276 77 8MB
German Pages 937 [940] Year 2019
Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Quantenmechanik De Gruyter Studium
Weitere empfehlenswerte Titel Quantenmechanik Band 2 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2019 ISBN 978-3-11-062609-4, e-ISBN (PDF) 978-3-11-063876-9, e-ISBN (EPUB) 978-3-11-063933-9 Quantenmechanik Band 3 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2020 ISBN 978-3-11-062064-1, e-ISBN (PDF) 978-3-11-064913-0, e-ISBN (EPUB) 978-3-11-064921-5 Quantenmechanik 1 Pfadintegralformulierung und Operatorformalismus Hugo Reinhardt, 2018 ISBN 978-3-11-058595-7, e-ISBN: 978-3-11-058602-2, e-ISBN (EPUB) 978-3-11-058647-3 Quantenmechanik 2 Pfadintegralformulierung und Operatorformalismus Hugo Reinhardt, 2019 ISBN 978-3-11-058596-4, e-ISBN (PDF) 978-3-11-058607-7, e-ISBN (EPUB) 978-3-11-058649-7 Quantenchemie Eine Einführung Michael Springborg, 2017 ISBN 978-3-11-050079-0, e-ISBN (PDF) 978-3-11-050080-6, e-ISBN (EPUB) 978-3-11-049813-4 Quantenelektrodynamik kompakt Karl Schilcher, 2019 ISBN 978-3-11-048858-6, e-ISBN: 978-3-11-048859-3, e-ISBN (EPUB) 978-3-11-048860-9
Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë
Quantenmechanik
| Band 1 Aus dem Französischen übersetzt von Joachim Streubel, Jochen Balla, Carsten Henkel und Karen Lippert 5. Auflage
Titel der Originalausgabe Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Mécanique Quantique. Tome I First published by Hermann Éditeurs des Sciences et des Arts, France Copyright © Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Übersetzer Prof. Joachim Streubel, Prof. Jochen Balla, Prof. Carsten Henkel, Dr. Karen Lippert
ISBN 978-3-11-062600-1 e-ISBN (PDF) 978-3-11-063873-8 e-ISBN (EPUB) 978-3-11-063930-8 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2019 Walter de Gruyter GmbH, Berlin/Boston Einbandabbildung: Winter, Dr. Mark J./Science Photo Library Satz: le-tex publishing services GmbH, Leipzig Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
Wichtiger Hinweis Dieses Buch besteht aus drei Bänden mit insgesamt 21 Kapiteln. Zu jedem Kapitel ge hören Ergänzungen. Die Kapitel bilden für sich eine Einheit und können unabhängig von den Ergän zungen gelesen werden. Die Ergänzungen schließen jeweils an das entsprechende Kapitel an und sind in der Kopfzeile durch das Zeichen ∙ gesondert gekennzeichnet. Sie beginnen mit einer kurzen Inhaltsübersicht, die als Leseanleitung verstanden werden kann. Die Abschnitte in den Ergänzungen sind von verschiedener Art: Einige erleichtern das Verständnis des zugehörigen Kapitels oder dienen der weiteren Präzisierung; an dere befassen sich mit konkreten physikalischen Anwendungen oder verweisen auf bestimmte Teilgebiete der Physik. Ein Abschnitt enthält schließlich die Aufgaben zum betreffenden Kapitel. Es wird nicht erwartet und ist auch nicht immer zweckmäßig, die Ergänzungen in der angegebenen Reihenfolge zu erarbeiten. In den beiden ersten Bänden wird gelegentlich auf die Anhänge I bis III verwiesen. Diese befinden sich am Ende des zweiten Bands.
https://doi.org/10.1515/9783110638738-201
Vorwort Die Bedeutung der Quantenmechanik ist in der Physik über die letzten Jahrzehn te ständig gestiegen. Sie ist natürlich ein wesentliches Werkzeug, um Struktur und Dynamik von mikroskopischen Körpern zu verstehen, etwa von Atomen, Molekülen sowie ihrer Wechselwirkung mit elektromagnetischer Strahlung. Die Quantenme chanik liefert aber auch das grundlegende Verständnis für zahlreiche technische Systeme: Quellen von Laserlicht (mit Anwendungen in Telekommunikation, Medi zintechnik, Materialbearbeitung), Atomuhren (zentrale Bausteine insbesondere für die Navigationssysteme GPS und Galileo), Transistoren (Computer- und Kommuni kationstechnik), bildgebende Tomographen per Magnetresonanz, Energiegewinnung (Solarzellen, Kerntechnik) usw. – die Liste der Anwendungen hört praktisch nicht auf. Überraschende physikalische Erscheinungen wie Supraflüssigkeiten und Supraleiter haben eine quantenmechanische Erklärung. Großes Interesse wird derzeit bestimm ten verschränkten Quanten-Zuständen gewidmet, die nicht-intuitive Eigenschaften aufweisen: sie sind nicht-lokal, nicht in ihre Teile separierbar und versprechen bemer kenswerte Anwendungen auf dem Gebiet der Quanten-Informatik. Unsere Zivilisation wird also mehr und mehr von technologischen Anwendungen durchdrungen, deren Wurzeln in den Konzepten der Quantenmechanik liegen. Demzufolge verdient das Lernen und Lehren dieser Konzepte besondere Aufmerksamkeit. Das vorliegende dreibändige Werk will einen Beitrag zu diesem Ziel leisten. In der Tat können die ersten Kontakte mit der Quantenmechanik sehr verstörend sein. Dieses Buch entstand aus zahlreichen Lehrveranstaltungen für Studierende mit dem Vorsatz, ihnen den Zugang zu erleichtern und das Verständnis der Leserin und des Lesers von Anfang an bis auf ein fortgeschrittenes Niveau hin stetig zu vertiefen. Die ersten beiden Bände erschienen vor mehr als vierzig Jahren in erster Auflage, sie fanden auf allen Kontinenten Verwendung und wurden in viele Sprachen übersetzt. Sie beschränkten sich inhaltlich allerdings auf ein mittleres Niveau; seit 2017 wer den sie durch den dritten Band ergänzt, der den Lesern erlaubt, weitere Schritte zu gehen. Das gesamte Werk verfolgt systematisch die Strategie, sich den Fragestellun gen schrittweise zu nähern: keine Schwierigkeit wird verschwiegen, und jeder Aspekt der diversen Probleme wird im Detail besprochen. Dabei erinnern wir oft an die Be griffe aus der klassischen Physik (d. h. aus der makroskopischen Welt oder vor der Quanten-Ära). Dieser Wunsch, den Dingen auf den Grund zu gehen, nichts zu „vertuschen“ und keine „Abkürzungen“ einzuschlagen, spiegelt sich in der Struktur des Lehrwerks wider: der Leser findet zwei verschiedene, aber ineinander verschränkte Stränge – Kapitel und Ergänzungen. Die Kapitel stellen in ihrer Abfolge die Ideen und Begriffe allgemein vor. Auf jedes Kapitel folgen eine oder mehrere Ergänzungen, die die zuvor erarbeiteten Methoden und Konzepte illustrieren. Die Ergänzungen sind voneinander unabhängig, ihr Ziel ist es, einen breiten Fächer von Anwendungen und interessanten https://doi.org/10.1515/9783110638738-202
VIII | Vorwort
Vertiefungen vorzustellen. Damit der Leser sich in seiner Auswahl besser orientieren kann, endet jedes Kapitel mit einer Übersicht, die mit ein paar Kommentaren die darauf folgenden Ergänzungen kurz anreißt. In Band 1 beginnen wir mit einer allgemeinen Einführung in das Thema, dar auf folgt eine detaillierte Beschreibung des mathematischen Handwerkzeugs für die Quantenmechanik. Dieses Kapitel II mag ein wenig lang und dicht erscheinen, die Autoren haben allerdings in der Lehre die Erfahrung gemacht, dass diese Art der Dar stellung letztendlich die größte Wirkung zeitigt. Beginnend mit dem dritten Kapitel werden die Axiome sorgfältig formuliert und in zahlreichen Ergänzungen veranschau licht. Einige wichtige Themen der Quantenmechanik werden dann durchgenommen, etwa der harmonische Oszillator, der sehr viele Anwendungen findet (Molekülschwin gungen, Phonon usw.); eine Reihe von ihnen werden in eigenen Ergänzungen bes prochen. Diesen Weg beschreiten wir weiter im Band 2, erweitern den Blickwinkel und erreichen einen etwas höheren Schwierigkeitsgrad. Der Stoff wendet sich der Streu theorie zu, dem Spin und der Addition von Drehimpulsen, sowie der Behandlung von stationären und zeitabhängigen Störungen. Mit einem ersten Blick auf die Be schreibung von ununterscheidbaren Teilchen endet Band 2. Wie im vorangehenden Band wird jeder theoretische Begriff sofort an Hand von diversen Anwendungen in den Ergänzungen veranschaulicht. Beide Bände wurden in der Neuausgabe 2018 an zahlreichen Stellen korrigiert; dem Kapitel XIII wurden zwei Abschnitte (§§ D und E) hinzugefügt, die sich mit zufälligen Störungen befassen, sowie eine weitere Ergän zung mit der Modellierung von Relaxationsprozessen. Der Band 3 ergänzt seit der Neuausgabe die ersten beiden Bände und siedelt sich auf einem fortgeschrittenen Niveau an. Seine Grundlage bildet der Formalismus der Erzeuger- und Vernichter-Operatoren (zweite Quantisierung), der in der Quantenfeld theorie durchgängig verwendet wird. Wir beginnen mit Systemen von ununterscheid baren Teilchen wie Fermi- und Bose-Gasen. Die Eigenschaften eines idealen Gases im thermischen Gleichgewicht werden dargestellt. Für Fermionen wird das Hartree-FockVerfahren im Detail eingeführt: es bildet die Grundlage für zahlreiche Untersuchun gen in der Chemie, der Atomphysik, der Festkörperphysik usw. Für Bosonen disku tieren wir die Gross-Pitaevskii-Gleichung und die Bogoliubov-Theorie. Mit Hilfe einer originellen Formulierung, die die Bildung von Paaren sowohl von Fermionen als auch von Bosonen erfasst, können die BCS-Theorie (Bardeen-Cooper-Schrieffer) der Supra leitung und die Bogoliubov-Theorie einheitlich dargestellt werden. Ein zweiter Teil von Band 3 ist der Quanten-Elektrodynamik gewidmet: diese wird allgemein einge führt, wir untersuchen Wechselwirkungen zwischen Atomen und Photonen sowie di verse Anwendungen (spontaner Zerfall, Multiphoton-Übergänge, optisches Pumpen usw.). Wir stellen die Methode der „beleuchteten Zustände“ (dressed atom) vor und veranschaulichen sie an Hand von konkreten Beispielen. Ein abschließendes Kapitel behandelt den Begriff der quantenmechanischen Verschränkung und gewisse funda mentale Fragen, insbesondere die Bellschen Ungleichungen und ihre Verletzung.
Vorwort
| IX
Es muss erwähnt sein, dass wir uns weder der Diskussion um die philosophischen Konsequenzen aus dem Weltbild der Quantenmechanik noch ihren zahlreichen Inter pretationen zuwenden, trotz des großen Interesses, das diesen Themen entgegenge bracht wird. Wir haben uns in der Tat darauf beschränkt, den so genannten „ortho doxen Standpunkt“ vorzustellen. Nur das Kapitel XXI nähert sich ein wenig gewissen Fragestellungen, die die Grundlagen der Quantenmechanik betreffen (etwa die NichtLokalität). Wir haben diese Wahl getroffen, weil es uns scheint, dass man sich noch wirksamer mit diesen Problemen befassen kann, wenn man sich vorher eine gewisse Geläufigkeit in der quantenmechanischen Praxis und ihren zahlreichen Anwendun gen erarbeitet hat. Diese Themen behandelt etwa das Buch Do we really understand quantum mechanics? (F. Laloë, Cambridge University Press 2012, französisches Origi nal: Comprenons-nous vraiment la mécanique quantique?, EDP Sciences/CNRS Editi ons, 2. Auflage 2017). Weitere Verweise bietet der Abschnitt 5 des Literaturverzeich nisses.
Danksagung Den Ausgangspunkt für das vorliegende Lehrbuch bilden Lehrveranstaltungen, die wir über mehrere Jahre hinweg in Teamarbeit durchgeführt haben. Es ist uns ein Anlie gen, allen Mitgliedern der Arbeitsgruppen, denen wir angehört haben, unseren Dank auszusprechen, ganz besonders aber Jacques Dupont-Roc und Serge Haroche für die freundschaftliche Zusammenarbeit und die fruchtbaren Diskussionen während der wöchentlichen Gruppensitzungen sowie für die Ideen zu Aufgaben und Übungen, die sie mit uns geteilt haben. Ohne ihren Enthusiasmus und ihre Unterstützung hätten wir dieses Werk niemals unternehmen und zu Ende schreiben können. Unvergessen bleibt auch, was wir den Physikern schulden, die uns in das Forschen eingeweiht ha ben: für zwei von uns waren dies Alfred Kastler und Jean Brossel, für den dritten war es Maurice Lévy. In dem „Stallgeruch“ ihrer Labore durften wir entdecken, was für ein schönes und und mächtiges Instrument die Quantenmechanik ist. Eine bleiben de wichtige Erinnerung sind für uns die Vorlesungen über moderne Physik, die am Commissariat pour l’Energie Atomique (C. E. A.) von Albert Messiah, Claude Bloch und Anatole Abragam in einer Zeit gehalten wurden, als es noch keine universitäre Lehre (« troisième cycle ») jenseits des Magisters/Diploms gab. Wir sind Nicole und Dan Ostrowsky sehr dankbar, die uns zahlreiche Verbesse rungen und Begriffsklärungen vorgeschlagen haben, als sie den Text ins Englische übersetzt haben. Danach hat uns auch Carsten Henkel bei seiner Übersetzung ins Deutsche zahlreiche nützliche Vorschläge gemacht, die in einen verbesserten Text eingeflossen sind; wir sprechen ihm unseren herzlichen Dank aus. Viele weitere Kolle gen und Freunde haben dazu beigetragen, die Feineinstellungen für diesen Band vor zunehmen. Besonders wertvoll war dabei, dass jeder von ihnen mit seinem eigenen Stil Bemerkungen und Vorschläge gemacht hat, die stets hilfreich waren. Unser Dank
X | Vorwort
geht besonders an Pierre-François Cohadon, Jean Dalibard, Sébastien Gleyzes, Mar kus Holzmann, Thibaut Jacqmin, Philippe Jacquier, Amaury Mouchet, Jean-Michel Raimond, Félix Werner. Eine große Hilfe waren uns Marco Picco und Pierre Cladé, um gewisse sensible Aufgaben im Latex-Schriftsatz zu meistern und um die Abbildungen in Vektor-Grafiken umzuwandeln. Roger Balian, Edouard Brézin und William Mullin haben uns mit ihren Vor- und Ratschlägen bereichert. Und für ihre Unterstützung mit einer Reihe von Abbildungen danken wir herzlich Geneviève Tastevin, Pierre-François Cohadon und Samuel Deléglise.
Inhalt Wichtiger Hinweis | V Vorwort | VII I A B C D
Welle und Teilchen | 1 Elektromagnetische Wellen und Photonen | 3 Materielle Teilchen und Materiewellen | 11 Freie Teilchen. Wellenpakete | 15 Teilchen in einem zeitunabhängigen Potential | 25
Übersicht über die Ergänzungen zu Kapitel I | 35 De-Broglie-Wellenlängen | 36 AI BI Zur Unschärferelation | 39 1 Makroskopisches System | 39 2 Mikroskopisches System | 40 CI Unschärferelationen und Atomparameter | 41 DI Ein Experiment zur Unschärferelation | 44 Ein zweidimensionales Wellenpaket | 47 EI 1 Einführung | 47 2 Winkeldispersion und laterale Ausdehnung | 47 3 Physikalische Diskussion | 49 FI Zusammenhang zwischen ein- und dreidimensionalen Problemen | 51 1 Dreidimensionales Wellenpaket | 51 2 Rechtfertigung des eindimensionalen Modells | 54 GI Eindimensionales Gaußsches Wellenpaket | 56 1 Definition eines Gaußschen Wellenpakets | 56 2 Orts- und Impulsbreite. Unschärfebeziehung | 58 3 Entwicklung des Wellenpakets | 58 Stationäre Zustände eines Teilchens in einem HI eindimensionalen Rechteckpotential | 62 1 Allgemeine Eigenschaften | 62 2 Einfache Beispiele | 64 JI Wellenpaket an einer Potentialstufe | 74 1 Totalreflexion: E < V0 | 74 2 Partielle Reflexion: E > V0 | 78 KI Aufgaben | 81
XII | Inhalt
II A B C D E F
Der mathematische Rahmen | 85 Der Raum der Wellenfunktionen eines Teilchens | 86 Zustandsraum und Dirac-Schreibweise | 99 Darstellungen im Zustandsraum | 113 Eigenwertgleichungen. Observable | 124 Zwei wichtige Beispiele | 137 Tensorprodukte von Zustandsräumen | 146
Übersicht über die Ergänzungen zu Kapitel II | 158 AII Schwarzsche Ungleichung | 159 BII Eigenschaften linearer Operatoren | 160 1 Spur eines Operators | 160 2 Kommutatoralgebra | 162 3 Einschränkung eines Operators | 162 4 Operatorfunktionen | 163 5 Ableitung eines Operators | 167 CII Unitäre Operatoren | 170 1 Allgemeine Eigenschaften | 170 2 Unitäre Transformation von Operatoren | 174 3 Infinitesimale unitäre Operatoren | 175 DII Orts- und Impulsdarstellung | 177 1 Ortsdarstellung | 177 2 Impulsdarstellung | 179 EII Eigenschaften zweier Observabler mit dem Kommutator iℏ | 181 1 Der Operator S(λ) | 181 2 Eigenwerte und Eigenvektoren des Operators Q | 182 3 {|q⟩}-Darstellung | 183 4 {|p⟩}-Darstellung | 185 FII Der Paritätsoperator | 186 1 Der Paritätsoperator | 186 2 Gerade und ungerade Operatoren | 189 3 Eigenzustände einer geraden Observablen | 192 4 Anwendung auf einen besonders wichtigen Fall | 192 GII Zweidimensionaler unendlich tiefer Potentialtopf | 193 1 Definition und Eigenzustände | 193 2 Energieniveaus | 194 HII Aufgaben | 197 III A B
Die Postulate der Quantenmechanik | 205 Einleitung | 205 Die Postulate | 207
Inhalt |
C D E
XIII
Physikalische Deutung der Postulate. Observable und ihre Messung | 218 Bedeutung der Schrödinger-Gleichung | 230 Superpositionsprinzip und Vorhersagen | 246
Übersicht über die Ergänzungen zu Kapitel III | 262 AIII Teilchen in einem unendlich tiefen Potentialtopf | 264 1 Verteilung der Impulswerte in einem stationären Zustand | 264 2 Entwicklung der Wellenfunktion | 268 3 Störung durch eine Ortsmessung | 272 Wahrscheinlichkeitsstrom. Spezialfälle | 274 BIII 1 Wahrscheinlichkeitsstrom in Bereichen konstanten Potentials | 274 2 Anwendung auf Potentialstufen | 275 3 Reflexion an einer zweidimensionalen Potentialstufe | 276 CIII Standardabweichung konjugierter Observabler | 280 1 Unschärferelation für P und Q | 280 2 „Minimales“ Wellenpaket | 281 DIII Messung an einem Teilsystem | 284 1 Berechnung physikalischer Vorhersagen | 284 2 Physikalische Bedeutung des Tensorprodukts | 286 3 Allgemeiner Zustand | 287 EIII Der Dichteoperator | 289 1 Problemstellung | 289 2 Statistisches Zustandsgemisch | 289 3 Reiner Fall. Einführung des Dichteoperators | 291 4 Statistisches Gemisch. Gemischter Fall | 294 5 Beispiele für den Dichteoperator | 299 FIII Der Entwicklungsoperator | 303 1 Allgemeine Eigenschaften | 303 2 Konservative Systeme | 305 GIII Schrödinger- und Heisenberg-Bild | 307 Eichinvarianz | 310 HIII 1 Problemstellung. Begriff der Eichung | 310 2 Eichinvarianz in der klassischen Mechanik | 311 3 Eichinvarianz in der Quantenmechanik | 316 JIII Der Propagator der Schrödinger-Gleichung | 325 1 Der physikalische Grundgedanke | 325 2 Existenz und Eigenschaften des Propagators | 326 3 Pfadintegral-Formulierung der Quantenmechanik | 329 KIII Instabile Niveaus. Lebensdauer | 333 1 Einführung | 333 2 Definition der Lebensdauer | 334 3 Phänomenologische Beschreibung | 335
XIV | Inhalt
LIII MIII 1 2 NIII 1 2 3 OIII 1 2 3
Aufgaben | 337 Gebundene Zustände in einem Potentialtopf | 348 Quantisierung der gebundenen Energiezustände | 349 Energie des Grundzustandes | 352 Nichtgebundene Zustände | 355 Transmissionsmatrix M(k) | 356 Transmissions- und Reflexionskoeffizienten | 359 Beispiel | 361 Eindimensionales periodisches Potential | 363 Durchgang durch mehrere identische Potentialbarrieren | 364 Erlaubte und verbotene Energiebänder | 369 Energiequantisierung bei einem periodischen Potential. Einfluss der Ränder | 371
IV A B C
Einfache Systeme | 381 Spin-1/2-Teilchen. Quantisierung des Drehimpulses | 382 Die Postulate am Beispiel des Spins 1/2 | 389 Systeme mit zwei Niveaus | 399
Übersicht über die Ergänzungen zu Kapitel IV | 410 AIV Die Pauli-Matrizen | 411 1 Definition, Eigenwerte und Eigenvektoren | 411 2 Einfache Eigenschaften | 412 3 Eine zweckmäßige Basis | 413 BIV Diagonalisierung einer hermiteschen 2 × 2-Matrix | 415 1 Einführung | 415 2 Wechsel des Bezugspunktes | 415 3 Eigenwerte und Eigenvektoren | 416 System mit zwei Niveaus. Fiktiver Spin | 419 CIV 1 Einführung | 419 2 Interpretation des Hamilton-Operators | 420 3 Interpretation der Effekte | 421 DIV Systeme mit zwei Spins 1/2 | 425 1 Quantenmechanische Beschreibung | 425 2 Vorhersage von Messergebnissen | 428 EIV Dichtematrix für einen Spin 1/2 | 432 1 Einführung | 432 2 Dichtematrix bei vollständiger Polarisation des Spins | 432 3 Beispiel für ein statistisches Gemisch: Unpolarisierter Spin | 433 4 Thermodynamisches Gleichgewicht in einem statischen Feld | 435 5 Zerlegung nach Pauli-Matrizen | 436
Inhalt | XV
4 GIV 1 2 3 HIV 1 2 3 JIV
Magnetische Resonanz | 437 Klassische Behandlung: Rotierendes Bezugssystem | 437 Quantenmechanische Behandlung | 440 Zusammenhang zwischen klassischer und quantenmechanischer Behandlung | 445 Bloch-Gleichungen | 446 Modell des Ammoniakmoleküls | 450 Beschreibung des Modells | 450 Eigenfunktionen und Eigenwerte des Hamilton-Operators | 452 Das Ammoniakmolekül als Zwei-Niveau-System | 459 Kopplung zwischen stabilem und instabilem Zustand | 465 Einführung und Bezeichnungen | 465 Schwache Kopplung | 465 Kopplung von Niveaus mit gleicher Energie | 467 Aufgaben | 471
V A B C D
Der harmonische Oszillator | 477 Einführung | 477 Eigenwerte des Hamilton-Operators | 482 Eigenzustände des Hamilton-Operators | 490 Physikalische Diskussion | 497
FIV 1 2 3
Übersicht über die Ergänzungen zu Kapitel V | 503 AV Beispiele für harmonische Oszillatoren | 505 1 Kernschwingungen in einem zweiatomigen Molekül | 505 2 Schwingungen von Kernen in einem Kristall | 512 3 Torsionsschwingungen eines Moleküls: Beispiel Ethylen | 515 4 Schwere Myonenatome | 519 Stationäre Zustände. Hermitesche Polynome | 524 BV 1 Hermitesche Polynome | 524 2 Eigenfunktionen des Hamilton-Operators für den harmonischen Oszillator | 527 CV Lösung der Eigenwertgleichung mit der Polynommethode | 531 1 Wechsel der Variablen | 531 2 Polynommethode | 533 DV Stationäre Zustände in der Impulsdarstellung | 539 1 Wellenfunktion im Impulsraum | 539 2 Physikalische Diskussion | 542 EV Dreidimensionaler isotroper harmonischer Oszillator | 544 1 Hamilton-Operator | 544 2 Separation der Variablen | 545 3 Entartung der Energieniveaus | 548
XVI | Inhalt
FV 1 2 3 GV 1 2 3 4 HV 1 2 JV 1 2 3 KV 1 2 3 LV 1 2 3 4 MV
Geladener harmonischer Oszillator im konstanten elektrischen Feld | 549 Eigenwertgleichung von H (ℰ) in der Ortsdarstellung | 549 Physikalische Diskussion | 551 Anwendung des Translationsoperators | 553 Quasiklassische Zustände des Oszillators | 556 Quasiklassische Zustände | 557 Eigenschaften der Zustände |α⟩ | 561 Zeitliche Entwicklung eines quasiklassischen Zustands | 568 Beispiel eines makroskopischen Oszillators | 571 Eigenschwingungen gekoppelter Oszillatoren | 573 Gekoppelte Schwingungen in der klassischen Mechanik | 573 Schwingungszustände des Systems in der Quantenmechanik | 579 Lineare Oszillatorenkette. Phononen | 584 Klassische Behandlung | 585 Quantenmechanische Behandlung | 595 Anwendung auf Kristallschwingungen | 599 Kontinuierliches System. Photonen | 603 Problemstellung | 603 Eigenschwingungen eines mechanischen Systems (Saite) | 604 Photonen | 611 Oszillator im thermodynamischen Gleichgewicht | 619 Energieerwartungswert | 620 Physikalische Diskussion | 621 Anwendungen | 623 Wahrscheinlichkeitsverteilung der Observablen X | 627 Aufgaben | 634
VI A B C D
Der Drehimpuls in der Quantenmechanik | 639 Die Bedeutung des Drehimpulses | 639 Drehimpulsvertauschungsrelationen | 641 Allgemeine Theorie des Drehimpulses | 644 Anwendung auf Bahndrehimpulse | 658
Übersicht über die Ergänzungen zu Kapitel VI | 675 AVI Die Kugelflächenfunktionen | 676 1 Berechnung der Kugelflächenfunktionen | 676 2 Eigenschaften der Kugelflächenfunktionen | 681 BVI Drehimpuls und Drehungen | 689 1 Einleitung | 689 2 Eigenschaften der räumlichen Drehungen R | 690 3 Drehoperatoren im Zustandsraum. Teilchen ohne Spin | 693
Inhalt | XVII
4 5 6 CVI 1 2 3 4 DVI 1 2 3 4 EVI 1 2 3 FVI
Drehoperatoren für ein beliebiges System | 699 Drehung von Observablen | 703 Drehinvarianz | 706 Drehung zweiatomiger Moleküle | 712 Einleitung | 712 Klassische Behandlung des starren Rotators | 713 Quantisierung des starren Rotators | 714 Nachweise für die Rotation von Molekülen | 720 Drehimpuls eines zweidimensionalen Oszillators | 727 Einleitung | 727 Klassifikation der stationären Zustände | 731 Andere Klassifikation der stationären Zustände | 733 Quasiklassische Zustände | 738 Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 742 Wiederholung der klassischen Ergebnisse | 742 Allgemeine Eigenschaften | 747 Homogenes Magnetfeld | 750 Aufgaben | 766
VII A B C
Teilchen in einem Zentralpotential. Das Wasserstoffatom | 775 Stationäre Zustände in einem Zentralpotential | 776 Massenmittelpunkts- und Relativbewegung | 785 Das Wasserstoffatom | 792
Übersicht über die Ergänzungen zu Kapitel VII | 806 Wasserstoffartige Systeme | 807 AVII 1 Wasserstoffartige Systeme mit einem Elektron | 808 2 Wasserstoffartige Systeme ohne Elektronen | 813 Der dreidimensionale isotrope harmonische Oszillator | 817 BVII 1 Lösung der Radialgleichung | 818 2 Energieniveaus und stationäre Wellenfunktionen | 821 Wahrscheinlichkeitsströme der stationären Zustände CVII des Wasserstoffatoms | 827 1 Allgemeiner Ausdruck | 827 2 Anwendung auf die stationären Zustände | 828 DVII Das Wasserstoffatom im homogenen Magnetfeld | 831 1 Der Hamilton-Operator des Problems | 832 2 Der Zeeman-Effekt | 838 EVII Einige Atomorbitale. Hybridorbitale | 844 1 Einleitung | 844 2 Atomorbitale zu reellen Wellenfunktionen | 845 3 sp-Hybridisierung | 851
XVIII | Inhalt
4 5 FVII 1 2 3 GVII
sp2 -Hybridisierung | 854 sp3 -Hybridisierung | 857 Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 860 Einleitung | 860 Näherungslösung der Radialgleichung | 861 Berechnung einiger Korrekturen | 867 Aufgaben | 874
Bibliographie | 877 Sach- und Namenverzeichnis | 899
Inhaltsübersicht zu Band 2 Wichtiger Hinweis | V Vorwort | VII VIII
Elementare Streutheorie | 915
Übersicht über die Ergänzungen zu Kapitel VIII | 948 AVIII
Freies Teilchen: Drehimpulseigenzustände | 949
BVIII
Inelastische Streuung | 962
CVIII
Beispiele zur Streutheorie | 969
IX
Der Spin des Elektrons | 977
Übersicht über die Ergänzungen zu Kapitel IX | 992 AIX
Drehoperatoren für ein Spin-1/2-Teilchen | 993
BIX
Aufgaben | 1000
X
Addition von Drehimpulsen | 1007
Übersicht über die Ergänzungen zu Kapitel X | 1033 AX
Beispiele für die Addition von Drehimpulsen | 1034
BX
Clebsch-Gordan-Koeffizienten | 1041
CX
Addition von Kugelflächenfunktionen | 1050
DX
Das Wigner-Eckart-Theorem | 1055
EX
Elektrische Multipolmomente | 1066
FX
Entwicklung gekoppelter Drehimpulse | 1080
GX
Aufgaben | 1095
XI
Stationäre Störungstheorie | 1103
Übersicht über die Ergänzungen zu Kapitel XI | 1117 AXI
Gestörter harmonischer Oszillator | 1118
BXI
Wechselwirkung zwischen magnetischen Dipolen | 1128
CXI
Van-der-Waals-Kräfte | 1139
XX | Inhaltsübersicht zu Band 2
DXI
Der Volumeneffekt | 1151
EXI
Die Variationsmethode | 1158
FXI
Energiebänder im Festkörper | 1167
GXI
Chemische Bindung: Das H+2 -Ion | 1180
HXI
Aufgaben | 1213
XII
Fein- und Hyperfeinstruktur des Wasserstoffatoms | 1223
Übersicht über die Ergänzungen zu Kapitel XII | 1257 AXII
Der Hyperfeinstruktur-Hamilton-Operator | 1258
BXII
Erwartungswerte und Feinstruktur | 1267
CXII
Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium | 1272
DXII
Elektronenspin und Zeeman-Effekt | 1280
EXII
Stark-Effekt des Wasserstoffatoms | 1289
XIII
Näherungsmethoden für zeitabhängige Probleme | 1293
Übersicht über die Ergänzungen zu Kapitel XIII | 1330 AXIII
Atom und elektromagnetische Strahlung | 1331
BXIII
Zweiniveausystem und sinusförmige Störung | 1350
CXIII
Oszillation zwischen zwei diskreten Zuständen bei einer sinusförmigen Störung | 1367
DXIII
Zerfall eines diskreten Zustands in ein Kontinuum | 1371
EXIII
Stochastische zeitabhängige Störung. Relaxation | 1384
FXIII
Aufgaben | 1409
XIV
Systeme identischer Teilchen | 1421
Übersicht über die Ergänzungen zu Kapitel XIV | 1461 AXIV
Mehrelektronenatome. Konfigurationen | 1462
BXIV
Energieniveaus des Heliumatoms | 1470
CXIV
Elektronengas. Anwendung auf Festkörper | 1485
DXIV
Aufgaben | 1500
Inhaltsübersicht zu Band 2
Anhänge | 1509 I
Fourier-Reihen. Fourier-Transformation | 1509
II
Die Diracsche δ-Funktion | 1519
III
Lagrange- und Hamilton-Mechanik | 1533
Bibliographie | 1551 Sach- und Namenverzeichnis | 1573
| XXI
Inhaltsübersicht zu Band 3 | XXIII
Inhaltsübersicht zu Band 3 Wichtiger Hinweis Vorwort XV
Erzeugungs- und Vernichtungsoperatoren von identischen Teilchen
Übersicht über die Ergänzungen zu Kapitel XV AXV
Teilchen und Löcher
BXV
Ideale Fermi- und Bose-Gase. Quantenstatistik
CXV
Kondensierte Bosonen. Gross-Pitaevskii-Gleichung
DXV
Zeitabhängige Gross-Pitaevskii-Gleichung
EXV
Wechselwirkende Fermionen. Hartree-Fock-Verfahren
FXV
Zeitabhängiges Hartree-Fock-Verfahren
GXV
Anwendung: wechselwirkende Fermi- und Bose-Gase
XVI
Feldoperatoren
Übersicht über die Ergänzungen zu Kapitel XVI AXVI
Korrelationen in idealen Bose- und Fermi-Gasen
BXVI
Greensche Funktionen und Korrelationen
CXVI
Wick-Theorem
XVII
Gepaarte Zustände identischer Teilchen
Übersicht über die Ergänzungen zu Kapitel XVII AXVII
Feldoperatoren für gepaarte Teilchen
BXVII
Berechnung der mittleren Energie von gepaarten Teilchen
CXVII
BCS-Theorie
DXVII
Das Cooper-Modell
EXVII
Kondensierte Bosonen mit abstoßenden Wechselwirkungen
XVIII
Elektrodynamik: Abriss der klassischen Theorie
Übersicht über die Ergänzungen zu Kapitel XVIII AXVIII
Lagrange-Formulierung der Elektrodynamik
XXIV | Inhaltsübersicht zu Band 3
XIX
Quantisierung des Strahlungsfelds
Übersicht über die Ergänzungen zu Kapitel XIX AXIX
Impulsaustausch zwischen Atomen und Photonen
BXIX
Drehimpuls des Strahlungsfelds
CXIX
Drehimpulsaustausch zwischen Atomen und Photonen
XX
Atom-Photon-Wechselwirkungen: Absorption, Emission, Streuung
Übersicht über die Ergänzungen zu Kapitel XX AXX
Zwei-Photonen-Absorption
BXX
Photo-Ionisation
CXX
Beleuchtete Atome (Dressed Atoms)
DXX
Lichtverschiebungen (Light Shifts) als Werkzeug
EXX
Detektion und Interferenz von photonischen Wellenpaketen
XXI
Verschränkung, Messung, Nichtlokalität
Übersicht über die Ergänzungen zu Kapitel XXI AXXI
Gemischte, korrelierte und separable Zustände
BXXI
GHZ-Zustände. Übertrag von Verschränkung
CXXI
Entstehen einer relativen Phase im Messprozess
DXXI
Relative Phase eines Spin-Kondensats, Nichtlokalität
Anhänge IV
Das Feynman Pfadintegral
V
Variation unter Nebenbedingungen
VI
Abriss der statistischen Mechanik
VII
Die Wigner-Transformation
Bibliographie Sach- und Namenverzeichnis
I Welle und Teilchen. Grundgedanken der Quantenmechanik A A-1 A-2 A-3 B B-1 B-2 C C-1 C-2 C-3 C-4 D D-1 D-2
Elektromagnetische Wellen und Photonen | 3 Lichtquanten und Einstein-de-Broglie-Beziehungen | 3 Der Welle-Teilchen-Dualismus | 4 Die Spektralzerlegung | 8 Materielle Teilchen und Materiewellen | 11 Die Einstein-de-Broglie-Beziehungen | 11 Wellenfunktion und Schrödinger-Gleichung | 12 Freie Teilchen. Wellenpakete | 15 Freies Teilchen | 15 Form des Wellenpakets | 16 Die Heisenbergsche Unschärferelation | 20 Zeitliche Entwicklung eines freien Wellenpakets | 22 Teilchen in einem zeitunabhängigen Potential | 25 Separation der Variablen. Stationäre Zustände | 25 Eindimensionale Rechteckpotentiale – qualitative Behandlung | 28
Beim heutigen Stand der Wissenschaft spielt die Quantenmechanik für das Verständ nis der Naturvorgänge eine grundlegende Rolle, im atomaren oder subatomaren Be reich ist sie unabdingbar. So sind z. B. Existenz und Eigenschaften der Atome, die che mische Bindung, die Bewegung eines Elektrons in einem Kristall etc. auf der Basis der klassischen Mechanik nicht zu verstehen. Doch auch bei makroskopischen Objekten, deren Größenordnungen unserer Alltagserfahrung entsprechen, setzt man prinzipi ell voraus, dass sie aus Atomen, Ionen und Elektronen bestehen. Erst dann ist man in der Lage, sie exakt und vollständig zu beschreiben. In diesem Sinne darf man sa gen, dass die Quantenmechanik die Basis darstellt für das aktuelle Verständnis aller natürlichen Vorgänge, d. h. auch solcher Phänomene, wie sie traditionell in der Che mie, der Biologie oder anderen naturwissenschaftlichen Disziplinen behandelt wer den. Im Übrigen verweisen gerade eine ganze Reihe von makroskopischen Erschei nungen, die sich in der im Alltag geläufigen Größenordnung abspielen, auf die Quan teneigenschaften der Natur. Aus historischer Sicht hat die Quantenphysik wesentlich zu einer Vereinheitli chung der physikalischen Grundlagen beigetragen. Bis zum Ende des 19. Jahrhun derts unterschied man grundsätzlich zwischen Materie und Strahlung und beschrieb sie durch völlig verschiedene Gesetze. Um die Bewegung materieller Körper vorher zusagen, verwendete man mit großem Erfolg die Gesetze der Newtonschen Mechanik (s. Anhang III). Dagegen war es bei Strahlungsvorgängen durch die Aufstellung der Maxwellschen Gleichungen gelungen, eine Theorie des Elektromagnetismus zu entwi ckeln, mit der vorher als verschieden angesehene Erfahrungsbereiche, nämlich die Elektrizität, der Magnetismus und die Optik, einheitlich beschrieben werden können. https://doi.org/10.1515/9783110638738-001
2 | I Welle und Teilchen
Durch die Entdeckung der Hertzschen Wellen fand die Theorie der elektromagneti schen Strahlung ihre glänzende experimentelle Bestätigung. Die Wechselwirkung zwi schen Materie und Strahlung konnte schließlich auf der Basis des Lorentzschen Kraft gesetzes gedeutet werden. Die Gesamtheit dieses theoretischen Wissens war nach den zu dieser Zeit bekannten experimentellen Gegebenheiten als ausreichend und befrie digend anzusehen. Zu Beginn des 20. Jahrhunderts ergaben sich in der Physik grundlegende Umwäl zungen, die schließlich zur Relativitätstheorie und zur Quantenmechanik führten. Da bei geschahen die relativistische und die quantenmechanische „Revolution“ in wei tem Maße unabhängig voneinander, da sie die klassische Physik in verschiedenen Be reichen in Frage stellten: Die klassischen Gesetze verlieren ihre Gültigkeit, wenn sich materielle Körper mit Geschwindigkeiten bewegen, die mit der Lichtgeschwindigkeit vergleichbar sind (relativistischer Bereich), sie versagen aber auch auf der atomaren bzw. subatomaren Skala (quantenmechanischer Bereich). Wichtig ist in diesem Zu sammenhang die Feststellung, dass in beiden Fällen die klassische Physik in die neue Theorie eingebettet werden kann. Häufig sagt man, dass sie die Rolle einer Näherung der neuen Theorien spielt. So beschreibt die Newtonsche Mechanik auch weiterhin einen festen Körper korrekt, falls dieser sich im Vergleich zur Lichtgeschwindigkeit nicht zu schnell bewegt und falls er verglichen mit den Atomen von makroskopischer Größe ist. Trotzdem ist die Quantenmechanik grundsätzlich unverzichtbar: Nur sie erklärt, warum der feste Körper überhaupt existieren kann, und nur sie ermöglicht die Berech nung seiner makroskopischen Eigenschaften (wie der Dichte, der spezifischen Wärme, der Elastizität usw.). Bis heute gibt es noch keine völlig befriedigende relativistische Quantentheorie, hier treten immer wieder Schwierigkeiten auf. Die meisten atomaren und molekularen Vorgänge werden aber bereits durch die nichtrelativistische Quan tenmechanik erklärt, und auf diese werden wir im Folgenden eingehen. Dieses Kapitel vermittelt einen ersten Eindruck von den Vorstellungen der Quan tenmechanik und ihrem „Vokabular“, ohne dass wir hier bereits Strenge und Vollstän digkeit beanspruchen. Im Wesentlichen geht es zunächst darum, auf Phänomene zu verweisen, durch die bestimmte Begriffe, wie z. B. den der Teilchenbahn oder Trajek torie, in Frage gestellt werden. Ferner wollen wir auf einfache und qualitative Wei se zeigen, wie durch die Quantentheorie Probleme im atomaren Bereich behandelt und gelöst werden können. Die präzise Formulierung erfolgt dann in den Kapiteln II und III. In § A stellen wir die quantenmechanischen Grundideen über die Dualität von Welle und Teilchen und den Messprozess vor, wobei wir uns auf wohlbekannte opti sche Experimente beziehen. Danach zeigen wir in § B, wie diese Ideen auf materielle Teilchen erweitert werden können. Der darauf folgende § C untersucht dann im Ein zelnen, wie einem Teilchen ein „Wellenpaket“ zugeordnet werden kann, und führt die Heisenbergschen Unschärferelationen ein. Schließlich diskutieren wir in § D an ein fachen Beispielen einige typische Quanteneffekte.
A Elektromagnetische Wellen und Photonen | 3
A Elektromagnetische Wellen und Photonen A-1 Lichtquanten und Einstein-de-Broglie-Beziehungen Newton betrachtete das Licht als einen Strahl von Teilchen, die bei der Reflexion an einem Spiegel von diesem zurückprallen. In der ersten Hälfte des 19. Jahrhunderts wurde die Wellennatur des Lichts bewiesen (Interferenz und Beugung); in der Folge konnte die Optik in die Elektrodynamik integriert werden. In diesem Rahmen wurde die Lichtgeschwindigkeit c mit der elektrischen und magnetischen Feldkonstanten in Beziehung gesetzt, und die Polarisation des Lichts konnte durch den Vektorcharakter des elektromagnetischen Feldes gedeutet werden. Die Gesetze der Hohlraumstrahlung waren jedoch durch die klassische Theorie des Elektromagnetismus nicht erklärbar, so dass Planck sich im Jahre 1900 gezwun gen sah, die Hypothese von der Quantisierung der Energie aufzustellen: Für eine elek tromagnetische Welle der Frequenz ν sind die einzig möglichen Energien ganzzahlige Vielfache des Quantums hν, worin h eine neue Fundamentalkonstante bedeutete. Ein stein verallgemeinerte diese Hypothese und schlug 1905 eine Korpuskulartheorie des Lichts vor: Das Licht ist als ein Strahl von Photonen aufzufassen, die alle die Energie hν besitzen. Er zeigte, wie durch die Einführung des Photons der photoelektrische Ef fekt auf sehr einfache Weise erklärt werden konnte. Fast zwanzig Jahre dauerte es, bis man 1924 durch den Compton-Effekt das Photon als individuelles Teilchen tatsächlich nachwies. Diese Erkenntnisse führten zu folgendem Schluss: Die Wechselwirkung einer elektromagnetischen Welle mit der Materie geschieht über unteilbare elementare Pro zesse, bei denen die Strahlung sich verhält, wie wenn sie aus Teilchen, eben den Photonen, bestünde. Zwischen den Teilcheneigenschaften (das sind die Energie E und der Impuls p eines Photons) und den Welleneigenschaften (also der Kreisfre quenz ω = 2πν und dem Wellenvektor k, wobei |k| = 2π/λ; ν ist die Frequenz und λ die Wellenlänge) postuliert man die grundlegenden Beziehungen E p
= =
hν = ℏω ℏk
(Planck-Einstein-Beziehungen)
(A-1)
worin ℏ = h/2π und h die Planck-Konstante h ≈ 6.62 × 10−34 J s
(A-2)
ist. Man nennt sie die Einstein-de-Broglie-Beziehungen. Bei jedem Elementarprozess bleiben Gesamtenergie und Gesamtimpuls erhalten.
4 | I Welle und Teilchen
A-2 Der Welle-Teilchen-Dualismus Wenn wir auf diese Weise zu einer korpuskularen Beschreibung des Lichts gelangt sind, so stellt sich die Frage, ob damit die Wellentheorie überflüssig geworden ist. Das ist aber nicht der Fall. Wir werden sehen, dass wir typische Wellenphänomene wie die Interferenz und die Beugung im Rahmen der Teilchenvorstellung nicht erklären können. Vielmehr werden wir bei der Analyse des Youngschen Spaltversuchs feststel len, dass eine vollständige Beschreibung nur möglich ist, wenn wir gleichzeitig den Teilchen- und den Wellenaspekt des Lichts beachten (obwohl sich diese von vornher ein gegenseitig auszuschließen scheinen). Wie dieses Paradoxon durch die Einfüh rung quantenmechanischer Begriffe aufgelöst werden kann, wollen wir im Folgenden zeigen. A-2-a Der Youngsche Spaltversuch Die Versuchsanordnung ist in Abb. 1 schematisch wiedergegeben. Von der Quelle Q fällt das monochromatische Licht auf eine undurchsichtige Blende B, in der sich zwei feine Spalte S1 und S2 befinden, und beleuchtet den Beobachtungsschirm S, z. B. eine Photoplatte. Deckt man den Spalt S2 ab, so erhält man den durch S1 ver ursachten Beugungsfleck mit der Intensitätsverteilung I1 (x); entsprechend wird der auf den Spalt S2 zurückgehende Fleck, wenn S1 abgedeckt wird, durch die Inten sität I2 beschrieben. Sind dagegen beide Spalte geöffnet, so ergibt sich auf dem Schirm ein System von Interferenzstreifen. Insbesondere stellt man dabei fest, dass
B (a)
S
(b)
(c)
Abb. 1: (a) Schema des Youngschen Versuchs am Doppelspalt. Auf dem Schirm S liefern der Spalt S1 und der Spalt S2 je einen Beugungsfleck mit den Intensitäten I1 (x) bzw. I2 (x) [die durchgezoge nen Kurven in (b)]. Sind S1 und S2 gleichzeitig geöffnet, so ist die Intensität I(x) auf dem Schirm nicht gleich der Summe I1 (x) + I2 (x) [gestrichelte Kurve in (b) und (c)], sondern zeigt das oszillie rende Muster, wie es durch die Interferenz der von S1 und S2 ausgehenden elektromagnetischen Strahlung entsteht [durchgezogene Kurve in (c)].
A Elektromagnetische Wellen und Photonen |
5
die Intensität I(x) nicht gleich der Summe der von S1 und S2 erzeugten Intensitäten ist I(x) ≠ I1 (x) + I2 (x)
(A-3)
Wie kann man diese experimentelle Tatsache im Teilchenbild erklären, das ja nach Planck und Einstein unter anderem zur Deutung der Strahlungsgesetze und des pho toelektrischen Effekts notwendig ist? Die Existenz eines Beugungsflecks, wie er bei Öffnung nur eines Spalts entsteht, ließe sich z. B. durch die Stöße interpretieren, die die Photonen an den Rändern des Spalts erfahren; doch zeigt eine genauere Unter suchung, dass dies nicht befriedigend durchzuführen ist. Konzentrieren wir uns da gegen auf die Interferenzerscheinung, so könnten wir sie durch eine Wechselwirkung zu erklären versuchen, die zwischen den durch den Spalt S1 tretenden Photonen und den durch den Spalt S2 gelangenden geschieht. Dabei gelangt man dann zu folgen der Vorhersage: Verringert man die Intensität der Quelle Q, d. h. die Zahl der in der Zeiteinheit emittierten Photonen, bis diese schließlich einzeln und nacheinander auf die Blende und dann auf den Schirm treffen, so muss auch die Wechselwirkung zwi schen den Photonen immer kleiner werden und im Grenzfall gegen null gehen; die Interferenzstreifen müssen verschwinden. Erinnern wir uns an die Erklärung der Interferenzstreifen im Wellenbild. Nach ihr ist die Lichtintensität in einem bestimmten Punkt auf dem Schirm zum Quadrat der Amplitude des elektrischen Feldes in diesem Punkt proportional. Sind E1 (x) bzw. E2 (x) die an der Stelle x vom Spalt S1 bzw. S2 erzeugten (komplexwertigen) elektri schen Feldstärken (die Spalte verhalten sich wie sekundäre Lichtquellen), so ist das Gesamtfeld, wenn beide Spalte geöffnet sind E(x) = E1 (x) + E2 (x)
(A-4)
Dann ist die Intensität I(x) ∝ |E(x)|2 = |E1 (x) + E2 (x)|2
(A-5)
Andererseits sind die Intensitäten I1 (x) bzw. I2 (x) proportional zu |E1 (x)|2 bzw. |E2 (x)|2 . Wir sehen also, dass I(x) sich von I1 (x) + I2 (x) um einen Interferenzterm unterscheidet, der von dem Phasenunterschied zwischen E1 (x) und E2 (x) abhängt und mit dem man das Auftreten der Streifen auch quantitativ erklären kann. Nach der Wellentheorie nimmt dann mit abnehmender Intensität der Quelle Q auch die Intensität der Interferenzstreifen ab; trotzdem treten sie weiterhin auf.¹
1 Da bei diesem Versuch der Vektorcharakter des Feldes keine grundsätzliche Rolle spielt, kann er mit unpolarisiertem Licht ausgeführt werden, was wir der Einfachheit halber in diesem Abschnitt voraus setzen.
6 | I Welle und Teilchen
Wenn nun die Quelle Q die Photonen einzeln nacheinander emittiert, so werden weder die Vorhersagen der Wellentheorie noch die der Teilchentheorie durch die Be obachtung bestätigt. Es zeigt sich vielmehr: 1. Bringt man auf dem Schirm einen Film an und belichtet ihn so lange, dass man bei jeder Aufnahme eine große Zahl von Photonen erhält, dann stellt man nach der Entwicklung fest, dass die Streifen nicht verschwunden sind. Eine reine korpuskula re Interpretation ist also nicht haltbar, denn nach ihr beruhten die Streifen auf einer Wechselwirkung zwischen den Photonen der beiden Spalte. 2. Belichtet man dagegen den Film so kurz, dass auf ihn nur wenige Photonen auftreffen können, so beobachtet man, dass jedes Photon auf dem Schirm S einen lokalisierten Stoß bewirkt. Es entsteht keine noch so schwache Interferenzfigur; eine reine Wellentheorie muss daher ebenfalls verworfen werden. Was wir beim Auftreffen der Photonen auf dem Schirm beobachten, ist das fol gende Phänomen: Ihre Stöße zeigen eine Zufallsverteilung, und erst wenn eine große Anzahl von ihnen den Schirm erreicht hat, scheint diese Verteilung einen kontinuier lichen Aspekt anzunehmen; die Dichte der Stöße in jedem Punkt des Schirms S ent spricht den Interferenzstreifen: Sie ist auf einem hellen Streifen am größten und null auf einem dunklen Streifen. Man kann sagen, dass die Photonen bei ihrem Auftreffen das Interferenzmuster erzeugen. Das Versuchsergebnis führt also offensichtlich zu einem Paradoxon, das man z. B. im Teilchenbild so umschreiben kann: Weil eine Wechselwirkung zwischen den ver schiedenen Photonen auszuschließen ist, müssen wir jedes von ihnen getrennt be trachten. Dann ist aber nicht zu verstehen, weshalb sich das Muster auf dem Schirm so grundsätzlich ändert, je nachdem ob ein Spalt oder aber beide Spalte geöffnet sind. Wie verträgt sich die Annahme, dass ein Photon durch genau einen Spalt geht, mit der Tatsache, dass das Verhalten dieses Photons in so grundsätzlicher Weise davon abhängt, ob der andere Spalt offen oder aber verdeckt ist? Bevor wir auf diese Frage eingehen, halten wir fest, dass wir beim vorstehenden Experiment nicht bestimmt haben, durch welchen Spalt jedes Photon vor seinem Auf treffen auf dem Schirm gelangt ist. Will man dies tun, so könnte man hinter S1 und S2 Detektoren (Photomultiplier) anbringen. Man wird dann feststellen, dass jedes Pho ton einen ganz bestimmten Spalt durchquert (man erhält ein Signal entweder von dem hinter dem Spalt S1 oder von dem hinter S2 aufgestellten Detektor, nie aber von beiden zugleich). Offensichtlich jedoch werden die auf diese Weise registrierten Photonen ab sorbiert und erreichen den Schirm überhaupt nicht. Nehmen wir darum z. B. den De tektor hinter S1 fort, so zeigt der Detektor hinter dem Spalt S2 an, dass bei einer großen Anzahl von Photonen ungefähr die Hälfte durch den Spalt S2 tritt. Daraus schließen wir, dass die anderen, den Schirm erreichenden Photonen durch den Spalt S1 gehen. Weil aber S2 abgedeckt ist, entsteht auf dem Schirm nur der von S1 stammende Beu gungsfleck und kein Interferenzmuster.
A Elektromagnetische Wellen und Photonen |
7
A-2-b Die quantenmechanische Vereinigung von Teilchen- und Wellenaspekt Wie wir gesehen haben, kann man nicht allen beobachteten Phänomenen gleichzei tig Rechnung tragen, wenn man das Licht nur im Teilchen- oder nur im Wellenbild beschreibt. Nun scheinen sich diese beiden Bilder gegenseitig auszuschließen: Ein physikalisches Objekt ist entweder ein Teilchen oder eine Welle, aber nie beides zu gleich. Man ist daher gezwungen, die Konzepte der klassischen Physik zu überprüfen, obwohl unsere Alltagserfahrung sie als gesichert erscheinen lassen. Im „mikrosko pischen“ Bereich, auf den wir hier gestoßen sind, können sie nicht mehr gelten. So tritt z. B. ein wesentliches Charakteristikum dieses Bereichs auf, wenn wir hinter den Youngschen Spalten Zähler anbringen: Sobald wir an einem mikroskopischen System eine Messung ausführen, stören wir es in grundsätzlicher Weise. Dies ist deshalb ei ne für uns neue Eigenschaft, weil wir es im makroskopischen Bereich gewöhnt sind, Messapparaturen zu entwerfen, deren Einfluss auf das beobachtete System beliebig klein gemacht werden kann. Eine derartige kritische Revision der klassischen Physik wird durch die Erfahrung, durch das Experiment, erzwungen. Greifen wir zunächst das „Paradoxon“ wieder auf, bei dem das Verhalten eines Photons, das durch einen bestimmten Spalt geht, davon abhängt, ob der andere Spalt geöffnet oder geschlossen ist. Wir sahen: Sobald wir versuchen, die Photonen nach ihrem Durchgang durch die Spalte nachzuweisen, erreichen diese den Schirm nicht mehr. Allgemeiner zeigt eine genauere Analyse der Experimente, dass es unmöglich ist, das Interferenzmuster auf dem Schirm zu beobachten und gleichzeitig zu wissen, durch welchen Spalt jedes Photon gegangen ist (s. Ergänzung DI ). Wir müssen also die Vorstellung aufgeben, dass ein Photon mit Sicherheit einen bestimmten Spalt pas siert. Damit wird aber ein fundamentaler Begriff der klassischen Physik, nämlich der Begriff der Teilchenbahn, in Frage gestellt. Andererseits erzeugen die einzelnen Photonen beim Auftreffen auf dem Schirm schließlich die Interferenzfigur. Man weiß also nicht im Voraus mit Sicherheit, wo ein bestimmtes Photon auf dem Schirm aufschlagen wird, denn alle Photonen werden un ter denselben Bedingungen emittiert. Damit verliert aber auch die klassische Vorstel lung ihre Gültigkeit, nach der die Anfangsbedingungen die weitere Bewegung eines Teilchens vollständig bestimmen. Man kann lediglich sagen: Wenn ein Photon emit tiert wird, so ist die Wahrscheinlichkeit, dass es an der Stelle x auftrifft, proportional zur Intensität I(x), wie sie von der Wellentheorie berechnet wird, also proportional zu |E(x)|2 . Nach vielen Versuchen der Interpretation, auf die wir hier nicht eingehen, gelang te man schließlich zur Vorstellung vom Welle-Teilchen-Dualismus. Man kann sie sche matisch etwa wie folgt zusammenfassen:²
2 Diese Deutung wird allgemein als die „orthodoxe“ angesehen, ist jedoch weiterhin in der Diskus sion.
8 | I Welle und Teilchen
1. Der Wellen- und der Teilchenaspekt des Lichts sind untrennbar; das Licht ver hält sich zugleich wie eine Welle und wie ein Teilchenstrom. Die Welle erlaubt die Berechnung der Wahrscheinlichkeit, mit dem ein Teilchen in Erscheinung tritt. 2. Über das Verhalten eines Photons kann man nur Wahrscheinlichkeitsaussagen machen. 3. Die Information über ein Photon zum Zeitpunkt t wird durch die Lösung E(r, t) der Maxwellschen Gleichungen gegeben; man sagt, dass diese Welle den Zustand des Photons zum Zeitpunkt t charakterisiert. E(r, t) wird als die Wahrscheinlichkeitsam plitude für das Auftreten eines Photons zum Zeitpunkt t an der Stelle r interpretiert. Dies bedeutet, dass die zugehörige Wahrscheinlichkeit proportional zu |E(r, t)|2 ist. Bemerkungen: 1. Die Maxwellschen Gleichungen sind linear und homogen, es gilt also ein Superpositions prinzip: Sind E 1 und E 2 zwei Lösungen dieser Gleichungen, so ist auch λ 1 E 1 + λ 2 E 2 mit zwei beliebigen Konstanten λ 1 und λ 2 eine Lösung. Es ist dieses Prinzip, das in der klassischen Optik die für Wellen typischen Phänomene wie die Interferenz und die Beugung erklärt. Die Deutung von E(r, t) als Wahrscheinlichkeitsamplitude ist daher für die Quantenphysik wesentlich. 2. Die Theorie erlaubt allein die Berechnung der Wahrscheinlichkeit für das Eintreten eines Er eignisses. Die experimentellen Bestätigungen müssen also auf einer großen Zahl identischer Versuche gründen. (Beim obigen Doppelspaltversuch wird zur Herstellung der Interferenzfigur nacheinander eine große Anzahl von Photonen auf die gleiche Art erzeugt und auf den Schirm geschickt; das entstehende Muster ist die Materialisation der berechneten Wahrscheinlichkei ten.) 3. Wir sprechen hier vom „Zustand des Photons“, um im nächsten Abschnitt eine Analogie zwi schen E(r, t) und der Wellenfunktion ψ(r, t) entwickeln zu können, mit der wir den quanten mechanischen Zustand eines materiellen Teilchens charakterisieren. Diese „optische Analogie“ erweist sich als sehr fruchtbar und ermöglicht insbesondere auch ohne Rechnungen ein einfa ches Verständnis verschiedener Quanteneigenschaften materieller Teilchen. Man darf sie jedoch nicht zu weit treiben und etwa glauben, dass E(r, t) in voller Strenge dem Quantenzustand eines Photons zuzuordnen ist.
Wir werden übrigens sehen, dass die Wellenfunktion ψ(r, t) in der Quantenmechanik wesentlich komplex ist, während die komplexe Schreibweise von E(r, t) in der Optik lediglich aus Zweckmäßigkeit verwendet wird (nur der Realteil hat einen physikali schen Sinn). Die genaue Definition des (komplexen) Quantenzustands der Strahlung kann nur im Rahmen der (relativistischen) Quantenelektrodynamik gegeben werden. Auf diese werden wir später skizzenhaft in Ergänzung KI eingehen, und in Kapitel XIX werden wir schließlich die Quantisierung des Strahlungsfelds durchführen.
A-3 Die Spektralzerlegung Wir sind jetzt in der Lage, ein weiteres einfaches optisches Experiment zu behandeln, bei dem wir uns diesmal für die Polarisation des Lichts interessieren. Es gibt uns Ge legenheit, auf die Grundlagen der Messung physikalischer Größen einzugehen.
A Elektromagnetische Wellen und Photonen
| 9
Der Versuch besteht darin, dass wir eine monochromatische ebene und polari sierte Lichtwelle auf einen Analysator A schicken. Oz kennzeichnet die Ausbreitungs richtung der Welle, der Einheitsvektor ep beschreibt ihre Polarisation, s. Abb. 2. Der Analysator A ist für parallel zur x-Richtung polarisiertes Licht durchlässig und absor biert Licht, das parallel zur y-Richtung polarisiert ist.
Abb. 2: Ein einfaches Experiment zur Bestim mung der Polarisation einer Lichtwelle. Ein Lichtbündel breitet sich in z-Richtung aus und durchquert nacheinander den Polarisator P und den Analysator A; θ ist der Winkel zwi schen der x-Richtung und dem von P durchge lassenen Feld. A ist für Schwingungen parallel zur x-Richtung durchlässig.
Bei genügend hoher Intensität beschreibt man diesen Versuch in der klassischen Phy sik wie folgt: Die ebene polarisierte Welle wird durch ein elektrisches Feld von der Form E(r, t) = E0 ep ei(kz−ωt)
(A-6)
charakterisiert, wobei E0 eine Konstante ist. Die Intensität des Lichts ist propor tional zu |E0 |2 . Nach dem Durchgang durch den Analysator A erhält man eine in Ox-Richtung polarisierte ebene Welle E (r, t) = E0 ex ei(kz−ωt)
(A-7)
mit der zu |E0 |2 proportionalen Intensität I . Diese ist durch das Malus-Gesetz I = I cos2 θ
(A-8)
gegeben (ex ist der Einheitsvektor in Ox-Richtung und θ der Winkel zwischen ep und ex : θ = arccos ex ⋅ ep ). Was geschieht, wenn die Intensität I so gering ist, dass die Photonen einzeln nach einander auf den Analysator treffen (in diesem Fall bringt man hinter dem Analysator einen Photonendetektor an)? Zunächst ist festzuhalten, dass er nie einen „Teil“ des Photons registriert: Entweder durchquert das Photon den Analysator, oder es wird von ihm vollständig absorbiert. Weiter kann man (bis auf zwei spezielle Fälle) nicht mit Sicherheit vorhersagen, ob das ankommende Photon den Analysator passiert oder ob es von ihm absorbiert wird; man kennt nur die zugehörigen Wahrscheinlichkeiten. Wenn schließlich eine große Zahl N von Photonen (einzeln nacheinander) auf den
10 | I Welle und Teilchen
Analysator auftrifft, so beobachtet man wieder die klassische Verteilung: Hinter dem Analysator weist man gerade N cos2 θ von ihnen nach. Hieraus ergeben sich die folgenden Vorstellungen: 1. Die Messapparatur (hier der Analysator) zeigt nur bestimmte Ergebnisse an. Im obigen Versuch gibt es nur zwei mögliche Resultate: Das Photon dringt durch den Analysator oder es wird von ihm absorbiert. Man spricht von einer Quantisierung des Ergebnisses, während sich im klassischen Fall [s. Gl. (A-8)] die transmittierte Intensi tät I in Abhängigkeit vom Winkel θ zwischen 0 und I stetig ändert. 2. Zu jedem der beiden Messresultate gehört ein Eigenzustand. Diese Eigenzu stände sind hier durch ep = ex
oder
ep = ey
(A-9)
charakterisiert; dabei ist ey der Einheitsvektor in y-Richtung. Ist ep = ex , so weiß man mit Sicherheit, dass das Photon den Analysator durchdringt. Ist dagegen ep = ey , so wird es mit Sicherheit absorbiert werden. Der Zusammenhang zwischen den Mess ergebnissen und den Eigenzuständen ist also der folgende: Befindet sich das Teilchen vor der Messung in einem der Eigenzustände, so steht das zugehörige Messresultat fest. 3. Befindet sich das Teilchen vor der Messung in einem beliebigen Zustand, so sind nur noch Wahrscheinlichkeitsaussagen über das Messergebnis möglich. Um sie zu ermitteln, zerlegt man den Zustand des Teilchens in eine Linearkombination der verschiedenen Eigenzustände. In unserem Fall schreibt man also ep = ex cos θ + ey sin θ
(A-10)
Die Wahrscheinlichkeit, einen der beiden Eigenzustände zu beobachten, ist dann proportional zum Betragsquadrat des Koeffizienten beim zugehörigen Eigenzustand (die Faktoren genügen der Bedingung, dass die Summe dieser Wahrscheinlichkeiten gleich eins ist). Gleichung (A-10) sagt also aus, dass für jedes Photon die Wahrschein lichkeit cos2 θ besteht, den Analysator zu passieren, und die Wahrscheinlichkeit sin2 θ, von ihm absorbiert zu werden; tatsächlich ist cos2 θ + sin2 θ = 1. Man nennt diese Regel in der Quantenmechanik das Prinzip der Spektralzerlegung. Wir beachten, dass die Zerlegung von der Wahl der Messapparatur abhängt: In Gl. (A-10) wird die Lage der x- bzw. y-Achse durch den Analysator bestimmt. 4. Nach dem Durchgang durch den Analysator ist das Licht vollständig in x-Rich tung polarisiert. Stellt man also nach dem ersten einen zweiten Analysator A auf, der ebenfalls in x-Richtung durchlässig ist, so durchqueren alle Photonen, die durch A gelangen, auch A . Nach 2. bedeutet dies, dass nach dem Durchgang durch A der Eigenzustand der Photonen durch ex beschrieben wird. Wir haben es mit einer plötzli chen Änderung des Teilchenzustandes zu tun: Vor der Messung war der Zustand durch einen Vektor E(r, t) in Richtung von ep gegeben; nach der Messung besitzt man eine zusätzliche Information (das Photon ist hindurchgelangt), die man berücksichtigt, in
B Materielle Teilchen und Materiewellen |
11
dem man den Zustand durch einen anderen, in unserem Fall einen in x-Richtung wei senden Vektor, beschreibt. Man interpretiert diesen Sachverhalt, indem man sagt, die Messung störe das mikroskopische System (hier also das Photon) in grundsätzlicher Weise. Bemerkung: Die bestimmte Vorhersage des Messergebnisses, wenn ep = ex oder ep = ey ist, stellt nur einen Spezialfall dar. Die Wahrscheinlichkeit für eines der möglichen Ereignisse ist dann gleich eins. Um jedoch diese Vorhersage zu verifizieren, muss man eine große Anzahl von Versuchen ausfüh ren: Man muss sich vergewissern, dass alle Photonen den Analysator passieren (oder von ihm absorbiert werden); ep = ex oder ep = ey beschreibt nicht, dass ein bestimmtes Photon durch den Analysator gelangt ist (oder von ihm absorbiert wurde).
B Materielle Teilchen und Materiewellen B-1 Die Einstein-de-Broglie-Beziehungen Die Untersuchung der Emissions- und Absorptionsspektren der Atome führte zu einer weiteren grundlegenden Beobachtung, die im Rahmen der klassischen Physik nicht zu verstehen war. Diese Spektren zeigen eine Linienstruktur, mit anderen Worten emit tiert oder absorbiert das Atom nur Photonen ganz bestimmter Frequenz (d. h. Energie). Eine Deutung dieses Phänomens ist möglich, wenn man annimmt, dass die Energie des Atoms quantisiert ist, also nur bestimmte diskrete Werte E i (i = 1, 2, . . . , n, . . . ) erlaubt sind: Die Emission oder Absorption eines Photons geschieht, wenn das Atom von einem Energiezustand mit dem erlaubten Wert E i in einen Zustand mit dem er laubten Energiewert E j übergeht; die Energieerhaltung verlangt dann, dass das Pho ton eine Frequenz aufweist, die durch die Beziehung hν ij = |E i − E j |
(B-1)
gegeben ist. Im Spektrum dürfen also nur Frequenzen auftreten, die dieser Gleichung genügen. Unabhängig von dieser Überlegung wurde die Existenz diskreter Energieniveaus durch den Versuch von Franck und Hertz nachgewiesen. Bohr schlug zur Erklärung ein Modell vor, nach dem sich die Atomelektronen nur auf bestimmten Bahnen bewe gen durften, und entwickelte mit Sommerfeld eine empirische Regel, mit der man für das Wasserstoffatom diese Bahnen berechnen konnte. Eine Begründung dieser Quan tisierungsregeln konnte man jedoch nicht geben. Erst im Jahre 1923 stellte L. de Broglie die Hypothese auf, nach der auch materiel le Teilchen Wellencharakter besitzen können. Aus ihr erhielt man wieder die Quan tisierungsregeln von Bohr und Sommerfeld, wobei sich die verschiedenen erlaubten Energieniveaus in Analogie zu den Eigenschwingungen einer Saite oder eines Hohl raumresonators ergaben. Durch die Elektronenbeugungsversuche von Davisson und
12 | I Welle und Teilchen
Germer im Jahre 1927 bestätigte sich der Wellencharakter der Materie in besonders deutlicher Weise: Mit materiellen Teilchen konnte man Interferenzfiguren erzeugen. Nach dieser Hypothese ordnet man einem materiellen Teilchen mit der Energie E und dem Impuls p eine Welle mit der Kreisfrequenz ω = 2πν und dem Wellenvektor k durch dieselben Beziehungen zu, wie wir sie für Photonen aufgestellt hatten { E = hν = ℏω { p = ℏk {
(B-2)
Die Wellenlänge ergibt sich dann durch die Einstein-de-Broglie-Beziehung λ=
2π h = |k| |p|
(B-3)
Bemerkung: Dass der Wellencharakter der Materie auf makroskopischer Ebene nur sehr schwer nachzuweisen ist, ergibt sich aus dem sehr kleinen Wert der Planck-Konstanten h. In Ergänzung AI diskutieren wir die de-Broglie-Wellenlängen verschiedener materieller Teilchen.
B-2 Wellenfunktion und Schrödinger-Gleichung Folgen wir der Hypothese von de Broglie, so müssen wir auf materielle Teilchen die Vorstellungen übertragen, die wir in § A für Photonen kennengelernt haben. Wir ge langen dann zu folgender Formulierung: 1. Das klassische Konzept der Bahn (oder Trajektorie) eines Teilchens muss durch den Begriff des von der Zeit t abhängigen Zustands ersetzt werden. Dabei wird der Quantenzustand eines Teilchens wie z. B. eines Elektrons (hier ohne Berücksich tigung des Spins) durch eine Wellenfunktion ψ(r, t) beschrieben, die die gesamte Information enthält, die man über das Teilchen erlangen kann. 2. ψ(r, t) wird als eine Wahrscheinlichkeitsamplitude für den Aufenthalt des Teil chens interpretiert. Nehmen wir an, dass die möglichen Orte des Teilchens ein Kontinuum bilden, so ist die Wahrscheinlichkeit, das Teilchen zum Zeitpunkt t in einem Volumenelement d3 r = dx dy dz um die Stelle r zu finden, proportional zu d3 r und infinitesimal: d𝒫(r, t). Man interpretiert daher |ψ(r, t)|2 als Wahrschein lichkeitsdichte und setzt d𝒫(r, t) = C |ψ(r, t)|2 d3 r
3.
(B-4)
worin C eine Normierungskonstante bedeutet (s. Bemerkung 1 am Ende dieses Abschnitts). Für eine beliebige physikalische Größe A gilt das Prinzip der Spektralzerlegung: – Ein Messergebnis gehört stets zu einem Ensemble von Eigenwerten {a}.
B Materielle Teilchen und Materiewellen | 13
–
Zu jedem Eigenwert a gehört ein Eigenzustand, d. h. eine Eigenfunktion ψ a (r). Gilt zum Zeitpunkt t0 der Messung von A, dass ψ(r, t0 ) = ψ a (r) ist, so liefert sie mit Sicherheit den Wert a. Bei einem beliebigem Zustand ψ(r, t) erhält man die Wahrscheinlichkeit 𝒫a , bei einer Messung zur Zeit t0 den Eigenwert a zu finden, aus der Zerlegung von ψ(r, t0 ) nach den Eigenfunktionen ψ a (r)
–
ψ(r, t0 ) = ∑ c a ψ a (r)
(B-5)
a
Hiernach ist also 𝒫a =
|c a |2 ∑a |c a |2
Durch den Nenner wird die Gesamtwahrscheinlichkeit gleich eins. Misst man den Wert a, so ist unmittelbar nach der Messung die Wellenfunk tion des Teilchens
–
ψ (r, t0 ) = ψ a (r) 4.
(B-6)
(B-7)
Schließlich wird die Bewegungsgleichung postuliert, der die Zustandsfunktion ψ(r, t) zu genügen hat. Man kann zu ihr durch Plausibilitätsüberlegungen ge langen, die von den Einstein-de-Broglie-Beziehungen ausgehen. Ihre Gültigkeit wird bestätigt, indem man die sich aus ihr ergebenden Folgerungen experimen tell überprüft. In Kapitel III werden wir genauer auf diese Gleichung zu sprechen kommen.
Unterliegt ein Teilchen mit der Masse m einem Potential V(r, t), so gilt für die Zu standsfunktion ψ(r, t) die Schrödinger-Gleichung iℏ
ℏ2 ∂ ψ(r, t) = − ∆ψ(r, t) + V(r, t) ψ(r, t) ∂t 2m
(B-8)
Darin ist ∆ = ∂2 /∂x2 + ∂2 /∂y2 + ∂2 /∂z2 der Laplace-Operator. Diese partielle Differentialgleichung zweiter Ordnung ist in ψ linear und homo gen. Folglich gilt für materielle Teilchen ein Superpositionsprinzip, das in Kombinati on mit der Deutung von ψ als Wahrscheinlichkeitsamplitude dazu führt, den Teilchen Welleneigenschaften zuzuschreiben. Weiter ist die Gleichung hinsichtlich der Zeitva riablen von erster Ordnung. Diese Eigenschaft ist notwendig, damit der Zustand des Teilchens zum Zeitpunkt t0 , der durch ψ(r, t0 ) charakterisiert wird, die späteren Zu stände eindeutig bestimmt. Zwischen Materie und Strahlung besteht also eine grundlegende Analogie: In bei den Fällen verlangt eine korrekte Beschreibung der experimentell festgestellten Er scheinungen ein quantenmechanisches Konzept, mit dem insbesondere dem WelleTeilchen-Dualismus Rechnung getragen werden kann.
14 | I Welle und Teilchen
Bemerkungen: 1. Besteht ein System nur aus einem Teilchen, so ist die Wahrscheinlichkeit, es zur Zeit t an einer beliebigen Stelle im Raum zu finden, gleich eins ∫ d𝒫(r, t) = 1
(B-9)
Hierin ist d𝒫(r, t) durch Gl. (B-4) gegeben. Die Wellenfunktion ψ(r, t) ist also quadratintegrabel: ∫ |ψ(r, t)|2 d3 r
ist endlich
(B-10)
Die in Gl. (B-4) auftretende Normierungskonstante C ist dann durch die Beziehung 1 = ∫ |ψ(r, t)|2 d3 r C
(B-11)
bestimmt. Wir werden später sehen, dass die Form der Schrödinger-Gleichung die Zeitunabhän gigkeit von C verlangt. Es wird C = 1, wenn man normierte Wellenfunktionen verwendet, denn dann gilt ∫ |ψ(r, t)|2 d3 r = 1
(B-12)
2. Zwischen dem klassischen Begriff des Zustands eines Teilchens und dem entsprechenden Begriff in der Quantenmechanik besteht ein großer Unterschied. Der Zustand eines klassischen Teilchens zum Zeitpunkt t ist durch die Angabe von sechs Parametern bestimmt, die seine Lage und seine Geschwindigkeit zu diesem Zeitpunkt charakterisieren: Es sind dies z. B. die Ortsko ordinaten x, y, z und die Geschwindigkeitskoordinaten v x , v y , v z . Der Zustand eines Quanten teilchens ist dagegen durch die unendlich vielen Werte der zugehörigen Wellenfunktion ψ(r, t) in den verschiedenen Punkten des Raumes gegeben. Der klassische Begriff der Bahn oder Tra jektorie, also der zeitlichen Aufeinanderfolge verschiedener klassischer Teilchenzustände, muss in der Quantentheorie durch den Begriff der Ausbreitung der dem Teilchen zugeordneten Welle ersetzt werden. Nehmen wir z. B. den weiter oben für Photonen beschriebenen Interferenzver such von Young, der grundsätzlich auch mit Materieteilchen wie Elektronen ausgeführt werden kann, so hat die Frage, welchen Spalt jedes Teilchen durchquert hat, keinen Sinn mehr, weil die zugehörige Welle gleichzeitig durch beide Spalte gelaufen ist. 3. Schließlich ist an dieser Stelle auf einen Unterschied zwischen Photonen und materiellen Teil chen einzugehen: Photonen können während eines Experiments emittiert oder absorbiert wer den, dagegen kann man materielle Teilchen weder erzeugen noch vernichten. Ein erhitzter Draht emittiert Elektronen, die bereits in ihm vorhanden sind. Entsprechend verschwindet ein von ei nem Zähler absorbiertes Elektron nicht, sondern findet sich in einem Atom wieder oder nimmt am elektrischen Strom teil. Erst aus der Relativitätstheorie ergibt sich, dass auch materielle Teil chen erzeugt und vernichtet werden können: Fliegt z. B. ein Photon mit genügend hoher Energie nahe an einem Atom vorbei, so kann es sich in ein Elektron-Positron-Paar materialisieren; um gekehrt zerstrahlt ein Positron zusammen mit einem Elektron und es entstehen Photonen. Da wir uns jedoch hier auf den nichtrelativistischen Quantenbereich beschränken, bei dem die Zeit und die Raumkoordinaten eine unsymmetrische Rolle spielen, setzen wir voraus, dass materielle Teilchen weder erzeugt noch vernichtet werden können. Diese Erhaltungsaussage ist selbst von grundsätzlicher Bedeutung, und eine der sich bei der Aufstellung einer relativistischen Quanten mechanik ergebenden Schwierigkeiten besteht gerade darin, sie aufgeben zu müssen.
C Freie Teilchen. Wellenpakete | 15
C Freie Teilchen. Wellenpakete Nachdem wir im vorangegangenen Abschnitt die für die Beschreibung von Quanten teilchen notwendigen Postulate formuliert haben, wollen wir jetzt einige wichtige Ei genschaften und Folgerungen herleiten. Zunächst behandeln wir den besonders ein fachen Spezialfall eines freien Teilchens.
C-1 Freies Teilchen Wir betrachten ein Teilchen, für das die potentielle Energie im gesamten Raum gleich null ist (oder überall einen konstanten Wert besitzt). Das Teilchen unterliegt also kei ner Kraft; man sagt, es sei frei. Für V(r, t) = 0 wird aus der Schrödinger-Gleichung iℏ
∂ ℏ2 ψ(r, t) = − ∆ψ(r, t) ∂t 2m
(C-1)
Diese Gleichung besitzt offensichtlich Lösungen der Form ψ(r, t) = A ei (k⋅r−ωt)
(C-2)
wobei A eine Konstante ist und k und ω durch die Beziehung ω=
ℏk2 2m
(C-3)
verknüpft sind. Beachten wir die Einstein-de-Broglie-Beziehungen (B-2), so sehen wir, dass diese Gleichung gerade dem aus der klassischen Mechanik bekannten Zusam menhang zwischen der Energie E und dem Impuls p eines freien Teilchens entspricht: E=
p2 2m
(C-4)
Auf die physikalische Deutung eines Zustands von der Form (C-2) werden wir in § C-3 eingehen. An dieser Stelle können wir bereits feststellen, dass wegen |ψ(r, t)|2 = |A|2
(C-5)
eine ebene Welle dieses Typs ein Teilchen repräsentiert, dessen Aufenthaltswahr scheinlichkeit im gesamten Raum gleich ist (s. die unten stehende Bemerkung). Nach dem Superpositionsprinzip ist jede Linearkombination von ebenen Wellen, die (C-3) erfüllen, wieder ein Lösung der Gl. (C-1). Eine derartige Überlagerung kann man als ein Integral ψ(r, t) =
1 ∫ g(k) ei(k⋅r−ω(k)t) d3 k (2π)3/2
(C-6)
16 | I Welle und Teilchen schreiben. d3 k = dk x dk y dk z ist das Volumenelement im k-Raum; g(k) kann kom plexwertig und muss hinreichend regulär sein, damit der Ausdruck genügend oft dif ferenzierbar ist. Übrigens kann man zeigen, dass jede quadratintegrable Lösung in dieser Form geschrieben werden kann. Eine derartige Superposition ebener Wellen nennt man ein dreidimensionales „Wellenpaket“ oder auch eine Wellengruppe. Der Einfachheit halber werden wir uns häufig auf eindimensionale Wellenpakete beschränken.³ In diesem Fall überlagert man ebene Wellen, die sich nur in eine Richtung, etwa in die x-Richtung, ausbreiten; die Wellenfunktion hängt dann nur von x und t ab: +∞
ψ(x, t) =
1 ∫ g(k) ei (kx−ω(k)t) dk √2π
(C-7)
−∞
Im folgenden Abschnitt interessieren wir uns für die Form des Pakets zu einem be stimmten Zeitpunkt. Ist dieser der Nullpunkt, lautet die Wellenfunktion ψ(x, 0) =
1 ∫ g(k) eikx dk √2π
(C-8)
g(k) ist also die Fourier-Transformierte von ψ(x, 0), s. Anhang I: g(k) =
1 ∫ ψ(x, 0) e−ikx dx √2π
(C-9)
Die Gültigkeit von Gl. (C-8) ist also nicht nur auf den Fall des freien Teilchens be schränkt: Bei beliebigem Potential kann man ψ(x, 0) stets in dieser Form schreiben. Die Folgerungen, die sich in den beiden nachstehenden Abschnitten ergeben, gelten daher allgemein. Lediglich in § C-4 gehen wir wieder speziell auf das freie Teilchen ein. Bemerkung: Eine ebene Welle vom Typ (C-2), deren Betrag [s. Gl. (C-5)] im ganzen Raum konstant ist, ist nicht quadratintegrabel. Sie kann in Strenge keinen physikalisch sinnvollen Teilchenzustand reprä sentieren. Auch in der Optik ist eine monochromatische ebene Welle nicht realisierbar.
C-2 Form des Wellenpakets Die Form des Wellenpakets ergibt sich aus der Ortsabhängigkeit der Wellenfunktion zur Zeit t = 0, Gl. (C-8). Wir nehmen an, dass |g(k)| einen Verlauf wie in Abb. 3 auf weist. Das Maximum liege bei k = k 0 und die Halbwertsbreite sei ∆k. 3 Ein einfaches Modell für ein zweidimensionales Wellenpaket wird in Ergänzung EI behandelt. Eini ge allgemeine Eigenschaften dreidimensionaler Pakete untersuchen wir in Ergänzung FI . Dort zeigen wir auch, wie man in bestimmten Fällen ein dreidimensionales Problem auf eindimensionale Proble me zurückführen kann.
C Freie Teilchen. Wellenpakete | 17
Abb. 3: Verlauf des Betrages |g(k)| der FourierTransformierten von ψ(x, 0). Wir nehmen an, dass es sich um ein an der Stelle k = k0 zentriertes Maximum mit der Halbwertsbreite ∆k handelt.
Wir untersuchen zunächst für sehr einfache Spezialfälle das qualitative Verhalten von ψ(x, 0). Als erstes nehmen wir an, dass ψ aus einer Summe von nur drei ebenen Wellen mit den Wellenzahlen k 0 , k 0 − ∆k/2 und k 0 + ∆k/2 besteht, während die Am plituden proportional zu 1, 1/2 und 1/2 sind. Es ist also g(k 0 ) ik0 x 1 i(k0 −∆k/2)x 1 i(k0 +∆k/2)x + e + e [e ] 2 2 √2π ∆k g(k 0 ) ik0 x [1 + cos ( x)] = e 2 √2π
ψ(x) =
(C-10)
Man erkennt, dass |ψ(x)| für x = 0 am größten ist. In diesem Fall sind die drei Wellen in Phase und überlagern sich konstruktiv, s. Abb. 4. Mit größer werdendem |x| unter scheiden sich die relativen Phasen der Teilwellen immer mehr und |ψ(x)| nimmt ab.
Abb. 4: Realteile der drei Wellen, aus denen die Funktion ψ(x) in Gl. (C-10) besteht. Für x = 0 sind die drei Wellen in Phase und interferieren konstruktiv. Entfernt man sich vom Nullpunkt, entstehen zwischen den einzelnen Wellen Phasenunterschiede, und für x = ±∆x/2 löschen sie sich gegensei tig aus.Im unteren Teil der Abbildung ist der Realteil Re{ψ(x)} aufgetragen. Die gestrichelte Kurve gehört zur Funktion [1 + cos( ∆k 2 x)]. Sie liefert nach Gl. (C-10) |ψ(x)|, also die Form des Wellenpakets.
18 | I Welle und Teilchen Ist der Phasenunterschied zwischen eik0 x und ei(k0 ∓∆k/2)x gleich ±π, so verschwindet ψ(x). Das ist an den Stellen x = ±∆x/2 der Fall, wobei ∆x durch die Beziehung ∆x ⋅ ∆k = 4π
(C-11)
gegeben ist. Hiernach ist die Breite ∆x der Funktion |ψ(x)| (also der Abstand zweier Nullstellen von |ψ(x)|) umso größer, je kleiner die Breite ∆k der Funktion |g(k)| ist. Bemerkung: Die Gl. (C-10) zeigt, dass |ψ(x)| in x periodisch ist, also eine Folge von Maxima und Minima auf weist. Das hat seinen Grund darin, dass ψ(x) eine Superposition von endlich vielen (hier drei) ebenen Wellen ist; für eine Überlagerung von unendlich vielen Wellen wie in Gl. (C-8) tritt diese Erscheinung nicht auf; |ψ(x, 0)| kann nur ein einziges Maximum besitzen.
Wir kehren zum allgemeinen Wellenpaket, wie es durch Gl. (C-8) beschrieben wird, zurück. Auch seine Form ergibt sich durch ein Interferenzphänomen: |ψ(x, 0)| nimmt sein Maximum an, wenn die ebenen Wellen konstruktiv interferieren. Es sei α(k) das Argument der Funktion g(k) g(k) = |g(k)|eiα(k)
(C-12)
Wir nehmen an, dass α(k) sich im Intervall [k 0 − ∆k/2, k 0 + ∆k/2], in dem |g(k)| nen nenswert von null verschieden ist, hinreichend regulär verhält. Dann können wir für genügend kleines ∆k die Funktion α(k) in der Umgebung von k = k 0 im Sinne von Taylor linearisieren: α(k) ≈ α(k 0 ) + (k − k 0 ) [
dα ] dk k=k0
(C-13)
Aus Gl. (C-8) wird damit +∞
ei[k0 x+α(k0)] ψ(x, 0) ≈ ∫ |g(k)| ei(k−k0 )(x−x0) dk √2π
(C-14)
−∞
worin wir x0 = − [
dα ] dk k=k0
(C-15)
gesetzt haben. Gleichung (C-14) erweist sich für die Untersuchung von |ψ(x, 0)| als zweckmäßig: Ist |x − x0 | groß, so oszilliert der Integrand im Intervall ∆k sehr rasch. Man erkennt (Abb. 5a), dass sich die Anteile der aufeinanderfolgenden Schwingungen aufheben und zum Integral kaum beitragen. Für einen festen, von der Stelle x0 ent fernten Punkt x ändern sich mit anderen Worten die Phasen der verschiedenen Wellen im Intervall ∆k sehr rasch, und die zugehörigen Wellen löschen sich durch Interferenz aus. Ist dagegen x ≈ x0 , so oszilliert der Integrand praktisch nicht (Abb. 5b); |ψ(x, 0)| wird maximal. Die Lage des Schwerpunkts xm (0) des Wellenpakets ist daher xm (0) = x0 = − [
dα ] dk k=k0
(C-16)
C Freie Teilchen. Wellenpakete | 19
Zu diesem Ergebnis kann man auch durch eine einfache Überlegung gelangen. Ein Integral wie in Gl. (C-8) wird (dem Betrage nach) maximal, wenn die Wellen mit der größten Amplitude, die also zu Wellenzahlen nahe k0 gehören, konstruktiv interferie ren. Dies ist der Fall, wenn die von k abhängigen Phasen dieser Wellen in der Umge bung von k = k 0 nur wenig variieren. Man erhält daher den Paketschwerpunkt aus der Bedingung, dass die Ableitung der Phase nach k für k = k 0 verschwindet (Bedingung der stationären Phase). In unserem Fall lautet die Phase kx + α(k) und xm (0) ist der Wert von x, für den x + dα/ dk null wird.
(a)
(b)
Abb. 5: Zum Verhalten des Integranden in Gl. (C-14). a) Für einen Punkt x mit |x − x0 | > 1/∆k oszilliert der Integrand im Intervall ∆k mehrere Male. b) Hier gilt |x − x0 | < 1/∆k, der Integrand zeigt praktisch keine Oszillation, und er trägt zum Integral über k den wesentlichen Anteil bei. Folglich liegt der Schwerpunkt des Wellenpakets (für den |ψ(x, 0)| sein Maximum annimmt) bei x = x0 .
|ψ(x, 0)| wird umso geringer, je mehr sich x vom Wert x0 unterscheidet. Dieser Abfall macht sich bemerkbar, wenn ei(k−k0 )(x−x0) ungefähr eine Schwingung ausführt, falls k das Intervall ∆k durchläuft, wenn also ∆k(x − x0 ) ≈ 1
(C-17)
ist. Bezeichnen wir mit ∆x die ungefähre Breite des Wellenpakets, so gilt daher ∆k ⋅ ∆x ≥ 1
(C-18)
Damit gelangen wir zu einer klassischen Beziehung zwischen den Breiten zweier Funktionen, von denen die eine die Fourier-Transformierte der anderen ist. Das Pro dukt ∆k ⋅ ∆x ist grundsätzlich nach unten beschränkt; der genaue Wert dieser Schran ke hängt natürlich von der Definition der Breiten ∆x und ∆k ab. Ein Wellenpaket wie das in Gl. (C-7) stellt hiermit den Zustand eines Teilchens dar, dessen Aufenthaltswahr scheinlichkeit zur Zeit t = 0 außerhalb eines Intervalls von der ungefähren Breite ∆x um den Schwerpunkt x0 praktisch null ist.
20 | I Welle und Teilchen
Bemerkung: Aufgrund unserer Überlegung könnte man vermuten, dass das Produkt ∆x ⋅ ∆k stets von der Grö ßenordnung eins ist. Es handelt sich jedoch lediglich um eine untere Grenze: Es ist unmöglich, ein Wellenpaket zu konstruieren, für das dieses Produkt gegen eins vernachlässigt werden könn te. Dagegen kann man immer Wellenpakete aufbauen, bei denen dieses Produkt so groß ist, wie man es nur haben will (s. z. B. Ergänzung GI ). Deshalb haben wir die Beziehung als Ungleichung angeschrieben.
C-3 Die Heisenbergsche Unschärferelation Die Ungleichung (C-18) hat in der Quantenmechanik physikalische Konsequenzen von außerordentlicher Bedeutung, die wir jetzt diskutieren wollen. Dabei beschränken wir uns der Einfachheit halber auf den eindimensionalen Fall. Wir haben gesehen, dass eine ebene Welle ei(k0 x−ω0 t) zu einer Wahrscheinlich keitsdichte gehört, die für beliebiges t auf der x-Achse konstant ist. Dies kann man grob so umschreiben, dass der Wert von ∆x unendlich groß sei. Dagegen gibt es nur eine Frequenz ω0 und nur eine Wellenzahl k 0 . Nach den de-Broglie-Beziehungen be deutet dies, dass die Energie und der Impuls des Teilchens wohlbestimmt sind, denn es ist E = ℏω0 und p = ℏk 0 . Eine derartige ebene Welle kann übrigens als Sonder fall von Gl. (C-7) angesehen werden, in der g(k) eine „Deltafunktion“ (Anhang II) dar stellt: g(k) = δ(k − k 0 )
(C-19)
Der Wert von ∆k ist hier also gleich null. Man kann diesen Sachverhalt aber auch im Rahmen der Spektralzerlegung inter pretieren (§ A-3 und § B-1). Wir nehmen an, dass ein Teilchen, das zur Zeit t = 0 durch die Wellenfunktion ψ(x, 0) = Aeikx beschrieben wird, einen wohlbestimmten Impuls besitzt, d. h. dass eine Impulsmessung zu diesem Zeitpunkt mit Sicherheit p = ℏk ergibt. Hieraus leitet man her, dass eikx den zu p = ℏk gehörenden Eigenzustand cha rakterisiert. Weil andererseits zu jedem reellen Wert von k eine ebene Welle existiert, erstrecken sich die bei einer Impulsmessung an einem beliebigen Zustand a priori zu erwartenden Eigenwerte über die gesamte reelle Zahlengerade. In diesem Fall gibt es keine Quantisierung der möglichen Messresultate: Wie in der klassischen Mechanik sind alle Impulswerte erlaubt. Nach Gl. (C-8) erscheint ψ(x, 0) als eine (lineare) Superposition von Eigenfunk tionen eikx des Impulses mit den Koeffizienten g(k). Man könnte daher |g(k)|2 (bis auf einen konstanten Faktor) als die Wahrscheinlichkeit deuten, den Wert p = ℏk zu finden, wenn man zur Zeit t = 0 den Impuls eines Teilchens misst, dessen Zu stand durch ψ(x, t) beschrieben wird. Nun bilden aber die möglichen Werte für p wie für x ein Kontinuum, und |g(k)|2 ist proportional zu einer Wahrscheinlichkeits dichte: Die Wahrscheinlichkeit d𝒫(k), einen Wert zwischen ℏk und ℏ(k + dk) zu erhal
C Freie Teilchen. Wellenpakete | 21
ten, ist bis auf einen Faktor gleich |g(k)|2 dk. Um dies genauer auszudrücken, schrei ben wir 1 ∫ ψ(p)eipx/ℏ dp (C-20) ψ(x, 0) = √2πℏ Wir wissen, dass ψ(p) und ψ(x, 0) die Parsevalsche Gleichung (s. Anhang I) +∞
+∞
∫ |ψ(x, 0)|2 dx = ∫ |ψ(p)|2 dp −∞
(C-21)
−∞
erfüllen. Ist C der gemeinsame Wert dieser Integrale, so ist d𝒫(x) = 1C |ψ(x, 0)|2 dx die Wahrscheinlichkeit, das Teilchen für t = 0 zwischen x und x + dx zu finden und 1 d𝒫(p) = |ψ(p)|2 dp (C-22) C die Wahrscheinlichkeit dafür, dass die Impulsmessung ein Resultat zwischen p und p + dp liefert. Gleichung (C-21) sichert, dass die Gesamtwahrscheinlichkeit, einen beliebigen Wert zu finden, gleich eins ist. Wir kehren zur Ungleichung (C-18) zurück, die man in der Form ∆x ⋅ ∆p ≥ ℏ
(C-23)
schreiben kann. ∆p = ℏ∆k wird dabei durch die Breite der Kurve |ψ(p)| veranschau licht. Betrachten wir nun ein Teilchen, dessen Zustand durch das Wellenpaket (C-20) bestimmt ist, so wissen wir, dass für t = 0 die Aufenthaltswahrscheinlichkeit nur in ei nem Bereich der Breite ∆x um die Stelle x0 nennenswert von null verschieden ist: Sei ne Lage ist mit einer Unsicherheit ∆x bekannt. Nimmt man zum selben Zeitpunkt an diesem Teilchen eine Impulsmessung vor, so kann man einen Wert zwischen p0 +∆p/2 und p0 − ∆p/2 finden, denn |ψ(p)|2 ist außerhalb dieses Intervalls praktisch null. Dies führt zu folgender Deutung von (C-23): Es ist grundsätzlich unmöglich, zu einem be stimmten Zeitpunkt zugleich die Lage des Teilchens und seinen Impuls mit beliebi ger Genauigkeit zu bestimmen. Wegen der durch (C-23) gegebenen unteren Schranke führt eine höhere Genauigkeit hinsichtlich des Teilchenortes (∆x wird kleiner) zu ei ner größeren Unschärfe beim Impuls (∆p wächst) und umgekehrt. Man nennt diese Beziehung die Heisenbergsche Unschärferelation. Einen derartigen Sachverhalt kennen wir in der klassischen Mechanik nicht. Er beruht darauf, dass das Plancksche Wirkungsquantum h von endlicher Größe ist. Nur auf der makroskopischen Ebene kann man seinen Wert als vernachlässigbar klein an sehen (auf ein Beispiel werden wir in Ergänzung BI zu sprechen kommen). Bemerkung: Die Ungleichung (C-18), von der wir bei unserer Überlegung ausgegangen sind, ist selbst eine rein klassische Beziehung. Sie drückt lediglich eine allgemeine Eigenschaft der Fourier-Trans formierten aus, für die es in der klassischen Physik zahlreiche Anwendungen gibt: So weiß man
22 | I Welle und Teilchen
z. B. aus der Radiotechnik, dass es keinen elektromagnetischen Wellenzug gibt, von dem man gleichzeitig seine Lage und seine Wellenlänge mit unendlicher Genauigkeit bestimmen könnte. Die Quantenmechanik kommt erst durch die Zuordnung einer Welle zu einem materiellen Teilchen ins Spiel, wobei man zwischen der Wellenlänge und dem Impuls das Bestehen der Einstein-deBroglie-Beziehung postuliert.
C-4 Zeitliche Entwicklung eines freien Wellenpakets Bisher waren wir nur an der Form eines Wellenpakets zu einem bestimmten Zeitpunkt interessiert. In diesem Abschnitt wollen wir seine zeitliche Entwicklung untersuchen. Wir betrachten den Fall eines freien Teilchens, dessen Zustand durch das eindimen sionale Wellenpaket (C-7) beschrieben wird. Eine einzelne ebene Welle ei(kx−ωt) breitet sich auf der x-Achse mit der Geschwin digkeit V φ (k) =
ω k
(C-24)
aus, weil sie von x und t nur über den Term (x − ωk t) abhängt. Man nennt V φ (k) die Phasengeschwindigkeit der ebenen Welle. Wir wissen, dass für eine elektromagnetische Welle im Vakuum die Phasenge schwindigkeit V φ von der Wellenzahl k unabhängig und gleich der Vakuumlichtge schwindigkeit c ist. Sämtliche Teilwellen bewegen sich mit der derselben Geschwin digkeit, so dass sich auch das Wellenpaket ohne Formänderung mit der Geschwindig keit c verschiebt. In einem dispersiven Medium ist dies jedoch nicht mehr der Fall. Hier ist die Phasengeschwindigkeit durch V φ (k) =
c n(k)
(C-25)
gegeben, wobei n(k) die von der Wellenlänge abhängige Brechzahl bedeutet. Der uns hier beschäftigende Fall der Teilchenwelle entspricht einer dispersiven Umgebung, weil wegen Gl. (C-3) für die Phasengeschwindigkeit die Beziehung V φ (k) =
ℏk 2m
(C-26)
gilt. Wenn jetzt die verschiedenen Moden unterschiedliche Phasengeschwindigkeiten aufweisen, so werden wir sehen, dass die Geschwindigkeit des Maximums xm des Wel 0 lenpakets nicht gleich der mittleren Phasengeschwindigkeit ωk00 = ℏk 2m ist, wie man zunächst erwarten könnte. Wir wollen zunächst wieder versuchen, die Zusammenhänge qualitativ zu verste hen und erst dann auf den allgemeinen Zusammenhang eingehen. Hierzu betrachten wir noch einmal die Überlagerung von drei Teilwellen (s. § C-2). Zu einem beliebigen
C Freie Teilchen. Wellenpakete |
23
Zeitpunkt t ist dann ψ(x, t) gegeben durch ∆ω ∆k ∆ω g(k 0 ) i[k0 x−ω0 t] 1 i[(k0 − ∆k 2 )x−(ω0 − 2 )t] + 1 ei[(k0 + 2 )x−(ω0 + 2 )t] } + e {e 2 2 √2π ∆k ∆ω g(k 0 ) i(k0 x−ω0 t) [1 + cos ( x − t)] (C-27) = e 2 2 √2π
ψ(x, t) =
Wir sehen also, dass das Maximum von |ψ(x, t)|, das sich zur Zeit t = 0 bei x = 0 befand, jetzt an der Stelle xm (t) =
∆ω t ∆k
(C-28)
ist und nicht im Punkt x = ωk00 t. Die physikalische Erklärung dieses Ergebnisses ver anschaulichen wir in Abb. 6.
(a)
(b)
Abb. 6: Die Lage von drei aufeinanderfolgenden Maxima der drei Teilwellen aus Abb. 4 (a) zur Zeit t = 0 und (b) zu einem späteren Zeitpunkt t. Für t = 0 fallen an der Stelle x = 0 die Maxi ma (2) zusammen: Der Schwerpunkt des Wellenpakets liegt bei xm (0) = 0. Zur Zeit t haben sich die drei Wellen mit unterschiedlichen Phasengeschwindigkeiten V φ ausgebreitet. Jetzt fallen die Maxima (3) zusammen, und der Schwerpunkt des Pakets befindet sich an der Stelle x = xm (t). Man erkennt, dass die Geschwindigkeit des Schwerpunkts (die Gruppengeschwindigkeit) und die Phasengeschwindigkeiten der drei Teilwellen verschieden sind.
Im linken Teil (a) dieser Abbildung ist für jede Teilwelle der Ort von drei aufeinan derfolgenden Maxima (1), (2) und (3) zur Zeit t = 0 angegeben. Die mit dem Index (2) gekennzeichneten Maxima koinzidieren. Hier ist die Interferenz konstruktiv, und |ψ(x, 0)| hat an dieser Stelle sein Maximum. Weil die Phasengeschwindigkeit nach Gl. (C-26) mit k wächst, wird das Maximum (3) der Welle (k 0 + ∆k/2) allmählich das der Welle (k 0 ) einholen, während dieses selbst das Maximum der Welle (k 0 − ∆k/2) erreicht. Nach einer bestimmten Zeitspanne erhalten wir die in Teil (b) skizzierte Situation. Jetzt sind es die Maxima (3), die zusammenfallen und den Ort xm (t) des Maximums von |ψ(x, t)| bestimmen. Man erkennt, dass xm (t) nicht gleich ωk00 t ist, und eine Rechnung führt wieder zur Gl. (C-28).
24 | I Welle und Teilchen
Auf analoge Weise kann man die Verschiebung des Schwerpunkts des Wellenpa kets (C-7) ermitteln, wenn man die Methode der „stationären Phase“ anwendet. Aus der Form dieser aus freien Wellen gebildeten Gruppe erkennt man, dass man von ψ(x, 0) zu ψ(x, t) gelangt, indem man einfach g(k) durch g(k)e−iω(k)t ersetzt. Die Über legungen aus § C-2 können dann übernommen werden, wenn man für das Argument α(k) von g(k) α(k) − ω(k)t
(C-29)
einsetzt. Die Bedingung (C-16) liefert dann xm (t) = [
dω dα t−[ ] ] dk k=k0 dk k=k0
(C-30)
Die Geschwindigkeit des Maximums des Wellenpakets (oder der Wellengruppe) ist danach VG (k 0 ) = [
dω ] dk k=k0
(C-31)
Man nennt sie die Gruppengeschwindigkeit. Mit dem Dispersionsgesetz (C-3) erhalten wir VG (k 0 ) =
ℏk 0 = 2V φ (k 0 ) m
(C-32)
Dies ist ein wichtiges Ergebnis, denn mit ihm gelangt man wieder zur klassischen Be schreibung des freien makroskopischen Teilchens. Bei diesem (z. B. einem Staubkorn, wie wir es in Ergänzung BI behandeln werden) legt die Unschärferelation der Genau igkeit von Lage und Impuls des Teilchens keine beobachtbare Einschränkung auf. Zur quantenmechanischen Behandlung eines derartigen Teilchens kann man daher ein Wellenpaket konstruieren, dessen charakteristische Größen ∆x und ∆p vernachlässig bar sind. Man redet dann von den klassischen Begriffen der Lage xm (t) und des Impul ses p0 des Teilchens. Für seine Geschwindigkeit muss dabei die Beziehung v = p0 /m gelten. Dies entspricht aber gerade der Gl. (C-32), die wir bei unserer quantenmechani schen Überlegung erhalten haben: Für den Fall, dass ∆x und ∆p beide vernachlässigt werden können, bewegt sich das Maximum des Wellenpakets wie ein Teilchen, das den Gesetzen der klassischen Mechanik gehorcht. Bemerkung: Wir haben hier unser Augenmerk auf die Bewegung des Schwerpunkts der aus freien Wellen be stehenden Gruppe gelegt. Man kann auch das zeitliche Verhalten seiner Form untersuchen. Ist die Impulsbreite ∆p eine Konstante der Bewegung, so lässt sich leicht zeigen, dass sich ∆x zeit lich ändert und nach genügend langer Zeit unendlich groß wird (Verbreiterung des Wellenpakets). Wir diskutieren dieses Phänomen in Ergänzung GI am Beispiel des Gaußschen Wellenpakets.
D Teilchen in einem zeitunabhängigen Potential
|
25
D Teilchen in einem zeitunabhängigen Potential Wir haben in § C gesehen, wie sich die quantenmechanische Behandlung eines Teil chens auf die klassische Beschreibung reduziert, wenn die Größe der Planck-Konstan ten vernachlässigt werden kann. In der klassischen Näherung zeigt sich der Wellen charakter nicht, weil die dem Teilchen zugeordnete de-Broglie-Wellenlänge λ = h/p gegenüber den Dimensionen, die seine Bewegung charakterisieren, sehr klein ist. Hier besteht eine Analogie zur Optik. Die geometrische Optik, in der die Welleneigenschaf ten des Lichts nicht berücksichtigt werden, stellt dann eine brauchbare Näherung dar, wenn die Wellenlänge des verwendeten Lichts im Vergleich zu den typischen Abmes sungen des Versuchs (z. B. dem Durchmesser einer Blende) vernachlässigbar ist. In dieser Hinsicht spielt die klassische Mechanik in Bezug auf die Quantenmechanik die selbe Rolle wie die geometrische Optik in Bezug auf die Wellenoptik. In diesem Abschnitt wollen wir das Verhalten eines Teilchens in einem zeitlich konstanten Potential untersuchen. Nach dem eben Gesagten müssen wir mit typi schen (durch den Wellencharakter des Teilchens verursachten) Quanteneffekten rech nen, wenn sich das Potential über Entfernungen ändert, die gegenüber der Wellenlän ge klein sind. Aus diesem Grund behandeln wir verschiedene „Rechteckpotentiale“, d. h. Potentiale, die sich „stufenförmig“ ändern (s. Abb. 7a). Ein derartiges sprunghaf tes Potential muss stets, also auch bei beliebig kleinen Wellenlängen, zu Quantenef fekten führen. Zuvor diskutieren wir aber einige wichtige Eigenschaften der Schrödin ger-Gleichung für den Fall, dass das Potential zeitlich konstant ist.
D-1 Separation der Variablen. Stationäre Zustände Die Wellenfunktion eines Teilchens, dessen potentielle Energie V(r) nicht von der Zeit abhängt, genügt der Schrödinger-Gleichung: iℏ
∂ ℏ2 ψ(r, t) = − ∆ψ(r, t) + V(r)ψ(r, t) ∂t 2m
(D-1)
D-1-a Stationäre Zustände Wir suchen nach Lösungen dieser Gleichung von der Form ψ(r, t) = φ(r)χ(t)
(D-2)
Gehen wir mit diesem Ansatz in Gl. (D-1) ein, so erhalten wir iℏφ(r)
dχ(t) ℏ2 = χ(t) [− ∆φ(r)] + χ(t)V(r)φ(r) dt 2m
(D-3)
Nach Division durch das Produkt φ(r)χ(t) ergibt sich 1 ℏ2 iℏ dχ(t) = [− ∆φ(r)] + V(r) χ(t) dt φ(r) 2m
(D-4)
26 | I Welle und Teilchen In dieser Gleichung hängt die linke Seite nur von t und die rechte nur von r ab. Sie ist also nur dann erfüllt, wenn die beiden Seiten gleich ein und derselben Konstanten sind. Wir wählen diese zu ℏω, wobei ω die Dimension einer Frequenz besitzt. Setzen wir die linke Seite gleich ℏω, so führt das zu einer Differentialgleichung für χ(t), die wir leicht integrieren können. Wir bekommen χ(t) = Ae−iωt
(D-5)
Entsprechend genügt φ(r) der Gleichung −
ℏ2 ∆φ(r) + V(r)φ(r) = ℏωφ(r) 2m
(D-6)
Setzen wir in Gl. (D-5) für A = 1 (was erlaubt ist, denn wir können A zu φ(r) schlagen), so gelangen wir zu folgendem Resultat: Unter der Bedingung, dass φ(r) Lösung der Gl. (D-6) ist, genügt ψ(r, t) = φ(r)e−iωt
(D-7)
der Schrödinger-Gleichung. Man sagt, dass die Koordinaten der Zeit und des Ortes separiert worden sind. Eine Wellenfunktion von der Form (D-7) heißt stationäre Lösung der SchrödingerGleichung, weil sie zu einer zeitunabhängigen Wahrscheinlichkeitsdichte |ψ(r, t)|2 = |φ(r)|2 führt. In einer stationären Funktion tritt nur eine einzige Frequenz ω auf; we gen der Einstein-Beziehung ist ein stationärer Zustand ein Zustand mit wohlbestimm ter Energie E = ℏω (ein Eigenzustand der Energie). Ist in der klassischen Mechanik die potentielle Energie unabhängig von der Zeit, so ist die Gesamtenergie eine Kon stante der Bewegung; in der Quantenmechanik gibt es in diesem Fall wohlbestimmte Energiezustände. Gleichung (D-6) kann man daher in der Form [−
ℏ2 ∆ + V(r)] φ(r) = Eφ(r) 2m
(D-8)
oder auch H φ(r) = E φ(r)
(D-9)
schreiben. Darin ist H der folgende Differentialoperator: H=−
ℏ2 ∆ + V(r) 2m
(D-10)
H ist weiter ein linearer Operator, denn für irgendzwei Konstanten λ1 und λ2 gilt: H[λ1 φ1 (r) + λ2 φ2 (r)] = λ1 Hφ1 (r) + λ2 Hφ2 (r)
(D-11)
D Teilchen in einem zeitunabhängigen Potential |
27
Gleichung (D-9) ist demnach die Eigenwertgleichung des linearen Operators H: Die Anwendung von H auf die „Eigenfunktion“ φ(r) ergibt wieder dieselbe Funktion, mul tipliziert mit dem zugehörigen Eigenwert E. Die möglichen Energiewerte sind gerade die Eigenwerte des Operators H. Später werden wir sehen, dass die Gl. (D-9) nur für bestimmte Werte von E quadratintegrable Lösungen φ(r) zulässt (s. § D-2-c und § 2-c von Ergänzung HI ). Dies ist gerade der Ursprung für die Energiequantisierung. Bemerkung: Gleichung (D-8) [oder auch Gl. (D-9)] wird manchmal auch im Gegensatz zur eigentlichen „zeit abhängigen Schrödinger-Gleichung“ (D-1) „zeitunabhängige Schrödinger-Gleichung“ genannt. Man beachte aber den wesentlichen Unterschied: Gleichung (D-1) ist eine allgemein gültige Dif ferentialgleichung, die die zeitliche Entwicklung der Wellenfunktion für jeden Zustand des Teil chens bestimmt. Dagegen liefert die Eigenwertgleichung (D-9) von allen möglichen Zuständen des Teilchens nur die stationären.
D-1-b Superposition stationärer Zustände Um die verschiedenen möglichen Energiewerte E und die zugehörigen Eigenfunktio nen φ(r) voneinander zu unterscheiden, kennzeichnen wir sie mit einem Index n. Es gilt dann Hφ n (r) = E n φ n (r)
(D-12)
und die stationären Zustände werden durch die Wellenfunktionen ψ n (r, t) = φ n (r)e−iE n t/ℏ
(D-13)
beschrieben. ψ n (r, t) ist Lösung der Schrödinger-Gleichung (D-1). Weil diese linear ist, erlaubt sie eine ganze Folge weiterer Lösungen in der Form ψ(r, t) = ∑ c n φ n (r)e−iE n t/ℏ
(D-14)
n
in denen die Koeffizienten c n beliebige komplexe Konstanten sind. Insbesondere ist ψ(r, 0) = ∑ c n φ n (r)
(D-15)
n
Wir nehmen umgekehrt an, dass wir den Zustand ψ(r, 0) zum Zeitpunkt t = 0 ken nen. Weiter unten werden wir sehen, dass eine beliebige Funktion ψ(r, 0) stets wie in Gl. (D-15) nach den Eigenfunktionen von H zerlegt werden kann. Die Koeffizien ten c n sind also durch ψ(r, 0) bestimmt. Die zugehörige Lösung ψ(r, t) der Schrödin ger-Gleichung ist dann durch (D-14) gegeben. Man muss lediglich jeden Summanden in Gl. (D-15) mit dem Faktor e−iE n t/ℏ multiplizieren, wobei E n der zu φ n (r) gehörende Eigenwert ist. Wir weisen besonders darauf hin, dass diese Phasenfaktoren voneinan der verschieden sind; nur für den Fall stationärer Zustände drückt sich die Zeitabhän gigkeit durch einen einzigen Exponentialfaktor wie in Gl. (D-13) aus.
28 | I Welle und Teilchen
D-2 Eindimensionale Rechteckpotentiale – qualitative Behandlung Zu Beginn dieses Abschnitts stellten wir fest, dass wir mit Quanteneffekten dann zu rechnen haben, wenn sich die Potentiale über kurze Entfernungen verhältnismäßig stark ändern. Wir beschränken uns hier auf eine qualitative Untersuchung und ein fache physikalische Vorstellungen. Eine genauere Behandlung findet sich in Ergän zung HI . Zur Vereinfachung des Problems werden wir uns mit einem eindimensiona len Modell befassen, bei dem die potentielle Energie nur von x abhängt (die Rechtfer tigung für ein derartiges Modell geben wir in Ergänzung FI ). D-2-a Physikalische Bedeutung eines Rechteckpotentials Wir betrachten also für ein eindimensionales Problem ein Potential von der Art, wie es in Abb. 7a dargestellt wird: Die x-Achse ist in verschiedene Bereiche unterteilt, in de nen das Potential konstant ist; dagegen zeigt es jeweils an der Grenze zweier benach barter Bereiche einen plötzlichen Sprung (eine Unstetigkeit). In Wirklichkeit kann ei ne derartige Funktion kein physikalisch sinnvolles Potential repräsentieren, da die ses stetig sein muss. Wir werden sie verwenden, um einen Potentialverlauf, wie er in Abb. 7b skizziert ist, zu schematisieren. Hier tritt keine Unstetigkeit auf, aber V(x) ändert sich in der Umgebung bestimmter Stellen sehr rasch. Sind diese Intervalle im Vergleich zu allen anderen bei dem Problem auftretenden Längen (vor allem auch im Verhältnis zur de-Broglie-Wellenlänge) sehr klein, so kann man dieses Potential durch das Rechteckpotential der Abb. 7a ersetzen. Es handelt sich dabei um eine Näherung, die ihre Gültigkeit z. B. verliert, wenn die Teilchenenergie sehr groß, die Wellenlänge also sehr kurz ist.
(a)
(b)
(c) Abb. 7: Ein Rechteckpotential (a) als Schematisierung eines realistischen Potentials (b), das zu einem in (c) skizzierten Kraftverlauf führt.
D Teilchen in einem zeitunabhängigen Potential
| 29
Die Vorhersagen der klassischen Mechanik über das Verhalten eines Teilchens in einem Potential wie in Abb. 7 sind leicht anzugeben. Man kann sich z. B. vorstellen, es handele sich bei V(x) um die potentielle Energie im Schwerefeld. Abbildung 7b stellt dann das Geländeprofil dar, auf dem sich das Teilchen bewegt: Die Unstetigkeiten ent sprechen dann den scharfen Kanten, die durch horizontale Plateaus getrennt sind. Hinsichtlich der Gesamtenergie E des Teilchens bemerken wir, dass die Bereiche auf der x-Achse, in denen V > E ist, für das Teilchen verboten sind (die kinetische Energie Ekin = E − V darf nicht negativ werden). Bemerkung: Die auf das Teilchen wirkende Kraft ist F(x) = − dV(x)/ dx. Ihren Verlauf zeigt die Abb. 7c. Auf den Plateaus ist also das Teilchen kräftefrei, seine Geschwindigkeit mithin konstant. Nur in den Grenzzonen zwischen diesen Plateaus wirkt auf das Teilchen eine Kraft, die es entweder be schleunigt oder verlangsamt.
D-2-b Analogie zur Optik Wir fragen nach den stationären Zuständen eines Teilchens in einem eindimensiona len Rechteckpotential. In einem Bereich, in dem das Potential einen konstanten Wert V besitzt, lautet die Eigenwertgleichung Gl. (D-9) [−
ℏ2 d2 + V] φ(x) = Eφ(x) 2m dx2
(D-16)
oder auch [
d2 2m + 2 (E − V)] φ(x) = 0 2 dx ℏ
(D-17)
In der Optik gibt es nun eine hierzu vollkommen analoge Gleichung. Betrachten wir nämlich ein transparentes Medium, dessen Brechzahl n weder orts- noch zeitab hängig ist, so können sich in ihm elektromagnetische Wellen ausbreiten, deren elek trischer Feldstärkevektor E(r, t) nicht von y und z abhängt und der von der Form E(r, t) = eE(x)e−iΩt
(D-18)
ist, wobei e einen zur x-Richtung senkrechten Einheitsvektor bedeutet. E(x) muss dann der Differentialgleichung [
d2 n2 Ω 2 + ] E(x) = 0 2 dx c2
(D-19)
genügen. Die Gleichungen (D-17) und (D-19) sind identisch, wenn man setzt: 2m n2 Ω 2 (E − V) = 2 ℏ c2
(D-20)
Ist andererseits x eine Unstetigkeitsstelle des Potentials V [und folglich der durch Gl. (D-20) gegebenen Brechzahl], so sind die Grenzbedingungen für φ(x) und E(x)
30 | I Welle und Teilchen
dieselben: Beide Funktionen müssen mitsamt ihren ersten Ableitungen stetig sein (s. Ergänzung HI , § 1-b). Die formale Analogie zwischen den beiden Gleichungen (D-17) und (D-19) erlaubt es, einem quantenmechanischen Problem mit dem Potential nach Abb. 7a ein optisches Problem zuzuordnen, bei dem sich eine elektromagnetische Wel le mit der Frequenz Ω in einem Medium mit der Brechzahl n ausbreitet, die dieselben Unstetigkeitsstellen aufweist. Nach Gl. (D-20) ist der Zusammenhang zwischen den optischen und den mechanischen Parametern n(Ω) =
1 √2mc2 (E − V) ℏΩ
(D-21)
Ein Bereich, in dem E > V ist, gehört zu einer Lichtwelle in einem transparenten Me dium, dessen Brechzahl reell ist; die Welle hat dann die Form eikx . Was geschieht nun, wenn V > E ist? Gleichung (D-20) führt jetzt zu einer rein imaginären Brechzahl, in Gl. (D-19) ist n2 negativ, und die Lösung hat die Form e−ρx : Das ist die Analogie einer „gedämpften“ Welle. In bestimmter Hinsicht erinnert die Situation an die Ausbreitung einer elektromagnetischen Welle in einem metallischen Medium.⁴ Somit sind wir in der Lage, die in der Wellenoptik wohlbekannten Ergebnisse auf unser mechanisches Problem zu übertragen. Dabei müssen wir uns aber im Klaren sein, dass es sich nur um eine Analogie handelt: Die Interpretation der Wellenfunkti on in der Quantenmechanik ist fundamental verschieden von der physikalischen Deu tung der elektromagnetischen Welle in der klassischen Wellenoptik. D-2-c Beispiele α Potentialstufe und Potentialwall Wir betrachten ein Teilchen mit der Energie E, das aus dem Bereich mit negativen x-Werten kommend auf die Potentialstufe mit der Höhe V0 trifft (Abb. 8).
Abb. 8: Potentialstufe
4 Man darf die Analogie jedoch nicht zu weit treiben. Die Brechzahl eines metallischen Mediums ist nämlich nicht rein imaginär, sondern besitzt auch einen von null verschiedenen Realteil (in einem Metall wird die optische Welle absorbiert und zeigt ein oszillierendes Verhalten).
D Teilchen in einem zeitunabhängigen Potential
| 31
Für E > V0 (der Fall, bei dem das klassische Teilchen über die Potentialstufe hin weggeht und sich mit einer geringeren Geschwindigkeit weiter nach rechts bewegt) ist die optische Analogie die folgende: Eine Lichtwelle bewegt sich von links nach rechts in einem Medium mit der Brechzahl n1 =
c √ 2mE ℏΩ
(D-22)
und trifft bei x = x1 auf die Grenzfläche eines zweiten Mediums (x > x1 ) mit der Brechzahl n2 =
c √2m(E − V0 ) ℏΩ
(D-23)
Wir wissen, dass sich die von links kommende einfallende Welle in eine reflektierte und eine durchgehende Welle aufteilt. Wir übertragen dieses Ergebnis auf die Quan tenmechanik: Für das Teilchen besteht eine gewisse Wahrscheinlichkeit 𝒫, reflektiert zu werden, und lediglich die Wahrscheinlichkeit 1 − 𝒫 für das Fortschreiten nach rechts. Dies steht im Widerspruch zu den Vorhersagen der klassischen Mechanik. Ist E < V0 , so wird die zum Bereich x > x1 gehörende Brechzahl n2 rein imaginär und die einfallende Lichtwelle wird totalreflektiert. Die quantenmechanische Vorher sage stimmt also in diesem Punkt mit der Aussage der klassischen Mechanik überein. Dagegen zeigt die Existenz einer gedämpften Welle für x > x1 an, dass das Quanten teilchen eine von null verschiedene Aufenthaltswahrscheinlichkeit in diesem Bereich besitzt. Noch überraschender ist die Rolle dieser gedämpften Welle für den Fall eines Po tentialwalls (Abb. 9). Ist E < V0 , so würde ein klassisches Teilchen umkehren. In der Optik läge jedoch eine Schicht mit einer imaginären Brechzahl und einer endlichen Di cke vor, die in ein transparentes Medium eingebettet ist. Falls diese Dicke nicht sehr viel größer als die Reichweite 1/ρ der gedämpften Welle ist, so wird ein Teil der einfal lenden Welle transmittiert und gelangt in den Bereich x > x2 . Danach gibt es auch für E < V0 eine von null verschiedene Wahrscheinlichkeit dafür, dass das Teilchen den Wall durchdringt: Man nennt dieses Phänomen den Tunneleffekt.
Abb. 9: Potentialwall
32 | I Welle und Teilchen β Potentialtopf Die Funktion V(x) hat hier die Form, wie sie in Abb. 10 skizziert ist. Hat das Teilchen eine negative Energie E, jedoch größer als −V0 , so sagt die klassische Mechanik aus, dass es nur mit der kinetischen Energie Ekin = E + V0 zwischen x1 und x2 oszillieren kann; hat das Teilchen eine positive Energie und erreicht es von links die Stelle x1 , so erfährt es dort eine plötzliche Beschleunigung, an der Stelle x2 eine gleich große Verzögerung und bewegt sich dann weiter nach rechts.
Abb. 10: Potentialtopf
In der optischen Analogie zum Fall −V0 < E < 0 sind die zu den Bereichen x < x1 und x > x2 gehörenden Brechzahlen n1 und n3 imaginär, während die Brechzahl n2 für das Intervall [x1 , x2 ] reell ist. Dies entspricht z. B. einer Luftschicht zwischen zwei reflektierenden Medien. Die verschiedenen bei x1 und x2 reflektierten Wellen löschen sich bis auf die „Eigenmoden“ durch Interferenz aus. Diese bilden die stehenden Wel len, die durch ganz bestimmte Frequenzen gekennzeichnet sind. Die quantenmecha nische Übersetzung dieser Tatsache führt zu der Aussage, dass die negativen Energien quantisiert sind, während klassisch alle Werte zwischen −V0 und 0 möglich sind. Da bei sind die erlaubten Energiewerte nicht durch die bekannte Bedingung x2 − x1 = kλ2 /2 bestimmt, weil man die Existenz gedämpfter Wellen berücksichtigen muss. Die se führen bei der Reflexion an den Stellen x = x1 und x = x2 zu einer Phasenverschie bung, s. Ergänzung HI , § 2-c. Für E > 0 sind die Brechzahlen n1 , n2 und n3 reell: n1 = n3 = n2 =
c 1√ 2mE Ωℏ
c 1 √2m(E + V0 ) Ωℏ
(D-24) (D-25)
Weil n2 größer als n1 und n3 ist, haben wir es mit einer Situation zu tun, die analog zu der einer Glasplatte in Luft ist. Um die reflektierte Welle im Bereich x < x1 oder die transmittierte im Bereich x > x2 zu erhalten, muss man unendlich viele Wellen super ponieren, die von den Reflexionen zwischen x1 und x2 herrühren (das entspricht der Vielstrahlinterferenz wie bei einem Fabry-Pérot-Interferometer). Man findet dann z. B.,
D Teilchen in einem zeitunabhängigen Potential
| 33
dass für bestimmte Frequenzen des einfallenden Lichts die Welle vollständig transmit tiert wird. Aus der Sicht der Quantenmechanik besteht für das Teilchen demnach im Allgemeinen eine gewisse Wahrscheinlichkeit, reflektiert zu werden. Es gibt aber En ergiewerte, die sogenannten Resonanzenergien, für die die Transmissionswahrschein lichkeit gleich eins und folglich die Reflexionswahrscheinlichkeit null ist. Wir erkennen an diesen Beispielen, wie die Vorhersagen der Quantenmechanik von denen der klassischen Mechanik verschieden sein können. Sie machen darüber hinaus deutlich, welche grundsätzliche Rolle Unstetigkeiten des Potentials (mit de nen wir seine raschen Änderungen schematisiert und idealisiert umschrieben haben) spielen.
D-2-d Zusammenfassung In diesem Kapitel sind wir qualitativ und intuitiv auf bestimmte grundlegende Vor stellungen der Quantenmechanik eingegangen. In Kapitel III werden wir hierauf genauer und systematisch zurückkommen. Bereits jetzt ist aber klar, dass sich die quantenmechanische Beschreibung physikalischer Systeme wesentlich von der klas sischen Behandlung unterscheidet (obwohl diese weiterhin in vielen Fällen gültig bleibt). Wir hatten uns bei unseren Überlegungen auf den Fall eines einzigen Teil chens beschränkt. In der klassischen Mechanik ist der Zustand eines Teilchens zu einem bestimmten Zeitpunkt t durch die Angabe von sechs Parametern, z. B. durch die Koordinaten des Ortsvektors r(t) und der Geschwindigkeit v(t), definiert. Alle weiteren Größen (wie Energie, Impuls, Drehimpuls) sind dann durch r(t) und v(t) bestimmt; r(t) erhält man aus der Newtonschen Bewegungsgleichung. Diese ist eine gewöhnliche Differentialgleichung zweiter Ordnung, die bei Vorgabe der Anfangslage und der Anfangsgeschwindigkeit des Teilchens, also bei Kenntnis seines Zustands zu einem bestimmten Zeitpunkt, eindeutig gelöst werden kann. In der Quantenmechanik ist die Beschreibung verwickelter. Hier wird der Zustand eines Teilchens durch eine Wellenfunktion dargestellt. Er hängt nicht mehr von nur sechs, sondern von unendlich vielen Parametern, nämlich von den Werten von ψ(r, t) in allen Raumpunkten r ab. Weiter sind die Vorhersagen über Messergebnisse nur noch Wahrscheinlichkeitsaussagen. Die Wellenfunktion ist Lösung der SchrödingerGleichung, mit der man ψ(r, t) aus der Kenntnis von ψ(r, 0) ermitteln kann. Diese partielle Differentialgleichung impliziert ein Superpositionsprinzip, das typische Wel leneffekte zur Folge hat. Es ist die Erfahrung, die diesen Umsturz in der Mechanik erzwungen hat: Die klas sische Mechanik kann Struktur und Verhalten der Materie auf atomarem Niveau nicht erklären. Die Theorie verliert an Einfachheit, doch gewinnt sie dafür an Einheitlich keit, weil jetzt Materie und Strahlung mit dem gleichen Konzept, dem Welle-TeilchenDualismus, beschrieben werden. Obwohl dies unseren Vorstellungen, an die wir uns beim Umgang mit den makroskopischen Vorgängen gewöhnt haben, widerspricht, ist es in sich völlig konsistent: Niemand hat ein Experiment vorstellen können, bei dem
34 | I Welle und Teilchen
die Unschärferelationen verletzt würden (s. Ergänzung DI ). Bis heute widerspricht kei ne Beobachtung den Grundprinzipien der Quantenmechanik. Allerdings gibt es auch noch keine Theorie, die alle relativistischen und quantenphysikalischen Phänomene umfassend beschreiben kann, und eine weitere Revolution ist in der Physik nicht mit Sicherheit auszuschließen.
Referenzen und Literaturhinweise Übersicht über physikalische Phänomene, die es nötig machten, Quantenkonzepte einzuführen: zu finden im Unterabschnitt Einführende Bücher – Quantenphysik des Abschnitts 1 der Bibliographie, insbesondere Wichmann (1.1) und Feynman, Bd. 5 (1.2), Kap. 1 und 2. Zur Geschichte der Ausarbeitung von Quantenkonzepten: Referenzen im Abschnitt 4 der Bibliographie, insbesondere Jammer (4.8); siehe auch die Quelle (5.12) sowie Jam mer (5.13), wo zahlreiche Referenzen auf Originalartikel angegeben sind. Grundlegende Experimente: Referenzen auf Originalartikel sind im Abschnitt 3 der Bibliographie zu finden. Zum Problem der Interpretation der Quantenmechanik: Abschnitt 5 der Bibliographie, insbesondere die Quelle (5.12), in der viele klassische Referenzen angegeben sind. Sie he auch Jammer (5.13) und Laloë (5.7). Gemeinsamkeiten und Unterschiede zwischen Materiewellen und elektromagneti schen Wellen: Bohm (5.1), Kap. 4, insbesondere die Zusammenstellung Summary on Probabilities am Ende des Kapitels. Siehe auch die Artikel von Schrödinger (1.25), Gamow (1.26), Born und Biem (1.28) sowie Scully und Sargent (1.30).
Übersicht über die Ergänzungen zu Kapitel I |
35
•
Übersicht über die Ergänzungen zu Kapitel I AI
De-Broglie-Wellenlängen
BI
Zur Unschärferelation
CI
Unschärferelationen und Atomparameter
DI
Ein Experiment zur Unschärferelation
Einfache, aber grundlegende Überlegungen zu den Größenordnungen quantenphysikalischer Parameter.
Besprochen wird ein einfaches Experiment, mit dem man versuchen könnte, die Aussage von der Komplementarität des Teilchen- und des Wellenaspekts beim Licht zu widerlegen. (einfach) Ergänzungen über Wellenpakete (§ C von Kap. I)
EI
Ein zweidimensionales Wellenpaket
EI zeigt auf einfache Weise den Zusammenhang zwischen der lateralen Ausdehnung eines zweidimensionalen Wellenpakets und der Winkeldispersion der Wellenvektoren auf. (einfach)
FI
Zusammenhang zwischen ein- und dreidimensionalen Problemen
FI verallgemeinert die Ergebnisse aus § C auf den dreidimensionalen Fall. Es wird gezeigt, wie man die Untersuchung eines Teilchens im dreidimensionalen Raum in bestimmten Fällen auf eindimensionale Probleme zurückführen kann. (etwas schwieriger)
GI
Eindimensionales Gaußsches Wellenpaket
GI befasst sich mit dem Sonderfall des Gaußschen Wellenpakets, dessen Eigenschaften und zeitliche Entwicklung exakt berechnet werden können. (nur mathematisch etwas aufwendiger)
HI
Stationäre Zustände eines Teilchens in einem eindimensionalen Recht eckpotential
Hier werden die Überlegungen aus § D-2 wieder aufgenommen und quantitativ präzisiert. Diese Ergänzung sei besonders empfohlen, da Rechteckpotentiale häufig zur einfachen Illustration quantenmechanischer Aussagen verwendet werden. (Viele der späteren Ergänzungen und Aufgaben basieren auf den Ergebnissen dieser Ergänzung.)
JI
Wellenpaket an einer Potentialstufe
An einem speziellen Beispiel wird das Verhalten eines Teilchens in einem Rechteckpotential genauer untersucht. Das Teilchen ist hinreichend im Raum (als Wellengruppe) lokalisiert, so dass man seine „Bewegung“ verfolgen kann. (von mittlerer Schwierigkeit; wichtig für die physikalische Interpretation der Ergebnisse)
KI
Aufgaben
•
36 | Ergänzung AI
Ergänzung AI De-Broglie-Wellenlängen Aufgrund der de-Broglie-Beziehung λ=
h p
(1)
ist die einem Teilchen zugeordnete Wellenlänge umso größer, je kleiner die Masse m und die Geschwindigkeit v dieses Teilchens sind. Um zu zeigen, dass es nicht möglich ist, im makroskopischen Bereich die Wellen eigenschaften der Materie zu beobachten, nehmen wir als Beispiel ein Staubkorn mit dem Durchmesser 1 μm und der Masse m ≈ 10−15 kg. Beträgt ferner seine Geschwin digkeit v ≈ 1 mm/s, so ergibt Gl. (1) 6.6 × 10−34 m = 6.6 × 10−16 m (2) 10−15 × 10−3 Eine derartige Länge ist im Vergleich zur Größe des Staubkorns zu vernachlässigen. Bei einem thermischen Neutron dagegen ist die Masse mn ≈ 1.67 × 10−27 kg, während sich seine Geschwindigkeit aus der mittleren thermischen Energie bei der (absoluten) Temperatur T ergibt. Es gilt der Zusammenhang λ≈
1 p2 3 mn v2 = ≈ kT 2 2mn 2
(3)
worin k die Boltzmann-Konstante (k ≈ 1.38 × 10−23 J/K) ist. Die zugehörige Wellen länge ist dann λ=
h h = p √3mn kT
(4)
Für eine Temperatur von T ≈ 300 K finden wir λ ≈ 1.4 × 10−10 m
(5)
also eine Länge von der Größenordnung der Atomabstände in einem Kristall. Fällt ein thermischer Neutronenstrahl auf einen Kristall, so erzeugt er Beugungserscheinun gen, wie man sie ähnlich auch mit Röntgen-Strahlen erreicht. Wir schätzen weiter die Größenordnung der de-Broglie-Wellenlänge von Elektro nen (Masse me ≈ 0.9 × 10−30 kg) ab. Wird ein Strahl von Elektronen durch eine Span nung V (gemessen in Volt) beschleunigt, so gewinnen sie die kinetische Energie E = qV = 1.6 × 10−19 V J q = 1.6 × 10−19 C ist die Ladung des Elektrons. Mit E = hörige Wellenlänge λ=
h h = p √2me E
https://doi.org/10.1515/9783110638738-002
(6) 2
p 2me
erhalten wir für die zuge-
(7)
De-Broglie-Wellenlängen |
37
•
also λ=
6.6 × 10−34 √2 × 0.9
× 10−30
× 1.6
× 10−19 V
m ≈
12.3 −10 10 m √V
(8)
Bei Spannungen von einigen hundert Volt erreicht man diesmal Wellenlängen, die mit denen der Röntgen-Strahlung vergleichbar sind. Mit diesen Elektronenstrahlen kann man an Kristallen oder Kristallpulver Beugungserscheinungen erzeugen. Mit den heutigen Beschleunigern erreicht man so hohe Energien, dass man sich nicht mehr im nichtrelativistischen Bereich befindet. So erzeugt man z. B. Elektro nenstrahlung, deren Energie 1 GeV = 109 eV überschreitet (1 eV = 1 Elektronvolt = 1.6 × 10−19 J), während die Ruhemasse des Elektrons ungefähr 0.5 × 106 eV beträgt. Die Geschwindigkeit liegt dann schon sehr nahe bei der Lichtgeschwindigkeit c. Dar um ist die nichtrelativistische Quantenmechanik, wie wir sie hier behandeln, nicht mehr anwendbar. Die Einstein-de-Broglie-Beziehungen E = hν λ=
h p
(9a) (9b)
gelten aber auch im relativistischen Bereich. Dagegen muss die Beziehung (7) modifi ziert werden, denn in der Relativitätstheorie ist die Energie E eines Teilchens mit der Ruhemasse m0 durch E = √p2 c2 + m20 c4
(10)
gegeben. Im eben betrachteten Beispiel (Elektronenenergie 1 GeV) ist me c2 gegenüber E vernachlässigbar, und man erhält λ≈
hc 6.6 × 10−34 × 3 × 108 m = 1.2 × 10−15 m = E 1.6 × 10−10
(11)
Mit diesen hochenergetischen Elektronen kann man die Struktur von Atomkernen un tersuchen, vor allem die des Protons. Bemerkungen: 1. Wir weisen auf einen häufig anzutreffenden Fehler hin, der bei der Berechnung der de-BroglieWellenlänge eines Teilchens gemacht wird, dessen Ruhemasse m 0 von null verschieden ist und von dem man die Energie E kennt. Dieser Fehler besteht darin, dass man mit der Beziehung (9a) die Frequenz ν berechnet und dann in Analogie zu elektromagnetischen Wellen für die de-Bro glie-Wellenlänge c/ν setzt. Richtig geht man offensichtlich so vor, dass man z. B. mit Gl. (10) – p2 oder im nichtrelativistischen Fall mit der Beziehung E = 2m – den zu E gehörenden Impuls p bestimmt und dann mit Gl. (9b) die Wellenlänge λ findet. 2. Nach Gl. (9a) hängt die Frequenz ν von der Wahl des Energienullpunkts ab. Das gleiche gilt dν für die Phasengeschwindigkeit V φ = ωk = νλ. Die Gruppengeschwindigkeit VG = dω = 2π dk dk ist dagegen von dieser Wahl unabhängig. Dies ist für die physikalische Interpretation von VG wichtig.
•
38 | Ergänzung AI
3. Nach Gl. (1) sollte die Wellenlänge bei beliebiger Teilchenmasse unendlich groß werden, wenn die Geschwindigkeit gegen null geht. Kehren wir darum noch einmal zum Beispiel mit dem Staub korn zurück. Damit die Wellenlänge die Größenordnung seines Durchmessers (1 μm) erreicht, dürfte seine Geschwindigkeit nicht größer werden als 10−9 mm/s = 10−6 μm/s. Es ist bei einem Staubkorn sehr schwierig festzustellen, ob seine Geschwindigkeit eine derartige Grenze über schreitet: Die ihm zugeordnete de-Broglie-Wellenlänge ist selbst dann vernachlässigbar klein, wenn es praktisch in Ruhe ist. Bei Teilchen wie Neutronen oder Elektronen zeigen sich Quanten effekte sehr viel leichter (s. die folgende Ergänzung).
Referenzen und Literaturhinweise Wichmann (1.1), Kap. 5; Eisberg und Resnick (1.3), § 3.1.
Zur Unschärferelation | 39
•
Ergänzung BI Zur Unschärferelation 1 2
Makroskopisches System | 39 Mikroskopisches System | 40
Wir haben in § C-3 von Kap. I gesehen, dass die Lage und der Impuls eines Teilchens nicht gleichzeitig mit beliebiger Genauigkeit bestimmt werden kann: Die Unschärfen ∆x und ∆p müssen der Unschärferelation ∆x ⋅ ∆p ≥ ℏ
(1)
genügen. Wir wollen hier numerisch abschätzen, welche Rolle diese Einschränkung spielt, und zeigen, dass sie im makroskopischen Bereich völlig vernachlässigbar, im mikroskopischen dagegen entscheidend ist.
1 Makroskopisches System Nehmen wir wieder das Beispiel mit dem Staubkorn aus Ergänzung AI . Sein Durch messer sei etwa 1 μm und seine Masse m ≈ 10−15 kg; es bewege sich mit der Geschwin digkeit v = 10−3 m/s. Dann beträgt sein Impuls p = mv ≈ 10−18 kg m/s
(2)
Misst man die Lage z. B. auf 0.01 μm genau, so muss die Impulsunschärfe der folgen den Bedingung genügen: ∆p ≈
ℏ ≈ 10−26 kgm/s ∆x
(3)
Die Unschärferelation führt also praktisch zu keiner Einschränkung, denn es gibt kei ne Messapparatur, mit der man eine relative Impulsgenauigkeit von 10−8 erreichen könnte. Quantenmechanisch würde man das Staubkorn durch ein Wellenpaket zu be schreiben haben, dessen Gruppengeschwindigkeit v = 10−3 m/s ist und dessen mittle rer Impuls p = 10−18 kg ⋅ m/s beträgt. Für dieses Paket kann man aber eine räumliche Ausdehnung ∆x und eine Impulsbreite ∆p so klein annehmen, dass sie völlig ver nachlässigbar sind. Das Maximum des Wellenpaketes repräsentiert damit die Lage des Staubkorns, und seine Bewegung ist mit der eines klassischen Teilchens iden tisch.
https://doi.org/10.1515/9783110638738-003
•
40 | Ergänzung BI
2 Mikroskopisches System Wir betrachten jetzt ein Elektron in einem Atom. Das Bohrsche Modell beschreibt es als ein klassisches Teilchen. Die erlaubten Bahnen ergeben sich aus Quantisierungs regeln, die einfach postuliert werden: Ist z. B. r der Radius einer Kreisbahn, auf dem das Elektron umläuft, und p = mv der Elektronenimpuls, so fordert man mit einer ganzen Zahl n, dass pr = nℏ
(4)
sein muss. Damit man klassisch überhaupt von einer Elektronenbahn sprechen kann, müs sen die Orts- und die Impulsunschärfe gegenüber r und p vernachlässigbar sein: ∆x ≪ r
(5a)
∆p ≪ p
(5b)
Dies aber verlangt, dass ∆x ∆p ≪1 r p
(6)
ist. Andererseits ergibt sich aus der Unschärferelation ∆x ∆p ℏ ≥ r p rp
(7)
Wenn man nun mit Hilfe der Gl. (4) auf der rechten Seite rp durch nℏ ersetzt, so lautet diese Ungleichung ∆x ∆p 1 ≥ r p n
(8)
Man sieht, dass die Beziehungen (8) und (6) nur dann miteinander verträglich sind, wenn n ≫ 1 ist: Die Unschärferelation zwingt uns dazu, das halbklassische Bild der Bohrschen Bahnen zu verwerfen.
Referenzen und Literaturhinweise Bohm (5.1), Kap. 5, § 14.
Unschärferelationen und Atomparameter | 41
•
Ergänzung CI Unschärferelationen und Atomparameter Die Heisenbergschen Unschärferelationen entziehen dem Begriff der Bohrschen Bahn jede physikalische Realität (s. Ergänzung BI ). Die Quantentheorie des Wasserstoff atoms werden wir im siebten Kapitel behandeln. Schon hier wollen wir aber zeigen, wie man mit Hilfe der Unschärferelation die Stabilität der Atome verstehen und auf einfache Weise die Größe des Atoms und seine Grundzustandsenergie abschätzen kann. Wir betrachten ein Elektron, das sich im Coulomb-Feld eines Protons bewegt. Von diesem nehmen wir an, dass es im Ursprung des verwendeten Koordinatensystems ruht. Ist r der Abstand des Elektrons vom Proton, so ist die potentielle Energie q2 1 (1) 4πε0 r worin q die Elektronenladung bedeutet (sie ist exakt entgegengesetzt gleich der La dung des Protons). Wir setzen V(r) = −
q2 = e2 (2) 4πε0 Wir nehmen an, dass der Zustand des Elektrons durch eine kugelsymmetrische Wel lenfunktion beschrieben wird, deren räumliche Ausdehnung durch r0 charakterisiert wird (dies bedeutet, dass die Aufenthaltswahrscheinlichkeit für Abstände wie 2r0 oder 3r0 praktisch null ist). Die zu diesem Zustand gehörende potentielle Energie hat dann die Größenordnung e2 (3) r0 Das liefert den kleinstmöglichen Wert, wenn man für r0 den kleinstmöglichen Wert nimmt, d. h. eine Wellenfunktion, die möglichst dicht um das Proton konzentriert ist. Wir müssen aber auch die kinetische Energie berücksichtigen. Dies geschieht über das Unschärfeprinzip. Wenn nämlich das Elektron auf ein Volumen von der linearen Abmessung r0 beschränkt ist, so ist die Impulsunschärfe ∆p wenigstens von der Größe ℏ/r0 . Selbst wenn also der mittlere Impuls null ist, gilt dies nicht für die zu diesem Zustand gehörende kinetische Energie T. Vielmehr ist V ≈−
T ≥ T min =
1 ℏ2 (∆p)2 ≈ 2m 2mr20
(4)
Daher wird die minimale kinetische Energie umso größer, je kleiner man zur Verrin gerung der potentiellen Energie den Parameter r0 wählt. Die niedrigste Gesamtenergie, die mit der Unschärferelation verträglich ist, ist das Minimum der Funktion ℏ2 e2 − (5) Emin = T min + V = 2 2mr0 r0 https://doi.org/10.1515/9783110638738-004
•
42 | Ergänzung CI
Sie ergibt sich für ℏ2 me2 und hat den Wert r0 = a0 =
E0 = −
me4 2ℏ2
(6)
(7)
Den gleichen Ausdruck wie in (6) erhält man beim Bohrschen Atommodell für den Radius der ersten Bahn und Gl. (7) liefert die richtige Energie des Grundzustands des Wasserstoffatoms (s. Kapitel VII; die Wellenfunktion des Grundzustands verhält sich wie e−r/a0 ). Diese quantitative Übereinstimmung kann natürlich nur ein Zufall sein, weil wir hier nur Größenordnungen abgeschätzt haben. Doch zeigt sich bei dieser Rechnung eine wichtige physikalische Tatsache: Aufgrund der Unschärferelation ist die kinetische Energie des Elektrons umso größer, je geringer die räumliche Ausdeh nung seiner Wellenfunktion ist: Der Grundzustand des Atoms ist das Resultat eines „Kompromisses“ zwischen kinetischer und potentieller Energie, s. Abb. 1.
Abb. 1: Potentielle Energie V, kinetische Energie T und Gesamtenergie T + V eines Wasserstoffatoms in Abhän gigkeit von der „Ausdehnung“ r0 der Wellenfunktion. T und V ändern sich gegenläufig, so dass die Gesamt energie ein Minimum annehmen kann. Der zugehörige Wert a0 von r0 stellt eine Abschätzung für die Größe des Wasserstoffatoms dar.
Noch einmal sei betont, dass dies auf der Unschärferelation beruht und sich von dem unterscheidet, was man in der klassischen Mechanik erwarten würde. Bewegte sich das Elektron nämlich auf einer klassischen Kreisbahn¹ mit dem Radius r0 , so wäre seine potentielle Energie Vkl = −
e2 r0
(8)
Die zugehörige kinetische Energie ergäbe sich durch Gleichsetzen der elektrostati schen Kraft und der Zentrifugalkraft: e2 v2 =m 2 r0 r0
(9)
1 Nach der klassischen Elektrodynamik strahlt ein beschleunigtes Elektron, so dass es schon deshalb keine stabilen Bahnen geben kann.
Unschärferelationen und Atomparameter |
43
•
woraus folgt, dass Tkl =
1 2 1 e2 mv = 2 2 r0
(10)
ist. Die Gesamtenergie wäre dann Ekl = Tkl + Vkl = −
1 e2 2 r0
(11)
Die energetisch günstigste Situation erhielte man für r0 = 0, was eine unendlich hohe Bindungsenergie bedeuten würde. Man kann sich daher auch so ausdrücken, dass es die Unschärferelation ist, die die Existenz stabiler Atome verständlich macht.
Referenzen und Literaturhinweise Feynman, Bd. 5 (1.2), § 2.4. Die gleiche Argumentation ist für Moleküle anwendbar: Schiff (1.18), erster Abschnitt von § 49.
•
44 | Ergänzung DI
Ergänzung DI Ein Experiment zur Unschärferelation In § A-2 von Kap. I analysierten wir den Youngschen Doppelspaltversuch und gelang ten zu folgender Schlussfolgerung: Einerseits können weder der Wellenaspekt noch der Teilchenaspekt des Lichts allein die beobachteten Phänomene erklären, anderer seits schließen sie sich gegenseitig aus, und zwar in dem Sinne, dass nicht bestimmt werden kann, durch welchen Spalt jedes Photon gelangt ist, ohne dass dabei die In terferenzfigur zerstört würde. Man drückt dies manchmal so aus, dass die Wellen- und die Teilcheneigenschaften zueinander komplementär seien. Wir wollen zeigen, wie eng diese Komplementarität und die Unschärferelati on miteinander zusammenhängen. Zur Widerlegung des Komplementaritätsbegriffs könnte man sich nämlich vorstellen, dass es ausgeklügeltere Versuchsanordnungen als das Aufstellen von Photomultipliern hinter den Spalten gibt. Auf einen denkbaren Fall gehen wir hier ein.
Abb. 1: Schema einer Versuchsanordnung mit einer beweg lichen Platte P. Ihr Impuls soll vor und nach Durchgang des Photons so gemessen werden, dass man vor dem Auf treffen dieses Photons im Punkt M weiß, durch welchen Spalt es gegangen ist.
Die Spaltplatte P in Abb. 1 sei in ihrer Ebene verschiebbar so angebracht, dass man die auf sie übertragenen vertikalen Impulse messen kann. Wir betrachten ein Photon, das auf dem Beobachtungsschirm im Punkt M auftrifft (der Einfachheit halber befinde sich die Lichtquelle Q im Unendlichen). Der Impuls dieses Photons ändert sich beim Passieren der Platte; die Impulserhaltung verlangt, dass diese die Differenz aufnimmt. Nun hängt aber der Impulsübertrag von der Bahn des Photons ab. Je nachdem, ob es durch den Spalt S1 oder S2 geht, haben wir p1 = −
hν sin θ1 c
(1)
hν sin θ2 c
(2)
oder p2 = −
(hν/c ist der Impuls des Photons, θ1 bzw. θ2 sind die Winkel zwischen S1 M bzw. S2 M und der Einfallsrichtung). Man lässt nun die Photonen nacheinander auf den Schirm https://doi.org/10.1515/9783110638738-005
Ein Experiment zur Unschärferelation | 45
•
treffen, so dass auf ihm allmählich die Interferenzfigur entsteht. Für jedes einzelne Photon ermittelt man, durch welchen Spalt es gegangen ist, indem man den Impuls misst, den es auf die Spaltplatte übertragen hat. Hiernach scheint man also die Inter ferenzerscheinungen auf dem Auffangschirm beobachten zu können und gleichzeitig in der Ebene der Platte P von jedem einzelnen Photon zu wissen, durch welchen Spalt es geflogen ist. Tatsächlich aber kann man mit dieser Anordnung keine Interferenzstreifen er zeugen. Der Fehler in dieser Überlegung besteht darin, dass man nur die Photonen als Quantenobjekte betrachtet und vergisst, dass die Quantenmechanik auch auf die (makroskopische) Platte P angewendet werden muss. Wenn man wissen will, durch welchen Spalt ein Photon gelangt ist, muss die vertikale Impulsunschärfe ∆p von P so gering sein, dass man die beiden Impulse p1 und p2 voneinander unterscheiden kann. Es muss also ∆p ≪ |p2 − p1 |
(3)
sein. Dann verlangt aber die Unschärferelation, dass die Lage von P nur mit einer Genauigkeit ∆x bekannt ist, die der Ungleichung ∆x ≥
h |p2 − p1 |
(4)
genügt. Ist a der Abstand der beiden Spalte und d die Entfernung zwischen der Plat te P und dem Schirm, und sind weiter die Winkel θ1 und θ2 sehr klein (also d/a ≫ 1), so erhält man, s. Abb. 1, x − a/2 d x + a/2 sin θ2 ≈ θ2 ≈ d
sin θ1 ≈ θ1 ≈
(5)
(x kennzeichnet die Lage des Auftreffpunktes M auf dem Schirm). Aus Gl. (1) und Gl. (2) ergibt sich damit |p2 − p1 | ≈
hν ha |θ2 − θ1 | ≈ c λd
(6)
worin λ = c/ν die Wellenlänge des Lichts bedeutet. Setzt man dies in (4) ein, so erhält man für die Ortsunschärfe ∆x die Ungleichung ∆x ≥ λd a
λd a
(7)
ist aber gerade der auf dem Schirm zu erwartende Streifenabstand. Wenn nun die Lagen der Spalte S1 und S2 mit einer Ungenauigkeit behaftet sind, die größer als der Streifenabstand der möglichen Interferenzfigur ist, so kann man keine derartige Figur auf dem Schirm erwarten.
•
46 | Ergänzung DI
Die Diskussion zeigt, dass man in schwerwiegende Widersprüche gerät, wenn man versucht, nur für das Licht und nicht auch für materielle Systeme eine Quanten theorie zu entwerfen. Weiter wird an diesem Beispiel deutlich: Könnte man die Plat te P wie ein klassisches System behandeln, so würde man für das Licht und damit für die Quantentheorie der Strahlung das Komplementaritätsprinzip verletzen. Übrigens geriete man umgekehrt in entsprechende Schwierigkeiten, wenn man nur eine Quan tentheorie der Materie entwickelte. Die quantenmechanischen Vorstellungen müssen auf alle physikalischen Systeme angewendet werden.
Referenzen und Literaturhinweise Bohm (5.1), Kap. 5 und 6; Messiah (1.17), Kap. IV, § III; Schiff (1.18), § 4; siehe auch Bohr (5.8) sowie Jammer (5.13), Kap. 4 und 5.
Ein zweidimensionales Wellenpaket |
47
•
Ergänzung EI Ein zweidimensionales Wellenpaket 1
Einführung | 47
2
Winkeldispersion und laterale Ausdehnung | 47
3
Physikalische Diskussion | 49
1 Einführung In § C-2 von Kap. I untersuchten wir die Form eines Wellenpakets, das man durch Über lagerung ebener Wellen erhielt, die alle in dieselbe Richtung laufen, Gl. (C-7). Ist dies die x-Richtung, so ist der resultierende Ausdruck von y und z unabhängig. Längs der x-Achse ist das Paket von endlicher Ausdehnung, in den dazu senkrechten Richtun gen dagegen unbeschränkt: In allen Punkten einer Ebene senkrecht zur x-Achse hat es denselben Wert. Wir wollen jetzt einen anderen einfachen Typ von Wellengruppen behandeln: Wir überlagern ebene Wellen, deren Wellenvektoren in einer Ebene liegen. Ihr Betrag sei (praktisch) derselbe, ihre Richtungen mögen sich jedoch etwas voneinander unter scheiden. Aufgrund der Winkeldispersion wird sich zeigen, dass die entstehende Wel lengruppe in den Richtungen senkrecht zum mittleren Wellenvektor beschränkt ist. Wir hatten beim eindimensionalen Wellenpaket gesehen (§ C-2 von Kap. I), dass sich die wesentlichen Züge dieses Modells, insbesondere die grundlegende Bezie hung (C-18), bereits ergeben, wenn man die Überlagerung von nur drei Teilwellen untersucht. Hier werden wir deshalb entsprechend vorgehen und die Ergebnisse dann wie in Kapitel I verallgemeinern, s. auch Ergänzung FI .
2 Winkeldispersion und laterale Ausdehnung Wir betrachten drei ebene Wellen mit den Wellenvektoren k1 , k2 und k3 wie in Abb. 1: Alle drei liegen in der x, y-Ebene, k1 weist in x-Richtung, die beiden anderen liegen zu k1 symmetrisch und bilden mit ihm einen kleinen Winkel ∆θ.
Abb. 1: Anordnung der Wellenvektoren k1 , k2 und k3 der drei ebenen Teilwellen eines zweidimensionalen Wellenpakets.
https://doi.org/10.1515/9783110638738-006
•
48 | Ergänzung EI
Für die x-Komponenten gilt dann k 1x ≈ k 2x = k 3x ≈ |k1 | = k
(1)
Die Beträge dieser drei Vektoren unterscheiden sich nur um Terme zweiter Ordnung in ∆θ, wir werden sie vernachlässigen. In y-Richtung ist k 1y = 0 ,
k 2y = −k 3y ≈ k∆θ
(2)
Wie in § C-2 von Kap. I sollen die Amplituden g(k) reell sein und den Beziehungen g(k2 ) = g(k3 ) =
1 g(k1 ) 2
(3)
genügen. Dieses extrem einfache Modell trägt bereits die Grundzüge eines allgemeinen (zweidimensionalen) Wellenpakets. Bei diesem stehen sämtliche Wellenvektoren senkrecht z. B. zur z-Richtung und ihre x-Komponenten sind gleich; es variiert also nur die y-Komponente; die Funktion |g(k)| zeigt bezüglich dieser einzigen Veränder lichen k y ein Verhalten, wie es in Abb. 2 skizziert ist, und ihre Breite ∆k y hängt mit der Winkeldispersion 2∆θ über die einfache Beziehung ∆k y = 2k∆θ
(4)
zusammen. Die Superposition der drei Teilwellen liefert dann 3
ψ(x, y) = ∑ g(k i )eiki ⋅r i=1
1 i(kx+k∆θ y) 1 i(kx−k∆θ y) e + e ] 2 2 = g(k1 )eikx [1 + cos(k∆θ y)]
= g(k1 ) [eikx +
(5)
Weil keine z-Abhängigkeit vorliegt, spricht man von einem zweidimensionalen Wel lenpaket.
Abb. 2: Die Auswahl von drei Werten für k y erlaubt bereits ein qualitatives Verständnis des allgemeineren Falls.
Ein zweidimensionales Wellenpaket | 49
•
Anhand der Abb. 3, in der für die drei Teilwellen die Phasenebenen angedeutet sind, kann man das Ergebnis verstehen. Die Funktion |ψ(x, y)| hat für y = 0 ein Ma ximum: Die drei Wellen interferieren auf der x-Achse konstruktiv. Entfernt man sich von dieser Achse, so nimmt |ψ(x, y)| ab (der Phasenunterschied zwischen den Kom ponenten nimmt zu) und wird für y = ± ∆y 2 gleich null, wobei ∆y durch cos (k∆θ
∆y ) = −1 2
(6)
gegeben ist, also durch k ∆θ ∆y = 2π
(7)
Die zu k2 und k3 gehörenden Wellen sind dann in Gegenphase zur Welle mit dem Wel lenvektor k1 . Unter Verwendung von Gl. (4) kann man diese Beziehung umschreiben und einen zu Gl. (C-11) von Kap. I analogen Zusammenhang erhalten: ∆y ⋅ ∆k y = 4π
(8)
Eine Winkeldispersion der Wellenvektoren begrenzt also die laterale Ausdehnung des Wellenpakets. Quantitativ nimmt diese Beschränkung die Form einer Unschärferela tion an [Gl. (7) und Gl. (8)].
Abb. 3: Ebenen gleicher Phase der drei Teil wellen mit Wellenvektoren nach Abb. 1. Sie sind für y = 0 in Phase und löschen sich für y = ±2π/∆k y aus.
3 Physikalische Diskussion Betrachten wir eine ebene Welle mit dem Wellenvektor k, die sich in x-Richtung aus breitet, so wird jeder Versuch, ihre Ausdehnung senkrecht zur Ausbreitungsrichtung zu begrenzen, zu einer Winkeldispersion führen, d. h. wir erhalten ein Wellenpaket von der Art, wie wir es eben untersucht haben.
•
50 | Ergänzung EI
Nehmen wir z. B. an, dass wir der ebenen Welle einen Schirm mit einem Spalt der Breite ∆y in den Weg stellen. Sie wird dann an diesem Spalt gebeugt werden (Abb. 4). Man weiß, dass für die Winkelbreite des Beugungsflecks die Beziehung 2∆θ ≈ 2
λ ∆y
(9)
besteht, wobei λ = 2π |k| die Einfallswellenlänge ist. Es ergibt sich wieder die obige Si tuation: Gl. (7) und Gl. (9) sind identisch.
Abb. 4: Wird die Spaltbreite ∆y verringert, so vergrößert sich durch die Beugung am Spalt die Unschärfe ∆k y .
Zusammenhang zwischen ein- und dreidimensionalen Problemen |
51
•
Ergänzung FI Zusammenhang zwischen ein- und dreidimensionalen Problemen 1 1-a 1-b 2
Dreidimensionales Wellenpaket | 51 Einfacher Fall | 51 Allgemeiner Fall | 52 Rechtfertigung des eindimensionalen Modells | 54
Der Raum, in dem sich ein klassisches oder ein Quantenteilchen bewegt, ist stets drei dimensional. Dies haben wir auch bei der Schrödinger-Gleichung (D-1) berücksichtigt, in der die Wellenfunktion von den drei Koordinaten x, y und z des Ortsvektors r ab hängt. Trotzdem haben wir wiederholt von einem eindimensionalen Modell Gebrauch gemacht, bei dem nur die eine Veränderliche x auftrat, ohne dies genauer zu rechtfer tigen. Diese Ergänzung verfolgt daher ein doppeltes Ziel: Zum einen (§ 1) verallgemei nern wir die Ergebnisse aus § C von Kap. I auf den dreidimensionalen Fall, zum ande ren (§ 2) zeigen wir, wie man in bestimmten Fällen die Wahl eines eindimensionalen Modells in Strenge rechtfertigen kann.
1 Dreidimensionales Wellenpaket 1-a Einfacher Fall Wir beginnen mit einem sehr einfachen Spezialfall, bei dem die beiden folgenden Vor aussetzungen erfüllt sind: – Das Wellenpaket ist frei [V(r) ≡ 0]; es kann also durch die Gl. (C-6) beschrieben werden: ψ(r, t) = –
1 ∫ g(k) ei[k⋅r−ω(k)t] d3 k (2π)3/2
(1)
für die Amplitudenfunktion g(k) gelte g(k) = g1 (k x ) g2 (k y ) g3 (k z )
(2)
Berücksichtigen wir ferner, dass ω(k) =
ℏ 2 ℏk2 = (k + k 2y + k 2z ) 2m 2m x
(3)
gilt, und setzen dies und Gl. (2) in Gl. (1) ein, so können wir die drei Integrationen über k x , k y und k z getrennt durchführen und erhalten ψ(r, t) = ψ1 (x, t) ψ2 (y, t) ψ3 (z, t) https://doi.org/10.1515/9783110638738-007
(4)
•
52 | Ergänzung FI
mit +∞
{ 1 { { { ψ (x, t) = ∫ g1 (k x ) ei[k x ⋅x−ω(k x )t] dk x { { 1 √2π −∞ { { { 2 { ℏk { { ω(k x ) = x 2m {
(5)
und zwei entsprechende Ausdrücke für ψ2 (y, t) und ψ3 (z, t). ψ1 (x, t) stellt gerade ein eindimensionales Wellenpaket dar. In diesem Spezialfall erhält man also ψ(r, t) einfach als das Produkt (4) aus drei eindimensionalen Paketen, die sich völlig unabhängig voneinander entwickeln.
1-b Allgemeiner Fall Ist V(r) ein beliebiges von null verschiedenes Potential, so gilt die Beziehung (1) nicht mehr. Es ist dann zweckmäßig, die dreidimensionale Fourier-Transformierte g(k, t) von ψ(r, t) einzuführen: ψ(r, t) =
1 ∫ g(k, t) eik⋅r d3 k (2π)3/2
(6)
Von vornherein kann g(k, t) durch das Potential V(r) in beliebiger Weise von t abhän gen. Darüber hinaus gibt es im Allgemeinen auch keinen Grund zu der Annahme, dass g(k, t) als ein Produkt wie in Gl. (2) geschrieben werden kann. Um die Ergebnisse aus § C-2 von Kap. I zu verallgemeinern, machen wir über die k-Abhängigkeit folgende Vor aussetzung: Zu einem bestimmten Zeitpunkt t habe |g(k, t)| in der Umgebung von k0 ein sehr ausgeprägtes Maximum, während es vernachlässigbar kleine Werte annimmt, sobald die Spitze des k-Vektors außerhalb eines um k0 zentrierten Quaders D k mit den Kantenlängen ∆k x , ∆k y und ∆k z liegt. Wie oben setzen wir g(k, t) = |g(k, t)|eiα(k,t)
(7)
so dass die Phase der zum Vektor k gehörenden Welle die Form ξ(k, r, t) = α(k, t) + k x x + k y y + k z z
(8)
hat. Wir können nun ähnlich wie in § C-2 von Kap. I vorgehen. Das Wellenpaket wird ein Maximum aufweisen, wenn die Wellen, für die die Spitze von k in D k liegt, prak tisch in Phase sind, d. h. wenn sich ξ in D k nur sehr wenig ändert. Entwickelt man ξ(k, r, t) um k0 nach Taylor, so ist ihre Änderung in erster Ordnung in δk = k − k0 : δξ(k, r, t) ≈ δk x [
∂ ∂ ξ(k, r, t)] + δk y [ ξ(k, r, t)] ∂k x ∂k y k=k0 k=k0
+ δk z [
∂ ξ(k, r, t)] ∂k z k=k0
(9)
Zusammenhang zwischen ein- und dreidimensionalen Problemen |
53
•
oder unter Verwendung des Gradientensymbols:¹ δξ(k, r, t) ≈ δk ⋅ [∇k ξ(k, r, t)]k=k0 ≈ δk ⋅ [r + [∇k α(k, t)]k=k0 ]
(10)
Wir sehen, dass die Änderungen von ξ(k, r, t) im Bereich D k minimal werden, wenn für r = rm (t) = −[∇k α(k, t)]k=k0
(11)
gilt. Wie wir bereits wissen, nimmt unter diesen Bedingungen |ψ(r, t)| ein Maximum an. Gleichung (11) bestimmt also die Lage des Schwerpunkts des Wellenpakets und ist die Verallgemeinerung von Gl. (C-15) aus Kap. I. Wir fragen nach dem um rm zentrierten Bereich D r mit den Abmessungen ∆x, ∆y und ∆z, in dem |ψ(r, t)| nennenswert von null verschiedene Werte annimmt. |ψ(r, t)| wird gegenüber |ψ(rm , t)| sehr klein werden, wenn sich die einzelnen Teilwellen durch Interferenz auslöschen, wenn also in D k die Änderungen von ξ(k, r, t) von der Größen ordnung 2π (bzw. von der Größe 1 Radiant) sind. Mit δr = r − rm lautet Gl. (10) δξ(k, r, t) ≈ δk ⋅ δr
(12)
Hieraus ergibt sich sofort der Zusammenhang zwischen den Bereichen D r und D k . Es muss, wenn wir δξ(k, r, t) ≥ 1 verlangen, ∆x ∆k x ≥ 1 ∆y ∆k y ≥ 1
(13)
∆z ∆k z ≥ 1 gelten. Aus der Beziehung p = ℏk folgen dann sofort die Heisenbergschen Unschärfe relationen ∆x ∆p x ≥ ℏ ∆y ∆p y ≥ ℏ
(14)
∆z ∆p z ≥ ℏ Sie sind die Verallgemeinerung von Gl. (C-23) aus Kapitel I. Wir erhalten schließlich die Gruppengeschwindigkeit VG des Wellenpakets, wenn wir Gl. (11) nach der Zeit t ableiten: VG = −
d [∇k α(k, t)]k=k0 dt
(15)
1 Nach Definition ist ∇f(x, y, z) der Vektor mit den Koordinaten ∂f/∂x, ∂f/∂y und ∂f/∂z. Durch den Index k kennzeichnen wir entsprechend die partiellen Ableitungen nach k x , k y und k z .
•
54 | Ergänzung FI
Bei einem freien Wellenpaket [für das aber nicht notwendig Gl. (2) gelten muss] hat man α(k, t) = α(k, 0) − ω(k)t ,
(16)
worin ω(k) durch Gl. (3) gegeben ist. In diesem Fall ist dann VG = [∇k ω(k)]k=k0 =
ℏk0 m
(17)
das ist die Verallgemeinerung von Gl. (C-31) aus Kapitel I.
2 Rechtfertigung des eindimensionalen Modells Wie wir in § D-1 von Kap. I sahen, kann man für den Fall eines zeitunabhängigen Po tentials in der Schrödinger-Gleichung die Zeitvariable von den Raumkoordinaten se parieren und damit zur Eigenwertgleichung (D-8) gelangen. Wir wollen jetzt zeigen, dass in bestimmten Fällen auch die Ortsvariablen x, y und z untereinander separiert werden können. Hierzu setzen wir voraus, dass man für das Potential V(r) = V(x, y, z) = V1 (x) + V2 (y) + V3 (z)
(18)
schreiben kann, und suchen nach Lösungen der Eigenwertgleichung in der Form φ(x, y, z) = φ1 (x) φ2 (y) φ3 (z)
(19)
Wie in § D-1 von Kap. I zeigt man, dass dies unter der Bedingung [−
ℏ2 d2 + V1 (x)] φ1 (x) = E1 φ1 (x) 2m dx2
(20)
und zwei entsprechenden Gleichungen möglich ist, in denen x durch y bzw. z, V1 durch V2 bzw. V3 und E1 durch E2 bzw. E3 ersetzt werden. Schließlich muss die Beziehung E = E1 + E2 + E3
(21)
gelten. Gleichung (20) ist der eindimensionale Fall von Gl. (D-8) aus Kap. I; die Varia blen x, y und z sind separiert.² Wenn z. B. die potentielle Energie eines Teilchens nur von x abhängt, so kann man sie in der Form (18) schreiben, indem man V1 = V und V2 = V3 = 0 setzt. Die dann 2 Falls V(r) von der Form (18) ist, so kann man zeigen (s. § F-4-a-β von Kap. II), dass alle Lösungen der Eigenwertgleichung (D-8) als Linearkombinationen der hier gefundenen Lösungen geschrieben werden können.
Zusammenhang zwischen ein- und dreidimensionalen Problemen |
55
•
entstehenden Gleichungen in den Veränderlichen y und z haben wir bereits in § C-1 von Kap. I in Zusammenhang mit dem Fall des (eindimensionalen) freien Teilchens untersucht: Ihre allgemeinen Lösungen sind die ebenen Wellen eik y y und eik z z . Es ver bleibt demnach die Aufgabe, Gl. (20) zu lösen. Das ist aber ein eindimensionales Pro blem. Jedenfalls ist unter dieser Voraussetzung die Gesamtenergie des Teilchens (im Dreidimensionalen) E = E1 +
ℏ2 [k 2 + k 2z ] 2m y
(22)
Die von uns weiter oben behandelten eindimensionalen Modelle entsprechen also ei nem Teilchen, das sich im dreidimensionalen Raum in einem Potential bewegt, das nur von der einen Koordinate x abhängt. Die Lösungen φ2 (y) und φ3 (z) sind dann sehr einfach und beschreiben Teilchen, die „entlang der y-Achse“ bzw. der z-Achse frei sind. Dies ist die Begründung dafür, dass wir unsere Untersuchung auf die (eindi mensionale) Gleichung in der Veränderlichen x konzentriert haben.
•
56 | Ergänzung GI
Ergänzung GI Eindimensionales Gaußsches Wellenpaket 1 2 3 3-a 3-b 3-c
Definition eines Gaußschen Wellenpakets | 56 Orts- und Impulsbreite. Unschärfebeziehung | 58 Entwicklung des Wellenpakets | 58 Berechnung von ψ(x, t) | 58 Verschiebungsgeschwindigkeit des Wellenpakets | 59 Zerfließen des Wellenpakets | 60
In diesem Abschnitt wollen wir den Fall einer Wellengruppe aus freien (eindimensio nalen) Wellen behandeln, bei der die Funktion g(k) eine Gauß-Verteilung beschreibt. Dieses Beispiel ist deshalb von Interesse, weil bei ihm die Rechnungen in Strenge ausgeführt und damit unsere Aussagen in § C von Kap. I über die Eigenschaften von Wellenpaketen wenigstens für diesen Spezialfall bewiesen werden können. An ihm lässt sich ferner das besondere zeitliche Verhalten eines Wellenpakets, nämlich das Phänomen der Verbreiterung oder des Zerfließens untersuchen.
1 Definition eines Gaußschen Wellenpakets In einem eindimensionalen Modell betrachten wir ein freies Teilchen [V(x) = 0], des sen Zustand zur Zeit t = 0 durch die Wellenfunktion +∞
2 √a − a4 (k−k0 )2 ikx e e dk ψ(x, 0) = ∫ (2π)3/4
(1)
−∞
beschrieben wird. Man erhält diese Wellengruppe durch Superposition von ebenen Wellen eikx mit den Koeffizienten 2 √a 1 − a4 (k−k0 )2 e g(k, 0) = √2π (2π)3/4
(2)
die zu einer um k = k 0 zentrierten, auf eins normierten Gauß-Verteilung gehören. Man nennt eine derartige Wellengruppe daher ein Gaußsches Wellenpaket. Im Folgenden werden wir wiederholt von Integralen des Typs +∞
I(α, β) = ∫ e−α
2
(ξ+β)2
dξ
(3)
−∞
Gebrauch machen, wobei α und β komplexe Zahlen sind [damit dieses Integral kon vergiert, muss Re(α2 ) > 0 sein]. Mit der Residuenmethode zeigt man, dass es von β
https://doi.org/10.1515/9783110638738-008
Eindimensionales Gaußsches Wellenpaket |
57
•
nicht abhängt. Es gilt also I(α, β) = I(α, 0)
(4)
Ferner ist für −π/4 < Arg(α) < +π/4 [was für Re(α 2 ) > 0 stets möglich ist] I(α, 0) =
1 I(1, 0) α
(5)
Man muss also nur I(1, 0) berechnen, was üblicherweise über ein Doppelintegral in der x, y-Ebene und Einführung von Polarkoordinaten geschieht. Man erhält +∞
I(1, 0) = ∫ e−ξ dξ = √π 2
(6)
−∞
und damit +∞
∫ e−α
2
(ξ+β)2
dξ =
−∞
√π α
(7)
mit −π/4 < Arg(α) < +π/4. Wir berechnen jetzt ψ(x, 0). Hierzu ordnen wir den Exponenten in Gl. (1) um und schreiben −
a2 a2 2ix 2 x2 (k − k 0 )2 + ikx = − [k − k 0 − 2 ] + ik 0 x − 2 4 4 a a
(8)
Unter Verwendung von Gl. (7) ergibt dies ψ(x, 0) = (
2 1/4 ik0 x −x2 /a2 ) e e πa2
(9)
Die Fourier-Transformierte einer Gauß-Verteilung ist wieder eine Gauß-Verteilung (s. Anhang I). Zur Zeit t = 0 ist daher die Wahrscheinlichkeitsdichte für den Ort des Teilchens |ψ(x, 0)|2 = √
2 −2x2 /a2 e πa2
(10)
Der Verlauf entspricht der klassischen Glockenkurve. Das Zentrum des Wellenpa kets [das Maximum von |ψ(x, 0)|2 ] liegt bei x = 0. Dies würde man nach der allgemei nen Beziehung (C-16) auch erwarten, da in unserem Fall g(k) reell ist.
•
58 | Ergänzung GI
2 Orts- und Impulsbreite. Unschärfebeziehung Bei der Behandlung einer Gauß-Verteilung f(x) = e−x ßig, ihre Breite ∆x =
2
/b 2
erweist es sich als zweckmä
b √2
(11)
zu definieren. Ändert sich x von 0 auf ±∆x, so verringert sich f(x) auf den √e-ten Teil. Diese Festlegung ist natürlich willkürlich, hat aber den Vorteil, mit der Standardab weichung der Veränderlichen x übereinzustimmen (s. § C-5 von Kap. III). Die Breite ∆x der Wellengruppe Gl. (10) ist danach ∆x =
a 2
(12)
Weil |g(k, 0)|2 ebenfalls eine Gauß-Verteilung darstellt, kann man auf die gleiche Weise ∆k bestimmen. Es ergibt sich ∆k =
1 a
(13a)
und weiter für die Impulsbreite ∆p =
ℏ a
(13b)
Wir erhalten somit den Zusammenhang ∆x ∆p =
ℏ 2
(14)
ein Ergebnis, das mit der Heisenbergschen Unschärferelation verträglich ist.
3 Entwicklung des Wellenpakets 3-a Berechnung von ψ(x, t) Zur Berechnung der Wellenfunktion zum Zeitpunkt t genügt es, von der Bezie hung (C-6) für die Wellenfunktion eines freien Teilchens auszugehen. Wir erhalten +∞
2 √a − a4 (k−k0 )2 i(kx−ω(k)t) ∫ e e dk ψ(x, t) = (2π)3/4
(15)
−∞
mit ω(k) = ℏk 2m (dem Dispersionsgesetz für ein freies Teilchen). Wir werden sehen, dass die Wellengruppe auch zur Zeit t eine Gauß-Verteilung beschreibt. Wie oben kann 2
Eindimensionales Gaußsches Wellenpaket | 59
•
man nämlich den Exponenten umgruppieren, so dass die von k abhängenden Terme zu einem vollständigen Quadrat zusammengefasst sind, und dann die Beziehung (7) verwenden. Es wird damit
ψ(x, t) = (
1/4
2 ) πa2
eiφ 1/4
4ℏ2 t2 (a + ) m2 4
ℏk 0 2 } { { (x − t) } } { } { m eik0 x exp {− } 2iℏt } { } { } { a2 + m } {
(16a)
worin φ reell und von x unabhängig ist: φ = −θ −
ℏk 20 t 2m
mit
tan 2θ =
2ℏt ma2
(16b)
Für die Wahrscheinlichkeitsdichte erhalten wir damit
|ψ(x, t)|2 = √
2 πa2
1 2 2 √1 + 4ℏ t m 2 a4
ℏk 0 2 } { { 2a2 (x − t) } } { } { m exp {− } 2 2 } { 4ℏ t } { } { a4 + 2 m } {
(17)
+∞
Wenn wir jetzt zeigen wollen, dass das Normquadrat ∫−∞ |ψ(x, t)|2 dx nicht von der Zeit abhängt, so könnten wir bei der Integration von Gl. (17) wieder die Bezie hung (7) verwenden. Rascher gelangen wir aber zu dieser Aussage, wenn wir über Gl. (15) feststellen, dass für die Fourier-Transformierte von ψ(x, t) der Zusammenhang g(k, t) = e−iω(k)t g(k, 0)
(18)
besteht. Sie hat also dieselbe Norm wie g(k, 0). Nun hat weiter aufgrund der Parse valschen Gleichung ψ(x, t) dieselbe Norm wie g(k, t) und ψ(x, 0) dieselbe wie g(k, 0). Hieraus schließt man, dass die Normen von ψ(x, t) und von ψ(x, 0) gleich sind.
3-b Verschiebungsgeschwindigkeit des Wellenpakets Nach Gl. (17) stellt die Wahrscheinlichkeitsdichte |ψ(x, t)|2 eine um x = V0 t zentrierte Gauß-Verteilung dar, wobei die Geschwindigkeit V0 durch V0 =
ℏk 0 m
(19)
gegeben ist. Wir gelangen also zu demselben Ergebnis wie beim allgemeinen Aus druck (C-32) aus Kap. I, der die Gruppengeschwindigkeit lieferte.
•
60 | Ergänzung GI
3-c Zerfließen des Wellenpakets Wir kehren zur Gl. (17) zurück. Aufgrund der Definition (11) hat das Paket zur Zeit t die Breite ∆x(t) =
a√ 4ℏ2 t2 1+ 2 4 2 m a
(20)
Wir erkennen (s. Abb. 1), dass sich das Paket nicht nur als Ganzes mit der Ge schwindigkeit V0 verschiebt, sondern auch noch seine Form ändert. Wächst t von −∞ bis 0, so nimmt die Breite des Pakets ab und erreicht für t = 0 ihr Minimum. Danach wird sie ständig größer: Das Wellenpaket zerfließt.
Abb. 1: Für negative Zeiten verschiebt sich das Gaußsche Wellenpaket mit abnehmender Breite nach rechts und wird für t = 0 „minimal“: Das Produkt ∆x ⋅ ∆p hat den Wert ℏ/2. Danach verbreitert sich das Paket bei seiner Bewegung wieder.
Wie wir in Gl. (17) feststellen können, ändert sich auch die Höhe des Pakets. Mit wach sender Breite nimmt sie in der Weise ab, dass die Norm von ψ(x, t) konstant bleibt. Die Funktion g(k, t) zeigt dagegen ganz andere Eigenschaften. Für sie gilt nämlich nach Gl. (18) |g(k, t)| = |g(k, 0)|
(21)
Der mittlere Impuls ℏk 0 und seine Streuung ℏ∆k ändern sich also im zeitlichen Ver lauf nicht. In Kapitel III werden wir sehen, dass dies von der Tatsache herrührt, dass der Impuls eines freien Teilchens eine Erhaltungsgröße ist. Ein freies Teilchen trifft bei seiner Bewegung auf kein Hindernis; deshalb ist physikalisch klar, dass seine Im pulsverteilung zeitlich konstant bleiben muss. Die Existenz einer Impulsstreuung ∆p = ℏ∆k = ℏ/a bedeutet, dass die Geschwin ℏ digkeit des Teilchens nur bis auf ∆v = ∆p m = ma bekannt ist. Stellen wir uns ein Ensem ble von klassischen Teilchen vor, die zur Zeit t = 0 von der Stelle x = 0 mit einer Ge schwindigkeitsstreuung ∆v ausgehen. Zur Zeit t ist dann die Streuung der Lage dieser Teilchen δxkl = ∆v|t| = ℏ|t| ma . Sie wächst also mit t linear, s. Abb. 2, in der die durchge zogene Hyperbel das Bild von ∆x(t) [Gl. (20)] darstellt. Für große t unterscheidet sich
Eindimensionales Gaußsches Wellenpaket | 61
•
∆x(t) praktisch nicht von δxkl . In diesem Fall kann man daher von einer quasiklas sischen Interpretation der Breite ∆x sprechen. Geht dagegen t gegen null, so unter scheiden sich ∆x(t) und δxkl immer mehr. Für das Quantenteilchen muss nämlich die Unschärferelation ∆x ⋅ ∆p ≥ ℏ/2 erfüllt sein. Weil aber ∆p fest ist, kann ∆x eine untere Grenze nicht unterschreiten.
Abb. 2: Zeitliche Änderung der Breite ∆x des Wellenpakets aus Abb. 1. Für große t geht ∆x asympto tisch gegen die Streuung δxkl der Orte eines Ensembles klassischer Teilchen, die sich zum Zeitpunkt t = 0 alle an der Stelle x = 0 mit einer Geschwindigkeitsstreuung ∆p/m befinden.
Bemerkungen: 1. Das Zerfließen eines Wellenpakets aus freien Wellen ist ein allgemeines Phänomen. Man kann zeigen (s. Aufgabe 4 in Ergänzung LIII ), dass die Breite eines beliebigen freien Wellenpakets sich zeitlich so verhält, wie es in Abb. 2 veranschaulicht ist. 2. In § C-2 von Kap. I erhielten wir durch eine einfache Überlegung die Beziehung ∆x ⋅ ∆k ≈ 1 [Gl. (C-17)], wobei wir lediglich voraussetzten, dass g(k) ein Maximum mit der Breite ∆k (so wie in Abb. 3 von Kap. I) aufweist. Dies ist auch in diesem Abschnitt der Fall. Wie ist es dann möglich, dass dieses Produkt sehr viel größer als eins werden kann? Bei einem Gaußschen Wellenpaket stellen wir dies für große t ja fest. Der Widerspruch ist selbstverständlich nur scheinbar. Bei der Herleitung der Beziehung ∆x ⋅ ∆k ≈ 1 hatten wir angenommen, dass das Argument α(k) der komplexwertigen Funktion g(k) im Inter vall ∆k näherungsweise linear von k abhängig ist, haben also mit anderen Worten in der Phase von g(k) Terme höherer Ordnung vernachlässigt. Für den Term zweiter Ordnung in (k − k0 ) muss dann z. B. gelten ∆k2 [
d2 α ] ≪ 2π dk2 k=k0
(22)
Ist diese Näherung nun nicht mehr erlaubt, so führt die entsprechende Überlegung zu der Aus sage, dass das Wellenpaket sehr viel breiter ist, als es die Beziehung (C-17) angibt. 2 Für das von uns hier untersuchte Gaußsche Wellenpaket ist ∆k ≈ 1a und α(k) = − ℏk 2m t. Die Bedin 1 2 ℏt gung (22) lautet dann ( a ) m ≪ 2π. Mit Hilfe von Gl. (20) kann gezeigt werden, dass unter dieser Annahme ∆x ⋅ ∆k ≈ 1 ist.
•
62 | Ergänzung HI
Ergänzung HI Stationäre Zustände eines Teilchens in einem eindimensionalen Rechteckpotential 1 1-a 1-b 1-c 2 2-a 2-b 2-c
Allgemeine Eigenschaften | 62 Bereiche mit konstantem Potential | 62 Unstetigkeitsstelle des Potentials | 63 Rechenmethode | 64 Einfache Beispiele | 64 Potentialstufe | 64 Potentialwall | 67 Potentialtopf und gebundene Zustände | 70
In § D-2 von Kap. I untersuchten wir die Bewegung eines Teilchens in einem Recht eckpotential und stellten fest, dass die plötzlichen Änderungen des Potentials für be stimmte x zu rein quantenmechanischen Effekten führten. Das Verhalten der Wellen funktionen für die stationären Zustände des Teilchens ergab sich dabei durch eine Analogieüberlegung zur Optik, mit der wir das Auftreten dieser neuen Phänomene auf einfache Weise verstehen konnten. In dieser Ergänzung behandeln wir das Prinzip zur quantitativen Berechnung der stationären Teilchenzustände, geben die Ergebnisse für einige einfache Beispiele an und diskutieren ihren physikalischen Inhalt. Dabei beschränken wir uns auf den ein dimensionalen Fall (s. Ergänzung FI ).
1 Allgemeine Eigenschaften 1-a Bereiche mit konstantem Potential Bei einem Rechteckpotential ist die Funktion V(x) in bestimmten Raumbereichen kon stant: V(x) = V. In einem derartigen Intervall genügt dann die Wellenfunktion φ(x) der Differentialgleichung d2 2m φ(x) + 2 (E − V)φ(x) = 0 dx2 ℏ
(1)
Wir haben verschiedene Fälle zu unterscheiden: Fall 1: E > V Durch ℏ2 k 2 2m führen wir die positive Konstante k ein und erhalten E−V =
(2)
φ(x) = Aeikx + A e−ikx
(3)
https://doi.org/10.1515/9783110638738-009
Stationäre Zustände eines Teilchens |
63
•
als allgemeine Lösung von Gl. (1), wobei A und A disponible komplexe Konstan ten sind. Fall 2: E < V Diese Bedingung gehört zu Raumbereichen, die nach den Gesetzen der klassischen Mechanik verboten wären. Definieren wir jetzt mit ℏ2 ρ 2 2m eine positive Konstante ρ, so lautet die allgemeine Lösung V−E =
(4)
φ(x) = Beρx + B e−ρx
(5)
B und B sind darin beliebige komplexe Konstanten. Fall 3: E = V In diesem Sonderfall hängt φ(x) linear von x ab.
1-b Unstetigkeitsstelle des Potentials Wie verhält sich die Wellenfunktion in einem Punkt x = x1 , in dem das Potential V(x) eine Unstetigkeit aufweist? Man könnte zunächst vermuten, dass sich die Wellenfunk tion φ(x) in diesem Punkt singulär verhält und dort z. B. ebenfalls unstetig ist. Wir zeigen jedoch, dass dies nicht der Fall ist: φ(x) und dφ(x)/ dx sind stetig, und nur die zweite Ableitung d2 φ(x)/ d x2 ist an der Stelle x = x1 unstetig. Diese Tatsache kann man sich auch ohne strengen Beweis verständlich machen. Hierzu erinnern wir uns daran, dass man das Rechteckpotential als den Grenzwert eines Potentials V ε (x) auffassen darf, das außerhalb des Intervalls [x1 − ε, x1 + ε] mit V(x) übereinstimmt, sich im Innern dagegen stetig ändert. Wir betrachten dann die Gleichung d2 2m φ ε (x) + 2 [E − V ε (x)]φ ε (x) = 0 (6) 2 dx ℏ wobei V ε (x) im Intervall [x1 − ε, x1 + ε] für jedes ε beschränkt sein soll. Nehmen wir eine Lösung φ ε (x), die für x < x1 − ε mit einer Lösung von Gl. (1) übereinstimmt, so muss gezeigt werden, dass für den Grenzübergang ε → 0 die Funktion φ ε (x) gegen eine Funktion φ(x) strebt, die mitsamt ihrer ersten Ableitung an der Stelle x = x1 ste tig ist. Wir nehmen an, dass φ ε (x) in der Umgebung von x = x1 für jedes ε beschränkt bleibt (was man zeigen könnte, indem man von den Eigenschaften der Differential gleichung (1) ausgeht); physikalisch bedeutet diese Annahme, dass die Wahrschein lichkeitsdichte endlich bleibt. Integrieren wir dann Gl. (6) zwischen x1 − η und x1 + η, so erhalten wir x 1 +η
dφ ε dφ ε 2m (x1 + η) − (x1 − η) = 2 ∫ [V ε (x) − E]φ ε (x) d x dx dx ℏ x 1 −η
(7)
•
64 | Ergänzung HI
Da nach Voraussetzung der Integrand auf der rechten Seite der Gleichung für ε → 0 beschränkt bleibt, geht das Integral für η → 0 gegen 0: η→0 dφ dφ (x1 + η) − (x1 − η) → 0 dx dx
(8)
Im Grenzfall ist also dφ/ dx an der Stelle x = x1 stetig und damit auch φ(x) als Stamm funktion einer stetigen Funktion. Dagegen ist d2 φ/ dx2 unstetig und erfährt, wie man φ(x1 )σ V , an Gl. (6) unmittelbar erkennen kann, in x = x1 einen Sprung der Größe 2m ℏ2 wenn σ V der Sprung von V(x) an der Stelle x = x1 ist. Bemerkung: In unserer Begründung ist die Voraussetzung, dass V ε (x) beschränkt ist, wesentlich. Bei eini gen Aufgaben in Ergänzung KI ist das Potential V(x) von der Form αδ(x), wobei δ(x) die Dirac sche Delta-Funktion darstellt. In diesem Fall bleibt φ(x) stetig, nicht dagegen ihre erste Ableitung dφ/ dx.
1-c Rechenmethode Zur Bestimmung der stationären Zustände bei einem Rechteckpotential geht man also wie folgt vor: In den Bereichen, in denen V(x) konstant ist, schreibt man φ(x) in der Form (3) bzw. (5), und „passt dann diese Funktionen an“, indem man fordert, dass φ(x) und dφ(x)/ dx an den Unstetigkeitsstellen von V(x) stetig sind.
2 Einfache Beispiele Wir ermitteln jetzt quantitativ die stationären Zustände bei den Formen des Potentials V(x), die wir in § D-2-c von Kap. I aufgeführt haben. Wir werden dabei sehen, dass die Lösungen gerade den Verlauf zeigen, wie wir ihn aufgrund der optischen Analogie behauptet haben.
2-a Potentialstufe
Abb. 1: Potentialstufe
Stationäre Zustände eines Teilchens |
65
•
α Fall 1: E > V0 (partielle Reflexion) Wir setzen √ 2mE = k 1 ℏ2 √ 2m(E − V0 ) = k 2 ℏ2
(9)
(10)
Dann lauten die Lösungen in den Bereichen I bzw. II φI (x) = A1 eik1 x + A1 e−ik1 x
(11)
φII (x) = A2 eik2 x + A2 e−ik2 x
(12)
Weil Gl. (1) eine homogene Differentialgleichung ist, können wir mit unserer Me thode die drei Verhältnisse A1 /A1 , A2 /A1 und A2 /A1 nicht bestimmen, denn an der Stelle x = 0 haben wir nur zwei (Stetigkeits-)Bedingungen. Wir setzen darum A2 = 0. Wir beschränken uns somit auf den Fall eines Teilchens, das aus dem negativen Un endlichen kommend auf die Potentialstufe trifft. Dann ist A1 k 1 − k 2 = A1 k1 + k2
(13)
A2 2k 1 = A1 k1 + k2
(14)
φI (x) stellt die Superposition einer sich nach rechts ausbreitenden einlaufenden Welle mit der Amplitude A1 und dem Impuls ℏk 1 und einer reflektierten Welle mit der Amplitude A1 und dem Impuls −ℏk 1 dar. Wegen A2 = 0 besteht φII (x) nur aus einer zu einem transmittierten Teilchen gehörenden Welle. In Kapitel III, § D-1-c-β werden wir sehen, wie man mit Hilfe des Begriffs des Wahrscheinlichkeitsstromes den Transmis sionskoeffizienten T und den Reflexionskoeffizienten R für die Potentialstufe einfüh ren kann (s. auch Ergänzung BIII , § 2). Sie liefern die Wahrscheinlichkeit dafür, dass ein aus dem negativen Unendlichen kommendes Teilchen die Stufe bei x = 0 passiert bzw. an dieser Stufe reflektiert wird. Dabei werden wir finden, dass A 2 R = 1 A1
(15)
und T=
k2 k1
A 2 2 A1
(16)
sind (die physikalische Erklärung für das Auftreten des Faktors k 2 /k 1 beim Transmis sionskoeffizienten geben wir in Ergänzung JI ). Berücksichtigen wir Gl. (13) und (14),
•
66 | Ergänzung HI
so erhalten wir weiter R = 1− T=
4k 1 k 2 (k 1 + k 2 )2
4k 1 k 2 (k 1 + k 2 )2
(17) (18)
Wir erkennen sofort, dass T + R = 1 ist: Das Teilchen wird mit Sicherheit transmittiert oder reflektiert. Entgegen der Vorhersage der klassischen Mechanik gibt es für das Teilchen eine von null verschiedene Wahrscheinlichkeit, dass es an der Stufe wie der umkehrt. Dies hatten wir früher in Analogie zur Optik damit erklärt, dass eine Lichtwelle an einer brechenden Fläche mit n1 > n2 ebenfalls reflektiert wird. Dabei weiß man, dass dies ohne Phasenverzögerung geschieht; die Verhältnisse A1 /A1 und A2 /A1 sind nach Gl. (13) bzw. Gl. (14) reell. So erfährt auch das Quantenteilchen bei der Reflexion und Transmission keine Verzögerung (s. Ergänzung JI , § 2). Schließlich folgt aus den Gleichungen (9), (10) und (18) sofort, dass für E ≫ V0 der Transmissi onskoeffizient T ungefähr gleich eins ist: Ist die Höhe der Potentialstufe gegenüber der Energie des Teilchens vernachlässigbar, so passiert es diese Stufe, wie wenn sie nicht vorhanden wäre. β Fall 2: E < V0 (Totalreflexion) Man ersetzt jetzt die Gleichungen (10) und (12) durch ρ2 = √
2m(V0 − E) ℏ2
φII (x) = B2 eρ2 x + B2 e−ρ2 x
(19) (20)
Hier muss B2 = 0
(21)
sein, damit die Lösung für x → +∞ beschränkt bleibt. Die Grenzbedingungen an der Stelle x = 0 ergeben jetzt A1 k 1 − iρ 2 = A1 k 1 + iρ 2
(22)
B2 2k 1 = A1 k 1 + iρ 2
(23)
Damit gilt für den Reflexionskoeffizienten A 2 2 k 1 − iρ 2 R = 1 = =1 k 1 + iρ 2 A1
(24)
Stationäre Zustände eines Teilchens | 67
•
Wie in der klassischen Mechanik wird das Teilchen also immer reflektiert (Totalrefle xion). Trotzdem besteht ein wesentlicher Unterschied, auf den wir schon früher hin gewiesen haben: Wegen des Auftretens der räumlich gedämpften Welle e−ρ2 x hat das Teilchen eine von null verschiedene Wahrscheinlichkeit dafür, dass es in den klas sisch verbotenen Bereich eindringt. Sie nimmt mit x exponentiell ab und ist für Werte von x, die größer als die „Reichweite“ 1/ρ 2 der gedämpften Welle sind, vernachläs sigbar klein. Wir bemerken weiter, dass das Verhältnis A1 /A1 komplex ist: Bei der Re flexion tritt demnach eine bestimmte Phasenverschiebung auf, die physikalisch dazu führt, dass das Teilchen im Bereich x > 0 mit einer gewissen Verzögerung eintritt (s. Ergänzung JI , § 1 und Ergänzung BIII , § 3). Eine derartige Verschiebung der Phase hat in der Optik ihre Entsprechung bei der Reflexion des Lichts an einem metallischen Medium; in der klassischen Mechanik gibt es hierfür aber keine Analogie. Bemerkung: Mit V0 → +∞ geht auch ρ2 → +∞ und damit A 1 → −A 1
und
B2 → 0
(25)
Im Bereich x > 0 strebt die Welle gegen null, weil ihre Reichweite beliebig klein wird. Wegen A 1 + A 1 → 0 verschwindet φ(x) an der Grenze x = 0, bleibt also in diesem Punkt stetig. Dagegen erfährt ihre Ableitung einen Sprung von 2ikA 1 auf den Wert null. Jetzt ist nämlich der Potential sprung an dieser Stelle unendlich groß, und das Integral in Gl. (7) geht für η → 0 nicht mehr gegen null.
2-b Potentialwall α Fall 1: E > V0 (Resonanzen) V0 kann positiv sein wie bei einem Potentialwall in Abb. 2, aber auch negativ; man spricht dann von einem Potentialtopf. Mit den Abkürzungen (9) und (10) findet man in den drei Bereichen I (x < 0), II (0 < x < l) und III (x > l) φI (x) = A1 eik1 x + A1 e−ik1 x
(26a)
A2 e−ik2 x A3 e−ik1 x
(26b)
ik2 x
+
ik1 x
+
φII (x) = A2 e φIII (x) = A3 e
(26c)
Wie oben nehmen wir an, dass A3 = 0 ist (das einfallende Teilchen kommt aus dem negativen Unendlichen). Die Grenzbedingungen an der Stelle x = l liefern dann A2 und A2 in Abhängigkeit von A3 , die an der Stelle x = 0 die Koeffizienten A1 und A1 in Abhängigkeit von A2 und A2 und folglich von A3 . Wir erhalten so A1 = [cos k 2 l − i A1
k 21 + k 22 sin k 2 l] eik1 l A3 2k 1 k 2
k 2 − k 21 =i 2 sin k 2 l eik1 l A3 2k 1 k 2
(27)
•
68 | Ergänzung HI
Abb. 2: Rechteckiger Potentialwall
Über A1 /A1 und A3 /A1 gelangen wir zum Reflexionskoeffizienten R und Transmissi onskoeffizienten T für den Potentialwall A 2 (k 21 − k 22 )2 sin2 k 2 l R = 1 = A1 4k 21 k 22 + (k 21 − k 22 )2 sin2 k 2 l
(28a)
A 2 4k 21 k 22 3 T = = A1 4k 21 k 22 + (k 21 − k 22 )2 sin2 k 2 l
(28b)
Man erkennt leicht, dass R + T = 1 ist. Mit den Abkürzungen (9) und (10) erhalten wir für den Transmissionskoeffizienten T=
4E(E − V0 ) 4E(E − V0 ) + V02 sin2 [√2m(E − V0 )l/ℏ]
(29)
In Abb. 3 ist T in Abhängigkeit von l (bei festem E und V0 ) aufgetragen: Der Transmissionskoeffizient verändert sich periodisch zwischen seinem kleinsten Wert V 02 [1 + 4E(E−V ]−1 und dem Maximum 1. 0) Den gleichen Zusammenhang finden wir in der Optik bei der Transmission an ei nem Fabry-Pérot-Interferometer. Auch dort treten die Resonanzen (für T = 1, also für k 2 l = nπ) auf, wenn l gleich einem halbzahligen Vielfachen der Wellenlänge des Teil chens im Bereich II ist. Ist E > V0 , so geschieht die Reflexion des Teilchens an den
Abb. 3: Verhalten des Transmissionskoeffizienten T für einen Potentialwall in Abhängigkeit von der Breite l des Walls (die Wallhöhe V 0 und die Teilchenenergie E bleiben fest). Resonanzen treten immer dann auf, wenn l gleich einem halbzahligen Vielfachen der Wellenlänge 2π/k2 im Bereich II ist.
Stationäre Zustände eines Teilchens |
69
•
Unstetigkeiten des Potentials ohne Veränderung der Phase der Wellenfunktion. Aus diesem Grund entspricht die Resonanzbedingung k 2 l = nπ Werten von l, für die sich im Bereich II stehende Wellen bilden können. Dagegen löschen sich fern von den Re sonanzstellen die einzelnen in x = 0 und x = l reflektierten Wellen durch Interferenz gegenseitig aus, so dass die Wellenfunktion nur wenig von null verschieden ist. Eine Untersuchung der Ausbreitung eines Wellenpakets (wie in Ergänzung JI ) würde zei gen, dass sich bei Erfüllung der Resonanzbedingung das Wellenpaket verhältnismä ßig lange im Bereich II aufhält. Dieses Phänomen nennt man in der Quantenmechanik Streuresonanz. β Fall 2: E < V0 (Tunneleffekt) Hier müssen wir Gl. (26b) durch Gl. (20) ersetzen, während ρ 2 weiterhin durch Gl. (19) gegeben ist. Über die Grenzbedingungen an den Stellen x = 0 und x = l könnten wir den Transmissionskoeffizienten für den Potentialwall berechnen. Es genügt aber, in den Beziehungen für den Fall 1 k 2 durch −iρ 2 zu ersetzen. Wir erhalten dann A 2 4E(V0 − E) 3 (30) T = = A1 4E(V0 − E) + V02 sinh2 [√2m(V0 − E) l/ℏ] wobei natürlich wieder R = 1 − T ist. Gilt ρ 2 l ≫ 1 so wird T≈
16E(V0 − E) −2ρ2 l e V02
(31)
Im Gegensatz zu den klassischen Vorhersagen gibt es für das Teilchen eine von null verschiedene Wahrscheinlichkeit, dass es den Potentialwall durchdringen kann: Im Bereich III verschwindet die Wellenfunktion nicht, vielmehr verhält sie sich wie eine „gedämpfte Welle“ mit der Reichweite 1/ρ 2 . Für l ≤ 1/ρ 2 vermag sie mit nennenswer ter Wahrscheinlichkeit den Wall zu durchqueren. Das ist der Tunneleffekt. Er hat in der Physik viele Anwendungen, so bei der Inversion des Ammoniakmoleküls (s. Ergän zung GIV ), der Tunneldiode, dem Josephson-Effekt, dem α-Zerfall der Atomkerne usw. Für ein Elektron beträgt die Reichweite der gedämpften Welle (
1 1.96 10−10 m )≈ ρ2 √ V0 − E
(32)
Darin sind E und V0 in Elektronvolt anzugeben (Man erhält diese Formel, indem man in Gl. (8) die Wellenlänge λ = 2π/k durch 2π/ρ2 ersetzt). Trifft daher ein Elektron mit der Energie 1 eV auf einen Potentialwall mit der Höhe V0 = 2 eV und der Breite l = 10−10 m, so ist die Reichweite 1.96 × 10−10 m, also von der gleichen Größenord nung wie l: Das Elektron kann den Wall mit einer beträchtlichen Wahrscheinlichkeit durchtunneln. Tatsächlich hat der Transmissionskoeffizient in diesem Fall den Wert T ≈ 0.78
(33)
Quantenmechanisch kann demnach das Elektron in 8 von 10 Fällen den Wall durch queren.
•
70 | Ergänzung HI
Nehmen wir jetzt an, dass es sich bei dem einfallenden Teilchen um ein Proton handelt (seine Masse ist ungefähr 1840 mal größer als die des Elektrons), so ist seine Reichweite 1 1.96 4.6 ( )≈ 10−10 m ≈ 10−12 m (34) ρ2 √1840(V0 − E) √V0 − E Besitzen E, V0 und l dieselben Werte wie eben, so haben wir den Fall, bei dem die Reichweite 1/ρ 2 sehr viel kleiner als die Breite des Walles ist; Gl. (31) liefert dabei den Wert T ≈ 4 × 10−19
(35)
Die Wahrscheinlichkeit, dass das Proton den Wall durchtunnelt, ist daher unter diesen Bedingungen vernachlässigbar klein.
2-c Potentialtopf und gebundene Zustände α Fall 1: Töpfe mit endlicher Tiefe Wir wollen hier nur die Verhältnisse untersuchen, bei denen −V0 < E < 0 ist. Ist E > 0, so haben wir wieder den Fall 1 für den Potentialwall vorliegen.
Abb. 4: Rechteckiger Potentialtopf
In den Bereichen I (x < −a/2), II (−a/2 ≤ x ≤ a/2) und III (x > a/2) ist jeweils φI (x) = B1 eρx + B1 e−ρx φII (x) = φIII (x) =
A2 e + A2 e−ikx B3 eρx + B3 e−ρx ikx
(36a) (36b) (36c)
mit ρ = √− k=√
2mE ℏ2
2m(E + V0 ) ℏ2
(37) (38)
Stationäre Zustände eines Teilchens | 71
•
Weil φ(x) im Bereich I beschränkt ist, muss B1 = 0
(39)
sein. Die Grenzbedingungen an der Stelle x = −a/2 ergeben dann ρ + ik B1 2ik ρ − ik A2 = −e−(ρ+ik)a/2 B1 2ik
A2 = e(−ρ+ik)a/2
(40)
und die an der Stelle x = a/2 e−ρa B3 = [(ρ + ik)2 eika − (ρ − ik)2 e−ika ] B1 4ikρ B3 ρ 2 + k 2 = sin ka B1 2kρ
(41)
Damit jedoch φ(x) auch im Bereich III beschränkt ist, muss B3 = 0, d. h. (
ρ − ik 2 ) = e2ika ρ + ik
(42)
sein. ρ und k sind von der Energie E abhängig, so dass diese Gleichung nur für be stimmte Werte von E erfüllt werden kann. Die Quantisierung der Energie folgt dem nach aus der Forderung, dass die Wellenfunktion φ(x) überall beschränkt ist. Genauer sind zwei Fälle möglich: 1. Gilt ρ − ik = −eika ρ + ik
(43)
so wird ka ρ = tan ( ) k 2
(44)
Setzen wir k0 = √
2mV0 = √k2 + ρ2 ℏ2
(45)
so erhalten wir 1 cos2 (
ka ) 2
= 1 + tan2
ka k 2 + ρ 2 k0 2 = ( = ) 2 k k2
Gleichung (43) ist also zum System ka k { { cos ( ) = { { 2 k 0 { { ka { { tan ( ) > 0 2 {
(46)
(47a) (47b)
•
72 | Ergänzung HI
äquivalent. Grafisch ergibt sich nach Abb. 5 eine bestimmte Anzahl erlaubter Energie werte durch die Schnittpunkte der Geraden (1/k 0 ) mit den lang gestrichelt gezeichne ten Kosinusbögen. Die zugehörigen Wellenfunktionen sind gerade. Dies erkennt man, wenn man Gl. (43) in Gl. (40) bzw. Gl. (41) einsetzt. Es wird dann B3 = B1 und A2 = A2 , so dass φ(−x) = φ(x) ist.
Abb. 5: Grafische Lösung von Gl. (42) zur Bestimmung der Energien der gebundenen Zustände eines Teilchens in einem rechteckigen Potentialtopf. In diesem Beispiel gibt es drei gerade Zustände (sie gehören zu den Punkten P) und zwei ungerade (zu den Punkten I).
2. Ist ρ − ik = eika ρ + ik
(48)
so liefert eine entsprechende Rechnung das System ka k { { sin ( ) = { { 2 k 0 { { ka { { tan ( ) < 0 2 {
(49a) (49b)
Die Energieniveaus ergeben sich hiernach durch die Schnittpunkte derselben Gera den wie oben mit den kurz gestrichelten Sinusbögen. Sie liegen zwischen den unter Fall 1 ermittelten Niveaus und gehören, wie man zeigen kann, zu ungeraden Wellen funktionen. Bemerkung: Für k0 ≤ πa , d. h. wenn V0 ≤ V1 =
π 2 ℏ2 2ma2
(50)
ist, zeigt die Abb. 5, dass es einen einzigen gebundenen Zustand des Teilchens gibt; die zugehö rige Wellenfunktion ist gerade. Ist weiter V1 ≤ V0 < 4V1 , so tritt ein erstes ungerades Niveau auf usw.: Mit wachsendem V0 ergeben sich abwechselnd Niveaus mit gerader und ungerader Wel lenfunktion. Gilt schließlich V0 ≫ V1 , so ist die Steigung 1/k0 der Geraden sehr gering. Für die niedrigsten Energieniveaus hat man dann praktisch k=
nπ a
(51)
Stationäre Zustände eines Teilchens |
73
•
worin n eine ganze Zahl ist, und folglich für die Energie E=
n 2 π 2 ℏ2 − V0 2ma2
(52)
β Fall 2: Unendlich tiefe Töpfe Es sei V(x) für 0 < x < a null und sonst überall unendlich. Wir setzen k=√
2mE ℏ2
(53)
Nach der Bemerkung im Anschluss an den Fall der Totalreflexion muss φ(x) außerhalb des Intervalls [0, a] gleich null und an den Stellen x = 0 und x = a stetig sein. Nun ist für 0 ≤ x ≤ a φ(x) = Aeikx + A e−ikx
(54)
Aus φ(0) = 0 ergibt sich dann A = −A und damit φ(x) = 2iA sin kx
(55)
Weiter ist φ(a) = 0, wenn nπ (56) k= a mit einer beliebigen ganzen Zahl n gilt. Normiert man unter Berücksichtigung von Gl. (56) die Funktion (55), so erhält man die stationären Wellenfunktionen 2 nπx sin ( ) a a zu den Energien φ n (x) = √
(57)
n2 π2 ℏ2 (58) 2ma2 In diesem Fall erweist sich also die Quantisierung der Energie als besonders einfach. En =
Bemerkungen: 1. Nach der Beziehung (56) sind die stationären Zustände durch die Bedingung bestimmt, dass der unendlich tiefe Topf mit der Breite a im Gegensatz zum endlich tiefen Topf eine ganze Anzahl von halben Wellen enthält. Der Unterschied zwischen den beiden Fällen rührt von der Phasenver schiebung her, die bei der Reflexion der Wellenfunktion an einer Potentialstufe auftritt. 2. An den Gleichungen (51) und (52) erkennt man, dass man die Energieniveaus für einen unend lich tiefen Potentialtopf auch erhält, wenn man hier V0 gegen unendlich gehen lässt.
Referenzen und Literaturhinweise Eisberg und Resnick (1.3), Kap. 6; Ayant und Belorizky (1.10), Kap. 4; Messiah (1.17), Kap. III; Merzbacher (1.16), Kap. 6; Valentin (16.1), Anhang V.
•
74 | Ergänzung JI
Ergänzung JI Wellenpaket an einer Potentialstufe 1 2
Totalreflexion: E < V 0 | 74 Partielle Reflexion: E > V 0 | 78
In der vorhergehenden Ergänzung haben wir die stationären Zustände eines Teilchens in einem Rechteckpotential untersucht. Dabei traten verschiedentlich, z. B. im Fall der Potentialstufe, unendlich ausgedehnte (einfallende, reflektierte und transmittierte) ebene Wellen auf. Derartige Funktionen sind nicht normierbar und können deshalb keinen wirklichen physikalischen Zustand des Teilchens repräsentieren. Man kann sie jedoch überlagern und mit ihnen ein normierbares Wellenpaket konstruieren. Dessen zeitliches Verhalten ist leicht zu bestimmen, weil es dabei nach stationären Wellen entwickelt wird. Es genügt, jeden Entwicklungskoeffizienten mit e−iEt/ℏ zu multipli zieren (s. Kap. I, § D-1-b). In diesem Abschnitt wollen wir für den Fall einer Potentialstufe mit der Höhe V0 (s. Abb. 1 in Ergänzung HI ) ein Wellenpaket konstruieren und seine zeitliche Entwick lung untersuchen. Wir gelangen auf diese Weise zu einer genaueren Beschreibung des quantenmechanischen Verhaltens des Teilchens, dem wir das Wellenpaket zuordnen, und können gleichzeitig Aussagen aus Ergänzung HI bestätigen. Wir setzen √ 2mE = k ℏ2
(1)
√ 2mV0 = K0 ℏ2 und unterscheiden wie in Ergänzung HI die beiden Fälle, bei denen k kleiner bzw. größer als K0 ist.
1 Totalreflexion: E < V0 Die stationären Wellenfunktionen sind in diesem Fall durch die Gleichungen (11) und (20) aus Ergänzung HI gegeben (wobei wir k 1 hier durch k ersetzen), und die Bezie hungen (21), (22) und (23) aus dieser Ergänzung liefern den Zusammenhang zwischen den Koeffizienten A1 , A1 , B2 und B2 . Das Wellenpaket bilden wir, indem wir diese Wellenfunktionen linear superpo nieren. Damit das Paket insgesamt eine Totalreflexion erfährt, nehmen wir für k nur die Werte, die kleiner als K0 sind; die Amplitudenfunktion g(k) muss also für k > K0 gleich null sein. Links von der Potentialstufe, d. h. für negative x, haben die Koeffizi enten im Ausdruck für die stationäre Wellenfunktion nach Gl. (11) denselben Betrag, https://doi.org/10.1515/9783110638738-010
Wellenpaket an einer Potentialstufe |
75
•
so dass wir A1 (k) = e−2iθ(k) A1 (k)
(2)
setzen können. Darin ist θ durch tan θ(k) =
√K02 − k 2
(3)
k
gegeben. Für t = 0 und x < 0 schreiben wir schließlich das Paket in der Form K0
1 ψ(x, 0) = ∫ dk g(k)[eikx + e−2iθ(k)e−ikx ] √2π
(4)
0
Wie in Kap. I, § C habe darin |g(k)| an der Stelle k = k 0 < K0 ein ausgeprägtes Maximum der Breite ∆k. Um die Wellenfunktion ψ(x, t) zu einem beliebigen Zeitpunkt t zu erhalten, gehen wir von der allgemeinen Beziehung (D-14) aus. Sie lautet hier mit ω(k) = ℏk 2 /2m K0
1 ψ(x, t) = ∫ dk g(k)ei[kx−ω(k)t] √2π 0
K0
1 + ∫ dk g(k)e−i[kx+ω(k)t+2θ(k)] √2π
(5)
0
und gilt nur für negative x. Der erste Summand repräsentiert das einfallende Wellen paket, der zweite das reflektierte. Der Einfachheit halber nehmen wir g(k) als reell an. Mit der Methode der stationären Phase (s. § C-2 von Kap. I) können wir dann die Lage xE des Schwerpunkts des einfallenden Pakets bestimmen. Hierzu genügt es, das Ar gument des ersten Exponentialausdrucks an der Stelle k = k 0 nach k abzuleiten und diese Ableitung gleich null zu setzen. Dies ergibt xE = t [
dω ℏk 0 = ] t dk k=k0 m
(6)
Um den Ort xR des Schwerpunkts des reflektierten Pakets zu erhalten, verfahren wir mit dem Argument des zweiten Exponentialausdrucks entsprechend. Die dabei zu bil dende Ableitung von θ nach k ergibt sich aus Gl. (3). Es ist [1 + tan2 θ] dθ = [1 + =−
K02 − k 2 ] dθ k2
dk dk √K02 − k 2 − , k2 √K02 − k 2
(7)
•
76 | Ergänzung JI
d. h. K02 K02 1 dθ = − dk k2 k2 √K 2 − k2 0
(8)
Somit erhalten wir xR = − [t
dθ 2 dω ℏk 0 +2 ] t+ =− dk dk k=k0 m 2 √K0 − k 20
(9)
Die Beziehungen (6) und (9) beschreiben die Bewegung des Teilchens, das in einem kleinen Intervall ∆x um xE bzw. xR lokalisiert ist. Wir betrachten zunächst den Vorgang für Zeiten t < 0. Hier bewegt sich der Schwerpunkt xE des einfallenden Wellenpakets mit der Geschwindigkeit ℏk 0 /m von links nach rechts. Andererseits erkennt man an Gl. (9), dass xR positiv und damit außerhalb des Bereichs liegt, in dem der Ausdruck (5) gültig ist. Dies bedeutet, dass für alle x < 0 die verschiedenen Anteile beim zweiten Summanden destruktiv interfe rieren: Für Zeiten t < 0 existiert kein reflektiertes Paket. Zum Zeitpunkt t = 0 erreicht der Schwerpunkt des einfallenden Wellenpakets die Potentialstufe, das Paket ist dann für einen gewissen Zeitraum im Bereich x ≈ 0 lokali siert und seine Form relativ kompliziert. Sobald dagegen t genügend groß ist, erkennt man an den Gleichungen (6) und (9), dass das einfallende Paket verschwunden ist: Es existiert nur noch das reflektierte Paket. Jetzt ist nämlich xE positiv, während xR ne gativ wird; die Teilwellen des einfallenden Pakets interferieren destruktiv, die des re flektierten dagegen konstruktiv. Das reflektierte Paket bewegt sich mit der Geschwin digkeit −ℏk 0 /m erst dann nach links, wenn das einfallende Paket die Stufe erreicht hat. Ist ∆k genügend klein und das Zerfließen des Pakets im betrachteten Zeitintervall vernachlässigbar, so ist die Form des reflektierten Pakets (bis auf eine Symmetrie) die gleiche wie die des einfallenden Pakets. Wir erkennen weiter nach Gl. (9), dass bei der Reflexion eine Verzögerung τ = −2 [
dθ/ dk 2m = ] dω/ dk k=k0 ℏk √K 2 − k 2 0 0 0
(10)
auftritt. Im Gegensatz zu den Vorhersagen der klassischen Mechanik wird das Teil chen also nicht sofort reflektiert. Die Verzögerung hängt vom Phasenunterschied zwischen der einfallenden und der reflektierten Welle ab, jedoch nicht einfach von θ(k 0 ) wie bei einer unendlich ausgedehnten ebenen Welle, sondern von der Ableitung dθ/ dk an der Stelle k = k 0 . Physikalisch hat diese Verzögerung ihre Ursache dar in, dass für t in der Nähe von null die Aufenthaltswahrscheinlichkeit des Teilchens im klassisch verbotenen Bereich x > 0 quantenmechanisch von null verschieden ist (gedämpfte Welle, s. Bemerkung 1 weiter unten). Bildhaft kann man dies so um schreiben, dass das Teilchen vor seiner Umkehr eine Zeit von der Größenordnung τ in
Wellenpaket an einer Potentialstufe | 77
•
diesem Bereich verliert. Nach Gl. (10) ist die Verzögerung τ umso größer, je weniger sich die mittlere Energie unterscheidet.
ℏ2 k20 2m
des Wellenpakets von der Höhe V0 der Potentialstufe
Bemerkungen: 1. Wir haben im Wesentlichen das Paket für x < 0 untersucht, doch kann man ebenso gut auch fragen, was im Bereich x > 0 geschieht. Hier ist das Paket K0
ψ(x, t) =
1 ∫ dk g(k)B2 (k)e−ρ(k)x e−iω(k)t √2π
(11)
0
mit ρ(k) = √ K02 − k2
(12)
B2 (k) ergibt sich aus Gl. (23) in Ergänzung HI , wenn man A 1 durch 1, k1 durch k und ρ2 durch ρ ersetzt. Eine analoge Überlegung wie die in § C-2 von Kap. I zeigt dann, dass |ψ(x, t)| sein Maximum annimmt, wenn die Phase des Integranden stationär ist. Nach den Gleichungen (22) und (23) von Ergänzung HI das Argument von B2 halb so groß wie das von A 1 , dies aber ist gleich −2θ(k). Entwickelt man daher ω(k) und θ(k) an der Stelle k = k0 , so erhält man unter Beachtung von Gl. (10) für die Phase des Integranden in Gl. (11) {− [
dθ dω ℏk0 τ −[ t} (k − k0 ) = − ] ] (k − k0 ) (t − ) dk k=k0 d k k=k0 m 2
(13)
g(k) ist nach Voraussetzung reell. Im Bereich x > 0 wird demnach |ψ(x, t)| für t = 2τ am größten¹: Zu diesem Zeitpunkt kehrt das Wellenpaket um, und wir erhalten wieder die bei der Reflexion beobachtete Verzögerung. Ist ∆k die Breite von g(k) und ∆t das durch die Beziehung ℏk0 ∆k∆t ≈ 1 m
(14)
bestimmte Zeitintervall, so zeigt Gl. (13) weiter, dass für |t − 2τ | > ∆t der Betrag |ψ(x, t)| der Wellenfunktion vernachlässigbar klein wird. Das Wellenpaket verweilt also im Bereich x > 0 nur während eines Zeitintervalls von der Größenordnung ∆t =
1/∆k ℏk0 /m
(15)
was näherungsweise der Zeit entspricht, die im Bereich x < 0 für die Verschiebung einer Größe mit der vergleichbaren Breite 1/∆k erforderlich wäre. 2. Weil wir voraussetzen, dass ∆k gegenüber k0 und K0 klein ist, liefert der Vergleich von Gl. (10) und Gl. (15), dass ∆t ≫ τ
(16)
ist. Die bei der Reflexion auftretende Verzögerung drückt sich also beim reflektierten Paket durch eine geringe Verschiebung gegenüber seiner Breite aus.
1 Wir stellen fest, dass die Phase (13) im Gegensatz zum Fall des freien Wellenpakets nicht von x ab hängt; hieraus folgt, dass im Bereich x > 0 der Betrag von ψ(x, t) kein ausgeprägtes und sich zeitlich verschiebendes Maximum aufweist.
•
78 | Ergänzung JI
2 Partielle Reflexion: E > V0 Wir betrachten jetzt eine um k = k 0 > K0 zentrierte Amplitudenfunktion g(k) mit der Breite ∆k, die für k < K0 gleich null ist. Das Wellenpaket setzt sich dann aus statio nären Wellenfunktionen zusammen, für die die Gleichungen (11) und (12) gelten. Soll das Teilchen von negativen x her auf die Potentialstufe treffen, muss A2 = 0 gesetzt werden. Wählen wir weiter A1 = 1, so ergeben sich die Koeffizienten A1 (k) und A2 (k) aus (13) und (14), indem wir dort k 1 durch k und k 2 durch √k 2 − K02 ersetzen. Um das Paket durch einen einzigen, für alle x gültigen Ausdruck beschreiben zu können, ver wenden wir die Heavisidesche Sprungfunktion θ(x). Sie ist definiert durch {0 für x < 0 θ(x) = { 1 für x > 0 { Wir erhalten dann für das Wellenpaket
(17)
+∞
ψ(x, t) = θ(−x)
1 ∫ dk g(k)ei[kx−ω(k)t] √2π K0
+∞
+ θ(−x)
1 ∫ dk g(k)A1 (k)e−i[kx+ω(k)t] √2π K0
+∞
+ θ(x)
1 √ 2 2 ∫ dk g(k)A2 (k)ei[ k −K0 x−ω(k)t] √2π
(18)
K0
Es gibt demnach jetzt drei Wellenpakete: ein einfallendes, ein reflektiertes und ein transmittiertes. Die Schwerpunkte dieser drei Pakete erhalten wir wieder durch die Methode der stationären Phase. Weil A1 (k) und A2 (k) reell sind, findet man ℏk 0 t m ℏk 0 xR = − t m xE =
xT =
ℏ√k 20 − K02
(19a) (19b)
t (19c) m Eine entsprechende Diskussion wie die aus dem vorgehenden Abschnitt führt zu fol genden Aussagen: Für negative Zeiten t gibt es nur ein einfallendes Wellenpaket; für genügend große positive t existieren ein reflektiertes und ein transmittiertes Wellen paket (Abb. 1). Weil die Koeffizienten A1 (k) und A2 (k) reell sind, tritt weder bei der Reflexion noch bei der Transmission eine Verzögerung auf. Das einfallende und das reflektierte Wellenpaket breiten sich mit der Geschwin digkeit ℏk 0 /m bzw. −ℏk 0 /m aus. Wir nehmen ∆k als so klein an, dass man die Ände rung von A1 (k) gegenüber der von g(k) vernachlässigen kann. Man kann dann beim zweiten Summanden in Gl. (18) A1 (k) durch A1 (k 0 ) ersetzen und vor das Integral zie
Wellenpaket an einer Potentialstufe |
79
•
(a)
(b)
(c)
(d) Abb. 1: Verhalten eines Wellenpakets an einer Potentialstufe für den Fall E > V 0 . (a) Verlauf des Potentials. (b) Das Paket bewegt sich auf die Stufe zu. (c) In der Übergangsperiode zerteilt sich das Paket, und die zwischen den einfallenden und den reflektierten Wellen auftretenden Interferenzen führen im Bereich x < 0 zu Oszillationen. (d) Nach einem gewissen Zeitraum erkennt man zwei Wel lenpakete: Das reflektierte bewegt sich nach links. Es hat eine geringere Höhe als das einfallende Paket, jedoch die gleiche Breite. Das transmittierte Paket läuft nach rechts, seine Höhe liegt etwas oberhalb der Höhe des einfallenden Pakets, dafür ist es aber viel schmaler.
hen. Wir erkennen, dass es bis auf eine Symmetrie dieselbe Form wie das einfallen de Paket aufweist. Seine Höhe ist jedoch geringer, weil nach Gl. (13) der Koeffizient A1 (k 0 ) kleiner als eins ist. Nach Definition ist der Reflexionskoeffizient R das Verhält nis der Aufenthaltswahrscheinlichkeiten des Teilchens beim einfallenden und beim reflektierten Paket. Weil wir A1 (k) = 1 gesetzt haben, ist daher R = |A1 (k 0 )|2 [in Über einstimmung mit Gl. (15) aus Ergänzung HI ]. Für das transmittierte Wellenpaket ist die Situation eine andere. Wieder kann man für genügend kleines ∆k den entsprechenden Ausdruck vereinfachen: Man ersetzt A2 (k) durch A2 (k 0 ) und schreibt für √k 2 − K02 näherungsweise √k 2 − K02 ≈ √k 20 − K02 + (k − k 0 ) [ [ k0 ≈ q0 + (k − k 0 ) q0
d √k 2 − K02 dk
] ]k=k0 (20)
•
80 | Ergänzung JI
mit q0 = √k 20 − K02
(21)
Wir erhalten damit für den transmittierten Anteil +∞
ψT (x, t) ≈ A2 (k 0 )eiq0 x
k 1 i[(k−k0 ) q0 x−ω(k)t] 0 ∫ dk g(k)e √2π
(22)
K0
Vergleichen wir dies mit dem einfallenden Wellenpaket +∞
ik0 x
ψE (x, t) = e
1 ∫ dk g(k)ei[(k−k0 )x−ω(k)t] √2π
(23)
K0
so sehen wir, dass k0 |ψT (x, t)| ≈ A2 (k 0 ) ψE ( x, t) q0
(24)
ist. Weil nach Gl. (14) aus Ergänzung HI der Koeffizient A2 (k 0 ) größer als eins ist, hat das transmittierte Paket eine etwas größere Höhe als das einfallende. Dagegen ist es im Vergleich zum einfallenden Paket schmaler, denn wenn ∆x die Breite von |ψE (x, t)| ist, so liefert Gl. (24) für die Breite von |ψT (x, t)| (∆x)T =
q0 ∆x k0
(25)
Der Transmissionskoeffizient (also das Verhältnis der Aufenthaltswahrscheinlichkei ten beim transmittierten und beim einfallenden Paket) erscheint somit in der Form eines Produkts aus zwei Faktoren: T=
q0 |A2 (k 0 )|2 k0
(26)
Wegen A1 (k 0 ) = 1 entspricht dies der Gl. (16) aus Ergänzung HI . Berücksichtigt man schließlich die Kontraktion des längs der x-Achse transmittierten Pakets, so erhält man wieder seine Verschiebungsgeschwindigkeit VT =
ℏk 0 q0 ℏq0 = m k0 m
(27)
Referenzen und Literaturhinweise Schiff (1.18), Kap. 5, Abb. 16, 17, 18, 19; Eisberg und Resnick (1.3), § 6.3, Abb. 6–8; siehe auch Referenz (1.32).
Aufgaben | 81
•
Ergänzung KI Aufgaben 1. Ein monoenergetischer Neutronenstrahl (Neutronenmasse Mn = 1.67 × 10−27 kg) falle mit der Energie E auf eine lineare Kette von Atomkernen, die wie in der nachfol genden Abbildung regelmäßig angeordnet sind; es kann sich dabei z. B. um ein langes lineares Molekül handeln. Der Abstand zweier benachbarter Kerne sei l, ihr Durch messer d, wobei d ≪ l gelte. In großer Entfernung befinde sich unter dem Winkel θ gegenüber der Einfallsrichtung ein Neutronendetektor.
a) Was beobachtet man qualitativ am Detektor D, wenn die Energie E der einfallen den Neutronen verändert wird? b) Trägt man die Zählrate in Abhängigkeit von E auf, so zeigt sich an der Stelle E = E1 eine Resonanz. Unter der Voraussetzung, dass für E < E1 keine weiteren Resonan zen auftreten, zeige man, dass man aus dieser Resonanzstelle den Kernabstand l berechnen kann. Beispiel: θ = 30∘ , E1 = 1.3 × 10−20 J. c) Ab welcher Energie muss der endliche Durchmesser der Kerne berücksichtigt wer den? 2. Ein Teilchen werde durch den Hamilton-Operator H=−
ℏ2 d2 − αδ(x) 2m dx2
beschrieben; α ist darin eine positive und dimensionsbehaftete Konstante. a) Man integriere die Schrödinger-Gleichung zu Eigenwerten zwischen −ε und +ε. Durch den Grenzübergang ε → 0 zeige man, dass die Eigenfunktion φ(x) an der Stelle x = 0 eine von α, m und φ(0) abhängende Unstetigkeit aufweist. b) Ist die Energie E des Teilchens negativ (gebundener Zustand), so kann man die Wellenfunktion φ(x) in der Form {A 1 eρx + A1 e−ρx falls x < 0 φ(x) = { A eρx + A2 e−ρx falls x > 0 { 2 schreiben. Dabei ist ρ eine von E und m abhängige Konstante. Unter Verwendung der Ergebnisse unter Punkt a) berechne man die durch die Beziehung (
A1 A2 ) = M( ) A2 A1
https://doi.org/10.1515/9783110638738-011
•
82 | Ergänzung KI
definierte Matrix M. Aus der quadratischen Integrierbarkeit von φ(x) bestimme man weiter die möglichen Energieeigenwerte und die zugehörigen normierten Ei genfunktionen. c) Man skizziere den Graphen dieser Funktionen und bestimme die Größenordnung ihrer Breite ∆x. d) Mit welcher Wahrscheinlichkeit d𝒫(p) ergibt eine Impulsmessung am Teilchen einen Wert zwischen p und p+d p, wenn sich das Teilchen in einem der normierten stationären Zustände befindet? Für welchen Wert von p ist diese Wahrscheinlich keit am größten? In welchem Intervall ∆p nimmt der Impuls von null wesentlich verschiedene Werte an? Von welcher Größenordnung ist das Produkt ∆x ⋅ ∆p? 3. Ein Teilchen bewegt sich mit der positiven Energie E in einem δ-Potential wie in der vorstehenden Aufgabe von links nach rechts auf der x-Achse. a) Man zeige, dass ein stationärer Zustand des Teilchens durch {eikx + Ae−ikx falls x < 0 φ(x) = { Beikx falls x > 0 { beschrieben werden kann, wobei k, A und B Konstante sind, die von der Ener gie E, der Masse m und von α abhängen. Man beachte die Unstetigkeit von dφ/ dx an der Stelle x = 0. b) Für die Energie des gebundenen Zustands setze man −Egeb = −mα 2 /2ℏ2 und be rechne den Reflexionskoeffizienten R und den Transmissionskoeffizienten T des Potentialwalls in Abhängigkeit von E/Egeb . Wie verhalten sie sich für E → ∞? Wie kann man dies deuten? Man zeige, dass der Ausdruck für T, wenn man ihn für negative Werte von E anschreibt, für E → −Egeb divergiert. Deutung? 4. a) Man schreibe die Eigenwertgleichung des Hamilton-Operators H aus der Aufga be 2 und die zugehörige Fourier-Transformierte dieser Gleichung an. Hieraus er gibt sich unmittelbar die Fourier-Transformierte φ(p) von φ(x) in Abhängigkeit von p, E, α und φ(0). Man zeige, dass nur ein einziger negativer Energieeigen wert möglich ist. Man erhält auf diese Weise also nur den gebundenen Zustand des Teilchens, nicht aber den für den Ausbreitungsvorgang. Warum ist das so? Man berechne φ(x) und zeige, dass man auf diese Weise sämtliche Ergebnisse aus Aufgabe 2 wieder erhält. b) Die mittlere kinetische Energie des Teilchens kann man in der Form +∞
Ekin =
1 ∫ p2 |φ(p)|2 dp 2m −∞
schreiben (s. Kapitel III). Unter der Voraussetzung, dass φ(p) hinreichend regulär ist, zeige man, dass für Ekin auch gilt +∞
Ekin
ℏ2 d2 φ =− dx ∫ φ∗ (x) 2m dx2 −∞
Aufgaben | 83
•
Für den unter Punkt a) berechneten gebundenen Zustand kann man also Ekin auf zwei verschiedene Weisen bestimmen. Was ergibt sich? Man beachte, dass im zweiten Fall φ(x) an der Stelle x = 0 ein „nichtreguläres“ Verhalten zeigt, weil ihre Ableitung un stetig ist. Man muss diese daher im Sinne einer Distribution auffassen. Erst dadurch trägt der Punkt x = 0 zur mittleren Energie bei. Zur physikalischen Interpretation die ses Anteils betrachte man ein Rechteckpotential, das um x = 0 zentriert ist und bei dem die Breite a gegen null und die Tiefe V0 gegen unendlich gehen, und zwar so, dass aV0 = α bleibt. Man untersuche das Verhalten der Wellenfunktion in einem der artigen Potential. 5. Man betrachte ein Teilchen der Masse m, das sich in einem Potential V(x) = −αδ(x) − αδ(x − l) ,
α>0
befindet; die Konstante l hat darin die Dimension einer Länge. ℏ2 ρ 2 a) Man setze E = − 2m und berechne die gebundenen Zustände des Teilchens. Man zeige, dass sich die möglichen Energiewerte aus der Beziehung e−ρl = ± (1 −
2ρ ) μ
(mit der Abkürzung μ = 2mα ) ergeben. Man löse diese Gleichung näherungsweise ℏ2 grafisch. 1. Grundzustand. Man zeige, dass der Grundzustand gerade, d. h. symmetrisch in Bezug auf den Punkt x = l/2, und seine Energie Eg niedriger als die in Aufgabe 3 eingeführte Energie −Egeb ist. Was bedeutet dies physikalisch? Man skizziere den Verlauf der zugehörigen Wellenfunktion. 2. Angeregter Zustand. Man zeige, dass ein ungerader Zustand (bezüglich der Stelle x = l/2) mit einer Energie Ea > −Egeb existiert, falls l größer als ein bestimmter Wert ist, und skizziere die zugehörige Wellenfunktion. 3. Man erkläre, wie die vorstehenden Rechnungen als Modell für ein zweiato miges ionisiertes Molekül dienen können (z. B. für H+2 ), bei dem der Abstand der Kerne gerade l ist. Wie hängen die beiden Energieniveaus von l ab, und was geschieht bei den Grenzübergängen l → 0 und l → ∞? Wie groß ist die Gesamtenergie des Systems bei Berücksichtigung der Abstoßung der beiden Kerne? Man zeige, dass man aus dem Verlauf der Energien in Abhängigkeit von l in bestimmten Fällen die Existenz gebundener Zustände vorhersagen und die Größe von l im Gleichgewicht bestimmen kann. Es ergibt sich damit ein sehr elementares Modell der chemischen Bindung. b) Man berechne für den zweifachen δ-Wall den Reflexions- und den Transmissions koeffizienten und untersuche deren Abhängigkeit von l. Warum treten die Reso nanzen bei einem Vielfachen der de-Broglie-Wellenlänge des Teilchens auf?
•
84 | Ergänzung KI
6. Man betrachte ein Rechteckpotential mit der Breite a und der Tiefe V0 , s. die Be zeichnungen aus Ergänzung HI , § 2-c-α. Wir wollen die Eigenschaften des gebundenen Zustands eines Teilchens in diesem Potential für den Fall untersuchen, dass a gegen null geht. a) Man zeige, dass nur ein einziger gebundener Zustand existiert und zwar mit der mV 2 a 2 Energie E ≈ − 2ℏ02 . Diese hängt also vom Quadrat der „Fläche“ aV0 ab. b) Man zeige, dass ρ → 0 geht und dass A2 = A2 ≈ B1 /2 ist. Hieraus leite man her, dass für den gebundenen Zustand die Aufenthaltswahrscheinlichkeit außerhalb des Potentialtopfes gegen eins strebt. c) Wie kann man die vorstehenden Überlegungen auf ein Teilchen anwenden, das sich in einem Potential V(x) = −αδ(x) (Aufgabe 2) befindet? 7. Man betrachte ein Teilchen im Potential {0 V(x) = { −V { 0
falls x ≥ a falls 0 ≤ x < a
für negative x sei V(x) unendlich. Man zeige, dass die Wellenfunktion φ(x) für einen gebundenen Teilchenzustand zu einer ungeraden Wellenfunktion fortgesetzt werden kann, die zu einem stationären Zustand in einem Rechteckpotential mit der Breite 2a und der Tiefe V0 gehört (s. Ergänzung HI , § 2-c-α). Man diskutiere die Zahl der gebun denen Zustände in Abhängigkeit von a und V0 . Existiert stets – wie beim symmetri schen Rechteckpotential – wenigstens ein derartiger Zustand? 8. Für ein zweidimensionales Problem untersuche man die schräge Reflexion eines Teilchens an der Potentialstufe {0 V(x, y) = { V { 0
falls x < 0 falls x > 0
Wie bewegt sich der Schwerpunkt des Wellenpakets? Man interpretiere für den Fall der Totalreflexion die Unterschiede zwischen der Bahn dieses Schwerpunktes und der klassischen Bahn (Lateralversetzung). Man zeige, dass sich für V0 → ∞ beide Bahnen asymptotisch nähern.
II Der mathematische Rahmen A A-1 A-2 A-3 B B-1 B-2 B-3 B-4 C C-1 C-2 C-3 C-4 C-5 D D-1 D-2 D-3 E E-1 E-2 F F-1 F-2 F-3 F-4
Der Raum der Wellenfunktionen eines Teilchens | 86 Struktur des Raumes der Wellenfunktionen | 86 Orthonormierte Basen | 89 Kontinuierliche Basen | 92 Zustandsraum und Dirac-Schreibweise | 99 Einführung | 99 Ket- und Bravektoren | 101 Lineare Operatoren | 106 Hermitesche Konjugation | 108 Darstellungen im Zustandsraum | 113 Definition einer Darstellung | 113 Eigenschaften einer orthonormierten Basis | 114 Darstellung der Ket- und Bravektoren | 117 Darstellung von Operatoren | 118 Darstellungswechsel | 122 Eigenwertgleichungen. Observable | 124 Eigenwerte und Eigenvektoren eines Operators | 124 Observable | 129 Kommutierende Observable | 132 Zwei wichtige Beispiele | 137 Die Orts- und die Impulsdarstellung | 138 Orts- und Impulsoperator | 142 Tensorprodukte von Zustandsräumen | 146 Einführung | 146 Definition und Eigenschaften des Tensorprodukts | 147 Eigenwertgleichung im Produktraum | 150 Anwendungen | 153
Dieses Kapitel gibt einen einfachen Überblick über die mathematischen Grundlagen der Quantenmechanik, wobei allerdings weder Vollständigkeit noch Strenge ange strebt wird. Vielmehr fassen wir hier die verschiedenen in der Quantentheorie ver wendeten Begriffe zusammen, soweit sie für das Verständnis der folgenden Kapitel erforderlich sind. Dabei gehen wir vor allem auf die Diracsche Notation ein, die sich für viele Rechnungen und Überlegungen als besonders zweckmäßig erweisen wird. In § A geben wir eine Reihe von Begriffen an, wie sie im Zusammenhang mit dem Raum F der Wellenfunktionen gebraucht werden; § B verallgemeinert das Konzept des Zustands eines physikalischen Systems und führt unter Verwendung der DiracSchreibweise den Zustandsraum H des Systems ein. § C untersucht den Darstellungs begriff, während der § D vor allem den Leserinnen und Lesern empfohlen wird, die mit der Diagonalisierung eines Operators noch nicht vertraut sind: Diese Operation wird uns im Folgenden immer wieder begegnen. Nachdem wir dann in § E zwei wichtige Beispiele zur Darstellungstheorie behandelt haben, führen wir schließlich in § F den https://doi.org/10.1515/9783110638738-012
86 | II Der mathematische Rahmen
Begriff des Tensorprodukts ein; dieser wird dann später in Ergänzung DIV an einem einfachen Beispiel genauer vorgestellt.
A Der Raum der Wellenfunktionen eines Teilchens Im ersten Kapitel gaben wir der Wellenfunktion ψ(r, t) im folgenden Sinne eine Wahr scheinlichkeitsdeutung: |ψ(r, t)|2 d3 r ist die Wahrscheinlichkeit dafür, dass sich das Teilchen zum Zeitpunkt t im Volumenelement d3 r um den Punkt r aufhält. Damit die Wahrscheinlichkeit, das Teilchen irgendwo zu finden, gleich eins ist, muss ∫ d3 r |ψ(r, t)|2 = 1
(A-1)
sein, wobei sich die Integration über den gesamten Raum erstreckt. Wir müssen uns also mit dem Raum der quadratintegrablen Funktionen¹ befas sen, d. h. mit den Funktionen, für die das Integral (A-1) konvergent ist. Unter physikalischen Gesichtspunkten ist dieser Raum L2 zu groß: Aufgrund der Deutung, die |ψ(r, t)|2 gegeben wird, müssen die Wellenfunktionen bestimmte Regu laritätseigenschaften aufweisen. Man darf nur die Funktionen ψ(r, t) zulassen, die überall definiert, stetig und sogar unendlich oft differenzierbar sind. So hat z. B. die Behauptung, eine Funktion sei in einem bestimmten Raumpunkt unstetig, physika lisch keinerlei Sinn, weil man Vorstellungen experimentell nie überprüfen könnte, bei denen sehr kleine Abstände, z. B. von 10−30 m, eine Rolle spielen. Weiter reicht es stets aus, nur Wellenfunktionen mit beschränktem Träger zu betrachten: Das Teilchen be findet sich mit Sicherheit in einem endlichen Raumbereich, z. B. in einem bestimmten Laboratorium. Auf diese zusätzlichen Bedingungen wollen wir hier nicht genauer ein gehen und unter F einfach einen Unterraum von L2 verstehen, für den die Funktionen hinreichend regulär sind.
A-1 Struktur des Raumes der Wellenfunktionen A-1-a F ist ein Vektorraum Es ist leicht zu zeigen, dass F die Eigenschaften eines Vektorraumes besitzt. Ist z. B. ψ1 (r) ∈ F und ψ2 (r) ∈ F , so ist ψ(r) = λ1 ψ1 (r) + λ2 ψ2 (r) ∈ F mit zwei beliebigen komplexen Konstanten λ1 und λ2 .
1 In der Mathematik heißt dieser Raum der L2 -Raum; er hat die Struktur eines Hilbert-Raums.
(A-2)
A Der Raum der Wellenfunktionen eines Teilchens |
87
Um zu beweisen, dass |ψ(r)|2 quadratisch integrierbar ist, multiplizieren wir aus: |ψ(r)|2 = |λ1 |2 |ψ1 (r)|2 + |λ2 |2 |ψ2 (r)|2 + λ∗1 λ2 ψ∗1 (r)ψ2 (r) + λ1 λ∗2 ψ1 (r)ψ∗2 (r)
(A-3)
und schätzen die beiden letzten Summanden durch |λ1 ||λ2 | [|ψ1 (r)|2 + |ψ2 (r)|2 ] nach oben ab. |ψ(r)|2 ist also kleiner als eine Funktion, deren Integral konvergiert, weil ψ1 und ψ2 quadratisch integrierbar sind. A-1-b Skalarprodukt α Definition Zwei Elementen φ(r) und ψ(r) von F , wobei auf die Reihenfolge zu achten ist, ordnet man durch die Definition (φ, ψ) = ∫ d3 r φ∗ (r) ψ(r)
(A-4)
eine komplexe Zahl zu, das Skalarprodukt von ψ(r) mit φ(r). Dieses Integral ist stets konvergent, weil φ und ψ zu F gehören. β Eigenschaften Aus der Definition ergibt sich unmittelbar (φ, ψ) = (ψ, φ)∗
(A-5)
(φ, λ1 ψ1 + λ2 ψ2 ) = λ1 (φ, ψ1 ) + λ2 (φ, ψ2 ) (λ1 φ1 + λ2 φ2 , ψ) =
λ∗1 (φ1 , ψ)
+
λ∗2 (φ2 , ψ)
(A-6) (A-7)
Das Skalarprodukt ist linear bezüglich des hinteren und antilinear bezüglich des vor deren Faktors. Ist (φ, ψ) = 0, so heißen φ(r) und ψ(r) zueinander orthogonal. (ψ, ψ) = ∫ d3 r |ψ(r)|2
(A-8)
ist eine reelle, nichtnegative Zahl; null ist sie genau dann, wenn ψ(r) = 0 ist. Die Definition des Skalarprodukts erlaubt die Einführung einer Norm in F . Für ψ(r) besitzt √(ψ, ψ) gerade die Eigenschaften, die diesen Begriff definieren. Schließlich gilt die Schwarzsche Ungleichung: |(ψ1 , ψ2 )| ≤ √(ψ1 , ψ1 )√(ψ2 , ψ2 )
(A-9)
(s. Ergänzung AII ). Gleichheit besteht genau dann, wenn die beiden Funktionen ψ1 und ψ2 zueinander proportional sind.
88 | II Der mathematische Rahmen
A-1-c Lineare Operatoren α Definition Unter einem linearen Operator A versteht man eine mathematische Vorschrift, mit der jeder Funktion ψ(r) ∈ F eine andere Funktion ψ (r) ∈ F so zugeordnet wird, dass gilt ψ (r) = Aψ(r)
(A-10a)
A[λ1 ψ1 (r) + λ2 ψ2 (r)] = λ1 Aψ1 (r) + λ2 Aψ2 (r)
(A-10b)
Wir nennen einige einfache Beispiele für lineare Operatoren: Der Paritätsoperator Π ist definiert durch Πψ(x, y, z) = ψ(−x, −y, −z)
(A-11)
Der Multiplikationsoperator X ist definiert durch Xψ(x, y, z) = x ψ(x, y, z)
(A-12)
und der Differentialoperator D x schließlich durch D x ψ(x, y, z) =
∂ψ(x, y, z) ∂x
(A-13)
Durch die Anwendung des Multiplikationsoperators und des Differentialoperators auf eine Funktion ψ(r) ∈ F können Funktionen entstehen, die nicht mehr in F liegen, also nicht mehr quadratisch integrierbar sind. β Produkte von Operatoren Sind A und B zwei lineare Operatoren, so ist ihr Produkt AB definiert durch (AB)ψ(r) = A [Bψ(r)]
(A-14)
Zunächst wirkt B auf ψ(r) und ergibt φ(r) = Bψ(r), danach wird A auf die so erhaltene Funktion φ(r) angewendet. Im Allgemeinen ist AB ≠ BA. Mit [A, B] = AB − BA
(A-15)
definiert man den Kommutator von A und B. Wir berechnen z. B. den Kommutator [X, D x ]. Für eine beliebige Funktion ψ(r) ∈ F ist ∂ ∂ − x) ψ(r) ∂x ∂x ∂ ∂ [xψ(r)] = x ψ(r) − ∂x ∂x ∂ ∂ = x ψ(r) − ψ(r) − x ψ(r) = −ψ(r) ∂x ∂x
[X, D x ]ψ(r) = (x
(A-16)
A Der Raum der Wellenfunktionen eines Teilchens | 89
Weil dies für alle ψ(r) ∈ F gilt, schreibt man [X, D x ] = −1
(A-17)
A-2 Orthonormierte Basen A-2-a Definition Es sei u 1 (r) ∈ F , u 2 (r) ∈ F , . . . , u i (r) ∈ F , . . . eine durch den diskreten Index i (i = 1, 2, . . . , n, . . .) gekennzeichnete abzählbare Menge von Funktionen aus F ; {u i (r)} heißt orthonormiert, wenn (u i , u j ) = ∫ d3 r u ∗i (r) u j (r) = δ ij
(A-18)
gilt, wobei wir unter δ ij das Kronecker-Symbol verstehen (δ ij ist gleich eins für i = j und null für i ≠ j). Sie bildet eine Basis² in F , wenn jede Funktion ψ(r) ∈ F auf genau eine Weise nach den u i (r) entwickelt werden kann: ψ(r) = ∑c i u i (r)
(A-19)
i
A-2-b Komponenten einer Funktion in Bezug auf eine Basis {u i (r)} Wir multiplizieren beide Seiten von Gl. (A-19) mit u ∗j (r) und integrieren über den ge samten Raum. Mit Gl. (A-6) und Gl. (A-18) erhalten wir³ (u j , ψ) = (u j , ∑ c i u i ) = ∑ c i (u j , u i ) i
i
= ∑ c i δ ij = c j
(A-20)
i
d. h. es ist c i = (u i , ψ) = ∫ d3 r u ∗i (r)ψ(r)
(A-21)
2 Man spricht manchmal auch von einem vollständigen Satz von Funktionen, wobei dieser Begriff sich von dem üblicherweise in der Mathematik verwendeten unterscheidet. 3 In Strenge müssten wir sichern, dass die Summation und die Integration vertauscht werden dürfen. Auf derartige Fragen werden wir hier grundsätzlich nicht eingehen.
90 | II Der mathematische Rahmen Die Komponente c i von ψ(r) ist daher gleich dem Skalarprodukt von ψ(r) mit u i (r). Bei gegebener Basis ist die Angabe der Komponenten c i zur Angabe von ψ(r) äquiva lent. Man sagt, die Menge der c i sei eine Darstellung der Funktion ψ(r). Bemerkungen: 1. Man beachte die Analogie zu einer orthonormierten Basis {e1 , e2 , e3 } des gewöhnlichen drei dimensionalen Raumes R 3 . Die Tatsache, dass die Einheitsvektoren e1 , e2 und e3 paarweise auf einander senkrecht stehen, kann man durch die Gleichungen ei ⋅ ej = δ ij
(i, j = 1, 2, 3)
ausdrücken. Jeder Vektor V aus
(A-22) R3
wird eindeutig nach den ei zerlegt. Es gilt
3
V = ∑ v i ei
(A-23)
i=1
mit v i = ei ⋅ V
(A-24)
Die Gleichungen (A-18), (A-19) und (A-21) entsprechen gerade den wohlbekannten Beziehun gen (A-22), (A-23) und (A-24). Festzuhalten ist jedoch, dass die v i stets reell, die c i aber im Allgemeinen komplexe Zahlen sind. 2. Ein und dieselbe Funktion ψ(r) hat offensichtlich in zwei verschiedenen Basen verschiedene Komponenten. Wir werden später die Frage des Basiswechsels erörtern. 3. Ein linearer Operator A kann in der Basis {u i (r)} durch eine Matrix dargestellt werden. Hierauf werden wir nach Einführung der Dirac-Schreibweise in § C zurückkommen.
A-2-c Skalarprodukt Es seien φ(r) und ψ(r) zwei Wellenfunktionen mit den Entwicklungen φ(r) = ∑ b i u i (r) i
(A-25)
ψ(r) = ∑ c j u j (r) j
Für das Skalarprodukt dieser beiden Funktionen erhalten wir dann mit den Gleichun gen (A-6), (A-7) und (A-18) (φ, ψ) = (∑ b i u i , ∑ c j u j ) = ∑ b ∗i c j (u i , u j ) i
=
j
i,j
∑ b ∗i c j δ ij i,j
d. h. (φ, ψ) = ∑b ∗i c i
(A-26)
i
Insbesondere ist (ψ, ψ) = ∑|c i |2 i
(A-27)
A Der Raum der Wellenfunktionen eines Teilchens | 91
Bemerkung: Sind V und W zwei Vektoren im R 3 und v i bzw. w j ihre Komponenten, so gilt der bekannte Zu sammenhang 3
V ⋅ W = ∑ vi wi
(A-28)
i=1
Gleichung (A-26) kann also als eine Verallgemeinerung von Gl. (A-28) aufgefasst werden.
A-2-d Vollständigkeitsrelation Die Orthonormierungsbedingungen (A-18) drücken aus, dass die Elemente der Funk tionenfolge {u i (r)} auf eins normiert und paarweise orthogonal zueinander sind. Wir stellen jetzt eine weitere Beziehung, die Vollständigkeits- oder auch Abgeschlossen heitsrelation, auf. Sie umschreibt die Eigenschaft dieser Funktionenmenge, eine Basis im Funktionenraum zu sein. Ist {u i (r)} eine Basis in F , so gibt es für jede Funktion ψ(r) ∈ F eine Entwicklung von der Art (A-19). In dieser Beziehung schreiben wir den Ausdruck (A-21) für die ver schiedenen c i um. Dazu müssen wir den Namen der Integrationsvariablen ändern. Es wird ψ(r) = ∑ c i u i (r) = ∑(u i , ψ) u i (r) i
i 3
= ∑ [∫ d r
u ∗i (r )
ψ(r )] u i (r)
(A-29)
i
Vertauscht man die Reihenfolge von Summation und Integration, so erhält man ψ(r) = ∫ d3 r ψ(r ) [∑ u i (r) u ∗i (r )]
(A-30)
i
∑ u i (r)u ∗i (r ) ist also eine von r und r abhängende Funktion F(r, r ) mit der Eigen schaft, dass für jede Funktion ψ(r) ∈ F gilt ψ(r) = ∫ d3 r ψ(r )F(r, r )
(A-31)
Diese Beziehung erklärt gerade die verallgemeinerte Funktion δ(r − r ), s. Anhang II. Wir schreiben daher ∑u i (r) u ∗i (r ) = δ(r − r )
(A-32)
i
Erfüllt umgekehrt eine orthonormierte Funktionenmenge {u i (r)} die Vollständig keitsrelation (A-32), so bildet sie eine Basis in F . Für eine beliebige Funktion ψ(r) ∈ F kann man nämlich ψ(r) = ∫ d3 r ψ(r ) δ(r − r )
(A-33)
92 | II Der mathematische Rahmen
schreiben. Setzt man hier Gl. (A-32) ein, so erhält man nach Vertauschen von Sum mation und Integration wieder Gl. (A-29). Diese Beziehung drückt also aus, dass ψ(r) stets nach den u i (r) entwickelt werden kann, und sie liefert gleichzeitig die Entwick lungskoeffizienten. Bemerkung: In § C werden wir die Vollständigkeitsrelation unter Verwendung der Dirac-Schreibweise angeben und sehen, wie man ihr eine einfache geometrische Deutung zuordnen kann.
A-3 Kontinuierliche Basen Die Elemente der soeben untersuchten Basen sind quadratisch integrierbar. Es kann nun zweckmäßig sein, eine „Basis“ von Funktionen einzuführen, die weder zu F noch zu L2 gehören, nach der man aber dennoch jede Wellenfunktion ψ(r) entwi ckeln kann. Wir wollen Beispiele derartiger Basen angeben und zeigen, wie man die Zusammenhänge des vorstehenden Abschnitts erweitern kann. A-3-a Ebene Wellen Wir betrachten der Einfachheit halber allein den eindimensionalen Fall und untersu chen quadratintegrable Funktionen ψ(x), die nur von der Variablen x abhängen. Im ersten Kapitel hatten wir bereits die Bedeutung der Fourier-Transformierten ψ(p) von ψ(x) erkannt. Es war ψ(x) =
ψ(p) =
+∞
1 √2πℏ
∫ dp ψ(p)eipx/ℏ
(A-34a)
−∞ +∞
1 ∫ dx ψ(x)e−ipx/ℏ √2πℏ
(A-34b)
−∞
Wir definieren die Funktion v p (x) =
1 √2πℏ
eipx/ℏ
(A-35)
Sie beschreibt eine ebene Welle mit dem Wellenvektor p/ℏ. Das Betragsquadrat von v p (x) ist gleich 1/2πℏ; das über die gesamte x-Achse erstreckte Integral divergiert al so, und v p (x) gehört nicht zu Fx . Bezeichnen wir mit {v p (x)} die Menge aller ebenen Wellen zu verschiedenen p, so können wir p als einen sich von −∞ bis +∞ erstre ckenden kontinuierlichen Index auffassen, mit dem wir die einzelnen Elemente dieser Funktionenmenge unterscheiden. Wir erinnern uns, dass der oben für die Folge {u i (r)} verwendete Index i diskret war.
A Der Raum der Wellenfunktionen eines Teilchens |
93
Mit Gl. (A-35) können wir die Beziehungen (A-34a) und (A-34b) umschreiben: +∞
ψ(x) = ∫ dp ψ(p) v p (x)
(A-36)
−∞ +∞
ψ(p) = (v p , ψ) = ∫ dx v∗p (x) ψ(x)
(A-37)
−∞
Wir vergleichen sie mit Gl. (A-19) und Gl. (A-21). Nach Gl. (A-36) kann jede Funktion ψ(x) ∈ Fx auf genau eine Weise nach den v p (x), d. h. nach ebenen Wellen, entwickelt werden. Weil der Index p sich jetzt kontinuierlich ändert, wird die Summation über i in Gl. (A-19) durch eine Integration über p ersetzt. Wie in Gl. (A-21) erhält man durch Gl. (A-37) die zu v p (x) gehörende Komponente ψ(p) von ψ(x) in Form des Skalarpro dukts (v p, ψ); die Gesamtheit dieser zu den verschiedenen p gehörenden Komponen ten bilden eine Funktion ψ(p), die Fourier-Transformierte von ψ(x).⁴ ψ(p) ist demnach das Analogon zu c i . Diese beiden, von p bzw. i abhängenden komplexen Zahlen sind die Komponenten derselben Funktion ψ(x) in Bezug auf die beiden verschiedenen Ba sen {v p (x)} und {u i (x)}. Dies wird auch deutlich, wenn man das Quadrat der Norm von ψ(x) bildet. Nach der Parsevalschen Gleichung [s. Anhang I, Gl. (45)] ist nämlich +∞
(ψ, ψ) = ∫ dp |ψ(p)|2
(A-38)
−∞
was Gl. (A-27) entspricht, wenn man dort die c i durch ψ(p) und die Summation über i durch eine Integration über p ersetzt. Wir zeigen weiter, dass die v p (x) einer Vollständigkeitsrelation genügen. Unter Verwendung der Beziehung +∞
1 ∫ dk eiku = δ(u) 2π
(A-39)
−∞
s. Anhang II, Gl. (34), findet man +∞
∫ dp v p (x) v∗p (x ) = −∞
1 dp i p (x−x) = δ(x − x ) ∫ eℏ 2π ℏ
(A-40)
Diese Gleichung ist das Analogon zu Gl. (A-32), wobei wiederum die Summation über i durch die Integration über p zu ersetzen ist. 4 Wir hatten das Skalarprodukt nur für zwei quadratintegrable Funktionen erklärt, doch kann man die Definition ohne Schwierigkeit auf den hier vorliegenden Fall erweitern, falls nur das entsprechen de Integral konvergiert.
94 | II Der mathematische Rahmen Schließlich berechnen wir das Skalarprodukt (v p , v p ). Mit Gl. (A-39) erhalten wir =∞
(v p , v p ) = ∫ dp v∗p (x) v p (x) −∞
und somit (v p , v p ) =
1 dx i x (p −p) = δ(p − p ) ∫ eℏ 2π ℏ
(A-41)
Vergleichen wir dies mit Gl. (A-18): Statt der beiden diskreten Indizes i und j und dem Kronecker-Symbol δ ij haben wir jetzt die beiden kontinuierlichen Indizes p und p und die von der Differenz dieser Indizes abhängende Deltafunktion δ(p − p ). Wir stel len fest, dass für p = p das Skalarprodukt (v p , v p ) divergiert; v p (x) liegt nicht in Fx . Trotzdem spricht man bei Gl. (A-41) von einer „Orthonormierungsbedingung“. Manch mal drückt man dies so aus, dass die v p (x) im „Diracschen Sinne“ orthonormiert sind. Die Verallgemeinerung auf drei Dimensionen bietet keine Schwierigkeiten. Wir betrachten die ebenen Wellen 1 3/2 ip⋅r/ℏ (A-42) ) e 2πℏ Die Basisfunktionen hängen nun von den drei kontinuierlichen Indizes p x , p y und p z ab. Es ergeben sich die folgenden Beziehungen: vp (r) = (
ψ(r) = ∫ d3 p ψ(p) vp (r)
(A-43)
ψ(p) = (vp , ψ) = ∫ d3 r v∗p (r) ψ(r)
(A-44)
(φ, ψ) = ∫ d3 p φ∗ (p) ψ(p) ∫ d3 p vp (r) v∗p (r ) = δ(r − r ) (vp , vp ) = δ(p − p )
(A-45) (A-46) (A-47)
die die Gleichungen (A-36), (A-37), (A-38), (A-40) und (A-41) verallgemeinern. Wir können also die vp (r) als die Elemente einer „kontinuierlichen Basis“ auffassen. Dabei gelten sämtliche Zusammenhänge, die wir für die diskrete Basis {u i (r)} gefunden haben, auch für eine kontinuierliche Basis, falls wir die in Schema 1 gege benen Ersetzungsregeln beachten. Schema 1 i ←→ p ∑ ←→ ∫ d3 p i
δ ij ←→ δ(p − p )
A Der Raum der Wellenfunktionen eines Teilchens |
95
A-3-b δ-Funktionen Als Beispiel für eine Funktionenmenge, die durch den kontinuierlichen Index r0 ({x0 , y0 , z0 }) gekennzeichnet ist, wählen wir die Menge mit den Elementen ξr0 (r) = δ(r − r0 )
(A-48)
{ξr0 (r)} sind also die um die Punkte r0 zentrierten δ-Funktionen. Offensichtlich sind die ξr0 (r) nicht quadratisch integrierbar, gehören also nicht zu F . Betrachten wir nun die für jede Funktion ψ(r) ∈ F geltenden Beziehungen ψ(r) = ∫ d3 r0 ψ(r0 ) δ(r − r0 ) ψ(r0 ) = ∫ d3 r δ(r0 − r) ψ(r)
(A-49) (A-50)
so können wir sie mit Gl. (A-48) auf die Form ψ(r) = ∫ d3 r0 ψ(r0 ) ξr0 (r) ψ(r0 ) = (ξr0 , ψ) = ∫ d3 r ξr∗0 (r) ψ(r)
(A-51) (A-52)
bringen. Gleichung (A-51) besagt, dass jede Funktion ψ(r) ∈ F eindeutig nach den ξr0 (r) entwickelt werden kann. Nach Gl. (A-52) ist die zu ξr0 (r) gehörende Komponen te von ψ(r) gerade der Wert von ψ an der Stelle r0 . Gleichung (A-51) und Gl. (A-52) entsprechen Gl. (A-19) bzw. Gl. (A-21), wenn man den diskreten Index i durch das kon tinuierliche Indextripel r0 und die Summation über i durch die Integration über r0 ersetzt. ψ(r0 ) ist daher das Äquivalent zu c i : Beide komplexen Zahlen stellen die Kompo nenten derselben Funktion ψ(r) in den verschiedenen Basen {ξr0 (r)} und {u i (r)} dar. Weiter haben wir statt Gl. (A-26) hier (φ, ψ) = ∫ d3 r0 φ∗ (r0 ) ψ(r0 )
(A-53)
Danach ist die Definition (A-4) des Skalarprodukts einfach die Anwendung von Gl. (A-26) auf den Fall der kontinuierlichen Basis {ξr0 (r)}. Schließlich stellen wir fest, dass die ξr0 (r) „Orthonormierungsbedingungen“ und einer Vollständigkeitsrelation genügen, wie wir sie für die vp (r) angegeben haben. Es ist nämlich [s. Anhang II, Gl. (28)] ∫ d3 r0 ξr0 (r) ξr∗0 (r ) = ∫ d3 r0 δ(r − r0 ) δ(r − r0 ) = δ(r − r )
(A-54)
96 | II Der mathematische Rahmen
und (ξr0 , ξr0 ) = ∫ d3 r δ(r − r0 ) δ(r − r0 ) = δ(r0 − r0 )
(A-55)
Damit können sämtliche Zusammenhänge, die wir für eine diskrete Basis ange schrieben haben, auf eine kontinuierliche Basis verallgemeinert werden, wenn wir dabei die in Schema 2 gegebenen Ersetzungsvorschriften beachten. Schema 2 i ←→ r0 ∑ ←→ ∫ d3 r 0 i
δ ij ←→ δ(r0 − r0 )
Wichtige Bemerkung: Die Zweckmäßigkeit der Einführung kontinuierlicher Basen werden wir erst bei unseren weiteren Überlegungen erkennen. In keinem Fall darf man jedoch aus dem Auge verlieren, dass zu einem physikalischen Zustand stets eine quadratintegrable Wellenfunktion gehört. Weder vp (r) noch ξ r0 (r) können den Zustand eines Teilchens repräsentieren. Sie sind nichts weiter als sehr zweck mäßige Hilfsmittel für die Rechnungen, die man in Zusammenhang mit der Wellenfunktion ψ(r) durchführen muss, und nur diese beschreibt einen physikalischen Zustand. Eine analoge Situation tritt in der klassischen Optik auf, in der die ebene, monochromatische Welle eine sehr bequeme mathematische Idealisierung darstellt, die physikalisch nie realisiert werden kann: Selbst die feinsten Filter passiert ein Frequenzband mit einer zwar sehr kleinen, aber grundsätzlich von null verschiedenen Breite ∆ν. Entsprechendes gilt für die Funktionen ξ r0 (r). Man kann sich eine quadratisch integrierbare, um die Stelle r0 lokalisierte Wellenfunktion, z. B. (ε)
ξ r0 (r) = δ (ε) (r − r0 ) = δ (ε) (x − x 0 ) δ (ε) (y − y0 ) δ (ε) (z − z 0 ) denken, bei der die δ (ε) Funktionen mit einem um x 0 , y0 bzw. z 0 zentrierten Maximum der Breite ε +∞ und der Höhe 1/ε sind, so dass ∫−∞ δ (ε) (x − x 0 ) dx = 1 ist (s. Anhang II, § 1-b). Für ε → 0 (ε)
geht ξ r0 (r) gegen die nicht quadratisch integrierbare Funktion ξ r0 (r). Es ist unmöglich, einen derartigen Zustand zu realisieren: Wie genau man auch ein Teilchen lokalisiert, stets ist ε von null verschieden.
A-3-c Verallgemeinerung: „Orthonormierte“ kontinuierliche Basen α Definition Wir verallgemeinern unsere Ergebnisse und nennen eine durch den kontinuierlichen Index α gekennzeichnete Menge von Funktionen {w α (r)} eine „orthonormierte“ konti nuierliche Basis, wenn sie den Orthonormierungsbedingungen (w α , w α ) = ∫ d3 r w∗α (r) w α (r) = δ(α − α )
(A-56)
A Der Raum der Wellenfunktionen eines Teilchens | 97
und der Vollständigkeitsrelation ∫ dα w α (r) w∗α (r ) = δ(r − r )
(A-57)
genügt. Bemerkungen: 1. Ist α = α , so divergiert (w α , w α ). Also gehört w α (r) nicht zu F . 2. α kann eine Zusammenfassung mehrerer Indizes sein, wie es bei r0 und p in den vorstehenden Beispielen der Fall ist. 3. Man kann sich Basen denken, die sowohl aus Funktionen u i (r), die durch einen diskreten Index gekennzeichnet sind, als auch aus Funktionen w α (r) mit einem kontinuierlichen Index be stehen. In diesem Fall bilden die u i (r) für sich keine Basis, sondern man muss stets die Menge der w α (r) hinzunehmen. Als Beispiel hierfür nennen wir den Fall des rechteckigen Potentialtopfes, der in Kap. I, § D-2-c und in Ergänzung HI behandelt wurde. Weiter unten werden wir sehen, dass die Gesamtheit der stationären Zustände eines Teilchens in einem zeitunabhängigen Potential eine Basis bildet. Für E < 0 haben wir diskrete Energieniveaus, für die die zugehörigen quadratintegrablen Wellenfunk tionen durch einen diskreten Index gekennzeichnet sind. Sie sind jedoch nicht die einzig mög lichen stationären Zustände. Gleichung (D-17) aus Kapitel I erlaubt für jedes E > 0 beschränkte Lösungen, die sich über den gesamten Raum erstrecken und nicht quadratisch integrierbar sind. In einem solchen Fall liegt eine „gemischte Basis“ {u i (r), w α (r)} vor, für die die Orthonormie rungsbedingungen (u i , u j ) = δ ij (w α , w α ) = δ(α − α )
(A-58)
(u i , w α ) = 0 lauten, während als Vollständigkeitsrelation ∑ u i (r) u ∗i (r ) + ∫ dα w α (r) w ∗α (r ) = δ(r − r )
(A-59)
i
anzuschreiben ist.
β Komponenten einer Wellenfunktion ψ(r) Stets gilt, dass ψ(r) = ∫ d3 r ψ(r ) δ(r − r )
(A-60)
ist. Setzt man hier den durch Gl. (A-57) gegebenen Ausdruck für δ(r − r ) ein und setzt voraus, dass die Integrationen über r und α vertauscht werden können, so erhält man ψ(r) = ∫ dα [∫ d3 r w∗α (r )ψ(r )] w α (r)
(A-61)
98 | II Der mathematische Rahmen
Dies können wir in der Form ψ(r) = ∫ dα c(α) w α (r)
(A-62)
c(α) = (w α , ψ) = ∫ d3 r w∗α (r ) ψ(r )
(A-63)
mit
schreiben. Die Wellenfunktion ψ(r) kann also auf genau eine Weise nach den w α (r) entwickelt werden, wobei die Komponente c(α) in Bezug auf w α (r) gleich dem Skalar produkt (w α , ψ) ist. γ Skalarprodukt und Norm Kennt man von den beiden quadratintegrablen Funktionen φ(r) und ψ(r) ihre Kom ponenten in Bezug auf die Basis {w α (r)}: φ(r) = ∫ dα b(α) w α (r)
(A-64)
ψ(r) = ∫ dα c(α ) w α (r)
(A-65)
so erhält man für ihr Skalarprodukt: (φ, ψ) = ∫ d3 r φ∗ (r) ψ(r) = ∫ dα ∫ dα b ∗ (α)c(α ) ∫ d3 r w∗α (r) w α (r)
(A-66)
Berücksichtigt man für das rechte Integral (A-56), so wird (φ, ψ) = ∫ dα ∫ dα b ∗ (α) c(α ) δ(α − α ) d. h. (φ, ψ) = ∫ dα b ∗ (α) c(α)
(A-67)
Insbesondere ist (ψ, ψ) = ∫ dα |c(α)|2
(A-68)
B Zustandsraum und Dirac-Schreibweise | 99
Alle Beziehungen aus § A-2 können demnach verallgemeinert werden, wenn man nur die in Schema 3 gegebenen Ersetzungsregeln beachtet. Schema 3 i ←→ α ∑ ←→ ∫ dα i
δ ij ←→ δ(α − α )
Die wichtigsten Zusammenhänge sind in Schema 4 zusammengefasst, obwohl wir sie uns in dieser Form nicht zu merken brauchen, weil wir sie nach Einführung der DiracSchreibweise viel einfacher ausdrücken können. Schema 4 Diskrete Basis {u i (r)}
Kontinuierliche Basis {w α (r)}
Orthonormierungs bedingungen
(u i , u j ) = δ ij
(w α , w α ) = δ(α − α )
Vollständigkeits relation
∑ u i (r)u ∗i (r ) = δ(r − r )
∫ dα w α (r)w ∗α (r ) = δ(r − r )
Entwicklung
ψ(r) = ∑ c i u i (r)
i
ψ(r) = ∫ dα c(α)w α (r)
i
c i = (u i , ψ) Komponenten
Skalarprodukt
3
= ∫d r
c(α) = (w α , ψ)
u ∗i (r)ψ(r)
(φ, ψ) = ∑ b ∗i c i
= ∫ d3 r w ∗α (r)ψ(r) (φ, ψ) = ∫ dα b ∗ (α)c(α)
i
Normquadrat
(ψ, ψ) = ∑ |c i |2
(ψ, ψ) = ∫ dα |c(α)|2
i
B Zustandsraum und Dirac-Schreibweise B-1 Einführung In Kapitel I formulierten wir das Postulat: Der quantenmechanische Zustand eines Teilchens zu einem bestimmten Zeitpunkt ist durch eine Wellenfunktion ψ(r) gege ben. Die Wahrscheinlichkeitsdeutung dieser Funktion erfordert, dass ihr Betragsqua drat integrierbar ist. So gelangten wir im vorhergehenden Abschnitt zum Funktionen
100 | II Der mathematische Rahmen
Schema 5 Basis
Komponenten von ψ(r)
u i (r)
c i , i = 1, 2, . . .
vp (r)
ψ(p)
ξ r0 (r)
ψ(r0 )
w α (r)
c(α)
raum F . Dabei fanden wir insbesondere, dass ein und dieselbe Funktion ψ(r) nach verschiedenen Basen entwickelt werden kann, s. Schema 5. Man kann dieses Ergeb nis in der Weise interpretieren, dass die Angabe der Komponenten {c i }, ψ(p) oder c(α) nach Wahl der jeweiligen Basis den Zustand eines Teilchens genauso gut charakteri siert wie die Funktion ψ(r) selbst. Übrigens tritt auch ψ(r) in dem Schema auf: Der Wert ψ(r0 ), den die Wellenfunktion im Punkt r0 annimmt, kann als die Komponente dieser Funktion in der Entwicklung nach den Basisfunktionen ξr0 (r) aufgefasst wer den, s. Gl. (A-48). Wir befinden uns damit in einer Situation, wie wir sie analog auch beim gewöhn lichen dreidimensionalen Raum kennen: Im R3 wird die Lage eines Punktes durch seine drei Koordinaten in Bezug auf ein vorher festgelegtes System gekennzeichnet; wechselt man dieses System, so gehört zum selben Raumpunkt ein anderes Koordina tentripel. Durch den Vektorbegriff befreit man sich vom Bezug auf das jeweilige Sys tem und erreicht so eine beträchtliche Vereinfachung und Durchsichtigkeit bei der Beschreibung der geometrischen Zusammenhänge. In diesem Sinne werden wir auch den quantenmechanischen Zustand eines Teil chens durch einen Zustandsvektor in einem abstrakten Zustandsraum Hr charakteri sieren. Aus der Tatsache, dass der Raum F ein Unterraum von L2 ist, folgt, dass Hr der Unterraum eines Hilbert-Raumes sein muss. Im Folgenden werden wir die zuge hörigen Begriffe und Zusammenhänge vorstellen. Nun ermöglicht die Einführung von Zustandsvektoren und des Zustandsraumes nicht nur eine Vereinfachung des Formalismus, sondern auch seine Verallgemeine rung. Es gibt nämlich physikalische Systeme, die man quantenmechanisch nicht be schreiben kann, indem man von einer einzigen Wellenfunktion ausgeht. Wir werden dies sehen, wenn wir in den Kapiteln IV und IX bei der Behandlung eines Teilchens seinen Spin berücksichtigen wollen. Aus diesem Grunde werden wir in Kapitel III als erstes Postulat formulieren: Der quantenmechanische Zustand eines beliebigen phy sikalischen Systems wird durch einen Zustandsvektor beschrieben, der zum Zustands raum H des Systems gehört. Hier entwickeln wir den Vektorkalkül in H. Die Begriffe und Aussagen gelten für jedes System, doch werden wir nur den einfachen Fall eines Teilchens (ohne Spin) betrachten. Wir führen zunächst die Dirac-Schreibweise ein, die sich bei den formalen Überlegungen als besonders zweckmäßig und bequem erweist.
B Zustandsraum und Dirac-Schreibweise | 101
B-2 Ket- und Bravektoren B-2-a Die Elemente von H α Notation Ein beliebiges Element oder einen beliebigen Vektor des Raumes H nennen wir Ket vektor oder einfach Ket. Wir bezeichnen ihn durch das Symbol | ⟩, in das wir ein be stimmtes Zeichen oder eine Zeichenfolge einsetzen, um den Ket von anderen Kets un terscheiden zu können; so schreiben wir z. B. |ψ⟩. Um den Zusammenhang mit dem uns inzwischen vertrauten Begriff der Wellen funktion herzustellen, definieren wir den Zustandsraum Hr eines Teilchens, indem wir jeder quadratisch integrierbaren Funktion ψ(r) einen Ketvektor |ψ⟩ ∈ Hr zuord nen: ψ(r) ∈ F
⇐⇒
|ψ⟩ ∈ Hr
(B-1)
Im Weiteren übertragen wir die verschiedenen Operationen, die wir für den Funktio nenraum F kennengelernt haben, auf den Zustandsraum Hr . Wir unterscheiden diese beiden Räume sorgfältig, obwohl sie zueinander isomorph sind. Wir halten fest, dass in |ψ⟩ keine Abhängigkeit von r angegeben ist, also nur der Buchstabe ψ auftritt. Die zugehörige Funktion ψ(r) wird in § E als die Gesamtheit der Komponenten des Kets |ψ⟩ in Bezug auf eine spezielle Basis interpretiert. Der Vektor r spielt dabei die Rolle eines kontinuierlichen Index, s. § A-3-b und Schema 5. In entsprechender Weise wollen wir im Folgenden vorgehen: Wir führen einen Vektor ein, indem wir zunächst seine Kom ponenten in Bezug auf ein spezielles Achsensystem angeben, um dann von diesem Bezug wie von dem auf die anderen möglichen Systeme abzusehen. Mit Hx bezeichnen wir den Zustandsraum eines Teilchens (ohne Spin) im eindi mensionalen Fall, bei dem die zugehörige Wellenfunktion nur von der Veränderlichen x abhängt. β Skalarprodukt Zwei Kets |φ⟩ und |ψ⟩ ordnet man (in dieser Reihenfolge) eine komplexe Zahl, ihr Ska larprodukt (|φ⟩, |ψ⟩), mit den Eigenschaften (A-5) bis (A-7) zu. Nach Einführung des Begriffs des „Bra“-Vektors werden wir diese Beziehungen in die Dirac-Notation um schreiben. Im Raum Hr stimmt das Skalarprodukt zweier Kets mit dem Skalarprodukt der zugehörigen Wellenfunktionen überein, wie wir es weiter oben definiert haben. B-2-b Die Elemente des dualen Raumes H∗ α Definition des dualen Raumes H∗ Ein lineares Funktional χ über dem Raum H ist eine lineare Operation, die jedem Ket |ψ⟩ eine komplexe Zahl zuordnet: χ
|ψ⟩ ∈ H → Zahl χ(|ψ⟩) χ(λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩) = λ1 χ(|ψ1 ⟩) + λ2 χ(|ψ2 ⟩)
(B-2)
102 | II Der mathematische Rahmen
Man verwechsle ein lineares Funktional nicht mit einem linearen Operator. Zwar handelt es sich in beiden Fällen um eine lineare Operation. Während aber beim Funk tional jedem Ket eine komplexe Zahl zugeordnet wird, ist dies bei einem Operator je weils ein Ket. Es kann gezeigt werden, dass die Gesamtheit der auf den Kets |ψ⟩ ∈ H definierten linearen Funktionale einen Vektorraum, den zu H dualen Raum, bildet. Man bezeich net ihn mit H∗ . β Bravektoren Ein beliebiger Vektor aus dem Raum H∗ heißt Bravektor oder einfach Bra. Man sym bolisiert ihn durch ⟨ |. So bezeichnet z. B. der Bra ⟨χ| das lineare Funktional χ, und wir verstehen von nun an unter ⟨χ|ψ⟩ die Zahl, die man erhält, wenn man das lineare Funktional ⟨χ| ∈ H∗ auf den Ket |ψ⟩ ∈ H anwendet: χ(|ψ⟩) = ⟨χ|ψ⟩
(B-3)
Die Bezeichnungen „Bra“ und „Ket“ rühren vom angelsächsischen bracket für Klammer her. Der linke Teil der Klammer entspricht dem Bra, der rechte dem Ket. B-2-c Zusammenhang zwischen Kets und Bras α Jedem Ket entspricht ein Bra Aufgrund der Existenz eines Skalarprodukts im Raum H können wir nun zeigen, dass man jedem Ket |φ⟩ ∈ H ein Element aus H∗ , also einen Bra, zuordnen kann; wir be zeichnen ihn mit ⟨φ|. Man kann nämlich mit jedem Ket |φ⟩ ein lineares Funktional definieren, indem man dem Ket |ψ⟩ ∈ H (linear) durch das Skalarprodukt (|φ⟩, |ψ⟩) eine komplexe Zahl zuordnet. Nennen wir dieses Funktional ⟨φ|, so ist es also durch die Beziehung ⟨φ| ψ⟩ = (|φ⟩, |ψ⟩)
(B-4)
definiert. β Der Zusammenhang ist antilinear Das Skalarprodukt ist im Raum H in Bezug auf den vorderen Faktor antilinear. Wegen (λ1 |φ1 ⟩ + λ2 |φ2 ⟩, |ψ⟩) = λ∗1 (|φ1 ⟩, |ψ⟩) + λ∗2 (|φ2 ⟩, |ψ⟩) = λ∗1 ⟨φ1 |ψ⟩ + λ∗2 ⟨φ2 |ψ⟩ = (λ∗1 ⟨φ1 | + λ∗2 ⟨φ2 |)|ψ⟩
(B-5)
ist dem Ket λ1 |φ1 ⟩ + λ2 |φ2 ⟩ der Bra λ∗1 ⟨φ1 | + λ∗2 ⟨φ2 | zugeordnet: λ1 |φ1 ⟩ + λ2 |φ2 ⟩ ⇒ λ∗1 ⟨φ1 | + λ∗2 ⟨φ2 |
(B-6)
B Zustandsraum und Dirac-Schreibweise |
103
Bemerkung: Ist λ eine komplexe Zahl und |ψ⟩ ein Ket, so ist auch λ|ψ⟩ ein Ket (denn H ist ein Vektorraum). Man schreibt darum auch |λψ⟩ = λ|ψ⟩
(B-7)
Dann stellt ⟨λψ| den zum Ket |λψ⟩ gehörenden Bra dar. Weil der Zusammenhang zwischen Ket und Bra antilinear ist, gilt ⟨λψ| = λ ∗ ⟨ψ|
(B-8)
γ Dirac-Schreibweise für das Skalarprodukt Für das Skalarprodukt von |ψ⟩ mit |φ⟩ verfügen wir jetzt über zwei verschiedene Schreibweisen, nämlich (|φ⟩, |ψ⟩) oder ⟨φ|ψ⟩, wobei ⟨φ| der zum Ket |φ⟩ gehören de Bravektor ist. Von nun an verwenden wir nur noch die auf Dirac zurückgehende Schreibweise ⟨φ|ψ⟩. In ihr lauten die bereits in den Gleichungen (A-5) bis (A-7) ange gebenen Eigenschaften: ⟨φ|ψ⟩ = ⟨ψ|φ⟩∗ ,
(B-9)
⟨φ|λ1 ψ1 + λ2 ψ2 ⟩ = λ1 ⟨φ|ψ1 ⟩ + λ2 ⟨φ|ψ2 ⟩ ⟨λ1 φ1 + λ2 φ2 |ψ⟩ = ⟨ψ|ψ⟩
λ∗1 ⟨φ1 |ψ⟩
+
λ∗2 ⟨φ2 |ψ⟩
reell, positiv und null genau dann, wenn |ψ⟩ = 0
(B-10) (B-11) (B-12)
δ Gibt es zu jedem Bra einen Ket? Zu jedem Ketvektor gibt es einen Bravektor. An zwei Beispielen zeigen wir, dass es umgekehrt Bravektoren geben kann, zu denen kein Ket gehört. 1. Beispiele Der Einfachheit halber beschränken wir uns auf den eindimensionalen Fall. Es sei +∞ (ε) (ε) ξ x0 (x) eine hinreichend reguläre Funktion, für die ∫−∞ dx ξ x0 (x) = 1 ist, und die an der Stelle x = x0 ein Maximum mit der Breite ε und der Höhe 1/ε aufweist, s. Abb. 1 (ε) und Anhang II, § 1-b. Ist ε ≠ 0, so gehört ξ x0 (x) zu Fx (das Normquadrat ist von der (ε) Größenordnung 1/ε). Mit |ξ x0 ⟩ bezeichnen wir den zugehörigen Ketvektor: (ε)
(ε)
ξ x0 (x) ⇐⇒ |ξ x0 ⟩
(B-13)
(ε)
Abb. 1: ξ x0 (x) ist eine Funktion, die an der Stelle x = x0 ein Maximum mit der Breite ε und der Höhe 1/ε aufweist und deren Integral über die gesamte x-Achse gleich eins ist.
104 | II Der mathematische Rahmen (ε)
(ε)
Für ε ≠ 0 gilt |ξ x0 ⟩ ∈ Hx . Es sei ⟨ξ x0 | der zu diesem Ket gehörende Bravektor. Für jedes |ψ⟩ ∈ Hx hat man +∞ (ε)
(ε)
(ε)
⟨ξ x0 |ψ⟩ = (ξ x0 , ψ) = ∫ dx ξ x0 (x) ψ(x)
(B-14)
−∞
Lassen wir jetzt ε gegen null gehen, so ist einerseits (ε)
lim ξ x0 (x) = ξ x0 (x) ∈ ̸ Fx
(B-15)
ε→0
(ε)
denn ξ x0 (x) ist von der Ordnung 1/ε, so dass das Normquadrat für ε → 0 divergiert: (ε)
lim |ξ x0 (x)⟩ ∈ ̸ Hx
(B-16)
ε→0
Andererseits strebt das Integral in Gl. (B-14) für ε → 0 gegen den endlichen Wert ψ(x0 ), weil man ψ(x) für hinreichend kleine ε durch ψ(x0 ) ersetzen und vor das Inte (ε) gral ziehen kann. Folglich geht ⟨ξ x0 | gegen einen bestimmten Bra, den wir mit ⟨ξ x0 | kennzeichnen: Er ist das lineare Funktional, das jedem Ket |ψ⟩ ∈ Hx den Wert ψ(x0 ) zuordnet: (ε)
lim ⟨ξ x0 | = ⟨ξ x0 | ∈ H∗x
ε→0
für |ψ⟩ ∈ Hx
(B-17)
ist ⟨ξ x0 |ψ⟩ = ψ(x0 )
Wir sehen also, dass der Bravektor ⟨ξ x0 | existiert, ohne dass ihm ein Ket entspricht. In einem zweiten Beispiel betrachten wir eine endliche ebene Welle, für die inner halb eines Intervalls der Breite L 1 eip0 x/ℏ √2πℏ
(L)
v p0 (x) =
für
−
L L ≤x≤+ 2 2
(B-18)
gilt, während sie außerhalb dieses Intervalls (stetig und differenzierbar) rasch gegen (L) null geht. Den zugehörigen Ket bezeichnen wir mit |v p0 ⟩: (L)
v p0 (x) ∈ Fx
⇐⇒
(L)
|v p0 ⟩ ∈ Hx
(B-19)
(L)
Das Quadrat der Norm von v p0 ist von der Größenordnung L/2πℏ und divergiert für L → ∞. Also gilt (L)
lim |v p0 ⟩ ∈ ̸ Hx
(B-20)
L→∞
(L)
(L)
Für den zu |v p0 ⟩ gehörenden Bra ⟨v p0 | haben wir dagegen +L/2
(L)
(L)
⟨v p0 |ψ⟩ = (v p0 , ψ) ≈ √
1 ∫ dx e−ip0 x/ℏ ψ(x) , 2πℏ −L/2
|ψ⟩ ∈ Hx
(B-21)
B Zustandsraum und Dirac-Schreibweise | 105
Hier existiert der Grenzwert für L → ∞: Er ist gleich dem Wert ψ(p0 ) der Fourier(L) Transformierten ψ(p) von ψ(x) an der Stelle p = p0 . Also strebt ⟨v p0 | für L → ∞ gegen einen bestimmten Bravektor ⟨v p0 |: (L)
lim ⟨v p0 | = ⟨v p0 | ∈ H∗x
L→∞
für |ψ⟩ ∈ Hx
ist
(B-22)
⟨v p0 |ψ⟩ = ψ(p0 )
Wiederum entspricht dem Bra ⟨v p0 | kein Ket. 2. Physikalische Deutung Wie hier an zwei Beispielen gezeigt wurde, hat die Asymmetrie im Zusammenhang von Kets und Bras ihre Ursache in der Existenz „kontinuierlicher“ Basen im Funktionen raum Fx : Die Elemente dieser Basen gehören nicht zu Fx , und man kann ihnen keinen Ketvektor aus dem Zustandsraum Hx zuordnen. Weil aber ihr Skalarprodukt mit einer beliebigen Funktion aus Fx definiert ist, kann man ihnen ein lineares Funktional in Hx , d. h. einen Bravektor im dualen Raum H∗x zuweisen. Derartige „kontinuierliche Basen“ verwendet man, weil sie für praktische Rechnungen sehr bequem sind. Aus demselben Grund stellt man durch die Einführung „verallgemeinerter Ketvektoren“ die Symmetrie zwischen Kets und Bras her, indem man von nicht quadratisch inte grierbaren Funktionen ausgeht, für die jedoch das Skalarprodukt für jede Funktion aus Fx existiert. Wir werden darum im folgenden mit „Kets“ wie |ξ x0 ⟩ oder |v p0 ⟩ ar beiten, die zu ξ x0 (x) bzw. v p0 (x) gehören. Wir dürfen aber nicht vergessen, dass diese verallgemeinerten „Kets“ in Strenge keinem physikalischen Zustand entsprechen. Sie sind lediglich rechnerische Hilfsmittel für bestimmte Operationen, die mit den tat sächlichen Kets aus dem Raum Hx durchzuführen sind; nur diese charakterisieren realisierbare Quantenzustände. Bei Verwendung der uneigentlichen Kets ergeben sich eine Reihe von mathema tischen Problemen, die man durch die folgende physikalische Überlegung umgehen (ε) (L) kann: Die Ketvektoren |ξ x0 ⟩ bzw. |vp0 ⟩ kennzeichnen letztlich die Kets |ξ x0 ⟩ bzw. |vp0 ⟩, bei denen ε eine sehr kleine Länge (bzw. L eine sehr große Länge) in Bezug auf sämt liche Entfernungen bedeutet, die bei dem zu behandelnden Problem eine Rolle spie (ε) (L) len. Bei allen Zwischenrechnungen, in denen |ξ x0 ⟩ bzw. |vp0 ⟩ auftreten, geht man niemals zur Grenze ε → 0 bzw. L → ∞ über, so dass man stets im Raum Hx arbeitet. Das physikalische Ergebnis, das man schließlich am Ende der Rechnungen erhält, ist hinsichtlich des Wertes von ε wenig empfindlich, wenn dieser nur gegenüber allen anderen Längen hinreichend klein ist. Darum darf man ε einfach gleich null setzen; eine entsprechende Überlegung gilt für L. (ε) (L) Nun könnte man einwenden, die Funktionenmengen {ξ x0 (x)} und {vp0 (x)} bilde ten im Gegensatz zu {ξ x0 (x)} und {vp0 (x)} keine Basen in Fx , weil sie der Vollständig keitsrelation nicht in Strenge, sondern nur näherungsweise genügen. Zum Beispiel ist (ε) (ε) der Ausdruck ∫ dx0 ξ x0 (x)ξ x0 (x ) eine Funktion von (x − x ), die die Deltafunktion δ(x − x ) dann ausgezeichnet approximiert, wenn ε genügend klein ist: Ihr Graph ist praktisch ein Dreieck mit der Basis 2ε und der Höhe 1/ε, das um die Stelle x − x = 0
106 | II Der mathematische Rahmen
konzentriert ist, s. Anhang II, § 1-c. Ist darum ε gegenüber den anderen auftretenden Längen des jeweiligen Problems vernachlässigbar, so kann man den Unterschied zu δ(x − x ) im physikalischen Sinne vernachlässigen. Allgemein ist der zu H duale Raum H∗ nur dann zu ihm isomorph, wenn er end lichdimensional ist:⁵ Wenn zu jedem Ket |ψ⟩ ∈ H ein Bravektor ⟨ψ| ∈ H∗ gehört, so gilt das Umgekehrte nicht. Wir werden dennoch außer den zu H gehörenden Vekto ren (mit endlicher Norm) verallgemeinerte Kets mit unendlicher Norm verwenden, für die jedoch das Skalarprodukt mit jedem Ket aus H endlich ist. Dann gehört zu jedem Bra ⟨ψ| ∈ H∗ ein Ket. Wir betonen aber noch einmal, dass die verallgemeinerten Kets keine physikalischen Zustände des Systems repräsentieren.
B-3 Lineare Operatoren B-3-a Definitionen Die Definitionen sind die gleichen wie die in § A-1-c. Ein linearer Operator ordnet jedem |ψ⟩ ∈ H einen Ket |ψ ⟩ ∈ H so zu, dass der Zusammenhang linear ist: |ψ ⟩ = A|ψ⟩
(B-23)
A(λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩) = λ1 A|ψ1 ⟩ + λ2 A|ψ2 ⟩
(B-24)
Das Produkt zweier linearer Operatoren A und B, das wir mit AB bezeichnen, ist defi niert durch die Gleichung (AB)|ψ⟩ = A(B|ψ⟩)
(B-25)
Zunächst wirkt also B auf |ψ⟩ und liefert den Ket B|ψ⟩; danach wirkt A auf B|ψ⟩. Im Allgemeinen ist AB ≠ BA. Unter dem Kommutator verstehen wir die Differenz [A, B] = AB − BA
(B-26)
Sind |φ⟩ und |ψ⟩ zwei Kets, so nennen wir das Skalarprodukt ⟨φ| (A|ψ⟩) = ⟨φ|A|ψ⟩
(B-27)
das Matrixelement von A zwischen |φ⟩ und |ψ⟩. Es ist also eine Zahl, die linear von |ψ⟩ und antilinear von |φ⟩ abhängt. B-3-b Projektoren α Wichtige Bemerkung zur Dirac-Schreibweise Die Einfachheit und Zweckmäßigkeit des Diracschen Formalismus ist offensichtlich. Der Bra ⟨φ| bezeichnet ein lineares Funktional und ⟨ψ1 |ψ2 ⟩ das Skalarprodukt der 5 Wir wissen, dass der zum Hilbert-Raum L2 duale Raum zu ihm isomorph ist, doch ist der von uns eingeführte Raum F der Wellenfunktionen ein Unterraum von L2 . Dies erklärt, warum F ∗ „viel grö ßer“ als F ist.
B Zustandsraum und Dirac-Schreibweise |
107
beiden Kets |ψ1 ⟩ und |ψ2 ⟩. Die Zahl, die das lineare Funktional ⟨φ| einem beliebi gen Ket |ψ⟩ zuordnet, drückt man dann einfach durch das Nebeneinanderstellen der Symbole ⟨φ| und |ψ⟩, also durch ⟨φ|ψ⟩ aus. Sie ist demnach das Skalarprodukt von |ψ⟩ mit dem zu ⟨φ| gehörenden Ket |φ⟩ (hierin liegt übrigens das Interesse an einem umkehrbar eindeutigen Zusammenhang zwischen Kets und Bras). Wir nehmen nun an, dass wir ⟨φ| und |ψ⟩ in der umgekehrten Reihenfolge schrei ben: |ψ⟩⟨φ|
(B-28)
Wenn wir uns an die Regel des Aneinandersetzens der Symbole halten, stellt dieser Ausdruck einen Operator dar. Betrachten wir nämlich |ψ⟩⟨φ|χ⟩
(B-29)
wobei |χ⟩ ein weiterer beliebiger Ket ist, so wissen wir bereits, dass ⟨φ|χ⟩ eine komple xe Zahl ist. Folglich bezeichnet Gl. (B-29) einen Ket, den man erhält, indem man |ψ⟩ mit dem Skalar ⟨φ|χ⟩ multipliziert. Die Anwendung von |ψ⟩⟨φ| auf einen Ket führt zu einem anderen Ket und stellt deshalb einen Operator dar. Die Reihenfolge der Symbole ist also wesentlich. Nur komplexe Zahlen dürfen ih ren Platz wechseln, ohne dass sich etwas ändert. Dies hat seinen Grund in der Linea rität des Raumes H und der Verwendung von ausschließlich linearen Operatoren. Mit einer Zahl λ gilt |ψ⟩ λ = λ |ψ⟩ { { { { { { ⟨ψ| λ = λ ⟨ψ| { { Aλ |ψ⟩ = λA |ψ⟩ (wobei A ein linearer Operator ist) { { { { {⟨φ|λ|ψ⟩ = λ⟨φ|ψ⟩ = ⟨φ|ψ⟩λ
(B-30)
Bei Kets, Bras und Operatoren muss dagegen stets auf die Reihenfolge geachtet wer den. Dies ist der Preis für die Einfachheit der Dirac-Schreibweise. β Anwendung des Projektors Pψ auf einen Ket |ψ⟩ Es sei |ψ⟩ ein auf eins normierter Ketvektor: ⟨ψ|ψ⟩ = 1
(B-31)
Wir betrachten den Operator P ψ = |ψ⟩⟨ψ|
(B-32)
und wenden ihn auf einen beliebigen Ket |φ⟩ an: P ψ |φ⟩ = |ψ⟩⟨ψ|φ⟩
(B-33)
108 | II Der mathematische Rahmen Wir erhalten also einen zu |ψ⟩ proportionalen Ket, wobei der Proportionalitätsfaktor ⟨ψ|φ⟩ gerade das Skalarprodukt von |φ⟩ mit |ψ⟩ ist. „Geometrisch“ bedeutet also die Anwendung von P ψ die „Orthogonalprojektion“ auf den Ket |ψ⟩. Diese Interpretation wird durch die Tatsache gestützt, dass P2ψ = P ψ ist (die zwei fache Projektion auf einen Vektor ist gleichwertig zur einfachen Projektion auf diesen Vektor). Es ist nämlich P2ψ = P ψ P ψ = |ψ⟩⟨ψ|ψ⟩⟨ψ|
(B-34)
In diesem Ausdruck ist ⟨ψ|ψ⟩ die Zahl 1, s. Gl. (B-31). So wird P2ψ = |ψ⟩⟨ψ| = P ψ
(B-35)
γ Anwendung des Projektors auf einen Unterraum Es seien |φ1 ⟩, |φ2 ⟩, . . . , |φ q ⟩ q normierte und paarweise orthogonale Vektoren: ⟨φ i |φ j ⟩ = δ ij
i, j = 1, 2, . . . , q
(B-36)
Den von q aufgespannten Unterraum bezeichnen wir mit Hq . Dann sei P q der durch q
P q = ∑ |φ i ⟩⟨φ i |
(B-37)
i=1
definierte lineare Operator. Wir bestimmen P2q : q
q
P2q = ∑ ∑ |φ i ⟩⟨φ i |φ j ⟩⟨φ j |
(B-38)
i=1 j=1
was wegen Gl. (B-36) zu q
q
q
P2q = ∑ ∑ |φ i ⟩⟨φ j |δ ij = ∑ |φ i ⟩⟨φ i | = P q i=1 j=1
(B-39)
i=1
führt. P q ist also ein Projektor. Man erkennt leicht, dass dieser Operator auf den Un terraum Hq projiziert: Für einen beliebigen Vektor |ψ⟩ ∈ H gilt q
P q |ψ⟩ = ∑ |φ i ⟩⟨φ i |ψ⟩
(B-40)
i=1
Die Wirkung von P q auf |ψ⟩ liefert demnach die lineare Superposition der Projektionen von |ψ⟩ auf die verschiedenen |φ i ⟩, also die Projektion von |ψ⟩ auf den Unterraum Hq .
B-4 Hermitesche Konjugation B-4-a Wirkung eines linearen Operators auf einen Bravektor Bisher haben wir nur die Wirkung eines linearen Operators A auf Ketvektoren erklärt. Wir wollen jetzt zeigen, wie man auch die Wirkung von A auf Bravektoren definieren kann.
B Zustandsraum und Dirac-Schreibweise | 109
Wir betrachten einen wohlbestimmten Bravektor ⟨φ| und die Menge aller Ketvek toren |ψ⟩. Jedem dieser Kets können wir die komplexe Zahl ⟨φ|(A|ψ⟩) zuordnen, die wir bereits weiter oben als das Matrixelement von A zwischen |φ⟩ und ⟨ψ| definiert ha ben. Weil A ein linearer Operator ist und das Skalarprodukt linear vom Ket abhängt, hängt auch die Zahl ⟨φ|(A|ψ⟩) linear von |ψ⟩ ab. Wir können so bei festem |φ⟩ und A jedem Ket |ψ⟩ eine Zahl zuordnen, die linear von |ψ⟩ abhängig ist. Die Vorgabe von ⟨φ| und A definiert demnach über die Kets von H ein neues lineares Funktional, d. h. einen neuen, zum dualen Raum H∗ gehörenden Bravektor. Wir werden ihn mit ⟨φ|A bezeichnen. Die Definitionsgleichung lautet damit (⟨φ| A) |ψ⟩ = ⟨φ| (A |ψ⟩)
(B-41)
Der Operator A ordnet jedem Bra ⟨φ| einen neuen Bra ⟨φ|A zu. Wir zeigen, dass der Zusammenhang linear ist, und betrachten hierzu eine Linearkombination der Bra vektoren ⟨φ1 | und ⟨φ2 |: ⟨χ| = λ1 ⟨φ1 | + λ2 ⟨φ2 |
(B-42)
d. h. es ist ⟨χ|ψ⟩ = λ1 ⟨φ1 |ψ⟩ + λ2 ⟨φ2 |ψ⟩. Nach Gl. (B-41) ist dann (⟨χ|A)|ψ⟩ = ⟨χ|(A|ψ⟩) = λ1 ⟨φ1 |(A|ψ⟩) + λ2 ⟨φ2 |(A|ψ⟩) = λ1 (⟨φ1 |A)|ψ⟩ + λ2 (⟨φ2 |A)|ψ⟩
(B-43)
Weil |ψ⟩ beliebig ist, folgt hieraus ⟨χ|A = (λ1 ⟨φ1 | + λ2 ⟨φ2 |)A = λ1 ⟨φ1 |A + λ2 ⟨φ2 |A
(B-44)
Durch Gl. (B-41) wird also über die Bravektoren eine lineare Operation definiert. ⟨φ|A ist der Bra, der sich durch die Wirkung des linearen Operators A auf den Bra ⟨φ| ergibt. Bemerkungen: 1. Aus der Definition (B-41) von ⟨φ|A erkennt man, dass die Klammern entfallen können. Daher werden wir im Folgenden für dieses Matrixelement ⟨φ|A|ψ⟩ schreiben ⟨φ|A|ψ⟩ = (⟨φ|A)|ψ⟩ = ⟨φ|(A|ψ⟩)
(B-45)
2. In dem Ausdruck ⟨φ|A kommt es auf die Reihenfolge von ⟨φ| und A wesentlich an. Wir dürfen für ⟨φ|A nicht etwa A⟨φ| schreiben. Die Wirkung von ⟨φ|A auf einen Ket |ψ⟩ ergibt nämlich eine Zahl ⟨φ|A|ψ⟩; ⟨φ|A ist demnach ein Bravektor. Dagegen würde A⟨φ|, angewendet auf einen Ket |ψ⟩, den Ausdruck A⟨φ|ψ⟩ liefern. Das ist aber ein Operator, nämlich der mit der Zahl ⟨φ|ψ⟩ multiplizierte Operator A. Ein derartiges (mathematisches) Objekt haben wir aber nicht definiert; der Ausdruck A⟨φ| hat keine Bedeutung.
110 | II Der mathematische Rahmen
B-4-b Adjungierter Operator In § B-2-c hatten wir den Zusammenhang zwischen den Ket- und den Bravektoren un tersucht. Wir zeigen jetzt, dass es dieser Zusammenhang erlaubt, jedem linearen Ope rator A einen anderen linearen Operator A† zuzuordnen, den man den zu A adjungier ten (oder hermitesch konjugierten) Operator nennt. Der Operator A ordnet einem beliebigen Ket |ψ⟩ aus dem Raum H einen anderen Ket |ψ ⟩ zu, s. Abb. 2. Weiter entspricht jedem Ket |ψ⟩ ein Bravektor ⟨ψ| und ebenso jedem |ψ ⟩ ein ⟨ψ |. Dieser Zusammenhang zwischen den Kets und den Bras erlaubt dann die Definition der Wirkung des Operators A† auf die Bravektoren: Gehört der Bra ⟨ψ| zum Ket |ψ⟩, so ordnet der Operator A† den Bra ⟨ψ | dem Ket |ψ ⟩ = A|ψ⟩ zu; man schreibt ⟨ψ | = ⟨ψ|A† .
Abb. 2: Definition des zum Operator A adjun gierten Operators A† über den Zusammenhang zwischen Ket- und Bravektoren.
Die Beziehung ⟨ψ | = ⟨ψ|A† ist linear. Zum Bra λ1 ⟨ψ1 |+ λ2 ⟨ψ2 | gehört der Ket λ∗1 |ψ1 ⟩+ λ∗2 |ψ2 ⟩, weil der Zusammenhang zwischen einem Bra und einem Ket antilinear ist. Der Operator A transformiert λ∗1 |ψ1 ⟩ + λ∗2 |ψ2 ⟩ in λ∗1 A|ψ1 ⟩ + λ∗2 A|ψ2 ⟩ = λ∗1 |ψ1 ⟩ + λ∗2 |ψ2 ⟩. Zu diesem Ket gehört schließlich der Bra λ1 ⟨ψ1 | + λ2 ⟨ψ2 | = λ1 ⟨ψ1 |A† + λ2 ⟨ψ2 |A† . Daraus schließt man, dass (λ1 ⟨ψ1 | + λ2 ⟨ψ2 |)A† = λ1 ⟨ψ1 |A† + λ2 ⟨ψ2 |A†
(B-46)
A† ist daher ein linearer Operator, der durch die Beziehung |ψ ⟩ = A|ψ⟩
⇐⇒
⟨ψ | = ⟨ψ|A†
(B-47)
definiert ist. Aus diesem Zusammenhang leitet man leicht eine weitere wichtige Relation her, der der Operator A† genügt. Aus den Eigenschaften des Skalarprodukts ergibt sich nämlich mit einem beliebigen Ket |φ⟩ ∈ H, dass ⟨ψ |φ⟩ = ⟨φ|ψ ⟩∗
(B-48)
Dann folgt mit Gl. (B-47) für beliebige Kets |φ⟩ und |ψ⟩ ⟨ψ|A† |φ⟩ = ⟨φ|A|ψ⟩∗
(B-49)
B Zustandsraum und Dirac-Schreibweise | 111
Bemerkung zur Schreibweise: In einer Bemerkung weiter oben zu den Gleichungen (B-7) und (B-8) stellten wir fest, wie wir aus dem Ket |λψ⟩ und dem Bra ⟨λψ| den skalaren Faktor λ herausziehen dürfen. Ein entsprechen des Problem ergibt sich bei den Ausdrücken |Aψ⟩ und ⟨Aψ|, wobei A einen linearen Operator bedeutet. |Aψ⟩ ist lediglich eine andere Schreibweise für den Ket A|ψ⟩: |Aψ⟩ = A|ψ⟩
(B-50)
⟨Aψ| ist der zum Ket |Aψ⟩ gehörende Bravektor. Aus Gl. (B-50) und (B-47) ersieht man, dass ⟨Aψ| = ⟨ψ|A †
(B-51)
ist. Will man also einen (linearen) Operator A aus einem Bra herausziehen, so muss man ihn durch seinen adjungierten Operator A † ersetzen und ihn rechts vom Bra ⟨ψ| anschreiben.
B-4-c Eigenschaften des adjungierten Operators Mit Verwendung von Gl. (B-47) und Gl. (B-49) zeigt man leicht die folgenden Eigen schaften: (A† )† = A
(B-52)
†
∗
†
†
(λA) = λ A
†
(A + B) = A + B
(λ ist eine komplexe Zahl) †
(B-53) (B-54)
Um schließlich den zum Produkt (AB) adjungierten Operator (AB)† zu bestimmen, betrachten wir den Ket |φ⟩ = AB|ψ⟩. Mit |χ⟩ = B|ψ⟩ schreiben wir ihn in der Form |φ⟩ = A|χ⟩. Dann ist ⟨φ| = ⟨ψ|(AB)† = ⟨χ|A† = ⟨ψ|B† A† denn es gilt ⟨χ| = ⟨ψ|B† . Hieraus erhalten wir (AB)† = B† A†
(B-55)
Es ändert sich also die Reihenfolge der Faktoren. Bemerkung: Wegen (A † )† = A kann man nach Gl. (B-51) auch ⟨A † φ| = ⟨φ|(A † )† = ⟨φ|A schreiben und die linke Seite von Gl. (B-41) auf die Form ⟨A † φ|ψ⟩ bringen. Entsprechend kann die rechte Seite dieser Gleichung wegen Gl. (B-50) in der Form ⟨φ|Aψ⟩ geschrieben werden. Hieraus ergibt sich eine Beziehung, die manchmal für die Definition des zu A adjungierten Operators A † benutzt wird ⟨A † φ|ψ⟩ = ⟨φ|Aψ⟩
(B-56)
112 | II Der mathematische Rahmen
B-4-d Hermitesche Konjugation in der Dirac-Schreibweise Den Begriff des adjungierten Operators haben wir unter Verwendung des Zusammen hangs zwischen Kets und Bras eingeführt. Man sagt, dass der Ket |ψ⟩ und der zuge hörige Bra ⟨ψ| zueinander „hermitesch konjugiert“ sind. In Abb. 2 haben wir diese Operation der hermiteschen Konjugation durch eine Wellenlinie angedeutet; man er kennt, dass sie A† dem Operator A zuordnet. Aus diesem Grunde nennt man A† auch den zu A hermitesch konjugierten Operator. Durch das Bilden des hermitesch Konjugierten ändert sich die Reihenfolge der Objekte. So sehen wir in Abb. 2, dass A|ψ⟩ in ⟨ψ|A† übergeht: Aus dem Ket |ψ⟩ wird der Bra ⟨ψ|, aus A wird A† und die Reihenfolge wird umgekehrt. Entsprechend vertau schen bei einem Produkt aus zwei Operatoren nach Gl. (B-55) die Faktoren ihre Plätze. Wir zeigen weiter, dass (|u⟩⟨v|)† = |v⟩⟨u|
(B-57)
ist; man ersetzt also |u⟩ durch ⟨u|, ⟨v| durch |v⟩ und vertauscht die Reihenfolge. Hierzu wenden wir die Beziehung (B-49) auf den Operator |u⟩⟨v| an. Es wird ⟨ψ|(|u⟩⟨v|)† |φ⟩ = [⟨φ|(|u⟩⟨v|)|ψ⟩]∗
(B-58)
und weiter mit Berücksichtigung von Gl. (B-9) [⟨φ|(|u⟩⟨v|)|ψ⟩]∗ = ⟨φ|u⟩∗ ⟨v|ψ⟩∗ = ⟨ψ|v⟩⟨u|φ⟩ = ⟨ψ|(|v⟩⟨u|)|φ⟩
(B-59)
Hieraus folgt dann Gl. (B-57). Schließlich bleibt festzustellen, dass wegen Gl. (B-6) und Gl. (B-53) die hermi tesche Konjugation einer Konstanten λ diese einfach in die konjugiert komplexe Zahl λ∗ transformiert. Dies ist mit der Tatsache in Übereinstimmung, dass ⟨φ|ψ⟩∗ = ⟨ψ|φ⟩ gilt. Also ist das hermitesch Konjugierte eines Kets ein Bra und umgekehrt, die hermi tesche Konjugation eines Operators führt zu dem zu ihm adjungierten Operator und eine Zahl geht in die zu ihr konjugiert komplexe Zahl über. In der Dirac-Schreibwei se ist diese Operation sehr einfach auszuführen; man hat lediglich die folgende Regel anzuwenden: Regel Man bildet von einem beliebigen Ausdruck, der Konstanten, Kets, Bras und Operato ren enthält, den dazu hermitesch konjugierten (oder adjungierten) Ausdruck, indem man – die Konstanten durch ihr konjugiert Komplexes, – die Kets durch die zugehörigen Bras, – die Bras durch die zugehörigen Kets, – die Operatoren durch die dazu adjungierten Operatoren ersetzt und die Reihenfolge der Faktoren umkehrt. Dabei ist die Anordnung der Kon stanten beliebig.
C Darstellungen im Zustandsraum | 113
Beispiele Nach dieser Regel wird aus λ⟨u|A|v⟩|w⟩⟨ψ| der Operator |ψ⟩⟨w|⟨v|A† |u⟩λ∗ , wofür man weiter λ∗ ⟨v|A† |u⟩|ψ⟩⟨w| schreiben kann. Der Ketvektor λ|u⟩⟨v|w⟩ wird in den Bravektor ⟨w|v⟩⟨u|λ∗ bzw. λ∗ ⟨w|v⟩⟨u| trans formiert. B-4-e Hermitesche Operatoren Ist ein Operator A gleich dem zu ihm adjungierten Operator A† : A = A†
(B-60)
so heißt er ein hermitescher Operator. Wenn wir dies in Gl. (B-49) einsetzen, so sehen wir, dass ein hermitescher Operator die Beziehung ⟨ψ|A|φ⟩ = ⟨φ|A|ψ⟩∗
(B-61)
für beliebige |φ⟩ und |ψ⟩ erfüllt. Weiter ergibt sich für ihn aus Gl. (B-56), dass ⟨Aφ|ψ⟩ = ⟨φ|Aψ⟩
(B-62)
gilt. Auf hermitesche Operatoren werden wir später im Zusammenhang mit dem Eigen wertproblem detailliert eingehen. Sie spielen in der Quantenmechanik eine grundle gende Rolle. Setzt man in Gl. (B-57) |u⟩ = |v⟩ = |ψ⟩, so erkennt man, dass der Projektionsope rator P ψ = |ψ⟩⟨ψ| hermitesch ist: P†ψ = |ψ⟩⟨ψ| = P ψ
(B-63)
Bemerkung: Das Produkt aus zwei hermiteschen Operatoren ist nur dann hermitesch, wenn der Kommutator [A, B] = 0 ist. Wenn nämlich A = A † und B = B† gilt, so ist nach Gl. (B-55) (AB)† = B† A † = BA, und dies ist nur dann gleich AB, wenn die beiden Operatoren vertauschen.
C Darstellungen im Zustandsraum C-1 Definition einer Darstellung Unter einer Darstellung im Zustandsraum H verstehen wir eine orthonormierte (dis krete oder kontinuierliche) Basis. Die Vektoren und Operatoren werden nach Wahl einer derartigen Darstellung durch Zahlen repräsentiert: die Vektoren durch ihre Kom ponenten und die Operatoren durch Matrixelemente. Aus dem im vorhergehenden Abschnitt eingeführten Vektorkalkül wird dann ein Matrixkalkül. Die Wahl einer Dar stellung ist im Prinzip willkürlich, doch wird man sie je nach dem zu untersuchenden Problem so treffen, dass sich die Rechnungen möglichst einfach gestalten.
114 | II Der mathematische Rahmen
In diesem Abschnitt wollen wir die in § A-2 und § A-3 eingeführten Begriffe und Zu sammenhänge über diskrete und kontinuierliche Basen im Raum F in die Diracsche Notation und für beliebige Räume H übertragen. Zunächst schreiben wir die beiden für eine Basis charakteristischen Relationen, also die Orthonormierungsbedingungen und die Vollständigkeitsrelation an. Darauf zeigen wir, wie man von diesen Beziehun gen ausgehend, alle konkreten Probleme in Bezug auf eine Basis behandeln kann und wie man weiter den Übergang von einer Basis zu einer anderen vollzieht.
C-2 Eigenschaften einer orthonormierten Basis C-2-a Orthonormierungsbedingungen Eine diskrete Menge {|u i ⟩} bzw. kontinuierliche Menge {|w α ⟩} von Kets heißt orthonor miert, wenn ihre Elemente den Orthonormierungsbedingungen ⟨u i |u j ⟩ = δ ij
(C-1)
⟨w α |w α ⟩ = δ(α − α )
(C-2)
bzw.
genügen. Wir sehen, dass für eine kontinuierliche Menge das Skalarprodukt ⟨w α |w α ⟩ nicht existiert: Die |w α ⟩ haben keine endliche Norm und gehören demnach nicht zu H. Den noch können die Vektoren von H nach den |w α ⟩ entwickelt werden, und es ist im Fol genden von Interesse, die |w α ⟩ als verallgemeinerte Kets zuzulassen (dabei sei an die Diskussion in § A-3 und § B-2-c erinnert). C-2-b Vollständigkeitsrelation Eine diskrete Menge {|u i ⟩} bzw. kontinuierliche Menge {|w α ⟩} von Kets bildet eine Basis in H, wenn jeder Ket |ψ⟩ ∈ H auf genau eine Weise nach den |u i ⟩ bzw. |w α ⟩ entwickelt werden kann: |ψ⟩ = ∑ c i |u i ⟩
(C-3)
i
oder |ψ⟩ = ∫ dα c(α)|w α ⟩
(C-4)
C Darstellungen im Zustandsraum |
115
Wir nehmen überdies an, dass die Basis orthonormiert ist. Multiplizieren wir beide Seiten von Gl. (C-3) skalar mit ⟨u j | bzw. beide Seiten von Gl. (C-4) mit ⟨w α |, so ergeben sich unter Berücksichtigung von Gl. (C-1) und Gl. (C-2) die Komponenten c j bzw. c(α ): ⟨u j |ψ⟩ = c j
(C-5)
bzw. ⟨w α |ψ⟩ = c(α )
(C-6)
Ersetzen wir in Gl. (C-3) die c i durch ⟨u i |ψ⟩ und in Gl. (C-4) die c(α) durch ⟨w α |ψ⟩, so wird |ψ⟩ = ∑ c i |u i ⟩ = ∑⟨u i |ψ⟩|u i ⟩ i
i
= ∑ |u i ⟩⟨u i |ψ⟩ = (∑ |u i ⟩⟨u i |) |ψ⟩ i
(C-7)
i
bzw. |ψ⟩ = ∫ dα c(α)|w α ⟩ = ∫ dα ⟨w α |ψ⟩|w α ⟩ = ∫ dα |w α ⟩⟨w α |ψ⟩ = (∫ dα |w α ⟩⟨w α |) |ψ⟩
(C-8)
Dabei haben wir von der Möglichkeit Gebrauch gemacht, dass wir in Gl. (C-7) die Zahl ⟨u i |ψ⟩ hinter den Ket |u i ⟩ und in Gl. (C-8) die Zahl ⟨w α |ψ⟩ hinter den Ket |w α ⟩ setzen dürfen. Wir erkennen aus diesen Gleichungen, dass die beiden Operatoren ∑i |u i ⟩⟨u i | und ∫ dα |w α ⟩⟨w α |, angewendet auf einen Ket |ψ⟩ ∈ H, wieder diesen Ket ergeben. Be zeichnen wir mit 𝟙 den Einheitsoperator in H, so gilt also P{u i } = ∑|u i ⟩⟨u i | = 𝟙
(C-9)
i
und P{w α } = ∫ dα |w α ⟩⟨w α | = 𝟙
(C-10)
Die Beziehung (C-9) bzw. (C-10) heißt die Vollständigkeitsrelation. Umgekehrt folgt aus diesen Gleichungen, dass die Menge {|u i ⟩} bzw. die Menge {|w α ⟩} eine Basis in H bil det. Für jeden zu H gehörenden Ket |ψ⟩ gilt nämlich |ψ⟩ = 𝟙 |ψ⟩ = P{u i } |ψ⟩ = ∑ |u i ⟩⟨u i |ψ⟩ i
= ∑ c i |u i ⟩ i
(C-11)
116 | II Der mathematische Rahmen
mit c i = ⟨u i |ψ⟩
(C-12)
und entsprechend |ψ⟩ = 𝟙 |ψ⟩ = P{w α } |ψ⟩ = ∫ dα |w α ⟩⟨w α |ψ⟩ = ∫ dα c(α) |w α ⟩
(C-13)
mit c(α) = ⟨w α |ψ⟩
(C-14)
So kann also jeder Ket auf genau eine Weise nach den |u i ⟩ oder den |w α ⟩ entwickelt werden. Jede Menge bildet eine (diskrete bzw. kontinuierliche) Basis. Bemerkungen: 1. In § E werden wir sehen, dass sich für den Raum F die Beziehungen (A-32) und (A-57) auf einfache Weise aus (C-9) und (C-10) ergeben. 2. Die geometrische Deutung der Vollständigkeitsrelation. Aufgrund der Überlegungen in § B-3-b ist ∑i |u i ⟩⟨u i | ein Projektor, der auf den von den |u 1 ⟩, |u 2 ⟩, ..., |u i ⟩, ...aufgespannten Unterraum H projiziert. Weil die |u i ⟩ in H eine Basis bilden und damit jeder Ket aus H nach ihnen entwi ckelt werden kann, ist der Unterraum H mit H identisch. Darum muss ∑i |u i ⟩⟨u i | gleich dem Einheitsoperator sein: Projiziert man einen Ket, der zu H gehört, auf diesen Raum H, so ändert er sich nicht. Eine entsprechende Überlegung gilt für den Operator ∫ dα |w α ⟩⟨w α |. Der Begriff der Vollständigkeitsrelation findet sein Analogon im R 3 , dem dreidimensionalen Raum der Geometrie. Sind e1 , e2 und e3 drei paarweise aufeinander senkrechte Einheitsvekto ren und weiter P 1 , P 2 und P 3 die Projektoren auf diese drei Vektoren, so kann man die Tatsache, dass die Menge {e1 , e2 , e3 } eine Basis im R 3 bildet, durch die Beziehung P1 + P2 + P3 = 𝟙
(C-15)
ausdrücken. Dagegen stellt das orthonormierte Zweibein {e1 , e2 } keine Basis im R 3 dar. Hier ist der Projektor P 1 + P 2 , der auf die von e1 und e2 aufgespannte Ebene projiziert, nicht gleich 𝟙; z. B. ist (P 1 + P 2 )e3 = 0.
Mit den in Schema 6 zusammengefassten Beziehungen können sämtliche Rechnun gen in der {|u i ⟩}- bzw. {|w α ⟩}-Darstellung durchgeführt werden. Schema 6 {|u i ⟩}-Darstellung
{|w α ⟩}-Darstellung
⟨u i |u j ⟩ = δ ij
⟨w α |w α ⟩ = δ(α − α )
P {u i } = ∑|u i ⟩⟨u i | = 𝟙
P {wα } = ∫ dα |w α ⟩⟨w α | = 𝟙
i
C Darstellungen im Zustandsraum | 117
C-3 Darstellung der Ket- und Bravektoren C-3-a Darstellung der Kets In der {|u i ⟩}-Darstellung wird der Ket |ψ⟩ durch die Gesamtheit seiner Komponenten, d. h. durch die Zahlen c i = ⟨u i |ψ⟩ repräsentiert. Man ordnet diese Zahlen in einem Spaltenvektor mit im Allgemeinen (abzählbar) unendlich vielen Zeilen an: ⟨u 1 |ψ⟩ ⟨u 2 |ψ⟩ ( .. ) ( . ) ( ) ⟨u i |ψ⟩ .. ( . )
(C-16)
In der kontinuierlichen {|w α ⟩}-Basis wird der Ket |ψ⟩ durch ein Kontinuum von Zahlen c(α) = ⟨w α |ψ⟩ repräsentiert, also durch eine Funktion von α. Diese kann man formal ebenfalls durch einen Spaltenvektor ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ α↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↓
.. . .. ( ) . ( ) (⟨w α | ψ⟩) ( ) ( ) .. . .. . ( )
(C-17)
mit nicht abzählbar unendlich vielen Komponenten symbolisieren. Er entspricht dann der aus der elementaren Analysis bekannten Funktionsskala. C-3-b Darstellung der Bras Es sei ⟨φ| ein beliebiger Bra. Dann kann man in der {|u i ⟩}-Darstellung schreiben ⟨φ| = ⟨φ| 𝟙 = ⟨φ|P{u i } = ∑⟨φ|u i ⟩⟨u i |
(C-18)
i
d. h. ⟨φ| wird auf genau eine Weise nach den Bras ⟨u i | entwickelt. Die Komponenten von ⟨φ|, ⟨φ|u i ⟩, sind das konjugiert Komplexe der Komponenten b i = ⟨u i |φ⟩ des Kets |φ⟩, der zum Bra ⟨φ| gehört. Bei Wahl einer kontinuierlichen Basis {|w α ⟩} erhält man entsprechend ⟨φ| = ⟨φ| 𝟙 = ⟨φ|P{w α } = ∫ dα ⟨φ|w α ⟩⟨w α |
(C-19)
Die Komponenten von ⟨φ|, also ⟨φ|w α ⟩, sind das konjugiert Komplexe der Komponen ten b(α) = ⟨w α |φ⟩ des zum Bra ⟨φ| gehörenden Kets |φ⟩.
118 | II Der mathematische Rahmen
Zur Darstellung eines Kets haben wir seine Komponenten in einem (vertikalen) Spaltenvektor angeordnet. Bevor wir nun die Darstellung eines Bras angeben, zeigen wir, wie man mit Hilfe der Vollständigkeitsrelation das Skalarprodukt ⟨φ|ψ⟩ zweier Kets durch ihre Komponenten ausdrücken kann. Man kann in diesem nämlich stets zwischen ⟨φ| und |ψ⟩ den 𝟙-Operator schieben: ⟨φ|ψ⟩ = ⟨φ|𝟙 |ψ⟩ = ⟨φ|P{u i } |ψ⟩ = ∑⟨φ|u i ⟩⟨u i |ψ⟩ = ∑ b ∗i c i i
(C-20)
i
Bei einer kontinuierlichen Basis erhalten wir entsprechend ⟨φ|ψ⟩ = ⟨φ|𝟙 |ψ⟩ = ⟨φ|P{w α } |ψ⟩ = ∫ dα ⟨φ|w α ⟩⟨w α |ψ⟩ = ∫ dα b ∗ (α)c(α)
(C-21)
Ordnen wir daher die Komponenten ⟨φ|u i ⟩ des Bras ⟨φ| in einem Zeilenvektor (mit unendlich vielen Spalten) an (⟨φ|u 1 ⟩⟨φ|u 2 ⟩ . . . ⟨φ|u i ⟩ . . .)
(C-22)
so ist das Skalarprodukt ⟨φ|ψ⟩ im Sinne der Matrizenrechnung einfach das Produkt des Spaltenvektors, der den Ket |ψ⟩ darstellt, mit dem Zeilenvektor, der den Bra ⟨φ| repräsentiert. Man erhält eine Matrix mit einer Zeile und einer Spalte, also eine Zahl. In der {|w α ⟩}-Darstellung gibt es nicht abzählbar unendlich viele Komponenten ⟨φ|w α ⟩ für ⟨φ|. Man symbolisiert dies formal durch den Zeilenvektor α → ( . . . . . . ⟨φ | w α ⟩ . . . . . .)
(C-23)
Bemerkung: Ist eine Darstellung gegeben, so sind die Matrizen, die den Ket |ψ⟩ und den zugehörigen Bra ⟨ψ| repräsentieren, im Sinne des Matrizenkalküls hermitesch konjugiert zueinander (Vertauschen von Zeilen und Spalten und Bilden des konjugiert Komplexen der einzelnen Elemente).
C-4 Darstellung von Operatoren C-4-a Darstellung eines Operators durch eine quadratische Matrix In einer {|u i ⟩}- oder einer {|w α ⟩}-Basis können wir mit einem linearen Operator A die Zahlen A ij = ⟨u i |A|u j ⟩
(C-24)
A(α, α ) = ⟨w α |A|w α ⟩
(C-25)
bzw.
C Darstellungen im Zustandsraum |
119
bilden und diese durch zwei Indizes gekennzeichneten Zahlen in einer „quadrati schen“ Matrix mit abzählbar bzw. nicht abzählbar unendlich vielen Zeilen und Spal ten anordnen. Es ist üblich, den ersten Index als Zeilen- und den zweiten Index als Spaltenindex anzusehen. So ergibt sich in der {|u i ⟩}-Basis die Matrix A11 A21 ( .. ( . ( A i1 .. ( .
⋅⋅⋅ ⋅⋅⋅ .. . ⋅⋅⋅ .. .
A12 A22 .. . A i2 .. .
⋅⋅⋅ ⋅⋅⋅ .. ) .) ) ⋅⋅⋅ .. .)
A1j A2j .. . A ij .. .
(C-26)
Wir sehen, dass in der j-ten Spalte gerade die Komponenten des Kets A|u j ⟩ in der {|u i ⟩}Basis stehen. Handelt es sich um eine kontinuierliche Basis, so symbolisiert man die von den beiden Veränderlichen α und α abhängende Funktion A(α, α ) durch eine „kontinu ierliche Matrix“: α → .. .
↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑ ( α↑ ↑ ↑ ↑ ↑ ↑ ↑ ⋅⋅⋅ ↑ ↓
.. . A(α, α )
⋅⋅⋅
)
(C-27)
Eine derartige Darstellung eines Operators durch eine quadratische Matrix erweist sich als sinnvoll und zweckmäßig. Wenn wir z. B. das Produkt von zwei Operatoren betrachten, so erhalten wir unter Verwendung der Vollständigkeitsrelation ⟨u i |AB|u j ⟩ = ⟨u i |A𝟙 B|u j ⟩ = ⟨u i |AP{u k } B|u j ⟩ = ∑⟨u i |A|u k ⟩⟨u k |B|u j ⟩ k
= ∑ A ik B kj
(C-28)
k
Das ist aber das Multiplikationsgesetz für die beiden Matrizen, mit denen wir die Ope ratoren A und B in der {|u i ⟩}-Basis darstellen. C-4-b Matrixdarstellung des Kets |ψ ⟩ = A|ψ⟩ Wir fragen weiter nach den Komponenten des Kets A|ψ⟩ in einer bestimmten Darstel lung, wenn die Komponenten von |ψ⟩ und die Matrixelemente des Operators A in die ser Darstellung bekannt sind. In der {|u i ⟩}-Basis sind die Koordinaten ci von |ψ ⟩ ge geben durch ci = ⟨u i |ψ ⟩ = ⟨u i |A|ψ⟩
(C-29)
120 | II Der mathematische Rahmen
Verwenden wir wieder die Vollständigkeitsrelation, so ergibt sich ci = ⟨u i |A𝟙 |ψ⟩ = ⟨u i |AP{u j } |ψ⟩ = ∑⟨u i |A|u j ⟩⟨u j |ψ⟩ j
= ∑ A ij c j
(C-30)
j
Für die kontinuierliche {|w α ⟩}-Basis wird entsprechend c (α) = ⟨w α |ψ ⟩ = ⟨w α |A|ψ⟩ = ∫ dα ⟨w α |A|w α ⟩⟨w α |ψ⟩ = ∫ dα A(α, α ) c(α )
(C-31)
Um die Matrixdarstellung des Kets |ψ ⟩ = A|ψ⟩ zu erhalten, muss man demnach ein fach den Spaltenvektor, der den Ket |ψ⟩ repräsentiert, von links mit der Matrix multi plizieren, die den Operator A darstellt: A11 c1 A21 c2 ( .. ) ( .. (.) ( . ( ) ( ( c ) = ( A i1 ( i) ( (.) ( . .. .. .. (.)
A12 A22 .. . A i2 .. . .. .
.. ( .
⋅⋅⋅ ⋅⋅⋅
A1j A2j .. . A ij .. . .. .
⋅⋅⋅
⋅⋅⋅ ⋅⋅⋅
c1 c2 ) )( . ) )( . ) . ⋅ ⋅ ⋅) )( ) ) cj .. (.) )
(C-32)
C-4-c Darstellung von ⟨φ|A|ψ⟩ Fügen wir die Vollständigkeitsrelation zwischen dem Bra ⟨φ| und A sowie zwischen A und dem Ket |ψ⟩ ein, so erhalten wir für die Basen {|u i ⟩} bzw. {|w α ⟩} ⟨φ|A|ψ⟩ = ⟨φ|P{u i } AP{u j } |ψ⟩ = ∑⟨φ|u i ⟩⟨u i |A|u j ⟩⟨u j |ψ⟩ i,j
=
∑ b ∗i A ij i,j
cj
(C-33)
und ⟨φ|A|ψ⟩ = ⟨φ|P{w α } AP{w α } |ψ⟩ = ∬ dα dα ⟨φ|w α ⟩⟨w α |A|w α ⟩⟨w α |ψ⟩ = ∬ dα dα b ∗ (α)A(α, α ) c(α )
(C-34)
In der Matrizendarstellung ergibt sich demnach der Skalar ⟨φ|A|ψ⟩, indem man den Spaltenvektor, der den Ket |ψ⟩ darstellt, nacheinander mit der quadratischen Matrix,
C Darstellungen im Zustandsraum |
121
die den Operator A repräsentiert, und dem Zeilenvektor, der den Bra ⟨φ| darstellt, multipliziert. In der {|u i ⟩}-Basis gilt z. B. A11 A21 ( .. ( . ( ⟨φ|A|ψ⟩ = (b ∗1 b ∗2 . . . b ∗i . . .) ( A ( i1 ( . .. .. ( .
A12 A22 .. . A i2 .. . .. .
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅
A1j A2j .. . A ij .. . .. .
⋅⋅⋅ ⋅⋅⋅
c1 c 2 ) )( . ) )( . ) . ⋅ ⋅ ⋅) )( ) ) cj .. (.) )
(C-35)
Bemerkungen: 1. Entsprechend könnte man für den Bra ⟨φ|A zeigen, dass er durch einen Zeilenvektor darge stellt wird, den man erhält, wenn man die quadratische Matrix, die den Operator A repräsentiert, von links mit dem Zeilenvektor multipliziert, der den Bra ⟨φ| darstellt. Wieder erkennen wir, dass es auf die Reihenfolge ankommt. Der Ausdruck A⟨φ| wäre in der Matrizenschreibweise gar nicht definiert. 2. Die Definitionsgleichung (B-41) für ⟨φ|A bedeutet aus Sicht der Matrizenrechnung nichts an deres als die Assoziativität des Produkts von Matrizen. 3. Der Operator |ψ⟩⟨ψ| wird durch die quadratische Matrix c1 c∗1 c1 c2 c∗1 c2 (.) ( . (.) ( . (.) ( . ( ) ∗ ∗ ( ∗ ( . ) (c1 c2 . . . c j . . .) = ( c i c∗ (.) ( 1 (.) ( . ( ) ( . cj . . .. .. ( ) ( .
c1 c∗2 c2 c∗2 .. . c i c∗2 . .. .. .
⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅
c1 c∗j c2 c∗j .. . c i c∗j . .. .. .
⋅⋅⋅ ⋅⋅⋅ ) ) ) ) ⋅ ⋅ ⋅) ) ) )
(C-36)
)
dargestellt. Dagegen ist ⟨ψ|ψ⟩ als das Produkt eines Spaltenvektors mit einem Zeilenvektor ein Skalar.
C-4-d Darstellung des adjungierten Operators A † Unter Verwendung von Gl. (B-49) erhält man: (A† )ij = ⟨u i |A† |u j ⟩ = ⟨u j |A|u i ⟩∗ = A∗ji
(C-37)
bzw. A† (α, α ) = ⟨w α |A† |w α ⟩ = ⟨w α |A|w α ⟩∗ = A∗ (α , α)
(C-38)
In einer gegebenen Darstellung sind daher die zu den Operatoren A und A† ge hörenden Matrizen zueinander hermitesch konjugiert: Sie ergeben sich gegenseitig durch Bilden des konjugiert Komplexen ihrer Elemente und anschließender Spiege lung an der Hauptdiagonalen.
122 | II Der mathematische Rahmen Ist nun A = A† , also A hermitesch, so kann man (A† )ij in Gl. (C-37) durch A ij bzw. Gl. (C-38) durch A(α, α ) ersetzen:
A† (α, α ) in
A ij = A∗ji
(C-39)
A(α, α ) = A∗ (α , α)
(C-40)
Ein hermitescher Operator wird demnach durch eine hermitesche Matrix dargestellt, bei der die zur Hauptdiagonalen symmetrisch liegenden Elemente zueinander konju giert komplex sind. Für i = j bzw. α = α gilt insbesondere A ii = A∗ii
(C-41)
∗
(C-42)
A(α, α) = A (α, α) Die Diagonalelemente einer hermiteschen Matrix sind stets reell.
C-5 Darstellungswechsel C-5-a Problemstellung In einer gegebenen Darstellung wird ein Ket, ein Bra oder ein Operator durch eine Matrix repräsentiert. Wechselt man die Darstellung, wählt also eine andere Basis, so wird derselbe Ket (bzw. Bra oder Operator) durch eine andere Matrix dargestellt. Die Frage ist, wie diese beiden Matrizen miteinander zusammenhängen. Der Einfachheit halber wollen wir annehmen, dass wir von einer diskreten ortho normierten Basis {|u i ⟩} zu einer anderen diskreten orthonormierten Basis {|t k ⟩} über gehen. In § E werden wir an einem Beispiel den Übergang von einer kontinuierlichen Basis in eine andere kontinuierliche Basis behandeln. Der Darstellungswechsel ist durch die Angabe der Komponenten ⟨u i |t k ⟩ der Kets der neuen Basis bezüglich der Kets der alten Basis definiert. Wir führen die Matrix S mit den Elementen S ik = ⟨u i |t k ⟩ ein. Für die dazu hermitesch konjugierte Matrix
(C-43) S†
gilt
(S† )ki = (S ik )∗ = ⟨t k |u i ⟩
(C-44)
Verwendet man die Vollständigkeitsrelationen P{u i } = ∑ |u i ⟩⟨u i | = 𝟙
(C-45)
i
P{t k } = ∑ |t k ⟩⟨t k | = 𝟙
(C-46)
k
und die Orthonormierungsbedingungen ⟨u i |u j ⟩ = δ ij
(C-47)
⟨t k |t l ⟩ = δ kl
(C-48)
so gestalten sich die folgenden Rechnungen sehr einfach.
C Darstellungen im Zustandsraum | 123
Bemerkung: Die den Basiswechsel beschreibende Transformationsmatrix S ist unitär (s. Ergänzung CII ), d. h. es gilt S † S = SS † = I
(C-49)
wobei I die Einheitsmatrix bedeutet. Es ist nämlich (S † S)kl = ∑ S †ki S il = ∑⟨t k |u i ⟩⟨u i |t l ⟩ i
i
= ⟨t k |t l ⟩ = δ kl
(C-50)
und ebenso (SS † )ij = ∑ S ik S †kj = ∑⟨u i |t k ⟩⟨t k |u j ⟩ k
k
= ⟨u i |u j ⟩ = δ ij
(C-51)
C-5-b Transformation der Komponenten eines Ketvektors Will man von den Komponenten ⟨u i |ψ⟩ eines Kets |ψ⟩ in der alten Basis zu den Kompo nenten ⟨t k |ψ⟩ dieses Kets in der neuen Basis gelangen, so muss man einfach zwischen ⟨t k | und |ψ⟩ die Beziehung (C-45) einsetzen: ⟨t k |ψ⟩ = ⟨t k |𝟙|ψ⟩ = ⟨t k |P{u i } |ψ⟩ = ∑⟨t k |u i ⟩⟨u i |ψ⟩ i
= ∑ S†ki ⟨u i |ψ⟩
(C-52)
i
Umgekehrt zeigt man mit Verwendung von Gl. (C-46) ⟨u i |ψ⟩ = ⟨u i |𝟙|ψ⟩ = ⟨u i |P{t k } |ψ⟩ = ∑⟨u i |t k ⟩⟨t k |ψ⟩ k
= ∑ S ik ⟨t k |ψ⟩
(C-53)
k
C-5-c Transformation der Komponenten eines Bravektors Der Rechengang ist derselbe. So wird z. B. ⟨ψ|t k ⟩ = ⟨ψ|𝟙|t k ⟩ = ⟨ψ|P{u i } |t k ⟩ = ∑⟨ψ|u i ⟩⟨u i |t k ⟩ i
= ∑⟨ψ|u i ⟩S ik i
(C-54)
124 | II Der mathematische Rahmen
C-5-d Transformation der Matrixelemente eines Operators Schiebt man in ⟨t k |A|t l ⟩ sowohl zwischen ⟨t k | und A als auch zwischen A und |t l ⟩ die Beziehung (C-45) ein, so erhält man ⟨t k |A|t l ⟩ = ⟨t k |P{u i } AP{u j } |t l ⟩ = ∑⟨t k |u i ⟩⟨u i |A|u j ⟩⟨u j |t l ⟩
(C-55)
i,j
also A kl = ∑ S†ki A ij S jl
(C-56)
i,j
Entsprechend wird A ij = ⟨u i |A|u j ⟩ = ⟨u i |P{t k } AP{t l } |u j ⟩ = ∑⟨u i |t k ⟩⟨t k |A|t l ⟩⟨t l |u j ⟩ k,l
= ∑ S ik A kl S†lj
(C-57)
k,l
D Eigenwertgleichungen. Observable D-1 Eigenwerte und Eigenvektoren eines Operators D-1-a Definitionen Man sagt, der Ket |ψ⟩ sei Eigenvektor (oder Eigenket) des linearen Operators A, wenn mit einer komplexen Zahl λ die Beziehung A|ψ⟩ = λ|ψ⟩
(D-1)
gilt. Diese Beziehung heißt die Eigenwertgleichung des linearen Operators A. Wir wol len einige ihrer Eigenschaften untersuchen. Im Allgemeinen hat sie nur für bestimmte Werte von λ, den Eigenwerten von A, Lösungen. Die Gesamtheit der Eigenwerte nennt man das Spektrum von A. Zunächst stellen wir fest: Ist |ψ⟩ ein Eigenvektor von A zum Eigenwert λ, so ist mit einer beliebigen komplexen Zahl α auch α|ψ⟩ Eigenvektor zum selben Eigenwert: A(α|ψ⟩) = αA|ψ⟩ = αλ|ψ⟩ = λ(α|ψ⟩)
(D-2)
Zur Beseitigung dieser Unbestimmtheit könnte man vereinbaren, die Eigenvekto ren auf eins zu normieren: ⟨ψ|ψ⟩ = 1
(D-3)
Eindeutigkeit ist damit aber immer noch nicht gegeben, da mit einer beliebigen reel len Zahl θ auch der Vektor eiθ |ψ⟩ die Norm eins hat. Wie wir sehen werden, ergeben
D Eigenwertgleichungen. Observable
| 125
sich in der Quantenmechanik physikalisch dieselben Vorhersagen, ob wir nun von |ψ⟩ oder von eiθ |ψ⟩ ausgehen. Der Eigenwert λ heißt nichtentartet oder einfach, wenn zu ihm ein bis auf einen Faktor eindeutiger Eigenvektor gehört, wenn also alle Eigenvektoren zu diesem Eigen wert kollinear sind. Existieren dagegen wenigstens zwei voneinander linear unabhän gige Eigenvektoren von A zum selben Eigenwert, so heißt dieser entartet; der Grad oder die Ordnung der Entartung ist dann die Zahl der zu diesem Eigenwert gehören den linear unabhängigen Eigenvektoren. Der Entartungsgrad eines Eigenwerts kann endlich oder unendlich sein. Ist λ g-fach entartet, so gehören dazu g linear unabhän gige Eigenkets |ψ i ⟩ (i = 1, 2, . . . , g) mit A|ψ i ⟩ = λ|ψ i ⟩
(D-4)
Nun ist aber jeder Vektor |ψ⟩ von der Form g
|ψ⟩ = ∑ c i |ψ i ⟩
(D-5)
i=1
Eigenvektor von A zum Eigenwert λ, und zwar für beliebige Koeffizienten c i . Es gilt nämlich g
g
A|ψ⟩ = ∑ c i A|ψ i ⟩ = λ ∑ c i |ψ i ⟩ = λ|ψ⟩ i=1
(D-6)
i=1
Folglich spannen die Eigenvektoren von A zum Eigenwert λ einen g-dimensionalen Vektorraum, den Eigenraum zum Eigenwert λ, auf. Ist insbesondere g = 1, so ist der Eigenwert nichtentartet und umgekehrt. Zur Illustration nehmen wir das Beispiel eines Projektors P ψ = |ψ⟩⟨ψ| (mit ⟨ψ|ψ⟩ = 1). Hier lautet die Eigenwertgleichung P ψ |φ⟩ = λ|φ⟩ also |ψ⟩⟨ψ|φ⟩ = λ|φ⟩
(D-7)
Der Ket auf der linken Seite ist stets kollinear zu |ψ⟩ oder gleich null. Darum sind die Eigenvektoren von P ψ entweder |ψ⟩ selbst (zum Eigenwert λ = 1) oder alle zu |ψ⟩ orthogonalen Kets |φ⟩ mit dem Eigenwert λ = 0. Das Spektrum von P ψ besteht daher nur aus den beiden Werten 1 und 0. Der erste ist einfach, der zweite unendlich oft entartet (falls der hier betrachtete Zustandsraum unendlichdimensional ist). Der zum Eigenwert λ = 0 gehörende Eigenraum ist zu |ψ⟩ komplementär⁶, s. § D-2-c. 6 In einem Vektorraum H heißen zwei disjunkte Unterräume H1 und H2 komplementär, wenn jeder Ket |ψ⟩ ∈ H als Summe |ψ1 ⟩ + |ψ2 ⟩ mit |ψ1 ⟩ ∈ H1 und |ψ2 ⟩ ∈ H2 geschrieben werden kann; diese Zerlegung ist dann eindeutig. Zu einem gegebenen Unterraum H1 gehören unendlich viele komple mentäre Unterräume H2 . Man kann H2 festlegen, indem man fordert, dass er orthogonal zu H1 ist. Dies wollen wir im Folgenden stets voraussetzen. Beispiel: Im gewöhnlichen dreidimensionalen Raum sei H1 eine Ebene E; dann kann H2 eine beliebi ge, nicht in E liegende Gerade sein. Der orthogonale Komplementärraum ist die durch den Ursprung gehende, zu E senkrechte Gerade.
126 | II Der mathematische Rahmen
Bemerkungen: 1. Die zu Gl. (D-1) konjugierte Gleichung lautet ⟨ψ|A † = λ ∗ ⟨ψ|
(D-8)
Ist demnach |ψ⟩ Eigenket von A zum Eigenwert λ, so kann man sagen, dass ⟨ψ| Eigenbra von A † zum Eigenwert λ ∗ ist. Doch können wir über den Ausdruck nur dann etwas sagen, wenn A hermitesch ist (§ D-2-a). 2. Streng genommen müsste man die Eigenwertgleichung (D-1) im Raum H lösen, dürfte also nur Eigenvektoren |ψ⟩ mit endlicher Norm betrachten. Tatsächlich werden wir auch Operatoren verwenden, bei denen die Eigenvektoren dieser Bedingung nicht genügen (§ E). Als Lösungen von Gl. (D-1) lassen wir darum auch „verallgemeinerte Kets“ zu.
D-1-b Bestimmung der Eigenwerte und Eigenvektoren eines Operators Wie findet man die Eigenwerte und die zugehörigen Eigenvektoren eines bestimmten linearen Operators? Hier interessieren wir uns nur für das praktische Vorgehen und beschränken uns daher auf einen Zustandsraum mit der endlichen Dimension N. Wir wählen eine bestimmte Darstellung {|u i ⟩} und projizieren die Vektorglei chung (D-1) auf die verschiedenen orthonormierten Basisvektoren |u i ⟩: ⟨u i |A|ψ⟩ = λ⟨u i |ψ⟩
(D-9)
Schieben wir zwischen A und |ψ⟩ die Vollständigkeitsrelation ein, so erhalten wir ∑⟨u i |A|u j ⟩⟨u j |ψ⟩ = λ⟨u i |ψ⟩
(D-10)
j
Mit den üblichen Abkürzungen ⟨u i |ψ⟩ = c i ⟨u i |A|u j ⟩ = A ij
(D-11)
lauten diese Gleichungen ∑ A ij c j = λc i
(D-12)
j
bzw. ∑[A ij − λδ ij ]c j = 0
(D-13)
j
Man kann Gl. (D-13) als ein lineares und homogenes Gleichungssystem für die unbe kannten Komponenten c j des Eigenvektors in der betreffenden Darstellung auffassen. α Die charakteristische Gleichung Das System (D-13) besteht aus N Gleichungen für die N Unbekannten c j (j = 1, 2, . . . , N). Weil es linear und homogen ist, erlaubt es eine nichttriviale Lösung (bei denen
D Eigenwertgleichungen. Observable
| 127
nicht alle c j gleich null sind) genau dann, wenn die Koeffizientendeterminante ver schwindet. Diese Bedingung lautet det[A − λI] = 0
(D-14)
worin A die N × N-Matrix mit den Elementen A ij und I die Einheitsmatrix bedeuten. Man nennt diese Gleichung die charakteristische Gleichung oder die Säkularglei chung. Sie erlaubt die Bestimmung sämtlicher Eigenwerte des Operators A, d. h. die Ermittlung seines Spektrums. Ausführlich hat Gl. (D-14) die Form A11 − λ A 21 . .. A N1
A12
A13
⋅⋅⋅
A22 − λ .. . A N2
A23 .. . A N3
⋅⋅⋅ ⋅⋅⋅
A2N = 0 .. . A NN − λ A1N
(D-15)
Dies ist eine Gleichung N-ten Grades in λ. Sie hat allgemein N reelle oder komplexe Lösungen, die verschieden sein oder auch zusammenfallen können. Man kann durch einen beliebigen Basiswechsel zeigen, dass die charakteristische Gleichung unabhän gig von der Wahl der Basis ist. Daher sind die Eigenwerte eines Operators die Lösungen seiner charakteristischen Gleichung. β Bestimmung der Eigenvektoren Wir wählen nun einen Eigenwert λ0 und ermitteln die zugehörigen Eigenvektoren. Da bei unterscheiden wir zwei Fälle: 1. Zunächst nehmen wir an, dass λ0 eine einfache Wurzel der Säkulargleichung ist. Man kann dann zeigen, dass das Gleichungssystem (D-13) nur aus N − 1 voneinan der unabhängigen Gleichungen besteht und dass die N -te Gleichung eine Folge der anderen ist. Da wir N Unbekannte haben, gibt es demnach unendlich viele Lösungen, wobei jedoch alle c j eindeutig als Funktion von einer Unbekannten, z. B. von c1 , be stimmt werden können. Mit diesem festen c1 erhält man nämlich für die N −1 anderen c j ein System von N − 1 linearen inhomogenen Gleichungen (die rechte Seite dieser Gleichungen ist ein Term in c1 ), und die Determinante dieses Systems ist von null ver schieden, weil die N − 1 Gleichungen voneinander unabhängig sind. Die Lösungen dieses Systems sind von der Form c j = α 0j c1
(D-16)
weil das ursprüngliche System (D-13) linear und homogen ist. α 01 ist nach Definition gleich eins, während die anderen Koeffizienten c j für j ≠ 1 durch die Matrixelemen te A ij und durch λ0 bestimmt sind. Die Eigenvektoren zum Eigenwert λ0 unterscheiden sich nur durch die Wahl des Werts für c1 , sind also gegeben durch |ψ0 (c1 )⟩ = ∑ α 0j c1 |u j ⟩ = c1 |ψ0 ⟩ j
(D-17)
128 | II Der mathematische Rahmen
mit |ψ0 ⟩ = ∑ α 0j |u j ⟩
(D-18)
j
Ist also λ0 eine einfache Wurzel der charakteristischen Gleichung, so gehört zu ihr nur ein einziger Eigenvektor (von einem Faktor abgesehen): Der Eigenwert ist nicht entartet. 2. Ist λ0 eine q-fache Wurzel (q > 1) der charakteristischen Gleichung, so können zwei Fälle auftreten: – Im Allgemeinen enthält das System (D-13) für λ = λ0 noch N −1 unabhängige Glei chungen. Zum Eigenwert λ0 gehört dann nur ein einziger Eigenvektor. In diesem Fall ist der Operator A nicht diagonalisierbar: Die Anzahl der Eigenvektoren von A reicht für die Konstruktion einer Basis im Zustandsraum nicht aus. – Es kann geschehen, dass das System (D-13) für λ = λ0 nur (N − p) unabhängi ge Gleichungen enthält (p ist eine Zahl größer eins, aber kleiner als q). Zum Ei genwert λ0 gehört dann ein Eigenraum mit der Dimension p, und λ0 ist p-fach entartet. Nehmen wir z. B. an, dass das Gleichungssystem (D-13) (N − 2) linear unabhängige Gleichungen enthält. Mit diesen Gleichungen kann man die Koeffi zienten c j als Funktion von zwei von ihnen, z. B. von c1 und c2 , bestimmen; diese beiden sind beliebig wählbar. Es ist dann c j = β 0j c1 + γ0j c2
(D-19)
Offensichtlich ist β 01 = γ02 = 1 und γ01 = β 02 = 0. Sämtliche zu λ0 gehörenden Eigenvektoren sind dann von der Form |ψ0 (c1 , c2 )⟩ = c1 |ψ10 ⟩ + c2 |ψ20 ⟩
(D-20)
mit |ψ10 ⟩ = ∑ β 0j |u j ⟩ j
|ψ20 ⟩
= ∑ γ0j |u j ⟩
(D-21)
j
Die Vektoren |ψ0 (c1 , c2 )⟩ spannen daher einen zweidimensionalen Vektorraum auf, wie er für einen zweifach entarteten Eigenwert charakteristisch ist. Für einen hermiteschen Operator kann man zeigen, dass der Entartungsgrad p ei nes Eigenwerts λ stets gleich der Vielfachheit q der entsprechenden Wurzel der Sä kulargleichung ist. Weil wir im Folgenden überwiegend hermitesche Operatoren untersuchen, genügt es, die Vielfachheit jeder Wurzel von Gl. (D-14) zu kennen, um sofort die Dimension des zugehörigen Eigenraums zu erhalten. In einem Raum mit der endlichen Dimension N besitzt ein hermitescher Operator stets N linear unabhängige Eigenvektoren (später werden wir sehen, dass sie orthonormiert ge wählt werden können): Dieser Operator ist darum diagonalisierbar (§ D-2-b).
D Eigenwertgleichungen. Observable
| 129
D-2 Observable D-2-a Eigenwerte und Eigenvektoren eines hermiteschen Operators Wir betrachten den in der Quantenmechanik sehr wichtigen Fall eines hermiteschen Operators A, für den also A† = A
(D-22)
gilt. 1. Die Eigenwerte eines hermiteschen Operators sind reell. Multipliziert man die Eigenwertgleichung (D-1) skalar mit |ψ⟩, so erhält man ⟨ψ|A|ψ⟩ = λ⟨ψ|ψ⟩
(D-23)
Nun ist aber ⟨ψ|A|ψ⟩ eine reelle Zahl, wenn A hermitesch ist. Es gilt nämlich ⟨ψ|A|ψ⟩∗ = ⟨ψ|A† |ψ⟩ = ⟨ψ|A|ψ⟩
(D-24)
wenn wir auf der rechten Seite die Annahme (D-22) berücksichtigen. Weil ⟨ψ|A|ψ⟩ und ⟨ψ|ψ⟩ reell sind, muss also auch λ reell sein. Ist der Operator A hermitesch und damit λ reell, so kann man in Gl. (D-8) A durch A † und λ durch λ∗ ersetzen. Es ergibt sich ⟨ψ|A = λ⟨ψ|
(D-25)
woraus folgt, dass ⟨ψ| auch Eigenbra von A zum reellen Eigenwert λ ist. Danach gilt für einen beliebigen Ket |φ⟩ ⟨ψ|A|φ⟩ = λ⟨ψ|φ⟩
(D-26)
Man sagt, der hermitesche Operator A wirke in dieser Beziehung nach links. 2. Zwei Eigenvektoren eines hermiteschen Operators zu verschiedenen Eigenwer ten sind orthogonal. Wir betrachten zwei Eigenvektoren |ψ⟩ und |φ⟩ des hermiteschen Operators A: A|ψ⟩ = λ|ψ⟩
(D-27a)
A|φ⟩ = μ|φ⟩
(D-27b)
Weil A hermitesch ist, kann man Gl. (D-27b) in der Form ⟨φ|A = μ⟨φ|
(D-28)
schreiben. Multiplizieren wir Gl. (D-27a) von links mit ⟨φ| und Gl. (D-28) von rechts mit |ψ⟩, so erhalten wir ⟨φ|A|ψ⟩ = λ⟨φ|ψ⟩
(D-29a)
⟨φ|A|ψ⟩ = μ⟨φ|ψ⟩
(D-29b)
Subtraktion dieser beiden Gleichungen liefert (λ − μ)⟨φ|ψ⟩ = 0 Für (λ − μ) ≠ 0 folgt hieraus, dass |φ⟩ und |ψ⟩ zueinander orthogonal sind.
(D-30)
130 | II Der mathematische Rahmen
D-2-b Definition einer Observablen Ist der Zustandsraum H von endlicher Dimension, so können wir, wie wir in § D-1-b gesehen haben, aus den Eigenvektoren eines hermiteschen Operators eine Basis bil den. Ist dagegen die Dimension von H unendlich, so ist dies nicht mehr zwingend möglich. Aus diesem Grunde ist es zweckmäßig, den neuen Begriff der Observablen einzuführen. Wir betrachten einen hermiteschen Operator A und nehmen der Einfachheit hal ber an, dass seine Eigenwerte ein diskretes Spektrum {a n ; n = 1, 2, . . .} bilden. Erst danach werden wir angeben, wie die Ergebnisse für den Fall zu modifizieren sind, wenn das ganze Spektrum oder ein Teil davon kontinuierlich ist. Den Entartungsgrad des Eigenwerts a n bezeichnen wir mit g n ; ist g n = 1, so ist a n nicht entartet. |ψ in ⟩ (i = 1, 2, . . . , g n ) seien g n linear unabhängige Eigenvektoren im Eigenraum Hn zum Eigenwert a n : A|ψ in ⟩ = a n |ψ in ⟩
i = 1, 2, . . . , g n
(D-31)
Weiter oben zeigten wir, dass jeder Vektor aus Hn zu jedem Vektor eines anderen Eigenraums Hn mit a n ≠ a n orthogonal ist. Darum gilt j
⟨ψ in |ψ n ⟩ = 0
n ≠ n und i, j beliebig
(D-32)
Innerhalb eines Unterraums Hn kann man die |ψ in ⟩ stets so wählen, dass j
⟨ψ in |ψ n ⟩ = δ ij
(D-33)
gilt, sie also orthonormiert sind. Damit gelangt man zu einem orthonormierten System von Eigenvektoren von A, denn die |ψ in ⟩ genügen den Beziehungen
⟨ψ in |ψ in ⟩ = δ nn δ ii
(D-34)
Wir definieren nun: Ein hermitescher Operator A ist eine Observable, wenn dieses System orthonormierter Vektoren im Zustandsraum eine Basis bildet. Man kann dies durch die Vollständigkeitsrelation ausdrücken: ∞ gn
∑ ∑ |ψ in ⟩⟨ψ in | = 𝟙
(D-35)
n=1 i=1
Bemerkungen: 1. Sind die den Eigenraum Hn zu a n aufspannenden Vektoren |ψ in ⟩ (i = 1, 2, . . . , g n ) orthonor miert, so kann der Projektionsoperator P n auf diesen Unterraum in der Form gn
P n = ∑ |ψ in ⟩⟨ψ in | i=1
(D-36a)
D Eigenwertgleichungen. Observable
| 131
geschrieben werden (§ B-3-b-γ). Die Observable A ist dann durch A = ∑ an Pn
(D-36b)
n
gegeben. Die linke und die rechte Seite dieser Gleichung liefern bei Anwendung auf die |ψ in ⟩ jeweils dasselbe Resultat. 2. Beachtet man die in Schema (3) angegebenen Ersetzungsregeln, so kann man die Beziehung Gl. (D-35) auf den Fall eines kontinuierlichen Eigenwertspektrums verallgemeinern. Nehmen wir z. B. einen hermiteschen Operator, dessen Spektrum aus einem diskreten Anteil {a n , Entartungs grad g n } und einem (als nicht entartet angenommenen) kontinuierlichen Anteil a(ν) besteht: A|ψ in ⟩ = a n |ψ in ⟩
n = 1, 2, . . . , i = 1, 2, . . . , g n
A|ψ ν ⟩ = a(ν)|ψ ν ⟩
(D-37a)
ν1 < ν < ν2
(D-37b)
Diese Vektoren wird man nun stets so wählen können, dass sie eine „orthonormierte“ Basis bil den, dass also gilt
⟨ψ in |ψ in ⟩ = δ nn δ ii ⟨ψ ν |ψ ν ⟩ = δ(ν − ν ) ⟨ψ in |ψ ν ⟩
(D-38)
=0
Wir nennen dann A eine Observable, wenn dieses System in H eine Basis bildet, wenn also gn
ν2
n i=1
ν1
∑ ∑ |ψ in ⟩⟨ψ in | + ∫ dν |ψ ν ⟩⟨ψ ν | = 𝟙
(D-39)
ist.
D-2-c Beispiel: Der Projektor P ψ Wir zeigen, dass P ψ = |ψ⟩⟨ψ| mit ⟨ψ|ψ⟩ = 1 eine Observable ist. Wie wir bereits wissen, ist dieser Operator hermitesch (§ B-4-d) und besitzt die Eigenwerte 1 und 0 (§ D-1-a). Der Eigenwert 1 ist nichtentartet, der zugehörige Eigenvektor ist |ψ⟩, wäh rend der zweite Eigenwert 0 unendlich oft entartet ist, die Eigenvektoren sind alle die zu |ψ⟩ orthogonalen Kets. Einen beliebigen Ket |φ⟩ aus dem Zustandsraum kann man stets in der Form |φ⟩ = P ψ |φ⟩ + (𝟙 − P ψ )|φ⟩
(D-40)
schreiben. P ψ |φ⟩ ist der Eigenket von P ψ zum Eigenwert 1. Wegen P2ψ = P ψ ist nämlich P ψ (P ψ |φ⟩) = P2ψ |φ⟩ = P ψ |φ⟩
(D-41)
(𝟙 − P ψ )|φ⟩ ist ebenfalls Eigenket zu P ψ , aber zum Eigenwert 0. Hier haben wir P ψ (𝟙 − P ψ )|φ⟩ = (P ψ − P2ψ )|φ⟩ = 0
(D-42)
Somit kann jeder Ket |φ⟩ nach den Eigenvektoren von P ψ entwickelt werden, also ist P ψ eine Observable.
132 | II Der mathematische Rahmen
D-3 Kommutierende Observable D-3-a Wichtige Sätze α Satz I Sind A und B zwei kommutierende Operatoren und |ψ⟩ ein Eigenvektor von A, so ist auch B|ψ⟩ Eigenvektor von A zum selben Eigenwert. Ist nämlich |ψ⟩ ein Eigenvektor von A, so gilt A|ψ⟩ = a|ψ⟩
(D-43)
Anwendung von B auf diese Gleichung liefert BA|ψ⟩ = aB|ψ⟩
(D-44)
Nach Voraussetzung vertauschen A und B, wir können also auf der linken Seite BA durch AB ersetzen und A(B|ψ⟩) = a(B|ψ⟩)
(D-45)
schreiben. B|ψ⟩ ist also Eigenvektor von A zum Eigenwert a, wie behauptet. Jetzt können zwei Fälle auftreten: 1. Ist a ein nichtentarteter Eigenwert, so sind nach Definition alle zu ihm gehören den Eigenvektoren kollinear, der Vektor B|ψ⟩ also notwendig zu |ψ⟩ proportional. Darum ist |ψ⟩ auch Eigenvektor von B. 2. Ist a ein entarteter Eigenwert, so kann man nur sagen, dass B|ψ⟩ zum Eigenraum Ha von A zum Eigenwert a gehört; für einen beliebigen Vektor |ψ⟩ ∈ Ha gilt also B|ψ⟩ ∈ Ha
(D-46)
Man sagt, dass Ha gegenüber der Wirkung von B invariant ist. Satz I kann man daher auch in folgender Form ausdrücken: Satz I a: Wenn zwei Operatoren A und B vertauschen, so ist jeder Eigenraum von A gegenüber der Wirkung von B invariant. β Satz II Sind A und B zwei kommutierende Observablen und |ψ1 ⟩ und |ψ2 ⟩ zwei Eigenvekto ren von A zu verschiedenen Eigenwerten, so ist das Matrixelement ⟨ψ1 |B|ψ2 ⟩ gleich null. Sind |ψ1 ⟩ und |ψ2 ⟩ Eigenvektoren von A, so gilt A|ψ1 ⟩ = a1 |ψ1 ⟩ A|ψ2 ⟩ = a2 |ψ2 ⟩
(D-47)
Nach Satz I ist wegen der Vertauschbarkeit von A und B der Vektor B|ψ2 ⟩ Eigenvektor von A zum Eigenwert a2 . Er ist wegen a1 ≠ a2 orthogonal zu |ψ1 ⟩ (§ D-2-a), und dies
D Eigenwertgleichungen. Observable
|
133
ist die Behauptung: ⟨ψ1 |B|ψ2 ⟩ = 0
(D-48)
Der Beweis kann auch ohne Bezug auf Satz I geführt werden: Weil der Operator [A, B] gleich null ist, hat man ⟨ψ1 |(AB − BA)|ψ2 ⟩ = 0
(D-49)
Beachtet man die Gl. (D-47) und die Hermitezität des Operators A [s. Gl. (D-25)], so erhält man ⟨ψ1 |AB|ψ2 ⟩ = a1 ⟨ψ1 |B|ψ2 ⟩
(D-50)
⟨ψ1 |BA|ψ2 ⟩ = a2 ⟨ψ1 |B|ψ2 ⟩ und man kann Gl. (D-49) in der Form (a1 − a2 )⟨ψ1 |B|ψ2 ⟩ = 0
(D-51)
schreiben. Weil nach Voraussetzung a1 − a2 ≠ 0 ist, folgt hieraus die Behaup tung (D-48). γ Satz III Sind A und B zwei kommutierende Observablen, so kann man aus ihren gemeinsamen Eigenvektoren eine orthonormierte Basis des Zustandsraums konstruieren. Wir betrachten zwei Observable A und B, die miteinander vertauschen. Der Ein fachheit halber setzen wir voraus, dass ihr Spektrum rein diskret ist. Weil A eine Ob servable ist, gibt es wenigstens ein orthonormiertes System von Eigenvektoren von A, die im Zustandsraum H eine Basis bilden. Wir bezeichnen diese Vektoren mit |u in ⟩ A|u in ⟩ = a n |u in ⟩ ,
n = 1, 2, . . . ;
i = 1, 2, . . . , g n
(D-52)
Darin ist g n der Entartungsgrad des Eigenwerts a n , also die Dimension des zu a n ge hörenden Eigenraums Hn . Es gilt
⟨u in |u in ⟩ = δ nn δ ii
(D-53)
Welche Gestalt hat die Matrix, die in dieser Basis die Observable B darstellt? Nach Satz II wissen wir, dass die Matrixelemente ⟨u in |B|u in ⟩ für n ≠ n gleich null sind; für den Fall n = n und i ≠ i können wir dagegen nichts sagen. Ordnen wir die Basisvek toren |u in ⟩ in der Reihenfolge g
|u 11 ⟩, |u 21 ⟩, . . . , |u 11 ⟩ ;
g
|u 12 ⟩, |u 22 ⟩, . . . , |u 22 ⟩ ;
|u 13 ⟩, . . .
134 | II Der mathematische Rahmen
an, so erhalten wir für B eine „Blockdiagonalmatrix“ mit der Form H1
H1
..
.
..
.
..
.
..
.
..
.
..
.
.
..
.
..
.
.. H2
0
H2
H3
...
0
0
0
..
0
0
. ..
H3
0
0
.. ..
.. .
0
0
.
..
.
..
.
..
.
..
.
.
..
.
.
..
.
0
(D-54)
0 ..
.
..
.
Nur in den gepunkteten Bereichen können von null verschiedene Matrixelemente ste hen. Es wird anschaulich deutlich, dass die verschiedenen Eigenräume Hn hinsicht lich der Wirkung der Observablen B invariant sind. Es können zwei Fälle auftreten: 1. Ist a n ein einfacher Eigenwert, so gibt es nur einen Eigenvektor |u n ⟩ (der obere Index i ist dann überflüssig), und der Raum H1 ist eindimensional. In der Matrix Gl. (D-54) ist der zugehörige Block eine 1 × 1-Matrix, also eine Zahl. In der zu |u n ⟩ gehörenden Spalte bzw. Zeile sind alle anderen Matrixelemente gleich null. Dies drückt die Tatsache aus, dass |u n ⟩ ein gemeinsamer Eigenvektor von A und B ist. 2. Ist a n ein entarteter Eigenwert von A (g n > 1), so ist der Block, der B im Raum Hn repräsentiert, im Allgemeinen keine Diagonalmatrix, weil die |u in ⟩ keine Eigen vektoren von B zu sein brauchen. Wir halten aber fest, dass sich die Wirkung von A auf jeden der g n Vektoren |u in ⟩ auf eine einfache Multiplikation mit a n reduziert, d. h. die Matrix, die die Einschränkung von A auf den Eigenraum Hn repräsentiert, ist gleich a n I, wobei I die g n × g n -Einheits matrix bedeutet. Damit drückt sich die Tatsache aus, dass ein beliebiger Vektor aus Hn Eigenvektor von A zum Eigenwert a n ist. Die Wahl einer Basis {|u in ⟩; i = 1, 2, . . . , g n } ist dann beliebig: Stets ist die Matrix, die A in Hn darstellt, eine Diagonalmatrix und gleich a n I. Dies können wir ausnutzen, um in Hn eine Basis aus Vektoren zu konstru ieren, die gleichzeitig Eigenvektoren von B sind. Ist die von uns gewählte Basis {|u in ⟩; i = 1, 2, . . . , g n }, so sind die Matrixelemente von B (n)
j
β ij = ⟨u in |B|u n ⟩
(D-55)
D Eigenwertgleichungen. Observable
(n)∗
|
135
(n)
Diese Matrix ist hermitesch (β ji = β ij ), weil B ein hermitescher Operator ist. Sie ist daher diagonalisierbar, man kann also in Hn eine Basis {|v in ⟩; i = 1, 2, . . . , g n } finden, so dass B durch eine Diagonalmatrix dargestellt wird: (n)
j
⟨v in |B|v n ⟩ = β i δ ij
(D-56)
Dies bedeutet, dass die so gewählten Basisvektoren in Hn Eigenvektoren von B sind: (n)
B|v in ⟩ = β i |v in ⟩
(D-57)
Wie wir oben gesehen haben, sind diese Vektoren automatisch auch Eigenvektoren von A zum Eigenwert a n , denn sie gehören zu Hn . Wir betonen jedoch noch einmal, dass die Eigenvektoren von A zu entarteten Eigenwerten nicht zwingend auch Eigen vektoren von B sind. Gezeigt haben wir lediglich Folgendes: Es ist immer möglich, in jedem Eigenraum von A eine Basis aus Vektoren zu bilden, die gleichzeitig Eigenvek toren von A und von B sind. Führen wir dies für alle Unterräume Hn aus, so erhalten wir in H eine Basis aus gemeinsamen Eigenvektoren von A und B. Bemerkungen: 1. Von jetzt an bezeichnen wir die gemeinsamen Eigenvektoren von A und B mit |u in,p ⟩: A|u in,p ⟩ = a n |u in,p ⟩ B|u in,p ⟩ = b p |u in,p ⟩
(D-58)
Durch die Indizes n bzw. p kennzeichnen wir die Eigenwerte a n von A bzw. b p von B; mit dem weiteren Index i können wir, falls erforderlich, die Eigenvektoren unterscheiden, die zum selben Eigenwert a n bzw. b p gehören, s. weiter unten. 2. Der Beweis der Umkehrung von Satz III ist leicht: Existiert für A und B eine Basis von gemein samen Eigenvektoren, so sind diese beiden Observablen vertauschbar. Mit Gl. (D-58) ist nämlich AB|u in,p ⟩ = b p A|u in,p ⟩ = b p a n |u in,p ⟩ BA|u in,p ⟩ = a n B|u in,p ⟩ = a n b p |u in,p ⟩
(D-59)
und weiter nach Subtraktion dieser beiden Gleichungen [A, B]|u in,p ⟩ = 0
(D-60)
Diese Beziehung gilt für alle i, n, p. Weil aber nach Voraussetzung die |u in,p ⟩ eine Basis in H bilden, muss [A, B] = 0 sein. 3. Bei unseren weiteren Überlegungen werden wir die Eigenwertgleichung einer Observablen C zu lösen haben, für die (mit zwei Observablen A und B) C= A+B
und [A, B] = 0
(D-61)
gilt. Dies gelingt, wenn wir für A und B eine Basis {|u in,p ⟩} von gemeinsamen Eigenvektoren ken nen. Man erkennt unmittelbar, dass |u in,p ⟩ auch Eigenvektor von C zum Eigenwert a n + b p ist. Die Tatsache, dass {|u in,p ⟩} eine Basis bildet, ist offensichtlich wesentlich: So zeigt man z. B. leicht, dass alle Eigenwerte von C in der Form a n + b p geschrieben werden können.
136 | II Der mathematische Rahmen
D-3-b Vollständiger Satz kommutierender Observabler (V. S. K. O.) Wir betrachten eine Observable A und eine Basis in H, die aus den Eigenvektoren |u in ⟩ von A gebildet wird. Ist keiner der Eigenwerte von A entartet, so können die ver schiedenen Basisvektoren durch die Eigenwerte a n gekennzeichnet werden, und der Index i ist überflüssig. Alle Eigenräume sind dann eindimensional, die Angabe des Ei genwerts bestimmt (bis auf einen Faktor) eindeutig den zugehörigen Eigenvektor. Mit anderen Worten gibt es in H nur eine einzige Basis aus Eigenvektoren von A (falls wir zwei Basen nicht als verschieden ansehen, deren Vektoren zueinander proportional sind). Sind dagegen gewisse Eigenwerte von A entartet (es genügt, dass dies auch nur für einen Eigenwert zutrifft), so reicht die Angabe des Eigenwerts a n nicht immer zur Charakterisierung eines Basisvektors aus, weil zu entarteten Eigenwerten mehrere li near unabhängige Vektoren gehören. In diesem Fall ist die aus Eigenvektoren von A gebildete Basis offensichtlich nicht eindeutig: In jedem mehr als eindimensionalen Eigenraum Hn kann man nämlich eine beliebige Basis auswählen. Wir nehmen nun eine weitere Observable B, die mit der Observablen A vertauscht, und konstruieren mit den gemeinsamen Eigenvektoren von A und B eine orthonor mierte Basis. Nach Definition bilden A und B einen vollständigen Satz kommutieren der Observabler (V. S. K. O.), wenn diese Basis (bis auf Phasenfaktoren) eindeutig ist, d. h. wenn zu jedem möglichen Paar {a n , b p } von Eigenwerten genau ein Basisvektor gehört⁷. Sind die Eigenwerte einer Observablen A (wie weiter oben) sämtlich einfach, ist also die aus den Eigenvektoren von A gebildete Basis (bis auf Proportionalität) ein deutig, so sagt man, A bilde für sich einen V. S. K. O. Bemerkung: Im vorangegangenen Unterabschnitt konstruierten wir eine Basis von gemeinsamen Eigenvekto ren, indem wir die Eigenwertgleichung für B in jedem Eigenraum Hn lösten. Damit die Observa blen A und B einen V. S. K. O. bilden, ist notwendig und hinreichend, dass in jedem Eigenraum die jeweils g n Eigenwerte von B sämtlich verschieden sind: Weil alle Vektoren aus Hn zum selben Eigenwert a n von A gehören, können dann die g n Vektoren |v in ⟩ durch den zu ihnen gehörenden Eigenwert von B unterschieden werden. Dabei müssen nicht alle Eigenwerte von B nichtentartet sein: Vektoren |v in ⟩ zu zwei verschiedenen Eigenräumen Hn können denselben Eigenwert von B haben. Sind übrigens alle Eigenwerte von B einfach, genügt es, B allein als V. S. K. O. zu wählen.
Wenn für wenigstens ein Paar {a n , b p } mehrere voneinander unabhängige Vektoren existieren, die zugleich Eigenvektoren von A und B zu diesen Eigenwerten sind, so ist die Menge {A, B} kein vollständiger Satz von Observablen. Wir fügen dann eine dritte Observable C hinzu, die sowohl mit A wie mit B kommutiert. In Verallgemeinerung der vorstehenden Überlegungen können wir sagen: Entspricht dem Paar {a n , b p } genau ein Vektor, so ist dieser auch Eigenvektor von C; gibt es dagegen mehrere Vektoren, so
7 Das Wort „vollständig“ wird hier in einem ganz anderen Sinn als in § A-2-a verwendet und tritt in dieser Bedeutung nur in der Quantenmechanik auf.
E Zwei wichtige Beispiele | 137
bilden diese einen Eigenraum Hn,p , in dem man eine Basis aus Vektoren konstruie ren kann, die auch Eigenvektoren von C sind. Man verschafft sich auf diese Weise eine orthonormierte Basis von gemeinsamen Eigenvektoren zu A, B und C. Diese drei Ob servablen bilden dann einen V. S. K. O., wenn diese Basis (bis auf einen Phasenfaktor) eindeutig ist, d. h. wenn die Angabe eines Eigenwerttripels {a n , b p , c r } genau einen der Basisvektoren charakterisiert. Falls dies nicht der Fall ist, so fügt man zu A, B und C eine weitere Observable D hinzu, die mit diesen drei Observablen vertauscht usw. Wir gelangen somit zu der Feststellung: Eine Menge von Observablen A, B, C, . . . bildet einen vollständigen Satz kommu tierender Observabler, wenn 1. alle Observablen A, B, C, . . . paarweise vertauschen und 2. die Angabe der Eigenwerte aller dieser Operatoren ausreicht, um (bis auf einen Faktor) eindeutig einen gemeinsamen Eigenvektor zu bestimmen. Eine äquivalente Formulierung lautet: Eine Menge von Observablen A, B, C, . . . bildet einen vollständigen Satz kommu tierender Observabler, wenn eine orthonormierte Basis gemeinsamer Eigenvektoren existiert und diese Basis (bis auf einen Phasenfaktor) eindeutig ist. Die vollständigen Sätze kommutierender Observabler spielen in der Quantenme chanik eine wichtige Rolle. Im Folgenden werden wir zahlreiche Beispiele kennenler nen, s. insbesondere § E-2-d und die Lösungen zu den Aufgaben 11 und 12 in Ergän zung HII . Bemerkungen: 1. Ist {A, B} ein V. S. K. O., so kann man durch Hinzufügen einer mit A und B kommutierenden Observablen C einen weiteren V. S. K. O. erhalten. Im Allgemeinen hält man sich aber an „mini male“ Mengen von Observablen, d. h. an solche, die keinen V. S. K. O. mehr bilden, sobald man eine Observable entfernt. 2. Bildet die Menge {A, B, C, . . .} einen V. S. K. O., so genügt zur Charakterisierung eines Basis kets (bis auf einen Faktor) die Angabe der Eigenwerte a n , b p , c r , . . . Darum schreibt man für die sen Ket manchmal |a n , b p , c r , . . .⟩. 3. Für ein bestimmtes physikalisches System existieren mehrere vollständige Sätze kommutie render Observabler. Einen speziellen Fall werden wir in § E-2-d kennenlernen.
E Zwei wichtige Beispiele Wir kehren in diesem Abschnitt zum Raum F der Wellenfunktionen eines Teilchens zurück oder genauer zu dem ihm zugeordneten Zustandsraum Hr , den wir wie folgt definiert hatten: Jeder Wellenfunktion ψ(r) entspricht ein Ket |ψ⟩ ∈ Hr ; der Zusam menhang ist dabei linear. Weiter ist das Skalarprodukt der beiden Kets gleich dem Skalarprodukt der zugehörigen Wellenfunktionen: ⟨φ|ψ⟩ = ∫ d3 r φ∗ (r) ψ(r) Hr ist daher der Zustandsraum eines Teilchens (ohne Spin).
(E-1)
138 | II Der mathematische Rahmen
Wir wollen in diesem Raum zwei Darstellungen und zwei besonders wichtige Ope ratoren definieren und untersuchen, die wir dann in Kapitel III der Lage und dem Im puls des Teilchens zuordnen. Dabei erhalten wir zugleich Gelegenheit, die in den vor angegangenen Abschnitten eingeführten Begriffe anzuwenden.
E-1 Die Orts- und die Impulsdarstellung E-1-a Definition In § A-3 hatten wir mit den Funktionenmengen {ξr0 (r)} und {vp0 (r)} zwei besondere „Basen“ in F eingeführt, deren Elemente nicht zu F gehören: ξr0 (r) = δ(r − r0 ) vp0 (r) =
(E-2a)
i p ⋅r (2πℏ)−3/2 e ℏ 0
(E-2b)
Man kann jedoch jede quadratintegrable und hinreichend reguläre Funktion nach ei ner dieser „Basen“ entwickeln. Darum werden wir die Anführungszeichen fortlassen und jeder Funktion aus die sen Basen einen Ket zuordnen (s. § B-2-c). Den zu ξr0 (r) gehörenden Ket bezeichnen wir einfach mit |r0 ⟩ und den zu vp0 (r) mit |p0 ⟩: ξr0 (r) ⇐⇒ |r0 ⟩
(E-3a)
vp0 (r) ⇐⇒ |p0 ⟩
(E-3b)
Ausgehend von den Basen {ξr0 (r)} und {vp0 (r)} in F definieren wir nun in Hr zwei Darstellungen: die {|r0 ⟩}- und die {|p0 ⟩}-Darstellung. Ein Basisvektor der ersten Dar stellung ist durch drei „kontinuierliche Indizes“, nämlich die Koordinaten x0 , y0 und z0 eines Punktes im dreidimensionalen Raum, gekennzeichnet, für einen Basisvektor der zweiten Darstellung sind die drei Indizes ebenfalls die Komponenten eines ge wöhnlichen Vektors. E-1-b Orthonormierungsbedingungen und Vollständigkeitsrelation Wir berechnen das Skalarprodukt ⟨r0 |r0 ⟩. Nach Definition ist im Raum Hr ⟨r0 |r0 ⟩ = ∫ d3 r ξr∗0 (r) ξr0 (r) = δ(r0 − r0 )
(E-4a)
wobei wir die Beziehung (A-55) berücksichtigt haben. Genauso ist nach Gl. (A-47) ⟨p0 |p0 ⟩ = ∫ d3 r v∗p0 (r) vp0 (r) = δ(p0 − p0 )
(E-4b)
Die auf diese Weise eingeführten Basen sind im weiteren Sinne orthonormiert.
E Zwei wichtige Beispiele | 139
Man kann die Tatsache, dass die Menge der |r0 ⟩ bzw. der |p0 ⟩ in Hr eine Basis bilden, durch eine Vollständigkeitsrelation wie in Gl. (C-10) ausdrücken, wobei jetzt über drei Indizes zu summieren ist. Damit gelten die folgenden grundlegenden Beziehungen ⟨r0 |r0 ⟩ = δ(r0 − r0 )
(a)
⟨p0 |p0 ⟩ = δ(p0 − p0 )
(c)
∫ d3 r0 |r0 ⟩⟨r0 | = 𝟙
(b)
∫ d3 p0 |p0 ⟩⟨p0 | = 𝟙
(d)
(E-5)
E-1-c Die Komponenten eines Ketvektors Wir betrachten einen beliebigen, der Wellenfunktion ψ(r) entsprechenden Ket |ψ⟩. Mit den eben angegebenen Vollständigkeitsrelationen können wir diesen Ket durch die beiden Formen |ψ⟩ = ∫ d3 r0 |r0 ⟩⟨r0 |ψ⟩
(E-6a)
|ψ⟩ = ∫ d3 p0 |p0 ⟩⟨p0 |ψ⟩
(E-6b)
ausdrücken. Die Koeffizienten ⟨r0 |ψ⟩ und ⟨p0 |ψ⟩ ergeben sich mit den Beziehungen ⟨r0 |ψ⟩ = ∫ d3 r ξr∗0 (r) ψ(r)
(E-7a)
⟨p0 |ψ⟩ = ∫ d3 r v∗p0 (r) ψ(r)
(E-7b)
⟨r0 |ψ⟩ = ψ(r0 )
(E-8a)
⟨p0 |ψ⟩ = ψ(p0 )
(E-8b)
zu
ψ(p) ist dabei die Fourier-Transformierte von ψ(r). Die Komponente des Kets |ψ⟩ bezüglich des Basisvektors |r0 ⟩ der Ortsdarstellung ist gerade gleich dem Wert der Wellenfunktion ψ(r) an der Stelle r0 . Die „Wellen funktion im Impulsraum“ ψ(p) wird entsprechend interpretiert. Die Möglichkeit, |ψ⟩ durch ψ(r) zu charakterisieren, ist demnach einfach ein Spezialfall der Ergebnisse aus § C-3-a. Für |ψ⟩ = |p0 ⟩ liefert Gl. (E-8a) z. B. i p ⋅r 0 0
⟨r0 |p0 ⟩ = vp0 (r0 ) = (2πℏ)−3/2 e ℏ
(E-9)
während für |ψ⟩ = |r0 ⟩ das Ergebnis in Übereinstimmung mit der Orthonormierungs bedingung (E-5a) steht: ⟨r0 |r0 ⟩ = ξr0 (r0 ) = δ(r0 − r0 )
(E-10)
140 | II Der mathematische Rahmen
Nachdem wir die Wellenfunktion ψ(r) und ihre Fourier-Transformierte ψ(p) auf diese Weise interpretiert haben, werden wir die Basisvektoren der beiden Darstellun gen durch |r⟩ bzw. |p⟩ kennzeichnen, also den Index 0 fortlassen. Dann lauten die Gleichungen (E-8) ⟨r|ψ⟩ = ψ(r)
(E-8a)
⟨p|ψ⟩ = ψ(p)
(E-8b)
und die vier Beziehungen (E-5) ⟨r|r ⟩ = δ(r − r )
(a)
⟨p|p ⟩ = δ(p − p )
(c)
∫ d3 r |r⟩⟨r| = 𝟙
(b)
∫ d3 p |p⟩⟨p| = 𝟙
(d)
(E-5)
r und p sind hier immer als Mengen mit den kontinuierlichen Indizes {x, y, z} bzw. {p x , p y , p z } aufzufassen, mit denen die Kets in der Orts- bzw. Impulsdarstellung ge kennzeichnet werden. Es sei jetzt {u i (r)} eine orthonormierte Basis in F . Jedem u i (r) ordnen wir einen Ket |u i ⟩ in Hr zu. Die Menge {|u i ⟩} bildet in Hr eine orthonormierte Basis, genügt also der Vollständigkeitsrelation: ∑ |u i ⟩⟨u i | = 𝟙
(E-11)
i
Bilden wir für beide Seiten dieser Gleichung das Matrixelement zwischen |r⟩ und |r ⟩, so erhalten wir ∑⟨r|u i ⟩⟨u i |r ⟩ = ⟨r|𝟙|r ⟩ = ⟨r|r ⟩
(E-12)
i
und hieraus ergibt sich wegen Gl. (E-8a) und Gl. (E-5a) ∑ u i (r)u ∗i (r ) = δ(r − r )
(E-13)
i
Die Vollständigkeitsrelation für die Funktionenmenge {u i (r)} [Gl. (A-32)] ist daher ein fach die Übersetzung der vektoriellen Vollständigkeitsrelation (E-11) in die Ortsdar stellung. E-1-d Skalarprodukt zweier Vektoren Mit Gl. (E-1) haben wir das Skalarprodukt zweier Kets aus dem Raum Hr über das Ska larprodukt der ihnen in F zugeordneten Wellenfunktionen definiert. In der Formulie rung des vorstehenden Abschnitts erscheint diese Definition einfach als ein Spezial fall der Gl. (C-21). Gleichung (E-1) ergibt sich nämlich, wenn man zwischen ⟨φ| und |ψ⟩ die Vollständigkeitsrelation (E-5b) schiebt: ⟨φ|ψ⟩ = ∫ d3 r ⟨φ|r⟩⟨r|ψ⟩
(E-14)
E Zwei wichtige Beispiele |
141
und die Komponenten ⟨r|ψ⟩ und ⟨r|φ⟩ wie in Gl. (E-8a) interpretiert. Begibt man sich in die {|p⟩}-Darstellung (Impulsdarstellung), so gelangt man zu einer Beziehung, die in Zusammenhang mit der Fourier-Transformation wohlbekannt ist, s. Anhang I, § 2-c: ⟨φ|ψ⟩ = ∫ d3 p ⟨φ|p⟩⟨p|ψ⟩ = ∫ d3 p φ ∗ (p) ψ(p)
(E-15)
E-1-e Übergang von der Orts- in die Impulsdarstellung Der Übergang von der Ortsdarstellung mit der Basis {|r⟩} in die Impulsdarstellung mit der Basis {|p⟩} geschieht nach der in § C-5 angegebenen Methode. Der Unterschied besteht lediglich darin, dass wir es jetzt mit kontinuierlichen Basen zu tun haben. Mit Hilfe der Zahlen i p⋅r
⟨r|p⟩ = ⟨p|r⟩∗ = (2πℏ)−3/2 e ℏ
(E-16)
gelangen wir von der einen in die andere Darstellung. Ein bestimmter Ket |ψ⟩ wird in der Ortsdarstellung durch ⟨r|ψ⟩ = ψ(r) und in der Impulsdarstellung durch ⟨p|ψ⟩ = ψ(p) repräsentiert. Wir wissen bereits, Gl. (E-7b), dass ψ(r) und ψ(p) Fourier-Trans formierte zueinander sind. Genau dies aber liefern die Formeln für den Darstellungs wechsel. Es ist ⟨r|ψ⟩ = ∫ d3 p ⟨r|p⟩⟨p|ψ⟩ also i p⋅r
ψ(r) = (2πℏ)−3/2 ∫ d3 p e ℏ
ψ(p)
(E-17)
− i p⋅r ℏ ψ(r)
(E-18)
Umgekehrt ist ⟨p|ψ⟩ = ∫ d3 r ⟨p|r⟩⟨r|ψ⟩ und daher ψ(p) = (2πℏ)−3/2 ∫ d3 r e
Von Gl. (C-56) ausgehend kann man aus den Matrixelementen ⟨r |A|r⟩ = A(r , r) für einen Operator A in der Ortsdarstellung leicht die Matrixelemente ⟨p |A|p⟩ = A(p , p) in der Impulsdarstellung erhalten. Es wird: i (p⋅r − p ⋅r )
A(p , p) = (2πℏ)−3 ∫ d3 r ∫ d3 r e ℏ
A(r , r)
(E-19)
Eine entsprechende Beziehung ergibt sich für die Berechnung von A(r , r) aus A(p , p).
142 | II Der mathematische Rahmen
E-2 Orts- und Impulsoperator E-2-a Definition Es sei |ψ⟩ ein beliebiger Ket aus Hr und ⟨r|ψ⟩ = ψ(r) ≡ ψ(x, y, z) die zugehörige Wel lenfunktion. Ist weiter in der Ortsdarstellung die Wellenfunktion ⟨r|ψ ⟩ = ψ (r) ≡ ψ (x, y, z) durch ψ (x, y, z) = x ψ(x, y, z)
(E-20)
gegeben, so definieren wir den Operator X durch die Gleichung |ψ ⟩ = X|ψ⟩
(E-21)
In der Ortsdarstellung besteht die Wirkung des Operators X also in einer Multiplika tion mit dem Faktor x. Entsprechend führt man die weiteren Operatoren Y und Z ein, indem man definiert ⟨r|X|ψ⟩ = x⟨r|ψ⟩
(E-22a)
⟨r|Y|ψ⟩ = y⟨r|ψ⟩
(E-22b)
⟨r|Z|ψ⟩ = z⟨r|ψ⟩
(E-22c)
worin die Zahlen x, y und z gerade die drei Indizes sind, die den Ket |r⟩ kennzeichnen. X, Y und Z werden als die Komponenten eines Vektoroperators R aufgefasst: An dieser Stelle ist dies nichts weiter als eine abgekürzte Schreibweise, die durch die Tatsache nahegelegt wird, dass x, y und z die Komponenten des Ortsvektors r sind. Die Handhabung der Operatoren X, Y und Z erweist sich in der Ortsdarstellung als besonders einfach. Will man z. B. das Matrixelement ⟨φ|X|ψ⟩ berechnen, so ge nügt es, die Vollständigkeitsrelation (E-5b) zwischen ⟨φ| und X zu schieben und die Definition (E-22) zu berücksichtigen: ⟨φ|X|ψ⟩ = ∫ d3 r ⟨φ|r⟩⟨r|X|ψ⟩ = ∫ d3 r φ∗ (r) x ψ(r)
(E-24)
Auf die gleiche Weise kann man den Vektoroperator P durch seine Komponen ten P x , P y und P z definieren, die in der Impulsdarstellung, in der die Kets |p⟩ die Basis bilden, durch die Gleichungen ⟨p|P x |ψ⟩ = p x ⟨p|ψ⟩
(E-25a)
⟨p|P y |ψ⟩ = p y ⟨p|ψ⟩
(E-25b)
⟨p|P z |ψ⟩ = p z ⟨p|ψ⟩
(E-25c)
gegeben sind; die p x , p y und p z sind dabei die drei Indizes, durch die der Ket |p⟩ be stimmt ist.
E Zwei wichtige Beispiele | 143
Wir fragen, wie der Operator P in der Ortsdarstellung wirkt. Hierzu genügt es, s. § C-5-d, die Vollständigkeitsrelation (E-5d) und die Beziehung (E-16) für den Basis wechsel zu verwenden: ⟨r|P x |ψ⟩ = ∫ d3 p ⟨r|p⟩⟨p|P x |ψ⟩ i p⋅r
= (2πℏ)−3/2 ∫ d3 p e ℏ
p x ψ(p)
(E-26)
Auf der rechten Seite steht, s. Anhang I, Gl. (38a), gerade die Fourier-Transformierte ∂ von p x ψ(p), d. h. ℏi ∂x ψ(r). Somit erhalten wir ℏ ∇⟨r|ψ⟩ (E-27) i In der Ortsdarstellung stimmt der Operator P mit dem auf die Wellenfunktion wirken den Differentialoperator ℏi ∇ überein. Demnach wird z. B. das Matrixelement ⟨φ|P x |ψ⟩ in der Ortsdarstellung wie folgt berechnet: ⟨r|P|ψ⟩ =
⟨φ|P x |ψ⟩ = ∫ d3 r ⟨φ|r⟩⟨r|P x |ψ⟩ = ∫ d3 r φ∗ (r) [
ℏ ∂ ] ψ(r) i ∂x
(E-28)
Man kann sich auch in die Ortsdarstellung begeben, um die Kommutatoren der Ope ratoren X, Y bzw. Z und P x , P y bzw. P z zu berechnen. So erhält man z. B. ⟨r| [X, P x ] |ψ⟩ = ⟨r|(XP x − P x X)|ψ⟩ ℏ ∂ ⟨r|X|ψ⟩ i ∂x ℏ ∂ ℏ ∂ = x ⟨r|ψ⟩ − x⟨r|ψ⟩ i ∂x i ∂x = iℏ ⟨r|ψ⟩ = x⟨r|P x |ψ⟩ −
(E-29)
Diese Rechnung gilt für jeden beliebigen Ket |ψ⟩ und jeden Basisket |r⟩, so dass wir auch schreiben können⁸ [X, P x ] = iℏ
(E-30)
Auf die gleiche Weise ermittelt man die anderen Kommutatoren, die zwischen den Komponenten von R und P möglich sind. Das Ergebnis können wir in der Form [R i , R j ] = 0 [P i , P j ] = 0
(i, j = 1, 2, 3)
(E-31)
[R i , P j ] = iℏ δ ij
8 Der Kommutator [X, P x ] ist ein Operator, weshalb wir in Strenge [X, P x ] = iℏ𝟙 schreiben müssten. Im Folgenden werden wir meist den Einheitsoperator unterdrücken und durch die Zahl 1 ersetzen, falls es auf den Unterschied nicht ankommt.
144 | II Der mathematische Rahmen
ausdrücken. Hierbei bezeichnen wir mit R1 , R2 und R3 die Operatoren X, Y und Z und mit P1 , P2 und P3 die Operatoren P x , P y und P z . Man nennt diese Gleichungen die kanonischen Vertauschungsrelationen. E-2-b Hermitezität des Orts- und Impulsoperators Für einen Beweis der Hermitezität z. B. des Operators X genügt die Verwendung von Gl. (E-24): ⟨φ|X|ψ⟩ = ∫ d3 r φ∗ (r) x ψ(r) = [∫ d3 r ψ∗ (r) x φ(r)]
∗
= ⟨ψ|X|φ⟩∗
(E-32)
s. § B-4-d. Ebenso zeigt man die Hermitezität von Y und Z, während man für den Be weis der Hermitezität der Operatoren P x , P y und P z am einfachsten in die Impulsdar stellung wechselt. Wir können die Hermitezität von P auch zeigen, indem wir von Gl. (E-27) ausgehen. Nehmen wir z. B. Gl. (E-28) für die x-Komponente dieses Operators, so können wir auf der rechten Seite partiell integrieren: +∞
ℏ ∂ ⟨φ|P x |ψ⟩ = ∫ dy dz ∫ dx φ∗ (r) ψ(r) i ∂x −∞
+∞
} { ∂ ℏ x=+∞ (E-33) ∫ dy dz {[φ∗ (r)ψ(r)] x=−∞ − ∫ dx ψ(r) φ∗ (r)} i ∂x −∞ } { Damit das Integral für das Skalarprodukt ⟨φ|ψ⟩ konvergiert, muss φ∗ (r)ψ(r) für x → ±∞ gegen null gehen. Der ausintegrierte Term verschwindet also, und wir erhalten ℏ ∂ ⟨φ|P x |ψ⟩ = − ∫ d3 r ψ(r) φ∗ (r) i ∂x ∗ ℏ ∂ = [ ∫ d3 r ψ∗ (r) φ(r)] i ∂x =
= ⟨ψ|P x |φ⟩∗
(E-34)
Wir sehen, dass das Auftreten der imaginären Einheit i für die Hermitezität von P x we sentlich ist: Der Differentialoperator ∂/∂x, der im Funktionenraum F wirkt, ist nicht hermitesch, weil bei der partiellen Integration ein Vorzeichenwechsel geschieht. Dies ∂ ∂ sind erst der Operator i ∂x sowie der Operator ℏi ∂x . E-2-c Eigenvektoren des Orts- und des Impulsoperators Wir betrachten die Wirkung des Operators X auf den Ket |r0 ⟩. Nach Gl. (E-22a) haben wir ⟨r|X|r0 ⟩ = x ⟨r|r0 ⟩ = x δ(r − r0 ) = x0 δ(r − r0 ) = x0 ⟨r|r0 ⟩
(E-35)
E Zwei wichtige Beispiele |
145
In der Ortsdarstellung ergeben sich also die Komponenten des Kets X|r0 ⟩, indem man die Komponenten des Kets |r0 ⟩ mit x0 multipliziert (r0 ist Eigenvektor von X). Darum gilt X|r0 ⟩ = x0 |r0 ⟩
(E-36)
Wir können die gleiche Überlegung auch für die Operatoren Y und Z durchführen und erhalten, wenn wir den Index 0 unterdrücken, die Beziehungen X|r⟩ = x |r⟩ Y|r⟩ = y |r⟩
(E-37)
Z|r⟩ = z |r⟩ Die Kets |r⟩ sind also gemeinsame Eigenvektoren von X, Y und Z. Dies rechtfertigt die von uns eingeführte Schreibweise: Jeder Eigenvektor ist durch einen Vektor r festge legt, dessen Komponenten x, y und z drei kontinuierliche Indizes repräsentieren, die gerade den Eigenwerten von X, Y und Z entsprechen. Ganz ähnliche Überlegungen gelten für den Impulsoperator P, wenn man sich in die Impulsdarstellung begibt. Wir erhalten P x |p⟩ = p x |p⟩ P y |p⟩ = p y |p⟩
(E-38)
P z |p⟩ = p z |p⟩ Bemerkung: Zu diesem Ergebnis gelangt man auch, indem man von Gl. (E-27) ausgeht, die die Wirkung von P in der Ortsdarstellung beschreibt. Mit Gl. (E-9) findet man ⟨r|P x |p⟩ =
i p⋅r ℏ ∂ ℏ ∂ ⟨r|p⟩ = (2πℏ)−3/2 e ℏ i ∂x i ∂x i p⋅r
= p x (2πℏ)−3/2 e ℏ
= p x ⟨r|p⟩
(E-39)
Die Komponenten des Kets P x|p⟩ in der Ortsdarstellung erhält man, indem man die Komponenten von |p⟩ mit der Konstanten p x multipliziert: |p⟩ ist Eigenket von P x zum Eigenwert p x .
E-2-d Observableneigenschaft des Orts- und Impulsoperators Die Beziehungen (E-5b) und (E-5d) drücken die Tatsache aus, dass die Vektorenmen gen {|r⟩} und {|p⟩} in Hr jeweils eine Basis bilden. Daher sind der Ortsoperator R und der Impulsoperator P Observable. Weiter bestimmt die Angabe der drei Eigenwerte x0 , y0 und z0 der Operatoren X, Y und Z eindeutig den zugehörigen Eigenvektor |r0 ⟩: In der Ortsdarstellung sind seine Komponenten δ(x − x0 )δ(y − y0 )δ(z − z0 ). Die Menge der drei Operatoren X, Y und Z
146 | II Der mathematische Rahmen bilden also in Hr einen V. S. K. O. Ebenso kann man zeigen, dass auch die Komponen ten P x , P y und P z in Hr einen V. S. K. O. bilden. Zu beachten ist, dass in Hr der Operator X allein noch keinen V. S. K. O. bildet. Bei vorgegebenem Index x0 können y0 und z0 noch beliebige reelle Werte annehmen, so das der Eigenwert x0 unendlich oft entartet ist. Dagegen ist X im Raum Hx eines eindimensionalen Problems ein V. S. K. O.: Der Eigenwert x0 bestimmt auf eindeutige Weise den einzigen Eigenket |x0 ⟩; in der {|x⟩}-Darstellung sind seine Komponenten die δ-Funktionen δ(x − x0 ). Bemerkung: Bisher haben wir in Hr zwei V. S. K. O. gefunden: die Operatorenmengen {X, Y, Z} und {P x , P y , P z }. Weitere V. S. K. O. werden wir später kennenlernen. Hier nennen wir nur ein Beispiel: Bei der Men ge {X, P y , P z } vertauschen die Operatoren paarweise, s. Gl. (E-31). Gibt man andererseits die drei Eigenwerte x0 , p0y und p0z vor, so gehört dazu ein einziger Ket, und die ihm entsprechende Wel lenfunktion lautet i (p y+p z) 1 ψ x0 ,p0y ,p0z (x, y, z) = δ(x − x 0 ) (E-40) e ℏ 0y 0z 2πℏ
F Tensorprodukte von Zustandsräumen F-1 Einführung Bis jetzt haben wir den Zustandsraum eines physikalischen Systems eingeführt, in dem wir vom Begriff der Wellenfunktion eines Teilchens ausgingen, und zwar für den ein- und den dreidimensionalen Fall. Nun ist klar, dass der Raum der quadratinte grablen Funktionen nicht derselbe ist, wenn wir einmal Funktionen ψ(x) von einer Veränderlichen und einmal Funktionen ψ(r) von drei unabhängigen Veränderlichen betrachten. Damit sind auch die Zustandsräume Hx und Hr verschieden: Hr erscheint als eine Verallgemeinerung von Hx . Gibt es zwischen diesen beiden Räumen eine ge nauere Beziehung? In diesem Abschnitt werden wir den Begriff des Tensorprodukts (manchmal auch Kronecker-Produkt genannt) von Vektorräumen einführen und ihn auf Zustandsräume anwenden. Wir werden dann sehen, dass man den Raum Hr konstruieren kann, indem man vom Raum Hx und zwei zu ihm isomorphen Räumen Hy und Hz ausgeht. Weiter werden wir uns später (Kapitel IV und IX) mit Teilchen befassen, die einen inneren Drehimpuls oder Spin besitzen: Neben den äußeren Freiheitsgraden des Or tes und des Impulses, die man in Hr mit den Observablen R und P beschreibt, muss man dann innere Freiheitsgrade berücksichtigen und Spinobservable einführen, die in einem Spinraum Hs wirken. Der Zustandsraum für ein Teilchen mit Spin erweist sich dann als Tensorprodukt von Hr und Hs . Schließlich erlaubt der Begriff des Tensorprodukts auch die Lösung des folgen den Problems. Gegeben seien zwei isolierte physikalische Systeme (S1 ) und (S2 ) (z. B. sollen sie so weit voneinander entfernt sein, dass man ihre Wechselwirkung vollstän
F Tensorprodukte von Zustandsräumen | 147
dig vernachlässigen kann). Die zu ihnen gehörenden Zustandsräume seien H1 und H2 . Wenn wir jetzt diese beiden Systeme zu einem System (S) zusammenfassen (was z. B. dann notwendig wird, wenn sich diese beiden Systeme so weit nähern, dass sie aufeinander einwirken können), so entsteht die Frage, wie der Zustandsraum des Ge samtsystems H aussieht.
F-2 Definition und Eigenschaften des Tensorprodukts Gegeben seien die beiden⁹ Räume H1 mit der Dimension N1 und H2 mit der Dimen sion N2 (N1 und N2 können endlich oder unendlich sein). Die Vektoren und Operato ren aus den beiden Räumen werden wir durch den Index (1) bzw. (2) kennzeichnen. F-2-a Das Tensorprodukt α Definition Der Vektorraum H heißt Tensorprodukt von H1 und H2 , in Zeichen: H = H1 ⊗ H 2
(F-1)
wenn zu jedem Paar von Vektoren |φ(1)⟩ ∈ H1 und |χ(2)⟩ ∈ H2 ein Vektor aus H gehört. Wir bezeichnen ihn mit |φ(1)⟩ ⊗ |χ(2)⟩
(F-2)
und nennen ihn das tensorielle Produkt von |φ(1)⟩ und |χ(2)⟩.¹⁰ Dieses Produkt besitzt die folgenden Eigenschaften: 1. Es ist linear bezüglich der Multiplikation mit einer komplexen Zahl: [λ|φ(1)⟩] ⊗ |χ(2)⟩ = λ[|φ(1)⟩ ⊗ |χ(2)⟩] |φ(1)⟩ ⊗ [μ|χ(2)⟩] = μ[|φ(1)⟩ ⊗ |χ(2)⟩] 2.
Es ist bezüglich der Vektoraddition distributiv: |φ(1)⟩ ⊗ [|χ 1 (2)⟩ + χ 2 (2)] = |φ(1)⟩ ⊗ |χ 1 (2)⟩ + |φ(1)⟩ ⊗ |χ 2 (2)⟩ [|φ1 (1)⟩ + |φ2 (1)⟩] ⊗ |χ(2)⟩ = |φ1 (1)⟩ ⊗ |χ(2)⟩ + |φ2 (1)⟩ ⊗ |χ(2)⟩
3.
(F-3)
(F-4)
Ist {|u i (1)⟩} eine Basis in H1 und {|v l (2)⟩} eine Basis in H2 , so bildet die Menge der Vektoren |u i (1)⟩ ⊗ |v l (2)⟩ eine Basis in H. Sind die Dimensionen N1 und N2 der Räume H1 und H2 endlich, so hat H die Dimension N1 N2 .
9 Die folgenden Definitionen können ohne Schwierigkeit auf den Fall einer endlichen Zahl von Räu men erweitert werden. 10 Auf die Reihenfolge kommt es dabei nicht an: Der Vektor kann auch mit |χ(2)⟩ ⊗ |φ(1)⟩ bezeichnet werden.
148 | II Der mathematische Rahmen β Vektoren in H 1. Wir betrachten ein tensorielles Produkt |φ(1)⟩ ⊗ |χ(2)⟩, in dem wir |φ(1)⟩ nach der Basis {|u i (1)⟩} und |χ(2)⟩ nach der Basis {|v l (2)⟩} zerlegen können: |φ(1)⟩ = ∑ a i |u i (1)⟩ i
(F-5)
|χ(2)⟩ = ∑ b l |v l (2)⟩ l
Berücksichtigen wir die eben aufgeführten Eigenschaften, so lautet die Entwicklung des Vektors |φ(1)⟩ ⊗ |χ(2)⟩ nach der Basis {|u i (1)⟩ ⊗ |v l (2)⟩} |φ(1)⟩ ⊗ |χ(2)⟩ = ∑ a i b l |u i (1)⟩ ⊗ |v l (2)⟩
(F-6)
i,l
Die Komponenten eines tensoriellen Produkts sind demnach die Produkte der Kom ponenten der beiden in diesem Produkt auftretenden Vektoren. 2. Es gibt in H Vektoren, die nicht als tensorielles Produkt eines Vektors aus H1 mit einem Vektor aus H2 darstellbar sind. Weil nämlich {|u i (1)⟩ ⊗ |v l (2)⟩} eine Basis in H bildet, kann ein beliebiger Vektor |ψ⟩ ∈ H in der Form |ψ⟩ = ∑ c i,l |u i (1)⟩ ⊗ |v l (2)⟩
(F-7)
i,l
geschrieben werden. N1 N2 vorgegebene komplexe Zahlen c i,l kann man aber nicht immer auf die Form eines Produkts a i b l von N1 Zahlen a i und N2 Zahlen b l bringen. Deshalb existieren im Allgemeinen keine Vektoren |φ(1)⟩ und |χ(2)⟩, deren tensoriel les Produkt gleich dem Vektor |ψ⟩ ist. Dagegen kann stets ein beliebiger Vektor |ψ⟩ ∈ H als eine Linearkombination wie in Gl. (F-7) dargestellt werden. γ Skalarprodukt in H Weil in den Räumen H1 und H2 ein Skalarprodukt erklärt ist, kann man auch in H ein Skalarprodukt definieren. Zunächst führt man das Skalarprodukt von |φ(1) χ(2)⟩ = |φ(1)⟩ ⊗ |χ(2)⟩ mit |φ (1) χ (2)⟩ = |φ (1)⟩ ⊗ |χ (2)⟩ ein, indem man ⟨φ (1) χ (2)|φ(1) χ(2)⟩ = ⟨φ (1)|φ(1)⟩⟨χ (2)|χ(2)⟩
(F-8)
setzt. Für zwei beliebige Vektoren aus H genügt es dann, die Eigenschaften eines Ska larprodukts, s. Gl. (B-9) bis (B-11), zu beachten, weil ja beide Vektoren als Linearkom bination von tensoriellen Produkten geschrieben werden können. Die Basis {|u i (1) v l (2)⟩ = |u i (1)⟩ ⊗ |v l (2)⟩} ist orthonormiert, weil es die Basen {|u i (1)⟩} und {|v l (2)⟩} sind: ⟨u i (1) v l (2)|u i (1) v l (2)⟩ = ⟨u i (1)|u i (1)⟩⟨v l (2)|v l (2)⟩ = δ ii δ ll
(F-9)
F Tensorprodukte von Zustandsräumen |
149
F-2-b Tensorprodukt von Operatoren 1. Wir betrachten zunächst einen linearen Operator A(1), der in H1 definiert ist. Man kann ihm einen linearen Operator ̃ A(1) in H zuordnen, der durch die Gleichung ̃ A(1)[|φ(1)⟩ ⊗ |χ(2)⟩] = [A(1)|φ(1)⟩] ⊗ |χ(2)⟩ (F-10) definiert ist und die Fortsetzung von A(1) in H heißt. Mit der Voraussetzung, dass die ser Operator linear sein soll, ist er in H vollständig definiert, weil man einen beliebigen Vektor |ψ⟩ ∈ H in der Form (F-7) schreiben kann und damit ̃ A(1)|ψ⟩ = ∑ c i,l [A(1)|u i (1)⟩] ⊗ |v l (2)⟩ (F-11) i,l
gilt. Entsprechend definiert man die Fortsetzung eines in H2 erklärten Operators B(2). 2. Es seien jetzt A(1) und B(2) zwei lineare Operatoren, die in H1 bzw. H2 wirken. Dann definieren wir das Tensorprodukt A(1)⊗B(2) dieser beiden Operatoren durch die Beziehung [A(1) ⊗ B(2)][|φ(1)⟩ ⊗ |χ(2)⟩] = [A(1)|φ(1)⟩] ⊗ [B(2)|χ(2)⟩]
(F-12)
Auch diese Erklärung ist für die Festlegung von A(1) ⊗ B(2) ausreichend. Bemerkungen: 1. Die Fortsetzungen von Operatoren sind Spezialfälle von Tensorprodukten von Operatoren: ̃ ̃ Sind 𝟙(1) und 𝟙(2) die Einheitsoperatoren in H1 bzw. H2 , so kann man für A(1) und B(2) ̃ A(1) = A(1) ⊗ 𝟙(2) ̃ B(2) = 𝟙(1) ⊗ B(2)
(F-13)
schreiben. Umgekehrt fällt das Tensorprodukt A(1) ⊗ B(2) mit dem gewöhnlichen Produkt der ̃ ̃ beiden Operatoren A(1) und B(2) in H zusammen: ̃ B(2) ̃ A(1) ⊗ B(2) = A(1)
(F-14)
̃ ̃ 2. Es ist leicht zu zeigen, dass zwei Operatoren von der Art A(1) und B(2) in H vertauschen: ̃ ̃ [ A(1), B(2)] =0
(F-15)
̃ B(2) ̃ ̃ A(1) ̃ Hierzu genügt der Nachweis, dass die Wirkung von A(1) und B(2) auf einen Vektor der Basis {|u i (1)⟩ ⊗ |v l (2)⟩} zum selben Resultat führt: ̃ B(2)|u ̃ ̃ A(1) i (1)⟩ ⊗ |v l (2)⟩ = A(1)[|u i (1)⟩ ⊗ (B(2)|v l (2)⟩)] = [A(1)|u i (1)⟩] ⊗ [B(2)|v l (2)⟩]
(F-16)
̃ A(1)|u ̃ ̃ B(2) i (1)⟩ ⊗ |v l (2)⟩ = B(2)[(A(1)|u i (1)⟩) ⊗ |v l (2)⟩] = [A(1)|u i (1)⟩] ⊗ [B(2)|v l (2)⟩]
(F-17)
3. Den Projektor auf den (tensoriellen) Produktvektor |φ(1) χ(2)⟩ = |φ(1)⟩ ⊗ |χ(2)⟩, also einen in H wirkenden Operator, erhält man aus dem Tensorprodukt der Projektoren auf |φ(1)⟩ bzw. |χ(2)⟩: |φ(1) χ(2)⟩⟨φ(1) χ(2)| = |φ(1)⟩⟨φ(1)| ⊗ |χ(2)⟩⟨χ(2)|
(F-18)
Diese Beziehung folgt unmittelbar aus der Definition des Skalarprodukts in H. 4. Wie bei den Vektoren gibt es auch Operatoren in H, die nicht als Tensorprodukt eines Opera tors in H1 und eines Operators in H2 dargestellt werden können.
150 | II Der mathematische Rahmen
F-2-c Bezeichnungen In der Quantenmechanik ist es üblich, die hier eingeführten Bezeichnungen zu ver einfachen. Auch wir wollen dies tun. Zunächst unterdrückt man das Symbol ⊗, mit dem das Tensorprodukt gekenn zeichnet wurde, und stellt die Vektoren oder Operatoren, die man tensoriell multipli ziert, einfach nebeneinander: |φ(1)⟩|χ(2)⟩
bedeutet
|φ(1)⟩ ⊗ |χ(2)⟩
(F-19)
A(1)B(2)
bedeutet
A(1) ⊗ B(2)
(F-20)
Weiter unterscheidet man in der Schreibweise nicht zwischen der Fortsetzung eines Operators in H und diesem Operator selbst: A(1)
bedeutet
̃ A(1)
oder
A(1)
(F-21)
Bei Vektoren ist eine Verwechslung nicht möglich, weil wir eine derartige Notation überhaupt noch nicht verwendet haben. Insbesondere halten wir fest, dass der Aus druck |ψ⟩|φ⟩ in H nicht erklärt ist, wenn |ψ⟩ und |φ⟩ zum selben Raum H gehören; sie wären dann selbst Vektoren aus diesem Produktraum. Dagegen führen die Festsetzungen in Gl. (F-20) und Gl. (F-21) zu Doppeldeutig keiten. Vor allem bei Gl. (F-21) verwendet man ein und dasselbe Symbol für zwei ver schiedene Operatoren, doch wird man in der Praxis die Unterscheidung durch den Vektor treffen, auf den das Symbol dann angewendet wird: Ist dieser Vektor aus dem Produktraum H, so hat man es mit dem Operator ̃ A(1) zu tun, ist der Vektor aus H1 , so mit dem Operator A(1) im engen Sinne. Was die Setzung in Gl. (F-20) angeht, so gibt es kein Problem, wenn die Räume H1 und H2 verschieden sind, weil wir bis jetzt nur Produkte von Operatoren definiert haben, die im selben Raum wirken. Man kann übrigens A(1)B(2) als ein gewöhnliches Produkt von Operatoren in H ansehen, wenn ̃ man unter A(1) und B(2) die Operatoren ̃ A(1) und B(2) versteht, s. Gl. (F-14).
F-3 Eigenwertgleichung im Produktraum Im Folgenden spielen tensorielle Produkte eines Vektors aus H1 mit einem Vektor aus H2 eine wichtige Rolle. Dies gilt auch für die Frage der Fortsetzung von Operatoren aus diesen Räumen. F-3-a Eigenwerte und Eigenvektoren von Operatorfortsetzungen α Eigenwertgleichung für A(1) Wir betrachten einen Operator A(1), von dem wir in H1 sämtliche Eigenwerte und Eigenvektoren kennen. Zum Beispiel nehmen wir an, dass sein Spektrum diskret ist: A(1)|φ in (1)⟩ = a n |φ in (1)⟩
i = 1, 2, . . . , g n
(F-22)
F Tensorprodukte von Zustandsräumen | 151
Wir wollen in H die Eigenwertgleichung der Fortsetzung von A(1) lösen: A(1)|ψ⟩ = λ|ψ⟩
|ψ⟩ ∈ H
(F-23)
Nach Gl. (F-10) erkennt man sofort, dass jeder Vektor von der Form |φ in (1)⟩|χ(2)⟩ (mit beliebigem |χ(2)⟩ ∈ H2 ) Eigenvektor von A(1) zum Eigenwert a n ist: A(1)|φ in (1)⟩|χ(2)⟩ = [A(1)|φ in (1)⟩]|χ(2)⟩ = a n |φ in (1)⟩|χ(2)⟩
(F-24)
Falls A(1) in H1 eine Observable ist, so können wir zeigen, dass wir auf diese Weise alle Lösungen von Gl. (F-23) erhalten. Unter dieser Voraussetzung bilden die |φ in (1)⟩ in H1 eine orthonormierte Basis. Folglich bildet das orthonormierte System der Vektoren i,l |ψ n ⟩ mit i,l
|ψ n ⟩ = |φ in (1)⟩|v l (2)⟩
(F-25) i,l
eine Basis in H, wenn {|v l (2)⟩} eine Basis in H2 ist. Man kennt also mit {|ψ n ⟩} in H eine orthonormierte Basis, die aus den Eigenvektoren von A(1) in H gebildet wird. Damit ist das Problem grundsätzlich gelöst. Es ergeben sich die drei Schlussfolgerungen: 1. Ist der Operator A(1) in H1 eine Observable, so ist er auch in H eine Observable. Dies ergibt sich aus der Tatsache, dass A(1) hermitesch ist und {|ψ i,l n ⟩} in H eine Basis bildet. 2. Das Spektrum von A(1) ist in H dasselbe wie in H1 : Die Eigenwerte a n , die in Gl. (F-24) auftreten, sind dieselben wie die in Gl. (F-22). 3. Ein Eigenwert a n , der in H1 g n -fach entartet ist, besitzt in H eine N2 × g n -fache i,l Entartung. Der Eigenraum zu a n wird in H durch die Vektoren |ψ n ⟩ mit n fest, i = 1, 2, . . . , g n und l = 1, 2, . . . , N2 aufgespannt. Selbst wenn also a n in H1 ein einfacher Eigenwert ist, so ist er in H (N2 -fach) entartet. Der Projektor auf den zu einem Eigenwert a n gehörenden Eigenraum hat in H die Form [Gl. (F-18)] i,l i i ∑ |ψ i,l n ⟩⟨ψ n | = ∑ |φ n (1)⟩⟨φ n (1)| ⊗ |v l (2)⟩⟨v l (2)| i,l
i,l
= ∑ |φ in (1)⟩⟨φ in (1)| ⊗ 𝟙(2)
(F-26)
i
wenn wir in H2 für die Basis {|v l (2)⟩} die Vollständigkeitsrelation berücksichti gen. Er ist also die Fortsetzung des in H1 zu a n gehörenden Projektors P n (1) = ∑i |φ in (1)⟩⟨φ in (1)|.
152 | II Der mathematische Rahmen β Eigenwertgleichung für A(1) + B(2) Häufig werden wir in einem Produktraum wie H Eigenwertgleichungen für Operatoren von der Form C = A(1) + B(2)
(F-27)
lösen müssen, wobei A(1) und B(2) Observable sind, deren Eigenwerte und Eigenvek toren in H1 bzw. H2 bekannt sind: A(1)|φ n (1)⟩ = a n |φ n (1)⟩ B(2)|χ p (2)⟩ = b p |χ p (2)⟩
(F-28)
Der Einfachheit halber nehmen wir hier an, dass die Spektren von A(1) und B(2) in H1 bzw. H2 diskret und nichtentartet sind. Die Operatoren A(1) und B(2) vertauschen [Gl. (F-16) und (F-17)] und die Vektoren |φ n (1)⟩|χ p (2)⟩, die in H eine Basis bilden, sind gemeinsame Eigenvektoren von A(1) und B(2): A(1)|φ n (1)⟩|χ p (2)⟩ = a n |φ n (1)⟩|χ p (2)⟩ B(2)|φ n (1)⟩|χ p (2)⟩ = b p |φ n (1)⟩|χ p (2)⟩
(F-29)
und sie sind auch Eigenvektoren von C: C|φ n (1)⟩|χ p (2)⟩ = (a n + b p )|φ n (1)⟩|χ p (2)⟩
(F-30)
Bemerkung: Gleichung (F-30) zeigt, dass alle Eigenwerte von C von der Form c np = a n + b p sind. Wenn zu ver schiedenen Zahlenpaaren n, p auch verschiedene Werte von c np gehören, ist dieser Wert nicht entartet (wir hatten a n und b p als nichtentartet vorausgesetzt); der zugehörige Eigenvektor von C ist notwendig das tensorielle Produkt |φ n (1)⟩|χ p (2)⟩. Ist dagegen der Eigenwert c np z. B. zwei fach entartet (es existiert ein m und ein q so, dass c mq = c np ), so kann man nur behaupten, dass jeder zu diesem Eigenwert von C gehörende Eigenvektor von der Form λ|φ n (1)⟩|χ p (2)⟩ + μ|φ m (1)⟩|χ q (2)⟩
(F-31)
ist, worin λ und μ beliebige komplexe Zahlen bedeuten. Es gibt also Eigenvektoren von C, die nicht als tensorielle Produkte geschrieben werden können.
F-3-b Vollständige Sätze kommutierender Observabler im Produktraum Wir zeigen schließlich, dass man durch die Wahl je eines V. S. K. O. in H1 und H2 sofort einen V. S. K. O. in H erhält. Wir wollen annehmen, dass A(1) in H für sich einen V. S. K. O. bildet, während in H2 der V. S. K. O. aus den beiden Observablen B(2) und C(2) besteht. Dies bedeutet (s. § D-3-b), dass alle Eigenwerte a n von A(1) in H1 einfach sind: A(1)|φ n (1)⟩ = a n |φ n (1)⟩
(F-32)
F Tensorprodukte von Zustandsräumen | 153
und der Ket |φ n (1)⟩ bis auf einen Faktor eindeutig ist. Dagegen sind in H2 gewisse Eigenwerte b p von B(2) entartet und ebenso bestimmte Eigenwerte c r von C(2). Die gemeinsamen Eigenvektoren von B(2) und C(2) in H2 sind jedoch eindeutig, denn es gibt zu vorgegebenen Eigenwerten b p und c r genau einen Ket (von einem Faktor abgesehen), der Eigenvektor von B(2) und C(2) zu diesen Werten ist: B(2)|χ pr (2)⟩ = b p |χ pr (2)⟩ C(2)|χ pr (2)⟩ = c r |χ pr (2)⟩ |χ pr (2)⟩
(F-33)
ist bis auf einen Faktor eindeutig
In H zeigen die Eigenwerte a n eine N2 -fache Entartung (s. § F-3-a), der Operator A(1) bildet allein keinen V. S. K. O. mehr. Ebenso gibt es N1 linear unabhängige Kets, die Eigenvektoren von B(2) und C(2) zu den Eigenwerten b p und c r sind, und {B(2), C(2)} ist kein V. S. K. O. Wir haben jedoch in § F-3-a gesehen, dass die gemeinsamen Eigen vektoren der drei paarweise vertauschenden Observablen A(1), B(2) und C(2) die Pro duktkets |φ n (1)χ pr (2)⟩ = |φ n (1)⟩|χ pr (2)⟩ sind: A(1)|φ n (1)χ pr (2)⟩ = a n |φ n (1)χ pr (2)⟩ B(2)|φ n (1)χ pr (2)⟩ = b p |φ n (1)χ pr (2)⟩
(F-34)
C(2)|φ n (1)χ pr (2)⟩ = c r |φ n (1)χ pr (2)⟩ Weil {|φ n (1)⟩} und {|χ pr (2)⟩} Basen in H1 bzw. H2 sind, bildet {|φ n (1)χ pr (2)⟩} eine Ba sis in H. Gibt man darüber hinaus ein Eigenwerttripel {a n , b p , c r } vor, so gehört dazu ein einziger Eigenvektor |φ n (1)χ pr (2)⟩: Die Observablen A(1), B(2) und C(2) bilden in H einen V. S. K. O. Es bereitet keine Schwierigkeit, diese Überlegungen zu verallgemeinern: Man er hält für den Produktraum H = H1 ⊗ H2 einen vollständigen Satz kommutierender Observabler, indem man einen in H1 vollständigen Satz kommutierender Observabler mit einem in H2 vollständigen Satz kommutierender Observabler vereinigt.
F-4 Anwendungen F-4-a Ein- und dreidimensionale Einteilchenzustände α Zustandsräume Wir kehren zu der in § F-1 gestellten Frage nach dem Zusammenhang zwischen Hx und Hr zurück. Hx ist der Zustandsraum für ein Teilchen im eindimensionalen Fall, d. h. der den Wellenfunktionen φ(x) zugeordnete Zustandsraum. In diesem Raum bildet die in § E-2 behandelte Observable X für sich einen V. S. K. O.; ihre Eigenvektoren sind die Basisvektoren der {|x⟩}-Darstellung. In dieser Darstellung ist ein Vektor |φ⟩ ∈ Hx durch die Wellenfunktion φ(x) = ⟨x|φ⟩ gegeben; insbesondere entspricht dem Basis ket |x0 ⟩ die „Funktion“ ξ x0 (x) = δ(x − x0 ).
154 | II Der mathematische Rahmen Auf die gleiche Weise können wir die Räume Hy und Hz einführen, indem wir von den Wellenfunktionen χ(y) bzw. ω(z) ausgehen. Hier bildet die Observable Y ei nen V. S. K. O. in Hy und die Observable Z entsprechend einen V. S. K. O. in Hz . Die zugehörigen Eigenvektoren sind Basisvektoren in der {|y⟩} – bzw. {|z⟩}-Darstellung. Einem Vektor |χ⟩ ∈ Hy (bzw. |ω⟩ ∈ Hz ) entspricht in der {|y⟩}-Darstellung eine Funk tion χ(y) = ⟨y|χ⟩ und einem Vektor |ω⟩ ∈ Hz eine Funktion ω(z) = ⟨z|ω⟩. Die zu |y0 ⟩ bzw. zu |z0 ⟩ gehörenden Basis„funktionen“ sind δ(y − y0 ) bzw. δ(z − z0 ). Wir bilden nun das Tensorprodukt Hxyz = Hx ⊗ Hy ⊗ Hz
(F-35)
und erhalten mit dem tensoriellen Produkt der Basen {|x⟩}, {|y⟩} und {|z⟩} eine Basis in Hxyz . Hierfür schreiben wir |x, y, z⟩ = |x⟩|y⟩|z⟩
(F-36)
Diese Basiskets sind gemeinsame Eigenvektoren der in Hxyz fortgesetzten Operato ren X, Y und Z: X|x, y, z⟩ = x|x, y, z⟩ Y|x, y, z⟩ = y|x, y, z⟩
(F-37)
Z|x, y, z⟩ = z|x, y, z⟩ Hxyz fällt also mit dem Zustandsraum für den dreidimensionalen Fall Hr und |x, y, z⟩ mit |r⟩ zusammen: |x, y, z⟩ ≡ |r⟩ = |x⟩|y⟩|z⟩
(F-38)
wobei x, y und z die kartesischen Koordinaten des Ortsvektors r bedeuten. In Hr gibt es Kets |φ χ ω⟩ = |φ⟩|χ⟩|ω⟩, die das tensorielle Produkt je eines Kets aus Hx , aus Hy und Hz sind. In der {|r⟩}-Darstellung sind dann ihre Komponenten nach Gl. (F-8): ⟨r|φ χ ω⟩ = ⟨x|φ⟩⟨y|χ⟩⟨z|ω⟩
(F-39)
Die zugehörigen Wellenfunktionen sind demnach faktorisiert: φ(x)χ(y)ω(z). Das Glei che gilt auch für die Basisvektoren: ⟨r|r0 ⟩ = δ(r − r0 ) = δ(x − x0 )δ(y − y0 )δ(z − z0 )
(F-40)
Dagegen stellt sich ein beliebiger Zustand |ψ⟩ ∈ Hr in der Form |ψ⟩ = ∫ dx dy dz ψ(x, y, z) |x, y, z⟩
(F-41)
dar. Die Abhängigkeit von den Koordinaten x, y und z ist nicht mehr faktorisiert.
F Tensorprodukte von Zustandsräumen | 155
Unter Berücksichtigung der Ergebnisse aus § F-3 verstehen wir jetzt, warum die Observable X, die in Hx einen V. S. K. O. bildet, diese Eigenschaft in Hr verliert (§ E-2-d): Die Eigenwerte seiner Fortsetzung in den Raum Hr sind dieselben wie in Hx , doch sind sie jetzt unendlich oft entartet, weil die Räume Hy und Hz unendlich dimensional sind. Von einem V. S. K. O. in Hx , Hy und Hz ausgehend kann man einen V. S. K. O. in Hr konstruieren. Dies kann z. B. der Satz {X, Y, Z} sein, aber auch der Satz {P x , Y, Z}, weil P x in Hx ein V. S. K. O. ist, oder der Satz {P x , P y , Z} usw. β Eine wichtige Anwendung Will man im Zustandsraum Hr die Eigenwertgleichung eines Operators H lösen, der die Form H = Hx + Hy + Hz
(F-42)
aufweist, wobei H x , H y und H z die Fortsetzungen von Observablen aus den Räumen Hx , Hy und Hz bedeuten, so kann man die Überlegung aus § F-3-a-β anwenden (prak tisch stellt man fest, dass z. B. H x die Fortsetzung einer Observablen aus Hx ist, weil sie ausschließlich aus den Operatoren X und P x gebildet wird). Man bestimmt zunächst die Eigenwerte und Eigenvektoren von H x in Hx , von H y in Hy und von H z in Hz : H x |φ n ⟩ = E nx |φ n ⟩ p
H y |χ p ⟩ = E y |χ p ⟩ H z |ω r ⟩ =
(F-43)
E rz |ω r ⟩
Die Eigenwerte von H sind dann alle von der Form p
E n,p,r = E nx + E y + E rz
(F-44)
während ein zu E n,p,r gehörender Eigenvektor das tensorielle Produkt |φ n ⟩|χ p ⟩|ω r ⟩ ist; die zu diesem Vektor gehörende Wellenfunktion ist dann das Produkt φ n (x)χ p (y)ω r (z) = ⟨x|φ n ⟩⟨y|χ p ⟩⟨z|ω r ⟩ Wir begegneten einem derartigen Fall in Ergänzung FI , § 2, als wir die Untersu chung eindimensionaler Modelle rechtfertigten. Es handelte sich dabei um den auf die Wellenfunktionen wirkenden Operator H=−
ℏ2 ∆ + V(r) 2m
(F-45)
der die Form (F-42) dann aufweist, wenn für das Potential V(r) = V1 (x) + V2 (y) + V3 (z) geschrieben werden kann.
(F-46)
156 | II Der mathematische Rahmen
F-4-b Zustand eines Zweiteilchensystems Wir betrachten ein physikalisches System, das aus zwei Teilchen (1) und (2) (ohne Spin) besteht. Zur quantenmechanischen Beschreibung dieses Systems kann man den Begriff der Wellenfunktion, wie wir ihn für den Fall eines Teilchens eingeführt ha ben, verallgemeinern: Ein Zustand dieses Systems zu einem bestimmten Zeitpunkt wird durch eine Funktion ψ(r1 , r2 ) ≡ ψ(x1 , y1 , z1 ; x2 , y2 , z2 ) charakterisiert, die al so von den sechs Ortskoordinaten der beiden Teilchen abhängt. Diese Zweiteilchen wellenfunktion interpretiert man in folgender Weise: Die Wahrscheinlichkeit dafür, dass sich das Teilchen (1) zu einem bestimmten Zeitpunkt in einem Volumenelement d3 r1 = dx1 dy1 dz1 um die Stelle r1 und gleichzeitig das Teilchen (2) in einem Volu menelement d3 r2 = dx2 dy2 dz2 um die Stelle r2 befindet, ist durch d𝒫(r1 , r2 ) = C|ψ(r1 , r2 )|2 d3 r1 d3 r2
(F-47)
gegeben. Die Normierungskonstante C wird durch die Bedingung festgelegt, dass die Gesamtwahrscheinlichkeit gleich eins sein soll (Erhaltung der Teilchenzahl, s. Kap. I, § B-2): 1 = ∫ d3 r1 d3 r2 |ψ(r1 , r2 )|2 C
(F-48)
Die Funktion ψ(r1 , r2 ) muss also (im sechsdimensionalen Raum) quadratisch inte grierbar sein. Man kann nun im Zustandsraum Hr1 für das Teilchen (1) die {|r1 ⟩}-Darstellung und die Observablen X1 , Y 1 und Z1 definieren. Entsprechend führt man im Zustands raum Hr2 des Teilchens (2) die {|r2 ⟩}-Darstellung und die Observablen X2 , Y2 und Z2 ein. Im Tensorprodukt Hr1 r2 = Hr1 ⊗ Hr2
(F-49)
dieser beiden Räume bildet die Gesamtheit der Vektoren |r1 , r2 ⟩ = |r1 ⟩|r2 ⟩
(F-50)
eine Basis. Folglich kann jeder Ket aus diesem Raum in der Form |ψ⟩ = ∫ d3 r1 d3 r2 ψ(r1 , r2 )|r1 , r2 ⟩
(F-51)
ψ(r1 , r2 ) = ⟨r1 , r2 |ψ⟩
(F-52)
mit
geschrieben werden. Für das Normquadrat von |ψ⟩ gilt weiter ⟨ψ|ψ⟩ = ∫ d3 r1 d3 r2 |ψ(r1 , r2 )|2
(F-53)
F Tensorprodukte von Zustandsräumen |
157
Zu jedem Ket aus Hr1 r2 gehört also eine Wellenfunktion ψ(r1 , r2 ): Der Zustandsraum für ein Zweiteilchensystem ist das Tensorprodukt der beiden Einteilchenräume. Einen vollständigen Satz kommutierender Observabler erhält man zum Beispiel, indem man die Observablen X1 , Y1 , Z1 und X2 , Y2 , Z2 zusammenfasst. Wird der Zustand des Zweiteilchensystems durch ein tensorielles Produkt |ψ⟩ = |ψ1 ⟩|ψ2 ⟩
(F-54)
beschrieben, so ist die zugehörige Wellenfunktion faktorisiert: ψ(r1 , r2 ) = ⟨r1 , r2 |ψ⟩ = ⟨r1 |ψ1 ⟩⟨r2 |ψ2 ⟩ = ψ1 (r1 )ψ2 (r2 )
(F-55)
In diesem Fall sagt man, zwischen den beiden Teilchen bestehe keine Korrelation. In Ergänzung DIII werden wir auf die physikalischen Konsequenzen genauer eingehen. Die Überlegungen dieses Abschnitts können verallgemeinert werden: Setzt sich ein physikalisches System aus zwei oder mehreren einfacheren Systemen zusammen, so ist sein Zustandsraum das Tensorprodukt der Räume, die zu diesen Teilsystemen gehören.
Referenzen und Literaturhinweise In Abschnitt 10 der Bibliographie ist eine Liste mathematischer Bücher zusammen gestellt. Diese ist in thematische Abschnitte und, wenn möglich, Unterabschnitte ge gliedert, wobei die Reihenfolge zunehmender Komplexität entspricht. Siehe auch die Bücher zur Quantenmechanik (Abschnitte 1 und 2 der Bibliographie), wo die typi schen mathematischen Problemstellungen auf sehr unterschiedlichem Niveau behan delt werden; außerdem sind dort weitere Referenzen zu finden. Interessierten Lesern, die noch nicht mit den in Kapitel II benötigten mathemati schen Begriffen (Vektorräume, Operatoren, Diagonalisierung von Matrizen usw.) ver traut sind, seien die folgenden Bücher empfohlen: Arfken (10.4), Kap. 4; Bak and Lich tenberg (10.3), Kap. I; Bass (10.1), Bd. I, Kap. II bis V. Einige Bücher beziehen sich ex plizit auf die Quantenmechanik, etwa Jackson (10.5) (siehe insbesondere Kap. 5) oder Butkov (10.8), Kap. 10 (endlichdimensionale Vektorräume) und 11 (unendlichdimen sionale Vektorräume, Funktionenräume). Siehe auch Meijer and Bauer (2.18), Kap. 1, insbesondere die Tabelle am Ende des Kapitels.
•
158 | Übersicht über die Ergänzungen zu Kapitel II
Übersicht über die Ergänzungen zu Kapitel II AII Schwarzsche Ungleichung BII Eigenschaften linearer Operatoren
Wiederholung von Begriffen und Sätzen aus der Mathematik, auf die wir uns im Folgenden immer wieder beziehen werden. (einfach)
CII Unitäre Operatoren DII Orts- und Impulsdarstellung EII
Eigenschaften zweier Observabler mit dem Kommutator iℏ
FII
Der Paritätsoperator
Ergänzungen zu § E von Kap. II. Insbesondere wird der später verwendete Translationsoperator eingeführt. (DII bleibt auf dem Niveau der vorhergehenden Ergänzungen und kann sofort gelesen werden. EII nimmt einen etwas allgemeineren und formalen Standpunkt ein.) Diese Ergänzung untersucht den in der Quantenmechanik besonders wichtigen Paritätsoperator. Gleichzeitig wird eine einfache Illustration der in Kapitel II eingeführten Begriffe geliefert.
GII Zweidimensionaler unendlich tiefer Potentialtopf
Diese Ergänzung befasst sich mit einer Anwendung des Begriffs des Tensorprodukts (§ F von Kap. II) und kann als eine Aufgabe mit Lösung angesehen werden.
HII Aufgaben
Zu den Aufgaben 11 und 12 sind die Lösungen angegeben. Sie sollen die Leserinnen und Leser mit den Eigenschaften kommutierender Observabler und dem Begriff des vollständigen Satzes kommutierender Observabler (V. S. K. O.) vertraut machen (§ D-3 von Kap. II).
Schwarzsche Ungleichung |
159
•
Ergänzung AII Schwarzsche Ungleichung Für einen beliebigen Vektor |ψ⟩ aus dem Zustandsraum H gilt ⟨ψ|ψ⟩ ≥ 0 ;
(1)
null ist ⟨ψ|ψ⟩ genau dann, wenn |ψ⟩ der Nullvektor ist [s. Gl. (B-12)]. Aus dieser Bezie hung kann man die Schwarzsche Ungleichung herleiten. Sie besagt, dass für irgend zwei Vektoren |φ1 ⟩, |φ2 ⟩ aus dem Zustandsraum H stets |⟨φ1 |φ2 ⟩|2 ≤ ⟨φ1 |φ1 ⟩⟨φ2 |φ2 ⟩
(2)
gilt. Das Gleichheitszeichen gilt genau dann, wenn |φ1 ⟩ und |φ2 ⟩ zueinander propor tional sind. Zum Beweis betrachten wir mit einem beliebigen Faktor λ den Ket |ψ⟩ = |φ1 ⟩ + λ|φ2 ⟩
(3)
Dann ist ⟨ψ|ψ⟩ = ⟨φ1 |φ1 ⟩ + λ⟨φ1 |φ2 ⟩ + λ∗ ⟨φ2 |φ1 ⟩ + λλ∗ ⟨φ2 |φ2 ⟩ ≥ 0 :
(4)
Setzen wir jetzt λ=−
⟨φ2 |φ1 ⟩ ⟨φ2 |φ2 ⟩
(5)
so wird ⟨φ1 |φ1 ⟩ −
⟨φ1 |φ2 ⟩⟨φ2 |φ1 ⟩ ≥0 ⟨φ2 |φ2 ⟩
(6)
Weil ⟨φ2 |φ2 ⟩ positiv ist, können wir mit ⟨φ2 |φ2 ⟩ multiplizieren und erhalten ⟨φ1 |φ1 ⟩⟨φ2 |φ2 ⟩ ≥ ⟨φ1 |φ2 ⟩⟨φ2 |φ1 ⟩
(7)
also gerade Gl. (2). Das Gleichheitszeichen ergibt sich für ⟨ψ|ψ⟩ = 0, d. h. wenn |φ1 ⟩ = −λ|φ2 ⟩ ist; die Kets sind dann zueinander proportional.
Referenzen und Literaturhinweise Bass I (10.1), § 5–3; Arfken (10.4), § 9–4. 165
https://doi.org/10.1515/9783110638738-013
•
160 | Ergänzung BII
Ergänzung BII Eigenschaften linearer Operatoren 1 1-a 1-b 1-c 2 2-a 2-b 3 4 4-a 4-b 4-c 5 5-a 5-b 5-c 5-d
Spur eines Operators | 160 Definition | 160 Invarianz der Spur | 160 Wichtige Eigenschaften | 161 Kommutatoralgebra | 162 Definition | 162 Eigenschaften | 162 Einschränkung eines Operators | 162 Operatorfunktionen | 163 Definition und einfache Eigenschaften | 163 Ein wichtiges Beispiel: Der Potentialoperator | 165 Kommutator und Operatorfunktionen | 165 Ableitung eines Operators | 167 Definition | 167 Rechenregeln | 167 Beispiele | 168 Anwendung: Eine nützliche Formel | 168
1 Spur eines Operators 1-a Definition Unter der Spur eines Operators, in Zeichen: Tr A, versteht man die Summe der Diago nalelemente der Matrix, die den Operator in der gewählten Basis darstellt. Wird der Raum H von einer diskreten orthonormierten Basis {|u i ⟩} aufgespannt, so hat man also Tr A = ∑⟨u i |A|u i ⟩
(1)
i
während für den Fall einer kontinuierlichen Basis {|w α ⟩} Tr A = ∫ dα ⟨w α |A|w α ⟩
(2)
gilt. Ist der Raum H von unendlicher Dimension, so ist die Spur des Operators A nur dann definiert, wenn die Ausdrücke (1) und (2) konvergieren.
1-b Invarianz der Spur Die Summe der Diagonalelemente der Matrix, die den Operator A darstellt, hängt nicht von der jeweils gewählten Basis ab. https://doi.org/10.1515/9783110638738-014
Eigenschaften linearer Operatoren
| 161
•
Wir zeigen dies für den Übergang von einer orthonormierten diskreten Basis {|u i ⟩} zu einer anderen orthonormierten Basis {|t k ⟩}. Es gilt ∑ = ⟨u i |A|u i ⟩ = ∑⟨u i | [∑ |t k ⟩⟨t k |] A|u i ⟩ i
i
(3)
k
wenn man die Vollständigkeitsrelation für die Zustände |t k ⟩ berücksichtigt. Für die rechte Seite können wir wegen der Vertauschbarkeit des Produkts zweier Zahlen ∑⟨u i |t k ⟩⟨t k |A|u i ⟩ = ∑⟨t k |A|u i ⟩⟨u i |t k ⟩ i,k
(4)
i,k
schreiben und weiter die Summe ∑i |u i ⟩⟨u i | durch den 𝟙-Operator ersetzen. Damit wird schließlich ∑⟨u i |A|u i ⟩ = ∑⟨t k |A|t k ⟩ i
(5)
k
und dies wollten wir beweisen. Bemerkung: Ist der Operator A eine Observable, so bilden seine Eigenvektoren eine Basis in H. In dieser Basis sind die Diagonalelemente der Darstellungsmatrix von A gerade die Eigenwerte a n von A. Ist g n jeweils der Entartungsgrad, so haben wir für die Spur Tr A = ∑ g n a n
(6)
n
1-c Wichtige Eigenschaften Es gilt Tr AB = Tr BA
(7a)
Tr ABC = Tr BCA = Tr CAB
(7b)
Allgemein ist die Spur des Produkts einer beliebigen Zahl von Operatoren gegenüber einer zyklischen Vertauschung der Faktoren invariant. Wir beweisen Gl. (7a). Es ist Tr AB = ∑⟨u i |AB|u i ⟩ = ∑⟨u i |A|u j ⟩⟨u j |B|u i ⟩ i
i,j
= ∑⟨u j |B|u i ⟩⟨u i |A|u j ⟩ = ∑⟨u j |BA|u j ⟩ = Tr BA i,j
(8)
j
Dabei haben wir zweimal die Vollständigkeitsrelation verwendet. Die Verallgemeine rung (7b) zeigt man entsprechend.
•
162 | Ergänzung BII
2 Kommutatoralgebra 2-a Definition [A, B] = AB − BA
(9)
heißt der Kommutator der beiden Operatoren A und B.
2-b Eigenschaften Aus dieser Definition ergeben sich unmittelbar die Eigenschaften [A, B] = −[B, A] ,
(10)
[A, (B + C)] = [A, B] + [A, C]
(11)
[A, BC] = [A, B]C + B[A, C]
(12)
[A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0
(13)
†
†
†
[A, B] = [B , A ]
(14)
3 Einschränkung eines Operators Es sei P q der Projektor auf den Unterraum Hq , der von den q orthonormierten Vekto ren |φ i ⟩ aufgespannt wird: q
P q = ∑ |φ i ⟩⟨φ i |
(15)
i=1
Dann heißt ̂ A q = P q AP q
(16)
die Einschränkung des Operators A auf den Unterraum Hq . Schreiben wir für die Or thogonalprojektion eines beliebigen Kets |ψ⟩ auf den Unterraum Hq ̂ q ⟩ = P q |ψ⟩ |ψ
(17)
so gilt ̂q⟩ ̂ A q |ψ⟩ = P q A|ψ
(18)
Will man also die Einschränkung ̂ A q auf einen Ket |ψ⟩ ∈ H anwenden, so projiziert man zunächst diesen Ket auf Hq , wendet auf diese Projektion den Operator A an und behält von dem so erhaltenen Ket nur die Projektion auf Hq . Der Operator ̂ A q transfor miert jeden Ket aus Hq in einen Ket aus demselben Unterraum, ist also ein Operator, dessen Wirkung auf Hq eingeschränkt ist.
Eigenschaften linearer Operatoren
|
163
•
Was kann man über die Matrix sagen, die den Operator ̂ A q in einer bestimmten Darstellung repräsentiert? Wir wählen eine Basis {|u k ⟩}, deren q erste Vektoren zu Hq gehören (dies sind z. B. die Kets |φ i ⟩), während die restlichen Kets den komplementä ren Unterraum aufspannen. Dann ist ⟨u i |̂ A q |u j ⟩ = ⟨u i |P q AP q |u j ⟩
(19)
d. h. aber {⟨u i |A|u j ⟩ wenn i, j ≤ q A q |u j ⟩ = { ⟨u i |̂ 0 wenn i > q oder j > q {
(20)
Die Matrixelemente, die die Einschränkung ̂ A q repräsentieren, werden also in gewis ser Weise aus der Matrix, die den Operator A darstellt, „ausgeschnitten“: Man behält nur die Elemente übrig, die den Basisvektoren |u i ⟩ und |u j ⟩ aus dem Unterraum Hq zugeordnet sind, und ersetzt die anderen Elemente durch null.
4 Operatorfunktionen 4-a Definition und einfache Eigenschaften Von einem beliebigen Operator A ausgehend kann man unschwer den Operator A n de finieren: Er entspricht einfach der n-fachen Anwendung des Operators A. Bekannt ist auch die Definition des Inversen A−1 eines Operators A. Dieser muss, falls er existiert, der Beziehung A−1 A = AA−1 = 𝟙
(21)
genügen. Wie kann man nun allgemein eine beliebige Funktion eines Operators ein führen? Hierzu betrachten wir eine Funktion F einer Variablen z und nehmen an, dass sie in einem bestimmten Bereich in eine Potenzreihe von z entwickelt werden kann: ∞
F(z) = ∑ f n z n
(22)
n=0
Nach Definition ist dann die zugehörige, vom Operator A abhängende Funktion F(A) durch die Reihe ∞
F(A) = ∑ f n A n
(23)
n=0
mit denselben Koeffizienten f n gegeben. So gilt z. B. für den Operator ∞
eA = ∑ n=0
An = 𝟙 + A + A2 /2! + . . . + A n /n! + . . . n!
(24)
•
164 | Ergänzung BII
Auf die Frage nach der Konvergenz der Reihe (23) wollen wir hier nicht eingehen. Sie hängt von den Eigenwerten von A und vom Konvergenzradius der Reihe (22) ab. Wir bemerken: Falls F(z) eine reellwertige Funktion ist, so sind die Koeffizienten f n reell; ist weiter A hermitesch, so erkennt man an Gl. (23), dass auch F(A) hermitesch ist. Es sei nun |φ a ⟩ ein Eigenvektor von A zum Eigenwert a: A|φ a ⟩ = a|φ a ⟩
(25)
Die n-fache Anwendung des Operators A auf diesen Vektor liefert A n |φ a ⟩ = a n |φ a ⟩
(26)
und weiter die Anwendung von F(A) gemäß Gl. (23) ∞
F(A)|φ a ⟩ = ∑ f n a n |φ a ⟩ = F(a)|φ a ⟩
(27)
n=0
Ist daher |φ a ⟩ Eigenvektor von A zum Eigenwert a, so ist er auch Eigenvektor von F(A) zum Eigenwert F(a). Diese Eigenschaft führt uns zu einer zweiten Definition der Operatorfunktion. Ist ein Operator A diagonalisierbar (was stets möglich ist, wenn es sich um eine Obser vable handelt), und wählen wir eine Basis, in der die zugehörige Matrix diagonal (mit den Eigenwerten a i von A als Elemente) ist, so definieren wir F(A) als den Operator, der in dieser Basis durch die Diagonalmatrix mit den Elementen F(a i ) repräsentiert wird. Ist z. B. die Matrix σ z durch σz = (
1 0
0 ) −1
(28)
gegeben, so folgt sofort eσ z = (
e 0
0 ) 1/e
(29)
Bemerkung: Bei der Anwendung von Operatorfunktionen muss man auf die Reihenfolge achten. So sind z. B. die Operatoren eA eB , eB eA und eA+B im Allgemeinen nicht gleich, wenn es sich bei den Operato ren A und B nicht lediglich um Zahlen handelt. Es ist ja eA eB = ∑ p
eB eA = ∑ q
eA+B = ∑ p
Ap Bq Ap Bq ∑ =∑ p! q q! p,q p!q!
(30)
Bq Ap Bq Ap ∑ =∑ q! p p! p,q p!q!
(31)
(A + B)p p!
(32)
Eigenschaften linearer Operatoren
|
•
165
Für beliebige Operatoren A und B müssen diese drei Ausdrücke überhaupt nicht gleich sein, s. Er gänzung HII , Aufgabe 7. Wenn dagegen A und B vertauschen, so hat man einfach [A, B] = 0
eA eB = eB eA = eA+B
⇒
(33)
Dies kann man auch erkennen, wenn man die zu eA und eB gehörenden Diagonalmatrizen in einer Basis aus gemeinsamen Eigenvektoren von A und B betrachtet.
4-b Ein wichtiges Beispiel: Der Potentialoperator Bei eindimensionalen Problemen werden wir oft Potentialoperatoren V(X) begegnen, die den Namen wegen ihrer Korrespondenz zur klassischen potentiellen Energie V(x) eines Teilchens in einem Kraftfeld tragen. V(X) ist dabei eine Funktion des Ortsopera tors X. Wendet man V(X) auf die Eigenvektoren |x⟩ von X an, so ist nach dem vorstehen den Abschnitt V(X)|x⟩ = V(x)|x⟩
(34)
In der {|x⟩}-Darstellung sind daher die Matrixelemente von V(X) ⟨x|V(X)|x ⟩ = V(x)δ(x − x )
(35)
Weiter gilt, wenn man die Hermitezität von V(X) beachtet [ V(x) ist reellwertig] ⟨x|V(X)|ψ⟩ = V(x)⟨x|ψ⟩ = V(x)ψ(x)
(36)
Die Wirkung des Operators V(X) besteht daher einfach in einer Multiplikation mit V(x). Diese Ergebnisse lassen sich ohne Weiteres auf den dreidimensionalen Fall ver allgemeinern. Wir erhalten V(R)|r⟩ = V(r)|r⟩
(37)
⟨r|V(R)|r ⟩ = V(r)δ(r − r )
(38)
⟨r|V(R)|ψ⟩ = V(r)ψ(r)
(39)
4-c Kommutator und Operatorfunktionen Aufgrund der Definition (23) vertauscht der Operator A mit jeder Funktion von A: [A, F(A)] = 0
(40)
Vertauschen weiterhin A und B, so gilt dies auch für die Operatoren F(A) und B: [B, A] = 0
⇒
[B, F(A)] = 0
(41)
•
166 | Ergänzung BII
Was ergibt sich für den Kommutator eines Operators mit der Funktion eines anderen Operators, der mit dem ersten nicht vertauscht? Wir beschränken uns hier auf den Fall des Ortsoperators X und des Impulsoperators P, für deren Kommutator [X, P] = iℏ
(42)
gilt. Mit Gl. (12) erhalten wir zunächst [X, P2 ] = [X, PP] = [X, P]P + P[X, P] = 2iℏP
(43)
Durch vollständige Induktion beweist man dann allgemein, dass [X, P n ] = iℏ nP n−1
(44)
ist. Dabei lautet der „Schluss von n auf n + 1 “ hier [X, P n+1 ] = [X, PP n ] = [X, P]P n + P[X, P n ] = iℏP n + iℏnPP n−1 = iℏ(n + 1)P n
(45)
Somit gilt schließlich [X, F(P)] = ∑[X, f n P n ] = ∑ iℏnf n P n−1 n
(46)
n
Bezeichnen wir die Ableitung von F(z) mit F (z), so kann man aus dieser Gleichung auch ablesen, dass [X, F(P)] = iℏF (P)
(47)
ist. Ganz entsprechend erhalten wir die hierzu symmetrische Beziehung [P, G(X)] = −iℏG (X)
(48)
Bemerkungen: 1. Bei unserer Überlegung hingen die Operatorfunktionen nur von P bzw. nur von X ab. Schwie riger ist die Berechnung eines Kommutators etwa von X mit einer Operatorfunktion Φ(X, P), die also gleichzeitig von X und P abhängig ist. Dies liegt daran, dass die Operatoren X und P nicht vertauschen. 2. Für den Fall, dass zwei Operatoren A und B beide mit ihrem Kommutator vertauschen, können die Beziehungen (47) und (48) verallgemeinert werden. Kürzen wir den Kommutator von A und B mit C = [A, B]
(49)
ab, so können wir aus dem Bestehen der Beziehung [A, C] = [B, C] = 0
(50)
durch eine analoge Rechnung wie eben zeigen, dass dann gilt [A, F(B)] = [A, B]F (B)
(51)
Eigenschaften linearer Operatoren
|
•
167
5 Ableitung eines Operators 5-a Definition Es sei A(t) ein Operator, der von einer beliebigen Variablen t abhängt. Wie bei gewöhn lichen Funktionen definiert man die Ableitung von A(t) durch den Grenzwert (falls er existiert) A(t + ∆t) − A(t) dA = lim dt ∆t→0 ∆t
(52)
Die Matrixelemente von A(t) sind auch in einer Darstellung, bei der die Basisvektoren |u i ⟩ von t unabhängig sind, Funktionen dieser Variablen: ⟨u i |A|u j ⟩ = A ij (t)
(53)
Bezeichnen wir mit ( ddAt )ij = ⟨u i | ddAt |u j ⟩ die Matrixelemente von gen, dass (
dA dt ,
so kann man zei
dA d ) = A ij (t) dt ij dt
(54)
ist. Die Regel, mit der man die Matrix für ddAt erhält, ist also sehr einfach: Man muss alle Elemente der Matrix, die A darstellt, nach t ableiten, ohne ihre Plätze zu verändern.
5-b Rechenregeln Die Ableitungsregeln haben dieselbe Form wie für gewöhnliche Funktionen. Es gilt d (F + G) = dt d (FG) = dt
dF dG + dt dt dF dG G+F dt dt
(55) (56)
Dabei ist allerdings darauf zu achten, dass die Reihenfolge der Operatoren in der letz ten Gleichung nicht geändert wird. Wir beweisen Gl. (56). Die Matrixelemente von FG sind: ⟨u i |FG|u j ⟩ = ∑⟨u i |F|u k ⟩⟨u k |G|u j ⟩
(57)
k
Leiten wir also elementweise ab, so erhalten wir ⟨u i |
d dF dG (FG)|u j ⟩ = ∑ [⟨u i | |u k ⟩⟨u k |G|u j ⟩ + ⟨u i |F|u k ⟩⟨u k | |u j ⟩] dt dt dt k = ⟨u i |
dF dG G+F |u j ⟩ dt dt
für alle i, j. Dies wollten wir zeigen.
(58)
•
168 | Ergänzung BII
5-c Beispiele Wir berechnen die Ableitung von eAt . Nach Definition ist ∞
(At)n n! n=0
eAt = ∑
(59)
Durch gliedweises Differenzieren erhalten wir d At ∞ t n−1 A n e = ∑n dt n! n=0 ∞
(At)n−1 (n − 1)! n=1
=A∑ ∞
(At)n−1 ]A (n − 1)! n=1
= [∑
(60)
Die Reihe in der Klammer (man setze p = n − 1) ist gerade wieder eAt , so dass wir schließlich schreiben können d At (61) e = AeAt = eAt A dt In diesem einfachen Fall, bei dem nur ein Operator auftritt, muss man auf die Reihen folge der Faktoren nicht achten: eAt und A vertauschen. Interessiert man sich dagegen für die Ableitung eines Operators wie eAt eBt , so liefert die Anwendung von Gl. (56) und Gl. (61) d At Bt (62) (e e ) = AeAt eBt + eAt BeBt dt Die rechte Seite dieser Gleichung kann man natürlich auch auf die Form eAt AeBt + eAt BeBt oder eAt AeBt +eAt eBt B bringen, erhält jedoch einen Ausdruck wie (A+B)eAt eBt nur dann, wenn die Operatoren A und B vertauschen. Bemerkung: Selbst wenn in einer Operatorfunktion nur ein einziger Operator auftritt, kann die Ableitung die ser Funktion nicht immer nach den Regeln ausgeführt werden, wie wir sie bei gewöhnlichen Funk tionen kennen. Hängt z. B. A(t) in beliebiger Weise von der Veränderlichen t ab, so ist die Ab leitung ddt eA(t) im Allgemeinen nicht gleich dA eA(t) , wie man es nach der Kettenregel erwarten dt würde. Man kann dies sehen, wenn man eA(t) in eine Potenzreihe von A(t) entwickelt. Gleichheit besteht nur dann, wenn A(t) und dA vertauschen. dt
5-d Anwendung: Eine nützliche Formel Es seien A und B zwei Operatoren, die beide mit ihrem Kommutator vertauschen. Wir beweisen die Formel 1
eA eB = eA+B e 2 [A,B] Gelegentlich nennt man sie auch die Glauber-Formel.
(63)
Eigenschaften linearer Operatoren
| 169
•
Hierzu definieren wir den von der reellen Variablen t abhängenden Operator F(t) = eAt eBt
(64)
Es ist dF = AeAt eBt + eAt BeBt = (A + eAt Be−At )F(t) dt
(65)
Weil nun nach Voraussetzung A sowie B mit ihrem Kommutator vertauschen, kann man Gl. (51) auf den Kommutator [eAt , B] anwenden: [eAt , B] = t[A, B]eAt
(66)
Also ist eAt B = BeAt + t[A, B]eAt
(67)
Multiplizieren wir beide Seiten dieser Gleichung von rechts mit e−At und setzen das Ergebnis in Gl. (65) ein, so erhalten wir dF = (A + B + t[A, B])F(t) dt
(68)
Mit A und B vertauscht auch die Summe A + B mit dem Kommutator [A, B], so dass wir diese Differentialgleichung integrieren können, wie wenn A + B und [A, B] Zahlen wären. Es ergibt sich als F(t) = F(0)e(A+B)t+ 2 [A,B]t 1
2
(69)
Es ist aber F(0) = 𝟙 und damit F(t) = e(A+B)t+ 2 [A,B]t 1
2
(70)
Setzen wir hierin t = 1, so erhalten wir die Behauptung. Bemerkung: Die Formel gilt nur, wie wir gesehen haben, wenn die Operatoren A und B beide mit ihrem Kom mutator vertauschen. Diese Bedingung scheint sehr einschränkend zu sein. Tatsächlich begeg net man aber in der Quantenmechanik häufig Operatoren, deren Kommutator eine Zahl ergibt. Dies ist z. B. für den Ortsoperator X und den Impulsoperator P oder für die beim harmonischen Oszillator auftretenden Operatoren a und a† der Fall (s. Kapitel V).
Referenzen Unterabschnitte „Allgemeine Werke“ und „Lineare Algebra. Hilberträume“ von Ab schnitt 10 der Bibliographie
•
170 | Ergänzung CII
Ergänzung CII Unitäre Operatoren 1 1-a 1-b 1-c 1-d 2 3
Allgemeine Eigenschaften | 170 Definition und einfache Eigenschaften | 170 Unitäre Operatoren und Basiswechsel | 171 Unitäre Matrix | 172 Eigenwerte und Eigenvektoren eines unitären Operators | 173 Unitäre Transformation von Operatoren | 174 Infinitesimale unitäre Operatoren | 175
1 Allgemeine Eigenschaften 1-a Definition und einfache Eigenschaften Ein Operator U heißt nach Definition ein unitärer Operator, wenn sein Inverses U −1 gleich seinem Adjungierten U † ist: U † U = UU † = 𝟙
(1)
Betrachten wir zwei beliebige Vektoren |ψ1 ⟩ und |ψ2 ⟩ aus dem Zustandsraum H und die transformierten Vektoren ̃ 1 ⟩ = U|ψ1 ⟩ |ψ (2) ̃ 2 ⟩ = U|ψ2 ⟩ |ψ so ergibt sich für das Skalarprodukt ̃ 1 |ψ ̃ 2 ⟩ = ⟨ψ1 |U † U|ψ2 ⟩ = ⟨ψ1 |ψ2 ⟩ ⟨ψ
(3)
Bei einer unitären Transformation bleibt also das Skalarprodukt und folglich die Norm eines Vektors erhalten. Ist der Zustandsraum H von endlicher Dimension, so ist diese Eigenschaft übrigens für einen unitären Operator charakteristisch. Bemerkungen: 1. Ist A ein hermitescher Operator, so ist der Operator T = eiA unitär. Man hat nämlich †
T † = e−iA = e−iA
(4)
und damit T † T = e−iA eiA = 𝟙 TT † = eiA e−iA = 𝟙
(5)
weil ja −iA mit iA vertauscht. 2. Das Produkt zweier unitärer Operatoren ist wieder unitär. Sind U und V zwei unitäre Operato ren, so ist zunächst U † U = UU † = 𝟙 V † V = VV † = 𝟙 https://doi.org/10.1515/9783110638738-015
(6)
Unitäre Operatoren
|
171
•
und damit (UV)† (UV) = V † U † UV = V † V = 𝟙 (UV)(UV)† = UVV † U † = UU † = 𝟙
(7)
Diese Eigenschaft war übrigens zu erwarten: Lassen zwei Transformationen das Skalarprodukt ungeändert, so muss dies auch gelten, wenn diese Transformationen nacheinander angewendet werden. 3. Im gewöhnlichen dreidimensionalen reellen Vektorraum kennen wir Operatoren, bei deren Anwendung der Betrag (die Norm) und das Skalarprodukt erhalten bleiben, so die Rotationen, die Spiegelungen an einem Punkt, einer Ebene usw. Bei diesem reellen Raum spricht man von orthogonalen Operatoren. Die unitären Operatoren stellen daher die Verallgemeinerung der or thogonalen Operatoren auf komplexe Räume mit beliebiger Dimension dar.
1-b Unitäre Operatoren und Basiswechsel Es sei {|v i ⟩} eine orthonormierte Basis im Zustandsraum H, den wir als diskret voraus setzen. Mit |̃v i ⟩ bezeichnen wir den Vektor, der sich durch die Anwendung des Opera tors U auf den Basisvektor |v i ⟩ ergibt: |̃v i ⟩ = U|v i ⟩
(8)
Ist der Operator U unitär, so gilt ⟨̃v i |̃v j ⟩ = ⟨v i |v j ⟩ = δ ij
(9)
die Vektoren |̃v i ⟩ sind somit orthonormiert. Wir zeigen, dass sie in H eine Basis bilden, und betrachten hierzu einen beliebigen Vektor |ψ⟩ ∈ H. Entwickeln wir den Vektor U † |ψ⟩ nach den |v i ⟩: U † |ψ⟩ = ∑ c i |v i ⟩
(10)
i
und wenden hierauf den Operator U an, so erhalten wir UU † |ψ⟩ = ∑ c i U|v i ⟩
(11)
i
also |ψ⟩ = ∑ c i |̃v i ⟩
(12)
i
Diese Gleichung besagt, dass ein beliebiger Vektor |ψ⟩ nach den |̃v i ⟩ entwickelt wer den kann, diese Vektoren also eine Basis in H bilden. Das Ergebnis können wir auch so ausdrücken: Für die Unitarität eines Operators U ist notwendig, dass die durch die Anwendung dieses Operators auf die Vektoren einer orthonormierten Basis entstehenden Vektoren wieder eine orthonormierte Basis bilden.
•
172 | Ergänzung CII
Diese Bedingung ist aber auch hinreichend. Es sei also |̃v i ⟩ = U|v i ⟩ ⟨̃v i |̃v j ⟩ = δ ij
(13)
∑ |̃v i ⟩⟨̃v i | = 𝟙 i
und damit ⟨v j |U † = ⟨̃v j |
(14)
Wir berechnen U † U|v i ⟩ = U † |̃v i ⟩ = ∑ |v j ⟩⟨v j |U † |̃v i ⟩ j
= ∑ |v j ⟩⟨̃v j |̃v i ⟩ = ∑ |v j ⟩δ ij j
j
= |v i ⟩
(15)
Da dies für jedes i gilt, muss U † U der Einheitsoperator sein. Wir zeigen, dass auch UU † = 𝟙 gilt. Hierzu betrachten wir die Wirkung von U † auf einen Vektor |v i ⟩: U † |v i ⟩ = ∑ |v j ⟩⟨v j |U † |v i ⟩ j
= ∑ |v j ⟩⟨̃v j |v i ⟩
(16)
j
Es ist also UU † |v i ⟩ = ∑ U|v j ⟩⟨̃v j |v i ⟩ j
= ∑ |̃v j ⟩⟨̃v j |v i ⟩ j
= |v i ⟩
(17)
Hieraus ergibt sich UU † = 𝟙. Der Operator U ist daher unitär.
1-c Unitäre Matrix Es seien U ij = ⟨v i |U|v j ⟩
(18)
die Matrixelemente von U. Wie kann man an dieser Matrix erkennen, dass der Opera tor, den sie in der betreffenden Darstellung repräsentiert, unitär ist? Die Gl. (1) liefert ⟨v i |U † U|v j ⟩ = ∑⟨v i |U † |v k ⟩⟨v k |U|v j ⟩ k
(19)
Unitäre Operatoren
| 173
•
also ∗ U kj = δ ij ∑ U ki
(20)
k
Wenn daher eine Matrix unitär ist, so ist die Summe der Produkte der Elemente einer Spalte mit den konjugiert komplexen Elementen einer anderen Spalte – null, wenn die beiden Spalten verschieden sind, – gleich eins im anderen Fall. Beispiele: 1. Drehmatrix für eine Drehung um die z-Achse mit dem Winkel θ im gewöhnlichen dreidimensionalen Raum: cos θ R(θ) = ( sin θ 0 2.
− sin θ cos θ 0
0 0) 1
(21) 1 2
Drehmatrix im Zustandsraum für den Spin i
e− 2 (α+γ) cos R(1/2) (α, β, γ) = ( i e 2 (α−γ) sin
β 2
β 2
(s. Kapitel IX):
i
−e 2 (γ−α) sin i e 2 (α+γ) cos
β 2
)
(22)
β 2
1-d Eigenwerte und Eigenvektoren eines unitären Operators Es sei |ψ u ⟩ ein normierter Eigenvektor des unitären Operators U und u der zugehörige Eigenwert: U|ψ u ⟩ = u|ψ u ⟩
(23)
Für das Quadrat der Norm von U|ψ u ⟩ finden wir ⟨ψ u |U † U|ψ u ⟩ = u ∗ u⟨ψ u |ψ u ⟩ = u ∗ u
(24)
Bei einem unitärem Operator bleibt die Norm erhalten, es ist notwendig u ∗ u = 1. Die Eigenwerte eines unitären Operators können demnach nur komplexe Zahlen mit dem Betrag eins sein: u = eiφ u
wobei φ u reell
(25)
Weiter ergibt sich für das Skalarprodukt zweier Eigenvektoren |ψ u ⟩ und |ψ u ⟩ von U ⟨ψ u |ψ u ⟩ = ⟨ψ u |U † U|ψ u ⟩ = u ∗ u ⟨ψ u |ψ u ⟩ = ei(φ u −φ u ) ⟨ψ u |ψ u ⟩
(26)
•
174 | Ergänzung CII
Sind die Eigenwerte u und u verschieden, so erkennt man an dieser Gleichung, dass das Skalarprodukt ⟨ψ u |ψ u ⟩ gleich null sein muss: Zwei Eigenvektoren eines unitären Operators zu verschiedenen Eigenwerten sind zueinander orthogonal.
2 Unitäre Transformation von Operatoren Im vorangegangenen Abschnitt sahen wir, dass man mit einem unitären Operator von einer orthonormierten Basis {|v i ⟩} in H zu einer anderen Basis {|̃v i ⟩} gelangen kann. Wir wollen jetzt zeigen, wie sich bei einem derartigen Übergang die Operatoren trans formieren. Nach Definition wird der zu A gehörende transformierte Operator ̃ A in der {|̃v i ⟩}Darstellung dieselben Matrixelemente wie der Operator A in der {|v i ⟩}-Darstellung ha ben: ⟨̃v i |̃ A|̃v j ⟩ = ⟨v i |A|v j ⟩
(27)
Setzen wir hier Gl. (8) ein, so wird ⟨v i |U † ̃ AU|v j ⟩ = ⟨v i |A|v j ⟩
(28)
Weil dies für alle i, j gilt, folgt U†̃ AU = A
(29)
oder auch, wenn wir diese Beziehung von links mit U und von rechts mit U † multipli zieren, ̃ A = UAU †
(30)
Diese Gleichung kann zur Definition der Transformierten ̃ A des Operators A in Be zug auf die unitäre Transformation U dienen. In der Quantenmechanik begegnet man derartigen Transformationen häufig; ein erstes Beispiel finden wir in § 2-a von Ergän zung FII . ̃ erhalten? Wir betrach Wie kann man aus den Eigenwerten von A diejenigen von A ten einen Eigenvektor |φ a ⟩ von A zum Eigenwert a: A|φ a ⟩ = a|φ a ⟩
(31)
φ a ⟩ = U|φ a ⟩. Man Es sei |̃ φ a ⟩ der durch den Operator U aus |φ a ⟩ entstehende Vektor |̃ hat dann ̃ A|̃ φ a ⟩ = (UAU † )U|φ a ⟩ = UA(U † U)|φ a ⟩ = UA|φ a ⟩ = aU|φ a ⟩ = a|̃ φa ⟩
(32)
Unitäre Operatoren
| 175
•
|̃ φ a ⟩ ist also Eigenvektor von ̃ A mit dem Eigenwert a. Man erhält allgemein die folgen de Regel: Die Eigenvektoren des transformierten Operators ̃ A sind die transformierten Vektoren |̃ φ a ⟩; die Eigenwerte ändern sich nicht. Bemerkungen: 1. Wegen ̃ † = (UAU † )† = UA † U † = ̃ ( A) A†
(33)
ist das Adjungierte des transformierten Operators gleich dem Transformierten des adjungierten ̃ hermitesch ist. Operators. Wir erkennen, dass mit A hermitesch auch A 2. Analog zeigt man, dass ̃2 ̃ 2 = UAU † UAU † = UAAU † = A ( A) und allgemein ̃ n=A ̃n ( A)
(34)
ist. Mit der Definition (23) beweist man schließlich, dass für eine Operatorfunktion F(A) ̃ ̃ F(A) = F( A)
(35)
gilt.
3 Infinitesimale unitäre Operatoren Es sei U(ε) ein Operator, der von einer infinitesimalen Größe ε so abhängt, dass U(ε) für ε → 0 gegen den Einheitsoperator 𝟙 strebt. Entwickeln wir diesen Operator in eine Potenzreihe von ε: U(ε) = 𝟙 + εG + . . .
(36)
so erhalten wir für den zu U(ε) adjungierten Operator U † (ε) = 𝟙 + εG† + . . .
(37)
und weiter U(ε)U † (ε) = U † (ε)U(ε) = 𝟙 + ε(G + G† ) + . . .
(38)
Weil U(ε) unitär ist, muss der Summand mit ε auf der rechten Seite dieser Gleichung verschwinden, also G + G† = 0
(39)
sein. Der Operator G ist also antihermitesch. Es ist zweckmäßig F = iG
(40)
•
176 | Ergänzung CII
zu setzen. Man erhält dann die Beziehung F − F† = 0
(41)
d. h. F ist hermitesch. Ein infinitesimaler unitärer Operator kann also in der Form U(ε) = 𝟙 − iεF
(42)
geschrieben werden, worin F ein hermitescher Operator ist. Setzen wir jetzt Gl. (42) in Gl. (30) ein, so erhalten wir ̃ A = (𝟙 − iεF)A(𝟙 + iεF † ) = (𝟙 − iεF)A(𝟙 + iεF)
(43)
̃ A − A = −iε [F, A]
(44)
also
Die Änderung des Operators A unter der Transformation U(ε) ist in erster Ordnung in ε zum Kommutator [F, A] proportional.
Orts- und Impulsdarstellung |
177
•
Ergänzung DII Orts- und Impulsdarstellung 1 1-a 1-b 1-c 2 2-a 2-b 2-c
Ortsdarstellung | 177 Ortsoperator und Funktionen des Ortsoperators | 177 Impulsoperator und Funktionen des Impulsoperators | 177 Schrödinger-Gleichung in der Ortsdarstellung | 178 Impulsdarstellung | 179 Impulsoperator und Funktionen des Impulsoperators | 179 Ortsoperator und Funktionen des Ortsoperators | 179 Schrödinger-Gleichung in der Impulsdarstellung | 180
1 Ortsdarstellung 1-a Ortsoperator und Funktionen des Ortsoperators Wir berechnen in der Orts- oder {|r⟩}-Darstellung die Matrixelemente der Komponen ten X, Y und Z des Ortsoperators. Mit Gl. (E-36) aus Kap. II und den Orthogonalitäts bedingungen für die Kets |r⟩ erhalten wir sofort ⟨r|X|r ⟩ = xδ(r − r ) ⟨r|Y|r ⟩ = yδ(r − r )
(1)
⟨r|Z|r ⟩ = zδ(r − r ) Diese drei Gleichungen kann man in vektorieller Schreibweise zusammenfassen: ⟨r|R|r ⟩ = rδ(r − r )
(2)
Entsprechend einfach sind in der Ortsdarstellung die Matrixelemente einer Operator funktion F(R) [s. Gl. (27) in Ergänzung BII ]: ⟨r|F(R)|r ⟩ = F(r)δ(r − r )
(3)
1-b Impulsoperator und Funktionen des Impulsoperators Wir berechnen das Matrixelement der x-Komponente des Impulsoperators: ⟨r|P x |r ⟩ = ∫ d3 p ⟨r|P x |p⟩⟨p|r ⟩ = ∫ d3 p p x ⟨r|p⟩⟨p|r ⟩ = (2πℏ)−3 ∫ d3 p p x e ℏ p⋅(r−r ) i
+∞
+∞
i i 1 1 =[ ∫ dp x p x e ℏ p x (x−x ) ] [ ∫ dp y e ℏ p y (y−y ) ] 2πℏ 2πℏ −∞ −∞ ][ ] [ +∞
i 1 ×[ ∫ dp z e ℏ p z (z−z ) ] 2πℏ −∞ ] [ https://doi.org/10.1515/9783110638738-016
(4)
•
178 | Ergänzung DII
Hieraus wird, wenn wir die Integralform der „δ-Funktion“ und ihrer Ableitung berück sichtigen [siehe Anhang II, Gl. (34) und Gl. (53)]: ℏ (5) ⟨r|P x |r ⟩ = δ (x − x )δ(y − y )δ(z − z ) i In analoger Weise können die Matrixelemente der anderen Impulskomponenten be rechnet werden. Überprüfen wir, wie man, von Gl. (5) ausgehend, die Wirkung von P x in der Orts darstellung wiederfinden kann. Hierzu berechnen wir ⟨r|P x |ψ⟩ = ∫ d3 r ⟨r|P x |r ⟩⟨r |ψ⟩
(6)
Mit Gl. (5) wird dies ℏ ⟨r|P x |ψ⟩ = ∫ δ (x − x )δ(y − y )δ(z − z )ψ(x , y , z ) dx dy dz i Mit der Beziehung ∫ δ (−u)f(u) d u = − ∫ δ (u)f(u) d u = f (0)
(7)
(8)
und u = x − x erhält man ℏ ∂ ψ(x, y, z) (9) ⟨r|P x |ψ⟩ = i ∂x also Gl. (E-27) aus Kap. II. Durch eine entsprechende Rechnung gelangt man zum Matrixelement einer Ope ratorfunktion G(P). Hier wird ⟨r|G(P)|r ⟩ = ∫ d3 p ⟨r|G(P)|p⟩⟨p|r ⟩ = (2πℏ)−3 ∫ d3 p G(p)e ℏ p⋅(r−r ) i
= (2πℏ)−3/2 ̃ G(r − r )
(10)
Darin ist ̃ G(r) die inverse Fourier-Transformierte der Funktion G(p): ̃ G(r) = (2πℏ)−3/2 ∫ d3 p e ℏ p⋅r G(p) i
(11)
1-c Schrödinger-Gleichung in der Ortsdarstellung In Kapitel III führen wir die Schrödinger-Gleichung ein, die für die Quantenmechanik grundlegend ist. Sie lautet d (12) iℏ |ψ(t)⟩ = H|ψ(t)⟩ dt H ist der Hamilton-Operator, den wir dort definieren werden. Für ein Teilchen (ohne Spin) zum Beispiel, das sich in einem skalaren Potential V(r) befindet, ist dies 1 2 H= P + V(R) (13) 2m
Orts- und Impulsdarstellung | 179
•
Wir wollen diese Gleichung in der Ortsdarstellung anschreiben, in der also die durch ψ(r, t) = ⟨r|ψ(t)⟩
(14)
definierte Wellenfunktion ψ(r, t) auftritt. Projiziert man Gl. (12) unter Berücksichti gung von Gl. (13) auf |r⟩, so erhält man ∂ 1 ⟨r|ψ(t)⟩ = ⟨r|P2 |ψ(t)⟩ + ⟨r|V(R)|ψ(t)⟩ ∂t 2m Nun ist zunächst ∂ ∂ ⟨r|ψ(t)⟩ = ψ(r, t) ∂t ∂t ⟨r|V(R)|ψ(t)⟩ = V(r)ψ(r, t) iℏ
(15)
(16) (17)
⟨r|P2 |ψ(t)⟩
berechnen kann, wenn man berücksich während man das Matrixelement tigt, dass P in der Ortsdarstellung wie ℏi ∇ wirkt: ⟨r|P2 |ψ(t)⟩ = ⟨r|(P2x + P2y + P2z )|ψ(t)⟩ = −ℏ2 (
∂2 ∂2 ∂2 + 2 + 2 ) ψ(x, y, z, t) 2 ∂x ∂y ∂z
= −ℏ2 ∆ψ(r, t)
(18)
wobei ∆ als Laplace-Operator bezeichnet wird. Damit ergibt sich wieder die in Kap. I, § B-2 angegebene Form der Schrödinger-Gleichung iℏ
ℏ2 ∂ ψ(r, t) = [− ∆ + V(r)] ψ(r, t) ∂t 2m
(19)
2 Impulsdarstellung 2-a Impulsoperator und Funktionen des Impulsoperators Es gelten in Analogie zu Gl. (2) und Gl. (3) die Beziehungen ⟨p|P|p ⟩ = p δ(p − p )
(20)
⟨p|G(P)|p ⟩ = G(p) δ(p − p )
(21)
2-b Ortsoperator und Funktionen des Ortsoperators Hier ergeben sich die Formeln ⟨p|X|p ⟩ = iℏ δ (p x − px ) δ(p y − py ) δ(p z − pz )
(22)
⟨p|F(R)|p ⟩ = (2πℏ)−3/2 F(p − p )
(23)
und
•
180 | Ergänzung DII
mit F(p) = (2πℏ)−3/2 ∫ d3 r e− ℏ p⋅r F(r) i
(24)
Sie entsprechen Gl. (5) und Gl. (10).
2-c Schrödinger-Gleichung in der Impulsdarstellung Wir führen mit ψ(p, t) = ⟨p|ψ(t)⟩
(25)
die „Wellenfunktion in der Impulsdarstellung“ ein und suchen die Bewegungsglei chung für diese Funktion, indem wir von Gl. (12) ausgehen. Projektion auf den Ket |p⟩ liefert zunächst iℏ
∂ 1 ⟨p|ψ(t)⟩ = ⟨p|P2 |ψ(t)⟩ + ⟨p|V(R)|ψ(t)⟩ ∂t 2m
(26)
Hier können wir ∂ ∂ ψ(p, t) ⟨p|ψ(t)⟩ = ∂t ∂t
(27)
⟨p|P2 |ψ(t)⟩ = p2 ψ(p, t)
(28)
und
setzen. Zur Berechnung der Größe ⟨p|V(R)|ψ(t)⟩ = ∫ d3 p ⟨p|V(R)|p ⟩⟨p |ψ(t)⟩
(29)
berücksichtigen wir Gl. (23) und erhalten ⟨p|V(R)|ψ(t)⟩ = (2πℏ)−3/2 ∫ d3 p V(p − p )ψ(p , t)
(30)
wobei V(p) = (2πℏ)−3/2 ∫ d3 r e− ℏ p⋅r V(r) i
(31)
die Fourier-Transformierte von V(r) ist. Somit wird schließlich iℏ
∂ p2 ψ(p, t) = ψ(p, t) + (2πℏ)−3/2 ∫ d3 p V(p − p )ψ(p , t) ∂t 2m
(32)
Bemerkung: Weil ψ(p, t) die Fourier-Transformierte von ψ(r, t) ist, s. Gl. (E-18) in Kap. II, hätte man diese Glei chung auch erhalten können, indem man von Gl. (19) die Fourier-Transformierte bildet.
Eigenschaften zweier Observabler mit dem Kommutator iℏ
| 181
•
Ergänzung EII Eigenschaften zweier Observabler mit dem Kommutator iℏ 1 2 2-a 2-b 2-c 3 3-a 3-b 3-c 4
Der Operator S(λ) | 181 Eigenwerte und Eigenvektoren des Operators Q | 182 Spektrum des Operators Q | 182 Entartungsgrad | 182 Eigenvektoren | 183 {|q⟩}-Darstellung | 183 Wirkung von Q in der {|q⟩}-Darstellung | 183 Translationsoperator | 184 Wirkung von P in der {|q⟩}-Darstellung | 184 {|p⟩}-Darstellung | 185
In der Quantenmechanik begegnet man oft Observablen, für die der Kommutator den Wert iℏ hat. Das ist z. B. der Fall, wenn diese Operatoren zu den beiden klassischen kanonisch konjugierten Größen q i und p i gehören (q i ist die Koordinate in einem or ∂L ). In der Quanten thogonalen Bezugssystem und p i der konjugierte Impuls p i = ∂q i mechanik ordnet man q i und p i die Operatoren Q i und P i zu, wobei diese der Vertau schungsrelation [Q i , P i ] = iℏ
(1)
genügen. Derartigen Operatoren sind wir bereits in § E von Kap. II begegnet; dort waren es die Operatoren X und P x . In diesem Ergänzungsabschnitt nehmen wir einen allgemei neren Standpunkt ein und zeigen, dass zwei Operatoren Q und P, deren Kommutator gleich iℏ ist, eine Reihe von wichtigen Eigenschaften besitzen, die sämtlich aus der Beziehung (1) folgen.
1 Der Operator S(λ) Wir betrachten die beiden Operatoren P und Q, die der Vertauschungsrelation [Q, P] = iℏ
(2)
genügen, und definieren mit S(λ) = e−iλP/ℏ
(3)
einen von dem reellen Parameter λ abhängenden Operator. Dieser ist unitär, denn wie man unmittelbar sieht, erfüllt er die Beziehungen S† (λ) = S−1 (λ) = S(−λ) https://doi.org/10.1515/9783110638738-017
(4)
•
182 | Ergänzung EII
Wir berechnen den Kommutator [Q, S(λ)]. Weil [Q, P] = iℏ mit Q und P vertauscht, können wir Gl. (51) aus Ergänzung BII anwenden. Dann ist [Q, S(λ)] = iℏ (−
iλ −iλP/ℏ = λS(λ) )e ℏ
(5)
Dies kann man auch in der Form QS(λ) = S(λ)[Q + λ]
(6)
schreiben. Schließlich halten wir noch fest, dass S(λ)S(μ) = S(λ + μ)
(7)
2 Eigenwerte und Eigenvektoren des Operators Q 2-a Spektrum des Operators Q Wir nehmen an, dass der Operator Q einen nichtverschwindenden Eigenvektor |q⟩ zum Eigenwert q besitzt: Q |q⟩ = q |q⟩
(8)
Wir wenden Gl. (6) auf diesen Vektor an: QS(λ)|q⟩ = S(λ)(Q + λ)|q⟩ = S(λ)(q + λ)|q⟩ = (q + λ)S(λ)|q⟩
(9)
Diese Gleichung besagt, dass S(λ)|q⟩ ein weiterer Eigenvektor von Q zum Eigenwert (q + λ) ist. S(λ)|q⟩ ist nicht der Nullvektor, weil S(λ) ein unitärer Operator ist. Ausge hend von einem Eigenvektor von Q können wir also durch Anwendung des Operators S(λ) einen weiteren Eigenvektor von Q konstruieren, zu dem als Eigenwert eine belie bige reelle Zahl gehört (λ kann jeden reellen Wert annehmen). Daher ist das Spektrum von Q kontinuierlich und besteht aus allen möglichen Werten auf der reellen Achse.¹
2-b Entartungsgrad Der Einfachheit halber wollen wir von jetzt ab voraussetzen, dass der Eigenwert q von Q nichtentartet ist (die folgenden Ergebnisse können auf den Fall verallgemeinert wer den, bei dem Entartung vorliegt). Wir zeigen, dass unter dieser Voraussetzung auch
1 Wir erkennen, dass in einem Raum H von der endlichen Dimension N keine Observablen Q und P existieren können, für die ihr Kommutator gleich iℏ ist. Die Anzahl der Eigenvektoren müsste dann nämlich zugleich kleiner oder gleich N und unendlich sein.
Eigenschaften zweier Observabler mit dem Kommutator iℏ |
183
•
alle anderen Eigenwerte von Q nichtentartet sind. Wir führen die Annahme, dass der Eigenwert q + λ z. B. zweifach entartet ist, zum Widerspruch. In diesem Fall müsste es zwei orthogonale Eigenvektoren |q + λ, α⟩ und |q + λ, β⟩ zum Eigenwert q + λ geben: ⟨q + λ, β|q + λ, α⟩ = 0
(10)
Wir betrachten die beiden Vektoren S(−λ)|q + λ, α⟩ und S(−λ)|q + λ, β⟩. Nach Gl. (9) sind beide Eigenvektoren von Q zum Eigenwert q + λ − λ = q. Wegen der Unitarität von S(λ) verschwindet ihr Skalarprodukt: ⟨q + λ, β|S † (−λ)S(−λ)|q + λ, α⟩ = ⟨q + λ, β|q + λ, α⟩ = 0
(11)
Also sind sie nicht kollinear, und wir gelangen zu dem Schluss, dass im Gegensatz zur Annahme q wenigstens zweifach entartet sein muss. Folglich müssen sämtliche Eigenwerte von Q denselben Entartungsgrad aufweisen.
2-c Eigenvektoren Wir legen die relativen Phasen der verschiedenen Eigenvektoren von Q in Bezug auf den Eigenvektor |0⟩ zum Eigenwert 0 fest, indem wir |q⟩ = S(q)|0⟩
(12)
setzen. Wenden wir auf diese Gleichung S(λ) an und beachten Gl. (7), so erhalten wir S(λ)|q⟩ = S(λ)S(q)|0⟩ = S(q + λ)|0⟩ = |q + λ⟩
(13)
Der hierzu adjungierte Ausdruck ist ⟨q|S † (λ) = ⟨q + λ|
(14)
oder auch mit Gl. (4), und wenn wir λ durch −λ ersetzen ⟨q|S(λ) = ⟨q − λ|
(15)
3 {|q⟩}-Darstellung Weil Q eine Observable ist, bilden ihre Eigenvektoren eine Basis in H. Man kann daher jeden Ket durch seine „Wellenfunktion in der {|q⟩}-Darstellung“ charakterisieren: ψ(q) = ⟨q|ψ⟩
(16)
3-a Wirkung von Q in der {|q⟩}-Darstellung In der {|q⟩}-Darstellung lautet die zum Ket Q|ψ⟩ gehörende Wellenfunktion ⟨q|Q|ψ⟩ = q ⟨q|ψ⟩ = q ψ(q)
(17)
•
184 | Ergänzung EII
Hier haben wir Gl. (8) und die Hermitezität von Q berücksichtigt. In der {|q⟩}-Dar stellung besteht die Wirkung des Operators Q einfach in einer Multiplikation mit der Zahl q.
3-b Translationsoperator Die zum Ket S(λ)|ψ⟩ gehörende Wellenfunktion lautet in der {|q⟩}-Darstellung, siehe Gl. (15), ⟨q|S(λ)|ψ⟩ = ⟨q − λ|ψ⟩ = ψ(q − λ)
(18)
In dieser Darstellung bewirkt daher der Operator S(λ) eine Translation der Wellen funktion um die Größe λ parallel zur q-Achse.² Aus diesem Grunde nennt man den Operator S(λ) den Translationsoperator.
3-c Wirkung von P in der {|q⟩}-Darstellung Ist ε eine infinitesimal kleine Größe, so gilt ε S(−ε) = eiεP/ℏ = 𝟙 + i P + O(ε2 ) ℏ
(19)
Folglich ist ε ⟨q|S(−ε)|ψ⟩ = ψ(q) + i ⟨q|P|ψ⟩ + O(ε2 ) ℏ
(20)
Andererseits liefert Gl. (18) ⟨q|S(−ε)|ψ⟩ = ψ(q + ε)
(21)
Der Vergleich der beiden letzten Gleichungen zeigt, dass ε ψ(q + ε) = ψ(q) + i ⟨q|P|ψ⟩ + O(ε2 ) ℏ
(22)
ist. Daher haben wir ℏ ψ(q + ε) − ψ(q) lim i ε→0 ε ℏ d = ψ(q) i dq
⟨q|P|ψ⟩ =
In der {|q⟩}-Darstellung wirkt also P wie der Differentialoperator Verallgemeinerung von Gl. (E-27) aus Kap. II.
(23) ℏ d i dq .
Dies ist eine
2 f(x − a) ist die Funktion, die im Punkt x = x 0 + a den Wert f(x 0 ) annimmt; man erhält sie also aus f(x) durch eine Translation um +a.
Eigenschaften zweier Observabler mit dem Kommutator iℏ |
•
185
4 {|p⟩}-Darstellung Mit Hilfe der Gl. (23) gelangen wir leicht zu der Wellenfunktion v p (q), die in der {|q⟩}Darstellung zum Eigenvektor |p⟩ von P mit dem Eigenwert p gehört: i
v p (q) = ⟨q|p⟩ = (2πℏ)−1/2 e ℏ pq
(24)
Daher können wir schreiben +∞
i
|p⟩ = (2πℏ)−1/2 ∫ dq e ℏ pq |q⟩
(25)
−∞
Für einen Ket |ψ⟩ kann man seine „Wellenfunktion in der {|p⟩}-Darstellung“ durch ψ(p) = ⟨p|ψ⟩
(26)
einführen. Wenn wir die zu Gl. (25) adjungierte Beziehung verwenden, erhalten wir hierfür gerade die Fourier-Transformierte von ψ(q): +∞ −1/2
ψ(p) = (2πℏ)
i
∫ dq e− ℏ pq ψ(q)
(27)
−∞
Die Wirkung des Operators P in der {|p⟩}-Darstellung besteht in der Multiplikation mit der Zahl p; der Operator Q wirkt in dieser Darstellung wie der Differentialoperator iℏ ddp , wie man mit Hilfe von Gl. (27) zeigen kann. Wir erhalten also in der {|q⟩} – und der {|p⟩}-Darstellung symmetrische Ergebnis se. Das ist nicht überraschend. Bei den von uns gemachten Voraussetzungen dürfen wir die Operatoren P und Q vertauschen, wenn wir nur bei dem durch (2) gegebenen Kommutator das Vorzeichen ändern. Wir hätten also auch statt des Operators S(λ) den durch T(λ ) = eiλ
Q/ℏ
(28)
definierten Operator einführen und dann dieselben Überlegungen anstellen können, indem wir überall P durch Q und i durch −i ersetzt hätten.
Referenzen und Literaturhinweise Messiah (1.17), Bd. 1, § VIII-6; Dirac (1.13), § 25; Merzbacher (1.16), Kap. 14, § 7.
•
186 | Ergänzung FII
Ergänzung FII Der Paritätsoperator 1 1-a 1-b 1-c 2 2-a 2-b 2-c 2-d 3 4
Der Paritätsoperator | 186 Definition | 186 Einfache Eigenschaften | 187 Eigenräume von Π | 188 Gerade und ungerade Operatoren | 189 Definitionen | 189 Auswahlregeln | 190 Beispiele | 190 Operatorfunktionen | 191 Eigenzustände einer geraden Observablen | 192 Anwendung auf einen besonders wichtigen Fall | 192
1 Der Paritätsoperator 1-a Definition Wir betrachten ein physikalisches System, dessen Zustandsraum Hr ist. In diesem Raum definieren wir den Paritätsoperator Π durch seine Wirkung auf die Basisvek toren¹ |r⟩: Π |r⟩ = | − r⟩
(1)
In der {|r⟩}-Darstellung sind die Matrixelemente von Π ⟨r|Π|r ⟩ = ⟨r| − r ⟩ = δ(r + r )
(2)
Wenn wir bei einem beliebigen Vektor |ψ⟩ ∈ Hr in dem Ausdruck |ψ⟩ = ∫ d3 r ψ(r)|r⟩
(3)
die Variable r = −r setzen, so kann man für |ψ⟩ auch |ψ⟩ = ∫ d3 r ψ(−r )| − r ⟩
(4)
schreiben. Berechnen wir jetzt Π|ψ⟩, so erhalten wir Π|ψ⟩ = ∫ d3 r ψ(−r )|r ⟩
(5)
1 Man darf | − r0 ⟩ nicht mit −|r0 ⟩ verwechseln. | − r0 ⟩ ist ein Eigenvektor von R zum Eigenwert −r0 mit der Wellenfunktion ξ −r0 (r) = δ(r + r0 ); −|r0 ⟩ ist ein Eigenvektor von R zum Eigenwert r0 mit der Wellenfunktion −ξ r0 (r) = −δ(r − r0 ). https://doi.org/10.1515/9783110638738-018
Der Paritätsoperator
| 187
•
Der Vergleich von Gl. (3) mit Gl. (5) zeigt, dass Π in der Ortsdarstellung r in −r ändert: ⟨r|Π|ψ⟩ = ψ(−r)
(6)
Gehen wir also von einem physikalischen System S mit dem Zustandsvektor |ψ⟩ aus, so beschreibt der Vektor Π|ψ⟩ das System, das man aus S durch Spiegelung am Koor dinatenursprung erhält.
1-b Einfache Eigenschaften Der Operator Π 2 ist gleich dem Einheitsoperator, denn nach Gl. (1) hat man zunächst Π 2 |r⟩ = Π(Π|r⟩) = Π| − r⟩ = |r⟩
(7)
Weil aber die Kets |r⟩ in Hr eine Basis bilden, gilt Π2 = 𝟙
(8a)
und damit auch Π = Π −1
(8b)
Durch Rekursion zeigt man weiter, dass der Operator Π n für gerades n gleich 𝟙 und für ungerades n gleich Π ist. Schreibt man Gl. (6) in der Form ⟨r|Π|ψ⟩ = ⟨−r|ψ⟩
(9)
so ergibt sich, weil |ψ⟩ beliebig ist, ⟨r|Π = ⟨−r|
(10)
Andererseits ist der zu (1) hermitesch konjugierte Ausdruck ⟨r|Π † = ⟨−r|
(11)
Da die Kets |r⟩ eine Basis bilden, erschließt man aus den beiden letzten Gleichungen die Hermitezität des Paritätsoperators, dass Π† = Π
(12)
Schließlich erhält man hieraus zusammen mit Gl. (8b) Π −1 = Π † Der Paritätsoperator ist also auch unitär.
(13)
•
188 | Ergänzung FII
1-c Eigenräume von Π Wenden wir auf einen Eigenvektor |φ π ⟩ von Π zum Eigenwert p π Gl. (8a) an, so erhal ten wir |φ π ⟩ = Π 2 |φ π ⟩ = p2π |φ π ⟩
(14)
Also gilt p2π = 1, und die Eigenwerte von Π können nur +1 und −1 sein. Weil der Raum Hr unendlichdimensional ist, müssen diese Eigenwerte entartet sein. Man nennt ei nen Eigenvektor von Π zum Eigenwert +1 von gerader Parität oder einfach gerade, einen Eigenvektor zum Eigenwert −1 von ungerader Parität oder ungerade. Wir führen die beiden hermiteschen Operatoren 1 (𝟙 + Π) 2 1 P− = (𝟙 − Π) 2 P+ =
(15)
ein. Mit Gl. (8a) zeigt man sofort, dass P2+ = P+
(16)
P2− = P−
ist. Sie sind also Projektoren, und wir wollen die Unterräume von Hr , auf die sie pro jizieren, H+ und H− nennen. Für die beiden Produkte P+ P− und P− P+ erhalten wir 1 (𝟙 + Π − Π − Π 2 ) = 0 4 1 P− P+ = (𝟙 − Π + Π − Π 2 ) = 0 4
P+ P− =
(17)
H+ und H− sind also orthogonale Unterräume. Zugleich sind sie zueinander komple mentär, denn aus der Definition (15) folgt sofort P+ + P− = 𝟙
(18)
Für einen beliebigen Ket |ψ⟩ ∈ H gilt daher |ψ⟩ = (P+ + P− )|ψ⟩ = |ψ+ ⟩ + |ψ− ⟩
(19)
mit |ψ+ ⟩ = P+ |ψ⟩
(20)
|ψ− ⟩ = P− |ψ⟩ Wir berechnen die Produkte 1 Π(𝟙 + Π) = 2 1 ΠP− = Π(𝟙 − Π) = 2
ΠP+ =
1 (Π + 𝟙) = P+ 2 1 (Π − 𝟙) = −P− 2
(21)
Der Paritätsoperator
|
189
•
Hiermit können wir zeigen, dass die in (20) eingeführten Vektoren gerade bzw. unge rade sind: Π|ψ+ ⟩ = ΠP+ |ψ⟩ = P+ |ψ⟩ = |ψ+ ⟩ Π|ψ− ⟩ = ΠP− |ψ⟩ = −P− |ψ⟩ = −|ψ− ⟩
(22)
H+ und H− sind demnach Eigenräume von Π zu den Eigenwerten +1 bzw. −1. In der Ortsdarstellung lauten die beiden letzten Gleichungen ⟨r|ψ+ ⟩ = ψ+ (r) = ⟨r|Π|ψ+ ⟩ = ψ+ (−r) ⟨r|ψ− ⟩ = ψ− (r) = −⟨r|Π|ψ− ⟩ = −ψ− (−r)
(23)
Die Wellenfunktionen ψ+ (r) und ψ− (r) sind gerade bzw. ungerade. Die Beziehung (19) bringt zum Ausdruck, dass ein beliebiger Ket |ψ⟩ ∈ Hr in ei ne Summe aus zwei Eigenvektoren |ψ+ ⟩ und |ψ− ⟩ von Π zerlegt werden kann, die zum geraden Unterraum H+ bzw. zum ungeraden Unterraum H− gehören. Der Paritätsope rator ist daher eine Observable.
2 Gerade und ungerade Operatoren 2-a Definitionen In § 2 von Ergänzung CII führten wir den Begriff der unitären Transformation von Ope ratoren ein. Für den Fall des (unitären) Paritätsoperators erfüllt der zu einem beliebi gen Operator B transformierte Operator ̃ = ΠBΠ B
(24)
die Beziehung [s. Gl. (27) in Ergänzung CII ]: ̃ ⟩ = ⟨−r|B| − r ⟩ ⟨r|B|r
(25)
̃ = +B, und ungerade, wenn B ̃ = −B Insbesondere heißt der Operator B gerade, wenn B gilt. Für einen geraden Operator B+ wird darum B+ = Π B+ Π
(26)
oder auch, wenn wir diese Gleichung von links mit Π multiplizieren und Gl. (8a) be achten, Π B+ = B+ Π [Π, B+ ] = 0
(27) (28)
Ein gerader Operator vertauscht mit dem Paritätsoperator Π. Entsprechend zeigt man, dass ein ungerader Operator B− mit Π antivertauscht: Π B− + B− Π = 0
(29)
•
190 | Ergänzung FII
2-b Auswahlregeln Für einen geraden Operator B+ berechnen wir das Matrixelement ⟨φ|B+ |ψ⟩. Nach Vor aussetzung ist ⟨φ|B+ |ψ⟩ = ⟨φ|Π B+ Π|ψ⟩ = ⟨φ |B+ |ψ ⟩ wenn wir |φ ⟩ = Π|φ⟩ |ψ ⟩ = Π|ψ⟩
(30)
(31)
setzen. Ist nun einer der Kets |φ⟩ und |ψ⟩ gerade und der andere ungerade (|φ ⟩ = ±|φ⟩, |ψ ⟩ = ∓|ψ⟩), so liefert diese Beziehung ⟨φ|B+ |ψ⟩ = −⟨φ|B+ |ψ⟩ = 0
(32)
Hieraus ergibt sich die Auswahlregel: Für Vektoren entgegengesetzter Parität sind die Matrixelemente eines geraden Operators gleich null. Für einen ungeraden Operator B− folgt aus Gl. (30), dass ⟨φ|B− |ψ⟩ = −⟨φ |B− |ψ ⟩
(33)
ist. Dieses Matrixelement ist gleich null, wenn |φ⟩ und |ψ⟩ beide gerade oder wenn beide ungerade sind. Hieraus erhalten wir eine weitere Auswahlregel: Haben die bei den Vektoren dieselbe Parität, so sind die Matrixelemente eines ungeraden Operators gleich null. Insbesondere ist das Diagonalelement ⟨ψ|B− |ψ⟩ (der Erwartungswert von B− im Zustand |ψ⟩, s. Kap. III, § C-4) eines ungeraden Operators B− gleich null, wenn |ψ⟩ eine bestimmte Parität aufweist.
2-c Beispiele α Der Ortsoperator In diesem Fall haben wir Π X|r⟩ = Π X|x, y, z⟩ = x Π|x, y, z⟩ = x| − x, −y, −z⟩ = x| − r⟩
(34)
und X Π|r⟩ = X| − r⟩ = X| − x, −y, −z⟩ = −x| − x, −y, −z⟩ = −x| − r⟩
(35)
Addieren wir diese beiden Gleichungen, so erhalten wir (Π X + X Π)|r⟩ = 0
(36)
oder, weil die Vektoren |r⟩ eine Basis bilden, ΠX+XΠ =0
(37)
X ist ungerade. Für Y und Z gilt eine entsprechende Überlegung; darum ist der Orts operator R ungerade.
Der Paritätsoperator
| 191
•
β Der Impulsoperator Für den Ket Π|p⟩ ergibt sich Π |p⟩ = (2πℏ)−3/2 ∫ d3 r eip⋅r/ℏ Π |r⟩ = (2πℏ)−3/2 ∫ d3 r eip⋅r/ℏ | − r⟩ = (2πℏ)−3/2 ∫ d3 r e−ip⋅r /ℏ |r ⟩
= | − p⟩
(38)
Mit einer analogen Überlegung wie eben gelangen wir dann zu den Beziehungen Π P x |p⟩ = p x | − p⟩
(39)
P x Π|p⟩ = −p x | − p⟩ und somit schließlich zu Π Px + Px Π = 0
(40)
Der Impulsoperator P ist ein ungerader Operator. γ Der Paritätsoperator Π vertauscht mit sich selbst. Darum ist er ein gerader Operator.
2-d Operatorfunktionen Für einen geraden Operator B+ erhalten wir unter Beachtung von Gl. (8a) B+ Π)(Π B+ Π) . . . (Π B+ Π) = B+n Π B+n Π = (Π ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟
(41)
n Faktoren
Die Potenz eines geraden Operators ist wieder gerade. Allgemeiner ist ein Operator F(B+ ), der also von einem geraden Operator abhängt, gerade. Für einen ungeraden Operator B− erhalten wir B− Π)(Π B− Π) . . . (Π B− Π) = (−1)n (B− )n Π B−n Π = (Π ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟
(42)
n Faktoren
Die n-te Potenz eines ungeraden Operators ist für gerades n gerade und für ungerades n ungerade. Die Operatorfunktion F(B− ) eines ungeraden Operators ist gerade, wenn die zugehörige Funktion F(z) gerade ist, und ungerade, wenn diese ungerade ist. Im allgemeinen Fall hat F(B− ) keine bestimmte Parität.
•
192 | Ergänzung FII
3 Eigenzustände einer geraden Observablen Es sei B+ eine beliebige gerade Observable und |φ b ⟩ ein Eigenvektor von B+ zum Eigen wert b. Weil B+ gerade ist, vertauscht sie mit dem Paritätsoperator Π. Die Anwendung der Sätze aus § D-3-a von Kap. II führt dann zu folgenden Ergebnissen: 1. Ist b ein nichtentarteter Eigenwert, so ist |φ b ⟩ notwendig ein Eigenvektor von Π, und zwar entweder gerade oder ungerade. Der Erwartungswert ⟨φ b |B− |φ b ⟩ jeder ungeraden Observablen B− , wie z. B. des Ortsoperators R oder des Impulsopera tors P, ist gleich null. 2. Ist b ein entarteter Eigenwert mit dem Eigenraum Hb , so besitzen die Vektoren aus Hb nicht notwendig eine bestimmte Parität: Es kann sein, dass Π|φ b ⟩ und |φ b ⟩ nicht kollinear sind, doch ist Π|φ b ⟩ in jedem Fall ein Eigenvektor zum selben Ei genwert b. Weiter kann man in jedem Eigenraum Hb eine Basis von gemeinsamen Eigenvektoren von Π und B+ finden.
4 Anwendung auf einen besonders wichtigen Fall Im Folgenden werden wir sehr häufig die Eigenzustände eines Hamilton-Operators von der Form H=
P2 + V(R) 2m
(43)
berechnen müssen. Der Operator P ist ungerade, der Operator P2 somit gerade. Wenn überdies die Funktion V(r) gerade, d. h. V(r) = V(−r) ist, so ist H gerade. Es ist dann möglich, die Eigenzustände von H unter den geraden oder den ungeraden Zuständen zu suchen, was die Rechnungen oft sehr vereinfacht. Wir sind bereits mehrfach dem Fall begegnet, bei dem der Hamilton-Operator H gerade ist: In Ergänzung HI waren dies die rechteckigen Potentialtöpfe und der unend lich tiefe Potentialtopf. Als weitere Beispiele werden wir den harmonischen Oszillator, das Wasserstoffatom und andere kennenlernen. Bemerkung: Ist der Hamilton-Operator H gerade und hat man herausgefunden, dass einer seiner Eigenzu stände keine bestimmte Parität aufweist (der Vektor Π|φ h ⟩ ist dann nicht kollinear zu |φ h ⟩), so kann man zeigen, dass der zugehörige Eigenwert entartet ist: Weil Π mit H vertauscht, ist Π|φ h ⟩ Eigenvektor von H zum selben Eigenwert wie |φ h ⟩.
Referenzen und Literaturhinweise Schiff (1.18), § 29; Roman (2.3), § 5–3d; Feynman, Bd. 1 (6.3), Kap. 2; Sakurai (2.7), Kap. 3; Artikel von Morrison (2.28), Feinberg und Goldhaber (2.29) sowie Wigner (2.30).
Zweidimensionaler unendlich tiefer Potentialtopf
| 193
•
Ergänzung GII Zweidimensionaler unendlich tiefer Potentialtopf 1 2 2-a 2-b 2-c
Definition und Eigenzustände | 193 Energieniveaus | 194 Grundzustand | 194 Erste angeregte Zustände | 195 Systematische und zufällige Entartung | 195
In Ergänzung HI , § 2-c untersuchten wir bereits für den eindimensionalen Fall die sta tionären Zustände eines Teilchens, das sich in einem unendlich tiefen Potentialtopf befindet. Mit Hilfe des Begriffs des Tensorprodukts (s. Kap. II, § F) können wir diese Untersuchung auf den zweidimensionalen Fall verallgemeinern; die Einführung einer dritten Dimension bietet dann keine grundsätzlichen Schwierigkeiten.
1 Definition und Eigenzustände Ein Teilchen bewege sich in der x, y-Ebene im Innern eines „quadratischen Kastens“ mit der Seitenlänge a. Seine potentielle Energie V(x, y) werde unendlich groß, sobald die x- oder die y-Koordinate außerhalb des Intervalls [0, a] liegt. Sie wird also mit: {0 V∞ (u) = { +∞ {
wenn 0 ≤ u ≤ a wenn u < 0 oder u > a
(1)
durch V(x, y) = V∞ (x) + V∞ (y)
(2)
beschrieben. Den Hamilton-Operator (s. Kap. III, § B-5) H=
1 (P2 + P2y ) + V∞ (X) + V∞ (Y) 2m x
(3)
können wir dann H = Hx + Hy
(4)
schreiben, wobei 1 2 P + V∞ (X) 2m x 1 2 P + V∞ (Y) Hy = 2m y
Hx =
(5)
gesetzt wurde. Dies ist der in Kap. II, § F-4-a-β angekündigte besonders wichtige Spe zialfall. Wir suchen nach den Eigenzuständen von H in der Form |Φ⟩ = |φ⟩x |φ⟩y https://doi.org/10.1515/9783110638738-019
(6)
•
194 | Ergänzung GII
Darin genügen |φ⟩x und |φ⟩y den Gleichungen H x |φ⟩x = E x |φ⟩x
|φ⟩x ∈ Hx
H y |φ⟩y = E y |φ⟩y
|φ⟩y ∈ Hy
(7)
Es ist dann H|Φ⟩ = E|Φ⟩ (8)
mit E = Ex + Ey
Auf diese Weise werden wir von einem zweidimensionalen auf ein eindimensionales Problem geführt. Dieses haben wir bereits in Ergänzung HI gelöst. Übernehmen wir die Ergebnisse und beachten die Gleichungen (7) und (8), so sehen wir, dass die Ei genwerte von H in der Form E n,p =
1 (n2 + p2 )π 2 ℏ2 2ma2
(9)
angegeben werden können, wenn n und p positiv und ganzzahlig sind. Ferner erken nen wir, dass die zugehörigen Eigenzustände |Φ n,p ⟩ als tensorielle Produkte |Φ n,p ⟩ = |φ n ⟩x |φ p ⟩y
(10)
darstellbar sind. So ist die normierte Wellenfunktion schließlich Φ n,p (x, y) = φ n (x) φ p (y) nπx pπy 2 sin = sin a a a
(11)
An den Rändern des „Kastens“ (x = 0 oder y = 0), an denen die potentielle Energie unendlich groß wird, haben diese Funktionen den Wert null.
2 Energieniveaus 2-a Grundzustand Die Quantenzahlen n und p sind positive ganze Zahlen. Gleich null können sie nicht sein, weil dann die Wellenfunktionen identisch gleich null und damit nicht normier bar wären. Den Grundzustand mit dem niedrigsten Niveau erhält man für n = 1, p = 1. Seine Energie ist E1,1 =
π 2 ℏ2 ma2
(12)
Da dieser Wert nur für n = p = 1 erreicht wird, ist der Grundzustand nichtentartet.
Zweidimensionaler unendlich tiefer Potentialtopf
| 195
•
2-b Erste angeregte Zustände Das erste angeregte Niveau erhält man für n = 1 und p = 2 oder für n = 2 und p = 1: E1,2 = E2,1 =
5 π 2 ℏ2 2 ma2
(13)
Weil |Φ1,2 ⟩ und |Φ2,1 ⟩ voneinander unabhängig sind, ist dieses Niveau zweifach ent artet. Das zweite angeregte Niveau gehört zu n = p = 2. Es ist nichtentartet, und seine Energie ist E2,2 = 4
π2 ℏ2 ma2
(14)
Das dritte angeregte Niveau gehört zu n = 1, p = 3 und n = 3, p = 1 usw.
2-c Systematische und zufällige Entartung Allgemein stellen wir fest, dass alle Niveaus mit n ≠ p entartet sind, weil E n,p = E p,n
(15)
gilt. Diese Entartung hängt mit der Symmetrie des Problems zusammen. Der hier un tersuchte Potentialkasten ist in Bezug auf die Winkelhalbierende der x, y-Ebene sym metrisch. Dies drückt sich in der Invarianz des Hamilton-Operators H gegenüber der Vertauschung: X ←→ Y P x ←→ P y
(16)
aus. Man könnte im Zustandsraum einen Operator definieren, der die Symmetrie in Bezug auf die Winkelhalbierende charakterisiert, und dann zeigen, dass dieser Ope rator mit H vertauscht. Kennt man einen Eigenzustand von H mit der Wellenfunktion Φ(x, y), so ist auch der Zustand mit der Wellenfunktion Φ (x, y) = Φ(y, x) Eigenzu stand von H zum selben Eigenwert. Ist daher die Funktion Φ(x, y) nicht in x und y symmetrisch, so muss der zugehörige Eigenwert entartet sein. Dies ist die Ursache für die in Gl. (15) angegebene Entartung: Für n ≠ p ist Φ n,p (x, y) gegenüber einer Vertau schung von x und y nicht symmetrisch, s. Gl. (11). Die Deutung wird dadurch bestätigt, dass eine Störung dieser Symmetrie die Entartung aufhebt: Ändert man den quadra tischen in einen rechteckigen „Kasten“ mit unterschiedlichen Seitenlängen a und b ab, so verschwindet die Entartung; aus Gl. (9) wird dann E n,p =
π 2 ℏ2 n2 p2 + ) ( 2m a2 b 2
(17)
•
196 | Ergänzung GII
d. h. dass jetzt für n ≠ p E p,n ≠ E n,p
(18)
ist. Entartungen, die auf eine Symmetrie des Problems zurückgehen, heißen systema tische Entartungen. Bemerkung: Die anderen, beim zweidimensionalen quadratischen Kasten auftretenden Symmetrien führen nicht zu systematischen Entartungen, weil bei ihnen alle Eigenzustände von H invariant sind. So werden z. B. für beliebige n und p die Funktionen Φ n,p (x, y) einfach mit einem Faktor multipli ziert, wenn man x durch (a−x) und y durch (a−y) ersetzt (Symmetrie in Bezug auf den Mittelpunkt des Kastens). Entartungen, die nicht direkt mit den dem Problem zugrunde liegenden Symmetrien zusammen hängen, nennt man zufällige Entartungen. In dem hier untersuchten Fall ergibt sich dies für E 5,5 = E 7,1 oder auch für E 7,4 = E 8,1 .
Aufgaben | 197
•
Ergänzung HII Aufgaben Dirac-Notation. Kommutatoren. Eigenvektoren und Eigenwerte 1. Es seien |φ n ⟩ die Eigenzustände eines hermiteschen Operators H (dies kann z. B. der Hamilton-Operator eines physikalischen Systems sein) und es werde vorausge setzt, dass diese Zustände eine diskrete, orthonormierte Basis bilden. Der Operator U(m, n) sei definiert durch U(m, n) = |φ m ⟩⟨φ n | a) Man bestimme den zu U(m, n) adjungierten Operator U † (m, n). b) Man bestimme den Kommutator [H, U(m, n)]. c) Man beweise die Beziehung U(m, n) U † (p, q) = δ nq U(m, p) d) Man berechne die Spur Tr{ U(m, n)}. e) Es sei A ein Operator mit den Matrixelementen A mn = ⟨φ m |A|φ n ⟩. Man beweise die Beziehung A = ∑ A mn U(m, n) m,n
f)
Man zeige, dass A pq = Tr{AU † (p, q)}.
2. In einem zweidimensionalen Vektorraum betrachte man den Operator, dessen Ma trix in einer orthonormierten Basis {|1⟩, |2⟩} durch 0 σy = ( i
−i ) 0
gegeben ist. a) Ist σ y hermitesch? Man berechne Eigenwerte und Eigenvektoren der Matrix (man gebe ihre normierte Entwicklung nach den Basisvektoren {|1⟩, |2⟩} an). b) Man berechne für die Projektoren auf diese Eigenvektoren die zugehörigen Matri zen. Man zeige dann, dass diese Vektoren den Orthogonalitätsbedingungen und der Vollständigkeitsrelation genügen. c) Man beantworte dieselben Fragen für die Matrizen 2 M=( −i√2
i√2 ) 3
und (in einem dreidimensionalen Raum) 0 ℏ (−√2 Ly = 2i 0
√2 0 −√2
0 √2) 0
https://doi.org/10.1515/9783110638738-020
•
198 | Ergänzung HII
3. Der Zustandsraum eines physikalischen Systems sei dreidimensional, und die Menge {|u 1 ⟩, |u 2 ⟩, |u 3 ⟩} bilde in diesem Raum eine orthonormierte Basis. Die Kets |ψ0 ⟩ und |ψ1 ⟩ seien durch die Gleichungen 1 |u 1 ⟩ + √2 1 |u 1 ⟩ + |ψ1 ⟩ = √3
|ψ0 ⟩ =
i 1 |u 2 ⟩ + |u 3 ⟩ 2 2 i |u 3 ⟩ √3
definiert. a) Sind diese Kets normiert? b) Man bestimme die Matrizen ρ 0 und ρ 1 , die in der Basis {|u 1 ⟩, |u 2 ⟩, |u 3 ⟩} die Pro jektoren auf den Zustand |ψ0 ⟩ bzw. |ψ1 ⟩ repräsentieren. Man zeige, dass diese Matrizen hermitesch sind. 4. Mit zwei Vektoren |φ⟩ und |ψ⟩ aus dem Zustandsraum sei ein Operator durch K = |φ⟩⟨ψ| definiert. a) Unter welcher Bedingung ist K hermitesch? b) Man berechne K 2 . Unter welcher Voraussetzung ist K ein Projektionsoperator? c) Man zeige, dass K stets in der Form K = λP1 P2 geschrieben werden kann, wobei λ eine zu berechnende Konstante und P1 und P2 Projektoren sind. 5. Es sei P1 der Orthogonalprojektor auf den Unterraum H1 und P2 der Orthogonal projektor auf den Unterraum H2 . Man zeige: Damit das Produkt P1 P2 ebenfalls ein Orthogonalprojektor ist, ist notwendig und hinreichend, dass P1 und P2 vertauschen. Welches ist in diesem Fall der Unterraum, auf den P1 P2 projiziert? 6. Die Matrix σ x sei definiert durch σx = (
0 1
1 ) 0
Man beweise die Beziehung eiασ x = I cos α + iσ x sin α wobei I die 2 × 2-Einheitsmatrix bedeutet. 7. Für die in Aufgabe 2 angegebene Matrix σ y beweise man eine analoge Relation, wie sie in der vorstehenden Aufgabe für die Matrix σ x gezeigt wurde. Man verallgemeinere die Aussage für Matrizen der Form σ u = λσ x + μσ y mit λ2 + μ 2 = 1 Man berechne die Matrizen für e2iσ x , (eiσ x )2 und ei(σ x +σ y ) . Ist e2iσ x gleich (eiσ x )2 und ei(σ x +σ y ) gleich eiσ x eiσ y ?
Aufgaben |
199
•
8. Bei einem eindimensionalen Problem betrachte man den Hamilton-Operator 1 2 P + V(X) H= 2m eines Teilchens, wobei X und P die in § E von Kap. II definierten Operatoren sind und der Vertauschungsrelation [X, P] = iℏ genügen. Die Eigenvektoren von H seien mit |φ n ⟩ bezeichnet: H|φ n ⟩ = E n |φ n ⟩; n ist ein diskreter Index. a) Man zeige, dass ⟨φ n |P|φ n ⟩ = α⟨φ n |X|φ n ⟩ ist, worin α ein Koeffizient ist, der von E n und E n nur über ihre Differenz abhängt. Man bestimme α. Anregung: Zum Beweis verwende man den Kommutator [X, H]. b) Hieraus leite man unter Verwendung der Vollständigkeitsrelation die Gleichung ∑(E n − E n )2 |⟨φ n |X|φ n ⟩|2 = n
ℏ2 ⟨φ n |P2 |φ n ⟩ m2
her. 9. Es seien H der Hamilton-Operator eines physikalischen Systems und |φ n ⟩ die Ei genvektoren von H zu den Eigenwerten E n : H|φ n ⟩ = E n |φ n ⟩ a) Für einen beliebigen Operator A beweise man die Beziehung ⟨φ n |[A, H]|φ n ⟩ = 0 b) Für das eindimensionale Problem eines Teilchens mit der Masse m und der poten tiellen Energie V(x) lautet der Hamilton-Operator 1 2 H= P + V(X) 2m α) Man bestimme in Abhängigkeit von P, X und V(X) die Kommutatoren [H, P], [H, X] und [H, XP]. β) Man zeige, dass das Matrixelement ⟨φ n |P|φ n ⟩ gleich null ist. In Kapitel III werden wir dies als den Erwartungswert des Impulses im Zustand |φ n ⟩ inter pretieren. P2 γ) Man stelle eine Beziehung zwischen Ekin = ⟨φ n | 2m |φ n ⟩ (dem Erwartungswert der kinetischen Energie im Zustand |φ n ⟩) und ⟨φ n |X dd VX |φ n ⟩ her. Versteht man unter dem Matrixelement ⟨φ n |V(X)|φ n ⟩ den Erwartungswert der potentiellen Energie im Zustand |φ n ⟩, wie hängt dann dieser mit dem Erwartungswert der kinetischen Energie zusammen? Man setze V(X) = V0 X k
k = 2, 4, 6, . . . ; V0 > 0
10. Unter Verwendung der Beziehung ⟨x|p⟩ = (2πℏ)−1/2 eipx/ℏ berechne man in Ab hängigkeit von ψ(x) die Ausdrücke ⟨x|XP|ψ⟩ und ⟨x|PX|ψ⟩. Kann man die Ergebnisse auch direkt aus der Tatsache finden, dass in der Ortsdarstellung der Impulsoperator P wie ℏi ddx wirkt?
•
200 | Ergänzung HII
Vertauschende Observable. V. S. K. O. 11. Ein physikalisches System mit einem dreidimensionalen Zustandsraum werde in einer aus den drei Kets |u 1 ⟩, |u 2 ⟩ und |u 3 ⟩ gebildeten orthonormierten Basis beschrie ben. Die beiden Operatoren H und B werden in dieser Basis (mit der angegebenen Reihenfolge) durch die Matrizen 1 H = ℏω0 (0 0
0 −1 0
0 0) −1
1 B = b (0 0
0 0 1
0 1) 0
definiert; ω0 und b sind reelle Konstante. a) Sind H und B hermitesch? b) Man zeige, dass H und B vertauschen. Man gebe eine Basis aus gemeinsamen Eigenvektoren von H und B an. c) Welche Operatorenmenge {H}, {B}, {H, B}, {H 2 , B} bildet einen vollständigen Satz kommutierender Observabler (V. S. K. O.)? 12. Der Zustandsraum sei der gleiche wie in der vorangegangenen Aufgabe. Die bei den Operatoren L z und S seien durch die Gleichungen L z |u 1 ⟩ = |u 1 ⟩ S|u 1 ⟩ = |u 3 ⟩
L z |u 2 ⟩ = 0 S|u 2 ⟩ = |u 2 ⟩
L z |u 3 ⟩ = −|u 3 ⟩ S|u 3 ⟩ = |u 1 ⟩
definiert. a) Welche Matrizen repräsentieren in der Basis {|u 1 ⟩, |u 2 ⟩, |u 3 ⟩} die Operatoren L z , L2z , S und S2 ? Sind diese Operatoren Observable? b) Welche Form hat allgemein die Matrix eines Operators, der mit L z vertauscht? Wel che allgemeine Form hat die Matrix eines Operators, der mit L2z vertauscht, und welche Form hat die Matrix eines Operators, der mit S2 vertauscht? c) Bilden L2z und S einen vollständigen Satz kommutierender Observabler? Man gebe eine Basis aus gemeinsamen Eigenvektoren an.
Lösung zu Aufgabe 11 a) H und B sind hermitesch, weil die zugehörigen Matrizen symmetrisch und reell sind. b) |u 1 ⟩ ist gemeinsamer Eigenvektor von H und B, also ist HB|u 1 ⟩ = BH|u 1 ⟩. Da mit H und B vertauschen, genügt es darum, dass die Einschränkungen dieser Operatoren auf den von |u 2 ⟩ und |u 3 ⟩ aufgespannten Unterraum H2 vertau schen. In diesem Raum wird H durch die Matrix −ℏω0 I dargestellt (wobei I die 2× 2-Einheitsmatrix bedeutet), die mit allen 2× 2-Matrizen vertauscht. Damit ver tauschen auch H und B. Dies könnte man auch zeigen, indem man die Matrizen
Aufgaben |
201
•
HB und BH direkt berechnet. Die Einschränkung von B auf H2 ist 0 PH2 BPH2 = b ( 1
1 ) 0
Die normierten Eigenvektoren dieser 2 × 2-Matrix sind 1 [|u 2 ⟩ + |u 3 ⟩] √2 1 |p3 ⟩ = [|u 2 ⟩ − |u 3 ⟩] √2
|p2 ⟩ =
(Eigenwert + b) (Eigenwert − b)
Diese Vektoren sind aber auch Eigenvektoren von H, weil H2 Eigenraum von H zum Eigenwert −ℏω0 ist. Insgesamt sind damit die gemeinsamen Eigenvektoren der Operatoren H und B gegeben durch
|p1 ⟩ = |u 1 ⟩ 1 [|u 2 ⟩ + |u 3 ⟩] √2 1 |p3 ⟩ = [|u 2 ⟩ − |u 3 ⟩] √2 |p2 ⟩ =
Eigenwert von H
Eigenwert von B
ℏω0
b
−ℏω0
b
−ℏω0
−b
Bis auf einen Phasenfaktor sind dies auch die einzigen. c) Man erkennt, dass H einen zweifach entarteten Eigenwert aufweist; H bildet al so keinen V. S. K. O. Auch B besitzt einen zweifach entarteten Eigenwert und ist damit kein V. S. K. O.: Sowohl |p1 ⟩ als auch |p2 ⟩ oder √13 |u 1 ⟩ + √13 |u 2 ⟩ + √13 |u 3 ⟩ können Eigenvektoren von B zum Eigenwert b sein. Dagegen bildet die Menge der beiden Operatoren H und B einen V. S. K. O.: Es gibt keine zwei Vektoren |p j ⟩, die gleichzeitig Eigenvektoren von H und B zu denselben Eigenwerten sind. Deshalb ist das System der normierten gemeinsamen Eigenvektoren (bis auf Phasenfakto ren) eindeutig. Wir bemerken, dass im Eigenraum H2 von H zum Eigenwert −ℏω0 die Eigenwerte von B verschieden sind (b und −b); entsprechend sind in dem von den Vektoren |p1 ⟩ und |p2 ⟩ aufgespannten Eigenraum von B die Eigenwerte von H verschieden, nämlich ℏω0 und −ℏω0 . Für H 2 sind |p1 ⟩, |p2 ⟩ und |p3 ⟩ Eigenvektoren zum Eigenwert ℏ2 ω20 . Man sieht sofort, dass H 2 und B keinen V. S. K. O. bilden, weil zum Eigenwertpaar {ℏ2 ω20 , b} zwei linear unabhängige Eigenvektoren, das sind |p1 ⟩ und |p2 ⟩, gehören.
•
202 | Ergänzung HII
Lösung zu Aufgabe 12 a) Es gilt die Regel zur Konstruktion der Darstellungsmatrix eines Operators: In die n-te Spalte schreibe man die Komponenten der Transformation des n-ten Basis vektors. Damit erhält man leicht 1 L z = (0 0
0 0 0
0 0) −1
0 S = (0 1
0 1 0
1 0) 0
1 L2z = (0 0
0 0 0
0 0) 1
1 S2 = (0 0
0 1 0
0 0) 1
Diese Matrizen sind symmetrisch und reell, also hermitesch. Weil der Zustands raum endlich ist, sind sie weiter diagonalisierbar und darum Observable. b) Es sei M ein Operator, der mit L z vertauscht. Nach Kap. II, § D-3-a verschwinden die Matrixelemente von M zwischen |u 1 ⟩ und |u 2 ⟩, zwischen |u 2 ⟩ und |u 3 ⟩ und zwischen |u 1 ⟩ und |u 3 ⟩, weil es sich bei diesen jeweils um Eigenvektoren von L z zu verschiedenen Eigenwerten handelt. Darum ist die Matrix, die M repräsentiert, notwendig eine Diagonalmatrix, also von der Form [M, L z ] = 0
⇐⇒
m11 M=( 0 0
0 m22 0
0 0 ) m33
Wenn N mit L2z vertauscht, so kann die zugehörige Matrix von null verschiedene Elemente zwischen |u 1 ⟩ und |u 3 ⟩ besitzen (diese sind Eigenvektoren von L2z zum selben Eigenwert), aber keine zwischen |u 2 ⟩ einerseits und |u 1 ⟩ und |u 3 ⟩ anderer seits. Darum gilt [N, L2z ] = 0
⇐⇒
n11 N=( 0 n31
0 n22 0
n13 0 ) n33
Die Vertauschbarkeit eines Operators mit L2z ist für ihn weniger einschränkend als die Vertauschbarkeit mit L z . N ist nicht unbedingt eine Diagonalmatrix. Man kann lediglich sagen, dass N nicht die Vektoren des von |u 1 ⟩ und |u 3 ⟩ aufgespannten Unterraums F2 mit den Vektoren des von |u 2 ⟩ aufgespannten eindimensionalen Unterraums mischt. Dies erkennt man ganz deutlich, wenn man die Matrix N aufschreibt, die den Operator N in der Basis {|u 1 ⟩, |u 3 ⟩, |u 2 ⟩} (man beachte die veränderte Reihenfolge) darstellt: n11 N = (n31 0
n13 n33 0
0 0 ) n22
Aufgaben | 203
•
Weil schließlich S2 gleich dem Einheitsoperator ist, vertauscht jede 3 × 3-Matrix mit ihm, und es gilt 2
[P, S ] = 0
p11 P = (p21 p31
⇐⇒
p12 p22 p32
p13 p23 ) p33
c) |u 2 ⟩ ist gemeinsamer Eigenvektor von L2z und S. In dem von |u 1 ⟩ und |u 3 ⟩ aufge spannten Unterraum F2 sind die Matrizen L2z und S PF2 L2z PF2 = (
1 0
0 ) 1
PF2 SPF2 = (
0 1
1 ) 0
Die Eigenvektoren der letzten Matrix sind 1 [|u 1 ⟩ + |u 3 ⟩] √2 1 [|u 1 ⟩ − |u 3 ⟩] |q3 ⟩ = √2
|q2 ⟩ =
Damit ist die Basis aus den gemeinsamen Eigenvektoren von L2z und S Vektor |q1 ⟩ = |u 2 ⟩ 1 |q2 ⟩ = [|u 1 ⟩ + |u 3 ⟩] √2 1 |q3 ⟩ = [|u 1 ⟩ − |u 3 ⟩] √2
Eigenwert von L2z
Eigenwert von S
0
1
1
1
1
−1
Aufgrund dieser Tabelle bilden die Operatoren L2z und S einen V. S. K. O. Das ist jedoch für je zwei von ihnen (wenn man sie isoliert betrachtet) nicht der Fall.
III Die Postulate der Quantenmechanik A B B-1 B-2 B-3 B-4 B-5 C C-1 C-2 C-3 C-4 C-5 C-6 D D-1 D-2 E E-1 E-2
Einleitung | 205 Die Postulate | 207 Der Zustand eines Systems | 207 Physikalische Größen | 207 Messung physikalischer Größen | 208 Zeitliche Entwicklung des Systems | 215 Korrespondenzregeln | 215 Physikalische Deutung der Postulate. Observable und ihre Messung | 218 Korrespondenzregeln und Wellenfunktion | 218 Quantisierung physikalischer Größen | 219 Der Messprozess | 220 Erwartungswert einer Observablen | 220 Standardabweichung | 223 Kompatible Observable | 225 Bedeutung der Schrödinger-Gleichung | 230 Allgemeine Eigenschaften | 230 Konservative Systeme | 239 Superpositionsprinzip und Vorhersagen | 246 Wahrscheinlichkeitsamplitude und Interferenzeffekte | 247 Zusammenhang zwischen Zuständen und Messergebnis | 253
A Einleitung In der klassischen Mechanik ist die Bewegung eines beliebigen materiellen Systems bestimmt, wenn man den Ort r(x, y, z) und die Geschwindigkeit v(x,̇ y,̇ z)̇ seiner Punkte in Abhängigkeit von der Zeit t kennt. Allgemein führt man zur Beschrei bung eines derartigen Systems generalisierte Koordinaten q i (t) (i = 1, 2, . . . , N) ein (s. Anhang III), deren zeitliche Ableitungen q̇ i (t) man die generalisierten Ge schwindigkeiten nennt: Die Angabe von q i (t) und q̇ i (t) erlaubt zu jedem Zeitpunkt die Berechnung der Lage und der Geschwindigkeit eines beliebigen Systempunktes. Über die Lagrange-Funktion L(q i , q̇ i , t) definiert man weiter den zu q i konjugierten Impuls p i : pi =
∂L ∂ q̇ i
(A-1)
Man nennt die q i (t) und p i (t) die (fundamentalen) dynamischen Variablen. Sämt liche zu dem System gehörenden physikalischen Größen wie die Energie, der Impuls oder der Drehimpuls werden als Funktionen dieser fundamentalen dynamischen Variablen ausgedrückt. So ist z. B. die Gesamtenergie des Systems durch die Hamil ton-Funktion H(q i , p i , t) gegeben. Die Bewegung des Systems kann man untersu https://doi.org/10.1515/9783110638738-021
206 | III Die Postulate der Quantenmechanik
chen, indem man von den Lagrangeschen Gleichungen oder von den Hamiltonschen Gleichungen dq i ∂H = dt ∂p i dp i ∂H =− dt ∂q i
(A-2a) (A-2b)
ausgeht. Für den speziellen Fall, dass das System nur aus einem Massenpunkt mit der Mas se m besteht, sind die q i einfach die Koordinaten dieses Punktes und die q̇ i die Kom ponenten der Geschwindigkeit v. Kann man die auf dieses Teilchen wirkenden Kräfte über ein skalares Potential V(r, t) beschreiben, so sind die zum Teilchenort r konju gierten Impulse, also die Komponenten des Teilchenimpulses p, gleich den Kompo nenten der Bewegungsgröße mv. Die Gesamtenergie ist dann p2 + V(r, t) 2m und der Drehimpuls in Bezug auf den Koordinatenursprung E=
𝓛=r×p Weil die Hamilton-Funktion H(r, p, t) = chungen die bekannte Form an: dr p = dt m dp = −∇V dt
(A-3)
(A-4) p2 2m
+ V(r, t) ist, nehmen die Hamilton-Glei
(A-5a) (A-5b)
Die klassische Beschreibung eines materiellen Systems kann also in folgender Weise zusammengefasst werden: 1. Der Zustand zu einem festen Zeitpunkt t0 ist durch die Angabe seiner N generali sierten Koordinaten q i (t0 ) und der N konjugierten Impulse p i (t0 ) definiert. 2. Der Wert der verschiedenen physikalischen Größen zu einem Zeitpunkt t0 ist vollständig bestimmt, wenn man den Zustand des Systems zu diesem Zeitpunkt kennt: Ausgehend vom Zustand des Systems kann man mit Sicherheit das Ergeb nis einer beliebigen Messung voraussagen, die zur Zeit t0 ausgeführt wird. 3. Die zeitliche Entwicklung des Systemzustands wird durch die Hamilton-Glei chungen beschrieben. Weil diese Differentialgleichungen erster Ordnung sind, ist ihre Lösung {q i (t), p i (t)} eindeutig bestimmt, wenn man die Werte dieser Funktionen zu einem Zeitpunkt t0 , also {q i (t0 ), p i (t0 )} vorgibt: Kennt man den Anfangszustand des Systems, so ist sein Zustand zu einem beliebigen Zeitpunkt determiniert. Dieses Kapitel behandelt die Postulate, auf denen die quantenmechanische Beschrei bung physikalischer Systeme basiert. Qualitativ und vorläufig haben wir sie in Kapi
B Die Postulate
| 207
tel I eingeführt. Im Rahmen des Formalismus, wie er in Kapitel II skizziert wurde, wer den wir sie jetzt genauer fassen. Mit diesen Postulaten werden (in Korrespondenz zu den eben aufgeführten drei Punkten über die klassische Beschreibung) die folgenden Fragen beantwortet: 1. Wie wird der Zustand eines quantenmechanischen Systems (oder kürzer: Quan tensystems) zu einem bestimmten Zeitpunkt beschrieben? 2. Wie werden für einen gegebenen Zustand die Messergebnisse der verschiedenen Größen vorausgesagt? 3. Wie erhält man den Zustand des Systems zu einem Zeitpunkt t, wenn man ihn zum Zeitpunkt t0 kennt? Wir beginnen im folgenden Abschnitt mit der Angabe der Postulate der Quanten mechanik, analysieren in den darauffolgenden Abschnitten ihren physikalischen Gehalt und diskutieren die Folgerungen.
B Die Postulate B-1 Der Zustand eines Systems In Kapitel I führten wir den Begriff des Quantenzustands eines Teilchens zu einem bestimmten Zeitpunkt ein, und charakterisierten ihn zunächst durch eine quadra tisch integrierbare Wellenfunktion. In Kapitel II ordneten wir dann jeder Wellenfunk tion einen Ket |ψ⟩ aus dem Zustandsraum Hr zu: Die zugehörige Wellenfunktion ψ(r) = ⟨r|ψ⟩ hängt dabei in äquivalenter Weise mit diesem Ket zusammen. Diese Überlegungen verallgemeinern wir nun in der folgenden Aussage: 1. Postulat Der Zustand eines physikalischen Systems zu einem bestimmten Zeitpunkt t0 wird durch die Angabe eines Kets |ψ(t0 )⟩ aus dem Zustandsraum H definiert. Weil H ein (linearer) Vektorraum ist, folgt aus diesem ersten Postulat ein Super positionsprinzip: Die Linearkombination von Zustandsvektoren ergibt wieder einen Zustandsvektor. Wir werden diesen wichtigen Punkt und seinen Zusammenhang mit den anderen Postulaten in § E diskutieren.
B-2 Physikalische Größen In § D-1 von Kap. I verwendeten wir bereits einen Zusammenhang zwischen einem Differentialoperator H und der Gesamtenergie eines Teilchens in einem skalaren Potential. Dies ist nur ein Spezialfall des zweiten Postulats:
208 | III Die Postulate der Quantenmechanik
2. Postulat Jede messbare physikalische Größe A wird durch einen im Zustandsraum H wirken den Operator A beschrieben; dieser Operator ist eine Observable. Bemerkungen: 1. Die Aussage, dass A eine Observable ist (s. Kap. II, § D-2), erweist sich weiter unten (§ B-3) als wesentlich. 2. Im fundamentalen Unterschied zur klassischen Mechanik beschreibt die Quantenmechanik den Zustand eines Systems durch einen Vektor und die zugehörigen physikalischen Größen durch Operatoren.
B-3 Messung physikalischer Größen B-3-a Mögliche Messergebnisse In § D-1 von Kap. I wurde der Zusammenhang zwischen dem Operator H und der Ge samtenergie des Teilchens durch die Forderung hergestellt, dass nur die Eigenwerte von H mögliche Energiewerte sind. Dies wird im dritten Postulat verallgemeinert: 3. Postulat Wird eine physikalische Größe A gemessen, so kann das Resultat nur einer der Eigenwerte der zugehörigen Observablen A sein. Bemerkungen: 1. Weil A hermitesch ist, wird eine Messung von A stets einen reellen Wert liefern. 2. Ist das Spektrum von A diskret, so sind die möglichen Resultate bei der Messung von A quan tisiert (§ C-2).
B-3-b Spektralzerlegung Wir wollen jetzt die Folgerungen aus § A-3 von Kap. I präzisieren und verallgemeinern. Dort hatten wir ein einfaches Experiment an polarisierten Photonen untersucht. Wir betrachten ein System, das zu einem bestimmten Zeitpunkt durch den auf eins normierten Ket |ψ⟩ beschrieben wird: ⟨ψ|ψ⟩ = 1
(B-1)
Wir wollen zu diesem Zeitpunkt eine physikalische Größe A des Systems, zu der die Observable A gehört, messen und hierfür die Ergebnisse voraussagen. Wie wir bereits sahen, wird es sich dabei um eine Wahrscheinlichkeitsaussage handeln. Wir geben die Regeln für die Berechnung der Wahrscheinlichkeit an, mit der ein bestimmter Ei genwert von A als Messergebnis auftreten kann.
209
B Die Postulate |
α Diskretes Spektrum Wir setzen zunächst voraus, dass das Eigenwertspektrum von A diskret ist. Sind sämt liche Eigenwerte a n von A nichtentartet, so gehört zu jedem von ihnen genau ein Eigenvektor |u n ⟩ (bis auf einen Phasenfaktor): A|u n ⟩ = a n |u n ⟩
(B-2)
Weil A eine Observable ist, bildet die Menge der (als normiert vorausgesetzten) |u n ⟩ in H eine Basis, und wir können den Zustandsvektor |ψ⟩ in der Form |ψ⟩ = ∑ c n |u n ⟩
(B-3)
n
schreiben. Man postuliert dann, dass die Wahrscheinlichkeit 𝒫(a n ) dafür, bei der Messung von A den Wert a n zu erhalten, durch 𝒫(a n ) = |c n |2 = |⟨u n |ψ⟩|2
(B-4)
gegeben ist. Dies ist also das vierte Postulat: 4. Postulat (nichtentartetes, diskretes Spektrum) Wird die physikalische Größe A eines Systems im normierten Zustand |ψ⟩ gemes sen, so ist die Wahrscheinlichkeit dafür, dass das Ergebnis den nichtentarteten Eigenwert a n der zugehörigen Observablen A liefert, gleich 𝒫(a n ) = |⟨u n |ψ⟩|2 . Hierbei ist |u n ⟩ der normierte Eigenvektor von A zum Eigenwert a n . Sind jetzt einige Eigenwerte a n entartet, so gehören zu ihnen mehrere orthonormierte Eigenvektoren |u in ⟩: A|u in ⟩ = a n |u in ⟩
i = 1, 2, . . . , g n
(B-5)
Der Ket |ψ⟩ kann dann nach der orthonormierten Basis {|u in ⟩} entwickelt werden: gn
|ψ⟩ = ∑ ∑ c in |u in ⟩
(B-6)
n i=1
In diesem Fall wird die Wahrscheinlichkeit gn
gn
𝒫(a n ) = ∑ |c in |2 = ∑ |⟨u in |ψ⟩|2 i=1
i=1
Danach ist Gl. (B-4) ein Spezialfall von Gl. (B-7).
(B-7)
210 | III Die Postulate der Quantenmechanik
4. Postulat (Fall eines entarteten Spektrums) Wird die physikalische Größe A eines Systems im normierten Zustand |ψ⟩ gemessen, so ist die Wahrscheinlichkeit dafür, dass das Ergebnis den entarteten Eigenwert a n der zugehörigen Observablen A liefert, gleich gn
𝒫(a n ) = ∑ |⟨u in |ψ⟩|2 i=1
Darin ist g n der Entartungsgrad des Eigenwerts a n und {|u in ⟩} (i = 1, 2, . . . , g n ) ein System von orthonormierten Vektoren, die im Eigenraum Hn zum Eigenwert a n von A eine Basis bilden. Damit dieses Postulat physikalisch sinnvoll ist, muss bei einem entarteten Eigen wert a n die Wahrscheinlichkeit 𝒫(a n ) von der Wahl der Basis {|u in ⟩} im Unterraum Hn unabhängig sein. Um dies zu zeigen, betrachten wir den Vektor gn
|ψ n ⟩ = ∑ c in |u in ⟩
(B-8)
i=1
worin die Koeffizienten c in dieselben sind wie die in Gl. (B-6): c in = ⟨u in |ψ⟩
(B-9)
Der Ket |ψ n ⟩ ist der zu Hn gehörende Anteil von |ψ⟩, d. h. die Projektion von |ψ⟩ auf Hn . Setzt man diese Beziehung in Gl. (B-8) ein, so wird gn
|ψ n ⟩ = ∑ |u in ⟩⟨u in |ψ⟩ i=1
= P n |ψ⟩
(B-10)
worin gn
P n = ∑ |u in ⟩⟨u in |
(B-11)
i=1
der Projektor auf Hn ist (s. § B-3-b von Kap. II). Für das Quadrat der Norm von |ψ n ⟩ erhalten wir nach Gl. (B-8) gn
⟨ψ n |ψ n ⟩ = ∑ |c in |2
(B-12)
i=1
Also ist 𝒫(a n ) gleich dem Normquadrat von |ψ n ⟩ = P n |ψ⟩, der Projektion von |ψ⟩ auf Hn . Aus dieser Form ist ersichtlich, dass ein Basiswechsel in Hn den Ausdruck für die Wahrscheinlichkeit 𝒫(a n ) nicht beeinflusst.
B Die Postulate |
211
Für 𝒫(a n ) können wir somit auch 𝒫(a n ) = ⟨ψ|P†n P n |ψ⟩
(B-13)
schreiben oder auch, weil P n hermitesch (P†n = P n ) und ein Projektor (P2n = P n ) ist, 𝒫(a n ) = ⟨ψ|P n |ψ⟩
(B-14)
β Kontinuierliches Spektrum Wir nehmen jetzt an, dass das Spektrum von A kontinuierlich und der Einfachheit halber nichtentartet ist. Das System der im weiteren Sinne orthonormierten Eigenvek toren |v α ⟩ von A, A|v α ⟩ = α|v α ⟩
(B-15)
bildet im Zustandsraum H eine kontinuierliche Basis, nach der wir |ψ⟩ zerlegen können: |ψ⟩ = ∫ dα c(α) |v α ⟩
(B-16)
Weil jetzt die möglichen Ergebnisse bei einer Messung von A ein Kontinuum bilden, müssen wir eine Wahrscheinlichkeitsdichte definieren, genau wie wir es bei der In terpretation der Wellenfunktion eines Teilchens getan haben (s. § B-2 von Kap. I): Die Wahrscheinlichkeit d𝒫(α) dafür, dass ein Wert zwischen α und α + dα erhalten wird, ist durch d𝒫(α) = ρ(α) dα mit ρ(α) = |c(α)|2 = |⟨v α |ψ⟩|2
(B-17)
gegeben. 4. Postulat (kontinuierliches nichtentartetes Spektrum) Wird die physikalische Größe A eines Systems im normierten Zustand |ψ⟩ gemessen, so ist die Wahrscheinlichkeit dafür, dass das Ergebnis einen Wert zwischen α und α + dα liefert: d𝒫(α) = |⟨v α |ψ⟩|2 dα wobei |v α ⟩ der Eigenvektor der zu A gehörenden Observablen A mit dem Eigenwert α ist.
212 | III Die Postulate der Quantenmechanik
Bemerkungen: 1. Man verifiziert explizit, dass in allen hier betrachteten Fällen die Gesamtwahrscheinlichkeit gleich eins ist. Geht man z. B. von Gl. (B-7) aus, so findet man gn
∑ 𝒫(a n ) = ∑ ∑ |c in |2 = ⟨ψ|ψ⟩ = 1 n
(B-18)
n i=1
weil |ψ⟩ normiert ist. Die Normierung von |ψ⟩ ist also für die Konsistenz unserer Überlegungen unverzichtbar, jedoch nicht wesentlich. Ist sie nicht erfüllt, so genügt es, Gl. (B-7) und Gl. (B-17) durch g
𝒫(a n ) =
n 1 ∑ |c in |2 ⟨ψ|ψ⟩ i=1
(B-19)
bzw. ρ(α) =
1 |c(α)|2 ⟨ψ|ψ⟩
(B-20)
zu ersetzen. 2. Damit das vierte Postulat konsistent ist, muss notwendig der Operator A, den man einer phy sikalischen Größe zuordnet, eine Observable sein: Es setzt nämlich voraus, dass jeder Zustands vektor nach den Eigenvektoren von A entwickelt werden kann. 3. Die allgemeinste Form des vierten Postulats haben wir hier nicht angegeben, doch kann man das Prinzip der Spektralzerlegung ohne Schwierigkeit auf jeden anderen möglichen Fall (etwa auf das entartete kontinuierliche Spektrum, auf ein Spektrum, das teils diskret und teils kon tinuierlich ist, usw.) ausdehnen. In § E und später in Kapitel IV werden wir dieses Postulat auf eine Reihe von Beispielen anwenden, um insbesondere bestimmte Implikationen des Superpo sitionsprinzips (s. § B-1) aufzuzeigen.
γ Wichtige Folgerung Es seien |ψ⟩ und |ψ ⟩ zwei Kets, so dass |ψ ⟩ = eiθ |ψ⟩
(B-21)
mit einer reellen Zahl θ gilt. Ist |ψ⟩ normiert, so ist dies auch |ψ ⟩: ⟨ψ |ψ ⟩ = ⟨ψ|e−iθ eiθ |ψ⟩ = ⟨ψ|ψ⟩
(B-22)
Die Wahrscheinlichkeiten, die man bei einer beliebigen Messung voraussagt, sind die selben, ob man nun von |ψ⟩ oder von |ψ ⟩ ausgeht. Für jedes |u in ⟩ gilt nämlich |⟨u in |ψ ⟩|2 = |eiθ ⟨u in |ψ⟩|2 = |⟨u in |ψ⟩|2
(B-23)
Ferner können wir |ψ⟩ auch durch |ψ ⟩ = αeiθ |ψ⟩
(B-24)
ersetzen, ohne dass sich die physikalischen Ergebnisse ändern. In Gl. (B-19) und Gl. (B-20) tritt dann der Faktor |α|2 im Zähler und im Nenner auf, kürzt sich also
B Die Postulate | 213
heraus. Daher repräsentieren zueinander proportionale Vektoren denselben physika lischen Zustand. Es ist wichtig, diese Aussage richtig zu interpretieren. Nehmen wir z. B. an, dass |ψ⟩ = λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩
(B-25)
mit zwei komplexen Zahlen λ1 und λ2 ist. Zwar repräsentiert eiθ1 |ψ1 ⟩ mit beliebi gem reellen θ1 denselben physikalischen Zustand wie |ψ1 ⟩ und eiθ2 |ψ2 ⟩ denselben Zustand wie |ψ2 ⟩. Im Allgemeinen wird aber der Vektor |φ⟩ = λ1 eiθ1 |ψ1 ⟩ + λ2 eiθ2 |ψ2 ⟩
(B-26)
nicht denselben Zustand wie |ψ⟩ beschreiben. Dies wäre nur der Fall, wenn θ1 = θ2 + 2nπ wäre, weil dann |φ⟩ = eiθ1 [λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩] = eiθ1 |ψ⟩
(B-27)
geschrieben werden kann. In § E-1 werden wir sehen, dass die relativen Phasen der Entwicklungskoeffizienten eines Zustandsvektors eine wichtige Rolle spielen. B-3-c Reduktion des Wellenpakets Den Begriff der Reduktion eines Wellenpakets führten wir bereits in Kap. I, § A-3 im Zusammenhang mit der Polarisationsmessung an Photonen ein. Hier wollen wir ihn verallgemeinern, uns dabei aber auf den Fall eines diskreten Spektrums beschränken (das kontinuierliche Spektrum behandeln wir in § E). Wir nehmen an, dass wir zu einem gegebenen Zeitpunkt die physikalische Grö ße A messen wollen. Kennt man den Ket |ψ⟩, der den Zustand des Systems unmit telbar vor der Messung repräsentiert, so erlaubt das vierte Postulat die Vorhersage, mit welcher Wahrscheinlichkeit sich die verschiedenen möglichen Resultate ergeben können. Führt man die Messung jedoch tatsächlich aus, erhält man offensichtlich ge nau ein einziges dieser möglichen Ergebnisse. Unmittelbar nach dieser Messung stellt sich nicht mehr die Frage nach der Wahrscheinlichkeit dieses oder jenes Wertes: Man weiß, dass es der ist, den man effektiv erhalten hat. Man besitzt also eine zusätzliche Information, und es ist einsichtig, dass der Zustand des Systems nach der Messung, der diese Information mit aufnehmen muss, von |ψ⟩ verschieden ist. Betrachten wir zunächst den Fall, bei dem die Messung von A einen einfachen Eigenwert a n von A liefert. Man postuliert dann, dass unmittelbar nach dieser Mes sung der Eigenvektor |u n ⟩ zu a n Zustandsvektor des Systems ist: an
|ψ⟩ ⇒ |u n ⟩
(B-28)
Bemerkungen: 1. Wir sprechen hier von Zuständen „unmittelbar vor“ der Messung (|ψ⟩) und „unmittelbar da nach“ (|u n ⟩). Die genaue Bedeutung dieser Ausdrucksweise ist die folgende: Wir nehmen an, dass die Messung zur Zeit t0 > 0 stattfindet und dass wir den Zustand |ψ(0)⟩ des Systems zur
214 | III Die Postulate der Quantenmechanik
Zeit t = 0 kennen. Das sechste Postulat, s. § B-4, gibt an, wie sich das System zeitlich entwi ckelt, d. h. es erlaubt, ausgehend von |ψ(0)⟩, die Berechnung des Zustands |ψ(t0 )⟩ „unmittelbar vor“ der Messung. Ist das Messergebnis der nichtentartete Eigenwert a n , so muss der Zustand |ψ (t1 )⟩ für einen Zeitpunkt t1 > t0 berechnet werden, indem man von |ψ (t0 )⟩ = |u n ⟩, dem Zustand „unmittelbar nach“ der Messung, ausgeht und mit Hilfe des sechsten Postulats die Ent wicklung des Zustandsvektors zwischen den Zeiten t0 und t1 bestimmt, s. Abb. 1. 2. Führt man sofort nach der ersten Messung von A eine zweite aus (bevor also das System Zeit hatte, sich zu ändern), so wird man mit Sicherheit dasselbe Resultat a n erhalten, weil der Zustand des Systems unmittelbar vor der zweiten Messung |u n ⟩ und nicht mehr |ψ⟩ ist.
Abb. 1: Bei einer Messung der Observablen A zum Zeitpunkt t 0 mit dem Resultat a n erfährt der Zu standsvektor des Systems eine plötzliche Änderung und wird gleich |u n ⟩. Das System entwickelt sich dann aus diesem neuen Anfangszustand weiter.
Ist der bei der Messung erhaltene Eigenwert a n entartet, so wird das Postulat (B-28) in folgender Weise verallgemeinert. Unmittelbar vor der Messung lautet die Entwicklung des Zustands |ψ⟩ (nach den Basisvektoren) gn
|ψ⟩ = ∑ ∑ c in |u in ⟩
(B-29)
n i=1
Durch die Messung ändert sich der Zustandsvektor gemäß 1
an
|ψ⟩ ⇒
gn
√ ∑ |c in |2
gn
∑ c in |u in ⟩
(B-30)
i=1
i=1 g
n Der Vektor ∑i=1 c in |u in ⟩ ist die Projektion von |ψ⟩ auf den zu a n gehörenden Eigenraum, s. Gl. (B-8). In Gl. (B-30) haben wir diesen Vektor normiert, weil der Umgang mit auf eins normierten Zustandsvektoren bequemer ist. Mit den Bezeichnungen aus (B-10) und (B-11) kann man (B-30) dann auch in der Form
an
|ψ⟩ ⇒ schreiben.
P n |ψ⟩ √⟨ψ|P n |ψ⟩
(B-31)
B Die Postulate
| 215
5. Postulat Ergibt die Messung der physikalischen Größe A am System im Zustand |ψ⟩ den Wert a n , so ist der Zustand des Systems unmittelbar nach der Messung gleich der P n |ψ⟩ auf eins normierten Projektion √⟨ψ|P von |ψ⟩ auf den zu a n gehörenden Eigen n |ψ⟩ raum. Sofort nach der Messung ist der Zustand des Systems also immer ein Eigenvektor von A zum Eigenwert a n . Dabei spielt es keine Rolle, welcher Ket aus dem Unterraum Hn dies ist, sondern nur, dass es der (aus Zweckmäßigkeit passend normierte) Teil von |ψ⟩ ist, der zu diesem Eigenraum Hn gehört. Unter dem Gesichtspunkt der Spektralzerlegung erscheint Gl. (B-28) als ein Sonderfall der Beziehung (B-30). Setzen wir nämlich g n = 1, so entfällt die Summation über i, und wir erhalten 1 c n |u n ⟩ = ei arg c n |u n ⟩ |c n |
(B-32)
Dieser Ket beschreibt aber denselben physikalischen Zustand wie der Ket |u n ⟩.
B-4 Zeitliche Entwicklung des Systems Bereits in Kap. I, § B-2 stellten wir die Schrödinger-Gleichung für ein Teilchen vor. Die allgemeine Bewegungsgleichung für ein physikalisches System wird im sechsten Pos tulat formuliert: 6. Postulat Die zeitliche Entwicklung des Zustandsvektors |ψ(t)⟩ wird bestimmt durch die Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = H(t)|ψ(t)⟩ dt
Darin ist H(t) die der Gesamtenergie des Systems zugeordnete Observable. Man nennt H den Hamilton-Operator des Systems, weil man ihn aus der klassischen Hamilton-Funktion erhält, s. Anhang II und den folgenden Abschnitt.
B-5 Korrespondenzregeln In einem letzten Postulat wollen wir angeben, wie man den Operator A für eine phy sikalische Größe A aufstellt, wenn diese in der klassischen Mechanik bereits definiert ist.
216 | III Die Postulate der Quantenmechanik
B-5-a Grundsätzliches Zunächst betrachten wir ein Teilchen ohne Spin, das sich in einem skalaren Potential befindet. Man verfährt dann nach folgender Korrespondenzregel: Dem Ort r(x, y, z) des Teilchens wird die Ortsobservable R(X, Y, Z) zugeordnet und seinem Impuls p(p x , p y , p z ) die Impulsobservable P(P x , P y , P z ). Dabei ist dann stets zu berücksichtigen [s. Kap. II, Gl. (E-31)], dass R und P den kano nischen Vertauschungrelationen genügen: [R i , R j ] = [P i , P j ] = 0 [R i , P j ] = iℏ δ ij
(B-33)
Eine beliebige physikalische Größe A dieses Teilchens ist stets eine Funktion der fundamentalen dynamischen Variablen r und p: A(r, p, t). Um nun die zugehörige Observable A zu erhalten, ersetzt man in dem Ausdruck A(r, p, t) die klassischen Va riablen r und p durch die Observablen R und P¹: A(t) = A(R, P, t)
(B-34)
Dieses Vorgehen ist jedoch im Allgemeinen nicht eindeutig. Nehmen wir z. B. an, dass in A(r, p, t) ein Term der Form r ⋅ p = xp x + yp y + zp z
(B-35)
auftritt. In der klassischen Mechanik ist das Skalarprodukt kommutativ, und man kann dafür auch p ⋅ r = px x + py y + pz z
(B-36)
schreiben. Ersetzt man nun aber r und p durch die zugehörigen Observablen R und P, so sind die sich aus Gl. (B-35) und Gl. (B-36) ergebenden Operatoren wegen der Ver tauschungsrelationen (B-33) nicht gleich: R ⋅ P ≠ P ⋅ R
(B-37)
Weiter sind weder R ⋅ P noch P ⋅ R hermitesch, denn es ist z. B. (R ⋅ P)† = (XP x + YP y + ZP z )† = P ⋅ R
(B-38)
Daher fügt man zu den Korrespondenzregeln eine Symmetrisierungsregel hinzu. Da nach gehört z. B. zu dem Term r ⋅ p die Observable 1 (R ⋅ P + P ⋅ R) 2 1 In Ergänzung BII wurde der Begriff einer Operatorfunktion definiert.
(B-39)
B Die Postulate | 217
die natürlich hermitesch ist. Entsprechend verfährt man bei verwickelteren Ausdrü cken. Die Observable A, die eine klassische physikalische Größe A beschreibt, erhält man, indem man in dem geeignet symmetrisierten Ausdruck für A die klassischen dyna mischen Variablen r und p durch die Observablen R bzw. P ersetzt. g Nun gibt es aber quantenmechanische Größen (wie z. B. den Spin eines Teilchens), die kein klassisches Äquivalent besitzen. Diese müssen dann direkt durch die zugehöri gen Observablen beschrieben werden. Bemerkung: Die hier angeführten Regeln, insbesondere die Vertauschungsregeln (B-33), gelten nur für karte sische Koordinaten. Man könnte sie auch verallgemeinern, so dass sie auch für andere Bezugs systeme gültig wären, sie haben dann aber nicht mehr diese einfache Form. Außerdem werden wir im Folgenden immer voraussetzen, dass wir es mit einem Inertialsystem zu tun haben.
B-5-b Wichtige Beispiele α Hamilton-Operator für ein Teilchen in einem skalaren Potential Wir betrachten ein Teilchen (ohne Spin) mit der Masse m und der elektrischen La dung q, das sich in einem elektrostatischen Feld mit dem skalaren Potential U(r) be findet. Die potentielle Energie des Teilchens ist dann V(r) = qU(r), und die zugehörige Hamilton-Funktion lautet [s. Anhang III, Gl. (29)] H(r, p) =
p2 + V(r) 2m
(B-40)
mit p=m
dr = mv dt
(B-41)
Darin bedeutet v die Geschwindigkeit des Teilchens. Es bereitet keine Schwierigkeiten, hierzu den Hamilton-Operator H aufzustellen. Eine Symmetrisierung ist nicht erforderlich, weil weder bei P2 = P2x + P2y + P2z noch bei V(R) Produkte von nichtvertauschenden Operatoren auftreten. Wir haben daher H=
P2 + V(R) 2m
(B-42)
Darin ist V(R) der Operator, den man bei der Ersetzung von r in V(r) erhält. Für diesen speziellen Fall lautet daher die Schrödinger-Gleichung iℏ
d P2 |ψ(t)⟩ = [ + V(R)] |ψ(t)⟩ dt 2m
(B-43)
218 | III Die Postulate der Quantenmechanik β Hamilton-Operator eines Teilchens in einem Vektorpotential Durchquert das Teilchen ein beliebiges elektromagnetisches Feld, so ist der Ausdruck für die klassische Hamilton-Funktion [s. Anhang III, Gl. (66)] 1 H(r, p) = (B-44) [p − qA(r, t)]2 + qU(r, t) 2m Darin ist U(r, t) das skalare und A(r, t) das Vektorpotential, mit denen man das elek tromagnetische Feld beschreibt, während p gegeben ist durch p=m
dr + qA(r, t) = mv + qA(r, t) dt
(B-45)
Hier kann man wieder ohne Schwierigkeiten den quantenmechanischen Operator A(R, t) angeben, weil die klassische Funktion A(r, t) nur von r und der Zeit t, aber nicht von p abhängt. Für den Hamilton-Operator erhalten wir somit 1 [P − qA(R, t)]2 + V(R, t) (B-46) H(t) = 2m mit V(R, t) = qU(R, t)
(B-47)
Die Schrödinger-Gleichung lautet jetzt iℏ
1 d |ψ(t)⟩ = { [P − qA(R, t)] 2 + V(R, t)} |ψ(t)⟩ dt 2m
(B-48)
Bemerkung: Wir müssen darauf achten, dass wir den (zu r konjugierten) Impuls p des Teilchens nicht mit der Bewegungsgröße mv verwechseln. Der Unterschied zwischen diesen beiden Größen ergibt sich aus Gl. (B-45). In der Quantenmechanik ist der zur Teilchengeschwindigkeit gehörende Operator durch 1 V = (P − qA) (B-49) m gegeben und somit der Hamilton-Operator durch 1 (B-50) mV 2 + V(R, t) 2 Die Summanden auf der rechten Seite entsprechen gerade der kinetischen bzw. der potentiellen Energie des Teilchens. Wir halten jedoch fest: Nicht die Bewegungsgröße mv, sondern der Impuls p wird zum Operator P, und dieser genügt den Vertauschungsrelationen (B-33). H(t) =
C Physikalische Deutung der Postulate. Observable und ihre Messung C-1 Korrespondenzregeln und Wellenfunktion Es liegt nahe, die in § E von Kap. II eingeführten Observablen R und P dem Ort und dem Impuls eines Teilchens zuzuordnen. Zunächst besitzt jede der Observablen X, Y, Z
C Physikalische Deutung der Postulate. Observable und ihre Messung
| 219
und P x , P y , P z ein kontinuierliches Spektrum, und die Erfahrung zeigt, dass für die sechs Orts-und Impulsvariablen jeder reelle Zahlenwert möglich ist. Vor allem aber ge langt man bei Anwendung des vierten Postulats auf diese Observablen wieder zu der Wahrscheinlichkeitsdeutung der Wellenfunktion und ihrer Fourier-Transformierten (s. § B-2 und § C-3 von Kap. I). Der Einfachheit halber beschränken wir uns auf den eindimensionalen Fall. Be findet sich das Teilchen im normierten Zustand |ψ⟩, so ist die Wahrscheinlichkeit da für, dass man bei einer Ortsmessung einen Wert zwischen x und x + dx erhält, nach Gl. (B-17) gleich d𝒫(x) = |⟨x|ψ⟩|2 dx
(C-1)
Darin ist |x⟩ der Eigenket von X zum Eigenwert x. Wir finden also wieder, dass das Betragsquadrat der Wellenfunktion ψ(x) = ⟨x|ψ⟩ die Wahrscheinlichkeitsdichte für den Aufenthalt des Teilchens in dem betreffenden Intervall ist. Andererseits gehört zum Eigenvektor |p⟩ der Observablen P die ebene Welle ⟨x|p⟩ =
1 √2πℏ
e
ipx ℏ
(C-2)
und wir sahen in § C-3 von Kap. I, dass die Einstein-de-Broglie-Beziehungen dieser Welle einen wohlbestimmten Impulswert p zuweisen. Darüber hinaus ist die Wahr scheinlichkeit, bei einem Teilchen im Zustand |ψ⟩ einen Impuls zwischen p und p+dp zu messen, durch d𝒫(p) = |⟨p|ψ⟩|2 dp = |ψ(p)|2 dp
(C-3)
gegeben. Genau dies wurde auch in § C-3 von Kap. I festgestellt.
C-2 Quantisierung physikalischer Größen Das dritte Postulat ermöglicht eine Erklärung der Beobachtung, dass bestimmte physi kalische Größen wie z. B. die Energie von Atomen quantisiert sind. Es impliziert dage gen nicht, dass alle Größen quantisiert sind, denn es gibt auch Observable mit konti nuierlichem Eigenwertspektrum. Die auf diesem Postulat basierenden physikalischen Vorhersagen sind daher nicht ohne Weiteres einsichtig. Wenn wir z. B. in Kapitel VII das Wasserstoffatom untersuchen, so gehen wir von der Gesamtenergie des Elektrons im Coulomb-Potential des Protons aus und leiten daraus den Hamilton-Operator ab. Lösen wir dann seine Eigenwertgleichung, so finden wir, dass die gebundenen Zustän de dieses Systems nur zu bestimmten diskreten Energiewerten gehören. Damit erklä ren wir nicht nur die Tatsache der Quantisierung der Wasserstoffniveaus, sondern wir berechnen zugleich die bei einer Messung möglichen Energiewerte. Festzuhalten ist in diesem Zusammenhang, dass wir bei unseren quantenmechanischen Überlegun gen dieselbe (Coulomb-)Wechselwirkung zugrunde legen wie in der klassischen Me chanik.
220 | III Die Postulate der Quantenmechanik
C-3 Der Messprozess Das vierte und fünfte Postulat führen zu einer Reihe von grundsätzlichen Problemen, auf die wir an dieser Stelle nicht näher eingehen können. Hierzu gehört vor allem ein Verständnis der „fundamentalen“ Störung, die bei der Beobachtung eines Quanten systems zwingend auftritt (s. § A-2 und § A-3 von Kap. I). Diese Probleme haben ihre Ursache darin, dass wir das System unabhängig von der Messapparatur behandeln, obwohl deren Wechselwirkung mit dem untersuchten System während des Beobach tungsvorgangs wesentlich ist. Man müsste daher das aus System und Apparatur be stehende Gesamtsystem betrachten, was aber zu schwierigen Fragen hinsichtlich der Details beim Messprozess führt. Wir begnügen uns mit dem Hinweis, dass die nichtdeterministische Formulierung des vierten und fünften Postulats mit diesen Fragen verbunden ist. So drückt z. B. die während der Messung erfolgende plötzliche Änderung eines Zustandsvektors in einen anderen die eben angesprochene fundamentale Störung aus. Es ist jedoch unmöglich vorherzusagen, was diese Störung sein wird, weil sie vom Messergebnis abhängig ist, dieses aber vorher nicht mit Sicherheit bekannt ist (falls dies dagegen der Fall sein sollte, so ist die Wahrscheinlichkeit gleich eins und die Messung ändert den Zustand des Systems nicht). Weiterhin wollen wir hier nur Idealmessungen betrachten. Zum Verständnis die ses Begriffs erinnern wir an das in § A-3 von Kap. I skizzierte Experiment mit polarisier ten Photonen. Wenn wir voraussetzen, dass der Analysator für alle in einer bestimm ten Richtung polarisierten Photonen durchlässig ist, so ist klar, dass wir ihn dabei als vollkommen ansehen. Praktisch wird er jedoch einige dieser Photonen absorbieren und sie nicht passieren lassen. Wir nehmen daher im Folgenden allgemein an, dass die bei einer Messung verwendeten Apparate vollkommen sind: Die von ihnen verur sachte Störung geht dann allein auf den quantenmechanischen Vorgang während der Messung zurück. Selbstverständlich weisen alle realen Messinstrumente Unvollkom menheiten auf, die die Messung beeinflussen. Man darf aber wenigstens prinzipiell annehmen, dass man sie beliebig verringern kann und sich so der idealen Grenze nä hert, wie sie von den Postulaten vorausgesetzt wird.
C-4 Erwartungswert einer Observablen Die vom vierten Postulat gelieferten Vorhersagen sind Wahrscheinlichkeitsaussagen. Um sie zu verifizieren, muss man eine große Anzahl von Messungen unter identischen Bedingungen ausführen, d. h. man muss dieselbe Größe an einer großen Zahl von Sys temen messen, die sich alle im selben Quantenzustand befinden. Sind diese Vorhersa gen richtig, muss bei insgesamt N identischen Versuchen der Anteil von ihnen, der ein bestimmtes Ergebnis liefert, für N → ∞ gegen die von der Theorie für dieses Ergeb nis behauptete Wahrscheinlichkeit 𝒫 streben. Eine derartige Verifizierung ist somit
C Physikalische Deutung der Postulate. Observable und ihre Messung
| 221
nur für den Grenzfall N → ∞ möglich. In der Praxis ist natürlich N stets endlich. Darum benötigt man zur Interpretation der Resultate Hilfsmittel aus der Statistik. Der Mittelwert oder Erwartungswert der Observablen² A im Zustand |ψ⟩ ist definiert als der Mittelwert der Ergebnisse, die man erhält, wenn man eine große Anzahl von N Mes sungen dieser Größe an Systemen, die sich alle im Zustand |ψ⟩ befinden, ausführt. Wir bezeichnen ihn mit ⟨A⟩ψ oder einfach mit ⟨A⟩. Bei gegebenem |ψ⟩ kennt man die Wahrscheinlichkeiten für das Auftreten aller möglichen Resultate. Man kann daher den Mittelwert ⟨A⟩ψ voraussagen. Wir werden zeigen, dass ⟨A⟩ψ bei normiertem |ψ⟩ durch die Beziehung ⟨A⟩ψ = ⟨ψ|A|ψ⟩
(C-4)
gegeben ist. Wir nehmen zunächst den Fall eines diskreten Spektrums. Bei N Messungen von A (das System ist dabei jedesmal im Zustand |ψ⟩) erhalten wir N (a n )-mal den Eigen wert a n mit lim
N→∞
N (a n ) = 𝒫(a n ) N
(C-5)
und ∑ N (a n ) = N
(C-6)
n
Der Mittelwert der Ergebnisse dieser N Versuche ist die durch N dividierte Summe der gefundenen Werte (wenn N Versuche dasselbe Ergebnis liefern, so treten diese Wer te N -mal in dieser Summe auf), also gleich 1 ∑ a n N (a n ) N n
(C-7)
Mit Gl. (C-5) erkennt man, dass dieser Mittelwert für N → ∞ gegen ⟨A⟩ψ = ∑ a n 𝒫(a n )
(C-8)
n
strebt. Wir setzen nun in diese Beziehung den in (B-7) gegebenen Ausdruck für 𝒫(a n ) ein: gn
⟨A⟩ψ = ∑ a n ∑ ⟨ψ|u in ⟩⟨u in |ψ⟩ n
(C-9)
i=1
Wegen A|u in ⟩ = a n |u in ⟩
(C-10)
2 Von jetzt an werden wir für eine physikalische Größe und den ihr zugeordneten Operator dasselbe Wort „Observable“ verwenden.
222 | III Die Postulate der Quantenmechanik
kann man Gl. (C-9) auch auf die Form gn
⟨A⟩ψ = ∑ ∑ ⟨ψ|A|u in ⟩⟨u in |ψ⟩ n i=1 gn
= ⟨ψ|A [∑ ∑ |u in ⟩⟨u in |] |ψ⟩
(C-11)
n i=1
bringen. Die {|u in ⟩} bilden aber im Zustandsraum H eine Basis, der Ausdruck in der eckigen Klammer ist daher gleich dem Einheitsoperator, und wir erhalten die Gl. (C-4). Für den Fall eines kontinuierlichen Spektrums (der Einfachheit wegen setzen wir noch voraus, dass es nichtentartet ist) ist die Überlegung völlig analog. Wir betrach ten N identische Experimente und nennen dN (α) die Anzahl der Versuche, die ein Ergebnis zwischen α und α + dα ergeben. Wir haben dann lim
N→∞
dN (α) = d𝒫(α) N
Der Mittelwert der gefundenen Resultate ist jetzt N → ∞ gegen
(C-12) 1 N
∫ α dN (α), und dieser geht für
⟨A⟩ψ = ∫ α d𝒫(α)
(C-13)
Setzen wir in diese Gleichung den mit Gl. (B-17) gegebenen Ausdruck für d𝒫(α) ein, so wird ⟨A⟩ψ = ∫ α ⟨ψ|v α ⟩⟨v α |ψ⟩ dα
(C-14)
Berücksichtigt man die Gleichung A|v α ⟩ = α|v α ⟩ ,
(C-15)
so kann man Gl. (C-14) auch in der Form ⟨A⟩ψ = ∫⟨ψ|A|v α ⟩⟨v α |ψ⟩ dα = ⟨ψ|A [∫ dα|v α ⟩⟨v α |] |ψ⟩
(C-16)
schreiben. Weil die Zustände |v α ⟩ der Vollständigkeitsrelation genügen, ergibt sich wiederum die Gl. (C-4). Bemerkungen: 1. Man darf ⟨A⟩ψ als den Mittelwert einer Menge identischer Messungen nicht mit dem zeitli chen Mittelwert verwechseln, der manchmal im Zusammenhang mit zeitabhängigen Vorgängen gebraucht wird. 2. Ist der Ket |ψ⟩, der den Zustand des Systems repräsentiert, nicht normiert, so muss man die Gl. (C-4) durch ⟨A⟩ψ = ersetzen.
⟨ψ|A|ψ⟩ ⟨ψ|ψ⟩
(C-17)
C Physikalische Deutung der Postulate. Observable und ihre Messung |
223
3. In der Praxis berechnet man ⟨A⟩ψ in einer bestimmten Darstellung. So ist z. B. aufgrund der Definition des Operators X [s. die Gleichungen (E-22) aus Kap. II] ⟨X⟩ψ = ⟨ψ|X|ψ⟩ = ∫ d3 r⟨ψ|r⟩⟨r|X|ψ⟩ = ∫ d3 r ψ∗ (r)xψ(r)
(C-18)
Entsprechend finden wir ⟨P x ⟩ψ = ⟨ψ|P x |ψ⟩ ∗
= ∫ d3 p ψ (p)p x ψ(p)
(C-19)
oder auch, wenn man zur Ortsdarstellung wechselt, ⟨P x ⟩ψ = ∫ d3 r ⟨ψ|r⟩⟨r|P x |ψ⟩ = ∫ d3 r ψ∗ (r) [
ℏ ∂ ψ(r)] i ∂x
(C-20)
weil jetzt P durch ℏi ∇ repräsentiert wird, s. Gl. (E-27) von Kap. II.
C-5 Standardabweichung Der Erwartungswert ⟨A⟩ zeigt die Größenordnung der Werte der Observablen A im Zu stand |ψ⟩ an. Dagegen liefert dieser Mittelwert keine Aussage über die Streuung der bei einer Messung von A zu erwartenden Ergebnisse. Nehmen wir z. B. für A ein kontinu ierliches Eigenwertspektrum an, und die Wahrscheinlichkeitsdichte ρ(α) = |⟨v α |ψ⟩|2 habe in einem bestimmten Zustand |ψ⟩ den in Abb. 2 skizzierten Verlauf. Dann liegen die Werte, die man bei einer Messung von A in diesem Zustand |ψ⟩ erhält, praktisch in einem Intervall der Breite δA um ⟨A⟩, wobei δA die Breite der Kurve ρ(α) charakte risiert: Je kleiner δA ist, umso mehr sind die Messergebnisse um den Erwartungswert ⟨A⟩ konzentriert.
Abb. 2: Die Wahrscheinlichkeitsdichte ρ(α) in Abhän gigkeit von α. Der Erwartungswert ⟨A⟩ ist die Abszisse des Schwerpunkts der unter der Kurve liegenden Flä che. Sie fällt nicht notwendig mit der Abszisse des Kurvenmaximums zusammen.
Wie kann man nun allgemein eine Zahl definieren, die der Streuung der Messergebnis se um den Erwartungswert ⟨A⟩ Rechnung trägt? Zunächst könnte man etwa so überle gen: Für jede einzelne Messung bildet man die Differenz aus dem Messwert und dem
224 | III Die Postulate der Quantenmechanik
Erwartungswert, berechnet dann den Mittelwert dieser Abweichungen, indem man ihre Summe durch die Anzahl N der Versuche dividiert. Wegen ⟨A − ⟨A⟩⟩ = ⟨A⟩ − ⟨A⟩ = 0
(C-21)
erkennt man jedoch sofort, dass wir stets das Ergebnis null erhalten würden. Es liegt an der Definition von ⟨A⟩, dass sich im Mittel die negativen mit den positiven Abwei chungen kompensieren. Dagegen ist der Mittelwert der Quadrate der Abweichungen immer größer oder gleich null. Darum definiert man die Standardabweichung über die Beziehung (∆A)2 = ⟨(A − ⟨A⟩)2 ⟩
(C-22)
Es ist also ∆A = √⟨(A − ⟨A⟩)2 ⟩
(C-23)
und mit Gl. (C-4) ergibt sich ∆A = √⟨ψ|(A − ⟨A⟩)2 |ψ⟩
(C-24)
Diese Beziehung kann man auch in etwas anderer Form schreiben. Man hat nämlich ⟨(A − ⟨A⟩)2 ⟩ = ⟨(A2 − 2⟨A⟩A + ⟨A⟩2 )⟩ = ⟨A2 ⟩ − 2⟨A⟩2 + ⟨A⟩2 = ⟨A2 ⟩ − ⟨A⟩2
(C-25)
und darum für die Standardabweichung ∆A = √⟨A2 ⟩ − ⟨A⟩2
(C-26)
Für den Fall des kontinuierlichen Spektrums z. B. ist ∆A durch +∞
(∆A) = ∫ [α − ⟨A⟩]2 ρ(α) dα 2
−∞ +∞
+∞
= ∫ α ρ(α) dα − [ ∫ αρ(α) dα ] −∞ [−∞ ] 2
2
(C-27)
gegeben. Wendet man Gl. (C-23) auf die Observablen R und P an, so kann man zeigen (s. Er gänzung CIII ), dass unter Berücksichtigung der Vertauschungsrelationen für einen be liebigen Zustand |ψ⟩ gilt ∆X ⋅ ∆P x ≥ ℏ/2 ∆Y ⋅ ∆P y ≥ ℏ/2 ∆Z ⋅ ∆P z ≥ ℏ/2
(C-28)
C Physikalische Deutung der Postulate. Observable und ihre Messung |
225
Wir erhalten somit wieder die Heisenbergschen Unschärferelationen, allerdings mit einer genaueren unteren Schranke. Dies rührt davon her, dass wir die Unschärfe mit der Standardabweichung der betreffenden Observablen identifizieren.
C-6 Kompatible Observable C-6-a Kompatibilität und Vertauschbarkeit Wir betrachten zwei Observable A und B, die miteinander vertauschen: [A, B] = 0
(C-29)
und nehmen zur Vereinfachung an, dass ihre Eigenwertspektren diskret sind. Nach dem in Kap. II, § D-3-a bewiesenen Satz existiert im Zustandsraum eine Basis aus ge meinsamen Eigenvektoren von A und B, die wir mit |a n , b p , i⟩ kennzeichnen wollen: A|a n , b p , i⟩ = a n |a n , b p , i⟩ B|a n , b p , i⟩ = b p |a n , b p , i⟩
(C-30)
(mit dem Index i unterscheiden wir gegebenenfalls die verschiedenen, zum selben Ei genwertpaar gehörenden Vektoren). Für irgendzwei a n , b p aus dem jeweiligen Eigen wertspektrum existiert somit wenigstens ein Zustand |a n , b p , i⟩, bei dem eine Mes sung von A mit Sicherheit den Wert a n und eine Messung von B mit Sicherheit den Wert b p liefert. Die Observablen können daher gleichzeitig vollständig bestimmt wer den. Man sagt, sie seien kompatibel. Ist dagegen der Kommutator von A und B un gleich null, so kann ein Zustand im Allgemeinen³ nicht gleichzeitig Eigenvektor dieser beiden Observablen sein. Sie sind dann nicht kompatibel. Wir untersuchen die Messung von zwei kompatiblen Observablen etwas genauer. Zu Beginn möge sich das System in einem beliebigen (normierten) Zustand |ψ⟩ befin den. Diesen können wir stets in der Form |ψ⟩ = ∑ c n,p,i |a n , b p , i⟩
(C-31)
n,p,i
schreiben. Wir nehmen an, dass wir zuerst A und kurz darauf (bevor sich das Sys tem weiter entwickeln konnte) B messen. Wir berechnen die Wahrscheinlichkeit 𝒫(a n , b p ) dafür, bei der ersten Messung den Wert a n zu erhalten und bei der zweiten Messung den Wert b p . Die Observable A wird im Zustand |ψ⟩ gemessen. Daher ist die Wahrscheinlichkeit, den Wert a n zu erhalten, gleich 𝒫(a n ) = ∑ |c n,p,i |2
(C-32)
p,i
3 Auch hier können bestimmte Kets gleichzeitig Eigenvektoren von A und von B sein, doch reichen diese Vektoren nicht aus, um im Gegensatz zum Fall kommutierender Observabler im Zustandsraum eine Basis zu bilden.
226 | III Die Postulate der Quantenmechanik
Misst man darauf die zweite Observable B, so befindet sich das System nicht mehr im Zustand |ψ⟩, sondern – wenn man den Wert a n gemessen hat – im Zustand |ψn ⟩ =
1 2 √∑ |c n,p,i |
∑ c n,p,i |a n , b p , i⟩
(C-33)
p,i
p,i
Damit ist die Wahrscheinlichkeit, den Wert b p zu messen, wenn man weiß, dass sich bei der ersten Messung von A der Wert a n ergeben hat, gleich 𝒫a n (b p ) =
1 ∑ |c n,p,i |2
∑ |c n,p,i |2
(C-34)
i
p,i
Die gesuchte Wahrscheinlichkeit 𝒫(a n , b p ) gehört nun zu einem „zusammengesetz ten Ereignis“: Damit ein günstiger Fall vorliegt, muss man zunächst a n finden und dann, wenn diese erste Bedingung erfüllt ist, den Wert b p . Also ist 𝒫(a n , b p ) = 𝒫(a n ) × 𝒫a n (b p )
(C-35)
Setzen wir in diese Gleichung die Ausdrücke (C-32) und (C-34) ein, so wird 𝒫(a n , b p ) = ∑ |c n,p,i |2
(C-36)
i
Weiter ist das System unmittelbar nach der zweiten Messung im Zustand 1
|ψn,p ⟩ =
2 √∑ |c n,p,i |
∑ c n,p,i |a n , b p , i⟩
(C-37)
i
i
Wenn man daher aufs neue entweder A oder B messen will, so steht das Ergebnis fest: Wir erhalten den Wert a n , wenn wir A bzw. den Wert b p , falls wir B messen: Der Ket |ψn,p ⟩ ist gemeinsamer Eigenvektor der beiden Observablen zu den Eigenwerten a n bzw. b p . Nehmen wir jetzt wieder das System im Zustand |ψ⟩ und messen die beiden Ob servablen in umgekehrter Reihenfolge, also zuerst B und danach A. Wie groß ist dann die Wahrscheinlichkeit 𝒫(b p , a n ), zu denselben Ergebnissen wie eben zu kommen? Die Überlegung ist die gleiche. Man hat hier 𝒫(b p , a n ) = 𝒫(b p ) × 𝒫b p (a n )
(C-38)
Ausgehend von Gl. (C-31) sehen wir, dass 𝒫(b p ) = ∑ |c n,p,i |2 n,i
(C-39)
227
C Physikalische Deutung der Postulate. Observable und ihre Messung |
und der Zustand, nachdem eine Messung von B den Wert b p ergeben hat, gleich |φp ⟩ =
1
∑ c n,p,i |a n , b p , i⟩
2 √∑ |c n,p,i |
(C-40)
n,i
n,i
ist. Folglich gilt 𝒫b p (a n ) =
1 ∑ |c n,p,i |2
∑ |c n,p,i |2
(C-41)
i
n,i
und schließlich 𝒫(b p , a n ) = ∑ |c n,p,i |2
(C-42)
i
Misst man also zuerst den Wert b p und dann den Wert a n , so ist das System in den Zustand 1
|φp,n ⟩ =
∑ c n,p,i |a n , b p , i⟩
√∑ |c n,p,i
|2
(C-43)
i
i
gelangt. Sind darum zwei Observable kompatibel, so sind die physikalischen Voraussagen unabhängig von der Reihenfolge, mit der man die beiden Größen misst (vorausgesetzt, dass das Zeitintervall zwischen den beiden Messungen genügend klein ist). Die Wahr scheinlichkeiten, erst a n und dann b p , oder erst b p und dann a n zu erhalten, sind identisch: 𝒫(a n , b p ) = 𝒫(b p , a n ) = ∑ |c n,p,i |2 = ∑ |⟨a n , b p , i|ψ⟩|2 i
(C-44)
i
Ferner ist in beiden Fällen der Zustand des Systems unmittelbar nach den Messungen (wenn sie für A den Wert a n und für B den Wert b p ergeben haben) 1
|ψn,p ⟩ = |φn,p ⟩ =
2 √∑ |c n,p,i |
∑ c n,p,i |a n , b p , i⟩
(C-45)
i
i
Erneute Messungen von A und B liefern mit Sicherheit dieselben Werte. Wir gelangen somit zu folgender Aussage: Sind zwei Observable A und B kompati bel, so gehen durch die Messungen von B die Informationen, die bei der Messung von A erlangt wurden, nicht verloren (und umgekehrt), sie werden dagegen vervollstän digt. Ferner kommt es auf die Reihenfolge der Messungen von A und B nicht an. Dieser Punkt erlaubt übrigens die gleichzeitige Messung dieser beiden Observablen. Wie man sich anhand der Gleichungen (C-44) und (C-45) überzeugt, können das vierte und das
228 | III Die Postulate der Quantenmechanik
fünfte Postulat auf derartige Simultanmessungen verallgemeinert werden: Zum Mess ergebnis {a n , b p } gehören die orthonormierten Eigenvektoren |a n , b p , i⟩. Geht man von ihnen aus, so erscheinen Gl. (C-44) und Gl. (C-45) als Anwendungen der Postu late (B-7) und (B-30). Die vorstehenden Überlegungen gelten nicht mehr, wenn die Observablen A und B nicht vertauschen. Der Einfachheit halber machen wir uns dies an einem Bild klar. Wir ersetzen den Zustandsraum H durch den zweidimensionalen reellen Vektorraum. Die Vektoren |u 1 ⟩ und |u 2 ⟩ in Abb. 3 sind Eigenvektoren von A zu den Eigenwerten a1 und a2 ; |v1 ⟩ und |v2 ⟩ sind Eigenvektoren von B zu den Eigenwerten b 1 und b 2 . So wohl {|u 1 ⟩, |u 2 ⟩} als auch {|v1 ⟩, |v2 ⟩} bildet eine orthonormierte Basis in H. In der Abbildung werden sie durch zwei Paare von senkrecht aufeinander stehenden Ein heitsvektoren dargestellt. Die Tatsache der Nichtvertauschbarkeit von A und B hat zur Folge, dass diese beiden Paare nicht zusammenfallen. Der normierte Anfangszustand des Systems wird durch den Einheitsvektor |ψ⟩ repräsentiert. Wir messen A und fin den z. B. den Wert a1 , das System gelangt in den Zustand |u 1 ⟩. Dann messen wir B, erhalten z. B. den Wert b 2 , und der Zustand des Systems ist jetzt |v2 ⟩: a1
b2
|ψ⟩ ⇒ |u 1 ⟩ ⇒ |v2 ⟩
(C-46)
Führen wir dagegen die Messungen in der umgekehrten Reihenfolge aus, wobei diese wieder die Werte a1 und b 2 liefern, so wird b2
a1
|ψ⟩ ⇒ |v2 ⟩ ⇒ |u 1 ⟩
(C-47)
Der Endzustand ist nicht derselbe. Aus der Abbildung ersehen wir weiter, dass 𝒫(a1 , b 2 ) = |OH1 |2 × |OK2 |2 𝒫(b 2 , a1 ) = |OH2 |2 × |OK1 |2
(C-48)
Zwar ist |OK1 | = |OK2 |, doch im Allgemeinen ist |OH1 | ≠ |OH2 | und somit 𝒫(b 2 , a1 ) ≠ 𝒫(a1 , b 2 )
(C-49)
Abb. 3: Schema für die aufeinanderfolgende Messung der nicht kompatiblen Observablen A und B. |ψ⟩ ist der Zustandsvektor des Systems. Die Eigenvektoren von A zu den Eigenwerten a1 und a2 sind |u 1 ⟩ bzw. |u 2 ⟩. Sie sind verschieden von den Eigenvektoren |v 1 ⟩ und |v 2 ⟩ von B zu den Eigenwerten b 1 bzw. b 2 .
C Physikalische Deutung der Postulate. Observable und ihre Messung | 229
Demnach können zwei nicht kompatible Observable nicht gleichzeitig gemessen wer den. An (C-46) und (C-47) erkennt man, dass durch die zweite Messung die Informa tion verloren geht, die man durch die erste Messung erhalten hatte. Würde man z. B. nach der in (C-46) schematisierten Reihenfolge noch einmal A messen, so ist das Er gebnis nicht mit Sicherheit vorauszusagen, weil |v2 ⟩ kein Eigenvektor von A ist. Das Wissen aus der ersten Messung von A steht nicht mehr zur Verfügung. C-6-b Präparation eines Zustands Wir betrachten ein physikalisches System im Zustand |ψ⟩ und messen die Observa ble A. Bei dieser setzen wir voraus, dass ihr Eigenwertspektrum diskret ist. Liefert die Messung den nichtentarteten Eigenwert a n , so befindet sich das System unmittelbar nach der Messung in dem zugehörigen Eigenzustand |u n ⟩. In diesem Fall reicht die Kenntnis des Messergebnisses zur eindeutigen Beschreibung des Systemzu stands nach dieser Messung aus. Unabhängig vom Ausgangszustand |ψ⟩ ist der Zu stand nach der Messung stets derselbe, weil |cc nn | |u n ⟩ physikalisch denselben Zustand repräsentiert wie |u n ⟩. Ist dagegen der Eigenwert a n entartet, so liegen die Verhältnisse anders. In dem Ausdruck 1
|ψn ⟩ =
gn
∑ c in |u in ⟩
(C-50)
i 2 i=1 √∑ |c n | i
kommt es dann auf die Beträge und die relativen Phasen der Koeffizienten c in an (s. § B-3-b-γ). Diese sind aber durch die Vorgabe von |ψ⟩ bestimmt, und der Zustand |ψn ⟩ hängt von |ψ⟩ ab. Nun untersuchten wir im vorstehenden Abschnitt die simultane Messung zweier kompatibler Observabler A und B. Gehört zum Ergebnis (a n , b p ) dieser kombinierten Messung genau ein gemeinsamer Eigenvektor |a n , b p ⟩ der Observablen A und B, so entfällt in Gl. (C-37) die Summation über i, und es wird |ψn,p ⟩ =
c n,p |a n , b p ⟩ |c n,p |
(C-51)
Dieser Zustand ist physikalisch äquivalent zu |a n , b p ⟩. Wiederum wird durch die An gabe des Messergebnisses (a n , b p ) der Endzustand des Systems eindeutig bestimmt, ist also vom Anfangsket |ψ⟩ unabhängig. Gibt es jedoch zu dem Eigenwertpaar (a n , b p ) mehrere voneinander unabhängige Eigenvektoren |a n , b p , i⟩, so kann man mit A und B gleichzeitig eine dritte, mit diesen beiden kompatible Observable C messen. Wir gelangen somit zu folgender Schlussfol gerung: Damit der Zustand eines Systems nach einer Messung durch die Angabe des Messergebnisses eindeutig bestimmt ist, muss sich diese Messung auf einen vollstän digen Satz kommutierender Observabler erstrecken, s. Kap. II, § D-3-b. Es ist diese Ei
230 | III Die Postulate der Quantenmechanik
genschaft, die die Einführung des Begriffs des vollständigen Satzes kommutierender Observabler rechtfertigt. Wenn es daher darum geht, ein System in einen bestimmten Quantenzustand zu präparieren, so kann man prinzipiell so vorgehen, wie man es von der Herstel lung polarisierten Lichts kennt. Schiebt man in einen Lichtstrahl einen Polarisator, so wird das Licht je nach dessen Polarisationsrichtung polarisiert, und zwar unabhän gig von der Polarisationsrichtung des einfallenden Strahls. Entsprechend konstruiert man Vorrichtungen zur Präparation von Quantensystemen, die nur einen einzigen, zu einem bestimmten n-Tupel von Eigenwerten eines V. S. K. O. gehörenden Zustand passieren lassen. Ein Beispiel werden wir in § B-1 von Kap. IV untersuchen. Bemerkung: Die Messung eines V. S. K. O. erlaubt nur die Präparation eines beliebigen Zustands aus der zu diesem V. S. K. O. gehörenden Basis. Will man andere Zustände präparieren, so genügt es aber, den V. S. K. O. zu verändern. In § B-1 von Kap. IV werden wir an einem Beispiel zeigen, wie man einen beliebigen Zustand aus H präparieren kann.
D Bedeutung der Schrödinger-Gleichung Die Schrödinger-Gleichung spielt nach dem sechsten Postulat als Bewegungsglei chung für ein physikalisches System in der Quantenmechanik eine zentrale Rolle. Wir untersuchen jetzt die wichtigsten Eigenschaften dieser Gleichung.
D-1 Allgemeine Eigenschaften D-1-a Determinismus in der Entwicklung physikalischer Systeme Die Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = H(t)|ψ(t)⟩ dt
(D-1)
ist hinsichtlich der Ableitung nach der Zeit t von erster Ordnung. Mit der Angabe des Anfangszustands |ψ(t0 )⟩ ist darum der Zustand |ψ(t)⟩ zu jedem späteren Zeit punkt bestimmt. Hinsichtlich der zeitlichen Entwicklung eines Quantensystems be steht also kein Indeterminismus. Dieser tritt erst bei der Messung einer physikalischen Größe auf, weil dabei der Zustandsvektor eine unvorhersehbare Modifizierung erfährt (s. fünftes Postulat). Zwischen zwei Messungen entwickelt sich der Zustandsvektor völlig deterministisch gemäß Gl. (D-1). D-1-b Superpositionsprinzip Die Schrödinger-Gleichung ist linear und homogen. Ihre Lösungen können daher li near überlagert (superponiert) werden.
D Bedeutung der Schrödinger-Gleichung
|
231
Es seien |ψ1 (t)⟩ und |ψ2 (t)⟩ zwei Lösungen von Gl. (D-1). Ist |ψ(t0 )⟩ = λ1 |ψ1 (t0 )⟩ + λ2 |ψ2 (t0 )⟩
λ1 , λ2 beliebige Konstante
der Anfangszustand des Systems, so gehört zum Zeitpunkt t der Zustand |ψ(t)⟩ = λ1 |ψ1 (t)⟩ + λ2 |ψ2 (t)⟩ Der Zusammenhang zwischen |ψ(t0 )⟩ und |ψ(t)⟩ ist daher linear. In Ergänzung FIII werden wir die Eigenschaften des linearen Operators U(t, t0 ) untersuchen, der |ψ(t0 )⟩ in |ψ(t)⟩ transformiert: |ψ(t)⟩ = U(t, t0 )|ψ(t0 )⟩
(D-2)
D-1-c Erhaltung der Wahrscheinlichkeit α Erhaltung der Norm Wegen der Hermitezität des Hamilton-Operators hängt die Norm des Zustandsvektors nicht von der Zeit ab. Wir zeigen nämlich, dass ddt ⟨ψ(t)|ψ(t)⟩ = 0 ist. Zunächst haben wir d d d ⟨ψ(t)|ψ(t)⟩ = [ ⟨ψ(t)|] |ψ(t)⟩ + ⟨ψ(t)| [ |ψ(t)⟩] dt dt dt
(D-3)
Nach Gl. (D-1) ist weiter d 1 |ψ(t)⟩ = H(t)|ψ(t)⟩ dt iℏ
(D-4)
und wenn wir von beiden Seiten dieser Gleichung das hermitesch Konjugierte bilden d 1 1 ⟨ψ(t)| = − ⟨ψ(t)|H † (t) = − ⟨ψ(t)|H(t) dt iℏ iℏ
(D-5)
weil H(t) (als Observable) hermitesch ist. Setzen wir Gl. (D-4) und Gl. (D-5) in Gl. (D-3) ein, so erhalten wir d 1 1 ⟨ψ(t)|ψ(t)⟩ = − ⟨ψ(t)|H(t)|ψ(t)⟩ + ⟨ψ(t)|H(t)|ψ(t)⟩ dt iℏ iℏ =0
(D-6)
Diese Erhaltungseigenschaft der Norm erweist sich in der Quantenmechanik als sehr nützlich. So ist sie z. B. unabdingbar, wenn man das Quadrat des Betrages der Wellen funktion eines Teilchens ohne Spin, also |ψ(r, t)|2 , als eine Aufenthaltswahrschein lichkeitsdichte interpretieren will. Die Tatsache, dass der Zustand |ψ(t0 )⟩ zum Zeit punkt t0 normiert ist, drücken wir durch die Beziehung ⟨ψ(t0 )|ψ(t0 )⟩ = ∫ d3 r |ψ(r, t0 )|2 = 1
(D-7)
232 | III Die Postulate der Quantenmechanik aus, worin ψ(r, t0 ) = ⟨r|ψ(t0 )⟩ die zu |ψ(t0 )⟩ gehörende Wellenfunktion ist. Sie besagt, dass die Wahrscheinlichkeit, das Teilchen irgendwo im Raum zu finden, gleich eins ist. Die eben bewiesene Eigenschaft der Normerhaltung bedeutet hier also, dass ⟨ψ(t)|ψ(t)⟩ = ∫ d3 r |ψ(r, t)|2 = ⟨ψ(t0 )|ψ(t0 )⟩ = 1
(D-8)
ist. |ψ(t)⟩ ist darin die Lösung von Gl. (D-1), die zum Anfangszustand |ψ(t0 )⟩ gehört. Bei der zeitlichen Entwicklung des Systems ändert sich mit anderen Worten die Gesamt wahrscheinlichkeit für den Aufenthalt des Teilchens im Raum nicht; sie bleibt stets gleich eins. Darum kann man |ψ(r, t)|2 als eine Wahrscheinlichkeitsdichte deuten. β Lokale Erhaltung der Wahrscheinlichkeit. Wahrscheinlichkeitsstrom In diesem Abschnitt beschränken wir uns auf ein physikalisches System, das nur aus einem einzigen Teilchen (ohne Spin) besteht. Ist ψ(r, t) normiert, so ist ρ(r, t) = |ψ(r, t)|2
(D-9)
eine Wahrscheinlichkeitsdichte: Die Wahrscheinlichkeit, zur Zeit t das Teilchen in ei nem Volumenelement d3 r um den Punkt r zu finden, ist d𝒫(r, t) = ρ(r, t) d3 r
(D-10)
Wie wir eben zeigten, bleibt das über den gesamten Raum erstreckte Integral von ρ(r, t) zeitlich konstant (und gleich eins, falls ψ normiert ist). Dies hat aber nicht unbe dingt zur Folge, dass auch die Dichte ρ(r, t) zeitunabhängig ist. Die Verhältnisse sind analog zur Elektrodynamik: Wenn bei einem isolierten System eine Ladung im Raum mit einer Volumendichte ρ(r, t) verteilt ist, so bleibt die Gesamtladung, d. h. das Inte gral über den gesamten Raum, erhalten; dagegen kann sich die räumliche Verteilung dieser Ladung zeitlich ändern, wobei elektrische Ströme entstehen. Man kann die Analogie weiterführen. Die globale Erhaltung der elektrischen La dung basiert auf einer lokalen Erhaltung: Ändert sich die in einem festen Volumen V enthaltene elektrische Ladung Q, tritt durch die das Volumen V begrenzende Oberflä che F ein elektrischer Strom. Genauer ist die während der Zeit dt auftretende Ände rung dQ der in V befindlichen Ladung gleich −Φ dt, wobei Φ der Fluss der Stromdich te J(r, t) ist, der die Fläche F verlässt. Die lokale Erhaltung der elektrischen Ladung drückt man dann mit Hilfe der Vektoranalysis durch die Kontinuitätsgleichung ∂ ρ(r, t) + div J(r, t) = 0 ∂t
(D-11)
aus. Es ist nun möglich, einen Vektor J(r, t), die Wahrscheinlichkeitsstromdichte, ein zuführen, der eine zu dieser Beziehung identische Gleichung erfüllt. Somit gibt es auch eine lokale Erhaltung der Wahrscheinlichkeit. Man kann diesen Sachverhalt mit
D Bedeutung der Schrödinger-Gleichung
|
233
dem Bild einer „Wahrscheinlichkeitsflüssigkeit“ veranschaulichen, bei der die Dichte durch ρ(r, t) und die Bewegung durch J(r, t) umschrieben werden: Ändert sich im Lau fe der Zeit die Wahrscheinlichkeit, das Teilchen in dem (festen) Volumen d3 r um r zu finden, so zeigt der Wahrscheinlichkeitsstrom einen nichtverschwindenden Fluss durch die Oberfläche, die das Volumenelement begrenzt. Wir nehmen zunächst an, dass das Teilchen lediglich einem skalaren Potential V(r, t) unterliegt. Der Hamilton-Operator lautet in diesem Fall H=
P2 + V(R, t) 2m
(D-12)
In der Ortsdarstellung (s. Ergänzung DII ) ist dann die Schrödinger-Gleichung iℏ
ℏ2 ∂ ψ(r, t) = − ∆ψ(r, t) + V(r, t)ψ(r, t) ∂t 2m
(D-13)
Damit H hermitesch ist, muss V(r, t) reell sein. Die hierzu konjugiert komplexe Glei chung ist −iℏ
∂ ∗ ℏ2 ψ (r, t) = − ∆ψ∗ (r, t) + V(r, t)ψ∗ (r, t) ∂t 2m
(D-14)
Multiplizieren wir die beiden Seiten von Gl. (D-13) mit ψ∗ (r, t), die beiden Seiten von Gl. (D-14) mit −ψ(r, t) und addieren, so wird iℏ
∂ ∗ ℏ2 ∗ [ψ (r, t) ψ(r, t)] = − [ψ ∆ψ − ψ∆ψ∗ ] ∂t 2m
(D-15)
oder auch ℏ ∂ ρ(r, t) + [ψ∗ (r, t)∆ψ(r, t) − ψ(r, t)∆ψ∗ (r, t)] = 0 ∂t 2m i
(D-16)
Wenn wir jetzt ℏ [ψ∗ ∇ψ − ψ∇ψ∗ ] 2m i 1 ℏ = Re [ψ∗ ( ∇ψ)] m i
J(r, t) =
(D-17)
setzen, so hat Gl. (D-16) gerade die Form von Gl. (D-11), weil div J(r, t) = ∇ ⋅ J ℏ [(∇ψ∗ )(∇ψ) + ψ∗ (∇2 ψ) − (∇ψ)(∇ψ∗ ) − ψ(∇2 ψ∗ )] 2m i ℏ [ψ∗ ∆ψ − ψ∆ψ∗ ] = 2m i =
(D-18)
ist. Somit haben wir eine Kontinuitätsgleichung aufgestellt, mit der wir die lokale Erhaltung der Wahrscheinlichkeit beweisen, und wir konnten den Ausdruck für die Wahrscheinlichkeitsstromdichte in Abhängigkeit von der normierten Wellenfunktion ψ(r, t) angeben.
234 | III Die Postulate der Quantenmechanik
Bemerkung: Die Form der Wahrscheinlichkeitsstromdichte (D-17) ist aus physikalischer Sicht befriedigend. J(r, t) erscheint hier nämlich als der Erwartungswert eines durch K(r) =
1 [|r⟩⟨r|P + P|r⟩⟨r|] 2m
(D-19)
gegebenen Operators im Zustand |ψ(t)⟩. Nun ist der Erwartungswert des Operators |r⟩⟨r| die Wahrscheinlichkeitsdichte ρ(r, t) = |ψ(r, t)|2 , und der Operator P/m ist der Geschwindig keitsoperator V. Daher wird der quantenmechanische Operator K konstruiert, indem man vom Produkt der Wahrscheinlichkeitsdichte mit der Teilchengeschwindigkeit ausgeht (und geeignet symmetrisiert). Dies entspricht genau dem Stromdichtevektor einer klassischen Flüssigkeit (Wir wissen z. B., dass die elektrische Stromdichte einer Flüssigkeit aus geladenen Teilchen gleich dem Produkt aus der räumlichen Ladungsdichte und der Verschiebungsgeschwindigkeit der Teilchen ist).
Befindet sich das Teilchen in einem elektromagnetischen Feld, das durch die Poten tiale U(r, t) und A(r, t) beschrieben wird, so kann man die vorstehende Überlegung wiederholen, indem man von dem Hamilton-Operator (B-46) ausgeht. In diesem Fall ergibt sich J(r, t) =
1 ℏ Re {ψ∗ [ ∇ − qA] ψ} m i
(D-20)
Man erkennt, dass man diesen Ausdruck aus Gl. (D-17) erhält, wenn man wie bei der Regel für die Aufstellung des Hamilton-Operators einfach P durch P − qA ersetzt. Beispiel: Ebene Welle Wir betrachten die Wellenfunktion ψ(r, t) = A ei(k⋅r−ωt) mit ℏω =
ℏ2 k2 2m .
(D-21)
Die zugehörige Wahrscheinlichkeitsdichte
ρ(r, t) = |ψ(r, t)|2 = |A|2
(D-22)
ist räumlich und zeitlich konstant. Für die Stromdichte erhalten wir aus Gl. (D-17) J(r, t) = |A|2
ℏk = ρ(r, t) vG m
(D-23)
mit der zum Impuls ℏk gehörenden Gruppengeschwindigkeit vG = ℏk m , s. Kap. I, § C-4. Wieder ist daher der Wahrscheinlichkeitsstrom gleich dem Produkt aus dieser Ge schwindigkeit und der Wahrscheinlichkeitsdichte. ρ und J hängen hier nicht von der Zeit ab: Im Bild der Wahrscheinlichkeitsflüssigkeit entspricht einer ebenen Welle eine stationäre Strömung (die wegen der Ortsunabhängigkeit von ρ und J zugleich homo gen und gleichförmig ist).
D Bedeutung der Schrödinger-Gleichung
|
235
D-1-d Zeitliche Entwicklung des Erwartungswerts einer Observablen Es sei A eine Observable. Ist der Zustand |ψ(t)⟩ des Systems normiert (wir wissen, dass dann diese Eigenschaft für jedes t gilt), so gilt für den Erwartungswert von A zum Zeitpunkt t ⟨A⟩(t) = ⟨ψ(t)|A|ψ(t)⟩
(D-24)
Der Erwartungswert hängt also zunächst mittelbar über |ψ(t)⟩ (und ⟨ψ(t)|) von der Zeit ab; deren zeitliche Entwicklung ist durch die Schrödinger-Gleichung (D-4) bestimmt. Darüber hinaus kann aber die Observable A auch explizit zeitabhängig sein, was dann zu einer zusätzlichen Änderung des Erwartungswerts ⟨A⟩(t) mit der Zeit t führt. Diese zeitliche Entwicklung des Erwartungswerts einer Observablen wollen wir jetzt untersuchen und zeigen, wie dadurch ein Zusammenhang zwischen der klassi schen und der Quantenmechanik hergestellt werden kann. α Allgemeine Formel Die zeitliche Ableitung von Gl. (D-24) ergibt d d d ⟨ψ(t)|A(t)|ψ(t)⟩ = [ ⟨ψ(t)|] A(t)|ψ(t)⟩ + ⟨ψ(t)|A(t) [ |ψ(t)⟩] dt dt dt ∂A + ⟨ψ(t)| |ψ(t)⟩ ∂t
(D-25)
Unter Berücksichtigung von Gl. (D-4) und Gl. (D-5) wird daraus d 1 ⟨ψ(t)|A(t)|ψ(t)⟩ = ⟨ψ(t)| [A(t)H(t) − H(t)A(t)] |ψ(t)⟩ dt iℏ ∂A |ψ(t)⟩ + ⟨ψ(t)| ∂t
(D-26)
Dies können wir schließlich wie folgt schreiben: d 1 ∂A ⟨A⟩ = ⟨[A, H(t)]⟩ + ⟨ ⟩ dt iℏ ∂t
(D-27)
Bemerkung: Der Erwartungswert ⟨A⟩ ist eine Zahl, die nur von t abhängt, und man muss sich genau klarma chen, wie diese Abhängigkeit zustande kommt. Nehmen wir als Beispiel den Fall eines Teilchens ohne Spin. A(r, p, t) sei eine klassische Größe. In der klassischen Mechanik hängen r und p gemäß den Hamilton-Gleichungen von der Zeit ab, so dass A(r, p, t) sowohl explizit als auch implizit (über r und p) von t abhängig ist. Zu dieser klassischen Größe gehört der hermitesche Operator A = A(R, P, t), den man erhält, indem man in A die Variablen r und p durch die Opera toren R und P ersetzt, s. § B-5. Die Eigenzustände und Eigenwerte von R und P und folglich diese Observablen selbst hängen nicht mehr von t ab. Die zeitliche Abhängigkeit von r und p, die die Entwicklung des klassischen Zustands charakterisiert, findet sich nicht mehr in R und P, son dern im Zustandsvektor |ψ(t)⟩, dem in der Ortsdarstellung die Wellenfunktion ψ(r, t) = ⟨r|ψ(t)⟩
236 | III Die Postulate der Quantenmechanik
zugeordnet ist. In dieser Darstellung lautet der Ausdruck für den Erwartungswert von A ⟨A⟩ = ∫ d3 r ψ∗ (r, t)A (r,
ℏ ∇, t) ψ(r, t) i
(D-28)
Die Integration über r ergibt eine Zahl, die nur noch von t abhängt. Es ist diese Zahl (und nicht der Operator A(r, ℏi ∇, t)), die man mit dem Wert der klassischen Größe A(r, p, t) zur Zeit t ver gleichen muss.
β Anwendung auf die Orts- und Impulsobservable. Das Ehrenfest-Theorem Die allgemeine Beziehung (D-27) wenden wir auf die Observablen R und P an. Der Einfachheit halber beschränken wir uns auf den Fall eines Teilchens ohne Spin, das sich in einem skalaren, statischen Potential V(r) bewegt. Der Hamilton-Operator ist dann P2 + V(R) 2m so dass wir schreiben können H=
d ⟨R⟩ = dt d ⟨P⟩ = dt
1 1 P2 ⟨[R, H]⟩ = ⟨[R, ]⟩ iℏ iℏ 2m 1 1 ⟨[P, H]⟩ = ⟨[P, V(R)]⟩ iℏ iℏ
(D-29)
(D-30) (D-31)
Beachtet man die Vertauschungsrelationen, so kann der Kommutator in (D-30) leicht berechnet werden. Wir erhalten [R,
P2 iℏ ]= P 2m m
(D-32)
Für den Kommutator in (D-31) muss man die aus Gl. (B-33) folgende Verallgemeinerung verwenden [s. Ergänzung BII , Gl. (48)]. Sie lautet [P, V(R)] = −iℏ∇V(R)
(D-33)
Hierin fasst ∇V(R) die drei Operatoren zusammen, die man erhält, wenn man in den drei Komponenten des Gradienten von V(r) die Variable r durch R ersetzt. Damit er halten wir d 1 ⟨R⟩ = ⟨P⟩ dt m d ⟨P⟩ = −⟨∇V(R)⟩ dt
(D-34) (D-35)
Diese beiden Gleichungen drücken das Theorem von Ehrenfest aus. Ihre Form erinnert an die klassischen Hamilton-Gleichungen für ein Teilchen (s. Anhang III, § 3): 1 d r= p dt m d p = −∇V(r) dt
(D-36a) (D-36b)
D Bedeutung der Schrödinger-Gleichung
|
237
die sich in diesem einfachen Fall auf die Newtonsche Bewegungsgleichung d2 r dp = m 2 = −∇V(r) dt dt
(D-37)
reduzieren. γ Diskussion des Theorems von Ehrenfest. Quasiklassischer Grenzfall Um die physikalische Bedeutung des Theorems von Ehrenfest, d. h. die Gleichun gen (D-34) und (D-35) zu untersuchen, nehmen wir an, dass die den Zustand des Teilchens beschreibende Wellenfunktion ψ(r, t) ein Wellenpaket darstellt, so wie wir es in Kapitel I behandelt haben. ⟨R⟩ ist dann eine Abkürzung für das zeitabhängige Zahlentripel {⟨X⟩, ⟨Y⟩, ⟨Z⟩}. Den durch dieses Tripel gekennzeichneten Punkt nen nen wir den Schwerpunkt des Wellenpakets⁴ ⟨R⟩(t) zum Zeitpunkt t. Die Menge dieser Punkte zu verschiedenen Zeiten t bildet die Bahn, die dieser Schwerpunkt durchläuft. Wir erinnern jedoch daran, dass wir nie von der Bahn des Teilchens selbst sprechen können: Dessen Zustand wird durch das ganze Wellenpaket beschrieben, das stets eine gewisse räumliche Ausdehnung besitzt. Nur wenn das Paket sehr konzentriert ist, kann man es sich annähernd durch seinen Schwerpunkt ersetzt denken, und nur in diesem Grenzfall besteht zwischen der quantenmechanischen und der klassischen Beschreibung des Teilchens kein nennenswerter Unterschied. Darum ist es wichtig zu wissen, ob die Bewegung des Paketschwerpunkts den Ge setzen der klassischen Mechanik gehorcht. Mit Hilfe des Theorems von Ehrenfest kön nen wir diese Frage entscheiden. Gleichung (D-34) drückt aus, dass die Geschwindig keit des Schwerpunkts des Wellenpakets gleich dem Quotienten aus dem mittleren Impuls dieses Pakets und der Masse m des Teilchens ist. Folglich ist die linke Seite 2 in Gl. (D-35) gleich m ddt2 ⟨R⟩, so dass die Frage darauf hinausläuft, ob die rechte Seite dieser Gleichung gleich der klassischen Kraft Fkl in dem Punkt ist, in dem sich gerade der Paketschwerpunkt befindet, ob also Fkl = [−∇V(r)]r=⟨R⟩
(D-38)
ist. Nun ist die rechte Seite von Gl. (D-35) aber gleich dem über das Wellenpaket gebil deten Mittelwert der Kraft, und im Allgemeinen gilt ⟨∇V(R)⟩ ≠ [∇V(r)]r=⟨R⟩
(D-39)
(der Mittelwert einer Funktion ist nicht gleich dem Wert dieser Funktion an der Stelle des Mittelwerts der unabhängigen Variablen). Daher genügen die Koordinaten des Pa ketschwerpunkts nicht der klassischen Bewegungsgleichung.
4 Im Allgemeinen sind der Schwerpunkt eines Wellenpakets und die Stelle seines Maximums ver schieden, s. § C-5, Abb. 2. Bei einem symmetrischen Paket fallen sie allerdings zusammen.
238 | III Die Postulate der Quantenmechanik
Bemerkung: Zur Illustration von (D-39) betrachten wir ein Beispiel. Für ein eindimensionales Problem nehmen wir an, dass das Potential V(x) = λx n
(D-40)
ist (λ reell und konstant, n positiv ganzzahlig). Der zugehörige Operator lautet V(X) = λX n
(D-41) d , dx
Ersetzt man ∇ durch so erhält man für die linke Seite von (D-39) den Ausdruck λn⟨X n−1⟩. Dagegen ergibt sich für die rechte Seite [
dV = [λnx n−1 ]x=⟨X⟩ = λn⟨X⟩n−1 ] dx x=⟨X⟩
(D-42)
Im Allgemeinen ist aber ⟨X n−1 ⟩ ≠ ⟨X⟩n−1 . Zum Beispiel wissen wir für den Fall n = 3, dass ⟨X 2 ⟩ ≠ ⟨X⟩2 ist, denn die Differenz dieser beiden Größen tritt gerade in der Definition der Stan dardabweichung auf. Nur für die Fälle n = 0, n = 1 und n = 2 sind die beiden Seiten in (D-39) gleich. n = 0 entspricht einem freien Teilchen, n = 1 führt zu einem konstanten Kraftfeld und n = 2 ergibt das Potential des harmonischen Oszillators. In diesen Fällen gehorcht also die Bewegung des Schwerpunkts des Wellenpakets den Gesetzen der klassischen Mechanik. Für das freie Teilchen erhielten wir dieses Ergebnis bereits in § C-4 von Kap. I.
Nun gibt es Situationen, man nennt sie quasiklassische Grenzfälle, in denen der Unter schied zwischen den beiden Seiten in der Beziehung (D-39) vernachlässigbar ist, weil bei ihnen das Wellenpaket hinreichend lokalisiert ist. Um dies zu sehen, begeben wir uns in die Ortsdarstellung, in der die linke Seite ⟨∇V(R)⟩ = ∫ d3 r ψ∗ (r, t)[∇V(r)]ψ(r, t) = ∫ d3 r |ψ(r, t)|2 ∇V(r)
(D-43)
lautet. Wir setzen voraus, dass |ψ(r, t)|2 nur in einem Bereich wesentlich von null ver schiedene Werte annimmt, der gegenüber den Abständen, in denen sich V(r) nen nenswert ändert, sehr klein ist. Dann ändert sich in diesem Bereich um den Schwer punkt ⟨R⟩ der Gradient ∇V(r) praktisch nicht. Man kann ihn näherungsweise durch seinen Wert an der Stelle r = ⟨R⟩ ersetzen und ihn vor das Integral ziehen. Weil aber ψ(r, t) auf eins normiert ist, erhält man für hinreichend lokalisierte Wellenpakete die Beziehung ⟨∇V(R)⟩ ≈ [∇V(r)]r=⟨R⟩
(D-44)
Im makroskopischen Grenzfall (bei dem die de-Broglie-Wellenlängen sehr klein ge genüber den Abständen sind, für die sich das Potential ändert⁵) kann man hinrei chend schmale Wellenpakete bilden, die dieser Beziehung genügen und für die der Impuls noch ausreichend definiert ist. Ein solches Paket bewegt sich dann praktisch wie ein Teilchen der Masse m in einem Potential V(r). 5 Siehe die Größenordnungen der de-Broglie-Wellenlängen, die in Ergänzung AI für ein makroskopi sches System angegeben wurden.
D Bedeutung der Schrödinger-Gleichung
|
239
D-2 Konservative Systeme Hängt der Hamilton-Operator eines physikalischen Systems nicht explizit von der Zeit ab, so spricht man von einem konservativen System. In der klassischen Mechanik er gibt sich hieraus als wichtigste Folgerung die Erhaltung der Energie: Sie bleibt zeitlich konstant. Man sagt auch, die Gesamtenergie des Systems sei eine Konstante der Be wegung. In diesem Abschnitt zeigen wir, dass konservative Systeme auch in der Quan tenmechanik besondere wichtige Eigenschaften aufweisen. D-2-a Lösung der Schrödinger-Gleichung Wir betrachten zunächst die Eigenwertgleichung des Hamilton-Operators H: H|φ n,τ ⟩ = E n |φ n,τ ⟩
(D-45)
Der Einfachheit halber setzen wir das Spektrum von H als diskret voraus; τ bezeichnet die Menge der weiteren, zur eindeutigen Festlegung eines Vektors |φ n,τ ⟩ notwendigen Indizes (diese sind im Allgemeinen durch die Eigenwerte der Operatoren gegeben, die mit H einen V. S. K. O. bilden). Weil nach Voraussetzung H nicht explizit von der Zeit abhängen soll, tritt die Zeit t weder im Eigenwert E n noch im Eigenket |φ n,τ ⟩ auf. Als erstes zeigen wir, dass die Schrödinger-Gleichung sehr einfach gelöst werden kann, wenn wir die Eigenwerte E n und die Eigenvektoren |φ n,τ ⟩ von H kennen. Da die |φ n,τ ⟩ im Zustandsraum eine Basis bilden (H ist eine Observable), kann man einen beliebigen Zustand |ψ(t)⟩ für jeden Wert von t nach den |φ n,τ ⟩ entwickeln: |ψ(t)⟩ = ∑ c n,τ (t)|φ n,τ ⟩
(D-46)
n,τ
wobei: c n,τ (t) = ⟨φ n,τ |ψ(t)⟩
(D-47)
ist. Weil die |φ n,τ ⟩ nicht von t abhängen, ist die gesamte zeitliche Abhängigkeit von |ψ(t)⟩ in den Koeffizienten c n,τ (t) enthalten. Zu deren Berechnung projizieren wir die Schrödinger-Gleichung auf die einzelnen Zustände |φ n,τ ⟩. Wir erhalten: iℏ
d ⟨φ n,τ |ψ(t)⟩ = ⟨φ n,τ |H|ψ(t)⟩ dt
(D-48)
Hierbei haben wir ⟨φ n,τ | rechts von ddt schreiben können, weil ⟨φ n,τ | nicht von t ab hängt. Wegen der Hermitezität von H folgt aus Gl. (D-45), dass: ⟨φ n,τ |H = E n ⟨φ n,τ |
(D-49)
ist, womit wir Gl. (D-48) schließlich auf die Form: iℏ
d c n,τ (t) = E n c n,τ (t) dt
(D-50)
240 | III Die Postulate der Quantenmechanik
bringen können. Diese Gleichung kann sofort integriert werden. Es ist: c n,τ (t) = c n,τ (t0 )e−iE n (t−t 0)/ℏ
(D-51)
Wir fassen zusammen: Den Zustandsvektor |ψ(t)⟩ zu einem beliebigen Zeitpunkt t findet man bei gege benem Anfangszustand |ψ(t0 )⟩ wie folgt: 1.
Man entwickelt zunächst |ψ(t0 )⟩ nach der Basis der Eigenzustände des Hamil ton-Operators H: |ψ(t0 )⟩ = ∑ ∑ c n,τ (t0 )|φ n,τ ⟩ n
(D-52)
τ
Darin ist c n,τ (t0 ) = ⟨φ n,τ |ψ(t0 )⟩ 2.
(D-53)
Man erhält dann |ψ(t)⟩, indem man in der Entwicklung von |ψ(t0 )⟩ jeden Ko effizienten c n,τ (t0 ) mit e−iE n (t−t 0)/ℏ multipliziert (E n ist der zum Zustand |φ n,τ ⟩ gehörende Eigenwert): |ψ(t)⟩ = ∑ ∑ c n,τ (t0 )e−iE n (t−t 0)/ℏ |φ n,τ ⟩ n
(D-54)
τ
Ist das Spektrum von H kontinuierlich, so können wir unsere Überlegung verallgemei nern und erhalten statt Gl. (D-54) die Beziehung |ψ(t)⟩ = ∑ ∫ dE c τ (E, t0 ) e−iE(t−t 0)/ℏ |φ E,τ ⟩
(D-55)
τ
D-2-b Stationäre Zustände Ein besonders wichtiger Fall liegt vor, wenn der Anfangszustand |ψ(t0 )⟩ selbst Eigen vektor von H ist. Dann enthält nämlich die Entwicklung in Gl. (D-52) nur Eigenzustän de von H zum selben Eigenwert (z. B. zu E n ): |ψ(t0 )⟩ = ∑ c n,τ (t0 )|φ n,τ ⟩
(D-56)
τ
Hier tritt eine Summation über n nicht mehr auf, und der Übergang von |ψ(t0 )⟩ zu |ψ(t)⟩ geschieht durch Multiplikation der Koeffizienten c n,τ (t0 ) mit demselben Faktor e−iE n (t−t 0)/ℏ . Diesen kann man dann vor die Summation über τ ziehen: |ψ(t)⟩ = ∑ c n,τ (t0 )e−iE n (t−t 0)/ℏ |φ n,τ ⟩ τ
= e−iE n (t−t 0)/ℏ ∑ c n,τ (t0 )|φ n,τ ⟩ τ −iE n (t−t 0)/ℏ
=e
|ψ(t0 )⟩
(D-57)
D Bedeutung der Schrödinger-Gleichung
|
241
Der Anfangszustand |ψ(t0 )⟩ und der Zustand |ψ(t)⟩ zu einer beliebigen anderen Zeit t unterscheiden sich nur durch den globalen Faktor e−iE n (t−t 0)/ℏ , sind also physikalisch nicht unterscheidbar (s. § B-3-b-γ). Hieraus schließen wir, dass sämtliche physikali schen Eigenschaften eines Systems zeitlich unverändert bleiben, wenn sich dieses in einem Eigenzustand von H befindet. Aus diesem Grund nennt man die Eigenzustände des Hamilton-Operators H stationäre Zustände. Um zu sehen, wie sich die Energieerhaltung bei einem konservativen System in der Quantenmechanik manifestiert, nehmen wir an, dass wir bei einer Energiemes sung an einem derartigen System z. B. den Wert E k feststellen. Unmittelbar nach die ser Messung befindet sich das System in einem Eigenzustand von H zum Eigenwert E k (Postulat der Zustandsreduktion). Weil aber die Eigenzustände von H stationär sind, wird sich auch dieser Eigenzustand zum Eigenwert E k nach der ersten Messung zeit lich nicht mehr ändern. Folglich wird man bei einer zweiten Messung zu einem belie bigen späteren Zeitpunkt t wieder dasselbe Ergebnis E k wie beim ersten Mal erhalten. Bemerkung: Beim Übergang von Gl. (D-52) zu Gl. (D-54) wird jeder Koeffizient c n,τ (t0 ) mit dem Phasenfaktor e−iEn (t−t0 )/ℏ multipliziert. Daraus darf man aber nicht schließen, dass die Zustände |ψ(t)⟩ und |ψ(t0 )⟩ physikalisch nicht zu unterscheiden sind. In der Entwicklung nach Gl. (D-52) treten im Allgemeinen mehrere Eigenzustände von H zu verschiedenen Eigenwerten E n auf. Dazu gehören dann verschiedene Phasenfaktoren, und es ändern sich die relativen Phasen der Entwicklungs koeffizienten: |ψ(t)⟩ unterscheidet sich physikalisch vom Anfangszustand |ψ(t0 )⟩. Nur wenn |ψ(t0 )⟩ ein Eigenzustand von H ist und in Gl. (D-52) nur ein einziger Wert von n auftritt, wird die zeitliche Entwicklung durch einen einzigen, globalen Phasenfaktor dargestellt, der dann physikalisch ohne Bedeutung ist. Eine physikalisch erkennbare zeitliche Änderung zeigt sich mit anderen Worten nur dann, wenn der Anfangszustand nicht mit Sicherheit bekannt ist. In § D-2-e werden wir auf den Zusammenhang zwischen der zeitlichen Entwicklung eines Systems und der Energieunschärfe zurückkommen.
D-2-c Konstanten der Bewegung Wenn eine Observable A nicht explizit zeitabhängig ist und außerdem mit dem Ha milton-Operator H vertauscht, so nennt man sie eine Konstante der Bewegung (oder eine Bewegungskonstante): ∂A =0 ∂t [A, H] = 0
(D-58)
Bei einem konservativen System ist H selbst eine Konstante der Bewegung. Die Konstanten der Bewegung besitzen wichtige Eigenschaften, die wir im Folgen den zeigen wollen. 1. Setzt man die Beziehungen (D-58) in die allgemeine Gleichung (D-27) ein, so erhält man d d ⟨A⟩ = ⟨ψ(t)|A|ψ(t)⟩ = 0 dt dt
(D-59)
242 | III Die Postulate der Quantenmechanik Für einen beliebigen Zustand |ψ(t)⟩ des Systems bleibt der Erwartungswert von A zeit lich konstant, was den Namen „Konstante der Bewegung“ erklärt. 2. Weil A und H zwei Observable sind, die miteinander vertauschen, kann man für sie stets ein System von gemeinsamen Eigenvektoren {|φ n,p,τ ⟩} angeben: H|φ n,p,τ ⟩ = E n |φ n,p,τ ⟩ A|φ n,p,τ ⟩ = a p |φ n,p,τ ⟩
(D-60)
Der Einfachheit halber nehmen wir an, dass die Spektren von H und A diskret sind; ferner kennzeichne der Index τ die Eigenwerte der Observablen, die zusammen mit H und A einen V. S. K. O. bilden. Als Eigenzustände von H sind die |φ n,p,τ ⟩ stationär. Befindet sich das System zum Anfangszeitpunkt in einem Zustand |φ n,p,τ ⟩, so bleibt es (abgesehen von einem Phasenfaktor) für alle Zeiten in diesem Zustand. Aber |φ n,p,τ ⟩ ist auch Eigenzustand von A. Falls also A eine Konstante der Bewegung ist, so gibt es stationäre Zustände des Systems (eben die Zustände |φ n,p,τ ⟩), die zu allen Zeiten Eigenzustände von A zum selben Eigenwert a p bleiben. Aus diesem Grund nennt man die Eigenwerte von A gute Quantenzahlen. 3. Schließlich zeigen wir, dass für einen beliebigen Zustand |ψ(t)⟩ die Wahr scheinlichkeit, bei einer Messung der Bewegungskonstanten A den Eigenwert a p zu erhalten, nicht von der Zeit abhängt. Man kann nämlich immer den Anfangszustand |ψ(t0 )⟩ nach der Basis {|φ n,p,τ ⟩} entwickeln: |ψ(t0 )⟩ = ∑ ∑ ∑ c n,p,τ (t0 )|φ n,p,τ ⟩ n
p
(D-61)
τ
woraus sich sofort |ψ(t)⟩ = ∑ ∑ ∑ c n,p,τ (t)|φ n,p,τ ⟩ n
p
(D-62)
τ
mit c n,p,τ (t) = c n,p,τ (t0 )e−iE n (t−t 0)/ℏ
(D-63)
ergibt. Nach dem Postulat der Spektralzerlegung ist die Wahrscheinlichkeit, bei einer Messung von A zum Zeitpunkt t0 an einem System im Zustand |ψ(t0 )⟩ den Wert a p zu finden, durch 𝒫(a p , t0 ) = ∑ ∑ |c n,p,τ (t0 )|2 n
(D-64)
τ
gegeben. Entsprechend erhält man für eine Messung zur Zeit t 𝒫(a p , t) = ∑ ∑ |c n,p,τ (t)|2 n
(D-65)
τ
Nun erkennt man aber an Gl. (D-63), dass c n,p,τ (t) und c n,p,τ (t0 ) denselben Betrag haben. Also ist 𝒫(a p , t) = 𝒫(a p , t0 ), was wir beweisen wollten.
D Bedeutung der Schrödinger-Gleichung
|
243
Bemerkung: Sind alle Wahrscheinlichkeiten 𝒫(a p , t0 ) bis auf eine, z. B. 𝒫(a k , t0 ) (diese ist dann gleich eins), gleich null, so ist das System zur Zeit t0 in einem Eigenzustand von A zum Eigenwert a k . Weil die Wahrscheinlichkeiten 𝒫(a p , t) aber nicht von t abhängen, bleibt der Zustand des Systems zur Zeit t Eigenzustand von A zum Eigenwert a k .
D-2-d Bohr-Frequenzen. Auswahlregeln Es sei B eine Observable, die mit H nicht zu vertauschen braucht. Für die Zeitableitung ihres Erwartungswerts haben wir nach Gl. (D-27) d 1 ∂B ⟨B⟩ = ⟨[B, H]⟩ + ⟨ ⟩ dt iℏ ∂t
(D-66)
Für ein konservatives System kennen wir für |ψ(t)⟩ die allgemeine Gleichung (D-54). In diesem Fall können wir daher nicht nur ddt ⟨B⟩, sondern auch ⟨ψ(t)|B|ψ(t)⟩ explizit und direkt berechnen. Die zu Gl. (D-54) hermitesch konjugierte Beziehung lautet (bei Vertauschung der Summationsindizes) ⟨ψ(t)| = ∑ ∑ c∗n ,τ (t0 )eiE n (t−t 0)/ℏ ⟨φ n ,τ |
(D-67)
n τ
Setzt man die Entwicklungen (D-67) und (D-54) in den Ausdruck ⟨ψ(t)|B|ψ(t)⟩ ein, so erhält man ⟨ψ(t)|B|ψ(t)⟩ = ⟨B⟩(t) = ∑ ∑ ∑ ∑ c∗n ,τ (t0 )c n,τ (t0 )⟨φ n ,τ |B|φ n,τ ⟩ei(E n −E n )(t−t 0)/ℏ (D-68) n
τ n τ
Im Weiteren setzen wir voraus, dass die Observable B von der Zeit nicht explizit abhängt. Die Matrixelemente ⟨φ n ,τ |B|φ n,τ ⟩ sind dann Konstante. Das zeitliche Ver halten von ⟨B⟩(t) wird durch eine Reihe beschrieben, deren Glieder aus harmoni schen Funktionen (eine Fourier-Reihe) bestehen. Die dabei auftretenden Frequenzen E −E 1 |E n −E n | = | nh n | = ν n n sind für das untersuchte System charakteristisch, hängen 2π ℏ aber weder von B noch vom Anfangszustand des Systems ab. Man nennt diese Fre quenzen die Bohr-Frequenzen. So oszillieren bei einem Atom die Erwartungswerte der atomaren Größen (wie die elektrischen und magnetischen Dipolmomente) mit den verschiedenen Bohr-Frequenzen dieses Atoms. Man versteht nun, wie diese Frequen zen mit den Energieniveaus zusammenhängen und weshalb ausschließlich sie vom Atom emittiert oder absorbiert werden können. Weiter erkennt man an Gl. (D-68), dass die in ⟨B⟩(t) auftretenden Frequenzen zwar von B unabhängig sind, nicht aber die Gewichte ihres Auftretens, denn diese hängen von den Matrixelementen ⟨φ n ,τ |B|φ n,τ ⟩ ab. So können für bestimmte Werte von n und n diese Matrixelemente gleich null sein, so dass die zugehörigen Frequenzen
244 | III Die Postulate der Quantenmechanik ν n n in der Entwicklung von ⟨B⟩(t) nicht vorhanden sind, und zwar für jeden Anfangs zustand. Das ist der Ursprung der Auswahlregeln, die bestimmen, welche Frequen zen unter den gegebenen Bedingungen überhaupt emittiert oder absorbiert werden können. Zum Aufstellen dieser Regeln muss man die nichtdiagonalen Matrixelemen te (n ≠ n ) der verschiedenen atomaren Operatoren (wie dem elektrischen oder dem magnetischen Dipol) untersuchen. Schließlich hängt das Gewicht einer Bohr-Frequenz über c∗n τ (t0 )c n,τ (t0 ) auch vom Anfangszustand ab. Wenn dieser z. B. ein stationärer Zustand mit der Energie E k ist, enthält die Entwicklung von |ψ(t0 )⟩ nur einen einzigen Wert von n (n = k) und c∗n τ (t0 )c n,τ (t0 ) kann nur für n = n = k von null verschieden sein. In diesem Fall ist der Erwartungswert ⟨B⟩ zeitlich konstant. Bemerkung: Man kann mit Gl. (D-68) auch direkt zeigen, dass der Erwartungswert einer Konstanten der Bewe gung immer unabhängig von der Zeit ist. Wenn nämlich B mit dem Hamilton-Operator H kommu tiert, so sind die Matrixelemente von B zwischen zwei Eigenzuständen von H zu verschiedenen Eigenzuständen gleich null (s. Kap. II, § D-3-a). Hieraus folgt, dass ⟨φ n ,τ |B|φ n,τ ⟩ für n ≠ n null ist. Damit treten in der Entwicklung von ⟨B⟩ nur (zeitlich) konstante Glieder auf.
D-2-e Energie-Zeit-Unschärfe Wir zeigen jetzt, dass bei einem konservativen System die zeitliche Entwicklung um so rascher abläuft, je ungenauer die Energie dieses Systems bekannt ist. Dies bedeutet genauer: Bezeichnen wir mit ∆t ein Zeitintervall, nach dessen Ablauf sich das System nennenswert geändert hat, und mit ∆E die Energieunschärfe, so genügen ∆t und ∆E der Relation ∆t ⋅ ∆E ≥ h
(D-69)
Ist zunächst das System in einem Eigenzustand des Hamilton-Operators H, so ist seine Energie scharf definiert und damit ∆E = 0. Ein derartiger Zustand ist aber statio när, ändert sich also zeitlich nicht. Dies kann man in gewisser Weise so umschreiben, dass in diesem Fall die Entwicklungszeit ∆t unendlich ist [Gl. (D-69) verlangt ja, dass für ∆E = 0 ∆t unendlich sein muss]. Als Nächstes nehmen wir an, dass der Anfangszustand |ψ(t0 )⟩ eine Überla gerung aus zwei Eigenzuständen von H zu verschiedenen Eigenwerten E1 und E2 ist: |ψ(t0 )⟩ = c1 |φ1 ⟩ + c2 |φ2 ⟩
(D-70)
Dann ist der Zustand des Systems zur Zeit t |ψ(t)⟩ = c1 e−iE1 (t−t 0)/ℏ |φ1 ⟩ + c2 e−iE2 (t−t 0)/ℏ |φ2 ⟩
(D-71)
D Bedeutung der Schrödinger-Gleichung
|
245
Bei einer Energiemessung erhält man entweder E1 oder E2 . Die Energieunschärfe ist jetzt von der Größenordnung⁶ ∆E ≈ |E2 − E1 |
(D-72)
Wir betrachten nun eine beliebige Observable des Systems, die mit H nicht vertauscht. Die Wahrscheinlichkeit, bei einer Messung von B zur Zeit t den zum Eigenvektor |u m ⟩ gehörenden Eigenwert b m (er sei nichtentartet) zu finden, ist 𝒫(b m , t) = |⟨u m |ψ(t)⟩|2 = |c1 |2 |⟨u m |φ1 ⟩|2 + |c2 |2 |⟨u m |φ2 ⟩|2 + 2 Re [c∗2 c1 ei(E2 −E1 )(t−t 0)/ℏ ⟨u m |φ2 ⟩∗ ⟨u m |φ1 ⟩]
(D-73)
𝒫(b m , t) oszilliert also zwischen zwei Extremwerten mit der Bohr-Frequenz ν21 = |E 2 −E 1 | . Die für die Änderung des Systems charakteristische Zeit ist daher h ∆t ≈
h |E2 − E1 |
(D-74)
Somit ergibt sich zusammen mit Gl. (D-72), dass ∆E ⋅ ∆t ≈ h ist. Wir nehmen jetzt an, dass das Spektrum von H kontinuierlich (und nichtentartet) ist. Der allgemeinste Zustand hat dann die Form |ψ(t0 )⟩ = ∫ dE c(E) |φ E ⟩
(D-75)
mit dem Eigenzustand |φ E ⟩ von H zum Eigenwert E. Nimmt |c(E)|2 nur in einer Breite ∆E um E0 wesentlich von null verschiedene Werte an, s. Abb. 4, so ist ∆E ein mögliches Maß für die Energieunschärfe des Systems. Der Zustand zur Zeit t ist nach Gl. (D-55) |ψ(t)⟩ = ∫ dE c(E)e−iE(t−t 0)/ℏ |φ E ⟩
(D-76)
Jetzt ist die Wahrscheinlichkeit, bei einer Messung von B im Zustand |ψ(t)⟩ den Eigen wert b m zu erhalten, 2 𝒫(b m , t) = |⟨u m |ψ(t)⟩|2 = ∫ dE c(E) e−iE(t−t 0 )/ℏ ⟨u m |φ E ⟩
(D-77)
Im Allgemeinen wird sich ⟨u m |φ E ⟩ mit E nur wenig ändern, wenn E um die Stelle E0 variiert. Ist ∆E genügend klein, so kann man daher im Integral (D-77) die Änderung von ⟨u m |φ E ⟩ gegenüber der von c(E) vernachlässigen, ⟨u m |φ E ⟩ durch ⟨u m |φ E0 ⟩ erset zen und dies vor das Integral ziehen. Man erhält dann 2 𝒫(b m , t) ≈ |⟨u m |φ E0 ⟩|2 ∫ dE c(E) e−iE(t−t 0 )/ℏ
(D-78)
6 Versteht man unter ∆E die Standardabweichung von E, wie sie allgemein in § C-5 definiert wurde, so ergäbe sich in unserem Fall, dass ∆E = |E 2 − E 1 ||c1 c2 | ist. Wir nehmen dann an, dass |c1 | und |c2 | von der gleichen Größenordnung sind.
246 | III Die Postulate der Quantenmechanik In dieser Näherung sehen wir, dass 𝒫(b m , t) bis auf einen Faktor gleich dem Betrags quadrat der Fourier-Transformierten von c(E) ist. Aufgrund der Eigenschaften der Fou rier-Transformation (s. Anhang I, § 2-b) besteht zwischen der Breite ∆t von 𝒫(b m , t) und der Breite ∆E von |c(E)|2 der Zusammenhang, wie er in (D-69) angegeben ist.
Abb. 4: Bei der Superposition der stationären Zustände |φ E ⟩ mit den Koeffizienten c(E) erhält man einen Zu stand |ψ⟩ des Systems, für den die Energie nicht scharf definiert ist. Die Energieunschärfe ist durch die Breite der Kurve |c(E)|2 gegeben. Der Zustand |ψ(t)⟩ wird sich nach einem Zeitintervall ∆t nennenswert ändern, das der Relation ∆E ⋅ ∆t ≥ ℏ genügt.
Bemerkung: Für den eindimensionalen Fall gelangt man bei einem Paket aus freien Wellen zur Relation (D-69) auch auf direkte Weise. Der Impulsunschärfe ∆p dieses Pakets kann eine Energieunschärfe ∆E = dE ∆p zugeordnet werden. Weil E = ℏω und p = ℏk ist, hat man ddpE = dω = vG , worin vG dp dk die Gruppengeschwindigkeit des Wellenpakets bedeutet, s. § C-4 von Kap. I. Folglich ist ∆E = vG ∆p
(D-79)
Das charakteristische Zeitintervall ∆t ist hier die Zeit, die das Paket bei der Geschwindigkeit vG benötigt, um an einem bestimmten Raumpunkt vorbeizulaufen. Ist ∆x die räumliche Ausdehnung der Wellengruppe, so ist daher ∆x ∆t ≈ (D-80) vG Damit erhalten wir für das Produkt aus Energie- und Zeitunschärfe ∆E ⋅ ∆t ≈ ∆x ⋅ ∆p ≥ ℏ
(D-81)
Die Beziehung (D-69) wird auch die vierte Heisenbergsche Unschärferelation genannt. Sie unterscheidet sich jedoch grundsätzlich von den drei anderen Unschärferelatio nen für die kartesischen Komponenten von R und P, s. die Beziehungen (14) in Ergän zung FI . In (D-69) ist nur die Energie eine physikalische Größe wie R und P. Die Zeit t ist dagegen ein Parameter, dem in der Quantenmechanik kein Operator entspricht.
E Superpositionsprinzip und Vorhersagen Wir untersuchen jetzt den physikalischen Gehalt des ersten Postulats, wonach die Zu stände eines Systems Elemente eines Vektorraums sind und daher linear überlagert werden können. Eine wichtige Konsequenz aus diesem Postulat (in Gemeinschaft mit den anderen) ist das Auftreten von Interferenzeffekten, die uns bereits in Kapitel I zum Welle-Teil chen-Dualismus führten. Ein Verständnis dieser Phänomene basiert auf dem Begriff der Wahrscheinlichkeitsamplitude, den wir hier präzisieren und auf einige einfache Beispiele anwenden wollen.
E Superpositionsprinzip und Vorhersagen
| 247
E-1 Wahrscheinlichkeitsamplitude und Interferenzeffekte E-1-a Physikalische Bedeutung der Superposition α Superposition und statistisches Gemisch Es seien |ψ1 ⟩ und |ψ2 ⟩ zwei normierte und orthogonale Zustände ⟨ψ1 |ψ1 ⟩ = ⟨ψ2 |ψ2 ⟩ = 1 ⟨ψ1 |ψ2 ⟩ = 0
(E-1)
Dies können z. B. zwei Eigenzustände ein und derselben Observablen B zu den ver schiedenen Eigenwerten b 1 und b 2 sein. Ist das System im Zustand |ψ1 ⟩, so kann man sämtliche Vorhersagen über die Er gebnisse der Messung einer gegebenen Observablen A berechnen. Ist z. B. |u n ⟩ der (normierte) Eigenvektor von A zum (nichtentarteten) Eigenwert a n , so ist die Wahr scheinlichkeit, bei einer Messung von A den Wert a n zu erhalten, 𝒫1 (a n ) = |⟨u n |ψ1 ⟩|2
(E-2)
Für den Zustand |ψ2 ⟩ haben wir entsprechend 𝒫2 (a n ) = |⟨u n |ψ2 ⟩|2
(E-3)
Wir betrachten nun einen normierten Zustand |ψ⟩, der eine (lineare) Superposi tion von |ψ1 ⟩ und |ψ2 ⟩ darstellt: |ψ⟩ = λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩ |λ1 |2 + |λ2 |2 = 1
(E-4)
Befindet sich das System in einem derartigen Zustand, so sagt man häufig, es gebe eine Wahrscheinlichkeit |λ1 |2 , das System im Zustand |ψ1 ⟩ zu finden, und eine Wahr scheinlichkeit |λ2 |2 dafür, dass es im Zustand |ψ2 ⟩ ist. Die genaue Bedeutung dieser Sprechweise ist die folgende: |ψ1 ⟩ und |ψ2 ⟩ sind zwei (hier als normiert vorausge setzte) Eigenvektoren der Observablen B zu den verschiedenen Eigenwerten b 1 und b 2 . Die Wahrscheinlichkeit, bei einer Messung von B den Wert b 1 zu erhalten, ist |λ1 |2 und die, den Wert b 2 zu finden, |λ2 |2 . Dies könnte (wie wir sehen werden fälschlicherweise) zu der Auffassung verlei ten, dass ein Zustand wie der in (E-4) ein statistisches Gemisch der Zustände |ψ1 ⟩ und |ψ2 ⟩ mit den Gewichten |λ1 |2 und |λ2 |2 sei. Betrachtet man mit anderen Worten eine große Zahl N identischer Systeme, die alle im Zustand |ψ⟩ [Gl. (E-4)] sind, so könnte man sich eine vollständige Äquivalenz zwischen einem Ensemble von N Systemen in diesem Zustand und einem weiteren Ensemble vorstellen, das aus N|λ1 |2 Systemen im Zustand |ψ1 ⟩ und N|λ2 |2 Systemen im Zustand |ψ2 ⟩ besteht. Eine derartige Interpre tation des Zustands |ψ⟩ führt zu falschen physikalischen Aussagen. Wir nehmen an, das System befinde sich in dem durch (E-4) gegebenen Zustand |ψ⟩ und fragen nach der Wahrscheinlichkeit 𝒫(a n ), bei einer Messung der Observa blen A an diesem System den Eigenwert a n zu erhalten. Wenn wir den Zustand |ψ⟩ als
248 | III Die Postulate der Quantenmechanik ein statistisches Gemisch aus den Zuständen ψ1 und ψ2 mit den Gewichten |λ1 |2 und |λ2 |2 ansehen, so sollte 𝒫(a n ) gleich der gewichteten Summe aus den Wahrschein lichkeiten 𝒫1 (a n ) und 𝒫2 (a n ), gegeben durch (E-2) und (E-3), sein: ?
𝒫(a n ) = |λ1 |2 𝒫1 (a n ) + |λ2 |2 𝒫2 (a n )
(E-5)
Nun geben aber die Postulate der Quantenmechanik eindeutig vor, wie die Wahr scheinlichkeit 𝒫(a n ) berechnet werden muss. Danach lautet der richtige Ausdruck für diese Wahrscheinlichkeit 𝒫(a n ) = |⟨u n |ψ⟩|2
(E-6)
ist also gleich dem Betragsquadrat der Wahrscheinlichkeitsamplitude ⟨u n |ψ⟩. Nach Gl. (E-4) ist sie gleich der Summe ⟨u n |ψ⟩ = λ1 ⟨u n |ψ1 ⟩ + λ2 ⟨u n |ψ2 ⟩
(E-7)
womit wir für 𝒫(a n ) zunächst erhalten 𝒫(a n ) = |λ1 ⟨u n |ψ1 ⟩ + λ2 ⟨u n |ψ2 ⟩|2 = |λ1 |2 |⟨u n |ψ1 ⟩|2 + |λ2 |2 |⟨u n |ψ2 ⟩|2 + 2 Re{λ1 λ∗2 ⟨u n |ψ1 ⟩⟨u n |ψ2 ⟩∗ }
(E-8)
Berücksichtigen wir Gl. (E-2) und Gl. (E-3), so ist schließlich der korrekte Ausdruck 𝒫(a n ) = |λ1 |2 𝒫1 (a n ) + |λ2 |2 𝒫2 (a n ) + 2 Re{λ1 λ∗2 ⟨u n |ψ1 ⟩⟨u n |ψ2 ⟩∗ }
(E-9)
Dieses Ergebnis unterscheidet sich von der Angabe in Gl. (E-5). Daher darf man den Zustand |ψ⟩ nicht als ein statistisches Gemisch auffassen: Bei einer derartigen Inter pretation würden alle Interferenzeffekte verloren gehen, wie sie in dem doppelten ge mischten Produkt in (E-9) enthalten sind. Man sieht, dass nicht nur die Beträge von λ1 und λ2 eine Rolle spielen, die relative Phase⁷ von λ1 und λ2 ist genauso wichtig, weil sie über den Term λ1 λ∗2 explizit in die Vorhersagen eingeht. β Ein Beispiel Für Photonen, die sich in z-Richtung ausbreiten, werde der Polarisationszustand durch den Einheitsvektor (Abb. 5) 1 e= (E-10) (ex + ey ) √2 gegeben. Es handelt sich um eine (lineare) Überlagerung zweier orthogonaler Polarisati onszustände und beschreibt Licht, das unter 45° gegenüber der x-Richtung linear po larisiert ist. Es wäre nun falsch anzunehmen, dass N Photonen im Zustand e äquiva
7 Die Multiplikation von |ψ⟩ mit einem globalen Phasenfaktor eiθ würde λ 1 und λ 2 in λ 1 eiθ und λ 2 eiθ umändern. Man erkennt dann an Gl. (E-9), dass dadurch die physikalischen Aussagen nicht modifi ziert werden: Sie hängen nur von |λ 1 |2 , |λ 2 |2 und λ 1 λ ∗2 ab.
E Superpositionsprinzip und Vorhersagen
|
249
Abb. 5: Ein einfaches Experiment zur Unterscheidung zwischen einer Superposition und einem Ge misch von Zuständen. Sind alle Photonen im Zustand mit der Polarisation e = √1 (ex +ey ), so gelangt 2
kein Photon durch einen Analysator, dessen Polarisationsrichtung e senkrecht auf e steht. Handelt es sich dagegen um ein statistisches Gemisch von Photonen, die mit gleichen Anteilen in x- bzw. in y-Richtung polarisiert sind (natürliches Licht), so durchquert die Hälfte von ihnen den Analysator.
lent zu einem Gemisch von N × | √1 |2 = N2 Photonen im Zustand ex und N × | √1 |2 = N2 2 2 im Zustand ey seien. Stellt man nämlich einen Analysator in den Lichtstrahl, dessen Polarisationsrichtung e auf e senkrecht steht, so weiß man, dass keines der N Photo nen im Zustand e diesen Analysator passieren würde. Bei einem statistischen Gemisch von N/2 Photonen im Zustand ex und N/2 Photonen im Zustand ey würde dagegen der Analysator die Hälfte der Photonen hindurchtreten lassen. An diesem konkreten Beispiel erkennt man deutlich den physikalischen Unter schied zwischen einer Superposition wie in (E-10), die zu polarisiertem Licht gehört (mit einer Polarisationsrichtung, die zur x-Richtung unter 45° geneigt ist), und einem statistischen Gemisch mit gleichen Polarisationsanteilen in x- bzw. y-Richtung, das natürlichem und somit unpolarisiertem Licht entspricht. Auch von der Bedeutung des relativen Phasenunterschieds zwischen den Ent wicklungskoeffizienten des Zustandsvektors kann man sich ein Bild machen. Wir be trachten die folgenden vier Polarisationszustände 1 (ex √2 1 (ex e2 = √2 1 (ex e3 = √2 1 (ex e4 = √2
e1 =
+ ey )
(E-11)
− ey )
(E-12)
+ iey )
(E-13)
− iey )
(E-14)
die sich nur durch die relative Phase der Koeffizienten unterscheiden (0, π, +π/2, −π/2). Diese vier Zustände sind physikalisch verschieden: Die beiden ersten reprä sentieren Licht, das entlang der Winkelhalbierenden zwischen der x- und der y-Rich tung linear polarisiert ist, die beiden anderen beschreiben (rechts bzw. links) zirkular polarisiertes Licht.
250 | III Die Postulate der Quantenmechanik
E-1-b Summation über Zwischenzustände α Vorhersage der Messergebnisse bei zwei einfachen Versuchen Erster Versuch: Nehmen wir an, wir hätten zu einem bestimmten Zeitpunkt an einem physikalischen System die Observable A beobachtet und den (nichtentarteten) Eigen wert a gemessen. Ist |u a ⟩ der zu a gehörende Eigenvektor, so befindet sich das System unmittelbar nach der Messung in diesem Zustand |u a ⟩. Noch bevor sich das System entwickeln kann, messen wir eine weitere Observa ble C, die mit A nicht vertauscht. Mit den in § C-6-a eingeführten Notationen bezeich nen wir mit 𝒫a (c) die Wahrscheinlichkeit, dass wir bei dieser zweiten Messung den Wert c erhalten. Unmittelbar vor der Messung von C ist das System im Zustand |u a ⟩. Ist dann |v c ⟩ der Eigenvektor von C zum Eigenwert c (dieser sei ebenfalls nichtentartet), so gilt nach den quantenmechanischen Postulaten 𝒫a (c) = |⟨v c |u a ⟩|2
(E-15)
Zweiter Versuch: Bei ihm werden nacheinander so rasch drei nicht miteinander vertauschende Observable A, B und C gemessen, dass sich das System in der Zeit zwischen zwei Messungen nicht ändern kann. Mit 𝒫a (b, c) bezeichnen wir die Wahr scheinlichkeit dafür, dass das Ergebnis der zweiten Messung b und das der dritten c ist, falls die erste Messung a ergab. Diese Wahrscheinlichkeit ist gleich dem Produkt aus 𝒫a (b) (das ist die Wahrscheinlichkeit, mit der man bei einer Messung von B den Wert b findet, falls man bei der Messung von A den Wert a erhalten hat) und 𝒫b (c) (der Wahrscheinlichkeit, mit der man bei einer Messung von C den Wert c erhält, falls die Messung von B den Wert b lieferte): 𝒫a (a, b) = 𝒫a (b) 𝒫b (c)
(E-16)
Sind die Eigenwerte von B nichtentartet und |w b ⟩ die zugehörigen Eigenvektoren, so ergibt sich schließlich 𝒫a (b, c) = |⟨v c |w b ⟩|2 |⟨w b |u a ⟩|2
(E-17)
β Unterscheidung der beiden Versuche Bei beiden Versuchen ist nach der Messung der Observablen A das System im Zu stand |u a ⟩, dem Anfangszustand, und nach der letzten Messung, also der Beobach tung von C, im Zustand |v c ⟩, dem Endzustand. In beiden Fällen kann man den Zustand des Systems kurz vor der Messung von C nach den Eigenvektoren |w b ⟩ der Observa blen B zerlegen und sagen, dass das System zwischen dem Zustand |u a ⟩ und dem Zustand |v c ⟩ verschiedene Zwischenzustände passieren kann. Jeder dieser Zwischen zustände bestimmt einen möglichen „Weg“ zwischen dem Anfangszustand |u a ⟩ und dem Endzustand |v c ⟩, s. Abb. 6. Zwischen den beiden Versuchen besteht jedoch ein Unterschied. Beim ersten wird der Weg, auf dem das System vom Zustand |u a ⟩ in den Zustand |v c ⟩ gelangt, expe rimentell nicht bestimmt (man misst nur die Wahrscheinlichkeit 𝒫a (c), mit der das
E Superpositionsprinzip und Vorhersagen
|
251
Abb. 6: Verschiedene mögliche „Wege“ des Zustandsvektors des Systems, wenn dieses sich frei (ohne einer Messung unterworfen zu sein) zwischen dem Anfangszustand |u a ⟩ und dem Endzustand |v c ⟩ entwickelt. In diesem Fall muss man diesen Wegen die Wahrscheinlichkeitsamplituden und nicht die Wahrscheinlichkeiten zuordnen.
System vom Zustand |u a ⟩ in den Zustand |v c ⟩ gelangt). Beim zweiten Versuch wird dagegen dieser Weg durch die Messung der Observablen B festgelegt, denn mit dieser Messung kann man die Wahrscheinlichkeit 𝒫a (b, c) erhalten, mit der das System vom Zustand |u a ⟩ über einen gegebenen Zwischenzustand |w b ⟩ schließlich in den Endzu stand |v c ⟩ übergeht. Man könnte nun versucht sein, zwischen 𝒫a (c) und 𝒫a (b, c) auf folgende Weise einen Zusammenhang herzustellen: Beim ersten Versuch kann das System „frei“ al le Zwischenzustände |w b ⟩ durchlaufen. Danach sollte die Gesamtwahrscheinlichkeit 𝒫a (c) gleich der Summe aller Wahrscheinlichkeiten 𝒫a (b, c) für die verschiedenen möglichen „Wege“ sein: ?
𝒫a (c) = ∑ 𝒫a (b, c)
(E-18)
b
Wie wir sehen werden, ist diese Beziehung falsch. Wenn wir nämlich in Gl. (E-15) unter Verwendung der Vollständigkeitsrelation für die Wahrscheinlichkeitsamplitude ⟨v c |u a ⟩ = ∑⟨v c |w b ⟩⟨w b |u a ⟩
(E-19)
b
schreiben und dies in Gl. (E-15) einsetzen: 2 𝒫a (c) = ∑⟨v c |w b ⟩⟨w b |u a ⟩ b 2 = ∑ |⟨v c |w b ⟩| |⟨w b |u a ⟩|2 + ∑ ∑ ⟨v c |w b ⟩⟨w b |u a ⟩⟨v c |w b ⟩∗ ⟨w b |u a ⟩∗ (E-20) b b =b ̸
b
so erhalten wir unter Beachtung von Gl. (E-17) schließlich 𝒫a (c) = ∑ 𝒫a (b, c) + ∑ ∑ ⟨v c |w b ⟩⟨w b |u a ⟩⟨v c |w b ⟩∗ ⟨w b |u a ⟩∗ b
b b =b ̸
(E-21)
252 | III Die Postulate der Quantenmechanik
Ein Vergleich mit Gl. (E-18) zeigt, dass bei dieser alle „gemischten“ Terme, die beim Quadrieren der Summe [Gl. (E-19)] auftreten, fehlen. Es werden also in Gl. (E-18) sämtli che Interferenzeffekte zwischen den verschiedenen möglichen Wegen vergessen. Glei chung (E-18) ist falsch. Um daher einen Zusammenhang zwischen den beiden Versuchen herstellen zu können, muss man von den Wahrscheinlichkeitsamplituden ausgehen: Wenn man nicht durch einen zusätzlichen Versuch bestimmt, durch welchen Zwischenzustand das System gegangen ist, so müssen die Amplituden und nicht die Wahrscheinlich keiten addiert werden. Der Fehler bei der Begründung von Gl. (E-18) wird übrigens deutlich, wenn man das fünfte Postulat über die Reduktion von Wellenpaketen korrekt anwendet. Nach diesem Postulat kann man die Observable B nur messen, indem man das System in der Weise stört, dass sein Zustandsvektor einer plötzlichen und groben Änderung un terworfen wird (Projektion auf einen Zustand |w b ⟩). Diese unvermeidbare Störung ist für das Verschwinden der Interferenzterme verantwortlich. Dagegen ist es beim ersten Versuch streng genommen falsch, zu sagen, das System „passiere den einen oder an deren Zustand |w b ⟩ “. Genauer müsste man sich so ausdrücken, dass es alle Zustände |w b ⟩ zugleich durchlaufe. Bemerkungen: 1. Die vorstehende Diskussion erinnert in allen Punkten an unsere Überlegungen im Zusammen hang mit dem Versuch von Young, s. Kap. I, § A-2-a. Zur Bestimmung der Wahrscheinlichkeit, dass ein von der Quelle ausgesandtes Photon auf einem gegebenen Punkt M des Schirms auftrifft, muss man zunächst das gesamte elektrische Feld in M berechnen. Das elektrische Feld spielt dabei die Rolle einer Wahrscheinlichkeitsamplitude. Wenn man bestimmen will, durch welchen Spalt das Photon gelangt ist, so sind es die durch die Spalte hindurchtretenden elektrischen Strahlungsfelder und nicht ihre Intensitäten, die man zur Ermittlung des Gesamtfeldes in M ad dieren muss (sein Quadrat liefert dann die gesuchte Wahrscheinlichkeit). Das durch einen Spalt gehende Strahlungsfeld repräsentiert im Punkt M die Amplitude dafür, dass ein von der Quelle ausgesandtes Photon durch diesen Spalt gegangen ist, bevor es den Punkt M erreicht. 2. Man kann sich leicht von der Bedingung befreien, nach der die Messungen von A und von C beim ersten Versuch und die von A, B und C beim zweiten Versuch zeitlich sehr nahe aufeinander folgen. Entwickelt sich das System zwischen zwei Messungen, so genügt es, mit der Schrödin ger-Gleichung diese Änderung zu berechnen (s. Ergänzung FIII , Bemerkung 2 in § 2).
E-1-c Die Bedeutung der Wahrscheinlichkeitsamplitude Die eben behandelten Beispiele machen deutlich, wie wichtig der Begriff der Wahr scheinlichkeitsamplitude ist. Die Gleichungen (E-5) und (E-18) sind ebenso wie die zu ihnen führenden Begründungen nicht korrekt, weil man eine Wahrscheinlichkeit zu berechnen sucht, ohne zunächst auf die Wahrscheinlichkeitsamplitude einzugehen. In beiden Fällen stellt sich der richtige Ausdruck in Form einer Quadratsumme dar (genauer eines Betragsquadrats dieser Summe), während Gl. (E-5) bzw. Gl. (E-18) nur eine Summe von Quadraten aufweist (die für die Interferenzeffekte verantwortlichen gemischten Terme werden dabei vergessen).
E Superpositionsprinzip und Vorhersagen
1.
2.
3.
| 253
Wir halten somit fest: Die Wahrscheinlichkeitsaussagen der Quantentheorie erhält man stets, wenn man von den Wahrscheinlichkeitsamplituden ausgeht und dann deren Betrags quadrat bildet. Wenn man bei einem bestimmten Experiment keine Messung in einem Zwischen stadium ausführen will, so darf man nie von den Wahrscheinlichkeiten schließen, mit denen man bei einer entsprechenden Messung die verschiedenen Resultate erhalten könnte, sondern immer von den zugehörigen Wahrscheinlichkeitsampli tuden. Weil die Zustände eines physikalischen Systems (linear) superponiert werden können, stellt sich eine Wahrscheinlichkeitsamplitude häufig in Form einer Sum me von Teil- oder Partialamplituden dar. Die zugehörige Wahrscheinlichkeit ist dann gleich dem Betragsquadrat einer Summe, und die verschiedenen Teilampli tuden interferieren miteinander.
E-2 Zusammenhang zwischen Zuständen und Messergebnis Wiederholt haben wir betont, dass durch die quantenmechanischen Postulate in be stimmten Fällen die Wahrscheinlichkeit eines Ereignisses in Form des Betragsquadrats einer Summe von Termen gegeben ist. Nun tritt im vierten Postulat [Gl. (B-7)] eine Sum me von Betragsquadraten auf, wenn das Messergebnis, für das man die Wahrschein lichkeit angeben will, zu einem entarteten Eigenwert gehört. Das ist jedoch kein Wider spruch, vielmehr ergänzen sich die beiden Regeln: Jeder Summand in Gl. (B-7) kann nämlich selbst das Betragsquadrat einer Summe sein. Dies wollen wir genauer fassen und dabei gleichzeitig die Angabe der Postulate vervollständigen. Wir werden weiter Messapparaturen mit endlicher Genauigkeit untersuchen, so wie sie in der Realität immer vorliegen, werden weiter sehen, wie die theoretischen Vorhersagen über die möglichen Ergebnisse berechnet werden, und erweitern schließlich das fünfte Postu lat über die Reduktion eines Wellenpakets auf den Fall der kontinuierlichen Spektren. E-2-a Entartete Eigenwerte Bei den in § E-1 behandelten Beispielen haben wir immer vorausgesetzt, dass die Mess ergebnisse einfache Eigenwerte der entsprechenden Observablen sind. Diese Voraus setzung diente lediglich der Vereinfachung, weil wir den Ursprung der Interferenzef fekte besonders deutlich herausstellen wollten. Wir betrachten jetzt einen entarteten Eigenwert a n einer Observablen A. Die zu a n gehörenden Eigenvektoren bilden einen Unterraum mit der Dimension g n , in dem man eine orthonormierte Basis {|u in ⟩; i = 1, 2, . . . , g n } wählen kann. Die Diskussion in § C-6-b über die Präparation eines Zustands hat gezeigt, dass man mit der Kenntnis des Messergebnisses a n noch nicht weiß, in welchem Zustand sich das System nach dieser Messung befindet: Zum selben Messwert a n kann es meh
254 | III Die Postulate der Quantenmechanik
rere Endzustände geben. Bei gegebenem Anfangszustand (dem Zustand vor der Mes sung) ist der Zustand nach der Messung vollständig bestimmt. Ändert man aber den Anfangszustand, gelangt man im Allgemeinen zu einem anderen Endzustand (für das selbe Messergebnis a n ). Alle zu a n gehörenden Endzustände sind Linearkombinatio nen aus den g n orthonormierten Vektoren |u in ⟩ mit i = 1, 2, . . . , g n . Durch Gl. (B-7) ist eindeutig festgelegt, wie man die Wahrscheinlichkeit 𝒫(a n ) da für findet, dass bei einer Messung von A an einem System im Zustand |ψ⟩ das Ergeb nis a n herauskommt: Man wählt im Eigenraum von a n eine orthonormierte Basis, z. B. {|u in ⟩; i = 1, 2, . . . , g n } und berechnet dann die Wahrscheinlichkeit |⟨u in |ψ⟩|2 , mit der man das System in jedem Zustand finden kann; 𝒫(a n ) ist dann die Summe dieser Wahrscheinlichkeiten. Dabei darf man jedoch nicht vergessen, dass jede Wahrschein lichkeit |⟨u in |ψ⟩|2 das Betragsquadrat einer Summe sein kann. Nehmen wir z. B. den Fall aus § E-1-a-α und machen jetzt die Annahme, dass der Eigenwert a n der Observa blen A, für den wir die Wahrscheinlichkeit 𝒫(a n ) berechnen wollen, g n -fach entartet ist, so muss Gl. (E-6) durch die Beziehung gn
𝒫(a n ) = ∑ |⟨u in |ψ⟩|2
(E-22)
i=1
mit ⟨u in |ψ⟩ = λ1 ⟨u in |ψ1 ⟩ + λ2 ⟨u in |ψ2 ⟩
(E-23)
ersetzt werden. Damit ist |⟨u in |ψ⟩|2 das Betragsquadrat einer Summe und 𝒫(a n ) die Summe dieser Quadrate. Entsprechend verallgemeinert man die Überlegungen in § E-1-b über die Rolle von Zwischenzuständen auf den Fall, bei dem die Eigenwerte der gemessenen Observablen entartet sind. Bevor wir die vorstehende Diskussion zusammenfassen, gehen wir auf eine an dere wichtige Situation ein, bei der mehrere Endzustände zum selben Messergebnis gehören. E-2-b Apparaturen mit unvollständiger Selektivität α Definition Wir wollen zur Messung der Observablen A an einem physikalischen System eine Ap paratur mit den folgenden Eigenschaften verwenden: 1. Sie kann nur zwei verschiedene Anzeigen⁸ liefern, die wir mit „Ja“ und „Nein“ bezeichnen. 2. Befindet sich das System in einem Eigenzustand von A, für den der zugehörige Ei genwert in einem bestimmten Intervall ∆ der reellen Achse liegt, so ist die Anzei ge mit Sicherheit „Ja“. Dies soll auch der Fall sein, wenn der Zustand des Systems 8 Die folgenden Überlegungen können leicht auf Fälle verallgemeinert werden, bei denen mehr als zwei verschiedene Anzeigen möglich sind und die ähnliche Eigenschaften wie die unter 2. und 3. an geführten besitzen.
E Superpositionsprinzip und Vorhersagen
3.
|
255
eine beliebige Linearkombination aus Eigenzuständen von A zu Eigenwerten aus dem Intervall ∆ ist. Ist der Zustand des Systems ein Eigenzustand von A mit einem Eigenwert außer halb des Intervalls ∆ oder eine Linearkombination derartiger Eigenzustände, so soll die Antwort der Apparatur mit Sicherheit „Nein“ sein.
Die Zahl ∆ charakterisiert das Auflösungsvermögen der betrachteten Messapparatur. Gibt es im Intervall ∆ nur einen Eigenwert a n von A, so verhält sich die Apparatur so, wie wenn dieses Auflösungsvermögen unendlich wäre: Befindet sich das System in einem beliebigen Zustand, so ist die Wahrscheinlichkeit 𝒫(Ja), die Antwort „Ja“ zu erhalten, gleich der Wahrscheinlichkeit, bei einer Messung von A den Wert a n zu finden; die Wahrscheinlichkeit 𝒫(Nein), mit der man die Anzeige „Nein“ erhält, ist offensichtlich 1−𝒫(Ja). Enthält dagegen ∆ mehrere Eigenwerte von A, so ist das Auflösungsvermögen der Apparatur nicht ausreichend, um diese verschiedenen Eigenwerte zu unterschei den: Wir sagen dann, sie sei von unvollständiger Selektivität. Wir wollen sehen, wie man in diesem Fall die Wahrscheinlichkeiten 𝒫(Ja) und 𝒫(Nein) berechnet. Um die Störung untersuchen zu können, die das System durch eine derartige Messung erfährt, fügen wir noch die weitere Annahme hinzu: Ohne Störung lasse die Appara tur die Eigenzustände passieren, die zu Eigenwerten innerhalb des Intervalls ∆ von A gehören (oder Linearkombinationen solcher Eigenzustände); sie „blockiere“ aber die Eigenzustände von A, die zu Werten außerhalb des Intervalls ∆ gehören (oder entspre chende Linearkombinationen). Die Apparatur verhält sich also für alle dem Intervall ∆ zugeordneten Zustände wie ein vollkommener Filter. β Beispiel Die in der Praxis verwendeten Messapparaturen sind meist von endlicher Selektivität. Zur Messung der x-Koordinate eines Elektrons, das sich in z-Richtung bewegt, kann man z. B. eine senkrecht auf dieser Richtung stehende und mit einem Spalt parallel zur y-Richtung versehene Platte verwenden, s. Abb. 7. Die Spaltgrenzen mögen bei x1 und x2 liegen. Man sieht dann, dass jedes Wellenpaket, das vollständig zwischen den Ebenen x = x1 und x = x2 konzentriert ist (also eine Überlagerung von Eigenzustän den von X zu Eigenwerten x, die im Intervall [x1 , x2 ] liegen), in den rechts vom Spalt befindlichen Bereich gelangt (Antwort: „Ja“) und dabei keine Modifizierung erfährt. Dagegen wird jedes Paket außerhalb der Ebene x = x1 oder x = x2 von der Platte abgeschirmt werden und nicht nach rechts kommen (Antwort: „Nein“).
Abb. 7: Schema zur Messung der x-Koordinate eines Teilchens. Die Länge des Intervalls [x1 , x2 ] muss ungleich null und die Apparatur von endlicher Selektivität sein.
256 | III Die Postulate der Quantenmechanik γ Quantenmechanische Beschreibung Bei einer Apparatur von endlicher Selektivität kann es nach einer Messung mit dem Resultat „Ja“ mehrere Endzustände geben, so z. B. die zu den verschiedenen Eigen werten im Intervall ∆ gehörenden Eigenzustände von A. Bei einer solchen Apparatur stellt sich nun die Frage, wie man ihre Antwort vor hersagen kann, wenn man durch sie ein System in einem beliebigen Zustand schickt. Was geschieht z. B. bei einer Anordnung wie der in Abb. 7, wenn man es mit einem Paket zu tun hat, das weder vollständig zwischen den Ebenen x = x1 und x = x2 konzentriert ist (und bei dem die Anzeige mit Sicherheit „Ja“ sein wird), noch völlig außer halb dieses Bereichs liegt (so dass die Antwort mit Sicherheit „Nein“ ist)? Wir zeigen, dass man sich hier auf den Fall der Messung einer Observablen mit entartetem Spek trum beziehen kann. Betrachten wir nämlich den Unterraum H∆ , der von allen Eigenzuständen von A zu den Eigenwerten a n aufgespannt wird, die im Intervall ∆ liegen, so lautet der Projektor P ∆ auf diesen Unterraum nach § B-3-b-γ von Kap. II gn
P ∆ = ∑ ∑ |u in ⟩⟨u in |
(E-24)
a n ∈∆ i=1
(die Eigenwerte a n aus dem Intervall ∆ können entartet sein; die Vektoren |u in ⟩ sei en orthonormiert). Der Unterraum H∆ wird von allen nach einer Messung möglichen Systemzuständen gebildet, wenn das Resultat „Ja“ ergab. Beachtet man die Definition der Messapparatur, so sieht man, dass die Antwort für jeden Zustand aus H∆ mit Sicherheit „Ja“ sein wird, d. h. für jeden Eigenzustand von P ∆ zum Eigenwert +1. Mit Sicherheit wird sie dagegen für jeden Zustand aus dem zu H∆ komplementären Raum „Nein“ sein, d. h. für jeden Eigenzustand von P ∆ zum Eigenwert 0. Die beiden möglichen Antworten „Ja“ und „Nein“, die die Apparatur ge ben kann, entsprechen also den Eigenwerten +1 und 0 der Observablen P ∆ . Dies kann man so umschreiben, dass die Apparatur eher die Observable P ∆ als die Observable A misst. Aufgrund dieser Interpretation kann ein Apparat mit unvollständiger Selektivität im Rahmen der von uns aufgestellten Postulate behandelt werden. Die Wahrschein lichkeit 𝒫(Ja), die Antwort „Ja“ zu erhalten, ist gleich der Wahrscheinlichkeit, den (entarteten) Eigenwert +1 von P ∆ zu finden. Nun kennen wir für den zugehörigen Eigenraum eine orthonormierte Basis: Sie wird von den Eigenzuständen |u in ⟩ von A zu den im Intervall ∆ liegenden Eigenwerten gebildet. Die Anwendung von Gl. (B-7) auf die Observable P ∆ und den Eigenwert +1 ergibt für ein System im Zustand |ψ⟩ gn
𝒫(Ja) = ∑ ∑ |⟨u in |ψ⟩|2
(E-25)
a n ∈∆ i=1
Weil nur zwei Antworten möglich sind, gilt offensichtlich 𝒫(Nein) = 1 − 𝒫(Ja)
(E-26)
E Superpositionsprinzip und Vorhersagen
| 257
Der Projektor auf den zum Eigenwert +1 gehörenden Eigenraum der Observablen P ∆ ist P ∆ selbst. Gl. (B-14) lautet hier somit 𝒫(Ja) = ⟨ψ|P ∆ |ψ⟩
(E-27)
eine zur Gl. (E-25) äquivalente Beziehung. Weil weiter die Apparatur die zu H∆ gehörenden Zustände nicht stört und die Zu stände aus dem komplementären Raum blockiert, ist der Zustand des Systems nach einer Messung mit dem Resultat „Ja“ |ψ ⟩ =
1 gn
√ ∑ ∑ |⟨u in |ψ⟩|2
gn
∑ ∑ |u in ⟩⟨u in |ψ⟩
(E-28)
a n ∈∆ i=1
a n ∈∆ i=1
d. h. |ψ ⟩ =
1 P ∆ |ψ⟩ √⟨ψ|P ∆ |ψ⟩
(E-29)
Enthält ∆ nur einen einzigen Eigenwert a n , so reduziert sich P ∆ auf P n : Gl. (B-14) und Gl. (B-31) sind danach Sonderfälle von Gl. (E-27) und Gl. (E-29). E-2-c Zusammenfassung Es gibt also sowohl Fälle (§ E-1), bei denen man zur Berechnung der Wahrscheinlich keit das Quadrat einer Summe bilden muss, weil man mehrere Wahrscheinlichkeits amplituden zu addieren hat, wie auch Fälle (§ E-2), bei denen eine Summe von Quadra ten zu berechnen ist, weil man mehrere Wahrscheinlichkeiten addieren muss. Diese verschiedenen Fälle dürfen keinesfalls verwechselt werden, und man muss in einer bestimmten Situation stets wissen, ob nun Wahrscheinlichkeitsamplituden oder die Wahrscheinlichkeiten selbst addiert werden müssen. Der Spaltversuch von Young ist ein einleuchtendes Beispiel zur Illustration un serer Überlegungen. Wir nehmen hierzu an, dass wir die Wahrscheinlichkeit dafür berechnen wollen, dass ein Photon zwischen den Punkten M1 und M2 mit den Ab szissen x1 bzw. x2 auf der Platte auftrifft, s. Abb. 8. Diese Wahrscheinlichkeit ist zur Lichtintensität proportional, die insgesamt von diesem Teil der Platte aufgenommen wird. Sie ist damit eine „Summe von Quadraten“, genauer das Integral über die In tensität I(x) zwischen x1 und x2 , die ihrerseits proportional zum Betragsquadrat der elektrischen Feldstärke E(x) ist. Diese wiederum ist gleich der Summe der elektrischen Felder E A (x) und E B (x), die von den Spalten A und B zum Punkt M gelangen. Damit ist I(x) proportional zum Betragsquadrat einer Summe. E A (x) und E B (x) sind die zu den beiden Wegen QAM und QBM gehörenden Amplituden. Man fügt sie zur Am plitude in M zusammen, weil man nicht zu bestimmen versucht, durch welchen Spalt das Photon gegangen ist. Zur Berechnung der insgesamt zwischen M1 und M2 auftref fenden Lichtintensität addiert man schließlich die Intensitäten in den verschiedenen Punkten dieses Intervalls.
258 | III Die Postulate der Quantenmechanik
Abb. 8: Youngscher Spaltversuch. Zur Berechnung der Wahrscheinlichkeitsdichte für das Auftreffen eines Photons im Punkt M, muss man die von Spalt A und Spalt B ausgehenden elektrischen Felder addieren und das so erhaltene Gesamtfeld quadrieren („Quadrat der Summe“). Die Wahrscheinlich keit dafür, im Intervall [x1 , x2 ] ein Photon nachzuweisen, erhält man dann durch Integration dieser Wahrscheinlichkeitsdichte („Summe von Quadraten“).
Man kann unsere Überlegungen schematisch etwa so zusammenfassen: Es müssen zunächst die Amplituden addiert werden, die zum selben Endzustand gehören, dann addiert man die Wahrscheinlichkeiten für die orthogonalen Endzu stände.
E-2-d Kontinuierliche Spektren Besitzt die zu messende Observable ein kontinuierliches Spektrum, so kann man über haupt nur Apparaturen mit endlicher Selektivität verwenden: Wir können uns keine physikalische Vorrichtung ausdenken, die aus einem Kontinuum einen einzigen Ei genwert isolieren kann. α Beispiel: Messung des Teilchenorts Es sei ψ(r) = ⟨r|ψ⟩ die Wellenfunktion eines (spinlosen) Teilchens. Wie groß ist dann die Wahrscheinlichkeit, mit Hilfe einer Vorrichtung wie in Abb. 7 die Abszisse dieses Teilchens im Intervall [x1 , x2 ] zu finden? Der zu diesem Messergebnis gehörende Unterraum H∆ wird von den Kets |r⟩ = |x, y, z⟩ aufgespannt, für die x1 ≤ x ≤ x2 ist. Sind diese im verallgemeiner ten Sinn orthonormiert, so erhalten wir x2
+∞
+∞
𝒫(x1 ≤ x ≤ x2 ) = ∫ dx ∫ dy ∫ dz |⟨x, y, z|ψ⟩|2 x1
−∞
−∞
x2
+∞
+∞
= ∫ dx ∫ dy ∫ dz |ψ(r)|2 x1
−∞
−∞
(E-30)
E Superpositionsprinzip und Vorhersagen
|
259
Zum selben Ergebnis gelangen wir, wenn wir von Gl. (E-27) ausgehen. Der Projek tor lautet hier x2
+∞
+∞
P ∆ = ∫ dx ∫ dy ∫ dz |x, y, z⟩⟨x, y, z| x1
−∞
(E-31)
−∞
womit wir wieder haben 𝒫(x1 ≤ x ≤ x2 ) = ⟨ψ|P ∆ |ψ⟩ x2
+∞
+∞
= ∫ dx ∫ dy ∫ dz ⟨ψ|x, y, z⟩⟨x, y, z|ψ⟩ x1
−∞
(E-32)
−∞
Zur Kenntnis des Zustands |ψ ⟩ des Teilchens nach einer Messung mit dem Resultat „Ja“ genügt die Anwendung von Gl. (E-29): |ψ ⟩ = =
1 P ∆ |ψ⟩ N x2
+∞
+∞
x1
−∞
−∞
1 ∫ dx ∫ dy ∫ dz |x , y , z ⟩⟨x , y , z |ψ⟩ N
(E-33)
worin der Normierungsfaktor N = √⟨ψ|P ∆ |ψ⟩ bekannt ist, s. Gl. (E-32). Wir berechnen die zum Ket |ψ ⟩ gehörende Wellenfunktion ψ (r) = ⟨r|ψ ⟩. Zunächst ist x2
+∞
+∞
x1
−∞
−∞
1 ⟨r|ψ ⟩ = ∫ dx ∫ dy ∫ dz ⟨r|r ⟩ ψ(r ) N
(E-34)
Wegen ⟨r|r ⟩ = δ(r − r ) = δ(x − x )δ(y − y )δ(z − z ) kann die Integration über y und z sofort ausgeführt werden, man muss einfach im Integranden y durch y und z durch z ersetzen. Es verbleibt somit x2
ψ (x, y, z) =
1 ∫ dx δ(x − x ) ψ(x , y, z) N
(E-35)
x1
Liegt der Punkt x = x im Innern des Integrationsintervalls [x1 , x2 ], so ist das Resultat dasselbe wie bei der Integration über die gesamte x-Achse: ψ (x, y, z) =
1 ψ(x, y, z) N
für x1 ≤ x ≤ x2
(E-36)
Befindet sich dagegen x = x außerhalb dieses Intervalls, so ist die „Funktion“ δ(x−x ) für alle Werte x aus diesem Intervall gleich null, und es gilt ψ (x, y, z) = 0 für x > x2 und x < x1
(E-37)
Der Anteil von ψ(r), der zu dem von der Messvorrichtung akzeptierten Intervall gehört, findet sich unmittelbar nach der Messung ohne Deformation wieder (der Faktor 1/N
260 | III Die Postulate der Quantenmechanik sichert nur, dass ψ (r) normiert bleibt); der Rest wird unterdrückt. In gewisser Weise wird das den Anfangszustand repräsentierende Wellenpaket ψ(r) durch die Ränder des Spalts „abgeschnitten“. Bemerkungen: 1. An diesem Beispiel erkennt man die konkrete Bedeutung der „Reduktion des Wellenpakets“. 2. Schickt man nacheinander eine große Zahl von Teilchen, die sich alle im selben Zustand |ψ⟩ befinden, durch den Apparat, so wird man mit der Wahrscheinlichkeit 𝒫(Ja) das Resultat „Ja“ und mit der Wahrscheinlichkeit 𝒫(Nein) das Ergebnis „Nein“ erhalten. Ist die Antwort „Ja“, so setzt das Teilchen (ausgehend von dem „abgeschnittenen“ Zustand |ψ ⟩) seinen Weg fort. Ist die Antwort „Nein“, so wird das Teilchen vom Schirm absorbiert.
In unserem Beispiel steigt die Selektivität der Apparatur mit kleiner werdendem x2 − x1 . Weil das Spektrum von X aber kontinuierlich ist, kann man mit einer der artigen Apparatur nie eine vollkommene Selektivität erreichen. Wie eng der Spalt auch sein mag, das Intervall [x1 , x2 ] enthält stets unendlich viele Eigenwerte. Für den Grenzfall eines Spaltes mit der infinitesimalen Breite ∆x erhält man aber dennoch ein Äquivalent zur Gl. (B-17), mit der wir für ein kontinuierliches Spektrum das vierte Pos tulat formuliert hatten. Ist der Spalt um die Stelle x0 zentriert, so gilt x1 = x0 − ∆x 2 und x2 = x0 + ∆x . Setzen wir weiter voraus, dass sich ψ(r) im Intervall ∆ nur wenig ändert, 2 so können wir in Gl. (E-30) |ψ(r)|2 durch |ψ(x0 , y, z)|2 ersetzen und die Integration über x ausführen: +∞
𝒫 (x0 −
∆x 2
≤ x ≤ x0 +
∆x 2 )
+∞
≈ ∆x ∫ dy ∫ dz|ψ(x0 , y, z)|2 −∞
(E-38)
−∞
Die Wahrscheinlichkeit ist also wieder gleich dem Produkt aus ∆x und einer positiven Größe, die als eine Wahrscheinlichkeitsdichte im Punkt x0 zu deuten ist. Der Unter schied zur Gl. (B-17) beruht darauf, dass diese sich auf den Fall eines kontinuierlichen nichtentarteten Spektrums bezieht, während hier die Eigenwerte von X im Raum Hr unendlich oft entartet sind. Aus diesem Grund muss über y und z integriert werden (Summation über die Indizes, mit denen die Entartung beschrieben wird). β Reduktion des Wellenpakets für den Fall eines kontinuierlichen Spektrums In § B-3-c hatten wir uns bei der Formulierung des fünften Postulats auf den Fall ei nes diskreten Spektrums beschränkt. Die Diskussion der Gl. (E-33) zeigt uns, wie wir es auszudrücken haben, wenn wir uns für ein kontinuierliches Spektrum interessie ren: Es genügt, die Ergebnisse aus § E-2-b über Apparaturen mit endlicher Selektivität anzuwenden. Es sei A eine Observable mit einem (nichtentarteten) kontinuierlichen Spektrum. Mit den Bezeichnungen aus Abschnitt B-3-b-β gilt dann:
E Superpositionsprinzip und Vorhersagen
|
261
Liefert eine Messung von A an einem System im Zustand |ψ⟩ bis auf ein ∆α das Er gebnis α 0 , so wird der Zustand des Systems direkt nach der Messung durch |ψ ⟩ =
1 P ∆α (α 0 )|ψ⟩ √⟨ψ|P ∆α (α 0 )|ψ⟩
(E-39)
mit ∆α α0 + 2
P ∆α (α 0 ) =
∫
dα |v α ⟩⟨v α |
(E-40)
∆α α0 − 2
beschrieben. Zur Illustration dieser Aussage ist in Abb. 9 (links) die in der Basis {|v α ⟩} den Zustand |ψ⟩ repräsentierende Wellenfunktion ⟨v α |ψ⟩ aufgetragen. Der Zustand des Systems unmittelbar nach der Messung wird (bis auf einen Normierungsfaktor) durch die in Abb. 9 (rechts) skizzierte Kurve dargestellt; dabei ist die Rechnung völlig analog zu der, die von Gl. (E-33) zu Gl. (E-36) und Gl. (E-37) führt.
Abb. 9: Zur Veranschaulichung des Postulats über die Reduktion eines Wellenpakets im Fall eines kontinuierlichen Spektrums. Man misst die Observable A mit den Eigenvektoren |v α ⟩ und den Ei genwerten α. Der Messapparat hat die Selektivität ∆α. Ist der gefundene Wert bis auf ∆α gleich α 0 , so besteht die Wirkung der Messung auf die Wellenfunktion ⟨v α |ψ⟩ darin, dass sie um den Wert α 0 „abgeschnitten“ wird (zur Normierung der neuen Wellenfunktion muss sie offensichtlich mit einem Faktor größer als eins multipliziert werden).
Referenzen und Literaturhinweise Ausarbeitung von Konzepten der Quantentheorie: Referenzen in Abschnitt 4 der Bi bliographie, insbesondere Jammer (4.8). Diskussion der Postulate und ihre Interpretation: Referenzen in Abschnitt 5 der Biblio graphie; von Neumann (10.10), Kapitel V und VI; Feynman, Bd. 5 (1.2), § 2.6, Kapitel 3 und § 8.3. Quantisierungsregeln und Poissonklammern: Dirac (1.13), § 21; Schiff (1.18), § 24. Wahrscheinlichkeiten und Statistik: siehe den entsprechenden Unterabschnitt von Abschnitt 10 der Bibliographie.
•
262 | Übersicht über die Ergänzungen zu Kapitel III
Übersicht über die Ergänzungen zu Kapitel III AIII Teilchen in einem unendlich tiefen Potentialtopf
Hier werden einfache Anwendungen von Kapitel III behandelt, wobei vor allem auf die physikalische Bedeutung der Ergebnisse eingegangen wird. (elementar)
BIII Wahrscheinlichkeitsstrom. Spezialfälle CIII Standardabweichung konjugierter Observabler
Allgemeiner Beweis der Heisenbergschen Unschärferelation (formal, kann beim ersten Lesen ausgelassen werden)
DIII Messung an einem Teilsystem
In DIII werden Messungen besprochen, die nur an einem Teil des Systems ausgeführt werden. (einfache Anwendung, kann ebenfalls beim ersten Lesen ausgelassen werden) Diese Ergänzungen bieten eine Einführung in fortgeschrittene Themen der Quantenmechanik. (abgesehen von FIII einfach; auf einem etwas höheren Niveau als die vorherigen Ergänzungen, aber auf der Basis von Kapitel III zu verstehen)
EIII Der Dichteoperator
EIII befasst sich mit der Definition und den Eigenschaften des Dichteoperators, der bei der quantenmechanischen Behandlung von Systemen benötigt wird, deren Zustand nur unvollständig bekannt ist (statistische Zustandsgemische). In der Quantenstatistik ist er ein Basisbegriff. (anspruchsvoller)
FIII Der Entwicklungsoperator
In FIII wird der Entwicklungsoperator eingeführt, der den Anfangszustand eines Systems in einen Zustand zu einem beliebigen anderen Zeitpunkt überführt. (einfach)
GIII Schrödinger- und Heisenberg-Bild
In GIII wird die Entwicklung quantenmechanischer Systeme von einem anderen Standpunkt beschrieben, als wir ihn bisher eingenommen haben. Die Zeitabhängigkeit tritt hier bei den Observablen und nicht beim Systemzustand auf. (anspruchsvoller)
HIII Eichinvarianz
In HIII wird der quantenmechanische Formalismus für den Fall diskutiert, dass in dem System ein elektromagnetisches Feld wirkt. Zwar treten bei dieser Beschreibung die elektromagnetischen Potentiale auf, doch hängen die physikalischen Eigenschaften nur von den Werten der Felder ab und bleiben bei einem Wechsel der Potentiale ungeändert.
JIII
JIII skizziert eine andere Formulierung der Quantenmechanik, bei der ein zum Huygensschen Prinzip der klassischen Wellenoptik analoges Prinzip zum Ausgangspunkt genommen wird. (anspruchsvoller)
Der Propagator der Schrödinger-Gleichung
KIII Instabile Niveaus. Lebensdauer LIII Aufgaben
Einführung in die wichtigen Konzepte Instabilität und Lebensdauer. (einfach, aber für das Folgende nicht unbedingt erforderlich)
Übersicht über die Ergänzungen zu Kapitel III |
263
•
In diesen Ergänzungen werden noch einmal eindimensionale Probleme betrachtet, jedoch von einem allgemeineren Standpunkt als in Kapitel I. MIII Gebundene Zustände in einem Potentialtopf
In MIII werden die in § 2-c von Ergänzung HI erhaltenen Ergebnisse für einen beliebigen Potentialtopf verallgemeinert. (einfach und physikalisch wichtig)
NIII Nichtgebundene Zustände
In NIII werden die nichtgebundenen stationären Zustände bei einem beliebigen Potential untersucht. (wird für Ergänzung OIII benötigt)
OIII Eindimensionales periodisches Potential
In OIII wird der (in der Festkörperphysik fundamentale) Begriff des Energiebandes eingeführt, der bei der Untersuchung eines periodischen Potentials auftritt. (etwas schwieriger; kann zunächst übergangen werden)
•
264 | Ergänzung AIII
Ergänzung AIII Teilchen in einem unendlich tiefen Potentialtopf 1 1-a 1-b 2 2-a 2-b 2-c 3
Verteilung der Impulswerte in einem stationären Zustand | 264 Berechnung von φ n (p), ⟨P⟩ und ∆P | 264 Physikalische Diskussion | 266 Entwicklung der Wellenfunktion | 268 Wellenfunktion zu einem beliebigen Zeitpunkt | 269 Formänderung des Wellenpakets | 269 Bewegung des Paketschwerpunkts | 270 Störung durch eine Ortsmessung | 272
In Ergänzung HI , § 2-c-β haben wir uns bereits mit den stationären Zuständen eines Teilchens in einem eindimensionalen unendlich tiefen Potentialtopf befasst. Hier wol len wir auf die physikalische Bedeutung näher eingehen und zeigen, wie man die von uns formulierten Postulate auf einen konkreten Fall anwenden kann. Dabei interes sieren wir uns vor allem für die Ergebnisse, die sich mit Ort und Impuls des Teilchens befassen.
1 Verteilung der Impulswerte in einem stationären Zustand 1-a Berechnung von φ n (p), ⟨P⟩ und ∆P Wir wissen bereits, dass die zu den stationären Zuständen des Teilchens gehörenden Energiewerte (mit den Bezeichnungen aus Ergänzung HI ) durch die Beziehung n2 π2 ℏ2 2ma2 und die Wellenfunktionen durch En =
φ n (x) = √
2 nℏx sin ( ) a a
(1)
(2)
gegeben sind (a ist die Breite des Potentialtopfes und n eine beliebige positive ganze Zahl). Wir betrachten nun ein Teilchen im Zustand |φ n ⟩ mit der Energie E n . Die Wahr scheinlichkeit dafür, dass wir bei einer Messung des Teilchenimpulses einen Wert zwi schen p und p + dp finden, ist 𝒫 n (p) dp = |φ n (p)|2 dp
(3)
mit φ n (p) =
1 √2πℏ
a
∫√
2 nπx −ipx/ℏ dx sin ( )e a a
0
https://doi.org/10.1515/9783110638738-022
(4)
Teilchen in einem unendlich tiefen Potentialtopf |
265
•
Dieses Integral kann leicht ausgewertet werden. Wir erhalten a
nπ p nπ p 1 − )x + )x i( −i( φ n (p) = ∫ [e a ℏ − e a ℏ ] dx 2i√πℏa 0
i(
nπ
p − )a
−i(
nπ
p + )a
a ℏ − 1 e a ℏ − 1] 1 [e = − p p i ( nπ −i ( nπ 2i√πℏa a − ℏ) a + ℏ) ] [
(5)
Setzen wir F(p) =
sin(pa/2ℏ) pa/2ℏ
(6)
so wird φ n (p) =
nπ pa a 1 nπℏ nπℏ √ ei( 2 − 2ℏ ) [F(p − ) + (−1)n+1 F(p + )] 2 i πℏ a a
(7)
Von einem Proportionalitätsfaktor abgesehen, ist diese Funktion die Summe (bzw. Dif ferenz) zweier „Beugungsfunktionen“ F(p ± nπℏ/a), die um die Stelle p = ∓nπℏ/a zentriert sind und deren „Breite“ (das ist der Abstand 4πℏ/a der beiden ersten, sym metrisch zum Zentrum liegenden Nullstellen) und „Höhe“ nicht von n abhängen. In Gl. (7) ist der Ausdruck in den eckigen Klammern für ungerades n gerade und für gerades n ungerade. Die durch Gl. (3) gegebene Wahrscheinlichkeitsdichte 𝒫 n (p) ist also in jedem Fall eine gerade Funktion in p, so dass +∞
⟨P⟩n = ∫ 𝒫 n (p) p d p = 0
(8)
−∞
ist, der Erwartungswert des Teilchenimpulses im Zustand mit der Energie E n ist somit gleich null. Zur Berechnung des Erwartungswerts ⟨P2 ⟩n des Impulsquadrates nutzen wir die Tatsache, dass in der Ortsdarstellung P wie der Differentialoperator ℏi ddx wirkt, und erhalten nach einer partiellen Integration¹ a a dφ 2 2 nπ 2 nπx nπℏ 2 n ⟨P2 ⟩n = ℏ2 ∫ ) dx = ( ) dx = ℏ2 ∫ ( ) cos2 ( dx a a a a 0
(9)
0
Aus den beiden letzten Beziehungen ergibt sich dann die Standardabweichung ∆P n = √⟨P2 ⟩n − ⟨P⟩2n =
nπℏ a
(10)
die somit linear von der Quantenzahl n abhängt. +∞
1 Man gelangt zum selben Ergebnis, wenn man das Integral ⟨P 2 ⟩n = ∫−∞ |φ n (p)|2 p2 dp unter Be rücksichtigung von Gl. (7) berechnet. Dies ist zwar nicht schwierig, aber länger als der von uns gegan gene Weg.
•
266 | Ergänzung AIII
1-b Physikalische Diskussion Um die Wahrscheinlichkeitsdichte 𝒫 n (p) über p auftragen zu können, untersuchen wir zunächst das Verhalten der eckigen Klammer in Gl. (7). Für den Grundzustand (n = 1) ist er eine Summe aus zwei Beugungsfunktionen F, deren Zentren den Ab stand 2πℏ/a (gleich der halben Breite dieser Kurven) haben, s. Abb. 1a. Für den ersten angeregten Zustand (n = 2) ist dieser Abstand doppelt so groß, wobei man außerdem die beiden Funktionen voneinander abziehen muss, s. Abb. 2a. Für größere Werte der Quantenzahl n sind die Zentren der Beugungskurven durch einen Abstand entfernt, der größer als ihre Breite ist.
(a)
(b) Abb. 1: In der Impulsdarstellung erhält man die Wellenfunktion φ1 (p) für den Grundzustand eines Teilchens, das sich in einem unendlich tiefen Potentialtopf befindet, indem man die beiden Beu gungsfunktionen F [gestrichelte Kurven in (a)] addiert; dabei sind die Zentren dieser beiden Kurven um deren halbe Breite getrennt. Der Verlauf dieser Summe ist durch die ausgezogene Kurve darge stellt. Bildet man davon das Betragsquadrat, so gelangt man zur Wahrscheinlichkeitsdichte 𝒫1 (p) für eine Messung des Teilchenimpulses (b).
Die Wahrscheinlichkeitsdichte 𝒫n (p) erhält man dann durch Bildung des Betragsqua drates, s. Abb. 1a und 1b. Für große n ist der Interferenzterm zwischen F(p − nπℏ a ) und ) wegen des größer werdenden Abstands der Zentren vernachlässigbar, es F(p + nπℏ a gilt also a nπℏ 2 nπℏ [F (p − ) + (−1)n+1 F (p + )] 4πℏ a a a nπℏ nπℏ [F 2 (p − ) + F 2 (p + )] ≈ 4πℏ a a
𝒫 n (p) =
Der Verlauf von 𝒫 n (p) ist für diesen Fall in Abb. 3 skizziert.
(11)
Teilchen in einem unendlich tiefen Potentialtopf
| 267
•
(a)
(b) Abb. 2: Um für das erste angeregte Niveau die Wellenfunktion φ2 (p) zu erhalten, muss man die beiden Funktionen F (mit derselben Breite wie in Abb. 1a) voneinander abziehen, wobei diese jetzt aber mit ihren Zentren weiter voneinander entfernt sind [gestrichelte Kurven in (a)]. Das Ergebnis stellt die ausgezogene Kurve dar. Die Wahrscheinlichkeitsdichte 𝒫2 (p) weist jetzt zwei Maxima auf, die in der Nähe von p = +2πℏ/a und p = −2πℏ/a liegen (b).
Die Wahrscheinlichkeitsdichte weist zwei symmetrisch liegende Maxima der Brei te 4πℏ/a mit ihren Zentren an den Stellen p = +nπℏ/a und −nπℏ/a auf. Man kann daher fast sicher vorhersagen, welche Resultate sich bei einer Messung des Teilchen impulses im Zustand |φ n ⟩ ergeben werden: Die Werte sind praktisch gleich +nπℏ/a bzw. −nπℏ/a, und die relative Genauigkeit² ist umso besser, je größer n ist (die ent gegengesetzten Werte ±nπℏ/a sind dabei gleich wahrscheinlich). Dies ist auch ver
Abb. 3: Für große n (hoch angeregte Niveaus) zeigt die Wahrscheinlichkeitsdichte zwei ausgeprägte Maxima bei p = ±nπℏ/a. Diese Werte entsprechen gerade den Impulsen bei einer klassischen Bewegung mit derselben Energie.
2 Die absolute Genauigkeit ist unabhängig von n, weil die Breite der Kurve stets 4πℏ/a ist.
•
268 | Ergänzung AIII
ständlich: Für große n führt die sinusförmig verlaufende Funktion φ n (x) im Potential topf viele Schwingungen aus und kann deshalb praktisch als die Überlagerung von zwei fortschreitenden Wellen mit den entgegengesetzten Impulsen p = +nπℏ/a und p = −nπℏ/a aufgefasst werden. Mit kleiner werdendem n nimmt auch die relative Genauigkeit ab, mit der man die möglichen Impulswerte vorhersagen kann. Für n = 2 sieht man z. B. in Abb. 2b, dass die Funktion 𝒫 n (p) zwei Maxima aufweist, deren Breite mit ihrem Abstand vom Ursprung vergleichbar ist. In diesem Fall führt nämlich die Wellenfunktion im Poten tialtopf nur eine Schwingung aus; es ist also nicht verwunderlich, dass für diese in x = 0 und x = a „abgeschnittene“ Sinuskurve die Wellenlänge (und somit der Impuls des Teilchens) schlecht definiert ist. Für den Grundzustand schließlich ist die Wel lenfunktion durch einen sinusförmigen Halbbogen gegeben: Die Wellenlänge und der Teilchenimpuls sind nur mit sehr schlechter relativer Genauigkeit bekannt, s. Abb. 1b. Bemerkungen: 1. Hat ein klassisches Teilchen die durch Gl. (1) gegebene Energie E n , ist also p2kl 2m
=
n 2 π 2 ℏ2 2ma2
(12)
so ist der klassische Impuls pkl = ±
nπℏ a
(13)
Für größer werdende n liegen die beiden Maxima von 𝒫 n (p) immer besser bei diesen Impuls werten. 2. Man erkennt, dass für große n der Betrag des Impulses (relativ) wohlbestimmt ist, nicht da gegen sein Vorzeichen. Das ist der Grund für die große Standardabweichung ∆P n : Ist die Wahr scheinlichkeitsverteilung auf die beiden Maxima wie in Abb. 3 konzentriert, so zeigt die Stan dardabweichung den Abstand dieser Maxima an und ist nicht mehr auf deren Breite bezogen.
2 Entwicklung der Wellenfunktion Jeder Ket |φ n ⟩ mit der Wellenfunktion φ n (x) beschreibt einen stationären Zustand, in dem sich die physikalischen Eigenschaften des Systems zeitlich nicht ändern. Eine Entwicklung tritt erst auf, wenn der Zustandsvektor eine Linearkombination aus meh reren Kets |φ n ⟩ ist. Wir befassen uns hier mit einem sehr einfachen Beispiel, bei dem der Zustand |ψ(0)⟩ zum Zeitpunkt t = 0 durch |ψ(0)⟩ = gegeben ist.
1 [|φ1 ⟩ + |φ2 ⟩] √2
(14)
Teilchen in einem unendlich tiefen Potentialtopf |
269
•
2-a Wellenfunktion zu einem beliebigen Zeitpunkt Mit Gl. (D-54) aus Kap. III erhalten wir sofort π ℏ 1 −i π ℏ2 t −2i t [e 2ma |φ1 ⟩ + e 2ma2 |φ2 ⟩] √2 2
|ψ(t)⟩ =
2
(15)
oder auch, wenn wir einen globalen Phasenfaktor unterdrücken, |ψ(t)⟩ ∝
1 [|φ1 ⟩ + e−iω21 t |φ2 ⟩] √2
(16)
mit ω21 =
E2 − E1 3π2 ℏ = ℏ 2ma2
(17)
2-b Formänderung des Wellenpakets Die Form des Wellenpakets wird durch die Wahrscheinlichkeitsdichte gegeben: |ψ(x, t)|2 =
1 2 1 φ1 (x) + φ22 (x) + φ1 (x) φ2 (x) cos ω21 t 2 2
(18)
Ihre zeitliche Änderung ist mithin durch den Interferenzterm φ1 φ2 bestimmt. Es gibt nur eine Bohrsche Frequenz, ν21 = (E2 −E1 )/h, weil im Anfangszustand nur die beiden Zustände |φ1 ⟩ und |φ2 ⟩ auftreten. Die zu φ21 , φ22 und φ1 φ2 gehörenden Kurven sind in Abb. 4 aufgetragen.
(a)
(b)
(c)
Abb. 4: Grafische Darstellung der Funktionen φ 21 (Aufenthaltswahrscheinlichkeitsdichte für den Grundzustand), φ 22 (Aufenthaltswahrscheinlichkeitsdichte für das erste angeregte Niveau) und φ 1 φ 2 (der die zeitliche Änderung der Form des Wellenpakets bestimmende gemischte Term).
Von hier aus gelangt man zusammen mit Gl. (18) zur grafischen Darstellung der zeitli chen Änderung der Form des Wellenpakets, s. Abb. 5: Es oszilliert zwischen den Wän den des Potentialtopfes.
•
270 | Ergänzung AIII
Abb. 5: Periodische Bewegung eines Wellenpakets, das aus einer Überlagerung des Grundzu stands und dem ersten angeregten Zustand eines Teilchens in einem unendlich tiefen Potentialtopf entsteht. Die (Bohrsche) Frequenz dieser Schwingung ist ω 21 /2π.
2-c Bewegung des Paketschwerpunkts Wir berechnen den Erwartungswert ⟨X⟩(t) des Teilchenortes zur Zeit t. Es erweist sich als zweckmäßig X = X − a/2
(19)
zu setzen, weil aus Symmetriegründen die Diagonalelemente der zugehörigen Matrix verschwinden: a
⟨φ1 |X |φ1 ⟩ ∝ ∫ (x −
a πx ) sin2 ( ) dx = 0 2 a
0 a
(20)
a 2πx ) dx = 0 ⟨φ2 |X |φ2 ⟩ ∝ ∫ (x − ) sin2 ( 2 a
0
Es ist dann ⟨X ⟩(t) = Re{e−iω21 t ⟨φ1 |X |φ2 ⟩}
(21)
mit ⟨φ1 |X |φ2 ⟩ = ⟨φ1 |X|φ2 ⟩ −
a ⟨φ1 |φ2 ⟩ 2
a
πx 2πx 2 sin dx = ∫ x sin a a a 0
16a =− 2 9π
(22)
Teilchen in einem unendlich tiefen Potentialtopf
| 271
•
Also ist ⟨X⟩(t) =
a 16a − cos ω21 t 2 9π2
(23)
Grafisch ist diese Zeitabhängigkeit in Abb. 6 wiedergegeben. Die gestrichelten Geradenstücke repräsentieren die Lage eines klassischen Teilchens, das mit der Fre quenz ω21 im Topf schwingt (dieses Teilchen erfährt nur an den Wänden eine Kraft und ändert während jeder Halbperiode seine Lage zwischen 0 und a gleichförmig).
Abb. 6: Zeitliche Änderung des Erwartungswerts ⟨X⟩ für das Wellenpaket aus Abb. 5. Die gestrichelte Kurve gibt die Lage eines klassischen Teilchens wieder, das mit derselben Frequenz schwingt. Nach der Quantenmechanik kehrt der Paketschwerpunkt vor Erreichen der Wand um, weil das Potential bereits auf die „Enden“ des Pakets einwirkt.
Wir stellen sofort einen deutlichen Unterschied zwischen der klassischen und der quantenmechanischen Bewegung fest: Der Schwerpunkt des Pakets führt eine Bewe gung mit geringerer Amplitude aus, kehrt also schon vor Erreichen der Wände, bzw. der Bereiche um, in denen das Potential ungleich null ist. Wir finden hier ein Resultat aus § D-2 von Kap. I wieder: Da das Potential an den Stellen x = 0 und x = a einen unendlich hohen Sprung aufweist, sind seine Änderungen in einem Bereich von der Dimension des Wellenpakets nicht vernachlässigbar, und die Bewegung des Paket schwerpunkts gehorcht nicht den Gesetzen der klassischen Mechanik (s. auch Kap. III, § D-1-d-γ). Die physikalische Erklärung dieses Phänomens besteht darin, dass das Po tential auf die „Enden“ des Pakets wirkt, noch bevor sein Schwerpunkt die Wände erreicht. Dies genügt, um es insgesamt schon vorher umkehren zu lassen. Bemerkung: Der Energieerwartungswert des Teilchens im Zustand |ψ(t)⟩ [gegeben durch Gl. (15)] ist leicht zu berechnen. Man erhält ⟨H⟩ =
1 1 5 E1 + E2 = E1 2 2 2
(24)
Weiter ist ⟨H 2 ⟩ =
1 2 1 2 17 2 E + E = E 2 1 2 2 2 1
(25)
und damit die Standardabweichung ∆H =
3 E1 2
(26)
•
272 | Ergänzung AIII Weil H eine Konstante der Bewegung ist, ist klar, dass ⟨H⟩, ⟨H 2 ⟩ und ∆H nicht von der Zeit ab hängen. Wie wir eben gesehen haben, finden wir andererseits eine nennenswerte Änderung des Pakets nach einer Zeit von der Größenordnung ∆t ≈
1 ω21
(27)
Aus dieser und der vorhergehenden Beziehung erhalten wir für das Produkt ∆H ⋅ ∆t ≈
3 ℏ ℏ = E1 ⋅ 2 3E 1 2
(28)
also wieder die Energie-Zeit-Unschärferelation (s. Kap. III, § D-2-e).
3 Störung durch eine Ortsmessung Wir betrachten ein Teilchen im Zustand |φ1 ⟩ und nehmen an, dass wir zur Zeit t = 0 den Ort des Teilchens messen und dabei den Wert x = a/2 erhalten. Welche Wahr scheinlichkeiten ergeben sich dann für eine unmittelbar anschließende Energiemes sung? Zunächst liegt folgende Überlegung nahe: Nach der ersten Messung befindet sich das Teilchen in einem Eigenzustand von X, der zu dem betreffenden Messwert gehört, seine Eigenfunktion ist dann proportional zu δ(x − a/2). Führt man nun eine Energie messung durch, so sollte man die verschiedenen Werte E n mit Wahrscheinlichkeiten finden, die proportional zu a 2 a a 2 {2/a für n ungerade ∗ (29) ∫ dx δ (x − ) φ n (x) = φ n ( ) = { 2 2 0 für n gerade 0 { sind. Hiernach wären die Wahrscheinlichkeiten für alle Eigenwerte E n zu ungeradem n gleich. Das ist aber ein unsinniges Ergebnis, weil dann die Summe dieser Wahr scheinlichkeiten gegen unendlich gehen würde. Der Fehler bei dieser Überlegung besteht im Folgenden. Die richtige Anwendung des vierten Postulats setzt voraus, dass die Wellenfunktion unmittelbar nach der ers ten Messung normiert ist. Nun ist aber die „Funktion“ δ(x − a/2) nicht normierbar³; die Frage muss daher präzisiert werden. Wie wir in § E-2-b in Kap. III gesehen haben, liefert die Messung einer Observablen mit einem kontinuierlichen Spektrum stets ein Ergebnis mit nur endlicher Genauig keit. In unserem Fall kann man lediglich sagen, dass a ε a ε − ≤x≤ + (30) 2 2 2 2 gilt, wobei ε von der verwendeten Messapparatur abhängt, aber stets größer als null ist. 3 Man erkennt wieder, dass eine δ-Funktion keinen physikalisch realisierbaren Zustand beschreiben kann.
Teilchen in einem unendlich tiefen Potentialtopf |
273
•
Wenn wir nun annehmen, dass ε gegenüber der Ausdehnung der Wellenfunkti on vor der Messung (die dann a ergibt) sehr klein ist, so ist die Wellenfunktion nach der Messung praktisch gleich √ε δ(ε) (x − a/2). Dabei ist δ(ε) (x) bis auf das durch (30) bestimmte Intervall überall null und nimmt in diesem Intervall den Wert 1/ε an, s. An hang II, § 1-a. Diese Funktion ist aber normiert, weil a 2 ∫ dx √εδ(ε) (x − ) = 1 2
(31)
ist. Jetzt findet man bei einer Energiemessung den Wert E n mit der Wahrscheinlichkeit 2 a 𝒫(E n ) = ∫ φ∗n (x)√ εδ(ϵ) (x − ) dx 2 8a 1 2 nπϵ { { ( ) sin2 ( ) ε nπ 2a ={ { {0
für n ungerade
(32)
für n gerade
Für ungerades n und festes ε ist der Verlauf von 𝒫(E n ) in Abb. 7 aufgetragen. Die Kurve zeigt, dass für Quantenzahlen n, die gegenüber a/ε sehr groß sind, die Wahrschein lichkeit 𝒫(E n ) vernachlässigbar klein ist. Weiter hängt die Wahrscheinlichkeitsver teilung stark von ε ab, wie klein ε auch sein mag. Das ist der Grund, weshalb wir bei unserer ersten Überlegung, bei der wir ε = 0 voraussetzten, nicht zum richtigen Er gebnis gelangen konnten. Man erkennt auch, dass mit kleiner werdendem ε das Bild von 𝒫(E n ) sich zu größeren n hin verbreitert. Diese Eigenschaft findet ihre Erklärung darin, dass aufgrund der Heisenbergschen Unschärferelation (s. Kap. I, § C-3) bei ei ner Ortsmessung mit hoher Genauigkeit der Impuls des Teilchens sehr stark geändert wird. Man überträgt demnach auf das Teilchen einen umso höheren Betrag an kineti scher Energie, je kleiner ε ist.
Abb. 7: Die Wahrscheinlichkeit 𝒫(E n ), bei ei ner Energiemessung den Wert E n zu erhalten, nachdem unmittelbar davor eine Ortsmessung den Wert a mit der Genauigkeit ε (ε ≪ a) er geben hat. Je kleiner ε ist, umso größer ist die Wahrscheinlichkeit, höhere Energien zu finden.
•
274 | Ergänzung BIII
Ergänzung BIII Wahrscheinlichkeitsstrom. Spezialfälle 1 2 2-a 2-b 3
Wahrscheinlichkeitsstrom in Bereichen konstanten Potentials | 274 Anwendung auf Potentialstufen | 275 Der Fall E > V 0 | 275 Der Fall E < V 0 | 276 Reflexion an einer zweidimensionalen Potentialstufe | 276
Wir hatten einem Teilchen, dessen Zustand durch die Wellenfunktion ψ(r, t) beschrie ben wird, einen Wahrscheinlichkeitsstrom J(r, t) =
ℏ [ψ∗ (r, t)∇ψ(r, t) − k. k.] 2m i
(1)
zugeordnet, wobei „k. k.“ die Abkürzung für den konjugiert komplexen Ausdruck ist. In diesem Abschnitt wollen wir ihn für einige Spezialfälle von ein- und zweidimensio nalen Rechteckpotentialen untersuchen.
1 Wahrscheinlichkeitsstrom in Bereichen konstanten Potentials Wir betrachten bei einem eindimensionalen Problem ein Teilchen mit der Energie E, das sich in einem konstanten Potential V0 befindet. In Ergänzung HI unterschieden wir mehrere Fälle: 1. Für E > V0 lautet die Wellenfunktion ψ(x) = A eikx + A e−ikx
(2)
ℏ2 k 2 2m
(3)
mit E − V0 =
Setzen wir Gl. (2) in Gl. (1) ein, so erhalten wir Jx =
ℏk [|A|2 − |A |2 ] m
(4)
Dieser Zusammenhang ist leicht zu interpretieren: Die durch Gl. (2) gegebene Wellen funktion gehört zu zwei ebenen Wellen mit den entgegengesetzten Impulsen +ℏk und −ℏk und den Wahrscheinlichkeitsdichten |A|2 und |A |2 . 2. Ist E < V0 , so hat man ψ(x) = B eρx + B e−ρx
(5)
mit V0 − E =
ℏ2 ρ 2 2m
https://doi.org/10.1515/9783110638738-023
(6)
Wahrscheinlichkeitsstrom. Spezialfälle |
275
•
Beim Einsetzen von Gl. (5) in Gl. (1) ergibt sich Jx =
ℏρ ∗ [iB B + k. k.] m
(7)
Damit in diesem Fall der Wahrscheinlichkeitsstrom nicht gleich null ist, müssen beide Koeffizienten B und B von null verschieden sein.
2 Anwendung auf Potentialstufen Die Ergebnisse wenden wir auf die in den Ergänzungen HI und JI behandelten Poten tialstufen an. Wir betrachten also ein Teilchen mit der Masse m und der Energie E, das sich in x-Richtung bewegt und bei x = 0 auf eine Potentialstufe mit der Höhe V0 trifft, s. Abb. 1.
Abb. 1: Potentialstufe mit der Höhe V 0 .
2-a Der Fall E > V0 Mit den durch Gl. (11) und Gl. (12) in Ergänzung HI gegebenen Wellenfunktionen, wo bei wir wie dort A2 = 0
(8)
setzen, ist die Stromdichte nach Gl. (4) im Bereich I JI =
ℏk 1 [|A1 |2 − |A1 |2 ] m
(9)
und im Bereich II JII =
ℏk 2 |A2 |2 m
(10)
Im Bereich I ist J I die Differenz aus dem einfallenden und dem reflektierten Strom. Das Verhältnis dieser beiden Ströme liefert den Reflexionskoeffizienten R der Poten tialstufe A 2 (11) R = 1 A1 in Übereinstimmung mit der Beziehung (15) aus Ergänzung HI .
•
276 | Ergänzung BIII
Entsprechend ist der Transmissionskoeffizient der Stufe das Verhältnis aus dem transmittierten Strom J II und dem einfallenden Strom, also k 2 A2 2 T= (12) k 1 A1 s. Gl. (16) in Ergänzung HI . 2-b Der Fall E < V0 Der Ausdruck für die Wellenfunktion φI (x) ist derselbe wie im ersten Fall, so dass auch Gl. (9) gültig bleibt. Dagegen ist die Wellenfunktion im Bereich II jetzt φII (x) = B2 e−ρ2 x
(13)
weil wir in Gl. (20) in Ergänzung HI wieder B2 = 0 setzen müssen. Gl. (7) liefert dann JII = 0
(14)
Der transmittierte Fluss ist [im Einklang mit Gl. (24) in Ergänzung HI ] gleich null. Wie erklärt man sich nun die Tatsache, dass im Bereich II der Wahrscheinlich keitsstrom, nicht aber die Aufenthaltswahrscheinlichkeit des Teilchens null ist? Hier zu erinnern wir an die Ergebnisse, die wir in § 1 von Ergänzung JI erhalten hatten. Wir sahen dort, dass ein Teil des einfallenden Wellenpakets in den klassisch verbo tenen Bereich II eindringt, bevor es seine Richtung umkehrt (dieses Eindringen ist für die Reflexionsverzögerung verantwortlich). Im stationären Fall haben wir daher im Bereich II zwei Wahrscheinlichkeitsströme: einen positiven Strom, der dem in den Bereich II eindringenden Teil des einfallenden Wellenpakets entspricht, und einen negativen Strom, der die Umkehr dieses Teils in Richtung des Bereichs I beschreibt. Diese beiden Ströme heben sich gegenseitig gerade auf. Im eindimensionalen Fall wird so die Struktur des Wahrscheinlichkeitsstroms für die gedämpfte Welle verdeckt. Darum wollen wir für den zweidimensionalen Fall den schrägen Einfall auf eine Potentialstufe untersuchen.
3 Reflexion an einer zweidimensionalen Potentialstufe Wir betrachten also das folgende zweidimensionale Problem: Ein Teilchen mit der Masse m befinde sich in der x, y-Ebene im Potential V(x, y), das unabhängig von y durch {0 V(x, y) = { V { 0
für x < 0 für x > 0
(15)
gegeben ist. Analog zu unserer Überlegung in § 2 von Ergänzung FI ist also die poten tielle Energie die Summe aus einem Ausdruck V1 (x) (dem Potential einer eindimen
Wahrscheinlichkeitsstrom. Spezialfälle | 277
•
sionalen Stufe) und einem Term V2 (y), der hier gleich null ist. Wir können daher eine Lösung der Eigenwertgleichung des Hamilton-Operators in der Form φ(x, y) = φ1 (x)φ2 (y)
(16)
suchen. Die Funktionen φ1 (x) und φ2 (y) genügen den Eigenwertgleichungen für den eindimensionalen Fall, in denen das Potential V1 (x) bzw. V2 (y) ist und die Energien E1 und E2 die Bedingung erfüllen E1 + E2 = E
(Gesamtenergie des Teilchens)
(17)
Wir setzen voraus, dass E1 < V0 ist. Die Eigenwertgleichung für φ1 (x) entspricht dann der Totalreflexion im eindimensionalen Fall, und wir können die Beziehun gen (11) und (20) aus Ergänzung HI verwenden. Die Funktion φ2 (y) ergibt sich sofort, weil sie wegen V2 (y) = 0 zu einem freien Teilchen gehört, sie beschreibt also eine ebene Welle. Wir erhalten so im Bereich I (x < 0) φI (x, y) = A ei(k x x+k y y) + A ei(−k x x+k y y)
(18)
mit kx = √
2mE1 ℏ2
ky = √
2mE2 ℏ2
(19)
und im Bereich II (x > 0) φII (x, y) = B e−ρ x x eik y y
(20)
mit ρx = √
2m(V0 − E1 ) ℏ2
(21)
Die Gleichungen (22) und (23) aus Ergänzung HI liefern dann die Verhältnisse A /A und B/A. Definieren wir mit tan θ =
V0 − E1 π ρx =√ (0 ≤ θ ≤ ) kx E1 2
(22)
einen Parameter θ, so wird A k x − iρ x = = e−2iθ A k x + iρ x
(23)
B 2k x = = 2 cos θ e−iθ A k x + iρ x
(24)
und
•
278 | Ergänzung BIII
Setzen wir diese Ergebnisse in die Definitionsgleichung (1) für den Wahrscheinlich keitsstrom ein, so ergibt sich im Bereich I ℏk x { (J ) = [|A|2 − |A |2 ] = 0 { { I x m JI { { ℏk y ik x x { 2 ℏk y + A e−ik x x = |A|2 [2 + 2 cos(2k x x + 2θ)] {(J I )y = m A e m
(25)
und im Bereich II { {(J II )x = 0 JII { ℏk y ℏk y { |B|2 e−2ρ x x = 4|A|2 cos2 θ e−2ρ x x (J ) = { II y m m
(26)
Im Bereich I ist nur die y-Komponente des Wahrscheinlichkeitsstroms von null ver schieden und besteht aus zwei Anteilen: – Der erste ist proportional zu 2|A|2 und stammt von der Summe der einfallenden und der reflektierten Welle, s. Abb. 2; – der zweite ist proportional zu cos(2k x x + 2θ) und beschreibt einen Interferenzef fekt zwischen den beiden Wellen; durch ihn ändert sich der Strom in Abhängigkeit von x harmonisch, s. Abb. 3.
Abb. 2: Die Summe aus dem einfallenden und dem reflektierten Wahrscheinlichkeitsstrom ergibt einen Strom in y-Richtung.
Abb. 3: Als Folge der Interferenz zwischen der einfallenden und der reflektierten Welle oszilliert im Bereich I der Wahrscheinlichkeitsstrom mit x.
Auch im Bereich II ist die Richtung des Wahrscheinlichkeitsstroms zur y-Achse par allel, er unterliegt jetzt aber einer exponentiellen Dämpfung, die gerade der querge dämpften Welle entspricht. Dieser Strom rührt von dem in den zweiten Bereich ein
Wahrscheinlichkeitsstrom. Spezialfälle |
279
•
dringenden Wellenpaket her, s. Abb. 4, das sich vor seiner Umkehr während einer ge wissen Verzögerungszeit τ [s. Ergänzung JI , Gl. (8)] in y-Richtung bewegt. Damit hängt auch die Lateralversetzung des Pakets bei seiner Reflexion zusammen, s. Abb. 4.
Abb. 4: Das Teilchen kann in den Bereich II eindringen. Dies führt zu einer Lateralversetzung bei der Reflexion.
•
280 | Ergänzung CIII
Ergänzung CIII Standardabweichung konjugierter Observabler 1 2
Unschärferelation für P und Q | 280 „Minimales“ Wellenpaket | 281
Wir nennen die beiden Observablen P und Q konjugiert, wenn ihr Kommutator [Q, P] gleich iℏ ist. Wir wollen zunächst beweisen, dass die Standardabweichungen (s. § C-5 von Kap. III) ∆P und ∆Q für jeden Zustandsvektor des Systems der Beziehung ∆P ⋅ ∆Q ≥
ℏ 2
(1)
genügen. Danach zeigen wir, dass bei Bestehen des Gleichheitszeichens die Wellen funktion des zugehörigen Zustands in der Ortsdarstellung (und in der Impulsdarstel lung) ein Gaußsches Wellenpaket ist.
1 Unschärferelation für P und Q Wir betrachten den Ket |φ⟩ = (Q + iλP)|ψ⟩
(2)
worin λ ein beliebiger Parameter ist. Das Normquadrat von |φ⟩ ist positiv (oder gleich null) und kann wie folgt geschrieben werden: ⟨φ|φ⟩ = ⟨ψ|(Q − iλP)(Q + iλP)|ψ⟩ = ⟨ψ|Q2 |ψ⟩ + ⟨ψ|(iλQP − iλPQ)|ψ⟩ + ⟨ψ|λ2 P2 |ψ⟩ = ⟨Q2 ⟩ + iλ⟨[Q, P]⟩ + λ2 ⟨P2 ⟩ = ⟨Q2 ⟩ − λℏ + λ2 ⟨P2 ⟩ ≥ 0
(3)
Daher ist die Diskriminante dieses Trinoms zweiten Grades in λ negativ oder null: ℏ2 − 4⟨P2 ⟩⟨Q2 ⟩ ≤ 0
(4)
und es gilt ⟨P2 ⟩⟨Q2 ⟩ ≥
ℏ2 4
(5)
Wir nehmen den Vektor |ψ⟩ als gegeben an und führen mit P = P − ⟨P⟩ = P − ⟨ψ|P|ψ⟩ Q = Q − ⟨Q⟩ = Q − ⟨ψ|Q|ψ⟩ https://doi.org/10.1515/9783110638738-024
(6)
Standardabweichung konjugierter Observabler
| 281
•
zwei weitere Observable ein. Auch diese sind zueinander konjugiert, weil [Q , P ] = [Q, P] = iℏ
(7)
ist. Darum gilt die Beziehung (5) auch für P und Q ⟨P2 ⟩⟨Q2 ⟩ ≥
ℏ2 4
(8)
Nach Definition der Standardabweichung [s. Gl. (C-23), Kap. III] erkennt man aber, dass wegen Gl. (6) ∆P = √⟨P2 ⟩ ∆Q = √⟨Q2 ⟩
(9)
ist, womit wir die Relation (8) auch ∆P ⋅ ∆Q ≥
ℏ 2
(10)
schreiben können. Sind daher zwei Observable zueinander konjugiert (was dann der Fall ist, wenn sie einer klassischen Ortskoordinate x i und derem kanonisch konjugier ten Impuls p i zugeordnet sind), so gibt es für das Produkt ihrer Standardabweichun gen ∆P ⋅ ∆Q eine genaue untere Grenze. Diese Aussage verallgemeinert die Heisen bergsche Unschärferelation. Bemerkung: Man kann die Überlegung sofort auf zwei beliebige Observable A und B verallgemeinern und erhält dann die Beziehung ∆A.∆B ≥
1 |⟨[A, B]⟩| 2
(11)
2 „Minimales“ Wellenpaket Nimmt das Produkt ∆P ⋅ ∆Q seinen kleinsten Wert an, d. h. ist ∆P ⋅ ∆Q =
ℏ 2
(12)
so sagt man, dass der Zustandsvektor |ψ⟩ zu einem „minimalen“ Wellenpaket (hin sichtlich der Observablen P und Q) gehört. Besteht Gl. (12), so muss nach unseren eben angestellten Überlegungen das Norm quadrat von |φ ⟩ = (Q + iλP )|ψ⟩
(13)
•
282 | Ergänzung CIII
gleich null sein. Wir gelangen zu einer quadratischen Gleichung in λ, die eine Dop pelwurzel λ0 zulässt. Bei Wahl von λ = λ0 ist dann der Ket |φ ⟩ null, also (Q + iλ0 P )|ψ⟩ = [Q − ⟨Q⟩ + iλ0 (P − ⟨P⟩)]|ψ⟩ = 0
(14)
(Ist dagegen ∆P ⋅ ∆Q > ℏ/2, so kann das sich aus ⟨φ |φ ⟩ ergebende Polynom nie verschwinden, es ist vielmehr für beliebiges λ positiv.) Als notwendige und hinreichende Bedingung dafür, dass das Produkt ∆P ⋅ ∆Q seinen kleinsten Wert ℏ/2 annimmt, ergibt sich demnach, dass die Kets (Q − ⟨Q⟩)|ψ⟩ und (P − ⟨P⟩)|ψ⟩ zueinander proportional sind. Der Proportionalitätsfaktor −iλ0 ist nun leicht zu berechnen. Mit ∆Q ⋅ ∆P = ℏ/2 hat die Gleichung ⟨φ |φ ⟩ = λ2 (∆P)2 − λℏ + (∆Q)2 = 0
(15)
die Doppelwurzel λ0 =
ℏ 2(∆Q)2 = ℏ 2(∆P)2
(16)
Wir schreiben Gl. (14) in der Ortsdarstellung und nehmen einfachheitshalber an, dass die Eigenwerte q von Q nicht entartet sind. In dieser Darstellung wirkt P wie der Differentialoperator ℏi ddq (s. Ergänzung EII ), und wir erhalten [q + ℏλ0
d − ⟨Q⟩ − iλ0 ⟨P⟩] ψ(q) = 0 dq
(17)
mit ψ(q) = ⟨q|ψ⟩
(18)
Zur Integration von Gl. (17) ist es zweckmäßig, durch die Beziehung ψ(q) = ei⟨P⟩q/ℏ θ(q − ⟨Q⟩)
(19)
die Funktion θ(q) einzuführen. Man erhält, wenn man Gl. (19) in Gl. (17) einsetzt, die einfachere Gleichung [q + λ0 ℏ
d ] θ(q) = 0 dq
(20)
mit der Lösung θ(q) = C e−q
2
/2λ 0 ℏ
(21)
Darin ist C eine beliebige komplexe Konstante. Berücksichtigen wir Gl. (16) und Gl. (21), so wird aus Gl. (19) q−⟨Q⟩ 2 −[ 2∆Q ]
ψ(q) = C ei⟨P⟩q/ℏ e
(22)
Standardabweichung konjugierter Observabler
| 283
•
Zur Normierung dieser Funktion muss man C = [2π(∆Q)2 ]−1/4
(23)
setzen. Wir sind somit zu folgendem Ergebnis gelangt: Nimmt das Produkt ∆P ⋅ ∆Q der Standardabweichungen von P und Q seinen kleinsten Wert ℏ/2 an, so ist die Wellen funktion in der Ortsdarstellung ein Gaußsches Paket. Man erhält es aus der GaußFunktion θ(q) durch die Transformation (19), die einen zweimaligen Wechsel des Ur sprungs bedeutet, und zwar einen auf der q- und einen auf der p-Achse. Bemerkung: Man kann unsere Überlegung in der Impulsdarstellung wiederholen und erhält dann die Aussage, dass die durch ψ(p) = ⟨p|ψ⟩ =
1 √2πℏ
+∞
∫ dq e−ipq/ℏ ψ(q)
(24)
−∞
definierte Funktion ebenfalls eine Gauß-Funktion ist. Sie lautet jetzt p−⟨P⟩ 2 −[ 2∆P ]
ψ(p) = [2π(∆P)2 ]−1/4 e−i⟨Q⟩p/ℏ e
wenn wir von einem Phasenfaktor exp(i⟨Q⟩⟨P⟩/ℏ) absehen.
(25)
•
284 | Ergänzung DIII
Ergänzung DIII Messung an einem Teilsystem 1 2 3
Berechnung physikalischer Vorhersagen | 284 Physikalische Bedeutung des Tensorprodukts | 286 Allgemeiner Zustand | 287
Mit dem in § F von Kap. II eingeführten Begriff des Tensorprodukts konnten wir zei gen, wie man aus den Zustandsräumen von zwei Teilsystemen den Zustandsraum des Gesamtsystems konstruieren kann. Wir wollen hier einen Schritt weitergehen und un ter Verwendung der quantenmechanischen Postulate sehen, zu welchen Ergebnissen man gelangen kann, wenn man bei Kenntnis des Zustands des Gesamtsystems nur an einem Teil dieses Systems Messungen durchführt.
1 Berechnung physikalischer Vorhersagen Wir betrachten ein physikalisches System, das aus den Teilen (1) und (2) (z. B. aus zwei Elektronen) besteht. Sind H(1) und H(2) die Zustandsräume der Teile (1) und (2), so ist der Zustand des Gesamtsystems (1) + (2) das Tensorprodukt H(1) ⊗ H(2). So wird z. B. ein System, das aus zwei Elektronen besteht, durch eine von sechs Variablen ab hängende Wellenfunktion ψ(x1 , y1 , z1 ; x2 , y2 , z2 ) beschrieben. Sie gehört zu einem Ket aus dem Produktraum Hr (1) ⊗ Hr (2), s. § F-4-b von Kap. II. Man kann sich nun Messungen vorstellen, die nur an einem der beiden Teile [z. B. am Teil (1)] ausgeführt werden. Die zu diesen Messungen gehörenden Observablen ̃ A(1) sind im Raum H(1) ⊗ H(2) durch die Fortsetzungen der Observablen A(1) defi niert, die nur¹ im Raum H(1) wirken, s. § F-2-b von Kap. II A(1) ⇒ ̃ A(1) = A(1) ⊗ 𝟙(2)
(1)
Darin ist 𝟙(2) der Einheitsoperator im Raum H(2). Das Spektrum von ̃ A(1) in H(1) ⊗ H(2) ist dasselbe wie das von A(1) in H(1). Dagegen hatten wir gesehen, dass alle Eigenwerte von ̃ A(1) in H(1) ⊗ H(2) entar tet sind, selbst wenn die von A(1) in H(1) einfach sind (natürlich muss dabei H(2) eine Dimension größer als eins aufweisen). Falls man eine Messung nur an dem Sys tem (1) vornimmt, liegt daher ein Fall vor, bei dem sich das Gesamtsystem nach der Messung in mehreren verschiedenen Zuständen befinden kann (der Zustand nach der Messung hängt nicht nur vom Messergebnis, sondern auch vom Zustand vor der Mes sung ab). Physikalisch ist dieser Sachverhalt verständlich: Er entspricht den Freiheits
1 Der Deutlichkeit halber verwenden wir in diesem Abschnitt unterschiedliche Bezeichnungen für die ̃ in H(1) wirkende Observable A(1) und ihre Fortsetzung A(1). https://doi.org/10.1515/9783110638738-025
Messung an einem Teilsystem | 285
•
graden des Teilsystems (2), über das man ja bei der Messung am Teilsystem (1) keine Information zu erhalten sucht. Es sei P n (1) in H(1) der Projektor, der auf den Eigenraum zum Eigenwert a n von A(1) projiziert: gn
P n (1) = ∑ |u in (1)⟩⟨u in (1)|
(2)
i=1
Dabei sind die Kets |u in (1)⟩ die g n orthonormierten Eigenvektoren zu a n . Den Projek ̃ n (1) in H(1) ⊗ H(2), der auf den Eigenraum zum selben Eigenwert a n von ̃ tor P A(1) projiziert, erhält man durch Fortsetzung von P n (1) in den Raum H(1) ⊗ H(2) ̃ n (1) = P n (1) ⊗ 𝟙(2) P
(3)
Berücksichtigen wir die Vollständigkeitsrelation für eine beliebige orthonormierte Basis {|v k (2)⟩} in H(2), so können wir für den Einheitsoperator 𝟙(2) in H(2) 𝟙(2) = ∑ |v k (2)⟩⟨v k (2)|
(4)
k
schreiben. Setzt man dies in Gl. (3) ein und verwendet Gl. (2), so wird gn
̃ n (1) = ∑ ∑ |u in (1) v k (2)⟩⟨u in (1) v k (2)| P
(5)
i=1 k
Bei Kenntnis des Zustands |ψ⟩ des Gesamtsystems (er sei auf eins normiert) kön nen wir die Wahrscheinlichkeit 𝒫 (1) (a n ) berechnen, mit der wir bei einer Messung von A(1) am Teil (1) dieses Systems das Resultat a n feststellen. Aus der allgemeinen Beziehung (B-14) aus Kap. III folgt hier ̃ n (1)|ψ⟩ 𝒫 (1) (a n ) = ⟨ψ|P
(6)
also gn
𝒫 (1) (a n ) = ∑ ∑ |⟨u in (1) v k (2)|ψ⟩|2
(7)
i=1 k
Weiter ist der Zustand |ψ ⟩ des Systems nach der Messung [s. Gl. (B-31) aus Kap. III] durch |ψ ⟩ =
̃ n (1)|ψ⟩ P ̃ n (1)|ψ⟩ √⟨ψ|P
(8)
gegeben. Mit Gl. (5) erhält man schließlich gn
∑ ∑ |u in (1) v k (2)⟩⟨u in (1) v k (2)|ψ⟩ |ψ ⟩ =
i=1 k
(9) gn
√ ∑ ∑ |⟨u in (1) v k (2)|ψ⟩|2 i=1 k
•
286 | Ergänzung DIII
Bemerkungen: 1. Die Wahl einer orthonormierten Basis {|v k (2)⟩} in H(2) ist beliebig; man erkennt an den Glei chungen (3), (6) und (8), dass die das Teilsystem (1) betreffenden Vorhersagen nicht von dieser Wahl abhängen. Das ist physikalisch klar, denn wenn am Teilsystem (2) keine Messung ausge führt wird, kann kein Zustand bzw. keine Menge von Zuständen dieses Teilsystems eine bevor zugte Rolle spielen. 2. Ist der Zustand |ψ⟩ vor der Messung ein tensorielles Produkt |ψ⟩ = |φ(1)⟩ ⊗ |χ(2)⟩
(10)
[die Zustände |φ(1)⟩ und |χ(2)⟩ seien in H(1) bzw. H(2) normiert], so erkennt man über Gl. (3) und Gl. (8), dass auch der Zustand |ψ ⟩ ein tensorielles Produkt ist. Es gilt dann |ψ ⟩ = |φ (1)⟩ ⊗ |χ(2)⟩
(11)
mit |φ (1)⟩ =
P n (1)|φ(1)⟩ . √⟨φ(1)|P n (1)|φ(1)⟩
(12)
Nur der Zustand des Teilsystems (1) hat sich geändert. 3. Ist der Eigenwert a n von A(1) in H(1) nichtentartet, oder symbolisiert A(1) allgemeiner einen vollständigen Satz kommutierender Observabler in H(1), so ist der Index i in Gl. (2) und den folgenden nicht nötig. Man sieht dann, dass der Zustand des Systems nach einer Messung mit dem Ergebnis a n stets als ein Produkt aus zwei Vektoren geschrieben werden kann. So kann Gl. (9) auf die Form |ψ ⟩ = |u n (1)⟩ ⊗ |χ (2)⟩
(13)
gebracht werden, wobei der normierte Vektor |χ (2)⟩ ∈ H(2) durch ∑ |v k (2)⟩⟨u n (1) v k (2)|ψ⟩ |χ (2)⟩ =
k
(14)
2 √ ∑ |⟨u n (1) v k (2)|ψ⟩| k
gegeben ist. Ist daher eine Messung am Teilsystem (1) hinsichtlich dieses Teils vollständig, so ist für jeden Zustand |ψ⟩ des Gesamtsystems vor der Messung der Zustand dieses Gesamtsystems nach der ausschließlich an (1) vorgenommenen Messung ein tensorielles Produkt. Das Gleiche gilt natürlich, wenn umgekehrt eine Messung nur am Teilsystem (2) geschieht.
2 Physikalische Bedeutung des Tensorprodukts Um die physikalische Bedeutung eines Produktzustands zu erkennen, wenden wir die vorstehenden Ergebnisse auf den speziellen Fall an, bei dem der Anfangszustand des Gesamtsystems die Form (10) hat. Mit Gl. (6) und Gl. (3) erhalten wir sofort die Wahr scheinlichkeit 𝒫 (1) (a n ) = ⟨φ(1) χ(2)|P n (1) ⊗ 𝟙(2)|φ(1) χ(2)⟩
(15)
Messung an einem Teilsystem | 287
•
Beachten wir die Definition des Tensorprodukts P n (1) ⊗ 𝟙(2) und die Tatsache, dass |χ(2)⟩ normiert ist, so können wir dies umschreiben 𝒫 (1) (a n ) = ⟨φ(1)|P n (1)|φ(1)⟩⟨χ(2)|𝟙(2)|χ(2)⟩ = ⟨φ(1)|P n (1)|φ(1)⟩
(16)
Somit hängt die Wahrscheinlichkeit 𝒫 (1) (a n ) nicht von |χ(2)⟩, sondern nur von |φ(1)⟩ ab. Falls also der Zustand des Gesamtsystems die Form (10) besitzt, hängen physika lische Aussagen, die sich nur auf eines der beiden Teilsysteme beziehen, nicht davon ab, in welchem Zustand sich der andere Teil befindet. Sie werden vollständig mit Hilfe von |φ(1)⟩ bzw. |χ(2)⟩ ausgedrückt, je nachdem welches der beiden Teilsysteme man gerade beobachtet. Hiernach repräsentiert ein Produktzustand ein einfaches Nebeneinanderstellen oder Zusammenfügen von zwei Systemen, von denen sich das eine im Zustand |φ(1)⟩ und das andere im Zustand |χ(2)⟩ befindet. Man sagt auch, dass die beiden Systeme in einem derartigen Zustand nicht korreliert seien (genauer gehören die Messergebnis se, die entweder das eine oder das andere System betreffen, zu unabhängigen Zufalls variablen). Eine derartige Situation ergibt sich, wenn man die beiden Systeme getrennt in den Zuständen |φ(1)⟩ und |χ(2)⟩ präpariert und sie dann, ohne dass sie miteinander in Wechselwirkung treten, vereinigt.
3 Allgemeiner Zustand Wir betrachten jetzt den Fall, bei dem der Zustand des Gesamtsystems kein Produkt zustand ist, bei dem also |ψ⟩ nicht in der Form |φ(1)⟩ ⊗ |χ(2)⟩ geschrieben werden kann. Voraussagen über Ergebnisse von Messungen, die man nur an einem der bei den Teilsysteme durchführt, können dann nicht mehr nur in Abhängigkeit von |φ(1)⟩ [bei einer Beobachtung von (1)] bzw. nur von |χ(2)⟩ [bei einer Beobachtung von (2)] ausgedrückt werden. Man muss vielmehr die allgemeinen Beziehungen (6) und (7) verwenden. Ohne Beweis geben wir hier nur an, dass in einem solchen Fall zwischen den beiden Teilsystemen (1) und (2) eine Korrelation besteht: Die Ergebnisse von Mes sungen, die entweder an dem Teilsystem (1) oder dem Teilsystem (2) vorgenommen werden, gehören zu Zufallsvariablen, die nicht mehr voneinander unabhängig, son dern korreliert sind. So kann man z. B. zeigen, dass eine Wechselwirkung zwischen den beiden Systemen einen anfänglichen Produktzustand in einen Zustand transfor miert, der nicht mehr als Produktzustand geschrieben werden kann: Im Allgemeinen führt jede Wechselwirkung der beiden Systeme zu einer Korrelation zwischen ihnen. Falls der Zustand des Gesamtsystems kein Produktzustand |φ(1)⟩ ⊗ |χ(2)⟩ ist und man nicht mehr dem System (1) den Ket |φ(1)⟩ bzw. dem System (2) den Ket |χ(2)⟩ zuordnen kann, so stellt sich weiter die Frage, wie eine Beschreibung des Sys tems (1) bzw. des Systems (2) überhaupt möglich ist. Diese Frage ist sehr wichtig, weil im Allgemeinen jedes physikalische System in der Vergangenheit mit ande
•
288 | Ergänzung DIII
ren Systemen in Wechselwirkung stand, selbst wenn es im Augenblick seiner Be obachtung isoliert ist. Der Zustand des Gesamtsystems {System (1) + System (2) + Systeme, die in der Vergangenheit mit ihnen wechselwirkten} ist im Allgemeinen kein Produktzustand, und es ist nicht möglich, dem System (1) allein einen Zustandsvektor |φ(1)⟩ zuzuordnen. Zur Lösung dieser Schwierigkeiten muss das System (1) vielmehr durch einen Operator, den sogenannten Dichteoperator, beschrieben werden. Dieser Begriff bildet die Grundlage der Quantenstatistik. In Ergänzung EIII , § 5-b geben wir einige Hinweise auf diesen Formalismus. Dagegen kann das System (1) stets durch einen Zustandsvektor beschrieben wer den, wenn man an ihm eine vollständige Messung ausführt. Wie wir weiter oben [Glei chungen (13) und (14)] sahen, gelangt das Gesamtsystem (1) + (2) bei einer vollstän digen Messung am System (1) in einen Produktzustand, wobei der dem System (1) zu geordnete Vektor gleich dem (bis auf einen Faktor) eindeutigen Eigenvektor zu den Ergebnissen der vollständigen Messung ist, die am System (1) vorgenommen wurde. Durch diese Messung verschwinden also alle Korrelationen, die sich aus den vorherge henden Wechselwirkungen mit dem System (2) ergeben haben. Wenn im Augenblick der Messung das System (2) genügend weit entfernt ist und mit dem System (1) nicht mehr in Wechselwirkung steht, so kann man es im weiteren Verlauf einfach vergessen. Bemerkung: Falls der Zustandsvektor |ψ⟩ vor der Messung keinen Produktzustand beschreibt, so kann man anhand der Beziehung (14) zeigen, dass der Zustandsvektor |χ (2)⟩ des Systems (2) nach der Messung vom Ergebnis der vollständigen Messung am System (1) abhängt (aufgrund der Bemer kung (2) im vorangegangenen Abschnitt ist dies nicht der Fall, wenn |ψ⟩ ein Produktzustand ist). Dies erscheint zunächst überraschend: Der Zustand des Systems (2) hängt nach einer vollstän digen Messung am System (1) selbst dann von den Ergebnissen dieser Messung ab, wenn das System (2) im Augenblick der Messung bereits sehr weit vom System (1) entfernt ist und nicht mehr mit ihm in Wechselwirkung steht. Es handelt sich hier um das Einstein-Podolsky-RosenParadoxon, das in der Literatur ausführlich diskutiert wird.
Referenzen und Literaturhinweise Einstein-Podolsky-Rosen-Paradoxon: siehe den Unterabschnitt „Versteckte Variable und Paradoxa“ von Abschnitt 5 der Bibliographie; Bohm (5.1), § 22.15 bis § 22.19; d’Espagnat (5.3), Kap. 7; Jammer (5.12), Kap. 6. Photonen beim Zerfall des Positroniums: Feynman, Bd. 5 (1.2), § 18.3; Dicke und Wittke (1.14), Kap. 7.
Der Dichteoperator
|
289
•
Ergänzung EIII Der Dichteoperator 1 2 3 3-a 3-b 3-c 4 4-a 4-b 4-c 5 5-a 5-b
Problemstellung | 289 Statistisches Zustandsgemisch | 289 Reiner Fall. Einführung des Dichteoperators | 291 Beschreibung durch den Zustandsvektor | 291 Beschreibung durch den Dichteoperator | 292 Eigenschaften des Dichteoperators beim reinen Fall | 293 Statistisches Gemisch. Gemischter Fall | 294 Definition des Dichteoperators | 294 Allgemeine Eigenschaften des Dichteoperators | 295 Besetzung. Kohärenz | 297 Beispiele für den Dichteoperator | 299 System im thermodynamischen Gleichgewicht | 299 Beschreibung eines Teilsystems. Partielle Spur | 299
1 Problemstellung Bis jetzt haben wir uns ausschließlich mit Systemen befasst, deren Zustand vollstän dig bekannt ist. Wir haben gezeigt, wie man ihre zeitliche Entwicklung untersuchen und Messergebnisse vorhersagen kann. Zur Bestimmung des Zustands eines Systems zu einem bestimmten Zeitpunkt genügt es, die Observablen eines vollständigen Satzes kommutierender Observabler (V. S. K. O.) zu messen. So ist z. B. beim Versuch, der in § A-3 von Kap. I behandelt wurde, der Polarisationszustand der Photonen vollständig bekannt, wenn der Lichtstrahl den Polarisator durchquert. Praktisch ist indessen der Zustand des Systems oft nur unvollständig bestimmt. Das ist etwa beim Polarisationszustand von Photonen der Fall, die von einer natür lichen (unpolarisierten) Lichtquelle ausgesandt werden, oder auch bei einem Atom strahl, den ein Ofen mit der Temperatur T emittiert; hier ist die kinetische Energie nur statistisch bekannt. Das Problem hinsichtlich der quantenmechanischen Beschrei bung besteht in diesen Fällen darin, in den Formalismus die unvollständige Informati on über den Systemzustand so einzubeziehen, dass man dann möglichst umfassende Vorhersagen machen kann. Man führt dazu den mathematischen Begriff des Dichte operators ein. Dieser erleichtert die gleichzeitige Anwendung der quantenmechani schen Postulate und die Berechnung der Wahrscheinlichkeiten.
2 Statistisches Zustandsgemisch Ist ganz allgemein die Information über ein System nicht vollständig, so beruft man sich stets auf den Begriff der Wahrscheinlichkeit. So weiß man z. B., dass ein von ei ner natürlichen Lichtquelle ausgesandtes Photon mit der gleichen Wahrscheinlichkeit https://doi.org/10.1515/9783110638738-026
•
290 | Ergänzung EIII
jeden Polarisationszustand besitzen kann. Oder befindet sich ein System bei der Tem peratur T im Gleichgewicht, so ist die Wahrscheinlichkeit dafür, dass es sich in einem Zustand mit der Energie E n befindet, proportional zu e−E n /kT . In der Quantenmechanik zeigt sich die Unvollständigkeit der Information über ein System sehr häufig darin, dass man weiß, das System kann sich mit einer Wahr scheinlichkeit p1 im Zustand |ψ1 ⟩, mit der Wahrscheinlichkeit p2 im Zustand |ψ2 ⟩ usw. befinden. Offensichtlich ist p1 + p2 + . . . = ∑ p k = 1
(1)
k
Man spricht dann von einem statistischen Gemisch der Zustände |ψ1 ⟩, |ψ2 ⟩, . . . mit den Wahrscheinlichkeiten p1 , p2 , . . . Im Folgenden wollen wir sehen, wie man zu Vorhersagen über die Ergebnisse gelangen kann, wenn man an diesem System Messungen vornimmt. Ist der Zustand des Systems etwa |ψ k ⟩, so könnte man mit den Postulaten die Wahrscheinlichkeit für das Auftreten eines bestimmten Resultats berechnen. Gehört zu diesem Zustand die Wahrscheinlichkeit p k , so muss man offensichtlich die berechneten Werte mit p k ge wichten und dann über die verschiedenen k, d. h. über alle Zustände des Gemischs, summieren. Bemerkungen: 1. Die Zustände |ψ1 ⟩, |ψ2 ⟩, . . . müssen nicht orthogonal sein. Man kann sie jedoch immer ge eignet normieren, was wir in diesem Abschnitt voraussetzen wollen. 2. Die Wahrscheinlichkeiten treten hier auf zwei verschiedenen Ebenen auf: – zum einen in der Information über den Anfangszustand des Systems (bisher hatten wir an dieser Stelle überhaupt nicht von Wahrscheinlichkeiten gesprochen: Der Zustandsvektor war vollständig bekannt, die Wahrscheinlichkeiten p k wären bis auf eine gleich null, diese hätte den Wert 1); – zum anderen bei der Anwendung der Quantenpostulate auf die Messung (was zu Wahr scheinlichkeitsaussagen führt, obwohl der Anfangszustand des Systems völlig bekannt ist). Es handelt sich also um gänzlich verschiedene Gründe, die zur Einführung von Wahrscheinlich keiten zwingen: einerseits die Unvollständigkeit in der Information über den Anfangszustand des Systems (diese Situation begegnet uns auch in der klassischen statistischen Mechanik), anderer seits die (spezifisch quantenmechanische) Unsicherheit, die mit dem Messprozess zusammen hängt. 3. Man darf ein System, bei dem die Information durch ein statistisches Gemisch von Zustän den gegeben ist (Wahrscheinlichkeit p k dafür, dass der Zustandsvektor |ψ k ⟩ ist), nicht mit einem System verwechseln, dessen Zustand durch eine (lineare) Superposition |ψ⟩ = ∑ c k |ψ k ⟩
(2)
k
von Zuständen¹ gegeben ist. Hier sagt man in der Quantenmechanik oft, „das System besitze eine Wahrscheinlichkeit |c k |2 , sich im Zustand |ψ k ⟩ zu befinden“. Darunter versteht man jedoch
1 An dieser Stelle wollen wir voraussetzen, dass die Zustände |ψ k ⟩ orthonormiert sind. Diese Annah me ist nicht wesentlich, vereinfacht jedoch die Diskussion.
Der Dichteoperator
|
291
•
folgenden Sachverhalt: Führt man eine Reihe von Messungen aus, die zu einem vollständigen Satz kommutierender Observabler gehören und für den |ψ k ⟩ ein Eigenvektor ist, so ist die Wahr scheinlichkeit, die zu diesem Ket gehörenden Eigenwerte zu finden, gleich |c k |2 . Wir halten aber fest, dass ein System in einem Zustand, der durch Gl. (2) gegeben ist, nicht einfach äquivalent zu einem System ist, dass mit der Wahrscheinlichkeit |c1 |2 im Zustand |ψ1 ⟩, der Wahrscheinlich keit |c2 |2 im Zustand |ψ2 ⟩ usw. ist. Bei einer Linearkombination der |ψ k ⟩ treten nämlich zwischen diesen Zuständen die in der Quantenmechanik sehr wichtigen Interferenzeffekte auf (sie rühren von den gemischten Termen c k c∗k her, die bei Bildung des Betragsquadrats der Wahrscheinlich keitsamplituden entstehen). Nun ist auch verständlich, weshalb es in der Quantenmechanik im allgemeinen unmöglich ist, ein statistisches Gemisch durch einen „mittleren Zustandsvektor“ in Form einer Superposition der |ψ k ⟩ zu beschreiben: Bildet man eine Summe von gewichteten Wahrscheinlichkeiten, so kann man nie Interferenzterme zwischen den verschiedenen |ψ k ⟩ erhalten, aus denen das Gemisch besteht.
3 Reiner Fall. Einführung des Dichteoperators Zur Untersuchung des Verhaltens eines statistischen Gemischs haben wir bereits ei nen ersten Weg angegeben: Man berechnet für die möglichen Zustände |ψ k ⟩ die phy sikalischen Vorhersagen, gewichtet die Ergebnisse mit den Wahrscheinlichkeiten p k und summiert anschließend über k. Diese Methode ist zwar korrekt, führt aber oft zu recht unbequemen Rechnungen. Stattdessen erlaubt der Begriff des Dichteoperators eine einfache und elegante Beschreibung von Zustandsgemischen. Vor der allgemeinen Behandlung wollen wir auf den einfachen Fall zurückkom men, bei dem der Zustand eines Systems völlig bekannt ist, bei dem also sämtliche Wahrscheinlichkeiten p k bis auf eine gleich null sind. Wir sprechen dann von einem reinen Fall. Hier kann man in äquivalenter Weise den Systemzustand entweder durch den Vektor |ψ⟩ charakterisieren oder aber durch einen im Zustandsraum wirkenden Operator. Unser Interesse an diesem Operator wird in § 4 deutlich werden: Es zeigt sich nämlich, dass fast alle Beziehungen, die wir im Folgenden für den reinen Fall aufstellen werden, auch für die Beschreibung eines Zustandsgemischs gültig bleiben. 3-a Beschreibung durch den Zustandsvektor Der Zustandsvektor eines Systems sei zur Zeit t durch |ψ(t)⟩ = ∑ c n (t)|u n ⟩
(3)
n
gegeben, wobei die Menge {|u n ⟩} im Zustandsraum eine diskrete orthonormierte Basis bildet (die Verallgemeinerung auf eine kontinuierliche Basis bereitet keine Schwierig keiten). Die Koeffizienten c n (t) genügen der Beziehung ∑ |c n (t)|2 = 1 n
die zum Ausdruck bringt, dass |ψ(t)⟩ normiert ist.
(4)
•
292 | Ergänzung EIII
Ist A eine Observable mit den Matrixelementen ⟨u n |A|u p ⟩ = A np
(5)
so ist der Erwartungswert von A zum Zeitpunkt t ⟨A⟩(t) = ⟨ψ(t)|A|ψ(t)⟩ = ∑ c∗n (t) c p (t) A np
(6)
n,p
Die Bewegungsgleichung für |ψ(t)⟩ ist schließlich die Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = H(t)|ψ(t)⟩ dt
(7)
mit dem Hamilton-Operator H(t). 3-b Beschreibung durch den Dichteoperator Die Beziehung (6) zeigt, dass die Koeffizienten c n (t) in den Erwartungswerten als qua dratische Ausdrücke von der Form c∗n (t)c p (t) auftreten. Im Übrigen sind sie nichts an deres als die Matrixelemente des Operators |ψ(t)⟩⟨ψ(t)|, dem Projektor auf den Ket |ψ(t)⟩ (s. § B-3-b von Kap. II), denn nach Gl. (3) ist ⟨u p |ψ(t)⟩⟨ψ(t)|u n ⟩ = c∗n (t)c p (t)
(8)
Es liegt daher nahe, durch die Definition ρ(t) = |ψ(t)⟩⟨ψ(t)|
(9)
den Dichteoperator ρ(t) einzuführen. In der {|u n ⟩}-Basis wird dieser Operator durch die Dichtematrix mit den Elementen ρ pn (t) = ⟨u p |ρ(t)|u n ⟩ = c∗n (t) c p (t)
(10)
dargestellt. Wir zeigen, dass die Angabe von ρ(t) zur (quantenmechanischen) Charakterisie rung des Systemzustands ausreicht, dass man also sämtliche physikalische Aussagen, die sich aus dem Zustandsvektor |ψ(t)⟩ ergeben, auch mit Hilfe des Dichteoperators ermitteln kann. Hierzu drücken wir die Beziehungen (4), (6) und (7) in Abhängigkeit vom Operator ρ(t) aus. Nach Gl. (4) und Gl. (10) ist die Summe der Diagonalelemente der Dichtematrix, also ihre Spur, gleich eins: ∑ |c n (t)|2 = ∑ ρ nn (t) = Tr{ρ(t)} = 1 n
(11)
n
Andererseits geht mit Gl. (5) und (10) die Gl. (6) über in ⟨A⟩(t) = ∑ ⟨u p |ρ(t)|u n ⟩⟨u n |A|u p ⟩ n,p
= ∑⟨u p |ρ(t)A|u p ⟩ p
= Tr{ρ(t)A}
(12)
Der Dichteoperator
| 293
•
Die zeitliche Änderung von ρ(t) ergibt sich schließlich aus der Schrödinger-Gleichung: d d d ρ(t) = ( |ψ(t)⟩) ⟨ψ(t)| + |ψ(t)⟩ ( ⟨ψ(t)|) dt dt dt 1 1 = H(t)|ψ(t)⟩⟨ψ(t)| + |ψ(t)⟩⟨ψ(t)|H(t) iℏ (−iℏ) 1 = [H(t), ρ(t)] iℏ
(13)
Wir fassen zusammen: Mit dem Dichteoperator wird die Wahrscheinlichkeitser haltung durch die Beziehung Tr{ρ(t)} = 1
(14)
ausgedrückt. Der Erwartungswert einer Observablen A ergibt sich aus der Gleichung ⟨A⟩(t) = Tr{Aρ(t)} = Tr{ρ(t)A}
(15)
und die zeitliche Änderung wird durch die Differentialgleichung iℏ
d ρ(t) = [H(t), ρ(t)] dt
(16)
bestimmt. Um schließlich die Wahrscheinlichkeit 𝒫(a n ) zu erhalten, mit der man bei einer Messung der Observablen A zum Zeitpunkt t die Werte a n findet, erinnern wir uns daran, dass nach Gl. (B-14), Kap. III die Wahrscheinlichkeit 𝒫(a n ) gleich dem Er wartungswert des Projektors P n auf den zu a n gehörenden Eigenraum von A ist, also 𝒫(a n ) = ⟨ψ(t)|P n |ψ(t)⟩
(17)
Nach Gl. (15) ergibt sich dann 𝒫(a n ) = Tr{P n ρ(t)}
(18)
3-c Eigenschaften des Dichteoperators beim reinen Fall Beim reinen Fall kann ein System sowohl durch einen Dichteoperator wie durch ei nen Zustandsvektor beschrieben werden, doch bietet der Dichteoperator in manchen Fällen eine Reihe von Vorteilen. Zunächst zeigt Gl. (9), dass die beiden Vektoren |ψ(t)⟩ und eiθ |ψ(t)⟩ (mit einer beliebigen reellen Zahl θ), die physikalisch denselben Zustand charakterisieren, zum selben Dichteoperator gehören. Durch den Gebrauch des Dichteoperators wird daher der manchmal störende globale Phasenfaktor beim Zustandsvektor unterdrückt. Wei ter sieht man, dass die Beziehungen (14), (15) und (18) in Bezug auf den Dichteoperator linear sind, während in den Ausdrücken (6) und (17) der Zustandsvektor |ψ(t)⟩ qua dratisch auftritt. Dies ist eine wichtige Eigenschaft, die sich im Folgenden als nützlich erweisen wird.
•
294 | Ergänzung EIII
Schließlich ergeben sich aus der Definition des Dichteoperators [Gl. (9)] sofort ei nige weitere Eigenschaften: ρ † (t) = ρ(t)
(19)
(der Dichteoperator ist hermitesch), ρ 2 (t) = ρ(t)
(20)
(der Dichteoperator ist ein Projektor), Tr{ρ 2 (t)} = 1
(21)
Die beiden letzten Eigenschaften besitzt der Dichteoperator nur beim reinen Fall, nicht dagegen bei einem Zustandsgemisch.
4 Statistisches Gemisch. Gemischter Fall 4-a Definition des Dichteoperators Wir kehren jetzt zu dem in § 1 beschriebenen allgemeinen Fall zurück und betrach ten ein System, für das (zu einem bestimmten Zeitpunkt) die Wahrscheinlichkeiten p1 , p2 , . . . , p k , . . . beliebig sein können, wenn sie nur den Bedingungen 0 ≤ p1 , p2 , . . . , p k , . . . ≤ 1 (22)
∑ pk = 1 k
genügen. Wie berechnet man dann die Wahrscheinlichkeit 𝒫(a n ) dafür, dass bei einer Messung der Observablen A das Ergebnis a n ist? Es sei 𝒫k (a n ) = ⟨ψ k |P n |ψ k ⟩
(23)
die Wahrscheinlichkeit, mit der man den Wert a n messen würde, wenn der Zustands vektor |ψ k ⟩ wäre. Um die gesuchte Wahrscheinlichkeit 𝒫(a n ) zu erhalten, muss man, wie wir bereits feststellten, 𝒫k (a n ) mit p k gewichten und anschließend über k sum mieren: 𝒫(a n ) = ∑ p k 𝒫k (a n )
(24)
k
Nun ist gemäß Gl. (18) 𝒫k (a n ) = Tr{ρ k P n }
(25)
mit dem zum Zustand |ψ k ⟩ gehörenden Dichteoperator ρ k = |ψ k ⟩⟨ψ k |
(26)
Der Dichteoperator
| 295
•
Wird Gl. (25) in Gl. (24) eingesetzt, so erhalten wir 𝒫(a n ) = ∑ p k Tr{ρ k P n } k
= Tr {∑ p k ρ k P n } k
= Tr{ρP n }
(27)
wenn man ρ = ∑ pk ρk
(28)
k
setzt. Wir sehen also, dass wegen der Linearität der Beziehungen, die den Dichteope rator verwenden, alle physikalischen Aussagen mit Hilfe von ρ, dem Mittel aus den Dichteoperatoren ρ k , ausgedrückt werden können. Dieser Operator ist per Definition der Dichteoperator des Systems für den gemischten Fall.
4-b Allgemeine Eigenschaften des Dichteoperators Da die Koeffizienten p k reell und die Operatoren ρ k hermitesch sind, ist ρ offensicht lich auch hermitesch. Berechnen wir die Spur von ρ, so ist zunächst Tr{ρ} = ∑ p k Tr{ρ k }
(29)
k
Wie wir aber in § 3-b sahen, ist die Spur der ρ k stets gleich eins. Damit folgt Tr{ρ} = ∑ p k = 1
(30)
k
die Gl. (14) gilt also allgemein. In Gl. (27) hatten wir die Wahrscheinlichkeit 𝒫(a n ) bereits in Abhängigkeit vom Dichteoperator ρ angegeben. Geht man von diesem Ausdruck aus, so kann man sofort Gl. (15) auf den gemischten Fall verallgemeinern. Es ist ⟨A⟩ = ∑ a n 𝒫(a n ) = Tr {ρ ∑ a n P n } n
= Tr{ρA}
n
(31)
wobei wir Gl. (D-36b) aus Kap. II beachten. Bei der Frage nach der Zeitabhängigkeit des Dichteoperators wollen wir voraus setzen, dass der Hamilton-Operator H(t) des Systems im Gegensatz zu seinem Zustand
•
296 | Ergänzung EIII
vollständig bekannt ist. Ist dann das System zum Anfangszeitpunkt t0 mit der Wahr scheinlichkeit p k im Zustand |ψ k ⟩, so ist es mit derselben Wahrscheinlichkeit p k zu einem späteren Zeitpunkt t in dem Zustand |ψ k (t)⟩, der sich als Lösung des Anfangs wertproblems iℏ
d |ψ k (t)⟩ = H(t)|ψ k (t)⟩ dt
(32)
|ψ k (t0 )⟩ = |ψ k ⟩ ergibt. Damit ist der Dichteoperator zur Zeit t ρ(t) = ∑ p k ρ k (t)
(33)
k
mit ρ k (t) = |ψ k (t)⟩⟨ψ k (t)|
(34)
Die Operatoren ρ k (t) genügen der Differentialgleichung iℏ
d ρ k (t) = [H(t), ρ k (t)] dt
(35)
Weil die Gleichungen (33) und (35) in den ρ k (t) linear sind, folgt iℏ
d ρ(t) = [H(t), ρ(t)] dt
(36)
Somit konnten wir mit Ausnahme der Beziehungen (20) und (21) alle Zusammen hänge aus § 3 auf den Fall eines statistischen Gemischs verallgemeinern. Der Dichte operator ist jetzt aber kein Projektor, vielmehr gilt im Allgemeinen² ρ 2 ≠ ρ
(37)
und folglich Tr{ρ 2 } ≤ 1
(38)
Damit ein reiner Fall vorliegt, genügt es übrigens, wenn eine der beiden Gleichun gen (20) oder (21) erfüllt ist.
2 Nehmen wir z. B. an, dass die Zustände |ψ k ⟩ untereinander orthogonal sind. In einer orthonormier ten Basis, die die |ψ k ⟩ enthält, ist ρ diagonal und seine Elemente sind gerade die Gewichtskoeffizien ten p k . Um ρ2 zu erhalten, muss man nur die p k durch p2k ersetzen. Dann folgen die Beziehungen (37) und (38) aus der Tatsache, dass die p k stets kleiner als eins sind (von dem speziellen Fall abgesehen, bei dem alle Koeffizienten bis auf einen verschwinden; das ist aber der reine Fall).
Der Dichteoperator
|
297
•
Endlich ersieht man aus der Definition (28), dass für einen beliebigen Ket |u⟩ gilt ⟨u|ρ|u⟩ = ∑ p k ⟨u|ρ k |u⟩ k
= ∑ p k |⟨u|ψ k ⟩|2
(39)
k
und folglich ⟨u|ρ|u⟩ ≥ 0
(40)
Der Dichteoperator ρ ist ein positiver Operator.
4-c Besetzung. Kohärenz Welche physikalische Bedeutung haben die Matrixelemente ρ np des Dichteoperators ρ in der {|u n ⟩}-Darstellung? Für das Diagonalelement ρ nn gilt nach Gl. (28) zunächst ρ nn = ∑ p k [ρ k ]nn
(41)
k
d. h. wir haben unter Verwendung von Gl. (26) und durch Einführung der Komponen ten (k)
c n = ⟨u n |ψ k ⟩
(42)
von |ψ k ⟩ in der {|u n ⟩}-Basis (k)
ρ nn = ∑ p k |c n |2
(43)
k (k)
Hierin ist |c n |2 eine reelle, positive Zahl und bedeutet physikalisch die Wahrschein lichkeit, mit der man bei einer Messung das System im Zustand |u n ⟩ findet, falls es vor der Messung im Zustand |ψ k ⟩ war. Trägt man der Unbestimmtheit des Zustands vor der Messung Rechnung, so repräsentiert ρ nn die mittlere Wahrscheinlichkeit dafür, das System im Zustand |u n ⟩ zu finden. Man nennt daher das Diagonalelement ρ nn der Dichtematrix die Besetzung des Zustands |u n ⟩: Führt man unter denselben Anfangsbe dingungen dieselbe Messung N-mal (N groß) aus, so wird man das System Nρ nn -mal im Zustand |u n ⟩ finden. Nach Gl. (43) ist klar, dass ρ nn eine reelle und nichtnegative (k) Zahl ist, die nur dann verschwindet, wenn alle |c n |2 gleich null sind. Für die nichtdiagonalen Matrixelemente ρ np erhalten wir in einer analogen Rech nung den Ausdruck (k) (k)∗
ρ np = ∑ p k c n c p k
(44)
•
298 | Ergänzung EIII (k) (k)∗
Darin ist c n c p ein gemischter Term von der Art, wie wir ihn in § E-1 von Kap. III un tersucht haben. Er ist für die Interferenzeffekte zwischen den Zuständen |u n ⟩ und |u p ⟩ verantwortlich, die dann auftreten können, wenn der Zustand |ψ k ⟩ eine kohärente (lineare) Superposition dieser Zustände ist; ρ np ist das Mittel dieser Terme über alle Zustände, die im Gemisch auftreten. Im Unterschied zu den Diagonalelementen kön (k) (k)∗ nen die ρ np auch verschwinden, wenn kein Produkt c n c p null ist, weil es sich bei ihnen um Summen von komplexen Zahlen handelt. Ist ein Matrixelement ρ np gleich null, so bedeutet dies, dass im Mittel alle Interferenzeffekte zwischen |u n ⟩ und |u p ⟩ verschwinden; dagegen besteht zwischen diesen Zuständen eine gewisse Kohärenz, falls ρ np von null verschieden ist. Aus diesem Grund bezeichnet man die Nichtdiago nalelemente der Dichtematrix häufig als Kohärenzen. Bemerkungen: 1. Offensichtlich hängt die Unterscheidung zwischen den Diagonal- und den Nichtdiagonalele menten der Dichtematrix von der Wahl der Basis {|u n ⟩} ab. Weil ρ hermitesch ist, kann man stets eine orthonormierte Basis {|χ l ⟩} finden, in der ρ diagonal ist. Dann kann man ρ in der Form ρ = ∑ π l |χ l ⟩⟨χ l |
(45)
l
schreiben. Weil ρ positiv und seine Spur gleich eins ist, hat man 0 ≤ πl ≤ 1 (46)
∑ πl = 1 l
Man kann dann ρ als den Dichteoperator auffassen, der ein statistisches Gemisch aus den Zu ständen |χ l ⟩ mit den Wahrscheinlichkeiten π l beschreibt, wobei es zwischen den Zuständen |χ l ⟩ keine Kohärenzen gibt. 2. Sind die Basiskets |u n ⟩ die Eigenvektoren des Hamilton-Operators H und ist dieser nicht zeit abhängig, gilt also H|u n ⟩ = E n |u n ⟩
(47)
so erhält man aus Gl. (36) sofort die Beziehungen d ρ nn (t) = 0 dt d iℏ ρ np (t) = (E n − E p )ρ np dt iℏ
(48)
Darum ist ρ nn (t) = const i
ρ np (t) = e ℏ (Ep −En )t ρ np (0)
(49)
Die Diagonalelemente sind konstant, während die Nichtdiagonalelemente mit den Bohr-Frequen zen des Systems oszillieren. 3. Mit der Beziehung (40) kann man die Ungleichung: ρ nn ρ pp ≥ |ρ np |2
(50)
beweisen. Hieraus folgt z. B., dass ρ nur Kohärenzen zwischen Zuständen aufweisen kann, für die die Besetzungen nicht null sind.
Der Dichteoperator
| 299
•
5 Beispiele für den Dichteoperator 5-a System im thermodynamischen Gleichgewicht Unser erstes Beispiel stammt aus der Quantenstatistik. Wir betrachten ein System, das mit einem Thermostaten der Temperatur T im thermodynamischen Gleichgewicht steht. Wie man zeigen kann, ist sein Dichteoperator dann ρ = Z −1 e−H/kT
(51)
worin H der Hamilton-Operator des Systems, k die Boltzmann-Konstante und Z ein Normierungsfaktor ist, der so festgelegt wird, dass die Spur von ρ gleich eins ist: Z = Tr {e−H/kT }
(52)
(Z heißt die Zustandssumme). Wählt man die Eigenvektoren |u n ⟩ von H zur Basis, so wird ρ nn = Z −1 ⟨u n |e−H/kT |u n ⟩ = Z −1 e−E n /kT
(53)
(s. Ergänzung BII , § 4-a) und ρ np = Z −1 ⟨u n |e−H/kT |u p ⟩ = Z −1 e−E p /kT ⟨u n |u p ⟩ =0
(54)
Im thermodynamischen Gleichgewicht sind die Besetzungen der stationären Zustän de exponentiell fallende Funktionen der Energie (wobei der Abfall umso rascher er folgt, je tiefer die Temperatur T ist) und die Kohärenzen zwischen den stationären Zuständen gleich null. 5-b Beschreibung eines Teilsystems. Partielle Spur Wir kehren jetzt zu dem in § 3 von Ergänzung DIII angeschnittenen Problem zurück. Wir betrachten also zwei verschiedene Teilsysteme (1) und (2) und das Gesamtsystem (1) + (2), dessen Zustandsraum das Tensorprodukt H = H(1) ⊗ H(2)
(55)
der beiden Zustandsräume für das Teilsystem (1) und (2) ist. Es sei {|u n (1)⟩} eine Basis in H(1) und {|v p (2)⟩} eine Basis in H(2). Dann bilden die Kets |u n (1)⟩|v p (2)⟩ eine Basis in H. Der Dichteoperator ρ des Gesamtsystems ist ein Operator, der im Raum H wirkt. In Kap. II, § F-2-b haben wir gesehen, wie ein Operator, der nur in H(1) [oder nur in
•
300 | Ergänzung EIII
H(2)] wirkt, in den Raum H fortgesetzt werden kann. Hier wollen wir zeigen, wie man umgekehrt von ρ ausgehend einen Operator ρ(1) [bzw. ρ(2)] konstruieren kann, der nur in H(1) [bzw. nur in H(2)] wirkt und mit dem sämtliche Vorhersagen über Mes sungen nur am System (1) [bzw. nur am System (2)] formuliert werden können. Man spricht bei dieser Operation vom Bilden der Teilspur in Bezug auf (2) [bzw. auf (1)]. Wir führen den Operator ρ(1) mit den Matrixelementen ⟨u n (1)|ρ(1)|u n (1)⟩ = ∑(⟨u n (1)|⟨v p (2)|)ρ(|u n (1)⟩|v p (2)⟩)
(56)
p
ein. Man erhält also den Operator ρ(1), indem man über (2) die Teilspur bildet: ρ(1) = Tr2 {ρ}
(57)
Entsprechend hat ρ(2) = Tr1 {ρ}
(58)
die Matrixelemente ⟨v p (2)|ρ(2)|v p (2)⟩ = ∑(⟨u n (1)|⟨v p (2)|)ρ(|u n (1)⟩|v p (2)⟩)
(59)
n
Der Begriff Teilspur erscheint sofort verständlich, denn die (Gesamt-)Spur von ρ ist Tr{ρ} = ∑ ∑(⟨u n (1)|⟨v p (2)|)ρ(|u n (1)⟩|v p (2)⟩) n
(60)
p
und der Unterschied zwischen dieser Gleichung und Gl. (56) [bzw. Gl. (59)] besteht darin, dass man beim Bilden der Teilspur nicht n = n (bzw. p = p ) setzt und nur über p (bzw. nur über n) summiert. Übrigens gilt Tr{ρ} = Tr1 (Tr2 {ρ}) = Tr2 (Tr1 {ρ})
(61)
Die Operatoren ρ(1) und ρ(2) haben wie ρ die Spur eins. Wie aus ihrer Definition her vorgeht, sind sie hermitesch und besitzen darüber hinaus alle Eigenschaften eines Dichteoperators (s. § 4-b). Es sei jetzt A(1) eine Observable in H(1) und ̃ A(1) = A(1) ⊗ 𝟙(2) ihre Fortsetzung in den Raum H. Dann erhält man mit der Definitionsgleichung (31) für die Spur und der Vollständigkeitsrelation für die Basis {|u n (1)⟩|v p (2)⟩} ⟨̃ A(1)⟩ = Tr{ρ ̃ A(1)} = ∑ ∑ (⟨u n (1)|⟨v p (2)|)ρ(|u n (1)⟩|v p (2)⟩) n,p n ,p
× (⟨u n (1)|⟨v p (2)|)A(1) ⊗ 𝟙(2)(|u n (1)⟩|v p (2)⟩) =
∑
(⟨u n (1)|⟨v p (2)|)ρ(|u n (1)⟩|v p (2)⟩)
n,p,n ,p
× ⟨u n (1)|A(1)|u n (1)⟩⟨v p (2)|v p (2)⟩
(62)
Der Dichteoperator
| 301
•
Weil aber ⟨v p (2)|v p (2)⟩ = δ pp
(63)
ist, kann man Gl. (62) auf die Form ⟨̃ A(1)⟩ = ∑ [∑⟨u n (1) v p (2)|ρ|u n (1) v p (2)⟩] ⟨u n (1)|A(1)|u n (1)⟩ n,n
(64)
p
bringen. In der eckigen Klammer steht aber gerade die rechte Seite von Gl. (56), mit der wir den Operator ρ(1) definiert haben. Darum können wir schreiben ⟨̃ A(1)⟩ = ∑ ⟨u n (1)|ρ(1)|u n (1)⟩⟨u n (1)|A(1)|u n (1)⟩ n,n
= ∑⟨u n (1)|ρ(1)A(1)|u n (1)⟩ n
= Tr{ρ(1)A(1)}
(65)
Vergleichen wir dieses Resultat mit Gl. (31), so sehen wir, dass man mit ρ(1) alle Er wartungswerte ⟨̃ A(1)⟩ berechnen kann, wie wenn wir es nur mit dem System (1) zu tun hätten und ρ(1) sein Dichteoperator wäre. Wiederholen wir die bei Gl. (17) getroffene Feststellung, so sehen wir, dass man mit dem Operator ρ(1) die Wahrscheinlichkeiten für alle Messungen ermitteln kann, die nur am System (1) durchgeführt werden. Bemerkungen: 1. Wie wir in Ergänzung DIII sahen, ist es nicht möglich, dem System (1) [oder dem System (2)] einen Zustandsvektor zuzuordnen, wenn der Zustand des Gesamtsystems (1) + (2) kein tensori elles Produkt ist. Jetzt stellen wir fest, dass der Dichteoperator sich als ein viel zweckmäßigeres Hilfsmittel zur Beschreibung eines quantenmechanischen Systems erweist, als es der Begriff des Zustandsvektors ist: Ob das Gesamtsystem nun in einem Produktzustand ist oder nicht, ob wir es mit einem reinen oder mit einem gemischten Fall zu tun haben, stets kann man dem Teilsys tem (1) bzw. (2) über die Teilspurbildung einen Dichteoperator zuweisen, mit dem man für dieses Teilsystem alle physikalischen Vorhersagen berechnen kann. 2. Selbst wenn der Dichteoperator ρ des Gesamtsystems einen reinen Zustand beschreibt (Tr{ρ2 } = 1), ist das im Allgemeinen bei den aus ρ durch Teilspurbildung erhaltenen Operatoren ρ(1) und ρ(2) nicht der Fall: Mit Gl. (56) bzw. Gl. (59) kann man nämlich zeigen, dass im Allgemei nen Tr{ρ2 (1)} von eins verschieden ist (Entsprechendes gilt für Tr{ρ2 (2)}). Wieder ergibt sich, dass im Allgemeinen das System (1) bzw. (2) nur dann durch einen Zustandsvektor beschrieben werden kann, wenn sich das Gesamtsystem in einem Produktzustand befindet. 3. Befindet sich das Gesamtsystem in einem Produktzustand |ψ⟩ = |φ(1)⟩|χ(2)⟩
(66)
so ergibt sich der Dichteoperator sofort zu ρ = σ(1) ⊗ τ(2)
(67)
mit σ(1) = |φ(1)⟩⟨φ(1)| τ(2) = |χ(2)⟩⟨χ(2)|
(68)
•
302 | Ergänzung EIII
Allgemeiner kann man Zustände des Gesamtsystems betrachten, für die der Dichteoperator ρ wie in Gl. (67) faktorisiert ist [dabei können σ(1) und τ(2) sowohl gemischte wie reine Zustände beschreiben]. Die Bildung der Teilspur liefert dann Tr2 {σ(1) ⊗ τ(2)} = σ(1) Tr1 {σ(1) ⊗ τ(2)} = τ(2)
(69)
Ein Ausdruck wie in Gl. (67) repräsentiert demnach die Zusammenfassung eines Systems (1), das durch den Dichteoperator σ(1) beschrieben wird, mit einem System (2), beschrieben durch den Dichteoperator τ(2). 4. Von einem beliebigen [nicht in der Form (67) vorliegenden] Dichteoperator ρ ausgehend, be rechnen wir ρ(1) = Tr2 {ρ} und ρ(2) = Tr1 {ρ} und bilden dann das Produkt ρ = ρ(1) ⊗ ρ(2)
(70)
Im Allgemeinen ist ρ von dem unter Punkt (3) betrachteten ρ verschieden: Weil der Dichteope rator nicht mehr wie in Gl. (67) faktorisiert ist, besteht zwischen den Systemen (1) und (2) eine gewisse „Korrelation“, die im Operator ρ nicht mehr enthalten ist. 5. Wird die zeitliche Entwicklung des Gesamtsystems durch Gl. (36) bestimmt, so ist es im Allge meinen nicht möglich, einen Hamilton-Operator nur für das System (1) anzugeben, mit dem man eine analoge Differentialgleichung für den Operator ρ(1) aufstellen könnte: Während die Definiti on von ρ(1) einfach ist, ist die Beschreibung seiner zeitlichen Entwicklung sehr viel schwieriger.
Referenzen und Literaturhinweise Artikel von Fano (2.31), Ter Haar (2.32). Zur Verwendung des Dichteoperators bei der Untersuchung von Relaxationsprozessen: Abragam (14.1), Kap. VIII; Slichter (14.2), Kap. 5; Sargent, Scully und Lamb (15.5), Kap. VII.
Der Entwicklungsoperator
|
303
•
Ergänzung FIII Der Entwicklungsoperator 1 2
Allgemeine Eigenschaften | 303 Konservative Systeme | 305
In § D-1-b von Kap. III hatten wir gesehen, dass wir vom Zustandsvektor |ψ(t0 )⟩ zum Anfangszeitpunkt t0 zum Zustandsvektor für einen beliebigen späteren Zeitpunkt t durch eine lineare Transformation gelangen können. Es existiert also ein linearer Ope rator U(t, t0 ), so dass |ψ(t)⟩ = U(t, t0 ) |ψ(t0 )⟩
(1)
gilt. Man nennt diesen Operator den Entwicklungsoperator des Systems, und wir wol len in diesem Abschnitt seine grundsätzlichen Eigenschaften untersuchen.
1 Allgemeine Eigenschaften Weil Gl. (1) für einen beliebigen Ket |ψ(t0 )⟩ gültig ist, haben wir zunächst U(t0 , t0 ) = 𝟙
(2)
Setzen wir andererseits Gl. (1) in die Schrödinger-Gleichung ein, so erhalten wir iℏ
∂ U(t, t0 )|ψ(t0 )⟩ = H(t)U(t, t0 )|ψ(t0 )⟩ ∂t
(3)
woraus sich die Beziehung iℏ
∂ U(t, t0 ) = H(t)U(t, t0 ) ∂t
(4)
ergibt. Durch diese Differentialgleichung erster Ordnung und die Anfangsbedin gung (2) ist der Entwicklungsoperator U(t, t0 ) vollständig bestimmt. Man kann Gl. (2) und Gl. (4) zu der Integralgleichung t
i U(t, t0 ) = 𝟙 − ∫ H(t ) U(t , t0 ) dt ℏ
(5)
t0
zusammenfassen. Betrachten wir jetzt den in U(t, t0 ) auftretenden Parameter t0 als eine Variable t , so können wir Gl. (1) auch in der Form |ψ(t)⟩ = U(t, t ) |ψ(t )⟩ https://doi.org/10.1515/9783110638738-027
(6)
•
304 | Ergänzung FIII
schreiben. Weil aber |ψ(t )⟩ auf die gleiche Weise aus einem Ket |ψ(t )⟩ durch die Transformation |ψ(t )⟩ = U(t , t ) |ψ(t )⟩
(7)
erhalten werden kann, gilt auch |ψ(t)⟩ = U(t, t )U(t , t )|ψ(t )⟩
(8)
Andererseits ist |ψ(t)⟩ = U(t, t )|ψ(t )⟩, so dass sich, weil |ψ(t )⟩ beliebig ist, U(t, t ) = U(t, t )U(t , t )
(9)
ergibt. Der Vorgang lässt sich sofort verallgemeinern und wir erhalten mit beliebigen t1 , t2 , . . . , t n den Zusammenhang U(t n , t1 ) = U(t n , t n−1 ) . . . U(t3 , t2 )U(t2 , t1 )
(10)
Setzt man voraus, dass t1 < t2 < t3 < ⋅ ⋅ ⋅ < t n ist, so kann man diese Beziehung leicht interpretieren: Um von t1 nach t n zu gelangen, schreitet das System von t1 nach t2 , dann von t2 zu t3 usw. und schließlich von t n−1 nach t n fort. Setzen wir in Gl. (9) t = t und beachten Gl. (2), so wird 𝟙 = U(t, t )U(t , t)
(11)
oder auch nach Vertauschen von t und t 𝟙 = U(t , t)U(t, t )
(12)
Darum ist U(t , t) = U −1 (t, t )
(13)
Wir bestimmen jetzt den Entwicklungsoperator zwischen zwei infinitesimal benach barten Zeitpunkten. Hierzu schreiben wir die Schrödinger-Gleichung in der Form d|ψ(t)⟩ = |ψ(t + dt)⟩ − |ψ(t)⟩ i = − H(t)|ψ(t)⟩ d t ℏ
(14)
Darum ist |ψ(t + dt)⟩ = [𝟙 −
i H(t) d t] |ψ(t)⟩ ℏ
(15)
und somit der gesuchte infinitesimale Entwicklungsoperator U(t + dt, t) = 𝟙 −
i H(t) d t ℏ
(16)
Der Entwicklungsoperator
| 305
•
Weil H(t) hermitesch ist, ist U(t + dt, t) unitär, s. § 3 von Ergänzung CII . Dann ist aber auch U(t, t ) unitär: Zerlegt man nämlich das Intervall [t, t ] in eine sehr große Anzahl von infinitesimalen Intervallen, so ist nach Gl. (10) U(t, t ) ein Produkt aus unitären Operatoren und mithin unitär. Folglich kann Gl. (13) auch U † (t, t ) = U −1 (t, t ) = U(t , t)
(17)
geschrieben werden. Übrigens war zu erwarten, dass die Transformation U(t, t ) unitär ist, dass also bei ihrer Wirkung auf einen Vektor dessen Norm erhalten bleibt. In § D-1-c von Kap. III hatten wir nämlich gezeigt, dass sich die Norm des Zustands vektors zeitlich nicht ändert.
2 Konservative Systeme Hängt der Hamilton-Operator nicht explizit von der Zeit ab, so lässt sich Gl. (4) ohne Schwierigkeit integrieren. Man erhält bei Berücksichtigung der Anfangsbedingung (2) U(t, t0 ) = e−i H(t−t 0)/ℏ
(18)
Die von uns aufgeführten Eigenschaften des Entwicklungsoperators lassen sich an diesem Ausdruck unmittelbar verifizieren. Mit Gl. (18) wird der Übergang von Gl. (D-52) zu Gl. (D-54) aus Kap. III sehr einfach. Man muss nur den Entwicklungsoperator U(t, t0 ) auf die beiden Seiten von Gl. (D-52) anwenden und beachten, dass |φ n,τ ⟩ Eigenvektor von H zum Eigenwert E n ist: U(t, t0 )|φ n,τ ⟩ = e−i H(t−t 0)/ℏ |φ n,τ ⟩ = e−iE n (t−t 0)ℏ |φ n,τ ⟩
(19)
Bemerkungen: 1. Bei einem zeitabhängigen Hamilton-Operator H könnte man zunächst vermuten, dass in Ana logie zu Gl. (18) der Entwicklungsoperator gleich dem Operator i t − ℏ ∫t H(t ) d t
V(t, t0 ) = e
0
(20)
ist, doch ist dies nicht der Fall, weil im Allgemeinen die Zeitableitung eines Operators der Form eF(t) nicht gleich F (t)eF(t) ist (s. § 5-c von Ergänzung BII ). Im Allgemeinen gilt also iℏ
∂ V(t, t0 ) ≠ H(t)V(t, t0 ) ∂t
(21)
2. Bei den in § E-1-b von Kap. III beschriebenen Versuchen hatten wir bereits festgestellt, dass die Messungen der Observablen A, B und C nicht unbedingt kurz hintereinander erfolgen müssen. Wenn sich das System zwischen den aufeinanderfolgenden Messungen zeitlich entwickelt, so kann man die Änderungen des Zustandsvektors durch Anwendung des Entwicklungsoperators berücksichtigen. Sind t0 , t1 und t2 die Zeitpunkte, zu denen man die Observable A, B bzw. C misst, so muss man einfach Gl. (E-15) und Gl. (E-17) aus Kap. III durch 𝒫a (c) = |⟨v c |U(t2 , t0 )|u a ⟩|2
(22)
•
306 | Ergänzung FIII
und 𝒫a (b, c) = |⟨v c |U(t2 , t1 )|w b ⟩|2 |⟨w b |U(t1 , t0 )|u a ⟩|2
(23)
ersetzen. Mit Berücksichtigung der Beziehung (9) ergibt sich dann weiter ⟨v c |U(t2 , t0 )|u a ⟩ = ⟨v c |U(t2 , t1 )U(t1 , t0 )|u a ⟩ = ∑⟨v c |U(t2 , t1 )|w b ⟩⟨w b |U(t1 , t0 )|u a ⟩
(24)
b
Setzt man dies in Gl. (22) ein, so erkennt man wieder, dass 𝒫a (c) von ∑b 𝒫a (b, c) verschieden ist.
Referenzen und Literaturhinweise Der Entwicklungsoperator ist von fundamentaler Bedeutung für die Theorie der Stoß prozesse (siehe Referenzen in Kapitel VIII) und für die zeitabhängige Störungstheorie (siehe Referenzen in Kapitel XIII).
Schrödinger- und Heisenberg-Bild | 307
•
Ergänzung GIII Schrödinger- und Heisenberg-Bild Bei dem von uns vorgestellten Formalismus sind die den Observablen zugeordneten Operatoren im Allgemeinen zeitunabhängig, s. § D-1-d von Kap. III. Dies ist z. B. beim Ortsoperator, beim Impulsoperator und bei der kinetischen Energie eines Teilchens der Fall. Die Entwicklung des Systems ist vollständig im Zustandsvektor |ψ(t)⟩ enthal ten, den wir im Folgenden mit dem Index S kennzeichnen wollen, |ψS (t)⟩, und ergibt sich aus der Schrödinger-Gleichung. Nimmt man diesen Standpunkt ein, so spricht man vom Schrödinger-Bild. Grundsätzlich werden sämtliche physikalischen Aussagen der Quantenmechanik durch Skalarprodukte eines Bras mit einem Ket oder durch die Matrixelemente von Operatoren ausgedrückt. Diese Größen sind jedoch gegenüber einer gleichzeitigen unitären Transformation der Kets und der Operatoren invariant (s. Ergänzung CII ). Wählt man nun eine solche Transformation, die den Ket |ψS (t)⟩ in einen zeitunab hängigen Ket überführt, so werden dafür die eben genannten Observablen von der Zeit abhängen: Man gelangt zum Heisenberg-Bild. Der Deutlichkeit halber werden wir in diesem Abschnitt Kets und Operatoren mit dem Index S kennzeichnen, wenn wir uns im Schrödinger-Bild befinden, dagegen mit dem Index H, sobald wir das Heisenberg-Bild verwenden. In allen folgenden Ab schnitten wählen wir dann das Schrödinger-Bild, so dass wir uns dort den Index S stillschweigend hinzudenken können. Der Zustandsvektor |ψS (t)⟩ zu einem beliebigen Zeitpunkt t ergibt sich aus dem Anfangszustand |ψS (t0 )⟩ durch die Beziehung |ψS (t)⟩ = U(t, t0 )|ψS (t0 )⟩
(1)
worin U(t, t0 ) der im vorigen Abschnitt eingeführte Entwicklungsoperator ist. Weil dieser Operator unitär ist, gelangen wir zu einem zeitlich konstanten Vektor, wenn wir mit dem Operator U † (t, t0 ) die unitäre Transformation durchführen: |ψH ⟩ = U † (t, t0 )|ψS (t)⟩ = U † (t, t0 )U(t, t0 )|ψS (t0 )⟩ = |ψS (t0 )⟩
(2)
Im Heisenberg-Bild stimmt der konstante Zustandsvektor mit dem Zustandsvektor |ψS (t0 )⟩ zum Anfangszeitpunkt überein. Die Transformierte AH (t) eines Operators AS (t) ist nach § 2 von Ergänzung CII durch AH (t) = U † (t, t0 )AS (t)U(t, t0 )
(3)
gegeben und hängt, wie wir bereits wissen, im Allgemeinen selbst dann von der Zeit ab, wenn AS zeitunabhängig ist. https://doi.org/10.1515/9783110638738-028
•
308 | Ergänzung GIII
Von besonderem Interesse ist nun der Fall, bei dem sowohl AS als auch AH kon stant sind: Dies ergibt sich, wenn das System konservativ, also der Hamilton-Opera tor HS zeitunabhängig ist und AS mit HS vertauscht (AS ist dann eine Konstante der Bewegung, s. § D-2-c von Kap. III). Der Entwicklungsoperator ist in diesem Fall U(t, t0 ) = e−iHS (t−t 0)/ℏ
(4)
wenn AS mit HS vertauscht, so auch mit U(t, t0 ) (s. § 4-c von Ergänzung BII ). Deshalb ist AH (t) = U † (t, t0 )U(t, t0 )AS = AS
(5)
Die Operatoren AS und AH sind gleich, insbesondere ist HS = HH , d. h. die Indizes S und H können beim Hamilton-Operator entfallen. Für die zeitliche Änderung eines beliebigen Operators AS (t) erhalten wir unter Berücksichtigung von Gl. (4) aus Ergänzung FIII und der zu ihr adjungierten Beziehung 1 dAS (t) d AH (t) = − U † (t, t0 )HS (t)AS (t)U(t, t0 ) + U † (t, t0 ) U(t, t0 ) dt iℏ dt 1 + U † (t, t0 )AS (t)HS (t)U(t, t0 ) iℏ
(6)
Schieben wir im ersten und im letzten Summanden der rechten Seite das Produkt U(t, t0 )U † (t, t0 ) = 𝟙 ein [s. Gl. (17) in Ergänzung FIII ], so wird d 1 AH (t) = − U † (t, t0 )HS (t)U(t, t0 )U † (t, t0 )AS (t)U(t, t0 ) dt iℏ dAS (t) + U † (t, t0 ) U(t, t0 ) dt 1 + U † (t, t0 )AS (t)U(t, t0 )U † (t, t0 )HS (t)U(t, t0 ) iℏ
(7)
Damit ergibt sich nach der Definition (3) schließlich iℏ
d d AH (t) = [AH (t), HH (t)] + iℏ ( AS (t)) dt dt H
(8)
Bemerkungen: 1. Historisch gesehen ist das erste Bild von Schrödinger entwickelt worden, wobei er zu der nach ihm benannten Gleichung gelangte, während das zweite Bild auf Heisenberg zurückgeht, der die zeitliche Entwicklung der Matrizen behandelte, die die verschiedenen Operatoren A H (t) darstell ten (daher der Name „Matrizenmechanik“). Die Äquivalenz der beiden Bilder wurde kurz darauf bewiesen. 2. Aus der Beziehung (8) erhält man sofort Gl. (D-27) von Kap. III, die zeitliche Änderung des Erwartungswerts von A(t). Diese kann man nämlich wegen ⟨A⟩(t) = ⟨ψS (t)|A S (t)|ψS (t)⟩ = ⟨ψH |A H (t)|ψH ⟩
(9)
auch im Heisenberg-Bild berechnen. Auf der rechten Seite dieser Gleichung hängt nur A H (t) von der Zeit ab, so dass sich Gl. (D-27) sofort durch Differentiation nach der Zeit ergibt. Wir halten
Schrödinger- und Heisenberg-Bild |
309
•
jedoch fest, dass Gl. (8) allgemeiner ist als Gl. (D-27), weil sie im Gegensatz zu dieser die Gleich heit zweier Operatoren ausdrückt und nicht nur die Gleichheit von Erwartungswerten, d. h. von Matrixelementen. 3. Die Beziehung (8) wird sehr einfach, wenn das untersuchte System nur aus einem Teilchen mit der Masse m besteht, das einem Potential unterworfen ist. Im eindimensionalen Fall ist dann der Hamilton-Operator H S (t) =
P 2S + V(XS , t) 2m
(10)
und daher wegen Gl. (35) aus Ergänzung CII H H (t) =
P 2H + V(XH , t) 2m
(11)
Setzt man Gl. (11) in Gl. (8) ein und beachtet, dass [XH , P H ] = [XS , P S ] = iℏ ist, so folgt nach einer analogen Überlegung wie in § D-1-d von Kap. III d 1 XH (t) = P H (t) dt m
(12)
d ∂V P H (t) = − (XH , t) dt ∂X Diese beiden Gleichungen verallgemeinern das Theorem von Ehrenfest [s. die Gleichungen (D-34) und (D-35) aus Kap. III]. Sie haben die gleiche Form wie die Bewegungsgleichungen für die klas sischen Größen x und p [s. die Beziehungen (D-36a) und (D-36b) aus Kap. III]. In dieser formalen Ähnlichkeit zur klassischen Mechanik liegt ein Vorteil des Heisenberg-Bildes.
Referenzen und Literaturhinweise Wechselwirkungsbild: Messiah (1.17). Kap. VIII, § 14; Schiff (1.18), § 24; Merzbacher (1.16), Kap. 18, § 7.
•
310 | Ergänzung HIII
Ergänzung HIII Eichinvarianz 1 2 2-a 2-b 3 3-a 3-b 3-c
Problemstellung. Begriff der Eichung | 310 Eichinvarianz in der klassischen Mechanik | 311 Die Newtonsche Bewegungsgleichung | 311 Der Hamilton-Formalismus | 311 Eichinvarianz in der Quantenmechanik | 316 Quantisierungsregeln | 316 Unitäre Transformation des Zustandsvektors und Forminvarianz der Schrödinger-Gleichung | 318 Eichinvarianz der physikalischen Aussagen | 321
1 Problemstellung. Begriff der Eichung Ein elektromagnetisches Feld wird beschrieben, indem man für jeden Raum-Zeit punkt die elektrische Feldstärke E(r; t) und die magnetische Induktion B(r; t) angibt. Weil elektrische und magnetische Feldstärke den Maxwellschen Gleichungen genü gen, sind sie nicht voneinander unabhängig. Statt der beiden Vektorfelder kann man ein skalares Potential U(r; t) und ein Vektorpotential A(r; t) so einführen, dass E(r; t) = −∇U(r; t) −
∂ A(r; t) ∂t
(1)
B(r; t) = ∇ × A(r; t) gilt. Man kann, von den Maxwellschen Gleichungen ausgehend (s. Anhang III, § 4-b-α), zeigen, dass derartige Funktionen U(r; t) und A(r; t) stets existieren, jedoch sind bei Vorgabe von E(r; t) und B(r; t) die Potentiale U(r; t) und A(r; t) nicht eindeutig be stimmt. Hat man nämlich zwei Potentiale U(r; t) und A(r; t), so erhält man mit der Transformation ∂ χ(r; t) ∂t A (r; t) = A(r; t) + ∇χ(r; t)
U (r; t) = U(r; t) −
(2)
zwei weitere Potentiale, die dasselbe elektromagnetische Feld wie U(r; t) und A(r; t) beschreiben. Dabei ist χ(r; t) eine beliebige Funktion von r und t. Zum Beweis ersetzt man einfach in Gl. (1) U(r; t) durch U (r; t) und A(r; t) durch A (r; t) und erkennt, dass E(r; t) und B(r; t) ungeändert bleiben. Man kann ferner zeigen, dass die Beziehun gen (2) alle möglichen skalaren und Vektorpotentiale für ein gegebenes elektroma gnetisches Feld liefern. Wählt man zur Beschreibung eines elektromagnetischen Feldes ein bestimmtes Paar von Potentialen aus, so sagt man, man habe eine bestimmte Eichung vorgenom men. Geht man zu einem anderen Paar von Potentialen über, so spricht man von einer Eichtransformation. https://doi.org/10.1515/9783110638738-029
Eichinvarianz |
311
•
Nun treten in den Bewegungsgleichungen eines physikalischen Systems oft die Potentiale U(r; t) und A(r; t) und nicht die Feldstärken E(r; t) und B(r; t) auf. In einem Beispiel haben wir dies in § B-5-b von Kap. III bereits gesehen, als wir die SchrödingerGleichung für ein Teilchen mit der Ladung q anschrieben, das sich in einem elektro magnetischen Feld bewegt, s. Gl. (B-48) aus Kap. III. Es stellt sich dann die Frage, ob die physikalischen Aussagen der Theorie nur von den Werten der Felder E(r; t) und B(r; t) in jedem Raum-Zeitpunkt oder auch von der Eichung abhängen, die man bei den Potentialen gewählt hat. Damit in diesem Fall die Theorie überhaupt einen Sinn hat, muss man offensichtlich präzisieren, in welcher Eichung die Gleichungen gelten sollen. In diesem Abschnitt wollen wir diese Frage beantworten. Wir werden sehen, dass in der klassischen (§ 2) wie in der Quantenmechanik (§ 3) die physikalischen Resultate durch eine Eichtransformation nicht modifiziert werden. Das skalare und das Vektor potential treten danach nur als Zwischengrößen bei der Berechnung der elektrischen und der magnetischen Feldstärke auf. Man sagt, klassische und Quantenmechanik sind eichinvariant.
2 Eichinvarianz in der klassischen Mechanik 2-a Die Newtonsche Bewegungsgleichung In der klassischen Mechanik kann man die Bewegung eines Teilchens¹, das sich mit der Ladung q und der Masse m in einem elektromagnetischen Feld befindet, berech nen, wenn man die auf das Teilchen ausgeübte Kraft f = q[E(r; t) + v × B(r; t)]
(3)
kennt; v ist darin die Teilchengeschwindigkeit. Setzt man dieses Kraftgesetz in die Newtonsche Bewegungsgleichung m
d2 r(t) = f dt2
(4)
ein, so treten hier die Feldstärken selbst auf, und die Frage der Eichinvarianz stellt sich nicht. 2-b Der Hamilton-Formalismus Man kann aber auch von den Hamilton-Gleichungen ausgehen. Diese sind (s. An hang III) zur Newtonschen Gleichung äquivalent. Weil wir aber bei der Quantisierung 1 Der Einfachheit halber nehmen wir in diesem Abschnitt an, dass das System nur aus einem Teilchen besteht. Die Verallgemeinerung auf Mehrteilchensysteme bietet keine grundsätzlichen Schwierigkei ten.
•
312 | Ergänzung HIII
eines physikalischen Systems vom Hamilton-Formalismus ausgegangen sind, wollen wir sehen, wie sich in diesem Formalismus eine Eichtransformation darstellt. Bei ihm sind ja das skalare und das Vektorpotential unerlässlich, und die Eigenschaft der Eich invarianz ist nicht unmittelbar zu erkennen. α Dynamische Variablen und ihre Zeitabhängigkeit Um die Bewegung eines Teilchens zu bestimmen, das der durch Gl. (3) gegebenen Kraft unterworfen ist, kann man von der Lagrange-Funktion² 1 mv2 − q[U(r; t) − v ⋅ A(r; t)] 2 ausgehen. Mit diesem Ausdruck kann man dann den Impuls durch L(r, v; t) =
(5)
p = ∇v L(r, v; t) = mv + qA(r; t)
(6)
berechnen und weiter die Hamilton-Funktion 1 H(r, p; t) = (7) [p − qA(r; t)]2 + qU(r; t) 2m einführen. Im Hamilton-Formalismus ist der Zustand des Teilchens durch seinen Ort r und seinen Impuls p definiert. Die fundamentalen dynamischen Variablen sind jetzt r und p, und nicht mehr wie in der Newtonschen oder der Lagrangeschen Formulierung der Ort und die Geschwindigkeit. Dabei darf man den zu r kanonisch konjugierten Impuls p nicht mit der Bewegungsgröße π = mv
(8)
verwechseln, da sie sich nach Gl. (6) unterscheiden. Vielmehr ist π = p − qA(r; t)
(9)
Diese (und damit die Geschwindigkeit) kann man also berechnen, wenn r und p bekannt sind. Auch alle anderen Teilchengrößen wie die kinetische Energie, der Drehimpuls usw. werden im Hamilton-Formalismus als Funktionen der dynamischen Variablen r und p (und evtl. der Zeit t) ausgedrückt. Schließlich lauten die Hamilton-Gleichungen d r(t) = ∇p H[r(t), p(t); t] dt
(10)
d p(t) = −∇r H[r(t), p(t); t] dt Darin ist H die durch (7) gegebene Hamilton-Funktion. Sind die Anfangsbedingungen bekannt, so liefert die Integration dieses Gleichungssystems die Werte der dynami schen Variablen für jeden Zeitpunkt. 2 Wir geben hier eine Reihe von Ergebnissen der analytischen Mechanik aus dem Anhang III an.
Eichinvarianz
| 313
•
Um die Hamilton-Gleichungen anschreiben zu können, muss man eine bestimm te Eichung E, d. h. ein bestimmtes Paar {U(r; t), A(r; t)} von Potentialen wählen. Was geschieht nun, wenn man statt dieser Eichung für dasselbe elektromagnetische Feld eine davon verschiedene Eichung E mit den Potentialen U (r; t) und A (r; t) nimmt? Wir kennzeichnen die dynamischen Größen des Teilchens in dieser Eichung durch ei nen Strich. In der Newtonschen Formulierung sind der Ort r und die Geschwindigkeit v von der gewählten Eichung unabhängig r (t) = r(t)
π (t) = π(t)
(11a) (11b)
Nun ist nach Gl. (9) π(t) = p(t) − qA[r(t); t] π (t) = p (t) − qA [r (t); t]
(12)
also müssen die verallgemeinerten Impulse p(t) und p (t) in den beiden Eichungen verschieden sein, da sie ja der Beziehung p (t) − qA [r (t) ; t] = p(t) − qA[r(t); t]
(13)
zu genügen haben. Ist χ(r; t) die Funktion, mit der man von der einen zur anderen Eichung gelangt, s. Gl. (2), so transformieren sich bei diesem Wechsel die fundamen talen dynamischen Variablen gemäß den Gleichungen r (t) = r(t)
p (t) = p(t) + q∇χ(r(t); t)
(14a) (14b)
Im Hamilton-Formalismus hängen sie also von der Wahl der Eichung ab. Dies ist je doch nicht überraschend, weil in diesem Formalismus das skalare und das Vektorpo tential in den Bewegungsgleichungen für Ort und Impuls explizit auftreten [Gleichun gen (7) und (10)]. β „Wahre physikalische“ und „nichtphysikalische“ Größen 1. Definitionen Wir sehen, dass wir dem Teilchen zwei Arten von Größen zuordnen können: Zum ei nen gibt es Größen wie r oder π, die bei zwei verschiedenen Eichungen zu einem be stimmten Zeitpunkt dieselben Werte annehmen, zum anderen aber Größen wie z. B. p, deren Werte von der Wahl der Eichung abhängen. Man führt daher folgende allge meine Definition ein: – Hängt der Wert einer dem System zugeordneten Größe (bei einer gegebenen Be wegung) nicht davon ab, in welcher Eichung man das elektromagnetische System beschreibt, so nennt man sie eine wahre physikalische Größe . – Ändern sich dagegen bei einer Eichtransformation die Werte einer Größe, so heißt sie eine nichtphysikalische Größe. Sie erscheint dann wie das Potential als eine Rechengröße, die nicht wirklich beobachtbar ist.
•
314 | Ergänzung HIII
Weil jede Größe eines Systems als Funktion von r und p ausgedrückt wird, stellt sich die Frage, wie man erkennt, ob es sich um eine (wahre) physikalische Größe oder um eine nichtphysikalische Größe handelt. 2. Charakteristische Beziehung für (wahre) physikalische Größen Wir nehmen zunächst an, eine dem Teilchen zugeordnete Größe werde in der Ei chung E durch eine Funktion von r und p (und eventuell der Zeit t) beschrieben; wir wollen sie mit F (r, p; t) bezeichnen. Entspricht dieser Größe in einer anderen Eichung E dieselbe Funktion F (r , p ; t), so stellt man sofort fest, dass es sich um eine nicht physikalische Größe handeln muss [wenn wir von dem Fall absehen, bei dem F nur von r und nicht von p abhängig ist, s. (14)]. Weil bei zwei verschiedenen Eichungen der generalisierte Impuls p verschieden ist, muss dies auch für die Werte von F gelten. Um zu den (wahren) physikalischen Größen eines Systems zu gelangen, müssen wir Funktionen GE (r, p; t) betrachten, deren Form von der jeweils gewählten Eichung abhängt. Hierfür haben wir mit der Bewegungsgröße π ein Beispiel bereits kennen gelernt, denn diese ist über das Vektorpotential A [s. Gl. (9)] eine mittelbare Funktion von r und p. Wenn daher die Funktion GE (r, p; t) eine (wahre) physikalische Größe beschreiben soll, so muss sie der Bedingung GE [r(t), p(t); t] = GE [r (t), p (t); t]
(15)
genügen. Darin sind r(t) und p(t) die Werte von Ort und Impuls in der Eichung E und r (t) und p (t) die Werte in der Eichung E . Setzt man die Beziehungen (14) in Gl. (15) ein, so erhält man den Zusammenhang GE [r(t), p(t); t] = GE [r(t), p(t) + q∇χ (r(t); t) ; t]
(16)
der zu jedem Zeitpunkt und für alle möglichen Bewegungen des Systems gelten muss. Weil man bei festem t die Werte von Ort und Impuls unabhängig voneinander vorge ben kann, müssen die beiden Seiten in dieser Gleichung hinsichtlich der Abhängigkeit von r und p dieselbe Funktion darstellen, es muss also GE [r, p; t] = GE [r, p + q∇χ (r; t) ; t]
(17)
sein. Diese Beziehung ist für Funktionen charakteristisch, die (wahre) physikalische Größen beschreiben. Betrachtet man also die Funktion GE [r, p; t] in der Eichung E und wird in ihr p durch p + q∇χ(r; t) ersetzt (χ(r; t) definiert den Übergang von der Eichung E zur Eichung E ), so erhält man eine neue Funktion von r und p, die mit GE [r, p; t] identisch ist. Ist dies nicht der Fall, so entspricht die Funktion einer nicht physikalischen Größe. 3. Beispiele Wir geben einige Beispiele für Funktionen, die (wahre) physikalische Größen be schreiben. Für den Ort und die Bewegungsgröße haben wir sie bereits kennengelernt: Die erste ist einfach r, während die zweite durch π E (r, p; t) = p − qA(r; t)
(18)
Eichinvarianz
| 315
•
gegeben ist. Wegen der Beziehungen (11) wissen wir schon von vornherein, dass die zugehörigen Funktionen die Gl. (17) erfüllen. Um uns mit dem Gebrauch dieser Beziehung vertraut zu machen, wollen wir dies auch direkt beweisen. Was r betrifft, so handelt es sich um eine Funktion, die von p und damit von der Wahl der Eichung³ nicht abhängt; sie erzwingt also sofort das Bestehen von Gl. (17). Für die Bewegungsgröße liefert Gl. (18) π E (r, p; t) = p − qA (r; t)
(19)
Ersetzt man hierin p durch p + q∇χ(r; t), so erhalten wir die Funktion p + q∇χ(r; t) − qA (r; t) = p − qA(r; t)
(20)
Dies ist aber nichts anderes als π ε (r, p; t), die Beziehung (17) ist also erfüllt. Weiter nennen wir unter den physikalischen Größen die kinetische Energie 1 (21) γ E (r, p; t) = [p − qA(r; t)]2 2m und den Drall (in Bezug auf den Ursprung) λ E (r, p; t) = r × [p − qA(r; t)]
(22)
Allgemeiner kann man feststellen, dass man immer dann eine physikalische Größe erhält, wenn man eine Funktion in der Form GE (r, p; t) = F[r, p − qA(r ; t)]
(23)
konstruiert, wobei F eine Funktion bezeichnet, die von der gewählten Eichung unab hängig ist.⁴ Dies ist physikalisch befriedigend, weil mit Gl. (23) zum Ausdruck kommt, dass sich die Werte der betrachteten Größe aus denen von r und π ergeben, die beide eichunabhängig sind. Schließlich geben wir Beispiele für Funktionen an, die nichtphysikalische Größen beschreiben. Neben dem verallgemeinerten Impuls p ist die Funktion p2 (24) 2m zu nennen, die man nicht mit der kinetischen Energie verwechseln darf, und allge meiner jede Funktion, die nur von p (und eventuell der Zeit) abhängt. Ebenso muss der Drehimpuls C(p) =
𝓛(r, p) = r × p
(25)
als eine nichtphysikalische Größe angesehen werden. Als Letztes führen wir die Ha milton-Funktion an, die nach Gl. (7) die Summe aus der kinetischen Energie γE (r, p; t) 3 Übrigens ist es nicht schwer zu beweisen, dass allgemein jede nur von r (und vielleicht von t) ab hängende Funktion G(r; t), deren Form in jeder Eichung dieselbe ist, eine (wahre) physikalische Größe beschreibt. 4 Man könnte auch Funktionen konstruieren, bei denen die Potentiale in verwickelterer Gestalt als in Gl. (23) auftreten (z. B. im Skalarprodukt der Teilchengeschwindigkeit mit dem elektrischen Feld am Teilchenort usw.).
•
316 | Ergänzung HIII
und der potentiellen Energie qU ist. Genauer sollte man U als UE (r; t) schreiben, weil sie von der Eichung abhängt und damit eine nichtphysikalische Größe darstellt. Damit ist auch die Hamilton-Funktion eine nichtphysikalische Größe.
3 Eichinvarianz in der Quantenmechanik In Kapitel III haben wir die Postulate der Quantenmechanik eingeführt, indem wir vom Hamilton-Formalismus der klassischen Mechanik ausgingen. Dabei war das Pro blem der Eichinvarianz wegen der Existenz der Newtonschen Bewegungsgleichung einfach zu lösen. In der Quantenmechanik liegen die Dinge verwickelter, und wir stel len uns die Frage, ob die Postulate in jeder beliebigen oder nur in einer bestimmten Eichung E gelten. Zur Beantwortung lassen wir uns von den Ergebnissen des vorstehenden Ab schnitts leiten. Wir werden sehen, dass zwischen den Folgen einer Eichtransforma tion im klassischen und im quantenmechanischen Formalismus eine enge Analogie besteht, und können so die Eichinvarianz der Quantenmechanik formulieren. Hierzu untersuchen wir zunächst die Ergebnisse, die wir erhalten, wenn wir die Quantisierungsregeln in zwei verschiedenen Eichungen durchführen. Weil in der klas sischen Mechanik die dynamischen Variablen bei einem Wechsel der Eichung im All gemeinen ihre Werte ändern, werden wir ein physikalisches System durch einen ma thematischen Zustandsvektor |ψ⟩ charakterisieren müssen, der von der Eichung ab hängt. Der Übergang von einer Eichung E zu einer anderen E geschieht durch eine unitäre Transformation, doch bleibt die Form der Schrödinger-Gleichung dabei stets dieselbe(sowieinder klassischenMechanik dieHamilton-GleichungenihreForm nicht ändern). Schließlich untersuchen wir das Verhalten der Observablen des Systems bei einem Wechsel der Eichung. Wir werden sehen, dass die gleichzeitige Änderung des Zu standsvektors und der Observablen so geartet sind, dass der physikalische Gehalt der Quantenmechanik von der gewählten Eichung nicht abhängt. Dies werden wir zeigen, indem wir die Eichinvarianz der Wahrscheinlichkeitsdichte und des Wahrscheinlich keitsstromes beweisen.
3-a Quantisierungsregeln Der Zustandsraum eines Teilchens (ohne Spin) ist stets der Raum Hr . Dagegen erwar tet man nach den vorstehenden Überlegungen (s. § 2), dass der einer Größe zugeord nete Operator in zwei verschiedenen Eichungen unterschiedlich sein kann. Wir kenn zeichnen daher die Operatoren mit einem Index E. Die Quantisierungsregeln ordnen dem Ort r und dem Impuls p des Teilchens die Operatoren R und P in Hr zu, die den Vertauschungsrelationen [X, P x ] = [Y, P y ] = [Z, P z ] = iℏ
(26)
Eichinvarianz | 317
•
genügen (alle anderen Kommutatoren zwischen den Komponenten von R und P sind gleich null). In der Ortsdarstellung wirkt der Operator R wie die Multiplikation mit r und P wie der Differentialoperator ℏi ∇. Diese Regeln sind in jeder Eichung dieselben. Wir können daher schreiben RE = RE
(27a)
PE = PE
(27b)
Der Index erweist sich bei diesen beiden Operatoren als überflüssig und wird im Fol genden fortgelassen. Die Quantisierung aller anderen dem Teilchen zugeordneten Größen ergibt sich aus den Quantisierungsregeln für Ort und Impuls. Man verwendet in einer bestimmten Eichung die Funktion von r und p, die klassisch die betrachtete Größe liefert, und ersetzt darin (nachdem man unter Umständen symmetrisiert hat) r durch R und p durch P. Dies ergibt (in der gewählten Eichung) den Operator, der zu der betreffenden Größe gehört. Wir nennen einige Beispiele: – Der Drehimpulsoperator, den man aus dem klassischen Ausdruck r × p erhält, ist in jeder Eichung gleich: LE = LE –
(28)
Dagegen hängt der der Bewegungsgröße zugeordnete Operator von der Wahl der Eichung ab. Ist er nämlich in der Eichung E durch ΠE = P − qA(R; t)
(29)
gegeben, so wird er in der Eichung E ΠE = P − qA (R; t)
(30)
Dessen Wirkung in Hr ist von der Wirkung von ΠE verschieden, weil sich die bei den Operatoren wegen ΠE = ΠE − q∇χ(R; t)
–
(31)
unterscheiden. Auch im Operator⁵ ΛE = R × Π E = R × [P − qA(R; t)]
(32)
für den Drall des Teilchens tritt das Vektorpotential explizit auf.
5 Beachtet man die Vertauschungsrelationen für R und ΠE , so kann man zeigen, dass die Symmetri sierung des Ausdrucks (32) nicht erforderlich ist.
•
318 | Ergänzung HIII
–
Schließlich erhält man den Hamilton-Operator aus Gl. (7) HE =
1 [P − qA(R; t)]2 + qU(R; t) 2m
(33)
Offensichtlich ändert sich dieser Operator, wenn man die Eichung wechselt: HE =
1 [P − qA (R; t)]2 + qU (R; t) ≠ HE 2m
(34)
3-b Unitäre Transformation des Zustandsvektors und Forminvarianz der Schrödinger-Gleichung α Der unitäre Operator T χ (t) In der klassischen Mechanik haben wir die Werte der fundamentalen dynamischen Variablen, mit denen wir den Zustand des Teilchens in den beiden verschiedenen Eichungen E und E charakterisierten, mit {r(t), p(t)} und {r (t), p (t)} bezeichnet. Entsprechend sind in der Quantenmechanik |ψ(t)⟩ und |ψ (t)⟩ die Zustandsvektoren in Bezug auf diese beiden Eichungen, und in Analogie zu den Beziehungen (14) gilt für die Erwartungswerte ⟨ψ (t)|RE |ψ (t)⟩ = ⟨ψ(t)|RE |ψ(t)⟩
⟨ψ (t)|PE |ψ (t)⟩ = ⟨ψ(t)|PE + q∇χ(R; t)|ψ(t)⟩
(35a) (35b)
Bei Beachtung der Gleichungen (27) erkennt man sofort, dass dies nur möglich ist, wenn |ψ(t)⟩ und |ψ (t)⟩ zwei verschiedene Vektoren sind. Wir suchen daher nach einer unitären Transformation T χ (t), die den Übergang von |ψ(t)⟩ nach |ψ (t)⟩ erlaubt: |ψ (t)⟩ = T χ (t)|ψ(t)⟩ T †χ (t)T χ (t)
=
T χ (t)T †χ (t)
=𝟙
(36a) (36b)
Nach Gl. (27) scheinen die Gleichungen (35) für einen beliebigen Ket |ψ(t)⟩ erfüllt zu sein, wenn T †χ (t)RT χ (t) = R
(37a)
T †χ (t)PT χ (t) = P + q∇χ(R; t)
(37b)
und
ist. Multiplizieren wir die erste Gleichung von links mit T χ (t), so wird RT χ (t) = T χ (t)R
(38)
Der gesuchte unitäre Operator kommutiert also mit den drei Komponenten von R, und wir können ihn mit einem hermiteschen Operator F(R; t) in der Form T χ (t) = eiF(R;t)
(39)
Eichinvarianz
•
| 319
schreiben. In Verallgemeinerung der Beziehung (48) aus Ergänzung BII gilt dann wei ter [P, T χ (t)] = ℏ∇{F(R; t)}T χ (t)
(40)
Wenn wir dies von links mit T †χ (t) multiplizieren und die resultierende Gleichung in (37b) einsetzen, so erhalten wir den einfachen Zusammenhang ℏ∇{F(R; t)} = q∇χ(R; t)
(41)
der erfüllt wird, wenn q F(R; t) = F0 (t) + χ(R; t) ℏ
(42)
ist. Unterdrücken wir hier den Term F0 (t), weil er beim Zustandsvektor |ψ(t)⟩ zu ei nem (physikalisch) bedeutungslosen globalen Phasenfaktor führt, so ergibt sich der gesuchte Operator zu q
T χ (t) = ei ℏ χ(R;t)
(43)
Geschieht die Transformation von |ψ(t)⟩ durch diesen Operator, so sind die Gleichun gen (35) automatisch erfüllt. Bemerkungen: 1. In der Ortsdarstellung folgt aus den Gleichungen (36a) und (43), dass die Wellenfunktionen ψ(r, t) = ⟨r|ψ(t)⟩ und ψ (r, t) = ⟨r|ψ (t)⟩ über die Gleichung q
ψ (r, t) = ei ℏ χ(r,t) ψ(r, t)
(44)
zusammenhängen. Für die Wellenfunktion bedeutet daher die Eichtransformation einen ortsab hängigen Phasenwechsel, so dass die Eichinvarianz der physikalischen Aussagen nicht von vorn herein klar ist, wenn wir sie mit ψ(r, t) und ψ (r, t) formulieren. 2. Besteht das zu untersuchende System aus mehreren Teilchen mit den Ladungen q 1, q 2 , ...und den Orten r1 , r2 , ..., so muss Gl. (43) durch (1)
(2)
i
T χ (t) = T χ (t) T χ (t) . . . = e ℏ [q1 χ(R1 ,t)+q2 χ(R2 ,t)+⋅⋅⋅ ]
(45)
ersetzt werden.
β Zeitliche Entwicklung des Zustandsvektors Wir zeigen jetzt: Genügt der Ket |ψ(t)⟩ in der Eichung E der Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = HE (t)|ψ(t)⟩ dt
(46)
so erfüllt der durch Gl. (36a) gegebene Zustandsvektor |ψ (t)⟩ in der Eichung E eine Gleichung derselben Form: iℏ
d |ψ (t)⟩ = HE (t)|ψ (t)⟩ dt
Darin ist der Hamilton-Operator HE (t) durch Gl. (34) gegeben.
(47)
•
320 | Ergänzung HIII
Hierzu berechnen wir die linke Seite von Gl. (47). Es ist iℏ
d d |ψ (t)⟩ = iℏ {T χ (t)|ψ(t)⟩} dt dt d d = iℏ { T χ (t)} |ψ(t)⟩ + iℏT χ (t) |ψ(t)⟩ dt dt
(48)
d. h. wegen Gl. (43) und Gl. (46)⁶ iℏ
d ∂ |ψ (t)⟩ = −q { χ(R; t)} T χ (t)|ψ(t)⟩ + T χ (t)HE (t)|ψ(t)⟩ dt ∂t ∂ ̃E (t)} |ψ (t)⟩ = {−q χ(R; t) + H ∂t
(49)
̃E (t) durch die Transformation T χ (t) aus HE (t) hervorgeht: worin H ̃E (t) = T χ (t)HE (t)T †χ (t) H
(50)
Danach wird Gl. (47) erfüllt, wenn ̃E (t) − q ∂ χ(R; t) HE (t) = H ∂t
(51)
̃E (t) durch ist. Nun ist H ̃E (t) = 1 [P ̃ t) ̃ − qA(R; ̃ t)]2 + qU(R; H 2m
(52)
gegeben, worin ̃ = T χ (t)R T †χ (t) = R R
(53a)
̃ = T χ (t)P T †χ (t) = P − q∇χ(R; t) P
(53b)
sich durch die unitäre Transformation T χ (t) aus R bzw. P ergeben. Setzt man diese Beziehungen in Gl. (52) ein, so wird ̃E (t) = 1 [P − qA(R; t) − q∇χ(R; t)]2 + q U(R; t) H 2m
(54)
Ersetzt man mit Gl. (2) die Potentiale der Eichung E durch die der Eichung E , so erhält man unter Beachtung von Gl. (34) die Beziehung (51). Also kann die Schrödinger-Glei chung unabhängig von der gewählten Eichung stets auf die gleiche Weise angeschrie ben werden.
∂ 6 Die Funktion χ hängt von R, aber nicht von P ab und vertauscht folglich mit ∂t χ(R; t). Darum kön nen wir T χ (t) ableiten, wie wenn χ(R, t) eine gewöhnliche Funktion und kein Operator wäre (s. die Bemerkung in § 5-c von Ergänzung BII ).
Eichinvarianz
| 321
•
3-c Eichinvarianz der physikalischen Aussagen α Verhalten der Observablen Unter der Wirkung der unitären Operation T χ (t) wird jede Observable K in ̃ K = T χ (t)K T †χ (t)
(55)
̃ einfach gleich R, während P ̃ von P verschieden transformiert. Nun ist nach Gl. (53) R ̃ ist. Ebenso unterscheidet sich Π ε von Π ε , denn es ist ̃E = P ̃ − qA(R; ̃ t) Π = P − q∇χ(R; t) − qA(R; t) = Π E − q∇χ(R; t)
(56)
Bei Beachtung von Gl. (27a) und Gl. (31) folgt hieraus und aus Gl. (53a), dass die den wahren physikalischen Größen Ort und Bewegungsgröße zugeordneten Observa blen R und ΠE die Eigenschaft ̃ E = RE R ̃ ΠE = ΠE
(57)
besitzen. Dagegen gilt für den Impuls, der keine wahre physikalische Größe ist, nach Gl. (27b) und Gl. (53b) ̃ E ≠ PE P
(58)
Hierbei handelt es sich um ein allgemeines Ergebnis: In der Quantenmechanik ist je der wahren physikalischen Größe ein Operator GE (t) so zugeordnet, dass die Bezie hung ̃ GE (t) = GE (t)
(59)
besteht. Diese ist das quantenmechanische Analogon zur Relation (16). Sehen wir von dem Sonderfall ab, dass der zu einer wahren physikalischen Größe gehörige Operator nur eine Funktion von R oder R selbst ist, so hängt seine Form also von der jeweils ge wählten Eichung ab. Beispiele erkannten wir bereits in den Gleichungen (29) und (32). Zum Beweis von Gl. (59) genügt es, die Quantisierungsregeln auf eine Funktion GE (r, p; t) anzuwenden und die Beziehung (17) zu berücksichtigen, die für klassische wahre physikalische Größen charakteristisch ist. Man ersetzt demnach r und p durch die Operatoren R und P und erhält (falls erforderlich, nach einer passenden Symme trisierung) den Operator GE (t). Hängt die Form der Funktion GE von der Eichwahl ab, so gilt dies auch für GE (t). Beschreibt GE eine wahre physikalische Größe, so gilt nach Gl. (17) GE [R, P; t] = GE [R, P + q∇χ(R; t); t]
(60)
•
322 | Ergänzung HIII
Wenden wir auf diese Gleichung die unitäre Transformation T χ (t) an, so erhalten wir G̃E [R, P; t] = G̃E [R, P + q∇χ(R; t); t] ̃ P ̃ + q∇χ(R; ̃ t); t] = GE [R,
(61)
Beachten wir die Gleichungen (53), so ergibt sich also G̃ε [R, P; t] = GE [R, P; t]
(62)
Nach einer gegebenenfalls erforderlichen Symmetrisierung gelangt man hiermit zur Gl. (59). Als Beispiele für wahre physikalische Größen sind neben R und Π E der Drall Λ E [s. Gl. (32)] und die kinetische Energie KE =
Π2E 1 = [P − qA(R; t)]2 2m 2m
(63)
zu nennen. Dagegen sind der Impulsoperator P und der Drehimpulsoperator L keine wahren physikalischen Größen. Dasselbe gilt auch für den Hamilton-Operator, denn nach Gl. (51) gilt im Allgemeinen ̃E (t) ≠ HE (t) H
(64)
Bemerkung: In der klassischen Mechanik ist die Gesamtenergie eines Teilchens, das sich in einem zeitunab hängigen elektromagnetischen Feld bewegt, eine Konstante der Bewegung. In diesem Fall kann man sich nämlich auf Potentiale beschränken, die ebenfalls nicht von der Zeit abhängen. Dann ist aber nach Gl. (51) ̃E = H E H
(65)
In diesem Sonderfall ist H E eine wahre physikalische Größe, und man darf sie als die Gesamt energie des Teilchens interpretieren.
β Eichunabhängigkeit der Messergebnisse Wir nehmen an, dass wir zu einem bestimmten Zeitpunkt t eine wahre physikalische Größe messen wollen. In der Eichung E werde der Zustand zu diesem Zeitpunkt durch den Ket⁷ |ψ⟩ und die Größe selbst durch die Observable GE beschrieben. Es sei |φ n ⟩ ein Eigenvektor von GE zum Eigenwert g n (der Einfachheit halber setzen wir ihn als nichtentartet voraus): GE |φ n ⟩ = g n |φ n ⟩
(66)
7 Wir unterdrücken die Angabe der Zeitabhängigkeit, weil alle Größen zu der Zeit t genommen werden müssen, zu der man die Messung ausführen will.
Eichinvarianz |
323
•
Aufgrund der quantenmechanischen Postulate ist die Wahrscheinlichkeit, bei der Messung in der Eichung E den Wert g n zu erhalten, 𝒫n = |⟨φ n |ψ⟩|2
(67)
Wie lautet die Voraussage, wenn wir die Eichung wechseln? Nach Gl. (59) ist der Ei genvektor des Operators GE , der der physikalischen Größe in der neuen Eichung E zugeordnet ist, durch |φn ⟩ = T χ |φ n ⟩
(68)
gegeben. Er gehört zum selben Eigenwert g n wie der Vektor |φ n ⟩ in Gl. (66). Es gilt nämlich GE |φn ⟩ = T χ GE T †χ T χ |φ n ⟩ = T χ g n |φ n ⟩ = g n |φn ⟩
(69)
In der Eichung E tritt also der Wert g n stets als ein mögliches Messergebnis auf. Wei ter ist die zugehörige Wahrscheinlichkeit dieselbe wie in der Eichung E, weil nach Gl. (36a) und Gl. (68) ⟨φn |ψ ⟩ = ⟨φ n |T †χ T χ |ψ⟩ = ⟨φ n |ψ⟩
(70)
ist. Somit haben wir gezeigt, dass die Postulate der Quantenmechanik zu physika lischen Aussagen führen, die von der Wahl der Eichung unabhängig sind: Die mögli chen Ergebnisse einer beliebigen Messung und die zugehörigen Wahrscheinlichkeiten sind gegenüber einer Eichtransformation invariant. γ Wahrscheinlichkeitsstromdichte Ausgehend von den Gleichungen (D-9) und (D-20) aus Kap. III berechnen wir die Wahrscheinlichkeit und die Wahrscheinlichkeitsstromdichte in zwei verschiedenen Eichungen E und E . In der ersten Eichung ist ρ(r, t) = |ψ(r, t)|2
(71)
und J(r, t) =
1 ℏ Re {ψ∗ (r, t) [ ∇ − qA(r; t)] ψ(r, t)} m i
(72)
Wegen Gl. (44) erkennen wir sofort, dass ρ (r, t) = |ψ (r, t)|2 = ρ(r, t)
(73)
ist. Weiter folgt, dass q q 1 ℏ Re {e−i ℏ χ(r;t) ψ∗ (r, t) [ ∇ − qA (r; t)] ei ℏ χ(r;t) ψ(r, t)} m i ℏ 1 Re {ψ∗ (r, t) [ ∇ − qA (r; t) + q∇χ(r; t)] ψ(r, t)} = m i
J (r, t) =
(74)
•
324 | Ergänzung HIII
also bei Berücksichtigung von Gl. (2) J (r, t) = J(r, t)
(75)
ist. Dichte und Wahrscheinlichkeitsstrom sind daher gegenüber einem Wechsel der Eichung invariant. Dies war übrigens aufgrund der vorhergehenden Überlegungen zu erwarten. Sowohl ρ(r, t) als auch J(r, t) können als die Erwartungswerte der Operato ren |r⟩⟨r| und KE (r) =
1 [|r⟩⟨r|ΠE + ΠE |r⟩⟨r|] 2m
(76)
aufgefasst werden. Von beiden Operatoren kann man zeigen, dass sie der Bezie hung (59) genügen. Sie beschreiben darum wahre physikalische Größen, deren Er wartungswerte eichunabhängig sind.⁸
Referenzen und Literaturhinweise Messiah (1.17), Kap. XXI, § 20 bis § 22; Sakurai (2.7), § 8–1. Die Ausdehnung der Eichtheorie auf andere Felder findet großes Interesse in der Teil chenphysik; siehe zum Beispiel den Artikel von Abers und Lee (16.35).
8 Die Frage der Eichinvarianz auch bei anderen Feldern spielt in der Physik der Elementarteilchen eine große Rolle.
Der Propagator der Schrödinger-Gleichung
|
325
•
Ergänzung JIII Der Propagator der Schrödinger-Gleichung 1 2 2-a 2-b 2-c 2-d 3 3-a 3-b 3-c 3-d
Der physikalische Grundgedanke | 325 Existenz und Eigenschaften des Propagators | 326 Existenz | 326 Physikalische Deutung | 327 Propagator und Eigenzustände des Hamilton-Operators | 328 Differentialgleichung für den Propagator | 328 Pfadintegral-Formulierung der Quantenmechanik | 329 Weltlinie in der Raum-Zeit | 329 Zerlegung des Propagators | 330 Feynman-Postulate | 331 Quasi-klassischer Grenzfall. Zusammenhang mit dem Hamilton-Prinzip | 332
1 Der physikalische Grundgedanke Wir betrachten ein Teilchen, das durch die Wellenfunktion ψ(r, t) beschrieben werde. ∂ ψ(r, t), also die Änderungsgeschwin Mit der Schrödinger-Gleichung können wir ∂t digkeit von ψ(r, t), bestimmen. Man erhält somit die zeitliche Entwicklung der Wel lenfunktion, indem man von einem differentiellen Standpunkt ausgeht. Hier stellt sich nun die Frage, ob man den Wert der Wellenfunktion an einer Stelle r0 und zum Zeitpunkt t unmittelbar aus der Kenntnis der gesamten Wellenfunktion ψ(r, t) zu ei nem früheren Zeitpunkt ermitteln kann, ohne dass diese infinitesimal benachbart sein muss. Hier lässt man sich zweckmäßig von einem anderen Bereich der Physik leiten. In der Elektrodynamik sind beide Standpunkte möglich. In der differentiellen Form lie fern die Maxwellschen Gleichungen die Änderungsgeschwindigkeiten der elektrischen und magnetischen Feldkomponenten. Bei der Anwendung des Huygensschen Prinzips (die globale Sicht) bestimmt man das Feld in einem beliebigen Punkt M unmittelbar aus der Kenntnis des monochromatischen Feldes auf einer Fläche Σ, indem man im Punkt M die von den fiktiven Quellen N1 , N2 , . . . ausgehenden Elementarwellen sum miert. Diese Strahlung hängt dabei von den Werten der Feldgrößen in den Punkten N1 , N2 , . . . ab, s. Abb. 1.
Abb. 1: Bei einem Beugungsversuch ergibt sich das elektrische Feld im Punkt M nach dem Huygensschen Prinzip als Summe von Elementarwellen, die von den Punkten N 1 , N 2 , . . . auf der Fläche Σ ausgehen. https://doi.org/10.1515/9783110638738-030
•
326 | Ergänzung JIII
In diesem Abschnitt wollen wir nun zeigen, dass es in der Quantenmechanik zum Huygensschen Prinzip ein Analogon gibt. Genauer kann man für die Wellenfunktion an der Stelle r2 und zur Zeit t2 > t1 die Beziehung ψ(r2 , t2 ) = ∫ d3 r1 K(r2 , t2 ; r1 , t1 ) ψ(r1 , t1 )
(1)
anschreiben und sie in folgender Weise physikalisch interpretieren: Man erhält die Wahrscheinlichkeitsamplitude dafür, dass sich das Teilchen zur Zeit t2 an der Stel le r2 befindet, durch Summation aller Elementarwellen, die von den Stellen (r1 , t1 ), (r1 , t1 ), . . . auf der Raum-Zeit-Fläche t = t1 ausgehen. Dabei besitzt jede Elemen tarquelle das Gewicht ψ(r1 , t1 ), ψ(r1 , t1 ), . . . (Abb. 2). Wir wollen diesen Zusammen hang herleiten, den sogenannten Propagator K der Schrödinger-Gleichung berechnen und einige seiner Eigenschaften untersuchen. Danach werden wir wenigstens qualita tiv skizzieren, wie man von K ausgehend die gesamte Quantenmechanik formulieren kann. Dieser Formalismus geht auf Feynman zurück.
Abb. 2: Man kann die Wahrscheinlichkeitsamplitude ψ(r2 , t 2 ) erhalten, indem man die Beiträge der verschiedenen zum sel ben früheren Zeitpunkt t 1 gehörenden Amplituden ψ(r1 , t 1 ), ψ(r1 , t 1 ), . . . addiert. Jedem Pfeil wird ein Propagator K(r2 , t 2 ; r1 , t 1 ), K(r2 , t 2 ; r1 , t 1 ), . . . zugeordnet.
2 Existenz und Eigenschaften des Propagators 2-a Existenz Das Problem besteht darin, zwischen den Zuständen des Systems zu zwei verschiede nen Zeitpunkten einen direkten Zusammenhang herzustellen. Dies ist mit Hilfe des in Ergänzung FIII eingeführten Entwicklungsoperators möglich. Mit ihm gilt |ψ(t2 )⟩ = U(t2 , t1 )|ψ(t1 )⟩
(2)
Weiter ist dann die Wellenfunktion ψ(r2 , t2 ) = ⟨r2 |ψ(t2 )⟩
(3)
Setzt man Gl. (2) in Gl. (3) ein und berücksichtigt die Vollständigkeitsrelation ∫ d3 r1 |r1 ⟩⟨r1 | = 𝟙
(4)
Der Propagator der Schrödinger-Gleichung
|
327
•
so wird ψ(r2 , t2 ) = ∫ d3 r1 ⟨r2 |U(t2 , t1 )|r1 ⟩⟨r1 |ψ(t1 )⟩ = ∫ d3 r1 ⟨r2 |U(t2 , t1 )|r1 ⟩ψ(r1 , t1 )
(5)
Diese Beziehung stimmt mit Gl. (1) überein, wenn man ⟨r2 |U(t2 , t1 )|r1 ⟩ = K(r2 , t2 ; r1 , t1 ) setzt. Nun braucht man Zusammenhänge wie in Gl. (1) nur für Zeiten t2 > t1 . Daher wählt man K so, dass er für t2 < t1 gleich null ist. Mit Hilfe der Stufenfunktion {1 für t2 > t1 θ(t2 − t1 ) = { 0 für t2 < t1 { lautet dann die genaue Definition K(r2 , t2 ; r1 , t1 ) = ⟨r2 |U(t2 , t1 )|r1 ⟩ θ(t2 − t1 )
(6)
(7)
Die Einführung der Stufenfunktion ist sowohl physikalisch als auch mathema tisch von Interesse. In physikalischer Hinsicht hat sie einfach zur Folge, dass die auf der Fläche t = t1 befindlichen Sekundärwellen nur in die Zukunft „strahlen“. Die durch Gl. (7) definierte Größe wird aus diesem Grund als retardierter Propagator be zeichnet. Mathematisch werden wir weiter unten sehen, dass K(r2 , t2 ; r1 , t1 ) wegen des Faktors θ(t2 − t1 ) einer partiellen Differentialgleichung genügt, deren Inhomoge nitätsglied eine Deltafunktion aufweist. Dies ist aber die Definitionsgleichung für eine Greensche Funktion. Bemerkungen: 1. Wir stellen fest, dass Gl. (5) auch für t2 < t1 gültig bleibt. Andererseits könnten wir mathema tisch auch einen „avancierten“ Propagator einführen, der nur für t2 < t1 von null verschieden ist und der ebenfalls einer Differentialgleichung für eine Greensche Funktion genügt. Weil sich sei ne physikalische Bedeutung nicht als ganz so einfach erweist, werden wir aber auf ihn an dieser Stelle nicht eingehen. 2. Im Folgenden schreiben wir für K(r2 , t2 ; r1 , t1 ) zur Abkürzung einfach K(2, 1).
2-b Physikalische Deutung Die physikalische Bedeutung des Propagators K(2, 1) ergibt sich aus Gl. (7): K(2, 1) re präsentiert die Wahrscheinlichkeitsamplitude dafür, dass das zur Zeit t1 an der Stelle r1 befindliche Teilchen zur späteren Zeit t2 an der Stelle r2 ist. Wählen wir nämlich zum Anfangszeitpunkt t1 einen Zustand, der im Punkt r1 lokalisiert ist, also |ψ(t1 )⟩ = |r1 ⟩
(8)
so ist der Zustand zur Zeit t2 |ψ(t2 )⟩ = U(t2 , t1 ) |ψ(t1 )⟩ = U(t2 , t1 ) |r1 ⟩
(9)
•
328 | Ergänzung JIII
Somit ist die Wahrscheinlichkeitsamplitude für das Auffinden des Teilchens zur Zeit t2 im Punkt r2 ⟨r2 |ψ(t2 )⟩ = ⟨r2 |U(t2 , t1 )|r1 ⟩
(10)
und dies ist gerade K(2, 1). 2-c Propagator und Eigenzustände des Hamilton-Operators Wir setzen voraus, dass der Hamilton-Operator von der Zeit nicht explizit abhängt, |φ n ⟩ seien seine Eigenzustände zu den Eigenwerten E n : H |φ n ⟩ = E n |φ n ⟩
(11)
Nach Gl. (18) aus Ergänzung FIII ist U(t2 , t1 ) = e−iH(t 2−t 1)/ℏ
(12)
Mit der Vollständigkeitsrelation ∑ |φ n ⟩⟨φ n | = 𝟙
(13)
n
können wir dies in der Form U(t2 , t1 ) = e−iH(t 2−t 1)/ℏ ∑ |φ n ⟩⟨φ n |
(14)
n
schreiben, also ist bei Beachtung von Gl. (11) U(t2 , t1 ) = ∑ e−iE n (t 2−t 1 )/ℏ |φ n ⟩⟨φ n |
(15)
n
Zur Berechnung von K(2, 1) genügt es daher, auf beiden Seiten das Matrixelement zwischen ⟨r2 | und |r1 ⟩ zu bilden und das Ergebnis mit θ(t2 − t1 ) zu multiplizieren. Weil aber ⟨r2 |φ n ⟩ = φ n (r2 )
(16)
⟨φ n |r1 ⟩ = φ∗n (r1 )
(17)
und
ist, erhalten wir schließlich K(r2 , t2 ; r1 , t1 ) = θ(t2 − t1 ) ∑ φ∗n (r1 )φ n (r2 )e−iE n (t 2 −t 1)/ℏ
(18)
n
2-d Differentialgleichung für den Propagator Der Ausdruck φ n (r2 )e−iE n t 2/ℏ ist Lösung der Schrödinger-Gleichung. In der Ortsdar stellung gilt also [iℏ
∂ ℏ − H (r2 , ∇2 )] φ n (r2 )e−iE n t 2/ℏ = 0 ∂t2 i
(19)
Der Propagator der Schrödinger-Gleichung
| 329
•
Dabei haben wir die drei Differentialoperatoren ∂/∂x2 , ∂/∂y2 und ∂/∂z2 mit ∇2 abge kürzt. Wenden wir auf Gl. (18) den Operator iℏ
ℏ ∂ − H (r2 , ∇2 ) ∂t2 i
an und beachten die Beziehung [s. Anhang II, Gl. (44)] ∂ θ(t2 − t1 ) = δ(t2 − t1 ) ∂t2
(20)
so ergibt sich weiter [iℏ
ℏ ∂ − H (r2 , ∇2 )] K(r2 , t2 ; r1 , t1 ) ∂t2 i
= iℏ δ(t2 − t1 ) ∑ φ∗n (r1 )φ n (r2 )e−iE n (t 2−t 1 )/ℏ
(21)
n
Auf der rechten Seite kann man wegen des Faktors δ(t2 − t1 ) in der Summe t2 − t1 durch null, also den Exponentialausdruck durch eins ersetzen, während wegen der Gleichungen (13), (16) und (17) der Term ∑n φ∗n (r1 )φ n (r2 ) gleich δ(r2 − r1 ) ist. Dies erkennt man, wenn man bei Gl. (13) das Matrixelement zwischen ⟨r2 | und |r1 ⟩ bildet. Somit erhalten wir schließlich für den Propagator K die Differentialgleichung [iℏ
∂ ℏ − H (r2 , ∇2 )] K(r2 , t2 ; r1 , t1 ) = iℏ δ(t2 − t1 )δ(r2 − r1 ) ∂t2 i
(22)
Allgemein nennt man die Lösungen einer Gleichung, deren Inhomogenitätsglied ei ne „vierdimensionale“ Deltafunktion enthält, Greensche Funktionen. Wie man zeigen kann, genügt es, zur vollständigen Bestimmung von K(2, 1) zu Gl. (22) die Bedingung K(r2 , t2 ; r1 , t1 ) = 0 wenn t2 < t1
(23)
hinzuzufügen. Die Gleichungen (22) und (23) erweisen sich insbesondere in der Störungstheorie (s. Kapitel XI) als besonders nützlich.
3 Pfadintegral-Formulierung der Quantenmechanik 3-a Weltlinie in der Raum-Zeit Wir betrachten in der Raum-Zeit die beiden Punkte mit den Koordinaten (r1 , t1 ) und (r2 , t2 ), s. Abb. 3, in der die Ordinate die drei Raumkoordinaten schematisch vertritt. Wir wählen N zwischen t1 und t2 liegende Zeitpunkte t α i (i = 1, 2, . . . , N): t1 < t α1 < t α2 < ⋅ ⋅ ⋅ < t α N−1 < t α N < t2
(24)
•
330 | Ergänzung JIII
und zu jedem einen Ort r α i . Mit N → ∞ konstruiert man so eine (als stetig angenom mene) Funktion r(t) mit r(t1 ) = r1
(25a)
r(t2 ) = r2
(25b)
Man sagt, dass r(t) in der Raum-Zeit eine Weltlinie zwischen (r1 , t1 ) und (r2 , t2 ) defi niert: Zunächst könnte es sich dabei um die Trajektorie eines Massenpunktes handeln, der zur Zeit t1 vom Punkt r1 ausgeht und zur Zeit t2 zum Punkt r2 gelangt.
Abb. 3: Zur Konstruktion einer Weltlinie in der Raum-Zeit. Man nimmt N zwischen t 1 und t 2 liegende Zeitpunkte t α i (i = 1, 2, . . . , N) und wählt für jeden von ihnen einen Wert rα i .
3-b Zerlegung des Propagators Wir beginnen mit dem Fall, bei dem die Anzahl N der Zwischenzeiten endlich ist. Nach Gl. (10) aus Ergänzung FIII dürfen wir für den Zeitentwicklungsoperator U(t2 , t1 ) = U(t2 , t α N )U(t α N , t α N−1 ) . . . U(t α2 , t α1 )U(t α1 , t1 )
(26)
schreiben. Bilden wir von beiden Seiten dieser Gleichung das Matrixelement zwischen ⟨r2 | und |r1 ⟩ und schieben für jede Zwischenzeit die Vollständigkeitsrelation ein, so erhalten wir bei Beachtung von Gl. (7) und Gl. (24) K(2, 1) = ∫ d3 r α N ∫ d3 r α N−1 . . . ∫ d3 r α2 ∫ d3 r α1 K(2, α N ) × K(α N , α N−1 ) × ⋅ ⋅ ⋅ × K(α 2 , α 1 )K(α 1 , 1)
(27)
Den Integranden K(2, α N )K(α N , α N−1 ) . . . K(α 2 , α 1 )K(α 1 , 1)
(28)
können wir nun als die Wahrscheinlichkeitsamplitude dafür interpretieren, dass das Teilchen – vom Raum-Zeitpunkt 1 (r1 , t1 ) ausgehend – zum Punkt 2 (r2 , t2 ) gelangt, indem es sämtliche Zwischenpunkte α i (r α i , t α i ) wie in Abb. 3 passiert. Dabei beachten wir, dass in Gl. (27) über alle möglichen Orte rα i zu den Zeitpunkten t α i summiert wird.
Der Propagator der Schrödinger-Gleichung
| 331
•
Wir lassen jetzt N gegen unendlich gehen.¹ Dann definiert eine Punktfolge α i eine Weltlinie zwischen 1 und 2, und das zugehörige Produkt [Gl. (28)] wird die Wahrschein lichkeitsamplitude dafür, dass das Teilchen sich längs dieser Linie bewegt. Wir halten fest, dass jetzt in Gl. (27) unendlich oft zu integrieren wäre. Es ist jedoch verständ lich, dass die Summation über die Gesamtheit der möglichen Orte für jeden Zeitpunkt auf eine Summation über die verschiedenen möglichen Wege hinausläuft. K(2, 1) er scheint daher als eine Summe (tatsächlich als ein Integral), die der kohärenten Super position der Amplituden für alle zwischen 1 und 2 möglichen Wege entspricht.
3-c Feynman-Postulate Die Begriffe des Propagators und der Weltlinie erlauben es, das Postulat hinsichtlich der zeitlichen Entwicklung eines physikalischen Systems in anderer Weise zu formu lieren. Für ein spinloses Teilchen wollen wir den grundsätzlichen Gedankengang hier skizzieren. Der Propagator K(2, 1) wird unmittelbar als die Wahrscheinlichkeitsamplitude dafür definiert, dass das Teilchen zur Zeit t1 von der Stelle r1 ausgeht und zur Zeit t2 zur Stelle r2 gelangt. Man postuliert also: 1. K(2, 1) ist die Summe der unendlich vielen Teilamplituden für die Weltlinien, die (r1 , t1 ) und (r2 , t2 ) verbinden. 2. Ist S Γ die klassische Wirkung längs des Weges Γ, d. h. S Γ = ∫ L(r, p, t) d t
(29)
(Γ)
mit der Lagrange-Dichte L(r, p, t) des Teilchens (s. Anhang III), so ist K Γ (2, 1) durch i
K Γ (2, 1) = N e ℏ S Γ
(30)
gegeben; N ist eine Normierungskonstante (die man übrigens explizit bestimmen kann). Aus diesen beiden Postulaten lässt sich die Schrödinger-Gleichung als Folgerung her leiten. Das Gleiche gilt für die kanonischen Vertauschungsrelationen zwischen den Komponenten der Observablen R und P: Die beiden Postulate erweisen sich somit als eine äquivalente Formulierung der Quantenmechanik.
1 Wir stellen hier keinerlei Anspruch auf mathematische Strenge.
•
332 | Ergänzung JIII
3-d Quasi-klassischer Grenzfall. Zusammenhang mit dem Hamilton-Prinzip Die Pfadintegral-Methode ist besonders interessant, wenn es um den Zusammenhang zwischen der klassischen und der Quantenmechanik geht. Betrachten wir die Situation, in der die Wirkungen S Γ gegenüber ℏ groß sind. In diesem Fall ist nämlich die Variation ∆S Γ der Wirkung zwischen zwei verschiedenen Weltlinien im Allgemeinen selbst dann sehr viel größer als ℏ, wenn die relative Varia tion ∆S Γ /S Γ ≪ 1 ist. Folglich ändert sich die Phase von K Γ (2, 1) sehr rasch, so dass sich die Beiträge zur Gesamtamplitude K(2, 1) für die meisten Wege Γ durch Interfe renz aufheben. Nehmen wir jedoch an, dass es einen Weg Γ0 gibt, für den die Wirkung stationär ist (sich also beim Übergang zu einem infinitesimal benachbarten Weg in erster Ordnung nicht ändert), so interferiert die Amplitude K Γ0 (2, 1) mit allen Ampli tuden zu benachbarten Amplituden konstruktiv, weil jetzt die Phasen praktisch gleich sind. Sind also die Wirkungen S Γ groß gegenüber ℏ, so befindet man sich in einer „qua siklassischen“ Situation: Bei der Berechnung von K(2, 1) kann man alle Wege bis auf den Weg Γ0 und seine infinitesimalen Nachbarn vernachlässigen, das Teilchen folgt zwischen den Punkten 1 und 2 der Trajektorie Γ0 . Dies ist aber gerade die klassische Bahn, weil sie nach dem Hamilton-Prinzip als der Weg definiert ist, auf dem die Wir kung minimal ist. Die Feynman-Postulate schließen also im klassischen Grenzfall das Hamilton-Prinzip der kleinsten Wirkung ein. Sie erlauben darüber hinaus auch eine anschauliche Erklärung: Die dem Teilchen zugeordnete Welle „tastet“ die verschiede nen möglichen Wege ab und wählt den Weg aus, für den die Wirkung am geringsten ist. Die Pfadintegral-Methode der Quantenmechanik bietet eine Reihe weiterer Vor teile, auf die wir hier nicht im Einzelnen eingehen. So erlaubt sie auf einfache Weise eine relativistische Verallgemeinerung, weil sie unmittelbar in der Raum-Zeit formu liert wird. Ferner kann man sie auf jedes klassische (und erst recht auf jedes mechani sche) System anwenden, das durch ein Variationsprinzip bestimmt wird, so z. B. auf ein Feld. Schwierigkeiten ergeben sich dagegen auf mathematischer Ebene (Summation über unendlich viele Wege, Grenzübergang N → ∞ usw.).
Referenzen und Literaturhinweise Originalartikel von Feynman (2.38); Feynman und Hibbs (2.25); Bjorken und Drell (2.6), Kap. 6 und 7.
Instabile Niveaus. Lebensdauer | 333
•
Ergänzung KIII Instabile Niveaus. Lebensdauer 1 2 3
Einführung | 333 Definition der Lebensdauer | 334 Phänomenologische Beschreibung | 335
1 Einführung Wir betrachten ein konservatives System, dessen Hamilton-Operator also zeitunab hängig ist. Zur Zeit t = 0 sei es in einem Eigenzustand |φ n ⟩ des Hamilton-Operators zum Eigenwert E n |ψ(0)⟩ = |φ n ⟩
(1)
H|φ n ⟩ = E n |φ n ⟩
(2)
mit
In diesem Fall bleibt das System dauernd in diesem Zustand (der Zustand ist stationär, s. § D-2-b von Kap. III). In Kapitel VII werden wir das Wasserstoffatom behandeln, indem wir die Eigen wertgleichung seines (zeitunabhängigen) Hamilton-Operators lösen. Die sich dabei ergebenden Energieniveaus stimmen mit den Messungen gut überein. Allerdings weiß man, dass die meisten dieser Niveaus in Wirklichkeit instabil sind: Befindet sich das Atom zur Zeit t = 0 in einem angeregten Zustand, also in einem Eigen zustand |φ n ⟩ zu einer Energie E n , die höher liegt als die am niedrigsten liegende Energie des Grundzustands, so „fällt“ es im Allgemeinen unter Aussendung von ei nem oder mehreren Photonen in diesen Grundzustand. Der Zustand |φ n ⟩ ist in diesem Fall nicht stationär. Diese Schwierigkeit rührt daher, dass man bei den Rechnungen in Kapitel VII das Wasserstoffatom als ein völlig isoliertes System behandelt, obwohl es in ständi ger Wechselwirkung mit dem elektromagnetischen Feld steht. Wenn man die zeitli che Entwicklung des Gesamtsystems „Atom + elektromagnetisches Feld“ vollständig durch einen Hamilton-Operator beschreiben kann, ist es in Strenge nicht möglich, für das Wasserstoffatom allein einen Hamilton-Operator zu definieren (s. die entspre chende Bemerkung 5 in § 5-b von Ergänzung EIII ). Nur weil die Kopplung zwischen Atom und Feld gering ist (man kann zeigen, dass die „Kraft“ durch die in Kapitel VII eingeführte Feinstrukturkonstante α ≈ 1/137 charakterisiert ist), erweist es sich als eine sehr gute Näherung, wenn man die Existenz des elektromagnetischen Feldes in soweit vollständig vernachlässigt, als man sich nicht für die Instabilität der Niveaus interessiert. https://doi.org/10.1515/9783110638738-031
•
334 | Ergänzung KIII
Bemerkungen: 1. Ist der Anfangszustand eines strikt konservativen und isolierten Systems eine Linearkombi nation aus stationären Zuständen, so ändert es sich zeitlich. Sein Hamilton-Operator ist jedoch eine Konstante der Bewegung, und folglich die Wahrscheinlichkeit, einen bestimmten Energie wert zu messen, zeitunabhängig genau wie der Energieerwartungswert, s. § D-2-c von Kap. III. Bei einem instabilen Niveau geschieht dagegen ein irreversibler Übergang von einem Zustand in einen anderen. Das System verliert dabei Energie, die von den emittierten Photonen fortgetragen wird.¹ 2. Die Instabilität der angeregten Niveaus eines Atoms rührt von der spontanen Photonen-emis sion her, während der Grundzustand stabil ist, weil es kein tieferes Energieniveau gibt. Dagegen können Atome auch Licht absorbieren und so in höhere Energiezustände gelangen.
Wir wollen an dieser Stelle andeuten, wie man der Instabilität eines Niveaus wenigs tens phänomenologisch Rechnung tragen kann. Dabei kann es sich nicht um eine Be schreibung in Strenge handeln, weil wir das System weiterhin als isoliert betrachten.
2 Definition der Lebensdauer Die Erfahrung zeigt, dass die Instabilität eines Niveaus häufig durch einen eindeuti gen Parameter τ mit der Dimension einer Zeit charakterisiert werden kann; man nennt ihn die Lebensdauer des Niveaus. Genauer: Wenn man das System zum Zeitpunkt t = 0 in den instabilen Zustand |φ n ⟩ präpariert, so stellt man fest, dass die Wahrscheinlich keit, es zu einem späteren Zeitpunkt t noch in diesem Zustand zu finden, durch 𝒫(t) = e−t/τ
(3)
gegeben ist. Diese Tatsache kann man auch in folgender Weise beschreiben: Wir be trachten eine große Zahl N von identischen und unabhängigen Systemen, die alle zur Zeit t = 0 in den Zustand |φ n ⟩ präpariert werden. Dann sind zum Zeitpunkt t noch N(t) = N e−t/τ Systeme in diesem Zustand. Zwischen den Zeiten t und t + dt verlässt eine bestimmte Zahl dn(t) = N(t) − N(t + dt) = −
dN(t) dt dt = N(t) dt τ
(4)
den instabilen Zustand. Für alle N(t) Systeme, die sich zur Zeit t noch im Zustand |φ n ⟩ befinden, kann man darum eine Wahrscheinlichkeit dϖ(t) =
dn(t) dt = N(t) τ
(5)
dafür definieren, dass sie diesen Zustand während des auf t folgenden Zeitintervalls dt verlassen. Wie man sieht, hängt dϖ(t) nicht von der Zeit ab: Man sagt, dass das System die Wahrscheinlichkeit pro Zeit 1/τ besitzt, das instabile Niveau zu verlassen. 1 Diese können übrigens auch Impuls und kinetische Energie mit sich führen.
Instabile Niveaus. Lebensdauer | 335
•
Bemerkungen: 1. Berechnen wir die mittlere Zeit, in der das System im instabilen Zustand verbleibt, so erhalten wir ∞
∫ t e−t/τ
dt =τ τ
(6)
0
Das ist der Grund, weshalb man den Parameter τ die Lebensdauer des betreffenden Zustands nennt. 2. Die Lebensdauer τ besitzt eine bemerkenswerte Eigenschaft. Sie hängt nämlich nicht davon ab, wie man das System in den instabilen Zustand präpariert hat, also nicht von seiner „Vorge schichte“: Die Lebensdauer ist ein Charakteristikum des instabilen Zustands selbst. 3. Aufgrund der Energie-Zeit-Unschärferelation (s. Kap. III, § D-2-e) entspricht der Zeit τ, die für die Entwicklung eines instabilen Niveaus charakteristisch ist, eine Energieunschärfe ∆E ≈
ℏ τ
(7)
Die Energie eines instabilen Niveaus kann also nicht mit beliebiger Genauigkeit bestimmt wer den, sondern höchstens mit einer Unschärfe ∆E. Diese nennt man die (natürliche) Linienbreite des betrachteten Niveaus. Im Fall des Wasserstoffatoms ist die Linienbreite der verschiedenen Niveaus gegenüber ihrem jeweiligen Abstand vernachlässigbar. Dies erklärt, weshalb man die Niveaus in erster Ordnung als stabil behandeln kann.
3 Phänomenologische Beschreibung Wir betrachten zunächst ein konservatives System, das wir zum Anfangszeitpunkt in den Eigenzustand |φ n ⟩ des Hamilton-Operators H präparieren. Dann ist nach der Re gel (D-54) aus Kapitel III das System zur Zeit t im Zustand |ψ(t)⟩ = e−iE n t/ℏ |φ n ⟩
(8)
Wird zu diesem Zeitpunkt eine Messung vorgenommen, so findet man das System im Zustand |φ n ⟩ mit der Wahrscheinlichkeit 𝒫n (t) = |e−iE n t/ℏ |2
(9)
Weil die Energie E n eine reelle Größe ist (H ist eine Observable), ist diese Wahrschein lichkeit konstant gleich eins. Wieder ergibt sich, dass |φ n ⟩ ein stationärer Zustand ist. Ersetzen wir dagegen E n durch den komplexen Ausdruck En = E n − iℏ
γn 2
(10)
so wird die Wahrscheinlichkeit γn
𝒫n (t) = |e−i(E n −iℏ 2 )t/ℏ |2 = e−γ n t
(11)
•
336 | Ergänzung KIII
In diesem Fall nimmt also die Wahrscheinlichkeit, das System im Zustand |φ n ⟩ zu finden, zeitlich wie in Gl. (3) exponentiell ab. Will man daher der Instabilität eines Zu stands |φ n ⟩ mit der Lebensdauer τ n phänomenologisch Rechnung tragen, so genügt es wie in Gl. (10), zu seiner Energie einen Imaginärteil hinzuzufügen, wobei man γn =
1 τn
(12)
zu setzen hat. Bemerkung: Ersetzt man E n durch E n , so wird die Norm des Zustandsvektors aus Gl. (8) zeitabhängig: e−γn t/2 . Das ist nicht überraschend: In § D-1-c von Kap. III hatten wir gesehen, dass die Normerhaltung des Zustandsvektors von der Hermitezität des Hamilton-Operators herrührt. Nun kann aber ein Operator mit komplexen Eigenwerten nicht hermitesch sein. Wir stellten bereits in § 1 fest, dass das von uns untersuchte System Teil eines größeren Systems ist (es steht ja in Wechselwirkung mit dem elektromagnetischen Feld) und dass wir in Strenge seine zeitliche Entwicklung nicht mit Hilfe eines Hamilton-Operators beschreiben können. Bemerkenswert ist daher schon, dass dies einfach durch Einführung eines „Hamilton-Operators“ mit komplexen Eigenwerten gelingt.
Aufgaben | 337
•
Ergänzung LIII Aufgaben 1. Bei einem eindimensionalen Problem sei einem Teilchen die Wellenfunktion ψ(x) = N
eip0 x/ℏ √ x2 + a2
zugeordnet, wobei a und p0 reelle Konstanten und N ein Normierungsfaktor sind. a) Man bestimme N so, dass ψ(x) normiert ist. b) Wie groß ist die Wahrscheinlichkeit, dass bei einer Ortsmessung das Ergebnis zwi schen −a/√3 und +a/√3 liegt? c) Man berechne den Impulserwartungswert des Teilchens. 2. Bei einem eindimensionalen Problem sei ψ(x, t) die Wellenfunktion eines Teil chens mit der Masse m zur Zeit t. a) Zu diesem Zeitpunkt werde der Abstand d dieses Teilchens vom Ursprung O ge messen. Man gebe in Abhängigkeit von ψ(x, t) die Wahrscheinlichkeit 𝒫(d0 ) da für an, dass das Resultat größer als eine bestimmte Entfernung d0 ist. Welche Grenzen gelten für 𝒫(d0 ), wenn d0 → 0 und d0 → ∞ geht? b) Statt der Ortsmessung wie in a) beobachtet man die Geschwindigkeit v des Teil chens zur Zeit t. Welcher Ausdruck in Abhängigkeit von ψ(x, t) ergibt sich für die Wahrscheinlichkeit, dass das Ergebnis größer als ein gegebener Wert v0 ist? 3. Bei einem eindimensionalen Problem sei die Wellenfunktion eines freien Teilchens zum Anfangszeitpunkt +∞
ψ(x, 0) = N ∫ dk e−|k|/k0 eikx −∞
darin sind k 0 und N Konstanten. a) Wie groß ist die Wahrscheinlichkeit 𝒫(p1 , 0) dafür, dass man bei einer Impuls messung zum Zeitpunkt t = 0 ein Ergebnis erhält, das zwischen −p1 und +p1 liegt? Man diskutiere die Funktion 𝒫(p1 , 0). b) Wie lautet die Wahrscheinlichkeit 𝒫(p1 , t), wenn die Messung zur Zeit t durchge führt wird? Deutung? c) Welche Form hat das Wellenpaket zur Zeit t = 0? Man berechne für diesen Zeit punkt das Produkt ∆X ⋅ ∆P; Schlussfolgerung? Man beschreibe qualitativ die wei tere Entwicklung des Pakets. 4. Zerfließen eines freien Wellenpakets Man untersuche das Verhalten eines freien Teilchens. a) Man zeige mit Hilfe des Ehrenfest-Theorems, dass der Erwartungswert ⟨X⟩ linear von der Zeit abhängt, der Impulserwartungswert ⟨P⟩ dagegen konstant bleibt. https://doi.org/10.1515/9783110638738-032
•
338 | Ergänzung LIII
b) Man formuliere die Bewegungsgleichungen für die Erwartungswerte ⟨X 2 ⟩ und ⟨XP + PX⟩ und integriere sie. c) Man leite her, dass bei geeigneter Wahl des Zeitursprunges die Standardabwei chung ∆X durch (∆X)2 =
1 (∆P)20 t2 + (∆X)20 m2
gegeben ist, wobei (∆X)0 und (∆P)0 die Standardabweichungen zur Zeit t = 0 sind. Wie ändert sich die Breite des Wellenpakets zeitlich (s. § 3-c von Ergän zung GI )? Physikalische Deutung? 5. Teilchen in einem konstanten Kraftfeld Bei einem eindimensionalen Problem betrachte man ein Teilchen mit der potentiellen Energie V(x) = −fX, f positiv und konstant (z. B. ein Teilchen im Schwerefeld oder unter der Wirkung eines konstanten elektrischen Feldes). a) Wie lautet das Ehrenfest-Theorem für den Erwartungswert des Ortes X und des Impulses P des Teilchens? Man integriere diese Gleichungen und vergleiche die Ergebnisse mit der klassischen Bewegung. b) Man zeige, dass sich die Standardabweichung ∆P zeitlich nicht ändert. c) Wie lautet die Schrödinger-Gleichung in der Impulsdarstellung? Man leite mit ihr ∂ ∂ eine Beziehung zwischen ∂t |⟨p|ψ(t)⟩|2 und ∂p |⟨p|ψ(t)⟩|2 her. Man integriere die erhaltene Gleichung; physikalische Deutung? 6. Man betrachte im Dreidimensionalen die Wellenfunktion |x| |y| |z| −[ 2a + 2b + 2c ]
ψ(x, y, z) = Ne
worin a, b und c drei Längen bedeuten. a) Man bestimme N so, dass ψ normiert ist. b) Man berechne die Wahrscheinlichkeit dafür, dass eine Messung von X ein Ergeb nis zwischen 0 und a liefert. c) Man berechne die Wahrscheinlichkeit dafür, dass bei der gleichzeitigen Messung von Y und Z die Resultate zwischen −b und +b bzw. −c und +c liegen. d) Man berechne die Wahrscheinlichkeit dafür, dass bei einer Impulsmessung das Ergebnis in dem um den Punkt p x = p y = 0; p z = ℏ/c zentrierten Element dp x dp y dp z liegt. 7. Es sei ψ(x, y, z) = ψ(r) die normierte Wellenfunktion eines Teilchens. Wie groß ist die Wahrscheinlichkeit dafür, dass man a) bei einer Messung der Abszisse X einen Wert zwischen x1 und x2 findet? b) bei einer Messung der x-Komponente des Impulses P einen Wert zwischen p1 und p2 findet?
Aufgaben |
339
•
c) bei der gleichzeitigen Messung von X und P z x1 ≤ x ≤ x2 pz ≥ 0 findet? d) bei der gleichzeitigen Messung von P x , P y und P z die Ergebnisse p1 ≤ p x ≤ p2 p3 ≤ p y ≤ p4 p5 ≤ p z ≤ p6 erhält? Man zeige, dass man für p3 , p5 → −∞ und p4 , p6 → +∞ wieder das Ergebnis von Fall b) erhält. e) Man zeige, dass man bei einer Messung der Komponente U = √13 (X + Y + Z) des Ortes ein zwischen u 1 und u 2 liegendes Ergebnis erhält. 8. Es sei ψ(r) die Wellenfunktion für den Zustand eines Teilchens mit der Masse m und J(r) der zugehörige Wahrscheinlichkeitsstrom [s. Gl. (D-17) und Gl. (D-19) in Kap. III]. a) Man zeige, dass m ∫ d3 r J(r) = ⟨P⟩ ist, worin ⟨P⟩ den Impulserwartungswert bedeutet. b) Man prüfe, ob die drei Komponenten des Bahndrehimpulses L = R× P hermitesch sind. Man beweise, dass m ∫ d3 r [r × J(r)] = ⟨L⟩ 9. Wir wollen zeigen, dass der physikalische Zustand eines Teilchens (ohne Spin) durch die Angabe der Wahrscheinlichkeitsdichte ρ(r) = |ψ(r)|2 und der Wahrschein lichkeitsstromdichte J(r) vollständig bestimmt ist. a) Die Funktion ψ(r) sei durch ψ(r) = √ρ(r)eiξ(r) gegeben. Man zeige, dass J(r) =
ℏ ρ(r)∇ξ(r) m
ist. Hiermit leite man weiter her: Zwei Funktionen, die dieselbe Dichte ρ(r) und denselben Strom J(r) ergeben, können sich nur um einen globalen Phasenfaktor unterscheiden. b) Es seien zwei beliebige Funktionen ρ(r) und J(r) gegeben. Man zeige, dass man ihnen nur dann einen quantenmechanischen Zustand ψ(r) zuordnen kann, wenn ∇ × v(r) = 0 ist, wobei v(r) = J(r)/ρ(r) die Geschwindigkeit des zugehörigen Wahr scheinlichkeitsfluids bedeutet.
•
340 | Ergänzung LIII
c) Man nehme an, dass das Teilchen der Wirkung eines Magnetfeldes B(r) = ∇ × A(r) unterworfen ist [s. Gl. (D-20) von Kap. III]. Man zeige, dass J(r) =
ρ(r) [ℏ∇ξ(r) − qA(r)] m
und ∇ × v(r) = −
q B(r) m
ist. 10. Der Virialsatz a) Bei einem eindimensionalen System betrachte man den Hamilton-Operator für ein Teilchen H=
P2 + V(X) 2m
mit V(X) = λ X n Man berechne den Kommutator [H, XP]. Man zeige: Existieren im Potential V ein oder mehrere stationäre Zustände |φ⟩, so besteht für die Erwartungswerte der kinetischen Energien und des Potentials in diesen Zuständen die Beziehung 2⟨T⟩ = n⟨V⟩. b) Für ein dreidimensionales Problem laute der Hamilton-Operator P2 + V(R) 2m Man berechne den Kommutator [H, R ⋅ P]. Man nehme an, dass V(R) in den Va riablen X, Y und Z eine homogene Funktion n-ten Grades ist. Welche Beziehung besteht notwendig zwischen den Erwartungswerten der kinetischen und der po tentiellen Energie des Teilchens in einem stationären Zustand? Man wende das Ergebnis auf ein Teilchen im Potential V(r) = −e2 /r an (Wasser stoffatom). Erinnerung: Eine Funktion V heißt in den Variablen x, y und z homogen vom Gra de n, wenn sie der Gleichung H=
V(αx, αy, αz) = α n V(x, y, z) genügt. Es gilt dann der Satz von Euler: x
∂V ∂V ∂V +y +z = n V(x, y, z) ∂x ∂y ∂z
c) Bei einem N-Teilchensystem sei die potentielle Energie in den Variablen X i , Y i , Z i , i = 1, 2, . . . , N eine homogene Funktion vom Grade n. Kann man die eben er haltenen Ergebnisse verallgemeinern? Anwendung: Man untersuche ein Molekül,
Aufgaben | 341
•
das aus Kernen mit den Ladungen −Z i q und Elektronen mit der Ladung q besteht. Sämtliche Teilchen wirken paarweise durch Coulomb-Kräfte aufeinander. Welche Beziehung besteht in einem stationären Zustand des Moleküls zwischen der kine tischen Energie der Teilchen und ihrer Wechselwirkungsenergie? 11. Zweiteilchen-Wellenfunktion Bei einem eindimensionalen Problem bestehe das System aus zwei Teilchen (1) und (2), die zugehörige Wellenfunktion sei ψ(x1 , x2 ). a) Welche Wahrscheinlichkeit besteht dafür, dass bei einer Messung der Orte X1 und X2 die Ergebnisse zwischen x ≤ x1 ≤ x + dx und α ≤ x2 ≤ β liegen? b) Welche Wahrscheinlichkeit besteht dafür, das Teilchen (1) zwischen x und x + dx zu finden, wenn man am Teilchen (2) keine Beobachtung vornimmt? c) Man gebe die Wahrscheinlichkeit dafür an, dass man wenigstens ein Teilchen zwi schen α und β findet. d) Wie groß ist die Wahrscheinlichkeit, genau ein Teilchen zwischen α und β zu fin den? e) Welche Wahrscheinlichkeit besteht, für den Impuls des Teilchens (1) einen Wert zwischen p und p und für den Ort des Teilchens (2) ein Ergebnis zwischen α und β zu finden? f) Man misst die Impulse P1 und P2 der beiden Teilchen. Welche Wahrscheinlichkeit besteht, dass sich p ≤ p1 ≤ p und p ≤ p2 ≤ p ergibt? g) Es werde nur der Impuls P1 des ersten Teilchens gemessen. Ausgehend von den Ergebnissen in Fall e), danach in Fall f) bestimme man die Wahrscheinlichkeit, für diesen Impuls einen Wert zwischen p und p zu erhalten. Man vergleiche die beiden Ergebnisse. h) Man misst den (algebraischen) Abstand X1 − X2 der beiden Teilchen. Wie lautet die Wahrscheinlichkeit für ein Ergebnis zwischen −d und +d? Wie groß ist der Erwartungswert dieses Abstands? 12. Eindimensionaler, unendlich tiefer Potentialtopf Ein Teilchen mit der Masse m unterliege dem Potential {0 wenn 0 ≤ x ≤ a V(x) = { +∞ wenn x < 0 oder x > a { π ℏ Die Eigenfunktionen zu den Eigenwerten n2ma 2 (s. Ergänzung HI ) nennen wir |φ n ⟩. Zum Anfangszeitpunkt t = 0 sei der Zustand des Teilchens 2 2 2
|ψ(0)⟩ = a1 |φ1 ⟩ + a2 |φ2 ⟩ + a3 |φ3 ⟩ + a4 |φ4 ⟩
•
342 | Ergänzung LIII
a) Mit welcher Wahrscheinlichkeit findet man bei einer Messung der Teilchenenergie 2 2 ℏ ? im Zustand |ψ(0)⟩ einen Wert kleiner als 3π ma 2 b) Wie groß sind Erwartungswert und Standardabweichung der Energie im Zustand |ψ(0)⟩? c) Man berechne den Zustandsvektor |ψ(t)⟩ zum Zeitpunkt t. Gelten die in a) und b) erhaltenen Ergebnisse für jeden Zeitpunkt t? 2 2 ℏ d) Bei einer Energiemessung erhält man den Wert 8π . In welchem Zustand ist das ma 2 System nach der Messung? Wo befindet man sich, wenn man die Energie noch einmal misst? 13. Zweidimensionaler unendlich tiefer Potentialtopf (s. Ergänzung GII ) Bei einem zweidimensionalen Problem sei der Hamilton-Operator eines Teilchens mit der Masse m H = Hx + Hy mit Hx =
P2x + V(X) 2m
Hy =
P2y 2m
+ V(Y)
Die potentielle Energie V(x) bzw. V(y) sei gleich null, wenn x bzw. y zum Intervall [0, a] gehört, und sonst gleich unendlich. a) Welche der folgenden Operatormengen bilden einen vollständigen Satz kommu tierender Observabler (V. S. K. O.): {H}, {H x }, {H x , H y }, {H, H x }? b) Die Wellenfunktion eines Teilchens sei ψ(x, y) = N cos
πy 2πx 2πy πx cos sin sin a a a a
wenn 0 ≤ x ≤ a und 0 ≤ y ≤ a, und sonst gleich null (N ist eine Konstante). α) Man bestimme den Erwartungswert ⟨H⟩ der Teilchenenergie. Welche Ergeb nisse findet man bei einer Energiemessung und mit welchen Wahrscheinlich keiten? β) Welche Resultate kann man bei einer Messung der Observablen H x erhalten π 2 ℏ2 und mit welchen Wahrscheinlichkeiten? Diese Messung möge den Wert 2ma 2 liefern. Welche Ergebnisse erhält man dann bei einer nachfolgenden Messung von H y und mit welchen Wahrscheinlichkeiten? γ) An Stelle der vorstehenden Messungen beobachtet man jetzt gleichzeitig H x und P y . Mit welchen Wahrscheinlichkeiten ergibt sich dann, dass Ex =
9π2 ℏ2 2ma2
und p0 ≤ p y ≤ p0 + dp gemessen wird?
Aufgaben | 343
•
14. Der dreidimensionale Zustandsraum eines physikalischen Systems werde von der orthonormierten Basis {|u 1 ⟩, |u 2 ⟩, |u 3 ⟩} aufgespannt. Der Hamilton-Operator H und die beiden Observablen A und B lauten in dieser Basis 1 H = ℏω0 (0 0
0 2 0
0 0) 2
1 A = a (0 0
0 0 1
0 1) 0
0 B = b (1 0
1 0 0
0 0) 1
worin ω0 , a und b reelle, positive Konstanten sind. Zur Zeit t = 0 befinde sich das System im Zustand |ψ(0)⟩ =
1 1 1 |u 1 ⟩ + |u 2 ⟩ + |u 3 ⟩ 2 2 √2
a) Zum Zeitpunkt t = 0 misst man die Energie des Systems. Welche Werte können sich mit welchen Wahrscheinlichkeiten ergeben? Man berechne für den Fall, dass sich das System im Zustand |ψ(0)⟩ befindet, den Erwartungswert ⟨H⟩ und die Standardabweichung ∆H. b) Statt H misst man zum Anfangszeitpunkt die Observable A. Welche Ergebnisse kann man mit welchen Wahrscheinlichkeiten erhalten? In welchem Zustand be findet sich das System unmittelbar nach der Messung? c) Man berechne den Zustandsvektor |ψ(t)⟩ zur Zeit t. d) Man berechne die Erwartungswerte ⟨A⟩(t) und ⟨B⟩(t). Was kann man feststellen? e) Welche Resultate erhält man, wenn man zur Zeit t die Observable A bzw. B misst? Deutung? 15. Das Wechselwirkungsbild (Man beachte bei dieser Aufgabe die Ergänzungen FIII und GIII .) Bei einem beliebigen physikalischen System sei H0 (t) der Hamilton-Operator und U0 (t, t0 ) der zugehörige Entwicklungsoperator: iℏ
∂ U0 (t, t0 ) = H0 (t)U0 (t, t0 ) ∂t U0 (t0 , t0 ) = 𝟙
Das System werde in der Weise gestört, dass sein Hamilton-Operator nun H(t) = H0 (t) + W(t) lautet. Ist |ψS (t)⟩ der Zustandsvektor des Systems im Schrödinger-Bild, so nennt man den Vektor |ψI (t)⟩ = U0† (t, t0 )|ψS (t)⟩ den Zustandsvektor im Wechselwirkungsbild ¹ . 1 Der Index I ist wegen des englischen bzw. französischen Ausdrucks interaction für Wechselwirkung auch im Deutschen üblich.
•
344 | Ergänzung LIII
a) Man zeige, dass die zeitliche Entwicklung von |ψI (t)⟩ durch die Differentialglei chung iℏ
d |ψI (t)⟩ = WI (t)|ψI (t)⟩ dt
bestimmt wird. Darin ist WI (t) = U0† (t, t0 )W(t)U0 (t, t0 ) der aus W(t) hervorgehende transformierte Operator. Man erkläre qualitativ, war um sich bei einer gegenüber H0 (t) sehr kleinen Störung W(t) der Zustandsvektor |ψI (t)⟩ sehr viel langsamer ändert als |ψS (t)⟩. b) Man zeige, dass die vorstehende Differentialgleichung zur Integralgleichung t
|ψI (t)⟩ = |ψI (t0 )⟩ +
1 ∫ dt WI (t )|ψI (t )⟩ iℏ t0
mit |ψI (t0 )⟩ = |ψS (t0 )⟩ äquivalent ist. c) Man löse diese Gleichung durch Iteration und zeige, dass man den Vektor |ψI (t)⟩ in eine Potenzreihe entwickeln kann:
t t t { } { } 1 1 dt W (t ) dt WI (t ) + . . . } |ψI (t0 )⟩ |ψI (t)⟩ = {𝟙 + ∫dt WI (t ) + ∫ ∫ I 2 { } iℏ (iℏ) t0 t0 t0 { }
16. Korrelationen zwischen zwei Teilchen (Zur Beantwortung von Teil e) beachte man Ergänzung EIII ) Wir betrachten ein System aus den beiden Teilchen (1) und (2) mit der Masse m, die sich in einem unendlich tiefen Potentialtopf der Breite a befinden, aber nicht mitein ander in Wechselwirkung stehen (s. Ergänzung HI , § 2-c). Die Hamilton-Operatoren der beiden Teilchen seien H(1) bzw. H(2) und |φ n (1)⟩ bzw. |φ q (2)⟩ die zugehörigen 2 2 2 q2 π 2 ℏ2 π ℏ Eigenfunktionen zu den Energiewerten n2ma 2 bzw. 2ma 2 . Im Zustandsraum des Ge samtsystems sei die Basis definiert durch |φ n φ q ⟩ = |φ n (1)⟩ ⊗ |φ q (2)⟩ a) Man ermittle die Eigenzustände und die Eigenwerte des Operators H = H(1) + H(2), also des Hamilton-Operators des Gesamtsystems, und bestimme den Entar tungsgrad der beiden niedrigsten Energiezustände. b) Zum Zeitpunkt t = 0 sei das System im Zustand |ψ(0)⟩ =
1 1 1 1 |φ1 φ2 ⟩ + |φ2 φ2 ⟩ |φ1 φ1 ⟩ + |φ2 φ1 ⟩ + √6 √3 √6 √3
Aufgaben |
345
•
α) In welchem Zustand befindet sich das System zur Zeit t? β) Welche Ergebnisse sind bei einer Energiemessung mit welchen Wahrschein lichkeiten möglich? γ) Was ergibt sich entsprechend, wenn man H(1) statt H beobachtet? c) α) Man zeige, dass der Zustandsvektor |ψ(0)⟩ als ein tensorielles Produkt ge schrieben werden kann. Für diesen Zustand berechne man die Erwartungs werte ⟨H(1)⟩, ⟨H(2)⟩ sowie ⟨H(1) H(2)⟩ und vergleiche sie. Wie kann man sich dieses Resultat erklären? β) Man zeige, dass die Ergebnisse auch gelten, wenn sich das System in dem in Teil b) berechneten Zustand |ψ(t)⟩ befindet. d) Man nehme an, das System sei zur Zeit t = 0 im Zustand |ψ(0)⟩ =
1 3 1 |φ1 φ1 ⟩ + √ |φ1 φ2 ⟩ + |φ2 φ1 ⟩ 5 √5 √5
Man zeige, dass |ψ(0)⟩ jetzt nicht mehr als ein tensorielles Produkt geschrieben werden kann. Was wird in diesem Fall aus den unter c) gegebenen Antworten? e) α) Wie lautet in der von den Vektoren |φ n φ q ⟩ aufgespannten Basis die Matrix, die den Dichteoperator ρ(0) zum Zustand |ψ(0)⟩ aus b) darstellt? Wie lautet die Dichtematrix ρ(t) zum Zeitpunkt t? Für t = 0 bilde man die Teilspuren ρ(1) = Tr2 {ρ}
und
ρ(2) = Tr1 {ρ}
Beschreiben die Dichteoperatoren ρ, ρ(1) und ρ(2) reine Zustände? Man ver gleiche ρ mit ρ(1) ⊗ ρ(2); Deutung? β) Man beantworte die gleichen Fragen wie in α) für den unter d) gegebenen Zustand |ψ(0)⟩. Die folgenden Aufgaben befassen sich mit dem Begriff des Dichteoperators. Man be achte hierzu Ergänzung EIII . 17. Es sei ρ der Dichteoperator (s. Ergänzung EIII ) eines beliebigen Systems, |χ l ⟩ die Ei genvektoren und π l die zugehörigen Eigenwerte von ρ. Wie lauten ρ und ρ 2 in Abhän gigkeit von |χ l ⟩ und π l ? Welche Gestalt haben diese Matrizen in der {|χ l ⟩}-Darstellung zum einen für den Fall, dass ρ einen reinen Zustand beschreibt, und zum anderen für ein statistisches Gemisch? (Es ergibt sich, dass für den reinen Fall ρ nur ein einziges von null verschiedenes Diagonalelement mit dem Wert eins besitzt, während beim ge mischten Fall in der Diagonalen mehrere von null verschiedene Elemente mit Werten stehen, die zwischen 0 und 1 liegen.) Man zeige, dass ρ genau dann zu einem reinen Zustand gehört, wenn die Spur von ρ 2 gleich eins ist. 18. Die Entwicklung eines Systems mit dem Dichteoperator ρ(t) werde durch den Ha milton-Operator H(t) bestimmt. Man zeige, dass die Spur von ρ 2 zeitlich konstant ist. Schlussfolgerung: Kann sich das System in der Weise ändern, dass es sich nacheinan der in einem reinen und in einem gemischten Zustand befindet?
•
346 | Ergänzung LIII
19. Ein Gesamtsystem (1) + (2) bestehe aus den beiden Teilsystemen (1) und (2). Fer ner seien A und B zwei Operatoren, die im Zustandsraum H(1) ⊗ H(2) wirken. Man zeige, dass die beiden Teilspuren Tr1 {AB} und Tr1 {BA} gleich sind, wenn A bzw. B tatsächlich nur im Raum H(1) wirken, wenn man also für A bzw. B A = A(1) ⊗ 𝟙(2)
bzw.
B = B(1) ⊗ 𝟙(2)
schreiben kann. Anwendung: Man berechne für den Fall, dass der Hamilton-Operator H des Ge samtsystems die Summe H = H(1) + H(2) zweier Operatoren ist, die nur in H(1) bzw. H(2) wirken, die zeitliche Änderung des Dichteoperators ρ(1). Man interpretiere das Ergebnis physikalisch.
Referenzen und Literaturhinweise Aufgabe 5: Flügge (1.24), § 40 und § 41; Landau und Lifshitz (1.19), § 22. Aufgabe 10: Levine (12.3), Kap. 14; Eyring et al. (12.5), § 18b. Aufgabe 15: siehe Referenzen in Ergänzung GIII
d d t ρ(1)
Nachdem wir uns mit dem mathematischen Formalismus und dem physikali schen Inhalt der Quantenmechanik etwas vertraut gemacht haben, können wir eine Reihe von Aussagen aus Kapitel I präzisieren und vervollständigen. In diesem und den beiden folgenden Abschnitten wollen wir allgemein die quantenmechanischen Eigen schaften eines Teilchens untersuchen, das einem skalaren Potential¹ beliebiger Form unterliegt, und beschränken uns dabei der Einfachheit halber auf eindimensionale Probleme. Zunächst befassen wir uns mit den gebundenen (stationären) Zuständen eines Teilchens, dessen Energien ein diskretes Spektrum bilden (Ergänzung MIII ), da nach mit den nichtgebundenen Zuständen, die zu einem kontinuierlichen Spektrum gehören (Ergänzung NIII ), und schließlich mit einem sehr wichtigen Sonderfall des periodischen Potentials (Ergänzung OIII ), der vor allem in der Festkörperphysik eine Rolle spielt.
1 Auf den Fall eines Vektorpotentials werden wir später, vor allem in Ergänzung EVI eingehen.
•
348 | Ergänzung MIII
Ergänzung MIII Gebundene Zustände in einem Potentialtopf 1 2
Quantisierung der gebundenen Energiezustände | 349 Energie des Grundzustandes | 352
In Ergänzung HI behandelten wir bereits die gebundenen Zustände eines Teilchens, das sich in einem rechteckigen endlich oder unendlich tiefen Potentialtopf befindet. Dabei ergaben sich bestimmte Eigenschaften dieser Zustände: Das Energiespektrum ist diskret, wobei die Energie des Grundzustandes oberhalb des Minimums der klas sischen Energie liegt. Dies gilt ganz allgemein und hat zahlreiche physikalische Kon sequenzen, wie wir in diesem Abschnitt sehen werden. Weist die potentielle Energie eines Teilchens ein Minimum wie in Abb. 1a auf, so sagt man, das Teilchen befinde sich in einem „Potentialtopf“.¹ Bevor wir qualitativ auf die stationären Zustände eines Quantenteilchens in einem derartigen Potential eingehen, erinnern wir uns an die Bewegung des zugehörigen klassischen Teilchens. Hier ruht das Teilchen im Punkt M0 mit der Abszisse x0 , wenn seine Energie bei einer Potentialtiefe V0 den kleinstmöglichen Wert Ekl = −V0 annimmt. Gilt −V0 < Ekl < 0, so oszilliert das Teilchen im Topf mit einer Amplitude, die mit wachsender Energie Ekl größer wird. Ist schließlich Ekl > 0, so bleibt das Teilchen nicht im Potentialtopf, sondern entfernt sich ins Unendliche. Die „gebundenen“ Zustände des klassischen Teilchens gehören also sämtlich zu den zwischen −V0 und 0 liegenden (negativen) Energiewerten. Ganz anders stellt sich die Situation für ein Quantenteilchen dar. Die Zustände mit wohlbestimmter Energie sind stationäre Zustände, und ihre Wellenfunktionen φ(x) sind Lösungen der Eigenwertgleichung des Hamilton-Operators H [−
ℏ2 d2 + V(x)] φ(x) = E φ(x) 2m dx2
(1)
Eine derartige Differentialgleichung zweiter Ordnung erlaubt für jeden beliebigen Wert E unendlich viele Lösungen: Gibt man für einen beliebigen Punkt einen beliebi gen Wert für die Funktion φ(x) und ihre Ableitung vor, so liegt φ(x) für alle x fest. Es ist also nicht Gl. (1) allein, die zu einer Einschränkung der möglichen Energiewerte führt. Erst wenn man der Funktion φ(x) zusätzlich gewisse Randbedingungen aufer legt, bleibt eine bestimmte Zahl von erlaubten Energiewerten übrig (Quantisierung der Energieniveaus).
1 Man beachte, dass die potentielle Energie nur bis auf eine Konstante bestimmt ist. Üblicherweise setzt man diese so fest, dass das Potential im Unendlichen gleich null ist. https://doi.org/10.1515/9783110638738-033
Gebundene Zustände in einem Potentialtopf |
349
•
(a)
(b)
(c)
(d) Abb. 1: Ein zwischen den Punkten x = x1 und x = x2 liegender Potentialtopf mit der Tiefe V 0 (a). Wir nehmen eine Lösung φ(x) der Eigenwertgleichung von H, die für x < x1 exponentiell verschwindet, falls x → −∞, und setzen diese Lösung auf der gesamten x-Achse fort. Für einen beliebigen Wert ̃ ̃ der Energie E divergiert φ(x) wie B(E) eρx , falls x → +∞: b) zeigt den Fall B(E) > 0, d) den Fall ̃ ̃ B(E) < 0. Wird der Energiewert aber so gewählt, dass B(E) = 0 ist, so strebt φ(x) für x → +∞ gegen null (c) und φ(x) ist quadratisch integrierbar.
1 Quantisierung der gebundenen Energiezustände Wir erinnern daran, dass wir unter „gebundenen Teilchenzuständen“ solche Zustän de verstehen, bei denen die zugehörige Wellenfunktion der Eigenwertgleichung (1) ge nügt und quadratisch integrierbar ist. Auf diese Bedingung kann man nicht verzichten, wenn φ(x) den physikalischen Zustand eines Teilchens beschreiben soll. Es handelt sich also um stationäre Zustände, für die die Aufenthaltswahrscheinlichkeitsdichte |φ(x)|2 nur in einem begrenzten Bereich des Raumes wesentlich von null verschie
•
350 | Ergänzung MIII +∞
dene Werte annimmt. (Damit das Integral ∫−∞ dx |φ(x)|2 konvergiert, muss |φ(x)|2 für x → ±∞ genügend schnell gegen null gehen.) In gewisser Weise erinnern die gebun denen Zustände an die Bewegung eines klassischen Teilchens, das in einem Poten tialtopf oszilliert, ohne diesen jemals zu verlassen, das also negative (aber oberhalb −V0 liegende) Energiewerte Ekl besitzt. Wenn wir in der Quantenmechanik an die Wellenfunktion φ(x) die Bedingung stellen, dass sie quadratisch integrierbar ist, so werden wir sehen, dass dies nur für ei ne diskrete Folge von Energiewerten möglich ist (wobei diese übrigens auch zwischen −V0 und 0 liegen). Wir betrachten hierzu das Potential, das in Abb. 1a dargestellt ist. Zur Vereinfachung nehmen wir an, dass V(x) im Äußeren des Intervalls [x1 , x2 ] in Strenge gleich null ist. Für x < x1 (Bereich I) gilt dann V(x) = 0, und man hat als Lösung von Gl. (1) sofort: – wenn E > 0: φI (x) = Aeikx + A e−ikx
(2)
mit k=√ –
2mE ℏ2
(3)
wenn E < 0: φI (x) = Beρx + B e−ρx
(4)
mit ρ = √−
2mE ℏ2
(5)
Wenn wir nun nach einer quadratisch integrierbaren Lösung suchen, so kommt die Form (2) nicht in Frage, weil es sich dabei um eine Überlagerung ebener Wellen mit konstantem Betrag handelt, das Integral x1
∫ dx |φI (x)|2
(6)
−∞
also divergieren würde. Daher bleibt nur die Möglichkeit von Gl. (4), und wir gelan gen zu einem ersten Resultat: Die gebundenen Zustände des Teilchens gehören alle zu negativen Energiewerten. In Gl. (4) muss der Term mit e−ρx fortgelassen werden, weil er für x → −∞ divergiert. Es bleibt φI (x) = eρx
wenn x < x1
(7)
Dabei haben wir den Proportionalitätsfaktor B weggelassen, weil φ(x) wegen der Ho mogenität von Gl. (1) nur bis auf eine multiplikative Konstante bestimmt ist. Durch Fortsetzung von φI (x) erhalten wir die Wellenfunktion im Intervall [x1 , x2 ] (Bereich II): Wir suchen nach der Lösung von Gl. (1), die für x = x1 den Wert eρx1
Gebundene Zustände in einem Potentialtopf |
351
•
hat und deren erste Ableitung an dieser Stelle gleich ρ eρx1 ist. Diese Funktion φII (x) hängt von ρ und natürlich vom genauen Verlauf des Potentials V(x) ab. Jedenfalls ist φII (x) als Lösung einer Differentialgleichung zweiter Ordnung durch die vorstehenden Randbedingungen eindeutig bestimmt. Darüber hinaus sieht man, dass sie reell ist. Dies erlaubt ihre grafische Veranschaulichung wie in Abb. 1, Teil b, c und d). Für x > x2 (Bereich III) schließlich können wir die Lösung in der Form ̃ ρx + B ̃ e−ρx φIII (x) = Be
(8)
̃ B
̃ und zwei reelle Konstante sind, die durch die Stetigkeitsbedin schreiben, wobei B gung für φ(x) und dφ/ dx im Punkt x = x2 festgelegt werden. Sie hängen von ρ und vom Verlauf des Potentials ab. Somit haben wir eine Lösung von Gl. (1) konstruiert, wie sie z. B. durch Abb. 1b veranschaulicht werden könnte. Ist diese Lösung nun quadratisch integrierbar? Die Lösung (8) zeigt sofort, dass dies im Allgemeinen nicht der Fall sein wird, es sei denn, ̃ ist gleich null (wie es in Abb. 1c dargestellt ist). Nun hängt bei ge die Konstante B gebenem V(x) diese Konstante über ρ von der Energie E ab. Die einzigen Werte von E, für die ein gebundener Zustand existiert, sind daher die Lösungen der Gleichung ̃ B(E) = 0. Diese bilden ein diskretes Spektrum E1 , E2 , . . . (s. Abb. 2), das natürlich vom gewählten Potential V(x) abhängt. Im Folgenden werden wir sehen, dass sämtliche E i oberhalb von −V0 liegen.
̃ Abb. 2: Grafische Darstellung der Funktion B(E). Die Nullstellen liefern die Energiewerte, für die die Wellenfunktion φ(x) quadratisch integrierbar ist (wie bei Abb. 1c), das sind also die Energien E 1 , E 2 , E 3 , . . . der gebundenen Zustände. Sie liegen alle zwischen −V 0 und 0.
Wir stellen also fest: Befindet sich ein Teilchen in einem Potential beliebiger Form, so bilden die möglichen Werte der Energie der gebundenen Zustände eine diskrete Folge; man umschreibt das gewöhnlich mit dem Satz, die Energie der gebundenen Zustände sei quantisiert. Dieses Ergebnis ist mit der Quantisierung der elektromagnetischen Hohlraum strahlung (Schwingungsmoden) zu vergleichen. In der klassischen Mechanik gibt es hierzu kein Analogon: Hier sahen wir, dass zwischen −V0 und 0 alle Werte erlaubt sind. Man nennt in der Quantenmechanik den Zustand mit der niedrigsten Energie E1 den Grundzustand, den mit der nächsthöheren Energie E2 den ersten angeregten Zu stand usw. Man kann dies durch ein Schema verdeutlichen: Im Innern des Poten tialtopfes, mit dem man V(x) darstellt, zeichnet man ein horizontales Geradenstück,
•
352 | Ergänzung MIII
dessen vertikaler Abstand von der Abszisse der Energie des betreffenden Niveaus ent spricht und dessen Länge eine Vorstellung von der räumlichen Ausdehnung der Wel lenfunktion liefert (tatsächlich gibt dieses Geradenstück den Bereich auf der x-Achse an, auf dem sich ein klassisches Teilchen derselben Energie bewegen würde). Für die ganze Folge der Energieniveaus erhält man dann ein Schema von der Art wie in Abb. 3.
Abb. 3: Schematische Darstellung der gebundenen Zustände eines Teilchens in einem Potentialtopf. Für jeden stationären Zustand zeichnet man ein horizontales Geradenstück, dessen Ordinate gerade der Energie des betreffenden Niveaus entspricht. Es wird dabei von den Schnittpunkten mit der Potentialkurve V(x) begrenzt und beschreibt somit den Bereich, in dem sich ein klassisches Teilchen derselben Energie aufhalten würde. Dies liefert eine ungefähre Vorstellung von der Ausdehnung der zugehörigen Wellenfunktion.
Wie wir bereits in Kapitel I feststellten, ist die Energiequantisierung ein spezifisch quantenmechanisches Phänomen. Es tritt bei zahlreichen physikalischen Systemen wie den Atomen (z. B. dem Wasserstoffatom, s. Kapitel VII), dem harmonischen Oszil lator (Kapitel V), den Atomkernen usw. auf.
2 Energie des Grundzustandes Wir zeigen jetzt, dass die Energien E1 , E2 , . . . der gebundenen Zustände alle oberhalb von −V0 , dem kleinsten Wert der potentiellen Energie V(x), liegen. Wir werden sehen, wie man dieses Ergebnis aufgrund der Heisenbergschen Unschärferelation leicht ver stehen kann. Multipliziert man Gl. (1) mit φ∗ (x) und integriert, so erhält man +∞
+∞
+∞
−∞
−∞
−∞
d2 ℏ2 ∫ dx φ∗ (x) 2 φ(x) + ∫ dx V(x)|φ(x)|2 = E ∫ dx |φ(x)|2 − 2m dx
(9)
Bei einem gebundenen Zustand kann man φ(x) normieren. Dann lautet diese Glei chung einfach E = ⟨T⟩ + ⟨V⟩
(10)
Gebundene Zustände in einem Potentialtopf
| 353
•
Es ist nämlich +∞ +∞ d 2 d2 ℏ2 ℏ2 ∗ ∫ dx φ (x) 2 φ(x) = ∫ dx φ(x) ⟨T⟩ = − dx 2m 2m dx −∞ −∞
(11)
wobei wir partiell integriert und die Tatsache berücksichtigt haben, dass φ(x) für |x| → ∞ gegen null geht, und +∞
⟨V⟩ = ∫ dx V(x)|φ(x)|2
(12)
−∞
E ist demnach die Summe des Erwartungswerts der kinetischen Energie P2 |φ⟩ 2m und des Erwartungswerts der potentiellen Energie ⟨T⟩ = ⟨φ|
(13)
⟨V⟩ = ⟨φ|V(X)|φ⟩
(14)
Man erkennt sofort, dass ⟨T⟩ > 0
(15)
und +∞
⟨V⟩ ≥ ∫ dx (−V0 )|φ(x)|2 = −V0
(16)
−∞
also E = ⟨T⟩ + ⟨V⟩ > ⟨V⟩ ≥ −V0
(17)
ist. Wie wir oben sahen, ist E negativ, so dass wie in der klassischen Mechanik die Energie der gebundenen Zustände zwischen −V0 und 0 liegt. Es gibt aber einen wichtigen Unterschied zwischen der klassischen und der Quan tenmechanik: Während das klassische Teilchen die Energie −V0 (das Teilchen ruht im Punkt M0 ) oder ein wenig darüber (das Teilchen führt kleine Schwingungen aus) an nehmen kann, ist das für ein Quantenteilchen nicht möglich. Die niedrigstmögliche Energie E1 (des Grundzustandes) ist in Strenge größer als −V0 (s. Abb. 3). Ein physi kalisches Verständnis dieser Tatsache ermöglichen die Unschärferelationen von Hei senberg. Versucht man nämlich, einen Zustand zu konstruieren, für den der Erwartungs wert der potentiellen Energie möglichst klein ist, so sieht man mit Gl. (12), dass man hierzu eine Wellenfunktion wählen muss, die praktisch im Punkt M0 lokalisiert ist. Die Standardabweichung ∆X ist also sehr klein, die Standardabweichung ∆P dafür entsprechend groß. Weil aber ⟨P2 ⟩ = (∆P)2 + ⟨P⟩2 ≥ (∆P)2
(18)
ist, gilt dies auch für die kinetische Energie ⟨T⟩ = ⟨P2 ⟩/2m. Nähert sich daher die po tentielle Energie des Teilchens ihrem Minimum, so wächst die kinetische Energie ins
•
354 | Ergänzung MIII
Unendliche. Die Wellenfunktion des Grundzustands entspricht einem Kompromiss, bei dem die Summe dieser beiden Energien minimal ist. Der Grundzustand des Quan tenteilchens wird somit durch eine Wellenfunktion mit einer gewissen räumlichen Ausdehnung charakterisiert (Abb. 3), und seine Energie liegt oberhalb von −V0 : Im Gegensatz zur klassischen Mechanik gibt es in der Quantenmechanik keinen Zustand mit wohldefinierter Energie, bei dem sich das Teilchen am Boden des Potentialtopfes „in Ruhe“ befindet. Bemerkung: Weil die Energie der gebundenen Zustände zwischen −V0 und 0 liegt, können derartige Zustän de nur dann existieren, wenn das Potential V(x) in einem oder in mehreren Bereichen auf der x-Achse negative Werte annimmt. Das ist der Grund, weshalb wir uns in diesem Abschnitt mit einem Potentialtopf wie in Abb. 1a befasst haben. Erst im folgenden Ergänzung werden wir diese Einschränkung fallen lassen. Dagegen wird auch hier der Fall nicht ausgeschlossen, dass V(x) für bestimmte Werte von x posi tiv ist. Zum Beispiel kann der „Topf“ von Potential„wänden“ oder -„wällen“ umgeben sein, s. z. B. Abb. 4, wobei allerdings das Potential weiterhin im Unendlichen genügend rasch verschwindet. In diesem Fall bleiben klassisch bestimmte Bewegungen mit positiver Energie beschränkt, wäh rend man in der Quantenmechanik durch dieselbe Überlegung wie weiter oben zeigen kann, dass gebundene Zustände stets eine Energie besitzen, die zwischen −V0 und 0 liegt. Physikalisch be ruht dieser Unterschied darauf, dass ein Potentialwall endlicher Höhe ein Quantenteilchen nie vollständig zur Umkehr zwingen kann: Wegen des Tunneleffekts besteht stets eine gewisse Wahr scheinlichkeit, dass es diesen Wall passiert (s. Ergänzung HI , § 2-b-β).
Abb. 4: Ein Potentialtopf mit der Tiefe −V 0 ist von zwei Wällen mit den Höhen V 1 bzw. V 2 umgeben (wobei als Beispiel V 1 ≤ V 2 sei). Klassisch gibt es Bewegungen mit Energien, die zwischen −V 0 und V 1 liegen und bei denen das Teilchen zwischen den Wällen bleibt. In der Quantenmechanik kann dagegen ein Teilchen mit einer Energie zwischen 0 und V 1 die Potentialwälle durchtunneln. Folglich besitzen die gebundenen Zustände stets eine Energie, die zwischen −V 0 und 0 liegt.
Referenzen und Literaturhinweise Feynman, Bd. 5 (1.2), § 16–6; Messiah (1.17), Kap. III, § 11; Ayant und Belorizky (1.10), Kap. IV, § 1, § 2, § 3; Schiff (1.18), § 8.
Nichtgebundene Zustände |
355
•
Ergänzung NIII Nichtgebundene Zustände 1 1-a 1-b 2 3
Transmissionsmatrix M(k) | 356 Definition von M(k) | 356 Eigenschaften von M(k) | 358 Transmissions- und Reflexionskoeffizienten | 359 Beispiel | 361
Im vorangegangenen Abschnitt sahen wir, dass gebundene Zustände eines Teilchens in einem Potential V(x) nur existieren, wenn das Potential anziehend ist und im klas sischen Fall räumlich begrenzte Bewegungen erlaubt; die zugehörigen Energien sind dann negativ.¹ Positive Energiewerte mussten wir verwerfen, weil sie zu Eigenfunktio nen des Hamilton-Operators H führten, die sich im Unendlichen wie die nicht qua dratisch integrierbaren Exponentialfunktionen e±ikx verhalten. Andererseits wissen wir aber aus Kapitel I, dass man durch Superposition derartiger Funktionen quadra tisch integrierbare Wellenfunktionen ψ(x) (die Wellenpakete) konstruieren kann, die für die Beschreibung eines physikalischen Teilchenzustandes geeignet sein können. Weil bei ihnen aber mehrere Werte der Wellenzahl k, also mehrere Energiewerte ins Spiel kommen, sind sie mit Sicherheit keine stationären Zustände: Die Wellenfunktion ψ(x) ändert sich zeitlich, sie breitet sich aus und verformt sich. Diese Änderung kann nun sehr leicht berechnet werden, weil ψ(x) eine Entwicklung nach den Eigenfunk tionen φ k (x) des Hamilton-Operators darstellt. Wir hatten dies z. B. in Ergänzung JI getan, als wir von den Eigenschaften der φ k (x) ausgingen, um die Transmissionsund Reflexionskoeffizienten für einen Potentialwall, die Reflexionsverzögerung usw. zu bestimmen. Daher erweist es sich als sinnvoll, auch die Eigenfunktionen von H zu positiven Eigenwerten² zu behandeln, wie es in Ergänzung HI für bestimmte Recht eckpotentiale bereits geschehen ist. In diesem Abschnitt untersuchen wir nun allgemein (für eindimensionale Pro bleme) den Zusammenhang zwischen einem Potential V(x) und den Eigenfunktionen φ k (x) zu positiver Energie. Dabei unterlegen wir V(x) nur der Einschränkung, dass es außerhalb eines endlichen Intervalls [x1 , x2 ] gleich null ist. Ansonsten darf es von beliebiger Form sein, es dürfen also z. B. mehrere Wälle, Töpfe usw. auftreten. Wir wer den in allen Fällen zeigen, dass man den Einfluss des Verlaufes von V(x) auf die Funk tion φ k (x) durch eine 2 × 2-Matrix M(k) beschreiben kann, die eine Reihe allgemeiner Eigenschaften aufweist. Wir gelangen dabei zu Ergebnissen, die von der speziellen
1 Wir hatten für die Energie den Ursprung so gewählt, dass V(x) im Unendlichen verschwindet. 2 Man könnte auch an die nicht quadratisch integrierbaren Eigenfunktionen des Hamilton-Operators zu negativen Energien denken, die nicht zu dem in Ergänzung MIII ermittelten diskreten Spektrum gehören. Diese divergieren aber im Unendlichen sehr rasch und sind für eine Konstruktion eines qua dratisch integrierbaren Wellenpakets nicht geeignet. https://doi.org/10.1515/9783110638738-034
•
356 | Ergänzung NIII
Gestalt des Potentials unabhängig sind. So sind z. B. die Transmissions- und Reflexi onskoeffizienten an einem (symmetrischen, aber auch nichtsymmetrischen) Wall die selben, wenn das Teilchen von links und wenn es von rechts auf diesen Wall trifft. Der Abschnitt ist weiter Ausgangspunkt für den dann folgenden Abschnitt, in dem wir uns mit dem Verhalten eines Teilchens in einem periodischen Potential befassen werden.
Abb. 1: Das Potential V(x) zeigt im Innern des Intervalls [x1 , x2 ] einen beliebigen Verlauf, während es außerhalb gleich null ist.
1 Transmissionsmatrix M(k) 1-a Definition von M(k) Bei einem eindimensionalen Problem betrachten wir ein Potential V(x), das außer halb eines Intervalls [x1 , x2 ] von der Länge l gleich null ist, in seinem Inneren aber eine beliebige Form besitzen kann, s. Abb. 1. Den Ursprung der x-Achse legen wir in den Mittelpunkt des Intervalls. Für einen stationären Zustand mit der Energie E muss jede Wellenfunktion φ(x) der Differentialgleichung {
d2 2m + 2 [E − V(x)]} φ(x) = 0 dx2 ℏ
(1)
genügen. Wir führen mit k=√
2mE ℏ2
(2)
einen Parameter ein, der im Folgenden die Energie charakterisieren soll. Im Bereich x < − l/2 genügt die Funktion eikx der Gl. (1). Mit v k (x) bezeichnen wir die Lösung, die für x < − l/2 mit eikx zusammenfällt. Ist x > + l/2, so ist v k (x) notwendig eine Linearkombination der beiden unabhängigen Lösungen eikx und e−ikx , so dass wir zu v k (x) = eikx v k (x) = F(k) e
ikx
−ikx
+ G(k) e
wenn x < − l/2
(3a)
wenn x > + l/2
(3b)
Nichtgebundene Zustände | 357
•
zusammenfassen können. Darin sind F(k) und G(k) Koeffizienten, die von k und vom speziellen Verlauf des Potentials abhängen. Entsprechend kann man die Lösung vk (x) einführen, die für x < − l/2 gleich e−ikx ist: vk (x) = e−ikx vk (x)
ikx
= F (k) e
−ikx
+ G (k) e
wenn x < − l/2
(4a)
wenn x > + l/2
(4b)
Die allgemeine Lösung φ k (x) von Gl. (1) (sie ist eine Differentialgleichung 2. Ordnung) ist dann eine Linearkombination von v k und vk : φ k (x) = A v k (x) + A vk (x)
(5)
Aus den Beziehungen (3a) und (4a) folgt φ k (x) = A eikx + A e−ikx
wenn x < − l/2
(6a)
wenn x > + l/2
(6b)
und aus (3b) und (4b) folgt A eikx + ̃ A e−ikx φ k (x) = ̃
Die Konstanten ̃ A und ̃ A sind durch die Beziehungen ̃ A = F(k)A + F (k)A ̃ A = G(k)A + G (k)A
(7)
gegeben. Führt man die Matrix M(k) = (
F(k) G(k)
F (k) ) G (k)
(8)
ein, so kann man dies auf die Form ̃ A A (̃ ) = M(k) ( ) A A
(9)
bringen. Mit Hilfe von M(k) kann man also aus der Wellenfunktion für die linke Seite des Potentials, Gl. (6a), die Wellenfunktion für die rechte Seite, Gl. (6b), bestimmen. Man nennt darum M(k) die Transmissionsmatrix des Potentials V(x). Bemerkung: Der einer Wellenfunktion φ(x) zugeordnete Strom ist J(x) =
dφ dφ ∗ ℏ [φ ∗ (x) − φ(x) ] 2mi dx dx
(10)
Differentiation nach x liefert d2 φ d2 φ ∗ d ℏ ] J(x) = [φ ∗ (x) 2 − φ(x) dx 2mi dx dx 2
(11)
•
358 | Ergänzung NIII
Mit Berücksichtigung von Gl. (1) erhält man d J(x) = 0 dx
(12)
Der zu einem stationären Zustand gehörende Strom J(x) ist daher auf der ganzen x-Achse kon stant. Diese Gleichung steht in Analogie zu der Beziehung div J(r) = 0
(13)
die sich für den stationären Zustand eines Teilchens ergibt, das sich im dreidimensionalen Raum bewegt, s. Gl. (D-11) in Kap. III. Wegen Gl. (12) kann man daher J k (x) für jedes x entweder nach Gl. (6a) oder nach Gl. (6b) berechnen. Es ist J k (x) =
ℏk ℏk ̃ 2 ̃ |2 ] [|A|2 − |A |2 ] = [| A| − | A m m
(14)
1-b Eigenschaften von M(k) Weil die Funktion V(x) reell ist, kann man leicht zeigen, dass mit φ(x) als einer Lösung von Gl. (1) auch φ∗ (x) Lösung dieser Gleichung ist. Betrachten wir darum die Funktion v∗k (x) als eine spezielle Lösung von Gl. (1). Der Vergleich von Gl. (3a) und Gl. (4a) zeigt, dass sie für x < −1/2 mit vk (x) zusammenfällt. Darum gilt für jedes x v∗k (x) = vk (x)
(15)
Setzt man hierin Gl. (3b) und Gl. (4b) ein, so ergibt sich F ∗ (k) = G (k) ∗
(16)
G (k) = F (k)
(17)
Wir können also die Transmissionsmatrix in der einfacheren Form M(k) = (
F(k) G(k)
G∗ (k) ) F ∗ (k)
(18)
schreiben. Wie wir eben sahen, hängt der Wahrscheinlichkeitsstrom J(x) für einen stationä ren Zustand nicht von x ab. Darum ist [s. Gl. (14] A|2 − |̃ A |2 |A|2 − |A |2 = |̃
(19)
für beliebige A und A . Damit erhält man, wenn man Gl. (18) in Gl. (9) einsetzt, |̃ A|2 − |̃ A |2 = [F(k)A + G∗ (k)A ][F ∗ (k)A∗ + G(k)A∗ ] − [G(k)A + F ∗ (k)A ][G∗ (k)A∗ + F(k)A∗ ] = [|F(k)|2 − |G(k)|2 ][|A|2 − |A |2 ]
(20)
Daher ist Gl. (19) zur Beziehung |F(k)|2 − |G(k)|2 = Det M(k) = 1 äquivalent.
(21)
Nichtgebundene Zustände |
359
•
Bemerkungen: 1. Über die Form des Potentials haben wir nichts vorausgesetzt. Ist es gerade, d. h. ist V(x) = V(−x), so besitzt die Matrix M(k) eine weitere Eigenschaft: Man kann nämlich zeigen, dass G(k) rein imaginär ist. ̃ die Koeffizienten von einlaufenden ebenen Wellen 2. Die Gleichungen (6) zeigen, dass A und A sind, d. h. sie gehören zu Teilchen, die sich aus dem negativen bzw. positiven Unendlichen auf ̃ und A den Wirkungsbereich des Potentials zu bewegen (einfallende Teilchen). Dagegen sind A die zu auslaufenden Wellen gehörenden Koeffizienten, sie beschreiben also die Teilchen, die sich vom Potential entfernen (transmittierte oder reflektierte Teilchen). Mit (
̃ A A ) = S(k) ( ̃ ) A A
(22)
führen wir eine Matrix ein, mit der wir die Amplituden der auslaufenden Wellen in Abhängigkeit von den Amplituden der einlaufenden Wellen darstellen können. Ihre Elemente lassen sich leicht durch die Elemente der Transmissionsmatrix ausdrücken. So folgt zunächst aus den Gleichungen ̃ = F(k)A + G∗ (k)A A ̃ = G(k)A + F ∗ (k)A A
(23a) (23b)
dass A =
1 ̃ − G(k)A] [A F ∗ (k)
(24)
Setzen wir dies in Gl. (23a) ein, so erhalten wir ̃= A
1 ̃ ] [(F(k)F ∗ (k) − G(k)G∗ (k))A + G∗ (k) A F ∗ (k)
(25)
Beachten wir Gl. (21), so ergibt sich für die S-Matrix schließlich S(k) =
1 F ∗ (k)
1 ( −G(k)
G∗ (k) ) 1
(26)
Wiederum mit Gl. (21) lässt sich rasch zeigen, dass S(k)S † (k) = S † (k)S(k) = 1
(27)
ist: Die S-Matrix ist unitär. Diese Matrix spielt besonders in der Streutheorie eine große Rolle. Ihre Unitarität könnte man auch beweisen, indem man von der Unitarität des Entwicklungsoperators (s. Ergänzung FIII ) ausgeht. Sie drückt ja lediglich die Tatsache aus, dass die Wahrscheinlichkeit, das Teilchen irgendwo auf der x-Achse zu finden, zeitlich konstant ist (Normierung der Wellen funktion).
2 Transmissions- und Reflexionskoeffizienten Zur Ermittlung der Reflexions- und Transmissionskoeffizienten für ein Teilchen, das auf ein Potential V(x) trifft, muss man im Prinzip (wie in Ergänzung JI ) aus den eben behandelten Eigenfunktionen des Hamilton-Operators H ein Wellenpaket konstruie ren. Betrachten wir z. B. ein von links kommendes Teilchen mit der Einfallsenergie E i ,
•
360 | Ergänzung NIII
dann erhält man das zugehörige Wellenpaket durch Superposition der Funktionen A = 0 gesetzt wurde; die Amplitudenfunktion g(k) besitzt dabei ein φ k (x), für die ̃ ausgeprägtes Maximum an der Stelle k = k i = √2mE i /ℏ2 . Da die Rechnung in allen Punkten analog zu der in Ergänzung JI verläuft, wollen wir sie hier nicht im Einzelnen ausführen, sondern nur zeigen, dass der Reflexionskoeffizient gleich |A (k i )/A(k i )|2 und der Transmissionskoeffizient gleich |̃ A(k i )/A(k i )|2 ist. Weil ̃ A = 0 ist, liefern die Gleichungen (22) und (26) ̃ A(k) =
1 F ∗ (k)
A (k) = −
A(k)
G(k) A(k) F ∗ (k)
Somit wird für den Reflexions- und den Transmissionskoeffizienten A (k i ) 2 G(k i ) 2 = R1 (k i ) = F(k ) A(k i ) i 2 ̃ 1 A(k i ) = T1 (k i ) = |F(k i )|2 A(k i )
(28)
(29a) (29b)
Mit Gl. (21) ist gesichert, dass R1 (k i ) + T1 (k i ) = 1 ist. Wenn jetzt das Teilchen von rechts kommen soll, muss man A = 0 setzen. Dies führt dann zu G∗ (k) ̃ A(k) = ∗ ̃ A (k) F (k) 1 A (k) = ∗ ̃ A (k) F (k) so dass der Transmissions- und der Reflexionskoeffizient durch A (k) 2 1 = T2 (k) = 2 |F(k)| ̃ A (k)
(30)
(31a)
und 2 ̃ G(k) 2 A(k) = R2 (k) = F(k) ̃ A (k)
(31b)
gegeben sind. Der Vergleich der Gleichung (29) mit (31) zeigt, dass T1 (k) = T2 (k) und R1 (k) = R2 (k) ist: Bei gegebener Energie ist die Durchlässigkeit einer (symmetrischen oder nichtsymmetrischen) Potentialbarriere stets dieselbe, gleichgültig von welcher Seite die Teilchen auf sie treffen. Andererseits ist nach Gl. (21) |F(k)| ≥ 1
(32)
Gilt hier das Gleichheitszeichen, so ist der Reflexionskoeffizient null und der Trans missionskoeffizient gleich eins (Resonanz). Die umgekehrte Situation ist dagegen
Nichtgebundene Zustände |
361
•
nicht möglich: Wegen Gl. (21) ist |F(k)| > |G(k)|, so dass T = 0 und R = 1 nur mög lich ist, wenn F und G gleichzeitig gegen unendlich streben. Man kann zeigen, dass dies nur für k = 0 geschehen könnte. Hierzu dividiere man die in Gl. (3) eingeführte Funktion v k (x) durch F(k). Mit F(k) → ∞ würde die Wellenfunktion auf der linken Seite identisch gleich null werden und somit notwendig auch ihre Fortsetzung auf der rechten Seite. Das ist aber außer für k = 0 und F = −G nicht möglich.
3 Beispiel Wir kehren zu dem in § 2-b von Ergänzung HI behandelten Rechteckpotential zurück: Im Intervall −1/2 < x < +1/2 ist V(x) gleich einer Konstanten V0 (s. Abb. 2, in der V0 positiv gewählt wurde).³
Abb. 2: Rechteckpotential.
Wir nehmen zunächst an, dass E unterhalb von V0 liegt und setzen ρ=√
2m (V0 − E) ℏ2
(33)
Eine elementare Rechnung wie die in Ergänzung HI liefert die Transmissionsmatrix [cosh ρl + i M(k) = (
k2 − ρ2 sinh ρl] e−ikl 2kρ
k2 i 0 sinh ρl 2kρ
−i
k 20 sinh ρl 2kρ
k2 − ρ2 sinh ρl] eikl [cosh ρl − i 2kρ
) (34)
mit k0 = √
2mV0 ℏ2
(35)
(V0 ist hier notwendig positiv, weil wir E < V0 vorausgesetzt haben). 3 Gegenüber dem in Ergänzung HI vorgestellten Beispiel ist hier die Potentialbarriere verschoben wor den.
•
362 | Ergänzung NIII Für den Fall E > V0 setzen wir k = √
2m (E − V0 ) ℏ2
(36)
und k0 = √ε
2mV0 ℏ2
(37)
Darin ist ε = +1, wenn V0 > 0, und −1, wenn V0 < 0. Wir erhalten dann [cos k l + i M(k) = (
k 2 + k 2 sin k l] e−ikl 2kk
k2 iε 0 sin k l 2kk
−iε [cos k l
k20 sin k l 2kk
k 2 + k 2 −i sin k l] eikl 2kk
) (38)
Die Elemente der Transmissionsmatrix erfüllen, wie es sein muss, in beiden Fällen die Beziehungen (16), (17) und (21).
Referenzen und Literaturhinweise Merzbacher (1.16), Kap. 6, § 5, § 6 und § 8; siehe außerdem die Referenzen in Ergän zung MIII .
Eindimensionales periodisches Potential
| 363
•
Ergänzung OIII Eindimensionales periodisches Potential 1 1-a 1-b 1-c 1-d 2 2-a 2-b 3 3-a 3-b 3-c
Durchgang durch mehrere identische Potentialbarrieren | 364 Schreibweisen | 364 Anpassungsbedingungen | 365 Iterationsmatrix Q(α) | 366 Eigenwerte von Q(α) | 367 Erlaubte und verbotene Energiebänder | 369 Verhalten der Wellenfunktion φ α (x) | 369 Bragg-Reflexion. Mögliche Energiewerte | 370 Energiequantisierung bei einem periodischen Potential. Einfluss der Ränder | 371 Bedingungen an die Wellenfunktion | 372 Erlaubte Energiebänder: Stationäre Zustände im Innern der Kette | 374 Verbotene Bänder: Stationäre Zustände an den Rändern | 378
In diesem Abschnitt wollen wir die quantenmechanischen Eigenschaften eines Teil chens untersuchen, das sich in einem periodischen Potential V(x) befindet. Die in diesem Zusammenhang betrachteten Funktionen V(x) müssen dabei nicht im stren gen Sinne periodisch sein; es genügt, wenn sie in einem endlichen Intervall auf der x-Achse ein periodisches Verhalten zeigen (Abb. 1), also ein bestimmter Verlauf N-mal regelmäßig aufeinanderfolgt (im eigentlichen Sinn periodisch wäre V(x) nur für den Grenzfall, dass N gegen unendlich geht).
Abb. 1: Ein Potential V(x) mit periodischer Struktur: Ein bestimmter Verlauf folgt N-mal aufeinander. Hier ist N = 4.
Derartigen periodischen Strukturen begegnet man z. B. bei der Untersuchung eines linearen Moleküls, das aus N identischen und regelmäßig angeordneten Atomen (oder Atomgruppen) besteht, aber auch in der Festkörperphysik, wenn man in einem eindi mensionalen Modell das Energiespektrum eines Kristallelektrons verstehen will. Ist N sehr groß (wie bei einem linearen Makromolekül oder einem makroskopischen Kris tall), so wird das Potential V(x) in einem bestimmten Raumbereich durch eine periodi sche Funktion beschrieben, und man erwartet, dass das Teilchen praktisch dieselben https://doi.org/10.1515/9783110638738-035
•
364 | Ergänzung OIII
Eigenschaften wie bei einem im strengen Sinne periodischen Potential aufweist. Phy sikalisch kann nun aber der Grenzfall N → ∞ nie realisiert werden, so dass wir uns für das Problem mit beliebigem endlichen N interessieren müssen. Für die Beschreibung der Abhängigkeit der Eigenfunktionen φ(x) des HamiltonOperators H vom Potential V(x) führen wir die 2 × 2-Iterationsmatrix Q ein. Ihre Eigenwerte können reell oder imaginär sein. Wir werden zeigen, dass φ(x) in den beiden Fällen ein völlig verschiedenes Verhalten aufweist. Weil diese Eigenwerte von der Energie E abhängen, werden wir Energiebereiche zu reellen Eigenwerten von Q von denen unterscheiden müssen, die zu imaginären Eigenwerten gehören: Es treten erlaubte und verbotene Energiebänder auf. Bemerkungen: 1. Den sich N-mal wiederholenden Potentialverlauf werden wir einfach „Potentialbarriere“ nen nen, obwohl es sich dabei auch um einen beliebig geformten „Potentialtopf“ handeln kann. 2. Bisher haben wir den Buchstaben k für einen Parameter benutzt, der proportional zur Qua dratwurzel aus der Energie E ist. In der Festkörperphysik ist es jedoch üblich, diesen Buchstaben in einem anderen Sinne zu verwenden. Darum ändern wir die Bezeichnungen aus dem vorigen Abschnitt und schreiben α=√
2mE ℏ2
(1)
Den Buchstaben k führen wir erst später ein (er hängt dort mit den Eigenwerten der Matrix Q zusammen).
1 Durchgang durch mehrere identische Potentialbarrieren Wir betrachten ein Potential von der Art, wie es in Abb. 1 skizziert ist: Die erste Bar riere ist um x = 0 zentriert, die zweite um x = l, die dritte um x = 2l, . . . , die letzte schließlich um x = (N − 1)l. Wir fragen nach dem Verhalten einer Eigenfunktion φ α (x) des Hamilton-Operators, also einer Lösung der Eigenwertgleichung: {
d2 2m + 2 [E − V(x)]} φ α (x) = 0 dx2 ℏ
(2)
worin E und α durch Gl. (1) miteinander verknüpft sind.
1-a Schreibweisen Für x ≤ −1/2 ist V(x) = 0 und die allgemeine Lösung der Gl. (2) lautet φ α (x) = A0 eiαx + A0 e−iαx
wenn x ≤ −
l 2
(3a)
Bei den in § 1-a von Ergänzung NIII eingeführten Funktionen v k (x) und vk (x) er setzen wir den Index k durch α. Mit ihnen lautet die allgemeine Lösung von Gl. (2) im
Eindimensionales periodisches Potential
| 365
•
Bereich der ersten Barriere φ α (x) = A1 v α (x) + A1 vα (x)
wenn −
l l ≤x≤+ 2 2
(3b)
Entsprechend erhält man im Bereich der zweiten um x = l zentrierten Barriere φ α (x) = A2 v α (x − l) + A2 vα (x − l)
wenn
3l l ≤x≤ 2 2
(3c)
und allgemeiner im Bereich der n-ten um x = (n − 1)l zentrierten Barriere φ α (x) = A n v α [x −(n −1)l]+ An vα [x −(n −1)l] wenn (n −1)l −
l l ≤ x ≤ (n −1)l + (3d) 2 2
Rechts von der N-ten Barriere schließlich, also für x ≥ (N − 1)l + l/2, ist wieder V(x) = 0, und wir haben φ α (x) = C0 eiα[x−(N−1)l] + C0 e−iα[x−(N−1)l]
wenn x ≥ (N − 1)l +
l 2
(3e)
Im folgenden Abschnitt werden wir diese verschiedenen Ausdrücke für φ α (x) an den Stellen x = −l/2, +l/2, . . . , (N − 1)l + l/2 anpassen. 1-b Anpassungsbedingungen Die Funktionen v α (x) und vα (x) hängen von der jeweiligen Form des Potentials ab. Mit Hilfe der Ergebnisse aus Ergänzung NIII können wir jedoch ihre Werte und die ihrer Ableitung an den Rändern jeder Barriere leicht berechnen. Hierzu stellen wir uns vor, dass alle Barrieren bis auf die n -te, die um die Stelle x = (n − 1)l zentriert ist, entfernt seien. Die Lösung (3d), die ja im Inneren dieser Barriere stets gültig ist, müsste dann nach links und rechts durch Überlagerungen ebener Wellen fortgesetzt werden. Diese erhält man aus den Beziehungen (6a) und (6b) in Ergänzung NIII , indem man x durch x − (n − 1)l sowie k durch α ersetzt und außerdem an den Koeffizienten A, A , ̃ A und ̃ A den Index n anbringt. Es ergibt sich so für x ≤ (n − 1)l − l/2 A n eiα[x−(n−1)l] + An e−iα[x−(n−1)l]
(4)
und für x ≥ (n − 1)l + l/2 ̃ A n eiα[x−(n−1)l] + ̃ An e−iα[x−(n−1)l]
(5)
Dabei gilt ̃ An An (̃ ) = M(α) ( ) An An
(6)
worin M(α) die in Ergänzung NIII eingeführte Matrix bedeutet. Folglich hat die in Gl. (3d) definierte Funktion φ α (x) am linken Rand der n-ten Barriere denselben Wert
•
366 | Ergänzung OIII
und dieselbe Ableitung wie die Superposition ebener Wellen (4) und am rechten Rand denselben Wert und dieselbe Ableitung wie (5). Damit können wir für die periodische Struktur die Anpassungsbedingungen auf einfache Weise formulieren. So genügt es, für den linken Rand der ersten Barriere (also an der Stelle x = − l/2) anzuschreiben, dass der Ausdruck (3a) denselben Wert und dieselbe Ableitung wie A1 eiαx + A1 e−iαx hat, woraus sich sofort A0 = A1
(7)
A0 = A1
ergibt. Für den rechten Rand der ersten Barriere, die mit dem linken Rand der zweiten Barriere zusammenfällt, müssen ̃ A1 eiαx + ̃ A1 e−iαx und A2 eiα(x−l) +A2 e−iα(x−l) denselben Wert und dieselbe Ableitung haben. Dies führt zu A1 eiαl A2 = ̃ A = ̃ A e−iαl 2
(8)
1
Setzt man für die Verbindungsstelle x = nl − l/2 der n-ten mit der (n + 1)-ten Barriere den Wert des Ausdrucks (5) und den seiner Ableitung mit den entsprechenden Werten gleich, die man aus (4) durch Ersetzen von n durch (n + 1) erhält, so findet man auf die gleiche Weise A n+1 = ̃ A n eiαl A = ̃ A e−iαl
(9)
n
n+1
Für den rechten Rand der letzten Barriere (x = (N −1)l + l/2) muss schließlich der Aus druck (3e) den gleichen Wert und die gleiche Ableitung haben wie der Ausdruck (5), wobei man hier n durch N zu ersetzen hat. Dann ergibt sich C0 = ̃ AN ̃ C = A 0
(10)
N
1-c Iterationsmatrix Q(α) Wir führen die Matrix D(α) = (
eiαl 0
0
) e−iαl
(11)
ein. Mit ihr kann man die Anpassungsbedingungen (9) in der Form (
̃ An A n+1 ) = D(α) ( ̃ ) An An+1
(12)
schreiben oder bei Berücksichtigung von Gl. (6) auch als (
A n+1 An ) = D(α)M(α) ( ) An+1 An
(13)
Eindimensionales periodisches Potential
| 367
•
Wiederholte Anwendung dieser Beziehung und Beachtung von (7) liefert dann (
A n+1 A1 ) = [D(α) M(α)]n ( ) An+1 A1 = [D(α) M(α)]n (
A0 ) A0
(14)
Schließlich kann man wegen (6) und (14) die Bedingung (10) in der Form (
AN C0 N−1 A 0 ( ) ) = M(α) ( ) = M(α)[D(α) M(α)] C0 AN A0
(15)
oder auch (
A0 C0 M(α) D(α) M(α) D(α) . . . D(α) M(α) ( ) ) = ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ C0 A0 N Matrizen M(α)
(16)
ausdrücken. In dieser Beziehung ist jeder Barriere eine Matrix M(α) und jedem Inter vall zwischen zwei aufeinanderfolgenden Barrieren eine Matrix D(α) zugeordnet. Die Gleichungen (13) und (14) zeigen, welche wichtige Rolle die Matrix Q(α) = D(α) M(α)
(17) A
A
spielt. Beim Übergang von ( A 1 ) zu ( A n+1 ), also bei einer Translation um nl längs der 1 n+1 periodischen Struktur, tritt sie in der n-ten Potenz auf. Aus diesem Grunde nennen wir Q(α) die Iterationsmatrix. Mit Gl. (18) aus Ergänzung NIII und dem Ausdruck (11) für D(α) erhält man eiαl F(α) Q(α) = ( −iαl e G(α)
eiαl G∗ (α) ) e−iαl F ∗ (α)
(18)
Die Berechnung von [Q(α)]n vereinfacht sich, wenn man durch einen Basiswechsel Q(α) auf Diagonalform bringt. Wir fragen daher nach den Eigenwerten dieser Matrix.
1-d Eigenwerte von Q(α) Es sei λ ein Eigenwert von Q(α). Dann lautet die charakteristische Gleichung [eiαl F(α) − λ][e−iαl F ∗ (α) − λ] − |G(α)|2 = 0
(19)
oder, mit der Beziehung (21) aus Ergänzung NIII , λ2 − 2λX(α) + 1 = 0
(20)
womit X(α) = Re{eiαl F(α)} =
1 Tr{Q(α)} 2
(21)
•
368 | Ergänzung OIII
Da F(α) einen Betrag größer als eins hat [s. Gl. (21) aus Ergänzung NIII ], gilt dies auch für eiαl F(α). Die Diskriminante dieser quadratischen Gleichung ist ∆ = [X(α)]2 − 1
(22)
Zwei Fälle sind möglich: 1. Hat die Energie E einen Wert, so dass |X(α)| ≤ 1
(23)
ist (wenn z. B. wie in Abb. 2 α zwischen α 0 und α 1 liegt), so kann man X(α) = cos[k(α)l]
(24)
mit 0 ≤ k(α) ≤
π l
(25)
setzen. Die einfache Rechnung zeigt dann, dass die Eigenwerte von Q(α) λ = e±ik(α)l
(26)
sind, also zwei zueinander konjugiert komplexe Zahlen mit dem Betrag eins.
Abb. 2: Die komplexe Zahl eiαl F(α) = X(α) + iY(α) in Abhängigkeit von α. Weil |F(α)| > 1 ist, liegt die Bildkurve in der komplexen Ebene außerhalb des Einheitskreises. Die Diskussion zeigt, dass für |X(α)| < 1, wenn also die Wahl von α zu einem zwischen den gestrichelten Geraden liegenden Kurvenpunkt führt, die zugehörige Energie in ein erlaubtes Band fällt, sonst in ein verbotenes Band.
Eindimensionales periodisches Potential
| 369
•
2. Liefert dagegen die Energie E einen Wert von α, so dass |X(α)| > 1
(27)
ist (α liegt z. B. zwischen α 1 und α 2 ), so setzt man X(α) = ε cosh[ρ(α)l]
(28)
ρ(α) ≥ 0
(29)
mit
und ε = +1, falls X(α) positiv, und ε = −1, falls X(α) negativ ist. Es wird dann λ = εe±ρ(α)l
(30)
Die Eigenwerte von Q(α) sind in diesem Fall beide reell und zueinander invers.
2 Erlaubte und verbotene Energiebänder 2-a Verhalten der Wellenfunktion φ α (x) Zur Anwendung von Gl. (14) beginnt man mit der Berechnung der beiden Spaltenma trizen Λ1 (α) und Λ2 (α), die die Eigenvektoren von Q(α) darstellen und zu den Eigen A werten λ1 und λ2 gehören; danach zerlegt man die Matrix ( A 1 ) in die Form 1
(
A1 ) = c1 (α)Λ1 (α) + c2 (α)Λ2 (α) A1
(31)
womit man sofort (
An ) = λ1n−1 c1 (α)Λ1 (α) + λ2n−1 c2 (α)Λ2 (α) An
(32)
erhält. An diesem Ausdruck erkennen wir, dass das Verhalten der Wellenfunktion ganz verschieden ist, je nachdem in welchem Energiebereich man sich befindet, ob also |X(α)| kleiner oder größer als eins ist. Im ersten Fall zeigt Gl. (26), dass der Durch gang durch die Barrieren in (32) zu einer Phasenverschiebung der Komponenten der A Spaltenmatrix ( A n ) bezüglich Λ1 (α) und Λ2 (α) führt. Das Verhalten von φ α (x) ist also n mit dem einer Superposition von imaginären Exponentialausdrücken vergleichbar. Liegt E dagegen in einem Bereich, so dass |X(α)| > 1 ist, so ist nach Gl. (30) genau einer der beiden Eigenwerte (z. B. λ1 ) dem Betrage nach größer als eins, und für genü gend große n gilt (
An ) ≈ ε n−1 e(n−1)ρ(α)l c1 (α)Λ1 (α) An
(33)
•
370 | Ergänzung OIII
Die Koeffizienten A n und An wachsen daher mit n exponentiell (falls nicht c1 (α) = 0 ist): Die Wellenfunktion φ α (x) wird dem Betrage nach immer größer, je weiter sie die aufeinanderfolgenden Potentialbarrieren durchquert; ihr Verhalten erinnert an eine Überlagerung von reellen Exponentialausdrücken.
2-b Bragg-Reflexion. Mögliche Energiewerte Aufgrund des unterschiedlichen Verhaltens der Wellenfunktion φ α (x) verstehen wir, dass auch die erkennbaren Phänomene ganz verschieden sein können. Wenn wir z. B. den Transmissionskoeffizienten T N (α) für die Gesamtheit der N identischen Barrieren bestimmen, so zeigt Gl. (15), dass dabei die Matrix M(α)[Q(α)]N−1 eine analoge Rolle spielt wie M(α) bei einer einzigen Barriere. Nun wird nach aus Gl. (29b) aus Ergänzung NIII der Transmissionskoeffizient T(α) durch dasjenige Element dieser Matrix ausgedrückt, das dort in der ersten Zeile und ersten Spalte steht [T N (α) ist gleich dem Kehrwert des Betragsquadrats dieses Elements]. Was geschieht daher, wenn die Energie E des Teilchens so gewählt wird, dass die Ei genwerte der Matrix Q(α) reell, d. h. durch (30) gegeben sind? Für genügend große N überwiegt dann der Eigenwert λ1 = ε eρ(α)l und die Matrix [Q(α)]N−1 wächst mit N ex ponentiell [s. auch Gl. (33)]. Folglich nimmt der Transmissionskoeffizient exponentiell ab T N (α) ∝ e−2Nρ(α)l
(34)
Für größere N reflektiert das aus N Barrieren bestehende Potential das Teilchen prak tisch sofort. Dies erklärt sich aus der Tatsache, dass die an den einzelnen Barrieren ge streuten Wellen für die transmittierte Welle vollständig destruktiv interferieren, für die reflektierte Welle dagegen in konstruktiver Weise. Dieses Phänomen ist mit der BraggReflexion zu vergleichen. Wir halten übrigens fest, dass sich diese beim transmittierten Anteil auftretende destruktive Interferenz auch dann zeigt, wenn E oberhalb der Bar rierenhöhe liegt; klassisch würde das Teilchen in diesem Fall transmittieren. Jedenfalls stellen wir fest: Ist der Transmissionskoeffizient einer isolierten Barrie re nur wenig von eins verschieden, so ist |F(α)| ≈ 1 (so geht in Abb. 2 |F(α)| gegen eins, wenn α, also die Energie, gegen unendlich geht); der die komplexe Zahl eiαl F(α) repräsentierende Punkt liegt dann sehr nahe am Einheitskreis. Mit Hilfe der Abb. 2 kann man dann erkennen, ob die Energiebereiche zu |X(α)| > 1, d. h. die Bereiche, für die Totalreflexion auftritt, sehr schmal sind und praktisch als isolierte Werte er scheinen. Physikalisch wird dies durch die Tatsache erklärt, dass das Teilchen einen wohlbestimmten Impuls und eine wohlbestimmte Wellenlänge besitzt, wenn seine Einfallsenergie gegenüber den Schwankungen des Potentials V(x) groß ist; die BraggBedingung ergibt dann wohlbestimmte Energiewerte. Wenn dagegen die Teilchenenergie E in einen Bereich fällt, in dem die Eigenwerte wie in (26) vom Betrag eins sind, so streben die Elemente der Matrix [Q(α)]N−1 nicht
Eindimensionales periodisches Potential
| 371
•
mehr mit N gegen unendlich; der Transmissionskoeffizient T N (α) geht bei einer Ver größerung der Anzahl der Barrieren nicht gegen null. Jetzt handelt es sich jedoch um ein rein quantenmechanisches Phänomen, das mit dem Wellencharakter der Materie zusammenhängt: Die Wellenfunktion kann sich in einer periodischen Struktur aus breiten, ohne exponentiell gedämpft zu werden. So stellen wir insbesondere fest, dass der Transmissionskoeffizient T N (α) und das Produkt der Transmissionskoeffizienten jeder einzelnen Barriere ganz verschieden sind (dieses geht für N → ∞ gegen null, weil alle Faktoren kleiner als eins sind). Eine weitere Frage, die vor allem in der Festkörperphysik von Interesse ist, be handelt die Quantisierung der Energieniveaus eines Teilchens, das sich in einer Folge identischer und gleichmäßig angeordneter Potentialtöpfe, also einem Potential mit periodischer Struktur, befindet. Wir werden in § 3 darauf eingehen, doch können wir über das grundsätzliche Verhalten des Energiespektrums schon an dieser Stelle ei ne Aussage machen. Nehmen wir nämlich an, das Teilchen besitzt eine Energie, so dass |X(α)| > 1 ist, dann zeigt Gl. (33), dass die Koeffizienten A n und An für n → ∞ gegen unendlich gehen. Die Wellenfunktion ist nicht beschränkt, und man versteht, weshalb man diese Möglichkeit verwerfen muss: Die zugehörigen Energien sind al so verboten, woraus sich der Name verbotene Bänder für die Energiebereiche ergeben hat, für die |X(α)| > 1 ist. Hat dagegen das Teilchen eine Energie, für die |X(α)| < 1 ist, so bleiben A n und An für n → ∞ beschränkt; man spricht bei den entsprechenden Bereichen auf der Energieachse von erlaubten Bändern. Das Energiespektrum besteht demnach aus endlichen Intervallen mit erlaubten Werten, die durch Bereiche getrennt sind, bei denen alle Energiewerte verboten sind.
3 Energiequantisierung bei einem periodischen Potential. Einfluss der Ränder Wir betrachten ein Teilchen mit der Masse m, das sich in dem in Abb. 3 abgebildeten Potential V(x) befindet: Im Bereich − l/2 ≤ x ≤ Nl + l/2 zeigt V(x) den Verlauf einer periodischen Funktion, die aus einer Kette von N + 1 aufeinanderfolgenden Barrieren der Höhe V0 besteht. Diese sind um die Punkte x = 0, l, 2l, . . . , Nl zentriert. Außer halb dieses Bereichs unterliegt V(x) beliebigen Änderungen über Entfernungen, die mit l vergleichbar sind, um schließlich gegen einen konstanten und positiven Wert Ve zu gehen. Im Folgenden nennen wir [0, Nl] das „Innere der Kette“ und die Bereiche x ≈ − l/2 und x ≈ Nl + l/2 die „Ränder der Kette“. Physikalisch kann ein solches Modell ein Elektron in einem linearen Molekül oder auch (eindimensional) in einem Kristall beschreiben. Die an den Stellen x = l/2, 3l/2, . . . befindlichen Potentialtöpfe entsprechen dann der Anziehung, die das Elektron durch die verschiedenen Ionen erfährt. Weiter außerhalb des Kristalls (oder des Moleküls) unterliegt das Elektron keiner anziehenden Kraft mehr: Das Potential wird rasch konstant, sobald man sich von dem Bereich − l/2 ≤ x ≤ Nl + l/2 entfernt.
•
372 | Ergänzung OIII
Abb. 3: Potentialverlauf für ein Elektron in einem „eindimensionalen Kristall“ mit seinen Rändern. Im Kristallinnern hat das Potential eine periodische Struktur. Zwischen den Ionen (die Barrieren an den Stellen x = 0, l, 2l, . . .) ist das Potential am größten, an den Ionenplätzen (Töpfe an den Stellen x = l/2, 3l/2, . . .) dagegen am kleinsten. An den Kristallgrenzen ändert sich V(x) über eine mit l vergleichbare Distanz mehr oder weniger verwickelt, darauf strebt es rasch gegen einen konstanten Wert V e .
Bis auf eine Änderung des Energienullpunkts fällt das von uns gewählte Poten tial V(x) ganz in den Rahmen von Ergänzung MIII : Wir wissen daher schon, dass die gebundenen Zustände des Teilchens ein diskretes und unterhalb von V0 liegendes Energiespektrum liefern. Darüber hinaus besitzt V(x) eine periodische Struktur, wie wir sie in Ergänzung MIII untersucht haben. Berücksichtigen wir die dort erhaltenen Ergebnisse, so können wir die Schlussfolgerungen aus Ergänzung MIII in eine be sondere Form bringen. So stellten wir z. B. fest, dass gerade die Randbedingungen (φ(x) → 0 für x → ±∞) zur Quantisierung der Energieniveaus führten. So könnte man denken, dass auch hier der Potentialverlauf an den Kettenrändern für die Be stimmung der möglichen Energien eine kritische Rolle spielte. Dies ist jedoch nicht der Fall: Wir werden feststellen, dass diese Energien praktisch allein von den Poten tialwerten im periodischen Bereich abhängen (falls nur die Anzahl der Potentialtöpfe genügend groß ist). Wir werden ferner unsere Behauptung aus dem vorstehenden Abschnitt bestätigen, wonach sich die meisten möglichen Energiewerte zu erlaubten Energiebändern gruppieren. Lediglich einige an den Rändern lokalisierte Zustände hängen kritisch vom Potentialverlauf in diesem Bereich ab und können eine Energie aufweisen, die in ein verbotenes Band fällt. Wir werden im Wesentlichen wie in Ergänzung MIII vorgehen und untersuchen zu nächst die Bedingungen, die für die Wellenfunktion φ α (x) eines stationären Zustands gelten. 3-a Bedingungen an die Wellenfunktion Im Bereich, in dem sich V(x) periodisch verhält, liefert Gl. (3d) die Form der Wellen funktion φ α (x), während die Koeffizienten A n und An über Gl. (32) ermittelt werden.
Eindimensionales periodisches Potential
| 373
•
Um diese Beziehung explizit anschreiben zu können, setzen wir c1 (α)Λ1 (α) = (
f1 (α) ) f1 (α)
(35)
f2 (α) c2 (α)Λ2 (α) = ( ) f2 (α) Wir erhalten dann A n = f1 (α)λ1n−1 + f2 (α)λ2n−1 An = f1 (α)λ1n−1 + f2 (α)λ2n−1
(36)
Untersuchen wir jetzt die Randbedingungen für die Wellenfunktion φ α (x). Zunächst ist links in großer Entfernung von der Kette das Potential gleich Ve und φ α (x) hat die Form φ α (x) = Beμ(α)x
(37a)
mit μ(α) = √
2m (Ve − E) ℏ2
(37b)
(die mit e−μ(α)x gehende Lösung verwerfen wir, weil sie für x → −∞ divergiert). Der zu dieser Funktion gehörende Wahrscheinlichkeitsstrom ist null (s. § 1 von Ergän zung BIII ). Weil nun der Strom für einen stationären Zustand ortsunabhängig ist [s. Er gänzung NIII , Gl. (12)], bleibt er es für alle x, insbesondere also auch im Ketteninneren. Nach der Beziehung (14) aus Ergänzung NIII haben daher die Koeffizienten A n und An notwendig denselben Betrag. Will man also die Randbedingungen zur Linken durch eine Beziehung zwischen den Koeffizienten A1 und A1 ausdrücken [indem man be rücksichtigt, dass der im Intervall − l/2 ≤ x ≤ l/2 gültige Ausdruck von φ α (x) die Fortsetzung der Funktion (37) ist], so findet man eine Gleichung der Form A1 = eiχ(α) A1
(38a)
Darin ist χ(α) eine reellwertige Funktion von α und somit der Energie E, die durch das Verhalten des Potentials am linken Kettenrand bestimmt ist. Hierauf gehen wir jedoch nicht im Einzelnen ein, der für uns wesentliche Punkt ist allein die Form (38a) der Randbedingung. Die gleiche Überlegung gilt offensichtlich auch für den rechten Rand (x → +∞). Hier ist A N+1 = eiχ (α) AN+1
(38b)
in der die reellwertige Funktion χ (α) vom Potentialverlauf am rechten Kettenrand ab hängt.
• –
374 | Ergänzung OIII
Zur Quantisierung der Energieniveaus gelangt man daher auf folgende Weise: Man geht von zwei Koeffizienten A1 und A1 aus, die der Gl. (38a) genügen. Damit ist die Beschränktheit der Funktion φ α (x) für x → −∞ gesichert. Weil φ α (x) bis auf einen Faktor definiert ist, kann man z. B. setzen A1 = eiχ(α)/2 A1 = e−iχ(α)/2
–
Mit Hilfe von Gl. (36) berechnet man dann die Koeffizienten A n und An und setzt so die Wellenfunktion durch den gesamten Kristall fort. Wir stellen fest, dass φ α (x) aufgrund der Bedingung (39) (s. § 1-b von Ergänzung NIII ) reell ist; darum gilt not wendig An = A∗n
–
(39)
(40)
Schließlich schreibt man die Bedingung (38b) für die Koeffizienten A N+1 und AN+1 an; mit ihr wird die Beschränktheit von φ α (x) für x → +∞ gesichert. Übrigens zeigt bereits Gl. (40), dass das Verhältnis A N+1 /AN+1 eine komplexe Zahl vom Be trag eins ist, und die Bedingung (38b) reduziert sich auf eine Gleichung für die Phasen zweier komplexer Zahlen. Man erhält so eine reelle Gleichung in α, die eine bestimmte Anzahl reeller Lösungen zulässt. Diese liefern die erlaubten Ener giewerte.
Wir wenden diese Methode an, indem wir zwei Fälle unterscheiden: die Eigenwerte der Matrix Q(α) sind reell (Fall |X(α)| > 1) oder imaginär (Fall |X(α)| < 1).
3-b Erlaubte Energiebänder: Stationäre Zustände im Innern der Kette Zunächst nehmen wir an, dass sich die Energie in einem Bereich befindet, für den |X(α)| < 1 ist. α Quantisierungsgleichung Beachtet man Gl. (26), so wird aus den Beziehungen (36) A n = f1 (α)ei(n−1)k(α)l + f2 (α)e−i(n−1)k(α)l An = f1 (α)ei(n−1)k(α)l + f2 (α)e−i(n−1)k(α)l
(41)
Andererseits führte der Ansatz (39) für A1 und A1 zu An = A∗n für jeden Wert von n. Nun zeigt man leicht, dass die Beziehungen (41) nur dann zwei zueinander konjugiert komplexe Zahlen ergeben, wenn f1∗ (α) = f2 (α) f2∗ (α) = f1 (α)
(42)
Eindimensionales periodisches Potential
| 375
•
ist. Die Bedingung (38b) lautet dann f1 (α)e2iNk(α)l + f2 (α) = eiχ (α) ∗ ∗ 2iNk(α)l f2 (α)e + f1 (α)
(43)
Diese Gleichung in α liefert die Quantisierung der Energieniveaus. Zu ihrer Lösung setzen wir
Θ(α) = arg {
f1∗ (α)eiχ (α)/2 − f2 (α)e−iχ (α)/2 f1 (α)e−iχ (α)/2 − f2∗ (α)eiχ (α)/2
}
(44)
[man kann Θ(α) im Prinzip berechnen, indem man von χ(α), χ (α) und der Matrix Q(α) ausgeht]. Die Gl. (43) lautet dann einfach e2iNk(α)l = eiΘ(α)
(45)
Die Energieniveaus sind also durch die Bedingung k(α) =
Θ(α) π +p 2Nl Nl
(46)
mit p = 0, 1, 2, . . . , (N − 1)
(47)
gegeben. Weitere Werte von p werden durch die Bedingung (25) ausgeschlossen, nach der sich k(α) nur in einem Intervall der Breite π/l ändern darf. Im Folgenden halten wir fest, dass man für sehr große N Gl. (46) in der einfacheren Form π (48) k(α) ≈ p Nl ausdrücken kann. β Grafische Lösung Setzt man in Gl. (46) die Definition (24) für k(α) ein, so ergibt sich für α eine Glei chung, aus der man die erlaubten Energien erhält. Zur grafischen Lösung zeichnen wir zunächst die Bildkurve der Funktion X(α) = Re{eiαl F(α)}, für die man wegen des ima ginären Exponentialfaktors eiαl einen oszillatorischen Verlauf erwartet (s. Abb. 4a). Weil |F(α)| sehr viel größer als eins ist [s. Gl. (32) in Ergänzung NIII ], ist die Amplitude größer als eins, so dass die Kurve die beiden Geraden X(α) = ±1 an bestimmten Stel len α 0 , α 1 , α 2 , . . . schneidet. Wir eliminieren daher alle von diesen Stellen begrenzten Bereiche auf der α-Achse, für die die Bedingung |X(α)| < 1 nicht erfüllt ist. Die Menge der auf diese Weise für X(α) erhaltenen Kurvenstücke bilden den Ausgangspunkt für die Darstellung der Funktion k(α) =
1 arccos X(α) l
(49)
Wegen der Form der Arcusfunktion (s. Abb. 5) erhalten wir eine Kurve, wie sie in Abb. 4b skizziert ist. Nach Gl. (46) gelangen wir zu den Energieniveaus, wenn wir
•
376 | Ergänzung OIII
(a)
(b) Abb. 4: Verlauf der Funktionen X(α) = Re{F(α)eiαl } (s. Abb. 2) und k(α) = 1l arccos X(α). Für N ≫ 1 er hält man die zu den stationären Zuständen gehörenden Werte von α in guter Näherung, indem man die Bildkurve von k(α) mit den horizontalen Geraden y = pπ/Nl (p = 0, 1, . . . , N − 1) zum Schnitt bringt. Es ergeben sich erlaubte Bänder, die jeweils N sehr eng beieinanderliegende Niveaus enthal ten (die Intervalle α 0 ≤ α ≤ α 1 usw.) und verbotene Bänder (die schraffierten Bereiche α 1 < α < α 2 usw.). Die gestrichelten Kurven gehören zum Sonderfall V(x) = 0 (freies Teilchen).
Abb. 5: Verlauf der Arcuscosinusfunktion. Aufgetragen ist der Hauptwert.
π diese Kurve mit den Bildkurven der Funktionen Θ(α) 2Nl + p Nl schneiden, d. h. (für N ≫ 1) π näherungsweise mit den horizontalen Geraden y = p Nl (p = 0, 1, 2, . . . , N − 1). Es erscheinen dann Gruppen von jeweils N Niveaus , die zu äquidistant liegenden Werten von k(α) gehören und in erlaubten Bändern zwischen α 0 ≤ α ≤ α 1 , α 2 ≤ α ≤ α 3 usw.
Eindimensionales periodisches Potential
| 377
•
angeordnet sind. Zwischen diesen Bändern befinden sich die verbotenen Bänder. Ihre Eigenschaften werden wir weiter unten genauer behandeln. Interessiert man sich für ein bestimmtes erlaubtes Band, so kann man jedes Ni veau durch den zugehörigen Wert k(α) kennzeichnen. Damit wählt man k als unab hängige Variable und betrachtet α und folglich auch E als Funktionen dieser Varia blen. Während man α(k) direkt aus Abb. 4b erhält, gelangt man zur Funktion E(k) über den Zusammenhang E = ℏ2 α 2 /2m; ihr Verlauf ist in Abb. 6 gezeigt.
Abb. 6: Die Energie in Abhängigkeit vom Parameter k. Die ausgezogenen Kurven repräsentieren die Energien für die beiden ersten erlaubten Bänder (die zugehörigen Werte von k liegen äquidistant im Intervall 0 ≤ k ≤ π/l). Die gestrichelten Kurven entsprechen dem Sonderfall V(x) = 0 (freies Teilchen); die erlaubten Bänder berühren sich dann, und es gibt kein verbotenes Band mehr.
Bemerkung: Nach Abb. 4b entsprechen einem bestimmten Wert von k mehrere Werte von α. Das ist der Grund, weshalb in Abb. 6 mehrere Kurvenzweige auftreten. Wächst X(α) gleichmäßig von −1 bis +1 (bzw. fällt gleichmäßig von +1 bis −1), so entspricht für dieses Band jedem Wert von k genau ein Ener gieniveau, und dieses Band enthält N Niveaus.
γ Physikalische Diskussion Unsere Rechnungen zeigen, wie man von einem Ensemble diskreter Niveaus zu er laubten Energiebändern gelangt, wenn man N von eins bis zu großen Werten wach sen lässt. Diese Bänder bestehen streng genommen auch aus diskreten Niveaus. Ihr Abstand ist jedoch bei einer makroskopischen Kette sehr gering, so dass man es prak tisch mit einem Kontinuum zu tun hat. Wählt man k als Parameter, so ist die Zustands dichte (das ist die Anzahl der möglichen Energien im Einheitsintervall von k) konstant und gleich Nl/π. Diese Eigenschaft macht verständlich, weshalb man k als unabhän gige Variable wählt. Ein wichtiger Punkt ergab sich beim Übergang von Gl. (46) zu Gl. (48): Ist die An zahl N der Potentialtöpfe sehr groß, so spielen die Verhältnisse an den Enden der Ket te, die nur über die Funktionen χ(α), χ (α) und Θ(α) zum Tragen kommen, überhaupt keine Rolle mehr. Für die Bestimmung der möglichen Energien ist allein die Form des periodischen Potentials innerhalb der Kette von Bedeutung.
•
378 | Ergänzung OIII
Zwei Grenzfälle sind von besonderem Interesse: 1. Ist V(x) = 0 (freies Teilchen), so gilt F(α) = 1
(50)
X(α) = cos αl und man hat α { { { k(α) = { 2π −α { { l usw. {
wenn 0 ≤ α ≤ wenn
π l
≤α≤
π l 2π l
(51)
(dies wird in Abb. 4b durch die gestrichelten Geradenstücke dargestellt). Nach Gl. (50) ist die Bedingung |X(α)| ≤ 1 immer realisiert: Es ergibt sich wieder, dass für ein freies Teilchen keine verbotenen Bänder existieren. Den Einfluss des Potentialverlaufs V(x) auf die Kurve E(k) erkennt man auch an der Abb. 6: Sobald verbotene Bänder in Erscheinung treten, verformen sich die Ener giekurven so, dass sie an den Bandrändern k = 0 und k = π/l waagerechte Tangenten aufweisen. Im Gegensatz zum Fall des freien Teilchens gibt es für jedes Band einen Wendepunkt, an dem sich die Energie linear mit k ändert. 2. Ist der Transmissionskoeffizient T(α) praktisch null, so ist [s. Ergänzung NIII , Gleichungen (29) und (21)] |F(α)| ≫ 1 |G(α)| ≫ 1
(52)
In Abb. 2 liegt dann der Punkt, der die komplexe Zahl eiαl F(α) repräsentiert, vom Ur sprung sehr weit entfernt, und die Bereiche auf der α-Achse sind extrem schmal, für die |X(α)| < 1 ist. Mit abnehmendem Transmissionskoeffizienten der Elementarbar riere schrumpfen daher die erlaubten Bänder zusammen, um sich im Grenzfall einer verschwindenden Transmission auf die Niveaus eines isolierten Potentialtopfes zu re duzieren. Sobald umgekehrt der Tunneleffekt dem Teilchen den Übergang von einem Topf zum nächsten erlaubt, entsteht aus jedem diskreten Niveau der Töpfe ein Energie band, das mit wachsendem Transmissionskoeffizienten immer breiter wird. Auf diese Eigenschaft werden wir in Ergänzung FXI zurückkommen.
3-c Verbotene Bänder: Stationäre Zustände an den Rändern α Form der Gleichungen. Energieniveaus Wir nehmen jetzt an, α gehöre zu einem Bereich, für den |X(α)| > 1 ist. Dann lauten nach Gl. (30) die Beziehungen (36) A n = ε n−1 [f1 (α)e(n−1)ρ(α)l + f2 (α)e−(n−1)ρ(α)l ] An = ε n−1 [f1 (α)e(n−1)ρ(α)l + f2 (α)e−(n−1)ρ(α)l ]
(53)
Eindimensionales periodisches Potential
•
| 379
Weil nun An = A∗n für jedes n gilt, muss notwendig f1 (α) = f1∗ (α)
(54)
f2 (α) = f2∗ (α) sein. Die Quantisierungsbedingung nimmt somit die Form A N+1 f1 (α) + f2 (α)e−2Nρ(α)l = ∗ = eiχ (α) A N+1 f1 (α) + f2∗ (α)e−2Nρ(α)l
(55)
an. Wenn wir
L(α) = −
f1∗ (α)eiχ (α)/2 − f1 (α)e−iχ (α)/2
f2∗ (α)eiχ (α)/2 − f2 (α)e−iχ (α)/2
(56)
setzen, können wir diese Gleichung auch e−2Nρ(α)l = L(α)
(57)
schreiben. Für N ≫ 1 wird e−2Nρ(α)l ≈ 0 und Gl. (57) reduziert sich auf L(α) = 0
(58)
Die in den verbotenen Bändern liegenden Energieniveaus sind also durch die Null stellen der Funktion L(α) gegeben (s. Abb. 7). Die Anzahl dieser Niveaus hängt im Ge gensatz zu einem erlaubten Band nicht von der Zahl N der Potentialtöpfe ab, da diese Zahl weder in Gl. (56) noch in Gl. (58) auftritt. Man kann daher sagen, dass für N ≫ 1 praktisch alle Niveaus in den erlaubten Bändern liegen.
Abb. 7: Verlauf von L(α) in einem verbotenen Band. Die Nullstellen liefern die an den Kettenenden lokalisierten stationären Zustände.
β Physikalische Diskussion Die Situation unterscheidet sich grundsätzlich von der im vorangegangenen Ab schnitt: Falls die Zahl N, d. h. die Kettenlänge, nur genügend groß ist, spielt sie keine Rolle mehr. Dagegen zeigt die Definition (56), dass die Funktionen χ(α) und χ (α)
•
380 | Ergänzung OIII
wesentlich zum Tragen kommen. Sie hängen vom Potentialverlauf an den Rändern der Kette ab, und man erwartet deshalb in diesen Bereichen lokalisierte Zustände. Das ist auch der Fall. Aus den Gleichungen (56) und (58) ergeben sich nämlich zwei Möglichkeiten: 1. Ist f1 (α) ≠ 0, so verlangt das Verschwinden von L(α), dass f1 (α) f1 (α) = = eiχ (α) f1∗ (α) f1 (α)
(59)
Erinnern wir uns an die Definition (35) von f1 (α) und f1 (α). Dann besagt Gl. (59) einfach, dass die mit dem ersten Eigenvektor der Matrix Q(α) konstruierte Wellen funktion die Bedingungen am rechten Kettenende erfüllt. Das ist gut zu verstehen: Wenn man von der Stelle x = 0 mit einer beliebigen Wellenfunktion ausgeht, die A die Bedingungen am linken Ende erfüllt, so besteht die Matrix ( A1 ) aus Kompo 1 nenten bezüglich der beiden Eigenvektoren von Q(α). Dann sind (falls N ≫ 1) die Koeffizienten A N+1 und AN+1 praktisch durch Gl. (33) gegeben; diese drückt aber A
2.
die Proportionalität der Matrix ( A N+1 ) mit der Spaltenmatrix des ersten Eigenvek N+1 tors von Q(α) aus. Wir bemerken, dass die Wellenfunktion exponentiell mit x wächst, wenn der Ei genwert λ1 (α) größer als eins ist. Der durch den ersten Eigenvektor von Q(α) ge gebene stationäre Zustand ist daher am rechten Kettenende lokalisiert. Mit f1 (α) = 0 liefert Gl. (54) f1 (α) = 0 und die Definitionen (35) verlangen, dass c1 (α) = 0 sein muss: Der entsprechende stationäre Zustand ist dem zweiten Ei genvektor von Q(α) zugeordnet. Abgesehen von der Tatsache, dass dieser Zustand jetzt am linken Kettenrand lokalisiert ist, bleiben die Schlussfolgerungen unter Punkt 1 auch hier gültig.
Referenzen und Literaturhinweise Merzbacher (1.16), Kap. 6, § 7 Flügge (1.24), § 28 und § 29; Landau und Lifshitz (1.19), § 104. Siehe auch die Werke zur Festkörperphysik (Abschnitt 13 der Bibliographie).
IV Einfache Systeme A A-1 A-2 B B-1 B-2 B-3 C C-1 C-2 C-3
Spin-1/2-Teilchen. Quantisierung des Drehimpulses | 382 Experimenteller Nachweis | 382 Theoretische Beschreibung | 386 Die Postulate am Beispiel des Spins 1/2 | 389 Präparation der verschiedenen Spinzustände | 389 Messung des Spins | 392 Spin 1/2 und homogenes Magnetfeld | 397 Systeme mit zwei Niveaus | 399 Problemstellung | 400 Statischer Aspekt | 401 Dynamischer Aspekt | 406
In diesem Kapitel wollen wir die in Kapitel III eingeführten und diskutierten Postula te der Quantenmechanik auf einfache Systeme anwenden, für die der Zustandsraum endlich, und zwar zweidimensional ist. Das Interesse an diesen Beispielen beschränkt sich nicht nur auf ihre mathematische Einfachheit, die uns ein besseres Verständnis der Postulate und ihrer Konsequenzen erlaubt. Sie haben auch grundsätzlich physika lische Bedeutung: Es treten typische Quanteneffekte auf, die man auch experimentell verifizieren kann. In § A und § B untersuchen wir ein System mit dem Spin 1/2 (worauf wir dann vollständiger in Kapitel IX zurückkommen werden). Zunächst beschreiben wir in § A-1 ein fundamentales Experiment, mit dem man die Quantisierung des Drehimpulses aufzeigen kann. Wir werden sehen, dass die z-Komponente des Drehimpulses eines neutralen paramagnetischen Atoms nur bestimmte, zu einer diskreten Menge gehö rende Werte annehmen kann; so besitzt die z-Komponente S z des Drehimpulses eines Silberatoms im Grundzustand nur die beiden möglichen Werte +ℏ/2 und −ℏ/2. Man sagt, im Grundzustand sei ein Silberatom ein Spin-1/2-Teilchen. Danach zeigen wir in § A-2, wie die Quantenmechanik die Spinvariablen eines derartigen Teilchens be schreibt: In Situationen, in denen man von einer quantenmechanischen Behandlung der äußeren Variablen r und p absehen kann, ist der Zustandsraum des Teilchens (der Spinraum) nur zweidimensional. In § B können wir dann die Postulate der Quanten mechanik auf diesen besonders einfachen Fall anwenden und verdeutlichen. So wer den wir sehen, wie man durch ein bestimmtes Experiment Silberatome so präparieren kann, dass sie einen beliebigen, im Voraus gegebenen Spinzustand aufweisen. Dann zeigen wir, wie durch die Messung der Spingrößen derartiger Silberatome die quan tenmechanischen Postulate experimentell bestätigt werden. Weiter untersuchen wir durch Integration der entsprechenden Schrödinger-Gleichung die zeitliche Entwick lung eines Spin-1/2-Systems in einem konstanten Magnetfeld (Larmor-Präzession). So gelangen wir schließlich in § C zur Behandlung von Systemen mit zwei Niveaus. Ob wohl diese Systeme im Allgemeinen nicht Spin-1/2-Systeme sind, sind die Rechnun https://doi.org/10.1515/9783110638738-036
382 | IV Einfache Systeme
gen zu denen in § A und § B sehr ähnlich. Im Einzelnen untersuchen wir den Einfluss einer äußeren Störung auf die stationären Zustände eines Zwei-Niveau-Systems und erläutern an diesem sehr einfachen Modell die physikalisch wichtigen Phänomene.
A Spin-1/2-Teilchen. Quantisierung des Drehimpulses A-1 Experimenteller Nachweis Zunächst werden wir den Stern-Gerlach-Versuch beschreiben, mit dem man die Quan tisierung der Komponenten eines Drehimpulses aufzeigen kann (manchmal auch Raumquantelung genannt). A-1-a Stern-Gerlach-Anordnung Beim Stern-Gerlach-Versuch beobachtet man die Ablenkung eines neutralen parama gnetischen Atomstrahls (Silberatome) in einem stark inhomogenen Magnetfeld. Die Anordnung ist in Abb. 1 skizziert.¹ Silberatome in einem hocherhitzten Ofen E entweichen durch eine enge Öffnung und breiten sich geradlinig in der hochevakuierten Apparatur aus. Ein kollimierender Spalt F wählt die Atome mit einer zur vorgegebenen y-Richtung parallelen Geschwin digkeit aus. Sie durchqueren den Luftspalt eines Elektromagneten A, bevor sie sich auf einer Platte P niederschlagen. Das vom Elektromagneten erzeugte Magnetfeld B besitzt eine Symmetrieebene (hier die y, z-Ebene) und hat in allen Punkten parallel zur y-Richtung denselben Wert (die Polschuhe liegen zur y-Richtung parallel, Randeffekte vernachlässigen wir). Die y-Komponente von B ist null, in z-Richtung ist das Feld am größten und stark verän derlich: In Abb. 1 liegen die Feldlinien in der Umgebung des Nordpols sehr viel enger als in der des Südpols. Weil der Fluss des Magnetfeldes konstant ist (es ist div B = 0), muss dieses auch eine von null verschiedene x-Komponente besitzen; sie hängt von x ab. A-1-b Klassische Berechnung der Strahlablenkung Zunächst² halten wir fest, dass die Silberatome wegen ihrer Neutralität keine LorentzKraft erfahren. Dagegen besitzen sie ein magnetisches Moment 𝓜 (es handelt sich um paramagnetische Atome) und damit eine potentielle Energie: W = −𝓜⋅ B
(A-1)
1 Wir geben hier nur die wichtigsten Charakteristika dieser Anordnung wieder. Eine genauere Be schreibung der Versuchstechnik findet man in der Literatur zur Atomphysik. 2 Hier begnügen wir uns mit einer Rechenskizze und verweisen für Einzelheiten auf die einschlägige Literatur zur Atomphysik.
A Spin-1/2-Teilchen. Quantisierung des Drehimpulses |
383
(a)
(b) Abb. 1: Schema des Stern-Gerlach-Versuchs. a) zeigt die Bahn eines Silberatoms, das aus dem hoch erhitzten Ofen E austritt. Dieses Atom wird durch den Gradienten des Magnetfeldes abgelenkt, das man mit dem Elektromagneten A erzeugt, und kondensiert dann im Punkt N auf der Platte P. b) zeigt einen Schnitt in der x, z-Ebene des Elektromagneten A. die Feldstärkelinien sind gestrichelt gezeich net. B z ist hier positiv und ∂B z /∂z negativ. Folglich entspricht die Trajektorie in (a) einer negativen Komponente ℳz des magnetischen Moments, d. h. einer positiven Spinkomponente 𝒮z (γ ist für ein Silberatom negativ).
Bei einem Atom gibt es zwei Ursprünge für das elektronische magnetische Mo ment 𝓜 und den Drehimpuls 𝓢: die Elektronenbewegung um den Kern, die für das Auftreten eines magnetischen Bahnmoments verantwortlich ist, und der eingeprägte Drehimpuls bzw. Spin (s. Kapitel IX) der Elektronen, zu dem ebenfalls ein magneti sches (Spin-)Moment gehört. Man kann zeigen (an dieser Stelle nehmen wir dies ohne Beweis an), dass 𝓜 und 𝓢 zueinander proportional sind:³ 𝓜 = γ𝓢
(A-2)
Die Proportionalitätskonstante γ wird gyromagnetisches Verhältnis des betrachteten Niveaus genannt. 3 Beim Silberatom im Grundzustand ist der Drehimpuls 𝓢 einfach gleich dem Spin des Valenzelek trons, der deshalb für die Existenz des magnetischen Moments 𝓜 allein verantwortlich ist. Dieses äußere Elektron hat nämlich den Bahndrehimpuls null. Weiter verschwindet die Summe der Bahnund Spindrehimpulse der Elektronen auf den inneren Schalen. Schließlich sind bei den in der Praxis realisierten experimentellen Verhältnissen die auf den Kernspin zurückgehenden Einflüsse vernach lässigbar. Aus diesen Gründen besitzt das Silberatom im Grundzustand wie das Elektron den Spin 1/2.
384 | IV Einfache Systeme
Vor dem Durchgang der Silberatome durch den Elektromagneten sind ihre magne tischen Momente (isotrop) zufallsverteilt. Wir fragen nach der Wirkung des Magnet feldes auf ein Atom, dessen magnetisches Moment 𝓜 beim Eintritt in den Luftspalt eine bestimmte Richtung besitzt. Aus dem Ausdruck (A-1) für die potentielle Energie ergibt sich durch Gradientenbildung die auf das Atom wirkende Kraft F = ∇ (𝓜 ⋅ B)
(A-3)
(die für ein konstantes Magnetfeld gleich null ist), während das Drehmoment in Bezug auf den Ort des Atoms Γ = 𝓜×B
(A-4)
ist. Der Drehimpulssatz lautet d𝓢 =Γ (A-5) dt also gilt d𝓢 = γ𝓢×B (A-6) dt Das Atom verhält sich demnach wie ein Gyroskop oder Kreisel (s. Abb. 2): d𝓢/ dt steht auf S senkrecht, und der Drehimpuls bewegt sich um das magnetische Feld, wobei der Winkel θ zwischen 𝓢 und B konstant bleibt. Die Winkelgeschwindigkeit ist gleich dem Produkt aus dem gyromagnetischen Verhältnis und dem Betrag des Magnetfeldes. Die zum Magnetfeld senkrechten Komponenten von 𝓜 oszillieren daher um null, wäh rend die zu B parallele Komponente konstant bleibt.
Abb. 2: Das Silberatom besitzt einen Drehimpuls und ein dazu pro portionales magnetisches Moment 𝓜. Folglich bewirkt ein homo genes Magnetfeld B eine Drehung von 𝓜 um B mit einer konstanten Winkelgeschwindigkeit (Larmor-Präzession).
Für die Berechnung der Kraft nach Gl. (A-3) kann man in sehr guter Näherung die zu ℳx und ℳy proportionalen Terme in W vernachlässigen und ℳz als konstant anse hen. Die Drehfrequenz von 𝓜 ist so groß, dass die Komponenten ℳx und ℳy nur über ihre Mittelwerte auftreten; diese sind aber null. Folglich kann man F = ∇ (ℳz B z ) = ℳz ∇B z
(A-7)
A Spin-1/2-Teilchen. Quantisierung des Drehimpulses |
385
als die allein wirkende Kraft ansehen. Andererseits verschwinden die x- und die y-Komponente des Gradienten von B z : Es ist ∂B z /∂y = 0, weil das Magnetfeld von y unabhängig ist (s. weiter unten), während ∂B z /∂x = 0 in allen Punkten der y, z-Ebene gilt. Die auf das Atom wirkende Kraft ist daher parallel zur z-Richtung und zu ℳz proportional. Damit ist aber auch die Ablenkung HN (Abb. 1) zu ℳz und weiter zu 𝒮z proportional. Die Messung von HN ermöglicht also die Bestimmung von ℳz bzw. 𝒮z . Die Momente der aus der Ofenöffnung austretenden Atome sind isotrop verteilt (ℳz nimmt sämtliche Werte zwischen −|𝓜| und |𝓜| an). Man erwartet daher, dass der auf die Platte auftreffende Strahl dort einen um H symmetrisch liegenden Fleck bil det; die Grenzen N1 und N2 dieses Flecks sollten dann dem maximalen Wert |𝓜| und dem minimalen Wert −|𝓜| von ℳz entsprechen. Tatsächlich führen die Geschwindig keitsverteilung und die endliche Breite des Spalts F dazu, dass die Atome mit einem bestimmten Wert ℳz nicht im selben Punkt kondensieren, sondern einen um diese Stelle zentrierten Fleck entstehen lassen. A-1-c Ergebnisse und Schlussfolgerungen Die experimentellen Ergebnisse (die von Stern und Gerlach im Jahre 1922 das erste Mal erhalten wurden) stehen nun in völligem Gegensatz zu den eben skizzierten Vor hersagen. Statt eines einzigen um H zentrierten Flecks beobachtet man zwei um die Punkte N1 und N2 zentrierte Flecken (s. Abb. 3), die zu H symmetrisch liegen (ihre Breite steht mit der Geschwindigkeitsverteilung und der Breite des Spalts F in Zusam menhang). Die Aussagen der klassischen Mechanik werden vom Experiment nicht be stätigt. Wie ist dieser Sachverhalt zu interpretieren? Unter den physikalischen Größen, mit denen man ein Silberatom beschreibt, gibt es einerseits solche, die zu seinen äu ßeren Freiheitsgraden gehören (die also von seinem Ort r und seinem Impuls p ab hängen), und andererseits solche, die seinen inneren Freiheitsgraden (auch Spinfrei heitsgrade genannten) 𝓜 bzw. 𝓢 entsprechen.
Abb. 3: Die beim Stern-Gerlach-Versuch auf der Platte P beobachteten Fle cken. Die magnetischen Momente der aus dem Ofen E austretenden Atome sind in allen Raumrichtungen zufallsverteilt, für eine Messung von ℳz sagt die klassische Mechanik die gleiche Wahrscheinlichkeit für alle Werte zwischen +|𝓜| und −|𝓜| voraus. Man müsste also einen einzigen (in der Abbildung gestrichelt gezeichneten) Fleck beobachten. Das Experiment zeigt aber etwas ganz anderes: Es entstehen zwei um N 1 und N 2 zentrierte Flecken. Bei einer Messung von ℳz gibt es also nur zwei mögliche Resultate (Quantisierung des Messergebnisses).
386 | IV Einfache Systeme
Zunächst zeigen wir, dass es bei den experimentellen Bedingungen nicht notwen dig ist, die äußeren Freiheitsgrade quantenmechanisch zu behandeln. Hierzu müssen wir nachweisen, dass man zur Beschreibung der Bewegung der Silberatome Wellen pakete konstruieren kann, bei denen die Breite ∆z und die Impulsverteilung ∆p z voll ständig vernachlässigbar ist. ∆z und ∆p z müssen der Unschärferelation ∆z ⋅ ∆p z ≥ ℏ
(A-8) 10−25
genügen. Die Masse M eines Silberatoms hat einen Wert von 1.8 × kg, ∆z und die Geschwindigkeitsunschärfe ∆v z = ∆p z /M müssen daher so gewählt sein, dass ℏ (A-9) ≈ 10−9 m2/s M ist. Welche Längen und Geschwindigkeiten treten nun im vorliegenden Fall auf? Die Spaltbreite beträgt ungefähr 0.1 mm, der Abstand zwischen N1 und N2 einige Milli meter. Die Entfernungen, über die sich das Magnetfeld nennenswert ändert, kann aus den Werten der Feldgröße (B ≈ 104 G) und seines Gradienten (∂B/∂z ≈ 105 G/cm) er mittelt werden; man erhält B/(∂B/∂z) ≈ 1 mm. Weiter ist die Geschwindigkeit, mit der die Atome einen Ofen mit einer Temperatur von 1000 K verlassen, von der Größenord nung 500 m/s. Wie genau der Strahl auch definiert sein mag, so wird die Geschwin digkeitsstreuung doch kaum geringer als einige Meter/Sekunde sein. Darum sind ∆z und ∆v z beim Stern-Gerlach-Versuch vernachlässigbar: Hinsichtlich der äußeren Va riablen r und p ist daher ein Rückgriff auf die Quantenmechanik nicht notwendig. Man darf seine Überlegungen auf der Grundlage nahezu punktförmiger Wellenpake te anstellen, die sich entlang der klassischen Bahn bewegen. Damit führt auch eine Messung der Ablenkung HN auf eine Messung von ℳz bzw. 𝒮z . Die Ergebnisse beim Stern-Gerlach-Versuch zwingen uns zu folgenden Schluss folgerungen: Misst man die Komponente 𝒮z des Spins eines Silberatoms in seinem Grundzustand, so gibt es nur zwei mögliche Werte, die den Ablenkungen HN1 oder HN2 entsprechen. Wir müssen daher das klassische Bild eines Vektors 𝓢 verwerfen, der mit dem Magnetfeld einen beliebigen Winkel θ einschließen kann: 𝒮z ist eine quantisierte physikalische Größe, deren diskretes Spektrum nur aus zwei Eigenwer ten besteht. Bei der Behandlung der Quantentheorie des Drehimpulses in Kapitel VI werden wir sehen, dass diese Eigenwerte +ℏ/2 und −ℏ/2 sind. Schon an dieser Stelle halten wir fest, dass der Spin des Silberatoms im Grundzustand 1/2 ist. ∆z ⋅ ∆v z ≥
A-2 Theoretische Beschreibung Wir wollen jetzt zeigen, wie die Quantenmechanik die (inneren) Freiheitsgrade eines Silberatoms, also seinen Spin beschreibt. Eine strenge deduktive Theorie zum Spin 1/2 werden wir erst im Rahmen der allge meinen Theorie des Drehimpulses (s. Kapitel IX) geben können. An dieser Stelle müs sen wir ohne Beweis von einer (geringen) Zahl von Aussagen aus Kapitel IX Gebrauch
A Spin-1/2-Teilchen. Quantisierung des Drehimpulses | 387
machen. Sinn des gegenwärtigen Kapitels ist die Anwendung des quantenmechani schen Formalismus auf ein einfaches und konkretes Beispiel und nicht so sehr die Behandlung des halbzahligen Spins: Wir wollen für Ketvektoren und Observable prä zise Beispiele vorstellen, zeigen, wie man zu physikalischen Vorhersagen kommt, und die verschiedenen Schritte bei einem Experiment (Präparation, zeitliche Entwicklung, Messung usw.) kennenlernen. In Kapitel III hatten wir gesehen, dass man in der Quantenmechanik jeder mess baren physikalischen Größe eine Observable zuordnen muss, also einen hermiteschen Operator, dessen Eigenvektoren im Zustandsraum eine Basis bilden. Wir müssen al so den Zustandsraum und die Observablen angeben, die zu den Komponenten von 𝓢 (das sind 𝒮x , 𝒮y und 𝒮z oder allgemeiner 𝒮u = 𝓢 ⋅ u, wobei u ein beliebiger Ein heitsvektor ist) gehören. Nach dem vorangegangenen Abschnitt wissen wir, dass diese Größen messbar sind. A-2-a Die Observable S z und der Spinraum Wir ordnen der Spinkomponente 𝒮z eine Observable S z zu, die aufgrund der eben beschriebenen experimentellen Ergebnisse die beiden entgegengesetzten Eigenwerte +ℏ/2 und −ℏ/2 besitzen soll. Wir setzen voraus, dass diese Eigenwerte nicht entartet sind (s. Kapitel IX), und bezeichnen mit |+⟩ und |−⟩ die zugehörigen orthonormierten Eigenvektoren: ℏ S z |+⟩ = + |+⟩ 2 ℏ S z |−⟩ = − |−⟩ 2
(A-10)
mit ⟨+|+⟩ = ⟨−|−⟩ = 1 ⟨+|−⟩ = 0
(A-11)
Also bildet S z für sich allein einen vollständigen Satz kommutierender Observabler (V. S. K. O.), und der Raum HS der Spinzustände ist zweidimensional und wird von den Eigenvektoren |+⟩ und |−⟩ aufgespannt. Die Tatsache, dass diese beiden Vektoren in HS eine Basis bilden, wird durch die Vollständigkeitsrelation |+⟩⟨+| + |−⟩⟨−| = 𝟙
(A-12)
ausgedrückt. Der allgemeine (normierte) Vektor im Spinraum HS ist eine (lineare) Su perposition der Ketvektoren |+⟩ und |−⟩: |ψ⟩ = α|+⟩ + β|−⟩
(A-13)
|α|2 + |β|2 = 1
(A-14)
mit
388 | IV Einfache Systeme In der {|+⟩, |−⟩}-Basis wird S z offensichtlich durch die Matrix (S z ) =
ℏ 1 ( 2 0
0 ) −1
(A-15)
dargestellt. A-2-b Die weiteren Spinvariablen Der x- und der y-Komponente von 𝓢 werden die Observablen S x und S y zugeordnet. In der {|+⟩, |−⟩}-Basis müssen sie durch hermitesche 2 × 2-Matrizen dargestellt werden. In Kapitel VI werden wir sehen, dass in der Quantenmechanik die drei Komponen ten eines Drehimpulses nicht miteinander kommutieren, sondern dass sie bestimmten Vertauschungsrelationen genügen. Damit können wir dann zeigen, dass für den hier behandelten Fall des Spins 1/2 die Darstellungsmatrizen von S x und S y in der Basis aus den Eigenvektoren |+⟩ und |−⟩ (S x ) =
ℏ 0 ( 2 1
1 ) 0
(A-16)
(S y ) =
ℏ 0 ( 2 i
−i ) 0
(A-17)
lauten. Für den Augenblick nehmen wir dies einfach an.
Abb. 4: Definition der Polarwinkel θ und φ zur Festlegung des Einheitsvektors u.
Für die Komponente 𝒮u von 𝓢 in Richtung des Einheitsvektors u, der durch die Polar winkel θ und φ (s. Abb. 4) charakterisiert ist, erhalten wir zunächst 𝒮u = 𝓢 ⋅ u = 𝒮x sin θ cos φ + 𝒮y sin θ sin φ + 𝒮z cos θ
(A-18)
Mit den Gleichungen (A-15), (A-16) und (A-17) wird dann die Matrix, die in der {|+⟩, |−⟩}-Basis die Observable S u = S ⋅ u darstellt, (S u ) = (S x ) sin θ cos φ + (S y ) sin θ sin φ + (S z ) cos θ =
ℏ cos θ ( 2 sin θ eiφ
sin θ e−iφ ) − cos θ
(A-19)
B Die Postulate am Beispiel des Spins 1/2 |
389
Im Folgenden benötigen wir die Eigenwerte und Eigenvektoren der Observa blen S x , S y und S u . Sie erhalten wir, wenn wir von den Matrizen (A-16), (A-17) und (A-19) ausgehen. Wir geben sie hier einfach an. Die Operatoren S x , S y und S u haben dieselben Eigenwerte +ℏ/2 und −ℏ/2 wie S z . Dies ist physikalisch befriedigend: Man kann nämlich die gesamte Stern-GerlachApparatur so drehen, dass die durch das Magnetfeld definierte Achse parallel zur x-, y- oder zur u-Richtung verläuft. Bei diesen Drehungen müssen die auf der Platte be obachteten Phänomene unverändert bleiben, weil alle Raumrichtungen dieselben Ei genschaften besitzen: Eine Messung von 𝒮x , 𝒮y oder 𝒮u kann nur eine der beiden Re sultate +ℏ/2 und −ℏ/2 ergeben. Die Eigenvektoren von S x , S y und S u bezeichnen wir jeweils mit |±⟩x , |±⟩y und |±⟩u (die im Ket auftretenden Vorzeichen beziehen sich auf den zugehörigen Eigenwert). Ihre Entwicklungen nach den Eigenvektoren |±⟩ von S z lauten 1 [|+⟩ ± |−⟩] √2 1 [|+⟩ ± i|−⟩] |±⟩y = √2
|±⟩x =
θ −iφ/2 θ |+⟩ + sin eiφ/2 |−⟩ e 2 2 θ −iφ/2 θ |+⟩ + cos eiφ/2 |−⟩ |−⟩u = − sin e 2 2 |+⟩u = cos
(A-20) (A-21)
(A-22a) (A-22b)
B Die Postulate am Beispiel des Spins 1/2 Wir sind jetzt in der Lage, die Postulate der Quantenmechanik auf eine Reihe von Ver suchen an Silberatomen mit der Stern-Gerlach-Apparatur anzuwenden und so an ei nem konkreten Fall die Folgerungen zu diskutieren, die sich aus diesen Postulaten ergeben.
B-1 Präparation der verschiedenen Spinzustände Um Vorhersagen über ein Messergebnis formulieren zu können, müssen wir den Zu stand des Systems (hier also den Spin des Silberatoms) unmittelbar vor der Messung kennen. Wir werden sehen, wie man einen Strahl von Silberatomen in einen bestimm ten Spinzustand präparieren kann. B-1-a Präparation der Zustände |+⟩ und |−⟩ Wir nehmen an, dass man in die Platte P (s. Abb. 1a) an der Stelle N1 (s. Abb. 3) ein Loch gebohrt hat, so dass die nach unten abgelenkten Atome sich weiterhin auf der Platte
390 | IV Einfache Systeme
Abb. 5: Bohrt man an der Stelle N 1 der Platte P ein Loch, so sind die hier hindurchgehenden Atome im Spinzustand |+⟩; die Stern-Gerlach-Apparatur wirkt also wie ein Polarisator.
niederschlagen, die nach oben abgelenkten dagegen die Platte durchqueren können (Abb. 5). Jedes Atom, das sich rechts von der Platte befindet, ist ein System, das bei einer Messung der Observablen S z das Resultat +ℏ/2 liefert. Nach dem fünften Pos tulat aus Kapitel III befindet sich dieses Atom im Eigenzustand |+⟩ zu diesem Eigen wert (S z bildet für sich allein einen V. S. K. O.; daher genügt für die Bestimmung des Systemzustands dieses Messergebnis). Mit der in Abb. 5 skizzierten Anordnung kann man demnach einen Strahl von Atomen erzeugen, die sich sämtlich im Spinzustand |+⟩ befinden. Sie spielt die Rolle eines „Atom-Polarisators“. Will man einen Strahl erzeugen, für den sich die Atome alle im Spinzustand |−⟩ befinden, so muss man entsprechend an der Stelle N2 ein Loch anbringen. B-1-b Präparation der Zustände |±⟩x , |±⟩y und |±⟩u Auch die Observable S x bildet einen V. S. K. O., weil ihre Eigenwerte nicht entartet sind. Zur Präparation eines ihrer Zustände genügt es daher, nach einer Messung von S x die Atome auszuwählen, für die diese Messung den entsprechenden Eigenwert ergeben hat. Dreht man also die Apparatur der Abb. 5 mit dem Winkel π/2 um die y-Achse, so gelangt man zu einem Atomstrahl mit dem Spinzustand |+⟩x (Abb. 6).
Abb. 6: Dreht man die Anordnung aus Abb. 5 mit 90∘ um die y-Achse, so erhält man einen Polarisator zur Präparation von Atomen im Zustand |+⟩x .
B Die Postulate am Beispiel des Spins 1/2 | 391
Diese Methode lässt sich sofort verallgemeinern: Man stellt die Stern-GerlachApparatur so auf, dass die Achse des Magnetfeldes parallel zu einem beliebigen Ein heitsvektor u ist. Durchbohrt man die Platte entweder an der Stelle N1 oder an der Stelle N2 , so kann man Silberatome präparieren, die sich entweder im Spinzustand |+⟩u oder im Spinzustand |−⟩u befinden.⁴ B-1-c Präparation in den allgemeinsten Zustand Der allgemeine (normierte) Ketvektor im Raum der Spinzustände hat, wie wir bereits feststellten, die Form |ψ⟩ = α |+⟩ + β |−⟩
(B-1)
|α|2 + |β|2 = 1
(B-2)
mit
Ist eine Präparation der Atome in den zu diesem Ket gehörenden Spinzustand mög lich? Wir wollen zeigen, dass zu jedem Ket |ψ⟩ ein Einheitsvektor u existiert, so dass |ψ⟩ zum Ket |+⟩u kollinear ist. Hierzu geben wir zwei komplexe Zahlen α und β vor, die zwar die Bedingung (B-2) erfüllen, aber sonst beliebig sind. Mit Gl. (B-2) existiert notwendig ein Winkel θ, so dass θ = |α| 2 θ sin = |β| 2
cos
(B-3)
ist. Verlangen wir ferner, dass 0≤θ≤π
(B-4) β
so legt die Gleichung tan 2θ = | α | den Winkel θ eindeutig fest. Wie wir wissen, gehen die Argumente von α und β in die physikalischen Vorhersagen nur über ihre Differenz ein. Setzen wir daher φ = arg β − arg α
(B-5)
χ = arg β + arg α
(B-6)
ist also 1 χ+ 2 1 arg α = χ − 2 arg β =
1 φ 2 1 φ 2
(B-7)
4 Der Strahl muss jetzt nicht mehr in y-Richtung verlaufen, doch ist dies für unsere augenblickliche Überlegung ohne Bedeutung.
392 | IV Einfache Systeme so können wir den Ket |ψ⟩ in der Form χ
|ψ⟩ = ei 2 [cos
θ −i φ θ φ e 2 |+⟩ + sin ei 2 |−⟩] 2 2
(B-8)
schreiben. Setzt man diesen Ausdruck in Gl. (A-22a) ein, so sieht man, dass sich |ψ⟩ vom Ket |+⟩u (der zum Einheitsvektor u mit den Polarwinkeln θ und φ gehört) nur um den Phasenfaktor eiχ/2 unterscheidet, der jedoch keine physikalische Bedeutung hat. Um Silberatome in den Zustand |ψ⟩ zu präparieren, genügt es daher, die SternGerlach-Apparatur (mit einem Loch in N1) so anzuordnen, dass ihre Achse in Richtung von u weist, wobei sich die zugehörigen Polarwinkel aus α und β über die Gleichun gen (B-3) und (B-5) ergeben.
B-2 Messung des Spins Wir sahen, wie man bei Silberatomen mit einer Stern-Gerlach-Apparatur die Drehim pulskomponente längs einer vorgegebenen Richtung messen kann, und wir konnten weiter zeigen, dass eine derartige Vorrichtung auch zur Präparation eines Atomstrahls in einen bestimmten Zustand geeignet ist. Damit sind wir in der Lage, die aus den Pos tulaten folgenden Vorhersagen experimentell zu überprüfen, indem wir den Strahl nacheinander durch zwei Stern-Gerlach-Magneten schicken. Der erste Apparat dient als Polarisator: Der austretende Strahl besteht aus einer großen Anzahl von Silberato men, die sich alle im selben Spinzustand befinden. Dieser Strahl tritt dann in einen zweiten Apparat ein, mit dem wir eine bestimmte Komponente des Drehimpulses 𝓢 messen können: In gewisser Weise ist er ein Analysator (man beachte die Analogie zur Optik, s. Kap. I, § A-3). Wir wollen im jetzigen Abschnitt voraussetzen, dass sich der Spinzustand der Atome zwischen dem Verlassen des „Polarisators“ und dem Eintritt in den „Analysator“, also zwischen der Präparation und der Messung, zeitlich nicht ändert. Von dieser Einschränkung könnten wir uns jedoch leicht befreien: Es würde genügen, die Entwicklung des Spinzustands zwischen dem Augenblick der Präpara tion und dem Zeitpunkt der Messung über die Schrödinger-Gleichung zu berechnen (s. § B-3). B-2-a Erster Versuch Die Achsen beider Apparaturen seien zur z-Richtung parallel (Abb. 7): Die erste prä pariert die Atome in den Zustand |+⟩, die zweite misst 𝒮z . Was beobachtet man auf der Platte der zweiten Anordnung? Weil der Zustand, in dem sich das System befin det, Eigenzustand der zu messenden Observablen S z ist, besagen die Postulate, dass das Resultat der Messung sicher ist: Man findet mit Bestimmtheit den zugehörigen Ei genwert (+ℏ/2). Folglich müssen sich alle Atome des Strahls auf der zweiten Platte in
B Die Postulate am Beispiel des Spins 1/2 | 393
Abb. 7: Der erste Apparat (bestehend aus der Quelle, also dem Ofen E 1 und dem kollimierenden Spalt F1 , dem Polarisator mit dem Magneten A1 und der durchlochten Platte P1 ) präpariert die Ato me in den Zustand |+⟩; der zweite (der Analysator mit dem Magneten A2 und der Platte P2 ) misst die Komponente 𝒮z : Das Resultat ist mit Sicherheit (+ℏ/2).
einem einzigen Fleck kondensieren, dessen Lage zu diesem Wert +ℏ/2 gehört. Genau dies stellt man im Experiment auch fest: Sämtliche Atome treffen in der Umgebung von N1 auf die zweite Platte und kein einziges in der Nähe von N2 . B-2-b Zweiter Versuch Wir drehen jetzt die Achse des ersten Apparats in Richtung des Einheitsvektors u mit den Polarwinkeln θ und φ = 0 (u liegt somit in der x, z-Ebene); die Achse des zweiten Apparats bleibt parallel zur z-Richtung (Abb. 8).
Abb. 8: Der erste Apparat präpariert die Spins in den Zustand |+⟩u (u ist der Einheitsvektor in der x, z-Ebene, der mit der z-Achse den Winkel θ einschließt); der zweite Apparat misst die Komponente 𝒮z : Die möglichen Ergebnisse sind +ℏ/2 (Wahrscheinlichkeit cos2 θ/2) und −ℏ/2 (Wahrscheinlichkeit sin2 θ/2).
Nach Gl. (A-22a) ist der Spinzustand der Atome beim Verlassen des „Polarisators“ θ θ |ψ⟩ = cos |+⟩ + sin |−⟩ 2 2
(B-9)
Der „Analysator“ misst an diesen Atomen die Komponente 𝒮z . Wie sind jetzt die Er gebnisse?
394 | IV Einfache Systeme
Dieses Mal stellt man fest, dass sich Atome sowohl um N1 als auch um N2 nieder schlagen, obwohl sie alle auf dieselbe Weise präpariert wurden: Während des Mess prozesses tritt im Verhalten jedes einzelnen Atoms eine Unbestimmtheit auf. Nach dem Postulat der Spektralzerlegung kann man nur die Wahrscheinlichkeiten ange ben, mit denen jedes Atom die Stellen N1 und N2 erreichen. Weil Gl. (B-9) die Ent wicklung des Spinzustands eines Atoms nach den Eigenzuständen der zu messenden Observablen angibt, kann man diese Wahrscheinlichkeiten sofort zu cos2 θ/2 bzw. sin2 θ/2 errechnen. Sobald genügend viele Atome auf der Platte kondensiert sind, ent spricht die Intensität der Flecken um N1 und N2 der Zahl der dort auftreffenden Atome, und diese ist proportional zu cos2 θ/2 bzw. sin2 θ/2. Bemerkung: Bei einer Messung von S z findet man für jeden Wert von θ immer die beiden Ergebnisse +ℏ/2 und −ℏ/2, falls θ nicht genau null oder π ist. Diese Aussage erscheint zunächst paradox: Ist z. B. θ sehr klein, so weist der Spin am Ausgang des ersten Apparats praktisch in die z-Richtung. Trotzdem kann man bei einer Messung von S z genauso gut den Wert −ℏ/2 wie den Wert +ℏ/2 erhalten (während nach der klassischen Mechanik das Ergebnis (ℏ/2) cos θ ≈ ℏ/2 wäre); doch ist die Wahrscheinlichkeit für den Wert −ℏ/2 umso geringer, je kleiner θ ist. Überdies werden wir sehen [Gl. (B-11)], dass der Erwartungswert ⟨S z ⟩, den man für die Ergebnisse einer großen Anzahl identischer Versuche berechnet, gleich (ℏ/2) cos θ ist, und dies entspricht genau der klassischen Aussage.
B-2-c Dritter Versuch Wir nehmen einen „Polarisator“ wie eben, der Atome in den Zustand (B-9) präpariert, und drehen den „Analysator“ so, dass seine Achse in die x-Richtung weist, wir mit ihm also die Drehimpulskomponente 𝒮x messen. Für die Formulierung der Vorhersagen müssen wir jetzt den Zustandsvektor |ψ⟩ nach den Eigenzuständen der Observablen S x entwickeln [Gl. (A-20)]. Wir finden =
θ π θ 1 θ (cos + sin ) = cos ( − ) 2 2 4 2 √2
x ⟨−|ψ⟩ =
1 θ π θ θ (cos − sin ) = sin ( − ) 2 2 4 2 √2
x ⟨+|ψ⟩
(B-10)
Den Eigenwert +ℏ/2 von S x beobachten wir also mit der Wahrscheinlichkeit cos2 (π/4− θ/2) und den Eigenwert −ℏ/2 mit der Wahrscheinlichkeit sin2 (π/4 − θ/2). Diese Vorhersagen werden bestätigt, wenn man die Intensitäten der Flecken auf der Platte des zweiten Stern-Gerlach-Apparats misst. Bemerkung: Es ist nicht überraschend, dass hier der Ausdruck (π/4 − θ/2) auftritt: Beim zweiten Versuch ist der Winkel zwischen den Achsen der beiden Apparate θ. Nach der Drehung des zweiten Apparats wird er (π/2 − θ).
B Die Postulate am Beispiel des Spins 1/2 | 395
B-2-d Mittelwerte Beim zweiten Versuch gelangen von einer großen Anzahl von N Atomen N cos2 θ/2 an die Stelle N1 und N sin2 θ/2 an die Stelle N2 . Daher liefert die Messung von 𝒮z für jedes Atom im ersten Fall den Wert +ℏ/2 und im zweiten Fall −ℏ/2. Berechnet man den Mittelwert aller Ergebnisse, so erhält man θ ℏ θ 1 ℏ [ N cos2 − N sin2 ] N 2 2 2 2 ℏ = cos θ 2
⟨S z ⟩ =
(B-11)
Mit den Beziehungen (B-9) und (A-10) weist man nach, dass dies gleich dem Matrix element ⟨ψ|S z |ψ⟩ ist. Entsprechend ist der Mittelwert der Messergebnisse beim dritten Versuch 1 ℏ π θ π θ ℏ [ N cos2 ( − ) − N sin2 ( − )] N 2 4 2 2 4 2 ℏ = sin θ 2
⟨S x ⟩ =
(B-12)
Für die Berechnung des Matrixelements ⟨ψ|S x |ψ⟩ kann man die Matrix (A-16) verwen den, die S x in der {|+⟩, |−⟩}-Basis darstellt. In dieser Basis wird der Ketvektor durch θ/2 den Spaltenvektor cos sin θ/2 dargestellt und der Bravektor durch den zugehörigen Zeilen vektor. Damit wird ⟨ψ|S x |ψ⟩ = =
ℏ (cos θ/2 2
0 sin θ/2) ( 1
ℏ sin θ 2
cos θ/2 1 ) )( sin θ/2 0 (B-13)
Wieder ist der Mittelwert von 𝒮x gleich dem Matrixelement der zugehörigen Observa blen S x im Zustand |ψ⟩. In diesem Zusammenhang ist eine Feststellung von Interesse: Ein klassischer Drehimpuls mit dem Betrag ℏ/2 und einer Richtung parallel zur Achse des „Pola risators“ besäße die x-Komponente (ℏ/2) sin θ und die z-Komponente (ℏ/2) cos θ. Berechnet man allgemeiner die Erwartungswerte von S x , S y und S z im Zustand |+⟩u [Gl. (A-22a)], so findet man ℏ sin θ cos φ 2 ℏ sin θ sin φ u ⟨+|S y |+⟩ u = 2 ℏ cos θ u ⟨+|S z |+⟩ u = 2
u ⟨+|S x |+⟩ u
=
(B-14)
396 | IV Einfache Systeme
Das sind gerade wieder die Komponenten eines klassischen Drehimpulses mit dem Betrag ℏ/2, der in Richtung des Einheitsvektors u mit den Polarwinkeln θ und φ ori entiert ist. Daher ergibt sich auch hier wieder über die Erwartungs- bzw. Mittelwerte eine Verbindung zwischen der klassischen und der Quantenmechanik. Man muss je doch beachten, dass eine Messung z. B. von 𝒮x an einem bestimmten Atom niemals den Wert (ℏ/2) sin θ cos φ liefern würde. Hierbei erhielte man allein die Werte +ℏ/2 und −ℏ/2. Erst der Mittelwert einer großen Anzahl identischer Messungen (der Zu stand, hier |+⟩u , ist derselbe, und es wird dieselbe Observable, hier S x , gemessen) ist dann (ℏ/2) sin θ cos φ. Bemerkung: An dieser Stelle ist es zweckmäßig, noch einmal auf die Frage der äußeren Freiheitsgrade (Ort und Impuls) einzugehen. Wir sahen: Wenn ein Silberatom in dem durch Gl. (B-9) gegebenen Zustand den zweiten SternGerlach-Apparat durchquert, so ist es nicht möglich, mit Sicherheit vorherzusagen, an welcher Stelle, N 1 oder N 2 , es auftreffen wird. Diese Unbestimmtheit ist mit der Vorstellung einer klas sischen Bahn, die bei Vorgabe des Anfangszustands vollständig determiniert ist, nur schwer in Einklang zu bringen. Der Widerspruch ist jedoch nur scheinbar: Die Möglichkeit einer klassischen Behandlung der äu ßeren Freiheitsgrade bedeutet lediglich, dass man Wellenpakete konstruieren kann, die im Ver gleich zu den Dimensionen der Versuchsanordnung von sehr geringer Ausdehnung sind. Daraus folgt aber nicht notwendig, dass das Teilchen selbst eine klassische Bahn beschreibt. Wir wollen dies zeigen. Betrachten wir zunächst ein Silberatom, das sich beim Eintritt in den Apparat im Anfangszustand |+⟩ befindet. Die Wellenfunktion, mit der die äußeren Freiheitsgrade dieses Teilchens beschrie ben werden, ist ein Wellenpaket sehr geringer Ausdehnung, dessen Schwerpunkt sich auf der in Abb. 9a skizzierten klassischen Bahn bewegt. Tritt dagegen das Silberatom im Zustand |−⟩ in den Apparat ein, so ist die Bahn des Paketschwerpunkts durch die klassische Kurve der Abb. 9b gegeben. Wenn wir nun ein Atom betrachten, das sich beim Eintritt in einem Spinzustand befindet, wie er durch Gl. (B-9) gegeben ist, so handelt es sich um eine völlig definierte Superposition der beiden eben genannten Anfangszustände. Wegen der Linearität der Schrödinger-Gleichung ist die Wellenfunktion des Teilchens zu einem späteren Zeitpunkt (Abb. 9c) eine Überlagerung der beiden Pakete aus Abb. 9a und Abb. 9b. Für das Teilchen besteht demnach eine gewisse Wahr scheinlichkeit, sich in dem einen oder dem anderen Paket zu befinden. Damit beschreibt es aber im Gegensatz zu den Paketschwerpunkten in keiner Weise eine klassische Trajektorie. Auf der Platte hat die Wellenfunktion in beiden (eng begrenzten) Bereichen um N 1 und N 2 von null ver schiedene Werte. Das Teilchen kann sich daher in der Nähe von N 1 oder von N 2 manifestieren, ohne dass man im Voraus mit Sicherheit sagen kann, an welcher Stelle dies geschehen wird. Man beachte insbesondere, dass die beiden Wellenpakete in Abb. 9c nicht zwei verschiedene, sondern ein einziges Teilchen repräsentieren. Seine Wellenfunktion besteht aus zwei Teilen, die in verschiedenen Punkten stark lokalisiert sind. Zwischen den beiden Paketen besteht übrigens eine wohldefinierte Phasenbeziehung, weil sie aus demselben Anfangspaket hervorgehen, das unter der Wirkung des Gradienten des Magnetfeldes B aufgespalten wird. Man könnte die bei den Teile wieder zu einem Paket zusammenbringen, indem man die Platte entfernt (also keine Messung durchführt) und sie einem neuen Feldgradienten mit entgegengesetztem Vorzeichen aussetzt.
B Die Postulate am Beispiel des Spins 1/2 | 397
(a)
(b)
(c) Abb. 9: Für den Spinzustand |+⟩ (a) bzw. den Zustand |−⟩ (b) folgt der Schwerpunkt des Wellenpa kets einer wohldefinierten Bahn, die man klassisch berechnen kann. Ist der Spinzustand eine Über lagerung der Zustände |+⟩ und |−⟩, so spaltet sich das Paket in zwei Teile. Man kann jetzt nicht mehr von einer klassischen Bahn des Atoms sprechen (obwohl die Ausdehnung der beiden Pakete auch weiterhin gegenüber den Abmessungen der Versuchsanordnung sehr gering ist).
B-3 Spin 1/2 und homogenes Magnetfeld B-3-a Hamilton-Operator und Schrödinger-Gleichung Ein Silberatom gelange in ein homogenes Magnetfeld B0 . Wir legen die z-Achse in Rich tung von B0 . Dann ist klassisch die potentielle Energie des magnetischen Moments 𝓜 = γ 𝓢 dieses Atoms W = − 𝓜 ⋅ B0 = − ℳz B0 = − γ B0 𝒮z
(B-15)
worin B0 der Betrag des Magnetfeldes ist. Wir setzen ω0 = − γ B0
(B-16)
Man erkennt, dass ω0 die Dimension einer Frequenz hat. Weil wir die inneren Freiheitsgrade des Teilchens auf eindeutige Weise quantisiert haben, müssen wir 𝒮z durch den Operator S z ersetzen, so dass auch die klassische Energie (B-15) zu einem Operator wird. Dieser Hamilton-Operator H = ω0 S z
(B-17)
bestimmt die zeitliche Entwicklung des Spins im Feld B0 . Er ist zeitunabhängig, so dass sich die Lösung der Schrödinger-Gleichung auf die Lösung der Eigenwertglei chung von H reduziert. Man sieht sofort, dass die Eigenvektoren von H die gleichen
398 | IV Einfache Systeme
sind wie die von S z : ℏω0 |+⟩ H|+⟩ = + 2 (B-18) ℏω0 |−⟩ H|−⟩ = − 2 Es gibt also zwei Energieniveaus: E+ = +ℏω0 /2 und E− = −ℏω0 /2 (Abb. 10). Ihr Ab stand ℏω0 ist zur Stärke des Magnetfeldes proportional, und sie bestimmen eine BohrFrequenz 1 ω0 (B-19) ν+− = (E+ − E− ) = h 2π
Abb. 10: Energieniveaus für ein Teilchen mit dem Spin 1/2 und dem gyromagnetischen Verhältnis γ in einem Magnetfeld B0 parallel zur z-Richtung. Es ist ω0 = − γB 0 .
Bemerkungen: 1. Liegt das Feld B0 in Richtung des Einheitsvektors u mit den Polarwinkeln θ und φ, so muss die Beziehung (B-17) durch H = ω0 S u
(B-20)
ersetzt werden; darin ist S u = S ⋅ u die Komponente von S in Richtung von u. 2. Für ein Silberatom ist γ negativ und damit ω0 positiv, woraus sich die Lage der Energieniveaus in Abb. 10 erklärt.
B-3-b Larmor-Präzession Wir nehmen an, dass sich das System zum Zeitpunkt t = 0 im Zustand θ −iφ/2 θ |+⟩ + sin eiφ/2 |−⟩ (B-21) e 2 2 befindet (in § B-1-c zeigten wir, dass wir einen beliebigen Zustand auf diese Form brin gen können). Zur Berechnung des Zustands |ψ(t)⟩ zu einem beliebigen Zeitpunkt t wenden wir die Regel (D-54) aus Kapitel III an. Im Ausdruck (B-21) ist |ψ(0)⟩ bereits nach den Eigenzuständen des Hamilton-Operators entwickelt worden, so dass wir für ψ(t) erhalten |ψ(0)⟩ = cos
θ −iφ/2 −iE+ t/ℏ θ e e |+⟩ + sin eiφ/2 e−iE− t/ℏ |−⟩ 2 2 oder auch, wenn wir E+ und E− einsetzen θ θ |ψ(t)⟩ = cos e−i(φ+ω0 t)/2 |+⟩ + sin ei(φ+ω0 t)/2 |−⟩ 2 2 |ψ(t)⟩ = cos
(B-22)
(B-23)
C Systeme mit zwei Niveaus
| 399
Das Magnetfeld B0 bewirkt daher zwischen den Koeffizienten von |+⟩ und |−⟩ eine zur Zeit t proportionale Phasenverschiebung. Vergleicht man den Ausdruck (B-23) für |ψ(t)⟩ mit dem Eigenket |+⟩u der Observa blen S⋅u [Gl. (A-22a)], so sieht man, dass die Richtung u(t), in der die Spinkomponente mit Sicherheit +ℏ/2 ist, durch die Polarwinkel θ(t) = θ φ(t) = φ + ω0 t
(B-24)
gegeben ist. Der Winkel zwischen u(t) und der z-Richtung (der Richtung des Magnet feldes B0 ) bleibt demnach konstant, doch dreht sich u(t) mit der zum Magnetfeld pro portionalen Winkelgeschwindigkeit ω0 um die z-Achse: Wie in der klassischen Me chanik finden wir auch hier wieder das Phänomen der Larmor-Präzession. Nach dem Ausdruck (B-17) für den Hamilton-Operator ist die Observable S z offen sichtlich eine Konstante der Bewegung. Über Gl. (B-23) weist man leicht nach, dass bei einer Messung dieser Observablen die Wahrscheinlichkeiten, die Werte +ℏ/2 oder −ℏ/2 zu erhalten, von der Zeit unabhängig sind: Weil der Betrag von e±i(φ+ω0 t)/2 gleich eins ist, sind diese Wahrscheinlichkeiten cos2 θ/2 und sin2 θ/2. Auch der Erwartungs wert von S z ist zeitlich konstant: ℏ cos θ (B-25) 2 Dagegen vertauschen S x und S y nicht mit H. Man sieht dies am einfachsten, wenn man von den Darstellungsmatrizen (A-15), (A-16) und (A-17) für S x , S y und S z ausgeht. Die Beziehungen (B-14) lauten jetzt ⟨ψ(t)|S z |ψ(t)⟩ =
ℏ sin θ cos(φ + ω0 t) 2 (B-26) ℏ ⟨ψ(t)|S y |ψ(t)⟩ = sin θ sin(φ + ω0 t) 2 In diesen Ausdrücken tritt wieder die Bohr-Frequenz ω0 /2π des Systems auf. Ferner verhalten sich die Erwartungswerte von S x , S y und S z wie die Komponenten eines klassischen Drehimpulses mit dem Betrag ℏ/2, der zu einer Larmor-Drehung angeregt wird. ⟨ψ(t)|S x |ψ(t)⟩ =
C Systeme mit zwei Niveaus Die vorstehenden Rechnungen gestalteten sich deshalb so leicht, weil der Zustands raum nur zweidimensional war. Nun gibt es eine Reihe weiterer Fälle in der Physik, die man in erster Näherung genauso einfach behandeln kann. Betrachten wir z. B. ein physikalisches System, das zwei Zustände mit benachbarten Energien besitzt, die sich aber von den Energien der anderen Zustände sehr unterscheiden. Will man nun die Wirkung einer äußeren Störung (oder der bis jetzt nicht angesprochenen inneren Wechselwirkungen) auf diese beiden Niveaus untersuchen, so kann man bei hinrei
400 | IV Einfache Systeme
chend geringer Stärke der Störung zeigen (Kapitel XI), dass diese Wirkung in erster Nä herung ohne Berücksichtigung der anderen Energieniveaus bestimmt werden kann. Man darf also die Rechnungen in einem zweidimensionalen Unterraum des Zustands raums durchführen. In diesem Abschnitt behandeln wir die allgemeinen Eigenschaften eines Systems, das nur zwei Niveaus besitzt (es müssen nicht unbedingt Spin-1/2-Niveaus sein). Mit diesem mathematisch sehr einfachen Modell können wir uns grundlegende physika lische Phänomene (wie die quantenmechanische Resonanz oder die Oszillation zwi schen zwei Niveaus) verdeutlichen.
C-1 Problemstellung C-1-a Bezeichnungen Wir betrachten ein System mit einem zweidimensionalen Zustandsraum. (Wie wir be reits bemerkten, handelt es sich dabei häufig um eine Näherung: Man kann sich un ter bestimmten Voraussetzungen auf einen zweidimensionalen Unterraum des allge meinen Zustandsraums beschränken.) Als Basis wählen wir die beiden Eigenzustände |φ1 ⟩ und |φ2 ⟩ des Hamilton-Operators H0 zu den Eigenwerten E1 und E2 : H0 |φ1 ⟩ = E1 |φ1 ⟩ H0 |φ2 ⟩ = E2 |φ2 ⟩
(C-1)
Diese Basis ist orthonormiert: ⟨φ i |φ j ⟩ = δ ij i, j = 1, 2
(C-2)
Wollen wir jetzt eine äußere Störung oder innere Wechselwirkungen im System berücksichtigen, die wir anfänglich im Hamilton-Operator H0 vernachlässigt haben, so lautet der Hamilton-Operator H = H0 + W
(C-3)
Die Eigenzustände und Eigenwerte von H bezeichnen wir mit |ψ± ⟩ und E± : H|ψ+ ⟩ = E+ |ψ+ ⟩ H|ψ− ⟩ = E− |ψ− ⟩
(C-4)
Häufig nennt man H0 den ungestörten Hamilton-Operator und W die Störung oder auch Kopplung. Wir werden voraussetzen, dass W zeitunabhängig ist. In der {|φ1 ⟩, |φ2 ⟩}-Basis der Eigenzustände von H0 (wir nennen sie die ungestörten Zustände) wird W durch eine hermitesche Matrix dargestellt: (W) = (
W11 W21
W12 ) W22
(C-5)
W11 und W22 sind reell, und es gilt weiter ∗ W12 = W21
(C-6)
C Systeme mit zwei Niveaus
|
401
Bei Abwesenheit der Kopplung sind E1 und E2 die möglichen Energien des Sys tems und die Zustände |φ1 ⟩ und |φ2 ⟩ sind stationär (Bringt man das System in einen von diesen Zuständen, so bleibt es auf Dauer in ihm). Das Problem besteht also in der Bestimmung der Änderungen, die durch die Einführung der Kopplung W auftreten. C-1-b Konsequenzen der Kopplung α E1 und E2 sind nicht mehr mögliche Energien des Systems Eine Energiemessung kann nur einen der beiden Eigenwerte E+ und E− von H liefern, die sich im Allgemeinen von E1 und E2 unterscheiden. Die erste Aufgabe ist also die Berechnung von E+ und E− in Abhängigkeit von E1 , E2 und den Matrixelementen W ij von W: Wie verschieben sich durch die Kopplung die Energieniveaus? β |φ1 ⟩ und |φ2 ⟩ sind keine stationären Zustände mehr Im Allgemeinen werden die Zustände |φ1 ⟩ und |φ2 ⟩ keine Eigenzustände des GesamtHamilton-Operators H sein. Ist z. B. das System für t = 0 im Zustand |φ1 ⟩, so besteht eine gewisse Wahrscheinlichkeit 𝒫12 (t), es zur Zeit t im Zustand |φ2 ⟩ zu finden: Die Kopplung induziert also Übergänge zwischen den beiden ungestörten Zuständen. Dies ist der Grund, weshalb man die Störung W auch Kopplung (zwischen |φ1 ⟩ und |φ2 ⟩) nennt. Die zweite Aufgabe befasst sich mit dem dynamischen Aspekt des Kopplungsef fektes. Bemerkung: In Ergänzung CIV werden beide Fragen durch die Einführung eines fiktiven Spins gelöst werden. Man kann nämlich zeigen, dass der zu diagonalisierende Hamilton-Operator H dieselbe Form hat wie im Falle eines Teilchens mit dem Spin 1/2, das sich in einem statischen Magnetfeld B bewegt. Die Komponenten dieses Feldes sind dann einfach Funktionen von E 1 , E 2 und den Ma trixelementen W ij . Man kann mit anderen Worten jedem System mit nur zwei Niveaus (und nicht nur einem Spin-1/2-System) einen Spin 1/2 (einen fiktiven Spin) zuordnen. Alle Aussagen, die wir in diesem Abschnitt über das System formulieren werden, erlauben eine geometrisch einfache Interpretation, in der die für ein Spin-1/2-System gültigen Begriffe (wie magnetisches Moment, Larmor-Präzession usw.) verwendet werden.
C-2 Statischer Aspekt C-2-a Eigenzustände und Eigenwerte In der {|φ1 ⟩, |φ2 ⟩}-Basis lautet die Matrix des Hamilton-Operators H (H) = (
E1 + W11 W21
W12 ) E2 + W22
(C-7)
402 | IV Einfache Systeme
Die Diagonalisierung dieser Matrix ist nicht schwierig; sie wird in Ergänzung BIV aus geführt. Man erhält für die Eigenwerte 1 (E1 + W11 + E2 + W22 ) + 2 1 E− = (E1 + W11 + E2 + W22 ) − 2
E+ =
1 √(E1 + W11 − E2 − W22 )2 + 4|W12 |2 2 1 √(E1 + W11 − E2 − W22 )2 + 4|W12 |2 2
(C-8)
Für W = 0 fallen E+ und E− mit E1 bzw. E2 zusammen.⁵ Die zu E+ und E− gehörenden Eigenvektoren sind θ −iφ/2 θ |φ1 ⟩ + sin eiφ/2 |φ2 ⟩ e 2 2 θ θ |ψ− ⟩ = − sin e−iφ/2 |φ1 ⟩ + cos eiφ/2 |φ2 ⟩ 2 2
|ψ+ ⟩ = cos
(C-9a) (C-9b)
worin die Winkel θ und φ durch die Beziehungen tan θ =
2|W12 | E1 + W11 − E2 − W22
mit 0 ≤ θ < π
W21 = |W21 | eiφ
(C-10) (C-11)
definiert sind. C-2-b Physikalische Diskussion α Grafische Darstellung des Kopplungseffektes Die im Folgenden diskutierten Effekte basieren sämtlich auf der Tatsache, dass die Stö ∗ rung W nichtverschwindende Nichtdiagonalelemente W12 = W21 besitzt. Für W12 = 0 wären die Eigenzustände von H dieselben wie die von H0 und die neuen Eigenwerte einfach E1 + W11 und E2 + W22 . Zur Vereinfachung unserer Überlegungen nehmen wir im Weiteren an, dass W11 = W22 = 0 ist.⁶ Aus den Gleichungen (C-8) und (C-10) wird dann 1 (E1 + E2 ) + 2 1 E− = (E1 + E2 ) − 2
E+ =
tan θ =
2|W12 | E1 − E2
1 √(E1 − E2 )2 + 4|W12 |2 2 1 √(E1 − E2 )2 + 4|W12 |2 2
0≤θ E 2 , so strebt E + gegen E 1 und E − gegen E 2 , wenn W gegen null geht. Ist dagegen E 1 < E 2 , so geht E + gegen E 2 und E − gegen E 1 . ̃ 1 = E 1 + W11 und E ̃ 2 = E 2 + W22 6 Sind die Diagonalelemente ungleich null, so braucht man nur E ̃ 1 und zu setzen. Alle Resultate dieses Abschnitts bleiben dann gültig, wenn man E 1 und E 2 durch E ̃ 2 ersetzt. E
C Systeme mit zwei Niveaus
| 403
Wir wollen jetzt untersuchen, wie die Kopplung W die Abhängigkeit der Energien E+ und E− von E1 und E2 beeinflusst. Wir nehmen W12 als fest an und setzen 1 Em = (E1 + E2 ) 2 (C-14) 1 ∆ = (E1 − E2 ) 2 Dann erkennen wir aus den Beziehungen (C-12) sofort die einfache Abhängigkeit von Em : Ändert sich Em , so wird nur der Energienullpunkt verschoben. Weiter zeigen die Gleichungen (C-9) bis (C-11), dass die Vektoren |ψ+ ⟩ und |ψ− ⟩ von Em unabhängig sind. Darum interessieren wir uns nur für den Einfluss von ∆. Wir tragen in derselben Gra fik die vier Energien E1 , E2 , E+ und E− als Funktion von ∆ auf (Abb. 11). Für E1 und E2 erhält man zwei (gestrichelt gezeichnete) Geraden mit den Steigungen +1 und −1. Setzt man Gl. (C-14) in Gl. (C-12) ein, so erhält man E+ = Em + √∆2 + |W12 |2
(C-15)
E− = Em − √∆2 + |W12 |2
(C-16)
Abb. 11: Die Energien E + und E − in Abhängig keit von der Energiedifferenz ∆ = (E 1 − E 2 )/2. Bei fehlender Kopplung kreuzen sich die Ni veaus im Ursprung (gestrichelte Geraden). Unter dem Einfluss der nichtdiagonalen Kopp lung W treten die gestörten Niveaus auseinan der. Die Bildkurven für E + und E − sind Hyper belzweige mit den nicht gestörten Niveaus als Asymptoten.
Ändert sich ∆, so beschreiben E+ und E− die beiden Zweige einer zu den Achsen sym metrischen Hyperbel, deren Asymptoten den ungestörten Niveaus entsprechen. Ihre Scheitel haben den Abstand 2|W12 |.⁷ β Kopplung und Lage der Energieniveaus Bei abwesender Kopplung „kreuzen“ sich die Energien für ∆ = 0. Wie aus der Abbil dung hervorgeht, bewirkt die Kopplung eine „Abstoßung“ der Niveaus, die Energie werte entfernen sich voneinander. 7 An der Abbildung erkennt man, weshalb für W → 0 gilt: E+ → E1 , E− → E2
wenn E 1 > E 2 ,
E+ → E2 , E− → E1
wenn E 1 < E 2 .
404 | IV Einfache Systeme
Andererseits sieht man, dass für beliebiges ∆ |E+ − E− | > |E1 − E2 | ist. Dies ist ein Ergebnis, das man auch in anderen Gebieten der Physik antrifft (z. B. in der Theorie der elektrischen Stromkreise): Eine Störung verbreitert die Eigenfrequen zen. In der Nähe der Asymptoten, also für |∆| ≫ |W12 |, kann man die Beziehun gen (C-15) und (C-16) in eine Potenzreihe nach |W12 /∆| entwickeln: 1 W12 2 + ⋅⋅⋅) 2 ∆ 1 W12 2 E− = Em − ∆ (1 + + ⋅⋅⋅) 2 ∆ E+ = Em + ∆ (1 +
(C-17)
Dagegen ergeben die Gleichungen (C-15) und (C-16) im Hyperbelmittelpunkt, also für E2 = E1 (∆ = 0), E+ = Em + |W12 |
(C-18)
E− = Em − |W12 |
Die Störung kommt also viel stärker zum Tragen, wenn die beiden ungestörten Niveaus dieselbe Energie besitzen. Der Effekt macht sich dann in erster Ordnung bemerkbar, während er für ∆ ≫ |W12 | erst in zweiter Ordnung auftritt [s. Gl. (C-17)]. γ Kopplung und Eigenzustände Bei Verwendung der Bezeichnungen (C-14) wird aus Gl. (C-13) tan θ =
|W12 | ∆
(C-19)
Daraus folgt, dass für ∆ ≪ |W12 | (starke Kopplung) θ ≈ π/2 ist, für ∆ ≫ |W12 | (schwa che Kopplung) dagegen θ ≈ 0 (wir setzen ∆ > 0 voraus). Für E2 = E1 (d. h. ∆ = 0) hat man 1 −iφ/2 |φ1 ⟩ + eiφ/2 |φ2 ⟩] [e √2 1 [−e−iφ/2 |φ1 ⟩ + eiφ/2 |φ2 ⟩] |ψ− ⟩ = √2 |ψ+ ⟩ =
(C-20)
während in der Nähe der Asymptoten, also für ∆ ≫ |W12 |, in erster Ordnung in |W12 |/∆ |ψ+ ⟩ = e−iφ/2 [|φ1 ⟩ + eiφ |ψ− ⟩ = e
iφ/2
|W12 | |φ2 ⟩ + ⋅ ⋅ ⋅ ] 2∆
−iφ |W12 |
[|φ2 ⟩ − e
2∆
|φ1 ⟩ + ⋅ ⋅ ⋅ ]
(C-21)
C Systeme mit zwei Niveaus
| 405
gilt. Bei einer schwachen Kopplung (E1 − E2 ≫ |W12 |) unterscheiden sich daher die gestörten Zustände nur sehr wenig von den ungestörten: Bis auf einen globalen Pha senfaktor e−iφ/2 ist |ψ+ ⟩ gemäß (C-21) gleich dem Zustand |φ1 ⟩ mit einem kleinen An teil des Zustands |φ2 ⟩. Dagegen zeigen die Gleichungen (C-20), dass bei einer starken Kopplung (E1 − E2 ≪ |W12 |) die Zustände |ψ+ ⟩ und |ψ− ⟩ von den Zuständen |φ1 ⟩ und |φ2 ⟩ beträchtlich verschieden sind, weil bei der Superposition die Beträge der Koeffi zienten denselben Betrag haben. So unterliegen die Eigenzustände ebenso wie die Energien in der Umgebung des Kreuzungspunktes ∆ = 0, E1 = E2 wesentlichen Modifizierungen.
C-2-c Resonanzphänomene Für E1 = E2 = Em ist die Energie des ungestörten Systems zweifach entartet. Die Kopp lung W12 hebt diese Entartung auf, und es entsteht insbesondere ein Niveau, dessen Energie um den Betrag |W12 | abgesenkt ist. Ist mit anderen Worten der Grundzustand eines physikalischen Systems doppelt entartet (und hinreichend weit von den ande ren Niveaus entfernt), senkt jede (rein nichtdiagonale) Kopplung zwischen den beiden zugehörigen Zuständen die Energie dieses Grundzustands ab; er wird also stabiler. Als erstes Beispiel für dieses Phänomen erwähnen wir die Stabilisierung des Ben zolmoleküls C6 H6 durch Resonanz. Man weiß, dass sich die sechs Kohlenstoffatome an den Ecken eines regelmäßigen Sechsecks befinden. Man erwartet daher, dass der Grundzustand drei Doppelbindungen zwischen benachbarten Kohlenstoffatomen aufweist. Die Abb. 12 zeigt zwei mögliche Konfigurationen. Während man die Kerne wegen ihrer großen Masse als ruhend annimmt, sind die zu den beiden Konfigura tionen gehörenden Elektronenzustände unterschiedlich. Wäre nur die Struktur wie in Abb. 12a möglich, so hätte der Grundzustand des Elektronensystems die Energie Em = ⟨φ1 |H|φ1 ⟩, wenn H der Hamilton-Operator der Elektronen in dem von den Kernen erzeugten Potential ist. Doch können die Bindungen auch wie in Abb. 12b angeordnet sein: Aus Symmetriegründen muss offensichtlich ⟨φ2 |H|φ2 ⟩ = ⟨φ1 |H|φ1 ⟩ sein, so dass man auf eine zweifache Entartung des Grundzustands schließen könnte. Nun ist aber das nichtdiagonale Matrixelement ⟨φ2 |H|φ1 ⟩ des Hamilton-Operators H von null verschieden. Diese Kopplung zwischen den Zuständen |φ1 ⟩ und |φ2 ⟩ führt zu zwei verschiedenen Niveaus, von denen das eine tiefer als Em liegt. Das Benzol molekül ist daher stabiler, als man zunächst erwarten könnte. Ferner kann die Kon figuration in seinem eigentlichen Grundzustand weder durch Abb. 12a noch durch Abb. 12b dargestellt werden: Dieser Zustand ist vielmehr eine Überlagerung von |φ1 ⟩ und |φ2 ⟩, wobei die Koeffizienten wie in Gl. (C-20) denselben Betrag besitzen. In der Chemie symbolisiert man dies gewöhnlich durch den Doppelpfeil. Ein weiteres Beispiel ist das ionisierte Wasserstoffmolekül H+2 , das aus den beiden Protonen p1 und p2 und einem Elektron besteht. Wegen ihrer großen Masse kann man die Protonen wieder als ruhend ansehen. Ihren Abstand bezeichnen wir mit R; |φ1⟩ sei der Zustand, in dem sich das Elektron bei p1 , und |φ2 ⟩ der Zustand, in dem es sich bei
406 | IV Einfache Systeme
(a)
(b)
(a)
Abb. 12: Zwei mögliche Konfigurationen eines Benzolmoleküls.
(b)
Abb. 13: In einem H+2 -Ion kann das Elektron zunächst in der Umgebung des Protons p 1 (a) oder in der des Protons p 2 lokalisiert sein (b). Im Grundzustand des Ions ist die Wellenfunktion des Elektrons eine Linearkombination der beiden zu (a) bzw. (b) gehörenden Wellenfunktionen. Seine Aufenthaltswahrscheinlichkeit ist zur Mittelebene von p 1 p 2 symmetrisch.
p2 aufhält. Die zugehörige Wellenfunktion ist jeweils die eines Wasserstoffatoms, das mit p1 bzw. p2 gebildet wurde (Abb. 13). Wie beim vorigen Beispiel sind die Diagonal elemente ⟨φ1 |H|φ1 ⟩ und ⟨φ2 |H|φ2 ⟩ des Hamilton-Operators aus Symmetriegründen gleich; wir bezeichnen sie mit Em (R). Die beiden Zustände |φ1 ⟩ und |φ2 ⟩ sind jedoch nicht stationär, weil das Matrixelement ⟨φ1 |H|φ2 ⟩ von null verschieden ist. Wieder erhält man ein Niveau, dessen Energie geringer als Em (R) ist, und im Grundzustand ist die Wellenfunktion des Elektrons eine Linearkombination aus den zu Abb. 13a und Abb. 13b gehörenden Funktionen: Das Elektron ist nicht mehr um ein Proton lokali siert. Diese Delokalisierung ist es, die unter Absenkung seiner potentiellen Energie für die chemische Bindung verantwortlich ist. Eine genauere Untersuchung des ionisier ten Wasserstoffmoleküls findet man in Ergänzung GXI .
C-3 Dynamischer Aspekt C-3-a Entwicklung des Zustandsvektors Es sei |ψ(t)⟩ = a1 |φ1 ⟩ + a2 |φ2 ⟩
(C-22)
der Zustandsvektor des Systems zum Zeitpunkt t. Seine zeitliche Entwicklung wird bei Gegenwart der Kopplung W durch die Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = (H0 + W)|ψ(t)⟩ dt
(C-23)
C Systeme mit zwei Niveaus
| 407
bestimmt. Wir projizieren diese Gleichung auf die Basisvektoren |φ1 ⟩ und |φ2 ⟩. Unter Beachtung von Gl. (C-5) (in der wir W11 = W22 = 0 setzen) und Gl. (C-22) erhalten wir iℏ
d a1 (t) = E1 a1 (t) + W12 a2 (t) dt
(C-24)
d iℏ a2 (t) = W21 (t)a1 (t) + E2 a2 (t) dt Ist |W12 | ≠ 0, so bilden diese Gleichungen ein gekoppeltes System linearer homoge ner Differentialgleichungen. Die klassische Lösungsmethode für ein derartiges System besteht in der Anwendung der Regel (D-54) aus Kap. III: Man sucht die Eigenvektoren ψ+ (zum Eigenwert E+ ) und |ψ− ⟩ (zum Eigenwert E− ) des Operators H = H0 + W [sei ne Matrixelemente sind die Koeffizienten des Gleichungssystems (C-24)] und zerlegt |ψ(0)⟩ nach |ψ+ ⟩ und |ψ− ⟩: |ψ(0)⟩ = λ|ψ+ ⟩ + μ|ψ− ⟩
(C-25)
worin λ und μ durch die Anfangsbedingungen festgelegt werden. Man erhält dann |ψ(t)⟩ = λ e−iE+ t/ℏ |ψ+ ⟩ + μ e−iE− t/ℏ |ψ− ⟩
(C-26)
Projiziert man |ψ(t)⟩ auf |φ1 ⟩ und |φ2 ⟩, so erhält man die Koeffizienten a1 (t) und a2 (t). Wir können nun zeigen, dass ein System mit dem durch Gl. (C-26) gegebenen Zu standsvektor |ψ(t)⟩ eine Schwingung zwischen den beiden ungestörten Zuständen |φ1 ⟩ und |φ2 ⟩ ausführt. Hierzu nehmen wir an, dass das System zum Zeitpunkt t = 0 im Zustand |φ1 ⟩ ist: |ψ(0)⟩ = |φ1 ⟩
(C-27)
und berechnen die Wahrscheinlichkeit 𝒫12 (t), es zur Zeit t im Zustand |φ2 ⟩ zu finden. C-3-b Berechnung von 𝓟 12 (t) Die Entwicklung des Kets |ψ(0)⟩ = |φ1 ⟩ nach der Basis {|ψ+ ⟩, |ψ− ⟩} erhalten wir, in dem wir das Gleichungssystem (C-9) umstellen. Es ergibt sich θ θ |ψ(0)⟩ = |φ1 ⟩ = eiφ/2 [cos |ψ+ ⟩ − sin |ψ− ⟩] 2 2
(C-28)
Hieraus folgt mit Gl. (C-26) |ψ(t)⟩ = eiφ/2 [cos
θ −iE+ t/ℏ θ |ψ+ ⟩ − sin e−iE− t/ℏ |ψ− ⟩] e 2 2
(C-29)
Damit lautet die Wahrscheinlichkeitsamplitude, das System zur Zeit t im Zustand |φ2 ⟩ zu finden, θ −iE+ t/ℏ θ ⟨φ2 |ψ+ ⟩ − sin e−iE− t/ℏ ⟨φ2 |ψ− ⟩] e 2 2 θ θ sin cos [e−iE+ t/ℏ − e−iE− t/ℏ ] 2 2
⟨φ2 |ψ(t)⟩ = eiφ/2 [cos = eiφ
(C-30)
408 | IV Einfache Systeme Für die Wahrscheinlichkeit 𝒫12 (t) = |⟨φ2 |ψ(t)⟩|2 selbst erhalten wir daher 1 E+ − E− sin2 θ [1 − cos ( t)] 2 ℏ E+ − E− t) = sin2 θ sin2 ( 2ℏ
𝒫12 (t) =
(C-31)
oder auch bei Berücksichtigung der Ausdrücke (C-12) und (C-13) 𝒫12 (t) =
t 4|W12 |2 sin2 [√4|W12 |2 + (E1 − E2 )2 ] 2ℏ 4|W12 |2 + (E1 − E2 )2
(C-32)
C-3-c Physikalische Diskussion Nach Gl. (C-31) oszilliert die Wahrscheinlichkeit 𝒫12 (t) zeitlich mit der Frequenz (E+ − E− /h), also mit der Bohr-Frequenz dieses Systems. Sie variiert zwischen null und dem maximalen Wert sin2 θ, den sie jeweils zu den Zeitpunkten t = (2k + 1)πℏ/(E+ − E− ), k = 0, 1, 2, . . . erreicht (Abb. 14).
Abb. 14: Zeitabhängigkeit der Wahrscheinlichkeit 𝒫12 (t), mit der man das System im Zustand |φ 2 ⟩ findet, wenn es anfänglich im Zustand |φ 1 ⟩ war. Haben die Zustände |φ 1 ⟩ und |φ 2 ⟩ dieselbe (ungestörte) Energie, so kann die Wahrscheinlichkeit den Wert eins annehmen.
Die Frequenz (E+ − E− )/h hängt ebenso wie der Maximalwert sin2 θ und 𝒫12 (t) von |W12 | und E1 − E2 ab, deren wesentliche Charakteristika wir nun beschreiben wollen. Ist E1 = E2 , so wird (E+ − E− )/h gleich 2|W12 |/h, und sin2 θ nimmt seinen größt möglichen Wert eins an: Zu den Zeitpunkten t = (2k + 1)πℏ/2|W12 | ist das (von |φ1 ⟩ ausgegangene) System im Zustand |φ2 ⟩. Somit führt jede Kopplung zwischen zwei Zu ständen derselben Energie zu einer vollständigen Oszillation des Systems von einem Zustand in den anderen; die Frequenz ist dabei zur Kopplung proportional.⁸ 8 Man findet das gleiche Phänomen auch in anderen Gebieten der Physik. Betrachten wir z. B. zwei gleiche Pendel (1) und (2) derselben Frequenz, die an derselben Halterung befestigt sind. Lenkt man zur Zeit t = 0 das Pendel (1) aus, so weiß man (s. Ergänzung HV ), dass man wegen der Kopplung über die gemeinsame Halterung nach einer bestimmten Zeit (die umso kürzer ist, je stärker die Kopplung wird) die umgekehrte Situation vorfindet: Jetzt schwingt das Pendel (2) und das Pendel (1) bleibt in Ruhe, und dies wiederholt sich immer aufs Neue.
C Systeme mit zwei Niveaus
| 409
Mit wachsender Differenz E1 − E2 nimmt auch (E+ − E− )/h zu, sin2 θ also ab. Bei ei ner schwachen Kopplung (E1 − E2 ≫ |W12 |) unterscheidet sich E+ − E− sehr wenig von E1 − E2 und sin2 θ wird sehr klein. Das ist nicht überraschend, denn bei einer schwa chen Kopplung liegt der Zustand |φ1 ⟩ sehr nahe beim Zustand |ψ+ ⟩ [s. Gl. (C-21)]: Das vom Zustand |φ1 ⟩ ausgehende System wird sich zeitlich nur sehr wenig ändern. C-3-d Ein Beispiel Wir kehren zum Beispiel des ionisierten Wasserstoffatoms zurück und nehmen an, dass das Elektron zu einem bestimmten Zeitpunkt in der Umgebung des Protons p1 lokalisiert ist, etwa im Zustand wie in Abb. 13a. Aufgrund unserer Ergebnisse wissen wir, dass das Elektron zwischen den beiden Protonen mit einer Frequenz schwingen wird, die gleich der Bohr-Frequenz der beiden stationären Molekülzustände |ψ+ ⟩ und |ψ− ⟩ ist. Dieser Oszillation zwischen den beiden in Abb. 13a und 13b veranschaulich ten Zuständen entspricht eine Oszillation des Erwartungswerts des elektrischen Di polmoments des Moleküls (das Dipolmoment ist ungleich null, wenn das Elektron bei einem der beiden Protonen lokalisiert ist und ändert sein Vorzeichen, je nachdem ob es sich um das Proton p1 oder um das Proton p2 handelt). Wir erkennen, wie ein nicht stationärer Molekülzustand zu einem oszillierenden elektrischen Dipolmoment füh ren kann. Man weiß weiter, dass durch einen solchen schwingenden Dipol ein Ener gieaustausch mit einem elektromagnetischen Feld derselben Frequenz möglich wird. Daher muss diese Frequenz im Absorptionsspektrum des H+2 -Ions auftreten. Weitere Beispiele für die Oszillation zwischen zwei Zuständen behandeln wir in den Ergänzungen FIV , GIV und HIV .
Referenzen und Literaturhinweise Stern-Gerlach-Versuch: Originalartikel (3.8); Cagnac und Pebay-Peyroula (11.2), Kap. X; Eisberg und Resnick (1.3), § 8–3; Bohm (5.1), § 22–5 und § 22–6; Frisch (3.13). Systeme mit zwei Niveaus: Feynman, Bd. 5 (1.2), Kap. 6, 10 und 11; Valentin (16.1), Anhang XII; Allen und Eberly (15.8), insbesondere Kapitel 3.
•
410 | Übersicht über die Ergänzungen zu Kapitel IV
Übersicht über die Ergänzungen zu Kapitel IV AIV Die Pauli-Matrizen BIV Diagonalisierung einer hermiteschen 2 × 2-Matrix
Diese Ergänzungen behandeln die Technik von 2 × 2-Matrizen. (einfach und für die Lösung zahlreicher quantenmechanischer Fragen wichtig)
CIV System mit zwei Niveaus. Fiktiver Spin
Ergänzung CIV ist eng mit dem Stoff aus § B und § C von Kap. IV verbunden. Sie bietet eine einfache geometrische Interpretation der Eigenschaften von Systemen mit zwei Niveaus. (einfach, jedoch für das Folgende nicht unbedingt notwendig)
DIV Systeme mit zwei Spins 1/2
Diese Ergänzung behandelt den Begriff des Tensorprodukts und die Postulate. (kann als eine Sammlung von Aufgaben mit Lösungen verstanden werden)
EIV Dichtematrix für einen Spin 1/2
Am Beispiel des Spin 1/2 werden die in Ergänzung EIII eingeführten Begriffe illustriert.
FIV Magnetische Resonanz
Mit der magnetischen Resonanz wird ein vor allem wegen seiner Anwendungen sehr wichtiges physikalisches Phänomen untersucht. (kann auch später gelesen werden)
GIV Modell des Ammoniakmoleküls
Diese Ergänzung befasst sich mit einem physikalischen System, dessen Behandlung in erster Näherung auf ein System mit zwei Niveaus zurückgeführt werden kann. (von mittlerer Schwierigkeit)
HIV Kopplung zwischen stabilem und instabilem Zustand
Untersucht wird der Einfluss einer Kopplung zwischen zwei Niveaus mit verschiedenen Lebensdauern. (einfach, benötigt aber die Begriffe aus Ergänzung KIII )
JIV
Aufgaben
Die Pauli-Matrizen |
411
•
Ergänzung AIV Die Pauli-Matrizen 1 2 3
Definition, Eigenwerte und Eigenvektoren | 411 Einfache Eigenschaften | 412 Eine zweckmäßige Basis | 413
In § A-2 von Kap. IV gaben wir die Darstellungsmatrizen der Komponenten S x , S y und S z eines Spins S in der {|+⟩, |−⟩}-Basis (den Eigenvektoren von S z ) an. In der Quanten mechanik erweist es sich nun als zweckmäßig, einen zu S proportionalen, dimensi onslosen Operator σ einzuführen. Er ist durch ℏ σ (1) 2 definiert. Die Darstellungsmatrizen seiner drei Komponenten in der {|+⟩, |−⟩}-Basis heißen die Pauli-Matrizen. S=
1 Definition, Eigenwerte und Eigenvektoren Erinnern wir uns an die Gleichungen (A-15) bis (A-17) in Kap. IV und beachten Gl. (1), so ergibt sich für die Pauli-Matrizen sofort 0 σx = ( 1
1 ) 0
σy = (
0 i
−i ) 0
σz = (
1 0
0 ) −1
(2)
Es sind hermitesche Matrizen. Die charakteristische Gleichung ist für alle drei Matri zen gleich: λ2 − 1 = 0
(3)
Die Eigenwerte von σ x , σ y und σ z sind daher λ = ±1
(4)
woraus sich für S x , S y und S z wieder die Eigenwerte ±ℏ/2 ergeben. Die Eigenwerte sind dieselben wie die von S x , S y und S z . Diese wurden in Kap. IV, § A-2 eingeführt. Mit 1 [|+⟩ ± |−⟩] √2 1 [|+⟩ ± i|−⟩] |±⟩y = √2
|±⟩x =
(5)
gilt σ x |±⟩x = ±|±⟩x σ z |±⟩ = ±|±⟩ https://doi.org/10.1515/9783110638738-037
(6)
•
412 | Ergänzung AIV
2 Einfache Eigenschaften Aus der Definition (2) folgen für die Pauli-Matrizen die folgenden Beziehungen: det(σ j ) = −1
j = x, y oder z
Tr{σ j } = 0 σ 2x
=
σ 2y
=
σ 2z
=I
(7) (8)
I ist die 2 × 2-Einheitsmatrix
σ x σ y = −σ y σ x = iσ z
(9) (10)
sowie die aus Gl. (10) durch zyklische Vertauschung von x, y und z sich ergebenden Gleichungen. Die Gleichungen (9) und (10) werden gelegentlich in der Form σ j σ k = i ∑ ε jkl σ l + δ jk I
(11)
l
zusammengefasst; darin ist ε jkl gegenüber einer Vertauschung von irgendzwei Indizes antisymmetrisch und hat den Wert
ε jkl
0 wenn die Indizes j, k, l nicht alle verschieden sind { { { = {1 wenn j, k, l eine gerade Permutation von x, y, z ist { { {−1 wenn j, k, l eine ungerade Permutation von x, y, z ist
(12)
Aus Gl. (10) folgt sofort [σ x , σ y ] = 2iσ z
(13)
und zwei weitere Beziehungen, die sich hieraus durch zyklische Vertauschung erge ben. Damit erhält man weiter [S x , S y ] = iℏS z [S y , S z ] = iℏS x
(14)
[S z , S x ] = iℏS y In Kapitel VI werden wir sehen, dass diese Zusammenhänge für einen Drehimpuls charakteristisch sind. Weiter erkennt man aus Gl. (10), dass σx σy + σy σx = 0
(15)
gilt. Man sagt, dass die Pauli-Matrizen antivertauschen. Bei Berücksichtigung von Gl. (9) ergibt sich ferner σ x σ y σ z = iI
(16)
Die Pauli-Matrizen | 413
•
Wir nennen schließlich noch eine Identität, die sich in der Quantenmechanik als nützlich erweist. Sind A und B zwei Vektoren, deren Komponenten Zahlen sind (oder aber wieder Operatoren, die jedoch mit allen anderen im zweidimensionalen Spin raum wirkenden Operatoren vertauschen), so gilt (σ ⋅ A)(σ ⋅ B) = A ⋅ BI + iσ ⋅ (A × B)
(17)
Man kann nämlich bei Beachtung von Gl. (11) und der Tatsache, dass A und B mit σ vertauschen, schreiben (σ ⋅ A)(σ ⋅ B) = ∑ σ j A j σ k B k j,k
= ∑ A j B k [i ∑ ε jkl σ l + δ jk I] j,k
l
= ∑ iσ l [∑ ε jkl A j B k ] + ∑ A j B j I l [ j,k ] j
(18)
Darin ist der Term ∑j,k ε jkl A j B k nichts anderes als die l-Komponente des Vektorpro dukts A × B und der Term ∑j A j B j gerade das Skalarprodukt A ⋅ B. Falls A und B nicht miteinander vertauschen, müssen sie auf beiden Seiten der Identität in derselben Rei henfolge stehen.
3 Eine zweckmäßige Basis Eine beliebige 2 × 2-Matrix M=(
m11 m21
m12 ) m22
(19)
kann man stets als eine Linearkombination der vier Matrizen I, σ x , σ y , σ z
(20)
schreiben. Es ist nämlich, wenn wir die Definition der Pauli-Matrizen beachten, M=
m12 + m21 m12 − m21 m11 + m22 m11 − m22 I+ σz + σx + i σy 2 2 2 2
(21)
oder abgekürzt M = a0 I + a ⋅ σ
(22)
mit den von den Matrixelementen m ij abhängenden komplexen Zahlen a0 , a x , a y und az .
•
414 | Ergänzung AIV
Vergleicht man Gl. (21) mit Gl. (22), so sieht man, dass M genau dann hermitesch ist, wenn die Koeffizienten a0 und a reell sind. Man kann sie in der Form 1 Tr{M} 2 1 a = Tr{Mσ} 2
a0 =
schreiben, wie man mit Hilfe der Beziehungen (8) bis (10) beweisen kann.
(23a) (23b)
Diagonalisierung einer hermiteschen 2 × 2-Matrix
| 415
•
Ergänzung BIV Diagonalisierung einer hermiteschen 2 × 2-Matrix 1 2 3 3-a 3-b 3-c 3-d
Einführung | 415 Wechsel des Bezugspunktes | 415 Eigenwerte und Eigenvektoren | 416 Die Winkel θ und φ | 416 Eigenwerte von K | 417 Eigenwerte von H | 417 Die normierten Eigenvektoren von H | 418
1 Einführung In der Quantenmechanik muss man sehr häufig 2 × 2-Matrizen diagonalisieren. In teressiert man sich nur für die Eigenwerte, so ist die Aufgabe einfach, weil die cha rakteristische Gleichung nur vom zweiten Grade ist. Grundsätzlich bietet auch die Er mittlung der normierten Eigenvektoren keinerlei Schwierigkeiten, doch kann man hier unter Umständen zu unnötig verwickelten Ausdrücken kommen. Wir wollen in diesem Abschnitt eine einfache, allgemeingültige Rechenmethode vorstellen. Hierzu ändern wir zunächst den Bezugspunkt für die Kennzeichnung der Eigenwerte und führen dann zwei von den Matrixelementen abhängende Winkel θ und φ ein, mit denen wir die normierten Eigenvektoren auf eine zweckmäßige Gestalt bringen können. Wie wir in der dann folgenden Ergänzung CIV sehen werden, können die beiden Winkel im Zusammenhang mit der Behandlung von Systemen mit zwei Ni veaus physikalisch interpretiert werden.
2 Wechsel des Bezugspunktes In der hermiteschen Matrix (H) = (
H11 H21
H12 ) H22
(1)
sind die Diagonalelemente H11 und H22 reell, und es gilt weiter ∗ H12 = H21
(2)
Die Matrix (H) stellt also in einer orthonormierten Basis {|φ1 ⟩, |φ2 ⟩} einen bestimmten hermiteschen Operator dar.¹
1 Wir verwenden hier den Buchstaben H für den hermiteschen Operator, weil es häufig darum geht, den Hamilton-Operator zu diagonalisieren. Die folgenden Überlegungen gelten aber für jede hermi tesche 2 × 2-Matrix. https://doi.org/10.1515/9783110638738-038
•
416 | Ergänzung BIV
Führt man die halbe Summe und die halbe Differenz der Diagonalelemente H11 und H22 ein, so kann man (H) in der Form 1 (H11 + H22 ) 2 (H) = ( 0
1 (H11 − H22 ) 2 )+( + H22 ) H21
0
1 (H11 2 schreiben. Hieraus folgt, dass der Operator H selbst in
H12
) (3) 1 − (H11 − H22 ) 2
1 1 (4) (H11 + H22 )𝟙 + (H11 − H22 )K 2 2 zerlegt werden kann, wobei 𝟙 der Einheitsoperator und K der hermitesche Operator ist, der in der {|φ1 ⟩, |φ2 ⟩}-Basis die Matrix H=
(K) = (
1 2H21 H11 − H22
2H12 H11 − H22 ) −1
(5)
zur Darstellung hat. Nach Gl. (4) haben H und K dieselben Eigenvektoren. Es seien |ψ± ⟩ diese Vekto ren, sowie E± und κ ± die zugehörigen Eigenwerte von H bzw. K: H|ψ± ⟩ = E± |ψ± ⟩
(6)
K|ψ± ⟩ = κ ± |ψ± ⟩
(7)
Aus Gl. (4) folgt sofort E± =
1 1 (H11 + H22 ) + (H11 − H22 )κ ± 2 2
(8)
Die erste Matrix auf der rechten Seite von Gl. (3) spielt eine wichtige Rolle: Wählt man für die Eigenwerte den neuen Bezugspunkt (H11 + H22 )/2, kann man sie zum Verschwinden bringen.²
3 Eigenwerte und Eigenvektoren 3-a Die Winkel θ und φ Die Winkel θ und φ werden über die Matrixelemente H ij durch die Beziehungen tan θ =
2|H21 | mit 0 ≤ θ < π H11 − H22
H21 = |H21 | eiφ
mit 0 ≤ φ < 2π
(9) (10)
2 Dieser neue Bezugspunkt ist übrigens immer derselbe, welche Basis {|φ 1 ⟩, |φ 2 ⟩} man auch zu Be ginn der Überlegungen gewählt hat. Gegenüber dem Wechsel einer orthonormierten Basis ist nämlich H 11 + H 22 = Tr{H} invariant.
Diagonalisierung einer hermiteschen 2 × 2-Matrix
|
417
•
definiert. Der Winkel φ ist das Argument der komplexen Zahl H21 . Nach Gl. (2) ist |H12 | = |H21 | und H12 = |H12 | e−iφ
(11)
Damit erhält man für die Matrix (K) 1 (K) = ( tan θ eiφ
tan θ e−iφ ) −1
(12)
3-b Eigenwerte von K Aus der charakteristischen Gleichung det [(K) − κI] = κ 2 − 1 − tan2 θ = 0
(13)
der Matrix (12) ergeben sich sofort die Eigenwerte κ + und κ − von (K): 1 cos θ 1 κ− = − cos θ κ+ = +
(14a) (14b)
Wie es sein muss, sind sie als Eigenwerte einer hermiteschen Matrix (s. Kap. II, § D-2-a) reell. Um 1/ cos θ durch die Matrixelemente H ij ausdrücken zu können, muss man nur auf Gl. (9) zurückgehen und beachten, dass cos θ und tan θ für 0 ≤ θ < π dasselbe Vorzeichen haben. Es ergibt sich √(H11 − H22 )2 + 4|H12 |2 1 = cos θ H11 − H22
(15)
3-c Eigenwerte von H Aus den Gleichungen (8), (14), und (15) erhalten wir unmittelbar 1 (H11 + H22 ) + 2 1 E− = (H11 + H22 ) − 2
E+ =
1 √(H11 − H22 )2 + 4|H12 |2 2 1 √(H11 − H22 )2 + 4|H12 |2 2
(16a) (16b)
Bemerkungen: 1. Die Eigenwerte (16a) und (16b) kann man über die charakteristische Gleichung der Matrix (H) erhalten. Wenn man sich also nur für sie interessiert, ist die Einführung der Winkel θ und φ un nötig. Dagegen werden wir sehen, dass diese Methode sich als praktisch erweist, wenn man die normierten Eigenvektoren von H braucht.
•
418 | Ergänzung BIV
2. Aus den Beziehungen (16a) und (16b) folgt E + + E − = H 11 + H 22 = Tr{H} E + E − = H 11 H 22 − |H 12 |2 = det(H)
(17) (18)
3. Damit E + = E − ist, muss (H 11 − H 22 )2 + 4|H 12 |2 = 0 sein, also H 11 = H 22 und H 12 = H 21 = 0. Eine hermitesche Matrix mit einem entarteten Spektrum ist darum notwendig zur Einheitsmatrix proportional.
3-d Die normierten Eigenvektoren von H Sind a und b die Komponenten von |ψ+ ⟩ in Bezug auf |φ1 ⟩ und |φ2 ⟩, so genügen sie nach den Gleichungen (7), (12) und (14a) der Gleichung (
1 tan θ e−iφ a a ( ) )( ) = cos θ b −1 b
1 tan θ eiφ
(19)
woraus sich (1 −
1 ) a + tan θ e−iφ b = 0 cos θ
(20)
oder auch − (sin
θ iφ/2 θ ) a + (cos e−iφ/2 ) b = 0 e 2 2
(21)
ergibt. Somit ist der normierte Eigenvektor |ψ+ ⟩ = cos
θ −iφ/2 θ |φ1 ⟩ + sin eiφ/2 |φ2 ⟩ e 2 2
(22)
Eine analoge Rechnung führt zu dem dazu orthogonalen Vektor |ψ− ⟩ = − sin
θ −iφ/2 θ e |φ1 ⟩ + cos eiφ/2 |φ2 ⟩ 2 2
(23)
Bemerkung: Während sich die trigonometrischen Funktionen für den Winkel θ verhältnismäßig einfach durch die Matrixelemente H ij ausdrücken lassen [s. z. B. Gl. (9) und Gl. (15)], ist dies für den Winkel θ/2 nicht mehr möglich. So ergeben sich in den Ausdrücken für die orthonormierten Eigenvektoren |ψ+ ⟩ und |ψ− ⟩ unbequeme Zusammenhänge, wenn man dort cos θ/2 und sin θ/2 durch ihre Ab hängigkeit von den Matrixelementen von (H) ersetzt. Darum sollte man bei Rechnungen, in denen die orthonormierten Eigenvektoren von H benötigt werden, die Funktionen cos θ/2 und sin θ/2 beibehalten. Ohnehin tritt im Endergebnis einer Rechnung oft nur die Abhängigkeit vom ganzen Winkel θ auf (s. z. B. § C-3-b von Kap. IV). Wenigstens die Zwischenrechnungen gestalten sich mit den Beziehungen (22) und (23) sehr elegant, und dies ist der eine Vorteil der hier vorgestellten Methode. Auf einen zweiten wollen wir im folgenden Abschnitt eingehen.
System mit zwei Niveaus. Fiktiver Spin
| 419
•
Ergänzung CIV System mit zwei Niveaus. Fiktiver Spin 1 2 3 3-a 3-b 3-c
Einführung | 419 Interpretation des Hamilton-Operators | 420 Interpretation der Effekte | 421 Fiktive Magnetfelder | 421 Eigenwerte und Eigenvektoren bei Kopplung | 423 Geometrische Interpretation der Übergangswahrscheinlichkeit | 423
1 Einführung Ein System besitze nur zwei Niveaus und sein Hamilton-Operator H werde in ei ner orthonormierten Basis {|φ1 ⟩, |φ2 ⟩} durch die hermitesche Matrix (H) dargestellt [s. Gl. (1) aus Ergänzung BIV ].¹ Wenn wir (H11 + H22 )/2 als neuen Ursprung für die Energie nehmen, wird die Matrix (H) = (
1 2 (H11
− H22 )
H21
H12 − 21 (H11
) − H22 )
(1)
Das betrachtete System mit den beiden einzigen Niveaus braucht nicht notwendig ein Spin-1/2-System zu sein; trotzdem kann man ihm stets einen fiktiven Spin zuord nen, wobei der zugehörige Hamilton-Operator H in der {|+⟩, |−⟩}-Basis der Eigenzu stände der z-Komponente S z dieses Spins durch dieselbe Matrix (H) dargestellt wird. (H) lässt sich dann als die Wechselwirkungsenergie dieses fiktiven Spins mit einem statischen Magnetfeld B interpretieren. Betrag und Richtung dieses „Magnetfeldes“ hängen auf sehr einfache Weise mit den Parametern zusammen, die im vorigen Ab schnitt bei der Diagonalisierung von (H) eingeführt wurden und denen man daher eine physikalische Deutung geben kann. Wenn ferner der Hamilton-Operator H als die Summe H = H0 + W von zwei Opera toren auftritt, so kann man H, H0 und W drei Magnetfelder B, B0 und b so zuordnen, dass B = B0 + b ist: Die Einführung der Kopplung W läuft darauf hinaus, dass man im Bild des fiktiven Spins das Feld b zu B0 hinzufügt. Unter diesem Gesichtspunkt lassen sich die in Kap. IV, § C untersuchten Effekte sehr einfach interpretieren.
1 Wir verwenden dieselben Bezeichnungen wie in Ergänzung BIV und Kapitel IV. https://doi.org/10.1515/9783110638738-039
•
420 | Ergänzung CIV
2 Interpretation des Hamilton-Operators In Kapitel IV hatten wir gesehen, dass der Hamilton-Operator für die Kopplung eines Spins 1/2 mit einem Magnetfeld B ̃ = −γ B ⋅ S = −γ(B x S x + B y S y + B z S z ) H
(2)
lautet. Zur Bestimmung der zu diesem Operator gehörenden Matrix genügt es, die zu S x , S y und S z gehörenden Matrizen [Kap. IV, Beziehungen (A-15) bis (A-17)] einzuset zen. Man erhält ̃ =− (H)
B x − iB y
Bz γℏ ( 2 B x + iB y
−B z
)
(3)
̃ identifizieren, so genügt es, ein „fiktives Feld“ B Will man daher die Matrix (1) mit (H) mit den Komponenten 2 Re H12 γℏ 2 Im H12 By = γℏ 1 Bz = (H22 − H11 ) γℏ
Bx = −
(4)
zu wählen. Der Betrag B⊥ der Projektion B⊥ von B auf die x, y-Ebene ist dann B⊥ =
2 ℏ
H 12 γ
(5)
Nach den Beziehungen (9) und (10) aus Ergänzung BIV sind dann die der Matrix (3) zugeordneten Winkel θ und φ gegeben durch tan θ =
|γB⊥ | −γB z
0≤θ b der chemischen Bindung, die für den Zusammenhalt des Moleküls sorgt. Mit diesem Modell gelangen wir also zu einem eindimensionalen Problem für ein Teilchen mit der fiktiven Masse m in einem Potential V(x) (man kann zeigen, dass 3mH mN die reduzierte Masse des Systems 3m ist). Welche Energieniveaus werden unter H +m N diesen Voraussetzungen von der Quantenmechanik vorausgesagt? Im Vergleich zur klassischen Mechanik können sich zwei grundsätzliche Unterschiede ergeben: 1. Die Heisenbergsche Unschärferelation verbietet dem Molekül eine Energie gleich dem Minimum Vmin des Potentials V(x). Wir haben bereits in den Ergänzungen CI und MIII gesehen, warum diese Energie größer als Vmin = 0 sein muss. 2. Klassisch ist die Potentialbarriere bei x = 0 für ein Teilchen mit einer Energie klei ner als V1 undurchdringlich: Das Stickstoffatom bleibt stets auf derselben Seite der von den Wasserstoffatomen gebildeten Ebene. Quantenmechanisch kann das Teilchen auch bei noch so geringer Energie durch diese Barriere tunneln (s. Kap. I, § D-2-c): Eine Inversion des Moleküls ist immer möglich. Die Konsequenzen dieses Effekts sollen uns im Folgenden beschäftigen. Wir sind hier nur an einer qualitativen Diskussion der physikalischen Phänomene in teressiert, weil eine quantitative Rechnung bei diesem Näherungsmodell keine größe re Bedeutung hätte. So zeigen wir nur die Existenz einer Inversionsfrequenz für das Ammoniakmolekül, ohne weder den exakten noch einen Näherungswert für sie anzu geben. Weiter wollen wir das Problem zusätzlich vereinfachen, indem wir das Poten tial V(x) durch ein Rechteckpotential ersetzen, wie es in Abb. 2 durch die gestrichelte Kurve gegeben ist [zwei unendlich hohe Potentialstufen bei x = ±(b + a/2) sowie eine um x = 0 zentrierte Potentialbarriere der Höhe V0 und der Breite (2b − a)].
•
452 | Ergänzung GIV
2 Eigenfunktionen und Eigenwerte des Hamilton-Operators 2-a Unendlich hohe Potentialbarriere Bevor wir die Eigenfunktionen und Eigenwerte des Hamilton-Operators für das Recht eckpotential aus Abb. 2 berechnen, wollen wir in einem ersten Schritt annehmen, dass die Barriere unendlich hoch ist (in diesem Fall gibt es keinen Tunneleffekt). Wir kön nen dann die Konsequenzen besser verstehen, die sich aus dem Tunneleffekt an der ̃ Barriere in Abb. 2 ergeben. Das Teilchen sei also zunächst einem Potential V(x) un terworfen, das aus zwei um x = ± b zentrierten und unendlich tiefen Töpfen mit der Breite a besteht (Abb. 3). Befindet sich das Teilchen in einem dieser Töpfe, so kann es offensichtlich nicht in den anderen gelangen.
Abb. 3: Ist die Höhe V 0 der Potentialbarriere in Abb. 2 groß, so steht sie zwei praktisch unend lich tiefen Potentialtöpfen der Breite a gegenüber, deren Mittelpunkte um 2b voneinander entfernt sind.
Beide Töpfe gleichen dem in Ergänzung HI , § 2-c-β behandelten. Wir können die Re sultate übernehmen und erhalten für die möglichen Energien En =
ℏ2 k 2n 2m
(1)
kn =
nπ a
(2)
mit
(n ist eine positive ganze Zahl). Jeder Eigenwert ist zweifach entartet, denn zu ihm gehören die beiden Wellenfunktionen 2 a a { {√ sin [k n (b + − x)] wenn b − ≤ x ≤ b + φ1n (x) = { a 2 2 { 0 sonst {
a 2
{ {√ 2 sin [k n (b + a + x)] wenn b − a ≤ −x ≤ b + φ2n (x) = { a 2 2 { 0 sonst {
(3) a 2
Modell des Ammoniakmoleküls |
•
453
Im Zustand |φ1n ⟩ befindet sich das Teilchen im rechten, im Zustand |φ2n ⟩ im linken Topf. In Abb. 4 sind die beiden ersten zweifach entarteten Energieniveaus des Moleküls aufgetragen. Wenn sein Zustand eine Überlagerung von |φ11 ⟩ und |φ21 ⟩ (bzw. von |φ12 ⟩ und |φ22 ⟩) ist, so entspricht die Bohr-Frequenz (E2 − E1 )/h (s. Ergänzung AIII , § 2-b) der Bewegung des Teilchens zwischen den Wänden des rechten (bzw. des linken) Top fes. Physikalisch repräsentiert eine derartige Schwingung eine molekulare Vibration der Ebene der drei Wasserstoffatome um die stabile Gleichgewichtslage x = +b (bzw. x = −b). Die Frequenz liegt im Infrarotbereich.
Abb. 4: Die beiden ersten Energieniveaus für die Potentialtöpfe aus Abb. 3. Die Oszilla tion des Systems in einem der beiden Töp fe mit der Bohr-Frequenz ν = (E 2 − E 1 )/h entspricht der Molekülvibration um eine der beiden klassischen Gleichgewichtslagen.
Für die folgende Rechnung ist in beiden Eigenräumen des Hamilton-Operators ein Ba siswechsel zweckmäßig. Da die Funktion V(x) gerade ist, vertauscht der HamiltonOperator H mit dem Paritätsoperator Π (s. Ergänzung FII , § 4). Darum kann man eine Basis aus Eigenfunktionen von H finden, die entweder gerade oder ungerade sind. Die zu diesen Vektoren gehörenden Wellenfunktionen sind die symmetrischen oder antisymmetrischen Linearkombinationen 1 [φ n (x) + φ2n (x)] √2 1 1 [φ n (x) − φ2n (x)] φan (x) = √2 1 φsn (x) =
(4)
In diesen Zuständen |φsn ⟩ und |φan ⟩ kann man das Teilchen in einem Topf finden. Im Folgenden befassen wir uns nur mit dem Niveau des Grundzustands, für den die Wellenfunktionen φ11 (x), φ12 (x), φ1s (x) und φ1a (x) in Abb. 5 grafisch angegeben sind.
•
454 | Ergänzung GIV
(a)
(b) Abb. 5: a) φ 11 (x) und φ 12 (x) sind stationäre Zustände derselben Energie und im rechten bzw. linken Topf lokalisiert (Abb. 3). b) Es ist zweckmäßig, als stationäre Zustände den symmetrischen φ 1s (x) und den antisymmetrischen Zustand φ 1a (x) zu nehmen.
2-b Endliche Potentialbarriere Wir untersuchen die Eigenfunktionen zu den ersten Niveaus, wenn die Höhe V0 der Potentialbarriere endlich ist (sie soll jedenfalls über diesen Niveaus liegen). Im Innern der beiden (in Abb. 2 gestrichelt gezeichneten) Potentialtöpfe ist V(x) = 0. Die Wellen funktion lautet daher { A sin [k (b + 2 − x)] χ(x) = { a { A sin [k (b + 2 + x)] a
wenn b −
a 2
≤x≤b+
wenn b −
a 2
≤ −x ≤ b +
a 2
(5) a 2
worin k mit der Energie über die Beziehung E=
ℏ2 k 2 2m
(6)
Modell des Ammoniakmoleküls | 455
•
zusammenhängt. Wieder ist χ(x) für x = ±(b + a/2) stets null, denn V(x) wird an diesen beiden Stellen unendlich groß. Dagegen verschwindet χ(x) an den Stellen x = ±(b − a/2) nicht mehr, weil V0 endlich ist. Folglich erfüllt auch k nicht länger die Beziehung (2). Da V(x) gerade ist, können wir auch diesmal die Eigenfunktionen χ s (x) und χa (x) des Hamilton-Operators suchen, die gerade bzw. ungerade sind. Bezeichnen wir die in Gl. (5) eingeführten Koeffizienten A und A mit As und As bzw. mit Aa und Aa , so ist offensichtlich As = As
(7)
Aa = −Aa
Die zu χs und χa gehörenden Eigenwerte seien Es und Ea , aus denen wir mit Gl. (6) zu den Werten k s und k a des Parameters k gelangen. Im Intervall −(b − a/2) ≤ x ≤ (b − a/2) ist die Wellenfunktion nicht wie im vorher gehenden Fall gleich null, denn V0 ist jetzt endlich: Je nachdem ob es sich um χ s oder χa handelt, muss sie eine gerade oder eine ungerade Linearkombination mit den Ex ponentialfaktoren eqs,a x und e−qs,a x sein, wobei qs und qa durch Es,a und V0 festgelegt sind. Es ist qs,a = √
2m (V0 − Es,a ) = √α 2 − k 2s,a ℏ2
(8)
α ergibt sich aus der Beziehung V0 =
ℏ2 α 2 2m
(9)
Somit lauten die Funktionen χs und χ a im Intervall −(b − a/2) ≤ x ≤ (b − a/2) χ s (x) = Bs cosh(qs x) χ a (x) = Ba sinh(qa x)
(10)
Es verbleibt das Anpassen der Eigenfunktionen und ihrer Ableitungen in den Punkten x = ±(b − a/2). Die gerade Lösung χ s (x) muss den Bedingungen a )] 2 a −As k s cos(k s a) = Bs qs sinh [qs (b − )] 2 As sin(k s a) = Bs cosh [qs (b −
(11)
genügen. As und Bs können nicht gleichzeitig null sein. Wir dividieren die beiden Glei chungen und erhalten tan(k s a) = −
ks a coth [qs (b − )] qs 2
(12)
Für die ungerade Lösung χ a (x) ergibt sich entsprechend tan(k a a) = −
ka a tanh [qa (b − )] qa 2
(13)
•
456 | Ergänzung GIV
Diese beiden Beziehungen lauten, wenn man qs und qa durch k s und k a ausdrückt, tan(k s a) = −
ks √α2 −
k 2s
coth [√α 2 − k 2s (b −
a )] 2
(14)
tanh [√α 2 − k 2a (b −
a )] 2
(15)
und tan(k a a) = −
ka √α2
−
k 2a
Damit ist das Problem grundsätzlich gelöst: Die beiden Gleichungen bringen die Quantisierung der Energie zum Ausdruck, weil sie die möglichen Werte für k s und k a und über Gl. (6) die Energien Es und Ea liefern (unter der Bedingung, dass sie unterhalb V0 liegen). Die Lösung der transzendenten Gleichungen (14) und (15) kann auf grafischem Wege erfolgen. Man erhält eine bestimmte Anzahl von Wurzeln: k 1s , k 2s , . . . , k 1a , k 2a , . . . Die Wurzel k sn ist von k an verschieden, weil die beiden Gleichun gen nicht gleich sind: Daher sind auch die Energien verschieden. Wird V0 sehr groß, so gehen natürlich k sn und k an beide gegen den Wert nπ/a, wie wir im vorangegange nen Abschnitt gefunden haben. Dies erkennt man, indem man in Gl. (14) und Gl. (15) den Parameter α gegen unendlich gehen lässt. Man bekommt dann tan(k s a) = 0, was wieder zur Beziehung (2) führt. Mit V0 → ∞ streben die Energien Esn und Ean gegen den Wert E n = ℏ2 n2 π2 /2ma2 , wie wir ihn im vorstehenden Abschnitt gefun den haben. Schließlich sieht man auch, dass sich die beiden Energien Esn und Ean mit wachsendem V0 immer näher kommen.
Abb. 6: Berücksichtigt man die endliche Höhe V 0 der Potentialbarriere, so ändert sich das Energiespektrum der Abb. 4: Jedes Niveau spaltet in zwei Niveaus auf. Der Tunneleffekt bewirkt einen Übergang von einem Topf zum anderen; die zugehörigen Bohr-Frequenzen Ω1 /2π und Ω2 /2π sind Inver sionsfrequenzen des Ammoniakmoleküls für die beiden ersten Vibrations niveaus. Im oberen Vibrationsniveau ist der Tunneleffekt bedeutsamer, so dass Ω2 > Ω1 ist.
Uns interessiert hier nicht der genaue Wert von Esn und Ean . Wir begnügen uns mit einer Skizze des Energiespektrums (Abb. 6), um zu sehen, was aus den Energieniveaus E1 und E2 in Abb. 4 wird, wenn die Potentialbarriere nur eine endliche Höhe V0 besitzt. Man erkennt, dass der Tunneleffekt an dieser Barriere die Entartung von E1 und E2 aufhebt und zu den beiden Dubletts (E1s , E1a ) und (E2s , E2a ) führt (wobei alle Energien unter V0 liegen). Das Dublett (E1s , E1a ) ist das niedrigste, so dass |E1s −E1a | < |E2s −E2a | ist. Schließlich ist der Abstand zwischen den Dubletts viel größer als die Trennung inner halb eines Dubletts (experimentell findet man einen Faktor von der Größenordnung
Modell des Ammoniakmoleküls | 457
•
tausend). Den Abständen innerhalb eines Dubletts kann man übrigens neue Bohrsche Frequenzen E1a − E1s E2 − E2s , Ω2 = a ,... ℏ ℏ zuordnen, deren physikalische Bedeutung wir im folgenden Abschnitt untersuchen werden (die zugehörigen Übergänge sind in der Abbildung durch die Doppelpfeile ge kennzeichnet). In Abb. 7 ist schließlich der Verlauf der Eigenfunktionen χ 1s (x) und χ 1a (x) skizziert, wie sie durch die Gleichungen (5), (7) und (10) gegeben sind und nachdem man k 1s und k 1a aus Gl. (14) und Gl. (15) ermittelt hat. Man erkennt, dass sie den Funktionen φ1s (x) und φ1a (x) ähnlich sind. Der wesentliche Unterschied besteht darin, dass die Wellenfunktion im Intervall −(b − a/2) ≤ x ≤ (b − a/2) nicht mehr gleich null ist. Man versteht jetzt auch das Interesse an der Einführung der Basis φ1s und φ1a : Bei Berücksichtigung des Tunneleffekts entsprechen die Eigenfunktionen χ 1s und χ 1a viel eher φ1s und φ1a als den Funktionen φ11 und φ12 . Ω1 =
Abb. 7: Die Wellenfunktionen zu den Energieniveaus E s1 und E a1 in Abb. 6. Man beachte die Ähnlichkeit mit dem Funktionsverlauf in Abb. 5b. Im Intervall −b + a/2 ≤ x ≤ b − a/2 sind sie jetzt aber ungleich null.
2-c Inversionsfrequenz Zum Anfangszeitpunkt t = 0 sei das Molekül im Zustand 1 (16) [|χ1 ⟩ + |χ 1a ⟩] |ψ(t = 0)⟩ = √2 s Den Zustandsvektor |ψ(t)⟩ zum Zeitpunkt t erhalten wir über Gl. (D-54) aus Kapitel III. Danach ist 1 1 1 −i Es +Ea t +iΩ1 t/2 1 |ψ(t)⟩ = |χ s ⟩ + e−iΩ1 t/2 |χ 1a ⟩] (17) e 2ℏ [e √2 Hieraus erhalten wir die Wahrscheinlichkeitsdichte 1 1 (18) |ψ(x, t)|2 = [χ 1s (x)]2 + [χ 1a (x)]2 + cos(Ω1 t)χ 1s (x)χ 1a (x) 2 2
•
458 | Ergänzung GIV
Die grafische Veranschaulichung ihrer Zeitabhängigkeit erhält man über die Bildkur ven in Abb. 7. Für t = 0 (Abb. 8a) entspricht dem Anfangszustand (16) eine Wahr scheinlichkeitsdichte, die im rechten Potentialtopf konzentriert ist (im linken Topf haben die Funktionen χ1s und χ1a entgegengesetztes Vorzeichen und nur wenig un terschiedliche Absolutwerte, so dass ihre Summe fast gleich null ist). Zu Beginn ist daher das Teilchen praktisch im rechten Topf, gelangt aber durch den Tunneleffekt in der Zeit t = π/2Ω1 auch in den linken Topf (Abb. 8b), so dass es zur Zeit t = π/Ω1 fast ausschließlich in diesem zu finden ist (Abb. 8c); darauf kehrt es dann seine Bewegung um (Abb. 8d und Abb. 8e).
(a)
(d)
(b)
(e)
(c) Abb. 8: Zeitliche Entwicklung eines Wellenpaketes, das aus den beiden stationären Zuständen der Abb. 7 besteht. Zu Anfang ist das Teilchen im rechten Topf (a), gelangt durch den Tunneleffekt auch in den linken (b), um nach einer bestimmten Zeit dort fast vollständig lokalisiert zu sein (c). Darauf kehrt es seine Bewegung um und erreicht schließlich wieder den rechten Topf usw.
Das fiktive Teilchen bewegt sich also mit der Frequenz Ω1 /2π von der einen Seite der Potentialbarriere auf die andere. Dies heißt aber nichts anderes, als dass das Stick stoffatom von der einen Seite der Ebene mit den Wasserstoffatomen auf die andere wechselt. Daher nennt man die Frequenz Ω1 /2π die Inversionsfrequenz des Moleküls. Da diese Frequenz wesentlich mit dem Tunneleffekt für das fiktive Teilchen zusam menhängt, gibt es für sie kein klassisches Analogon. Das Stickstoffatom wirkt auf die Wasserstoffelektronen anziehend. Deshalb be sitzt das Ammoniakmolekül ein elektrisches Dipolmoment, das zum Erwartungs wert ⟨X⟩ der Lage des fiktiven Teilchens proportional ist und sich (s. Abb. 8) peri
Modell des Ammoniakmoleküls | 459
•
odisch mit der Zeit ändert. Unter diesen Umständen vermag das Ammoniakmolekül elektromagnetische Strahlung der Frequenz Ω1 /2π zu emittieren oder zu absorbie ren. Experimentell wird dies bestätigt; der Wert von Ω1 fällt in den Bereich der Zen timeterwellen. In der Radioastronomie beobachtet man die Emission und Absorpti on elektromagnetischer Wellen durch die Ammoniakmoleküle des interstellaren Rau mes. Auch das Prinzip des Ammoniakmasers beruht auf der stimulierten Emission dieser Wellen durch das NH3 -Molekül.
3 Das Ammoniakmolekül als Zwei-Niveau-System Wie wir in Abb. 6 sehen können, haben wir es beim NH3 -Molekül mit einer Situation zu tun, wie wir sie in der Einführung zu § C von Kapitel IV angesprochen haben: Das System besitzt zwei unmittelbar benachbarte Niveaus E1s und E1a , die von den anderen Niveaus E2s , E2a , . . . weit entfernt sind. Falls man sich nur für die beiden Niveaus E1s und E1a interessiert, so kann man die anderen „vergessen“ (eine genaue Rechtfertigung für dieses Vorgehen werden wir in Kapitel XI im Rahmen der Störungstheorie geben). Wir wollen daher unsere Überlegungen aus Kapitel IV unter einem leicht verän derten Gesichtspunkt wieder aufgreifen und zeigen, dass die allgemeinen Ergebnisse über Systeme mit zwei Niveaus auch auf das Ammoniakmolekül übertragen werden können. Dies erlaubt uns dann auch, auf sehr einfache Weise den Einfluss eines zeit lich konstanten äußeren elektrischen Feldes auf dieses Molekül zu behandeln.
3-a Zustandsraum Der Zustandsraum wird von den beiden orthogonalen Vektoren |φ11 ⟩ und |φ12 ⟩ aufge spannt; die zugehörigen Wellenfunktionen sind durch Gl. (3) gegeben. Die anderen Zustände |φ1n ⟩ und |φ2n ⟩ für n > 1 berücksichtigen wir nicht. In den Zuständen |φ11 ⟩ und |φ12 ⟩ ist das Stickstoffatom entweder oberhalb oder unterhalb der von den Was serstoffatomen gebildeten Ebene. Mit (4) führten wir eine zweite orthonormierte Basis des Zustandsraums ein, die von dem geraden und dem ungeraden Vektor 1 [|φ1 ⟩ + |φ12 ⟩] √2 1 1 [|φ1 ⟩ − |φ12 ⟩] |φ1a ⟩ = √2 1 |φ1s ⟩ =
(19)
gebildet wird. Für diese beiden Zustände ist die Wahrscheinlichkeit, das Stickstoff atom oberhalb bzw. unterhalb der Ebene der Wasserstoffatome zu finden, dieselbe.
•
460 | Ergänzung GIV
3-b Energieniveaus und Aufhebung der Entartung Ist die Potentialbarriere unendlich hoch, so haben die Zustände |φ11 ⟩ und |φ12 ⟩ diesel be Energie (wie übrigens auch die Zustände |φ1s ⟩ und |φ1a ⟩), so dass der Hamilton-Ope rator H0 lautet H0 = E1 𝟙
(20)
(mit 𝟙 als dem Einheitsoperator im zweidimensionalen Zustandsraum). Um phänomenologisch zu berücksichtigen, dass die Barriere nicht unendlich hoch ist, fügen wir zu H0 eine Störung W hinzu, die in der {|φ11 ⟩, |φ12 ⟩}-Basis durch die Matrix 0 W = −A ( 1
1 ) 0
(21)
mit einem reellen und positiven Koeffizienten A dargestellt wird.² Zur Ermittlung der stationären Zustände des Moleküls müssen wir den GesamtHamilton-Operator H = H0 + W mit der Matrix H=(
E1
−A
−A
E1
)
(22)
diagonalisieren. Eine elementare Rechnung liefert die Eigenwerte und die Eigenvek toren von H: E1 + A
mit dem Eigenket |φ1a ⟩
E1 − A
mit dem Eigenket |φ1s ⟩
(23)
Wir sehen, dass die beiden (für A = 0 entarteten) Niveaus unter dem Einfluss der Störung W aufspalten. Es tritt ein Energieunterschied von der Größe 2A auf, und die neuen Eigenzustände sind |φ1s ⟩ und |φ1a ⟩. Dies ist das Resultat aus § 2. Ist das Molekül zu Anfang im Zustand |φ11 ⟩, |ψ(t = 0)⟩ = |φ11 ⟩ =
1 [|φ1 ⟩ + |φ1a ⟩] √2 s
(24)
so lautet der Zustandsvektor zum Zeitpunkt t 1 −iE1 t/ℏ iAt/ℏ 1 [e |φs ⟩ + e−iAt/ℏ|φ1a ⟩] e √2 At At = e−iE1 t/ℏ [cos ( ) |φ11 ⟩ + i sin ( ) |φ12 ⟩] ℏ ℏ
|ψ(t)⟩ =
(25)
2 Die Voraussetzung A > 0 ist erforderlich, damit wir wieder die relative Lage der Energieniveaus E 1s und E 1a in Abb. 6 erhalten [s. die Eigenwerte (23)].
Modell des Ammoniakmoleküls |
•
461
Führen wir zu diesem Zeitpunkt eine Messung durch, so ist die Wahrscheinlichkeit, das Molekül im Zustand |φ11 ⟩ zu finden (das Stickstoffatom also oberhalb der Ebene der Wasserstoffatome), gleich cos2 (At/ℏ) und die Wahrscheinlichkeit, es im Zustand |φ12 ⟩ (also das Stickstoffatom unterhalb der Ebene) zu finden, gleich sin2 (At/ℏ). Wie der ergibt sich die periodische Inversion des Ammoniakmoleküls. Bemerkung: Die (phänomenologische) Beschreibung der Wirkung einer endlich hohen Potentialbarriere durch eine Störung von der Form (21) ist weniger genau als die Behandlung im vorangegangenen Ab schnitt, weil wir hier Eigenfunktionen φ 1s (x) und φ 1a (x) erhalten, die im Unterschied zu χ 1s und χ 1a im Intervall (−b + a/2) ≤ x ≤ (b − a/2) verschwinden. Sie ist aber sehr viel einfacher und erklärt trotzdem die beiden wesentlichen physikalischen Effekte, nämlich die Aufhebung der Entartung des Niveaus E 1 und die Oszillation des Moleküls zwischen den Zuständen |φ 11 ⟩ und |φ 12 ⟩.
3-c Einfluss eines statischen elektrischen Feldes Wir hatten gesehen, dass das elektrische Dipolmoment des Moleküls in den beiden Zuständen |φ11 ⟩ und |φ12 ⟩ zwei entgegengesetzte Werte annimmt; wir bezeichnen sie mit +η und −η. Ist D die zu dieser physikalischen Größe gehörende Observable, so kann man sie in der {|φ11⟩, |φ12 ⟩}-Basis durch eine Diagonalmatrix mit den Eigenwerten +η und −η darstellen: D=(
η 0
0 ) −η
(26)
Gelangt das Molekül in ein statisches elektrisches Feld ℰ³, so lautet die Wechselwir kungsenergie W (ℰ) = −ℰD
(27)
Dieser Anteil des Hamilton-Operators⁴ wird in der {|φ11 ⟩, |φ12 ⟩}-Basis durch die Matrix 1 W (ℰ) = −ηℰ ( 0
0 ) −1
(28)
dargestellt. Die Matrix des Gesamt-Hamilton-Operators H0 + W + W (ℰ) ist daher H0 + W + W (ℰ) = (
E1 − η ℰ −A
−A ) E1 + η ℰ
(29)
3 Zur Vereinfachung soll dieses Feld parallel zur x-Achse in Abb. 1 gerichtet sein (eindimensionales Modell). 4 In W (ℰ) ist D eine Observable, ℰ jedoch eine von außen angreifende klassische Größe.
•
462 | Ergänzung GIV
Sie kann leicht diagonalisiert werden. Ihre Eigenwerte sind E+ = E1 + √A2 + η2 ℰ 2 E− = E1 − √A2 + η2 ℰ 2
(30)
und ihre Eigenvektoren θ θ |ψ+ ⟩ = cos |φ11 ⟩ − sin |φ12 ⟩ 2 2
(31)
θ θ |ψ− ⟩ = sin |φ11 ⟩ + cos |φ12 ⟩ 2 2 hierbei haben wir tan θ = −
A 0≤θ
ℏ γ1 4
(19)
so erhält man bei Berücksichtigung von Gl. (12) sofort 2 ℏ k 1 = −k 2 = √|W12 |2 − ( γ1 ) 4
(20)
und die Eigenwerte sind 2 ℏ ℏ ε1 = E1 + √|W12 |2 − ( γ1 ) − i γ1 4 4
(21)
2 ℏ ℏ ε2 = E1 − √|W12 |2 − ( γ1 ) − i γ1 4 4
Der Imaginärteil ist bei beiden Eigenwerten gleich, nur die Realteile unterscheiden sich. Somit haben die Zustände |ψ1 ⟩ und |ψ2 ⟩ dieselbe Lebensdauer 2τ1 , aber ver schiedene Energien. Setzen wir Gl. (20) in Gl. (18) ein, so erhält man |W12 |2
𝒫21 (t) = |W12
|2
2 ℏ − ( γ1 ) 4
2 t ℏ e−γ1 t/2 sin2 (√|W12 |2 − ( γ1 ) ) 4 ℏ
(22)
Kopplung zwischen stabilem und instabilem Zustand | 469
•
Dieses Ergebnis erinnert in seiner Form an die Gl. (C-32) aus Kapitel IV. Die Funktion 𝒫21 (t) stellt eine Sinusschwingung dar, die mit der Zeitkonstanten 2τ1 gedämpft ist (Abb. 1). Die Bedingung (19) drückt nämlich aus, dass die Kopplung stark genug ist, um das System zwischen den Zuständen |φ1 ⟩ und |φ2 ⟩ oszillieren zu lassen, bevor es die Instabilität des Zustands |φ1 ⟩ spüren kann.
Abb. 1: Starke Kopplung zwischen einem stabilen Zu stand |φ 2 ⟩ und einem instabilen Zustand |φ 1 ⟩: Ist das System zu Anfang im Zustand |φ 2 ⟩, so zeigt die Wahr scheinlichkeit 𝒫21 (t), es zur Zeit t im Zustand |φ 1 ⟩ zu finden, die Form einer gedämpften Sinusschwingung.
2. Ist |W12 |
T null und wachse für 0 ≤ t ≤ T linear an (T ist ein gegebener Parameter mit der Dimension einer Zeit). Man zeige, dass der Zustandsvektor zur Zeit t in der Form |ψ(t)⟩ =
1 iθ(t) [e |+⟩ + ie−iθ(t)|−⟩] √2
mit einer reellwertigen Funktion θ(t) geschrieben werden kann. Man bestimme diese Funktion. c) Zu einem Zeitpunkt t = τ > T misst man S y . Mit welchen Wahrscheinlichkeiten kann man welche Ergebnisse finden? Welcher Zusammenhang muss zwischen ω0 und T bestehen, damit ein Resultat sicher ist? Physikalische Deutung?
https://doi.org/10.1515/9783110638738-045
•
472 | Ergänzung JIV
3. Ein Spin 1/2 befinde sich in einem Magnetfeld mit den Komponenten Bx =
1 B0 , √2
By = 0 ,
Bz =
1 B0 √2
Wir verwenden wieder die Bezeichnungen aus Aufgabe 1. a) Wie lautet die Matrix, die in der {|+⟩, |−⟩}-Basis den Hamilton-Operator H des Sys tems darstellt? b) Man berechne die Eigenwerte und Eigenvektoren von H. c) Zur Zeit t = 0 befinde sich das System im Zustand |−⟩. Welche Werte kann man mit welchen Wahrscheinlichkeiten bei einer Energiemessung finden? d) Man berechne den Zustandsvektor |ψ(t)⟩ zur Zeit t. Man misst zu diesem Zeit punkt S x . Man bestimme den Erwartungswert der möglichen Ergebnisse. Geome trische Deutung? 4. Man betrachte die in Kap. IV, § B-2-b (Abb. 8) beschriebene Versuchsanordnung: Ein Strahl aus Atomen mit dem Spin 1/2 durchquert zunächst einen „Polarisator“ in einer Richtung, die in der x, z-Ebene mit der z-Achse den Winkel θ einschließt, um dann einen „Analysator“ zu passieren, der die z-Komponente S z des Spins misst. Zwischen dem Polarisator und dem Analysator wirke auf den Atomstrahl über eine Länge L und in x-Richtung ein homogenes Magnetfeld B0 . Die Geschwindigkeit der Atome sei v und die Zeit, in der das Feld auf sie wirkt, T = L/v. Man setze ferner ω0 = −γ B0 . a) Wie lautet der Zustandsvektor |ψ1 ⟩ eines Spins beim Eintritt in den Analysator? b) Man zeige, dass bei einer Messung im Analysator die Wahrscheinlichkeit für den Wert +ℏ/2 gleich (1 + cos θ cos ω0 T)/2 und für −ℏ/2 gleich (1 − cos θ cos ω0 T)/2 ist. Physikalische Deutung? c) (Für diese und die nächste Frage wird der Begriff des Dichteoperators benötigt, Er gänzung EIII ; empfohlen wird auch die Kenntnis von Ergänzung EIV ). Man zeige, dass in der {|+⟩, |−⟩}-Basis die Dichtematrix ρ 1 eines in den Analysator eintreten den Spins gleich ρ1 =
1 + cos θ cos ω0 T 1 ( 2 sin θ − i cos θ sin ω0 T
sin θ + i cos θ sin ω0 T 1 − cos θ cos ω0 T
)
ist. Man berechne Tr{ρ 1 S x }, Tr{ρ 1 S y } und Tr{ρ 1 S z }. Deutung? Beschreibt der Dich teoperator einen reinen Zustand? d) Die Geschwindigkeit v eines Atoms sei jetzt zufallsverteilt, so dass die Zeit T nur mit der Genauigkeit ∆T bekannt ist. Weiter sei der Betrag B0 des Feldes so groß, dass ω0 ∆T ≫ 1; ω0 T kann dann alle Werte zwischen 0 und 2π (modulo 2π) an nehmen, und zwar mit derselben Wahrscheinlichkeit. Wie lautet in diesem Fall der Dichteoperator ρ2 für ein Atom im Augenblick sei nes Eintritts in den Analysator? Beschreibt ρ 2 einen reinen Fall? Man berechne
Aufgaben | 473
•
Tr{ρ 2 S x }, Tr{ρ 2 S y } und Tr{ρ 2 S z }. Deutung? In welchem Fall beschreibt der Dichte operator einen vollständig polarisierten Spin, in welchem einen vollständig un polarisierten? Man beschreibe qualitativ die Vorgänge am Ausgang des Analysators, wenn man ω0 von null bis zu einem Wert ändert, für den ω0 ∆T ≫ 1 ist. 5. Entwicklungsoperator für einen Spin 1/2 Ein System mit dem Spin 1/2 und dem magnetischen Moment M = γ S bewegt sich in einem Magnetfeld B0 mit den Komponenten B x = −ω x /γ ,
B y = −ω y /γ ,
B z = −ω z /γ
Man setze ω0 = −γ |B0 | a) Man zeige, dass mit dem Operator M=
1 1 [ω x S x + ω y S y + ω z S z ] = [ω x σ x + ω y σ y + ω z σ z ] ℏ 2
(σ x , σ y und σ z sind die Pauli-Matrizen, s. Ergänzung AIV ) der Entwicklungsopera tor dieses Spins die folgende Form hat: U(t, 0) = e−iMt Man berechne die Matrix von M in der von den Eigenvektoren von S z aufgespann ten Basis {|+⟩, |−⟩}. Man zeige, dass M2 =
1 2 ω0 2 [ω x + ω2y + ω2z ] = ( ) 4 2
b) Man bringe den Entwicklungsoperator auf die Form U(t, 0) = cos (
ω0 t 2i ω0 t M sin ( )− ) 2 ω0 2
c) Zur Zeit t = 0 sei das System im Spinzustand |ψ(0)⟩ = |+⟩. Man zeige, dass die Wahrscheinlichkeit, es zur Zeit t im Zustand |+⟩ zu finden, 𝒫++ (t) = |⟨+|U(t, 0)|+⟩|2 ist, und verifiziere die Beziehung 𝒫++ (t) = 1 −
ω2x + ω2y ω20
Geometrische Deutung?
sin2 (
ω0 t ) 2
•
474 | Ergänzung JIV
6. Ein System bestehe aus zwei 1/2-Spins S1 und S2 . Die vier in Ergänzung DIV defi nierten Vektoren |±, ±⟩ bilden eine Basis. Zu Beginn sei das System im Zustand |ψ(0)⟩ =
1 1 1 | + +⟩ + | + −⟩ + | − −⟩ 2 2 √2
a) Man misst zur Zeit t = 0 die Spinkomponente S1z . Mit welcher Wahrscheinlichkeit ergibt sich der Wert −ℏ/2? Wie lautet der Zustandsvektor nach dieser Messung? Mit welchen Wahrscheinlichkeiten erhält man welche Resultate, wenn man dar auf S1x misst? Man beantworte die gleichen Fragen für den Wert +ℏ/2 und eine Messung von S1z . b) Das System sei wieder im Zustand |ψ(0)⟩ und man misst gleichzeitig S1z und S2z . Mit welcher Wahrscheinlichkeit erhält man entgegengesetzte, mit welcher identi sche Ergebnisse? c) Statt der vorstehenden Messungen überlässt man das System einer Entwicklung unter dem Einfluss des Hamilton-Operators H = ω1 S1z + ω2 S2z Wie lautet der Zustandsvektor |ψ(t)⟩ zur Zeit t? Für diesen Zeitpunkt berechne man die Erwartungswerte ⟨S1 ⟩ und ⟨S2 ⟩. Physikalische Interpretation? d) Man zeige, dass die Beträge der Vektoren ⟨S1 ⟩ und ⟨S2 ⟩ kleiner als ℏ/2 sind. Wie müsste der Ausdruck für |ψ(0)⟩ lauten, damit beide den Betrag +ℏ/2 haben? 7. Für dasselbe System wie in der vorangegangenen Aufgabe sei der Zustandsraum durch die vier Vektoren |±, ±⟩ aufgespannt. a) Man schreibe die 4 × 4-Matrix an, die in dieser Basis den Operator S1y darstellt. Welche Eigenwerte und welche Eigenvektoren besitzt diese Matrix? b) Der normierte Zustand des Systems laute |ψ⟩ = α| + +⟩ + β| + −⟩ + γ| − +⟩ + δ| − −⟩ mit gegebenen komplexen Koeffizienten α, β, γ und δ. Man misst gleichzeitig S1x und S2y . Mit welchen Wahrscheinlichkeiten erhält man welche Ergebnisse? Was wird aus diesen Wahrscheinlichkeiten, wenn |ψ⟩ das tensorielle Produkt eines Vektors aus dem Zustandsraum des ersten mit einem Vektor aus dem Zustands raum des zweiten Spins ist? c) Man beantworte die gleichen Fragen, wenn S1y und S2y gemessen werden. d) Statt der vorstehenden Messungen beobachtet man nur S2y . Von den Ergebnissen unter b), danach unter c) ausgehend, berechne man die Wahrscheinlichkeit dafür, dass der Wert −ℏ/2 gemessen wird.
Aufgaben | 475
•
8. Man betrachte ein Elektron in einem linearen Molekül, das aus drei äquidistanten Atomen gebildet wird. Mit |φA ⟩, |φB ⟩ und |φC ⟩ bezeichnen wir die drei orthonormier ten Zustände dieses Elektrons, die zu den drei um die Kerne der Atome A, B und C lokalisierten Wellenfunktionen gehören. Im Folgenden beschränke man sich auf den von |φA ⟩, |φB ⟩ und |φC ⟩ aufgespannten Zustandsraum. Vernachlässigt man die Möglichkeit, dass das Elektron von einem Kern zum an deren zu wechseln vermag, so kann es durch den Hamilton-Operator H0 beschrieben werden, der als Eigenzustand die drei Vektoren |φA ⟩, |φB ⟩ und |φC ⟩ zum selben Ei genwert E0 zulässt. Durch einen zusätzlichen Hamilton-Operator W wird die Kopp lung dieser drei Zustände beschrieben. Er ist (mit einer reellen positiven Konstante a) durch die Gleichungen definiert W|φA ⟩ = −a|φB ⟩ W|φB ⟩ = −a|φA ⟩ − a|φC ⟩ W|φC ⟩ = −a|φB ⟩ a) Man berechne die Energien und die stationären Zustände des Hamilton-Operators H = H0 + W. b) Für t = 0 sei das Elektron im Zustand |φA ⟩. Man beschreibe qualitativ die Lokali sierung des Elektrons zu späteren Zeiten. Gibt es Zeiten, in denen es vollständig um das Atom A, um B oder um C lokalisiert ist? c) Es sei D die Observable mit den Eigenzuständen |φA ⟩, |φB ⟩ und |φC ⟩ zu den Ei genwerten −d, 0 und +d. Man misst D zum Zeitpunkt t. Mit welchen Wahrschein lichkeiten kann man welche Werte finden? d) Welche Bohr-Frequenzen können bei einem beliebigen Anfangszustand des Elek trons in der Entwicklung von ⟨D⟩ auftreten? Man gebe der Observablen D eine physikalische Deutung. Bei welchen Frequenzen werden vom Molekül elektroma gnetische Wellen absorbiert oder emittiert? 9. Ein Molekül bestehe aus sechs identischen und in einem regelmäßigen Sechseck angeordneten Atomen A1 , A2 , . . . , A6 . Man betrachte ein Elektron, das bei jedem Atom lokalisiert sein kann. Mit |φ n ⟩ (n = 1, 2, . . . , 6) bezeichnen wir den Zustand, in dem das Elektron beim n-ten Atom lokalisiert ist. Weiter beschränken wir uns auf den von diesen sechs (orthonormierten) Vektoren aufgespannten Zustandsraum.
•
476 | Ergänzung JIV
a) Ein Operator R werde durch die Beziehungen definiert R|φ1 ⟩ = |φ2 ⟩ ; R|φ2 ⟩ = |φ3 ⟩ ; . . . ; R|φ6 ⟩ = |φ1 ⟩ Man ermittle die Eigenwerte und Eigenzustände von R. Man zeige, dass die Eigen vektoren von R eine Basis im Zustandsraum bilden. b) Bei Vernachlässigung der Möglichkeit, dass das Elektron von einem Platz zum nächsten gelangen kann, wird seine Energie durch einen Hamilton-Operator H0 beschrieben, bei dem die sechs Zustände |φ n ⟩ Eigenzustände zum selben Eigen wert E0 sind. Der Wechsel von einem Atom zum anderen wird wie in Aufgabe 8 durch Einführung einer Störung W erfasst, die man durch W|φ1 ⟩ = −a|φ6 ⟩ − a|φ2 ⟩ ; W|φ2 ⟩ = −a|φ1 ⟩ − a|φ3 ⟩ ; . . . ; W|φ6 ⟩ = −a|φ5 ⟩ − a|φ1 ⟩ definiert. Man zeige, dass R mit dem Gesamt-Hamilton-Operator H = H0 + W ver tauscht. Hieraus leite man die Eigenzustände und Eigenwerte von H her. Ist das Elektron in diesen Eigenzuständen lokalisiert? Man wende diese Überlegungen auf das Benzolmolekül an.
Referenzen Aufgabe 9: Feynman, Bd. 5 (1.2), § 15–4.
V Der harmonische Oszillator A A-1 A-2 A-3 B B-1 B-2 B-3 C C-1 C-2 D D-1 D-2 D-3
Einführung | 477 Bedeutung des harmonischen Oszillators | 477 Klassischer harmonischer Oszillator | 479 Allgemeine Eigenschaften des Hamilton-Operators | 481 Eigenwerte des Hamilton-Operators | 482 Bezeichnungen | 483 Das Spektrum | 485 Entartung der Eigenwerte | 489 Eigenzustände des Hamilton-Operators | 490 {|φ n ⟩}-Darstellung | 490 Wellenfunktionen zu den stationären Zuständen | 494 Physikalische Diskussion | 497 Erwartungswert und Standardabweichung von X und P | 497 Eigenschaften des Grundzustands | 499 Entwicklung der Erwartungswerte | 501
A Einführung A-1 Bedeutung des harmonischen Oszillators In diesem Kapitel befassen wir uns mit dem eindimensionalen harmonischen Oszilla tor, einem physikalischen System, das in der Physik besondere Bedeutung hat. Das einfachste Beispiel für ein solches System ist ein Teilchen mit der Masse m, das sich in einem nur von der Koordinate x abhängenden Potential V(x) =
1 2 kx 2
(A-1)
bewegt (k ist eine reelle positive Konstante). Das Teilchen wird mit einer Kraft Fx = −
dV = −kx dx
(A-2)
zur Ebene x = 0 hingezogen (Minimum von V(x), stabile Gleichgewichtslage). Man weiß, dass in der klassischen Mechanik die Projektion der Teilchenbewegung auf die x-Achse eine Sinusschwingung mit der Frequenz ω=√
k m
(A-3)
um die Gleichgewichtslage x = 0 darstellt. Die Bewegung vieler Systeme wird (zumindest näherungsweise) durch die Glei chungen für den harmonischen Oszillator beschrieben. Untersucht man nämlich das Verhalten eines Systems in der Nähe seiner stabilen Gleichgewichtslage, so wird man https://doi.org/10.1515/9783110638738-046
478 | V Der harmonische Oszillator
zu Gleichungen geführt, die für den Grenzfall kleiner Schwingungen mit denen eines harmonischen Oszillators übereinstimmen (s. § A-2). Daher können wir die Resultate, zu denen wir in diesem Kapitel gelangen werden, auf eine ganze Reihe physikalisch wichtiger Phänomene anwenden. Wir nennen z. B. die Schwingungen von Atomen, die diese in einem Molekül um ihre Gleichgewichtslage ausführen, oder die Schwin gungen von Atomen oder Ionen in einem Kristallgitter (Phononen).¹ Der harmonische Oszillator spielt auch bei der Behandlung elektromagnetischer Felder eine Rolle. So weiß man, dass in einem Strahlungshohlraum unendlich viele stationäre Wellen (die Eigenmoden) möglich sind. Das elektromagnetische Feld kann nach den Moden entwickelt werden. Setzt man diese Entwicklung in die Maxwell schen Gleichungen ein, so ergeben sich für die Entwicklungskoeffizienten Differen tialgleichungen, die mit der Bewegungsgleichung des harmonischen Oszillators iden tisch sind. Man kann daher das Feld formal als ein Ensemble unabhängiger harmoni scher Oszillatoren ansehen (s. Ergänzung KV ). Die Feldquantisierung geschieht dann einfach dadurch, dass man die zu Eigenmoden des Hohlraums gehörenden Oszillato ren quantisiert. In diesem Zusammenhang erinnern wir daran, dass Max Planck die nach ihm benannte Konstante zum ersten Mal in die Physik einführte, als er das Ver halten dieser Oszillatoren im thermischen Gleichgewicht (Strahlung Schwarzer Kör per) zu erklären versuchte. In Ergänzung LV werden wir nämlich sehen, dass im ther mischen Gleichgewicht bei der Temperatur T die mittlere Energie eines klassischen harmonischen Oszillators von der eines quantenmechanischen Oszillators verschie den ist. Weiter hat der harmonische Oszillator bei der Beschreibung eines Systems iden tischer Teilchen, die sich alle im selben Zustand befinden, Bedeutung (dabei kann es sich nur um Bosonen handeln, s. Kapitel XIV). Das hat seinen Grund darin, dass die Energieniveaus eines harmonischen Oszillators äquidistant sind, wobei der Abstand benachbarter Niveaus gleich ℏω ist. Man kann dann dem durch die ganze Zahl n ge kennzeichneten Niveau (das also mit dem Abstand nℏω über dem Grundniveau liegt) ein Ensemble von n identischen Teilchen oder Quanten zuordnen, von denen jedes die Energie ℏω besitzt. Dem Übergang des Oszillators vom Niveau n zum Niveau n + 1 bzw. n − 1 entspricht die Erzeugung bzw. Vernichtung eines Quants der Energie ℏω. Zur Beschreibung derartiger Übergänge werden wir die Operatoren a† und a einfüh ren. Diese Erzeugungs- bzw. Vernichtungsoperatoren treten gewöhnlich in der statis tischen Quantenmechanik und in der Quantenfeldtheorie auf.² In physikalischer Hinsicht ist daher eine detaillierte Behandlung des harmoni schen Oszillators in der Quantenmechanik ganz besonders wichtig. Darüber hinaus
1 In Ergänzung AV werden einige Beispiele qualitativ untersucht. 2 Die Quantenfeldtheorie beschreibt die Wechselwirkung von Teilchen, vor allem die von Elektronen, Positronen und Photonen, im relativistischen Bereich. Dabei können die Operatoren für die Erzeugung oder Vernichtung von Teilchen eine wichtige Rolle spielen, weil man derartige Prozesse experimentell beobachtet (Absorption und Emission von Photonen, Paarerzeugung usw.).
A Einführung | 479
handelt es sich bei ihm um ein Quantensystem, für das die Schrödinger-Gleichung in Strenge lösbar ist. Nach der Untersuchung eines Systems mit dem Spin 1/2 und der Zwei-Niveau-Systeme lernen wir somit ein weiteres Beispiel kennen, mit dem wir den allgemeinen Formalismus der Quantenmechanik illustrieren können. So werden wir insbesondere zeigen, wie man eine Eigenwertgleichung unter der ausschließlichen Verwendung von Operatoren und auf der Basis der Vertauschungsrelationen lösen kann (diese Methode werden wir auch beim Drehimpuls anwenden, s. Kapitel VI). Schließlich gehen wir auf die Bewegung von Wellenpaketen, vor allem für den (qua si)klassischen Grenzfall, im Einzelnen ein (s. Ergänzung GV ). In § A-2 erinnern wir an einige Aussagen über den klassischen Oszillator, bevor wir in § A-3 auf bestimmte allgemeine Eigenschaften der Eigenwerte des HamiltonOperators eingehen. Darauf bestimmen wir in § B und § C diese Eigenwerte und die zugehörigen Eigenvektoren, indem wir die Erzeugungs- und Vernichtungsoperatoren einführen und ausschließlich von den Folgerungen ausgehen, die sich aus der (kano nischen) Vertauschungsrelation [X, P] = iℏ und aus der Form des Hamilton-Opera tors H ergeben. In § D befassen wir uns mit den stationären Zuständen des Oszillators und mit Wellenpaketen, die aus diesen Zuständen gebildet werden.
A-2 Klassischer harmonischer Oszillator Der Verlauf der potentiellen Energie V(x) [Gl. (A-1)] ist in Abb. 1 wiedergegeben.
Abb. 1: Potentielle Energie V(x) eines eindimensionalen harmonischen Oszillators. Die Amplitude einer klassischen Bewegung mit der Energie E ist xM .
Die Bewegungsgleichung für das Teilchen lautet m
dV d2 x = −kx =− 2 dx dt
(A-4)
Die allgemeine Lösung dieser Gleichung kann in der Form x = xM cos(ωt − φ)
(A-5)
480 | V Der harmonische Oszillator
geschrieben werden, wobei die Frequenz durch Gl. (A-3) definiert wird und xM und φ Integrationskonstanten sind, die durch die Anfangsbedingungen festgelegt werden. Das Teilchen wird also zu einer harmonischen Schwingung um den Punkt O mit der Amplitude xM und der (Kreis-)Frequenz ω angeregt. Die kinetische Energie des Teilchens ist T=
p2 dx 2 1 m( ) = 2 dt 2m
(A-6)
mit dem Teilchenimpuls p = m ddxt . Somit ist die Gesamtenergie E=T+V =
p2 1 + mω2 x2 2m 2
(A-7)
Setzt man hier die Lösung (A-5) ein, so erhält man E=
1 mω2 x2M 2
(A-8)
Die Energie des Teilchens ist unabhängig von der Zeit (eine allgemeine Eigenschaft konservativer Systeme) und kann jeden nichtnegativen Wert annehmen, weil xM be liebig gewählt werden kann. Gibt man die Gesamtenergie E vor, so erhält man für die klassische Bewegung die größten Auslenkungen x = ± xM , wenn man in Abb. 1 die Parabel und die Parallele zur x-Achse mit der Ordinate E zum Schnitt bringt. In diesen Punkten ist die potentielle Energie am größten und gleich E, während die kinetische Energie gleich null ist. Für x = 0 dagegen ist die potentielle Energie null und die kinetische Energie maximal. Bemerkung: Wir betrachten ein Potential V(x), das im Punkt x = x 0 ein Minimum aufweist, sonst aber beliebig ist (Abb. 2). Wir entwickeln die Funktion V(x) an der Stelle x = x0 in eine Taylor-Reihe: V(x) = a + b(x − x0 )2 + c(x − x 0 )3 + . . .
(A-9)
Darin sind die Koeffizienten a = V(x0 )b =
1 d2 V 1 d3 V ) c= ) ( ( 2 dx 2 x=x0 3! dx 3 x=x0
(A-10)
Der in (x − x0 ) lineare Term verschwindet, weil V(x) für x 0 ein Minimum besitzt. Für die Kraft gilt dann in der Umgebung von x0 Fx = −
dV = −2b(x − x 0 ) − 3c(x − x 0 )2 + . . . dx
(A-11)
Der Koeffizient b ist positiv, weil V(x) an der Stelle x 0 ein Minimum hat. Dieser Punkt x = x0 gehört zu einer stabilen Gleichgewichtslage des Teilchens: F x ist für x = x 0 null; ferner haben F x und (x − x 0 ) für genügend kleines (x − x 0 ) entgegengesetztes Vorzeichen (b ist positiv).
A Einführung |
481
Abb. 2: Jedes Potential V(x) kann an der Stelle x = x0 seines Minimums durch ein parabelförmi ges Potential (gestrichelte Kurve) approximiert werden. Ein klassisches Teilchen mit der Energie E schwingt zwischen den Punkten x1 und x2 .
Haben die Bewegungen des Teilchens um x 0 eine so kleine Amplitude, dass man in Gl. (A-9) den Term mit (x − x0 )3 [und folglich in Gl. (A-11) den Term mit (x − x 0 )2 ] vernachlässigen kann, so hat man es mit einem harmonischen Oszillator zu tun, weil die Bewegungsgleichung jetzt nähe rungsweise lautet m
d2 x ≈ −2b(x − x 0 ) dt2
(A-12)
Die zugehörige Frequenz ω hängt mit der zweiten Ableitung von V(x) an der Stelle x = x 0 über die Beziehung ω=√
2b 1 d2 V =√ ( 2) m m dx x=x0
(A-13)
zusammen. Die Energie dieses harmonischen Oszillators ist sicher gering, weil die Amplitude klein bleiben muss. Für höhere Energien E wird das Teilchen zu einer periodischen Bewegung zwischen den Stel len x1 und x 2 (s. Abb. 2) angeregt, doch ist diese nicht mehr sinusförmig. Entwickelt man die Funktion x(t), die die Lage des Teilchens zum Zeitpunkt t angibt, in eine Fourier-Reihe, so erhält man mehrere sinusförmige Terme, deren Frequenzen das Vielfache einer Grundfrequenz sind. Man spricht dann von einem anharmonischen Oszillator. Übrigens ist in diesem Fall die Periode im Allgemeinen von 2π/ω [Gl. (A-13)] verschieden.
A-3 Allgemeine Eigenschaften des Hamilton-Operators In der Quantenmechanik werden die klassischen Größen x und p durch die Observa blen X und P ersetzt. Diese genügen der Vertauschungsrelation [X, P] = iℏ
(A-14)
Aus Gl. (A-7) schließt man sofort auf den Hamilton-Operator. Er lautet H=
1 P2 + mω2 X 2 2m 2
(A-15)
482 | V Der harmonische Oszillator
und ist zeitunabhängig (konservatives System). Die quantenmechanische Behand lung des harmonischen Oszillators führt also auf die Lösung der Eigenwertgleichung H|φ⟩ = E|φ⟩
(A-16)
In der Ortsdarstellung ist das die Differentialgleichung [−
ℏ2 d2 1 + mω2 x2 ] φ(x) = Eφ(x) 2m dx2 2
(A-17)
Bevor wir Gl. (A-16) im Detail untersuchen, nennen wir einige wichtige Eigenschaften, die sich aus der Form (A-1) des Potentials ergeben: 1. Die Eigenwerte des Hamilton-Operators sind positiv. Man kann nämlich allgemein zeigen (s. Ergänzung MIII ): Ist die Potentialfunktion V(x) nach unten beschränkt, P2 + V(X) größer als das so sind die Eigenwerte E des Hamilton-Operators H = 2m Minimum von V(x): V(x) ≥ Vm
2.
erzwingt
E > Vm
In unserem Fall wählten wir den Energieursprung so, dass Vm gleich null ist. Die Eigenfunktionen von H haben eine wohlbestimmte Parität. Das ergibt sich daraus, dass das Potential V(x) eine gerade Funktion ist: V(−x) = V(x)
3.
(A-18)
(A-19)
Man kann darum (s. Ergänzungen FII und CV ) die Eigenfunktionen von H in der Ortsdarstellung unter den Funktionen mit bestimmter Parität suchen. (Wie wir sehen werden, sind die Eigenwerte von H nicht entartet. Darum sind die zu den stationären Zuständen gehörenden Wellenfunktionen notwendig gerade oder un gerade.) Das Energiespektrum ist diskret. Die klassische Bewegung des Teilchens ist für je den Wert der Gesamtenergie auf einen endlichen Bereich der x-Achse beschränkt (Abb. 1). Für diesen Fall kann man aber zeigen (s. Ergänzung MIII ), dass die Eigen werte des Hamilton-Operators eine diskrete Menge bilden.
In den folgenden Abschnitten werden sich diese Eigenschaften (in einer genaueren Form) wieder ergeben. Hier erhielten wir sie, indem wir einfach allgemeine Sätze über eindimensionale Probleme auf den harmonischen Oszillator übertrugen.
B Eigenwerte des Hamilton-Operators Wir untersuchen jetzt die Eigenwertgleichung (A-16). Als Erstes ermitteln wir das Spek trum des Hamilton-Operators (A-15), indem wir nur die Vertauschungsrelation (A-14) verwenden.
B Eigenwerte des Hamilton-Operators
| 483
B-1 Bezeichnungen ̂ B-1-a Die Operatoren X̂ und P Die Observablen X und P sind offensichtlich mit einer Dimension behaftet (einer Län ge bzw. eines Impulses). Weil ω die Dimension 1/Zeit und ℏ die einer Wirkung (Energie mal Zeit) hat, kann man zu Operatoren mit der Dimension eins übergehen: ̂ = √ mω X X ℏ 1 ̂= P P √mℏω
(B-1)
Für diese Operatoren lautet die Vertauschungsrelation ̂ P] ̂ =i [X,
(B-2)
während der Hamilton-Operator die Form ̂ H = ℏω H
(B-3)
mit ̂2) ̂2 + P ̂ = 1 (X H 2 annimmt. Wir suchen daher nach den Lösungen der Eigenwertgleichung ̂ iν ⟩ = ε ν |φ iν ⟩ H|φ
(B-4)
(B-5)
̂ und ε ν die Dimension eins besitzen. Zunächst kann der Index ν eine diskrete worin H oder eine kontinuierliche Menge bezeichnen; der weitere Index i erlaubt gegebenen falls die Unterscheidung der orthogonalen Eigenvektoren, die zum selben Eigenwert ε ν gehören. B-1-b Die Operatoren a, a† und N ̂ und P ̂ Zahlen und keine Operatoren, so könnte man die in Gl. (B-4) auftre Wären X ̂ − iP)( ̂ X ̂ + iP). ̂ Weil aber tende Summe als ein Produkt aus Linearfaktoren schreiben: (X 2 2 ̂ ̂ ̂ ̂ X und P Operatoren sind, die nicht vertauschen, ist der Ausdruck X + P nicht gleich ̂ − iP)( ̂ X ̂ + i P). ̂ Nun werden wir jedoch zeigen, dass wir mit der Einführung von Ope (X ̂ + iP ̂ und X ̂ − iP ̂ proportional sind, die Suche nach den Eigenwerten ratoren, die zu X ̂ von H beträchtlich vereinfachen können. Wir setzen³ 1 ̂ ̂ a= (X + i P) (B-6a) √2 1 ̂ ̂ (X − i P) (B-6b) a† = √2 3 Bis jetzt haben wir Operatoren mit Großbuchstaben bezeichnet. Es ist jedoch allgemein üblich, für die folgenden Operatoren kleine Buchstaben zu verwenden.
484 | V Der harmonische Oszillator
Stellen wir diese Gleichungen um, so erhalten wir ̂ = 1 (a† + a) X √2 ̂ = i (a† − a) P √2
(B-7a) (B-7b)
̂ und P ̂ sind hermitesch. a und a† sind dies wegen des Faktors i nicht, dafür sind sie X aber zueinander adjungiert. Bilden wir für a und a† den Kommutator, so erhalten wir mit den Gleichun gen (B-6) und (B-2) 1 ̂ ̂ X ̂ − iP] ̂ [X + iP, 2 i ̂ ̂ i ̂ ̂ = [P, X] − [X, P] 2 2
[a, a† ] =
(B-8)
d. h. [a, a† ] = 1
(B-9)
Diese Beziehung ist zur Vertauschungsrelation (A-14) äquivalent. Wir verschaffen uns schließlich einige Zusammenhänge, die wir im Folgenden be nötigen. Zunächst berechnen wir a† a: 1 ̂ ̂ X ̂ + iP) ̂ (X − i P)( 2 1 ̂ 2 ̂2 ̂ ̂ ̂ ̂ + P + iX P − iP X) = (X 2 1 ̂ 2 ̂2 + P − 1) = (X 2
a† a =
(B-10)
Ein Vergleich mit dem Ausdruck (B-4) liefert ̂ − iP)( ̂ X ̂ + iP) ̂ +1 ̂ = a† a + 1 = 1 (X H 2 2 2
(B-11)
̂ nicht in ein Produkt aus Li Im Unterschied zur klassischen Mechanik kann man H ̂ und P ̂ führt auf der rechten nearfaktoren zerlegen. Die Nichtvertauschbarkeit von X Seite zu einem zusätzlichen Term 1/2. Man kann ebenso zeigen, dass ̂ = aa† − 1 H 2
(B-12)
ist. Wir führen nun den Operator N = a† a
(B-13)
ein. Er ist hermitesch, weil N † = a† (a† )† = a† a = N
(B-14)
B Eigenwerte des Hamilton-Operators
| 485
ist. Weiter ist wegen Gl. (B-11) ̂=N+1 H 2
(B-15)
̂ auch Eigenvektoren von N und umgekehrt sind. so dass die Eigenvektoren von H Wir berechnen zum Schluss die Kommutatoren von N mit a und a† : [N, a] = [a† a, a] = a† [a, a] + [a† , a]a = −a [N, a† ] = [a† a, a† ] = a† [a, a† ] + [a† , a† ]a = a†
(B-16)
d. h. [N, a] = −a †
[N, a ] = a
†
(B-17a) (B-17b)
Die folgende Behandlung des harmonischen Oszillators basiert auf der Verwen dung der Operatoren a, a† und N. In gewisser Weise haben wir die Eigenwertgleichung von H, die wir zunächst in der Form (B-5) angeschrieben hatten, durch die Eigenwert gleichung für den Operator N ersetzt: N|φ iν ⟩ = ν|φ iν ⟩
(B-18)
Haben wir diese Gleichung gelöst, so wissen wir, dass der Eigenvektor |φ iν ⟩ von N auch Eigenvektor von H zum Eigenwert E ν = (ν + 1/2)ℏω [Gleichungen (B-3) und (B-15)] ist: H|φ iν ⟩ = (ν + 1/2)ℏω|φ iν ⟩
(B-19)
Zur Lösung von Gl. (B-18) gehen wir von der Vertauschungsrelation (B-9), die zur Re lation (A-14) äquivalent ist, und von den Beziehungen (B-17) aus, die sich daraus als Folgerungen ergeben.
B-2 Das Spektrum B-2-a Lemmata α Lemma I (Eigenschaft der Eigenwerte von N) Die Eigenwerte ν des Operators N sind positiv oder null. Denn für einen beliebigen Eigenvektor |φ iν ⟩ von N ist das Quadrat der Norm des Vektors a|φ iν ⟩ nichtnegativ: 2 a|φ iν ⟩ = ⟨φ iν |a† a|φ iν ⟩ ≥ 0
(B-20)
Mit der Definition (B-13) für N wird ⟨φ iν |a† a|φ iν ⟩ = ⟨φ iν |N|φ iν ⟩ = ν⟨φ iν |φ iν ⟩
(B-21)
Weil aber ⟨φ iν |φ iν ⟩ positiv ist, zeigt der Vergleich von Gl. (B-20) und Gl. (B-21), dass ν≥0
(B-22)
486 | V Der harmonische Oszillator β Lemma II (Eigenschaften des Vektors a|φ iν ⟩) Es sei |φ iν ⟩ ein (nichtverschwindender) Eigenvektor von N zum Eigenwert ν. 1. Ist ν = 0, so ist der Ketvektor a|φ iν=0 ⟩ gleich null. 2. Ist ν > 0, so ist der Ketvektor a|φ iν ⟩ ein nichtverschwindender Eigenvektor von N zum Eigenwert ν − 1. Zum Beweis: 1. Nach Gl. (B-21) ist das Quadrat der Norm von a|φ iν ⟩ gleich null, wenn ν = 0 ist. Nun ist die Norm eines Vektors dann und nur dann null, wenn dieser Vektor der Nullvektor ist. Ist daher ν = 0 Eigenwert von N, so erfüllen alle Eigenvektoren |φ0i ⟩ zu diesem Eigenwert die Gleichung a|φ0i ⟩ = 0
(B-23)
Man kann übrigens zeigen, dass die Gleichung für diese Eigenvektoren charakte ristisch ist. Betrachten wir hierzu einen Vektor |φ⟩, der der Gleichung a|φ⟩ = 0
(B-24)
genügt. Multiplizieren wir beide Seiten dieser Gleichung von links mit a† , so er halten wir a† a|φ⟩ = N|φ⟩ = 0
2.
(B-25)
Jeder Vektor, der die Beziehung (B-24) erfüllt, ist darum Eigenvektor von N zum Eigenwert ν = 0. Es sei jetzt ν streng positiv. Nach Gl. (B-21) ist dann der Vektor a|φ iν ⟩ ungleich dem Nullvektor, weil das Quadrat seiner Norm von null verschieden ist. Wir zeigen, dass a|φ iν ⟩ Eigenvektor von N ist. Hierzu wenden wir die Operatorglei chung (B-17a) auf den Vektor |φ iν ⟩ an: [N, a]|φ iν ⟩ = −a|φ iν ⟩ Na|φ iν ⟩ = aN|φ iν ⟩ − a|φ iν ⟩ =
aν|φ iν ⟩
−
(B-26)
a|φ iν ⟩
also ist N[a|φ iν ⟩] = (ν − 1)[a|φ iν ⟩]
(B-27)
womit wir gezeigt haben, dass a|φ iν ⟩ Eigenvektor von N zum Eigenwert ν − 1 ist. γ Lemma III (Eigenschaften des Vektors a† |φ iν ⟩) Es sei |φ iν ⟩ ein (nichtverschwindender) Eigenvektor von N zum Eigenwert ν. 1. a† |φ iν ⟩ ist stets ungleich null. 2. a† |φ iν ⟩ ist Eigenvektor von N zum Eigenwert ν + 1.
B Eigenwerte des Hamilton-Operators
|
487
Zum Beweis: 1. Mit Gl. (B-9) und Gl. (B-13) kann man die Norm des Vektors a† |φ iν ⟩ berechnen: † i 2 a |φ ν ⟩ = ⟨φ iν |aa† |φ iν ⟩ = ⟨φ iν |(N + 1)|φ iν ⟩ = (ν + 1)⟨φ iν |φ iν ⟩
2.
(B-28)
Weil nach Lemma I ν positiv oder null ist, ist die Norm des Ketvektors a† |φ iν ⟩ stets von null verschieden und darum dieser Vektor nie gleich dem Nullvektor. Der Beweis verläuft wie bei Lemma II. Es genügt, von der Operatorgleichung (B-17b) auszugehen. Man erhält [N, a† ]|φ iν ⟩ = a† |φ iν ⟩ Na† |φ iν ⟩ = a† N|φ iν ⟩ + a† |φ iν ⟩ = (ν + 1)a† |φ iν ⟩
(B-29)
B-2-b Spektrum von N Gegeben sei ein beliebiger Eigenwert ν von N und ein nichtverschwindender Eigen vektor |φ iν ⟩ zu diesem Eigenwert. Nach Lemma I ist ν notwendig positiv oder null. Wir zeigen zunächst, dass die Annahme, ν sei keine ganze Zahl, im Widerspruch zu Lemma I steht. Ist nämlich ν nicht ganzzahlig, so kann man stets eine ganze Zahl n ≥ 0 finden, so dass n < ν < n+1
(B-30)
ist. Wir betrachten dann die Folge der Vektoren |φ iν ⟩, a|φ iν ⟩, . . . , a n |φ iν ⟩
(B-31)
Nach Lemma II ist jeder Vektor a p |φ iν ⟩ (mit 0 ≤ p ≤ n) dieser Folge ungleich null und Eigenvektor von N zum Eigenwert ν − p (s. Abb. 3). Der Beweis erfolgt schrittweise: |φ iν ⟩ ist nach Voraussetzung nicht der Nullvektor, a|φ iν ⟩ ist ungleich null (weil ν > 0) und gehört zum Eigenwert ν − 1 von N, . . . ; a p |φ iν ⟩ ergibt sich durch die Wirkung von a auf a p−1 |φ iν ⟩, dem Eigenvektor von N zum positiven Eigenwert ν − p + 1, denn es ist p ≤ n und ν > n [s. Gl. B-30)].
Abb. 3: Die wiederholte Wirkung des Operators a auf den Ketvektor |φ iν ⟩ ergibt die Eigenvektoren von N zu den Eigenwerten ν − 1, ν − 2, . . .
488 | V Der harmonische Oszillator Lassen wir jetzt den Operator a auf den Ket a n |φ iν ⟩, einem Eigenvektor von N zum Eigenwert ν − n > 0, wirken. Weil nach Gl. (B-30) ν − n > 0 ist, liefert das einen nichtverschwindenden Vektor (Lemma II); weiter ist (immer nach Lemma II) a n+1 |φ iν ⟩ Eigenvektor von N zum Eigenwert ν − n − 1, der nach Gl. (B-30) negativ ist. Wäre ν nicht ganzzahlig, so könnten wir einen nichtverschwindenden Eigenvektor von N zu einem (streng) negativen Eigenwert konstruieren. Weil dies aber nach Lemma I nicht möglich ist, muss die Annahme eines nichtganzzahligen ν verworfen werden. Was geschieht, wenn ν=n
(B-32)
mit einer nichtnegativen ganzen Zahl n ist? In der Vektorfolge (B-31) ist a n |φ in ⟩ ver schieden vom Nullvektor und Eigenvektor von N zum Eigenwert 0. Nach Lemma II ist dann a n+1 |φ in ⟩ = 0
(B-33)
Für ganzzahliges n ist daher die Folge der Vektoren, die man durch wiederholte An wendung des Operators a auf |φ in ⟩ erhält, beschränkt; zu einem negativen Eigenwert von N kann man also nie einen vom Nullvektor verschiedenen Eigenvektor erhalten. Folglich kann ν nur eine nichtnegative ganze Zahl n sein. Mit Lemma III kann man zeigen, dass das Spektrum von N alle nichtnegativen ganzen Zahlen enthält. Wir haben eben einen Eigenvektor von N zum Eigenwert null konstruiert (a n |φ in ⟩). Lässt man auf einen solchen Vektor den Operator (a† )k wirken, so erhält man einen Eigenvektor von N zum Eigenwert k, wobei k beliebig positiv ganz ist. Man gelangt mit Berücksichtigung von Gl. (B-19) zu dem Schluss, dass die Eigen werte von H von der Form E n = (n +
1 ) ℏω 2
(B-34)
mit n = 0, 1, 2, . . . sind. In der Quantenmechanik ist daher die Energie des harmoni schen Oszillators quantisiert und kann nicht jeden beliebigen Wert annehmen. Weiter stellen wir fest, dass der kleinstmögliche Wert (das Grundniveau) nicht gleich null ist, sondern den Wert ℏω/2 hat (s. § D-2). B-2-c Interpretation der Operatoren a und a† Von einem Eigenvektor |φ in ⟩ von H zum Eigenwert E n = (n + 1/2)ℏω gelangt man durch Anwendung des Operators a auf einen Eigenvektor zum Eigenwert E n−1 = (n + 1/2)ℏω − ℏω; die Anwendung von a† liefert einen Eigenvektor zum Eigenwert E n+1 = (n + 1/2)ℏω + ℏω. Aus diesem Grund nennt man a einen Vernichtungsoperator und a† einen Erzeugungsoperator: Ihre Anwendung auf einen Eigenvektor von N lässt ein Energiequant ℏω verschwinden oder umgekehrt entstehen.
B Eigenwerte des Hamilton-Operators
| 489
B-3 Entartung der Eigenwerte Wir wollen zeigen, dass die Energieniveaus (B-34) des eindimensionalen harmoni schen Oszillators nichtentartet sind. B-3-a Das Grundniveau ist nichtentartet Alle Eigenzustände von H zum Eigenwert E0 = ℏω/2, d. h. die Eigenzustände von N zum Eigenwert n = 0 müssen nach Lemma II die Gleichung a|φ0i ⟩ = 0
(B-35)
erfüllen. Zur Bestimmung der Entartung des Niveaus E0 genügt es daher, die Anzahl der linear unabhängigen Ketvektoren zu ermitteln, für die diese Gleichung richtig ist. Mit der Definition (B-6a) von a und den Beziehungen (B-1) kann man Gl. (B-35) auf die Form 1 mω i P] |φ0i ⟩ = 0 X+ [√ ℏ √2 √mℏω
(B-36)
bringen. In der Ortsdarstellung lautet sie (
mω d x+ ) φ0i (x) = 0 ℏ dx
(B-37)
worin φ0i (x) = ⟨x|φ0i ⟩
(B-38)
Die allgemeine Lösung dieser Differentialgleichung erster Ordnung ist 1
φ0i (x) = c e− 2
mω ℏ
x2
(B-39)
mit der Integrationskonstanten c. Die Lösungen von Gl. (B-37) sind also zueinander proportional. Darum existiert (von einem Faktor abgesehen) nur ein Ketvektor |φ0 ⟩, der Gl. (B-35) erfüllt: Das Grundniveau E0 = ℏω/2 ist nichtentartet. B-3-b Kein Niveau ist entartet Durch Rekursion beweisen wir, dass auch alle anderen Niveaus nichtentartet sind. Hierzu genügt es zu zeigen, dass das Niveau E n+1 = (n + 1 + 1/2)ℏω nichtentartet ist, wenn sein Vorgänger E n = (n + 1/2)ℏω nichtentartet ist. Wir nehmen somit an, dass (bis auf einen Faktor) genau ein Ketvektor |φ n ⟩ existiert, für den N|φ n ⟩ = n|φ n ⟩
(B-40)
gilt. Wir betrachten nun einen Eigenvektor |φ in+1 ⟩ zum Eigenwert n + 1: N|φ in+1 ⟩ = (n + 1)|φ in+1 ⟩
(B-41)
490 | V Der harmonische Oszillator Wir wissen, dass der Ketvektor a|φ in+1 ⟩ nicht null und Eigenvektor von N zum Eigen wert n ist (s. Lemma II). Weil dieser nach Voraussetzung nichtentartet ist, gibt es eine Zahl c i , so dass a|φ in+1 ⟩ = c i |φ n ⟩
(B-42)
Wendet man auf die beiden Seiten dieser Gleichung den Erzeugungsoperator a† an, a† a|φ in+1 ⟩ = c i a† |φ n ⟩
(B-43)
so wird mit Berücksichtigung von Gl. (B-13) und Gl. (B-41) |φ in+1 ⟩ =
ci † a |φ n ⟩ n+1
(B-44)
Nun ist aber a† |φ n ⟩ Eigenvektor von N zum Eigenwert (n + 1); somit sind alle Ket vektoren |φ in+1 ⟩ zum Eigenwert (n + 1) proportional zu a† |φ n ⟩, also auch zueinander proportional: Der Eigenwert (n + 1) ist nichtentartet. Weil schließlich der Eigenwert n = 0 nichtentartet ist, sind dies auch die Eigen werte n = 1, 2, . . . : Kein Eigenwert von N und daher auch kein Eigenwert von H ist entartet. Wir können also den Eigenvektor von H zum Eigenwert E n = (n + 1/2)ℏω einfach mit |φ n ⟩ bezeichnen.
C Eigenzustände des Hamilton-Operators Wir untersuchen jetzt die grundsätzlichen Eigenschaften des Operators N und des Ha milton-Operators H.
C-1 {|φ n ⟩}-Darstellung Wir setzen voraus, dass die Operatoren N und H Observable sind, ihre Eigenvektoren also im Zustandsraum Hx für ein Teilchen und für ein eindimensionales Problem eine Basis bilden (wir könnten dies über die weiter unten angegebenen Wellenfunktionen beweisen, die zu den Eigenvektoren von N gehören). Weil kein Eigenwert von N (bzw. H) entartet ist (s. § B-3), bilden N (bzw. H) für sich einen vollständigen Satz kommu tierender Observabler in Hx . C-1-a Basisvektoren in Abhängigkeit von |φ0 ⟩ Für den Vektor |φ0 ⟩ ∈ Hx zum Eigenwert n = 0 von N gilt a|φ0 ⟩ = 0
(C-1)
Er ist bis auf einen Faktor bestimmt. Nehmen wir |φ0 ⟩ als normiert an, so reduziert sich die Unbestimmtheit auf einen globalen Phasenfaktor eiθ (θ reell).
C Eigenzustände des Hamilton-Operators
| 491
Nach Lemma III aus § B-2-a ist der zu n = 1 gehörende Vektor |φ1 ⟩ zu a† |φ0 ⟩ proportional: |φ1 ⟩ = c1 a† |φ0 ⟩
(C-2)
Wir bestimmen c1 , indem wir |φ1 ⟩ normieren und die Phase von |φ1 ⟩ (in Bezug auf |φ0 ⟩) so wählen, dass c1 reell und positiv ist. Nach Gl. (C-2) gilt für das Quadrat der Norm von |φ1 ⟩ ⟨φ1 |φ1 ⟩ = |c1 |2 ⟨φ0 |aa† |φ0 ⟩ = |c1 |2 ⟨φ0 |(a† a + 1)|φ0 ⟩
(C-3)
wobei wir Gl. (B-9) verwendet haben. Weil |φ0 ⟩ normierter Eigenvektor von N = a† a zum Eigenwert null ist, finden wir ⟨φ1 |φ1 ⟩ = |c1 |2 = 1
(C-4)
Mit unserer Phasenvereinbarung ist c1 = 1 und folglich |φ1 ⟩ = a† |φ0 ⟩
(C-5)
Den Vektor |φ2 ⟩ kann man aus |φ1 ⟩ ebenso konstruieren: |φ2 ⟩ = c2 a† |φ1 ⟩
(C-6)
Wir verlangen, dass |φ2 ⟩ normiert ist und wählen seine Phase so, dass c2 reell und positiv ist: ⟨φ2 |φ2 ⟩ = |c2 |2 ⟨φ1 |aa† |φ1 ⟩ = |c2 |2 ⟨φ1 |(a† a + 1)|φ1 ⟩ = 2|c2 |2 = 1
(C-7)
Somit ist |φ2 ⟩ =
1 † 1 † 2 a |φ1 ⟩ = (a ) |φ0 ⟩ √2 √2
(C-8)
wenn man Gl. (C-5) berücksichtigt. Dieses Vorgehen lässt sich leicht verallgemeinern. Kennt man den (normierten) Vektor |φ n−1 ⟩, so lautet der normierte Vektor |φ n ⟩ = c n a† |φ n−1 ⟩
(C-9)
Weil ⟨φ n |φ n ⟩ = |c n |2 ⟨φ n−1 |aa† |φ n−1 ⟩ = n|c n |2 = 1
(C-10)
492 | V Der harmonische Oszillator
ist, wählt man mit denselben Phasenvereinbarungen wie oben cn =
1 √n
(C-11)
Auf diese Weise kann man von |φ0 ⟩ ausgehend alle Vektoren |φ n ⟩ erhalten: 1 † a |φ n−1 ⟩ = √n 1 1 ⋅⋅⋅ = √n √n − 1
|φ n ⟩ =
1 1 (a† )2 |φ n−2 ⟩ = ⋅ ⋅ ⋅ √n √n − 1 1 † n (a ) |φ0 ⟩ √2
(C-12)
oder |φ n ⟩ =
1 (a† )n |φ0 ⟩ √n!
(C-13)
C-1-b Orthonormierungsbedingungen und Vollständigkeitsrelation Weil der Hamilton-Operator H hermitesch ist, sind die Ketvektoren zu verschiedenen n orthogonal. Da sie überdies normiert sind, erfüllen sie die Orthonormierungsbedin gungen ⟨φ n |φ n ⟩ = δ nn
(C-14)
Andererseits ist H eine Observable (wie wir hier ohne Beweis voraussetzen). Die Men ge der |φ n ⟩ bildet daher eine Basis in Hx und es gilt die Vollständigkeitsrelation ∑ |φ n ⟩⟨φ n | = 1
(C-15)
n
Bemerkung: Über den Ausdruck (C-13) kann man direkt beweisen, dass die Vektoren |φ n ⟩ orthonormiert sind. Zunächst ist ⟨φ n |φ n ⟩ =
1 ⟨φ 0 |a n a†n |φ 0 ⟩ √ n!n !
(C-16)
Nun gilt aber
a n a†n |φ 0 ⟩ = a n = an
−1
(aa† )a†n−1 |φ 0 ⟩
−1
(a† a + 1)a†n−1 |φ 0 ⟩
= n an
−1
a†n−1 |φ 0 ⟩
(C-17)
(a†n−1 |φ 0 ⟩ ist Eigenzustand von N = a† a zum Eigenwert n − 1). Verringert man so schrittweise die Exponenten von a und a† , so ergibt sich schließlich
⟨φ 0 |a n a†n |φ 0 ⟩ = n × (n − 1) × ⋅ ⋅ ⋅ × 2 × 1⟨φ 0 |a n n †n
−n
|φ 0 ⟩ † n−n
⟨φ 0 |a a |φ 0 ⟩ = n × (n − 1) × ⋅ ⋅ ⋅ × (n − n + 1)⟨φ 0 |(a ) n †n
⟨φ 0 |a a |φ 0 ⟩ = n × (n − 1) × ⋅ ⋅ ⋅ × 2 × 1 ⟨φ 0 |φ 0 ⟩
für n < n
(C-18a)
|φ 0 ⟩ für n > n
(C-18b)
für n = n
(C-18c)
C Eigenzustände des Hamilton-Operators
| 493
Der Ausdruck (C-18a) ist null, weil a|φ 0 ⟩ = 0 ist. Auch der Ausdruck (C-18b) verschwindet, weil wir ⟨φ 0 |(a† )n−n |φ 0 ⟩ als das Skalarprodukt von |φ 0 ⟩ mit dem Bravektor zu a n−n |φ 0 ⟩ auffassen können; dieser ist aber für n > n null. Setzt man zuletzt Gl. (C-18c) in Gl. (C-16) ein, so sieht man, dass ⟨φ n |φ n ⟩ = 1 ist.
C-1-c Wirkung verschiedener Operatoren Die Observablen X und P sind Linearkombinationen der Operatoren a und a† [Glei chungen (B-1) und (B-7)]. Folglich können sämtliche physikalische Größen als Funk tionen von a und a† ausgedrückt werden. Nun wissen wir (und werden dies auch prä zisieren), dass die Wirkung von a und a† auf die Vektoren |φ n ⟩ besonders einfach ist. Aus diesem Grund ist man in vielen Fällen daran interessiert, die Matrixelemente und Erwartungswerte der verschiedenen Observablen in der {|φ n ⟩}-Darstellung zu berech nen. Mit der oben eingeführten Phasenwahl ist die Wirkung der Operatoren a und a† auf die Vektoren der Basis {|φ n ⟩} gegeben durch a† |φ n ⟩ = √n + 1 |φ n+1 ⟩ a|φ n ⟩ = √n |φ n−1 ⟩
(C-19a) (C-19b)
Die erste Gleichung haben wir bereits bewiesen: Man muss nur in Gl. (C-9) und Gl. (C-11) n durch n + 1 ersetzen. Um Gl. (C-19b) zu erhalten, multiplizieren wir beide Seiten von Gl. (C-9) von links mit dem Operator a und berücksichtigen Gl. (C-11). Dann wird 1 1 † a|φ n ⟩ = aa† |φ n−1 ⟩ = (a a + 1)|φ n−1 ⟩ = √n|φ n−1 ⟩ (C-20) √n √n Bemerkung: Die zu Gl. (C-19a) und Gl. (C-19b) adjungierten Beziehungen sind ⟨φ n |a = √n + 1⟨φ n+1 | †
⟨φ n |a = √n⟨φ n−1 |
(C-21a) (C-21b)
Man beachte, dass a den Wert n um eins verringert oder erhöht, je nachdem ob er auf den Ket vektor |φ n ⟩ oder auf den Bravektor ⟨φ n | wirkt. Entsprechend erhöht oder erniedrigt a† den Wert von n um eins, je nachdem ob er auf den Ketvektor |φ n ⟩ oder auf den Bravektor ⟨φ n | wirkt.
Geht man von den Gleichungen Gl. (C-19a) und Gl. (C-19b) aus und verwendet die Glei chungen (B-1) und (B-7), so ergeben sich die Ausdrücke für X|φ n ⟩ und P|φ n ⟩ unmittel bar: X|φ n ⟩ = √
ℏ 1 † ℏ [√ n + 1|φ n+1 ⟩ + √n|φ n−1 ⟩] (a + a)|φ n ⟩ = √ mω √2 2mω
P|φ n ⟩ = √mℏω
mℏω i [√n + 1|φ n+1 ⟩ − √n|φ n−1 ⟩] (a† − a)|φ n ⟩ = i√ 2 √2
(C-22a) (C-22b)
494 | V Der harmonische Oszillator Damit sind dann die Matrixelemente der Operatoren a, a† , X und P in der {|φ n ⟩}-Dar stellung ⟨φ n |a|φ n ⟩ = √nδ n ,n−1
(C-23a)
⟨φ n |a† |φ n ⟩ = √n + 1δ n ,n+1 ⟨φ n |X|φ n ⟩ = √
(C-23b)
ℏ √ [ n + 1δ n ,n+1 + √nδ n ,n−1 ] 2mω
(C-23c)
mℏω √ [ n + 1δ n ,n+1 − √nδ n ,n−1 ] 2
(C-23d)
⟨φ n |P|φ n ⟩ = i√
Die Darstellungsmatrizen von a und a† sind zueinander hermitesch konjugiert. Sie lauten 0 0 (0 ( (a) = ( ( ... ( 0 .. (. 0 √1 (0 ( (0 † (a ) = ( ( . ( .. ( 0 .. ( .
√1 0 0 .. . 0 .. . 0 0 √2 0 .. . 0 .. .
0 √2 0 .. . 0 .. . 0 0 0 √3 .. . 0 .. .
0 0 √3 .. . 0 .. .
... ... ... 0 .. .
... ... ... √n .. .
... ... ... ...
... ... ... ...
√n + 1 .. .
0 .. .
... ... . . .) ) ) ) ) ...
(C-24a)
) ... ... . . .) ) . . .) ) ) ) ) ...
(C-24b)
)
Die Matrizen für X und P sind beide hermitesch: Bis auf einen Faktor ist die Darstel lungsmatrix von X die Summe von (a) und (a† ), die Darstellungsmatrix von P ist pro portional zur Differenz von (a† ) und (a); dabei sichert der Faktor i ihre Hermitezität.
C-2 Wellenfunktionen zu den stationären Zuständen Wir schreiben jetzt für die Eigenzustände |φ n ⟩ des Hamilton-Operators die Wellen funktionen φ n (x) = ⟨x|φ n ⟩ an, begeben uns also in die Ortsdarstellung. Für den Grundzustand |φ0 ⟩ haben wir die Funktion φ0 (x) bereits angegeben (s. § B-3-a). Sie lautet φ0 (x) = ⟨x|φ0 ⟩ = (
2 mω 1/4 − 1 mω ) e 2 ℏ x πℏ
(C-25)
C Eigenzustände des Hamilton-Operators
| 495
Der Faktor vor der e-Funktion sorgt für die Normierung von φ0 (x). Um die Funktionen φ n (x) zu den anderen stationären Zuständen des harmonischen Oszillators zu erhal ten, braucht man nur den Ausdruck (C-13) für den Ketvektor |φ n ⟩ und den Operator a† in der Ortsdarstellung. Er lautet 1 [ mω ℏ d] √ x−√ ℏ mω dx √2 ] [ weil X durch die Multiplikation mit x und P durch den Differentialoperator [s. Gl. (B-6b)] dargestellt werden. Es ergibt sich φ n (x) = ⟨x|φ n ⟩ =
ℏ d i dx
1 ⟨x|(a† )n |φ0 ⟩ √n! n
ℏ d] 1 1 [ mω √ φ0 (x) x−√ = ℏ mω dx √n! √2n [ ]
(C-26)
also 1/2
φ n (x) = [
ℏ n 1 ( ) ] n 2 n! mω
(
2 mω 1/4 mω d n − 1 mω x− ) [ ] e 2 ℏ x πℏ ℏ dx
1
(C-27)
φ n (x) ist demnach das Produkt aus dem Exponentialausdruck e− 2 ℏ x und einem Po lynom n-ten Grades mit der Parität (−1)n ; man nennt es ein hermitesches Polynom oder Hermite-Polynom (s. Ergänzungen BV und CV ). Eine einfache Rechnung liefert die ersten Funktionen mω
2
2 4 mω 3 1/4 − 1 mω ( ) ] xe 2 ℏ x π ℏ 1 mω 2 mω 1/4 mω 2 φ2 (x) = ( ) [2 x − 1] e− 2 ℏ x 4πℏ ℏ
φ1 (x) = [
(C-28)
Ihr Verlauf ist in Abb. 4 wiedergegeben, Abb. 5 zeigt die zugehörigen Wahrscheinlich keitsdichten. Abb. 6 stellt das Verhalten der Wellenfunktion φ n (x) und die zugehörige Wahrscheinlichkeitsdichte für n = 10 dar.
Abb. 4: Wellenfunktionen für die drei ersten Niveaus des harmonischen Oszillators
496 | V Der harmonische Oszillator
Abb. 5: Wahrscheinlichkeitsdichten für die drei ersten Niveaus des harmonischen Oszillators
Abb. 6: Verlauf der Wellenfunktion (a) und der Wahrschein lichkeitsdichte (b) für ein hoch angeregtes Niveau n = 10 des harmonischen Oszillators
An diesen Abbildungen erkennt man, dass der Bereich auf der x-Achse, für den φ n (x) nennenswert von null verschiedene Werte annimmt, mit steigendem n immer größer wird. Das entspricht dem Verhalten in der klassischen Mechanik, wonach die Amplitude der Teilchenbewegung mit der Energie wächst [s. Abb. 1 und die Bezie hung (A-8)]. Damit wird auch der Erwartungswert der potentiellen Energie mit n grö ßer (s. Bemerkung 2 in § D-1), denn φ n (x) nimmt in den Bereichen auf der x-Achse wesentlich von null verschiedene Werte an, in denen das Potential V(x) groß ist. Wei ter stellen wir in den Abbildungen fest, dass die Zahl der Nullstellen von φ n (x) gleich n ist (dies wird in Ergänzung BV bewiesen). Damit wächst aber auch die mittlere kine tische Energie des Teilchens mit n (s. Bemerkung 2 in § D-1). Sie ist gegeben durch +∞
ℏ2 d2 1 ∫ φ∗n (x) 2 φ n (x) d x ⟨P2 ⟩ = − 2m 2m dx
(C-29)
−∞
Mit wachsender Anzahl der Nullstellen wächst auch die Krümmung der Bildkurve von φ n (x), so dass die zweite Ableitung von φ n (x) immer größere Werte annimmt. Schließlich ist für große n die Wahrscheinlichkeitsdichte |φ n (x)|2 an den Stellen x ≈ ± xM groß [xM ist die Amplitude der klassischen Bewegung mit der Energie E n ,
D Physikalische Diskussion
| 497
s. Gl. (A-8)]. Dieses Ergebnis erinnert an ein Charakteristikum, wie es von der klassi schen Mechanik vorausgesagt wird: Das klassische Teilchen hat in den Umkehrpunk ten x = ± xM die Geschwindigkeit null, hält sich also im Mittel in der Umgebung dieser Punkte länger als im Zentrum des Intervalls −xM ≤ x ≤ xM auf.
D Physikalische Diskussion D-1 Erwartungswert und Standardabweichung von X und P Mit dem Hamilton-Operator H vertauschen weder der Ortsoperator X noch der Impuls operator P, und die Eigenzustände |φ n ⟩ von H sind keine Eigenzustände von X oder P. Befindet sich daher der harmonische Oszillator in einem stationären Zustand |φ n ⟩, so kann die Messung der Observablen X oder der Observablen P von vornherein ein beliebiges Resultat liefern (die Spektren von X und P enthalten alle reelle Zahlen). Wir berechnen in diesem Abschnitt die Erwartungswerte und die Standardabweichungen der beiden Observablen und gelangen dann zur Unschärferelation für den Fall des harmonischen Oszillators. Wir wollen die Rechnungen mit Hilfe der Operatoren a und a† ausführen. Aus den Gleichungen (C-22) folgt sofort, dass die Erwartungswerte von X und P gleich null sind, denn beide Operatoren haben keine von null verschiedenen Diagonalelemente: ⟨φ n |X|φ n ⟩ = 0 ⟨φ n |P|φ n ⟩ = 0
(D-1)
Zur Bestimmung der Standardabweichungen ∆X und ∆P benötigen wir die Erwar tungswerte von X 2 und P2 : (∆X)2 = ⟨φ n |X 2 |φ n ⟩ − (⟨φ n |X|φ n ⟩)2 = ⟨φ n |X 2 |φ n ⟩ (∆P)2 = ⟨φ n |P2 |φ n ⟩ − (⟨φ n |P|φ n ⟩)2 = ⟨φ n |P2 |φ n ⟩
(D-2)
Nach den Gleichungen (B-1) und (B-7) ist ℏ (a† + a)(a† + a) 2mω ℏ = (a†2 + aa† + a† a + a2 ) 2mω mℏω † (a − a)(a† − a) P2 = − 2 mℏω †2 (a − aa† − a† a + a2 ) =− 2
X2 =
(D-3)
Die Terme mit a2 und a†2 liefern zu den Diagonalelementen keinen Beitrag, weil a2 |φ n ⟩ zu |φ n−2 ⟩ und a†2 |φ n ⟩ zu |φ n+2 ⟩ proportional ist; beide sind aber orthogonal
498 | V Der harmonische Oszillator zu |φ n ⟩. Dagegen liefert ⟨φ n |(a† a + aa† )|φ n ⟩ = ⟨φ n |(2a† a + 1)|φ n ⟩ = 2n + 1
(D-4)
Folglich ist 1 ℏ ) 2 mω 1 (∆P)2 = ⟨φ n |P2 |φ n ⟩ = (n + ) mℏω 2
(∆X)2 = ⟨φ n |X 2 |φ n ⟩ = (n +
(D-5a) (D-5b)
Damit wird das Produkt ∆X ⋅ ∆P = (n +
1 )ℏ 2
(D-6)
Wieder ergibt sich (s. Ergänzung CIII ), dass es größer oder gleich ℏ/2 ist. Die untere Schranke wird für n = 0, also für den Grundzustand erreicht (s. § D-2). Bemerkungen: 1. Ist x M die Amplitude der klassischen Bewegung mit der Energie E n = (n + 1/2)ℏω, so erkennt man unter Beachtung von Gl. (A-8) und Gl. (D-5a), dass ∆X =
1 xM √2
(D-7)
ist. Ist entsprechend pM die Amplitude des klassischen Impulses, pM = mω x M so erhält man 1 ∆P = pM √2
(D-8)
(D-9)
Es ist nicht überraschend, dass ∆X von der Größenordnung der Breite des Intervalls [−xM , +x M ] ist, in dem die klassische Bewegung verläuft (s. Abb. 1). Wie wir am Ende von § C gesehen haben, nimmt nämlich φ n (x) (wenigstens annähernd) gerade in diesem Intervall nicht vernachlässigba re Werte an. Andererseits ist leicht einzusehen, warum ∆X mit größer werdendem n wächst: Die Wahrscheinlichkeitsdichte |φ n (x)|2 weist für große n in der Nähe der Stellen x = ± x M zwei sym metrisch liegende Maxima auf; die Standardabweichung kann dann nicht sehr viel kleiner als der Abstand dieser Maxima sein (s. Kap. III, § C-5 und die Diskussion in § 1-b von Ergänzung AIII ). Eine analoge Überlegung kann für ∆P angestellt werden (s. Ergänzung DV ). 2. Der Mittel- oder Erwartungswert der potentiellen Energie eines Teilchens im Zustand |φ n ⟩ ist ⟨V(X)⟩ =
1 mω2 ⟨X 2 ⟩ 2
(D-10)
d. h. weil ⟨X⟩ null ist [s. Gl. (D-1)], 1 (D-11) mω2 (∆X)2 2 Für den Erwartungswert der kinetischen Energie dieses Teilchens erhalten wir entsprechend ⟨V(X)⟩ =
⟨
P2 1 ⟩= (∆P)2 2m 2m
(D-12)
D Physikalische Diskussion
Setzen wir in diese beiden Gleichungen die Gleichungen (D-5) ein, so wird 1 1 En ⟨V(X)⟩ = (n + ) ℏω = 2 2 2 ⟨
P2 1 1 En ⟩ = (n + ) ℏω = 2m 2 2 2
| 499
(D-13)
Die Erwartungswerte der potentiellen und der kinetischen Energie sind gleich. Das ist die Aussa ge des Virialsatzes für einen Sonderfall (s. Aufgabe 10 in Ergänzung LIII ). 3. Zu einem stationären Zustand |φ n ⟩ gibt es in der klassischen Mechanik kein Äquivalent. Ob wohl die Erwartungswerte ⟨X⟩ und ⟨P⟩ null sind, gilt dies nicht für die Energie dieses Zustands. Dennoch besteht eine gewisse Analogie zwischen dem Zustand |φ n ⟩ und einem klassischen Teil chen, dessen Ort durch Gl. (A-5) beschrieben wird (die Amplitude x M hängt mit der Energie E n über die Beziehung (A-8) zusammen), wobei die Anfangsphase φ aber zufallsverteilt ist (also mit derselben Wahrscheinlichkeit jeden Wert zwischen null und 2π annimmt). In diesem Fall wären die Mittelwerte von x und p null, weil 2π
x kl = x M
1 ∫ cos(ωt − φ) dφ = 0 2π 0
(D-14)
2π
1 pkl = −pM ∫ sin(ωt − φ) dφ = 0 2π 0
Weiter stimmen die Standardabweichungen von Ort und Impuls mit den Werten für den Zustand |φ n ⟩ [Gl. (D-7) und Gl. (D-9)] überein. Es ist nämlich 2π
x 2kl = x 2M
x2 1 ∫ cos2 (ωt − φ) dφ = M 2π 2 0
p2kl
=
1 p2M 2π
(D-15)
2π
p2 ∫ sin (ωt − φ) dφ = M 2 2
0
d. h. aber δxkl = √ x 2kl − (xkl )2 =
xM √2
δpkl = √ p2kl − (pkl )2 =
pM √2
(D-16)
D-2 Eigenschaften des Grundzustands In der klassischen Mechanik ergibt sich die tiefstmögliche Energie des harmonischen Oszillators, wenn das Teilchen ruht (Impuls und kinetische Energie sind dann null). In der Quantenmechanik ist das grundlegend anders: Die Energie des Grundzustands |φ0 ⟩ ist ungleich null, und die zugehörige Wellenfunktion besitzt eine gewisse räum liche Ausdehnung, die durch die Standardabweichung ∆X = √ℏ/2mω charakteri siert ist. Als Ursprung dieses wesentlichen Unterschieds zwischen den Aussagen der klas sischen und der Quantenmechanik kann man die Unschärferelationen ansehen, nach denen eine gleichzeitige Minimierung von kinetischer und potentieller Energie verbo
500 | V Der harmonische Oszillator
ten ist. Der Grundzustand entspricht, wie wir bereits in den Ergänzungen CI und MIII festgestellt hatten, einem Kompromiss, bei dem die Summe der beiden Energien so gering wie möglich ist. Für den Sonderfall des harmonischen Oszillators kann man die qualitativen Be trachtungen wenigstens zum Teil quantitativ präzisieren, indem man die Größenord nung der Energie und der räumlichen Ausdehnung des Grundzustands ermittelt. Ist ξ die Länge, die diese räumliche Ausdehnung charakterisiert, so wird die potentielle Energie im Mittel von der Größenordnung 1 V ≈ mω2 ξ 2 (D-17) 2 sein. Dann beträgt die Impulsbreite ∆P ungefähr ℏ/ξ , so dass die mittlere kinetische Energie ungefähr T=
p2 ℏ2 ≈ 2m 2mξ 2
(D-18)
ist. Somit ergibt sich für die Gesamtenergie im Mittel E=T+V ≈
ℏ2 1 + mω2 ξ 2 2 2 2mξ
(D-19)
Den Verlauf von T, V und E in Abhängigkeit von ξ gibt Abb. 7 wieder. Für kleine Werte von ξ liegt T über V, für große ξ ist dagegen V größer als T. Näherungsweise entspricht der Grundzustand dem Minimum der Funktion (D-19). Es liegt bei ξm ≈ √
ℏ mω
(D-20)
und hat den Wert E m ≈ ℏω
(D-21)
Wieder ergibt sich die Größenordnung von E0 und ∆X für den Zustand |φ0 ⟩.
Abb. 7: Mittlere potentielle Energie V und kinetische Energie T in Abhängigkeit vom Parameter ξ, mit dem man die räumliche Ausdehnung der Wellenfunktion um den Ursprung x = 0 charakteri siert. Weil das harmonische Potential für x = 0 sein Minimum annimmt, ist V eine mit ξ steigende Funktion (V ∝ ξ 2 ). Dagegen fällt T aufgrund der Heisenbergschen Unschärferelation mit größer werdendem ξ. Die kleinstmögliche Gesamtenergie ergibt sich für ξ = ξ m als ein Kompromiss, bei dem die Summe T + V minimal wird.
D Physikalische Diskussion
| 501
Der harmonische Oszillator besitzt die besondere Eigenschaft, dass das Produkt ∆X ⋅ ∆P der Unschärfen im Grundzustand seine untere Schranke tatsächlich annimmt [Gl. (D-6)], weil dann die Wellenfunktion eine Gauß-Funktion ist [s. Ergänzung CIII ].
D-3 Entwicklung der Erwartungswerte Der Anfangszustand eines harmonischen Oszillators sei ∞
|ψ(0)⟩ = ∑ c n (0)|φ n ⟩
(D-22)
n=0
(|ψ(0)⟩ normiert). Der Zustand zur Zeit t ist dann nach Gl. (D-54) aus Kapitel III ∞
|ψ(t)⟩ = ∑ c n (0) e−iE n t/ℏ |φ n ⟩ n=0 ∞
= ∑ c n (0) e−i(n+1/2)ωt |φ n ⟩
(D-23)
n=0
Somit ist der Erwartungswert einer beliebigen physikalischen Größe A ∞
∞
⟨ψ(t)|A|ψ(t)⟩ = ∑ ∑ c∗m (0)c n (0)A mn ei(m−n)ωt
(D-24)
m=0 n=0
mit A mn = ⟨φ m |A|φ n ⟩
(D-25)
Da m und n ganze Zahlen sind, treten in der zeitlichen Entwicklung der Erwartungs werte nur die Frequenz ω/2π und ihre höheren Harmonischen auf, die somit die BohrFrequenzen des harmonischen Oszillators bilden. Wir untersuchen insbesondere die Erwartungswerte der Observablen X und P. Nach Gl. (C-22a) und Gl. (C-22b) sind nur die Matrixelemente X mn und P mn für m = n±1 von null verschieden. Folglich enthalten die Erwartungswerte von X und P allein Ter me mit e±iωt . Es sind also sinusförmige Funktionen der Zeit mit der Kreisfrequenz ω. Dies erinnert an die klassische Lösung des Problems. Bereits bei der Diskussion des Ehrenfest-Theorems [Kap. III, § D-1-d-γ] hatten wir darauf hingewiesen, dass die Er wartungswerte von X und P wegen der Form des Oszillatorpotentials für jeden belie bigen Zustand |ψ⟩ den klassischen Bewegungsgleichungen in Strenge genügen müs sen. Nach den allgemeinen Beziehungen (D-34) und (D-35) aus Kapitel III ist näm lich d ⟨X⟩ = dt d ⟨P⟩ = dt
1 ⟨P⟩ ⟨[X, H]⟩ = iℏ m 1 ⟨[P, H]⟩ = −mω2 ⟨X⟩ iℏ
(D-26a) (D-26b)
502 | V Der harmonische Oszillator
Die Integration dieser Gleichungen liefert 1 ⟨P⟩(0) sin ωt mω ⟨P⟩(t) = ⟨P⟩(0) cos ωt − mω ⟨X⟩(0) sin ωt
⟨X⟩(t) = ⟨X⟩(0) cos ωt +
(D-27)
Das entspricht genau der sinusförmigen Form, wie sie Gl. (D-24) angibt. Bemerkung: Diese Analogie zum klassischen Fall tritt allerdings nur auf, wenn der Anfangszustand |ψ(0)⟩ eine Überlagerung der Zustände |φ n ⟩ [Gl. (D-22)] ist und mehrere Koeffizienten c n (0) von null verschieden sind. Wären alle Koeffizienten bis auf einen gleich null, so wäre der Oszillator in einem stationären Zustand und die Erwartungswerte aller Observablen wären Konstanten der Bewegung. In einem stationären Zustand |φ n ⟩ verhält sich demnach ein harmonischer Oszillator selbst für große n (Grenzfall großer Quantenzahlen) gänzlich anders, als es die klassische Mechanik vor hersagt. Will man ein Wellenpaket konstruieren, dessen Schwerpunkt zeitlich oszilliert, so muss man verschiedene Zustände |φ n ⟩ superponieren (s. Ergänzung GV ).
Referenzen und Literaturhinweise Dirac (1.13), § 34; Messiah (1.17), Kap. XII.
Übersicht über die Ergänzungen zu Kapitel V | 503
•
Übersicht über die Ergänzungen zu Kapitel V AV Beispiele für harmonische Oszillatoren
An einigen Beispielen aus verschiedenen Gebieten der Physik wird die Bedeutung des quantenmechanischen harmonischen Oszillators aufgezeigt. (halbquantitativ und verhältnismäßig leicht; wird für das erste Lesen empfohlen)
BV Stationäre Zustände. Hermitesche Polynome
Diese Ergänzung befasst sich mit den stationären Wellenfunktionen des harmonischen Oszillators. (dient als Referenz)
CV
Vorgestellt wird eine alternative Methode, um die Resultate des Kapitels V zu erhalten. Dabei wird der Zusammenhang zwischen der Energiequantisierung und dem Verhalten der Wellenfunktionen im Unendlichen verdeutlicht. (von mittlerer Schwierigkeit)
Lösung der Eigenwertgleichung mit der Polynommethode
DV Stationäre Zustände in der Impulsdarstellung
In DV wird nachgewiesen, dass die Wahrscheinlichkeitsverteilung des Impulses dieselbe Form wie die des Ortes hat. (verhältnismäßig einfach)
EV
Dreidimensionaler isotroper harmonischer Oszillator
Die Ergebnisse aus Kapitel V werden auf den dreidimensionalen Fall verallgemeinert. (wird zum ersten Lesen empfohlen, da einfach und von physikalischer Bedeutung)
FV
Geladener harmonischer Oszillator im konstanten elektrischen Feld
FV befasst sich mit einer direkten und einfachen Anwendung der Resultate aus Kapitel V (abgesehen von § 3, in dem der in Ergänzung EII eingeführte Translationsoperator verwendet wird). (wird für das erste Lesen empfohlen)
GV Quasiklassische Zustände des Oszillators
GV widmet sich der detaillierten Untersuchung der quasiklassischen Zustände des harmonischen Oszillators. Mit diesen kann man den Zusammenhang zwischen der klassischen und der Quantenmechanik herstellen. (wichtig für die Anwendungen in der Quantentheorie der Strahlung; von mittlerer Schwierigkeit, kann zunächst übersprungen werden)
HV Eigenschwingungen gekoppelter Oszillatoren
HV untersucht für den sehr einfachen Fall zweier gekoppelter harmonischer Oszillatoren die Eigenschwingungen eines Systems. (leicht und physikalisch wichtig) Diese Ergänzungen liefern im Rahmen einfacher Modelle eine Einführung von Konzepten, die in der Physik besonders wichtig sind. (verhältnismäßig schwierig, kann auch später gelesen werden)
JV
Lineare Oszillatorenkette. Phononen
KV Kontinuierliches System. Photonen
JV untersucht die Eigenschwingungen einer linearen Kette von eindimensionalen Oszillatoren. Führt mit dem Phonon einen Grundbegriff der Festkörperphysik ein. KV befasst sich mit den Eigenschwingungen eines kontinuierlichen Systems und macht auf einfache Weise verständlich, wie in der quantentheoretischen Behandlung des elektromagnetischen Feldes die Photonen eingeführt werden.
•
504 | Übersicht über die Ergänzungen zu Kapitel V
LV
Oszillator im thermodynamischen Gleichgewicht
MV Aufgaben
Hier wird der (in Ergänzung EIII eingeführte) Begriff des Dichteoperators auf einen harmonischen Oszillator im thermodynamischen Gleichgewicht angewendet. (physikalisch wichtig, setzt aber die Kenntnis von Ergänzung EIII voraus)
Beispiele für harmonische Oszillatoren
| 505
•
Ergänzung AV Beispiele für harmonische Oszillatoren 1 1-a 1-b 1-c 2 2-a 2-b 3 3-a 3-b 3-c 4 4-a 4-b 4-c
Kernschwingungen in einem zweiatomigen Molekül | 505 Wechselwirkungsenergie von zwei Atomen | 505 Bewegung der Kerne | 507 Experimentelle Hinweise auf die Kernschwingungen | 509 Schwingungen von Kernen in einem Kristall | 512 Einstein-Modell | 512 Quantencharakter der Kristallschwingungen | 514 Torsionsschwingungen eines Moleküls: Beispiel Ethylen | 515 Struktur des Ethylenmoleküls | 515 Klassische Bewegungsgleichungen | 516 Quantenmechanische Behandlung | 517 Schwere Myonenatome | 519 Vergleich mit dem Wasserstoffatom | 519 Schweres Myonenatom als Oszillator | 520 Größenordnung der Energien und Ausdehnung der Wellenfunktionen | 522
Wir hatten bereits in der Einleitung zu Kapitel V bemerkt, dass die Aussagen, zu de nen man bei der Untersuchung des harmonischen Oszillators gelangt, in der Physik auf zahlreiche Fälle angewendet werden können. Insbesondere gilt dies, wenn das System um eine stabile Gleichgewichtslage (für die seine potentielle Energie ein Mi nimum annimmt) schwingt. In diesem Abschnitt stellen wir einige Beispiele hierzu vor und zeigen ihre physikalische Bedeutung: Das sind die Kernschwingungen in ei nem zweiatomigen Molekül oder einem Kristallgitter, die Torsionsschwingungen ei nes Moleküls und die Bewegung eines μ− -Mesons im Innern eines schweren Kerns. Wir beschränken uns dabei auf eine einfache und qualitative Diskussion.
1 Kernschwingungen in einem zweiatomigen Molekül 1-a Wechselwirkungsenergie von zwei Atomen Bildet sich aus zwei neutralen Atomen ein Molekül, so hat das seine Ursache darin, dass die Wechselwirkungsenergie V(r) der beiden Atome (r ist ihr Abstand) ein Mini mum aufweist. Den Verlauf von V(r) gibt Abb. 1 wieder. Für sehr große r wirken die beiden Atome nicht aufeinander und V(r) geht gegen ein Konstante, die wir als Ener gieursprung nehmen. Dann ändert sich V(r) mit kleiner werdendem r näherungsweise wie −1/r6 : Die Anziehung geht auf Van-der-Waals-Kräfte zurück (mit diesen befassen wir uns in Ergänzung CXI ). Wird r so klein, dass sich die Elektronenwellenfunktionen beider Atome überlappen, so wächst V(r) rascher, geht für r = re durch ein Minimum, um schließlich für r gegen null sehr groß zu werden. https://doi.org/10.1515/9783110638738-047
•
506 | Ergänzung AV
Abb. 1: Verlauf des Wechselwirkungspotentials von zwei Atomen, die ein stabiles Molekül bilden können. Klassisch ist V 0 die Dissoziationsenergie des Mole küls und re der Abstand der beiden Kerne im Gleichge wicht. Quantenmechanisch erhält man Schwingungsni veaus (horizontale Geradenstücke im Potentialtopf) mit Energien oberhalb von −V 0 .
Das Minimum von V(r) ist für das Phänomen der chemischen Bindung der beiden Atome verantwortlich: Bereits in Kap. IV, § C-2-c stellten wir am Beispiel des H+2 -Ions fest, dass eine derartige Energieabsenkung auf eine Delokalisierung der Elektronen zustände zurückgeht (Quantenresonanz), was dann die Anziehung der Elektronen durch beide Kerne ermöglicht. Das rasche Ansteigen von V(r) für kurze Abstände um schreibt dann die Abstoßung der Kerne. Wären die Kerne klassische Teilchen, so hätten sie für r = re stabile Gleichge wichtslagen. Die Tiefe V0 des Potentialtopfes an dieser Stelle wird in der klassischen Physik die Dissoziationsenergie des Moleküls genannt: Es ist die Energie, die man zur Trennung der beiden Atome aufwenden muss. Je größer V0 ist, desto stabiler ist das Molekül. Die theoretische und experimentelle Bestimmung der Kurve in Abb. 1 ist eine in der Atom- und Molekülphysik sehr wichtige Aufgabe. Wir zeigen, dass eine Untersu chung der Kernschwingungen über diese Kurve Aufschluss verschaffen kann. Bemerkung (Born-Oppenheimer-Näherung): Für die Quantenmechanik erweist sich die Beschreibung eines zweiatomigen Moleküls als ein sehr komplexes Problem: Man muss die stationären Zustände eines Systems von miteinander wechselwirkenden Elektronen und Kernen ermitteln. Im Allgemeinen ist die strenge Lösung der Schrödinger-Gleichung für ein solches System unmöglich. Eine wichtige Vereinfachung ergibt sich dadurch, dass die Elektronenmasse gegenüber den Kernmassen klein ist, so dass sich die Elektronen sehr viel schneller als die Kerne bewegen. Daher kann man in erster Näherung die beiden Bewegungen getrennt voneinander untersuchen. Man beginnt damit, dass man die Be wegung der Elektronen für einen festen Kernabstand r bestimmt, und erhält für das Elektronen system eine Folge von stationären Zuständen mit den Energien E 1 (r), E 2 (r), . . . Wir betrachten nun den Grundzustand des Elektronensystems mit der Energie E 1 (r). Ändert sich r aufgrund der Bewegung der Kerne, so bleibt das Elektronensystem stets im Grundzustand. Dies bedeutet, dass die zu ihm gehörende Wellenfunktion sich jeder Änderung von r augenblicklich anpasst; man sagt, dass die sehr beweglichen Elektronen der Kernbewegung adiabatisch folgen. Unter sucht man jetzt diese Bewegung, so spielt die Elektronenenergie E 1 (r) die Rolle einer (poten tiellen) Wechselwirkungsenergie zwischen den beiden Kernen. Sie ist vom Abstand r der Ker ne abhängig und muss zu ihrer elektrostatischen Abstoßung addiert werden Z 1 Z 2 e 2 /r (Z 1 und Z 2 sind die Atomzahlen der Kerne; ferner setzen wir e 2 = q 2 /4πε 0 , worin q die Elektronenla dung ist). Somit ist die potentielle Energie des aus den beiden Kernen bestehenden Systems
Beispiele für harmonische Oszillatoren
|
507
•
insgesamt V(r) = E 1 (r) +
Z1 Z2 e2 r
(1)
Diese Funktion ist in Abb. 1 dargestellt.
1-b Bewegung der Kerne α Separation von Rotation und Schwingung Wir gelangen somit zum Problem der Bewegung von zwei Teilchen mit den Massen m1 und m2 , die über das Potential V(r) (Abb. 1) miteinander in Wechselwirkung stehen. Wegen der Existenz mehrerer miteinander gekoppelter Freiheitsgrade ist dieses Pro blem immer noch kompliziert: Es gibt Schwingungen (Änderungen von r) und Rota tionen (Änderungen der Polarwinkel θ und φ), mit denen die Richtung der Molekül achse festgelegt wird). Durch die Schwingung ändert sich mit r das Trägheitsmoment des Moleküls und damit die Rotationsenergie. Für Schwingungen geringer Amplitude kann man zeigen, dass die Kopplung zwi schen den Schwingungs- und den Rotationsfreiheitsgraden vernachlässigbar ist, weil sich das Trägheitsmoment nur wenig verändert. Man hat es dann mit zwei unabhän gigen Problemen zu tun (wie wir genauer in Ergänzung FVII sehen werden): an erster Stelle mit der Rotation einer „Hantel“, die aus zwei Massenpunkten m1 und m2 mit dem Abstand re besteht¹, und dann mit dem eindimensionalen Problem (hier ist r die einzige Variable) eines fiktiven Teilchens der reduzierten Masse m=
m1 m2 m1 + m2
(2)
(s. Kap. VII, § B), das sich im Potential V(r) (Abb. 1) bewegt. Hier muss man die Eigen wertgleichung [−
ℏ2 d2 + V(r)] φ(r) = Eφ(r) 2m dr2
(3)
lösen. Wir wollen uns auf dieses Problem konzentrieren. β Schwingungsniveaus Für Schwingungen kleiner Amplitude kann man V(r) an der Stelle r = re nach Taylor entwickeln: V(r) = −V0 +
1 1 V (re )(r − re )2 + V (re )(r − re )3 + . . . 2 6
(4)
1 Die quantenmechanische Behandlung dieses Systems, das man auch starrer Rotator nennt, erfolgt in Ergänzung CVI .
•
508 | Ergänzung AV
Vernachlässigt man die Glieder dritter und höherer Ordnung, so gelangt man zum Po tential für einen harmonischen Oszillator, das um die Stelle r = re zentriert ist. Die zugehörige Kreisfrequenz ist ω=√
V (re ) m
(5)
Die Energie des Schwingungszustands |φ v ⟩ ist dann (s. auch die horizontalen Gera denstücke in Abb. 1) E v = (v +
1 ) ℏω − V0 2
(6)
mit v = 0, 1, 2, . . . Nach der Diskussion in § D-3 von Kapitel V oszilliert der Erwartungswert ⟨R⟩ des Kernabstands um re mit der Frequenz ω/2π, der Vibrationsfrequenz des Moleküls. Bemerkungen: 1. Die Wellenfunktion eines harmonischen Oszillators hat selbst im Grundzustand eine endli che Ausdehnung von der Größenordnung √ℏ/2mω (s. Kap. V, § D-2). Deshalb ist für den Grund zustand der Molekülschwingung der Abstand der Kerne höchstens mit einer Genauigkeit von √ℏ/2mω definiert. Damit die Schwingungs- von den Rotationsfreiheitsgraden entkoppelt sind, muss also √
ℏ ≪ re 2mω
(7)
sein. 2. Ist die reduzierte Masse m bekannt, so liefert die Messung von ω nach Gl. (5) die zweite Ablei tung V (r e ). Mit wachsender Quantenzahl v darf man den Term mit (r − r e )3 in der Entwicklung (4) (also die Abweichung des Potentials von der Parabelform) nicht mehr vernachlässigen; der Oszil lator wird anharmonisch. Mit Hilfe der Störungsrechnung (s. Ergänzung AXI ergibt sich dann, dass der Abstand E v+1 −E v von zwei aufeinanderfolgenden Niveaus für große und für kleine v verschie den ist. Untersucht man daher die Abhängigkeit der Differenz E v+1 − E v von der Quantenzahl v, erhält man Aufschluss über die dritte Ableitung V (r e ) des Potentials. Das macht verständlich, wie man über die Frequenzen der Molekülschwingungen die Form des Potentials in der Umge bung seines Minimums bestimmen kann.
γ Größenordnung der Vibrationsfrequenzen Es ist üblich, bei Molekülschwingungen die Vibrationsfrequenzen in cm−1 , d. h. als Kehrwert der (in cm gemessenen) Wellenlänge λ einer elektromagnetischen Strahlung mit derselben Frequenz ν anzugeben. 1 cm−1 entspricht dabei einer Frequenz von 3 × 1010 Hz und einer Energie von 1.24 × 10−4 eV. Für zweiatomige Moleküle liegen die verschiedenen Vibrationsfrequenzen zwi schen einigen zehn bis zu einigen tausend cm−1 . Die entsprechenden Wellenlängen fallen daher in den Infrarotbereich.
Beispiele für harmonische Oszillatoren
| 509
•
Aus Gl. (5) ersieht man, dass ω umso größer ist, je kleiner die Masse und je größer V (re ), also die Krümmung des Potentialtopfs an der Stelle r = re , ist. Da re stets die selbe Größenordnung von einigen 10−8 cm aufweist, wächst V (re ) mit der Tiefe V0 des Topfes: ω wird somit mit der chemischen Stabilität größer. Wir betrachten einige konkrete Beispiele. Die Vibrationsfrequenzen des Wasserstoff- und des Deuteriummoleküls (H2 und D2 ) sind (ohne Berücksichtigung der Anharmonizität) νH2 = 4 401 cm−1 νD2 = 3 112 cm−1
(8)
Die Potentialkurve ist in beiden Fällen dieselbe: Die chemische Bindung zwischen den beiden Atomen hängt nur von der elektronischen Umgebung ab. Dagegen ist die redu zierte Masse des H2 -Moleküls nur halb so groß wie die des D2 -Moleküls. Darum muss nach Gl. (5) νH2 = √2νD2 sein, wie es die experimentellen Werte auch anzeigen. Wir nehmen jetzt ein Beispiel, bei dem die beiden Moleküle ungefähr die glei che reduzierte Masse besitzen, sich jedoch in ihrer chemischen Stabilität unterschei den. Das Molekül 79 Br85 Rb ist chemisch stabil (Verbindung zwischen einem Alka limetall und einem Halogen). Es besitzt eine Vibrationsfrequenz von 181 cm−1 . Bei Versuchen zum optischen Pumpen beobachtete man 84 Kr85 Rb-Moleküle. Ihre chemi sche Stabilität ist wesentlich schwächer, weil das Krypton als Edelgas in chemischer Hinsicht praktisch träge ist (tatsächlich geht die Kohäsion des Moleküls allein auf Van-der-Waals-Kräfte zurück). Man findet für diese Moleküle eine Vibrationsfrequenz von 13 cm−1 . Dieser beträchtliche Unterschied beruht allein auf der unterschiedlichen chemischen Bindung der beiden Molekülarten, weil ihre reduzierten Massen bis auf wenige Prozent praktisch gleich sind.
1-c Experimentelle Hinweise auf die Kernschwingungen Wir wollen jetzt erklären, wie sich die Kernschwingung in einem Molekül experimen tell manifestiert. Dabei betrachten wir insbesondere die Wechselwirkung des Mole küls mit einer elektromagnetischen Welle. α Absorption und Emission im Infrarotbereich Wir nehmen zunächst an, dass das Molekül heteropolar ist, d. h. dass es aus zwei ver schiedenen Atomen besteht. Weil die Elektronen vom Atom mit der größeren Elek tronegativität angezogen werden, wird das Molekül im Allgemeinen ein permanentes Dipolmoment D(r) besitzen, das vom Abstand r der beiden Kerne abhängt. Wir entwi ckeln D(r) um die Gleichgewichtslage r = re : D(r) = d0 + d1 (r − re ) + . . . mit zwei reellen Konstanten d0 und d1 .
(9)
•
510 | Ergänzung AV
Weil das Molekül durch eine Superposition |ψ(t)⟩ mehrerer stationärer Schwin gungszustände beschrieben wird, oszilliert der Erwartungswert ⟨ψ(t)|D(R)|ψ(t)⟩ sei nes elektrischen Dipolmoments mit der Frequenz ω/2π um den Wert d0 . Der oszil lierende Term rührt vom Erwartungswert des Terms d1 (R − re ) in Gl. (9) her (R − re spielt hier dieselbe Rolle wie die Observable X des in § D-3 von Kapitel V untersuchten harmonischen Oszillators). Nun hat (R− re ) nur zwischen solchen Zuständen |φ v ⟩ und |φ v ⟩ nichtverschwindende Matrixelemente, für die v−v = ±1 ist. Mit dieser Auswahl regel können wir verstehen, weshalb beim Zeitverhalten ⟨D(R)⟩(t) des Dipolmoments nur eine Bohr-Frequenz ω/2π auftritt (die höheren Harmonischen findet man offen sichtlich erst dann, wenn man die Anharmonizität des Potentials und weitere Terme in der Entwicklung (9) berücksichtigt; sie sind jedenfalls von sehr viel geringerer In tensität). Diese Schwingung des elektrischen Dipolmoments erklärt die Kopplung des Mo leküls mit dem elektromagnetischen Feld: Das Molekül kann Strahlung mit der Fre quenz ν = ω/2π absorbieren oder emittieren. Im Photonenbild kann das Molekül ein Photon mit der Energie hν absorbieren und vom Zustand |φ v ⟩ in den Zustand |φ v+1 ⟩ gelangen (Abb. 2a), oder es emittiert umgekehrt ein Photon hν und fällt vom Zustand |φ v ⟩ in den Zustand |φ v−1 ⟩ (Abb. 2b).
(a)
(b)
Abb. 2: Absorption (a) bzw. Emission (b) eines Photons mit der Energie hν durch ein heteropolares Molekül, das vom Schwingungszustand |φ v ⟩ in den Zustand |φ v+1 ⟩ bzw. |φ v−1 ⟩ übergeht.
β Raman-Effekt Wir betrachten jetzt ein homöopolares Molekül, das aus zwei identischen Atomen be steht. Aus Symmetriegründen ist dann das permanente elektrische Dipolmoment für jedes r null; das Molekül ist im Infraroten inaktiv. Wir stellen uns jetzt vor, dass wir auf das Molekül eine elektromagnetische Wel le mit der optischen Frequenz Ω/2π schicken. Sie ist sehr viel höher als die bis jetzt betrachteten Frequenzen und in der Lage, die Elektronenhülle des Moleküls anzu regen. Dadurch werden die Elektronen zu erzwungenen Schwingungen angeregt, so dass sie Strahlung derselben Frequenz in den Raum reemittieren. Es handelt sich um
Beispiele für harmonische Oszillatoren
| 511
•
das bekannte Phänomen der Lichtstreuung an Molekülen (Rayleigh-Streuung).² Wel che neuen Erscheinungen treten nun durch die Molekülschwingung auf? Qualitativ kann man wie folgt überlegen. Die elektronische Suszeptibilität³ des Moleküls ist im Allgemeinen eine Funktion des Abstandes r der beiden Kerne. Mit der (im Vergleich zur Elektronenbewegung) langsamen Änderung von r ändert sich die Amplitude des mit der Frequenz Ω/2π schwingenden induzierten elektrischen Dipols. Die zeitliche Abhängigkeit des Dipolmoments ist also eine mit der Molekülschwin gung ω/2π modulierte harmonische Schwingung der Frequenz Ω/2π (Abb. 3). Die Fourier-Transformierte dieser Bewegung liefert die Frequenzverteilung des vom Mo lekül emittierten Lichts. Es ergibt sich eine zentrale Frequenz Ω/2π (Rayleigh-Streu ung) und zwei Seitenlinien, von denen eine die Frequenz (Ω − ω)/2π besitzt (RamanStokes-Streuung) und die andere die Frequenz (Ω + ω)/2π (Raman-Anti-Stokes-Streu ung) (Abb. 4).
Abb. 3: Die Amplitude des mit der Frequenz der einfallenden Lichtwelle schwingenden induzierten elektrischen Dipols wird durch die Schwingung eines Moleküls moduliert.
Abb. 4: Spektrum der amplitudenmodulierten Schwingung aus Abb. 3. Neben der zentralen Linie mit der Frequenz des einfallenden Lichts (Rayleigh-Streuung), treten zwei seitlich verschobene Linien auf (Stokes- und Anti-StokesLinie). Ihr Abstand von der zentralen Linie ist gleich der Vibrationsfrequenz des Moleküls.
Im Photonenbild kann man die verschiedenen Linien sehr leicht interpretieren. Wir betrachten ein Photon mit der Energie ℏΩ, das auf das Molekül im Zustand |φ v ⟩ trifft (Abb. 5a). Wechselt das Molekül sein Vibrationsniveau nicht, so haben wir es mit einer
2 Die quantenmechanische Behandlung der durch ein Strahlungsfeld erzwungenen Bewegung von Atomelektronen erfolgt in Ergänzung AXIII . 3 Das Feld E0 eiΩt der einfallenden Lichtwelle induziert in der Elektronenhülle des Moleküls ein Di polmoment D = χ(Ω) E0 eiΩt . Darin ist χ(Ω) die elektronische Suszeptibilität des Moleküls. In unserem Zusammenhang ist die r-Abhängigkeit von χ wichtig.
•
512 | Ergänzung AV
(a)
(b)
(c)
(d)
Abb. 5: Schematische Darstellung der Streuung eines Photons mit der Energie ℏΩ an einem Molekül, das sich anfänglich im Schwingungszustand |φ v ⟩ befindet (a); Rayleigh-Streuung ohne Zustands änderung des Moleküls (b); Raman-Stokes-Streuung bzw. Raman-Antistokes-Streuung mit einem Übergang des Moleküls vom Zustand |φ v ⟩ in den Zustand |φ v+1 ⟩ (c) bzw. in den Zustand |φ v−1 ⟩ (d).
elastischen Streuung zu tun: Das Photon wird mit derselben Energie gestreut, die das einfallende Teilchen besitzt (Abb. 5b; Rayleigh-Linie). Das Molekül kann aber auch während des Streuvorgangs vom Zustand |φ v ⟩ in den Zustand |φ v+1 ⟩ gelangen. Das Molekül gewinnt auf Kosten des gestreuten Photons die Energie ℏω, dieses hat also die Energie ℏ(Ω − ω) (Abb. 5c). Die Streuung ist inelastisch (Stokes-Linie). Schließlich kann das Molekül auch vom Zustand |φ v ⟩ in den Zustand |φ v−1 ⟩ gelangen, und das gestreute Photon hat die Energie ℏ(Ω + ω) (Abb. 5d; Anti-Stokes-Linie). Bemerkungen: 1. Man kann den Raman-Effekt auch an heteropolaren Molekülen beobachten. 2. Der Raman-Effekt hat unter anderem für die Erzeugung von Laserstrahlung Bedeutung. Bringt man in einen Laserresonator mit der Frequenz Ω/2π ein Gefäß, das mit einer Raman-aktiven Sub stanz gefüllt ist, so kann man in bestimmten Fällen eine Verstärkung (stimulierter Raman-Effekt), also Laserstrahlung mit der Frequenz (Ω − ω)/2π erhalten, wobei ω die Vibrationsfrequenz der im Gefäß befindlichen Moleküle ist (Raman-Laser). Durch Auswechseln der Substanz erhält man eine bequeme Methode zur Änderung der Laserfrequenz. 3. Die Untersuchung der Raman- und Infrarotspektren hat besondere Bedeutung in der Chemie, da sie eine Identifizierung der verschiedenen Bindungszustände in einem komplexen Molekül ermöglicht. So ist z. B. die Vibrationsfrequenz eines Kohlenstoffpaars verschieden, je nachdem ob es sich um eine Einfach-, Doppel- oder Dreifachbindung handelt.
2 Schwingungen von Kernen in einem Kristall 2-a Einstein-Modell Bei einem Kristall sind die Atome oder Ionen in einem periodischen Gitter regelmäßig angeordnet. Wir beschränken uns der Einfachheit halber auf ein eindimensionales Modell und betrachten eine lineare Kette von (identischen) Atomen. Die mittlere Lage
Beispiele für harmonische Oszillatoren
|
513
•
des Kerns des q-ten Atoms ist x0q = qd
(10)
worin d die Gitterkonstante (von der Größenordnung einiger 10−10 m) darstellt. Die potentielle Energie U(x1 , x2 , . . . , x q , . . .) dieses Systems von Kristallkernen hängt von ihren Lagen x1 , x2 , . . . , x q , . . . ab. Ist x q − x0q nicht zu groß, entfernen sich also die Kerne nur wenig aus ihrer Gleichgewichtslage, so kann man das Potential in bestimmten Fällen nach Taylor entwickeln: 1 U(x1 , x2 , . . . , x q , . . .) ≈ U0 + ∑ (x q − x0q )2 U0 + . . . q 2
(11)
mit zwei reellen Konstanten U0 und U0 > 0. Lineare Terme treten nicht auf, weil x0q für den Kern (q) eine stabile Gleichgewichtslage ist. Fügt man zum Ausdruck (11) die Summe der kinetischen Energien der Kerne T=∑ q
p2q
(12)
2m
hinzu (p q ist der Impuls des Kerns q mit der Masse m), so ist der Gesamt-HamiltonOperator des Systems bis auf die Konstante U0 die Summe von Hamilton-Operatoren eindimensionaler harmonischer Oszillatoren: H = U0 + ∑ [ q
p2q 2m
+
1 (x q − x0q )2 U0 ] 2
(13)
In diesem vereinfachten Modell schwingt demnach jeder Kern unabhängig von seinen Nachbarn um seine Gleichgewichtslage mit der (Kreis-)Frequenz ω=√
U0 m
(14)
Wie beim zweiatomigen Molekül ist ω umso größer, je geringer die Masse m des ein zelnen Kerns und je größer die Krümmung des Potentials ist, das den Kern in seine Gleichgewichtslage zieht. Bemerkung: In diesem einfachen Modell schwingt, wie wir feststellten, jeder Kern unabhängig von den an deren. Dies ergibt sich daraus, dass der Näherungsausdruck für das Potential U keine Terme enthält, die von mehr als einer Veränderlichen x q abhängen; zwischen den einzelnen Kernen be steht bei diesem Potential keine Wechselwirkung. Das Modell ist darum unrealistisch, und wir werden in Ergänzung JV ein etwas aufwendigeres Modell behandeln, das die Kopplung der Kerne mit ihren nächsten Nachbarn berücksichtigt. Dabei werden wir sehen, dass man auch in diesem Fall den Hamilton-Operator des Gesamtsystems als eine Summe von Hamilton-Operatoren unab hängiger harmonischer Oszillatoren schreiben kann.
•
514 | Ergänzung AV
2-b Quantencharakter der Kristallschwingungen Das Einstein-Modell ist sehr schematisch. Trotzdem kann man mit ihm einige Phä nomene verstehen, die mit dem quantenmechanischen Charakter der Kristallschwin gungen zusammenhängen. Das Verhalten der spezifischen Wärme bei konstantem Vo lumen kann für niedrige Temperaturen von der klassischen Mechanik nicht erklärt werden. Darauf werden wir in Ergänzung LV im Zusammenhang mit den Eigenschaf ten eines harmonischen Oszillators im thermodynamischen Gleichgewicht eingehen. Hier wollen wir einen besonders auffälligen Effekt diskutieren, der seine Ursache in der endlichen Ausdehnung der Wellenfunktionen für den Grundzustand der einzel nen Atome hat. Unter Atmosphärendruck sind alle Substanzen am absoluten Nullpunkt bis auf Helium fest. Damit auch Helium erstarrt, muss man einen Druck von wenigstens 25 At mosphären aufbringen. Kann man diese Besonderheit des Heliums qualitativ erklä ren? Wir versuchen zunächst, den Schmelzvorgang einer normalen Substanz zu ver stehen. Am absoluten Nullpunkt sind die Atome praktisch in ihrer Gleichgewichtslage lokalisiert, wobei die Ausdehnung ihrer Wellenfunktion um x0q durch [s. Gl. (D-5a) aus Kapitel V] ∆X ≈ √
1/4
ℏ ℏ2 =[ ] 2mω 4mU0
(15)
gegeben ist [wir haben hier Gl. (14) berücksichtigt]. Im allgemeinen ist ∆X sehr klein. Wird der Kristall erwärmt, so erlangen die Kerne immer höhere Schwingungsniveaus: Klassisch schwingen sie mit immer größerer Amplitude, quantenmechanisch verbrei tert sich ihre Wellenfunktion [wie die Quadratwurzel aus der Schwingungsquanten zahl, s. Gl. (D-5a) aus Kapitel V]. Ist ihre Ausdehnung gegenüber dem Abstand d der Atome nicht mehr vernachlässigbar, so schmilzt der Kristall (s. § 4-c von Ergänzung LV für die quantitative Behandlung). Die Tatsache, dass Helium bei normalem Druck selbst am absoluten Nullpunkt nicht erstarrt, wird nun damit erklärt, dass auch in diesem Zustand die Ausdehnung der Wellenfunktion in Bezug auf d nicht vernachlässigt werden kann. Das wieder um liegt an der geringen Masse des Heliums und an seiner chemischen Trägheit (die Krümmung der Potentialkurve ist an den Minima sehr schwach und somit U0 sehr klein, weil die Potentialtöpfe sehr flach sind). In Gl. (15) wirken beide Faktoren im selben Sinn, so dass sich eine große Ausdehnung ∆X ergibt. Durch eine Druckerhö hung wächst U0 , also ω, und ∆X wird kleiner: Bei hohem Druck werden nämlich die Heliumatome gewissermaßen von ihren Nachbarn „eingeklemmt“, das Potentialmi nimum wird umso ausgeprägter (U0 umso größer), je geringer der mittlere Abstand zu diesen Nachbarn ist, so dass schließlich auch das Helium fest werden kann.
Beispiele für harmonische Oszillatoren
| 515
•
3 Torsionsschwingungen eines Moleküls: Beispiel Ethylen 3-a Struktur des Ethylenmoleküls Die Struktur des Ethylenmoleküls mit der Summenformel C2 H4 ist wohlbekannt: Die sechs Atome liegen in einer Ebene (Abb. 6), und die Winkel zwischen den C–H-Bin dungen und der C–C-Bindung betragen 120°.
Abb. 6: Ebene Struktur des Ethylenmoleküls
Wir stellen uns jetzt vor, dass sich eine der CH2 -Gruppen um die C–C-Achse mit dem Winkel α gegenüber der anderen Gruppe dreht, ohne dass dabei die H-Atome ihre Ab stände zum C-Atom ändern. Eine Ansicht des Moleküls, wenn man in Richtung der C–C-Achse blickt, gibt Abb. 7 wieder: Die C–H-Bindungen der einen CH2 -Gruppe sind durchgezogen, die der anderen gestrichelt gezeichnet. Wie ändert sich die potentielle Energie V(α) mit dem Winkel α?
Abb. 7: Torsion des Ethylenmoleküls (Ansicht in Richtung der C–C-Achse): Eine CH2 -Gruppe hat sich gegenüber der anderen um die C–C-Achse mit dem Winkel α gedreht.
Da das Molekül in seinem stabilen Zustand eine Ebene bildet, gehört der Winkel α = 0 zu einem Minimum von V(α). Andererseits entspricht auch der Winkel α = π einem Mi nimum, weil die zu diesen beiden Winkeln gehörenden Strukturen nicht unterscheid bar sind. V(α) wird also (im Intervall −π/2 ≤ α ≤ 3π/2) wie in Abb. 8 verlaufen, wobei wir V(0) als Energieursprung gewählt haben. Die beiden stabilen Lagen α = 0 und α = π sind durch eine Potentialbarriere von der Höhe V0 getrennt. Oft ersetzt man das Potential in Abb. 8 durch den einfachen Zusammenhang V(α) =
V0 (1 − cos 2α) 2
(16)
•
516 | Ergänzung AV
Abb. 8: Die potentielle Energie des Moleküls in Abhängigkeit vom Torsionswinkel α. Für α = 0 und α = π hat das Potential ein Minimum.
Bemerkung: Die Quantenmechanik vermag alle hier angesprochenen Charakteristika des Ethylenmoleküls zu erklären. In diesem Molekül besitzt jedes Kohlenstoffatom vier Valenzelektronen. Drei Elektro nen (die σ-Elektronen) besitzen Wellenfunktionen, die in Bezug auf drei in einer Ebene liegende und miteinander den Winkel 120° bildende Achsen rotationssymmetrisch sind; sie bestimmen die Richtung der chemischen Bindungen (Abb. 6). Weiter ist die Überlappung dieser Wellenfunk tionen mit den Elektronenwellenfunktionen der Nachbaratome wichtig, weil sie die Stabilität der C–H-Bindungen und eines Teils der C–C-Bindung sichert (man nennt dieses Phänomen die sp2 -Hybridisierung; wir werden in Ergänzung EVII näher darauf eingehen). Das vierte Valenzelek tron des Kohlenstoffatoms ist ein π-Elektron. Seine Wellenfunktion ist rotationssymmetrisch in Bezug auf eine Achse, die durch C geht und senkrecht auf der von C und seinen drei Nachbarn aufgespannten Ebene steht. Die Überlappung der Wellenfunktionen der beiden π-Elektronen ist maximal, und die Doppelbindung hat folglich die größtmögliche Stabilität, wenn die zu den bei den π-Elektronen gehörenden Achsen parallel sind, also die sechs Atome in einer Ebene liegen.
Kann man V(α) in der Umgebung seiner beiden Minima durch eine Parabel approxi mieren, so wird das Molekül um die beiden stabilen Gleichgewichtslagen Torsions schwingungen ausführen. Wir wollen sie untersuchen, nachdem wir uns die entspre chenden klassischen Zusammenhänge in Erinnerung gerufen haben.
3-b Klassische Bewegungsgleichungen Wir bezeichnen mit α 1 und α 2 die Winkel, die die beiden CH2 -Gruppen mit einer fes ten, durch die C–C-Achse gehenden Ebene einschließen (Abb. 9). Offensichtlich gilt
Abb. 9: Die Lage der beiden CH2 -Gruppen wird durch die Winkel α 1 und α 2 in Bezug auf eine feste Ebene bestimmt.
Beispiele für harmonische Oszillatoren
| 517
•
dann für den Winkel α in Abb. 7 α = α1 − α2
(17)
Es sei I das Trägheitsmoment einer CH2 -Gruppe in Bezug auf die C–C-Achse. Die potentielle Energie hängt nur von α = α1 − α 2 ab, so dass die Bewegungsgleichungen für die beiden Gruppen lauten I
∂ d d2 α 1 =− V(α 1 − α 2 ) = − V(α) 2 ∂α dα dt 1
d2 α 2 ∂ d I 2 =− V(α 1 − α 2 ) = + V(α) ∂α 2 dα dt
(18)
Addition und Subtraktion der beiden Gleichungen liefert d2 (α 1 + α 2 ) = 0 dt2 I
d d2 α = −2 V(α) 2 dα dt
(19a) (19b)
Nach Gl. (19a) kann sich das Molekül unabhängig von der Torsionsbewegung frei um die C–C-Achse drehen: Der Winkel (α 1 + α 2 )/2, der die Winkelhalbierende zwischen den Lagen der beiden CH2 -Gruppen kennzeichnet, ist eine lineare Funktion der Zeit. Durch Gl. (19b) wird die eigentliche Torsionsbewegung, also die Drehung der einen Gruppe relativ zur anderen, beschrieben. Wir untersuchen diese Bewegung in der un mittelbaren Umgebung der stabilen Gleichgewichtslage α = 0 und entwickeln hierzu den Ausdruck (16) an dieser Stelle: V(α) ≈ V0 α 2
(20)
Setzen wir dies in Gl. (19b) ein, so erhalten wir d2 α 4V0 α=0 + I dt2
(21)
Das ist wieder die Bewegungsgleichung eines eindimensionalen harmonischen Oszil lators (α ist die einzige Variable) mit der (Kreis-)Frequenz ωT = 2√
V0 I
(22)
Für das C2 H4 -Molekül ist ωT von der Größenordnung 825 cm−1 .
3-c Quantenmechanische Behandlung In der Umgebung der beiden Gleichgewichtslagen α = 0 und α = π besitzt das Molekül Torsionszustände mit der quantisierten Energie E n = (n + 1/2)ℏωT und n = 0, 1, 2, . . .
•
518 | Ergänzung AV
In erster Näherung ist jedes Niveau zweifach entartet, weil zu ihm zwei Zustände |φ n ⟩ und |φn ⟩ mit den Wellenfunktionen φ n (α) und φn (α) gehören, die sich voneinander nur dadurch unterscheiden, dass die eine in α = 0 und die andere in α = π konzen triert ist (Abb. 10).
(a)
(b) Abb. 10: Wird der Tunneleffekt für die Potentialbarrieren bei α = π/2 und α = 3π/2 nicht berücksich tigt, so erhält man die Torsionszustände des Moleküls, die in den Potentialtöpfen bei α = 0 (a) und α = π (b) lokalisiert sind.
Nun müssen wir aber als einen typischen Quanteneffekt beachten, dass die Poten tialbarriere zwischen den beiden Minima in Abb. 8 durchtunnelt werden kann. Einer ähnlichen Situation sind wir bereits in Ergänzung GIV im Zusammenhang mit der In version des Ammoniakmoleküls begegnet. Bei einer analogen Rechnung würde sich wieder zeigen, dass die Entartung der beiden Zustände |φ n ⟩ und |φn ⟩ durch den Tun neleffekt aufgehoben wird: Es treten für jeden Wert von n zwei stationäre Zustände |ψ+n ⟩ und |ψ−n ⟩ auf (in erster Näherung sind es die symmetrische und die antisymme trische Linearkombination von |φ n ⟩ und |φn ⟩), die durch eine Energiedifferenz ℏδ n voneinander getrennt sind. Diese ist umso größer, je größer n ist, d. h. je näher E n an V0 liegt. Dagegen ist ℏδ n im Vergleich zum Abstand ℏωT , der zwischen den beiden aufeinanderfolgenden Niveaus zu n und n ± 1 besteht (Abb. 11), stets sehr klein. Daher beschreibt der Erwartungswert des Winkels eine Schwingung mit der ho hen Frequenz ωT um α = 0 oder um α = π, der sich viel langsamere Schwingungen mit den Bohr-Frequenzen δ0 /2π, δ1 /2π und δ2 /2π, . . . überlagern.
Beispiele für harmonische Oszillatoren
|
519
•
Abb. 11: Der Tunneleffekt hebt die Entartung der Energie niveaus in Abb. 10 auf und dies umso stärker, je näher das Niveau beim Barrierengipfel liegt (δ 1 > δ 0 ). |ψ 0+ ⟩, |ψ 0− ⟩, |ψ 1+ ⟩ und |ψ 1− ⟩ sind die neuen stationären Zustände.
Bemerkung: Es existieren auch Niveaus, für die die Energie oberhalb der maximalen Barrierenhöhe V0 in Abb. 8 liegt. Diese Niveaus gehören zu einer so großen Rotationsenergie, dass man eine der beiden CH2 -Gruppen gegenüber der anderen fast als frei auffassen kann (wobei sie allerdings durch das Potential der Abb. 8 periodisch gebremst und beschleunigt wird). Das Ethanmolekül C2 H6 zeigt ein derartiges Verhalten. Bei ihm fehlen die π-Elektronen, so dass sich eine CH3 -Gruppe in Bezug auf die andere viel leichter drehen kann (die Potentialbarriere hat eine viel geringere Höhe V0 ). Aus Symmetriegründen hat das Potential V(α), das die freie Drehung einer CH3 -Gruppe zu behindern versucht, in diesem Fall die Periode 2π/3.
4 Schwere Myonenatome Das Myon μ− (aus historischen Gründen nennt man es auch das μ-Meson) ist ein Teil chen⁴, das bis auf die 207-fach größere Masse dieselben Eigenschaften wie das Elek tron hat. Es unterliegt insbesondere nicht der starken Wechselwirkung und koppelt mit den Kernen im Wesentlichen elektromagnetisch. Ein in Materie gebremstes Myon kann vom Coulomb-Feld eines Atomkerns angezogen werden und mit diesem einen gebundenen Zustand bilden. Ein derartiges System nennt man ein Myonenatom.
4-a Vergleich mit dem Wasserstoffatom In § C von Kapitel VII werden wir die gebundenen Zustände von zwei Teilchen mit entgegengesetzter Ladung und dabei vor allem das Wasserstoffatom behandeln. Wir werden sehen, dass die Ergebnisse der Quantenmechanik hinsichtlich der Energien der gebundenen Zustände mit den Aussagen übereinstimmen, die sich aus dem Bohr schen Atommodell ergeben. Auch die Ausdehnung der Wellenfunktionen ist von der Größenordnung des Bohrschen Radius. Wir wollen daher in diesem einfachen Modell die Energien und Ausdehnungen der ersten gebundenen Zustände eines Myons im Coulomb-Feld eines schweren Kerns (Z = 82, A = 207) berechnen. 4 Das Myon ist instabil. Es zerfällt in ein Elektron und zwei Neutrinos.
•
520 | Ergänzung AV
Behandelt man den Kern als unendlich schwer, so ist die Energie der n-ten Bohr schen Bahn En = −
Z 2 me4 1 2ℏ2 n2
(23)
worin Z die Ordnungszahl des Kerns, e2 = q2 /4πε0 (q die Elektronenladung) und m die Masse des Elektrons bzw. des Myons ist. Geht man vom Wasserstoffatom zum hier betrachteten Myonenatom über, so wird E n mit dem Faktor Z 2 m μ /me = (82)2 ⋅ 207 = 1.4 ⋅ 106 multipliziert. Für das Myonenatom ist demnach E1 = −19 MeV E2 = −4.7 MeV
(24)
Mit dem Ausdruck rn =
n2 ℏ2 Zme2
(25)
für den Radius der n-ten Bohrschen Bahn erhalten wir beim Wasserstoff für r1 ≈ 0.5 × 10−8 cm. Diese Zahl müssen wir durch Zm μ /me teilen, um für das Myon zu erhalten r1 = 3 × 10−13 cm r2 = 12 × 10−13 cm
(26)
Hierbei haben wir stillschweigend den Kern als punktförmig angenommen (so wohl beim Bohrschen Modell als auch in der Theorie, die wir in Kapitel VII, § C vor stellen, wird für das Potential −Ze2 /r gesetzt). Wie wir aber an der geringen Größe von r1 und r2 in Gl. (26) sehen, kann diese Annahme bei einem schweren Myonenatom auf keinen Fall gültig sein. So hat der Bleikern einen nicht zu vernachlässigenden Radius ρ 0 von der Größenordnung 8.5 × 10−13 cm (wir erinnern daran, dass der Kernradius mit A1/3 geht). Wir müssen also in Erwägung ziehen, dass die Ausdehnung der Wel lenfunktionen geringer als die des Kerns sein kann.⁵ Darum müssen wir das Problem aufs neue angehen und zunächst das Potential berechnen, das das Myon sowohl au ßerhalb als auch im Innern der Kernladungsverteilung „spürt“.
4-b Schweres Myonenatom als Oszillator In einem groben Modell für den Bleikern nehmen wir an, dass seine Ladung in einer Kugel mit dem Radius ρ 0 = 8.5 × 10−13 cm gleichmäßig verteilt ist. 5 Beim Wasserstoffatom hat die Wellenfunktion eine Ausdehnung von einigen 10−8 cm und ist un gefähr 105 -mal größer als die Größe des Protons. Darum dürfen wir es als punktförmig ansehen. Die neue Situation resultiert aus Faktoren, die alle im gleichen Sinn wirken: Vergrößerung der Masse m, Vergrößerung von Z, was sowohl zu einer stärkeren elektrostatischen Anziehung als auch zu einem viel größeren Kernradius führt.
Beispiele für harmonische Oszillatoren
| 521
•
Ist der Abstand r des Myons vom Mittelpunkt dieser Kugel größer als ρ 0 , so ist seine potentielle Energie V(r) = −
Ze2 r
für r ≥ ρ 0
(27)
Für r < ρ 0 kann man die auf das Myon wirkende elektrostatische Kraft über das Gauß sche Gesetz berechnen. Sie ist zum Kugelmittelpunkt gerichtet und hat den Betrag Ze2 (
r 3 1 Ze2 ) 2 = 3 r ρ0 r ρ0
(28)
Diese Kraft ergibt sich aus der Ableitung des Potentials V(r) =
1 Ze2 2 r +C 2 ρ 30
für r ≤ ρ 0
(29)
Die Konstante C wird durch die Bedingung festgelegt, dass die Ausdrücke (27) und (29) für r = ρ 0 gleich sein müssen: C=−
3 Ze2 2 ρ0
(30)
In Abb. 12 ist der Verlauf der potentiellen Energie des Myons in Abhängigkeit von r wiedergegeben.
Abb. 12: Verlauf des Potentials für ein Myon μ− , das von einem Kern mit dem Radius ρ0 ange zogen wird. Ist r < ρ0 , so ist das Potential (bei konstanter Dichte der Kernladung) parabel förmig; ist r > ρ0 , so ändert sich V(r) wie 1/r (Coulomb-Gesetz).
Im Innern des Kerns ist das Potential parabelförmig. Aus den obigen Abschätzungen müssen wir schließen, dass die Annahme eines reinen Coulomb-Potentials unrealis tisch wäre, denn die Wellenfunktion ist überwiegend in dem Bereich konzentriert, in dem das Potential die Form einer Parabel hat. Es ist in diesem Fall viel eher gerechtfer tigt, das Myon als ein Teilchen zu betrachten, das „elastisch“ an den Kern gebunden ist. Man hat es dann mit einem dreidimensionalen harmonischen Oszillator (s. Ergän zung EV ) der Frequenz ω=√
Ze2 m μ ρ 30
(31)
•
522 | Ergänzung AV
zu tun. Wir werden indessen sehen, dass die Wellenfunktion für den Grundzustand dieses Oszillators außerhalb des Kerns nicht verschwindet, so dass sich die harmoni sche Näherung als unzureichend erweist. Bemerkung: Das hier untersuchte System weist viele Ähnlichkeiten mit dem ersten Atommodell von J. J. Thom son auf. Er hatte nämlich vorgeschlagen, dass die positive Ladung des Atoms in einer Kugel mit einem Radius von einigen 10−8 cm verteilt sein soll und die Elektronen sich in dem von dieser Ladung hervorgerufenen parabolischen Potential bewegen (Modell des elastisch gebundenen Elektrons). Erst seit den Versuchen von Rutherford weiß man, dass der Kern viel kleiner ist und das Thomsonsche Modell nicht der Wirklichkeit entspricht.
4-c Größenordnung der Energien und Ausdehnung der Wellenfunktionen Trägt man in den Ausdruck (31) die Werte Z = 82 e2 1 ≈ ℏc 137 ℏ ≈ 1.05 × 10−34 J s
c = 3 × 108 m/s m μ = 207 me = 1.86 × 10−28 kg ρ 0 = 8.5 × 10−15 m
ein, so findet man ω ≈ 1.3 × 1022 rad s−1
(32)
was einer Energie ℏω ≈ 8.4 MeV entspricht. Diesen Wert kann man mit der Tiefe des Potentialtopfes Diese ist 3 Ze2 ≈ 21 MeV 2 ρ0
(33) 3 Ze 2 2 ρ0
vergleichen.
(34)
Man sieht, dass ℏω kleiner ist, jedoch nicht klein genug, als dass man den nichtpara bolischen Anteil von V(r) vernachlässigen dürfte. Entsprechend erhalten wir für die Ausdehnung des Grundniveaus bei einem voll kommen parabolischen Potentialtopf die Größenordnung √
ℏ ≈ 4.7 × 10−13 cm 2m μ ω
(35)
Unsere obigen qualitativen Angaben werden also bestätigt: Ein wesentlicher Teil der Myonenwellenfunktion befindet sich im Innern des Kerns. Man darf trotzdem nicht völlig vernachlässigen, was außerhalb des Kerns geschieht.
Beispiele für harmonische Oszillatoren
|
523
•
Aus diesen Gründen ist die exakte Berechnung der Energien und Wellenfunktio nen viel verwickelter als bei einem einfachen harmonischen Oszillator. Man muss die Schrödinger-Gleichung mit dem in Abb. 12 angegebenen Potential lösen (und hierbei zusätzlich den Spin, die relativistischen Korrekturen usw. berücksichtigen). Derartige Rechnungen haben ihre Bedeutung, weil die Energie der von einem schweren Myo nenatom emittierten Photonen Aufschluss über die Kernstruktur liefert, so unter an derem über die tatsächliche Ladungsverteilung im Kernvolumen. Bemerkung: Bei gewöhnlichen Atomen (mit Elektronen statt Myonen) darf man die Abweichung des Potentials von der Coulomb-Form −Ze 2 /r vernachlässigen. Man kann sie jedoch im Rahmen der Störungs rechnung (s. Kap. XI) berücksichtigen. In Ergänzung DXI werden wir diesen Volumeneffekt des Kerns untersuchen.
Referenzen und Literaturhinweise Molekülschwingungen: Karplus und Porter (12.1), Kap. 7; Pauling und Wilson (1.9), Kap. X; Herzberg (12.4). Bd. I, Kap. III, § 1; Landau und Lifshitz (1.19), Kap. XI und XIII. Stimulierter Raman-Effekt: Baldwin (15.19), § 5.2; siehe auch den Artikel von Schawlow (15.17). Torsionsschwingungen: Herzberg (12.4), Bd. II, Kap. II, § 5 d; Kondratiev (11.6), § 37. Einstein-Modell: Kittel (13.2), Kap. 6; Seitz (13.4), Kap. III; Ziman (13.3), Kap. 2; siehe auch den Artikel Bertman und Guyer (13.20). Myonenatome: Cagnac und Pebay-Peyroula (11.2), § XIX-7; Weissenberg (16.19), § 4–2; siehe auch den Artikel von De Benedetti (11.21).
•
524 | Ergänzung BV
Ergänzung BV Stationäre Zustände. Hermitesche Polynome 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c
Hermitesche Polynome | 524 Definition und einfache Eigenschaften | 524 Erzeugende Funktion | 525 Rekursionsbeziehungen. Differentialgleichung | 526 Beispiele | 527 Eigenfunktionen des Hamilton-Operators für den harmonischen Oszillator | 527 Erzeugende Funktion | 527 Eigenfunktionen und hermitesche Polynome | 529 Rekursionsbeziehungen | 529
Wir wollen in diesem Abschnitt etwas genauer als in § C-2 von Kapitel V die zu den stationären Zuständen |φ n ⟩ des harmonischen Oszillators gehörenden Wellenfunk tionen φ n (x) = ⟨x|φ n ⟩ untersuchen. Hierzu definieren wir zunächst die hermiteschen Polynome und besprechen ihre grundsätzlichen Eigenschaften.
1 Hermitesche Polynome 1-a Definition und einfache Eigenschaften Wir betrachten die Gauß-Funktion F(z) = e−z
2
(1)
Ihr Bild ist die Glockenkurve (Abb. 1). Ihre ersten beiden Ableitungen sind F (z) = −2z e−z
2
F (z) = (4z2 − 2) e−z
(2) 2
(3)
Allgemein kann die n-te Ableitung F (n) (z) in der Form F (n) (z) = (−1)n H n (z) e−z
2
(4)
geschrieben werden, worin H n (z) ein Polynom n-ten Grades in z ist. Der Beweis erfolgt durch Rekursion. Die Aussage ist für n = 1 und n = 2 richtig [s. Gleichungen (2) und (3)]. Wir machen die Annahme, dass sie für n − 1 richtig ist: F (n−1) (z) = (−1)n−1 H n−1 (z) e−z
2
(5)
mit dem Polynom (n − 1)-ten Grades H n−1 (z). Leitet man diese Gleichung nach z ab, so erhält man mit Gl. (4) sofort, dass man H n (z) = (2z −
d ) H n−1 (z) dz
https://doi.org/10.1515/9783110638738-048
(6)
Stationäre Zustände. Hermitesche Polynome
|
525
•
setzen muss. Weil H n−1 (z) ein Polynom (n − 1)-ten Grades ist, ist H n (z) ein Polynom n-ten Grades. Man nennt es das hermitesche Polynom vom Grade n. Seine Definition ist daher n 2 d 2 H n (z) = (−1)n ez e−z (7) dz n An Gl. (2) und Gl. (3) erkennt man, dass H1 (z) gerade und H2 (z) ungerade sind. An dererseits zeigt die Beziehung (6), dass H n (z) die entgegengesetzte Parität zu H n−1 (z) besitzt (falls diese von bestimmter Parität ist). Hieraus ergibt sich, dass H n (z) die Pa rität (−1)n hat.
Abb. 1: Verlauf der Gauß-Funktion F(z) und ihrer ersten Ableitungen
Man kann zeigen, dass H n (z) genau n reelle Nullstellen besitzt, unter denen sich die Nullstellen von H n−1 (z) befinden. Für n = 1, 2, 3 erkennt man dies an Abb. 1 und den Gleichungen (1) bis (3). Durch Rekursion kann man das Ergebnis verallgemeinern: H n−1 (z) habe n − 1 Nullstellen. Sind z1 und z2 zwei aufeinanderfolgende Nullstellen von H n−1 (z), also auch von F (n−1) (z), so gibt es nach dem Satz von Rolle zwischen z1 und z2 wenigstens eine Stelle z3 , so dass die Ableitung von F (n−1) (z), also F (n) (z) gleich null ist. Also ist H n (z3 ) = 0. Weil weiter F (n−1) (z) für z → −∞ und z → +∞ ver schwindet, haben F (n) (z) und H n (z) wenigstens n Nullstellen (aber auch nicht mehr, da H n (z) vom Grade n ist), zu denen die Nullstellen von H n−1 (z) gehören.
1-b Erzeugende Funktion Wir betrachten die von z und λ abhängige Funktion F(z + λ) = e−(z+λ)
2
(8)
Ihre Taylor-Entwicklung in Bezug auf λ lautet ∞
F(z + λ) = ∑ n=0 ∞
= ∑
n=0
λ n (n) F (z) n! λn 2 (−1)n H n (z) e−z n!
(9)
•
526 | Ergänzung BV 2
Multiplizieren wir mit ez und ersetzen λ durch −λ, so erhalten wir ∞
λn H n (z) n! n=0
2
ez F(z − λ) = ∑
(10)
d. h. wenn wir hier den Ausdruck für F(z − λ) einsetzen, e−λ
2
+2λz
∞
= ∑ n=0
λn H n (z) n!
(11)
Die hermiteschen Polynome ergeben sich also aus einer Entwicklung der Funktion 2 e−λ +2λz nach Potenzen von λ. Sie heißt deshalb die erzeugende Funktion der hermi teschen Polynome. Aus der Beziehung (11) ergibt sich eine weitere Definition der her miteschen Polynome. Sie lautet H n (z) = (
∂ n −λ 2 +2λz e ) ∂λ n λ=0
(12)
1-c Rekursionsbeziehungen. Differentialgleichung Eine erste Rekursionsbeziehung ergab sich bereits mit Gl. (6). Durch Differenzieren von Gl. (11) ergeben sich sofort weitere. Leitet man sie nach z ab, so wird 2λe−λ
2
+2λz
∞
= ∑ n=0
λn d H n (z) n! dz
(13)
woraus, wenn wir für e−λ +2λz die Entwicklung (11) einsetzen und die Koeffizienten mit gleicher Potenz in λ vergleichen, 2
d H n (z) = 2nH n−1 (z) dz
(14)
wird. Leitet man Gl. (11) entsprechend nach λ ab, so erhält man H n (z) = 2zH n−1 (z) − 2(n − 1)H n−2 (z)
(15)
Schließlich können wir eine Differentialgleichung aufstellen, der die hermi teschen Polynome genügen. Hierzu differenzieren wir Gl. (14) nach z und berück sichtigen Gl. (6). Es ergibt sich d2 d H n (z) = 2n H n−1 (z) 2 dz dz = 2n[2zH n−1 (z) − H n (z)]
(16)
d. h. wenn wir H n−1 (z) durch Gl. (14) ersetzen, [
d2 d − 2z + 2n] H n (z) = 0 dz dz2
(17)
Stationäre Zustände. Hermitesche Polynome |
527
•
1-d Beispiele Mit der Definition (7) oder, was auf das Gleiche hinausläuft, mit der Rekursionsbezie hung (6) kann man die ersten hermiteschen Polynome leicht berechnen. Wir erhalten H0 (z) = 1 H1 (z) = 2z
(18)
H2 (z) = 4z2 − 2 H3 (z) = 8z3 − 12z Allgemein ist H n (z) = (2z −
d n ) 1 dz
(19)
2 Eigenfunktionen des Hamilton-Operators für den harmonischen Oszillator 2-a Erzeugende Funktion Wir betrachten die Funktion ∞
1 n λ ⟨x|φ n ⟩ √ n=0 n!
K(λ, x) = ∑
(20)
Mit der Beziehung |φ n ⟩ =
1 (a† )n |φ0 ⟩ √n!
(21)
[s. Gl. (C-13) in Kapitel V] erhält man ∞
K(λ, x) = ∑ ⟨x| n=0
(λa† )n |φ0 ⟩ n! †
= ⟨x|eλa |φ0 ⟩
(22)
̂ und P ̂ mit der Dimension eins ein: Wir führen wie in Kapitel V die Operatoren X ̂ = βX X ̂= P P βℏ
(23)
worin der Parameter β die Dimension einer Länge hat und durch β=√
mω ℏ
(24)
•
528 | Ergänzung BV
definiert ist. Der Operator λ
†
eλa = e √2
̂ P) ̂ ( X−i
(25)
kann mit Verwendung der Beziehung (63) aus Ergänzung BII berechnet werden, wenn man λ ̂ X √2 iλ ̂ B=− P √2
A=
(26)
setzt. Man erhält λ ̂ iλ ̂ i 2 X − P ̂ ̂ √2 e 4 λ [ X, P]
†
eλa = e √2 e
λ ̂ iλ ̂ P X − 2 √2 e−λ /4
= e √2 e
(27)
Setzt man dies in Gl. (22) ein, so ergibt sich ̂ (−iλ/√2) P ̂ √2) X
K(λ, x) = e−λ
2
/4
⟨x|e(λ/
= e−λ
2
/4 βλx/√2
e
e
|φ0 ⟩
√2)P/βℏ
⟨x|e(−iλ/
|φ0 ⟩
(28)
Nun ist [s. Ergänzung EII , Gl. (15)] −i
⟨x|e
λP βℏ√2
= ⟨x − λ/β √2|
(29)
und Gl. (28) lautet K(λ, x) = e−λ
2
/4 βλx/√2
⟨x − λ/β √2|φ0 ⟩
= e−λ
2
/4 βλx/√2
φ0 (x − λ/β √2)
e e
(30)
Beachtet man Gl. (C-25) aus Kapitel V, so wird schließlich K(λ, x) = (
β2 ) π
1/4
exp [−
β2 x2 λ2 + βλx√2 − ] 2 2
(31)
Aufgrund der Definition (20) genügt es, diesen Ausdruck nach Potenzen von λ zu ent wickeln, wenn man die Wellenfunktion φ n (x) = ⟨x|φ n ⟩ erhalten will: ∞
λn φ n (x) n=0 √ n!
K(λ, x) = ∑
K(λ, x) heißt die erzeugende Funktion der φ n (x).
(32)
Stationäre Zustände. Hermitesche Polynome
| 529
•
2-b Eigenfunktionen und hermitesche Polynome Ersetzen wir in Gl. (11) λ durch λ/√2 und z durch βx, so erhalten wir exp [−
∞ λ n 1 λ2 + βλx√2] = ∑ ( H n (βx) ) 2 n! n=0 √2
(33)
Diesen Ausdruck setzten wir in Gl. (31) ein: K(λ, x) = (
1/4 ∞
β2 ) π
∑(
n=0
λ n 1 −β2 x2 /2 H n (βx) e ) n! √2
(34)
Der Koeffizientenvergleich zwischen den Ausdrücken (32) und (34) liefert dann φ n (x) = (
β2 ) π
1/4
1 √2n n!
e−β
x /2
2 2
H n (βx)
(35)
Die Funktion φ n (x) verhält sich also wie die n-te Ableitung der Gauß-Funktion F(x). Sie hat die Parität (−1)n und besitzt n Nullstellen. In Kap. V, § C-2 wiesen wir bereits darauf hin, dass diese Eigenschaft mit der Zunahme der mittleren kinetischen Energie für wachsendes n in Zusammenhang steht.
2-c Rekursionsbeziehungen Wir drücken die Gleichungen a|φ n ⟩ = √n|φ n−1 ⟩
(36)
a† |φ n ⟩ = √n + 1|φ n+1 ⟩
in der Ortsdarstellung aus. Mit den Definitionen der Operatoren a und a† [s. Gleichun gen (B-6) in Kapitel V] sieht man, dass diese Operatoren durch a
⇒
β 1 d ] [x + 2 √2 β dx
a†
⇒
β 1 d ] [x − 2 √2 β dx
(37)
gegeben sind. Damit wird aus Gl. (36) β [x + √2 β [x − √2
1 β2 1 β2
d ] φ n (x) = √n φ n−1 (x) dx d ] φ n (x) = √n + 1 φ n+1 (x) dx
(38)
Bilden wir aus diesen beiden Gleichungen die Summe und die Differenz, so ergibt sich xβ √2φ n (x) = √nφ n−1 (x) + √n + 1φ n+1 (x)
(39)
√2 d φ n (x) = √nφ n−1 (x) − √n + 1φ n+1 (x) β dx
(40)
•
530 | Ergänzung BV
Bemerkung: Ersetzen wir in diesen Gleichungen die Funktionen φ n (x) durch die in Gl. (35) gegebenen Aus drücke, so erhält man nach Vereinfachung (und der Setzung ̂x = βx) 2̂x H n (̂x) = 2nH n−1 (̂x) + H n+1 (̂x )
(41)
d 2 [−̂x H n (̂x) + H n (̂x)] = 2nH n−1 (̂x) − H n+1 (̂x ) d̂x
(42)
Bildet man hiervon die Summe bzw. die Differenz, so ergeben sich wieder die Beziehungen (14) bzw. (6).
Referenzen und Literaturhinweise Messiah (1.17), Anhang B, § III; Arfken (10.4), Kap. 13, § 1; Angot (10.2), § 7.8.
Lösung der Eigenwertgleichung mit der Polynommethode |
531
•
Ergänzung CV Lösung der Eigenwertgleichung mit der Polynommethode 1 2 2-a 2-b 2-c 2-d
Wechsel der Variablen | 531 Polynommethode | 533 Asymptotische Form von ̂ φ (̂x ) | 533 Berechnung von h(̂x) durch Potenzreihenentwicklung | 534 Quantisierung der Energie | 535 Stationäre Wellenfunktionen | 537
Die Methode, mit der wir in § B von Kapitel V die Energien der stationären Zustän de |φ n ⟩ des harmonischen Oszillators berechnet haben, basierte auf der Verwendung der Operatoren a, a† , N und ihrer Vertauschungsrelationen. Man kann zu denselben Ergebnissen auch auf eine ganz andere Weise gelangen, indem man die Eigenwert gleichung des Hamilton-Operators H in der Ortsdarstellung löst. Dies soll in diesem Abschnitt geschehen.
1 Wechsel der Variablen In der Ortsdarstellung lautet die Eigenwertgleichung des Hamilton-Operators [−
ℏ2 d2 1 + mω2 x2 ] φ(x) = E φ(x) 2m dx2 2
(1)
Wir führen wie in Kapitel V die Operatoren ̂ = βX X ̂= P P βℏ
(2)
mit der Dimension eins ein, wobei der Parameter β mit der Dimension einer Länge durch β=√
mω ℏ
(3)
̂ zum Eigenwert ̂x nennen wir |ξ ̂x ⟩: definiert ist. Den Eigenvektor von X ̂ ̂x ⟩ = ̂x|ξ ̂x ⟩ X|ξ
(4)
Die Orthonormierungsbedingungen und die Vollständigkeitsrelation für die Kets |ξ ̂x ⟩ lauten dann ⟨ξ ̂x |ξ ̂x ⟩ = δ(̂x − ̂x )
(5)
+∞
∫ d ̂x|ξ ̂x ⟩⟨ξ ̂x | = 1 −∞ https://doi.org/10.1515/9783110638738-049
(6)
•
532 | Ergänzung CV
Offensichtlich ist der Ketvektor |ξ ̂x ⟩ Eigenvektor von X zum Eigenwert ̂x/β. Weil x̂ = βx
(7)
ist, sind die Kets |x⟩ und |ξ ̂x ⟩ zueinander proportional. Sie müssen aber nicht gleich sein. Die Vollständigkeitsrelation für die Vektoren |x⟩ lautet nämlich +∞
∫ dx|x⟩⟨x| = 1
(8)
−∞
Führen wir in diesem Integral den Variablenwechsel (7) durch, so erhalten wir +∞
∫ −∞
d ̂x |x = x̂/β⟩⟨x = ̂x/β| = 1 β
(9)
Der Vergleich mit Gl. (6) zeigt, dass man z. B. |x = ̂x/β⟩ = √ β|ξ ̂x ⟩
(10)
setzen kann, damit die Kets |x⟩ in Bezug auf x und die Kets |ξ ̂x ⟩ in Bezug auf ̂x ortho normiert sind. Es sei |φ⟩ ein beliebiger Vektor, φ(x) = ⟨x|φ⟩ seine Wellenfunktion in der Orts darstellung und ̂ φ(̂x ) = ⟨̂x |φ⟩ seine Wellenfunktion in der {|ξ ̂x ⟩}-Darstellung. Nach Gl. (10) ist ̂ φ (̂x ) = ⟨ξ ̂x |φ⟩ =
1 ⟨x = ̂x /β|φ⟩ √β
(11)
d. h. ̂ φ (̂x ) =
1 φ(x = ̂x/β) √β
(12)
Ist |φ⟩ normiert, so liefert Gl. (8) +∞
+∞
⟨φ|φ⟩ = ⟨φ| ( ∫ dx|x⟩⟨x|) |φ⟩ = ∫ φ∗ (x)φ(x) d x = 1 −∞
(13)
−∞
und Gl. (6) +∞
+∞
̂∗ (̂x )̂ ⟨φ|φ⟩ = ⟨φ| ( ∫ d ̂x|ξ ̂x ⟩⟨ξ ̂x |) |φ⟩ = ∫ φ φ (̂x) d ̂x = 1 −∞
(14)
−∞
Die Wellenfunktion φ(x) wird also in Bezug auf x und die Funktion ̂ φ(̂x ) in Bezug auf ̂x normiert [dies kann man übrigens auch unmittelbar sehen, indem man im Integral in Gl. (13) den Variablenwechsel (7) vornimmt und Gl. (12) beachtet].
533
Lösung der Eigenwertgleichung mit der Polynommethode |
•
Setzen wir nun Gl. (7) und Gl. (12) in Gl. (1) ein und setzen ε=
E ℏω
(15)
so erhalten wir die Differentialgleichung 1 d2 φ (̂x) = ε ̂ φ (̂x ) [− 2 + ̂x2 ] ̂ 2 d ̂x
(16)
Sie lässt sich bequemer als Gl. (1) behandeln, weil in ihr alle Größen die Dimension eins haben.
2 Polynommethode ̂ (̂ 2-a Asymptotische Form von φ x) Gleichung (16) kann man in der Form [
d2 − (̂x2 − 2ε)] ̂ φ(̂x ) = 0 d ̂x2
(17)
schreiben. Wir fragen nach dem Verhalten von ̂ φ(̂x ) für große ̂x. Hierzu betrachten wir die Funktionen G± (̂x) = e±̂x
2
/2
(18)
Sie sind Lösungen der Differentialgleichungen [
d2 − (̂x2 ± 1)] G± (̂x ) = 0 d ̂x2
(19)
Geht ̂x gegen unendlich, so wird ̂x2 ± 1 ∼ ̂x2 ∼ x̂2 − 2ε
(20)
und die Gleichungen (17) und (19) nehmen asymptotisch dieselbe Form an. Man erwar 2 2 tet also, dass sich die Lösungen von Gl. (17) für große x̂ wie êx /2 oder wie e−̂x /2 ver halten.¹ Physikalisch interessieren uns nur die beschränkten Funktionen ̂ φ (̂x), d. h. die Lösungen von Gl. (17), die sich (für den Fall ihrer Existenz) im Unendlichen wie 2 e−̂x /2 verhalten. Wir setzen darum ̂ φ(̂x ) = e−̂x
2
/2
h(̂x )
(21)
1 Es ist nicht zwingend, dass die Lösungen von Gl. (17) für ̂ x → ∞ gegen êx /2 oder e−̂x /2 gehen. 2 Unsere intuitiven Überlegungen schließen z. B. nicht aus, dass ̂ φ(̂x) gegen das Produkt von êx /2 oder 2 /2 −̂ x e mit einer Potenz von ̂x geht. 2
2
•
534 | Ergänzung CV
Damit erhalten wir aus Gl. (17) die Differentialgleichung d2 d h(̂x ) − 2̂x h(̂x ) + (2ε − 1)h(̂x ) = 0 d ̂x d x̂2
(22)
Sie kann man über eine Potenzreihenentwicklung von h(̂x ) lösen.
2-b Berechnung von h(̂ x ) durch Potenzreihenentwicklung In § A-3 von Kapitel V wiesen wir darauf hin, dass wir die Lösungen von Gl. (1) [bzw. die von Gl. (17)] unter den Funktionen mit gerader oder ungerader Parität suchen können. 2 Weil die Funktion e−̂x /2 gerade ist, können wir h(̂x ) = x̂ p (a0 + a2 ̂x2 + a4 x̂4 + . . . + a2m ̂x2m + . . .)
(23)
mit a0 ≠ 0 setzen (a0 ̂x p ist dann der erste nichtverschwindende Term in der Entwick lung). Schreiben wir kürzer ∞
h(̂x ) = ∑ a2m ̂x2m+p
(24)
m=0
so erhalten wir für die erste Ableitung ∞ d h(̂x ) = ∑ (2m + p)a2m ̂x(2m+p−1) d x̂ m=0
(25)
und für die zweite Ableitung ∞ d2 h(̂x ) = ∑ (2m + p)(2m + p − 1)a2m ̂x(2m+p−2) 2 d x̂ m=0
(26)
Wir setzen die drei letzten Ausdrücke in Gl. (22) ein. Damit diese Gleichung identisch in ̂x erfüllt ist, müssen die Koeffizienten in der Entwicklung (auf der linken Seite der Gleichung) einzeln gleich null sein. Für den allgemeinen Term in ̂x2m+p bedeutet dies, dass (2m + p + 2)(2m + p + 1)a2m+2 = (4m + 2p − 2ε + 1)a2m
(27)
sein muss. Der niedrigste Term ist der mit ̂x p−2 . Damit sein Koeffizient verschwindet, muss p(p − 1)a0 = 0
(28)
sein. Da a0 nicht gleich null ist, muss entweder p = 0 (die Funktion φ(x) ist dann gerade) oder p = 1 sein (sie ist dann ungerade).
Lösung der Eigenwertgleichung mit der Polynommethode |
535
•
Gleichung (27) kann man schreiben als a2m+2 =
4m + 2p + 1 − 2ε a2m (2m + p + 2)(2m + p + 1)
(29)
Dies liefert eine Rekursionsbeziehung zwischen den Koeffizienten a2m . Da a0 ≠ 0 ist, kann man a2 aus a0 , a4 aus a2 usw. berechnen. Für beliebiges ε kennen wir somit die Reihenentwicklungen von zwei linear un abhängigen Lösungen der Gl. (22), die zu p = 0 bzw. p = 1 gehören.
2-c Quantisierung der Energie Unter den eben erhaltenen Lösungen wählen wir nun die aus, für die als physikali sche Bedingung die Funktion ̂ φ(̂x ) überall beschränkt ist. Für die meisten Werte von ε verschwindet der Zähler in der Beziehung (29) für eine beliebige positive ganze Zahl m oder 0 nicht. Da dann kein Koeffizient a2m null ist, enthält die Entwicklung unendlich viele Summanden. Man kann nun zeigen, dass in diesem Fall das asymptotische Verhalten physika lisch nicht akzeptabel ist. Nach Gl. (29) gilt nämlich a2m+2 m→∞ 1 ∼ a2m m
(30) 2
Wir betrachten andererseits die Entwicklung der Funktion eλ̂x mit einem reellen Pa rameter λ. Es ist 2
∞
eλ̂x = ∑ b 2m ̂x2m
(31)
m=0
mit b 2m =
λm m!
(32)
Für diese zweite Reihe ist daher b 2m+2 m! λ m+1 λ m→∞ λ = = ∼ b 2m (m + 1)! λ m m+1 m
(33)
Wählen wir nun für den Parameter λ einen Wert, so dass 0 >0 a2m b 2m
(35)
•
536 | Ergänzung CV
ist. Unter der Bedingung (34) kann man dann zeigen, dass a 2M λ̂x2 |̂x−p h(̂x ) − P(̂x )| ≥ |e − Q(̂x )| b 2M
(36)
gilt, wobei P(x̂ ) und Q(x̂ ) Polynome vom Grade 2M sind, deren erste M + 1 Terme durch die Entwicklungen (23) und (31) gegeben sind. Geht ̂x gegen unendlich, so folgt aus dieser Ungleichung ̂x→∞ a2M ̂x p eλ̂x2 (37) |h(̂x )| ≥ b 2M und damit ̂x→∞ a2M ̂x p e(λ−1/2)̂x2 |̂ φ (̂x)| ≥ b 2M
(38)
Weil man λ so wählen kann, dass 1/2 < λ < 1
(39)
ist, kann |̂ φ(̂x )| für ̂x → ∞ nicht beschränkt sein. Wir müssen daher diese Lösung als physikalisch nicht brauchbar verwerfen. Es bleibt nur die eine Möglichkeit, dass der Zähler in Gl. (29) für einen bestimmten Wert m0 von m gleich null wird. Man hat in diesem Fall a2m ≠ 0
wenn m ≤ m0
a2m = 0
wenn m > m0
(40)
Die Reihenentwicklung von h(x̂ ) reduziert sich dann auf ein Polynom vom Grade 2m0 + p. Das Verhalten von ̂ φ(̂x ) wird im Unendlichen durch den Exponentialaus 2 druck e−̂x /2 bestimmt; ̂ φ (̂x) ist quadratintegrabel und daher physikalisch sinnvoll. Damit der Zähler in Gl. (29) verschwindet, muss die Bedingung 2ε = 2(2m0 + p) + 1
(41)
gelten. Setzt man 2m0 + p = n
(42)
so lautet diese Gleichung ε = ε n = n + 1/2
(43)
worin n eine beliebige nichtnegative ganze Zahl ist (m ist nichtnegativ ganz, und p liegt zwischen null und eins). Durch Gl. (43) wird die Energie des harmonischen Os zillators quantisiert; sie liefert nämlich mit Gl. (15) E n = (n +
1 ) ℏω 2
Es ergibt sich somit wieder Gl. (B-34) aus Kapitel V.
(44)
Lösung der Eigenwertgleichung mit der Polynommethode |
537
•
2-d Stationäre Wellenfunktionen Mit der Polynommethode erhält man auf elegante Weise die zu den verschiedenen Energien E n gehörenden Eigenfunktionen in der Form ̂ φ n (̂x ) = e−̂x
2
/2
h n (̂x )
(45)
worin h n (̂x ) ein Polynom vom Grad n ist. Nach Gl. (23) und Gl. (42) ist h n (̂x ) für gerades n gerade und für ungerades n ungerade. Den Grundzustand erhält man für n = 0, d. h. für m0 = p = 0; h0 (̂x ) ist also eine Konstante und ̂ φ0 (̂x) = a0 e−̂x
2
/2
(46)
Damit ̂ φ0 (̂x ) in Bezug auf ̂x normiert ist, genügt es, a0 = π−1/4
(47)
zu wählen. Mit Gl. (12) findet man folglich 1/4
β2 ) π
φ0 (x) = (
e−β
x /2
2 2
(48)
und das ist der Ausdruck (C-25) aus Kapitel V. Das erste angeregte Niveau E1 = 3ℏω/2 gehört zu n = 1, d. h. zu m0 = 0 und p = 1; h1 (̂x ) besteht nur aus einem Term. Durch eine entsprechende Rechnung wie eben ergibt sich 2 4 1/4 ̂ φ1 (̂x) = ( ) x̂e−̂x /2 π
φ1 (x) = (
4β 6 ) π
(49a)
1/4
xe−β
x /2
2 2
(49b)
Für n = 2 hat man m0 = 1 und p = 0. Die Beziehung (29) liefert dann a2 = −2a0
(50)
so dass wir schließlich ̂ φ2 (̂x) = (
2 1 1/4 ) (2̂x2 − 1)e−̂x /2 4π
φ2 (x) = (
β2 ) 2π
1/4
(2β 2 x2 − 1)e−β
(51a) x /2
2 2
(51b)
haben. Für beliebiges n ist h n (̂x ) die Polynomlösung von Gl. (22). Diese lautet bei Beach tung der Quantisierungsbedingung (43) [
d d2 − 2̂x + 2n] h(̂x ) = 0 d x̂ d ̂x2
(52)
•
538 | Ergänzung CV
Dies ist die Differentialgleichung für die hermiteschen Polynome H n (̂x) [Gl. (17) in Er gänzung BV ]. Darum ist das Polynom h n (̂x ) zu H n (̂x ) proportional; der Proportionali tätsfaktor wird durch die Normierung von ̂ φ n (̂x ) festgelegt. Es ergibt sich wieder der Ausdruck (35) aus Ergänzung BV .
Referenzen und Literaturhinweise Mathematische Behandlung von Differentialgleichungen: Morse und Feshbach (10.13), Kap. 5 und 6.
Stationäre Zustände in der Impulsdarstellung |
539
•
Ergänzung DV Stationäre Zustände in der Impulsdarstellung 1 1-a 1-b 1-c 2
Wellenfunktion im Impulsraum | 539 Variablen- und Funktionswechsel | 539 ̂ ) | 540 Bestimmung von ̂ φn (p Berechnung des Phasenfaktors | 541 Physikalische Diskussion | 542
Die Verteilung der möglichen Impulswerte eines Teilchens im Zustand |φ n ⟩ wird durch die Wellenfunktion φ n (p) in der Impulsdarstellung gegeben; es ist die Fourier-Trans formierte der Wellenfunktion φ n (x) in der Ortsdarstellung. In diesem Abschnitt wollen wir zeigen, dass für den harmonischen Oszillator die Funktionen φ n und φ n (bis auf einen Faktor) gleich sind, so dass in einem stationären Zustand die Wahrscheinlich keitsverteilung des Impulses zur Verteilung des Ortes ähnlich ist.
1 Wellenfunktion im Impulsraum 1-a Variablen- und Funktionswechsel In Ergänzung CV haben wir zur Vereinfachung den Operator ̂ = βX X
(1)
mit β=√
mω ℏ
(2)
̂ eingeführt, zu denen in der {|ξ ̂x ⟩}-Darstellung die Wel und die Eigenkets |ξ ̂x ⟩ von X lenfunktionen ̂ φ(̂x ) gehören. Hier wollen wir entsprechend für den Operator ̂= P P βℏ
(3)
vorgehen. Seine Eigenkets nennen wir |π p̂ ⟩: ̂ p̂ ⟩ = p ̂ |π p̂ ⟩ P|π
(4)
̂ ): Die Wellenfunktion in der {|π p̂ ⟩}-Darstellung bezeichnen wir mit ̂ φ(p ̂p ̂ ) = ⟨π p̂ |φ⟩ φ(
(5)
So wie der Ketvektor |ξ ̂x ⟩ proportional zum Ket |x = x̂/β⟩ ist, ist der Ket |π p̂ ⟩ proportio ̂ ⟩. Ersetzt man β durch 1/βℏ [s. Gl. (1) und Gl. (3)], so folgt nach nal zum Ket |p = βℏp Gl. (10) aus Ergänzung CV ̂⟩ |π p̂ ⟩ = √βℏ|p = βℏp https://doi.org/10.1515/9783110638738-050
(6)
•
540 | Ergänzung DV
̂ ) in der {|π p̂ ⟩}-Darstellung hängt darum mit der Wellenfunkti Die Wellenfunktion ̂ φ(p on φ(p) in der Impulsdarstellung über die Beziehung ̂ ̂ ) = √βℏ φ(p = βℏp ̂) φ(p
(7)
zusammen. Andererseits erhält man mit den Beziehungen (6) und (10) aus Ergän zung CV ⟨ξ ̂x |π p̂ ⟩ =
eîp̂x √2π
(8)
Unter Beachtung der Definition (5) und der Vollständigkeitsrelation für die Basis {|ξ ̂x ⟩} wird +∞
̂ ̂ ) = ∫ ⟨π p̂ |ξ ̂x ⟩⟨ξ ̂x |φ⟩ d ̂x φ(p −∞ +∞
=
1 φ (̂x) d ̂x ∫ e−îp̂x ̂ √2π
(9)
−∞
Die Funktion ̂ φ ist demnach die Fourier-Transformierte von ̂ φ. ̂ (p 1-b Bestimmung von φ n ̂) Wir haben bereits gesehen [Gl. (16) in Ergänzung CV ], dass die stationären Wellen funktionen ̂ φ (̂x) des harmonischen Oszillators der Differentialgleichung 1 d2 φ(̂x ) = ε ̂ φ (̂x ) [− 2 + x̂2 ] ̂ 2 d ̂x
(10)
d2 ̂(x̂ ) der Ausdruck −p ̂2 ̂ ̂ ) und genügen. Nun ist die Fourier-Transformierte von d̂ φ φ(p x2 d2 ̂ ̂ ) die Fourier-Transformierte von ̂x2 ̂ − 2 φ(p φ (̂x ). So ergibt sich aus Gl. (10) durch Fou ̂ dp
rier-Transformation die Gleichung 1 2 d2 ̂ ̂p ̂ − ̂ ) = ε φ( ̂) [p ] φ(p ̂2 2 dp
(11)
φ n der Vergleichen wir Gl. (10) und Gl. (11), so sehen wir, dass die Funktionen ̂ φ n und ̂ selben Differentialgleichung genügen. Weiter wissen wir, dass diese Gleichung nur für ε = n + 1/2 (n nichtnegativ ganz) eine quadratintegrable Lösung erlaubt (die Eigen werte ε n sind nichtentartet, s. Kap. V, § B-3). Daher können wir schließen, dass ̂ φ n und ̂ φ n zueinander proportional sind. Sind beide Funktionen normiert, so ist der Propor tionalitätsfaktor eine komplexe Zahl mit dem Betrag eins. Wir schreiben daher ̂ ̂ ) = eiθ n ̂ ̂) φ n (̂x = p φ n (p worin eiθ n ein Phasenfaktor ist, den wir jetzt berechnen wollen.
(12)
•
Stationäre Zustände in der Impulsdarstellung | 541
1-c Berechnung des Phasenfaktors Die Wellenfunktion des Grundzustands ist [s. Ergänzung CV , Gl. (46) und Gl. (47)] ̂ φ0 (̂x) = π −1/4 e−̂x
2
/2
(13)
Es ist eine Gauß-Funktion. Ihre Fourier-Transformierte ist daher [s. Anhang I, Gl. (50)] 2 ̂ ̂ ) = π−1/4 e−̂p /2 φ 0 (p
(14)
woraus folgt, dass θ0 null sein muss. Um θ n zu finden, schreiben wir die Gleichung a† |φ n ⟩ = √n + 1|φ n+1 ⟩
(15)
in der {|ξ ̂x ⟩}- und in der {|π p̂ ⟩}-Darstellung. In der {|ξ ̂x ⟩}-Darstellung wirken die Ope ̂ und P ̂ wie ̂x und 1 d , a† also wie 1 (̂x − d ). In der {|p ̂ ⟩}-Darstellung wirkt ratoren X i d̂x d̂x √2 d d i † ̂ wie p ̂ wie i und P ̂ , a also wie ( − p ̂ ). X ̂ dp
̂ √2 d p
In der {|ξ ̂x ⟩}-Darstellung lautet daher Gl. (15) ̂ φ n+1 (̂x ) =
d 1 (̂x − )̂ φ n (̂x ) d ̂x √2(n + 1)
(16)
während wir in der {|π p̂ ⟩}-Darstellung ̂ ̂) = φ n+1 (p
d i ̂) ̂) ̂ ( φ n (p −p ̂ √2(n + 1) d p
(17)
erhalten. Darum ist eiθ n+1 = −ieiθ n
(18)
d. h. weil θ0 = 0 ist, eiθ n = (−i)n
(19)
Somit ist n ̂ (p ̂) φ n (̂x = p φ n ̂ ) = (−i) ̂
(20)
oder auch, wenn wir zu den Funktionen φ n und φ n zurückkehren, φ n (p) = (−i)n
1 p φ n (x = 2 ) β ℏ √ β ℏ
(21)
•
542 | Ergänzung DV
2 Physikalische Diskussion Wir betrachten ein Teilchen im Zustand |φ n ⟩. Misst man die x-Koordinate des Teil chens, so ist die Wahrscheinlichkeit, es im Intervall zwischen x und x + dx zu finden, durch ρ n (x) dx = |φ n (x)|2 dx
(22)
gegeben. Entsprechend ist bei einer Impulsmessung die Wahrscheinlichkeit, einen Wert zwischen p und p + dp zu erhalten, ρ n (p) d p = |φ n (p)|2 dp
(23)
Die Beziehung (21) ergibt somit ρ n (p) =
p 1 ρ n (x = ) mω mω
(24)
Dies zeigt, dass die Impulsverteilung in einem stationären Zustand dieselbe Form wie die Ortsverteilung hat. So weist z. B. ρ n (p) für größere n an den Stellen p = ±mωxM = ±pM
(25)
(s. Abb. 6, Kap. V) zwei Maxima auf, wobei pM der größtmögliche Impulswert für ein klassisches Teilchen ist, das sich im Potentialtopf mit der Energie E n bewegt. Durch eine Überlegung wie am Ende von § C-2 aus Kapitel V können wir dieses Ergebnis ver stehen: Hat der Impuls des klassischen Teilchens die Werte ±pM , so ist seine Beschleu nigung null, und diese Werte sind im zeitlichen Mittel die wahrscheinlichsten. Die Be merkung 1 in § D-1 von Kapitel V über die Wahrscheinlichkeitsdichte ρ n (x) kann hier übernommen werden. So kann man z. B. bei großen n die Standardabweichung ∆P als eine Abschätzung für den Abstand der bei p = ±pM liegenden Maxima von ρ n (p) interpretieren. Übrigens kann man an Abb. 6a direkt verstehen, weshalb diese Impulswerte für große n so wahrscheinlich sind. Die Wellenfunktion führt dann nämlich zwischen den beiden äußersten Maxima eine große Zahl von (sinusähnlichen) Schwingungen aus. Dies rührt daher, dass die Differentialgleichung, der die Wellenfunktion genügen muss [s. Gl. (A-17) in Kapitel V], für E ≫ mω2 x2 /2 näherungsweise zu 2mE d2 φ(x) + 2 φ(x) ≈ 0 2 dx ℏ
(26)
wird. Nach der Definition von pM ist dann φ(x) ≈ A eipM x/ℏ + A e−ipM x/ℏ
(27)
Die Wellenfunktion ist also in einem relativ ausgedehnten Bereich auf der x-Achse (für größere n) ähnlich einer Sinuswelle mit der Wellenlänge h/pM . Sie kann als die Über lagerung von zwei fortschreitenden Wellen mit entgegengesetzten Impulsen +pM und
Stationäre Zustände in der Impulsdarstellung | 543
•
−pM aufgefasst werden (entsprechend der Hin- und Herbewegung des Teilchens im Potentialtopf). Darum ist es nicht überraschend, dass die Wahrscheinlichkeitsdichte ρ n (p) in der Umgebung von p = ±pM groß ist. Auf die gleiche Weise kann man die Größenordnung des Produkts ∆X⋅∆P erklären. Nach den Beziehungen (D-6), (D-7) und (D-9) in Kapitel V ist ∆X ⋅ ∆P = (n +
1 xM pM )ℏ = 2 2
(28)
Mit wachsendem n nehmen auch die Amplituden xM und pM der Schwingungen zu, und das Produkt ∆X ⋅∆P wird sehr viel größer als sein Minimalwert ℏ/2. Man kann sich nun fragen, warum dies so ist, haben wir doch an mehreren Beispielen gesehen, dass die Breite ∆P der Fourier-Transformierten einer Funktion abnimmt, wenn die Breite ∆X der Funktion selbst wächst. Tatsächlich würde sich das auch bei den Funktionen φ n (x) zeigen, wenn sich diese in einem Intervall −xM ≤ x ≤ +xM , in dem sie wesent lich von null verschiedene Werte annehmen, nur langsam ändern und z. B. nur ein Extremum aufweisen. Für kleine n ist dies der Fall, und das Produkt ∆X ⋅ ∆P liegt nahe bei seinem kleinstmöglichen Wert. Dagegen zeigen die Funktionen φ n (x) mit größer werdendem n im Intervall −xM ≤ x ≤ +xM zahlreiche Schwingungen mit n Nullstellen. Man kann ihnen daher Wellenlängen von der Größenordnung λ ≈ xM /n ≈ ∆X/n zu ordnen, zu denen Werte des Teilchenimpulses gehören, die in einem Bereich von der Breite ∆P ≈
h nh ≈ λ ∆X
(29)
liegen. Jetzt ergibt sich für das Produkt ∆X ⋅ ∆P ≈ nh
(30)
In gewisser Hinsicht befinden wir uns in einer Situation, der wir im Zusammenhang mit dem eindimensionalen unendlich tiefen Potentialtopf (Ergänzung AIII , § 1) begeg net sind.
•
544 | Ergänzung EV
Ergänzung EV Dreidimensionaler isotroper harmonischer Oszillator 1 2 3
Hamilton-Operator | 544 Separation der Variablen | 545 Entartung der Energieniveaus | 548
In Kapitel V untersuchten wir den eindimensionalen harmonischen Oszillator. Wir wollen jetzt zeigen, wie man unter Berücksichtigung der dabei erlangten Aussagen und Ergebnisse den dreidimensionalen harmonischen Oszillator behandeln kann.
1 Hamilton-Operator Gegeben sei ein spinloses Teilchen mit der Masse m, das im (dreidimensionalen) Raum einer Zentralkraft, d. h. einer stets zum Koordinatenursprung O gerichteten Kraft ausgesetzt ist. Der Betrag dieser Kraft sei proportional zum Abstand des Teil chens von O. Dann gilt F = −kr
(1)
(k ist eine positive Konstante). Die potentielle Energie ist in diesem Fall V(r) =
1 2 1 kr = mω2 r2 2 2
(2)
wenn die Kreisfrequenz ω wie beim eindimensionalen harmonischen Oszillator defi niert wird: ω=√
k m
(3)
Die klassische Hamilton-Funktion lautet dann H(r, p) =
p2 1 + mω2 r2 2m 2
(4)
Nach den Quantisierungsregeln (Kap. III, § B-5) erhalten wir damit sofort den Hamil ton-Operator H=
P2 1 + mω2 R2 2m 2
(5)
Er ist zeitunabhängig, und wir suchen nach den Lösungen der Eigenwertgleichung H|ψ⟩ = E|ψ⟩ worin |ψ⟩ zum Zustandsraum Hr des Teilchens gehört. https://doi.org/10.1515/9783110638738-051
(6)
Dreidimensionaler isotroper harmonischer Oszillator
|
545
•
Bemerkung: Weil V(r) tatsächlich nur vom Abstand r = |r| des Teilchens vom Ursprung O abhängt [V(r) ist folglich gegenüber beliebigen Drehungen invariant], sagt man, dass man es mit einem isotropen harmonischen Oszillator zu tun habe. Die folgenden Rechnungen können jedoch auf einen aniso tropen harmonischen Oszillator verallgemeinert werden. Für diesen ist die potentielle Energie V(r) =
m 2 2 (ω x + ω2y y2 + ω2z z 2 ) 2 x
(7)
mit drei verschiedenen Konstanten ω x , ω y und ω z .
2 Separation der Variablen Wir erinnern uns daran, dass wir den Zustandsraum Hr (s. Kap. II, § F) als ein Tensor produkt schreiben können: Hr = H x ⊗ H y ⊗ H z
(8)
worin Hx der Zustandsraum eines Teilchens ist, das sich längs der x-Achse bewegt, d. h. der Raum, der den Wellenfunktionen φ(x) zugeordnet ist; die Räume Hy und Hz sind entsprechend definiert. Nun kann der Ausdruck (5) für den Hamilton-Operator in der Form 1 1 (P2 + P2y + P2z ) + mω2 (X 2 + Y 2 + Z 2 ) 2m x 2 = Hx + Hy + Hz
H=
(9)
geschrieben werden. Darin ist Hx =
P2x 1 + mω2 X 2 2m 2
(10)
zwei entsprechende Definitionen gelten für H y und H z . H x hängt nur von X und P x ab, ist also die Fortsetzung eines nur im Raum Hx wirkenden Operators in den Raum Hr . Entsprechendes gilt für die Operatoren H y und H z . Im Raum Hx ist H x der HamiltonOperator für einen eindimensionalen harmonischen Oszillator. Das Gleiche gilt für H y in Hy und H z in Hz . Die drei Operatoren H x , H y und H z kommutieren paarweise. Daher vertauscht auch jeder mit der Summe H. Folglich kann man zur Lösung der Eigenwertglei chung (6) die Eigenvektoren von H suchen, die gleichzeitig Eigenvektoren von H x , H y und H z sind. Die Eigenvektoren und Eigenwerte von H x in Hx , H y in Hy und H z in Hz kennen wir aber schon: 1 ) ℏω|φ n x ⟩ ; 2 1 H y |φ n y ⟩ = (n y + ) ℏω|φ n y ⟩ ; 2 1 H z |φ n z ⟩ = (n z + ) ℏω|φ n z ⟩ ; 2
H x |φ n x ⟩ = (n x +
|φ n x ⟩ ∈ Hx
(11a)
|φ n y ⟩ ∈ Hy
(11b)
|φ n z ⟩ ∈ Hz
(11c)
•
546 | Ergänzung EV
(n x , n y und n z sind ganzzahlig positiv oder null). Hieraus ergibt sich (s. Kap. II, § F), dass die gemeinsamen Eigenvektoren von H, H x , H y und H z die Form |ψ n x ,n y ,n z ⟩ = |φ n x ⟩|φ n y ⟩|φ n z ⟩
(12)
haben. Nach den Gleichungen (9) und (11) gilt dann H|ψ n x ,n y ,n z ⟩ = (n x + n y + n z +
3 ) ℏω|ψ n x ,n y ,n z ⟩ 2
(13)
d. h. dass die Eigenvektoren von H als tensorielle Produkte der Eigenvektoren von H x , H y und H z auftreten und die Eigenwerte als Summe der Eigenwerte dieser drei Opera toren. So sind also die Energieniveaus E n des dreidimensionalen isotropen harmoni schen Oszillators E n = (n +
3 ) ℏω 2
(14)
mit n positiv ganz oder null,
(15)
weil n die Summe von drei Zahlen n x , n y , n z ist, deren Werte alle nichtnegativen gan zen Zahlen sein können. Weiter erlaubt Gl. (12), die Eigenschaften der Vektoren |ψ n x ,n y ,n z ⟩ aus den in Kap. V, § C-1 erhaltenen Eigenschaften der Eigenvektoren |φ n x ⟩ von H x (die dann auch für die Vektoren |φ n y ⟩ und |φ n z ⟩ gelten) herzuleiten. Wir führen drei Paare von Erzeugungs- und Vernichtungsoperatoren ein: mω i Px X+ 2ℏ √2mℏω mω i Py Y+ ay = √ 2ℏ √2mℏω
a†x = √
mω i Pz Z+ 2ℏ √2mℏω
a†z = √
ax = √
az = √
mω i Px X− 2ℏ √2mℏω mω i Py a†y = √ Y− 2ℏ √2mℏω mω i Pz Z− 2ℏ √2mℏω
(16a) (16b) (16c)
Diese Operatoren sind die Fortsetzungen der in Hx bzw. Hy und Hz wirkenden Opera toren in den Raum Hr . Aus den kanonischen Vertauschungsrelationen für die Kompo nenten des Ortsoperators R und des Impulsoperators P ergeben sich dann als einzige nichtverschwindende Kommutatoren dieser sechs Operatoren [a x , a†x ] = [a y , a†y ] = [a z , a†z ] = 1
(17)
Dreidimensionaler isotroper harmonischer Oszillator
| 547
•
(man beachte, dass zwei Operatoren mit verschiedenen Indizes stets vertauschen; letztlich wirken sie ja auch in verschiedenen Räumen). Die Wirkung der Operatoren a x und a†x auf die Zustände |ψ n x ,n y ,n z ⟩ ist durch die Beziehungen a x |ψ n x ,n y ,n z ⟩ = (a x |φ n x ⟩)|φ n y ⟩|φ n z ⟩ = √n x |φ n x −1 ⟩|φ n y ⟩|φ n z ⟩ = √n x |ψ n x −1,n y ,n z ⟩
(18a)
a†x |ψ n x ,n y ,n z ⟩ = (a†x |φ n x ⟩)|φ n y ⟩|φ n z ⟩ = √n x + 1 |φ n x +1 ⟩|φ n y ⟩|φ n z ⟩ = √n x + 1 |ψ n x +1,n y ,n z ⟩
(18b)
gegeben und entsprechende Beziehungen für die Operatoren a y , a†y und a z , a†z . Wir wissen ferner [s. Gl. (C-13) in Kapitel V], dass |φ n x ⟩ =
1 (a†x )n x |φ0 ⟩ √n x !
(19)
wobei |φ0 ⟩ der Vektor aus Hx ist, der die Bedingung a x |φ0 ⟩ = 0
(20)
erfüllt. Für |φ n y ⟩ und |φ n z ⟩ gelten entsprechende Ausdrücke. Nach Gl. (12) ist daher stets |ψ n x ,n y ,n z ⟩ =
1 √n x !n y !n z !
(a†x )n x (a†y )n y (a†z )n z |ψ0,0,0 ⟩
(21)
Darin ist |ψ0,0,0 ⟩ das tensorielle Produkt der Grundzustände von drei eindimensiona len Oszillatoren, genügt also den Beziehungen a x |ψ0,0,0 ⟩ = a y |ψ0,0,0 ⟩ = a z |ψ0,0,0 ⟩ = 0
(22)
Schließlich ergibt sich für die zu |ψ n x ,n y ,n z ⟩ gehörende Wellenfunktion ⟨r|ψ n x ,n y ,n z ⟩ = φ n x (x) φ n y (y) φ n z (z)
(23)
wobei φ n x , φ n y und φ n z die stationären Wellenfunktionen des eindimensionalen har monischen Oszillators sind (s. Kap. V, § C-2). So ist z. B. ⟨r|ψ0,0,0 ⟩ = (
mω 3/4 − mω (x2 +y2 +z2 ) ) e 2ℏ πℏ
(24)
•
548 | Ergänzung EV
3 Entartung der Energieniveaus In Kap. V, § B-3 zeigten wir, dass der Hamilton-Operator H x einen vollständigen Satz kommutierender Observabler (V. S. K. O.) im Zustandsraum Hx bildet. Das Gleiche gilt natürlich auch für H y in Hy und H z in Hz . Nach Kap. II, § F bildet dann die Menge {H x , H y , H z } in Hr einen V. S. K. O. Es existiert daher zu einem gegebenen Eigenwert tripel von H x , H y , H z (bis auf einen Faktor) genau ein Ket |ψ n x ,n y ,n z ⟩ ∈ Hr . Dagegen stellt der Hamilton-Operator H für sich allein keinen V. S. K. O. dar, denn seine Energieniveaus E n sind entartet. Wählen wir nämlich einen Eigenwert E n = (n + 3/2)ℏω, so läuft das auf das Festlegen einer nichtnegativen ganzen Zahl n hinaus. Sämtliche Kets der Basis {|ψ n x ,n y ,n z ⟩}, die die Beziehung nx + ny + nz = n
(25)
erfüllen, sind Eigenvektoren von H zum Eigenwert E n . Der Grad g n der Entartung von E n ist gleich der Anzahl der verschiedenen Zahlentripel {n x , n y , n z }, die dieser Bedin gung genügen. Um diese Zahl zu finden, kann man wie folgt vorgehen: Für festes n wählt man zunächst n x aus den Werten n x = 0, 1, 2, . . . , n
(26)
Dann ist ny + nz = n − nx
(27)
Für das Zahlenpaar {n y , n z } gibt es (n − n x + 1) Möglichkeiten: {n y , n z } = {0, n − n x }, {1, n − n x − 1}, . . . , {n − n x , 0}
(28)
Somit ergibt sich für den Entartungsgrad g n des Energieniveaus E n n
g n = ∑ (n − n x + 1)
(29)
n x =0
Diese Summe lässt sich leicht auswerten: n
n
g n = (n + 1) ∑ 1 − ∑ n x = n x =0
n x =0
(n + 1)(n + 2) 2
(30)
Folglich ist allein der Grundzustand mit der Energie E0 = 32 ℏω nichtentartet. Bemerkung: Das System der orthonormierten Eigenkets |ψ n x ,n y ,n z ⟩ von H bildet in Hr eine Basis. Wegen der Entartung der Eigenwerte E n ist dieses System nicht eindeutig. Wir werden insbesondere in Er gänzung BVII sehen, dass man zur Lösung von Gl. (6) eine Menge von Konstanten der Bewegung verwenden kann, die von der Menge {H x , H y , H z } verschieden ist: Man erhält so eine von der vorstehenden verschiedene Basis in Hr , obwohl sie aus Eigenvektoren von H besteht. Die Kets dieser neuen Basis sind orthonormierte Linearkombinationen der |ψ n x ,n y ,n z ⟩ und gehören zu den verschiedenen Eigenräumen von H, d. h. zu einem festen Wert der Summe n x + n y + n z .
Geladener harmonischer Oszillator im konstanten elektrischen Feld |
549
•
Ergänzung FV Geladener harmonischer Oszillator im konstanten elektrischen Feld 1 2 2-a 2-b 3
Eigenwertgleichung von H (𝓔) in der Ortsdarstellung | 549 Physikalische Diskussion | 551 Elektrische Suszeptibilität eines elastisch gebundenen Elektrons | 551 Interpretation der Energieverschiebung | 552 Anwendung des Translationsoperators | 553
Der in Kapitel V untersuchte eindimensionale harmonische Oszillator besteht aus ei nem Teilchen mit der Masse m und dem Potential¹ V(X) =
1 mω2 X 2 2
(1)
Wir nehmen jetzt zusätzlich an, dass das Teilchen eine Ladung q trägt und sich in einem konstanten, parallel zur x-Achse gerichteten elektrischen Feld ℰ bewegt. Klas sisch ist die potentielle Energie eines Teilchens in einem derartigen Feld w(ℰ) = −qℰx
(2)
Um den Hamilton-Operator H (ℰ) für diesen Fall zu erhalten, muss man daher zur potentiellen Energie (1) des harmonischen Oszillators den Term W(ℰ) = −qℰX
(3)
hinzufügen. Damit ist H (ℰ) =
P2 1 + mω2 X 2 − qℰX 2m 2
(4)
Zur Bestimmung der Eigenwerte und Eigenfunktionen dieses Operators werden wir zwei verschiedene Methoden anwenden: Zuerst lösen wir die Eigenwertgleichung von H (ℰ) in der Ortsdarstellung; die Ergebnisse erlauben eine sehr einfache physikali sche Interpretation. Danach werden wir dann zeigen, wie man das Problem auch be handeln kann, wenn man von einem reinen Operatorkalkül ausgeht.
1 Eigenwertgleichung von H (𝓔) in der Ortsdarstellung Es sei |φ ⟩ ein Eigenvektor von H (ℰ): H (ℰ)|φ ⟩ = E |φ ⟩ 1 Wir vereinbaren wie üblich, dass das Potential im Ursprung x = 0 null gesetzt wird. https://doi.org/10.1515/9783110638738-052
(5)
•
550 | Ergänzung FV
Mit Gl. (4) lautet diese Gleichung in der Ortsdarstellung [−
1 ℏ2 d2 + mω2 x2 − qℰx] φ (x) = E φ (x) 2m dx2 2
(6)
In der Klammer auf der linken Seite bilden wir die quadratische Ergänzung: [−
qℰ 2 q2 ℰ 2 ℏ2 d2 1 + mω2 (x − ) − ] φ (x) = E φ (x) 2 2m dx 2 mω2 2mω2
(7)
Wir ersetzen die Variable x durch die Variable u, u=x−
qℰ mω2
(8)
so dass die Funktion φ mittelbar über x von u abhängt. Gleichung (7) wird dann [−
ℏ2 d2 1 + mω2 u 2 ] φ (u) = E φ (u) 2m du 2 2
(9)
mit q2 ℰ 2 (10) 2mω2 Sie hat somit in der Ortsdarstellung dieselbe Form wie die Eigenwertgleichung eines harmonischen Oszillators ohne das elektrische Feld [s. Gl. (A-17) in Kapitel V]. Wir kön nen also die Lösung sofort angeben und erhalten für die Energiewerte die Beziehung E = E +
En = (n +
1 ) ℏω 2
(11)
(n nichtnegativ ganz). Durch das elektrische Feld werden demnach die Energien E der stationären Zu stände des harmonischen Oszillators modifiziert: En (ℰ) = (n +
q2 ℰ 2 1 ) ℏω − 2 2mω2
(12)
Das Spektrum des harmonischen Oszillators wird „als Ganzes“ um den Betrag q2 ℰ 2 / 2mω2 verschoben. Was die Eigenfunktionen φn (x) zu den Energien (12) angeht, so erhält man sie sämtlich aus den Funktionen φ n (x) durch ein und dieselbe Translation. Zu einem be stimmten Wert von n ist die Lösung nämlich φ n (u) (wobei die Funktion φ n z. B. durch Gl. (35) aus Ergänzung BV gegeben ist), und nach Gl. (8) ist dann φn (x) = φ n (x −
qℰ ) mω2
(13)
Physikalisch hat diese Translation ihre Ursache darin, dass das elektrische Feld auf das Teilchen eine Kraft ausübt.² 2 Aus Gl. (13) ersieht man, dass die Funktion φ n (x) aus der Funktion φ n (x) durch die Translation um qℰ/mω2 hervorgeht. Ist das Produkt qℰ positiv, so erfolgt die Translation in positiver x-Richtung, also in Richtung der elektrischen Kraft.
Geladener harmonischer Oszillator im konstanten elektrischen Feld | 551
•
Bemerkung: Der durch Gl. (8) gegebene Variablenwechsel ermöglichte uns, den Fall eines beliebigen (kon stanten) elektrischen Feldes auf ein bereits gelöstes Problem (mit dem Feld ℰ = 0) zurückzufüh ren. Die einzige Wirkung dieses Feldes besteht in einer Verschiebung des Ursprungs auf der x[s. Gl. (13)] und auf der Energieachse [Gl. (12)]. Dieses Ergebnis kann man übrigens auch grafisch gut verstehen (Abb. 1): Für ℰ = 0 wird das Potential V(x) durch eine Parabel mit dem Schei telpunkt im Ursprung O beschrieben. Ist das elektrische Feld ℰ ungleich null, muss zu diesem Potential die Größe −qℰx (die gestrichelte Gerade in der Abbildung) hinzugefügt werden. Die Kurve V + W ist wieder eine Parabel, so dass man es auch bei Anwesenheit des Feldes mit einem harmonischen Oszillator zu tun hat. Die beiden Parabeln können zur Deckung gebracht werden. Darum gehören sie zum selben Wert von ω, so dass auch die Abstände der Energieniveaus die selben bleiben. Die Scheitelpunkte der beiden Parabeln sind jedoch gegeneinander verschoben: Man gelangt wieder zu den Beziehungen (12) und (13).
Abb. 1: Wirkt ein konstantes elektrisches Feld ℰ, so kommt zur potentiellen Energie V des har monischen Oszillators der in x lineare Term W hinzu. Das Gesamtpotential V + W wird durch die verschobene Parabel dargestellt.
2 Physikalische Diskussion 2-a Elektrische Suszeptibilität eines elastisch gebundenen Elektrons In bestimmten Fällen verhalten sich die Elektronen eines Atoms oder Moleküls in guter Näherung wie elastisch gebundene Teilchen, stellen also harmonische Oszillatoren dar. Für Atome zeigen wir dies in Ergänzung AXIII im Zusammenhang mit der zeitab hängigen Störungstheorie. Den Anteil eines Elektrons zum elektrischen Dipolmoment des Atoms beschreibt der Operator D = qX
(14)
mit der Elektronenladung q < 0 und der Ortsobservablen X. Wir wollen den Erwar tungswert von D im Modell von elastisch gebundenen Elektronen bestimmen.
•
552 | Ergänzung FV
Ohne elektrisches Feld ist der Erwartungswert des elektrischen Dipolmoments in einem stationären Zustand des Oszillators null: ⟨D⟩ = q⟨φ n |X|φ n ⟩ = 0
(15)
[s. Gl. (D-1) aus Kapitel V]. Wir wollen jetzt annehmen, dass das Feld ℰ hinreichend langsam eingeschaltet wird, so dass das Elektron allmählich vom Zustand |φ n ⟩ in den Zustand |φn ⟩ (mit gleich bleibendem n) gelangt. Das mittlere Dipolmoment ist nun von null verschie den, denn mit Gl. (8) und Gl. (13) wird +∞
⟨D⟩ = q⟨φn |X|φn ⟩ = q ∫ dx x|φn (x)|2
(16)
−∞ +∞
+∞
= q ∫ u|φ n (u)|2 du + −∞
q2 ℰ q2 ℰ ∫ |φ n (u)|2 du = 2 mω mω2
(17)
−∞
weil das erste Integral aus Symmetriegründen verschwindet. ⟨D⟩ ist in diesem Modell also zu ℰ proportional, und die elektrische Suszeptibilität des Atomelektrons wird ⟨D⟩ q2 (18) = ℰ mω2 Sie ist unabhängig vom Vorzeichen der Ladung q stets positiv. Physikalisch ist dieses Ergebnis einfach zu erklären. Das elektrische Feld bewirkt die Verschiebung der klassischen Gleichgewichtslage des Elektrons, d. h. quantenme chanisch des Erwartungswerts seines Orts [s. Gl. (13)]. Dies führt zu einem induzierten Dipolmoment. Die Abnahme von χ mit wachsendem ω entspricht der Eigenschaft des Oszillators, nach der er umso schwerer deformiert werden kann, je stärker die zu (ω2 proportionale) elastische Kraft ist. χ=
2-b Interpretation der Energieverschiebung Im Rahmen des hier betrachteten Modells kann man auch Gl. (12) interpretieren, in dem man die Änderung der Erwartungswerte der kinetischen und der potentiellen Energie berechnet, die sich beim Übergang vom Zustand |φ n ⟩ in den Zustand |φn ⟩ er gibt. Für die kinetische Energie erhalten wir keine Änderung (was auch an Abb. 1 an schaulich klar wird). Es ist wegen Gl. (13) +∞
P2 ℏ2 [ d2 P2 φ (x) dx ⟨ ∫ φ∗ ⟩ −⟨ ⟩=− n (x) 2m 2m 2m dx2 n [−∞ +∞
− ∫ φ∗n (x) −∞
d2 φ n (x) dx] = 0 dx2 ]
(19)
Geladener harmonischer Oszillator im konstanten elektrischen Feld |
–
•
Die Änderung der potentiellen Energie kann man in zwei Terme zerlegen: Der erste Term ⟨W(ℰ)⟩ entspricht der potentiellen Energie des Dipols im elektri schen Feld ℰ. Weil Dipol und Feld zueinander parallel sind, hat man nach Gl. (17) ⟨W(ℰ)⟩ = −ℰ⟨D⟩ = −
–
553
q2 ℰ 2 mω2
(20)
Der zweite Term ⟨V(X)⟩ − ⟨V(X)⟩ geht auf die Modifizierung der Wellenfunktion zur Quantenzahl n durch das elektrische Feld zurück: Der „elastische“ Anteil der potentiellen Energie des Teilchens ändert sich daher um +∞
+∞
1 ⟨V(X)⟩ − ⟨V(X)⟩ = mω2 [ ∫ x2 |φn (x)|2 dx − ∫ x2 |φ n (x)|2 dx] 2 −∞ [−∞ ]
(21)
Hierin kann das erste Integral unter Beachtung von Gl. (13) und dem Variablen wechsel (8) ausgewertet werden: +∞
+∞
+∞
∫ x2 |φn (x)|2 dx = ∫ u 2 |φ n (u)|2 du + −∞
−∞
−∞
2
+(
2qℰ ∫ u|φ n (u)|2 du mω2
+∞
qℰ ) ∫ |φ n (u)|2 du mω2
(22)
−∞
Weil φ n (u) normiert ist und das Integral über u|φ n (u)|2 aus Symmetriegründen verschwindet, erhalten wir schließlich ⟨V(X)⟩ − ⟨V(X)⟩ =
q2 ℰ 2 2mω2
(23)
Diese Änderung ist positiv, weil das elektrische Feld das Teilchen aus dem Ur sprung O in einen Bereich auslenkt, in dem der „elastische“ Anteil V(x) des Po tentials viel größer ist. Addieren wir die beiden Terme (20) und (23), so ergibt sich, dass die Energie des Zu stands |φn ⟩ um den Betrag q2 ℰ 2 /2mω2 niedriger als die Energie des Zustands |φ n ⟩ liegt.
3 Anwendung des Translationsoperators Zu den Eigenwerten und Eigenfunktionen eines geladenen harmonischen Oszillators in einem konstanten elektrischen Feld kann man auch auf einem anderen Weg gelan gen. Hierzu geht man unmittelbar vom Hamilton-Operator H (ℰ) in Gl. (4) aus. Man kann nämlich zeigen, dass man durch eine unitäre Transformation (mit der man die Translation der Wellenfunktion auf der x-Achse bewirkt) vom Operator H = H (ℰ = 0) zum Operator H (ℰ) gelangen kann (bis auf eine additive Konstante, die jedoch die
•
554 | Ergänzung FV
Eigenvektoren nicht beeinflusst). Die Eigenwerte und Eigenfunktionen von H für den feldfreien Fall haben wir aber in Kapitel V bereits bestimmt. Wir betrachten den Operator U(λ) = e−λ(a−a
†
)
(24)
mit einer reellen Konstanten λ. Der dazu adjungierte Operator ist U † (λ) = eλ(a−a
†
)
(25)
Man sieht leicht, dass U(λ)U † (λ) = U † (λ)U(λ) = 1
(26)
ist. U(λ) ist also ein unitärer Operator. Mit der durch ihn bewirkten unitären Transfor mation wird aus dem Hamilton-Operator H der Operator ̃ = U(λ)HU † (λ) H 1 = ℏω [ + U(λ)a† aU † (λ)] 2 Wir berechnen den Operator
(27)
̃ ̃† a U(λ)a† aU † (λ) = a
(28)
mit ̃ = U(λ)aU † (λ) a
(29)
̃ † = U(λ)a† U † (λ) a
̃ und a ̃ † zu erhalten, verwenden wir die Beziehung (63) aus Ergänzung BII (wir Um a dürfen dies hier tun, weil der Kommutator von a und a† gleich eins ist) und erhalten †
†
U(λ) = e−λa+λa = e−λa eλa eλ U † (λ) = e−λa
†
+λa
†
2
/2
= e−λa eλa e−λ
2
/2
(30)
Andererseits dürfen wir nach Gl. (51) aus Ergänzung BII setzen [e−λa , a† ] = −λ e−λa †
[eλa , a] = −λ eλa
†
(31)
d. h. e−λa a† eλa = a† − λ †
†
eλa a e−λa = a − λ
(32)
Damit wird †
†
̃ = e−λa eλa a e−λa eλa a = e−λa (a − λ)eλa = a − λ
(33)
und entsprechend ̃ † = a† − λ a
(34)
•
Geladener harmonischer Oszillator im konstanten elektrischen Feld | 555
Darum ist ̃ = ℏω [ 1 + (a† − λ)(a − λ)] H 2 1 = ℏω [ + a† a − λ(a + a† ) + λ2 ] 2 = H − λℏω(a + a† ) + λ2 ℏω
(35)
Weil (a + a† ) zum Ortsoperator X proportional ist [s. Gl. (B-1) und (B-7) aus Kap. V], genügt es, λ=
qℰ √ 1 ω 2mℏω
(36)
zu setzen, um für den Hamilton-Operator bei Anwesenheit des elektrischen Feldes 2 2 2 2 ̃ = H − qℰX + q ℰ = H (ℰ) + q ℰ H 2mω2 2mω2
(37)
̃ und H (ℰ) haben daher dieselben Eigenvekto zu erhalten. Die beiden Operatoren H ren, während sich ihre Eigenwerte um q2 ℰ 2 /2mω2 unterscheiden. Sind nun die Kets |φ n ⟩ die Eigenvektoren von H, so weiß man (s. Ergänzung CII , § 2), dass die Eigenvek ̃ die Kets toren von H |̃ φ n ⟩ = U(λ)|φ n ⟩
(38)
̃ und H dieselben Eigenwerte. Die stationären Zustände |φn ⟩ des sind. Weiter haben H harmonischen Oszillators im elektrischen Feld ℰ werden also die durch Gl. (38) gege benen Zustände |̃ φ n ⟩ sein, und die zugehörigen Eigenwerte von H (ℰ) sind En (ℰ) = (n +
1 q2 ℰ 2 ) ℏω − 2 2mω2
(39)
Es ergibt sich wieder die Beziehung (12). Den Ausdruck (38) kann man auf die Form −i
|φn ⟩ = |̃ φn ⟩ = e
qℰ P mℏω2 |φ n ⟩
(40)
bringen, wenn man Gl. (24) und Gl. (36) sowie die Beziehungen (B-1) und (B-7) aus Kapitel V verwendet. In Ergänzung EII hatten wir den Operator e−iaP/ℏ als den Trans lationsoperator für eine (algebraische) Verschiebung um a längs der x-Achse inter pretiert. So ist also |φn ⟩ der Zustand, den man aus |φ n ⟩ durch eine Translation um qℰ/mω2 erhält. Genau dies zeigt Gl. (13) an.
Referenzen und Literaturhinweise Elastisch gebundene Elektronen: siehe Referenzen in Ergänzung AXIII .
•
556 | Ergänzung GV
Ergänzung GV Quasiklassische Zustände des Oszillators 1
Quasiklassische Zustände | 557
1-a
Charakterisierung der klassischen Bewegung | 557
1-b
Definition der quasiklassischen Zustände | 559
1-c
Quasiklassische Zustände und Vernichtungsoperator | 561
2
Eigenschaften der Zustände |α⟩ | 561
2-a
Entwicklung nach den stationären Zuständen | 561
2-b
Energiewerte im Zustand |α⟩ | 562
2-c
Erwartungswerte und Streuungen im Zustand |α⟩ | 564
2-d
Operator D(α) und Wellenfunktion ψ α (x) | 565
2-e
Skalarprodukt von zwei |α⟩-Zuständen. Vollständigkeitsrelation | 567
3
Zeitliche Entwicklung eines quasiklassischen Zustands | 568
3-a
Quasiklassischer Zustand als Eigenvektor von a | 568
3-b
Zeitliche Entwicklung der physikalischen Eigenschaften | 569
3-c
Bewegung des Wellenpakets | 570
4
Beispiel eines makroskopischen Oszillators | 571
Bei der Untersuchung der stationären Zustände |φ n ⟩ des harmonischen Oszillators stellten wir unter anderem fest (§ D), dass die Erwartungswerte von Ort und Impuls in einem solchen Zustand null sind. Nun ist aus der klassischen Mechanik bekannt, dass Ort und Impuls sich zeitlich periodisch ändern und nur dann konstant gleich null sein können, wenn das auch für die Energie der Fall ist [s. Gl. (A-5) und Gl. (A-8) in Kapitel V]. Andererseits weiß man, dass die Quantenmechanik für den Grenzfall großer Quantenzahlen, wenn also die Energie des Oszillators sehr viel größer als ℏω ist, zu denselben Ergebnissen wie die klassische Mechanik gelangen muss. Es ergibt sich somit die folgende Frage: Kann man Quantenzustände konstruie ren, für die die physikalischen Voraussagen der Quantenmechanik zumindest bei ei nem makroskopischen Oszillator mit den Aussagen der klassischen Mechanik prak tisch identisch sind? Wir werden in diesem Abschnitt sehen, dass derartige Zustände tatsächlich existieren. Es sind dies die kohärenten Überlagerungen aller stationären Zustände |φ n ⟩. Wir werden sie quasiklassische oder auch kohärente Zustände nennen. An dieser Frage besteht in der Quantenmechanik ein ganz allgemeines Interesse. Wie wir bereits in der Einführung zum Kapitel V und in Ergänzung AV feststellten, gibt es zahlreiche Systeme, die wenigstens in erster Näherung als ein harmonischer Oszil lator behandelt werden können. Bei ihnen will man nun im Rahmen der Quantenme chanik verstehen, wie man von dem Fall, in dem sich die Aussagen der klassischen Näherung als hinreichend genau erweisen, zu dem Fall gelangt, bei dem die Quanten effekte zum Tragen kommen. Die elektromagnetische Strahlung ist ein sehr wichtiges Beispiel für ein solches System: Je nach der Art des Experiments zeigt sie Quanten charakter (z. B. beim Doppelspaltversuch für sehr geringe Lichtintensität) oder kann https://doi.org/10.1515/9783110638738-053
Quasiklassische Zustände des Oszillators
|
557
•
einfach klassisch behandelt werden. So spielen heute die (von Glauber eingeführten) kohärenten Zustände in der Quantenoptik eine wichtige Rolle. Ort, Impuls und Energie eines harmonischen Oszillators werden in der Quanten mechanik durch nichtvertauschbare Operatoren beschrieben; es sind nichtkompati ble physikalische Größen. Daher kann man keinen Zustand konstruieren, in dem alle drei vollständig bestimmt sind. Wir begnügen uns deshalb mit der Suche nach einem Vektor, für den zu einem beliebigen Zeitpunkt t die Erwartungswerte ⟨X⟩, ⟨P⟩ und ⟨H⟩ möglichst nahe an den entsprechenden klassischen Werten liegen. Das führt uns zu ei nem Kompromiss, bei dem keine der drei Observablen vollständig bekannt ist; jedoch wird sich herausstellen, dass man im makroskopischen Grenzfall die Standardabwei chungen ∆X, ∆P und ∆H gänzlich vernachlässigen darf.
1 Quasiklassische Zustände 1-a Charakterisierung der klassischen Bewegung Die klassischen Bewegungsgleichungen eines eindimensionalen harmonischen Oszil lators mit der Masse m und der Kreisfrequenz ω lauten 1 d x(t) = p(t) dt m d p(t) = −m ω2 x(t) dt
(1a) (1b)
Für die folgenden quantenmechanischen Rechnungen ist es einfacher, wenn wir zwei Größen mit der Dimension eins einführen. Wir setzen ̂x (t) = β x(t) 1 ̂ (t) = p(t) p ℏβ
(2)
mit β=√
mω ℏ
(3)
Die Gleichungen (1a) und (1b) lauten dann: d ̂x(t) = ω p̂ (t) dt d ̂ (t) = −ω x̂(t) p dt
(4a) (4b)
Klassisch ist der Zustand des Oszillators zur Zeit t bestimmt, wenn man zu diesem Zeit ̂ (t) kennt. Wir punkt seinen Ort x(t) und seinen Impuls p(t) bzw. die Größen ̂x(t) und p fassen diese beiden reellen Zahlen zu einer komplexen Zahl α(t) zusammen, indem
•
558 | Ergänzung GV
wir definieren α(t) =
1 ̂ (t)] [̂x (t) + ip √2
(5)
Das Gleichungssystem (4) ist dann zu einer einzigen Gleichung, d α(t) = −iω α(t) dt
(6)
äquivalent. Ihre Lösung ist α(t) = α 0 e−iωt
(7)
wobei wir α 0 = α(0) =
1 ̂ (0)] [̂x (0) + ip √2
(8)
gesetzt haben. Wir betrachten jetzt in der komplexen Ebene die zu den Zahlen α 0 bzw. α(t) gehö renden Punkte M0 bzw. M (Abb. 1). Der Punkt M fällt zur Zeit t = 0 mit M0 zusammen und beschreibt mit der Winkelgeschwindigkeit −ω um O einen Kreis mit dem Radius OM0 .
Abb. 1: Die komplexe Zahl α(t) charakterisiert den Zu stand des harmonischen Oszillators zur Zeit t. Ihr Bild M(t) beschreibt mit der Winkelgeschwindigkeit −ω ei nen Kreis. Die Abszisse dieses Punktes liefert den Ort und die Ordinate den Impuls des Oszillators.
̂ (t)/√2 sind, erhält man Weil die Koordinaten von M nach Gl. (5) gleich ̂x (t)/√2 und p eine sehr einfache geometrische Darstellung der zeitlichen Entwicklung des Systems. Eine Bewegung mit bestimmten Anfangsbedingungen ist durch den Punkt M0 , d. h. durch die komplexe Zahl α 0 vollständig charakterisiert (der Betrag von α 0 gibt die Amplitude der Schwingung und das Argument ihre Phase an). Nach Gl. (5) und Gl. (7) gilt übrigens 1 [α 0 e−iωt + α ∗0 eiωt ] √2 i ̂ (t) = − p [α 0 e−iωt − α ∗0 eiωt ] √2 ̂x(t) =
(9a) (9b)
Quasiklassische Zustände des Oszillators
| 559
•
Die klassische Energie H des Systems ist zeitlich konstant: 1 1 [p(0)]2 + m ω2 [x(0)]2 2m 2 ℏω ̂ (0)]2 } = {[̂x (0)]2 + [p 2
H=
(10)
also gilt wegen Gl. (8) H = ℏω|α 0 |2
(11)
Für einen makroskopischen Oszillator ist die Energie H sehr viel größer als ℏω, denn bei ihm ist |α 0 | ≫ 1
(12)
1-b Definition der quasiklassischen Zustände Wir suchen nach einem Quantenzustand, in dem die Erwartungswerte ⟨X⟩, ⟨P⟩ und ⟨H⟩ zu jedem Zeitpunkt praktisch gleich den Werten x, p und H der zugehörigen klas sischen Bewegung sind. Zur Berechnung der Erwartungswerte verwenden wir die Ausdrücke ̂ = β X = 1 (a + a† ) X √2 i 1 ̂= P=− P (a − a† ) ℏβ √2
(13)
sowie H = ℏω (a† a +
1 ) 2
(14)
Für einen beliebigen Zustand |ψ(t)⟩ ist die zeitliche Entwicklung des Matrixelements ⟨a⟩(t) = ⟨ψ(t)|a|ψ(t)⟩ durch die Differentialgleichung iℏ
d ⟨a⟩(t) = ⟨[a, H]⟩(t) dt
(15)
gegeben [s. Kap. III, § D-1-d]. Nun ist [a, H] = ℏω[a, a† a] = ℏω a
(16)
woraus d ⟨a⟩(t) = ω⟨a⟩(t) dt
(17)
⟨a⟩(t) = ⟨a⟩(0) e−iωt
(18)
i d. h.
•
560 | Ergänzung GV
folgt. Die Entwicklung von ⟨a† ⟩(t) = ⟨ψ(t)|a† |ψ(t)⟩ gehorcht der konjugiert komple xen Gleichung ⟨a† ⟩(t) = ⟨a† ⟩(0) eiωt = ⟨a⟩∗ (0) eiωt
(19)
Die Gleichungen (18) und (19) entsprechen der klassischen Gl. (7). Wir setzen Gl. (18) und Gl. (19) in Gl. (13) ein und erhalten 1 [⟨a⟩(0)e−iωt + ⟨a⟩∗ (0)eiωt ] √2 i ̂ ⟨P⟩(t) =− [⟨a⟩(0)e−iωt − ⟨a⟩∗ (0)eiωt ] √2
̂ ⟨X⟩(t) =
(20)
Vergleichen wir diese Ergebnisse mit den Gleichungen (9), so sehen wir: Damit für einen beliebigen Zeitpunkt t ̂ ⟨X⟩(t) = x̂(t) ̂ ̂ (t) ⟨P⟩(t) =p
(21)
gilt, ist es notwendig und hinreichend für t = 0, ⟨a⟩(0) = α 0
(22)
zu setzen. Dabei ist α 0 der komplexe Parameter zur Charakterisierung der klassischen Bewegung, die man quantenmechanisch so gut wie möglich zu reproduzieren ver sucht. So muss also der normierte Zustandsvektor |ψ(t)⟩ des Oszillators als Erstes die Bedingung ⟨ψ(0)|a|ψ(0)⟩ = α 0
(23)
erfüllen. Weiter muss der Erwartungswert ⟨H⟩ = ℏω⟨a† a⟩(0) +
ℏω 2
(24)
gleich der durch Gl. (11) gegebenen klassischen Energie H sein. Weil für einen klassi schen Oszillator |α 0 | sehr groß gegen eins ist, vernachlässigen wir den Term ℏω/2 (er ist rein quantenmechanischen Ursprungs, s. § D-2 von Kapitel V) gegenüber ℏω|α 0 |2 , so dass die zweite Bedingung an den Zustandsvektor ⟨a† a⟩(0) = |α 0 |2
(25)
d. h. ⟨ψ(0)|a† a|ψ(0)⟩ = |α 0 |2
(26)
lautet. Wir werden sehen, dass die Bedingungen (23) und (26) zur Bestimmung des normierten Vektors |ψ(0)⟩ ausreichen (von einem Phasenfaktor abgesehen).
Quasiklassische Zustände des Oszillators
|
561
•
1-c Quasiklassische Zustände und Vernichtungsoperator Wir führen den Operator b(α 0 ) = a − α0
(27)
ein. Es ist b † (α 0 )b(α 0 ) = a† a − α 0 a† − α ∗0 a + α∗0 α 0
(28)
und weiter das Quadrat der Norm des Kets b(α 0 )|ψ(0)⟩ ⟨ψ(0)|b † (α 0 )b(α 0 )|ψ(0)⟩ = ⟨ψ(0)|a† a|ψ(0)⟩ − α 0 ⟨ψ(0)|a† |ψ(0)⟩ − α ∗0 ⟨ψ(0)|a|ψ(0)⟩ + α ∗0 α 0
(29)
Setzen wir hier die Bedingungen (23) und (26) ein, so wird ⟨ψ(0)|b † (α 0 )b(α 0 )|ψ(0)⟩ = α ∗0 α 0 − α 0 α ∗0 − α ∗0 α 0 + α ∗0 α 0 = 0
(30)
Hieraus folgt, dass b(α 0 )|ψ(0)⟩ = 0
(31)
d. h. a|ψ(0)⟩ = α 0 |ψ(0)⟩
(32)
ist. Genügt umgekehrt der normierte Vektor |ψ(0)⟩ dieser Gleichung, so sind die Be dingungen (23) und (26) offensichtlich erfüllt. Wir sind somit zu folgendem Ergebnis gelangt: Der zu einer klassischen Bewegung mit dem Parameter α 0 gehörende quasiklassische Zustandsvektor |ψ(0)⟩ ist Eigenvek tor des Vernichtungsoperators a zum Eigenwert α 0 . Im Folgenden bezeichnen wir den Eigenvektor von a zum Eigenwert α mit |α⟩: a|α⟩ = α|α⟩
(33)
(weiter unten werden wir zeigen, dass diese Gleichung eine bis auf einen Faktor ein deutige Lösung hat).
2 Eigenschaften der Zustände |α⟩ 2-a Entwicklung nach den stationären Zuständen Wir bestimmen die Lösung |α⟩ der Eigenwertgleichung (33), indem wir |α⟩ nach den Zuständen |φ n ⟩ entwickeln: |α⟩ = ∑ c n (α)|φ n ⟩ n
(34)
•
562 | Ergänzung GV
Damit ist a|α⟩ = ∑ c n (α)√ n|φ n−1 ⟩
(35)
n
und wenn wir dies in Gl. (33) einsetzen, c n+1 (α) =
α c n (α) √n + 1
(36)
Mit dieser Beziehung können wir durch Rekursion alle Koeffizienten c n (α) durch c0 (α) ausdrücken. Es ist c n (α) =
αn c0 (α) √n!
(37)
Mit c0 (α) sind somit auch alle anderen Koeffizienten c n (α) festgelegt. Der Vektor |α⟩ ist daher bis auf einen Faktor eindeutig. Wir vereinbaren, dass c0 (α) reell und positiv und der Ket |α⟩ normiert sein soll, womit er dann vollständig bestimmt ist. In diesem Fall erfüllen die c n (α) die Gleichung ∑ |c n (α)|2 = 1
(38)
n
d. h. es ist |c0 (α)|2 ∑ n
|α|2n 2 = |c0 (α)|2 e|α| = 1 n!
(39)
also wegen unserer Vereinbarung c0 (α) = e−|α|
2
/2
(40)
Das gesuchte Ergebnis lautet somit |α⟩ = e−|α|
2
/2
∑ n
αn |φ n ⟩ √n!
(41)
2-b Energiewerte im Zustand |α⟩ Wir betrachten einen Oszillator im Zustand |α⟩. Wir ersehen aus Gl. (41), dass eine Energiemessung den Wert E n = (n + 1/2)ℏω mit der Wahrscheinlichkeit 𝒫n (α) = |c n (α)|2 =
|α|2n −|α|2 e n!
(42)
ergibt. Es handelt sich um eine Poisson-Verteilung. Weil 𝒫n (α) =
|α|2 𝒫n−1 (α) n
(43)
Quasiklassische Zustände des Oszillators
| 563
•
ist, kann man zeigen, dass 𝒫n (α) für n = ganzzahliger Teil von |α|2
(44)
am größten ist. Zur Berechnung des Energieerwartungswerts ⟨H⟩α könnte man Gl. (42) und den Ausdruck ⟨H⟩α = ∑ 𝒫n (α) [n + n
1 ] ℏω 2
(45)
verwenden. Man gelangt jedoch viel schneller zum Ergebnis, wenn man unter Beach tung der zu Gl. (33) adjungierten Beziehung ⟨α|a† = α ∗ ⟨α|
(46)
feststellt, dass ⟨α|a† a|α⟩ = α ∗ α
(47)
und damit ⟨H⟩α = ℏω ⟨α| [a† a +
1 1 ] |α⟩ = ℏω [|α|2 + ] 2 2
(48)
ist. Ein Vergleich mit Gl. (44) zeigt, dass sich für |α| ≫ 1 der Energieerwartungswert ⟨H⟩α relativ nur wenig von der zum maximalen Wert von 𝒫n (α) gehörenden Energie E n unterscheidet. Wir berechnen den Erwartungswert von H 2 im Zustand α: ⟨H 2 ⟩α = ℏ2 ω2 ⟨α| (a† a +
1 2 ) |α⟩ 2
(49)
Verwendet man Gl. (33) und beachtet, dass [a, a† ] = 1 ist, so ergibt sich sofort ⟨H 2 ⟩α = ℏ2 ω2 [|α|4 + 2|α|2 +
1 ] 4
(50)
so dass für die Standardabweichung ∆H α = ℏω|α|
(51)
gilt. Für sehr große |α| ist dann die relative Standardabweichung 1 ∆H α ≈ ≪1 ⟨H⟩α |α| Relativ ist die Energie im Zustand |α⟩ sehr gut bestimmt.
(52)
•
564 | Ergänzung GV
Bemerkung: Weil H = (N +
1 ) ℏω 2
(53)
ist, erhält man mit Gl. (48) und Gl. (51) sofort ⟨N⟩α = |α|2
(54)
∆N α = |α|
Man muss also für die Konstruktion eines quasiklassischen Zustands eine sehr große Zahl von stationären Zuständen |φ n ⟩ überlagern, denn es ist ∆N α ≫ 1. Dagegen ist die relative Streuung von N sehr gering, weil ∆N α 1 = ≪1 ⟨N⟩α |α|
(55)
ist.
2-c Erwartungswerte und Streuungen im Zustand |α⟩ Zur Berechnung des Orts- und des Impulserwartungswerts drücken wir X und P durch die Operatoren a und a† [Gl. (13)] aus und beachten Gl. (33) und Gl. (46). Dann wird ⟨X⟩α = ⟨α|X|α⟩ = √
2ℏ Re(α) mω
(56)
⟨P⟩α = ⟨α|P|α⟩ = √2mℏω Im(α) Eine analoge Rechnung liefert ⟨X 2 ⟩α =
ℏ [(α + α ∗ )2 + 1] 2mω
(57)
mωℏ ⟨P ⟩α = [1 − (α − α ∗ )2 ] 2 2
so dass wir für die Standardabweichungen der beiden Größen erhalten ∆X α = √
ℏ 2mω (58)
∆P α = √
mℏω 2
Sie hängen nicht von α ab. Wir stellen andererseits fest, dass ihr Produkt ∆X ⋅ ∆P den minimalen Wert annimmt: ∆X α ⋅ ∆P α = ℏ/2
(59)
Quasiklassische Zustände des Oszillators
| 565
•
2-d Operator D(α) und Wellenfunktion ψ α (x) Wir definieren D(α) = eαa
†
−α∗ a
(60)
Dieser Operator ist unitär, weil D† (α) = eα
∗
a−αa †
(61)
ist und dies zu D(α)D† (α) = D† (α)D(α) = 1
(62)
führt. Der Kommutator der Operatoren αa† und α ∗ a ist gleich der Zahl α ∗ α. Wir kön nen also die Identität (63) aus Ergänzung BII verwenden und D(α) = −|α|
2
/2 αa † −α∗ a
e
e
(63)
schreiben. Wir berechnen den Ket D(α)|φ0 ⟩. Weil ∗
e−α a |φ0 ⟩ = [1 − α ∗ a +
α ∗2 2 a + ⋅ ⋅ ⋅ ] |φ0 ⟩ 2!
= |φ0 ⟩
(64)
ist, ergibt sich D(α)|φ0 ⟩ = e−|α|
2
= e−|α|
2
= e−|α|
2
/2 αa †
e
|φ0 ⟩
(αa† )n /2 ∑ |φ0 ⟩ n! n /2
∑ n
αn |φ n ⟩ √n!
(65)
Vergleichen wir Gl. (41) mit Gl. (65), so sehen wir, dass |α⟩ = D(α)|φ0 ⟩
(66)
ist. D(α) ist also die unitäre Transformation, die aus dem Grundzustand |φ0 ⟩ den qua siklassischen Zustand |α⟩ erzeugt. Mit Gl. (66) können wir die Wellenfunktion ψ α (x) = ⟨x|α⟩
(67)
erhalten, die den quasiklassischen Zustand |α⟩ in der Ortsdarstellung angibt. Zur Be rechnung von ψ α (x) = ⟨x|D(α)|φ0 ⟩
(68)
•
566 | Ergänzung GV
drücken wir den Operator αa† − α ∗ a durch X und P aus: αa† − α ∗ a = √
mω α − α ∗ α + α∗ i ( ( )X − )P ℏ √2 √mℏω √2
(69)
Wenn wir wiederum Gl. (63) aus Ergänzung BII verwenden, erhalten wir D(α) = eαa
†
−α∗ a
∗ α+α∗ α∗2 −α2 √ mω α−α X − i ℏ √2 e √ mℏω √2 P e 4
=e
(70)
Setzen wir dies in Gl. (68) ein, so wird ψ α (x) =
∗ α+α∗ α∗2 −α2 √ mω α−α X − i P ℏ √ √ √2 |φ ⟩ 2 mℏω 4 e ⟨x|e e 0
=e
∗ i α+α∗ α∗2 −α2 √ mω α−α x P − 4 e ℏ √2 ⟨x|e √mℏω √2 |φ0 ⟩
(71)
Nun ist der Operator e−iλP/ℏ der Translationsoperator um λ längs der x-Achse (s. Er gänzung EII ). Darum gilt −
⟨x|e
i α+α∗ P √ mℏω √2
= ⟨x − √
ℏ (α + α∗ )| 2mω
(72)
Aus Gl. (71) wird somit ψ α (x) =
∗ α∗2 −α2 √ mω α−α x ℏ √ 2 4 e e φ0
(x − √
ℏ (α + α ∗ )) 2mω
(73)
Wenn wir hierin α und α ∗ durch ⟨X⟩α und ⟨P⟩α ausdrücken [Gleichungen (56)], so gelangt ψ α (x) auf die Form ψ α (x) = eiθ α ei⟨P⟩α x/ℏ φ0 (x − ⟨X⟩α )
(74)
mit dem Phasenfaktor eiθ α = e
α∗2 −α2 4
(75)
Man kommt also zur Wellenfunktion für den Zustand |α⟩, indem man die Wellenfunk tion φ0 (x) des Oszillatorgrundzustands um ⟨X⟩α längs der x-Achse verschiebt und sie mit dem oszillierenden Faktor ei⟨P⟩α x/ℏ multipliziert (den Faktor eiθ α können wir fort lassen, da er physikalisch keine Rolle spielt).¹ Schreibt man in Gl. (74) die Wellenfunktion φ0 aus, so erhält man schließlich ψ α (x) = eiθ α (
x mω 1/4 x − ⟨X⟩α 2 ] + i⟨P⟩α } ) exp {− [ πℏ ∆X α ℏ
(76)
1 Da der Exponentialausdruck ei⟨P⟩α x/ℏ von x abhängt, ist er offensichtlich kein globaler Phasenfaktor. Durch sein Auftreten in Gl. (74) ist gesichert, dass der Erwartungswert von P im Zustand ψ α (x) gleich ⟨P⟩α ist.
Quasiklassische Zustände des Oszillators
| 567
•
Damit ist die Form des zum Zustand |α⟩ gehörenden Wellenpakets |ψ α (x)|2 = √
mω 1 x − ⟨X⟩α 2 exp {− [ ] } πℏ 2 ∆X α
(77)
Man erhält für jeden |α⟩-Zustand ein Gauß-Paket. Dieses Ergebnis vergleiche man mit der Tatsache, dass das Produkt ∆X α ⋅ ∆P α der Standardabweichungen stets ein Mini mum ist (s. Ergänzung CIII ).
2-e Skalarprodukt von zwei |α⟩-Zuständen. Vollständigkeitsrelation Die |α⟩-Zustände sind Eigenvektoren des nichthermiteschen Operators a. Darum be steht zunächst kein Grund zu der Annahme, dass diese Zustände die Orthogonalisie rungsbedingungen und die Vollständigkeitsrelation erfüllen. Wir wollen daher prü fen, ob sie gerechtfertigt ist. Zunächst betrachten wir zwei Eigenkets |α⟩ und |α ⟩ des Operators a. Mit Gl. (41) erhalten wir sofort ihr Skalarprodukt. Weil ⟨α|α ⟩ = ∑ c∗n (α)c n (α )
(78)
n
ist, wird ⟨α|α ⟩ = e−|α|
2
/2 −|α |2 /2
e
∑ n
(α ∗ α )n n!
−|α|2 /2 −|α |2 /2 α∗ α
=e
e
e
(79)
woraus sich 2
|⟨α|α ⟩|2 = e−|α−α |
(80)
ergibt. Das Skalarprodukt wird also niemals null. Dagegen können wir zeigen, dass die |α⟩-Zustände eine Vollständigkeitsrelation erfüllen. Sie lautet 1 ∬ |α⟩⟨α| d{Re(α)} d{Im(α)} = 1 (81) π Zum Beweis ersetzen wir auf der linken Seite |α⟩ durch seinen Ausdruck (41): 2 αn α ∗m 1 |φ n ⟩ ∑ ⟨φ m | d{Re(α)} d{Im(α)} ∬ e−|α| ∑ π n √ n! m √ m!
(82)
Gehen wir in der komplexen α-Ebene zu Polarkoordinaten über (man setze α = ρ eiφ ), so wird ∞
2π
0
0
1 2 ρ n+m |φ n ⟩⟨φ m | ∫ ρ dρ ∫ dφ e−ρ ∑ ei(n−m)φ π √n!m! n,m
(83)
•
568 | Ergänzung GV
Die Integration über φ ergibt 2π
∫ ei(n−m)φ dφ = 2πδ nm
(84)
0
so dass wir für den Ausdruck (83) ∑ In n
1 |φ n ⟩⟨φ n | n!
(85)
erhalten, wenn wir ∞
∞
I n = 2 ∫ ρ dρ e−ρ ρ 2n = ∫ du e−u u n 2
0
(86)
0
setzen. Durch partielle Integration gelangen wir zu einer Rekursionsformel für die I n : I n = nI n−1
(87)
mit der Lösung I n = n! I0 = n!
(88)
Setzen wir dies in den Ausdruck (85) ein, so wird aus ihm ∑ |φ n ⟩⟨φ n |
(89)
n
und die Vollständigkeitsrelation (81) ist bewiesen.
3 Zeitliche Entwicklung eines quasiklassischen Zustands Ein harmonischer Oszillator sei zum Anfangszeitpunkt in einem bestimmten |α⟩-Zu stand: |ψ(0)⟩ = |α 0 ⟩
(90)
Wie ändern sich seine physikalischen Eigenschaften im Laufe der Zeit? Wir wissen bereits, dass die Erwartungswerte ⟨X⟩(t) und ⟨P⟩(t) gleich den Werten der zugehöri gen klassischen Größen bleiben, und untersuchen daher weitere Eigenschaften des Zustandsvektors |ψ(t)⟩.
3-a Quasiklassischer Zustand als Eigenvektor von a Da der Hamilton-Operator nicht von der Zeit abhängt, kann man unter Berücksich tigung von Gl. (41) die allgemeine Regel aus Kapitel III, § D-2-a anwenden, um den
Quasiklassische Zustände des Oszillators
•
| 569
Zustandsvektor |ψ(t)⟩ zu einem beliebigen Zeitpunkt zu erhalten: |ψ(t)⟩ = e−|α0 |
2
/2
∑ n
α 0n −iE n t/ℏ e |φ n ⟩ √n!
= e−iωt/2 e−|α0 |
2
/2
∑ n
α 0n e−inωt |φ n ⟩ √n!
(91)
Vergleichen wir dieses Ergebnis mit der Beziehung (41), so sehen wir: Um vom An fangszustand |ψ(0)⟩ = |α 0 ⟩ zum Zustand |ψ(t)⟩ zu gelangen, genügt es, α 0 durch α 0 e−iωt zu ersetzen und den so erhaltenen Ketvektor mit e−iωt/2 zu multiplizieren (ei nem globalen Phasenfaktor ohne physikalische Konsequenzen): |ψ(t)⟩ = e−iωt/2 |α = α 0 e−iωt ⟩
(92)
Ein quasiklassischer Zustand bleibt also stets ein Eigenvektor von a zu einem Eigen wert α 0 e−iωt , der nichts anderes als der Parameter α(t) in Abb. 1 ist, mit dem der Punkt M festgelegt, also der Zustand des klassischen harmonischen Oszillators cha rakterisiert wird.
3-b Zeitliche Entwicklung der physikalischen Eigenschaften Setzen wir in Gl. (56) für α = α 0 e−iωt und verwenden Gl. (92), so erhalten wir sofort ⟨X⟩(t) = √
2ℏ Re[α 0 e−iωt ] mω
(93)
⟨P⟩(t) = √2mℏω Im[α 0 e−iωt ] Wie vorauszusehen, entsprechen diese Gleichungen den klassischen Beziehun gen (9). Der Erwartungswert der Energie des Oszillators ist zeitunabhängig: ⟨H⟩ = ℏω [|α 0 |2 +
1 ] 2
(94)
Die Standardabweichungen ∆H, ∆X und ∆P sind nach Gl. (51) und Gl. (58) ∆H = ℏω|α0 |
(95)
und ∆X = √
ℏ 2mω (96)
mℏω ∆P = √ 2 ∆X und ∆P hängen nicht von der Zeit ab; zu jedem Zeitpunkt bleibt das Wellenpaket minimal.
•
570 | Ergänzung GV
3-c Bewegung des Wellenpakets Wir berechnen die Wellenfunktion zur Zeit t. Es ist ψ(x, t) = ⟨x|ψ(t)⟩
(97)
wobei |ψ(t)⟩ durch Gl. (92) gegeben ist. Wenn wir von Gl. (76) ausgehen, erhalten wir ψ(x, t) = eiθ α (
mω 1/4 −iωt/2 i x⟨P⟩(t) −[ x−⟨X⟩(t) 2∆X ] e ℏ e ) e πℏ
2
(98)
Dies ist zu allen Zeiten ein Gaußsches Wellenpaket. Weil |ψ(x, t)|2 = |φ0 [x − ⟨X⟩(t)]|2
(99)
ist, ändert sich seine Form zeitlich nicht. Es bleibt [s. Gl. (96)] zu jedem Zeitpunkt minimal. In Abb. 2 ist die Bewegung des Pakets veranschaulicht. Es führt entlang der x-Achse eine harmonische Schwingung mit der Periode T = 2π/ω aus. Wir hatten in Ergänzung GI gesehen, dass sich ein freies Gauß-Paket bei seiner Bewegung verformt: Es verbreitert sich oder „zerfließt“. Hier stellen wir fest, dass dies bei einem Paket in einem parabelförmigen Potential nicht der Fall ist. Physikalisch hat dies seine Ursa che darin, dass das Potential das Wellenpaket aus Bereichen mit großem V(x) zum Ursprung zurückdrängt und so der Verbreiterung entgegenwirkt. Was ergibt sich nun für sehr große |α|? Die Standardabweichungen ∆X und ∆P ändern sich nach Gl. (96) nicht. Dagegen werden die Amplituden ⟨X⟩(t) und ⟨P⟩(t) im Vergleich zu ∆X und ∆P groß. Mit wachsendem |α| kann man daher eine quantenme chanische Bewegung erhalten, für die der Ort und der Impuls des Oszillators relativ
Abb. 2: Bewegung des zum Zustand |α⟩ gehören den Wellenpakets: Unter dem Einfluss des parabo lischen Potentials V(x) oszilliert das Paket, ohne dabei seine Form zu ändern.
Quasiklassische Zustände des Oszillators
| 571
•
so genau bestimmt ist, wie man es nur wünscht. Ist daher |α| ≫ 1, so beschreibt ein |α⟩-Zustand die Bewegung eines makroskopischen harmonischen Oszillators, für den Ort, Impuls und Energie als klassische Größen angesehen werden können, sehr gut.
4 Beispiel eines makroskopischen Oszillators Ein makroskopischer Körper mit der Masse m = 1 kg hänge im Erdfeld (Fallbeschleu nigung g ≈ 10 m/s2 ) an einem Faden der Länge l = 0.1 m. Wir wissen, dass für kleine Schwingungen die Schwingungsdauer durch T = 2π√
l g
(100)
gegeben ist. In unserem Fall erhalten wir T ≈ 0.63 s ω = 10 rad/s
(101)
Wir nehmen nun an, dass dieser Oszillator eine periodische Bewegung mit der Amplitude xM = 1 cm ausführt. Welcher Quantenzustand beschreibt diese Schwin gung am besten? Wie wir sahen, ist dieser Zustand ein |α⟩-Zustand, wobei α nach Gl. (93) der Be ziehung |α| = √
mω xM 2ℏ
(102)
genügt. Hier ist |α| ≈ √5 × 1015 ≈ 2.2 × 1015 ≫ 1
(103)
(das Argument von α ist durch die Nullphase der Bewegung bestimmt). Die Standardabweichungen ∆X und ∆P sind dann ∆X = √
ℏ ≈ 2.2 × 10−18 m ≪ xM 2mω (104)
mℏω ≈ 2.2 × 10−17 kg m/s ∆P = √ 2 Für die Standardabweichung ∆v der Geschwindigkeit erhalten wir ∆v ≈ 2.2 × 10−17 m/s
(105)
Die maximale Geschwindigkeit des Oszillators beträgt 0.1 m/s, so dass die Orts- und Geschwindigkeitsunschärfe gegenüber den bei diesem Problem auftretenden Größen
•
572 | Ergänzung GV
völlig vernachlässigt werden könnte. So ist z. B. ∆X kleiner als ein durchschnittlicher Kerndurchmesser (etwa 10−15 m). Es ist überhaupt keine Frage, dass man eine makro skopische Länge nicht mit einer derartigen Genauigkeit messen kann. Die relative Genauigkeit der Oszillatorenergie schließlich ist nach Gl. (52) ∆H 1 ≈ ≈ 0.4 × 10−15 ≪ 1 ⟨H⟩ |α|
(106)
also ausgezeichnet. Für die Beschreibung eines makroskopischen Oszillators sind also die Gesetze der klassischen Mechanik in weitem Maße ausreichend.
Referenzen und Literaturhinweise Vorlesung von Glauber in (15.2).
Eigenschwingungen gekoppelter Oszillatoren
| 573
•
Ergänzung HV Eigenschwingungen gekoppelter Oszillatoren 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c 2-d
Gekoppelte Schwingungen in der klassischen Mechanik | 573 Bewegungsgleichungen | 573 Lösung der Bewegungsgleichungen | 574 Physikalische Interpretation | 576 Bewegung im allgemeinen Fall | 577 Schwingungszustände des Systems in der Quantenmechanik | 579 Vertauschungsrelationen | 579 Transformation des Hamilton-Operators | 580 Stationäre Zustände | 581 Zeitliche Entwicklung der Erwartungswerte | 582
In diesem Abschnitt untersuchen wir die Bewegung von zwei gekoppelten (eindimen sionalen) harmonischen Oszillatoren. Im Zusammenhang mit diesem einfachen Bei spiel können wir den in der Physik wichtigen Begriff der Eigenschwingungen eines Sys tems einführen. Er begegnet uns bei zahlreichen Problemen in der klassischen genau so wie in der Quantenmechanik, so z. B. bei den Schwingungen von Atomen in einem Kristall (Ergänzung JV ) und bei den Schwingungen elektromagnetischer Strahlungs felder (Ergänzung KV ).
1 Gekoppelte Schwingungen in der klassischen Mechanik 1-a Bewegungsgleichungen Wir betrachten also zwei Teilchen mit derselben Masse m, die sich auf der x-Achse bewegen können; ihre Abszissen nennen wir x1 und x2 . Zunächst nehmen wir an, dass ihre potentielle Energie durch U0 (x1 , x2 ) =
1 1 mω2 (x1 − a)2 + mω2 (x2 + a)2 2 2
(1)
gegeben ist. Für x1 = a und x2 = −a besitzt die potentielle Energie U0 (x1 , x2 ) ein Minimum, und die beiden Teilchen befinden sich in einem stabilen Gleichgewicht. Werden sie aus ihren Gleichgewichtslagen ausgelenkt, so wirken auf sie jeweils die Kräfte ∂ U0 (x1 , x2 ) = −mω2 (x1 − a) ∂x1 ∂ F2 = − U0 (x1 , x2 ) = −mω2 (x2 + a) ∂x2 F1 = −
https://doi.org/10.1515/9783110638738-054
(2)
•
574 | Ergänzung HV
und ihre Bewegungsgleichungen lauten m
d2 x1 (t) = −mω2 (x1 − a) dt2
d2 m 2 x2 (t) = −mω2 (x2 + a) dt
(3)
Die beiden Teilchen führen also unabhängig voneinander um ihre jeweilige Gleichge wichtslage harmonische (d. h. sinusförmige) Schwingungen aus, wobei die Amplitu den durch geeignete Anfangsbedingungen beliebig gewählt werden können.¹ Als potentielle Energie der beiden Teilchen geben wir jetzt den Ausdruck U(x1 , x2 ) = U0 (x1 , x2 ) + V(x1 , x2 )
(4)
V(x1 , x2 ) = λmω2 (x1 − x2 )2
(5)
mit
an (λ ist eine Konstante mit der Dimension eins, die wir die Kopplungskonstante nen nen). Zu den in Gl. (2) angegebenen Kräften F1 und F2 müssen wir die Kräfte ∂ V(x1 , x2 ) = 2λmω2 (x2 − x1 ) ∂x1 ∂ F2 = − V(x1 , x2 ) = 2λmω2 (x1 − x2 ) ∂x2 F1 = −
(6)
hinzufügen. Die Einführung von V(x1 , x2 ) berücksichtigt somit eine Anziehungskraft zwischen den beiden Teilchen, die zu ihrem gegenseitigen Abstand proportional ist. Die Teilchen sind nicht mehr unabhängig voneinander, und wir fragen, wie sie sich jetzt bewegen. Bevor wir auf die Antwort der Quantenmechanik eingehen, erinnern wir an die klassischen Ergebnisse.
1-b Lösung der Bewegungsgleichungen Die Bewegungsgleichungen lauten jetzt m
d2 x1 (t) = −mω2 (x1 − a) + 2λmω2 (x2 − x1 ) dt2
d2 m 2 x2 (t) = −mω2 (x2 + a) + 2λmω2 (x1 − x2 ) dt
(7)
1 Bei der Wahl des Potentials (1) sind allerdings die bei großen Amplituden möglichen Stöße nicht berücksichtigt.
Eigenschwingungen gekoppelter Oszillatoren
| 575
•
Wir wissen, wie man dieses gekoppelte Differentialgleichungssystem lösen kann (s. z. B. Kap. IV, § C-3-a). Wir diagonalisieren die Koeffizientenmatrix K der rechten Seite: K = −mω2 (
1 + 2λ −2λ
−2λ ) 1 + 2λ
(8)
Dann führt man mit den Eigenvektoren von K Linearkombinationen aus x1 (t) und x2 (t) ein, deren zeitliches Verhalten durch ein entkoppeltes System von Differential gleichungen (mit den Eigenwerten von K als Koeffizienten) bestimmt wird. In unserem Fall sind diese Linearkombinationen zum einen xS (t) =
1 [x1 (t) + x2 (t)] 2
(9)
(Koordinate des Schwerpunkts des Zweiteilchensystems) und zum anderen xR (t) = x1 (t) − x2 (t)
(10)
(Koordinate des „Relativteilchens“). Bildet man beim System (7) die Summe und die Differenz und setzt die Ausdrücke für xS (t) und xR (t) ein, so erhalten wir d2 xS (t) = −ω2 xS (t) dt2 d2 xR (t) = −ω2 [xR (t) − 2a] − 4λω2 xR (t) dt2
(11)
Diese Gleichungen kann man sofort integrieren: xS (t) = x0S cos(ωS t + θS ) 2a + x0R cos(ωR t + θR ) xR (t) = 1 + 4λ
(12)
mit ωS = ω ωR = ω√1 + 4λ
(13)
Die Integrationskonstanten x0S , x0R , θS und θR werden durch die Anfangsbedingungen festgelegt. Um die Bewegung der beiden Teilchen selbst zu erhalten, müssen wir nur die Beziehungen (9) und (10) umstellen, 1 xR (t) 2 1 x2 (t) = xS (t) − xR (t) 2 x1 (t) = xS (t) +
und hierin Gl. (12) einsetzen.
(14)
•
576 | Ergänzung HV
1-c Physikalische Interpretation Wir haben also die Bewegungsgesetze für die beiden gekoppelten Teilchen gefunden, indem wir ihnen zwei fiktive Teilchen (S) und (R) zugeordnet haben, die nicht mit einander wechselwirken. Deren Bewegungen hängen nicht voneinander ab, und wir können durch geeignete Anfangsbedingungen je eine Amplitude und eine Phase fest legen. So können wir ein fiktives Teilchen als ruhend annehmen, ohne dass dies für das andere Teilchen der Fall zu sein braucht. Man spricht dann von einer Eigenschwin gung des angeregten Systems. Man beachte, dass sich bei einer Eigenschwingung des Systems beide reellen Teilchen (1) und (2) bewegen, und zwar mit derselben Frequenz (ωS oder ωR ). Es gibt keine Lösung der Bewegungsgleichungen, bei der ein reelles Teilchen in Ruhe bleibt und nur das andere schwingt. Erteilt man einem Teilchen eine Anfangsgeschwindigkeit, bringt die Kopplungskraft auch das andere in Bewegung. Der einfachste Fall ist sicher der, bei dem keine der beiden Eigenschwingungen angeregt wird. In dieser Situation sind in den Beziehungen (12) die Konstanten x0S und x0R gleich null. Die Funktionen xS (t) und xR (t) sind dann konstant gleich null bzw. gleich 2a/(1 + 4λ). Dies gibt nach Gl. (14) x1 = −x2 =
a 1 + 4λ
(15)
Das System oszilliert nicht, und die beiden Teilchen (1) und (2) bleiben in ihren neuen Gleichgewichtslagen (15). Man kann zeigen, dass die auf die Teilchen wirkende Kraft für diese Werte von x1 und x2 verschwindet. Dabei rücken die Teilchen aufgrund ihrer gegenseitigen Anziehung im Vergleich zu λ = 0 näher zusammen. Will man nur die zu xS (t) gehörende Schwingung anregen, so muss man nur die Teilchen (1) und (2) in denselben Abstand 2a/(1 + 4λ) wie beim vorhergehen den Fall bringen und ihnen die gleiche Anfangsgeschwindigkeit erteilen. Man findet dann, dass xR (t) konstant gleich 2a/(1 + 4λ) bleibt (aus diesen Anfangsbedingun gen folgt x0R = 0). Die Teilchen bewegen sich „en bloc“ und führen ohne Änderung ihres Abstands dieselbe Bewegung aus. Für diese Mode kann man das Teilchensys tem als einen nichtdeformierbaren Körper mit der Masse 2m auffassen, auf den die Kraft F1 + F2 = −2mω2 xS (t) wirkt. Man versteht, warum in diesem Fall die Frequenz ωS = ω ist [s. Gl. (A-3) aus Kap. V]. Will man dagegen nur die zu xR (t) gehörende Schwingung anregen, so genügt die Wahl eines Anfangszustands, bei dem die Lagen und Geschwindigkeiten der bei den Teilchen entgegengesetzt sind. Dann gilt für jeden späteren Zeitpunkt xS (t) = 0, und die Bewegung der beiden Teilchen ist in Bezug auf den Ursprung symmetrisch. In diesem Fall ändert sich der Abstand x2 − x1 , und in den Bewegungsgleichungen tritt die Anziehungskraft zwischen den beiden Teilchen auf. Das ist der Grund, wes halb die Frequenz dieser Mode nicht mehr ω, sondern ωR = ω√1 + 4λ ist. Die zu den unabhängigen Eigenschwingungen gehörenden Variablen xS (t) und xR (t) heißen die Normalvariablen.
Eigenschwingungen gekoppelter Oszillatoren
| 577
•
1-d Bewegung im allgemeinen Fall Allgemein werden beide Moden angeregt, und die Zeitfunktionen x1 (t) und x2 (t) sind Überlagerungen von zwei Schwingungen mit den Frequenzen ωS und ωR [s. Gl. (14)]. Die Bewegung ist dann übrigens nur noch periodisch, wenn das Verhältnis ωS /ωR rational ist.² Als Beispiel fragen wir, was geschieht, wenn zum Anfangszeitpunkt t0 das Teil chen (1) in seiner Gleichgewichtslage x1 = a/(1+4λ) ruht und das zweite eine nichtver schwindende Geschwindigkeit besitzt (das ist das klassische Analogon zum Problem in Kap. IV, § C-3-b). Ohne Kopplung würde nur das Teilchen (2) schwingen, während das Teilchen (1) in Ruhe bliebe. Durch die Kopplung wird auch das Teilchen (1) in Be wegung gesetzt. In der zeitlichen Entwicklung von x1 (t) und x2 (t) treten die beiden verschiedenen Frequenzen ωS und ωR auf. Die Überlagerung der dazu gehörenden Schwingungen führt zu einer Schwebung (s. Abb. 1) mit der Frequenz ν=
ω √ ωR − ωS = [ 1 + 4λ − 1] 2π 2π
(16)
Abb. 1: Schwingungen des zur Zeit t = 0 in seiner Gleichgewichtslage ruhenden Teilchens (1), wäh rend das Teilchen (2) eine von null verschiedene Anfangsgeschwindigkeit besitzt. Es entsteht eine Schwebung mit der Frequenz (16), und die Amplitude des Teilchens (1) wird zeitabhängig.
Bei schwacher Kopplung (λ ≪ 1) ist diese Frequenz ν ≈ λω/π und gegenüber ωR und ωS vernachlässigbar. Solange (t − t0 ) ≪ 1/ν ist, schwingt praktisch nur das Teil chen (2). Dann geht die Schwingungsenergie langsam auf das Teilchen (1) über, seine Amplitude wächst, während die des Teilchens (2) abnimmt. Nach einer gewissen Zeit ist die Ausgangssituation umgekehrt: Jetzt schwingt das Teilchen (1) stark, und das
2 Ist ωS /ωR = 1/√1 + 4λ gleich einem irreduziblen rationalen Bruch p1 /p2 , so ist die Periode T = 2πp1 /ωS = 2πp2 /ωR .
•
578 | Ergänzung HV
Teilchen (2) ist praktisch in Ruhe. Darauf nimmt die Amplitude von (1) allmählich ab, die von (2) nimmt zu, bis die Energie von neuem beim Oszillator (2) lokalisiert ist. Dieser Vorgang wiederholt sich immer wieder. Eine schwache Kopplung bewirkt also einen periodischen Energieübergang zwischen den beiden Oszillatoren mit einer zur Kopplungskonstanten proportionalen Frequenz. Bemerkungen: 1. Sind p1 und p2 die Impulse der Teilchen (1) und (2), so lautet die Hamilton-Funktion des Sys tems H(x1 , x 2 , p1 , p2 ) =
p21 p2 + 2 + U 0 (x 1 , x 2 ) + V(x 1 , x 2 ) 2m 2m
(17)
Setzt man pS (t) = p1 (t) + p2 (t) pR (t) =
1 [p1 (t) − p2 (t)] 2
(18)
und μ S = 2m m μR = 2
(19)
so kann man H auf die Form bringen H=
2 p2S p2 4λ 1 1 2a + μ S ω2S x 2S + R + μ R ω2R (x R − ) + m ω2 a2 2μ S 2 2μ R 2 1 + 4λ 1 + 4λ
(20)
Durch einen Wechsel des Energieursprungs kann man den letzten (konstanten) Term zum Ver schwinden bringen. Dann ist H die Summe aus zwei zu den beiden Eigenschwingungen gehö renden Energien. Im Unterschied zu Gl. (17) gibt es keinen Kopplungsterm: Die beiden fiktiven Teilchen sind voneinander unabhängig. 2. Der Einfachheit halber haben wir angenommen, dass die Massen der beiden Teilchen gleich sind. Will man sich von dieser Einschränkung befreien, so muss man mit den Teilchenmassen m 1 und m 2 folgende Ersetzungen vornehmen: xS (t) =
m 1 x 1 (t) + m 2 x 2 (t) m1 + m2
pS (t) = p1 (t) + p2 (t)
(21)
μS = m1 + m2 (für Lage, Impuls und Masse des Schwerpunkts) und x R (t) = x 1 (t) − x 2 (t) m 2 p1 (t) − m 1 p2 (t) m1 + m2 m1 m2 μR = m1 + m2
pR (t) =
(22)
(für Lage, Impuls und Masse des „Relativteilchens“). Man erhält dann ein zu Gl. (20) analoges Ergebnis.
Eigenschwingungen gekoppelter Oszillatoren
| 579
•
3. Ohne Kopplung haben beide Schwingungsmoden dieselbe Frequenz ω; mit Kopplung treten dagegen zwei verschiedene Frequenzen ωS und ωR auf. Ein solches Phänomen finden wir in der Physik häufig: Eine Kopplung zwischen zwei Schwingungen führt in der Mehrzahl der Fälle zu einer Trennung der Eigenfrequenzen (dieselbe Erscheinung würden wir beobachten, wenn die beiden Oszillatoren zu Anfang verschiedene Frequenzen aufweisen). Für den Fall unendlich vieler Oszillatoren (die isoliert dieselbe Frequenz besäßen) bewirkt eine Kopplung das Auftreten einer unendlichen Folge verschiedener Frequenzen (s. Ergänzung JV ).
2 Schwingungszustände des Systems in der Quantenmechanik Wenn wir jetzt das Problem quantenmechanisch behandeln, so müssen wir die Orte x1 (t) und x2 (t) sowie die Impulse p1 (t) und p2 (t) der beiden Teilchen durch Operato ren ersetzen. Wir bezeichnen sie mit X1 , X2 , P1 und P2 . In Analogie zu Gl. (9), Gl. (10) und Gl. (18) führen wir die folgenden Observablen ein: 1 (X1 + X2 ) 2 PS = P1 + P2
(23)
XR = X1 − X2 1 PR = (P1 − P2 ) 2
(24)
XS =
Um zu sehen, ob wir den Hamilton-Operator auf eine zu Gl. (20) analoge Form bringen können, untersuchen wir zunächst die Vertauschungsrelationen dieser vier Operato ren.
2-a Vertauschungsrelationen Weil alle Observablen des Teilchens (1) mit den Observablen des Teilchens (2) vertau schen, sind die einzigen nichtverschwindenden Kommutatoren [X1 , P1 ] = iℏ [X2 , P2 ] = iℏ
(25)
Insbesondere vertauscht X1 mit X2 , so dass sofort [XS , XR ] = 0
(26)
folgt. Entsprechend gilt [PS , PR ] = 0 Für den Kommutator [XS , PS ] erhalten wir 1 [XS , PS ] = {[X1 , P1 ] + [X1 , P2 ] + [X2 , P1 ] + [X2 , P2 ]} 2 1 = {iℏ + iℏ} = iℏ 2
(27)
(28)
•
580 | Ergänzung HV
Ebenso ist [XR , PR ] = iℏ
(29)
Es bleiben die beiden Kommutatoren [XS , PR ] und [XR , PS ]. Für sie ergibt sich einer seits 1 {[X1 , P1 ] − [X1 , P2 ] + [X2 , P1 ] − [X2 , P2 ]} 4 1 = {iℏ − iℏ} = 0 4
[XS , PR ] =
(30)
und andererseits [XR , PS ] = 0
(31)
Wir können daher XS und PS bzw. XR und PR als die Orts- und Impulsoperatoren von zwei verschiedenen „Teilchen“ auffassen. Für diese sind Gl. (28) bzw. Gl. (29) die ka nonischen Vertauschungsrelationen. Darüber hinaus drücken die Beziehungen (26), (27), (30) und (31) aus, dass die Observablen des einen „Teilchens“ mit allen Observa blen des anderen „Teilchens“ vertauschen.
2-b Transformation des Hamilton-Operators Liegt eine Kopplung V(X1 , X2 ) vor, so ist der Hamilton-Operator H =T+U
(32)
mit T=
1 (P2 + P22 ) 2m 1
(33)
(dem Operator der kinetischen Energie) und U=
1 mω2 [(X1 − a)2 + (X2 + a)2 + 2λ(X1 − X2 )2 ] 2
(34)
(dem Operator der potentiellen Energie). Weil P1 und P2 miteinander vertauschen, kann man Gl. (33) transformieren, wie wenn sie Zahlen wären, und findet T=
1 2 1 2 P + P 2μS S 2μR R
(35)
worin μ S und μR in Gl. (19) definiert sind. Weil auch X1 und X2 kommutieren, erhält man wie oben [Gl. (20)] U=
1 4λ 1 2a 2 μ S ω2S XS2 + μ R ω2R (XR − ) + mω2 a2 2 2 1 + 4λ 1 + 4λ
worin ωS und ωR durch Gl. (13) gegeben sind.
(36)
Eigenschwingungen gekoppelter Oszillatoren
|
581
•
Wir sehen, dass der Hamilton-Operator in Analogie zu Gl. (20) auf eine Form ge bracht werden kann, in der ein Kopplungsterm nicht mehr auftritt. Es ist H = HS + HR + mω2 a2
4λ 1 + 4λ
(37)
mit HS =
P2S 1 + μ S ω2S XS2 2μS 2
P2 1 2a 2 HR = R + μ R ω2R [XR − ] 2μR 2 1 + 4λ
(38)
2-c Stationäre Zustände Der Zustandsraum des Systems ist das Tensorprodukt H(1) ⊗ H(2) der Zustandsräu me der Teilchen (1) und (2). Er ist auch das Tensorprodukt H(S) ⊗ H(R) der beiden (zu den beiden Eigenmoden gehörenden) fiktiven Teilchen. Weil H die Summe aus den beiden Operatoren HS und HR ist, die nur in HS bzw. nur in HR wirken (die Kon 4λ stante mω2 a2 1+4λ führt nur zu einer Verschiebung des Energieursprungs), darf man (s. Kap. II, § F) eine Basis von Eigenvektoren von H in der Form |φ⟩ = |φS ⟩|φR ⟩
(39)
suchen. Darin sind |φS ⟩ Eigenvektoren von HS in H(S) und |φR ⟩ Eigenvektoren von HR in H(R). Nun sind HS und HR Hamilton-Operatoren für eindimensionale harmonische Oszillatoren, von denen wir die Eigenwerte und Eigenvektoren kennen. Sind a†S und a†R die durch a†S = a†R
μS ωS 1 PS XS − i ] [√ ℏ √2 √μ S ℏωS
(40a)
μR ωR 1 PR = ] XR − i [√ ℏ √2 √μ R ℏωR
mit XR = XR −
2a 1 + 4λ
(40b)
definierten Operatoren, und sind |φS0 ⟩ und |φR0 ⟩ die Grundzustände von HS und HR , so sind die Eigenvektoren von HS zu den Eigenwerten 1 ) ℏωS 2
(41)
1 (a† )n |φS0 ⟩ √n! S
(42)
ESn = (n + die Vektoren |φSn ⟩ =
•
582 | Ergänzung HV
und die Eigenvektoren von HR zu den Eigenwerten 1 ) ℏωR 2
(43)
1 (a† )p |φR0 ⟩ √p! R
(44)
ERp = (p + sind |φRp ⟩ =
Die Situation ist ähnlich wie bei einem anisotropen zweidimensionalen harmoni schen Oszillator (weil ωS ≠ ωR ist). Diese stationären Zustände des Systems sind |φ n,p ⟩ = |φSn ⟩|φRp ⟩ =
(a†S )n (a†R )p √n! p!
|φ0,0 ⟩
(45)
mit den Energien 4λ 1 + 4λ 4λ 1 1 = (n + ) ℏωS + (p + ) ℏωR + mω2 a2 2 2 1 + 4λ
E n,p = ESn + ERp + mω2 a2
(46)
Somit sind die Operatoren aS und a†S (bzw. aR und a†R ) Vernichtungs- oder Er zeugungsoperatoren für ein Energiequant des Schwingungsmodus (S) [bzw. (R)]. Wie man an Gl. (45) sieht, kann man durch wiederholte Anwendung von a†S und a†R die sta tionären Zustände des Systems für beliebige Quantenzahlen der beiden Eigenmoden erhalten. Die Wirkung dieser vier Operatoren auf die Zustände |φ n,p ⟩ ist sehr einfach: a†S |φ n,p ⟩ = √n + 1 |φ n+1,p ⟩ aS |φ n,p ⟩ = √n |φ n−1,p ⟩ a†R |φ n,p ⟩ = √p + 1 |φ n,p+1⟩
(47)
aR |φ n,p ⟩ = √p |φ n,p−1⟩ Im Allgemeinen ist kein Niveau entartet, denn es gibt keine zwei verschiedenen Paare {n, p} und {n , p }, so dass n ωS + p ωR = n ωS + p ωR
(48)
(bis auf den Fall, dass das Verhältnis ωR /ωS = √1 + 4λ rational ist).
2-d Zeitliche Entwicklung der Erwartungswerte Der allgemeinste Zustand des Systems ist eine Überlagerung der stationären Zustände |φ n,p ⟩: |φ(t)⟩ = ∑ c n,p (t)|φ n,p ⟩ n,p
(49)
Eigenschwingungen gekoppelter Oszillatoren
| 583
•
mit c n,p (t) = c n,p (0)e−iE n,p t/ℏ
(50)
Nach den Beziehungen (40) und ihren Adjungierten sind XS bzw. XR Linearkombina tionen von aS und a†S bzw. aR und a†R . Darum stellt man bei Beachtung von Gl. (47) fest, dass XS nur zwischen den Zuständen |φ n,p ⟩ und |φ n ,p ⟩ von null verschiedene Matrixelemente aufweist, für die n − n = ±1 und p = p ist (und für XR , wenn n = n und p − p = ±1 ist). Hieraus leitet man her, dass in der zeitlichen Entwicklung der Erwartungswerte ⟨XS ⟩(t) und ⟨XR ⟩(t) nur die Bohr-Frequenzen E n±1,p − E n,p = ±ωS ℏ E n,p±1 − E n,p = ±ωR ℏ
(51)
auftreten. ⟨XS ⟩(t) und ⟨XR ⟩(t) schwingen demnach mit den Frequenzen ωS und ωR ; man vergleiche dies mit dem klassischen Ergebnis in § 1-c.
Referenzen und Literaturhinweise Kopplung zweier klassischer Oszillatoren: Berkeley 3 (7.1), § 1.4 und § 3.3; Alonso und Finn (6.1), Bd. I, § 12.10.
•
584 | Ergänzung JV
Ergänzung JV Lineare Oszillatorenkette. Phononen 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c 2-d 3 3-a 3-b
Klassische Behandlung | 585 Bewegungsgleichungen | 585 Einfache Lösungen | 586 Normalvariable | 589 Gesamtenergie und Eigenschwingungen | 593 Quantenmechanische Behandlung | 595 Stationäre Zustände ohne Kopplung | 595 Wirkung der Kopplung | 596 Normaloperatoren. Vertauschungsrelationen | 597 Stationäre Zustände bei Kopplung | 599 Anwendung auf Kristallschwingungen | 599 Problemstellung | 599 Eigenschwingungen. Schallgeschwindigkeit | 600
In Ergänzung HV untersuchten wir ein System aus zwei gekoppelten harmonischen Oszillatoren. Als Grundgedanke ergab sich dabei die Möglichkeit der Einführung neuer dynamischer Variablen (der Normalvariablen), die im Gegensatz zu den Va riablen des einzelnen Oszillators voneinander unabhängig, also entkoppelt sind. Sie beschreiben die Eigenschwingungen des Systems mit wohldefinierten Frequenzen. In diesen Variablen ist der Hamilton-Operator des Gesamtsystems die Summe von zwei Hamilton-Operatoren für unabhängige Oszillatoren, so dass sich die Quantisierung als einfach erweist. Wir wollen diesen Gedanken jetzt auf eine unendliche Folge identischer harmo nischer Oszillatoren anwenden, die regelmäßig auf einer Achse angeordnet und paar weise miteinander gekoppelt sind. Hierzu werden wir die verschiedenen Eigenmoden des Systems bestimmen und zeigen, dass jede von ihnen einer kollektiven Schwingung des Teilchensystems ent spricht, die durch eine Frequenz Ω und einen Wellenvektor k charakterisiert wird. Die Eigenzustände und Eigenwerte des Gesamt-Hamilton-Operators lassen sich dann sehr einfach ermitteln, weil dieser sich als eine Summe der Energien der verschiedenen Ei genmoden darstellt. Mit den Ergebnissen können wir zeigen, wie sich Schwingungen in einem Kris tall ausbreiten, und wir können den in der Festkörperphysik grundlegenden Begriff des Phonons einführen (auf die Eigenschaften der Phononen werden wir allerdings in diesem Buch nicht im Einzelnen eingehen).
https://doi.org/10.1515/9783110638738-055
Lineare Oszillatorenkette. Phononen | 585
•
1 Klassische Behandlung 1-a Bewegungsgleichungen Wir betrachten eine unendliche Kette von eindimensionalen harmonischen Oszillato ren, die wir durch einen ganzzahligen Index q kennzeichnen. Die Gleichgewichtslage des Oszillators (q), also des Teilchens M q mit der Masse m, ist der Punkt ql auf der x-Achse (Abb. 1).
Abb. 1: Unendliche Oszillatorenkette. Mit x q bezeichnen wir die Auslenkung des q-ten Teilchens aus seiner Gleichgewichtslage ql.
Gibt es unter den Teilchen keine Wechselwirkung, so ist die potentielle Energie des Systems +∞
1 mω2 x2q q=−∞ 2
U(. . . , x−1 , x0 , x+1 , . . .) = ∑
(1)
(jeder Oszillator besitzt die Frequenz ω). Die Bewegungsgleichungen lauten dann m
d2 x q (t) = −mω2 x q (t)q = . . . , −1, 0, +1, . . . dt2
(2)
Ihre allgemeinen Lösungen sind x q (t) = x M q cos(ωt − φ q )
(3)
in denen die Integrationskonstanten x M q und φ q durch die Anfangsbedingungen fest gelegt werden. Die Oszillatoren schwingen unabhängig voneinander. Wir stellen uns jetzt vor, dass die Teilchen miteinander in Wechselwirkung ste hen. Der Einfachheit halber wollen wir annehmen, dass man nur die Kräfte berück sichtigen muss, die auf ein Teilchen von seinen nächsten Nachbarn ausgeübt werden. Ferner sollen sie anziehend und proportional zum Abstand sein. Somit unterliegt das Teilchen (q) zwei neuen Anziehungskräften, die von den Teilchen (q + 1) und (q − 1) herrühren und proportional zu |M q M q+1 | bzw. |M q M q−1 | sind (in beiden Fällen soll die Proportionalitätskonstante dieselbe sein). Auf das Teilchen (q) wirkt dann insgesamt die Kraft F q = −mω2 x q − mω21 [ql + x q − (q + 1)l − x q+1 ] − mω21 [ql + x q − (q − 1)l − x q−1 ] = −mω2 x q − mω21 (x q − x q+1 ) − mω21 (x q − x q−1 )
(4)
•
586 | Ergänzung JV
worin ω1 eine Konstante mit der Dimension 1/Zeit ist, die die Stärke der Kopplung charakterisiert. Die Bewegungsgleichungen lauten dann m
d2 x q (t) = −mω2 x q (t) − mω21 [2x q (t) − x q+1 (t) − x q−1 (t)] dt2
(5)
Die Wechselwirkungskraft (also der zweite Term auf der rechten Seite) ergibt sich üb rigens aus dem Kopplungspotential V(. . . , x−1 , x0 , x+1 , . . .) =
+∞ 1 mω21 ∑ (x q − x q+1 )2 2 q=−∞
(6)
Die Gl. (5) stellt ein unendliches System von gekoppelten Differentialgleichungen dar; die zeitliche Entwicklung von x q hängt von x q+1 und x q−1 ab. Bevor wir neue Varia ble einführen, um dieses System zu entkoppeln, wollen wir nach einfachen Lösungen suchen und den physikalischen Sachverhalt präzisieren.
1-b Einfache Lösungen α Existenz einfacher Lösungen Die unendliche Kette gekoppelter Oszillatoren ist ein Bild für eine makroskopische, unendlich ausgedehnte Feder. Auf dieser aber können sich (durch Dilatation und Kompression) longitudinale fortschreitende Wellen ausbreiten. Bei einer Sinuswelle mit dem Wellenvektor k und der Frequenz Ω befindet sich der Punkt auf der Feder, der im Gleichgewicht die Koordinate x hat, zum Zeitpunkt t an der Stelle x + u(x, t), wobei u(x, t) = μ ei(kx−Ωt) + μ∗ e−i(kx−Ωt)
(7)
Lösungen dieser Art existieren auch für das Gleichungssystem (5). Weil aber die Oszil latorenkette kein kontinuierliches Medium ist, beobachtet man den Welleneffekt nur an einer Reihe von Punkten mit den Koordinaten x = ql. Dann repräsentiert u(ql, t) die Auslenkung des Oszillators (q) zur Zeit t: x q (t) = u(ql, t) = μ ei(kql−Ωt) + μ ∗ e−i(kql−Ωt)
(8)
Dieser Ausdruck erfüllt das System (5) dann, wenn Ω und k der Bedingung −mΩ2 = −mω2 − mω21 [2 − eikl − e−ikl ]
(9)
genügen. Somit hängt Ω mit k über das Dispersionsgesetz Ω(k) = √ω2 + 4ω21 sin2 (
kl ) 2
zusammen. Wir werden es weiter unten diskutieren.
(10)
Lineare Oszillatorenkette. Phononen |
587
•
β Physikalische Interpretation In der Lösung (8) der Bewegungsgleichungen schwingen alle Oszillatoren mit dersel ben Frequenz Ω und derselben Amplitude |2μ|, während ihre Phase periodisch von der Gleichgewichtslage abhängt. Die Auslenkungen der verschiedenen Oszillatoren werden durch eine fortschreitende Sinuswelle mit dem Wellenvektor k und der Pha sengeschwindigkeit v φ (k) =
Ω(k) k
(11)
bestimmt. Geht man von Gl. (8) aus, so kann man zeigen, dass x q1 +q2 (t) = x q1 (t −
q2 l ) vφ
(12)
ist. Der Oszillator (q1 + q2 ) führt zeitlich verschoben dieselbe Bewegung wie der Os zillator (q1 ) aus, und zwar um die Zeit, die die Welle mit der Geschwindigkeit v φ zum Durchlaufen des Abstands q2 l der beiden Oszillatoren braucht. Weil dabei alle Oszilla toren in Bewegung sind, nennt man die Lösungen (8) kollektive Schwingungsmoden. γ Mögliche Werte des Wellenvektors Wir betrachten zwei Werte k und k des Wellenvektors, die sich um ein ganzzahliges Vielfaches von 2π/l unterscheiden: k = k +
2nπ l
mit n ganz
(13)
Offensichtlich ist
eik ql = eikql Ω(k ) = Ω(k)
(14)
wobei sich die zweite Beziehung unmittelbar aus Gl. (10) ergibt. Mit Gl. (8) sehen wir, dass die beiden fortschreitenden Wellen zu denselben Be wegungen der Oszillatoren führen, also nicht unterscheidbar sind. Daher reicht es aus, den Wellenvektor k auf ein Intervall der Breite 2π/l einzuschränken. Wir wählen aus Symmetriegründen −
π π 0 ein Ergebnis größer als 2ℏω? Welche Koeffizienten c n verschwin den nicht, wenn 𝒫 = 0 ist? b) Im Folgenden nehmen wir an, dass nur die Koeffizienten c0 und c1 von null ver schieden sind. Man gebe die Normierungsbedingung für |ψ(0)⟩ und den Energie erwartungswert ⟨H⟩ in Abhängigkeit von diesen beiden Koeffizienten an. Man be rechne |c0 |2 und |c1 |2 , wenn zusätzlich ⟨H⟩ = ℏω ist. c) Der normierte Zustand |ψ(0)⟩ ist zunächst nur bis auf einen globalen Phasenfak tor bestimmt. Man lege diesen Faktor fest, indem man c0 reell und positiv wählt. Man setze c1 = |c1 |eiθ1 . Weiter sei ⟨H⟩ = ℏω und ⟨X⟩ =
1√ ℏ 2 mω
Man berechne θ1 . d) Man gebe den Zustand |ψ(t)⟩ für t > 0 an, wenn |ψ(0)⟩ wie in c) festgelegt ist, und berechne den Wert von θ1 zu diesem Zeitpunkt. Hieraus berechne man den Erwartungswert ⟨X⟩(t). 2. Dreidimensionaler anharmonischer Oszillator Für den dreidimensionalen Fall betrachte man ein Teilchen mit der Masse m und der potentiellen Energie V(X, Y, Z) =
4λ 2λ mω2 [(1 + ) (X 2 + Y 2 ) + (1 − ) Z2 ] 2 3 3
Dabei sind ω und λ Konstanten mit ω≥0,
0≤λ
0 die Energie des Teilchens (1) misst? Was ergibt sich bei einer Ortsmessung am Teilchen (1)? Man skizziere das Bild der zugehörigen Wahr scheinlichkeitsdichte. b) Statt zur Zeit t = 0 die Gesamtenergie H zu messen, beobachtet man die Ener gie H2 des Teilchens (2). Das Ergebnis ist ℏω/2. Wie lauten jetzt die Antworten auf die Fragen unter α) und β)?
•
636 | Ergänzung MV
5. (Fortsetzung von Aufgabe 3) Die gemeinsamen Eigenzustände von H1 und H2 seien |Φ n1 ,n2 ⟩ und die Eigenwerte (n1 + 1/2)ℏω und (n2 + 1/2)ℏω. Der Austauschoperator der beiden Teilchen wird definiert durch die Beziehung P a |Φ n1 ,n2 ⟩ = |Φ n2 ,n1 ⟩ a) Man zeige, dass P−1 a = P a und P a unitär ist. Welche Eigenwerte hat P a ? Es sei † B = P a BP a die Transformierte einer beliebigen Observablen B. Man zeige, dass die Bedingung B = B (B ist in Bezug auf den Austausch der beiden Teilchen in variant) äquivalent zu [B, P a ] = 0 ist. b) Man zeige, dass P a H1 P†a = H2 P a H2 P†a = H1 gilt. Vertauscht H mit P a ? Man berechne die Transformierten der Observablen X1 , P1 , X2 und P2 . c) Man konstruiere eine Basis von gemeinsamen Eigenvektoren von H und P a . Bil den diese beiden Operatoren einen V. S. K. O.? Was wird aus dem Spektrum von H und dem Entartungsgrad seiner Eigenwerte, wenn man nur die Eigenvektoren |Φ⟩ von H behält, für die P a |Φ⟩ = −|Φ⟩ gilt? 6. Geladener Oszillator in einem elektrischen Feld Ein eindimensionaler harmonischer Oszillator bestehe aus einem Teilchen mit der Masse m, der Ladung q und der potentiellen Energie V(X) = mω2 X 2 /2. Für diese Aufgabe bewege sich das Teilchen in einem zeitabhängigen, in x-Richtung weisenden elektrischen Feld ℰ(t), so dass man zur potentiellen Energie V(X) den Term W(t) = −qℰ(t)X hinzufügen muss. a) Man drücke den Hamilton-Operator des Teilchens durch die Vernichtungs- und Erzeugungsoperatoren a und a† aus. Man berechne die Kommutatoren von a und von a† mit H(t). b) Es sei α(t) = ⟨ψ(t)|a|ψ(t)⟩ worin |ψ(t)⟩ der normierte Zustandsvektor des Teilchens ist. Man gebe die Ant worten auf die vorstehende Frage, wenn α(t) der Differentialgleichung d α(t) = −iωα(t) + iλ(t) dt genügt, wobei λ(t) durch q ℰ(t) λ(t) = √2mℏω definiert ist. Man integriere diese Gleichung. Man bestimme den Erwartungswert des Teilchenortes und des Teilchenimpulses.
Aufgaben | 637
•
c) Der Ketvektor |φ(t)⟩ sei definiert durch |φ(t)⟩ = [a − α(t)]|ψ(t)⟩ (α(t) ist die unter b) angegebene Zahl). Unter Verwendung der vorstehenden Er gebnisse zeige man, dass |φ(t)⟩ der Differentialgleichung iℏ
d |φ(t)⟩ = [H(t) + ℏω]|φ(t)⟩ dt
genügt. Wie verhält sich die Norm von |φ(t)⟩ in Abhängigkeit von der Zeit? d) Es sei |ψ(0)⟩ Eigenvektor von a zum Eigenwert α(0). Man zeige, dass auch |ψ(t)⟩ Eigenvektor von a ist, und berechne den zugehörigen Eigenwert. Hieraus leite man für den Zeitpunkt t den Erwartungswert des ungestörten Hamil ton-Operators H0 = H(t) − W(t) in Abhängigkeit von α(0) her. Man bestimme die Standardabweichungen ∆X, ∆P und ∆H0 . Wie ist ihr zeitliches Verhalten? e) Zum Zeitpunkt t = 0 sei der Oszillator im Grundzustand |φ0 ⟩. Das elektrische Feld wirke während des Zeitintervalls [0, T] und sei anschließend null. Man bestimme für t > T den zeitlichen Verlauf der Erwartungswerte ⟨X⟩(t) und ⟨P⟩(t). Beispiel: Im Zeitintervall [0, T] sei ℰ(t) = ℰ0 cos(ω t). Man diskutiere die beobachtbaren Phänomene in Abhängigkeit von ∆ω = ω − ω. Welche Ergebnisse erhält man mit welchen Wahrscheinlichkeiten, wenn man für t > T eine Energiemessung vornimmt? 7. Gegeben sei ein eindimensionaler harmonischer Oszillator mit dem Hamilton-Ope rator H und den stationären Zuständen |φ n ⟩: H|φ n ⟩ = (n + 1/2)ℏω|φ n ⟩ Der Operator U(k) sei durch U(k) = eikX definiert; k ist reell. a) Ist U(k) unitär? Man zeige, dass seine Matrixelemente für beliebiges n die Bezie hung ∑ |⟨φ n |U(k)|φ n ⟩|2 = 1 n
erfüllen. b) Man drücke U(k) durch die Operatoren a und a† aus. Man verwende die GlauberFormel (63) aus Ergänzung BII , mit der man U(k) als ein Produkt von Exponential operatoren schreiben kann. c) Man beweise die Beziehungen eλa |φ0 ⟩ = |φ0 ⟩ †
⟨φ n |eλa |φ0 ⟩ =
λn √n!
mit einem beliebigen komplexen Parameter λ.
•
638 | Ergänzung MV
d) Man gebe das Matrixelement ⟨φ0 |U(k)|φ n ⟩ in Abhängigkeit von E k = ℏ2 k 2 /2m und E ω = ℏω an. Was ergibt sich für k → 0? Kann man die Antwort auch unmit telbar erhalten? 8. Für einen eindimensionalen harmonischen Oszillator lautet der Entwicklungsope rator U(t, 0) = e−iHt/ℏ mit H = ℏω (a† a +
1 ) 2
a) Man betrachte die Operatoren ̃ (t) = U † (t, 0)a U(t, 0) a
̃ † (t) = U † (t, 0)a† U(t, 0) a
Man bestimme ihre Wirkung auf die Eigenvektoren |φ n ⟩ und ermittle daraus ihre Abhängigkeit von a und a† . b) Man berechne die Operatoren ̃ = U † (t, 0)X U(t, 0) X(t) ̃ = U † (t, 0)P U(t, 0) P(t) und interpretiere das Ergebnis. c) Man zeige, dass U † (π/2ω, 0)|x⟩ Eigenvektor von P ist, und bestimme den zuge hörigen Eigenwert. Man zeige ebenso, dass U † (π/2ω, 0)|p⟩ Eigenvektor von X ist, und bestimme den Eigenwert. d) Für t = 0 sei die Wellenfunktion des Oszillators ψ(x, 0). Wie erhält man für alle späteren Zeiten t q = qπ/2ω (q positiv ganz) die Wellenfunktion ψ(x, t q )? e) Es sei ψ(x, 0) gleich der Wellenfunktion φ n (x) eines stationären Zustands. Mit Hil fe von d) leite man die Beziehung her, die zwischen φ n (x) und ihrer Fourier-Trans formierten φ n (p) bestehen muss. f) Man beschreibe qualitativ für die folgenden Fälle die zeitliche Entwicklung der Wellenfunktion: 1. ψ(x, 0) = eikx mit gegebenem reellen k; 2. ψ(x, 0) = e−ρx mit ρ reell und positiv; 1 a a { wenn − ≤ x ≤ { 2 2 √a 3. ψ(x, 0) = { { 0 sonst { 2 2 4. ψ(x, 0) = e−ρ x mit ρ reell.
VI Der Drehimpuls in der Quantenmechanik A B B-1 B-2 B-3 C C-1 C-2 C-3 D D-1 D-2
Die Bedeutung des Drehimpulses | 639 Drehimpulsvertauschungsrelationen | 641 Bahndrehimpuls | 641 Verallgemeinerung: Definition eines Drehimpulses | 642 Problemstellung | 643 Allgemeine Theorie des Drehimpulses | 644 Definitionen und Notationen | 644 Die Eigenwerte von J2 und J z | 646 Standarddarstellungen {|k, j, m⟩} | 650 Anwendung auf Bahndrehimpulse | 658 Eigenwerte und Eigenfunktionen von L2 und L z | 658 Physikalische Diskussion | 666
A Die Bedeutung des Drehimpulses Dies ist das erste von vier Kapiteln (VI, VII, IX und X), die der Untersuchung von Dreh impulsen in der Quantenmechanik gewidmet sind. Es handelt sich hierbei um eine äu ßerst wichtige Fragestellung, und die Ergebnisse, auf die wir stoßen werden, finden in zahlreichen Bereichen der Physik Anwendung, so bei der Klassifikation der Spektren von Atomen, Molekülen und Kernen, dem Spin von Elementarteilchen, dem Magne tismus usw. Wir kennen bereits die wichtige Rolle, die der Drehimpuls in der klassischen Me chanik spielt; der Gesamtdrehimpuls eines isolierten physikalischen Systems ist eine Konstante der Bewegung. Das gilt auch für bestimmte andere Fälle, wenn das System nicht isoliert ist. Wenn sich z. B. ein Massenpunkt P mit der Masse m in einem Zentral potential (ein Potential, das nur vom Abstand zwischen P und einem festen Punkt O abhängt) bewegt, zeigt die Kraft auf P immer in die Richtung von O. Das Drehmoment bezüglich des Punkts O ist somit gleich null, so dass der Drehimpulssatz besagt d 𝓛=0 dt
(A-1)
worin 𝓛 der Drehimpuls von P bezüglich O ist. Diese Eigenschaft zieht wichtige Fol gerungen nach sich: Die Bewegung von P verläuft in einer festen Ebene (die Ebene durch O und senkrecht auf 𝓛); außerdem erfüllt diese Bewegung den Flächensatz (das 2. Keplersche Gesetz). Diese Eigenschaften finden sich auch in der Quantenmechanik wieder. Zu dem Drehimpuls 𝓛 eines klassischen Systems gehört eine Observable L, also ein Satz drei er Observablen L x , L y und L z , die den drei Komponenten von 𝓛 in einem kartesischen Koordinatensystem entsprechen. Wenn es sich bei dem betrachteten physikalischen System um einen Massenpunkt in einem Zentralpotential handelt, so werden wir in Kapitel VII zeigen, dass L x , L y und L z Konstanten der Bewegung im quantenmecha https://doi.org/10.1515/9783110638738-059
640 | VI Der Drehimpuls in der Quantenmechanik
nischen Sinn sind, d. h. dass sie mit dem Hamilton-Operator H vertauschen, der das Teilchen im Zentralpotential beschreibt. Durch diese wichtige Eigenschaft wird die Be stimmung und die Klassifikation der Eigenzustände von H beträchtlich vereinfacht. In Kapitel IV haben wir das Stern-Gerlach-Experiment beschrieben, das die Quan telung des Drehimpulses zeigte: Die Komponente längs einer gegebenen Achse des in neren Drehimpulses eines Atoms kann nur bestimmte diskrete Werte annehmen; wir werden sehen, dass Drehimpulse in dieser Weise quantisiert sind. Damit werden wir den atomaren Magnetismus, den Zeeman-Effekt usw. verstehen können. Bei der Un tersuchung dieser Phänomene werden wir auf typische quantenmechanische Drehim pulse geführt, die kein klassisches Analogon besitzen (innere Drehimpulse von Ele mentarteilchen; Kapitel IX). Von nun an wollen wir jeden Drehimpuls, der ein klassisches Analogon besitzt, als Bahndrehimpuls (und die entsprechende Observable mit L) und den inneren Dreh impuls eines Elementarteilchens als Spindrehimpuls oder kurz Spin (mit dem entspre chenden Buchstaben S) bezeichnen. In komplexen Systemen wie einem Atom, einem Atomkern oder einem Molekül addieren sich die Bahndrehimpulse Li der verschie denen Elementarteilchen (Elektronen, Protonen, Neutronen, . . . ) untereinander und mit den Spindrehimpulsen S i dieser Teilchen und bilden so den Gesamtdrehimpuls J des Systems. Wie im Einzelnen die Drehimpulse in der Quantenmechanik zu addieren sind (Kopplung von Drehimpulsen), werden wir in Kapitel X untersuchen. Schließlich machen wir noch darauf aufmerksam, dass wir das Symbol J auch zur Bezeichnung eines beliebigen Drehimpulses verwenden werden, wenn es keine Rolle spielt, ob es sich um einen Bahndrehimpuls, einen Spin oder eine Kombination mehrerer Drehim pulse handelt. Bevor wir mit der Untersuchung der gerade angesprochenen physikalischen Sys teme (Energieniveaus eines Teilchens in einem Zentralpotential, Spin, Zeeman-Effekt, Addition von Drehimpulsen, . . . ) beginnen, behandeln wir in diesem Kapitel die all gemeinen quantenmechanischen Eigenschaften eines Drehimpulses unabhängig von seiner speziellen Natur. Diese Eigenschaften folgen aus den Vertauschungsrelationen, die die drei Obser vablen J x , J y und J z , die Komponenten eines beliebigen Drehimpulses J, erfüllen. Den Ursprung dieser Vertauschungsrelationen diskutieren wir in § B: Für einen Bahndreh impuls sind sie eine einfache Folge der Quantisierungsregeln (Kap. III, § B-5) und der kanonischen Vertauschungsrelationen [Kap. II, Gl. (E-31)]; für Spindrehimpulse, die kein klassisches Analogon besitzen, stellen sie die Definitionen der entsprechenden Observablen dar.¹ In § C untersuchen wir die Folgerungen aus diesen Vertauschungs relationen, die charakteristisch für Drehimpulse sind. Insbesondere diskutieren wir 1 Der eigentliche Ursprung dieser Vertauschungsrelationen ist rein geometrischer Natur. Wir wollen diese Zusammenhänge in Ergänzung BVI ausführlich besprechen; dabei werden wir den engen Zusam menhang zwischen den Drehimpulsen eines Systems bezüglich eines Punkts O und den geometrischen Rotationen dieses Systems um O herausarbeiten.
B Drehimpulsvertauschungsrelationen | 641
die räumliche Quantisierung, d. h. die Eigenschaft, dass jede Komponente des Dreh impulses ein diskretes Spektrum besitzt. In § D schließlich wollen wir die so erhalte nen allgemeinen Ergebnisse auf den Bahndrehimpuls eines Teilchens anwenden.
B Drehimpulsvertauschungsrelationen B-1 Bahndrehimpuls Zur Bestimmung der Observablen L x , L y , L z , die in der Quantenmechanik den drei Komponenten des Drehimpulses 𝓛 eines spinlosen Teilchens entsprechen, wenden wir einfach die in § B-5 von Kapitel III angegebenen Quantisierungsregeln an. Wir be trachten also die Komponente ℒx des klassischen Drehimpulses ℒx = yp z − zp y
(B-1)
Den Ortsvariablen y und z ordnen wir die Observablen Y und Z zu, und entsprechend den Impulsvariablen p y und p z die Observablen P y und P z . Obwohl der Ausdruck (B-1) Produkte von zwei klassischen Variablen enthält, ist bei ihrer Ersetzung durch die ent sprechenden Observablen keine besondere Vorsicht notwendig, da Y mit P z und Z mit P y vertauscht [s. die kanonischen Vertauschungsrelationen (E-31), Kap. II]. Es ist also nicht nötig, den Ausdruck (B-1) zu symmetrisieren, um den Operator L x zu erhalten; darum ist L x = YP z − ZP y
(B-2)
Aus dem gleichen Grund (sowohl Y und P z als auch Z und P y vertauschen) ist der so erhaltene Operator hermitesch. Analog ergeben sich die Operatoren L y und L z , die den Komponenten ℒy und ℒz des klassischen Drehimpulses entsprechen. Wir können also schreiben L= R×P
(B-3)
Da die kanonischen Vertauschungsrelationen der Ortsobservablen R und der Im pulsobservablen P bekannt sind, lassen sich die Kommutatoren der Operatoren L x , L y und L z leicht bestimmen. Berechnen wir z. B. [L x , L y ]: [L x , L y ] = [YP z − ZP y , ZP x − XP z ] = [YP z , ZP x ] + [ZP y , XP z ]
(B-4)
da YP z mit XP z und ZP y mit ZP x vertauscht. Wir erhalten dann [L x , L y ] = Y[P z , Z]P x + X[Z, P z ]P y = −iℏ YP x + iℏ XP y = iℏ L z
(B-5)
642 | VI Der Drehimpuls in der Quantenmechanik
Analoge Rechnungen führen auf die beiden anderen Kommutatoren, so dass sich schließlich ergibt [L x , L y ] = iℏ L z [L y , L z ] = iℏ L x
(B-6)
[L z , L x ] = iℏ L y Dies sind also die Vertauschungsrelationen für die Komponenten des Drehimpulses eines spinlosen Teilchens. Das Ergebnis lässt sich sofort auf ein System N spinloser Teilchen verallgemei nern. Der Gesamtdrehimpuls dieses Systems lautet in der Quantenmechanik N
L = ∑ Li
(B-7)
i=1
mit Li = Ri × Pi
(B-8)
Jeder einzelne Drehimpuls Li erfüllt die Vertauschungsrelationen (B-6) und vertauscht außerdem mit Lj , wenn j nicht gleich i ist (Operatoren, die in den Zustandsräumen verschiedener Teilchen wirken). Wir sehen also, dass die Relationen (B-6) für den Ge samtdrehimpuls L gültig bleiben.
B-2 Verallgemeinerung: Definition eines Drehimpulses Die drei Operatoren, die den drei Komponenten eines beliebigen klassischen Drehim pulses entsprechen, erfüllen also die Vertauschungsrelationen (B-6). Diese Relationen haben ihren Ursprung in den geometrischen Eigenschaften der Rotationen im dreidi mensionalen Raum (s. Ergänzung BVI ). Wir wollen daher allgemeiner einen Drehim puls J als einen Satz von drei Observablen J x , J y , J z definieren, für die gilt [J x , J y ] = iℏ J z [J y , J z ] = iℏ J x
(B-9)
[J z , J x ] = iℏ J y Wir führen dann den Operator J2 = J 2x + J 2y + J 2z
(B-10)
ein, das (skalare) Quadrat des Drehimpulses J. Dieser Operator ist hermitesch, da J x , J y und J z hermitesch sind. Wir wollen annehmen, dass es sich um eine Observable handelt. Wir zeigen, dass J2 mit den drei Komponenten von J vertauscht: [J2 , J] = 0
(B-11)
B Drehimpulsvertauschungsrelationen |
643
Wir führen die Rechnung z. B. für J x durch: [J2 , J x ] = [J 2x + J 2y + J 2z , J x ] = [J 2y , J x ] + [J 2z , J x ]
(B-12)
da J x offenbar mit sich selbst und damit auch mit seinem Quadrat vertauscht. Die an deren beiden Kommutatoren ergeben sich leicht aus Gl. (B-9): [J 2y , J x ] = J y [J y , J x ] + [J y , J x ]J y = −iℏ J y J z − iℏ J z J y
(B-13a)
[J 2z , J x ] = J z [J z , J x ] + [J z , J x ]J z = iℏ J z J y + iℏ J y J z
(B-13b)
Die Summe dieser beiden Operatoren, die in Gl. (B-12) eingeht, ist also tatsächlich gleich null. Die Theorie des Drehimpulses in der Quantenmechanik beruht vollständig auf den Vertauschungsrelationen (B-9). Aus ihnen folgt, dass es unmöglich ist, die drei Komponenten eines Drehimpulses gleichzeitig zu messen; jedoch sind J2 und eine beliebige Komponente von J kompatibel.
B-3 Problemstellung Wir kehren zum Beispiel eines spinlosen Teilchens in einem Zentralpotential zurück, das wir in der Einleitung erwähnt haben. Wie wir in Kapitel VII sehen werden, ver tauschen in diesem Fall die drei Komponenten des Drehimpulses L des Teilchens mit dem Hamilton-Operator H; das gilt also auch für den Operator L2 . Wir haben dann vier Konstanten der Bewegung zur Verfügung: L2 , L x , L y , L z . Diese vier Operatoren aber vertauschen nicht alle miteinander; wenn wir mit H ein vollständiges System kommu tierender Observabler bilden wollen, müssen wir nur L2 und einen der drei anderen Operatoren, z. B. L z , auswählen. Für ein solches Teilchen unter dem Einfluss eines Zentralpotentials können wir dann nach Eigenzuständen des Hamilton-Operators H suchen, die auch Eigenvektoren von L2 und L z sind, ohne dass dadurch die Allge meinheit der Fragestellung eingeschränkt würde. Allerdings ist es nicht möglich, eine Basis des Zustandsraums zu konstruieren, die aus gemeinsamen Eigenvektoren der drei Komponenten von L besteht, da diese drei Observablen nicht vertauschen. Diese Situation liegt auch für den allgemeinen Fall vor: Da die Komponenten ei nes beliebigen Drehimpulses J nicht vertauschen, sind sie nicht gleichzeitig diagona lisierbar. Wir werden daher nach dem System gemeinsamer Eigenvektoren von J2 und J z suchen, also den Observablen, die dem Quadrat des Betrags des Drehimpulses und seiner Komponente längs der z-Achse entsprechen.
644 | VI Der Drehimpuls in der Quantenmechanik
C Allgemeine Theorie des Drehimpulses In diesem Abschnitt wollen wir das Spektrum von J2 und J z für den allgemeinen Fall bestimmen und ihre gemeinsamen Eigenvektoren untersuchen. Wir werden dabei ähnlich vorgehen wie in Kapitel V bei der Behandlung des harmonischen Oszillators.
C-1 Definitionen und Notationen C-1-a Die Operatoren J + und J − Es erweist sich als vorteilhaft, anstelle der Komponenten J x und J y des Drehimpulses J die folgenden Linearkombinationen einzuführen: J + = J x + iJ y
(C-1)
J − = J x − iJ y
Wie die Operatoren a und a† des harmonischen Oszillators sind J + und J− nicht her mitesch: Sie sind ihre gegenseitigen Adjungierten. Im Rest dieses Abschnitts werden wir nur die Operatoren J+ , J − , J z und J2 verwen den. Durch einfaches Einsetzen zeigt man mit Hilfe von Gl. (B-9) und Gl. (B-11), dass diese Operatoren die folgenden Vertauschungsrelationen erfüllen: [J z , J + ] = ℏ J +
(C-2)
[J z , J − ] = −ℏ J−
(C-3)
[J + , J − ] = 2ℏ J z 2
2
(C-4) 2
[J , J + ] = [J , J − ] = [J , J z ] = 0
(C-5)
Wir berechnen die Produkte J + J − und J − J + : J+ J − = (J x + iJ y ) (J x − iJ y ) = J 2x + J 2y − i[J x , J y ] = J 2x + J 2y + ℏ J z
(C-6a)
J − J + = (J x − iJ y ) (J x + iJ y ) = J 2x + J 2y + i[J x , J y ] = J 2x + J 2y − ℏ J z Mit Hilfe der Definition (B-10) für den Operator ben in der Form
(C-6b) J2
lassen sich diese Ausdrücke schrei
J + J − = J2 − J 2z + ℏ J z 2
J− J+ = J −
J 2z
− ℏ Jz
Durch Addition der einzelnen Summanden erhalten wir daraus 1 J2 = (J + J − + J − J + ) + J 2z 2
(C-7a) (C-7b)
(C-8)
C Allgemeine Theorie des Drehimpulses | 645
C-1-b Notation für die Eigenwerte von J2 und J z Nach Gl. (B-10) handelt es sich bei J2 um die Summe der Quadrate von drei hermi teschen Operatoren. Folglich ist für einen beliebigen Vektor |ψ⟩ das Matrixelement ⟨ψ|J2 |ψ⟩ positiv oder gleich null: ⟨ψ|J2 |ψ⟩ = ⟨ψ|J 2x |ψ⟩ + ⟨ψ|J 2y |ψ⟩ + ⟨ψ|J 2z |ψ⟩ = ‖J x |ψ⟩‖2 + ‖J y |ψ⟩‖2 + ‖J z |ψ⟩‖2 ≥ 0
(C-9)
Dieses Ergebnis ist nicht überraschend, da J2 dem Betragsquadrat des Drehimpulses J entspricht. Insbesondere folgt, dass sämtliche Eigenwerte von J2 positiv oder gleich null sind, da ⟨ψ|J2 |ψ⟩ gleich dem Produkt des entsprechenden Eigenwerts und dem Quadrat der Norm von |ψ⟩, also einer stets positiven Zahl ist, wenn |ψ⟩ ein Eigenvektor von J2 ist. Wir schreiben die Eigenwerte von J2 in der Form j(j + 1)ℏ2 und verwenden die Konvention j≥0
(C-10)
Diese Notation vereinfacht die folgenden Überlegungen; auf das Ergebnis hat sie kei nerlei Einfluss. Da J die Dimension von ℏ hat, ist ein Eigenwert von J2 notwendig von der Form λℏ2 (λ reell mit der Dimension eins). Wie wir gesehen haben, muss λ posi tiv oder gleich null sein; es lässt sich dann leicht zeigen, dass die Gleichung zweiter Ordnung in j, j(j + 1) = λ
(C-11)
immer genau eine positive oder verschwindende Wurzel hat. Unter Beachtung der Konvention (C-10) legt also die Angabe von λ den Wert von j eindeutig fest. Somit lässt sich jeder Eigenwert von J2 als j(j + 1)ℏ2 schreiben, wobei j positiv oder gleich null ist. Die Eigenwerte des Operators J z haben die Dimension von ℏ; üblicherweise be zeichnet man sie mit mℏ, wobei die Zahl m die Dimension eins hat. C-1-c Eigenwertgleichungen für J2 und J z Die gemeinsamen Eigenvektoren von J2 und J z bezeichnen wir durch die Indizes j und m, die die entsprechenden Eigenwerte angeben. Die Operatoren J2 und J z bilden je doch nicht immer einen V. S. K. O. (s. z. B. Kap. VII, § A); daher ist es notwendig, ei nen dritten Index einzuführen, um zwischen den verschiedenen Eigenvektoren, die zu denselben Eigenwerten j(j + 1)ℏ2 und mℏ von J2 und J z gehören, unterscheiden zu können (darauf werden wir unten in § C-3-a genauer eingehen). Wir wählen den Index k (dabei muss es sich nicht notwendig um einen diskreten Index handeln). Wir versuchen also, die folgenden Eigenwertgleichungen simultan zu lösen: J2 |k, j, m⟩ = j(j + 1)ℏ2 |k, j, m⟩ J z |k, j, m⟩ = mℏ |k, j, m⟩
(C-12)
646 | VI Der Drehimpuls in der Quantenmechanik C-2 Die Eigenwerte von J2 und J z Wie in § B-2 von Kapitel V beginnen wir mit dem Beweis von drei Hilfssätzen, die uns dann die Bestimmung des Spektrums von J2 und J z ermöglichen. C-2-a Lemmata α Lemma I (Eigenschaften der Eigenwerte von J2 und J z ) Wenn j(j + 1)ℏ2 und mℏ die Eigenwerte von J2 und J z sind, die zu demselben Eigen vektor |k, j, m⟩ gehören, so erfüllen j und m die Ungleichung −j ≤ m ≤ j
(C-13)
Zum Beweis dieser Aussage betrachten wir die beiden Vektoren J + |k, j, m⟩ und J − |k, j, m⟩ und verwenden, dass ihre Normen positiv oder gleich null sind, ‖J + |k, j, m⟩‖2 = ⟨k, j, m | J− J + | k, j, m⟩ ≥ 0
(C-14a)
‖J − |k, j, m⟩‖2 = ⟨k, j, m | J+ J − | k, j, m⟩ ≥ 0
(C-14b)
Um die linken Seiten dieser Ungleichungen zu berechnen, greifen wir auf Gl. (C-7) zu rück. Es ergibt sich (wenn wir |k, j, m⟩ als normiert annehmen) ⟨k, j, m | J − J + | k, j, m⟩ = ⟨k, j, m | (J2 − J 2z − ℏJ z ) | k, j, m⟩ = j(j + 1)ℏ2 − m2 ℏ2 − mℏ2 ⟨k, j, m | J + J − | k, j, m⟩ = ⟨k, j, m | (J − 2
J 2z
(C-15a)
+ ℏJ z ) | k, j, m⟩
= j(j + 1)ℏ2 − m2 ℏ2 + mℏ2
(C-15b)
Setzen wir diese Ausdrücke in die Ungleichungen (C-14) ein, so erhalten wir j(j + 1) − m(m + 1) = (j − m)(j + m + 1) ≥ 0
(C-16a)
j(j + 1) − m(m − 1) = (j − m + 1)(j + m) ≥ 0
(C-16b)
d. h. −(j + 1) ≤ m ≤ j −j ≤ m ≤ j + 1
(C-17a) (C-17b)
Diese beiden Bedingungen sind nur dann gleichzeitig erfüllt, wenn m der Unglei chung (C-13) genügt.
C Allgemeine Theorie des Drehimpulses |
647
β Lemma II (Eigenschaften des Vektors J − |k, j, m⟩) Es sei |k, j, m⟩ ein Eigenvektor von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und mℏ. Dann gilt: 1. Für m = −j ist J − |k, j, −j⟩ = 0. 2. Für m > −j ist J − |k, j, m⟩ ein Eigenvektor ungleich null von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und (m − 1)ℏ. Zu 1: Nach Gl. (C-15b) ist das Quadrat der Norm von J − |k, j, m⟩ gleich ℏ2 [j(j + 1) − m(m − 1)] und wird somit für m = −j null. Da die Norm eines Vektors genau dann gleich null ist, wenn es sich um den Nullvektor handelt, folgern wir daraus, dass alle Vektoren J − |k, j, −j⟩ null sind: m = −j
⇒
J − |k, j, −j⟩ = 0
(C-18)
Auch die Umkehrung von (C-18), J − |k, j, m⟩ = 0
⇒
m = −j
(C-19)
lässt sich leicht zeigen: Wir wenden J + auf beide Seiten der Gleichung in (C-19) an und beachten dabei Gl. (C-7), womit wir erhalten ℏ2 [j(j + 1) − m 2 + m]|k, j, m⟩ = ℏ2 (j + m)(j − m + 1) |k, j, m⟩ = 0
(C-20)
Mit Gl. (C-13) sieht man, dass Gl. (C-20) nur die eine Lösung m = −j besitzt. Zu 2: Wir nehmen nun m größer als −j an. Nach Gl. (C-15b) ist J − |k, j, m⟩ dann ein Vektor ungleich null, da das Quadrat seiner Norm nicht verschwindet. Wir zeigen, dass es sich um einen Eigenvektor von J2 und J z handelt: Die Opera toren J− und J2 vertauschen; daher gilt [J2 , J − ]|k, j, m⟩ = 0
(C-21)
was sich schreiben lässt als J2 J − |k, j, m⟩ = J − J2 |k, j, m⟩ = j(j + 1)ℏ2 J − |k, j, m⟩
(C-22)
Diese Beziehung drückt die Tatsache aus, dass J − |k, j, m⟩ ein Eigenvektor von J2 mit dem Eigenwert j(j + 1)ℏ2 ist. Nun wenden wir die Operatorgleichung (C-3) auf |j, k, m⟩ an: [J z , J − ]|k, j, m⟩ = −ℏJ − |k, j, m⟩
(C-23)
648 | VI Der Drehimpuls in der Quantenmechanik
d. h. J z J − |k, j, m⟩ = J − J z |k, j, m⟩ − ℏJ − |k, j, m⟩ = mℏJ − |k, j, m⟩ − ℏJ − |k, j, m⟩ = (m − 1)ℏ J − |k, j, m⟩
(C-24)
J − |k, j, m⟩ ist also ein Eigenvektor von J z mit dem Eigenwert (m − 1)ℏ. γ Lemma III (Eigenschaften des Vektors J + |k, j, m⟩) Es sei |k, j, m⟩ ein Eigenvektor von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und mℏ. Dann gilt: 1. Für m = j ist J + |k, j, j⟩ = 0. 2. Für m < j ist J + |k, j, m⟩ ein Eigenvektor ungleich null von J2 und J z mit den Eigen werten j(j + 1)ℏ2 und (m + 1)ℏ. Zu 1: Zum Beweis gehen wir wie oben vor: Nach Gl. (C-14a) ist das Quadrat der Norm von J + |k, j, m⟩ null für m = j: m=j
⇒
J + |k, j, j⟩ = 0
(C-25)
Ebenso zeigt man die Umkehrung, so dass gilt J + |k, j, m⟩ = 0
⇐⇒
m=j
(C-26)
Zu 2: Für m < j führt analoges Vorgehen mit Hilfe der Gleichungen (C-5) und (C-2) auf J2 J + |k, j, m⟩ = j(j + 1)ℏ2 J + |k, j, m⟩
(C-27)
J z J + |k, j, m⟩ = (m + 1)ℏ J + |k, j, m⟩
(C-28)
C-2-b Bestimmung des Spektrums von J2 und J z Wir zeigen nun, wie wir mit Hilfe der drei obigen Lemmata die möglichen Werte von j und m bestimmen können. Es sei |k, j, m⟩ ein Eigenvektor ungleich null von J2 und J z mit den Eigenwerten j(j+1)ℏ2 und mℏ. Nach Lemma I gilt −j ≤ m ≤ j. Es gibt damit sicher eine nichtnegative ganze Zahl p, für die gilt −j ≤ m − p ≤ −j + 1
(C-29)
Betrachten wir nun die Folge von Vektoren |k, j, m⟩, J − |k, j, m⟩, . . . , (J − )p |k, j, m⟩
(C-30)
Nach Lemma II ist jeder Vektor (J − )n |k, j, m⟩ dieser Folge (n = 0, 1, . . . , p) ein Eigen vektor ungleich null von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und (m − n)ℏ.
C Allgemeine Theorie des Drehimpulses | 649
Der Beweis erfolgt durch Iteration. Nach Annahme ist |k, j, m⟩ ungleich null und gehört zu den Eigenwerten j(j +1)ℏ2 und mℏ; (J − )n |k, j, m⟩ ergibt sich aus der Wirkung von J − auf (J − )n−1 |k, j, m⟩, dem Eigenvektor von J2 und J z mit den Eigenwerten j(j+1)ℏ2 und (m − n + 1)ℏ, wobei letzterer notwendig größer als −jℏ ist, da nach Gl. (C-29) gilt m − n + 1 ≥ m − p + 1 ≥ −j + 1
(C-31)
Es folgt nach Teil 2 von Lemma II, dass (J − )n |k, j, m⟩ ein Eigenvektor ungleich null von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und (m − n)ℏ ist. Nun lassen wir J − auf (J − )p |k, j, m⟩ wirken. Zunächst wollen wir annehmen, dass der Eigenwert (m − p)ℏ von J z , der zu (J − )p |k, j, m⟩ gehört, größer als −jℏ ist, d. h. dass gilt m − p > −j
(C-32)
Nach Teil 2 von Lemma II ist J− (J − )p |k, j, m⟩ dann ungleich null und gehört zu den Eigenwerten j(j + 1)ℏ2 und (m − p − 1)ℏ. Dies ist ein Widerspruch zu Lemma I, da nach Gl. (C-29) gilt m − p − 1 < −j
(C-33)
Es muss also m − p gleich −j sein. In diesem Fall gehört (J − )p |k, j, m⟩ zum Eigen wert −j von J z und nach Teil 1 von Lemma II ist J − (J − )p |k, j, m⟩ gleich null. Die Folge von Vektoren (C-30), die sich aus der wiederholten Anwendung des Operators J − auf |k, j, m⟩ ergibt, ist demnach endlich und der Widerspruch mit Lemma I ist aufgeho ben. Wir haben also gezeigt, dass es eine nichtnegative ganze Zahl p gibt, für die gilt m − p = −j
(C-34)
Entsprechend zeigt man, ausgehend von Lemma III, dass es eine nichtnegative ganze Zahl q gibt mit m+q=j
(C-35)
denn die Folge von Vektoren |k, j, m⟩, J + |k, j, m⟩, . . . , (J + )q |k, j, m⟩
(C-36)
muss endlich sein, damit kein Widerspruch zu Lemma I auftritt. Aus der Kombination von Gl. (C-34) und (C-35) ergibt sich p + q = 2j
(C-37)
j ist also eine durch zwei dividierte nichtnegative ganze Zahl, also notwendig ganzoder halbzahlig². Außerdem sind, wenn es einen Vektor |k, j, m⟩ ungleich null gibt, 2 Eine Zahl heißt halbzahlig, wenn sie gleich einer durch zwei dividierten ungeraden Zahl ist.
650 | VI Der Drehimpuls in der Quantenmechanik
auch alle Vektoren der Folgen (C-30) und (C-36) ungleich null; diese Vektoren sind alle Eigenvektoren von J2 mit dem Eigenwert j(j + 1)ℏ2 und von J z mit den Eigenwerten −jℏ, (−j + 1)ℏ, (−j + 2)ℏ, . . . , (j − 2)ℏ, (j − 1)ℏ, jℏ
(C-38)
Die so erhaltenen Ergebnisse fassen wir wie folgt zusammen: Es sei J ein beliebiger Drehimpuls, der die Vertauschungsrelationen (B-9) erfüllt. Wenn die Eigenwerte von J2 und J z mit j(j + 1)ℏ2 und mℏ bezeichnet werden, so gilt: – Die einzig möglichen Werte für j sind ganz- oder halbzahlig und nichtnegativ, d. h. 0, 1/2, 1, 3/2, 2, . . . (diese Werte sind die einzig möglichen, aber sie wer den nicht notwendig für jeden Drehimpuls angenommen). – Bei einem gegebenen Wert von j sind die einzig möglichen Werte für m die (2j+1) Zahlen −j, −j + 1, . . . , j − 1, j; also ist m ganzzahlig, wenn j ganzzahlig ist, und halbzahlig, wenn j halbzahlig ist. Mit einem dieser Werte werden alle möglichen Werte von m angenommen.
C-3 Standarddarstellungen {|k, j, m⟩} Wir wollen die gemeinsamen Eigenvektoren von J2 und J z untersuchen. Sie bilden eine Basis des Zustandsraums, da J2 und J z nach Annahme Observable sind. C-3-a Die Basiszustände Wir betrachten einen Drehimpuls J, der in einem Zustandsraum H wirkt. Wir werden zeigen, wie sich aus gemeinsamen Eigenzuständen von J2 und J z eine Orthonormal basis von H konstruieren lässt. Wir gehen von einem Paar von Eigenwerten j(j + 1)ℏ2 und mℏ aus. Die Menge von Eigenvektoren, die zu diesem Paar von Eigenwerten gehört, bildet einen Untervektor raum von H, den wir mit H(j, m) bezeichnen; seine Dimension g(j, m) kann durchaus größer als eins sein, da J2 und J z im Allgemeinen keinen V. S. K. O. bilden. In H(j, m) wählen wir eine beliebige Orthonormalbasis {|k, j, m⟩; k = 1, 2, . . . , g(j, m)}. Wenn m nicht gleich j ist, muss es einen weiteren Unterraum H(j, m + 1) in H ge ben, der aus Eigenvektoren von J2 und J z mit den Eigenwerten j(j + 1)ℏ2 und (m + 1)ℏ besteht. Analog gibt es für m ungleich −j einen Unterraum H(j, m − 1). Für den Fall, dass m weder gleich j noch gleich −j ist, konstruieren wir, ausgehend von der in H(j, m) gewählten Basis, Orthonormalbasen in H(j, m + 1) und H(j, m − 1). Zunächst wollen wir zeigen, dass für k 1 ungleich k 2 die Vektoren J + |k 1 , j, m⟩ und J + |k 2 , j, m⟩ und die Vektoren J − |k 1 , j, m⟩ und J− |k 2 , j, m⟩ orthogonal zueinander sind. Das Skalarprodukt von J± |k 1 , j, m⟩ und J ± |k 2 , j, m⟩ ergibt sich aus Gl. (C-7): ⟨k 2 , j, m | J ∓ J ± | k 1 , j, m⟩ = ⟨k 2 , j, m | (J2 − J 2z ∓ ℏJ z ) | k 1 , j, m⟩ = [j(j + 1) − m(m ± 1)]ℏ2 ⟨k 2 , j, m | k 1 , j, m⟩
(C-39)
C Allgemeine Theorie des Drehimpulses | 651
Diese Skalarprodukte sind also für k1 ≠ k 2 gleich null, da die Basis von H(j, m) ortho normal ist; für k 1 = k 2 ist das Quadrat der Norm von J ± |k 1 , j, m⟩ gleich [j(j + 1) − m(m ± 1)]ℏ2 Wir betrachten nun die Menge der g(j, m) Vektoren, die definiert sind durch |k, j, m + 1⟩ =
1 ℏ√j(j + 1) − m(m + 1)
J + |k, j, m⟩
(C-40)
Wie wir soeben gesehen haben, sind diese Vektoren orthonormal. Wir wollen zeigen, dass sie eine Basis in H(j, m + 1) bilden. Wir nehmen an, es gibt in H(j, m + 1) ei nen Vektor |α, j, m + 1⟩, der orthogonal ist zu allen Vektoren |k, j, m + 1⟩, die sich aus Gl. (C-40) ergeben. Der Vektor J − |α, j, m + 1⟩ wäre ungleich null, da (m + 1) nicht gleich −j sein kann; er gehörte zu H(j, m) und wäre orthogonal zu sämtlichen Vektoren J − |k, j, m +1⟩. Nach Gl. (C-40) ist J − |k, j, m +1⟩ proportional zu J − J + |k, j, m⟩ und damit zu |k, j, m⟩ [Gl. (C-7)]. Also wäre J − |α, j, m + 1⟩ ein Vektor ungleich null von H(j, m), der orthogonal zu allen Vektoren der Basis {|k, j, m⟩} wäre. Das aber ist unmöglich. Folglich bildet die Menge der Vektoren (C-40) eine Basis in H(j, m + 1). Mit einer entsprechenden Argumentation lässt sich zeigen, dass die durch |k, j, m − 1⟩ =
1 ℏ√j(j + 1) − m(m − 1)
J − |k, j, m⟩
(C-41)
definierten Vektoren eine Orthonormalbasis von H(j, m − 1) bilden. Insbesondere sehen wir, dass die Dimensionen der Unterräume H(j, m + 1) und H(j, m − 1) gleich der von H(j, m) sind. Diese Dimension ist also unabhängig von m:³ g(j, m + 1) = g(j, m − 1) = g(j, m) = g(j)
(C-42)
Wir gehen dann wie folgt vor: Für jeden Wert von j in dem betrachteten Problem wählen wir einen Unterraum, der zu diesem Wert von j gehört, z. B. H(j, j) für m = j. In diesem Unterraum wählen wir weiter eine beliebige Orthonormalbasis {|k, j, j⟩; k = 1, 2, . . . , g(j)}. Dann konstruieren wir mit Hilfe von Gl. (C-41) iterativ die Basis, aus der sich die Basen der anderen 2j Unterräume H(j, m) ergeben: Die Pfeile im Schema 1 geben die dabei verwendete Methode an. Für alle Werte von j, die in dem Problem auftreten, erhalten wir so eine Standardbasis des Zustandsraums H. Die Or thonormalitätsbedingungen und die Vollständigkeitsrelation lauten für diese Basis ⟨k, j, m | k , j , m ⟩ = δ kk δ jj δ mm +j
(C-43a)
g(j)
∑ ∑ ∑ |k, j, m⟩⟨k, j, m| = 1
(C-43b)
j m=−j k=1
3 Wenn diese Dimension unendlich ist, ist die Aussage wie folgt zu verstehen: Es gibt eine umkehrbar eindeutige Zuordnung der Basisvektoren zweier Unterräume, die zu einem Wert von j gehören.
652 | VI Der Drehimpuls in der Quantenmechanik Schema 1: Schematische Darstellung der Konstruktion der (2j + 1)g(j) Vektoren einer Standardbasis, die zu einem festen Wert von j gehören. Ausgehend von den Vektoren |k, j, j⟩ in der ersten Zeile kon struiert man unter Anwendung des Operators J − die (2j +1) Vektoren der entsprechenden Spalte. Die Unterräume H(j, m) werden von den g(j) Vektoren einer Zeile aufgespannt. Ein Unterraum H(k, j) wird von den (2j + 1) Vektoren der entsprechenden Spalte aufgespannt. g(j) verschiedene Werte von k, k = 1,
2,
. . .,
g(j),
mit den zugehörigen g(j) Unterräumen H(k, j),
(2j + 1) Räume H(j, m)
H(k = 1, j)
H(k = 2, j)
...
H(k = g(j), j)
H(j, m = j) ↑ ↑ ↑ ↑ J− ↓ H(j, m = j − 1) ↑ ↑ ↑ ↑ J− ↓ .. .
|1, j, j⟩ ↑ ↑ ↑ ↑ J− ↓ |1, j, j − 1⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
|2, j, j⟩ ↑ ↑ ↑ ↑ J− ↓ |2, j, j − 1⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
...
|g(j), j, j⟩ ↑ ↑ ↑ ↑ J− ↓ |g(j), j, j − 1⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
H(j, m) ↑ ↑ ↑ ↑ J− ↓ .. .
|1, j, m⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
|2, j, m⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
...
|g(j), j, m⟩ ↑ ↑ ↑ ↑ J− ↓ .. .
H(j, m = −j)
|1, j, −j⟩
|2, j, −j⟩
...
|g(j), j, −j⟩
...
Bemerkungen: 1. Die Verwendung von Gl. (C-41) bedeutet eine Phasenwahl: Die Basisvektoren im Raum H(j, m − 1) sind somit proportional zu den Vektoren, die sich aus der Anwendung von J− auf die Basis von H(j, m) ergeben. Der Proportionalitätskoeffizient ist dabei reell und positiv. 2. Die Gleichungen (C-40) und (C-41) sind verträglich. Die Anwendung des Operators J+ auf beide Seiten von Gl. (C-41) ergibt unter Beachtung von Gl. (C-7a) die Gl. (C-40) (wobei m durch m − 1 ersetzt ist). Es ist also nicht unbedingt notwendig, zur Konstruktion der Basen der Unterräume H(j, m) zu einem bestimmten Wert von J mit dem Maximalwert m = j zu beginnen und Gl. (C-41) zu verwenden.
In den meisten Fällen verwendet man zur Definition einer Standardbasis Obser vable A, B, . . ., die mit den drei Komponenten von J vertauschen⁴ und zusammen mit J2 und J z einen V. S. K. O. bilden (in § A von Kapitel VII werden wir dafür ein konkretes Beispiel kennenlernen), [A, J] = [B, J] = . . . = 0
(C-44)
4 Ein Operator, der mit den drei Komponenten des Gesamtdrehimpulses eines physikalischen Sys tems vertauscht, wird als Skalar bezeichnet (s. Ergänzung BVI ).
C Allgemeine Theorie des Drehimpulses |
653
Der Einfachheit halber wollen wir annehmen, dass nur eine Observable A nötig ist, um mit J2 und J z einen V. S. K. O. zu bilden. Dann sind alle oben definierten Unter räume H(j, m) unter der Wirkung von A global invariant: Wenn |ψ j,m ⟩ einen beliebigen Vektor von H(j, m) bezeichnet, ist A|ψ j,m ⟩ nach Gl. (C-44) wieder ein Eigenvektor von J2 und J z mit denselben Eigenwerten, wie sie |ψ j,m ⟩ hat: J2 A |ψ j,m ⟩ = AJ2 |ψ j,m ⟩ = j(j + 1)ℏ2 A |ψ j,m ⟩ J z A |ψ j,m ⟩ = AJ z |ψ j,m ⟩ = mℏ A |ψ j,m ⟩
(C-45)
A|ψ j,m ⟩ gehört also ebenfalls zu H(j, m). Wenn wir einen Wert von j vorgeben, können wir A in dem entsprechenden Unterraum H(j, j) diagonalisieren. Die sich auf diese Weise ergebenden verschiedenen Eigenwerte bezeichnen wir mit a k,j . Der Index j gibt an, in welchem Raum H(j, j) sie ermittelt wurden, und der Index k (der Einfachheit halber als diskret angenommen) erlaubt die Unterscheidung zwischen ihnen. Zu je dem Eigenwert a k,j gehört ein einziger Vektor (geschrieben als |k, j, j⟩) von H(j, j), da A, J2 und J z nach Annahme einen V. S. K. O. bilden: A |k, j, j⟩ = a k,j |k, j, j⟩
(C-46)
Die Menge { |k, j, j⟩; j fest; k = 1, 2, . . . , g(j)} bildet eine Orthonormalbasis von H(j, j), aus der wir mit der oben beschriebenen Methode eine Basis der anderen Un terräume H(j, m), die zu dem gewählten Wert von j gehören, konstruieren können. Indem wir so für alle Werte von j vorgehen, erhalten wir schließlich eine Standardba sis {|k, j, m⟩} des Zustandsraums, deren Vektoren alle Eigenzustände von J2 , J z und auch von A sind: A |k, j, m⟩ = a k,j |k, j, m⟩
(C-47)
Dies lässt sich wie folgt zeigen: Wenn die Annahme (C-44) erfüllt ist, vertauscht A mit J − . Demnach ist J − |k, j, j⟩, also |k, j, j − 1⟩, ein Eigenvektor von A mit demselben Eigenwert wie der von |k, j, j⟩: AJ − |k, j, j⟩ = J − A |k, j, j⟩ = a k,j J − |k, j, j⟩
(C-48)
Durch Wiederholung dieses Schritts lässt sich Gl. (C-47) leicht nachweisen. Bemerkungen: 1. Eine Observable, die mit J2 und J z vertauscht, vertauscht nicht notwendig auch mit J x und J y (J z ist selbst ein Beispiel). Folglich sollte es zur Bildung eines V. S. K. O. mit J2 und J z nicht nötig sein, Observable zu wählen, die wie in Gl. (C-44) mit den drei Komponenten von J vertauschen. Wenn A jedoch mit J+ und J− nicht vertauschen würde (d. h. mit J x und J y ), wäre J± |k, j, m⟩ nicht notwendig ein Eigenvektor von A mit demselben Eigenwert wie der von |k, j, m⟩. 2. Das Spektrum von A ist in jedem Unterraum H(j, m) mit demselben Wert von j gleich. Die Eigenwerte a k,j hängen allerdings im Allgemeinen von j ab (dieser Punkt wird in § A und § C von Kapitel VII anhand konkreter Beispiele erläutert).
654 | VI Der Drehimpuls in der Quantenmechanik C-3-b Die Räume H(k, j) Im vorigen Abschnitt führten wir eine Standardbasis des Zustandsraums ein, indem wir aus einer im Unterraum H(j, m = j) gewählten Basis eine Basis von H(j, m = j − 1) konstruierten, dann von H(j, m = j − 2), . . . , H(j, m), usw. Der Zustandsraum kann als direkte Summe aller orthogonalen Unterräume H(j, m) aufgefasst werden, wobei m in ganzen Schritten von −j bis j läuft und j alle Werte annimmt, die in dem betrach teten Problem tatsächlich auftreten. Das bedeutet, dass ein beliebiger Vektor von H in genau einer Weise als Summe von Vektoren geschrieben werden kann, die jeweils zu einem bestimmten Unterraum H(j, m) gehören. Die Verwendung der Unterräume H(j, m) hat jedoch einige Nachteile. Ihre Dimen sion g(j) hängt von dem betrachteten physikalischen Problem ab und ist nicht not wendig bekannt. Außerdem sind die Unterräume H(j, m) nicht invariant unter der Wirkung von J, da aufgrund der Konstruktion der Vektoren |k, j, m⟩ die Operatoren J+ und J − nichtverschwindende Matrixelemente zwischen Vektoren aus H(j, m) und solchen aus H(j, m ± 1) besitzen. Wir wollen deshalb andere Unterräume von H, die Räume H(k, j), einführen. An statt die Vektoren |k, j, m⟩ mit festen Werten j und m (die H(j, m) aufspannen) zusam menzufassen, betrachten wir nun die Vektoren mit vorgegebenen Werten k und j und bezeichnen den von ihnen aufgespannten Unterraum mit H(k, j). Wir fassen also die (2j + 1) Vektoren einer Spalte des Schemas 1 zusammen (anstelle der g(j) Vektoren einer Zeile). Der Raum H lässt sich dann als direkte Summe der Unterräume H(k, j) auffassen, die einfache Eigenschaften besitzen: – Die Dimension von H(k, j) ist (2j + 1), unabhängig vom Wert von k und dem be trachteten physikalischen System. – Der Raum H(k, j) ist global invariant unter der Wirkung von J: Jede Komponente J u von J (oder eine Funktion F(J) von J), die auf einen Vektor aus H(k, j) wirkt, ergibt wiederum einen Vektor aus H(k, j).⁵ Diese Eigenschaft ist leicht zu zeigen, da J u (oder F(J)) immer in Abhängigkeit von J z , J + und J− ausgedrückt werden kann. Die Wirkung von J z auf |k, j, m⟩ ergibt ei nen Vektor proportional zu |k, j, m⟩, die Wirkung von J + einen Vektor proportional zu |k, j, m + 1⟩ und die Wirkung von J − einen Vektor proportional zu |k, j, m − 1⟩. Die Gültigkeit dieser Eigenschaft hängt also direkt mit der Konstruktion der Standardbasis {|k, j, m⟩} zusammen.
5 Ferner ist H(k, j) bezüglich J irreduzibel: Es gibt keinen Unterraum von H(k, j) außer H(k, j) selbst, der unter der Wirkung der Komponenten von J global invariant ist.
C Allgemeine Theorie des Drehimpulses | 655
C-3-c Darstellungsmatrizen der Drehimpulsoperatoren Durch die Verwendung der Unterräume H(k, j) wird die Bestimmung der Matrizen, die in einer Standardbasis eine Komponente J u von J (oder eine beliebige Funktion F(J)) darstellen, erheblich vereinfacht. Das Matrixelement zwischen zwei Basisvekto ren aus verschiedenen Unterräumen H(k, j) ist null. Die Matrix hat daher die folgende Form:
H(k, j) H(k , j)
H(k, j) (2j + 1)× (2j + 1)Matrix 0
H(k , j)
H(k , j )
...
0
0
0
(2j + 1)× (2j + 1)Matrix
0
0 0
H(k , j )
0
0
(2j + 1) × (2j + 1)-
.. .
0
0
0
Matrix
(C-49)
...
Wir müssen dann nur noch die endlichdimensionalen Matrizen berechnen, die den betrachteten Operator innerhalb der Unterräume H(k, j) darstellen. Eine weitere wichtige Vereinfachung besteht darin, dass die endlichen Unterma trizen unabhängig von k und von dem betrachteten physikalischen System sind. Sie hängen nur von j und natürlich von dem Operator ab, den wir darstellen wollen. Um das zu zeigen, beachten wir, dass aus der Definition der Vektoren |k, j, m⟩ [s. Gleichun gen (C-12), (C-40) und (C-41)] folgt J z |k, j, m⟩ = mℏ |k, j, m⟩ J + |k, j, m⟩ = ℏ√j(j + 1) − m(m + 1) |k, j, m + 1⟩
(C-50)
J − |k, j, m⟩ = ℏ√j(j + 1) − m(m − 1) |k, j, m − 1⟩ d. h. ⟨k, j, m | J z | k , j , m ⟩ = mℏ δ kk δ jj δ mm ⟨k, j, m | J ± | k , j , m ⟩ = ℏ√j(j + 1) − m (m ± 1) δ kk δ jj δ m,m ±1
(C-51)
Aus diesen Beziehungen folgt, dass die Matrixelemente, die die Komponenten von J darstellen, nur von j und m und nicht von k abhängen. Zur Bestimmung der Matrix, durch die allgemein eine beliebige Komponente J u in einer Standardbasis dargestellt wird, haben wir also nur einmal die „allgemeinen“ Matrizen (J u )(j) zu berechnen, die J u in den Unterräumen H(k, j) (für alle möglichen Werte von j, j = 0, 1/2, 1, 3/2, . . .) darstellen. Wenn wir ein bestimmtes physikalisches System und seinen Drehimpuls J untersuchen wollen, bestimmen wir neben den Werten von j, die tatsächlich auftre ten, die Anzahl der Unterräume H(k, j), die zu jedem dieser Werte gehören (d. h. ihre
656 | VI Der Drehimpuls in der Quantenmechanik Entartungen (2j + 1)g(j)). Wir wissen, dass die Matrix, die J u für diesen speziellen Fall darstellt, die „blockdiagonale“ Form (C-49) hat, und können sie deshalb aus den so eben definierten allgemeinen Matrizen zusammensetzen: Für jeden Wert von j haben wir g(j) „Blöcke“, die gleich (J u )(j) sind. Wir wollen einige Beispiele für die Matrizen (J u )(j) angeben: 1. j = 0: Die Unterräume H(k, j = 0) sind eindimensional, da der einzig mögliche Wert für m null ist. Die Matrizen (J u )(0) reduzieren sich daher auf Zahlen, die nach Gl. (C-51) gleich null sein müssen. 2. j = 1/2: Die Unterräume H(k, j = 1/2) sind zweidimensional (m = 1/2 oder −1/2). Wenn wir die Basisvektoren in dieser Reihenfolge anordnen (m = 1/2, m = −1/2), so ergibt sich aus Gl. (C-51) (J z )(1/2) =
ℏ 1 ( 2 0
0 ) −1
(C-52)
und 0 (J + )(1/2) = ℏ ( 0
1 ) 0
(J − )(1/2) = ℏ (
1 ) 0
(J y )
0 1
0 ) 0
(C-53)
d. h. mit Gl. (C-1) (J x )(1/2) =
ℏ 0 ( 2 1
(1/2)
=
ℏ 0 ( 2 i
−i ) 0
(C-54)
Die Matrix, die J2 darstellt, lautet also (1/2)
(J2 )
=
3 2 1 ℏ ( 4 0
0 ) 1
(C-55)
Wir finden hier die Pauli-Matrizen wieder, die wir ohne Beweis bereits in Kap. IV, § A-2 eingeführt hatten. 3. j = 1: Für diesen Fall finden wir (die Reihenfolge der Basisvektoren ist m = 1, m = 0, m = −1) 1 (J z )(1) = ℏ (0 0 (1)
(J + )
0 0 0
0 = ℏ (0 0
0 0) −1
√2 0 0
0 √2) 0
(C-56) 0 (J − )(1) = ℏ (√2 0
0 0 √2
0 0) 0
(C-57)
und damit (J x )(1) =
0 ℏ (1 √2 0
1 0 1
0 1) 0
(J y )
(1)
=
0 ℏ (i √2 0
−i 0 i
0 −i) 0
(C-58)
C Allgemeine Theorie des Drehimpulses |
657
und (1)
(J2 )
1 = 2ℏ2 (0 0
0 1 0
0 0) 1
(C-59)
Es lässt sich nachweisen, dass die Matrizen (C-56) und (C-58) die Vertauschungs relationen (B-9) erfüllen. 4. j beliebig: Wir verwenden Gl. (C-51), die sich wegen Gl. (C-1) auch in folgender Form schreiben lassen: ⟨k, j, m | J x | k , j , m ⟩ =
ℏ δ kk δ jj [√j(j + 1) − m (m + 1) δ m,m +1 + √j(j + 1) − m (m − 1) δ m,m −1 ] 2 (C-60)
und ⟨k, j, m | J y | k , j , m ⟩ =
ℏ δ kk δ jj [√j(j + 1) − m (m + 1) δ m,m +1 − √j(j + 1) − m (m − 1) δ m,m −1 ] 2i (C-61)
Die Matrix (J z )(j) ist somit diagonal; ihre Elemente werden durch die (2j + 1) Werte von mℏ gegeben. Die einzigen nichtverschwindenden Matrixelemente von (J x )(j) und (J y )(j) liegen direkt über und unter der Hauptdiagonalen; (J x )(j) ist symmetrisch und reell und (J y )(j) antisymmetrisch und rein imaginär. Da die Vektoren |k, j, m⟩ nach Konstruktion Eigenvektoren von J2 sind, haben wir ⟨k, j, m | J2 | k , j , m ⟩ = j(j + 1)ℏ2 δ kk δ jj δ mm
(C-62)
Die Matrix (J2 )(j) ist also proportional zur (2j + 1) × (2j + 1)-Einheitsmatrix; ihre Dia gonalelemente sind gleich j(j + 1)ℏ2 . Bemerkung: Die Wahl der z-Achse als „Quantisierungsachse“ erfolgte rein willkürlich. Alle Raumrichtungen sind physikalisch äquivalent, und wir sollten für J x und J y dieselben Eigenwerte wie für J z er warten (ihre Eigenvektoren jedoch sind verschieden, da J x und J y nicht mit J z vertauschen). Tat sächlich kann man zeigen, dass die Eigenwerte der Matrizen (J x )(1/2) und (J y )(1/2) [Gl. (C-54)] gleich ±ℏ/2 und die der Matrizen (J x )(1) und (J y )(1) [Gl. (C-58)] gleich +ℏ, 0, −ℏ sind. Dies ist ein allgemeines Ergebnis: Innerhalb eines gegebenen Unterraums H(k, j) sind die Eigenwerte von J x und J y (oder die der Komponente J u = J ⋅ u längs eines beliebigen Einheitsvektors u) gleich jℏ, (j − 1)ℏ, . . . , (−j + 1)ℏ, −jℏ. Bei den entsprechenden Eigenvektoren (gemeinsame Eigenvekto ren von J2 und J x , J2 und J y oder J2 und J u ) handelt es sich um Linearkombinationen der Vektoren |k, j, m⟩ (k und j fest).
658 | VI Der Drehimpuls in der Quantenmechanik
Zum Abschluss dieses Abschnitts über die Standarddarstellungen fassen wir zusam men: Eine Orthonormalbasis {|k, j, m⟩} des Zustandsraums aus gemeinsamen Eigenvekto ren von J2 und J z , J2 |k, j, m⟩ = j(j + 1)ℏ2 |k, j, m⟩ J z |k, j, m⟩ = mℏ |k, j, m⟩ heißt Standardbasis, wenn die Wirkung der Operatoren J + und J − gegeben wird durch J + |k, j, m⟩ = ℏ√j(j + 1) − m(m + 1) |k, j, m + 1⟩ J − |k, j, m⟩ = ℏ√j(j + 1) − m(m − 1) |k, j, m − 1⟩
D Anwendung auf Bahndrehimpulse In § C untersuchten wir die allgemeinen Eigenschaften von Drehimpulsen, die sich ausschließlich aus den Vertauschungsrelationen (B-9) ableiten. Wir wollen nun zum Bahndrehimpuls L eines spinlosen Teilchens [Gl. (B-3)] zurückkehren und die allge meine Theorie auf diesen speziellen Fall anwenden. In der Ortsdarstellung werden wir zeigen, dass die Eigenwerte des Operators L2 durch die Werte l(l + 1)ℏ2 gegeben werden, die zu nichtnegativen ganzzahligen l gehören; von den möglichen Werten für j, die wir in § C-2-b bestimmt haben, sind also für diesen Fall nur ganzzahlige Werte möglich, die auch alle auftreten. Wir werden die gemeinsamen Eigenfunktionen von L2 und L z und ihre wichtigsten Eigenschaften untersuchen. Schließlich betrachten wir diese Eigenzustände unter physikalischen Gesichtspunkten.
D-1 Eigenwerte und Eigenfunktionen von L2 und L z D-1-a Die Eigenwertgleichung in der Ortsdarstellung Die Observablen R und P entsprechen in der Ortsdarstellung der Multiplikation mit r bzw. dem Differentialoperator (ℏ/i)∇. Die drei Komponenten des Drehimpulses L lau ten dann ℏ ∂ ∂ L x = (y −z ) (D-1a) i ∂z ∂y ∂ ∂ ℏ −x ) (D-1b) L y = (z i ∂x ∂z ℏ ∂ ∂ L z = (x −y ) (D-1c) i ∂y ∂x
D Anwendung auf Bahndrehimpulse | 659
Es ist zweckmäßig, Kugelkoordinaten (oder Polarkoordinaten) zu benutzen; wir wer den sehen, dass die verschiedenen Drehimpulsoperatoren nur auf die Winkelvaria blen θ und φ, aber nicht auf die Variable r wirken. Statt den Vektor r durch kartesische Koordinaten x, y, z zu beschreiben, geben wir den entsprechenden Raumpunkt M (OM = r) durch seine Kugelkoordinaten r, θ, φ an (s. Abb. 1): x = r sin θ cos φ y = r sin θ sin φ
(D-2)
z = r cos θ mit r ≥ 0, 0 ≤ θ ≤ π, 0 ≤ φ < 2π.
Abb. 1: Definition der Kugelkoordinaten r, θ, φ eines beliebigen Raumpunkts M.
Das Volumenelement d3 r = dx dy dz lautet in Kugelkoordinaten d3 r = r2 sin θ dr dθ dφ = r2 dr dΩ
(D-3)
wobei dΩ = sin θ dθ dφ
(D-4)
das Raumwinkelelement in Richtung der Polarwinkel θ und φ ist. Wir führen in der üblichen Weise eine Variablentransformation durch, wobei sich aus den Gleichungen (D-1) und (D-2) ergibt (die Rechnungen sind recht zeitaufwendig, stellen aber keine prinzipiellen Schwierigkeiten dar) ∂ cos φ ∂ + ) ∂θ tan θ ∂φ sin φ ∂ ∂ + L y = iℏ (− cos φ ) ∂θ tan θ ∂φ ℏ ∂ Lz = i ∂φ
L x = iℏ (sin φ
(D-5a) (D-5b) (D-5c)
660 | VI Der Drehimpuls in der Quantenmechanik
daraus folgt ∂2 1 ∂ ∂2 1 + ) + ∂θ2 tan θ ∂θ sin2 θ ∂φ2 ∂ ∂ + i cot θ ) L+ = ℏ eiφ ( ∂θ ∂φ ∂ ∂ + i cot θ ) L− = ℏ e−iφ (− ∂θ ∂φ L2 = −ℏ2 (
(D-6a) (D-6b) (D-6c)
In der Ortsdarstellung werden die Eigenfunktionen, die zu den Eigenwerten l(l + 1)ℏ2 von L2 und mℏ von L z gehören, durch die Lösungen der Differentialglei chungen ∂2 1 ∂ ∂2 1 + } ψ(r, θ, φ) = l(l + 1) ψ(r, θ, φ) + ∂θ2 tan θ ∂θ sin2 θ ∂φ2 ∂ ψ(r, θ, φ) = m ψ(r, θ, φ) −i ∂φ −{
(D-7a) (D-7b)
gegeben. Da die allgemeinen Ergebnisse aus § C auch für Bahndrehimpulse gelten, wissen wir bereits, dass l ganz- oder halbzahlig ist und dass m bei gegebenem l nur die Werte −l, −l + 1, . . . , l − 1, l annehmen kann. In (D-7) tritt die Variable r in keinem Differentialoperator auf, so dass wir r als Parameter betrachten können und nur die θ- und φ-Abhängigkeit von ψ zu berück sichtigen haben. Wir bezeichnen also die gemeinsame Eigenfunktion von L2 und L z mit den Eigenwerten l(l + 1)ℏ2 und mℏ mit Y lm (θ, φ): L2 Y lm (θ, φ) = l(l + 1)ℏ2 Y lm (θ, φ)
(D-8a)
L z Y lm (θ, φ)
(D-8b)
=
mℏ Y lm (θ, φ)
Um ganz genau zu sein, müssten wir einen zusätzlichen Index einführen, mit dem wir verschiedene Lösungen (D-8) zu denselben Werten für l und m unterscheiden können. Wir werden allerdings im Folgenden sehen, dass diese Gleichungen für jedes Paar von Werten l und m nur eine Lösung besitzen (bis auf einen konstanten Faktor), so dass die Indizes l und m ausreichen. Bemerkungen: 1. Durch die Gleichungen (D-8) wird die θ- und φ-Abhängigkeit der Eigenfunktionen von L2 und L z bestimmt. Wenn die Lösung Y lm (θ, φ) dieser Gleichungen einmal gefunden ist, erhält man die Eigenfunktionen in der Form ψ l,m (r, θ, φ) = f(r) Y lm (θ, φ)
(D-9)
f(r) ist eine Funktion von r,⁶ die als Integrationskonstante der partiellen Differentialgleichun gen (D-7) auftritt. Da f(r) beliebig ist, bilden L2 und L z im Raum Hr der Funktionen von r (oder von r, θ, φ) keinen V. S. K. O.
6 Die Funktion f(r) muss eine solche Form haben, dass ψ l,m (r, θ, φ) quadratintegrabel ist.
D Anwendung auf Bahndrehimpulse | 661
2. Zur Normierung von ψ l,m (r, θ, φ) ist es günstig, Y lm (θ, φ) und f(r) getrennt zu normieren (wie wir es hier tun wollen). Mit Gl. (D-4) haben wir dann 2π
π
∫ dφ ∫ sin θ |Y lm (θ, φ)|2 dθ = 1 0
(D-10)
0
und ∞
∫ r 2 |f(r)|2 dr = 1
(D-11)
0
D-1-b Mögliche Werte von l und von m α Die Werte von l und m sind ganzzahlig Mit Gl. (D-5c) können wir Gl. (D-8b) in der Form schreiben ℏ ∂ m Y (θ, φ) = mℏ Y lm (θ, φ) i ∂φ l
(D-12)
daraus folgt, dass für Y lm (θ, φ) gilt Y lm (θ, φ) = F lm (θ) eimφ
(D-13)
Wir überstreichen den ganzen Raum, wenn φ von 0 nach 2π läuft. Da eine Wel lenfunktion in allen Raumpunkten stetig sein muss,⁷ muss insbesondere gelten Y lm (θ, φ = 0) = Y lm (θ, φ = 2π)
(D-14)
woraus folgt e2imπ = 1
(D-15)
In § C stellten wir fest, dass m höchstens ganz- oder halbzahlig sein kann. Glei chung (D-15) besagt, dass für den Fall eines Bahndrehimpulses m eine ganze Zahl sein muss (e2imπ wäre für halbzahliges m gleich −1). Wir wissen aber, dass m und l entweder beide ganz- oder beide halbzahlig sind; also muss auch l ganzzahlig sein. β Die möglichen ganzzahligen (nichtnegativen) Werte von l Wir betrachten einen (nichtnegativen) ganzzahligen Wert von l. Aus der Theorie in § C wissen wir, dass Y ll (θ, φ) die Bedingung L+ Y ll (θ, φ) = 0
(D-16)
erfüllen muss, woraus sich mit Gl. (D-6b) und (D-13) ergibt {
d − l cot θ} F ll (θ) = 0 dθ
(D-17)
7 Wenn Y lm (θ, φ) bei φ = 0 nicht stetig wäre, wäre sie nicht differenzierbar und könnte keine Eigen funktion der Differentialoperatoren (D-5c) und (D-6a) sein. Zum Beispiel würde ∂Y lm (θ, φ)/∂φ eine Funktion δ(φ) erzeugen, was nicht mit Gl. (D-12) verträglich ist.
662 | VI Der Drehimpuls in der Quantenmechanik
Diese Gleichung erster Ordnung lässt sich sofort integrieren, wenn wir beachten, dass cot θ dθ =
d(sin θ) sin θ
(D-18)
Ihre allgemeine Lösung lautet F ll (θ) = c l (sin θ)l
(D-19)
worin c l eine Normierungskonstante ist.⁸ Für jeden nichtnegativen ganzzahligen Wert von l gibt es also eine eindeutig (bis auf einen konstanten Faktor) bestimmte Funktion Y ll (θ, φ): Y ll (θ, φ) = c l (sin θ)l eilφ
(D-20)
Mit der wiederholten Anwendung von L− können wir daraus Y ll−1 , . . . , Y lm , . . . , Y l−l konstruieren. Wir sehen also, dass es zu dem Paar von Eigenwerten l(l + 1)ℏ2 und mℏ (wobei l eine beliebige nichtnegative ganze Zahl und m eine ganze Zahl mit −l ≤ m ≤ l ist) genau eine Eigenfunktion Y lm (θ, φ) gibt, die sich eindeutig aus Gl. (D-20) berechnen lässt. Die Eigenfunktionen Y lm (θ, φ) werden als Kugelflächenfunktionen bezeichnet. D-1-c Die wichtigsten Eigenschaften der Kugelflächenfunktionen Die Kugelflächenfunktionen Y lm (θ, φ) werden wir in Ergänzung AVI ausführlich be handeln; in diesem Abschnitt beschränken wir uns auf die Angabe ihrer wichtigsten Eigenschaften. α Rekursionsbeziehungen Den allgemeinen Ergebnissen in § C zufolge gilt L± Y lm (θ, φ) = ℏ√l(l + 1) − m(m ± 1) Y lm±1 (θ, φ)
(D-21)
Mit Hilfe der Ausdrücke (D-6b) und (D-6c) für die Operatoren L+ und L− und wenn wir beachten, dass Y lm (θ, φ) das Produkt einer Funktion von θ und eimφ ist, erhalten wir ∂ − m cot θ) Y lm (θ, φ) = √l(l + 1) − m(m + 1) Y lm+1 (θ, φ) ∂θ ∂ − m cot θ) Y lm (θ, φ) = √l(l + 1) − m(m − 1) Y lm−1 (θ, φ) e−iφ (− ∂θ eiφ (
(D-22a) (D-22b)
8 Umgekehrt lässt sich leicht zeigen, dass die auf diese Weise erhaltene Funktion tatsächlich eine Eigenfunktion von L2 und L z mit den Eigenwerten l(l+1)ℏ2 und lℏ ist. Mit Gl. (D-5c) und (D-13) erhalten wir leicht L z Y ll (θ, φ) = lℏY ll (θ, φ). Dann lässt sich mit den Gleichungen (D-16) und (D-7b) zeigen, dass Y ll (θ, φ) auch Eigenfunktion von L2 mit dem erwarteten Eigenwert ist.
D Anwendung auf Bahndrehimpulse | 663
β Orthonormierungsbedingungen und Vollständigkeitsrelation Durch die Beziehungen (D-7) werden die Kugelflächenfunktionen nur bis auf einen konstanten Faktor bestimmt. Wir wählen nun diesen Faktor so, dass die Y lm (θ, φ) (als Funktionen der Winkelvariablen θ und φ) normiert sind: 2π
π
∫ dφ ∫ sin θ dθ Y lm ∗ (θ, φ) Y lm (θ, φ) = δ l l δ m m 0
(D-23)
0
Jede Funktion f(θ, φ) von θ und φ kann in Kugelflächenfunktionen entwickelt werden: ∞
+l
f(θ, φ) = ∑ ∑ c l,m Y lm (θ, φ)
(D-24)
l=0 m=−l
mit 2π
π
c l,m = ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) f(θ, φ) 0
(D-25)
0
Die Kugelflächenfunktionen bilden also eine Orthonormalbasis des Raums HΩ der Funktionen von θ und φ, was durch die Vollständigkeitsrelation ausgedrückt wird ∞
+l
∑ ∑ Y lm (θ, φ) Y lm∗ (θ , φ ) = δ(cos θ − cos θ ) δ(φ − φ ) l=0 m=−l
=
1 δ(θ − θ ) δ(φ − φ ) sin θ
(D-26)
[auf der rechten Seite der Vollständigkeitsrelation geht δ(cos θ − cos θ ) und nicht δ(θ − θ ) ein, weil die Integrationen über die Variable θ unter Verwendung des Dif ferentials sin θ dθ = − d(cos θ) ausgeführt werden]. γ Parität und komplexe Konjugation Der Übergang von r nach −r (Spiegelung am Koordinatenursprung) wird in Kugelko ordinaten ausgedrückt durch (Abb. 2) r ⇒ r θ ⇒ π − θ
(D-27)
φ ⇒ π + φ Man zeigt leicht (s. Ergänzung AVI ), dass Y lm (π − θ, π + φ) = (−1)l Y lm (θ, φ)
(D-28)
Die Kugelflächenfunktionen sind also Funktionen mit einer wohldefinierten Parität, die unabhängig von m ist: Für gerades l sind sie gerade und für ungerades l ungerade. Ebenso kann man erkennen, dass gilt [Y lm (θ, φ)]∗ = (−1)m Y l−m (θ, φ)
(D-29)
664 | VI Der Drehimpuls in der Quantenmechanik
Abb. 2: Transformation der Kugelkoordinaten ei nes beliebigen Punkts bei einer Spiegelung am Ursprung: r wird nicht verändert, θ geht in π − θ und φ in π + φ über.
D-1-d Standardbasis Wir haben bereits darauf hingewiesen (s. Bemerkung 1 in § D-1-a), dass L2 und L z im Raum der Wellenfunktionen eines spinlosen Teilchens keinen V. S. K. O. bilden. Aus gehend von der Argumentation in § C-3 wollen wir nun die Form der Standardbasis in diesem Raum angeben. Es sei H(l, m = l) der Unterraum gemeinsamer Eigenfunktionen von L2 und L z mit den Eigenwerten l(l + 1)ℏ2 und lℏ, wobei l eine feste nichtnegative ganze Zahl ist. Der erste Schritt bei der Konstruktion einer Standardbasis (s. § C-3) besteht in der Wahl einer beliebigen Orthonormalbasis in jedem Raum ℰ(l, m = l); die Funktionen der in H(l, m = l) gewählten Basis bezeichnen wir mit ψ k,l,l (r), wobei wir mit dem Index k (der Einfachheit halber als diskret angenommen) zwischen den verschiede nen Funktionen dieser Basis unterscheiden können. Durch die wiederholte Anwen dung des Operators L− auf die ψ k,l,l (r) konstruieren wir dann die Funktionen ψ k,l,m (r), durch die die Standardbasis für m ≠ l vervollständigt wird; sie genügen den Gleichun gen (C-12) und (C-50), die hier lauten L2 ψ k,l,m (r) = l(l + 1)ℏ2 ψ k,l,m (r) L z ψ k,l,m (r) = mℏ ψ k,l,m (r)
(D-30)
und L± ψ k,l,m (r) = ℏ√l(l + 1) − m(m ± 1) ψ k,l,m±1(r)
(D-31)
Wir haben oben festgestellt, dass alle gemeinsamen Eigenfunktionen von L2 und L z , die zu Eigenwerten l(l + 1)ℏ2 und mℏ gehören, dieselbe Winkelabhängigkeit auf weisen; sie wird durch Y lm (θ, φ) gegeben. Nur die Radialabhängigkeit ist verschieden. Aus Gl. (D-30) folgern wir daher, dass ψ k,l,m (r) die Form ψ k,l,m (r) = R k,l,m (r) Y lm (θ, φ)
(D-32)
D Anwendung auf Bahndrehimpulse | 665
hat. Wir wollen zeigen, dass die Radialfunktionen R k,l,m (r) nicht von m abhängen, wenn die ψ k,l,m (r) eine Standardbasis bilden. Da die Differentialoperatoren L± nicht auf die Variable r wirken, ergibt sich nach Gl. (D-21) L± ψ k,l,m (r) = R k,l,m (r) L± Y lm (θ, φ) = ℏ√l(l + 1) − m(m ± 1) R k,l,m (r) Y lm±1 (θ, φ)
(D-33)
Ein Vergleich mit Gl. (D-31) zeigt, dass die Radialfunktionen für alle r die Bedingung R k,l,m±1(r) = R k,l,m (r)
(D-34)
erfüllen müssen und folglich unabhängig von m sind. Die Funktionen ψ k,l,m (r) einer Standardbasis im Raum der Wellenfunktionen eines (spinlosen) Teilchens sind daher notwendig von der Form ψ k,l,m (r) = R k,l (r) Y lm (θ, φ)
(D-35)
Die Orthonormierungsbedingungen lauten für diese Basis ∞
∫ d3 r ψ∗k,l,m (r)ψ k ,l ,m (r) = ∫ r2 dr R∗k,l (r)R k ,l (r) 0 2π
π
× ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ)Y lm (θ, φ) = δ kk δ ll δ mm 0
(D-36)
0
Da die Kugelflächenfunktionen orthonormal sind [Gl. (D-23)], erhalten wir schließlich ∞
∫ r2 dr R∗k,l (r)R k ,l (r) = δ kk
(D-37)
0
Die Radialfunktionen R k,l (r) sind demnach bezüglich der Variablen r normiert; außer dem sind zwei Radialfunktionen, die zum selben Wert von l, aber unterschiedlichen Indizes k gehören, orthogonal. Bemerkungen: 1. Gleichung (D-37) ist einfach eine Folge der Orthonormalität der Funktionen ψ k,l,l (r) = R k,l (r) ⋅ Y ll (θ, φ), die als Basis des Unterraums H(l, m = l) gewählt wurden. Es ist daher wichtig, dass der Index l für die beiden Funktionen R k,l auf der rechten Seite dieser Gleichung denselben Wert hat. Für l ≠ l sind ψ k,l,m (r) und ψ k ,l ,m (r) bereits aufgrund ihrer Winkelabhängigkeit orthogonal (sie sind Eigenfunktionen des hermiteschen Operators L2 mit verschiedenen Eigenwerten); das Integral ∞
∫ r 2 dr R ∗k,l (r)R k ,l (r) 0
kann daher a priori für l ungleich l einen beliebigen Wert annehmen.
(D-38)
666 | VI Der Drehimpuls in der Quantenmechanik
2. Im Allgemeinen hängen die Radialfunktionen R k,l (r) von l ab, und zwar aus folgendem Grund: Eine Funktion der Form f(r)g(θ, φ) kann nur dann im Koordinatenursprung (r = 0, θ und φ belie big) stetig sein, wenn sich g(θ, φ) auf eine Konstante reduziert oder f(r) bei r = 0 gegen null geht (wenn g(θ, φ) von θ und φ abhängt, hängt für f(0) ≠ 0 der Grenzwert von f(r)g(θ, φ) für r → 0 von der Richtung ab, auf der man sich dem Ursprung nähert). Wenn wir also verlangen, dass die Basisfunktionen ψ k,l,m (r) stetig sind, können nur die Radialfunktionen mit l = 0 bei r = 0 un gleich null sein (Y00 (θ, φ) ist tatsächlich eine Konstante). Entsprechend erhalten wir, wenn wir verlangen, dass ψ k,l,m (r) im Ursprung (ein- oder mehrmals) differenzierbar ist, Bedingungen für die R k,l (r), die vom Wert von l abhängen.
D-2 Physikalische Diskussion D-2-a Untersuchung eines Zustands |k, l, m⟩ Wir betrachten ein (spinloses) Teilchen in einem Eigenzustand |k, l, m⟩ von L2 und L z (mit der zugehörigen Wellenfunktion ψ k,l,m (r)), also in einem Zustand, in dem das Quadrat seines Drehimpulses und die Projektion dieses Drehimpulses auf die z-Achse wohldefinierte Werte haben [l(l + 1)ℏ2 bzw. mℏ]. Wir nehmen an, wir wollten seine Drehimpulskomponente längs der x- oder y-Achse messen. Da L x und L y nicht mit L z vertauschen, ist |k, l, m⟩ weder Eigenzu stand von L x noch von L y ; das Ergebnis der Messung kann somit nicht mit Sicherheit vorhergesagt werden. Wir wollen die Erwartungswerte und die mittleren quadrati schen Abweichungen von L x und L y im Zustand |k, l, m⟩ berechnen. Diese Rechnung lässt sich sehr einfach durchführen, wenn wir L x und L y als Um kehrung von Gl. (C-1) durch L+ und L− ausdrücken: Lx =
1 (L+ + L− ) 2
Ly =
1 (L+ − L− ) 2i
(D-39)
Wir sehen also, dass es sich bei L x |k, l, m⟩ und L y |k, l, m⟩ um Linearkombinationen von |k, l, m + 1⟩ und |k, l, m − 1⟩ handelt. Daraus folgt ⟨k, l, m | L x | k, l, m⟩ = ⟨k, l, m | L y | k, l, m⟩ = 0
(D-40)
außerdem gilt 1 ⟨k, l, m | (L2+ + L2− + L+ L− + L− L+ ) | k, l, m⟩ 4 1 ⟨k, l, m | L2y | k, l, m⟩ = − ⟨k, l, m | (L2+ + L2− − L+ L− − L− L+ ) | k, l, m⟩ 4 ⟨k, l, m | L2x | k, l, m⟩ =
(D-41)
Die Terme mit L2+ und L2− liefern keinen Beitrag, da L2± |k, l, m⟩ proportional zu |k, l, m± 2⟩ ist. Aus Gl. (C-8) erhalten wir weiter L+ L− + L− L+ = 2 (L2 − L2z )
(D-42)
D Anwendung auf Bahndrehimpulse | 667
Es ergibt sich also ⟨k, l, m | L2x | k, l, m⟩ = ⟨k, l, m | L2y | k, l, m⟩ 1 = ⟨k, l, m | (L2 − L2z ) | k, l, m⟩ 2 ℏ2 = [l(l + 1) − m 2 ] 2 Im Zustand |k, l, m⟩ gilt demnach
(D-43)
⟨L x ⟩ = ⟨L y ⟩ = 0
(D-44a)
∆L x = ∆L y = ℏ√[l(l + 1) − m 2 ]/2
(D-44b)
Diese Ergebnisse legen die folgende Vorstellung nahe: Wir betrachten einen klassi schen Drehimpuls, dessen Betrag gleich ℏ√l(l + 1) und dessen Projektion längs der z-Achse gleich mℏ ist (Abb. 3), |L| = ℏ√l(l + 1)
(D-45)
OH = mℏ Mit Θ und Φ bezeichnen wir die Polarwinkel, die seine Richtung angeben. Da das Dreieck OLJ (L ist der Endpunkt von L) in J einen rechten Winkel hat und OH = JL ist, erhalten wir OJ = √OL − OH = ℏ√l(l + 1) − m 2 2
2
(D-46)
Folglich lauten die Komponenten eines solchen klassischen Drehimpulses OI = ℏ√l(l + 1) − m 2 cos Φ OK = ℏ√l(l + 1) − m 2 sin Φ
(D-47)
OH = ℏ√l(l + 1) cos Θ = mℏ
Abb. 3: Klassisches Modell für den Bahndrehim puls eines Teilchens im Zustand |l, m⟩. Wir nehmen an, die Länge |L| und der Winkel Θ seien bekannt, während Φ eine Zufallsvariable ist, deren Wahr scheinlichkeitsdichte im Intervall [0, 2π] konstant ist. Die klassischen Erwartungswerte der Kompo nenten von L und die der Quadrate dieser Kom ponenten sind dann gleich den entsprechenden quantenmechanischen Erwartungswerten.
668 | VI Der Drehimpuls in der Quantenmechanik Wir nehmen nun an, |L| und Θ seien bekannt, während Φ eine Zufallsvariable ist, die einen beliebigen Wert des Intervalls [0, 2π] annehmen kann, wobei alle diese Werte gleichwahrscheinlich sind (gleichverteilte Zufallsvariable). Die Mittelung über Φ ergibt dann 2π
⟨OI⟩ ∝ ∫ cos Φ dΦ = 0
(D-48a)
0 2π
⟨OK⟩ ∝ ∫ sin Φ dΦ = 0
(D-48b)
0
was Gl. (D-44a) entspricht. Weiter erhält man 2π
2
⟨OI ⟩ =
1 2 ℏ2 ℏ [l(l + 1) − m 2 ] ∫ cos2 Φ dΦ = [l(l + 1) − m2 ] 2π 2
(D-49)
0
und entsprechend 2
⟨OK ⟩ =
ℏ2 [l(l + 1) − m 2 ] 2
(D-50)
Diese Erwartungswerte sind gleich denen, die wir in den Gleichungen (D-44) berech net haben. Der Drehimpuls eines Teilchens im Zustand |k, l, m⟩ verhält sich also, so weit es die Erwartungswerte seiner Komponenten und ihrer Quadrate betrifft, wie ein klassischer Drehimpuls der Größe ℏ√l(l + 1) mit einer Projektion mℏ auf die z-Achse, wobei Φ eine zwischen 0 und 2π gleichverteilte Zufallsvariable ist. Natürlich ist dieses Bild mit Vorsicht zu verwenden; wir haben in diesem Ka pitel festgestellt, wie sehr sich die quantenmechanischen Eigenschaften und die klassischen Eigenschaften des Drehimpulses unterscheiden. Insbesondere müssen wir beachten, dass eine Einzelmessung von L x oder L y bei einem Teilchen im Zu stand |k, l, m⟩ nicht, wie zunächst zu erwarten, einen beliebigen Wert zwischen −ℏ√l(l + 1) − m 2 und +ℏ√l(l + 1) − m 2 ergeben kann. Die einzig möglichen Ergebnis se sind die Eigenwerte von L x und L y (wir sahen am Ende von § C, dass das dieselben wie bei L z sind), d. h. bei festem l einer der (2l + 1) Werte lℏ, (l − 1)ℏ, . . . , (−l + 1)ℏ, −lℏ. D-2-b Physikalische Vorhersagen für Messungen von L2 und L z Wir betrachten ein Teilchen, dessen Zustand beschrieben wird durch die (normierte) Wellenfunktion ⟨r|ψ⟩ = ψ(r) = ψ(r, θ, φ)
(D-51)
Wir wissen, dass eine Messung von L2 nur die Resultate 0, 2ℏ2 , 6ℏ2 , . . . , l(l +1)ℏ2 , . . . und eine Messung von L z nur 0, ±ℏ, ±2ℏ, . . . , mℏ, . . . ergeben kann. Wie lassen sich die Wahrscheinlichkeiten für diese Ergebnisse aus der Wellenfunktion ψ(r, θ, φ) be rechnen?
D Anwendung auf Bahndrehimpulse |
669
α Allgemeine Beziehungen Die Wahrscheinlichkeit, bei einer gleichzeitigen Messung von L2 und L z die Ergeb nisse l(l + 1)ℏ2 und mℏ zu erhalten, wollen wir mit 𝒫L2 ,L z (l, m) bezeichnen. Um sie zu berechnen, entwickeln wir ψ(r) in einer Basis aus Eigenfunktionen von L2 und L z . Wir wählen eine Standardbasis wie in § D-1-d: ψ k,l,m (r) = R k,l (r)Y lm (θ, φ)
(D-52)
ψ(r) lässt sich dann schreiben als ψ(r) = ∑ ∑ ∑ c k,l,m R k,l (r)Y lm (θ, φ) k
l
(D-53)
m
wobei die Koeffizienten c k,l,m in der üblichen Weise berechnet werden: c k,l,m = ∫ d3 r ψ∗k,l,m (r)ψ(r) ∞
2π
π
= ∫ r2 dr R∗k,l (r) ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) ψ(r, θ, φ) 0
0
(D-54)
0
Nach den Postulaten von Kapitel III wird die Wahrscheinlichkeit 𝒫L2 ,L z (l, m) für diesen Fall gegeben durch 𝒫L2 ,L z (l, m) = ∑ |c k,l,m |2
(D-55)
k
Wenn wir nur L2 messen, ist die Wahrscheinlichkeit für das Ergebnis l(l + 1)ℏ2 gleich +l
+l
𝒫L2 (l) = ∑ 𝒫L2 ,L z (l, m) = ∑ ∑ |c k,l,m |2 m=−l
(D-56)
k m=−l
Analog wird bei einer Messung allein von L z die Wahrscheinlichkeit für das Ergebnis mℏ gegeben durch 𝒫L z (m) = ∑ 𝒫L2 ,L z (l, m) = ∑ ∑ |c k,l,m |2 l≥|m|
(D-57)
k l≥|m|
(die Bedingung l ≥ |m| ist automatisch erfüllt, da es keine Koeffizienten c k,l,m gibt, für die |m| größer als l ist). Bei diesen Wahrscheinlichkeitsberechnungen ist nur die θ- und φ-Abhängigkeit der Wellenfunktion ψ(r) von Bedeutung, da L2 und L z nur auf diese Variablen wirken. Wir betrachten also ψ(r, θ, φ) als Funktion von θ und φ, die von dem Parameter r ab hängt. Wie jede andere Funktion von θ und φ kann ψ dann in Kugelflächenfunktionen entwickelt werden: ψ(r, θ, φ) = ∑ ∑ a l,m (r) Y lm (θ, φ) l
(D-58)
m
Die Koeffizienten a l,m dieser Entwicklung hängen vom „Parameter“ r ab und werden gegeben durch 2π
π
a l,m (r) = ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) ψ(r, θ, φ) 0
0
(D-59)
670 | VI Der Drehimpuls in der Quantenmechanik
Wenn wir die Ausdrücke (D-58) und (D-53) vergleichen, sehen wir, dass die Koeffizien ten der Entwicklung von a l,m (r) nach den Funktionen R k,l (r) gleich den c k,l,m sind, a l,m (r) = ∑ c k,l,m R k,l (r)
(D-60)
k
wobei nach Gl. (D-54) und (D-59) gilt ∞
c k,l,m = ∫ r2 dr R∗k,l (r) a l,m (r)
(D-61)
0
Außerdem erhalten wir mit Gl. (D-37) und (D-60) ∞
∫ r2 dr |a l,m (r)|2 = ∑ |c k,l,m |2
(D-62)
k
0
Die Wahrscheinlichkeit 𝒫L2 ,L z (l, m) [Gl. (D-55)] kann also in der Form ∞
𝒫L2 ,L z (l, m) = ∫ r2 dr |a l,m (r)|2
(D-63)
0
geschrieben werden, woraus wir wie in den Gleichungen (D-56) und (D-57) erhalten +l
∞
𝒫L2 (l) = ∑ ∫ r2 dr |a l,m (r)|2
(D-64)
m=−l 0
und ∞
𝒫L z (m) = ∑ ∫ r2 dr |a l,m (r)|2
(D-65)
l≥|m| 0
(auch hier existieren die a l,m (r) nur für l ≥ |m|). Um also die physikalischen Vorher sagen für Messungen von L2 und L z zu berechnen, betrachten wir die Wellenfunktion so, als hinge sie nur von θ und φ ab. Wir entwickeln sie dann wie in Gl. (D-58) in Ku gelflächenfunktionen und wenden die Gleichungen (D-63), (D-64) und (D-65) an. Da der Operator L z nur auf φ wirkt, wird die Berechnung der Wahrscheinlichkeit 𝒫L z (m) entsprechend nur von der φ-Abhängigkeit der Wellenfunktion ψ(r) bestimmt. Bei den Kugelflächenfunktionen handelt es sich um Produkte einer Funktion von θ und einer Funktion von φ, und wir schreiben sie Y lm (θ, φ) = Z lm (θ)
eimφ √2π
(D-66)
Diese Form ist so gewählt, dass beide Funktionen in diesem Produkt normiert sind, denn es gilt 2π
e−imφ eim φ = δ mm ∫ dφ √2π √2π 0
(D-67)
D Anwendung auf Bahndrehimpulse | 671
Wir setzen diese Beziehung in die Orthonormierungsbedingungen (D-23) für die Ku gelflächenfunktionen ein und erhalten π
∫ sin θ dθ Z lm∗ (θ)Z lm (θ) = δ ll
(D-68)
0
(aus analogen Gründen wie in Bemerkung 1 am Ende von § D-1-d enthalten beide Funk tionen Z lm auf der linken Seite denselben Wert von m). Wenn wir ψ(r, θ, φ) als Funktion von φ über dem Intervall [0, 2π] auffassen, die von den „Parametern“ r und θ abhängt, können wir sie in eine Fourier-Reihe entwi ckeln: ψ(r, θ, φ) = ∑ b m (r, θ) m
eimφ √2π
(D-69)
wobei sich die Koeffizienten b m (r, θ) aus 2π
1 b m (r, θ) = ∫ dφ e−imφ ψ(r, θ, φ) √2π
(D-70)
0
ergeben. Wenn wir die Gleichungen (D-69) und (D-70) mit (D-58) und (D-59) verglei chen, so sehen wir, dass bei vorgegebenem Wert von m die a l,m (r) gleich den Koeffizi enten der Entwicklung von b m (r, θ) nach den Funktionen Z lm zu demselben Wert von m sind: b m (r, θ) = ∑ a l,m (r) Z lm (θ)
(D-71)
l
mit π
a l,m (r) = ∫ sin θ dθ Z lm∗ (θ) b m (r, θ)
(D-72)
0
Mit Gl. (D-68) folgt aus der Entwicklung (D-71), dass gilt π
∫ sin θ dθ |b m (r, θ)|2 = ∑ |a l,m (r)|2
(D-73)
l
0
Wir setzen diese Beziehung in Gl. (D-65) ein und erhalten 𝒫L z (m) in der folgenden Form: ∞
π 2
𝒫L z (m) = ∫ r dr ∫ sin θ dθ |b m (r, θ)|2 0
(D-74)
0
Um die Wahrscheinlichkeiten der verschiedenen möglichen Ergebnisse einer Messung von L z allein zu berechnen, fassen wir die Wellenfunktion nur als Funktion von φ auf und entwickeln sie dann in eine Fourier-Reihe wie in Gl. (D-69).
672 | VI Der Drehimpuls in der Quantenmechanik
Man könnte nun daran denken, in einer entsprechenden Überlegung die Wahr scheinlichkeit 𝒫L2 (l) zu berechnen, indem man ψ(r, θ, φ) nur bezüglich der Varia blen θ entwickelt. Das ist jedoch nicht möglich: Die Vorhersage für eine Messung von L2 wird sowohl von der θ- als auch von der φ-Abhängigkeit der Wellenfunktion be stimmt, da L2 auf beide Variablen wirkt. Wir müssen also auf Gl. (D-64) zurückgreifen. β Spezialfälle und Beispiele Wir nehmen an, dass die Wellenfunktion ψ(r), die den Zustand des Teilchens darstellt, die Form eines Produkts einer Funktion von r und einer Funktion von θ und φ hat: ψ(r, θ, φ) = f(r) g(θ, φ)
(D-75)
Dabei können wir die Funktionen f(r) und g(θ, φ) stets so wählen, dass sie einzeln normiert sind: ∞
∫ r2 dr |f(r)|2 = 1
(D-76a)
0 2π
π
∫ dφ ∫ sin θ dθ |g(θ, φ)|2 = 1 0
(D-76b)
0
Um die Wellenfunktion in der Form (D-58) zu erhalten, müssen wir g(θ, φ) nach den Kugelflächenfunktionen entwickeln: g(θ, φ) = ∑ ∑ d l,m Y lm (θ, φ) l
(D-77)
m
mit 2π
π
d l,m = ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) g(θ, φ) 0
(D-78)
0
In diesem Fall sind die Koeffizienten a l,m (r) aus Gl. (D-58) alle proportional zu f(r): a l,m (r) = d l,m f(r)
(D-79)
Unter Beachtung von Gl. (D-76a) wird der Ausdruck (D-63) für die Wahrscheinlichkeit 𝒫L2 ,L z (l, m) dann einfach 𝒫L2 ,L z (l, m) = |d l,m |2
(D-80)
Diese Wahrscheinlichkeit hängt nicht vom Radialanteil f(r) der Wellenfunktion ab. Wir betrachten entsprechend den Fall, dass die Wellenfunktion ψ(r, θ, φ) das Pro dukt aus drei Funktionen einer Variablen ist, ψ(r, θ, φ) = f(r)h(θ)k(φ)
(D-81)
D Anwendung auf Bahndrehimpulse |
673
die wir einzeln als normiert annehmen wollen: ∞
π
2π
∫ r dr |f(r)| = ∫ sin θ dθ |h(θ)| = ∫ dφ |k(φ)|2 = 1 2
2
2
0
0
(D-82)
0
Gleichung (D-81) ist natürlich ein Spezialfall von Gl. (D-75), so dass wir die soeben ge fundenen Ergebnisse hier anwenden können. Wenn wir außerdem nur an einer Mes sung von L z interessiert sind, müssen wir k(φ) in der Form k(φ) = ∑ e m m
eimφ √2π
(D-83)
entwickeln mit 2π
1 em = ∫ dφ e−imφ k(φ) √2π
(D-84)
0
damit diese Entwicklung äquivalent zu Gl. (D-69) ist, muss außerdem gelten b m (r, θ) = e m f(r) h(θ)
(D-85)
Aus Gl. (D-74) erhalten wir dann mit Gl. (D-82) die Wahrscheinlichkeit 𝒫L z (m) als 𝒫L z (m) = |e m |2
(D-86)
Die vorstehenden Überlegungen sollen anhand einiger sehr einfacher Beispiele erläutert werden: Zunächst nehmen wir an, die Wellenfunktion ψ(r) sei in Wirklich keit unabhängig von θ und φ, so dass gilt 1 √2 1 k(φ) = √2π h(θ) =
(D-87)
Weiterhin haben wir g(θ, φ) =
1 = Y00 (θ, φ) √4π
(D-88)
eine Messung von L2 oder von L z muss also null ergeben. Als Nächstes wollen wir die θ-Abhängigkeit modifizieren und betrachten 3 cos θ 2 1 k(φ) = √2π h(θ) = √
(D-89)
674 | VI Der Drehimpuls in der Quantenmechanik
In diesem Fall ergibt sich g(θ, φ) = √
3 cos θ = Y 10 (θ, φ) 4π
(D-90)
Wieder stehen die Ergebnisse einer Messung von L2 oder L z eindeutig fest: Für L2 können wir nur 2ℏ2 und für L z nur 0 erhalten. Es lässt sich nachweisen, dass diese Modifikation der θ-Abhängigkeit keinen Einfluss auf die physikalischen Vorhersagen bezüglich einer Messung von L z hat. Wenn wir jedoch die φ-Abhängigkeit verändern, indem wir z. B. 1 √2 eiφ k(φ) = √2π h(θ) =
(D-91)
setzen, so wird g(θ, φ) nicht mehr durch eine einzige Kugelflächenfunktion gegeben. Nach Gl. (D-86) sind die Wahrscheinlichkeiten 𝒫L z (m) gleich null außer für 𝒫L z (m = 1) = 1
(D-92)
Auch die Vorhersagen bezüglich einer Messung von L2 sind anders als für den durch (D-87) beschriebenen Fall. Zu ihrer Berechnung müssen wir die Funktion g(θ, φ) =
1 iφ e √4π
(D-93)
in Kugelflächenfunktionen entwickeln. Man kann zeigen, dass in der Entwicklung der Funktion (D-93) alle Y lm (θ, φ) mit ungeradem l und m = 1 auftreten. Folglich steht das Ergebnis einer Messung von L2 nicht länger fest (die Wahrscheinlichkeiten für die un terschiedlichen Messergebnisse lassen sich aus den Ausdrücken für die Kugelflächen funktionen bestimmen). Wir können also an diesem Beispiel sehen (wir haben darauf oben bereits hingewiesen), dass die φ-Abhängigkeit in die Berechnung von Vorhersa gen für Messungen von L2 eingeht.
Referenzen und Literaturhinweise Dirac (1.13), § 35 und § 36; Messiah (1.17), Kap. XIII; Rose (2.19); Edmonds (2.21).
Übersicht über die Ergänzungen zu Kapitel VI | 675
•
Übersicht über die Ergänzungen zu Kapitel VI AVI Die Kugelflächen funktionen
In dieser Ergänzung werden verschiedene Eigenschaften bewiesen, die in Kap. VI und in einigen der folgenden Ergänzungen Verwendung finden.
BVI Drehimpuls und Drehungen
Hier wird die Beziehung zwischen dem Drehimpuls J eines quantenmechanischen Systems und den räumlichen Drehungen des Systems herausgearbeitet. Es wird gezeigt, dass die Vertauschungsrelationen zwischen den Komponenten von J aus den geometrischen Eigenschaften dieser Drehungen resultieren; es werden die Begriffe skalare Observable und Vektorobservable eingeführt, die in anderen Ergänzungen (insbesondere DX ) eine Rolle spielen. (schwieriger, kann einem zweitem Lesen vorbehalten bleiben)
CVI Drehung zweiatomiger Moleküle
Behandelt wird eine einfache und direkte Anwendung der quantenmechanischen Eigenschaften von Drehimpulsen: die reinen Rotationsspektren heteropolarer zweiatomiger Moleküle und Raman-Rotationsspektren. (relativ einfach; wegen der Bedeutung der behandelten Phänomene in Physik und Chemie beim ersten Lesen zu empfehlen)
DVI Drehimpuls eines zweidimensionalen Oszillators
Diese Ergänzung kann als ausgearbeitete Aufgabe angesehen werden. Es werden die stationären Zustände des zweidimensionalen harmonischen Oszillators untersucht. Zu ihrer Klassifizierung nach dem Drehimpuls wird der Begriff der Rotationsquanten eingeführt. (ohne theoretische Schwierigkeiten) Einige der Ergebnisse werden in Ergänzung EVI verwendet.
EVI Geladenes Teilchen im Magnetfeld. Landau-Niveaus
Untersucht werden die allgemeinen quantenmechanischen Eigenschaften geladener Teilchen im Magnetfeld; insbesondere wird der wichtige Spezialfall des homogenen Magnetfelds betrachtet (Landau-Niveaus). (ohne theoretische Schwierigkeiten; für ein erstes Lesen zu empfehlen, wobei man sich auf die jeweils einführenden Abschnitte beschränken kann)
FVI Aufgaben
•
676 | Ergänzung AVI
Ergänzung AVI Die Kugelflächenfunktionen 1 1-a 1-b 1-c 2 2-a 2-b 2-c 2-d 2-e
Berechnung der Kugelflächenfunktionen | 676 Bestimmung von Y ll (θ, φ) | 676 Der allgemeine Ausdruck für Y lm (θ, φ) | 678 Explizite Ausdrücke für l = 0, l = 1 und l = 2 | 681 Eigenschaften der Kugelflächenfunktionen | 681 Rekursionsbeziehungen | 681 Orthonormierungsbedingungen und Vollständigkeitsrelation | 683 Parität | 683 Komplexkonjugation | 684 Kugelflächenfunktionen. Legendre-Polynome. Zugeordnete Legendre-Funktionen | 684
Diese Ergänzung untersucht die Form und die wichtigsten Eigenschaften der Kugel flächenfunktionen. Es werden einige Beziehungen bewiesen, die wir in § D-1-c von Kapitel VI bereits verwendet haben.
1 Berechnung der Kugelflächenfunktionen Wir berechnen die verschiedenen Kugelflächenfunktionen Y lm (θ, φ) nach der in Kap. VI, § D-1-c angegebenen Methode: Ausgehend von dem Ausdruck für Y ll (θ, φ) wenden wir den Operator L− an und erhalten so iterativ die anderen Kugelflächen funktionen, die bei gleichem l zu den (2l + 1) verschiedenen Werten von m gehören. Die Operatoren L+ und L− wirken nur auf die Winkelabhängigkeit der Wellenfunktio nen; sie lassen sich schreiben L± = ℏ e±iφ [±
∂ ∂ + i cot θ ] ∂θ ∂φ
(1)
1-a Bestimmung von Y ll (θ, φ) Wie wir oben (Kap. VI, § D-1-c) gesehen haben, lässt sich Y ll (θ, φ) aus der Gleichung L+ Y ll (θ, φ) = 0
(2)
berechnen, wobei wir außerdem verwenden, dass Y ll (θ, φ) = F ll (θ) eilφ
(3)
Auf diese Weise ergibt sich Y ll (θ, φ) = c l (sin θ)l eilφ wobei c l eine beliebige Konstante ist. https://doi.org/10.1515/9783110638738-060
(4)
Die Kugelflächenfunktionen |
677
•
Zunächst bestimmen wir den Betrag von c l aus der Forderung, dass Y ll (θ, φ) be züglich der Winkelvariablen θ und φ normiert ist: 2π
π
π
2π
∫ dφ ∫ sin θ dθ |Y ll (θ, φ)|2 0 0
= |c l | ∫ dφ ∫ sin θ dθ (sin θ)2l = 1 2
0
(5)
0
Wir erhalten |c l |2 =
1 2πI l
(6)
wobei I l gegeben wird durch +1
π
I l = ∫ sin θ dθ (sin θ)2l = ∫ du (1 − u 2 )
l
(7)
−1
0
(wir substituieren u = cos θ). Das Integral I l kann durch Iteration berechnet werden, da gilt +1
+1 2
2 l−1
I l = ∫ du (1 − u ) (1 − u )
= I l−1 − ∫ du u 2 (1 − u 2 )
−1
l−1
(8)
−1
Partielle Integration des letzten Integrals führt auf 1 I l = I l−1 − Il 2l Wir erhalten also 2l Il = I l−1 2l + 1 mit
(9)
(10)
+1
I0 = ∫ du = 2
(11)
−1
Daraus lässt sich sofort der Wert von I l ableiten: Il =
(2l)!! 22l+1 (l!)2 I0 = (2l + 1)!! (2l + 1)!
(12)
Y ll (θ, φ) ist also normiert, wenn gilt 1 √ (2l + 1)! (13) 4π 2l l! Um die Konstanten c l vollständig zu definieren, müssen wir ihre Phase festlegen; üblicherweise wählt man |c l | =
cl =
(−1)l √ (2l + 1)! 4π 2l l!
(14)
Wir werden unten sehen, dass mit dieser Konvention Y l0 (θ) (das von φ unabhängig ist) für θ = 0 einen reellen positiven Wert hat.
•
678 | Ergänzung AVI
1-b Der allgemeine Ausdruck für Y lm (θ, φ) Wir erhalten die anderen Kugelflächenfunktionen Y lm (θ, φ) durch die sukzessive An wendung des Operators L− auf die soeben bestimmte Funktion Y ll (θ, φ). Zunächst aber wollen wir eine Formel beweisen, durch die die Rechnungen vereinfacht werden. α Die Wirkung von (L± )p auf die Funktion einφ F(θ) Die Wirkung der Operatoren L+ und L− auf die Funktion einφ F(θ) (n ist eine beliebige ganze Zahl) lautet L± [einφ F(θ)] = ∓ℏ ei(n±1)φ (sin θ)1±n
d [(sin θ)∓n F(θ)] d(cos θ)
(15)
Allgemeiner gilt (L± ) p [einφ F(θ)] = (∓ℏ)p ei(n±p)φ (sin θ)p±n
dp [(sin θ)∓n F(θ)] d(cos θ)p
(16)
Wir beweisen zunächst Gl. (15): Wir wissen, dass d dθ 1 d d = =− d(cos θ) d(cos θ) dθ sin θ dθ
(17)
und damit d [(sin θ)∓n F(θ)] d(cos θ) dF(θ) 1 = (sin θ)1±n (− ) [∓n (sin θ)∓n−1 cos θ F(θ) + (sin θ)∓n ] sin θ dθ dF(θ) = − [∓n cot θ F(θ) + ] dθ
(sin θ)1±n
(18)
gilt. Daraus folgt ∓ ei(n±1)φ (sin θ)1±n
d [(sin θ)∓n F(θ)] d(cos θ)
∂ ] ei(n±1)φ F(θ) ∂θ ∂ ∂ + i cot θ ] einφ F(θ) = e±iφ [± ∂θ ∂φ = [−n cot θ ±
(19)
Wir erkennen hier den Ausdruck (1) für die Operatoren L+ und L− wieder; Gl. (19) ist also identisch mit Gl. (15). Gleichung (16) können wir durch vollständige Induktion beweisen: Für p = 1 reduziert sich Gl. (16) auf Gl. (15), die wir gerade nachgewiesen haben. Wir nehmen
Die Kugelflächenfunktionen | 679
•
also an, Gl. (16) gelte für (p − 1), (L± )p−1 [einφ F(θ)] = (∓ℏ)p−1 ei(n±p∓1)φ (sin θ)p−1±n ×
dp−1 [(sin θ)∓n F(θ)] d(cos θ)p−1
(20)
und zeigen, dass sie dann auch für p gilt. Dazu wenden wir L± auf beide Seiten von Gl. (20) an. Für die rechte Seite können wir Gl. (15) benutzen, indem wir die folgenden Ersetzungen vornehmen: n ⇒ n ± p ∓ 1 F(θ) ⇒ (sin θ)p−1±n
dp−1 [(sin θ)±n F(θ)] d(cos θ)p−1
(21)
Wir erhalten dann (L± ) p [einφ F(θ)] = (∓ℏ)p ei(n±p)φ (sin θ)±n+p ×
dp−1 d [(sin θ)∓n F(θ)]} {(sin θ)∓n−p+1 (sin θ)p−1±n d(cos θ) d(cos θ)p−1
= (∓ℏ)p ei(n±p)φ (sin θ)p±n
dp [(sin θ)∓n F(θ)] d(cos θ)p (22)
Somit ist Gl. (16) bewiesen. β Berechnung von Y lm (θ, φ) aus Y ll (θ, φ) Wir haben bereits gesehen (Kap. VI, § D-1-c-α), dass für die Kugelflächenfunktionen Y lm (θ, φ) L± Y lm (θ, φ) = ℏ√l(l + 1) − m(m ± 1) Y lm±1 (θ, φ) = ℏ√(l ∓ m)(l ± m + 1) Y lm±1 (θ, φ)
(23)
gilt. Diese Relationen stellen sicher, dass mit Y lm auch Y lm±1 normiert ist. Außerdem wird durch sie die relative Phase der Kugelflächenfunktionen zu einem Wert von l und unterschiedlichen Werten von m festgelegt. Insbesondere können wir Y lm (θ, φ) aus Y ll (θ, φ) berechnen, indem wir den Ope rator L− [Gl. (1) und Gl. (23)] verwenden. So erhalten wir automatisch eine bereits nor mierte Funktion Y lm (θ, φ), deren Phase durch die Konvention für Y ll (θ, φ) [Gl. (14)] festgelegt ist. Um von Y ll (θ, φ) auf Y lm (θ, φ) zu gelangen, haben wir (l − m)-mal den Operator L− anzuwenden; nach Gl. (23) erhalten wir also (L− ) l−m Y ll (θ, φ) = ℏl−m √(2l)(1) × (2l − 1)(2) × ⋅ ⋅ ⋅ × (l + m + 1)(l − m) Y lm (θ, φ)
(24)
•
680 | Ergänzung AVI
d. h. Y lm (θ, φ) = √
(l + m)! L− l−m l Y l (θ, φ) ( ) (2l)!(l − m)! ℏ
(25)
Schließlich können wir unter Verwendung des Ausdrucks (4) für Y ll (θ, φ) [wobei der Koeffizient c l durch Gl. (14) gegeben wird] und Gl. (16) (mit n = l und p = l − m) die Funktion (25) explizit in der Form schreiben Y lm (θ, φ) =
dl−m (−1)l 2l + 1 (l + m)! imφ −m √ (sin θ) (sin θ)2l e 4π (l − m)! 2l l! d(cos θ)l−m
(26)
γ Berechnung von Y lm (θ, φ) aus Y l−l (θ, φ) Zur Berechnung des Ausdrucks (26) gingen wir von der Funktion Y ll (θ, φ) aus und benutzten dann die Wirkung des Operators L− . Man kann natürlich ebenso gut auch erst die Funktion Y l−l (θ, φ) bestimmen und dann den Operator L+ anwenden. Der Aus druck, der sich auf diese Weise für Y lm (θ, φ) ergibt, unterscheidet sich von Gl. (26), obwohl beide Ausdrücke natürlich vollständig äquivalent sind. Wir bestimmen also Y l−l (θ, φ) aus Gl. (26):¹ Da (sin θ)2l = (1 − cos2 θ)l
(27)
ein Polynom vom Grad 2l in cos θ ist, trägt nur der Term höchster Ordnung zu Y l−l (θ, φ) bei, d2l (sin θ)2l = (−1)l (2l)! d(cos θ)2l
(28)
daraus ergibt sich sofort Y l−l (θ, φ) =
1 √ (2l + 1)! −ilφ (sin θ)l e 4π 2l l!
(29)
Die Funktion Y lm (θ, φ) ergibt sich dann durch die (l + m)-malige Anwendung des Operators L+ auf Y l−l (θ, φ). Mit Gl. (23) und (16) erhalten wir schließlich Y lm (θ, φ) =
dl+m (−1)l+m 2l + 1 (l − m)! imφ m √ (sin θ) (sin θ)2l e 4π (l + m)! 2l l! d(cos θ)l+m
(30)
1 Offenbar könnten wir Y l−l (θ, φ) auch aus der Gleichung L− Y l−l (θ, φ) = 0 berechnen. Die Phase blie be dann jedoch unbestimmt. Mit Hilfe von Gl. (26) wird Y l−l (θ, φ) vollständig festgelegt, wobei sich ihre Phase aus der obigen Konvention ergibt.
Die Kugelflächenfunktionen | 681
•
1-c Explizite Ausdrücke für l = 0, l = 1 und l = 2 Aus den allgemeinen Gleichungen (26) und (30) berechnen wir die Kugelflächenfunk tionen für die ersten Werte von l: Y 00 =
1 √4π
Y1±1 (θ, φ) = ∓√ Y10 (θ, φ) = √ Y2±2 (θ, φ) = √
(31)
3 sin θ e±iφ 8π
3 cos θ 4π
(32)
15 sin2 θ e±2iφ 32π
15 sin θ cos θ e±iφ 8π 5 Y20 (θ, φ) = √ (3 cos2 θ − 1) 16π
Y2±1 (θ, φ) = ∓√
(33)
2 Eigenschaften der Kugelflächenfunktionen 2-a Rekursionsbeziehungen Ihrer Konstruktion nach erfüllen die Kugelflächenfunktionen Gl. (23) zusammen mit Gl. (1) die Beziehung e±iφ [±
∂ − m cot θ] Y lm (θ, φ) = √l(l + 1) − m(m ± 1) Y lm±1 (θ, φ) ∂θ
(34)
Außerdem gilt die folgende nützliche Formel: cos θ Y lm (θ, φ) = √
(l + m + 1)(l − m + 1) m Y l+1 (θ, φ) (2l + 1)(2l + 3)
+√
(l + m)(l − m) m Y (θ, φ) (2l + 1)(2l − 1) l−1
(35)
Wir skizzieren den Beweis dieser Gleichung: Nach Gl. (25) gilt cos θ Y lm (θ, φ) = √
(l + m)! L− l−m l Y l (θ, φ) cos θ ( ) (2l)!(l − m)! ℏ
(36)
Mit Hilfe des Ausdrucks (1) für L− zeigt man leicht, dass [L− , cos θ] = ℏ e−iφ sin θ
(37)
•
682 | Ergänzung AVI
gilt und außerdem [L− , e−iφ sin θ] = 0
(38)
Daraus ergibt sich durch vollständige Induktion der Kommutator von (L− /ℏ)k und cos θ: Wenn wir annehmen, dass [(
L− k−1 L− k−2 , cos θ] = (k − 1) e−iφ sin θ ( ) ) ℏ ℏ
(39)
gilt, so erhalten wir [(
L− k−1 L− L− L− k L− k−1 , cos θ] ) , cos θ] = ( ) [ , cos θ] + [( ) ℏ ℏ ℏ ℏ ℏ =(
L− k−1 −iφ L− k−1 sin θ + (k − 1) e−iφ sin θ ( ) ) e ℏ ℏ
(40)
d. h. [(
L− k−1 L− k−1 L− k = k ( ) e−iφ sin θ ) , cos θ] = k e−iφ sin θ ( ) ℏ ℏ ℏ
(41)
Diese Beziehung ist somit durch vollständige Induktion bewiesen. Mit ihrer Hilfe schreiben wir Gl. (36) in der Form cos θ Y lm = √
(l + m)! (2l)!(l − m)!
× [(
L− l−m L− l−m−1 −iφ cos θ Y ll − (l − m) ( ) e sin θ Y ll ] ) ℏ ℏ
(42)
Mit den Gleichungen (4) und (14) können wir leicht zeigen, dass e−iφ sin θ Y ll = −√
2l + 1 l−1 (1 − cos2 θ) Y l−1 2l
(43)
gilt. Wenn wir dann aus der allgemeinen Beziehung (26) die expliziten Ausdrücke für l−1 l Y l+1 und Y l+1 berechnen, ergibt sich cos θ Y ll = l−1 cos2 θ Y l−1 =
1 √2l + 3
l Y l+1
2 √ l 1 Y l−1 + Y l−1 2l + 1 2l + 3 l+1 2l + 1 l−1
(44a) (44b)
Wir erhalten Gl. (35), indem wir die Beziehungen (43) und (44) in Gl. (42) einsetzen und Gl. (23) verwenden.
Die Kugelflächenfunktionen |
683
•
2-b Orthonormierungsbedingungen und Vollständigkeitsrelation Die Kugelflächenfunktionen stellen aufgrund ihrer Konstruktion eine Menge normier ter Funktionen dar; außerdem sind sie orthogonal, da es sich bei ihnen um Eigen funktionen der hermiteschen Operatoren L2 und L z zu verschiedenen Eigenwerten handelt. Die entsprechende Orthonormalitätsrelation lautet 2π
π
∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) Y lm (θ, φ) = δ ll δ mm 0
(45)
0
Es lässt sich zeigen (wir wollen es hier annehmen), dass jede quadratintegrable Funktion von θ und φ in eindeutiger Weise in Kugelflächenfunktionen entwickelt wer den kann: f(θ, φ) = ∑ ∑ c l,m Y lm (θ, φ) l
(46)
m
mit 2π
π
c l,m = ∫ dφ ∫ sin θ dθ Y lm∗ (θ, φ) f(θ, φ) 0
(47)
0
Die Menge der Kugelflächenfunktionen bildet daher eine Orthonormalbasis des Raums der quadratintegrablen Funktionen von θ und φ. Das lässt sich durch die Vollständigkeitsrelation ausdrücken: ∑ ∑ Y lm (θ, φ) Y lm∗ (θ , φ ) = δ(cos θ − cos θ ) δ(φ − φ ) l
(48)
m
2-c Parität Die Paritätsoperation besteht für eine Funktion im Ortsraum (s. Ergänzung FII ) in der Ersetzung der Koordinaten eines Raumpunkts durch die Koordinaten des zu diesem Punkt unter einer Spiegelung am Ursprung des Koordinatensystems symmetrischen Punkts: r ⇒ −r
(49)
In Kugelkoordinaten drückt sich diese Transformation durch die Ersetzung (s. Abb. 2 in Kap. VI) r ⇒ r θ ⇒ π − θ
(50)
φ ⇒ π + φ aus. Wenn wir im Raum der Wellenfunktionen eines spinlosen Teilchens (s. Kap. VI, § D-1-d) eine Standardbasis verwenden, lässt die Paritätsoperation den Radialteil ei ner Basisfunktion ψ k,l,m (r) also gleich. Lediglich die Kugelflächenfunktionen erfahren eine Änderung, die wir uns nun ansehen.
•
684 | Ergänzung AVI
Unter der Transformation (50) gilt sin θ ⇒ sin θ cos θ ⇒ − cos θ imφ
e
m
(51) imφ
⇒ (−1) e
Die Funktion Y ll (θ, φ), die wir in § 1-a berechnet haben, wird also transformiert in Y ll (π − θ, π + φ) = (−1)l Y ll (θ, φ)
(52)
Außerdem gilt ∂ ∂ ⇒ − ∂θ ∂θ ∂ ∂ ⇒ ∂φ ∂φ
(53)
Die Ersetzungen (51) und (53) zeigen, dass die Operatoren L+ und L− [Gl. (1)] keine Än derung erfahren (L+ und L− sind also, wie in § 2-a von Ergänzung FII definiert, gerade Operatoren). Aus Gl. (52) und der Formel (25), mit deren Hilfe wir Y lm (θ, φ) berechnen können, folgt somit Y lm (π − θ, π + φ) = (−1)l Y lm (θ, φ)
(54)
Bei den Kugelflächenfunktionen handelt es sich also um Funktionen mit wohldefi nierter, von m unabhängiger Parität: Für gerade l sind sie gerade und für ungerades l ungerade.
2-d Komplexkonjugation Die φ-Abhängigkeit macht die Kugelflächenfunktionen zu komplexwertigen Funktio nen. Durch einen Vergleich von Gl. (26) und Gl. (30) ergibt sich unmittelbar ∗
[Y lm (θ, φ)] = (−1)m Y l−m (θ, φ)
(55)
2-e Kugelflächenfunktionen. Legendre-Polynome. Zugeordnete Legendre-Funktionen Die θ-Abhängigkeit der Kugelflächenfunktionen wird durch Funktionen beschrieben, die als Legendre-Polynome und zugeordnete Legendre-Funktionen bekannt sind. Wir wollen die Eigenschaften dieser Funktionen weder beweisen noch aufzählen, sondern lediglich ihren Zusammenhang mit den Kugelflächenfunktionen angeben.
Die Kugelflächenfunktionen |
685
•
α Die Funktion Y l0 (θ) ist proportional zu einem Legendre-Polynom Für m = 0 ergeben Gl. (26) und (30) Y l0 (θ) =
(−1)l √ 2l + 1 dl (sin θ)2l 4π d(cos θ)l 2l l!
(56)
(−1)l dl l (1 − u 2 ) 2l l! du l
(57)
Setzt man P l (u) =
so lässt sich das in der Form schreiben: Y l0 (θ) = √
2l + 1 P l (cos θ) 4π
(58)
Seiner Definition (57) nach handelt es sich bei P l (u) um ein Polynom l. Ordnung in u mit der Parität² (−1)l : P l (−u) = (−1)l P l (u)
(59)
P l (u) ist das Legendre-Polynom l. Ordnung. Man zeigt leicht, dass es im Intervall [−1, +1] l Nullstellen hat und dass mit dem numerischen Koeffizienten in Gl. (57) P l (1) = 1
(60)
gilt. Weiterhin lässt sich zeigen, dass die Legendre-Polynome eine Menge orthogonaler Funktionen bilden: +1
π
∫ du P l (u) P l (u) = ∫ sin θ dθ P l (cos θ) P l (cos θ) = −1
0
2 δ ll 2l + 1
(61)
nach denen die nur von θ abhängigen Funktionen entwickelt werden können: f(θ) = ∑ c l P l (cos θ)
(62)
l
mit π
2l + 1 cl = ∫ sin θ dθ P l (cos θ) f(θ) 2
(63)
0
Bemerkung: Nach Gl. (58) und (60) gilt Y l0 (0) = √
2l + 1 4π
(64)
wir haben in § 1-a darauf hingewiesen, dass die für Y ll (θ, φ) gewählte Phasenkonvention für Y l0 (0) einen reellen positiven Wert ergibt. 2 Die Paritätsoperation im Ortsraum [Gl. (50)] entspricht der Transformation von cos θ in − cos θ; die Eigenschaft (59) lässt sich ausdrücken durch Y l0 (π − θ) = (−1)l Y l0 (θ), wobei es sich um einen Spezi alfall von Gl. (54) handelt.
•
686 | Ergänzung AVI
β Die Funktion Y lm (θ, φ) ist proportional zu einer zugeordneten Legendre-Funktion Für positive m ergibt sich Y lm (θ, φ) aus der Anwendung des Operators L+ auf Y l0 (θ); mit Gl. (23) erhält man Y lm (θ, φ) = √
(l − m)! L+ m 0 ( ) Y l (θ) (l + m)! ℏ
(m ≥ 0)
(65)
Mit Hilfe der Beziehungen (1) und (16) folgt Y lm (θ, φ) = (−1)m √
2l + 1 (l − m)! m P (cos θ) eimφ 4π (l + m)! l
(m ≥ 0)
(66)
wobei P m l eine zugeordnete Legendre-Funktion ist, die definiert wird durch 2 √ Pm l (u) = (1 − u )
m
dm P l (u) du m
(−1 ≤ u ≤ +1)
(67)
2 m √ Die Funktion P m l (u) ist also das Produkt aus (1 − u ) und einem Polynom vom l−m 0 Grad (l − m) und der Parität (−1) ; P m (u) ist gleich dem Legendre-Polynom P l (u). Die Menge der P m l mit festem m bildet ein orthogonales Funktionensystem, +1
π
m m m ∫ du P m l (u) P l (u) = ∫ sin θ dθ P l (cos θ) P l (cos θ) −1
0
=
2 (l + m)! δ ll 2l + 1 (l − m)!
(68)
in das Funktionen von θ entwickelt werden können. Gleichung (66) gilt für positive Werte von m (oder null); für negative Werte von m wendet man Gl. (55) an und erhält Y lm (θ, φ) = √
2l + 1 (l + m)! −m P (cos θ) eimφ 4π (l − m)! l
(m < 0)
(69)
γ Additionstheorem der Kugelflächenfunktionen Wir betrachten zwei Raumrichtungen u und u , die durch die Polarwinkel (θ , φ ) bzw. (θ , φ ) definiert werden; der Winkel zwischen diesen beiden Richtungen sei α. Dann lässt sich die folgende Beziehung zeigen: +l 2l + 1 P l (cos α) = ∑ (−1)m Y lm (θ , φ ) Y l−m (θ , φ ) 4π m=−l
(70)
(P l ist das Legendre-Polynom l. Ordnung). Sie wird als das Additionstheorem der Ku gelflächenfunktionen bezeichnet. Wir geben die wichtigen Schritte des Beweises von Gl. (70) an: Zunächst stellen wir fest, dass die linke Seite von Gl. (70) als Funktion von θ und φ aufgefasst werden
Die Kugelflächenfunktionen | 687
•
kann, wenn wir α durch die Polarwinkel (θ , φ ) und (θ , φ ) ausdrücken; sie kann also in die Kugelflächenfunktionen Y lm (θ , φ ) entwickelt werden. Die Koeffizienten dieser Entwicklung, bei denen es sich offenbar um Funktionen der anderen beiden Variablen θ und φ handelt, lassen sich wiederum in die Kugelflächenfunktionen Y lm (θ , φ ) entwickeln. Es gilt also 2l + 1 P l (cos α) = ∑ ∑ c l ,m ;l ,m Y lm (θ , φ ) Y lm (θ , φ ) 4π l ,m l ,m
(71)
das Problem besteht also in der Berechnung der Koeffizienten c l ,m ;l ,m . Dabei kann man wie folgt vorgehen: 1. Zunächst zeigen wir, dass diese Koeffizienten nur für l = l = l
(72)
von null verschieden sind: Wir betrachten eine feste Richtung u ; P l (cos α) hängt dann nur von θ und φ ab. Wenn wir die z-Achse in Richtung von u legen, ist cos α = cos θ und P l (cos α) proportional zu Y l0 (θ ) [s. Gl. (58)]. Um im allgemeinen Fall eine beliebige Richtung von u zu erhalten, führen wir eine Drehung der z-Achse in diese Richtung durch; cos α und P l (cos α) bleiben dabei gleich. Da die Drehope ratoren (s. Ergänzung BVI , § 3-c-γ) mit L2 vertauschen, bleibt die Transformierte von Y l0 (θ ) eine Eigenfunktion von L2 mit dem Eigenwert l(l + 1)ℏ2 , also eine Linearkom bination der Kugelflächenfunktionen Y lm (θ , φ ). Damit gilt l = l. Analog zeigt man auch l = l. 2. Eine Drehung der beiden Richtungen u und u um einen Winkel β um die z-Achse ändert weder den Winkel α noch die Winkel θ und θ , während φ und φ in φ + β und φ + β übergehen. Der Wert der linken Seite von Gl. (71) bleibt daher unter einer solchen Drehung gleich, und jeder Term auf der rechten Seite wird mit ei(m +m )β multipliziert. Folglich verschwinden nur die Koeffizienten in der Summe auf der rechten Seite nicht, für die gilt m + m = 0
(73)
3. Mit Gl. (72) und Gl. (73) können wir Gl. (71) in der Form schreiben +l 2l + 1 P l (cos α) = ∑ (−1)m c m Y lm (θ , φ ) Y l−m (θ , φ ) 4π m=−l
(74)
Wenn wir θ = θ und φ = φ setzen, erhalten wir nach Gl. (60) +l 2l + 1 = ∑ (−1)m c m Y lm (θ , φ ) Y l−m (θ , φ ) 4π m=−l
(75)
Da (−1)m Y l−m gleich Y lm∗ ist, führt die Integration von Gl. (75) über dΩ = sin θ dθ dφ unter Beachtung der Orthonormalitätsrelation (45) auf +l
2l + 1 = ∑ c m m=−l
(76)
•
688 | Ergänzung AVI
Wir quadrieren nun den Betrag beider Seiten von Gl. (74) und integrieren über d Ω 2 und dΩ . Mit Gl. (45) sieht man dann leicht, dass die rechte Seite ∑+l m=−l |c m | ergibt. Für die linke Seite können wir erneut die Invarianz des Winkels α unter Drehungen ausnutzen und zeigen, dass ∫ dΩ |P l (cos α)|2 unabhängig von θ und φ ist. Wenn wir dann zur Berechnung dieses Integrals u in z-Richtung legen, erhalten wir mit Gl. (61) ∫ dΩ |P l (cos α)|2 = ∫ dΩ |P l (cos θ)|2 = 2π
2 2l + 1
(77)
Die Integration über dΩ ergibt eine zweite Beziehung für die Koeffizienten c m : +l
2l + 1 = ∑ |c m |2
(78)
m=−l
4. Die Gleichungen (76) und (78) genügen zur Bestimmung der (2l + 1) Koef fizienten c m : Sie sind alle gleich eins. Um das zu sehen, betrachten wir in einem normierten (2l + 1)-dimensionalen Vektorraum den Vektor X mit den Komponenten x m = c m /√2l + 1 und den Vektor Y mit den Komponenten y m = 1/√2l + 1. Die Schwarzsche Ungleichung besagt (X∗ ⋅ X) (Y∗ ⋅ Y) ≥ |Y∗ ⋅ X|2
(79)
wobei das Gleichheitszeichen genau dann gilt, wenn X und Y proportional zueinander sind. Nach Gl. (76) und Gl. (78) ist das aber der Fall: x m und c m sind daher wie y m unabhängig von m, und es gilt notwendig c m = 1. Damit ist Gl. (70) bewiesen.
Referenzen und Literaturhinweise Messiah (1.17), Anhang B, § IV; Arfken (10.4), Kap. 12; Edmonds (2.21), Tabelle 1; Butkov (10.8), Kap. 9, § 5 und § 8; Whittaker und Watson (10.12), Kap. XV; Bateman (10.39), Kap. III; Bass (10.1), Bd. I, § 17–7.
Drehimpuls und Drehungen | 689
•
Ergänzung BVI Drehimpuls und Drehungen 1 2 2-a 2-b 3 3-a 3-b 3-c 4 4-a 4-b 5 5-a 5-b 5-c 6 6-a 6-b 6-c
Einleitung | 689 Eigenschaften der räumlichen Drehungen R | 690 Definition. Parametrisierung | 690 Infinitesimale Drehungen | 691 Drehoperatoren im Zustandsraum. Teilchen ohne Spin | 693 Existenz und Definition von Drehoperatoren | 693 Eigenschaften des Drehoperators R | 694 Drehoperatoren und Drehimpulsobservable | 696 Drehoperatoren für ein beliebiges System | 699 Ein System aus mehreren spinlosen Teilchen | 699 Ein beliebiges System | 701 Drehung von Observablen | 703 Die allgemeine Transformationsvorschrift | 703 Skalare Observable | 704 Vektorielle Observable | 705 Drehinvarianz | 706 Invarianz physikalischer Gesetze | 706 Folgerung: Erhaltung des Drehimpulses | 709 Anwendungen | 710
1 Einleitung Wir haben in § B-2 von Kapitel VI darauf hingewiesen, dass die Vertauschungsrela tionen zwischen den Komponenten eines Drehimpulses Ausdruck der geometrischen Eigenschaften von Drehungen im dreidimensionalen Raum sind. Diesen Zusammen hang zwischen Drehungen und Drehimpulsoperatoren wollen wir in dieser Ergänzung untersuchen. Wir betrachten ein physikalisches System (S), dessen quantenmechanischer Zu stand zu einer bestimmten Zeit durch den Vektor |ψ⟩ des Zustandsraums H beschrie ben wird. An diesem System führen wir eine Drehung R aus: In der neuen Lage wird der Zustand des Systems durch den Vektor |ψ ⟩ beschrieben, der von |ψ⟩ verschieden ist. Das Problem besteht darin, anhand der gegebenen geometrischen Transformati on R aus dem Zustand |ψ⟩ den Zustand |ψ ⟩ zu bestimmen. Wir werden sehen, dass die Lösung wie folgt aussieht: Jeder räumlichen Drehung R lässt sich ein linearer Ope rator R zuordnen, der im Zustandsraum H wirkt und für den gilt |ψ ⟩ = R |ψ⟩
(1)
Dabei müssen wir unterscheiden zwischen der räumlichen Drehung R, die im Orts raum wirkt, und ihrem „Bild“ R, also einem Operator, der im Zustandsraum wirkt: R → R https://doi.org/10.1515/9783110638738-061
(2)
•
690 | Ergänzung BVI
Wir beginnen (§ 2) mit einer Wiederholung der grundlegenden Eigenschaften räumlicher Drehungen R. Dabei werden wir lediglich einige Tatsachen angeben, die uns später nützen werden. In § 3 werden wir dann am Beispiel eines spinlosen Teilchens den Drehoperator R genau definieren, seine wichtigsten Eigenschaften untersuchen und seinen Zusammenhang mit dem Drehimpulsoperator L herausar beiten. Danach werden wir zeigen, wie man im Zustandsraum Hr die Drehimpuls vertauschungsrelationen als Bild der geometrischen Eigenschaften der Drehungen R interpretieren kann, und anschließend (§ 4) das Konzept auf beliebige quantenme chanische Systeme verallgemeinern. In § 5 untersuchen wir, wie sich Observable, die in diesem System messbare physikalische Größen beschreiben, bei Drehungen ver halten. Das wird uns zu einer Klassifizierung der Observablen in Skalare, Vektoren, Tensoren führen. Schließlich betrachten wir in § 6 die Frage der Drehinvarianz und geben einige wichtige Folgerungen daraus an.
2 Eigenschaften der räumlichen Drehungen R 2-a Definition. Parametrisierung Eine Drehung oder Rotation R ist als eine umkehrbar eindeutige Abbildung des dreidi mensionalen Raums in sich definiert, bei der ein Punkt fest bleibt und die Winkel, die Abstände sowie die Orientierung des Koordinatensystems erhalten bleiben.¹ Wir wer den uns hier mit der Menge von Drehungen befassen, die einen bestimmten Punkt O unverändert lassen und diesen als Ursprung des Koordinatensystems wählen. Eine Drehung wird dann durch ihre Drehachse (gegeben durch ihren Einheitsvektor u oder ihre Polarwinkel θ und φ) und den Drehwinkel α (0 ≤ α < 2π) bestimmt. Daher sind zur Festlegung einer Drehung drei Parameter notwendig; man kann sie als Kompo nenten des Vektors α = αu
(3)
auffassen, dessen Betrag gleich dem Drehwinkel ist und dessen Richtung die Dreh achse definiert (sie könnte ebenso gut auch durch drei Winkel, die sogenannten EulerWinkel, bestimmt werden). Wir bezeichnen eine räumliche Drehung mit dem Winkel α um die durch den Einheitsvektor u gegebene Drehachse mit Ru (α). Die Menge der Drehungen R bildet eine Gruppe: Das Produkt zweier Drehun gen (das ist die Transformation, die sich aus zwei aufeinanderfolgenden Drehungen ergibt) ist wieder eine Drehung; es gibt eine Einheitsdrehung (die Drehung um den Winkel null um eine beliebige Achse); zu jeder Drehung Ru (α) gibt es eine inverse
1 Diese letzte Eigenschaft wird verlangt, um Spiegelungen an einer Ebene oder einem Punkt auszu schließen.
Drehimpuls und Drehungen | 691
•
Drehung, R−u (α). Die Gruppe der Drehungen ist nicht kommutativ: Im Allgemeinen hängt das Produkt zweier Drehungen von der Reihenfolge ab, in der sie ausgeführt werden:² Ru (α)Ru (α ) ≠ Ru (α )Ru (α)
(4)
Jedoch vertauschen zwei Drehungen immer, wenn sie dieselbe Drehachse besitzen: Ru (α)Ru (α ) = Ru (α )Ru (α) = Ru (α + α )
(5)
(wenn nötig, ziehen wir von α + α den Wert 2π ab, damit der Drehwinkel im Intervall [0, 2π] bleibt).
2-b Infinitesimale Drehungen Eine infinitesimale Drehung unterscheidet sich infinitesimal von der Einheitsdre hung, bedeutet also eine Drehung Ru (dα) mit einem infinitesimalen Drehwinkel dα um eine beliebige Achse u. Es lässt sich leicht zeigen, dass ein Vektor OM bei einer infinitesimalen Drehung Ru (dα) (in erster Ordnung in dα) in den Vektor Ru (dα) OM = OM + dα u × OM
(6)
transformiert wird. Jede endliche Drehung kann in eine unendliche Anzahl infinitesimaler Drehun gen zerlegt werden, da sich der Drehwinkel stetig verändern kann und nach Gl. (5) Ru (α + dα) = Ru (α)Ru (dα) = Ru (dα)Ru (α)
(7)
gilt, wobei Ru (dα) eine infinitesimale Drehung bedeutet. Die Behandlung der Dreh gruppe lässt sich damit auf die der infinitesimalen Drehungen zurückführen.³ Zum Abschluss dieses kurzen Überblicks der Eigenschaften räumlicher Drehun gen wollen wir eine Beziehung angeben, die sich weiter unten als nützlich erweisen wird: Rey (− dα ) Rex (dα) Rey (dα ) Rex (− dα) = Rez (dα dα )
(8)
wobei ex , ey und ez die Einheitsvektoren der Koordinatenachsen in x-, y- bzw. z-Richtung bezeichnen. Für infinitesimale Winkel erster Ordnung dα und dα gilt diese Beziehung in zweiter Ordnung; sie beschreibt für einen Spezialfall die nicht kommutative Struktur der Drehgruppe.
2 Wenn wir R1 R2 schreiben, so ist zunächst R2 und danach R1 anzuwenden. 3 Mit der Beschränkung auf infinitesimale Drehungen geht allerdings eine „globale“ Eigenschaft der endlichen Drehgruppe verloren, nach der eine Drehung um den Winkel 2π gleich der Einheitstransfor mation ist. Die Drehoperatoren (§ 3 und § 4), die aus infinitesimalen Operatoren konstruiert werden, erfüllen diese globale Eigenschaft nicht immer. In bestimmten Fällen (s. Ergänzung AIX ) ist der zur Drehung um 2π gehörende Operator nicht der Einheits-, sondern der entgegengesetzte Operator.
•
692 | Ergänzung BVI
Zum Beweis von Gl. (8) wenden wir ihre linke Seite auf einen beliebigen Vektor OM an. Mit Gl. (6) bestimmen wir den Vektor OM , das Bild von OM nach der aufeinan derfolgenden Anwendung von vier infinitesimalen Drehungen. Für dα gleich null re duziert sich die linke Seite von Gl. (8) auf das Produkt Rey (− dα )Rey (dα ), also die Einheitsdrehung [s. Gl. (5)]; der Vektor OM − OM muss somit proportional zu dα sein. Entsprechend muss er auch proportional zu dα sein. Die Differenz OM − OM ist dem nach proportional zu dα dα . Um also OM in zweiter Ordnung zu berechnen, können wir uns bei beiden infi nitesimalen Winkeln dα und dα auf die erste Ordnung beschränken. Nach Gl. (6) gilt zunächst Rex (− dα) OM = OM − dα ex × OM Dann wenden wir, erneut unter Verwendung von Gl. (6), Rey an:
(9) (dα )
auf diesen Vektor
Rey (dα ) Rex (− dα) OM = (OM − dα ex × OM) + dα ey × (OM − dα ex × OM) = OM − dα ex × OM + dα ey × OM − dα dα ey × (ex × OM)
(10)
Die Anwendung von Rex (dα) auf den Vektor der rechten Seite von Gl. (10) führt zur Addition der folgenden infinitesimalen Terme zu diesem Vektor: dα ex × OM + dα dα ex × (ey × OM)
(11)
die sich aus der Vektormultiplikation der rechten Seite von Gl. (10) mit dα ex ergeben, wobei nur die Terme erster Ordnung in dα berücksichtigt werden. Also haben wir Rex (dα) Rey (dα ) Rex (− dα) OM = OM + dα ey × OM + dα dα [ex × (ey × OM) − ey × (ex × OM)]
(12)
Der Vektor OM ist schließlich proportional zu der Summe des soeben erhaltenen Vek tors und seinem Vektorprodukt mit − dα ey . Zur ersten Ordnung in dα ergibt dieses Vektorprodukt − dα ey × OM
(13)
womit wir erhalten Rey (− dα ) Rex (dα) Rey (dα ) Rex (− dα) OM = OM + dα dα [ex × (ey × OM) − ey × (ex × OM)]
(14)
Die zweifachen Vektorprodukte lassen sich leicht berechnen; es ergibt sich Rey (− dα ) Rex (dα) Rey (dα ) Rex (− dα) OM = OM + dα dα ez × OM = Rez (dα dα ) OM
(15)
Damit ist Gl. (8) bewiesen, da diese Beziehung für jeden beliebigen Vektor OM erfüllt ist.
Drehimpuls und Drehungen
| 693
•
3 Drehoperatoren im Zustandsraum. Teilchen ohne Spin In diesem Abschnitt betrachten wir das physikalische System eines einzelnen (spin losen) Teilchens im dreidimensionalen Raum.
3-a Existenz und Definition von Drehoperatoren Der quantenmechanische Zustand des Teilchens zu einem bestimmten Zeitpunkt wird durch den Vektor |ψ⟩ im Zustandsraum Hr beschrieben, zu dem die Wellenfunktion ψ(r) = ⟨r|ψ⟩ gehört. Wir wollen eine Drehung dieses Systems durchführen, bei der der Raumpunkt r0 (x0 , y0 , z0 ) in den Punkt r0 (x0 , y0 , z0 ) übergeht: r0 = R r0
(16)
Der Zustandsvektor des Systems nach der Rotation sei |ψ ⟩ und die zugehörige Wel lenfunktion ψ (r) = ⟨r|ψ ⟩. Dabei nehmen wir an, dass der Wert der ursprünglichen Wellenfunktion ψ(r) im Punkt r0 nach der Drehung gleich dem Wert der Wellenfunk tion ψ (r) in dem durch Gl. (16) gegebenen Punkt r0 ist: ψ (r0 ) = ψ(r0 )
(17)
d. h. ψ (r0 ) = ψ(R−1 r0 ) Da diese Beziehung für jeden beliebigen Raumpunkt der Form schreiben
(18) r0
gilt, können wir sie auch in
ψ (r) = ψ(R−1 r)
(19)
Der räumlichen Drehung R wird der im Zustandsraum wirkende Drehoperator R zugeordnet. Man definiert ihn als den Operator, der den Zustand |ψ⟩ vor der Drehung in den Zustand |ψ ⟩ nach der Drehung R transformiert: |ψ ⟩ = R |ψ⟩
(20)
In der Ortsdarstellung wird seine Wirkung durch Gl. (19) beschrieben: ⟨r | R | ψ⟩ = ⟨R−1 r | ψ⟩
(21)
wobei |R−1 r⟩ den Basisvektor dieser Darstellung bezeichnet, der durch die Kompo nenten des Vektors R−1 r gekennzeichnet ist. Bemerkung: Wenn der Zustand des Teilchens nach der Drehung eiθ |ψ ⟩ (mit einer beliebigen reellen Zahl θ) anstelle von |ψ ⟩ lautete, blieben seine physikalischen Eigenschaften ungeändert. Gleichung (17) könnte also durch ψ (r0 ) = eiθ ψ(r0 )
(22)
ersetzt werden. Dabei wäre θ offenbar unabhängig von r0 , könnte aber von der Drehung R ab hängen. Auf dieses Problem wollen wir hier jedoch nicht eingehen.
•
694 | Ergänzung BVI
3-b Eigenschaften des Drehoperators R α Der Operator R ist linear Diese grundlegende Eigenschaft von Drehoperatoren ergibt sich aus ihrer Definition: Wenn es sich bei dem Zustand |ψ⟩ vor der Drehung um eine lineare Überlagerung von Zuständen handelt, z. B. |ψ⟩ = λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩
(23)
so folgt aus Gl. (21) ⟨r | R | ψ⟩ = λ1 ⟨R−1 r | ψ1 ⟩ + λ2 ⟨R−1 r | ψ2 ⟩ = λ1 ⟨r | R | ψ1 ⟩ + λ2 ⟨r | R | ψ2 ⟩
(24)
Da diese Beziehung für jeden beliebigen Vektor der {|r⟩}-Basis erfüllt ist, können wir schließen, dass R ein linearer Operator ist: R |ψ⟩ = R [λ1 |ψ1 ⟩ + λ2 |ψ2 ⟩] = λ1 R |ψ1 ⟩ + λ2 R |ψ2 ⟩
(25)
β Der Operator R ist unitär Der Ketvektor |ψ⟩ in Gl. (21) ist beliebig. Die Wirkung des Operators R auf den Bravek tor ⟨r| wird demnach gegeben durch ⟨r| R = ⟨R−1 r|
(26)
Die hermitesche Konjugation beider Seiten von Gl. (26) führt dann auf R† |r⟩ = |R−1 r⟩
(27)
Erinnern wir uns weiterhin, dass der Vektor |r⟩ einen Zustand darstellt, in dem das Teilchen vollständig am Ort r lokalisiert ist, so folgt R |r⟩ = |Rr⟩
(28)
Diese Beziehung besagt einfach, dass das Teilchen, das sich vor der Drehung im Punkt r befand, nach der Drehung im Punkt r = Rr zu finden ist. Um Gl. (28) aus Gl. (21) abzuleiten, wählen wir für |ψ⟩ einen Basiszustand |r0 ⟩: ⟨r | R | r0 ⟩ = ⟨R−1 r | r0 ⟩ = δ [(R−1 r) − r0 ]
(29)
wobei wir die Orthonormalitätsrelation der {|r⟩}-Basis verwendet haben. Außerdem gilt⁴ δ [(R−1 r) − r0 ] = δ [r − (Rr0 )]
(30)
4 Gleichung (30) kann anhand der Definition der Deltafunktion leicht bewiesen werden, da bei einer Drehung das infinitesimale Volumenelement invariant bleibt.
Drehimpuls und Drehungen
| 695
•
Wir setzen Gl. (30) in (29) ein und erhalten ⟨r | R | r0 ⟩ = δ [r − (Rr0 )] = ⟨r | Rr0 ⟩
(31)
d. h. also, da {|r⟩} eine Basis von Hr ist, R |r0 ⟩ = |Rr0 ⟩
(32)
Ausgehend von Gl. (27) und (28) zeigt man leicht, dass RR† = R† R = 1
(33) RR†
R† R
gilt; die Wirkung von oder nämlich eben diesen Vektor, z. B.
auf einen beliebigen Vektor der {|r⟩}-Basis ergibt
RR† |r⟩ = R |R−1 r⟩ = |RR−1 r⟩ = |r⟩
(34)
Der Operator R ist somit unitär. Bemerkung: Bei Anwendung des Operators R bleiben also das Skalarprodukt und die Norm der Vektoren er halten: |ψ ⟩ = R |ψ⟩ |φ ⟩ = R |φ⟩
}
⇒
⟨φ |ψ ⟩ = ⟨φ|ψ⟩
(35)
Diese Eigenschaft ist aus physikalischer Sicht sehr wichtig, da die Wahrscheinlichkeitsamplitu den, die die physikalischen Vorhersagen liefern, die Form eines Skalarprodukts von zwei Ketvek toren haben.
γ Die Menge der Operatoren R ist eine Darstellung der Drehgruppe Wir haben in § 2 festgestellt, dass die räumlichen Drehungen eine Gruppe bilden; ins besondere ist das Produkt von zwei Drehungen R1 und R2 wieder eine Drehung: R1 R2 = R3
(36)
Den drei räumlichen Drehungen R1 , R2 und R3 sind im Zustandsraum Hr drei Drehoperatoren R1 , R2 bzw. R3 zugeordnet. Für räumliche Drehungen, die Gl. (36) erfüllen, wollen wir zeigen, dass R2 R1 = R3
(37)
gilt (R2 R1 ist ein Produkt von Operatoren in Hr , wie in Kap. II, § B-3-a definiert). Wir betrachten ein Teilchen, dessen Zustand durch einen beliebigen Basisvektor |r⟩ gegeben ist. Führen wir die Drehung R1 aus, so geht sein Zustand nach Definition von R1 in R1 |r⟩ = |R1 r⟩
(38)
über. Nun führen wir an diesem neuen Zustand die Drehung R2 aus; der Zustand des Teilchens nach der zweiten Drehung lautet nach Gl. (38) und der Definition von R2 R2 R1 |r⟩ = R2 |R1 r⟩ = |R2 R1 r⟩
(39)
•
696 | Ergänzung BVI
Mit Gl. (36) sehen wir, dass diese Gleichung äquivalent ist zu R2 R1 |r⟩ = |R3 r⟩
(40)
Für den Operator R3 , der der Drehung R3 zugeordnet ist, gilt aber R3 |r⟩ = |R3 r⟩
(41)
da der betrachtete Vektor |r⟩ willkürlich aus den Vektoren der Basis {|r⟩} gewählt wer den kann, ist Gl. (37) damit bewiesen. Liegt diese soeben gezeigte wichtige Eigenschaft vor, so sagt man, die Abbildung R → R zwischen räumlichen Drehungen und Drehoperatoren erhält die Gruppenei genschaft, oder die Menge der Operatoren R bildet eine Darstellung der Drehgruppe. Der Einheitsdrehung wird dabei natürlich der Einheitsoperator in Hr zugeordnet, und der Drehung R−1 (dem Inversen einer Drehung R) entspricht der Operator R−1 , das Inverse des zu R gehörenden Operators (wir haben oben gezeigt, dass R−1 = R† gilt).
3-c Drehoperatoren und Drehimpulsobservable α Infinitesimale Drehoperatoren Zunächst betrachten wir eine infinitesimale Drehung Rez (dα) um die z-Achse. Wen den wir diese Drehung auf ein Teilchen an, dessen Zustand durch die Wellenfunktion ψ(r) beschrieben wird, so besagt Gl. (19), dass die Wellenfunktion ψ (r) des Teilchens nach der Drehung die folgende Relation erfüllt: ψ (r) = ψ [R−1 ez (dα)r]
(42)
Der Ausdruck R−1 ez (dα)r kann aus Gl. (6) leicht berechnet werden, wenn x, y, z die Komponenten von r bezeichnen: R−1 ez (dα)r
x + y dα = R−ez (dα)r = r − dα ez × r = (y − x dα ) z
(43)
Gleichung (42) lässt sich dann in der Form schreiben ψ (x, y, z) = ψ(x + y dα, y − x dα, z)
(44)
was in erster Ordnung in dα ergibt ∂ψ ∂ψ −x ] ∂x ∂y ∂ ∂ −y ] ψ(x, y, z) = ψ(x, y, z) − dα [x ∂y ∂x
ψ (x, y, z) = ψ(x, y, z) + dα [y
(45)
Drehimpuls und Drehungen | 697
•
In der Klammer erkennen wir bis auf den Faktor ℏ/i den Ausdruck für den Operator L z = XP y − YP x in der Ortsdarstellung wieder; das Ergebnis lautet also ψ (r) = ⟨r|ψ ⟩ = ⟨r | (1 −
i dα L z ) | ψ⟩ ℏ
(46)
Nach der Definition des zur Drehung Rez (dα) gehörenden Operators Rez (dα) erhalten wir daraus |ψ ⟩ = Rez (dα) |ψ⟩
(47)
Da der Anfangszustand |ψ⟩ beliebig ist, ergibt sich schließlich Rez (dα) = 1 −
i dα L z ℏ
(48)
Die vorstehenden Überlegungen können leicht auf eine infinitesimale Drehung um eine beliebige Achse übertragen werden. Allgemein gilt dann Ru (dα) = 1 −
i dα L ⋅ u ℏ
(49)
Bemerkung: Gleichung (46) kann auch leicht bewiesen werden, wenn man Kugelkoordinaten (r, θ, φ) verwen det; der Operator L z entspricht dann der Ableitung (ℏ/i)∂/∂φ.
β Interpretation der Drehimpulsvertauschungsrelationen Wie sieht das „Bild“ der Relation (8) im Zustandsraum Hr aus? Mit den in § 3-b-γ erhal tenen Ergebnissen besagt diese Relation in erster Ordnung in den beiden Winkeln dα und dα [1 +
i i i i i dα L y ] [1 − dα L x ] [1 − dα L y ] [1 + dα L x ] = 1 − dα dα L z (50) ℏ ℏ ℏ ℏ ℏ
Entwickeln wir die rechte Seite dieser Gleichung und setzen die Koeffizienten vor dα dα gleich, so reduziert sie sich auf [L x , L y ] = iℏ L z
(51)
Die beiden anderen Vertauschungsrelationen für die Komponenten von L ergeben sich natürlich entsprechend, indem man die Vektoren ex , ey und ez zyklisch vertauscht. Die Vertauschungsrelationen des Bahndrehimpulses eines Teilchens können al so als Folge der nichtkommutativen Struktur der räumlichen Drehgruppe verstanden werden.
•
698 | Ergänzung BVI
γ Endliche Drehoperatoren Wir betrachten nun eine Drehung Rez (α) mit einem beliebigen Winkel α um die z-Achse. Nach Gl. (7) muss der dazu gehörende Operator Rez (α) die Beziehung Rez (α + dα) = Rez (α) Rez (dα)
(52)
erfüllen, wobei die beiden Operatoren auf der rechten Seite vertauschen. Den Aus druck für Rez (dα) kennen wir; also können wir Rez (α + dα) = Rez (α) [1 −
i dα L z ] ℏ
(53)
d. h. i Rez (α + dα) − Rez (α) = − dα Rez (α) L z ℏ
(54)
schreiben. Wieder vertauschen Rez (α) und L z . Obwohl wir es hier mit Operatoren zu tun haben, ist die Lösung von Gl. (54) dieselbe, als betrachteten wir eine normale Funktion der Variablen α: Rez (α) = e−iαL z /ℏ
(55)
Wenn wir uns daran erinnern (Ergänzung BII , § 4), dass die Exponentialfunktion eines Operators durch die entsprechende Potenzreihe definiert ist, lässt sich leicht zeigen, dass der Ausdruck (55) eine Lösung von Gl. (54) ist. Die „Integrationskonstante“ muss dabei gleich eins sein, da gilt Rez (0) = 1
(56)
Wie oben kann das Ergebnis auf endliche Drehungen um eine beliebige Drehachse verallgemeinert werden: Ru (α) = e−iαL⋅u/ℏ
(57)
Bemerkungen: 1. Gleichung (57) lautet ausgeschrieben R u (α) = e−iα(L x u x +L y u y +L z u z )/ℏ
(58)
wobei u x , u y und u z die Komponenten des Einheitsvektors u sind. Da L x , L y und L z nicht vertau schen, haben wir allerdings zu beachten, dass R u (α) ≠ e−iαL x u x /ℏ e−iαL y u y /ℏ e−iαL z u z /ℏ
(59)
2. Aus Gl. (57) lässt sich entnehmen, dass der Operator R u (α) unitär ist. Da die Komponenten von L hermitesch sind, gilt zunächst [R u (α)]† = eiαL⋅u/ℏ
(60)
Drehimpuls und Drehungen |
699
•
und damit (L ⋅ u vertauscht offenbar mit sich selbst) [R u (α)]† R u (α) = R u (α) [R u (α)]† = 1
(61)
3. Für den speziellen Fall in diesem Abschnitt ergibt sich R u (2π) = 1
(62)
Wir beschränken uns darauf, diese Aussage für eine Drehung von 2π um die z-Achse zu bewei sen (die Verallgemeinerung des Beweises macht keine Schwierigkeiten): Wir betrachten einen beliebigen Vektor |ψ⟩ und entwickeln ihn in einer Basis aus Eigenvektoren der Observablen L z : |ψ⟩ = ∑ c m,τ |m, τ⟩
(63)
m,τ
mit L z |m, τ⟩ = mℏ |m, τ⟩
(64)
(τ steht für die zusätzlichen Indizes, die zur Kennzeichnung der Basisvektoren notwendig sind; diese Basis kann z. B. eine Standardbasis {|k, l, m⟩} sein, wie wir sie in § C-3 von Kapitel VI ein geführt haben). Die Wirkung des Operators R ez (α) auf diesen Vektor ist dann R ez (α) |ψ⟩ = ∑ c m,τ e−iαL z /ℏ |m, τ⟩ m,τ
= ∑ c m,τ e−iαm |m, τ⟩
(65)
m,τ
Nun wissen wir, dass für den Bahndrehimpuls eines Teilchens m stets ganzzahlig ist. Wenn α also den Wert 2π annimmt, sind alle Faktoren e−iαm gleich 1 und damit R ez (2π) |ψ⟩ = ∑ c m,τ |m, τ⟩ = |ψ⟩
(66)
m,τ
Da diese Beziehung für alle |ψ⟩ erfüllt ist, schließen wir, dass R ez (2π) der Einheitsoperator ist. Aus dem vorstehenden Beweis wird deutlich, dass Gl. (62) nicht gilt, wenn auch halbzahlige Wer te von m möglich sind. Wir werden in Ergänzung AIX sehen, dass für einen Spin 1/2 der Opera tor zu einer Drehung um 2π gleich −1 und nicht gleich 1 ist; dieses Ergebnis hängt damit zu sammen, dass wir die endlichen Drehungen aus infinitesimalen Drehungen konstruiert haben (s. Fußnote 3).
4 Drehoperatoren für ein beliebiges System Wir wollen unsere Überlegungen verallgemeinern.
4-a Ein System aus mehreren spinlosen Teilchen Die Argumentation in § C-3 lässt sich ohne Schwierigkeiten auf Systeme erweitern, die aus mehreren spinlosen Teilchen bestehen; wie man dabei vorgeht, wollen wir kurz am Beispiel eines Systems von zwei spinlosen Teilchen (1) und (2) zeigen. Der Zustandsraum des Systems ist das Tensorprodukt der Zustandsräume Hr1 und Hr2 der beiden Teilchen: H = Hr1 ⊗ Hr2
(67)
•
700 | Ergänzung BVI
Wir verwenden hier dieselbe Bezeichnung wie in Kap. II, § F-4-b. Unter Verwendung der Orts- und Impulsobservablen (R1 und P1 bzw. R2 und P2 ) definieren wir die Ein zeldrehimpulse der beiden Teilchen: L1 = R1 × P1 L2 = R2 × P2
(68)
Sowohl die Komponenten von L1 als auch die von L2 erfüllen die charakteristischen Vertauschungsrelationen für Drehimpulse. Wir betrachten einen Vektor, bei dem es sich um das Tensorprodukt eines Vektors aus Hr1 und eines Vektors aus Hr2 handelt: |ψ⟩ = |φ(1)⟩ ⊗ |χ(2)⟩
(69)
|ψ⟩ beschreibt den Zustand des Systems, bei dem sich Teilchen (1) im Zustand |φ(1)⟩ und Teilchen (2) im Zustand |χ(2)⟩ befindet. Wenn wir dieses Zwei-Teilchen-System mit dem Winkel α um u drehen, so geht es in den Zustand über, in dem die beiden Teilchen in den „gedrehten Zuständen“ |φ (1)⟩ und |χ (2)⟩ sind: |ψ ⟩ = |φ (1)⟩ ⊗ |χ (2)⟩ = [R1u (α) |φ(1)⟩] ⊗ [R2u (α) |χ(2)⟩]
(70)
wobei R1u (α) und R2u (α) die Drehoperatoren in Hr1 und Hr2 sind: R1u (α) = e−iαL1 ⋅u/ℏ
(71a)
−iαL2 ⋅u/ℏ
(71b)
R2u (α)
=e
Gleichung (70) kann nach der Definition des Tensorprodukts aus zwei Operatoren (Kap. II, § F-2-b) auch so geschrieben werden: |ψ ⟩ = [R1u (α) ⊗ R2u (α)] |φ(1)⟩ ⊗ |χ(2)⟩
(72)
Da es sich bei jedem Vektor aus H um eine Linearkombination entsprechend zu Gl. (69) handelt, lautet also das Ergebnis |ψ ⟩ der Drehung eines beliebigen Vektors |ψ⟩ aus H |ψ ⟩ = [R1u (α) ⊗ R2u (α)] |ψ⟩
(73)
Aus den Ergebnissen in Gl. (F-14) von Kapitel II und weil L1 und L2 vertauschen (diese Operatoren wirken auf verschiedene Teilchen), erhalten wir also für den Drehoperator in H R1u (α) ⊗ R2u (α) = e−iαL1 ⋅u/ℏ e−iαL2 ⋅u/ℏ = e−iαL⋅u/ℏ
(74)
worin L = L1 + L2
(75)
der Gesamtdrehimpuls des Zwei-Teilchen-Systems ist. Alle Beziehungen des vorher gehenden Abschnitts bleiben also gültig, wenn L den Gesamtdrehimpuls des Systems darstellt.
Drehimpuls und Drehungen | 701
•
Bemerkungen: 1. Der Operator L wirkt in H. Streng genommen bezeichnet L1 in Gl. (75) die Erweiterung des in Hr1 wirkenden Operators auf H (analog für L2 ); zur Vereinfachung der Bezeichnung wollen wir je doch für L1 und seine Erweiterung auf H keine unterschiedlichen Symbole verwenden (s. Kap. II, § F-2-c). 2. Wir könnten Drehungen betrachten, die nur eins der beiden Teilchen betreffen, etwa Teil chen (1). Unter einer solchen „teilweisen Drehung“ geht ein Vektor wie in Gl. (69) in [R 1u (α) |φ(1)⟩] ⊗ |χ(2)⟩
(76)
über; es wird also nur der Zustand von Teilchen (1) geändert. Analog zu oben lässt sich zeigen, dass die Wirkung einer Drehung, die nur Teilchen (1) betrifft, auf einen beliebigen Zustand |ψ⟩ von H durch den Operator R 1u (α) ⊗ 𝟙(2) = e−iαL1 ⋅u/ℏ
(77)
beschrieben wird, wobei 𝟙(2) der Einheitsoperator in Hr2 ist [in Gl. (77) wirkt L1 in H].
4-b Ein beliebiges System Den Ausgangspunkt für die bisherigen Überlegungen stellt Gl. (19) dar, die die Trans formationsvorschrift für den Zustandsvektor des Systems anhand seiner Wellenfunk tion angibt. Für den Fall eines beliebigen quantenmechanischen Systems (das nicht unbedingt ein klassisches Analogon besitzt) kann man nicht in derselben Weise vor gehen. Zum Beispiel bilden für ein Teilchen mit Spin die Operatoren X, Y und Z keinen vollständigen Satz kommutierender Observabler mehr, und der Zustand des Systems kann nicht durch eine Wellenfunktion ψ(x, y, z) definiert werden (s. Kapi tel IX). Man hat also direkt den Zustandsraum H des Systems zu betrachten. Ohne in Einzelheiten zu gehen, wollen wir hier annehmen, jeder beliebigen räumlichen Drehung R des Systems lasse sich ein in H wirkender Operator R zuordnen; wenn sich das System anfangs im Zustand |ψ⟩ befindet, wird es durch die Drehung R in den Zustand |ψ ⟩ = R |ψ⟩
(78)
überführt, wobei der Operator R linear und unitär ist (s. die Bemerkung in § 3-b-β). Die Gruppeneigenschaft der Drehungen R wird durch die Operatoren R erhal ten, allerdings nur lokal: Das Produkt aus zwei räumlichen Drehungen, von denen mindestens eine infinitesimal ist, wird im Zustandsraum H durch das Produkt der entsprechenden Operatoren R dargestellt (woraus insbesondere folgt, dass das „Bild“ einer Drehung um einen Winkel null der Einheitsoperator ist). Bei dem Operator, der der räumlichen Drehung um den Winkel 2π entspricht, handelt es sich jedoch nicht notwendig um den Einheitsoperator (s. Bemerkung 3 in § 3-c-γ und Ergän zung AIX ).
•
702 | Ergänzung BVI
Wir betrachten nun eine infinitesimale Drehung Rez (dα) um die z-Achse. Da die Gruppeneigenschaft für infinitesimale Drehungen erhalten bleibt, ist der Operator Rez (dα) notwendig von der Form Rez (dα) = 1 −
i dα J z ℏ
(79)
wobei J z ein hermitescher Operator ist, da Rez (dα) unitär ist (s. Ergänzung CII , § 3). Diese Beziehung stellt die Definition für J z dar. Entsprechend lassen sich die hermi teschen Operatoren J x und J y einführen, indem man infinitesimale Drehungen um die x- bzw. y-Achse betrachtet. Der Gesamtdrehimpuls des Systems wird dann durch seine drei Komponenten J x , J y und J z definiert. Wir übernehmen nun die Überlegungen aus § 3-c-β: Aus der geometrischen Bezie hung (8) folgt, dass die Komponenten von J Vertauschungsrelationen erfüllen, die mit den Relationen für Drehimpulse identisch sind. Der Gesamtdrehimpuls eines beliebi gen quantenmechanischen Systems hängt also mit den entsprechenden Drehopera toren zusammen; daraus folgen die Vertauschungsrelationen für seine Komponenten unmittelbar. Wir können sie daher wie in Kap. VI, § B-2 zur Charakterisierung eines beliebigen Drehimpulses verwenden. Schließlich wollen wir zeigen, dass der Operator Ru (dα) einer beliebigen infini tesimalen Drehung (die Komponenten des Vektors u sind u x , u y , u z ) mit Hilfe dieser soeben definierten Operatoren J x , J y und J z in der Form Ru (dα) = 1 −
i dα (J x u x + J y u y + J z u z ) ℏ
(80)
und zusammengefasst Ru (dα) = 1 −
i dα J ⋅ u ℏ
(81)
geschrieben werden kann. Gleichung (80) ist einfach eine Folge der geometrischen Beziehung Ru (dα) = Rex (u x dα) Rey (u y dα) Rez (u z dα)
(82)
sie gilt in erster Ordnung in dα und ergibt sich direkt aus Gl. (6). Wir haben somit die Ausdrücke (48) und (49) für infinitesimale Drehoperatoren verallgemeinert. Da die Gruppeneigenschaft lokal erhalten bleibt, behalten Gl. (52) und die sich anschließende Überlegung ihre Gültigkeit. Folglich sind die Ausdrücke für endliche Drehoperatoren analog zu Gl. (55) und Gl. (57): Ru (α) = e−iαJ⋅u/ℏ
(83)
Drehimpuls und Drehungen
| 703
•
5 Drehung von Observablen Wir wissen nun, wie sich der Zustandsvektor eines Systems bei Drehungen transfor miert. In der Quantenmechanik werden jedoch der Zustand eines Systems und die physikalischen Größen unabhängig voneinander beschrieben. Wir wollen daher un tersuchen, wie sich Observable unter Drehungen verhalten. 5-a Die allgemeine Transformationsvorschrift Wir betrachten die Observable A eines bestimmten physikalischen Systems; dabei nehmen wir der Einfachheit halber an, dass das Spektrum von A diskret und nicht entartet ist: A |u n ⟩ = a n |u n ⟩
(84)
Um zu verstehen, wie diese Observable von einer Drehung beeinflusst wird, stellen wir uns eine Messapparatur vor, mit der wir die Observable A beobachten können. Man definiert dann: Die transformierte Observable A ist die Größe, die das Instrument misst, nachdem man es der Drehung R unterworfen hat. Wir nehmen an, dass das System sich im Eigenzustand |u n ⟩ von A befindet: Die Messung von A ergibt dann mit Sicherheit a n . Kurz vor der Messung jedoch wenden wir eine Drehung R gleichzeitig auf das System und auf das Messinstrument an; ih re relative Lage wird dabei nicht geändert. Die Observable A, die wir betrachten, be schreibe eine physikalische Größe, die nur mit dem System zusammenhängt, das wir gedreht haben (die also unabhängig ist von anderen Systemen oder Messinstrumen ten, die nicht gedreht wurden). In der neuen Lage wird das Messinstrument dann wie der mit Sicherheit denselben Wert a n ergeben. Nach der Drehung misst das Messinstru ment per Definition A , und das System befindet sich im Zustand |u n ⟩ = R |u n ⟩
(85)
Es muss daher gelten A |u n ⟩ = a n |u n ⟩ → A |u n ⟩ = a n |u n ⟩
(86)
Die Verknüpfung der Gleichungen (85) und (86) ergibt A R |u n ⟩ = a n R |u n ⟩
(87)
d. h. R† A R |u n ⟩ = a n |u n ⟩
(88)
da das Inverse von R gleich R† ist. Die Menge der Vektoren |u n ⟩ bildet eine Basis des Zustandsraums (A ist eine Observable), so dass allgemein gilt R† A R = A
(89)
•
704 | Ergänzung BVI
d. h. A = RAR†
(90)
Für eine infinitesimale Drehung Ru (dα) ergibt der Ausdruck (81), eingesetzt in Gl. (90), in erster Ordnung in dα A = (1 − =A−
i i dα J ⋅ u) A (1 + dα J ⋅ u) ℏ ℏ
i dα [J ⋅ u, A] ℏ
(91)
Bemerkungen: 1. Für ein spinloses Teilchen folgt aus Gl. (90) ⟨r | A | r ⟩ = ⟨r | RAR † | r ⟩
(92)
Mit (26) und (27) erhalten wir also ⟨r | A | r ⟩ = ⟨R−1 r | A | R−1 r ⟩
(93)
Die Transformation, die A in A überführt, entspricht also vollständig der Transformation von |ψ⟩ in |ψ ⟩ [s. Gl. (19)]. 2. Wir betrachten den Fall, dass die Observable A einer klassischen Größe A entspricht; A ist dann eine Funktion der Orte ri und der Impulse pi der Teilchen, aus denen das System besteht. Die Observable A erhält man durch die Anwendung der in Kapitel III angegebenen Quantisie rungsregeln. Wir wissen, wie wir in der klassischen Mechanik die Größe A bestimmen können, die aus A durch eine Drehung R hervorgeht: Wenn A z. B. ein Skalar ist, ist A gleich A; ist A die Komponente einer vektoriellen Größe in Bezug auf eine u-Achse, so ist A gleich der Kompo nente derselben vektoriellen Größe in Bezug auf die Achse, die bei der Rotation aus der u-Achse hervorgeht. Der quantenmechanische Operator, der A entspricht, ergibt sich durch die Anwen dung derselben Quantisierungsregeln wie oben. Man kann zeigen, dass dieser Operator gleich dem Operator A ist, der durch Gl. (90) gegeben wird; das ist schematisch in Abb. 1 dargestellt.
Abb. 1: Verhalten einer klassischen physikalischen Größe A und der zugehörigen Observablen A bei einer Drehung R.
5-b Skalare Observable Eine Observable A heißt skalar, wenn für alle R gilt A = A
(94)
Nach Gl. (91) folgt daraus [A, J] = 0
(95)
eine skalare Observable (oder ein „Skalar“) vertauscht mit den drei Komponenten des Gesamtdrehimpulses.
Drehimpuls und Drehungen |
705
•
Es gibt zahlreiche Beispiele für skalare Observable: J2 ist stets ein Skalar (das folgt, wie wir in Kap. VI, § B-2 sahen, aus den charakteristischen Vertauschungsrela tionen für Drehimpulse); für ein spinloses Teilchen sind die Observablen R2 , P2 und R ⋅ P, die alle klassischen Größen entsprechen, Skalare. Außerdem lässt sich leicht zeigen (s. § 5-c), dass für R2 , P2 und R ⋅ P Gl. (95) erfüllt ist. Später (§ 6) werden wir sehen, dass auch der Hamilton-Operator eines isolierten physikalischen Systems ein Skalar ist.
5-c Vektorielle Observable Eine vektorielle Observable (oder ein „Vektor“) V ist eine Menge von drei Observa blen V x , V y , V z (die kartesischen Komponenten), die sich bei Drehungen in der für Vektoren charakteristischen Weise transformieren: Die Transformierte der Kompo nente V u = V ⋅ u von V in Bezug auf die Achse u (mit Einheitsvektor u) bei einer Drehung R muss gleich der Komponente V u = V ⋅ u von V in Bezug auf die bei der Drehung aus der Achse u resultierenden Achse u sein. Wir betrachten z. B. die Komponente V x dieser Observablen. Wir wollen ihr Ver halten bei infinitesimalen Drehungen um die Koordinatenachsen untersuchen. Eine Drehung um die x-Achse lässt V x offenbar ungeändert; nach Gl. (91) lässt sich das in der Form [J x , V x ] = 0
(96)
ausdrücken. Bei einer Drehung Rey (dα) um die y-Achse ist die Transformierte von V x gleich der durch Gl. (91) gegebenen Observablen (V x ) : i (97) (V x ) = V x − dα [J y , V x ] ℏ V x ist die Komponente von V in Bezug auf die x-Richtung mit dem Einheitsvektor ex . Die Drehung Rey (dα) führt ex in ex über, wobei gilt [s. Gl. (6)] ex = ex + dα ey × ex = ex − dα ez
(98)
Wenn es sich bei V um eine vektorielle Observable handelt, muss (V x ) gleich V ⋅ ex sein: (V x ) = V ⋅ ex − dα V ⋅ ez = V x − dα V z
(99)
Ein Vergleich von (97) und (99) ergibt dann [V x , J y ] = iℏ V z
(100)
Für eine infinitesimale Drehung Rez (dα) um die z-Achse führt eine entsprechende Überlegung auf die Beziehung [J z , V x ] = iℏ V y
(101)
Die Zusammenhänge, die aus den Gleichungen (96), (100) und (101) durch zyklische Vertauschung der Indizes x, y, z hervorgehen, lassen sich beweisen, indem man das
•
706 | Ergänzung BVI
Verhalten von V y und V z unter infinitesimalen Drehungen untersucht. Dies führt auf einen Satz von Gleichungen, der charakteristisch für vektorielle Observable ist; diese Gleichungen stellen sicher, dass bei einer beliebigen infinitesimalen Drehung V ⋅ u in V ⋅ u übergeht, wobei u die Transformierte von u bei der betrachteten Drehung ist. Offenbar ist der Drehimpuls J selbst eine vektorielle Observable; die Gleichun gen (96), (100) und (101) folgen dann aus den charakteristischen Vertauschungsre lationen für Drehimpulse. In einem System, das aus einem spinlosen Teilchen be steht, sind R und P vektorielle Observable, wie sich leicht aus den kanonischen Ver tauschungsrelationen ableiten lässt. Die Vektorbezeichnung, die wir für R, P, L und J verwendet haben, ist somit gerechtfertigt. Bemerkungen: 1. Das Skalarprodukt V ⋅ W von zwei vektoriellen Observablen, das durch die übliche Formel V ⋅ W = Vx Wx + Vy Wy + Vz Wz
(102)
definiert wird, ist ein skalarer Operator. Zum Beweis berechnen wir z. B. den Kommutator von V ⋅ W und J x : [V ⋅ W, J x ] = [V y W y , J x ] + [V z W z , J x ] = V y [W y , J x ] + [V y , J x ] W y + V z [W z , J x ] + [V z , J x ] W z = −iℏ V y W z − iℏ V z W y + iℏ V z W y + iℏ V y W z =0
(103)
Wir haben bereits darauf hingewiesen, dass J2 , R2 , P2 und R ⋅ P skalare Observable sind. 2. In den Beziehungen (96), (100) und (101) tritt der Gesamtdrehimpuls des betrachteten Sys tems auf. Das folgende Beispiel macht die Wichtigkeit dieser Tatsache deutlich: Wenn wir in ei nem Zwei-Teilchen-System L1 anstelle von L = L1 + L2 verwenden würden, wäre R2 eine Menge von drei skalaren Observablen und keine vektorielle Observable.
6 Drehinvarianz Die Bedeutung der Drehungen in der Physik leitet sich im Wesentlichen aus der Tat sache ab, dass physikalische Gesetze drehinvariant sind. Wir werden in diesem Ab schnitt erklären, was damit gemeint ist, und wollen einige Folgerungen angeben.
6-a Invarianz physikalischer Gesetze Wir betrachten ein klassisches oder quantenmechanisches physikalisches System (S), das wir zu einem bestimmten Zeitpunkt einer Drehung R unterwerfen. Wenn wir zur selben Zeit alle anderen Systeme oder Messinstrumente, die das System beeinflussen könnten, ebenfalls drehen, werden die physikalischen Eigenschaften von (S) nicht ge ändert. Das bedeutet, dass die physikalischen Gesetze, denen das System unterliegt, gleich bleiben: Man sagt, die physikalischen Gesetze seien drehinvariant. Diese Ei genschaft ist durchaus nicht selbstverständlich: Es gibt Transformationen – z. B. Ähn
Drehimpuls und Drehungen | 707
•
lichkeitstransformationen⁵ – unter denen physikalische Gesetze nicht invariant sind.⁶ Man sollte deshalb die Drehinvarianz als ein Postulat auffassen, dessen Konsequen zen experimentell gerechtfertigt sind. Mit der Aussage, dass die physikalischen Eigenschaften und das Verhalten eines Systems durch eine zu einem Zeitpunkt t0 erfolgte Drehung nicht beeinflusst werden, trifft man zwei Feststellungen: 1. Die Eigenschaften des Systems verändern sich zu diesem Zeitpunkt nicht (obwohl sich die Beschreibung des Systemzustands und der physikalischen Größen än dert; s. die vorstehenden Abschnitte). In der Quantenmechanik bedeutet das, dass die Transformierte A einer beliebigen Observablen A dasselbe Spektrum hat und auch die Wahrscheinlichkeit, bei einer Messung von A nach der Drehung einen bestimmten Eigenwert dieses Spektrums zu finden, dieselbe ist wie bei einer Mes sung von A vor der Drehung des Systems. Daraus folgt, dass die Operatoren R, die die Drehungen im Zustandsraum beschreiben, linear und unitär oder antilinear und unitär (d. h. antiunitär⁷) sind. 2. Die Zeitentwicklung des Systems wird nicht beeinflusst. Um diese Aussage genau er zu fassen, bezeichnen wir den Zustand des Systems mit |ψ(t0 )⟩; bei einer Dre hung zur Zeit t0 wird dieser Zustand transformiert in |ψ (t0 )⟩ = R |ψ(t0 )⟩
(104)
Aus diesem Zustand lassen wir das System sich frei entwickeln und vergleichen zu einer späteren Zeit t den Zustand |ψ (t)⟩ mit dem Zustand |ψ(t)⟩, in den es sich frei aus |ψ(t0 )⟩ entwickeln würde. Wenn das Verhalten des Systems bei der Drehung nicht geändert wird, muss gelten |ψ (t)⟩ = R |ψ(t)⟩
(105)
d. h. für alle t muss der Zustand |ψ (t)⟩ durch dieselbe Drehung wie in Gl. (104) aus |ψ(t)⟩ hervorgehen. Wenn also |ψ(t)⟩ eine Lösung der Schrödinger-Gleichung ist, muss auch R|ψ(t)⟩ eine Lösung sein: Die Transformierte einer möglichen Be wegung des Systems ist wieder eine mögliche Bewegung. Wir werden im nächsten Abschnitt sehen, dass daraus folgt, dass der Hamilton-Operator des Systems eine skalare Observable ist. 5 Betrachten wir etwa ein Wasserstoffatom: Wenn wir den Abstand zwischen Proton und Elektron mit einer Konstanten λ ≠ 1 multiplizieren (ohne die Massen und Ladungen der Teilchen zu verändern), ergibt sich ein System, dessen Zeitentwicklung weder klassischen noch quantenmechanischen Geset zen gehorcht. 6 Wir weisen außerdem auf die experimentelle Tatsache hin, dass die physikalischen Gesetze des β-Zerfalls von Atomkernen in Bezug auf die Spiegelung an einer Ebene nicht invariant sind (Verletzung der Parität). 7 Alle Transformationen, unter denen physikalische Gesetze invariant sind, werden durch unitäre Operatoren beschrieben; die einzige Ausnahme stellt die Zeitumkehr dar, zu der ein antiunitärer Ope rator gehört.
•
708 | Ergänzung BVI
Die Invarianz physikalischer Gesetze gegenüber Drehungen drückt sich in Symmetrie eigenschaften der Gleichungen aus, mit denen diese Gesetze mathematisch formuliert werden. Um den Ursprung dieser Symmetrien zu verstehen, betrachten wir als Bei spiel ein System aus einem (spinlosen) Teilchen. Dieses System genügt Gesetzen, in die die Parameter r(x, y, z) des Teilchenortes und p(p x , p y , p z ) des Teilchenimpulses explizit eingehen. In der klassischen Mechanik wird der Zustand des Teilchens zu je dem Zeitpunkt durch r und p definiert; in der Quantenmechanik treten sie mit verän derter Bedeutung in der Wellenfunktion ψ(r) und ihrer Fourier-Transformierten ψ(p) auf. Bei einer momentanen Drehung R des Teilchens werden r und p in r und p transformiert: r = Rr p = Rp
(106)
Ersetzen wir in den Gleichungen, mit denen das System beschrieben wird, r durch R−1 r und p durch R−1 p , so gelangen wir zu Beziehungen, in denen r und p auftre ten. Dann bedeutet die Invarianz physikalischer Gesetze in Bezug auf die Drehung R, dass die Gleichungen in r und p dieselbe Form wie in r und p haben: Lässt man die Striche fort, so gelangt man wieder zu den ursprünglichen Gleichungen. Es ist klar, dass dieser Sachverhalt die möglichen Formen der Gleichungen stark einschränkt. Bemerkungen: 1. Was geschieht, wenn wir eine Drehung an einem System ausführen, das nicht isoliert ist? Wir betrachten hierzu ein Teilchen in einem äußeren Potential. Führt man an diesem System eine Drehung aus, ohne zugleich die Quellen des äußeren Potentials zu drehen, so wird die nachfol gende zeitliche Entwicklung des Systems im Allgemeinen eine andere sein.⁸ In der klassischen Mechanik wirken auf das Teilchen in seiner neuen Lage andere Kräfte. In der Quantenmechanik ist ψ (r, t) = ψ(R−1 r, t) eine Lösung der Schrödinger-Gleichung, in der das Potential V(r) durch das im Allgemeinen von ihm verschiedene Potential V(R−1r) ersetzt ist. Also ist die Transformier te einer möglichen Bewegung nicht wieder eine mögliche Bewegung. Das äußere Potential hebt in gewisser Weise die Homogenität des Raumbereichs auf, in dem sich das betrachtete Teilchen bewegt. Nun kann jedoch das äußere Potential Symmetrien aufweisen, die bestimmte Drehungen des physikalischen Systems erlauben, ohne dass dadurch sein Verhalten geändert würde. Gibt es al so Drehungen R0 , für die V(R−1 0 r) gleich V(r) ist, so bleiben die Eigenschaften des Systems bei
8 Befindet sich das Teilchen in einem Vektorpotential, so können seine Eigenschaften unmittelbar nach der Drehung grundlegend verschieden sein. Betrachten wir z. B. ein spinloses Teilchen in einem äußeren Magnetfeld: Nach dem Transformationsgesetz (19) lässt sich der Wahrscheinlichkeitsstrom [s. Kap. III, Gl. (D-20)] im Allgemeinen nicht aus einer Drehung des ursprünglichen Stroms herleiten, da er vom magnetischen Vektorpotential abhängt. Physikalisch lässt sich dies wie folgt verstehen: Wir stellen uns vor, das wir anstelle des Teilchens das Magnetfeld so rasch in der entgegengesetzten Richtung drehen, dass für die Änderung der Wellen funktion keine Zeit bleibt; diesem Fall entspricht Gl. (19). Die physikalischen Eigenschaften ändern sich, weil ein elektrisches Feld induziert wird und auf das Teilchen wirkt. Dabei kommt es auf die Einzelheiten der Drehung des Magnetfeldes nicht an, falls diese nur schnell genug erfolgt.
Drehimpuls und Drehungen |
709
•
diesen Drehungen ungeändert. Dieser Fall liegt z. B. bei Zentralpotentialen vor, d. h. bei Poten tialen, die nur vom Abstand zu einem festen Punkt O abhängen: Die Drehungen R0 werden dann durch sämtliche Drehungen gegeben, die den Punkt O unverändert lassen (s. Kapitel VII). 2. Wir kehren zu einem isolierten physikalischen System zurück. Bisher haben wir hier den „akti ven“ Standpunkt eingenommen: Der Beobachter bleibt fest, und das physikalische System wird gedreht. Es lässt sich aber auch ein „passiver“ Standpunkt einnehmen: Der Beobachter dreht sich und verwendet bei der Beschreibung des unveränderten physikalischen Systems ein neu es, gegenüber dem ursprünglichen gedrehtes Koordinatensystem. Drehinvarianz heißt dann: In der neuen Lage (d. h. mit den neuen Koordinaten) beschreibt der Beobachter die Phänomene mit Gesetzen, die dieselbe Form wie in dem alten Bezugssystem haben. Kein Bezugssystem ist vor dem anderen ausgezeichnet; es gibt kein absolutes System. Offenbar besteht für ein isoliertes physikalisches System eine Äquivalenz zwischen einer „passiven“ Drehung und einer „aktiven“ Drehung (mit demselben Winkel um die entgegengesetzt orientierte Achse).
6-b Folgerung: Erhaltung des Drehimpulses Wie wir eben sahen, führt die Drehinvarianz zu bestimmten Symmetrieeigenschaften der Bewegungsgleichungen. Wir wollen hier die Schrödinger-Gleichung untersuchen und zeigen, dass der Hamilton-Operator eines isolierten Systems eine skalare Obser vable ist. Wir betrachten also ein isoliertes System im Zustand |ψ(t0 )⟩. Zur Zeit t0 führen wir eine beliebige Drehung R aus; der Zustand des Systems wird dann zu |ψ (t0 )⟩ = R |ψ(t0 )⟩
(107)
wobei R das „Bild“ der Drehung R ist. Wenn sich das System nun aus dem Zustand |ψ (t0 )⟩ frei entwickelt, ist sein Zustand zur Zeit t0 + dt |ψ (t0 + dt)⟩ = |ψ (t0 )⟩ +
dt H |ψ (t0 )⟩ iℏ
(108)
Ohne diese Drehung würde der Zustand |ψ(t0 + dt)⟩ = |ψ(t0 )⟩ +
dt H |ψ(t0 )⟩ iℏ
(109)
lauten. Drehinvarianz bedeutet nun, dass |ψ (t0 + dt)⟩ = R |ψ(t0 + dt)⟩
(110)
sein muss. Hieraus erhalten wir RH |ψ(t0 )⟩ = H |ψ (t0 )⟩
(111)
d. h. RH |ψ(t0 )⟩ = HR |ψ(t0 )⟩
(112)
•
710 | Ergänzung BVI
Der Zustand |ψ(t0 )⟩ ist beliebig; darum vertauscht H mit sämtlichen Drehoperatoren. Dafür ist notwendig und hinreichend, dass H mit den infinitesimalen Drehoperatoren, also mit den drei Komponenten des Gesamtdrehimpulses J des Systems vertauscht: [H, J] = 0
(113)
H ist demnach eine skalare Observable und die Drehimpulserhaltung eine Folge der Drehinvarianz. Bemerkungen: 1. Der Hamilton-Operator eines nichtisolierten Systems ist im Allgemeinen kein Skalar. Wenn das System jedoch unter bestimmten Drehungen invariant ist (s. Bemerkung 1 in § 6-a), so ver tauscht der Hamilton-Operator mit den entsprechenden Operatoren. Der Hamilton-Operator ei nes Teilchens in einem Zentralpotential vertauscht daher mit dem Operator L, der den Drehim puls des Teilchens bezüglich des Kraftzentrums angibt. 2. Der Hamilton-Operator eines Systems, das aus mehreren miteinander wechselwirkenden Teil chen besteht, vertauscht mit dem Gesamtdrehimpuls des Systems. Er wird im Allgemeinen je doch nicht mit den Einzeldrehimpulsen der Teilchen vertauschen. Damit die Transformation einer möglichen Bewegung wieder zu einer möglichen Bewegung führt, muss die Drehung am gesam ten System ausgeführt werden, und nicht nur an einigen Teilchen.
6-c Anwendungen Wie wir soeben gezeigt haben, folgt aus der Drehinvarianz, dass der Gesamtdrehim puls J eines physikalischen Systems eine Konstante der Bewegung im quantenmecha nischen Sinn ist. Es erweist sich daher als nützlich, die stationären Zustände dieses Systems (also die Eigenzustände des Hamilton-Operators) zu bestimmen, die gleich zeitig Eigenzustände von J2 und J z sind. Wir können dann im Zustandsraum eine Stan dardbasis {|k, j, m⟩} wählen, die aus gemeinsamen Eigenzuständen von H, J2 und J z besteht: H |k, j, m⟩ = E |k, j, m⟩ J2 |k, j, m⟩ = j(j + 1)ℏ2 |k, j, m⟩
(114)
J z |k, j, m⟩ = mℏ |k, j, m⟩ α Wesentliche Drehentartung Da der Hamilton-Operator H eine skalare Observable ist, vertauscht er mit J + und J − . Daraus können wir schließen, dass die Zustände |k, j, m + 1⟩ und |k, j, m − 1⟩, die proportional zu J + |k, j, m⟩ bzw. J − |k, j, m⟩ sind, Eigenzustände von H mit demselben Eigenwert wie von |k, j, m⟩ sind [s. Kap. VI, Gl. (C-48)]. Es lässt sich somit iterativ zei gen, dass die (2j + 1) Vektoren der Standardbasis zu gegebenen Werten von k und j dieselbe Energie haben. Die entsprechende Entartung der Eigenwerte von H wird als wesentlich bezeichnet, weil sie direkt aus der Drehinvarianz folgt und für jede Form
Drehimpuls und Drehungen |
711
•
des Hamilton-Operators H auftritt. Natürlich können die Energieniveaus in einigen Fällen zusätzliche Entartungen aufweisen, die als zufällig bezeichnet werden; ein Bei spiel dafür werden wir in Kapitel VII, § C kennenlernen. β Matrixelemente von Observablen in einer Standardbasis Wir betrachten eine physikalische Größe in einem isolierten System. Wenn wir wis sen, wie sich die entsprechende Observable bei einer Drehung verhält, können wir einige Eigenschaften angeben, ohne ihre genaue Form zu kennen. Wir können vor hersagen, dass nur einige Matrixelemente in einer Standardbasis wie {|k, j, m⟩} von null verschieden sind, und wir können Beziehungen zwischen ihnen angeben. Eine skalare Observable besitzt nichtverschwindende Matrixelemente nur zwischen Basis vektoren, die zu gleichen Werten von j und m gehören (das folgt daraus, dass diese Ob servable mit J2 und J z vertauscht; s. die Theoreme über kommutierende Observable, Kap. II, § D-3-a). Außerdem sind diese nichtverschwindenden Elemente unabhängig von m (da die skalare Observable auch mit J + und J − vertauscht). Für vektorielle oder tensorielle Observable werden diese Eigenschaften durch das Wigner-Eckart-Theorem angegeben, das wir später für einen Spezialfall beweisen werden (s. Ergänzung DX ); dieses Theorem findet in vielen Bereichen der Physik Anwendung, die eine quanten mechanische Behandlung erfordern (Atom-, Molekül- und Kernphysik, Elementarteil chenphysik).
Referenzen und Literaturhinweise Symmetrien und Erhaltungssätze: Feynman, Bd. 5 (1.2), Kap. 17; Schiff (1.18), Kap. 7; Messiah (1.17), Kap. XV; siehe auch die Artikel von Morrisson (2.28), Feinberg und Goldhaber (2.29), Wigner (2.30). Gruppentheorie: Messiah (1.17), Anhang D; Meijer und Bauer (2.18), Kap. 5 und 6; Bacry (10.31), Kap. 6; Wigner (2.23), Kap. 14 und 15. Siehe auch Omnès (16.13), ins besondere Kap. III.
•
712 | Ergänzung CVI
Ergänzung CVI Drehung zweiatomiger Moleküle 1 2 2-a 2-b 2-c 3 3-a 3-b 3-c 4 4-a 4-b
Einleitung | 712 Klassische Behandlung des starren Rotators | 713 Notation | 713 Bewegung des Rotators. Drehimpuls und Energie | 714 Fiktives Teilchen | 714 Quantisierung des starren Rotators | 714 Quantenmechanischer Zustand und Observable des Rotators | 714 Eigenzustände und Eigenwerte des Hamilton-Operators | 716 Untersuchung der Observablen Z | 717 Nachweise für die Rotation von Molekülen | 720 Heteropolare Moleküle. Reines Rotationsspektrum | 720 Homöopolare Moleküle. Raman-Rotationsspektrum | 723
1 Einleitung In § 1 von Ergänzung AV untersuchten wir die Vibrationen der beiden Atomkerne ei nes zweiatomigen Moleküls um ihre Gleichgewichtslage, wobei wir die Rotation der beiden Kerne um ihren Massenmittelpunkt vernachlässigten. Es ergaben sich statio näre Vibrationszustände mit den Energien E v , deren Wellenfunktionen φ v (r) nur vom Abstand r der beiden Kerne abhängen. In dieser Ergänzung wollen wir umgekehrt vorgehen: Wir vernachlässigen die Kernschwingungen und betrachten nur ihre Rotation um den Massenmittelpunkt des Systems. Wir nehmen also an, dass der Abstand r der Kerne konstant gleich dem Ab stand re ist, den die Kerne in der stabilen Gleichgewichtslage des Moleküls annehmen, s. Abb. 1 in Ergänzung AV . Die Wellenfunktionen der stationären Rotationszustände hängen dann nur von den Polarwinkeln θ und φ ab, die die Richtungen der Molekül achsen definieren. Wir werden sehen, dass es sich bei diesen Wellenfunktionen um die Kugelflächenfunktionen Y lm (θ, φ) handelt (die wir in Kap. VI, § D-1 und in Ergän zung AVI behandelt haben), und dass mit ihnen eine Rotationsenergie E l verbunden ist, die nur von l abhängt. In Wirklichkeit führt das Molekül im Ruhesystem des Massenmittelpunkts so wohl Rotationen als auch Vibrationen aus, so dass die Wellenfunktionen seiner sta tionären Zustände Funktionen der drei Variablen r, θ und φ sind. Wir werden in Ergänzung FVII zeigen, dass diese Wellenfunktionen in erster Näherung von der Form (φ v (r)/r)Y lm (θ, φ) sind und ihnen die Energie E v + E l entspricht. Dadurch wird unsere Näherung im Nachhinein gerechtfertigt.¹ Wir beginnen in § 2 mit der klassischen Un
1 In Ergänzung FVII werden wir außerdem die Korrekturen behandeln, die von der Kopplung zwischen Rotations- und Vibrationsfreiheitsgraden herrühren. https://doi.org/10.1515/9783110638738-062
Drehung zweiatomiger Moleküle | 713
•
tersuchung eines Systems aus zwei Massenpunkten mit einem festen Abstand (starrer Rotator). In § 3 folgt dann die quantenmechanische Behandlung, und schließlich be schreiben wir in § 4 einige Nachweise für die Rotation zweiatomiger Moleküle (reine und Raman-Rotationsspektren).
2 Klassische Behandlung des starren Rotators 2-a Notation Zwei Teilchen mit den Massen m1 und m2 seien durch einen festen Abstand re voneinander getrennt. Ihren Massenmittelpunkt wählen wir als Ursprung eines x, y, z-Systems. Darin ist die Verbindungsachse der Teilchen durch die Polarwinkel θ und φ definiert (Abb. 1). Die Strecken OM1 und OM2 bezeichnen wir mit r1 bzw. r2 ; die Definition des Massenmittelpunkts besagt m 1 r1 = m 2 r2
(1)
so dass wir schreiben können r1 r2 re = = m2 m1 m1 + m2
(2)
Abb. 1: Parameter, die die Lage des starren Rotators M 1 M 2 definieren, dessen Massenmittelpunkt im Ursprung O des Koordinatensystems liegt. Die Abstände r1 und r2 liegen fest, nur die Polarwinkel θ und φ können sich verändern.
Das Trägheitsmoment I des Systems bezüglich O ist I = m1 r21 + m2 r22 führen wir die reduzierte Masse ein, m1 m2 μ= m1 + m2 und verwenden Gl. (2), können wir I in der Form schreiben I = μr2e
(3)
(4)
(5)
•
714 | Ergänzung CVI
2-b Bewegung des Rotators. Drehimpuls und Energie Solange keine äußere Kraft auf den Rotator wirkt, ist der Gesamtdrehimpuls 𝓛 des Systems bezüglich O eine Konstante der Bewegung. Der Rotator dreht sich also mit ei ner festen Winkelgeschwindigkeit ωR um O in einer Ebene senkrecht zum festen Vek tor 𝓛. Der Betrag von 𝓛 hängt mit ωR über |𝓛| = m1 r1 r1 ωR + m2 r2 r2 ωR = IωR
(6)
zusammen, d. h. mit Gl. (5) ist |𝓛| = μr2e ωR
(7)
Die Rotationsfrequenz des Systems νR = ωR /2π ist proportional zum Drehimpuls |𝓛| und umgekehrt proportional zum Trägheitsmoment I. Im Ruhesystem des Massenmittelpunkts reduziert sich die Gesamtenergie H des Systems auf die kinetische Rotationsenergie H=
1 2 Iω 2 R
(8)
die sich nach den Gleichungen (6) und (5) auch in der Form H=
𝓛2 𝓛2 = 2I 2μr2e
(9)
schreiben lässt.
2-c Fiktives Teilchen Aus den Gleichungen (5), (7) und (9) ersieht man, dass das hier untersuchte Problem zu dem eines fiktiven Teilchens mit der Masse μ äquivalent ist, das sich in einem festen Abstand re zum Punkt O befindet und um den es mit der Kreisfrequenz ωR rotiert. Der Drehimpuls dieses fiktiven Teilchens bezüglich O ist 𝓛.
3 Quantisierung des starren Rotators 3-a Quantenmechanischer Zustand und Observable des Rotators Da re fest ist, wird die Lage des Rotators (oder die des fiktiven Teilchens) durch die Polarwinkel θ und φ definiert (Abb. 1). Der quantenmechanische Zustand des Rotators wird dann durch eine Wellenfunktion ψ(θ, φ) beschrieben, die nur von diesen beiden Parametern abhängt. Die Funktion ψ(θ, φ) ist quadratintegrabel; wir nehmen sie als
Drehung zweiatomiger Moleküle | 715
•
normiert an: 2π
π
∫ dφ ∫ sin θ dθ |ψ(θ, φ)|2 = 1 0
(10)
0
Die physikalische Bedeutung der Wellenfunktion ψ(θ, φ) folgt aus dem Postulat: Die Wahrscheinlichkeit dafür, dass die Achse des Rotators in die Richtung des Raumwin kelelements dΩ = sin θ dθ dφ um θ und φ zeigt, ist gleich |ψ(θ, φ)|2 sin θ dθ dφ. In der Dirac-Schreibweise ordnen wir jeder quadratintegrablen Funktion ψ(θ, φ) einen Ketvektor |ψ⟩ des Zustandsraums HΩ zu: ψ(θ, φ) ↔ |ψ⟩ ∈ HΩ
(11)
Das Skalarprodukt von |ψ⟩ und |χ⟩ ist per Definition ⟨χ|ψ⟩ = ∫ dΩ χ ∗ (θ, φ) ψ(θ, φ)
(12)
wobei χ(θ, φ) und ψ(θ, φ) die Wellenfunktionen zu |χ⟩ und |ψ⟩ sind. Der quantenmechanische Hamilton-Operator H des Rotators (oder des zugeord neten fiktiven Teilchens) wird erhalten, indem man im Ausdruck (9) die klassische Energie 𝓛2 durch den in Kap. VI, § D behandelten Operator L2 ersetzt: H=
L2 2μr2e
(13)
der Operator H wirkt in HΩ . Gemäß Gl. (D-6a) aus Kap. VI wird H|ψ⟩, wenn wir |ψ⟩ durch die Wellenfunktion ψ(θ, φ) darstellen, durch H |ψ⟩ ←→
−ℏ2 ∂2 1 ∂ ∂2 1 [ + ] ψ(θ, φ) + 2 ∂θ2 2 tan θ ∂θ sin θ ∂φ2 2μre
(14)
ausgedrückt. Andere Observable, die für uns später von Interesse sein werden, entsprechen den drei algebraischen Projektionen x, y, z der Strecke M1 M2 (x, y, z sind außerdem die Koordinaten des fiktiven Teilchens): x = re sin θ cos φ y = re sin θ sin φ
(15)
z = re cos θ Die Bedeutung dieser Variablen werden wir in § 4-a kennenlernen. Die Observablen X, Y, Z, die den Koordinaten x, y, z entsprechen, wirken in HΩ . Den Vektoren X|ψ⟩, Y|ψ⟩, Z|ψ⟩ sind die folgenden Funktionen zugeordnet: X|ψ⟩ ←→ re sin θ cos φ ψ(θ, φ) Y|ψ⟩ ←→ re sin θ sin φ ψ(θ, φ) Z|ψ⟩ ←→ re cos θ ψ(θ, φ)
(16)
•
716 | Ergänzung CVI
Bemerkung: Wir haben bereits in der Einleitung darauf hingewiesen, dass die genauen Wellenfunktionen des Moleküls von r, θ, φ abhängen. Entsprechend wirken die Observablen dieses Moleküls, die sich aus den entsprechenden klassischen Größen mit den Quantisierungsregeln aus Kapitel III erge ben, auf Funktionen von diesen drei Variablen und nicht nur auf Funktionen von θ und φ. In Er gänzung FVII werden wir den hier eingenommenen Standpunkt rechtfertigen, der insbesondere in der Vernachlässigung des Radialanteils der Wellenfunktionen besteht, indem wir r als festen Parameter (mit dem Wert r e ) auffassen [s. die Formeln (14) und (16)].
3-b Eigenzustände und Eigenwerte des Hamilton-Operators In § D von Kapitel VI bestimmten wir die Eigenwerte des Operators L2 : Sie haben die Form l(l + 1)ℏ2 , wobei l eine beliebige nichtnegative ganze Zahl ist. Außerdem ken nen wir bereits ein Orthonormalsystem von Eigenfunktionen von L2 : die Kugelflächen funktionen Y lm (θ, φ), die eine Basis im Raum der quadratintegrablen Funktionen von θ und φ bilden (s. Kap. VI, § D-1-c-β). Den Vektor, der in HΩ zu Y lm (θ, φ) gehört, be zeichnen wir mit |l, m⟩: Y lm (θ, φ) ↔ |l, m⟩
(17)
Aus Gl. (13) folgt H |l, m⟩ =
l(l + 1)ℏ2 |l, m⟩ 2μr2e
(18)
Man setzt üblicherweise B=
ℏ ℏ = 4πI 4πμr2e
(19)
B wird die Rotationskonstante genannt und hat die Dimension einer Frequenz.² Die Eigenwerte von H haben dann die Form E l = Bh l(l + 1)
(20)
Jeder Eigenwert E l ist (2l + 1)-fach entartet, da es zu einem Wert von l genau (2l + 1) Kugelflächenfunktionen Y lm (θ, φ) (m = −l, −l + 1, . . . , l) gibt. In Abb. 2 sind die ersten Energieniveaus des Rotators dargestellt. Der Abstand von zwei benachbarten Niveaus l und l − 1 ist E l − E l−1 = Bh [l(l + 1) − l(l − 1)] = 2Bh l
(21)
er steigt also linear mit l an.
2 Manchmal tritt im Nenner auf der rechten Seite von Gl. (19) zusätzlich die Lichtgeschwindigkeit c auf; B hat dann die Dimension einer inversen Länge und wird in cm−1 angegeben (im CGS-System).
Drehung zweiatomiger Moleküle |
717
•
Abb. 2: Die ersten Niveaus des starren Rotators mit den Energien E l = Bhl(l+1) (l = 0, 1, 2, . . .). Jedes Niveau E l mit l ≥ 1 hat von dem darunter liegenden Niveau den Abstand 2Bhl.
Die Eigenzustände von H erfüllen die folgenden Orthogonalitäts- und Vollständig keitsrelationen [sie folgen aus den entsprechenden Relationen für die Kugelflächen funktionen, s. Kap. VI, § D-1-c-β]: ⟨l, m | l , m ⟩ = δ ll δ mm ∞
+l
∑ ∑ |l, m⟩⟨l, m| = 1
(22)
l=0 m=−l
Ein beliebiger Quantenzustand des Rotators kann nach den Zuständen |l, m⟩ entwi ckelt werden: ∞
+l
|ψ(t)⟩ = ∑ ∑ c l,m (t) |l, m⟩
(23)
l=0 m=−l
Die Komponente c l,m (t) = ⟨l, m | ψ(t)⟩ = ∫ dΩ Y lm∗ (θ, φ) ψ(θ, φ; t)
(24)
ändert sich zeitlich gemäß der Gleichung c l,m (t) = c l,m (0) e−iE l t/ℏ
(25)
3-c Untersuchung der Observablen Z Oben führten wir die Observablen X, Y, Z ein, die den Projektionen der Strecke M1 M2 auf die drei Koordinatenachsen entsprechen. In diesem Abschnitt wollen wir die Zeitentwicklung der Erwartungswerte dieser Observablen untersuchen und die Er gebnisse mit den Vorhersagen der klassischen Mechanik vergleichen. Dabei werden wir uns auf die Berechnung von ⟨Z⟩(t) beschränken, da ⟨X⟩(t) und ⟨Y⟩(t) analoge Eigenschaften aufweisen. Die Bohr-Frequenz (E l − E l )/h kann in der Funktion ⟨Z⟩(t) auftreten, wenn Z ein nichtverschwindendes Matrixelement zwischen dem Zustand |l, m⟩ mit der Energie E l und dem Zustand |l , m ⟩ mit der Energie E l besitzt. Die erste Aufgabe besteht daher in der Bestimmung der nichtverschwindenden Matrixelemente von Z. Zur Lösung ver
•
718 | Ergänzung CVI
wenden wir die folgende Relation, die sich mit Hilfe der mathematischen Eigenschaf ten der Kugelflächenfunktionen beweisen lässt [Gl. (35) aus Ergänzung AVI ]: cos θ Y lm (θ, φ) = √
l2 − m2 m (l + 1)2 − m2 m √ (θ, φ) + Y Y (θ, φ) l−1 4l2 − 1 4(l + 1)2 − 1 l+1
(26)
Daraus erhalten wir mit den Beziehungen (16), (17) und (22) l2 − m2 (l + 1)2 − m2 ] ⟨l , m | Z | m, l⟩ = re δ mm [δ l ,l−1 √ 2 + δ l ,l+1 √ 4l − 1 4(l + 1)2 − m2 [ ]
(27)
Bemerkung: Nach Gl. (27) erfüllt Z die Auswahlregeln ∆l = ±1, ∆m = 0. Es lässt sich zeigen, dass für X und Y gilt ∆l = ±1, ∆m = ±1. Da die Energien nur von l abhängen, sind die Bohr-Frequenzen für ⟨X⟩, ⟨Y⟩ und ⟨Z⟩ gleich.
Der Operator Z kann daher nur Zustände verknüpfen, die zu zwei benachbarten Ni veaus in Abb. 2 gehören (die entsprechenden Übergänge sind in der Abbildung durch vertikale Pfeile angedeutet). Die einzigen Bohr-Frequenzen, die in der Zeitentwicklung von ⟨Z⟩(t) auftreten, sind also von der Form E l − E l−1 = 2Bl (28) ν l,l−1 = h Sie bilden eine Folge äquidistanter Frequenzen, die jeweils den Abstand 2B haben (Abb. 3). Dieses Ergebnis steht im Gegensatz zum klassischen Fall, bei dem die Rota tionsfrequenz νR jeden beliebigen Wert annehmen kann.
Abb. 3: In der zeitlichen Entwicklung des Erwartungswerts der Observablen Z treten aufgrund der Auswahlregel ∆l = ±1 nur die Bohr-Frequenzen 2Bl (mit l ≥ 1) auf, die zu den benachbarten Niveaus E l und E l−1 gehören (s. Abb. 2).
Nach Gl. (27) ist ⟨Z⟩(t), selbst für große l, immer gleich null, wenn sich das System in einem stationären Zustand |l, m⟩ befindet. Um einen quantenmechanischen Zustand zu erhalten, in dem sich ⟨Z⟩ wie die entsprechende klassische Variable z verhält, müs sen wir eine große Anzahl von Zuständen |l, m⟩ überlagern. Der Zustand des Systems wird durch Gl. (23) gegeben. Wenn wir annehmen, dass die Zahlen |c l,m (0)|2 Werte haben, die sich mit l wie in Abb. 4 ändern, so ist der wahrscheinlichste Wert lM von l sehr groß; der absolute Wert der Breite ∆l ist ebenfalls sehr groß, der Relativwert jedoch klein: lM , ∆l ≫ 1
(29a)
∆l/lM ≪ 1
(29b)
•
Drehung zweiatomiger Moleküle | 719
Abb. 4: Betragsquadrate der Koeffizienten in der Entwicklung eines „quasiklassischen“ Zustands nach den stationären Zuständen |l, m⟩ des starren Rotators. Die Breite ∆l ist groß; da der wahrscheinlichste Wert von l, lM , aber sehr groß ist, gilt ∆l/lM ≪ 1 und die relative Genauigkeit von l ist sehr hoch.
Wir können dann zeigen, dass in diesem Zustand gilt ⟨L⟩2 ≈ ⟨L2 ⟩ ≈ lM (lM + 1)ℏ2 ≈ l2M ℏ2
(30)
Außerdem liegen alle in ⟨Z⟩(t) auftretenden Bohr-Frequenzen (relativ) sehr nahe bei νM = 2BlM Wir eliminieren aus (30) und (31) lM und erhalten dann mit Gl. (19) 2B|⟨L⟩| |⟨L⟩| νM ≈ = ℏ 2πI das Analogon zur klassischen Beziehung (6).
(31)
(32)
Bemerkung: Es ist interessant, die Bewegung des Wellenpakets genauer zu untersuchen, das dem Zustand von Abb. 4 entspricht. Es wird durch eine Funktion von θ und φ dargestellt, von der wir annehmen können, dass sie sich zeitlich auf der Einheitskugel entwickelt. Wie die vorstehende Diskussion zeigt, rotiert das Wellenpaket auf dieser Kugel im Mittel mit der Frequenz ν M . Aufgrund der Breite ∆l und der dazu gehörenden Breite 2B∆l der in ⟨X⟩, ⟨Y⟩ und ⟨Z⟩ auftretenden Bohr-Frequenzen wird sich die Form des Wellenpakets während eines Zeitintervalls von der Länge 1 τ≈ (33) 2B∆l merklich ändern. Da die relative Breite von l klein ist, haben wir lM νM τ ≈ ≫1 (34) ∆l Somit verformt sich das Wellenpaket im Vergleich zu seiner Rotation verhältnismäßig langsam. In Wirklichkeit bilden die Bohr-Frequenzen des Systems eine diskrete äquidistante Folge mit dem Abstand 2B. Die Bewegung, die sich aus der Überlagerung dieser Frequenzen ergibt, verläuft damit periodisch, und die Periodendauer beträgt 1 T= (35) 2B nach Gl. (29) gilt dann 1 T≫τ≫ (36) νM Die Verformung des Wellenpakets ist daher nicht irreversibel; sie geschieht vielmehr in einem sich periodisch wiederholenden Zyklus. Das hängt damit zusammen, dass sich das Wellenpaket auf der Einheitskugel, also auf einer beschränkten Oberfläche, entwickelt. Dieses Verhalten kann man mit dem eines freien Wellenpakets (irreversibles Zerfließen; Ergänzung GI ) und dem eines quasiklassischen Zustands des harmonischen Oszillators (Oszillation ohne Verzerrung, s. Ergän zung GV ) vergleichen.
•
720 | Ergänzung CVI
4 Nachweise für die Rotation von Molekülen 4-a Heteropolare Moleküle. Reines Rotationsspektrum α Beschreibung des Spektrums Wenn das Molekül aus zwei verschiedenen Atomen aufgebaut ist, werden die Elek tronen vom Atom mit der größeren Elektronegativität angezogen; daraus resultiert im Allgemeinen ein permanentes elektrisches Dipolmoment d0 des Moleküls in Richtung der Molekülachse. Seine Projektion auf die z-Achse entspricht in der Quantenmecha nik einer Observablen, die zu Z proportional ist. Wie wir gesehen haben, treten in der zeitlichen Entwicklung von ⟨Z⟩(t) die in Abb. 3 dargestellten Bohr-Frequenzen 2Bl (l = 1, 2, 3, . . .) auf. Daraus kann man entnehmen, in welcher Weise das Molekül an ein elektromagnetisches Feld gekoppelt ist: Es kann in z-Richtung³ polarisierte Strah lung unter der Bedingung absorbieren oder emittieren, dass ihre Frequenz gleich einer Bohr-Frequenz 2Bl ist. Das entsprechende Absorptions- oder Emissionsspektrum des Moleküls bezeich net man als das reine Rotationsspektrum. Es besteht aus einer Serie äquidistanter Li nien mit dem Abstand 2B (s. Abb. 3). Die Absorption (oder Emission) der Linie mit der Frequenz 2Bl entspricht dem Übergang des Moleküls aus dem Niveau l − 1 in das Ni veau l (oder aus dem Niveau l in das Niveau l − 1), wobei gleichzeitig ein Photon der Frequenz 2Bl absorbiert (oder emittiert) wird. In Abb. 5 ist dieser Prozess schematisch dargestellt (Abb. 5a gibt die Absorption und Abb. 5b die Emission eines Photons der Frequenz 2Bl wieder). Die reinen Rotationsspektren zweiatomiger Moleküle liefern also einen direkten Nachweis für die Quantisierung der Observablen L2 .
(a)
(b)
Abb. 5: Schematische Darstellung des Übergangs des Moleküls aus einem Rotationsniveau in das benachbarte Niveau unter Absorption (a) oder Emission (b) eines Photons.
β Vergleich mit dem reinen Schwingungsspektrum Wir vergleichen das Rotationsspektrum mit dem in Ergänzung AV , § 1-c-α behandelten reinen Schwingungsspektrum: 3 Bei der Untersuchung der Bewegung von ⟨X⟩(t) und ⟨Y⟩(t) stellt man fest, dass das Molekül ebenso in x- oder y-Richtung polarisierte Strahlung absorbieren oder emittieren kann.
Drehung zweiatomiger Moleküle | 721
•
1. Die Rotationsfrequenzen eines zweiatomigen Moleküls sind im Allgemeinen viel kleiner als die Vibrationsfrequenzen. Der Abstand 2B/c zweier Rotationslinien liegt zwischen einigen Zehnteln und wenigen Dutzend cm−1 . Für kleine Werte von l entsprechen die Rotationsfrequenzen 2Bl daher Wellenlängen in der Größenord nung von Zentimetern oder Millimetern. Für HCl etwa ist der Abstand 2B/c gleich 20.8 cm−1 , während die Vibrationsfrequenz mit einem Wert von 2 886 cm−1 mehr als hundertmal größer ist. Reine Rotationsspektren liegen daher im weit entfernten Infra rot- oder Mikrowellenbereich. Bemerkung: In Ergänzung FVII werden wir zeigen, dass die Rotation von Molekülen für eine Feinstruktur der Vi brationsspektren (Vibrations-Rotations-Spektren) verantwortlich ist. Die Größe 2B gehört dann zu Wellenlängen, die nicht mehr im Mikrowellenbereich liegen. Dies gilt auch für den RamanRotationseffekt (s. § 4-b), der sich in einer optischen Linie als Rotationsstruktur bemerkbar macht.
2. Das reine Vibrations- oder Schwingungsspektrum enthält nur eine Vibrationslinie. Das hängt damit zusammen, dass die verschiedenen Vibrationsniveaus äquidistant liegen (wenn der anharmonische Anteil des Potentials vernachlässigt wird) und dem nach in der Zeitentwicklung des Dipols nur eine Bohr-Frequenz auftritt (Auswahlregel ∆v = ±1). Die reinen Rotationsspektren bestehen andererseits aus einer Serie äquidi stanter Linien. 3. Das permanente elektrische Dipolmoment eines heteropolaren Moleküls kann in der Nähe der Gleichgewichtslage nach Potenzen von r − re entwickelt werden (Er gänzung AV ): D(r) = d0 + d1 (r − re ) + . . .
(37)
Damit das reine Schwingungsspektrum auftritt, muss D(r) von r abhängen; der Koef fizient d1 muss also von null verschieden sein. Aber selbst wenn r konstant (gleich re ) ist, unterliegt die Projektion des elektrischen Dipols auf die z-Achse wegen der Rotation des Moleküls einer Modulation, solange d0 ungleich null ist. Durch die Un tersuchung der Intensitäten von Vibrations- und Rotationslinien können wir so die Koeffizienten d1 und d0 der Entwicklung (37) getrennt messen. γ Anwendungen Wir wollen drei Beispiele angeben: 1. Nach Gl. (19) können wir aus der Messung des Abstands 2B zweier benach barter Linien das Trägheitsmoment des Moleküls bestimmen. Wenn wir m1 und m2 kennen, ermöglicht das die Bestimmung von re , dem Gleichgewichtsabstand der bei den Atomkerne [re ist die Abszisse des Minimums der Kurve für V(r) in Abb. 1 aus Ergänzung AV ]. Aus der Messung der Vibrationsfrequenz können wir wiederum die Krümmung von V(r) bei r = re bestimmen.
•
722 | Ergänzung CVI
2. Wir betrachten die zweiatomigen Moleküle N–M und N–M , bei denen zwei Iso tope M und M eines Elements an dasselbe Atom N gebunden sind. Da die Abstände re der Kerne in beiden Molekülen gleich sind, ergibt eine Messung des Verhältnisses der entsprechenden Koeffizienten B, die mit hoher Genauigkeit möglich ist, das Ver hältnis der Isotopenmassen M und M . Man könnte auch die Schwingungsfrequenzen der beiden Moleküle vergleichen; das Rotationsspektrum ist jedoch vorzuziehen, weil die Rotationsfrequenzen von 1/μ abhängen [Gl. (19)], während bei den Schwingungsfrequenzen 1/√μ eingeht [s. Er gänzung AV , Gl. (5)]. 3. Bei der Untersuchung einer Probe, die eine große Anzahl von identischen Molekülen enthält, lassen sich aus der relativen Intensität der (Absorptions- oder Emissions-)Linien des reinen Rotationsspektrums Rückschlüsse über die Verteilung der Moleküle auf die verschiedenen Energieniveaus E l ziehen. Anders als bei den Vibrationsspektren treten die Übergänge zwischen zwei benachbarten Niveaus (Pfeile in Abb. 2) mit einer bestimmten Frequenz auf, die für diese beiden Niveaus charakte ristisch ist. Die Intensität der entsprechenden Linie hängt demnach von der Anzahl der Moleküle ab, die sich in den beteiligten Niveaus befinden. Aus dieser Information kann man die Temperatur eines Mediums ermitteln.⁴ Wenn das thermodynamische Gleichgewicht erreicht ist, wird die Wahrscheinlichkeit dafür, dass sich ein bestimmtes Molekül in einem Zustand der Energie E l befindet, durch e−E l /kT gegeben. Da die Entartung des Rotationsniveaus E l gleich (2l + 1) ist, ergibt sich die folgende Gesamtwahrscheinlichkeit 𝒫l , das betrachtete Molekül in einem der Zustände des E l -Niveaus zu finden: 1 (2l + 1) e−E l /kT Z 1 = (2l + 1) e−l(l+1)hB/kT Z
𝒫l =
(38)
worin ∞
Z = ∑ (2l + 1) e−l(l+1)hB/kT
(39)
l=0
die Verteilungsfunktion ist. Haben wir es mit einem System aus einer großen Anzahl von Molekülen zu tun, deren gegenseitigen Wechselwirkungen vernachlässigt werden können, gibt 𝒫l den Anteil der Moleküle an, deren Energie gleich E l ist. Bei normalen Temperaturen ist hB sehr viel kleiner als kT, so dass mehrere Ro tationsniveaus besetzt sind. Aufgrund des Faktors (2l + 1) sind allerdings nicht die niedrigsten Niveaus am stärksten besetzt: Abb. 6 gibt den Verlauf von 𝒫l als Funk tion von l für eine Temperatur an, für die hB/kT von der Größenordnung 1/10 ist.
4 In der Praxis verwendet man meistens Vibrations-Rotationsspektren oder Raman-Rotationsspek tren, da sie in besser zugängliche Frequenzbereiche als das reine Rotationsspektrum fallen.
Drehung zweiatomiger Moleküle |
723
•
Die Schwingungsniveaus sind hingegen nichtentartet, und ihr gegenseitiger Abstand ist viel größer als hB; folglich befinden sich bei einer Verteilung der Moleküle auf die Rotationsniveaus wie in Abb. 6 praktisch alle im Schwingungsgrundzustand (v = 0).
Abb. 6: Besetzung 𝒫l der verschiedenen Rotations niveaus E l im thermodynamischen Gleichgewicht. Die Tatsache, dass 𝒫l zunächst mit l ansteigt, er klärt sich aus der (2l + 1)-fachen Entartung der Niveaus E l . Wenn l ausreichend groß wird, über wiegt der Boltzmann-Faktor e−El /kT und sorgt für einen Abfall von 𝒫l .
4-b Homöopolare Moleküle. Raman-Rotationsspektrum In § 1-c-β von Ergänzung AV stellten wir fest, dass ein homöopolares Molekül (das ist ein Molekül aus zwei gleichen Atomen) kein permanentes Dipolmoment besitzt: In Gl. (37) gilt dann d0 = d1 = ⋅ ⋅ ⋅ = 0. Die Schwingungen und Rotationen des Mole küls induzieren keine Kopplung an ein elektromagnetisches Feld, und das Molekül ist demzufolge im nahen Infrarotbereich (Vibration) und im Mikrowellenbereich (Rotati on) inaktiv. Wie die Schwingung (s. Ergänzung AV , § 1-c-β) lässt sich auch die Rotation über die inelastische Streuung von Licht beobachten (Raman-Effekt). α Der Raman-Rotationseffekt. Klassische Behandlung In Ergänzung AV führten wir die Suszeptibilität χ eines Moleküls im optischen Bereich ein: Eine einfallende Lichtwelle, deren elektrisches Feld durch EeiΩt gegeben wird, erzeugt eine erzwungene Bewegung der Elektronen im Molekül und verursacht damit das Auftreten eines elektrischen Dipols DeiΩt , der mit derselben Frequenz oszilliert wie die einfallende Welle; χ ist dann der Proportionalitätskoeffizient zwischen D und E. Wenn E parallel zur Molekülachse ist, hängt χ vom Abstand r der beiden Kerne ab: Schwingt das Molekül, oszilliert χ mit derselben Frequenz. Das verursacht den Raman-Vibrationseffekt, den wir in § 1-c-β von Ergänzung AV beschrieben haben. In Wirklichkeit handelt es sich bei einem zweiatomigen Molekül um ein anisotro pes System. Wenn der Winkel zwischen der Molekülachse und E beliebig ist, wird D im Allgemeinen nicht parallel zu E sein: Zwischen D und E besteht ein tensorieller Zusammenhang (χ ist der Suszeptibilitätstensor). In den folgenden Fällen ist aber D tatsächlich parallel zu E: wenn E parallel zur Molekülachse (χ = χ ‖ ) oder senkrecht zu ihr ist (χ = χ⊥ ). Im allgemeinen Fall wählen wir nun die z-Achse in Richtung des elek trischen Felds E der Lichtwelle (die als polarisiert angenommen wird). Wir betrachten
•
724 | Ergänzung CVI
dann ein Molekül, dessen Achse in Richtung der Polarwinkel θ und φ zeigt, und be rechnen die z-Komponente des durch E in diesem Molekül induzierten Dipols. Wir begeben uns in die Ebene, die durch die z-Achse und die Molekülachse M1 M2 aufgespannt wird: Das Feld E lässt sich in eine Komponente E‖ parallel zur Molekül achse und eine Komponente E⊥ senkrecht zu ihr zerlegen (Abb. 7). Der in dem Molekül durch das Feld E cos Ωt induzierte Dipol ist dann D = (χ‖ E‖ + χ ⊥ E⊥ ) cos Ωt
(40)
Abb. 7: Zerlegung des elektrischen Felds E in eine Komponente E‖ parallel zur Molekülachse und eine Komponente E⊥ senkrecht zu ihr. Die Felder induzieren kollineare elektrische Dipole χ‖ E‖ und χ⊥ E⊥ . Da jedoch χ‖ und χ⊥ unterschiedliche Werte haben (das Molekül ist anisotrop), ist der induzierte Dipol D = χ‖ E‖ + χ⊥ E⊥ nicht kollinear zu E.
Weiter ist seine Projektion auf die z-Achse D z = (cos θ χ‖ |E‖ | + sin θ χ⊥ |E⊥ |) cos Ωt = (cos2 θ χ‖ + sin2 θ χ⊥ ) E cos Ωt = [χ⊥ + (χ‖ − χ⊥ ) cos2 θ] E cos Ωt
(41)
Wie wir sehen, hängt D z von θ ab, da χ ‖ und χ⊥ unterschiedliche Werte haben (das Molekül ist anisotrop). Um die Rotation des Moleküls zu untersuchen, gehen wir zunächst klassisch vor. Da das Molekül mit der Frequenz ωR /2π rotiert, oszilliert cos θ mit derselben Fre quenz: cos θ = α cos(ωR t − β)
(42)
wobei α und β von den Anfangsbedingungen und dem (festen) Drehimpuls 𝓛 abhän gen. Daraus ergibt sich, dass der Term mit cos2 θ in Gl. (41) zusätzlich zu der Kompo nente mit der Frequenz Ω/2π Komponenten von D z erzeugt, die mit den Frequenzen (Ω ± 2ωR )/2π oszillieren. Das Ergebnis, dass die Rotation des Moleküls mit der Fre quenz ωR /2π seine Polarisierbarkeit mit der doppelten Frequenz moduliert, lässt sich leicht verstehen: Nach einer halben Drehung (in einer halben Periode) nimmt das Mo lekül bezüglich der einlaufenden Lichtwelle dieselbe geometrische Lage ein. Das mit einer Polarisation parallel zur z-Achse emittierte Licht wird von D z abge strahlt. Es enthält neben einer unverschobenen Linie der Frequenz Ω/2π (Rayleigh-Li nie) zwei Linien zu beiden Seiten der Rayleigh-Linie mit den Frequenzen (Ω +2ωR )/2π (Raman-Anti-Stokes-Linie) bzw. (Ω − 2ωR )/2π (Raman-Stokes-Linie).
Drehung zweiatomiger Moleküle |
725
•
β Quantenmechanische Auswahlregeln. Die Form des Raman-Spektrums Quantenmechanisch entspricht die Raman-Streuung einem inelastischen Streupro zess, bei dem das Molekül aus dem Niveau E l in das Niveau E l übergeht, während sich die Energie ℏΩ des Photons in ℏΩ + E l − E l ändert (die Gesamtenergie des Sys tems bleibt bei diesem Prozess erhalten). Die Quantentheorie des Raman-Effekts (auf die wir hier nicht eingehen wollen) ergibt, dass die Wahrscheinlichkeit dieses Prozesses durch die Matrixelemente von (χ ‖ − χ ⊥ ) cos2 θ + χ ⊥ zwischen dem Anfangszustand Y lm (θ, φ) und dem Endzustand Y lm (θ, φ) des Moleküls bestimmt wird:
∫ dΩ Y lm ∗ (θ, φ) [(χ‖ − χ⊥ ) cos2 θ + χ ⊥ ] Y lm (θ, φ)
(43)
Mittels der Eigenschaften der Kugelflächenfunktionen lässt sich zeigen, dass ein sol ches Matrixelement nur von null verschieden ist, wenn gilt⁵ l − l = 0, +2, −2
(44)
Es existiert nur eine Rayleigh-Linie (sie gehört zu l = l ). Da die Rotationsniveaus nicht äquidistant sind, gibt es allerdings mehrere Raman-Anti-Stokes-Linien (für l = l − 2) mit den Frequenzen Ω 3 E l +2 − E l Ω + = + 4B (l + ) 2π h 2π 2
mit l = 0, 1, 2, . . .
(45)
und mehrere Raman-Stokes-Linien (für l = l + 2) mit den Frequenzen Ω E l − E l+2 Ω 3 + = − 4B (l + ) 2π h 2π 2
mit l = 0, 1, 2, . . .
(46)
Die Form des Raman-Rotationsspektrums ist in Abb. 8 dargestellt. Die Stokes- und Anti-Stokes-Linien liegen symmetrisch zur Rayleigh-Linie. Der Abstand zweier be nachbarter Stokes-(oder Anti-Stokes-)Linien ist gleich 4B, d. h. gleich dem zweifachen Abstand von zwei Linien eines reinen Rotationsspektrums, wenn es existierte. Da die Schwingungsfrequenz sehr viel größer als B ist, liegen die Raman-Stokes- und AntiStokes-Schwingungslinien sehr viel weiter rechts bzw. links von der Rayleigh-Linie als die Raman-Rotationslinien und treten daher in der Abbildung nicht auf (auch diese Linien weisen eine Rotationsstruktur wie die in Abb. 8 auf). Bemerkungen: 1. Wir betrachten ein Wellenpaket wie in § 3-c, für das die Werte von l um einen sehr großen Wert l M gruppiert sind (Abb. 4). Nach Gl. (45) und Gl. (46) liegen die Frequenzen der verschiede nen Stokes- und Anti-Stokes-Linien (relativ) sehr dicht bei Ω ± 4Bl M 2π
(47)
5 Das Integral (43) verschwindet außerdem für m ≠ m . Wenn wir reflektiertes Licht mit einem an deren Polarisationszustand als dem des einfallenden Lichts betrachten, ergeben sich die folgenden Auswahlregeln für m: ∆m = 0, ±1, ±2.
•
726 | Ergänzung CVI
Abb. 8: Raman-Rotationsspektrum eines Moleküls. Das Molekül, das sich anfangs im Rotations niveau E l befindet, streut ein einfallendes Photon der Energie ℏΩ inelastisch. Nach der Streuung befindet sich das Molekül im Rotationsniveau E l , und die Energie des Photons ist gleich ℏΩ + E l − E l (Energieerhaltung). Für l = l besitzt das gestreute Photon dieselbe Frequenz ν = Ω/2π wie das einlaufende Photon: Das ergibt die Rayleigh-Linie. Es ist aber auch l − l = ±2 möglich: Für l = l + 2 ist die Frequenz des gestreuten Photons kleiner (Stokes-Streuung); für l = l − 2 ist sie größer (AntiStokes-Streuung). Da die Rotationsniveaus nicht äquidistant sind (s. Abb. 2), gibt es ebenso viele Stokes- oder Anti-Stokes-Linien wie es Werte von l gibt. Diese Linien sind in der Abbildung mit l → l gekennzeichnet (mit l = l ± 2).
das ist mit Gl. (31) Ω ± 2ν M 2π
(48)
wobei ν M die mittlere Rotationsfrequenz des Moleküls ist. Die quantenmechanische Behandlung stimmt also im klassischen Grenzfall mit den Ergebnissen der obigen klassischen Behandlung überein. 2. Die Stokes- und Anti-Stokes-Linien treten in den Raman-Rotationsspektren mit vergleichbaren Intensitäten auf. Das liegt daran, dass die Niveaus mit großen l hohe Besetzungszahlen aufwei sen, da hB sehr viel kleiner als kT ist. Diese Bedingung muss für die mögliche Beobachtung von Anti-Stokes-Linien erfüllt sein, wobei der Anfangszustand des Moleküls mindestens l = 2 sein muss. Die Anti-Stokes-Schwingungslinie hat hingegen eine sehr viel geringere Intensität als die Stokes-Linie: Die Schwingungsenergie ist viel größer als kT; die Besetzung des Schwin gungsgrundzustands v = 0 ist damit viel größer als die der anderen Zustände; Stokes-Prozesse v = 0 → v = 1 sind viel häufiger als Anti-Stokes-Prozesse v = 1 → v = 0. 3. Der Raman-Rotationseffekt tritt auch bei heteropolaren Molekülen auf.
Referenzen und Literaturhinweise Karplus und Porter (12.1), § 7.4; Herzberg (12.4), Bd. I, Kap. III, § 1 und § 2; Landau und Lifshitz (1.19), Kap. XI und XIII; Townes und Schawlow (12.10), Kap. 1 bis 4.
Drehimpuls eines zweidimensionalen Oszillators
| 727
•
Ergänzung DVI Drehimpuls eines zweidimensionalen Oszillators 1 1-a 1-b 2 2-a 2-b 3 3-a 3-b 3-c 3-d 4 4-a 4-b
Einleitung | 727 Die klassische Behandlung | 727 Quantenmechanische Behandlung | 729 Klassifikation der stationären Zustände | 731 Energien. Stationäre Zustände | 731 Der Operator H xy bildet in Hxy keinen V. S. K. O. | 732 Andere Klassifikation der stationären Zustände | 733 Bedeutung und Eigenschaften des Operators L z | 733 Rechts- und linkszirkulare Quanten | 733 Stationäre Zustände mit definiertem Drehimpuls | 734 Wellenfunktionen der gemeinsamen Eigenzustände von H xy und L z | 736 Quasiklassische Zustände | 738 Definition der Zustände |α x , α y ⟩ und |α d , α g ⟩ | 738 Erwartungswerte der verschiedenen Observablen | 740
In dieser Ergänzung befassen wir uns mit den quantenmechanischen Eigenschaften eines zweidimensionalen harmonischen Oszillators. Dieses Problem ist quantenme chanisch exakt lösbar und erfordert keine komplizierten Rechnungen. Außerdem bie tet sich mit ihm eine Möglichkeit, die Eigenschaften des Bahndrehimpulses L an ei nem einfachen Beispiel zu untersuchen; wir werden sehen, dass die stationären Zu stände dieses Oszillators nach den möglichen Werten der Observablen L z klassifiziert werden können. Die Ergebnisse sind in Ergänzung EVI von Nutzen.
1 Einleitung 1-a Die klassische Behandlung Ein physikalisches Teilchen bewegt sich immer im dreidimensionalen Raum. Wenn die potentielle Energie jedoch nur von x und y abhängt, kann das Problem zweidi mensional behandelt werden. Wir nehmen hier an, dass die potentielle Energie von der Form V(x, y) =
μ 2 2 ω (x + y2 ) 2
(1)
ist, worin μ die Masse des Teilchens und ω eine Konstante ist. Die klassische Hamil ton-Funktion des Systems lautet dann H = Hxy + Hz https://doi.org/10.1515/9783110638738-063
(2)
•
728 | Ergänzung DVI
mit 1 1 (p2 + p2y ) + μω2 (x2 + y2 ) 2μ x 2 1 2 Hz = p 2μ z
Hxy =
(3)
wobei p x , p y , p z die drei Komponenten des Impulses p des Teilchens sind; Hxy ist die Hamilton-Funktion eines zweidimensionalen harmonischen Oszillators. Die Bewegungsgleichungen dieses Systems können leicht integriert werden und ergeben p z (t) = p0 p0 z(t) = t + z0 μ x(t) = xM cos(ωt − φ x ) p x (t) = −μωxM sin(ωt − φ x ) y(t) = yM cos(ωt − φ y ) p y (t) = −μωyM sin(ωt − φ y )
(4)
(5)
(6)
p0 , z0 , xM , φ x , yM , φ y sind Konstanten, die von den Anfangsbedingungen abhängen (wir nehmen xM und yM als positiv an).
Abb. 1: Projektion der klassischen Bahn des Teil chens in einem zweidimensionalen harmonischen Potential auf die x, y-Ebene: Es ergibt sich eine Ellipse, die in das Rechteck ABCD eingeschrieben ist.
Bei der Projektion der Bewegung des Teilchens auf die z-Achse handelt es sich um eine gleichförmige Bewegung mit der Geschwindigkeit p0 /μ. Die Projektion auf die x, y-Ebene beschreibt eine Ellipse, die in das Rechteck ABCD von Abb. 1 einbeschrie ben ist. Die Richtung, in der das Teilchen die Ellipse durchläuft, hängt von der Pha sendifferenz φ y − φ x ab: Für φ y − φ x = ±π reduziert sich die Ellipse auf die Strecke AC. Wenn φ y − φ x zwischen −π und 0 ist, bewegt sich das Teilchen im Uhrzeigersinn („linkshändige“ Bewegung), wobei die Achsen der Ellipse für φ y − φ x = −π/2 par allel zur x- bzw. y-Achse sind. Für φ y − φ x = 0 reduziert sie sich auf die Strecke BD.
Drehimpuls eines zweidimensionalen Oszillators
|
729
•
Wenn schließlich φ y − φ x zwischen 0 und π ist, bewegt sich das Teilchen gegen den Uhrzeigersinn („rechtshändige“ Bewegung); für φ y − φ x = +π/2 sind die Achsen par allel zur x- bzw. y-Achse. Die Ellipse geht in einen Kreis über, wenn gilt φ y − φ x = ±π/2 und xM = yM . Es ist leicht, mehrere Konstanten der Bewegung zu bestimmen, die mit der Pro jektion der Bewegung auf die x, y-Ebenen zusammenhängen: – die Gesamtenergie Hxy , die nach den Gleichungen (3), (5) und (6) gegeben wird durch 1 (7) Hxy = μω2 (x2M + y2M ) 2 – die Energien 1 Hx = μω2 x2M (8a) 2 1 (8b) Hy = μω2 y2M 2 der Projektionen der Bewegung auf die x- bzw. y-Achse; – die Komponente des Bahndrehimpulses 𝓛 des Teilchens längs der z-Achse, ℒz = xp y − yp x
(9)
die nach (5) und (6) gleich ℒz = μωxM yM sin(φ y − φ x )
(10)
ist. Wir sehen, dass ℒz positiv oder negativ ist, je nachdem ob die Bewegung ge gen den Uhrzeigersinn (0 < φ y −φ x < π) oder im Uhrzeigersinn (−π < φ y −φ x < 0) verläuft. Für die linearen Bewegungen (φ y −φ x = ±π und φ y −φ x = 0) ist ℒz gleich null. Für die Bewegung mit einer gegebenen Energie, d. h. nach Gl. (7) für einen festen Wert von x2M + y2M , wird |ℒz | schließlich maximal, wenn φ y − φ x = ±π/2 und das Produkt xM yM maximal ist; daraus folgt xM = yM . Für eine vorgegebene Ener gie nimmt also ℒz bei der kreisförmigen Bewegung im (gegen den) Uhrzeigersinn seinen minimalen (maximalen) Wert an. 1-b Quantenmechanische Behandlung Mit den Quantisierungsregeln aus Kapitel III erhalten wir aus den klassischen Hamil ton-Funktionen H, Hxy und Hz die quantenmechanischen Operatoren H, H xy und H z . Die stationären Zustände |φ⟩ des Teilchens werden gegeben durch H |φ⟩ = (H xy + H z ) |φ⟩ = E |φ⟩
(11)
mit H xy = Hz =
P2x + P2y 2μ P2z 2μ
+
1 2 2 μω (X + Y 2 ) 2
(12a) (12b)
•
730 | Ergänzung DVI
Aufgrund der Ergebnisse in Ergänzung FI wissen wir, dass wir eine Basis von Eigen zuständen von H wählen können, deren Vektoren von der Form |φ⟩ = |φ xy ⟩ ⊗ |φ z ⟩
(13)
sind; dabei ist |φ xy ⟩ ein Eigenvektor von H xy im Zustandsraum Hxy zu den Variablen x und y, H xy |φ xy ⟩ = E xy |φ xy ⟩
(14)
und |φ z ⟩ ein Eigenvektor von H z im Zustandsraum Hz zur Variablen z, H z |φ z ⟩ = E z |φ z ⟩
(15)
Die Gesamtenergie des Zustands (13) ist dann E = E xy + E z
(16)
Gleichung (15) beschreibt die stationären Zustände eines freien Teilchens in einer Dimension und kann sofort gelöst werden; es ergibt sich 1 eip z z/ℏ ⟨z|φ z ⟩ = (17) √2πℏ (mit einer beliebigen reellen Konstanten p z ) und p2z (18) 2μ Das Problem ist somit auf die Bestimmung der Lösungen von Gl. (14) reduziert, also der Energien und der stationären Zustände eines zweidimensionalen harmonischen Oszillators. Diese Aufgabe wollen wir im Folgenden lösen. Wir werden sehen, dass die Eigenwerte E xy von H xy entartet sind: H xy bildet allein keinen V. S. K. O. in Hxy . Zur Konstruktion eines V. S. K. O. müssen wir daher zu H xy ein oder mehrere Observable hinzufügen. In der Quantenmechanik werden sich diesel ben Konstanten der Bewegung wie in der klassischen Mechanik ergeben: H x , H y , die Energien der Projektionen der Bewegung auf die x- bzw. y-Achse, und L z , die z-Kom ponente des Bahndrehimpulses L. Da L z weder mit H x noch mit H y vertauscht, lässt sich ein V. S. K. O. entweder aus H xy , H x und H y (§ 2) oder aus H xy und L z bilden (§ 3). Ez =
Bemerkungen: 1. Aus Gl. (18) folgt, dass die Eigenwerte E z von H z im Raum Hz alle zweifach entartet sind. Au ßerdem ist die Entartung der Eigenwerte (16) des Gesamt-Hamilton-Operators H im Raum H = Hxy ⊗Hz nicht ausschließlich auf die Entartung von E xy in Hxy und von E z in Hz zurückzuführen: Zwei Eigenvektoren (13) von H können dieselbe Gesamtenergie E haben, ohne dass die entspre chenden Werte von E xy (und E z ) übereinstimmen müssen. 2. Der Operator H vertauscht mit der Komponente L z von L, nicht aber mit L x und L y . Der Grund dafür liegt darin, dass die potentielle Energie (1) nur gegenüber Drehungen um die z-Achse in variant ist. Von den drei Operatoren L x , L y und L z wirkt nur einer, nämlich L z , ausschließlich im Raum Hxy . Bei der Untersuchung des zweidimensionalen harmonischen Oszillators werden wir daher nur die Observable L z verwenden. In Ergänzung BVII untersuchen wir den isotropen dreidimensionalen harmonischen Oszillator, dessen potentielle Energie bei Drehungen um eine beliebige Achse durch den Ursprung invariant ist. Wir werden sehen, dass dann alle Komponen ten von L mit dem Hamilton-Operator vertauschen.
Drehimpuls eines zweidimensionalen Oszillators
| 731
•
2 Klassifikation der stationären Zustände 2-a Energien. Stationäre Zustände Zur Lösung der Eigenwertgleichung (14) schreiben wir H xy in der Form H xy = H x + H y
(19)
wobei H x und H y jeweils Hamilton-Operatoren eindimensionaler harmonischer Oszil latoren sind: Hx = Hy =
P2x 1 2 2 + μω X 2μ 2 P2y 2μ
+
1 2 2 μω Y 2
(20)
Die Eigenzustände |φ n x ⟩ von H x im Raum Hx und |φ n y ⟩ von H y im Raum Hy kennen wir bereits; ihre Energien sind gleich E x = (n x +1/2)ℏω bzw. E y = (n y +1/2)ℏω (n x und n y sind nichtnegative ganze Zahlen). Als Eigenzustände von H xy können wir somit |φ n x ,n y ⟩ = |φ n x ⟩ ⊗ |φ n y ⟩
(21)
wählen, wobei die zugehörige Energie E xy gegeben wird durch 1 1 ) ℏω + (n y + ) ℏω 2 2 = (n x + n y + 1)ℏω
E xy = (n x +
(22)
Nach den Eigenschaften des eindimensionalen harmonischen Oszillators ist E x in Hx und E y in Hy nichtentartet. Folglich gehört zu einem Paar {n x , n y } ein bis auf einen konstanten Faktor eindeutig bestimmter Vektor |φ n x ,n y ⟩ in Hxy : H x und H y bilden in Hxy einen V. S. K. O. Es erweist sich als praktisch, die Operatoren a x und a y (Vernichtungsoperatoren eines Oszillatorquants für die x- bzw. y-Komponente) zu verwenden, die definiert wer den durch 1 Px (βX + i ) βℏ √2 Py 1 ay = (βY + i ) βℏ √2
ax =
(23)
mit β=√
μω ℏ
(24)
Da a x und a y in den unterschiedlichen Räumen Hx und Hy wirken, sind die einzigen nichtverschwindenden Kommutatoren zwischen den vier Operatoren a x , a y , a†x , a†y [a x , a†x ] = [a y , a†y ] = 1
(25)
•
732 | Ergänzung DVI
Die Operatoren N x (die Anzahl der Quanten in x-Richtung) und N y (die Anzahl der Quanten in y-Richtung) werden durch N x = a†x a x
(26)
N y = a†y a y gegeben, so dass wir H xy schreiben können als H xy = H x + H y = (N x + N y + 1)ℏω
(27)
Offenbar gilt N x |φ n x ,n y ⟩ = n x |φ n x ,n y ⟩
(28)
N y |φ n x ,n y ⟩ = n y |φ n x ,n y ⟩ Der Grundzustand |φ0,0 ⟩ wird gegeben durch |φ0,0 ⟩ = |φ n x =0 ⟩ ⊗ |φ n y =0 ⟩
(29)
Der in Gl. (21) definierte Zustand |φ n x ,n y ⟩ ergibt sich aus |φ0,0 ⟩ durch die sukzessive Anwendung der Operatoren a†x und a†y : |φ n x ,n y ⟩ =
1 √n x !n y !
nx
ny
(a†x ) (a†y ) |φ0,0 ⟩
(30)
Die zugehörige Wellenfunktion ist gleich dem Produkt der Funktionen φ n x (x) und φ n y (y) [s. Ergänzung BV , Gl. (35)]: φ n x ,n y (x, y) =
β √π 2n x +n y n x ! n y !
e−β
2
(x 2 +y2 )/2
H n x (βx) H n y (βy)
(31)
2-b Der Operator H xy bildet in Hxy keinen V. S. K. O. Wir können Gl. (22) entnehmen, dass die Eigenwerte von H xy von der folgenden Form sind: E xy = E n = (n + 1)ℏω
(32)
wobei n = nx + ny
(33)
eine nichtnegative ganze Zahl ist. Zu jedem Wert der Energie gehören mehrere ortho gonale Eigenvektoren |φ n x =n,n y =0 ⟩, |φ n x =n−1,n y =1 ⟩, . . . , |φ n x =0,n y =n ⟩
(34)
Da es (n+1) Vektoren gibt, ist der Eigenwert E n in Hxy (n+1)-fach entartet. Folglich bil det H xy allein keinen V. S. K. O. Andererseits haben wir gesehen, dass durch {H x , H y } ein V. S. K. O. gegeben wird; dasselbe gilt offenbar auch für {H xy , H x } und {H xy , H y }.
Drehimpuls eines zweidimensionalen Oszillators
| 733
•
3 Andere Klassifikation der stationären Zustände 3-a Bedeutung und Eigenschaften des Operators L z Im vorstehenden Abschnitt kennzeichneten wir die stationären Zustände durch die Angabe der Quantenzahlen n x und n y . Die Wahl der x- und y-Achse spielt jedoch bei dem hier betrachteten Problem keine wesentliche Rolle: Da die potentielle Energie gegenüber Drehungen um die z-Achse invariant ist, hätten wir in der x, y-Ebene eben sogut ein anderes System orthogonaler Achsen x und y nehmen können; wir wären dann zu anderen stationären Zuständen gelangt. Um also die Symmetrieeigenschaften des Systems besser ausnutzen zu können, betrachten wir nun die Komponente L z des Drehimpulses. Sie ist durch L z = XP y − YP x
(35)
definiert. Wenn wir X und P x durch a x und a†x und Y und P y durch a y und a†y ausdrü cken, ergibt sich L z = iℏ (a x a†y − a†x a y )
(36)
Der Ausdruck für H xy in Abhängigkeit von diesen Operatoren lautet H xy = (a†x a x + a†y a y + 1) ℏω
(37)
Wegen [a x a†y , a†x a x + a†y a y ] = a x a†y − a x a†y = 0 [a†x a y , a†x a x + a†y a y ] = −a†x a y + a†x a y = 0
(38)
erhalten wir [H xy , L z ] = 0
(39)
Wir werden daher nach einer Basis aus gemeinsamen Eigenvektoren von H xy und L z suchen.
3-b Rechts- und linkszirkulare Quanten Wir führen die folgenden Operatoren ad und ag ein: 1 (a x − ia y ) √2 1 (a x + ia y ) ag = √2
ad =
(40)
Aus ihrer Definition ersehen wir, dass die Wirkung von ad (oder ag ) auf |φ n x ,n y ⟩ ei ne Linearkombination von |φ n x −1,n y ⟩ und |φ n x ,n y −1 ⟩ ergibt, also einen stationären Zu stand, der ein Energiequant ℏω weniger besitzt. Entsprechend führt die Wirkung von
•
734 | Ergänzung DVI
a†d (oder a†g ) auf |φ n x ,n y ⟩ zu einem stationären Zustand, der ein Energiequant mehr hat; ad (bzw. ag ) können somit in Analogie zu a x (bzw. a y ) als Vernichtungsoperato ren eines rechts- bzw. eines linkszirkularen Quants aufgefasst werden. Mit Gl. (40) und (25) zeigt man, dass die einzigen nichtverschwindenden Kommu tatoren der vier Operatoren ad , ag , a†d , a†g [ad , a†d ] = [ag , a†g ] = 1
(41)
sind. Diese Beziehungen entsprechen tatsächlich Gl. (25). Außerdem lässt sich der Operator H xy in ähnlicher Weise wie in Gl. (37) auch in Abhängigkeit von diesen Ope ratoren schreiben: Da 1 † (a a x + a†y a y − ia†x a y − ia x a†y ) 2 x 1 a†g ag = (a†x a x + a†y a y + ia†x a y + ia x a†y ) 2
a†d ad =
(42)
gilt, erhalten wir H xy = (a†d ad + a†g ag + 1) ℏω
(43)
Mit Gl. (36) folgt weiterhin L z = ℏ (a†d ad − a†g ag )
(44)
Führen wir die Operatoren Nd und Ng (die Anzahl der rechts- und linkszirkularen Quanten) ein, Nd = a†d ad Ng = a†g ag
(45)
so werden die Gleichungen (43) und (44) zu H xy = (Nd + Ng + 1) ℏω L z = ℏ (Nd − Ng )
(46)
Während also H eine Form ähnlich wie in (27) behält, vereinfacht sich die von L z .
3-c Stationäre Zustände mit definiertem Drehimpuls Für die Anwendung der Operatoren ad und ag können wir die Überlegungen im Zu sammenhang mit den Operatoren a x und a y übernehmen. Die Spektren von Nd und Ng enthalten also alle nichtnegativen ganzen Zahlen. Außerdem wird mit der Anga be eines Paares {nd , ng } der gemeinsame Eigenvektor von Nd und Ng (bis auf einen konstanten Faktor) eindeutig bestimmt. Er lautet |χ nd ,ng ⟩ =
1 nd ng (a†d ) (a†g ) |φ0,0 ⟩ √nd ! ng !
(47)
Drehimpuls eines zweidimensionalen Oszillators
| 735
•
Die Operatoren Nd und Ng bilden also einen V. S. K. O. in Hxy . Aus (46) folgt damit, dass |χ nd ,ng ⟩ auch ein Eigenvektor von H xy und L z mit den Eigenwerten (n + 1)ℏω und mℏ ist, wobei n und m gegeben werden durch n = nd + ng
(48)
m = nd − ng
Aus den Gleichungen (48) wird der Grund für die Bezeichnung rechts- und linkszirku lares Quant deutlich: Die Wirkung des Operators a†d auf |χ nd ,ng ⟩ ergibt einen Zustand, der ein Quant mehr besitzt; zu diesem Quant gehört, da m um eins erhöht wurde, ein zusätzlicher Drehimpuls +ℏ (der einer Rotation im Gegenzeigersinn um die z-Achse entspricht). Entsprechend führt a†g auf einen Zustand mit einem zusätzlichen Quant mit dem Drehimpuls −ℏ (Rotation im Uhrzeigersinn). Da es sich bei nd und ng um nichtnegative ganze Zahlen handelt, sind diese Ergeb nisse mit denen des vorhergehenden Abschnitts verträglich: Die Eigenwerte von H xy haben die Form (n + 1)ℏω, worin n eine nichtnegative ganze Zahl ist; ihre Entartung ist gleich (n + 1), so dass wir für gegebenes n haben nd = n ;
ng = 0
nd = n − 1 ;
ng = 1 (49)
.. . nd = 0 ;
ng = n
Darüber hinaus sehen wir, dass die Eigenwerte von L z von der Form mℏ mit einer ganzen Zahl m sind; das stimmt mit den allgemeinen Ergebnissen, die wir in Kapitel VI abgeleitet haben, überein. Der Auflistung (49) lässt sich entnehmen, welche Werte von m zu einem bestimmten Wert von n gehören. Im Grundzustand ist z. B. nd = ng = 0 und damit notwendig m = 0; im ersten angeregten Zustand sind nd = 1 und ng = 0 oder nd = 0 und ng = 1 möglich, was m = +1 oder m = −1 ergibt. Allgemein folgt aus den Gleichungen (48) und (49), dass für ein bestimmtes Energieniveau (n + 1)ℏω die folgenden Werte von m auftreten können: m = n, n − 2, n − 4, . . . , −n + 2, −n
(50)
Zu einem Paar von Werten für n und m gehört also ein eindeutig (bis auf einen kon stanten Faktor) bestimmter Vektor |χ nd =(n+m)/2,ng=(n−m)/2 ⟩ H und L z bilden demnach einen V. S. K. O. in Hxy . Bemerkung: Für einen gegebenen Wert der Gesamtenergie (definiert durch n) entsprechen die Zustände |χ nd =n,ng =0 ⟩ und |χ nd =0,ng =n ⟩ dem maximalen (nℏ) bzw. dem minimalen Wert (−nℏ) von L z . Diese Zustände erinnern also an die klassische rechts- und linkszirkulare Bewegung, für die ℒz bei gegebener Energie den maximalen bzw. minimalen Wert annimmt (s. § 1-a).
•
736 | Ergänzung DVI
3-d Wellenfunktionen der gemeinsamen Eigenzustände von H xy und L z Wir tragen der Symmetrie des Problems gegenüber Drehungen um die z-Achse Rech nung, indem wir Polarkoordinaten verwenden und setzen x = ρ cos φ
ρ≥0
y = ρ sin φ
0 ≤ φ < 2π
(51)
Wie sieht nun die Wirkung der Operatoren ad und ag auf eine Funktion von ρ und φ aus? Zunächst bestimmen wir ihre Wirkung auf eine Funktion von x und y. Wir kennen die Wirkung von X und P x und damit die von a x (und analog die von a y ); mit Gl. (40) erhalten wir ad ⇒
1 1 ∂ ∂ [β(x − iy) + ( − i )] 2 β ∂x ∂y
(52)
Aus den Regeln für das Differenzieren von Funktionen mehrerer Variabler ergibt sich dann ad ⇒
i ∂ 1 ∂ e−iφ − [βρ + ] 2 β ∂ρ βρ ∂φ
(53)
Ebenso finden wir a†d ⇒
eiφ 1 ∂ i ∂ [βρ − − ] 2 β ∂ρ βρ ∂φ
ag ⇒
1 ∂ i ∂ eiφ [βρ + + ] 2 β ∂ρ βρ ∂φ
a†g ⇒
e−iφ 1 ∂ i ∂ [βρ − + ] 2 β ∂ρ βρ ∂φ
(54)
und
(55)
Um die Wellenfunktionen χ nd ,ng (ρ, φ) zu berechnen, wenden wir einfach die Dif ferentialoperatoren, die a†d und a†g darstellen, auf die Funktion χ 0,0 (ρ, φ) an, die nach Gl. (31) lautet χ 0,0 (ρ, φ) =
β −β2 ρ2 /2 e √π
(56)
Aus den Beziehungen (54) und (55) entnehmen wir, dass die Wirkung von a†d (oder von a†g ) auf eine Funktion der Form eimφ F(ρ) gegeben wird durch a†d [eimφ F(ρ)] = a†g [eimφ
ei(m+1)φ m 1 dF [(βρ + ) F(ρ) − ] 2 βρ β dρ
m 1 dF ei(m−1)φ F(ρ)] = [(βρ − ) F(ρ) − ] 2 βρ β dρ
(57)
Drehimpuls eines zweidimensionalen Oszillators
•
| 737
Mit der wiederholten Anwendung dieser Beziehungen auf die Funktion (56) ergibt sich zunächst, dass die φ-Abhängigkeit von χ nd ,ng (ρ, φ) durch ei(nd −ng )φ gegeben wird. Da mit haben wir ein allgemeines Ergebnis wiedergefunden, das wir bereits in Kapitel VI gezeigt haben: Die φ-Abhängigkeit einer Eigenfunktion von L z mit dem Eigenwert mℏ ist eimφ . 2 2 Wenn wir in Gl. (57) F(ρ) = ρ m e−β ρ /2 wählen, erhalten wir a†d [eimφ ρ m e−β
ρ /2
2 2
] = β ei(m+1)φ ρ m+1 e−β
ρ /2
2 2
(58)
Die nd -malige Anwendung des Operators a†d auf die Funktion χ0,0 (ρ) ergibt χ nd ,0 (ρ, φ) =
β √ π nd !
eind φ (βρ)nd e−β
ρ /2
2 2
(59)
Eine analoge Rechnung führt auf χ 0,ng (ρ, φ) =
2 2 β e−ing φ (βρ)ng e−β ρ /2 √π ng !
(60)
Diese Wellenfunktionen sind normiert. Die Wellenfunktionen (59) und (60) entspre chen für ein bestimmtes Energieniveau den Extremwerten +n und −n der Quanten zahl m. Ihre ρ-Abhängigkeit ist besonders einfach: Der maximale Wert ihres Betrags wird für ρ = √n/β angenommen. Ihre räumliche Ausdehnung nimmt daher (wie im Fall des eindimensionalen harmonischen Oszillators) mit ihrer Energie (n + 1)ℏω zu. In gleicher Weise können wir durch Anwendung der Operatoren a†d (oder a†g ) auf die Funktionen (59) und (60) die Funktionen χ nd ,ng (ρ, φ) für beliebige nd und ng kon struieren. Die Ergebnisse für die ersten angeregten Niveaus sind in Schema 1 ange geben. Schema 1: Gemeinsame Eigenfunktionen des Hamilton-Operators H xy und der Observablen L z für die ersten Niveaus des zweidimensionalen Oszillators. β −β2 ρ2 /2 e √π
n = 0:
m=0
χ 0,0 (ρ) =
n = 1:
m=1
χ 1,0 (ρ, φ) =
m = −1 n = 2:
m=2 m=0 m = −2
2 2 β βρ e−β ρ /2 eiφ √π 2 2 β χ 0,1 (ρ, φ) = βρ e−β ρ /2 e−iφ √π 2 2 β (βρ)2 e−β ρ /2 e2iφ √2π 2 2 β χ 1,1 (ρ, φ) = [(βρ)2 − 1] e−β ρ /2 √π 2 2 β χ 0,2 (ρ, φ) = (βρ)2 e−β ρ /2 e−2iφ √2π
χ 2,0 (ρ, φ) =
•
738 | Ergänzung DVI
Bemerkung: 2 2 Die durch Gl. (59) gegebenen Funktionen χ nd ,0 (ρ, φ) sind proportional zu e−β ρ /2 (βρeiφ )nd . All gemeiner haben ihre Linearkombinationen die Form F(ρ, φ) = e−β
2 ρ 2 /2
f (βρ eiφ )
(61)
(worin f eine beliebige Funktion einer Variablen ist) und sind Eigenfunktionen von N g mit dem Eigenwert null. Mit Gl. (55) lässt sich leicht zeigen, dass gilt ag F(ρ, φ) = 0
(62)
Entsprechend besteht der Unterraum von Eigenfunktionen von N d mit dem Eigenwert null aus Funktionen der Form G(ρ, φ) = e−β
2 ρ 2 /2
g (βρ e−iφ )
(63)
4 Quasiklassische Zustände Die zeitliche Entwicklung des Zustandsvektors und die Erwartungswerte der verschie denen Observablen des zweidimensionalen Oszillators lassen sich unter Verwendung der Eigenschaften des eindimensionalen Oszillators berechnen. Zum Beispiel zeigt man leicht, dass sowohl in den Erwartungswerten ⟨X⟩(t) und ⟨Y⟩(t) als auch in ⟨P x ⟩(t) und ⟨P y ⟩(t) nur die eine Bohr-Frequenz ω auftritt. Darüber hinaus lässt sich nachwei sen, dass diese Erwartungswerte genau den klassischen Bewegungsgleichungen ge horchen. In diesem Abschnitt wollen wir die Eigenschaften und die Zeitentwicklung der quasiklassischen Zustände des zweidimensionalen harmonischen Oszillators un tersuchen.
4-a Definition der Zustände |α x , α y ⟩ und |αd , αg ⟩ Bei der Konstruktion der quasiklassischen Zustände des zweidimensionalen harmo nischen Oszillators können wir die Ergebnisse für den eindimensionalen Oszillator (s. Ergänzung GV ) verwenden. Wir erinnern uns, dass die Erwartungswerte ⟨X⟩(t) und ⟨P⟩(t) zu jedem Zeitpunkt mit x(t) und p(t) übereinstimmen. Außerdem ist der Er wartungswert des Hamilton-Operators H (bis auf ein „halbes Quant“ ℏω/2) gleich der klassischen Energie. Darüber hinaus zeigten wir in Ergänzung GV , dass die quasi klassischen Zustände zu jedem Zeitpunkt Eigenzustände des Vernichtungsoperators a sind und |α⟩ = ∑ c n (α) |φ n ⟩
(64)
n
lauten, wobei α der Eigenwert von a ist; es ist c n (α) =
α n −|α|2 /2 e √n!
(65)
Drehimpuls eines zweidimensionalen Oszillators
•
| 739
Im vorliegenden Fall können wir die Regeln für Tensorprodukte anwenden, um die quasiklassischen Zustände in der Form ∞
∞
|α x , α y ⟩ = |α x ⟩ ⊗ |α y ⟩ = ∑ ∑ c n x (α x ) c n y (α y ) |φ n x ,n y ⟩
(66)
n x =0 n y =0
mit a x |α x , α y ⟩ = α x |α x , α y ⟩ a y |α x , α y ⟩ = α y |α x , α y ⟩
(67)
zu erhalten. Wir sind dann sicher, dass ⟨X⟩, ⟨P x ⟩, ⟨H x ⟩, ⟨Y⟩, ⟨P y ⟩, ⟨H y ⟩ mit den ent sprechenden klassischen Größen übereinstimmen. Wir greifen nun auf die Definiti on (40) zurück und erhalten mit Gl. (67) ad |α x , α y ⟩ = α d |α x , α y ⟩ ag |α x , α y ⟩ = α g |α x , α y ⟩
(68)
mit 1 (α x − iα y ) √2 1 αg = (α x + iα y ) √2
αd =
(69)
Der Vektor |α x , α y ⟩ ist demnach auch Eigenvektor von ad und ag mit den Eigenwer ten, die in Gl. (69) angegeben sind. Den gemeinsamen Eigenvektor von ad und ag mit den Eigenwerten α d und αg wollen wir mit |α d , α g ⟩ bezeichnen. Es ist leicht zu sehen, dass die Entwicklung von |α d , α g ⟩ in der Basis {|χ nd ,ng ⟩} dieselbe Form hat wie die von |α x , α y ⟩ in der Basis {|φ n x ,n y ⟩}: ∞
∞
|α d , α g ⟩ = ∑ ∑ c nd (α d ) c ng (α g ) |χ nd ,ng ⟩
(70)
nd =0 ng =0
die Koeffizienten c n werden durch Gl. (65) gegeben. Aus (68) und (69) erhalten wir |α x , α y ⟩ = | αd = (α x − iα y )/√2 , α g = (α x + iα y )/√2 ⟩
(71)
Aus den Eigenschaften der Zustände |α⟩ [s. Ergänzung GV , § 3-a] ergibt sich, dass für |ψ(0)⟩ = |α x , α y ⟩ = |α d , α g ⟩
(72)
der Zustandsvektor zur Zeit t gegeben wird durch |ψ(t)⟩ = e−iωt |e−iωt α x , e−iωt α y ⟩ = e−iωt |e−iωt α d , e−iωt α g ⟩
(73)
•
740 | Ergänzung DVI
4-b Erwartungswerte der verschiedenen Observablen Wir setzen α x = |α x | eiφ x
(74)
α y = |α y | eiφ y Die Anwendung der Gleichungen (93) aus Ergänzung GV ergibt dann √2 |α x | cos(ωt − φ x ) β √2 |α y | cos(ωt − φ y ) ⟨Y⟩(t) = β
⟨X⟩(t) =
⟨P x ⟩(t) = −μω ⟨P y ⟩(t) = −μω
√2 β √2 β
(75)
|α x | sin(ωt − φ x ) (76) |α y | sin(ωt − φ y )
Einem Vergleich von (75) und (76) mit (5) und (6) entnehmen wir βxM iφ x e √2 βyM iφ y αy = e √2
αx =
(77)
dabei sind xM , φ x , yM , φ y die Parameter der klassischen Bewegung, der der Zustand |α x , α y ⟩ am ehesten entspricht. Außerdem gilt ⟨N x ⟩ = |α x |2 ⟨N y ⟩ = |α y |2
(78)
und 1 [|α x |2 + |α y |2 + i(α x α ∗y − α ∗x α y )] 2 1 ⟨Ng ⟩ = |α g |2 = [|α x |2 + |α y |2 − i(α x α ∗y − α ∗x α y )] 2
⟨Nd ⟩ = |α d |2 =
(79)
d. h. mit den Beziehungen (46) ⟨H xy ⟩ = ℏω (|α x |2 + |α y |2 + 1) = ℏω (|α d |2 + |α g |2 + 1)
(80)
⟨L z ⟩ = 2ℏ|α x ||α y | sin(φ y − φ x ) = ℏ (|α d |2 − |α g |2 )
(81)
und
Nach (77) ist ⟨L z ⟩ gleich dem klassischen Wert von ℒz [Gl. (10)].
Drehimpuls eines zweidimensionalen Oszillators
| 741
•
Wir betrachten nun die Standardabweichungen des Orts und des Impulses und dann der Energie und des Drehimpulses in einem Zustand |α x , α y ⟩. Aus den Ergebnis sen in Ergänzung GV erhalten wir sofort 1 √ β 2 μω ∆P x = ∆P y = β √2 ∆X = ∆Y =
(82)
Die Standardabweichungen des Orts und des Impulses sind von α x und α y unabhän gig; wenn |α x | und |α y | sehr viel größer als eins sind, haben der Ort und der Impuls des Oszillators eine sehr kleine Streuung um ⟨X⟩, ⟨Y⟩ und ⟨P x ⟩, ⟨P y ⟩. Schließlich berechnen wir die Standardabweichungen der Energie, ∆H xy , und des Drehimpulses, ∆L z . Wie in Ergänzung GV gilt ∆N x = |α x | ∆N y = |α y | ∆Nd = |α d |
(83)
∆Ng = |α g | Der Hamilton-Operator H xy hängt von N = N x + N y ab, und L z ist proportional zu Nd − Ng . Wir haben also beispielsweise zu berechnen (∆N)2 = ⟨(N x + N y )2 ⟩ − ⟨(N x + N y )⟩2 = (∆N x )2 + (∆N y )2 + 2 [⟨N x N y ⟩ − ⟨N x ⟩⟨N y ⟩]
(84)
Nach Gl. (66) wird der Zustand des Systems durch ein Tensorprodukt gegeben; das bedeutet, dass die Observablen N x und N y nicht korreliert sind: ⟨N x N y ⟩ = ⟨N x ⟩⟨N y ⟩
(85)
Daraus folgt (∆N)2 = (∆N x )2 + (∆N y )2
(86)
d. h. ∆H xy = ℏω√|α x |2 + |α y |2 = ℏω√|α d |2 + |α g |2
(87)
Entsprechend ist ∆L z = ℏ√|α d |2 + |α g |2 = ℏ√|α x |2 + |α y |2
(88)
•
742 | Ergänzung EVI
Ergänzung EVI Geladenes Teilchen im Magnetfeld. Landau-Niveaus 1 1-a 1-b 1-c 2 2-a 2-b 2-c 3 3-a 3-b 3-c 3-d
Wiederholung der klassischen Ergebnisse | 742 Bewegung des Teilchens | 742 Das Vektorpotential. Lagrange- und Hamilton-Funktion | 744 Konstanten der Bewegung im homogenen Magnetfeld | 745 Allgemeine Eigenschaften | 747 Quantisierung. Hamilton-Operator | 747 Vertauschungsrelationen | 747 Physikalische Folgerungen | 749 Homogenes Magnetfeld | 750 Eigenwerte des Hamilton-Operators | 751 Observable und Eichung | 753 Die stationären Zustände | 757 Zeitliche Entwicklung | 763
Bisher haben wir unter unterschiedlichen Fragestellungen die Eigenschaften eines Teilchens untersucht, das einem skalaren Potential V(r) unterliegt (mit dem z. B. der Einfluss eines elektrischen Feldes auf ein geladenes Teilchen beschrieben wird). In Kapitel V (harmonischer Oszillator) und Kapitel VII (Teilchen in einem Zentralpoten tial) finden wir weitere Beispiele für Skalarpotentiale. In diesem Abschnitt wollen wir das Verhalten eines Teilchens untersuchen, das einem Vektorpotential A(r) unterwor fen ist, also nach den Eigenschaften eines geladenen Teilchens in einem Magnetfeld fragen. Dabei werden wir einer Reihe rein quantenmechanischer Effekte begegnen, so z. B. den äquidistanten Energieniveaus in einem homogenen Magnetfeld (LandauNiveaus).¹ Bevor wir das Problem quantenmechanisch beschreiben, wiederholen wir kurz einige klassische Ergebnisse.
1 Wiederholung der klassischen Ergebnisse 1-a Bewegung des Teilchens Wenn ein Teilchen der Ladung q am Ort r einem Magnetfeld B(r) ausgesetzt ist, so unterliegt es der Lorentz-Kraft f, f = q v × B(r)
(1)
1 Diese Äquidistanz wird sich als eine Folgerung aus den Eigenschaften des harmonischen Oszillators ergeben und hätte auch in Kapitel V behandelt werden können. Da bei unserer Untersuchung aber auch die Drehimpulseigenschaften von Nutzen sein werden, behandeln wir den Fall an dieser Stelle. https://doi.org/10.1515/9783110638738-064
Geladenes Teilchen im Magnetfeld. Landau-Niveaus |
•
743
wobei v=
dr dt
(2)
die Geschwindigkeit des Teilchens ist. Seine Bewegung gehorcht der Newtonschen Grundgleichung μ
dv =f dt
(3)
(μ ist die Masse des Teilchens). Im Folgenden werden wir oft ein homogenes Magnetfeld betrachten, in dessen Richtung wir die z-Achse legen. Die Lösung von Gl. (3) hat die Form x(t) = x0 + σ cos(ωc t − φ0 ) y(t) = y0 + σ sin(ωc t − φ0 )
(4)
z(t) = v0z t + z0 Dabei sind x0 , y0 , z0 , σ, φ0 und v0z sechs konstante Parameter, die durch die Anfangs bedingungen festgelegt werden. Die Zyklotronfrequenz ωc ist gleich ωc = −q
B μ
(5)
Gemäß (4) beschreibt die Projektion des Teilchenorts auf die x, y-Ebene eine gleich förmige Kreisbewegung mit der Winkelgeschwindigkeit ωc und der Anfangsphase φ0 . Dieser Kreis hat den Radius σ, und sein Mittelpunkt C0 besitzt die Koordinaten x0 und y0 . Die Projektion der Bewegung von M auf die z-Richtung ist eine einfache geradlinig gleichförmige Bewegung. Das Teilchen bewegt sich demnach auf einer kreisförmigen Spirale (Abb. 1), deren Achse parallel zur z-Achse durch den Punkt C0 verläuft.
Abb. 1: Klassische Bahn eines geladenen Teilchens in einem homogenen Magnetfeld. Das Teilchen folgt mit konstanter Geschwindigkeit einer kreisförmigen Spirale, deren Achse parallel zur z-Achse durch den Punkt C 0 verläuft. Die Abbildung stellt den Fall q < 0 (eines Elektrons) dar, d. h. ω c > 0.
•
744 | Ergänzung EVI
Die Bewegung des Punkts Q, also der Projektion von M auf die x, y-Ebene, be schreiben wir durch den Vektor ρ = xex + yey
(6)
(wobei ex und ey die Einheitsvektoren in x- bzw. y-Richtung sind). Die Geschwindig keit von Q ist dρ v⊥ = (7) dt Es ist zweckmäßig, die Komponenten x und y des Vektors C0 Q einzuführen: x = x − x0 y = y − y0
(8)
Da Q eine gleichförmige Kreisbewegung um den Punkt C0 ausführt, haben wir v⊥ = ωc ez × C0 Q
(9)
(ez ist der Einheitsvektor in z-Richtung). Daraus ergibt sich für die Koordinaten x0 und y0 von C0 der Zusammenhang 1 vy ωc 1 y0 = y + vx ωc
x0 = x −
(10)
worin v x und v y die Komponenten von v⊥ bedeuten. 1-b Das Vektorpotential. Lagrange- und Hamilton-Funktion Das Magnetfeld B(r) kann mit Hilfe eines Vektorpotentials A(r) beschrieben werden. Nach Definition ist B(r) = ∇ × A(r)
(11)
Zum Beispiel kann ein homogenes Magnetfeld B durch das Potential 1 A(r) = − r × B 2
(12)
beschrieben werden. Dabei ist zu beachten, dass für ein gegebenes B(r) die Bedin gung (11) das Potential A(r) nicht eindeutig festlegt: Zu A(r) kann der Gradient einer beliebigen Ortsfunktion addiert werden, ohne dass sich B(r) ändert.² Nach Anhang III, § 4-b ist die Lagrange-Funktion des Teilchens Z(r, v) =
1 2 μv + q v ⋅ A(r) 2
(13)
2 Für ein homogenes Feld in z-Richtung könnten wir anstelle des Vektors A(r) aus Gl. (12) z. B. den Vektor mit den Komponenten A x = 0, A y = xB, A z = 0 wählen.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 745
•
Daraus folgt für den zum Ort r kanonisch konjugierten Impuls p = ∇v Z(r, v) = μv + qA(r)
(14)
Die klassische Hamilton-Funktion H(r, p) ist dann H(r, p) =
1 [p − qA(r)]2 2μ
(15)
Es erweist sich als zweckmäßig, H(r, p) = H⊥ (r, p) + H‖ (r, p)
(16)
1 2 {[p x − qA x (r)]2 + [p y − qA y (r)] } 2μ 1 H‖ (r, p) = [p z − qA z (r)]2 2μ
(17)
mit H⊥ (r, p) =
zu setzen. Bemerkung: Unterliegt das Teilchen einem Vektorpotential, so zeigt Gl. (14), dass der Impuls p nicht mehr gleich dem mechanischen Impuls μv ist (wie bei einem skalaren Potential). Weiter ergibt sich aus dem Vergleich von Gl. (14) mit Gl. (15), dass H gleich der kinetischen Energie μv2 /2 des Teilchens ist: Die Lorentz-Kraft (1) steht stets senkrecht auf v und verrichtet somit während der Teilchenbewegung keine Arbeit. Schließlich haben wir zu beachten, dass sich der Drehimpuls 𝓛=r×p
(18)
vom Drall λ = r × μv
(19)
unterscheidet.
1-c Konstanten der Bewegung im homogenen Magnetfeld Wir betrachten den Spezialfall eines homogenen Feldes B. Die Bewegung des Teil chens verläuft so, dass H‖ und H⊥ [Gl. (17)] Konstanten der Bewegung sind.³ Wir setzen Gl. (14) in (10) ein und erhalten 1 [p y − qA y (r)] μωc 1 y0 = y + [p x − qA x (r)] μωc
x0 = x −
(20)
3 Das folgt daraus, dass nach den Gleichungen (14) und (17) H⊥ bzw. H‖ gleich der kinetischen Ener gie μv2⊥ /2 bzw. μv2z /2 der Bewegung senkrecht bzw. parallel zur z-Achse ist.
•
746 | Ergänzung EVI
Daraus folgt, dass für den Radius σ der spiralförmigen Bahn gilt σ 2 = (x − x0 )2 + (y − y0 )2 1 2 2 ) {[p y − qA y (r)] + [p x − qA x (r)]2 } μωc 2 H⊥ = μω2c
=(
(21)
σ 2 ist also proportional zur Hamilton-Funktion H⊥ . Den Drehimpuls des mechanischen Impulses μv bezüglich des Mittelpunkts C0 des Kreises bezeichnen wir mit θ: θ = C0 M × μv
(22)
Die Komponente θ z dieses Drehimpulses lässt sich mit Gl. (20) schreiben: θ z = μ [(x − x0 )v y − (y − y0 )v x ] 1 2 {[p y − qA y (r)] + [p x − qA x (r)]2 } = μωc 2 H⊥ = ωc
(23)
θ z ist demnach, wie zu erwarten, eine Konstante der Bewegung. Die Komponente λ z des Drehimpulses des mechanischen Impulses μv bezüglich O bleibt jedoch im Allge meinen nicht erhalten, da λ z = θ z + μ [x0 v y (t) − y0 v x (t)]
(24)
gilt, nach Gl. (4) λ z also einen zeitlich sinusförmigen Verlauf hat. Wir betrachten schließlich die Projektion ℒz des Drehimpulses 𝓛 auf die z-Achse: ℒz = xp y − yp x
(25)
Nach Gl. (14) lautet sie ℒz = x [μv y + qA y (r)] − y [μv x + qA x (r)]
(26)
Sie hängt damit explizit von der gewählten Eichung ab, d. h. vom Vektorpotential A, das wir zur Beschreibung des Magnetfelds verwendet haben. In den meisten Fällen ist ℒz keine Konstante der Bewegung. Wählt man jedoch die Eichung (12), so folgt aus Gl. (4) ℒz =
qB 2 (x0 + y20 − σ 2 ) 2
(27)
so dass dann ℒz eine Konstante der Bewegung ist. Für Gl. (27) lässt sich keine ein fache physikalische Erklärung angeben, da sie nur in einer bestimmten Eichung gilt. Sie wird sich allerdings in den folgenden Abschnitten bei der quantenmechanischen Untersuchung des Problems als hilfreich erweisen.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 747
•
2 Allgemeine Eigenschaften 2-a Quantisierung. Hamilton-Operator Wir betrachten ein Teilchen in einem beliebigen Magnetfeld, das durch das Vektorpo tential A(x, y, z) beschrieben wird. In der Quantenmechanik wird das Vektorpotential zu einer Operatorfunktion der drei Observablen X, Y und Z. Den Hamilton-Operator H des Teilchens erhält man aus Gl. (15): H=
1 [P − qA(X, Y, Z)] 2 2μ
(28)
Nach Gl. (14) wird der Operator V, der die Geschwindigkeit des Teilchens beschreibt, gegeben durch V=
1 [P − qA(X, Y, Z)] μ
(29)
μ 2 V 2
(30)
so dass H=
2-b Vertauschungsrelationen Die Observablen R und P erfüllen die kanonischen Vertauschungsrelationen [X, P x ] = [Y, P y ] = [Z, P z ] = iℏ
(31)
die anderen Kommutatoren zwischen den Komponenten von R und P verschwinden. Zwei Komponenten von P vertauschen also miteinander. Aus Gl. (29) sehen wir jedoch, dass das für die Komponenten von V nicht erfüllt ist. Zum Beispiel gilt q [V x , V y ] = − 2 {[P x , A y (R)] + [A x (R), P y ]} (32) μ Dieser Ausdruck lässt sich mit Hilfe der in Ergänzung BII [s. Gl. (48)] angegebenen Regeln leicht berechnen: [V x , V y ] =
iqℏ iqℏ ∂A y ∂A x − } = 2 B z (R) { 2 ∂X ∂Y μ μ
(33a)
und analog iqℏ B x (R) μ2 iqℏ [V z , V x ] = 2 B y (R) μ
[V y , V z ] =
(33b) (33c)
Das Magnetfeld geht also explizit in die Vertauschungsrelationen der Geschwindig keitskomponenten ein.
•
748 | Ergänzung EVI Da A(R) mit X, Y und Z vertauscht, folgt aus Gl. (29) [X, V x ] =
1 iℏ [X, P x ] = μ μ
(34a)
und ebenso [Y, V y ] = [Z, V z ] =
iℏ μ
(34b)
(die anderen Kommutatoren zwischen einer Komponente von R und einer Komponen te von V verschwinden). Aus diesen Beziehungen lässt sich ableiten, dass (s. Ergän zung CIII ) ∆X ∆V x ≥
ℏ 2μ
(35)
ist (mit entsprechenden Ungleichungen für die y- und z-Komponenten). Die physikali schen Folgerungen aus den Heisenbergschen Unschärferelationen werden also durch die Gegenwart eines Magnetfelds nicht beeinflusst. Schließlich berechnen wir die Vertauschungsrelationen zwischen den Kompo nenten des Operators Λ = μR × V
(36)
also dem Drehimpuls des mechanischen Impulses bezüglich O.⁴ Wir erhalten [Λ x , Λ y ] = μ 2 [YV z − ZV y , ZV x − XV z ] = μ 2 Y {[V z , Z] V x + Z [V z , V x ]} − μ2 Z 2 [V y , V x ] + μ2 X {Z [V y , V z ] + [Z, V z ] V y }
(37)
d. h. mit den Gleichungen (33) und (34) [Λ x , Λ y ] = iℏ [−μYV x + qYZB y + qZ 2 B z + qXZB x + μXV y ]
(38)
Wir haben also [Λ x , Λ y ] = iℏ [Λ z + qZR ⋅ B(R)]
(39)
(die anderen Kommutatoren ergeben sich durch zyklisches Vertauschen der Indizes x, y und z). Wenn das Feld B ungleich null ist, sind die Vertauschungsrelationen von Λ vollständig anders als die von L. Der Operator Λ besitzt daher a priori nicht die in diesem Kapitel bewiesenen Eigenschaften von Drehimpulsen.
4 Die Komponenten des Drehimpulses L = R × P erfüllen natürlich immer die üblichen Vertau schungsrelationen.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus |
749
•
2-c Physikalische Folgerungen α Die Zeitentwicklung von ⟨R⟩ Die zeitliche Abhängigkeit des Erwartungswerts des Teilchenorts wird durch das Eh renfest-Theorem gegeben: iℏ
d μ2 2 ⟨R⟩ = ⟨[R, H]⟩ = ⟨[R, V ]⟩ dt 2
(40)
[nach Gl. (30)]. Die Beziehungen (34) sind unschwer zu interpretieren. Werden sie in Gl. (40) eingesetzt, so ergibt sich: d ⟨R⟩ = ⟨V⟩ dt
(41)
Wie für ein verschwindendes Magnetfeld ist also der Erwartungswert der Geschwin digkeit gleich der Ableitung von ⟨R⟩. Somit stellt Gl. (41) das quantenmechanische Analogon zu Gl. (2) dar. β Die zeitliche Entwicklung von ⟨V⟩. Lorentz-Kraft Wir berechnen die Zeitableitung des Erwartungswerts der Geschwindigkeit ⟨V⟩: iℏ
d μ2 2 ⟨V⟩ = ⟨[V, V ]⟩ dt 2
(42)
Nach Gl. (33) gilt [V2 , V x ] = [V x2 + V y2 + V z2 , V x ] = V y [V y , V x ] + [V y , V x ] V y + V z [V z , V x ] + [V z , V x ] V z =
iqℏ [−V y B z (R) − B z (R)V y + V z B y (R) + B y (R)V z ] μ2
(43)
daraus ersieht man, dass μ
d ⟨V⟩ = ⟨F(R, V)⟩ dt
(44)
gilt, worin der Operator F(R, V) definiert wird durch F(R, V) =
q [V × B(R) − B(R) × V] 2
(45)
Die beiden Beziehungen entsprechen den klassischen Gleichungen (1) und (3). Aller dings erhalten wir hier einen symmetrisierten Ausdruck für F(R, V) (s. Kap. III, § B-5), weil R und V nicht vertauschen.
•
750 | Ergänzung EVI
γ Die Zeitentwicklung von ⟨Λ⟩ Nun wollen wir iℏ
d ⟨Λ⟩ = ⟨[Λ, H]⟩ dt
(46)
berechnen. Dazu betrachten wir z. B. den Kommutator [XV y − YV x , H]: [XV y − YV x , H] = X [V y , H] + [X, H] V y − Y [V x , H] − [Y, H] V x =
iℏ (XF y − YF x ) + iℏ (V x V y − V y V x ) μ
(47)
Die Operatoren X und V y vertauschen aber ebenso wie Y und V x . Der Kommutator ist daher gleich [V y X − V x Y, H] = V y [X, H] + [V y , H] X − V x [Y, H] − [V x , H] Y =
iℏ (F y X − F x Y) + iℏ (V y V x − V x V y ) μ
(48)
Bilden wir die Hälfte der Summe dieser beiden Ausdrücke, so ergibt sich d⟨Λ z ⟩/ dt in der Form d 1 ⟨Λ z ⟩ = ⟨XF y − YF x − F x Y + F y X⟩ dt 2
(49)
Die Ableitungen von ⟨Λ x ⟩ und ⟨Λ y ⟩ lassen sich entsprechend bestimmen, so dass wir schließlich erhalten d 1 ⟨Λ⟩ = ⟨R × F(R, V) − F(R, V) × R⟩ dt 2
(50)
Das klassische Analogon dieser Beziehung lautet d λ = r × f(r, v) dt
(51)
und drückt ein wohlbekanntes Theorem aus: Die Zeitableitung des Drehimpulses ei nes mechanischen Impulses bezüglich eines festen Punkts O ist gleich dem Dreh moment bezüglich O der auf das Teilchen wirkenden Kraft.
3 Homogenes Magnetfeld Für ein homogenes Magnetfeld lassen sich die obigen Überlegungen leicht weiterfüh ren. Wir wählen das Feld B in z-Richtung. Die Vertauschungsrelationen (33) werden dann unter Verwendung von Definition (5) zu [V x , V y ] = −i
ℏωc μ
[V y , V z ] = [V z , V x ] = 0
(52a) (52b)
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 751
•
Bemerkung: Bei Anwendung der Ergebnisse von Ergänzung CIII auf V x und V y folgt aus Gl. (52a), dass die Standardabweichungen die Ungleichung ∆V x ∆V y ≥
ℏ|ωc | 2μ
(53)
erfüllen. Die Komponenten der Geschwindigkeit V⊥ sind somit nicht kompatibel.
3-a Eigenwerte des Hamilton-Operators In Analogie zu Gl. (16) kann H in der Form H = H⊥ + H‖ geschrieben werden mit μ H⊥ = (V x2 + V y2 ) 2 μ H‖ = V z2 2
(54)
(55a) (55b)
Nach Gl. (52b) gilt [H⊥ , H‖ ] = 0
(56)
Wir können nun nach einer Basis aus gemeinsamen Eigenvektoren von H⊥ (Eigen werte E⊥ ) und H‖ (Eigenwerte E‖ ) suchen; ihre Vektoren sind dann automatisch Eigenvektoren von H mit den Eigenwerten E = E⊥ + E‖
(57)
α Eigenwerte von H‖ Die Eigenvektoren des Operators V z sind ebenso Eigenvektoren von H‖ . Bei Z und V z handelt es sich um zwei hermitesche Operatoren, die die Beziehung [Z, V z ] =
iℏ μ
(58)
erfüllen. Wir können daher die Ergebnisse von Ergänzung EII auf sie anwenden; ins besondere enthält das Spektrum von V z alle reellen Zahlen. Folglich haben die Eigenwerte von H‖ die Form μ 2 (59) v 2 z wobei v z eine beliebige reelle Konstante ist. Das Spektrum von H‖ ist also kontinuier lich: Die Energie E‖ kann jeden nichtnegativen Wert annehmen. Die Interpretation dieses Ergebnisses ist klar: H‖ beschreibt die kinetische Energie eines Teilchens, das sich frei in z-Richtung bewegt (wie in der klassischen Mechanik, s. § 1-a). E‖ =
•
752 | Ergänzung EVI
β Eigenwerte von H⊥ Wir wollen annehmen, dass das Teilchen eine negative Ladung q trägt; die Zyklotron frequenz ωc ist dann positiv [Gl. (5)].⁵ Wir setzen ̂ = √ μ Vy Q ℏωc μ Ŝ = √ Vx ℏωc
(60)
Gleichung (52a) wird damit zu ̂ =i [̂ Q, S]
(61)
während H⊥ lautet H⊥ =
ℏωc ̂2 ̂ 2 (Q + S ) 2
(62)
H⊥ hat also dieselbe Form wie der Hamilton-Operator eines eindimensionalen harmo ̂ die Gl. (61) erfüllen, nischen Oszillators [s. Kap. V, Gl. (B-4)]. Die Operatoren ̂ Q und S, ̂ und des Impulses P ̂ dieses Oszillators ein. nehmen dabei die Rolle des Orts X Wir können dann für die Operatoren ̂ Q und Ŝ dieselben Überlegungen anstellen ̂ und P. ̂ Zum Beispiel lässt sich leicht zeigen, dass für einen wie in Kapitel V, § B-2 für X Eigenvektor |φ⊥ ⟩ von H⊥ , H⊥ |φ⊥ ⟩ = E⊥ |φ⊥ ⟩
(63)
die Vektoren 1 ̂ ̂ (Q + iS) |φ⊥ ⟩ √2 1 ̂ ̂ |φ (Q − iS) |φ⊥ ⟩ ⊥⟩ = √2 |φ⊥ ⟩ =
(64a) (64b)
ebenfalls Eigenvektoren von H⊥ sind: H⊥ |φ⊥ ⟩ = (E⊥ − ℏωc ) |φ⊥ ⟩
(65a)
H⊥ |φ ⊥⟩
(65b)
= (E⊥ +
ℏωc ) |φ ⊥⟩
Daraus schließen wir, dass die möglichen Werte von E⊥ gegeben werden durch E⊥ = (n +
1 ) ℏωc 2
(66)
worin n eine nichtnegative ganze Zahl ist.
5 Für eine positive Ladung q kann man die Konvention eines positiven Werts von ωc aufrechterhalten, indem man die z-Achse antiparallel zum Magnetfeld wählt.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 753
•
γ Eigenwerte von H Aus den vorstehenden Ergebnissen ergeben sich die Eigenwerte des Gesamt-Hamil ton-Operators H in der Form 1 1 (67) E(n, v z ) = (n + ) ℏωc + μv2z 2 2 Die zugehörigen Niveaus bezeichnet man als Landau-Niveaus. Für einen vorgegebenen Wert v z treten alle möglichen Werte von n (nichtnegative ganze Zahlen) tatsächlich auf. Durch die wiederholte Anwendung des Operators (̂ Q± ̂ √2 auf einen Eigenvektor von H mit dem Eigenwert E(n, v z ) kann man nach Gl. (65) iS)/ einen Zustand mit der Energie E(n , v z ) erhalten, wobei n eine beliebige ganze Zahl ist und v z sich nicht geändert hat (da ̂ Q und Ŝ mit H‖ vertauschen). Die Projektion der Bewegung in die x, y-Ebene ist also im Gegensatz zur Bewegung längs der z-Achse quantisiert. Bemerkung: Wir zeigten in Kapitel V, § B-3, dass die Energieniveaus des eindimensionalen harmonischen Oszillators in Hx nichtentartet sind. Hier haben wir es mit einer anderen Situation zu tun, da sich das betrachtete Teilchen im dreidimensionalen Raum bewegt. Da 1 ̂ ̂ μ (V y + iV x ) ( Q + iS) = √ 2ℏωc √2 der Vernichtungsoperator eines Quants ℏωc ist, handelt es sich bei den Eigenvektoren von H ⊥ mit n = 0 um Lösungen der Gleichung (V y + iV x ) |φ⟩ = 0
(68)
Vektoren, die Gl. (68) erfüllen, können aber Eigenvektoren von H ‖ mit einem beliebigen (posi tiven) Eigenwert sein. Und selbst für einen festen Wert von v z handelt es sich bei Gl. (68) um eine partielle Differentialgleichung in x und y mit einer unendlichen Anzahl von Lösungen. Die Energien E(n = 0, v z ) sind somit unendlichfach entartet. Unter Verwendung des Erzeugungsope rators für ein Quant lässt sich dann leicht zeigen, dass dasselbe für sämtliche Niveaus E(n, v z ) (mit einer beliebigen nichtnegativen ganzen Zahl n) gilt.
3-b Observable und Eichung Wir präzisieren die vorstehenden Ergebnisse und bestimmen die stationären Zustände des Systems, damit wir ihre physikalischen Eigenschaften untersuchen können. Dazu ist es notwendig, eine bestimmte Eichung zu wählen: Wir wählen die durch Gl. (12) gegebene. Die Komponenten der Geschwindigkeit lauten dann P x ωc Vx = − Y μ 2 P y ωc + X (69) Vy = μ 2 Pz Vz = μ
•
754 | Ergänzung EVI
α Die Hamilton-Operatoren H⊥ und H‖ Wir setzen die durch (69) gegebenen Ausdrücke in (55) ein und erhalten (mit L z als der z-Komponente des Drehimpulses) H⊥ = H‖ =
P2x + P2y 2μ
+
μω2c ωc Lz + (X 2 + Y 2 ) 2 8
P2z 2μ
(70a) (70b)
In der Ortsdarstellung ist H‖ ein Operator, der nur auf die Variable z wirkt; H⊥ wirkt hingegen nur auf x und y. Man kann daher eine Basis von Eigenzuständen von H finden, indem man in Hz die Eigenwertgleichung von H‖ und dann in Hxy die von H⊥ löst. Danach bilden wir das tensorielle Produkt der beiden sich ergebenden Vektoren. Die Eigenwertgleichung von H‖ führt auf die Wellenfunktionen φ(z) =
1 √2πℏ
eip z z/ℏ
(71)
mit E‖ =
p2z 2μ
(72)
[erneut ergibt sich Gl. (59)]. Wir müssen nun noch die Eigenwertgleichung von H⊥ in Hxy lösen; die betrachteten Wellenfunktionen hängen von x und y, aber nicht von z ab. Ein Vergleich von Gl. (70a) mit Gl. (12a) aus Ergänzung DVI zeigt, dass H⊥ in Ab hängigkeit von dem Hamilton-Operator H xy eines zweidimensionalen harmonischen Oszillators ausgedrückt werden kann: ωc Lz (73) H⊥ = H xy + 2 wenn wir für den Wert der in H xy eingehenden Konstanten ωc (74) ω= 2 setzen. In Ergänzung DVI haben wir gezeigt, dass H xy und L z einen V. S. K. O. in Hxy bil den und konstruierten eine Basis von gemeinsamen Eigenvektoren |χ nd ,ng ⟩ der beiden Observablen [s. Gl. (47) von Ergänzung DVI ]. Die Vektoren |χ nd ,ng ⟩ sind auch Eigenvek toren von H⊥ ; Ergänzung DVI gibt also bereits die Lösungen der Eigenwertgleichung von H⊥ an. Bemerkungen: 1. Wir haben in § 3-a gesehen, dass H ⊥ in einer Form geschrieben werden kann, die analog zum Hamilton-Operator eines eindimensionalen harmonischen Oszillators ist. Hier haben wir nun in einer bestimmten Eichung festgestellt, dass derselbe Operator H ⊥ ebenso einfach mit dem Ha milton-Operator H xy eines zweidimensionalen harmonischen Oszillators zusammenhängt. Diese beiden Ergebnisse widersprechen sich nicht: Sie resultieren aus zwei verschiedenen Zerlegun gen des Hamilton-Operators und müssen offenbar auf die gleichen physikalischen Ergebnisse führen.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus |
755
•
2. Man darf nicht aus dem Auge verlieren, dass der Hamilton-Operator H ⊥ ein physikalisches Problem beschreibt, das von dem eines zweidimensionalen harmonischen Oszillators grundle gend verschieden ist. Das geladene Teilchen unterliegt hier einem Vektorpotential (das ein homo genes Magnetfeld beschreibt) und keinem harmonischen Skalarpotential (das z. B. einem nicht homogenen elektrischen Feld entspricht). In der hier gewählten Eichung lassen sich allerdings die Effekte des Magnetfelds mit Hilfe eines fiktiven harmonischen Skalarpotentials beschreiben.
β Observable in Abhängigkeit von den Erzeugungs- und Vernichtungsoperatoren zirkularer Quanten Wir wollen die Observablen, die die physikalischen Größen des Teilchens beschrei ben, mit Hilfe der in Ergänzung DVI durch die Gleichungen (40) definierten Operato ren ad und ag und ihrer Adjungierten a†d und a†g ausdrücken (dabei werden wir auch die Operatoren Nd = a†d ad und Ng = a†g ag verwenden). Wir setzen die Beziehungen (46) aus Ergänzung DVI in Gl. (73) ein und erhalten⁶ H⊥ = (Nd +
1 ) ℏωc 2
(75)
Die Energie des Zustands |χ nd ,ng ⟩ ist demnach E⊥ = (nd +
1 ) ℏωc 2
(76)
wie wir bereits in Gl. (66) festgestellt haben. Da E⊥ unabhängig von ng ist, sind sämt liche Eigenwerte von H⊥ unendlichfach entartet. Mit Gl. (23) und den Beziehungen (40) aus Ergänzung DVI können wir schreiben 1 (ad + a†d + ag + a†g ) 2β i Y= (ad − a†d − ag + a†g ) 2β X=
(77)
wobei β definiert ist durch [s. Gl. (74)] β=√
μωc 2ℏ
(78)
Entsprechend gilt iℏβ (−ad + a†d − ag + a†g ) 2 ℏβ (ad + a†d − ag − a†g ) Py = 2
Px =
(79)
6 Wir haben ωc als positiv angenommen. Wenn ωc negativ wäre, würden in einigen Gleichungen die Indizes d und g vertauscht werden. Zum Beispiel lautete Gl. (75) H ⊥ = (N g + 1/2)ℏ|ωc |.
•
756 | Ergänzung EVI
Das Einsetzen dieser Ausdrücke in Gl. (69) ergibt iωc (ad − a†d ) 2β ωc (ad + a†d ) Vy = 2β
Vx = −
(80)
Da ad und a†d nicht mit Nd vertauschen, folgt aus Gl. (75), dass V x und V y wie in der klassischen Mechanik keine Konstanten der Bewegung sind. Außerdem erhalten wir, wenn wir nun die Vertauschungsrelationen von ad und a†d verwenden, wieder Gl. (52a). Es ist interessant, die quantenmechanischen Operatoren zu untersuchen, die den verschiedenen Variablen entsprechen, die wir oben bei der Beschreibung der klassi schen Bewegung eingeführt haben (§ 1): die Koordinaten (x0 , y0 ) des Mittelpunkts der klassischen Bahn, die Komponenten (x , y ) des Vektors C0 Q usw. Wie üblich bezeich nen wir die entsprechenden Operatoren mit Großbuchstaben und die klassischen Va riablen mit Kleinbuchstaben. In Analogie zu Gl. (10) setzen wir also 1 1 X0 = X − Vy = (81a) (ag + a†g ) ωc 2β 1 i Y0 = Y + Vx = (81b) (a† − ag ) ωc 2β g Die Operatoren ag und a†g vertauschen mit Nd ; demnach sind X0 und Y0 Konstanten der Bewegung. Aus den Gleichungen (81) folgt weiterhin [X0 , Y0 ] =
iℏ i = 2 μωc 2β
(82)
Folglich sind X0 und Y 0 inkompatible physikalische Größen, und ihre mittleren qua dratischen Abweichungen hängen über ∆X0 ∆Y0 ≥
ℏ 2μωc
zusammen. Weiter definieren wir 1 (ad + a†d ) X = X − X0 = 2β i Y = Y − Y0 = (ad − a†d ) 2β
(83)
(84)
Offenbar sind X und Y wie in der klassischen Mechanik keine Konstanten der Be wegung, vielmehr sind sie wie die klassischen Variablen [Gl. (9)] proportional zu V y bzw. V x : V x = −ωc Y V y = ωc X
(85)
Mit Gl. (53) folgt dann ∆X ∆Y ≥
ℏ 2μωc
(86)
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 757
•
Den Operator zu σ 2 (das Quadrat des klassischen Bahnradius) wollen wir mit Σ2 bezeichnen: Σ2 = (X − X0 )2 + (Y − Y 0 )2
(87)
Nach Gl. (81) gilt also Σ2 = (
1 2 2 2 ) (V x + V y2 ) = H⊥ ωc μω2c
(88)
Σ2 ist demnach wie σ 2 in der klassischen Mechanik eine Konstante der Bewegung. Der Operator des Drehimpulses bezüglich O des mechanischen Impulses μv lautet schließlich Θ z = μ [(X − X0 ) V y − (Y − Y 0 ) V x ]
(89)
wobei dann mit Gl. (81) wie in Gl. (23) folgt Θz =
2 H⊥ ωc
(90)
Θ z ist also eine Konstante der Bewegung. Der Operator Λ z jedoch, die z-Komponente von μR × V, wird gegeben durch Λz =
2 H⊥ + ℏ (ad ag + a†d a†g ) ωc
(91)
und vertauscht demnach nicht mit H⊥ .
3-c Die stationären Zustände Wir haben oben festgestellt, dass die Eigenwerte des Hamilton-Operators H⊥ in Hxy unendlichfach entartet sind. Zu jeder nichtnegativen ganzen Zahl n gibt es einen un (n) endlichdimensionalen Unterraum Hxy von Hxy , dessen Vektoren alle Eigenvektoren von H⊥ mit demselben Eigenwert (n + 1/2)ℏωc sind. In diesem Abschnitt wollen wir unterschiedliche Basen untersuchen, die in diesen Unterräumen gewählt werden kön nen. Dazu geben wir zunächst die allgemeinen Eigenschaften der Zustände an, die für jede beliebige Basis aus Eigenzuständen von H⊥ gültig sind. α Allgemeine Eigenschaften Aus den Gleichungen (88) und (90) folgt, dass jeder stationäre Zustand notwendig Eigenvektor von Σ2 und Θ z ist; die entsprechenden physikalischen Größen sind also in einem solchen Zustand wohldefiniert und haben die Werte (2n + 1)ℏ/μωc
für Σ2
(2n + 1)ℏ
für Θ z
(92)
Diese Werte sind proportional zur Energie, was mit der klassischen Beschreibung der Bewegung übereinstimmt (s. § 1).
•
758 | Ergänzung EVI
Aus den Gleichungen (80) und (84) ersehen wir, dass X , Y , V x und V y innerhalb (n) eines bestimmten Unterraums Hxy keine nichtverschwindenden Matrixelemente be sitzen. Für einen stationären Zustand folgt somit ⟨V x ⟩ = ⟨V y ⟩ = 0
(93)
⟨X ⟩ = ⟨Y ⟩ = 0
Da jedoch V x und V y (und damit X und Y ) keine Konstanten der Bewegung sind, be sitzen die entsprechenden physikalischen Größen in einem stationären Zustand kei ne genau festgelegten Werte. Vielmehr lässt sich mit den Gleichungen (80) und (84) sowie unter Verwendung der Eigenschaften des eindimensionalen harmonischen Os zillators [s. Gl. (D-5) in Kap. V] zeigen, dass in Übereinstimmung mit Gl. (53) ∆V x = ωc ∆Y = √(n +
1 ℏωc ) 2 μ
1 ℏωc ∆V y = ωc ∆X = √(n + ) 2 μ
(94)
gilt. Darüber hinaus sehen wir, dass der einzige stationäre Zustand, in dem das Pro dukt ∆V x ∆V y (oder ∆X ∆Y ) seinen minimalen Wert annimmt, der Grundzustand (n = 0) ist. Bemerkung: Die verschiedenen Grundzustände sind Lösungen der Gleichung ad |φ⟩ = 0
(95a)
d. h. mit Gl. (80) (V y + iV x ) |φ⟩ = 0
(95b)
Dieses Ergebnis fanden wir bereits in Gl. (68).
β Die Zustände |χ nd ,ng ⟩ In Ergänzung DVI verwendeten wir die Tatsache, dass H⊥ und L z in Hxy einen V. S. K. O. bilden, um eine Basis aus gemeinsamen Eigenvektoren dieser beiden Observablen zu konstruieren. Diese Basis wird aus den Vektoren |χ nd ,ng ⟩ gebildet, da nach Gl. (75) und Gl. (46) aus Ergänzung DVI gilt 1 ) ℏωc |χ nd ,ng ⟩ 2 L z |χ nd ,ng ⟩ = (nd − ng )ℏ |χ nd ,ng ⟩
H⊥ |χ nd ,ng ⟩ = (nd +
(n)
(96a) (96b)
Der Unterraum Hxy , der durch die Angabe einer nichtnegativen ganzen Zahl n definiert wird, wird somit durch die Menge von Vektoren |χ nd ,ng ⟩ mit nd = n aufge spannt. Die Eigenwerte von L z , die zu diesen Vektoren gehören, sind von der Form mℏ,
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 759
•
wobei m für festes n Werte zwischen −∞ und n annehmen kann (die Grundzustände entsprechen also negativen Werten von m; das liegt an unserer oben gestellten Bedin gung ωc > 0). Die zu diesen Zuständen |χ nd ,ng ⟩ gehörenden Wellenfunktionen wurden in Ergänzung DVI , § 3-a berechnet. Zu beachten ist, dass die Zustände |χ nd ,ng ⟩ zwar Eigenzustände des Operators L z , nicht aber des Operators Λ z des Drehimpulses des mechanischen Impulses sind. Das ergibt sich direkt aus Gl. (91). In einem Zustand |χ nd ,ng ⟩ sind die Erwartungswerte ⟨X0 ⟩ und ⟨Y0 ⟩ nach Gl. (81) gleich null. Weder X0 noch Y0 aber sind wohldefinierte physikalische Größen: Aus den Eigenschaften des eindimensionalen harmonischen Oszillators zeigt man leicht, dass in einem Zustand |χ nd ,ng ⟩ gilt ∆X0 = √(ng +
ℏ 1 ) 2 μωc
(97)
1 ℏ ∆Y0 = √(ng + ) 2 μωc
Der minimale Wert des Produkts ∆X0 ∆Y0 wird somit für die Zustände |χ nd ,ng =0 ⟩ ange nommen, d. h. für die Zustände mit einer Energie E⊥ = (n + 1/2)ℏωc , für die L z seinen maximalen Wert nℏ hat [s. Gl. (96)]. Wir betrachten nun den Operator Γ2 = X02 + Y02
(98)
Er entspricht dem Quadrat des Abstands vom Mittelpunkt C0 der Bahn zum Ursprung. Mit Gl. (81) finden wir leicht ℏ (ag a†g + a†g ag ) μωc ℏ (2Ng + 1) = μωc
Γ2 =
(99)
Der Zustand |χ nd ,ng ⟩ ist demnach ein Eigenzustand von Γ2 mit einem Eigenwert (2ng + 1)ℏ/μωc ; der Umstand, dass dieser Eigenwert nie null werden kann, hängt damit zu sammen, dass X0 und Y 0 nicht vertauschen. Bemerkung: Der Operator L z wird nach Gl. (75) und Gl. (99) gegeben durch L z = ℏ(N d − N g ) = ℏ (
1 μωc 2 1 H⊥ − − Γ + ] ℏωc 2 2ℏ 2
(100)
d. h. mit Gl. (88) Lz =
μωc 2 qB 2 (Σ − Γ 2 ) = (Γ − Σ2 ) 2 2
hierbei handelt es sich um das Analogon zur klassischen Gl. (27).
(101)
•
760 | Ergänzung EVI
γ Andere Typen stationärer Zustände Jede Linearkombination der Kets |χ nd ,ng ⟩ mit demselben Wert von nd ist wieder ein Eigenzustand von H⊥ und besitzt daher die oben angegebenen Eigenschaften. Durch entsprechende Wahl der Koeffizienten in der Linearkombination lassen sich Zustände konstruieren, die weitere interessante Eigenschaften besitzen. Zum Beispiel wissen wir, dass X0 und Y 0 Konstanten der Bewegung sind (s. § 3-b-β). Da diese beiden Operatoren jedoch nicht vertauschen, besitzen sie keine gemeinsa men Eigenzustände. Das heißt aber in der Quantenmechanik, dass es unmöglich ist, einen Zustand zu erhalten, in dem beide Koordinaten des Punkts C0 bekannt sind. Um gemeinsame Eigenzustände von H⊥ und X0 zu konstruieren, verwenden wir die Eigenschaften des eindimensionalen harmonischen Oszillators; aus Gl. (81a) geht hervor, dass X0 bis auf einen konstanten Faktor durch denselben Ausdruck gegeben wird wie der Ortsoperator Xg eines eindimensionalen Oszillators, dessen Vernich tungsoperator gleich ag ist: X0 =
1 ̂ Xg β √2
(102)
̂ k (̂x ) der stationären Zustände |̂ φ k ⟩ eines eindimen Da wir die Wellenfunktionen φ sionalen harmonischen Oszillators kennen (s. Ergänzung BV , § 2-b), können wir die Eigenvektoren |̂x⟩ des Ortsoperators als Linearkombinationen der Zustände |̂ φk ⟩ schreiben: ∞
|̂x ⟩ = ∑ |̂ φ k ⟩⟨̂ φ k |̂x⟩ k=0 ∞
̂∗k (̂x ) |̂ φk ⟩ =∑φ
(103)
k=0
Um die gemeinsamen Eigenzustände von H⊥ und X0 zu erhalten, wendet man einfach dieses Ergebnis auf die Zustände |χ nd ,ng =k ⟩ an; der Vektor ∞
̂∗k (β √2x0 ) |χ nd =n,ng=k ⟩ |ξ n,x0 ⟩ = ∑ φ
(104)
k=0
ist ein gemeinsamer Eigenvektor von H⊥ und X0 mit den Eigenwerten (n + 1/2)ℏωc und x0 . Die gemeinsamen Eigenzustände |η n,y0 ⟩ von H⊥ und Y0 lassen sich genauso be stimmen. Gleichung (81b) besagt, dass Y0 proportional zum Impulsoperator Pg des fiktiven eindimensionalen Oszillators ist: 1 ̂ (105) Y0 = Pg √ β 2 Folglich [s. Gl. (20] in Ergänzung DV ) gilt ∞
φ∗k (β √2y0 ) |χ nd =n,ng =k ⟩ |η n,y0 ⟩ = ∑ ik ̂ k=0
(106)
Geladenes Teilchen im Magnetfeld. Landau-Niveaus |
761
•
Wir haben soeben die Zustände konstruiert, in denen entweder X0 oder Y0 ei nen wohldefinierten Wert haben. Wir können ebenso die stationären Zustände be stimmen, in denen das Produkt ∆X0 ∆Y0 seinen in Gl. (83) gegebenen minimalen Wert annimmt. Für den eindimensionalen harmonischen Oszillator untersuchten wir in Er ̂ P ̂ minimal wird; dabei handelt es sich um die gänzung GV die Zustände, für die ∆ X∆ quasiklassischen Zustände ∞
|α⟩ = ∑ c k (α) |φ k ⟩
(107)
k=0
mit c k (α) =
α k −|α|2 /2 e √k!
(108)
In diesen Zuständen ist ̂ = ∆P ̂= 1 ∆X √2
(109)
Für unseren Fall folgt daraus, dass im Zustand ∞
|θ n,α0 ⟩ = ∑ c k (α 0 ) |χ nd =n,ng=k ⟩
(110)
k=0
die Standardabweichungen für X0 und Y 0 durch ∆X0 = ∆Y0 =
1 2β
(111)
gegeben werden. Das Produkt ∆X0 ∆Y0 ist somit minimal. Bemerkung: Das hier behandelte physikalische Problem ist invariant in Bezug auf Translationen, da das Magnetfeld homogen ist. Bisher ist diese Symmetrie jedoch durch die spezielle Wahl der Ei chung (12), in der der Ursprung O den anderen Raumpunkten gegenüber ausgezeichnet ist, verdeckt worden. Folglich sind weder der Hamilton-Operator H noch seine Eigenzustände trans lationsinvariant. Wir wissen jedoch (s. Ergänzung HIII ), dass die physikalischen Aussagen der Quantenmechanik eichinvariant sind. Die Vorhersagen müssen gleich bleiben, wenn wir durch einen Wechsel der Eichung einen anderen Punkt als O auszeichnen. Die Translationssymmetrie muss also zum Vorschein kommen, wenn wir die physikalischen Eigenschaften der Zustände untersuchen. Um das genauer zu erkennen, nehmen wir an, zu einem gegebenen Zeitpunkt werde der Zustand des Teilchens in der Eichung (12) durch den Vektor |ψ⟩ mit der Wellenfunktion ⟨r|ψ⟩ = ψ(r) be schrieben. Wir führen dann eine Translation T aus, die durch den Vektor a definiert wird, und betrachten den Zustandsvektor |ψT ⟩ = e−iP⋅a/ℏ |ψ⟩
(112)
zu diesem Vektor gehört den Ergebnissen in Ergänzung EII zufolge die Wellenfunktion ψT (r) = ⟨r|ψT ⟩ = ψ(r − a)
(113)
•
762 | Ergänzung EVI
Dieselbe Translation kann auch auf das Vektorpotential angewandt werden, das dann 1 AT (r) = A(r − a) = − (r − a) × B 2
(114)
heißt. AT (r) beschreibt offenbar dasselbe Magnetfeld wie A(r). Da die physikalischen Eigen schaften eines bestimmten Zustandsvektors nur von diesem Vektor und dem gewählten Potential A abhängen, müssen diese Eigenschaften der Translation T unterworfen werden, wenn ψ(r) und A(r) durch die Ausdrücke (113) bzw. (114) ersetzt werden. Aus diesen Beziehungen erhält man leicht die Ausdrücke für die Wahrscheinlichkeitsdichte des Zustands |ψT ⟩, ρT (r) = |ψT (r)|2 = |ψ(r − a)|2 = ρ(r − a)
(115)
und den entsprechenden Strom JT (r), berechnet aus dem Vektorpotential AT (r), 1 ℏ q {ψ∗T (r) [ ∇ + (r − a) × B] ψT (r) + k. k.} 2μ i 2 1 ℏ q = {ψ∗ (r − a) [ ∇ + (r − a) × B] ψ(r − a) + k. k.} 2μ i 2
JT (r) =
= J(r − a)
(116)
[J(r) ist der Wahrscheinlichkeitsstrom von ψ(r) in der Eichung (12)]. Der Vektor |ψT ⟩ beschreibt also in der neuen Eichung AT (r) einen Zustand, dessen physikalische Eigenschaften mit denen des Zustands |ψ⟩ in der Eichung A(r) über die Translation T zusammenhängen. Darüber hinaus wollen wir nun zeigen, dass die Translation einer möglichen Bewegung wieder zu einer möglichen Bewegung führt; damit ist dann der Beweis der Translationsinvarianz des Problems abgeschlossen. Dazu betrachten wir die Schrödinger-Gleichung in der Ortsdarstellung und in der Eichung A(r): iℏ
2 ∂ 1 ℏ ψ(r, t) = [ ∇ − qA(r)] ψ(r, t) ∂t 2μ i
(117)
Gehen wir in dieser Gleichung von r nach r − a über, so erhalten wir mit Gl. (113) und (114) iℏ
2 ∂ 1 ℏ ψT (r, t) = [ ∇ − qAT (r)] ψT (r, t) ∂t 2μ i
(118)
Der Operator auf der rechten Seite dieser Gleichung ist der Hamilton-Operator in der Eichung AT (r). Wenn also ψ(r, t) in der Eichung A(r) eine mögliche Bewegung beschreibt, stellt ψT (r, t) in der äquivalenten Eichung AT (r) wiederum eine mögliche Bewegung dar; diese Bewegung ist einfach das Ergebnis einer Translation der ersten Bewegung. Wenn insbesondere ψ(r, t) = φ(r) e−iEt/ℏ ein stationärer Zustand [in der Eichung A(r)] ist, so ist ψT (r, t) = φ T (r) e−iEt/ℏ wiederum ein stationärer Zustand [in der Eichung AT (r)]. Wollen wir nach einer Translation T des physikalischen Zustands des Teilchens weiter in der Eichung (12) bleiben, so müssen wir den transformierten Zustand durch einen Vektor |ψT ⟩ be schreiben, der von |ψT ⟩ verschieden ist. Gemäß den Ergebnissen in § 3-b-α von Ergänzung HIII ergibt sich der Vektor |ψT ⟩ durch eine unitäre Transformation aus |ψT ⟩: |ψT ⟩ = T χ |ψT ⟩
(119)
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 763
•
Der Operator T χ wird durch T χ = eiqχ(R)/ℏ
(120)
gegeben, worin χ(r) die Funktion ist, die die Eichtransformation beschreibt. Hier lautet das Po tential nach der Eichtransformation 1 1 A(r) = − r × B = AT (r) − a × B 2 2
(121)
so dass wir haben 1 χ(r) = − r ⋅ (a × B) 2
(122)
Wir setzen die Gleichungen (112), (120) und (122) in Gl. (119) ein und erhalten schließlich |ψT ⟩ = U(a) |ψ⟩
(123)
U(a) = e−iqR⋅(a×B)/2ℏ e−iP⋅a/ℏ
(124)
mit
Wenn wir also in der Eichung A(r) bleiben wollen, wird der Translationsoperator durch U(a) ge geben [Gl. (124)]. In Gl. (124) gehen die Komponenten von R und P in Bezug auf zwei aufeinander senkrecht ste hende Achsen ein; sie vertauschen somit, so dass wir schreiben können U(a) = e−iqR⋅(a×B)/2ℏ−iP⋅a/ℏ
(125)
Wenn a ein Vektor der x, y-Ebene ist, ergibt eine einfache Rechnung mit Hilfe von Gl. (10) und (69) U(a) = eiq(a×R0 )⋅B/ℏ
(126)
R0 = X0 ex + Y0 ey
(127)
mit
Die Operatoren X0 und Y0 (die Koordinaten des Kreismittelpunkts) stehen also in Zusammenhang mit infinitesimalen Translationen in Richtung der x- bzw. y-Achse.
3-d Zeitliche Entwicklung α Erwartungswerte der Observablen Wir haben bereits eine Reihe von physikalischen Größen kennengelernt, die Konstan ten der Bewegung sind: X0 , Y 0 , Θ z , Σ2 . Unabhängig vom Zustand des Systems sind ihre Erwartungswerte nicht von der Zeit abhängig. Wir betrachten nun die zeitliche Entwicklung der Erwartungswerte ⟨X⟩, ⟨Y⟩, ⟨V x ⟩, ⟨V y ⟩ und ⟨X ⟩, ⟨Y ⟩. Die entsprechenden Operatoren haben nur Matrixelemente zwi schen den Zuständen |χ nd ,ng ⟩, deren Werte von nd sich um ±1 (oder 0) unterscheiden. Die Zeitentwicklung dieser Erwartungswerte enthält somit nur eine Bohr-Frequenz, bei der es sich um die in Gl. (5) definierte Zyklotronfrequenz ωc /2π handelt. Dieses Ergebnis ist analog zu dem der klassischen Mechanik.
•
764 | Ergänzung EVI
β Quasiklassische Zustände Wir nehmen an, zur Zeit t = 0 sei der Zustand des Teilchens gleich |ψ⊥ (0)⟩ = |α d , α g ⟩
(128)
wobei der Vektor |α d , α g ⟩ durch Gl. (70) in Ergänzung DVI definiert ist. Da der Aus druck (75) für H⊥ nur Nd , aber nicht Ng enthält, ergibt sich der Zustandsvektor |ψ⊥ (t)⟩ zur Zeit t durch den Wechsel von α d nach α d e−iωc t [s. Ergänzung GV , Gl. (92)]: |ψ⊥ (t)⟩ = e−iωc t/2 |α d e−iωc t , α g ⟩
(129)
Wir setzen α d = |α d | eiφd
(130)
α g = |α g | eiφg Aus den Gleichungen (80), (81) und (84) erhalten wir dann 1 (α g + α ∗g ) = 2β i ⟨Y 0 ⟩ = (α ∗ − α g ) = 2β g
⟨X0 ⟩ =
|α g | cos φg β |α g | sin φg β
1 (α d e−iωc t + α ∗d eiωc t ) = 2β i (α d e−iωc t − α ∗d eiωc t ) = ⟨Y ⟩(t) = 2β ⟨X ⟩(t) =
(131)
|α d | cos(ωc t − φd ) β |α d | sin(ωc t − φd ) β
(132)
und |α d | ωc sin(ωc t − φd ) β |α d | ωc cos(ωc t − φd ) ⟨V y ⟩(t) = β
⟨V x ⟩(t) = −
(133)
Aus den Eigenschaften der Zustände |α⟩ folgt darüber hinaus ⟨H⊥ ⟩ = ℏωc (|α d |2 +
1 ) 2
1 ) 2 1 1 ⟨Σ2 ⟩ = 2 (|α d |2 + ) 2 β
⟨Θ z ⟩ = 2ℏ (|α d |2 +
(134)
Diese Ergebnisse sind denen aus der klassischen Mechanik [s. Gl. (4)] sehr ähnlich. Wie wir sehen, hängt |α d | mit dem Radius σ der klassischen Bahn und φd mit der An fangsphase φ0 zusammen, während |α g | dem Abstand OC0 und φg dem Polarwinkel des Vektors OC0 entspricht.
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 765
•
Weiterhin lässt sich mittels der Eigenschaften der Zustände |α⟩ zeigen ∆X0 = ∆Y 0 = ∆X = ∆Y = ∆V x = ∆V y =
1 2β
(135a)
ωc 2β
(135b)
(die Produkte ∆X0 ∆Y0 , ∆X ∆Y und ∆V x ∆V y nehmen demnach ihre minimalen Werte an) und ∆H⊥ = ℏωc |α d |
∆Θ z = 2ℏ |α d |
∆Σ2 =
1 |α d | β2
(136)
Die Abweichungen ∆X und ∆Y lassen sich unter Verwendung der Beziehung α d e−iωc t + α g iα d e−iωc t − iα g |ψ⊥ (t)⟩ = e−iωc t/2 α x = , αy = ⟩ √2 √2
(137)
berechnen [dabei ist |α x , α y ⟩ definiert durch Gl. (66)]; es ergibt sich ∆X = ∆Y = √
ℏ 1 = μωc β √2
(138)
(∆P x und ∆P y ergeben sich analog). Wenn die Bedingungen |α d | ≫ 1 ,
|α g | ≫ 1
(139)
erfüllt sind, liegen die verschiedenen physikalischen Größen (Ort, Geschwindigkeit, Energie usw.) mit ihrem relativen Wert sehr genau fest. Bei den Zuständen (129) han delt es sich also um „quasiklassische“ Zustände eines geladenen Teilchens in einem homogenen Magnetfeld. Bemerkung: Für α d = 0 erhalten wir 1 ℏωc 2 ∆H ⊥ = 0
⟨H ⊥ ⟩ =
(140)
Die Zustände |α x , α y = −iα x ⟩
(141)
entsprechen daher dem Grundzustand.
Referenzen und Literaturhinweise Landau und Lifshitz (1.19), Kap. XVI, § 124 und § 125; Ter Haar (1.23), Kap. 6. Anwendungen in der Festkörperphysik: Mott und Jones (13.7), Kap. VI, § 6; Kittel (13.2), Kap. 8, S. 239 und Kap. 9, S. 290.
•
766 | Ergänzung FVI
Ergänzung FVI Aufgaben 1. Man betrachte ein System mit dem Drehimpuls j = 1, dessen Zustandsraum durch die Basis {|+1⟩, |0⟩, |−1⟩} der drei gemeinsamen Eigenvektoren von J2 (Eigenwert 2ℏ2 ) und J z (Eigenwerte +ℏ, 0 bzw. −ℏ) aufgespannt wird. Das System befinde sich im Zu stand |ψ⟩ = α | + 1⟩ + β |0⟩ + γ | − 1⟩ wobei α, β, γ drei gegebene komplexwertige Parameter sind. a) Man berechne den Erwartungswert ⟨J⟩ des Drehimpulses in Abhängigkeit von α, β und γ. b) Man gebe den Ausdruck für die drei Erwartungswerte ⟨J 2x ⟩, ⟨J 2y ⟩ und ⟨J 2z ⟩ in Ab hängigkeit von diesen Größen an. 2. Wir betrachten ein beliebiges physikalisches System, dessen vierdimensionaler Zu standsraum durch eine Basis von vier gemeinsamen Eigenvektoren |j, m z ⟩ von J2 und J z (j = 0 oder 1; −j ≤ m z ≤ +j) mit den Eigenwerten j(j + 1)ℏ2 bzw. m z ℏ aufgespannt werde. Dabei gelte J ± |j, m z ⟩ = ℏ√j(j + 1) − m z (m z ± 1) |j, m z ± 1⟩ J + |j, j⟩ = J − |j, −j⟩ = 0 a) Man drücke die gemeinsamen Eigenzustände |j, m x ⟩ von J2 und J x durch die Vek toren |j, m z ⟩ aus. b) Man betrachte ein System in dem normierten Zustand |ψ⟩ = α |j = 1, m z = 1⟩ + β |j = 1, m z = 0⟩ + γ |j = 1, m z = −1⟩ + δ |j = 0, m z = 0⟩ α) Wie groß ist die Wahrscheinlichkeit, bei einer gleichzeitigen Messung von J2 und J z die Werte 2ℏ2 und ℏ zu finden? β) Man berechne den Erwartungswert von J z , wenn sich das System im Zustand |ψ⟩ befindet, und die Wahrscheinlichkeiten für die verschiedenen möglichen Ergebnisse bei einer Messung nur dieser Observablen. γ) Dieselbe Frage beantworte man für die Observable J2 und für J x . δ) Nun werde J 2z gemessen. Wie lauten die möglichen Ergebnisse, ihre Wahr scheinlichkeiten und der Erwartungswert? 3. Es sei L = R × P der Drehimpuls eines Systems mit dem Zustandsraum Hr . Man beweise die Vertauschungsrelationen [L i , R j ] = iℏ ε ijk R k [L i , P j ] = iℏ ε ijk P k [L i , P2 ] = [L i , R2 ] = [L i , R ⋅ P] = 0 https://doi.org/10.1515/9783110638738-065
Aufgaben |
767
•
wobei L i , R j , P j beliebige Komponenten von L, R, P in einem Orthonormalsystem sind und ε ijk definiert wird durch 0 für zwei (oder drei) gleiche Indizes i, j, k { { { ε ijk = {1 für eine gerade Permutation von x, y, z { { {−1 für eine ungerade Permutation 4. Drehung eines mehratomigen Moleküls Man betrachte ein System aus N verschiedenen Teilchen an den Orten R1 , . . . , Rm , . . . , RN und mit den Impulsen P1 , . . . , Pm , . . . , PN . Wir setzen J = ∑ Lm m
mit Lm = Rm × Pm a) Man zeige, dass der Operator J die Vertauschungsrelationen erfüllt, durch die Drehimpulse definiert werden. Daraus folgere man, dass für zwei unterschiedli che Vektoren V und V des Ortsraums gilt [J ⋅ V, J ⋅ V ] = iℏ(V × V ) ⋅ J b) Man berechne die Kommutatoren von J mit den drei Komponenten von Rm und mit denen von Pm . Man zeige, dass [J, Rm ⋅ Rp ] = 0 c) Man beweise, dass [J, J ⋅ Rm ] = 0 und schließe daraus, dass [J ⋅ Rm , J ⋅ Rm ] = iℏ (Rm × Rm ) ⋅ J = iℏJ ⋅ (Rm × Rm ) Wir setzen W = ∑ a m Rm m
W = ∑ am Rm m
wobei die Koeffizienten a m und am bekannt seien. Man zeige [J ⋅ W, J ⋅ W ] = −iℏ (W × W ) ⋅ J Schlussfolgerung: Worin besteht der Unterschied zwischen den Vertauschungsre lationen der Komponenten von J in Richtung fester Achsen und denen der Kom ponenten von J in Richtung von bewegten Achsen des betrachteten Systems?
•
768 | Ergänzung FVI
d) Wir betrachten ein Molekül, dessen N nicht auf einer Linie angeordneten Atome sich in einem festen Abstand zueinander befinden (ein starrer Rotator). Der Dreh impuls J ist dann die Summe der Drehimpulse der Atome bezüglich des Massen mittelpunkts des Moleküls, der sich an dem festen Punkt O befindet; mit diesem Punkt ist ein starres x, y, z-Orthonormalsystem verbunden. Die drei Hauptträg heitsachsen des Systems bezeichnen wir mit α-, β- bzw. γ-Achse, und wir nehmen das Trägheitsellipsoid als rotationssymmetrisch um die γ-Achse (symmetrischer Rotator) an. Die Rotationsenergie des Moleküls lautet dann 2 2 2 1 [ Jγ Jα + Jβ ] H= + 2 I‖ I⊥ ] [
dabei sind J α , J β , J γ die Komponenten von J längs der Einheitsvektoren wα , wβ , wγ der mit dem Molekül verbundenen bewegten Achsen α, β, γ und I‖ und I⊥ die entsprechenden Trägheitsmomente. Es gilt J 2α + J 2β + J 2γ = J 2x + J 2y + J 2z = J2 α) Man leite aus den Ergebnissen von c) die Vertauschungsrelationen von J α , J β , J γ her. β) Wir führen die Operatoren N± = J α ± iJ β ein. Mit Hilfe der allgemeinen Ergeb nisse dieses Kapitels zeige man, dass sich gemeinsame Eigenwerte von J2 und J γ mit den Eigenwerten J(J + 1)ℏ2 und Kℏ finden lassen, K = −J, −J + 1, . . . , J − 1, J. γ) Man drücke den Hamilton-Operator H des Rotators in Abhängigkeit von J2 und J 2γ aus und bestimme seine Eigenwerte. δ) Man zeige, dass sich gemeinsame Eigenzustände von J2 , J z und J γ finden las sen, die wir mit |J, M, K⟩ bezeichnen wollen (die entsprechenden Eigenwerte sind J(J + 1)ℏ2 , Mℏ, Kℏ). Man zeige, dass diese Zustände auch Eigenzustände von H sind. ϵ) Man berechne die Kommutatoren von J ± und N± mit J2 , J z , J γ . Daraus leite man die Wirkung von J ± und N± auf |J, M, K⟩ her. Man zeige, dass die Eigen werte von H für K ≠ 0 mindestens 2(2J + 1)-fach und für K = 0 mindestens (2J + 1)-fach entartet sind. ζ) Man zeichne ein Energiediagramm des starren Rotators (J ist eine ganze Zahl, da J eine Summe von Bahndrehimpulsen ist; s. Kapitel 10). Wie ändert sich das Diagramm, wenn I ‖ = I⊥ (kugelsymmetrischer Rotator) gilt? 5. Ein System mit dem Zustandsraum Hr habe die Wellenfunktion ψ(x, y, z) = N (x + y + z) e−r
2
/α2
mit vorgegebenem reellen α und einer Normierungskonstanten N.
Aufgaben | 769
•
a) Die Observablen L z und L2 werden gemessen. Wie lautet die Wahrscheinlichkeit, 0 und 2ℏ2 zu finden? Man beachte Y10 (θ, φ) = √
3 cos θ 4π
b) Wir verwenden zusätzlich die Beziehung Y1±1 (θ, φ) = ∓√
3 sin θ e±iφ 8π
Ist es möglich, die Wahrscheinlichkeiten für die möglichen Ergebnisse einer Mes sung von L2 und L z an einem System mit der Wellenfunktion ψ(x, y, z) direkt vor herzusagen? 6. Man betrachte ein System mit dem Drehimpuls l = 1. Die drei Eigenvektoren von L z |+1⟩, |0⟩, |−1⟩ mit den Eigenwerten +ℏ, 0, −ℏ bilden eine Basis des Zustandsraums. Dabei gelte L± |m⟩ = ℏ√2 |m ± 1⟩ L+ |1⟩ = L− | − 1⟩ = 0 Das System besitze ein elektrisches Quadrupolmoment und sei einem elektrischen Feldgradienten ausgesetzt, so dass sein Hamilton-Operator lautet H=
ω0 2 (L u − L2v ) ℏ
Dabei sind L u und L v die Komponenten von L bezüglich der Richtungen u und v der x, z-Ebene, die einen Winkel von 45∘ mit der x- bzw. der z-Achse einschließen; ω0 ist eine reelle Konstante. a) Man gebe die Matrix an, die H in der Basis {|+1⟩, |0⟩, |−1⟩} beschreibt. Welche sta tionären Zustände hat das System, und wie lauten ihre Energien? (Man bezeichne diese Zustände mit |E1 ⟩, |E2 ⟩, |E3 ⟩ in der Reihenfolge fallender Energien.) b) Zur Zeit t = 0 befinde sich das System im Zustand |ψ(0)⟩ =
1 (| + 1⟩ − | − 1⟩) √2
Wie lautet der Zustandsvektor |ψ(t)⟩ zur Zeit t? Zur Zeit t werde L z gemessen; wel ches sind die Wahrscheinlichkeiten für die verschiedenen möglichen Ergebnisse? c) Man berechne die Erwartungswerte ⟨L x ⟩(t), ⟨L y ⟩(t) und ⟨L z ⟩(t) zur Zeit t. Welche Bewegung vollzieht der Vektor ⟨L⟩? d) Zur Zeit t werde L2z gemessen: α) Gibt es Zeiten, zu denen nur ein Ergebnis möglich ist? β) Man nehme an, diese Messung habe ℏ2 ergeben. Wie lautet der Zustand des Systems unmittelbar nach der Messung? Man gebe ohne Rechnung seine nachfolgende zeitliche Entwicklung an.
•
770 | Ergänzung FVI
7. Wir betrachten Drehungen im dreidimensionalen Raum und bezeichnen sie mit Ru (α), wobei u der Einheitsvektor, der die Drehachse definiert, und α der Drehwinkel ist. a) Die Transformierte von M bei einer infinitesimalen Drehung mit dem Winkel ε sei M . Man zeige, dass gilt OM = OM + εu × OM b) Wie lautet die Matrix, die Ru (ε) beschreibt, wenn OM durch den Spaltenvektor x ( y) dargestellt wird? Daraus leite man die Matrizen her, die die Komponenten z des durch Ru (ε) = 1 + ε 𝓜 ⋅ u definierten Operators 𝓜 darstellen. c) Man berechne die Kommutatoren [ℳx , ℳy ], [ℳy , ℳz ] und [ℳz , ℳx ]. Wie lauten die quantenmechanischen Ausdrücke, die den rein geometrischen Be ziehungen entsprechen? d) Ausgehend von der Matrix, die ℳz darstellt, berechne man die Matrix für eαℳz . Man zeige, dass Rz (α) = eαℳz gilt. Wie sieht diese Beziehung in der Quantenme chanik aus? 8. Wir betrachten ein Teilchen im dreidimensionalen Raum mit dem Zustandsvek tor |ψ⟩ und der Wellenfunktion ψ(r) = ⟨r|ψ⟩. Es sei A eine Observable, die mit dem Bahndrehimpuls L = R × P des Teilchens vertauscht. Wir nehmen an, dass A, L2 und L z einen V. S. K. O. in Hr bilden und bezeichnen ihre gemeinsamen Eigenvektoren mit |n, l, m⟩; zu ihnen gehören die Eigenwerte a n (n sei ein diskreter Index), l(l + 1)ℏ2 und mℏ. Es sei U(φ) der unitäre Operator, definiert durch U(φ) = e−iφL z /ℏ mit einem reellen Parameter φ der Dimension eins. Für einen beliebigen Operator K bezeichne ̃ K die Transformierte von K durch den unitären Operator U(φ): ̃ K = U(φ)KU † (φ) a) Wir setzen L+ = L x + iL y , L− = L x − iL y . Man berechne L̃ + |n, l, m⟩ und zeige, dass ̃ + proportional zueinander sind; man bestimme die Proportionalitäts L+ und L ̃−. konstante. Dieselbe Frage beantworte man für L− und L ̃ ̃ ̃ b) Man drücke L x , L y und L z durch L x , L y und L z aus. Welche geometrische Trans ̃ formation entspricht der Transformation von L nach L? c) Man berechne die Kommutatoren [X ± iY, L z ] und [Z, L z ]. Man zeige, dass die Vektoren (X ± iY)|n, l, m⟩ und Z|n, l, m⟩ Eigenvektoren von L z sind und bestim me ihre Eigenwerte. Welcher Beziehung müssen m und m genügen, damit das Matrixelement ⟨n , l , m |X ± iY|n, l, m⟩ von null verschieden ist? Dieselbe Frage beantworte man für ⟨n , l , m |Z|n, l, m⟩.
Aufgaben |
771
•
̃ mit denen von X ± iY d) Durch einen Vergleich der Matrixelemente von X̃ ± iY und Z ̃ ̃ ̃ und Z berechne man X, Y, Z in Abhängigkeit von X, Y, Z. Wie lässt sich das Ergebnis geometrisch interpretieren? 9. Wir betrachten ein physikalisches System mit dem festen Drehimpuls l und dem Zustandsraum Hl , das sich in einem Zustand |ψ⟩ befindet; der Drehimpulsoperator werde mit L bezeichnet. Die 2l + 1 Eigenvektoren |l, m⟩ von L z (−l ≤ m ≤ +l) bilden eine Basis von Hl ; zu ihnen gehören die Wellenfunktionen f(r)Y lm (θ, φ). ⟨L⟩ = ⟨ψ|L|ψ⟩ bezeichne den Erwartungswert von L. a) Zunächst nehmen wir an, dass ⟨L x ⟩ = ⟨L y ⟩ = 0 Für welche Zustände des Systems wird die Summe (∆L x )2 + (∆L y )2 + (∆L z )2 mini mal? Man zeige, dass für diese Zustände die Standardabweichung ∆L α der Kom ponente von L in Richtung einer Achse, die mit der z-Achse einen Winkel α ein schließt, durch l ∆L α = ℏ√ sin α 2 gegeben wird. b) Wir nehmen nun an, ⟨L⟩ habe eine beliebige Richtung bezüglich des x, y, z-Sys tems. Zusätzlich betrachten wir ein X, Y, Z-System, dessen Z-Achse in Richtung von ⟨L⟩ orientiert ist, wobei seine Y-Achse in der x, y-Ebene verläuft. α) Man zeige, dass für den Zustand |ψ0 ⟩ des Systems, in dem (∆L x )2 + (∆L y )2 + (∆L z )2 minimal wird, (L x + iL y ) |ψ0 ⟩ = 0 L z |ψ0 ⟩ = lℏ |ψ0 ⟩ ist. β) Es sei θ0 der Winkel, den die z- und Z-Achse miteinander einschließen, und φ0 der Winkel zwischen der y- und der Y-Achse. Man beweise die Beziehun gen θ0 −iφ0 θ0 iφ0 e e L− − sin θ0 L z L+ − sin2 L X + iL Y = cos2 2 2 θ0 −iφ0 θ0 iφ0 θ0 θ0 cos e cos e L− + cos θ0 L z L Z = sin L+ + sin 2 2 2 2 Wir setzen |ψ0 ⟩ = ∑ d m |l, m⟩ m
man zeige, dass θ0 iφ0 √ l + m + 1 e d m+1 2 l−m gilt. Man drücke d m durch d l , θ0 , φ0 und l aus. d m = tan
•
772 | Ergänzung FVI
γ) Wir wollen nun d l berechnen. Dazu zeige man, dass die Wellenfunktion zu |ψ0 ⟩ durch ψ0 (X, Y, Z) = c l (X + iY)l f(r)/r l gegeben wird [der Koeffizient c l ist wie in Kap. VI, Gl. (D-20) definiert], wobei die Wellenfunktion zu |l, l⟩ c l (x + iy)l f(r)/r l lautet. Indem man in diesem Ausdruck für ψ0 (X, Y, Z) die Operatoren X, Y, Z durch ihre in x, y, z ausgedrückten Werte ersetzt, bestim me man d l und beweise die Gleichung d m = (sin
(2l)! θ0 l−m θ0 l+m −imφ0 √ (cos ) e ) 2 2 (l + m)!(l − m)!
δ) Am System im Zustand |ψ0 ⟩ werde L z gemessen. Wie lauten die Wahrschein lichkeiten für die verschiedenen möglichen Ergebnisse? Welches Ergebnis ist am wahrscheinlichsten? Man zeige, dass für l viel größer als eins die Ergeb nisse dem klassischen Grenzfall entsprechen. 10. Es sei J der Drehimpulsoperator eines beliebigen physikalischen Systems mit dem Zustandsvektor |ψ⟩. a) Gibt es Zustände des Systems, in denen die Standardabweichungen ∆J x , ∆J y und ∆J z gleichzeitig verschwinden? b) Man beweise die Beziehung ∆J x ∆J y ≥
ℏ |⟨J z ⟩| 2
und die daraus durch zyklische Vertauschung von x, y, z hervorgehenden Bezie hungen. Es sei ⟨J⟩ der Erwartungswert des Drehimpulses des Systems. Wir legen das x, y, z-Koordinatensystem so, dass ⟨J x ⟩ = ⟨J y ⟩ = 0 gilt. Man beweise die Un gleichung (∆J x )2 + (∆J y )2 ≥ ℏ|⟨J z ⟩| c) Man zeige, dass die beiden Ungleichungen aus Frage b) genau dann in Gleichun gen übergehen, wenn J + |ψ⟩ = 0 oder J − |ψ⟩ = 0 gilt. d) Wir betrachten nun ein spinloses Teilchen, für das J = L = R × P gilt. Man zeige, dass nur dann gleichzeitig ∆L x ∆L y = ℏ|⟨L z ⟩|/2 und (∆L x )2 + (∆L y )2 = ℏ|⟨L z ⟩| erfüllt sein kann, wenn die Wellenfunktion des Systems die Form hat ψ(r, θ, φ) = F (r, sin θ e±iφ ) 11. Wir betrachten einen dreidimensionalen harmonischen Oszillator mit dem Zu standsvektor |ψ⟩ = |α x ⟩ ⊗ |α y ⟩ ⊗ |α z ⟩ ,
Aufgaben | 773
•
wobei |α x ⟩, |α y ⟩, |α z ⟩ quasiklassische Zustände (s. Ergänzung GV ) eines eindimensio nalen harmonischen Oszillators in x-, y- bzw. z-Richtung sind. Es sei L = R × P der Bahndrehimpuls des dreidimensionalen harmonischen Oszillators. a) Man beweise ⟨L z ⟩ = iℏ (α x α ∗y − α ∗x α y ) ∆L z = ℏ√|α x |2 + |α y |2 und die analogen Beziehungen für die x- und die y-Komponente von L. b) Wir nehmen an, dass ⟨L x ⟩ = ⟨L y ⟩ = 0 ,
⟨L z ⟩ = λℏ > 0
Man zeige, dass α z null sein muss. Wir geben nun einen festen Wert für λ vor. Man weise nach, dass wir zur Minimierung von ∆L x + ∆L y λ α x = −iα y = √ eiφ0 2 wählen müssen (wobei φ0 eine beliebige reelle Zahl ist). Sind die Minimalwerte von ∆L x ∆L y und (∆L x )2 + (∆L y )2 für diesen Fall mit den Ungleichungen aus Fra ge b) der vorherigen Aufgabe verträglich? c) Man zeige, dass die Zustände des Systems, für die die vorstehenden Bedingungen erfüllt sind, notwendig die folgende Form haben: |ψ⟩ = ∑ c k (α d ) |χ nd =k,ng=0,n z =0 ⟩ k
mit |χ nd =k,ng=0,n z =0 ⟩ = c k (α) =
(a†x + ia†y ) √2k k!
α k −|α|2 /2 e , √k!
k
|φ n x =0,n y =0,n z =0 ⟩ α d = eiφ0 √λ
(die Ergebnisse von Ergänzung GV und § 4 der Ergänzung DVI dürfen verwen det werden). Man zeige, dass die Winkelabhängigkeit von |χ nd =k,ng =0,n z =0 ⟩ durch (sin θ eiφ )k gegeben wird. An einem System im Zustand |ψ⟩ werde L2 gemessen. Man weise nach, dass die Wahrscheinlichkeiten für die verschiedenen möglichen Ergebnisse einer PoissonVerteilung entsprechen. Welche möglichen Ergebnisse liefert eine Messung von L z , die nach der Messung von L2 mit dem Ergebnis l(l + 1)ℏ2 erfolgt?
Referenzen Aufgabe 4: Landau und Lifshitz (1.19), § 101; Ter Haar (1.23), § 8.13 und § 8.14.
VII Teilchen in einem Zentralpotential. Das Wasserstoffatom A A-1 A-2 A-3 B B-1 B-2 C C-1 C-2 C-3 C-4
Stationäre Zustände in einem Zentralpotential | 776 Problemstellung | 776 Separation der Variablen | 779 Stationäre Zustände in einem Zentralpotential | 783 Massenmittelpunkts- und Relativbewegung | 785 Klassische Behandlung | 786 Separation der Variablen in der Quantenmechanik | 788 Das Wasserstoffatom | 792 Einleitung | 792 Das Bohrsche Atommodell | 793 Quantenmechanik des Wasserstoffatoms | 794 Diskussion der Ergebnisse | 799
In diesem Kapitel sollen die quantenmechanischen Eigenschaften eines Teilchens un tersucht werden, das sich in einem Zentralpotential, d. h. in einem Potential V(r), wel ches nur vom radialen Abstand r abhängt, befindet. Dieses Problem ist eng verbunden mit den Überlegungen zum Drehimpuls, die in den vorangegangenen Kapiteln ange stellt wurden. In § A werden wir zunächst aus der Invarianz von V(r) unter beliebigen Drehungen um den Ursprung folgern, dass der Hamilton-Operator H des Teilchens mit den drei Komponenten des Drehimpulsoperators L vertauscht. Das vereinfacht die Be stimmung der Eigenfunktionen und -werte von H beträchtlich, da diese Funktionen gleichzeitig als Eigenfunktionen zu L2 und L z gewählt werden können; diese Wahl legt sofort ihre Winkelabhängigkeit fest, und die Eigenwertgleichung von H kann durch ei ne Differentialgleichung ersetzt werden, die nur noch die Radialvariable r enthält. Von besonderem physikalischen Interesse ist das Problem zusätzlich wegen einer in § B angesprochenen Eigenschaft: Ein System aus zwei Teilchen, deren Wechselwir kung durch eine potentielle Energie beschrieben wird, die nur von der relativen Lage der beiden Teilchen zueinander abhängt, lässt sich auf das einfachere Problem der Bewegung nur eines fiktiven Teilchens reduzieren. Ist darüber hinaus das Wechsel wirkungspotential nur eine Funktion des relativen Abstands, so befindet sich bei dem reduzierten Problem das fiktive Teilchen in einem Zentralpotential. Das erklärt, war um die in diesem Kapitel behandelte Fragestellung von allgemeinem Interesse ist, da sie immer zum Tragen kommt, wenn es um die quantenmechanischen Eigenschaften isolierter Zweiteilchensysteme geht. In § C werden die zuvor entwickelten allgemeinen Methoden auf den speziellen Fall, in dem es sich bei V(r) um ein Coulomb-Potential handelt, angewandt. Das Wasserstoffatom, bestehend aus einem Elektron und einem Proton, die sich elektro statisch anziehen, ist das einfachste Beispiel eines solchen Systems. Natürlich ist es nicht das einzige: Neben den Wasserstoffisotopen (Deuterium, Tritium) lassen sich https://doi.org/10.1515/9783110638738-066
776 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom die wasserstoffartigen Ionen He+ , Li++ usw. angeben (weitere Beispiele können Er gänzung AVII entnommen werden). Für diese Systeme werden wir die Energien der gebundenen Zustände und die zugehörigen Wellenfunktionen explizit berechnen. Ursprünglich war die Quantenmechanik ja gerade eingeführt worden, um atoma re Eigenschaften (insbesondere des einfachsten Elements, des Wasserstoffs) zu be schreiben, denen mit der klassischen Mechanik nicht Rechnung getragen werden konnte. Die bemerkenswerte Übereinstimmung zwischen den theoretischen Vorher sagen und den experimentellen Beobachtungen ist einer der spektakulärsten Erfolge auf diesem Gebiet der Physik. Schließlich soll darauf hingewiesen werden, dass die exakten Lösungen des Wasserstoffproblems die Grundlage für alle Näherungsrech nungen darstellen, die komplexere Atome, d. h. Systeme mit mehreren Elektronen, beschreiben.
A Stationäre Zustände in einem Zentralpotential In diesem Abschnitt betrachten wir ein spinloses Teilchen mit der Masse μ, das sich unter dem Einfluss einer aus einem Zentralpotential V(r) abgeleiteten Kraft befindet (das Kraftzentrum wird als Koordinatenursprung gewählt).
A-1 Problemstellung A-1-a Wiederholung einiger klassischer Resultate Die Kraft, die auf ein klassisches Teilchen am Punkt M wirkt, ist gegeben durch (r ist der Ortsvektor von M) F = −∇V(r) = −
dV r dr r
(A-1)
Die Kraft F ist also immer in Richtung des Ursprungs O gerichtet, und das Drehmoment in Bezug auf diesen Punkt verschwindet. Für den Drehimpuls 𝓛=r×p
(A-2)
des Teilchens in Bezug auf O folgt mit dem Drehimpulserhaltungssatz d𝓛 =0 dt
(A-3)
Der Drehimpuls 𝓛 ist also eine Erhaltungsgröße, und die Bahn des Teilchens verläuft in der Ebene durch O, die senkrecht auf 𝓛 steht. Wir betrachten nun (Abb. 1) den Ort, gegeben durch r = OM, und die Geschwin digkeit v eines Teilchens zu einem festen Zeitpunkt t. Die beiden Vektoren r und v liegen in der Bahnebene, und die Geschwindigkeit v kann in eine Radialkomponente
A Stationäre Zustände in einem Zentralpotential
| 777
Abb. 1: Radialkomponente v r und Tangentialkomponente v ⊥ der Geschwindigkeit v eines Teilchens.
vr (in der Richtung von r) und eine Tangentialkomponente v⊥ (senkrecht zu r) zerlegt werden. Die Radialgeschwindigkeit, d. h. der Betrag des Vektors vr , ist die zeitliche Ableitung des Abstands r des Teilchens vom Ursprung: vr =
dr dt
(A-4)
Die Tangentialgeschwindigkeit kann in Abhängigkeit von r und 𝓛 angegeben werden: Mit |r × v| = r|v⊥ |
(A-5)
erhält man für den Betrag des Bahndrehimpulses |𝓛| = |r × μv| = μr|v⊥ |
(A-6)
Die Gesamtenergie des Teilchens E=
1 2 1 1 μv + V(r) = μv2r + μv2⊥ + V(r) 2 2 2
(A-7)
kann jetzt geschrieben werden als E=
1 2 𝓛2 + V(r) μv + 2 r 2μr2
(A-8)
Damit lässt sich die klassische Hamilton-Funktion des Systems angeben: H=
𝓛2 p2r + V(r) + 2μ 2μr2
(A-9)
wobei pr = μ
dr dt
(A-10)
der kanonische Impuls zu r ist und 𝓛2 als Funktion der Variablen r, θ, φ und der zugehörigen Impulse p r , p θ , p φ ausgedrückt werden muss; man findet (s. Anhang III, § 4-a) 𝓛2 = p2θ +
1 sin2 θ
p2φ
(A-11)
778 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
In Gl. (A-9) ist die kinetische Energie in zwei Terme aufgeteilt: die radiale kine tische Energie und die kinetische Energie der Rotation um O. Aufgrund dieser Zerle gung lässt sich die folgende Überlegung anstellen: Da das Potential V(r) in dem hier betrachteten Fall von θ und φ unabhängig ist, treten die Winkelvariablen und ihre konjugierten Impulse nur in dem 𝓛2 -Term auf. Interessiert man sich daher für die zeitliche Entwicklung von r, so kann man die Tatsache verwenden, dass 𝓛 eine Er haltungsgröße ist, und 𝓛2 in Gl. (A-9) durch eine Konstante ersetzen. Die HamiltonFunktion H ist dann nur eine Funktion der Variablen r und p r – während 𝓛2 die Rolle eines Parameters spielt – und man erhält eine Differentialgleichung mit der einzigen Variablen r: dp r ∂H 𝓛2 dV d2 r =μ 2 =− = 3 − dt ∂r dr dt μr
(A-12)
Es handelt sich jetzt also um ein eindimensionales Problem (mit einer Variablen r, die nur zwischen 0 und +∞ läuft), bei dem sich ein Teilchen mit der Masse μ in einem effektiven Potential Veff (r) = V(r) +
𝓛2 2μr2
(A-13)
bewegt. Wie wir sehen werden, liegt in der Quantenmechanik eine ganz analoge Si tuation vor. A-1-b Der Hamilton-Operator In der Quantenmechanik soll die Eigenwertgleichung des Hamilton-Operators H, d. h. der mit der Gesamtenergie korrespondierenden Observablen, gelöst werden. Diese Gleichung wird in der Ortsdarstellung gegeben durch [−
ℏ2 ∆ + V(r)] ψ(r) = Eψ(r) 2μ
(A-14)
Da das Potential V nur vom Abstand r des Teilchens vom Ursprung abhängt, sind Kugelkoordinaten (s. Kap. VI, § D-1-a) dem Problem am besten angepasst; daher drü cken wir den Laplace-Operator ∆ in diesen Koordinaten aus:¹ ∆=
1 ∂2 1 ∂2 1 ∂ ∂2 1 r + ( + ) + r ∂r2 r2 ∂θ2 tan θ ∂θ sin2 θ ∂φ2
(A-15)
und suchen nach den Eigenfunktionen ψ(r) als Funktionen der Variablen r, θ und φ.
1 Die Gl. (A-15) liefert den Laplace-Operator nur für nichtverschwindende r und ist auch nur für solche definiert, da der Ursprung r = 0 in Kugelkoordinaten eine Sonderrolle einnimmt.
A Stationäre Zustände in einem Zentralpotential |
779
Vergleichen wir den Ausdruck (A-15) mit der Form des Operators L2 in Kugelkoor dinaten [s. Gl. (D-6a) aus Kap. VI ], so können wir den Hamilton-Operator der Quan tenmechanik in einer zu Gl. (A-9) völlig analogen Weise schreiben: H=−
ℏ2 1 ∂2 1 2 r+ L + V(r) 2 2μ r ∂r 2μr2
(A-16)
Die Winkelabhängigkeit des Hamilton-Operators ist nur im L2 -Term enthalten, der hier als Operator zu verstehen ist. Man könnte übrigens die Analogie zwischen Gl. (A-16) und Gl. (A-9) noch deutlicher zum Ausdruck bringen, indem man einen Operator P r definiert, mit dem man den ersten Term in Gl. (A-16) wie in Gl. (A-9) schreibt. Im Folgenden werden wir zeigen, wie die Eigenwertgleichung [−
1 2 ℏ2 1 ∂2 r+ L + V(r)] ψ(r, θ, φ) = Eψ(r, θ, φ) 2μ r ∂r2 2μr2
(A-17)
gelöst werden kann.
A-2 Separation der Variablen A-2-a Winkelabhängigkeit der Eigenfunktionen Wie wir wissen [s. Gl. (D-5) aus Kap. VI ], wirken die drei Komponenten des Drehim pulsoperators L nur auf die Winkelvariablen θ und φ; sie vertauschen daher mit jedem Operator, der nur auf die Radialvariable r wirkt; dasselbe gilt natürlich auch für L2. Mit einem Blick auf den Hamilton-Operator Gl. (A-16) ist damit klar, dass die drei Kompo nenten von L Konstanten der Bewegung im quantenmechanischen Sinne sind,² d. h. dass gilt [H, L] = 0
(A-18)
ebenso vertauscht H mit L2 . Nach unseren bisherigen Überlegungen haben wir also vier Konstanten der Be wegung (L x , L y , L z und L2 ), die jedoch, weil sie teilweise untereinander nicht vertau schen, nicht alle zur Lösung von Gl. (A-17) herangezogen werden können. Wir werden nur L2 und L z benutzen: Die drei Observablen H, L2 und L z vertauschen paarweise untereinander, und es ist möglich, eine Basis des Zustandsraums Hr des Teilchens zu finden, deren Elemente gleichzeitig Eigenfunktionen zu diesen drei Observablen sind. Deshalb können wir verlangen, ohne dass dies die Allgemeinheit des Problems ein schränkt, dass die in der Eigenwertgleichung (A-17) enthaltenen Funktionen ψ(r, θ, φ)
2 Gleichung (A-18) drückt die Tatsache aus, dass H in Bezug auf Rotationen um den Ursprung ein Skalar ist (s. Ergänzung BVI ); die potentielle Energie ist unter diesen Transformationen invariant.
780 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom ebenfalls Eigenfunktionen zu L2 und L z sind. Es ist also das folgende System von Dif ferentialgleichungen zu lösen: Hψ(r) = E ψ(r) 2
(A-19a) 2
L ψ(r) = l(l + 1)ℏ ψ(r)
(A-19b)
L z ψ(r) = mℏ ψ(r)
(A-19c)
Die allgemeine Form der Eigenfunktionen zu L2 und L z aber kennen wir bereits (s. Kap. VI, § D-1): Die Lösungen ψ(r) der Gleichungen (A-19), die zu festen Wer ten von l und m gehören, müssen sich notwendigerweise als Produkt einer nur von r abhängigen Funktion und einer Kugelflächenfunktion Y lm (θ, φ) darstellen las sen: ψ(r) = R(r)Y lm (θ, φ)
(A-20)
Unabhängig von der Form der Radialfunktion R(r) ist ψ(r) in dieser Form sicher eine Lösung der Gleichungen (A-19b) und (A-19c). Das verbleibende Problem also ist, R(r) so zu bestimmen, dass ψ(r) ebenfalls Eigenfunktion zu H ist [vgl. (A-19a)]. A-2-b Die Radialgleichung Um die Form der Radialfunktion R(r) bestimmen zu können, werden wir nun Gl. (A-16) und Gl. (A-20) in (A-19a) einsetzen. Da ψ(r) Eigenfunktion zu L2 mit dem Eigenwert l(l + 1)ℏ2 ist, ist Y lm (θ, φ) ein beiden Seiten der Gleichung gemeinsamer Faktor. Nach Vereinfachung erhält man die folgende Radialgleichung: [−
ℏ2 1 d2 l(l + 1)ℏ2 r + + V(r)] R(r) = ER(r) 2μ r dr2 2μr2
(A-21)
Eine Lösung von Gl. (A-21), eingesetzt in Gl. (A-20), ergibt allerdings nicht automa tisch auch eine Lösung der Eigenwertgleichung (A-14) des Hamilton-Operators. Wie oben bereits festgestellt, ist der Ausdruck (A-15) für den Laplace-Operator bei r = 0 nicht definiert. Um sicherzustellen, dass ψ(r) tatsächlich Eigenfunktion des Hamil ton-Operators unter Einschluss des Ursprungs ist, werden wir uns daher unten davon zu überzeugen haben, dass sich R(r) im Ursprung ausreichend regulär verhält. An Stelle der partiellen Differentialgleichung (A-17), die die drei Variablen r, θ und φ enthält, müssen wir mit der Radialgleichung eine Differentialgleichung in nur einer Variablen r, dafür aber abhängig von dem Parameter l, lösen; wir suchen also die Ei genwerte und -funktionen eines Operators H l , der sich mit dem Wert von l verändert. Anders ausgedrückt betrachten wir getrennt voneinander die Unterräume H(l, m) des Zustandsraums Hr , die jeweils zu einem festen Paar (l, m) gehören (vgl. Kap. VI § C-3-a), indem wir in jedem dieser Unterräume die Eigenwertgleichung lösen; das ist möglich, weil H mit L2 und L z vertauscht. Die jeweils zu lösende Gleichung hängt von l, aber nicht von m ab, d. h. sie ist dieselbe in den 2l + 1 zu einem Wert von l
A Stationäre Zustände in einem Zentralpotential | 781
gehörenden Unterräumen. Die Eigenwerte von H l , also die Eigenwerte von H in ei nem gegebenen Unterraum H(l, m), wollen wir mit E k,l bezeichnen. Der zusätzliche Index k, der sowohl diskrete als auch kontinuierliche Werte annehmen kann, steht für die zahlreichen möglichen Eigenwerte, die zu einem Wert von l gefunden werden kön nen. Analog bezeichnen wir die entsprechenden Eigenfunktionen von H l mit R k,l (r). Es ist nicht von vornherein klar, dass diese zwei Indizes auch für die eindeutige Be zeichnung der Eigenfunktionen ausreichen; es ist denkbar, dass mehrere Radialfunk tionen als Eigenfunktionen zu einem Operator H l und einem Eigenwert E k,l gehören. Wir werden allerdings in § A-3-b sehen, dass dies nicht der Fall ist und dass die zwei In dizes k und l demnach auch für die Radialfunktionen ausreichend sind. Wir schreiben also die Radialgleichung (A-21) in der Form [−
l(l + 1)ℏ2 ℏ2 1 d2 r + + V(r)] R k,l (r) = E k,l R k,l (r) 2μ r dr2 2μr2
(A-22)
Der in dieser Gleichung enthaltene Differentialoperator kann vereinfacht werden: Wir führen eine neue Funktion u k,l (r) ein, indem wir R k,l (r) =
1 u k,l (r) r
(A-23)
setzen. Multipliziert man Gl. (A-22) mit r, so ergibt sich die folgende äquivalente Radi algleichung für u k,l (r):
[−
ℏ2 d2 l(l + 1)ℏ2 + + V(r)] u k,l (r) = E k,l u k,l (r) 2μ dr2 2μr2
(A-24)
Diese Gleichung ist völlig analog zu der eines eindimensionalen Problems, bei dem sich ein Teilchen mit der Masse μ in einem effektiven Potential Veff (r) der Form Veff (r) = V(r) +
l(l + 1)ℏ2 2μr2
(A-25)
bewegt; allerdings darf nicht außer Acht gelassen werden, dass die Variable r nur nichtnegative Werte annehmen kann. Der Term l(l + 1)ℏ2 /2μr2 , der zu dem Potential V(r) addiert wird, ist positiv oder gleich null; die diesem Term entsprechende Kraft (gleich dem negativen Gradienten des Terms) weist daher immer vom Kraftzentrum im Ursprung radial nach außen. Deshalb spricht man bei diesem Term vom Zentrifu galpotential (oder von Zentrifugalbarriere). In Abb. 2 ist die Form des effektiven Poten tials Veff (r) für verschiedene Werte von l für den Fall eines anziehenden Coulomb-Po tentials V(r) = −e2 /r dargestellt. Für l ≥ 1 erzeugt die Anwesenheit des für kleine r dominierenden Zentrifugalterms bei kleinen Abständen ein abstoßendes Gesamtpo tential.
782 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
Abb. 2: Form des effektiven Potentials V eff (r) für die ersten Werte von l für ein Coulomb-Potential 2 V(r) = − er . Für l = 0 entspricht V eff (r) einfach dem Coulomb-Potential. Für l = 1, 2, etc. erhält man V eff (r), 2 indem man das Zentrifugalpotential l(l+1)ℏ , das für 2μr 2 r → 0 wie
1 r2
gegen +∞ läuft, zu V(r) addiert.
A-2-c Verhalten der Lösungen der Radialgleichung im Ursprung Wie wir in den obigen Überlegungen bereits erwähnt haben, ist es nötig, das Verhalten der Lösungen der Radialgleichung (A-21) im Ursprung gesondert zu untersuchen, um festzustellen, ob sie tatsächlich auch die Schrödinger-Gleichung (A-14) erfüllen. Wir wollen annehmen, dass das Potential V(r) für r → 0 endlich bleibt oder zu mindest nicht schneller als 1/r gegen unendlich strebt (diese Annahme ist in den meisten Fällen erfüllt, insbesondere für das in § C zu untersuchende Coulomb-Poten tial). Wir betrachten eine Lösung von Gl. (A-22), die sich in der Nähe des Ursprungs wie r s verhalte, r→0
R k,l (r) ∼ Cr s
(A-26)
Verwendet man diesen Ansatz in Gl. (A-22) und setzt in der sich ergebenden Gleichung den dominierenden Anteil gleich null, so ergibt sich die Bedingung −s(s + 1) + l(l + 1) = 0
(A-27)
und damit entweder oder
s=l
(A-28a)
s = −(l + 1)
(A-28b)
Für einen gegebenen Wert von E k,l kann man somit zwei linear unabhängige Lö sungen der Differentialgleichung zweiter Ordnung (A-22) finden, die sich in der Nä he des Ursprungs wie r l bzw. wie 1/r l+1 verhalten. Die Lösungen des zweiten Typs 1 müssen jedoch ausgeschlossen werden; es lässt sich zeigen, dass r l+1 Y lm (θ, φ) keine
A Stationäre Zustände in einem Zentralpotential
| 783
Lösung der Eigenwertgleichung (A-14) für r = 0 ist.³ Wir erkennen also, dass physika lisch sinnvolle Lösungen von Gl. (A-24) im Ursprung für alle l verschwinden müssen, da r→0
u k,l (r) ∼ Cr l+1
(A-29)
Der Differentialgleichung (A-24) muss daher die zusätzliche Bedingung u k,l (0) = 0
(A-30)
beigefügt werden. Bemerkung: In Gl. (A-24) variiert r, der Abstand des Teilchens vom Ursprung, nur zwischen 0 und +∞. Auf grund der Bedingung (A-30) können wir auch annehmen, es handle sich um ein eindimensiona les Problem, bei dem sich das Teilchen theoretisch entlang der gesamten Achse bewegen kann, das effektive Potential jedoch für negative Werte von r unendlich groß ist. Wir wissen, dass in diesem Fall die Wellenfunktion auf der negativen Halbachse identisch verschwinden muss; die Bedingung (A-30) stellt die Stetigkeit der Wellenfunktion bei r = 0 sicher.
A-3 Stationäre Zustände in einem Zentralpotential A-3-a Quantenzahlen Die Ergebnisse in § A-2 können wir wie folgt zusammenfassen: Aus der Forderung, dass das Potential V(r) unabhängig von θ und φ ist, ergeben sich die beiden Bedin gungen: 1. Die Eigenfunktionen von H sind gleichzeitig Eigenfunktionen zu L2 und L z , wo durch ihre Winkelabhängigkeit festgelegt ist: 1 (A-31) u k,l (r)Y lm (θ, φ) r Die Eigenwertgleichung von H, die eine Differentialgleichung mit partiellen Ab leitungen nach r, θ und φ ist, ist durch eine Differentialgleichung zu ersetzen, die nur die Variable r enthält und vom Parameter l abhängt [Gl. (A-24)], mit der zusätzlichen Forderung (A-30). ψ k,l,m (r) = R k,l (r)Y lm (θ, φ) =
2.
Diese Ergebnisse können verglichen werden mit denen, an die in § A-1-a erinnert wur de; sie stellen deren quantenmechanisches Analogon dar. Die Funktionen ψ k,l,m (r, θ, φ) müssen grundsätzlich quadratisch integrierbar, d. h. normierbar sein: ∫ |ψ k,l,m (r, θ, φ)|2 r2 dr dΩ = 1
(A-32)
3 Der Grund dafür ist darin zu suchen, dass bei der Anwendung des Laplace-Operators auf m 1 l+1 Y l (θ, φ) die l-te Ableitung von δ(r) auftritt (s. Anhang II, am Ende von § 4). r
784 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
Ihre Form (A-31) erlaubt es, Radial- und Winkelintegration zu trennen, ∞
∫ |ψ k,l,m (r, θ, φ)|2 r2 dr dΩ = ∫ r2 dr |R k,l (r)|2 ∫ dΩ |Y lm (θ, φ)|2
(A-33)
0
Die Kugelflächenfunktionen Y lm (θ, φ) aber sind hinsichtlich der Winkelvariablen be reits normiert, so dass sich die Bedingung (A-32) tatsächlich reduziert auf ∞
∞
∫ r2 dr |R k,l (r)|2 = ∫ dr |u k,l (r)|2 = 1 0
(A-34)
0
In der Praxis ist es allerdings oft von Vorteil, auch nichtquadratintegrable Eigen funktionen des Hamilton-Operators zuzulassen. Wenn das Spektrum von H einen kontinuierlichen Teil enthält, werden wir nur verlangen, dass die entsprechenden Eigenfunktionen in einem erweiterten Sinn orthonormiert sind, d. h. dass sie einer Bedingung der Form ∞
∞ 2
∫ r dr 0
R∗k ,l (r)R k,l (r)
= ∫ dr u ∗k ,l (r)u k,l (r) = δ(k − k)
(A-35)
0
genügen, wobei k ein kontinuierlicher Index ist. Aufgrund der Bedingung (A-30) ist klar, dass die Integrale in Gl. (A-34) und Gl. (A-35) an ihrer unteren Grenze bei r = 0 konvergieren. Das ist vom physikali schen Standpunkt aus befriedigend, da so die Wahrscheinlichkeit, das Teilchen in einem endlichen Volumen zu finden, stets endlich ist. Außerdem ist es ausschließlich dem Verhalten der Wellenfunktionen für r → ∞ zuzuschreiben, dass die Normie rungsintegrale im Fall des kontinuierlichen Spektrums für k = k divergieren. Die Wellenfunktionen des Hamilton-Operators H eines Teilchens in einem Zen tralpotential V(r) hängen von mindestens drei Indizes ab [vgl. Gl. (A-31)]: Die Funkti on ψ k,l,m (r, θ, φ) = R k,l (r)Y lm (θ, φ) ist gleichzeitig Eigenfunktion von H, L2 und L z zu den entsprechenden Eigenwerten E k,l , l(l + 1)ℏ2 bzw. mℏ. Der Index k heißt radia le Quantenzahl, l ist die azimutale Quantenzahl und m die magnetische Quantenzahl. Der radiale Anteil R k,l (r) = 1r u k,l (r) der Eigenfunktionen und der Eigenwert E k,l von H sind unabhängig von der magnetischen Quantenzahl und werden durch die Radial gleichung (A-24) gegeben. Der Winkelanteil der Eigenfunktionen hängt nur von l und m und nicht von k ab; die Form des Potentials hat auf ihn keinen Einfluss. A-3-b Entartung der Energieniveaus Abschließend wollen wir die Entartung der Energieniveaus, d. h. der Eigenwerte des Hamilton-Operators H betrachten. Die 2l + 1 Funktionen ψ k,l,m (r, θ, φ) mit festem k und l, während m zwischen −l und +l läuft, sind alle Eigenfunktionen von H zum selben Eigenwert E k,l (sie sind offensichtlich paarweise orthogonal, da sie zu unter schiedlichen Eigenwerten von L z gehören). Das Energieniveau E k,l ist also mindestens (2l + 1)-fach entartet. Diese Entartung existiert für alle Formen des Potentials V(r)
B Massenmittelpunkts- und Relativbewegung | 785
und wird wesentliche Entartung genannt; sie entsteht als Folge davon, dass der Hamil ton-Operator H zwar L2 , aber nicht L z enthält.⁴ Das bedeutet, dass die magnetische Quantenzahl m nicht in der Radialgleichung enthalten ist. Außerdem ist es möglich, dass ein Eigenwert E k,l der Radialgleichung zu einem gegebenen Wert von l noch ein mal als Eigenwert E k ,l der durch l ≠ l charakterisierten Radialgleichung vorkommt. Dies tritt nur für bestimmte Potentialformen auf, und die resultierenden Entartungen heißen zufällige Entartungen (wir werden in § C sehen, dass die Energiezustände des Wasserstoffatoms solche zufälligen Entartungen enthalten). Es bleibt zu zeigen, dass die Radialgleichung für einen gegebenen Wert von l höchstens eine physikalisch akzeptable Lösung für jeden Eigenwert E k,l besitzt. Das folgt aus Bedingung (A-30): Die Radialgleichung hat a priori als Differentialgleichung zweiter Ordnung zwei linear unabhängige Lösungen zu jedem Wert von E k,l . Die Be dingung (A-30) schließt eine von ihnen aus, so dass höchstens eine Lösung für jeden Wert von E k,l übrig bleibt. Zusätzlich müssen wir das Verhalten der Lösungen für r → ∞ beachten: Wenn V(r) → 0 für r → ∞ gilt, dann bilden die negativen Werte von E k,l eine diskrete Menge und die entsprechenden Lösungen der Radialgleichung, in der eben beschriebenen Form ausgewählt, sind auch im Unendlichen akzeptabel (d. h. beschränkt) (s. Beispiele in § C und Ergänzung BVII ). Aus den vorhergehenden Überlegungen folgt, dass H, L2 und L z einen vollständi gen Satz kommutierender Observablen bilden.⁵ Wenn wir drei Eigenwerte E k,l , l(l +1)ℏ2 und mℏ festlegen, so ist damit auch eindeutig eine Funktion ψ k,l,m (r) bestimmt. Mit dem Eigenwert von L2 wird die Gleichung für die Radialfunktion gegeben; der Eigen wert von H legt diese Radialfunktion R k,l (r) eindeutig fest; schließlich existiert zu ei nem gegebenen Paar (l, m) nur eine Kugelflächenfunktion Y lm (θ, φ).
B Massenmittelpunkts- und Relativbewegung Wir betrachten ein System aus zwei Teilchen ohne Spin, mit den Massen m1 , m2 und den Ortsvektoren r1 , r2 . Die Kraft zwischen beiden Teilchen sei abgeleitet aus einer po tentiellen Energie V(r1 −r2 ), die nur vom relativen Abstand r1 −r2 der Teilchen abhängt. Das ist immer dann der Fall, wenn keine Kräfte wirken, deren Ursprung außerhalb des Systems liegt (d. h. wenn das System isoliert ist) und wenn die Wechselwirkung zwi schen den beiden Teilchen aus einem Potential abgeleitet werden kann, das nur von r1 − r2 , also nur vom relativen Abstand der Teilchen abhängt. Wir werden zeigen, dass ein solches System auf das Problem eines einzelnen Teilchens in einem Potential V(r) zurückgeführt werden kann. 4 Wesentliche Entartung tritt immer dann auf, wenn der Hamilton-Operator rotationsinvariant ist (s. Ergänzung BVI ). Sie ist also in zahlreichen physikalischen Problemen enthalten. 5 Tatsächlich haben wir nicht bewiesen, dass die Operatoren Observablen sind, d. h. dass die Menge der ψ k,l,m (r) eine Basis des Zustandsraums Hr bildet.
786 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
B-1 Klassische Behandlung In der klassischen Mechanik wird ein Zwei-Teilchen-System durch die Lagrange-Funk tion (s. Anhang III) L(r1 , r1̇ ; r2 , r2̇ ) = T − V =
1 1 m1 r2̇1 + m2 r2̇2 − V(r1 − r2 ) 2 2
(B-1)
beschrieben; die konjugierten Impulse der sechs freien Koordinaten der zwei Teilchen sind die Komponenten der mechanischen Impulse p1 = m1 r1̇
(B-2)
p2 = m2 r2̇
Die Untersuchung der Bewegung der beiden Teilchen wird vereinfacht, indem man die Koordinaten ri durch die drei Koordinaten des Massenmittelpunkts rG =
m 1 r1 + m 2 r2 m1 + m2
(B-3)
und die drei relativen Koordinaten⁶ r = r1 − r2
(B-4)
ersetzt. Gleichung (B-3) und Gl. (B-4) können invertiert werden und ergeben m2 r1 = rG + r m1 + m2 m1 r r2 = rG − m1 + m2
(B-5)
Die Lagrange-Funktion kann damit in den neuen Variablen rG und r ausgedrückt wer den: 2 2 1 m2 1 m1 m1 [ṙG + r]̇ + m2 [ṙG − r]̇ − V(r) 2 m1 + m2 2 m1 + m2 1 1 = M r2Ġ + μ r2̇ − V(r) 2 2
L(rG , ṙG ; r, r)̇ =
(B-6)
wobei M = m1 + m2 die Gesamtmasse und m1 m2 μ= m1 + m2
(B-7)
(B-8a)
die reduzierte Masse des Systems ist, die auch gegeben wird durch 1 1 1 + = μ m1 m2
6 Die Definition (B-4) zeigt eine leichte Asymmetrie zwischen den beiden Teilchen.
(B-8b)
B Massenmittelpunkts- und Relativbewegung | 787
Die konjugierten Impulse der Variablen rG und r erhält man durch Ableitung des Ausdrucks (B-6) nach den Komponenten von ṙG und r.̇ Unter Verwendung der Glei chungen (B-3), (B-4) und (B-2) finden wir pG = M rĠ = m1 r1̇ + m2 r2̇ = p1 + p2 m 2 p1 − m 1 p2 p = μ ṙ = m1 + m2
(B-9a) (B-9b)
oder p p1 p2 = − μ m1 m2
(B-9c)
pG ist der Gesamtimpuls des Systems, während p den Relativimpuls der beiden Teil chen bezeichnet. Wir können jetzt die klassische Hamilton-Funktion des Systems in den neuen dy namischen Variablen ausdrücken: H(rG , pG ; r, p) =
p2G p2 + + V(r) 2M 2μ
(B-10)
Daraus lassen sich die Bewegungsgleichungen unmittelbar ableiten [s. Gl. (27) in An hang III]: ṗ G = 0 ṗ = −∇V(r)
(B-11) (B-12)
Der erste Term von Gl. (B-10) stellt die kinetische Energie eines fiktiven Teilchens dar, das sich im Massenmittelpunkt des Systems befindet [Gl. (B-3)] und dessen Masse M gleich der Summe m1 + m2 der Massen der realen Teilchen ist. Der Impuls dieses Teil chens pG ist gleich dem Gesamtimpuls p1 + p2 des Systems. Gleichung (B-11) drückt aus, dass sich dieses fiktive Teilchen geradlinig gleichförmig, d. h. wie ein freies Teil chen, bewegt. Diese Resultate sind aus der klassischen Mechanik wohlbekannt: Der Massenmittelpunkt eines Systems von Teilchen bewegt sich wie ein einzelnes Teilchen mit der Gesamtmasse des Systems unter dem Einfluss der Summe aller Kräfte auf die einzelnen Teilchen. In unserem Fall ist diese resultierende Gesamtkraft gleich null, da nur innere Kräfte zwischen den Teilchen wirken und diese dem Prinzip von actio et reactio (Kraft = Gegenkraft) unterliegen. Da sich der Massenmittelpunkt in Bezug auf ein ursprünglich gewähltes Koor dinatensystem geradlinig gleichförmig bewegt, ist auch das Ruhesystem, definiert durch pG = 0, ein Inertialsystem. In diesem Ruhesystem des Massenmittelpunkts ver schwindet der erste Term in Gl. (B-10). Die klassische Hamilton-Funktion, d. h. die Gesamtenergie des Systems, reduziert sich dann auf Hr =
p2 + V(r) 2μ
(B-13)
788 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom Hr ist die Energie, die sich aus der Relativbewegung der beiden Teilchen ergibt. Of fenbar ist gerade diese Relativbewegung von Interesse, wenn es um die Eigenschaften zweier wechselwirkender Teilchen geht. Sie kann durch ein neues fiktives Teilchen beschrieben werden, das Relativteilchen: Seine Masse ist die reduzierte Masse μ der beiden realen Teilchen, seine Lage wird durch die Relativkoordinaten r und sein Im puls durch den Relativimpuls p gegeben. Da seine Bewegung durch Gl. (B-12) festge legt wird, verhält es sich wie unter dem Einfluss eines Potentials V(r), das gleich der potentiellen Energie der Wechselwirkung zwischen den beiden realen Teilchen ist. Wir haben somit die Untersuchung der Relativbewegung zweier wechselwirken der Teilchen auf die der Bewegung eines einzelnen fiktiven Teilchens zurückgeführt, das durch Gl. (B-4), Gl. (B-8) und Gl. (B-9c) charakterisiert wird. Die letzte dieser Glei chungen bringt zum Ausdruck, dass die Geschwindigkeit p/μ des Relativteilchens tat sächlich gleich der Differenz der Geschwindigkeiten der beiden Teilchen, d. h. der Re lativgeschwindigkeit, ist.
B-2 Separation der Variablen in der Quantenmechanik Wie wir nun zeigen werden, können die Überlegungen des vorhergehenden Ab schnitts leicht auf die Quantenmechanik übertragen werden. B-2-a Observable des Massenmittelpunkts und des Relativteilchens Die Operatoren R1 , P1 und R2 , P2 , die den Ort und den Impuls der beiden Teilchen des Systems beschreiben, erfüllen die kanonischen Vertauschungsrelationen [X1 , P1x ] = iℏ [X2 , P2x ] = iℏ
(B-14)
mit analogen Ausdrücken für die y- bzw. z-Komponenten. Alle mit 1 indizierten Ob servablen vertauschen mit den mit 2 indizierten, und ebenso vertauschen die Obser vablen bezüglich verschiedener Achsen. Wir definieren die Observablen RG und R analog zu den Ausdrücken (B-3) und (B-4) als RG =
m1 R1 + m2 R2 m1 + m2
R = R1 − R2
(B-15a) (B-15b)
und die Observablen PG und P analog zu (B-9) als PG = P1 + P2 m 2 P1 − m 1 P2 P= m1 + m2
(B-16a) (B-16b)
B Massenmittelpunkts- und Relativbewegung |
789
Es ist leicht, die Kommutatorrelationen dieser neuen Observablen zu bestimmen; man findet [XG , PGx ] = iℏ
(B-17a)
[X, P x ] = iℏ
(B-17b)
und analoge Ausdrücke für die anderen Komponenten. Alle anderen Kommutatoren verschwinden. Also erfüllen auch R und P ebenso wie RG und PG die kanonischen Ver tauschungsrelationen. Darüber hinaus vertauscht jede Observable der Menge {R, P} mit jeder der Menge {RG , PG }. Wir können also R und P auf der einen und RG und PG auf der anderen Seite als Orts- und Impulsobservablen von zwei verschiedenen fiktiven Teilchen interpretieren. B-2-b Eigenwerte und Eigenfunktionen des Hamilton-Operators Den Hamilton-Operator des Systems erhält man aus Gl. (B-1) und den Beziehun gen (B-2) in Verbindung mit den Quantisierungsregeln, die in Kapitel III angegeben wurden: H=
P21 P2 + 2 + V(R1 − R2 ) 2m1 2m2
(B-18)
Da die Definitionen (B-15) und (B-16) formal identisch sind mit (B-3), (B-4) und (B-9) und weil alle Impulsoperatoren untereinander vertauschen, ergibt eine einfache alge braische Rechnung den Gl. (B-10) entsprechenden Ausdruck H=
P2G P2 + + V(R) 2M 2μ
(B-19)
Der Hamilton-Operator H erscheint in dieser Form also als Summe aus zwei Termen, H = HG + Hr
(B-20)
mit P2G 2M P2 Hr = + V(R) 2μ
HG =
(B-21a) (B-21b)
diese beiden Anteile kommutieren nach den Ergebnissen des vorhergehenden Ab schnitts: [HG , Hr ] = 0
(B-22)
Also vertauschen HG und Hr auch mit H selbst. Es existiert daher eine Basis aus Eigen vektoren zu H, die gleichzeitig Eigenvektoren zu HG und Hr sind. Wir werden deshalb
790 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
nach Lösungen des Systems HG |ψ⟩ = EG |ψ⟩ Hr |ψ⟩ = Er |ψ⟩
(B-23)
suchen, woraus nach Gl. (B-20) unmittelbar auch H|ψ⟩ = E|ψ⟩
(B-24)
E = EG + Er
(B-25)
mit
folgt. Wir betrachten die {|rG , r⟩}-Darstellung, deren Basisvektoren die Eigenvektoren der Observablen RG und R sind: In dieser Darstellung wird ein Zustand durch eine Wellenfunktion ψ(rG , r) gegeben, die von sechs Variablen abhängt. Die Wirkung der Operatoren RG und R besteht dann aus der Multiplikation der Wellenfunktion mit den Variablen rG bzw. r. Die Operatoren PG und P werden zu den Differentialoperatoren ℏ ℏ i ∇G und i ∇ (dabei steht ∇G für die drei Operatoren ∂/∂x G , ∂/∂y G und ∂/∂zG ). Der Zu standsraum H des Systems kann als Tensorprodukt HrG ⊗ Hr des zu der Observablen RG gehörenden Raums HrG und des zu R gehörenden Raums Hr verstanden werden; die Operatoren HG und Hr , deren Wirkung ursprünglich nur in den Unterräumen HrG bzw. Hr definiert ist, werden dann als Erweiterungen auf ganz H verstanden. Wir kön nen daher, wie wir in § F von Kapitel II gesehen haben, eine Basis von Eigenvektoren |ψ⟩ finden, die Gl. (B-23) erfüllen und sich in der Form |ψ⟩ = |χ G ⟩ ⊗ |ωr ⟩
(B-26)
mit HG |χ G ⟩ = EG |χ G ⟩ |χ G ⟩ ∈ HrG
(B-27a)
und Hr |ωr ⟩ = Er |ωr ⟩ |ωr ⟩ ∈ Hr
(B-27b)
schreiben lassen. Drückt man diese Gleichungen in der {|rG ⟩}- bzw. {|r⟩}-Darstellung aus, so ergibt sich − [−
ℏ2 ∆G χ G (rG ) = EG χ G (rG ) 2M
ℏ2 ∆ + V(r)] ωr (r) = Er ωr (r) 2μ
(B-28a) (B-28b)
B Massenmittelpunkts- und Relativbewegung |
791
Gleichung (B-28a) zeigt, dass sich der Massenmittelpunkt wie in der klassischen Mechanik frei bewegt. Wir kennen die Lösungen einer solchen Bewegungsgleichung: Es handelt sich dabei z. B. um ebene Wellen χG (rG ) =
i 1 e ℏ pG ⋅rG 3/2 (2πℏ)
(B-29)
mit der Energie EG =
p2G 2M
(B-30)
EG kann jeden positiven Wert oder den Wert null annehmen; es ist die kinetische Ener gie der Bewegung des Gesamtsystems. Die vom physikalischen Standpunkt aus interessantere Gleichung ist die zweite, Gl. (B-28b), die die Bewegung des Relativteilchens bestimmt. Sie beschreibt das Ver halten des Systems der zwei wechselwirkenden Teilchen im Ruhesystem des Massen mittelpunkts. Wenn das Wechselwirkungspotential der zwei realen Teilchen nur von deren Abstand voneinander, d. h. von |r1 − r2 |, abhängt, und nicht von der Richtung des Vektors r1 −r2 , so kann die Bewegung des Relativteilchens durch ein Zentralpoten tial V(r) beschrieben werden; wir haben das Problem dann auf den in § A behandelten Fall reduziert. Bemerkung: Der Gesamtdrehimpuls des Systems der zwei realen Teilchen ist J = L1 + L2
(B-31)
mit L1 = R1 × P1 L2 = R2 × P2
(B-32)
Man kann leicht zeigen, dass sich ebenso die folgende Zerlegung vornehmen lässt: J = LG + L
(B-33)
wobei LG = RG × PG L=R×P
(B-34)
die Drehimpulse der fiktiven Teilchen sind (den Resultaten am Anfang dieses Abschnitts folgend erfüllen LG und L die Vertauschungsrelationen, die Drehimpulse charakterisieren, und die Kom ponenten von L vertauschen mit denen von LG ).
792 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
C Das Wasserstoffatom C-1 Einleitung Das Wasserstoffatom besteht aus einem Proton der Masse mp = 1.7 × 10−27 kg
(C-1)
und der Ladung q = 1.6 × 10−19 C
(C-2)
und einem Elektron der Masse me = 0.91 × 10−30 kg
(C-3)
und der Ladung −q. Die Wechselwirkung zwischen diesen beiden Teilchen ist im We sentlichen elektrostatisch, und die zugehörige potentielle Energie wird durch V(r) = −
q2 1 e2 =− 4πε0 r r
(C-4)
gegeben, wobei r für den Abstand zwischen den Teilchen steht; es ist q2 = e2 4πε0
(C-5)
Den Ergebnissen aus § B folgend, beschränken wir uns auf die Untersuchung im Ruhesystem des Massenmittelpunkts. Die klassische Hamilton-Funktion, die die Re lativbewegung der beiden Teilchen beschreibt, ist dann⁷ H(r, p) =
p2 e 2 − 2μ r
(C-6)
Da mp ≫ me gilt [vgl. Gl. (C-1) und Gl. (C-3)], ist die reduzierte Masse des Systems fast me , μ=
me mp me ≈ me (1 − ) me + mp mp
(C-7)
(der Korrekturterm me /mp ist von der Größenordnung 1/1840). Das bedeutet, dass der Massenmittelpunkt praktisch mit dem Proton zusammenfällt, und das Relativteil chen kann in sehr guter Näherung mit dem Elektron identifiziert werden. Wir werden deshalb etwas ungenau das Relativteilchen als Elektron und den Massenmittelpunkt als Proton bezeichnen. 7 Wir lassen den Index r, der in § B die mit der Relativbewegung zusammenhängenden Größen be zeichnete, im Folgenden weg.
C Das Wasserstoffatom
| 793
C-2 Das Bohrsche Atommodell Wir wollen kurz einige Resultate des Bohrschen Atommodells für das Wasserstoff atom wiederholen. Dieses Modell, das sich noch auf das Konzept einer wohldefinier ten Bahn des Elektrons stützt, lässt sich mit den Grundideen der Quantenmechanik nicht vereinbaren. Dennoch erlaubt es uns, auf sehr einfache Weise fundamentale Größen wie die Ionisierungsenergie EI des Wasserstoffatoms oder einen Parameter, der die typische Größe des Atoms angibt (den Bohr-Radius a0 ), einzuführen. Zusätz lich stimmen die Energien E n , die die Bohrsche Theorie liefert, mit den Eigenwerten des Hamilton-Operators überein, die wir in § C-3 berechnen werden. Und schließlich befindet sich die Quantenmechanik im Einklang mit einigen intuitiven Vorstellungen, die das Bohrsche Atommodell liefert (s. § C-4-c-β). Das halbklassische Bohrsche Modell stützt sich auf die Hypothese, dass sich das Elektron auf einer Kreisbahn mit dem Radius r um das Proton bewegt; diese Bewegung gehorcht den folgenden Gleichungen: 1 2 e2 μv − 2 r μv2 e2 = 2 r r μvr = nℏ ; n ist eine positive ganze Zahl E=
(C-8) (C-9) (C-10)
Die ersten beiden Gleichungen sind rein klassisch. Gleichung (C-8) besagt, dass die Gesamtenergie des Elektrons gleich der Summe der kinetischen Energie μv2 /2 und der potentiellen Energie −e2 /r ist. Bei Gl. (C-9) handelt es sich um nichts anderes als die fundamentale Gleichung der Newtonschen Mechanik (e2 /r2 ist die Coulomb-Kraft, die auf das Elektron wirkt, und v2 /r ist seine Beschleunigung aufgrund der gleichför migen Kreisbewegung). Die dritte Gleichung stellt eine Quantisierungsbedingung dar, die von Bohr rein empirisch eingeführt wurde, um die Existenz von diskreten Energie niveaus zu erklären: Er nahm an, nur Kreisbahnen, die diese Bedingung erfüllen, sei en erlaubte Bahnen für das Elektron. Diese unterschiedlichen Bahnen werden, ebenso wie die zugehörigen Werte zahlreicher physikalischer Größen, mit dem ganzzahligen Index n beziffert. Eine einfache algebraische Rechnung ergibt dann die Ausdrücke für E n , r n und v n : 1 EI n2 r n = n2 a0 1 v n = v0 n
En = −
(C-11a) (C-11b) (C-11c)
794 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
mit μe4 2ℏ2 ℏ2 a0 = μe2 EI =
v0 =
(C-12a) (C-12b)
e2 ℏ
(C-12c)
Als das Modell von Bohr vorgeschlagen wurde, stellte es einen wichtigen Schritt auf dem Weg zum Verständnis atomarer Phänomene dar, da es die korrekten Werte für die Energieniveaus des Wasserstoffatoms ergab. Diese Werte zeigen tatsächlich die 1/n2 -Abhängigkeit (Balmer-Formel) der Gl. (C-11a). Darüber hinaus stimmte die expe rimentell gemessene Ionisierungsenergie (das ist die Energie, die dem Atom im Grund zustand zugeführt werden muss, um das Elektron aus dem Atomverband zu entfernen) mit dem numerischen Wert von EI überein: EI ≈ 13.6 eV
(C-13)
Schließlich charakterisiert der Bohr-Radius a0 tatsächlich die räumliche Ausdehnung von Atomen, a0 ≈ 0.52 Å
(C-14)
Bemerkung: Ergänzung CI zeigt, dass die Unschärferelation für das Wasserstoffatom die Existenz eines stabi len Grundzustands erklären kann und die Berechnung der Größenordnung der Grundzustands energie und der räumlichen Ausdehnung des Atoms erlaubt.
C-3 Quantenmechanik des Wasserstoffatoms Wir wenden uns nun dem Problem zu, die Eigenwerte und Eigenfunktionen des Ha milton-Operators H, der die Relativbewegung des Protons und des Elektrons im Ru hesystem des Massenmittelpunkts beschreibt [Gl. (C-6)], zu bestimmen. In der {|r⟩}Darstellung schreibt sich die Eigenwertgleichung des Hamilton-Operators als [−
e2 ℏ2 ∆ − ] ψ(r) = Eψ(r) 2μ r
(C-15)
Da es sich bei dem Potential −e2 /r um ein Zentralpotential handelt, können wir die Ergebnisse aus § A verwenden: Die Eigenfunktionen ψ(r) sind von der Form ψ k,l,m (r) =
1 u k,l (r)Y lm (θ, φ) r
(C-16)
C Das Wasserstoffatom
| 795
und die Funktion u k,l (r) wird von der Radialgleichung (A-24), d. h. [−
ℏ2 d2 l(l + 1)ℏ2 e2 + − ] u k,l (r) = E k,l u k,l (r) 2μ dr2 r 2μr2
(C-17)
festgelegt. Wir fügen dieser Gleichung wieder die Bedingung (A-30) bei, u k,l (0) = 0
(C-18)
Man kann zeigen, dass das Spektrum von H einen diskreten (negative Eigenwerte) und einen kontinuierlichen Teil (positive Eigenwerte) enthält. Man beachte Abb. 3: Sie zeigt das effektive Potential für einen gegebenen Wert von l (die abgebildete Kurve zeigt den Fall l ≠ 0, die Argumentation bleibt aber auch für l = 0 gültig). Für positive Werte von E ist die klassische Bewegung räumlich nicht beschränkt: Für den in Abb. 3 gewählten Wert E > 0 ist sie linksseitig zwar begrenzt durch die Abszisse des Punkts A, rechtsseitig aber ist sie unbeschränkt.⁸ Daher (vgl. Ergän zung MIII ) hat Gl. (C-17) für jeden positiven Wert von E eine Lösung; das Spektrum von H ist also kontinuierlich für E > 0, und die zugehörigen Eigenfunktionen sind nicht quadratintegrabel. Für negative Werte von E hingegen ist die klassische Bewegung beschränkt: Für den in Abb. 3 gewählten Wert E < 0 verläuft sie zwischen den Abszissen der Punkte B und C.⁹ Wie wir später sehen werden, hat Gl. (C-17) jetzt nur für bestimmte diskrete Werte von E akzeptable Lösungen. Das Spektrum von H ist also diskret für E < 0, und die Eigenfunktionen sind quadratintegrabel.
Abb. 3: Für positive Werte der Energie E ist die klas sische Bewegung nicht gebunden. Das Spektrum des quantenmechanischen Hamilton-Operators H ist daher für E > 0 kontinuierlich, und die zugehörigen Eigenfunktionen sind nicht normierbar. Für negative Werte von E hingegen ist die klassische Bewegung auf das Intervall BC beschränkt. Das Spektrum von H ist also diskret für E < 0, und die Eigenfunktionen sind normierbar.
8 Für ein Potential der Form (−1/r) erfolgt die klassische Bewegung auf Kegelschnitten; eine unbe schränkte Bewegung verläuft auf einer Hyperbel- oder Parabelbahn. 9 Die klassische Trajektorie ist eine Ellipse oder ein Kreis.
796 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
C-3-a Wechsel der Variablen Zur Vereinfachung wollen wir a0 und EI [Gl. (C-12)] als Einheiten für die Länge bzw. die Energie verwenden; wir führen also die Größen mit der Dimension eins ρ = r/a0 λ k,l = √−E k,l /EI
(C-19) (C-20)
ein (die Größe unter der Wurzel ist positiv, da wir gebundene Zustände betrachten). Verwenden wir die neuen Variablen in der Radialgleichung (C-17) und setzen die expliziten Ausdrücke (C-12a) und (C-12b) für a0 und EI ein, so vereinfacht sie sich zu [
l(l + 1) 2 d2 − + − λ2k,l ] u k,l (ρ) = 0 ρ dρ 2 ρ2
(C-21)
C-3-b Lösung der Radialgleichung Zur Lösung der Radialgleichung (C-21), werden wir die in Ergänzung CV vorgestellte Methode verwenden, indem wir die Funktion u k,l (ρ) in eine Potenzreihe entwickeln. α Asymptotisches Verhalten Das asymptotische Verhalten der Funktion u k,l (ρ) kann man qualitativ zeigen: Wenn ρ gegen unendlich läuft, werden die 1/ρ- und 1/ρ 2 -Terme im Vergleich mit dem kon stanten Term λ2k,l vernachlässigbar, so dass sich Gl. (C-21) effektiv reduziert auf [
d2 − λ2k,l ] u k,l (ρ) = 0 dρ 2
(C-22)
Lösungen dieser Gleichung sind die Funktionen e±ρλ k,l . Dies ist nicht in aller Strenge gültig, da wir die 1/ρ- und 1/ρ 2 -Terme vollständig vernachlässigt haben; genauer lässt sich zeigen, dass u k,l (ρ) gleich dem Produkt von e±ρλ k,l mit einer Potenz von ρ ist. Wir werden später durch physikalische Überlegungen darauf geführt werden, von der Funktion u k,l (ρ) zu verlangen, dass sie im Unendlichen beschränkt ist; das wird die Lösungen von Gl. (C-21), die sich wie e+ρλ k,l verhalten, ausschließen. Wir werden deshalb den folgenden Wechsel der Funktion durchführen: u k,l (ρ) = e−ρλ k,l y k,l (ρ)
(C-23)
Obwohl dieser Wechsel e−ρλ k,l auswählt, sind die Lösungen mit e+ρλ k,l dadurch noch nicht eliminiert; sie müssen am Ende der Rechnung identifiziert und ausgeschlossen werden. Die Differentialgleichung für y k,l (ρ) kann leicht aus Gl. (C-21) abgeleitet wer den: {
d d2 2 l(l + 1) − 2λ k,l ]} y k,l (ρ) = 0 +[ − dρ ρ dρ 2 ρ2
(C-24)
Die Bedingung (C-18) drückt sich in der neuen Funktion aus als y k,l (0) = 0
(C-25)
C Das Wasserstoffatom
|
797
β Lösungen in Form einer Potenzreihe Betrachten wir die Entwicklung der Funktion y k,l (ρ) in Potenzen von ρ in der Form ∞
y k,l (ρ) = ρ s ∑ c q ρ q
(C-26)
q=0
Der erste nichtverschwindende Koeffizient der Entwicklung werde als ungleich null vorausgesetzt, c 0 ≠ 0
(C-27)
Gleichung (C-25) verlangt dann, dass s nur positiv sein kann. 2 Wir berechnen die Ableitungen ddρ y k,l (ρ) und ddρ2 y k,l (ρ) des durch (C-26) gegebe nen Ausdrucks: ∞ d y k,l (ρ) = ∑ (q + s)c q ρ q+s−1 dρ q=0 ∞ d2 y k,l (ρ) = ∑ (q + s)(q + s − 1)c q ρ q+s−2 2 dρ q=0
(C-28a) (C-28b)
Um die linke Seite von Gl. (C-24) zu erhalten, multiplizieren wir die Ausdrücke (C-26), ], (−2λ k,l ) und 1 und bilden anschlie (C-28a) und (C-28b) mit den Faktoren [ 2ρ − l(l+1) ρ2 ßend die Summe. Die entstehende Potenzreihe muss nach Gl. (C-24) identisch ver schwinden, d. h. aber, dass alle ihre Koeffizienten gleich null sein müssen. Der Term niedrigster Ordnung in ρ ist ρ s−2 . Setzt man seinen Koeffizienten gleich null, so wird [−l(l + 1) + s(s − 1)] c0 = 0
(C-29)
Beachten wir Gl. (C-27), so sehen wir, dass s einen der folgenden Werte annehmen kann: s =l+1
(C-30a)
s = −l
(C-30b)
(in Übereinstimmung mit dem allgemeinen Ergebnis in § A-2-c). Wir haben bereits ge sehen, dass nur die erste Möglichkeit, das ist s = l + 1, aufgrund des Verhaltens im Ursprung akzeptable Lösungen liefern kann [Bedingung (C-25)]. Setzen wir allgemein den Koeffizienten vor ρ q+s−2 gleich null, so erhalten wir (mit s = l + 1) die Rekursions formel q(q + 2l + 1)c q = 2 [(q + l)λ k,l − 1] c q−1
(C-31)
Für einen vorgegebenen Wert von c0 kann man aus dieser Beziehung c1 , dann c2 und weiter rekursiv alle Koeffizienten c q berechnen. Da das Verhältnis c q /c q−1 für q → ∞ gegen null geht, konvergiert die zugehörige Reihe für alle ρ. Wir haben al so für einen beliebigen Wert von λ k,l eine Lösung von Gl. (C-24) konstruiert, die die Bedingung (C-25) erfüllt.
798 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
C-3-c Quantisierung der Energie. Radialfunktionen Wir wollen nun verlangen, dass die oben konstruierte Lösung ein physikalisch sinn volles asymptotisches Verhalten aufweist, was auf eine Quantisierung der möglichen Werte von λ k,l führt. Wenn der Term in den eckigen Klammern auf der rechten Seite von Gl. (C-31) für keinen Wert der ganzen Zahl q verschwindet, handelt es sich bei dem Ausdruck (C-26) um eine echte unendliche Reihe, für die gilt cq c q−1
q→∞
∼
2λ k,l q
(C-32)
Die Potenzreihenentwicklung der Funktion e2ρλ k,l lautet ∞
eρλ k,l = ∑ d q ρ q q=0
(C-33)
(2λ k,l )q dq = q! woraus dq 2λ k,l = d q−1 q
(C-34)
folgt. Wenn man die Ausdrücke (C-32) und (C-34) vergleicht, sieht man leicht,¹⁰ dass sich die betrachtete Reihe für große ρ wie e2ρλ k,l verhält. Die zugehörige Funktion u k,l [Gl. (C-23)] ist dann proportional zu e+ρλ k,l , was physikalisch nicht sinnvoll ist. Wir müssen daher alle Fälle ausschließen, in denen die Reihe (C-26) nicht ab bricht. Die einzig möglichen Werte von λ k,l sind diejenigen, für die (C-26) nur eine endliche Anzahl von Termen hat, d. h. für die sich y k,l auf ein Polynom reduziert. Die zugehörige Funktion u k,l ist dann aus physikalischer Sicht erlaubt, da ihr asymptoti sches Verhalten durch e−ρλ k,l bestimmt wird. Wir müssen also eine ganze Zahl k su chen, so dass der Term in eckigen Klammern auf der rechten Seite von Gl. (C-31) für q = k gleich null wird; der Koeffizient c k verschwindet dann und mit ihm alle Koeffi zienten höherer Ordnung, da mit c k auch c k+1 gleich null ist usw. Für gegebenes l be zeichnen wir die entsprechenden Werte von λ k,l mit dieser ganzen Zahl k (k ist sicher größer oder gleich eins, da c0 nicht null sein kann). Wir erhalten dann aus Gl. (C-31) λ k,l =
1 k+l
(C-35)
Für gegebenes l sind die einzig möglichen negativen Energiewerte also [Gl. (C-20)] E k,l =
−EI (k + l)2
k = 1, 2, 3, . . .
(C-36)
(wir werden dieses Ergebnis in § C-4 diskutieren). Die Funktion y k,l ist also ein Poly nom, dessen Term kleinster Ordnung ρ l+1 und dessen Term höchster Ordnung ρ k+l ist. 10 Ein analoges Problem ist ausführlicher in Ergänzung CV diskutiert worden.
C Das Wasserstoffatom
| 799
Die verschiedenen Koeffizienten können in Abhängigkeit von c0 aus der Rekursions beziehung (C-31) berechnet werden, die mit Gl. (C-35) wie folgt geschrieben werden kann: cq = −
2(k − q) c q−1 q(q + 2l + 1)(k + l)
(C-37)
Daraus findet man leicht c q = (−1)q (
2 q (k − 1)! (2l + 1)! ) c0 k + l (k − q − 1)! q!(q + 2l + 1)!
(C-38)
Die Funktion u k,l (ρ) wird dann durch Gl. (C-23) gegeben und c0 (bis auf einen Pha senfaktor) durch die Normierungsbedingung (A-34) festgelegt (natürlich muss man zu erst über Gl. (C-19) zur Variablen r zurückkehren). Schließlich erhalten wir die eigent lichen Radialfunktionen R k,l (r), indem wir u k,l (r) durch r teilen. Die folgenden drei Beispiele geben einen Eindruck von ihrer Form: R k=1,l=0 (r) = 2(a0 )−3/2 e−r/a0 r ) e−r/2a0 R k=2,l=0 (r) = 2(2a0 )−3/2 (1 − 2a0 1 r −r/2a0 e R k=1,l=1 (r) = (2a0 )−3/2 √3 a 0
(C-39a) (C-39b) (C-39c)
C-4 Diskussion der Ergebnisse C-4-a Größenordnung der atomaren Parameter Die Beziehungen (C-36) und (C-39) zeigen, dass für das Wasserstoffatom die Ionisie rungsenergie EI [Gl. (C-12a)] und der Bohrsche Radius a0 [Gl. (C-12b)] eine wichtige Rolle spielen. Sie geben die Größenordnungen der Energien und der räumlichen Aus dehnungen der Wellenfunktionen der gebundenen Zustände des Wasserstoffatoms an. Die Ausdrücke (C-12a) und (C-12b) können in der Form 1 2 2 α μc 2 1 a0 = λc α EI =
(C-40a) (C-40b)
geschrieben werden; die Feinstrukturkonstante α ist eine Konstante mit der Dimension eins, die in der Physik eine wichtige Rolle spielt, α=
q2 1 e2 = ≈ ℏc 4πε0 ℏc 137
(C-41)
während λc durch λc =
ℏ μc
(C-42)
800 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom
definiert ist. Da sich μ nur wenig von der Elektronenmasse me unterscheidet, ist λc praktisch gleich der Compton-Wellenlänge ℏ ≈ 3.8 × 10−3 Å me c
(C-43)
des Elektrons. Gleichung (C-40b) besagt also, dass a0 etwa einhundertmal größer als die Comp ton-Wellenlänge des Elektrons ist, während Gl. (C-40a) ausdrückt, dass sich die Bin dungsenergie des Elektrons zwischen 10−4 μc2 und 10−5 μc2 bewegt, wobei μc2 unge fähr gleich der Ruheenergie des Elektrons me c2 ≈ 0.51 × 106 eV
(C-44)
ist. Daraus folgt die Abschätzung EI ≪ me c2
(C-45)
Das rechtfertigt unseren Ansatz, bei der Beschreibung des Wasserstoffatoms mit der nichtrelativistischen Schrödinger-Gleichung zu arbeiten. Trotzdem treten natürlich, wenn auch kleine, relativistische Effekte auf; ihre Geringfügigkeit erlaubt es, sie mit Hilfe der Störungstheorie zu behandeln (s. Kapitel XI und XII). C-4-b Energieniveaus α Mögliche Werte der Quantenzahlen. Entartungen Für festes l existiert eine unendliche Anzahl von möglichen Energiewerten [Gl. (C-36)]. Jeder von ihnen ist mindestens (2l + 1)-fach entartet: Dies ist die wesentliche Entar tung, die damit zusammenhängt, dass die Radialgleichung nur von der Quantenzahl l, nicht aber von m abhängt (s. § A-3). Zusätzlich kommen auch zufällige Entartungen vor: Aus Gl. (C-36) erkennt man, dass zwei zu unterschiedlichen Radialgleichungen (l ≠ l ) gehörende Energieeigenwerte E k,l und E k ,l gleich sind, wenn gilt k + l = k + l . Abbil dung 4, die die ersten zu l = 0, 1, 2 und 3 gehörenden Eigenwerte auf einer gemeinsa men Energieskala zeigt, sind deutlich mehrere zufällige Entartungen zu entnehmen. In dem speziellen Fall des Wasserstoffatoms hängt E k,l nicht von k und l separat ab, sondern nur von ihrer Summe. Wir setzen n=k+l
(C-46)
Die Energiezustände werden mit der ganzen Zahl n (die größer oder gleich eins ist) indiziert, und Gl. (C-36) wird zu En = −
1 EI n2
(C-47)
Nach der Definition (C-46) können die Eigenfunktionen entweder durch Angabe von k und l oder von n und l festgelegt werden. Der Konvention folgend verwenden wir
C Das Wasserstoffatom
| 801
Abb. 4: Energieniveaus des Wasserstoffatoms. Die Energie E n eines Niveaus hängt nur von n ab. Für einen Wert n sind mehrere Werte von l möglich: l = 0, 1, 2, . . . , n − 1. Zu jedem l gehö ren 2l + 1 Werte von m: m = −l, −l + 1, . . . , +l. Das Energieniveau E n ist also n2 -fach entartet.
die Quantenzahlen n und l. Die Energie wird dann durch n, die Hauptquantenzahl, bestimmt; ein Wert von n legt eine so genannte (Elektronen-)Schale fest. Da k notwendig eine ganze Zahl größer oder gleich eins ist (s. § C-3-c), existiert nur eine endliche Anzahl möglicher Werte l zu einem Wert von n. Nach Gl. (C-46) sind für ein festes n nur l = 0, 1, 2, . . . , n − 1
(C-48)
möglich. Man sagt, die durch n bestimmte Schale enthalte n Unterschalen¹¹, je eine für jeden in Gl. (C-48) gegebenen möglichen Wert von l. Schließlich enthält jede Un terschale 2l + 1 verschiedene Zustände, die zu den 2l + 1 möglichen Werten von m gehören. Die Gesamtentartung eines Energieniveaus E n ist also n−1
g n = ∑ (2l + 1) = 2 l=0
(n − 1)n + n = n2 2
(C-49)
Wir werden in Kapitel IX sehen, dass diese Zahl wegen der Existenz des Elektronspins mit zwei multipliziert werden muss (wenn wir auch den Spin des Protons mit in Be tracht ziehen, erhalten wir einen weiteren Faktor zwei).
11 Das Konzept der Unterschalen kann sogar in dem halbklassischen Modell von Sommerfeld gefun den werden. Dieses Modell ordnet jedem Wert n der Bohrschen Quantenzahl n elliptische Bahnen derselben Energie, aber unterschiedlichen Drehimpulses zu. Eine dieser Bahnen ist eine Kreisbahn; sie entspricht dem maximalen möglichen Wert des Drehimpulses.
802 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom β Spektroskopische Notation Aus historischen Gründen (sie reichen zurück in die Zeit vor der Entwicklung der Quantenmechanik, als die Untersuchung der Spektren zu einer empirischen Klassi fikation der zahlreichen beobachteten Linien führte) werden Buchstaben des Alpha bets zur Bezeichnung der Zustände mit gleichem Wert von l verwendet; die folgende Zuordnung wurde vorgenommen: l=0 l=1 l=2 l=3 l=4
←→ s ←→ p ←→ d ←→ f ←→ g .. . alphabetische Reihenfolge
(C-50)
Die spektroskopische Notation bezeichnet eine Unterschale mit dem entspre chenden Wert von n, gefolgt von dem Buchstaben für den Wert von l. So enthält der Grundzustand [der Gl. (C-49) zufolge nicht entartet ist], manchmal auch „K-Scha le“ genannt, nur die 1s-Unterschale; das erste angeregte Niveau oder die „L-Schale“ enthält die 2s- und 2p-Unterschale; das zweite angeregte Niveau („M-Schale“) ent hält die 3s-, 3p- und 3d-Unterschale usw. (Die Großbuchstaben zur Bezeichnung der Schalen folgen alphabetisch aufeinander und beginnen mit K). C-4-c Wellenfunktionen Die Wellenfunktionen, die zu den gemeinsamen Eigenzuständen von L2 , L z und dem Hamilton-Operator H des Wasserstoffatoms gehören, werden im Allgemeinen nicht wie bisher mit den drei Quantenzahlen k, l und m, sondern stattdessen mit n, l und m beziffert [der Übergang zwischen beiden Möglichkeiten erfolgt einfach mit Gl. (C-46)]. Da die Operatoren H, L2 und L z ein vollständiges System kommutierender Observa bler bilden (vgl. § A-3), legen die drei ganzen Zahlen n, l, m – mit denen auch die Eigen werte der Operatoren H, L2 und L z bestimmt sind – die Wellenfunktionen eindeutig fest. α Winkelabhängigkeit Wie für jedes beliebige Zentralpotentialsind ψ n,l,m (r) Produkte einer Radialfunktion mit einer Kugelflächenfunktion Y lm (θ, φ). Um deren Winkelabhängigkeit zu verdeutli chen, können wir bei festem r die Länge einer Strecke proportional zu |ψ n,l,m (r, θ, φ)|2 entlang der durch die Winkel θ und φ im Raum festgelegten Achse messen; damit ist diese Länge auch proportional zu |Y lm (θ, φ)|2 , da r konstant ist. Markieren wir die Endpunkte der Strecken im Raum, so erhalten wir eine um die z-Achse rotationssym
C Das Wasserstoffatom
803
|
Abb. 5: Winkelabhängigkeit einiger stationärer Wellenfunk tionen des Wasserstoffatoms, abhängig von den Werten für l und m. Für jede Richtung der Polarwinkel θ, φ ist der Wert von |Y lm (θ, φ)|2 aufgetragen; das ergibt eine um die z-Achse rotationssymmetrische Fläche. Für l = 0 erhält man eine Kugel mit dem Mittelpunkt O; für höhere Werte von l wird die Fläche komplizierter.
metrische Fläche, da Y lm (θ, φ) von φ nur über einen Faktor eimφ abhängt (s. Kap. VI, § D-1-b) und demnach |Y lm (θ, φ)|2 unabhängig von φ ist. Die Form dieser Flächen kann durch einen ebenen Schnitt, der die z-Achse enthält, sichtbar gemacht werden. Das Ergebnis dieser Konstruktion ist in Abb. 5 für m = 0 und l = 0, 1 und 2 ge zeigt [die zugehörigen Kugelflächenfunktionen können Ergänzung AVI entnommen werden, Gleichungen (31) bis (33)]: Y00 ist eine Konstante und daher kugelsymme trisch; |Y 10 |2 ist proportional zu cos2 θ, und |Y20 |2 zu (3 cos2 θ − 1)2 . β Radialabhängigkeit Die Radialfunktionen R n,l (r), die jeweils eine Unterschale charakterisieren, können mit Hilfe der Ergebnisse aus § C-3-c berechnet werden, wobei auf den Wechsel der No tation in Gl. (C-46) zu achten ist. Abbildung 6 stellt die drei Radialfunktionen (C-39) in Abhängigkeit von r dar: R k=1,l=0 ≡ R n=1,l=0 ,
R k=2,l=0 ≡ R n=2,l=0 ,
R k=1,l=1 ≡ R n=2,l=1
(C-51)
Abb. 6: Radiale Abhängigkeit R n,l (r) der Wellen funktionen für die ersten Zustände des Wasserstoff atoms. Für r → 0 verhält sich R n,l (r) wie r l ; nur die s-Zustände haben eine nichtverschwindende Aufenthaltswahrscheinlichkeit im Ursprung.
804 | VII Teilchen in einem Zentralpotential. Das Wasserstoffatom Das Verhalten von R n,l (r) in der Nähe des Ursprungs wird durch r l bestimmt (s. § A-2-c). Daher ergeben nur Zustände, die zu den s-Unterschalen (l = 0) ge hören, eine nichtverschwindende Aufenthaltswahrscheinlichkeit im Ursprung. Je größer l ist, desto größer ist auch das Gebiet um das Proton, in dem die Aufenthalts wahrscheinlichkeit des Elektrons vernachlässigbar ist. Das hat einige physikalische Konsequenzen, insbesondere beim Phänomen des Elektroneneinfangs bestimmter Atomkerne und bei der Hyperfeinstruktur der Linien (s. Kap. XII, § B-2). Abschließend wollen wir Gl. (C-11b), die die verschiedenen Bohr-Radien in Ab hängigkeit von n angibt, ableiten. Dazu betrachten wir die speziellen Niveaus, für die l = n − 1 gilt.¹² Wir berechnen die r-Abhängigkeit der Wahrscheinlichkeitsdichte für jedes Niveau in einem infinitesimalen Raumwinkel dΩ, dessen Orientierung durch die Polarwinkel θ und φ bestimmt ist. Allgemein ist die Aufenthaltswahrscheinlich keit des Elektrons im Volumenelement d 3 r = r2 dr dΩ um den Punkt (r, θ, φ) gegeben durch d3 𝒫n,l,m (r, θ, φ) = |ψ n,l,m (r, θ, φ)|2 r2 dr dΩ = |R n,l (r)|2 r2 dr |Y lm (θ, φ)|2 dΩ
(C-52)
Bisher sind θ, φ und dΩ festgelegt. Die Wahrscheinlichkeit, das Elektron innerhalb des betrachteten Raumwinkels zwischen r und r + dr zu finden, ist dann proportional zu r2 |R n,l (r)|2 dr; die entsprechende Dichte ist daher bis auf einen Vorfaktor gleich r2 |R n,l (r)|2 (der Faktor r2 stammt vom Volumenelement in Kugelkoordinaten). In den Fällen, die wir hier betrachten, ist l = n − 1, d. h. k = n − l = 1; aus § C-3-c folgt dann, dass das in R n,l (r) enthaltene Polynom nur einen Term mit (r/a0 )n−1 enthält. Die gesuchte Wahrscheinlichkeitsdichte ist deshalb proportional zu r n−1 −r/na0 2 r2 e [( ) ] a0 a20 r 2n = ( ) e−2r/na0 a0
f n (r) =
(C-53)
Diese Funktion hat ein Maximum bei r = r n = n2 a0
(C-54)
was gerade gleich dem Radius der zur Energie E n gehörenden Bohrschen Bahn ist.
12 Das sind gerade diejenigen, denen die Theorie von Sommerfeld Kreisbahnen zuordnet.
C Das Wasserstoffatom
| 805
Schließlich geben wir in der folgenden Tabelle die ersten Wellenfunktionen expli zit an: 1
1s-Niveau
ψ n=1,l=0,m=0 =
2s-Niveau
ψ n=2,l=0,m=0 =
2p-Niveau
ψ n=2,l=1,m=1 = −
ψ n=2,l=1,m=0 =
√πa30
e−r/a0
1 √8πa30
(1 −
1 8√πa30 1
4√2πa30
ψ n=2,l=1,m=−1 =
1 8√πa30
r ) e−r/2a0 2a0
r −r/2a0 e sin θeiφ a0 r −r/2a0 e cos θ a0 r −r/2a0 e sin θe−iφ a0
Referenzen und Literaturhinweise Teilchen im Zentralpotential: Messiah (1.17), Kap. IX; Schiff (1.18), § 16. Bohr-Sommerfeldsches Atommodell und frühe Quantentheorie: Cagnac und PebayPeyroula (11.2), Kap. V, VI und XIII; Born (11.4), Kap. V, § 1 und § 2; Pauling und Wilson (1.9), Kap. II; Tomonaga (1.8), Bd. I; Eisberg und Resnick (1.3), Kap. 4. Wellenfunktionen für wasserstoffartige Atome: Levine (12.3), § 6.5; Karplus und Porter (12.1), § 3.8 und § 3.10; Eisberg und Resnick (1.3), § 7.6 und § 7.7. Entartung für das 1/r-Potential: Borowitz (1.7), § 13.7; Schiff (1.18), § 30; Bacry (10.31), § 6.11. Mathematische Behandlung von Differentialgleichungen: Morse und Feshbach (10.13), Kap. 5 und 6; Courant und Hilbert (10.11), Bd. I, §V-11.
•
806 | Übersicht über die Ergänzungen zu Kapitel VII
Übersicht über die Ergänzungen zu Kapitel VII AVII Wasserstoffartige Systeme
Vorgestellt werden einige wasserstoffartige Systeme, auf die die Überlegungen von Kapitel VII sofort übertragen werden können. Der Schwerpunkt liegt auf der Diskussion physikalischer Ergebnisse; insbesondere wird auf die Auswirkungen der unterschiedlichen Massen der am System beteiligten Teilchen eingegangen. (einfach; auch für das erste Lesen geeignet)
BVII Der dreidimensionale isotrope harmonische Oszillator
Betrachtet wird ein weiteres System (der dreidimensionale harmonische Oszillator), bei dem es möglich ist, die Energieniveaus eines Teilchens in einem Zentralpotential mit der in Kapitel VII entwickelten Methode (Lösung der Radialgleichung) exakt zu berechnen. (prinzipiell nicht schwierig; kann als zum Haupttext gehörendes Beispiel angesehen werden)
CVII Wahrscheinlichkeitsströme der stationären Zustände des Wasserstoffatoms
Diese Ergänzung vervollständigt die Ergebnisse aus § C-4-c von Kap. VII, wo mit Hilfe der Berechnung der Wahrscheinlichkeitsströme Aussagen über Eigenschaften der stationären Zustände des Wasserstoffatoms gemacht wurden. (einfach und kurz, hilfreich für Ergänzung DVII ) Basierend auf den Ergebnissen aus Kapitel VII werden in den Ergänzungen DVII bis FVII verschiedene phyikalische Phänomene diskutiert:
DVII Das Wasserstoffatom im homogenen Magnetfeld
In DVII werden die Eigenschaften eines Atoms in einem Magnetfeld (Diamagnetismus, Paramagnetismus, Zeeman-Effekt) untersucht. (von mittlerer Schwierigkeit, wichtig aufgrund der zahlreichen Anwendungen)
EVII Einige Atomorbitale. Hybridorbitale
In EVII wird das Konzept der Hybridorbitale eingeführt, das wesentlich ist für das Verständnis einiger Eigenschaften der chemischen Bindung. (keine prinzipiellen Schwierigkeiten auf; betont die geometrischen Aspekte der Wellenfunktion)
FVII Vibrations- und Rotationsniveaus zweiatomiger Moleküle
FVII stellt eine direkte Anwendung der in Kapitel VII entwickelten Theorie dar: Es werden die Schwingungs- und Rotationsspektren eines heteropolaren zweiatomigen Moleküls untersucht. (setzt die Überlegungen der Ergänzungen AV (§ 1) und CVI fort) (von mittlerer Schwierigkeit)
GVII Aufgaben
GVII enthält die Aufgaben zu Kapitel VII. Aufgabe 2 betrachtet den Einfluss eines homogenen Magnetfelds auf die Energieniveaus eines einfachen physikalischen Systems, für das eine exakte Lösung möglich ist. Sie stellt damit eine konkrete Anwendung der theoretischen Überlegungen der Ergänzungen CVII und DVII dar, die sich mit den Auswirkungen paramagnetischer und diamagnetischer Terme im Hamilton-Operator befassen.
Wasserstoffartige Systeme | 807
•
Ergänzung AVII Wasserstoffartige Systeme 1 1-a 1-b 2 2-a 2-b
Wasserstoffartige Systeme mit einem Elektron | 808 Elektrisch neutrale Systeme | 808 Wasserstoffartige Ionen | 813 Wasserstoffartige Systeme ohne Elektronen | 813 Myonenatome | 814 Hadronenatome | 815
Die Bestimmung zahlreicher physikalischer Eigenschaften des Wasserstoffatoms (Energieniveaus, räumliche Ausdehnung der Wellenfunktionen usw.) in Kapitel VII stützen sich auf die Tatsache, dass das untersuchte System aus zwei Teilchen (einem Elektron und einem Proton) aufgebaut ist, deren gegenseitige Wechselwirkungsener gie umgekehrt proportional zum Abstand ist. Es existieren zahlreiche andere Systeme, für die das Gleiche gilt: Deuterium oder Tritium, Myonium, Positronium, Myonena tome usw. Die Ergebnisse aus Kapitel VII können daher direkt auf diese Systeme übertragen werden; es müssen lediglich die in den Rechnungen enthaltenen Konstan ten (Massen und Ladungen der beiden Teilchen) geändert werden. Im vorliegenden Abschnitt wollen wir insbesondere untersuchen, wie sich der Bohr-Radius und die Ionisierungsenergie EI für die betrachteten Systeme ändern. Die Wellenfunktionen der stationären Zustände mit den zugehörigen Energien werden erhalten, indem wir die in den Funktionen (C-39) und in Gl. (C-47) aus Kapitel VII auftretenden Konstan ten a0 und EI durch ihre neuen Werte ersetzen, die wiederum die Größenordnungen der räumlichen Ausdehnung der Wellenfunktionen und der Bindungsenergien der neuen Systeme widerspiegeln. Wir erinnern an die Ausdrücke für a0 und EI : a0 =
1 ℏ2 λc = α μe2
(1)
1 2 2 μe4 μc α = 2 2ℏ2 worin μ die reduzierte Masse des Elektron-Proton-Systems ist, EI =
μ = μ(H) =
me mp me ≈ me (1 − ) me + mp mp
(2)
(3)
und e2 die Stärke des anziehenden Potentials V(r) bestimmt, V(r) = −
e2 |r1 − r2 |
(4)
Im Fall des Wasserstoffatoms finden wir a0 (H) ≃ 0.52 Å
(5a) −18
EI (H) ≃ 13.6 eV = 22 × 10
https://doi.org/10.1515/9783110638738-067
J
(5b)
•
808 | Ergänzung AVII
Wie können wir nun die entsprechenden Werte für ein System von zwei beliebigen Teilchen mit den Massen m1 und m2 finden, deren Wechselwirkungsenergie durch V (r) = −
Ze2 |r1 − r2 |
(6)
gegeben ist (Z ist ein Parameter mit der Dimension eins)? Wir müssen nur die redu zierte Masse μ berechnen, indem wir in Gl. (3) me und mp durch m1 und m2 ersetzen, m1 m2 (7a) m1 + m2 und das Ergebnis in Gl. (1) und Gl. (2) einsetzen, wobei zusätzlich die Ersetzung μ=
e2 ⇒ Ze2
(7b)
vorzunehmen ist. Wir werden dies für eine Reihe von physikalischen Beispielen durchführen.
1 Wasserstoffartige Systeme mit einem Elektron 1-a Elektrisch neutrale Systeme α Schwere Isotope des Wasserstoffs Zwei Systeme, die unmittelbar mit dem Wasserstoffatom verwandt sind, sind die Was serstoffisotope Deuterium und Tritium; bei ihnen ist das Proton durch andere Atom kerne ersetzt, die zwar dieselbe Ladung tragen, aber neben dem Proton ein bzw. zwei zusätzliche Neutronen enthalten. Die Masse des Deuteriumkerns ist daher ungefähr 2mp und die des Tritiumkerns ungefähr 3mp . Die reduzierten Massen sind also in die sen beiden Fällen: me ) 2mp me ) μ(Tritium) ≈ me (1 − 3mp
μ(Deuterium) ≈ me (1 −
(8a) (8b)
Da die Abschätzung me 1 ≈ ≪1 mp 1836
(9)
gilt, sind die reduzierten Massen von Deuterium und Tritium fast so groß wie die von Wasserstoff und können ohne großen Fehler durch me ersetzt werden. Wenn wir also entweder Gl. (3), Gl. (8a) oder Gl. (8b) in Gl. (1) und Gl. (2) einsetzen, werden wir praktisch identische Bohr-Radien und Energien für die drei Wasserstoff isotope erhalten. Eine kleine Differenz jedoch bleibt bestehen – von der relativen Grö ßenordnung eines Tausendstels –, die sich auch experimentell nachweisen lässt. Zum Beispiel kann man mit einem optischen Spektrographen ausreichender Auflösung
Wasserstoffartige Systeme
| 809
•
feststellen, dass die von einem Wasserstoffatom emittierten Wellenlängen (der Lini en) etwas größer sind als die des Deuteriums, und diese wiederum sind etwas größer als die des Tritiums. Die Verschiebung der emittierten Wellenlängen tritt auf, weil die Atomkerne nicht unendlich schwer sind und sich deshalb aufgrund der Bewegung des Elektrons auch ein wenig bewegen; diesen Effekt nennt man den „Effekt der endlichen Kernmasse“. Experimentell ist sehr genau bestätigt worden, dass Gl. (7a), Gl. (1) und Gl. (2) diesen Effekt korrekt beschreiben. β Myonium Das Myon ist ein (Elementar-)Teilchen, dessen fundamentale Eigenschaften sich im Wesentlichen mit denen des Elektrons decken, wobei es allerdings eine Masse m μ be sitzt, die etwa 207 me ist. Insbesondere reagiert das Myon wie das Elektron nicht auf die Kernkräfte (starke Wechselwirkung). Es gibt zwei verschiedene Arten von Myonen, μ+ und μ− , deren Ladungen gleich denen des Elektrons e− bzw. des Positrons e+ sind; auch bei ihnen handelt es sich um ihre jeweiligen Antiteilchen. Wie alle geladenen Teilchen unterliegen die Myonen der elektromagnetischen Wechselwirkung. Wir können deshalb ein physikalisches System betrachten, das von einem Myon + μ und einem Elektron e− gebildet wird, wobei die elektrostatische Anziehung die selbe ist wie zwischen Proton und Elektron. Es existieren daher gebundene Zustände. Man kann sozusagen von einem „leichten Isotop“ des Wasserstoffs sprechen, bei dem das Proton durch ein Myon ersetzt wurde. Dieses „Isotop“ heißt Myonium (seine Atom masse ist von der Größe m μ /mp ≈ 0.1). Es fällt nicht schwer, die Ergebnisse dieses Kapitels auf das Myonium zu übertra gen: Für die Ionisierungsenergie und den Bohr-Radius ergibt sich mit den Beziehun gen (1), (2) und (7) 1 + me /m μ 1 ≈ a0 (H) (1 + ) 1 + me /mp 200
(10a)
1 + me /mp 1 ≈ EI (H) (1 − ) 1 + me /m μ 200
(10b)
a0 (Myonium) = a0 (H) EI (Myonium) = EI (H)
Da das Myon ungefähr zehnmal leichter ist als ein Proton, ist der Effekt der endlichen Kernmasse für das Myonium etwa zehnmal stärker als für das Wasserstoffatom; die ser Effekt bleibt aber auch hier klein (etwa in einer Größenordnung von 0.5 %), da das Elektron noch wesentlich leichter als das Myon ist. So sollten z. B. die vom Myonium emittierten optischen Linien sehr dicht an den entsprechenden Linien des Wasser stoffs liegen. Beobachtet werden konnte allerdings das optische Emissionsspektrum des Myoniums bisher noch nicht. Experimentell konnte die Existenz des Myoniums aufgrund seiner Instabilität gezeigt werden. Das μ+ -Myon zerfällt mit einer Lebensdauer von 2.2 ⋅ 10−6 s in ein Positron und zwei Neutrinos. Das so entstehende Positron kann beobachtet werden,
•
810 | Ergänzung AVII
es wird vorzugsweise in die Richtung des μ+ -Spins¹ emittiert (Paritätsverletzung der schwachen Wechselwirkung); der Nachweis des Positrons ermöglicht so die Bestim mung dieser Richtung. Da außerdem der Spin des μ+ -Myons eines Myonium-Atoms mit dem Spin des Elektrons koppelt (Hyperfeinstrukturkopplung, s. Kapitel XII und zugehörige Ergänzungen), unterscheidet sich die Präzessionsfrequenz dieses Myons von der eines freien Myons. Die Messung dieser Frequenz lässt also auf die Existenz des Myoniums schließen. Die Untersuchung des Myoniums ist sowohl experimentell als auch theoretisch von großem Interesse. Die beiden Teilchen, die dieses System bilden, reagieren nicht auf die starke Wechselwirkung, so dass die Energieniveaus (insbesondere die Hyper feinstruktur des 1s-Zustandes) mit großer Präzision ohne jede „Kernkorrektur“ be rechnet werden können (beim Wasserstoffatom hingegen muss die innere Struktur und die Polarisierbarkeit des Protons mit einbezogen werden, beides Effekte der star ken Wechselwirkung). Der Vergleich zwischen theoretischen Vorhersagen und expe rimentellen Messungen ermöglicht so einen sehr strengen Test der Quantenelektrody namik. Tatsächlich kann aus Messungen der Hyperfeinstruktur des Myoniums einer der genauesten Werte für die Feinstrukturkonstante α = e2 /ℏc gewonnen werden. γ Positronium Das Positronium ist ein gebundenes System aus einem Elektron e− und einem Posi tron e+ . Wie beim Myonium kann man auch hier im erweiterten Sinn von einem Isotop des Wasserstoffs sprechen, bei dem das Proton durch ein Positron ersetzt ist. Aller dings bestehen auch wichtige Unterschiede: Beim Wasserstoffatom bewegt sich das Proton (das sehr viel schwerer als das Elektron ist) fast gar nicht, während das Posi tron, das Antiteilchen des Elektrons, im Positronium dieselbe Masse und demzufolge auch dieselbe Geschwindigkeit wie das Elektron hat, wenn man den Massenmittel punkt festhält (s. Abb. 1b). Die reduzierte Masse des Positroniums ergibt sich aus Gl. (7a): μ(Positronium) =
me 2
(11)
Damit ist a0 (Positronium) ≃ 2a0 (H) 1 EI (Positronium) ≃ EI (H) 2
(12a) (12b)
Für einen gegebenen Zustand des Positroniums ist also der durchschnittliche Elek tron–Positron-Abstand doppelt so groß wie der entsprechende Elektron–Proton-Ab stand im Wasserstoffatom (s. Abb. 1). Der Abstand der Energiestufen der stationären 1 Wie das Elektron hat das Myon den Spin 1/2, und dieser ist mit einem magnetischen Moment Mμ = q μ S/m μ verknüpft.
•
Wasserstoffartige Systeme | 811
(a)
(b)
Abb. 1: Schematische Darstellung des Wasserstoff- (Elektron+Proton-System) und des Positro niumatoms (Elektron+Positron-System). Da das Proton sehr viel schwerer ist als das Elektron, ruht es praktisch im Massenmittelpunkt des Wasserstoffatoms; das Elektron „kreist“ im Abstand a0 (H) um das Proton. Das Positron hingegen hat dieselbe Masse wie das Elektron; beide Teilchen kreisen daher gemeinsam um ihren Massenmittelpunkt, bei einem gegenseitigen Abstand von a0 (Positronium) = 2a0 (H).
Zustände hingegen ist halb so groß, und das vom Positronium emittierte optische Li nienspektrum erhält man, indem man die Wellenlängen des Wasserstoffspektrums verdoppelt. Bemerkung: Man sollte aus der Beziehung (12a) nicht schließen, dass der Radius des Positroniums zweimal so groß ist wie der des Wasserstoffatoms: Der Bohr-Radius gibt einen Eindruck von der räumlichen Ausdehnung der zu dem „Relativteilchen“ gehörenden Wellenfunktion (s. Kap. VII, § B), dessen Lage r1 − r2 mit dem Abstand der beiden Teilchen zusammenhängt und nicht mit deren Abstand vom Massenmittelpunkt G. Abbildung 1 zeigt, dass das Wasserstoffatom und das Positronium gleich groß sind. Generell haben alle wasserstoffartigen Systeme, deren anziehendes Potential durch Gl. (6) mit Z = 1 gegeben ist, genau denselben Radius; das folgt aus Gl. (B-5) in Kapitel VII: m2 μ r1 − rG = r= r (13) m1 + m2 m1 Unter Verwendung von Gl. (1), die die Größenordnung der räumlichen Ausdehnung der Wellen funktion ψ100 (r) des Grundzustands angibt, können wir den „Radius“ ρ des Atoms definieren durch ρ=
ℏ2 m 1 Ze 2
(14)
wobei m 1 die Masse des leichteren Teilchens ist (das schwerere Teilchen befindet sich dichter am Massenmittelpunkt). In allen bisher betrachteten Systemen ist Z = 1 und m 1 = m e ; ihre Radien stimmen somit überein. Wir werden später auch Fälle betrachten, in denen der Radius ρ kleiner ist, entweder wegen m 1 ≠ m e oder wegen Z ≠ 1.
Das optische Spektrum des Positroniums konnte inzwischen beobachtet werden. Die (Hyperfein-)Struktur des Grundzustands (infolge der Wechselwirkung zwischen den magnetischen Momenten des Elektrons und des Protons) war exakt vorhergesagt wor den (s. Ergänzung CXII ). Die Tatsache, dass es sich beim Positronium wie beim Myonium um ein rein elek trodynamisches System handelt (weder das Elektron noch das Positron unterliegen der starken Wechselwirkung), erklärt die Bedeutung dieser theoretischen und experi mentellen Untersuchungen.
•
812 | Ergänzung AVII
Schließlich ist auch das Positronium kein stabiles System: Da der Grundzustand ein 1s-Zustand ist, kommen das Elektron und das Positron in Kontakt miteinander und zerstrahlen in zwei oder drei Photonen, abhängig vom ursprünglichen Hyperfein zustand. Auch das Studium der entsprechenden Zerfallsrate ist von großem Interesse in der Quantenelektrodynamik. δ Wasserstoffartige Systeme in der Festkörperphysik Die Atomphysik ist nicht das einzige Anwendungsgebiet der in diesem Kapitel ent wickelten Theorie. Die sich in einem Festkörper befindenden Donatoren bilden z. B. näherungsweise wasserstoffartige Systeme. Betrachten wir einen Siliciumkristall: Im Siliciumgitter bilden die vier Valenzelektronen der Atome tetraedisch die vier Bindun gen zu den Nachbaratomen aus. Wenn ein fünfbindiges Atom wie z. B. Phosphor (Do nator) anstelle eines Siliciumatoms in das Gitter eingebaut wird, muss es ein Valenz elektron verlieren, und seine Gesamtladung wird positiv; es verhält sich dann wie ein Kraftzentrum, das ein Elektron einfangen und ein wasserstoffartiges System bilden kann. Die auf das Elektron wirkende Kraft kann allerdings nicht direkt aus dem Cou lomb-Gesetz im Vakuum berechnet werden, weil Silicium eine große Dielektrizitäts konstante ε ≈ 12 hat, so dass Gl. (4) durch V(r) = −
e2 ε|r1 − r2 |
(15)
zu ersetzen ist. Um exakt zu rechnen, müsste man außerdem die Elektronmasse durch die „effektive Masse“ m∗ des Elektrons im Silicium ersetzen, die sich wegen der Wech selwirkungen mit den Ladungen der Atomkerne im Gitter von der Masse des freien Elektrons unterscheidet. Wir wollen uns allerdings auf eine qualitative Diskussion be schränken und stellen fest, dass der große Wert für ε in Gl. (15) e2 verkleinert, was nach Gl. (1) eine Vergrößerung des Bohr-Radius etwa um den Faktor 10 bedeutet. Die Verunreinigung durch das Donatoratom entspricht daher einem sehr großen Wasser stoffatom, dessen Wellenfunktionen sich über einen weit größeren Bereich als den der Einheitszelle des Siliciums erstrecken. Wir wollen noch kurz ein anderes wasserstoffartiges System der Festkörperphysik diskutieren: das Exziton. Wir betrachten einen Halbleiterkristall. Ohne äußere Störun gen befinden sich die äußeren Elektronen der Atome des Kristalls in Zuständen, die zum Valenzband gehören (die Temperatur sei ausreichend niedrig; s. Ergänzung CXIV ). Wird der Kristall nun in bestimmter Weise bestrahlt, so kann ein Elektron durch Ab sorption eines Photons in das Leitungsband (das aus Energieniveaus gebildet wird, die über dem Valenzband liegen) springen; dem Valenzband fehlt dann ein Elektron. Wir können uns vorstellen, es enthalte ein Teilchen entgegengesetzter Ladung, ein Loch. Dieses Loch kann ein Elektron des Valenzbands anziehen und so ein gebundenes Sys tem bilden: das Exziton. Das Exziton besitzt wie das Wasserstoffatom eine Reihe von Energieniveaus, zwischen denen Übergänge stattfinden können; seine Existenz kann durch Messungen der Absorption von Licht im Kristall nachgewiesen werden.
Wasserstoffartige Systeme |
813
•
1-b Wasserstoffartige Ionen Ein elektrisch neutrales Heliumatom besteht aus zwei Elektronen und einem positiv geladenen Atomkern der Ladung −2qe ; dieses aus drei Teilchen bestehende System kann mit der Theorie in Kapitel VII nicht beschrieben werden. Wenn jedoch ein Elek tron von dem Heliumatom entfernt wird, so entsteht ein He + -Ion, das dem Wasserstoff atom sehr ähnlich ist. Der einzige Unterschied besteht in der Ladung des Atomkerns, die gleich der zweifachen Protonladung ist (die Gesamtladung des Ions ist positiv und gleich −qe ), und in der Masse (die für 4 He etwa gleich der vierfachen Masse des Pro tons ist). Es gibt natürlich noch andere wasserstoffartige Ionen: das Li ++ -Ion (das nicht ionisierte Lithiumatom hat Z = 3 Elektronen), das Be+++ -Ion (Z = 4) usw. Wir betrachten also ein System, das aus einem Atomkern mit der Masse M und der positiven Ladung −Zqe und aus einem Elektron besteht. Wir verwenden (7b) in Gl. (1) und Gl. (2) und finden a0 (H) Z 2 EI (Z) ≃ Z EI (H)
a0 (Z) ≃
(16) (17)
(da M ≫ me gilt, haben wir den Unterschied zwischen den reduzierten Massen des Wasserstoffatoms und denen der betrachteten wassertoffartigen Ionen vernachläs sigt; die Auswirkungen der endlichen Kernmasse auf a0 und EI sind tatsächlich im Vergleich zum Einfluss der veränderten Ladungen vernachlässigbar). Wasserstoff artige Ionen sind also kleiner als das Wasserstoffatom, was natürlich aufgrund der stärkeren Bindung zwischen Atomkern und Elektron zu erwarten ist. Außerdem steigt ihre Energie mit Z schnell an (quadratisch): Zum Beispiel ist die Energie, die einem Li++ -Ion zugeführt werden muss, um das letzte Elektron zu entfernen, größer als 100 eV. Aus diesem Grund fallen die elektromagnetischen Frequenzen, die von einem wasserstoffartigen Ion emittiert oder absorbiert werden können, in den ultravioletten Bereich oder für große Z sogar in den Bereich der Röntgen-Strahlung.
2 Wasserstoffartige Systeme ohne Elektronen Alle von uns bisher behandelten Systeme enthielten ein Elektron. Es existieren aber auch zahlreiche andere Teilchen mit derselben Ladung qe , die zusammen mit einem Atomkern der Ladung −Zqe ein wasserstoffartiges System bilden können. Wir werden einige Beispiele angeben. Die „Atome“, die wir dabei betrachten, sind natürlich we niger geläufig als die „üblichen“ Atome, die in Mendelejews Klassifikation auftreten. Sie sind nicht stabil, und für ihre Untersuchung müssen sie erst in Hochenergie-Teil chenbeschleunigern erzeugt werden. Sie werden deswegen manchmal als „exotische Atome“ bezeichnet.
•
814 | Ergänzung AVII
2-a Myonenatome Wir haben bereits einige grundlegende Eigenschaften der Myonen erwähnt, wobei auch auf die Existenz des μ− -Myons hingewiesen wurde. Wenn dieses Teilchen von einem positiv geladenen Atomkern angezogen wird, kann sich ein gebundenes Sys tem, das sogenannte Myonenatom, bilden.² Betrachten wir z. B. das einfachste Myonenatom, das aus einem μ− -Myon und ei nem Proton besteht: Es handelt sich offensichtlich um ein neutrales System mit dem Bohr-Radius a0 (μ− , p+ ) ≈
ℏ2 a0 (H) ≈ 2 200 mμ e
(18)
und der Ionisierungsenergie EI (μ− , p+ ) ≈
m μ e4 ≈ 200EI (H) 2ℏ2
(19)
Die Größe dieses Myonenatoms bewegt sich also bei einigen 10−5 cm, und das Spek trum ergibt sich aus dem Wasserstoffspektrum, indem man die entsprechenden Wel lenlängen durch 200 teilt; es liegt im Bereich der Röntgen-Strahlung. Was geschieht nun, wenn das μ− -Myon, anstatt um ein Proton zu kreisen, von einem Atomkern N eingefangen wird, dessen Ladung Z-mal größer ist als z. B. Blei mit der Ordnungszahl Z = 82?³ Die Beziehungen (1) und (2) ergeben dann a0 (μ− , N) ≃
a0 (H) 200Z
EI (μ− , N) ≃ 200Z 2 EI (H)
(20) (21)
Setzen wir in diesen Gleichungen Z = 82, so finden wir für die Übergänge des my onischen Bleiatoms Energien von mehreren MeV (1 MeV = 106 Elektronenvolt); wir müssen allerdings feststellen, dass Gl. (1) und Gl. (2) für den hier betrachteten Fall nicht mehr gültig sind; Gl. (20) ergäbe mit a0 (μ− , Pb) ≈ 3 fm
(22)
2 Ebenso könnte man sich ein gebundenes System vorstellen, das etwa aus einem Myon μ+ und ei nem Myon μ− gebildet würde; mit den geringen Intensitäten der Myonenstrahlen, die sich technisch realisieren lassen, ist ein solches Atom jedoch nur schwer zu realisieren und konnte bisher nicht be obachtet werden. 3 Ein solches System kann z. B. erzeugt werden, wenn man einen μ − -Strahl auf ein Blei-Target richtet. Wird ein μ− von einem Blei-Atomkern eingefangen, umkreist es diesen in einem Abstand, der etwa 200 mal kleiner ist als der Abstand der Elektronen der innersten Schale vom Kern. Die Kernladung wirkt daher praktisch allein auf das Myon; die Elektronen können für die Zustände des Myons einfach vernachlässigt werden.
Wasserstoffartige Systeme | 815
•
eine Länge, die kleiner ist als der Radius des Bleiatomkerns. Die Berechnungen in Ka pitel VII verlieren daher ihre Gültigkeit, weil sie auf der in Gl. (6) gegebenen Form des Potentials V(r) basieren. Man kann sie nur dann anwenden,⁴ wenn die Dimensionen der behandelten Teilchen sehr viel kleiner als ihre gegenseitigen Abstände sind, sie also als Massenpunkte betrachtet werden können. Diese Bedingung, die für das Was serstoffatom sehr gut erfüllt ist, gilt hier nicht mehr. Trotzdem liefern die Beziehungen (20) und (21) die richtige Größenordnung der Energien und der Radien des myonischen Bleiatoms. Die physikalischen Auswirkun gen einer endlichen räumlichen Ausdehnung des Atomkerns („Volumeneffekt“) wer den ausführlicher in Ergänzung DXI diskutiert. Wir weisen an dieser Stelle nur darauf hin, dass ein Grund für das Interesse an myonischen Atomen gerade mit diesem Ef fekt zusammenhängt: Das μ − -Myon „spürt“ die innere Struktur des Atomkerns,⁵ und die Energieniveaus des Myonenatoms hängen von der elektrischen Ladungsverteilung und dem Magnetismus innerhalb des Kerns ab (man erinnere sich, dass das Myon nicht der Kernkraft unterliegt). Auf diese Weise kann man mit der Untersuchung der Zustände Informationen gewinnen, die in der Kernphysik sehr nützlich sind.
2-b Hadronenatome Mit Hadronen bezeichnet man Teilchen, die im Gegensatz zu Leptonen der starken Wechselwirkung unterliegen. Elektronen und Myonen, deren gebundene Zustände in einem Coulomb-Potential von uns bisher untersucht wurden, sind Leptonen; Proto nen, Neutronen und Mesonen wie das π-Meson usw. sind Hadronen. Negativ gelade ne Hadronen können mit einem Atomkern ein wasserstoffartiges gebundenes System bilden, ein Hadronenatom. Zum Beispiel bildet ein Atomkern-π− -System ein Pionen atom, ein Atomkern-Σ− -System ein Sigmaatom⁶; ein Atomkern-K− -Meson-System ein Kaonenatom, ein Atomkern-Antiproton-System ein Antiprotonenatom usw. Jedes der soeben aufgeführten Systeme ist tatsächlich untersucht worden. Sie sind nicht stabil, aber ihre Lebensdauern reichen aus, um einige Spektrallinien beobachten zu können. Die Theorie des Wasserstoffatoms, die nur die elektromagnetische Wechselwirkung der beiden beteiligten Teilchen berücksichtigt, kann natürlich solche Systeme, in de nen die starke Wechselwirkung eine entscheidende Rolle spielt, nicht angemessen be
4 Innerhalb des Atomkerns ist das Potential näherungsweise parabolisch (s. § 4 von Ergänzung AV sowie Ergänzung DXI ). 5 Die Vorstellung, dass sich zwei massive Körper nicht durchdringen können, ist makroskopischer Na tur. In der Quantenmechanik können sich die Wellenfunktionen von zwei Teilchen gegenseitig über lappen. 6 Der Ausdruck „Mesonenatom“ wird manchmal zur Bezeichnung eines Systems mit einem Meson verwandt. Entsprechend nennt man das Sigmaatom auch Hyperonenatom, da das Σ− ein Hyperon (ein Teilchen schwerer als das Proton) ist.
•
816 | Ergänzung AVII
schreiben. Allerdings kann für angeregte Zustände von Hadronenatomen (außer s-Zu ständen), bei denen der Abstand der beiden Teilchen groß ist, die starke Wechselwir kung mit sehr kurzer Reichweite vernachlässigt werden. Dann kann die Theorie aus Kapitel VII angewandt werden, und Gl. (1) und Gl. (2) führen zu sehr viel kleineren Bohr-Radien und sehr viel größeren Energien im Vergleich zum Wasserstoff. Messun gen der Frequenzen der von einem Pionenatom emittierten Spektrallinien führen so z. B. auf eine sehr genaue Bestimmung der Masse des π− -Mesons.
Referenzen und Literaturhinweise Exotische Atome: siehe Unterabschnitt Exotische Atome im Abschnitt 11 der Bibliogra phie; siehe auch Cagnac und Pebay-Peyroula (11.2), Kap. XIX, § 7; Weissenberg (16.19), Kap. 4, § 2 sowie Kap. 6. Exzitonen: Kittel (13.2), Kap. 17, S. 538; Ziman (13.3), § 6.7.
Der dreidimensionale isotrope harmonische Oszillator
| 817
•
Ergänzung BVII Der dreidimensionale isotrope harmonische Oszillator 1 2
Lösung der Radialgleichung | 818 Energieniveaus und stationäre Wellenfunktionen | 821
In diesem Abschnitt werden wir den Spezialfall eines Zentralpotentials untersuchen, für den die Radialgleichung exakt lösbar ist: den isotropen dreidimensionalen har monischen Oszillator. Wir haben dieses Problem bereits behandelt (Ergänzung EV ), indem wir den Zustandsraum Hr als Tensorprodukt Hx ⊗ Hy ⊗ Hz auffassten; das ist in der {|r⟩}-Darstellung gleichbedeutend damit, die Variablen in kartesischen Koordi naten zu separieren. Wir erhielten auf diese Weise drei Differentialgleichungen, eine in x, eine in y und eine dritte in z. Hier wollen wir stationäre Zustände suchen, die gleichzeitig Eigenzustände von L2 und L z sind, und separieren dazu die Variablen in Polarkoordinaten; wir werden dann sehen, wie sich diese beiden auf verschiedene Arten erhaltenen Basen von Hr zueinander verhalten. In Ergänzung AVIII sehen wir uns darüber hinaus die stationären Zustände eines freien Teilchens mit wohldefiniertem Drehimpuls an. Man kann dies als einen weite ren Spezialfall eines Zentralpotentials betrachten [V(r) ≡ 0], der auf eine exakt lösbare Radialgleichung führt. Der dreidimensionale harmonische Oszillator besteht aus einem (spinlosen) Teil chen der Masse μ, das sich in einem Potential 1 V(x, y, z) = μ [ω2x x2 + ω2y y2 + ω2z z2 ] (1) 2 befindet, wobei ω x , ω y und ω z reelle positive Konstanten sind. Der Oszillator heißt isotrop, wenn gilt ωx = ωy = ωz = ω
(2)
Da das Potential (1) die Summe einer nur von x, einer nur von y und einer nur von z abhängigen Funktion ist, können wir die Eigenwertgleichung des Hamilton-Opera tors, H=
P2 + V(R) 2μ
(3)
durch Separieren der Variablen x, y und z in der {|r⟩}-Darstellung lösen; das wurde in Ergänzung EV vorgeführt. Es ergeben sich dann die Energieniveaus des isotropen Oszillators in der Form 3 E n = (n + ) ℏω (4) 2 worin n eine positive ganze Zahl oder null ist. Die Entartung g n des Niveaus E n ist gleich 1 (5) g n = (n + 1)(n + 2) 2 https://doi.org/10.1515/9783110638738-068
•
818 | Ergänzung BVII
und die zugehörigen Eigenfunktionen lauten ψ n x ,n y ,n z (x, y, z) = (
β2 ) π
3/4
1 √2n x +n y +n z n x ! n y ! n z !
2
β 2 2 2 e− 2 ( x +y +z )
× H n x (βx)H n y (βy)H n z (βz)
(6)
mit β=√
μω ℏ
(7)
[H p (u) steht für das hermitesche Polynom p-ten Grades; s. Ergänzung BV ]. Die Funk tion ψ n x ,n y ,n z ist eine Eigenfunktion von H mit dem Eigenwert E n , so dass gilt n = nx + ny + nz
(8)
Wenn der betrachtete Oszillator isotrop ist,¹ hängt das Potential (1) nur vom Abstand r des Teilchens vom Ursprung ab: V(r) =
1 2 2 μω r 2
(9)
Folglich sind die drei Komponenten des Bahndrehimpulses L Konstanten der Bewe gung. Wir suchen die gemeinsamen Eigenzustände von H, L2 und L z . Dazu könnten wir wie in Ergänzung DVI Operatoren einführen, die zu rechts- und linkszirkularen Quanten und entsprechend dem dritten Freiheitsgrad in z-Richtung zu „longitudina len“ Quanten gehören (eine Skizze dieser Methode geben wir am Ende dieser Ergän zung). An dieser Stelle wollen wir dagegen die Radialgleichung mit Hilfe des PolynomAnsatzes lösen, s. Kap. VII, § A.
1 Lösung der Radialgleichung Für einen festen Wert der Quantenzahl l werden die Radialfunktionen R k,l (r) und die zugehörigen Energien E k,l durch die Gleichung [−
ℏ2 1 d2 1 2 2 l(l + 1)ℏ2 + μω r + ] R k,l (r) = E k,l R k,l (r) 2μ r dr2 2 2μr2
(10)
gegeben. Setzen wir 1 u k,l (r) r 2μE k,l = ℏ2
R k,l (r) =
(11a)
ε k,l
(11b)
1 Die Separation der polaren Variablen r, θ, φ ist nur für einen isotropen Oszillator möglich.
Der dreidimensionale isotrope harmonische Oszillator
|
819
•
so wird aus Gl. (10) [
l(l + 1) d2 − β 4 r2 − + ε k,l ] u k,l (r) = 0 2 dr r2
(12)
[β ist die in Gl. (7) definierte Konstante]. Wir müssen die Bedingung im Ursprung hin zufügen: u k,l (0) = 0
(13)
Für große r reduziert sich Gl. (12) auf [
d2 r→∞ − β 4 r2 ] u k,l (r) ≈ 0 dr2
(14)
Die Lösungen von (12) verhalten sich daher asymptotisch wie eβ r /2 oder e−β r /2 ; nur die zweite dieser Möglichkeiten ist physikalisch sinnvoll, und wir werden zum folgen den Funktionenwechsel geführt: 2 2
u k,l (r) = e−β
r /2
2 2
y k,l (r)
2 2
(15)
Man sieht leicht, dass y k,l (r) die folgenden Gleichungen erfüllen muss: d l(l + 1) d2 y k,l − 2β 2 r y k,l + [ε k,l − β 2 − ] y k,l = 0 dr dr2 r2
(16a)
y k,l (0) = 0
(16b)
Wir wollen die Funktion y k,l (r) als Potenzreihe in r ansetzen, ∞
y k,l (r) = r s ∑ a q r q
(17)
q=0
worin per Definition a0 der erste nichtverschwindende Koeffizient ist: a 0 ≠ 0
(18)
Setzen wir die Entwicklung (17) in Gl. (16a) ein, so verhält sich der Term kleinster Ord nung im Ursprung wie r s−2 ; sein Koeffizient verschwindet, wenn gilt [s(s − 1) − l(l + 1)]a0 = 0
(19)
Beachten wir die Bedingungen (18) und (16b), so erkennen wir, dass Gl. (19) nur durch die Wahl s =l+1
(20)
erfüllt werden kann (dieses Ergebnis war vorauszusehen; s. Kap. VII, § A-2-c). Der nächste Term in der Entwicklung von Gl. (16a) verhält sich wie r s−1 und hat den Koef fizienten [s(s + 1) − l(l + 1)]a1
(21)
•
820 | Ergänzung BVII
Da s bereits durch Gl. (20) festgelegt ist, kann er nur für a1 = 0
(22)
verschwinden. Schließlich setzen wir den Koeffizienten des allgemeinen Termes in r q+s gleich null: [(q + s + 2)(q + s + 1) − l(l + 1)]a q+2 + [ε k,l − β 2 − 2β 2 (q + s)]a q = 0
(23)
d. h. mit Gl. (20) (q + 2)(q + 2l + 3)a q+2 = [(2q + 2l + 3)β 2 − ε k,l ]a q
(24)
wir haben somit eine Rekursionsbeziehung für die Koeffizienten a q der Entwick lung (17) erhalten. Als Erstes stellen wir fest, dass sich daraus zusammen mit dem Ergebnis (22) er gibt, dass alle Koeffizienten a q von ungeradem Grad q verschwinden. Die Koeffizien ten geraden Grades müssen hingegen proportional zu a0 sein. Wenn der Wert von ε k,l für keine ganze Zahl q den Term in Klammern auf der rechten Seite von Gl. (24) ver schwinden lässt, finden wir die Lösung y k,l von Gl. (16) in Form einer unendlichen Potenzreihe, für die gilt a q+2 aq
q→∞
∼
2β 2 q
(25)
Dieses Verhalten deckt sich mit dem der Koeffizienten der Entwicklung der Funktion 2 2 eβ r , die durch eβ
2 2
r
∞
= ∑ c2p r2p
(26)
p=0
mit c2p =
β 2p p!
(27)
gegeben wird; es ist also c2p+2 c2p
p→∞
∼
β2 p
(28)
Da 2p der geraden Zahl q in der Entwicklung von y k,l entspricht, sind die Beziehun gen (28) und (25) tatsächlich identisch. Wenn Gl. (17) wirklich eine unendliche An 2 2 zahl von Termen enthält, so wird das asymptotische Verhalten von y k,l durch eβ r bestimmt, was diese Funktion als physikalisch nicht sinnvoll ausschließt [s. Gl. (15)]. Die vom physikalischen Standpunkt aus einzig interessanten Fälle sind daher die jenigen, für die eine gerade nichtnegative ganze Zahl k existiert, so dass gilt ε k,l = (2k + 2l + 3)β 2
(29)
Der dreidimensionale isotrope harmonische Oszillator
| 821
•
Die Rekursionsbeziehung (24) besagt dann, dass alle Koeffizienten von geradem Grad größer als k verschwinden. Da die Koeffizienten ungeraden Grades ohnehin gleich null sind, reduziert sich die Entwicklung (17) auf ein Polynom, und die Radialfunk tion u k,l (r) aus Gl. (15) fällt für r gegen unendlich exponentiell ab.
2 Energieniveaus und stationäre Wellenfunktionen Unter Verwendung der Definitionen (7) und (11b) ergeben sich aus Gl. (29) die Energien E k,l zu einem Wert von l: E k,l = ℏω (k + l +
3 ) 2
(30)
wobei k eine beliebige nichtnegative gerade ganze Zahl ist. Da E k,l nur von der Summe n=k+l
(31)
abhängt, treten zufällige Entartungen auf. Die Energieniveaus des dreidimensionalen isotropen harmonischen Oszillators sind von der Form E n = ℏω (n +
3 ) 2
(32)
l ist eine positive ganze Zahl oder null und k eine positive gerade ganze Zahl oder null; n kann daher alle positiven ganzzahligen Werte oder den Wert null annehmen. Das stimmt mit dem Ergebnis (4) überein. Wir betrachten einen gegebenen Energiewert E n , d. h. einen nichtnegativen Wert von n. Zu dieser Zahl können nach Gl. (31) die folgenden Werte von k und l gehören: (k, l) = (0, n) , (2, n − 2), . . . , (n − 2, 2) , (n, 0)
für gerade n
(33a)
(k, l) = (0, n) , (2, n − 2), . . . , (n − 3, 3) , (n − 1, 1)
für ungerade n
(33b)
Daraus lassen sich unmittelbar die möglichen Werte von l zu den ersten Werten von n ablesen: n = 0:
l=0
n = 1:
l=1
n = 2:
l = 0, 2
n = 3:
l = 1, 3
n = 4:
l = 0, 2, 4
(34)
In Abb. 1 sind die niedrigsten Energieniveaus des isotropen dreidimensionalen Oszil lators dargestellt, wobei dieselben Konventionen wie beim Wasserstoffatom verwen det werden (s. Abb. 4 in Kap. VII).
•
822 | Ergänzung BVII
Zu jedem Paar (k, l) gibt es genau eine Radialfunktion u k,l (r) und damit insgesamt 2l + 1 gemeinsame Eigenfunktionen zu H, L2 und L z : ψ k,l,m (r) =
1 u k,l (r)Y lm (θ, φ) r
(35)
Die Entartung des betrachteten Energieniveaus E n ergibt sich also zu gn =
∑
(2l + 1)
für gerade n
(36a)
(2l + 1)
für ungerade n
(36b)
l=0,2,...,n
gn =
∑ l=1,3,...,n
Abb. 1: Erste Energieniveaus des dreidimensionalen harmonischen Oszillators. Für gerade n kann l die Werte (n/2) + 1 annehmen: l = n, n − 2, . . . , 0, für ungerade n die Werte (n + 1)/2: l = n, n − 2, . . . , 1. Beachtet man die möglichen Werte von m (−l ≤ m ≤ l), so ergibt sich die Entartung des Energieniveaus E n zu (n + 1)(n + 2)/2.
Diese Summen können leicht berechnet werden, und wir erhalten wieder das Ergeb nis (5): n/2
für gerades n :
g n = ∑ (4p + 1) = p=0
für ungerades n :
gn =
(n−1)/2
1 (n + 1)(n + 2) 2
∑ (4p + 3) =
p=0
1 (n + 1)(n + 2) 2
(37a)
(37b)
Für jedes durch (33) gegebene Paar (k, l) können wir aufgrund der Ergebnisse aus § 1 die zugehörige Radialfunktion u k,l (r) bestimmen (bis auf den Faktor a0 ) und damit auch die 2l + 1 gemeinsamen Eigenfunktionen von H und L2 zu den Eigenwerten E n und l(l + 1)ℏ2 . Als Beispiel wollen wir die zu den drei ersten Energieniveaus gehören den Wellenfunktionen explizit berechnen. Für den Grundzustand mit der Energie E0 = 32 ℏω muss k=l=0
(38)
Der dreidimensionale isotrope harmonische Oszillator
| 823
•
sein; y0,0 (r) reduziert sich dann auf a0 r. Wählen wir a0 reell und positiv, so kann die normierte Funktion ψ k=l=m=0 ψ0,0,0 (r) = (
β2 ) π
3/4
e−β
r /2
2 2
(39)
geschrieben werden. Da der Grundzustand nicht entartet ist (g0 = 1), ist ψ0,0,0 gleich der Funktion ψ n x =n y =n z =0 , die durch Separation der kartesischen Variablen x, y, z ge funden wurde [s. Gl. (6)]. Zum ersten angeregten Zustand (E1 = 52 ℏω), der dreifach entartet ist, gehört wie der nur ein einziges Paar (k, l): k=0
(40)
l=1
und damit y0,1 = a0 r2 . Die drei Funktionen der durch L2 und L z definierten Basis sind daher ψ0,1,m (r) = √
8 β 3/2 2 2 βr e−β r /2 Y1m (θ, φ) 3 π1/4
m = 1, 0, −1
(41)
Wir wissen [s. Ergänzung AVI , Gleichungen (32)], dass die Kugelflächenfunktionen die folgenden Relationen erfüllen: rY10 (θ, φ) = √
3 z 4π
3 r x [Y1−1 − Y11 ] = √ 4π √2
(42)
3 r y [Y −1 + Y11 ] = −i√ 4π √2 1 und dass das hermitesche Polynom erster Ordnung durch [s. Ergänzung BVI , Bezie hungen (18)] H1 (u) = 2u
(43)
gegeben wird. Es ist daher klar, dass die drei Funktionen ψ0,1,m mit den Funktionen ψ n x ,n y ,n z der Basis (6) durch die folgenden Relationen verknüpft sind: ψ n x =0,n y =0,n z =1 = ψ k=0,l=1,m=0 1 ψ n x =1,n y =0,n z =0 = [ψ k=0,l=1,m=−1 − ψ k=0,l=1,m=1] √2 i ψ n x =0,n y =1,n z =0 = [ψ k=0,l=1,m=−1 + ψ k=0,l=1,m=1] √2
(44)
•
824 | Ergänzung BVII
Schließlich behandeln wir den zweiten angeregten Zustand mit der Energie E2 = 7ℏω/2. Er ist sechsfach entartet, und die Quantenzahlen k und l können die folgenden Werte annehmen: k=0,
l=2
(45a)
k=2,
l=0
(45b)
Die zu den Werten (45a) gehörende Funktion y0,2 (r) ist gleich a0 r3 . Für die Werte (45b) enthält die Funktion y2,0 zwei Terme; mit Gl. (24) und Gl. (29) finden wir leicht y2,0 (r) = a0 r [1 −
2 2 2 β r ] 3
(46)
Die sechs Funktionen der Basis des Eigenunterraums zu E2 sind also von der Form ψ0,2,m (r) = √
16 β 3/2 2 2 −β2 r2 /2 m β r e Y2 (θ, φ) 15 π1/4
ψ2,0,0 (r) = √
3 β 3/2 2 2 2 (1 − β 2 r2 ) e−β r /2 2 π3/4 3
m = 2, 1, 0, −1, −2
(47a) (47b)
Da wir die expliziten Ausdrücke für die Kugelflächenfunktionen [Ergänzung AVI , Glei chungen (33)] und die hermiteschen Polynome [Ergänzung BV , Gleichungen (18)] ken nen, können wir leicht die folgenden Relationen zeigen: 1 [ψ n x =2,n y =0,n z =0 + ψ n x =0,n y =2,n z =0 + ψ n x =0,n y =0,n z =2 ] √3 1 1 [ψ k=0,l=2,m=2 + ψ k=0,l=2,m=−2] = [ψ n x =2,n y =0,n z =0 − ψ n x =0,n y =2,n z =0 ] √2 √2 1 [ψ k=0,l=2,m=2 − ψ k=0,l=2,m=−2] = iψ n x =1,n y =1,n z =0 √2 1 [ψ k=0,l=2,m=1 − ψ k=0,l=2,m=−1] = −ψ n x =1,n y =0,n z =1 √2 1 [ψ k=0,l=2,m=1 + ψ k=0,l=2,m=−1] = −iψ n x =0,n y =1,n z =1 √2
ψ k=2,l=0,m=0 = −
ψ k=0,l=2,m=0 = √
(48)
2 1 1 [ψ n x =0,n y =0,n z =2 − ψ n x =2,n y =0,n z =0 − ψ n x =0,n y =2,n z =0 ] 3 2 2
Bemerkung: Wie wir bereits zu Beginn dieses Abschnitts bemerkt haben, kann man auf den isotropen dreidi mensionalen Oszillator eine Methode analog zu der in Ergänzung DVI anwenden. Für die Vernich tungsoperatoren a x , a y und a z , die in den Zustandsräumen Hx , Hy bzw. Hz wirken, definieren wir 1 (a x − ia y ) √2 1 ag = (a x + ia y ) √2
ad =
(49a) (49b)
Der dreidimensionale isotrope harmonische Oszillator
| 825
•
Man kann zeigen, dass sich ad und ag wie unabhängige Vernichtungsoperatoren verhalten (Er gänzung DVI , § 3-b). Der Hamilton-Operator H und der Drehimpulsoperator können in Abhängig keit von ad , ag , a z und ihren hermitesch Konjugierten ausgedrückt werden: 3 ) 2
H = ℏω (N d + N g + N z + L z = ℏ(N d − N g )
(50a) (50b)
L+ = ℏ√2(a z ag − ad a z )
(50c)
L− = ℏ√2(ag a z − a z ad )
(50d)
†
†
†
†
Die gemeinsamen Eigenvektoren |χ nd ,ng ,n z ⟩ der Observablen N d , N g und N z kann man erhal ten, indem man die Erzeugungsoperatoren ad † , ag † und a z † auf den Grundzustand |0, 0, 0⟩ des Hamilton-Operators anwendet [dieser Zustand ist eindeutig bis auf einen konstanten Faktor; s. Gl. (6) und Gl. (39)], |χ nd ,ng ,n z ⟩ =
1 √n d ! n g ! n z !
(ad † )nd (ag † )ng (a z † )n z |0, 0, 0⟩
(51)
Nach Gl. (50a) und Gl. (50b) ist |χ nd ,ng ,n z ⟩ Eigenvektor zu H und L z mit den Eigenwerten (n d + n g + n z + 3/2)ℏω und (n d − n g )ℏ. Der Eigenunterraum Hn zu einer gegebenen Energie E n wird daher durch die Menge der Vektoren |χ nd ,ng ,n z ⟩ mit nd + ng + n z = n
(52)
aufgespannt. Unter diesen ist der Eigenvektor zu L z mit dem größtmöglichen, mit der Energie E n verträglichen Eigenwert nℏ durch |χ n,0,0 ⟩ gegeben. Für diesen Ketvektor gilt nach Gl. (50c) L+ |χ n,0,0 ⟩ = 0
(53)
Es handelt sich daher um einen Eigenvektor zu L2 mit dem Eigenwert n(n + 1)ℏ2 ,² und man kann ihn mit dem Ketvektor aus der Basis {|ψ k,l,m ⟩} identifizieren, für den k+l= n
(54)
l=m=n gilt. Also ist |ψ k=0,l=n,m=n ⟩ = |χ nd =n,ng =0,n z =0 ⟩
(55)
Die Anwendung des Operators L− [Gl. (50d)] auf beide Seiten von Gl. (55) ergibt |ψ0,n,n−1 ⟩ = −|χ n−1,0,1 ⟩
(56)
Der Eigenwert (n − 2)ℏ von L z ist, anders als die beiden vorhergehenden, in Hn zweifach entar tet: Zu ihm gehören die orthogonalen Vektoren |χ n−2,0,2 ⟩ und |χ n−1,1,0 ⟩. Wenden wir wieder mit Gl. (50d) L− auf Gl. (56) an, so finden wir |ψ0,n,n−2 ⟩ = √
2(n − 1) 1 |χ n−2,0,2 ⟩ − |χ n−1,1,0 ⟩ 2n − 1 √2n − 1
(57)
2 Das folgt direkt aus Gl. (C-7b) in Kap. VI; man findet für die Wirkung von L2 auf |χ n,0,0 ⟩: L2 |χ n,0,0 ⟩ = ℏ2 (n 2 + n)|χ n,0,0 ⟩.
•
826 | Ergänzung BVII
Man kann zeigen, dass die Wirkung von L+ auf die Linearkombination orthogonal zu Gl. (57) den Nullvektor ergibt; diese Linearkombination muss also ein Eigenvektor zu L2 mit dem Eigenwert (n − 2)(n − 1)ℏ2 sein. Das ergibt bis auf einen Phasenfaktor |ψ2,n−2,n−2 ⟩ =
1 2(n − 1) |χ n−2,0,2 ⟩ + √ |χ n−1,1,0 ⟩ 2n − 1 √2n − 1
(58)
Wir können auf diese Weise durch Iteration³ die beiden Basen {|χ nd ,ng ,n z ⟩} und {|ψ k,l,m ⟩} mitein ander in Verbindung setzen. Und natürlich ist es auch möglich, indem man ad † und ag † in Gl. (51) durch Funktionen von a x † und a y † ersetzt, die Zustände |χ nd ,ng ,n z ⟩ als Linearkombinationen der Vektoren |ψ n x ,n y ,n z ⟩, deren Wellenfunktionen durch (6) gegeben werden, zu schreiben.
Referenzen und Literaturhinweise Weitere Beispiele mit Lösungen: Messiah (1.17), Kap. IX, § 10; Schiff (1.18), § 15; siehe auch Flügge (1.24), § 58 bis § 79.
3 Eine analoge Überlegung werden wir in Kapitel X bei der Addition von zwei Drehimpulsen anstellen.
Wahrscheinlichkeitsströme der stationären Zustände des Wasserstoffatoms
| 827
•
Ergänzung CVII Wahrscheinlichkeitsströme der stationären Zustände des Wasserstoffatoms 1 2 2-a 2-b
Allgemeiner Ausdruck | 827 Anwendung auf die stationären Zustände | 828 Struktur des Wahrscheinlichkeitsstroms | 828 Wirkung eines magnetischen Felds | 829
Die normierten Wellenfunktionen ψ n,l,m (r) der stationären Zustände des Wasserstoff atoms wurden in Kapitel VII bestimmt: ψ n,l,m (r) ist das Produkt aus der Kugelflächen funktion Y lm (θ, φ) und der Funktion R n,l (r), die in § C-3 von Kapitel VII berechnet wurde: ψ n,l,m (r) = R n,l (r)Y lm (θ, φ)
(1)
Dann wurde die räumliche Verteilung der Wahrscheinlichkeitsdichte ρ n,l,m (r) = |ψ n,l,m (r)|2
(2)
zumindest für die niedrigsten Energieniveaus untersucht. Man muss beachten, dass ein stationärer Zustand durch die Angabe der Wahr scheinlichkeitsdichte ρ n,l,m(r) an jedem Ort noch nicht vollständig charakterisiert ist; wir müssen zusätzlich den Wahrscheinlichkeitsstrom betrachten, der wie folgt ausge drückt werden kann: ℏ ∗ Jn,l,m (r) = (r)∇ψ n,l,m (r) + k. k. (3) ψ 2iμ n,l,m wobei „k. k.“ wieder die Abkürzung für den konjugiert komplexen Ausdruck ist (wir nehmen hier an, dass das Vektorpotential A(r, t) verschwindet; μ steht für die Masse des Teilchens). Auf diese Weise können wir dem Quantenzustand eines Teilchens ein Fluid (die sogenannte Wahrscheinlichkeitsflüssigkeit) mit der Dichte ρ(r) zuordnen. Die Fließ bewegung wird durch die Stromdichte J charakterisiert. In einem stationären Zustand sind ρ und J zeitunabhängig. Um die Ergebnisse aus Kapitel VII in Bezug auf die physikalischen Eigenschaf ten der stationären Zustände des Wasserstoffatoms zu vervollständigen, wollen wir im Folgenden die Wahrscheinlichkeitsströme Jn,l,m (r) untersuchen.
1 Allgemeiner Ausdruck Wir betrachten eine beliebige normierte Wellenfunktion ψ(r) und führen reelle Grö ßen α(r) [den Betrag von ψ(r)] und ξ(r) [das Argument von ψ(r)] ein, indem wir schrei ben ψ(r) = α(r) eiξ(r) https://doi.org/10.1515/9783110638738-069
(4)
•
828 | Ergänzung CVII
wobei α(r) ≥ 0 ;
0 ≤ ξ(r) < 2π
(5)
Setzen wir Gl. (4) in die Ausdrücke für die Wahrscheinlichkeitsdichte ρ(r) und den Strom J(r) ein, erhalten wir [wir setzen immer noch verschwindendes Vektorpotential A(r) voraus] ρ(r) = α 2 (r)
(6)
ℏ J(r) = α 2 (r)∇ξ(r) μ
(7)
ρ(r) hängt also nur vom Betrag der Wellenfunktion ab, während in J(r) auch die Phase eingeht [z. B. verschwindet J(r), wenn die Phase räumlich konstant ist]. Bemerkung: Für eine vorgegebene Wellenfunktion ψ(r) ist klar, dass ρ(r) und J(r) wohlbestimmt sind. Gibt es aber umgekehrt auch nur genau eine Funktion ψ(r) zu vorgegebenen Werten von ρ(r) und J(r)? Nach Gl. (6) kann der Betrag α(r) einer Wellenfunktion direkt aus ρ(r) bestimmt werden;¹ das Argument ξ(r) muss die folgende Gleichung erfüllen: ∇ξ(r) =
μ J(r) ℏ ρ(r)
(8)
Wir wissen, dass eine solche Gleichung nur eine Lösung hat, wenn ∇×
J(r) =0 ρ(r)
(9)
ist. Es gibt dann eine unendliche Anzahl von Lösungen, die sich durch einen konstanten Term voneinander unterscheiden. Da diese Konstante einem globalen Phasenfaktor entspricht, ist die Wellenfunktion des Teilchens mit der Festlegung von ρ(r) und J(r) wohlbestimmt, wenn Gl. (9) erfüllt ist. Anderenfalls gibt es keine Wellenfunktion zu den betrachteten Werten von ρ(r) und J(r).
2 Anwendung auf die stationären Zustände 2-a Struktur des Wahrscheinlichkeitsstroms Für die durch Gl. (1) gegebene Form der Wellenfunktion, worin R n,l (r) eine reelle Funk tion und Y lm (θ, φ) ein Produkt von eimφ mit einer reellen Funktion sind, erhalten wir α n,l,m (r) = |R n,l (r)| |Y lm (θ, φ)| ξ n,l,m (r) = mφ
(10)
Benutzen wir Gl. (7) und verwenden den Ausdruck für den Gradienten in Kugelkoor dinaten, folgt weiter Jn,l,m (r) =
ℏ ρ n,l,m (r) m eφ (r) μ r sin θ
1 Natürlich muss ρ(r) als Wahrscheinlichkeitsdichte überall positiv sein.
(11)
Wahrscheinlichkeitsströme der stationären Zustände des Wasserstoffatoms
|
829
•
worin eφ (r) der Einheitsvektor ist, der mit der z-Achse und r ein rechtshändiges Koor dinatensystem bildet. Die Bewegung des Wahrscheinlichkeitsstroms in einer Ebene senkrecht zur z-Achse ist in Abb. 1 dargestellt.
Abb. 1: Struktur des Wahrscheinlichkeitsstroms in einem stationären Zu stand |ψ n,l,m ⟩ des Wasserstoffatoms (einer zur z-Achse senkrechten Ebene). Der Index m gehört zum Eigenwert mℏ von L z . Für m > 0 rotiert der Wahr scheinlichkeitsstrom im Gegenuhrzeigersinn um die z-Achse, für m < 0 im Uhrzeigersinn. Für m = 0 verschwindet der Wahrscheinlichkeitsstrom in allen Raumpunkten.
Nach Gl. (11) verläuft der Strom an jedem Punkt M senkrecht zu der durch M und die z-Achse definierten Ebene: Das Wahrscheinlichkeitsfluid rotiert um die z-Achse. Da |J| nicht proportional zu r sin θ ρ(r) ist, handelt es sich nicht um eine Drehung „en bloc“. Der Eigenwert mℏ der Observablen L z kann als klassischer Drehimpuls der Rotations bewegung des Wahrscheinlichkeitsstroms gedeutet werden. Der Beitrag des Volumen elements d3 r am Punkt r zum Drehimpuls um den Ursprung kann geschrieben werden als dℒ = μr × Jn,l,m (r) d3 r
(12)
Wegen der Symmetrie verläuft die Resultierende dieser elementaren Drehmomente entlang der z-Achse; sie ist gleich ℒz = μ ∫ d3 r ez ⋅ [r × Jn,l,m (r)]
(13)
Mit Gl. (11) für Jn,l,m (r) ergibt sich daraus leicht ℒz = μ ∫ d3 r r|Jn,l,m (r)| sin θ = mℏ ∫ d3 r ρ n,l,m (r) = mℏ
(14)
2-b Wirkung eines magnetischen Felds Die bisher erhaltenen Ergebnisse sind nur gültig, wenn das Vektorpotential A(r) gleich null ist; wir wollen jetzt untersuchen, was sich für ein endliches Vektorpotential er gibt. Betrachten wir z. B. ein Wasserstoffatom, das sich in einem homogenen Magnet feld B befindet. Ein solches Feld kann durch das Vektorpotential 1 A(r) = − r × B 2
(15)
•
830 | Ergänzung CVII
beschrieben werden. Wie sieht jetzt der zum Grundzustand gehörende Wahrschein lichkeitsstrom aus? Der Einfachheit halber nehmen wir an, dass die Wellenfunktion des Grundzu stands durch das magnetische Feld B nicht verändert wird.² Der Wahrscheinlichkeits strom kann dann aus dem allgemeinen Ausdruck für J [s. Kap. III, Gl. (D-20)] berechnet werden; es ergibt sich 1 ℏ {ψ∗n,l,m (r) [ ∇ − qA(r)] ψ n,l,m (r) + k. k.} 2μ i 1 = ρ n,l,m (r) [ℏ∇ξ n,l,m (r) − qA(r)] μ
Jn,l,m (r) =
(16)
Für den Grundzustand und ein in z-Richtung zeigendes Magnetfeld B erhalten wir mit Gl. (15) ωc ρ 1,0,0 (r) ez × r (17) J1,0,0 (r) = 2 wobei die Zyklotronfrequenz ωc definiert ist durch ωc = −
qB μ
(18)
Der Wahrscheinlichkeitsstrom des Grundzustands verschwindet also im Gegen satz zum Fall B = 0 in Anwesenheit eines Magnetfelds nicht. Gleichung (17) besagt, dass der Wahrscheinlichkeitsstrom als Ganzes mit der Winkelgeschwindigkeit ωc /2 um B rotiert. Physikalisch ist das so zu verstehen, dass mit dem Einschalten des Ma gnetfelds B vorübergehend ein elektrisches Feld E(t) existieren muss; unter dessen Einfluss führt das Elektron, während es im Grundzustand bleibt, eine Rotationsbe wegung um das Proton aus, wobei die Winkelgeschwindigkeit nur von der Stärke des B-Felds abhängt (und nicht vom exakten Verhalten des Felds in der Übergangsperiode des Einschaltvorgangs). Bemerkung: Die spezielle Wahl der Eichung in Gl. (15) erlaubte es, dieselben Wellenfunktionen wie in Abwe senheit des Felds mit nur vernachlässigbarem Fehler zu verwenden (s. Fußnote). Bei anderer Ei chung wären die Wellenfunktionen verändert worden (s. Ergänzung HIII ), und in Gl. (16) wäre der A(r) enthaltende Term nicht der einzige gewesen, der in erster Ordnung in B zu J(r) beigetragen hätte. Am Ende der Rechnung hätten wir jedoch wiederum Gl. (17) gefunden, da das physikalische Ergebnis von der Eichung nicht abhängen darf.
2 Da der Hamilton-Operator H von B abhängt, ist dies offenbar nicht in Strenge richtig. Man kann jedoch [s. Gl. (6) und Gl. (7) in Ergänzung DVII ] zeigen, dass für die in Gl. (15) gewählte Eichung und für ein in z-Richtung orientiertes B-Feld die Funktionen ψ n,l,m (r) bis auf einen Term zweiter Ordnung in B Eigenfunktionen zu H sind. Wendet man die in Kapitel XI entwickelte Störungstheorie an, so sieht man, dass dieser Term zweiter Ordnung für die in einem Labor normalerweise erzeugten Feldstärken vernachlässigbar ist.
Das Wasserstoffatom im homogenen Magnetfeld |
831
•
Ergänzung DVII Das Wasserstoffatom im homogenen Magnetfeld. Paramagnetismus und Diamagnetismus. Der Zeeman-Effekt 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c
Der Hamilton-Operator des Problems | 832 Hamilton-Operator | 832 Größenordnung der einzelnen Terme | 833 Interpretation des paramagnetischen Terms | 835 Interpretation des diamagnetischen Terms | 836 Der Zeeman-Effekt | 838 Energieniveaus des Atoms in Gegenwart eines Magnetfelds | 838 Oszillationen des elektrischen Dipols | 839 Frequenz und Polarisation der emittierten Strahlung | 841
In Kapitel VII haben wir die quantenmechanischen Eigenschaften des freien Wasser stoffatoms untersucht, d. h. eines Systems aus einem Elektron und einem Proton, die sich elektrostatisch anziehen, aber mit keinem externen Feld wechselwirken. In die sem Abschnitt wollen wir die neuen Effekte betrachten, die beim Wasserstoffatom un ter dem Einfluss eines statischen Magnetfeldes auftreten. Dabei werden wir uns auf den Fall eines homogenen Felds beschränken, was in der Praxis immer erfüllt ist, da für die im Labor erzeugten Magnetfelder die relativen Schwankungen über atomare Distanzen sehr klein sind. Wir haben bereits das Verhalten eines Elektrons unter dem Einfluss entweder nur eines elektrischen (Kapitel VII) oder nur eines magnetischen (Ergänzung EVI ) Felds untersucht und werden jetzt diese Überlegungen verallgemeinern, indem wir die Energieniveaus eines Elektrons sowohl unter dem Einfluss des internen elektrischen Felds des Atoms als auch unter dem eines externen magnetischen Felds berechnen. Unter diesen Bedingungen ist die exakte Lösung der Schrödinger-Gleichung sehr kom pliziert; wie wir jedoch sehen werden, kann das Problem unter Verwendung gewisser Näherungen beträchtlich vereinfacht werden: Zunächst werden wir den Einfluss der endlichen Kernmasse vernachlässigen.¹ Dann werden wir die Tatsache ausnutzen, dass in der Praxis der Einfluss des externen magnetischen Felds sehr viel kleiner ist als der des internen elektrischen Felds des Atoms: Die Verschiebung der atoma ren Niveaus aufgrund des Magnetfelds sind sehr viel kleiner als ihre energetischen Abstände im verschwindenden Feld. 1 Für das Wasserstoffatom ist diese Näherung durch die sehr viel größere Masse des Protons im Ver gleich zum Elektron gerechtfertigt. Für das Myonium (s. Ergänzung AVII ) ist sie bereits weniger gut erfüllt und für das Positronium schließlich ist sie gar nicht mehr anwendbar. Darüber hinaus weisen wir darauf hin, dass es in Gegenwart eines magnetischen Felds nicht mehr in Strenge möglich ist, die Bewegung des Massenmittelpunkts zu separieren (s. § B von Kapitel VII); wollte man den Einfluss der endlichen Kernmasse in die Überlegungen mit einbeziehen, würde es nicht ausreichen, die Masse m e des Elektrons durch die reduzierte Masse μ des Elektron-Proton-Systems zu ersetzen. https://doi.org/10.1515/9783110638738-070
•
832 | Ergänzung DVII
In dieser Ergänzung werden wir für die Atomphysik wichtige Effekte einführen und erklären; insbesondere werden wir sehen, wie atomarer Paramagnetismus und Diamagnetismus im quantenmechanischen Formalismus auftreten. Zusätzlich wer den wir in der Lage sein, die Veränderungen des optischen Spektrums des Wasser stoffatoms vorherzusagen, die sich in einem statischen Magnetfeld ergeben (ZeemanEffekt).
1 Hamilton-Operator. Paramagnetischer und diamagnetischer Anteil 1-a Hamilton-Operator Wir betrachten ein spinloses Teilchen mit der Masse me und der Ladung q, das sich gleichzeitig unter dem Einfluss eines Skalarpotentials V(r) und eines Vektorpotentials A(r) befindet. Sein Hamilton-Operator lautet 1 H= (1) [P − qA(R)] 2 + V(R) 2me Wenn das magnetische Feld B = ∇ × A(r) homogen ist, kann das Vektorpotential A in der folgenden Form geschrieben werden: 1 (2) A(r) = − r × B 2 Um diesen Ausdruck in Gl. (1) einzusetzen, berechnen wir die Größe q q2 (3) (R × B)2 [P ⋅ (R × B) + (R × B) ⋅ P] + 2 4 Da es sich bei B in Wirklichkeit um eine Konstante und nicht um einen Operator han delt, vertauschen alle Observablen mit B, so dass wir nach den Regeln der Vektorrech nung erhalten [P − qA(R)]2 = P2 +
q q2 2 2 [R B − (R ⋅ B)2 ] [B ⋅ (P × R) − (R × P) ⋅ B] + 2 4 Auf der rechten Seite dieser Gleichung tritt der Drehimpuls L des Teilchens auf, [P − qA(R)]2 = P2 +
(4)
L = R × P = −P × R
(5)
Wir können daher H in der Form H = H0 + H1 + H2
(6)
schreiben, wobei H0 , H1 und H2 definiert werden durch P2 + V(R) 2me μB H1 = − L ⋅ B ℏ q2 B2 2 R H2 = 8me ⊥ H0 =
(7a) (7b) (7c)
Das Wasserstoffatom im homogenen Magnetfeld | 833
•
In diesen Gleichungen steht μB für das Bohr-Magneton (mit der Dimension eines ma gnetischen Moments), μB =
qℏ 2me
(8)
und der Operator R⊥ ist die Projektion von R auf eine Ebene senkrecht zu B, R2⊥ = R2 −
(R ⋅ B)2 B2
(9)
Wählen wir ein orthonormales x, y, z-System so, dass B parallel zur z-Achse ist, dann gilt R2⊥ = X 2 + Y 2
(10)
Bemerkung: Wenn das B-Feld gleich null ist, wird H gleich H 0 , also gleich der Summe der kinetischen Energie P2 /2m e und der potentiellen Energie V(R). Wir dürfen daraus aber nicht schließen, dass P2 /2m e immer noch die kinetische Energie des Elektrons ist, wenn das B-Feld nicht gleich null ist. Wir haben gesehen (s. Ergänzung HIII ), dass sich die physikalische Bedeutung von im Zustandsraum wirkenden Operatoren mit einem nichtverschwindenden Vektorpotential ändert. Zum Beispiel stellt der Impuls P nicht mehr den mechanischen Impuls Π = m e V dar, und die kinetische Energie ist gleich Π2 1 = [P − qA(R)]2 2m e 2m e
(11)
Nimmt man den Term P2 /2m e für sich, so hängt seine Bedeutung von der gewählten Eichung ab. In der in Gl. (2) definierten Eichung kann leicht gezeigt werden, dass er der „relativen“ kine tischen Energie Π2R /2m e entspricht, wobei ΠR der mechanische Impuls des Teilchens in Bezug auf das Larmor-System ist, das mit der Winkelgeschwindigkeit ωL = −qB/2m e um B rotiert. Der Term H 2 beschreibt dann die kinetische Energie Π2E /2m e , die mit der Bewegung des Koordina tensystems zusammenhängt; H 1 hingegen entspricht dem Mischterm ΠE ⋅ ΠR /m e .
1-b Größenordnung der einzelnen Terme In Gegenwart eines magnetischen Felds B erscheinen im Hamilton-Operator H zwei neue Terme H1 und H2 . Bevor wir deren physikalische Bedeutung genauer betrachten, wollen wir die Größenordnung der zu ihnen gehörenden Energieverschiebungen ∆E (oder der Frequenzverschiebungen ∆E/h) ermitteln. Für H0 kennen wir bereits die entsprechenden Energiedifferenzen ∆E0 . Die zuge hörigen Frequenzen sind von der Größenordnung ∆E0 ≈ 1014 bis 1015 Hz h
(12)
Mit Gl. (7b) sehen wir, dass ∆E1 näherungsweise durch ∆E1 1 μ B ωL ≈ ( ℏB) = h h ℏ 2π
(13)
•
834 | Ergänzung DVII
gegeben ist, worin ωL die Larmor-Frequenz² ωL = −
qB 2μ
ist. Eine kurze Rechnung ergibt die Larmor-Frequenz für ein Elektron: νL ωL = ≈ 1.40 × 1010 Hz/T = 1.40 MHz/G B 2πB Bei den üblichen Feldstärken (die selten 100 000 G überschreiten) ist ωL ≲ 1011 Hz 2π Ein Vergleich von Gl. (12) mit der Ungleichung (16) ergibt ∆E1 ≪ ∆E0
(14)
(15)
(16)
(17)
Nun wollen wir zeigen, dass gilt ∆E2 ≪ ∆E1
(18)
Dafür werden wir die Größenordnung ∆E2 der zu H2 gehörenden Energien berechnen. Die Matrixelemente des Operators R2⊥ = X 2 + Y 2 sind von der gleichen Größenordnung wie a20 . Wir erhalten also ∆E2 ≈
q2 B2 2 a me 0
(19)
und damit das Verhältnis ∆E2 q2 B2 2 1 qB me a20 ≈ a0 = 2ℏ ∆E1 me ℏωL me ℏ2
(20)
Nun gilt gemäß den Gleichungen (C-12a) und (C-12b) aus Kapitel VII ∆E0 ≈
ℏ2 me a20
(21)
so dass Gl. (20) in Verbindung mit Gl. (13) ergibt ∆E2 ∆E1 ≈ ∆E1 ∆E0
(22)
womit nach Ungleichung (17) die Beziehung (18) bewiesen ist. Somit bleiben die Einflüsse des Magnetfelds in der Praxis sehr viel kleiner als die des internen Felds des Atoms. Darüber hinaus ist es im Allgemeinen ausreichend, wenn wir uns auf die Auswirkungen des Terms H1 beschränken, demgegenüber H2 vernachlässigbar ist (H2 wird nur in den speziellen Fällen berücksichtigt, in denen der Beitrag von H1 gleich null ist).³ 2 Die Larmor-Frequenz ωL /2π ist gleich der halben Zyklotronfrequenz. 3 Der Zeeman-Effekt des dreidimensionalen harmonischen Oszillators kann ohne Näherungen be rechnet werden (s. Aufgabe 2 aus Ergänzung GVII ), weil V(R) und H 2 dann eine analoge Form haben. Dieses Beispiel ist deshalb interessant, weil es ermöglicht, die Beiträge von H 1 und H 2 für einen lös baren Fall zu untersuchen.
Das Wasserstoffatom im homogenen Magnetfeld | 835
•
1-c Interpretation des paramagnetischen Terms Wir betrachten zuerst den durch Gl. (7b) gegebenen Term H1 und werden sehen, dass er als Kopplungsenergie −M1 ⋅ B des B-Felds und des zur Rotation des Elektrons auf seiner Bahn gehörenden magnetischen Moments M1 interpretiert werden kann. Dazu berechnen wir zunächst das magnetische Moment 𝓜, das klassisch zu einer Ladung q auf einer Kreisbahn mit dem Radius r gehört (Abb. 1). Wenn v die Geschwin digkeit des Teilchens ist, entspricht seine Bewegung einem Strom i=q
v 2πr
(23)
Die durch diesen Strom definierte Fläche ist S = πr2
(24)
so dass das magnetische Moment 𝓜 wie folgt gegeben ist: |𝓜| = iS =
q rv 2
(25)
Führen wir den Drehimpuls 𝓛 ein, der wegen der tangential verlaufenden Geschwin digkeit den Betrag |𝓛| = me rv
(26)
hat, können wir Gl. (25) in der Form schreiben 𝓜=
q 𝓛 2me
(27)
(es handelt sich um eine Vektorgleichung, weil 𝓛 und 𝓜, die beide senkrecht auf der Ebene der klassischen Bahn stehen, parallel sind).
Abb. 1: Klassisch kann die Bewegung des Elektrons auf seiner Bahn als Stromschleife mit dem magnetischen Moment 𝓜 angesehen werden.
Quantenmechanisch entspricht Gl. (27) die Operatorgleichung M1 =
q L 2me
(28)
Wir können daher H1 in der Form H1 = −M1 ⋅ B
(29)
•
836 | Ergänzung DVII
schreiben, wodurch die oben gegebene Interpretation bestätigt wird: H1 entspricht der Kopplung zwischen dem magnetischen Feld B und dem atomaren magnetischen Moment (M1 ist unabhängig von B); H1 wird daher als paramagnetischer Kopplungs term bezeichnet. Bemerkungen: 1. Nach Gl. (28) sind die Eigenwerte einer jeden Komponente des magnetischen Moments von der Form (
q ) (mℏ) = mμ B 2m e
(30)
wobei m eine ganze Zahl ist. Das Bohr-Magneton μ B gibt daher die Größenordnung des zu der Bahnbewegung gehörenden magnetischen Moments an; die Definition (8) ist somit sinnvoll. Es ist μ B ≈ −9.27 × 10−24 J/T
(31)
2. Wie wir in Kapitel IX sehen werden, besitzt das Elektron neben dem Bahndrehimpuls L auch einen inneren Spin S. Mit dieser Observablen ist ein magnetisches Moment MS proportional zu S verbunden, MS = 2
μB S ℏ
(32)
Obwohl die magnetischen Effekte infolge des Spins wichtig sind, berücksichtigen wir sie im Au genblick nicht (und kommen in Ergänzung DXII auf sie zurück). 3. Die oben verwendete klassische Darstellung ist nicht ganz korrekt: Wir haben den Drehimpuls 𝓛 =r×p
(33)
mit dem Drehimpuls des mechanischen Impulses λ = r × m e v = 𝓛 − qr × A(r)
(34)
vertauscht. Allerdings ist der Fehler klein. Wie wir im nächsten Abschnitt sehen werden, läuft er lediglich auf das Vernachlässigen von H 2 im Vergleich zu H 1 hinaus.
1-d Interpretation des diamagnetischen Terms Betrachten wir einen Zustand des Wasserstoffatoms mit dem Drehimpuls null (z. B. den Grundzustand). Die von H1 stammenden Korrekturen zur Energie dieses Zustands sind dann ebenfalls gleich null. Um also die Wirkung des B-Felds zu bestimmen, müs sen wir jetzt H2 betrachten. Wie kann die zugehörige Energie interpretiert werden? Wir haben gesehen (s. Ergänzung CVII , § 2-b), dass in Gegenwart eines homogenen Magnetfelds der zum Elektron gehörende Wahrscheinlichkeitsstrom modifiziert wird. Dieser Strom ist in Bezug auf B rotationssymmetrisch, ihm entspricht eine einheitli che Rotation des Wahrscheinlichkeitsflusses, die für positives q im Uhrzeigersinn und für negatives q im Gegenuhrzeigersinn verläuft. Mit dem zugehörigen elektrischen
Das Wasserstoffatom im homogenen Magnetfeld |
837
•
Strom ist dann ein magnetisches Moment ⟨M2 ⟩ antiparallel zu B verbunden, und da mit ergibt sich eine positive Kopplungsenergie, was den physikalischen Ursprung des Terms H2 erklärt. Für ein genaueres Verständnis kehren wir zur klassischen Überlegung des vorher gehenden Abschnitts zurück und beachten (s. Bemerkung 3 in § 1-c), dass das magne tische Moment 𝓜 proportional zu λ = r × me v ist (und nicht zu 𝓛 = r × p): 𝓜=
q q λ= [𝓛 − qr × A(r)] 2me 2me
(35)
Wenn 𝓛 gleich null ist, reduziert sich 𝓜 in der Eichung von Gl. (2) auf 𝓜2 =
q2 q2 r × (r × B) = [(r ⋅ B)r − r2 B] 4me 4me
(36)
𝓜2 ist proportional zur Größe des magnetischen Felds.⁴ Es handelt sich daher um das durch B induzierte Moment im Atom. Seine Kopplungsenergie mit B ist B
1 W2 = − ∫ 𝓜2 (B ) ⋅ dB = − 𝓜2 (B) ⋅ B 2 0
q2 = [r2 B2 − (r ⋅ B)2 ] 8me q2 2 2 r B = 8me ⊥
(37)
wie wir bereits in Gl. (7c) gefunden haben. Unsere Interpretation wird somit bestätigt: H2 beschreibt die Kopplung zwischen dem B-Feld und dem im Atom induzierten ma gnetischen Moment M2 . Da das induzierte Moment nach der Lenzschen Regel dem angelegten Feld entgegenwirkt, ist die Kopplungsenergie positiv. Daher wird H2 dia magnetischer Term des Hamilton-Operators genannt. Bemerkung: Wir haben bereits darauf hingewiesen [s. Ungleichung (18)], dass der Effekt des atomaren Dia magnetismus relativ klein ist und vom Paramagnetismus überlagert wird, wenn beide Effekte gleichzeitig auftreten. Wie Gl. (37) (mit den Rechnungen aus § 1-b) zeigt, hängt dies mit der klei nen Größe des atomaren Radius zusammen: Mit den üblichen Magnetfeldern ist der von einem Atom aufgefangene magnetische Fluss sehr klein. Man darf nicht davon ausgehen, dass H 2 im Vergleich zu H 1 immer, d. h. für jedes physikalische Problem, vernachlässigt werden kann. Zum Beispiel zeigten wir in Ergänzung EVI für ein freies Elektron (für das der Radius der klassischen Kreisbahn in einem verschwindenden Magnetfeld unendlich groß wäre), dass der Beitrag des diamagnetischen Terms genauso wichtig ist wie der des paramagnetischen Terms.
4 𝓜2 ist nicht kollinear mit B. Allerdings kann gezeigt werden, dass im Grundzustand des Was serstoffatoms der Erwartungswert ⟨M2 ⟩ des zu 𝓜2 gehörenden Operators antiparallel zu B ist. Das stimmt mit den obigen Resultaten über die Struktur des Wahrscheinlichkeitsstroms überein.
•
838 | Ergänzung DVII
2 Der Zeeman-Effekt Nachdem wir die physikalische Bedeutung der verschiedenen im Hamilton-Operator auftretenden Terme erklärt haben, wollen wir nun ihre Auswirkungen auf das Spek trum des Wasserstoffatoms näher betrachten. Wir werden untersuchen, wie sich die Emission einer optischen Linie, der sogenannten Resonanzlinie (λ ≈ 1.2 ⋅ 10−5 cm) verändert, wenn das Atom in ein Magnetfeld gebracht wird. Dabei werden wir sehen, dass nicht nur die Frequenz verschoben wird, sondern dass sich auch die Polarisation der Linien ändert: Das ist der Zeeman-Effekt. Wichtige Bemerkung: In Wirklichkeit enthält die Resonanzlinie des Wasserstoffatoms infolge des Elektronen- und Pro tonenspins eine Reihe von begleitenden Linien (Fein- und Hyperfeinstruktur; s. Kapitel XII). Dar über hinaus modifizieren die Spinfreiheitsgrade wesentlich den Einfluss des Magnetfelds auf die einzelnen Komponenten der Resonanzlinie (der Zeeman-Effekt des Wasserstoffatoms wird manchmal als „anomal“ bezeichnet). Da wir an dieser Stelle die Spineffekte vernachlässigen, entsprechen die folgenden Überlegungen nicht genau den wirklichen physikalischen Gegeben heiten. Sie können jedoch leicht verallgemeinert werden, so dass Spineffekte mit einbezogen werden (s. Ergänzung DXII ). Außerdem bleiben die Ergebnisse (das Entstehen mehrerer ZeemanKomponenten verschiedener Frequenzen und Polarisationen) qualitativ gültig.
2-a Energieniveaus des Atoms in Gegenwart eines Magnetfelds Die Resonanzlinie des Wasserstoffatoms entspricht einem atomaren Übergang zwi schen dem Grundzustand 1s (n = 1; l = m = 0) und dem angeregten Zustand 2p (n = 2; l = 1; m = +1, 0, −1). Während der Drehimpuls im Grundzustand null ist, stimmt das für den angeregten Zustand nicht mehr; wenn wir die Modifikationen ei ner optischen Linie in Gegenwart eines Magnetfelds B berechnen, machen wir daher mit der Vernachlässigung des diamagnetischen Terms H2 einen kleinen Fehler, den wir mit der Wahl von H0 + H1 als Hamilton-Operator in Kauf nehmen müssen. Wir bezeichnen mit |ψ n,l,m ⟩ die gemeinsamen Eigenzustände von H0 (Eigenwert E n = −EI /n2 ), L2 (Eigenwert l(l + 1)ℏ2 ) und L z (Eigenwert mℏ). Die Wellenfunktionen dieser Zustände haben wir in diesem Kapitel berechnet: ψ n,l,m (r, θ, φ) = R n,l (r)Y lm (θ, φ)
(38)
Legen wir die z-Achse parallel zu B, so sehen wir, dass die Zustände |ψ n,l,m ⟩ dann auch Eigenzustände von H0 + H1 sind: μB BL z ) |ψ n,l,m ⟩ ℏ = (E n − mμ B B)|ψ n,l,m ⟩
(H0 + H1 )|ψ n,l,m ⟩ = (H0 −
(39)
Das Wasserstoffatom im homogenen Magnetfeld | 839
•
Vernachlässigen wir also den diamagnetischen Term, sind die stationären Zustände des Atoms im Magnetfeld B immer noch durch |ψ n,l,m ⟩ gegeben; lediglich die zugehö rigen Energien sind verändert. Insbesondere gilt für die zur Resonanzlinie gehörenden Zustände (H0 + H1 )|ψ1,0,0 ⟩ = −EI |ψ1,0,0 ⟩
(40a)
(H0 + H1 )|ψ2,1,m ⟩ = [−EI + ℏ(Ω + mωL )] |ψ2,1,m ⟩
(40b)
worin Ω=
E2 − E1 3EI = ℏ 4ℏ
(41)
die Kreisfrequenz der Resonanzlinie ohne Feld ist.
2-b Oszillationen des elektrischen Dipols α Matrixelemente des Dipoloperators Es sei D = qR
(42)
der elektrische Dipoloperator des Atoms. Zur Bestimmung des Erwartungswerts ⟨D⟩ dieses Dipols beginnen wir mit der Berechnung der Matrixelemente von D. Bei Spiegelungen am Ursprung wechselt D nach −D: Der elektrische Dipol ist also ein ungerader Operator (s. Ergänzung FII ). Auch die Zustände |ψ n,l,m ⟩ haben wohlde finierte Parität: Da ihre Winkelabhängigkeit durch Y lm (θ, φ) gegeben ist, haben sie die Parität +1 für gerade l und −1 für ungerade l (s. Ergänzung AVI ). Daraus folgt insbe sondere (für alle m, m ) ⟨ψ1,0,0 | D | ψ1,0,0 ⟩ = 0 ⟨ψ2,1,m | D | ψ2,1,m ⟩ = 0
(43)
Die nichtverschwindenden Matrixelemente von D sind also notwendig nichtdia gonal. Um die Matrixelemente ⟨ψ2,1,m | D | ψ1,0,0 ⟩ zu berechnen, erinnern wir uns an die Ausdrücke für x, y und z in Abhängigkeit von den Kugelflächenfunktionen: x=√
2π r [Y1−1 (θ, φ) − Y 11 (θ, φ)] 3
y = i√ z=√
2π r [Y1−1 (θ, φ) + Y 11 (θ, φ)] 3
4π 0 rY1 (θ, φ) 3
(44)
•
840 | Ergänzung DVII
In den Ausdrücken für die gesuchten Matrixelemente finden wir daher auf der einen Seite ein Radialintegral, das wir gleich χ setzen, ∞
χ = ∫ R2,1 (r)R1,0 (r)r3 dr
(45)
0
und auf der anderen Seite ein Winkelintegral, das sich aufgrund der Beziehungen (44) auf Skalarprodukte von Kugelflächenfunktionen reduziert, die direkt aus deren Ortho gonalitätsbedingungen berechnet werden können. So erhalten wir schließlich ⟨ψ2,1,1 | D x | ψ1,0,0 ⟩ = −⟨ψ2,1,−1 | D x | ψ1,0,0 ⟩ = −
qχ √6
(46a)
⟨ψ2,1,0 | D x | ψ1,0,0 ⟩ = 0 ⟨ψ2,1,1 | D y | ψ1,0,0 ⟩ = ⟨ψ2,1,−1 | D y | ψ1,0,0 ⟩ =
iqχ √6
(46b)
⟨ψ2,1,0 | D y | ψ1,0,0 ⟩ = 0 ⟨ψ2,1,1 | D z | ψ1,0,0 ⟩ = ⟨ψ2,1,−1 | D z | ψ1,0,0 ⟩ = 0 qχ ⟨ψ2,1,0 | D z | ψ1,0,0 ⟩ = √3
(46c)
β Berechnung des Erwartungswerts des Dipols Die Ergebnisse des vorstehenden Abschnitts zeigen, dass der Erwartungswert des Ope rators D gleich null ist, wenn sich das System in einem stationären Zustand befin det. Nehmen wir nun an, dass der Zustandsvektor des Systems zu Anfang eine lineare Überlagerung des Grundzustands 1s mit einem der 2p-Zustände ist, |ψ m (0)⟩ = cos α |ψ1,0,0 ⟩ + sin α |ψ2,1,m ⟩
(47)
mit m = +1, 0 oder −1 (α ist ein reeller Parameter). Daraus erhalten wir sofort den Zustandsvektor |ψ m (t)⟩ = cos α |ψ1,0,0 ⟩ + sin αe−i(Ω+mωL)t |ψ2,1,m ⟩
(48)
zur Zeit t (wir haben den globalen Phasenfaktor eiEI t/ℏ fortgelassen, da er keine phy sikalische Bedeutung hat). Um den Erwartungswert des Dipolmoments ⟨D⟩m (t) = ⟨ψ m (t) | D | ψ m (t)⟩
(49)
zu berechnen, verwenden wir die Gleichungen (46) und (48) und unterscheiden drei Fälle:
Das Wasserstoffatom im homogenen Magnetfeld | 841
1.
•
Wenn m = 1 ist, erhalten wir qχ sin 2α cos [(Ω + ωL )t] √6 qχ ⟨D y ⟩1 = − sin 2α sin [(Ω + ωL )t] √6 ⟨D x ⟩1 = −
(50)
⟨D z ⟩1 = 0
2.
Der Vektor ⟨D⟩1 (t) rotiert also in der x, y-Ebene im Gegenuhrzeigersinn und mit der Winkelgeschwindigkeit Ω + ωL um die z-Achse. Für m = 0 ist ⟨D x ⟩0 = ⟨D y ⟩0 = 0 ⟨D z ⟩0 =
3.
qχ sin 2α cos Ωt √3
(51)
Die Bewegung von ⟨D⟩0 (t) ist eine lineare Oszillation entlang der z-Achse mit der Kreisfrequenz Ω. Für m = −1 ist qχ sin 2α cos [(Ω − ωL )t] √6 qχ sin 2α sin [(Ω − ωL )t] =− √6
⟨D x ⟩−1 = ⟨D y ⟩−1
(52)
⟨D z ⟩−1 = 0 Der Vektor ⟨D⟩−1 (t) rotiert also wieder in der x, y-Ebene um die z-Achse, diesmal aber im Uhrzeigersinn und mit der Winkelgeschwindigkeit Ω − ωL .
2-c Frequenz und Polarisation der emittierten Strahlung In allen drei Fällen (m = +1, 0 und −1) ist der Erwartungswert des elektrischen Dipols eine oszillierende Funktion der Zeit, und es ist klar, dass dieser Dipol elektromagne tische Energie abstrahlt. Da die atomaren Dimensionen im Vergleich zur optischen Wellenlänge vernach lässigbar klein sind, kann die atomare Strahlung in großen Abständen als Dipol strahlung angesehen werden. Wir wollen annehmen⁵, die Eigenschaften des vom Atom während des Übergangs zwischen dem |ψ2,1,m ⟩-Zustand und dem Grundzu
5 Wollten wir das Problem gänzlich quantenmechanisch behandeln, müssten wir die Quantentheo rie der Strahlung anwenden. Insbesondere das Zurückkehren des Atoms in den Grundzustand durch spontane Emission eines Photons könnte nur im Rahmen dieser Theorie verstanden werden. Trotzdem bleiben die halbklassischen Resultate, solang sie die Strahlung betreffen, im Wesentlichen gültig.
•
842 | Ergänzung DVII
stand emittierten oder absorbierten Lichts würden mit der klassischen Berechnung der Strahlung eines Dipols, der durch den quantenmechanischen Erwartungswert ⟨D⟩m (t) gegeben wird, richtig beschrieben. Um die Fragestellung zu präzisieren, nehmen wir an, dass Strahlung von einer Probe emittiert wird, die eine große Anzahl von Atomen enthält, die auf irgendeine Weise in den 2p-Zustand angeregt wurden. In den meisten durchgeführten Experi menten ist die Anregung isotrop, und die drei Zustände |ψ2,1,1 ⟩, |ψ2,1,0 ⟩ und |ψ2,1,−1 ⟩ treten mit gleicher Wahrscheinlichkeit auf. Wir beginnen daher, indem wir die Strah lungsverteilung für jeden der in den vorhergehenden Abschnitten behandelten Fälle berechnen. Daraus erhalten wir dann die tatsächlich vom Atom emittierte Strahlung, wenn wir für jede Raumrichtung die Summe der Intensitäten des in den einzelnen Fällen emittierten Lichts bilden. 1. Für m = 1 ist die Kreisfrequenz der emittierten Strahlung gleich Ω + ωL . Die Fre quenz der optischen Linie ist also durch das Magnetfeld leicht verschoben. In Übereinstimmung mit den Gesetzen der klassischen Elektrodynamik, angewandt auf einen rotierenden Dipol wie ⟨D⟩1 (t), ist die in z-Richtung emittierte Strahlung zirkular polarisiert (die zugehörige Polarisation wird mit σ + bezeichnet). Die in Richtung der x, y-Ebene emittierte Strahlung ist linear polarisiert (parallel zu die ser Ebene). In andere Richtungen liegt elliptische Polarisation vor. 2. Für m = 0 müssen wir einen mit der Frequenz Ω linear in z-Richtung oszillieren den Dipol betrachten, wie er auch im verschwindenden Magnetfeld existiert. Die Wellenlänge der Strahlung wird daher durch das Magnetfeld B nicht verändert. Sie ist in allen Richtungen linear polarisiert. So ist z. B. für die Ausbreitung in ei ne Richtung der x, y-Ebene die Polarisation parallel zur z-Achse (π-Polarisation). In Richtung der z-Achse wird keine Strahlung emittiert (ein oszillierender linearer Dipol strahlt nicht entlang seiner Achse). 3. Für m = −1 sind die Ergebnisse analog zu denen für m = 1. Der einzige Unter schied besteht darin, dass die Kreisfrequenz der Strahlung jetzt Ω − ωL anstelle von Ω + ωL ist und dass der Dipol in entgegengesetzter Richtung rotiert; dadurch wird z. B. der Umlaufsinn der zirkularen Polarisation verändert (σ − -Polarisation). Nehmen wir nun an, die Anzahl der angeregten Atome in den drei Zuständen zu m = +1, 0 und −1 sei gleich groß, so folgt: – in jede beliebige Raumrichtung werden drei optische Frequenzen emittiert: Ω/2π, (Ω ± ωL )/2π. Die Polarisation zur ersten Frequenz ist linear, die zu den anderen ist im Allgemeinen elliptisch; – in einer Richtung senkrecht zum B-Feld sind die drei Polarisationen linear (s. Abb. 2 links); die erste ist parallel zu B. Die Intensität der zentralen Linie ist dop pelt so groß wie die der verschobenen Linien [s. Gleichungssysteme (50), (51) und (52)]. In Richtung parallel zu B werden nur die zwei verschobenen Frequenzen (Ω ± ωL )/2π emittiert, die zugehörigen Polarisationen sind beide zirkular, aber mit entgegengesetztem Umlaufsinn (s. Abb. 2 rechts).
Das Wasserstoffatom im homogenen Magnetfeld | 843
•
Abb. 2: Links: Die Zeeman-Komponenten der Resonanzlinie des Wasserstoffatoms bei Beobachtung in einer Richtung senkrecht zum B-Feld (ohne Elektronenspin). Wir erhalten eine nicht verschobe ne Frequenz ν, die parallel zu B polarisiert ist, und zwei um ±ω L /2π verschobene Komponenten, die senkrecht zu B polarisiert sind. Rechts: Bei Beobachtung in Richtung des B-Felds erhält man nur zwei Zeeman-Komponenten, die zirkular mit unterschiedlichem Umlaufsinn polarisiert und um ±ωL /2π verschoben sind.
Bemerkung: Das Atom emittiert also σ + -polarisierte Strahlung beim Übergang vom Zustand |ψ2,1,1 ⟩ nach |ψ1,0,0 ⟩, σ − -polarisierte beim Übergang von |ψ2,1,−1 ⟩ nach |ψ1,0,0 ⟩ und π-polarisierte beim Über gang von |ψ2,1,0 ⟩ nach |ψ1,0,0 ⟩. Die Gleichungen (46) liefern eine einfache Regel, um diese Pola risationen zu bestimmen: Betrachten wir die Operatoren D x + iD y , D x − iD y und D z ; die einzigen nichtverschwindenden Matrixelemente dieser Kombinationen zwischen den 2p- und 1s-Zustän den sind ⟨ψ2,1,1 D x + iD y ψ1,0,0 ⟩ ⟨ψ2,1,−1 D x − iD y ψ1,0,0 ⟩ ⟨ψ2,1,0 | D z | ψ1,0,0 ⟩ Zu den σ + -, σ − - und π-Polarisationen gehören daher die Operatoren D x + iD y , D x − iD y bzw. D z . Das ist eine allgemeine Regel: Emission elektrischer Dipolstrahlung tritt auf, wenn der Opera tor D ein nichtverschwindendes Matrixelement zwischen dem Anfangs- und Endzustand hat. Die Polarisation dieser Strahlung ist σ + , σ − oder π, je nachdem, ob das nichtverschwindende Matrix element⁶ das von D x + iD y , D x − iD y oder D z ist.
Referenzen und Literaturhinweise Paramagnetismus und Diamagnetismus: Feynman, Bd. 4 (7.2), Kap. 6 und 7; Cagnac und Pebay-Peyroula (11.2), Kap. VIII und IX; Kittel (13.2), Kap. 14; Slater (1.6), Kap. 14; Flügge (1.24), § 128 und § 160. Dipolstrahlung: Cagnac und Pebay-Peyroula (11.2), Anhang III; Panofsky und Phillips (7.6), § 14–7; Jackson (7.5), § 9–2. Drehimpuls und Auswahlregeln: Cagnac und Pebay-Peyroula (11.2), Kap. XI.
6 Die Reihenfolge der Zustände im Matrixelement darf nicht vertauscht werden, damit man nicht σ + und σ − verwechselt.
•
844 | Ergänzung EVII
Ergänzung EVII Einige Atomorbitale. Hybridorbitale 1 2 2-a 2-b 2-c 3 3-a 3-b 3-c 4 4-a 4-b 4-c 5 5-a 5-b 5-c
Einleitung | 844 Atomorbitale zu reellen Wellenfunktionen | 845 s-Orbital (l = 0) | 845 p-Orbital (l = 1) | 845 Andere Werte der Drehimpulsquantenzahl | 850 sp-Hybridisierung | 851 Einführung von sp-Hybridorbitalen | 851 Eigenschaften der Hybridorbitale | 851 Beispiel: Die Struktur von Acetylen | 853 sp 2 -Hybridisierung | 854 Einführung von sp 2 -Hybridorbitalen | 854 Eigenschaften der sp 2 -Hybridorbitale | 855 Beispiel: Die Struktur von Ethylen | 856 sp 3 -Hybridisierung | 857 Einführung von sp 3 -Hybridorbitalen | 857 Eigenschaften der sp 3 -Hybridorbitale | 858 Beispiel: Die Struktur von Methan | 858
1 Einleitung In § C von Kapitel VII haben wir eine Orthonormalbasis der stationären Zustände des Elektrons im Wasserstoffatom bestimmt. Die entsprechenden Wellenfunktionen sind ψ n,l,m (r) = R n,l (r)Y lm (θ, φ)
(1)
und die Quantenzahlen n, l, m gehören zur Energie E n = −EI /n2 , zum Quadrat des Drehimpulses l(l + 1)ℏ2 bzw. zur z-Komponente mℏ des Drehimpulses. Durch lineare Superposition von stationären Zuständen derselben Energie, d. h. mit derselben Quantenzahl n, können wir neue stationäre Zustände konstruieren, de nen nicht notwendig wieder wohldefinierte Werte von l und m zugeordnet werden können. In diesem Abschnitt wollen wir die Eigenschaften einiger dieser neuen statio nären Zustände, insbesondere die Winkelabhängigkeit der zugehörigen Wellenfunk tionen untersuchen. Die Wellenfunktionen (1) werden oft Atomorbitale genannt, und eine lineare Su perposition von Orbitalen mit gleichem n, aber unterschiedlichen l und m, heißt Hy bridorbital. Wie wir sehen werden, kann sich ein Hybridorbital in bestimmte Richtun gen des Raums weiter ausdehnen als die (reinen) Orbitale, aus denen es gebildet ist; diese Eigenschaft, die wichtig ist bei der Ausbildung chemischer Bindungen, motiviert die Einführung von Hybridorbitalen. Obwohl die in diesem Abschnitt durchgeführten Rechnungen in Strenge nur für das Wasserstoffatom gelten, werden wir auch die geometrische Struktur der verschie https://doi.org/10.1515/9783110638738-071
Einige Atomorbitale. Hybridorbitale
| 845
•
denen Bindungen, die von einem Atom mit mehreren Valenzelektronen gebildet wer den, qualitativ erklären können.
2 Atomorbitale zu reellen Wellenfunktionen Die Radialfunktion R n,l (r) in Ausdruck (1) ist reell, Y lm (θ, φ) jedoch außer für m = 0 eine komplexe Funktion von φ, da Y lm (θ, φ) = F lm (θ) eimφ
(2)
worin F lm (θ) eine reelle Funktion von θ ist. Atomorbitale sind also im Allgemeinen komplexe Funktionen. Indem man die Or bitale ψ n,l,m (r) und ψ n,l,−m (r) überlagert, kann man jedoch reelle Orbitale konstruie ren, deren Vorteil in ihrer einfachen Winkelabhängigkeit liegt; Letztere kann grafisch dargestellt werden, ohne dass man das Quadrat des Betrags der Wellenfunktion bil den muss (wie wir es in § C-4-b-α von Kapitel VII getan haben).
2-a s-Orbital (l = 0) Für l = m = 0 ist die Wellenfunktion ψ n,0,0 (r) reell, und wir sprechen von einem s-Orbital; wir wollen den zugehörigen stationären Zustand mit |ψ ns ⟩ bezeichnen. Um die Winkelabhängigkeit des ns-Orbitals darzustellen, legen wir r fest und tragen in jede Richtung mit den Polarwinkeln θ, φ die Länge von ψ ns (r, θ, φ) auf. Die mit der Variation von θ und φ erhaltene Oberfläche ist eine Kugel mit dem Zentrum im Koor dinatenursprung (Abb. 1).
Abb. 1: Ein s-Orbital ist kugelsymmetrisch: Die Wellenfunktion hängt weder von θ noch von φ ab.
2-b p-Orbital (l = 1) α p x , p y , p z -Orbitale Wenn wir die durch die Gleichungen (32) in Ergänzung AVI gegebenen Ausdrücke für die drei Kugelflächenfunktionen Y 1m (θ, φ) verwenden, erhalten wir für die drei zu l = 1
•
846 | Ergänzung EVII
gehörenden Atomorbitale ψ n,1,m (r) ψ n,1,1 (r) = −√ ψ n,1,0 (r) = √ ψ n,1,−1 (r) = √
3 R n,1 (r) sin θ eiφ 8π
(3a)
3 R n,1 (r) cos θ 4π
(3b)
3 R n,1 (r) sin θ e−iφ 8π
(3c)
Daraus bilden wir die drei linearen Überlagerungen ψ n,1,0 (r) 1 − [ψ n,1,1 (r) − ψ n,1,−1 (r)] √2 i [ψ n,1,1 (r) + ψ n,1,−1 (r)] √2
(4a) (4b) (4c)
Man sieht leicht, dass diese drei Wellenfunktionen auch in der Form √
3 z R n,1 (r) 4π r
(5a)
√
3 x R n,1 (r) 4π r
(5b)
√
3 y R n,1 (r) 4π r
(5c)
geschrieben werden können. Es handelt sich um reelle Funktionen von r, θ, φ, die wie die Funktionen ψ n,1,m (r) orthonomiert sind und eine Basis des Unterraums Hn,l=1 bilden; sie heißen p z -, p x - bzw. p y -Orbital, und wir wollen die Wellenfunktionen (5) mit ψ np z (r), ψ np x (r) und ψ np y (r) bezeichnen. Zwei unterschiedliche geometrische Darstellungen erlauben es, die Form eines Orbitals ψ(r, θ, φ) zu verdeutlichen. Zunächst sind wir an der Winkelabhängigkeit des Orbitals interessiert: Wir legen einen Wert von r fest und tragen in jeder durch die Po larwinkel θ und φ gegebenen Richtung eine Strecke mit der Länge |ψ(r, θ, φ)| auf. Die Winkelabhängigkeit des 2p z -Orbitals ist dann die von z/r = cos θ. Da φ zwischen 0 und 2π und θ zwischen 0 und π variiert, beschreibt das Ende der Strecke mit der Länge | cos θ|, die in Richtung der Polarwinkel θ und φ eingezeichnet wird, zwei rotations symmetrisch um die z-Achse angeordnete Kugelflächen, die am Ursprung tangential zur x, y-Ebene liegen und sich zu dieser spiegelsymmetrisch verhalten (Abb. 2a). Das in der Abbildung eingezeichnete Vorzeichen ist das der reellen Wellenfunktion. Eine andere mögliche Darstellung des Orbitals ψ(r, θ, φ) ergibt sich, wenn man sich eine Familie von Oberflächen ansieht, die jeweils zu einem gegebenen Wert von |ψ(r, θ, φ)| gehören (Oberflächen gleicher Wahrscheinlichkeitsdichte). Das ist in Abb. 2b für das
Einige Atomorbitale. Hybridorbitale |
(a)
847
•
(b)
Abb. 2: Zwei mögliche Darstellungen eines p z -Orbitals (l = 1, m = 0). a) Winkelabhängigkeit dieses Orbitals. Mit festem r tragen wir |ψ n,l=1,m=0 (r, θ, φ)| für jede Richtung θ, φ auf. Wir erhalten zwei Kugeloberflächen, die im Ursprung tangential an der x, y-Ebene liegen. Das ihnen jeweils zugeord nete Vorzeichen ist das Vorzeichen der (reellen) Wellenfunktion. b) Schnitte in der x, z-Ebene zeigen eine Familie von Oberflächen, von denen jede zu einem gegebenen Wert von |ψ n,l=1,m=0 (r, θ, φ)| gehört (wir haben Werte gleich dem 0.2-, 0.6- und 0.9-fachen des Maximalwerts von |φ| an den Punkten A und B gewählt). Diese Flächen liegen rotationssymmetrisch um die z-Achse. Das einge zeichnete Vorzeichen ist das der (reellen) Wellenfunktion. Anders als in Teil (a) hängt die Darstellung in Teil (b) vom Radialteil der Wellenfunktion ab (hier wurde der Zustand des Wasserstoffatoms zu n = 2 gewählt).
2p z -Orbital vorgeführt (wieder ist das eingezeichnete Vorzeichen das der reellen Wel lenfunktion). Im weiteren Verlauf dieses Abschnitts werden wir mal die eine und mal die andere Darstellung verwenden. Die p x - und p y -Orbitale erhält man aus dem p z -Orbital, indem man Rotationen um die y-Achse und die x-Achse mit den Winkeln +π/2 bzw. −π/2 ausführt (s. Abb. 3a und Abb. 3b, die eine zur Abb. 2a identische Darstellung verwenden). Anders als das s-Orbital, das kugelsymmetrisch ist, zeigen die p x -, p y - und p z -Orbitale in Richtung der x-, y- bzw. z-Achse. β p u -Orbital Die Wahl der x-, y- und z-Achsen erfolgt offensichtlich willkürlich. Durch lineare Su perposition der p x -, p y - und p z -Orbitale sollte sich daher ein Orbital p u konstruie ren lassen, das dieselbe Form hat, jedoch in Richtung einer beliebigen u-Achse orien tiert ist. Eine solche u-Achse sei gegeben, und sie schließe mit den x-, y-, z-Achsen die Winkel α, β bzw. γ ein. Offensichtlich gilt cos2 α + cos2 β + cos2 γ = 1
(6)
•
848 | Ergänzung EVII
Wir betrachten nun den Gl. (6) zufolge normierten Zustand cos α |np x ⟩ + cos β |np y ⟩ + cos γ |np z ⟩
(7)
Mit den Ausdrücken (5) können wir die zugehörige Wellenfunktion in der Form schrei ben √
3 3 x cos α + y cos β + z cos γ u R n,l (r) =√ R n,l (r) 4π r 4π r
(8)
worin u = x cos α + y cos β + z cos γ
(9)
die Projektion von r auf die u-Achse ist. Der Vergleich mit den Termen (5) zeigt, dass das auf diese Weise konstruierte Orbital tatsächlich ein p u -Orbital ist.
(a)
(b)
Abb. 3: a) Winkelabhängigkeit eines p x -Orbitals (in der Darstellung von Abb. 2a); b) Winkelabhängigkeit eines p y -Orbitals.
Daher kann jede reelle und normierte Linearkombination von p x -, p y - und p z -Orbita len, λψ np x (r) + μψ np y (r) + νψ np z (r)
(10)
als ein in u-Richtung orientiertes p u -Orbital betrachtet werden, wobei die u-Richtung definiert wird durch cos α = λ , cos β = μ , cos γ = ν
(11)
γ Beispiel: Struktur der H2 O- und H3 N-Moleküle In erster Näherung (s. Ergänzung AXIV ) kann man in einem Mehrelektronenatom je des Elektron so betrachten, als bewege es sich unabhängig von den anderen in einem
Einige Atomorbitale. Hybridorbitale
| 849
•
Zentralpotential Vc (r), das die Summe ist aus dem anziehenden elektrostatischen Po tential des Atomkerns und einem „mittleren Potential“ aufgrund der Abstoßung der anderen Elektronen. Jedes Elektron kann dann durch einen Zustand beschrieben wer den, der durch die drei Quantenzahlen n, l, m charakterisiert wird. Da sich das Poten tial Vc (r) nicht mehr wie 1/r verhält, hängt die Energie nicht mehr nur von n, sondern auch von l ab. Wir werden in Ergänzung AXIV sehen, dass sich die Energie des 2s-Zu stands gegenüber der des 2p-Zustands leicht verringert; auch der 3s-Zustand liegt tie fer als der 3p-Zustand, dieser wiederum tiefer als der 3d-Zustand usw.
Abb. 4: Schematische Struktur des Wassermole küls H2 O. Die 2p x - und 2p y -Orbitale ergeben Bin dungen unter einem Winkel von ungefähr 90∘ (der reale Winkel beträgt wegen der elektrostatischen Abstoßung der beiden Protonen 104∘ ).
Aus der Existenz des Spins und dem Pauli-Prinzip (worauf wir in den Kapiteln IX und XIV eingehen werden) folgt, dass die 1s-, 2s-, . . . Unterschalen jeweils nur zwei Elek tronen enthalten können; die 2p-, 3p-, . . . Unterschalen sechs Elektronen, . . . ; die nl-Unterschalen 2(2l + 1) Elektronen (der Faktor 2l + 1 stammt von der L z -Entartung und der Faktor 2 vom Elektronenspin). In einem Sauerstoffatom, das acht Elektronen enthält, sind also die 1s- und 2s-Unterschalen gefüllt und enthalten zusammen vier Elektronen. Die vier verblei benden Elektronen befinden sich in der 2p-Unterschale: Zwei von ihnen (mit entge gengesetztem Spin) können eins der drei 2p-Orbitale, z. B. das 2p z -Orbital, füllen; die anderen beiden verteilen sich dann auf die verbleibenden 2p x - und 2p y -Orbitale. Diese letzten beiden Elektronen sind die Valenzelektronen: Sie sind „ungepaart“, d. h. die Orbitale, in denen sie sich befinden, können ein weiteres Elektron aufnehmen. Die 2p x - und 2p y -Wellenfunktionen der Valenzelektronen des Sauerstoffs zeigen daher in zwei senkrecht aufeinander stehende Richtungen. Es kann nun gezeigt werden: Je größer die Überlappung der Wellenfunktionen der beiden an einer chemischen Bindung beteiligten Elektronen ist, desto stabiler ist diese Bindung. Die beiden Was serstoffatome, die sich zur Bildung eines Wassermoleküls mit dem Sauerstoffatom verbinden, müssen sich deshalb auf der x- bzw. der y-Achse befinden. Dann wird das kugelsymmetrische 1s-Orbital des Valenzelektrons der beiden Wasserstoffatome
•
850 | Ergänzung EVII
maximal mit den 2p x - und 2p y -Orbitalen der Valenzelektronen des Sauerstoffatoms überlappen. Abbildung 4 zeigt die Form der Wahrscheinlichkeitsverteilungen für die Valenzelektronen des Sauerstoffatoms und der Wasserstoffatome im Wassermolekül. Die verwendete grafische Darstellung ist analog zu der in Abb. 2b; wir haben für jedes Elektron die wie folgt definierte Fläche eingezeichnet: Die Wahrscheinlichkeitsdichte hat in allen Punkten der (Ober-)Fläche denselben Wert; er ist so gewählt, dass die gesamte innerhalb der Fläche eingeschlossene Wahrscheinlichkeit nahe bei eins liegt (z. B. bei 0.9). Die vorstehende Überlegung ermöglicht uns, die Form des H2 O-Moleküls zu ver stehen: Der Winkel zwischen den beiden OH-Bindungen sollte dicht bei 90∘ liegen. Der experimentell gefundene Winkel beträgt dagegen 104∘ . Die Differenz kommt teil weise durch die elektrostatische Abstoßung der beiden Protonen der Wasserstoffato me zustande und kann als Ergebnis einer leichten sp3 -Hybridisierung des 2p- und 2s-Orbitals verstanden werden (s. § 5). Eine ähnliche Überlegung erklärt die Pyramidenform des NH3 -Moleküls. Die drei Valenzelektronen des Stickstoffatoms besetzen die 2p x -, 2p y - und 2p z -Orbitale, die jeweils senkrecht zueinander orientiert sind. Wieder bewirkt die elektrostatische Ab stoßung der Protonen der drei Wasserstoffatome eine Vergrößerung des Bindungswin kels von 90∘ auf 108∘ (durch leichte Hybridisierung des 2p- und 2s-Orbitals).
2-c Andere Werte von l Bisher haben wir uns auf die Betrachtung der s- und p-Orbitale beschränkt; eine Or thonormalbasis von reellen Orbitalen kann jedoch für jeden Wert von l konstruiert werden. Wenn wir [s. Gl. (D-29) in Kap. VI)] die Beziehung ∗
[Y lm (θ, φ)] = (−1)m Y l−m (θ, φ)
(12)
beachten, so erkennen wir unmittelbar, dass (für m ≠ 0) die beiden komplexen Funk tionen ψ n,l,m (r) und ψ n,l,−m (r) durch die beiden Funktionen 1 [ψ n,l,m (r) + (−1)m ψ n,l,−m (r)] √2 i [ψ n,l,m (r) − (−1)m ψ n,l,−m (r)] √2
(13a) (13b)
ersetzt werden können, die reell und orthonormal zueinander sind. So können wir für l = 2 (d-Orbitale) fünf reelle Orbitale konstruieren, deren Win kelabhängigkeit gegeben wird durch √ 1 (3 cos2 θ − 1) , 2
√6 sin θ cos θ cos φ ,
√ 3 sin2 θ cos 2φ , 2
√ 3 sin2 θ sin 2φ 2
√6 sin θ cos θ sin φ ,
Einige Atomorbitale. Hybridorbitale
| 851
•
(d3z2 −r2 -, d zx -, d zy -, d x2 −y2 -, d xy -Orbitale). Ihre Form ist etwas komplizierter als die der s- und p-Orbitale, und wir wollen uns auf Letztere beschränken; es ist jedoch möglich, auch im komplizierteren Fall in analoger Weise wie im Folgenden vorzugehen.
3 sp-Hybridisierung 3-a Einführung von sp-Hybridorbitalen Wir kehren zum Wasserstoffatom zurück und betrachten den Unterraum Hns ⊕ Hnp , der durch die vier reellen Orbitale ψ ns (r), ψ np x (r), ψ np y (r) und ψ np z (r) (die für das Wasserstoffatom alle zur selben Energie gehören) aufgespannt wird. Wie wir nun zei gen werden, können wir durch lineare Überlagerung der ns- und np-Orbitale andere reelle Orbitale konstruieren, die eine Orthonormalbasis in Hns ⊕ Hnp bilden und die einige interessante Eigenschaften aufweisen. Wir beginnen mit einer linearen Überlagerung der Orbitale ψ ns (r) und ψ np z (r) al lein, also ohne ψ np x (r) und ψ np y (r) zu benutzen. Wir ersetzen die beiden Funktionen ψ ns (r) und ψ np z (r) durch die zwei orthonormalen Linearkombinationen cos α ψ ns (r) + sin α ψ np z (r)
(14a)
sin α ψ ns (r) − cos α ψ np z (r)
(14b)
Außerdem verlangen wir, dass die beiden Orbitale (14a) und (14b) dieselbe geo metrische Form haben. Da diese nur von den relativen Anteilen der s- und p-Orbitale in der Linearkombination abhängt, ist klar, dass dies für sin α = cos α erfüllt ist, d. h. für α = π/4. Die zwei neu eingeführten Orbitale sind daher von der Form 1 ψ n,s,p z (r) = (15a) [ψ ns (r) + ψ np z (r)] √2 1 (15b) [ψ ns (r) − ψ np z (r)] ψn,s,p z (r) = √2 und wir sprechen hier von der sp-Hybridisierung. Wir haben also eine neue Orthonor malbasis von Hns ⊕ Hnp konstruiert, bestehend aus ψ n,s,p z (r), ψn,s,p z (r), ψ np x (r) und ψ np y (r).
3-b Eigenschaften der sp-Hybridorbitale Um die Winkelabhängigkeit der ψ n,s,p z (r)- und ψn,s,p z (r)-Hybridorbitale zu untersu chen, wählen wir einen festen Wert von r, r0 , und setzen λ=√
1 R n,0 (r0 ) 4π
3 R n,1 (r0 ) μ=√ 4π
(16)
•
852 | Ergänzung EVII
So erhalten wir mit den Ausdrücken (5) und (15) die Winkelfunktionen 1 (λ + μ cos θ) √2 1 (λ − μ cos θ) √2
(17)
die wir mit derselben Methode wie in § 2 (s. Abb. 2a) darstellen: Wir tragen in je de Richtung der Polarwinkel θ und φ eine Strecke der Länge √1 |λ + μ cos θ| oder 2
|λ − μ cos θ| auf und zeigen durch ein Minus- oder Pluszeichen an, ob die Wellen funktion negativ oder positiv ist. Abbildung 5 zeigt die Schnitte in der x, z-Ebene der so erhaltenen Oberflächen, die in Bezug auf die z-Achse zylindersymmetrisch sind (wir haben μ > λ > 0 angenommen). Das ψ n,s,p z (r)-Orbital kann durch Spiegelung am Ursprung O in das ψn,s,p z (r)-Orbital überführt werden. Wie man sieht, weist das ψ n,s,p z (r)-Orbital in Bezug auf den Ursprung keine einfache Symmetrie auf; diese Asymmetrie tritt auf, weil die ψ np z (r)- und ψ ns (r)-Orbitale, aus denen es gebildet ist (und die in Abb. 5c abgebildet sind), entgegengesetzte Parität haben. In der Region z > 0 haben ψ np z (r) und ψ ns (r) gleiche Vorzeichen und addieren sich, während sie für z < 0 ungleiche Vorzeichen haben und sich somit voneinander subtrahieren. Für ψn,s,p z (r) kehren sich die Argumente um. Die ψ n,s,p z (r)-Orbitale dehnen sich daher in die positive Richtung der z-Achse wei ter aus als in die negative Richtung, da für festes r die Werte, die es annehmen kann, für θ = 0 (absolut betrachtet) größer sind als für θ = π. Allgemein sind für große r, λ und μ die Werte des ψ n,s,p z (r)-Orbitals in positiver z-Richtung größer als die jeweils von den ψ ns (r)- und ψ np z (r)-Orbitalen angenommenen Werte (dasselbe gilt für das ψn,s,p z (r)-Orbital in negativer z-Richtung). 1 √2
(a)
(b)
(c)
Abb. 5: Winkelabhängigkeit der ψ n,s,pz (r)-Hybridorbitale (a) und der ψ n,s,pz (r)-Hybridorbitale (b), die aus den ψ ns (r)- und ψ npz (r)-Orbitalen mit entgegengesetzter Parität hervorgehen (c). Ein Hybrid orbital kann sich in bestimmte Raumrichtungen weiter ausdehnen als die reinen Orbitale, aus denen es gebildet wird.
Einige Atomorbitale. Hybridorbitale | 853
•
Diese Eigenschaft spielt bei der Untersuchung chemischer Bindungen eine wich tige Rolle. Um sie qualitativ zu verstehen, nehmen wir an, in einem Atom A sei eines der Valenzelektronen entweder im ns-Orbital oder in einem np-Orbital. Dann neh men wir an, in der Nachbarschaft des Atoms befinde sich ein anderes Atom B, und wir nennen die Verbindungsachse zwischen beiden die z-Achse. Das ψ n,s,p z (r)-Orbital von A wird dann mehr mit den Orbitalen der Valenzelektronen von B überlappen als die ψ ns (r)- oder ψ np z (r)-Orbitale. So sehen wir, dass die Hybridisierung der Orbitale von A zu einer größeren Stabilität der chemischen Bindung führt, da diese Stabilität, wie wir bereits ausgeführt haben, mit der Größe der Überlappung der an der Bindung beteiligten Elektronenorbitale von A und B wächst.
3-c Beispiel: Die Struktur von Acetylen Das Kohlenstoffatom besitzt sechs Elektronen. Wenn das Atom frei ist, befinden sich zwei davon in der 1s-Unterschale, zwei in der 2s-Unterschale und zwei in der 2p-Unter schale. Nur die letzten beiden sind ungepaart, und Kohlenstoff sollte daher zweiwertig sein; das wird auch tatsächlich in einigen seiner Verbindungen beobachtet. Üblicher weise liegt Kohlenstoff jedoch in vierwertiger Form vor. Denn wenn das Kohlenstoff atom an andere Atome gebunden ist, so kann eines der 2s-Elektronen seine Unterscha le verlassen und in das dritte 2p-Orbital wechseln, das im freien Kohlenstoffatom nicht besetzt ist. Es entstehen so vier ungepaarte Elektronen, deren Wellenfunktionen das Ergebnis einer Hybridisierung der vier Orbitale 2s, 2p x , 2p y und 2p z sind. Im Acetylenmolekül C2 H2 sind daher die vier Valenzelektronen jedes Kohlen stoffatoms wie folgt verteilt: Zwei Elektronen befinden sich in den gerade eingeführ ten ψ2,s,p z (r)- und ψ2,s,p z (r)-Hybridorbitalen und die anderen beiden in den in § 2-b behandelten ψ2p x (r)- und ψ2p y (r)-Orbitalen. Nach Abb. 5a und 5b bilden die beiden Elektronen jedes Kohlenstoffatoms, die die ψ2,s,p z (r)- und ψ2,s,p z (r)-Hybridorbitale besetzen, Bindungen unter einem Winkel von 180∘ zueinander aus: die erste mit dem anderen Kohlenstoffatom, und die zweite mit einem der beiden Wasserstoffatome (deren Valenzelektronen 1s-Orbitale besetzen). So verstehen wir die lineare Struktur des C2 H2 -Moleküls (s. Abb. 6, in der wir dieselbe Art der grafischen Darstellung wie in Abb. 4 verwenden). Für die beiden 2p x -Orbitale in jedem Kohlenstoffatom stellt sich eine seitliche Überlappung ein, genau wie bei den beiden 2p y -Orbitalen, wie in Abb. 6 durch die durchgezogenen Linien angedeutet ist. Sie tragen zu einer Verstärkung der chemi schen Stabilität des Moleküls bei. Die beiden Kohlenstoffatome bilden also eine Dreifachbindung zwischen sich aus. Eine Bindung wird durch die ψ2,s,p z (r)- und ψ2,s,p z (r)-Hybridorbitale erzeugt, die sich jeweils an einem der beiden Atome befin den und die in Bezug auf die z-Achse zylindersymmetrisch sind (σ-Bindung). Die zwei weiteren Bindungen kommen aufgrund der ψ2p x (r)- und ψ2p y (r)-Orbitale zustande, die symmetrisch sind in Bezug auf die x, z- und y, z-Ebenen (π-Bindung).
•
854 | Ergänzung EVII
Bemerkung: Wir haben bereits darauf hingewiesen, dass die 2p-Unterschale in einem Mehrelektronenatom eine höhere Energie als die 2s-Unterschale hat. Der Wechsel eines Elektrons aus der 2s-Unter schale in die 2p-Unterschale ist deshalb energetisch nicht ohne Weiteres möglich. Die für diese Anregung benötigte Energie wird jedoch durch die Erhöhung der Stabilität aufgrund der an den C–H- und C–C-Bindungen beteiligten Hybridorbitalen kompensiert.
Abb. 6: Schematische Struktur des Acetylenmole küls C2 H2 . Für jedes Kohlenstoffatom befinden sich zwei Elektronen in den sp z -Hybridorbitalen (s. Abb. 5) und tragen zu der C–H- und C–C-Bindung bei (σ-Bin dungen). Außerdem befinden sich zwei Elektronen in den p x - und p y -Orbitalen und bilden zusätzliche Bindungen zwischen den beiden Kohlenstoffatomen aus (π-Bindungen, schwächer als σ-Bindungen), in der Abbildung durch vertikale Linien dargestellt. Die C–C-Bindung ist daher eine Dreifachbindung.
4 sp2 -Hybridisierung 4-a Einführung von sp2 -Hybridorbitalen Wir kehren zurück zu den vier Orbitalen ψ ns (r), ψ np x (r), ψ np y (r), ψ np z (r) und ersetzen die ersten drei durch die folgenden reellen Kombinationen: ψ n,s,p x ,p y (r) = aψ ns (r) + bψ np x (r) + cψ np y (r)
(18a)
ψn,s,p x ,p y (r)
(18b)
= a ψ ns (r) + b ψ np x (r) + c ψ np y (r)
ψn,s,p x ,p y (r) = a ψ ns (r) + b ψ np x (r) + c ψ np y (r)
(18c)
Wir verlangen, dass die drei Wellenfunktionen (18) äquivalent sind, d. h. durch Rotationen um die z-Achse ineinander überführt werden können. Der Anteil der
Einige Atomorbitale. Hybridorbitale
| 855
•
ψ ns (r)-Orbitale muss daher in allen Funktionen gleich sein: a = a = a
(19)
Es ist immer möglich, die Achsen so zu legen, dass das erste Orbital (18a) symmetrisch in Bezug auf die x, z-Ebene ist; wir können also c=0
(20)
wählen. Indem wir verlangen, dass die drei Orbitale (18) normiert und orthogo nal sind, erhalten wir sechs Beziehungen, mit denen wir die sechs Koeffizienten a, b, b , b , c , c bestimmen¹ können. Eine einfache Rechnung ergibt 2 1 ψ ns (r) + √ ψ np x (r) 3 √3 1 1 ψn,s,p x ,p y (r) = ψ ns (r) − ψ np x (r) + √3 √6 1 1 ψ ns (r) − ψ np x (r) − ψn,s,p x ,p y (r) = √3 √6 ψ n,s,p x ,p y (r) =
(21a) 1 ψ np y (r) √2 1 ψ np y (r) √2
(21b) (21c)
Das ist die sogenannte „sp2 -Hybridisierung“. Die drei Hybridorbitale (21) und das ψ np z (r)-Orbital bilden eine neue Orthonormalbasis des Raums Hns ⊕ Hnp .
4-b Eigenschaften der sp2 -Hybridorbitale Wir werden dieselbe grafische Darstellung wie in Abb. 5 benutzen. Das ψ n,s,p x ,p y (r)-Orbital ist zylindrisch symmetrisch um die x-Achse. Abbildung 7a zeigt den Schnitt in der x, y-Ebene durch die Fläche, die die Winkelabhängigkeit für festes r wiedergibt. Die Form der erhaltenen Kurve ist völlig analog zu der in Abb. 5a: Das Orbital zeigt in die positive x-Richtung. Indem wir die Gl. (4b) für ψ np x (r) verwenden, können wir leicht die Wirkung des Operators, der eine Drehung um den Winkel α um die z-Achse ausführt, e−iαL z /ℏ , auf |ψ np x ⟩ erhalten: e−iαL z /ℏ |ψ np x ⟩ = cos α|ψ np x ⟩ + sin α|ψ np y ⟩
(22)
Ebenso gilt offensichtlich e−iαL z /ℏ |ψ ns ⟩ = |ψ ns ⟩
(23)
Mit den Gleichungen (21) folgt dann |ψn,s,p x ,p y ⟩ = e−2iπL z /3ℏ |ψ n,s,p x ,p y ⟩
(24a)
|ψn,s,p x ,p y ⟩ = e2iπL z /3ℏ |ψ n,s,p x ,p y ⟩
(24b)
1 Die Vorzeichen von a, b und c können beliebig gewählt werden.
•
856 | Ergänzung EVII
Die beiden durch (21b) und (21c) gegebenen Orbitale können daher durch eine Rotati on mit den Winkeln 2π/3 und −2π/3 um die z-Achse aus dem ersten erhalten werden. In Abb. 7b und Abb. 7c sind die Schnitte in der x, y-Ebene dargestellt, die ihre Winkel abhängigkeit darstellen.
(a)
(b)
(c)
Abb. 7: Winkelabhängigkeit der drei orthogonalen sp 2 -Orbitale. Die ψ n,s,px ,py (r)-, ψ n,s,px ,py (r)∘ und ψ n,s,p x ,p y (r)-Orbitale können durch Rotationen um 120 um die z-Achse ineinander überführt werden.
4-c Beispiel: Die Struktur von Ethylen Wie im Acetylenmolekül haben auch die beiden Kohlenstoffatome des Ethylenmole küls C2 H4 jeweils vier Valenzelektronen (ein Elektron in der 2s-Unterschale und drei in der 2p-Unterschale). Drei dieser vier Elektronen besetzen sp2 -Hybridorbitale vom gerade besproche nen Typ; es sind diejenigen, die für jedes Kohlenstoffatom die Bindungen mit dem benachbarten Kohlenstoffatom und den zwei Wasserstoffatomen einer CH2 -Gruppe ausbilden. Auf diese Weise sehen wir, warum die drei Bindungen C–C, C–H, C–H ei nes Kohlenstoffatoms in einer Ebene liegen und zueinander Winkel von 120∘ bilden (s. Abb. 8, in der wir die grafische Darstellung von Abb. 4 und 6 verwenden). Das ver bleibende Elektron der Kohlenstoffatome besetzt das 2p z -Orbital. Die 2p z -Orbitale der beiden Kohlenstoffatome überlappen sich teilweise seitlich, was durch die durchge zogenen Linien in Abb. 8 angedeutet wird. Die beiden Kohlenstoffatome des Ethylenmoleküls sind daher durch eine Dop pelbindung miteinander verbunden: Eine Bindung wird entlang der Verbindungslinie der beiden Kohlenstoffatome durch die beiden sp2 -Hybridorbitale, die zylindersym metrisch um die x-Achse liegen (σ-Bindung), und eine Bindung aufgrund der bei den 2p z -Orbitale symmetrisch zur x, z-Ebene (π-Bindung) gebildet. Letztere verhin dert eine Verdrehung einer CH2 -Gruppe in Bezug auf die andere; würde man eine
Einige Atomorbitale. Hybridorbitale |
857
•
CH2 -Gruppe um die Verbindungsachse der beiden Kohlenstoffatome drehen, wären die Achsen der beiden Orbitale 2p z und 2p z nicht mehr parallel zueinander (Abb. 8). Es würde ihre gegenseitige seitliche Überlappung verringert und damit auch die Sta bilität des Systems. So wird klar, warum die sechs Atome des Moleküls in einer Ebene liegen.
Abb. 8: Schematische Struktur des Ethylenmoleküls C2 H4 . Die beiden Kohlenstoffatome bilden eine Doppelbindung zueinander aus: eine σ-Bindung von der Art wie in Abb. 7 (die anderen beiden sp 2 -Hybridorbitale unter einem Winkel von 120∘ bilden die C–H-Bindungen), und eine π-Bindung aufgrund der Überlappung der p z -Orbitale.
5 sp3 -Hybridisierung 5-a Einführung von sp3 -Hybridorbitalen Wir werden jetzt die vier Orbitale ψ ns (r), ψ np x (r), ψ np y (r), ψ np z (r) überlagern, um die folgenden vier Hybridorbitale zu erhalten: ψ n,s,p x ,p y ,p z (r) = aψ ns (r) + bψ np x (r) + cψ np y (r) + dψ np z (r)
(25a)
ψn,s,p x ,p y ,p z (r)
(25b)
= a ψ ns (r) + b ψ np x (r) + c ψ np y (r) + d ψ np z (r)
ψn,s,p x ,p y ,p z (r) = a ψ ns (r) + b ψ np x (r) + c ψ np y (r) + d ψ np z (r)
(25c)
ψ n,s,p x ,p y ,p z (r) = a ψ ns (r) + b ψ np x (r) + c ψ np y (r) + d ψ np z (r)
(25d)
Wir verlangen wieder, dass die vier Orbitale dieselbe geometrische Form haben. Das bedeutet a = a = a = a
(26)
Die Symmetrieachse eines Orbitals kann beliebig gewählt werden, ebenso wie die La ge der Fläche, die diese Achse und die Symmetrieachse eines zweiten Orbitals enthält. Dadurch wird die Anzahl der freien Parameter auf 10 reduziert; wir können sie festle gen, indem wir die vier Orbitale (25) orthonormiert wählen.
•
858 | Ergänzung EVII
Wir begnügen uns an dieser Stelle damit, einen möglichen Satz solcher Hybridor bitale anzugeben: a=b=c=d=
1 2
a = −b = −c = d =
1 2
a = −b = c = −d =
(27)
1 2
a = b = −c = −d =
1 2
von dem sofort gezeigt werden kann, dass er orthonormal und von der verlangten geo metrischen Form ist. Alle anderen möglichen Sätze können aus diesem durch Rotatio nen erhalten werden. Auf diese Weise haben wir die sogenannte sp3 -Hybridisierung durchgeführt. Die vier Orbitale (25) mit den Koeffizienten (27) bilden eine neue Orthonormalbasis im Raum Hns ⊕ Hnp .
5-b Eigenschaften der sp3 -Hybridorbitale Die vier in § 5-a konstruierten Orbitale sind in der Form analog zu den in § 3 und § 4 betrachteten Orbitalen. Sie zeigen in Richtung der Vektoren mit den folgenden Kom ponenten: (1, 1, 1) (−1, −1, −1) (−1, 1, −1)
(28)
(1, −1, −1) Die Achsen der vier sp3 -Orbitale sind daher wie die Verbindungslinien vom Mittel punkt zu den vier Eckpunkten eines regelmäßigen Tetraeders angeordnet; der Winkel zwischen zwei Achsen beträgt 109∘ 28 .
5-c Beispiel: Die Struktur von Methan Im Methanmolekül CH4 besetzen die vier Valenzelektronen des Kohlenstoffatoms je eins der vier oben untersuchten sp3 -Hybridorbitale. Das erklärt sofort, warum die vier Wasserstoffatome die Ecken eines regelmäßigen Tetraeders mit dem Kohlenstoffatom im Zentrum bilden (Abb. 9). Im Ethanmolekül C2 H6 ist ein Wasserstoffatom des Methans durch eine CH3 -Grup pe ersetzt. Die beiden Kohlenstoffatome sind dann durch eine Einfachbindung von
Einige Atomorbitale. Hybridorbitale
| 859
•
zwei sp3 -Hybridorbitalen verknüpft, die zylindersymmetrisch zur Verbindungslinie der Kohlenstoffatome ist. Die Abwesenheit einer zweiten Bindung erlaubt die freie Ro tation einer CH3 -Gruppe in Bezug auf die andere.
Abb. 9: Schematische Struktur des Methanmoleküls. Die sp 3 -Orbitale erzeugen Bindungen, die wie die Verbin dungslinien des Zentrums eines Tetraeders zu den vier Eckpunkten angeordnet sind (Winkel von 109∘ 28 ).
Referenzen und Literaturhinweise Verschiedene geometrische Darstellungen von Orbitalen: Levine (12.3), § 6.6; Karplus und Porter (12.1), § 3.10. Hybridorbitale: Karplus und Porter (12.1), § 6.3; Alonso und Finn III (1.4), § 5–5; Eyring et al. (12.5), Kap. XII, § 12b; Coulson (12.6), Kap. VIII; Pauling (12.2), Kap. III, § 13 und § 14.
•
860 | Ergänzung FVII
Ergänzung FVII Vibrations- und Rotationsniveaus zweiatomiger Moleküle 1 2 2-a 2-b 2-c 3 3-a 3-b 3-c
Einleitung | 860 Näherungslösung der Radialgleichung | 861 Die Zustände mit dem Drehimpuls null (l = 0) | 862 Allgemeiner Fall (l beliebige ganze Zahl) | 863 Das Vibrations-Rotations-Spektrum | 865 Berechnung einiger Korrekturen | 867 Genauere Untersuchung der Form des effektiven Potentials V eff (r) | 868 Energieniveaus und Wellenfunktionen der stationären Zustände | 870 Interpretation der verschiedenen Korrekturen | 870
1 Einleitung In dieser Ergänzung wollen wir die Ergebnisse von Kapitel VII verwenden, um die sta tionären Zustände eines aus den zwei Kernen eines zweiatomigen Moleküls bestehen den Systems quantenmechanisch zu untersuchen. Dabei werden wir alle Freiheits grade dieses Systems gleichzeitig berücksichtigen: einerseits die Schwingungen der beiden Atomkerne um ihre Gleichgewichtslage und andererseits die Rotation des Ge samtsystems um seinen Massenmittelpunkt. Wir werden zeigen, dass die Ergebnisse der Ergänzungen AV und CVI , die für nur einen Freiheitsgrad erhalten wurden, in ers ter Näherung auch hier ihre Gültigkeit behalten. Zusätzlich werden wir eine Reihe von Korrekturen, die sich aus der „zentrifugalen Verzerrung“ des Moleküls und der Kopp lung von Vibration und Rotation ergeben, berechnen und interpretieren. Wir sahen in § 1-a von Ergänzung AV (Born-Oppenheimer-Näherung), dass die po tentielle Energie V(r) der Wechselwirkung zwischen den beiden Atomkernen nur von ihrem gegenseitigen Abstand r abhängt und die in Abb. 1 gezeigte Form hat: Das Po tential V(r) wirkt bei großen Abständen anziehend, bei kleinen Abständen abstoßend und hat bei r = re ein Minimum der Tiefe V0 . Wir bezeichnen nun mit m1 und m2 die Massen der beiden Atomkerne. Da das Wechselwirkungspotential V(r) dieser beiden Teilchen nur von r abhängt, können wir nach § B von Kapitel VII die Bewegung des Massenmittelpunkts (die derjenigen eines freien Teilchens der Masse M = m1 + m2 entspricht) und die relative Bewegung der Teilchen im Ruhesytem des Massenmittel punkts getrennt voneinander betrachten. Die Relativbewegung ist äquivalent zur Be wegung eines fiktiven Teilchens der Masse m1 m2 μ= (1) m1 + m2 das sich in einem Potential V(r) wie in Abb. 1 befindet. Wenn wir uns nur für diese Relativbewegung interessieren, werden die stationä ren Zustände des Systems nach § A von Kapitel VII durch die Wellenfunktionen 1 ψ v,l,m (r, θ, φ) = u v,l (r)Y lm (θ, φ) (2) r https://doi.org/10.1515/9783110638738-072
Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 861
•
Abb. 1: Wechselwirkungsenergie V(r) zwischen den Atomkernen eines zweiatomigen Moleküls in Abhängigkeit vom Abstand r; V(r) nimmt seinen minimalen Wert −V 0 bei r = re an. Die ersten Vibrationszustände werden durch die horizontalen Linien in der Potentialmulde dargestellt.
beschrieben, wobei die entsprechenden Energien E v,l und die Radialfunktionen u v,l (r) durch die Gleichung [−
l(l + 1)ℏ2 ℏ2 d2 + V(r) + ] u v,l (r) = E v,l u v,l (r) 2 2μ dr 2μr2
(3)
gegeben werden. Bemerkung: Streng genommen gehen wir in diesem ganzen Abschnitt (wie in den Ergänzungen AV und CVI ) da von aus, dass die Projektion des Gesamtbahndrehimpulses der Elektronen auf die Verbindungs achse der beiden Atomkerne gleich null ist, ebenso wie ihr Gesamtspin. Der Gesamtdrehimpuls des Moleküls stammt dann nur von der Rotation der Atomkerne. Diese Bedingung ist bei nahezu allen zweiatomigen Molekülen im Grundzustand erfüllt. Im allgemeinen Fall treten auch Terme in der Wechselwirkungsenergie der Atomkerne auf, die nicht nur vom Abstand r abhängen.
2 Näherungslösung der Radialgleichung Die Radialgleichung ist von derselben Form wie die Eigenwertgleichung des HamiltonOperators eines eindimensionalen Problems, bei dem sich ein Teilchen der Masse μ unter dem Einfluss des effektiven Potentials Veff (r) = V(r) + befindet.
l(l + 1)ℏ2 2μr2
(4)
•
862 | Ergänzung FVII
2-a Die Zustände mit dem Drehimpuls null (l = 0) Für l = 0 ist das „Zentrifugalpotential“ l(l + 1)ℏ2 /2μr2 gleich null und Veff (r) gleich V(r). In der Nähe des Minimums bei r = re kann V(r) in Potenzen von r − re entwickelt werden, V(r) = −V0 + f(r − re )2 − g(r − re )3 + . . .
(5)
f und g sind positiv, da r = re ein Minimum ist und die potentielle Energie für r < re schneller wächst als für r > re . Zunächst vernachlässigen wir den (r−re )3 -Term und Terme höherer Ordnung. Das Potential ist dann rein parabolisch und wir kennen die Eigenzustände und Eigenwerte des Hamilton-Operators. Wenn wir ω=√
2f μ
(6)
setzen, erhalten wir Niveaus mit der Energie 1 E v,0 = −V0 + (v + ) ℏω (v = 0, 1, 2, . . .) 2 und den zugehörigen Wellenfunktionen (s. Kapitel V und Ergänzung BV ) u v (r) = (
β2 ) π
1/4
1 √2v v!
e−β
2
(r−r e )2 /2
H v [β(r − re )]
(7)
(8)
wobei μω (9) ℏ ist (H v ist ein hermitesches Polynom). In Abb. 1 haben wir die ersten beiden Energie niveaus durch horizontale Linien dargestellt. Die Länge dieser Linien ist ein Maß für die Ausdehnung (∆r)v der zu diesen Zuständen gehörenden Wellenfunktionen; wir erinnern uns [Kap. V, Gl. (D-5a)]: β=√
(∆r)v ≈ √(v +
1 ℏ ) 2 μω
(10)
Für die Richtigkeit der vorliegenden Rechnung ist notwendig, dass in einer Um gebung der Breite (∆r)v um r = re der (r − re )3 -Term in Gl. (5) im Vergleich zum (r − re )2 -Term immer vernachlässigbar ist; es muss daher gelten 1 2 worin (∆r)0 die Ausdehnung des Grundzustands ist: f ≫ g(∆r)v = g(∆r)0 √v +
(∆r)0 = √
ℏ μω
(11)
(12)
Daraus folgt insbesondere f ≫ g(∆r)0
(13)
Vibrations- und Rotationsniveaus zweiatomiger Moleküle |
863
•
Die Bedingung (13) ist in der Praxis immer erfüllt. Wir wollen uns im Folgenden auf Quantenzahlen v beschränken, die klein genug sind, damit auch (11) erfüllt ist. Bemerkung: Die Entwicklung (5) gilt offensichtlich nicht für r = 0, wo V(r) unendlich wird. Die durchgeführte Beweisführung setzt (∆r)v ≪ r e
(14)
voraus. Für diesen Fall sind die Wellenfunktionen (8) im Ursprung praktisch gleich null und ent sprechen fast den exakten Lösungen der Radialgleichung (3), die bei r = 0 exakt verschwinden müssen (s. Kap. VII, § A-2-c).
2-b Allgemeiner Fall (l beliebige ganze Zahl) α Einfluss des Zentrifugalpotentials An der Stelle r = re ist das Zentrifugalpotential l(l + 1)ℏ2 = Bh l(l + 1) 2μr2e
(15)
worin B=
ℏ 4πμr2e
(16)
die in Ergänzung CVI eingeführte Rotationskonstante ist; in § 4-a-β dieser Ergänzung haben wir bereits dargelegt, dass die Energie 2Bh (der Abstand zwischen zwei be nachbarten Linien im reinen Rotationsspektrum) immer sehr viel kleiner ist als ℏω (das Vibrationsquant): 2Bh ≪ ℏω
(17)
Wir beschränken uns hier auf Rotationsquantenzahlen l, die klein genug bleiben, um die folgende Abschätzung zu erfüllen: Bh l(l + 1) ≪ ℏω
(18)
In einer Umgebung schmaler Breite ∆r um r = re ist die Änderung des Zentrifu galpotentials von der Größe l(l + 1)ℏ2 μr3e
∆r = 2Bh l(l + 1)
∆r re
(19)
Die Änderung des Potentials V(r) beträgt ungefähr f(∆r)2 =
1 2 1 (∆r)2 μω (∆r)2 = ℏω 2 2 (∆r)20
(20)
•
864 | Ergänzung FVII
wobei wir Gl. (12) benutzt haben. Wie wir aus dem vorhergehenden Abschnitt wissen, ist die Ausdehnung ∆r der Wellenfunktionen klein gegen re , aber natürlich mindes tens von der Größenordnung (∆r)0 . Daher ist in den Gebieten mit bedeutenden Am plituden der Wellenfunktionen die Änderung des Zentrifugalpotentials (19) nach Un gleichung (18) sehr viel kleiner als die in Gl. (20) angegebene Änderung von V(r). Wir können dann in erster Näherung das Zentrifugalpotential in Gl. (4) durch den Wert (15) bei r = re ersetzen, so dass sich für das effektive Potential ergibt Veff (r) ≈ V(r) + Bh l(l + 1)
(21)
β Energieniveaus und stationäre Wellenfunktionen Wenn wir Gl. (21) verwenden und Terme höherer als zweiter Ordnung in der Entwick lung (5) vernachlässigen, können wir die Radialgleichung (3) in der Form [−
ℏ2 d 2 1 2 + μω (r − re )2 ] u v,l (r) = [E v,l + V0 − Bhl(l + 1)] u v,l (r) 2μ dr2 2
(22)
schreiben, die völlig analog zur Eigenwertgleichung des eindimensionalen harmoni schen Oszillators ist. Daraus schließen wir sofort, dass der Term in Klammern auf der rechten Seite gleich (v + 1/2)ℏω sein muss, mit v = 0, 1, 2, . . .; daraus ergeben sich die möglichen Energieniveaus E v,l des Moleküls: E v,l = −V0 + (v +
1 ) ℏω + Bh l(l + 1) 2
(23)
mit v = 0, 1, 2, . . . und l = 0, 1, 2, . . . Wie die Radialfunktionen hängen sie nicht von l ab, da der Differentialoperator auf der rechten Seite von Gl. (22) nicht von l abhängt. Wir haben also u v,l (r) = u v (r)
(24)
wobei u v (r) durch Gl. (8) gegeben wird. Die Wellenfunktionen der stationären Zustän de (2) lauten dann in dieser Näherung ψ v,l,m (r, θ, φ) =
1 u v (r)Y lm (θ, φ) r
(25)
Wir sehen also, dass die Energien der stationären Zustände die Summen der in den Ergänzungen AV und CVI berechneten Energien sind, bei denen jeweils nur ein Freiheitsgrad (Vibration oder Rotation) berücksichtigt wurde. Außerdem sind die Wel lenfunktionen bis auf einen Faktor 1/r die Produkte der in diesen beiden Ergänzungen gefundenen Wellenfunktionen. In Abb. 2 sind die ersten beiden Rotationsniveaus v = 0 und v = 1 mit ihrer Rota tionsstruktur aufgrund des Terms Bh l(l + 1) dargestellt.
Vibrations- und Rotationsniveaus zweiatomiger Moleküle |
865
•
Abb. 2: Die Abbildung stellt die beiden ersten Vibrationsniveaus (v = 0 und v = 1) eines zweiato migen Moleküls mit deren Rotationsstruktur (l = 0, 1, . . .) dar. Innerhalb der Näherung ist diese Rotationsstruktur für die verschiedenen Vibrationsniveaus gleich. Für ein heteropolares Molekül er geben die durch vertikale Pfeile angegebenen Übergänge die Linien des Vibrations-Rotations-Spek trums des Moleküls. Diese Linien liegen im Infrarotbereich. Die Übergänge erfüllen die Auswahlregel ∆l = l − l = ±1.
2-c Das Vibrations-Rotations-Spektrum Wir beschränken uns auf die Untersuchung des infraroten Absorptions- oder Emissi onsspektrums und gehen von heteropolaren Molekülen aus (wir könnten Rechnungen analog zu denen in den Ergänzungen AV , § 1-c-β und CVI , § 4-b durchführen, wenn wir homöopolare Moleküle und den Raman-Effekt betrachten würden). α Auswahlregeln Wir erinnern uns, dass das Dipolmoment D(r) des Moleküls die Richtung der Verbin dungsachse der beiden Atomkerne hat und um re in Potenzen von r − re entwickelt werden kann: D(r) = d0 + d1 (r − re ) + . . .
(26)
Die Projektion dieses Dipolmoments auf die z-Achse ist gleich D(r) cos θ (wobei θ der Winkel zwischen der Molekülachse und der z-Achse ist). Wir wollen die Frequenzen des Spektrums der elektromagnetischen Wellen be stimmen, die entlang der z-Achse polarisiert sind und die das Molekül als Folge der Änderungen seines Dipolmoments absorbieren oder emittieren kann. Wie schon eini
•
866 | Ergänzung FVII
ge Male zuvor suchen wir die Bohr-Frequenzen, die in der zeitlichen Entwicklung des Erwartungswerts von D(r) cos θ auftreten können. Wir müssen daher nur herausfin den, für welche Werte von v , l , m und v, l, m das Matrixelement ⟨ψ v ,l ,m | D(r) cos θ | ψ v,l,m ⟩ = ∫ r2 dr dΩ φ∗v ,l ,m D(r) cos θ ψ v,l,m
(27)
nicht verschwindet. Mit dem Ausdruck (25) für die Wellenfunktionen bringen wir das Matrixelement in die Form ∞
[ ∫ dr u ∗ (r)D(r)u v (r)] × [∫ dΩ Y m ∗ (θ, φ) cos θ Y m (θ, φ)] v
[0
l
l
(28)
]
Auf diese Weise erhalten wir ein Produkt von zwei Integralen, mit denen wir uns be reits in den Ergänzungen AV und CVI beschäftigt haben: Das zweite Integral ist nur von null verschieden für l − l = +1 , −1
(29)
auch das erste Integral ist, wenn wir uns auf die Terme in d0 und d1 in Gl. (26) be schränken, nur ungleich null für v − v = 0 , +1 , −1
(30)
Die Linien, die zu v − v = 0 gehören, stellen das in Ergänzung CVI untersuchte reine Rotationsspektrum dar (die Intensität der Linien ist proportional zu d20 ). Zusam men mit den Linien zu v − v = ±1, l − l = ±1 (mit einer Intensität proportional zu d21 ) bilden sie das Vibrations-Rotations-Spektrum, das wir jetzt kurz beschreiben wollen. Bemerkung: Die Auswahlregel l −l = ±1 stammt von der Winkelabhängigkeit der Wellenfunktionen; sie ist da her unabhängig von der zur Lösung der Radialgleichung (3) verwendeten Näherung, während (30) nur in der harmonischen Näherung gilt.
β Die Form des Spektrums Sei v die größere der beiden Vibrationsquantenzahlen (v = v + 1). Die VibrationsRotations-Linien können in zwei Gruppen aufgeteilt werden: – die Linien v = v + 1, l = l + 1 ←→ v, l mit den Frequenzen ω ω + B(l + 1)(l + 2) − Bl(l + 1) = + 2B(l + 1) (31) 2π 2π
–
mit l = 0, 1, 2, . . . (die durch die Pfeile angedeuteten Übergänge finden sich auf der rechten Seite von Abb. 2 wieder); die Linien v = v + 1, l = l − 1 ←→ v, l mit den Frequenzen ω ω (32) + Bl (l + 1) − B(l + 1)(l + 2) = − 2B(l + 1) 2π 2π mit l = 0, 1, 2, . . . (die durch die Pfeile angedeuteten Übergänge finden sich auf der linken Seite von Abb. 2 wieder).
Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 867
•
Das Vibrations-Rotations-Spektrum besitzt also die in Abb. 3 dargestellte Form. Es ent hält zwei Gruppen von äquidistanten Linien, die symmetrisch sind in Bezug auf die Vibrationsfrequenz ω/2π. Alle Linien zusammen bilden ein Band. Die Gruppe von Li nien mit den Frequenzen (31) bilden den sogenannten R-Zweig, und entsprechend diejenigen zu (32) den P-Zweig. In jedem Zweig beträgt der Abstand zwischen zwei benachbarten Linien 2B. Das zentrale Intervall, das die beiden Zweige voneinander trennt, hat die Breite 4B; es gibt keine Linie mit der reinen Vibrationsfrequenz ω/2π (man sagt oft, das Spektrum enthalte eine „fehlende Linie“). Bemerkung: Das „reine Vibrationsspektrum“, das in Ergänzung AV untersucht wurde und das eine einzige Linie bei ω/2π besitzt, existiert also in der Praxis gar nicht. Nur wenn man spektroskopische Untersuchungen mit niedriger Auflösung benutzt, kann man die Rotationsstruktur der Vibrati ons-Rotations-Linie vernachlässigen und das in Abb. 3 dargestellte Band als eine Linie bei ω/2π ansehen (wir erinnern uns an ω/2π ≫ 2B).
Abb. 3: Das Vibrations-Rotations-Spektrum eines heteropolaren Moleküls. Da Übergänge zwischen Zuständen in Abb. 2 mit gleichem Wert von l nicht erlaubt sind, gibt es keine Linie mit der reinen Vi brationsfrequenz ω/2π. Übergänge, bei denen das Molekül aus dem Zustand (v , l ) in den Zustand (v = v − 1, l = l − 1) wechselt, gehören zu den Frequenzen (ω/2π) + 2B(l + 1) (Linien des R-Zweigs). Übergänge, bei denen das Molekül aus dem Zustand (v , l ) in den Zustand (v = v − 1, l = l + 1) wechselt, gehören zu den Frequenzen (ω/2π) − 2B(l + 1) (Linien des P-Zweigs). Die verschiedenen Linien sind in der Abbildung mit l ←→ l bezeichnet.
3 Berechnung einiger Korrekturen Die Rechnungen dieses Abschnitts stützen sich auf die Näherung, das Zentrifugalpo tential in der Radialgleichung durch seinen Wert bei r = re zu ersetzen. Das effektive Potential Veff (r) kann dann aus V(r) durch eine einfache vertikale Verschiebung er halten werden [Gl. (21)]. Im vorliegenden Abschnitt untersuchen wir die Korrekturen, die sich für die Er gebnisse aus § 2 ergeben, wenn wir die leichten Variationen des Zentrifugalpotentials in der Nähe von r = re berücksichtigen. Dazu entwickeln wir in Potenzen von r − re : l(l+1)ℏ2 l(l+1)ℏ2 l(l+1)ℏ2 3l(l+1)ℏ2 = − (r − r ) + (r − re )2 + . . . e 2μr2 2μr2e μr3e 2μr4e
(33)
•
868 | Ergänzung FVII
3-a Genauere Untersuchung der Form des effektiven Potentials Veff (r) Wenn wir Gl. (5) und Gl. (33) verwenden, können wir die Entwicklung des effektiven Potentials (4) in der Nähe von r = re wie folgt schreiben: Veff (r) = −V0 + f(r − re )2 − g(r − re )3 + . . . +
3l(l + 1)ℏ2 l(l + 1)ℏ2 l(l + 1)ℏ2 − (r − r ) + (r − re )2 + . . . e 2μr2e μr3e 2μr4e
(34)
Wir werden sehen, dass die Variation des Zentrifugalpotentials in der Nähe von r = re für nichtverschwindendes l die folgenden Auswirkungen hat: 1. Der Ort ̃re des Minimums von Veff (r) fällt nicht exakt mit re zusammen. 2. Der Wert Veff (̃re ) unterscheidet sich etwas von −V0 + Bh l(l + 1). 3. Die Krümmung von Veff (r) an der Stelle r = ̃re [die wie in Gl. (6) die Kreisfrequenz des äquivalenten harmonischen Oszillators festlegt] wird nicht länger exakt durch den Koeffizienten f gegeben. Wir wollen diese verschiedenen Effekte unter Verwendung der Entwicklung (34) be rechnen. Was die ersten beiden betrifft, können wir Terme von höherer als zweiter Ordnung für V(r) und solche von höherer als erster Ordnung für das Zentrifugalpo tential vernachlässigen, da der Abstand ̃re − re , den wir finden werden, sehr klein ist [er ist sogar im Vergleich mit (∆r)0 klein]. Wir werden in der Lage sein, a posteriori die folgenden Abschätzungen nachzuweisen: g(̃re − re ) ≪ f 3l(l +
1)ℏ2
2μr4e
l(l
(̃re − re ) ≪
(35a) + 1)ℏ2 μr3e
(35b)
α Lage und Wert des Minimums von Veff (r) Wenn wir in Gl. (34) nur die ersten beiden Terme für V(r) und für das Zentrifugalpo tential mitnehmen, wird ̃re gegeben durch 2f(̃re − re ) ≈
l(l + 1)ℏ2 μr3e
(36)
d. h. ̃re − re ≈
l(l + 1)ℏ2 2μfr3e
=
Bh l(l + 1) fre
(37)
Nach Gl. (6) und Gl. (12) haben wir somit ̃re − re 2Bh l(l + 1) (∆r)0 ≈ ≪1 (∆r)0 ℏω re
(38)
womit bei Berücksichtigung der Relationen (13) und (14) die Abschätzungen (35a) und (35b) bewiesen sind.
Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 869
•
Setzen wir diesen Wert für ̃re in die Entwicklung von Veff (r) ein, dann folgt Veff (̃re ) ≈ −V0 + Bh l(l + 1) − Gh [l(l + 1)]2
(39)
mit G=
ℏ3
(40)
8πμ2 r6e f
β Krümmung von Veff (r) im Minimum In der Nähe von r = ̃re können wir also Veff (r) in der folgenden Form schreiben: Veff (r) = Veff (̃re ) + f (r − ̃re )2 − g (r − ̃re )3 + . . .
(41)
Der Koeffizient f hängt mit der Krümmung von Veff (r) in r = ̃re zusammen: f =
1 d2 Veff (r)] [ 2 dr2 r=̃r e
(42)
Um die Differenz zwischen f und f zu berechnen, müssen wir den (r − re )3 -Term von V(r) in der Entwicklung (34) und damit auch den (r − re )2 -Term des Zentrifugalpo tentials berücksichtigen. Eine einfache Rechnung ergibt dann unter Verwendung von Gl. (37) 2f ≈ 2f +
3l(l + 1)ℏ2 μr4e
−
3g l(l + 1)ℏ2 μr3e f
(43)
Die in Gl. (6) definierte Kreisfrequenz ω muss daher durch ω = √
2f μ
(44)
ersetzt werden. Entwickeln wir die Quadratwurzel, so finden wir leicht ω = ω − 2πα e l(l + 1)
(45)
mit αe =
3ℏ2 ω 8πμr3e f
[
g 1 − ] f re
(46)
Wir könnten nun mit einer analogen Rechnung auch den Koeffizienten g bestim men; da der (r − ̃re )3 -Term von Gl. (41) die Ergebnisse, die man mit den ersten beiden Termen erhält, nur unwesentlich modifiziert, wollen wir den entstehenden Fehler in d3 V (r) beim Übergang von re nach ̃re vernachlässigen und also g ≈ g verwenden. d r 3 eff Zusammenfassend können wir daher Veff (r) in der Nähe des Minimums in der Form 1 Veff (r) ≈ Veff (̃re ) + μω2 (r − ̃re )2 − g(r − ̃re )3 (47) 2 schreiben, worin ̃re , Veff (̃re ) und ω durch Gl. (37), Gl. (39) und Gl. (45) gegeben sind.
•
870 | Ergänzung FVII
3-b Energieniveaus und Wellenfunktionen der stationären Zustände Mit Gl. (47) für Veff (r) lautet die Radialgleichung [−
ℏ2 d2 1 2 + μω (r − ̃re )2 − g(r − ̃re )3 ] u v,l (r) = [E v,l − Veff (̃re )] u v,l (r) 2μ dr2 2
(48)
Wenn wir wie im vorhergehenden § 2 den Term g(r−̃re )3 vernachlässigen, erkennen wir die Eigenwertgleichung eines eindimensionalen harmonischen Oszillators der Kreis frequenz ω , dessen Ruhelage sich bei r = ̃re befindet. Daraus schließen wir, dass der Term in eckigen Klammern auf der rechten Seite nur die Werte (v + 1/2)ℏω , v = 0, 1, 2, . . . annehmen kann. Mit Gl. (39) erhalten wir daher E v,l = −V0 + (v +
1 ) ℏω + Bh l(l + 1) − Gh [l(l + 1)]2 2
(49)
Die Wellenfunktionen stationärer Zustände haben die Form wie in Gl. (25). Wir müssen nur im Ausdruck für die Radialfunktionen, Gl. (8), re durch ̃re und β durch β = √
μω ℏ
(50)
ersetzen. Bei der Berechnung der neuen Kreisfrequenz ω haben wir den g(r − re )3 -Term be rücksichtigt und müssen daher folgerichtig die Korrekturen der Eigenwerte und Eigen funktionen der Radialgleichung berechnen, die aufgrund dieses Terms auf der linken Seite von Gl. (48) entstehen. Wir werden dies in Ergänzung AXI im Rahmen der Stö rungstheorie durchführen; an dieser Stelle beschränken wir uns darauf, das Ergebnis für die Eigenwerte anzugeben: Zu Gl. (49) für die Energie muss der Term ξℏω (v +
1 2 7 ) + ξℏω 2 60
(51)
addiert werden, worin ξ =−
15 g2 ℏ 4 μ 3 ω5
(52)
eine Größe mit der Dimension eins sehr viel kleiner als 1 ist (deshalb kann ω in diesem Korrekturterm durch ω ersetzt werden).
3-c Interpretation der verschiedenen Korrekturen α Zentrifugale Verzerrung des Moleküls Wie die Diskussion im vorletzten Abschnitt zeigte, vergrößert sich der Abstand der beiden Atomkerne, wenn das Molekül rotiert. Nach Gl. (37) nimmt diese Vergrößerung
Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 871
•
mit l(l + 1), d. h. für ein schneller rotierendes Molekül, zu. Dieses Verhalten ist leicht zu verstehen: Klassisch gesprochen zieht die „Zentrifugalkraft“ die beiden Atomkerne auseinander, bis sie von der Anziehungskraft 2f(̃re − re ) aufgrund des Potentials V(r) ausgeglichen wird. Das Molekül ist also in Wirklichkeit kein rotierender „starrer“ Körper. Die Ände rung ̃re − re des mittleren Abstands zwischen den Atomkernen bewirkt eine Vergrö ßerung des Trägheitsmoments des Moleküls und damit eine Verminderung (bei kon stantem Drehimpuls) der Rotationsenergie. Diese Verminderung wird nur zum Teil durch den Anstieg der potentiellen Energie V(̃re ) − V(re ) kompensiert; das ist der phy sikalische Grund für die in Gl. (49) auftretende Energiekorrektur −Gh l2 (l + 1)2 . Ihr Vorzeichen ist negativ, und sie wächst sehr viel schneller mit l als die Rotationsener gie Bh l(l + 1). Man kann diesen Effekt experimentell beobachten: Die Linien des rei nen Rotationsspektrums sind nicht genau äquidistant, der Abstand der Linien wächst mit l. β Vibrations-Rotations-Kopplung Wir betrachten nun den zweiten und den dritten Term von Gl. (49) und setzen für ω den Ausdruck (45) ein: (v +
1 1 1 ) ℏω + Bh l(l + 1) = (v + ) ℏω + Bh l(l + 1) − α e h l(l + 1) (v + ) 2 2 2
(53)
Die ersten beiden Terme auf der rechten Seite von Gl. (53) sind gleich der Vibrationsbzw. Rotationsenergie, die in den Ergänzungen AV und CVI berechnet wurden. Der dritte Term, der von den beiden Quantenzahlen v und l abhängt, beschreibt die Effekte aufgrund der Kopplung der Vibrations- und Rotationsfreiheitsgrade. Wir können die rechte Seite von Gl. (53) in der Form schreiben (v +
1 ) ℏω + B v h l(l + 1) 2
(54)
mit B v = B − αe (v +
1 ) 2
(55)
Jedes Vibrationsniveau erscheint dann mit einer effektiven Rotationskonstante B v , die vom zugehörigen Wert von v abhängt. Um diese Kopplung der Vibration und der Rotation des Moleküls zu erklären, wol len wir klassische Argumente verwenden. Die Rotationskonstante B ist proportional zu 1/r2 [Gl. (16)]. Wenn das Molekül schwingt, variiert r und damit auch B. Da die Vibrationsfrequenzen viel größer sind als die der Rotation, können wir eine effektive Rotationskonstante des Moleküls in einem gegebenen Vibrationszustand definieren: Sie wird gleich dem mittleren Wert von B in einem Zeitintervall sein, das viel größer ist als die Periodendauer der Vibration. Wir müssen also das zeitliche Mittel von 1/r2 in dem betrachteten Vibrationszustand nehmen.
•
872 | Ergänzung FVII
Auf diese Weise können wir die beiden Terme mit unterschiedlichen Vorzeichen, die in Gl. (46) für α e auftreten, interpretieren: Der erste, zu g proportionale Term be sagt, dass das Potential V(r) nicht harmonisch ist; dieser Effekt wächst mit der Am plitude der Vibration (d. h. mit v). Mit der gegebenen asymmetrischen Form von V(r) (Abb. 1) „verbringt“ das Molekül „mehr Zeit“ in der Region mit r > re als in der mit r < re ; daraus folgt, dass der mittlere Wert von 1/r2 kleiner als der von 1/r2e ist: Die nichtharmonische Form des Potentials verringert die effektive Rotationskonstan te. Das spiegelt sich in Gl. (55) und Gl. (46) wider. Tatsächlich würde auch dann, wenn die Vibrationsbewegung vollkommen symmetrisch in Bezug auf re verlaufen würde (d. h. wenn g gleich null wäre), der mittlere Wert von 1/r2 nicht gleich 1/r2e sein, da ⟨
1 1 ⟩ ≠ 2 r ⟨r⟩2
(56)
Das ist der Grund für den zweiten Term von Gl. (46): Nimmt man den mittleren Wert von 1/r2 , werden kleine Werte von r bevorzugt, so dass ⟨1/r2 ⟩ größer ist als 1/⟨r⟩2 ; so erklärt sich das Vorzeichen der zweiten Korrektur. Das gesamte Vorzeichen von α e ergibt sich aus dem Vergleich der beiden oben betrachteten Effekte. im Allgemeinen dominiert der anharmonische Term, so dass α e positiv und B v kleiner als B ist. Bemerkungen: 1. Vibrations-Rotations-Kopplung tritt auch im Vibrationsgrundzustand v = 0 auf, B0 = B −
1 αe 2
(57)
An dieser Stelle wird ein weiteres Mal die endliche Ausdehnung (∆r)0 der Wellenfunktion des Zustands mit v = 0 sichtbar. 2. Experimentell macht sich die Vibrations-Rotations-Kopplung in der folgenden Weise bemerk bar: Wenn α e positiv ist, ist die Rotationsstruktur in den höheren Vibrationszuständen v etwas kompakter als in den niedrigeren v = v − 1. Man kann leicht zeigen, dass die P- und R-Zweige in Abb. 3 in unterschiedlicher Weise beeinflusst werden. Benachbarte Linien haben nicht mehr exakt den gleichen Abstand voneinander und liegen im Mittel im R-Zweig dichter als im P-Zweig.
Zusammenfassend also ist die Energie eines Vibrations-Rotations-Niveaus eines zwei atomigen Moleküls mit den Quantenzahlen v und l gegeben durch 1 1 ) ℏω + [B − αe (v + )] h l(l + 1) 2 2 2 1 7 ξℏω − Gh l2 (l + 1)2 + ξ (v + ) ℏω + 2 60
E v,l = −V0 + (v +
(58)
Dabei sind V0 die Dissoziationsenergie des Moleküls, ω/2π die Vibrationsfrequenz, B die Rotationskonstante, gegeben durch Gl. (16), G, α e , ξ Konstanten mit der Dimen sion eins, gegeben durch Gl. (40), Gl. (46) und Gl. (52).
Vibrations- und Rotationsniveaus zweiatomiger Moleküle |
873
•
Referenzen und Literaturhinweise Molekülspektren: Eisberg und Resnick (1.3), Chap. 12; Pauling und Wilson (1.9), Chap. X; Karplus und Porter (12.1), Kap. 7; Herzberg (12.4), Bd. I, Kap. III, § 2b und § 2c; Landau und Lifshitz (1.19), Kap. XI und XIII. Vibration und Rotation in Kernen: Valentin (16.1), § VII-2.
•
874 | Ergänzung GVII
Ergänzung GVII Aufgaben 1. Teilchen in einem zylindersymmetrischen Potential Es seien ρ, φ, z die Zylinderkoordinaten eines spinlosen Teilchens: x = ρ cos φ ,
y = ρ sin φ ,
ρ≥0,
0 ≤ φ < 2π
Die potentielle Energie dieses Teilchens hänge nur von ρ und nicht von φ und z ab. Es ist ∂2 1 ∂2 ∂2 ∂2 1 ∂ + + = + ∂x2 ∂y2 ∂ρ 2 ρ ∂ρ ρ 2 ∂φ2 a) Man gebe den zum Hamilton-Operator gehörenden Differentialoperator in Zylin derkoordinaten an. Weiter zeige man, dass H mit L z und P z vertauscht und schlie ße daraus, dass die Wellenfunktionen der stationären Zustände des Teilchens in der Form ψ n,m,k (ρ, φ, z) = f n,m (ρ) eimφ eikz gewählt werden können, wobei die möglichen Werte der Indizes m und k angege ben werden sollen. b) Man gebe die Eigenwertgleichung des Hamilton-Operators H des Teilchens in Zy linderkoordinaten an und leite daraus die Differentialgleichung für f n,m (ρ) ab. c) Es sei Σ y der Operator, dessen Wirkung in der {|r⟩}-Darstellung darin besteht, y nach −y zu transformieren (Spiegelung an der x, z-Ebene). Vertauscht Σ y mit H? Man zeige, dass Σ y mit L z antivertauscht, und folgere daraus, dass Σ y |ψ n,m,k ⟩ Ei genvektor von L z ist. Welches ist der zugehörige Eigenwert? Was kann man über die Entartung der Energieniveaus des Teilchens aussagen? Hätte man das Ergeb nis auch direkt mit der in b) angegebenen Differentialgleichung vorhersagen kön nen? 2. Dreidimensionaler harmonischer Oszillator im homogenen Magnetfeld Bemerkung: Gegenstand dieser Übung ist die Untersuchung eines einfachen physika lischen Systems, für das der Einfluss eines homogenen Magnetfelds exakt berechnet werden kann. Für diesen Fall ist es möglich, die relative Größe des paramagnetischen und des diamagnetischen Terms zu bestimmen und den Einfluss des diamagnetischen Terms auf die Wellenfunktion des Grundzustands anzugeben. (Es sei an dieser Stelle auf die Ergänzungen DVI und BVII hingewiesen.) Man betrachte ein Teilchen der Masse μ, dessen Hamilton-Operator gegeben ist durch H0 =
P2 1 2 2 + μω R 2μ 2 0
(isotroper dreidimensionaler harmonischer Oszillator), worin ω0 eine vorgegebene positive Konstante ist. https://doi.org/10.1515/9783110638738-073
Aufgaben |
875
•
a) Man bestimme die Energieniveaus des Teilchens und deren Entartungen. Ist es möglich, eine Basis aus gemeinsamen Eigenzuständen zu H0 , L2 und L z zu kon struieren? b) Man nehme nun an, dass sich das Teilchen mit der Ladung q in einem homogenen Magnetfeld B parallel zur z-Achse befindet. Wir setzen ωL = −qB/2μ. Der Hamil ton-Operator H des Teilchens wird dann, wenn wir die Eichung A = −r × B/2 wählen, zu H = H0 + H1 (ωL ) Dabei ist H1 die Summe aus einem Operator, der linear von ωL abhängt (der pa ramagnetische Term), und einem Operator, der quadratisch von ωL abhängt (der diamagnetische Term). Man zeige, dass die neuen stationären Zustände des Sys tems und ihre Entartungen exakt bestimmt werden können. c) Man zeige, dass der Effekt des diamagnetischen Terms gegen den des parama gnetischen Terms vernachlässigt werden kann, wenn ωL sehr viel kleiner als ω0 ist. d) Wir betrachten jetzt den ersten angeregten Zustand des Oszillators, das ist der Zustand, dessen Energie für ωL → 0 den Wert 5ℏω0 /2 annimmt. Wie lauten die Energiezustände und ihre Entartungen in Gegenwart des Magnetfelds in erster Ordnung in ωL /ω0 ? Wie sieht es für den zweiten angeregten Zustand aus? e) Man betrachte den Grundzustand. Wie ändert sich seine Energie als Funktion von ωL (diamagnetischer Effekt auf den Grundzustand)? Man berechne die magne tische Suszeptibilität χ dieses Zustands. Ist der Grundzustand in Gegenwart des Magnetfelds ein Eigenvektor von L2 , von L z , von L x ? Man gebe die Form seiner Wellenfunktion und des zugehörigen Wahrscheinlichkeitsstroms an. Man zeige, dass die Wirkung des B-Felds eine Stauchung der Wellenfunktion in z-Richtung (um den Faktor [1 + (ωL /ω0 )2 ]1/4 ) und die Induktion eines Stroms ist.
Bibliographie 1 Quantenmechanik: Allgemeine Referenzen A – Einführende Bücher Quantenphysik (1.1) (1.2) (1.3) (1.4) (1.5) (1.6)
E. H. Wichmann, Berkeley Physics Course, Vol. 4: Quantum Physics, McGrawHill, New York (1971). R. P. Feynman, R. B. Leighton und M. Sands, Feynman-Vorlesungen über Phy sik, Band 5: Quantenmechanik, 6. Auflage, De Gruyter, Berlin/Boston (2015). R. Eisberg and R. Resnick, Quantum Physics of Atoms, Molecules, Solids, Nu clei and Particules, Wiley, New York (1974). M. Alonso and E. J. Finn, Fundamental University Physics, Vol. III: Quantum and Statistical Physics, Addison Wesley, Reading, Mass. (1968). U. Fano and L. Fano, Basic Physics of Atoms and Molecules, Wiley, New York (1959). J. C. Slater, Quantum Theory of Matter, McGraw-Hill, New York (1968).
Quantenmechanik (1.7)
S. Borowitz, Fundamentals of Quantum Mechanics, Benjamin, New York (1967). (1.8) S. I. Tomonaga, Quantum Mechanics, Vol. I: Old Quantum Theory, North Hol land, Amsterdam (1962). (1.9) L. Pauling and E. B. Wilson Jr., Introduction to Quantum Mechanics, McGrawHill, New York (1935). (1.10) Y. Ayant et E. Belorizky, Cours de Mécanique Quantique, Dunod, Paris (1969). (1.11) P. T. Matthews, Introduction to Quantum Mechanics, McGraw-Hill, New York (1963). (1.12) J. Avery, The Quantum Theory of Atoms, Molecules and Photons, McGraw-Hill, London (1972). B – Bücher für Fortgeschrittene (1.13) P. A. M. Dirac, The Principles of Quantum Mechanics, Oxford University Press (1958). (1.14) R. H. Dicke and J. P. Wittke, Introduction to Quantum Mechanics, AddisonWesley, Reading, Mass. (1966). (1.15) D. I. Blokhintsev, Quantum Mechanics, D. Reidel, Dordrecht (1964). (1.16) E. Merzbacher, Quantum Mechanics, Wiley, New York (1970). (1.17) A. Messiah, Quantum Mechanics, North Holland, Amsterdam (1962). (1.18) L. I. Schiff, Quantum Mechanics, McGraw-Hill, New York (1968). https://doi.org/10.1515/9783110638738-074
878 | Bibliographie
(1.19) L. D. Landau and E. M. Lifshitz, Quantum Mechanics, Nonrelativistic Theory, Pergamon Press, Oxford (1965). (1.20) A. S. Davydov, Quantum Mechanics, Translated, edited and with additions by D. ter Haar, Pergamon Press, Oxford (1965). (1.21) H. A. Bethe and R. W. Jackiw, Intermediate Quantum Mechanics, Benjamin, New York (1968). (1.22) H. A. Kramers, Quantum Mechanics, North Holland, Amsterdam (1958). C – Aufgaben zur Quantenmechanik (1.23) Selected Problems in Quantum Mechanics, Collected and edited by D. ter Haar, Infosearch, London (1964). (1.24) S. Flügge, Rechenmethoden der Quantentheorie, Springer-Verlag, Berlin (1999). D – Artikel (1.25) E. Schrödinger, What is Matter?, Scientific American 189, 52 (Sept. 1953). (1.26) G. Gamow, The Principle of Uncertainty, Scientific American 198, 51 (Jan. 1958). (1.27) G. Gamow, The Exclusion Principle, Scientific American 201, 74 (July 1959). (1.28) M. Born and W. Biem, Dualism in Quantum Theory, Physics Today 21, p. 51 (Aug. 1968). (1.29) W. E. Lamb Jr., An Operational Interpretation of Nonrelativistic Quantum Mechanics, Physics Today 22, 23 (April 1969). (1.30) M. O. Scully and M. Sargent III, The Concept of the Photon, Physics Today 25, 38 (March 1972). (1.31) A. Einstein, Zur Quantentheorie der Strahlung, Physik. Z. 18, 121 (1917). (1.32) A. Goldberg, H. M. Schey and J. L. Schwartz, Computer-Generated Motion Pic tures of One-Dimensional Quantum-Mechanical Transmission and Reflection Phenomena, Am. J. Phys., 35, 177 (1967). (1.33) R. P. Feynman, F. L. Vernon Jr. and R. W. Hellwarth, Geometrical Representa tion of the Schrödinger Equation for Solving Maser Problems, J. Appl. Phys. 28, 49 (1957). (1.34) A. A. Vuylsteke, Maser States in Ammonia-Inversion, Am. J. Phys. 27, 554 (1959).
2 Quantenmechanik: Spezielle Themen A – Stoßprozesse (2.1)
T. Y. Wu and T. Ohmura, Quantum Theory of Scattering, Prentice Hall, Engle wood Cliffs (1962).
Bibliographie |
(2.2) (2.3) (2.4) (2.5)
879
R. G. Newton, Scattering Theory of Waves and Particles, McGraw-Hill, New York (1966). P. Roman, Advanced Quantum Theory, Addison-Wesley, Reading, Mass. (1965). M. L. Goldberger and K. M. Watson, Collision Theory, Wiley, New York (1964). N. F. Mott and H. S. W. Massey, The Theory of Atomic Collisions, Oxford Uni versity Press (1965).
B – Relativistische Quantenmechanik (2.6) (2.7) (2.8)
J. D. Bjorken and S. D. Drell, Relativistic Quantum Mechanics, McGraw-Hill, New York (1964). J. J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley, Reading, Mass. (1967). V. B. Berestetskii, E. M. Lifshitz and L. P. Pitaevskii, Relativistic Quantum Theory, Pergamon Press, Oxford (1971).
C – Feldtheorie. Quantenelektrodynamik (2.9) (2.10) (2.11) (2.12) (2.13) (2.14) (2.15) (2.16) (2.17)
F. Mandl, Introduction to Quantum Field Theory, Wiley Interscience, New York (1959). J. D. Bjorken and S. D. Drell, Relativistic Quantum Fields, McGraw-Hill, New York (1965). E. A. Power, Introductory Quantum Electrodynamics, Longmans, London (1964). R. P. Feynman, Quantenelektrodynamik – Eine Vorlesungsmitschrift, Olden bourg, München (1997). W. Heitler, The Quantum Theory of Radiation, Clarendon Press, Oxford (1954). A. I. Akhiezer and V. B. Berestetskii, Quantum Electrodynamics, Wiley Inter science, New York (1965). N. N. Bogoliubov and D. V. Shirkov, Introduction to the Theory of Quantized Fields, Interscience Publishers, New York (1959). S. S. Schweber, An Introduction to Relativistic Quantum Field Theory, Harper and Row, New York (1961). M. M. Sternheim, Resource Letter TQE-1: Tests of Quantum Electrodynamics, Am. J. Phys. 40, 1363 (1972).
D – Symmetrien, Gruppentheorie (2.18) (2.19) (2.20) (2.21)
P. H. E. Meijer and E. Bauer, Group Theory, North Holland, Amsterdam (1962). M. E. Rose, Elementary Theory of Angular Momentum, Wiley, New York (1957). M. E. Rose, Multipole Fields, Wiley, New York (1955). A. R. Edmonds, Angular Momentum in Quantum Mechanics, Princeton Uni versity Press (1957).
880 | Bibliographie
(2.22) M. Tinkham, Group Theory and Quantum Mechanics, McGraw-Hill, New York (1964). (2.23) E. P. Wigner, Group Theory and its Application to the Quantum Mechanics of Atomic Spectra, Academic Press, New York (1959). (2.24) D. Park, Resource Letter SP-I on Symmetry in Physics, Am. J. Phys. 36, 577 (1968). E – Diverse (2.25) R. P. Feynman and A. R. Hibbs, Quantum Mechanics and Path Integrals, McGraw-Hill, New York (1965). (2.26) J. M. Ziman, Elements of Advanced Quantum Theory, Cambridge University Press (1969). (2.27) F. A. Kaempffer, Concepts in Quantum Mechanics, Academic Press, New York (1965). F – Artikel (2.28) P. Morrison, The Overthrow of Parity, Scientific American 196, 45 (April 1957). (2.29) G. Feinberg and M. Goldhaber, The Conservation Laws of Physics, Scientific American 209, 36 (Oct. 1963). (2.30) E. P. Wigner, Violations of Symmetry in Physics, Scientific American 213, 28 (Dec. 1965). (2.31) U. Fano, Description of States in Quantum Mechanics by Density Matrix and Operator Techniques, Rev. Mod. Phys. 29, 74 (1957). (2.32) D. ter Haar, Theory and Applications of the Density Matrix, Rept. Progr. Phys. 24, 304 (1961). (2.33) V. F. Weisskopf and E. Wigner, Berechnung der Natürlichen Linienbreite auf Grund der Diracschen Lichttheorie, Z. Physik 63, 54 (1930). (2.34) A. Dalgarno and J. T. Lewis, The Exact Calculation of Long-Range Forces be tween Atoms by Perturbation Theory, Proc. Roy. Soc. A 233, 70 (1955). (2.35) A. Dalgarno and A. L. Stewart, On the Perturbation Theory of Small Distur bances, Proc. Roy. Soc. A 238, 269 (1957). (2.36) C. Schwartz, Calculations in Schrödinger Perturbation Theory, Annals of Phy sics (New York), 6, 156 (1959). (2.37) J. O. Hirschfelder, W. Byers Brown and S. T. Epstein, Recent Developments in Perturbation Theory, in Advances in Quantum Chemistry, P. O. Lowdin ed., Vol. I, Academic Press, New York (1964). (2.38) R. P. Feynman, Space Time Approach to Nonrelativistic Quantum Mechanics, Rev. Mod. Phys., 20, 367 (1948). (2.39) L. Van Hove, Correlations in Space and Time and Born Approximation Scat tering in Systems of Interacting Particles, Phys. Rev. 95, 249 (1954).
Bibliographie
|
881
3 Grundlagenexperimente der Quantenmechanik Interferenzmuster bei schwachem Licht (3.1) (3.2)
G. I. Taylor, Interference Fringes with Feeble Light, Proc. Camb. Phil. Soc. 15, 114 (1909). G. T. Reynolds, K. Spartalian and D. B. Scarl, Interference Effects Produced by Single Photons, Nuovo Cimento 61 B, 355 (1969).
Experimenteller Nachweis des Photoeffekts. Bestimmung von h (3.3) (3.4)
A. L. Hughes, On the Emission Velocities of Photoelectrons, Phil. Trans. Roy. Soc. 212, 205 (1912). R. A. Millikan, A Direct Photoelectric Determination of Planck’s h, Phys. Rev. 7 355 (1916).
Franck-Hertz-Versuch (3.5)
J. Franck und G. Hertz, Über Zusammenstöße zwischen Elektronen und Mo lekülen des Quecksilberdampfes und die Ionisierungsspannung desselben, Verhandlungen der Deutschen Physikalischen Gesellschaft, 16, 457 (1914). Über Kinetik von Elektronen und Ionen in Gasen, Physikalische Zeitschrift 17, 409 (1916).
Proportionalität von magnetischem Moment und Drehimpuls (3.6)
(3.7)
A. Einstein und J. W. de Haas, Experimenteller Nachweis der Ampereschen Molekularströme, Verhandlungen der Deutschen Physikalischen Gesellschaft 17, 152 (1915). E. Beck, Zum Experimentellen Nachweis der Ampereschen Molekularströme, Annalen der Physik (Leipzig) 60, 109 (1919).
Stern-Gerlach-Versuch (3.8)
W. Gerlach und O. Stern, Der Experimentelle Nachweis der Richtungsquante lung im Magnetfeld, Zeitschrift für Physik 9, 349 (1922).
Compton-Effekt (3.9)
A. H. Compton, A Quantum Theory of the Scattering of X-Rays by Light Ele ments, Phys. Rev., 21, 483 (1923). Wavelength Measurements of Scattered X-Rays, Phys. Rev., 21, 715 (1923).
Elektronenbeugung (3.10) C. Davisson and L. H. Germer, Diffraction of Electrons by a Crystal of Nickel, Phys. Rev. 30, 705 (1927).
882 | Bibliographie
Lamb-Verschiebung (3.11) W. E. Lamb Jr. and R. C. Retherford, Fine Structure of the Hydrogen Atom, Phys. Rev. 79, 549 (1950) und Phys. Rev. 81, 222 (1951). Hyperfeinstruktur des Grundzustands des Wasserstoffatoms (3.12) S. B. Crampton, D. Kleppner and N. F. Ramsey, Hyperfine Separation of Ground State Atomic Hydrogen, Phys. Rev. Letters 11, 338 (1963). Weitere Grundlagenexperimente (3.13) O. R. Frisch, Molecular Beams, Scientific American 212, 58 (May 1965).
4 Zur Geschichte der Quantenmechanik (4.1) (4.2)
(4.3) (4.4) (4.5) (4.6) (4.7) (4.8)
L. de Broglie, Recherches sur la Théorie des Quanta, Annales de Physique (Paris), 3, 22 (1925). N. Bohr, The Solvay Meetings and the Development of Quantum Mechanics, Essays 1958–1962 on Atomic Physics and Human Knowledge, Vintage, New York (1966). W. Heisenberg, Physics and Beyond: Encounters and Conversations, Harper and Row, New York (1971). Niels Bohr, His life and work as seen by his friends and colleagues, S. Rozental, ed., North Holland, Amsterdam (1967). A. Einstein, M. and H. Born, Correspondance 1916–1955, Editions du Seuil, Paris (1972). Theoretical Physics in the Twentieth Century, M. Fierz and V. F. Weisskopf eds., Wiley Interscience, New York (1960). Sources of Quantum Mechanics, B. L. van der Waerden ed., North Holland, Amsterdam (1967); Dover, New York (1968). M. Jammer, The Conceptual Development of Quantum Mechanics, McGrawHill, New York (1966). Siehe auch (5.13).
Artikel (4.9) K. K. Darrow, The Quantum Theory, Scientific American 186, 47 (March 1952). (4.10) M. J. Klein, Thermodynamics and Quanta in Planck’s work, Physics Today 19, 23 (Nov. 1966). (4.11) H. A. Medicus, Fifty Years of Matter Waves, Physics Today 27, 38 (Feb. 1974). Die Referenz (5.12) enthält eine große Zahl von Verweisen auf Originalarbeiten.
Bibliographie
| 883
5 Zur Interpretation der Quantenmechanik A – Allgemeine Fragestellungen (5.1) (5.2) (5.3) (5.4)
(5.5) (5.6) (5.7)
D. Bohm, Quantum Theory, Constable, London (1954). J. M. Jauch, Foundations of Quantum Mechanics, Addison-Wesley, Reading, Mass. (1968). B. d’Espagnat, Conceptual Foundations of Quantum Mechanics, Benjamin, New York (1971). Proceedings of the International School of Physics Enrico Fermi (Varenna), Course IL; Foundations of Quantum Mechanics, B. d’Espagnat ed., Academic Press, New York (1971). B. S. Dewitt, Quantum Mechanics and Reality, Physics Today 23, 30, (Sept. 1970). Quantum Mechanics debate, Physics Today 24, 36 (April 1971). F. Laloë, Comprenons-nous Vraiment la Mécanique Quantique?, EDP Sciences et CNRS, (2011); seconde édition (2017).
Siehe auch (1.28). B – Verschiedene Interpretationen (5.8)
N. Bohr, Discussion with Einstein on Epistemological Problems in Atomic Physics, in A. Einstein: Philosopher-Scientist, P. A. Schilpp ed., Harper and Row, New York (1959). (5.9) M. Born, Natural Philosophy of Cause and Chance, Oxford University Press, London (1951); Clarendon Press, Oxford (1949). (5.10) L. de Broglie, Une Tentative d’Interprétation Causale et Non Linéaire de la Mécanique Ondulatoire: la Théorie de la Double Solution, Gauthier-Villars, Paris (1956); Etude Critique des Bases de l’Interprétation Actuelle de la Méca nique Ondulatoire, Gauthier-Villars, Paris (1963). (5.11) The Many-Worlds Interpretation of Quantum Mechanics, B. S. Dewitt and N. Graham eds., Princeton University Press (1973). Eine sehr umfassende, klassifizierte und kommentierte Sammlung von Referenzen ist zu finden in: (5.12) B. S. Dewitt and R. N. Graham, Resource Letter IQM-1 on the Interpretation of Quantum Mechanics, Am. J. Phys. 39, 724 (1971). (5.13) M. Jammer, The Philosophy of Quantum Mechanics, Wiley-interscience, New York (1974). Umfassende Darstellung der verschiedenen Interpretationen und Formalismen der Quantenmechanik; enthält viele Referenzen.
884 | Bibliographie
C – Der Messprozess in der Quantenmechanik (5.14) K. Gottfried, Quantum Mechanics, Vol. I, Benjamin, New York (1966). (5.15) D. I. Blokhintsev, Principes Essentiels de la Mécanique Quantique, Dunod, Paris (1968). (5.16) A. Shimony, Role of the Observer in Quantum Theory, Am. J. Phys., 31, 755 (1963). Siehe auch (5.13), Kap. 11. D – Versteckte Variablen und Paradoxa (5.17) A. Einstein, B. Podolsky and N. Rosen, Can Quantum-Mechanical Description of Physical Reality Be Considered Complete?, Phys. Rev. 47, 777 (1935). N. Bohr, Can Quantum-Mechanical Description of Physical Reality Be Consid ered Complete?, Phys. Rev. 48, 696 (1935). (5.18) Paradigms and Paradoxes, the Philosophical Challenge of the Quantum Do main, R. G. Colodny ed., University of Pittsburgh Press (1972). (5.19) J. S. Bell, On the Problem of Hidden Variables in Quantum Mechanics, Rev. Mod. Phys. 38, 447 (1966). Siehe auch die Referenzen (4.8) und (5.12) sowie Kap. 7 in (5.13).
6 Klassische Mechanik A – Einführende Bücher (6.1) (6.2) (6.3)
(6.4)
M. Alonso and E. J. Finn, Fundamental University Physics, Vol. I: Mechanics, Addison-Wesley, Reading, Mass. (1967). C. Kittel, W. D. Knight and M. A. Ruderman, Berkeley Physics Course, Vol. 1: Mechanics, McGraw-Hill, New York (1962). R. P. Feynman, R. B. Leighton und M. Sands, Feynman-Vorlesungen über Physik, Band 1: Klassische Mechanik; Band 2: Optik, Thermodynamik, Schwingungen und Wellen, 6. Auflage, De Gruyter, Berlin/Boston (2015). J. B. Marion, Classical Dynamics of Particles and Systems, Academic Press, New York (1965).
B – Für Fortgeschrittene (6.5) (6.6) (6.7)
A. Sommerfeld, Vorlesungen über Theoretische Physik, Band 1: Mechanik, Verlag Harri Deutsch, Thun (1994). H. Goldstein, Classical Mechanics, Addison-Wesley, Reading, Mass. (1959). L. D. Landau and E. M. Lifshitz, Lehrbuch der theoretischen Physik I. Mecha nik, 14. Auflage, Verlag Harri Deutsch, Thun (1997).
Bibliographie
| 885
7 Elektromagnetismus und Optik A – Einführende Bücher (7.1)
(7.2)
(7.3) (7.4)
E. M. Purcell, Berkeley Physics Course, Vol. 2: Electricity and Magnetism, McGraw-Hill, New York (1965). F. S. Crawford Jr., Berkeley Physics Course, Vol. 3: Waves, McGraw-Hill, New York (1968). R. P. Feynman, R. B. Leighton und M. Sands, Feynman-Vorlesungen über Physik, Band 3: Elektromagnetismus; Band 4: Kondensierte Materie, 6. Auflage, De Gruyter, Berlin/Boston (2015). M. Alonso and E. J. Finn, Fundamental University Physics, Vol. II: Fields and Waves, Addison-Wesley, Reading, Mass. (1967). E. Hecht and A. Zajac, Optics, Addison-Wesley, Reading, Mass. (1974).
B – Für Fortgeschrittene (7.5) (7.6) (7.7) (7.8) (7.9) (7.10) (7.11) (7.12) (7.13)
J. D. Jackson, Classical Electrodynamics, 2e edition Wiley, New York (1975). W. X. H. Panofsky and M. Phillips, Classical Electricity and Magnetism, Addi son-Wesley, Reading, Mass. (1964). J. A. Stratton, Electromagnetic Theory, McGraw-Hill, New York (1941). M. Born and E. Wolf, Principles of Optics, Pergamon Press, London (1964). A. Sommerfeld, Lectures on Theoretical Physics, Vol. IV: Optics, Academic Press, New York (1964). G. Bruhat, Optique, 5. Auflage, durchgesehen und bearbeitet von A. Kastler, Masson, Paris (1954). L. Landau and E. Lifshitz, The Classical Theory of Fields, Addison-Wesley, Reading, Mass. (1951); Pergamon Press, London (1951). L. D. Landau and E. M. Lifshitz, Electrodynamics of Continuous Media, Perga mon Press, Oxford (1960). L. Brillouin, Wave Propagation and Group Velocity, Academic Press, New York (1960).
8 Thermodynamik. Statistische Mechanik A – Einführende Bücher (8.1) (8.2) (8.3)
F. Reif, Berkeley Physics Course, Vol. 5: Statistical Physics, McGraw-Hill, New York (1967). C. Kittel, Thermal Physics, Wiley, New York (1969). G. Bruhat, Thermodynamique, 5. Auflage, Neufassung von A. Kastler, Mas son, Paris (1962). Siehe auch die Referenzen (1.4), Teil 2, und (6.3).
886 | Bibliographie
B – Für Fortgeschrittene (8.4)
F. Reif, Fundamentals of Statistical and Thermal Physics, McGraw-Hill, New York (1965). (8.5) R. Castaing, Thermodynamique Statistique, Masson, Paris (1970). (8.6) P. M. Morse, Thermal Physics, Benjamin, New York (1964). (8.7) R. Kubo, Statistical Mechanics, North Holland, Amsterdam and Wiley, New York (1965). (8.8) L. D. Landau and E. M. Lifshitz, Course of Theoretical Physics, Vol. 5: Statisti cal Physics, Pergamon Press, London (1963). (8.9) H. B. Callen, Thermodynamics, Wiley, New York (1961). (8.10) A. B. Pippard, The Elements of Classical Thermodynamics, Cambridge Univer sity Press (1957). (8.11) R. C. Tolman, The Principles of Statistical Mechanics, Oxford University Press (1950).
9 Relativität A – Einführende Bücher (9.1)
J. H. Smith, Introduction to Special Relativity, Benjamin, New York (1965). Siehe auch die Referenzen (6.2) und (6.3).
B – Für Fortgeschrittene (9.2) (9.3) (9.4) (9.5) (9.6) (9.7)
J. L. Synge, Relativity: The Special Theory, North Holland, Amsterdam (1965). R. D. Sard, Relativistic Mechanics, Benjamin, New York (1970). J. Aharoni, The Special Theory of Relativity, Oxford University Press, London (1959). C. Møller, The Theory of Relativity, Oxford University Press, London (1972). P. G. Bergmann, Introduction to the Theory of Relativity, Prentice Hall, Engle wood Cliffs (1960). C. W. Misner, K. S. Thorne and J. A. Wheeler, Gravitation, Freeman, San Fran cisco (1973).
Siehe auch die Referenzen im Abschnitt Elektrodynamik, insbes. (7.5) und (7.11). Als gewinnbringende Lektüre werden außerdem die folgenden Werke empfohlen: (9.8)
A. Einstein, Quatre Conférences sur la Théorie de la Relativité, Gauthier-Vil lars, Paris (1971). (9.9) A. Einstein, La Théorie de la Relativité Restreinte et Générale. La Relativité et le Problème de l’Espace, Gauthier-Villars, Paris (1971). (9.10) A. Einstein, The Meaning of Relativity, Methuen, London (1950).
Bibliographie
| 887
(9.11) A. Einstein, Relativity, the Special and General Theory, a Popular Exposition, Methuen, London (1920); H. Holt, New York (1967). Eine noch umfangreichere Sammlung von Referenzen ist zu finden in: (9.12) G. Holton, Resource Letter SRT-1 on Special Relativity Theory, Am. J. Phys. 30, 462 (1962).
10 Mathematische Methoden A – Allgemeine einführende Bücher (10.1) (10.2) (10.3) (10.4) (10.5)
J. Bass, Cours de Mathématiques, Vols. I, II et III, Masson, Paris (1961). A. Angot, Compléments de Mathématiques, Revue d’Optique, Paris (1961). T. A. Bak and J. Lichtenberg, Mathematics for Scientists, Benjamin, New York (1966). G. Arfken, Mathematical Methods for Physicists, Academic Press, New York (1966). J. D. Jackson, Mathematics for Quantum Mechanics, Benjamin, New York (1962).
B – Allgemeine Bücher für Fortgeschrittene (10.6) (10.7)
(10.8) (10.9)
(10.10) (10.11) (10.12) (10.13)
J. Mathews and R. L. Walker, Mathematical Methods of Physics, Benjamin, New York (1970). L. Schwartz, Méthodes Mathématiques pour les Sciences Physiques, Her mann, Paris (1965). Mathematische Methoden der Physik, BI Hochschulta schenbücher, Mannheim (1974). E. Butkov, Mathematical Physics, Addison-Wesley, Reading, Mass (1968). H. Cartan, Théorie Elémentaire des Fonctions Analytiques d’une ou Plusieurs Variables Complexes, Hermann, Paris (1961). Elementary Theory of Analytic Functions of One or Several Complex Variables, Addison-Wesley, Reading, Mass. (1966). J. von Neumann, Mathematical Foundations of Quantum Mechanics, Prince ton University Press (1955). R. Courant and D. Hilbert, Methods of Mathematical Physics, Vols. I and II, Wiley, Interscience, New York (1966). E. T. Whittaker and G. N. Watson, A Course of Modern Analysis, Cambridge University Press (1965). P. M. Morse and H. Feshbach, Methods of Theoretical Physics, McGraw-Hill, New York (1953).
888 | Bibliographie
C – Lineare Algebra. Hilbert-Räume (10.14) A. C. Aitken, Determinants and Matrices, Oliver and Boyd, Edinburgh (1956). (10.15) R. K. Eisenschitz, Matrix Algebra for Physicists, Plenum Press, New York (1966). (10.16) M. C. Pease III, Methods of Matrix Algebra, Academic Press, New York (1965). (10.17) J. L. Soule, Linear Operators in Hilbert Space, Gordon and Breach, New York (1967). (10.18) W. Schmeidler, Linear Operators in Hilbert Space, Academic Press, New York (1965). (10.19) N. I. Akhiezer and I. M. Glazman, Theory of Linear Operators in Hilbert Space, Ungar, New York (1961). D – Fourier-Transformation (10.20) R. Stuart, Introduction to Fourier Analysis, Chapman and Hall, London (1969). (10.21) M. J. Lighthill, Introduction to Fourier Analysis and Generalized Functions, Cambridge University Press (1964). (10.22) L. Schwartz, Théorie des Distributions, Hermann, Paris (1967). (10.23) I. M. Gel’fand and G. E. Shilov, Generalized Functions, Academic Press, New York (1964). (10.24) F. Oberhettinger, Tabellen zur Fourier Transformation, Springer-Verlag, Ber lin (1957). E – Wahrscheinlichkeit und Statistik (10.25) J. Bass, Éléments de Calcul des Probabilités, Masson, Paris (1974). Elements of Probability Theory, Academic Press, New York (1966). (10.26) P. G. Hoel, S. C. Port and C. J. Stone, Introduction to Probability Theory, Houghton- Mifflin, Boston (1971). (10.27) H. G. Tucker, An Introduction to Probability and Mathematical Statistics, Academic Press, New York (1965). (10.28) J. Lamperti, Probability, Benjamin, New York (1966). (10.29) W. Feller, An Introduction to Probability Theory and its Applications, Wiley, New York (1968). (10.30) L. Breiman, Probability, Addison-Wesley, Reading, Mass. (1968). F – Gruppentheorie Mit Fokus auf die Physik (10.31) H. Bacry, Lectures on Group Theory, Gordon and Breach, New York (1967).
Bibliographie
| 889
(10.32) M. Hamermesh, Group Theory and its Application to Physical Problems, Addison-Wesley, Reading, Mass. (1962). Siehe auch (2.18), (2.22), (2.23) oder die Referenz (16.13), wo insbesondere eine einfa che Einführung in die Verwendung kontinuierlicher Gruppen in der Physik gegeben wird. Mit Fokus auf die Mathematik (10.33) G. Papy, Groupes, Presses Universitaires de Bruxelles, Bruxelles (1961); Groups, Macmillan, New York (1964). (10.34) A. G. Kurosh, The Theory of Groups, Chelsea, New York (1960). (10.35) L. S. Pontryagin, Topological Groups, Gordon and Breach, New York (1966). G – Spezielle Funktionen (10.36) A. Gray and G. B. Mathews, A Treatise on Bessel Functions and their Applica tions to Physics, Dover, New York (1966). (10.37) E. D. Rainville, Special Functions, Macmillan, New York (1965). (10.38) W. Magnus, F. Oberhettinger and R. P. Soni, Formulas and Theorems for the Special Functions of Mathematical Physics, Springer-Verlag, Berlin (1966). (10.39) Bateman Manuscript Project, Higher Transcendental Functions, Vols. I, II and III, A. Erdelyi ed., McGraw-Hill, New York (1953). (10.40) M. Abramowitz and I. A. Stegun, Handbook of Mathematical Functions, Do ver, New York (1965). (10.41) L. J. Comrie, Chambers’s Shorter Six-Figure Mathematical Tables, Chambers, London (1966). (10.42) E. Jahnke and F. Emde, Tables of Functions, Dover, New York (1945). (10.43) V. S. Aizenshtadt, V. I. Krylov and A. S. Metel’skii, Tables of Laguerre Polyno mials and Functions, Pergamon Press, Oxford (1966). (10.44) H. B. Dwight, Tables of Integrals and Other Mathematical Data, Macmillan, New York (1965). (10.45) D. Bierens de Haan, Nouvelles Tables d’Intégrales Définies, Hafner, New York (1957). (10.46) F. Oberhettinger and L. Badii, Tables of Laplace Transforms, Springer-Ver lag, Berlin (1973). (10.47) Bateman Manuscript Project, Tables of Integral Transforms, Vols. I and II, A. Erdelyi ed., McGraw-Hill, New York (1954). (10.48) M. Rotenberg, R. Bivins, N. Metropolis and J. K. Wooten Jr., The 3-j and 6-j symbols, M.I.T. Technology Press (1959); Crosby Lockwood and Sons, Lon don.
890 | Bibliographie
11 Atomphysik A – Einführende Bücher (11.1) (11.2)
(11.3) (11.4) (11.5) (11.6)
H. G. Kuhn, Atomic Spectra, Longman, London (1969). B. Cagnac and J. C. Pebay-Peyroula, Physique Atomique, Vols 1 et 2, Dunod, Paris (1971). Englische Übersetzung: Modern Atomic Physics, Vol. 1: Funda mental Principles, and 2: Quantum Theory and its Application, Macmillan, London (1975). A. G. Mitchell and M. W. Zemansky, Resonance Radiation and Excited Atoms, Cambridge University Press, London (1961). M. Born, Atomic Physics, Blackie and Son, London (1951). H. E. White, Introduction to Atomic Spectra, McGraw-Hill, New York (1934). V. N. Kondratiev, La Structure des Atomes et des Molécules, Masson, Paris (1964).
Siehe auch (1.3) und (12.1). B – Für Fortgeschrittene (11.7) (11.8) (11.9) (11.10) (11.11) (11.12) (11.13)
G. W. Series, The Spectrum of Atomic Hydrogen, Oxford University Press, London (1957). J. C. Slater, Quantum Theory of Atomic Structure, Vols. I and II, McGraw-Hill, New York (1960). A. E. Ruark and H. C. Urey, Atoms, Molecules and Quanta, Vols. I and II, Do ver, New York (1964). Handbuch der Physik, Vols. XXXV and XXXVI, Atoms, S. Flügge ed., SpringerVerlag Berlin (1956 and 1957). N. F. Ramsey, Molecular Beams, Oxford University Press, London (1956). I. I. Sobel’man, Introduction to the Theory of Atomic Spectra, Pergamon Press, Oxford (1972). E. U. Condon and G. H. Shortley, The Theory of Atomic Spectra, Cambridge University Press (1953).
C – Artikel Viele klassifizierte und kommentierte Referenzen sind zu finden in: (11.14) J. C. Zorn, Resource Letter MB-1 on Experiments with Molecular Beams, Am. J. Phys. 32, 721 (1964). Siehe auch (3.13). (11.15) V. F. Weisskopf, How Light Interacts with Matter, Scientific American, 219, 60 (Sept. 1968). (11.16) H. R. Crane, The g-Factor of the Electron, Scientific American 218, 72 (Jan. 1968).
Bibliographie
| 891
(11.17) M. S. Roberts, Hydrogen in Galaxies, Scientific American 208, 94 (June 1963). (11.18) S. A. Werner, R. Colella, A. W. Overhauser and C. F. Eagen, Observation of the Phase Shift of a Neutron due to Precession in a Magnetic Field, Phys. Rev. Letters 35, 1053 (1975). Siehe auch: H. Rauch, A. Zeilinger, G. Badurek, A. Wilfing, W. Baupiess and U. Bon se, Physics Letters 54 A, 425 (1975). D – Exotische Atome (11.19) H. C. Corben and S. de Benedetti, The Ultimate Atom, Scientific American 191, 88 (Dec. 1954). (11.20) V. W. Hughes, The Muonium Atom, Scientific American 214, 93, (April 1966). Muonium, Physics Today 20, 29 (Dec. 1967). (11.21) S. de Benedetti, Mesonic Atoms, Scientific American 195, 93 (Oct. 1956). (11.22) C. E. Benedetti, Exotic Atoms, Scientific American 227, 102 (Nov. 1972). (11.23) V. W. Hughes, Quantum Electrodynamics: Experiment, in Atomic Physics, B. Bederson, V. W. Cohen and F. M. Pichanick eds., Plenum Press, New York (1969). (11.24) R. de Voe, P. M. Mc Intyre, A. Magnon, D. Y. Stowell, R. A. Swanson and V. L. Telegdi, Measurement of the Muonium Hfs Splitting and of the Muon Moment by Double Resonance, and New Value of α, Phys. Rev. Letters 25, 1779 (1970). (11.25) K. F. Canter, A. P. Mills Jr. and S. Berko, Observations of Positronium LymanRadiation, Phys. Rev. Letters 34, 177 (1975). Fine-Structure Measurement in the First Excited State of Positronium Phys. Rev. Letters 34, 1541 (1975).
12 Molekülphysik A – Einführende Bücher (12.1) (12.2)
M. Karplus and R. N. Porter, Atoms and Molecules, Benjamin, New York (1970). L. Pauling, The Nature of the Chemical Bond, Cornell University Press (1948).
Siehe auch (1.3), Kap. 12; (1.5) und (11.6). B – Für Fortgeschrittene (12.3) (12.4)
I. N. Levine, Quantum Chemistry, Allyn and Bacon, Boston (1970). G. Herzberg, Molecular Spectra and Molecular Structure, Vol. I: Spectra of Diatomic Molecules and Vol. II: Infrared and Raman Spectra of Polyatomic Molecules, D. Van Nostrand Company, Princeton (1963 and 1964).
892 | Bibliographie
(12.5)
H. Eyring, J. Walter and G. E. Kimball, Quantum Chemistry, Wiley, New York (1963). (12.6) C. A. Coulson, Valence, Oxford at the Clarendon Press (1952). (12.7) J. C. Slater, Quantum Theory of Molecules and Solids, Vol. 1: Electronic Struc ture of Molecules, McGraw-Hill, New York (1963). (12.8) Handbuch der Physik, Vol. XXXVII, 1 and 2, Molecules, S. Flügge, ed., Sprin ger Verlag, Berlin (1961). (12.9) D. Langbein, Theory of Van der Waals Attraction, Springer Tracts in Modern Physics, Vol. 72, Springer Verlag, Berlin (1974). (12.10) C. H. Townes and A. L. Schawlow, Microwave Spectroscopy, McGraw-Hill, New York (1955). (12.11) P. Encrenaz, Les Molécules Interstellaires, Delachaux et Niestlé, Neuchâtel (1974). Siehe auch (11.9), (11.11) und (11.14). C – Artikel (12.12) B. V. Derjaguin, The Force Between Molecules, Scientific American 203, 47 (July 1960). (12.13) A. C. Wahl, Chemistry by Computer, Scientific American 222, 54 (April 1970). (12.14) B. E. Turner, Interstellar Molecules, Scientific American 228,51 (March 1973). (12.15) P. M. Solomon, Interstellar Molecules, Physics Today 26, 32 (March 1973). Siehe auch (16.25).
13 Festkörperphysik A – Einführende Literatur (13.1) (13.2) (13.3) (13.4)
C. Kittel, Elementary Solid State Physics, Wiley, New York (1962). C. Kittel, Introduction to Solid State Physics, 3rd edn., Wiley, New York (1966). J. M. Ziman, Principles of the Theory of Solids, Cambridge University Press, London (1972). F. Seitz, Modern Theory of Solids, McGraw-Hill, New York (1940).
B – Für Fortgeschrittene Allgemeine Bücher (13.5) (13.6)
C. Kittel, Quantum Theory of Solids, Wiley, New York (1963). R. E. Peierls, Quantum Theory of Solids, Oxford University Press, London (1964).
Bibliographie
(13.7)
|
893
N. F. Mott and H. Jones, The Theory of the Properties of Metals and Alloys, Clarendon Press, Oxford (1936); Dover, New York (1958).
Spezielle Themen (13.8) (13.9) (13.10) (13.11) (13.12) (13.13) (13.14) (13.15)
M. Born and K. Huang, Dynamical Theory of Crystal Lattices, Oxford Univer sity Press, London (1954). J. M. Ziman, Electrons and Phonons, Oxford University Press, London (1960). H. Jones, The Theory of Brillouin Zones and Electronic States in Crystals, North Holland, Amsterdam (1962). J. Callaway, Energy Band Theory, Academic Press, New York (1964). R. A. Smith, Wave Mechanics of Crystalline Solids, Chapman and Hall, Lon don (1967). D. Pines and P. Nozières, The Theory of Quantum Liquids, Benjamin, New York (1966). D. A. Wright, Semi-Conductors, Associated Book Publishers, London (1966). R. A. Smith, Semi-Conductors, Cambridge University Press, London (1964).
C – Artikel (13.16) R. L. Sproull, The Conduction of Heat in Solids, Scientific American 207, 92 (Dec. 1962). (13.17) A. R. Mackintosh, The Fermi Surface of Metals, Scientific American 209, 110 (July 1963). (13.18) D. N. Langenberg, D. J. Scalapino and B. N. Taylor, The Josephson Effects, Scientific American 214, 30 (May 1966). (13.19) G. L. Pollack, Solid Noble Gases, Scientific American 215, 64 (Oct. 1966). (13.20) B. Bertman and R. A. Guyer, Solid Helium, Scientific American 217, 85 (Aug. 1967). (13.21) N. Mott, The Solid State, Scientific American 217, 80 (Sept. 1967). (13.22) M. Ya. Azbel, M. I. Kaganov and I. M. Lifshitz, Conduction Electrons in Me tals, Scientific American 228, 88 (Jan. 1973). (13.23) W. A. Harrison, Electrons in Metals, Physics Today 22, 23 (Oct. 1969).
14 Magnetische Kernresonanz (14.1) (14.2) (14.3)
A. Abragam, The Principles of Nuclear Magnetism, Clarendon Press, Oxford (1961). C. P. Slichter, Principles of Magnetic Resonance, Harper and Row, New York (1963). G. E. Pake, Paramagnetic Resonance, Benjamin, New York (1962).
Siehe auch Ramsey (11.11), Kap. V, VI und VII.
894 | Bibliographie
Artikel (14.4) (14.5) (14.6) (14.7) (14.8)
G. E. Pake, Fundamentals of Nuclear Magnetic Resonance Absorption, I and II, Am. J. Phys. 18, 438 and 473 (1950). E. M. Purcell, Nuclear Magnetism, Am. J. Phys. 22, 1 (1954). G. E. Pake Magnetic Resonance, Scientific American 199, 58 (Aug. 1958). K. Wüthrich and R. C. Shulman, Magnetic Resonance in Biology, Physics Today 23, 43 (April 1970). F. Bloch, Nuclear Induction, Phys. Rev. 70, 460 (1946).
Zahlreiche Referenzen, insbesondere auf Originalarbeiten, sind zu finden in: (14.9)
R. E. Norberg, Resource Letter NMR-EPR-1 on Nuclear Magnetic Resonance and Electron Paramagnetic Resonance, Am. J. Phys. 33, 71 (1965).
15 Quantenoptik; Maser und Laser A – Optisches Pumpen; Maser und Laser (15.1)
(15.2)
(15.3)
R. A. Bernheim, Optical Pumping: An Introduction, Benjamin, New York (1965). Enthält zahlreiche Referenzen. Außerdem sind dort mehrere Origi nalarbeiten abgedruckt. Quantum Optics and Electronics, Les Houches Lectures 1964, C. de Witt, A. Blandin and C. Cohen-Tannoudji eds., Gordon and Breach, New York (1965). Quantum Optics, Proceedings of the Scottish Universities Summer School 1969, S. M. Kay and A. Maitland eds., Academic Press, London (1970).
Die Bände dieser beiden Sommerschulen umfassen mehrere Kurse, die das optische Pumpen und die Quantenelektrodynamik berühren. (15.4)
W. E. Lamb Jr., Quantum Mechanical Amplifiers, in Lectures in Theoretical Physics, Vol. II, W. Brittin and D. Downs eds., Interscience Publishers, New York (1960). (15.5) M. Sargent III, M. O. Scully and W. E. Lamb Jr., Laser Physics, Addison-Wes ley, New York (1974). (15.6) A. E. Siegman, An Introduction to Lasers and Masers, McGraw-Hill, New York (1971). (15.7) L. Allen, Essentials of Lasers, Pergamon Press, Oxford (1969). Dieses kom pakte Werk umfasst Nachdrucke mehrerer Originalarbeiten über Laser. (15.8) L. Allen and J. H. Eberly, Optical Resonance and Two-Level Atoms, Wiley Interscience, New York (1975). (15.9) A. Yariv, Quantum Electronics, Wiley, New York (1967). (15.10) H. M. Nussenzveig, Introduction to Quantum Optics, Gordon and Breach, London (1973).
Bibliographie
|
895
B – Artikel In den beiden „Resource Letters“ ist eine große Anzahl von klassifizierten und kom mentierten Referenzen enthalten: (15.11) H. W. Moos, Resource Letter MOP-1 on Masers (Microwave through Optical) and on Optical Pumping, Am. J. Phys. 32, 589 (1964). (15.12) P. Carruthers, Resource Letter QSL-1 on Quantum and Statistical Aspects of Light, Am. J. Phys., 31, 321 (1963). Nachrucke vieler bedeutender Artikel über Laser sind zu finden in: (15.13) (15.14) (15.15) (15.16) (15.17)
Laser Theory, F. S. Barnes ed., IEEE Press, New York (1972). H. Lyons, Atomic Clocks, Scientific American 196, 71 (Feb. 1957). J. P. Gordon, The Maser, Scientific American 199, 42 (Dec. 1958). A. L. Bloom, Optical Pumping, Scientific American 203, 72 (Oct. 1960). A. L. Schawlow, Optical Masers, Scientific American 204, 52 (June 1961). Advances in Optical Masers, Scientific American 209, 34 (July 1963). Laser Light, Scientific. American., 219, 120 (Sept. 1968). (15.18) M. S. Feld and V. S. Letokhov, Laser Spectroscopy, Scientific American 229, 69 (Dec. 1973). C – Nichtlineare Optik (15.19) G. C. Baldwin, An Introduction to Non-Linear Optics, Plenum Press, New York (1969). (15.20) F. Zernike and J. E. Midwinter, Applied Non-Linear Optics, Wiley Inter science, New York (1973). (15.21) N. Bloembergen, Non-Linear Optics, Benjamin, New York (1965). Siehe auch die beiden Bände der Sommerschulen (15.2) und (15.3). D – Artikel (15.22) J. A. Giordmaine, The Interaction of Light with Light, Scientific American 210, 38 (Apr. 1964). Non-Linear Optics, Physics Today 22, 39 (Jan. 1969).
16 Kernphysik und Teilchenphysik A – Einführung in die Kernphysik (16.1) (16.2) (16.3) (16.4) (16.5)
L. Valentin, Physique Subatomique: Noyaux et Particules, Hermann, Paris (1975). D. Halliday, Introductory Nuclear Physics, Wiley, New York (1960). R. D. Evans, The Atomic Nucleus, McGraw-Hill, New York (1955). M. A. Preston, Physics of the Nucleus, Addison-Wesley, Reading, Mass. (1962). E. Segre, Nuclei and Particles, Benjamin, New York (1965).
896 | Bibliographie
B – Weiterführende Bücher zur Kernphysik (16.6) (16.7) (16.8) (16.9)
A. Deshalit and H. Feshbach, Theoretical Nuclear Physics, Vol. 1: Nuclear Structure, Wiley, New York (1974). J. M. Blatt and V. F. Weisskopf, Theoretical Nuclear Physics, Wiley, New York (1963). E. Feenberg, Shell Theory of the Nucleus, Princeton University Press (1955). A. Bohr and B. R. Mottelson, Nuclear Structure, Benjamin, New York (1969).
C – Einführung in die Elementarteilchenphysik (16.10) D. H. Frisch and A. M. Thorndike, Elementary Particles, Van Nostrand, Princeton (1964). (16.11) C. E. Swartz, The Fundamental Particles, Addison-Wesley, Reading, Mass. (1965). (16.12) R. P. Feynman, Theory of Fundamental Processes, Benjamin, New York (1962). (16.13) R. Omnes, Introduction à l’Etude des Particules Elémentaires, Ediscience, Paris (1970). (16.14) K. Nishijima, Fundamental Particles, Benjamin, New York (1964). D – Weiterführende Bücher zur Elementarteilchenphysik (16.15) B. Diu, Qu’est-ce qu’une Particule Elémentaire? Masson, Paris (1965). (16.16) J. J. Sakurai, Invariance Principles and Elementary Particles, Princeton Uni versity Press (1964). (16.17) G. Källen, Elementary Particle Physics, Addison-Wesley, Reading, Mass. (1964). (16.18) A. D. Martin and T. D. Spearman, Elementary Particle Theory, North Holland, Amsterdam (1970). (16.19) A. O. Weissenberg, Muons, North Holland, Amsterdam (1967). E – Artikel (16.20) M. G. Mayer, The Structure of the Nucleus, Scientific American 184, 22 (March 1951). (16.21) R. E. Peierls, The Atomic Nucleus, Scientific American 200, 75 (Jan. 1959). (16.22) E. U. Baranger, The Present Status of the Nuclear Shell Model, Physics To day, 26, 34 (June 1973). (16.23) S. de Benedetti, Mesonic Atoms, Scientific American 195, 93 (Oct. 1956). (16.24) S. de Benedetti, The Mössbauer Effect, Scientific American 202, 72 (April 1960). (16.25) R. H. Herber, Mössbauer Spectroscopy, Scientific American 225, 86 (Oct. 1971). (16.26) S. Penman, The Muon, Scientific American 205, 46 (July 1961).
Bibliographie |
897
(16.27) R. E. Marshak, The Nuclear Force, Scientific American 202, 98 (March 1960). (16.28) M. Gell-Mann and E. P. Rosenbaum, Elementary Particles, Scientific Ameri can 197, 72 (July 1957). (16.29) G. F. Chew, M. Gell-Mann and A. H. Rosenfeld, Strongly Interacting Parti cles, Scientific American 210, 74 (Feb. 1964). (16.30) V. F. Weisskopf, The Three Spectroscopies, Scientific American 218, 15 (May 1968). (16.31) U. Amaldi, Proton Interactions at High Energies, Scientific American 229, 36 (Nov. 1973). (16.32) S. Weinberg, Unified Theories of Elementary-Particle Interaction, Scientific American 231, 50 (July 1974). (16.33) S. D. Drell, Electron-Positron Annihilation and the New Particles, Scientific American 232, 50 (June 1975). (16.34) R. Wilson, Form Factors of Elementary Particles, Physics Today 22, 47 (Jan. 1969). (16.35) E. S. Abers and B. W. Lee, Gauge Theories, Physics Reports (Amsterdam), 9C, 1 (1973).
Sach- und Namenverzeichnis Übungsaufgaben sind mit dem Kürzel „(ü)“ gekennzeichnet. Abbremsen (Atomstrahl) AXIX .2-a Abschneidefrequenz JV .1-b-δ Absorption KV .3-d-δ, XIII.E-3-b – Photonen- XX.B – rückstoßfreie AXIX .4 – Zwei-Photonen- AXX AC Stark shift XIII.E-3-b, EXIII .3, CXX .2-b Acetylen EVII .3-c Additionstheorem der Kugelflächenfunktionen AVI .2-e-γ adjungierter Operator II.B-4-b akustisches Phonon JV .3-b Akzeptor CXIV .2-b Ammoniakmaser GIV .2-c, GIV .3-c Ammoniakmolekül GIV .1, EVII .2-b-γ Analysator IV.B-2 anomale Dispersion CXX .4-b anomaler Mittelwert XVII.C-3, AXVII .2-a-α Anregungsrate XIII.E-3-b Anti-Bunching AXVI .2-b – Photonen BXX .3-b-γ Antikommutator AIV .2, XV.A-5-b – Feldoperatoren XVI.A-2 Antinormalordnung BXVI .1-a-α, BXVI .1-c-β Antisymmetrisierungsoperator XIV.B-1-c, XIV.B-2-c Atom – Anregung XIII.E-3, AXIII .3-b – exotisches AVII .2 – Spiegel DXX .2 Atommodell – Bohrsches BI .2, AV .4-a, VII.C-2 – Thomsonsches AV .4-b Atomradius AVII .1-a-γ Ausschließungsprinzip XIV.C-3-b äußere Variable IV Austausch siehe Teilchenaustausch – von Verschränkung BXXI .2 Austauschentartung XIV.A-3-b Austauschintegral BXIV .2-c-β Austauschloch AXVI .2-b Austauschterm XIV.D-2-a-α, BXV .3-a, BXV .3-c https://doi.org/10.1515/9783110638738-075
Auswahlregeln FII .2-b, III.D-2-d, XIX.C-5 – Dipolübergang CXIX .1-b Autler-Townes-Dublett FXIII (ü), CXX .3-c Bahndrehimpuls VI.A – elektromagnetisches Feld BXIX .3-c Bahnzustandsraum IX.A-2 Band FVII .2-c-β – erlaubtes OIII , OIII .3-b, OIII .3-b-β, JV .1-b-δ – verbotenes OIII , OIII .3-b-β, JV .1-b-δ Bandlücke CXVII .1-b, CXVII .1-c, CXVII .4-d-γ Bardeen, Cooper, Schrieffer siehe BCS Basis II.A-2-a, II.C-2-b – kontinuierliche II.A-3-a, II.B-2-c-δ – orthonormierte II.A-2-a, II.C-2-a Basiswechsel XV.A-6 BCHSH-Ungleichungen XXI.F-3-a, XXI.F-3-b-α BCS CXVII – angeregte Zustände CXVII .4 – Anregungsspektrum CXVII .4-d-γ – Bandlücke CXVII .1-b, CXVII .1-c, CXVII .4-d-γ – elementare Anregungen CXVII .4-d-γ – Kohärenzfaktor CXVII .2 – Kohärenzlänge CXVII .2-c-α – Kondensationsenergie CXVII .3-b – Mechanismus CXVII .3 – nicht-diagonale Ordnung CXVII .2-c-δ – Paarwellenfunktion CXVII .2-b, CXVII .2-c – Phasenkopplung CXVII .1-b, CXVII .3-a – Zerfall, Anregung von Paaren CXVII .4-b beleuchteter Zustand, Energie CXX .1-c-α beleuchtetes Atom siehe Dressed Atom Bell, J. S. XXI.F Bell-Theorem XXI.F, XXI.F-3-a Bell-Ungleichungen XXI.F, XXI.F-3 – Verletzung der XXI.F-3-b-α, DXXI .3-c Benzol IV.C-2-c Besetzung EIII .4-c, EIV .2 Besetzungszahl XIV.C-3-d, XV.A-1 Besetzungszahloperator XV.A-4 Bessel-Funktion AVIII .2-b-β Bewegungskonstante III.D-2, III.D-2-c biorthogonale Zerlegung XXI.C-2 Bitter, F. CXIX .2-a
900 | Sach- und Namenverzeichnis
Bloch-Funktion FXI .2-a-γ Bloch-Gleichung FIV .4-a, BXIII .2-a Bloch-Theorem LV .4-d Blockdiagonalmatrix II.D-3-a-γ Bogoliubov-Anregungen DXV .1-c-α Bogoliubov-Hamilton-Operator EXVII .4-b Bogoliubov-Operator-Verfahren EXVII .4 Bogoliubov-Spektrum DXV .1-c Bogoliubov-Transformation EXVII .4 Bogoliubov-Valatin-Transformation XVII.E, CXVII .4-a Bohr, N. I.B-1, XXI.F-2 Bohr-Frequenz III.D-2-d, EIII .4-c Bohrsche Bahn CI Bohrsches Atommodell BI .2, AV .4-a, VII.C-2 Boltzmann-Verteilung BXV .2-d Born-Oppenheimer-Näherung AV .1-a, JV .3-a Bornsche Näherung VIII.B-4-a Bornsche Reihe VIII.B-4-a Born-von-Karman-Bedingungen FXI .2-a-δ, CXIV .1-c-β Bose-Einstein-Kondensat – fragmentiert CXV .4-c – Grundzustand EXVII .3 – relative Phase CXXI Bose-Einstein-Kondensation BXV .4-b-β, CXV , EXVII – abstoßende Wechselwirkung EXVII – von Paaren AXVII .2-b-γ Bose-Einstein-Spin-Kondensat DXXI .1 Bose-Einstein-Statistik LV .3-b, XIV.D-1-b, BXV .2-d Bose-Gas BXV , HXV Bosonen – abstoßende Wechselwirkung (Kondensation) EXVII – anziehende Wechselwirkung (Instabilität) HXV .4 – Bunching AXVI .3-b – endliche Temperatur HXV .4 – Fragmentierung AXVI .3-b – Grundzustand AXVI .3-a – Gruppieren AXVI .3-b – Paare BXVII .4 Bragg-Reflexion OIII .2-b Bravektor II.B-2-b-β Brechungsindex I.D-2-b, CXX .4-b Brillouin-Streuung JV .3-b
Brillouin-Zone JV .1-b-γ, FXI .2-a-β Brossel, J. CXIX .2-a charakteristische Funktion LV .4-d charakteristische Gleichung II.D-1-b-α chemische Bindung EVII .2-b-γ chemisches Potential CXIV .1-b-α, BXV .1-a, Anhang VI.1-a-β Clebsch-Gordan-Koeffizienten X.C-4-c, BX Compton-Wellenlänge VII.C-4-a Cooper-Modell DXVII .1 Cooper-Paare DXVII Coulomb-Eichung XVIII.A-2-f Coulomb-Feld XVIII.A-2-c Coulomb-Integral GXI .2-c Darstellung II.C-1 – der Kets und Bras II.C-3 – Drehgruppe BVI .3-b-γ – von Operatoren II.C-4 – Wechsel II.C-5-a Darwin-Term XII.B-1-b-γ Davisson, C. J. I.B-1 de Broglie, L. I.B-1 de-Broglie-Wellenlänge AI , KI (ü) Dekohärenz XXI.D-2 δ-Funktion Anhang II δ-Operator Anhang VII.1 Depletion EXVII .3-a Detektor, breitbandiger BXX .2-b-α, EXX .1-a Deuterium AVII .1-a-α Diamagnetismus DVII .1-d Dichte – Einteilchen- XV.B-3 – Zweiteilchen- XV.C-5-b-α Dichtematrix EIII .3-b, EXIII .1 – gemischter Fall EIV .3 – reiner Fall EIV .2 Dichteoperator EIII .3-b, EIII .4-a, EXIII .1 – Einteilchen- EXV .2-a-γ – Entropie AXXI .1 – reduzierter XV.B-4 Differentialoperator II.A-1-c-α Dipolfalle DXX .1 Dipolkopplung XIX.C-4 Dipolmoment – elektrisches GIV .3-c, FV .2-a, AXIII .1-c-α – heteropolares Molekül AV .1-c-α – magnetisches AXIII .1-d
Sach- und Namenverzeichnis | 901
Dipolnäherung, elektrische AXIII .1-c-α Dipolübergang – Auswahlregeln CXIX .1-a – elektrischer CXIX .1-a Dirac, P. A. M. XIX Dirac-Gleichung XII.B-1-a Dirac-Schreibweise II.B-1 direkter Term und Austauschterm BXV .3-a, BXV .3-c, CXV .2-b-β, CXV .3-c Dispersion, anomale CXX .4-b Dispersionsrelation I.C-4, JV .1-b-α – Bogoliubov- DXV .1-c-α – Phononen JV .3-b Dissoziationsenergie AV .1-a Divergenz der Vakuum-Energie XIX.B-3-a Donator AVII .1-a-δ, CXIV .2-b Doppelbindung EVII .4-c Doppelresonanz CXIX .2-a Doppler-Effekt AXIX .1-b – relativistischer AXIX .1-b Doppler-freie Spektroskopie AXX .3-a-β Doppler-Kühlung AXIX .2-b Doppler-Temperatur AXIX .2-b-δ Dotierung CXIV .2-b Down-Conversion EXX .5-a Drehimpuls VI – Addition X.A-2 – elektromagnetisches Feld XVIII.A-3-c, BXIX – Operator VI.B-2 Drehoperator BVI .3-a Drehungen BVI .2 Drehwellennäherung XIII.E-1 dreidimensionaler Oszillator EV Dreiecksregel X.C-4-c, BX .1-a Dreifachbindung EVII .3-c Dreiphotonenübergänge BXIII .3-d-β Dressed Atom CXX , CXX .1-c – Energiediagramm CXX .1-c-α – schwache Kopplung CXX .2 – starke Kopplung CXX .3 Druck des idealen Gases BXV .5 dualer Raum II.B-2-b-α Dulong-Petit-Regel LV .3-c ebene Welle I.C-1, II.A-3-a, III.D-1-c-β Effekt der endlichen Kernmasse AVII .1-a-α effektiver Hamilton-Operator CXX .3-a Ehrenfest-Theorem III.D-1-d-β, GIII , LIII (ü) Eichinvarianz HIII .1
Eichpotentiale XVIII.A-1-d, XVIII.A-2-e Eichtransformation HIII .1, AXIII .1-b, AXIII .1-c-α, XVIII.A-1-d Eichung HIII .1 Eigenfunktion I.B-2, I.D-1-a Eigenleitung CXIV .2-b Eigenraum II.D-1-a – invarianter II.D-3-a-α Eigenschwingung HV .1-c Eigenwert I.B-2, I.D-1-a, II.D-1-a – einfacher II.D-1-a – entarteter II.D-1-a – harmonischer Oszillator V.B – nichtentarteter II.D-1-a Eigenwertgleichung I.D-1-a, II.D-1-a Eigenzustand I.A-3, I.B-2, I.D-1-a eindeutiges Messergebnis XXI.D-3 Einschränkung BII .3 Einstein, A. I.A-1, XX.C-4, BXX .1-a Einstein-de-Broglie-Beziehung I.A-1, I.B-1, AI Einstein-Koeffizienten XIII.E-3-b, XX.C-4 Einstein-Modell AV .2, LV .3-c Einstein-Podolsky-Rosen-Paradoxon siehe EPR-Paradoxon Einstein-Temperatur LV .4-c Einteilchendichte XV.B-3 Einteilchen-Dichteoperator EXV .2-a-γ Einteilchenoperator XV.B-2-b, BXV .2, XVI.B-1 Einteilchensystem III.D-1-c-β einzelnes Atom BXX .3-b-γ elektrische Dipolnäherung AXIII .1-c-α elektrische Suszeptibilität GIV .3-c, FV .2, FV .2-a elektrischer Dipolübergang CXIX .1-a elektrisches Dipolmoment GIV .3-c, FV .2-a elektrisches Feld, quantisiertes XIX.A-1, XIX.B-1 Elektrodynamik – Bahndrehimpuls BXIX .3-c – Drehimpuls XVIII.A-3-c, BXIX – Energiedichte XVIII.A-3-a – Impuls XVIII.A-3-b, AXIX – klassische Theorie XVIII – Lagrange-Dichte AXVIII .2, AXVIII .3 – Quantisierung XIX – Spindrehimpuls BXIX .1, BXIX .3-a Elektronengas CXIV Elektronenkonfiguration AXIV .2 Elektronenspin IX.A-1 elektronische Suszeptibilität AV .1-c-β
902 | Sach- und Namenverzeichnis
elementare Anregungen – BCS CXVII .4-d-γ – Bose-Einstein-Kondensat DXV .1-c-α Elementarwelle JIII .1 Elements of Reality XXI.F-1 Emission – induzierte KV .3-d-δ, XIII.E-3-b – Photonen- XX.B – spontane KV .3-d-δ, DXIII .1, XX.C-3, CXX .1-e – stimulierte XIII.E-3-b, XX.C-1, XX.C-2 Energie – elektromagnetisches Feld XVIII.A-3-a, XVIII.B-2-d-β – freie Anhang VI.1-b-β – im Paarzustand BXVII Energieband FXI .1 – erlaubtes OIII , OIII .3-b, OIII .3-b-β, JV .1-b-δ – verbotenes OIII , OIII .3-b-β, JV .1-b-δ Energieerhaltung III.D-2 Energieniveau OIII .3-b-β Energiequantisierung I.A-1, I.D-1-a, I.D-2-c-β – harmonischer Oszillator CV .2-c Energie-Zeit-Unschärfe III.D-2-e Ensemble Anhang VI.2-d – großkanonisches BXV .1, Anhang VI.1-c – kanonisches Anhang VI.1-b – mikrokanonisches Anhang VI.1-a Entanglement Swapping BXXI .2 Entartung EII .2-b – systematische GII .2-c – wesentliche BVI .6-c-α, VII.A-3-b – zufällige GII .2-c, VII.A-3-b Entartungsgrad II.D-1-a Entropie Anhang VI.1-a-α – von Neumann- AXXI .1 Entstehen einer relativen Phase CXXI .3-b-β, DXXI Entvölkerung (Bose-Einstein-Kondensat) EXVII .3-a Entwicklungsoperator FIII EPR-Argument XXI.F, XXI.F-1-a, DXXI .3-b EPR-Paradoxon DIII .3, FX .4-c – Bohmsche Version (EPRB) XXI.F-1 – Elemente der Wirklichkeit XXI.F-1 erlaubtes Band OIII , OIII .3-b, OIII .3-b-β, JV .1-b-δ Erwartungswert III.C-4, III.D-1-d, III.D-2-c – Zeitabhängigkeit III.D-1-d erzeugende Funktion BV .1-b Erzeugungsoperator V.B-2-c, XV.A-2, AXVIII .2-f – für Teilchenpaar XVII.A, AXVII .1
Etappenzustand (virtuelles Niveau) XX.E-1-a, AXX .1, AXX .3-b Ethylen EVII .4-c Euler, Satz von LIII (ü), GXI .5-b-α Euler-Lagrange-Gleichungen Anhang III.2, AXVIII .1-b-α, AXVIII .3-b extensive Variable Anhang VI.2 Exziton AVII .1-a-δ Fabry-Pérot-Interferometer HI .2-b-α Falle – Dipol- DXX .1 – magneto-optische (MOT) AXIX .2-c – optisches Gitter DXX .3 Faltung Anhang I.2-b Feinstruktur IX.A-1-a, XII.A, XII.C-1-b Feinstrukturkonstante KIII .1, VII.C-4-a Feld – Absorption CXX .4-c – Dispersion CXX .4 – Normalmoden XVIII.B, XVIII.B-3 – Quantisierung XVI.D – räumliche Korrelationsfunktion XVI.B-3 Feldoperator XVI.A – elektrisches Feld XIX.A-1, XIX.B-1 – magnetisches Feld XIX.A-1, XIX.B-1 – Teilchenpaare AXVII – zeitabhängiger XVI.C, XVI.C-4 Fermi-Dirac-Statistik XIV.D-1-b, CXIV .1-b-α, BXV .2-d, GXV .2-b Fermi-Energie XIV.D-1-a, CXIV .1-a, AXV .1, AXVI .2 Fermi-Fläche CXVII .3-a Fermi-Gas BXV , HXV Fermi-Kugel AXV .1 Fermi-Niveau CXIV .1-b-α Fermionen XIV.C-1 – Grundzustand AXVI .2 – Paare BXVII .3 Fermis Goldene Regel XIII.C-3-b Feynman, Postulate JIII .3-c Feynman, R. P. JIII .1, Anhang IV Feynman-Pfadintegral Anhang IV fiktive Teilchen HV .1-c fiktiver Spin CIV .1 Fletcher, H. BXX .1-a Fluktuationen – Besetzungszahl (Bosonen) BXV .3-b-β – Intensitäts- BXX .4-c – Vakuum- XIX.B-3-a
Sach- und Namenverzeichnis | 903
Fluoreszenz-Spektrum CXX .3-c Fock-Raum XV.A-1 – freies Feld XIX.B-1 Fock-Zustand XV.A-1, XV.C-5-b-β, AXVI .1, AXX .2-b Fortsetzung eines Operators II.F-2-b Fourier-Reihe III.D-2-d, Anhang I.1, Anhang I.α Fourier-Spektrum Anhang I.α Fourier-Transformation III.D-2-e, Anhang I.2 Fourier-Transformierte I.C-1, I.C-2, FI .1-b, II.A-3-a Fragmentation (Bosonen) CXV .4-c, AXVI .3-b Franck-Hertz-Versuch I.B-1 freie Energie Anhang VI.1-b-β freies Teilchen I.C-1 Frequenz – Bohr- III.D-2-d, EIII .4-c – positive, negative (Feldoperator) XX.A-3 Gap siehe Bandlücke Gauß-Funktion CIII .2, BV .1-a Gaußsches Wellenpaket GI , GI .1, CIII .2, Anhang VII.2-d Gauß-Verteilung GI – Breite GI .2 gekoppelte Oszillatoren HV Gemisch, statistisches III.E-1-a-α, EIII .2, EIV .3 gemischter Zustand EIII .4-a gepaarte Fermionen BXVII .3 gepaarte Teilchen XVII – Energie BXVII Germer, L. H. I.B-1 Gesamtdrehimpulsoperator X.A-2 Gesamtspin X.B-1-b Gesamtwahrscheinlichkeit III.B-3-b-β Geschichten (klassische) Anhang IV.2 Geschwindigkeit – kritische (Superfluid) DXV .3-c – Schall- (Bose-Gas) DXV .1-c-β GHZ-Experiment BXXI .1 GHZ-Zustand AXXI .2-b, BXXI .1 Gibbs-Duhem-Gleichung Anhang VI.2-d Glauber – Detektormodell BXX .2, EXX .1-a, EXX .2-b-β – Formel BII .5-d – Zustand XIX.B-3-b Glauber, R. BXX .2-c, EXX .2-b-γ Gleichgewicht, thermodynamisches EIV .4, LV Glockenkurve GI .1 Goldene Regel XIII.C-3-b Gradienten-Entwicklung Anhang VII.3-c-γ
Greenberger, Horne, Zeilinger siehe GHZ-Experiment Green’sche Funktion JIII .2-a, JIII .2-d, VIII.B-3, BXVI – Vier-Punkt- BXVI .1-a-δ, BXVI .1-b-β – Zwei-Punkt- BXVI .1-b-α, BXVI .1-c-γ Grenzfall – quasiklassischer III.D-1-d-γ, Anhang VII.2-e – semiklassischer Anhang VII.2-e Groenewold-Formel Anhang VII.3-c-γ Größe – nichtphysikalische HIII .2-b-β – wahre physikalische HIII .2-b-β großkanonische Zustandssumme BXV .1-a, Anhang VI.1-c-α großkanonisches Ensemble BXV .1, Anhang VI.1-c großkanonisches Potential BXV .1-b, GXV .2-c, Anhang VI.1-c-β Gross-Pitaevskii-Gleichung CXV , DXV Grundzustand CI , GII .2-a, MIII .1 Gruppengeschwindigkeit I.C-4, III.D-1-c-β, JV .1-b-δ, JV .3-b Gruppieren von Bosonen AXVI .3-b gute Quantenzahl III.D-2-c gyromagnetisches Verhältnis IV.A-1-b, FIV .1-a, FIV .2-d, IX.A-2 Hadron AVII .2-b Halbleiter CXIV .2-b Hamilton-Funktion III.A, III.B-4, III.B-5-b-α, HIII .2-b-α, Anhang III, Anhang III.3-b, AXVIII .1-b-γ, AXVIII .2-d, AXVIII .3-d Hamilton-Gleichungen III.A, HIII .2-b-α Hamilton-Jacobi-Bewegungsgleichungen AXVIII .1-a, AXVIII .1-b-γ, AXVIII .2-d Hamilton-Mechanik AXVIII .1-a Hamilton-Operator FII .4, III.B-4, III.B-5-b, III.D-2-a, KIII .1 – effektiver CXX .3-a – ungestörter IV.C-1-a Hamilton-Prinzip JIII .3-d Hanbury Brown, R. BXX .3-b-α Hanle-Effekt BXIII .4(ü) harmonischer Oszillator III.D-1-d-γ, V, LV .4-a – im elektrischen Feld FV harte Kugel CVIII .2 Hartree-Fock-Gleichungen EXV .1-f, GXV .3-e – für Elektronen EXV .2-d
904 | Sach- und Namenverzeichnis
Hartree-Fock-Näherung EXV – Molekularfeld FXV .4-a, GXV .3 – thermisches Gleichgewicht GXV , HXV – zeitabhängige FXV , FXV .4-a Hartree-Fock-Potential FXV .3-b Hauptquantenzahl VII.C-4-b-α Heaviside-Funktion Anhang II.3-a Heisenberg, W I.C-3 Heisenberg-Bild GIII , XVI.C Heisenbergsche Unschärferelation I.C-3, FI .1-b, GI .2, III.C-5, III.D-2-e, AIII .3, CIII .1 Helium AV .2-b, AVII .1-b Helizität BXIX .3-a Hellman-Feynman-Theorem GXI .5-b-β hermitesche Matrix II.C-4-d hermitesche Polynome V.C-2, BV .1-a – Rekursionsbeziehungen BV .1-c hermitescher Impulsoperator II.E-2-b hermitescher Operator II.B-4-e heteropolares Molekül AV .1-c-α Hilbert-Raum II.A, II.B-1 Hohlraumstrahlung I.A-1, MIII .1, KV .3 homogene Funktion LIII (ü) homöopolares Molekül AV .1-c-β Huygenssches Prinzip JIII .1 Hybridisierung EVII .3-a Hybridorbital EVII .1, EVII .3-b hydrodynamische Formulierung DXV .2, Anhang VII.2-e-β Hyperfeinstruktur XII.A, XII.C-1-b ideales Gas BXV , BXVI .1-c, BXVI .2-b, CXVI .2 – Korrelationen AXVI Idealmessung III.C-3 identische Teilchen XV Impuls – elektromagnetisches Feld XVIII.A-3-b, XVIII.B-2-d-β, AXIX – generalisierter Anhang III.3-a – kanonischer AXVIII .1-b-β, AXVIII .2-c, AXVIII .3-c – konjugierter III.A, Anhang III.3-a, AXVIII .1-b-β, AXVIII .2-c, AXVIII .3-c – Rückstoß- (Photonen-Emission) AXIX .1 Impulsdarstellung II.E-1-b, II.E-1-e, DII .2 Impulsdiffusion AXIX .2-b-γ Impulsoperator II.E-2-a, II.E-2-d, DII .1-b, DII .2, FII .2-c-β – Hermitezität II.E-2-b Impulsübertrag VIII.B-3
induzierte Emission KV .3-d-δ Infrarotabsorption AV .1-c-α integrale Streugleichung VIII.B-3 intensive Variable Anhang VI.2 Interferenz – Photonen EXX .2 – zwei Photonen EXX .2-c, EXX .5-b invarianter Eigenraum II.D-3-a-α Inversionsfrequenz GIV .2-b, GIV .2-c Ionisation – Photo- BXX , EXX .1-a – Tunnel- BXX .5 Isolator CXIV .2-b isotropes Strahlungsfeld XX.B-2-b Iterationsmatrix OIII , OIII .1-c kanonisch konjugierter Impuls AXVIII .1-b-β, AXVIII .2-c, AXVIII .3-c kanonische Bewegungsgleichungen AXVIII .1-a, AXVIII .1-b-γ, AXVIII .2-d kanonische Kommutator-Relationen AXVIII .1-b-δ kanonisches Ensemble Anhang VI.1-b Kastenpotential HI , AIII – zweidimensionales GII .1 Kastler, A. CXIX .2-a, CXIX .2-b Kernmagneton XII.B-2-a Ketvektor II.B-2-a-α, III.B-1 – verallgemeinerter II.B-2-c-δ kinetische Energie eines Felds XVI.B-4, XVI.C-1 klassische Näherung I.D klassischer Pfad Anhang IV.2 kohärenter Zustand XIX.B-3-b Kohärenzlänge – BCS CXVII .2-c-α – Bose-Kondensat CXV .4-b kohärenter Zustand GV , KV .3-d-γ Kohärenz EIII .4-c Kohlenstoff EVII .3-c Kommutator II.A-1-c-β, II.B-3-a, BII .2-a, BII .4-c – Bosonen XV.A-5-a – elektromagnetisches Feld AXVIII .2-e, AXVIII .3-e – Feldoperatoren XVI.A-2, AXVIII .2-e, AXVIII .3-e – Feldoperatoren (gepaarte Teilchen) AXVII .3 – Fermionen XV.A-5-b kommutierende Observable II.D-3 – vollständiger Satz (V. S. K. O.) II.D-3-b, IV.A-2-a, DIV .1-b kompatible Observable III.C-6-a Komplementarität DI
Sach- und Namenverzeichnis |
konjugierter Impuls AXVIII .1-b-β, AXVIII .2-c, AXVIII .3-c konservatives System III.D-2, FIII .2 Konstante der Bewegung III.D-2, III.D-2-c Kontaktterm AXII .2-b-γ kontextuell BXXI .1-c kontinuierliche Basis II.A-3-a, II.B-2-c-δ Kontinuitätsgleichung III.D-1-c-β Kontinuum von Endzuständen XIII.C-3 Kontraktion CXVI .1-c kooperative Effekte (BCS) CXVII .3-a-β Kopplung IV.C-1-a – schwache HV .1-d Kopplungskonstante HV .1-a Korrelationen AXXI .2 Korrelationsfunktion BXVI – antinormal geordnete BXVI .1-a-α, BXVI .1-c-β – Dipol- (Atom) BXX .2-b-α – Ein-Photon-Prozess XX.D – Feld- BXX .2-b-α – Fluoreszenz-Photonen CXX .3-d – ideales Gas AXVI , CXVI .2 – im Ortsraum XV.C-5-b-α – normal geordnete BXVI .1-a-α, BXVI .1-c-α – räumliche XVI.B-3 – Vier-Punkt- AXVI .1-b – Zwei-Punkt- XVI.B-3-a Korrespondenzregeln III.B-5-a Kristall AV .2-a Kristallschwingungen JV .3 kritische Geschwindigkeit DXV .3-c Kronecker-Produkt II.F-1 Kühlung – Doppler- AXIX .2-b – Laser- AXIX .2 – Sisyphus- AXIX .2-b-δ, DXX .4 – unter das Rückstoßlimit AXIX .2-b-δ, DXX .4 – Verdampfungs- AXIX .2-b-δ Kugelflächenfunktionen VI.D-1-b-β, AVI – Additionstheorem AVI .2-e-γ Kugelkoordinaten VI.D-1-a Kugelwelle, freie VIII.C-2-b Lagrange-Dichte JIII .3-c, AXVIII .1-c, AXVIII .2-a Lagrange-Funktion III.A, HIII .2-b-α, Anhang III, Anhang III.2, AXVIII .1, AXVIII .1-b-α, AXVIII .3-b – elektromagnetisches Feld AXVIII .2, AXVIII .3 – komplexe Variablen AXVIII .1-b – kontinuierliche Variablen AXVIII .1-c
905
Lagrange-Gleichungen Anhang III.2 Lagrange-Mechanik AXVIII .1 Lagrange-Multiplikator Anhang V Laguerre-Gauß-Strahl CXIX .3-a Lamb-Shift KV .3-d-δ, XII.C-3-b, DXIII .5-b, XIX.B-3-a Landau-Niveau EVI .3-a-γ Landé-Abstandsregel BXIV .3 Landé-Faktor DX .3, XII.E-2-b, DXII .3 langreichweitige Ordnung AXVI .2-a, AXVI .3-c Laplace-Operator I.B-2 Larmor-Frequenz DVII .1-b Larmor-Präzession IV.A-1-b, IV.B-3-b, FIV .1 Laser AV .1-c-β, BXIII .1-c – Kühlung (Atome) AXIX .2 – Raman- XX.E-3-d Lebensdauer KIII .2, HIV .1, DXIII .5-a, XX.C-3 Legendre-Funktionen, zugeordnete AVI .2-e Legendre-Polynome AVI .2-e Leiter CXIV .2-b Leitungsband CXIV .2-b Lepton AVII .2-b Lichtgeschwindigkeit I.A-1 Lichtverschiebung XIII.E-3-b, EXIII .3, CXX .2-b, DXX lineares Funktional II.B-2-b-α Linearkombination von Atomorbitalen GXI .2-a Linienbreite KIII .2 Linieneinengung durch Bewegung XIII.D-3, EXIII .2-c-δ Linienverbreiterung, radiative CXX .2-b Löcher CXIV .2-b, AXV – erzeugen und vernichten AXV .2 lokaler Realismus XXI.F-1, XXI.F-3-a, BXXI .1-b longitudinales Feld XVIII.A-2-b Lorentz-Kraft Anhang III.β, XVIII.A-1-b Lorenz-Eichung XVIII.A-2-f L2 -Raum II.A magnetische Resonanz FIV , FIV .1-b magnetisches Feld, quantisiertes XIX.A-1, XIX.B-1 Magnetometer FIV .2-d Malus-Gesetz I.A-3 Markow-Bedingung XIII.D-3, EXIII .1-c, EXIII .1-d-β Markow-Näherung XIII.D-1, XIII.E-2-c Maser BXIII .1-c Mastergleichung EXIII .1-c, EXIII .1-d
906 | Sach- und Namenverzeichnis
Matrix – hermitesche II.C-4-d – unitäre CII .1-c Matrixelement II.B-3-a – reduziertes EX .2-a-α Matrizenmechanik GIII Maxwell-Gleichungen JIII .1 – klassische XVIII.A-1-a – quantisierte XIX.A-3-b Mean Field EXV Mehrquantenübergänge BXIII .3-d, AXIX .4, AXX Messprozess III.C-3 Messung III.B-3 – ideale XXI.D – nicht-destruktive DXX .5 – von Neumann XXI.D metastabile Strömung DXV .3, DXV .3-c Methan EVII .5-c mikrokanonisches Ensemble Anhang VI.1-a Millikan, R. BXX .1-a Mittelwert III.C-4, IV.B-2-d Mode des Strahlungsfelds XVIII.B-3, XVIII.B-4 Molekularfeld EXV , EXV .2-c Mollow, B. R. CXX .3-c Mollow-Triplett CXX .3-c Monogamie (Verschränkung) AXXI .2-b Mößbauer-Effekt FXIII (ü), AXIX .3-e Multiphotonenübergang AXIX .4, AXX Multiplett BXIV .3 Multiplikationsoperator II.A-1-c-α Multipoloperator EX .1-a-α Multipolwellen BXIX .3-c-α Myon AVII .1-a-β Myonenatom AV .4 Myonium AVII .1-a-β, CXII negative Frequenz (Feldoperator) XX.A-3 Neumann-Funktion AVIII .2-c-β Neutron AI Newton, I. I.A-1 Newtonsche Bewegungsgleichung I.D-2-d, HIII .2-a Newtonsche Mechanik I nicht-destruktive Messung (einzelnes Photon) DXX .5 nicht-diagonale Ordnung AXVI .2-a, AXVI .3-c Nichtlokalität XXI.F nichtphysikalische Größe HIII .2-b-β Niveauschema MIII .1
Norm II.A-1-b-β, III.D-1-c-α Normalkoordinaten, elektromagnetisches Feld XVIII.B-2-b Normalordnung BXVI .1-a-α, BXVI .1-c-α Normalvariable HV .1-c, JV .1-c-α, KV .2-c, KV .3-b – elektromagnetisches Feld XVIII.B – gekoppelte Oszillatoren HV .1-b – lineare Kette JV .1-c-α – Saite KV .2-c Nullpunktsenergie LV .2-a – divergente XIX.B-3-a Observablen II.D-2-b, III.B-2 – kommutierende II.D-3 – kompatible III.C-6-a – vektorielle BVI .5-c – vollständiger Satz kommutierender (V. S. K. O.) II.D-3-b Operator III.B-2 – Ableitung BII .5 – adjungierter II.B-4-b – Besetzungszahl- XV.A-4 – Einschränkung BII .3 – Einteilchen- XV.B-2-b, BXV .2, XVI.B-1 – Erzeugungs- XV.A-2, AXVIII .2-f – Feld- XVI.A – Fortsetzung II.F-2-b – gerader FII .2 – hermitescher II.B-4-e – infinitesimaler unitärer CII .3 – linearer II.A-1-c-α, II.B-3 – orthogonaler CII .1-a – Paritäts- FII – Spur BII .1-a – symmetrischer XV.B-2-b, XV.C-3, BXV .2, BXV .3, XVI.B – Teilchendichte XVI.B-2 – Teilchenstrom XVI.B-2 – ungerader FII .2 – unitärer CII .1-a – Vernichtungs- XV.A-3, AXVIII .2-f – Zweiteilchen- XV.C-3, BXV .3, XVI.B-1 Operatorfunktion BII .4-c Operatorprodukt (Wigner) Anhang VII.3-c optische Analogie I.D-2-b optisches Gitter DXX .3 optisches Pumpen CXIX .2-b, CXX .2-e-β optisches Theorem BVIII .2-c Orbital EVII .1
Sach- und Namenverzeichnis | 907
Ordnung, langreichweitige AXVI .2-a, AXVI .3-c Ordnungsparameter, Teilchenpaare AXVII .2-a orthogonal II.A-1-b-β orthogonaler Operator CII .1-a orthonormierte Basis II.A-2-a, II.C-2-a Orthonormierungsbedingungen II.A-2-d, II.C-2, II.C-2-a, II.E-1-b Orthopositronium CXII .2-d Ortsdarstellung II.E-1-b, DII Ortsoperator II.E-2-d, DII , DII .2-b, FII .2-c-α Oszillator – anharmonischer V.A-2, AXI .3-a – anisotroper harmonischer EV .1 – dreidimensionaler LV .1-b – dreidimensionaler harmonischer EV , BVII – Eigenwerte des harmonischen V.B – gekoppelter HV – harmonischer III.D-1-d-γ, LV .4-a – harmonischer, im elektrischen Feld FV – im thermodynamischen Gleichgewicht LV – isotroper BVII – isotroper harmonischer EV .1 – klassischer harmonischer V.A-2 Oszillatorenkette V.D-3, JV Oszillatorstärke AXIII .2-c Paar XVII.A, AXVII .1 Paaranregung (BCS) CXVII .4-b Paardichte XV.C-5-b-α, XVI.B-3-b Paarerzeugung XVII.D-1-a, BXVII .3-a-β, BXVII .4-b-β Paarfeld AXVII – Kommutatoren AXVII .3 Paarvernichtung XVII.D-1-a, BXVII .3-a-β, BXVII .4-b-β Paarwellenfunktion AXVII .2-a – BCS CXVII .2-b, CXVII .2-c Paarzerfall CXVII .4-b Pairing Term BXVII .3-a-β paramagnetische Suszeptibilität EIV .4 Paramagnetismus DVII .1-c parametrische Verstärkung EXX .5-a Parapositronium CXII .2-d Parität AVI .2-c, XIV.B-2-b-β, AXX .3-a-γ Paritätsoperator II.A-1-c-α, FII Partialwelle VIII.C-1 partielle Reflexion JI .2 partielle Spur EIII .5-b Paschen-Back-Effekt DXII .4-c
Pauli-Matrizen AIV , IX.B Pauli-Prinzip XIV.C-3-b Penrose-Onsager-Kriterium AXVI .3-a, AXVII .2-c-β, EXVII .3-d-α Peres, A. XXI.F-3-b-α periodische Funktion Anhang I.1-a periodisches Potential OIII Permutationsoperator XIV.B-1-a Pfad – klassischer Anhang IV.2 – raumzeitlicher Anhang IV Pfadintegral Anhang IV – Formulierung JIII .3 – Methode JIII .3-d Phantom-Komponente (Wigner-Funktion) Anhang VII.5-b Phasenkonventionen BX .2 Phasenkopplung – BCS CXVII .3-a, CXVII .3-a-β – Bosonen EXVII .2-a-α, EXVII .3-c Phononen JV .3-b – Bogoliubov- DXV .1-c Photodetektion – Amplitude EXX .1-b – einfache EXX .2-b-β, EXX .2-c-β – zwei Photonen EXX .2-c-γ, EXX .5-b-α Photodetektor BXX .2, EXX .1-a photoelektrischer Effekt BXX .1 Photo-Ionisation BXX , EXX .1-a – Rate BXX .2-b-β, BXX .4-b – zwei Photonen BXX .4 Photon I.A-1, I.A-2-b, KV .3-d-α, LV .3-b, XIX.B, BXX .1-a – Absorption, Emission XX, XX.B – Energie und Impuls XIX.B-2 – Helizität BXIX .3-a – Photonenzahl CXX .1-d – Rückstoß AXIX .1 – Spin-1-Teilchen BXIX .2-b – Streuung an Atom XX.E π-Bindung EVII .3-c π-Elektron AV .3-a, EVII Pitaevskii siehe Gross-Pitaevskii-Gleichung Planck, M. I.A-1, XX.C-4 Planck-Konstante I.A-1 Plancksche Strahlungsformel XX.C-4 Pointer State XXI.D-2 Poisson-Verteilung GV .2-b
908 | Sach- und Namenverzeichnis
Polarisation FX .3-c-α – elektromagnetisches Feld XVIII.B-2-a – vollständige EIV .2 Polarisator IV.B-2 Polynommethode CV .2 positive Frequenz (Feldoperator) XX.A-3 Positronium AVII .1-a-γ Potential – periodisches OIII – skalares HIII .1, XVIII.A-1-d, XVIII.A-2-e – Vektor- HIII .1, XVIII.A-1-d, XVIII.A-2-e Potentialoperator BII .4-b Potentialstufe I.D-2-c-α, JI , BIII .2 – zweidimensionale BIII .3 Potentialtopf I.D-2-c-β, HI .2-c, MIII Potentialwall I.D-2-c-α, HI .2-b potentielle Energie I.D-1 – eines Felds XVI.B-2, XVI.C-2 Präparation III.C-6-b, IV.B-1-a Prinzip der kleinsten Wirkung Anhang III.5-b, AXVIII .1-a Projektionspostulat XXI.D-3-b Projektionstheorem DX .2-c Projektoren II.B-3-b Propagator JIII .1 – retardierter JIII .2-a – Teilchen- Anhang IV.1, Anhang IV.2-a Pseudoteilchen JV .3-b Pumpen BXIII .1-a, BXIII .2-a, BXIII .3 Punktladung im elektromagnetischen Feld XVIII.A-1-b Quadrupolmoment, elektrisches AXIII .1-d Quantenelektrodynamik XIX Quantenresonanz GXI .2-c Quantenstatistik BXV , Anhang VI Quantenwinkel DXXI .2-b Quantenzahl, gute III.D-2-c Quantisierung III.C-2 – elektromagnetisches Feld XIX – Feld- XVI.D, BXX .3, BXX .3-b-β – Regeln HIII .3-a, Anhang IV.3 – zweite XVI.D quasiklassischer – Grenzfall III.D-1-d-γ, Anhang VII.2-e – Zustand GV , GV .1-b, XIX.B-3-b Quasiteilchen HXV .2-b, XVII.E-3 – Bogoliubov-Phononen EXVII .4-c – Vakuumzustand XVII.E
Quasiverteilung Anhang VII.2-a, Anhang VII.2-f Quasiwahrscheinlichkeit Anhang VII.2-a, Anhang VII.2-f Rabi-Formel XIII.E-1 Rabi-Frequenz XIII.E-1 Rabi-Oszillation CXX .1-c-β radiative Kaskade CXX .3-d-α Raman-Anti-Stokes-Linie CVI .4-b-α Raman-Anti-Stokes-Streuung AV .1-c-β Raman-Effekt AV .1-c-β, CVI .4-b Raman-Laser AV .1-c-β, XX.E-3-d Raman-Stokes-Linie CVI .4-b-α Raman-Stokes-Streuung AV .1-c-β Raman-Streuung XX.E-3 Random Walk AXIX .2-b-γ Rang (Schmidt-) XXI.C-3 Rate – Anregungs- XIII.E-3-b – Ionisations- BXX .2-b-β, BXX .4-b – Übergangs- XIII.D-2, EXIII .2-b-α Ratengleichungen XIII.E-2-c Raum, dualer II.B-2-b-α Raumquantelung IV.A-1 raumzeitlicher Pfad Anhang IV Rayleigh-Jeans-Gesetz LV .3-a Rayleigh-Linie CVI .4-b-α Rayleigh-Streuung AV .1-c-β, XX.E-1-d Realismus, lokaler XXI.F-1, XXI.F-3-a, BXXI .1-b Rechteckpotential I.D, I.D-2-a, HI .1 Reduktion III.B-3-c Reduktion des Wellenpakets III.E-2-d-β – von Neumann-Postulat XXI.D-3-b Reflexion, partielle JI .2 Reflexionskoeffizient JI .2, BIII .2-a Reibungskraft AXIX .2-b-β Reichweite HI .2-a-β reiner Zustand EIII .3, EIII .3-c reines Rotationsspektrum CVI .4-a-α relative Phase – Kondensate CXXI , CXXI .3-b-β, DXXI .2-b – Spin-Kondensate DXXI Relaxation BXIII .3, EXIII – allgemeine Mastergleichung EXIII .1-d – longitudinale EXIII .2-b – transversale EXIII .2-c Relaxationslänge CXV .4-b Relaxationsprozess BXIII .1-a
Sach- und Namenverzeichnis |
Relaxationszeit FIV .4-a, FXIII (ü) – longitudinale EXIII .2-b-α – transversale EXIII .2-c-γ Renormierung KV .3-d-δ, XIX.B-3-a Resonanz IV.C-2-c, XIII.C-2-a – Energie I.D-2-c-β – Fluoreszenz CXX .3-c – Integral GXI .2-c – magnetische FIV , FIV .1-b – Näherung XIII.C-2-a, XIII.E-1 – Phänomene IV.C-2-c – Streuung XX.E-2 retardierter Propagator JIII .2-a Ringstrom DXV .3-a Rotating Wave Approximation (RWA) XIII.E-1 Rotation BVI .2-a Rotationskonstante CVI .3-b Rotationsspektrum, reines CVI .4-a-α Rotator, starrer CVI .2 Rückstoß – auf freies Atom AXIX .1 – Energie AXIX .1-c – Limit (Laser-Kühlung) AXIX .2-b-δ – Unterdrückung AXIX .3 Rutherford-Formel CVIII .1-b RWA (Rotating Wave Approximation) XIII.E-1 Saite KV .1 Saitengleichung KV .2-b Säkulargleichung II.D-1-b-α Säkularnäherung CXIII .1 Sättigungseffekte BXIII .3-d Schale VII.C-4-b-α, AXIV .2 Schallgeschwindigkeit JV .3-b – Bose-Gas DXV .1-c-β Schattenstreuung BVIII .2-a Schmelztemperatur LV .4-c Schmidt-Rang XXI.C-3 Schmidt-Zerlegung XXI.C-2 Schottky-Anomalie LV .3-c Schrödinger, E. I.B-2, XXI.A Schrödinger-Bild GIII , XIII.B-1-b, EXIII .1-b-α Schrödinger-Gleichung I.B-2, I.D, DII .1-c, DII .2-c, III.B-4, III.B-5-b-α, III.B-5-b-β, III.D, JIII .3-c – Feldoperator XVI.C-4 schwache Kopplung HV .1-d Schwarzer Körper LV .3 Schwarzsche Ungleichung II.A-1-b-β, AII Schwebung HV .1-d
909
Schwingung, harmonische V.A-2 Selbstionisation DXIII .1 Selektivität III.E-2-b-α semiklassischer Grenzfall Anhang VII.2-e Separabilität XXI.F-2, AXXI .3 separabler Dichteoperator AXXI .3-a Separation der Variablen I.D-1 σ-Bindung EVII .3-c σ-Elektron AV .3-a Singulett X.B-4 Sisyphus-Kühlung DXX .4 Skalar BVI .5-b Skalarprodukt II.A-1-b, II.B-2-a-β, II.E-1-d, II.F-2-a-γ Slater-Determinante XIV.C-3-c-β, EXV .1-a S-Matrix NIII .1-b Sommerfeld, A. I.B-1 spektrale Dichte AXIII .3-b, EXIII .2-b-β Spektralfunktion BXVI .3 Spektralterm BXIV .2-b Spektralzerlegung I.A-3, I.B-2, III.B-3-b spektroskopische Notation BXIV .2-b Spektrum – diskretes III.B-3-b-α – eines Operators II.D-1-a – kontinuierliches III.B-3-b-β, XIII.C-3 spezifische Wärme fester Körper LV .3-c Spin VI.A, IX.A-2 – Drehimpuls VI.A – fiktiver CIV .1 – Operator IX.A-2 – Raum IV, IV.A-2-a – Variable IV, IX.A-2 – Zustandsraum IX.A-2 Spin-1/2-Teilchen IV Spin-1-Teilchen BXIX .1 Spin-Bahn-Kopplung XII.B-1-b-β Spinor IX.C-1-b-α Spin-Statistik-Theorem XIV.C-1 spontane Emission KV .3-d-δ, DXIII .1, XX.C, CXX .1-e spontane Magnetisierung (Fermionen) HXV .3 Spur BII .1-a – partielle EIII .5-b Standardabweichung III.C-5, CIII , LIII (ü) Standardbasis VI.C-3-a starke Felder BXX .5 Stark-Effekt EXII starrer Rotator CVI .2
910 | Sach- und Namenverzeichnis
stationäre Lösung I.D-1-a stationärer Streuzustand VIII.B-1-a stationärer Zustand I.D-1-a, I.D-1-b, III.D-2-b statistische Physik Anhang VI statistisches Gemisch III.E-1-a-α, EIII .2, EIV .3 Stern-Gerlach-Versuch IV.A-1-a stimulierte Emission XX.C stimulierter Raman-Effekt AV .1-c-β, XX.E-3-d stochastische Störung XIII.D, XIII.E-2, EXIII Stoner-Modell HXV .3 Störparameter XI.A-1 Störstellenleitung CXIV .2-b Störung IV.C-1-a, XI.A-1 – stochastische XIII.D, XIII.E-2, EXIII – zeitabhängige XIII.A – zufällige XIII.D, XIII.E-2, EXIII Störungstheorie – stationäre XI – zeitabhängige XIII.A, XX.A-1 Strahlung Schwarzer Körper LV .3 Strahlungsdruck AXIX .1-d Strahlungsgesetz von Planck LV .3-a Streuamplitude VIII.B-1-b Streugleichung, integrale VIII.B-3 Streuphase VIII.C-3-a Streuquerschnitt VIII.A-3, XIII.C-3-b – differentieller VIII.A-3 – totaler VIII.A-3, BVIII .2-c Streureaktion VIII.A-1 Streuresonanz HI .2-b-α, VIII.C-4-b Streuung III.C-5 – elastische VIII.A-1, XX.E-1 – inelastische XX.E-3 – Photon an Atom XX.E – Raman- XX.E-3 – Raman- (stimuliert) XX.E-3-d – Rayleigh- XX.E-1-d – resonante XX.E-2 Streuwellenvektor VIII.B-3 Streuzustand, stationärer VIII.B-1-a Stromdichte XVI.B-2 Summenregel AXIII .2-c-α Superfluid siehe Supraflüssigkeit Superposition I.D-1-b – inkohärente XIII.E-3 Superpositionsprinzip I.B-2, I.C-1, III.B-1, III.D-1-b – Maxwellsche Gleichungen I.A-2-b
Supraflüssigkeit DXV .3, DXV .3-d – Wirbel DXV .3-a Suszeptibilität AXIII .2-a-γ – elektrische GIV .3-c, FV .2, FV .2-a – elektronische AV .1-c-β – lineare BXIII .3-b-γ – nichtlineare BXIII .3-d-α Symmetrisierungsoperator XIV.B-1-c, XIV.B-2-c Symmetrisierungspostulat XIV.C Symmetrisierungsregel III.B-5-a Tamas-Komponente (Wigner-Funktion) Anhang VII.5-b Teilchen – identische XIV.A – und Löcher AXV Teilchenaustausch XV.C-5 Teilchendichte, Operator XV.B-3, XVI.B-2 Teilchenpaar siehe Paar Teilchenpropagator Anhang IV.1, Anhang IV.2-a Teilchenzahl – ideales Gas BXV .4 – Photonen CXX .1-d Tensoroperatoren, irreduzible GX (ü) Tensorprodukt II.F-1, II.F-2-a-α – von Operatoren II.F-2-b Tensorwechselwirkung BXI .1-b Term – Austausch- CXV .2-b-β, CXV .3-c – direkter XIV.D-2-a-α, CXV .2-b-β, CXV .3-c – Paar- BXVII .3-a-β thermische de-Broglie-Wellenlänge AI , BXV .4-a thermisches Gleichgewicht – ideales Gas BXV – mit Wechselwirkungen GXV thermodynamisches Gleichgewicht EIV .4, LV thermodynamisches Potential – Entropie Anhang VI.1-a-α – freie Energie Anhang VI.1-b-β – großkanonisches Potential BXV .1-b, GXV .2-c, Anhang VI.1-c-β – Minimierung GXV .1-c, Anhang VI.1-b-β Thomas-Präzession XII.B-1-b-β Thomsonsches Atommodell AV .4-b Torsionsschwingungen AV .3 totaler Streuquerschnitt VIII.A-3, BVIII .2-c Totalreflexion JI .1 Transformation – Bogoliubov- EXVII .4
Sach- und Namenverzeichnis |
– Bogoliubov-Valatin- XVII.E, CXVII .4-a – unitäre II.C-5-a, CII .1-a – Wigner- Anhang VII Translationsoperator EII .3-b Transmissionskoeffizient BIII .2-a, OIII .2-b Transmissionsmatrix NIII .1-a Transposition XIV.B-2-b-β transversales Feld XVIII.A-2-b – Satz von Oszillatoren XVIII.B Triplett X.B-4 – Fluoreszenz CXX .3-c Tritium AVII .1-a-α Tunneleffekt I.D-2-c-α, HI .2-b-β, MIII .2, GIV .2-c, AV .3-c, FXI – Ionisation BXX .5 Twiss, R. BXX .3-b-α Übergangswahrscheinlichkeit CIV .3-c, FIV .2-c Überlappungsintegral GXI .2-c Übergangsrate XIII.D-2, EXIII .2-b-α Übergangswahrscheinlichkeit XIII.B-3-b, XIII.D-2 unitäre Matrix CII .1-c unitärer Operator CII .1-a Unschärferelation BI , AIII .3, CIII .1, MIII .2 – Heisenbergsche I.C-3, FI .1-b, GI .2, III.C-5, III.D-2-e, AIII .3, CIII .1 – Zeit-Energie- XIII.C-2-b ununterscheidbare Teilchen XV Vakuum KV .2-e-β, KV .3-d-α Vakuumschwankungen KV .3-d-δ Vakuumzustand XV.A-1-c – Anregungen AXV .3 – Photonen XIX.B-3-a – Quasiteilchen XVII.E Valenzband CXIV .2-b Valenzelektron EVII .2-b-γ Van-der-Waals-Kraft AV .1-a, CXI Variablen – äußere IV – extensive Anhang VI.2 – intensive Anhang VI.2 Variationsmethode EXI .1-a Vektor BVI .5-c Vektormodell FX Vektoroperator II.E-2-a, DX Vektorpotential HIII .1
911
Vektorraum II.A-1 – dualer II.B-2-b-α verallgemeinerter Ket II.B-2-c-δ verbotenes Band OIII , OIII .3-b-β, JV .1-b-δ Verletzung Bellsche Ungleichungen XXI.F-3-b-α, DXXI .3-c Vernichtungsoperator V.B-2-c, XV.A-3, AXVIII .2-f Verschränkung XXI, XXI.C, XXI.E-1 – Austausch von BXXI .2 – durch Messung verstärkt CXXI .2 versteckte Variablen XXI.F-3-a Vertauschungsrelationen II.E-2-a, EII .1, JIII .3-c, XV.A-5-a – kanonische II.E-2-a Verteilung – Boltzmann- BXV .2-d – Bose-Einstein- BXV .2-b, BXV .2-d – Fermi-Dirac- BXV .2-a, BXV .2-d – Wigner- Anhang VII – Zwei-Teilchen- (BCS) CXVII .2-b Verteilungsfunktion BXV , HXV .1 – BCS CXVII .2 Verzögerung JI .1 Vibrationsfrequenz AV .1-b-β – Deuteriummolekül AV .1-b-γ – Wasserstoffmolekül AV .1-b-γ Vier-Punkt-Korrelationsfunktion AXVI .1-b Virialsatz LIII (ü), GXI .5-a, GXI .5-c-β virtueller Übergang AXX .1 vollständiger Satz kommutierender Observabler (V. S. K. O.) II.D-3-b, IV.A-2-a, DIV .1-b Vollständigkeitsrelation II.A-2-d, II.A-3-a, II.A-3-c-α, II.C-2-b, II.D-2-b, II.E-1-b, DIV .1-a, GV .2-e Volumeneffekt DXI von Neumann, J. XXI.D von Neumann-Entropie AXXI .1 von Neumann-Kette XXI.D-3-a von Neumann-Messung XXI.D Vortex DXV .3-a V. S. K. O. (vollständiger Satz kommutierender Observabler) II.D-3-b, IV.A-2-a, DIV .1-b wahre physikalische Größe HIII .2-b-β Wahrscheinlichkeit I.A-2-b, I.A-3, II.A, III.B-3-b-α, III.D-1-c-α, III.D-2-c, III.E-1-a-α, EIV .4 – lokale Erhaltung III.D-1-c-β – Photon-Absorption XX.B-2-a-α
912 | Sach- und Namenverzeichnis
– pro Zeit KIII .2 – Übergangs- XIII.B-3-b, XIII.D-2 Wahrscheinlichkeitsamplitude I.A-2-b, I.B-2, III.E-1-a-α, III.E-1-c Wahrscheinlichkeitsdichte I.B-2, I.C-3, III.C-1, III.D-1-c-β Wahrscheinlichkeitsfluid VIII.B-2-a Wahrscheinlichkeitsflüssigkeit CVII , Anhang VII.2-e-β Wahrscheinlichkeitsstrom III.D-1-c-β, BIII , CVII Wassermolekül EVII .2-b-γ Wasserstoffatom CI , VII Wechselwirkung – Atom-Feld- XIX.C-2 – Austausch- XV.C-5-b – direkter Term XV.C-5-b – elektrische Dipolkopplung XIX.C-4 – Feld und Ladungen XIX.C-1 Wechselwirkungsbild LIII (ü), XIII.B-1-b, EXIII .1-b-α, XX.A-2 Wechselwirkungsenergie – eines Felds XVI.B-4, XVI.C-3 – Hartree-Fock EXV .1-b-γ Welcher-Weg-Experiment XXI.E Welle, ebene I.C-1, II.A-3-a, III.D-1-c-β Wellenfunktion I.A-2-b, I.B-2, I.D-1, II.A, DII .2-c, III.B-1, III.C-1 Wellengruppe I.C-1 Wellenpaket I.C-1, I.C-2, JI , III.D-1-d-γ, EXX – ein Photon EXX .2-b – eindimensionales FI .1-a – freies FI .1-a – Gaußsches GI , GI .1, CIII .2, Anhang VII.2-d – Reduktion III.B-3-c, III.E-2-d-β – zerfließendes LIII (ü) – zwei Photonen EXX .5 – zweidimensionales EI .2 Welle-Teilchen-Dualismus I.A-2-b Weltlinie JIII .3-a Weyl, H. Anhang VII.2-a Weyl-Operator Anhang VII.2-a Wick-Theorem CXVI .1-d Wigner, E. Anhang VII Wigner-Eckart-Theorem DX Wigner-Transformation Anhang VII Windungszahl DXV .3-d Winkeldispersion EI .2 Wirkung AXVIII .1-a
Wirkungsquerschnitt VIII.A-3 – differentieller VIII.A-3 – totaler VIII.A-3, BVIII .2-c Young, Th. I.A-2 Youngscher Doppelspaltversuch I.A-2, I.A-2-a, DI , III.E-1-b-β, III.E-2-c Yukawa-Potential CVIII .1 Zeeman-Diagramm XII.E-1-b Zeeman-Effekt DVII .2, IX.A-1-b, XII.E, XII.E-1-b Zeiger-Zustand XXI.D-2 Zeitentwicklungsoperator XVI.C-4, XX.A-1 – Integralgleichung XX.A-1 Zentralkraft EV .1 Zentralpotential VII, AXIV .1-b Zerfließen eines freien Wellenpakets LIII (ü) Zerlegung – nach Eigenzuständen I.D-1-b – von 2 × 2-Matrizen EIV .5 Zirkulation DXV .3-a zufällige Störung EXIII zugeordnete Legendre-Funktionen AVI .2-e Zustand – angeregter GII .2-b – Anzahl- XV.A-1 – eines klassischen Systems III.A – eines Quantensystems III.B – Etappen- (virtueller) AXX .1 – Fock- XV.A-1, XV.C-5-b-β, AXVI .1, AXX .2-b – gemischter EIII .4-a – gepaarter XVII, XVII.B – GHZ- AXXI .2-b, BXXI .1 – kohärenter GV , KV .3-d-γ, XIX.B-3-b – Photon I.A-2-b – Pointer State XXI.D-2 – quasiklassischer GV , GV .1-b, XIX.B-3-b – reiner EIII .3, EIII .3-c – separabel AXXI .3-a – stationärer I.D-1-a, I.D-1-b, III.D-2-b – total symmetrischer XIV.B-2-c Zustandsdichte OIII .3-b-γ, XIII.C-3-a-α, CXIV .1-a, CXVII .1-c-β – der Endzustände XIII.C-3-a Zustandsgleichung Anhang VI.2-b – Bosonen (abstoßende Wechselwirkung) HXV .4 – ideales Gas BXV .5 Zustandspräparation III.C-6-b
Sach- und Namenverzeichnis | 913
Zustandsraum II.B-1, III.B-1 – System mit zwei Spins 1/2 DIV .1-a Zustandssumme EIII .5-a, EIV .4, BXV .1-a, BXV .1-b, GXV .2-b, Anhang VI.1-a-α – harmonischer Oszillator LV .1 – kanonische Anhang VI.1-b-α Zustandsvektor II.B-1 zwei Kondensate CXXI zwei Spin-Kondensate DXXI .1 zweidimensionales Wellenpaket EI .2 Zweig, akustischer JV .3-b Zwei-Niveau-System IV.C
Zwei-Photon-Absorption EXX .5-b-α Zwei-Photon-Interferenz EXX .2-c, EXX .5-b Zwei-Photon-Ionisation BXX .4 Zwei-Punkt-Korrelationsfunktion XVI.B-3-a zweite Quantisierung XVI.D Zweiteilchendichte XV.C-5-b-α, XVI.B-3-b Zwei-Teilchen-Operator XV.C-3, BXV .3, XVI.B-1 Zwei-Teilchen-System II.F-4-b Zwei-Teilchen-Verteilung (BCS) CXVII .2-b Zwischenzustände III.E-1-b-β Zyklotronfrequenz EVI .1-a
Einige Fundamentalkonstanten der Physik Name
Zahlenwert
Vakuumlichtgeschwindigkeit c
2.99792458 × 108
Elementarladung e
1.60217733
× 10−19
SIEinheit
relative Standard abweichung (in 10−6 )
m/s
exakt
C
0.30
Ruhemasse des Elektrons m e
9.1093897
× 10−31
kg
0.59
Ruhemasse des Protons m p
1.6726231 × 10−27
kg
0.59
1.6749286
× 10−27
kg
0.59
1.8835327
× 10−28
kg
0.61
Ruhemasse des Neutrons m n Ruhemasse des Myons m μ Ruhemasse
Wasserstoff*
m(1 H)
1.007825035
u
0.011
Ruhemasse Deuterium* m(2 H)
2.014101779
u
0.012
Ruhemasse Helium* m(4 He)
4.00260324
u
0.012
C/kg
0.30
Spezifische Elektronenladung e/m e
1.75881962
Verhältnis Ruhemasse des Protons zur Ruhemasse des Elektrons m p /m e Elektrische Feldkonstante ε0
1.836152701 × 10
Magnetische Feldkonstante μ0
× 1011 3
8.85418781762 × 10−12 1.25663706143
× 10−6
× 10−34
0.020 F/m
exakt
H/m
exakt
Planck-Konstante h
6.6260755
Js
0.60
Compton-Wellenlänge des Elektrons λc,e
2.42631058 × 10−12
m
0.089
Avogadro-Konstante N A
6.0221367 × 1023
mol−1
0.59
J/K
1.8
m
0.045
m−1
0.00036
J/T
0.34
Boltzmann-Konstante k
1.3806508
× 10−23 × 10−11
Bohr-Radius a0
5.29177249
Rydberg-Konstante R ∞
1.0973731571 × 107
Magnetisches Moment des Elektrons μe Magnetisches Moment des Protons μp
9.2847701
× 10−24
1.41060761
× 10−26
J/T
0.34
Bohr-Magneton μB
9.2740154 × 10
−24
J/T
0.34
Kernmagneton μN
5.0507866 × 10−27
J/T
0.34
Feinstrukturkonstante α
1/137.0359895
* Masse in atomaren Masseeinheiten; 1 u = 1.6605402 × 10−27 kg
0.045
Koordinatensysteme Kartesische Koordinaten Definition U = U(x, y, z) A = A x ex + A y ey + A z ez A x = A x (x, y, z) A y = A y (x, y, z) A z = A z (x, y, z)
z ez M ey
ex
Gradient ∇U = (∂U/∂x)ex + (∂U/∂y)ey + (∂U/∂z)ez
z
O x y
Divergenz ∂A x ∂A y ∂A z ∇⋅A = + + ∂x ∂y ∂z Rotation ∇ × A = (∂A z /∂y − ∂A y /∂z)ex + (∂A x /∂z − ∂A z /∂x)ey + (∂A y /∂x − ∂A x /∂y)ez
y
x
Laplace-Operator ∂2 U ∂2 U ∂2 U ∆U = + + ∂x 2 ∂y2 ∂z2
Zylinderkoordinaten Definition U = U(ρ, φ, z) A = A ρ eρ + A φ eφ + A z ez A ρ = A x cos φ + A y sin φ A φ = −A x sin φ + A y cos φ
z ez eφ
M eρ O φ
Gradient (∇U)ρ = ∂U/∂ρ (∇U)φ = [∂U/∂φ]/ρ (∇U)z = ∂U/∂z
z ρ
Divergenz 1 ∂ 1 ∂A φ ∂A z ∇⋅A = (ρA ρ ) + + ρ ∂ρ ρ ∂φ ∂z Rotation (∇ × A)ρ = (∂A z /∂φ)/ρ − ∂A φ /∂z (∇ × A)φ = ∂A ρ /∂z − ∂A z /∂ρ (∇ × A)z = [∂(ρA φ )/∂ρ − ∂A ρ /∂φ]/ρ
y
x
Laplace-Operator ∂U 1 ∂2 U ∂2 U 1 ∂ + (ρ )+ 2 ∆U = ρ ∂ρ ∂ρ ρ ∂φ 2 ∂z2
Kugelkoordinaten Definition U = U(r, θ, φ) A = A r er + A θ eθ + A φ eφ A r = A ρ sin θ + A z cos θ A θ = A ρ cos θ − A z sin θ A φ = −A x sin φ + A y cos φ
z er eφ
M eθ
θ r
Gradient (∇U)r = ∂U/∂r (∇U)θ = [∂U/∂θ]/r (∇U)φ = [∂U/∂φ]/(r sin θ)
O φ y
x
Laplace-Operator 1 ∂ ∂U 1 ∂2 U 1 ∂2 (rU) + 2 (sin θ )+ ∆U = 2 2 r ∂r2 ∂θ r sin θ ∂θ r sin θ ∂φ 2 Divergenz 1 ∂ 2 1 1 ∂A φ ∂ ∇⋅A = 2 (r A r ) + (sin θA θ ) + r ∂r r sin θ ∂θ r sin θ ∂φ Rotation (∇ × A)r = [∂(sin θA φ )/∂θ − ∂A θ /∂φ]/(r sin θ) (∇ × A)θ = [∂A r /∂φ − sin θ∂(rA φ )/∂r]/(r sin θ) (∇ × A)φ = [∂(rA θ )/∂r − ∂A r /∂θ]/r
Einige nützliche Formeln U ein Skalarfeld, A, B, . . . ein Vektorfeld. ∇ × (∇U) = 0
∇ ⋅ (∇U) = ∆U
∇ ⋅ (∇ × A) = 0
∇ × (∇ × A) = ∇(∇ ⋅ A) − ∆A
ℏ r×∇ i r ∂ i ∇= r×L − r ∂r ℏr2 2 1 ∂ L2 ∆= r− 2 2 2 r ∂r ℏ r
L=
A × (B × C) = (A ⋅ C)B − (A ⋅ B)C A × (B × C) + B × (C × A) + C × (A × B) = 0 (A × B) ⋅ (C × D) = (A ⋅ C)(B ⋅ D) − (A ⋅ D)(B ⋅ C) (A × B) × (C × D) = [(A × B) ⋅ D]C − [(A × B) ⋅ C]D = [(C × D) ⋅ A]B − [(C × D) ⋅ B]A
∇(UV) = U∇V + V∇U ∆(UV) = U∆V + 2(∇U) ⋅ (∇V) + V∆U ∇ ⋅ (UA) = U∇ ⋅ A + A ⋅ ∇U ∇ × (UA) = U∇ × A + (∇U) × A ∇ ⋅ (A × B) = B ⋅ (∇ × A) − A ⋅ (∇ × B) ∇(A ⋅ B) = A × (∇ × B) + B × (∇ × A) + B ⋅ ∇A + A ⋅ ∇B ∇ × (A × B) = A(∇B) − B(∇ ⋅ A) + B ⋅ ∇A − A ⋅ ∇B Man beachte: B ⋅ ∇A ist ein Vektor, dessen Komponenten gegeben sind durch ∂ (B ⋅ ∇A)i = B j ∂ j A i = ∑ B j A i (i = x, y, z) ∂x j j