299 85 7MB
German Pages 686 [688] Year 2014
Christoph Strunk Moderne Thermodynamik De Gruyter Studium
Christoph Strunk
Moderne Thermodynamik Von einfachen Systemen zu Nanostrukturen
Physics and Astronomy Classification Scheme 2010 Primary: 51, 60, 65, 70; Secondary: 01.03.M, 05.70.-a, 05.30-d, 05.60.-k Autor Prof. Dr. Christoph Strunk Universität Regensburg Fakultät für Physik Universitätsstr. 31 93053 Regensburg [email protected] Titelbild: „Kritische Opaleszenz“ am kritischen Punkt von Schwefelhexafluorid, an dem der Unterschied zwischen Flüssigkeit und Dampf verschwindet. Eine halb gefüllte Flüssigkeitszelle wird von hinten beleuchtet. Obere Reihe von links nach rechts: Der Flüssigkeitsspiegel in der Zelle sinkt mit steigender Temperatur, weil mehr Gas in die Dampfphase übergeht. Oberhalb des kritischen Punkts ist der Flüssigkeitsspiegel plötzlich verschwunden. Mittlere und untere Reihe: Bei sinkender Temperatur und Annäherung an den kritischen Punkt tritt eine intensive Rotfärbung der sonst farblosen Substanz auf – ein Phänomen, das auf starke Dichtefluktuationen zurückzuführen ist, die das Licht stark streuen, ähnlich wie die Atmosphäre bei Sonnenuntergang. Bei Unterschreiten der kritischen Temperatur bilden sich überall in der Zelle kleinste Flüssigkeits- und Dampfbereiche, welche die Zelle undurchsichtig machen und die sich wegen des extrem kleinen Dichteunterschiedes nur sehr langsam voneinander trennen (Regen in Zeitlupe, Kapitel 9). ISBN 978-3-11-037105-5 e-ISBN (PDF) 978-3-11-037106-2 e-ISBN (ePUB) 978-3-11-039679-9 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/München/Boston Einbandabbildung: Jürgen Putzger, Regensburg Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Vorwort Was ist der Gegenstand der Thermodynamik? William Thomson (Lord Kelvin), einer ihrer Begründer, wollte mit diesem Wort zum Ausdruck bringen, dass es sich dabei um eine Vereinigung der Beschreibung thermischer und „dynamischer“ Phänomene handelt, wobei unter „Dynamik“ die Physik der Bewegungsvorgänge verstanden wurde. Sie stellt damit das erste Beispiel einer (für die Physik charakteristischen) Vereinheitlichung der Beschreibung zweier ursprünglich als grundverschieden angesehenen Gruppen von Phänomenen dar. Das Ziel dieses Buches ist es, das Potenzial der Thermodynamik für das Verständnis der modernen Physik herauszuarbeiten. Der Gegenstand der modernen Physik ist die Entschlüsselung der Eigenschaften der Materie. Lange Zeit war man der Ansicht, dass sich makroskopische Materiestücke im wesentlichen gemäß den Gesetzen der klassischen Physik verhalten und nur deren mikroskopisch kleinen Bausteine – die Atome und Moleküle – durch die ganz andersartige Quantentheorie beschrieben werden. Interessanterweise beschränkte sich der Erfolg der Quantentheorie von Anfang an nicht auf die Welt des mikroskopisch Kleinen. Im Gegenteil, die ersten Erfolge der Quantentheorie betrafen thermische Systeme, wie die thermische Strahlung und das Problem der thermischen Eigenschaften der Kristallgitter. Diese Tatsache zeigt, dass die Trennung zwischen einer klassischen Gesetzen gehorchenden makroskopischen Welt und einer den merkwürdigen Quantengesetzen folgenden Mikrowelt nicht haltbar ist. In der heutigen Forschung wird dies im Bereich der Physik der Nanostrukturen deutlich, welche zum Ziel hat, die Schnittstelle zwischen der Makro- und der Mikrowelt experimentell zu untersuchen. Damit stellt sich die Frage, welche Konzepte tauglich sind, um die anscheinend so widersprüchlichen Eigenschaften beider Welten in einem logisch konsistenten Rahmen zu beschreiben. Die meisten Lehrbücher der Thermodynamik folgen einem von zwei scheinbar entgegengesetzten Pfaden – entweder wird die Thermodynamik aus der Phänomenologie abgeleitet und erscheint als eine Methode der reinen Verpackung experimenteller Beobachtungen, ohne zu versuchen diese zu erklären – oder es werden von vornherein Modelle zur Erklärung der thermischen Phänomene betrachtet. Im Rahmen der Modelle erscheinen die thermischen Eigenschaften der Materie als „emergente“ Phänomene, die nur im Zusammenspiel vieler Teilchen möglich sind, wobei das einzelne Teilchen stets den Gesetzen der Mechanik beziehungsweise der Quantenmechanik folgt und die Temperatur dabei keine Rolle spielt. Mit diesem Buch möchte ich eine Brücke zwischen diesen Extremen schlagen und darstellen, wie sich das Beschreibungsverfahren der makroskopischen Thermodynamik (kombiniert mit der Quantentheorie) weit über die von Kelvin beabsichtigte Vereinigung vom Wärmelehre und Mechanik hinaus zur Grundlage großer Bereiche der modernen Physik ausbauen lässt.
vi | Vorwort Nach meiner Erfahrung stellt die Thermodynamik eine im Grundstudium nicht leicht zu motivierende Disziplin der Physik dar. Das liegt wohl zum einen daran, dass sie in der Schule wenig Gewicht hat und oft mehr als eine statistische Variante der klassischen Mechanik präsentiert wird. Zum anderen erfordert es einen gewissen Überblick über die Physik, um die Allgemeinheit und die Brückenfunktionen der thermodynamischen Begriffe und Konzepte wertzuschätzen. Dieser Überblick stellt sich naturgemäß erst im Laufe des Studiums ein. Aus diesem Grund habe ich dieses Buch von vornherein nicht nur als einen auf die Begleitung eines Semesters hin ausgerichteten ’Text’, sondern auch als Referenz für einen mehrere Semester umfassenden Studienabschnitt konzipiert. Ein weiteres Ziel des Buches ist es, einen Zusammenhang zwischen den Inhalten verschiedener Standard-Vorlesungen wie der Wärmelehre, der Festkörperphysik und der Quantenstatistik herzustellen und auch Fragen aufzuwerfen, die in der Regel erst in der Rückschau auf mehrere Vorlesungen auftreten. Der Umfang und die ungewöhnliche Stoffauswahl des Buches rechtfertigen sich unter anderem durch das Ziel, zur Weiterentwicklung der Lehrtradition beizutragen, indem die Erkenntnisse und die Anwendungen der Thermodynamik in der modernen Physik bis hin zur aktuellen Forschung von vornherein berücksichtigt werden. Neben den Grundlagen wird eine Vielzahl von Beispielen behandelt. An mathematischen Voraussetzungen ist die Kenntnis der Differenzialrechnung von Funktionen mit mehreren Veränderlichen hilfreich (insbesondere der Begriff des totalen Differenzials). Von den physikalischen Kenntnissen her wendet sich das Buch an Studierende ab dem dritten Semester, die bereits mit den Konzepten der Mechanik und Elektrodynamik vertraut sind, und über elementare Kenntnisse der Quantenmechanik verfügen (es werden im wesentlichen die Energie-Eigenwerte der Modellsysteme „Spin“, „Rotator“, „Oszillator“ und „freies Teilchen“ benutzt). Zur experimentellen Illustration der Quantenstatistik erweisen sich Festkörper und die Quantenflüssigkeiten 3 He und 4 He als besonders geeignet, die überdies zur Erzeugung tiefer Temperaturen von großer praktischer Bedeutung sind. Zahlreiche Übungsaufgaben erleichtern die Verarbeitung des Stoffes. Die erste Auflage eines Lehrbuches ist schwerlich frei von Fehlern. Für Hinweise auf solche Fehler und Anmerkungen zum Konzept bin ich dankbar (email: [email protected]); Korrekturen werden auf meiner Webseite veröffentlicht (www.physik.ur.de/forschung/strunk/). Regensburg, im September 2014
Christoph Strunk
Inhalt Vorwort
v
Bezeichnungen Die Strategie des Buches
xiv xv
Stoffauswahl für eine Einführungsvorlesung
xix
Teil I TThermodynamik in der Makrowelt
1
1
Wie beschreibt man physikalische Systeme?
2
1.1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2
Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.3
Bilanzen und Erhaltungssätze . . . . . . . . . . . . . . . . . . . . . . . .
15
1.4
Einfache Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
1.5
Extensive und intensive Größen . . . . . . . . . . . . . . . . . . . . . . .
28
1.6
Die Gibbs’sche Fundamentalform . . . . . . . . . . . . . . . . . . . . . .
31
1.7
Elektrisches Gleichgewicht . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2
Thermische Systeme
45
2.1
Energie, Entropie und Temperatur . . . . . . . . . . . . . . . . . . . . . .
45
2.2
Empirische und absolute Temperaturen . . . . . . . . . . . . . . . . . . .
49
2.3
Das System „heißer Körper“ . . . . . . . . . . . . . . . . . . . . . . . . .
52
2.4
Der zweite Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
2.5
Der dritte Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
2.6
Transportphänomene und Entropieerzeugung . . . . . . . . . . . . . . .
62
2.7
Die Messung der Temperatur . . . . . . . . . . . . . . . . . . . . . . . . .
66
2.8
Die Messung der Wärmekapazität und der Entropie . . . . . . . . . . . .
67
viii | INHALT 2.9
Entropieerzeugung durch irreversiblen Temperaturausgleich . . . . . . .
70
2.10 Wärmestrom und Wärmeleitung . . . . . . . . . . . . . . . . . . . . . . .
74
3
Ideale Gase
82
3.1
Stoffmenge und chemisches Potenzial . . . . . . . . . . . . . . . . . . . .
82
3.2
Thermodynamische Beschreibung von Gasen . . . . . . . . . . . . . . .
87
3.3
Die thermische Zustandsgleichung . . . . . . . . . . . . . . . . . . . . .
89
3.4
Die kalorische Zustandsgleichung . . . . . . . . . . . . . . . . . . . . . .
92
3.5
Die Maxwell-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
3.6
Erwärmung und Abkühlung – Wärmekapazitäten . . . . . . . . . . . . . 100
3.7
Der Gleichverteilungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . .
103
3.8
Expansion und Kompression – Kompressibilitäten . . . . . . . . . . . . .
107
4
Maschinen
118
4.1
Die Kopplung verschiedener Energie-Transportprozesse . . . . . . . . . .
118
4.2
Das Carnot’sche Prinzip . . . . . . . . . . . . . . . . . . . . . . . . . . .
121
4.3
Unvollkommene Maschinen – Irreversibilität . . . . . . . . . . . . . . . .
127
4.4
Unzerlegbare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . .
127
4.5
Wärme und Arbeit – der Carnot’sche Kreisprozess . . . . . . . . . . . .
132
4.6
Thermische Maschinen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
136
4.7
Der Stirling-Motor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
138
4.8
Der historische Weg zur Entropie . . . . . . . . . . . . . . . . . . . . . .
140
5
Thermodynamische Potenziale
144
5.1 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5
Weitere Massieu-Gibbs-Funktionen . . . Die freie Energie . . . . . . . . . . . . . . Die Enthalpie . . . . . . . . . . . . . . . Die freie Enthalpie . . . . . . . . . . . . Die Energie im externen Magnetfeld . . . Die freie Energie im externen Magnetfeld
. . . . . .
144 145 148 149 150 152
5.2
Maxwell-Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
152
5.3
Die Messung der absoluten Temperatur . . . . . . . . . . . . . . . . . . .
155
5.4
Homogenität der Massieu-Gibbs-Funktionen . . . . . . . . . . . . . . . 160
5.5
Entropieartige Massieu-Gibbs-Funktionen . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
165
| ix
INHALT
5.6
Drei Ebenen der Systembeschreibung . . . . . . . . . . . . . . . . . . . .
167
6
Mehr über ideale Gase
174
6.1
Die Entropie eines idealen Gases . . . . . . . . . . . . . . . . . . . . . . .
174
6.2
Freie Energie und chemisches Potenzial . . . . . . . . . . . . . . . . . . . 180
6.3
Die Teilchenkapazität ∂n(T, μ)/∂μ . . . . . . . . . . . . . . . . . . . . . .
183
6.4
Das ideale Gas in Entropiedarstellung . . . . . . . . . . . . . . . . . . . .
184
7
Zusammengesetzte Systeme und Gleichgewichte
188
7.1
Was ist eigentlich ein System? . . . . . . . . . . . . . . . . . . . . . . . .
188
7.2
System-Zerlegung und System-Zusammensetzung . . . . . . . . . . . . .
192
7.3
Gleichgewicht und Stabilität . . . . . . . . . . . . . . . . . . . . . . . . .
195
7.4
Mischungsentropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
7.5
Ideale Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
7.6
Der osmotische Druck . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
210
7.7 7.7.1 7.7.2 7.7.3
Chemische Reaktionen . . . . . . . . . . . . Das Massenwirkungsgesetz . . . . . . . . . . Reaktionswärmen . . . . . . . . . . . . . . . Die Absolutwerte des chemischen Potenzials
. . . .
212 212 218 224
7.8
Der dritte Hauptsatz in der physikalischen Chemie . . . . . . . . . . . . .
226
8
Transportphänomene
234
8.1
Transport durch bewegliche Teilchen . . . . . . . . . . . . . . . . . . . .
234
8.2
Mittlere freie Weglänge . . . . . . . . . . . . . . . . . . . . . . . . . . . .
237
8.3
Diffusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
239
8.4 8.4.1 8.4.2 8.4.3 8.4.4
Diffusion und Diffusionsgleichgewichte in äußeren Feldern Thermodynamik im äußeren Kraftfeld . . . . . . . . . . . . Die Einstein-Relation . . . . . . . . . . . . . . . . . . . . Die barometrische Höhenformel . . . . . . . . . . . . . . . Abschirmung elektrischer Felder . . . . . . . . . . . . . .
241 241 243 245 247
8.5
Impulstransport und Viskosität . . . . . . . . . . . . . . . . . . . . . . . 250
8.6
Entropietransport und Wärmeleitfähigkeit . . . . . . . . . . . . . . . . .
253
8.7
Effusion aus kleinen Öffnungen . . . . . . . . . . . . . . . . . . . . . . .
255
8.8
Teilchendiffusion durch dünne Kapillaren . . . . . . . . . . . . . . . . .
257
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . . .
x | INHALT 8.9
Thermoelektrizität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
8.10 Kritik des Drift-Diffusionsmodells . . . . . . . . . . . . . . . . . . . . . . 266 8.11
Die Matrix der Transportkoeffizienten . . . . . . . . . . . . . . . . . . . . 268
8.12
Entropieproduktion durch Ströme . . . . . . . . . . . . . . . . . . . . . .
270
9
Reale Systeme
276
9.1
Phasen und Phasenübergänge . . . . . . . . . . . . . . . . . . . . . . . .
276
9.2
Verdampfen und Kondensieren . . . . . . . . . . . . . . . . . . . . . . .
278
9.3 9.3.1 9.3.2 9.3.3 9.3.4 9.3.5 9.3.6
Phasengleichgewichte . . . . . . . . . . . . . . . . . Die Gleichung von Clausius und Clapeyron . . . . . . Verdunsten und Sieden . . . . . . . . . . . . . . . . . Siedepunkterhöhung und Gefrierpunktserniedrigung Der Tripelpunkt . . . . . . . . . . . . . . . . . . . . . Experimente zur chemischen Konstante . . . . . . . . Der Dampfdruck über realen Mischungen . . . . . . .
9.4
Instabilitäten in realen Mischungen . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. 281 . 281 . 285 . 285 . 286 . 287 . 288 291
9.5 Das reale Gas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 9.5.1 Die van der Waals’sche Zustandsgleichung . . . . . . . . . . . . . . . . 296 9.5.2 Die Joule-Thomson Expansion . . . . . . . . . . . . . . . . . . . . . . . 298 9.6 Der Phasenübergang im van der Waals-Modell . . . . . . . . . . . . . . 304 9.6.1 Freie Energie und das chemische Potenzial . . . . . . . . . . . . . . . . . 304 9.6.2 Der kritische Punkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
Teil II Statistische Thermodynamik
317
10
Thermodynamik von Spin-1/2-Systemen
318
10.1
Quantenzustände und chemische Spezies . . . . . . . . . . . . . . . . .
318
10.2 Zufallsgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
323
10.3 Zustände und Zufallsgrößen des Spin-1/2-Systems . . . . . . . . . . . . .
329
10.4 Chemisches Gleichgewicht im Spin-1/2-System . . . . . . . . . . . . . . . 330 10.5 Der ideale Spin- 1/2-Paramagnet . . . . . . . . . . . . . . . . . . . . . . .
334
10.6 Thermische Schwankungen . . . . . . . . . . . . . . . . . . . . . . . . .
342
10.7 Ferromagnetismus in der Molekularfeld-Näherung . . . . . . . . . . . . 346 11
Einfache Quantensysteme
358
| ix
INHALT
11.1
Die Boltzmann-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2
Das allgemeine Zwei-Niveau-System - Gläser . . . . . . . . . . . . . . . . 364
11.3
Polymere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
11.4
Der harmonische Oszillator . . . . . . . . . . . . . . . . . . . . . . . . . .
372
11.5
Rotationsanregungen von Molekülen . . . . . . . . . . . . . . . . . . . .
377
11.6
Innere Freiheitsgrade von Atomen . . . . . . . . . . . . . . . . . . . . . .
385
11.7
Zerlegung idealer Gase in Teilsysteme . . . . . . . . . . . . . . . . . . . . 389
11.8
Zusammengesetzte Quantensysteme . . . . . . . . . . . . . . . . . . . .
11.9
Die Translationsfreiheitsgrade eines idealen Gases . . . . . . . . . . . . 394
11.10 Das „klassische“ ideale Gas . . . . . . . . . . . . . . . . . . . . . . . . .
358
391
397
11.11 Der dritte Hauptsatz in der Quantenphysik . . . . . . . . . . . . . . . . . 402 11.12 Kanonische oder Mikrokanonische Verteilung? . . . . . . . . . . . . . . . 405 12
Ideale Gase bei tiefen Temperaturen
411
12.1
Fermionen und Bosonen . . . . . . . . . . . . . . . . . . . . . . . . . . .
411
12.2
Die Gibbs’sche Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . .
417
12.3
Elementare Bose- und Fermi-Systeme . . . . . . . . . . . . . . . . . . . .
422
12.4
Transport durch elementare Fermi- oder Bose-Systeme . . . . . . . . . . 430
12.5
Der „klassische“ Grenzfall . . . . . . . . . . . . . . . . . . . . . . . . . .
433
12.6
Vergleich von Bose- und Fermi-Gasen . . . . . . . . . . . . . . . . . . .
435
12.7
Ensembles in der statistischen Physik . . . . . . . . . . . . . . . . . . . . 439
13
Bose-Systeme
13.1 13.1.1 13.1.2 13.1.3
Photonen – thermische Strahlung . . . . . . . Zustandsdichte . . . . . . . . . . . . . . . . . Thermische Eigenschaften des Photonengases Energietransfer durch thermische Strahlung .
445 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
445 445 446 450
13.2 Phononen im Debye-Modell . . . . . . . . . . . . . . . . . . 13.2.1 Debye-Näherung der Zustandsdichte . . . . . . . . . . . . . 13.2.2 Thermische Eigenschaften des Phononensystems . . . . . . 13.2.3 Thermische Ausdehnung von Festkörpern - Phononendruck 13.2.4 Wärmeleitfähigkeit durch Phononen . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
454 456 458 463 469
13.3 Massive Bose-Gase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.1 Die Bose-Einstein Kondensation . . . . . . . . . . . . . . . . . . . . . .
471 471
xii | INHALT 13.3.2 Experimente zur Bose-Einstein-Kondensation . . . . . . . . . . . . . . . 4
13.4 Quasiteilchen in suprafluidem He . . . 13.4.1 Die Suprafluidität von 4 He . . . . . . . . 13.4.2 Dispersionsrelation und Wärmekapazität 13.4.3 Der Fontänen-Effekt . . . . . . . . . . . . 13.4.4 Die Trägheit des Quasiteilchen-Systems .
. . . . .
. . . . .
. . . . .
. . . . .
14
Fermi-Systeme
14.1 14.1.1 14.1.2 14.1.3 14.1.4 14.1.5
Das ideale Fermi-Gas – Elektronen in Metallen . Dispersionsrelationen – die Bandstruktur . . . Zustandsgleichungen . . . . . . . . . . . . . . . Der Grundzustand: Fermi-Entartung . . . . . . Abschirmung im entarteten Fermi-Gas . . . . . Kontaktspannungen . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
476 479 480 482 485 487 497
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. 507 . 507 . 509 . 511 . 515 . 516
14.3 Fermi-Flüssigkeiten . . . . . . . . . . . . . . . . 14.3.1 Landaus Fermi-Flüssigkeit . . . . . . . . . . . . 14.3.2 Flüssiges 3 He . . . . . . . . . . . . . . . . . . . 14.3.3 Verfestigung von 3 He – Pomeranchuk-Kühlung 14.3.4 Lösungen von 3 He in 4 He . . . . . . . . . . . . . 14.3.5 Der 3 He-4 He-Mischkryostat . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. 518 . 518 . 521 . 524 . 526 . 530
14.4 Transport in Fermi-Systemen . . . . . . . . . . . . . . . . . . . 14.4.1 Ströme im Nichtgleichgewicht . . . . . . . . . . . . . . . . . . . 14.4.2 Ladungstransport – elektrische Leitfähigkeit . . . . . . . . . . . 14.4.3 Ladungstransport – Thermokraft . . . . . . . . . . . . . . . . . 14.4.4 Entropietransport – Peltier-Koeffizient und Wärmeleitfähigkeit
. . . . .
. . . . .
. . . . .
. . . . .
. 532 . 532 . 538 . 540 . 546
14.5 Halbleiter . . . . . . . . . . . . . . . . . . 14.5.1 Quasiteilchen in intrinsischen Halbleitern 14.5.2 Dotierung und Leitfähigkeit . . . . . . . . 14.5.3 Thermoelektrizität in Halbleitern . . . . . 14.5.4 Halbleiter-Grenzflächen . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. 548 . 548 . 552 . 556 . 558
14.2 Thermische Eigenschaften des Fermi-Gases 14.2.1 Sommerfeld-Entwicklung . . . . . . . . . . 14.2.2 Thermische Zustandsgleichung . . . . . . . 14.2.3 Kalorische Zustandsgleichung . . . . . . . . 14.2.4 Thermische Ausdehnung . . . . . . . . . . . 14.2.5 Pauli-Suszeptibilität . . . . . . . . . . . . .
. . . . .
. . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
497 497 499 499 503 505
14.6 Quasiteilchen in supraleitenden Metallen . . . . . . . . . . . . . . . . . . 567 14.6.1 Supraleitende Phänomene . . . . . . . . . . . . . . . . . . . . . . . . . . 568 14.6.2 Thermodynamische Eigenschaften . . . . . . . . . . . . . . . . . . . . . 571
| xiii
INHALT
14.6.3 BCS-Theorie und Bogoliubov-Quasiteilchen . . . . . . . . . . . . . . . . 15
Quasiteilchen in reduzierten Dimensionen
574 588
15.1 Zweidimensionale Elektronensysteme . . . . . . . . . . . . . . . . . . . . 588 15.1.1 Halbleiter-Heterostrukturen . . . . . . . . . . . . . . . . . . . . . . . . . 588 15.1.2 Elektronische Struktur von Quantentrögen . . . . . . . . . . . . . . . . . 590 15.2 Tunnelkontakte und Punktkontakte . . . . . . . . . . . . . . . . . . . . . 15.2.1 Tunnelkontakte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.2 Punktkontakte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
591 592 595
15.3 15.3.1 15.3.2 15.3.3 15.3.4
Quasi-eindimensionale Leiter . . . . . . . . . . . . . Elektrischer Transport durch Quanten-Punktkontakte Entropietransport durch Quanten-Punktkontakte . . Phononen in reduzierten Dimensionen . . . . . . . . Diffusive Quantendrähte . . . . . . . . . . . . . . . .
596 599 605 607 611
A
Differenzialrechnung im Rn
620
B
Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten
622
C
Nützliche Integrale
627
D
Legendre-Transformation
629
E
Das Zwei-Körper-System aus thermodynamischer Sicht
634
F
Magnetische Felder in Materie
639
G
Charakteristische Funktionen in der Statistik
643
H
Die Boltzmann-Gleichung
647
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Literaturverzeichnis
650
Stichwortverzeichnis
653
Bezeichnungen In dieser Darstellung werden extensive Größen meist mit Großbuchstaben bezeichnet, die Dichten extensiver Größen mit Kleinbuchstaben, und Größen pro Teilchen (molare Größen) durch Buchstaben mit einem „Hut“. Größe X E Energie P Impuls L Drehimpuls M Masse Q elektrische Ladung N Teilchenzahl/Stoffmenge V Volumen S Entropie pel
elektrisches Dipolmoment
m
magnetisches Dipolmoment
x
X-Dichte
x ˆ
X pro Teilchen (Mol)
e p m q n – s
Energiedichte Impulsdichte Drehimpulsdichte Massendichte Ladungsdichte Teilchendichte
eˆ ˆ p ˆ m ˆ qˆ – vˆ sˆ
Energie pro Teilchen Impuls pro Teilchen Drehimpuls pro Teilchen Masse pro Teilchen Ladung pro Teilchen
P el M
Entropiedichte elektrische Polarisation
ˆ el p
elektrisches Dipolmoment pro Teilchen
Magnetisierung
ˆ m
magnetisches Dipolmoment pro Teilchen
intensive Größe v Ω φG φ μ −F −p T E ext B ext
Volumen pro Teilchen Entropie pro Teilchen
Geschwindigkeit Winkelgeschwindigkeit Gravitationspotenzial elektrisches Potenzial chemisches Potenzial Kraft Druck Temperatur externes elektrisches Feld externes Magnetfeld
konjugierte P L M Q N R oder x V S pel m
extensive Größe Impuls Drehimpuls Masse elektrische Ladung Teilchenzahl Verschiebung Volumen Entropie elektrisches Dipolmoment magnetisches Dipolmoment
Fundamentale Relationen: dE = T dS − p dV + μ dN E = T S − p V + μN 0 = −S dT + V dp − N dμ
Gibbs’sche Fundamentalform Homogenitätsrelation (Euler-Gleichung) Gibbs-Duhem Relation
dμ = −ˆ s dT + vˆ dp μ = eˆ − T sˆ + p vˆ
chemisches Potenzial
Vertiefungsthema, kann beim ersten Lesen übergangen werden Merksatz oder wichtige Formel
Übung
Die Strategie des Buches Der Startpunkt dieses Buches ist die Tatsache, dass die grundlegende Idee des thermodynamischen Beschreibungsverfahrens nicht auf thermische Systeme beschränkt ist, sondern sich auch auf nicht-thermische Systeme anwenden lässt. Dies wird dadurch illustriert, dass die Konstruktionsprinzipien der Thermodynamik zunächst anhand von nicht-thermischen Beispielen dargestellt werden. Auf diese Weise wird ein neuartiges Beschreibungsverfahren am Beispiel wohlvertrauter Systeme aus der Mechanik und Elektrizitätslehre eingeführt und erst im zweiten Schritt auf die weniger vertrauten thermischen Systeme angewandt. Die in diesem Buch verwendete interdisziplinäre Darstellung der Physik geht davon aus, dass es in den verschiedenen Teilbereichen der Physik ein gemeinsames Grundmotiv gibt, welches zur Grundlage einer einheitlichen Beschreibung gemacht werden kann. Dieses Grundmotiv besteht darin, dass sich eine zentrale Klasse von physikalischen Prozessen als Transport oder Strom von gewissen physikalischen Größen X auffassen lässt. Zu diesen Größen gehören unter anderen die Stoffmenge, der Impuls, die elektrische Ladung, die Energie oder die Entropie. Ändert sich die in einem System enthaltene Menge von X , so muss diese entweder zu- oder abgeflossen sein, oder aber erzeugt beziehungsweise vernichtet worden sein. Die Größen X , die solche Bilanzierungsoperationen erlauben, werden wir mengenartig oder bilanzierbar nennen. Bei Erhaltungsgrößen fällt die Alternative der Erzeugung und Vernichtung weg. Beispiele für Erzeugung und Vernichtung von Stoffen sind chemische Reaktionen aller Art und die Erzeugung von Entropie bei Reibungsphänomenen aller Art. Der Transport einer Größe X ist stets mit dem Transport von Energie verbunden, wobei für jede Größe X eine konjugierte Größe ξ (beispielsweise für den Impuls die Geschwindigkeit und für die Ladung das elektrostatische Potenzial) existiert, welche angibt, wie stark der X -Strom mit Energie „beladen“ ist. Jedes physikalische System verfügt über eine gewisse Zahl von unabhängigen „Kanälen“, welche mit einem wohlbestimmten Paar von Größen X, ξ verknüpft sind und über die dem System Energie zu- oder abgeführt werden kann. Zahlreiche aktuelle Darstellungen der Thermodynamik benutzen die Boltzmann’sche Formel S = kB ln Ω zur Definition der Entropie und bauen alles Folgende auf dieser Definition auf. Dies hat den Vorteil, dass man damit auf direkte Weise eines der thermodynamischen Potenziale in die Hand bekommen und damit Thermodynamik treiben kann. Allerdings gilt die Boltzmann’sche Formel nur für Zustände im Gleichgewicht. Eine Beschränkung der Entropie allein auf GleichgewichtsSituationen muss aber zu dem Schluss führen, dass auch die Thermodynamik an sich nur für Zustände im Gleichgewicht Bedeutung hat und dass ihr die Grundlage für die Behandlung von Nicht-Gleichgewichts-Phänomenen fehlt. Selbst ein so alltägliches Phänomen wie die Abkühlung einer Kaffeetasse auf dem Frühstückstisch würde sich damit einer thermodynamischen Beschreibung entziehen. Dies wirkt überaus künst-
xvi | Die Strategie des Buches lich und kontrastiert außerdem mit der Existenz einer „Thermodynamik der irreversiblen Prozesse“, welche eben diese Nicht-Gleichgewichts-Phänomene sehr erfolgreich beschreibt. Aus diesem Widerspruch kann man nur schließen, dass die Anwendbarkeit des Konzepts der Entropie den Gültigkeitsbereich der Boltzmann’schen Formel offenbar weit überschreitet. Aus diesen Gründen habe ich mich in der vorliegenden Darstellung entschieden, die Entropie als eine der elektrischen Ladung, dem Impuls und der Energie vergleichbare fundamentale Größe von Anfang an einzuführen. Auch in der Elektrizitätslehre wird uns gleich am Anfang zugemutet, dass eine effektive Beschreibung elektrischer Phänomene nur durch die Einführung einer neuen physikalischen Größe – nämlich der elektrischen Ladung – möglich ist, für die wir zunächst keine Anschauung haben und die sich nicht auf bekannte (mechanische) Größen zurückführen lässt. Die Entropie hat eine ebenso grundlegende Bedeutung wie die Energie, die elektrische Ladung oder der Impuls. Sie ist von den Modellen, die zu ihrer Berechnung im Rahmen der statistischen Physik verwendet werden, konzeptionell unabhängig. Auf der Basis dieser Einsicht ist es möglich, die häufig anzutreffende, aber unnatürliche Trennung zwischen der Thermodynamik im Gleichgewicht und der irreversiblen Thermodynamik der Transportprozesse zu vermeiden und beide in einem einheitlichen Begriffssystem zu formulieren. Die im letzten Kapitel vorgestellten Beispiele aus dem Bereich der Nanostrukturphysik zeigen, dass sich die thermodynamischen Konzepte auch im Bereich extremen Nichtgleichgewichts bewähren, solange man das Gesamtsystem in geeignete Teilsysteme zerlegen kann, welche in sich – aber nicht untereinander – im Gleichgewicht sind. Da die thermischen Phänomene in unserer Welt allgegenwärtig sind, ist die Entropie ein unverzichtbarer und extrem erfolgreicher Begriff. Es wird gezeigt, dass die Entropie (mit Ausnahme der Erhaltung) ähnlichen Regeln wie der Impuls oder die elektrische Ladung genügt und mit einer analogen Anschauung versehen werden kann. Andererseits liefert die Erzeugbarkeit der Entropie den Schlüssel für die ausgezeichnete Richtung bei der Einstellung von Gleichgewichten – auch im Bereich der Mechanik und Elektrodynamik. Das Musterbeispiel für ein thermodynamisches System ist das ideale Gas. Es ist in der Physik deshalb von großer Bedeutung, weil es den Prototyp des quantenmechanischen Vielteilchenproblems darstellt. Die an Gasen entwickelten Konzepte lassen sich auf weite Bereiche der kondensierten Materie übertragen und bilden damit einen zentralen Baustein für das Verständnis der modernen Physik. Der Modellcharakter und die Unzulänglichkeiten der kinetischen Gastheorie bilden die Motivation für eine konsequent quantenmechanische Beschreibung von Gasen, Festkörpern und Quantenflüssigkeiten im zweiten Teil des Buches. Die notwendige Anpassung des durch die klassische Anschauung suggerierten Teilchenbegriffs an die quantenphysikalische Wirklichkeit bleibt nicht der Intuition des Lernenden überlassen, sondern es wird auseinandergesetzt, welche gravierenden Veränderungen dieser scheinbar so intuitive Begriff durch die Quantenmechanik und die Thermodynamik erfahren hat. Das Resultat dieser Analyse ist das Konzept der „elementaren
Die Strategie des Buches | xvii
Bose- und Fermi-Systeme“, welche an Stelle der „Teilchen“ die Rolle der elementaren Teilsysteme eines Gases übernehmen. Diese stellen eine didaktisch-konzeptionelle Neuerung dar, die es erlaubt, Quantenfelder in einfache Teilsysteme zu zerlegen, auf welche die allgemeinen Regeln der Thermodynamik anwendbar sind. Sie erlauben einen bruchlosen Übergang von der Beschreibung makroskopischer Systeme zu dem im letzten Kapitel dargestellten Quantentransport durch Nanostrukturen. „Teilchen“ sind in dieser Terminologie keine Systeme vom Typ eines „freien Körpers“, sondern die Anregungs-Quanten der aus den elementaren Bose- und Fermi-Systemen aufgebauten Quantenfelder. Ich versuche, die durch die moderne Physik erzwungenen Änderungen unserer Anschauung bewusst zu machen und anhand zahlreicher Beispiele experimentell zu illustrieren. Es wird aufgezeigt, wie auf der Basis der engen begrifflichen Verwandtschaft zwischen chemischen Reaktionen und Quantenübergängen ein intuitives Verständnis für die statistische Thermodynamik möglich wird. Damit entsteht ein einheitlicher konzeptioneller Rahmen, der in der Lage ist, sowohl die grundlegenden thermodynamischen Phänomene in der Physik, Chemie und Biologie als auch moderne Experimente vom Elektronentransport in Nanostrukturen bis hin zur Physik ultrakalter Atomgase begrifflich korrekt zu erfassen.
Stoffauswahl für eine Einführungsvorlesung Ein Buch und eine Vorlesung sind unterschiedliche Medien zur Vermittlung eines Lehrstoffs. Ein Buch bietet ein Forum für die differenzierte Darstellung eines komplexen Themas; es erlaubt Blättern sowie Quer- und Rückverweise, bei denen die Leser wählen können, ob sie diesen folgen oder sich lieber auf das aktuelle Thema konzentrieren möchten. In einer Vorlesung dagegen muss man sich jedoch für eine bestimmte Abfolge der Themen entscheiden – sie sollte neben einer ersten Einführung in den Stoff aber auch die Motivation für das Lesen von Büchern liefern. Die Grundlagen der statistischen Thermodynamik enthalten einen subtilen Übergang von klassischen zu quantenmechanischen Modellvorstellungen, deren Diskussion und Reflexion einigen Raum benötigt. Diesen Raum bietet nur ein Buch. Eine angemessene Diskussion hat einen Umfang, der den Einstieg in die Grundlagen der Thermodynamik unterbrechen und mit vielen theoretischen Überlegungen belasten würde. Deshalb – aber auch um die Unabhängigkeit der Thermodynamik von mikroskopischen Modellvorstellungen zu demonstrieren – habe ich die Modelle im ersten Teil des Buches auf ein Minimum an kinetischer Gastheorie beschränkt und beginne erst im zweiten Teil eine systematische Diskussion der Grundlagen der statistischen Thermodynamik und ihrer Anwendungen zur Erklärung der im ersten Teil vorgestellten Phänomenologie. Dies hat den Vorteil, dass die Kapitel 2–4 des Buches auch als Grundlage für eine Kurzversion der Wärmelehre dienen können, die an vielen Fakultäten in das erste Semester integriert ist. Für diesen Zweck sind auch die zahlreichen Analogien zwischen der Mechanik und der Thermodynamik nützlich. Darüber hinaus kann der erste Teil des Buches auch für Studierende des Lehramts von Nutzen sein, weil er sich mehr auf den Stoff beschränkt, der in elementarisierter Form für die Schule relevant ist. Im zweiten Teil komme ich dann auf viele Themen des ersten Teils zurück, für deren tieferes Verständnis dann erst der Rahmen vorhanden ist. Lernen erfordert in der Regel mehrere Durchgänge durch ein komplexes Thema. Auch in einer vierstündigen Einführungsvorlesung im vierten Semester muss man natürlich eine Auswahl treffen. Diese wird immer auch von persönlichen Vorlieben geprägt sein. Zentrale Merksätze und Formeln sind mit dem Symbol gekennzeichnet. Diejenigen Abschnitte, die für eine Einführungsvorlesung entbehrlich sind, habe ich mit dem Symbol markiert. Die Zeit ist knapp, aber auch im Rahmen einer Einführung kann man heute nicht mehr auf die Grundbegriffe der statistischen Thermodynamik verzichten. Für meine Einführungsvorlesung beschränke ich mich auf Teile der Kapitel 10 und 11. Dieser Aufbau passt gut zu den in Regensburg parallel laufenden Vorlesungen in der Quantenphysik und erlaubt zahlreiche Querbezüge zwischen der Thermodynamik einerseits und der Atom- und Molekülphysik andererseits, welche auch die historische Entwicklung in den zwanziger und dreißiger Jahren des letzten Jahrhunderts geprägt haben.
xx | Stoffauswahl für eine Einführungsvorlesung Insgesamt habe ich versucht herauszuarbeiten, dass die meisten Konzepte des ersten Teils (zumindest implizit) integrale Bestandteile der im zweiten Teil vorgestellten mikroskopischen Modelle sind. Einige Beispiele im ersten und zahlreiche im zweiten Teil des Buches werden weiterführenden Vorlesungen oder dem Selbststudium vorbehalten bleiben. In ihrer Gesamtheit illustrieren sie aber den Facettenreichtum der Thermodynamik und die Kraft der thermodynamischen Begriffe.
| Teil I: Thermodynamik in der Makrowelt –
Physikalische Systeme
1 Wie beschreibt man physikalische Systeme? In diesem Kapitel werden in der gesamten Physik anwendbare Grundbegriffe des thermodynamischen Beschreibungsverfahrens – System, Größe, Zustand und Prozess – zunächst für nicht-thermische Systeme eingeführt. Ein System im Sinne der Thermodynamik stellt ein mehr oder weniger präzises gedankliches Abbild der physikalischen Wirklichkeit dar, welches sich auf bestimmte, im Rahmen einer vorgegebenen Fragestellung relevante Aspekte der Wirklichkeit beschränkt, die quantitativ beschrieben werden können. Zur Illustration dienen eine Reihe von „archetypischen“ Systemen, die in der gesamten Physik ständig verwendet werden.1 Es zeigt sich, dass zur Beschreibung der verschiedenen Arten des Energietransfers zwischen physikalischen Systemen jeweils ein Paar von zwei fundamental verschiedenen physikalischen Größen erforderlich ist, von denen eine von der Größe des Systems abhängt (extensive Größen), die andere dagegen nicht (intensive Größen). Differenzen der intensiven Größen bilden den Antrieb zur Änderung der extensiven Größen und damit auch den Antrieb für den Energietransport zwischen verschiedenen Systemen. Am Beispiel elektrischer Systeme wird der fundamentale Begriff des Gleichgewichts erklärt und mit dem Minimum-Prinzip der Energie verknüpft. Gleichzeitig wird gezeigt, dass Letzteres nicht ausreicht, um die Richtung der Einstellung von Gleichgewichten festzulegen, weil die Minimierung der Energie eines Systems aufgrund der Energieerhaltung stets die Zunahme der Energie eines anderen Systems erfordert.
1.1 Einleitung Der traditionelle Gegenstand der Thermodynamik ist die Beschreibung der Materie unter „irdischen Bedingungen“, das heißt insbesondere bei endlichen Temperaturen T . Diese Beschreibung geht über die Mechanik, Elektrodynamik und einfache Quantenmechanik hinaus, die üblicherweise bei T = 0 stattfinden (meist ohne, dass dies ausdrücklich gesagt wird). Obwohl zunächst auf rein makroskopische Phänomene beschränkt, hat sie in zunehmender Weise auch zur Bildung von Modellen für den inneren Aufbau der Materie beigetragen. Dabei erwies sich das im Laufe ihrer Entwicklung geschaffene Begriffssystem gegenüber wissenschaftlichen Revolutionen wie der Relativitätstheorie und der Quantentheorie als erstaunlich robust. Die Analyse thermody-
1 Es mag paradox erscheinen, die Funktionsweise der Thermodynamik an nicht-thermischen Systemen erläutern zu wollen – dies ist möglich, weil im Folgenden ein übergreifender Systembegriff verwendet wird, der es erlaubt, sowohl thermische und nicht-thermische Systeme als auch Makro- und Mikrosysteme auf einer einheitlichen Grundlage zu beschreiben. Der Grund für das universelle Auftreten dieser archetypischen Systeme liegt darin, dass diese zu komplizierteren Systemen zusammengesetzt werden können, welche Modelle für komplexe Vielteilchen-Systeme bilden.
1.1 Einleitung
|
3
namischer Experimente, wie der Untersuchung der thermischen Eigenschaften des elektromagnetischen Strahlungsfeldes oder der Wärmekapazitäten von Festkörpern und Gasen, lieferte sogar entscheidende Anstöße zur Entwicklung der Quantentheorie. Andererseits hat kaum eine physikalische Disziplin im Laufe ihrer Entwicklung und bis heute derartige Kontroversen hervorgerufen wie die Thermodynamik. Eine Theorie ist umso eindrucksvoller, je größer die Einfachheit ihrer Prämissen ist, je verschiedenartigere Dinge sie verknüpft und je weiter ihr Anwendungsbereich ist. Deshalb der tiefe Eindruck, den die klassische Thermodynamik auf mich machte. Es ist die einzige physikalische Theorie allgemeinen Inhalts, von der ich überzeugt bin, dass sie im Rahmen der Anwendbarkeit ihrer Grundbegriffe niemals umgestoßen wird (zur besonderen Beachtung der grundsätzlichen Skeptiker). Albert Einstein
Wodurch erlangt die Thermodynamik diese Allgemeinheit und Robustheit? Sie liefert ein allgemeines Schema zur Beschreibung physikalischer Systeme, welches in seinen Grundannahmen so gut wie keinen Bezug auf Raum und Zeit, das heißt auf den Ablauf von Prozessen nimmt. Dies wird zunächst als ein Mangel an Anschaulichkeit empfunden, weil wir von der Mechanik her gewohnt sind, den Ablauf von Prozessen mit dem (teils bewaffneten) Auge zu verfolgen. Die besten Beispiele für solche verfolgbaren Prozesse liefert die Astronomie, die als Beschreibung himmlischer Vorgänge zudem einen hohen philosophischen Stellenwert genießt. Wir werden sehen, dass dieser Mangel an Anbindung an das mechanische Vorbild große Vorteile hat. Dies zeigt sich vor allem in den als gescheitert anzusehenden Versuchen, die am Beispiel der Planeten des Sonnensystems gebildeten Vorstellungen auf sehr leichte Objekte, das heißt Atome und Moleküle, zu übertragen. Insbesondere haben sich in diesem Bereich der für die klassische Mechanik fundamentale Begriff der Bahn eines Körpers und damit die Verfolgbarkeit und Individualisierbarkeit einzelner Objekte als unhaltbar erwiesen – wie sich zeigen wird, selbst dann, wenn das für die „Bewegung“ solcher Quantenobjekte verfügbare Volumen eine makroskopische Größe hat.2 Wo die Thermodynamik auf Raum und Zeit Bezug nimmt, geschieht das in einer anderen Weise als in der Newton’schen Mechanik: Statt der Bewegung von Körpern werden „Nachbarschaftsverhältnisse“ und der daraus resultierende Transport der verschiedensten physikalischen Größen zwischen benachbarten „Teilstücken“ eines ausgedehnten physikalischen Objekts untersucht. Statt von „Objekten“ spricht man in der Thermodynamik gerne von „Systemen“ und sieht ein wesentliches Ziel der wis-
2 Dieser Sachverhalt wurde durch die Festkörperphysik, die Supraflüssigkeiten und zuletzt durch die experimentelle Beobachtung des Phänomens der (später diskutierten) Bose-Einstein-Kondensation auf das Eindrücklichste illustriert. Diese Phänomene bilden sozusagen den letzten Nagel auf dem Sarg der klassischen Physik.
4 | 1 Wie beschreibt man physikalische Systeme? senschaftlichen Analyse in der Zerlegung von Makrosystemen in möglichst elementare Teilsysteme. Statt einen genauen Zeitverlauf zu beschreiben, ist es meist ausreichend, den Anfangs- und den Endzustand eines Prozesses zu betrachten. Im Gegensatz zur Mechanik gibt es die Auszeichnung einer Zeitrichtung in dem Sinne, dass die Umkehrung eines Prozesses an einem System in vielen Fällen nur um den Preis zu realisieren ist, in einem anderen System eine Spur zu hinterlassen. Betrachtet man das Gesamtsystem, im allgemeinsten Fall „die Welt“, so existieren also unumkehrbare, auch irreversibel genannte Prozesse, die mit den Auffassungen der Mechanik nicht leicht in Einklang zu bringen sind. Es ist bemerkenswert, dass die Thermodynamik ein einheitliches Verfahren zur Beschreibung physikalischer Systeme bietet, welches eine integrierte Darstellungsweise der verschiedenen Disziplinen der Physik wie der Mechanik (sowohl der Massenpunkte als auch der Kontinua), des Elektromagnetismus und der Wärmelehre ermöglicht. Die moderne Physik, das heißt die Beschreibung der Struktur der Materie, erfordert eine solche integrierte Beschreibung, weil dort alle diese ursprünglich separat betrachteten Bereiche untrennbar miteinander verknüpft werden. Viele Verständnisprobleme in der Quantenmechanik rühren von einem (meist unbewussten) Festhalten an den klassisch-mechanischen Vorstellungen her. Das Beschreibungsverfahren der Thermodynamik bietet ein Begriffssystem, das flexibel genug ist, um den Anforderungen der Quantenmechanik gerecht zu werden, weil sie sich nur auf diejenigen mechanischen Begriffe stützt, die in der Quantenmechanik weiterhin verwendet werden. Ein zentraler Begriff ist der des Zustands eines Systems, für den es in der Quantenmechanik sogar ein besonderes Darstellungsmittel, nämlich die „Wellenfunktion“, genauer und allgemeiner, den „Zustandsvektor“ gibt. Trotz dieser interessanten Züge und großen Erfolge bei der Beschreibung der Materie zeigt die Erfahrung, dass die Thermodynamik von vielen, wenn nicht der Mehrzahl der Studierenden und nicht wenigen Hochschullehrern als die mit Abstand unbeliebteste Disziplin der Physik angesehen wird. Dies liegt meines Erachtens an einer tradierten Form der Darstellung, welche stark an die Umbrüche, Missverständnisse und Umwege in der historischen Entwicklung der Physik angelehnt ist. Das führt zu einer schwer verständlichen Mischung inkompatibler Begriffe und Vorstellungen aus der Frühzeit der Mechanik und Wärmelehre bis hin zu denen aus der Quantenstatistik. Zwei besonders drastische Beispiele sind die Begriffe „Wärme“ und „Teilchen“. Ausgehend von den Erfahrungen des Alltags wurde in der historischen Entwicklung zunächst erkannt, dass zur Beschreibung der thermischen Phänomene zwei Begriffe unterschieden werden müssen: Wärmeintensität, das heißt die Temperatur, und Wärmemenge. Das Wort „Wärmemenge“ drückt die Alltagserfahrung aus, dass die Wärme gewisse stoffähnliche Aspekte hat, ja zunächst als ein besonderer Stoff angesehen wurde. Dies impliziert insbesondere, dass die Aufstellung von Wärmebilanzen möglich ist: Wird einem Körper, zum Beispiel einem Topf mit kaltem Wasser, eine bestimmte Wärmemenge zugeführt und einem anderen Körper, beispielsweise einer heißen Herdplatte, entzogen, so erwartet man, dass die in dem zweiten Körper enthal-
1.1 Einleitung
|
5
tene Wärmemenge um den denselben Betrag zunimmt, wie die in dem ersten Körper enthaltene Wärmemenge abgenommen hat. Allerdings weiß jeder, der einmal im Winter seine kalten Hände gerieben hat, dass Wärme unter Aufwendung mechanischer Arbeit erzeugt werden kann. Da Stoffen, genauer der Größe Stoff„menge“, in dieser Zeit die Eigenschaft der Erhaltung als selbstverständlich zugeschrieben wurde, nahm man die Erzeugbarkeit von Wärme zum Anlass, die Vorstellung der Stoffartigkeit der Wärme ganz zu verwerfen.3 Zur gleichen Zeit machte die Entdeckung der allgemeinen Erhaltung der Energie durch Mayer, Joule, Helmholtz und andere sehr großen Eindruck auf die Zeitgenossen. Man sah das Postulat von der Erhaltung der Energie unter dem Namen „1. Hauptsatz“ als eine der Grundlagen der Wärmelehre an und beschloss, die Wärme (ebenso wie die Arbeit) von nun an als Form des Austausches von Energie zu begreifen und die Vorstellung von der Wärmemenge damit an die Energie zu binden. Dies hatte allerdings den Preis, dass die Wärme damit keine physikalische Größe in dem sonst üblichen Sinne ist: Zwar kann man noch von einer abgegebenen oder zugeführten Wärmemenge sprechen - jedoch nicht von der in einem Körper enthaltenen Wärmemenge. Bei Festkörpern und Flüssigkeiten ist dies wenig auffällig, bei Gasen jedoch bedeutend: Mit Hilfe eines Gases kann Wärme effektiv in Arbeit „verwandelt“ werden. Der Wärmemenge sind Zahlenwerte nicht für jeden Zustand eines Systems, sondern nur für Prozesse, das heißt ganze Folgen von Zuständen zuzuschreiben. Das klingt zunächst wenig bedeutsam, weist aber angesichts der Tatsache, dass der Prozessverlauf in der Regel viel weniger genau bekannt ist als die Anfangs- und Endzustände, nicht nur begriffliche, sondern auch große praktische Nachteile auf. Die Tatsache, dass der seitdem in der Physik übliche Begriff der Wärmemenge als Energieform mit der Semantik des Wortes „Menge“ nicht mehr vereinbar ist, hinderte die Physiker allerdings nicht daran, die Begriffe „Wärmemenge“ und „Wärmekapazität“ 4 weiterhin zu verwenden – ja den Begriff der Wärme so einzuführen! Wenige Jahre nach der Formulierung des Prinzips der Erhaltung der Energie entdeckte Clausius, dass man zur Beschreibung der thermischen Eigenschaften von Gasen eine neue physikalische Größe – die Entropie – einführen kann, welche die Eigenschaft der „Mengenartigkeit“ (das heißt die Möglichkeit Bilanzen aufzustellen) besitzt und mit der daher einfach zu operieren ist. Die Entropie – von Clausius auch „reduzierte Wärme“ ge-
3 Allerdings zeigte sich bald, dass Stoffe durch chemische Reaktionen sehr wohl erzeugt und vernichtet werden können, ohne dass dies mit dem entscheidenden begrifflichen Aspekt der Stoffartigkeit, nämlich der Möglichkeit Stoff-Bilanzen aufstellen zu können, in Konflikt käme. Dennoch sitzt die intuitive Überzeugung sehr tief, dass ein „richtiger“ Stoff unzerstörbar sei. Dies äußert sich beispielsweise in der Schwierigkeit, Lichtquanten (Photonen) oder Schallquanten (Phononen) als „richtige“ Teilchen und nicht nur als theoretische Konstrukte anzusehen. 4 Diese Worte suggerieren ja gerade, dass die Wärme nicht nur zwischen Körpern ausgetauscht, sondern auch in Körpern gespeichert werden kann. Dies kommt auch in ihrem – Symbol Q für „quantitas“ – zum Ausdruck.
6 | 1 Wie beschreibt man physikalische Systeme? nannt – ist eng mit der Wärme verknüpft, hat aber den Vorteil, für jeden Zustand und nicht nur für einen vorgegebenen Prozess definiert zu sein. Außerdem stellte Clausius fest, dass die Irreversibilität gewisser Prozesse über das Postulat, dass Entropie erzeugt, aber nicht vernichtet werden könne, begrifflich und quantitativ gefasst werden kann. Diese Erkenntnisse fasste er in seinem berühmten „zweiten Hauptsatz“ der Thermodynamik zusammen. Die Einsicht, dass die ursprüngliche (kalorische) Vorstellung von der Wärme„menge“ mit der Entropie viel besser zusammen passt als die Energie, wurde erstmals von Callendar im Jahre 1911 zum Ausdruck gebracht. Sie hat bis heute aber wenig Eingang in die Lehrbücher gefunden5 – die Gewöhnung an die historisch gewachsene Darstellungsweise erscheint bis heute stärker als die mit der Erlernung derselben verbundenen semantischen und konzeptionellen Schwierigkeiten. Die in diesem Buch vertretene Sichtweise – dass der ursprüngliche kalorische Wärmebegriff in zwei unabhängige Größen, nämlich Energie und Entropie, aufgespalten werden muss – wurde in ähnlicher Form von Tisza, einem der Begründer der Tieftemperaturphysik, formuliert [4]. Weil das Wort „Wärme“ als „Form der Energie“ bereits belegt ist, blieb für die Entropie keine anschauliche Bedeutung mehr übrig. Zusammen mit der Schwierigkeit, die Erzeugbarkeit der Entropie mit den Vorstellungen der klassischen Mechanik in Einklang zu bringen, brachte dies die Entropie in den Ruf, eine der unanschaulichsten und abstraktesten Größen der Physik zu sein. Der Preis für die ausschließliche Interpretation der Wärme als „Form der Energie“ war also doppelt hoch: Nicht nur die Größe Entropie war von Anfang an unanschaulich, sondern auch das Wort „Wärmemenge“ wird bis heute in einer Weise verwendet, die nicht mit der sonst selbstverständlichen „Speicherbarkeit“ von Gütern aller Art kompatibel ist. Mathematisch kann die so verstandene Wärme nicht durch eine einfache Funktion, sondern nur durch eine nicht-integrable Differenzialform dargestellt werden – ein Konzept, welches in der Schule gar nicht und an der Universität nur bedingt vermittelt wird. Damit wurde auch der zuvor intuitive handhabbare Begriff der Wärmemenge unanschaulich. Eine Folge der Unanschaulichkeit der in traditioneller Weise eingeführten Entropie ist, dass diese in den neueren Darstellungen der Thermodynamik von vornherein über ihren von Boltzmann erkannten Zusammenhang mit der Wahrscheinlichkeit von Zuständen eines Vielteilchensystems eingeführt wird. Dieser Zusammenhang ist sehr wichtig und für die Entwicklung von allen Arten von Modellen der Materie unverzichtbar. In der Tat stehen bei diesem Zugang Modellsysteme und weniger der experimentelle Zugang zur Thermodynamik im Vordergrund. Dies wird auch durch die Tatsache unterstrichen, dass die Mehrzahl der neueren Darstellungen aus der Perspektive der theoretischen Physik verfasst sind. Unter der Bildung von Modellen verstehen
5 Ausnahmen bilden die Bücher von H. Fuchs „Dynamics of heat“ [2] sowie von G. Job und R. Rüffler „Physikalische Chemie“ [3], welche aber zumindest in der Physik wenig Verbreitung erfahren haben.
1.1 Einleitung
|
7
wir dabei den Versuch, die Eigenschaften eines Makrosystems durch die Konstruktion eines aus mikroskopischen Teilsystemen zusammengesetzten Systems abzubilden. Der Zugang über die statistische Interpretation der Entropie kann ihre einfache makroskopische Bedeutung leider wesentlich verschleiern. Makroskopisch ist die Entropie (neben der Energie) einfach eines von zwei (imaginären) Fluiden, welche zusammen mit der Temperatur zur Beschreibung aller thermischen Phänomene erforderlich sind.6 Außerdem – und vielleicht noch wichtiger – tritt dabei die Einfachheit des Gedankengebäudes der Thermodynamik und seine zunächst modellunabhängige Natur in den Hintergrund. Eine modellunabhängige Rahmentheorie ist gerade für den Experimentalphysiker von großer Bedeutung, der eines Tages vielleicht das Privileg hat, ein fundamental neues Phänomen entdecken zu dürfen. Ein fundamental neues Phänomen ist eines, welches mit den bekannten Modellen für den Aufbau der Materie nicht zu erklären ist. Unabhängig von jeder Modellvorstellung lassen sich die Relationen der Thermodynamik nutzen, um bestimmte gemessene Größen mit völlig anderen, für den naiven Betrachter davon ganz unabhängigen Größen in Verbindung zu bringen und auf diese Weise zu testen, ob die bekannten physikalischen Größen ausreichen, um das neue Phänomen zu erfassen, oder ob dafür vielleicht die Einführung von völlig neuen physikalischen Größen erforderlich ist. Die physikalischen Systeme, an denen ein Großteil der Entwicklung der Thermodynamik stattgefunden hat, sind das ideale und das reale Gas; weitere Beispiele sind die thermische Strahlung und die Supraleitung. In all diesen Fällen ging die quantitative Erfassung der Phänomenologie durch die Thermodynamik deren Interpretation durch mikroskopische Modelle um Jahrzehnte voraus. Ein weiterer Begriff, der im Laufe der historischen Entwicklung gravierende Veränderungen erfahren hat, ist der des Teilchens. Die Physik gegen Ende des 19. Jahrhunderts war von der Vorstellung geprägt, dass sich die Eigenschaften der Materie auf die Mechanik, dass heißt auf die von gegenseitigen und externen Kräften bestimmten Bahnbewegungen von kleinen Teilchen – Atomen und Molekülen – zurückführen lässt. Allein die große Zahl dieser Teilchen schien eine statistische Beschreibung erforderlich zu machen. Die Idee, dass die traditionellen Systeme der Thermodynamik, das heißt Gase, Festkörper und Flüssigkeiten in eine (üblicherweise große) Anzahl von Teilchen zerlegbar sind, hat historisch dazu geführt, dass die Stoffmenge – in atomistischer Sprechweise die Teilchenzahl – nicht als echte physikalische Größe sondern als bloße Stückzahl von Objekten angesehen wurde. In älteren Darstellungen der Thermodynamik wird die Teilchenzahl einfach als Systemparameter (ähnlich der Masse) be-
6 Wir halten fest, dass letztlich alle physikalischen Größen imaginär sind, weil sie sich auf die gedanklichen Bilder beziehen, die sich die Physik von der realen Welt macht. Die Verbindung zwischen den gedanklichen Bildern und der realen Welt bilden Experimente, die es gestatten, die Relationen zwischen den physikalischen Größen quantitativ zu überprüfen.
8 | 1 Wie beschreibt man physikalische Systeme? handelt. Das führt dazu, dass die zur Teilchenzahl thermodynamisch konjugierte Größe, das chemische Potenzial, in der Physik lange Zeit ein Schattendasein geführt hat und ebenfalls als eine hochabstrakte Größe gilt – obwohl es einfach die mit den Änderungen einer Stoffmenge verbundene Energetik beschreibt. Viele Studierende werden mit dem chemischen Potenzial frühestens in der Quantenstatistik konfrontiert, wo es als Lagrange-Multiplikator zu Extremalisierung der Entropie in der großkanonischen Verteilung dient – diese Art der Einführung trägt wenig zur Bildung einer Anschauung für das chemische Potenzial bei. Das chemische Potenzials ist heute bei der Beschreibung von Transportprozessen in der Festkörperphysik und in der mesoskopischen Physik unverzichtbar. Daher findet es in neuere Lehrbüchern eher Eingang – allerdings ist dort oft immer noch ein gewisses Unbehagen im Umgang mit dieser Größe spürbar. Ähnlich wie bei der Entropie wird häufig auf Hilfskonstruktionen und Hilfsgrößen ausgewichen, die den Begriff „chemisches Potenzial“ vermeiden helfen, aber in der Regel nicht zur Transparenz des Gedankengebäudes beitragen. Für die Chemiker, die sich mit der Veränderung von Teilchenzahlen durch chemische Reaktionen auseinanderzusetzen haben, war dies schon immer etwas anders. Im Laufe der Entwicklung der Quantentheorie zeigte sich, dass die Quantentheorie für eine realistische Beschreibung der Materie unverzichtbar ist. Dennoch sind die klassisch-mechanischen Bilder bis heute extrem einflussreich, weil sie in der Anschauung tief verwurzelt und nicht leicht durch etwas Besseres zu ersetzen ist. Was ist also die Alternative zur Interpretation von Teilchen als Newton’sche Objekte? Eine befriedigende Antwort auf diese Frage erfordert die Einbindung der Vielteilchenaspekte der Quantenphysik in unsere Anschauung. Jedoch ist der physikalische Gehalt der Vielteilchen-Quantentheorie hinter ihrem mathematischen Apparat nicht immer leicht erkennbar. Ich plädiere dafür, die physikalischen Ideen der VielteilchenQuantenphysik ohne deren mathematischen Apparat zu formulieren und den Studierenden bereits in einer frühen Phase des Studiums nahezubringen. Denn diese Idee ist bereits für den zugänglich, der gelernt hat, dass die meisten Quantensysteme durch einen Satz von diskreten stationären Zuständen mit diskreten Werten der Energie beschrieben werden. Akzeptiert man, dass die Teilchenzahl ebenso eine physikalische Größe ist wie die Energie (wozu die Thermodynamik allen Anlass gibt), so sieht man, dass die ganzzahlige Quantisierung der Werte der Teilchenzahl bereits erkannt und als „Atomistik“ propagiert wurde, lange bevor dies für die Energie aktuell wurde! Der fundamentale Bedeutungswandel des Wortes „Teilchen“ in der modernen Physik besteht darin, dass die Teilchen nicht mehr als Gegenstände (und damit als Teil-Systeme), sondern als Anregungszustände eines größeren Vielteilchen-Systems interpretiert werden, dessen Grundzustand das Vakuum beziehungsweise der nichtangeregte Festkörper ist. Die kollektiven Anregungszustände eines Festkörpers lassen sich vielfach als Systeme von Quasi-Teilchen verstehen, die sich – analog zu den Molekülen eines konventionellen Gases – in dem vom Festkörper eingenommenen Volumen (bis auf Stöße mit anderen Quasi-Teilchen oder statischen Gitterdefekten) frei
1.2 Grundbegriffe | 9
bewegen können. Der nicht-angeregte Festkörper bildet in diesem Sinne ein QuasiVakuum. Chemische Reaktionen lassen sich auf diese Weise ebenso wie die Elektron-LochRekombination (unter Photon- oder Phonon-Emission) in der Halbleiterphysik als Quantenübergänge zwischen verschiedenen (Vielteilchen-)Zuständen interpretieren. Dass diese Analogien nicht künstlich, sondern sehr tiefgehend sind, zeigen uns die Erkenntnisse der Astroteilchenphysik über die Synthese der Elemente durch die Kernund Elementarteilchenreaktionen in den Sternen und in Sternexplosionen. Bei diesen Prozessen finden thermisch induzierte Teilchenreaktionen bei Energien statt, die in der Chemie nicht betrachtet werden – begrifflich sind sie aber ein und dasselbe. Teilchen sind damit keine unvergänglichen Objekte, wie die Atome Demokrits, sondern sie können erzeugt oder vernichtet werden, sofern dies mit den bekannten Erhaltungssätzen verträglich ist. Es ist das zentrale Anliegen dieser Darstellung, ausgehend von den Eigenschaften der einfachsten physikalischen Systeme, ein begrifflich einfaches und einheitliches Gesamtbild der Physik zu entwickeln. Vor der Beschreibung thermischer Phänomene wird in den folgenden Abschnitten dieses Kapitels die der Thermodynamik zugrundeliegende Methode anhand von einfachen, dem Leser wohlvertrauten Beispielen aus der Mechanik und Elektrodynamik illustriert. An diesen Beispielen wird auch der thermodynamische Systembegriff erklärt, der eben nicht auf thermische oder Vielteilchensysteme beschränkt ist, sondern auf alle Bereiche der Physik ausgedehnt werden kann. Die thermischen Systeme fügen sich dann in völlig analoger Weise in den Gibbs’schen Zugang zur Thermodynamik ein.
1.2 Grundbegriffe In den beiden folgenden Abschnitten wird eine Reihe von Grundbegriffen vorgestellt, auf denen unser Zugang zur Physik aufbaut. Diese Grundbegriffe sind so formuliert, dass sie aus dem Bereich der klassischen Physik ohne Modifikation in den Bereich der Quantenphysik übernommen werden können und daher für eine einheitliche Formulierung der Physik tauglich sind. Obwohl einige dieser Grundbegriffe elementar erscheinen, ist es für uns dennoch sinnvoll sich diese zu vergegenwärtigen, um uns nicht später in subtilen, von den Bildern unserer Alltagswelt suggerierten Widersprüchen zu verstricken, wie wir sie im vorangegangenen Abschnitt diskutiert haben. Die Physik erreicht eine effiziente und logisch geordnete Beschreibung der zahllosen Phänomene in der Natur dadurch, dass sie für möglichst viele davon dieselben Werkzeuge benutzt. Eine Gruppe dieser Werkzeuge nennen wir „physikalische Grö-
10 | 1 Wie beschreibt man physikalische Systeme? ßen“.7 Diese erlauben es, verschiedene Aspekte des Gegenstandes der Betrachtung quantitativ zu fassen, indem wir den Größen bestimmte Zahlenwerte zuweisen, mit den Werten anderer Gegenstände vergleichen und untersuchen, wie sich die Werte bei physikalischen Vorgängen verändern. Verglichen mit der Vielzahl von Phänomenen, ist die zu ihrer Beschreibung erforderliche Zahl von fundamentalen physikalischen Größen relativ klein – die (Makro-)Physik benötigt etwa zwanzig solcher Größen, von denen sieben8 in diesem Buch eine Hauptrolle spielen. Fundamental wollen wir diejenigen Größen nennen, die nicht auf andere Größen zurückgeführt werden können, sondern eingeführt werden müssen, um einen spezifischen Aspekt der Natur quantitativ fassen zu können. Beispielhaft sind die Phänomene der Bewegung, des Elektromagnetismus, der Wärme oder der Stoffumwandlung zu nennen. Entscheidend ist dabei, dass eine fundamentale Größe nicht für einzelne Gegenstände spezifisch ist, sondern stets in einer großen Klasse von Gegenständen auftritt. Daraus folgt, dass fundamentale Größen oft einen hohen Abstraktionsgrad haben, weil sie das Gemeinsame einer großen Zahl von Beobachtungen auf den kleinsten gemeinsamen Nenner bringen. Eine Anschauung für solche fundamentalen Größen lässt sich daher nur durch eine Übersicht über möglichst viele verschiedene Phänomene gewinnen, die alle einen, nämlich den durch die jeweilige Größe beschriebenen Aspekt, gemeinsam haben. Es ist das Ziel der physikalischen Naturbeschreibung, einen Basis-Satz von physikalischen Größen zu identifizieren, der es erlaubt, immer mehr verschiedene Phänomene mit immer weniger fundamentalen Größen zu beschreiben. Aus diesen Grund werden neue fundamentale Größen nur mit äußerster Vorsicht eingeführt: Man tut dies nur, wenn man ein neues Phänomen auf überhaupt keine andere Weise als durch die Einführung neuer Größen fassen kann. Und bevor eine neue fundamentale Größe wirklich als solche anerkannt wird, verstreichen in aller Regel viele Jahre, in denen versucht wird, das neue Phänomen doch auf bekannte Größen zurückzuführen. Diese Bemühungen sind verantwortlich dafür, dass nur eine geringe Anzahl von Größen als fundamental anzusehen ist – und dieser Erfolg macht die Geschlossenheit der physikalischen Naturbeschreibung aus. Die Gegenstände der physikalischen Beschreibung selbst bezeichnen wir gerne als Systeme. Dabei ist zu beachten, dass es sich bei physikalischen Systemen stets um gedachte Reduktionen der realen Objekte auf bestimmte von der jeweiligen Fragestellung abhängige und quantitativ fassbare Teilaspekte handelt – auch wenn im Wissenschaft-Jargon oft auch die Objekte selbst als Systeme bezeichnet werden.9
7 In vielen Büchern werden solche Größen als Zustandsgrößen bezeichnet, um sie von so genannten Prozessgrößen abzugrenzen. In diesem Buch spielen die (auch von uns so benannten) Prozessgrößen nur eine Nebenrolle, weswegen wir die Nomenklatur einfacher halten können. 8 E, T, S, p, V, μ und N . 9 Um uns am Anfang nicht in allzu tiefgründigen Betrachtungen zu verlieren, verschieben wir eine eingehendere Diskussion des Begriffs System auf Abschnitt 7.1.
1.2 Grundbegriffe | 11
Die Eigenschaften eines Systems werden durch die gegenseitigen Abhängigkeiten zwischen den Werten seiner physikalischen Größen beschrieben. Der Wert10 einer physikalischen Größe besteht aus einem Zahlenwert (oder Maßzahl) und einer Einheit, wobei die Einheit durch den Vergleich mit einem im Prinzip frei wählbaren Standardsystem definiert wird. Die Gesamtheit der Werte aller physikalischen Größen eines Systems zu einem gewissen Zeitpunkt bestimmt den momentanen Zustand des Systems. Die Zuweisung von Werten für die physikalischen Größen eines Systems kann außer durch Messung auch mit Hilfe einer Theorie geschehen, die auf der Basis von Modellen Vorhersagen für die Zahlenwerte der physikalischen Größen des Systems macht. Modelle sind aus mehr oder weniger einfachen Elementarsystemen gebildete Konstruktionen, die ein einfaches und überschaubares, aber möglichst auch quantitativ korrektes mathematisches Abbild der experimentellen Situation ergeben. Ein illustratives Beispiel ist das Bohr’sche Atommodell, welches das Wasserstoffatom mit Hilfe einiger Zusatzannahmen auf das System zweier sich elektrisch anziehender Körper im freien Raum abbildet. Im nächsten Abschnitt werden einige der einfachsten dieser Mustersysteme vorgestellt. Über die abzubildenden, also bereits bekannten Eigenschaften hinaus sollte ein Modell Vorhersagen über bisher unbekannte Eigenschaften des untersuchten Systems machen, die es erlauben, die Plausibilität und Korrektheit der dem Modell zugrundeliegenden physikalischen Ideen auf die Probe zu stellen. Je einfacher das Modell und je größer seine Vorhersagekraft, desto besser. Der Grad der quantitativen Übereinstimmung zwischen den Messwerten und der theoretischen Vorhersage misst die Qualität des Modells und damit den Grad des erreichten Verständnisses. Wesentliche wissenschaftliche Fortschritte ergeben sich oft aus den Unzulänglichkeiten der Modelle, wie gerade das Beispiel des Bohr’schen Atommodells zeigt, dem trotz vieler, auch quantitativer Übereinstimmungen mit den experimentellen Daten eine fundamentale Beschränkung innewohnt, die letztlich zur Entwicklung ganz neuer Vorstellungen, nämlich der Quantentheorie geführt hat. Die Fundamentalbegriffe „System“, „Zustand“, „Größe“ und „Wert“ sind nicht unabhängig voneinander zu definieren, sondern werden durch den folgenden Merksatz miteinander verknüpft: In einem Zustand hat jede Größe eines Systems einen bestimmten Wert.11
10 Viele Messverfahren liefern keinen Absolutwert eine Größe, sondern nur die Differenz der Werte dieser Größe zwischen zwei verschiedenen Zuständen des Systems – in diesem Fall spricht man von Differenz-Messverfahren.
12 | 1 Wie beschreibt man physikalische Systeme? Der Zustand eines physikalischen Systems ist also zu jedem Zeitpunkt durch die Gesamtheit der Werte aller seiner Größen zu diesem Zeitpunkt gegeben. Da zwischen den Werten der physikalischen Größen für das betrachtete System charakteristische Abhängigkeiten bestehen, ist es für die Festlegung des Zustands ausreichend, die Werte eines Satzes von unabhängig variierbaren Größen anzugeben. Die Elemente eines Satzes von unabhängig variierbaren Größen nennt man die Freiheitsgrade des Systems.
Ein physikalisches System wird durch seine unabhängigen Variablen und deren funktionalen Zusammenhang mit den abhängigen Variablen charakterisiert. Zustandsänderungen von physikalischen Systemen sind Folgen von Zuständen und werden Prozesse genannt. Prozesse können sowohl „von außen“, das heißt durch den Experimentator, gesteuert werden als auch „von selbst“ ablaufen, das heißt durch die innere Dynamik des Systems entstehen. Im Verlauf von Prozessen im Bereich der klassischen Physik variieren die Werte der physikalischen Größen stetig. Daher lassen sich solche Prozesse mathematisch durch Differenzialgleichungen (Bewegungsgleichungen) beschreiben. Im Bereich der Quantenphysik sind jedoch auch diskontinuierliche Änderungen („Quantensprünge“) der Werte der physikalischen Größen möglich, deren Beschreibung andere mathematische Hilfsmittel erfordert. Der Wertevorrat der physikalischen Größen bildet jedoch auch im Bereich der Quantenphysik ein reelles Kontinuum.12 Der folgende Aspekt des Zustandsbegriffs kann nicht stark genug betont werden:
Ein Zustand zum Zeitpunkt t = t0 enthält keinerlei Information darüber, auf welche Weise er erreicht worden ist. Dies ist gleichbedeutend damit, dass ein Zustand im Sinne der Thermodynamik keinerlei „Gedächtnis“ hat – die Werte der physikalischen Größen zu Zeiten t < t0 , und damit die Vorgeschichte des Systems, spiegeln sich in keiner Weise in den Werten der
11 Die Werte sind unter Umständen nicht durch eine Einzelmessung, sondern nur als Mittelwert einer ganzen Messreihe zu bestimmen, in der die Resultate der Einzelmessungen mit gewissen Wahrscheinlichkeiten auftreten. Die Schwankungsbreite der Ergebnisse der Einzelmessungen um den Mittelwert nennt man die Unschärfe des Wertes. Die Quantenmechanik und die statistische Thermodynamik zeigen uns, dass Unschärfen nicht allein als Folge von Messfehlern auftreten, sondern mitunter inhärente Eigenschaften der untersuchten Systeme sind. In der Thermodynamik sind solche Schwankungen vor allem in der Nähe von Phasenübergängen bedeutsam. 12 Das liegt daran, dass die Mittel- oder „Erwartungs“-Werte der physikalischen Größen kontinuierlich variable Wahrscheinlichkeiten enthalten, während die bei einer Einzelmessung resultierenden Werte oft diskret sind.
1.2 Grundbegriffe | 13
physikalischen Größen zum Zeitpunkt t0 wider. Diese Tatsache steht in einem gewissen Kontrast zum Weltbild der klassischen Mechanik, nach der die Weltgeschichte mit dem Ablauf eines Uhrwerks verglichen werden kann: die Lösung der Bewegungsgleichungen des Systems verknüpft einen Zustand zu einem beliebigen Zeitpunkt t0 eindeutig sowohl mit allen vorangegangenen Zuständen (der „Geschichte“) als auch mit allen kommenden Zuständen (der „Zukunft“). Während die klassische Mechanik nur „von selbst“ ablaufende Prozesse kennt, existiert im Bereich der Thermodynamik (von einigen speziellen Ausnahmen abgesehen) keine Bewegungsgleichung, welche momentane Zustände mit vergangenen oder zukünftigen Zuständen verbindet. Was aus der Perspektive der Mechanik wie ein Mangel erscheint, ermöglicht erst die Arbeit des Experimentators, der mit einem zu untersuchenden System gerne möglichst beliebige Prozesse ausführen möchte, ohne durch die Gesetze der Mechanik auf einen einzigen Prozess (nämlich die Lösung der Bewegungsgleichung) festgelegt zu sein. Der Experimentator möchte „von Hand“ in eventuell von selbst ablaufende Prozesse eingreifen, sie anhalten, fortsetzen oder modifizieren. Eine weitere wichtige Folge der Unabhängigkeit eines Zustands von seiner Vorgeschichte besteht darin, dass dies erst die für wissenschaftliche Untersuchungen zentrale Reproduzierbarkeit von Experimenten13 und damit eine entscheidende Absicherung seiner Erkenntnisse ermöglicht: Gewisse Prozesse müssen wiederholt werden, um eine vermutete funktionale Verknüpfung der Werte der physikalischen Größen bestätigen zu können. Dazu ist entscheidend, dass der Anfangszustand des Prozesses mit der erforderlichen Genauigkeit wiederhergestellt werden kann – unabhängig davon, wieviele solcher Versuche bereits stattgefunden haben.14 Die Aufgabe sowohl des Experiments als auch der Theorie besteht darin, im Laufe der Erforschung eines gegebenen Systems die Art der wechselseitigen Abhängigkeiten zwischen den physikalischen Größen, beziehungsweise ihren Werten, zu bestimmen und herauszufinden, welche davon sich unabhängig variieren lassen. Für verschiedene physikalische Systeme sind die Art und Zahl ihrer unabhängig variierbaren Größen unterschiedlich. Es zeigt sich oft, dass sich nicht alle Größen eines Systems variieren lassen und (zumindest unter gewissen Bedingungen) als Systemkonstanten angesehen werden können. Allerdings ist die Unterscheidung von Variablen und Systemkonstanten in der Regel von der Fragestellung abhängig und damit willkürlich. Mit fort-
13 Im Rahmen der Quantentheorie besteht ein gewisser Indeterminismus im dem Sinne, dass die Wiederholung von Einzel-Messungen einer Größe zu einer Vielzahl von Messergebnissen führen kann. Diese Komplikationen werden im zweiten Teil dieses Buches relevant, und in Abschnitt 10.2 besprochen. Im Ergebnis fordert die Quantentheorie die Unterscheidung von Einzelmessungen und Messreihen. Reproduzierbarkeit ist im Rahmen der Quantenphysik nur für Messreihen, das heißt für die Mittelwerte der aus den Einzelmessungen resultierenden Einzelwerte gegeben. 14 Der von den Experimentatoren gelegentlich leidvoll erfahrene Fehlschlag bei der Reproduktion eines Experiments ist danach stets darauf zurückzuführen, dass es nicht gelungen ist, die Werte aller unabhängigen Größen des Systems mit der erforderlichen Genauigkeit wiederherzustellen.
14 | 1 Wie beschreibt man physikalische Systeme? schreitendem Untersuchungsgrad eines Systems wird man versuchen, möglichst alle „Systemkonstanten“ in Variablen und systemunabhängige Konstanten zu zerlegen. Letztere werden üblicherweise als Naturkonstanten bezeichnet. Sie sind allen Systemen gemeinsam und drücken letztlich Eigenschaften unseres Maß- oder Einheitensystems aus. Aus diesem Grund erscheint es treffender statt von Naturkonstanten von Maßsystemkonstanten zu sprechen.15 Beispiele für Systemkonstanten sind die Massen der Himmelskörper, beziehungsweise der Atome und Moleküle. In den Fragestellungen der Mechanik beziehungsweise der Chemie sind die auftretenden Konstanten Systemkonstanten. Auf einer fundamentalen Ebene versucht man die Zahlenwerte der letzteren auf der Basis immer feinerer Modelle zu verstehen, das heißt letztlich mit Hilfe von Modellen zu erklären, die keine Systemkonstanten mehr, sondern nur noch Variablen enthalten. Dies kann die Einführung von völlig neuen physikalischen Größen erfordern. Die Frage ist nun, wie die gegenseitigen Abhängigkeiten der Werte der physikalischen Größen charakterisiert werden können. Greift man einen gewissen Satz von unabhängigen Variablen heraus, so werden sich die Werte der übrigen Größen des Systems im Allgemeinen als Funktionen der Werte der als unabhängig gewählten Variablen darstellen lassen. Solche Relationen zwischen den physikalischen Größen nennt man Zustandsgleichungen.
Die grundlegende Idee der thermodynamischen Beschreibungsweise besteht darin, alle diese Abhängigkeiten, das heißt die verschiedenen ein System charakterisierenden Zustandsgleichungen eines Systems, in einer einzigen Funktion der unabhängigen Variablen zusammenzufassen! Der dazu zu verwendende Variablensatz ist (ähnlich der Basis eines Vektorraums) nicht eindeutig festgelegt, sondern erlaubt Übergänge von einem Satz unabhängiger Variablen zu einem anderen, je nach Zweckmäßigkeit und Fragestellung. Für den Ex-
15 Die Konventionsabhängigkeit der Maßsystemkonstanten zeigt sich darin, dass diese in verschiedenen Maßsystemen unterschiedliche Werte annehmen. In der theoretischen Physik ist es üblich in einem System natürlicher Einheiten zu rechnen, in dem konsequent alle Maßsystemkonstanten c = e = = kB = τN = 4πε0 = μ0 /(4π) = 1 gesetzt werden. Auf diese Weise bekommen alle physikalischen Größen die Einheit einer Potenz der Masse pro Teilchen. Wird auch noch die Gravitationskonstante γG = 1 gesetzt, so sind alle physikalischen Größen dimensionslos. Diese Feststellung geht auf Planck zurück, nach dem die natürlichen Einheiten auch die Planck-Skalen genannt werden. Bei komplexen Rechnungen sind die natürlichen Einheiten sehr sinnvoll, weil sonst häufig umfangreiche Kombinationen der Maßsystemkonstanten auftreten, welche lange Rechnungen unnötig unübersichtlich machen. Um die Ergebnisse der Theorie mit experimentellen Daten vergleichen zu können, ist es nötig, die in der Experimentalphysik gebräuchliche Einheit jeder Größe durch Multiplikation mit der richtigen Kombination von Maßsystemkonstanten, das heißt der zugehörigen Planck-Einheit, wiederherzustellen.
1.3 Bilanzen und Erhaltungssätze
| 15
perimentalphysiker ist diese Flexibilität besonders wichtig, weil je nach Experiment mal die eine und mal die andere Variable besonders leicht messbar oder unabhängig kontrollierbar sein wird. Je nach Variablensatz wird die das System charakterisierende Funktion eine andere Gestalt haben. Die System-charakterisierenden Funktionen werden Massieu-Gibbs-Funktionen oder Thermodynamische Potenziale genannt. Das zunächst vertrauteste Beispiel eines thermodynamischen Potenzials ist die Energie – sofern sie als Funktion des „richtigen“ Variablensatzes dargestellt ist. Welche Variablen dies sind, werden wir im Folgenden sehen. Bei den thermodynamischen Potenzialen handelt es sich um eine Verallgemeinerung des aus der Mechanik und Elektrodynamik bekannten Potenzialbegriffs. Dort hat das Potenzial den Sinn, die verschiedenen Komponenten eines konservativen Kraftfeldes durch Integration in einer einzigen skalaren Funktion zusammenzufassen. Wie in der Mechanik und Elektrodynamik lassen sich viele physikalische Vorgänge besonders anschaulich als „Bewegungen“ – allgemeiner als Prozesse – in einer „Potenzial-Landschaft“ darstellen. Die obigen Überlegungen illustrieren die Feststellung, dass sich der thermodynamische Systembegriff nicht auf konkrete „Gegenstände“ bezieht. Dies wird deutlich, wenn wir fragen, ob die Größen Masse M oder Teilchenzahl N für einen gegebenen Kupferblock Variablen darstellen. In vielen Situationen können M und N für einen solchen Gegenstand als Systemkonstanten angesehen werden.16 Das thermodynamische System „festes Kupfer“ repräsentiert aber genau genommen keinen einzelnen Gegenstand aus Kupfer, sondern – abstrakter – eine ganze Klasse von Gegenständen, welche alle denkbaren Kupferklötze umfasst.
1.3 Bilanzen und Erhaltungssätze Ein für die gesamte Physik relevantes fundamentales Postulat ist der 1. Hauptsatz der Thermodynamik:17
Die physikalische Größe Energie (E ) kommt in allen physikalischen Systemen vor und ist bei allen Prozessen erhalten. Die Werte der Energiedichte (e = E/V ) sind stets nach unten beschränkt.
16 Das in Kapitel 9 diskutierte Sublimationsgleichgewicht zeigt, dass die Teilchenzahl auch für einen einzelnen Kupferblock variabel ist, weil dieser Teilchen mit der ihn umgebenden Gasphase austauschen kann. 17 Diese Bezeichnung ist allerdings insofern etwas irreführend, weil die Energieerhaltung nicht auf die Thermodynamik beschränkt ist und sich im Folgenden außerdem zeigen wird, dass das thermodynamische Beschreibungsverfahren selbst von den Erhaltungssätzen unabhängig ist! Die traditionelle Formulierung des 1. Hauptsatzes wird in Abschnitt 4.5 diskutiert.
16 | 1 Wie beschreibt man physikalische Systeme? Diese Aussagen bilden einen Meilenstein in der Geschichte der Physik. Sie sind grundsätzlich unbeweisbar und rechtfertigen sich dadurch, dass nach unserer bisherigen Erfahrung Energie weder erzeugt noch vernichtet werden kann und es keine endlich großen Systeme gibt, denen unendliche Mengen von Energie entzogen werden könnten. Daher ist es möglich (und in vielen Fällen sinnvoll), den Energie-Nullpunkt so zu legen, dass nur positive Werte von E vorkommen.18 Die Energie kann als eine universelle Währung veranschaulicht werden, mit der alle Veränderungsprozesse in der Welt bezahlt werden müssen. Das Gleichnis zwischen der Energie und dem Geld ist passend, weil Geld das Eigentümliche der Bilanzierbarkeit sowohl der Energie als auch einiger anderer physikalischer Größen besonders gut illustriert. Unter bilanzierbaren Größen verstehen wir solche, für die eine Änderung des Werts in einem System mit der Änderung des Werts derselben Größe in einem oder mehreren anderen Systemen in Verbindung gebracht werden können, weil diese Änderung entweder durch Zustrom oder Abfluss einer gewissen Menge dieser Größe oder aber durch Erzeugung oder Vernichtung erfolgen. Die Energie, der Impuls, der Drehimpuls, die elektrische Ladung, die Entropie und die Teilchenzahl sind wichtige Vertreter dieser Klasse. Statt bilanzierbar werden wir im folgenden auch oft das Wort mengenartig benutzen, um den Mengencharakter dieser physikalischer Größen hervorzuheben.19 Den mengenartigen Größen steht eine zweite Klasse von Größen gegenüber, welche keine Bilanzen erlauben, wie zum Beispiel die Geschwindigkeit, das elektrische Potenzial oder die Temperatur. Mengenartige Größen, deren Erzeugung und Vernichtung sich trotz intensiver experimenteller Bemühungen in dem oben beschriebenen Sinne als unmöglich herausgestellt hat, nennt man allgemeine Erhaltungsgrößen. Daneben gibt es mengenartige Größen, die nur bei einer bestimmten Klasse von Prozessen, aber nicht bei allen Prozessen erhalten sind. Ein Beispiel für eine solche Größe ist die Stoffmenge (oder Teilchenzahl), welche bei vielen Prozessen erhalten ist – mit Ausnahme der Prozesse, die wir chemische Reaktionen nennen. Bei chemischen Reaktionen kommt es zu Stoffum-
18 Wenn sich solche Erfahrungen erst einmal lange genug bewährt haben, so werden diese nicht mehr als lästige Einschränkungen (wie dies von den Erfindern von perpetuum mobiles 1. Art gewertet wurde), sondern als fundamentale Konstruktionsprinzipien betrachtet. Von diesem Zeitpunkt an wird man neue experimentelle Beobachtungen, welche ein solches Prinzip zunächst zu widerlegen scheinen, durch die Einführung von neuen physikalischen Größen oder neuen Systemen so zu deuten versuchen, dass das Prinzip aufrecht erhalten werden kann. Jede gelungene Konstruktion dieser Art stärkt die Einschätzung eines Prinzips als „fundamental“. Die Erhaltung gewisser Größen lässt sich mit Symmetrieprinzipien verknüpfen. Die Entdeckung, dass ein gewisses Symmetrieprinzip verletzt ist (wie zum Beispiel die räumliche Parität beim radioaktiven β-Zerfall), ist daher gleichbedeutend damit, dass eine zunächst als allgemeine Erhaltungsgröße eingeordnete physikalische Größe bei bestimmten Prozessen doch nicht erhalten ist, und erregt daher meist großes Aufsehen. 19 Eine mathematische Definition der Mengenartigkeit erfolgt in Abschnitt 1.5: Mengenartig sind diejenigen Größen, für die sich eine Kontinuitätsgleichung aufstellen lässt.
1.4 Einfache Systeme
| 17
sätzen: Die Teilchenzahl einer chemischen Spezies nimmt auf Kosten einer anderen ab. Dass diese Phänomene nicht auf die Chemie beschränkt sind, zeigen die Beispiele des radioaktiven Zerfalls und der Reaktionen zwischen Elementarteilchen in der Hochenergiephysik. Ein weiteres wichtiges Beispiel für eine Größe, die zwar mengenartig, aber nicht allgemein erhalten ist, bildet die Entropie, welche ebenfalls nicht bei allen, sondern nur bei als reversibel bezeichneten Prozessen erhalten ist. Neben der Energie stellen die elektrische Ladung, der Impuls und der Drehimpuls weitere Beispiele für Größen dar, die einem allgemeinen, das heißt nicht auf bestimmte Prozesse beschränkten Erhaltungssatz genügen. Bei Erhaltungsgrößen werden die Bilanzen besonders einfach, weil die Bilanzgleichung keine Erzeugungs- oder Vernichtungsterme enthält. Das bedeutet, dass eine Zunahme einer solchen Größe in einem System mit einer gleich großen Abnahme dieser Größe in einem anderen System verbunden ist. Die Beschreibung der Energieänderungen von physikalischen Systemen beziehungsweise der Energietransport zwischen Systemen spielt in der gesamten Physik eine zentrale Rolle. Charakteristisch ist, dass Änderungen der Energie immer auch mit der Änderung anderer physikalischer Größen verknüpft sind. Was üblicherweise als unterschiedliche Formen der Energie bezeichnet wird, wollen wir dadurch präziser fassen, dass wir neben der Energie stets auch die anderen bei einem Prozess ausgetauschten Größen benennen. Der Nachteil der Unterscheidung von verschiedenen Energieformen besteht darin, dass diese die Größe Energie je nach dem betrachteten Prozess mit anderen Zusatzattributen befrachtet, welche mit dem heutigen Konzept einer physikalischen Größe – wonach diese allein einen Zahlenwert und eine Einheit repräsentiert – nicht vereinbar sind. Prozesse, bei denen sich die Werte von Erhaltungsgrößen ändern, setzen für ihre Realisierung stets die Existenz anderer Systeme voraus, aus denen die erhaltenen Größen zugeführt werden oder die sie aufnehmen müssen, sodass die Bilanzen am Ende stimmen. Wollen wir uns bei der Betrachtung eines bestimmten Systems über die Natur dieser zusätzlich erforderlichen Systeme keine weiteren Gedanken machen, so nennen wir diese einfach Reservoire.
1.4 Einfache Systeme Bevor wir uns der Beschreibung thermischer Systeme zuwenden, liegt es nahe sich einmal anzusehen, wie das oben skizzierte Beschreibungsverfahren für wohlbekannte Systeme der klassischen Mechanik oder der Elektrodynamik aussieht. Im folgenden Abschnitt werden einige Beispiele von einfachen Systemen aufgeführt. Diese Beispiele
18 | 1 Wie beschreibt man physikalische Systeme? sind nicht zufällig gewählt: wir wollen sie als „Archetypen“20 der zahllosen in der Natur auftretenden Objekte auffassen. Bei diesen Systemen kommt es nicht so sehr darauf an, dass sie die Eigenschaften der Gegenstände, die sie repräsentieren, im Detail und quantitativ richtig wiedergeben – dann würden wir uns in diesen Details verlieren –, sondern bestimmte, häufig auftretende Elemente zu charakterisieren und anhand dieser einen Überblick über fundamentale Eigenschaften und Prinzipien zu gewinnen. In diesem Sinne sind die archetypischen Systeme nicht als getreue Abbilder real existierender (Klassen von) Objekte(n) anzusehen, sondern als deren – das wesentliche betonende – Karikaturen! Im Laufe der folgenden Kapitel werden wir noch einige weitere solcher „archetypischen“ Systeme kennenlernen, mit denen sich (unter Verzicht auf individuelle Details) eine ganz erstaunliche Breite an Naturphänomenen zumindest qualitativ verstehen lässt. Im Folgenden wollen wir die allgemeinen Prinzipien der Thermodynamik mit Hilfe einiger archetypischer Beispiele für physikalische Systeme illustrieren. Dazu geben wir jeweils deren Variablen und die zwischen diesen bestehenden Zustandsgleichungen an und betrachten typische Prozesse. In diesen Beispielen werden die Zustandsgleichungen üblicherweise aus Experimenten gewonnen. Wir beschränken uns hier überwiegend auf die einfachsten Varianten und Grenzfälle dieser Systeme.
Newton’scher freier Körper: Dieses System hat die folgenden physikalischen Größen:21 Energie E , Impuls P , Geschwindigkeit v und die Masse M . Zunächst beschränken wir uns auf Prozesse, bei denen M konstant ist; damit bleibt als einzig möglicher Prozess die Beschleunigung des Körpers durch Impulszufuhr. Aus der Mechanik kennen wir den Zusammenhang zwischen dem Impuls und der im Körper gespeicherten Energie: E(P ) =
P2 2M
(1.1)
Die differenzielle Energie-Änderung während eines Beschleunigungsprozesses beträgt dann: dE = v dP , (1.2) wobei v(P ) :=
∂E(P ) ∂P
(1.3)
20 Wir verwenden dieses Wort in demselben Sinn, in dem in der Psychologie versucht wird, die Vielzahl der Charaktere der Menschen trotz aller individuellen Unterschiede in wenige Klassen zusammenzufassen, um gewisse gemeinsame Charakteristika hervorzuheben. 21 Bei (kräfte-)freien Körpern sind Impuls und Energie definitionsgemäß unabhängig von der Zeit und damit auch vom Ort des Körpers.
1.4 Einfache Systeme
1
2 P1 - 'P
P2 + 'P
| 19
Abb. 1.1. Beschleunigung des Körpers 2 durch Impulszufuhr ΔP durch einen Stoßprozess (mit dem Körper 1).
die dynamische Geschwindigkeit definiert.22 Diese Definition der Geschwindigkeit erscheint gegenüber der vertrauten kinematischen Definition der Geschwindigkeit (v = dr(t)/dt) zunächst ungewohnt, weil sie weder auf den Ort r(t) des Teilchens noch auf die Zeit t Bezug nimmt. Sie setzt nicht voraus, dass der durch den Körper repräsentierte Transport von Energie und Impuls in einem bestimmten Raumbereich lokalisiert ist. Für lokalisierbare Körper sind die dynamische und die kinematische Geschwindigkeit identisch. Darüber hinaus erlaubt Gl. 1.3 die Geschwindigkeit auch im Bereich der Quantenmechanik zu definieren, nach der Teilchen mit einem scharfen Impuls delokalisiert sind. In diesem Fall ist die kinematische Definition der Geschwindigkeit nicht mehr anwendbar, weil die Ortsunschärfe der Teilchen maximal ist. Besondere Bedeutung gewinnt die dynamische Definition von v für den Fall des Lichts, dessen Geschwindigkeit im Vakuum nach Einstein stets den Betrag |v| = c hat. Gemäß den de Broglie-Relationen E = ω und P = k entspricht die dynamische Geschwindigkeit der Gruppengeschwindigkeit v G = ∂ω(k)/∂k von mehr oder weniger ausgedehnten Wellenpaketen. Da die dynamische Geschwindigkeit unabhängig von der Form von E(P ) ist, legt Gl. 1.1 alle Relationen zwischen den dynamischen Variablen des Systems „freier Körper“ fest. Gl. 1.1 definiert also das System „freier Körper“ in seiner einfachst möglichen Form, nämlich für eine P -unabhängige Masse. Alternativ zur Angabe der Funktion E(P ) kann das System „freier Körper“ auch durch die Angabe seiner Zustandsgleichung v(P ) =
P M
(1.4)
beschrieben werden. Weiterhin definiert die Zustandsgleichung die Masse M des Körpers als das Verhältnis von Impuls und Geschwindigkeit. Die Definition eines Systems durch Angabe der Funktion E(P ) und durch Angabe seiner Zustandsgleichung sind äquivalent, da Gl. 1.1 (bis auf eine Integrationskonstante) durch Integration von Gl. 1.2 (nach Einsetzen von Gl. 1.4) oder umgekehrt Gl. 1.4 durch Differenzieren aus Gl. 1.1 gewonnen kann. Die Äquivalenz gilt auch für alle folgenden Beispiele.
22 Hier ist ∂E(P )/∂P als Abkürzung für gradP E(P ) zu verstehen.
20 | 1 Wie beschreibt man physikalische Systeme? Einstein’scher freier Körper: Nach der Relativitätstheorie Einsteins ändert sich der funktionale Zusammenhang zwischen Energie und Impuls bei hohen Energien. Um die Schlagkraft des thermodynamischen Beschreibungsverfahrens zu illustrieren, wollen wir den Energie-ImpulsZusammenhang eines freien Körpers für beliebige Energien allein aus der Definition der Masse (Gl. 1.4), der Einstein’schen Relation E = M c2
(1.5)
und der fundamentalen Relation 1.2 herleiten. Gleichung 1.5 bedeutet, dass Energie und Masse danach nicht zwei verschiedene, sondern dieselbe physikalische Größe sind, deren Einheiten sich nur um die Maßsystemkonstante c2 unterscheiden. Materie ist strukturierte Energie und daher massebehaftet. Wird ein Teil der Energie, beispielsweise durch das Eingehen von Bindungen bei chemischen Reaktionen, nach außen abgegeben, so äußert sich dies in einer reduzierten Ruhemasse der Reaktionsprodukte. Bei gewöhnlichen chemischen Reaktionen ist dieser Massendefekt im Vergleich zur Ruhemasse (siehe unten) vor und nach der Reaktion so klein, dass er in der Regel nicht messbar ist. Allein bei Kernreaktionen wie der Kernspaltung und der Kernfusion entspricht der Massendefekt einem messbaren Bruchteil (einige %) der Gesamtmasse der Reaktanden – mit manchmal katastrophalen Auswirkungen der freigesetzten Energie. Da E eine Funktion von P ist, bedeutet die Äquivalenz von Energie und Masse, dass die Masse im Gegensatz zum Newton’schen Körper nicht als konstant angesehen werden kann, sondern vom Wert des Impulses abhängen muss. Nehmen wir an, dass die Masse unabhängig von der Richtung von P ist, so kann M nur von |P | abhängen.23 Daher hat die Zustandsgleichung eines Einstein’schen freien Körpers die Gestalt: v(P ) =
P . M (P )
Setzen wir diese Beziehung in Gl. 1.2 ein und integrieren, so erhalten wir: dE = c2 dM =
M c
c 2
2
2 M0
|P | d|P | , M
|P |
|P | d|P | ,
M dM =
M 2 (P ) − M02 =
0
1 2 P , 2
wobei die Masse M0 des Körpers bei P = 0 seine Ruhemasse genannt wird. Lösen wir die letzte Gleichung nach E = M c2 auf, so erhalten wir den Energie-Impuls-
23 In der Festkörperphysik werden häufig sogenannte Quasiteilchen betrachtet, deren Masse nicht nur vom Betrag, sondern auch von der Richtung ihres Impulses abhängt.
1.4 Einfache Systeme
| 21
Abb. 1.2. Energie-Impuls-Zusammenhang für relativistische freie Körper. Die gestrichelten Linien geben den Newton’schen und den extrem-relativistischen Grenzfall an.
Zusammenhang eines relativistischen freien Körpers: 2 2 E(P ) =
cP
+ E0 ,
(1.6)
wobei E0 = M0 c2 die M0 entsprechende Ruheenergie ist. Gleichung 1.5 hat die fundamentale Konsequenz, dass die Werte der Energie (nach Festlegung eines Bezugspunktes für v ) absolut messbar und damit eindeutig festlegbar sind, weil die Ruhemasse im Prinzip in Stoß- oder anderen Beschleunigungsexperimenten gemessen werden kann.24 Die relativistische Form von E(P ) ist in Abb. 1.2 dargestellt. Interessant ist, dass die durch Gl. 1.3 definierte dynamische Geschwindigkeit sich im Grenzfall c|P | E0 asymptotisch an den Wert c annähert, ihn aber nie überschreitet. Daher stellt die Lichtgeschwindigkeit c eine Grenzgeschwindigkeit dar, die selbst bei beliebiger Zufuhr von Energie und Impuls nicht überschritten werden kann. Physikalisch ist die Existenz einer Grenzgeschwindigkeit wieder auf Gl. 1.5 zurückzuführen, da die dem Körper zur Beschleunigung gemeinsam mit dem Impuls zugeführte Energie zur trägen Masse des Körpers beiträgt. Bei gleichem Impulsübertrag ist der resultierende Geschwindigkeitszuwachs daher umso kleiner, je größer die Energie des Körpers ist. Kombiniert man die Existenz einer Grenzgeschwindigkeit c mit dem Relativitätsprinzip, das heißt der Forderung nach der Gleichberechtigung aller gegeneinander gleichförmig bewegten Bezugssystem, so folgt daraus die Feststellung, dass die Grenzgeschwindigkeit in allen Bezugssystemen gleich sein muss. Das bedeutet, dass das Galilei’sche Gesetz der Addition von Geschwindigkeiten bei Wechsel in ein anderes Bezugssystem bei großen Geschwindigkeiten ungültig werden muss. Wäre dies nicht
24 Dass dies in der Praxis schwierig ist, weil die machbaren Energieänderungen meist sehr klein gegen die Ruheenergie E0 sind, ist für diese fundamentale Betrachtung nicht relevant.
22 | 1 Wie beschreibt man physikalische Systeme? der Fall, so ließe sich zu einem Bezugssystem, in dem ein Körper die Geschwindigkeit c hat, stets ein anderes Bezugsystem finden, in dem die Geschwindigkeit dieses Körpers größer als c ist. Die Invarianz von c bei einem Wechsel des Bezugssystems wird durch die Lorentz-Transformationen sichergestellt, welche die nur bei Geschwindigkeiten |v| c gültigen Galilei-Transformationen verallgemeinern.25 Für das Folgende sind insbesondere die beiden Grenzfälle c|P | E0 und c|P | E0 interessant. Im ersten Fall liefert die Taylor-Entwicklung von Gl. 1.6 nach c|P |/E0 : E(P ) = E0 +
P2 2M0
und nimmt bis auf den konstanten Beitrag E0 die klassische Form Gl. 1.1 an. Entsprechend hat die Zustandsgleichung in diesem Grenzfall die Form v = P /M0 . Diese Newton’sche Näherung der Zustandsgleichung des freien Körpers hat einen ähnlich asymptotischen Charakter wie das später zu besprechende ideale Gasgesetz, das nur im Grenzfall kleiner Dichten und hoher Temperaturen gilt und das Verhalten der Gase außerhalb dieses Bereiches nicht korrekt beschreibt. Den entgegengesetzten Grenzfall mit M0 c2 |cP | nennt man extrem relativistisch. In diesem Fall ist E(P ) = c|P | .
Ist M0 = 0, so beträgt die dynamische Geschwindigkeit nach Gl. 1.6 stets c. Das wichtigste Beispielsystem mit dieser Eigenschaft, das uns im Zusammenhang mit der thermischen Strahlung begegnen wird, sind die Photonen, das heißt die Quanten des Lichtfelds. Aber auch die Elektronen und Positronen (M0 c2 = 0.511 MeV) in Teilchenbeschleunigern können Energien im GeV-Bereich und damit den extrem relativistischen Grenzfall erreichen. Für Systeme mit kleiner oder verschwindender Ruhemasse M0 können die Gesetze der Quantenmechanik nicht mehr ignoriert werden. Wie oben bereits erwähnt, kann der durch das System repräsentierte Transport von Energie und Impuls nicht mehr auf einen wohldefinierten Raumbereich lokalisiert werden. Deshalb spricht man im Grenzfall kleiner Massen nicht mehr von „Körpern“, sondern von „Teilchen“ – oder besser von „Quanten“. Während das Wort „Teilchen“ noch suggeriert, dass es sich bei dem System um ein Objekt handelt, das sich von makroskopischen Körpern nur durch den viel kleineren Wert der Ruhemasse unterscheidet, macht die letztere Bezeichnung deutlich, dass es sich um etwas qualitativ Neues, nämlich quantenmechanische Objekte handelt. Für die Relationen 1.1, 1.2 und 1.5 sind diese Unterschiede aber irrelevant, und daher behalten alle nur auf diesen Relationen basierenden Schlussfolgerungen ihre Gültigkeit.26 Tatsächlich sind die Gleichungen 1.1, 1.2, 1.5 und deren Konsequen-
25 Historisch war bekanntlich die Universalität von c der Ausgangspunkt von Einsteins Überlegungen und die Relation E = M c2 die Folgerung. 26 Ein schönes Beispiel bildet der in Aufgabe 1.1 behandelte Compton-Effekt.
1.4 Einfache Systeme
| 23
L=J:
-mg
˙ durch DrehimpulszuAbb. 1.3. Winkelbeschleunigung Ω ˙ fuhr mittels eines externen Drehmoments M = L.
zen fast das Einzige, was von der klassischen Mechanik in die Quantenphysik übernommen werden kann. Nach diesem Exkurs in die moderne Physik wollen wir jetzt weitere wohlbekannte Beispiele für einfache Systeme aufzählen:
Symmetrischer freier Kreisel (Rotator): Dieses System hat die physikalischen Größen Energie E , Drehimpuls L, Winkelgeschwindigkeit Ω und das Trägheitsmoment J . Zunächst beschränken wird uns auf Prozesse, bei denen J konstant ist; damit bleibt als einzig möglicher Prozess die Beschleunigung des Rotators. Im Kreisel gespeicherte Energie: E(L) =
L2 . 2J
(1.7)
Energieänderung während der Beschleunigung des Rotators: dE = Ω dL ,
(1.8)
∂E(L) ∂L
(1.9)
wobei Ω=
analog zur dynamischen Geschwindigkeit die dynamische Definition der Winkelgeschwindigkeit darstellt. Zustandsgleichung: Ω(L) = L/J . (1.10) Wieder sind die Gl. 1.7 und 1.10 charakteristisch für das System „Kreisel“, während Gl. 1.8 und 1.9 für alle Systeme gelten, die die Variablen L und Ω besitzen. Ebenso wie das System „Freier Körper“ existiert das System „Kreisel“ auch in einer quantenmechanischen Version, die uns später im Zusammenhang mit Molekülgasen begegnen wird.
Lineare Feder: Dieses System hat die physikalischen Größen Energie E , Verschiebung x, Kraft F und die Federkonstante K. Zunächst beschränken wird uns auf Prozesse, bei denen K kon-
24 | 1 Wie beschreibt man physikalische Systeme?
F1
Δx
F2
Abb. 1.4. Spannen einer Feder durch Auslenkung Δx mit Hilfe zweier externer Kräfte F 1 und F 2 . Damit sich die Feder tatsächlich spannt und sich nicht einfach unter Impulsaufnahme in Bewegung setzt, muss die auf das rechte Ende der Feder wirkende Kraft F 1 durch eine entgegengesetzt gleiche Gegenkraft F 2 = −F 1 kompensiert werden. Wie am Ende des nächsten Abschnitts erklärt wird, kann dies auch so verstanden werden, dass der über das rechte Ende der Feder zugeführte Impuls über das linke Ende wieder abgeführt werden muss.
stant ist; damit bleibt als einzig möglicher Prozess das Spannen der Feder. In der Feder gespeicherte Energie: E(x) =
1 Kx2 . 2
(1.11)
Energieänderung während des Spannens der Feder: dE = −F dx ,
wobei −F (x) =
∂E(x) ∂x
(1.12)
(1.13)
den bekannten allgemeinen (das heißt systemunabhängigen) Zusammenhang zwischen potentieller Energie und Kraft darstellt. Zustandsgleichung: F (x) = −Kx . (1.14) Die Kraft F , mit der die Feder auf andere Systeme wirkt, ist der Auslenkung entgegengesetzt. Wie beim freien Teilchen sind die Gl. 1.11 und 1.14 charakteristisch für das System „lineare Feder“. Weil bei realen elastischen Systemen die Federkonstante K(x) von der Auslenkung abhängt, werden bei großen Auslenkungen nichtlineare Zusatzterme in der Zustandsgleichung auftreten.
Harmonischer Oszillator: Hier handelt es sich um ein System, welches aus einem Körper und einer Feder zusammengesetzt ist, wobei der Ort des Körpers und das rechte Ende der Feder fest verknüpft sind. Derartigen zusammengesetzten Systeme werden wir später häufig begegnen. Das System hat die physikalische Größen Energie E , Impuls P , Geschwindigkeit v , Masse M , Auslenkung x, Kraft F und die Federkonstante K. Es erlaubt zwei Typen von Prozessen, die kombiniert werden können: die Beschleunigung des Teilchens und
1.4 Einfache Systeme
| 25
e+ + + + + + + + + + + + +
-----------
U + e-
Abb. 1.5. Laden eines Kondensators über eine externe elektrische Spannungsquelle.
das Spannen der Feder. Im System gespeicherte Energie: E(P , x) =
P2 1 + Kx2 . 2M 2
(1.15)
Energieänderung während eines beliebigen Prozesses: dE = v dP − F dx ,
(1.16)
wobei v und −F wieder durch die partiellen Ableitungen von E nach P und x gegeben sind. Dieses System hat die beiden Zustandsgleichungen: v(P ) =
P M
und
F (x) = −Kx .
(1.17)
Analog zum freien Teilchen und zur elastischen Feder sind die Gl. 1.15 und 1.17 charakteristisch für das zusammengesetzte System „Harmonischer Oszillator“. Die Zerlegbarkeit dieses Systems äußert sich darin, dass seine Massieu-Gibbs-Funktion aus zwei variablenfremden Summanden besteht, die die Massieu-Gibbs-Funktionen der beiden Teilsysteme darstellen. Weiter unten werden wir ein anderes Beispiel kennenlernen, welches sich nicht in dieser Weise zerlegen lässt, nämlich den Kondensator mit variablem Plattenabstand.
Kondensator: Dieses System hat die physikalischen Größen Energie E , elektrische Ladung Q, elektrische Spannung/elektrisches Potenzial U = ΔΦ und die elektrostatische Kapazität C . Zunächst beschränken wir uns auf Prozesse, bei denen C konstant ist; damit bleibt als einzig möglicher Prozess das Laden des Kondensators. Im elektrischen Feld des Kondensators gespeicherte Energie: Q2 . 2C
(1.18)
dE = U dQ ,
(1.19)
E(Q) =
Energieänderung während des Ladens:
26 | 1 Wie beschreibt man physikalische Systeme? wobei U (Q) =
∂E(Q) ∂Q
(1.20)
die dynamische Definition der Spannung darstellt. Wie sich in den späteren Kapiteln zeigen wird, hat auch diese Beziehung einen größeren Gültigkeitsbereich als die rein elektrostatische Beziehung zwischen U und der elektrischen Feldstärke E : r2 E(r) dr .
U= r1
Zustandsgleichung: U (Q) =
Q . C
(1.21)
Der Kondensator erscheint zunächst als ein rein elektrisches System. Durch eine geringfügige Modifikation lässt er sich jedoch zu einem interessanten elektromechanischen System erweitern, welches uns zur Illustration der thermodynamischen Prinzipien im Folgenden noch gute Dienste leisten wird.
Kondensator mit variablem Plattenabstand: Dieses System hat die physikalischen Größen Energie E , elektrische Ladung Q, elektrische Spannung U , elektrische Kapazität C , Plattenabstand x und die Kraft F zwischen den Kondensatorplatten. Jetzt gestatten wir auch eine Änderung der Kapazität des Kondensators durch die Variation des Plattenabstands, und daher gibt es zwei Typen von Prozessen, die beliebig kombiniert werden können: das Laden des Kondensators und die Änderung des Plattenabstandes. Im elektrischen Feld des Kondensators gespeicherte Energie: E(Q, x) = √
Q2 Q2 x = , 2C(x) 20 A
(1.22)
mit C(x) = 0 A/x (solange x A), wobei A die Fläche der Kondensatorplatten und 0 die elektrische Feldkonstante sind. In diesem Beispiel kann die Kapazität des Plattenkondensators über den Plattenabstand x verändert werden. Energieänderung während eines beliebigen Prozesses: dE = U dQ − F dx ,
wobei U (Q, x) =
∂E(Q, x) ∂Q
und
− F (Q, x) =
(1.23) ∂E(Q, x) ∂x
(1.24)
die beiden Zustandsgleichungen des Systems liefern: U (Q, x) = −F (Q, x) =
Q Qx = , C(x) 0 A
(1.25)
Q2 . 20 A
(1.26)
1.4 Einfache Systeme
| 27
Φ
I
Abb. 1.6. Magnetische Flussänderung einer Spule über eine externe elektrische Stromquelle. Der magnetische Fluss in der Spule lässt sich durch das Einführen eines leicht magnetisierbaren Spulenkerns um noch mehrere Größenordnungen verstärken.
Das Kraft-Abstand-Gesetz (Gl. 1.26) für dieses System ist ungewöhnlich, weil die Kraft (anders als bei der elastischen Feder) unabhängig vom Abstand ist. Dies gilt allerdings nur bei konstanter Ladung! Bei konstanter Spannung U gilt ein anderes Kraft-AbstandGesetz, wie man sieht, wenn man Gl. 1.25 nach Q auflöst und in Gl. 1.26 einsetzt. Eine derartige Abhängigkeit der Relationen zwischen zwei Variablen von der Wahl der übrigen unabhängigen Variablen wird uns in der Thermodynamik sehr häufig begegnen.
Magnetspule: Dieses System hat die physikalischen Größen Energie E , magnetischer Fluss Φ, elektrischer Strom I und die Induktivität L. Zunächst beschränken wird uns auf Prozesse, bei denen L konstant ist; damit bleibt als einzig möglicher Prozess die Änderung des magnetischen Flusses in der Spule. Im Magnetfeld der Spule gespeicherte Energie: E(Φ) =
Φ2 . 2L
(1.27)
Energieänderung während der magnetischen Flussänderung: dE = I dΦ ,
(1.28)
wobei magnetischer Fluss und elektrischer Strom über die Zustandsgleichung I(Φ) =
∂E(Φ) Φ = ∂Φ L
(1.29)
verknüpft sind. Dabei ist der Strom nicht notwendigerweise die unabhängige Variable - genauso kann der magnetische Fluss in der Spule über ein externes Magnetfeld kontrolliert und Induktionsströme in der Spule angeworfen werden. Analog zum mechanischen Oszillator lassen sich Kondensator und Spule zu einem elektrischen Oszillator, dem bekannten elektrischen Schwingkreis, kombinieren.
28 | 1 Wie beschreibt man physikalische Systeme?
1.5 Extensive und intensive Größen In diesem Abschnitt wollen wir versuchen, eine gewisse Systematik in die oben angeführten Beispiele zu bringen. Dabei werden wir jedes System als eine Art „black box“ auffassen, aus der nur Stellknöpfe für die unabhängigen Variablen und Anzeigeinstrumente für die abhängigen Variablen herausragen. Der unschätzbare Vorteil einer solchen (zunächst sehr abstrakten) Beschreibung besteht darin, dass sie unabhängig vom Inhalt der „box“ nur auf den Relationen zwischen den physikalischen Größen beruht und damit eine phänomenologische Beschreibung erlaubt. Diese Art der Beschreibung ist selbst dann möglich, wenn der Inhalt der „box“ unbekannt ist! Sie ist damit prädestiniert für die Untersuchung von neuen Phänomenen, für die zunächst kein Modell existiert, das unsere Vorstellungen vom Inhalt der „box“ widerspiegelt. Diese Herangehensweise an die Beschreibung der Natur ist sehr positivistisch, das heißt sie orientiert sich allein an messbaren Fakten, nämlich den Werten der physikalischen Größen. Sie ist immer dann der einzig mögliche Zugang, wenn sich die bekannten Modellvorstellungen allesamt als untauglich erweisen, das heißt, wenn ein Stück von fundamental neuer Physik entdeckt wird. Die Bildung von neuen Modellen zur Beschreibung dieser Phänomene erfolgt in der Regel schrittweise und kann Jahrzehnte hinter der experimentellen Feststellung der Systemeigenschaften zurückbleiben. Kriterium für die Korrektheit der Modellvorstellungen ist dabei stets die Genauigkeit der qualitativen und quantitativen Übereinstimmung zwischen den Modellaussagen und den Messwerten. Wenn allerdings ein Durchbruch erzielt wurde und ein Modell gefunden wurde, welches die neue Physik richtig widerspiegelt, dann ermöglicht das Modell meist eine Fülle neuer Vorhersagen, die sich experimentell überprüfen lassen und die Experimentatoren zu neuen Phänomenen führen. Das wichtigste historische Beispiel für diesen Prozess ist die allmähliche Entwicklung der Quantentheorie auf der Basis zunächst kleiner unverstandener Abweichungen zwischen den experimentellen Daten und der auf klassischen Modellen basierenden Theorie. Im Laufe dieser Darstellung werden wir immer wieder auf diese Entwicklung zurückkommen. Zunächst stellen wir fest, dass zur Beschreibung der Energieänderung in den obigen Modellsystemen stets Paare (ξ, X) von physikalischen Größen erforderlich sind: (v, P ): Energieänderung durch Impulszufuhr (Ω, L): Energieänderung durch Drehimpulszufuhr (U, Q): Energieänderung durch Ladungszufuhr (−F , x): Energieänderung durch Verschiebung (I, Φ): Energieänderung durch magnetische Flußänderung
Die beiden Partner eines solchen Variablenpaares ξ und X unterscheiden sich dabei in einer charakteristischen Weise. Dies erkennen wir, wenn wir in einem GedankenExperiment den Prozess der Vergrößerung eines Systems um einen Faktor λ betrachten. Bei diesem Prozess nehmen die Größen Xi um den Faktor λ zu, während die Grö-
1.5 Extensive und intensive Größen
|
29
ßen ξi konstant bleiben. So bleibt die Geschwindigkeit eines freien Körpers konstant, wenn wir dessen Energie, Masse und Impuls um denselben numerischen Faktor ändern. Ebenso bleibt die Spannung eines Kondensators konstant, wenn dessen Kapazität und Ladung um denselben Faktor geändert werden. Die Variablen vom Typ X nennt man extensiv27 und die Variablen vom Typ ξ heißen intensiv. Zusammengehörige Paare (ξ, X) von Variablen heißen thermodynamisch konjugiert. Zunächst betrachten wir die Beispiele „Freier Körper“, „Freier Kreisel“ und „Kondensator“. In allen diesen Systemen erfolgt die Zustandsänderung durch Zufuhr einer Größe von Typ X , nämlich Impuls, Drehimpuls und elektrische Ladung. Außerdem erfordert die Zustandsänderung die Zufuhr einer gewissen Menge von Energie. Diese Größen haben gemeinsam, dass sie einem allgemeinen Erhaltungssatz genügen, das heißt dass die Änderung von P , L, Q und E allein durch Transport in oder aus einem anderen System erfolgen kann. Dies bedeutet, dass die Änderungen der Werte diese Größen in den beteiligten Systemen nicht beliebig sind, sondern dass beispielsweise eine Änderung von E um ΔE in einem System eine Änderung von −ΔE in den anderen Systemen zur Folge haben muss. Derartige Bilanzen, wie sie zum Beispiel bei Stoßprozessen in der Mechanik auftreten, ermöglichen weitgehende Aussagen über physikalische Prozesse, ohne dass der genaue zeitliche Ablauf des Prozesses (beispielsweise die genaue Bahnkurve der beteiligten Körper) bekannt sein muss. Physikalische Größen, welche die Aufstellung von Bilanzen erlauben, wollen wir – wie bereits erwähnt – bilanzierbar oder mengenartig nennen. Nun wollen wir uns der mathematischen Formulierung von Bilanzen zuwenden. Die zeitliche Änderung X˙ des innerhalb eines gegebenen Raumbereichs G enthaltenen Betrags einer mengenartigen Größe X lässt sich mit Hilfe der Kontinuitätsgleichung quantitativ beschreiben. Diese wird üblicherweise im Rahmen der Elektrodynamik im Zusammenhang mit der Erhaltung der elektrischen Ladung diskutiert. Sie lässt sich aber auf beliebige mengenartige Größen übertragen, wenn ein Zusatzterm ΣX eingefügt wird, welcher möglichen Erzeugungs- oder Vernichtungsprozessen Rechnung trägt: dX + IX = ΣX dt
Kontinuitätsgleichung.
(1.30)
Nicht alle extensiven Größen sind auch mengenartig. So sind die Verschiebung x, das Volumen V oder der magnetische Fluss Φ zwar extensiv, aber nicht mengenartig, denn für diese können keine durch eine Kontinuitätsgleichung quantifizierbaren Bilanzen aufgestellt werden. In diesem Sinne ist das für die zeitliche Änderung des Volumens V˙ gelegentlich verwendete Wort „Volumen-Strom“ irreführend. Dieser Ausdruck ist nur in Zusammenhang mit inkompressiblen Flüssigkeiten sinnvoll, wo das Volumen ein
27 Umgekehrt können wir den Prozess der Systemvergrößerung durch die Vergrößerung aller extensiven Variablen des Systems um denselben Faktor λ definieren.
30 | 1 Wie beschreibt man physikalische Systeme?
IX
dX , Σ X dt
Abb. 1.7. Die Summe der zeitlichen Änderung X˙ einer mengenartigen Größe X innerhalb eines Gebietes G und des Stroms IX von X durch die Berandung ∂G von G ist gleich der Erzeugungs- (Vernichtungs-) Rate ΣX von X in G.
verlässliches Maß für die Stoffmenge der Flüssigkeit darstellt. Hinter dem „Volumenstrom“ verbirgt sich also eigentlich ein Massen- oder Mengenstrom. In einer derart verallgemeinerten Kontinuitätsgleichung ist IX der Strom der Größe X und ΣX ihre Erzeugungsrate. ΣX < 0 entspricht der Vernichtung von X . Für fast alle mengenartigen Größen ist das Vorzeichen des Stromes dabei so festgelegt, dass ein X -Strom, der G verlässt, also zu einer Abnahme von X in G führt, positiv gezählt wird. In der Mechanik werden die Impulsbilanz dP + IP = 0 dt
(1.31)
dL + IL = 0 dt
(1.32)
und die Drehimpulsbilanz ebenfalls durch Kontinuitätsgleichungen beschrieben. Vergleichen wir Gleichung 1.31 mit dem 2. Newton’schen Axiom dP =F dt
so folgt
I P = −F .
(1.33)
Eine analoge Beziehung besteht zwischen dem Drehmoment und dem Drehimpulsstrom. Weil der Impuls und der Drehimpuls Erhaltungsgrößen sind, die sich nur durch Zu- oder Abfluss ändern können, liegt es nahe, die Kraft und das Drehmoment als Impulsstrom und Drehimpulsstrom zu interpretieren. Historisch wurde diese Erkenntnis erst sehr spät formuliert, nämlich als man erkannte, dass man nicht nur der bewegten Materie, sondern auch dem elektromagnetischen Feld einen Impuls zubilligen muss, wenn man nicht mit dem Impulserhaltungssatz in Konflikt kommen möchte (Planck, 1908). Im Rückblick ist dies nicht sehr überraschend, denn alle drei Newton’schen Axiome bringen die Erhaltung des Impulses zu Ausdruck. Das Minuszeichen in Gl.1.33 entspricht dem Minuszeichen in −F = ∂E(x, . . . )/∂x. Eine auf einen Körper wirkende Kraft lässt sich also direkt als ein Strom von Impuls interpretieren. Der netto in den Körper hineinströmende Impuls ändert den Bewegungszustand des Körpers genauso, wie ein in einen Kondensator hineinfließender elektrischer Strom dessen Ladungszustand ändert. Im Gegensatz dazu ändert der durch eine gespannte Feder fließende Impulsstrom deren Bewegungszustand nicht, weil kein
1.6 Die Gibbs’sche Fundamentalform
| 31
Impuls in der Feder angehäuft wird, sondern, wie in Abb. 1.4 dargestellt, über das andere Federende wieder abfließt. Diese Situation ist das exakte Analogon zu einer stromdurchflossenen Magnetspule, bei der die durchfließende Ladung ebenfalls nirgendwo gespeichert, sondern über den zweiten Kontakt vollständig wieder abgegeben wird.
1.6 Die Gibbs’sche Fundamentalform Als nächstes wollen wir die mit der Änderung einer Größe X verbundene Energieänderung genauer betrachten. Nehmen wir an, ein System habe r Freiheitsgrade, das heißt r verschiedene, unabhängig voneinander zu variierende extensive Größen Xi . Das thermodynamische Beschreibungsverfahren basiert auf der folgenden Grundannahme:28
Die Energie eines Systems lässt sich stets als Funktion E(X1 , . . . , Xr ) seiner unabhängigen extensiven Variablen {X1 , . . . , Xr } darstellen! Es wird sich im Folgenden zeigen, dass sich die Werte aller anderen physikalischen Größen des Systems aus der Funktion E(X1 , . . . , Xr ) gewinnen lassen. Das bedeutet, dass E(X1 , . . . , Xr ) das System vollständig charakterisiert. Solche System-charakterisierenden Funktionen nennen wir Massieu-Gibbs-Funktionen.29 Dies wird durch die in Abschnitt 1.4 dargestellten Beispiele illustriert: Die Gleichungen 1.1, 1.6, 1.7, 1.11, 1.15, 1.18, 1.27 und 1.22 stellen die Massieu-Gibbs-Funktionen der dort besprochenen einfachen physikalischen Systeme dar. Wie diese Beispiele zeigen, können wir die Zustandsgleichungen 1.4, 1.10, 1.14, 1.17, 1.21, 1.29, 1.25 und 1.26 dieser Systeme durch (partielles) Ableiten von E(X1 , . . . , Xr ) gewinnen. Daher folgt aus unserer Grundannahme die allgemeine Form der mit infinitesimalen Xi -Änderungen verknüpften Energieänderung dE : dE =
r i=1
ξi (X1 , . . . , Xr ) dXi
Gibbs’sche Fundamentalform.
(1.34)
28 Diese Grundannahme ist unabhängig von der Erfahrung, dass E eine Erhaltungsgröße ist. 29 In Abschnitt 5.1 werden wir sehen, dass E(X1 , . . . , Xr ) nicht die einzige Funktion ist, in der sich alle Eigenschaften eines Systems kompakt zusammenfassen lassen. Allgemein nennt man die systemcharakterisierenden Funktionen auch thermodynamische Potenziale. Diese Bezeichnung ist dadurch motiviert, dass sie die verschiedenen Zustandsgleichungen eines Systems in einer einzigen Funktion zusammenfasst – genau wie die verschiedenen Kraftkomponenten eines konservativen Kraftfelds in einer einzigen Funktion (dem Potenzial des Kraftfelds) zusammenfasst werden können.
32 | 1 Wie beschreibt man physikalische Systeme? Mathematisch gesehen, stellt Gleichung 1.34 das totale Differenzial (Anhang A) der Funktion E(X1 , . . . , Xr ) dar. Die Gibbs’sche Fundamentalform leistet also zweierlei: Zum einen beschreibt sie die mit allen möglichen Zustandsänderungen des Systems verknüpften Energieänderungen. Zum anderen definieren die partiellen Ableitungen von E(X1 , . . . , Xr ) nach den Xi die Zustandsgleichungen des Systems: ξi (X1 , . . . , Xr ) =
∂E(X1 , . . . , Xr ) ∂Xi
Zustandsgleichungen.
(1.35)
Kennt man also alle intensiven Größen ξi (X1 , . . . , Xr ) als Funktion der extensiven Größen X1 , . . . , Xr , das heißt alle Zustandsgleichungen des Systems, so ist dies (bis auf den Absolutwert von E ) der Kenntnis der Funktion E(X1 , . . . , Xr ) äquivalent. Die Erfahrungstatsache, dass die Energie einem Erhaltungssatz genügt, impliziert, dass auch die Energie mengenartig und damit auch extensiv ist. Daraus folgt wegen der im vorangegangen Abschnitt gegebenen Charakterisierung der extensiven Variablen weiter, dass die Energie eine (im Sinne Eulers) homogene Funktion der r unabhängigen extensiven Variablen {X1 , . . . , Xr } sein muss: E(λX1 , . . . , λXr ) = λE(X1 , . . . , Xr )
Homogenität,
(1.36)
wobei λ eine reelle Zahl ist. Die Homogenität der Energie in den {X1 , . . . , Xr } stellt eine notwendige und hinreichende Bedingung dafür dar, dass der Variablensatz {X1 , . . . , Xr } extensiv ist. Die Eigenschaft, extensiv zu sein, kann also nicht einzelnen Variablen zugeordnet werden, sondern bezieht sich stets auf einen vollständigen Satz unabhängiger Variablen eines konkreten Systems.30 Die Konsequenzen der Homogenität werden wir in Abschnitt 5.4 genauer untersuchen.31
30 Am einfachsten lässt sich dies an den Variablen „Durchmesser“, „Oberfläche“ und „Volumen“ eines Körpers veranschaulichen. Obwohl alle diese Variablen von der „Größe“ des Körpers abhängen, kann nur eine davon extensiv sein. In der Regel ist dies das Volumen. Zur Beschreibung der Oberflächeneigenschaften eines Körpers muss die Oberfläche als ein eigenes, vom Körperinneren weitgehend unabhängiges System aufgefasst werden. In diesen Fall ist der Oberflächeninhalt als eine neue, für die Oberfläche spezifische Variable anzusehen, die vom Volumen des Körpers unabhängig ist – so wie die Oberflächeninhalt eines Wassertropfens durch die Deformation der Oberfläche unabhängig von seinem Volumen variiert werden kann. 31 Es wird immer wieder diskutiert, ob die Verschärfung des thermodynamischen Systembegriffs durch die Forderung nach Homogenität für alle physikalischen Systeme haltbar ist. In vielen Fällen (zum Beispiel bei den in Abschnitt 1.4 betrachteten) lassen sich anscheinende Verletzungen der Homogenität dadurch auflösen, dass Größen, die zunächst als Systemkonstanten erscheinen, als zusätzliche Variablen aufgefasst werden. In anderen Fälle ist eine zu saloppe Verwendung des thermodynamischen Systembegriffs die Ursache des Problems. Die entscheidende Bedeutung der Homogenität liegt nach Meinung des Verfassers darin, dass erst durch diese eine Unterscheidung von extensiven und intensiven Variablensätzen möglich wird.
{
1.6 Die Gibbs’sche Fundamentalform
| 33
Abb. 1.8. Strömungsfeld für eine nicht erhaltene mengenartige Größe X durch zwei Flächenelemente mit konstanten Werten ξ1 , ξ2 ξ1 der zu X thermodynamisch konjugierten Größe ξ. Die XProduktionsrate zwischen den Flächenelementen wird gegen die durchfließende X-Menge vernachlässigbar, wenn der Abstand d und die Differenz ξ1 − ξ2 gegen Null gehen.
Die Relationen 1.34, 1.35 und 1.36 bilden den abstrakten Kern der Thermodynamik – alle ihre Aussagen lassen sich auf diese wenigen Prinzipien zurückführen. Jetzt wollen diese anhand einfacher Beispiele illustrieren: Für einfache Systeme mit nur einer unabhängigen Variablen (r = 1) enthält die Gibbs’sche Fundamentalform nur einen Term – zum Beispiel für den Kondensator gilt: dE = U (Q) dQ .
Bei mehreren Freiheitsgraden, zum Beispiel für den Kondensator mit variablem Plattenabstand (r = 2), erhalten wir entsprechend: dE = U (Q, x) dQ − F (Q, x) dx .
Jeder Freiheitsgrad entspricht einer Art Kanal oder Energieträger, über den wir dem System Energie zuführen können. Eine Gl. 1.34 analoge Relation gilt auch für die zeitlichen Änderungen der in einem System oder einem Raumbereich enthaltenen Energie. Nehmen wir an, dass die Xi (t) in der Zeit variieren, so erhalten wir: dXi dE ξi = . dt dt r
(1.37)
i=1
Änderungen der Energie in einem System erfordern stets einen Energie-Transport oder Energiestrom IE , weil die Energie eine Erhaltungsgröße ist. Um ein noch plastischeres Bild dieser Transportprozesse zu gewinnen, wollen wir den Energie-Übertrag von einem Raumbereich A in einen benachbarten Raumbereich B betrachten, wobei A und B entlang einer Fläche F aneinander grenzen. Der Einfachheit halber wollen wir zunächst annehmen, dass die intensiven Größen ξi auf dieser Fläche räumlich und die Stromverteilung zeitlich konstant sind. Sind die Größen Xi mengenartig, dann erfolgen die Xi -Überträge ebenfalls durch X -Ströme IX , wobei wegen der Kontinuitätsgleichung Gl. 1.30 X˙ i = −IXi gilt, weil die Xi -Erzeugungsrate auf der Grenzfläche
34 | 1 Wie beschreibt man physikalische Systeme? vernachlässigbar ist (Abb. 1.8). Dann müssen die Ströme IE und IX wegen Gl. 1.34 durch die Relation IE = ξ i IX i (1.38) i 32
miteinander verknüpft sein. Falls die mengenartigen Größen bei den interessierenden Prozessen erhalten sind, so müssen deren Änderungen im Raumbereich G auf den Zustrom oder Abfluss von und nach G zurückzuführen sein. Gleichung 1.38 lässt sich so veranschaulichen, dass der Energiestrom IE nach G von den Strömen der übrigen extensiven Größen „getragen“ wird. Wir halten fest:
Energie strömt nie alleine, sondern wird stets vom Strom mindestens einer anderen mengenartigen Größe begleitet! Ebenso folgern wir aus der Gibbs’schen Fundamentalform, dass eine Änderung der Energie eines Systems stets von der Änderung mindestens einer anderen extensiven Größe begleitet ist! Für das Beispiel des Kondensators mit variablem Plattenabstand ergibt sich als globale Energiebilanz: E˙ = U Q˙ − F x˙
oder
IE = U IQ + vI P ,
wobei aus den Kontinuitätsgleichungen für E und Q folgt, dass −IE und −IQ der ˙ und Ladungsänderung (Q˙ ) entsprechenden Energie- und der Rate der Energie- (E) Ladungsstrom sind. Analog entspricht −I P der Kraft und der Rate der Impulsänderung F = P˙ . Das System „elastische Feder“ unterscheidet sich von dem System „freier Körper“ dadurch, dass in die Feder einerseits über ein Ende ein Impulsstrom der Stärke
32 Nach dieser Auffassung sind die Ströme aller bilanzierbaren Größen gleichberechtigt. Genauso wäre es möglich nach einem der anderen Ströme aufzulösen, so wie zum Beispiel in der irreversiblen Thermodynamik nach dem Entropiestrom aufgelöst wird (Abschnitt 8.11). Zunächst interessieren wir uns aber für den Energiestrom. Der mittels Kontinuitätsgleichungen formulierte Strombegriff stellt eine Verallgemeinerung gegenüber der Auffassung der klassischen Mechanik dar, nach der alle Prozesse auf die Bewegung von Teilchen zurückgeführt werden können. Gibt man dem Teilchenstrom eine primäre Rolle, so sind alle anderen Ströme durch die Beziehung jX = x ˆ · jN gegeben, wobei x ˆ = X/N der (Mittel)-Wert von X pro Teilchen ist. Wie wir später sehen werden, ist ein rein mechanisches Bild bei Entropieströmen nicht anwendbar, weil die Entropie pro Teilchen nicht als die (mittlere) Entropie eines Teilchens interpretiert werden kann. Ebenso wenig kann das Teilchenbild bei statischen Impulsstromverteilungen angewandt werden, weil diese mit den elektromagnetischen Feldstärken oder den Verzerrungsfeldern eines Festkörpers, aber nicht mit der Bewegung von Teilchen verknüpft sind.
1.6 Die Gibbs’sche Fundamentalform
| 35
I P = −F hineinfließt, andererseits aber durch die Aufhängung am anderen Ende der
Feder ein gleich starker Impulsstrom wieder abfließt. Für einen festen Wert der Auslenkung x fließt der Impuls in einem geschlossenen Stromkreis, ohne dass dabei Energie auf die Feder übertragen werden kann. Nur solange der Wert der Auslenkung geändert wird, bewegen sich die unterschiedlichen Teile der Feder mit unterschiedlichen Geschwindigkeiten, sodass Energie übertragen wird. Die lokale Geschwindigkeit einzelner Abschnitte der Feder in Abbildung 1.4 nimmt von rechts nach links ab, sodass auch der lokale Betrag der Energiestromstärke abnimmt. Dies spiegelt wider, dass die Energie dabei lokal in den Deformationen der atomaren Bindungen des elastischen Materials gespeichert wird. Der auch im statischen Fall (das heißt für x = const.) vorliegende mechanische Spannungszustand des Materials wird offenbar, wenn der Impuls-Stromkreis an irgendeiner Stelle unterbrochen wird, zum Beispiel indem die Feder durchgezwickt wird: Dann setzen sich die beiden Enden der Feder schlagartig in Bewegung.33 Ganz analoge Verhältnisse liegen bei der Magnetspule vor: In diesem Fall fließt der elektrische Strom IQ in einem geschlossenen Kreis. Nur wenn IQ geändert wird, ˙ Q = tritt eine Induktionsspannung Uind = −Φ˙ und damit ein Energiestrom IE = ΦI −Uind IQ auf, über den dem Magnetfeld der Spule Energie zugeführt beziehungsweise entnommen wird. Wird der Stromkreis plötzlich unterbrochen, wird die im Magnetfeld gespeicherte Energie auch hier in einem mehr oder weniger dramatischen Funkenüberschlag frei. Betrachtet man die zusammengesetzten Systeme Körper + Feder und Kondensator + Spule, so spiegeln die Beziehungen v Körper = v Federende = x˙ Federende ;
˙ Spule UKondensator = −USpule = Φ
(1.39)
die mechanische Kopplung des Körpers an die Feder beziehungsweise die leitfähigen Verbindungen zwischen Kondensator und Spule wider. Die (als ideal angenommenen) Verbindungen erlauben einerseits den Transport von Impuls beziehungsweise Ladung, andererseits stellen sie die Gleichheit der Geschwindigkeiten von Körper und Federende beziehungsweise der Spannungen über Kondensator und Spule sicher. Die Kopplungsrelationen v Körper =
∂E(P , x) = x˙ Federende ; ∂P
∂E(P , x) = −P˙ Körper ∂x
(1.40)
∂E(Q, Φ) = −Q˙ Kondensator ∂Φ
(1.41)
−F Feder =
beziehungsweise UKondensator =
∂E(Q, Φ) ˙ Spule ; =Φ ∂Q
IQ =
entsprechen daher einem geschlossenen System von (Hamilton’schen) Bewegungsgleichungen, welche die zeitliche Entwicklung der Prozesse in diesen Systemen bestim-
33 Entsprechende Überlegungen können für ein Torsionsfeder angestellt werden. Das rückstellende Drehmoment der Torsionsfeder entspricht dabei einem Drehimpulsstrom.
36 | 1 Wie beschreibt man physikalische Systeme? men.34 Gibt es keine weiteren unabhängigen Variablen, das heißt keine zusätzlichen Terme in der Gibbs’schen Fundamentalform, müssen wegen der Erhaltungssätze alle Ströme von Impuls, Ladung und Energie innerhalb des zusammengesetzten Gesamtsystems bleiben. Schreibt man Gl. 1.37 für beide Beispiele auf, so erhält man aus den Kopplungsrelationen: dE dP dx =v· −F · =v·F −F ·v ≡0, dt dt dt
beziehungsweise dE dΦ = U I Q + IQ = U IQ − IQ U ≡ 0 . dt dt
Diese Beziehungen drücken aus, dass die Kopplungsrelationen und die aus ihnen folgende Dynamik (Gl. 1.39) mit der Erhaltung der Gesamtenergie verträglich sind. Die Lösung der Bewegungsgleichungen zeigt, dass Zustände dieser Systeme mit E > 0 nicht zeitunabhängig sind, sondern dass ungedämpfte Schwingungen auftreten, bei denen die Energie periodisch zwischen beiden Teilsystemen hin- und herfließt. Reale Systeme weisen allerdings immer eine Dämpfung der Oszillationen auf. Die Beschreibung dieser Dämpfung erfordert die Ankopplung eines dritten Systems, dessen Energie von den Werten von x und P unabhängig ist (und das daher noch mindestens eine andere unabhängige Variable besitzen muss) und das die Energie des Systems Körper + Feder beziehungsweise Kondensator + Spule mit dem Abklingen der Schwingung aufnehmen kann. Am Ende des nächsten Abschnitts werden wir sehen, dass die Beschreibung derartiger Reibungsphänomene sowohl die Aufnahme weiterer Terme in die Gibbs’sche Fundamentalform als auch eine Modifikation der Kopplungsrelationen erfordert. Die verschiedenen Beiträge zu dE werden gerne als Energie„formen“ bezeichnet: v dP Ω dL −F dx U dQ I dΦ
Beschleunigungsarbeit bei linearen Bewegungen Beschleunigungsarbeit bei Drehbewegungen Verschiebungsarbeit Aufladungsarbeit Magnetisierungsarbeit
Die Unterscheidung verschiedener Energieformen ist allerdings problematisch, da einem System mit mehreren Freiheitsgraden in einem Zustand mit einem gewissem Wert der Energie E nicht mehr anzusehen ist, über welchen Prozess dieser Zustand erreicht wurde, das heißt über welche Energieform(-en) dieser Energiebetrag zugeführt wurde. Wenn man die Art der Energiezufuhr charakterisieren möchte, ist es begrifflich klarer, verschiedene Kanäle, über die die Energie zugeführt wird, beziehungsweise verschiedene Energieträger zu unterscheiden. Jeder der Kanäle entspricht einer der extensiven
34 Die Paare (x, P ) und (Φ, Q) nennt man kanonisch konjugiert.
1.6 Die Gibbs’sche Fundamentalform
| 37
Größen des Systems. Die jeweils zugehörigen intensiven Größen sagen, wie stark die verschiedenen extensiven Größen mit Energie beladen sind. Statt von einer Umwandlung von einer Energieform in eine andere zu sprechen, kann man bildhaft sagen, dass Energie von einem Träger (zum Beispiel der elektrischen Ladung Q) auf einen anderen Träger (zum Beispiel dem Drehimpuls L) umgeladen wird, und auf diese Weise die Energiebilanz in einem Elektromotor veranschaulichen. Der Vorteil dieser Sprechweise besteht darin, dass nicht verschiedene Arten (im Beispiel des Elektromotors elektrische und mechanische Energie) von Energie unterschieden werden – eine Unterscheidung, die sich schwer aufrechterhalten lässt, wenn „dieselbe“ Energie auf einem Weg zugeführt und auf einem anderen Weg wieder abgeführt wird. Die bisher vorgestellte Systematik erlaubt die Beschreibung von mechanischen und elektrischen Systemen mittels eines einheitlichen Begriffssystems und offenbart sehr weitgehende Analogien zwischen den an diesen Systemen auftretenden Prozessen. Wie wir in den nächsten Kapiteln sehen werden, ist eine analoge Beschreibung von thermischen und chemischen Phänomenen möglich. Abschließend wollen wir Gl. 1.38 noch für den Fall erweitern, dass die intensiven Größen ξi entlang der Fläche F in Abb. 1.8 variieren. Dann müssen die Ströme durch das Flächenintegral über die lokalen Stromdichten j X berechnet werden. Die Stromdichte ist mit dem Gesamtstrom gemäß IX = j X (r) dF (1.42) F
definiert. Dann gelten anstelle von Gl. 1.38: jE =
ξi (r) j Xi (r)
und IE =
i
ξi (r) j Xi (r) dF .
(1.43)
i F
Diese Relationen gelten selbst dann, wenn die Vektoren der verschiedenen j Xi (r) nicht parallel sind. Wir wollen nun eine lokal gültige Form der Kontinuitätsgleichung mit Hilfe der Stromdichten j X und der X -Dichten x ableiten. Dazu gehen wir von der globalen Form der Kontinuitätsgleichung Gl. 1.30 aus, welche den globalen, einem Gebiet G durch dessen Begrenzungsfläche ∂G herausfließenden X -Strom mit der zeitlichen Änderung der im Gebiet G enthaltenen X -Menge verknüpft. Mit Hilfe des Gauss’schen Integralsatzes erhalten wir
IX +
dX = dt
j X dS + ∂G
dX = dt
div j X + G
∂x ∂t
dV =
ΣX,lok (r) dV , G
wobei ΣX,lok die lokale Dichte der X -Erzeugungsrate ist, die für Erhaltungsgrößen natürlich verschwindet. Wenn wir annehmen, dass die globale Form für jedes beliebige (einfach zusammenhängende) Gebiet G gilt, können wir die Integranden in dieser Beziehung gleich-
38 | 1 Wie beschreibt man physikalische Systeme? setzen und erhalten die gesuchte lokale Variante der Kontinuitätsgleichung für eine mengenartige Grüße X :35 div j X (r, t) +
∂x(r, t) = ΣX,lok (r) . ∂t
(1.44)
Die lokale Form der Kontinuitätsgleichung ist immer dann wichtig, wenn räumliche Variationen von x und j X auftreten. Wir werden ihr bei der Beschreibung des Phänomens der Wärmeleitung und anderer Transportphänomene gleich im nächsten Kapitel und auch später immer wieder begegnen.
1.7 Elektrisches Gleichgewicht In diesem Abschnitt wollen wir überlegen, was geschieht, wenn zwei Systeme, zum Beispiel zwei Kondensatoren oder zwei freie Körper, derart in Kontakt gebracht werden, dass ein Transport extensiver Größen (in unseren Beispielen der Transport der elektrischen Ladung oder des Impulses) möglich ist. Dazu betrachten wir exemplarisch die Gesamtenergie eines aus zwei Kondensatoren zusammengesetzten Systems: E(Q1 , Q2 ) = E1 (Q1 ) + E2 (Q2 ) =
Q21 Q2 + 2 . 2C1 2C2
(1.45)
Die Erhaltung der elektrischen Ladung koppelt die Ladungsänderungen auf beiden Kondensatoren miteinander: Q1 + Q2 = Q0 = const. =⇒ Q2 = Q0 − Q1 und dQ1 = −dQ2 .
Wenn wir zur Vereinfachung C1 = C2 = C annehmen, erhalten wir für die Gesamtenergie: E(Q0 , Q1 ) =
Q21 (Q0 − Q1 )2 + 2C 2C
(1.46)
Wir suchen nun das Minimum der Gesamtenergie bei Variation von Q1 : ∂E(Q0 , Q1 ) ∂E1 (Q1 ) ∂E2 (Q2 ) ∂Q2 (Q0 − Q1 ) = + ∂Q1 ∂Q1 ∂Q2 ∂Q1 !
= U1 (Q1 ) − U2 (Q0 − Q1 ) = 0 .
(1.47)
Die Bedingungen U1 = U2 und ∂E(Q1 , Q0 )/∂Q1 = 0 sind also äquivalent! Sie definieren den Gleichgewichtszustand des zusammengesetzten Systems. Da U1 und U2 aus
35 Im Falle des Impulses und des Drehimpulses wird die lokale Form der Kontinuitätsgleichung durch deren Vektornatur etwas komplizierter – die Stromdichte ist dann ein Tensor 2. Stufe, der Spannungstensor, der die Information über die Stromdichten der drei Vektorkomponenten zusammenfasst.
1.7 Elektrisches Gleichgewicht |
IQ
IQ
Q1
Q2
-Q1
C1
-Q2
C2
0
1
E(Q , Q )
a
b
39
Q
1G
Q
1A
Q
1
Abb. 1.9. a) Parallelschaltung zweier Kondensatoren: Falls die Spannungen U1 und U2 unterschiedlich sind, fließt ein elektrischer Strom IQ , sobald der Schalter geschlossen wird. b) Energie des Gesamtsystems als Funktion der Ladung Q1 auf dem linken Kondensator und der (konstanten) Gesamtladung Q0 . Der Zustand minimaler Gesamtenergie bei Q1G ist der Gleichgewichtszustand. In diesem Zustand tritt auch beim Schließen des Schalters kein Strom auf.
den Zustandsgleichungen bekannt sind, können wir die Lage des Energieminimums E(Q1G , Q0 ) bestimmen: U1 − U2 =
Q1G Q − Q1G ! =0 − 0 C C
=⇒
ΔE = E(Q1 , Q0 ) − E(Q1G , Q0 ) = 2 ·
Q1G = Q2G =
Q0 , 2
(Q1 − Q0 /2)2 ≥0. 2C
Damit haben wir gezeigt, dass der Zustand (Q1G , Q0 ) tatsächlich einem absoluten Minimum der Gesamtenergie E entspricht. Diese Zustände haben die besondere Eigenschaft, dass sie stabil, das heißt zeitlich unveränderlich sind. Ganz analoge Überlegungen und Rechnungen gelten für den Fall des Geschwindigkeitsgleichgewichts beim inelastischen Stoß zwischen zwei Körpern, beim Kräftegleichgewicht zwischen zwei Federn und in unzähligen anderen Beispielen. Man nennt dies das Minimalprinzip der Energie. Allerdings gibt es dabei einen Haken: Da die Energie stets erhalten ist, kann sich das Gleichgewicht nur dann einstellen, wenn es ein anderes System gibt, das in der Lage ist, die Energiedifferenz zwischen dem Anfangszustand und dem Gleichgewichtszustand aufzunehmen. Welcher Art ist dieses System? Und warum sollte es bereit sein Energie aufzunehmen, anstatt seinerseits auf der Minimierung seiner eigenen Energie zu bestehen? Diese Frage lässt sich auf der Basis des bisher Besprochenen nicht beantworten. Das Minimalprinzip der Energie allein reicht nicht aus, um zu verstehen, warum ein zusammengesetztes System einen Gleichgewichtszustand anstreben sollte. Dennoch ist letzteres unsere alltägliche Erfahrung. Um hier weiter zu kommen, erweitern wir unserer Beispielsystem aus zwei Kondensatoren einmal um eine Spule und einmal um einen Widerstand (Abb. 1.10). Wir beginnen in einem Zustand mit geladenen Kondensatoren. Aufgrund des zunächst offenen Schalters ist anfänglich IQ = 0 und U = U0 . Der erste Fall ist der oben besprochene elektrische Schwingkreis. Wird der Stromkreis mit dem Schalter geschlossen,
40 | 1 Wie beschreibt man physikalische Systeme?
L
a
C1
C2
R
b C1
C2
Abb. 1.10. a) Kopplung zweier Kondensatoren über eine ideale Spule: Es resultiert ein Schwingkreis, in dem die aus den Kondensatoren abfließende Energie in der Spule zwischengespeichert wird, um dann wieder in die Kondensatoren zurückzufließen. Solange der elektrische Widerstand der Spule vernachlässigt werden kann, wird sich kein stationärer Zustand einstellen, weil das System keine Zeitrichtung auszeichnet. b) Kopplung der Kondensatoren über einen elektrischen Widerstand: Ein Teil der durch den Widerstand fließenden Energie erzeugt dort Wärme. Auf diese Weise kann Energie aus dem elektrischen System abgeführt werden und es kann sich ein elektrischer Gleichgewichtszustand einstellen.
so beträgt die Spannung über der Spule gemäß dem Induktionsgesetz: Uind = −LI˙Q .
Im Magnetfeld der Spule wird Energie mit der Rate E˙ = Uind · IQ
gespeichert, sobald sie von einem elektrischen Strom durchflossen wird. Wenn die Kondensatoren entleert sind und sich alle Energie im Magnetfeld der Spule befindet, wechseln der Ladungs- und der Energiestrom das Vorzeichen, und die Energie fließt wieder in die Kondensatoren zurück. Auf diese Weise kommt es zu periodischen Schwingungen mit der Frequenz ω0 = LCges , wobei Cges = 2C ist. Ein elektrischer Widerstand dagegen zeichnet sich dadurch aus, dass der elektrischer Strom und die elektrischen Spannung stets proportional sind: U = RIQ
Ohm’sches Gesetz.
Die resultierende Differenzialgleichung für Q(t) ist daher von 1. Ordnung in der Zeit und hat nur exponentiell variierende Lösungen. Die physikalisch relevanten Lösungen klingen innerhalb der Relaxationszeit τ = RCges ab. In der Praxis wird jede Realisierung eines solchen Schaltkreises aufgrund der unvermeidlichen Zuleitungen zu den Bauteilen sowohl eine gewisse Induktivität L, als auch einen gewissen Widerstand R aufweisen. Je nach dem Wert des Produkts ω0 τ kommt es zu exponentiell gedämpften Oszillationen oder zu exponentiell relaxierendem Verhalten. Sowohl der Widerstand als auch die Spule haben die Eigenschaft, dass ihnen über den elektrischen Strom an einem Kontakt stets mehr Energie zugeführt wird, als über den anderen Kontakt wieder abfließt. Das bedeutet, dass sich in beiden Bauelementen
1.7 Elektrisches Gleichgewicht |
41
Energie mit der Rate E˙ = U IQ kontinuierlich anhäuft, wohingegen die in ihnen enthaltene elektrische Ladungsmenge konstant ist. Wie das unterschiedliche Verhalten der beiden Schaltkreise zeigt, gibt es aber einen entscheidenden Unterschied: Während die im Magnetfeld der Spule gespeicherte Energie wieder an den Kondensator abgegeben werden kann, ist die im Widerstand gespeicherte Energie für eine erneute Aufladung des Kondensators verloren! Gleiches gilt, wenn man einen Widerstand in einen elektrischen Schwingkreis einfügt: Die vom Widerstand aufgenommene Energie ist für die elektrischen Schwingungen verloren, was schließlich zum Abklingen der Schwingungen führt. Dies bedeutet, dass der Zustand des physikalischen Systems „Widerstand“, des scheinbar einfachsten aller elektrischen Bauelemente, durch die elektrischen Größen U und IQ nicht vollständig beschrieben sein kann. Phänomenologisch stellen wir fest, dass der Widerstand warm wird, sobald er von einem hinreichend großen elektrischen Strom durchflossen wird. Damit stellt sich also die Frage, wie das Phänomen der Wärme und die damit verbundenen Energieänderungen quantitativ beschrieben werden können. In der historischen Entwicklung war die Beantwortung dieser Frage alles andere als einfach. Wir wollen hier nicht zu sehr auf die Details dieser Entwicklung eingehen, sondern im nächsten Kapitel die heutige Sicht in möglichst einfacher und systematischer Form darstellen.
Übungsaufgaben Berechnen Sie soweit möglich konkrete Zahlenwerte und verwenden Sie dabei die in diesem Kapitel tabellierten Materialparameter. 1.1. Compton-Effekt Die Energie-Änderung eines Photons beim Stoß mit einem Elektron nennt man den Compton-Effekt. Die Energieänderung der gestreuten Photonen in Abhängigkeit vom Streuwinkel Θ macht sich durch eine Frequenzverschiebung Δω = ΔE bemerkbar. Dabei gilt: 1 1 1 − = (1 − cos Θ) , Ephot Eel,0 Ephot
(1.48)
wobei Eel,0 die Ruheenergie des Elektrons bezeichnet.36
36 Klassische elektromagnetische Wellen zeigen diesen Effekt nicht, denn bei diesen wird nur Rayleigh-Streuung erwartet, bei der die emittierte Strahlung stets dieselbe Frequenz wie die einfallende Strahlung hat.
42 | 1 Wie beschreibt man physikalische Systeme?
a) Leiten Sie die Formel (1.48) ab (P el = 0). Diskutieren Sie die Grenzfälle „weicher“ (Ephot Eel,0 ) als auch „harter“ (Ephot Eel,0 ) Photonen. b) Jenseits welcher Energie bricht die Energieverteilung der gestreuten Elektronen ab (Compton-Kante)? 1.2. Wasserströmung Gegeben sei ein mit Wasser gefülltes Gefäß mit dem Volumen V und der Höhe H . Im Boden der Gefäßes sei ein Schlauch eingelassen, dessen Strömungswiderstand Rfließ durch Δp = Rfließ · IM definiert ist, wobei Δp die Druckdifferenz zwischen den Schlauchenden und IM der Massenstrom des Wassers ist. a) Berechnen Sie den Wasserdruck am Boden des Gefäßes. b) Berechnen Sie den Füllstand h(t) des Behälters als Funktion der Zeit, wenn das Wasser durch den Schlauch abfließt. Wie lange dauert eine Abnahme von h auf 10 % des Anfangswertes, wenn V = 10 , H = 30 cm und Rfließ = 0.1/(m s) beträgt? Vergleichen Sie die Lösung mit der, die sich bei der Entladung eines Kondensators über einen Widerstand ergibt. 1.3. Massieu-Gibbs-Funktion und Gleichgewicht eines Federpendels a) Geben Sie die Massieu-Gibbs-Funktion eines Federpendels im Schwerefeld an. b) Berechnen Sie die Gleichgewichtslage des Pendels, wenn die Masse M = 0.1 kg, die Ruhelänge der Feder L = 15 cm und die Federkonstante K = 0.1 kg/s2 betragen. 1.4. Kondensator mit variablem Plattenabstand a) Berechnen Sie nach der Formel x1 ΔE = −
Fext (Q, x) dx x0
die Energie, die dem Kondensator bei zeitlich konstanter Ladung Q zuzuführen ist, um den Abstand von x0 auf x1 zu vergrößern. b) Nehmen Sie jetzt an, dass der Kondensator mit einer Spannungsquelle (Spannung U ) verbunden ist. Berechnen Sie wiederum die dem System zugeführte Arbeit und vergleichen Sie das Ergebnis mit dem von Teilaufgabe a). c) Bestimmen Sie den Anfangs- und den Endzustand sowie die graphische Darstellung der beiden Prozesse in der Q-x-Ebene beziehungsweise in der U -xEbene. 1.5. Zustandsgleichung und elastische Energie a) Berechnen Sie die Zustandsgleichung eines unter hydrostatischem Druck stehenden Körpers unter der Annahme, dass sein Volumen V bei p = 0 den Wert V0 hat und seine Kompressibilität κ = −(1/V ) · dV (p)/dp vom Druck unabhängig ist.
1.7 Elektrisches Gleichgewicht |
43
b) Zeigen Sie, dass die im Körper gespeicherte elastische Energie durch V Eelast = −
p(V ) dV =
1 (V − V0 )2 2κV0
V0
gegeben ist. 1.6. Energieaufnahme eines strömenden Mediums Zeigen Sie, dass die von einem durch ein Rohr strömenden Medium aufgenommene Leistung IE = Δp · V˙ beträgt, wobei Δp die Druckdifferenz zwischen den Rohrenden und V˙ die Durchflussrate in /s ist. 1.7. Gezeitenbremse Erde und Mond bilden ein zusammengesetztes System von drei gekoppelten Rotatoren. Die drei Drehimpuls-Variablen des Systems sind die Eigen-Drehimpulse (Spin) von Erde und Mond sowie der Bahndrehimpuls des Zwei-Körpersystems in Bezug auf den gemeinsamen Schwerpunkt. Die entsprechenden Trägheitsmomente sind 2 JSE und JSM von Erde und Mond, und das Bahn-Trägheitsmoment JB = Mred RB . Dabei hat das Trägheitsmoment einer starren Kugel mit homogener Massendichte und dem Radius R den WertJS = 2/5 M R2 , Mred = (1/ME + 1/MM )−1 ist die reduzierte Masse des Zwei-Körperproblems und RB der (mittlere) Bahnradius. Die Inhomogenität des Gravitationsfeldes der Himmelkörper bewirkt eine leichte (zigarren-förmige) Verzerrung von Erde und Mond in Richtung der Verbindungsachse RB , die eine Kopplung der Eigenrotation mit der Bahnbewegung bewirkt.37 Diese ist für das Phänomen der Gezeiten verantwortlich. In Verbindung mit der Eigenrotation bewirkt die ständige Gezeitendeformation des Erdkörpers Reibungsverluste, die zu einer allmählichen Abbremsung der Eigenrotation führt. Aufgrund der kleineren Masse des Mondes hat dies bereits dazu geführt, dass der Mond bezüglich der Verbindungsachse RB stillsteht und uns daher immer dieselbe Seite zuwendet. Der Mond befindet sich bezüglich der Erde bereits im RotationsGleichgewicht. a) Mittels Laser-Reflektometrie wird eine Zunahme des mittleren Bahnabstandes von 3.8 cm/Jahr gemessen. Bestimmen Sie mit Hilfe der Energie- und Drehimpulsbilanzen die jährliche Änderung der Umlaufzeit des Mondes und der Tageslänge auf der Erde. b) Berechnen Sie die mit der Abbremsung verbundene Bremsleistung.
37 Eine solche Kopplung wird im Bereich der Quantenmechanik auch als Spin-Bahn-Kopplung bezeichnet.
44 | 1 Wie beschreibt man physikalische Systeme?
c) Nehmen Sie an, dass die Bremsleistung zeitlich unveränderlich bleibt, und ermitteln Sie durch Extrapolation in die Zukunft, wie lange es noch bis zur Einstellung des Rotationsgleichgewicht zwischen Erde und Mond dauert und durch Extrapolation in die Vergangenheit, welche Werte sich für die Tageslänge der Erde und den Bahnabstand vor 4 Mrd. Jahren ergeben. Die notwendigen astronomischen Daten lauten: Erdmasse ME = 6 · 1024 kg, Erdradius RE = 6370 km und heutige Rotationsfrequenz ΩE = 2π/T (mit T = 23.93 h) der Erde; Mondmasse MM = 7.35 · 1022 kg, Mondradius RM = 3480 km, mittlere Bahngeschwindigkeit ca. 1 km/s und heutige Umlaufzeit des Mondes 27.3 Tage.
2 Thermische Systeme In diesem Kapitel werden die für thermischen Systeme grundlegenden physikalischen Größen Temperatur und Entropie eingeführt. Diese können als thermische Spannung und thermische Ladung angesehen werden. Das System „heißer Körper“ entspricht als Speicher für Energie und Entropie in der Wärmelehre dem System „freier Körper“ (Speicher für Impuls und Energie) in der Mechanik und dem System „Kondensator“ (Speicher für Ladung und Energie) in der Elektrizitätslehre. Der zweite Hauptsatz der Thermodynamik postuliert, dass Entropie erzeugt, aber nicht vernichtet werden kann. Auf diese Weise wird die Richtung der Einstellung von Gleichgewichten festgelegt. Nach einem Exkurs über die Messung der Temperatur und der Entropie wird der einfachste thermische Prozess, nämlich der spontane Temperaturausgleich zwischen zwei heißen Körpern, sowie der raum-zeitliche Verlauf der Wärmeleitung diskutiert.
2.1 Energie, Entropie und Temperatur Wir wollen das Phänomen der Wärme, das heißt thermische Systeme und ihren Energieaustausch mit anderen physikalischen Systemen, nun in einer Weise beschreiben, die in ihrer Struktur mit den im vorangegangenen Kapitel betrachteten mechanischen und elektrischen Systemen identisch ist. Das bedeutet, dass wir ein neues Paar aus einer extensiven und einer intensiven Größe einführen müssen: Wie als einer der ersten der Schotte Black1 erkannt hat, müssen wir zwischen „Wärmemenge“ und „Wärmeintensität“ unterscheiden. Die Wärmeintensität sagt, wie „heiß“ ein Körper ist. Wir quantifizieren sie durch die Temperatur (Symbol T ). Die Temperatur hängt im Gegensatz zur Wärmemenge nicht von der Größe des Systems ab und ist damit eine intensive Größe. Wenn wir beispielsweise zwei Gefäße vorliegen haben, von denen eines 1 kg und das andere 2 kg Wasser enthält, und beide gleich „heiß“ sind (festgestellt mit Hilfe eines Thermometers), so müssen 2 kg Wasser die doppelte Wärmemenge von 1 kg Wasser enthalten. Dies lässt sich auch dadurch veranschaulichen, dass zum Erwärmen von 1 kg Wasser (zum Beispiel von 20 ◦C auf 80 ◦C) mit Hilfe eines Tauchsieders bei gleicher elektrischer Leistung nur halb soviel Zeit und damit halb soviel Energie benötigt wird, wie notwendig ist, um 2 kg Wasser auf dieselbe Temperatur zu bringen. Aus unserer Alltagserfahrung kennen wir eine weitere Beziehung zwischen Temperatur und Wärmemenge: Anfängliche Temperaturdifferenzen zwischen zwei thermi-
1 Joseph Black (∗ 1728 in Bordeaux, † 1799 in Edinburgh) war ein schottischer Physiker und Chemiker. Er ist der Entdecker des Kohlendioxids und des Elements Magnesium und er prägte die Begriffe „Wärmekapazität“ und „latente Wärme“.
46 | 2 Thermische Systeme schen Systemen führen zu Wärmeströmen und damit zum Ausgleich der Temperaturdifferenz, genauso, wie elektrische Potenzialdifferenzen in unserem Beispiel mit den beiden Kondensatoren zu elektrischen Strömen und damit zum Ausgleich der elektrischen Potenzialdifferenz führen. Analog können wir eine Temperaturdifferenz als „thermische Spannung“ verstehen. Um die Wärme„menge“, das heißt die mengenartigen Aspekte thermischer Phänomene zu quantifizieren, liegt es nahe, eine neue, analog zur elektrischen Ladung gebildete, physikalische Größe einzuführen. Diese Größe heißt heute Entropie und ihre Änderungen sind mit den Änderungen der Energie bei thermischen Prozessen in derselben Weise verknüpft, wie die Änderungen der elektrischen Ladung mit denen der Energie bei elektrischen und die Änderungen des Impulses mit denen der Energie bei mechanischen Prozessen (Gln. 1.19 und 1.2). Anschaulich gesprochen, ist die Entropie das, woran wir uns die Finger verbrennen, wenn wir versehentlich auf eine heiße Herdplatte fassen. Der dabei auftretende Schmerz ist klar von dem zu unterscheiden, der auftritt, wenn wir uns beim Einschlagen eines Nagels mit dem Hammer auf den Finger klopfen. In beiden Fällen wird dem Finger mehr Energie zugeführt, als wir als angenehm empfinden. Der Unterschied in der sinnlichen Wahrnehmung ist jedoch nicht allein mit der zugeführten Energie verknüpft, sondern kommt daher, dass neben Energie im ersten Fall Entropie, im zweiten Fall aber Impuls zugeführt wird. Der historische Weg zur Entropie wurde dadurch verkompliziert, dass man zunächst davon ausging, dass alle mengenartigen Größen auch erhalten sein müssen. Letzteres trifft auf die Wärmemenge nicht zu, da Wärmemengen zum Beispiel durch Reibung erzeugt werden können. Aus diesem Grunde wurde die ursprüngliche Vorstellung von der Wärmemenge als einer Art Stoff („Caloricum“) verworfen. Zudem legen Experimente, wie das oben genannte Erwärmen von Wasser, nahe, die Energie mit den mengenartigen Aspekten des Phänomens der Wärme zu verknüpfen. Diese Verknüpfung hat jedoch das Problem, dass die Energie in allen, auch in den nicht-thermischen Systemen vorkommt und daher nicht für thermische Phänomene typisch sein kann. Dies bedeutet, dass Wärmemenge und Energie nicht identisch sein können! Der historisch beschrittene Ausweg bestand darin, die Wärme (wie die mechanische Arbeit) als „Form“ der Zu - oder Abfuhr von Energie zu interpretieren, genauso, wie der „Regen“ und der „Zufluss über einen Bach“ als zwei verschiedene „Formen“ der Änderung der Wassermenge in einem Teich aufgefasst werden können. Befindet sich das Wasser erst einmal im Teich, ist es unmöglich zu sagen, wieviel davon „Regenwasser“ und wieviel „Bachwasser“ ist, weil es sich dabei um dieselbe chemische Substanz handelt.2 Zwar ist es während des Zuflusses möglich, die über den Regen und den Bach zugeführten Wassermengen quantitativ zu erfassen; jedoch erlaubt die Kenntnis des Zustands des Teichs zu einem gewissen Zeitpunkt keinen Rückschluss auf das Verhältnis der Wassermengen aus Bach und Regen, die zu dem momentanen Wert des
2 Dieses Gleichnis stammt aus dem Buch von Callen [1].
2.1 Energie, Entropie und Temperatur |
47
Wasserinhalts geführt haben. In analoger Weise ist für die Prozessgrößen Wärme und Arbeit charakteristisch, dass es im allgemeinen nicht möglich ist zu sagen, wieviel Wärme und wieviel Arbeit einem System durch einen Prozess nun eigentlich zugeführt wurde, wenn man nur den Anfangs- und den Endzustand des Systems, nicht aber den genauen Verlauf des Prozesses kennt. Es war das Verdienst von Clausius zu erkennen, dass sich hinter dem Phänomen der Wärme nicht nur eine, sondern zwei bilanzierbare Größen, nämlich die Energie E und die Entropie S verbergen. Die Änderungen ΔS des Entropie-Inhalts eines Systems sind (bei konstanter Temperatur T ) nach Clausius mit der Zu- oder Abfuhr der Energiemenge Q = T ΔS verknüpft. In den meisten Darstellungen der Wärmelehre bezeichnet das Wort „Wärmemenge“ den Energiebetrag Q, wohingegen der gleichzeitig mit der Energie zugeführte Entropiebetrag ΔS meist nicht ausdrücklich erwähnt wird. Dieser Sprachgebrauch, das heißt die ausschließliche Assoziation von Wärme und Energie, hat den entscheidenden Nachteil, dass dadurch die Entropie ihrer anschaulichen Bedeutung beraubt wird, anstatt sie mit unserer Alltagserfahrung in Verbindung zu bringen! Die für thermische Prozesse spezifische Größe Entropie spiegelt den in der Alltagssprache üblichen Gebrauch des Wortes „Wärmemenge“ sogar besser wider als die Energie. Dies äußert sich darin, dass die meisten Sätze der Umgangssprache, die das Wort „Wärmemenge“ enthalten, physikalisch richtig bleiben, wenn wir „Wärmemenge“ durch „Entropie“ ersetzen.3 Dagegen ist es aus den oben skizzierten Gründen sachlich falsch, vom Wärmeinhalt eines Systems zu sprechen, auch wenn dies durch die Semantik des Wortes „Wärmemenge“ stark suggeriert wird. Die mathematische Problematik des auf die Energie bezogenen Wärmebegriffs wird in den Abschnitten 4.5 und 4.8 dargestellt. Die historische Entwicklung der für die Wärmelehre grundlegenden Begriffe erscheint kompliziert und verwirrend. Sie ist ein Musterbeispiel für den allmählichen und mit Umwegen verbundenen Prozess der Verschärfung der Umgangssprache hin
3 Diese Beobachtung hat zu dem Vorschlag geführt, den Begriff der Wärme umzudefinieren und fortan nicht auf die Energie, sondern auf die Entropie anzuwenden. So einleuchtend eine solche Umdefinition unter dem Gesichtspunkt der Systematik ist, so problematisch ist sie in der Durchführung. Die Bedeutung von im Umlauf befindlichen physikalischen Begriffen kann nicht per Dekret festgesetzt oder geändert werden, sondern ergibt sich aus dem Sprachgebrauch sehr vieler Individuen, das heißt Forschern, (Hochschul-)Lehrern, Schülern und Studenten. Der Versuch Einzelner, einen fundamentalen Begriff umzudefinieren, muss zu Kommunikationsproblemen mit den Übrigen führen. Nach Meinung des Verfassers kann sich ein neuer Standpunkt und damit eine neue Darstellungsweise nur durchsetzen, wenn nicht nur die Vorteile der neuen Darstellung offensichtlich sind, sondern wenn auch die neue Terminologie mit der alten so weit verträglich ist, dass keine Missverständnisse auftreten. Aus diesem Grunde wird in dieser Darstellung keine Umdefinition, sondern eine Erweiterung des Begriffs der Wärme um den Aspekt der Entropie vorgeschlagen. Diese Erweiterung erlaubt es, die Entropie mit unseren Alltagsvorstellungen von thermischen Prozessen zu verknüpfen. In der Lehrpraxis hat sich gezeigt, dass sich die so eingeführte Entropie für ein intuitives Verständnis der Physik der Wärme ausgezeichnet eignet.
48 | 2 Thermische Systeme zu einem für die quantitative Naturbeschreibung tauglichen Begriffssystem. Vergleichbar gewundene Erkenntniswege ergaben im 17. und 18.Jahrhundert eine ganz ähnliche Problematik innerhalb der Mechanik. Auch in der Mechanik sprach man zunächst nur von einer „Bewegungsgröße“, anstatt zwischen Impuls und Energie zu unterscheiden. So postulierte Descartes als erster, dass die Bewegungsgröße bei Stoß zweier Körper von einem Körper auf den anderen übergeht, sodass die Summe beider Bewegungsgrößen erhalten bleibt. Dabei nahm er an, dass die Bewegungsgröße proportional zur Geschwindigkeit ist. Dies war die erste Formulierung der Impulserhaltung, auch wenn Descartes den vektoriellen Charakter des Impulses noch nicht erkannt hatte. Dagegen stellte Leibniz Jahrzehnte später die These auf, dass die „wahre Ursache einer Kraft“ nicht der zu zu v proportionale „impetus“, sondern die zu v 2 proportionale „lebendige Kraft“ sei.4 Erst d’Alembert klärte die Situation noch einmal 100 Jahre später, indem er feststellte, dass zur Beschreibung des Phänomens der Bewegung nicht nur eine, sondern ebenfalls zwei mengenartige Größen vonnöten sind, nämlich die Energie und der Impuls, welche sogar unabhängig voneinander einem allgemeinen Erhaltungssatz genügen [5]. Die beste Möglichkeit, die durch die Mehrdeutigkeit der Begriffe „Bewegungsgröße“ und „lebendige Kraft“ ausgelöste Verwirrung zu vermeiden, bestand darin, diesen nicht mehr zu verwenden, sondern allmählich durch das präzisere Begriffs-Paar „Energie und Impuls“ zu ersetzen. Entsprechend ist es ratsam, den Alltags-Begriff „Wärme“ im Rahmen der quantitativen Beschreibung thermischer Prozesse durch das präzisere Begriffs-Paar „Energie und Entropie“ zu ersetzen. Um dennoch auf die hinter dem Wort Wärme stehenden anschaulichen Vorstellungen zurückgreifen zu können, werden wir es in dieser Darstellung überwiegend in seiner qualitativen, umgangssprachlichen Bedeutung verwenden. Wissenschaftlich präzisiert wollen wir unter der Zufuhr von Wärme in ein System die gleichzeitige Zufuhr von Energie und Entropie verstehen.5
4 Zur Begründung führte Leibniz an, dass nur sein Kraftbegriff die Existenz eines perpetuum mobiles 1. Art ausschlösse. Das Wort „Kraft“ war in der damaligen Wissenschaft bei weitem nicht so eindeutig definiert wie heute. So trug auch Helmholtz grundlegende Arbeit zur Energie-Erhaltung den Titel: „Über die Erhaltung der Kraft“. In der um 1920 erschienenen Auflage des Thermodynamik-Lehrbuchs von Planck wird der Begriff „lebendige Kraft“ für die kinetische Energie der Moleküle eines Gases noch verwendet. Auch die Verwendung der Wortes „Kraft“ in der heutigen Alltagssprache (Worte wie „Kraftwerk“, „Kraft-Wärme-Kopplung“ oder Sätze wie „Ich habe keine Kraft mehr. . . “) entspricht häufig mehr der Energie als der Größe F . 5 Man mag einwenden, dass wir damit immer noch nicht wissen, was Entropie „eigentlich“ ist. Um einzusehen, dass diese Frage nicht sinnvoll ist, müssen wir uns bewusst machen, dass fundamentale Begriffe nur dann fundamental sind, wenn sie gerade nicht auf andere Begriffe zurückgeführt werden können. Wir können auch nicht sagen, was Energie oder Impuls „eigentlich“ sind. Alles was uns zugänglich ist, sind die Relationen, mit denen diese mit anderen fundamentalen Begriffen in Beziehung stehen. Die Gibbs’sche Fundamentalform und die für bestimmte Systeme spezifischen (aus Experimenten oder theoretischen Modellen extrahierten) Zustandsgleichungen sind solche Relationen. Der Gegenstand des zweiten Teils dieses Buches ist eine weitere fundamentale Relation zwischen der Entropie und den
2.2 Empirische und absolute Temperaturen |
49
2.2 Empirische und absolute Temperaturen Zur quantitativen Beschreibung von thermischen Prozessen postulieren wir also (in Analogie zu den mit dem Transport anderer mengenartiger Größen verknüpften Energieänderungen) die folgende Verknüpfung der Änderungen von Energie- und Entropieinhalt eines Systems bei Wärmezufuhr: (2.1)
dE = T dS .
Ist S die einzige unabhängige extensive Variable des Systems, so definiert diese Relation die absolute Temperatur als: T (S) =
dE(S) dS
(2.2)
Natürlich erwacht diese Definition nur dann zum Leben, wenn wir die Funktion E(S) für konkrete thermische Systeme auch angeben können. Das einfachste mögliche Beispiel hierfür wollen wir im nächsten Abschnitt besprechen. Andererseits benötigt der Experimentator auch eine Möglichkeit, die Temperatur zu messen. Auf der empirischen Ebene lässt sich das Volumen V (T ) von Flüssigkeiten als empirisches Maß für die Temperatur benutzen, da die relative thermische Ausdehnung zumindest in gewissen Temperaturbereichen in guter Näherung unabhängig von der Temperatur ist. Auch die Längenausdehnung von Festkörpern kann in ähnlicher Weise genutzt werden. Der Volumenausdehnungkoeffizient β und der Längenausdehnungskoeffizient β sind wie folgt definiert: β :=
1 dV (T ) ; V dT
β :=
1 dL(T ) . L dT
(2.3)
Der Effekt ist zwar recht klein (Tabelle 2.1), aber bei geeigneter Anordnung durchaus messbar. Die thermische Ausdehnung wird in den üblichen Alkohol-, Quecksilber-, oder Bimetall-Thermometern ausgenutzt. Zur empirischen Festlegung der Temperaturskala werden leicht zugängliche Referenzpunkte benötigt. Die in Europa übliche Celsius-Skala ist dadurch festgelegt, dass der Temperaturbereich zwischen dem Schmelzpunkt und dem Siedepunkt hochreinen Wassers bei Normaldruck (1013 mbar) in 100 gleiche Teile eingeteilt wird. Hat eine gegebene Menge einer Flüssigkeit am Gefrierpunkt des Wassers das Volumen V0 und an dessen Siedepunkt das Volumen V100 , so erhalten wir als empirische Temperatur τ : τ (T ) =
V (T ) − V0 · 100 ◦C V100 − V0
Wahrscheinlichkeiten für das Vorliegen von Quantenzuständen. Aber auch diese Relation, die sich als außerordentlich schlagkräftig für die Formulierung von Modellen erweisen wird, sagt uns nicht, was die Entropie „eigentlich“ ist, sondern postuliert nur eine Verknüpfung der Entropie mit diesen Wahrscheinlichkeiten.
50 | 2 Thermische Systeme Die so oder ähnlich definierte empirische Temperatur bezieht sich stets auf ein Intervall zwischen zwei endlichen Referenztemperaturen. Für unsere gegenwärtigen Zwecke ist dies genug. In Abbildung 2.1a sind einige Beispiele dieses Verhaltens gezeigt. Bei Ethanol und Quecksilber erscheint der Zusammenhang zwischen der empirischen und der absoluten Temperatur weitgehend linear. Bei genügend hoher Messgenauigkeit zeigt sich jedoch, dass das Ausdehnungsverhalten zweier verschiedener Stoffe A und B im Allgemeinen verschieden ist.6 Dies äußert sich in einer mehr oder weniger ausgeprägten Differenz der empirischen Temperaturen τA und τB im thermischen Kontakt mit dem demselben Objekt, das heißt bei derselben absoluten Temperatur. In Abbildung 2.1b sind die Diskrepanzen τ − T für Ethanol, Wasser und Quecksilber gezeigt. Beim Wasser gibt es nicht nur erhebliche Abweichungen von der Linearität, sondern der Verlauf τ (T ) ist wegen der Dichteanomalie des Wassers sogar nichtmonoton und die Funktion T (τ ) mehrdeutig. Aus diesem (und anderen) Gründen ist Wasser für Flüssigkeitsthermometer ungeeignet. Aber auch bei Alkohol zeigen sich Abweichungen, die im Bereich von einigen Prozent liegen. Nur das Ausdehnungsverhalten des Quecksilbers erscheint in dem betrachteten Temperaturbereich im Rahmen der Messgenauigkeit von einigen 10−4 linear. Es gibt jedoch kein gegenüber anderen ausgezeichnetes Material, welches zur Messung der Temperatur zu bevorzugen ist. Aus diesem Grund ist es notwendig, ein materialunabhängiges absolutes Temperaturmaß zu haben. Ein solches Temperaturmaß wird durch Gl. 2.1 bereitgestellt – um den Preis, dass wir (später) Wege finden müssen, den Differenzialquotienten dE(S)/dS direkt zu messen. Für den Augenblick verlassen wir uns einfach auf die mit kommerziellen Thermometern mitgelieferte Tabelle für T (τ ). Gleichung 2.1 legt fest, dass das Produkt T dS die Einheit „Joule“ hat. Die Werte der absoluten Temperatur und der Entropie sind auf diese Weise nur bis auf einen Tab. 2.1. Relativer thermischer Ausdehnungskoeffizient einiger Stoffe (bei T = 18 ◦C): Stoff
β (10−4 /K)
Stoff
β (10−6 /K)
Wasser
1.8
Quarzglas
0.5
Quecksilber
0.18
Invar-Stahl
2.0
Glyzerin
4.9
Eisen
12.7
Benzol
10.6
Kupfer
16.7
Ethanol
11
Aluminium
23.8
6 In Kapitel 3 werden wir sehen, dass das Ausdehnungsverhalten von idealen Gasen universell ist, also nicht von der chemischen Natur des Gases abhängt. Daher eignen sich ideale Gase besonders gut als Arbeitsmedium von Thermometern.
2.2 Empirische und absolute Temperaturen |
1.30
(b)
(a)
1.28
1.24 1.008
1.0003 1.0002
Quecksilber Ethanol Wasser
1.0001
1.004
0
3
6
9
1.0000
Wasser
1.000 0.0741
-4
-8
0.0738 0.0735
0
Ethanol
τ -T (°C)
V/M (Liter/kg)
1.26
51
Quecksilber 0
10
20
T (°C)
30
0
10
20 T (°C)
30
-12 40
Abb. 2.1. a) Spezifisches Volumen V /M von Ethanol, Wasser und Quecksilber als Funktion der absoluten Temperatur. Für das Wasser ist im Einsatz das Minimum des spezifischen Volumens bei 4◦ C gezeigt, welches eine Besonderheit dieses Stoffes, aber auch einiger anderer Stoffe darstellt. b) Abweichung der empirischen von der absoluten Temperatur im Bereich von 0 − 40◦ C. Bei Quecksilber kann im Rahmen der Messgenauigkeit keine Abweichung festgestellt werden.
beliebigen Skalenfaktor α festgelegt, da dieser aus der Definitions-Gleichung herausfällt: dE = T dS = (T /α) d(αS) = T dS .
In Abschnitt 2.5 werden wir sehen, dass der Nullpunkt der absoluten Temperatur durch die Forderung !
T (S = 0) = 0
festgelegt werden kann.7 Zur Festlegung des Skalenfaktors α der absoluten Temperatur-Skala wird nur ein einzelner Referenzpunkt benötigt. Um dieselben Zahlenwerte für Temperaturdifferenzen wie mit der Celsius-Skala zu erhalten, hat man sich darauf geeinigt, der absoluten Temperatur am so genannten Tripelpunkt vom hochreinem Wasser, bei dem flüssiges Wasser, Eis und Wasserdampf miteinander koexistieren, den
7 Historisch stand der Begriff der absoluten Temperatur erst am Ende eines langen Wechselspiels von Experiment und theoretischer Deutung. Um unseren Einstieg in die Thermodynamik nicht unnötig mit solchen konzeptionellen Schwierigkeiten zu belasten, nehmen wir das Konzept der absoluten Temperatur hier axiomatisch vorweg. Die experimentelle Bestimmung der absoluten Temperatur, welche die Eichung, das heißt die Verknüpfung der empirischen Temperaturmaße mit der absoluten Temperaturskala erst ermöglicht, erfordert mehr thermodynamisches Rüstzeug und wird in den Abschnitt 5.3 besprochen. Wie komplex das Problem der Festlegung der absoluten Temperatur und die Bereitstellung geeigneter metrologischer Standards ist, wird daran deutlich, dass es noch heute internationale Kommissionen beschäftigt.
52 | 2 Thermische Systeme Wert T = 273.16 Kelvin (K) zuzuweisen.8 Auf der Celsius-Skala liegt der Tripelpunkt bei 0.01 ◦C. Der Zahlenwert für die Lage des Tripelpunkts auf der Kelvin-Skala wurde so gewählt, dass sich für den Siedepunkt des Wasser 373.15 K ergeben und daher eine Temperaturdifferenz von 1 K auf der Kelvin-Skala mit einer Temperaturdifferenz von 1 ◦C identisch ist. Nur die Lage des Nullpunkts ist auf beiden Temperaturskalen verschieden: 0 K entsprechen −273.15 ◦C. Wenn die Einheit der Temperatur festgelegt ist, so ist die Einheit der Entropie wegen Gl. 2.1 ebenfalls festgelegt: Die Entropie hat die Einheit „Joule pro Kelvin“ (J/K). Im Folgenden werden wir fast ausschließlich die Kelvin-Skala verwenden.
2.3 Das System „heißer Körper“ In diesem Kapitel wollen wir zunächst die einfachst möglichen thermischen Systeme betrachten, bei denen S die einzige unabhängige extensive Variable ist. Der allgemeine Fall von Systemen mit mehreren extensiven Variablen wird in den nächsten Kapiteln behandelt. Dazu konstruieren wir nun das archetypische System „heißer Körper“ als thermisches Analogon zu den zuvor besprochenen Beispielsystemen „freier Körper“, „Rotator“ und „Kondensator“. Letztere besitzen in ihrer einfachsten Form nur eine unabhängige extensive Variable, nämlich den Impuls P , den Drehimpuls L beziehungsweise die elektrische Ladung Q. Entsprechend ist die Entropie S die einzige9 unabhängige extensive Variablen des Systems „heißer Körper“. Um uns die Funktionen T (S) und E(S) für dieses System zu verschaffen, stützen wir uns auf die folgende experimentelle Beobachtung:
Wird einem Körper (zum Beispiel einem Kupferblock, oder einem gewissen Volumen an Wasser) mit der Anfangstemperatur T0 mittels eines elektrischen Widerstandes eine zeitlich konstante (Heiz-)Leistung zugeführt, so steigt dessen Temperatur (zumindest in einem gewissen Temperaturbereich) linear als Funktion der Zeit.
8 In Kapitel 9 werden wir sehen, dass diese Wahl dadurch nahe gelegt wird, dass die drei Aggregatzustände eines reinen Stoffs nur bei einer einzigen Temperatur koexistieren können. In Gegensatz dazu hängen der Schmelzpunkt oder der Siedepunkt vom Druck ab. Der Tripelpunkt erlaubt die Reproduktion eines wohldefinierten Temperaturwerts, weil die Einstellung des thermischen Gleichgewichts bei der Koexistenz von Gas, Flüssigkeit und Festkörper über die Variation der Mengenverhältnisse automatisch zur Realisierung der richtigen Druck- und Temperaturwerte führt. Der Druck am Tripelpunkt beträgt 611.657 Pa (ca. 6 mbar). 9 Dies entspricht der vereinfachenden Annahme, dass nur Prozesse betrachtet werden, bei denen alle anderen extensiven Variablen wie die Masse, die Stoffmenge (Abschnitt 3.1) und das Volumen des Systems zumindest näherungsweise konstant gehalten werden.
2.3 Das System „heißer Körper“
| 53
Aufgrund der Erhaltung der Energie muss die über den elektrischen Strom in das System transportierte Energiemenge ΔE = U IQ · Δt in dem Körper gespeichert werden. Aus der Beobachtung ΔT ∝ Δt können wir also folgern, dass die Temperaturerhöhung ΔT und die Energieänderung ΔE des Körpers für hinreichend kleine ΔT zueinander proportional sind: ΔE = C(T ) ΔT
dE(T ) = C(T ) dT
und
für
ΔT −→ 0 .
(2.4)
Die Größe C(T ) ist materialspezifisch und wird die Wärmekapazität des Körpers genannt. Integration von Gl. 2.4 nach T liefert die Funktion: T E(T ) =
C(T ) dT + E(T0 ) ,
(2.5)
T0
wobei T0 eine beliebige Referenztemperatur ist. Gleichung 2.5 nennen wir die kalorische Zustandsgleichung des heißen Körpers. Im Allgemeinen ist C(T ) nicht konstant, sondern eine Funktion der Temperatur. Zusammen mit Gl. 2.1 können wir aus Gl. 2.4 weiter folgern: dE = T dS = C(T ) dT
=⇒
dS =
C(T ) dT. T
(2.6)
Damit erhalten wir die folgenden allgemein gültigen Relationen zwischen der in dem Körper enthaltenen Entropie und seiner Wärmekapazität: C(T ) = T
T S(T ) =
dS(T ) dT
und
C(T ) dT + S(T0 ) . T
(2.7) (2.8)
T0
Diese Relationen gelten unabhängig von dem für verschiedene Materialien unterschiedlichen Verlauf von C(T ). Beschränkt man die Experimente auf einen nicht zu großen Temperaturbereich, so kann die T -Abhängigkeit von C vernachlässigt werden und man erhält aus Gl. 2.4: E(T ) = C · T + E0 ,
(2.9)
wobei E0 die Nullpunkts-Energie genannt wird und eine Systemkonstante des Systems heißer Körper mit konstanter Wärmekapazität darstellt, welche den Absolutwert der Energie bestimmt. Für die Entropie resultiert in diesem Spezialfall:
T S(T ) = C ln + S(T0 ) . (2.10) T0
In dieser Gleichung können wir die Integrationskonstante S(T0 ) noch in den Logarithmus hineinziehen und erhalten
T S(T ) = C ln , (2.11) ∗ T
54 | 2 Thermische Systeme wobei
T ∗ = T0 exp −
S(T0 ) C
(2.12)
eine charakteristische Temperatur und damit eine weitere Systemkonstante des heißen Körpers mit konstanter Wärmekapazität darstellt, welche den Absolutwert von dessen Entropie bestimmt. Wenn wir Gleichung 2.10 nach T auflösen, bekommen wir: T (S) = T ∗ exp
S C
.
(2.13)
Die Temperatur eines heißen Körpers mit konstanter Wärmekapazität nimmt bei Entropiezufuhr exponentiell zu. Wenn wir diesen Ausdruck in die kalorische Zustandsgleichung Gl. 2.9 einsetzen, so erhalten wir schließlich die Massieu-Gibbs-Funktion E(S) des Systems heißer Körper mit konstanter Wärmekapazität:
S ∗ E(S) = CT exp + E0 . (2.14) C
Wir betonen noch einmal, dass alle Ergebnisse dieses Abschnitts auf der fundamentalen Relation dE = T dS und der Definition der Wärmekapazität C(T ) = dE(T )/dT beruhen! Für Systeme, die tatsächlich nur eine einzige unabhängige extensive Variable X besitzen, folgt aus der Homogenitätsrelation Gl. 1.36, dass E(X) = ξ0 X und die zu X konjugierte intensive Variable ξ = ξ0 nicht von X abhängen darf, sondern konstant sein muss. Solche Systeme existieren nur im Gedanken-Experiment; man nennt sie Reservoire, weil sie es erlauben, die für die Realisierung bestimmter Prozesse erforderliche E - und X -Mengen zu extrahieren, ohne dass sich ξ dabei ändert.10 Wie wir aus Gl. 2.14 ersehen können, ist E(S) bei einer konstanten Wärmekapazität (und auch sonst) keineswegs proportional zu S . Das System „heißer Körper“ muss also noch andere extensive Variablen besitzen, um dem Homogenitätspostulat zu genügen. Es sind dies die Masse M , die Stoffmenge N (Abschnitt 3.1) und das Volumen V . Diese verbergen sich in der Wärmekapazität.11 Wenn wir der Einfachheit halber annehmen, dass M , N und V untereinander durch die konstanten Materialparameter Molmasse m ˆ = M/N , Massendichte m = M/V , Volumen pro Masse v˜ = V /M , Molvolumen vˆ = V /N und Stoffmengendichte n = N/V zusammenhängen,12 dann muss C
10 Näherungsweise können solche Systeme dadurch realisiert werden, dass man die Werte von X und E eines relativ beliebigen Systems einfach sehr groß gegen die bei dem Prozess ausgetauschten Xund E-Werte macht – dann bleiben die mit dem Prozess verbundenen ξ-Änderungen vernachlässigbar. 11 Dass vermeintliche Systemkonstanten weitere Variablen enthalten können, ist uns schon bei dem System „Kondensator mit variablem Plattenabstand“ begegnet. 12 Das von uns zur Thermometrie benutzte Phänomen der thermischen Ausdehnung zeigt, dass v˜, vˆ, n und m tatsächlich nur näherungsweise als von T unabhängige Materialparameter aufzufassen sind. Der Parameter m ˆ ist dagegen T -unabhängig und kann nur über die Isotopenmischung der betrachteten Stoffe geändert werden.
2.3 Das System „heißer Körper“
|
55
Tab. 2.2. Massendichte m = M/V , Molgewicht13 m ˆ = M/N und spezifische Wärmekapazitäten c˜ = C/M und cˆ = C/N einiger Feststoffe und Flüssigkeiten (bei T = 298 K). Stoff
C (diam.)
Be
Ag
Au
Fe
Al
Cu
NaCl
H2 O
m [g/cm3 ]
3.52
1.85
10.50
19.32
7.874
2.699
8.960
2.170
0.998
m ˆ [g/mol]
12.01
9.02
107.9
197.0
55.85
26.98
63.55
58.44
18.02
c˜ [kJ/(kg K)]
0.502
1.756
0.238
0.129
0.447
0.897
0.377
0.879
4.184
cˆ [J/(mol K)]
5.9
15.9
25.5
25.4
25.1
24.3
24.5
51.5
75.2
linear von allen diesen Variablen abhängen, damit die thermische Zustandsgleichung des heißen Körpers dem Homogenitätspostulat genügt. Es liegt nahe, diese Proportionalität auszunutzen, um spezifische Wärmekapazitäten ⎫ ⎪ c˜(T ) := C(T, M )/M , cˆ(T ) := C(T, N )/N ⎪ ⎬ (2.15) und ⎪ ⎪ ⎭ c(T ) := C(T, V )/V zu definieren, welche von M , N und V unabhängige Materialcharakteristiken darstellen. Messwerte der spezifischen Wärmekapazitäten sind für einige Stoffe in Tabelle 2.2 zusammengefasst. Es ist auffallend, dass die molaren Wärmekapazitäten wesentlich dichter beieinander liegen als die auf die Masse bezogenen. Mit Ausnahme von Diamant und Beryllium liegen die Werte von cˆ dicht bei ganzzahligen Vielfachen des auf Dulong und Petit zurückgehenden Wertes von 25 J/(mol K). Dies ist ein erster Hinweis auf die atomare Struktur der Materie, auf den wir später zurückkommen werden. Zum Schluss dieses Abschnitts wollen wir noch eine weitere Analogie zwischen dem System „heißer Körper“ und dem Beispielsystem „Kondensator“ aufzeigen, in dem die Größe ∂Q(U ) = CQ ∂U als Systemkonstante „Ladungskapazität“ CQ auftritt. Die Ladungskapazität CQ gibt
an, wieviel elektrische Ladung in einem Kondensator bei einer gewissen Spannung enthalten ist. Ebenso wie die Wärmekapazität ist auch die Ladungskapazität nicht notwendigerweise eine Konstante, wie die Spannungsabhängigkeit der Kapazität in einem Kondensator mit einem nichtlinearen Dielektrikum oder einer Kapazitätsdiode (Abschnitt 14.5.4.1) zeigt. Gleichung 2.7 zeigt, dass die Größe ∂S/∂T = C/T in demselben Sinne als „Entropiekapazität“ anzusehen ist. Dass heute C und nicht C/T als charakteristische Größe eines heißen Körpers betrachtet wird, hängt vor allem damit zusammen, dass C(T ) = ΔE/ΔT über die mit einer Energiezufuhr ΔE verbunde-
13 Näheres zur Stoffmenge N und der Einheit „Mol“ wird in Abschnitt 3.1 erklärt.
56 | 2 Thermische Systeme ne Temperaturänderung ΔT direkt messbar ist, während die Angabe von ∂S/∂T = (ΔE/ΔT )/T zusätzlich die Kenntnis der absoluten Temperatur T erfordert. Größen vom Typ ∂X/∂ξ , welche die Abhängigkeit der extensiven Größen von den intensiven Größen beschreiben, nennt man Suszeptibilitäten. Weitere Beispiele sind die Induktivität, die Federkonstante sowie die elektrische und die magnetischen Suszeptibilität. Ihre Kenntnis ist (bis auf Integrationskonstanten) der Kenntnis der Zustandsgleichungen äquivalent – allerdings sind die Suszeptibilitäten in der Regel wesentlich leichter zu messen. Aus einer Messung der Wärmekapazität C(T ) zwischen zwei Zuständen mit den Temperaturen T0 und T lässt sich nach Gl. 2.8 die Entropiedifferenz zwischen diesen Zuständen experimentell bestimmen!
2.4 Der zweite Hauptsatz Nach dieser Diskussion des Phänomens der Wärme wollen wir auf die spontane Einstellung von Gleichgewichten zurückkommen: Die Auszeichnung einer bestimmten Richtung des Energieflusses (in unserem Beispiel aus Abschnitt 1.7 vom Kondensator zum Widerstand) bei der spontanen Einstellung von Gleichgewichten tritt in unzähligen Prozessen auf. Ein solch allgemeines Phänomen wird in der Physik sehr gerne auf ein fundamentales Prinzip zurückgeführt. Mit den jetzt vorhandenen Begriffen lässt sich ein solches Prinzip formulieren:
Entropie kann erzeugt, aber nicht vernichtet werden.
Wir postulieren also zusätzlich zu Gl. 2.1, dass die Entropie (anders als die bisher besprochenen mengenartigen Größen E , Q, P und L) keinem allgemeinen Erhaltungssatz genügt. Dieses Prinzip ist unter dem Namen 2. Hauptsatz der Thermodynamik bekannt und lässt sich auch als eine Art halbseitiger Erhaltungssatz für die Entropie auffassen. Mit anderen Worten: Physikalische Prozesse, die mit der Erzeugung von Entropie verbunden sind, sind nicht umkehrbar, weil die einmal erzeugte Entropie nicht mehr vernichtet werden kann. Ein wichtiges Beispiel solcher, irreversibel genannten, Prozesse sind Reibungsprozesse, die stets mit einer Erwärmung der Umgebung verbunden sind. Entsprechend heißen Prozesse, bei denen die Entropie konstant bleibt, reversibel. Die Irreversibilität zeichnet, im Gegensatz zum Prinzip der Minimierung der Energie, eine Richtung für den Energietransfer bei der Einstellung von Gleichgewichten aus. Der Energietransfer erfolgt stets in ein thermisches System, welches die erzeugte Entropie aufnehmen kann. Dies wird durch unsere Alltagserfahrung illustriert, nach der sich ein Fahrzeug mittels einer Bremse unter Erwärmung der Bremse anhalten lässt. In Abschnitt 1.7 war es die Erzeugung von Entropie beim Stromfluss
2.4 Der zweite Hauptsatz
| 57
durch einen elektrischen Widerstand, die die Anwendung des Prinzips der EnergieMinimierung bei der Einstellung des elektrischen Gleichgewichts zwischen zwei Kondensatoren möglich machte. Die Umkehrung dieses Prozesses, das heißt die Beschleunigung des Fahrzeugs mit Hilfe der in der Bremse gemeinsam mit Entropie gespeicherten Energie ist dagegen nur in beschränktem Maße möglich (Abschnitt 4.2). Wie wir im nächsten Abschnitt genauer besprechen werden, lassen sich Reibungsphänomene auch so charakterisieren, dass der Transport von physikalischen Größen in der Regel die Überwindung eines Reibungswiderstandes durch einen Antrieb erfordert. Die Verwendung von Energie zur Erzeugung von Entropie nennt man Dissipation. Der zweite Hauptsatz sagt, dass Entropie in thermisch isolierten Systemen nicht abnehmen kann. Die Lehrpraxis zeigt, dass die Bedingung der thermischen Isolation immer wieder übersehen oder vergessen wird. Dies führt dann zu der (unrichtigen) Vorstellung, „dass die Entropie eines Systems generell nicht abnehmen kann“. Daher betonen wir, dass der zweite Hauptsatz natürlich nicht ausschließt, dass Prozesse existieren, bei denen die Entropie eines Systems abnimmt:
Eine Abnahme der in einem System enthaltenen Entropie ist möglich, wenn diese, beispielsweise über den in Abschnitt 2.10 besprochenen Prozess der Wärmeleitung, gemeinsam mit Energie an ein anderes System abgegeben wird. Die Abnahme der Entropie eines Körpers ist ein alltägliches Ereignis, das nach Gl. 2.10 beispielsweise bei der Abkühlung der Kaffeetasse auf unserem Frühstückstisch vorliegt. Dabei wird die ursprünglich im Kaffee gespeicherte Entropie an die Umgebung, und zwar überwiegend an die umgebende Luft, abgegeben. Die Umgebungsluft erwärmt sich dabei zunächst; die Wärmekapazität der Atmosphäre ist aber so groß, dass diese Temperatur-Erhöhung nach kurzer Zeit nicht mehr spürbar ist. Ein Abkühlungsprozess tritt immer dann auf, wenn ein Körper mit einem anderen in thermischen Kontakt gebracht wird, der sich auf einer niedrigeren Temperatur befindet. Der heißere Körper kühlt ab, der kältere erwärmt sich. Wie wir in den folgenden Abschnitten ausführlich besprechen werden, gibt der zweite Hauptsatz also unsere Alltagserfahrung wieder, dass der thermische Kontakt zu einem Transport von Energie und Entropie vom wärmeren zum kälteren Körper erfolgt und nach ausreichend langer Zeit stets zum Ausgleich der Temperaturdifferenz führt. Wie wir in Abschnitt 2.9 sehen werden, nimmt die Entropie des kälteren Körpers dabei stärker zu, als die des wärmeren Körpers abnimmt – daher ist der Ausgleichsprozess mit der Erzeugung von Entropie verbunden und damit irreversibel. Diejenigen Grundgleichungen der Physik, welche den zeitlichen Ablauf von Prozessen beschreiben, nämlich die Newton’schen Gleichungen, die MaxwellGleichungen oder die Schrödinger-Gleichung, weisen alle eine fundamentale Symmetrie auf: die Invarianz unter Zeitumkehr. Die Asymmetrie zwischen Erzeugbarkeit und Unvernichtbarkeit der Entropie bricht diese Zeitumkehrinvarianz! Das bedeutet,
58 | 2 Thermische Systeme dass es schwer ist, die Erzeugung von Entropie im Rahmen von Modellen zu beschreiben, deren zeitliche Entwicklung durch die oben genannten Zeitumkehr-invarianten Grundgleichungen bestimmt wird.14 Aus diesem Grund findet die Entropie in unserem durch die Mechanik und die Elektrodynamik geprägten Verständnis der Physik nur schwer einen Platz. Die in fast allen realen Prozessen auftretenden Irreversibilitäten werden in der theoretischen Physik am liebsten „wegidealisiert“. Wenn es einen Weg gegeben hätte, die Entropie aus der Physik zu eliminieren, dann wäre das ganz sicher geschehen! Wir können allerdings nur feststellen, dass dies in den letzten 150 Jahren trotz aller Versuche offenbar nicht gelungen ist. Es ist eines der zentralen Anliegen dieser Darstellung, das häufig anzutreffende Unbehagen im Umgang mit der Entropie dadurch zu mildern, dass wir die starken Analogien zwischen der Entropie und den vertrauteren Größen Energie, elektrische Ladung, Impuls, Drehimpuls und Stoffmenge betonen und klare Regeln für den Umgang mit der Entropie angeben. Diese Analogien haben ihre Ursache in der Eigenschaft der Mengenartigkeit und den damit verbundenen vertrauten Operationen des Bilanzierens.
2.5 Der dritte Hauptsatz Wie wir in den Abschnitten 3.4 und 3.7 sehen werden, sollte die Wärmekapazität im Rahmen von auf der Basis der klassischen Mechanik gewonnenen Modellen stets temperaturunabhängig sein. Nehmen wir dies als gegeben an und betrachten dann Gl. 2.11, so stellen wir fest, dass S(T ) unterhalb der charakteristischen Temperatur T ∗ beliebig große negative Werte annimmt, wenn sich T dem absoluten Nullpunkt nähert. Wären unbeschränkt negative Werte der Entropie physikalisch sinnvoll, so sagt Gleichung 2.11 aus, dass einem heißen Körper mit einer bei allen Temperaturen endlichen Wärmekapazität unendliche Mengen an Entropie entzogen werden könnten. Wie bei der Energie erscheint ein solches Verhalten unphysikalisch und erregte bereits im 19. Jahrhundert erhebliche Zweifel an der Sinnhaftigkeit des Konzepts der Entropie. Daher wurden zunächst nur Entropiedifferenzen als physikalisch sinnvoll angesehen. Es war zu dieser Zeit nicht absehbar, dass die Wurzel des Problems nicht in der Entropie, sondern in der klassischen Mechanik zu suchen ist! Vertritt man die die Auffassung, dass die in einem Körper mit endlicher Wärmekapazität enthaltene Entropiemenge positiv und endlich sein muss, so bereits das einfachst mögliche thermische System – der heiße Körper, dass das Konzept der Entropie mit der klassischen Physik nicht verträglich ist. Dies beinhaltet, dass die klassischen Modelle, welche eine T -Unabhängigkeit der Wärmekapazität zur Folge haben, bei T T ∗ kollabieren müssen. Im zweiten Teil des Buches werden wir sehen, dass die Quantentheorie das
14 Dieses Thema ist noch immer Gegenstand der aktuellen Forschung.
2.5 Der dritte Hauptsatz | 59
cp (J/mol K)
30
Pb Au Ag Cu
20
10 C
0
200
T (K) 400
600
Abb. 2.2. Gemessener Verlauf der molaren Wärmekapazität für verschiedene Elemente als Funktion der Temperatur (bei konstantem Druck). Die horizontale gestrichelte Linie markiert den Wert von Dulong und Petit; die vertikale gestrichelte Linie markiert 300 K. Auffallend ist, dass Diamant (C) die bei weitem kleinste Wärmekapazität aufweist. Die (zunächst qualitative) Erklärung dieser Unterschiede im gemessenen Verlauf auf der Basis eines mikroskopischen Modells des Festkörpers durch Einstein stellt einen der frühen Triumphe der Quantentheorie dar (Abschnitt 11.4).
Problem löst und die charakteristische Temperatur T ∗ in Gl. 2.11 mit dem Abstand der nach dieser Theorie nicht mehr kontinuierlich variierenden, sondern diskreten Anregungsenergien der betrachteten Systeme in Verbindung bringt. Auf der experimentellen Seite bedeutet dies, dass für T T ∗ Abweichungen von der durch Gl. 2.9 gegebenen Form der Zustandsgleichung auftreten müssen. In der Tat wurde bereits am Ende des 19. Jahrhunderts experimentell beobachtet, dass die Wärmekapazität von vielen Festkörpern und Gasen zu tiefen Temperaturen hin stark abnimmt. Diese Beobachtung wurde von Lord Kelvin, dem wir das Konzept der absoluten Temperatur verdanken, als eine der „dunklen Wolken am Himmel der klassischen Physik“ bezeichnet und hat die damals angestrebte Zurückführung der Eigenschaften der Materie auf die klassische Mechanik vor ein fundamentales Problem gestellt. Heute können Messungen der Wärmekapazität bis zu Temperaturen nahe am absoluten Nullpunkt durchgeführt werden. Wie Abbildung 2.2 zeigt, liegen die Ergebnisse für die Edelmetalle bei Zimmertemperatur dicht bei 25 J/(mol K), dem nach Dulong und Petit im Rahmen der klassischen Physik erwarteten Wert, während Diamant deutlich davon abweicht. Bei tiefen Temperaturen sind die Wärmekapazitäten jedoch alles andere als temperaturunabhängig und streben tatsächlich den Wert Null an. Bei hohen Temperaturen unterscheiden sich die Wärmekapazitäten bei konstan-
60 | 2 Thermische Systeme tem Volumen und bei konstantem Druck merklich – die Erklärung dieses (bei Gasen wesentlich bedeutsameren) Effekts stellen wir bis zu Abschnitt 3.6 zurück. Das unphysikalische Verhalten von S(T ) lässt sich durch die folgende Forderung ausschließen:
Die Wärmekapazität jedes physikalischen Systems muss bei Annäherung an den absoluten Nullpunkt verschwinden. Daraus folgt nach den Gleichungen 2.5 und 2.8, dass die Energie, wie die Entropie, nach unten beschränkt sind, und im Grenzfall T → 0 konstanten Werten E0 und S0 zustreben müssen. Diese These wurde erstmals 1906 von Nernst ausgesprochen.15 Von Planck wurde darüber hinaus vorgeschlagen den Nullpunkt der Entropie so festzulegen, dass S0 = 0 ist. Anschaulich lässt sich dieser Sachverhalt wie folgt formulieren: Der Entropieinhalt jedes endlichen Systems ist endlich. Wird einem System sämtliche Entropie entzogen, so kann es nicht weiter abgekühlt werden und seine Temperatur ist absolut gleich Null. Diese Aussage legt die Absolutwerte der Entropie für jedes System eindeutig fest. Wir können daher die Integrationskonstante S0 aus Gl. 2.8 eliminieren und erhalten allgemein: T S(T ) =
C(T ) dT . T
(2.16)
0
In der Literatur findet sich üblicherweise die Umkehrung dieser Formulierung:
Bei Annäherung an den absoluten Nullpunkt strebt die Entropie jedes im inneren thermischen Gleichgewicht befindlichen Systems gegen den Wert Null. Diese Aussage wird als der dritte Hauptsatz der Thermodynamik bezeichnet. Dabei ist die Einschränkung auf Systeme „im inneren thermischen Gleichgewicht“ erforderlich, weil es Systeme gibt, die aus mehreren Teilsystemen bestehen, zwischen denen der
15 Wie wir in Abschnitt 7.8 sehen werden, wurde Nernst durch Überlegungen zur Vorhersagbarkeit der Lage chemischer Reaktionsgleichgewichte zu seiner These geführt.
2.5 Der dritte Hauptsatz | 61
thermische Kontakt sehr schwach sein kann. In diesem Fall kann die Einstellung einer einheitlichen Temperatur in allen Teilsystemen extrem lange dauern.16 Die Kühlleistung eines Kühlaggregats, das heißt der in das Kühlaggregat abgeführte und mit dem Entropiestrom IS verbundene Energiestrom IE = T · IS muss wegen des Vorfaktors T bei Annäherung an den absoluten Nullpunkt verschwinden. Weil in der Realität keine perfekte thermische Isolation existiert, ist es unmöglich, den absoluten Nullpunkt tatsächlich zu erreichen.17 Die tiefste mit einer realen Apparatur erreichbare Temperatur ist diejenige, bei der sich der Wärmeeintrag durch die unvollkommene Isolation und die Wärmeabfuhr durch das Kühlaggregat die Waage halten. Die Existenz eines absoluten Temperatur-Nullpunkts ist der Existenz eines absoluten Nullpunkts für den Druck analog (und ähnlich plausibel). Dem absoluten DruckNullpunkt, den man auch als das „absolute Vakuum“ bezeichnen könnte, nähert man sich an, wenn einem Gasvolumen mit Hilfe einer Pumpe Gasteilchen entzogen werden. Er liegt dort, wo dem System keine Teilchen mehr entzogen werden können. Ein absolutes Vakuum ist aufgrund der endlichen Leckrate realer Vakuum-Apparaturen und der mit dem Druck abnehmenden Effizienz realer Pumpen in der Praxis ebenso unerreichbar wie der absolute Nullpunkt der Temperatur.18 Die Existenz einer unteren Schranke für die Entropie und die Entropiedichte sowie die daraus folgende Existenz eines absoluten Nullpunkts der Temperatur erscheinen sehr natürlich. Wie wir gesehen haben, folgt daraus ein direkter Widerspruch zu den etablierten und anschaulichen, auf der Basis der klassischen Mechanik gewonnenen, Modellen. Letztlich sagt der 3. Hauptsatz also, dass bei tiefen Temperaturen die QuantenNatur aller physikalischen Systeme zutage kommen muss. Er spielt daher eine wichtige Rolle bei der Bildung von Modellen. Im zweiten Teil dieses Buches werden wir sehen, dass die Aussage des dritten Hauptsatzes auf der mikroskopischen Ebene mit der These äquivalent ist, dass der quantenmechanische Grundzustand, das heißt der Zustand niedrigster Energie, nicht entartet ist. Es kann jedoch durchaus vorkommen, dass es in der Nähe des Grundzustandes noch andere Zustände gibt, deren Energien so nahe an der des Grundzustandes liegen, dass es praktisch nicht möglich ist, dem System alle Entropie zu entziehen. Wie bei den anderen Hauptsätzen handelt es sich auch beim dritten Hauptsatz um eine grundsätzlich unbeweisbare Verallgemeinerung unserer bisherigen experimentellen Erfahrung. Seine Rechtfertigung bezieht er daraus, dass ihn alle bisher bekann-
16 Ein Beispiel für solches Verhalten liefern Gläser. 17 Entsprechend formulierte Simon den 3. Hauptsatz als Unmöglichkeits-Aussage: „Es ist unmöglich, einem Körper sämtliche Entropie zu entziehen.“ 18 Die besten bei Zimmertemperatur auf der Erde bisher realisierbaren Vakua weisen Drucke von 10−13 mbar auf. Wie wir in Kapitel 3 sehen werden, entspricht dies immer noch einer Dichte von etwa einer Million Teilchen pro cm3 .
62 | 2 Thermische Systeme ten physikalischen Systeme erfüllen. Im Folgenden werden wir zahlreiche Beispiele kennen lernen.
2.6 Transportphänomene und Entropieerzeugung Wir kehren wieder zur spontanen Einstellung des Gleichgewichts zwischen zwei Kondensatoren zurück: Offenbar ist dieser Prozess mit dem Transport von elektrischer Ladung von einem Kondensator zum anderen verbunden. Nach einer gewissen Zeit kommt der Transport, das heißt der elektrische Strom in dem Schaltkreis, zum Erliegen, und zwar genau dann, wenn die Spannung, beziehungsweise die elektrische Potenzialdifferenz U = Δφ = φ1 − φ2 , über dem Widerstand null wird. Dies wird durch den Entladungsprozess nur asymptotisch erreicht, wobei der Grenzzustand der Gleichgewichtszustand ist. Das Ohm’sche Gesetz lässt sich also so interpretieren, dass das Aufrechterhalten eines elektrischen Stromes durch den Widerstand eine gewisse elektrische Potenzialdifferenz erfordert, deren Wert durch den Wert R des Widerstands bestimmt ist. Es ist also möglich, eine elektrische Potenzialdifferenz Δφ in einem elektrisch leitfähigen Medium als Antrieb für einen Strom IQ = G Q · Δ φ
Ohm’sches Gesetz
(2.17)
der zu φ thermodynamisch konjugierten Größe Q anzusehen, wobei GQ = 1/R der dem Widerstand entsprechende elektrische Leitwert ist. Dabei fließt bei diesem Prozess nach Gl. 1.38 neben der elektrischen Ladung auch ein Energie-Strom der Stärke IE,1 = φ1 · IQ über die eine Zuleitung in den Widerstand hinein und ein zweiter Energiestrom der Stärke IE,2 = φ2 · IQ über den zweiten Kontakt wieder ab. Während der einfließende Ladungsstrom betragsmäßig gleich dem abfließenden Ladungsstrom ist (im Widerstand also keine elektrische Ladung deponiert wird), beträgt die Differenz der zu- und abfließenden Energie-Ströme ΔIE = Δ φ · IQ .19 Ohne Kühlung des Widerstands nimmt die in ihm enthaltene Energie also mit der Rate ∂E/∂t = −ΔIE zu
19 Wenn die lokalen Werte der Energieströme IE = φ · IQ , IE = v · IP und IE = T · IS absolut festgelegt sind, so impliziert dies, dass auch die Absolutwerte des elektrischen Potenzials φ, der Geschwindigkeit v und der Temperatur T absolut festgelegt sind. Dies scheint zunächst der aus der Mechanik (Galilei-Invarianz) und Elektrodynamik vertrauten Tatsache zu widersprechen, dass die Null-Punkte der Geschwindigkeit und des elektrischen Potenzials frei wählbar sind. Die Lösung des Problems besteht darin, nur relative Geschwindigkeiten beziehungsweise elektrische Potenzialdifferenzen als thermodynamische Größen zuzulassen. Wie wir später (in Abschnitt 7.7.3) sehen werden, macht die Erhaltung einer mengenartigen Größe X, die absolute Messung des Nullpunkts der zugehörigen intensiven Größe ξX unmöglich. Aus diesem Grund ist es gerade die Erzeugbarkeit der Entropie, welche es ermöglicht, absolute Temperaturen experimentell zu bestimmen.
2.6 Transportphänomene und Entropieerzeugung
| 63
und äußert sich in einem Anstieg der Temperatur. Dies ist nur dann möglich, wenn der elektrische Leitungsprozess mit der Erzeugung von Entropie verbunden ist. Ähnliche Sachverhalte treten nach Gl. 1.38 auch auf bei Ströme anderer mengenartiger Größen in anderen Systemen auf. So gilt für den Impulstransport durch ein viskoses Medium, wie zum Beispiel die Flüssigkeit in einem Stoßdämpfer, −Fx = Ipx = GP · Δv x (y) ,
(2.18)
wobei x-Komponente der Kraft, beziehungsweise des Impulsstroms −Fx = Ipx durch eine Geschwindigkeitsdifferenz senkrecht zur Bewegungsrichtung angetrieben wird (Abb. 2.3a). Der entsprechende „Impulsleitwert“ GP ist durch die Viskosität η des Mediums bestimmt. Dabei fließt bei diesem Prozess neben dem Impulsstrom auch ein Energie-Strom der Stärke IE,2 = vx,2 · IPx über den einen Aufhängepunkt in den Stoßdämpfer hinein und ein zweiter Energiestrom der Stärke IE,1 = vx,1 · IPx über den zweiten Aufhängepunkt wieder ab. Während der einfließende Impulsstrom betragsmäßig gleich dem abfließenden Ladungsstrom ist (im Stoßdämpfer also kein Impuls deponiert wird), beträgt die Differenz der zu- und abfließenden Energie-Ströme ΔIE = Δ vx · IPx . Ohne Kühlung nimmt die im Stoßdämpfer enthaltene Energie also mit der Rate ∂E/∂t = −ΔIE zu und äußert sich ebenfalls in einem Anstieg der Temperatur. Besonders deutlich ist dieser Erwärmungseffekt bei Bremsen aller Art, deren Aufgabe es ist, den in einem Fahrzeug enthaltenen Impuls möglichst effektiv in die Erde abzuleiten und gleichzeitig die kinetische Energie des Fahrzeugs auf andere Weise zu speichern.20 Auch die mechanische Reibung ist also mit der Erzeugung von Entropie (Reibungswärme) verbunden. Nicht ganz analog gilt für ein wärmeleitfähiges Medium zwischen zwei Wärmereservoiren auf unterschiedlichen Temperaturen T1 , T2 > T1 (Abb. 2.3b), dass die Temperaturdifferenz ΔT = T2 − T1 einen Antrieb für den nach Gl. 1.38 mit dem Entropiestrom IS verbundenen Energiestrom IE = T · IS = Gth · ΔT ,
(2.19)
durch ein Medium mit dem Wärmeleitwert Gth darstellt. Dabei variiert die lokale Temperatur T (x) entlang des Mediums, so wie das lokale elektrische Potenzial φ(x) und die lokale Geschwindigkeit vx (y) in den anderen Beispielen. Die besondere, in Abschnitt 2.1 beschriebene historische Entwicklung hat zu der (nach Meinung des Verfassers problematischen) Sprech-(und Denk-)Gewohnheit geführt, nach der mit dem Wort „Wärmestrom“ allein der (offenbar räumlich konstante) Energiestrom IE = T · IS gemeint ist, während der gleichzeitig auftretende
20 Es handelt sich hierbei um einen Sonderfall eines inelastischen Stoßprozesses (Aufgabe 2.4). Da die Masse der Erde viel größer als die des Fahrzeuges ist, kann durch den Stoßprozess allein Impuls und keine Energie auf die Erde übertragen werden. Die Energie muss daher (zunächst) im Fahrzeug verbleiben und wird zur Erwärmung der Bremse verwendet.
64 | 2 Thermische Systeme
a)
viskoses Medium
v1x , F1x Stoßdämpfer
b)
y
v2x , F2x = - F1x
heiß
wärmeleitfähiges Medium
T1
kalt
T2 < T1 IE = T IS
Abb. 2.3. Mechanisches und thermisches Analogon zu Abb. 1.10: a) Irreversibler Transport von Energie und Impuls durch ein viskoses Medium, getrieben von einer Geschwindigkeits-Differenz ΔvX der Aufhängepunkte. Ist ΔvX = 0, so bedeutet dies außerdem einen Energieübertrag auf das Medium, der zu seiner Erwärmung durch die innere Reibung führt, wenn das Medium nicht gekühlt wird. b) Irreversibler Transport von Energie und Entropie („Wärmestrom“) durch ein wärmeleitfähiges Medium, getrieben von einer Temperaturdifferenz ΔT .
Entropiestrom nicht (oder nur im Rahmen der als schwierig geltenden irreversiblen Thermodynamik) diskutiert wird. Diese Betrachtungen lassen sich für kleine Differenzen21 der intensiven Größe ξX wie folgt verallgemeinern:
Verbindet ein X -leitfähiges Medium zwei X -Reservoire, zwischen denen eine Differenz Δξ der zu X thermodynamisch konjugierten intensiven Größen ξX besteht, so ist der resultierende X -Strom IX mit ΔξX gemäß IX = GX · ΔξX
(2.20)
durch den X -Leitwert GX verknüpft.22 Die Beziehung zwischen Strom und Antrieb lässt sich nicht nur in der globalen Form von Gl. 2.20 sondern mit Hilfe der X -Stromdichte j X auch in der lokalen Form j X (r) = −σX grad ξX (r)
(2.21)
darstellen. Dabei hängt die X -Leitfähigkeit σX mit den X -Leitwert GX eines Mediums mit der Länge l und dem Querschnitt A über σX = GX · l/A zusammen.23 l 1 Siemens σ Q = σ = GQ = elektrische Leitfähigkeit A Ωm m
21 Bei hinreichend großen ξX -Differenzen treten im allgemeinen auch höhere Potenzen von Δξ in IX auf. 23 Solche Zusammenhänge sind dem Leser von der elektrischen Leitfähigkeit σ her wohlvertraut.
2.6 Transportphänomene und Entropieerzeugung
σP
l = η = GP A
σth = λ = Gth
l A
Ns kg m Pa s = 2 = s m J W = Km Kms
|
65
Impulsleitfähigkeit (Viskosität) Wärmeleitfähigkeit
Analog zu dem in Abschnitt 1.7 betrachteten elektrischen Potenzialausgleich zwischen den Platten eines Kondensators über einen elektrischen Widerstand der Größe R = 1/GQ , der innerhalb der elektrischen Relaxationszeit τ = RCQ abläuft, stellt sich das thermische Gleichgewicht innerhalb einer thermischen Relaxationszeit τth = C/Gth ein. Hier tritt der inverse Wärmeleitwert an die Stelle des elektrischen Widerstands und die Wärmekapazität C an die Stelle der Ladungskapazität CQ (Abschnitt 2.9 und Aufgabe 2.7). Die Transportgleichungen sind empirischer Natur und gelten keineswegs für jedes Medium und jede Art des Transports. Dennoch lässt sich eine wichtige Klasse von Transportprozessen in linearer Näherung so beschreiben. Die Transport-Koeffizienten GQ , Gth und GP sowie die zugehörigen Leitfähigkeiten σ , λ und η lassen sich experimentell bestimmen. Auf der Basis der kinetischen Gastheorie werden wir in Kapitel 8 ein einfaches Modell entwickeln, welches die Transportkoeffizienten (und beispielsweise auch ihre Temperaturabhängigkeit) mit mikroskopischen Materialeigenschaften in Verbindung bringt. Wie bereits gesagt, erfolgt nach Gl. 1.38 in allen Beispielen nicht nur ein Transport der mengenartigen Größe X , sondern gleichzeitig auch von Energie. Dieser Energietransport ist (mit Ausnahme der Wärmeleitung) im Gegensatz zu dem von X „verlustbehaftet“, das heißt die Energie wird nicht vollständig von einem X -Reservoir auf das andere übertragen, sondern mit der Rate 2 T · ΣS = Δξ · IX = IX /GX
(2.22)
zur irreversiblen Produktion von Entropie verwendet. Solche Transporte nennt man dissipativ, da sie mit der „Dissipation“, das heißt der irreversiblen „Zerstreuung“ von Energie verbunden sind. Stationäre Verhältnisse, das heißt eine konstante Temperatur des Mediums, sind dabei nur möglich, wenn die erzeugte Entropie zusammen mit der dissipierten Energie an ein Wärmereservoir, das heißt ein weiteres System abfließt, welches Energie und Entropie speichern kann. Dabei wird der Wärmestrom durch die Temperaturdifferenz zwischen Widerstand und Wärmereservoir getrieben. Nach Gl. 1.38 beträgt die Stärke des Energiestroms in das Wärmereservoir, beziehungsweise die an das Wärmereservoir abgegebene Heizleistung Pheiz = IE = T · IS , wobei T die Temperatur des Wärmereservoirs ist. Bei Widerständen in elektronischen Schaltkreisen ist das Wärmereservoir die Umgebung des Widerstands, wobei die Erwärmung ein eher unerwünschter Nebeneffekt ist, den man gegebenenfalls durch Kühlkörper oder andere Kühlmaßnahmen reduzieren muss. Beim Tauchsieder oder beim Elektroherd dagegen ist das Wärmereservoir das zu erwärmende Gut und die Erwärmung selbst der Zweck des Geräts.
66 | 2 Thermische Systeme
a)
Thermometer
T1, E1, S1 T2 < T1 , E2, S2 b) T1, E1 -'E, S1 - 'S1 T1, E2+'E, S2+'S2
Abb. 2.4. Temperaturausgleich zwischen einem heißen Körper (T = T1 ) und einem kälteren Thermometer (T = T2 ). a) vor dem thermischen Kontakt; b) nach dem thermischen Kontakt.
2.7 Die Messung der Temperatur Zur Temperaturmessung benutzt man meist mechanische oder elektrische Größen von bestimmten Referenz-Systemen, die in bekannter Weise von der absoluten Temperatur abhängen. Wie in Abb. 2.4 dargestellt, wird dazu das Thermometer in thermischen Kontakt mit dem zu messenden System gebracht, dessen Temperatur gemessen werden soll. Dabei werden so lange Energie und Entropie ausgetauscht, bis thermisches Gleichgewicht vorliegt, das heißt, bis beide dieselbe Temperatur haben. Der Ausgleichsprozess kann eine Weile dauern (wie beim Fiebermessen). Wir berechnen mit Hilfe des Energieerhaltungssatzes die Temperaturänderung des Messobjekts: !
ΔE1 + ΔE2 = C1 ΔT1 + C2 ΔT2 = 0 .
Daraus folgt, dass ΔT1 = −
C2 ΔT2 |ΔT2 | , C1
wenn C1 C2 ist. Damit das Thermometer die Temperatur des zu messenden Systems nicht ändert, müssen die ausgetauschten Energie- und Entropiemengen ΔE und ΔS klein gegen die im zu messenden System enthaltenen Energie- und Entropiemengen E1 und S1 sein. Das kann dadurch erreicht werden, dass das Thermometer eine viel kleinere Wärmekapazität als das zu messende System hat. Im übernächsten Abschnitt werden wir sehen, dass für den Temperaturausgleich wie für jede andere spontane Einstellung eines Gleichgewichts ΔSgesamt = ΔS1 + ΔS2 > 0 ist. Die anfängliche Temperaturdifferenz zwischen Messobjekt und Thermometer ist die treibende Kraft für den Temperaturausgleich und die Einstellung des thermischen Gleichgewichts. In Abschnitt 2.9 werden wir sehen, dass der Ausgleichsprozess stets mit einem Entropiezuwachs verbunden und daher irreversibel ist. Neben den erwähnten auf der thermischen Ausdehnung beruhenden Thermometern werden heute oft elektrische Thermometer verwendet, zum Beispiel Widerstandsthermometer oder Thermoelemente. Ein Thermoelement besteht aus zwei elektrischen Leitern aus verschiedenen Materialien, die an einer Stelle elektrisch leitfähig verbunden werden (Abb. 2.5). Die Verbindungsstelle befindet sich auf der zu messenden Temperatur T1 und die offenen
2.8 Die Messung der Wärmekapazität und der Entropie |
67
V T1
T2
Abb. 2.5. Ein Thermoelement besteht aus zwei Metalldrähten aus unterschiedlichem Material, die an einer Stelle elektrisch verbunden sind. Die über dem Element gemessenen Thermospannung V hängt von den gewählten Materialien und den Temperaturen T1 und T2 ab. Besonders hohe Thermospannungen weisen Kombinationen mit einer (verdünnten) magnetischen Legierung wie Kupfer/Konstantan oder Gold/Gold-Eisen auf.
Enden auf einer Referenztemperatur T2 , zum Beispiel Zimmertemperatur. Die Temperaturdifferenz ΔT = T1 − T2 bewirkt einen Wärmestrom T IS = Gth ΔT . Ein Thermoelement nutzt aus, dass der aufgrund der Temperaturdifferenz fließende Wärmestrom im Elektronensystem mit einem Elektronenstrom verknüpft ist, der in den unterschiedlichen Leitern in der Regel verschieden ist. Diese unterschiedlich starke Kopplung von IN und IS führt zu einer Spannungsdifferenz zwischen den offenen Enden, welche als Thermospannung gemessen werden kann. Im Zusammenhang mit der Modellierung der Transportphänomene in Kapitel 8 und bei der thermodynamischen Beschreibung des Elektronensystems in Kapitel 14 wird dieser Effekt im Detail erklärt. Thermoelemente haben den Vorteil, dass sie einen sehr einfachen und robusten Aufbau, eine hohe Empfindlichkeit, eine sehr kleine Wärmekapazität und damit eine kurze Ansprechzeit sowie einen großen Temperaturbereich (vom absoluten Nullpunkt bis nahe an die Schmelztemperatur des Materials) miteinander verbinden.
2.8 Die Messung der Wärmekapazität und der Entropie Kalorimetrie Das historisch älteste Verfahren zur Bestimmung von Wärmekapazitäten ist die Kalorimetrie. Ein Kalorimeter besteht aus einem mit Wasser gefüllten und allseitig wärmeisolierten Behälter. Die Temperatur des Wassers wird mit einem Thermometer gemessen. Bringt man einen Körper mit der Wärmekapazität CK und der Anfangstemperatur TKa in das Kalorimeter, so wird sich beim Einstellen des Temperaturgleichgewichts die Temperatur des Wassers von TWa auf die Endtemperatur Te ändern. Dabei fließen bestimmte Beträge von Energie und Entropie vom Körper in das Wasser. Die Energieänderung und damit die Wärmekapazität des Körpers lassen sich durch Ausnutzung der Erhaltung der Energie bestimmen, wenn die Wärmekapazität
68 | 2 Thermische Systeme
Abb. 2.6. Ein Kalorimeter dient der Bestimmung der bei Einstellung eines thermischen oder chemischen Gleichgewichts an das Wasser abgegebenen Energiemenge. Es erlaubt die Bestimmung von Wärmekapazitäten, solange diese unabhängig von der Temperatur sind.
des Wassers bekannt ist: ΔEKörper = CK (TKa − Te ) = −ΔEWasser = −CW (TWa − Te ).
Das Verfahren setzt voraus, dass die beiden Wärmekapazitäten unabhängig von T sind. Die spezifische Wärmekapazität des Wassers beträgt c˜W = CW /MW = 1 kcal/(kgK), wobei die sich Einheit „ – Kalorie“ von dem alten Wort „Caloricum“ für die Wärmemenge ableitet (1 cal = 4.18 J). Mit Hilfe der Anfangs- und Endtemperaturen lässt sich auf diese Weise die Wärmekapazität des Körpers bestimmen, wenn die Wärmekapazität (der „Wasserwert“) des leeren Kalorimeters noch abgezogen wird. Ein Kalorimeter misst also Energiemengen. Kalorimeter werden heute noch in der Chemie (zum Beispiel zur Bestimmung von Reaktions„wärmen“), aber auch als Detektoren in der Teilchenphysik verwendet. Die Entropiebilanz des Temperaturausgleichs werden wir in Abschnitt 2.9 betrachten.
Heizpulsverfahren Die der einfachen Kalorimetrie innewohnende Beschränkung auf Körper mit konstanter Wärmekapazität lässt sich vermeiden, wenn nur sehr kleine Temperaturdifferenzen auftreten, bei denen C als konstant angenommen werden kann. Durch Erhöhung der Temperatur in vielen kleinen Schritten lässt sich dann die Abhängigkeit der Wärmekapazität von der Temperatur experimentell bestimmen. Wie wir im zweiten Teil des Buches sehen werden, ist diese Temperaturabhängigkeit physikalisch sehr interessant, da sie Aufschluss über die Energien der inneren Anregungszustände des zu untersuchenden Systems gibt. Die praktische Umsetzung dieser Idee ist das „Heizpuls“Verfahren:
2.8 Die Messung der Wärmekapazität und der Entropie |
69
Probenthermometer Hauptthermometer
0.3 mm Probe
a
Heizer
b
Abb. 2.7. Anordnungen zur Messung der Wärmekapazität eines Festkörpers bei tiefen Temperaturen mit dem Heizpulsverfahren. a) Eine in einem Kupferrahmen thermisch isoliert aufgehängte dünne Saphirplatte dient als Träger für ein kleines Kohlethermometer, einen aufgedampften mäanderförmigen Metallfilm als Heizer und die mit etwas Fett aufgeklebte Probe. b) Modernes Mikrokalorimeter aus einem auf 100 μm abgedünnten Cernox-Chip, der gleichzeitig als Heizer und Thermometer dient und an 10 μm dünnen elektrischen Zuleitungen aufgehängt ist. Die Probe ist ein kleiner Zeolith-Einkristall mit einer Masse von ca. 10 μg (Photo: Rolf Lortz, Hongkong University of Science and Technology).
Der Körper wird thermisch isoliert aufgehängt und mit einem elektrischen Heizer mit dem Widerstand R und einem Thermometer versehen. In dem Heizer wird durch einen Strompuls der Dauer Δt eine bestimmte Energiemenge ΔE = RI 2 Δt dissipiert, das heißt die Entropiemenge ΔS = ΔE/T erzeugt, und die resultierende Temperaturerhöhung ΔT gemessen. Daraus ergibt sich die Wärmekapazität C(T ) = T · ΔSerzeugt /ΔT = ΔEdiss /ΔT . Dabei muss ΔE klein genug gewählt werden, um zu gewährleisten, dass C(T ) im Temperaturintervall ΔT näherungsweise als konstant angenommen werden kann. Wie beim Kalorimeter muss die Wärmekapazität der Anordnung durch eine Messung ohne Probe bestimmt und dann von der Messung mit der Probe abgezogen werden. Nach Gl. 2.8 erhält man aus der gemessenen Wärmekapazität C(T ) durch Integrieren sofort die Entropiedifferenz S(T2 ) − S(T1 ) zwischen dem Anfangs- und dem Endzustand der Messung. Eine experimentelle Bestimmung des Absolutwerts der Entropie erfordert dagegen eine Messung der Wärmekapazität bis hin zum absoluten Nullpunkt. Da dieser stets nur näherungsweise erreicht werden kann, ist man dabei auf eine Extrapolation der Messwerte der Wärmekapazität hin zu T → 0 angewiesen, um den Absolutwert der Entropie nach Gl. 2.16 bestimmen zu können. Wir werden später auf dieses Problem zurückkommen. Abbildung 2.8 zeigt Messwerte der molaren Entropie sˆ(T ). Die Linien entsprechen einer Anpassung durch Gl. 2.11, wobei für die molare Wärmekapazität der Wert von Dulong-Petit cˆ = 24.9 J/(mol K) verwendet und sˆ(T ) durch Variation von T ∗ bei hohen Temperaturen angepasst wurde. Bei Temperaturen T 4T ∗ weichen die Fitkurven nach unten von den Messwerten ab und schneiden bei T ∗ die T -Achse (schräge Pfeile). Substanzen mit einem höheren Atomgewicht m ˆ weisen offenbar höhere Werte von sˆ und niedrigere Werte von T ∗ auf als solche mit niedrigem Atomgewicht. In den Kapiteln 6 und 11 werden wir diese Regelmäßigkeit genauer untersuchen und darauf zurückführen, dass die Abstände zwischen den quan-
70 | 2 Thermische Systeme
100
TS
Quecksilber
s^ (J/mol K)
80 60
T* (K) 22 72 390
Kupfer
40 20 0
Graphit
0
T*
500
T (K)
1000
1500
Abb. 2.8. Messwerte der auf eine Stoffmenge von einem Mol bezogenen Entropie von Quecksilber, Kupfer und Graphit. Die Linien entsprechen Gl. 2.8, wobei die charakteristische Temperatur T0 bei hohen Temperaturen angepasst wurde. Die sprunghafte Zunahme der Entropie von Quecksilber bei der Schmelztemperatur TS (vertikaler Pfeil) ist mit dem Schmelzen des Festkörpers bei dieser Temperatur verbunden (Messwerte nach [11]).
tisierten Energieniveaus mit zunehmender Molmasse abnehmen. Die Messdaten für Quecksilber zeigen die Besonderheit, dass die Entropie bei der Schmelztemperatur TS = 234, 3 K sprunghaft um ca. 9.8 J/(mol K) zunimmt (Kap. 9).
2.9 Entropieerzeugung durch irreversiblen Temperaturausgleich In diesem Abschnitt wollen wir die Energie- und Entropiebilanz bei der Einstellung des thermischen Gleichgewichts zwischen zwei heißen Körpern quantitativ untersuchen. Gegeben seien also zwei Körper 1 und 2 mit nur einem Freiheitsgrad, nämlich S beziehungsweise T . Die Körper seien zunächst thermisch isoliert. Ihre Wärmekapazitäten C1 und C2 sollen, der Einfachheit halber, gleich groß (= C) und temperaturunabhängig sein, aber ihre Anfangstemperaturen T1a > T2a seien unterschiedlich.
IE=T(x)IS T1
T2T2a
!
= 2 C(TEnde − Tref ) + 2 E(Tref )
Endzustand T1 = T2 = TEnde
Daraus folgt T1a + T2a = 2 TEnde
24 Streng genommen gilt diese Aussage nur im zeitlichen Mittel. Die mit den statistischen Aspekten der Entropie verbundenen Fluktuationen der physikalischen Größen zwischen den beiden Körpern wollen wir bis zu einer eingehenden Diskussion im zweiten Teil des Buches vernachlässigen.
72 | 2 Thermische Systeme und schließlich erhalten wir TEnde =
T1a + T2a . 2
Die Forderung nach der Konstanz der Gesamtenergie legt also die Gleichgewichtstemperatur TEnde fest. Die Einstellung des thermischen Gleichgewichts erfolgt also nicht unter Minimierung der Energie. Noch interessanter ist die Entropiebilanz, die wir mit Hilfe der in Abschnitt 2.3, Gln. 2.8 und 2.10 gewonnenen Ausdrücke für S(T ) aufstellen können: T S(T ) =
T C dT = C ln + S(Tref ) T Tref
Tref
T1a T2a + 2S(Tref ) 2 Tref T = S1 (TEnde ) + S2 (TEnde ) = 2C ln Ende + 2S(Tref ) Tref T1a + T2a = 2C ln + 2S(Tref ) 2Tref
SAnfang = S1 (T1a ) + S2 (T2a ) = C ln SEnde
Damit erhalten wir für die bei diesem Prozess erzeugte Entropie: ΔSerzeugt = SEnde − SAnfang = C ln
(T1a + T2a )2 4T1a T2a
(2.24)
Da das arithmetische Mittel 12 (T1a + T2a ) für beliebige Anfangstemperaturen stets grö√ ßer oder gleich dem geometrischen Mittel T1a T2a ist, resultiert stets ΔSerzeugt ≥ 0. Als nächstes fragen wir, wie groß die Entropieänderungen der beiden Körper im Vergleich zur erzeugten Entropie sind. ΔT = T1a − T2a ,
TEnde =
ΔS1
T = C ln Ende = C ln T1a
ΔS2
T = C ln Ende = C ln T2a
Mit der Reihenentwicklung:
T1a + T2a ΔT = T1a − , 2 2
T1a − ΔT /2 T1a T1a − ΔT /2 T1a − ΔT
ΔT = C ln 1 − 2T1a
< 0,
ΔT = C ln 1 + 2(T1a − ΔT )
ln(1 ± x) = ±x − 12 x2 + · · ·
1 ΔT ΔT ΔS2 + ΔS1 − = − C 2(T1a − ΔT ) 2T1a 2
(ΔT )2 2 2T1a
ΔT 2(T1a − ΔT )
2
(ΔT )2 2 4T1a
+
ΔT 2T1a
> 0.
2 +···
2.9 Entropieerzeugung durch irreversiblen Temperaturausgleich
| 73
S
ΔS2 Serzeugt ΔT
ΔS1
Abb. 2.10. Entropiebilanzen zweier Körper beim Temperaturausgleich. Der kalte Körper (2) nimmt mehr Entropie auf als der heiße Körper (1) abgibt. Die Differenz wird während des Wärmeleitungsprozesses erzeugt. Sie ist um so größer, je größer die anfängliche Temperaturdifferenz ΔT war.
folgt schließlich: ΔSerzeugt = C
ΔT 4T1a
2 + ··· .
(2.25)
Die übergeströmte Entropie ist aber proportional zu CΔT /(2T1a ). Das heißt, bei kleinen Temperaturdifferenzen ist die Entropieerzeugung gegen den transportierten Entropiebetrag vernachlässigbar, bei großen dagegen nicht. Dies hat Konsequenzen für die Realisierung reversibler Prozesse. Wie Gleichung 2.19 zeigt, ist der Wärmestrom durch ein wärmeleitfähiges Medium in der Regel proportional zur Temperaturdifferenz ΔT . Wird ΔT klein gehalten, um die erzeugte Entropie klein gegen die übertragene Entropie zu machen, so ist auch der resultierende Wärmestrom klein! Das bedeutet, dass Wärmeleitungsprozesse nur dann näherungsweise reversibel größere Wärmemengen übertragen können, wenn sie sehr langsam ablaufen! Schnelle Prozesse, die auf Zeitskalen der thermischen Relaxationszeit t τth = C/Gth (Abschnitt 2.6) realisiert werden, erlauben praktisch keinen Energie- und Entropieaustausch mit der Umgebung. Solche Prozesse nennt man auch adiabatisch. Bei langsamen Prozessen, die auf Zeitskalen t τtherm realisiert werden, bleibt das betrachtete System im thermischen Gleichgewicht mit der Umgebung. Wie wir im folgenden Abschnitt sehen werden, sind die Wärmeleitwerte verschiedener Materialien nicht allzu verschieden. Soll Entropie über eine große Temperaturdifferenz reversibel übertragen werden, so kann dies nicht über Wärmeleitung geschehen. Wegen der Energieerhaltung muss die Energiedifferenz zwischen dem Anfangs- und dem Endzustand an ein anderes System abgeführt werden. Aus der Annahme ΔSGesamt = C ln
T1a T T ! + C ln 2a − 2C ln Ende = 0 Tref Tref Tref
folgt: 2 T1 T2 − TEnde =0
und TEnde =
T1a T2a
Cv ! Bei Gasen ist dieser Unterschied allerdings sehr viel größer als bei Flüssigkeiten und Festkörpern. Bei letzteren kann der Unterschied zwischen Cp und Cv in vielen Fällen vernachlässigt werden, so wie wir es in Abschnitt 2.3 getan haben. Anstatt die „Energieform“ T dS zu betrachten, können wir eine allgemeine Definition der Wärmekapazität angeben, die sich direkt auf die Entropie S = S(T, {αi }) als Funktion der Temperatur und beliebigen weiteren Variablen {αi } stützt: C{αi } dT := T dS(T, {αi }) = T
∂S ∂S dαi dT + ∂T ∂αi
i
=0
bei konstanten αi . Damit erhalten wir als allgemeine Definition der Wärmekapazität bei konstanten {αi }: C{αi } (T ) = T
∂S(T, {αi }) . ∂T
(3.22)
Welche Größen αi konstant gehalten werden, ist die Entscheidung des Experimentators. Für ein thermisches System mit r Freiheitsgraden gibt es (r − 1)2 verschiedene Wärmekapazitäten. Werden V und N beziehungsweise p und N konstant gehalten, so gilt: Cv,N = T
∂S(T, V, N ) , ∂T
beziehungsweise Cp,N = T
∂S(T, p, N ) . ∂T
(3.23)
Außerdem gibt es neben Cv,N und Cp,N noch eine Wärmekapazität bei konstantem chemischen Potenzial μ: Cv,μ (T ) = T
∂S(T, V, μ) . ∂T
Letztere ist allerdings von geringer praktischer Bedeutung – wir werden ihr nur in den Abschnitten 5.6 und 14.2 wieder begegnen. Wenn es nicht ausdrücklich erwähnt wird, wollen wir in Zukunft stillschweigend N = const. annehmen und die Indizes N und μ in Zukunft weglassen. Die Wärmekapazitäten Cv und Cp sind (bis auf den Faktor T ) analog den Ladungskapazitäten eines Kondensators bei konstantem Plattenabstand beziehungsweise konstanter Kraft zwischen den Platten. In Abschnitt 5.2 werden wir zeigen, dass sich die Differenz zwischen Cp und Cv unabhängig von der Natur des betrachteten Systems mit der isothermen Kompressibilität κT und dem thermischen Ausdehnungskoeffizienten β in Verbindung bringen lässt:
3.7 Der Gleichverteilungssatz |
C p − Cv = T · V ·
βp2 . κT
103
(3.24)
Es ist auch bei Gasen üblich, die Mengenabhängigkeit aus der Wärmekapazität herauszudividieren, um Werte zu erhalten, die für den jeweiligen Stoff charakteristisch sind. Dadurch erhält man die Wärmekapazität pro Teilchen cˆ{αi } = C{αi } /N , die in der Literatur auch spezifische Wärmekapazität oder kürzer, aber irreführend, spezifische Wärme genannt werden. Die letztgenannte Bezeichnung darf nicht zur Verwechslung von Wärmekapazität und Wärme Q führen. Ersteres ist eine über die Ableitung von ∂S(T, {αi })/∂T wohldefinierte Zustandsgröße, die letztere nicht!
3.7 Der Gleichverteilungssatz Bei Molekülen sind die Translationsfreiheitsgrade nicht die einzigen mikroskopischen Freiheitsgrade,16 die einen Beitrag zur thermischen Energie liefern. Zusätzliche Beiträge kommen von inneren Freiheitsgraden der Moleküle, wie den Rotationen und den Schwingungen. Die Maxwell’sche Ableitung der Verteilungsfunktion lässt sich auf alle Fälle übertragen, in denen die Energie quadratisch von der entsprechenden extensiven Variable des Moleküls abhängt. Daraus resultiert der Gleichverteilungssatz:17
Lässt sich die Energie der Moleküle eines Stoffes durch f in den Mikrovariablen quadratische Beiträge sowie die Ruhenergie darstellen, so gilt für die Gesamtenergie des Systems: E(T, V, N ) =
f N kB T + E0 2
Gleichverteilungssatz
(3.25)
Der Name „Gleichverteilungs“-Satz rührt daher, dass die zu Verfügung stehende Energie auf alle Freiheitsgrade gleich verteilt ist. Im folgenden zählen wir die wichtigsten Beispiele auf: Translationsfreiheitsgrade:
2 p2x py p2z , , , 2m ˆ 2m ˆ 2m ˆ
16 Man sollte die in der thermodynamischen Beschreibung des Gases als Ganzes auftretenden (makroskopischen) Freiheitsgrade nicht mit den (mikroskopischen) Freiheitsgraden seiner Moleküle durcheinanderbringen. . . 17 Der Gleichverteilungssatz lässt sich auch aus der später eingeführten Boltzmann-Verteilung ableiten (Kapitel 11), wenn man entsprechend der klassischen Physik annimmt, dass die Energie der mikroskopischen Freiheitsgrade kontinuierlich variiert und nicht quantisiert ist.
104 | 3 Ideale Gase
Rotationsfreiheitsgrade:
2 L2x Ly L2z , , , 2J 2J 2J
Elastische Freiheitsgrade:
1 1 1 Kx x2 , Ky y 2 , Kz z 2 . 2 2 2
Damit ergeben sich die folgenden Anwendungen: • einatomige Gase (zum Beispiel Edelgase und Metalldämpfe) 3 Translationsfreiheitsgrade •
3 Translationsfreiheitsgrade 2 Rotationsfreiheitsgrade + 2 Schwingungsfreiheitsgrade:
εi =
5 5 k T, Cv = N kB 2 B 2 Cv =
7 N kB 2
dreiatomige, geknickte Molekülgase (zum Beispiel H2 O-Dampf) 3 Translationsfreiheitsgrade 3 Rotationsfreiheitsgrade
•
3 3 k T, Cv = N kB 2 B 2
zweiatomige Gase (zum Beispiel O2 , N2 ,. . . )
•
εi =
εi = 3kB T, Cv = 3N kB
Festkörper (zum Beispiel Au, Cu, . . . ) 3 Translationsfreiheitsgrade 3 elastische Freiheitsgrade
εi = 3kB T, Cv = 3N kB
Das letzte Ergebnis ist als die Regel von Dulong und Petit bekannt. Gehen wir zu den in Abb. 2.2 gezeigten spezifischen Wärmekapazität cˆp von Festkörpern zurück, so erkennen wir, dass die Messwerte gerade bei Zimmertemperatur recht gut mit der durch die gestrichelte Linie angedeutete Regel von Dulong und Petit übereinstimmen. Der weitere Anstieg vom cˆp über den Wert 3kB hinaus ist auf die bei hohen Temperaturen auch für Festkörper nicht mehr vernachlässigbare thermische Ausdehnung und damit den Unterschied von cˆp und cˆv zurückzuführen Gl. 3.24). Die starke Diskrepanz bei tiefen Temperaturen ist dagegen im Rahmen des klassischen Modells nicht erklärbar. Während sich die Wärmekapazitäten pro Teilchen cˆv und cˆp zwischen Gasen einerseits, und Flüssigkeiten und Festkörpern andererseits maximal um einen Faktor 2 unterscheiden, betragen diese Unterschiede für die Wärmekapazitäten pro Volumen cv,p = Cv,p /V bei Normaldruck etwa einen Faktor 1000. Dieser Unterschied kommt im wesentlichen durch das Verhältnis der Teilchendichten n zustande. Aufgrund der aus dem Gleichverteilungssatz folgenden Temperatur-Unabhängigkeit der Wärmekapazitäten und der daraus resultierenden Divergenz der Entropie können wir jetzt schon sagen, dass der Gleichverteilungssatz bei tiefen Temperaturen nicht richtig sein kann. Das liegt an der Abschnitt 3.5 zugrundeliegenden (im Rahmen
3.7 Der Gleichverteilungssatz |
105
c^ V /kB 6 CO2 4 H 2O 2 CO2
0
0
H 2O
Cl2
Cl2
N2 H2
Edelgase, Hg-Dampf
500
1000
T (K)
Abb. 3.6. Molare Wärmekapazitäten cv für verschiedene Gase als Funktion der Temperatur. Mit Ausnahme von H2 sind die Rotationsanregungen der zweiatomigen Moleküle bei Zimmertemperatur bereits voll angeregt. Die Schwingungsanregungen machen sich in vielen Fällen erst bei höheren Temperaturen bemerkbar (nach [5]).
der klassischen Mechanik selbstverständlichen) Annahme, dass die molekularen Anregungsenergien stetig variieren. Letzteres widerspricht den Erkenntnissen der Molekülphysik. Nach der Quantenmechanik sind die Anregungsenergien meist quantisiert! Die Aussage des Gleichverteilungssatzes gilt bei Molekülgasen meist nur in relativ engen Temperaturbereichen. Abbildung 3.6 zeigt, dass die gemessenen Wärmekapazitäten von mehratomigen Gasen in der Regel von der Vorhersage des Gleichverteilungssatzes abweichen. Dies liegt daran, dass die Energien der Rotations- und Schwingungs-Freiheitsgrade innerhalb des dargestellten Temperaturintervalls liegen. Bei hinreichend großen Temperaturvariationen zeigt sich in fast allen thermischen Systemen eine Temperaturabhängigkeit der spezifischen Wärmen, die genuin quantenmechanischen Ursprungs ist und die wir in Abschnitt 11.5 und 11.4 quantitativ erklären werden. Aus heutiger Sicht waren diese Phänomene die ersten Vorboten des Zusammenbruchs der klassischen Physik. Wir wollen abschätzen, bei welchen Temperaturen eine Temperaturabhängigkeit der Wärmekapazitäten auftreten sollte. Dazu sehen wir uns an, welche Werte die Energiequanten für die quantenmechanische Version der Systeme „Freier Rotator“ und „Harmonischer Oszillator“ annehmen:
106 | 3 Ideale Gase Rotator: Die Rotationsenergien εl = [2 l(l + 1)]/2J variieren in Stufen, da der Drehimpuls ˆz = l in Einheiten von quantisiert ist. Dabei ist = 1.054 · 10−34 J s das Planck’sche Wirkungsquantum. Oszillator: Die Schwingungsenergien εn = ω(n + 1/2) sind ganzzahlig quantisiert, wobei ω = K/m ˆ die Schwingungsfrequenz ist. Aufgrund des kleinen Trägheitsmoments lassen sich Elektronen in den Atomen bei Zimmertemperatur normalerweise nicht zu Rotationen anregen.18 Aus demselben Grund entfällt in linearen Molekülen ein Rotationsfreiheitsgrad, nämlich der um die Längsachse. Beim Wasserstoff H2 liegt die niedrigste Rotationsenergie ε1 /kB ≈ 85 K wegen der niedrigen Siedetemperatur ( 20.3 K) im experimentell zugänglichen Bereich, bei Zimmertemperatur sind die Rotationsfreiheitsgrade daher so hoch angeregt, dass die Quantisierung der Anregungsenergien vernachlässigt werden kann. Die Schwingungsenergie ω ist typischerweise etwa 2–3 Größenordnungen größer als die Rotationsenergie 2 /2J . Entsprechend werden Molekülschwingungen üblicherweise erst oberhalb von Zimmertemperatur merklich angeregt. Eine Ausnahme sind Molekülgase aus sehr schweren Atomen, wie zum Beispiel Br2 und I2 . Atome:
Moleküle:
Trägheitsmoment des Elektrons im 2 Atom: J = m ˆ e rB ≈ 2.6 · 10−51 J s2
Trägheitsmoment des Moleküls: 2 −46 J = 2m ˆ N LN2 /2
= 1.4 · 10
J s2
Elektronenmasse: m ˆ e = 9.1 · 10−31 kg Wegen m ˆp m ˆ e kann die Bewegung
Masse eines N-Atoms: m ˆ N = 14 u = 2.3 · 10−26 kg
des Protons vernachlässigt werden. Bohr’scher Radius: rB = 5.3 · 10
−11
m
niedrigste Rotationsenergie: 2 Δεrot = 2J ≈ 2 · 10−18 J = 105 K
Kernabstand von N2 : LN2 = 1.1 · 10−10 m
niedrigste Rotationsenergie: Δεrot = 4 · 10−23 J = 3K
Aus den in Abb. 3.6 gezeigten Messungen der Wärmekapazität von Gasen lässt sich also auf die charakteristischen Anregungsenergien der Moleküle schließen. Mit Hilfe geeigneter Modelle für Schwingungs- und Rotationsbeiträge zur Wärmekapazität (Kapitel 11) können so mikroskopische Systemparameter, wie die Schwingungsfrequenz oder das Trägheitsmoment, bestimmt werden.
18 Bei ausreichend hohen Temperaturen sind solche elektronischen Anregungen natürlich möglich.
3.8 Expansion und Kompression – Kompressibilitäten |
107
3.8 Expansion und Kompression – Kompressibilitäten Freie Expansion nach Gay-Lussac Neben der linearen Temperaturabhängigkeit ist die nach Gl. 3.9 erwartete Unabhängigkeit der Energie E(T, V, N ) vom Volumen ein weiteres wichtiges Charakteristikum von idealen Gasen. Diese lässt sich mit Hilfe des in Abb. 3.7 skizzierten Expansionsexperiments von Gay-Lussac experimentell untersuchen. Das Experiment zeigt, dass die Temperatur eines thermisch isolierten Gases bei einer freien (das heißt nicht mit Arbeitsleistung verbundenen) Expansion konstant bleibt. Da außerdem N konstant ist, können wir wegen ∂E(T, V, N ) ∂T (E, V, N ) 1 ∂E(T, V, N ) ∂V = − = − ∂E(T, V, N ) ∂V Cv ∂V ∂T
schließen, dass ∂E(T, V, N ) ≡ 0 ∂V
(3.26)
ist (Anhang A.3). Wenn wir den Formalismus etwas weiter entwickelt haben, werden wir in Abschnitt 5.2 sehen, dass Gl. 3.26 eine Identifikation der in Gl. 3.6 definierten empirischen Gastemperatur mit der absoluten Temperatur erlaubt. Das Gay-LussacExperiment stellt daher eines der Schlüsselexperimente zur Etablierung der absoluten Temperaturskala dar (Aufgabe 5.3). Da der Prozess außerdem bei E = const. abläuft, können wir die bei der freien Expansion erfolgende Zunahme der Entropie aus der Gibbs’schen Fundamentalform und der thermischen Zustandsgleichung berechnen: dE = T dS − p dV + μ dN ≡ 0
=⇒
=0
dS =
p(T, V, N ) N kB dV = dV . T V
Damit folgt, dass bei dem Expansionsprozess der Entropiebetrag V2 ΔSerzeugt = N kB
dV = N kB ln V
V2 V1
V1
irreversibel erzeugt werden muss.
Isotherme Kompression und Expansion Eine vollständige Umkehrung der freien Expansion ist wegen der Unvernichtbarkeit der dabei erzeugten Entropie nicht möglich. Entfernt man jedoch die thermische Isolation und komprimiert man das Gas bei konstantem N durch langsames Hineinschieben eines Kolbens (sodass auch T dabei konstant bleibt) von V2 auf V1 in den rechten
108 | 3 Ideale Gase
(a)
adiabatischer Einschluß
(b)
Wärmereservoir
− pdV
Ventil
Ventil
TdS Abb. 3.7. a) Freie Expansion eines idealen Gases nach Gay-Lussac. Zwei thermisch gegen die Umgebung isolierte Behälter mit dem Gesamtvolumen V2 sind über ein Ventil verbunden. Die thermische Isolation unterbindet den Entropie-Austausch mit der Umgebung. Die Temperatur des Gases wird mittels eines Thermometers gemessen. Das Gas befinde sich bei geschlossenem Ventil zunächst im linken Behälter mit dem Volumen V1 , während der rechte evakuiert ist. Durch Öffnen des Ventils strömt das Gas in den rechten Behälter über, bis sich ein Druckgleichgewicht zwischen beiden Behältern einstellt. b) Umkehrung der Gay-Lussac-Expansion eines idealen Gases. Um die Temperatur bei der Kompression konstant halten zu können, muss die thermische Isolation entfernt und der Prozess ausreichend langsam durchgeführt werden.
Behälter, so kann der Anfangszustand des Gases wieder hergestellt werden. Die dabei zugeführte Energie (die dabei verrichtete Arbeit W ) kann einfach durch Integration von p(T, V, N ) = N kB T /V bestimmt werden:
V1 W=−
p(T, V, N ) dV = N kB T ln
V2 V1
.
(3.27)
V2
Die auf mechanischem Wege zugeführte Energiemenge W und die Änderung der im Gas enthaltenen Energie E können aber bei konstanter Temperatur wegen der Unabhängigkeit der Energie vom Volumen (Gl. 3.26) nicht identisch sein! Es ist nicht ausreichend, nur den mechanischen Freiheitsgrad des Systems zu betrachten, um die im Gas bei diesem Prozess auftretende Energieänderung zu bestimmen. Anders als bei einer Feder wird die bei der isothermen Kompression über den mechanischen Freiheitsgrad zugeführte Energie nicht im Gas gespeichert, sondern über den thermischen Freiheitsgrad wieder abgeführt. Da T und N bei einer isothermen Kompression konstant sind, lässt sich die im vorangegangenen Abschnitt gezeigte Konstanz der Energie bei der isothermen Kompression eines Gases nur so verstehen, dass sich bei diesem Prozess ebenfalls die Entropie ändert. Aufgrund des 2. Hauptsatzes ist dies allein dadurch möglich, dass ein bestimmter Entropiebetrag an die Umgebung abgegeben wird. Die obige Rechnung zeigt, dass der abgeführte Entropiebetrag wegen E(T, V, N ) = const. gleich dem bei der Gay-Lussac-Expansion irreversibel erzeugten Entropiebetrag ist:
ΔSabgeführt = −
W = −N kB ln T
V2 V1
.
3.8 Expansion und Kompression – Kompressibilitäten |
(a)
(b)
Wärmereservoir
adiabatischer Einschluß
− pdV
TdS
T = const.
109
− pdV
S = const.
Abb. 3.8. Isotherme a) und isentrope b) Expansion eines idealen Gases. In beiden Fällen wird Energie über den Kolben abgeführt. Im isothermen Fall ist der Druckabfall geringer und die vom Kolben geleistete Arbeit höher, weil Energie aus dem Wärmereservoir nachfließt.
Umgekehrt müssen bei einer reversiblen Realisierung der isothermen Expansion Energie und Entropie aus einem Wärmereservoir nachfließen, um die Energie des Gases bei der Expansion konstant zu halten. Charakteristisch für die thermodynamische Beschreibung ist, dass der vom Gas durchlaufene Prozess (das heißt die Abfolge der Werte der physikalischen Größen des Gases) unabhängig davon ist, ob er reversibel oder irreversibel realisiert wird. Bezüglich der Entropie verhält sich das Gas bei isothermer Expansion und nachfolgender Kompression ähnlich wie ein Schwamm, der sich in Kontakt mit Wasser zunächst vollsaugt und aus dem das Wasser bei Kompression wieder herausgepresst wird. Der Entropietransport in die Umgebung erfolgt durch den Prozess der Wärmeleitung (Abschnitt 2.10). Experimentell äußert sich dies darin, dass die Temperatur des Gases bei einer schnellen Kompression ansteigt. Eine Kompression oder Expansion ist schnell, wenn wenn sie auf einer Zeitskala erfolgt, die kürzer als die thermische Relaxationszeit τth erfolgt. In der Praxis ist τth durch die niedrige Wärmeleitfähigkeit des Gases bestimmt. (Aufgabe 3.9) Das Gas wird dann heißer, weil die Wärmeleitung zu langsam ist, um das sofortige Abfließen der Entropie in die Umgebung zu erlauben. Dieser Effekt ist jedem bekannt, der schon einmal einen Fahrradschlauch aufgepumpt hat.
Isentrope Kompression und Expansion Wir wenden uns nun der Frage zu, wie sich isotherme (T = const.) von isentropen (S = const.) beziehungsweise adiabatischen19 Kompressions- und Expansions-
19 Zur Terminologie: In vielen Büchern wird statt des Ausdrucks „isentrop“ der Ausdruck „adiabatisch“ benutzt. Damit ist gemeint, dass das System thermisch isoliert ist, das heißt, dass die das System begrenzenden Wände für Entropie undurchlässig sind. Wie das Beispiel der Gay-Lussac-Expansion zeigt, sind adiabatische Prozesse nicht notwendigerweise isentrop, da innerhalb der adiabatischen
110 | 3 Ideale Gase Prozesse quantitativ beschreiben lassen. Um die bei der isentropen Expansion ge leistete Arbeit W = − p(S, V, N ) dV zu berechnen, muss man p als Funktion von V kennen. Für isotherme Prozesse ist der Zusammenhang zwischen p und V durch die thermische Zustandsgleichung gegeben. Die Isothermen im pV -Diagramm sind daher einfach Hyperbeln. Für isentrope Prozesse lässt sich ein analoger Zusammenhang zwischen p und V angeben. Um diesen abzuleiten betrachten wir wieder die Gibbs’sche Fundamentalform dE = T dS − p dV
und lösen diese nach 1 p dE + dV T T
dS =
(für N = const.)
auf. Nehmen wir an, dass die Wärmekapazität Cv = N κ kB des Gases durch einen dimensionslose, temperaturunabhängige Systemkonstante κ gegeben ist, so können wir dS mit Hilfe der thermischen Zustandsgleichung umschreiben: dS =
T Cv
Cv N kB ! dT + dV = 0 T V
dT = −N kB T
T0
V
dV V
V0
T V κ ln = − ln T0 V0
T T0
κ
=
V0 V
Das Produkt T κ V ist für Expansionsprozesse bei konstantem {S, N } also eine von S und N abhängige Konstante: V T κ = T0κ V0 = C(S, N ) .
(3.28)
Eliminiert man T mit Hilfe der thermischen Zustandsgleichung T = pV /N kB , so erhält man den gewünschten Zusammenhang zwischen p und V : pV
κ +1 κ
= pV γ = p0 V0γ = C (S, N )
(3.29)
mit C (S, N ) = p0 C(S, N )γ /T0κ +1 . Die Gleichungen 3.28 und 3.29 werden die Adiabatengleichungen genannt und
Hülle Entropie erzeugt werden kann. Nur wenn ein adiabatischer Prozess reversibel ist, ist er auch isentrop.
3.8 Expansion und Kompression – Kompressibilitäten |
γ =
Cp κ+1 = ≥ 1 Cv κ
111
(3.30)
heißt der Adiabatenexponent. Wir können Werte von γ nach unseren Überlegungen in Abschnitt 3.7 für einfache Beispiele angeben: 3 , 2 5 κ= , 2
einatomige ideale Gase: κ = zweiatomige ideale Gase:
5 2 5 · = ≈ 1.66 2 3 3 7 2 7 γ = · = = 1.4 2 5 5 γ=
(3.31) (3.32)
Könnten wir die Werte der von S und N abhängigen Konstanten bestimmen, so hätten wir auch Zugang zur Entropie. Für diese Aufgabe benötigen wir noch etwas mehr Rüstzeug, welches wir im nächsten Kapitel bereitstellen werden. Zuvor wollen wir aber noch einige Anwendungen der Adiabatengleichungen besprechen.
Isotherme und isentrope Kompressibilität Die Definition der Kompressibilität κ = −(1/V )∂V /∂p lässt zunächst offen, welche anderen Variablen bei der Kompression konstant gehalten werden sollen. Analog zur Wärmekapazität sind bei konstantem N zwei verschiedene Kompressibilitäten zu unterscheiden: κT (T, p, N ) = −
1 ∂V (T, p, N ) 1 = V ∂p p
κS (S, p, N ) = −
1 ∂V (S, p, N ) V ∂p
isotherme Kompressibilität, isentrope Kompressibilität.
κT folgt direkt aus der thermischen Zustandsgleichung (Gl. 3.3); für das ideale Gas erhalten wir κT = 1/p (Gl. 3.5). Jetzt wollen wir κS aus der Isentropengleichung be-
rechnen: V (S, p, N ) =
C (S, N ) p1/γ
κS = −
=⇒
∂V (S, p, N ) 1 C (S, N ) =− ∂p γ p(1+1/γ)
C (S, N ) 1 ∂V (S, p, N ) 1 1 p1/γ = · (1+1/γ) = V ∂p γ C (S, N ) p γp
Für die isentrope Kompressibilität resultiert damit: κS =
1 ≤ κT γp
da γ ≥ 1
(3.33)
Bei Systemen mit endlichem thermischen Ausdehnungskoeffizienten βp ist die isotherme Kompressibilität κT stets größer als die isentrope κS , da die isentrope Kompression zu einer Temperaturerhöhung und damit bei gleicher Druckänderung zu einer
112 | 3 Ideale Gase kleineren Volumenänderung führt. Schallwellen sind ein Beispiel für isentrope Druckschwankungen, die so schnell erfolgen, dass der Temperaturausgleich durch Wärmeleitung vernachlässigbar ist. Die Schallgeschwindigkeit cSchall wird durch die Massendichte m = mn ˆ und κS bestimmt. Daher lässt sich der Adiabatenexponent sehr elegant über eine Messung der akustischen Schallgeschwindigkeit bestimmen: 1 γp γp γkB T cSchall = √ (3.34) = = = , κS m
m
mn ˆ
m ˆ
da n = N/V = p/(kB T ). Damit erhalten wir: γ=
mc ˆ 2Schall . kB T
Da γ von der Zahl der Freiheitsgrade der Gasmoleküle abhängt, erlauben Messungen der Schallgeschwindigkeit einen Rückschluss darauf, ob das Gas atomar (zum Beispiel He) oder als Molekül (zum Beispiel H2 ) vorliegt. Derart unerwartete Zusammenhänge sind typisch für die Thermodynamik, da sie gerade die Verknüpfung von thermischen und mechanischen Eigenschaften quantitativ beschreiben kann.
Übungsaufgaben 3.1. Totales Differenzial Es sei die Funktion (3.35)
z(x, y) = cos πx + cos πy
gegeben. a) Wie lautet das totale Differenzial diese Funktion? b) Bestimmen Sie die stationären Punkte – also die Punkte, an denen alle partiellen Ableitungen verschwinden – der Funktion in Gleichung (3.35). Weswegen nennt man diese Punkte „stationär“? c) Um die Art eines stationären Punktes (xS , yS ) weiter zu bestimmen (ob es sich um ein lokales Extremum handelt), muss die Matrix H der zweiten partiellen Ableitungen ⎛ 2 ⎞ 2 ⎜ H=⎜ ⎝
∂ z(xS , yS ) ∂x2
∂ z(xS , yS ) ⎟ ∂x∂y
∂ 2 z(xS , yS ) ∂y∂x
∂ 2 z(xS , yS ) ∂y 2
⎟ ⎠
berechnet und die Definitheit der durch sie gegebenen quadratischen Form untersucht werden. Welche der unter a) gefundenen Punkte entsprechen (lokalen) Minima beziehungsweise Maxima der Funktion z(x, y)? Von welchem Typ sind die übrigen stationären Punkte aus a)?
3.8 Expansion und Kompression – Kompressibilitäten |
113
3.2. Chemisches Potenzial eines heißen Körpers Die Massieu-Gibbs-Funktion eines heißen Körpers mit konstanter Wärmekapazität C(N ) = N cˆ ist nach Gl. 2.14 durch
E(S, N ) = N cˆ T ∗ exp
S N cˆ
+ N eˆB
gegeben, wobei T ∗ seine durch das Hoch-Temperaturverhalten der Entropie (Abb. 2.8) definierte charakteristische Temperatur und eˆB die Bindungsenergie der Atome im Festkörper ist. a) Gewinnen Sie das chemische Potenzial μ eines heißen Körpers mit Hilfe der Zustandsgleichung ∂E(S, N ) . ∂N b) Zeigen Sie, dass μ allein von T und nicht von N abhängt und, dass gilt: E − TS μ = . N μ(S, N ) =
Eine praktische Anwendung dieser Größe werden wir in Kapitel 9 kennenlernen, wo sie das Schmelz- und Sublimations-Gleichgewicht bestimmt. 3.3. Das ideale Gasgesetz nach Gay-Lussac Bringen Sie das ideale Gasgesetz auf die von Gay-Lussac entdeckte Form, in welcher die Temperatur θ = T − 273◦ C in ◦ C gemessen und anstelle der Stoffmenge die Masse M des Gases verwendet hat. Wie universell ist das Gasgesetz in dieser Formulierung? 3.4. Prozesse mit idealen Gasen a) Erklären Sie die Begriffe “isotherm”, “isobar”, “isentrop”, “isochor”, “isoenergetisch”. b) Gibt es einen Unterschied zwischen “isentrop” und “adiabatisch”? c) Existieren Prozesse mit idealen Gasen, die gleichzeitig isentrop und isoenergetisch sind? d) Existieren Prozesse, die gleichzeitig isobar und isochor sind? 3.5. Thermische Ausdehnung von Gasen Betrachten Sie ein Röhrchen mit Durchmesser d und zwei offenen Enden, welches senkrecht in ein mit Wasser gefülltes Becken getaucht wird, so dass das obere Ende noch um die Höhe h h aus dem Wasser herausragt. Die Temperatur sei T0 . Dann wird das obere Ende des Röhrchens verschlossen und die Temperatur des Gases auf T1 erhöht.
d T0
T1 ?
Dd
Wie verändert sich der Pegel der Wassersäule im Röhrchen?
114 | 3 Ideale Gase
Hinweis: Finden Sie die Bedingung für Druckgleichgewicht bei der erhöhten Temperatur. 3.6. Isotherme Expansion Wir betrachten den Prozess der isothermen Expansion eines idealen Gases. a) Wieviel Arbeit leisten 10 Liter Argon (als ideales Gas betrachtet), wenn sich das Volumen bei konstanter Temperatur (T = 300 K) um 50% vergrößert? Wie ändert sich dabei die Energie des Gases? Nehmen Sie an, dass der Anfangsdruck des Gases p0 = 1 bar beträgt. b) Berechnen Sie außerdem – wieder mit Hilfe des Gibbs’schen Fundamentalform sowie der Energieerhaltung – die Entropieänderung der betrachteten Gasmenge. c) Eine experimentelle Realisierung der Gay-Lussac-Expansion benutzt zwei Behälter mit einem Volumen von jeweils 5 , die in einem thermisch isolierten Wasserbad mit einer Wassermenge von 3.5 eingebettet sind. Der eine Behälter sei zu Beginn des Versuches evakuiert, der andere enthalte Luft bei einem Druck von 1 bar. Die Wärmekapazität der Behälter werde vernachlässigt; die des Wassers beträgt c˜ = 4.184 kJ/(kg·K). Welche obere Schranke resultiert für den Gay-Lussac-Koeffizienten
∂T (ˆ e, vˆ) ∂T (E, V, N ) alternativ: ∂ˆ v
∂V
und die Änderung der molaren Energie ∂ˆ e(T, vˆ) ∂E(T, V, N ) alternativ: ∂ˆ v
∂V
aus der Tatsache, dass keine Temperaturänderung beobachtet wird, wenn die Messgenauigkeit für die Temperatur des Wasserbades ±1 mK beträgt und die thermische Isolation als perfekt angenommen wird? d) Vergleichen Sie das Resultat von c) mit der Energiedichte bei StandardBedingungen und dem aus anderen Experimenten bestimmten Wert ∂E(T, V, N )/∂V = 0.22 J/. Kommentieren Sie den Vergleich. 3.7. Thermodynamische Suszeptibilitäten Benutzen Sie die thermische Zustandsgleichung des idealen Gases, um folgende Suszeptibilitäten zu berechnen: a) Isotherme Kompressibilität: κT = −
1 ∂V (T, p, N ) , V ∂p
b) Isobarer thermischer Ausdehnungskoeffizient: βp =
1 ∂V (T, p, N ) . V ∂T
3.8 Expansion und Kompression – Kompressibilitäten |
115
3.8. Messung des Adiabatenexponenten nach Clement und Desormes Der Adiabatenexponent γ = Cp /Cv eines idealen Gases kann auf folgende elegante Art bestimmt werden: Ein ideales Gas befinde sich bei Raumtemperatur T0 in einem verschlossenen Gefäß (Volumen V0 ), wobei sein Druck p0 + Δp1 geringfügig über dem Umgebungsdruck p0 liegt. Der Druck wird an einem angeschlossenen Manometer abgelesen. Dann wird ein Hahn geöffnet, so dass sich der Druck im Gas rasch mit dem der Umgebung ausgleicht – dabei sinkt die Temperatur unter T0 (warum?). Nachdem der Hahn wieder geschlossen ist, steigt die Temperatur erneut auf T0 und es wird der Enddruck p0 + Δp2 abgelesen. Zeigen Sie, dass gilt: γ=
Δp1 . Δp1 − Δp2
Hinweis: Bei der Ableitung der vorstehenden Formel findet die Tatsache Verwendung, dass die Beträge der auftretenden Druckänderungen klein sind. 3.9. Messung des Adiabatenexponenten nach Rüchardt Ein in einem Volumen von 1 befindliches zweiatomiges ideales Gas werde durch eine in einem Zylinder nahezu reibungsfrei gelagerte Kugel mit der Masse M = 10 g und dem Querschnitt A = 1 cm2 abgeschlossen. Der Verlust durch zwischen der Kugel und der Zylinderwand ausströmendes Gas wird durch einen Zufluss ersetzt.
dz z=0
p
a) Berechnen Sie die Federkonstante des Gases und die Schwingungsfrequenz f des so realisierten Gasoszillators zunächst unter der Annahme, dass das Gas thermisch perfekt isoliert ist. Betrachte Sie dazu die lineare Näherung der Kraft auf die Kugel um die Gleichgewichtslage. b) Was ändert sich, wenn die Oszillationsfrequenz so niedrig ist, dass die Schwingung isotherm erfolgt? c) Begründen Sie mit Hilfe der thermischen Eindringtiefe Lth = D/f , warum die isentrope Rechnung eine gute Näherung darstellt. 3.10. Statistische Verteilung von Zufallsgrößen Eine Zufallsgröße x sei gemäß der Verteilungsfunktion w(x) = A exp(−x) zufällig verteilt. a) Berechnen Sie die Normierungskonstante A.
116 | 3 Ideale Gase
b) Berechnen Sie die Mittelwerte der folgenden Funktionen von x: nutzen Sie die Gammafunktion ∞ Γ(x) =
dt tx−1 e−t , mit Γ(1/2) =
√
π
√
x, x, x2 . Be-
und Γ(N + 1) = N ! für n ∈ N.
0
c) Zeigen Sie, dass die Γ-Funktion folgender Rekursionsrelation genügt: Γ(x + 1) = xΓ(x) .
3.11. Maxwell-Verteilung Die Verteilung der Geschwindigkeiten v = |v| der Teilchen in einem Gas lautet 4 f (v) = √ π
m ˆ 2 kB T
3/2
v 2 exp −
m ˆ v2 2kB T
.
a) Berechnen Sie mit Hilfe von f (v) die mittlere Geschwindigkeit |v| und das mittlere Geschwindigkeits-Quadrat v 2 eines Gases mit dem Molgewicht m ˆ. b) Welche Zahlenwerte erhalten Sie für He und N2 Gas bei T = 300 K? c) Können Sie aufgrund des Ergebnisses in b) begründen, warum die Erdatmosphäre fast kein He (mehr) enthält? 3.12. Mikroskopische Interpretation der adiabatischen Kompression Berechnen Sie die Zunahme der (mittleren) Geschwindigkeitsbetrags d |v| /dt und der kinetischen Energie d ε /dt von Gasteilchen der Masse m ˆ bei der Reflexion an einem das Gas mit der Geschwindigkeit vK komprimierenden Kolben. Welches Resultat erwarten Sie? 3.13. Photonengas Zeigen Sie analog zum Bernoulli-Modells für massive Teilchen, dass ein Gas aus extrem relativistischen Teilchen den folgenden Zusammenhang zwischen Druck p und Energiedichte e aufweist: p =
1 e(T ) . 3
p
θ p⊥
Hinweis: Berechnen Sie den mittleren Impulsübertrag |P | auf eine Wand, indem Sie annehmen, dass die Verteilungsfunktion W (P ) nur von |P |, aber nicht von der Richtung von P und der zu P parallelen Geschwindigkeit c abhängt. Benutzen Sie den Energie-Impuls Zusammenhang ε = cP = c|P | der Photonen und mitteln Sie den Impulsübertrag auf die Wand über alle Winkel θ.
3.8 Expansion und Kompression – Kompressibilitäten |
117
In Aufgabe 5.6 werden wir das Resultat auf das Photonengas, das heißt auf das Problem der thermischen Strahlung, anwenden. Die Herleitung beruht allein auf der Form von ε(P ) und ist damit extrem robust. Sie hat (im Gegensatz zum idealen Gasgesetz) alle späteren Revolutionen in der Physik überdauert. 3.14. Statistische Unabhängigkeit Sind u und v statistisch unabhängige Zufallsvariablen, dann ist die Wahrscheinlichkeit dafür, dass u im Bereich zwischen u und u + du und v im Bereich zwischen v und v + dv liegen, definiert durch Wuv (u, v) du dv = Wu (u)Wv (v) du dv .
a) Berechnen Sie die Mittelwerte u und v von u und v und die Korrelation von u und v , corr(u, v) = uv − u v . Es sei Y die Summe aus n Zufallsvariablen n Xi : Y = Xi . i=1
Alle Xi haben den gleichen Mittelwert X und die Varianz σX X 2 − X 2 . b) Berechnen Sie Y 2 . σ c) Berechnen Sie die relative Streuung Y als Funktion von σX . n
=
4 Maschinen In diesem Kapitel wird zunächst das grundlegende Funktionsprinzip abstrakter Maschinen, insbesondere der Wärmekraftmaschine, vorgestellt. All diesen Maschinen ist gemeinsam, dass ihnen Energie über einen Kanal A (im Sinne von Abschnitt 1.6) gemeinsam mit der Größe XA zugeführt und über einen anderen Kanal B gemeinsam mit der Größe XB wieder abgeführt wird. Im Allgemeinen ist keine vollständige Übertragung der Energie von dem Energieträger A auf den Energieträger B zu erzielen, weil die über A gemeinsam mit der Energie zugeführte Größe XA auch wieder abgeführt werden muss, um das Arbeitssystem der Maschine (im zeitlichen Mittel) in einem stationären Zustand zu halten. Diese Tatsache ist unabhängig von der Natur der Maschine und liegt dem berühmten Carnot’schen Wirkungsgrad zugrunde. Darüber hinaus wird untersucht, welche Eigenschaften ein physikalisches System haben muss, um als Arbeitsmedium für eine Maschine in Frage zu kommen. Schließlich besprechen wir Beispiele für die Realisierung von Kolbenmaschinen mit Gasen.
4.1 Die Kopplung verschiedener Energie-Transportprozesse Im Abschnitt 2.6 haben wir bereits diskutiert, dass sich die Ströme mengenartiger Größen durch eine Differenz der zugehörigen intensiven Größen antreiben lassen. Eine Maschine hat den Zweck, den Strom einer Größe XA und einen mit diesem Strom verbundenen Energiestrom durch die Differenz einer anderen intensiven Größe ξB anzutreiben. Auf diese Weise wird es möglich, den Strom IXA gegen die dazugehörige ξA -Differenz zu treiben und insbesondere ξA -Differenzen zwischen zwei XA -Speichern zu erzeugen, die anfänglich im Gleichgewicht waren. Hier sind einige konkrete Beispiele: •
Wasserturbine – Wasserpumpe Eine Pelton-Turbine1 ist eine Maschine, welche die potenzielle Energie des Wassers in einem Wasserreservoir dadurch nutzbar macht, dass es durch die Turbine hindurch in ein tiefer liegendes Wasserreservoir geleitet wird. Der Wasserstrom – abstrakter: ein Massenstrom IM – wird durch die Differenz ΔφM der zur Masse thermodynamisch konjugierten Größe – des Gravitationspotenzials φM – angetrieben. Die anfänglich im Gravitationsfeld gespeicherte Energie wird zunächst in die kinetische Energie des mit der Geschwindigkeit v strömenden Wassers umgesetzt. Ein Anteil ΔI p = ΔP˙ = M˙ Δv des an den Massenstrom gekoppelten
1 Bei einer Kaplan-Turbine bleibt dagegen die Strömungsgeschwindigkeit der Wassers konstant, aber der Druck nimmt ab.
4.1 Die Kopplung verschiedener Energie-Transportprozesse |
119
Impulsstroms fließt über die Lager der Turbine in die Erde ab. Dabei sind M˙ die pro Zeiteinheit durchströmende Masse und Δv die Geschwindigkeitsdifferenz des Wassers vor und hinter der Turbine. Der Rotor der Turbine setzt den durchfließenden Impulsstrom in einen Drehimpulsstrom durch die Turbinenachse um, der zur Arbeitsleistung – zum Beispiel in einem Generator – genutzt werden kann. Eine Wasserpumpe kehrt diesen Prozess um und kann einen Massenstrom unter Zufuhr von Energie gegen das Gravitationspotenzial aus dem tiefergelegenen in das höhergelegene Reservoir pumpen. •
Elektromotor – Generator Ein Elektromotor ist die zur Turbine exakt analoge elektrische Maschine: Ein von einer elektrischen Potenzialdifferenz U = ΔφQ getriebener elektrischer Strom fließt aus einem Ladungsreservoir, etwa dem Pol einer Batterie, durch die Magnetspulen des Motors in den anderen Pol der Batterie zurück. Die dabei auftretenden Magnetfelder treiben einen Drehimpulsstrom vom Stator zum Rotor des Motors, dessen Achse wie bei der Turbine zur Abfuhr der Nutzenergie dient. Ein Generator ist das elektrische Analogon zur Wasserpumpe und wird benutzt, um elektrische Ladung gegen eine elektrische Potenzialdifferenz, beispielsweise zum Aufladen eines Akkumulators, oder durch einen elektrischen Widerstand, zum Beispiel eine Glühbirne, einen Tauchsieder oder einen anderen elektrischen Verbraucher, zu treiben. Wir haben diese bekannten Beispiele betrachtet, um im nächsten Beispiel zu sehen, dass sich eine Wärmekraftmaschine ganz ähnlich verhält – allein die strömende Größe (der „Träger“ des Energiestroms) ist nicht die Masse beziehungsweise die elektrische Ladung, sondern die Entropie:
•
Gasturbine – Wärmepumpe Eine Gasturbine ist der Wasserturbine in der Hinsicht ähnlich, dass in beiden der Druck eines Arbeitsmediums (Wasser oder Gas) ausgenutzt wird, um die Drehung der Turbine anzutreiben. Der entscheidende Unterschied liegt in der Erzeugung des Drucks. Während in einer Wasserturbine meist das Schwerefeld der Erde ausgenutzt wird, arbeitet eine Gasturbine mit einer Verbrennungsreaktion: Bei dieser Reaktion wird eine große Menge an Entropie erzeugt, die gemäß Gl. 2.13 zu einem exponentiellen Temperaturanstieg führt.2 Nach der thermischen Zustandsgleichung 3.3 nimmt der Druck eines (idealen) Gases mit seiner Temperatur (linear) zu. Der mit der Gasströmung verbundene Massenstrom durch die Turbine ist mit einer Druckabnahme und gleichzeitig mit dem Abtransport von Entropie
2 Ein einfacher exponentieller Temperaturanstieg ergibt sich genau genommen nur, wenn das Gas eine konstante Wärmekapazität besitzt. Wie bei anderen Stoffen ist dies nur in gewissen Temperaturbereichen der Fall; für die Funktion der Turbine ist der genaue Verlauf von T (S) jedoch irrelevant.
120 | 4 Maschinen in ein Wärmereservoir verbunden – dieses ist in der Regel die Umgebung der Maschine. Statt der kontinuierlich arbeitenden Turbinen werden in der Technik oft zyklisch arbeitende Kolbenmaschinen verwendet (Dampfmaschine, Ottomotor, Kühlschrank, Klimaanlage). Am Funktionsprinzip, das heißt der Umsetzung eines Entropietransport in eine Drehbewegung (oder umgekehrt), ändert das jedoch nichts. •
Peltier- und Thermoelemente Die in Abschnitt 2.7 wegen ihrer Bedeutung für die Thermometrie bereits angesprochenen Thermoelemente beruhen auf der Kopplung des Entropietransports an den Ladungstransport im Elektronensystem von Metallen (Abschnitt 8.9). Die resultierende Thermospannung Uth zwischen dem heißen und dem kalten Ende des Metalldrahts ist in linearer Näherung proportional zur Temperaturdifferenz: Uth = S(T ) · ΔT . Der Faktor S(T ) heißt die Thermokraft. Ein Temperaturgradient wird in einem Metall daher stets von einem Gradienten des elektrochemischen Potenzials der Elektronen begleitet. Letzterer wird oft auch als elektromotorische Kraft bezeichnet und kann für den Antrieb eines elektrischen Stroms ausgenutzt werden. Peltier-Elemente werden umgekehrt zur Erzeugung eines Temperaturgradienten durch einen elektrischen Strom benutzt. Sie beruhen darauf, dass die von einem Elektronenstrom mitgeführte Entropiemenge für verschiedene Metalle unterschiedlich ist und beim Übergang des Ladungsstroms von einem Metall ins andere auftretende Entropiedifferenz entweder aus der Umgebung zugeführt (Kühlung) oder in diese abgeführt (Heizung) werden muss. In der Praxis bestehen Peltier-Elemente aus vielen, parallel und seriell geschalteten Thermoelementen, um eine Maximierung der resultierenden Temperaturdifferenz und der Kühlbeziehungsweise Heizleistung zu erreichen.
•
Brennstoffzelle Eine Brennstoffzelle verknüpft chemische Umsetzungen mit dem Transport von elektrischer Ladung. Im Gegensatz zur Gasturbine erfolgt die „Verbrennungs“reaktion hier reversibel! Benötigt werden beispielsweise H2 und O2 als Brennstoff und ein Elektrolyt (zum Beispiel Schwefelsäure) als Arbeitsmedium und zur Aufnahme des entstehenden Wassers. Die Gase H2 und O2 umspülen zwei Platinelektroden, an die Elektronen abgegeben beziehungsweise von denen Elektronen aufgenommen werden. Antrieb der Reaktion ist die „chemische Spannung“ der beteiligten Stoffe, das heißt die Tatsache, dass 2μH2 + μO2 > 2μH2 O ist. An den beiden Elektroden laufen die chemischen Reaktionen Kathode Anode
+ − H2 + 2 H 2 O − − − − H3 O + 2 e , − O2 + 2 H2 O + 4 e− − − − − 4 OH .
4.2 Das Carnot’sche Prinzip | 121
Durch die an beiden Elektroden ablaufenden chemische Reaktionen steigen dort die Konzentration und das chemische Potenzial der jeweiligen Reaktionsprodukte. Der entstehende chemische Potenzialgradient treibt einen ionischen Diffusionsstrom von den Elektroden weg und baut einen elektrischen Potenzialgradienten auf. Der Anstieg der elektrischen Spannung kommt erst zum Stillstand, wenn der elektrische Potenzialgradient ausreicht, um den ionischen Diffusionsstrom zum Stillstand zu bringen. Die chemischen Potenziale der Reaktionspartner bestimmen den Energieumsatz und die elektrische Spannung der Zelle. Der technisch ebenso wichtige Innenwiderstand der Zelle wird im wesentlichen durch den Elektrolyten bestimmt, dessen wesentliche Funktion darin besteht, zwar den Transport von H3 O+ und OH– und deren Neutralisation zu H2 O zu erlauben, nicht aber den für den Ablauf der Reaktion ebenso erforderlichen Transport der Elektronen von einer Elektrode zur anderen. Letzterer erfolgt mittels zweier Drähte über einen Verbraucher, zum Beispiel einen Elektromotor.
4.2 Das Carnot’sche Prinzip Mit der Entdeckung der allgemeinen Erhaltung der Energie stellte sich die Frage, ob der in einem Wärmereservoir enthaltene Energievorrat vollständig zur Arbeitsleistung nutzbar gemacht werden kann. Eine solche Maschine könnte praktisch unerschöpfliche Energiemengen zum Beispiel aus der Abkühlung der Ozeane gewinnen. Sie wurde daher ein perpetuum mobile 2. Art genannt. Wie man aufgrund der Tatsache, dass derartige Maschinen nicht allgegenwärtig sind, bereits vermuten kann, gibt es dabei allerdings eine prinzipielle Schwierigkeit. Dies wurde zum ersten Mal von Carnot dargelegt, von dem wichtige prinzipielle Betrachtungen zur Arbeitsweise von Maschinen, insbesondere der Wärmekraftmaschine, stammen. Carnot überlegte sich anhand der oben dargelegten Analogie mit einem Wasserrad, auf welche Weise der Transport von Wärme (im Sinne des alten Caloricums) von einem Reservoir mit hoher Temperatur T1 zu einem mit niedrigerer Temperatur T2 zur Verrichtung von Arbeit genutzt werden kann. Dabei nahm er an, dass die Summe der Wärmemengen beider Wärmereservoire konstant, die gesamte Wärmemenge also erhalten ist. Anhand dieser Analogie hat er ein grundlegendes Charakteristikum jeder Wärmekraftmaschine erkannt, welches diese mit dem oben genannten mechanischen (und dem zu seiner Zeit noch unbekannten elektrischen) Beispiel gemeinsam hat: Die zugeführte Wärme (ebenso wie die der Turbine zugeführte Wassermenge und ebenso wie die dem Elektromotor zugeführte elektrische Ladung) muss auch wieder abgeführt werden, um einen kontinuierlichen Betrieb der Maschine zu gewährleisten! Die Analogie ist allerdings nur dann haltbar, wenn die Maschine ideal arbeitet (also keine Entropie erzeugt), und wir das, was Carnot Wärme nannte, mit der Entropie und nicht mit der Energie identifizieren. Zu Carnot’s Zeiten war noch nicht bekannt, dass sich hinter dem Phänomen des Wärmetransports zwei physikalische Größen, Energie und Entropie verbergen,
122 | 4 Maschinen ebenso wenig wie die Tatsache, dass sich hinter der mechanischen Arbeitsleistung der Transport von zwei Größen, nämlich Energie und Impuls verbergen. Außerdem nahm Carnot wie seine Zeitgenossen als selbstverständlich an, dass die Wärmemenge stets erhalten ist. Letzteres wurde durch die Experimente von Rumford widerlegt, der experimentell zeigte, dass sich durch Reibung beliebige Wärmemengen erzeugen lassen. Diese Experimente zerstörten den Glauben an die „Stoffartigkeit“ der Wärme, da es zu dieser Zeit dem gesunden Menschenverstand zu widersprechen schien, dass Stoffe erzeugt und vernichtet werden können.3 Tatsächlich ist die Vorstellung eines Wärmestoffs wie des Caloricums unhaltbar. Dessen logische Funktion im Rahmen der Carnot’schen Theorie hat heute die Entropie übernommen, welche die Eigenschaft der Bilanzierbarkeit mit der Stoffmenge, der elektrischen Ladung und dem Impuls gemeinsam hat – und auf diese Eigenschaft gründet sich Carnots Analogieschluss. Die von Carnot postulierten Prozesse mit konstanter Entropie werden heute reversibel genannt. Sie bilden einen zumindest in Gedankenexperimenten zu erwägenden Grenzfall, in dem sich die Funktion der Wärmekraftmaschinen besonders einfach darstellen lässt. Die Erkenntnis, dass an der Funktion von Maschinen die Energie als eine weitere mengenartige Größe beteiligt ist, kam erst 25 Jahre später. Die Tatsache, dass die Energie und nicht die „Wärme“ erhalten ist, führte dazu, dass Carnots Theorie (gemeinsam mit dem Begriff des Caloricums) zunächst verworfen wurde. Erst die Arbeiten von Clausius und William Thomson (Lord Kelvin) führten zur Rehabilitierung von Carnots Ideen – allerdings war der Begriff der Wärme zu dieser Zeit schon fest mit der Energie verknüpft. Die dadurch entstandenen begrifflichen Probleme haben wir bereits in Abschnitt 2.1 dargestellt. Wir wollen nun die Bilanzen der physikalischen Größen des Arbeitsmediums (meistens ein Gas) einer Wärmekraftmaschine genauer betrachten. Die Maschine kann entweder kontinuierlich oder zyklisch arbeiten. Für die Aufstellung der Bilanzen sind keine Aussagen über den konkreten Aufbau und die Arbeitsweise der Maschine erforderlich. Es wird allein die Annahme gemacht, dass ihr Arbeitsmedium seinen (gegebenenfalls über einen Zyklus gemittelten) Zustand nicht ändert. Wie in Abb. 4.1 schematisch dargestellt, liefert ein Wärmereservoir mit der Temperatur T1 die für den Betrieb der Maschine notwendige Energie und Entropie. Der in die Maschine einfließende Entropiestrom muss in ein zweites Wärmereservoir mit der Temperatur T2 wieder abgeführt werden, da sich im Arbeitssystem (im zeitlichen Mittel) keine
3 Das Sprichwort „Von nichts kommt nichts!“ spiegelt diese Überzeugung wider. Dem entspricht auch die von Demokrit begründete These, dass die „Grundbausteine der Materie“ unzerstörbar und unvergänglich seien. Die moderne Physik hat aber gezeigt, dass Stoffe durch Prozesse wie den radioaktiven Zerfall, die Kernfusion oder die Paarerzeugung (zum Beispiel von Elektron/Positron-Paaren) durchaus erzeugt oder vernichtet werden können, ohne dass dadurch grundlegende Erhaltungssätze verletzt würden und ohne dass dies der Eigenschaft der Bilanzierbarkeit widerspricht: Diesen Prozessen kann durch den Erzeugungs- und Vernichtungsterm in der Kontinuitätsgleichung Rechnung getragen werden.
4.2 Das Carnot’sche Prinzip | 123
IE1
Reservoir 1 für Energie E und Entropie S Temperatur T1
IE2
Reservoir 2 für Energie E und Entropie S
Maschine
IS2
IS1 IE3
Die Breite der Pfeile ist ein Maß für die Stromstärke
Temperatur T2 < T1
Ipz Feder als Speicher für Nutzenergie
Abb. 4.1. Schematische Darstellung einer Wärmekraftmaschine mit zwei Wärmereservoiren und einem durch eine elastische Feder realisierten Nutzenergiespeicher. Die Maschine steht mit zwei Stützen auf dem Nutzenenergiespeicher. Die Energieströme sind als rote und die Entropieströme als blaue Pfeile eingezeichnet. Die grünen Pfeile geben die Stromstärken des in den Nutzenergiespeicher hineinund hinausfließenden z-Impulses an. Wegen Fz = −IPz entspricht dies den Kräften, welche der Nutzenergiespeicher über die Feder und die Stützen auf die Maschine ausübt. Die Gesamtkraft ist Null, das heißt, die z-Komponente des Impulses fließt in einem geschlossenen Kreislauf. Nur der Impulsstrom durch das bewegte (obere) Federende trägt die Nutzenergie aus der Maschine in die Feder.
Entropie anhäufen darf – letzteres würde im Mittel zu einer (für die Funktion fatalen) fortschreitenden Erwärmung der Maschine führen. Der von der Maschine abgegebene „Nutz“-Energiestrom muss zusammen mit einem anderen Träger (zum Beispiel einem Impulsstrom) an ein weiteres Reservoir oder an einen „Verbraucher“ abgegeben werden. Eine solche Maschine wird auch Carnot-Maschine genannt. Das dritte Reservoir in Abb. 4.1 ist der Nutzenergiespeicher, beispielsweise eine Feder. Wie bereits erwähnt, postuliert der erste Hauptsatz die Erhaltung der Gesamtenergie aller beteiligten Systeme. Die über einen Zyklus gemittelte Summe aller Energieströme in das Arbeitssystem hinein und aus dem Arbeitssystem heraus muss Null sein, weil sich im Arbeitssystem keine Energie anhäufen darf. Falls nirgendwohin anders Energie abfließt, lautet die Energiebilanz: IE1 + IE2 + IE3 = 0 .
Der zweite Hauptsatz postuliert nach Abschnitt 2.4 die Unmöglichkeit, Entropie zu vernichten. Wird im Verlauf eines Prozesses Entropie erzeugt, so ist der Prozess irreversibel, das heißt unumkehrbar. Prozesse mit konstanter Entropie sind dagegen reversibel. Zunächst wollen wir – wie Carnot – idealisierend annehmen, dass unsere Wärmekraftmaschine reversibel arbeitet. Falls nirgendwohin anders Entropie ab-
124 | 4 Maschinen fließt und keine Entropie erzeugt wird, lautet die Entropiebilanz: IS1 + IS2 = 0 .
Der von der Temperaturdifferenz T1 − T2 getriebene Entropiestrom führt langfristig (bei endlicher Größe der Reservoire) zum Ausgleich der Temperaturdifferenz. Eine ideale Wärmekraftmaschine erlaubt also eine reversible Realisierung des Temperaturausgleichs, welche das Gegenstück des irreversiblen Temperaturausgleichs durch Wärmeleitung bildet (Abschnitt 2.9). Schließlich lautet die Impuls-Bilanz: IPz , Feder + IPz , Stütze = 0 .
Wie in Abb. 1.4 ist die Rückleitung des Impulses über die Stütze erforderlich, damit die Feder nicht insgesamt Impuls aufnimmt und sich in Bewegung setzt, anstatt gespannt zu werden. Der Energieerhaltungssatz äußert sich also darin, dass das Arbeitsmedium (die Wärmekraftmaschine) den durchfließenden Entropiestrom und die Längenänderung vz = z˙ der Feder im Mittel so koppeln muss, dass gilt: IE1 + IE2 + IE3 = (−T1 + T2 )IS + vz · IPz = 0 ,
(4.1)
wobei IS = −IS1 = IS2 > 0 und IPz = IPz , Feder = −IPz , Stütze > 0 ist. Diese Beziehung drückt das Carnot’sche Prinzip aus, nach dem die Differenz der ein- und ausfließenden Wärmeströme der nutzbaren Arbeitsleistung entspricht. Gemäß der Vorzeichenkonvention in Abschnitt 1.5 werden die das Arbeitsmedium verlassenden Energie- und Entropieströme positiv, die hineinfließenden negativ gezählt. Von dem aus dem Wärmereservoir 1 in die Maschine fließenden Energiestrom IE1 wird ein mechanisch nutzbarer Energiestrom IE3 (die Nutzleistung) in die Feder abgezweigt, dessen Stärke von der Temperaturdifferenz zwischen den Reservoiren abhängt: IE3 = (T1 − T2 )IS , IE1 = −T1 IS (4.2) Der Quotient der Energieströme IE3 und |IE1 |, das heißt das Verhältnis von Nutzleistung zu zugeführter Leistung η Carnot =
IE3 T − T2 < 1 = 1 |IE1 | T1
für
T2 > 0
(4.3)
heißt Carnot’scher Wirkungsgrad. Wenn T2 > 0 ist, muss selbst bei einer idealen Wärmekraftmaschine η Carnot < 1 sein, da die abzuführende Entropie den Bruchteil IE2 = T2 · IS des einfließenden Energiestroms IE1 in das zweite Wärmereservoir überträgt. Auf lange Sicht muss sich die Temperatur in diesem zweiten Wärmereservoir daher erhöhen, bis schließlich T1 = T2
4.2 Das Carnot’sche Prinzip | 125
wird und der Gewinn an Nutzenergie IE3 auf Null abfällt. Die Unvermeidbarkeit der Erwärmung des zweiten Wärmereservoirs ist mit der Formulierung des zweiten Hauptsatzes nach Thomson äquivalent: Es existiert keine periodisch arbeitende Maschine, die nichts weiter bewirkt als die Abkühlung eines Wärmereservoirs und das Heben einer Last (Unmöglichkeit eines perpetuum mobiles 2. Art).
Diese Formulierung lässt den springenden Punkt allerdings unausgesprochen:
Jede periodisch arbeitende Wärmekraftmaschine bewirkt zusätzlich zum Heben einer Last und der Abkühlung eines Wärmereservoirs die Erwärmung eines zweiten Wärmereservoirs. Die Abkühlung eines Wärmereservoirs impliziert, dass die Maschine diesem neben Energie auch Entropie entzieht, welche durch das Heben einer Last nicht aus der Maschine entfernt wird. Die Abfuhr der Entropie aus der Maschine ist allein durch die Erwärmung eines zweiten Wärmereservoirs möglich! Wäre die Arbeitsleistung der Maschine auch für T1 < T2 möglich, so widerspräche dies der Unmöglichkeits-Aussage von Clausius: Es gibt keinen Prozess, dessen einziges Resultat die Übertragung von Energie und Entropie von einem kälteren zu einem wärmeren Körper ist.
In moderner Sprache lassen sich die Unmöglichkeits-Aussagen von Thomson und Clausius zu der hier gewählten Formulierung des zweiten Hauptsatzes zusammenfassen:
Es gibt kein physikalisches System, keinen Prozess und damit auch keine Maschine, die Entropie vernichtet. Der Witz der Größe Entropie besteht unter anderem darin, die Unmöglichkeit eines perpetuum mobiles 2. Art (die durch die vergeblichen Bemühungen vieler Erfindergenerationen demonstriert wurde) auf ein allgemeines, durch physikalische Größen ausgedrücktes Prinzip – nämlich den Satz von der Unvernichtbarkeit der Entropie – zurückzuführen, ähnlich wie die Unmöglichkeit eines perpetuum mobiles 1. Art auf das allgemeine Prinzip der Erhaltung der Energie zurückgeführt wird. Die Beispiele Wasserturbine und Elektromotor haben bereits gezeigt, dass das Prinzip des Carnot-Prozesses nicht an den Energietransport über Entropieströme gebunden ist – wie wir in Abschnitt 4.4 sehen werden, lässt sich dasselbe Verfahren auf
126 | 4 Maschinen den Transport von zwei beliebigen extensiven Variablen X1 , X2 übertragen, wenn die zugehörigen intensiven Variablen ξ1 , ξ2 des Arbeitsmediums beide Funktionen von X1 und X2 sind. Falls ein geeignetes Arbeitssystem existiert, lässt sich eine ξ1 -Differenz zwischen den X1 Reservoiren zum Antrieb eines X2 -Stroms gegen eine ξ2 -Differenz zwischen den X2 -Reservoiren ausnutzen. Im Falle der Wasserturbine und des Elektromotors erscheint uns selbstverständlich, dass die der Turbine zugeführte Wassermenge beziehungsweise die dem Elektromotor zugeführte Ladung auch wieder abgeführt werden müssen und weiterhin Energie mit sich führen. So trägt auch die in das zweite Wasserreservoir abzuführende Wassermenge eine gewisse Energiemenge mit sich, die von einer weiteren Turbine weiter unten am Fluss genutzt werden kann. Die entscheidende Einsicht von Clausius war die, dass sich hinter der Abweichung des Wirkungsgrads einer idealen Wärmekraftmaschine von 1 die Existenz einer von der Energie unabhängigen und von ihm Entropie genannten physikalischen Größe verbirgt. Hat man die Existenz der Entropie und ihre Mengenartigkeit bereits akzeptiert, so erscheint das Ergebnis seiner in Abschnitt 4.8 skizzierten Überlegungen nicht mehr überraschend. Zum Abschluss dieses Abschnitts wollen wir noch auf eine historisch bedeutsame Konsequenz von Carnots Überlegungen hinweisen, die zuerst von Kelvin bemerkt wurde: Für eine ideale Carnot-Maschine gilt für das Verhältnis der von der Maschine aus dem Wärmereservoir 1 aufgenommenen, beziehungsweise ins Wärmereservoir 2 abgegebenen Energiebeträge T ΔS1 T ΔE1 = 1 =− 1 , ΔE2 T2 ΔS2 T2
(4.4)
weil wegen der Reversibilität einer idealen Maschine ΔS1 = −ΔS2 sein muss. Wählt man die Temperatur T1 als Bezugstemperatur für die absolute Temperaturskala und gibt ihr gemäß unseren Überlegungen in Abschnitt 2.3 einen beliebigen Zahlenwert, so ist ΔE2 T2 = −T1 · (4.5) ΔE1
die absolute Temperatur des Wärmereservoirs 2. Diese Überlegung zeigt, dass der Nullpunkt der Temperatur nicht frei wählbar ist, sondern absolut festgelegt sein muss. Wie wir im nächsten Abschnitt sehen werden, ist dieses Verfahren zur experimentellen Bestimmung der absoluten Temperatur des Wärmereservoirs 2 leider nicht geeignet, weil alle real existierenden Maschinen mehr oder weniger irreversibel arbeiten und daher ΔS1 = −ΔS2 ist. Erst in Abschnitt 5.3 haben wir genügend Hintergrundwissen, um ein praktikables Verfahren zur experimentellen Bestimmung der absoluten Temperatur anzugeben.
4.3 Unvollkommene Maschinen – Irreversibilität |
127
4.3 Unvollkommene Maschinen – Irreversibilität Bisher haben wir angenommen, dass unsere Maschine reversibel arbeitet, sodass IS1 = −IS2 . Die meisten realen Prozesse sind jedoch mit der Erzeugung von Entropie verbunden. Solche Prozesse nennt man irreversibel, das heißt nicht (vollständig) umkehrbar. In der Praxis ist es fast unmöglich, die Erzeugung von Entropie zu vermeiden, da alle Reibungsphänomene Entropie erzeugen. Nur eine idealisierte Maschine ohne Reibungsverluste hat nach der Theorie den Wirkungsgrad ηCarnot . Verluste spiegeln sich in der Entropiebilanz durch einen Erzeugungsterm wider: IS1 + IS2 = ΣS
(4.6)
Die mit der Rate ΣS zusätzlich erzeugte Entropie muss ebenfalls in das Wärmereservoir 2 abgeführt werden und erhöht den Energiestrom IE2 in dieses Reservoir auf Kosten des Nutz-Energiestroms IE3 ! Diese Energie fehlt damit im Nutzenergiespeicher – sie ist vergeudet. Die Energiebilanz lautet entsprechend: IE1 + IE2 + IE3 = T1 IS1 − T2 (IS1 + ΣS ) + IE3 = 0 .
(4.7)
Die vergeudete Leistung T2 ΣS ist der bei Maschinen meist unerwünschte „Reibungsverlust“. Es gibt aber auch Fälle, in denen Reibungsverluste benutzt werden, um Energie kontrolliert und einfach abzuleiten, zum Beispiel bei allen Arten von Bremsen, mit denen die kinetische Energie von Fahrzeugen abgeführt wird. Im Extremfall einer stehenden Maschine wird gar keine Nutzleistung extrahiert. In diesem Fall liegt der in Abschnitt 2.9 behandelte spontane Temperaturausgleich durch Wärmeleitung vor, und es muss T2 ΣS = (T1 − T2 )IS1 sein, um die Energieerhaltung zu gewährleisten. Im Gegensatz zum spontanen Temperaturausgleich durch Wärmeleitung ist der Temperaturausgleich durch eine ideale Wärmekraftmaschine umkehrbar. Lässt man eine Wärmekraftmaschine rückwärts laufen, so erhält man eine Wärmepumpe. Diese „pumpt“ Entropie von einem Wärmereservoir auf niedriger Temperatur unter Energiezufuhr in ein Wärmereservoir auf hoher Temperatur und kann so zur Erzeugung von Temperaturdifferenzen ausgenutzt werden. Dies wird zum Beispiel in Kühlschränken und Klimaanlagen angewendet.
4.4 Unzerlegbare Systeme Die meisten der in den Abschnitten 1.4 und 2.3 aufgeführten Systeme sind in dem Sinn einfach, dass sie nur einen einzigen Freiheitsgrad haben. Wie das Beispiel des mechanischen und elektrischen Oszillators zeigt, können einfache Systeme zu komplexeren zusammengesetzt werden. Die Massieu-Gibbs-Funktion des zusammengesetzten
128 | 4 Maschinen Systems ist dann einfach die Summe der Massieu-Gibbs-Funktionen der Einzelsysteme. Wenn die Variablen der Teilsysteme unabhängig voneinander vorgegeben werden können, zerfällt die Massieu-Gibbs-Funktion des Gesamtsystems in variablenfremde Summanden. Dann müssen die Zustandsgleichungen des einen Teilsystems von den Variablen der anderen Teilsysteme unabhängig sein. Diese Bedingung liefert ein Kriterium für die Zerlegbarkeit eines thermodynamischen Systems in unabhängige Teilsysteme. Dass eine solche Systemzerlegung nicht immer möglich ist, zeigt das im letzten Kapitel intensiv besprochene ideale Gas. Das allgemein als thermische Zustandsgleichung bekannte Gasgesetz Gl. 3.3 ist nicht nur eine thermische, sondern gleichzeitig auch eine mechanische und eine chemische Zustandsgleichung, welche die thermische Größe T mit den mechanischen Größen p und V sowie mit der chemischen Größe N verknüpft. Das bedeutet, dass das ideale Gas nicht in ein thermisches, in ein mechanisches und in ein chemisches Teilsystem zerlegt werden kann. In diesem Abschnitt wollen wir zeigen, dass es genau die Eigenschaft der Unzerlegbarkeit ist, die ein physikalisches System als Arbeitssystem für eine Maschine geeignet macht. Ein weiteres Beispiel ist der bereits aus Kapitel 1 bekannte Plattenkondensator mit variablem Plattenabstand. Dieses System hat einen mechanischen und einen elektrischen Freiheitsgrad, aber seine Massieu-Gibbs-Funktion (Gl. 1.22) lässt sich ebenfalls nicht in Summanden zerlegen, die ausschließlich elektrische beziehungsweise ausschließlich mechanische Größen enthalten – damit ist das System auch nicht in ein elektrisches und ein mechanisches Teilsystem zerlegbar. Dies äußert sich darin, dass die Zustandsgleichungen (Gln. 1.25, 1.26) des Systems jeweils beide unabhängigen Variablen enthalten. Formal lässt sich dies dadurch ausdrücken, dass die Ableitung einer Zustandsgleichung nach der jeweils anderen Variablen nicht verschwindet: −Ex =
∂U (Q, x) ∂ 2 E(Q, x) ∂ 2 E(Q, x) ∂F (Q, x) Q = ≡ =− = , ∂x ∂x∂Q ∂Q∂x ∂Q 0 A
(4.8)
wobei Ex die x-Komponente der elektrischen Feldstärke ist. Die Identität der gemischten partiellen Ableitungen von E(Q, x) ist stets gegeben, wenn E(Q, x) stetig differenzierbar ist (Satz von Schwarz). Relationen dieses Typs sind für beliebige unabhängige Variablen als Maxwell-Relationen bekannt – in Abschnitt 5.2 werden wir diese allgemeiner besprechen. Gleichung 4.8 sagt aus, wie stark die Anziehungskraft zwischen den Kondensatorplatten beim Laden des Kondensators zunimmt, beziehungsweise wie stark die Spannung über dem Kondensator bei einer Erhöhung des Plattenabstandes zunimmt. Die Eigenschaft der Unzerlegbarkeit ist entscheidend für die Möglichkeit, ein System als Arbeitsmedium für eine Maschine (in diesen Fall das elektrostatische Feld als Arbeitsmedium für eine „Elektro-Kraft“-Maschine, das heißt als elektrostatischen Motor) zu nutzen. Wir wollen uns ein weiteres System ansehen, bei dem die Eigenschaft der Unzerlegbarkeit näherungsweise, aber nicht perfekt realisiert ist: Ein geeignet geformtes Stück Metall lässt sich sowohl als Beispiel für das System „Elastische Feder“ als auch
4.4 Unzerlegbare Systeme | 129
Stahldraht
Thermoelement
5 kg
Abb. 4.2. Versuchsanordnung zum schnellen Strecken eines Stacheldrahts (nach [3], S.69). Die Temperatur in der Mitte des Drahtes wird mit einem Thermoelement gemessen und als Funktion der Zeit aufgezeichnet. Der Draht wird „schnell“, das heißt, ohne dass Entropie aus der Umgebung nachfließen kann, belastet und dadurch gestreckt. Die Entropiedichte im Draht nimmt dabei ab, weil sein Volumen zunimmt. Dies äußert sich in einem Absinken der Temperatur. Nach einigen Sekunden wird der Draht wieder entlastet, sodass er wieder seine Ruhlänge und die Ausgangstemperatur annimmt. Die Gesamtentropie des Drahtes bleibt konstant, solange Wärmeleitungsprozesse vernachlässigt werden können.
als Repräsentant des Systems „Heißer Körper“ ansehen. Die Massieu-Gibbs-Funktion dieses Systems kann ebenfalls nicht einfach als Summe der durch die Gln. 1.1 und 2.14 gegebenen Massieu-Gibbs-Funktionen dargestellt werden. Der Grund dafür ist der Effekt der linearen thermischen Ausdehnung, welche die mechanischen und thermischen Eigenschaften (relativ schwach) miteinander koppelt4 und die wir daher bereits für die Thermometrie ausgenutzt haben. Da der Effekt recht klein ist, betrachtet man am besten einen langen dünnen Draht mit der Ruhlänge L und dem Querschnitt A. Die Folge ist, dass eine Längenänderung Δx nicht nur von der Kraft F abhängt, mit der die Feder mit der Außenwelt wechselwirkt, sondern auch von der Temperatur. Zusammen mit dem Hooke’schen Gesetz (Gl. 1.14) erhalten wir für die thermische Zustandsgleichung des Drahtes in linearer Näherung: Δx(ΔT, F ) = β L · ΔT − K−1 F ,
(4.9)
wobei der lineare Längenausdehnungs-Koeffizient β in Gl. 2.3 definiert wurde. Dabei haben wir eine mögliche Temperaturabhängigkeit der Federkonstanten K vernachlässigt. Die thermoelastische Kopplung kann mittels der in Abb. 4.2 skizzierten Anordnung auch als Temperaturänderung ΔT bei einer plötzlichen elastischen Verformung des Drahtes sichtbar gemacht werden. Die Längenänderung wird durch eine plötzli-
4 Eine Erklärung der thermischen Ausdehnung von Festkörpern auf der Basis eines mikroskopischen Modells können wir erst in Abschnitt 13.2.3 vorstellen – sie wird interessanterweise stark durch Abweichungen vom Hooke’schen Gesetz, das heißt durch die Nichtlinearität der Feder bestimmt.
130 | 4 Maschinen che Belastung mit der Kraft −F0 erreicht. Das Volumen des Drahtes nimmt dabei zu, während die im Draht enthaltene Entropie bei der Verformung konstant bleibt, sofern die Zeit für die Verformung klein gegen die thermische Relaxationszeit (Abschnitt 2.9) ist. Um die erwartete Temperaturänderung abzuschätzen, benötigen wir den Differenzialquotienten ∂T (S, F )/∂F : ΔT =
∂T (S, F ) ∂T (S, F ) ∂S(T, F ) F0 = − F0 ∂F ∂S ∂F
=
∂S(T, F ) ∂T
−1
∂x(T, F ) T x0 β F0 T β F0 = , F0 = ∂T V m˜ cF Am˜ cF
wobei c˜F = (T /M )∂S(T, F )/∂T die spezifische Wärmekapazität des Drahtes (bei konstanter Kraft) und m seine Massendichte sind. In dieser Herleitung wurden die Maxwell-Relation5 −∂S(T, F )/∂F = ∂x(T, F )/∂T und die Differentiationsregel Gl. A.3 verwendet. Mit den Zahlenwerten von β und c˜F für Stahl und L = 1 m ergibt eine plötzliche Belastung von F0 /A = −0.5 · 109 N/m2 (entsprechend etwa der halben Zerreißfestigkeit) eine Abkühlung von ca. −0.4 K. Dies stimmt in der Tat mit den in Abb. 4.2 gezeigten Messdaten überein. Wegen des kleinen Wertes der thermischen Ausdehnung in Festkörpern ist die thermoelastische Kopplung in Festkörpern nur selten von praktischer Bedeutung.6 Polymere, beispielsweise in einem Gummiband, sind Materialien, bei denen die thermoelastische Kopplung wesentlich stärker als bei Metallen ist. Polymere bestehen aus langen Ketten von Molekülen, welche als Freiheitsgrade nicht nur die Schwingungen der Atome innerhalb der Moleküle, sondern auch die Konfiguration der Kette selbst besitzen. Während es für eine maximal gestreckte Kette nur eine einzige, nämlich die lineare Konfiguration mit der Länge Lmax gibt, so existieren für Abstände LK < Lmax der Endpunkte der Kette um so mehr Konfigurationen Ω(LK ) pro Kette, je kleiner LK ist. Die in der statistischen Thermodynamik postulierte Proportionalität zwischen der Entropie pro Kette S(LK ) und ln Ω(LK ) vorwegnehmend,7 können wir jetzt schon sagen, dass kleine Werte von LK eine höhere Entropie zur Folge haben. Wird die Zahl der möglichen Konfigurationen durch ein plötzliches Strecken des Gummibands reduziert, muss die dabei abzugebende Entropie auf die Schwingungsfreiheitsgrade der Kette übergehen und sich in einer Temperaturerhöhung niederschlagen. Das Verhalten eines Gummibands bei Streckung ist dem eines Stahldrahts also
5 Hier nehmen wir ein Ergebnis aus Abschnitt 5.2 vorweg. 6 Eine Ausnahme stellt die thermische Ausdehnung von Eisenbahnschienen dar. Bei Erwärmung um 20 ◦C–30 ◦C im Sommer kann der thermische Spannungskoeffizient ∂F (T, x)/∂T so große Werte erreichen, dass die Schienen aus ihrer Verankerung gerissen werden und sich schlangenlinienförmig verkrümmen. Um dies zu vermeiden, wurden früher Lücken zwischen den Schienen gelassen, um eine thermische Ausdehnung ohne Spannungsaufbau zu erlauben. 7 Die thermoelastischen Eigenschaften von Polymeren werden in Abschnitt 11.3 in mehr Detail besprochen.
4.4 Unzerlegbare Systeme | 131
T1
T2
IE
T1
T2
WKM IS
A
IE
WKM IE
Ip
B : isotherme Expansion
T1 IE
B T2
Ip
C : isentrope Expansion
T1
T2
WKM
WKM IS
IE
C
IE
Ip
D : isotherme Kompression
D
Ip
A : isentrope Kompression
Abb. 4.3. Energie-, Entropie- und Impulsaustausch zwischen den zwei Wärmereservoiren (rot und blau), dem Arbeitsmedium einer Carnot-Maschine (WKM) und einem Reservoir für Nutzarbeit (grau) bei den vier verschiedenen Schritten des Carnot’schen Kreisprozesses. Die Werte der verschiedenen physikalischen Größen im Verlauf der einzelnen Prozessschritte ist in den Zustandsdiagrammen in Abb. 4.4 und 4.5 dargestellt.
genau entgegengesetzt – wir erwarten, dass sich ein Gummiband bei Erwärmung zusammenzieht, sein thermischer Ausdehnungskoeffizient β also negativ ist. Diese Phänomene lassen sich experimentell leicht beobachten. Die beobachtete Zunahme der Kraft ist allein auf die Entropiezunahme durch Erwärmung bei konstanter Länge des Gummibands zurückzuführen. Dies stellt ein Beispiel für „entropische Kräfte“ dar, wie sie in der Biologie eine große Rolle spielen. Die obigen Beispiele illustrieren, wie die Eigenschaft der Unzerlegbarkeit dazu führt, dass die Zustandsgleichungen nicht nur von einer, sondern von zwei oder mehr Variablen bestimmt werden. Dies lässt sich in Kreisprozessen8 ausnutzen, um Energie aus einem Reservoir eines Typs (zum Beispiel einem Wärmereservoir) zum Teil in ein Reservoir anderen Typs (zum Beispiel eine Batterie) zu überführen oder zur Gewinnung von Arbeit mittels einer Maschine nutzbar zu machen. Da solche Kreisprozesse einen Eckpfeiler des traditionellen Zugangs zur Thermodynamik darstellen, wollen wir im nächsten Abschnitt den Zusammenhang zwischen unserer, sich allein auf Zustandsgrößen stützenden, Terminologie und der traditionellen Darstellungsweise herstellen, bei der die Prozessgrößen „Wärme“ und „Arbeit“ eine größere Rolle spielen.
8 Damit ist gemeint, dass sich das Arbeitsmedium der Maschine nach Durchlaufen eines Umlaufs der Maschine wieder im Anfangszustand befindet.
132 | 4 Maschinen
4.5 Wärme und Arbeit – der Carnot’sche Kreisprozess Zur Illustration seiner Ideen hat Carnot eine Wärmekraftmaschine vorgeschlagen, welche ein ideales Gas als Arbeitssystem benutzt und Entropie reversibel zwischen zwei Wärmereservoiren transferiert, deren Temperaturen T1 und T2 konstant gehalten werden. Der Prozess besteht aus zwei isothermen und zwei isentropen Schritten zwischen den Zuständen A, B, C und D. Die Energie- und Entropie- und Impulsströme der einzelnen Prozessschritte sind in Abb. 4.3 dargestellt. Die Gibbs’sche Fundamentalform (Gl. 1.34) beschreibt die Änderungen der Energie eines thermoelastischen Systems, beispielsweise eines Gases, und nimmt für alle mit dem System bei konstanten Werten von N durchgeführten Prozesse die Form dE = T (S, V ) dS − p(S, V ) dV .
(4.10)
an. Betrachten wir einen Prozess γ , das heißt eine Folge von Zuständen zwischen einem Anfangszustand {SA , VA } und einem Endzustand {SC , VC } in der {S, V }-Ebene (Abb. 4.4). Die einzelnen Terme auf der rechten Seite der Gibbs’schen Fundamentalform beschreiben die beiden verschiedenen Kanäle, über die dem System Energie zugeführt werden kann. Wir beschränken uns auf reversible Prozesse, bei denen keine Entropie erzeugt wird. In diesem Fall sind sowohl die Energie als auch die Entropie erhalten und die während des Prozesses zugeführte Energie und Entropie müssen aus einem Wärmereservoir stammen. Es ist üblich, den Energiebetrag Qrev = T (S, V ) dS (4.11) γ
die dem System aus einem reversibel Reservoir zugeführte Wärme zu nennen. Entsprechend wird der Energiebetrag Wrev = − p(S, V )dV (4.12) γ
die von dem System an einem anderen Energiereservoir reversibel verrichtete Arbeit genannt.9 Gleichungen 4.11 und 4.12 repräsentieren das Prinzip der Energie-Erhaltung – die über den thermischen und den mechanischen Kanal zugeführten Energiemengen müssen am Ende des Prozesses im System enthalten sein.
9 Der Zusatz „reversibel“ weist bereits darauf hin, dass den Gln. 4.11 und 4.12 eine Idealisierung zugrunde liegt. In aller Regel erfolgt die Wärmezufuhr aus einem Reservoir irreversibel, da eine Temperaturdifferenz erforderlich ist, um einen Wärmestrom vom Reservoir in das Arbeitssystem hinein und wieder heraus zu treiben. Ebenso setzt die Reversibilität der Arbeitsleistung voraus, dass der Kolben reibungsfrei gleitet. Ist dies nicht der Fall, so ist die am Kolben geleistete Arbeit Wirr = − F dx größer als die vom Gas aufgenommene Arbeit Wrev = − pdV . Die Differenz Wirr − Wrev = T ΔSirr entspricht dem durch Reibung vergeudeten Energiebetrag. Die für die Verschiebung des Kolbens erforderliche Kraft FKolben ist höher als der zur Kompression des Gases erforderliche Wert FGas = pA (A ist
4.5 Wärme und Arbeit – der Carnot’sche Kreisprozess
|
133
C
V Weg γ1 D
B Weg γ 2 A S
Abb. 4.4. Die Prozesse γ1 = ADC und γ2 = ABC in der V SEbene. Bei festem N entspricht jeder Punkt in der V S-Ebene einem Zustand des Gases. Die beiden Prozesse weisen jeweils einen isothermen (T = const., AB, CD, in schwarz) und einen isentropen (S = const.,, BC, DA, in rot) Prozessschritt auf. Die Verkettung von γ1 und −γ2 = CBA resultiert in einem Kreisprozess.
Die naheliegende Schlussfolgerung, dass die Wärmemenge Qrev beziehungsweise die Arbeit Wrev am Ende des Prozesses im System enthalten sind, ist jedoch falsch! Nur die Summe ΔE = Qrev + Wrev , nämlich die dem System insgesamt zugeführte Energiemenge, ist nach dem Prozess im System enthalten. Das liegt daran, dass Qrev und Wrev nicht allein durch den Anfangs- und Endzustand des Prozesses festgelegt sind, sondern auch vom Verlauf des Prozesses in der S, V Ebene abhängen. Um uns dies klar zu machen, betrachten wir sogenannte Kreisprozesse: Kehren wir den Ablauf von Prozess γ2 um, so bildet die Verkettung der Prozesse γ1 und −γ2 einen Kreisprozess, der vom Zustand A über B nach C und über Zustand D wieder zurück nach A führt. Dies ist für ein Gas in Abb. 4.4 illustriert. Das Charakteristikum eines Kreisprozesses ist, dass er wieder zum Anfangszustand zurückführt. Daher sind die Werte aller physikalischer Größen nach einem Umlauf wieder dieselben. Wärme und Arbeit sind dagegen keine physikalischen Größen in diesem Sinne:
Hängt T nicht nur von S , sondern auch von V ab, so unterscheidet sich die zugeführte Wärme für die Prozesse γ1 und γ2 . Hängt p nicht nur von V , sondern auch von S ab, so unterscheidet sich auch die während der Prozesse γ1 und γ2 zu verrichtende Arbeit.10
die Querschnittsfläche des Kolbens), weil aufgrund der Reibungskraft Freib = FKolben − pA neben dem Gas auch die Kolbenwand einen Teil der mechanischen Spannung aufnimmt. Erfolgt die Verschiebung hinreichend langsam, sind die irreversiblen Beiträge vernachlässigbar und Gln. 4.11 und 4.12 stellen eine gute Näherung dar. Deshalb wird in der traditionellen Darstellungsweise der Thermodynamik stets gefordert, dass Zustandsänderungen „quasistatisch“, das heißt unendlich langsam, zu erfolgen haben. 10 Man beachte den semantischen Unterschied zwischen diesen beiden Aussagen: Man spricht von der zugeführten Wärme, aber von der zu verrichtenden Arbeit. In der zweiten Aussage wird deutlicher, dass die Arbeit keine physikalische Größe ist, die man zuführen kann. Weniger missverständlich wäre es, statt von Wärme und Arbeit in den beiden Fällen von der zu verrichtenden thermischen und mechanischen Arbeit zu sprechen.
Isentropen (Adiabaten)
(a)
A
Isentropen (Adiabaten) Temperatur
Druck
134 | 4 Maschinen
(b)
A
B
D
C
B D
Isothermen
C
Isothermen Volumen
Entropie
Abb. 4.5. Isothermen und Isentropen eines Carnot’schen Kreisprozesses zwischen den Zuständen A, B, C und D a) im pV und b) im T S-Diagramm. Die von dem Prozess umlaufenen Flächen geben die pro Umlauf gewonnene Arbeit und die aufgenommene Wärme an.
Dies ist genau die Eigenschaft der Unzerlegbarkeit (Abschnitt 4.4). Diese Eigenschaft ist für die Funktion der Maschine zentral: Das Gas ist elastisches Medium, dessen Kompressibilität (analog zur Härte einer Feder) durch die Temperatur eingestellt werden kann. Wenn die Temperatur T1 des Gases beim Prozessschritt AB höher als beim Prozessschritt CD ist, so ist der Druck und damit die im Prozessschritt AB gewonnene Arbeit größer als die zur Kompression des Gases bei der niedrigeren Temperatur T2 zuzuführende Arbeit. Wir wollen die geometrische Bedeutung von Q und W für unser Beispiel im T S und im pV -Diagramm (Abb. 4.5) darstellen. Man beachte, dass ein Punkt in der pV Ebene zusammen mit dem festen Wert von N und den Zustandsgleichungen p(T, V, N ) und S(T, V, N ) einen Zustand des Systems definiert, sodass auch die thermischen Variablen T und S festgelegt sind. Umgekehrt legt ein Punkt in der T S -Ebene zusammen mit dem Wert von N über die Zustandsgleichungen auch die Werte der mechanischen Variablen p und V fest. In jedem der Prozessschritte AB, BC, CD und DA ändert sich die Energie des Systems über den mechanischen Kanal, während Wärme nur während der beiden isothermen Schritte zu- beziehungsweise abgeführt wird. Da der Adiabatenexponent γ > 1 ist, laufen die Isentropen im pV -Diagramm steiler als die Isothermen. Damit kann ein Kreisprozess zwischen den Zuständen A, B, C und D konstruiert werden, bei dem während eines Zyklus aus einem Wärmereservoir mit der Temperatur T1 mehr Wärme zugeführt wird, als an ein zweites Reservoir mit der Temperatur T2 abgeführt wird. Die Differenz wird über den mechanischen Kanal von der Maschine abgegeben. Die Entropie und die Energie des Gases haben dabei nach Durchlaufen des Kreisprozesses wieder dieselben Werte! Die Fläche unter einem Stück der in diesen Diagrammen laufenden Wege γ repräsentiert gerade die während dieses Prozess-Abschnitts zugeführte Wärme beziehungs-
4.5 Wärme und Arbeit – der Carnot’sche Kreisprozess
|
135
weise der geleisteten Arbeit. Daher entspricht der Flächeninhalt der im pV -Diagramm bei einem vollständigen Umlauf umlaufenen Fläche gerade dem Betrag der während des Kreisprozesses gewonnenen Arbeit, während die im T S -Diagramm umlaufene Fläche gerade der aufgenommenen Wärme entspricht.11 In üblicher Sprechweise bewirkt ein System, welches einen derartigen Kreisprozess durchläuft, eine „Umwandlung“ von Wärme in Arbeit und stellt daher eine Wärmekraftmaschine dar.12 Als Arbeitssystem kommt im Allgemeinen jedes physikalische System in Betracht, dessen Energie über zwei verschiedene Kanäle geändert werden kann und das im Sinne von Abschnitt 4.4 unzerlegbar ist. Das ideale Gas und die in den Kapiteln 5 und 10 vorgestellten magnetischen Systeme sind Prototypen unzerlegbarer Systeme. Die Wärme Q und die Arbeit W werden auch „Prozessgrößen“ genannt, weil sie eine Aussage über den Energieaustausch des Systems mit seiner Umgebung, aber nicht über den Zustand des Systems machen. Sie hängen von der genauen Führung des Prozesses ab, der vom Anfangs- zum Endzustand des Prozesses führte. Daher ist mit den Prozessgrößen schwerer zu operieren als mit den bisher betrachteten Größen des Systems, die auch als Zustands-Größen bezeichnet werden. Im folgenden werden wir wo immer möglich die Zustandsgrößen benutzen. Kombinieren wir die durch die Gleichungen 4.11 und 4.12 ausgedrückte Erhaltung der Energie mit der Gibbs’schen Fundamentalform, so erhalten wir ΔE = Qrev + Wrev .
(4.13)
Diese Gleichung stellt die traditionelle Formulierung des ersten Hauptsatzes der Thermodynamik dar. Sie besagt, dass die Energieänderung ΔE des Arbeitssystems durch die Summe der der von außen zugeführten Wärme und der vom System geleisteten Arbeit gegeben ist. Natürlich ist für die Gültigkeit dieser Gleichung erforderliche reversible Prozessführung in der Praxis nicht gegeben. Daher wird die für eine Änderung der Energie des Arbeitssystems um den Betrag ΔE aufzuwendende oder abzuführende Energiemenge Q + W stets von ΔE verschieden sein. Ursprünglich hat Clausius die Entropie über die reversibel zugeführte Wärme Qrev definiert (Abschnitt 4.8): ΔS ≥
Qrev . T
(4.14)
11 Im Gegensatz dazu hat die im SV -Diagramm umlaufene Fläche keine physikalische Bedeutung. 12 Wir betonen noch einmal, dass die Unterscheidung verschiedener „Formen“ von Energie problematisch ist, weil aus der für die „Umwandlung“ erforderlichen (!) Unzerlegbarkeit des Systems folgt, dass sich seine Energie gerade nicht in einen thermischen und einen mechanischen Anteil zerlegen lässt. Die Vorstellung von der „Umwandlung von einer Energieform in eine andere“ stellt für den Lernenden eine Quelle der Verwirrung dar, weil sie die verschiedenen Realisierungen des Austausches von Energie mit historischen Beinamen befrachtet, welche keine eigenständigen physikalischen Größen repräsentieren, aber mit zweckmäßigeren Begriffen (wie der Entropie und dem chemischen Potenzial) konkurrieren.
136 | 4 Maschinen Diese Beziehung stellt die ursprüngliche Formulierung des 2. Hauptsatzes der Thermodynamik dar. Bei irreversibler Prozessführung gilt das > Zeichen in Gl. 4.14. Das bedeutet, dass Qrev für eine allgemeine Definition der Entropie nicht brauchbar ist.13 In vielen Büchern wird die Gibbs’sche Fundamentalform dE = T dS − p dV
durch die Kombination der differenziellen Formen der Gln. 4.12, 4.13 und 4.14 abgeleitet. Obwohl dies der historischen Entwicklung entspricht, wird das Pferd damit von hinten aufgezäumt: Die Gibbs’sche Fundamentalform ist von den Hauptsätzen logisch unabhängig! Sie enthält nämlich ausschließlich Größen des betrachteten Arbeitssystems und ist Folge unserer Grundannahme (Abschnitt 1.6), dass sich die Energie E des Arbeitssystems als Funktion von S, V (und N ) schreiben lässt. Die Erhaltung der Energie kann sich nicht in Relationen widerspiegeln, die ein einzelnes System betreffen, sondern sie macht nur Aussagen über die Energiebilanz bei Transport von Energie zwischen verschiedenen Systemen. Außerdem ist die Gibbs’sche Fundamentalform nicht nur für reversible, sondern für alle Prozesse des Arbeitssystems gültig, weil sie keine Information darüber enthält, welche Zusatzbedingungen bei der Änderung der Variablen erfüllt werden müssen. Sie macht keinerlei Unterschied zwischen erhaltenen und nicht erhaltenen Größen. Ein Prozess, das heißt, die genaue Variation der Werte der physikalischen Größe als Funktion der Zeit, ist unabhängig davon, auf welche Weise dieser Prozess realisiert wird. Wie der Vergleich der in Abschnitt 3.8 dargestellten Gay-Lussac- und der isothermen Expansion zeigt, kann derselbe Prozess, das heißt dieselbe zeitliche Abfolge von Zuständen, sowohl irreversibel als auch reversibel realisiert werden: Einmal wird die für das größere Volumen des Endzustands benötigte Entropie erzeugt und einmal aus der Umgebung nachgeführt. Die beiden Realisierungen des Expansionsprozesses unterscheiden sich nicht im Endzustand des Gases, sondern ausschließlich im Wert der Entropie seiner Umgebung.
4.6 Thermische Maschinen Zur Realisierung einer Wärmekraft-Maschine sind im Prinzip alle Systeme als Arbeitssysteme geeignet, bei denen γ > 1, das heißt Cp > Cv ist. Dies sind alle die Systeme, die das Phänomen der thermischen Ausdehnung zeigen, das heißt bei denen mechanische und thermische Freiheitsgrade gekoppelt sind. Bei reversibler Prozess-
13 Aus diesem Grunde werden zur Beschreibung der Entropiebilanzen irreversibler Prozesse in manchen Büchern „reversible Ersatzprozesse“ bemüht, bei denen die Entropie von außen zugeführt wird, statt intern erzeugt zu werden. Derart künstliche Konstruktionen werden vermieden, wenn umgekehrt die reversibel zugeführte Wärme über Qrev = T ΔSausgetauscht definiert wird.
4.6 Thermische Maschinen | 137
realisierung (Vermeidung von Entropieerzeugung) ist der Wirkungsgrad der bereits in Abschnitt 4.2 diskutierte Carnot-Wirkungsgrad ηCarnot =
T1 − T 2 . T1
Wie die dortigen Betrachtungen gezeigt haben, ist ηCarnot gänzlich unabhängig von der Natur des Arbeitssystems. Es kommt allein darauf an, dass das Arbeitssystem einen von Null verschiedenen thermischen Ausdehungskoeffizienten aufweist. Die technische Realisierung ist umso leichter, je größer der Adiabatenexponent γ und damit der Unterschied zwischen Cp und Cv ist. Wegen der Kleinheit des thermischen Ausdehnungskoeffizienten von Festkörpern und Flüssigkeiten kommen in praxi nur Gase als Arbeitsmedien in Frage. Der von Carnot zur Illustration seiner Ideen erdachte Kreisprozess ist in einer realen Maschine nicht zu realisieren, weil der Wechsel zwischen den isothermen und isentropen Prozessschritten in Abb. 4.5 einen effizienten Wärmeschalter erfordert, der zwischen einem möglichst hohen und einem möglichst niedrigen Wärmeleitwert hinund herschalten sollte. Ein solcher Schalter wurde bei Raumtemperatur oder bei noch höheren Temperaturen bisher nicht realisiert. Um zu einer effizienten Maschine zu kommen, gibt es zwei alternative Wege, die beide den verlustreichen und langsamen Transport von Energie und Entropie durch Wärmeleitung vermeiden, indem diese zusammen mit dem Arbeitsgas konvektiv durch die Maschine transportiert werden: •
Verbrennungsmotoren: Bei diesen erfolgt die Entropiezufuhr durch schnelle Verbrennung eines Gasgemisches im Kolben und die Entropieabfuhr mit dem Abgas durch einen Auspuff.
•
Dampfmaschine und Stirling-Motor: Durch die Verschiebung des Arbeitsgases von einem permanent geheizten in einen permanent gekühlten Teil der Maschine wird die Wärmeleitung auf die im Gas selbst beschränkt und ein Wärmeschalter überflüssig.
Verbrennungsmotoren, wie der Otto- oder der Dieselmotor, haben den Vorteil, dass sie sehr hohe Umdrehungszahlen und damit auch hohe Leistungen erlauben, weil keiner der Prozessschritte einen (langsamen) Wärmeleitungsvorgang beinhaltet. Diese Motoren können leicht und kompakt gebaut werden. Außerdem haben die üblichen, bisher in der Regel auf Erdöl basierenden Brennstoffe eine sehr hohe Energiedichte. Die daraus resultierenden mobilen Motoren prägen seit einem Jahrhundert unsere technische Zivilisation. Der Ottomotor arbeitet mit einem (theoretischen) Temperaturgefälle von 1300 ◦C auf etwa 100 ◦C und erreicht einen praktischen Wirkungsgrad von 35 %–38 %, was etwa der Hälfte des mit dieser Temperaturdifferenz theoretisch erreichbaren Wirkungsgrads entspricht. In der Praxis wird das Gas nach der Zündung durch den thermischen Kontakt mit Zylinder und Kolben sehr schnell abgekühlt, so-
138 | 4 Maschinen dass die effektive Eingangstemperatur deutlich niedriger ist. Der Dieselmotor erreicht eine ähnliche Effizienz. Dampfmaschinen haben den Vorteil, dass sie mit einer kontinuierlichen Heizbeziehungsweise Kühlleistung arbeiten und ebenfalls hohe Leistungen erzeugen. Sie sind aber größer und schwerer als die Verbrennungsmotoren gleicher Leistung und spielen für den mobilen Einsatz daher keine Rolle mehr. Im stationären Einsatz in Kraftwerken werden heute keine Kolbenmaschinen, sondern nur noch Turbinen eingesetzt, weil diese einen höheren Wirkungsgrad haben und damit eine bessere Ausnutzung des Brennstoffs erlauben. Je höher der Durchsatz und je höher die Temperaturdifferenz, um so besser der Wirkungsgrad. Ein optimaler Wirkungsgrad lässt sich durch eine Kombination von Gas- und Dampfturbinen erreichen: Heißes Gas mit einer Eingangstemperatur von typisch 1400 ◦C treibt eine Gasturbine mit einer Ausgangstemperatur von etwa 550 ◦C; diese Turbine erreicht η 35 %, während der Carnot-Wirkungsgrad 51 % beträgt. Das heiße Abgas dient als Energiequelle für eine Dampfturbine, die zwischen 500 ◦C und 25 ◦C operiert und in der Realität etwa 45 % erzielt (bei einem Carnot-Wirkungsgrad von etwa 61 %). Der Gesamtwirkungsgrad der Anlage beträgt dann etwa 64 %, wobei der Carnot-Wirkungsgrad für eine zwischen 1400 ◦C und 25 ◦C arbeitende Anlage 82 % beträgt.
4.7 Der Stirling-Motor Als weiteres Beispiel wollen wir den Stirling-Motor etwas genauer besprechen. Dieser Motor arbeitet im Gegensatz zu den Motoren mit interner Verbrennung mit einer kontinuierlichen Heizung und Gegenkühlung und hat den Vorteil, dass er bereits bei relativ geringen Temperaturdifferenzen läuft. Als Energiequelle kommen deshalb nicht nur Verbrennungsprozesse, sondern insbesondere auch Solarenergie in Betracht. Damit ist er insbesondere in heißen Ländern zur dezentralen Stromversorgung geeignet. Das Funktionsprinzip des Stirling-Motors ist in Abb. 4.6 dargestellt. Er arbeitet mit zwei beweglichen Kolben, einem Arbeitskolben und einem Verdrängerkolben, die mit einem um 90° versetzten Phasenwinkel operieren. Während der Arbeitskolben die vom Gas geleistete Arbeit an ein Schwungrad (als mechanischen Zwischenspeicher) und an den mechanischen Verbraucher abgibt, dient der Verdrängerkolben dazu, das Gas abwechselnd zur heißen beziehungsweise zur kalten Seite des Motors zu verschieben, um so abwechselnd den thermischen Kontakt mit dem heißen und dem kalten Wärmereservoir herzustellen. Das Volumen des Gases ändert sich bei der Verschiebung des Arbeitskolbens näherungsweise isotherm, während sich seine Temperatur bei der Verschiebung des Verdrängerkolbens näherungsweise isochor (V = const.) ändert. In Abb. 4.7 sind die auftretenden Paare von isothermen und isochoren Prozessschritten im pV - und im T S -Diagramm dargestellt.
4.7 Der Stirling-Motor
| 139
geheizte Wand: T1 Verdrängerkolben Wärmespeicher kalte Wand: T2
isotherme Expansion
A
B
isochore Abkühlung
B
C
isotherme Kompression
C
D
isochore Erwärmung
D
A
Abb. 4.6. Die vier Prozessschritte des Stirling-Motors. AB: Isotherme Expansion bei hoher Temperatur T1 und entsprechend hoher Arbeitsleistung, BC: Isochore Abkühlung ohne Arbeitsleistung und Zwischenspeicherung von Energie und Entropie im Regenerator. CD: Isotherme Kompression bei niedriger Temperatur T2 und geringer Energieaufnahme aus dem Schwungrad. DA: Isochore Erwärmung durch Aufnahme von Energie und Entropie aus dem Regenerator (nach [7]).
Die Effizienz des Motor wird dadurch wesentlich gesteigert, dass das nach dem Arbeitstakt (der Teilprozess, in den der größte Teil der Nutzarbeit vom Gas abgegeben wird) noch immer relativ warme Gas bei der Verschiebung auf die kalte Seite Energie und Entropie an einen thermischen Zwischenspeicher, den Regenerator, abgibt und dadurch weiter abkühlt. Auf diese Weise entspannt sich das Gas noch weiter und kann in dem nachfolgenden Kompressionstakt durch den Arbeitskolben mit geringerem Energieaufwand wieder komprimiert werden. Wenn das Gas anschließend durch den Verdrängerkolben wieder durch den Regenerator geleitet wird, nimmt es die dort zwischengespeicherte Energie und Entropie wieder auf. Dadurch erhöht sich der Arbeitsdruck, und die Temperaturdifferenz zum heißen Reservoir verringert sich. Der Regenerator erlaubt eine höhere Temperaturdifferenz zwischen dem Arbeits- und dem Kompressionstakt und erhöht somit den Wirkungsgrad. Der Stirling-Motor lässt sich im Gegensatz zu den oben besprochenen Wärmekraftmaschinen auch als Wärmepumpe benutzen, wenn er durch einen anderen Motor angetrieben wird. Das liegt daran, dass er im Gegensatz zu den Verbrennungsmotoren keinen notwendig irreversiblen Schritt (wie die interne Verbrennung des Kraftstoffs) benutzt.
140 | 4 Maschinen (b) Temperatur
Isochoren
Druck
(a)
A
Isochoren Isothermen
B
A
B
D C
Isothermen
D
Volumen
C
Entropie
Abb. 4.7. Isothermen und Isochoren eines Stirling-Prozesses zwischen den Zuständen A, B, C und D a) im p − V und b) im T S-Diagramm. Die von dem Prozess umlaufenen Flächen geben die pro Umlauf gewonnene Arbeit und die aufgenommene Wärme an.
Die zur Konstruktion des Motors erforderliche Optimierung besteht darin, dass die Prozessparameter so gewählt werden, dass die nach der Kompression und Verschiebung des Arbeitsgases auf die heiße Seite bestehende Temperaturdifferenz ΔT zum heißen Wärmereservoir einerseits groß genug ist, um während des Arbeitstakts genügend Energie durch Wärmeleitung in das Gas zu übertragen, dass andererseits die damit verbundenen Verluste durch den irreversiblen Temperaturausgleich (die mit ΔT 2 ansteigen) nicht zu groß werden.
4.8 Der historische Weg zur Entropie Nach der Entdeckung der allgemeinen Erhaltung der Energie wurde der erste Hauptsatz zunächst in der Form dE = δQrev + δWrev
(für N = const.)
(4.15)
formuliert. Der Zusammenhang des Arbeits„differenzials“ δWrev mit den Zustandsgrößen p und V war bereits bekannt: δWrev = −p dV . Dagegen ließ sich das Wärme„differenzial“ δQrev nicht in analoger Weise auf bekannte Zustandsgrößen zurückführen. Löst man den ersten Hauptsatz nach δQrev auf, so erhält man: δQrev = dE + p dV .
Für ideale Gase gilt dE = Cv dT , da E unabhängig von V ist. Damit bekommen wir für δQrev :
N kB T dV V An dieser Gleichung lässt sich direkt sehen, dass δQrev nicht das Differenzial einer Funktion Qrev (T, V ) sein kann, denn δQrev erfüllt nicht die für die Existenz einer δQrev = dE + p dV = Cv dT +
4.8 Der historische Weg zur Entropie |
141
Stammfunktion notwendige Integrabilitätsbedingung ∂f (x, y) ∂f (x, y) = , ∂y∂x ∂x∂y
da
∂Cv (T ) = 0 ∂V
=
(4.16)
∂p(T, V ) N kB = . ∂T V
Man sagt: δQrev ist kein exaktes Differenzial. Dies hat zur Folge, dass keine Funktion Qrev (T, V, N ) existiert, die wir als Wärme im Sinne einer üblichen physikalischen Größe bezeichnen können. Aus diesem Grunde spricht man stets von zwischen Systemen ausgetauschten Wärmemengen und nicht von der in einem System enthaltenen Wärmemenge – obwohl die Existenz der letzteren durch den Zusatz „Menge“ stark suggeriert wird. Clausius entdeckte, dass der Faktor 1/T für reversible Prozesse einen integrierenden Faktor des Wärmedifferenzials bildet. Daher postulierte er die Existenz einer neuen physikalischen Größe, S , welche er Entropie nannte. Deren Differenzial dS hängt direkt mit δQrev zusammen: δQrev Cv N kB (4.17) = dT + dV . T T V Das Differenzial dS ist exakt und besitzt im Gegensatz zu δQrev eine Stammfunktion S(T, V ), weil
Cv (T ) ∂ ∂ N kB = = 0 ∂V T ∂T V dS :=
der Integrabilitätsbedingung Gl. 4.16 genügt. Damit haben wir die Clausius’sche Definition der Entropie S über die reversibel ausgetauschte Wärme δQrev reproduziert. Die Nachteile dieser Definition haben wir in Abschnitt 4.5 diskutiert. Die historische Entwicklung, die zur Unterscheidung von Entropie und Energie führte, ist ähnlich komplex wie jene, die in der Mechanik zur Unterscheidung von Energie und Impuls führte. Aus heutiger Sicht erschwert sie in überflüssiger Weise das Verständnis der Thermodynamik und ist eher von historischem Interesse.
Übungsaufgaben 4.1. Reversibler Temperaturausgleich Eine Wärmekraftmaschine arbeitet reversibel zwischen zwei Wärmereservoiren mit gleicher Wärmekapazität und den Anfangstemperaturen T1 und T2 . Im Laufe der Zeit gleichen sich die Temperaturen an.
142 | 4 Maschinen
a) Bei welcher Temperatur kommen die Reservoire ins Gleichgewicht? b) Wieviel Energie wird bei dem Ausgleichsprozess durch die Maschine abgeführt? 4.2. Kraftwerk Landshut Ein Kraftwerk an der Isar erzeugt heißen Wasserdampf bei einer Temperatur von 600◦ C. Die Kombination von Dampfturbine und Generator produziert 1 GW elektrische Energie mit einem Wirkungsgrad ηReal von 40% des Carnot-Wirkungsgrades ηCarnot . Am Turbinenausgang hat der Dampf noch eine Temperatur von 150◦ C. Die Entropie des Dampfes wird über einen Wärmetauscher in die Isar abgeführt; das Wasser des Flusses habe dabei eine Ausgangstemperatur von 18◦ C und eine Fließgeschwindigkeit von 1.8 m/s. a) Wie groß ist die Flussrate der Isar, wenn wir eine Breite von 40 m und eine Durchschnittstiefe von 3.5 m annehmen? b) Um welchen Betrag erhöht sich die Temperatur des Isarwassers beim Passieren des Kernkraftwerks? c) Wie groß ist der Entropiestrom am Turbinenausgang und am Ausgang des Wärmetauschers? 4.3. Satz von Stokes in der Ebene
y
Betrachten Sie eine geschlossene Kurve C , die aus zwei orientierten Teilkurven C1 , C2 zusammengesetzt ist (Abbildung rechts); hierbei sei C1 der Graph der Funktion y1 = y1 (x) und entsprechend C2 der Graph der Funktion y2 = y2 (x). Wir wollen die von der Kurve C eingeschlossene Fläche A berechnen und zeigen, dass
C1 A C2
z
xa
xb x
' A=
y(x)dx , C
wobei yj (j = 1, 2) dem jeweiligen Kurvenstück zuzuordnen ist. xb yj (x)dx (j = 1, 2) ,
a) Überlegen Sie anhand der Integrale xa
dass die obige Formel gilt. b) Zeigen Sie nun, dass die Formel für die Fläche A auch als Spezialfall des Satzes von Stokes erhalten werden kann, indem über die von der Kurve C berandete Fläche in der x-y-Ebene integriert wird. Dabei ist das zu integrierende Vektorfeld so zu wählen, dass seine Rotation eine Projektion der Länge 1 in z -Richtung hat.
4.8 Der historische Weg zur Entropie |
143
c) Als Beispiel wollen wir einen Halbkreis (in der oberen Halbebene) vom Radius R = 1 mit dem Mittelpunkt im Ursprung betrachten. Berechnen Sie die Fläche des Halbkreises nach beiden angegebenen Methoden.
4.4. Dieselmotor p
Die Arbeitsweise eines Dieselmotors lässt 2 3 sich näherungsweise durch einen reversiblen a Ví Kreisprozess zwischen den Zuständen 1-4 wie 4 im nebenstehenden pV -Diagramm beschreiben. Der Prozess besteht aus vier Schritten: 1 • Von 1 nach 2 erfolgt eine isentrope (bei S = V const.) Kompression der eingesaugten Luft. • Von 2 nach 3 wird der Kraftstoff eingespritzt und isobar (bei p = const.) verbrannt. Dabei soll die Änderung der Stoffmenge durch Kraftstoffzufuhr vernachlässigbar werden. • Nach Ende der Verbrennung erfolgt eine isentrope Expansion von 3 nach 4. • Von 4 nach 1 erfolgt der Ausstoß des Abgases und das Ansaugen frischer Luft. Dies entspricht einer isochoren (bei V = const.) Abkühlung. Als Arbeitssubstanz lege man 0.2 mol eines zweiatomigen idealen Gases zugrunde. a) Berechnen Sie ausgehend vom Zustand 1 für die Zustände 1 bis 4 den Wert von Temperatur T und Volumen V in Abhängigkeit vom Druck p1 , der Temperatur T1 , dem Kompressionsverhältnis k und der bei der Verbrennung autretende Temperaturerhöhung ΔT = T3 − T2 . Hinweis: noch keine Zahlenwerte einsetzen. b) Stellen Sie den Prozess qualitativ in einem S −T -Diagramm dar. Wie kann man aus einem solchen Diagramm die geleistete Arbeit entnehmen? Berechnen Sie aus den folgenden Betriebsdaten jeweils Temperatur T , Volumen V und Druck p für die Zustände 1 bis 4: p1 = 1 bar, T1 = 288 K, k = 15 und ΔT = 1300 K. c) Berechnen Sie für diese Daten die pro Umlauf abgegebene Arbeit W und den Wirkungsgrad η = W/ΔE des Motors. Hierbei ist ΔE = Cp · ΔT die über den thermischen Kanal (d.h. durch die Verbrennung des Kraftstoffs) zugeführte Energie. Vergleichen Sie η mit dem Wirkungsgrad ηCarnot = (TA − T1 )/TA einer zwischen den Temperaturen TA = (T2 + T3 )/2 und T1 arbeitenden CarnotMaschine.
5 Thermodynamische Potenziale Anhand der besprochenen Beispiele haben wir dargestellt, wie die Thermodynamik mit physikalischen Größen operiert, um aus wenigen empirischen Beobachtungen oder einfachen Modellen Aussagen über die Zustandsgleichungen eines Systems zu gewinnen. Mit Hilfe der Zustandsgleichungen und der Gibbs’schen Fundamentalform lassen sich alle möglichen Zustandsänderungen des Systems beschreiben. Die erstmals von Massieu formulierte Idee der thermodynamischen Potenziale besteht darin, die in den Zustandsgleichungen enthaltene Information in einer einzigen Funktion zusammenzufassen, welche ein System für einen gegebenen Satz von unabhängigen Variablen vollständig charakterisiert. In diesem Kapitel wollen wir folgende Fragen untersuchen: • Wie kann das Konzept der System-charakterisierenden Funktion auf beliebige Variablensätze verallgemeinert werden und wie sehen diese für das ideale Gas und andere Systeme konkret aus? • Welche Abhängigkeiten bestehen zwischen den Zustandsgleichungen und wieviele Zustandsgleichungen sind überhaupt erforderlich, um ein System mit r Freiheitsgraden zu beschreiben? Woher bekommen wir die Zustandsgleichung μ = μ(T, V, N )? Die Antwort auf diese Fragen ist das Ergebnis der 200-jährigen Arbeit vieler Forschergenerationen, die schließlich in einer grundlegenden Arbeit von Gibbs in die hier dargestellte Form gebracht wurde. Die ein System charakterisierenden Funktionen werden daher Massieu-Gibbs-Funktionen oder – in Anlehnung an die Potenziale der Mechanik und Elektrodynamik – Thermodynamische Potenziale genannt. Es wird sich zeigen, dass der Anwendungsbereich und die Schlagkraft des in der modernen Physik ohnehin schon unentbehrlichen Potenzialbegriffs auf diese Weise noch einmal wesentlich erweitert wird.
5.1 Weitere Massieu-Gibbs-Funktionen In diesem Abschnitt wollen wir zeigen, wie das Konzept der Massieu-Gibbs-Funktion und der Gibbs’schen Fundamentalform auf einen beliebigen Satz von unabhängigen Variablen verallgemeinert werden kann. Wir werden sehen, dass zu jedem Variablensatz eine andere Massieu-Gibbs-Funktion gehört. Weil all diese Funktionen dasselbe physikalische System beschreiben, müssen sie physikalisch äquivalent sein, das heißt, alle äquivalente Zustandsgleichungen liefern. Wie wir es von der Energie E(S, V, N ) bereits kennen, erfüllen alle Massieu-Gibbs-Funktionen eines Systems eine Doppelfunktion:
5.1 Weitere Massieu-Gibbs-Funktionen
• •
|
145
Zum einen beschreiben sie die Energieänderungen des Systems bei Austauschprozessen mit anderen Systemen. Zum anderen liefern sie durch Differenzieren die Zustandsgleichungen des Systems.
5.1.1 Die freie Energie Dies wollen wir anhand der in Abschnitt 5.5 besprochenen Arbeitsleistung W eines idealen Gases einmal bei isentroper und einmal bei isothermer Expansion illustrieren. Im isentropen Fall gibt das Gas über den Kolben den Energiebetrag W ab, während es ansonsten energetisch isoliert ist: V2 Wrev =
p(S, V, N ) dV = −ΔEGas . V1
Daher nehmen die im Gas gespeicherte Energie sowie der Druck und die Temperatur des Gases dabei ab. Im isothermen Fall gibt das Gas über den Kolben ebenfalls Energie ab, seine Temperatur wird aber gleichzeitig durch die Ankopplung an ein Wärmereservoir konstant gehalten. Wenn Reibungsprozesse vernachlässigbar sind, der Prozess also reversibel durchgeführt wird, so nimmt das Gas den Entropiebetrag ΔS und den Energiebetrag T ΔS aus dem Wärmereservoir auf.1 Da die in einem idealen Gas gespeicherte Energie bei einer isothermen Expansion konstant bleibt, wird die zusätzlich aus dem Wärmereservoir aufgenommene Energie über den Kolben wieder abgeführt. Die Energiebilanz des Gases lautet dann: V2 ΔEGas = T ΔS −
p(T, V, N ) dV = 0 , V1
da bei idealen Gasen E(T, V, N ) von V unabhängig ist. Interessieren wir uns nur für den mechanischen Beitrag, das heißt für den aus dem Gas über den Kolben abgeführten Energiebetrag, so erhalten wir: V2 Wrev = −
p(T, V, N ) dV = ΔEGas − T ΔS = ΔFGas .
V1
1 In diesem Fall brauchen wir nicht über S zu integrieren, da T voraussetzungsgemäß konstant ist. Wird bei dem Prozess durch Reibung der Entropiebetrag ΔSirr erzeugt, so verringert sich die Aufnahme von Entropie und Energie aus dem Wärmereservoir um ΔSirr beziehungsweise um T ΔSirr . Die vom Gas geleistete Arbeit reduziert sich dann ebenfalls um T ΔSirr , bis im Extremfall der vollständig irreversiblen Gay-Lussac-Expansion keine Arbeit mehr geleistet wird.
146 | 5 Thermodynamische Potenziale Dabei haben wir die neue Größe F := E − T S
freie Energie
(5.1)
eingeführt, die als Kombination von Zustandsgrößen selbst eine Zustandsgröße ist. Wir stellen fest, dass wir die vom Kolben reversibel geleistete Arbeit Wrev (die selbst keine Zustandsgröße ist) bei konstanten T und N durch die neue Zustandsgröße F ausdrücken können. Weil F die Arbeitsfähigkeit des Gases, das heißt die unter diesen Bedingungen über den mechanischen Kanal nutzbare Energie bezeichnet, nennt man F die freie Energie. Bei reversiblen Prozessen ist die abgegebene Energiemenge unabhängig vom zeitlichen Ablauf des Prozesses – das Ergebnis hängt nur vom Anfangsund vom Endzustand ab.2 Dies ist analog der Verschiebung eines Körpers in einem konservativen Kraftfeld, bei dem die Energieänderung ebenfalls nur von dem Anfangsund dem Endpunkt des Prozesses, nicht aber von dem gewählten Weg abhängt. Obwohl die Funktion F (T, V, N ) allein für das ideale Gas und nicht für die mit dem Gas verbundenen Reservoire charakteristisch ist, beschreibt sie Prozesse, welche den Austausch von Energie mit einem Wärme- und einem Arbeitsreservoir einschließen, ohne dass letztere in der Beschreibung explizit auftauchen. Um die zweite Bedeutung der freien Energie, nämlich ihre Äquivalenz zu den Zustandsgleichungen des betrachteten Systems zu illustrieren, betrachten wir das Differenzial von F (T, V, N ): dF = dE − d(T · S) = dE − (T dS + S dT ) = T dS − p dV + μ dN − T dS − S dT
und erhalten: dF = −S dT − p dV + μ dN .
Offenbar liefert das Differenzieren von F (T, V, N ) die zum Variablensatz {T, V, N } gehörigen Zustandsgleichungen: ∂F (T, V, N ) = −S(T, V, N ) ∂T ∂F (T, V, N ) = −p(T, V, N ) ∂V ∂F (T, V, N ) = μ(T, V, N ). ∂N
(5.2) (5.3) (5.4)
Die entscheidende Eigenschaft der Massieu-Gibbs-Funktionen ist es, durch Differenzieren nach einer Variablen die dazu thermodynamisch konjugierte Variable zu lie-
2 Wenn bei der Realisierung des Prozesses Reibungsverluste auftreten, ist die abgegebene Energiemenge natürlich kleiner.
5.1 Weitere Massieu-Gibbs-Funktionen
|
147
fern! Auf diese Weise werden die r Zustandsgleichungen eines Systems mit r Freiheitsgraden in einem thermodynamischen Potenzial zusammengefasst, genau wie in der Mechanik und in der Elektrostatik die drei Kraft- beziehungsweise Feldkomponenten in einem skalaren Potenzial zusammengefasst werden. Will man von der Variablen S zur Variablen T übergehen, genügt es nicht, die Zustandsgleichung T (S, V, N ) = ∂E(S, V, N )/∂S nach S aufzulösen, in E(S, V, N ) einzusetzen und die Funktion E(T, V, N ) als Massieu-Gibbs-Funktion anzusehen. Wie das Beispiel des idealen Gases zeigt (Gl. 3.10), ist ∂E(T, V, N )/∂V ≡ 0! Das liegt daran, dass E(T, V, N ) keine Massieu-Gibbs-Funktion, sondern die thermische Zustandsgleichung des Systems ist. E(T, V, N ) enthält keine Information über den Druck beziehungsweise die Kompressibilität des Systems. Die Information über den Druck ist in der thermischen Zustandsgleichung p(T, V, N ) enthalten. Diese Information geht aber beim einfachen Substitution von S durch T in E(S, V, N ) verloren. Die partielle Ableitung von E(T, V, N ) nach T nach Gl. 3.18 liefert nicht die Entropie, sondern die Wärmekapazität Cv (T, N )! Bei Differentiation von F (T, V, N ) nach V ergibt sich aus Gl. 5.1 und Gl. 5.3 dagegen ∂F (T, V, N ) ∂E(T, V, N ) ∂S(T, V, N ) = −T = −p(T, V, N ) . ∂V ∂V ∂V
(5.5)
Beim idealen Gas ist der Energie-Term identisch null, weil die Wechselwirkungskräfte zwischen den Gas-Molekülen vernachlässigbar sind. Daher ist der Druck des Gases ausschließlich auf die Volumenabhängigkeit der Entropie zurückzuführen. Man spricht in diesem Zusammenhang auch von entropischen Kräften. Bei Polymeren ist dies ähnlich (Abschnitt 11.3), nur dass ∂S(T, V, N )/∂V im Gegensatz zum Gas nicht positiv, sondern negativ ist. Bei Flüssigkeiten und Festkörpern dominieren die in E(T, V, N ) enthaltenen elastischen Wechselwirkungen zwischen den Atomen und Molekülen über den Entropieterm, und die entropischen Effekte bewirken nur eine kleine Änderung der elastischen Eigenschaften. Entscheidend ist beim Variablenwechsel, nicht nur eine Variable in der MassieuGibbs-Funktion, sondern ein konjugiertes Paar ξ dX in der Gibbs’schen Fundamentalform gegen den Term −X dξ auszutauschen. Dies wird erreicht, indem man das Produkt ξX von der Ausgangs-Massieu-Gibbs-Funktion abzieht. Dieses, LegendreTransformation3 genannte, Verfahren zum Austausch der unabhängigen Variablen lässt sich auf einzelne oder auch auf mehrere Terme in der Gibbs’schen Fundamentalform anwenden.
3 Der mathematische Hintergrund der Legendre-Transformation wird in Anhang D erklärt.
148 | 5 Thermodynamische Potenziale 5.1.2 Die Enthalpie Analog zur isothermen Expansion können wir die in Abschnitt 3.6 besprochene isobare Erwärmung von Gasen mit einer weiteren Massieu-Gibbs-Funktion in Verbindung bringen. Um ein Gas bei konstantem Druck zu erwärmen, muss es an ein Volumenreservoir angekoppelt werden, welches die beim Erwärmen auftretende thermische Ausdehnung des Gases unter Konstanthaltung des Drucks auffangen kann (Abb. 3.5). Die zur thermischen Expansion des Gases gegen den Druck des Reservoirs erforderliche Energie Wrev wird dem Gas dabei entzogen: S2 T dS − pΔV .
ΔEGas = S1
Die zur Erwärmung des Gases aus dem Wärmereservoir zuzuführende Energiemenge beträgt daher S2 Qrev =
T dS = ΔEGas + pΔV = ΔH , S1
wobei die neue Größe H := E + pV
Enthalpie
(5.6)
eine weitere Massieu-Gibbs-Funktion des idealen Gases in den Variablen {S, p, N } darstellt. Bei konstanten p und N lässt sich also auch die zu- oder abgeführte „Wärme“ Qrev = T dS durch die Änderung der Zustandsgröße H ausdrücken. Damit hängt das Ergebnis wiederum nur von dem Anfangs- und dem Endzustand ab. Um die mit der Enthalpie verknüpften Zustandsgleichungen zu gewinnen, betrachten wir das Differenzial von H dH = dE + (p dV + V dp)
dH = T dS + V dp + μ dN .
Wenn wir die Funktion H(S, p, N ) nach S , p und N differenzieren, erhalten wir also die Zustandsgleichungen T (S, p, N ), V (S, p, N ) und μ(S, p, N ). H(T, p, N ) ist genau wie E(T, V, N ) keine Massieu-Gibbs-Funktion, sondern eine kalorische Zustandsgleichung, die bei Differentiation nach T die Wärmekapazität Cp (T, p, N ) bei konstantem Druck liefert. Dies ist leicht einzusehen, wenn wir uns die
5.1 Weitere Massieu-Gibbs-Funktionen
|
149
Herleitung von Cp nach Gl. 3.19 in Abschnitt 3.6 vergegenwärtigen: Cp dT = T dS(T, p, N ) = dE(T, p, N ) + p dV (T, p, N )
=
∂E(T, p, N ) ∂V (T, p, N ) +p ∂T ∂T
=
∂[E(T, p, N ) + p V (T, p, N )] dT ∂T
=
∂H(T, p, N ) dT ∂T
dT
und damit Cp,N (T, p, N ) = T
∂S(T, p, N ) ∂H(T, p, N ) = . ∂T ∂T
(5.7)
Bei Prozessen mit konstantem p und N , aber variablem T entsprechen die Änderungen der Enthalpie (und nicht der Energie!) der Wärmezufuhr Qrev : S2
Qrev =
T2
T (S, p, N )dS = S1
Cp (T, p, N ) dT T1
= H(T2 , p, N ) − H(T1 , p, N ) = ΔH .
Diese Aussage ist unabhängig von der Wahl der unabhängigen Variablen und gilt damit auch für H(T, p, N ). Wie oben und in Abschnitt 3.6 bereits erklärt, liegt dies an dem aufgrund der thermischen Ausdehnung bei p = const. unvermeidbaren Energieaustausch über den mechanischen Kanal.
5.1.3 Die freie Enthalpie Werden Prozesse betrachtet, bei denen sowohl die Temperatur als auch der Druck durch Ankopplung an Reservoire konstant gehalten werden, bleibt nur noch die Teilchenzahl als Variable. Änderungen der Teilchenzahl treten bei Phasenübergängen, wie dem Schmelzen von Eis oder dem Verdampfen von Wasser, Transportprozessen sowie chemischen Reaktionen auf. In diesem Fall müssen wir in der Gibbs’schen Fundamentalform sowohl −p dV durch V dp als auch T dS durch −S dT ersetzen. Damit erhalten wir für die zum Variablensatz {T, p, N } gehörige Massieu-GibbsFunktion: G := E − T S + pV
freie Enthalpie.
Dies führt auf dG = dE − (T dS − S dT ) + (p dV + V dp)
(5.8)
150 | 5 Thermodynamische Potenziale und dG = −S dT + V dp + μ dN .
Bei der Energieänderung durch die Zufuhr von Teilchen ist besonders stark auf die Bedingungen zu achten, unter denen diese erfolgt. In der Praxis werden dabei meistens nicht S und N , sondern T und p konstant gehalten. Gleichzeitig mit der Injektion von Teilchen muss dann auch Entropie abgeführt beziehungsweise das Volumen vergrößert werden. Das hat zur Folge, dass die Energiebilanz dieses Prozesses nicht allein durch das chemische Potenzial und die Änderung der Teilchenzahl, sondern auch durch Wärmezufuhr und Arbeitsleistung bestimmt wird.
5.1.4 Die Energie im externen Magnetfeld In Systemen mit magnetischen Dipolmomenten ist oft das von außen angelegte (intensive) Magnetfeld B ext = μ0 H ext die experimentell leichter kontrollierbare Variable. Daher ist es vorteilhaft, B ext anstatt des (extensiven) magnetischen Momentes m als unabhängige Variable zu wählen.4 Die zu dem Variablensatz {S, V, B ext , N } gehörige Massieu-Gibbs-Funktion lautet: U := E − B ext · m
Energie im externen Magnetfeld.
(5.9)
Für das Diffenzial von U erhalten wir: dU = T dS − p dV − m dB ext + μ dN .
(5.10)
4 Im einfachsten Fall einer räumlich homogenen Magnetisierung M , auf den wir uns hier beschränken werden, gilt einfach: m = V · M . Es ist streng zwischen dem von außen angelegten Magnetfeld B ext und dem innerhalb des magnetisierten Materials lokal herrschenden Magnetfeld B(r) = B ext + μ0 [HK (r) + M (r)] zu unterscheiden. Dabei ist μ0 HK (r) der durch den magnetischen Körper erzeugte Quellenanteil des Magnetfeldes, der zu dem in der Regel durch eine Magnetspule erzeugten Wirbelanteil B ext hinzutritt. Der Beitrag von μ0 HK (r) ist für Proben mit der Form von dünnen, langgestreckten Zylindern oder Ellipsoiden vernachlässigbar, wenn B ext parallel zur Längsachse angelegt wird. Bei anderer Geometrie, zum Beispiel bei kugelförmigen Proben, treten Entmagnetisierungseffekte auf. Diese äußern sich in einer effektiven Reduktion des von außen angelegten Feldes und werden in Anhang F beschrieben.
5.1 Weitere Massieu-Gibbs-Funktionen
| 151
Der Unterschied zwischen E und U besteht in der Wechselwirkungsenergie B ext 2
ΔEM = −
m(B ext ) · dB ext
(5.11)
B ext 1
zwischen dem magnetischen Moment und dem externen Magnetfeld, die in U mitgezählt wird, in E aber nicht. Wird das externe Magnetfeld in einer Spule erzeugt und von einer geregelten Stromquelle konstant gehalten, so bewirkt das Einbringen eines magnetisierbaren Körpers in die Spule eine magnetische Flussänderung und damit eine Induktionsspannung. Die Induktionsspannung transferiert Energie in die Stromquelle, wenn sich das magnetische Moment parallel zum Magnetfeld der Spule ausrichtet, wie dies bei Paramagneten und homogen magnetisierten Ferromagneten ohne magnetische Anisotropie der Fall ist. Bei Diamagneten ist die Ausrichtung von m und B ext anti-parallel, und in diesem Fall muss die Stromquelle die Energiemenge ΔEM in das System „Spule + Magnetischer Körper“ einbringen. Der Unterschied zwischen E und U beschreibt also analog zu den vorangegangenen Beispielen den Gewinn oder Verlust an Energie, die dem magnetischen Körper über den magnetischen Kanal zuoder abgeführt wird. Änderungen von U bei konstanten {T, V, Bext , N } entsprechen der reversibel zugeführten Wärme Qrev = T ΔS . Deshalb wird U auch als magnetische Enthalpie bezeichnet. Die Funktion U (T, V, B ext , N ) ist genau wie E(T, V, N ) und H(T, p, N ) keine Massieu-Gibbs-Funktion, sondern eine kalorische Zustandsgleichung und liefert beim Differenzieren nach T die Wärmekapazität CB (T, V, B ext , N ): CB dT = T dS(T, V, B ext , N ) = dE(T, V, B ext , N ) − Bext dm(T, V, B ext , N )
=
∂m(T, V, B ext , N ) ∂E(T, V, B ext , N ) − B ext ∂T ∂T
=
∂[E(T, V, B ext , N ) − B ext m(T, V, B ext , N )] dT ∂T
=
∂U (T, V, B ext , N ) dT . ∂T
dT
Damit ist CB (T, V, B ext , N ) = T ·
∂S(T, V, B ext , N ) ∂T
∂U (T, V, B ext , N ) = ∂T
die Wärmekapazität bei konstanten {V, Bext , N }.
(5.12)
152 | 5 Thermodynamische Potenziale 5.1.5 Die freie Energie im externen Magnetfeld Entsprechend lautet die zum Variablensatz {T, V, B ext , N } gehörige Massieu-GibbsFunktion: F := F − B ext · m
freie Energie im externen Magnetfeld.
(5.13)
Für das Diffenzial von F erhalten wir: dF = −S dT − p dV − m dB ext + μ dN .
(5.14)
Auf analoge Weise kann auch eine freie Enthalpie im Magnetfeld G := F +pV definiert werden, falls der Druck anstelle von V experimentell kontrolliert wird. Bei Festkörpern ist dies fast immer der Fall, weil die mit der thermischen Ausdehnung und der Magnetostriktion (das heißt der Deformation bei Magnetisierungsänderungen) verbundenen mechanischen Kräfte meist sehr groß sind. Im Vakuum ist allerdings p = 0 und daher F = G . In der Literatur werden E und U , F und F sowie G und G oft nicht namentlich unterschieden.5 In diesem Fall hat man sich stets an den verwendeten unabhängigen Variablen zu orientieren. Abschließend wollen wir noch einmal betonen, dass in jeder Variante der Gibbs’schen Fundamentalform die Faktoren vor den Differenzialen stets die partiellen Ableitungen der Massieu-Gibbs-Funktionen sind, das heißt sie entsprechen den Zustandsgleichungen. Wenn man weiß, welche Massieu-Gibbs-Funktion zu welchem Variablensatz gehört, kennt man auch das zugehörige Differenzial.6 Die LegendreTransformationen erlauben, den für das jeweilige Problem optimalen Variablensatz auszusuchen und es auf dem kürzesten Weg zu lösen. Der Formalismus wird natürlich erst dann zum Leben erweckt, wenn man die Zustandsgleichungen beziehungsweise Massieu-Gibbs-Funktionen konkreter Systeme vorliegen hat.
5.2 Maxwell-Relationen Die Tatsache, dass die Ableitung einer Massieu-Gibbs-Funktion nach einer Variablen die dazu thermodynamisch konjugierte Variable liefert, impliziert die Existenz von Beziehungen zwischen den Zustandsgleichungen. Der aus der Analysis bekannte Satz von
5 Nachahmenswerte Ausnahmen bilden beispielsweise die (von einem gänzlich anderen Standpunkt geschriebenen) Lehrbücher von F. Schwabl und M. Kardar [9; 10]. 6 Dazu muss man nur mit den Vorzeichen etwas Buch halten. Der Verfasser hält es für sinnvoller, sich das entsprechende Differenzial bei Bedarf kurz abzuleiten, als eines der diversen auf dem Markt befindlichen Merkschemata für die thermodynamischen Potenziale und deren Differenziale auswendig zu lernen...
5.2 Maxwell-Relationen
| 153
Schwarz sagt aus, dass für eine stetig differenzierbare Funktion f (x1 , . . . , xr ) gilt: ∂2f ∂2f = . ∂xi ∂xj ∂xj ∂xi
Dies entspricht einer Integrabilitätsbedingung für die r Zustandsgleichungen ∂f /∂x1 , . . . , ∂f /∂xr . Falls die Massieu-Gibbs-Funktionen stetig differenzierbar sind, gilt also: Für jedes Paar unabhängiger Variablen sind die gemischten zweiten Ableitungen der Massieu-Gibbs-Funktionen gleich – die daraus resultierenden Identitäten nennt man die Maxwell-Relationen. Für ein System mit r Freiheitsgraden gibt es 2r Kombinationen der extensiven und intensiven Variablen. Für r = 3 bedeutet dies, dass für jede der 8 Massieu-GibbsFunktionen nur 3 der 6 gemischten zweiten Ableitungen unabhängig sind. Den Nutzen der Maxwell-Relationen wollen wir durch einige Beispiele illustrieren: 1.
Wie hängt S bei konstantem T und N von p ab? Die zum Variablensatz {T, p, N } gehörige Massieu-Gibbs-Funktion ist die freie Enthalpie G(T, p, N ). Daher entspricht ∂S(T, p, N ) ∂ 2 G(T, p, N ) ∂ 2 G(T, p, N ) ∂V (T, p, N ) =− =− =− ∂p ∂p∂T ∂T ∂p ∂T
(5.15)
der thermischen Ausdehnung. Als praktische Anwendung dieser Relation wollen wir Gl. 3.24 in Abschnitt 3.6 beweisen: Aus Gl. A.2 erhalten wir ∂S(T, V, N ) ∂S(T, p, N ) ∂S(T, p, N ) ∂p(T, V, N ) = + · . ∂V ∂T ∂p ∂T
Wegen Gl. A.3 gilt für den zweiten Faktor im zweiten Term außerdem ∂p(T, V, N ) ∂p(T, V, N ) ∂V (T, p, N ) =− · , ∂T ∂V ∂T
Aus den Gleichungen 5.15 und A.4 folgt daher, dass die Differenz der Wärmekapazitäten
2 ∂V (T, p, N ) 2 C p − Cv = T ·
∂S(T, p, N ) ∂S(T, V, N ) =− − ∂p ∂T
∂T ∂V (T, p, N ) ∂p
= T ·V ·
βp . κT
allgemein durch die thermische Ausdehnung bei konstantem Druck und die isotherme Kompressiblität ausgedrückt werden kann. Gemeinsam mit dem dritten Hauptsatz folgt daraus weiterhin, dass Cp − Cv bei Annäherung an den absoluten Nullpunkt für jedes System gegen Null gehen muss (Aufgabe 5.2).
154 | 5 Thermodynamische Potenziale 2.
Wie hängt die Energie bei konstantem T und N vom Volumen ab? Die für den Variablensatz {T, V, N } zuständige Massieu-Gibbs-Funktion ist freie Energie F (T, V, N ). Mit der Maxwell-Relation ∂S(T, V, N ) ∂ 2 F (T, V, N ) ∂ 2 F (T, V, N ) ∂p(T, V, N ) =− =− = ∂V ∂V ∂T ∂T ∂V ∂T
(5.16)
folgt: ∂E(T, V, N ) ∂S(T, V, N ) ∂ = (F + T S) = −p + T ∂V ∂V ∂V = −p + T
3.
∂p(T, V, N ) N kB = −p + T ≡0! ∂T V
Im letzten Schritt wurde das ideale Gasgesetz benutzt. Damit haben wir gezeigt, dass die Energie E(T, V, N ) eines idealen Gases von V unabhängig ist.7 Analog kann man zeigen, dass H(T, p, N ) für ein ideales Gas unabhängig von p ist. Im Abschnitt 9.5.2 werden wir sehen, wie die intermolekularen Wechselwirkungen dazu führen, ∂E(T, V, N )/∂V = 0 wird. Wie hängt die Temperatur des in Abschnitt 4.4 besprochenen thermisch isolierten Stahldrahts von seinem mechanischen Spannungszustand ab? Die zu den unabhängigen Variablen {S, F, N } gehörige Massieu-Gibbs-Funktion ist analog zur Enthalpie: H(S, F, N ) = E(S, F, N ) + F · x(S, F, N )
wobei das vollständige Differenzial von H durch dH = T dS + x dF + μdN
gegeben ist. Daher besteht die Maxwell-Relation ∂T (S, F , N ) ∂x(S, F , N ) ∂2H ∂2H = = = . ∂F ∂F ∂S ∂S∂F ∂S
Der Zusammenhang mit der thermischen Zustandsgleichung des Drahtes (Gl. 4.9) ist durch die Differenzialbeziehung Gl. A.3 gegeben: ∂x(T, F , N ) ∂x(S, F , N ) T ∂T · βL , =− = ∂S(T, F , N ) ∂S CF ∂T
wobei L die Ruhelänge des Drahtes ist.
7 Umgekehrt lässt sich aus der empirischen Feststellung ∂E(τG , V, N )/∂V = 0 und der MaxwellRelation 5.16 folgern, dass die empirische Gastemperatur τG = pV /N und die absolute Temperatur T = ∂E(S, V, N )/∂S proportional sein müssen (Aufgabe 5.3).
5.3 Die Messung der absoluten Temperatur
| 155
4. Wie hängt die Entropie bei konstantem T und p von der Teilchenzahl ab? Wiederum ist G(T, p, N ) die zuständige Massieu-Gibbs-Funktion:
∂ ∂S = ∂N ∂N
−
∂G ∂T
=−
∂ ∂T
∂G ∂N
=−
∂μ ∂T
Solange die Stoffmenge konstant gehalten wird, taucht das chemische Potenzial μ nicht explizit auf. Das ändert sich, wenn chemische Reaktionen betrachtet werden, bei denen sich bei konstanten T und p die Teilchenzahlen ändern (Diese Maxwell-Relation wird in Abschnitt 8.10 benutzt).
5.3 Die Messung der absoluten Temperatur Als erste Anwendung dieser abstrakten Konzepte wollen wir ein allgemein anwendbares Verfahren zur experimentellen Bestimmung der absoluten Temperatur besprechen. Dieses Verfahren muss von den spezifischen Eigenschaften des als Thermometer verwendeten Systems unabhängig sein. In unseren bisherigen Anmerkungen zur Messung der Temperatur in den Abschnitten 2.3 und 2.7 hatten wir als empirisches Maß für die Temperatur verschiedene Systeme mit temperaturabhängigen Messgrößen verwendet. Derartige Thermometer nennt man Sekundär-Thermometer, weil ihre Benutzung die Existenz einer Kalibrationstabelle τ (T ) erfordert, welche die Werte dieser Messgrößen mit der absoluten Temperatur verknüpft. Entsprechend der Wahl der als empirisches Temperaturmaß verwendeten Messgröße ist die Einheit der empirischen Temperatur zunächst willkürlich. Es können ganz verschiedene Messgrößen benutzt werden; wir müssen nur fordern, dass die Funktion τ (T ) eindeutig nach T auflösbar ist. In diesem Abschnitt wollen wir nun angeben, wie eine solche Tabelle erstellt werden kann. Als Messgrößen sind besonders die Suszeptibilitäten des System geeignet, weil diese meist empfindlich von der Temperatur abhängen. Für hohe Temperaturen liefert uns das ideale Gas ein besonders geeignetes System, weil dessen thermische Zustandsgleichung pV = N kB T
die Definition einer empirischen Temperatur, der Gastemperatur τ G = kB T =
pV N
nahe legt, die proportional zur absoluten Temperatur ist (Aufgabe 5.3). Von besonderer Bedeutung ist dabei, dass der Proportionalitätsfaktor kB zwischen T und τG universell ist und nicht von der chemischen Natur des verwendeten Gases abhängt. In der Praxis sind vor allem die Helium-Isotope 3He und 4He für Gasthermometer geeignet, weil bei diesen die Wechselwirkungen zwischen den Gasmolekülen von allen Gasen am schwächsten sind und der Zustandsbereich mit idealem Verhalten bei diesen die größten T - und p-Bereiche überdeckt.
156 | 5 Thermodynamische Potenziale Diese Universalität äußert sich auch darin, dass der inverse thermische Ausdehnungskoeffizient 1/β nicht nur zu T proportional, sondern sogar mit T identisch ist. So betrachtet, ist es ein besonderer Glücksfall, dass die Natur ein derart universelles Mustersystem für uns bereithält. Allerdings sollte die Konstruktion der Thermodynamik nicht davon abhängen, dass ein (im Rahmen des idealen Verhaltens) solches Mustersystem existiert. Es muss also eine Möglichkeit geben, die absolute Temperatur experimentell zu bestimmen, ohne idealisierende Annahmen über die Zustandsgleichungen zu machen. Eine andere Klasse von Systemen, die sich als Thermometer nutzen lassen, sind paramagnetische Festkörper. Bringt man diese in thermischen Kontakt mit einem Gasthermometer, so zeigt sich, dass bei Paramagneten die inverse magnetische Suszeptibilität bei hohen Temperaturen ebenfalls proportional zur absoluten Temperatur ist: V Bext 1 T τm = (5.17) = = , μ0 · m
χm (T )
A
wobei μ0 = 1.256 · 10−6 V s/(A m). Bei Paramagneten sind das externe Magnetfeld B ext und das magnetische Moment m stets parallel, sodass es genügt, deren Beträge Bext und m zu betrachten. Die magnetische Temperatur τm ist mit der absoluten Temperatur T über die Curie-Konstante A verknüpft, die im Gegensatz zu kB nicht universell ist, sondern von der chemischen Natur des Paramagneten abhängt.8 Daher erfordert die Temperaturmessung mit einem paramagnetischen Thermometer stets eine Bestimmung seiner Curie-Konstanten mit einem Gasthermometer. Magnetische Systeme, die dem Curie-Gesetz (Gl. 5.17) genügen, nennt man (in Analogie zu Gasen) ideale Paramagnete. Paramagnetische Festkörper sind für die Thermometrie von besonderem Wert, weil sie sich auch bei extrem tiefen Temperaturen vermessen lassen, bei denen Gase längst kondensiert sind. Es ist klar, dass sich nur solche Systeme als Thermometer verwenden lassen, die unzerlegbar sind, das heißt, bei denen der durch das Variablenpaar {T, S} quantifizierte thermische Freiheitsgrad mit einem anderen, durch das Variablenpaar {ξ, X} charakterisierten, Freiheitsgrad gekoppelt ist. Bei Gasen ist dies das Variablenpaar {−p, V }, bei den Paramagneten {Bext , m}. Die Unzerlegbarkeit des Systems bedeutet aber, dass es sich nicht nur als Thermometer, sondern auch als Arbeitssystem verwenden lässt, mit dem tiefe Temperaturen erzeugt werden können. Ein Thermometer ist daher immer auch eine Wärmekraftmaschine und umgekehrt! Die Frage ist nun, wie wir die absolute Temperatur des Systems bei Abkühlen bestimmen können, wenn die thermische Zustandsgleichung des verwendeten Gases oder Paramagneten bei hinreichend tiefen Temperaturen in unbekannter Weise von der des idealen Systems abweicht. Die einzige Möglichkeit, die sich hier bietet, ist di-
8 Paramagnetische Systeme werden im Detail in Anschnitt 10.5 besprochen.
5.3 Die Messung der absoluten Temperatur
| 157
rekt zur Definition der absoluten Temperatur ∂E(τ, X) ∂E(S, X) ∂τ T (S, X) = = ∂S(τ, X) ∂S ∂τ
(5.18)
zurückzugehen, wobei X für die anderen extensiven Variablen des Systems steht. Dabei müssen wir annehmen, dass unser Arbeitssystem/Thermometer so beschaffen ist, dass die gesuchte Funktion τ (T ) eindeutig ist.9 Wenn die zu X konjugierte Variable ξ leichter als X zu kontrollieren ist, so benutzen wir die äquivalente Definition ∂Ξ(τ, ξ) ∂Ξ(S, ξ) ∂τ T (S, ξ) = , = ∂S(τ, ξ) ∂S ∂τ
(5.19)
wobei Ξ(S, ξ) = E − ξX die entsprechende Legendre-Transformierte der Energie ist. Bei Gasen ist Ξ mit der Enthalpie H(S, p), bei Paramagneten mit der Energie im Magnetfeld U (S, Bext ) zu identifizieren. Im Folgenden wollen wir die Diskussion auf den (neben dem Gasthermometer) in der Praxis relevantesten Fall der magnetischen Systeme beschränken.10 Die Messung der absoluten Temperatur läuft also darauf hinaus, die Differenzialquotienten ∂U (τ, Bext )/∂τ und ∂S(τ, Bext )/∂τ separat zu bestimmen. Zuerst bestimmt man ∂U (τ, Bext )/∂τ , indem man mit Hilfe eines elektrischen Heizpulses in dem System eine gewisse Energiemenge ΔU dissipiert und die resultierende Änderung von τm über die Änderung des magnetischen Moments Δm misst. Eine Messung von Δm lässt sich beispielsweise dadurch realisieren, dass man die paramagnetische Probe in einer Spule platziert und die bei der Änderung des magnetischen Flusses Φ in der Spule auftretende Induktionsspannung Uind (t) = −Φ˙ über die Zeit integriert. Die Änderung von m bei der Erwärmung liefert nach Gl. 5.17 dann die entsprechende Erhöhung Δτm der empirischen Temperatur. Dieses Vorgehen entspricht einer Messung der Wärmekapazität C(τm , Bext ) = ∂U (τm , Bext )/∂τm ) als Funktion von τm . Zur Bestimmung des Differenzialquotienten ∂S(τm , Bext )/∂τm müssen wir ΔS und Δτm für hinreichend viele τm separat bestimmen. Zunächst verschaffen wir uns eine Wertetabelle der Funktion S(τ0 , Bext ) bei einer empirischen Temperatur τ0 , die hoch genug ist, um die zu τ0 gehörige absolute Temperatur T0 (zum Beispiel mit Hilfe eines Gasthermometers) bestimmen zu können. Für kleine Feldänderungen ist ∂S(T0 , Bext ) · (B2 − B1 ) . ΔS(B1 , B2 ) = ∂B (B2 +B1 )/2
9 Diese Bedingung wird verletzt, wenn das System beim Abkühlen einen Phasenübergang durchläuft (Kapitel 9). 10 In einer Arbeit von D. Bancroft, Am. J. Phys. 23, 142 (1952) ist ein Praktikums-Experiment zur kalorimetrischen Bestimmung der absoluten Temperatur mit Hilfe eines nicht notwendigerweise idealen Gases beschrieben, das auf eine Anregung von Fermi zurückgeht.
158 | 5 Thermodynamische Potenziale Die Suszeptibilität ζM K =
1 ∂S(T, Bext ) V ∂Bext
(5.20)
wird auch der magnetokalorische Effekt genannt. Sie sagt, welche Energie- und Entropiemengen das System bei konstanter Temperatur mit seiner Umgebung austauscht, wenn die Entropie über das Magnetfeld geändert wird, und ist über die aus der Massieu-Gibbs-Funktion F (T, Bext ) resultierende Maxwell-Relation V · ζM K =
∂S(T, Bext ) ∂F (T, Bext ) ∂m(T, Bext ) ∂F (T, Bext ) =− = =− ∂Bext ∂T ∂Bext ∂T
(5.21)
mit ∂m(T, Bext )/∂T verknüpft. ζM K stellt also gleichzeitig das magnetische Analogon zur thermischen Ausdehnung dar und bestimmt die Effektivität der magnetischen Kühlung (Aufgabe 5.7) ebenso, wie βp die Abkühlung eines Gases bei isentroper Entspannung bestimmt. Aus der Messung von ∂m(T, Bext ) ∂T T =T0
als Funktion von Bext erhalten wir also für die Entropiedifferenz zwischen den Zuständen {T0 , B1 } und {T0 , B2 }: ∂m(T0 , Bext ) ΔS(B1 , B2 ) = · (B2 − B1 ) , (5.22) ∂T
B2 +B1 2
welche auf der Bext -Achse so nahe beieinander liegen müssen, dass eine lineare Näherung von S(T, Bext ) ausreichend genau ist. Da ∂m(T, Bext )/∂T negativ ist, nimmt die Entropie des Paramagneten bei Erhöhung des Magnetfeldes ab (Aufgabe 5.7).11 Um den gesuchten Differenzialquotienten ∂S(τ, Bext )/∂τ zu bestimmen, benötigen wir nun noch die zu ΔS(τm , Bext ) gehörige Differenz Δτm der empirischen Temperaturen. Dazu wird der Paramagnet erst isotherm magnetisiert, das heißt, in den Zustand {T0 , B1 } gebracht, und dann isentrop (adiabatisch) zu Bext = 0 entmagnetisiert.12 Dabei kühlt das System auf die empirische Temperatur τ1 ab. Danach wird bei Bext = 0 wieder auf die Temperatur T0 aufgewärmt und der Zyklus mit einem etwas höheren Magnetfeld B2 wiederholt, wobei nach der Entmagnetisierung die empirische Temperatur τ2 resultiert. Da die Entropie der Zustände {T0 , B1 } und {τ1 , Bext = 0} sowie {T0 , B2 } und {τ2 , Bext = 0} wegen der adiabatischen Entmagnetisierung jeweils
11 Mikroskopisch lässt sich diese Tatsache so verstehen, dass eine Erhöhung der Temperatur der Ausrichtung der paramagnetischen Momente durch das externe Magnetfeld entgegen wirkt und das magnetische Moment der Probe reduziert. 12 Die isotherme beziehungsweise isentrope Realisierung der (Ent-)Magnetisierungsprozesse kann dabei entweder durch unterschiedliche Prozessgeschwindigkeiten oder durch einen Wärmeschalter realisiert werden. Letzterer erlaubt eine Unterbrechung des thermischen Kontakts zwischen dem Wärmebad bei T = T0 und der paramagnetischen Probe.
5.3 Die Messung der absoluten Temperatur
S
(a)
(b)
m
T = T0
S0
0
0 . ∂V12
Dies ist kein Zufall, sondern eine Konsequenz der Gibbs-Duhem Relation (Gl. 5.29)! Wenn durch den freien Teilchenaustausch chemisches Gleichgewicht μ1 = μ2 hergestellt wurde, so liegt gleichzeitig Druckgleichgewicht p1 = p2 vor: Wegen p = p(T, μ) muss, wenn T und μ gleich sind, auch der Druck in beiden Teilvolumina gleich sein. Diese Redundanz zwischen p und μ ist damit eine Folge der Homogenität. Die Endzustände der Beispiele 3 und 4 sind (falls es sich in beiden Fällen chemisch um das
204 | 7 Zusammengesetzte Systeme und Gleichgewichte gleiche Gas handelt) identisch, auch wenn der Prozess, mit dessen Hilfe das Gleichgewicht eingestellt wurde, ein anderer ist.
Allgemeine Stabilitätsbedingungen Eine allgemeines Stabilitätskriterium für Gleichgewichte (und damit für die beteiligten Systeme) ist notwendigerweise ziemlich abstrakt, da es alle möglichen Variablensätze umfassen muss. Im Ergebnis lässt es sich wie folgt formulieren:
Gegeben sei ein zusammengesetztes System mit der Massieu-Gibbs-Funktion Ξ(Y1 , . . . , Yi , . . . , Yr ). Die Massieu-Gibbs-Funktion Ξ gehört bezüglich des Austauschs der Variable Yi zur Maximum-Klasse oder zur Minimum-Klasse, je nachdem, ob Ξ(Y1 , . . . , Yi , . . . , Yr ) bei freiem Austausch von Yi zwischen den beiden Teilsystemen im Gleichgewicht ein Maximum oder ein Minimum annimmt. Die Matrix der 2. Ableitungen (Suszeptibilitätsmatrix) von Ξ(Y1 , . . . , Yr ) muss positiv (negativ) definit sein, wenn Ξ(Y1 , . . . , Yi , . . . , Yr ) für alle Yi zur Minimum(Maximum-)Klasse gehört. Die Energie gehört bezüglich des Austausches aller extensiven Variablen zur Minimum-Klasse. Die Entropie gehört bezüglich des Austausches aller extensiven Variablen zur Maximum-Klasse. Bei Legendre-Transformation alterniert die Klassenzugehörigkeit:
Gehört die Massieu-Gibbs-Funktion Ξ(Y1 , . . . , Yi , . . . , Yr ) zur Minimum(Maximum)-Klasse und ist yi die zu Yi thermodynamisch konjugierte Variable, so gehört die Legendre-Transformierte Ξ(Y1 , . . . , yi , . . . , Yr ) − yi Yi zur Maximum(Minimum)-Klasse bezüglich des „Austausches“ von yi (siehe auch Anhang D).10 Aus diesem Grund sind die Hauptdiagonalelemente der Suszeptibilitätsmatrizen χ ˆij (T, p) (Gl. 5.39) und χij (T, μ) (Gl. 5.40) negativ. Für einfache Phasen mit drei Freiheitsgraden bedeutet die Stabilitätsbedingung, dass die in Abschnitt 5.6 definierte Suszeptibilitätsmatrix ⎛ 2 ⎞ ( ) ∂ μ ∂2μ −ˆ cp /T vˆβp ⎜ ∂T 2 ⎟ ∂p∂T χ ˆT,p = ⎝ 2 (7.6) ⎠= 2 ∂ μ ∂T ∂p
∂ μ ∂p2
vˆβp
−ˆ v κT
negativ definit sein muss. Dies bedeutet, dass die Wärmekapazität cˆp und die Kompressibilität κT stets positiv sein müssen und außerdem die Bedingung det χ ˆT p = vˆκT · cˆp /T − (ˆ v βp )2 > 0 (7.7)
7.4 Mischungsentropie |
205
erfüllt sein muss. Daraus lesen wir ab, dass die relative thermische Ausdehnung bei konstantem Druck βp (wie das Beispiel flüssigen Wassers in Abb. 2.1 zeigt) beide Vor zeichen annehmen kann, ihr Betrag den Wert nκT cˆp /T aber nicht überschreiten darf.
7.4 Mischungsentropie Wir betrachten ein ideales Gemisch von r Gasen mit den Mengenvariablen N1 , . . . , Nr . Dabei bedeutet „ideal“, dass die Massieu-Gibbs-Funktionen der Mischung einfach die Summe der Massieu-Gibbs-Funktionen der Komponenten ist. Im Gegensatz dazu weisen die in Kapitel 9 besprochenen realen Mischungen Wechselwirkungsbeiträge zu den Massieu-Gibbs-Funktionen auf, in denen mehrere Mengenvariablen auftreten. Durch die Wechselwirkungsbeiträge lassen sich die realen Mischungen im Gegensatz zu den idealen Mischungen nicht mehr in unabhängige Teilsysteme zerlegen. Für idealen Mischungen lautet die freie Energie: F (T, V, N1 , . . . , Nr ) = F1 (T, V, N1 ) + · · · + Fr (T, V, Nr ) , p=−
=⇒
∂F =− ∂V
.
∂Fr ∂F1 + ··· + ∂V ∂V
/
= p1 + · · · + pr ,
wobei p der Gesamtdruck und die pi die Partialdrucke der i-ten Komponente der Mischung sind. Mit anderen Worten: Ideale Mischungen verhalten sich so, als befände sich jede allein im Volumen – die Partialdrucke addieren sich! Bei Systemen mit anziehenden und/oder abstoßenden Wechselwirkungen ist dies nicht der Fall. Befolgen die Komponenten der Mischung das ideale Gasgesetz pi V = Ni kB T , so tut dies auch ihre Mischung: ( pV =
) Ni
kB T = N kB T
Dalton’sches Gesetz ,
(7.8)
i
1 wobei N = i Ni die Gesamtmenge und xi = Ni /N die Molenbrüche des Gemisches sind. Zur Berechnung der Entropie des Gemisches betrachten wir die freie Enthalpie G = E − T S + pV .11 Aus der Homogenitätsrelation (siehe Abschnitt 5.4) für die Mischung E = T S − p V + μ1 N1 + · · · + μr Nr (7.9)
11 Diese Wahl bietet sich an, wenn bei konstantem Druck gearbeitet werden soll – bei konstantem Volumen läuft eine analoge Betrachtung über die freie Energie.
206 | 7 Zusammengesetzte Systeme und Gleichgewichte
unvermischt
vermischt
1
Schieber
0.5
0
0
0.5
1
x1
Abb. 7.8. Gegeben sind zwei mit verschiedenen Gasen gefüllte Teilvolumina, die durch einen Schieber getrennt sind. Nach dem Herausziehen des Schiebers expandieren die Gase irreversibel in das jeweils andere Teilvolumen, bis ihre Dichte (und damit ihr chemisches Potenzial) räumlich konstant und die Gase daher homogen vermischt sind. Triebkraft der Vermischung ist die Differenz der chemischen Potenziale der Einzelgase zwischen den Teilvolumina. Aus der Differenz ΔG der freien Enthalpien des Anfangs- und des Endzustandes bekommen wir die während des Prozesses erzeugte Entropie: ΔS = −ΔG/T . Der Zustand mit minimalem ΔG liegt bei x1 = x2 = 1/2.
folgt allgemein: G(T, p, N1 , . . . , Nr ) =
r
μi (T, p, x1 , . . . , xr ) · Ni ,
i=1
weil die chemischen Potenziale μi (T, p, x1 , . . . , xr ) wegen der Gibbs-Duhem-Relation nur von intensiven Größen abhängen dürfen. Für ideale Gase gilt nach Gleichung 6.15: μi (T, p, x1 , . . . , xr ) = μi (T, p, xi ) = eˆ0i − kB T ln
= eˆ0i − kB T ln
ji kB T κi +1 xi p ji kB T κi +1 p
+ kB T ln xi
Damit erhalten wir den Ausdruck μi (T, p, x1 , . . . , xr ) = μiR (T, p) + kB T ln xi ,
(7.10)
wobei μiR (T, p) das chemische Potenzial des reinen Gases der Stoffart i beim Druck p ist. Die Anwesenheit der übrigen Komponenten bei gegebenen Gesamtdruck p reduziert das chemische Potenzial der i-ten Komponente um einen Mischungsterm kB T ln Ni /N , der vom Mengenverhältnis der Komponenten zur Gesamtmenge abhängt. Entsprechend reduziert sich auch die freie Enthalpie G der Mischung um einen Mischungsterm gegenüber dem unvermischten Zustand:
7.4 Mischungsentropie |
G(T, p, N1 , . . . , Nr ) =
μi (T, p, Ni ) · Ni
(7.11)
i
=
( μiR (T, p) · Ni + N kB T
i
207
Ni i
N ln i N N
) .
Mischungsterm
Der einfachste Fall ist in Abb. 7.8 illustriert, wo zwei zunächst durch einen Schieber getrennte Volumina mit den Gasen 1 und 2 und den Drucken p1 = p2 = p dargestellt sind. Im Anfangszustand gilt für den linken Behälter μ1a = μ1R (T, p) und μ2a → −∞, da N2a = 0 ist.12 Im rechten Behälter sind die Verhältnisse entsprechend umgekehrt. Wenn die Mischung ideal ist, so ist der Prozess der Vermischung für die einzelnen Gase identisch mit dem der irreversiblen Expansion. Nach dem Herausziehen der Trennwand bildet die Differenz der chemischen Potenziale in beiden Behältern den Antrieb für einen Diffusionsstrom von Gas 1 in den rechten und Gas 2 in den linken Behälter, an dessen Ende ein chemisches Gleichgewicht vorliegt, in dem μ1 und μ2 über das ganze Volumen konstant sind: μ1 = μ1R + kB T ln N1 /N
und μ2 = μ2R + kB T ln N2 /N
Insgesamt gilt wie bei jeder Einstellung eines Gleichgewichts: Gunvermischt > Gvermischt
Die bei dem Diffusionsprozess erzeugte Entropie nennt man die Mischungsentropie: ∂ ΔS = Svermischt − Sunvermischt = −
Gvermischt − Gunvermischt
∂T
Differenzieren des Mischungterms von G in Gl. 7.11 nach T liefert: ΔS = −N kB
r Ni i=1
N
ln
Ni . N
(7.12)
Für die Mischung zweier Gase ist die Anhängigkeit der Mischungsentropie vom der Zusammensetzung der Gasmischung in Abb. 7.9 dargestellt. Gleichung 7.12 lässt sich auch direkt gewinnen, wenn wir in der Formel für die unvermischten Teilgase S(T, V1 , . . . , Vr , N1 , . . . , Nr ) =
r i=1
. kB N i
ln
ji V i T κ i Ni
/ + (κi + 1)
12 Diese logarithmische Divergenz von μ2a ist mathematisch harmlos, da der entsprechende Beitrag N2a μ2a zur freien Enthalpie im Grenzfall N2a → 0 gegen Null geht.
208 | 7 Zusammengesetzte Systeme und Gleichgewichte
NkB ln 2
0
0.5
1
x1
Abb. 7.9. Entropiedifferenz ΔS zwischen dem unvermischten und dem vermischten Zustand. Der Zustand maximaler Entropie liegt bei x1 = x2 = 1/2.
die Teilvolumina Vi gegen das Gesamtvolumen V = sen:
1
i Vi
= Vi /xi expandieren las-
(7.13)
S(T, V1 , . . . , Vr , N1 , . . . , Nr ) =
r
. kB N i
ln
i=1
=
r i=1
ji V T Ni
. kB N i
ln
κi
ji V i T κ i Ni
/ + (κi + 1)
0
/ + (κi + 1)
+
unvermischt
−N kB
r
xi ln xi
i=1
.
Mischungsentropie
Hierbei wird deutlich, dass es bei idealen Gasen für den Wert der Gesamtentropie nach der Expansion/Vermischung irrelevant ist, ob sich die einzelnen Gase in getrennten Volumina V befinden oder sie sich das Volumen teilen. Gl. 7.13 zeigt, dass die Entropie der Einzelgase unabhängig von der Dichte der übrigen Gase ist. Dies liegt daran, dass im Grenzfall hoher Verdünnung, der ja ideale Gase auszeichnet, die Wechselwirkung zwischen allen Gasteilchen vernachlässigt werden kann, unabhängig davon, ob es sich um dieselbe chemische Spezies handelt oder nicht. Bei Mischungen von realen Gasen (siehe Kapitel 9) ist dies anders; dort machen sich die Wechselwirkungen bemerkbar. Aus diesem Grund trifft der Ausdruck „Verdünnungs“-Entropie die Verhältnisse vielleicht etwas besser als „Mischungs“-Entropie. Die Mischungsentropie lässt eine statistische Interpretation zu: Wir denken uns das Volumen der Mischung in kleine Teilvolumina zerlegt, die im Mittel jeweils ein Molekül enthalten. Dann ist Δˆ s = ΔS/N = −kB Wi ln Wi (7.14) i
Die Wi = Ni /N = xi sind dann die Wahrscheinlichkeiten, dass dieses Molekül zur Stoffart i gehört. Diese Form der Mischungsentropie wird uns in der statistischen Formulierung der Thermodynamik wieder begegnen.
7.5 Ideale Lösungen |
209
7.5 Ideale Lösungen Idealität bedeutet bei Gasen die Vernachlässigbarkeit von Wechselwirkungen zwischen den Gasmolekülen aufgrund geringer Dichten. Das Konzept der Idealität ist auf verdünnte Lösungen übertragbar. Wir betrachten eine r-komponentige Mischung aus einer Flüssigkeit mit der Menge N1 , dem Lösungsmittel, mit anderen Stoffen mit den Mengen N2 , . . . Nr , den gelösten Stoffen. Eine verdünnte Lösung liegt vor, wenn N1 N2 , . . . , Nr ist, sodass N1 ≈ N = 1 i Ni und x1 ≈ 1 ist. Wenn wir bei konstanter Temperatur und konstantem Druck arbeiten, so ist {T, p, N, x2 , . . . , xr }
mit xi ≈
Ni 1 N
für i = 1 ,
ein geeigneter Variablensatz. Alternativ zu dem Molenbrüchen xi werden in der Chemie auch die Mengendichten oder Konzentrationen ni = Ni /V ≈ xi n verwendet. Letztere haben jedoch den Nachteil, über die Dichte n1 (T, p) des Lösungsmittels von Druck und Temperatur abzuhängen. Als Massieu-Gibbs-Funktion des Systems verwenden wir die molare freie Enthalpie, die nach der Homogenitätsrelation (Gl. 7.9) durch die chemischen Potenziale der Komponenten ausgedrückt werden kann: G G (T, p, x2 , . . . , xr ) = μ1 + x i μi (T, p, x2 , . . . , xr ) ≈ N N1 r
i=2
Eine ideale Lösung zeichnet sich dadurch aus, dass die Wechselwirkungen der gelösten Moleküle untereinander bei hinreichend kleinen xi gegen ihre Wechselwirkung mit den Molekülen des Lösungsmittels vernachlässigbar sind. Thermodynamisch lassen sich die gelösten Stoffe dann genau wie ideale Gase betrachten, wobei das Lösungsmittel die Rolle eines „Quasi-Vakuums“ spielt. Nach van’t Hoff lässt sich dies wie folgt formulieren: Wir nennen eine Lösung ideal, wenn die Mengenabhängigkeit des chemische Potenzials der gelösten Stoffe durch denselben Mischungsterm kB T ln xi wie bei Gasen (Gl. 7.10) beschrieben wird:
μi (T, p, xi ) ≈ eˆ0i + ζi (T, p) + kB T ln xi
(7.15)
Die (hier nicht weiter zu diskutierenden) Funktionen ζi (T, p) enthalten dabei die Wechselwirkung der gelösten Stoffe mit dem Lösungsmittel, insbesondere die kalorischen Eigenschaften der Lösung.13 Entscheidend ist für uns, dass der zweite Term in Gl. 7.15
13 In Abschnitt 9.3.6 werden wir die chemischen Potenziale in realen Mischungen besprechen. Die Aufstellung von Modellen zur theoretischen Berechnung der chemischen Potenziale in realen Mischungen stellt bis heute eine Herausforderung dar.
210 | 7 Zusammengesetzte Systeme und Gleichgewichte genau dieselbe Gestalt wie bei idealen Gasen hat und wir unsere Herleitung der Mischungsentropie ungeändert übernehmen können. Aus Gl. 7.15 folgern wir, dass die μi von den xj (i = j, i = 1) unabhängig sind (Idealität) sowie ∂μi (T, p, xi ) k T = B . ∂xi xi
(7.16)
Gleichung 7.16 hat also genau dieselbe Form wie Gl. 6.19 bei idealen Gasen. Über das chemische Potenzial des Lösungsmittels μ1 sowie über die Funktionen ζi (T, p) wissen wir zunächst nichts. Zum Glück können wir unabhängig davon eine wichtige Aussage über die Abhängigkeit des chemischen Potenzials des Lösungsmittels von den Konzentrationen der gelösten Stoffe machen, indem wir von der Gibbs-Duhem-Relation (Gl. 5.29) der Mischung ausgehen: S dT − V dp +
r
(7.17)
Ni dμi = 0
i=1
ausgehen. Wegen T , p = const. folgt: dμ1 = −
r i=2
xi dμi = −
r
xi
i=2
r r ∂μi k T dxi = − xi B dxi = −kB T dxi . ∂xi xi i=2
i=2
Im vorletzten Schritt haben wir Gl. 7.16 ausgenutzt. Durch Integration nach den xi folgt für das chemische Potenzial des Lösungsmittels in linearer Näherung:14 μ1 (T, p, N1 , . . . , Nr ) = μ1R (T, p) − kB T ·
r Ni i=2
N
,
(7.18)
wobei μ1R (T, p) das chemische Potenzial des reinen Lösungsmittels bezeichnet. Gelöste Stoffe erniedrigen also das chemische Potenzial μ1 des Lösungsmittels! Dieses Resultat zieht viele weitere Effekte nach sich, zum Beispiel die Schmelzpunktserniedrigung beziehungsweise Siedepunktserhöhung bei Zugabe von gelösten Stoffen zur flüssigen Phase (siehe Abschnitt 9.3) sowie den osmotischen Druck, den wir im nächsten Abschnitt behandeln wollen.
7.6 Der osmotische Druck Erfolgt die Vermischung zweier Gase oder gelöster Salze irreversibel, so wird Entropie erzeugt und damit die in den anfangs bestehenden chemischen Potenzialdifferen-
14 Es sei darauf hingewiesen, dass es auch Lösungen gibt, bei denen schon bei Molenbrüchen x1 > 0.99 entsprechend < 1% gelöste Stoffe Abweichungen vom idealen Verhalten auftreten, die in Abschnitt 9.3.6 beschrieben sind.
7.6 Der osmotische Druck
pA
| 211
Abb. 7.10. Eine für Ionen undurchlässige semipermeable Membran trennt zwei Teilvolumina. Werden die Drucke pA im linken und pB im rechten Teilvolumen so eingestellt, dass keine Verschiebung der Kolben mehr eintritt, so ist pA > pB . Die Druckdifferenz ist der osmotische Druck der Salzlösung im linken Teilvolumen.
pB
zen steckende chemische Energie vergeudet. Stattdessen lässt sich die Vermischung auch reversibel durchführen und als Arbeit mechanisch nutzen. Dazu betrachten wir eine semipermeable Membran, die zwei Teilvolumina in einem Kolben trennt (siehe Abb. 7.10). Im linken Teilvolumen befinde sich eine Lösung (beispielsweise eine wässrigen Salzlösung), im rechten das reine Lösungsmittel. Die Membran sei nur für das Lösungsmittel, nicht aber für die gelösten Stoffe durchlässig. Sind die Drucke pA und pB auf beiden Seiten der Membran gleich, so besteht zwischen beiden Seiten eine Differenz der chemischen Potenziale des Lösungsmittels: B μA 1 − μ1 = μ1R (T, pA ) − kB T
r Ni i>1
N1
− μ1R (T, pB = pA ) < 0 ,
wobei N1 ≈ N . Aufgrund dieser chemischen Potenzialdifferenz wird das Lösungsmittel aus dem rechten Teilvolumen in das linke strömen, um dort die Konzentration der gelösten Stoffe zu verringern und so die chemische Potenzialdifferenz abzubauen. Damit wird sich eine Druckdifferenz pA − pB > 0 aufbauen, die ihrerseits das chemische Potenzial auf der linken Seite erhöht, so lange, bis die chemische Potenzialdifferenz verschwindet und chemisches Gleichgewicht bezüglich des Austauschs von Lösungsmittel eintritt. Um die resultierende Druckdifferenz abzuschätzen benötigen wir die Druckabhängigkeit des chemischen Potenzials. Diese erhalten wir aus der Gibbs-Duhem-Relation (Gl. 5.29) für das reine Lösungsmittel: ∂μ1R (T, p) V = 0.018 = vˆ1R (T, p) = . ∂p NH2 O mol
(7.19)
Mit dem Molvolumen von Wasser können wir die Änderung der chemischen Potenzials mit dem Druck in linearer Näherung abschätzen μA ˆ1R (pA − pB ) 1 (T, pA ) = μ1R (T, pB ) + v
und erhalten schließlich aufgrund der Gleichheit der chemischen Potenziale des Lösungsmittels im Diffusionsgleichgewicht μA ˆ1R (pA − pB ) − kB T 1 = μ1R (T, pB ) + v
r Ni i>1
und wegen vˆ1 N1L = VL für die Druckdifferenz:
N1
!
= μ1R (T, pB )
212 | 7 Zusammengesetzte Systeme und Gleichgewichte
pA − pB =
r N i kB T i>1
VA
.
(7.20)
Diese Gleichung stammt ebenfalls von van’t Hoff. Der durch den gelösten Stoff aufgebaute osmotische Druck hat also genau dieselbe Form wie bei einem idealen Gas. Dies unterstreicht noch einmal die Tatsache, dass das Lösungsmittel für den gelösten Stoff ein „Quasivakuum“ darstellt. Diese Betrachtungen spielten eine wichtige Rolle bei der Entdeckung, dass Salze in Ionen dissoziieren statt in „Salzmolekülen“ gebunden zu sein. Messungen des osmotischen Druckes ergaben (zum Beispiel für Kochsalzlösungen) doppelt so hohe Werte, wie die Zahl der NaCl-„Einheiten“ vermuten lässt. Der osmotische Druck ist von entscheidender Bedeutung in der Biologie, wo die Zellmembranen oft semipermeabel sind, ja die Durchlässigkeit der Zellwand für bestimmte Stoffe von der Zelle gezielt gesteuert wird. Als Abschätzung für die Größenordnung des osmotischen Drucks in Pflanzenzellen, in denen ein gelöstes Molekül oder Ion auf ca. 200 Wassermoleküle kommt, erhalten wir mit Gl. 7.19: pA − pB = RT ·
Nsalz 6.9 · 105 N/m2 = 6.9 bar . vˆH2 O NH2 O
Ein so hoher Druck ist ausreichend um 70 m hohe Bäume mit Wasser zu versorgen! Zusätzlich zum osmotischen Druck unterstützen auch Kapillarkräfte, das heißt die Anziehungskräfte zwischen der Flüssigkeit und dem Material der Baumkapillaren, das Aufsteigen des Saftes in den Bäumen. Die höchsten vorkommenden Bäume werden etwa 140 m hoch.
7.7 Chemische Reaktionen 7.7.1 Das Massenwirkungsgesetz Die homogene Vermischung verschiedener Stoffe durch Diffusion bildet ein Beispiel der spontanen Einstellung eines chemischen Gleichgewichts im Raum, ohne dass sich die im Gesamtvolumen enthaltene Menge der einzelnen Stoffe ändert. Wenn die verschiedenen Stoffarten miteinander chemisch reagieren können, verändern sich auch die Absolutwerte der Stoffmengen derart, dass sich zwischen den verschieden Teilchensorten chemisches Gleichgewicht einstellt. Wie bereits in Kapitel 3.1 erwähnt, sind die r Mengenvariablen Ni dabei nicht unabhängig, sondern durch Erhaltungssätze aneinander gekoppelt, sodass die Stoffumsetzungen zueinander stets in gewissen Proportionen stehen. Die kommt in den stöchiometrischen Koeffizienten νi in der Reaktionsgleichung zum Ausdruck. Die äußeren Variablen des Systems sind die Teilchenzahlen der in den Stoffen vorhandenen Elemente sowie Druck und Temperatur.
7.7 Chemische Reaktionen
| 213
Typische Beispiele für chemische Reaktionen sind die Ammoniaksynthese oder die Bildung von Salzsäure in der Gasphase: N2 + 3 H2 − − − − 2 NH3
(7.21)
H2 + Cl2 − − − − 2 HCl .
Wie wir bereits in Abschnitt 3.1 erwähnt haben, betragen die Teilchenzahlen beim Fortschreiten der Reaktion Ni (λ) = Nia + νi λ , (7.22) wobei die Nia die Anfangswerte der Teilchenzahlen bezeichnen. Der Fortgang der Reaktion wird durch die Reaktionslaufzahl λ beschrieben, welche den einzigen inneren Freiheitsgrad des Systems darstellt. Die Änderungen der Teilchenzahlen betragen daher dNi = νi dλ . (7.23) Das chemische Gleichgewicht ist (wie alle Gleichgewichte) durch ein Extremum der zum gewählten Variablensatz zugehörigen Massieu-Gibbs-Funktion ausgezeichnet. Wir folgen einer Gewohnheit der Physikochemiker und betrachten Reaktionen bei konstanten T und p.15 Daher verwenden wir die freie Enthalpie G(T, p, N1 , . . . , Nr ) als Massieu-Gibbs-Funktion. Setzen wir die Ni (λ) aus Gl. 7.22 ein, so betragen die Änderungen von G bei konstanten T und p 0 r r dG =
μi dNi =
ν i μi
i=1
dλ = A dλ .
i=1
Die Funktion A(T, p, x1 , . . . , xr ) wird in der Chemie auch die Affinität der Reaktion genannt. Als Extremalbedingung für G(T, p, N1 , . . . , Nr ) erhält man dann: A(T, p, x1 , . . . , xr ) :=
r
!
νi μi (T, p, x1 . . . , xr ) = 0 .
(7.24)
i=1
Für ideale Gase und verdünnte Lösungen kennen wir die μi (T, p, x1 . . . , xr ) (Gl. 7.10): μi (T, p, x1 . . . , xr ) = μiR (T, p) + kB T ln xi ,
wobei die μiR (T, p) wieder die chemischen Potenziale der reinen Stoffe sind. Setzen wir dies in die Gleichgewichtsbedingung ein, so erhalten wir: kB T
r i=1
νi ln xi = −
r
νi μiR (T, p) =: −Δˆ gR (T, p) .
i=1
15 Ebenso könnten wir den Variablensatz {T, V, N1 , . . . , Nr } mit der freien Energie als MassieuGibbs-Funktion verwenden (siehe Aufgabe 7.4).
214 | 7 Zusammengesetzte Systeme und Gleichgewichte
(a)
N
NH3
N1,2a
T'Serzeugt
Ga
N2 N3a
(b)
G
Ge
H2 λGGW
λGGW
λ
λ
Abb. 7.11. a) Stoffmengen der Ammoniaksynthese als Funktion der Zahl der Reaktionslaufzahl λ. Die Steigung der Gerade entspricht dem stöchiometrischen Koeffizienten νi . b) Verlauf der freien Enthalpie G als Funktion von λ. Das Minimum Ge von G(λ) liefert die Lage λGGW des chemischen Gleichgewichts. Der Differenz [Ga (λ = 0) − Ge (λ = λGGW )] bestimmt die durch die Reaktion erzeugte Entropie.
Die Funktion Δˆ gR (T, p) =
|νi | μiR,Produkte −
i
|νi | μiR,Edukte
(7.25)
i
heißt die molare freie Reaktionsenthalpie. Im Unterschied zur Affinität A hängt gˆR nicht mehr von den Molenbrüchen, sondern nur noch von den chemischen Potenzialen der reinen Stoffe ab. Damit erhalten wir das Massenwirkungsgesetz . K(T, p) := exp −
Δˆ gR (T, p) kB T
/
r 2
=
[xi ] νi ,
(7.26)
i=1
wobei die Funktion K(T, p) die Gleichgewichtskonstante der Reaktion genannt wird, da sie bei festen T und p unabhängig von den xi ist.16 In der Chemie schreibt man das Massenwirkungsgesetz üblicherweise in der Form: 3 νi [x]Produkte
3
|ν |
i [x]Edukte
= K(T, p) .
Der etwas kuriose Name „Massenwirkungsgesetz“ rührt daher, dass die Molenbrüche früher „wirksame Masse“ genannt wurden. Ist Δˆ gR (T, p) < 0 (das heißt K(T, p) > 1), so wird bei der Reaktion freie Enthalpie frei und das chemische Gleichgewicht liegt auf der Seite der Produkte – die Reaktion läuft „freiwillig“ ab. Ist dagegen Δˆ gR (T, p) > 0 (das heißt K(T, p) < 1), so „kostet“
16 Die eckigen Klammern sollen zum Ausdruck bringen, dass Gl. 7.26 für die Gleichgewichtswerte [xi ] der Konzentrationen gilt.
7.7 Chemische Reaktionen
| 215
die Reaktion freie Enthalpie, und das chemische Gleichgewicht liegt auf der Seite der Edukte – die Reaktion findet nicht statt. Wir wollen die Gleichgewichtskonstante noch in ihre T - und p-abhängigen Anteile separieren: ln K(T, p) = −
r r 1 νi μiR (T, p) = [νi ζi (T ) − νi ln p] kB T i=1
i=1
=
r
νi ζi (T ) − ln p(
i
νi )
i=1
Die ζi regeln die Temperaturabhängigkeit der chemischen Potenziale. Wir erkennen, dass es zwei Typen von Reaktionen gibt, die sich durch Druck und Temperatur unterschiedlich beeinflussen lassen: 1 (i) i νi = 0: Für Reaktionen dieses Typ bleibt die gesamte Teilchenzahl (und damit der Druck) während der Reaktion konstant und K(T ) ist unabhängig von p. Damit ist die Lage des Gleichgewichts unabhängig vom Druck! 1 (ii) i νi > 0 ( < 0): Für Reaktionen dieses Typs nimmt die gesamte Teilchenzahl und damit der Druck während der Reaktion zu (ab) und K(T, p) nimmt mit wachsendem Druck ab (zu). Das chemische Gleichgewicht verschiebt sich daher auf die Seite der Edukte (Produkte). Für eine anschauliche Erklärung der T - und p-Abhängigkeit betrachten wir noch einmal die verschiedenen Beiträge zu ΔG: ΔG = ΔE − T ΔE + pΔV
Der wesentliche Beitrag zu ΔE kommt aus den molekularen Bindungsenergien. Dieser Term favorisiert daher die Bildung von Molekülen. Der Term mit T ΔS geht negativ ein und bevorzugt bei hohen Temperaturen die Mischungsentropie, das heißt die Bildung von Teilchen durch die Dissoziation von Molekülen. Schließlich favorisiert der Term p ΔV bei hohen Drucken große Dichten und ein kleines Molvolumen und fördert daher wiederum die Bildung von Molekülen. Diese Druck- und Temperaturabhängigkeit wollen wir am Beispiel der berühmten Ammoniaksynthese (Gl. 7.21) noch einmal genauer ansehen. Für diese Reaktion ist νi = 2 − 3 − 1 = −2 < 0 ,
i
das heißt hoher Druck verlagert das Gleichgewicht auf die NH3 -Seite! Um eine Aussage über die Temperaturabhängigkeit zu machen, können wir die Gleichgewichtskonstante aus den chemischen Potenzialen (unter der Annahme idealen Ver-
216 | 7 Zusammengesetzte Systeme und Gleichgewichte haltens) explizit berechnen: ln K(T, p) = −
1 νi μiR (T, p) kB T i
=−
i
=
. νi
ln
i
eˆ0i − ln kB T
ji kB T κi +1 p
ji kB T κi +1 p
νi −
/
νi eˆ0i i
kB T
Damit erhalten wir schließlich für die Gleichgewichtskonstante K(T, p) =
2 i
(
(kB ji )
νi
·
T
νi (κi +1) p i νi i
· exp
−
νi eˆ0i i
kB T
) .
(7.27)
Der Löwenanteil der Temperaturabhängigkeit von K(T, p) rührt von der Exponentialfunktion im letzten Faktor her. Die Lage des chemischen Gleichgewichts wird damit wesentlich durch die (gewichtete) Summe Δˆ eR =
r
νi eˆ0i
i=1
der Bindungsenergien eˆ0i der Moleküle bestimmt. Ist Δˆ eR positiv, wird durch die Reaktion Bindungsenergie gewonnen und (bei irreversibler Prozessführung17 ) zur Erzeugung von Entropie verwendet. Ist Δˆ eR negativ, muss die erforderliche Energie zusammen mit Entropie aus dem Wärmereservoir, dass während des Ablaufes der Reaktion die Temperatur konstant hält, zugeführt werden (endotherme Reaktionen). Wie wir im nächsten Abschnitt sehen werden, tritt dies als positive oder negative Reaktionswärme in Erscheinung. Die Berechnung der eˆ0i im Rahmen der Atom- und Molekülphysik erfordert „chemische Genauigkeit“, das heißt relative Fehler von 10−4 –10−3 , um hinreichend genaue Aussagen über die Gleichgewichtskonstanten machen zu können. Die „Chemie“, das heißt die stoffspezifischen Eigenschaften, stecken außer in den eˆ0i auch in den νi und den chemischen Konstanten ji , welche die Information über die Zahl der Bindungspartner und innere Freiheitsgrade der Moleküle enthalten (siehe Abschnitt 11.1). H2 und N2 sind lineare Moleküle mit zwei Rotationsfreiheitsgraden – daraus folgt: κ +1 = 7/2. Dagegen ist NH3 kein lineares Molekül und hat 3 Rotationsfreiheitsgrade – daraus folgt κ +1 = 8/2 = 4. Diese Resultate gelten, wenn die Rotationsfreiheitsgrade voll angeregt sind, die Anregung der Schwingungsanregungen jedoch noch vernach-
17 Bestimmte Reaktionen können in elektrochemischen Zellen (Batterien!) weitgehend reversibel ablaufen. Die frei werdende Bindungsenergie wird dann an einen elektrischen Verbraucher abgeführt.
7.7 Chemische Reaktionen
| 217
lässigbar ist. Damit erhalten wir für die Ammoniaksynthese νi (κi + 1) = 4 · 7/2 − 2 · 4 = −1, νi = −2 , i
K(T, p) =
2
ji kB
ν i p 2 ·
T
i
i
0 · exp
−
νi eˆ0i kB T
i
.
Hohe Temperaturen und niedrige Drucke verlagern bei dieser Reaktion das Gleichgewicht auf die H2 /N2 -Seite. Die Ammoniaksynthese erfordert hohe Drucke und niedrige Temperaturen – zur Erhöhung der bei niedrigen Temperaturen sehr kleinen Reaktionsraten ist daher ein Katalysator (zum Beispiel Platin) erforderlich. Generell sagt die Favorisierung einer bestimmten Lage des chemischen Gleichgewichts durch die Bedingung A(T, p, x1 , . . . , xr ) = 0 noch nichts darüber, ob sich das Gleichgewicht auch freiwillig einstellt. Zur Dissoziation oder Bildung von Molekülen sind nämlich häufig die Zufuhr einer gewisser Aktivierungsenergie erforderlich. Bei hohen Temperaturen gibt es im zeitlichen Mittel mehr schnelle Moleküle mit hoher kinetischer Energie, die diese Aktivierungsenergie „mitbringen“. Daher laufen bei hohen Temperaturen Reaktionen generell schneller ab. Die Rolle eines Katalysators besteht darin, auf die eine oder andere Weise eine Erniedrigung der Aktivierungsenergie zu bewirken und die Reaktionsrate auf diese Weise zu erhöhen. Gleichung 7.27 ist mehr für das theoretische Verständnis, als für die praktische Anwendung zu gebrauchen, weil die Tabellenwerke nicht die mikroskopischen Systemkonstanten eˆ0i und ji enthalten, sondern die Standardwerte μ◦i der chemischen Potenziale. Für die praktische Berechnung der Gleichgewichtskonstanten geht man daher besser von
κi +1 ◦ μiR (T, p) = μ◦iR − RT ln
aus und erhält damit .
Δˆ g ◦ (T, p) K(T, p) = exp − R RT
/ ·
T T◦
T T◦
p p
i νi (κi +1)
p◦ p
i ν i .
(7.28)
Entsprechend unserer Herleitung der Entropie ist Ergebnis in den T - und p-Bereichen verlässlich, in denen die κi als konstant angesehen werden können. In Kapitel 11 werden wir Methoden kennen lernen, mit denen die T -Abhängigkeit des Beitrags der inneren Anregungen zu den thermodynamischen Größen berücksichtigt werden kann. ◦ Die freie Reaktionsenthalpie bei Standardbedingungen Δˆ gR = Δˆ gR (T ◦ , p◦ ) ist 18 ◦ für viele Verbindungen tabelliert. Aus diesen Werten lassen sich die Δˆ gR -Werte für
18 Da die chemischen Potenziale der bei Standardbedingungen stabilsten Form der Elemente in der ◦ identisch mit dem Chemie konventionsgemäß gleich Null gesetzt werden, ist der Zahlenwert von Δˆ gR
218 | 7 Zusammengesetzte Systeme und Gleichgewichte beliebige Reaktionen berechnen (siehe Tabelle 7.1 für eine kleine Auswahl). Hier sind einige konkrete Beispiele: ◦ • Ammoniaksynthese: Δˆ gR = 32.9 kJ/mol ◦ • Dissoziation von Wasser: Δˆ gR = 79.9 kJ/mol • Lösung von Gasen in Wasser ◦ • Ionisation von Wasserstoff: Δˆ gR = 13.9 eV/Teilchen • Teilchen-Loch-Gleichgewicht im Halbleiter: 0 1.12 eV/e− h+ -Paar für reines Silizium − + ◦ e + h Phononen Δˆ gR = 0.7 eV/e− h+ -Paar für reines Germanium Das chemische Gleichgewicht zwischen Elektronen und Löchern im letzten Beispiel bestimmt unter anderem die Temperaturabhängigkeit des Widerstands reiner Halbleiter (siehe Abschnitt 14.5.1).
7.7.2 Reaktionswärmen Die irreversible Einstellung des chemischen Gleichgewichts ist wie in allen anderen Fällen der irreversiblen Einstellung eines Gleichgewichts mit der Produktion von Entropie verbunden. Für einen gegebenen Anfangszustand {T, p, x1a , . . . , xra } beträgt die während einer bei konstanten T und p ablaufenden Reaktion erzeugte Entropiemenge Ga (T, p, N1a , . . . , Nra ) − Ge (T, p, N1e , . . . , Nre ) ΔG = , T T wobei Ga die freie Enthalpie des Anfangszustands und Ge die des Endzustands ist (Abb. 7.11). Andererseits differiert die Entropie Se des Endzustands bei konstanter Temperatur T von der Entropie Sa des Anfangszustands um den Wert Serzeugt = −
ΔS = −
∂(ΔG) . ∂T
Im Normalfall wird die Größe ΔS , welche durch die spezifischen Größen der beteiligten Einzelstoffe im Anfangs- und Endzustand bestimmt ist, von der Größe Serzeugt , welche auch von den gewählten Anfangszustand abhängt, verschieden sein. Die Differenz beträgt T ΔS + ΔG ΔH (7.29) = . T T Im Folgenden beziehen wir uns auf einen Umsatz Δλ von einem Mol. Die Größe ΔHR = He − Ha , die analog zu ΔS gebildet wird, wird die molare ReaktionsentΔS − Serzeugt =
chemischen Potenzial μ◦R der Verbindung relativ zu denen der Elemente, aus denen sie besteht (siehe Abschnitt 7.7.3).
7.7 Chemische Reaktionen
| 219
halpie19 genannt. Je nachdem, ob ΔH positiv oder negativ ist, hat der Endzustand {T, p, x1e , . . . , xre } gegenüber dem Anfangszustand entweder ein Entropiedefizit oder einen Entropieüberschuss. Soll die Reaktion wie angenommen bei T, p = const. ablaufen, so muss die Energiemenge ΔH = T (ΔS − Serzeugt ), die auch die Reaktionswärme genannt wird, aus einem Wärmereservoir zugeführt oder abgeführt werden. Zusätzlich ist ein weiterer Energiebetrag ΔF = −pΔV erforderlich, da das Behältervolumen wegen der Änderungen der Teilchenzahlen bei konstantem Druck um den Betrag ΔV =
∂(ΔG) ∂p
geändert werden muss. Die Energieänderungen der Reservoire werden durch den Entropie- und den Volumenterm in G(T, p, N1 , . . . , Nr ) automatisch berücksichtigt. Läuft die Reaktion dagegen bei p = const. und adiabatisch20 ab, so muss sich die Temperatur der Reaktanden nach Gl. 5.7 entweder ab- oder zunehmen: ΔT = −
ΔH . Cp
Wie man sieht, tritt nur ein Teil der erzeugten Entropie in Form einer Temperaturänderung in Erscheinung. Ein manchmal erheblicher Teil der bei der Reaktion erzeugten Entropie wird durch die zur Erreichung des Gleichgewichts erforderliche Änderung der Teilchenzahlen ohne Temperaturänderung konsumiert. Reaktionen, bei denen die für T = const. benötigte Änderung der Entropie ΔS größer als die im Verlauf der Reaktion erzeugte Entropie Serzeugt ist, und die deshalb zu einer Abkühlung führen, heißen endotherm. Wird im umgekehrten Fall mehr Entropie erzeugt, als zur Erzeugung von Teilchen benötigt wird, kommt es zu einer Erwärmung. Solche Reaktionen heißen exotherm. Die Triebkraft endothermer Reaktionen liegt offenbar nicht in dem Bestreben des Systems seine Energie zu minimieren, sondern (wie besprochen) im Abbau der durch die freie Enthalpie G quantifizierten „chemischen Spannung“, welche durch die mit den νi gewichteten chemischen Potenziale der Reaktanden bestimmt ist. Die Enthalpie (und natürlich auch ihre Differenzen) lässt sich auch direkt mit der freien Enthalpie verknüpfen, da ΔH = ΔG + T ΔS = ΔG − T ·
*
∂ ΔG(T, p)/T = −T · ∂T 2
+
∂ΔG(T, p) ∂T
= kB T 2
∂ ln K(T, p) . ∂T
(7.30)
19 Für eine Reaktion, bei der eine Verbindung aus den Elementen gebildet wird, spricht man auch von der molaren Bildungs-Enthalpie. 20 Hier ist der Unterschied zwischen adiabatisch und isentrop entscheidend, da der Prozess thermisch isoliert (adiabatisch), aber nicht isentrop, da irreversibel, erfolgt.
220 | 7 Zusammengesetzte Systeme und Gleichgewichte Diese Relation ist als die Gibbs-Helmholtz Gleichung bekannt. Sie stellt einen Zusammenhang zwischen der Reaktionsenthalpie ΔH und der logarithmischen Ableitung der Gleichgewichtskonstanten K(T, p) (Gl. 7.27) nach der Temperatur her. Die molaren Standard-Reaktionsenthalpien ˆ◦ = Δh
r
ˆ ◦i (T ◦ , p◦ ) νi h
i=1
sowie die molaren Entropien und Wärmekapazitäten sind ebenfalls tabelliert [11; 12; 13; 14]. In Tabelle 7.1 sind Messwerte der thermochemischen Größen einer Reihe von anorganischen Stoffen unter Standardbedingungen zusammengefasst. Die zweite Spalte enthält die molare freie Reaktionsenthalpie ΔgR . Da die chemischen Potenziale der bei Zimmertemperatur stabilsten Form der Elemente konventionsgemäß gleich Null gesetzt werden (dies wird im nachfolgenden Abschnitt begründet), entspricht dies gleichzeitig dem chemischen Potenzial μ(T ◦ , p◦ ) und der molaren freien Bildungsenthalpie ΔgB der Stoffe aus den Elementen. Die dritte Spalte enthält die molaren Reakˆ ◦ , die wegen derselben Nullpunkts-Konvention mit den molaren tionsenthalpien Δh Bildungsenthalpien21 identisch sind. Nach der Gibbs-Helmholtz-Gleichung (Gl. 7.30) bestimmen die Reaktionsenthalpien die T -Abhängigkeit der Gleichgewichtskonstanten. Die vierte Spalte enthält die Standardwerte sˆ◦ der Entropie. Diese bestimmen nach der Gibbs-Duhem-Relation (Gl. 5.29) auch die T -Abhängigkeit des chemischen Potenzials des jeweiligen Stoffs, während dessen p-Abhängigkeit durch die Mol-Volumina gegeben ist. Die fünfte Spalte enthält den T -abhängigen Anteil der molaren Enthalpie ˆ = 0) = ˆ ◦ − h(T h
T
dT cˆp (T ) ,
0
ˆ ◦ , die Bindungsder es erlaubt, zusammen mit den molaren Bildungsenthalpien Δh R energien r ◦ ◦ ˆR − eˆ0 = Δh
ˆ i − h(T ˆ = 0)] νi [h
i=1
der Verbindungen zu berechnen. Die molaren Bindungsenergien legen die Werte von ˆ , und μ relativ zu denen der Elemente fest. Die sechste Spalte enthält schließlich die eˆ, h molaren Wärmekapazitäten bei konstantem Druck. Die Angaben für ionisierte Stoffe beziehen sich auf wässerige Lösungen mit einer Konzentration von 1 mol/. Tabelle 7.2 enthält die thermochemischen Daten einer Reihe von organischen Verbindungen. Ob die Reaktionen wie erwartet ablaufen ist auch eine Frage der der Reaktionsraten ΣNi , die extrem unterschiedlich sein können. Das Verständnis der Reaktionsraten ist der Gegenstand der chemischen Kinetik.
21 Im Englischen werden diese als „enthalpies of formation“ bezeichnet.
7.7 Chemische Reaktionen
| 221
Tab. 7.1. Standardwerte der thermochemischen Größen verschiedener fester (f), flüssiger (fl) und gasförmiger (g) Stoffe sowie von Stoffen in wässiger Lösung (aq) [11; 12; 13; 14]. Stoff
◦ Δˆ gR [kJ/mol]
ˆ◦ Δh R [kJ/mol]
Ag (f) 0 0 Ag (g) 246.0 284.9 Ag+ (aq) 77.1 105.8 AgCl (f) −109.8 −127.0 Al (f) 0 0 Al (g) 330 Al3+ (aq) −485.0 −538 Al2 O3 (f) −1582.3 −1675 Br (g) 82.4 111.8 Br– (aq) −104.0 −121.4 Br2 (fl) 0 0 Br2 (g) 3.1 30.9 C (Graphit) 0 0 C (Diamant) 2.900 1.879 C (g) 671.20 716.7 CO (g) −137.2 −110.5 −394.4 −393.5 CO2 (g) CO2 (aq) −413.2 CO32– (aq) −527.8 −675.2 Ca (f) 0 0 Ca2+ (aq) −553.6 −542.8 CaO (f) −603.3 −634.9 Cl (g) 105.7 121.3 Cl– (aq) −131.2 −167.0 Cl2 (g) 0 0 Cs (f) 0 0 Cs (g) 76.5 Cs+ (aq) −258.0 Cu (f) 0 0 Cu (g) 337 Cu2+ (aq) 64.9 CuSO4 (f) −662.2 −771 F (g) 62.3 79.3 F– (aq) −278.8 −335.3 F2 (g) 0 0 H (g) 203.3 217.99 H+ (aq) 0 0 H2 (g) 0 0 H2 O (fl) −237.1 −285.83
sˆ◦ [J/(mol K)] 42.55 172.99 73.4 96.2 28.3 164.55 −325 50.9 175.01 82.5 152.2 245.46 5.74 2.378 158.10 197.7 213.78 119.3 −50.0 41.6 −56.2 38.1 165.19 56.6 223.08 85.2 175.60 132.1 33.1 166.39 −98 109.2 158.75 −13.8 202.79 114.71 0 130.68 69.9
ˆ ˆ ◦ − h(0) h [kJ/mol]
cˆ◦p [J/(mol K)]
5.74 6.197
25.4 20.8
12.03 4.54 6.919
50.8 24.4
10.01 6.197
79.0 20.8
24.52 9.725 1.05 0.536 6.536 8.671 9.365
75.7 36.0 8.52 6.12 20.8 29.1 37.1
5.73
25.9
6.75 6.272
42.0 21.8
9.181 7.71 6.197
33.9
5.00 6.197
24.4
16.8 6.518
98.5 22.7
8.825 6.197
31.3 20.8
8.468 13.27
28.8 75.3
222 | 7 Zusammengesetzte Systeme und Gleichgewichte
Stoff
◦ Δˆ gR [kJ/mol]
H2 O (g) −228.6 H2 S (g) 33.4 H2 S (aq) HBr (g) −53.4 HCl (g) −95.3 HF (g) −275.4 HJ (g) HCO3 (aq) HPO42– (aq) −1089 HSO4– (aq) H2 PO4– (aq) Hg (fl) 0 Hg (g) 31.8 J (g) 70.2 J– (aq) −51.6 J2 (f) 0 J2 (g) 19.3 K (f) 0 K (g) 60.5 K+ (aq) −283.3 Li (f) 0 Li (g) 126.6 Li+ (aq) −293.3 Mg (f) 0 Mg (g) 112.5 MgO (f) −569.3 N (g) 455.5 N2 (g) 0 NH3 (g) −16.5 NH4+ (aq) −79.3 NO3– (aq) −111.3 Na (f) 0 Na (g) 77.0 Na+ (aq) −261.9 O (g) 231.7 O2 (g) 0 OH– (aq) −157.20 P (weiß, f) 0 P (g) Pb (f) Pb (g) 195.2 Pb2+ (aq) −24.4
ˆ◦ Δh R [kJ/mol] −241.82 −20.6 −38 −36.3 −92.3 −273.3 26.5 −689.9 −1299 −887 −1302 0 61.38 106.76 −56.78 0 62.42 0 89.0 −252.1 0 159 −278.5 0 147.1 −601.6 472.6 0 −45.9 −133.2 −206.8 0 107.5 −240.34 249.2 0 −230.02 0 317 0 195.2 0.92
sˆ◦ [J/(mol K)] 188.84 205.8 126 198.70 186.90 173.78 206.59 98.4 −33.5 131 92 75.9 174.97 180.78 106.4 116.1 260.68 64.6 160.34 101.20 29.1 138.78 12.2 32.6 148.648 26.9 153.30 191.61 192.77 111.1 146.7 51.3 153.71 58.4 161.059 205.15 −10.9 41.1 163.2 64.8 175.37 18.5
ˆ ˆ ◦ − h(0) h [kJ/mol] 9.905 9.96
cˆ◦p [J/(mol K)] 33.6
8.648 8.640 8.599 8.657
9.34 6.197 6.197
28.0 20.8 20.8
13.19 10.11 7.08 6.197
54.4 36.9 29.6 20.8
4.63 6.197
24.8 20.8
4.99 6.197 5.16 6.197 8.670 10.043
24.9 20.8 37.2 20.8 29.1 35.1
6.46 6.197
28.2 20.8
6.725 8.680
21.9 29.4
5.36 6.197 6.87 6.197
23.8 20.8 20.8
| 223
7.7 Chemische Reaktionen
Stoff PbSO4 (f) Rb (f) Rb (g) Rb+ (aq) S (f) S (g) S2 (g) SO2 (g) SO42– (aq) Si (f) Si (g) SiO2 (f) Sn (f) Sn (g) Sn2+ (aq) SnO2 (f) Ti (f) Ti (g) TiCl4 (g) Zn (f) Zn (g) Zn2+ (aq) ZnO (f)
◦ Δˆ gR [kJ/mol]
−813.2 0
0
−300.1 −744.5 0 405.5 −856.3 0 266.2 −27.2 −515.8 0 428.4 −737.2 0 −147.1 −320.5
ˆ◦ Δh R [kJ/mol] −920.0 0 80.9 −251.1 0 277.1 128.6 −296.8 −909.3 0 450 −911 0 301 −8.9 −577.6 0 473 −763 0 130.4 −153.4 −350.4
Stoff Benzol Benzol Cyclohexan Ethan Ethanol Ethanol Ethen Ethin Kohlenstoffdisulfid Methan Methanol Methanol n-Pentan Phenol Propen Saccharose Tetrachlorkohlenstoff
sˆ◦ [J/(mol K)]
C6 H6 (g) C6 H6 (fl) C6 H12 (fl) C2 H6 (g) C2 H6 O (g) C2 H6 O (fl) C2 H4 (g) C2 H2 (g) CS2 (g) CH4 (g) CH4 O (g) CH4 O (fl) C5 H12 (g) C6 H6 O (f) C3 H8 (g) C12 H22 O11 (f) CCl4 (g) CCl4 (fl)
ˆ ˆ ◦ − h(0) h [kJ/mol]
148.5 76.7 170.094 121.7 32.05 167.829 228.16 248.22 18.5 18.8 167.98 41.4 51.1 168.49 −16.7 49.0 30.7 180.29 353 41.6 160.99 −109.8 43.6
cˆ◦p [J/(mol K)]
20.05 7.49 6.197 4.41 6.657 9.132 10.549
22.6
39.9
3.217 7.550 6.91 6.32 6.215
20.00 22.3 44.4 27.0 21.3
8.38 4.824 7.539 21.5 5.65 6.197
52.6 25.0 24.4 145.2 25.4
6.93
40.3
◦ Δˆ gR [kJ/mol]
ˆ◦ Δh R [kJ/mol]
sˆ◦ [J/(mol K)]
cˆ◦p [J/(mol K)]
129.7 124.5 26.8 −32.0 −167.9 −174.8 68.4 209.2 66.8
82.9 49.1 −156.4 −84.0 −234.8 −277.6 52.4 227.4 116.9
269.2 173.4 204.5 229.2 281.6 160.7 219.3 200.9 238.0
82.4 136.0 154.9 52.5 65.6 112.3 42.9 44 45.7
−50.5 −162.3 −166.6 −8.2 −50.2 −23.4 −1544.6 −58.2 −62.5
−74.6 −201.0 −239.2 −146.9 −165.1 −103.8 −2226.1 −95.7 −128.2
186.3 239.9 126.8 349.1 144.0 270.3 360.2 309.7 214.4
35.7 44.1 81.1 120.1 127.4 73.6 424.3 83.4 133.9
224 | 7 Zusammengesetzte Systeme und Gleichgewichte 7.7.3 Die Absolutwerte des chemischen Potenzials Die Berechnung der Gleichgewichtskonstanten K(T, p) im Massenwirkungsgesetz (Gl. 7.26) erfordert konkrete Werte für die chemischen Potenziale der Reaktionspartner. Damit stellt sich die Frage nach den Absolutwerten des chemischen Potenzials. Für Gase ohne innere Freiheitsgrade haben wir diese Absolutwerte über die Konstanten eˆ0 und jtrans (Gl. 6.6) in Gl. 6.15 bereits in der Hand. Zur Fixierung des Absolutwerts genügt ein einziger Wert, zum Beispiel der Standardwert bei T = 298.15 K und p = 1013 mbar. Weitere Werte können, wie im vorangegangenen Abschnitt besprochen, aus Messungen der Wärmekapazitäten und Integration der Gibbs-HelmholtzGleichung gewonnen werden. Messdaten für die Entropie, die Enthalpie, das chemische Potenzial und andere Materialgrößen werden seit vielen Jahren über weite Druckund Temperaturbereiche gesammelt und tabelliert und haben zu einem immensen quantitativen Wissen über die thermodynamischen Eigenschaften der verschiedensten Substanzen geführt. Zum Teil sind diese Daten auch über Internet-Datenbanken abrufbar [13]. Obwohl die Absolutwerte der chemischen Potenziale im Prinzip eindeutig festgelegt sind, ist es zumindest in der Chemie praktischer, die Berechnungen der freien Reaktionsenthalpien und der Gleichgewichtskonstanten mittels bestimmter Konventionen zu vereinfachen. Um dies einzusehen, stellen wir zunächst fest, dass der Absolutwert einer intensiven Größe ξ schwer zu messen ist, wenn die konjugierte extensive Größe X einem Erhaltungssatz genügt. Wenn wir annehmen, dass für E und X zumindest DifferenzMessverfahren existieren, so ist es grundsätzlich möglich, den Absolutwert ξ1 von ξ für ein gegebenes System mit Hilfe der Gibbs’schen Fundamentalform zu bestimmen: ξ1 (X) =
ΔE . ΔX
Wenn die Größe X aber eine Erhaltungsgröße ist, so bedeutet dies, dass der Betrag ΔX einem anderen physikalischen System entnommen werden muss. Für diese Entnahme ist aber ebenfalls ein gewisser Energiebetrag zu aufzubringen, der durch den Wert ξ2 von ξ in dieser Quelle bestimmt ist. Nur die Energiedifferenz ΔE = ξ1 − ξ2 ) ΔX
ist (beispielsweise mit Hilfe eines dem Carnot-Prozess analogen Verfahren) experimentell zugänglich.22 Daher ist bei Prozessen, bei denen die Größe X erhalten ist, in
22 Dennoch existiert eine prinzipielle Möglichkeit, die Absolutwerte von ξ zu messen, indem die Einstein’sche Äquivalenz von Energie und Masse ausgenutzt wird: Dazu muss der dem System 1 gemeinsam mit dem X-Betrag ΔX entnommene Energiebetrag ξ1 ΔX durch eine präzise Bestimmung der damit verbundenen Massenänderung ΔM = ξ1 ΔX/c2 ermittelt werden. Praktisch ist der auftretende Massendefekt wegen des großen Faktors c2 in der Einstein’schen Relation E = M c2 nur bei sehr großen Energieänderungen, zum Beispiel bei Kernreaktionen, zu bestimmen.
7.7 Chemische Reaktionen
| 225
der Regel auch nur die ξ -Differenz ξ2 − ξ1 experimentell bestimmbar und der Nullpunkt der zu X konjugierten Größe ξ kann willkürlich festgelegt werden. Beispiele für diese Eigenschaft liefern etwa die konjugierten Größenpaare {P , v} oder {Q, φQ }. Die Nullpunkte der Geschwindigkeit und des elektrischen Potenzials sind frei wählbar. Dies spiegelt auch die als Galilei-Invarianz23 bekannte Freiheit bei der Wahl des Nullpunkts für die Geschwindigkeit wider. Die Variablenpaare S, T und V, −p sind dagegen Beispiele dafür, dass die Möglichkeit der Entropie-Erzeugung und die Nicht-Erhaltung des Volumens ausgenutzt werden können, um die Absolutwerte von Temperatur und Druck experimentell zu bestimmen (siehe Abschnitt 5.3). Wo steht nun das Variablenpaar {μ, N } in dieser Systematik? Die Antwort auf diese Frage hängt interessanterweise davon ab, ob wir Chemie oder Teilchenphysik betreiben. Jeder Versuch, das chemische Potenzial eines Stoffes durch Messung des Energieaufwands für die Extraktion aus einer gegebenen Phase oder chemischen Verbindung zu bestimmen, impliziert die Notwendigkeit, diese Atome in eine andere Phase oder Verbindung einzubringen. Damit kann das chemische Potenzial dieses Stoffes immer nur relativ zu denen der anderen Phase oder Verbindung bestimmt werden. Definieren wir die „Chemie“ etwas willkürlich als alle diejenigen Prozesse, welche die Teilchenzahlen der chemischen Elemente24 invariant lassen, so ist nach den obigen Überlegungen der Nullpunkt des chemischen Potenzials für jeweils einen frei wählbaren Aggregatzustand jedes Elements unabhängig festsetzbar! Entsprechend besteht im Bereich der Chemie die folgende Konvention:
Das chemische Potenzial der unter Standardbedingungen stabilsten Modifikation jedes Elements wird gleich Null gesetzt. Die Standard-Werte der chemischen Potenziale in Tabelle 7.1 spiegelt diese Konvention wider. Dagegen können die Differenzen der chemischen Potenziale der aus den Elementen hervorgehenden Verbindungen oder zwischen verschiedenen Phasen desselben Elements aus den thermochemischen Daten bestimmt werden, wenn der Nullpunkt der Entropie festgelegt ist (diese Bedingung wird im nachfolgenden Abschnitt diskutiert). Die Teilchenphysik (und teilweise auch die Physik der kondensierten Materie) zeichnet sich insbesondere dadurch aus, dass die Elemente in andere Elemente oder andere „Elementarteilchen“ zerfallen oder aus diesen synthetisiert werden können. In diesem Bereich der Kern- und Teilchenreaktionen ist es nicht nur möglich und
23 Eine vollständige Beschreibung muss natürlich die Relativitätstheorie einbeziehen . . . 24 Noch genauer – wir müssen eine Erhaltung der Teilchenzahl für jedes Isotop der chemischen Elemente einzeln fordern, also radioaktive Zerfälle und andere Umwandlungen der Elemente ausschließen.
226 | 7 Zusammengesetzte Systeme und Gleichgewichte notwendig, die chemischen Potenziale der Elemente zueinander in Beziehung zu setzen, sondern es ist auch nötig, die Ruhenergie eˆ0 = mc ˆ 2 im chemischen Potenzial zu berücksichtigen, die bei der Erzeugung eines Teilchen zusätzlich zu dem Beitrag eventueller Bindung an seine Umgebung aufzubringen und bei seiner Vernichtung abzuführen ist. Dieser Beitrag dominiert gewöhnlich (mit Ausnahme der sogenannten „masselosen“ Teilchen wie Photonen und Phononen) alle anderen Beiträge, so dass die Absolutwerte der chemischen Potenziale grundsätzlich als positiv anzusehen sind.
7.8 Der dritte Hauptsatz in der physikalischen Chemie Der dritte Hauptsatz der Thermodynamik, den wir bereits in Abschnitt 2.5 eingeführt haben, wurde zuerst von dem Physiko-Chemiker Nernst in Zusammenhang mit der quantitativen Beschreibung chemischer Gleichgewichte formuliert [15]. Dieser beschäftigte sich mit dem Problem der experimentellen Bestimmung der freien Reaktionsenthalpien, um gemäß Gl. 7.26 Voraussagen über die Lage der chemischen Gleichgewichte machen zu können. Nach Gl. 7.27 ist die Gleichgewichtskonstante durch die molare freie Reaktionsenthalpie durch . / K(T, p) = exp −
Δˆ gR (T, p) kB T
gegeben. Wegen der Homogenitätsrelation Gl. 5.31 sind die Absolutwerte ˆ − T sˆ . μ = eˆ − T sˆ + pˆ v=h
der chemischen Potenziale in Δˆ gR mit den Absolutwerte von eˆ und mit denen der molaren Entropie sˆ verknüpft. Nullpunktsverschiebungen der Energie bewirken nur Verschiebungen der chemischen Potentiale, während Nullpunktsverschiebungen der Entropien auch die Temperaturabhängigkeit der μiR (T, p), und damit die Lage des chemischen Gleichgewichts beeinflussen. Nernst erkannte, dass eindeutige Aussagen über die Lage chemischer Gleichgewichte nur dann möglich sind, wenn die Werte der Entropien der verschiedenen miteinander reagierenden Stoffe relativ zueinander ebenso festgelegt sind, wie dies für deren Energien und Enthalpien gilt. Zu dieser Zeit war die Bedeutung des Absolutwerts der Entropie allerdings noch im Dunkeln, vor allem weil die molare Entropie von Gasen nach Gl. 6.3 im Grenzfall T → 0 (bei konstanter Teilchendichte) divergiert. Aus diesem Grund wurden nur Entropie-Differenzen als physikalisch sinnvoll angesehen. Um die Gleichgewichtskonstanten K(T, p) und damit die Lage des Gleichgewichts einer chemischen Reaktion vorhersagen zu können ist es wünschenswert die freie Reaktionsenthalpie Δˆ gR aus anderen messbaren Eigenschaften der Reaktionspartner zu bestimmen. Diese messbaren Eigenschaften sind die molaren Wärmekapazitäten ˆ R (T, p) ˆ ◦ (T, p). Ist der Verlauf von Δh und die Standardwerte der molaren Enthalpien h i
7.8 Der dritte Hauptsatz in der physikalischen Chemie | 227
gR (T, p) durch die Integration der für einen bestimmten Druck p bekannt, so kann Δˆ Gibbs-Helmholtz-Gleichung (Gl. 7.30) bezüglich T bestimmt werden. Dazu müssen ˆ i der einzelnen Reaktionspartner als Funktion der Tempedie molaren Enthalpien h ratur bestimmt werden, indem die molaren Wärmekapazitäten cˆp,i (T ) zu möglichst tiefen Temperaturen hin gemessen, und dann gemäß
T ˆ i (T ) = h
cˆp,i (T ) dT
0
integriert werden.25 Durch nochmalige Integration erhält man aus Gl. 7.30 ˆ Δˆ gR = −T
ΔhR (T, p) dT + T · C(p) , T2
(7.31)
wobei C(p) eine vom Druck abhängige Integrationskonstante ist. Experimentell zeigt ˆ R wegen der starken Abnahme der Wärmekapazitäten bei Annäherung sich, dass Δh an den absoluten Nullpunkt stets konstant wird, also eine horizontale Tangente aufweist. Um den Wert von Δˆ gR eindeutig festlegen zu können, postulierte Nernst 1906, ˆ dass ΔhR und Δˆ gR am absoluten Nullpunkt nicht nur denselben Wert, sondern auch dieselbe horizontale Tangente besitzen sollten und daher die Konstante C(p) ≡ 0 sein muss. Diese Aussage ist zusammen mit Gl. 7.31 identisch mit der Feststellung, dass die molare Reaktionsentropie Δˆ sR =
ˆR Δˆ gR − Δh T
am absoluten Nullpunkt verschwindet! Die übliche Formulierung des 3. Hauptsatzes, dass nämlich für jede Substanz sˆ(T → 0) = 0 ist, geht auf Planck zurück, der weitergehend feststellte, dass nicht nur die Summe Δˆ sR (T = 0, p) =
r
νi sˆ(T = 0, p)
i=1
verschwinden muss, sondern dass außerdem auch einzelnen Summanden, das heißt die Absolutwerte sˆi der Entropien der einzelnen Reaktionspartner, am absoluten Nullpunkt gleich Null gesetzt werden können, weil diese aus den thermochemischen Daten experimentell nicht zu bestimmen und daher willkürlich seien. Im zweiten Teil des Buches werden wir sehen, dass diese weitergehende Annahme auch im Rahmen der statistischen Thermodynamik begründet werden kann. Die experimentelle Rechtfertigung des Nernst’schen Postulates besteht jetzt darin, dass der auf dieser Basis durch Integration von ΔHR /T 2 erhaltene Verlauf von
25 Dabei hilft die Tatsache, dass die Wärmekapazitäten bei Annäherung an den absoluten Nullpunkt klein werden und der Fehler aufgrund der notwendigen Extrapolation von der tiefsten erreichbaren Messtemperatur zu T = 0 ebenfalls klein ist.
228 | 7 Zusammengesetzte Systeme und Gleichgewichte 16
ΔH
ΔG, ΔH (J)
12 8
ÜbergangsPunkt
4
ΔG
0 0
100
200 T (K)
300
400
Abb. 7.12. Gemessene Reaktionsenthalpie ΔH und daraus durch Integration (Gl. 7.31) bestimmte Differenz der Gibbs’schen freien Enthalpien ΔG von 1 g rhombischem und monoklinem Schwefel als Funktion der Temperatur [15; 16]. Der Übergang von einer Kristallstruktur zur anderen wird am Nulldurchgang von ΔG bei 369.6 K erwartet, was sehr gut mit dem direkt gemessenen Wert von 368.4 K übereinstimmt (nach [16]).
ΔGR die Nullstellen der Affinität A der Reaktion, und damit die Lage chemischer
Gleichgewichte einschließlich der in Kapitel 9 zu besprechenden Phasenübergänge, für eine große Zahl von Beispielen korrekt vorhersagt. Während bei Gasreaktionen die Molenbrüche aller Reaktionspartner im Allgemeinen sämtlich von Null verschieden sind und sich bei Variation von T und p stetig verschieben, zeichnen sich die im übernächsten Kapitel besprochenen Phasenübergänge dadurch aus, dass der betrachtete Stoff bei Überschreiten der Übergangstemperatur auch unstetig von einer Modifikation in eine andere übergehen kann. In diesem Fall ist das chemische Potenzial der einen Modifikation vom Molenbruch der anderen unabhängig, sodass die Affinität A mit der freien Reaktionsenthalpie Δˆ gR identisch wird, und der Übergangspunkt durch die Bedingung Δˆ gR = 0 bestimmt wird. In Abb. 7.12 ist dies am Beispiel eines strukturellen Phasenübergangs, nämlich der Umwandlung von der rhombischen in die monokline Modifikation von festem Schwefel, illustriert. Zunächst wurde die Wärmekapazität von rhombischem Schwefel von 15 K bis zum Übergangspunkt bei etwa 370 K gemessen. Danach wurde die Probe für 24 h auf ca. 373 K aufgeheizt, um eine möglichst vollständige Umwandlung in monoklinen Schwefel zu erreichen. Nach einer schnellen Abkühlung auf 60 K wurde dann die Wärmekapazität des monoklinen Schwefels gemessen. Weil dieser strukturelle Phasenübergang wegen der tiefen Temperaturen nur sehr langsam abläuft, konnte die monokline Kristallstruktur so auch bei Temperaturen unterhalb des Übergangspunkts vermessen und die Differenz der Wärmekapazitäten bestimmt werden. Diese war dann der Ausgangspunkt für die Berechnung der in Abb. 7.12 gezeigten Daten. Die Aussage über das Verschwinden der Entropie am absoluten Nullpunkt erlaubt also Aussagen über den Ablauf von Phasenumwandlungen und chemischen Reaktionen bei viel höheren Temperaturen! Dieser überraschende Zusammenhang geht auf die Bestimmung der relativen chemischen Potenziale der beteiligten Stoffe zurück, welche ihrerseits auf der korrekten Festlegung der Werte der Entropie beruht. Ein historische bedeutendes Beispiel für die Anwendung dieser Zusammenhänge ist das
7.8 Der dritte Hauptsatz in der physikalischen Chemie | 229
die Vorhersage der Lage des Ammoniak-Gleichgewichts und die darauf beruhende Ammoniak-Synthese, die wenige Jahre später (1913) gelang. Unser Zugang zur Thermodynamik hat uns schon in Abschnitt 2.3 gezeigt, dass das Nernst’sche Postulat bereits von Anfang an in die Konstruktion der Thermodynamik mit eingebaut werden kann. Allein der ätherische Charakter des Entropiebegriffs in der traditionellen Darstellungsweise verschleiert die plausible Tatsache, dass der Entropieinhalt jedes endlichen physikalischen Systems endlich ist und sich bei hinreichender Abkühlung schließlich dem Wert Null annähern muss.
Übungsaufgaben 7.1. Legendre-Transformation am Beispiel Kondensator Wir betrachten zwei parallel geschaltete Kondensatoren mit den Kapazitäten C0 und C , wobei C0 C . Die Gesamtladung Qges = Q0 + Q des Systems soll konstant sein. a) Wie lautet die für die unabhängigen Variablen{U0 , U } zuständige MassieuGibbs-Funktion L(U0 , U ) des Gesamtsystems? b) Schreiben Sie nun die Gesamtenergie des Systems mit den beiden Kapazitäten C und C0 – bei konstanter Gesamtladung Qges – auf und bestimmen Sie die Gleichgewichtsladung Q auf der Kapazität C durch Minimieren der Gesamtenergie. c) Schreiben Sie nunmehr die Gesamtenergie als Funktion von Q und vergleichen Sie die Größe der auftretenden Terme. Vernachlässigen Sie den kleinsten Beitrag. d) Begründen Sie, weshalb man den großen Kondensator mit der Kapazität C0 praktisch als Ladungsreservoir mit U = const. betrachten kann. Vergleichen Sie das Resultat mit dem Ergebnis von Teilaufgabe a) und interpretieren Sie die einzelnen Beiträge zur Massieu-Gibbs-Funktion des Systems. e) Geben Sie die aus den Massieu-Gibbs-Funktionen E(Q0 , Q) und L(U0 , U ) folgenden Maxwell-Relationen an. 7.2. Isentropes und isothermes Druckgleichgewicht Gegeben sei ein einatomiges (κ = 3/2) ideales Gas, welches anfänglich bei ein Druckverhältnis von p1 /p2 = 2 in zwei gleiche Teilvolumina V1 = V2 = V /2 eingeschlossen ist. Ein beweglicher Kolben erlaubt die Einstellung eines Druckgleichgewichts zwischen beiden Teilvolumina bei konstantem Gesamtvolumen V . a) Berechnen Sie zunächst das Gleichgewichts-Volumen V1G bei thermischer Isolation der Teilvolumina (S1 , S2 = const.) sowie bei thermischem Kontakt mit einem Wärmereservoir mit der Temperatur T0 = T1 = T2 = const..
230 | 7 Zusammengesetzte Systeme und Gleichgewichte
b) Berechnen Sie die Gesamtenergie des Systems E(S, V, V1 , N ) = E1 (S1 , V1 , N1 , ) + E2 (S2 , V − V1 , N2 )
mit S = S1 + S2 und N = N1 + N2 nach Gl. 6.23. Vergewissern Sie sich mit Hilfe dieses Ausdrucks, dass das Minimum von E(S, V1 , V, N ) tatsächlich bei dem in (a) berechneten Wert von V1G liegt. c) Berechnen Sie für isentrope Verschiebungen die Temperaturen in den beiden Teilvolumina als Funktion von V1 unter der Annahme, dass im Anfangszustand V1 = V2 ist und thermisches Gleichgewicht bei der Temperatur T0 vorliegt. d) Zeigen Sie, dass die freie Energie des einzelnen Gases für eine feste Temperatur T0 die folgende Form annimmt: S0 V F (T0 , V, N ) = E − T0 S = N kB T0 κ − , − ln (N kB )
Vb
wobei S0 = S(T0 , Vb , N ) und Vb ein beliebiges Bezugsvolumen sind. Bestimmen sie die gesamte freie Energie des Systems F (T0 , V, V1 , N ) = F1 (T0 , V1 , N1 , ) + F2 (T0 , V − V1 , N2 )
und berechnen Sie daraus ebenfalls die Lage des Druckgleichgewichts. Hinweis: Die Werte von S0 , T0 und Vb werden an keiner Stelle benötigt, wenn man sich auf die Berechnung von geeignet normierten F -Differenzen beschränkt. Das Ergebnis dieser Aufgabe ist in Abb. 7.4 graphisch dargestellt. 7.3. Mischungsentropie und osmotischer Druck Betrachten Sie zwei Gasvolumina V1 und V2 , die durch ein Schiebeventil und eine entlang der Kolbenachse bewegliche Membran voneinander getrennt sind. Die Teilvolumina seien mit zwei verschiedenen Gasen, N2 und He, gefüllt. Die Membran ist für He durchlässig. Im Anfangzustand (A) liegen die Werte pA = 1013 mbar, T = 300 K und V1 = 0.2 , V2 = 0.8 vor. Die Temperatur wird durch den Kontakt mit einem Wärmebad konstant gehalten. Nun werden die beiden Gase in zwei Teilschritten entspannt: 1.
Membran
V1
N2 Schieber
V2
He
$QIDQJVí Zustand (A)
1. 3UR]HVVí6FKULWW
=ZLVFKHQí Zustand (Z) 2. 3UR]HVVí6FKULWW
(QGí Zustand (E)
Wird der Schieber in einem ersten Prozess-Schritt herausgezogen, so diffundiert das He durch die (zunächst festgehaltene) Membran in das andere Teilvolumen, bis der Partialdruck pHe (und damit auch das chemische Potential μHe ) in beiden Teilvolumina gleich pZ ist.
7.8 Der dritte Hauptsatz in der physikalischen Chemie | 231
2.
Wird dann im zweiten Prozess-Schritt die Membran losgelassen, so wird sie durch den Partialdruck pN2 von Stickstoff (d.h. durch den osmotischen Druck) reibungsfrei nach rechts verschoben.
Am Ende liegt eine homogene Mischung der beiden Gase vor, in der sowohl die Partialdrucke pE , als auch die chemischen Potenziale beider Gase in beiden Teilvolumina gleich sind. a) Wie groß sind die Stoffmengen NN2 und NHe und welcher Gesamtdruck liegt in beiden Teilvolumina vor, wenn sich das System im Zwischenzustand (Z) befindet? b) Wieviel Entropie wird durch die Diffusion von Helium in das Teilvolumen V1 erzeugt und wie groß ist die Änderung ΔFA→Z der freien Energie der Mischung? Entspricht die Änderung der freien Energie geleisteter oder vergeudeter Arbeit? c) Berechnen Sie, wieviel Arbeit im zweiten Prozess-Schritt durch die Verschiebung der semipermeablen Membran, d.h. durch eine isotherme Expansion des Gases A, maximal gewonnen werden kann. Wie groß ist die entsprechende Änderung ΔFZ→E der freien Energie? Vergleichen Sie das Ergebnis mit dem für den ersten Prozess-Schritt (Teilaufgabe b) ) resultierenden Wert von ΔFA→Z . Woher stammt die für den zweiten Prozess-Schritt benötigte Mischungsentropie? Wie könnte eine vollständig reversible Vermischung der beiden Gase realisiert werden? 7.4. Massenwirkungsgesetz bei konstantem Volumen Leiten Sie eine Variante des Massenwirkungsgesetzes für die Reaktionen von Gasgemischen bei konstantem Volumen ab. Wie lautet die Gleichgewichtskonstante, wenn auf der linken Seite des Massenwirkungsgesetzes die Teilchendichten ni statt der Molenbrüche stehen?
7.5. Dissoziation von Wasser Der pH-Wert stellt ein Maß für den Säuregrad, das heißt die Konzentration von H+ - (beziehungsweise H3 O+ -)Ionen in wässerigen Lösungen dar, und ist durch pH := − log10 nH+ definiert. a) Überzeugen Sie sich mit Hilfe der Werte in Tabelle 7.1, dass die freie Reaktionsenthalpie für die Dissoziation von Wasser + − −− H2 O − − H + OH ◦ den Standardwert Δˆ gR = 79.9 kJ/mol hat. b) Begründen Sie, warum der pH-Wert von reinem Wasser den Wert 7 hat. Berechnen Sie dazu die Dichten n von H+ und OH− -Ionen in reinem Wasser bei 300 K.
232 | 7 Zusammengesetzte Systeme und Gleichgewichte
7.6. Erfinder Ein Erfinder behauptet, sein neuer Motor gibt pro mit Luft verbranntem Kilogramm Methanol eine Nutzleistung von 20 MJ über eine Welle ab. a) Stellen Sie die Reaktionsgleichung auf und überprüfen Sie die Energiebilanz der Reaktion, indem Sie die freie Reaktionsenthalpie Δˆ gR =
νi μiR
i
als Funktion der chemischen Potenziale der beteiligten Stoffe berechnen. Ist die Behauptung des Erfinders korrekt? Welche Bedingung muss Δˆ gR erfüllen, damit die Reaktion Energie freisetzt? Hinweis: Die molare Masse von Methanol beträgt m ˆ Methanol = 32 g/mol. b) Angenommen, es handelt sich um eine Carnot-Maschine, die zwischen zwei Wärmereservoirs mit den Temperaturen Ta und Tb arbeitet, wobei Ta = 300 K. Wie groß müßte Tb sein? Substanz
μ (kJ/mol)
Kohlendioxid CO2 (g) Methanol CH3 OH (fl) Sauerstoff O2 (g) Wasser (g)
-394 -166 0 -229
7.7. Verbrennung a) Wieviel Energie wird bei der „Verbrennung“ von 1 kg Schokolade frei und wieviel Entropie wird dabei erzeugt (wenn der Prozess bei Zimmertemperatur stattfindet)? Rechnen Sie mit Zucker (Sacharode), einem der Hauptbestandteile von Schokolade: C12 H22 O11 + 12 O2 −→ 12CO2 + 11 H2 O . b) Eine Lokomotive wiegt ca. 80 Tonnen. Auf welche Geschwindigkeit (in km/h) kann man eine anfänglich stehende Lokomotive mit der vorstehenden Energiemenge beschleunigen, wenn alle Verluste vernachlässigt werden? c) Wieviel Entropie wird beim Verrosten von 1 kg Eisen erzeugt? Substanz Eisen (f) Eisenoxid Fe2 O3 (f) Kohlendioxid CO2 (g) Oktan (fl) Sauerstoff O2 (g) Wasser (fl) Zucker C12 H22 O11 (f)
μ (kJ/mol) 0 -742 -394 6.41 0 -237 -1544
7.8 Der dritte Hauptsatz in der physikalischen Chemie | 233
7.8. Diamant-Synthese aus Graphit Das chemische Potenzial μA eines Stoffes A charakterisiert – pointiert gesagt – die Tendenz dieses Stoffes zu verschwinden (ggf. begleitet vom Entstehen anderer Stoffe B, C, . . . ). Es leuchtet ein, dass der Wert von μ von Zustandsgrößen wie dem Druck p und der Temperatur T abhängt. In linearer Näherung gilt somit μ(T, p0 ) = μ(T0 , p0 ) + α · (T − T0 ) μ(T0 , p) = μ(T0 , p0 ) + β · (p − p0 ) .
Die chemischen Potentiale sowie die Temperatur- und Druckkoeffizienten für die Modifikationen des Kohlenstoffs lauten (für Normalbedingungen):
μGraphit αGraphit βGraphit
= = =
0 −0.0057 kJ/(mol · K) 0, 541 kJ/(mol · kbar)
μDiamant αDiamant βDiamant
= = =
2.9 kJ/mol −0, 0024 kJ/(mol · K) 0.342 kJ/(mol · kbar)
a) Welche Modifikation ist unter Normalbedingungen häufiger anzutreffen? b) Skizzieren Sie qualitativ die Temperatur- beziehungsweise Druckabhängigkeit der chemischen Potenziale von Graphit und Diamant. c) Ist es möglich, Diamant aus Graphit herzustellen – und wenn ja, wie? 7.9. Wässrige Lösung von CO2 In einer ungeöffneten Sprudelflasche herrscht bei 25◦ C ein Druck von p = 1.5 bar (der Dampfdruck des Wassers pD ∼ 4 mbar bei 25◦ C ist gegen den CO2 Partialdruck vernachlässigbar). Berechnen Sie das chemische Potenzial und die Konzentration des im Wasser gelösten CO2 im Diffusionsgleichgewicht, unter der Annahme dass die Lösung ideal ist. Beachten Sie dabei die Druck, bzw. Konzentrationsabhängigkeit von μCO2 in der Lösung und in der Gasphase. Vernachlässigen Sie Volumenänderungen der flüssigen Phase durch die Lösung von CO2 . Hinweis: ◦ μGas CO2 = −394.36 kJ/mol bei T = 25 C und p0 = 1 bar Lsg μCO2 = −386.00 kJ/mol bei T = 25◦ C, p0 = 1 bar und nCO2 = 1 mol/
8 Transportphänomene Die Einstellung eines Gleichgewichts zwischen Systemen ist in der Regel mit dem Transport physikalischer Größen von einem Teilsystem in ein anderes verbunden. Die Untersuchung von Transport-Phänomenen stellt daher neben dem Studium der Gleichgewichtszustände eine wichtige Klasse von Experimenten zur Erforschung komplexer Systeme dar. In diesem Kapitel wollen wir die Transporteigenschaften von verdünnten Gasen darstellen. Dazu nehmen wir an, dass sich das Gas in einem Nichtgleichgewichtszustand mit einer langsamen räumlichen Variation der intensiven Größen ξ und der Dichten x der thermodynamisch konjugierten mengenartigen Größen X befindet. Die Herstellung des Gleichgewichtszustands wird durch den Transport der Größen X erfolgen, der im Allgemeinen von den Gebieten mit der höheren X -Dichte in die mit der niedrigeren X -Dichte verläuft. Die treibenden (verallgemeinerten) Kräfte für den Transportprozess sind die mit den Dichte-Gradienten verknüpften Gradienten der intensiven Größen ξ . Auf dieser Basis werden wir viel verwendete Relationen für die in Abschnitt 2.6 eingeführten Transport-Koeffizienten gewinnen. Es zeigt sich, dass die Transportkoeffizienten der verschiedenen mengenartigen Größen in diesem Rahmen durch die thermodynamischen Suszeptibilitäten des Systems sowie einen einzigen neuen Parameter – die Diffusionskonstante – kontrolliert werden.1 Die Ergebnisse werden unter minimalen Voraussetzungen abgeleitet und gelten nicht nur für die in diesem Abschnitt betrachteten idealen Gase, sondern lassen sich auch auf die später zu besprechenden Quantengase übertragen. Sie beschreiben daher auch einen wichtigen Teil der Transporteigenschaften von Festkörpern und Quanten-Flüssigkeiten.
8.1 Transport durch bewegliche Teilchen Nach der kinetischen Theorie können Gase oder andere makroskopische fluide Systeme in mikroskopische Teilsysteme zerlegt werden, die untereinander im Gleichgewicht stehen. Wie bei anderen zusammengesetzten Systemen kann man sagen, dass sich das makroskopische System in diesem Fall im „inneren“ Gleichgewicht befindet. Eine Möglichkeit, dieses Gleichgewicht zu stören, ist es, räumliche Gradienten der intensiven Größen oder der Dichten der mengenartigen Größen zu erzeugen, die dann zu entsprechenden Strömen der mengenartigen Größen Anlass geben. Entscheidend für die Ableitung der Transportkoeffizienten ist die Annahme, dass das Gas eine innere Längenskala Λ aufweist, unterhalb derer sich kein inneres Gleich-
1 In der Halbleiterphysik ist dieser Zugang als das Drift-Diffusions-Modell bekannt.
8.1 Transport durch bewegliche Teilchen |
235
L1
L2
(a)
(b)
Abb. 8.1. Berechnung der Diffusionskonstanten. a) Modellhafte Zerlegung des Gasvolumens in Teilvolumina der Größe L31 im inneren Gleichgewicht (T, n =const.), getrennt durch Bereiche der Breite L2 , in denen T und n variieren. b) Im Grenzfall L1 → 0, L2 → Λ entsteht die feinste physikalisch sinnvolle Zerlegung in Bereiche der Größe Λ3 . Bei einer Zunahme der Teilchendichte von oben nach unten und gleicher mittlerer Geschwindigkeit |v| driften mehr Teilchen von unten nach oben als von oben nach unten und bewirken einen resultierenden N -Strom von unten nach oben.
gewicht einstellen kann. Dieser Annahme liegt die Vorstellung zu Grunde, dass die Einstellung eines lokalen Gleichgewichts eines Relaxationsmechanismus bedarf, dessen Effektivität im Rahmen des kinetischen Modells (Abschnitt 3.4) durch die charakteristische Längenskala Λ quantifiziert wird. Modellhaft nehmen wir zunächst an, dass wir das Gasvolumen in Teilvolumina der Größe L31 im inneren Gleichgewicht (T, n =const.) zerlegen können, die durch Bereiche der Breite L2 , getrennt sind, in denen T und n variieren (Abb. 8.1a). Die feinst-mögliche, physikalisch sinnvolle Zerlegung entsteht im Grenzfall L1 → 0, L2 → Λ: In diesem Fall wird das Gasvolumen in Bereiche der Größe Λ3 unterteilt. Die Größe Λ wird die mittlere freie Weglänge genannt und gibt die mittlere Wegstrecke an, die ein Atom oder Molekül zurücklegt, ohne an Seinesgleichen oder an anderen Streupartnern gestreut zu werden. Entsprechend ist die Relaxationszeit τ die mittlere Flugzeit zwischen zwei Stößen. Der Zusammenhang zwischen Λ und τ ist durch die mittlere Geschwindigkeit |v| der Teilchen zwischen den Stößen gegeben: Λ = |v| · τ .
(8.1)
Zunächst betrachten wir den Transport von Teilchen in Abwesenheit von äußeren Kraftfeldern. Zerlegen wir das Gasvolumen entsprechend Abb. 8.1b in Teilvolumina der Größe Λ3 , so ist der Betrag der Teilchenstromdichte j N , mit der Teilchen von einem herausgegriffenen Teilvolumen in die sechs benachbarten Volumenelemente strömen, durch |j N | =
1 n · |v| 6
236 | 8 Transportphänomene gegeben, wobei n die Teilchendichte ist. Der Vorfaktor 1/6 kommt daher, dass die Stromdichte durch die sechs das betrachtete Teilvolumen V0 begrenzenden Flächen gleich sein muss, wenn die Verteilung der Geschwindigkeiten isotrop ist.2 Jetzt nehmen wir an, dass in dem Gas ein Gradient der Teilchendichte, beispielsweise in z Richtung, vorliegt. Dann setzt sich die z -Komponente der Teilchenstromdichte j N (z0 ) durch eine bei z = z0 senkrecht auf der z -Achse stehenden Ebene aus den folgenden vier Beiträgen zusammen: 1 (+) jN (z0 ) = + n(z0 ) · |v| , 6 1 (−) jN (z0 ) = − n(z0 ) · |v| , 6 1 (+) jN (z0 − Λ) = + n(z0 − Λ) · |v| , 6 1 (−) jN (z0 + Λ) = − n(z0 + Λ) · |v| . 6
Die ersten beiden Beiträge beschreiben die aus dem Volumenelement V0 bei z0 herausströmenden Teilchen, während die anderen beiden Beiträge von den NachbarVolumina bei z0 ± Λ in das betrachtete Teilvolumen V0 hineinströmen. Als Summe dieser Beiträge ergibt sich ∂n(z) 1 |j N (z)| = − |v| Λ · . 3 ∂z
(8.2)
Das Minus-Zeichen bedeutet, dass der Transport (normalerweise) in Richtung niedrigerer Teilchendichten erfolgt und damit bestehende Dichte-Unterschiede ausgleicht. Für eine beliebige Orientierung des n-Gradienten gilt: j N (r) = −D · grad n(r) .
(8.3)
Gleichung 8.3 gilt in Abwesenheit äußerer Kraftfelder und wird auch das 1. Fick’sche Gesetz genannt. Die Größe D=
1 |v| Λ 3
(8.4)
heißt die Diffusionskonstante.3 Die Diffusionskonstante bildet im folgenden den entscheidenden Parameter für die Effizienz der Transportprozesse. Diese extrem vereinfachte Überlegung vernachlässigt, dass die Teilchengeschwindigkeiten eine breite Wahrscheinlichkeitsverteilung aufweisen und die mittlere freie Weglänge im Allgemeinen von der Geschwindigkeit abhängig ist. Dennoch wird sich dieses Resultat als sehr nützlich erweisen, auch wenn es in bestimmten Fällen zusammenbricht.
2 In einer und zwei Raumdimensionen beträgt dieser Faktor entsprechend 1/2 beziehungsweise 1/4. 3 Der Vorfaktor in Gl. 8.4 beträgt in einer und zwei Raumdimensionen nicht 1/3, sondern 1 beziehungsweise 1/2.
8.2 Mittlere freie Weglänge | 237
Die vorstehende Überlegung lässt sich ganz analog auf den allgemeinen Fall des Transports einer beliebigen mengenartigen Größe X übertragen. An die Stelle der Teilchendichte tritt dabei die X -Dichte x = nˆ x, in der sowohl n als auch x ˆ ortsabhängig sein können. Damit erhalten wir die folgende allgemeine Form der Transportgleichung:
j X (r) = −D · grad x(r) .
(8.5)
Diese Gleichung zeichnet sich durch einen (gemessen an ihrer Einfachheit) verblüffend großen Gültigkeitsbereich und ein sehr breites Spektrum von Anwendungen aus. Bevor wir sie für verschiedene interessante Transportgrößen auswerten, wollen wir noch die freie Weglänge Λ für Gase berechnen.
8.2 Mittlere freie Weglänge Die mittlere freie Weglänge Λ wird durch die Streuwahrscheinlichkeit der Teilchen in dem betrachteten Medium bestimmt. Die Teilchen können entweder aneinander oder an andere (feste oder bewegliche) Streuzentren stoßen. Um im Rahmen eines einfachen Modells einen Ausdruck für Λ zu gewinnen, beschränken wir uns zunächst auf feste Streuzentren und betrachten einen flachen Quader der Querschnittsfläche A und der Dicke ΔL innerhalb des Mediums, der für eine gegebene Dichte nstreu der Streuer dünn genug ist, um nur eine Schicht von Streuzentren zu enthalten (Abb. 8.2). Die Bewegungsrichtung eines zur Illustration herausgegriffenen Teilchens sei senkrecht zur Fläche A des Quaders. Die Effektivität der Streuzentren ist durch ihren Streuquerschnitt (oder Wirkungsquerschnitt) σstreu bestimmt, der ein Maß für die effektive Fläche ist, die ein Streuer in der Querschnittsfläche des Quaders abdeckt. Im Rahmen der klassischen Mechanik ist der Wirkungsquerschnitt für die Streuung der einlaufen-
} 6L
Abb. 8.2. Berechnung der mittleren freien Weglänge über die Teilchendichte und den Streuquerschnitt σst . Der Streuquerschnitt wird durch die quantenmechanischen Streueigenschaften bestimmt und ist im allgemeinen energieabhängig. Für das klassische Modell harter Kugeln entspricht er der Querschnittsfläche einer Kugel mit dem doppelten Teilchendurchmesser.
238 | 8 Transportphänomene den Kugeln mit dem Radius R an harten Kugeln mit dem Radius Rstreu isotrop und beträgt σstreu = π(R + Rstreu )2 pro Teilchen. Im Rahmen der Quantenmechanik ist die Streuung für den normalerweise dominierenden Beitrag mit dem Bahndrehimpuls 0 (s-Wellen-Streuung) ebenfalls isotrop. Wir betrachten nun eine Anzahl von Z einlaufenden Teilchen der Masse m ˆ innerhalb der Querschnittsfläche A des Quaders und fragen, wieviele davon auf der Strecke ΔL gestreut werden. Dabei nehmen wir an, dass ΔL hinreichend klein ist, so dass die Wahrscheinlichkeit, dass sich zwei Streuzentren hintereinander befinden, vernachlässigbar klein ist. Da das Quadervolumen Nst = nst ·A·ΔL Streuzentren enthält, beträgt die durch die Streuzentren abgedeckte Fläche ΔA = σstreu · Nst . Daher resultiert für die relative Änderung ΔZ/Z der Zahl der nicht gestreuten Teilchen: ΔZ ΔA =− = −σstreu nst · ΔL Z A
ΔZ = −σstreu nst · Z(L) . ΔL
=⇒
Die letzte Gleichung stellt im Grenzfall ΔL → 0 eine einfache Differenzialgleichung für die Zahl der nicht gestreuten Teilchen bei beliebiger Dicke L des Quaders dar und besitzt die Lösung: Z(L) = Z0 exp
− σstreu nst · L = Z0 exp
− L/Λ .
Die mittlere freie Weglänge Λ zwischen zwei Stößen beträgt also: Λ=
1 . σstreu nst
(8.6)
Im folgenden betrachten wir die Diffusion eines Gases in einem diffusiven Medium mit statistisch verteilten, fixierten Streuzentren. Dieses findet beispielsweise in der gleich folgenden Diffusion eines Gases durch die Poren eines Tonzylinders, aber auch bei der Diffusion des Elektronengases in einem Metall oder Halbleiter mit einer fest vorgegebenen Verteilung von Streuzentren Anwendung. Für Gase in einem freien Volumen kann die Diffusion nur in zwei- oder mehrkomponentigen Gasgemischen auftreten. In diesem Fall spricht man von gegenseitiger Diffusion. Bei Gasgemischen sind die Streuzentren ebenfalls bewegliche Teilchen der Masse m ˆ st . Daher reduziert sich die mittlere freie Weglänge Λ in Gl. 8.6 (und damit auch die Diffusionskonstante) um einen durch die reduzierte Masse (Anhang E)
−1 1 1 m ˆ red = + (8.7) m ˆ st
m ˆ
der Streupartner bestimmten Faktor [26]:
1/2 Λ=
m ˆ st m ˆ st + m ˆ
·
1 . σstreu nst
(8.8)
Als Beispiel betrachten wir die Diffusion eines verdünnten idealen Gases mit dem Molekulargewicht m ˆ durch die Poren eines Tonzylinders. Mit der mittleren Geschwin-
8.3 Diffusion
digkeit |v| =
| 239
8kB T /π m ˆ erhalten wir für die Diffusionskonstante: 1 D= 3
1 8 kB T . π m ˆ σstreu nst
Leichte Teilchen diffundieren also wesentlich schneller als schwere. Dies kann man experimentell sichtbar machen, indem man einen mit Stickstoff gefüllten porösen Tonzylinder mit Heliumgas umspült. Die schnell in den Zylinder hineindiffundierenden Heliumatome erzeugen im Inneren des Zylinders solange einen Überdruck bis die schweren N2 -Moleküle den Weg nach außen gefunden haben und sich die Konzentrationen von He und N2 auf beiden Seiten der Wand des Tonzylinders angeglichen haben. Ersetzt man das Helium auf der Außenseite danach wieder durch Stickstoff, so diffundiert das Helium ebenso schnell wieder nach außen, und es entsteht für eine gewisse Zeit ein Unterdruck imm Zylinder, bis es der langsamere Stickstoff wieder hineingeschafft hat. In den folgenden Abschnitten wollen wir die Transportgleichungen in linearer Näherung auswerten und die Stromdichten der Transportgrößen S , N und P mit den Antrieben für den Transport, nämlich den Gradienten der intensiven Größen T , μ und v , in Verbindung bringen.
8.3 Diffusion In Abschnitt 7.4 haben wir nur den Anfangs- und den Endzustand des Diffusionsprozesses betrachtet. Um den raum-zeitlichen Verlauf des Diffusionsprozesses zu beschreiben, gehen wir ganz analog wie bei dem Problem der Wärmeleitung in Abschnitt 2.10 vor. Dazu kombinieren wir die Transportgleichung 8.3 für den Teilchenstrom j N mit der Kontinuitätsgleichung4 für die Teilchendichte: div j N +
∂n =0. ∂t
(8.9)
Setzen wir die Transportgleichung in die Kontinuitätsgleichung ein, erhalten wir eine Differenzialgleichung für n: ∂n(x, t) = D div grad n(x, t) ∂t
(8.10)
Diese Gleichung wird auch das 2. Fick’sche Gesetz genannt. Sie ist ganz analog zur Wärmeleitungsgleichung Gl. 2.28. Um uns Einsicht in die Charakteristika des Diffusionsprozesses zu verschaffen, wollen wir Gl. 8.10 für ein eindimensionales Problem lösen. Dazu betrachten wir die
4 In Abwesenheit chemischer Reaktionen verschwindet der Erzeugungsterm ΣN .
240 | 8 Transportphänomene bezüglich x Fourier-transformierte Diffusionsgleichung: ∂nq (t) = −Dq 2 nq (t) . ∂t
(8.11)
Dabei ist nq (t) die Fourier-Transformierte der Dichte: ∞ nq (t) =
dx exp(iqx) n(x, t) . −∞
Die Fourier-transformierte Diffusionsgleichung ist linear in n und hat die Lösung nq (t) = n(q, 0) exp(−Dq 2 t) .
(8.12)
Die Funktion n(q, 0) beschreibt die (Fourier-transformierte) räumliche Verteilung der Teilchendichte. Ist im einfachsten Fall n(q, 0) = n0 konstant, so entspricht dies einer punktförmigen Anfangsverteilung n(x, 0) = n0 δ(x). Gleichung 8.12 sagt uns, dass Inhomogenitäten der Teilchendichte auf einer Längenskala 1/q innerhalb der charakteristischen Zeit 1/Dq 2 exponentiell zerfallen. Kleinskalige Inhomogenitäten mit großen q zerfallen also schnell, großräumige Inhomogenitäten langsam. Anders gesagt: Der Stofftransport durch Diffusion ist über kurze Stecken effektiv, über lange Strecken nicht. Je größer die Diffusionskonstante D ist, um so schneller ist die Diffusion. Um die Ortsabhängigkeit der Relaxation zur erhalten, müssen wir Gleichung 8.12 Fourier-rücktransformieren: ∞ n(x, t) = n0
dx exp(iqx − q 2 Dt) .
(8.13)
−∞
Durch quadratische Ergänzung des Exponenten lässt sich das Fourier-Integral auf ∞ √ ein Gauss-Integral exp(−x2 )dx = π zurückführen: 0
n x2 exp − n(x, t) = √ 0 4Dt 2 πDt
(8.14)
Das Resultat ist eine auf n0 normierte Gauss-Funktion, die in Abb. 8.3 für verschiedene Zeiten t dargestellt ist. Die Breite der Gauß-Funktion, beziehungsweise das mittlere Verschiebungsquadrat (x − x )2 = 2Dt, wächst mit der Zeit linear an. Nach Einstein lässt sich der Diffusionsprozess auch als Zufallsbewegung deuten („random walk“), bei dem das einzelne Molekül einen durch die Stöße mit den übrigen Molekülen zufälligen Pfad zurücklegt. Die Stöße sorgen dafür, dass die Verschiebung beziehungsweise die Geschwindigkeit der Moleküle bei einer homogenen Anfangsverteilung im Mittel gleich Null sind. Ist die Dichteverteilung am Anfang inhomogen, so bewirkt die Diffusion einen Nettotransport, der die Dichteunterschiede ausgleicht. Die Dichteverteilung der Gesamtheit der Moleküle einer Sorte, beziehungsweise die
241
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern |
P(x,t) t 1 5 25 2Dt
-4
-2
0
2
4 x/ Dt
Abb. 8.3. Die räumliche Verteilung der Wahrscheinlichkeitsdichte w(x, t) ist wegen der Normierung der Wahrscheinlichkeiten in allen Fällen gleich.
Aufenthaltswahrscheinlichkeit für ein einzelnes Molekül, wird durch die Lösungen der Diffusionsgleichung bei gegebenen Anfangsbedingungen beschrieben. Gleichung 8.14 ist die Green’sche Funktion der Diffusionsgleichung (auch „Diffusionspropagator“ genannt), mit deren Hilfe sich die Lösung der Diffusionsgleichung für eine beliebige Anfangsverteilung n(x, t0 ) gewinnen lässt: ∞ n(x, t) = −∞
n (x , t ) (x − x )2 dx 0√ 0 exp − 4D(t − t0 ) 2 πDt
(8.15)
Dividieren wir Gleichung 8.14 noch durch n0 , so erhalten wir die Verteilungsfunktion des Diffusionsprozesses (Anhang B):
1 x2 exp − w(x, t) = √ 4Dt 2 πDt
(8.16)
Lässt man ein Molekül für eine Zeit t diffundieren, so legt es im Mittel die Entfernung √ √ L = Dt/2 zurück. Deutet man dL/dt ∝ 1/ t als eine Art „mittlere Geschwindigkeit“ so geht diese für lange Zeiten gegen Null. Dies ist äquivalent zu der Feststellung, dass Dichteunterschiede über große Abstände nur sehr langsam ausgeglichen werden.
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern 8.4.1 Thermodynamik im äußeren Kraftfeld Teilchenströme in Fluiden können außer durch Gradienten des chemischen Potenzials auch durch externe Felder in Bewegung gesetzt werden. Diese Felder stellen neben dem Gas weitere physikalische Systeme dar, deren Energie durch die räumliche Verteilung einer oder mehrerer extensiver Größen X des Gases, wie der elektrischen Ladung Q oder der Masse M , gegeben ist. Die Größe X ist in der Regel über eine Stoff-(oder gar Natur-)Konstante xˆ fest mit der Teilchenzahl verknüpft: X=x ˆN .
242 | 8 Transportphänomene Für ein konservatives Kraftfeld ist die auf die Teilchen wirkende Kraft F durch ein Potenzial darstellbar: F = −ˆ x grad φX (r) .
Durch die Verschiebung eines Teilchens in dem Kraftfeld kann also Energie gespeichert oder aus dem Kraftfeld entnommen werden, was zu einer Energieänderung des zusammengesetzten Systems ’Gas + Kraftfeld’ dEFeld = φX dX
führt. Dieser Term muss an die Gibbs’sche Fundamentalform des Gases angefügt werden, um dessen Kopplung an das externe Feld zu berücksichtigen: dEGas+Feld = T dS − p dV + μ dN + φX dX = T dS − p dV + (μ + x ˆφX ) dN .
Die wichtigsten Beispiele für eine solche Kopplung zwischen Teilchen und Feldern sind Gase im Gravitationsfeld und Elektronen oder Ionen in elektrischen Feldern, die wir weiter unten besprechen werden. Da X = xˆN , bietet es sich an, die zu X zugehörige intensive Größe mit dem chemischen Potenzial zu einer neuen intensiven Größe μ ¯ := μ + x ˆφX
(8.17)
des Gesamtsystems „Gas + Kraftfeld“ zusammenzufassen, um die energetischen Aspekte der Verschiebung des Gases in einem Kraftfeld in der üblichen Weise thermodynamisch zu beschreiben. Dies ist möglich, wenn die betrachteten Zustandsänderungen so langsam sind, dass der Beitrag der Schwerpunktsbewegung des Gases zur Gesamtenergie vernachlässigbar ist5 und keine inneren Freiheitsgrade des Feldes angeregt werden.6 Für das Folgende ist insbesondere die Tatsache wichtig, dass das Gleichgewicht bezüglich räumlicher Änderungen der Teilchendichte n(r) zwischen dem Gas und dem Kraftfeld durch die räumliche Konstanz der zu N thermodynamisch konjugierten Größe μ ¯ gegeben ist: μ ¯(r) = μ(r) + x ˆφX (r) = const.
(8.18)
Dies stellt eine Verallgemeinerung der bisher betrachteten Gleichgewichtsbedingungen dar, bei denen nur ein Austausch der Größe X zwischen zwei Systemen betrachtet
5 Die Beschreibung von Fluiden und Gasen unter Berücksichtigung der Schwerpunktsbewegung ist der Gegenstand der Hydrodynamik. 6 Die schnelle Verschiebung von elektrischen Ladungen äußert sich in der Emission elektromagnetischer Wellen, welche die inneren Freiheitsgrade des Systems „elektromagnetisches Feld“ darstellen. Ähnlich liegen die Verhältnisse im Verzerrungsfeld eines Festkörpers. Immer wenn die Geschwindigkeiten der Teilchen mit der Ausbreitungsgeschwindigkeit c von Zustandsänderungen im Feld vergleichbar sind, werden die inneren Freiheitsgrade des Feldes bedeutsam.
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern |
243
wurde. Hier geht es um das Diffusionsgleichgewicht in einem kontinuierlichen Medium, das beliebig in Subvolumina aufgeteilt werden kann, sofern deren Größe Λ nicht unterschreitet.
8.4.2 Die Einstein-Relation Gemäß dem (leicht verallgemeinerten) Ohm’schen Gesetz, j N = −σN grad φX ,
liefert das externe Kraftfeld einen weiteren Beitrag zur Stromdichte nach Gleichung 8.3. Dabei ist σN die (Teilchen-)Leitfähigkeit des Systems. Neben der Leitfähigkeit ist es üblich, auch die Beweglichkeit (Einheit „s/kg“) B = σN /n
der Teilchen einzuführen. Dies ist dadurch motiviert, dass die Relation j N = n · v
(8.19)
die Driftgeschwindigkeit v (nicht zu verwechseln mit |v| !) definiert. Im Gegensatz zu |v| stellt v die mittlere Transportgeschwindigkeit der Teilchen dar und verschwindet im Gleichgewicht. Die Beweglichkeit ist der Proportionalitätsfaktor zwischen der externen Kraft und der durch das externe Kraftfeld resultierenden Driftgeschwindigkeit gemäß v = B · F X . (8.20) Addieren wir den Diffusionsstrom und den Beitrag durch das externe Kraftfeld, so erhalten wir (in Abwesenheit eines Temperaturgradienten) für die Stromdichte jN :7 j N = − {D grad n + σN x ˆ grad φX } ˆ grad φX } . = − {Dν grad μ + σN x
(8.21)
wobei ν = ∂n(T, μ)/∂μ die in Abschnitt 3.1 eingeführte Teilchenkapazität ist. Zunächst erscheinen die Koeffizienten D und σN als voneinander unabhängig. Sie sind es jedoch nicht, wenn wir fordern, dass j N im Gleichgewicht verschwindet. Im Gleichgewicht müssen die beiden Antriebe nicht einzeln verschwinden, aber sie müssen sich gegenseitig aufheben, sodass wegen der Gleichgewichtsbedingung Gl. 8.18 grad μ = −ˆ x grad φX
7 Die beiden Beiträge in Gl. 8.21: der Diffusionsstrom, der durch den Gradienten des chemischen Potenzials μ angetrieben wird, und der Feldstrom, der durch das externe Feld angetrieben wird, haben zu dem Namen „Drift-Diffusions-Modell“ Anlass gegeben.
244 | 8 Transportphänomene gilt: !
j N = − {Dν − σN } grad μ = 0 .
Aus den Gleichungen 8.21 und 8.18 folgt also, dass die Leitfähigkeit σN , die Diffusionskonstante D und die Beweglichkeit B durch die Einstein-Relation σN = nB = νD
(8.22)
miteinander verknüpft sind. Damit erhalten wir für den Teilchenstrom in einem äußeren Kraftfeld φX schließlich j N = −σN grad μ ¯X .
(8.23)
Falls neben dem Gradienten von μ ¯X auch ein Temperatur-Gradient vorhanden ist, tritt noch ein weiterer Beitrag zum Strom auf, den wir in Abschnitt 8.9 besprechen werden. Der Gradient von μ ¯X definiert eine verallgemeinerte Kraft: * + F (x, t) = − grad μ(x, t) + x ˆ grad φX (x, t) . (8.24) Der chemische Beitrag − grad μ zur verallgemeinerten Kraft führt ebenso wie die externe Kraft zu einer endlichen Driftgeschwindigkeit im Sinne von Gl. 8.20. Er beschreibt genau wie eine reguläre Kraft den „chemischen“ Beitrag zur Energiebilanz bei der Verschiebung von Teilchen in einem chemischen Potenzialgradienten. In einem diffusiven System führt die verallgemeinerte Kraft nicht zu einer Beschleunigung des Teilchenstroms: Die Teilchen können nur beschränkt Impuls in die durch F ausgezeichnete Richtung akkumulieren, weil dieser durch die Streuung sofort an andere Teilchen weitergegeben wird.8 Der Ursprung der Einstein-Relation ist die Zusammenfassung von chemischem und externem Potenzial in Gl. 8.17. Sie gilt daher sehr allgemein; viel allgemeiner, als die klassisch anmutende Definition der Beweglichkeit durch Gl. 8.20 vermuten lässt. Für ein ideales Gas folgt aus ν = n/kB T (Gl. 6.19) und der Einstein-Relation (Gl. 8.22): nB = νD =
n n 3kB T 1 · |v| 2 τ ·τ . kB T 3 3kB T m ˆ
Im letzten Schritt haben wir unser Ergebnis aus Gl.8.4 für die Diffusionskonstante eingesetzt und mit |v| 2 v 2 = 3kB T /m ˆ den Unterschied von etwa 8 % zwischen dem Betrag der mittleren Geschwindigkeit und der Wurzel aus dem mittleren Geschwindigkeitsquadrat vernachlässigt (Gln. 3.16 und 3.17). Damit erhalten wir B =
τ m ˆ
(8.25)
8 Einen exotischen Fall stellt das supraflüssige Helium dar: Dort bewirkt auch der chemische Beitrag − grad μ eine Beschleunigung der suprafluiden Komponente des Heliums.
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern |
245
als handliches Resultat für die Beweglichkeit einer Teilchensorte in einem Gemisch klassischer Gase oder der Ionen in einer idealen Lösung. Ein weiteres, für die moderne Physik wichtiges Anwendungsbeispiel sind die Ladungsträger in einem Halbleiter, welche aufgrund ihrer geringen Dichte (Aufgabe 6.4) ebenfalls als ideales Gas aufgefasst werden können. Aus der Beweglichkeit erhalten wir die elektrische Leitfähigkeit σ = qˆ2 νD = qˆnB = nˆ q2 B =
nˆ q2 τ m ˆ
Drude-Formel.
(8.26)
Dabei ist B = qˆB die in der Halbleiterphysik gebräuchliche Beweglichkeit,9 qˆ = i · e die Ladung pro Teilchen, i eine ganze Zahl und e = 1.602 · 10−19 A s/Teilchen die Elementarladung. Überraschenderweise bleibt die Drude-Formel auch für die (entarteten) Elektronen in Metallen richtig, obwohl für diese sowohl ν als auch |v| durch völlig andere Ausdrücke gegeben sind (Abschnitt 14.1.4).
8.4.3 Die barometrische Höhenformel Das erste Beispiel, das wir besprechen wollen, sind Teilchen der Masse m ˆ in einem Gravitationsfeld (beschrieben durch das Gravitationspotenzial φM ), welches an alle Materie ankoppelt. Bei Objekten mit Größen im Labormaßstab kann φM in den meisten Fällen als konstant angesehen werden.10 Dies ändert sich, wenn wir beispielsweise die Ozeane oder die Atmosphäre betrachten, innerhalb derer das Gravitationspotenzial bereits erheblich variiert. Noch konkreter betrachten wir die Gibbs’sche Fundamentalform einer gewissen Luftmenge im Gravitationsfeld der Erde: dE = T dS − p dV + μ dN + φM dM .
(8.27)
Der Einfachheit halber beschränken wir uns auf die Nähe der Erdoberfläche, wo das Gravitationspotenzial als Funktion der Höhe z oberhalb eines Bezugspunkts bei z = 0 linear genähert werden kann: φM = gz + φM (z = 0) ,
(8.28)
wobei g = 9.81 m/s2 die Fallbeschleunigung ist. Da die Masse eines reinen Stoffes über das Atom- oder Molekulargewicht m ˆ fest mit der Teilchenzahl verknüpft ist, führen wir als neue, den Effekt des Gravitationsfeldes berücksichtigende intensive Größe das
9 In der Halbleiterphysik) wird die Beweglichkeit mit μ bezeichnet und durch B := σ/(ˆ q n) = v /|E| mit der Einheit „m2 /Vs“ definiert. Dabei ist E die lokale elektrische Feldstärke. Um Verwechslungen mit dem chemischen Potenzial zu vermeiden, ziehen wir hier die Symbole B und B vor. 10 Eine technisch wichtige Ausnahme sind Zentrifugen, in denen hohe Gravitationsfelder lokal erzeugt werden.
246 | 8 Transportphänomene gravitochemische Potenzial μ ¯G ein: (8.29)
μ ¯G = μ + mφ ˆ M .
Die Gibbs’sche Fundamentalform lautet dann dE = T dS − p dV + μ ¯G dN .
(8.30)
Verwenden wir als unabhängige Variablen T und p und die freie Enthalpie G als zugehörige Massieu-Gibbs-Funktion, so erhalten wir als neue Bedingung für das Diffusionsgleichgewicht: ∂G(T, p, z, N ) =μ ¯G (T, p, z) = μ(T, p) + φM (z) = const. ∂N
(8.31)
Diese Konstanz von μ ¯G drückt aus, dass sich im Gleichgewicht die Antriebe für den durch den chemischen Potenzialgradienten angetriebenen Diffusionsstrom (j N ∝ − grad μ) und den durch die Schwerkraft angetriebenen Massen- beziehungsweise Teilchenstrom (mj ˆ N ∝ − grad φM ) gegenseitig gerade kompensieren.11 Wenn φM höhenabhängig ist, können wir schließen, dass μ(T, p) über T (z) und p(z) höhenabhängig sein muss! Wir beschränken uns hier auf die Variation von p mit z und nehmen der Einfachheit halber T (z) = const. an. Zur Berechnung von p(z) gehen wir von der zu Gl. 8.27 zugehörigen Gibbs-Duhem-Relation aus: !
d¯ μG = −ˆ s dT + vˆ dp + mg ˆ dz = 0 .
(8.32)
Für ein ideales Gas mit vˆ = kB T /p folgt: kB T dp = −mg ˆ dz , p
ln
mg ˆ dp =− dz , p kB T p p0
=−
mgz ˆ , kB T
wobei p0 = p(z = 0) ist. Für Höhenbereiche, in denen die Temperatur der Atmosphäre als konstant angesehen werden kann, erhalten wir schließlich die barometrische Höhenformel:
11 Häufig wird dieser Sachverhalt so beschrieben, dass der Gradient der Teilchendichte einen Diffusionsstrom antreibt, der Gradient des äußeren Potenzials aber einen Feld- oder Driftstrom, und dass sich diese beiden Ströme im Gleichgewicht gegenseitig kompensieren. Dies ist physikalisch etwas irreführend, weil es suggeriert, dass auch im Gleichgewicht ständig Ströme flössen. Das Wesen des Gleichgewichts besteht jedoch darin, dass gerade keine Ströme fließen, weil dafür kein Antrieb vorhanden ist!
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern |
p(z) = p0 exp −
mgz ˆ kB T
247
.
(8.33)
Die wohlbekannte Wirkung des Gravitationsfeldes besteht also darin, die Atmosphäre in der Nähe der Erdoberfläche zu komprimieren. Die komprimierende Wirkung hängt exponentiell von m ˆ ab. Dies erklärt, warum die Verteilung des leichten Heliums in der Erdatmosphäre stark inhomogen ist: Beträgt der Heliumanteil in der untersten Schicht der Atmosphäre nur wenige ppm, wird Helium oberhalb von etwa 400 km Höhe die dominierende Spezies. Da ein merklicher Anteil der He-Atome in der MaxwellVerteilung Geschwindigkeiten oberhalb der Fluchtgeschwindigkeit aus dem Gravitationsfeld der Erde hat, diffundiert ständig Helium in den Weltraum hinaus. Gleichzeitig wird es aus dem Erdinneren durch Vulkanismus und seit kurzem auch durch die Förderung von Erdgas (wo 7-11% He enthalten sind) nachgeliefert. Die Abhängigkeit der Sedimentationswirkung von der Molmasse wird in Zentrifugen technisch ausgenutzt, um Stoffe mit hohen Molmassen am Boden der Zentrifuge zu konzentrieren.
8.4.4 Abschirmung elektrischer Felder Ganz analoge Verhältnisse liegen vor, wenn elektrisch geladene Teilchen mit der spezifischen Ladung qˆ in einem elektrischen Feld diffundieren. Dabei ist allerdings zu beachten, dass die elektrostatische Energie einer homogenen Ladungsverteilung sehr hoch ist. Die meisten Systeme beinhalten daher geladene Teilchen beider Polaritäten und sind elektrisch neutral. Die gilt für Elektrolytlösungen ebenso wie für Metalle oder Halbleiter. Letztere bilden ein besonders einfaches Beispiel, weil eine Sorte von Ladungen, nämlich die Dotieratome, fest ins Kristallgitter eingebaut sind. Nur die von den Dotieratomen abgegebenen Elektronen oder Löcher sind frei beweglich und bilden bei hinreichend schwacher Dotierung ein ideales Gas mit der Teilchendichte n0 . Als typisches Beispiel fragen wir, wie das System der beweglichen Ladungen auf das elektrische Feld einer extern vorgegebenen Ladungsverteilung qext (r) reagiert, das heißt welches Konzentrationprofil n(r) sich im Diffusionsgleichgewicht ausbildet. Die Ortsabhängigkeit des elektrischen Potenzials φQ wird durch die Lösungen der Poisson-Gleichung beschrieben: div grad φQ = −
q(r) , εr ε0
(8.34)
wobei q(r) = qext (r) + qˆδn(r) die lokale Ladungsdichte und δn(r) = n(r) − n0 die Abweichung der Dichte der beweglichen Ladungsträger von der homogenen Verteilung ist. ε0 ist die elektrische Feldkonstante und εr die relative Dielektrizitätskonstante des Lösungsmittels beziehungsweise des intrinsischen Halbleiters. Die durch εr gegebene elektrische Polarisierbarkeit des Mediums, in dem sich die Ladungsträger bewegen,
248 | 8 Transportphänomene führt bereits zu einer teilweisen Abschirmung des elektrischen Feldes und damit zu einer Reduktion der elektrostatischen Wechselwirkung zwischen den Ladungsträgern. Als Gleichgewichtsbedingung fordern wir die räumliche Konstanz des elektrochemischen Potenzials μ ¯ = μ + qˆφQ der diffundierenden Teilchen: μ ¯ = μ + qˆφQ = const.
Lösen wir die Gleichgewichtsbedingung nach φQ auf und bilden den Gradienten, so erhalten wir unter der Annahme einer konstanten Temperatur in linearer Näherung 1 1 ∂μ 1 grad φQ (r) = − grad μ(r) = − grad n(r) = − grad δn(r) . qˆ qˆ ∂n qˆν
Setzen wir diese Beziehung in die Poisson-Gleichung für φQ ein, ergibt sich eine Differenzialgleichung für die Teilchendichte:
− div grad φQ =
1 1 qˆδn(r) + qext (r) div grad δn = qˆν εr ε0
.
Lösen wir nach dem externen Anteil der Ladungsdichte qext auf der rechten Seite auf, so erhalten wir eine inhomogene Differenzialgleichung, die mit der Diffusionsgleichung (Abschnitt 8.3) eng verwandt ist: div grad δn(r) − kS2 δn(r) = kS2
qext (r) , qˆ
(8.35)
wobei der Kehrwert von kS λS =
1 = kS
r 0 qˆ2 ν
(8.36)
je nach Kontext Debye-Hückel oder Thomas-Fermi-Abschirmlänge heißt. Die erste Bezeichnung kommt aus der Elektrochemie und bezieht sich auf die Abschirmlänge in Salzlösungen; die zweite kommt aus der Festkörperphysik und bezieht sich auf die Abschirmlänge im Elektronensystem von Metallen oder Halbleitern. Um den Effekt der Abschirmung anschaulich zu verstehen, betrachten wir als Beispiel eine positive Punktladung am Ort r 0 = 0 mit qext = Q0 · δ(r) und lösen die Differenzialgleichung analog zur Lösung der Diffusionsgleichung in Abschnitt 8.3 durch FourierTransformation: − k2 + kS2 δnk = kS2 δnk = −
Q0 , qˆ
kS2 Q0 4π . 4π qˆ k2 + kS2
8.4 Diffusion und Diffusionsgleichgewichte in äußeren Feldern |
249
(0)
φQ
~ exp(-r/λS ) /r φQ
~ 1/r
r
λS δn
Abb. 8.4. Räumlicher Verlauf des ursprünglichen („nackten“) elektrostatischen Potenzials (0) (φQ ) einer Punktladung Q0 und des abgeschirmten (φQ ) Potenzials um diese Ladung in einem Medium mit freien Ladungsträgern gleicher Polarität. Die gestrichelte Linie stellt die Dichte δn der beweglichen Ladungsträger dar.
Berücksichtigen wir, dass die Fourier-Rücktransformation von 4π/(k2 +kS2 ) die Funktion exp(−kS r/|r|) ergibt,12 so erhalten wir das Ergebnis
δn(r) = −
kS2 Q0 exp − kS |r| . 4π qˆ |r|
(8.37)
Das Minuszeichen in Gl. 8.37 bedeutet, dass das Vorzeichen von δn dem von Q0 /ˆ q stets entgegengesetzt ist. Anschaulich ist dies leicht verständlich, da die externe Ladung die beweglichen Ladungen abstößt, wenn Q0 /ˆ q > 0 ist, und anzieht, wenn Q0 /ˆ q < 0 ist. Integriert man die induzierte Ladungsverteilung δn(r) über den ganzen Raum, so erhält man genau −Q0 . Da der größte Teil der induzierten Ladung im Bereich λS um die eingebrachte Ladung konzentriert ist, bedeutet dies, dass im Gleichgewicht das elektrische Feld der externen Ladung durch die sie umgebende Wolke beweglicher Ladungsträger auf Längenskalen, welche größer als λS sind, vollständig abgeschirmt wird.13 Diese Tatsache hat sehr weitreichende Folgen, da sie impliziert, dass es in Systemen mit geladenen beweglichen Teilchen im Diffusionsgleichgewicht keine langreichweitigen Coulomb-Kräfte gibt! Sie erklärt den auf den ersten Blick überraschenden Erfolg des Modells freier Elektronen in der Festkörperphysik. Um uns realistische Größenordnungen klarzumachen, berechnen wir die Abschirmlänge für eine ideale Lösung oder für einen Halbleiter mit einfach geladenen Dotieratomen (Q0 = qˆ = e = 1.6 · 10−19 A s/Teilchen) und der Ladungsträgerdichte n0 = 2 · 1016 Teilchen/cm3 , entsprechend 0.8 mmol/. Mit der für ideale Gase und Lösungen gültigen Teilchenkapazität ν = n/kB T (Gl. 6.19) und εr = 12.4 (für Silizium)
12 Diese Funktion beschreibt auch das aus der Teilchenphysik stammende Yukawa-Potenzial, welches eine andere kurzreichweitige Variante des Coulomb-Potenzials darstellt. ¯ erfordern. 13 Dies ändert sich, wenn Ladungsströme fließen, die einen Antrieb durch Differenzen von μ
250 | 8 Transportphänomene resultiert für T = 300 K ein Wert von λS 30 nm bei einem mittleren Ionenabstand von ebenfalls 30 nm. In Wasser beträgt die Dielektrizitätskonstante εr 80 (wegen der großen Dipolmoments der Wassermoleküle) und λS ist damit recht klein. Bei der Dichte n0 = 0.8 mmol/ enthält das Volumen λ3S nur noch wenige Teilchen. Da die bei der Ableitung erfolgte Linearisierung des Zusammenhangs zwischen μ und n kleine Werte von δn/n0 erfordert, ist die quantitative Gültigkeit dieser einfachstmöglichen Theorie der Abschirmung auf Konzentrationen unter 10−3 mol/ beschränkt. Weiterhin liegt unserer Betrachtung zugrunde, dass die mittlere Teilchendichte als homogen angesehen werden kann. Bei kleinen Volumina, die im Mittel nur noch wenige Teilchen enthalten, müssen starke statistische Fluktuationen der Teilchendichte auftreten. Bei dem Elektronensystem in Metallen ist die Teilchendichte so hoch, dass die Entartungsbedingungen (Gln. 6.9) verletzt sind und die Elektronen nicht als ideales Gas im bisherigen Sinne angesehen werden können. Gleichung 6.19 ist in diesem Fall ungültig. Diesen Fall müssen wir bis zur thermodynamischen Behandlung von FermiSystemen in Kapitel 14 zurückstellen. Der qualitative Effekt der Abschirmung bleibt jedoch auch bei hohen Teilchendichten bestehen und ist von enormer Bedeutung für das Verständnis der Coulomb-Wechselwirkung in Systemen mit geladenen Teilchen!
8.5 Impulstransport und Viskosität Wir betrachten zwei parallele Platten im Abstand d, die in einem viskosen Medium gemäß der Skizze in Abb. 8.5 gegeneinander mit der Relativgeschwindigkeit vx bewegt werden, und fragen nach der Kraft Fx = −j Px · A, die erforderlich ist, um diese Geschwindigkeitsdifferenz aufrecht zu erhalten. Die Kraft entspricht einem Strom der xKomponente Px des Impulses mit der Impulsstromdichte j Px , wobei A die Fläche ist, über die Impuls fließen kann, und der Vektor j Px in y -Richtung zeigt.14 Dabei nehmen wir an, dass die Impulsstromdichte homogen ist. Entsprechend der kinetischen Modellvorstellung streuen die Teilchen des Mediums an den Platten und untereinander. Die Reflexion der Teilchen an den Oberflächenrauhigkeiten der Platte soll diffus sein und damit ebenso zu einer zufälligen Richtungsänderung führen wie die Streuung der Teilchen untereinander. Dies führt dazu, dass die Teilchen in der Nähe einer Platte im Geschwindigkeitsgleichgewicht mit der Platte stehen, das heißt, dieselbe mittlere Geschwindigkeit v x wie die Platte haben. Zwischen den beiden Platten muss sich daher ein Geschwindigkeitsprofil ausbilden, um die Randbedingung v x = vxP latte erfüllen zu können. Bei hinreichend kleinen Geschwindigkeiten ist das Strömungsprofil
14 Charakteristisch für Reibungsphänomene und den Vektorcharakter des Impulses ist dabei, dass die Richtung der Impulskomponente Px (die x-Richtung) nicht mit der Richtung des Stromdichtevektors j Px eˆy identisch ist – hierin äußert sich der tensorielle Charakter der Impulsstromdichte.
8.5 Impulstransport und Viskosität |
251
Platte
Abb. 8.5. Geschwindigkeitsprofil in einem viskosen Medium zwischen zwei gegeneinander bewegten Platten. Unterhalb einer kritischen Geschwindigkeit bildet sich eine laminare Strömung mit einem konstanten Gradienten von vx in y-Richtung aus.
A
laminar, das heißt die lokale mittlere Geschwindigkeit ist parallel zur x-Richtung.15 Durch die Stöße der Teilchen untereinander und mit den Platten wird der Transport der x-Komponente Px des Impulses von einer Platte zur anderen vermittelt. Ist die Geschwindigkeitsdifferenz vorgegeben, so stellt dies den Antrieb für einen dissipativen Impulsstrom dar, den wir als Reibungskraft wahrnehmen. Wir wollen die entsprechende Stromdichte j Px der x-Komponente des Impulses mit Hilfe der allgemeinen Transportgleichung 8.5 berechnen: j Px = −D grad px = −Dm grad vx = −η grad vx ,
(8.38)
wobei die Ableitung der x-Impulsdichte px nach vx die Massendichte m = ∂px /∂vx liefert. Genau wie im Fall der Diffusion ist die Px -Stromdichte mit dem Gradienten der konjugierten Variable vx verknüpft, wobei der Proportionalitätsfaktor zwischen beiden die Viskosität genannt wird: η = Dm = nDm ˆ ,
(8.39)
wobei n die Teilchendichte und m ˆ die Masse pro Teilchen ist. Die Einheit der Viskosität ist [η] = Pa s = N s/m2 = kg/(m s).16 Wenn wir unsere für verdünnte Gase gültigen Ausdrücke 8.4 und 8.6 für die Diffusionskonstante und die freie Weglänge Λ in Gl. 8.39 einsetzen, so erhalten wir η=
√ nm |v| ˆ m |v| ˆ 1 ∝ T . nm |v| Λ ˆ = = 3 3σstreu n 3σstreu
(8.40)
In Tabelle 8.1 sind experimentelle Daten für die Viskosität einiger Gase sowie die daraus extrahierten freien Weglängen zusammengestellt. Damit erhalten wir also das auf den ersten Blick überraschende Ergebnis, dass die Viskosität eines verdünntes Gases von seiner Dichte unabhängig ist. Dies kommt daher, dass sich die n-Abhängigkeit der Massendichte und der freien Weglänge gerade
15 Wird ein kritischer Wert der Geschwindigkeitsdifferenz überschritten, so wird die Strömung turbulent – es bilden sich Wirbel. In diesem Fall ist der Zusammenhang zwischen Kraft und Geschwindigkeitsdifferenz in etwa quadratisch und nicht linear. 16 In der älteren Literatur findet man oft die Einheit „Poise“: 1 Poise = 0.1 Pa s.
252 | 8 Transportphänomene 50
η (μPa ⋅s)
40
Ar Ar
30 N2
20 10
N2 200
400 T (K)
600
1
10
100 p (bar)
Abb. 8.6. Gemessene Viskosität von Argon und Stickstoff. a) Temperaturabhängigkeit: Die Linien entsprechen dem Modell harter Kugeln (Gl. 8.40). Die Abweichungen zwischen der Modellrechnung und den Messdaten kommt daher, dass der quantenmechanische Streuquerschnitt mit zunehmender Energie abnimmt. b) Druckabhängigkeit: Die Viskosität ist über einen weiten Bereich druckunabhängig (nach [14]).
kompensieren. In der historischen Entwicklung gab die experimentelle Bestätigung dieses Befundes der kinetischen Gastheorie starken Auftrieb. Die Temperaturabhängigkeit von η ist in diesem Modell allein durch die mittlere Geschwindigkeit gegeben. Nimmt man diese Formeln wörtlich, so lässt sich aus Messungen der Viskosität der Streuquerschnitt und im Modell harter Kugeln der Radius der Gasteilchen abschätzen. Die Resultate solcher Messungen sind in Abbildung 8.6 dargestellt. Deutliche Abweichungen ergeben sich insbesondere in der Temperaturabhängigkeit, welche stärker als die im Modell harter Kugeln aufgrund der mittleren √ Geschwindigkeit erwartete T -Abhängigkeit ist. Dies liegt daran, dass Atome und Moleküle keine harten Kugeln sind, sondern eine gewisse Elastizität besitzen. Ihre Wechselwirkung wird am besten durch das Lennard-Jones-Potenzial17 beschrieben. Für dieses Potenzial nimmt der Streuquerschnitt als Funktion der Teilchenenergie ab, die Moleküle werden also effektiv etwas kleiner. Dies erklärt die im Vergleich zum einfachen Modell erhöhte Viskosität, die einer Zunahme der Effektivität des Impulsübertrags zwischen den Platten entspricht.
17 Dieses Wechselwirkungspotenzial hat die Form: VLJ (r) = −
α β + 12 , r6 r
wobei der erste Term die Form einer magnetischen Dipol-Dipol-Wechselwirkung hat. Der zweite Term ist ein Resultat der extrem kurzreichweitigen Pauli-Abstoßung zwischen den Atomrümpfen und sollte mehr als eine empirische Anpassung und nicht als ein exaktes Resultat angesehen werden. Beide Phänomene sind rein quantenmechanischen Ursprungs.
8.6 Entropietransport und Wärmeleitfähigkeit | 253
Tab. 8.1. Gemessene Viskosität η einiger Gase (bei 273 K und 1013 mbar) und die daraus extrahierten freien Weglängen (aufgrund der reduzierten Masse bei Stößen gleichartige Atome ist in Gl. 8.6 der √ Faktor 1/ 2 zu ergänzen): Gas
η (μPa s)
Λ(nm)
Gas
η (μPa s)
Λ (nm)
Luft Kohlendioxid (CO2 ) Argon Helium
17.1 13.8 21.0 18.6
60 39 62.6 174
Sauerstoff (O2 ) Stickstoff (N2 ) Neon Wasserstoff (H2 )
19.2 16.6 29.7 8.4
63 59 124 111
8.6 Entropietransport und Wärmeleitfähigkeit In diesem Abschnitt wollen wir unsere Transportgleichung auf das Problem der Wärmeleitung in Gasen anwenden. Wir betrachten dazu die Transportgleichung für die Entropie. Die Entropie-Dichte s = S/V ist durch die Zustandsgleichung s = s(T, n) des Systems gegeben. Daher erhalten wir zwei Beiträge zur Entropiestromdichte: j S (r) = −D · grad s(r)
.
= −D = −D
/
∂s(T, n) ∂s(T, n) grad T (r) + grad n(r) ∂T ∂n
∂s(T, n) ∂s(T, n) grad T (r) + · jN . ∂T ∂n
(8.41)
Im letzten Schritt haben wir Gl. 8.3 benutzt. Multiplizieren wir diese Gleichung mit T , so erhalten wir den mit dem Entropiestrom verbundenen Energie- oder Wärmestrom: T · j S (r) = −λ grad T (r) + T ·
∂s(T, n) · jN . ∂n
(8.42)
Der erste Anteil stellt einen konduktiven Anteil zur Wärmestromdichte dar, der auch dann auftritt, wenn die Teilchenstromdichte verschwindet. Der zweite Anteil stellt einen konvektiven Anteil zur S -Stromdichte dar, welcher von der Mitnahme von Entropie durch den Teilchenstrom herrührt. Ein Wärmestrom T j S kann also nicht nur durch einen T -Gradienten getrieben, sondern auch von einem Teilchenstrom mitgeführt werden, so wie uns dies von der Zentralheizung oder vom Föhn her vertraut ist. Den zweiten Beitrag werden wir im nachfolgenden Abschnitt genauer diskutieren. Zunächst befassen wir uns mit dem ersten Term in Gl. 8.41, welcher den konduktiven Entropietransport, das heißt das Phänomen der Wärmeleitung beschreibt. Der Vergleich von Gl. 8.41 und 8.42 liefert die Wärmeleitfähigkeit λ: λ(T, n) = T · D
∂s(T, n) cv (T ) . = Dcv (T, n) = nDˆ ∂T
(8.43)
Damit haben wir den bereits in Gl. 2.28 auftretenden Wärmediffusionskoeffizienten D auf die mikroskopischen Modellparameter |v| und Λ des wärmeleitfähigen Mediums
254 | 8 Transportphänomene
λ (mW/(K⋅m)
60 N2
40
20
0 200
N2
Ar
Ar
400
600
800
1
10
T (K)
100
1000
p (bar)
Abb. 8.7. Gemessene Wärmeleitfähigkeit von Argon und Stickstoff. a) Temperaturabhängigkeit: Die Linien entsprechen dem Modell harter Kugeln (Gl. 8.40). b) Druckabhängigkeit: Auch die Wärmeleitfähigkeit ist über einen weiten Bereich druckunabhängig (nach [14]).
zurückgeführt. Die breite Anwendbarkeit des kinetischen Modells beruht darauf, dass sich der Entropietransport in den meisten Fällen auf die Diffusion (1. Term in Gl. 8.41) oder auf die Konvektion von Entropie (2. Term in Gl. 8.41) zurückführen lässt18 – auch, wenn die relevanten Teilchen (vor allem in Festkörpern) nicht die Atome, sondern andere Quasiteilchen sind. Solche Quasiteilchen stellen die in den Kapiteln 13 und 14 besprochenen kollektiven Freiheitsgrade des Festkörpers dar. Analog zur Viskosität ist die Wärmeleitfähigkeit verdünnter Gase von der Dichte weitgehend unabhängig und variiert im Modell harter Kugeln als Funktion der Temperatur aufgrund der Temperaturabhängigkeit der mittleren Geschwindigkeit wie T 1/2 . In Abbildung 8.7 sind Messungen der Wärmeleitfähigkeit als Funktion von p und T dargestellt, die zeigen, dass unser Modell in akzeptabler qualitativer Übereinstimmung mit dem Experiment ist. Das Drift-Diffusions-Modell lässt sich auch auf die thermische Leitfähigkeit von Metallen anwenden, wenn wir mit Drude annehmen, dass die Elektronen im Metall ein ideales Gas bilden. Dann erhalten wir wegen cv = (3/2)nkB die Beziehung λ = cv D = (3/2)nkB D für die Wärmeleitfähigkeit. Bilden wir den Quotienten λ/(T σ), so erhalten wir mit den Gln. 8.22 und 6.19 das Wiedemann-Franz-Gesetz, welches besagt, dass die Lorenz-Zahl λ nˆ cv 3 L0 := = 2 Tσ 2 e Tν
kB e
2 = const.
(8.44)
18 Eine interessante Ausnahme stellt das Phänomen des 2. Schalls in supraflüssigem 4 He und in stark anharmonischen Festkörpern dar. Dabei handelt es sich um eine wellenartige Ausbreitung von Entropie und Energie mit einer Geschwindigkeit, die zwar kleiner als die akustische Schallgeschwindigkeit ist, aber dennoch etliche 10 m/s betragen kann.
8.7 Effusion aus kleinen Öffnungen |
255
für viele Metalle ähnliche Werte hat. Die experimentell gemessenen Werte liegen etwa bei
L0 3
kB e
2
,
was wieder bis auf einen Faktor 2 mit der Aussage des Modells übereinstimmt. Dieser Übereinstimmung kann man entnehmen, dass in vielen Metallen die Wärmeleitung und die elektrische Leitung von denselben Teilchen, nämlich den Elektronen, dominiert wird. In Abschnitt 14.4.4 werden wir ein verfeinertes Transportmodell besprechen, welches berücksichtigt, dass die Elektronen in Metallen ein so genanntes Fermi-Gas bilden. Wie wir sehen werden, sind ν und cv für solche Gase durch völlig andere Ausdrücke gegeben – das Verhältnis L0 bleibt davon jedoch nahezu unberührt.
8.7 Effusion aus kleinen Öffnungen Die kinetische Gastheorie lässt sich nicht nur auf die bisher betrachteten diffusiven Transportphänomene, sondern auch auf das ballistische Regime anwenden, in dem die freie Weglänge Λ groß gegen die relevanten geometrischen Abmessungen ist. Das einfachste Beispiel für solche Prozesse ist der Austritt (oder die Effusion) eines Gases aus einer kleinen Öffnung mit dem Durchmesser d Λ ins Vakuum.19 Um den aus dem Gasvolumen emittierten Teilchenstrom mit der Teilchendichte im Gas in Beziehung zu setzen, betrachten wir die in Abb. 8.8 skizzierte, um eine Öffnung mit der Fläche A zentrierte, Halbkugel mit dem Radius R = |v| dt und fragen, welcher Bruchteil der in der Halbschale enthaltenen Teilchen in dem Zeitraum dt durch das Loch emittiert wird. Dabei muss der Radius der Halbkugel kleiner als die freie Weglänge Λ sein, damit die Teilchen auf dem Weg vom Kugelrand zur Öffnung nicht gestreut werden. Greifen wir einen um die Winkel θ und φ zentrierten Ausschnitt (grau schattiert in Abb. 8.8) der Halbkugel heraus, so beträgt dessen Volumen dV = |v| dt × R dθ × R dφ .
Dabei ist R dφ die Breite eines um die x-Achse geschlagenen Kreisringes mit dem Radius R = R sin θ ,
der senkrecht auf der Flächennormalen steht, wobei die Position des Volumenelements dV auf dem Kreisring durch den Winkel φ angegeben wird. Da die Verteilungsfunktion der in dem Volumenelement dV und dem Geschwindigkeitsintervall d|v| enthaltenen Teilchen isotrop und daher von den Winkeln θ und φ unabhängig ist, beträgt
19 Weitere Anwendungsbeispiele sind die Emission von thermischer Strahlung aus einem Hohlraum (Abschnitt 13.1.3) und der in Abschnitt 15.2.2 diskutierte Sharvin-Widerstand eines metallischen Punktkontaktes.
256 | 8 Transportphänomene
Behälterwand
R R sinθ θ A
R sinθ dϕ
Abb. 8.8. Darstellung der Effusion eines Gases durch eine kleine Öffnung ins Vakuum. Jedes Volumenelement dV der Halbkugel emittiert unter einem gewissen Winkelpaar (θ, φ) durch die Austrittsfläche A.
vdt R dθ
das Verhältnis zwischen der mit der Geschwindigkeit |v| cos θ aus dV durch das Loch entweichenden Teilchen zur Gesamtzahl der in dV enthaltenen Teilchen A cos θ . 4πR2
Damit beträgt der Beitrag des Volumenelement dV zum entweichenden Teilchenstrom n×
A cos θ × |v| dt × R2 sin θ dθdφ . 4πR2
Integrieren wir nun über die Winkel φ und θ, so beträgt die im Zeitintervall dt aus der Kugelschale emittierte Teilchenmenge:
IN
A |v| dt n(T, p) dt = 4π
π/2 2π
cos θ sin θ dθdφ = A 0
0
π
|v| n(T, p) dt . 4
Das Ergebnis ist unabhängig vom Radius der Kugelschale. Damit beträgt der gesamte durch die Fläche emittierte Teilchenstrom: IN (T, p) = A ·
|v| , n(T, p) p , = √ 4 2π mk ˆ BT
(8.45)
wobei die Temperaturabhängigkeit der mittleren Geschwindigkeit |v| durch Gl. 3.16 gegeben ist. Die Ausström-Rate nimmt also mit zunehmender Molmasse m ˆ ab.
8.8 Teilchendiffusion durch dünne Kapillaren
| 257
d
p1 , T 1
p 2 , T2
Abb. 8.9. Diffusion eines Gases durch eine dünne Kapillare im Grenzfall Λ d (Knudsen-Strömung).
8.8 Teilchendiffusion durch dünne Kapillaren Mit den Ergebnissen des vorangegangenen Abschnitts können wir auch den Transport durch Rohre (oder dünne Kapillaren) behandeln, deren Durchmesser d ebenfalls vergleichbar mit oder kleiner als die mittlere freie Weglänge Λ im Gasvolumen ist. In diesem Fall findet die Mehrzahl der Streuprozesse nicht mehr zwischen den Teilchen, sondern zwischen den Teilchen und der Kapillarwand statt. Das bedeutet, dass die freie Weglänge von Druck und Temperatur unabhängig wird, weil sie im wesentlichen durch den Rohrdurchmesser gegeben ist. Das Rohr befinde sich zwischen zwei Gasvolumina, die eine Druck- oder Temperaturdifferenz aufweisen, sodass sich ein Gradient der Teilchendichte n(x) entlang des Rohres ausbildet. Für die Teilchenstromdichte können wir eine Variante von Gl. 8.2 aufstellen, bei der Λ durch den Durchmesser ersetzt wird: 1 jN = |v| n(x − d) − n(x + d) (8.46) 4
dn(x) 1 = − |v| · 2d 4 dx d = − |v| 2
.
∂n(T, p) dT (x) ∂n(T, p) dp(x) + dT dx dp dx
/ ,
(8.47)
wobei |v| die mittlere thermische Geschwindigkeit und L die Länge des Rohrs ist. Der Vorfaktor 1/4 resultiert wie im vorangegangenen Abschnitt aus der Mittelung über die Geschwindigkeits-Komponente parallel zur Rohrachse über die Winkelverteilung der auf die Rohröffnung einfallenden Teilchen (Gl. 8.45). Da das Rohr normalerweise eine auf der atomaren Skala raue Oberfläche hat, ist die Streuung an der Oberfläche genauso diffusiv wie im Inneren des Gasvolumens (Abb. 8.9). Wegen der Erhaltung des Teilchenstroms können wir die lokale Relation Gl. 8.46 durch die Beziehung 1 jN =
4
|v 1 | n(T1 , p1 ) − |v 2 | n(T2 , p2 )
ersetzen, wobei T1,2 und p1,2 die Temperaturen und Drucke in den beiden Reservoiren sind. Für jN = 0 erhalten wir daraus wegen |v| = 8kB T /(π m) ˆ (Gl. 3.16) und der
258 | 8 Transportphänomene thermischen Zustandsgleichung n(T, p) = p/(kB T ) die Beziehung p p √1 = √2 . T1 T2
(8.48)
Bei gegebenem Verhältnis p1 /p2 muss sich ein dazu reziprokes Verhältnis T1 /T2 = (p1 /p2 )−1/2 der Temperaturen einstellen. Der durch eine Druckdifferenz getriebene Teilchenstrom führt also zur Abkühlung der Hochdruck-Seite und einer Erwärmung der Niederdruck-Seite. Das liegt daran, dass der fließende Teilchenstrom auch einen Entropiestrom konvektiv mitführt (Aufgabe 8.11). Umgekehrt muss sich bei gegebenem Verhältnis der Temperaturen ein entsprechendes Druckverhältnis einstellen. In linearer Näherung können wir den Teilchenstrom für den Fall einer Druckdifferenz Δp = p1 − p2 p1 , p2 bei T = const. zwischen den Gasvolumina berechnen. Mit Hilfe der thermischen Zustandsgleichung erhalten wir für die Ableitung ∂n(T, p) 1 = ∂p kB T
und damit für den Teilchenstrom IN = π(d/2)2 · jN : IN =
πd3 |v| Δp 8kB T L
für
dΛ,
(8.49)
wobei L die Länge des Rohres ist. Der Strom fließt erwartungsgemäß dem Druckgradienten entgegen, das heißt von hohen zu niedrigen Drucken beziehungsweise Dichten. Mit Hilfe von Gl. 3.17 ergibt sich für den Massenstrom das kompakte Resultat: IM = mI ˆ N =
d3 Δp . |v| L
Die Knudsen-Strömung unterscheidet sich von der für große Rohrdurchmesser d Λ auftretende Poiseuille-Strömung durch die stärkere Abhängigkeit des Teilchenstroms (∝ d3 anstelle von ∝ d2 ) vom Durchmesser. Dies ist von großer Bedeu-
tung in der Hochvakuumtechnik, weil die freien Weglängen für N2 und O2 bei Drucken p < 10−4 mbar mehr als 6 cm betragen und damit vergleichbar mit typischen Rohrquerschnitten sind. Der andere Fall einer Temperaturdifferenz ΔT = T1 − T2 T1 , T2 bei p = const. ist noch interessanter, weil sich hier die Stromrichtung umkehrt! Mit der thermischen Zustandsgleichung folgt ∂n(T, p) n p =− . =− ∂T T kB T 2
Für den thermisch induzierten Massenstrom bei p = const. erhalten wir damit: IM = −
d3 nkB ΔT |v| L
für
dΛ.
(8.50)
In diesem Fall fließt der Strom noch immer von hohen zu niedrigen Dichten, aber von niedrigen zu hohen Temperaturen. Er verhält sich damit entgegengesetzt zu unserer
8.8 Teilchendiffusion durch dünne Kapillaren
| 259
Ta Ti IN
IQ
Abb. 8.10. Demonstration des Thermodiffusions-Effekts: Trotz Bestehen eines Druck-Gleichgewichts zwischen dem Inneren eines porösen Tonzylinders und dem Außenraum fließt ein kontinuierlicher Gasstrom durch den unten am Zylinder befestigten Schlauch, solange eine durch die Heizspirale gegenüber dem Außenraum erhöhte Innentemperatur besteht. Der Antrieb für diesen Teilchenstrom IN ist der durch die T -Differenz induzierte Gradient von n/|v| zwischen dem Innen- und dem Außenraum.
spontanen Erwartung, die intuitiv von einer konstanten Dichte ausgeht und daher hohen Druck und hohe Temperatur assoziiert. Dieses Phänomen nennt man Thermodiffusion oder „thermische Transpiration“. Die Thermodiffusion lässt sich leicht experimentell nachweisen. Dazu wird ein poröser Tonzylinder über einen Schlauch mit einem Wasserbehälter verbunden, der den Druck im Schlauch konstant hält und den durchfließenden Luftstrom durch Luftblasen sichtbar macht (Abb. 8.10). Dabei wird sichergestellt, dass sich das Innere des Zylinders und die Außenluft stets im Druckgleichgewicht befinden. Wird die Luft im Inneren des Zylinders mittels eines Heizers erwärmt, dehnt sie sich gemäß dem idealen Gasgesetz zunächst aus, bis sich ein stationärer Zustand einstellt, in dem sich die eingebrachte Heizleistung und die Ableitung der Wärme in die Umgebung die Waage halten. Nach Erreichen des stationären Zustands beobachtet man aber, dass der Gastransfer in das Volumenreservoir keineswegs zum Stillstand kommt. Im Gegenteil, solange die Temperatur an der Innenwand des Tonzylinders höher ist als an der Außenwand, wird ein kontinuierlicher Gasstrom beobachtet. Nach kurzer Zeit übersteigt die in das Volumenreservoir transferierte Gasmenge das ursprünglich im Zylinder enthaltene Volumen deutlich! Die Erklärung für diese Beobachtung ist das Fließen eines kontinuierlichen Gasstroms, der gegen den Temperaturgradienten vom Außenraum in das Innere des Zylinders diffundiert! Das Druckgleichgewicht in unserer Anordnung impliziert die Annahme der Dichte auf der heißen Seite. Wird der Druckausgleich verhindert, resultiert ein Druckanstieg im Inneren des Zylinders.
260 | 8 Transportphänomene Eine technische Anordnung, die den Knudsen-Effekt ausnutzt, ist der KnudsenKompressor, der ohne bewegliche Teile auskommt. Falls allerdings d Λ, ist die erreichbare Druckdifferenz leider nicht allein durch Gl. 8.47 bestimmt, sondern eine endliche Druckdifferenz treibt zusätzlich die oben erwähnte Poiseuille-Strömung, bei der sich ein parabolisches Geschwindigkeitsprofil im Gas ausbildet (Aufgabe 8.5). Der Knudsen-Strom fließt in der Nähe der Rohrwand dem hydrodynamischen Strom entgegen; in diesem Fall spricht man auch von „thermischer Gleitung“. Eine weitere Variante der Thermodiffusion liegt vor, wenn sich mesoskopische Körper, zum Beispiel Staubpartikel, in einem ruhenden Gas unter Einfluss eines Temperaturgradienten bewegen. In diesem Fall spricht man von Thermophorese.
8.9 Thermoelektrizität Wie lässt sich die nach Gl. 8.41 erwartete, von einem Teilchenstrom mitgeführte Entropie experimentell sichtbar machen? Die deutlichste Manifestation eines solchen Mitnahmeeffekts finden wir in stromdurchflossenen elektrischen Leitern, das heißt, in Metallen und Halbleitern. Der Einfachheit halber nehmen wir zunächst an, dass die Entropieerzeugung durch den konduktiven Beitrag zum Entropiestrom sowie den Teilchenstrom (die Joule’sche Wärme) vernachlässigbar sind:20 Δ¯ μ · IN T · IS
und
T = const.
Die Kontinuitätsgleichung für den Entropiestrom lautet dann ΣS = =
∂s(T, n) + div j S ∂t ∂s(T, n) ∂n(t) · + div j S ∂n ∂t
= −
∂s(T, n) · div j N + div j S 0 . ∂n
Im letzten Schritt haben wir die Kontinuitätsgleichung für die Teilchendichte mit ΣN = 0 benutzt. Damit erhalten wir die lokal gültige Beziehung jS =
∂s(T, n) · jN . ∂n
(8.51)
Die durch Konvektion mitgeführte Entropie pro Teilchen beträgt also ∂s(T, n)/∂n, und nicht einfach sˆ(T, n), wie man es erwarten würde, wenn die Entropie des Gases einfach gleich der Summe der Entropien der einzelnen Teilchen wäre. Hier zeigt sich erneut, dass die Entropie pro Teilchen nicht einfach als die mittlere Entropie eines Teil-
20 Eine allgemeinere Betrachtung wird in Anschnitt 8.12 durchgeführt.
8.9 Thermoelektrizität |
261
chens interpretiert werden kann, wie wir es in Abschnitt 6 bereits gesehen haben.21 Dieses Ergebnis entspricht dem zweiten Term in den Gleichungen 8.41 und 8.42. Für geladene Teilchen nennt man das Verhältnis zwischen dem Wärmestrom T j S und dem elektrischen Strom j Q = qˆj N den Peltier-Koeffizienten Π = T·
1 ∂s(T, n) . qˆ ∂n
(8.52)
In Gegensatz zur mitgeführten Entropie pro Teilchen kann der Peltier-Koeffizient Π – abhängig vom Vorzeichen der Ladung pro Teilchen qˆ – beiderlei Vorzeichen ha-
ben: negative für Ladungstransport durch Elektronen, positive beispielsweise in pdotierten Halbleitern. Für (nicht zu stark) dotierte Halbleiter können wir den PeltierKoeffizienten leicht berechnen, da die Ladungsträger in diesem Fall ein ideales Gas bilden. Differenzieren von Gl. 6.3 nach n = 1/ˆ v liefert * + s(T, n) ∂ nˆ ∂s(T, n) = = sˆ(T, n) − kB ∂n ∂n
.
= kB
ln
jT 3/2 n
3 + 2
/
(8.53)
.
Typische Ladungsdichten in dotierten Halbleitern22 sind n 1014 /cm3 –1018 /cm3 . Damit erhalten wir sˆ − kB 12.5 · kB bis 21.5 · kB bei Zimmertemperatur. Man beachte, dass sˆ(T, n) mit zunehmender Teilchendichte abnimmt. Für den PeltierKoeffizienten eines solchen Halbleiters resultieren damit typische Werte von Π
kB · 3750 K qˆ
bis
kB · 6450 K 0.32 W/A qˆ
bis
0.55 W/A .
Die Elektronen in Metallen können, wie bereits öfter erwähnt, nicht als verdünntes ideales Gas angesehen werden. Deren thermodynamische Behandlung in Kapitel 14 liefert ∂s(T, n) sˆ(T, n) π 2 kB T = = , ∂n 3 6 TF (n)
(8.54)
wobei die sogenannte Fermi-Temperatur TF (n) eine materialspezifische charakteristische Temperatur des Elektronensystems ist, die in Metallen typischerweise 5 bis 10 · 104 K beträgt, und damit sehr hoch ist (Abschnitt 14.1). Wir erhalten für den Peltier-Koeffizienten von Metallen bei Zimmertemperatur Π =
kB π 2 T 2 k · B · 1.5 K 0.13 mW/A qˆ 6 TF (n) qˆ
.
21 Siehe auch die Fußnote auf Seite 34. 22 In dieser Abschätzung nehmen wir an, dass die Ladungsträgerdichte n durch die Dotierung bestimmt ist (Störstellenerschöpfung, Abschnitt 14.5.2) und nur schwach von der Temperatur abhängt. Bei Temperaturen außerhalb dieses Bereichs müssen weitere Effekte berücksichtigt werden.
262 | 8 Transportphänomene Thermoelektrische Effekte in Metallen sind wegen der in der Regel sehr kleinen Entropie pro Teilchen wesentlich kleiner als in Halbleitern. Bei räumlich konstanter Temperatur macht sich die von den Ladungsträgern mitgeführte Entropie innerhalb eines Leiters nicht durch thermische Effekte bemerkbar.23 Wenn der elektrische Strom aber durch eine Grenzfläche zwischen zwei Leitern mit unterschiedlichem Peltier-Koeffizienten fließt, sind die ein- und auslaufenden Entropieströme verschieden. Die Diskrepanz
T ΔIS = Π2 − Π1 · IQ ,
(8.55)
die Peltier-Wärme, wird an der Grenzfläche frei oder absorbiert. Dies resultiert in einer kontinuierlichen Heiz- beziehungsweise Kühlleistung, welche entweder zugeführt oder abgeführt werden muss, um die Temperatur an der Grenzfläche konstant zu halten. Ohne externe Zu- oder Abfuhr von Energie und Entropie erwärmt sich die Grenzfläche entweder, oder sie kühlt ab. Abbildung 8.11a zeigt eine Anordnung, bei der ein Draht aus einem Material A mit dem Peltier-Koeffizienten ΠA < 0 mit einem zweiten Draht aus einem anderen Material B mit dem Peltier-Koeffizienten ΠB < 0 zu einen geschlossenen Stromkreis verbunden sind. An einer Stelle ist der Kreis durch eine Stromquelle unterbrochen, die einen im Uhrzeigersinn zirkulierenden Elektronenstrom antreibt. Wenn |ΠA | > |ΠB | ist, so werden an der oberen Kontaktstelle Energie und Entropie frei, an der unteren absorbiert – die Anordnung wirkt als Wärmepumpe. Das Analogon des Peltier-Effekts in Elektrolyt-Lösungen nennt man den SoretEffekt. Wenn ein Teilchenstrom einen Wärmestrom mitführen kann, so ist zu erwarten, dass auch ein Wärmestrom einen Teilchenstrom mitführen kann. Dies wurde von Seebeck erstmals beschrieben. Wird ein elektrisch isolierter Metalldraht an einem Ende erwärmt, so bewirken die von dem resultierenden Wärmestrom zum kalten Ende mitgeführten Ladungsträger eine Ladungsakkumulation am kalten und eine entsprechenden Verarmung am heißen Ende. Im Inneren des Leiters ändert sich die Ladungsverteilung nicht, weil die Ausbildung makroskopischer Raumladungszonen unverhältnismäßig viel elektrostatische Energie kostet. Daher bilden sich Oberflächenladungen in einer Randzone von der Dicke der Thomas-Fermi-Abschirmlänge (Abschnitt 8.4.4), bis deren elektrostatisches Feld den Antrieb für den thermoelektrischen Strom gerade kompensiert und die Ladungsverteilung an der Oberfläche zeitlich konstant wird. Auf diese Weise entsteht ein thermisch induzierter Gradient des elektrostatischen Potenzials, welcher dem der Temperatur entgegen wirkt. Das chemische Potenzial nimmt bei konstanter Dichte zum kalten Ende hin zu, was den thermoelektrischen Strom zusätzlich reduziert.
23 Bei gleichzeitigem Vorhandensein eines T -Gradienten und eines elektrischen Stroms tritt zusätzlich zum Joule’schen Beitrag zur Energiedissipation ein zu grad T proportionaler Beitrag in der Energieund Entropiebilanz auf – die Thomson-Wärme.
8.9 Thermoelektrizität |
a)
b)
TI S
Erwärmung
A
IQ
c)
TI S
heiß
A
T2
T2 P3
e-
e-
M
heiß
A
e-
TIS
Uth
e-
T2
Ea
P4 +
+
T1 TI S
B
TI S
Abkühlung
E
B
T1
263
B
T1
kalt
kalt
TI S
Abb. 8.11. Verschiedene Anordnungen zur Messung thermoelektrischer Effekte an einem Thermoelement aus den Leitern A (dunkelgrau) und B (hellgrau). Die Peltier-Koeffizienten Π und SeebeckKoeffizienten S seien negativ (für Elektronen ist qˆ = −e/Teilchen) und |SA | > |SB |. Die Temperatur T2 ist höher als T1 . a) Peltier-Effekt: Der von einer Stromquelle getriebene elektrische Strom IQ führt den Wärmestrom ΠA · IQ beziehungsweise ΠB · IQ mit. An der oberen Kontaktstelle wird die Differenz (ΠA − ΠB ) · IQ frei, an der unteren wird sie absorbiert. b) Seebeck-Effekt: Anordnung zum Antrieb eines Motors M durch den thermoelektrischen Strom. Man beachte die umgekehrte Richtung des Entropiestroms und des elektrischen Stroms in (a) und (b). Die Anordnung in (a) ist eine Wärmepumpe, während (b) eine Wärmekraftmaschine darstellt. c) Anordnung zur Messung der Thermospannung Uth . Die lokale elektromotorische Kraft E ist grün eingezeichnet. Da die Elektronen beim Aufbau der Temperaturdifferenz gegen den Uhrzeigersinn getrieben werden, lädt sich der mit der heißen Seite des Thermoelements verbundene obere Pol des Voltmeters negativ auf.
Um die erwartete Verbindung zwischen den Gradienten von T und μ ¯ zu finden, werten wir die Transportgleichung für den Teilchenstrom für den allgemeinen Fall (grad μ ¯, grad T = 0) aus: 4
j N = − D div n(T, μ) + σN qˆ grad φQ
. = −D
∂n(T, μ) ∂n(T, μ) gradT grad μ ¯+ ∂μ ∂T
. = −σN
5
grad μ ¯+
∂s(T, n) grad T ∂n
/
/ .
(8.56)
Hier haben wir wieder das chemische und das elektrostatische Potenzial zu μ ¯ zusammengefasst und die aus Gl. 5.30 folgende Maxwell-Relation ∂n(T, μ) ∂s(T, μ) ∂s(T, n) ∂n(T, μ) = = · ∂T ∂μ ∂n ∂μ
(8.57)
sowie Gl. A.1 benutzt. Aus Gl. 8.56 folgt, dass ein Temperaturgradient entlang eines elektrisch isolierten Drahtes (j N = 0) einen zu grad T proportionalen Gradienten des elektrochemischen
264 | 8 Transportphänomene Potenzials erzeugt: ∂s(T, n) (8.58) · grad T . ∂n Der thermisch induzierte Gradient von μ ¯ zeigt bei konstanter Dichte dem Gradienten von T entgegen. Die Ladungsträger fließen vom heißen zum kalten Ende des Drahtes, den T -Gradienten hinab, den elektrochemischen Potenzialgradienten dagegen hinauf. grad μ ¯=−
Dies ist ein Charakteristikum der in Abschnitt 4.1 besprochenen Wärmekraftmaschinen. Den Proportionalitätsfaktor S zwischen grad T und der elektromotorischen Kraft 1 1 E := − grad μ ¯ = − grad μ + E i = S grad T qˆ qˆ
(8.59)
nennt man die Thermokraft beziehungsweise den Seebeck-Koeffizienten. Dabei ist E i das lokale, von den Oberflächenladungen erzeugte elektrostatische Feld im Innern des Leiters. Mit Gl. 8.58 erhalten wir: S =
1 ∂s(T, n) . qˆ ∂n
(8.60)
Der Vergleich zwischen Gl. 8.52 und Gl. 8.60 liefert die Kelvin-Relation Π = T ·S
(8.61)
zwischen S und Π. Beim Peltier-Effekt führt der Teilchenstrom einen Wärmestrom mit; beim Seebeck-Effekt dagegen führt der Wärmestrom einen Teilchenstrom mit. Die durch die Kelvin-Relation Gl. 8.61 quantifizierte Symmetrie der beiden Mitführeffekte wurde von Onsager erstmals als ein grundlegendes Prinzip erkannt. Solange die Beziehung zwischen den Strömen und den Gradienten linear ist, genügen die bisher bekannten Systeme diesem Prinzip.24 Wird die Stromquelle in Abb. 8.11a durch einen Motor ersetzt (Abb. 8.11b), so erhält man eine thermoelektrische Wärmekraftmaschine: Ein Temperaturgefälle zwischen der oberen und der unteren Kontaktstelle induziert einen gegen den Uhrzeigersinn zirkulierenden Elektronenstrom. Die zirkulierenden Elektronen nehmen aus dem heißen Wärmereservoir pro Zeiteinheit einen Energiebetrag T2 ΔSA auf und geben am kalten Reservoir den kleineren Energiebetrag T1 (ΔSA +SA,irr ) wieder ab, wobei SA,irr die Ohm’schen Verluste im Leiter A angibt. Auf dem Rückweg extrahieren die Elektronen den kleineren Energiebetrag T1 ΔSB aus dem Reservoir und geben den größeren Betrag T2 (ΔSB + SB,irr ) wieder ab. Dabei wird ein Teil der gewonnenen Energie be-
24 Onsager wurde außerdem durch die exakte Lösung des zweidimensionalen Ising-Modells für wechselwirkende Spins und durch Arbeiten zum superfluiden Helium berühmt. Für sein ReziprozitätsTheorem wurde er 1968 mit dem Nobelpreis für Chemie ausgezeichnet.
8.9 Thermoelektrizität |
265
nötigt, um die Entropie von der Temperatur T1 wieder auf die höhere Temperatur T2 „hochzupumpen“. Zur experimentellen Bestimmung der thermoelektrischen Koeffizienten S und Π ersetzen wir den Motor in Abb. 8.11b durch ein Voltmeter (Abb. 8.11c), welches den Stromkreis unterbricht und die Leerlaufspannung der Anordnung zwischen den Punkten P3 und P4 misst. Die Thermospannung Uth erhalten wir durch die Integration der in Gl. 8.59 definierten elektromotorischen Kraft E entlang des vom Punkt P4 zum Punkt P3 führenden Weges durch das Thermoelement:25 ⎧ P ⎫ P2 P3 ⎨1 ⎬ Uth (T1 , T2 ) =
μ ¯3 − μ ¯4 =− qˆ ⎩
E (r) dr +
P4
P4 P1
T2 =
E (r) dr
P2
P2 SA · grad T (r) dr −
=
E (r) dr +
P1
⎭
P2 SB · grad T (r) dr +
P1
SA · grad T (r) dr P3
SA (T ) − SB (T ) dT ,
(8.62)
T1
wenn wir annehmen, dass die Temperaturen an beiden Punkten P3 und P4 gleich sind. Die Thermospannung ist unabhängig davon, an welcher Stelle der Stromkreis unterbrochen wird. Für die Ableitung der Thermospannung nach der Temperatur ergibt sich damit dUth (T ) = SA (T ) − SB (T ) . dT
(8.63)
Diese Gleichung stellt also eine präzise Messvorschrift für die Differenz zweier Seebeck-Koeffizienten dar. Zur experimentellen Bestimmung der Thermokraft des Materials A muss die Thermokraft des Referenzmaterials B bekannt sein.26 ) Der Innenwiderstand des Voltmeters muss viel größer als der des Thermoelements sein, damit der fließende Strom vernachlässigbar ist. Ohne Nutzlast beträgt der maximale elektrische Ringstrom (Kurzschluss-Strom) des Thermoelements Uth IQ = , (8.64) R A + RB
25 Die Thermospannung ist keine rein elektrostatische Potenzialdifferenz, sondern enthält auch einen Beitrag vom chemischen Potenzial der Elektronen. 26 Supraleiter sind als Referenzmaterialien besonders geeignet, weil in diesen der Ladungsstrom nicht mit einem konvektiven Entropiestrom [für das den Suprastrom tragende Cooper-Paar-Kondensat sind s und ∂s(T, n)/∂n ≡ 0] verbunden ist (Abschnitt 14.6). Daher sind in diesem Fall S und Π exakt gleich Null.
266 | 8 Transportphänomene wobei RA und RB die elektrischen Widerstände der beiden Drähte sind. Wird wie in Abb. 8.11b ein Elektromotor mit dem elektrischen Widerstand RM in den Stromkreis eingefügt, so sinkt der Ringstrom auf den Wert IQ = Uth /(RA + RB + RM ). Der Spannungsabfall über dem Motor beträgt dann UM =
Uth RM . R A + RB + R M
(8.65)
Der höchste Wirkungsgrad ergibt sich, wenn der Widerstand des Motors RM gleich dem Innenwiderstand des Thermoelements RA + RB ist. Der Spannungsabfall über dem Motor ist dann nur halb so groß wie die in Abb. 8.11c gemessene Thermospannung. Der Wirkungsgrad dieser Wärmekraftmaschine ist neben S auch durch die elektrische (σ ) und die Wärmeleitfähigkeit (λ) der verwendeten Leiter bestimmt. Um die Entropie-Erzeugung im Thermoelement zu minimieren, muss σ möglichst groß und λ möglichst klein sein. Aufgrund des Wiedemann-Franz-Gesetzes (Gl. 8.44) ist hier ein Kompromiss erforderlich. Die Eignung eines Materials für thermoelektrische Anwendungen wird durch den dimensionslosen Qualitätsfaktor ZT =
σT S 2 λ
(8.66)
bestimmt. Die dotierten Halbleiter Bi2 Te3 , Bi2 Se3 und Sb2 Te3 sind die bei Zimmertemperatur geeignetsten konventionellen Materialien (ZT 1), die eine hohe Thermokraft mit einem niedrigen Widerstand und einer niedrigen Wärmeleitfähigkeit kombinieren. Halbleiter sind interessant, weil in einem Thermoelement n- und p-dotierte Materialien verwendet werden können, deren Seebeck-Koeffizienten sich betragsmäßig addieren und deren Wärmeleitfähigkeit relativ niedrig ist. Gegenwärtig laufen in der aktuellen Forschung große Anstrengungen, ZT für künstliche Materialien, zum Beispiel für Halbleiter-Übergitter, zu optimieren. In solchen Systemen wurden bereits Werte von ZT 2–3 erreicht.
8.10 Kritik des Drift-Diffusionsmodells Die wesentliche Schwäche dieses einfachen Modells ist die Tatsache, dass in der Transportgleichung das Produkt der Mittelwerte von D und des Gradienten der X -Dichte auftritt. Bekanntlich ist für Wahrscheinlichkeits-Verteilungen, die asymmetrisch um den Mittelwert verteilt sind, das Produkt der Mittelwerte ungleich dem Mittelwert des Produkts. Genauere Ergebnisse werden erwartet, wenn die Energieabhängigkeit der Diffusionskonstante berücksichtigt wird. Einen ersten Schritt zur Verfeinerung des Drift-Diffusionsmodells stellen wir im zweiten Teil des Buches im Zusammenhang mit den Transporteigenschaften von Metallen vor (Abschnitt 14.4). Dort wird sich zeigen, dass sich der hier verwendete Zu-
8.10 Kritik des Drift-Diffusionsmodells |
267
gang leicht verallgemeinern lässt, wenn wir Teilchen mit derselben Energie separat betrachten. In diesem verbesserten Modell ergeben sich Resultate für die elektrischen Leitfähigkeit und die Wärmeleitfähigkeit, die mit denen der Boltzmanngleichung in Relaxationszeitnäherung identisch sind. Die stärksten Abweichungen treten bei der Thermokraft auf, die am sensitivsten auf die genannten Asymmetrien reagiert.27 Darüber hinaus zeigt die dortige Analyse, dass die Abweichung der Verteilungsfunktion von der Verteilung im Gleichgewicht so klein ist, dass die thermodynamischen Eigenschaften des stromdurchflossenen Mediums gleich bleiben. Daher ist es gerechtfertigt, die aus Experimenten im Gleichgewicht bestimmten thermodynamischen Suszeptibilitäten auch im Zusammenhang mit den Transport-Koeffizienten zu benutzen. Eine über die Relaxationszeitnäherung hinausgehende Behandlung der Stöße ist mathematisch so viel schwieriger, dass es nach Aufstellung der BoltzmannGleichung (Anhang H) im Jahre 1872 etwa 45 Jahre dauerte, bis Chapman und Enskog 1916–17 die Entwicklung eines effektiven Näherungsverfahrens gelang. Für einatomige verdünnte Gase liefert dieses die universellen Verhältnisse 6 mD = = 1.2 η 5
und
5 mλ ˆ = = 2.5 , ηˆ cv 2
welche nach Gl. 8.39 und 8.43 beide = 1 sein sollten. Die Korrekturen sind für den Wärmetransport größer als für den Impulstransport. Das liegt daran, dass die Teilchen mit Geschwindigkeiten |v| > |v| nicht nur schneller sind, sondern auch mehr Energie tragen. Für einatomige Gase sind diese Ergebnisse in guter Übereinstimmung mit den in Abb. 8.12 gezeigten Messwerten: mD = 1.35 ± 0.05 η
und
E=
mλ ˆ = 2.5 ± 0.1 , ηˆ cv
(8.67)
wobei E der Eucken-Faktor genannt wird. Die Reduktion von E bei den zweiatomigen Gasen kommt daher, dass der Beitrag der inneren Anregungen (Rotationen und Vibrationen) zur Wärmekapazität näherungsweise unabhängig von der Geschwindigkeit ist und daher nicht von dem Erhöhungsfaktor 2.5 profitiert. Der entsprechende
27 Nimmt man Gleichung 8.60 wörtlich, so kompensieren sich die Thermokraft und der aus der T Abhängigkeit von μ(T, n) resultierende μ-Gradient bei konstanter Dichte n in Gl. 8.56 wegen der Maxwell-Relation ∂s(T, n)/∂n = −∂μ(T, n)/∂T (Beispiel 4 in Abschnitt 5.2). Dann wäre der thermoelektrische Strom stets Null, weil die thermisch induzierte elektromotorische Kraft von dem aufgrund der T -Abhängigkeit von μ(T, n) ebenfalls vorhandenen chemischen Potenzialgradienten exakt kompensiert wird. Dies mag der Grund sein, warum Gl. 8.60 trotz ihrer Prägnanz weitgehend in Vergessenheit geriet, obwohl sie bereits 1851 von keinem Geringeren als Kelvin abgeleitet wurde [18]. Die Berücksichtigung der Energieabhängigkeit der Diffusionskonstanten und weiter verfeinerte Modelle für die mitgeführte Entropie liefern Ergebnisse, die sich von Gl. 8.60 um einen numerischen Faktor im Bereich von ±10 unterscheiden. Für qualitative Betrachtungen stellt Gl. 8.60 eine brauchbare Abschätzung dar, die insbesondere die Temperaturabhängigkeiten von S vielfach richtig wiedergibt (Abschnitte 14.4 und 14.5.3).
2.5
2.0
mλ / ηcv
268 | 8 Transportphänomene
mD/η
1.4
1.2
He Ne Ar
Kr Xe H2
Gasart
N2
Abb. 8.12. Die Verhältnisse mD/η und mλ/ηcv für ein- und zweiatomige Gase (Daten aus [11]).
O2
korrigierte Erhöhungsfaktor ist leicht zu berechnen. Wenn cv,T den Beitrag der Translation und cv,i den Beitrag der inneren Anregungen zur Wärmekapazität pro Volumen bezeichnet, gilt wegen cv,T = nˆ cv,T = 3nkB /2 λ=
5 2
cv,T + cv,i
η m
=
3 2
cv,T + cv
η m
=
9 4
nkB + cv
η m
.
Mit Hilfe des Adiabatenexponenten γ = cp /cc und wegen nkB = (γ − 1)cv resultiert: λ = Ecv η/m
mit E =
1 9γ − 5 . 4
(8.68)
Für einatomige Gase hat hat der Eucken-Faktor den Wert E = 2.5 und für zweiatomige Gase den Wert E = 1.9. Gleichung 8.68 liefert auch, unabhängig von der T Abhängigkeit von cˆv , Werte, die in guter Übereinstimmung mit experimentellen Daten wie denen in Abb. 8.12 sind. Der quantitative Vergleich der experimentell bestimmten Transportkoeffizienten der Gase mit den Aussagen des Drift-Diffusions-Modells zeigt also, dass dieses die Temperatur- und Dichte-Abhängigkeit weitgehend richtig wiedergibt, während die Absolutwerte in der Regel um einen Faktor 1.3–3 unterschätzt werden. Gemessen an dem Aufwand unserer Herleitung ist das Ergebnis also recht befriedigend. Insgesamt stellen die in diesem Kapitel gewonnen Resultate der einfachen Transporttheorie die überwiegend verwendete Grundlage für die Behandlung von Transportphänomenen nicht nur in Gasen, sondern auch in Festkörpern und Quantenflüssigkeiten dar.
8.11 Die Matrix der Transportkoeffizienten Um die Vielzahl von Ergebnissen noch übersichtlicher darzustellen, wollen wir die beiden Transportgleichungen für S und N in Matrixform zusammenfassen. In linearer
8.11 Die Matrix der Transportkoeffizienten |
269
Näherung erhalten wir: (
jS jN
)
⎛
⎞
) ∂s(T, μ) ( ∂μ ⎟ grad T (r) ∂n(T, μ) ⎠ grad μ ¯(r) ∂μ
∂s(T, μ) ⎜ ∂T = −D ⎝ ∂n(T, μ) ∂T
(
)( Lss Lns
= −
Lsn Lnn
(8.69)
) grad T (r) grad μ ¯(r)
(8.70)
.
Die Matrix der kinetischen Koeffizienten Lsn genügt wegen der Maxwell-Relation Gl. 8.57 der Onsager-Symmetrie. Drei der darin auftretenden Elemente, nämlich Lnn = σN
und
Lsn = Lns = σN qˆS
sind uns bereits bekannt. Um das vierte Element Lss durch vertrautere Größen auszudrücken, wenden wir Gl. A.2 sowie Gl. 8.57 an und erhalten: Lss = D
∂s(T, μ) ∂T
. = D
0 = D
=
∂s(T, n) ∂s(T, n) ∂n(T, μ) + ∂T ∂n ∂T ∂s(T, n) + ∂T
∂s(T, n) ∂n
2
/
∂n(T, μ) ∂μ
2 λ + σN qˆS . T
(8.71)
¯ als unabhängige Variable beDer zweite Beitrag zu Lss kommt daher, dass wir grad μ trachten. Der Fall grad T = 0, grad μ ¯ = 0, in dem j N = −Lnn grad T ist, lässt sich nur dadurch realisieren, dass zusätzlich zu dem durch grad T getriebenen Wärmestrom ein Teilchenstrom j N fließt, der den durch die T -Abhängigkeit von μ(T, n) resultierenden μ ¯-Gradienten gerade kompensiert. Setzen wir umgekehrt j N = 0, so gilt grad μ ¯ = −
und damit
. jS = −
Lns = −ˆ q S grad T Lnn
λ q S)2 − σN (ˆ q S)2 + σN (ˆ T
/ grad T = −
λ grad T , T
in Übereinstimmung mit unserem früheren Resultat in Gl. 8.43. Ebenso lässt sich leicht nachrechnen, dass auch Gl. 8.41 reproduziert wird. In Aufgabe 8.13 ist zu zeigen, dass die Anwendung der Transportgleichung auf die Energiedichte e(T, μ ¯) auf den aus Gl. 1.43 wohlbekannten Zusammenhang j E = −D grad e(T, μ ¯) = T j S + μ ¯j N
führt.
270 | 8 Transportphänomene
8.12 Entropieproduktion durch Ströme In diesem Abschnitt wollen wir einen allgemeinen Ausdruck für die Entropieproduktion durch Ströme ableiten und in linearer Näherung mit den Transportkoeffizienten in Verbindung bringen. Dazu beginnen wir mit der Gibbs’schen Fundamentalform in Entropie-Darstellung (Abschnitt 6.4), das heißt dem totalen Differenzial der Entropiedichte s(e, xi ): n n 1 ξi ds =
T
de −
i=2
ξ˜i dxi ,
dxi =
T
i=1
wobei die xi die Dichten erhaltener mengenartiger Größen und ξi die zugehörigen Energie-konjugierten Größen sind. Die ξ˜i heißen Entropie-konjugiert. Insbesondere sind ξ˜1 := 1/T zu x1 := e Entropie-konjugiert. Die zeitlichen Ableitungen s, ˙ e˙ und x˙ i der Dichten der mengenartigen Größen sind dann gemäß n ∂s ∂x ξ˜i i = ∂t ∂t
(8.72)
i=1
verknüpft. Außerdem gilt für die lokalen Stromdichten nach Gl. 1.43 jS =
n
ξ˜i j Xi .
(8.73)
i=1
Eliminieren wir mit Hilfe der Kontinuitätsgleichungen ∂xi =0 ∂t die Zeitableitungen in Gl. 8.72 zugunsten von j S und den div j Xi , so erhalten wir für div j S +
∂s Σ = S ∂t V
und
div j Xi +
die lokale Entropieproduktionsrate ΣS,lok = div j S −
n
ξ˜i div j Xi .
i=1
In einem letzten Schritt setzen wir Gl. 8.73 im ersten Term auf der rechten Seite ein und bekommen das fundamentale Ergebnis ΣS,lok =
n
grad ξ˜i · j Xi .
(8.74)
i=1
Bei konstanter Temperatur beträgt die entsprechende lokale Heizleistung P grad ξi · j Xi , = T ΣS,lok = − V n
(8.75)
i=2
was uns unter dem Namen Joule’sche Wärme wohlbekannt ist. Dies setzt natürlich voraus, dass die Wärmeleitfähigkeit des von den Xi -Strömen durchflossenen Mediums so groß ist, dass durch die Dissipation keine zusätzliche Erwärmung erfolgt und T zeitlich konstant bleibt.
8.12 Entropieproduktion durch Ströme |
271
In linearer Näherung können wir analog zu dem vorangegangenen Abschnitt auch ˜ ij von kinetischen Koeffizienten definieren, sodass hier eine Matrix L j Xi =
n
˜ ij grad ξ˜i . L
(8.76)
i=1
Auch diese Matrix sollte nach dem Onsager-Theorem symmetrisch sein. Setzen wir diese linearisierte Variante der Transportgleichung in unser Resultat für die EntropieProduktion Gl. 8.74 ein, so erhalten wir ΣS,lok =
n
˜ ij grad ξ˜i . grad ξ˜j L
(8.77)
i,j=1
Entsprechend dem zweiten Hauptsatz sollte die Entropie-Produktionsrate stets positiv ˜ ij daher positiv definit sein. Im Rahmen des Drift-Diffusions-Modells und die Matrix L ˜ ij mit der Suszeptibilitätsmatrix der Massieuist dies dadurch sichergestellt, dass L Gibbs-Funktion p T
1 μ , T T
= s−
e μ + n T T
zusammenhängt, die sich durch Legendre-Transformation von s(e, n) ergibt und die gemäß den thermodynamischen Stabilitätsbedingungen positiv definit sein muss.
Übungsaufgaben 8.1. Atom- und Molekülradien Schätzen Sie aus den Messdaten in Tabelle 8.1 unter Annahme des Modells harter Kugeln den Teilchendurchmesser für N2 , Ar und He ab. 8.2. Abschätzung der Avogadro-Konstanten Berechnen Sie aus den Ergebnissen von Aufgabe 8.1 und den Teilchendichten im flüssigen und im gasförmigen Zustand für N2 , Ar und He Schätzwerte für die Avogadro-Konstante. Nehmen Sie dazu an, dass der mittlere Teilchenabstand in der flüssigen Phase näherungsweise dem Teilchendurchmesser entspricht.
8.3. Entropieproduktion durch Reibung a) Berechnen Sie die lokale Entropie-Produktionsrate ΣS,lok in einem Medium mit der Viskosität η , welches sich zwischen zwei mit der Relativgeschwindigkeit v im Abstand d gegeneinander bewegten Platten befindet (Abb.8.5). b) Zeigen Sie, dass das lineare Geschwindigkeitsprofil vx (y) ∝ y die Entropieproduktion des Systems minimiert. Dies ist ein Spezialfall der Theorems der „Minimierung der Entropieproduktion“ im linearen Transportregime.
272 | 8 Transportphänomene
8.4. Rotationsviskometer Ein Rotationsviskometer besteht aus zwei koaxialen Zylindern, zwischen denen sich das zu untersuchende viskose Medium befindet. Die Messgrößen sind die relative Winkelgeschwindigkeit und das Drehmoment. a) Berechnen Sie das Drehmoment, welches bei der Rotation mit der Frequenz Ω durch das Medium von einem Zylinder auf den anderen übertragen wird. b) Wie hängen die Eigenfrequenz Ω0 und die Güte Q eines mit dem Viskometer realisierten Drehpendels von der Viskosität des Mediums ab? 8.5. Das Gesetz von Hagen-Poiseuille Ein Rohr mit der Länge L und Radius R verbindet zwei mit einer Flüssigkeit gefüllte Behälter, mit Druck p1 auf der einen und Druck p2 auf der anderen Seite. Nehmen Sie dabei an, dass der Flüssigkeitsstrom durch das Rohr laminar ist. Die lokale Geschwindigkeit v des Stromes hängt nur vom radialen Abstand zum Mittelpunkt des Rohres ab, v = v(r), und erfüllt die Gleichung
η ∂ r ∂r
r
∂v(r) ∂r
=
∂p(z) , ∂z
wobei p der hydrostatische Druck und η die Viskosität der Flüssigkeit ist. Es gibt zwei Randbedingungen für den Strom, zum einen sei v(r = R) = 0, das heißt die Flüssigkeit haftet an den Wänden des Rohres, zum anderen sei die Geschwindigkeit in der Mitte des Rohres am größten: ∂v(r)/∂r|r=0 = 0. a) Lösen Sie die Differentialgleichung mit den gegebenen Randbedingungen und zeigen Sie, dass v(r) durch r 2 ΔpR2 v(r) = −
4ηL
1−
R
gegeben ist, wobei Δp = p1 − p2 . b) Berechnen Sie die durchschnittliche Strömungsgeschwindigkeit. Die Flussrate der Flüssigkeit V˙ = dV /dt hängt mit der Druckdifferenz Δp durch die Beziehung V˙ = Gfließ Δp zusammen. Leiten Sie die Formel für Gfließ her. 8.6. Gravitationsenergie einer Kugel konstanter Dichte a) Berechnen Sie die Gravitationsenergie einer kugelsymmetrischen Massenverteilung mit der konstanten Massendichte m auf der Basis des Newton’schen Gravitationsgesetzes Egrav = γG
M1 M2 , |r|
wobei γG = 6.67259 · 10−11 J/(kg2 m) die Gravitationskonstante ist. Bauen Sie die Kugel dazu schalenweise auf, indem Sie M1 mit der Masse des bereits aufgebauten Teils und M2 mit der Masse der neu hinzukommenden Kugelschale identifizieren.
8.12 Entropieproduktion durch Ströme |
273
b) Ist das Ergebnis eine homogene Funktion im Sinne des Homogenitätspostulats in Abschnitt 5.4? Wenn ja, in welchen Variablen? Hinweis: Dieses Ergebnis findet bei der (näherungsweisen) Berechnung des Gleichgewichtsradius von gravierenden Himmelskörpern wie Planeten (Aufgabe 8.7) oder weißen Zwergen (Aufgabe 14.6) praktische Anwendung. 8.7. Volumenänderung einer gravitierenden Kugel Nach Aufgabe 1.5 beträgt die in einem unter hydrostatischem Druck komprimierten Körper gespeicherte elastische Energie V Eelast = −
p(V ) dV =
(V − V0 )2 2κV0
V0
wobei V0 das Volumen beim Druck p = 0 und die Kompressibilität κ des Körpers ist. Die Gesamtenergie ist durch E(M, R, V ) = Egrav + Eelast
gegeben.28 Bestimmen Sie mit Hilfe des Ergebnisses von Aufgabe 8.6 die Änderungen des Volumens und des Radius, die erwartet werden, wenn das Schwerefeld abgeschaltet werden könnte. Gehen Sie dazu davon aus, dass Gleichgewichtsradius R durch die Extremalisierung der Gesamtenergie bezüglich des Radius R gegeben ist. Nehmen Sie einen für die Kompressibilität für kondensierte Materie typischen Wert von κ = 10−9 Pa−1 an. Die Masse und der Radius der Erde betragen ME = 6·1024 kg und RE = 6370 km. Welche Vereinfachung liegt diesem Rechenweg zugrunde? 8.8. Hydrostatisches Gleichgewicht in einer gravitierenden Kugel Eine selbstkonsistente Lösung des Problems der gravitierenden Kugel ergibt sich im Rahmen der Newton’schen Gravitationstheorie durch die Kombination der Poisson-Gleichung für das Gravitationspotenzial divgrad φG (r) = −4πγG m(r)
mit der Bedingung gravitochemischen Gleichgewichts grad μ ¯G (r) = 0 (Gl. 8.31). a) Eliminieren Sie φG zugunsten der Gravitationsfeldstärke g = −grad φG und zeigen Sie, dass der Druck im Inneren einer Kugel mit räumlich konstanter Temperatur durch die Differenzialgleichung 0
vˆ2 [T, p(r)]
κT [T, p(r)]
beschrieben wird.
∂p(r) ∂r
2
−
1 ∂ r2 ∂r
r2
∂p(r) ∂r
= 4πγG m ˆ2
274 | 8 Transportphänomene
b) Welche Randbedingung ist an die Lösung dieser Gleichung zu stellen? 8.9. Abschirmung Eine externe Punktladung Q0 befindet sich in einer Elektrolytlösung. a) Berechnen Sie den Betrag der elektrischen Feldstärke als Funktion des Abstands zur externen Ladung und die in der Abschirmwolke enthaltene Gesamtladung. b) Berechnen Sie einen zu Gl. 8.37 analogen Ausdruck für die Abschirmlänge λS für eine Elektrolytlösung mit mehreren beweglichen Ladungsträgern. 8.10. Absorption von Sauerstoff Ein kugelförmiges Bakterium mit Radius a befindet sich in einem unendlich ausgedehnten wässrigen Medium, das mit Sauerstoff der Teilchendichte n0 gesättigt ist. Das Bakterium absorbiert Sauerstoff so effizient, dass sich nach einiger Zeit ein Fließ-Gleichgewicht einstellt, bei dem sich im Abstand r = a vom Mittelpunkt des Bakteriums keine Sauerstoffmoleküle mehr befinden, also n(r = a) = 0. In Kugelkoordinaten reduziert sich die Diffusionsgleichung zu:
∂n 1 ∂ =D 2 ∂t r ∂r
r2
∂n ∂r
.
a) Zeigen Sie, dass im Gleichgewichtszustand die Lösung der Diffusionsgleichung durch n(r) = A + B/r gegeben ist. Bestimmen Sie die Konstanten A und B , indem Sie die Randbedingungen benutzen. b) Finden Sie die Vernichtungsrate Σn , mit der das Bakterium den Sauerstoff im Gleichgewichtszustand absorbiert (Dimension von Σn : Moleküle pro Sekunde). 8.11. Entropiestrom durch eine dünne Kapillare Berechnen Sie den Entropiestrom, der zwischen zwei durch eine dünne Kapillare verbundenen, mit N2 gefüllten Behältern auf der Temperatur T = 300 K fließt, wenn der Durchmesser der Kapillare d = 1 μm, deren Länge L = 100 μm und die Drucke p1 = 10 mbar und p2 = 1 mbar betragen. In welche Richtung fließt der Entropiestrom? Ist die Bedingung d Λ erfüllt? 8.12. Wirkungsgrad thermoelektrischer Generatoren Die Effizienz eines Thermoelektrikums wird oft durch den dimensionslosen Parameter ZT :=
σT S 2 λ
angegeben. Für einen thermoelektrischen Generator, der notwendigerweise zwei verschiedene Thermoelektrika beinhaltet, wird ein kombinierter Effizienzparame-
8.12 Entropieproduktion durch Ströme |
ter durch Z T¯ :=
T¯ (S1 − S2 )2 λ1 /σ1 +
275
2 ,
λ2 /σ2
definiert, wobei T¯ = (TH − TC )/2 der Mittelwert der Temperaturen der beiden Reservoire ist. Zeigen Sie, dass der Wirkungsgrad des thermoelektrischen Generators durch den Ausdruck η = ηCarnot ·
1 + Z T¯ − 1 1 + Z T¯ + TC /TH
gegeben ist. Berechnen Sie einen typischen Zahlenwert für η/ηCarnot für einen Generator mit ZT1,2 = 1 und S1,2 = ±1 mV/K sowie TH = 500 K und TC = 300 K. 8.13. Kinetische Koeffizienten und der Energiestrom Zeigen Sie, dass die Auswertung der Transportgleichung 8.5 für die Energiedichte e(T, μ) auf eine lokale Version unserer grundlegenden Gl. 1.43 führt: j E = − D grad e(T, μ ¯) = T j S + μ ¯ jN .
Hinweis: Benutzen Sie die Homogenitätsrelation e = T s − p + μn.
9 Reale Systeme Nachdem wir bisher fast ausschließlich ideale Gase behandelt haben, wollen wir in diesem Kapitel die Konsequenzen von Wechselwirkungen zwischen den Gasmolekülen betrachten. Die spektakulärste Folge der Wechselwirkungen sind Phasenübergänge und die Koexistenz verschiedener Phasen derselben Stoffe im PhasenGleichgewicht. Grundlage unserer Behandlung sind phänomenologische Modelle wie die Erweiterung der thermischen Zustandsgleichung um Elemente der attraktiven und repulsiven Wechselwirkung zwischen den Gasmolekülen nach van der Waals. Als Resultat ergeben sich nicht nur quantitative Abweichungen vom Verhalten idealer Gase, wie bei der Joule-Thomson-Expansion, sondern auch thermodynamische Instabilitäten, welche für das Auftreten der flüssigen Phase verantwortlich sind. Weitere für Phasenübergänge typischen Phänomene sind die Metastabilität der Phasen und die daraus resultierende Hysterese des Phasenübergangs sowie das Auftreten von Fluktuationen der thermodynamischen Größen in der Nähe der Stabilitätsgrenzen der Phasen.
9.1 Phasen und Phasenübergänge Viele Stoffe existieren in verschiedenen Aggregatzuständen oder Phasen. Das Wort „Aggregatzustand“ sagt dabei, wie die in einer Phase befindlichen Teilchen miteinander verbunden sind. Am engsten ist diese Verbindung in Festkörpern – hier sind die Bindungen so stark (beziehungsweise die Temperatur so niedrig), dass die Atome, Ionen oder Moleküle Kristallgitter bilden und darin nur kleine Schwingungen um ihre Ruhelage ausführen können. Aufgrund der starken Wechselwirkung zwischen den Atomen sind die Schwingungen verschiedener Atome miteinander gekoppelt, und Gitterverzerrungen breiten sich wellenartig über den ganzen Festkörper aus. Die Quanten dieser Schwingungen haben wir bereits mehrfach als Phononen kennengelernt.1 Wird die Temperatur langsam erhöht, so nimmt die Schwingungsamplitude zu, bis einzelne Atome genügend Anregungsenergie bekommen, um sich aus dem Kristallverband zu lösen.2 Die aus der festen Phase gelösten Atome bilden neue Phasen, eine Flüssigkeit oder ein Gas. Flüssigkeiten weisen in der Regel einen etwas größeren, statistisch schwankenden Teilchenabstand und damit eine geringere Dichte als der Festkörper auf. Dies äußert sich darin, dass sie in der Röntgenbeugung keine klaren Interferenz-
1 Die thermodynamische Beschreibung des Phononensystems erfordert Methoden der statistischen Thermodynamik und wird in Kap. 13.2 in Angriff genommen. 2 Es gibt interessante Ausnahmen, wie zum Beispiel flüssiges 3 He, das in einem gewissen Druck- und Temperaturbereich bei Erwärmung gefriert – oder besser: erstarrt (Abschnitt 14.3.3).
9.1 Phasen und Phasenübergänge
|
277
reflexe mehr, sondern nur noch eine Wahrscheinlichkeitsverteilung für die nächsten und übernächsten Nachbarabstände zeigen. Die Periodizität des Kristallgitters ist zerstört, es gibt nur noch eine gewisse Nahordnung. Wellenartige Anregungen gibt es nur noch auf sehr großen Längenskalen, auf denen die Fluktuationen der Teilchenabstände vernachlässigt werden können. Der Quantencharakter dieser Wellen ist wegen der durch die thermischen Fluktuationen extrem kurzen Kohärenzzeiten nicht mehr spürbar.3 Bei weiter zunehmender Temperatur lösen sich wiederum Atome aus der flüssigen Phase und bilden die Gasphase. Diese zeichnet sich bei Zimmertemperatur durch eine etwa 1000-mal geringere Dichte, verglichen mit der flüssigen oder der festen Phase, aus. Die Positionen der „Teilchen“ sind im wesentlichen unkorreliert.4 Die kinetische Energie der Teilchen wird mit zunehmender Temperatur und abnehmender Dichte viel größer als die potentielle Energie. Wie wir im folgenden sehen werden, können Phasen paarweise, unter bestimmten Bedingungen aber auch in größerer Zahl koexistieren. Allgemein können wir festhalten, dass (von einigen Sonderfällen abgesehen) die molare Entropie sˆ = S/N und das Molvolumen vˆ = V /N mit zunehmender Temperatur zunächst stetig, beim Übergang in eine andere Phase an der Übergangstemperatur TC dagegen sprunghaft ansteigen. Um eine gegebene Stoffmenge von einer Phase A vollständig in eine andere Phase B überzuführen, ist eine gewisse Entropiemenge und die entsprechende Energiemenge L = TC (SB − SA ), die latente Wärme oder Übergangsenthalpie, entweder zu- oder abzuführen.5 Bei den Schmelz- und Siedetemperaturen gibt es große Unterschiede zwischen den verschiedenen Stoffen. Je stärker die Wechselwirkung und damit die Bindungsenergie, um so höher ist die Übergangstemperatur. Sofern keine Wasserstoff-Brückenbindungen6 oder andere spezielle Bindungstypen wie die metallische Bindung dominieren, sind die Verdampfungsentropien trotz der stark verschiedenen Übergangstemperaturen in etwa (innerhalb eines Faktors 2) gleich groß. Sie beträgt Δˆ sV 7R (Trouton’sche Regel, Aufgabe 9.1). Die relative Konstanz der Übergangsentropien spiegelt die Konstanz der Molvolumina wider, das heißt die Tatsache, dass die Atomradien nur schwach von der Ordnungszahl abhängen. Dagegen spiegeln die latenten Wärmen die genannten Unterschiede in den
3 Eine interessante Ausnahme bilden wiederum die Heliumflüssigkeiten, die bei Atmosphärendruck selbst am absoluten Nullpunkt nicht fest werden. Dies liegt an der wegen der geringen Masse großen quantenmechanischen Nullpunktenergie und der schwachen Wechselwirkung der Heliumatome (Abschnitt 13.4). 4 Liegt das Gas bei tiefen Temperaturen vor, so zeigen sich Korrelationen aufgrund des Quantencharakters der Teilchen. Bosonen zeigen eine Tendenz zur „Verklumpung“, das heißt die Wahrscheinlichkeit mehrere Bosonen an einem Ort anzutreffen ist erhöht. Fermionen gehen sich dagegen gegenseitig aus dem Weg. 5 Ausnahmen sind sogenannte Phasenübergänge 2. Ordnung. 6 Diese sind beispielsweise für die besonderes hohe Verdampfungsentropie des Wassers mitverantwortlich.
278 | 9 Reale Systeme
T
TS(p)
{
$S Koexistenzbereich
S
Abb. 9.1. Erwärmung einer Flüssigkeit bei konstantem Druck. Bei Erreichen der Siedetemperatur TS (p) tritt zusätzlich eine gasförmige Phase auf. Im Bereich der Koexistenz von Dampf und Flüssigkeit ist die Temperatur T = TS konstant. Für den Übertritt einer gewissen Stoffmenge N der flüssigen ist die Gasphase ist die Verdampfungsentropie N · Δˆ s erforderlich. Das Gesamtvolumen beider Phasen vergrößert sich dabei wegen der viel geringeren Dichte des Gases erheblich.
Bindungsenergien wider. Interessante Ausnahmen von der Trouton’schen Regel sind die He-Flüssigkeiten, bei denen die Verdampfungsentropie und -enthalpie einen Faktor 4 für 4 He und 8 für 3 He unterhalb des Wertes liegen, der nach der Siedetemperatur erwartet würde. Diese Abweichungen sind auf den stark von der Masse m ˆ abhängigen Beitrag der quantenmechanischen Nullpunktsenergie zurückzuführen. In gewissen Zustandsbereichen können verschiedene Phasen miteinander koexistieren. Die Phasenkoexistenz ist ein Spezialfall des chemischen Gleichgewichts.
9.2 Verdampfen und Kondensieren Heizt man eine Flüssigkeit bei konstantem Druck durch Zufuhr von Energie und Entropie, so nimmt ihre Temperatur und damit die kinetische Energie ihrer Moleküle kontinuierlich zu. Bei einer bestimmten Temperatur genügt die kinetische Energie der Moleküle, um eine gewisse Anzahl von ihnen gegen die anziehende Wechselwirkung ihrer Nachbarn aus der Flüssigkeit zu lösen und eine zweite Phase – die Gasphase – zu bilden. Mit weiterer Entropiezufuhr steigt die Stoffmenge in der Gasphase im Vergleich zur Menge der Flüssigkeit kontinuierlich an, bis schließlich alle Flüssigkeit verdampft und nur noch Gas da ist. Interessanterweise bleibt die Temperatur während des Verdampfungsprozesses exakt konstant, solange noch Flüssigkeit vorhanden ist. Erst wenn die Flüssigkeit vollständig verdampft ist, erhöht sich die Temperatur des Gases, so wie man dies von einem Erwärmungsprozess erwartet. Wegen der niedrigen Dichte des Gases nimmt das Volumen während des Verdampfungsprozesses beträchtlich zu. Wiederholt man das Experiment bei einem höheren Druck, verläuft das Experiment ähnlich, nur tritt die Gasphase erst bei einer höheren Temperatur auf. Dieser Prozess ist in Abb. 9.1 dargestellt.
279
9.2 Verdampfen und Kondensieren |
Stoff
4He
H2
N2
H2 O
Hg
S
Ag
Si
W
TS
(K)
0.95
14.0
63.1
273
234
388
1235
1683
3695
vˆfest Δˆ vS Δˆ sS LˆS
cm3 /mol
22.3 2.07 45.8 0.0207
22.5 2.83 121 0.117
27.2 2.02 88.9 0.36
18 −1.62 45.4 6.01
14.9 0.52 102 2.29
15.4 0.9 963 1.71
10.3 1.03 109 11.3
12.0 0.6 36.1 50.2
9.5
cm3 /mol J/(K mol) kJ/mol
65.4 35.4
TV
K
4.2
20.4
77.4
373
630
718
2483
3533
6203
Δˆ vV Δˆ sV LˆV
/mol J/(K mol) kJ/mol
0.322 19.8 0.082
1.67 44.3 0.90
6.45 72 5.58
30.6 109 45
51.7 94 58.2
58.9 63 90
204 102 254
290 112 395
509 125 774
Tab. 9.1. Schmelz- und Siedetemperaturen TS und TV , mit den entsprechenden Änderungen der Molvolumina Δˆ v , den molaren Übergangsentropien Δˆ s und molaren latenten Wärmen Lˆ verschiedener Stoffe bei p = 1013 hPa (mit Ausnahme der Schmelzdaten von 4He: p = 25 bar).
Komprimiert man dagegen ein Gas bei konstanter Temperatur, wie in Abb. 9.2 illustriert, so muss Entropie abgeführt werden. Ab einem bestimmten Druck p kondensiert das Gas und koexistiert mit der flüssigen Phase. Bei weiterer Kompression nimmt die Menge der flüssigen Phase auf Kosten des Gasvolumens weiter zu, wobei die in der Gasphase enthaltene Entropie ständig weiter abgeführt werden muss. Der Dampfdruck pD (T ) bleibt dabei solange konstant, bis alles Gas kondensiert ist, und steigt dann wegen der geringen Kompressibilität der Flüssigkeit steil an. Phasenübergänge sind eine spektakuläre Manifestation der Wechselwirkung zwischen den molekularen Konstituenten der Stoffe. Chemisch homogene Stoffe kommen in vielen Fällen in den drei Phasen fest, flüssig und gasförmig vor. Als Beispiel ist in Abbildung 9.3 das Phasendiagramm des Wassers gezeigt, in dem die Phasengrenzlini-
-pdV
p
pD(T)
TdS
{
$V T = const.
Koexistenzbereich
V
Abb. 9.2. Kompression eines Gases bei konstanter Temperatur. Bei Erreichen des Dampfdrucks pD (T ) tritt zusätzlich eine flüssige Phase auf. Im Bereich der Koexistenz von Dampf und Flüssigkeit ist der Druck p = pD (T ) konstant. Für den Übertritt von der Gasphase in die Flüssigkeit muss die Verdampfungsentropie ΔS an die Umgebung abgeführt werden.
280 | 9 Reale Systeme
Abb. 9.3. Schematisches Phasendiagramm des Wassers mit der festen, flüssigen und gasförmigen Phase mit dem Tripelpunkt T und dem kritischen Punkt K. Die in Abb. 9.1 und 9.2 gezeigten Beispiele für Verdampfungs- und Kondensationsprozesse sind durch die horizontalen und vertikalen Pfeile in der {p, T }-Ebene andeutet. Die Verdampfungskurve beginnt am Tripelpunkt (T) und endet am kritischen Punkt (K).
en in der p-T Ebene dargestellt sind. Aus dem Phasendiagramm lässt sich ersehen, in welchen Zuständen {T, p} welche Phase die thermodynamisch stabilste ist. Wie man aus Abb. 9.3 ersieht, ist die Kondensation aus der Gasphase sowohl in die flüssige als auch in die feste Phase möglich. Der Übergang von der festen in die Gasphase heißt Sublimation. Die Funktionen TS (p) und pD (T ), die die Lage des Phasenübergangs in der p-T -Ebene angeben, sind identisch, sofern alle Zustandsänderungen so langsam erfolgen, dass dabei stets thermisches und Druck-Gleichgewicht vorliegt und das Gesamtsystem während des Prozesses stets im thermodynamisch günstigsten Zustand mit der niedrigsten freien Enthalpie bleibt.7 Die Dampfdruckkurve zwischen der flüssigen und der Gasphase endet an einem Punkt {pc , Tc }, welcher der kritische Punkt genannt wird. Kritische Punkte kommen in vielen Systemen vor. Weist ein System mehr als zwei Phasen auf, können auch mehrere Phasen(-Grenzlinien) an einem Punkt zusammentreffen, dem Tripelpunkt. Bei Wasser treffen die Dampfdruckkurve, die Schmelzdruckkurve und die Sublimationskurve bei T = 273.16 K und p = 6.4 mbar zusammen. Aufgrund der eindeutigen Bestimmtheit des Tripelpunktes für einen reinen Stoff eignet er sich als Temperatur-Normal, das heißt zur Festlegung der absoluten Temperaturskala (Abschnitt 9.3.4). Bei vielen Stoffen gibt es nicht nur eine, sondern mehrere feste Phasen, die in unterschiedlichen Zustandsbereichen stabil sind. So gibt es etwa ein Dutzend verschiedene Eisphasen, die sich in ihrer Kristallstruktur unterscheiden. Eine Kristallstruktur mit besonders niedriger Dichte ist auch für die negative Steigung der Schmelzdruckkurve verantwortlich, deren Molvolumen etwa 15 % unter dem flüssigen Wassers bei derselben Temperatur liegt. Dies ist der Grund für das Schwimmen von Eisbergen – aber auch dafür, dass sich der größte Teil eines Eisbergs unter Wasser befindet. An den Phasengrenzlinien treten oft Unstetigkeiten der molaren Größen vˆ(T, p) und sˆ(T, p), das heißt in den 1. Ableitungen der freien Enthalpie der Stoffe, auf, die den
7 Dass dies nicht immer der Fall ist, belegt das Phänomen des Siedeverzugs, das wir später diskutieren werden.
9.3 Phasengleichgewichte
| 281
charakteristischen Unterschieden im mittleren Teilchenabstand und dem EntropieInhalt der beiden Phasen entsprechen. In diesem Fall spricht man von Phasenübergängen 1. Art. Wie wir weiter unter besprechen werden, gibt es auch den Fall, dass vˆ(T, p) und sˆ(T, p) am Phasenübergang stetig sind, aber in den Suszeptibilitäten, das heißt den 2. Ableitungen der freien Enthalpie, eine Unstetigkeit oder eine Singularität auftritt. In diesem Fall spricht man von kontinuierlichen Phasenübergängen oder von Phasenübergängen 2. Art. Kontinuierliche Phasenübergänge treten beispielsweise an den Endpunkten von Phasengrenzlinien auf (Abschnitte 9.6.2, 10.7 und 14.6). Eine ähnliche Systematik lässt sich bei vielen verwandten Phänomenen beobachten: • fest/flüssig (Schmelzen und Erstarren) • fest/gasförmig (Sublimieren und Kondensieren) • Kristallstruktur I / Kristallstruktur II (Gitterverzerrungen) • homogen vermischt/unvermischt (Mischen und Entmischen) • benetzt/entnetzt („Wetting“ und „Dewetting“) • flüssig/nematisch (Flüssig-Kristall mit Richtungsordnung) • flüssig/smektisch (Flüssig-Kristall mit Richtungs- und Schichtordnung) • paramagnetisch/ferromagnetisch • paramagnetisch/antiferromagnetisch • dielektrisch/ferroelektrisch • normalfluid/suprafluid • normalleitend/supraleitend Einige diese Beispiele werden wir später im einzelnen besprechen.
9.3 Phasengleichgewichte 9.3.1 Die Gleichung von Clausius und Clapeyron Das Prinzip der nachfolgenden Überlegungen gilt für alle Phasenübergänge erster Ordnung, wie die oben aufgeführten und viele weitere Beispiele. Das Phasengleichgewicht stellt stets ein inneres Gleichgewicht des aus verschiedenen Phasen im Sinne von Abschnitt 7.2 zusammengesetzten Gesamtsystems dar. Um ein konkretes Beispiel vor Augen zu haben, betrachten wir den Übergang zwischen der flüssigen und der gasförmigen Phase. Zur thermodynamischen Beschreibung der Phasen verwenden wir als unabhängige (äußere) Variablen die Gesamtmenge N = Ngas + Nflüssig , das Gesamtvolumen V = Vgas + Vflüssig und die Gesamtentropie S = Sgas + Sflüssig . Die inneren Variablen Sgas /Sflüssig , Vgas /Vflüssig und Ngas /Nflüssig werden durch das thermische Gleichgewicht T = Tgas = Tflüssig , das Druckgleichgewicht p = pgas = pflüssig und das chemische Gleichgewicht μ = μgas = μflüssig festgelegt. Alternativ zur Vorgabe von {S, V, N } ist bei Vorgabe von {T, p, N } als äußere Variablen nur eine unabhängige innere Variable,
282 | 9 Reale Systeme
P
P Pflüssig
Pflüssig Pgas
Pgas
T
TS(p)
pD(T)
p
Abb. 9.4. Schematische Darstellung der chemischen Potenziale der flüssigen und gasförmigen Phase. Die Steigungen der Kurven entsprechen der (negativen) molaren Entropie −ˆ s beziehungsweise dem Molvolumen vˆ der beiden Phasen. Der Schnittpunkt der Kurve repräsentiert den Zustand des Phasengleichgewichts. Die Verschiebung der Schnittpunkte der chemischen Potenziale als Funktion von T beziehungsweise p definiert die Phasengrenzline im Phasendiagramm (Abb. 9.3).
nämlich Ngas /Nflüssig , vorhanden und durch das innere Gleichgewicht festgelegt, da sˆ(T, p) und vˆ(T, p) für beide Phasen bereits durch die Werte von T und p bestimmt sind, und daher Ngas sˆgas (T, p) Sgas = · Sflüssig Nflüssig sˆflüssig (T, p)
und
Ngas vˆgas (T, p) Vgas = · Vflüssig Nflüssig vˆflüssig (T, p)
nicht mehr unabhängig zu variieren sind. Das chemische Potenzial spielt bei Phasenübergängen eine Doppelrolle: Einerseits stellt es den Antrieb für den Stofftransfer von einer Phase in die andere dar und regelt damit das Phasengleichgewicht. Andererseits sind die verschiedenen G(T, p, N ) = N ·μ(T, p) die für den Variablensatz {T, p, N } zuständigen Massieu-Gibbs-Funktionen der einzelnen Phasen. Jede Phase genügt der Gibbs-Duhem-Relation (Gl. 5.29): dμ = −ˆ s dT + vˆ dp .
Aus den Gibbs-Duhem Relationen (Gl. 5.29) erhalten wir als Zustandsgleichungen für beide Phasen: sˆ(T, p) = −
∂μ(T, p) ∂T
und
vˆ(T, p) =
∂μ(T, p) . ∂p
Da die beiden Phasen verschieden sind, muss auch die funktionale Abhängigkeit der chemischen Potenziale μgas und μflüssig von T und p unterschiedlich sein. Daher bestehen substanzspezifische Differenzen zwischen den molaren Entropien und den Molvolumina der beiden Phasen: Δˆ s = sˆgas (T, p) − sˆflssig (T, p)
und Δˆ v = vˆgas (T, p) − vˆflssig (T, p) .
(9.1)
9.3 Phasengleichgewichte
| 283
1000 10 0.1 pD (mbar)
-3
10
-5
10
-7
Cd Ag Fe Pt
10
-9
10
- 11
10
300
600
1000 T (K)
2000
4000
Abb. 9.5. Gemessener Dampfdruck verschiedener Metalle als Funktion der Temperatur. Die durchgezogenen Linien sind Modellanpassungen, die in Aufgabe 9.7 motiviert werden.
Subtrahieren wir die Gibbs-Duhem Relationen der beiden Phasen voneinander, so erhalten wir d μgas − μflssig = − sˆgas − sˆflssig dT + vˆgas − vˆflssig dp = −Δˆ s dT + Δˆ v dp
Damit erhalten wir aus der Bedingung !
μgas (T, pD ) = μflssig (T, pD )
für chemisches Gleichgewicht zwischen den beiden Phasen die berühmte Gleichung von Clausius und Clapeyron für die Phasenkoexistenzlinie pD (T ): ˆ ) dpD (T ) Δˆ s[T, pD (T )] L(T . = = dT Δˆ v [T, pD (T )] T vˆGas − vˆflssig
(9.2)
s nennt man Die mit der Temperatur T multiplizierte molare Verdampfungsentropie Δˆ die molare latente Wärme oder auch molare Verdampfungsenthalpie: ˆ ˆ ) = Δh(T, s(T, pD (T )) . L(T pD (T )) = T · Δˆ
(9.3)
Die latente Wärme stellt den bei Phasenumwandlung gemeinsam mit der Umwandlungsentropie Δˆ s zu- oder abgeführten Energiebetrag dar. Eine solche Beziehung zwischen der Steigung der Phasenkoexistenzkurve und den Differenzen der molaren Größen existiert für alle Phasenübergänge erster Ord-
284 | 9 Reale Systeme nung. Sie stellt eine Differenzialgleichung für die Phasenkoexistenzkurve dar. Um diese für unser Beispiel der Dampfdruckkurve näherungsweise zu lösen, nehmen wir an, dass das Molvolumen der flüssigen Phase gegen das der gasförmigen Phase vernachlässigbar ist und letztere sich außerdem wie ein ideales Gas verhält: vˆGas − vˆflüssig ≈ vˆGas ≈
kB T . p
ˆ ) vernachWenn wir außerdem die Temperaturabhängigkeit der latenten Wärme L(T lässigen können, erhalten wir die eine Diffenzialgleichung für die Dampfdruckkurve,
Lˆ p dp = dT T kB T
=⇒
dp Lˆ dT = p kB T 2
=⇒
ln
p p(T0 )
=−
Lˆ kB
1 1 − T T0
,
die wir durch Trennung der Veränderlichen lösen können. Mit der Abkürzung p0 = ˆ B T0 )] ergibt sich das Resultat: p(T0 ) exp[L/(k pD (T ) = p0 exp −
Lˆ kB T
.
(9.4)
Unter diesen Annahmen8 (die vor allem in der Nähe des kritischen Punkts keineswegs erfüllt sind) resultiert ein exponentieller Abfall des Dampfdrucks mit fallender Temperatur! Der Dampfdruck von Festkörpern wird durch Gl. 9.4 in der Regel gut beschrieben, weil deren Sublimationsenthalpie oft recht groß ist. Dies spielt bei der Auswahl von Materialien für Ultra-Hochvakuumsysteme (p < 10−8 mbar) eine wichtige Rolle. Die Legierungsbestandteile von konventionellem Lötzinn (überwiegend Pb und Sn) haben bereits bei Zimmertemperatur einen so hohen Dampfdruck, dass dies in solchen Anlagen nicht verwendet werden kann. Bei der Herstellung von dünnen Festkörperschichten durch Aufdampfen bestimmt die Sublimationsenthalpie die für das Erzielen der gewünschten Depositionsrate erforderliche Temperatur. In Abbildung 9.5 sind die Dampfdruckkurven einiger Metalle dargestellt. Der exponentielle Anstieg des Dampfdrucks mit der Temperatur im Zwei-Phasengebiet hat eine wichtige Anwendung in den ersten Dampfmaschinen ebenso wie in modernen Dampfturbinen, weil dadurch bereits bei moderaten Temperaturen die für hohe Leistungen erforderlichen hohen Prozessdrucke erreicht werden. In der Gas-Phase steigt der Druck entsprechend der thermischen Zustandsgleichung dagegen nur linear mit der Temperatur. Deshalb erreichen mit heißer Luft betriebene Stirling-Motoren vergleichsweise kleine Leistungen.
8 Ein weiteres Musterbeispiel für die Gültigkeit dieser Formel sind die Heliumflüssigkeiten, deren bei tiefen Temperaturen exponentiell verschwindender Dampfdruck die durch Verdampfungskühlung erreichbare tiefste Temperatur auf ca. 1 K (0.2 K) bei 4He ( 3He) begrenzt.
9.3 Phasengleichgewichte
| 285
9.3.2 Verdunsten und Sieden Beim Verdunsten und Sieden (zum Beispiel von Wasser) handelt es sich um Nichtgleichgewichts-Prozesse, bei denen aufgrund μflüssig > μGas ein kontinuierlicher Stofftransfer in die Gasphase stattfindet. Eine Flüssigkeit verdampft beziehungsweise verdunstet, solange der Partialdruck des Wasserdampfs in der Gasphase kleiner als der Dampfdruck ist. Wenn beide gleich sind, sind auch die chemischen Potenziale des Dampfes und der Flüssigkeit gleich und es gibt keinen Antrieb für die Phasenumwandlung. Leichtverdunstende, „flüchtige“ Stoffe (zum Beispiel Äther oder Alkohol) haben bei Zimmertemperatur bereits einen hohen Dampfdruck. Die für die Verdunstung erforderliche Entropie wird der Flüssigkeit entzogen und führt zu deren Abkühlung. Dies ist das Phänomen der Verdunstungskälte. Sobald der Dampfdruck größer als der Druck innerhalb der Flüssigkeit ist, können sich auch innerhalb der Flüssigkeit Dampfblasen bilden – die Flüssigkeit siedet. Entsprechend hängt die Siedetemperatur vom Gesamtdruck ab: Auf einen hohen Berg siedet Wasser bei tieferer Temperatur als auf Meereshöhe.
9.3.3 Siedepunkterhöhung und Gefrierpunktserniedrigung In Abschnitt 7.5 hatten wir festgestellt, dass in einer Flüssigkeit gelöste Stoffe, beispielsweise eines Zuckers oder eines Salzes, das chemische Potenzial des Lösungsmittels erniedrigen (Gl. 7.18): μflssig (T, p) = μR,flssig (T, p) − kB T
Ngelst , Nflssig
wobei für Ngelst = Σi Ni die Gesamtmenge aller gelösten Moleküle oder Ionen zu nehmen ist.9 Ähnlich wie bei unserer Diskussion des osmotischen Drucks (Abschnitt 7.6) können wir die daraus resultierende Verschiebung des Phasengleichgewichts in der {p, T }-Ebene bestimmen. Es sei {T0 , p0 } ein Punkt der Phasengrenze der reinen Flüssigkeit. Den Druck wollen wir der Einfachheit halber konstant halten. Die Größen der festen und der Gasphase werden mit dem Index „x“ bezeichnet. Nun entwickeln wir die chemischen Potenziale um den Punkt {T0 , p0 } bis zur ersten Ordnung in ΔT = T − T0 : ∂μR,flssig Ngelst μflssig (T, p0 ) = μR,flssig (T0 , p0 ) + · (T − T0 ) − kB T + ··· ∂T Nflssig ∂μx μx (T, p0 ) = μx (T0 , p0 ) + ∂T
T0 ,p0
· (T − T0 ) + · · · T0
9 Bei einem Salz wie NaCl läuft die Summe über alle beteiligten Ionen.
286 | 9 Reale Systeme
fest
fest flüssig
flüssig
gas
Tschmelz
gas
T
Tsiede
pschmelz
pdampf p
Abb. 9.6. Erniedrigung des chemischen Potenzials der flüssigen Phase durch Zusatz von gelösten Stoffen. Die Schnittpunkte mit den chemischen Potenzialen der festen und der Gasphase verschieben sich nach außen: Es kommt zu einer Erniedrigung der Schmelztemperatur beziehungsweise des Dampfdrucks und zu einer Erhöhung der Siedetemperatur beziehungsweise des Schmelzdrucks.
Wegen ∂μ(T, p) = −ˆ s(T, p) ∂T
und μR, flüssig (T0 , p0 ) = μx (T0 , p0 )
gilt im Phasengleichgewicht zwischen der Lösung und der Phase x bei festem Druck p0 : ΔT = T − T0 =
Ngelst k T 2 Ngelst kB T 0 · = B 0 · . ˆ 0 ) Nflssig sˆx − sˆflssig Nflssig L(T
(9.5)
ˆ ) die mit dem Übergang von der Phase x zur Flüssigkeit verbundene ÜberDabei ist L(T gangsenthalpie, das heißt die mit T multiplizierte Entropieänderung beim Übergang. Die erwartete Verschiebung ΔT der Gleichgewichtstemperatur ist also der zugesetzten Menge Ngelst der gelösten Stoffe proportional. Abhängig von der Differenz der molaren Entropien der beiden Phasen gilt: sˆfest < sˆflssig
⇒
ΔT < 0
Schmelzpunktserniedrigung
sˆgas > sˆflssig
⇒
ΔT > 0
Siedepunktserhöhung
Die experimentelle Bestimmung von ΔT /Ngelöst (in der physikalischen Chemie „Kryoskopie“ beziehungsweise „Ebullioskopie“ genannt) erlaubt also eine Messung der Übergangsentropie des Phasenübergangs, welche in der Regel genauer als deren kalorimetrische Bestimmung ist.
9.3.4 Der Tripelpunkt Für eine homogene Phase ist μ = μ(T, p). Koexistieren zwei Phasen I und II im Gleichgewicht, so liefert die Gleichgewichtsbedingung μI (T, p) = μII (T, p)
9.3 Phasengleichgewichte
| 287
eine Koexistenzlinie, nämlich pD (T ). Stehen dagegen drei Phasen miteinander im Gleichgewicht, so bestehen zwei Gleichgewichtsbedingungen μI (T, p) = μII (T, p)
und
μII (T, p) = μIII (T, p) ,
die nur einen wohlbestimmten Koexistenzpunkt, beispielsweise den Tripelpunkt in Abb. 9.3, erlauben. Diese Betrachtung lässt sich zu der sogenannten Gibbs’schen Phasenregel verallgemeinern:
Koexistieren k Phasen mit jeweils r chemischen Komponenten, so beträgt Zahl der unabhängigen intensiven Variablen 2 + k(r − 1). Da für diese Variablen r(k − 1) Phasengleichgewichtsbedingungen bestehen, beträgt die Dimension der Mannigfaltigkeit der Koexistenzzustände r − k + 2. Die Tripelpunkte verschiedener Substanzen lassen sich aufgrund ihrer für eine Substanz eindeutigen Festlegung als Referenzpunkt für die absolute Temperatur T verwenden. Allgemein verwendet wird der Tripelpunkt des Wassers, der definitionsgemäß auf T = 273.16 K festgelegt wurde. Bei der praktischen Realisierung des Tripelzustandes ist darauf zu achten, dass hochreines Wasser verwendet wird, da gelöste Stoffe nach dem vorangegangenen Absatz das chemische Potenzial des flüssigen Wassers und damit auch den Tripelpunkt verschieben.
9.3.5 Experimente zur chemischen Konstante In Abschnitt 6.1 haben wir gesehen, dass der Absolutwert der Entropie von Gasen durch die Integration der Zustandsgleichungen nicht bestimmt werden kann. In diesem Abschnitt wollen wir darstellen, wie die in Abb. 6.1 zusammengefassten Standardwerte der Entropien experimentell bestimmt werden. Die Messung der Entropie in der Gasphase erfordert eine Messung der molaren Wärmekapazität cˆv (T, p)/T in der festen, der flüssigen und der Gasphase und die anschließende Integration von cˆv (T, p)/T von T = 0 bis 298 K. Wegen der großen Änderungen der Teilchendichte beim Verdampfen oder bei der Sublimation ist es experimentell sehr viel einfacher, diese Messungen bei konstantem Druck durchzuführen. An jedem Phasenübergang 1. Ordnung muss die entsprechende Übergangsentropie zu den durch die Integration von cˆp (T )/T bestimmten Werten hinzuaddiert werden. In Abbildung 9.7 ist eine solche Messung der molaren Wärmekapazität und die daraus gewonnenen Absolutwerte der Entropie exemplarisch für molekularen Sauerstoff O2 dargestellt. Da der experimentell zugängliche Temperaturbereich beschränkt ist, müssen die Werte der Wärmekapazität des Festkörpers zu T → 0 extrapoliert werden. Aufgrund der in Abschnitt 13.2.2 besprochenen Universalität des Tieftemperaturverhaltens der Schwingungsfreiheitsgrade von Festkörpern ist eine solche Extrapolation in aller Regel möglich. Ausnah-
288 | 9 Reale Systeme 60 200
40
20
100 50
f1
0
0
(b)
150 s^ (J/Kumol))
c^ p (J/(Kumol)
(a)
25
f2
f3
50
fl
75 T (K)
g
100
0
0
g
f1 f2 f3 fl
100 T (K)
200
300
Abb. 9.7. a) Molare Wärmekapazität cˆp (T ) von molekularem Sauerstoff bei p = 1013 mbar und Temperaturen zwischen 12 und 125 K. Unterhalb von 12 K wurden die Messdaten mit Hilfe der Debye’schen Formel (13.24) zu T → 0 extrapoliert. Die drei festen Phasen von O2 sind mit „f1 “, „f2 “ und „f3 “, die flüssige Phase mit „fl“ und die Gasphase mit „g“ bezeichnet. Oberhalb von 90 K wurden die Daten der NIST-Datenbank [13] entnommen. b) Durch Integration der Daten in (a) gewonnene Absolutwerte der molaren Entropie. Die Sprünge entsprechen den gemessenen Übergangsentropien von 3.964 J/(K mol), 16.98 J/(K mol), 8.181 J/(K mol) und 75.59 J/(K mol). Die Werte sind inzwischen sehr genau; der gegenwärtig akzeptierte Standardwert für O2 beträgt sˆ◦ = 205.152 J/(K mol) (nach[14]).
men ergeben sich nur, wenn die Atome sehr niederenergetische Freiheitsgrade, wie beispielsweise Kernspins, haben. Diese frieren (mit Ausnahme des flüssigen 3He) erst bei Temperaturen weit unterhalb 1 μK aus und sind durch kalorimetrische Messungen kaum zu erfassen. Wie wir in Abschnitt 10.5 sehen werden, äußert sich dies in einem Zusatzbeitrag Δˆ s = kB ln(2s+1) zur Entropie, wobei s der Wert des Kernspins ist.10 Mit den Absolutwerten der Entropie sind auch die des chemischen Potenzials festgelegt, und letzteres bestimmt die Lage chemischer Gleichgewichte (Abschnitt 7.7).
9.3.6 Der Dampfdruck über realen Mischungen Das Phasengleichgewicht eröffnet eine Möglichkeit, die chemischen Potenziale flüchtiger Stoffe in realen Mischungen experimentell zu bestimmen. Der Partialdruck der Komponenten der Mischung in der Gasphase bestimmt zusammen mit der Temperatur und der chemischen Konstanten das chemische Potenzial in der Gasphase, sofern diese als ideales Gas angesehen werden kann. Sind chemischen Potenziale in der Gasphase bekannt, so können wir wegen des Phasengleichgewichts auf das chemische Po-
10 Die Elektronenspins der freien Atome werden dagegen erfasst, weil diese entweder durch die kovalente oder metallische Bindung zwischen den Atomen oder durch die bei hinreichend tiefen Temperaturen einsetzende magnetische Ordnung fixiert werden.
9.3 Phasengleichgewichte
| 289
tenzial der Mischungs-Komponenten in der flüssigen Phase zurückschließen. In dem Grenzfall, dass der Molenbruch einer der Komponenten viel größer als der der anderen Komponenten ist, liegt eine ideale Lösung vor, wie wir sie in Abschnitt 7.5) besprochen haben. (fl) Nach Gleichung 7.18 strebt das chemische Potenzial μ1 des Lösungsmittels in der flüssigen Phase in diesem Grenzfall linear gegen das des reinen Lösungsmittels und ist gleich dem chemischen Potenzial in den Gasphase. Daher gilt: (g)
(fl)
μ1 (T, p1 , x2 , . . . , xr ) = μ1 (T, p, x2 , . . . , xr ) (fl)
= μ1R (T, p) − kB T
r
xi ,
i=2
wobei p1 der Partialdruck des Lösungsmittels in der Gasphase ist. Nach Gl. 7.18 gilt für ideale Lösungen: (g)
(fl)
(fl)
μ1 (T, p, x1 ) = μ1R (T, p) + kB T ln x1 = μ1R (T, p) + kB T ln
p , p1
wobei x1 der Molenbruch des Lösungsmittels in der Flüssigkeit ist. Wegen des zweiten Gleichheitszeichens muss im Grenzfall x1 → 0 für den Dampfdruck des Lösungsmittels über der Lösung gelten: p1 (T, x1 ) = x1 · pD1R (T )
(9.6)
Dies ist das für ideale Lösungen gültige Raoult’sche Gesetz. Es stellt eine zu Gleichung 7.18 äquivalente Definition einer idealen Lösung dar. Wir betrachten jetzt den Fall einer zweikomponentigen Mischung zweier flüssiger Stoffe A und B und bezeichnen die Molenbrüche in der flüssigen Phase mit x1 und x2 . Der Einfachheit halber nehmen wir an, dass sich beide Stoffe in der Gasphase wie ideale Gase verhalten. Die Stärke der Wechselwirkungen zwischen den Molekülen bestimmt den Dampfdruck – eine stark attraktive Wechselwirkung hat einen niedrigen Dampfdruck zur Folge. Zunächst betrachten wir den Fall, dass die Wechselwirkungen zwischen den Molekülen von A und B gleich stark wie die zwischen den Molekülen der Reinstoffe sind. Nach dem Raoult’schen Gesetz sollte der Druck über einer idealen Mischung p(T, x1 ) = x1 · pD,1R (T ) + (1 − x1 ) · pD,2R (T ) (9.7) betragen, weil die Dampfdrucke der beiden Stoffe diesem Fall jeweils den Molenbrüchen x1 und x2 = 1 − x1 folgen – das Mischungsverhältnis ist in der flüssigen Phase gleich dem in der Dampfphase. Eine gute Annäherung an das ideale Verhalten liefert die in Abb. 9.8a gezeigte Mischung von Ethylenchlorid und Benzol. Wenn jedoch die vom mittleren Abstand rAA zwischen den A-Molekülen bestimmte Wechselwirkungsenergie εAA (rAA ) stark von der Wechselwirkungsenergie εBB (rBB ) zwischen den B-Molekülen abweicht, oder die Wechselwirkungsenergie εAB (rAB ) zwischen der A- und den B-Molekülen stark von εAA und εBB abweicht, dann werden auch
290 | 9 Reale Systeme
Dampfdruck (bar)
0.3
1
gesamt
gesamt
0.8 0.2
0.4
0.1
0
(a)
OÀG tofIGLVX Kohlens
0.6
id lor ch len y Eth
0
0.2
Be nz ol
0.4 0.6 XC2H5Cl
0.8
Aceto n
0.2 1
(b)
0 0
0.2
0.4
0.6 XCS2
0.8
1
Abb. 9.8. a) Gesamtdruck (rot) und Partialdrucke (schwarz) über einer Mischung von Ethylenchlorid (C2 H5 Cl) (Rhomben) und Benzol (C6 H6 ) (offene Kreise). Die beobachteten Abweichungen vom Raoult’schen Gesetz (gestrichelte Linien) sind gering. b) Gesamtdruck (rot) und Partialdrucke (schwarz) über einer Mischung von Kohlenstoff-Disulfid (CS2 , Rhomben) und Aceton (CH3 OCH3 , offene Kreise). Der Dampfdruck der Mischung ist deutlich höher als der der reinen Komponenten. Die Steigung des für kleine Molenbrüche linearen Verlaufs der Dampfdruckkurve liefert die Henry’sche Konstante (nach[14]).
deutliche Abweichungen vom Raoult’schen Gesetz erwartet. Abbildung 9.8b zeigt die Partialdrücke und den Gesamtdruck von Mischungen aus CS2 (A) und Aceton (B), für die gilt: εAB > εAA > εBB .
Da sich Dampfdrucke gerade umgekehrt wie die Wechselwirkungsenergien verhalten, ist in diesem Fall der Dampfdruck der Mischung höher als der nach Gl. 9.7 berechnete, mit den Molenbrüchen gewichtete, Mittelwert der Dampfdrucke der reinen Stoffe. Wenn das Verhältnis pD,1 (T )/pD,2 (T ) der Dampfdrucke vom Mischungsverhältnis x1 /x2 in der flüssigen Phase verschieden ist, so ist auch das Mischungsverhältnis in der Gasphase von dem in der Lösung verschieden. Diese Tatsache liegt der Methode der Destillation zugrunde, welche es erlaubt, Mischungen von Substanzen mit verschiedenen Dampfdrucken voneinander zu trennen. Die Destillation findet in der Regel bei einem (z.B. durch die Atmosphäre) extern vorgegebenen Druck p0 statt, welcher die durch p0 = pD,1 (TV , x1 ) + pD,2 (TV , x1 ) bestimmte Siedetemperatur TV der Mischung festlegt. Wenn die Differenz der Wechselwirkungsenergien εAB von εAA,BB so stark abweicht, dass sich ein Minimum oder Maximum in der Dampfdruckkurve ausbildet (Abb. 9.8b), dann gibt es eine Kombination von x1 und p0 mit: pD,1 (TV , x1 ) x1 . = pD,2 (TV , x1 ) 1 − x1
An diesem Punkt sind die Mischungsverhältnisse von A und B in beiden Phasen gleich – ein solches Gemisch nennt man ein Azeotrop. In einem azeotropen Gemisch ist keine Trennung durch Destillation möglich.
9.4 Instabilitäten in realen Mischungen |
291
Im Grenzfall xi → 1 genügt der zugehörige Dampfdruck pDi dem Raoult’schen Gesetz. Bei hinreichender Verdünnung genügt der Dampfdruck der verdünnten Komponente dem zu Gl. 9.6 komplementären Henry’schen Gesetz pDi (T, xi ) = xi · kH,i (T )
für
xi → 0 ,
(9.8)
wobei die Henry-Konstante kH ein Maß für die Unterschiede zwischen εAB , εAA und εBB ist. Für ideale Mischungen mit εAB = εAA = εBB beträgt die Henry-Konstante kH,i (T ) = pi (T ). Um die bei derartigen Experimenten auftretenden Abweichungen der chemischen Potenziale vom Verhalten idealer Lösungen quantitativ beschreiben zu können, ist es in der physikalischen Chemie üblich, nicht mit dem chemischen Potenzial selbst, sondern mit der durch μ (T, p, {xi }) − μiR (T, p) ai (T, p, {xi }) = exp i (9.9) kB T
definierten Aktivität zu arbeiten, wobei {xi } für die Gesamtheit der xi steht. Bei realen Gasen benutzt man die analog definierten Fugazitäten (Gl. 6.18). Dies hat den Vorteil, dass man die Molenbrüche im Raoult’schen Gesetz, ai (T, p, {xi }) =
pD,i (T, p, {xi }) , pD,iR (T )
aber auch im Massenwirkungsgesetz (Gl. 7.26) r 2
[ai ]νi = K(T, p)
i=1
durch die Aktivitäten ersetzen und so auf reale Stoffe verallgemeinern kann, die beliebig stark vom Verhalten idealer Gase abweichen dürfen. Die Aktivitäten sind über die Dampfdrücke der Gemische und Reinstoffe direkt messbare Größen. Ihnen kommt in der physikalischen Chemie eine erhebliche praktische Bedeutung zu.
9.4 Instabilitäten in realen Mischungen Nachdem wir uns bis jetzt auf eine phänomenologische Behandlung des Phasengleichgewichts beschränkt haben, wollen wir jetzt einfache Modellvorstellungen entwickeln, warum es bestimmten physikalischen Systemen beliebt, in gewissen Zustandsgebieten spontan in zwei verschiedene Phasen zu zerfallen. Bevor wir das Beispiel der realen Gase quantitativ betrachten, wollen wir anhand des Systems der binären (zweikomponentigen) Mischung ein qualitatives Verständnis für das Phänomen der Instabilität einer homogenen Phase entwickeln. Die in Abschnitt 7.4 behandelten idealen Mischungen zeichnen sich dadurch aus, dass die Wechselwirkungen von Molekülen der verschiedenen Komponenten der Mischung untereinander vernachlässigt
292 | 9 Reale Systeme
(a)
e^ o2
e^ 1o
(b) g^ o1 T>0
e^ ww 0
g^ o2
T=0
0.5
1 x1
0
0.5
1 x1
Abb. 9.9. a) Molare Energie eˆ = i xi eˆiR eines idealen Gemischs (schwarz) und Wechselwirkungs beitrag eˆWW in einem realen Gemisch (rot). b) Molare freie Enthalpie gˆ = i xi μiR − T sˆmisch eines idealen Gemischs bei endlichen Temperaturen. Es gibt für alle Temperaturen nur ein Minimum in der freien Enthalpie.
werden können. Das führt dazu, dass die Energie einer idealen Mischung in der Form E(T, p, N1 , . . . , Nr ) = N eˆ(T, p, x1 , . . . , xr ) = N
r
xi · eˆiR (T, p)
i=1
dargestellt werden kann, wobei die eˆRi (T, p) die molaren Energien der reinen Stoffe sind. Die N1 , . . . , Nr sind die Stoffmengen der einzelnen Komponenten, xi = Ni /N 1 die dazugehörigen Molenbrüche und N = i Ni die gesamte Stoffmenge. Das thermodynamische Verhalten der Mischung wird dann von der Mischungsentropie Δˆ smisch (x1 , . . . , xr ) = −kB
r
xi ln xi
i=1
bestimmt, die dafür sorgt, dass die molare freie Enthalpie gˆ(T, p, x1 , . . . , xr ) = eˆ − T sˆ + pˆ v
der Mischung ein einziges Minimum hat, welches dem Zustand homogener Durchmischung entspricht. In Abbildung 9.9 sind eˆ und gˆ für eine zweikomponentige Mischung dargestellt. In diesem Fall ist G(T, p, N1 , N2 ) = N gˆ(T, p, x) und gˆ wegen x1 = x und x2 = 1 − x nur von einem der Molenbrüche abhängig. N = N1 + N2 ist dabei wie in Abschnitt 7.7.1 die Gesamtmenge der beteiligten Stoffe. In realen Mischungen bewirken die Differenzen zwischen den Wechselwirkungsenergien εAA , εBB und εAB zwischen den Molekülen der beiden Mischungskomponenten das Auftreten eines Zusatzterms in der molaren freien Energie: eˆ(T, p, x1 , . . . , xr ) =
r
xi · eˆiR (T, p) + eˆW W (T, p, x1 . . . xr ) ,
i=1
der auch die Exzess-Energie genannt wird. Dieser Zusatzterm macht des System unzerlegbar und führt zu dem Auftreten von Exzessbeiträgen in allen anderen thermodynamischen Größen, zum Beispiel in den chemischen Potenzialen (Dampfdruckanomalien in Abb. 9.8) oder in den Molvolumina (zum Beispiel dem Volumenkontraktionseffekt in Wasser/Ethanol-Mischungen). Wenn eˆWW hinreichend positiv ist, erwarten wir
293
9.4 Instabilitäten in realen Mischungen |
g^
x1
g^ o2
g^ o1
1 homogen vermischt 0.5
a
0
0.5
1 x1
b
entmischt
0
T
Abb. 9.10. a) Molare freie Enthalpie gˆ = ˆWW − T sˆmisch eines realen Gemischs mit i xi μiR + e abstoßender Wechselwirkung zwischen den Komponenten. Die Temperatur nimmt von oben nach unten zu. Bei tiefen Temperaturen bewirkt die Wechselwirkung eine Trennung des Gemischs in zwei Phasen. Der Bereich zwischen den Wendepunkten (rote Punkte) von gˆ ist thermodynamisch instabil. Die durch die gestrichelten Tangentiallinien verbundenen schwarzen Punkte entsprechen Zuständen mit gleichem chemischem Potenzial in beiden Phasen, den Zuständen im Phasengleichgewicht. Der Bereich zwischen den schwarzen Punkten und den Wendepunkten ist metastabil, das heißt thermodynamisch möglich, aber von höherer freier Enthalpie als der entsprechende phasenseparierte Zustand. Mit zunehmender Temperatur wird der Beitrag der Mischungsentropie in gˆ immer wichtiger, bis schließlich nur noch ein Minimum vorhanden ist (schwarzer Punkt auf der untersten Kurve). b) Phasendiagramm des Gemischs. Für Temperaturen unterhalb der kritischen Temperatur (roter Punkt auf der Phasengrenzkurve) existiert eine Mischungslücke, in der kein homogenes Gemisch thermodynamisch stabil ist. Die gestrichelten Linien geben das Metastabilitätsgebiet an. Für Temperaturen oberhalb der kritischen Temperatur ist das homogene Gemisch stabil. Am kritischen Punkt K verschwinden die Mischungslücke und das Metastabilitätsgebiet.
im einfachsten Fall ein Maximum der molaren Energie bei einem Mischungsverhältnis von x = x1 = x2 = 0.5 (rote Linie in Abb. 9.9a). In der freien Enthalpie gˆ bekommen wir dann eine Konkurrenz zwischen der Mischungsenergie und der Mischungsentropie. Abbildung 9.10a zeigt den Verlauf von gˆ(x) für verschiedene Temperaturen. Bei tiefen und mittleren Temperaturen resultiert eine repulsive Wechselwirkung in zwei Minima von gˆ: Das System zerfällt in zwei gemischte Phasen, wobei in einer Stoff 1 und in der anderen Stoff 2 überwiegt. Die chemischen Potenziale μ1,2 (T, p, x) =
∂G(T, p, N1 , N2 ) ∂N1,2
beider Stoffe in beiden Phasen regeln den Stofftransport zwischen den Phasen. Die Zustände chemischen Gleichgewichts erhält man dadurch, dass man von unten eine Tangente an die Kurve gˆ(x1 ) legt, die in der Nähe der beiden Minima berührt. An den Tangentialpunkten ist die Steigung und damit die chemischen Potenziale der Stoffe 1 und 2 in den beiden Phasen α und β paarweise gleich: β μα 1 = μ1 ,
β μα 2 = μ2 .
294 | 9 Reale Systeme
25.1°C
58.8°C
46.1°C
56.4°C
56.9°C
68.7°C
41.9°C
Abb. 9.11. Mischung und Entmischung des Systems Phenol/Wasser bei verschiedenen Temperaturen. Die phenolreiche Phase wurde rot angefärbt.
In dem Bereich zwischen den Wendepunkten von gˆ ist negativer Krümmung ν1 (T, p, x) =
∂ 2 gˆ(T, p, x) < 0 ∂x2
und die homogene Mischung nicht mehr stabil – sie muss in zwei Phasen zerfallen.11 Den verbotenen Bereich zwischen den beiden Wendepunkten, in dem die Teilchenkapazität ν1 negativ ist, nennt man die Mischungslücke. In diesem Gebiet ist keine homogene Mischung möglich. Wir nehmen einen Anfangszustand bei einer hohen Temperatur an, wo der Entropiebeitrag zu gˆ gegenüber dem der Mischungsenergie überwiegt und keine Mischungslücke vorhanden ist. Lassen wir dann die Mischung abkühlen, so separiert die vorher homogene Mischung in zwei Phasen, sobald die Temperatur die Entmischungstemperatur TM (x) für das voreingestellte Mischungsverhältnis x1 /x2 unterschreitet.
11 Wie irreführend der Ausdruck „Mischungsentropie“ ist, zeigte sich, als experimentell festgestellt wurde, dass sich eine hinreichend verdünnte Lösung von 3He in 4He für x3 0.064 bis hin zum absoluten Nullpunkt nicht entmischt (Abschnitt 14.3.4). Das bedeutet, dass die Entropie dieser Lösung nicht durch Gl. 7.13 beschrieben wird, wohl aber dem dritten Hauptsatz genügt. Dieser Widerspruch lässt sich erst im Rahmen der Quantenstatistik lösen (Abschnitt 14.3.4).
9.4 Instabilitäten in realen Mischungen |
295
Am Beispiel des Systems Phenol/Wasser ist die Mischungsinstabilität in Abb. 9.11 gezeigt. Durch die Zugabe eines in Phenol gut löslichen Farbstoffes sind beide Mischungskomponenten unterscheidbar. Bei tiefen Temperaturen sind die beiden Phasen zunächst weitgehend entmischt. Mit steigender Temperatur nehmen die Konzentrationen der Minoritätskomponenten in beiden Phasen zu, und der Dichteunterschied sowie der Farbkontrast zwischen beiden Phasen nimmt ab, bis bei der höchsten Temperatur eine homogen Mischung vorliegt. Mit sinkender Temperatur entmischen die Phasen wieder, was sich zunächst in einer lokalen Trübung bemerkbar macht. Erst nach einiger Zeit trennen sich die beiden Komponenten unter dem Einfluss der Schwerkraft. In Abbildung 9.10b ist die Position der Tangentialpunkte als Funktion der Temperatur aufgetragen. Man erhält das Phasendiagramm der Mischung. Dem Instabilitätsgebiet ist ein Metastabilitätsgebiet vorgelagert. Dort ist zwar ∂ 2 G/∂x2 > 0, aber G liegt oberhalb der Tangentiallinie, die den Werten von gˆ im Zweiphasengebiet entspricht. Das bedeutet, dass das System seine freie Enthalpie reduzieren kann, wenn es in zwei Phasen mit den Konzentrationsverhältnissen der Minima xA und xB zerfällt. Am kritischen Punkt schließlich sind die Mischungslücken und das Metastabilitätsgebiet auf einen Punkt zusammengeschrumpft. Die Grenzkurve zwischen dem stabilen und dem metastabilen Bereich nennt man die Binodale, diejenige zwischen dem metastabilen und dem instabilen Bereich die Spinodale. Die Spinodale ist nur am kritischen Punkt leicht zugänglich, weil sich hier die Binodale und die Spinodale berühren. Am kritischen Punkt liegt ein besonderer Typ von Entmischung vor, den man die spinodale Entmischung nennt. Dabei handelt es sich um einen Phasenübergang zweiter Art, dem kein Metastabilitätsgebiet vorgelagert ist. Die Instabilität der homogenen Mischung (ν < 0) bringt mit sich, dass der chemische Potenzialgradient beider Stoffe dem jeweiligen Konzentrationsgradienten entgegengerichtet ist. Daher diffundieren die Komponenten der Mischung ihrem Konzentrationsgradienten entgegen.12 In der Praxis lässt sich die spinodale Entmischung am ehesten in Systemen mit großen Molekülen – in der Regel Polymeren – beobachten, bei denen die Diffusion sehr langsam (auf der Zeitskala von Stunden und Tagen) erfolgt und daher auch durch schnelle Abkühlung in Zwischenstadien eingefroren und beispielsweise elektronenmikoskopisch untersucht werden kann. Am Ende des nächsten Abschnitts werden wir auf ein analoges Phänomen bei Gasen zurückkommen.
12 In der englischsprachigen Literatur wird dieses Phänomen als „uphill-diffusion“ bezeichnet.
296 | 9 Reale Systeme
9.5 Das reale Gas 9.5.1 Die van der Waals’sche Zustandsgleichung Bei höheren Dichten müssen auch bei Gasen Wechselwirkungen zwischen den Teilchen wichtig werden. Von van der Waals stammen die folgenden Überlegungen, wie die thermische Zustandsgleichung des idealen Gases modifiziert werden kann, um die Wechselwirkung der Gasmoleküle in einem einfachen Modell näherungsweise zu berücksichtigen. Obwohl die neue Zustandsgleichung keine wirklich quantitative Beschreibung liefert, reproduziert sie alle qualitativen Aspekte des Phasenübergangs von der Flüssigkeit zum Gas. Ideales Gas:
p · vˆ = kB T
Ansatz von van der Waals:
(p + π) · (ˆ v − b) = kB T
(9.10)
π : Binnendruck – modelliert Anziehungskräfte zwischen den Molekülen b : Ausschlussvolumen – modelliert Abstoßungskräfte zwischen den Molekülen
Im einfachen Modell harter Kugeln mit dem Eigenvolumen v0 gilt einfach b = v0 = const., während b = b(T, p) für realistische Wechselwirkungspotenziale von Druck und Temperatur abhängt. Für vˆ → 0 (hohe Verdünnung) muss πˆ v → 0 gehen, damit sich das ideale Gasgesetz als Grenzfall ergibt. Wir können daher π(n) als Potenzreihe in n = 1/ˆ v ansetzen: π = cn + an2 + dn3 + · · ·
Setzen wir dies in Gl. 9.10 ein, so erhalten wir im Grenzfall nb 1: p + cn + an2 + dn3 + . . . = nkB T .
Die Konstante c muss verschwinden, um im Grenzfall n → 0 die Zustandsgleichung des idealen Gases zu liefern. Berücksichtigen wir nur den führenden Term an2 in der Dichteabhängigkeit von π , so folgt die van der Waals’sche Zustandsgleichung: p+
a vˆ2
(ˆ v − b) = kB T
oder
p + an2 (1 − nb) = nkB T .
(9.11)
Für praktische Rechnungen bietet es sich an, die thermische Zustandsgleichung des van der Waals-Gases nach dem Druck aufzulösen: kB T a − 2 vˆ − b vˆ
(9.12)
nkB T − an2 . 1 − nb
(9.13)
p(T, vˆ) =
oder p(T, n) =
9.5 Das reale Gas
pv (J/mol) ^
273 K
2000
(a)
(b) U(r)
(c)
U(r)
223 K 1
B2(T) 2/3/r03
123 K
1000
r/r0
¡
173 K
1500
0
-1
65.3 K
-2
1
2
20
50 k T / ¡ B
4
He
-3
33.26 K 40
20
10
Ar
47.8 K
0
r/r0
1
90 K
36.9 K
1
¡
5
500
0
| 297
60
(d) p (bar)
Abb. 9.12. a) Isothermen von molekularem Wasserstoffgas bei verschiedenen Temperaturen. Die grau schattierte Fläche entspricht einem verbotenen Gebiet, welches durch die nahezu inkompressible flüssige Phase entsteht (nach [5]). b) Wechselwirkungspotenzial U (r) in einem Modell harter Kugeln (Kastenpotenzial). c) Lennard-Jones-Potenzial. d)Temperaturabhängigkeit des zweiten Virialkoeffizienten für Argon und Helium (Normierung: siehe Text). Die gestrichelte Linie entspricht einem Kastenpotenzial (b), die durchgezogene Linie dem Lennard-Jones-Potenzial (c) (nach [27]).
Bei Standardbedingungen sind die Abweichungen vom idealen Gasgesetz oft sehr klein: Wie Tabelle 9.2 zeigt, haben die dimensionslosen Korrekturparameter bn und an2 /p für Gase wie Ar, N2 und O2 Werte um 10−3 . In Abbildung 9.12a sind die pˆ vIsothermen von H2 für verschiedene Temperaturen bis hin zu hohen Drucken dargestellt. Deutliche Abweichungen von dem für ideale Gase erwarteten horizontalen Verlauf treten erst in der Nähe der kritischen Temperatur auf, die bei Wasserstoff Tk 33 K beträgt. Die Temperatur, bei der die Steigung der pˆ v -Isothermen das Vorzeichen wechselt, heißt die Boyle-Temperatur TB . Bei Wasserstoff beträgt sie 109 K. Es ist üblich, Korrekturen zur idealen Gasgleichung als Potenzreihe in der Teilchendichte n anzusetzen: p(T, n) = nkB T 1 + nB2 (T ) + n2 B3 (T ) + · · · .
Diese Darstellung der thermischen Zustandsgleichung nennt man die Virialentwicklung und die Koeffizienten B2 (T ), B3 (T ), . . . heißen Virialkoeffizienten.
298 | 9 Reale Systeme Die Entwicklung von Gl. 9.13 nach Potenzen von n liefert die Virialkoeffizienten des van der Waals-Gases: B2 (T ) = b −
a , kB T
B 3 = b2 ,
B 4 = b3 . . .
(9.14)
Die statistische Thermodynamik des realen Gases erlaubt eine Berechnung der Virialkoeffizienten aus dem Wechselwirkungspotenzial U (r) der Gasmoleküle (Abb.9.12b,c). Der zweite Virialkoeffizient ist im wesentlichen durch den mittleren BoltzmannFaktor der potentiellen Energie gegeben [27]: .
∞ d3 r
B2 (T ) = −2π
exp −
U (r) kB T
/ .
(9.15)
0
In Abbildung 9.12d werden normierte Virialkoeffizienten für zwei verschiedene Modelle zusammen mit den experimentellen Daten für Ar und 4He dargestellt. Der Nulldurchgang von B2 (T ) definiert die Boyle-Temperatur TB . Das Kastenpotenzial beinhaltet neben einer ’harten’ abstoßenden Komponente auch einen attraktiven Bereich, und das Lennard-Jones-Potenzial (Fußnote auf Seite 252) r 6 r 12 U (r) = 4ε
0
r
−
0
r
beschreibt die Messungen für nicht zu leichte Gase recht gut. Bei 4He zeigen sich bei tiefen Temperaturen Abweichungen, die auf die in Kap. 12 zu besprechenden Konsequenzen der Nicht-Unterscheidbarkeit der 4He-Atome zurückgehen.
9.5.2 Die Gay-Lussac- und die Joule-Thomson-Expansion Wir fragen nun nach den Unterschieden zwischen realen und idealen Gasen. Eine wichtige Konsequenz der idealen Gasgleichung ist, dass die Energie eˆ(T, vˆ) vom Molvolumen unabhängig ist. Für das reale Gas erwarten wir also eine Temperaturänderung bei der isoenergetischen Expansion im Gay-Lussac-Experiment (Abb. 3.7). Um die entsprechende Vorhersage des van der Waals-Modells zu berechnen, betrachten wir die molare Energie: dˆ e(T, vˆ) = T dˆ s(T, vˆ) − p dˆ v
(Gibbs’sche Fundamentalform)
s, vˆ) keine Massieu-Gibbs-Funktion, wohl Die Funktion eˆ(T, vˆ) ist im Gegensatz zu eˆ(ˆ aber die freie Energie fˆ(T, vˆ) = eˆ(T, vˆ) − T s(T, vˆ). Wenn wir das Differenzial dˆ s(T, vˆ) =
∂ˆ s(T, vˆ) ∂ˆ s(T, vˆ) dT + dˆ v ∂T ∂ˆ v
in die Gibbs’sche Fundamentalform einsetzen, so erhalten wir wegen der MaxwellRelation ∂ˆ s(T, vˆ) ∂ 2 fˆ(T, vˆ) ∂ 2 fˆ(T, vˆ) ∂p(T, vˆ) =− =− = . ∂ˆ v ∂ˆ v ∂T ∂T ∂ˆ v ∂T
9.5 Das reale Gas
| 299
Tab. 9.2. van der Waals-Parameter a und b, kritische Daten (Abschnitt 9.6.2) und Moleküldurchmesser d aus b und Λ (Tabelle 8.1) (Daten aus [11; 14]). Stoff Stoff
a (bar 2 /mol2 )
b (/mol)
Tk (K)
pk (bar)
v ˆk (/mol)
σk
d (nm) aus b
d (nm) aus Λ
He Ne Ar Kr Xe H2 O2 N2 F2 Cl2 Br2 CO CO2 H2 O C 2 H4 C 2 H2 CH4 CH3 OH C25 H12 C 3 H8 C 5 H5 N NH23 CCl4 C6 H6 C 2 H6 C2 H5 OH
0.0346 0.215 1.355 2.349 4.192 0.2452 1.382 1.370 1.171 6.573 9.75 1.472 3.658 5.537 4.612 4.533 2.303 9.476 19.09 9.39 19.77 4.225 20.01 18.82 5.580 12.56
0.0237 0.0155 0.0320 0.0398 0.0516 0.0265 0.0319 0.0387 0.0290 0.0562 0.0591 0.0395 0.0429 0.0305 0.0582 0.0524 0.0431 0.0659 0.1448 0.0905 0.1137 0.0371 0.1281 0.1193 0.0651 0.0871
5.20 44.40 150.86 209.4 289.74 32.98 154.48 126.2 144.30 417.2 588.00 132.91 304.13 647.14 282.34 308.30 190.56 512.50 469.70 369.83 620.00 405.40 556.6 562.05 305.32 513.92
2.29 27.2 48.62 54.80 58.40 12.93 50.43 33.98 51.72 77.10 103.40 34.99 73.75 220.64 50.41 61.38 45.99 80.84 33.70 42.48 56.70 13.53 45.16 48.95 48.72 61.37
0.0578 0.0417 0.0753 0.0921 0.118 0.0642 0.0737 90.010 0.0662 0.1237 0.1270 0.0931 0.0941 0.0560 0.1311 0.1122 0.0986 0.1170 0.3110 0.200 0.243 0.0725 0.276 0.256 0.1455 0.1680
0.307 0.308 0.292 0.290 0.286 0.303 0.288 0.292 0.285 0.275 0.268 0.295 0.274 0.229 0.281 0.269 0.286 0.221 0.268 0.276 0.267 0.244 0.269 0.268 0.279 0.241
0.35 0.30 0.38 0.41 0.44 0.35 0.38 0.40 0.36 0.46 0.46 0.40 0.41 0.37 0.46 0.44 0.42 0.48 0.62 0.53 0.57 0.39 0.60 0.58 0.48 0.52
0.26 0.28 0.34 0.4
0.36 0.38
0.40
für eine isoenergetische Expansion zunächst allgemein: dˆ e(T, vˆ) =
∂ˆ e(T, vˆ) ∂ˆ e(T, vˆ) dT + dˆ v ∂T ∂ˆ v
= cˆv (T, vˆ) dT +
T
∂p(T, vˆ) −p ∂T
!
dˆ v=0.
Im Allgemeinen hängt also eˆ(T, vˆ) nicht nur von der Temperatur, sondern auch vom Volumen ab: ∂ˆ e(T, vˆ) ∂p(T, vˆ) a (9.16) =T − p(T, vˆ) = 2 . ∂ˆ v
∂T
vˆ
Daraus ergibt sich mit Gl. A.3 der gesuchte Ausdruck für die Änderung der Temperatur im Gay-Lussac-Experiment:
300 | 9 Reale Systeme
Abb. 9.13. Bei der Joule-Thomson-Expansion wird ein Gas bei konstantem Druck durch ein Drosselventil getrieben und auf der anderen Seite bei einem niedrigeren Druck wieder abgeführt. Die Drossel dient dazu, für die mit der Entspannung verbundene Entropiezunahme zu sorgen.
*
p − T ∂p(T, vˆ)/∂T ∂T (ˆ e, vˆ) = ∂ˆ v cˆv (T, vˆ)
+ Gay-Lussac-Koeffizient.
(9.17)
Nun können wir den Gay-Lussac-Koeffizienten für das van der Waals-Gas aus Gl. 9.12 berechnen: ∂p(T, vˆ) k = B ∂T vˆ − b
und erhalten damit
∂T (ˆ e, vˆ) 1 a 0 sowie einen instabilen Zweig mit κT < 0 gibt. Die Mehrdeutigkeit ist in Abbildung 9.17 dargestellt und hat eine klare physikalische Interpretation:
Die beiden stabilen Zweige von μ[T, vˆ(T, p)] sind die Massieu-Gibbs-Funktionen der flüssigen und der Gasphase, wohingegen der instabile Zweig keinen realisierbaren Zuständen entspricht. Die chemischen Potenziale beider Phasen ergeben sich also direkt aus unserer Zustandsgleichung vˆ(T, p): pA μ(T, pA ) = μ(T, pB ) +
vˆ(T, p) dp .
pB
Erhöht man den Druck des Gases ausgehend von Zustand 1, so erreicht man bei Zustand 2 das chemische Gleichgewicht zwischen den beiden Phasen (μgas = μflüssig ). Die folgenden Zustände bis Punkt 3 sind noch stabil, haben aber ein höheres chemisches Potenzial als die Flüssigkeit. Ist die Temperatur ausreichend hoch, so kann die Phasenumwandlung spontan einsetzen. Der metastabile Zustand bricht spätestens am Punkt 3 zusammen und es kondensiert so viel Gas, dass die chemische Potenziale μgas und μflüssig wieder gleich sind. Das Modell-System van der Waals-Gas reproduziert also die in Abschnitt 9.2 beschriebene Phänomenologie.
9.6 Der Phasenübergang im van der Waals-Modell
|
307
1
s^
gasförmig
2
3
3
flüssig
s^
instabil
2, 5
1
4 flüssig
5 gas
p = const.
a)
4
TS
T
b)
TS
T
Abb. 9.18. Die Funktionen sˆ(T, p) (a) und μ(T, p) (b) bei p = const. Die Zahlen 1–5 geben in beiden Diagrammen gleiche Zustände während eines Aufheizprozesses an. Die schwarzen Kurven entsprechen den Zuständen der Flüssigkeit, die grünen denen des Gases. Die rot gezeichneten Linien sind absolut instabil.
Wird das System bei μgas = μflüssig , das heißt unter Erhaltung des Gleichgewichts, weiter komprimiert, so bleibt der Druck konstant. Dabei ändert sich das Mengenverhältnis zugunsten der flüssigen Phase. Die dabei zuzuführende Energie muss zum Teil als „Kondensationswärme“ zusammen mit der bei der Kondensation freiwerdenden Entropie an ein Wärmereservoir weitergegeben werden, da die molare Entropie des Gases höher als die der Flüssigkeit ist. Das Wärmereservoir sorgt für die Konstanz der Temperatur bei der Kondensation. Die Kondensation des Gases ist im Zustand 5 vollständig, danach steigt der Druck aufgrund der kleinen Kompressibilität der Flüssigkeit steil an. Die im {p, vˆ}-Diagramm ablesbare sprunghafte Änderung des Molvolumens bei p = pD (T ) entspricht dem Knick von μ(T, p) am Gleichgewichtspunkt. Der Dampfdruck pD (T ) ist durch den Schnittpunkt der beiden stabilen Zweige von μ(T, p) gegeben und durch die Gleichheit der schraffierten Flächen in Abb. 9.17a bestimmt (Maxwell-Konstruktion). Dies folgt aus der Tatsache, dass die Integration von vˆ(T, p) nach p zwischen den Zuständen 2 und 5 zu demselben Wert μ(T, p) führen muss. Statt bei konstanter Temperatur zu komprimieren, kann die Kondensation auch dadurch durchgeführt werden, dass man bei konstantem Druck abkühlt. Die entsprechenden Diagramme für sˆ(T, p) und μ(T, p) bei konstantem p sind in Abbildung 9.18 dargestellt. Die Mehrdeutigkeit in vˆ(T, p) überträgt sich auch auf sˆ(T, p). Abbildung 9.19a stellt eine Schar von Isobaren im {S, T }-Diagramm dar. Die Siedetemperaturen TS (p) sind wieder durch die Gleichheit der chemischen Potenziale bei TS und damit durch eine zu Abb. 9.17a analoge Maxwell-Konstruktion bestimmt. Die sprunghafte Änderung Δˆ s bei der Siedetemperatur entspricht der bei der Kondensaˆ ) = T Δˆ tion abzuführenden latenten Wärme L(T s. Ebenso wie die Flüssigkeit über den Gleichgewichtspunkt 2 hinaus überhitzt werden kann, bis sie spätestens am Punkt 3 „explodiert“ (Siedeverzug), so kann sie beim
308 | 9 Reale Systeme
p/pk
K
16
überkritisch
15 flüssig
0.8
50 40
gasförmig
0.9
1.0 T/ Tk
1.1
0.6 0.7 0.8 0.9 1.0 1.1 1.2
L (kJ/mol)
17 s^ / kB
b)
18
^
a)
30 20 10 0
Wasser Benzol Methanol Aceton
300
400 500 T (K)
600
Abb. 9.19. a) Nach dem van der Waals-Modell berechnete T S-Isobaren eines realen Gases als Funktion der reduzierten Temperatur für verschiedene reduzierte Drucke. Die Siedetemperaturen (punktierte Linien) sind wieder durch die Maxwell-Konstruktion bestimmt. Die instabilen Bereiche sind rot geˆ und die Differenz der molaren Entropien zwischen dem strichelt eingezeichnet. Die latente Wärme L flüssigen und dem gasförmigen Zweig verschwinden mit der Annäherung an die kritischen Punkt (K). Zur Berechnung wurde die chemische Konstante von Argon verwendet. b) Gemessene Verdampˆ verschiedener Stoffe als Funktion der Temperatur. Bei der kritischen Temperatur fungsenthalpien L ˆ verschwindet L (nach Dortmunder Datenbank).
Abkühlen über den Punkt 5 hinaus unterkühlt werden, bis sie spätestens am Punkt 4 „implodiert“. Diese Verzögerung des Phasenübergangs nennt man Hysterese. Sie ist charakteristisch für Phasenübergänge 1. Art, ebenso wie die Koexistenz der Phasen und die Existenz eines Metastabilitätsgebiets zwischen den Punkten 2 und 3 beziehungsweise 5 und 4. Abbildung 9.19a zeigt eine Schar von sˆ(T, p) Isobaren. Bei Annäherung an den kritischen Punkt schrumpfen das Metastabilitätsgebiet und der rot markierte absolut instabile Bereich, bis die kritische Isobare sˆ(T, pk ) am kritischen Punkt eine senkrechte Steigung annimmt. Die entsprechende divergente Wärmekapazität cˆp (T, p) bildet das Gegenstück zu der Divergenz der Kompressibilität in Abb. 9.16a. Die Höhe der Sprünge in sˆ(T, P ) liefert die latenten Wärmen, deren Temperaturabhängigkeit in Abb. 9.19b für verschiedene Stoffe dargestellt ist. Für den Versuch, experimentell in das Metastabilitätsgebiet vorzustoßen, ist die Existenz der energetischen Barriere, das heißt des Maximums in der freien Energie in Abb. 9.16b, entscheidend. Sie verhindert den Übergang von dem metastabilen Einphasen-Zustand in den (absolut) stabilen Zweiphasen-Zustand. Bietet man dem System Keime für die Nukleation der stabilen Phase an, so erniedrigen diese die Barriere, ähnlich einem Katalysator bei chemischen Reaktionen. Will man das Metastabilitätsgebiet in der Praxis ausloten, so kommt es darauf an, Kondensationskeime zu vermeiden und insbesondere Staubpartikel und rauhe Oberflächen zu vermeiden.
9.6 Der Phasenübergang im van der Waals-Modell
|
309
K - 1.4
+ (T, p) + 14 kBT ] / kBTk
- 1.0
- 1.8 1.2 1.0 p/ pk
0.8 0.6
0.8
0.9
T / Tk
1.0
1.1
Abb. 9.20. Numerische Integration der van der Waals-Gleichung zur Berechnung der μ(T, p) darstellenden zweiblättrigen Fläche. Am kritischen Punkt (K) weist μ(T, p) einen Windungspunkt auf. Die Projektion der Schnittlinie zwischen den beiden stabilen Zweigen in die grau schattierte p, T -Ebene ist die Dampfdruckkurve pD (T ). Die beiden metastabilen Zweige brechen an der Stabilitätsgrenze ab. Die Abbildungen 9.17 und 9.18 repräsentieren Schnitte parallel zur T - beziehungsweise p-Achse.
9.6.2 Der kritische Punkt Betrachten wir die van der Waals-Isothermen, so sehen wir, dass die Mehrdeutigkeit von p(T, vˆ) oberhalb einer gewissen Temperatur Tk verschwindet. Für einen gewissen Druck pk hat die zu Tk gehörende kritische Isotherme p(Tk , vˆ) eine horizontale Tangente, die anzeigt, dass die Kompressibilität v (T, p) 1 ∂ˆ κT (Tk , pk ) = − =∞ vˆ ∂p Tk ,pk
an diesem Punkt divergiert. Entsprechend der van der Waals-Gleichung gehört zu Tk und pk auch ein kritisches Molvolumen vˆk beziehungsweise eine kritische Dichte nk = 1/ˆ vk . Den Zustand {Tk , pk } beziehungsweise {Tk , vˆk } nennt man den kritischen Punkt. Bei Temperaturen T > Tk zeigt das van der Waals-Gas keine Instabilität und damit keinen Phasenübergang. Entsprechend endet die Phasenkoexistenzlinie am kritischen Punkt. Ebenso verschwindet die Mehrdeutigkeit der μ(T, p)-Fläche zusammen mit dem Metastabilitätsgebiet am kritischen Punkt. Der kritische Punkt ist ein Windungspunkt der μ(T, p)-Fläche, die in Abbildung 9.20 dargestellt ist. Wir erhalten den
310 | 9 Reale Systeme kritischen Punkt aus der van der Waals-Gleichung mittels folgender Bedingungen: ∂p(T, vˆ) 2a k T =− B 2 + 3 ∂ˆ v (ˆ v − b) vˆ
!
=0
∂ 2 p(T, vˆ) 6a 2kB T − 4 = ∂ˆ v (ˆ v − b)3 vˆ
!
=0
Stationarität, Wendepunkt.
Zusammen mit der Zustandsgleichung p(T, vˆ) ergeben sich daraus die Koordinaten des kritischen Punktes: vˆk = 3b,
pk =
Die Größe σk =
1 a , 27 b2
kB Tk =
8 a . 27 b
(9.25)
pk vˆk 3 = = 0.375 kB T k 8
sollte nach dem van der Waals-Modell also für alle Gase denselben universellen Wert haben. Tatsächlich hat σk für übliche Gase Werte zwischen 0.22 und 0.31 (Tabelle 9.2). Das zeigt an, dass das van der Waals-Modell die Wechselwirkung der Moleküle durch die beiden Parameter a und b zu grob modelliert, um die drei kritischen Größen Tk , pk und vˆk für verschiedene reale Gase zu beschreiben. Geht man von pk , vˆk und Tk als unabhängigen Systemparametern aus, so kann man die van der Waals-Gleichung durch die reduzierten Größen π = p/pk , φ = vˆ/ˆ vk und θ = T /Tk ausdrücken und erhält eine reduzierte Zustandsgleichung: π(θ, φ) =
θ 3 − 2 , σk (3φ − 1) φ
(9.26)
die nur noch σk als einzigen dimensionslosen Systemparameter enthält. Das Theorem der korrespondierenden Zustände postuliert die universelle, das heißt die stoffunabhängige Gültigkeit der reduzierten Zustandsgleichung 9.26. Das Vorliegen eines solches universelles Verhaltens lässt sich am besten dadurch überprüfen, dass man die reduzierten Zustandsgleichungen für verschiedene Gase in dasselbe Diagramm einträgt. Im vorliegenden Fall bietet sich dafür der Kompressionsfaktor Z :=
pV N kB T
an, der für ideale Gase den Wert eins hat. In Abbildung 9.21 sind die Kompressionsfaktoren für eine Reihe von Gasen für verschiedene Werte der reduzierten Temperatur als Funktion des reduzierten Drucks aufgetragen. Es handelt sich um eine Variation von Abb. 9.12, in der auch noch die für das ideale Gas lineare Temperaturabhängigkeit von pˆ v herausdividiert wurde. Auf diese Weise bleiben nur noch Abweichungen vom idealen Verhalten übrig, die sehr schön die starke Reduktion des Kompressionsfaktors in der Nähe des kritischen Punktes zeigen. Tatsächlich fallen die Messpunkte für die gezeigten Stoffe sehr klar auf die universellen, im Rahmen des van der Waals-Modells erwarteten universellen Kurven.
9.6 Der Phasenübergang im van der Waals-Modell
|
311
1.0 2.0
pV / NkBT
1.5 1.3
Stickstoff
1.2
0.5
Methan Propan
1.1
Ethan Butan Isopentan
1.0
0.0
Ethan
T/Tk 0
1
2
3
p/pk
4
5
6
7
Abb. 9.21. a) Illustration des Theorems der korrespondierenden Zustände durch das universelle Verhalten des Kompressionsfaktors pV /N kB T verschiedener Gase als Funktion des reduzierten Drucks. Die verschiedenen Kurven entsprechen verschiedenen Werten der reduzierten Temperatur. Die Daten für die gezeigten Gase fallen mit der Erwartungen nach der van fder Waals-Gleichung (Kurven nach Gl. 9.11) zusammen (nach [14]).
Stoffe mit nicht zu leichten Molekülen mit der van der Waals-Wechselwirkung, beispielsweise Ne, Kr, O2 , N2 , CO oder die leichten Kohlenwasserstoffe, werden durch die van der Waals-Gleichung gut beschrieben. Bei Stoffen mit Wasserstoffbrückenbindungen oder stark von der Kugelform abweichenden Molekülen liefert das van der Waals-Modell jedoch keine quantitativ richtigen Ergebnisse. Trotz aller Schwächen erlaubt das van der Waals-Modell ein prinzipielles Verständnis des Phasenübergangs zwischen Gas und Flüssigkeit. Die experimentelle Überprüfung des durch die van der Waals-Theorie nahegelegten universellen Verhaltens realer Gase war historisch eine entscheidende Motivation, die bei der Verflüssigung der sogenannten „permanenten“ Gase Wasserstoff und Helium (deren Inversionstemperatur weit unterhalb von 300 K liegt) auftretenden Schwierigkeiten zu überwinden. Der Phasenübergang des realen Gases zeigt ein weiteres universelles Phänomen: Bei Annäherung an den kritischen Punkt wachsen die Suszeptibilitäten κT und cˆp über alle Grenzen, während sich vˆ und sˆ (genauer die Mittelwerte ˆ v und ˆ s , Abb. 9.17, 9.19) stetig verhalten. Dies sind die Signaturen eines Phasenübergangs 2. Art. Die Divergenz der Suszeptibilitäten äußert sich darin, dass das System starke thermische Schwankungen, das heißt starke Fluktuationen der lokalen Werte der Dichten n und s zeigt. Diese Schwankungen zeigen sich in der Lichtstreuung in der Nähe des kritischen Punktes. In dem in Abb. 9.22 gezeigten Experiment wird eine Messzelle, in der sich Schwefelhexafluorid (SF6 ) bei der kritischen Dichte (vˆc = 197.4 cm3 /mol, pc = 3.76 bar, Tc =
312 | 9 Reale Systeme
a)
b)
c)
d)
e)
f)
Abb. 9.22. Kritische Opaleszenz von SF6 bei von a)-f) abnehmender Temperatur. Für T Tc a) und T Tc f) ist das Gas farblos. Bei abnehmender Temperatur treten in der Nähe des kritischen Punktes c),d) starke Fluktuationen der Teilchendichte auf. Die Dichtefluktuationen verursachen RayleighStreuung (Text). Wird die Korrelationslänge der Schwankungen mit der Wellenlänge des Lichtes vergleichbar, tritt eine zunehmende Rotfärbung wegen der stärkeren Streuung der blauen Anteile des Spektrums auf b),c). Unterhalb Tc wird die Phasengrenze zwischen Gas und Flüssigkeit sichtbar d)–f).
45.5 ◦C) befindet, mit weißem Licht durchleuchtet. Oberhalb der kritischen Tempera-
tur ist das überkritische Fluid räumlich homogen (Abb. 9.22a) – es gibt nur eine Phase. Bei Annäherung an den kritischen Punkt macht sich der Anstieg der isothermen Kompressibilität κT in Dichteschwankungen bemerkbar (Abb. 9.22b).15 Die Dichteschwankungen sind Vorboten der kommenden Instabilität und verursachen Lichtstreuung an den mit den Dichteschwankungen korrelierten Schwankungen des Brechungsindex. Diese Lichtstreuung ist Rayleigh-Streuung, und ihre Intensität wächst gemäß der Abstrahlcharakteristik eines Hertz’schen Dipols mit ω 4 , sodass blaues Licht stärker gestreut wird als rotes.16 Dies führt zu einer intensiven Rotfärbung des transmittierten Lichts (Abb. 9.22c). Sehr nahe am kritischen Punkt ist die Streuung so stark, dass fast kein Licht transmittiert und das Fluid undurchsichtig wird (kritische Opaleszenz). Unterhalb des kritischen Punktes führt die Instabilität des überkritischen Fluids zur Bildung von über das ganze Volumen verteilten Gasblasen. Die Blasen brechen das Licht stark, ihre Abmessungen sind aber wesentlich größer als die Wellenlänge des Lichts.
15 Hier nehmen wir Gl. 12.18 aus Abschnitt 12.2 vorweg. 16 Dieselbe Frequenzcharakteristik der Rayleigh-Streuung ist für das Himmelsblau und die Rotfärbung des Sonnenlichts bei Sonnenauf- und untergang verantwortlich.
9.6 Der Phasenübergang im van der Waals-Modell
|
313
Deshalb ist die Rotfärbung bei dieser Temperatur verschwunden (Abb. 9.22d). Das Zwei-Phasengemisch trennt sich wegen des geringen Unterschieds der Massendichten von Gas und Flüssigkeit nur langsam. Zuerst erscheint die Phasengrenze (Abb. 9.22e), bevor die gasförmige und die flüssige Phase wieder räumlich homogen und transparent werden (Abb. 9.22f). Die experimentellen und theoretischen Untersuchungen der Suszeptibilitäten in der Nähe von Phasenübergängen 2. Art hat in den 1970er und 80er Jahren gezeigt, dass diese in der Nähe des kritischen Punktes nach Potenzgesetzen von Typ χ(T ) ∼ (T − Tk )γ divergieren, wobei für die Exponenten γ für sehr viele verschiedene Phasenübergänge 2. Art nur ganz wenige Werte von γ gefunden wurden. Offenbar zerfallen die beobachteten Phasenübergänge in wenige Universalitätsklassen, innerhalb derer die kritischen Exponenten γ unabhängig von der Art und Stärke der Wechselwirkung und anderen mikroskopischen Details sind. Derart universelle Eigenschaften sind unter dem Namen kritisches Verhalten bekannt geworden, weil die Universalität nur in der unmittelbaren Nähe des kritischen Punktes vorliegt.
Übungsaufgaben 9.1. Trouton’sche Regel Bei vielen Verdampfungsprozessen beträgt die Verdampfungsentropie in etwa Δˆ sV 7R. Begründen Sie diese Regel. Nützen Sie aus, dass die Teilchendichte im flüssigen Zustand typischerweise 1000 mal größer als im Gaszustand ist und sich die Entropie eines van der Waals-Gases nur um das Kovolumen b von dem eines idealen Gases unterscheidet.
9.2. Dampfdrucktopf In einem Dampfdrucktopf herrscht ein Druck von etwa 1.8 bar. Bei 100◦ C beträgt das Molvolumen der Flüssigkeit 57.8 g/cm3 und der Volumenausdehnungskoeffizient 7.5 · 10−4 /K. Der Wasserdampf kann unter diesen Bedingungen als ideales Gas angesehen werden. Wie groß ist die Siedetemperatur unter diesem Druck, wenn die molare Verdampfungsenthalpie zwischen 100◦ C und 120◦ C von 40.7 kJ/mol auf 39.7 kJ/mol abnimmt?
9.3. Phasendiagramm von Ammoniak In der Nähe des Tripelpunkts sind die Dampfdruck-Kurven von flüssigem und festem Ammoniak durch die Beziehungen ln pV (T ) = 24.38 − 3063/T
und
ln pS (T ) = 27.92 − 3754/T
314 | 9 Reale Systeme
gegeben, wobei p in Pa und T in K gemessen werden. Berechnen Sie den Druck und die Temperatur am Tripelpunkt. Wie groß sind die Sublimations- und Verdampfungsenthalpien sowie die Schmelzenthalpie am Tripelpunkt? 9.4. Latente Wärme und Temperaturausgleich Zwei Liter Wasser mit einer Anfangstemperatur von 20◦ C werden in einen Behälter aus Kupfer (M = 1.5 kg), welcher eine Temperatur von 150◦ C besitzt, langsam eingegossen. a) Berechnen Sie die Wassermenge, die verdampft, bevor der Kupfertopf auf 100◦ C abgekühlt ist. b) Bei welcher Temperatur kommen das übriges Wasser und der Topf ins thermische Gleichgewicht? Hinweis: c˜H2 O = 4.184 kJ/(kg·K), cˆCu = 3kB , m ˆ H2 O = 18.02 u, m ˆ Cu = 63.55 u, ˆ H O = 41.0 kJ/mol. L 2 9.5. Taupunkt und die Kondensation von Wasser Die relative Luftfeuchtigkeit φ(T ) = pH2 O /pD (T ) (pH2 O ist der H2 O Partialdruck) soll durch isobare Abkühlung und die Kondensation von Wasser am Taupunkt (pH2 O = pD (T )) reduziert werden. a) Wie groß ist der H2 O Partialdruck, wenn die relative Luftfeuchtigkeit bei 310 K 80% beträgt (φ(310 K)=80%) ? Der Dampfdruck am Tripelpunkt beträgt 612 Pa. b) Die Luft soll mit einer idealen Carnot-Maschine bis zum Taupunkt abgekühlt werden. Am Taupunkt muss die Verdampfungsentropie abgeführt werden, um den H2 O-Dampf zu kondensieren. Wie weit muss die Luft abgekühlt werden und wieviel Energie ist erforderlich, um den Wasserdampfgehalt von einen Kubikmeter feuchter Luft auf 1/3 zu reduzieren? c) Benutzen Sie die Resultate in a), um abzuschätzen wie tief die Temperatur TNacht in einer Wüstennacht absinken muss, um zur Taubildung zu führen. Nehmen Sie an, dass am Tag bei einer Temperatur TTag = 42◦ C die relative Luftfeuchtigkeit φ = 20% beträgt. 9.6. Sublimationsgleichgewicht bei T → 0 Wie verhalten sich das Molvolumen und die molare Entropie eines einatomigen Gases im Sublimations-Gleichgewicht bei Annäherung an den absoluten Nullpunkt. Ist das Ergebnis mit dem 3. Hauptsatz verträglich? Kann das Gas auch bei sehr tiefen Temperaturen als ideal angesehen werden? 9.7. Dampfdruck von Metallen Entlang der Sublimationskurve pD (T ) eines Festkörpers stehen das Kristallgitter und die Gasphase im chemischen Gleichgewicht: μgas (T, pD ) = μfest (T ). In Aufgabe 3.2 haben wir das chemische Potential eines Festkörpers mit konstanter molarer Wärmekapazität cˆ = 3kB berechnet. Aufgrund des sehr kleinen Molvolumens
9.6 Der Phasenübergang im van der Waals-Modell
|
315
des Festkörpers, kann die Druckabhängigkeit seines chemischen Potenzials gegenüber der des Gases bei niedrigen Drucken vernachlässigt werden. a) Nach der makroskopischen Thermodynamik beträgt das chemische Potential der Gasphase
kB jT 5/2 μgas (T, p) = −kB T ln , (9.27) p
wobei j die chemische Konstante des Gases ist. Zeigen Sie, dass mit diesen Modellannahmen der Sublimationsdampfdruck pD (T ) für T ΘE die Form ln
pS (T ) B T =A+ + C ln 1 mBar T 1K
(9.28)
hat und drücken Sie die stoffabhängigen Konstanten A, B und C durch die Modellparameter eˆB , T ∗ und j aus. b) Berechnen Sie die Modellwerte des Dampfdrucks von Silber (T ∗ = 56 K, eˆB = −kB · 14700 K) und Cadmium (T ∗ = 31 K, eˆB = −kB · 5900 K) für 550 and 1000 K. Welchen Einfluss hat der Spin der Silberatome? 9.8. Thermischer Ausdehnungskoeffizient Berechnen Sie den thermischen Ausdehnungskoeffizienten βp (T, vˆ) des van der Waals-Gases. Hinweis: Gehen Sie von Gl. 9.11 aus, und benutzen Sie die Rechenregeln für partielle Ableitungen. 9.9. Inversionskurve a) Berechnen Sie aus den Gleichungen 9.12 und 9.19 die Inversionskurve des van der Waals-Gases (Gl. 9.20). b) Berechnen Sie die obere und untere Inversionstemperatur bei p = 0 sowie TI und pI für das Maximum der Inversionskurve. c) Berechnen Sie mit den Werten aus Tabelle 9.2 die obere und untere Inversionstemperatur für Stickstoff, Wasserstoff und Helium. Hinweis: Benutzen Sie für (a) das Ergebnis von Aufgabe 9.8 und in (b) die Form 9.13 der Zustandsgleichung. 9.10. Kritisches Verhalten a) Zeigen Sie, dass die reduzierte Zustandsgleichung (Gl. 9.26 mit σk = 3/8) in der Nähe des kritischen Punktes auf die Form 2 3 2 ˆ = − φˆ + τ 4 + 6φˆ + 9φˆ + . . . + . . . π ˆ (τ, φ) 3
gebracht werden kann, wobei die Variablen π ˆ = π − 1, φˆ = φ − 1 und τ = θ − 1 ˆ am und in die Entfernung zum kritischen Punkt messen. Skizzieren Sie π ˆ (τ, φ) der Umgebung des kritischen Punktes.
316 | 9 Reale Systeme
b)
c) d) e) f)
ˆ um den kritischen Punkt bis zur 3. Ordnung in Hinweis: Entwickeln Sie π ˆ (τ, φ) ˆ eine Taylor-Reihe in φ. Der in a) resultierende Ausdruck ist näherungsweise antisymmetrisch in φˆ. Benutzen Sie diese Tatsache, um eine Näherungsformel für die Dampfdruckkurve π ˆD (τ ) abzuleiten. Wie groß ist die Steigung von π ˆD (τ ) am kritischen Punkt? Zeigen Sie, dass die Differenz der reduzierten Volumina die Form φˆg − φˆfl ∝ (−τ )β hat. Berechnen Sie mit Hilfe der obigen Resultate die τ -Abhängigkeit der latenten Wärme und vergleichen Sie mit den experimentellen Resultaten in Abb. 9.19b. ˆ für τ = 0 die Form π Überzeugen Sie sich, dass π ˆ (τ, φ) ˆ ∝ φˆδ hat, und geben Sie δ an. Zeigen Sie, dass die Kompressibilität in der Nähe des kritischen Punktes divergiert: ˆ ∝ τγ , κT (τ, φ)
und bestimmen Sie γ für τ → 0± oberhalb und unterhalb des kritischen Punktes. Hinweis: Berechnen Sie zunächst κ−1 T . Die Exponenten β , γ und δ nennt man die kritischen Exponenten. Die Resultate haben große Ähnlichkeit mit denen am Ende von Abschnitt 10.7. Dies ist kein Zufall, sondern ein Beispiel der Universalität des kritischen Verhaltens in der Nähe von Phasenübergängen 2. Ordnung.
| Teil II: Statistische Thermodynamik –
Teilchen und Quasiteilchen
10 Statistische Thermodynamik am Beispiel von Spin-1/2-Systemen Im ersten Teil des Buches haben wir bereits mehrfach darauf hingewiesen, dass die Konstruktion der Entropie und damit die Thermodynamik insgesamt mit dem Gleichverteilungssatz und daher mit der klassischen Physik nicht kompatibel ist. Im zweiten Teil des Buches wollen wir nun die Verknüpfung der Thermodynamik mit quantenmechanischen Modellvorstellungen betrachten. In diesem Kapitel wird zunächst die begriffliche Verwandtschaft von Quantenübergängen und chemischen Reaktionen beleuchtet. Auf der Basis dieser Analogie wenden wir die bewährten thermodynamischen Methoden auf das chemische Gleichgewicht der Reaktion/des Quantenübergangs Spin↑ Spin↓ an und erhalten die Massieu-Gibbs-Funktionen und damit sämtliche thermodynamischen Eigenschaften von idealen Spinsystemen. Letztere werden am Beispiel der magnetischen Suszeptibilität, der Wärmekapazität und der magnetischen Kühlung erläutert. Dies ist das erste Modell, welches (zumindest in Anwesenheit eines Magnetfeldes) dem 3. Hauptsatz genügt. Den Abschluss des Kapitels bildet eine Diskussion der thermischen Fluktuationen und der Wechselwirkung zwischen Spins, welche schließlich zu magnetischen Phasenübergängen führen.
10.1 Quantenzustände und chemische Spezies Der Inhalt des folgenden Abschnitts lässt sich in der folgenden These zusammen fassen:
Mit der Entwicklung der Quantentheorie und deren Anwendung auf makroskopische Systeme mit vielen inneren Freiheitsgraden ist ein fundamentaler Bedeutungswandel des Begriffes „Teilchen“ verbunden. Wir müssen etwas ausholen, um diese These zu begründen: Mit dem Fortschreiten der Atomphysik wurde offenbar, dass die Atome weniger unteilbar sind als zunächst erwartet wurde, weil sie in einen positiv geladenen Kern und negativ geladene Elektronen zerlegt werden können. Im Atom bilden die Elektronen eine Hülle mit einer für das Element charakteristischen Zahl von Elektronen – solange das Atom elektrisch neutral ist. Mit den Mitteln der Chemie lässt sich die Zahl der Elektronen in der Hülle eines Atoms durch bestimmte, Oxidation oder Reduktion genannte, chemische Reaktionen verändern. Man spricht dann von unterschiedlichen Wertigkeiten der ionisierten Atome oder Moleküle. Aber auch der Atomkern erweist sich als zerlegbar, wenn man genügend Energie aufwendet, beispielsweise indem man ihn mit hochenergetischen Teilchen beschießt. Selbst in Ruhe zeigen manche Atom-
10.1 Quantenzustände und chemische Spezies
| 319
kerne Umwandlungsprozesse, indem sie in andere Atomkerne und weitere Teilchen zerfallen. Eine gewisse Zeit wurden die Elektronen und die Konstituenten des Atomkerns, nämlich die Protonen und Neutronen (auch Baryonen genannt), als Grundbausteine der Materie angesehen. Bald aber zeigte sich, dass auch diese nicht als „elementar“ angesehen werden können, sondern aus Quarks und Gluonen bestehen – wobei die Zerlegung der Baryonen in Quarks auf praktische Schwierigkeiten stößt, weil letztere nur in gebundenen Zuständen vorkommen („confinement“). Gemessen am Tempo der vorangegangenen Entwicklung bewährt sich das letztgenannte (unpoetisch als Standardmodell bezeichnete) System von Grundstoffen seit fast vierzig Jahren erstaunlich gut. Es ist bisher nicht gelungen, Phänomene experimentell zu beobachten, die im Rahmen des Standardmodells nicht zu erklären sind. Für uns ist ein anderer Aspekt wichtiger: Ein Prozess wie die photo-induzierte Oxidation, das heißt die Abgabe eines Elektrons unter Absorption eines Photons, wird in der Chemie als chemische Reaktion klassifiziert. In der (Atom-)Physik würde man ihn eher als Ionisation bezeichnen und darunter einen quantenmechanischen Übergang, nämlich die Anregung eines Elektrons aus einem gebundenen (und diskreten) Zustand mit negativer Energie in einen freien Kontinuumszustand mit positiver Energie, verstehen. Stellt man sich ein einzelnes Atom vor, dem man eines seiner Elektronen auf diese Weise entreißt, so hat man das Gefühl, das anschließend vorhandene freie Elektron sei dasselbe wie das vorher im Atom gebundene! Unsere Anschauung suggeriert uns, dass dieses Elektron ein genauso individualisierbarer Baustein der Materie sei wie ein Baustein unseres Hauses, den man ebenfalls (mit einiger Mühe) aus der Wand lösen könnte. Allgemein suggeriert das in Abschnitt 3.4 dargestellte kinetische Gasmodell, dass Elektronen, Atome und Moleküle nichts anderes als sehr kleine Vertreter des Systems „freier Körper“ sind, die sich nur in ihrer Masse von makroskopischen Objekten unterscheiden. Die moderne Physik lehrt uns aber, dass diese Auffassung in einer Reihe von Hinsichten nicht mit der inzwischen zweifelsfrei anerkannten Struktur der Quantentheorie vereinbar ist. Davon sind (neben den Welleneigenschaften der Materie) folgende Punkte für uns besonders wichtig: 1. Teilchen wie das Elektron sind keine individualisierbaren Objekte, sondern prinzipiell ununterscheidbar. Dies bedeutet, dass diese sogenannten „Quanten-Teilchen“ über keinerlei Merkmale verfügen, die eine individuelle Kennzeichnung – ein Wiedererkennen – ermöglichen. Dies hat wichtige Konsequenzen in der Quantenphysik, wo es sich in der fundamentalen Unterscheidung zwischen Fermionen und Bosonen niederschlägt und, wie wir sehen werden, zu dramatischen Unterschieden im Tieftemperaturverhalten idealer Gase führt. 2. Atome, Moleküle und andere Teilchen sind nicht unvergänglich, wie die Atome Demokrits, sondern können erzeugt und vernichtet werden, sofern dies mit den akzeptierten Erhaltungssätzen für Energie, Impuls, Drehimpuls und einige andere physikalische Größen vereinbar ist! Dies wird am Beispiel des während des Io-
320 | 10 Thermodynamik von Spin-1/2-Systemen nisationsprozesses vernichteten Photons deutlich. Ein anderes Beispiel bildet die Teilchen-Antiteilchen-Annihilation unter Emission von Photonen. Betrachtet man die mathematische Beschreibung des Ionisationsprozesses durch die Quanten(feld)theorie, so sieht man, dass diese die Vernichtung des gebundenen und die Erzeugung eines freien Elektrons mittels eigens zu diesem Zweck eingeführter Operatoren explizit benutzt. Selbst die feldtheoretische Beschreibung der vertrauten Coulomb-Streuung zweier Elektronen aneinander enthält die Vernichtung der einlaufenden und die Erzeugung der auslaufenden Elektronen. Nimmt man diese Beschreibungsweise ernst (und sieht sie nicht nur als eine rechentechnische Zweckmäßigkeit an), so ist die Konsequenz, dass Elektronen in Zuständen mit unterschiedlichen Impulsen durch einen Prozess auseinander hervorgehen, der von einer chemischen Reaktion begrifflich nicht zu unterscheiden ist! Dies gilt nicht nur für Teilchen in verschiedenen Impuls-Eigenzuständen, sondern für alle Teilchen, die von einem Quantenzustand in den anderen übergehen. In einem gewissem Sinne können wir Teilchen in verschiedenen Quantenzuständen als Elementarportionen unterschiedlicher Stoffe ansehen. In den nachfolgenden Kapiteln werden wir sehen, wie sich diese begriffliche Verwandschaft zwischen chemischen Reaktionen einerseits und Quantenübergängen andererseits in der statistischen Thermodynamik explizit verwenden lässt, um bestimmte thermodynamische Potenziale auf der Basis von Modellen zu berechnen. Wir wollen diese zunächst ungewohnte Auffassung am Beispiel der folgenden, üblicherweise nicht dem Bereich der Chemie zugerechneten, Rekombinationsreaktion1 für Ladungsträger in einem Halbleiter noch einmal erläutern: + e− k + hk Photonen .
(10.1)
Analog den chemischen Symbolen für die Elemente steht hier e− für die Elektronen und h+ für die positiv geladenen Löcher. Die Indizes k und k bezeichnen die Welˆ = k auch die Impulse der einlenvektoren und nach den de Broglie-Relationen p laufenden Elektronen- beziehungsweise Lochzustände. Dabei ist = 6.63 J s/Teilchen das Planck’sche Wirkungsquantum. Photonen sind die Quanten des elektromagnetischen Feldes, die bekanntlich auch teilchenartige Aspekte haben. Die Erfüllung der Erhaltungssätze für Energie und Impuls wird dadurch sichergestellt, dass gelten muss: k + k = Photonenimpulse und k + k = Photonenenergien . Analoge Prozesse sind auch mit Phononen, den Quanten der Gitterwellen eines Kristalls, möglich, die wir als Schallquanten ansehen können. Diese sind keineswegs exotisch, sondern spielen in den praktischen Anwendungen der Halbleiterphysik, näm-
1 In Gl. (14.72), Abschnitt 14.5.1 werden wir die Massenwirkungskonstante für diese Reaktion angeben.
10.1 Quantenzustände und chemische Spezies
| 321
lich in Halbleiter-Bauelementen wie der Diode, eine wichtige Rolle. In Abschnitt 14.5 werden wir dies genauer besprechen. In vielem sind Phononen den Photonen – Lichtquanten – sehr ähnlich, nur die Ausbreitungsgeschwindigkeit cSchall ist etwa 100 000 mal kleiner als cLicht . Der analoge Prozess im Vakuum ist die Elektron-Positron-Paarvernichtungsreaktion. Dafür schreiben wir entsprechend: + e− k + pk Photonen ,
wobei p+ für das Positron steht. Die beiden Reaktionen haben gemein, dass die Summe der auftretenden Phonon-(Photonen-)Energien oberhalb einer gewissen Schwelle liegen. Bei der Elektron-Loch-Rekombination ist die Mindestenergie der sogenannte Bandabstand (dieser ist das Festkörper-Äquivalent zur Ionisierungsenergie der Atome). Im Fall der Elektron-Positron-Paarvernichtung ist die Mindestenergie durch die Summe der Ruheenergien (2 · 511 keV/Teilchen) von Elektron und Positron gegeben. So, wie Positronen die Anti-Teilchen der Elektronen im Vakuum sind, stellen die Löcher die Anti-Teilchen der Elektronen in Halbleiter dar. Diese Analogien sind nicht zufällig, denn die Quantentheorie des (idealen) Festkörpers lehrt uns, dass sich die Leitungs-Elektronen im Festkörper genauso frei bewegen können wie Elektronen im Vakuum, nur gewisse Systemkonstanten wie die Masse (oder allgemeiner der EnergieImpulszusammenhang) haben andere Werte beziehungsweise eine andere funktionale Form. Für die Phononen gilt die gleiche freie Bewegung, die nur durch Stoßprozesse mit Elektronen, Löchern, anderen Phononen oder statische Gitterdefekten unterbrochen wird. Solche Stoßprozesse sind unter anderem für den elektrischen und den thermischen Widerstand verantwortlich. Aufgrund der von den Vakuum-Werten abweichenden Werte von Systemparametern wie m ˆ oder v(k) nennt man die Teilchen im Festkörper (im Gegensatz zu denen im Vakuum) gerne Quasi-Teilchen. Der Festkörper im Grundzustand übernimmt in der Festkörperphysik die Rolle des Vakuums in der Teilchenphysik. Die begriffliche Nähe zur Chemie äußert sich auch im thermischen Verhalten der (Quasi)Teilchen: Bei ausreichend hohen Temperaturen ist es möglich, Teilchen/Anti-Teilchenpaare thermisch anzuregen – oder zu dissoziieren, wie der Chemiker sagen würde. Im Halbleiter geschieht dies schon bei Zimmertemperatur, während die thermische Anregung von Elektron-Positron-Paaren im Vakuum Temperaturen von etwa 107 K erfordert, wie sie im Inneren der Sonne herrschen. Ebenso wird bei hinreichend hohen Temperaturen offenbar, dass es sich bei dem System „Wasserstoffgas“ nicht, wie bei Zimmertemperatur, um ein Einstoff-System (H2 ), sondern, wie in Abbildung 10.1 gezeigt, um ein Vierstoff-System (H2 , H, H+ und e− ) handelt. In diesem Zustandsbereich spricht man nicht mehr von Wasserstoffgas, sondern von Wasserstoff-Plasma. Die thermische Dissoziation von H2 und H hat kalorische Effekte, die in der Wärmekapazität sichtbar werden. In allen Fällen werden die Teilchendichten durch das in Abschnitt 7.7.1 besprochene Massenwirkungsgesetz bestimmt. Die in diesen und dem nächsten Kapitel zu entwi-
322 | 10 Thermodynamik von Spin-1/2-Systemen
10
(a)
n (mol/m3)
1 10 -1 10 -2 10 -3
H2 H e-, H+
10 -4 10 -5 300
~
cp (J/g K)
(b) 200
100
0 0
10000
20000
30000
T (K) Abb. 10.1. a) Teilchendichten des Systems „Wasserstoffgas“ bei hohen Temperaturen und p = 1 bar. Die Teilchendichten sind nicht fest vorgebbar, sondern variieren mit der Temperatur. b) Entsprechende spezifische Wärmekapazität c˜p pro Masse. Die Dissoziation/Ionisation und Rekombination der Moleküle/Atome äußert sich in ausgeprägten Maxima bei T 4000 K und 15 000 K in der Wärmekapazität (Daten aus [11]).
ckelnden Methoden erlauben es, den Beitrag der inneren Freiheitsgrade zum chemischen Potenzial der einzelnen Stoffe zu berechnen und die gezeigten Messergebnisse quantitativ zu erklären (Aufgabe 11.9). Unsere Schlussfolgerung ist, dass der Begriff des Teilchens in der Quantenphysik (und ebenso in der Chemie) mit unseren Vorstellungen aus der Newton’schen Mechanik unvereinbar ist. Dies gilt insbesondere für die Vorstellung, dass wir ein einzelnes Teilchen im Prinzip auf seiner Bahn verfolgen und auf diese Weise dessen Individualität selbst in Abwesenheit geeigneter Markierungen aufrechterhalten können. Diese Tatsache müssen wir akzeptieren und nach neuen Bildern für die Veranschaulichung von Quantenprozessen suchen. Die Beschreibungsweise der Thermodynamik, die sich (unter anderem) am Beispiel chemischer Reaktionen entwickelt hat, bietet dafür einen sicheren Rahmen, gerade weil sie sich in ihrem Aufbau nicht auf die
10.2 Zufallsgrößen
| 323
klassisch Newton’schen Begriffe stützt. Einzelne „Teilchen“ sind keine Systeme im Sinne des im Einführungskapitel definierten Systems „freier Körper“, sondern die Basiszustände eines größeren Systems, nämlich des quantisierten Materiefeldes. Dieses System besitzt die Variable „Teilchenzahl“ (wie auch Energie und Entropie). Die moderne Auffassung der Atomistik lässt sich in der Aussage zusammenfassen, dass die Werte der Teilchenzahl ebenso wie die des Drehimpulses ganzzahlig quantisiert sind. Damit fassen wir zusammen:
• • •
Teilchen im gleichen Quantenzustand sind nicht unterscheidbar. Teilchen in verschiedenen Quantenzuständen müssen als verschiedene Stoffe aufgefasst werden. Chemische Reaktionen und Quantenübergänge sind Konzepte mit identischer Struktur.2
Jede chemische Reaktion kann als Quantenübergang aufgefasst werden. Im Folgenden werden wir sehen, dass auch umgekehrt jeder Quantenübergang als chemische Reaktion angesehen werden kann. Die Kraft der thermodynamischen Begriffe wird darin deutlich, dass es für ihre Anwendbarkeit unerheblich ist, ob es sich bei dem zu beschreibenden Stoff um aus Millionen von Atomen bestehende Polymer-Moleküle oder um Quarks und Neutrinos handelt! Ebenso gilt dies für die Quantenmechanik: Die Gesetze der Quanteninterferenz gelten für Photonen ebenso wie für einzelne Atome, für C60 -Moleküle („Bucky balls“) oder gar für die aus hunderttausenden von Atomen bestehenden Bose-Einstein-Kondensate (Abschnitt 13.3.1). Letztere existieren bei Temperaturen im Nano-Kelvin-Bereich, aber ihre thermodynamischen Eigenschaften werden genauso beschrieben wie die von Neutronensternen (Aufgabe 14.7) oder von Supernova-Explosionen bei extrem hohen Temperaturen. Bevor wir anfangen, die thermodynamischen Eigenschaften konkreter Quantensysteme zu besprechen, müssen wir uns einige generelle Züge der Quantentheorie vergegenwärtigen.
10.2 Zufallsgrößen Eine zentrale Aussage der Quantentheorie lautet, dass die Werte der extensiven physikalischen Größen wie beispielsweise E, P , x, L oder N stets als Mittelwerte einer Wahrscheinlichkeitsverteilung aufzufassen sind, die nicht durch eine Einzelmessung, sondern nur durch eine Messreihe experimentell zu bestimmen sind. Die bei den Einzelmessungen auftretenden Messwerte sind die Eigenwerte des die Größe repräsen-
324 | 10 Thermodynamik von Spin-1/2-Systemen tierenden Operators, der über dem Hilbert-Raum der Zustandsvektoren3 |φ des Systems definiert ist. Solche Größen wollen wir im Folgenden Zufallsgrößen nennen. Die (Erwartungs-)Werte einer Zufallsgröße X sind über die Vorschrift X = wi xi mit wi = 1 (10.2) i
i
definiert, wobei die xi die Eigenwerte des X repräsentierenden Operators und die wi die Wahrscheinlichkeiten sind, mit denen die Eigenwerte xi als Resultat der Einzelmessungen in der Messreihe auftreten. Befindet sich das untersuchte System in einem Eigenzustand |φj der gemessenen Größe X , so resultiert bei allen Messungen der zu |φj gehörende Eigenwert xj . Die zu einem solchen Zustand gehörende Wahrscheinlichkeitsverteilung hat die Gestalt wobei δij = 1 für i = j und δij = 0 für i = j .
wi = δij ,
Weist die Größe X ein kontinuierliches Spektrum von Eigenwerten auf, so ist die entsprechende Wahrscheinlichkeitsdichte eine Deltafunktion. Wegen der Schärfe dieser Verteilungsfunktion nennen wir die xi die scharfen Werte der Größe X . Entscheidend ist nun, dass es auch Zustände |φ gibt, die keine Eigenzustände der gemessenen Größe X , sondern Überlagerungen (Superpositionen) von Eigenzuständen mit verschiedenen Eigenwerten sind. Betreibt man (wie dies in der einführenden Quantenmechanik-Vorlesung wohl stets der Fall ist) Quantentheorie für Systeme bei der Temperatur T = 0 K, so ist die Überlagerung mehrerer Eigenzustände wieder ein Vektor aus dem Hilbert-Raum, der dem System zugrunde liegt: |φ = ci |φi . (10.3) i
Die dabei auftretenden Koeffizienten ci = |ci | exp(iϕi ) sind komplexe Zahlen mit wohldefinierten Phasen ϕi . Aus diesem Grund nennt man solche Überlagerungen phasenkohärent. Die Messung der Größe X , das heißt der Kontakt mit einer geeigneten Messapparatur, projiziert den Superpositionszustand in einen Eigenzustand der Größe X . Um die Einzelmessung zu wiederholen, muss man zunächst den Superpositionszustand |φ wiederherstellen und das System dann wieder in Kontakt mit dem Messapparat bringen. Im allgemeinen resultiert dann ein anderer Eigenzustand von X aus der in Gl. 10.3 auftretenden Summe. Die Wahrscheinlichkeiten wi , mit denen die Messwerte xi in der Messreihe auftreten, sind daher durch die Betragsquadrate |ci |2 der in Gl. 10.3 auftretenden Wahrscheinlichkeitsamplituden gegeben: X = φ|X|φ = φi |c∗i X cj |φj = |ci |2 xi = wi xi , (10.4) i
j
i
i
3 Wir benutzen hier die von Dirac stammende „Bra-Ket“-Darstellung der Zustandsvektoren.
| 325
10.2 Zufallsgrößen
|P|
W(|P|)
W( )
P2
z
'(|P|) '
|P|max
z
|P|
z
-
2
0
2
Abb. 10.2. Beispiele für Wahrscheinlichkeitsverteilungen: a) (Quasi)-kontinuierliche Verteilung der Eigenwerte des Impulsbetrags für ein Teilchen im Kasten (nach Maxwell, Abschnitt 3.5). b) Diskrete Wahrscheinlichkeitsverteilung der Eigenwerte der z-Komponente des Elektronenspins in einen ˆx Eigenzustand.
da φi |φj = δij . Die für einen solchen Superpositionszustand resultierenden Mittelwerte X nennen wir im Folgenden unscharf. Die Unschärfe des Mittelwerts ist nichts Mystisches, sondern einfach die aus der Statistik wohlbekannte Streuung des Mittelwerts, das heißt im Wesentlichen die Breite der Verteilungsfunktion: 1/2 1/2 2 ΔX = (X − X )2 = X − X 2 ≥0 (10.5) Das Quadrat (ΔX)2 der Unschärfe nennt man auch die zum Mittelwert X gehörige quadratische Streuung oder die Varianz. In der Regel haben Quantensysteme mehrere extensive Größen, deren Operatoren nicht miteinander vertauschen, das heißt, die kein gemeinsames System von Eigenvektoren besitzen. Misst man zwei nicht-vertauschbare Größen hintereinander, so befindet sich das System nach Messung der ersten Größe nicht in einem Eigenzustand der zweiten Größe und muss daher einen unscharfen Mittelwert haben. Dies ist der Ursprung der berühmten Heisenberg’schen Unschärfe-Relationen. Die in der Quantentheorie unvermeidbar auftretenden Unschärfen stehen im scharfen Gegensatz zur klassischen Physik, wo Streuungen der Messwerte stets als Folge von unvollkommenen Messungen angesehen werden, die mit zunehmender Genauigkeit der Messungen beliebig klein werden müssen. Heute ist allgemein akzeptiert, dass es im Rahmen der Quantenphysik und der Thermodynamik Systeme gibt, die Zustände besitzen, in denen statistische Schwankungen der Messwerte auch bei einer idealen Messung auftreten und daher eine fundamentale Eigenschaft sind. Bei physikalischen Größen mit einem diskreten Eigenwertspektrum kann es vorkommen, dass der Mittelwert mit keinem der Eigenwerte übereinstimmt. Ein in dieser Hinsicht besonders drastisches Beispiel ist das Spin-1/2-
326 | 10 Thermodynamik von Spin-1/2-Systemen System, bei dem die Komponenten des Drehimpulses pro Teilchen ˆx , ˆy und ˆz nur die Eigenwerte ±/2 besitzen. Wenn wir annehmen, dass sich ein System in einem Eigenzustand von ˆz , zum Beispiel mit dem Eigenwert /2, befindet, so sind die Werte4 ˆx und ˆy der anderen beiden Drehimpulskomponenten gleich Null und maximal unscharf. Die Unschärfen dieser beiden Komponenten betragen in diesem Zustand Δˆx = Δˆy = /2 und sind damit gleich unendlich viel größer als die zugehörigen Mittelwerte! Aus Gl. 10.5 lässt sich damit ablesen, dass die Mittelwerte ˆ2x,y = (Δˆx,y ) sind. Dies ist auch der Grund dafür, dass die Eigenwerte des Drehimpuls-Quadrats ˆ2 2 l(l + 1) (= 3/4 2 für l = 1/2) und nicht einfach (l)2 betragen. Kohärente Überlagerungen von Zuständen mit verschiedenen Energie-Eigenwerten εi spielen eine Sonderrolle in der Quantenmechanik, weil die Wahrscheinlichkeitsamplitude ci (t) jedes dieser Zustände nach der zeitabhängigen Schrödinger-Gleichung gemäß
i ci (t) = ci (t = 0) · exp − εi t
(10.6)
von der Zeit abhängt. Da die zeitliche Änderung der Phase für die verschiedenen Energieeigenwerte unterschiedlich schnell ist, kommt es zu einer zeitlichen Veränderung der Mittelwerte derjenigen physikalischen Größen, die nicht mit der Energie vertauschbar sind. Das bedeutet, dass kohärente Überlagerungen von Zuständen mit verschiedenen Energieeigenwerten keine stationären Zustände, das heißt zeitlich nicht stabil sind, sondern sich im Laufe der Zeit entwickeln. Die Energie-Eigenzustände sind dagegen stationär. Weil die quantenmechanische Zeitentwicklung auf den deterministischen (!) Veränderungen der Phasendifferenzen5 der WahrscheinlichkeitsAmplituden ci beruht, lässt sich die Zeitentwicklung als Interferenz-Effekt interpretieren. Zustände, die sich durch einen Zustands-Vektor repräsentieren lassen, werden reine Zustände genannt. Wie wir in Abschnitt 11.11 sehen werden, haben solche Zustände stets die Entropie S = 0. Aus diesem Grund sind sie zur Beschreibung der thermischen Eigenschaften von Quantensystemen ungeeignet. Andererseits wissen wir beispielsweise aus der Optik, dass es auch inkohärente Überlagerungen von Photonenzuständen gibt. Diese zeichnen sich dadurch aus, dass es zwischen ihnen (zumindest auf Zeitskalen, die größer als die Kohärenzzeit sind) keine feste Phasenbeziehung gibt.
4 In der Quantenmechanik ist es üblich, die Mittelwerte X als Erwartungs-Werte zu bezeichnen. Hinter dieser Bezeichnung steckt die alte (klassische) Vorstellung, dass die Unschärfen im Idealfall verschwinden und dass der Mittelwert zugleich stets der wahrscheinlichste Wert sein sollte. In unserem Beispiel zeichnen sich die Eigenzustände von σz durch σx,y = 0 aus, wohingegen die Resultate der Einzelmessungen bekanntlich nur ±/2 sein können. Der „Erwartungswert“ der Observablen wird in diesen Zuständen also nie erwartet! Dieses Beispiel zeigt, dass die Bezeichnung „Erwartungswert“ sehr irreführend sein kann. 5 Ein globaler, das heißt allen ci gemeinsamer Phasenfaktor fällt bei der Bildung der Mittelwerte nach Gl. 10.2 heraus!
10.2 Zufallsgrößen
| 327
Daher zeigen inkohärente Überlagerungen in der Regel keine oder nur schwache Interferenzen. Statistische Schwankungen der Phase sind genau die Eigenschaft, die Zustände mit von Null verschiedener Entropie und damit Systeme bei endlichen Temperaturen auszeichnet! Um Quantenphysik bei endlichen Temperaturen betreiben zu können, benötigen wir also eine geeignete mathematische Darstellungsform für eine Erweiterung des Zustandsbegriff, die es erlaubt, auch inkohärente Überlagerungen von Zuständen zu beschreiben. Im Extremfall vollständig inkohärenter Überlagerung darf die mathematische Darstellung der Zustände gar keine Phaseninformation enthalten. Dieses lässt sich erreichen, wenn wir die Zustände nicht durch Vektoren, sondern durch Projektionsoperatoren, kurz Projektoren darstellen: Pˆi = |φi φi |
(10.7)
In dieser Darstellung der Zustände ist keine Phaseninformation mehr enthalten, weil der Phasenfaktor der Ket-Vektoren |φi zu denen der zugehörigen Bra-Vektoren φi | komplex konjugiert ist und sie sich daher gegenseitig aufheben. Die Projektionsoperatoren sind ein genaues Abbild der Wirkung einer idealen Messapparatur auf ein System im Zustand |φ – sie stellen bei ihrer Anwendung auf |φ einen der Eigenzustände |φi der gemessenen Größe her: cj φi |φj = ci |φi . (10.8) Pˆi |φ = |φi j
δij
Der (Mess-)Wert des Projektors Pˆi ist die Wahrscheinlichkeit |ci |2 , nach der Messung den Eigenwert Xi der Größe X zu finden: ∗ Pˆ = φ|Pˆi |φ = ck cj φk |φi φi |φj = |ci |2 = wi . (10.9) jk
δij δik
Die wiederholte Anwendung eines Projektors ändert das Messergebnis nicht: 2 2 Pˆi , |φ = |φi φi |φi
1
cj φi |φj = ci |φi
j
=⇒
Pˆi = Pˆi .
(10.10)
δij
Mit Hilfe der Projektoren können wir nun mittels ˆ := W
Wi Pˆi =
i
Wi |φi φi |
(10.11)
i
ˆ definieren, der geeignet ist, sowohl reine als auch gemischeinen Zustandsoperator W te Zustände darzustellen. Letztere werde auch statistische Gemische genannt und bilˆ wird den die gewünschten inkohärenten Überlagerungen von reinen Zuständen. W auch der statistische Operator genannt. Die Wi bezeichnen das statistische Gewicht ˆ . Wir betonen, dass W ˆ , obwohl mathematisch ein Opeder reinen Zustände |φi in W rator, keine physikalische Größe ist, sondern den Zustand des Systems repräsentiert!
328 | 10 Thermodynamik von Spin-1/2-Systemen ˆ werden dann über Die Mittelwerte der physikalischen Größen X im Zustand W die Vorschrift ˆ X) = ˆ X|φi X = Spur(W φi |W (10.12) i
definiert, wobei Spur(O) die Spur, das heißt die Summe der Diagonalelemente des Operators O ist. Auf diese Weise wird eine kombinierte Mittelung über das statistische ˆ und das statistische Gewicht wi der Eigenwerte Gewicht Wi der reinen Zustände in W Xi von X in den reinen Zuständen |φi durchgeführt. Die korrekte Normierung der ˆ ) = 1 beziehungsweise Wahrscheinlichkeiten wird durch die Bedingungen Spur(W 1 i Wi = 1 und φ|φ = 1 sichergestellt. Hat der Hilbert-Raum des physikalischen ˆ als Matrix darstellen und wird Systems endlich viele Dimensionen, so lässt sich W auch die Dichtematrix genannt. ˆ im allgeWerden die Zustände |φi in einer beliebigen Basis dargestellt, so ist W meinen nicht diagonal. Ein reiner Zustand kann aber in jeder Basis dadurch identifiˆ erfüllen muss (Gl. 10.10). ˆ2=W ziert werden, dass er stets die Bedingung W Da in der Thermodynamik in der Regel stationäre Zustände ohne Zeitentwicklung betrachtet werden, handelt es sich dabei um statistische Gemische aus den Eigenzuständen |ψ der Energie, die der zeitunabhängigen Schrödinger-Gleichung H|ψi = εi |ψi ˆ dann stets diagonal. In diesem genügen. In der Basis der Energie-Eigenzustände ist W ˆ Fall braucht uns die Operator-Natur von W nicht weiter zu kümmern, und wir können allein mit den Wahrscheinlichkeiten Wi der Energieeigenzustände operieren. Dabei wird sich (zur Freude des Experimentalphysikers) herausstellen, dass für die thermodynamischen Eigenschaften nur die Eigenwerte der physikalischen Größen und nicht die komplizierte mathematische Maschinerie des Hilbert-Raums benötigt werden. Schließlich wollen wir festhalten, dass die (Mittel-)Werte der physikalischen Größen auch in der Quantenphysik stetig variabel sind, obwohl ihre Eigenwerte in vielen Fällen diskret sind.6 Das liegt daran, dass die Mittelwerte nicht nur durch die in der Regel diskreten Eigenwerte, sondern auch durch die kontinuierlich variablen Wahrscheinlichkeiten bestimmt werden. Dies bedeutet, dass wir erwarten können, mit den (Mittel-)Werten in gewohnter Weise Differenzialrechnung betreiben zu können, was Voraussetzung für die in der Thermodynamik notwendigen Rechenoperationen ist. Unsere zentrale Aufgabe bei der thermodynamischen Behandlung von Quantensystemen ist daher die Bestimmung der Wahrscheinlichkeiten Wi , mit denen die reiˆ auftreten. Dieser Aufgabe wollen wir uns in den folgenden nen Zustände |ψi in W Abschnitten widmen. Mit Hilfe der Wahrscheinlichkeiten können dann die Mittelwerte der physikalischen Größen (und damit die thermodynamischen Zustandsgleichungen des Systems) aus den Modellvorstellungen berechnet werden. Um das Prinzip zu
6 Diese Eigenschaft gibt bekanntlich zu der Bezeichnung Quanten-Physik Anlass.
10.3 Zustände und Zufallsgrößen des Spin-1/2-Systems |
329
verdeutlichen, wollen wir zunächst das konkrete Beispiel eines Systems von Spin-1/2Teilchen untersuchen, bevor wir eine allgemeine Strategie zur Berechnung der Wi beschreiben.
10.3 Zustände und Zufallsgrößen des Spin-1/2-Systems Das einfachste Quantensystem hat nur zwei linear unabhängige Zustände. ZweiZustands-Systeme sind in der Natur vielfach realisiert. Ein handliches Beispiel sind an einem Ort lokalisierte Teilchen mit dem Spin 1/2, wie sie beispielsweise in paramagnetischen Festkörpern auftreten. Betrachten wir ein einzelnes solches Teilchen, so stellen wir fest, dass es sich um eine quantenmechanische Variante des archetypischen Systems „Rotator“ handelt, welches aber insofern speziell ist, als dass es nur zwei Zustände mit den Drehimpuls2 Eigenwerten ˆz = ±/2 besitzt. Das Quadrat des Spins pro Teilchen ˆ = 3/4 2 ist dabei eine Systemkonstante. Die z -Richtung sei durch ein nach oben orientiertes externes Magnetfeld B ext ausgezeichnet. Auf diese Weise sind die Eigenzustände von ˆz zugleich auch die Eigenzustände der Energie. Für dieses System ist also der Drehimpuls eine Zufallsgröße, deren Werte durch die Wahrscheinlichkeiten W↓ und W↑ festgelegt werden:
ˆz = W↓ (−/2) + W↑ /2 = W↓ − W↑ /2 .
Bei den meisten Teilchen mit Spin ist der Drehimpuls pro Teilchen mit einem magnetischen Moment pro Teilchen m ˆ z verknüpft:7 1 m ˆ z,↓,↑ = −gμB ±
2
,
wobei μB =
e = 9.274 · 10−24 J/(T Teilchen) = 5.788 · 10−5 eV/(T Teilchen) 2m ˆ el
das Bohr’sche Magneton, g das gyromagnetische Verhältnis und m ˆ el die Ruhemasse des Elektrons ist. Für freie Elektronen gilt in guter Näherung g = 2, das heißt, m ˆ z,↑ = μB (Grundzustand) und m ˆ z,↓ = −μB (angeregter Zustand). Dabei gibt der Pfeil die Richtung des magnetischen Moments an: ↑ entspricht der parallelen und ↓ der anti-parallelen Orientierung des magnetischen Moments in Bezug auf das externe Magnetfeld.
ˆ 7 In diesem Zusammenhang sollte keine Gefahr bestehen, das magnetische Moment pro Teilchen m mit der Masse pro Teilchen m ˆ zu verwechseln. . .
330 | 10 Thermodynamik von Spin-1/2-Systemen
Abb. 10.3. Externes Magnetfeld B ext , magnetisches Moment m ˆ und Drehimpuls (Spin) ˆ eines Teilchen mit dem Spin ˆ = ±1/2.
10.4 Chemisches Gleichgewicht im Spin-1/2-System Nun wollen wir einen kristallinen Festkörper betrachten, in dem N magnetische Atome mit dem Spin 1/2 eingebaut sind. Wir wollen annehmen, dass die Orientierung der einzelnen Spins frei umgekehrt werden kann, wenn das externe Magnetfeld verschwindet, und dass etwaige Wechselwirkungen zwischen den Spins vernachlässigt werden können. Der Wert8 der z -Komponente des magnetischen Moments des Festkörpers beträgt dann ˆ z = −N · gμB ˆz = N μB (W↑ − W↓ ) . mz = N · M
(10.13)
ˆ z und ˆz die Mittelwerte des Operators M ˆ für das magnetische MoDabei sind M ment pro Teilchen und des Drehimpulses pro Teilchen. Getreu der Auffassung, dass Teilchen in unterschiedlichen (orthogonalen!) Quantenzuständen als chemisch verschiedene Spezies anzusehen sind, wollen wir dieses System nun als Gemisch zweier Teilchensorten mit entgegengesetzten Spin-Orientierungen ↑ und ↓ auffassen und analog den Gasgemischen aus Kapitel 7 thermodynamisch beschreiben. Dann sind N↑ = N W↑ und N↓ = N W↓ stetige Mengenvariablen im Sinne der Thermodynamik, weil die Wahrscheinlichkeiten W↑ und W↓ stetig variabel sind. Dagegen ist die Summe N = N↑ + N↓ entsprechend der Zahl der Atome im Festkörper fest und fluktuiert nicht. Unsere entscheidende Annahme ist, dass Entropie des Systems in derselben Weise wie die Mischungsentropie von Gasen in Kapitel 7 mit den beiden Mengenvariablen N↑ und N↓ zusammenhängt:
N↓ N↑ N↑ N↓ S = −N kB + . (10.14) ln ln N
N
N
N
Diese Annahme ist zunächst vielleicht überraschend, weil die Spins in unserem Beispiel im Gegensatz zu den Gasmolekülen räumlich fixiert sind, sie wird sich aber im
8 Aus Gründen der kompakteren Schreibweise unterdrücken wir die Klammern · · · bei den makroskopischen Größen m, L und E, obwohl es sich auch bei diesen selbstverständlich um Mittelwerte handelt. Wie wir weiter unten sehen werden, ist deren relative Schwankungsbreite ΔX/X allerdings meist sehr klein.
10.4 Chemisches Gleichgewicht im Spin-1/2-System | 331
Folgenden als Konstruktionsmittel ersten Ranges erweisen. Die intensiven und hier als unabhängig angenommenen Variablen des Systems sind die Temperatur T und das externe Magnetfeld B ext = (0, 0, Bext ).9 Die für diesen Variablensatz zuständige Massieu-Gibbs-Funktion ist die freie Energie im Magnetfeld (Abschnitt 5.1.5) F (T, Bext , N↑ , N↓ ) = U − T S = E − T S − mz Bext .
Hierbei ist E = H die Energie des Spinsystems im Nullfeld, U = H−Mz Bext die in Abschnitt 5.1.4 definierte Legendre-Transformierte der Energie bezüglich mz und Mz der mz repräsentierende Operator. Damit erhalten wir als Massieu-Gibbs-Funktion des Systems:
F T, Bext , N↑ , N↓
= −kB T
N↑ ln
N↑ N↓ + N↓ ln N ↑ + N↓ N ↑ + N↓
− μB Bext N↑ − N↓
.
(10.15)
Durch Differenzieren nach T und Bext gewinnen wir die kalorische und die magnetische Zustandsgleichung des Spinsystems: ∂F = −S , ∂T
∂F = −mz . ∂Bext
(10.16)
Um eine Bestimmungsgleichung für das Verhältnis N↑ /N↓ zu erhalten, differenzieren wir Gl. 10.15 nach N↑ und nach N↓ . Damit erhalten wir ein Paar von „chemischen“ Zustandsgleichungen, nämlich
N↑ ∂F μ↑ = = −μB Bext +kB T ln , (10.17) ∂N↑ N ε↑
μ↓ =
∂F = +μB Bext +kB T ln ∂N↓
N↓ N
.
(10.18)
ε↓
Dabei sind μ↑ und μ↓ die zu beiden Teilchensorten gehörenden chemischen Potenziale sowie ε↑ und ε↓ die Eigenwerte des Operators H − Mz Bext für einen einzelnen Spin. Wenn wir annehmen, dass sich ↑- und ↓-Spins unter Austausch von (zirkular polarisierten) Photonen oder Phononen frei ineinander umwandeln können, wird sich (wie bei allen chemischen Reaktionen) ein chemisches Gleichgewicht gemäß der folgenden Reaktionsgleichung zwischen beiden Teilchensorten einstellen: ↑↓ +γ ,
(10.19)
9 Die im Prinzip ebenfalls vorhandene Abhängigkeit von V wollen wir in diesem Abschnitt außer Acht lassen, indem wir p = 0 annehmen. Damit fällt die V -Abhängigkeit aus allen thermodynamischen Relationen heraus.
332 | 10 Thermodynamik von Spin-1/2-Systemen wobei das zirkular polarisierte Photon oder Phonon γ die Erhaltung von E und L bei den notwendigen Spinflip-Prozessen sicherstellt. Das chemische Potenzial thermisch angeregter Photonen ist identisch gleich Null (Abschnitt 13.1). Als Bedingung für das chemische Gleichgewicht erhalten wir daher:
N↑ N↓
μ↑ − μ↓ = ε↑ − ε↓ + kB T ln
!
=0.
Aus der Gleichheit der chemischen Potenziale folgt für das Verhältnis N↑ /N↓ :
ln
N↑ N↓
=−
ε↑ − ε↓ kB T
und schließlich
ε↑ − ε↓ N↑ = exp − N↓ kB T
(10.20)
.
Die Menge der durch das externe Magnetfeld bevorzugten ↑-Spins ist also stets größer als die der ↓-Spins. Im Grenzfall T = 0, das heißt im Grundzustand des Systems, gibt es nur ↑-Spins und keine ↓-Spins: N↑ = N und N↓ = 0. Bei endlichen Temperaturen T > 0 ist es möglich, einen Teil der Spins thermisch anzuregen, und es gilt N↑ > N↓ > 0. Im Grenzfall T → ∞ oder Bext → 0 ergibt sich schließlich Gleichbesetzung: N↑ = N↓ = N/2. Im Fall von einem beliebigen Quantensystem mit einer festen Zahl N von unterscheidbaren10 Teilchen, von denen sich jedes in einem von r linear unabhängigen Quantenzustand befindet, lässt sich Gl. 10.20 leicht verallgemeinern. Zur Berechnung von μi ist dann Nj = N −
Nk
k =j
zu setzen und nach Ni zu differenzieren. Wiederum durch die Annahme chemischen Gleichgewichts zwischen allen Teilchenspezies, das heißt durch paarweises Gleichsetzen von μi und μj , ergibt sich
Nj = Ni · exp
εi kB T
· exp −
εj kB T
.
Schließlich liefert die Bedingung, dass die Summe aller k Teilchenzahlen Ni durch 1 N = i Ni fest vorgegeben ist, die Absolutwerte der Teilchenzahlen und die gesuchten Wahrscheinlichkeiten:
r r εj εi N=
Nj = Ni exp
j=1
kB T
·
exp −
j=1
Z(T )
10 Der Sinn dieser Einschränkung wird in Abschnitt 11.10 klar werden.
kB T
.
10.4 Chemisches Gleichgewicht im Spin-1/2-System | 333
Die auf der rechten Seite aufgetretene Summe der Boltzmann-Faktoren
exp −
εi kB T
über alle Zustände nennt man die kanonische Zustandssumme Z(T ). Damit erhalten wir: exp (−εi /kB T ) N Wi = i = (10.21) N
Z(T )
Damit haben wir ein zentrales Ergebnis der statistischen Thermodynamik, nämlich die zuerst von Boltzmann gefundene und nach ihm benannte Verteilungsfunktion für die Wahrscheinlichkeiten von Quantenzuständen in einem statistischen Gemisch hergeleitet. Das sogenannte „thermodynamische Gleichgewicht“, für das die Boltzmann-Verteilung Gültigkeit beansprucht, entpuppt sich also als ein chemisches Gleichgewicht zwischen den verschiedenen Spinsorten. Eine praktische Anwendung dieser Überlegungen ergibt sich in einem modernen Gebiet der Festkörperphysik, nämlich der Spintronik,11 deren Ziel die Einbeziehung des Spin-Freiheitsgrads in die Halbleiter-Elektronik ist. Während die Spins der beweglichen Elektronen in den üblichen Halbleiterbauelementen unpolarisiert sind, interessiert man sich gegenwärtig sehr stark für ferromagnetische Halbleiter. Diese weisen eine spontane Spinpolarisation auf, wie sie in Abschnitt 10.7 besprochen wird. Bringt man einen unmagnetischen und einen ferromagnetischen Halbleiter in elektrischen Kontakt, so führt das Fließen eines elektrischen Stroms von einem Material ins andere zur Ausbildung einer Nichtgleichgewichtszone auf beiden Seiten der Grenzfläche. In dieser Zone ist das chemische Gleichgewicht gestört, das heißt die (elektro-)chemischen Potenziale μ↓ und μ↑ sind verschieden, weil die Konversion von einer Spinsorte in die andere mit einer endlichen Reaktionsrate, der Spin-Relaxationsrate, erfolgt. Dieses Beispiel illustriert, dass dieser an chemischen Reaktionen entwickelte Sprachgebrauch ausgezeichnet geeignet ist, die traditionelle Physik der Spinsysteme und modernste Forschungsaktivitäten im Gebiet der Spintronik in einer einheitlichen Weise zu beschreiben. Schließlich wollen wir noch zeigen, welche physikalische Bedeutung die Zustandssumme hat. Dazu bilden wir zuerst den Logarithmus von Gl. 10.21 ln
Ni ε = − i − ln Z(T ) N kB T
und setzen das Ergebnis dann in F (Gl. 10.15) ein: F (T, Bext , N ) =
i
εi Ni + kB T
i
Ni ln
Ni N
11 Dieses Kunstwort resultiert aus einer Verschmelzung der Worte „Spin“ und „Elektronik“.
334 | 10 Thermodynamik von Spin-1/2-Systemen =
εi N i +
i
Ni (−εi ) −kB T
i
Ni ln Z(T )
i
=0
Damit erhalten wir F (T, Bext , N ) = −N kB T · ln Z(T, Bext ) ,
wobei Z(T, Bext ) =
exp −
i
εi (Bext ) kB T
(10.22)
die Zustandssumme für einen Einzelspin ist. Da die Spins als voneinander unabhängig angesehen werden, ist die freie Energie des N -Spinsystems einfach das N -fache der freien Energie des Einzelspinsystems. Da in das obige Resultat allein die Eigenwerte εi eingehen, können wir unseren Ansatz auf beliebige Quantensysteme mit scharfer (das heißt nicht fluktuierender) Teilchenzahl verallgemeinern. Die statistische Thermodynamik erlaubt es also, die Massieu-Gibbs-Funktionen solcher Systeme mit Hilfe von Modellen, welche deren Energie-Eigenwerte εi liefern, theoretisch zu berechnen! Damit haben wir einen völlig neuen Zugang zu den Massieu-Gibbs-Funktionen und somit zu allen thermodynamischen Eigenschaften, der den bisher von uns benutzten überwiegend empirischen Zugang ergänzt, Vorhersagen für neue Experimente ermöglicht und unser Verständnis der untersuchten Systeme wesentlich vertieft.
10.5 Der ideale Spin- 1/2-Paramagnet Auf der Basis der obigen allgemeinen Betrachtung sind wir nun in der Lage, Z für einen einzelnen Spin und F für das N -Spin-System sofort anzugeben:12
Z(T, Bext ) = exp −
μB Bext kB T
= 2 cosh
μB Bext kB T
+ exp
μB Bext kB T
(10.23)
.
Die Massieu-Gibbs-Funktion des N -Spin-Systems erhalten wir nach Gl. 10.22:
F (T, Bext , N ) = −N kB T · ln 2 cosh
μB Bext kB T
.
(10.24)
12 Hier nehmen wir an, dass die betrachtete Probe die Gestalt eines dünnen Stabes hat und das Magnetfeld parallel zum Stab anliegt. Dann können wir die in Anhang F beschriebenen Entmagnetisierungseffekte vernachlässigen, die ansonsten eine Modifizierung der Zustandsgleichung bewirken.
10.5 Der ideale Spin- 1/2-Paramagnet | 335
mz
mz a)
PB
b)
T1
B3
T2
B2
T3 kBT1 kBT2 kBT3
B1
PBBext
kBT
T1 < T2 < T3
-PB
B1 < B2 < B3
Abb. 10.4. Magnetische Zustandsgleichung des idealen Paramagneten. a) als Funktion von Bext für verschiedene Temperaturen und b) als Funktion von T für verschiedene Magnetfelder.
Um uns Schreibarbeit zu ersparen, benutzen wir im Folgenden die dimensionslose Variable X = μB Bext /kB T und deren Ableitungen nach T und Bext : X=
μB Bext , kB T
∂X X =− , ∂T T
X ∂X = . ∂Bext Bext
(10.25)
Zur Bestimmung der thermodynamischen Eigenschaften eines Quantensystems stehen uns zwei äquivalente Rechenwege offen. Der erste benutzt den Boltzmann’schen Ausdruck Gl. 10.21 für die Wahrscheinlichkeiten Wi , um damit die Mittelwerte U und mz sowie S zu berechnen. Der zweite Weg benutzt die Ableitungen von F (T, Bext , N ) entsprechend Abschnitt 5.1. Mit Hilfe der Wi berechnen wir zunächst die kalorische Zustandsgleichung U (T, Bext , N ) des idealen Paramagneten: U (T, Bext , N ) = N
εi W i = N
i
= −N μB Bext ·
i
εi
exp (−εi /kB T ) Z (1) (T, Bext )
mit εi = ∓ μB Bext
sinh X cosh X
und schließlich U (T, Bext , N ) = −N μB Bext tanh
μB Bext kB T
.
(10.26)
Bei T = 0 ist U entsprechend der Energie der vollständig parallel zum Magnetfeld ausgerichteten magnetischen Momente (↑) zunächst negativ und steigt mit zunehmender Temperatur in dem Maße, in dem die thermische Anregung von Momenten mit antiparalleler Ausrichtung (↓) wahrscheinlicher wird. Im Grenzfall T → ∞ kann das Spinsystem keine weitere Energie aufnehmen, weil die Boltzmann-Verteilung höchstens eine Gleichverteilung der Spins auf die Energieniveaus, aber keine Besetzungsinversi-
336 | 10 Thermodynamik von Spin-1/2-Systemen
(1)
7
|m| (μB)
6 (2)
5 4
(3)
3
1.3 K 2.0 K 3.0 K 4.2 K
2 1 0
0
1
2
3
4
B / T (Tesla / K)
Abb. 10.5. Magnetisches Moment pro Ion für (1) Gd-Sulfat, (2) FeNH3 -Alaun und (3) KCr-Alaun als Funktion von Bext /T . Die durchgezogenen Linien geben die Brillouin-Funktion für die verschiedenen Spinmomente an (Gd: S=7/2, Fe: S=5/2, Cr: S=3/2) (nach [21]).
on mit W↓ > W↑ erlaubt. Bei sehr kleinen Magnetfeldern erfolgt die thermische Anregung der Spins in einem entsprechend kleinen Temperaturintervall. Die magnetische Zustandsgleichung des Spinsystems bestimmen wir zur Abwechslung aus der magnetischen freien Energie F : mz (T, Bext , N ) = −
∂F (T, Bext , N ) sinh X X = N kB T · ∂Bext cosh X Bext
mz = N μB · tanh
μB Bext kB T
(10.27)
Der Verlauf von U als Funktion von T und Bext ist in Abb. 10.4 dargestellt. Als Funktion des Magnetfeldes steigt das magnetische Moment von Null an und sättigt in hohen Feldern bei m ˆ z = μB . Als Funktion der Temperatur sind die Spins bei T = 0 zunächst vollständig ausgerichtet. Bei endlichen Temperaturen nimmt das magnetische Moment ab, bis im Grenzfall sehr hoher Temperaturen der ↑- und der ↓-Zustand mit gleicher Wahrscheinlichkeit besetzt sind und m ˆ z verschwindet. Wir stellen fest, dass beide Zustandsgleichungen bis auf den Faktor −Bext identisch sind, nämlich dass gilt: U = −mz Bext , (10.28) wie wir das von der Seite der Elektrodynamik her auch erwarten. Die faktische Äquivalenz der Zustandsgleichungen ist eine Besonderheit des idealen Paramagneten, die sich auch darin widerspiegelt, dass F /N nur von Bext /T , das heißt eigentlich nur von einer Variablen abhängt. Wie wir weiter unten sehen werden, wird diese Besonderheit beseitigt, wenn wir eine beliebig schwache Wechselwirkung der Spins untereinander annehmen.
10.5 Der ideale Spin- 1/2-Paramagnet | 337
Die Verallgemeinerung der magnetischen Zustandsgleichung auf höhere Werte von ˆ2 mit r = 2l + 1 Eigenzuständen vom m ˆ z (Aufgabe 10.3) hat die Form
gμB Bext mz (T, Bext , N ) = N gμB · l Bl , (10.29) kB T
2l + 1 1 2l + 1 X coth X − coth (10.30) wobei Bl (X) := 2
2
2
2
die Brillouin-Funktion genannt wird. Der Grenzfall großer Spins (l → ∞) wird der klassische Grenzfall genannt, weil dann die Quantisierung der mz -Eigenwerte nicht ins Gewicht fällt und die Brillouin-Funktion in die nach Langevin benannte Funktion 1 L(X) := coth(X) − (10.31) X
übergeht. Dieser Funktion werden wir im Zusammenhang mit Polymeren in Abschnitt 11.3 wieder begegnen. Aus der magnetischen Zustandsgleichung gewinnen wir durch nochmaliges Differenzieren nach Bext die magnetische Suszeptibilität (pro Teilchen)13 des idealen Paramagneten: χ ˆm =
μ0 μ2B 1 μ0 ∂mz (T, Bext , N ) ∂ tanh X 1 = μ0 μ B = , N ∂Bext ∂Bext kB T cosh2 X
(10.32)
wobei μ0 die magnetische Feldkonstante ist. Bei hohen Temperaturen mit X → 0, cosh X → 1 erhalten wir das Curie-Gesetz: χ ˆCurie =
μ0 μ2B , kB T
(10.33)
beziehungsweise für beliebige Drehimpuls-Quantenzahlen l: χ ˆCurie = μ0 (gμB )2
l(l + 1) . 3kB T
(10.34)
Abbildung 10.6a zeigt, dass die Divergenz von χˆm im entgegengesetzten Grenzfall 1 2 exp X bei endlichen Werten des externen Magnetfeldes abgeschnitten wird und die Suszeptibilität wieder auf Null sinkt, weil das Spinsystem bei tiefen Temperaturen nahezu vollständig polarisiert ist. Aus der kalorischen Zustandsgleichung 10.26 folgt nach unseren Überlegungen in Abschnitt 5.1.4 für die Wärmekapazität bei konstantem Magnetfeld (analog Cp beim idealen Gas): X → ∞, cosh X →
cˆB =
1 ∂U (T, Bext , N ) k X2 . = B2 N ∂T cosh X
(10.35)
13 Oft wird die magnetische Suszeptibilität pro Volumen abgegeben und ist dann dimensionslos: χm = n χ ˆm , wobei n die Teilchendichte ist.
338 | 10 Thermodynamik von Spin-1/2-Systemen v,B /kB
Curie
b)
a) 0.44 Bext = 0.5T
j = 3/2
a1/T2
Bext = 0.1T
j = 1/2 aexp(…)
T(K)
T(K)
Abb. 10.6. a) Temperaturabhängigkeit der molaren magnetischen Suszeptibilität eines idealen Paramagneten mit Spin 1/2. b) Molare Wärmekapazität (pro Teilchen) eines idealen Paramagneten. Das charakteristische Maximum bei kB T μB Bext wird in Systemen mit freien Spins beobachtet und als Schottky-Anomalie bezeichnet. Bei hohen Temperaturen kB T μB Bext treten die Spins nicht in der Wärmekapazität, wohl aber im Absolutwert der Entropie in Erscheinung (Abb. 6.2).
Wie in Abb. 10.6b illustriert wird, weist die Wärmekapazität des Spinsystems einen charakteristischen, nichtmonotonen Verlauf auf, der unter dem Namen SchottkyAnomalie bekannt ist. Im Grenzfall hoher Temperaturen lässt sich Gl. 10.35 gemäß cˆB −→ kB X 2 = kB
μB Bext kB T
2 ,
annähern und strebt gegen Null, weil die Spins für kB T ε↑ − ε↓ keine weitere Energie und Entropie mehr aufnehmen können. Im Grenzfall tiefer Temperaturen ergibt sich
cˆB −→ 4kB X 2 exp(2X) ∝
ε↓ − ε↑ 1 exp − 2 kB T T
.
Ein solcher exponentieller Abfall der Wärmekapazität mit 1/T ist typisch für Systeme mit einer Energielücke Δε = ε↑ − ε↓ im Anregungsspektrum, deren angeregte Zustände für kB T Δε nur wenig thermische Anregung erlauben. Damit haben wir zum ersten Mal ein Modell-System vorliegen, das dem 3. Hauptsatz genügt, weil seine Wärmekapazität nicht konstant ist, sondern bei tiefen Temperaturen gegen Null geht, sodass der Wert der Entropie stets endlich ist. Um dies direkt zu überprüfen, berechnen wir die Entropie durch Ableitung von F nach T : ∂F S(T, Bext , N ) = − = N kB ln 2 + ln (cosh X) − X tanh X (10.36) ∂T
Wird der Paramagnet bei festem Magnetfeld aufgeheizt, so steigt die Entropie vom Ausgangswert S = 0 monoton an, bis sie bei sehr hohen Temperaturen, bei denen die Energieniveaus annähernd gleich stark besetzt sind, den Wert S = N kB ln 2 erreicht (Abb. 10.8a). Noch interessanter ist die Abhängigkeit der Entropie vom Magnetfeld. Abbildung. 10.8b demonstriert, dass S bei fester Temperatur und steigendem Magnetfeld
10.5 Der ideale Spin- 1/2-Paramagnet | 339
6 (J mol-1K-1)
α-NiSO46H2O 4
2
Cmag CGitter
0
0
5
10 T (K)
Abb. 10.7. Molare Wärmekapazität von Nickelsulfat als Funktion der Temperatur. Die durchgezogene Linie entspricht einer Schottky-Anomalie mit einem zweifach entarteten oberen Niveau; die strichpunktierte Linie gibt den Gitterbeitrag und die gestrichelte Linie die Summe aus Spinund Gitterbeitrag an (nach [21]).
von dem Wert N kB ln 2 aus monoton abfällt und in dem Maß verschwindet, in dem die Spins durch das Magnetfeld ausgerichtet werden. Bei vollständiger Ausrichtung im Grenzfall Bext → ∞ liegt schließlich S = 0 vor. Gleichzeitig sinkt die Energie im Magnetfeld auf den Wert U = −N μB Bext ab. Da die bei der Ausrichtung frei werdenden Entropie- und Energiebeträge nicht verschwinden können, müssen diese über einen thermischen Kontakt an die Umgebung abgeführt werden. Bei adiabatischer Prozessführung erwärmt sich das Spinsystem. Dieses Phänomen nennt man den magnetokalorischen Effekt. Wird das Spinsystem umgekehrt bei fester Temperatur von einem hohen Magnetfeld mit starker Ausrichtung der Spins zu kleinen Magnetfeldern mit schwächerer Ausrichtung hin entmagnetisiert, so müssen dafür Energie und Entropie aus einem Wärmereservoir zugeführt werden. Ist dies nicht möglich, weil die Entmagnetisierung unter thermischer Isolation des Spinsystems stattfindet, so muss das Spinsystem abkühlen! Dies ist das Prinzip der magnetischen Kühlung durch adiabatische Entmagnetisierung, bei der der ideale Paramagnet als Arbeitssystem für Kühlprozesse einsetzbar ist. Dieses Verfahren ist eine der leistungsfähigsten Methoden zur Erzeugung ultratiefer Temperaturen. Die erreichbaren Temperaturen sind nach unten nur durch die Idealität des verwendeten paramagnetischen Materials, das heißt durch die Stärke der Wechselwirkung zwischen den Spins, und natürlich durch die Güte der thermischen Isolation beschränkt. Mit Elektronenspins in paramagnetischen Salzen lassen sich Temperaturwerte von einigen mK erreichen, mit den wesentlich schwächer wechselwirkenden Kernspins, beispielsweise in Kupfer, wurden bisher Spin-Temperaturen von einigen 100 pK (Pikokelvin!) demonstriert.14
14 So tiefe Temperaturen sind nur erreichbar, wenn das Spin- und das Gittersystem thermisch entkoppelt sind und das Gitter viel wärmer als das Spinsystem ist. Dies erfordert eine sehr große Spin-GitterRelaxationszeit. In Systemen mit kleiner Spin-Gitter-Relaxationszeit wurden Werte der Gittertemperaturen um 2 μK erreicht.
340 | 10 Thermodynamik von Spin-1/2-Systemen (Bext) kB
(T) kB a)
ln(2)
B1 B2
b)
ln(2)
B3 Curie Susz.
B1 < B2 < B3 T(K)
PBBext 0
1
2
kBT
Abb. 10.8. Molare Entropie eines idealen Paramagneten mit Spin 1/2 a) als Funktion der Temperatur. Gestrichelt ist der in Aufgabe 5.7 berechnete quadratische Verlauf angegeben, der aus dem CurieGesetz für Bext → 0 folgt. Danach wird sˆ bei höheren Magnetfeldern negativ, was anzeigt, dass das Curie-Gesetz mit dem 3. Hauptsatz unvereinbar ist. b) Molare Entropie als Funktion des Magnetfeldes. Die Fähigkeit des Paramagneten, Entropie zu speichern, nimmt mit zunehmendem Magnetfeld sehr stark ab, weil die Spins stärker und stärker ausgerichtet werden. Bei isentroper Prozessführung ist die Spin-Ausrichtung durch eine Erhöhung des Magnetfeldes mit einer Temperaturerhöhung verbunden (magnetokalorischer Effekt). Umgekehrt führt eine isentrope Entmagnetisierung zur Abkühlung.
Die Effizienz des Paramagneten als Arbeitsmedium, das heißt die Stärke des magnetokalorischen Effekts, wird durch die (neben cˆvB und χˆm ) dritte unabhängige Suszeptibilität des Systems, nämlich ∂ˆ s(T, Bext ) ∂m ˆ z (T, Bext ) ∂ tanh X = ζˆM K (T, Bext ) = = μB ∂Bext ∂T ∂T =−
μ2B Bext 1 =− kB T 2 cosh2 X
μB kB
2
· cˆvB < 0
(10.37)
charakterisiert. Weil der ideale Paramagnet nur einen einzigen Systemparameter, nämlich μB enthält, sind ζˆM K und cˆvB zueinander proportional. Entsprechend der Darstellung von cˆvB (T ) in Abb. 10.8 nimmt ζˆM K bei kleinen (effektiven) Magnetfeldern und tiefen Temperaturen sehr stark zu. Schließlich wollen wir die Entropie des idealen Paramagneten noch als Funktion der Energie im Magnetfeld U = −mz Bext ausdrücken. S (U , N ) ist ebenfalls eine Massieu-Gibbs-Funktion des idealen Paramagneten, wie wir in Abschnitt 5.5 gesehen haben. Zur Bestimmung von S (U , N ) machen wir uns klar, dass die Wahrscheinlichkeiten nach Gl. 10.13 und Gl. 10.28 mit der Energie über
W↑, ↓ =
(1 ∓ Y ) 1 1∓ = 2 2
U N μB Bext
10.5 Der ideale Spin- 1/2-Paramagnet | 341
kB
T a)
ln(2)
b)
-PBBext
-PBBext
PBBext
PBBext
Abb. 10.9. a) Die Entropie des idealen Paramagneten als Funktion der magnetischen Energie U . b) Die Temperatur des idealen Paramagneten. Die Zustände mit negativer Temperatur liegen oberhalb der maximalen durch „Heizen“ (Entropiezufuhr) erreichbaren Temperatur.
zusammenhängen, wobei Y = U /(N μB Bext ). Damit erhalten wir15 nach Einsetzen der nach X aufgelösten magnetischen Zustandsgleichung 10.27 und mit Gl. 10.14:
1+Y 1−Y 1−Y 1+Y S (U , N ) = −N kB + . (10.38) ln ln 2
2
2
2
Dieses Ergebnis ist in Abb. 10.9a dargestellt. Wir erhalten die inverse Temperatur 1/T durch Differenzieren von S nach U : ∂S U , N 1
U, N = . T ∂U Interessant ist hier, dass S(U , N ) nicht monoton wachsend ist, sondern über ein Maximum geht (Abb. 10.9). Entsprechend zerfällt 1/T für positive und negative U in zwei Zweige mit positiver und negativer Temperatur (∂S/∂U ist für U > 0 negativ). Sind beide Zustände bei U = 0 gleichbesetzt, ist das System immer noch im Stande, Ener-
gie aufzunehmen – allerdings muss es dafür Entropie abgeben, während seine Temperatur auf −∞ springt! Experimentell werden Zustände mit negativen Temperaturen entweder durch eine schnelle Umkehr des Magnetfeldes oder mit Spinresonanzverfahren16 hergestellt. Die Inversion der Wahrscheinlichkeitsverteilung der Zustände erzeugt einen Zustand mit W↓ > W↑ . Ein solches Verhalten ist in der Regel nur bei Systemen möglich, deren Energiespektrum nach oben beschränkt ist.
15 Es ist eine Übung in Algebra, zu zeigen, dass sich der komplizierte Ausdruck 10.36 tatsächlich auf Gl. 10.14 reduziert, wenn die magnetische Zustandsgleichung 10.27 nach X aufgelöst und mz über die Wahrscheinlichkeiten ausgedrückt wird. 16 Dazu wird entweder das Magnetfeld schnell umgekehrt oder ein sogenannter π-Puls mit der Resonanzfrequenz (ε↑ − ε↓ )/ eingestrahlt, der alle Spins um 180° dreht.
342 | 10 Thermodynamik von Spin-1/2-Systemen
10.6 Thermische Schwankungen Entsprechend dem Homogenitätspostulat (Abschnitt 5.4 muss die magnetische freie Energie F (T, Bext , N ) eine homogene Funktion der extensiven Variablen sein. Da außer N nur intensive Variablen auftreten, muss F (T, Bext , N ) proportional zu N sein. Es ist daher grundsätzlich auch möglich, den Extremfall N = 1 zu betrachten.17 Die Idee, einem an ein Wärmereservoir angekoppelten Einzelspin die Fähigkeit zuzubilligen, einen gewissen Entropiebetrag (maximal kB ln 2) zu speichern und ihm eine damit verbundene Temperatur zuzuschreiben, ist zunächst etwas gewöhnungsbedürftig. Unser durch das klassische Verhalten makroskopischer Körper geprägtes Vorstellungsvermögen besteht (oft unbewusst) hartnäckig darauf, den Einzelspins (zumindest für einen gewissen Zeitpunkt) einen reinen Zustand, das heißt eine wohldefinierte Orientierung zuzuschreiben. Ein solcher Zustand hätte aber sowohl die Entropie als auch die Temperatur Null. Wir sind es gewohnt, die Kopplung an und die Entkopplung von einem Wärmebad als typische Operationen bei thermodynamischen Prozessen anzusehen. Für das Verständnis der statistischen Thermodynamik ist es aber wichtig sich klarzumachen, dass solchen Operationen prinzipielle und praktische Grenzen gesetzt sind. So wäre es unphysikalisch anzunehmen, dass wir unser Spinsystem isoliert betrachten könnten. Selbst wenn wir in einem Gedankenexperiment annehmen, dass wir das von dem Spinsystem eingenommene Volumen über eine perfekte thermische Isolation, zum Beispiel einen im Vakuum schwebenden, innen perfekt verspiegelten Kasten, vom Rest der Welt isolieren könnten, gibt es zumindest zwei weitere Systeme, mit welchen sich mit das Spinsystem dieses Volumen teilen muss: das Gittersystem der die Spins tragenden Atome und das elektromagnetische Feld! Wie wir in Abschnitt 13.1 sehen werden, steht das elektromagnetische Feld in jedem Raumbereich, in dem ein Stück Materie mit der Temperatur T eingeschlossen ist, nach einiger Zeit mit diesem Stück Materie im thermischen Gleichgewicht. Dies bedeutet, dass in diesem Volumen thermisch angeregte Photonen gibt, welche die thermische Strahlung bilden. Das Phononensystem bildet ein weiteres Wärmebad, in welches das Spinsystem unvermeidbar eingebettet ist. Es sind die Photonen und Phononen, welche in die Reaktionsgleichung 10.19 eingehen und die Einstellung des thermischen und chemischen Gleichgewichts im Spinsystem ermöglichen (Abb. 10.10). Gibt man an einem Ort des Spinsystems einen Heizpuls (zum Beispiel mit Hilfe eines elektrischen Heizers), der die Temperatur dort lokal erhöht, so wird diese Information über die thermischen Photonen von einem Spin zum nächsten weitergeben, und nach einer gewissen Zeit, die von der Zahl der verfügbaren Photonen abhängt, wird sich wieder
17 Der hier gewählte Zugang zur statistischen Thermodynamik ist nicht an große Teilchenzahlen, das heißt an den sogenannten „thermodynamischen Limes“ gebunden, den wir in Abschnitt 12.7 diskutieren werden.
10.6 Thermische Schwankungen |
343
Abb. 10.10. Thermisch isoliertes Spinsystem bei einer endlichen Temperatur: Durch den Austausch von thermischen Photonen oder Phononen (rot) schalten einzelne Spin unregelmäßig zwischen verschiedenen Zuständen hin und her. Dies führt zu einem thermischen Rauschen der Magnetisierung, welches gemäß Gl. 10.41 proportional zur magnetischen Suszeptibilität ist.
thermisches Gleichgewicht einstellen. Obwohl die Spins im Kristallgitter fest eingebaut und zum Teil weit voneinander entfernt sind, ist es prinzipiell unvermeidbar, dass sie über das elektromagnetische Feld miteinander kommunizieren, selbst wenn keine statische Wechselwirkung zwischen ihnen besteht. Die thermischen Anregungen des Kristallgitters, die Phononen, spielen eine analoge Rolle. Da der Prozess der Absorption und Emission von Photonen und Phononen ein statistischer ist, erwarten wir thermisch induzierte Schwankungen der Orientierung der einzelnen Spins. Die Existenz dieser Dynamik lässt sich in empfindlichen Messungen als ein thermisches Rauschen der lokalen Magnetisierung und des makroskopischen magnetischen Moments um seinen Mittelwert mz auch experimentell nachweisen. Dieses Rauschen ist die magnetische Variante der bekannten Brown’schen Molekularbewegung in Flüssigkeiten und Gasen. Die Rauschamplitude ist nichts anderes als die Unschärfe Δmz von mz . Dies wollen wir anhand der quadratischen Streuung (Δm ˆ z )2 des magnetischen Moments eines Einzelspins illustrieren. Dafür müssen wir zunächst den Mittelwert von m ˆ 2z berechnen: 2 2 m ˆ z =
m ˆ z,i Wi
i
=
ε↑ 1 μ2 exp − Z(T, Bext ) B kB T
=
μ2B 2 cosh X Z(T, Bext )
+ (−μB )2 exp −
ε↓ kB T
Aus Gl. 10.23 folgt dann m ˆ 2z = μ2B und wir erhalten für die quadratische Streuung von m ˆ z mit Gl. 10.27: (Δm ˆ z )2 = m ˆ 2z − m ˆ z 2 = μ2B 1 − tanh2 X =
μ2B cosh2 X
=
kB T ·χ ˆm . μ0
(10.39)
344 | 10 Thermodynamik von Spin-1/2-Systemen
1.0
1.0
0.1 1 2
0.5
0.5
3
(a)
(b) 0.0
0.0 0
1
2
3
4
5
1
10
100
1000 10000
Abb. 10.11. a) Mittelwert und Unschärfe des magnetischen Moments für einen Einzelspin in Einheiten von μB . b) Ensemble-Mittelung der relativen Unschärfe Δmz /mz als Funktion der Teilchenzahl N für verschiedene Bext /T .
(j)
Die Unschärfe des magnetischen Moments mz eines Einzelspins beträgt bei Bext = 0 also μB , währende der Mittelwert verschwindet! Mit zunehmendem Verhältnis Bext /T wächst der Mittelwert dagegen an und die Streuung verschwindet, wie in Abb. 10.11 (j) (j) dargestellt ist. Die relative Streuung Δmz / mz kann für T → ∞ sogar divergieren. Betrachten wir dagegen die Gesamtheit aller Spins, so wird die relative Streuung Δmz /mz des makroskopischen Moments mit zunehmender Teilchenzahl sehr schnell (j) klein. Das liegt daran, dass sich die statistisch unabhängigen Fluktuationen δmz = (j) mz − m ˆ z der Einzelspins zunehmend gegenseitig herausmitteln. Nach Anhang B erhalten wir (Δmz )2 = N · m ˆ z 2 = N μ2B 1 − tanh2 X
.
Damit folgt, dass die relative Schwankung des Gesamtmoments 2 √
Δmz = |mz |
N 1 − tanh X N tanh X
1 1 = √ N sinh X
proportional zu 1/ N abnimmt und bei makroskopischen Körpern, für die N ≈ 1023 ist, nicht ins Gewicht fällt. Die Temperaturabhängigkeit des makroskopischen magnetischen Moments eines Paramagneten als Folge der Verschiebung eines chemischen Gleichgewichts zwischen den ↑- und den ↓-Teilchen ist analog der durch das Massenwirkungsgesetz (Abschnitt 7.7) geregelten Verschiebung des chemischen Gleichgewichts in einem reaktiven Gasgemisch bei Variation der Temperatur oder des Drucks. Den Quantenübergängen, das heißt den Spinflip-Prozessen im Paramagneten, entsprechen dabei die Kollisionen der Gasmoleküle und die dadurch induzierten Reaktionen zwischen den verschiedenen chemischen Spezies. Obwohl die Mittelwerte der Konzentrationen der reagierenden Gase im chemischen Gleichgewicht zeitlich konstant sind, kommt es auch dort zu lokalen Fluktuationen der Teilchendichten ni der verschiedenen Spezies.
10.6 Thermische Schwankungen |
345
Die zeitliche Konstanz der Mittelwerte wird durch das Prinzip des detaillierten Gleichgewichts sichergestellt, welches besagt, dass die Teilchendichten ni und nk sowie die Reaktionsraten Σi→k der „chemisch“ verschiedenen Spezies im Gleichgewicht der Bedingung ni Σi→k = nk Σk→i (10.40) genügen müssen. Aus Gleichung 10.39 können wir ablesen, dass (Δm ˆ z )2 und die magnetische Suszeptibilität χˆm offenbar eng miteinander zusammenhängen: (Δm ˆ z )2 =
kB T ·χ ˆm . μ0
(10.41)
ˆ z )2 stets positiv ist, passt sehr Die Tatsache, dass das Schwankungsquadrat (Δm gut mit den Stabilitätsbedingungen der Thermodynamik zusammen, die ebenfalls fordern, dass χˆm stets positiv ist. Identitäten des durch Gl. 10.41 gegebenen Typs sind kein Zufall oder eine spezielle Eigenschaft unseres Beispiels. Ein derartiger Zusammenhang gilt für jedes thermodynamische System mit einer oder mehreren Zufallsvariablen. Dass sich sowohl mz als auch (Δmz ) durch Differenzieren von −kB T ln Z gewinnen lassen, ist Konsequenz der Tatsache, dass die Zustandssumme Z die sogenannte charakteristische Funktion und ln Z die Kumulantenfunktion der Wahrscheinlichkeitsverteilung {Wi } sind. Diese in Anhang G beschriebenen Funktionen sind der Wahrscheinlichkeitsverteilung äquivalent und erlauben es, die Momente, das heißt die Mittelwerte X n einer Zufallsgröße X durch Ableiten von Z zu gewinnen. Es ist diese strukturelle Ähnlichkeit zwischen der Wahrscheinlichkeitsrechnung einerseits und der Thermodynamik andererseits, die eine Darstellung der Thermodynamik als einer Theorie von Zufallsgrößen möglich macht. Dass eine solche Verknüpfung physikalisch sinnvoll ist, wird nicht nur durch die Quantentheorie nahegelegt, sondern auch experimentell durch die Existenz kritischer Fluktuationen in der Nähe von Singularitäten der Suszeptibilitäten, das heißt an den Stabilitätsgrenzen des betrachteten Systems, demonstriert. Ein Beispiel, das wir bereits kennen, ist das Phänomen der kritischen Opaleszenz am kritischen Punkt realer Gase, an dem die Divergenz der Kompressibilität in der Nähe der Phasenübergangs durch die dabei auftretenden Dichtefluktuationen direkt beobachtet werden kann. Im folgenden Abschnitt werden wir das entsprechende magnetische Analogon bei magnetischen Phasenübergängen kennenlernen. Abschließend wollen wir noch die Frage diskutieren, inwieweit die Beschreibung physikalischer Systeme durch die Massieu-Gibbs-Funktionen beziehungsweise der dazu äquivalenten Wahrscheinlichkeitsverteilung vollständig ist oder ob es eine darunter liegende deterministische Beschreibung gibt. In vielen Büchern ist zu le-
346 | 10 Thermodynamik von Spin-1/2-Systemen sen, dass der mit der Entropie18 verknüpfte statistische Charakter der Aussagen der Thermodynamik allein Ausdruck unseres Unwissens über den genauen Zeitablauf der unüberschaubar vielen mikroskopischen Freiheitsgrade eines makroskopischen Systems ist. Diese Frage erinnert stark an eine analoge Debatte in der Frühzeit der Quantentheorie, in der die statistische Interpretation der Wellenfunktion als Wahrscheinlichkeitsamplitude zu erbitterten Diskussionen Anlass gegeben hat. Damals gab es zahlreiche Versuche, Theorien mit sogenannten verborgenen Parametern zu formulieren, welche die statistischen Aussagen der Quantentheorie als Resultat einer verborgenen deterministischen Dynamik zu erklären. Diese Versuche führten entweder zu krassen Widersprüchen mit den experimentellen Beobachtungen oder zu Theorien, deren Aussagen denen der Quantentheorie so ähnlich sind, dass sie gegenüber der konventionellen Quantentheorie keinen Erkenntnisgewinn bedeuten. Die für Physik bei endlichen Temperaturen und damit bei endlichen Werten der Entropie charakteristischen thermischen Fluktuationen der physikalischen Größen werden durch die aus unserem Ausdruck 10.14 für S abgeleitete Wahrscheinlichkeitsverteilung jedenfalls vollständig beschrieben. Aus diesem Grunde werden wir diese Beziehung zu einem fundamentalen Prinzip erheben, welches wir in den folgenden Kapiteln als Grundlage für die weitere Diskussion der statischen Thermodynamik verwenden. Bevor wir dies tun, wollen wir jedoch noch den Effekt von Wechselwirkungen zwischen den Einzelspins untersuchen. Dabei wird sich zeigen, dass eine Reihe von pathologischen Eigenschaften des idealen Paramagneten, insbesondere die Divergenzen seiner Suszeptibilitäten im Grenzfall T → 0 und Bext → 0, von der Vernachlässigung der Wechselwirkungseffekten, das heißt von der Annahme der Idealität, herrührt. Diese wollen wir im nächsten Abschnitt im Rahmen der sogenannten Molekularfeldnäherung diskutieren.
10.7 Ferromagnetismus in der Molekularfeld-Näherung Wie bei Gasen müssen auch in magnetischen Systemen bei hinreichend tiefen Temperaturen Wechselwirkungs- oder Entartungseffekte auftreten, um bei Bext = 0 nicht in Konflikt mit dem 3. Hauptsatz zu geraten. Ein offensichtlicher Kandidat für Wechselwirkungs-Phänomene ist die im allgemeinen sehr schwache magnetischen Dipol-Dipol-Wechselwirkung. Diese ist beispielsweise für die magnetische Ordnung in Kernspin-Systemen verantwortlich. Es zeigt sich aber, dass in elektronischen Spin-
18 In manchen Büchern wird gar die Entropie selbst als Maß dieses Unwissens interpretiert. Es wäre allerdings überraschend, wenn etwas so Subjektives wie unser Unwissen imstande wäre, eine Wärmekraftmaschine zu betreiben. . .
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 347
Systemen noch ein anderer Typ von Wechselwirkung existiert, der schon bei wesentlich höheren Temperaturen wirksam wird. Es ist dies die sogenannte AustauschWechselwirkung. Der etwas kuriose Name rührt daher, dass die Elektronen in einem Festkörper nicht auf einzelne Atome lokalisiert sind, sondern über eine endliche Tunnelwahrscheinlichkeit an ihren Nachbarn im Kristallgitter gekoppelt sind, also zwischen den Gitterplätzen ausgetauscht werden können. Wie wir in Abschnitt 12.1 noch genauer erläutern werden, ist die Vertauschung zweier Elektronen mit einem Vorzeichenwechsel der Vielteilchen-Wellenfunktion verbunden. Da letztere zumindest näherungsweise als Produkt eines spinabhängigen und eines ortsabhängigen Anteils geschrieben werden kann, verbindet diese Austausch-Symmetrie die Symmetrieeigenschaften des Spin-Anteils mit denen des Ortsanteils. Sind beispielsweise anti-symmetrische Ortswellenfunktionen energetisch günstiger, weil diese eine niedrigere Coulomb-Wechselwirkung haben, so sind automatisch symmetrische Spin-Zustände und damit eine Parallelstellung der Spins bevorzugt. Da parallel orientierte Spins auch in Abwesenheit eines externen Magnetfeldes zu einem makroskopischen magnetischen Moment führen, wie dies zum Beispiel bei Eisen beobachtet wird, wird eine solche effektive Spin-Spin-Kopplung ferromagnetisch genannt. Es existieren aber auch anti-ferromagnetische Kopplungen, bei denen eine antiparallele Ausrichtung benachbarter Spins energetisch bevorzugt wird, oder noch kompliziertere spiralförmige Kopplungstypen. Die Austausch-Kopplung kann sehr viel stärker als die direkte magnetische Wechselwirkung über das Dipolfeld der Spins sein. Um das Spin-System unabhängig von den elektronischen und den VibrationsEigenschaften des Kristalls zu untersuchen, ist es zweckmäßig, einen effektiven Hamilton-Operator für das Spinsystem zu definieren, in dem der komplizierte elektronische Ursprung der Austauschkopplung durch eine phänomenologische Austauschkonstante Jij quantifiziert wird: Hspin = −
1 Jij S i · S j , 2
(10.42)
i =j
wobei S i der Spinvektor am i-ten Gitterplatz ist und die Doppelsumme über alle Paare {i, j} von Gitterplätzen läuft. Dieser Hamilton-Operator definiert das HeisenbergModell des Magnetismus, den Prototyp aller Modellsysteme zum Studium der magnetischen Ordnung. Um eine Massieu-Gibbs-Funktion für den Heisenberg-Magneten zu gewinnen, betrachten wir ein Spin-1/2-System in einem externen Magnetfeld mit dem HamiltonOperator 2 Hspin − M · Bext = − Jij σ i · σ j − b σi (10.43) 8
i =j
i
348 | 10 Thermodynamik von Spin-1/2-Systemen mit S = (/2)σ , wobei die Komponenten des Spinvektors σ die aus der Quantenmechanik bekannten Pauli-Matrizen19 sind, b = −gμB B ext das Magnetfeld und μB = e/2m ˆ el das Bohr’sche Magneton bezeichnet. Man beachte, dass für verschwindende Jij , das heißt für wechselwirkungsfreie Spins, Hspin ≡ 0 ist. Die exakte Berechnung der Eigenwerte von Hspin − M · Bext für das HeisenbergModell stellt eines der fundamentalen Probleme der Vielteilchen-Physik dar und ist bis heute nicht gelungen. Für die Zwecke dieses Buches wollen wir nur die einfachstmögliche Näherungslösung diskutieren, an der sich bereits viele grundsätzliche Züge der modellhaften Beschreibung von Phasenübergängen qualitativ illustrieren lassen. Die zentrale Idee der Molekularfeld-Näherung besteht darin, einen Spin herauszugreifen und die Wechselwirkung mit seinen Nachbarn durch ein effektives Magnetfeld – das Molekularfeld – zu modellieren, dessen Stärke durch den Mittelwert des gesamten magnetischen Moments m gegeben ist. Wenn das System homogen magnetisiert ist,20 dürfen wir die Summe über alle Spins durch ihren Mittelwert ersetzen. Dann erhalten wir für das magnetische Moment: 9 : m = −μB
σi
= −μB N σ .
i
In Abwesenheit von magnetischer Anisotropie, das heißt von bevorzugten Richtungen für die Richtung der Magnetisierung im Kristall, können wir den Vektorcharakter von σ vernachlässigen und nur die Komponente σ parallel zum externen Magnetfeld betrachten. Dann ist b · σ = bσ mit b = |b|. Die entscheidende Vereinfachung besteht nun darin, in der Doppelsumme in Gl. 10.43 einen der beiden Spin-Operatoren durch seinen Mittelwert zu ersetzen, indem wir das Produkt σi · σj in seinen Mittelwert σi und die Fluktuationen δσi = σi − σi um diesen Mittelwert zerlegen:
σi · σj = σi + δσi ( σj + δσj
= σi σj + σi δσj + σj δσi + δσi δσj
und den Term δσi δσj zu vernachlässigen, der die gegenseitigen Korrelationen der Fluktuationen beschreibt:21 σi · σj σi σj + σi (σj − σj ) + σj (σi − σi ) − σi σj + σi σj + σj σi 19 Die Pauli-Matrizen lauten: σx =
0 1
1 0
, σy =
0 i
−i 0
, σz =
1 0
0 −1
20 Wenn der Kristall groß genug ist, neigen viele Ferromagnete zur Ausbildung von ferromagnetischen Domänen, um die Energie des von den magnetischen Momenten außerhalb des Kristalls erzeugten Magnetfeldes zu minimieren. Jede Domäne stellt für sich aber wieder einen homogen magnetisierten Ferromagneten dar.
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 349
Der Einfachheit halber beschränken wir die Doppelsumme auf die nächsten Nachbarn (NN) und nehmen an, dass die Jij alle gleich sind. Wenn wir noch vernachlässigen, dass die Spins an der Oberfläche des Kristalls weniger nächste Nachbarn als die im Inneren des Kristalls haben, erhalten wir mit der Abkürzung J :=
2 4
Jij
NN
schließlich den Hamilton-Operator in der Molekularfeld-Näherung: Hspin − M · Bext = N
1 2
J σ 2 − J σ + b σ
.
(10.44)
Dabei haben wir ausgenutzt, dass sich der Mittelwert der Summe über alle Spins auf N σ reduziert. σ ist der Mittelwert der z -Komponente eines beliebigen Einzelspins,
der als repräsentativ für alle Spins angesehen werden kann. Das Molekularfeld (10.45)
bMF := J σ
spielt die Rolle eines effektiven Magnetfeldes, welches den Effekt der Wechselwirkung auf einen beliebig herausgegriffenen Einzelspin mit seinen Nachbarn näherungsweise beschreibt. Damit haben wir das komplexe Vielteilchen-Problem auf ein effektives Ein-Teilchenproblem reduziert, welches sich analog zum idealen Paramagneten behandeln lässt. Der einzige Unterschied besteht darin, dass anstatt des externen Feld jetzt die Größe B eff =
b + J σ gμB
(10.46)
das Spinsystem magnetisch polarisiert. Um die thermodynamischen Eigenschaften des Heisenberg-Magneten in der Molekularfeld-Näherung abzuleiten, betrachten wir die Zustandssumme für einen Spin
J σ + b J σ 2 Z MF = exp − 2 cosh (10.47) 2kB T
kB T
des Systems und gewinnen dessen magnetische Zustandsgleichung durch Differenzieren nach b:
σ = kB T
∂ ln Z MF = tanh ∂b
J σ + b kB T
(10.48)
und damit
21 Die Vernachlässigung dieser Korrelationen ist gleichzeitig die wesentliche Schwäche der Molekularfeld-Näherung. Die Entwicklung besserer Näherungsverfahren zur Beschreibung des in Abschnitt 9.6.2 bereits erwähnten kritischen Verhaltens bildete einen Schwerpunkt der Physik der 70er und 80er Jahre der letzten Jahrhunderts – diese Methoden gehen jedoch über den Rahmen einer Einführung hinaus.
350 | 10 Thermodynamik von Spin-1/2-Systemen
1.0
paramagnetisch
(b)
(a)
m
0.5 ferromagnetisch
0.0
°b°/J
-0.5
2 1 0.2
-1.0 -2
0 0.02 0.1 0.3
J/kBT
-1
0
1
2 0
0.5
b/kBT
1
1.5
2
kBT/J
Abb. 10.12. Spinpolarisation eines eindomänigen Ferromagneten nach der Molekularfeld-Theorie: a) Magnetfeldabhängigkeit für verschiedene Temperaturen. Unterhalb einer kritischen Temperatur TC = J/kB wird die Magnetisierungskurve mehrdeutig und weist einen instabilen Bereich auf, der zu einem hysteretischen Schalten der Magnetisierung führt. b) Temperaturabhängigkeit für verschiedene Magnetfelder. Im Grenzfall B → 0 (rote Kurven) verschwindet die Magnetisierung für T ≥ J/kB stetig, aber mit einer senkrechten Tangente. Dies ist die Signatur eines Phasenübergangs zweiter Ordnung. Die gestrichelte rote Linie entspricht einem Phasenübergang 1. Ordnung zwischen der ↑- und der ↓magnetisierten Phase. Ein externes Magnetfeld bewirkt eine „Ausschmierung“ des Phasenübergangs.
mz (T, b) = −N μB σ = −N μB tanh
J σ + b kB T
.
(10.49)
Das Besondere an diesem Resultat besteht darin, dass es den Mittelwert des Spins – den sie ja erst liefern soll – auch auf der rechten Seite enthält. Gleichung 10.48 stellt damit eine Selbstkonsistenz-Relation dar, die typisch für das Verfahren der Molekularfeld-Näherung ist. Der Wert des Molekularfelds bMF muss mit der resultierenden Spin-Polarisation σ konsistent sein. Je nach dem, ob die Austausch-Konstante J positiv oder negativ ist, verstärkt oder reduziert das Austausch-Feld den Effekt des lokalen Magnetfeldes b.22 Um die Konsequenzen dieses Resultats zu übersehen, lösen wir Gl. 10.49 nach b/kB T auf b = kB T · artanh σ − J σ
(10.50)
und tragen in Abb. 10.12a σ über b/kB T für verschiedene Werte von J/kB T auf.
22 Falls die Form der Probe von einem parallel zum externen Feld liegenden langen Zylinders abweicht, wird das extern angelegte Feld durch das Eigenfeld der Probe reduziert. Für ellipsoidisch geformte Proben lässt sich dies durch den Entmagnetisierungfaktor (Anhang F) berücksichtigen.
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 351
Man erkennt, dass die Magnetisierungskurve mz (T, b) für Temperaturen unterhalb einer kritischen Temperatur TC =
J kB
Mehrdeutigkeiten und einen instabilen Bereich mit negativer Steigung entwickelt, ähnlich wie wir dies in Abb. 9.17 für die Zustandsgleichung des van der Waals-Gases gesehen haben. Die Temperatur TC wird auch die Curie-Temperatur genannt. Das System entwickelt bei hinreichend tiefen Temperaturen also eine magnetische Instabilität, welche für den Übergang in eine magnetisch geordnete Phase verantwortlich ist. Der Übergang entsteht durch eine Art Rückkopplungseffekt: Unterhalb TC vergrößert das sich in einem beliebig kleinen Magnetfeld aufbauende Molekularfeld die Spinpolarisation, welche wiederum das Molekularfeld verstärkt. Dieses Verhalten ist typisch für magnetische Instabilitäten. Aufgrund der Bi-Stabilität der Zustandsgleichung tritt für T < TC beim Hoch- und Herunterfahren des Magnetfeldes ein hysteretisches Schalten der Magnetisierung auf. Unter diesen Bedingungen ist das Umlaufintegral ' ΔE =
B dm = 0
von Null verschieden, was einer Energiezufuhr in das Spinsystem über den magnetischen Kanal entspricht. Die durch das hysteretische Schalten dissipierte Energiemenge ΔE = T ΔSerzeugt entspricht den Ummagnetisierungsverlusten beim Durchlaufen der Hystereseschleife. Wie beim van der Waals-Gas überträgt sich Mehrdeutigkeit der Magnetisierung auf die Entropie (Abb. 10.13 und Aufgabe 10.6). Das Schalten der Magnetisierung führt auch zu einer sprunghaften Abnahme der Entropie, die sich in einem magnetokalorischen Effekt, das heißt einer Erwärmung des Ferromagneten beim Durchlaufen der Ummagnetisierungskurve, bemerkbar macht. In der Realität sind die Entropie, die Wärmekapazität und auch die Magnetisierung eines Ferromagneten nicht allein durch die Einteilchen-Anregungen (spin-flips gegen B eff ), sondern auch durch kollektive Anregungen (Spinwellen) bestimmt. Spinwellen entstehen, wenn benachbarte Spins nur wenig durch das Austauschfeld ausgelenkt werden, so dass über lange Abstände ein Wellenmuster in der Spinverteilung entsteht – ähnlich den Wellen, die in einem Lattenzaun bei periodischer Auslenkung einer Latte angeregt werden können. Dies erfordert die Aufnahme eines Terms ∝ (grad σ )2 in Gl. 10.44. In einem isotropen Ferromagneten und Bext = 0 geht die entsprechende Anregungsenergie für ein Quantum dieser Wellen – die Magnonen – bei großen Wellenlängen gegen Null – diese sind daher viel leichter anzuregen als die Einzelspins. In Tabelle 10.1 sind experimentelle Werte für die Curie-Temperaturen, die Molekular- oder Austauschfelder sowie die magnetischen Momente angegeben. Man erkennt, dass die Austauschfelder für die üblichen Magnete viel höher als üblicherweise experimentell realisierbare Werte für das externe Magnetfeld sind. Außerdem sind die Werte der Curie-Temperatur und des magnetischen Moments nicht korreliert. Dies bestätigt
352 | 10 Thermodynamik von Spin-1/2-Systemen die bereits aufgrund der Stärke der Wechselwirkung geäußerte Vermutung, dass die Spins nicht über ihr (um viele Größenordnungen kleineres) magnetisches Dipolfeld miteinander gekoppelt sind.23 Außerdem treten bei einigen magnetischen Metallen „krumme“ Werte von m/μ ˆ B auf – dies ist in dem hier betrachteten Bild lokalisierter Momente nicht zu verstehen, da der Spin und damit auch das magnetische Moment quantisiert sein sollten. Bei diesen Materialien handelt es sich um sogenannte BandFerromagnete, die wir in Abschnitt 14.3.1 und Aufgabe 14.2 kurz behandeln werden. Wenn wir Gl. 10.50 nach T auflösen, erhalten wir die Umkehrung der Temperaturabhängigkeit der Magnetisierung: σ + b/J kB T = . J Artanh σ
(10.51)
Tragen wir dann σ für verschiedene Werte von |b|/J gegen T auf, bekommen wir die in Abb. 10.12b gezeigte Kurvenschar. Nahe TC sind die Werte von σ klein, und wir erhalten aus Gl. 10.50 näherungsweise * 3 2 + b = kB T · σ + σ /3 + . . . − J σ = σ (kB T − J) + kB T σ /3 .
Damit resultieren für b = 0 die beiden, nahe TC gültigen Lösungen: ⎧ ⎪ ⎪ ⎨ 3(TC − T ) für T < TC σ =
T
⎪ ⎪ ⎩0
(10.52)
für T > TC
Es fällt auf, dass die Magnetisierung im Grenzfall T → 0 bei T = TC stetig, aber mit einer senkrechten Tangente verschwindet. Dies ist die Signatur eines Phasenübergangs zweiter Ordnung. Die gestrichelte rote Linie entspricht einem Phasenübergang 1. Ordnung zwischen der ↑- und der ↓-magnetisierten Phase. Diese Phasen können koexistieren und entsprechen der Existenz von ferromagnetischen Domänen. Tab. 10.1. Curie-Temperaturen TC , daraus abgeleitete Austauschfelder BMF , SättigungsMagnetisierung |μ0 M S | und magnetisches Moment |m| ˆ einiger ferromagnetischer Stoffe: Stoff
Fe
Co
Ni
Gd
MnSb
EuO
EuS
TC (in K)
1043
1394
631
289
587
70
16.5
BMF (in T)
1546
2066
935
428
870
104
24.5
|μ0 M S | (in T)
2.20
2.00
0.64
2.59
ˆ (in μB ) |m|
2.22
1.72
0.61
7.5
2.36 3.5
6.9
6.9
23 Bei den Kernspins ist dies anders: Für diese ist der Austausch, aber auch das magnetische Moment viel kleiner – entsprechend liegen die gemessenen magnetischen Ordnungstemperaturen für die Kernmomente im Piko- bis Nanokelvin-Bereich.
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 353
0.8
ln 2
paramagnetisch
0.2 1 2
0.6
s / kB
ferromagnetisch
J/kBT
0.4 0.2 0.0
b /J
(b)
(a) -4
0 0.02 0.1 0.2
-2
0
2
4
0
0.5
1
b/kBT
1.5
2
kBT/J
Abb. 10.13. Entropie eines eindomänigen Ferromagneten nach der Molekularfeld-Theorie: a) Magnetfeldabhängigkeit für verschiedene Temperaturen. Unterhalb einer kritischen Temperatur T ≤ J/kB wird die Entropie mehrdeutig und weist einen instabilen Bereich auf, der zu einem hysteretischen Sprung in der Entropie führt. b) Temperaturabhängigkeit für verschiedene Magnetfelder. Im Grenzfall B → 0 (rote Kurve) weist die Entropie bei TC = J/kB einen Knick auf, der einem Sprung in der Wärmekapazität entspricht. Dies ist die Signatur eines Phasenübergangs zweiter Ordnung. Ein externes Magnetfeld bewirkt eine „Ausschmierung“ des Phasenübergangs.
Da im Rahmen der Molekularfeld-Näherung ein einzelner Spin repräsentativ für alle ist und dessen Erwartungswert σ durch die Temperatur und das effektive Feld B eff (Gl. 10.46) kontrolliert wird, ist dessen Entropie wie bei unabhängigen Spins durch Gl. 10.38 gegeben, wenn in dieser B ext durch B eff (Gl. 10.46) ersetzt wird. Setzt man hier die Lösung von Gl. 10.50 (Abb. 10.12) ein, so erhält man die b und T Abhängigkeit der Entropie. S Die in Abbildung 10.13a dargestellte Magnetfeldabhängigkeit zeigt ein ähnliches hysteretisches Schalten der Entropie wie die Magnetisierung – dieses äußert sich in magneto-kalorischen Effekten beim Ummagnetisieren. Die entsprechende Temperaturabhängigkeit ist in Abb. 10.13b gezeigt. Hier ist auffällig, dass die Entropie bei B ext = 0 und T = TC einen Knick aufweist, der einem Sprung in der Wärmekapazität entspricht. Dieses Verhalten ist ein Charakteristikum der Molekularfeld-Näherung, das uns im Zusammenhang mit den Eigenschaften von Supraleitern (Abschnitt 14.6.2) wieder begegnen wird. Durch Ableiten von Gl. 10.50 nach σ erhalten wir die inverse magnetische Suszeptibilität
χ ˆm μ0 μ2B
−1 =
∂b(T, σ ) kB T −J =J = ∂ σ 1 − σ 2
T /TC −1 1 − σ 2
354 | 10 Thermodynamik von Spin-1/2-Systemen 1000
5
b/J
(a)
AFM PM
3
b/J
0.9
1.0 T /TC
1.1
1.2 0
1
2
3
4
5
2 -1
2 0.4 0.2 0.1 1 0.003 0.00001
10
1 0.8
4
FM
(χmJ / μ0 μB )
100
χmJ / (μ0μB2)
(b)
0.00001 0.002 0.004 0.006 0.01 0.02
0
T /TC
Abb. 10.14. a) Divergenz der magnetischen Suszeptibilität bei T = TC . Bereits relativ kleine Magnetfelder führen zu einer Ausschmierung der Divergenz. b) Hochtemperaturverhalten der inversen Suszeptibilität. Der Schnittpunkt mit der T -Achse liefert eine Abschätzung für TC . Die rote strichpunktierte Linie entspricht dem Curie-Gesetz für Spinsysteme ohne Wechselwirkung. Die schwarze strich-punktierte Linie entspricht anti-ferromagnetischem Verhalten mit J < 0.
und daraus nach Einsetzen der σ -Werte aus Gl. 10.52 die Curie-Weiss-Suszeptibilität ⎧ ⎪ 2μ0 μ2B ⎪ ⎪− für T < TC ⎨ kB (T − TC ) χ ˆm (T ) = (10.53) ⎪ μ0 μ2B ⎪ ⎪ für T > TC ⎩ kB (T − TC )
welche sich von der Curie-Suszeptibilität nicht-wechselwirkender Spin-Systeme (Gl. 10.32) dadurch unterscheidet, dass bei der Curie-Temperatur TC eine Divergenz auftritt. Diese kommt dadurch zustande, dass das Molekularfeld bMF = J σ für T = TC verschwindet. In Abbildung 10.14 a sind χ ˆm als Funktion der Temperatur aufgetragen. Der Vorfaktor von χˆm ist auf beiden Seiten des Phasenübergangs betragsmäßig unterschiedlich (hier 2:1). Die Divergenz der Suszeptibilität entspricht nach Gl. 10.41 kritischen Fluktuationen in der Nähe des Phasenübergangs, die das zur kritischen Opaleszenz bei Gasen analoge Phänomen darstellen. Die Fluktuationen werden im Magnetfeld unterdrückt. Die Exponenten der Potenzgesetze für σ (T ) und χ ˆm (T ) (hier 1/2 und -1) nennt man die kritischen Exponenten (Aufgabe 9.10). Die Tendenz zur magnetischen Ordnung macht sich bereits bei Temperaturen weit oberhalb des Phasenübergangs bemerkbar. Aus dem Curie-Weiss-Gesetz folgt, dass die inverse Suszeptibilität χˆ−1 m zwar wie beim Paramagneten linear, entsprechend Abb. 10.14 b) aber im ganzen Temperaturbereich nach unten verschoben ist. Aus der Verschiebung kann die Curie-Temperatur TC abgeschätzt werden. Im Gegensatz dazu bewirkt eine anti-ferromagnetische Kopplung mit negativer Austauschkonstante J < 0
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 355
(die sich auch in der magnetisch geordneten Phase nicht in einem makroskopischen magnetischen Moment bemerkbar macht) eine Verschiebung von χˆ−1 m nach oben. Magnetische Phasenübergänge machen sich auch in allen anderen Suszeptibilitäten, wie der Wärmekapazität, der thermischen Ausdehnung und anderen, bemerkbar, weil die magnetischen Freiheitsgrade über das Phänomen der Spin-Bahn-Kopplung an das Kristallgitter gekoppelt sind. Besonders dramatisch tritt die Kopplung von magnetischen und Gittereigenschaften bei Experimenten unter hohem Druck in Erscheinung, bei denen die Gitterabstände und damit die Austauschkonstante geändert werden können.24 In Systemen mit einer kleinen Austausch-Konstanten, wie zum Beispiel in MnSi, kann die Übergangstemperatur sogar bis nach Null verschoben werden und nur durch Druck ein Phasenübergang induziert werden. Bei sehr tiefen Temperaturen sind für den Phasenübergang dann nicht mehr nur thermische Fluktuationen wichtig, sondern auch Quantenfluktuationen. Dies führt zu einer neuen Klasse von Quantenphänomenen, den Quantenphasenübergängen, welche gegenwärtig ein wichtiges Forschungsgebiet darstellen. Die Molekularfeldtheorie versagt sowohl bei tiefen Temperaturen, wo Magnonen die dominanten Anregungszustände sind, als auch in der in der Nähe der CurieTemperatur, weil dort die in Gl. 10.44 vernachlässigten Korrelationsterme δσi δσj wichtig werden. Diese führen ähnlich wie bei realen Gasen zu einer Divergenz in der Wärmekapazität bei TC und zu Modifikationen der kritischen Exponenten.
Übungsaufgaben 10.1. Organischer Paramagnet Ein Beispiel für einen Spin-1/2-Paramagneten ist die organische Substanz DPPH (α, α -Diphenyl-β -Picrylhydrazyl), die im Inneren ein Stickstoffatom mit einem ungepaarten Elektron enthält. Berechnen Sie die Energie, Magnetisierung und Entropie pro Spin bei einem Magnetfeld von Bext = 2.06 T und einer Temperatur von T = 2.2 K. Was wäre experimentell nötig, um 99% der Sättigungsmagnetisierung zu erreichen?
10.2. Wärmekapazität eines Spin-Systems Berechnen Sie den Spin-Beitrag zur molaren Wärmekapazität cˆV von Gadolinium-Sulfat (Spin 7/2) bei 1.5 K und 5 T. Ist es möglich, den Spin- und den Git-
24 Das liegt daran, dass die elektronischen Wellenfunktionen und ihr Überlapp, der die Austauschkonstante bestimmt, exponentiell vom Gitterabstand abhängen.
356 | 10 Thermodynamik von Spin-1/2-Systemen
terbeitrag zu cˆV experimentell zu trennen, wenn Sie den Magnetfeld-unabhängigen Gitterbeitrag aus Abb. 10.7 abschätzen? 10.3. Brillouin-Funktion a) Berechnen Sie die Zustandssumme für einen Spin-l-Einzelspin. b) Gewinnen Sie aus der Zustandssumme die magnetische Zustandsgleichung und verifizieren Sie die Darstellung der Brillouin-Funktion in (Gl. 10.30). 10.4. Magnetische Kühlung II In einem adiabatischen Entmagnetisierungs-Experiment befinden sich 0.1 Mol eines paramagnetischen Salzes mit dem Spin 1/2 bei T = 0.5 K in einem magnetischen Feld von 1 T. a) Berechnen Sie die im Idealfall erwartete Temperatur TS des Spinsystems nach einer Reduktion des Magnetfeldes auf 0.1 T, wenn die thermische Kopplung der Spins an das Kristallgitter vernachlässigt werden kann. b) Wie viel Energie und Entropie sind pro Spin und insgesamt notwendig, um das Spinsystem anschließend auf 0.1 K und auf 0.3 K zu erwärmen? c) Wie viel Energie und Entropie Spin müssen dazu dem Gittersystem pro Spin entnommen werden, wenn dessen Wärmekapazität durch die Debye-Formel gegeben ist: 3 12π 4 T cˆv (T ) = (10.54) kB 5
θD
und seine Debye-Temperatur 300 K beträgt (hier greifen wir auf Abschnitt 13.2 vor)? d) Berechnen Sie die Endtemperatur TG des Kristalls, nachdem die Spin- und Gitter-Teilsysteme ins thermische Gleichgewicht relaxiert sind. Wie viel Entropie wurde bei dem Temperaturausgleich erzeugt? Nehmen Sie an, dass TL während der Entmagnetisierung konstant bleibt, das heißt, dass die Spin-GitterRelaxationszeit groß gegen die Entmagnetisierungszeit ist, und lösen Sie die resultierende Gleichung graphisch. 10.5. Kernspin-Magnetisierung Im Jahr 1951 haben Pound und Purcell mittels resonanter Emission und Absorption von Mikrowellen die Magnetisierung des Kernspin-Systems von Lithium bei Zimmertemperatur vermessen. Das verwendete Magnetfeld betrug 0.63 T. a) Nehmen Sie an, dass Lithium einen Kernspin 1/2 mit einem magnetischen Moment von 50 neV/(T Teilchen) hat (tatsächlich beträgt der Kernspin 3/2) und berechnen Sie das magnetische Moment pro Teilchen. b) Berechnen Sie die Photonen-Energie und die zugehörige Frequenz und Wellenlänge, die für einen Spin-Flip-Prozess erforderlich sind.
10.7 Ferromagnetismus in der Molekularfeld-Näherung | 357
In diesem Experimente wurden zum ersten Mal negative Temperaturen nachgewiesen – dabei waren die Kernspins innerhalb von 10 μs untereinander im thermischen Gleichgewicht, während die Wiederherstellung des thermischen Gleichgewichts mit dem Gitter etwa 5 min erforderte [33]. 10.6. Die Entropie eines Ferromagneten in der Molekularfeld-Näherung a) Berechnen Sie zunächst die Energie im Magnetfeld U ( σ , Bext ) = Hspin − M · Bext .
b) Begründen Sie, warum die Entropie des Ferromagneten in der MolekularfeldNäherung wie bei einem Paramagneten allein vom Wert der Spinpolarisation σ abhängt, und geben Sie die Funktion S( σ ) an. Stellen Sie das Resultat mit Hilfe eines Graphikprogramms dar. c) Benutzen Sie das Ergebnis aus b), um dann S(U , Bext ) mit Hilfe eines Graphikprogramms graphisch darzustellen. Hinweis: Erstellen Sie eine Wertetabelle für σ , S( σ ) und U ( σ , Bext ) und tragen Sie dann S und U gegeneinander auf. 10.7. Magnetische Dipol-Wechselwirkungen Schätzen Sie die kritische Temperatur für Dipol-Dipol-Wechselwirkung in einem Kristall mit einem Gitterabstand a 0.3 nm für Elektronenspins und Kernspins mit l = 1/2 ab. Hinweis: Die für Kernspins angemessene Einheit ist das Kernmagneton μK 5.05 · 10−27 J/T, das sich von μB durch das Verhältnis von Elektronen- und Protonenmasse unterscheidet.
11 Einfache Quantensysteme In diesem Kapitel wollen wir zeigen, dass sich der zunächst sehr speziell anmutende Ausdruck für die Mischungsentropie, Gl. 10.14, als Grundlage für eine quantenstatistische Beschreibung der thermischen Eigenschaften von Quantensystemen verwenden lässt. Wir erhalten auf direktem Wege die Boltzmann’sche Wahrscheinlichkeitsverteilung für Quantenzustände im thermischen Gleichgewicht. Sowohl für die Berechnung der Wahrscheinlichkeiten als auch für die thermodynamischen Größen ist die Zustandssumme von zentraler Bedeutung. Wir berechnen die Zustandssumme und die thermodynamischen Eigenschaften für eine Reihe von archetypischen Quantensystemen. Die Ergebnisse werden anhand von experimentellen Daten für Festkörper und zweiatomige Gase illustriert. Dabei zeigt sich, dass das der klassischen Physik fremde Konzept der Nichtunterscheidbarkeit von Teilchen einen wesentlichen Einfluss auf die Absolutwerte der Entropie von Systemen aus identischen Teilchen hat. Den Abschluss bildet eine Diskussion des dritten Hauptsatzes aus der Perspektive der Quantenphysik.
11.1 Die Boltzmann-Verteilung Wir betrachten zunächst ein durch die Einteilchen-Schrödinger-Gleichung H(1) |ψi = εi |ψi
beschriebenes Einteilchen-Quantensystem mit Ω Energie-Eigenzuständen |ψi und den Energie-Eigenwerten εi . Solche Systeme bilden den Grundbaustein für makroskopische Systeme, die aus einer Vielzahl (typischerweise ≈ 1023 ) von gleichartigen Systemen aufgebaut sind. Die Rückführung eines Vielteilchen-Systems auf gleichartige Einteilchen-Systeme ist dann möglich, wenn die Werte der physikalischen Größen der Einteilchen-Systeme voneinander statistisch unabhängig sind. In diesem Fall kann die Verteilungsfunktion der Zufallsgrößen des Vielteilchen-Systems in die der Einteilchen-Systeme faktorisiert werden (Abschnitt 11.8, Anhang B). Die in der Einteilchen-Zustandssumme zusammengefassten statistischen Eigenschaften des Einteilchen-Systems sind dann repräsentativ für das N Teilchen enthaltende Vielteilchen-System. Aus diesem Grund stellen die aus der Einteilchen-Schrödinger-Gleichung gewonnenen (Eigen-)Werte der extensiven physikalischen Größen (insbesondere die Energien εi , die Impulse ki und die Drehimpulse ˆi ) Größen pro Teilchen beziehungsweise molare Größen dar. Diese zunächst überraschend anmutende Feststellung wird auch dadurch nahegelegt, dass sämtliche in den Hamilton-Operator H(1) eingehenden Systemparameter und Maßsystemkonstanten (, qˆ, μB , m ˆ ) Größen pro Teilchen sind.
11.1 Die Boltzmann-Verteilung
| 359
Die Bemühungen von Boltzmann, Gibbs, von Neumann und anderen um eine Grundlegung der statistischen Thermodynamik lassen sich in dem folgenden Postulat zusammenfassen, welches (wie die Hauptsätze) eine unbeweisbare Verallgemeinerung unserer bisherigen experimentellen Erfahrung darstellt: Die Entropie eines inkohärenten Gemisches von Ω orthogonalen Zuständen1 eines Einteilchen-Quantensystems mit den Wahrscheinlichkeiten Wi ist ein Funktional2 der {Wi } und beträgt: sˆ[Wi ] = −kB
Ω
Wi ln Wi
Boltzmann’sches Prinzip.
(11.1)
i=1
Dieser Ausdruck ist mit dem in Kapitel 10 verwendeten Ausdruck für die Mischungsentropie identisch, wenn wir die Molenbrüche Ni /N der in dem statistischen Gemisch auftretenden Quantenzustände |i mit den Wahrscheinlichkeiten Wi identifizieren. Das Auftreten der Einheit „Mol“ in der Gaskonstante R beziehungsweise „Teilchen“ in der Boltzmann-Konstante impliziert, dass es sich bei der so gewonnenen Entropie ebenfalls um eine Entropie pro Menge (Mol oder Teilchen) handeln muss. Im Folgenden werden wir sehen, dass sich aus den Lösungen der EinteilchenSchrödinger-Gleichung kombiniert mit dem Boltzmann’schen Prinzip thermodynamische Relationen für molare Größen gewinnen lassen. Zur Bestimmung derjenigen Wahrscheinlichkeiten Wi , die mit der Gibbs’schen Fundamentalform (und damit mit der Thermodynamik insgesamt) verträglich sind, kombinieren wir nun das Konzept der Zufallsgrößen, das Boltzmann’sche Prinzip und die Gibbs’sche Fundamentalform. Wir nehmen an, dass die Energie die einzige thermodynamisch relevante Zufallsgröße des Systems ist,3 dass ihre Eigenwerte εi bekannt und fest vorgegeben sind und dass die Wi den Zustand des Systems bei der
2 Viele Modellsysteme (Freier Körper, Oszillator, Rotator) besitzen unendlich viele Zustände. Wie sich zeigen wird, stellt die nachfolgend abgeleitete Form der Wi sicher, dass die durch Gl. 11.1 gegebene unendliche Reihe konvergiert, sofern die Folge der εi keinen Häufungspunkt bei endlicher Energie aufweist. Diese Forderung wird durch eine Reihe anderer Modellsysteme (Atome und Moleküle, wie atomarer und molekularer Wasserstoff H und H2 ) verletzt, welche das Phänomen der Dissoziation (Ionisation) aufweisen. In der Praxis ist es meist ausreichend, die Folge der εi bei einem Zustand |i abbrechen zu lassen, bei dem die räumliche Ausdehnung der zugehörigen Wellenfunktion mit dem Teilchenabstand vergleichbar wird. 2 Die Schreibweise sˆ [Wi ] bedeutet, dass sˆ nicht nur von einem der Wi , sondern von allen Wi abhängt. 3 In den nachfolgenden Kapiteln werden wir Erweiterungen vorstellen, bei denen neben der Energie auch die Teilchenzahl (Kapitel 12) und der Impuls (Abschnitt 13.4.4) thermodynamisch relevante Zufallsgrößen sind.
360 | 11 Einfache Quantensysteme Temperatur T festlegen. Dann gilt: eˆ[Wi ] = H(1) =
εi W i .
i
Wir können die Differenziale dˆ e[Wi ] und dˆ s[Wi ] durch die εi und die Differenziale der Wahrscheinlichkeiten ausdrücken: dˆ e[Wi ] =
εi dWi
i
dˆ s[Wi ] = −kB
ln Wi dWi + Wi
i
= −kB
ln Wi dWi +
dWi Wi
dWi
.
i
i
Aufgrund der Normierung der Wahrscheinlichkeiten Wi = 1 = const.
i
verschwindet der zweite Ausdruck in der Klammer und wir erhalten dˆ s[Wi ] = −kB
ln Wi dWi .
i
Diese Ausdrücke setzen wir in die (unter diesen Umständen sehr einfache4 ) Gibbs’sche Fundamentalform ein: !
dˆ e [Wi ] − T dˆ s [Wi ] = 0 .
Ist die Temperatur konstant, so erhalten wir nach der Definition der freien Energie (Abschnitt 5.1.1) fˆ [Wi ] := eˆ[Wi ] − T sˆ[Wi ]
ein Extremwertproblem dfˆ[Wi ] =
,
-
!
εi + kB T ln Wi dWi = 0
(11.2)
i
4 Die Verhältnisse werden etwas komplizierter, wenn die εi noch von einer weiteren Größe, zum Beispiel bei magnetischen Systemen vom externen Magnetfeld Bext , abhängen. In diesem Fall lau ˆ tet die Energie im Magnetfeld Uˆ = i εi (Bext )Wi , und es gilt dU = i (εi dWi + Wi dεi ) = ˆ ˆ m m (ε dW − W dB ). Dabei ist das zum Zustand i gehörige magnetische Moment pro Teilext i i i i i i ˆ dB ext . chen. Andererseits lautet das Differenzial von Uˆ nach Abschnitt 5.1.4 (Gl. 5.10): dUˆ = T dˆ s−m Wegen dB ext = 0 gilt dann: ! ˆ i ] = dUˆ [Wi ] − T dˆ dF[W εi + kB T ln Wi dWi = 0 , s [Wi ] = i
was mit 11.2 entspricht. Für wechselwirkungsfreie Spins ist das Ergebnis der nachfolgenden Rechnung identisch mit dem von Abschnitt 10.4.
11.1 Die Boltzmann-Verteilung |
361
für die freie Energie pro Teilchen fˆ[Wi ] bezüglich der Variation der Wi . Die Wi müssen der Nebenbedingung genügen, dass die Wahrscheinlichkeiten Wi stets korrekt normiert sein sollen: Wi = 1 .
i
Zur Lösung dieses Extremalproblems wenden wir die Methode der Lagrange’schen Multiplikatoren an. Letztere besteht darin, nicht fˆ(Wi ), sondern die Funktion fˆ[Wi ] − λ
Wi − 1
i
bezüglich des um die Hilfsgröße λ erweiterten Variablensatzes {Wi , λ} zu extremalisieren. Die partielle Ableitung nach dem Lagrange-Multiplikator λ liefert dabei die Nebenbedingung. Damit erhalten wir das Gleichungssystem , d fˆ[Wi ] − λ
und
Wi − 1
,
i
!
=
εi + kB T ln Wi + λ dWi = 0
i
-
!
Wi − 1 dλ = 0 .
i
Da die Wi (und λ) nun als voneinander unabhängig angesehen werden können, müssen die Ausdrücke in den geschwungenen Klammern einzeln verschwinden. Die zweite Gleichung reproduziert dann einfach die Normierungsbedingung. Lösen wir die erste Gleichung in 11.1 nach den Wi auf, so resultiert εi λ − kB T kB T
ε λ · exp − Wi = exp − i kB T kB T
ln Wi = −
Der erste Faktor in dieser Gleichung ist der Boltzmann-Faktor und der zweite stellt über eine geeignete Wahl von λ die Normierung der Wahrscheinlichkeiten sicher:
exp −
Wi =
i
i
εi kB T
· exp −
λ kB T
!
=1.
Z(T )
Lösen wir diesen Ausdruck nach exp(λ/kB T ) auf, so erhalten wir die kanonische Zustandssumme Z(T ) :=
i
ε exp − i kB T
= exp
λ kB T
(11.3)
als Normierungsfaktor für die Wahrscheinlichkeiten. Diese Wahl des LagrangeParameters stellt sicher, dass die Normierungsbedingung erfüllt werden kann. Damit erhalten wir für die gesuchten Wahrscheinlichkeiten
362 | 11 Einfache Quantensysteme
1.0
W(ε)
0.8
kBT/ hω 0.5 2.5
0.6 0.4 0.2 0.0
0
2
4
6
8
ε/ hω
exp − εi /kB T Wi (T ) = Z(T )
10
Abb. 11.1. Boltzmann’sche Verteilungsfunktion für die Wahrscheinlichkeiten der niederenergetischen Zustände des harmonischen Oszillators für niedrige und hohe Temperaturen (Abschnitt 11.4). Die Energie-Eigenwerte betragen εi = ω(i + 1/2) und die Summe der Wahrscheinlichkeiten ist für alle Temperaturen stets gleich eins.
Boltzmann-Verteilung .
(11.4)
Das Ergebnis stimmt mit dem in Gl. 10.21 in Abschnitt 10.4 überein, welches aus der Bedingung chemischen Gleichgewichts zwischen Subsystemen von Teilchen mit verschiedenen εi gewonnen wurde. Die Boltzmann-Verteilung stellt ein ganz zentrales Ergebnis der statistischen Thermodynamik dar, weil die konkrete Kenntnis der Wahrscheinlichkeiten es jetzt erlaubt, die Mittelwerte der Zufallsgrößen des Systems gemäß ˆ x =
xi Wi
i
aus ihren Werten xi in den Zuständen |φi zu berechnen. Anstatt für jede physikalische Größe xˆ die Summe neu zu auszuwerten, wollen wir nun zeigen, dass die gesamte Information über die Wahrscheinlichkeitsverteilung bereits in der Zustandssumme enthalten ist. Dazu wollen wir zunächst die physikalische Bedeutung der Zustandsumme Z(T ) deutlich machen. Wir setzen die mit Hilfe von Z(T ) korrekt normierten Wahrscheinlichkeiten in den Boltzmann’schen Ausdruck für die Entropie ein: sˆ = −kB
Wi ln Wi
i
= −kB
. i
ε Wi · − i − ln Z(T ) kB T
/
eˆ = + kB ln Z(T ) . T Lösen wir diese Gleichung nach ln Z auf, so erhalten wir die ziemlich allgemeine, das
heißt für alle Quantensysteme, bei denen die Energie die einzige relevante Zufallsvariable ist, gültige Beziehung zwischen der Zustandssumme und der freien Energie:
11.1 Die Boltzmann-Verteilung |
fˆ(T ) = eˆ − T sˆ = −kB T ln Z(T ) .
363
(11.5)
Gelingt es uns, die Zustandssumme für ein konkretes Quantensystem auszuwerten, so haben wir über die Ableitungen der freien Energie Zugang zu allen thermodynamischen Eigenschaften des Systems. Auch die Ableitungen der Zustandssumme selbst liefern nützliche Relationen und interessante Einsichten. Um diese zu gewinnen, suchen wir zunächst einen Zusammenhang zwischen der Energie und der freien Energie:5
eˆ = fˆ + T sˆ = fˆ − T
∂ fˆ = T2 ∂T
1 ∂ fˆ fˆ − 2 T ∂T T
= kB T 2
∂ ∂T
−
fˆ kB T
Zusammen mit Gl. 11.5 erhalten wir daraus die Beziehung eˆ(T ) = kB T 2
∂ ln Z(T ) . ∂T
(11.6)
Neben dem Mittelwert von eˆ εi können wir aus der Zustandssumme auch die quadratische Streuung (Δε)2 = ε2i − εi 2 der Energie um den Mittelwert gewinnen. Dazu setzen wir die Boltzmann-Verteilung in die Definition des Mittelwerts ein
1 1 εi eˆ(T ) =
Z
εi W i =
i
Z
εi exp −
i
multiplizieren die Gleichung mit Z und leiten nach T ab:
∂ ∂T
eˆ(T ) ·
i
ε exp − i kB T
∂ = ∂T
i
kB T
,
ε εi exp − i kB T
Dividieren wir nach dem Ableiten wieder durch Z(T ), so erhalten wir ε2i ∂ˆ e(T ) eˆ(T ) 1 2 ε W = ε W = . + i i i i ∂T kB T 2 kB T 2 kB T 2
i
i
= eˆ(T )
5 Der tiefere Grund für diesen Zusammenhang, besteht darin, dass sich der Logarithmus der Zustandsumme wegen eˆ fˆ = − = kB ln Z(T ) fˆM = sˆ − T T auch direkt als entropieartige Massieu-Gibbs-Funktion (Abschnitt 5.5), nämlich als das durch LegendreTransformation von sˆ(ˆ e, vˆ) bezüglich eˆ gewonnene Massieu’sche Potenzial fˆM auffassen lässt. Dann erhalten wir −ˆ e durch Ableitung von fˆM nach 1/T : ∂ fˆM ∂ fˆM = −T 2 = −ˆ e. ∂(1/T ) ∂T Die Variable β = 1/kB T ist für manche Fragestellungen in der statistischen Thermodynamik die natürlichste Wahl.
364 | 11 Einfache Quantensysteme Schließlich resultiert (analog zu Abschnitt 10.6) die interessante Relation: (Δε)2 = ε2i − εi 2 = kB T 2
dˆ e(T ) = kB T 2 cˆ(T ) . dT
(11.7)
Damit haben wir ein weiteres Beispiel für den Zusammenhang zwischen der thermischen Schwankungsbreite von Zufallsgrößen (hier der Energie) und gewissen Suszeptibilitäten des Systems gefunden. Wie in Abschnitt 10.6 stimmen die Stabilitätsbedingungen der Thermodynamik und Statistik in der Forderung nach Positivität von (Δε)2 und cˆ überein. Der Grund für die strukturelle Ähnlichkeit zwischen der Thermodynamik und der Wahrscheinlichkeitsrechnung ist in Anhang G beschrieben. Zusammenfassend halten wir fest, dass die Boltzmann-Verteilung und die Mischung von Teilchen in verschiedenen Quantenzuständen nach Kapitel 10 zu völlig identischen Resultaten führen. Dies illustriert die These, dass Teilchen in verschiedenen Quantenzuständen als thermodynamisch verschiedene Stoffe anzusehen sind. In den nachfolgenden Abschnitten wollen wir den Formalismus auf (im Sinne von Abschnitt 1.4) archetypische Quantensysteme anwenden.
11.2 Das allgemeine Zwei-Niveau-System - Gläser Der Spin 1/2 ist nicht das einzige Zwei-Niveau-System von praktischer Bedeutung. Bei tiefen Temperaturen lassen sich aus dem unendlich-dimensionalen Hilbert-Raum eines komplexen Quantensystems die beiden Zustände mit der niedrigsten Energie herausgreifen, wenn deren Energiedifferenz Δε sehr viel kleiner ist als der energetische Abstand zu dem nächst-höheren Anregungszustand. In diesem Fall bestimmen nur diese beiden Zustände das Tieftemperaturverhalten des Systems. Ein wichtiger Spezialfall ist der eines Teilchens in einem Doppelmulden-Potenzial V (x),6 bei dem zwei Potenzialmulden durch eine zunächst sehr hohe Barriere voneinander getrennt sind (Skizze in Abb. 11.2a). Die genaue Form der Mulden und der Barriere7 spielen für unsere Zwecke keine wesentliche Rolle, wenn nur die Energien der Grundzustände der Teilchens in beiden Mulden energetisch dicht beieinander liegen oder sogar exakt gleich (also entartet) sind. Bei sehr hoher Barriere sind die beiden Mulden völlig voneinander getrennt. Wird nun die Barriere abgesenkt, so entsteht für
6 Die Koordinate x steht hier für die Position eines Atoms, einer ganzen Gruppe von Atomen oder für den Winkel einer rotierenden Atomgruppe beim „Rotations“tunneln. Bei Erweiterung des Modells auf nicht-mechanische Systeme kann x auch für eine makroskopische Variable, wie den magnetischen Fluss in einen supraleitenden Ring oder die Phasendifferenz eines Josephson-Kontakts, stehen. 7 Diese bestimmen natürlich die Energien der links und rechts lokalisierten Zustände sowie die Stärke der Tunnel-Kopplung durch die Barriere.
11.2 Das allgemeine Zwei-Niveau-System - Gläser |
365
Abb. 11.2. a) Doppelmuldenpotenzial mit der Barriere V0 und dem Tunnelabstand d. Die Einzelmuldenenergien betragen ε1 , ε2 (gestrichelt) und die Energieeigenwerte des gekoppelten Systems ε+ und ε− (rot). Der Parameter Δ bezeichnet die Asymmetrie des Potenzials. b) Energieeigenwerte des gekoppelten Systems ε+ und ε− als Funktion der Asymmetrie Δ.
ein in einer der Mulden sitzendes Teilchen eine endliche Tunnelwahrscheinlichkeit, mit der es in die andere Mulde tunneln kann. Natürlich kann es mit derselben Wahrscheinlichkeit auch wieder zurücktunneln, sodass das Teilchen im Ergebnis über beiden Mulden delokalisiert wird. Im delokalisierten Zustand ist das dem Teilchen zur Verfügung stehende Volumen größer und seine Lokalisierungsenergie ist damit erniedrigt. Die Delokalisierung führt damit zu einer Energie-Absenkung und damit zu einer Bindungsenergie zwischen beiden Potenzialmulden. Dieses Phänomen liegt beispielsweise der kovalenten chemischen Bindung zugrunde, bei der ein Elektron zwischen zwei Atomen delokalisiert wird. Die Hamilton-Matrix des Systems ist in der Basis der rechts und links lokalisierten Zustände ψ1,2 durch ( ) H=
1 2
ε+Δ −Δ0
−Δ0 ε−Δ
(11.8)
gegeben, wobei ε = ε1 + ε2 die Summe der Energieniveaus ε1 , ε2 der Einzelmulden ist. Der Kopplungs-Parameter Δ0 ist durch die Tunnelrate,8 und der AsymmetrieParameter Δ durch Δ = ε2 − ε1 gegeben. Selbst, wenn die Form des Potenzials symmetrisch ist und damit die Energien ε1 und ε2 eines in der einen oder in der anderen Mulde lokalisierten Teilchens exakt gleich sind, sorgt eine beliebig schwache Tunnel-Kopplung Δ0 zwischen den beiden Mulden dafür, dass die auf einer Seite der Barriere lokalisierten Wellenfunktionen ψ1 (x) und ψ2 (x) entsprechenden Zustände instabil sind. Daher können sie keine
√ 8 Für Potenziale der in Abb. 11.2a gezeigten Art ist Δ0 ≈ Ω exp(d 2M V0 /2) gegeben, wobei Ω der Eigenfrequenz der Potenzialmulde, V0 die Barrierenhöhe, d der Tunnelabstand und M die Masse des tunnelnden Teilchens sind.
366 | 11 Einfache Quantensysteme Energie-Eigenzustände des Systems sein und werden sich daher gemäß unserer Diskussion in Abschnitt 10.2 in der Zeit entwickeln müssen. Nach den Regeln der Quantenmechanik ist die resultierende Zeitabhängigkeit periodisch mit der Frequenz ω = Δε/. Damit oszillieren die Mittelwerte aller physikalischer Größen des Systems mit dieser Frequenz, solange kein Relaxations-Prozess stattfindet, bei dem das System unter Energieabgabe in den Grundzustand relaxiert. Die Tunnelkopplung bewirkt, dass die Eigenzustände eines symmetrischen Doppelmulden-Potenzials Linearkombinationen 1 |ψ ± = √ 2
|ψ1 ± |ψ2
der links und rechts lokalisierten Zustände ψ1 (x) und ψ2 (x) sind. Dabei hat die antisymmetrische Kombination |ψ − von |ψ1 und |ψ2 die niedrigere Energie, weil die entsprechende Wellenfunktion ψ − (x) = x|ψ − am Ort der Tunnelbarriere einen Knoten und damit ein Minimum der Aufenthaltswahrscheinlichkeit |ψ − (x)|2 hat. Damit resultiert für |ψ − ein geringer Werte der potenziellen Energie Epot =
d3 x ψ ∗ (x)V (x)ψ(x) =
d3 x |ψ(x)|2 V (x) .
Man nennt |ψ − auch den bindenden und |ψ + entsprechend den anti-bindenden Zustand. Letzterer hat eine höhere Energie, da seine Wellenfunktion ψ + (x) ein Maximum der Aufenthaltswahrscheinlichkeit am Ort der Barriere aufweist. Die Diagonalisierung von H liefert die zu den Eigenzuständen ψ ± gehörenden Eigenwerte ε± =
ε±
Δ2 + Δ20 2
.
Für symmetrische Tunnelsysteme ist die resultierende Energiedifferenz ε+ − ε− = Δ0 Δ=0
gleich dem Kopplungsparameter Δ0 und wird Tunnelaufspaltung genannt. Die Zustandssumme des Systems lautet damit Z(T ) = g − exp − ε− /kB T + g + exp − ε+ /kB T , (11.9) wobei g − und g + ganze Zahlen sind, die den quantenmechanischen Entartungsgrad9 der beiden Zustände |ψ + und |ψ − angeben. Durch Ableiten von ln Z nach T gewinnen wir zunächst die Energie und dann die Wärmekapazität. Eine Asymmetrie Δ des Doppelmuldenpotenzials erhöht den Beitrag des stärker auf der niederenergetischen Seite lokalisierten Zustands zum bindenden und des
9 Unter Entartung versteht man in der Quantenmechanik das Phänomen, dass mehrere linear unabhängige Eigenzustände einer Größe X denselben Eigenwert xl besitzen. Sind gl Eigenzustände zum Eigenwert xl vorhanden, so spricht man von einer gl -fachen Entartung von xl .
11.2 Das allgemeine Zwei-Niveau-System - Gläser |
367
10-5
10-6
CN
(J g-1K-1)
KCl:CN
27 ppm Schottky-Kurve 10-7 0.1
0.2
0.5 T (K)
1
2
Abb. 11.3. Spezifische Wärmekapazität eines mit einer geringen Menge von CN− -Ionen dotierten KClKristalls bei tiefen Temperaturen. Der Gitteranteil (Abschnitt 13.2) der spezifischen Wärmekapazität wurde abgezogen. Die durchgezogene Linie entspricht einer modifizierten Schottky-Anomalie mit der Anregungsenergie Δε/kB = 1.55 K, die der Tatsache Rechnung trägt, dass die CN− -Ionen mehrere äquivalente Gitterplätze im KCl-Wirtskristall einnehmen können und der erste angeregte Zustand dreifach entartet ist (siehe Kap. 9 in [21] für Details).
mehr auf der hochenergetischen Seite lokalisierten zum anti-bindenden Zustand und macht sich in einer Vergrößerung der Energiedifferenz zwischen |ψ − und |ψ + bemerkbar. Asymmetrische Tunnelsysteme mit einer hohen Barriere können auf der höherliegenden Seite in einem metastabilen Zustand mit extrem hoher Lebensdauer vorliegen. Es sind diese langen Lebensdauern, die für die weiter unten in diesem Abschnitt kurz diskutierten Langzeit-Relaxationseigenschaften in ungeordneten Systemen verantwortlich sind (siehe Abschnitt 11.11). Die thermodynamischen Eigenschaften eines einzelnen Tunnelsystems sind zu denen des Spin-1/2-Systems isomorph. So weist insbesondere die spezifische Wärmekapazität ein Maximum bei der Temperatur Δε/kB , das heißt eine SchottkyAnomalie (siehe Gl. 10.35) auf. Im Unterschied zum Spin ist die Anregungsenergie nicht über das Magnetfeld einstellbar, sondern durch die Struktur, das heißt die Form des Doppelmulden-Potenzials und die Massen der beteiligten Teilchen gegeben.10 Enthält der Festkörper eine nicht zu große Zahl gleichartiger Tunnelsysteme mit derselben Tunnelaufspaltung Δε, so zeigt auch die Wärmekapazität eines makroskopischen
10 Über mechanische Verspannungen des Glases lassen sich die Tunnelaufspaltungen der Defekte etwas beeinflussen.
368 | 11 Einfache Quantensysteme
(μJ g-1K-1)
10 1
Quarzglas
0.1 T 0.01
T3
Quarz 0.001 0.01 0.02
0.05
0.1 T (K)
0.2
0.5
1
Abb. 11.4. Wärmekapazität von Quarzglas und kristallinem Quarz bei tiefen Temperaturen. Während kristalliner Quarz das für die Gitterschwingungen typische T 3 Verhalten zeigt (siehe Abschnitt 13.2), liegen die Messdaten von Quarzglas deutlich höher und zeigen eine lineare T Abhängigkeit (nach [21]).
Festkörpers bei T Δε/kB eine den Spin-Systemen analoge Schottky-Anomalie. Die ist für das Beispiel eines mit CN− -Ionen dotierten KCl-Kristalls in Abb. 11.3 gezeigt. Bei höherer Dichte der CN− -Defekte treten Wechselwirkungen zwischen den Tunnelsystemen auf, die zu einer breiten Verteilung P (Δε) der Anregungsenergien Δε führen. Eine solche breite Verteilung ist auch für andere Realisierungen von Tunnelsystemen in Festkörpern charakteristisch. Insbesondere bestimmen Tunnelsysteme die Tieftemperatureigenschaften von ungeordneten oder glasartigen11 Festkörpern. Diese zeichnen sich durch eine metastabile Anordnung der Atome oder Moleküle aus, die nicht dem in der Regel geordneten Zustand niedrigster Energie entspricht. Die im Alltag bekanntesten Vertreter solcher Systeme sind Silikat-Gläser (Fensterglas) und Kunststoffe (Polymere). Nimmt man im einfachsten Fall an, dass P (Δε) = P0 eine Konstante ist, so ergibt die Superposition vieler Schottky-Anomalien eine lineare Variation der Wärmekapazität mit der Temperatur. Da eine solche Temperaturabhängigkeit (wie wir in Abschnitt 14.2 sehen werden) normalerweise den Elektronen in Metallen vorbehalten ist, hat es eine große Überraschung ausgelöst, ein solches Verhalten in amorphen Isolatoren zu beobachten. Abbildung 11.4 zeigt die spezifische Wärmekapazität von kristallinem Quarz und Quarzglas. Während kristalliner Quarz eine bei tiefen Temperaturen mit T 3 variierende Wärmekapazität aufweist, ist die Wärmekapazität von Quarzglas wesentlich höher und variiert linear mit T . Dies sowie die empirische Tatsache, dass die Zahlenwerte von P0 in unterschiedlichen Systemen sehr ähnlich ausfallen, hat
11 Unter einem glasartigen oder amorphen Festkörper versteht man eine unterkühlte Flüssigkeit, die in kürzerer Zeit abgekühlt wurde, als für das Wachstum eines wohlgeordneten Kristallgitter notwendig ist. Der entstehende Festkörper weist im Gegensatz zu Kristallen keine Gitter-Periodizität auf und zeigt in der Röntgenbeugung keine scharfen Gitterreflexe, sondern ähnlich wie eine Flüssigkeit nur breite Maxima, die nur noch eine Nahordnung anzeigen.
11.3 Polymere
|
369
über einen gewissen Zeitraum zu einem regelrechten Boom der Physik der Gläser geführt.12 Das allgemeine Zwei-Niveau-System ist eines der wichtigsten archetypischen Systeme der Quantenphysik. Seine Anwendungen reichen von der chemischen Bindung über die Gläser bis hin zu dem aktuellen Gebiet der Quanten-Informationsverarbeitung, bei dem die universelle Dynamik von künstlichen, mikrostrukturierten Zwei-Niveau-Systemen ausgenutzt wird, um diese als Quanten-Bits einzusetzen. Ein Quanten-Bit ist die quantenmechanische Variante des „Flip-Flop“s, eines elektronischen Schaltkreises, der die logischen Zustände „0“ und „1“ der Informatik realisiert. Ein Quanten-Bit ist also ein Flip-Flop, welches nicht nur „0“ und „1“, sondern auch deren quantenmechanische Superpositionen zulässt! Gegenwärtig werden große Anstrengungen unternommen, solche Systeme verlässlich (und in großen Zahlen) herzustellen und zu steuern. Eine entscheidende Voraussetzung des Quantenrechnens ist eine ausreichende Lebensdauer der quantenkohärenten Superpositions-Zustände solcher Schaltkreise. Die Kohärenz wird durch unerwünschte Quanten-Übergänge zerstört, welche durch Umgebung des Zwei-Niveau-Systems hervorgerufen werden. Dabei handelt es sich um Prozesse, welche kohärente in inkohärente Überlagerungen von Zuständen überführen und daher mit der Erzeugung von Entropie verbunden sind. Neben der möglichen (und durch die potenziellen Anwendungen motivierte) Realisierung von „Quantenrechnern“ erlaubt das Studium von Quanten-Bits in Zukunft möglicherweise ein tieferes Verständnis der Entropie-Erzeugung und anderer Grundlagenfragen der Thermodynamik.
11.3 Polymere In diesem Abschnitt wollen wir auf die in Abschnitt 4.4 als Beispiel diskutierte thermoelastische Kopplung in Polymeren zurückkommen. Wie wir dort gesehen haben, bestehen Polymere aus langen Ketten mit N molekularen Einheiten, den Monomeren. Polymere zeichnen sich dadurch aus, dass sie sich bei Verstreckung erwärmen beziehungsweise bei Erwärmung im gestreckten Zustand zusammenziehen. Hierbei handelt es sich um ein Beispiel, bei dem sich zeigt, dass die Methoden der statistischen Thermodynamik unter bestimmten Bedingungen auch auf „klassische“ Systeme angewendet werden können. Die einfachste Situation liegt vor, wenn sich die Polymere in einer Lösung befinden oder mit einem „Weichmacher“ benetzt sind. In diesem Fall können wir die attraktiven Wechselwirkungen zwischen den einzelnen Polymerketten weitgehend ver-
12 Weitere Details zu diesem Thema finden sich in Kapitel 9 des Buches „Tieftemperaturphysik“ von C. Enss und S. Hunklinger [21].
370 | 11 Einfache Quantensysteme
a)
b)
c)
}
} Persistenzlänge a
Abb. 11.5. a) Polymere sind molekulare Ketten, die viele verschiedene räumliche Konfigurationen einnehmen können. Im einfachsten Fall sind die Ketten unverzweigt und Wechselwirkungen zwischen verschiedenen Kettensegmenten können vernachlässigt werden. b) Modellierung der elastischen Eigenschaften der Polymerkette durch die Persistenzlänge a in drei Dimensionen. Die Winkel zwischen den Kettensegmenten sind beliebig. c) Modellierung in einer Dimension: Der Winkel zwischen den Kettensegmenten kann nur 0 oder 180◦ betragen. Daraus folgt die im Text beschriebene mathematische Isomorphie zum Spin-1/2-System.
nachlässigen (wir machen wiederum vom Konzept der Idealität Gebrauch), weil das Lösungsmittel, beziehungsweise der Weichmacher als eine Art Schmiermittel wirken, welches verhindert, dass die Polymerketten agglomerieren und ein Hartplastik bilden. Wenn wir also annehmen können, dass sich die einzelnen Polymerketten frei bewegen können, wird die Brown’sche Bewegung thermische Fluktuationen der Konfiguration, das heißt der Geometrie des Kettenverlaufs, verursachen. Weiterhin nehmen wir an, dass die Enden der Kette in einem gewissen Abstand x fixiert sind. Die Diffusion der Kette in dem Lösungsmittel sorgt nun dafür, dass jede Kettenkonfiguration mit einer gewissen Wahrscheinlichkeit eingenommen wird. Typisch für Polymere ist nun, dass ihre elastischen Eigenschaften durch eine charakteristische Längenskala, die Persistenzlänge a, näherungsweise beschrieben werden. Diese ist so definiert, dass der Energieaufwand für eine Krümmung der Polymerkette mit einem Krümmungsradius R > a vernachlässigbar ist. Wir können damit näherungsweise annehmen, dass eine Kette der Länge L aus N = L/a starren Segmenten besteht, die frei, das heißt ohne Energieaufwand, gegeneinander verkippt werden können. Sofern wir neben den attraktiven auch die repulsiven Wechselwirkungen der Kette (das Eigenvolumen der Kette) vernachlässigen, sind alle Konfigurationen, die sich durch unterschiedliche Verkippungen der Segmente unterscheiden, energetisch gleichwertig. Es ist interessant festzustellen, dass diese Situation zu dem bereits besprochenen Beispiel des idealen Spin-1/2-Paramagneten mathematisch und physikalisch isomorph ist, wenn wir uns auf eine Raumdimension beschränken. Dazu identifzieren wir die statistische Orientierung der flexiblen Kettensegmente mit der Orientierung der Einzelspins, die Persistenzlänge a mit μB , den mittleren Abstand der Kettenendpunkte x mit dem Mittelwert des magnetischen Moments mz und die Kraft zwischen den Kettenenden −Fext mit dem externen Magnetfeld Bext . Den beiden Einstellrichtungen des Spins entsprechen die beiden möglichen Knickwinkel 0 und π . Bei vorgegebener äu-
11.3 Polymere
|
371
ßerer Kraft Fext wird sich die mittlere Kettenlänge x über die Wahrscheinlichkeitsverteilung der Knickwinkel so einstellen, dass die freie Enthalpie G(T, Fext , N ) = E − T S + Fext x
der Kette ein Minimum annimmt. Dabei bildet das Lösungsmittel, in dem sich die Polymerkette bewegt, zugleich das die Temperatur definierende Wärmebad. Übersetzen wir die in der thermischen Zustandsgleichung 10.27 des idealen Paramagneten enthaltenen Größen in die der Polymerkette, so erhalten wir als thermische Zustandsgleichung des Polymers: x(T, Fext ) = −N a tanh
aFext . kB T
(11.10)
Für kleine Abstände der Kettenenden ergibt sich ein lineares Kraft-Abstand-Gesetz mit der Federkonstanten K=
kB T . N a2
Eine Messung der Federkonstanten liefert bei bekannter Länge L = N a der Polymerkette eine Abschätzung der Persistenzlänge a. Bei höheren Kräften gibt es Abweichungen von der Linearität, die daher rühren, dass x natürlich durch die Kettenlänge nach oben beschränkt ist. Bemerkenswert ist, dass die zwischen den Enden der Polymerkette auftretende Kraft (mit Ausnahme des Wertes der Persistenzlänge) nichts mit den elastischen Eigenschaften der Kette und auch nichts mit deren elastischer Energie, sondern allein mit dem durch die Konfigurations-Entropie gegebenen entropischen Beitrag zur freien Energie gegeben ist. Aus diesem Grund spricht man in Analogie zum idealen Gas auch von entropischen Kräften. Umgekehrt hat eine Streckung der Polymerkette auch kalorische Effekte: Wird die Kette durch die externe Kraft verstreckt, so muss ihre Entropie abnehmen und an die Umgebung abgegeben werden. Lässt man die Kette aus dem verstreckten Zustand kontrahieren, so muss sie aus der Umgebung Entropie aufnehmen und eine Abkühlung bewirken. Dies ist das Analogon zur adiabatischen Entmagnetisierung des Spinsystems und die Ursache der in Abschnitt 4.4 bereits angesprochenen starken thermoelastischen Kopplung in Polymeren. Eine Verallgemeinerung des Modells auf drei Dimensionen stößt auf die Schwierigkeit, dass in diesem Fall die Bindungswinkel zwischen den als starr angenommenen Polymersegmenten der Länge a nicht nur 0 und π betragen, sondern kontinuierlich variieren können. Wir können dieser Tatsache durch eine Verallgemeinerung der Zustandssumme auf ein Zustandsintegral 1 Z(T, |F ext |) = 4π
2ππ
exp −
0
a|F ext | cos θ kB T
sin θ dθ dφ =
sinh X X
(11.11)
0
über alle Winkel Rechnung zu tragen. Dabei ist X = a|F ext |/kB T . Berechnen wir daraus das Kraft-Abstandsgesetz (die thermische Zustandsgleichung der Polymerkette), so
372 | 11 Einfache Quantensysteme ergibt sich
x(T, |F ext |) = −N a coth X −
1 X
(11.12)
und in linearer Näherung die Federkonstante K=
3kB T . N a2
Gleichung 11.12 ist aus dem Bereich des Magnetismus als Langevin-Funktion bekannt. Das Kraftgesetz für den Bereich kleiner Auslenkungen wird aber in der Polymerphysik üblicherweise aus „random walk“-Modellen abgeleitet, welche die diffusive Dynamik der Polymerkette abbilden. Berechnet man aus Gl. 11.11 als nächstes die Entropie S(T, |Fext |) = −∂G(T, |Fext |)/∂T und dann die Wärmekapazität bei konstanter Kraft, so erhält man in Übereinstimmung mit dem Gleichverteilungssatz: CF = N kB . Alternativ können wir durch Ableiten der Zustandssumme nach der Temperatur auch die Enthalpie H = E + F ext x = N kB T und daraus die Wärmekapazität berechnen. Natürlich ergeben sich in drei Dimensionen zusätzliche Komplikationen. Insbesondere können sich in der Kette Knoten und Verschlaufungen bilden, welche die Einstellung eines inneren Gleichgewichtszustands behindern. Dies führt zu metastabilen Zuständen, die dann bei kritischen Werten der externen Kraft instabil werden und die Verschlaufung ruckartig lösen. Derartige sogenannte „slip-stick“-Bewegungen resultieren in einem hysteretischen Verhalten der Kraft-/Abstandskurve.13 Im Grenzfall T → 0 stößt man allerdings auf das fundamentale Problem jeder klassischen Statistik: Hier divergiert die Entropie S → −∞! Im Zusammenhang mit Polymeren ist diese Einschränkung allerdings wenig relevant, da diese bei tiefen Temperaturen einen sogenannten Glasübergang zeigen, bei dem die attraktiven Wechselwirkungen zwischen den Ketten dominant werden und eine extreme Verlangsamung der Dynamik der Polymerketten bewirken. Das Polymer geht dann in einen glasartigen Zustand über, der eher einer unterkühlten Flüssigkeit ähnlich ist. Dieser Zustand ist metastabil, die thermische Unordnung ist „eingefroren“, das heißt alle Konfigurationssänderungen erfolgen extrem langsam. Das Auftreten extrem langer Relaxationszeiten ist auch für andere Gläser typisch und lässt sich, wie im vorangegangenen Abschnitt 11.2 durch (seltene) Tunnelprozesse zwischen verschiedenen, metastabilen Molekül-Konfigurationen verstehen.
11.4 Der harmonische Oszillator Nach dem Zwei-Niveau-System ist der harmonische Oszillator mit der Schwingungsfrequenz ω das nächst-einfachste archetypische Quantensystem. Beschränken wir
13 Mehr über das interessante Gebiet der weichen Materie unter der Betonung fachübergreifender Gesichtspunkte findet sich in dem exzellenten Buch „Physik kondensierter Materie“ von G. Strobl [19].
11.4 Der harmonische Oszillator
| 373
uns auf eine Raumdimension, so werden die Zustände des quantenmechanischen Oszillators durch nur eine Quantenzahl n = 0, 1, 2, · · · charakterisiert. Die EnergieEigenwerte lauten: 1 1 εn = ω n + = kB Θvib n + , 2
2
wobei ω die Eigenfrequenz des Oszillators und Θvib die dieser Frequenz entsprechende charakteristische Temperatur ist. Die Zustände sind beim eindimensionalen Oszillator nicht entartet und die Zustandssumme lautet daher einfach:
Θ Θ Z(T ) = exp − vib · exp −n · vib . (11.13) 2T
T
n
Da es sich bei dieser Summe offenbar um eine geometrische Reihe ∞
an =
n=0
1 , 1−a
mit a = exp(−Θvib /T ) handelt, erhalten wir, wenn wir noch mit exp(Θvib /2T ) erweitern: exp(−Θvib /2T ) 1 Zvib (T ) = (11.14) = . 1 − exp(−Θvib /T )
2 sinh(Θvib /2T )
Kürzen wir X = Θvib /2T ab, so gilt dX/dT = −Θvib /2T 2 . Im Grenzfall hoher Temperaturen kB T ω , entsprechend X → 0, erhalten wir wegen sinh X → X das Resultat des Gleichverteilungssatzes: Zvib (T → ∞) =
T . Θvib
(11.15)
Mit Gleichung 11.6 gewinnen wir den Mittelwert der Energie pro Oszillator durch Ableiten von ln Zvib (T ) eˆvib (T ) = kB T 2 =
d ln Z(T ) cosh(X) dX = −kB T 2 2 sinh(X) dT 2 sinh2 (X) dT
ω ω kB Θvib = + . 2 tanh(Θvib /2T ) 2 exp(ω/kB T ) − 1
(11.16)
Der Verlauf von eˆ(T ) ist zusammen mit dem klassischen Ergebnis aus Abschnitt 3.7 in Abb. 11.8a dargestellt. Man erkennt, dass die Energie des Oszillators bei tiefen Temperaturen nicht Null wird, sondern gegen die bekannte quantenmechanische Nullpunktsenergie ε0 = ω/2 strebt. Wenn wir eˆvib (T ) wieder nach T differenzieren, bekommen wir den Schwingungsbeitrag eines Oszillators zur Wärmekapazität: cˆvib (T ) = kB
ω/kB T 2 sinh(ω/2kB T )
2 (11.17)
Bei tiefen Temperaturen ergibt sich wegen der endlichen Anregungsenergie ω ein
374 | 11 Einfache Quantensysteme
(a)
(b)
1 mm
Abb. 11.6. a) Mittelwert der Energie eines thermisch angeregten harmonischen Oszillators. Im Grenzfall T → 0 strebt die Energie des Oszillators gegen die quantenmechanische Nullpunktsenergie. b) Photographie eines Quarzoszillators, wie er üblicherweise in Armbanduhren verwendet wird und darüber hinaus in der Rasterkraftmikroskopie eingesetzt werden kann (Photo Q+ -Sensor mit Spitze: F. Giessibl).
exponentieller Abfall der Wärmekapazität, während cˆvib bei hohen Temperaturen kB T ω (wieder im Einklang mit dem Resultat des Gleichverteilungssatzes) gegen kB strebt. Diese Ergebnisse wenden wir zunächst auf einen einzelnen makroskopischen Oszillator an, der durch einen gabelförmigen Quarzkristall realisiert ist, wie er in elektronischen Uhren verwendet wird (siehe Abb. 11.6a). Da Quarz ein piezoelektrisches Material ist, bei dem sich mechanische Deformationen durch elektrische Spannungen äußern, können die Auslenkungen der beiden Arme des Sensors elektrisch detektiert und mit Hilfe eines Fourier-Analysators spektral zerlegt werden. In Abb. 11.7 sind das Fourier-Spektrum (a) und die Temperaturabhängigkeit des gemessenen mittleren Auslenkungsquadrats x2 (T ) (b) gezeigt. Der zeitliche Verlauf x(t) der Auslenkung des Oszillators ist, wie für thermische Schwankung typisch, rein statistisch. Die Wahrscheinlichkeitsverteilung der Fourier-Koeffizienten von x(t) spiegelt jedoch die Eigenfrequenz des Oszillators wider: Die Auslenkung ist um die Resonanzfrequenz zentriert. Das Auslenkungsquadrat liefert zusammen mit der Federkonstanten K gerade die Hälfte der thermischen Energie des Oszillators; die andere Hälfte ist durch die kinetische Energie der schwingenden Arme gegeben: eˆ(T ) =
Px2 1 1 K + x2 = kB T + kB T 2M 2 2 2
=⇒
x2 =
kB T . K
(11.18)
Bei Zimmertemperatur und einer Resonanzfrequenz von etwa 32.76 kHz sind etwa 109 Schwingungsquanten angeregt, was einer Unschärfe der Auslenkung im Pikometer-Bereich entspricht. In jüngster Zeit laufen große experimentelle Anstrengungen, mechanische Resonatoren mit Massen im Pikogramm- und Eigenfrequenzen im MHz-Bereich bis in die Nähe des quantenmechanischen Grundzustands abzuküh-
11.4 Der harmonische Oszillator
(a)
2
6 nV
1.5
281 K
(b)
2
8
x2 [(pm) ]
10
143 K
4
1.0 1.5
Experiment Gl. 11.23
2 0
| 375
32730
32750 f [Hz]
32770
0.0
150
200
250
300
T (K)
Abb. 11.7. a) Spektrale Dichte des thermisch angeregten piezoelektrischen Spannungsrauschens eines Quarzoszillators bei 143 K und 281 K. Verschiebung des Maximums zu tieferen Resonanzfrequenzen zeigt eine Reduktion der Federkonstanten (ca. 1800 N/m bei 300 K) an. Die Fläche unter den Kurven entspricht dem thermischen Mittelwert V 2 des Quadrats des Spannungsrauschens. b) Temperaturabhängigkeit des mittleren Amplitudenquadrats der thermisch induzierten Schwingung als Funktion der Temperatur. Die durchgezogene Linie ist eine lineare Interpolation der Daten. Die rote gestrichelte Linie entspricht der Vorhersage des Gleichverteilungssatzes (nach [24]).
len. Diese Bemühungen zeigen, dass es sinnvoll ist, nach den thermodynamischen Eigenschaften einzelner quantenmechanischer Objekte zu fragen.14 Von großer historischer Bedeutung war der im Ansatz richtige Erklärungsversuch der Temperaturabhängigkeit der spezifischen Wärmekapazität von Festkörpern durch Einstein, der 1907 feststellte, dass die gemessene Wärmekapazität von Diamant bis auf Abweichungen bei tiefen Temperaturen recht gut durch Gl. 11.17 beschrieben wird. Dieses Modell – die erste Anwendung der Quantenhypothese auf die Festkörperphysik – ist sehr grob, weil es annimmt, dass im Kristallgitter nur eine charakteristische Schwingungsfrequenz ωE entsprechend der Einstein-Temperatur ΘE = ωE /kB existiert. Wie bereits bei gekoppelten Pendeln offenbar wird, bewirkt die Kopplung zweier identischer Oszillatoren eine Aufspaltung der Eigenfrequenzen, ähnlich wie bei der Tunnelkopplung zweier Potenzialtöpfe. Wie Abb. 11.8 illustriert, beschreibt das Modell die zu Einsteins Zeit bekannten Messwerte der Wärmekapazität von Diamant (offene Symbole) trotz dieser groben Vereinfachung erstaunlich gut. Das Modell reproduzierte insbesondere auch die Tatsache, dass das Quantenverhalten der atomaren Vibrationen besonders bei den leichten Atomen zutage tritt, welche gemäß kB ΘE = ω = K/m ˆ besonders hohe Eigenfrequenzen mit ΘE 300 K aufweisen. Bei Diamant trifft die niedrige Masse auf eine besonders hohe Federkonstante und bedingt eine sehr hohe Einstein-Temperatur, während Blei mit hohem Atomgewicht und weichem Gitter den entgegengesetzten Grenzfall ΘE 300 K darstellt.
14 Die aktuelle Forschung zeigt also, dass die thermodynamischen Begriffe im Bereich einzelner Quantensysteme keineswegs ihre Anwendbarkeit verlieren, dass also kein grundsätzlicher Unterschied zwischen der Beschreibung von Makro-Systemen einerseits und Mikro-Systemen andererseits besteht.
376 | 11 Einfache Quantensysteme
1.0
≈
0.5
0.0 10
100
1000
Abb. 11.8. Messdaten der spezifischen Wärmekapazität (bei konstantem Druck) von verschiedenen Festkörpern. Die durchgezogenen Linien sind Anpassungen nach dem Einstein-Modell (Gl. 11.17). Die gestrichelten Linien entsprechen dem Dulong-Petit-Grenzfall (horizontal) beziehungsweise der Lage der Zimmertemperatur (vertikal). Die Abweichungen vom Dulong-Petit-Grenzfall bei hohen Temperaturen sind eine Konsequenz der dort spürbaren thermischen Ausdehnung des Festkörpers. Diese bewirkt gemäß Gl. 3.24 eine messbare Differenz zwischen cˆp und cˆv . Auch bei tiefen Temperaturen treten Abweichungen auf, deren Ursprung in Abschnitt 13.2 geklärt wird (Daten nach [11]).
Eine weitere wichtige Anwendung des harmonischen Oszillators sind die Vibrationsanregungen in Molekülen. Moleküle stellen wechselwirkende Zwei-KörperSysteme dar, die gemäß Anhang E in zwei unabhängige Ein-Körper-Systeme zerlegt werden können. Das eine repräsentiert die Translationsfreiheitsgrade der Moleküle, das andere die inneren Freiheitsgrade, welche wiederum in einen Rotationsanteil und einen Schwingungsanteil zerlegt werden können. Die Vibrationsanregungen werden durch die charakteristische Energie ω = kB Θvib = K/m ˆ red kontrolliert, wobei m ˆ red die reduzierte Masse des Zwei-Körper-Problems ist (siehe Anhang E). Bei den leichteren Gasen (H2 , F2 , N2 , O2 , etc.) sind die Vibrationstemperaturen Θvib zu hoch, um bei Zimmertemperatur spürbare Beiträge zur Entropie und zur Wärmekapazität zu liefern. Bei den schwereren zweiatomigen Gasen verursachen die Vibrationsanregungen jedoch merkliche Abweichungen der Standardentropiewerte der idealen Gase von den durch die Entropie der Translations- und Rotationsfreiheitsgrade gegebenen Beträgen. Um dies experimentell zu illustrieren (siehe Abb. 11.13a), müssen wir zuvor noch die Rotationsbeiträge quantitativ verstehen, die wir im nachfolgenden Abschnitt besprechen werden.
11.5 Rotationsanregungen von Molekülen | 377
Noch deutlicher ist der Beitrag der Schwingungen zur molaren Wärmekapazität. In Abb. 11.13b ist die Vorhersage von Gl. 11.17 zusammen mit den Standardwerten der Wärmekapazität für verschiedene Gase aufgetragen. Die experimentellen Beispiele decken den ganzen Bereich von T ◦ = 300 K Θvib (für H2 ) bis T ◦ Θvib (für I2 ) ab.
11.5 Rotationsanregungen von Molekülen Ein weiteres archetypisches Quantensystem ist der freie Rotator. Wie in Anhang E dargestellt, tritt dieser als Teilsystem bei der Zerlegung des Zwei-Körper-Problems in der Form E(L) =
L2 L2 = 2J 2m ˆ red R2
auf, wobei J das Trägheitsmoment, R der Gleichgewichtsabstand und m ˆ red die reduzierte Masse des Zwei-Körper-Systems ist. Das quantenmechanische Gegenstück zur Energie als Massieu-Gibbs-Funktion des Rotators ist der Hamilton-Operator H=
2 ˆ . 2J
Der Bahndrehimpuls ˆ unterscheidet sich vom Spin dadurch, dass der Wert seines Quadrats nicht festgelegt, sondern variabel ist. Die Eigenwerte des DrehimpulsQuadrats ˆ2l = 2 l(l + 1) werden durch die Quantenzahl l = 0, 1, 2, . . . parametrisiert. Bezeichnen wir wir εrot = 2 /2J als die Rotations-Energie, so betragen die für die thermodynamischen Eigenschaften ausschlaggebenden Eigenwerte von H εl = εrot · l(l + 1) = kB Θrot · l(l + 1) =
2 2J
· l(l + 1) ,
wobei Θrot die die der Rotations-Energie entsprechende charakteristische Temperatur des Systems ist. Zu jedem Energie-Eigenwert εl gehören gl = 2l + 1 Zustände mit verschiedenen Eigenwerten von ˆ z . Man sagt auch, dass die Eigenwerte εl gl -fach entartet seien und nennt gl den Entartungsgrad. Experimentell werden die Werte von εrot aus den Linien-Abständen in den Molekülspektren bestimmt. Die Positionen der Linien im Spektrum entsprechen den Energie-Differenzen zwischen benachbarten (Δl = 1) Rotationszuständen hν = εl+1 − εl = (l + 1)(l + 2) − l(l + 1)kB Θrot = (2l + 1)kB Θrot ,
wobei ν die Frequenz der absorbierten oder emittierten Photonen ist. Dies resultiert in den für Rotationsanregungen typischen regelmäßigen Linienmustern mit dem Linienabstand Δ hν = 2kB Θrot , wie sie in Abb. 11.10 im Spektrum
378 | 11 Einfache Quantensysteme
l
l
l
l
l
l
l
l
l
Abb. 11.9. Energieniveaus und Entartungsgrad des starren Rotators.
des Kohlenmonoxids (CO) gezeigt sind. Zusätzlich ist eine Messung des Rotationsspektrums von Sauerstoff (O2 ) gezeigt, bei dem die Linienabstände bei ähnlichen Rotationstemperaturen etwa doppelt so groß wie bei CO sind. In dieser Verdoppelung manifestiert sich die Nichtunterscheidbarkeit identischer Teilchen, die für die Thermodynamik von Quantensystemen eine große Rolle spielt und im Folgenden genauer besprochen wird. Teilchen, wie Atome im Grundzustand oder Elektronen mit gleichem Spin, die sich im gleichen „inneren“ Zustand befinden, sind nicht unterscheidbar, weil sie über keinerlei Merkmale verfügen, an denen sie zu unterscheiden wären. Könnte man sie, gemäß der klassischen Anschauung, noch auf ihren Bahnen verfolgen, so wäre dies eine weitere Möglichkeit, Individuen zu unterscheiden. Genau dieser klassische Bahnbegriff ist nach der Aussage der Quantentheorie aber unhaltbar! Ist die Bewegung der Teilchen unterdrückt, wie bei den Atomen in einem Kristallgitter, so lassen sich diesen immerhin noch „Hausnummern“, das heißt, die Koordinaten von Gitterplätzen zuweisen. Bei beweglichen Teilchen verschwindet auch diese Unterscheidungsmöglichkeit. Daher müssen die Mehrteilchen-Zustände in Systemen mit identischen Teilchen der folgenden Bedingung genügen:
In Systemen mit identischen Teilchen muss jeder Mehrteilchen-Zustand invariant unter der Vertauschung zweier beliebiger Teilchen sein. Das heißt, die Vertauschung zweier Teilchen darf keinen neuen Zustand erzeugen. Man nennt diese Eigenschaft auch die Austauschsymmetrie des Zweiteilchen-Zustands. Vergleichen wir das O2 und das CO-Molekül, so führt der Austausch der beiden Atome im Molekül, zum Beispiel eine Drehung um 180° um eine zur Molekülbindung senkrechte Achse, das O2 -Molekül in sich über, das CO-Molekül dagegen nicht. Das bedeutet, dass Zustände des O2 -Moleküls, die durch einen solchen Austausch-Prozess auseinander hervorgehen, nur für unsere klassische Anschauung, nicht aber in der physikalischen Realität verschieden sind.
11.5 Rotationsanregungen von Molekülen | 379
CO
255
O2
260
265
H
270
175
275
180
185
190
H
(meV)
195
200
205
210
(meV)
Abb. 11.10. Gemessene Spektren der Rotationsanregungen von CO und O2 in der Nähe der ersten Vibrationsanregung [23]. Der Abstand der äquidistanten Linien entspricht der Energiedifferenz Δεl zweier benachbarter Anregungszustände. Bei CO beträgt der Abstand zwischen benachbarten Rotationslinien Δεl = 2kB Θrot , bei O2 wegen des Prinzips der Nichtunterscheidbarkeit dagegen Δεl = 4kB Θrot (nach [22]).
Das in Abb. 11.10 gezeigte Rotations-Spektrum des Sauerstoffs (16 O2 ) bildet eine experimentelle Demonstration dieses Prinzips. Berücksichtigt man die unterschiedlichen Trägheitsmomente der Moleküle, so ist der Linienabstand bei symmetrischen Molekülen wie 16 O2 mit Δεl = 4kB Θrot doppelt so groß wie der bei asymmetrischen Molekülen wie CO oder 16O18 O. Bei 16O2 existieren keine Rotationszustände mit geraden l. Wie wir in Abschnitt 12.1 genauer besprechen werden, ist dies eine Konsequenz der Tatsache, dass Sauerstoffatome Bosonen und die für die chemische Bindung des O2 -Moleküle verantwortlichen Zustände p-Zustände mit der Drehimpulsquantenzahl l = 1 und negativer Parität sind. Um insgesamt zu der für Bosonen geforderten positiven Parität zu kommen, müssen die Rotationszustände ebenfalls negative Parität besitzen, und es sind nur ungerade l erlaubt. Besonders drastisch ist dieser Effekt, wenn das Molekül durch zwei verschiedene Isotope desselben Elements gebildet wird, welche bezüglich der elektronischen Eigenschaften identisch sind, sich in den Spektren aber klar unterscheiden. Aus den Energieeigenwerten εl erhalten wir für die Zustandssumme des Rotators: Zrot (T ) =
∞ l=0
Θrot gl exp − l(l + 1) T
= 1 + 3 exp −
2 Θrot T
+ 5 exp −
6 Θrot T
+ ...
(11.19)
Für niedrige Temperaturen kB T εrot konvergiert die Zustandssumme des Rotators sehr schnell. In diesem Fall genügt es, nur die ersten Terme in der Summe zu berücksichtigen. Im Grenzfall hoher Temperaturen T Θrot dagegen ist der Abstand Δεl der Energie-Eigenwerte gegen die Temperatur vernachlässigbar. In diesem Fall können wir eine Kontinuumsnäherung anwenden und die Summe in Gl. 11.19 durch ein Inte-
380 | 11 Einfache Quantensysteme
gl W(Hl )
gl W(Hl)
kBT = 30 H rot kBT = 3 H rot
0
2
l
4
0
5
l
10
Abb. 11.11. Relevante Terme der Zustandssumme des starren Rotators für a) niedrige und b) hohe Temperaturen. Für hohe Temperaturen kann die Zustands-Summe durch das Integral über die rote Linie genähert werden. Das in b) aufgetragene Gewicht gl W (εl ) der Zustände für jedes l reproduziert die gemessenen relativen Intensitäten der Linien der Rotationsspektren in Abb. 11.10.
gral mit kontinuierlich variierendem l annähern. Mit den Definitionen x = l(l + 1)
Θrot T
erhalten wir zunächst: ∞ Zrot (T ) ≈
und
(2l + 1) exp −
dx = (2l + 1)
l(l + 1) Θrot T
dl
0
T ≈ Θrot
∞ exp(−x)dx =
T εrot
Θrot dl T
∞
− exp(−x)
0
=
0
T . Θrot
Damit erhalten wir für den Grenzwert der Zustandssumme bei hohen Temperaturen: Zrot (T → ∞) =
T . Θrot
(11.20)
Den Mittelwert der Energie pro Rotator gewinnen wir wieder nach Gl. 11.6 durch Ableitung der Zustandssumme:
eˆrot (T ) = kB T 2
d ln Z(T ) Θrot d = kB T 2 dT T dT
T Θrot
Als Beitrag der Rotationsanregungen zur molaren Wärmekapazität erhalten wir: cˆrot (T ) =
dˆ erot (T ) = kB dT
Diese im Grenzfall hoher Temperaturen gültigen Ergebnisse entsprechen denen des Gleichverteilungssatzes, den wir in Abschnitt 3.7 als Resultat der klassischen
11.5 Rotationsanregungen von Molekülen | 381
10000 100
10
Θ
Θ
1
1000
0.1
1
^
10
100
1
10
100
200
^
Abb. 11.12. a) Rotationstemperaturen zweiatomiger Gase als Funktion der reduzierten Masse m ˆ red =
−1 1/m ˆ 1 + 1/m ˆ2 [11]. Die durchgezogene Linie ist eine Anpassung gemäß der erwarteten Abhängigkeit kB Θrot = 2 /2J = A/m ˆ red . Der so erhaltene Wert von A liefert einen typischen Kernabstand von R ≈ 130 pm. Die Streuung der Daten spiegelt die unterschiedlichen Bindungsabstände der verschiedenen Moleküle wider. b) Vibrationstemperaturen Θvib als Funktion von m ˆ . Die durchgezogene red Linie ist eine Anpassung gemäß der erwarteten Abhängigkeit kB Θvib = K/m ˆ red = A / m ˆ red und liefert eine typische molekulare Federkonstante von K = 1.2 nN/pm. Die Streuung der Daten entspricht der Variation der Federkonstanten der verschiedenen Moleküle (Daten nach [11]).
Maxwell-Verteilung ganz anders motiviert haben! Allgemein können wir festhalten, dass der sogenannte „klassische Grenzfall“15 vorliegt, wenn die Temperatur groß gegen den Abstand der Energieniveaus wird. Die Rotationstemperaturen Θrot sind durch das Trägheitsmoment J = m ˆ red R2 gegeben, wobei m ˆ red wieder die reduzierte Masse des Zwei-Körper-Systems ist (siehe Anhang E und auch die Diskussion in Abschnitt 3.7) und R den Bindungsabstand, das heißt die Entfernung zwischen den Atomkernen im Molekül, bezeichnet. Bei konstantem Bindungsabstand erwartet man, dass Θrot ∝ 1/m ˆ red ist. Die mit Hilfe der Molekülspektroskopie gewonnenen experimentellen Daten [11] in Abb. 11.12a liefern in der Tat eine solche Abhängigkeit. Bei annähernd konstanter reduzierter Masse (beispielsweise bei den Wasserstoff-Halogeniden HF, HCl, HBr und HJ, bei denen die reduzierte Masse durch das leichte H-Atom bestimmt wird) ist eine Abnahme von Θvib zu beobachten, welche die Zunahme der Bindungslänge mit zunehmendem Atomradius widerspiegelt. In dieser Form ist das Ergebnis auf die Rotationsanregungen asymmetrischer Moleküle wie HCl, CO oder HD anwendbar. Bei symmetrischen Molekülen, wie H2 , O2 , N2 oder NH3 , treten die im Zusammenhang mit den Rotationsspektren bereits erwähnten
15 Wie wir gleich sehen werden, sind in diesem Grenzfall keineswegs alle Spuren der Quantenphysik aus den beobachtbaren Größen getilgt, weil die Werte der Entropie im Gegensatz zur Energie und der Wärmekapazität auch bei hohen Temperaturen durch die quantenmechanischen Systemparameter sowie das Prinzip der Nicht-Unterscheidbarkeit bestimmt werden.
382 | 11 Einfache Quantensysteme
3.5
10
kB s^
5
c^v kB
3.0
2.5 0
0.1
1
Θ
10
100 300
1000
Θ
5000
Abb. 11.13. a) Standardwerte (T = 298.15 K, p = 1013 mbar) der molaren Entropie der inneren Anregungen von symmetrischen und asymmetrischen zweiatomigen Molekülgasen als Funktion der Rotationstemperaturen Θrot (siehe Tabelle 11.1). Der Translationsbeitrag zur molaren Entropie (entsprechend Gl. 6.3 mit der chemischen Konstante jtrans aus Gl. 6.5) wurde abgezogen. Die gestrichelten Linien geben den Rotationsbeitrag zu sˆint an; die durchgezogenen Linien berücksichtigen auch den im vorangegangen Abschnitt besprochenen Schwingungsanteil, der bei den schweren Molekülen schon bei Zimmertemperatur spürbar ist. Die Werte für O2 und NO liegen oberhalb dieser theoretischen Erwartung: Die Bindungselektronen des Sauerstoffs bilden einen Spin-Triplett-Zustand, wobei die Energiedifferenzen innerhalb des Tripletts nur etwa 3 K betragen. Bei Temperaturen über 10 K ist dies vernachlässigbar, weshalb der Spin des O2 -Moleküls einen weitgehend T -unabhängigen Zusatzbeitrag von sˆspin = kB ln 3 zur molaren Entropie liefert. Bei NO beträgt der Zusatzbeitrag etwa kB ln 4, was wegen der Kombination eines Bahndrehimpulses (L = 1) mit dem Spin des ungepaarten Elektrons des Stickstoffs zu zwei Feinstrukturkomponenten mit den Gesamtdrehimpulsen J = 1/2 und J = 3/2 zurückzuführen ist (Daten nach [11; 25]). Nach der 3. Hund’schen Regel hat der 4-fach entartete Zustand mit J = 3/2 die niedrigste Energie. b) Gemessene Standardwerte der molaren Wärmekapazität derselben Gase als Funktion der Vibrationstemperatur Θvib . Die gestrichelten Linien entsprechen den Grenzfällen (Θvib 300 K (ˆ c = 7/2 · kB ) und (Θvib 300 K (ˆ c = 5/2 · kB ). Die durchgezogene Linie ist die Wärmekapazität eines Einstein-Oszillators und wurde nach Gl. 11.17 berechnet. Der cˆv -Wert von NO ist bei Zimmertemperatur gegenüber der durchgezogenen Linie etwas erhöht, was an der relativ hohen Energiedifferenz von 174 K zwischen den Komponenten des Feinstruktur-Multipletts liegt (Daten nach [11; 25]).
Komplikationen durch Nicht-Unterscheidbarkeit der beiden Partner des Moleküls auf. In den thermodynamischen Eigenschaften äußert sich dies dadurch, dass in der Regel die Zustände gerader Parität, das heißt die mit geraden l, aus der Zustandssumme herausfallen, sofern die Atome Fermionen sind. Bei Bosonen fallen dagegen die Zustände ungerader Parität (mit ungeraden l) aus der Zustandssumme heraus.16 Im Grenzfall
16 Das Beispiel des Sauerstoffs 16 O2 zeigt, dass die Verhältnisse noch komplizierter liegen, wenn der elektronische Bindungszustand negative Parität hat: In diesem Fall muss auch die Wellenfunktion der Atomkerne negative Parität haben. Im Spektrum des Sauerstoffs fehlen daher die Zustände mit geraden
11.5 Rotationsanregungen von Molekülen | 383
hoher Temperaturen fällt der Unterschied der erlaubten Zustände für Bosonen und Fermionen nicht ins Gewicht; in beiden Fällen enthält die Zustandssumme nur halb soviele Terme wie bei asymmetrischen Molekülen, und die Symmetrie-Eigenschaften lassen sich einfach durch einen sogenannten Symmetriefaktor zS in der Zustandssumme berücksichtigen [26]: Zrot (T → ∞) =
T . zS Θrot
(11.21)
Für zweiatomige symmetrische Moleküle ist zS = 2, bei mehratomigen Molekülen, wie NH3 (zS = 3), können auch höhere Werte von z auftreten. Mit Hilfe der Zustandssumme können wir die molare Entropie des Systems „Rotator“ leicht berechnen und erhalten im Grenzfall kB T εrot :
sˆrot = −
∂ ∂T
− kB T ln Zrot (T ) =
= kB ·
ln
T +1 zS Θrot
∂ ∂T
−kB T ln
T Θrot
(11.22)
.
Bei hohen Temperaturen zeigt sich das quantenmechanische Charakteristikum der Nicht-Unterscheidbarkeit in der Entropie, nicht aber in der Energie und in der Wärmekapazität. Die höhere Symmetrie der Moleküle mit identischen Teilchen bewirkt eine geringere Zahl der Terme in der Zustandssumme und damit eine im Vergleich mit dem asymmetrischen Fall reduzierte Entropie. Experimentell offenbart sich dies in den in Abbildung 11.13a gezeigten Absolutwerten der molaren Entropie, die sich für symmetrische und asymmetrische Moleküle genau um den Wert kB ln 2, also um den Symmetriefaktor zS = 2, unterscheiden. In Tabelle 11.1 sind die Rotationstemperaturen und Symmetriefaktoren für eine Reihe von Molekülen zusammengestellt. Schließlich sind wir nun in der Lage, die beiden in Gln. 6.3 eingehenden Systemkonstanten κ2 = cˆv /kB und j2 (chemische Konstante) eines zweiatomigen idealen Gases mit konstanter Wärmekapazität anzugeben: κ2 =
5 , 2
j2 =
jtrans zS zΘrot
für Θrot T Θvib
(11.23)
und κ2 =
7 , 2
j2 =
jtrans zS zΘrot Θvib
für Θrot , Θvib T Tel ,
(11.24)
wobei Tel die charakteristische Temperatur der elektronischen Freiheitsgrade des Moleküls und z die Multiplizität des molekularen Grundzustands ist.
l. Außerdem besitzen manche Moleküle (zum Beispiel H2 und N2 ) auch noch Paare von Kernspins, für die ebenfalls symmetrische und antisymmetrische Kombinationen möglich sind.
2
207
30.01
NO
JBr
16.60
28.01
12 C16 O
146
127.9
H127 I
162.5
80.92
H81 Br
JF
36.47
H35 Cl
JCl
7.204
20
49.10
27.80
6.433
0.992
0.988
0.973
0.95
0.669
3.02
HD
79.9
H19 F
159.8
35.46
19
16
126.9
2
70.91
38
32
253.8
127 J
79 Br
2
2
35 Cl
19 F
2
14
2
28
14 N
16 O
1
2.015
2
4.03
(u)
(u)
D2
mred
m ˆ
H2
Molekül
278
378
–
–
2170
2309
2649
2991
4138
–
214.5
325.3
559.7
916.6
1580
2359
3115
–
–
–
–
25.6
69.2
79.4
89.7
124.1
–
6.43
9.75
16.8
27.5
47.4
70.7
93.3
132
(THz)
(cm−1 ) 4401
νvib
kvib
–
–
–
–
112.8
160.92
141.4
127.5
91.68
–
267
228
199
141
121
110
74.2
74.1
(pm)
R
–
–
–
–
1902
314
412
516
966
–
172
246
323
470
1177
2295
577
575
(N/m)
K
–
–
–
–
1.93
6.43
8.46
10.6
21.0
–
0.0374
0.0821
0.244
0.8902
1.4456
1.9982
30.44
60.85
(cm−1 )
krot
–
–
–
–
1080
298
366
432
570
–
151
193
243
159
498
945
439
432
(kJ/mol)
Δεdis
–
–
–
–
11.18
3.09
3.80
4.48
5.91
–
1.57
2.00
2.52
1.65
5.17
9.81
4.55
4.48
(eV)
Δεdis
0.081
0.162
0.402
2.45
2.815
9.25
12.2
15.25
30.16
–
0.0538
0.118
0.35
1.28
2.08
2.88
43.8
87.6
(K)
Θrot
(spec)
0.081
0.162
0.402
2.45
2.78
9.48
12.18
15.34
30.1
65.96
0.054
0.118
0.356
1.27
2.11
2.92
43.0
85.3
(K)
Θ(cal) rot
Tab. 11.1. Spektroskopische Daten und charakteristische Temperaturen einiger zweiatomiger Gase (Daten nach [11; 25]).
400
544
–
–
3123
3323
3812
4304
5955
–
309
468
806
1319
2274
3395
4483
6334
(K)
(spec)
Θvib
382.3
545.4
869
2701
3081
3207
3680
4160
5692
5219
306.4
463
801
1283
2238
3352
4300
5995
(K)
Θ(cal) vib
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
zS
384 | 11 Einfache Quantensysteme
11.6 Innere Freiheitsgrade von Atomen |
385
11.6 Innere Freiheitsgrade von Atomen Die Atome besitzen selbstverständlich auch innere Freiheitsgrade. Im einfachsten Modell, welches nur die orbitalen Freiheitsgrade der Elektronen berücksichtigt, erwartet man zunächst, dass die entsprechenden Energiedifferenzen deutlich oberhalb der Zimmertemperatur liegen. Berücksichtigt man jedoch auch den Elektronen-Spin und die Feinstruktur der atomaren Zustände, so findet man auch sehr kleine Anregungsenergien. Daher können bei vielen Atomen auch deren innere Freiheitsgrade bereits bei Zimmertemperatur thermisch angeregt sein und zur Standard-Entropie des Gases beitragen. In Tabelle 11.2 sind die Elektronenkonfigurationen für die Hauptgruppen des Periodensystems, einiger Übergangsmetalle sowie einiger der Seltenen Erden zusammen mit den niedrigsten Anregungsenergie und den Entartungsgraden17 angegeben. Die Termsymbole der Form 2S+1 LJ fassen die Spinmultiplizität gs = 2s + 1, den Bahndrehimpuls L sowie den Gesamtdrehimpuls J zusammen. Die Entartungsgrade der Elektronenzustände hängen von den Werten der Drehimpulsquantenzahlen ab. Der Beitrag der inneren Freiheitsgrade der Atome zu den Standard-Werten der molaren Entropie sind in Abbildung 11.14a aufgetragen. Besonders einfach liegen die Verhältnisse für die ersten beiden Hauptgruppen des Periodensystems sowie für die Edelmetalle. Wie in Abschnitt 6.1 bereits erwähnt, bewirkt der Spinfreiheitsgrad des einzelnen Valenzelektrons bei den Dämpfen der Elemente der ersten Hauptgruppe (H, Li, Na, K, Rb, Cs) und der Edelmetalle (Cu, Ag, Au), dass der atomare Grundzustand doppelt entartet ist. Im Absolutwert der molaren Entropie macht sich dies durch einen zusätzlichen Beitrag von sˆint = kB ln 2 bemerkbar (siehe Abb. 6.2). Die Elemente der zweiten Hauptgruppe (Be, Mg, Ca, Sr, Ba, Ra) besitzen dagegen zwei Valenzelektronen, welche in einem Spin-Singulett-Zustand ohne Entartung vorliegen, der nicht zur molaren Entropie beiträgt. Der erste angeregte Zustand ist bei all diesen Elementen ein p-Zustand (L = 1), der energetisch so weit über dem Grundzustand liegt, dass er bei Zimmertemperatur nicht zur molaren Entropie beträgt. Dies gilt auch für die meisten anderen elektronischen Anregungszustände. Die fünfte Hauptgruppe (N, P, As, Sb, Bi) und die Übergangsmetalle Cr, Mo sowie Mn, Tc und Re weisen im Grundzustand ebenfalls ein reines Spin-Moment mit S = 3/2, 5/2, 3 und den Spin-Multiplizitäten 4, 6 und 7 auf, wohingegen der BahnDrehimpuls L = 0 ist. Der erste angeregte Zustand ist wieder ein p-Zustand mit hoher Anregungsenergie. Zum großen Teil sind die Werte der inneren Zustandssumme ganzzahlig und spiegeln den Entartungsgrad des atomaren Grundzustands wider. Allein die Feinstruktur des Grundzustandes liefert Energiedifferenzen zwischen Zuständen mit verschiedenen Drehimpulswerten (J ), welche mit Zimmertemperatur vergleichbar und damit für die Standardwerte der Entropie und der Wärmekapazität relevant sind. In besonderem Maße gilt dies für die leichten Elemente mit endlichem Bahndre-
17 In der Atomphysik wird der Entartungsgrad auch als Multiplizität bezeichnet.
386 | 11 Einfache Quantensysteme
ln 16 ln 10 ln 8 ln 6 ln 4 ln 3 ln 2 0 2.5 1.5 0
50
100
150
200
250
Abb. 11.14. Messwerte der Entropie sˆint /kB = (ˆ s0 − sˆtrans )/kB der inneren Freiheitsgrade der Elemente im idealen Gaszustand unter Standardbedingungen. Wenn die innere Zustandssumme ausschließlich entartete Zustände enthält, so entspricht sˆint /kB T dem Logarithmus des Entartungsgrads. Bei einigen Atomen bedingt die aus der Spin-Bahn-Wechselwirkung resultierende Feinstrukturaufspaltung des Grundzustands die Existenz von niedrig liegenden elektronischen Anregungszuständen, die sich in nicht-ganzzahligen Werten der Zustandssumme äußern. Am ausgeprägtesten ist dies bei Ge, Nb und Gd, welche in den atomaren Konfigurationen mit hoher Werten von S und L vorliegen und für die das Maximum der Schottky-Anomalie in cˆv (T ) (siehe Fig. 10.6b) nahe bei Zimmertemperatur liegt. Andere Elemente, wie C, Fe, oder Os, weichen trotz ihres hohen Entropiewertes in der spezifischen Wärmekapazität nicht wesentlich von κ = 3/2 ab, weil die Anregungsenergie deutlich unterhalb Zimmertemperatur liegt (Daten nach [11]).
himpuls, bei denen die für die Feinstrukturaufspaltung verantwortliche Spin-BahnWechselwirkung besonders klein ist. Bei den Hauptgruppen 3, 4 und 6 äußert sich dies in einem kontinuierlichen Abfall der Entropiewerte, weil mit zunehmender Anregungsenergie immer weniger thermische Aktivierung möglich ist. Die übrigen Beispiele weisen gemischte Zustände mit endlichen L und S auf, bei denen die Spin-Bahn-Wechselwirkung für kleine Aufspaltungen von Zuständen mit verschiedenen Gesamtdrehimpulsen J sorgt. Die leichten Elemente zeigen Aufspaltungen im meV-Bereich und sind damit bereits bei Zimmertemperatur thermisch angeregt. Mit zunehmender Kernladungszahl nimmt die Stärke der Spin-Bahn-Wechselwirkung zu, sodass nur der niedrigste Zustand des J -Multipletts zur Zustandssumme beiträgt. Dieser Trend äußert sich in der Abnahme von sˆint in Abbildung 11.14a beispielsweise für die 3. Hauptgruppe (B, Al, Ga, In, Tl), wo bei In und Tl nur der J = 1/2-Zustand sichtbar bleibt, oder bei der 4. Hauptgruppe (C, Si, Ge, Sn, Pb), wo nur ein nicht ent-
11.6 Innere Freiheitsgrade von Atomen |
387
Tab. 11.2. Multiplizitäten und einige der Anregungsenergien Δε/kB (in K) der drei niedrigsten Quantenzustände einiger Elemente.
Gruppe 3. Hauptgruppe
GZ 2
P1/2
B
Al
Ga
In
Tl
2, 4
2, 4
2, 4
2
2
–
160.5
–
–
–
C
Si
Ge
Sn
Pb
1, 3, 5
1, 3, 5
1, 3
1
1
21.3; 61
111; 321
–
2434
–
N
P
As
Sb
Bi
4
4
4
4
4
O
S
Se
Te
5, 3, 1
5, 3, 1
5
5
227.5; 326.3
573; 824
–
–
F
Cl
Br
J
Multiplizität
4, 2
4, 2
4
Δε/kB (K)
581.3
1268
5302
Multiplizität Δε/kB (K) 3
4. Hauptgruppe
P0
Multiplizität Δε/kB (K)
5. Hauptgruppe
4
S3/2
Multiplizität 3
6. Hauptgruppe
P2
Multiplizität Δε/kB (K)
7. Hauptgruppe
2
Übergangsmetalle
P3/2
Cr 7
Grundzustand Multiplizität
Zr 3
S3 7
Übergangsmetalle
7
Ti 3
Grundzustand
F2
F2
Mo 7
Nb 6
D1/2
S3
Mn 6
S5/2
7
D4
Os 5
D4
Multiplizität
9,7
–
9,7
9,7
Δε/kB (K)
–
598.5
–
–
Seltene Erden Grundzustand Multiplizität
La 2
D3/2 4
8
Eu
Gd
S7/2
9
8
D2
9,7
Tc 6
S5/2
6
Fe 5
–
2
6
S5/2 6
Pt 3
D3 –
Tm
Yb
F7/2
1
8
Re 6
S0 1
Lu 2
D3/2 4
artetes Spin-Singulett übrig bleibt. Bei den Elementen, bei denen eine der Anregungsenergien im Bereich der Zimmertemperatur liegt, wie beispielsweise S, ist auch auch die Wärmekapazität cˆv deutlich höher als 3kB /2. Am höchsten ist der Beitrag der inneren Freiheitsgrade zur molaren Entropie bei den Atomen, bei denen ein hohes Spinmoment mit einem hohen Bahnmoment kombiniert ist, wie Ti (L = 4, S = 2), Fe (L = 4, S = 2) oder Gd (L = 2, S = 4). In diesen Fällen trägt nicht nur der Grundzu-
388 | 11 Einfache Quantensysteme stand, sondern auch in der Nähe liegende angeregte Zustände mit hoher Multiplizität zur molaren Standard-Entropie bei. Diese Beispiele illustrieren, dass die spezifische Wärmekapazität einatomiger Gase keineswegs immer cˆv = 3kB /2 beträgt, wenn die Atome niederenergetische Anregungszustände besitzen. In diesem Fall ist die spezifische Wärmekapazität wie bei den Tunnelzentren in dotierten Salzen (siehe Abschnitt 11.2) durch eine Variante der Schottky-Anomalie gegeben, bei der die Entartungsfaktoren von Grund- und angeregten Zuständen deutlich größer als 1 sein können. Der bereits in Fig. 3.6 experimentell beobachtete stufenartige Anstieg der Wärmekapazitäten mit der Temperatur resultiert daher, dass die inneren Anregungen eine Minimalenergie wie εrot oder εvib erfordern, die aufgrund der exponentiellen Temperaturabhängigkeit der Boltzmann-Verteilung bei tiefen Temperaturen nicht mehr verfügbar ist. Zusammenfassend halten wir fest, dass die Verallgemeinerung des in Abschnitt 6.2 gefundenen Ausdrucks für die freie Energie auf mehratomige ideale Gase durch die Ergänzung der Zustandssumme Zint der inneren Freiheitsgrade der Moleküle im Argument des Logarithmus erfolgt : .
/ jtrans V T 3/2 F (T, V, N ) = E0 − N kB T ln · Zint (T ) + 1 (11.25) N
Die besprochenen Beispiele für innere Anregungen, wie Rotationen, Schwingungen oder elektronische Anregungen, lassen sich (bis auf Korrekturen durch die Wechselwirkung) aufgrund des mikroskopischen Ausdrucks für die chemische Konstante mit dem quantitativ korrekten Absolutwert der Entropie beschreiben. Im Allgemeinen tragen die inneren Freiheitsgrade nicht nur zum Absolutwert der Entropie, sondern auch zu deren Temperaturabhängigkeit bei. Für O2 und N2 liegt bei Zimmertemperatur der Fall Θrot T Θvib vor, in vielen Fällen liegen Θrot und Θvib aber so dicht beieinander, dass die Wärmekapazität kein Plateau aufweist, sondern zwischen Θrot und Θvib temperaturabhängig bleibt (siehe Abb. 3.6) und in Gl. 11.25 nicht die klassischen Grenzfälle Gln. 11.20 und 11.15, sondern die allgemeinen Ausdrücke für Zrot und Zvib verwendet werden müssen. Wenn keine FeinstrukturAufspaltung des Grundzustands vorliegt, liefern nur die Spinfreiheitsgrade einen (im allgemeinen T -unabhängigen) Beitrag zur Zustandssumme und zur Entropie. Die Temperaturabhängigkeit der Wärmekapazitäten kann nun quantitativ richtig berechnet werden, da die hierzu notwendigen Materialgrößen, wie εrot oder ωvib , mit Hilfe der Molekülspektroskopie unabhängig zu beschaffen sind. Diese Ergebnisse sind von großer Bedeutung für die physikalische Chemie, weil die (verallgemeinerte) chemische „Konstante“ j(T ) := jtrans Zint (T ) die Absolutwerte der chemischen Potenziale bestimmt. Die auf diese Weise mögliche theoretische Vorhersage der Gleichgewichtskonstanten für chemische Reaktionen in Gasgemischen (siehe Abschnitt 7.7) stellt einen Durchbruch für die physikalischen Chemie dar.
11.7 Zerlegung idealer Gase in Teilsysteme | 389
11.7 Zerlegung idealer Gase in Teilsysteme In diesem Abschnitt wollen wir zeigen, unter welchen Bedingungen sich Gase – allgemeiner: Vielteilchensysteme – im Sinne von Abschnitt 7.2 in Teilsysteme zerlegen lassen. Die quantitative Übereinstimmung der experimentellen Daten der zweiatomigen Gase mit den Ergebnissen der in den vorangegangenen Abschnitten dargestellten einfachen Modellrechnungen hat gezeigt, dass wir die Entropie pro Teilchen sˆ eines ein- oder zweiatomigen Gases in mehrere Summanden zerlegen können: sˆ = sˆtrans + sˆint = sˆtrans + sˆrot + sˆvib + sˆel .
Dabei ist sˆtrans der Translationsbeitrag und sˆint der Beitrag der inneren Anregungen zur molaren Entropie. Der Beitrag der inneren Freiheitsgrade lässt sich in den Rotations-, Vibrations- und den elektronischen18 Anteil sˆel zerlegen, soweit das Molekül als starrer Rotator approximierbar ist und damit die Rotations- und Vibrations- und elektronischen Freiheitsgrade als wechselwirkungsfrei und voneinander unabhängig angesehen werden können.19 Dann lassen sich auch die molare Energie eˆ und die molare freie Energie fˆ in analoge Summanden separieren: fˆ = fˆtrans + fˆint = fˆtrans + fˆrot + fˆvib + fˆel .
Gemäß unseren Überlegungen in Abschnitt 7.2 können wir damit das System „ideales Gas“ in zwei Teilsysteme, nämlich das System der Translationsfreiheitsgrade mit der freien Energie (siehe Abschnitt 6.2)
jtrans V T 3/2 ˆ +1 , (11.26) ftrans (T, V /N ) = eˆ0,trans − kB ln N
sowie das System der inneren Freiheitsgrade mit fˆint = −kB T ln Zint (T )
(11.27)
zerlegen.20 Das System der inneren Freiheitsgrade zerfällt wiederum in die Systeme „Rotations-Anregungen“, „Schwingungs-Anregungen“ und „Elektronische Anregungen“. Der Addition der freien Energien der inneren Freiheitsgrade bei der Systemzu-
18 Wie wir gesehen haben, ist der elektronische Beitrag bei nicht zu hohen Temperaturen durch den Gesamtdrehimpuls J = L + S bestimmt. 19 Bei starker Anregung der Schwingungsfreiheitsgrade, das heißt bei Temperaturen kB T ω, bricht diese Approximation zusammen, da in diesem Fall der Atomabstand und damit das Trägheitsmoment J des Moleküls mit T zunimmt. In diesem Fall erhält man einen Kopplungsterm zwischen Rotations- und Vibrations-Freiheitsgraden, der Rotator kann nicht länger als starr angesehen werden (Anhang E). 20 Für Gase aus relativistischen Teilchen ist eine solche Separation von „inneren“ und Translationsfreiheitgraden allerdings nicht möglich.
390 | 11 Einfache Quantensysteme sammensetzung spiegelt sich in der Multiplikation der entsprechenden Zustandssummen wider: Zint (T ) = Zrot (T ) · Zvib (T ) · Zel (T ) .
Ebenso könnten wir noch den Beitrag des Kernspins hinzufügen, den wir hier aber ignorieren, weil er nur in wenigen Fällen experimentell sichtbar wird.21 Das Gesamtsystem befindet sich in inneren Gleichgewicht, wenn die Untersysteme miteinander im Gleichgewicht stehen, das heißt alle intensiven Größen der Untersysteme dieselben Werte haben. Letzteres ist allerdings nicht notwendig – der experimentelle Beweis der Zerlegbarkeit eines Systems besteht darin, zu zeigen, dass das innere Gleichgewicht zwischen den Teilsystemen gestört wird. Die physikalischen Größen der Teilsysteme können somit unabhängig voneinander variiert werden.22 Im folgenden Abschnitt wollen wir nun die Systeme der Spin-, Rotations- und Vibrationszustände weiter zerlegen. Dazu nutzen wir aus, dass die Messwerte der Energie, Wärmekapazität und Entropie pro Teilchen sehr gut mit der Modellrechnungen für einen einzelnen Rotator, Oszillator oder Einzelspin übereinstimmen. Offenbar ist es möglich, einen Rotator, Oszillator oder Einzelspin repräsentativ für alle Moleküle des Gases herauszugreifen und die thermodynamischen Eigenschaften des Gesamtsystems der Rotationszustände aller Moleküle des Gases durch Multiplikation mit der Teilchenzahl N zu erhalten. Dies ist nicht überraschend, denn wir erwarten, dass sich das System der inneren Anregungen der Gasteilchen aus denen seiner elementaren Konstituenten – den Atomen oder Molekülen – aufbauen lässt. Auf diese Weise wollen wir versuchen, der geläufigen Anschauung, dass das System „ideales Gas“ in demselben Sinne aus „Teilchen“ bestehe, wie ein Sandhaufen aus Sandkörnern besteht, eine präzise Bedeutung zu geben, indem wir das Gas in Teilsysteme mit einem Teilchen23 zerlegen und so „Teilchen“ als die elementaren Bausteine der Materie identifizieren. In gewissem Sinne verbirgt sich hinter der Eigenschaft der Zerlegbarkeit die Homogenität des Gesamtsystems (siehe Abschnitt 5.4), welche es erlaubt, eine beliebige Teilmenge des Gases als repräsentativ für das gesamte Gas auf-
21 Die Kernspin-Beiträge sind für kalorimetrische Experimente im Allgemeinen unzugänglich, weil sie mit wenigen Ausnahmen erst bei extrem tiefen Temperaturen in Nano- und Pikokelvin-Bereich ausfrieren. Wichtige Ausnahmen sind Wasserstoff (H2 ) und das Isotop 3 He mit dem Kernspin 1/2 pro Atom sowie schwerer Wasserstoff (D2 ), mit dem Kernspin 1 pro Atom. 22 Werden beispielsweise gleiche Mengen 3 He-Gas auf der Temperatur T1 und 4 He-Gas auf der Temperatur T2 (irreversibel) miteinander gemischt, so kommt das System der Translationsanregungen wegen der sehr schwachen Kopplung der Kernspins an die Umgebung sehr viel schneller ins thermische Gleichgewicht als das Kernspin-System. Dann ist die Temperatur des Spinystems für Zeitspannen von der Größenordnung der Kernspin-Bahn-Relaxationszeit höher als die Temperatur des Systems der Translationsanregungen. Wegen der bei Zimmertemperatur völlig vernachlässigbaren (warum?) Wärmekapazität des Spinsystems macht sich die Angleichung der Spin- an die Translationstemperatur allerdings nicht in der Gleichgewichtstemperatur bemerkbar. 23 Dies sind Systeme, welche durch eine Einteilchen-Schrödinger-Gleichung beschrieben werden.
11.8 Zusammengesetzte Quantensysteme
| 391
zufassen. Die „Atomistik“ erhalten wir dann aus der Annahme, dass N nur die quantisierten Werte 0, 1, 2, 3, . . . annehmen kann. Hier zeigt sich, dass zwei konzeptionell sehr verschiedene Sichtweisen der Teilchenzahl N existieren: zum einen wird N als diskrete dimensionslose Stückzahl von Teilsystemen aufgefasst, zum anderen haben wir N bisher als physikalischen Größe mit einen reellen (das heißt kontinuierlichen) Wertevorrat und einer Einheit („Mol“ oder „Teilchen“) angesehen. Dieser Gegensatz ist letztlich nicht zu überbrücken – man muss sich für eine dieser beiden Auffassungen entscheiden. Da wir in den nachfolgenden Abschnitten sehen werden, dass die quantenmechanische Eigenschaft der Nichtunterscheidbarkeit den Aufbau eines Gases aus N statistisch unabhängigen Einteilchen-Systemen unmöglich macht, werden wir uns in dieser Darstellung ab Kapitel 12 für die zweite Alternative entscheiden.
11.8 Zusammengesetzte Quantensysteme Auf der Basis der betrachteten Beispiele können wir jetzt die folgende allgemeine Definition der Zerlegbarkeit eines Quantensystems in unabhängige Teilsysteme im Sinne des allgemeinen Systembegriffs in Abschnitt 7.2 geben. Dabei gehen wir davon aus, dass Systeme Mengen {ψ1 , ψ2 ...} von Zuständen sind: Definition: Zwei Quantensysteme mit den stationären Zuständen {ψ1A , ψ2A , . . . } A und {ψ1B , ψ2B , . . . } sowie den zugehörigen Energie-Eigenwerten {εA 1 , ε2 , . . . } und B B {ε1 , ε2 , . . . } heißen unabhängig (unterscheidbar) und wechselwirkungsfrei, wenn B die Energie-Eigenwerte des zusammengesetzten Systems durch εij = εA i + εj gegeben sind und keine Einschränkungen bezüglich der Kombinationen von i und j bestehen. Mathematisch bedeutet dies, dass der Zustandsraum des zusammengesetzten Systems das Tensor-Produkt AB = A ⊗ B der Zustandsräume A und B der Teilsysteme A und B ist. Die Zustandssumme des aus den Teilsystemen A und B zusammengesetzten Systems AB lautet dann: ( ) ( )
B εA εB εA i + εj j (AB) Z
=
exp
−
i,j
= Z (A) · Z (B) .
kB T
exp −
=
i
i
kB T
·
exp
j
−
kB T
(11.28)
Vom Standpunkt der Wahrscheinlichkeitsrechnung aus (siehe Anhang G) bedeutet die Zerlegbarkeit eines Systems in unabhängige Teilsysteme, dass die Zustandssumme des Gesamtsystems in die Zustandssummen der Teilsysteme faktorisierbar ist, wie wir dies am Beispiel der inneren Anregungen von Gasen bereits gesehen haben.
392 | 11 Einfache Quantensysteme Wenn die Zustandssumme faktorisiert werden kann, bedeutet dies, dass die Wahrscheinlichkeiten der Zustände der Teilsysteme voneinander statistisch unabhängig sind. Dies beinhaltet auch, dass keine Korrelationen zwischen zwei Zufallsvariablen XA und XB der Teilsysteme A und B vorhanden sind. Mathematisch bedeutet dies, dass der Mittelwert des Produkts δXA · δXB der Abweichungen δX = X − X von den Mittelwerten X stets verschwindet: δXA · δXB = 0 .
In Einklang mit unseren Überlegungen in Abschnitt 7.2 spiegelt sich die Möglichkeit der Zerlegung eines gegebenen Systems also darin wider, dass sich seine MassieuGibbs-Funktionen, zum Beispiel die freie Energie, zumindest approximativ in unabhängige Summanden zerlegen lassen. Ein Quantensystem ist in unabhängige Teilsysteme zerlegbar, wenn gilt: FAB = −kB T ln Z (AB) = −kB T ln Z (A) · Z (B) = −kB T ln Z (A) − kB T ln Z (B) = FA + FB .
(11.29)
Bisher haben wir für die inneren Freiheitsgrade die gemessene Entropie pro Teilchen mit der Entropie eines einzelnen Rotators, Vibrators und Elektronen-Gesamtdrehimpulses betrachtet. Um den Beitrag Sint der inneren Freiheitsgrade zum Entropieinhalt einer gewissen Gasmenge mit der Teilchenzahl N zu erhalten, müssen wir mit N multiplizieren: Sint = N · sˆint .
Analog gilt für die freie Energie Fint des N -Teilchen-Systems: (N ) (1) Fint = −kB T ln Zint (T ) = N · fˆint = −N kB T ln Zint (T ) ,
(1) N (N ) (1) wobei Zint (T ) = Zint (T ) und Zint (T ) die Zustandssummen des N - und des 1-Teilchens-Systems sind. Das System der inneren Freiheitsgrade lässt sich also in N Teilsysteme entsprechend den N Teilchen des Gases zerlegen.24 In dieser Betrachtung wird offensichtlich, dass physikalische Systeme Mengen25 von Zuständen, nämlich die Menge der möglichen Spin-, Rotations-, Vibrations- oder Translations-Zustände, repräsentieren. Entsprechend würde man erwarten, dass sich die freie Energie der Translationsfreiheitsgrade in N Einteilchen-Zustandssummen von der in Gl. 11.32 ge-
24 Hier wird also die stillschweigende Annahme gemacht, dass die thermischen Fluktuationen der inneren Freiheitsgrade der verschiedenen Atome des Gases voneinander statistisch unabhängig sind. Bei niedrigen Dichten, also in der Gasphase, ist diese Annahme sicher gerechtfertigt, bei Flüssigkeiten oder überkritischen Dichten in der Regel nicht. 25 Hier sind Mengen im Sinne der Mathematik (Mengenlehre) gemeint.
11.8 Zusammengesetzte Quantensysteme
|
393
gebenen Form faktorisieren lässt. Dieser Erwartung werden wir im nachfolgenden Abschnitt nachgehen.26 Neben den Gasen lassen sich zur Illustration der System-Zerlegung auch die lokalisierten Spins in paramagnetischen Festkörpern heranziehen. Der Hamilton-Operator H − MBext eines N -Spinsystems im Magnetfeld lässt sich in die Beiträge der Einzelspins zerlegen: (j) Hspin − MB = −
m ˆ z Bext = −N m ˆ z Bext ,
j
solange Wechselwirkungen zwischen den Spins vernachlässigbar sind. Die Zustandssumme des Einzelspins lautet nach Abschnitt 10.3:
(1)
Z spin = 2 cosh
μB Bext kB T
.
Sind T und Bext für alle Einzelspins gleich, so resultiert aus dem Produkt der Zustandssummen aller Einzelspins (N )
(1)
Z spin = Z spin
N =
2 cosh
μB Bext kB T
N
die (magnetische) freie Energie des Gesamtsystems: (1) (N ) (1) Fspin = N · fˆ spin = −N kB T ln Z spin .
Selbstverständlich steht es uns frei, die N Spins in zwei Untergruppen von NA und NB Spins mit unterschiedlichen Temperaturen TA und TB zu zerlegen. Analog zu unserer elementaren Betrachtung in Abschnitt 2.9 können wir fragen, welche Endtemperatur resultiert, wenn wir beide Systeme in thermischen Kontakt bringen, und wieviel Entropie dabei erzeugt wird.
26 Alternativ lässt sich ein Gas aus Atomen mit r − 1 Angeregungszuständen als ein Gemisch von r Elementar-Gasen auffassen, welche sich durch den inneren Zustand der Atome unterscheiden und untereinander im chemischen Gleichgewicht stehen. Thermodynamisch unterscheiden sich diese Gase nur in der Molmasse m ˆi = m ˆ 0 + εi /c2 und damit (geringfügig) in den chemischen Konstanten. Ganz analog zu der Betrachtung für Spinsysteme in Abschnitt 10.3 resultiert die Boltzmann-Verteilung aus der Annahme chemischen Gleichgewichts zwischen den Teilgasen. In reaktiven Gasgemischen entsprechen die verschiedenen Reaktionspartner (zum Beispiel H2 und atomarer Wasserstoff) den gebundenen und dissoziierten Zuständen des Systems „gasförmiger Wasserstoff ( Abbildung 10.1 und Aufgabe 11.9)“. Wir erkennen, dass die chemische Reaktion „thermische Dissoziation von Wasserstoff“ und ebenso die thermische Ionisierung sich ganz natürlich als Quantenübergang zwischen den gebundenen und den Streuzuständen der H-Moleküle, beziehungsweise der H-Atome verstehen lässt. Es bedarf nur einer geringen Abstraktion, jeden Quantenübergang als chemische Reaktion und damit Systeme in unterschiedlichen Quantenzuständen als verschiedene Stoffe aufzufassen.
394 | 11 Einfache Quantensysteme
H H
H H 0
L
Abb. 11.15. Wellenfunktionen und Energieniveaus εi eines freien Teilchens in einem Kasten. Bei endlicher Größe des Kastens sind die möglichen Energien aufgrund der Randbedingungen diskret.
11.9 Die Translationsfreiheitsgrade eines idealen Gases Nehmen wir im Rahmen unserer bisherigen Modellvorstellungen an, dass sich ein ideales Gas in N Teilsysteme vom Typ „Freier Körper“ zerlegen lässt, so liegt es nahe, als ersten Schritt die Zustandsumme eines einzelnen Teilchens in einem quaderförmigen Kasten mit den Kantenlängen Lx , Ly , Lz und dem Volumen V = Lx Ly Lz zu berechnen. Die stationären (zeitunabhängigen) Zustände |k des Teilchens sind ebene Wellen27 mit den Wellenfunktionen 1 ψk (x) = x|k = √
V
exp ikx
mit dem Wellenvektor k = (kx , ky , kz ). Bei periodischen Randbedingungen28 für die Wellenfunktionen ergeben sich als erlaubte Wellenvektoren und zugehörige Energie-Eigenwerte ⎛ ⎞ klmn =
l 2π ⎜ ⎟ ⎝ m ⎠ L n
und εlmn = ε0 +
(klmn )2 , 2m ˆ
wobei l, m und n ganze Zahlen sind und m ˆ die Masse pro Teilchen ist. 29 In der Zustandssumme macht sich eine von Null verschiedene Ruhenergie durch einen zu-
27 Die räumliche Konstanz der Aufenthaltswahrscheinlichkeit |ψk |2 = 1/V einer ebenen Welle impliziert, dass die Teilchen gleichmäßig über das gesamte Volumen V delokalisiert sind. 28 Man unterscheidet feste und periodische Randbedingungen. Bei den in der Zeichnung gezeigten festen Randbedingungen (ψ(0) = ψ(L) = 0) sind die Wellenfunktionen reell (und daher leichter zu zeichnen). Bei periodischen Randbedingungen ergeben sich auch laufende Wellen, mit positiven und negativen Wellenvektoren. Wegen des Superpositionsprinzips (mit komplexen Koeffizienten) ist der Zustandsraum für beide Typen von Randbedingungen jedoch praktisch identisch. 29 Zur Vereinfachung der Schreibweise wird im folgenden gelegentlich nur die kinetische Energie der Gasteilchen berücksichtigt und die Ruhenergie ε0 ignoriert. Es gibt jedoch eine Reihe von Situationen in
11.9 Die Translationsfreiheitsgrade eines idealen Gases |
395
ˆ fˆ und sätzlichen Faktor exp(−ε0 /kB T ) bemerkbar, der eine Erhöhung der Größen eˆ, h, μ um den Wert ε0 bewirkt. Für makroskopische Volumina liegen die Energie-Eigenwerte εlmn extrem eng beieinander. Aus diesem Grund ist ähnlich wie beim „klassischen“ Rotator (siehe Abschnitt 11.5) eine Kontinuumsnäherung zulässig:
kx ,ky ,kz
Lx L y L z = (2π)3
+∞
V d k= (2π)3
∞
3
−∞
4πk2 dk
(11.30)
0
Der beim Übergang auftretende Faktor V /(2π)3 stellt die Dichte der erlaubten Zustände im Raum der Wellenvektoren (kurz: k-Raum) dar. Glücklicherweise ist der Grenzübergang zum Kontinuum bei hinreichend großen Volumina nicht an die Quaderform gebunden, da die Zahl der möglichen Zustände nur vom Volumen abhängt. Als nächstes nutzen wir aus, dass die Funktion ε(k) nur vom Betrag und nicht von der Richtung von k abhängt und substituieren k = |k| durch ε: k(ε) = (kx2 + ky2 + kz2 )1/2 =
1
2m(ε ˆ − ε0 ), dk =
1
2
2m ˆ 2m(ε ˆ − ε0 )
dε =
1
m ˆ dε . 2(ε − ε0 )
Fassen wir dann alle Faktoren im Integranden von Gl. 11.30 zusammen, so erhalten wir: 2mε ˆ 1 2 k dk = 2π 2 2π 2 3
m ˆ m ˆ 3/2 √ ε − ε0 dε dε = √ 2(ε − ε0 ) 2π 2 3
Damit können wir die Summe über alle Zustände näherungsweise durch das folgende Integral ersetzen: kx ,ky ,kz
∞ = ˆ V ·
dε g(ε) ε0
m ˆ 3/2 √ ε − ε0 . 2π 2 3
wobei g(ε) = √
(11.31)
Die Funktion g(ε) nennt man die Zustandsdichte. Sie bezeichnet die Zahl der Einteilchenzustände im Energieintervall dε pro Volumen.30 Sie stellt eine Verallgemeinerung des Entartungsfaktors gl auf das Kontinuum dar und wird uns von nun an sehr häufig begegnen, weil sie bei der Berechnung aller möglichen thermodynamischen Größen auftritt.
denen berücksichtigt werden muss, dass ε0 von Null verschieden ist (chemische Reaktionen, Halbleiter, Nanostrukturen. . . ). 30 Manche Autoren schlagen das Volumen auch der Zustandsdichte zu, anstatt sie vor die Summe zu ziehen. In der Thermodynamik ist das aber ungünstig, weil die Volumenabhängigkeit besser explizit gemacht werden sollte.
396 | 11 Einfache Quantensysteme
Vgε
ε (k)
k
ε
dε
Abb. 11.16. a) Dispersionsrelation nicht-relativistischer freier Teilchen der Masse m. ˆ Die erlaubten k-Werte sind durch gestrichelte Linien angedeutet. b) Zugehörige Zustandsdichte auf der Energieskala. Im Energieintervall dε befinden sich g(ε) · V · dε Zustände (grau hinterlegte Fläche).
Jetzt können wir die Translations-Zustandssumme für ein Teilchen im Kasten berechnen und erhalten unter Verwendung der Γ-Funktion (siehe Anhang C): (1) Ztrans (T, V )
V = √ 2π 2
mk ˆ BT
3/2
2
ε exp − 0 kB T
∞
√
0
=V
mk ˆ BT 2π 2
3/2
· exp −
V ε = · exp − 0 kB T (λT )3
wobei die Größe λT = √
ε0 kB T
x exp(−x) dx
√ Γ(3/2)= π/2
(11.32)
(11.33)
, 2π 2π mk ˆ BT
(11.34)
die Wellenlänge von Teilchen mit der Energie kB T angibt und daher die thermische de Broglie-Wellenlänge genannt wird. Für N2 bei 300 K erhält man beispielsweise λT ≈ 2 · 10−11 m. Unter Standardbedingungen ist λT bei Atom- und Molekülgasen viel kleiner als der mittlere Teilchenabstand: λT vˆ1/3 . (1)
Die mittlere Energie bekommen wir wieder durch Ableiten von ln Ztrans (T ) nach T :
Etrans (T ) = kB T 2
ε d ln T 3/2 exp − 0 dT kB T
= ε0 +
3 k T . 2 B
Damit haben wir wieder das Resultat des Gleichverteilungssatzes Gl. 3.9 aus Abschnitt 3.4 bestätigt.
11.10 Das „klassische“ ideale Gas |
397
Die naheliegende Frage, ob sich auch die Entropie pro Teilchen sˆtrans durch die Einteilchen-Zustandssumme (Gl. 11.33) ausdrücken lässt, führt auf überraschende Komplikationen. Im nächsten Abschnitt werden wir feststellen, dass die Zerlegung eines Gases in unabhängige Teilchen wesentlich weniger trivial ist, als dies der bisherige Erfolg unserer atomistischen Modelle erwarten lässt.
11.10 Das „klassische“ ideale Gas Kein anderes Begriffspaar wird in der Physik so inflationär verwendet wie die Worte „klassisch“ und „quanten-. . . “. Entsprechend stark schwankt die Bedeutung dieser Begriffe in den verschiedenen Zusammenhängen. Im letzten Abschnitt haben wir drei Beispiele für die „klassische“ Statistik, nämlich die Systeme „Polymer-Molekül“, „Rotator“ und „Oszillator“ im Grenzfall T Θrot , Θvib besprochen. Im folgenden Abschnitt wollen wir eine erste quantenmechanische Behandlung der Translationsfreiheitsgrade des idealen Gases versuchen. Es wird sich herausstellen, dass sich die quantenmechanische Eigenschaft der Nichtunterscheidbarkeit nur „von Hand“ in die Theorie einbauen lässt. Im Grenzfall hoher Temperaturen ergeben sich aber trotzdem die korrekten Zustandsgleichungen des idealen Gases. Aus diesem Grund wird der Hochtemperaturbereich des idealen Gases ebenfalls der „klassische“ Bereich genannt. Wir untersuchen nun die Frage, ob sich die Zustandssumme der Translationsanregungen eines idealen Gases in derselben Weise wie die Zustandsumme der inneren Freiheitsgrade in N Einteilchen-Zustandssummen faktorisieren lässt. Da sich der Hamiltonoperator eines Systems mit N freien Teilchen H =
N P 2i
2m ˆ
i=1
=
N
Hi
(11.35)
i=1
in eine Summe von N Hamilton-Operatoren für jeweils ein freies Teilchen zerlegen lässt, haben wir aufgrund des bisherigen Erfolgs dieses Modells allen Anlass zu erwarten, dass dies möglich ist. Daher machen wir versuchsweise den Ansatz Z
(N ) ?
= Z
(1)
N
und erhalten
=
?
F (T, V, N ) = E0 − N kB T ln
V λ3T
V λ3T
N
N ε0 · exp − kB T
= E0 − N kB T ln αV T 3/2
mit E0 = N ε0 und der Konstanten α=
mk ˆ B 2π 2
3/2 .
(11.36)
398 | 11 Einfache Quantensysteme Vergleichen wir das Ergebnis mit der durch die Zustandsgleichungen experimentell gesicherten Formel 6.10 für die freie Energie eines einatomigen idealen Gases mit κ = 3/2, so stellen wir fest, dass dieses Resultat nicht richtig sein kann, weil es die Forderung nach Homogenität der freien Energie verletzt – im Vergleich zu Gl. 6.10 fehlt in Gl. 11.36 der Faktor 1/N im Argument des Logarithmus! Dies ist kein kleiner Fehler, da N leicht Werte von NA ≈ 1023 und entsprechend ln NA 55 erreicht. Dies ist mit Messdaten in Abb. 6.2 in keiner Weise verträglich! Wo liegt also das Problem? Wie bei der Behandlung der Rotationsfreiheitsgrade symmetrischer zweiatomiger Gase muss auch für die Translationsfreiheitsgrade das Prinzip der Nichtunterscheidbarkeit identischer Atome berücksichtigt werden. Sieht man die Atome als (mindestens durch die Nummer i im Hamilton-Operator) unterscheidbare Individuen an, so resultiert eine Überschätzung der Zahl der physikalisch relevanten Zustände. Im Fall der Rotationsanregungen besteht die Diskrepanz nur in einem Faktor 1/2, bei einem Gas mit N ≈ NA Teilchen ist die Diskrepanz viel dramatischer. Wir haben zwei Fragen zu beantworten: • Gibt es eine Möglichkeit, unseren Ansatz für die Vielteilchen-Zustandssumme so zu modifizieren, dass die Forderung nach Homogenität erfüllt ist? • Gibt es eine andere Möglichkeit, ein Gas in elementare Teilsysteme zu zerlegen? Die Beantwortung der zweiten Frage ist Gegenstand des nächsten Kapitels. Um die erste Frage zu beantworten, schreiben wir uns die möglichen Mehrteilchen-Zustände für das einfachste Beispiel eines Zwei-Teilchen Systems einmal auf: ⎧ ⎫ ⎧ ⎫ ⎪ ⎪ |11 |12 |13 · · · ⎪ |11 |12 |13 · · · ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ |21 |22 |23 · · · ⎬ ⎨ − |22 |23 · · · ⎪ ⎬ =⇒ (11.37) ⎪ ⎪ |31 |32 |33 · · · ⎪ − − |33 · · · ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ ⎭ ⎩ ⎭ ···
···
···
···
−
−
−
···
Dabei bezeichnet |ij einen Zustand, bei dem sich Teilchen A im Zustand |i und Teilchen B sich im Zustand |j befindet. Die Zweiteilchen-Zustandssumme ist eine Doppelsumme, die alle Kombinationen |ij von Einteilchen-Zuständen |i und |j enthält. Sind die Teilchen nicht unterscheidbar, so sind aber die Zustände |ij oberhalb und |ji unterhalb der Diagonalen identisch. Das bedeutet, dass wir bei der Berechnung der Zweiteilchen-Zustandssumme fast alle möglichen Zustände doppelt zählen! Allein die Zustände auf der Diagonalen treten nur einfach auf; ihre Zahl wächst bei Vergrößerung der Zahl der Einteilchenzustände des Systems (zum Beispiel durch die Vergrößerung der Volumens) aber linear, und nicht wie die der anderen Zustände quadratisch. Daher fallen sie bei einer hinreichend großen Zahl von Einteilchen-Zuständen nicht ins Gewicht. Um den Effekt der Nichtunterscheidbarkeit näherungsweise zu berücksichtigen, müssen wir die resultierende Zweiteilchen-Zustandssumme also durch
11.10 Das „klassische“ ideale Gas |
399
2 dividieren, so wie wir das durch die Einführung des Symmetriefaktors zs für die Rotationsanregungen zweiatomiger Gase in Abschnitt 11.5 (Gl. 11.21) bereits getan haben. Betrachten wir allgemeiner ein N -Teilchensystem, so sind alle Zustände |ijklmn . . . identisch, die sich nur durch eine Permutation der Quantenzahlen zweier Teilchen unterscheiden. Da die Zahl der möglichen Permutationen N ! beträgt, kann die Nichtunterscheidbarkeit von N Teilchen dadurch näherungsweise berücksichtigt werden, dass die N -Teilchen-Zustandssumme durch N ! dividiert wird.31 Daher testen wir jetzt, ob der entsprechend modifizierte Ansatz Z (N ) =
Z (1)
N (11.38)
N!
zu einem mit der aus Gl. 6.10 bekannten Form von F (T, V, N ) verträglicheren Ergebnis führt: , ?
Ftrans (T, V, N ) = −kB T
(1)
N ln Ztrans − ln N !
Zur Auswertung dieses Ausdrucks benutzen wir die für große N gültige Stirling’sche Näherung: ln N ! = N ln N − N + · · ·
und erhalten . Ftrans (T, V, N ) = E0 − N kB T
ln
V − ln N + 1 λ3T
. = E0 − N kB T
ln
V N λ3T
/
/ (11.39)
+1
Dieses Ergebnis entspricht der Sackur-Tetrode-Gleichung für die Entropie eines idealen Gases, die wir durch Differenzieren nach T erhalten. Es wird nicht nur der Forderung nach Homogenität gerecht, sondern liefert mit Gl. 11.34 beim Vergleich mit Gl. 6.10 .
/ Ftrans (T, V, N ) = E0 − N kB T
ln
V T 3/2 jtrans N
+1
auch den korrekten Zahlenwert für die in Kapitel 6 bereits empirisch bestimmte chemische Konstante der einatomigen idealen Gase ohne innere Freiheitsgrade: jtrans =
mk ˆ B 2π 2
3/2 = 1.88 · 1026 · m ˆ 3/2
Teilchen (u · K)3/2 m3
.
(11.40)
31 Zustände, bei denen zwei oder mehr Quantenzahlen gleich sind, fallen nicht ins Gewicht, solange die Zahl der verfügbaren Einteilchen-Zustände viel größer als N ist. Bei höheren Dichten müssen aber auch diese Zustände berücksichtigt werden.
400 | 11 Einfache Quantensysteme Die chemische Konstante hängt mit der de Broglie-Wellenlänge und der Entartungsdichte (Gl. 6.9) über nc (T ) =
1 = T 3/2 jtrans λ3T
zusammen. Unter Standardbedingungen beträgt λT ≈ 20 pm für Stickstoff. Vergleichen wir dies mit dem mittleren Teilchenabstand von ≈ 3 nm, so erhalten wir für die bereits in Abschnitt 6.1 auf der Basis der Standard-Werte der molaren Entropien der Gase diskutierte Entartungsbedingung: n = nλ3T ≈ 3 · 106 ≫ 1 . nc (T )
Konventionelle Gase sind unter Standardbedingungen weit vom Grenzfall der Entartung entfernt. Aus Sicht der Boltzmann’schen Theorie stellt dies sicher, dass die Terme mit gleichen Quantenzahlen in Z (N ) tatsächlich vernachlässigt werden können. Die obige, von Boltzmann und Gibbs stammende Argumentation bildet einen Meilenstein in der Geschichte der statistischen Physik, weil sie die historisch erste32 Herleitung der Massieu-Gibbs-Funktion eines physikalischen Systems im Rahmen eines mikroskopischen Modells darstellt. An dieser Stelle wird zum ersten Male deutlich, dass Atome und Moleküle von makroskopischen Systemen vom Typ „freier Körper“ fundamental verschieden sein müssen. Während sich makroskopische Körper stets auf irgendeine Weise kennzeichnen lassen und damit als Individuum identifizierbar sind, sind Atome und Moleküle identisch und damit prinzipiell nicht unterscheidbar! Obwohl sie so heißen,33 sind Atome keine Individuen! Dieser Aspekt der Quantenmechanik ist nach Einschätzung des Verfassers ein wesentlich schwerer nachzuvollziehender Schritt im Verständnis der modernen Physik und der Quantentheorie als der bloße Übergang vom Teilchen- zum Wellenbild. Da Wellen in unserer Alltagswelt (zum Beispiel in Form von Wasserwellen) vorkommen, fällt deren Veranschaulichung sehr viel leichter als die von „NichtIndividuen“, die in keiner Weise von anderen „Nicht-Individuen“ der gleichen Spezi-
32 Im Rahmen des Bernoulli-Modells in Abschnitt 3.4 lässt sich zwar die kalorische Zustandsgleichung begründen, wenn man die thermische Zustandsgleichung als gegeben voraussetzt. Letztere ist jedoch eine Zusatzinformation aus dem Experiment und keine Folgerung aus dem Modell. 33 Das Adjektiv „individuus“ ist die lateinische Übersetzung des griechischen Worts „atomos“, welches „unteilbar“ bedeutet. Im Laufe der Zeit hat sich der Schwerpunkt der Wortes „Individuum“ vom Aspekt der Unteilbarkeit auf den der Identifizierbarkeit persönlicher Eigenarten verschoben, wie die Redewendung vom „Streben nach Individualität in der (Massen-)Gesellschaft“ illustriert. Das Wort „Atom“ drückte dagegen bis zum Anfang des 20. Jahrhunderts die Eigenschaft Unteilbarkeit aus. Heutzutage ist diese Eigenschaft den sogenannten „Elementar“teilchen vorbehalten – wobei die Antwort auf die Frage, welche Teilchen als elementar anzusehen seien, seit den Anfängen der Atomphysik häufig aktualisiert werden musste.
11.10 Das „klassische“ ideale Gas |
401
es unterschieden werden können.34 „Nicht-Individuen“ haben keinerlei Gegenstück in unserer Alltagswelt, wo jeder Gegenstand zu seiner Identifikation mit einem Farbklecks versehen werden und notfalls mit dem Auge auf seiner Bahn verfolgt werden kann. Wir schließen dieses Kapitel mit einem Fazit der Erfolge und Unzulänglichkeiten der kanonischen Verteilung: Erfolge: • Die kanonische Verteilung erlaubt die Berechnung der Massieu-Gibbs-Funktionen von Quantensystemen mit fester35 Teilchenzahl und stellt damit ein mächtiges Werkzeug zur Vereinigung von Makro- und Mikrophysik, das heißt zur theoretischen Vorhersage der thermodynamischen Eigenschaften von Quantensystemen dar. • Die Thermodynamik idealer Gase wird auf die Quantenmechanik des archetypischen Systems „freies Teilchen“ zurückgeführt – allerdings ist die dabei benutzte Methode zur Berücksichtigung der quantenmechanischen Ununterscheidbarkeit durch die Gültigkeit der Stirling’schen Näherung begrenzt und daher nur für „große“ Systeme (N ≫ 1) anwendbar. Dabei ist die Teilchenzahl N keine physikalische Größe, sondern eine dimensionslose Zahl. Unzulänglichkeiten: • Die von der Quantenmechanik nicht unterscheidbarer Teilchen geforderte Identität von Zuständen, die sich nur durch Permutationen von Teilchen unterscheiden, erfordert die Löschung gewisser Terme in der Vielteilchen-Zustandssumme. Damit ist letztere entgegen unserer Erwartung nicht mehr als Produkt von EinteilchenZustandssummen darstellbar! Das bedeutet, dass das ideale Gas nicht in N unabhängige Teilsysteme vom Typ „freies Teilchen“ zerlegbar ist, beziehungsweise, dass der Hamilton-Operator eines idealen Gases nicht die Form 11.35 haben kann! • Die pauschale Vernachlässigung von Termen mit Teilchen im gleichen Zustand hat zur Folge, dass für einatomige ideale Gase eine temperaturunabhängige molare Wärmekapazität (ˆ cv = 3/2kB ) vorhergesagt wird. Dies führt für T → 0 zur Divergenz der Entropie und verletzt somit den 3. Hauptsatz, wie wir wir seit Abschnitt 2.3 wissen. Diese Näherung muss also im Grenzfall tiefer Temperaturen oder hoher Dichten zusammenbrechen! Nun könnte man meinen, dass die Frage nach dem Tieftemperaturverhalten idealer Gase ganz irrelevant ist, weil wir wissen, dass die Wechselwirkungen zwischen den Gasmolekülen normalerweise (wenn dies nicht durch besondere Anstrengungen un-
34 Wir betonen, dass Atome oder Moleküle, die sich nicht im gleichen Quantenzustand befinden, sehr wohl voneinander unterschieden werden können – die Nicht-Unterscheidbarkeit betrifft allein Teilchen, die sich im gleichen Quantenzustand befinden. 35 Damit ist gemeint, dass N keine Zufallsgröße ist.
402 | 11 Einfache Quantensysteme terbunden wird) zur Kondensation des Gases führen. Allerdings wird sich im folgenden zeigen, dass es neben den konventionellen Gasen noch ganz andere Systeme gibt, auf die das Konzept der Idealität im Sinne (fast) wechselwirkungsfreier Teilchen anwendbar ist und die damit als ideale Gase aufgefasst werden können. Wir meinen damit die thermische Strahlung (Photonengas), die Gitterschwingungen in Festkörpern (Phononengas), die Leitungselektronen in Metallen und Halbleitern (Elektronengas) und generell alle wellenartigen Anregungszustände im Vakuum und in Festkörpern. Diese Systeme erfordern die in der ganzen Physik fundamentale Unterscheidung zwischen Fermionen und Bosonen und haben in der Physik der kondensierten Materie überragende Bedeutung erlangt. Ihnen wollen wir uns im Folgenden zuwenden. Darüber hinaus ist es in jüngster Zeit gelungen, auch konventionelle Atom- und Molekülgase – unter Vermeidung der Kondensation – bis hin zu ultratiefen Temperaturen im Piko(!)Kelvin-Bereich abzukühlen und damit die Frage nach dem Tieftemperaturverhalten der Gase experimentell neu anzugehen. Die dabei auftretenden spektakulären Erscheinungen, wie die Bose-Einstein-Kondensation und ähnliche Phänomene wie die Superfluidität und Supraleitung in kondensierten Systemen, erlauben die experimentelle Untersuchung von Quantensystemen auf der makroskopischen Ebene.
11.11 Der dritte Hauptsatz in der Quantenphysik Bevor wir dieses Kapitel schließen, wollen wir noch auf eine weitere Konsequenz des Boltzmann’schen Prinzip hinweisen. Dieses erlaubt es, den dritten Hauptsatz der Thermodynamik mit Hilfe quantenphysikalischer Begriffe umzuformulieren. Wie bereits in Abschnitt 2.5 festgestellt, besagt der dritte Hauptsatz, dass für alle physikalischen Systeme im inneren Gleichgewicht im Grenzfall T →0
auch S → 0
gilt.
Zusammen mit dem Boltzmann’schen Prinzip legt der 3. Hauptsatz nahe:
Der Grundzustand jedes physikalischen Systems ist nicht entartet.
Da Entartungen, das heißt, die Existenz verschiedener Energie-Eigenzustände mit demselben Energie-Eigenwert, stets Folge von Symmetrien sind, lautet die Aussage des dritten Hauptsatzes letztlich, dass die Natur offenbar Wege findet, Symmetrien, die zur Entartung des Grundzustandes physikalischer Systeme führen, zu brechen. Natürlich ist dies nicht generell zu beweisen, weil leicht Modellsysteme konstruiert werden können, welche derartige Symmetrien aufweisen. Zumindest bei makroskopischen Stoffmengen scheint die Natur jedoch dem 3. Hauptsatz weitgehend zu folgen. Ein Beispiel dafür sind die paramagnetischen Systeme, wie im letzten Kapitel erläutert wurde: Die natürlich erscheinende Entartung
11.11 Der dritte Hauptsatz in der Quantenphysik | 403
von Spin-Zuständen bei Bext = 0 wird schließlich durch die (unter Umständen extrem schwache) Wechselwirkung zwischen den Spins aufgehoben. Bei den Kernspins des Helium-Isotops 3 He sorgt ein anderer Effekt – die in Abschnitt 14.3.1 vorgestellte Fermi-Entartung – dafür, dass die Entropie des Kernspin-Systems bei Annäherung an den absoluten Nullpunkt verschwindet. Für die Praxis lässt sich die Aussage des dritten Hauptsatzes dahingehend abwandeln, dass man postuliert, dass S für T → 0 gegen einen konstanten, in manchen Fällen aber endlichen Wert strebt. Dies ist dann gerechtfertigt, wenn es in dem System eine Untermenge von Zuständen gibt, deren Energiedifferenzen Δε/kB klein gegen die experimentell zugänglichen Temperaturen sind, sodass die Wahrscheinlichkeiten dieser Zustände gleich sind. Das Gesamtsystem zerfällt dann in zwei Teilsysteme, von denen eines sich in sehr guter Näherung im Grundzustand befindet und nicht merklich zur Entropie des Gesamtsystems beiträgt, während sich das andere nicht im Grundzustand (und möglicherweise auch nicht im thermischen Gleichgewicht mit der Umgebung) befindet. Ein Beispiel für das letztere Teilsystem sind die Kernspins in Festkörpern, deren magnetisches Moment etwa 2000-mal kleiner als das der Elektronenspins ist, was auch im Magnetfeld Temperaturen im Mikro- und Nanokelvinbereich entspricht, welche üblicherweise schwer erreichbar sind. Ein weiteres Beispiel manifestiert sich in dem Tieftemperaturverhalten von Gläsern und anderen Systemen mit „eingefrorener Unordnung“, die auch bei sehr tiefen Temperaturen nicht dem Zustand niedrigster Energie zustreben, sondern in metastabilen Zuständen mit höherer Energie verharren. Dies wird unter anderem durch Festkörper aus asymmetrischen zweiatomigen Molekülen wie zum Beispiel Kohlenmonoxid (CO) illustriert. Nach der klassisch-mechanischen Sichtweise erwartet man, dass sich beim Gefrieren von CO und ähnlichen Substanzen Kristalle mit einer zufälligen Orientierung der verschiedenen CO-Moleküle ausbilden. Die zufällige Orientierung ist mit einem gewissen Entropiebetrag S0 (bei zwei Einstellmöglichkeiten N kB ln 2) verbunden. Tatsächlich zeigen kalorimetrische Messungen, dass zum Schmelzen oder zur Sublimation solcher Substanzen etwa 4.6 J/(mol K) entsprechend kB ln 1.7 pro Teilchen weniger Entropie von außen zugeführt werden muss, als dies bei Kristallen aus symmetrischen Molekülen wie zum Beispiel N2 der Fall ist, welches dasselbe Molekulargewicht wie CO hat. Auch die theoretische Berechnung der chemischen Konstanten aus den molekülspektroskopischen Daten lässt einen höheren Wert der molaren Entropie im Gaszustand erwarten, als nach der in Abschnitt 9.3.5 beschriebenen Methode kalorimetrisch gemessen wird. Aus quantenphysikalischer Sicht kann diese Beobachtung so gedeutet werden, dass die beiden Molekül-Orientierungen durch (Rotations-)Tunnelprozesse ineinander übergehen können. Die resultierende Tunnelaufspaltung der Energien der beiden Energie-Eigenzustände dieses System ist aufgrund der hohen Barriere, die zu durchtunneln ist, extrem klein. Das hat zur Folge, dass extrem niedrige Temperaturen erforderlich sind, um den angeregten Zustand bei dieser kleinen Aufspaltung zu entvölkern. Da in der Chemie kalorimetrische Experimente in der Regel nur bis herab zu eini-
404 | 11 Einfache Quantensysteme gen Kelvin erfolgen und der weitere Verlauf der Wärmekapazität in der Regel mit Hilfe des in Abschnitt 13.2 besprochenen Debye-Modells für die Entropie von isolierenden Festkörpern zu T = 0 hin extrapoliert wird, ist nicht verwunderlich, dass bei derart hohen Mess-Temperaturen die beiden Orientierungszustände nach der BoltzmannVerteilung noch gleichbesetzt sind und daher die diesen Freiheitsgraden entsprechende Entropie noch weitgehend im System ist. Bei hinreichend tiefen Temperaturen sollte man grundsätzlich auch bei diesen Systemen die Einstellung des quantenmechanischen Grundzustandes und damit ein Abführen der scheinbar eingefrorenen Entropie und die Erfüllung der Vorhersage des dritten Hauptsatzes erwarten. Auch bei Substanzen, die beim langsamen Abkühlen Kristalle bilden, kann man glasartige Zustände durch schnelles Abschrecken aus der Schmelze oder der Gasphase einfrieren. Der resultierende ungeordnete Zustand ist metastabil, weil die Atome und Moleküle keine Zeit haben die Konfiguration mit dem absoluten Minimum der Energie zu finden, sondern lokale Gleichgewichtslagen einnehmen. In der Literatur findet man auch in diesem Fall die Vorstellung, dass die im amorphen Zustand eingefrorene Unordnung einer „eingefrorenen“ Entropie entspricht. Auch aus diesem Grund wird der dritte Hauptsatz auch so formuliert, dass der Wert S = 0 nur angenommen wird, wenn tatsächlich das absolute Minimum der freien Enthalpie vorliegt. Zumindest im Grenzfall langer Zeiten erscheint diese Vorstellung fragwürdig, weil Entropie nach der Boltzmann-Verteilung auf thermisch angeregte Zustände zurückzuführen ist. Falls die Atome in einer metastabilen Konfiguration eingefroren sind, werden Schwingungen um diese metastabile Gleichgewichtslage auftreten. Diesen angeregten Schwingungen kann ein gewisser Wert der Entropie zugeordnet werden. Mit abnehmender Temperatur werden diese Schwingungsanregungen jedoch aussterben und die mit ihnen verbundene Entropie wird mit T → 0 wiederum gegen Null streben. Die Metastabilität des Glas-Zustandes bringt es mit sich, dass glasartige Systeme ein sehr breites Spektrum von Relaxationszeiten aufweisen, die von Nanosekunden bis hin zu Jahrtausenden reichen. Die Existenz solcher langlebiger, da extrem schwach gekoppelter Zustände macht es eigentlich unmöglich, einem Glas bei sehr tiefen Temperaturen eine einheitliche Temperatur zuzuschreiben. Selbst wenn der Probenträger, an dem das Glas befestigt ist, und das Thermometer, welches auf dem Glas sitzt, eine wohldefinierte Temperatur aufweisen, weil diese viel leichter ins thermische Gleichgewicht geraten, müssen die langsam relaxierenden Zwei-Niveausysteme im Inneren des Glases noch lange nicht im thermischen Gleichgewicht mit ihrer Umgebung sein. In der Tat wurde bei der Abkühlung von Gläsern beobachtet, dass diese bei Ankopplung an ein kaltes Wärmereservior über lange Zeit (in Extremfällen über mehrere 100 Stunden) kontinuierlich Energie und Entropie abgeben. Derartige Langzeit-Relaxationsphänomene zeigen, dass die extrem schwache Kopplung der Zwei-Niveausysteme in Gläsern an andere Freiheitgrade wie die Phononen die Einstellung eines üblichen thermodynamischen Gleichgewichtszustands, der mit wenigen makroskopischen Variablen beschrieben werden kann, de facto verhindert. In der Praxis wird der Betrag der experimentell resultierenden Restentropie also dadurch
11.12 Kanonische oder Mikrokanonische Verteilung? | 405
bestimmt, welcher Bruchteil aller Tunnelsysteme eine Energieaufspaltung hat, die ausreichend groß gegen die erreichte Temperatur ist und welcher Anteil dieser Systeme außerdem so lange Relaxationszeiten aufweist, dass sie auf der Zeitskala des Experiments nicht in Gleichgewicht relaxieren können. Der in Abb. 11.4 beobachtete lineare Beitrag in der Wärmekapazität von Gläsern reflektiert gerade das Ausfrieren eines erheblichen Teils der Tunnelsysteme und lässt erwarten, dass der Beitrag der Restentropie bei hinreichend tiefer Temperatur wesentlich kleiner ist, als die Anzahl der Tunnelsysteme vermuten lässt. Werden Gläser nach dem Einfrieren über die Kristallisations-Temperatur hinaus erwärmt, gehen die Atome oder Moleküle in die Konfiguration mit dem absoluten Minimum der freien Enthalpie, nämlich in die kristalline Phase über. Statt anzunehmen, dass die „eingefrorene“ Entropie bei dem Kristallisationsprozess frei wird, ist es sehr viel natürlicher zu sagen, dass die bei der Kristallisation frei gewordene freie Enthalpie unter Erzeugung von Entropie dissipiert wird, wie dies bei jeder irreversiblen Einstellung eines Gleichgewichts der Fall ist. Die gemeinsam mit der bei der Kristallisation erzeugten Entropie abfließende Energie nennt man auch die Kristallisations„wärme“.
11.12 Kanonische oder Mikrokanonische Verteilung? Die historische Entwicklung der statistischen Thermodynamik nahm natürlich einen wesentlich komplexeren Weg als den hier vorgestellten. Zu Boltzmanns Zeit standen vor allem Gase in Zentrum des Interesses. Er ging von dem in Abschnitt 3.4 skizzierten kinetischen Gasmodell aus, nach dem ein Gas einfach als eine gewisse Zahl N in einem Volumen V eingeschlossener Teilchen aufgefasst werden kann, deren Geschwindigkeiten entsprechend der Maxwell’schen Verteilungsfunktion statistisch verteilt sind. Boltzmann wollte nun neben der Energie E auch die Entropie in dieses Modell integrieren. Wie in der Mechanik üblich, verstand er unter dem Zustand des Systems die Gesamtheit {xi , P i } der Werte von Ort und Impuls der Teilchen, aus denen das System zusammengesetzt ist. Einen solchen Zustand nannte er einen Mikrozustand, weil er durch Angaben zu den mikroskopischen Konstituenten des Gases charakterisiert wird. In diesem Modell entwickeln sich die Mikrozustände gemäß den Hamilton’schen Bewegungsgleichungen in der Zeit. Die für Gase charakteristischen thermischen Fluktuationen der Teilchendichte werden als Folge der (im Prinzip deterministischen) Bewegung sehr vieler Teilchen interpretiert. Boltzmann versuchte zu verstehen, warum das Verhalten von Gasen mit einer für makroskopische Stoffmengen (N 1023 ) extrem hohen Zahl Ω von denkbaren Mikrozuständen durch die Werte von so wenigen makroskopischen und zeitunabhängigen Größen wie E , V und N charakterisiert werden kann. Er machte die Annahme, dass ein Gas im thermodynamischen Gleichgewicht durch die gleiche a-prioriWahrscheinlichkeit aller Ω Mikrozustände des Gases charakterisiert werden kann. Diese Verteilung der Mikrozustände wird die mikrokanonischen Verteilung genannt,
406 | 11 Einfache Quantensysteme nach der die Wahrscheinlichkeit Wi für jeden Mikrozustand |i einfach 1/Ω beträgt. In diesem Spezialfall erhält man aus Gl. 11.1 für die Entropie des Gases im Gleichgewicht: S = kB ln Ω
(11.41)
Gelingt es nun, die Zahl Ω der mit den Werten von E , V und N kompatiblen Mikrozustände des Gases zu bestimmen, so stellt die Funktion S(E, V, N ) = kB ln Ω(E, V, N )
eine der Massieu-Gibbs-Funktionen des Gases in der Entropiedarstellung der Gibbs’schen Thermodynamik dar. Dieser (weitverbreitete) Zugang zur statistischen „Mechanik“ hat den Vorteil, dass die Thermodynamik damit auf die Mechanik zurückgeführt erscheint, was dem Streben nach einem Verständnis der Natur in einem begrifflich einheitlichen Rahmen sehr entgegen kommt. Nach Einschätzung des Verfassers hat dieser Zugang jedoch einige gravierende Nachteile. Der wichtigste ist die Tatsache, dass die Resultate dieser Rechnungen nur im Grenzfall V, N → ∞ (dem sogenannten thermodynamischen Limes) korrekt sind.36 Dies führt zu der verbreiteten Auffassung, dass die Thermodynamik selbst nur in diesem Grenzfall anwendbar ist! Weiterhin erweist es sich als nichttrivial, die fundamentale Eigenschaft der Nichtunterscheidbarkeit von Teilchen in der Quantentheorie in stringenter Weise einzubauen. Die Zerlegung eines Gases oder eines Festkörpers in klassische Teilchen kommt der Anschauung zunächst entgegen, erweist sich letztlich aber doch als unhaltbar. An der Quantennatur der Welt führt kein Weg vorbei. Statt das klassische Bild der Welt zunächst in Marmor zu meißeln und das Resultat trotz seiner Ästhetik dann doch wieder zerschmettern zu müssen, setzen wir hier von vornherein konsequent auf die Quantentheorie und versuchen, uns die dadurch erforderlichen Änderungen in unserer Begriffswelt anschaulich zu machen. Der Aufbau der statistischen Thermodynamik mit Hilfe der von Neumann’schen Variante (Gl.11.1) des Boltzmann’schen Prinzips ist nicht nur mathematisch transparenter und vermeidet unnötige Beschränkungen, sondern ermöglicht auch die Bildung einer neuen, mit der Quantenphysik verträglichen Anschauung auf der Basis der bewährten thermodynamischen Begriffe. Es ist möglich (und üblich), die Boltzmann-Verteilung aus der mikrokanonischen Verteilung abzuleiten. Auf diesem Weg gewinnt man zwar dieselben Formeln, aber um den (hohen) Preis, dass die Thermodynamik den Charakter einer phänomenologischen Beschreibung makroskopischer Systeme bekommt, in der eine thermodynamische Beschreibung eines einzelnen Quantensystems sinnlos ist. Im Gegensatz dazu
36 „It all works, because Avogadros’s number is much closer to infinity than to 10“. [Ralph Baierlein, American Journal of Physics 46, 1045 (1978)] – zitiert in [6].
11.12 Kanonische oder Mikrokanonische Verteilung? | 407
haben wir in den vorangegangenen Abschnitten zunächst die thermodynamischen Charakteristika des einzelnen Quantensystems berechnet und dann erst das Vielteilchensystem aus Einteilchensystemen zusammengesetzt.
Übungsaufgaben 11.1. Thermisch angeregter Wasserstoff a) Berechnen Sie das Verhältnis der Wahrscheinlichkeiten dafür, dass sich ein Wasserstoffatom im ersten angeregten beziehungsweise im Grundzustand befindet. Berücksichtigen Sie dabei die Entartung des ersten angeregten Zustandes. b) Werten Sie das Ergebnis aus für 300 K, die Temperatur an der Sonnenoberfläche (5800 K), die Temperatur an der Oberfläche des heißeren Sterns γ Ursa Major (9500 K) und die Temperatur in der Sonnenatmosphäre (ca. 106 K). c) Berücksichtigen Sie nun, dass beide Zustände wegen des Elektronen- und des Kernspins zusätzlich vierfach Spin-entartet sind. Warum ändert sich das Ergebnis nicht?
c^ p (J/mol K)
11.2. Rotations-Zustandssumme a) Berechnen Sie mit Hilfe eines Computers die Rotations-Zustandssumme eines zweiatomigen idealen Gases bis zu Temperaturen T = 30Θrot . Berücksichtigen Sie genügend Zustände, um die Konvergenz der Summe in diesem Temperaturbereich sicherzustellen. b) Berechnen Sie aus Zrot (T ) erst die molare 29.12 N2 Energie eˆrot (T ) und daraus die Wärmekapazität cˆp,rot (T ). Vergleichen Sie das Resultat 29.11 mit den experimentellen Daten in Abb. 3.6 und dem nebenstehenden Detailausschnitt. Wie erklären Sie die Diskrepanz? 29.10 100
200 T (K)
300
11.3. Kristallisation von Gläsern Wird eine flüssige Silikatschmelze langsam unter die Schmelztemperatur TS = 2011 K abgekühlt, so bildet sich unter Freisetzung der latenten Wärme ein Quarzkristall. Bei schneller Abkühlung wird die Flüssigkeit unterkühlt und erstarrt in einem metastabilen Zustand: Quarzglas. Bei p = 0 spielen Volumeneffekte keine Rolle und das System kann als ein Beispiel für einen heißen Körper angesehen werden (nach [10]). a) Die spezifische Wärmekapazität von kristallinem Quarz hat bei tiefen Temperaturen die Form cˆk = αT 3 , während die von Quarzglas nach Abb.11.4 wie
408 | 11 Einfache Quantensysteme
cˆg = βT variiert. Die Konstanten α 55 J/(molK4 ) und β 110 J/(molK2 )
b)
c)
d) e) f)
können aus Abb. 11.4 bestimmt werden. Berechnen Sie die molare Entropie beider Phasen. Bei T = 0 ist die lokale Struktur beider Festkörper sehr ähnlich, weshalb die Bindungsenergien eˆB gleichgesetzt werden können. Berechnen Sie unter dieser Annahme die Energie und mit Hilfe der Homogenitätsrelation das chemische Potenzial für beide Festkörper. Nehmen Sie für den Schmelzpunkt chemisches Gleichgewicht zwischen beiden Phasen an, um die Schmelztemperatur TS als Funktion von α und β zu berechnen. Berechnen Sie die aus der Modellüberlegung resultierende molare Schmelzentropie Δˆ s(TS ). Sind die Resultate physikalisch sinnvoll? Wenn nicht, welche der zugrundeliegenden Annahmen können Sie als problematisch identifizieren? Was ändert sich, wenn Sie die Wärmekapazität des Glases um den Term αT 3 ergänzen, der Schwingungsanregungen beschreibt?
11.4. Wärmekapazität eines Polymers Berechnen Sie die Wärmekapazität Cx eines Polymerstrangs bei konstanter Auslenkung x.
11.5. Chemische Konstante von CO2 a) Zeigen Sie, mithilfe des aus Gl. 11.25 folgenden Ausdrucks für das chemische Potenzial, dass die chemische „Konstante“ eines idealen Gases mit beliebigen inneren Freiheitsgraden die Form j(T ) = jtrans · Zint (T )
hat, wobei Zint (T ) die kombinierte Zustandssumme aller inneren Freiheitsgrade der Gasmoleküle ist. b) Berechnen Sie j(T ) für das lineare Molekül CO2 unter Berücksichtigung des Symmetriefaktors z und unter der Annahme, dass die Schwingungen vernachlässigt werden können. Wie groß ist der Bindungsabstand der C-O–Bindung? Hinweis: Die Rotationstemperatur von CO2 beträgt Θrot = 0.57 K. c) Bestimmen Sie für T = 300 K das Verhältnis der Beiträge der Translations- und der inneren Freiheitsgrade zur Entropie. 11.6. Gleichverteilungssatz Die Energie eines klassischen Systems sei durch ε(q) = aq 2 gegeben, wobei q eine kontinuierliche Variable und a eine Konstante ist.
11.12 Kanonische oder Mikrokanonische Verteilung? | 409
a) Berechnen Sie das Zustandsintegral ∞
dq exp −
Z(T ) = −∞
ε(q) kB T
(11.42)
.
b) Berechnen Sie die mittlere Energie ∞ ε =
dq ε(q) exp −
−∞
ε(q) kB T
(11.43)
mit Hilfe der Integrale in Anhang C. Wegen der quadratischen Abhängigkeit ε(q) nennt man q auch einen harmonischen Freiheitsgrad (Abschnitt 3.7).
11.7. Ultrarelativistisches Boltzmann-Gas Betrachten Sie ein ideales Gas nicht-unterscheidbarer Teilchen im ultrarelativistischen Grenzfall, in dem die Dispersionsrelation durch ε(k) gegeben ist. Das Gas befinde sich in einem unendlich tiefen Potenzialkasten mit dem Volumen V . a) Berechnen Sie die Zustandsdichte g(ε). b) Berechnen Sie die Ein-Teilchen- und die N -Teilchen-Zustandssummen Z (1) (T, V ) und Z (N ) (T, V, N ). c) Geben Sie die freie Energie F (T, V, N ) sowie die thermische und die kalorische Zustandsgleichung und vergleichen Sie mit dem nicht-relativistischen Fall. 11.8. Zustandssumme und Bohr-Sommerfeld-Quantisierung Nach der klassischen Physik wird die Zustandsmenge (der Phasenraum) eines N -Teilchensystems durch die kontinuierlich variierenden Werte von P und r parametrisiert. Die historisch erste Quantisierungsmethode von Bohr und Sommerfeld bestand darin, den Phasenraum in Zellen mit dem Volumen h3 zu zerlegen und über diese zu mitteln. In diesem Geiste kann die Einteilchen-Zustandssumme eines idealen Gases gemäß
(1)
Ztrans =
1 h3
d3 r d3 P exp −
ε(P ) kB T
.
angesetzt werden. Zeigen Sie, dass dieses Integral auf dasselbe Ergebnis wie Gl. 11.32 führt, wenn die Integration über die Ortskoordinaten auf das Volumen V beschränkt wird. 11.9. Dissoziations- und Ionisations-Gleichgewicht von Wasserstoff Bei hinreichend hohen Temperaturen dissoziiert Wasserstoffgas H2 in H Atome. Wird die Temperatur noch weiter erhöht, so dissoziieren die H-Atome in Elektronen und Protonen (Abbildung 10.1).
410 | 11 Einfache Quantensysteme
a) Berechnen Sie mit einem Algebra-Programm (Maple oder Mathematica) die innere Zustandssumme des H-Atoms. Berücksichtigen Sie dabei nur Zustände, für die der Atomdurchmesser a = n2 2a0 (a0 53 pm ist der Bohr’sche Radius) kleiner als der mittlere Atomabstand bei p 1 bar und T 4000 beziehungsweise 15 000 K ist – bis zu welcher Hauptquantenzahl n der H-Atoms müssen Sie dabei jeweils gehen? b) Geben Sie die innere Zustandssumme des H2 -Moleküls an, wobei die Parameter θrot und θvib als konstant anzusehen sind. Ist die klassische Näherung der Rotations- beziehungsweise Vibrationszustandssumme ausreichend? Inwieweit ist die Näherung, dass Rotationen und Schwingungen voneinander unabhängige Freiheitsgrade sind, gerechtfertigt? c) Ermitteln Sie nun die Massenwirkungskonstante K(T, p) für die Dissoziation von H2 -Molekülen in H-Atomen unter der Annahme, dass die Ionisation der H-Atome vernachlässigt werden kann. Entnehmen Sie die benötigten Systemkonstanten der Tabelle 11.1. d) Berechnen Sie daraus die Temperaturabhängigkeit der Teilchendichten nH2 und nH bei p 1 bar und vergleichen Sie mit Abb. 10.1a. Bestimmen Sie analog die Massenwirkungskonstante für die Ionisation von H-Atomen unter der Annahme, dass die Dichte der H2 -Moleküle vernachlässigt werden kann. e) Berechnen Sie daraus die Temperaturabhängigkeit der Teilchendichten nH , ne− und nH+ bei p 1 bar und vergleichen Sie wieder mit Abb. 10.1. f) Begründen Sie, warum die thermische Dissoziation schon bei viel niedrigeren Temperaturen stattfindet, als man erwarten würde, wenn man die Bindungsenergien einfach in Temperaturen übersetzt. g) Berechnen Sie mit Hilfe der Teilchendichten die Enthalpie und daraus die spezifische Wärmekapazität des Gemischs. Vergleichen Sie das Ergebnis mit Abb. 10.1b.
12 Ideale Gase bei tiefen Temperaturen Wir haben gesehen, dass sich aus der Boltzmann-Verteilung unter gewissen Zusatzannahmen die Massieu-Gibbs-Funktionen des „klassischen“ idealen Gases ableiten lassen. Die dafür notwendige Bedingung war, dass wir uns auf hohe Temperaturen und kleine Dichten beschränken. Dies lässt sich durch die bereits im Zusammenhang mit der Entropie des idealen Gases besprochenen Entartungsbedingungen (Gl. 6.9) nvQ (T ) τN
und
Tc (n) 1, T
quantifizieren. Bei tiefen Temperaturen werden diese Bedingungen verletzt. Gase in diesem Zustandsbereich nennt man auch „Quanten“gase.1 In diesem Zustandsbereich wird der Teilchenabstand mit der de-Broglie-Wellenlänge der Teilchen vergleichbar, und die Forderung der Quantentheorie nach Nicht-Unterscheidbarkeit der Teilchen zeigt noch viel deutlichere Konsequenzen als bei hohen Temperaturen und kleinen Dichten. Als didaktische Neuerung führen wir das Konzept der elementaren Fermi- und Bose-Systeme ein, die eine flexible Basis für die Zerlegung komplexer quantenmechanischer Vielteilchensysteme in elementare, das heißt nicht weiter zerlegbare, Teilsysteme bilden. Diese sind nicht nur für die Beschreibung des Tieftemperaturverhaltens von Gasen, Festkörpern und (Quanten)-Flüssigkeiten geeignet, sondern erlauben darüber hinaus eine Erfassung der Transportphänomene bis hin zu dem in Kapitel 15 vorgestellten Transport in Nanostrukturen. Die für tiefe Temperaturen charakteristische niedrige Dichte von thermischen Anregungen erlaubt die Verallgemeinerung des Konzepts der Idealität auf Systeme von Quasi-Teilchen.
12.1 Fermionen und Bosonen Jetzt wollen wir die Konsequenzen der Nichtunterscheidbarkeit in der Quantenmechanik genauer untersuchen. Die Forderung nach Ununterscheidbarkeit von Teilchen in identischen Zuständen verlangt Permutations-Symmetrie, das heißt, dass Zustän-
1 Es lässt sich (wie bei dem Gegensatz von „nicht-relativistischen“ und „relativistischen“ Teilchen) darüber streiten, ob es sinnvoll ist, ein und dasselbe physikalische System in zwei verschiedenen Zustandsbereichen mit verschiedenen Namen zu bezeichnen. In einer solchen Nomenklatur drückt sich der Fortschritt des physikalischen Verständnisses aus, in dessen Verlauf wir immer wieder feststellen müssen, dass die Eigenschaften wohlvertrauter Systeme nur einen Grenzfall eines allgemeineren Verhaltens darstellen. Dies wird offenbar, wenn wir den vertrauten Parameterbereich durch neuartige Experimente verlassen. Solche Fortschritte zwingen uns gelegentlich zu einem radikalen Umbau unseres Verständnisses der Natur dieser Systeme, der nur sehr langsam in den Sprachgebrauch der Physiker und noch langsamer in die Lehrbücher eindringt.
412 | 12 Ideale Gase bei tiefen Temperaturen de, die sich nur in einer Permutation der Quantenzahlen der einzelnen Teilchen unterscheiden, identisch sein müssen. Die Operation des Vertauschens zweier Teilchen kann mathematisch mittels des durch Pij |1, 2, . . . , i, . . . , j, . . . , N = |1, 2, . . . , j, . . . , i, . . . , N
definierten Permutationsoperator Pij formuliert werden. Die Identität der Zustände verlangt, dass die (Mittel)-Werte aller physikalischen Größen des Systems in dem betrachteten Vielteilchen-Zustand unter der Permutation invariant sein müssen. Die Permutationssymmetrie gestattet daher, den Phasenfaktor des zugehörigen Zustandsvektors bei der Permutation um exp(iφ) zu ändern Pij |1, 2, . . . , i, . . . , j, . . . , N = eiφ |1, 2, . . . , j, . . . , i, . . . , N ,
da dieser aus allen Mittelwerten herausfällt. Zweimaliges Vertauschen zweier Teilchen 2 entspricht der Identität Pij = 1 und muss daher wieder denselben Zustandsvektor |1, 2, . . . , i, . . . , j, . . . , N liefern! Daraus folgt, dass ei2φ = 1
sein muss und dass eiφ nur die Werte +1 und −1 annehmen kann. Dies erlaubt die Unterscheidung von zwei2 fundamental verschiedenen Typen von Teilchen: Bosonen und Fermionen. Vielteilchenzustände in Bose-Systemen sind invariant unter der Permutationsoperation Pij |1, 2, . . . , i, . . . , j, . . . , N = + |1, 2, . . . , j, . . . , i, . . . , N ,
während Vielteilchenzustände in Fermi-Systemen unter der Permutationsoperation Pij |1, 2, . . . , i, . . . , j, . . . , N = − |1, 2, . . . , j, . . . , i, . . . , N
ihr Vorzeichen wechseln. Das sogenannte Spin-Statistik-Theorem3 sagt uns, dass der Spin von Bosonen stets ganzzahlig, der von Fermionen dagegen stets halbzahlig ist. Wichtige Beispiele für Fermionen sind Elektronen, Protonen, Neutronen, Neutrinos sowie deren Komposite (zum Beispiel 3 He-Atome), sofern letztere wieder einen halbzahligen Spin haben. Entsprechende Beispiele für Bosonen sind Photonen, Phononen (die Quanten der Gitterschwingungen in Festkörpern), Magnonen (quantisierte Spinwellen) und andere, üblicherweise mit Feldern assoziierte quantisierte Anregungen sowie Fermion-Komposite mit ganzzahligem Spin (zum Beispiel 4 He-Atome oder atomarer Wasserstoff).
2 Seit einigen Jahren wird die Möglichkeit diskutiert, dass es in Systemen mit nur zwei Raumdimensionen noch weitere Typen von Teilchen geben könnte, bei deren Vertauschung noch andere Werte der Phasendifferenz auftreten. Solche Teilchen werden Anyonen genannt und treten im Zusammenhang mit dem fraktionalen Quanten-Hall-Effekt als Quasiteilchen auf. 3 Der Autor wäre hocherfreut, eine qualitative Begründung für dieses Theorem zu erfahren. . .
12.1 Fermionen und Bosonen
| 413
Die Phase φ tritt nicht in den Mittelwerten der physikalischen Größen für einen Vielteilchenzustand, sondern nur bei der Superposition solcher Zustände zutage. Dies äußert sich in der Regel in Interferenzeffekten, zum Beispiel beim Wirkungsquerschnitt für die Streuung identischer Teilchen. Aus diesen Überlegungen folgt, dass sich Fermionen und Bosonen bei der Besetzung von Einteilchen-Zuständen grundsätzlich unterscheiden:
•
Zwei Fermionen mit gleichem Spin können sich nicht in demselben Einteilchen-Zustand befinden, weil der resultierende Mehrteilchen-Zustand invariant unter Vertauschung wäre. Daraus folgt das Pauli-Prinzip: Von Fermionen besetzte Zustände müssen stets orthogonal sein. Mathematisch bedeutet dies, dass die Zustände der beiden Atome orthogonal sein müssen: χi |χj ·
•
ψi∗ (r − ri )ψj (r − r j )d3 r ≡ 0 ,
wobei |χi,j die Spinzustände und ψi,j die Wellenfunktionen sind.4 Dagegen kennen Bosonen keine Hemmungen, sich im Grenzfall T → 0 allesamt in den energetisch tiefsten Einteilchen-Zustand zu drängeln. Dieser Tatsache liegt das später zu besprechende Phänomen der Bose-EinsteinKondensation zugrunde.
Wie im letzten Kapitel bereits erwähnt, verhindert es die Unmöglichkeit, Teilchen auf ihrer Bahn zu verfolgen, ihnen Unterscheidungsmerkmale zuzuschreiben, welche über Unterschiede in ihrem „inneren“ Zustand hinausgehen. Befinden sich zwei Teilchen daher im gleichen Einteilchen-Zustand, so müssen Vielteilchen-Zustände, die sich nur durch die Permutation dieser Teilchen unterscheiden, identisch sein. Durch die von der Quantentheorie geforderte Permutationssymmetrie verliert der Begriff des Individuums auf der mikroskopischen Ebene seinen Sinn. Andererseits neigt unsere Anschauung hartnäckig dazu, den Teilchen auch auf der mikroskopischen Ebene dieselbe Individualität zuzuschreiben, wie sie uns von makroskopischen Objekten her vertraut ist. Dies stellt unser Bedürfnis, für physikalische Vorgänge auf der mi-
4 Die daraus resultierende Pauli-Abstoßung wird durch den repulsiven Anteil des Lennard-JonesPotenzials (Abschnitt 8.5) modelliert. Sie macht kondensierte Materie schwer kompressibel, weil ein Überlapp der Elektronen-Wellenfunktionen bei Annäherung zweier identischer Atome durch das PauliPrinzip verboten ist. Das bedeutet, dass die Wellenfunktionen der beiden Atome durch die Beimischung von Zuständen mit höherer Energie orthogonal gemacht werden muss, was mit einem dramatischen Anstieg der Energie des Zwei-Teilchensystems verbunden ist.
414 | 12 Ideale Gase bei tiefen Temperaturen kroskopischen Ebene ein anschauliches Verständnis zu entwickeln, vor eine harte Herausforderung. Die Herausforderung ist wesentlich größer als diejenige, welche aus der Erkenntnis resultiert, dass Teilchen auch Welleneigenschaften haben – ja, dass Teilchen und Wellen zwei Seiten derselben Medaille sind. Wir können Scharen von klassischen Trajektorien mit einer Phase versehen und analog den Strahlenbündeln beim Übergang zwischen der geometrischen und der Wellenoptik miteinander interferieren lassen. Das Prinzip der Interferenz ist uns aufgrund der Existenz von Wellen auf der makroskopischen Ebene bereits vertraut. Das Konzept der Nichtunterscheidbarkeit hat dagegen kein Pendant auf der makroskopischen Ebene. Andererseits zeigen Systeme wie das Lichtfeld, die sich in vielen Eigenschaften gut durch eine klassische Wellentheorie beschreiben lassen, Quantenphänomene wie beispielsweise den Photo-Effekt. Es stellt sich also die Frage, wie sich Teilchen- und Wellenaspekte der verschiedenen Systeme auf einer einheitlichen Grundlage beschreiben lassen. Die Lösung, die die moderne Physik für dieses Problem gefunden hat, besteht darin, alle physikalischen Systeme nicht durch Wellenfunktionen, sondern mittels quantisierter Wellenfelder zu beschreiben.5 Die grundlegende Idee der Feldquantisierung, häufig auch zweite Quantisierung genannt, besteht darin, die Amplitude des Wellenfeldes mit einen nicht-Hermite’schen Operator ak zu identifizieren. Ein solcher Operator hat komplexe Mittelwerte, deren Phasenfaktor dem einer klassischen Welle entspricht. Mathematisch sind ak und der zu ak adjungierte Operator a†k von derselben Natur wie die vom harmonischen Oszillator her bekannten Leiteroperatoren [22]. Die Intensität der Quanten-Welle wird durch den Hermite’schen Operator a†k ak repräsentiert, der sich dadurch auszeichnet, dass er bei fermionischen Systemen nur die Eigenwerte 0 und 1 besitzt. Bei bosonischen Systemen besitzt der Operator a†k ak dagegen die Eigenwerte 0, 1, 2, 3,. . . , ∞, sein Eigenwertspektrum ist also ganzzahlig, aber nach oben unbeschränkt. Auf diese Weise lässt sich die physikalische Größe Teilchenzahl Nk = τN a†k ak
(12.1)
mit der Intensität des quantisierten Wellenfeldes identifizieren. Hier ist τN = 1 Teilchen = 1.66 · 10−24 mol das in Abschnitt 3.1 definierte elementare Mengenquantum. Obwohl die Mittelwerte Nk der Teilchenzahl wie die Intensität eines klassischen Wellenfeldes stetig variieren, reflektieren die bei Einzelmessungen der Teilchenzahl zutage tretenden ganzzahligen Eigenwerte Nk,i von Nk die „körnige“, durch das „Klick“ in einem Detektor verkörperte Quantennatur aller Teilchen. Die prinzipielle Nichtunterscheidbarkeit der Teilchen ist hierbei von Anfang an eingebaut, weil sich das Beschrei-
5 Für die mathematischen Details verweisen wir auf einführende Lehrbücher in den Formalismus der zweiten Quantisierung. Hier geht es uns um ein grundlegendes qualitatives Verständnis der Quantentheorie für Vielteilchen-Systeme.
12.1 Fermionen und Bosonen
| 415
bungsverfahren der zweiten Quantisierung nur noch auf die Teilchenzahlen und die Modeneigenschaften, aber nicht mehr auf Größen „individueller“ Teilchen stützt. Es ist bedeutsam, dass es die Quantentheorie erlaubt, komplexe, aus zahlreichen Teilchen zusammengesetzte Objekte bezüglich der Translationsfreiheitsgrade zumindest näherungsweise genauso wie „freie Teilchen“ ohne innere Struktur zu behandeln. Dies ist ein Beispiel einer Systemzerlegung: Die inneren Freiheitsgrade dieser zusammengesetzten Teilchen bilden separat zu behandelnde (Teil)-Systeme, wie wir im letzten Kapitel am Beispiel der Atome und Moleküle gesehen haben. Im Rahmen der Quantenfeldtheorie gewinnt das Wort „Teilchen“ eine völlig neue Bedeutung: statt ein durch einen eigenen Hamilton-Operator (Gl. 11.35) charakterisiertes Teilsystem eines Gases zu bilden, wird es zum bloßen Anregungs-Zustand eines sehr viel größeren Systems, nämlich des quantisierten Materiefeldes degradiert. Die räumliche Gestalt dieser Anregungszustände hängt wie bei klassischen Feldern stark von den an das Wellenfeld gestellten Randbedingungen ab. In der Regel gibt es einen ganzen Satz {q} von Eigenmoden des Quantenfeldes. Hier beschränken wir uns auf den einfachsten Fall der Einschränkung des Systems, auf ein quaderförmiges Volumen. In diesem Fall sind die Eigenmoden k des Feldes einfach ebene Wellen mit dem Wellenvektor k.6 In der Darstellung der zweiten Quantisierung nimmt der Hamilton-Operator eines solchen Vielteilchen-Systems die Gestalt H= ε k τN a†k ak + Wechselwirkungsterme (12.2) k
an, wobei die Summe über alle mit den Randbedingungen verträglichen Wellenvektoren k läuft. Die Wechselwirkungsterme lassen sich in wichtigen Fällen berücksichtigen, ohne die Natur des Systems allzu grundsätzlich zu verändern – nämlich dann, wenn sich der Hamilton-Operator auf eine Form bringen lässt, die dem ersten Term in Gl. 12.2 entspricht. Dies bringt in der Regel eine Modifikation der Dispersionsrelation ε k mit sich; manchmal werden dabei auch Fermionen zu Bosonen (oder umgekehrt), oder es tritt ein weiterer Term mit derselben Form hinzu.7 Die verbleibende Wechselwirkung
6 Im Kristallgitter eines Festkörpers bilden die Atomrümpfe ein periodisches Potenzial für die Elektronen, welches für eine Modifikation der Dispersionsrelation ε(k) (die Bandstruktur des Festkörpers) verantwortlich ist. Die Funktion ε(k) zerfällt in mehrere Zweige (die Bänder) und ist dafür auf ein gewisses Teilvolumen des k-Raumes eingeschränkt. Auf Längenskalen, die groß gegen die Elementarzelle des Kristallgitters sind, sind die resultierenden Bloch-Wellen den ebenen Wellen aber sehr ähnlich. Für Details verweisen wir auch die Lehrbücher der Festkörperphysik. 7 Ein berühmtes Beispiel ist das Fermi-Gas mit Coulomb-Wechselwirkung, welches sich näherungsweise auf zwei neue schwach wechselwirkende Systeme, ein Fermi-Gas mit einer abgeschirmten Wechselwirkung (die zum Beispiel in Thomas-Fermi-Näherung behandelt werden kann) und ein zusätzliches Bose-Gas, die Plasmonen, abbilden lässt. Ein weiteres Beispiel ist die in Abschnitt 14.6.3 dargestellte BCS-Theorie.
416 | 12 Ideale Gase bei tiefen Temperaturen resultiert in einer endlichen Lebensdauer der Anregungszustände, die sich (nach der Philosophie von Kapitel 8) als Streuung mit einer mittleren freien Weglänge modellieren lässt. Die funktionale Abhängigkeit der Anregungsenergie pro Teilchen ε(k) vom Impuls pro Teilchen k ist ebenso wie seine Fermi- oder Bose-Natur ein Charakteristikum der jeweils betrachteten Systems. Elektronen und 3 He-Atome im Grundzustand sind Anregungszustände von fermionischen Materiefeldern, bei denen jede Eigenmode in zwei Teilsysteme zerfällt, welche sich in der Spinquantenzahl unterscheiden und deren Dispersionsrelation für (kinetische) Energien ε(k) − ε0 ε0 durch
ε k
= ε0 +
k
2
2m ˆ
(12.3)
ˆ 2 die minimale Anregungsenergie, nämlich gegeben ist. Dabei ist ε0 = ε(k = 0) = mc die aus der Relativitäts-Theorie bekannte Ruhenergie (Abschnitt 1.4) und c die Lichtgeschwindigkeit. Im Gegensatz zum klassischen System „freier Körper“ (das nur beschleunigt oder abgebremst werden kann) sind die Teilchen des Materiefeldes nicht „immer da“, sondern können (mittels der Operatoren a† und a) aus dem Grundzustand (dem sogenannten Vakuumzustand) erzeugt oder vernichtet werden. Bei festen Randbedingungen stellen diese Operationen zugleich die einzigen möglichen Zustandsänderungen des Materiefeldes dar, da sich jeder andere Operator durch a† und a darstellen lässt. Sie sind geeignet, um die für die Quantenphysik typischen, diskontinuierlichen Zustandsänderungen (die „Quantensprünge“) mathematisch abzubilden. Für ein anderes solches System, das Lichtfeld, heißen die Feldquanten bekanntlich Photonen. Sie sind Bosonen, und für jede Eigenmode des Feldes gibt es zwei Gruppen von jeweils unendlich vielen Anregungszuständen, die sich in der Polarisation unterscheiden. Im freien Raum lautet die Dispersionsrelation der Photonen
ε k
= ck .
(12.4)
In diesem Fall ist die minimale Anregungsenergie ε(0) = 0. Von einigen Modifikationen von ε k abgesehen, stellen diese beiden Beispiele die Prototypen für die Systeme dar, deren thermodynamische Eigenschaften Gegenstand der folgenden Kapitel sind. Glücklicherweise ist für Thermodynamik nicht der ganze mathematische Apparat der Quantenfeld-Theorie erforderlich, sondern es genügen dazu die Eigenwerte der Operatoren H und N . Die Teilchenzahl ist nun kein Systemparameter mehr, sondern eine neben der Energie, dem Impuls oder dem magnetischen Moment gleichberechtigt zu behandelnde Zufallsvariable. Weiterhin bietet der Hamiltonoperator 12.2 einen natürlichen Ansatz für eine neuartige Zerlegung des Gesamtsystems in einfachere Teil-
12.2 Die Gibbs’sche Verteilung |
417
systeme – dies sind die verschiedenen, durch den Wellenvektor k parametrisierten Eigenmoden des Quantenfeldes.8 Mit dem Aufkommen der Quantentheorie wurde offenbar, dass neben der Teilchenzahl noch andere physikalische Größen existieren, deren (Eigen-) Werte ganzzahlig quantisiert sind. Dies sind vor allem die elektrische Ladung Q (in Einheiten von e) und der Drehimpuls L (in Einheiten von ). Die Energie, der Impuls und der magnetische Fluss sind dagegen nicht allgemein, sondern nur für bestimmte Systeme (den harmonischen Oszillator, das freie Teilchen und supraleitende Ringe) ganzzahlig quantisiert. Allerdings zeigte sich selbst für die Größen Q und L recht schnell, dass die fundamentale Einheit zu früh festgelegt wurde, weil bei manchen Elementar-Teilchen auch gewisse Bruchteile der „natürlichen“ Einheit als scharfe und damit messbare Werte dieser Größen auftreten können. Wie bereits in Abschnitt 3.1 diskutiert, hat sich (unter den Physikern) bei keiner anderen Größe als bei der Stoffmenge die Auffassung, dass nur eine Einheit (nämlich die Teilchenzahl) erforderlich ist, als derart allgemein verbindlich durchgesetzt. Da1 her wird N = k Nk meist als dimensionslose Zahl angesehen. Dafür ist weniger die Vereinfachung der Schreibweise als vielmehr die von der klassischen Erfahrung suggerierte Auffassung verantwortlich, dass es sich bei der Teilchenzahl nicht um eine kontinuierliche Variable, sondern um eine wohldefinierte Anzahl von eindeutig voneinander abgrenzbaren Objekten handelt. Wie wir bereits mehrfach betont haben, ist letzteres im Bereich der Quantenphysik trotz der intuitiven Eingängigkeit nicht haltbar. Dennoch werden wir von nun an die Elementarmenge τN in der Definition des Teilchenzahl-Operators N in Gl. 12.1 weglassen, um auf die in der Literatur üblichen Formeln zu kommen – um den Preis, dass die zum Teil subtilen Unterschiede zwischen extensiven physikalischen Größen, Größen pro Teilchen und dimensionslosen Objekten wie der Zustandssumme oder den Wahrscheinlichkeiten verwischen.
12.2 Die Gibbs’sche Verteilung Im Abschnitt 11.1 haben wir die Boltzmann-Verteilung aus dem Boltzmann’schen Prinzip und der Gibbs’schen Fundamentalform abgeleitet. Nun wollen wir in analoger Weise die Wahrscheinlichkeitsverteilung der Zustände mit scharfen Werten von E und N bestimmen. Dazu schreiben wir zunächst die Differenziale der thermodynamischen
8 Das Verfahren eignet sich nicht nur für delokalisierte, sondern auch für lokalisierte Zustände, wie zum Beispiel die einzelnen Moden in einem Laser-Resonator, die sich jeweils durch einen HamiltonOperator der Gestalt Hq = εq τN a†k ak , darstellen lassen.
418 | 12 Ideale Gase bei tiefen Temperaturen Größen auf:
E = H =
Ei W i ,
dE =
i
N = N = S = −kB
Ei dWi ,
i
Ni Wi ,
i
dN =
Ni dWi ,
i
Wi ln Wi ,
dS = −kB
i
ln Wi dWi .
i
Hierbei sind Ei und Ni die Eigenwerte von H und N .9 Weiterhin haben wir die implizite Annahme gemacht, dass die Operatoren H und N miteinander vertauschbar sind, also ein gemeinsames System {|i } von Eigenzuständen besitzen.10 Im Gegensatz zu Kapitel 11, wo wir von der Einteilchen- Schrödinger-Gleichung ausgegangen sind, haben wir nun ein echtes Vielteilchen-System vor uns. In diesem Fall liefert das Boltzmann’sche Prinzip keine Entropie pro Teilchen, sondern die Entropie des Gesamt-Systems.11 Bemerkenswert ist die Tatsache, dass Entropie entsprechend dem Boltzmann’schen Prinzip (Gl. 11.1) und im Gegensatz zur Energie und zur Teilchenzahl nicht mit dem Mittelwert einer durch einen Operator repräsentierten physikalischen Größe identifiziert werden kann, sondern allein durch die Wi gegeben ist. Bringen wir alle Terme in der Gibbs’schen Fundamentalform12 dE = T dS − p dV + μdN
auf eine Seite, so erhalten wir unter der Annahme, dass das Volumen fest sei (dV = 0): dE − T dS − μdN = 0 .
(12.5)
9 Die Eigenwerte Ei von H können wie bei der Boltzmann-Verteilung noch von weiteren Parametern wie dem Volumen oder dem Magnetfeld abhängen. 10 Im Prinzip ist hier neben E und N als weitere Zufallsvariable noch der Impuls P mit seinen Eigen werten P i zu berücksichtigen. Dieser liefert den Beitrag v dP mit dP = i P i dWi zur Gibbs’schen Fundamentalform. Wenn wir als Bezugssystem aber das Schwerpunkts-System wählen, so ist v = 0 und der Impulsbeitrag zur Gibbs’schen Fundamentalform und zur Homogenitätsrelation fällt heraus. Von Bedeutung werden diese Terme bei Strömungs-Phänomenen, das heißt in der Hydrodynamik, wie wir in Abschnitt 13.4.4 bei der Diskussion von Quasiteilchen in suprafluidem 4 He sehen werden. Analoge Überlegungen für den Drehimpuls sind für rotierende Systeme relevant. 11 Strenggenommen müssten wir Gl. 11.1 um den Faktor τN ergänzen, um dimensionsmäßig korrekte Resultate zu erhalten: Wird die Teilchenzahl als dimensionslos angesehen, so ist τN = 1 statt τN = 1 Teilchen und diese Modifikation überflüssig. Allerdings zeigt unsere Diskussion der chemischen Konstanten in den Abschnitten 6.1 und 11.10, dass die Wahl der Einheit von N („Mol“ oder „Teilchen“) sehr wohl eine Rolle spielt. 12 Bei elektrisch geladenen Teilchen, wie zum Beispiel Elektronen, muss das chemische Potenzial durch das elektrochemische Potenzial μ ¯ ersetzt werden, damit auch der Ladungsterm φdQ = qˆφdN in der Gibbs’schen Fundamentalform berücksichtigt wird.
12.2 Die Gibbs’sche Verteilung |
419
Diese Gleichung ist äquivalent zu einem Extremwertproblem für die in Abschnitt 5.4 eingeführte Massieu-Gibbs-Funktion K[Wi ] = E − T S − μN .
Für das Differenzial von K erhalten wir nach Einsetzen der Differenziale für E , N und S in Gl. 12.5: , ! Ei + kB T ln Wi − μi Ni
dK[Wi ] =
dWi = 0 .
i
1 Um die Normierungsbedingung i Wi = 1 für die Wahrscheinlichkeiten einzuarbeiten, wenden wir wieder die Methode der Lagrange’schen Multiplikatoren an und extremalisieren die Funktion Wi − 1
K[Wi ] + λ
i
bezüglich der Wi und des Lagrange-Multiplikators λ. Damit ergibt sich die Bedingung , ! Ei + kB T ln Wi − μNi + λ dWi = 0 .
i
Da die Wahrscheinlichkeiten unabhängig voneinander variiert werden können, muss der Ausdruck in der Klammer verschwinden, und wir erhalten ln Wi = −
Ei − μNi λ − , kB T kB T
λ Wi = exp − kB T
E − μNi · exp − i kB T
(12.6)
.
Der Wert des Lagrange-Parameters wird durch die Normierung der Wi bestimmt:
Wi = exp −
i
λ kB T
·
exp −
i
Ei − μNi kB T
!
=1.
Damit resultieren schließlich die Wahrscheinlichkeiten
Ei − μNi kB T Z(T, μ)
exp − Wi (T, μ) =
Gibbs’sche Verteilung
(12.7)
mit der großkanonischen Zustandssumme Z(T, μ) := exp
λ kB T
=
i
exp −
Ei − μNi kB T
(12.8)
420 | 12 Ideale Gase bei tiefen Temperaturen als Normierungsfaktor. Die physikalische Bedeutung dieser Zustandssumme Z(T, μ) machen wir uns wieder klar, indem wir den Ausdruck für ln Wi (Gl. 12.6) in die Entropie einsetzen: S = −kB
Wi ln Wi
i
= −kB
= kB
Wi ·
i
E − μNi − i − ln Z(T, μ) kB T
E − μN + ln Z(T, μ) kB T
.
Mit Hilfe der Homogenitätsrelation E = T S − pV + μN
sehen wir schließlich, dass K(T, V, μ) = −kB T ln Z(T, μ)
(12.9)
= E − T S − μN = −p(T, μ) · V
(12.10)
eng mit dem Druck zusammenhängt. Die großkanonische Zustandssumme muss also proportional zum Volumen sein, auch wenn dieses bisher nicht explizit aufgetaucht ist.13 Dieses Ergebnis liefert uns direkt die in Abschnitt 5.4 skizzierte Darstellung der Thermodynamik in Dichten. Die Massieu-Gibbs-Funktion K(T, V, μ) wird auch das Landau-Potenzial oder das großkanonische Potenzial genannt. Als nächstes wollen wir die Mittelwerte und Streuungen interessanter Größen berechnen. Dazu betrachten wir die Funktion M := E − μN = K + T S .
(12.11)
Die Änderungen ΔM von M liefern die Änderungen ΔS der Entropie eines Systems bei konstanten V und μ: ΔM := ΔE − μΔN = T ΔS .
(12.12)
In Analogie zur Enthalpie (Abschnitt 5.1.2) nennen wir M die großkanonische Enthalpie.14 Ganz ähnlich wie bei der Herleitung von Gl. 11.6 gilt für M (T, V, μ):
K(T, V, μ) ∂K ∂ M (T, V, μ) = K − T − = T2 (12.13) ∂T
∂T
T
13 Das Volumen steckt in den mit den Randbedingungen verträglichen k-Werten, welche die einzelnen elementaren Teilsysteme nummerieren. In Zusammenhang mit dem Problem der thermischen Ausdehnung in Abschnitt 13.2.3 muss diese Abhängigkeit genauer untersucht werden. 14 Die Größe M besitzt in der Literatur keinen etablierten Namen. Sie wird uns bei der Betrachtung des Entropietransports in ballistischen Systemen in Kapitel 15 wiederbegegnen.
12.2 Die Gibbs’sche Verteilung |
421
und
∂M (T, V, μ) ∂(K + T S) ∂S (12.14) = = −S + S + T = Cv,μ (T ) . ∂T ∂T ∂T Analog zu Gl. 5.7 liefert die Ableitung von M (T, V, μ) nach T die Wärmekapazität bei konstanten V und μ.
Die Kombination der Gln. 12.13 und 12.9 liefert die Zustandsgleichungen M (T, V, μ) = E − μN = kB T 2
∂ ln Z(T, μ) ∂T
(12.15)
und N (T, V, μ) = kB T
∂ ln Z(T, μ) . ∂μ
(12.16)
Zur Berechnung der quadratischen Streuungen schreiben wir genau wie bei der Ableitung von Gl. 11.7
(Ei − μNi )Wi =
M=
i
1 Z
(Ei − μNi ) exp −
i
Ei − μNi kB T
,
und gewinnen durch Ableiten nach T sowie mit Gl. 12.14:
ΔM
2
= kB T 2
∂M (T, V, μ) = kB T 2 Cv,μ (T ) . ∂T
(12.17)
Das Ableiten von Gl. 12.16 nach μ resultiert in der analogen Beziehung (ΔN )2 = kB T
∂ 2 ln Z(T, μ) ∂N (T, μ) kB T N 2 = = (kB T )2 κT ∂μ V ∂μ2
(12.18)
zwischen der Teilchenkapazität, der Kompressibilität (Gl. 5.44) und den Fluktuationen der Teilchenzahl N um ihren Mittelwert. Diese ist für das bei Annäherung an den kritischen Punkt auftretende Phänomen der kritischen Opaleszenz verantwortlich (Abschnitt 9.6.2). Die sich anbahnende Instabilität des Systems äußert sich in starken Fluktuationen der Teilchendichte, die zur Streuung des Lichts führen, wenn die räumliche Korrelation der Fluktuationen in die Größenordnung der Wellenlänge des Lichts kommt. Die gemischten 2. Ableitungen von ln Z(T , μ) beschreiben nach Anhang G die Korrelationen der Fluktuationen von E und N und hängen mit dem thermischen Ausdehnungskoeffizienten βμ zusammen.
422 | 12 Ideale Gase bei tiefen Temperaturen
12.3 Elementare Bose- und Fermi-Systeme Nun wollen wir die durch die Form von Gl. 12.2 nahegelegte exakte Zerlegung idealer Gase in elementare Teilsysteme durchführen. Die in den einzelnen Summanden † Hk = ε k N k ,
Nk = ak ak
in der Summe Gl. 12.2 auftretenden Teilsysteme lassen sich in folgender Weise charakterisieren: a) Es ist Ek = Hk = ε(k) Nk
in allen Zuständen eines elementaren Teilsystems. Dabei ist ε eine Energie pro Teilchen; im Gegensatz zu Ek ist ε(k) eine charakteristische Konstante des durch k bezeichneten Systems. Bei Systemen von freien (Quasi)-Teilchen, die durch einen Wellenvektor k klassifiziert werden können, gilt nach de Broglie für den Mittelwert des Impulses in diesem Teilsystem außerdem Pk = k · Nk .
b) Elementare Fermi-Systeme besitzen zwei Eigenzustände von Hk und Nk mit den Eigenwerten Ei,k = 0, ε(k), sowie Ni,k = 0, 1. Die Zustandssumme lautet dann:
ε(k) − μ ZF (T, μ) = 1 + exp − . (12.19) kB T
Damit erhalten wir für den Mittelwert der Teilchenzahl dieser Systeme (F ) Nk (T, μ)
= Nk =
exp −
ε(k)−μ kB T
1 + exp −
ε(k)−μ kB T
≤1.
Das Ergebnis (F )
Nk
(T, μ) =
1 . exp [(ε(k) − μ)/(kB T )] + 1
(12.20)
wird als die Fermi-Funktion bezeichnet; sie gibt den Mittelwert der Teilchenzahl in einem elementaren Fermi-System an. Daneben ist auch die Bezeichnung FermiDirac-Verteilung üblich. Sie gibt an, wie die Gesamtzahl der Teilchen eines aus elementaren Fermi-Systemen zusammengesetzten Systems auf die einzelnen elementaren Fermi-Systeme verteilt ist. Der Wert der Teilchenzahl in einem elementaren Fermi-System variiert stetig zwischen 0 und 1. Dies reflektiert das PauliPrinzip.15
15 In üblicher Terminologie wird die Fermi-Funktion nicht als Mittelwert der Teilchenzahl, sondern als als Wahrscheinlichkeit dafür interpretiert, dass der „Einteilchenzustand“ mit der Energie ε(k) mit
12.3 Elementare Bose- und Fermi-Systeme
|
423
Die zweite Ableitung der Zustandssumme nach μ liefert wieder die Unschärfe der Teilchenzahl: (ΔNk )2Fermi = (kB T )2
∂ 2 ln ZF (T, μ) = Nk 1 − Nk . ∂μ2
(12.21)
Die Schwankungen der Fermionenzahlen sind wegen der Beschränkung auf Nk ≤ 1 stets relativ klein. Diese statistischen Schwankungen äußern sich experimentell in dem Johnson-Nyquist-Rauschen der Spannung an jedem elektrischen Widerstand (Abschnitt 15.3.4). c) Elementare Bose-Systeme besitzen abzählbar-unendlich viele Eigenzustände von Hk und Nk mit den Eigenwerten Ei,k = 0, ε(k), 2ε(k), 3ε(k), ... sowie Ni,k = 0, 1, 2, 3, ... . Die Zustandssumme dieser Systeme lautet in diesem Fall:
ZB = 1 + exp −
ε(k) − μ kB T
+ exp −2
ε(k) − μ kB T
+ ... .
Dabei handelt es sich wie beim harmonischen Oszillator in Abschnitt 11.4 um eine geometrische Reihe, die leicht aufsummiert werden kann: ZB (T, μ) =
1
1 − exp −
ε(k)−μ kB T
.
(12.22)
Daraus ergibt sich nach Gl. 12.16 für den Mittelwert der Teilchenzahl:
(B)
Nk
(T, μ) = kB T
∂ ln ZB ∂ = kB T ∂μ ∂μ
exp − = kB T
1 − exp
ε(k)−μ kB T
ln 1 − exp −
ε(k)−μ − kB T
ε(k) − μ kB T
1 . kB T
Komplementär zu den Fermi-Systemen erhalten wir die Bose-Funktion: (B)
Nk
(T, μ) =
1 . exp [(ε(k) − μ)/kB T ] − 1
(12.23)
Der Mittelwert der Teilchenzahl in elementaren Bose-Systemen variiert stetig zwischen 0 und ∞ und wird auch als Bose-Einstein-Verteilung bezeichnet. Im Gegensatz zu Fermi-Systemen gibt es eine Einschränkung für die möglichen Werte
einem Teilchen „besetzt“ ist. Dem liegt die in Abschnitt 11.12 dargestellte Boltzmann’sche Auffassung zugrunde, dass die Teilchen elementare Teilsysteme repräsentieren, die sich auf die Zustände (des Einteilchensystems) statistisch verteilen. In dieser Sprechweise wird die Rolle von System und Zustand also gerade vertauscht. Diese Interpretation ist bei Bose-Systemen nicht möglich, weil bei diesen kein Pauli-Prinzip gilt und Nk nach oben unbeschränkt, also nicht normierbar ist.
424 | 12 Ideale Gase bei tiefen Temperaturen
2.0
(a)
(b) 3
Sk / k B
3
1.0
Bose Fermi
2 1
0.5 -4
-2 0 2 ¡k cT = B/m , wobei m die Massendichte und A und B elastische Konstanten sind, die mit dem
•
•
•
Elastizitätsmodul (definiert durch die Längenänderung bei uniaxialem Druck) und dem Schermodul (definiert durch die Schersteifigkeit) zusammenhängen.6 Die Translationssymmetrie des Raumgitters in kristallinen Festkörpern führt dazu, dass die Dispersionsrelation ε(q) eine periodische Funktion des Wellenvektors q ist.7 Diese Periodizität wird analog zu der des Raumgitters durch reziproke Gittervektoren G beschrieben, die das reziproke Gitter im Raum der mit den Randbedingungen verträglichen q -Vektoren aufspannen. Wegen der Gitterperiodizität existiert für die charakteristische Energie ε(q) der einzelnen Schwingungsmoden eine obere Schranke εmax , die kein Gegenstück in der thermischen Strahlung hat. Die Einheitszelle des reziproken Gitters wird die 1. Brillouin-Zone genannt. Wegen der Periodizität des Gitters ist es möglich, sich auf q -Vektoren zu beschränken, die innerhalb der 1. Brillouin-Zone liegen, indem man von den größeren q -Vektoren einen geeigneten reziproken Gittervektor subtrahiert. Die Impulse G lassen sich mit dem Schwerpunktsimpuls des Kristallgitters identifizieren, während die Impulse (q − G) innerhalb der 1. Brillouin-Zone den Phononen zugeordnet werden können. Die Zahl der Schwingungsmoden in einem Kristall mit N Atomen ist endlich und beträgt 3N − 3. Ein typischer Wert für den Abstand zweier Atome im Raumgitter ist a 0.3 nm. Dass dieser Wert weitgehend unabhängig von Material ist, kommt
6 Kristallgitter sind nicht isotrop. Von Richtungen hoher Symmetrie abgesehen führt dies dazu, dass die longitudinalen und transversalen Schwingungsmoden miteinander vermischt werden. 7 Die Wellenvektoren der Phononen werden oft mit q bezeichnet, um sie von denen der Elektronen zu unterscheiden (die man meist mit k bezeichnet).
13.2 Phononen im Debye-Modell
|
455
LO Einstein
¡(q)
TO LA
Debye
TA
(b)
(a) -//a
0 q
//a
-//a
qmax
0 q
//a
qmax
Abb. 13.4. a) Schematische Darstellung der longitudinalen (LA, LO) und transversalen (TA, TO) Phononenzweige eines kubischen Kristallgitters mit zwei Atomen pro Elementarzelle (zum Beispiel von NaCl). Für Kristallrichtungen hoher Symmetrie sind die transversalen Zweige der Dispersionsrelation ε(q) entartet. Die grau schattierten Bereiche außerhalb der 1. Brillouin-Zone entsprechen redundanten Wellenvektoren mit |q| > π/a. b) Die optischen und akustischen Zweige der Dispersionsrelation im Einstein- und Debye-Modell. Die Dispersionsrelation bricht bei einem fiktiven Wellenvektor qmax ab, der so gewählt ist, dass sich die korrekte Zahl von Phononenmoden ergibt.
•
•
wieder durch die relative Unabhängigkeit der Atomradien von der Ordnungszahl der Atome zustande. Weist der Kristall mehr als ein Atom pro Elementarzelle auf, so existieren zusätzlich zu den Polarisationsfreiheitsgraden mehrere Zweige der Dispersionsrelation (akustische und optische Phononen), die durch eine Energielücke getrennt sein können. Eine typische Phononen-Dispersionrelation eines Kristallgitters mit zwei Atomen von unterschiedlicher Masse pro Elementarzelle ist in Abb. 13.4a skizziert. Die Wechselwirkung zwischen Phononen ist viel stärker als zwischen Photonen.8 Entsprechend der Energieunschärfe-Lebensdauer-Relation der Quantenmechanik bedeutet dies, dass die Lebensdauern der Phononen endlich sind und bei höheren Phononendichten stark verkürzt werden. Im flüssigen Zustand sind die Phononenlebensdauern so kurz, dass das Phononenbild in der Regel nicht sinnvoll ist. Von allen Bose-Flüssigkeiten existiert allein flüssiges 4 He bei so tiefen Temperaturen, dass es im Phononenbild sinnvoll beschrieben werden kann.
Für weitere Details sei auf die Lehrbücher der Festkörperphysik verwiesen [31; 32].
8 Dies liegt daran, dass das Wechselwirkungspotenzial zwischen den Atomen stark anharmonisch ist.
456 | 13 Bose-Systeme 13.2.1 Debye-Näherung der Zustandsdichte Nach Debye wurde ein vereinfachtes Modell benannt, das anstelle der realen Dispersionsrelation in Fig. 13.4a mit der entsprechenden (meist nur numerisch berechenbaren) Zustandsdichte g(ε) für die akustischen Phononenzweige eine Kontinuumsnäherung verwendet, welche die atomistische Struktur der Festkörper ignoriert. Eine solche Näherung ist bei tiefen Temperaturen immer zulässig, weil in diesem Grenzfall nur Gitterwellen mit großen Wellenlängen λ a angeregt sind, für die die viel feinere atomare Struktur des Kristalls nicht spürbar ist. Das Debye-Modell ist auch auf amorphe Festkörper oder Flüssigkeiten anwendbar, die keine periodische Struktur haben. Eine weitere Vereinfachung ist möglich, wenn die unterschiedlichen Schallgeschwindigkeiten cL und cT durch eine einzige effektive Schallgeschwindigkeit ceff ersetzt werden. Im Rahmen der Kontinuumsnäherung ist das Spektrum der akustischen Phononen linear in q : ε(q) = ceff · |q| . Die optischen Phononen lassen sich grob durch eine δ -förmige Zustandsdichte bei einer mittleren Frequenz der optischen Phononen modellieren, die auf das in Abschnitt 11.4 betrachtete Einstein-Modell des Festkörpers führt. Die Dispersionsrelationen in einem derart stark vereinfachten Modell sind in Abb. 13.4b dargestellt, Genau wie bei der thermischen Strahlung hat die Linearität von ε(q) zur Konsequenz, dass die Phononen-Zustandsdichte bei niedrigen Energien nach Gl. 13.1 quadratisch in ε sein muss. Um für hohe Temperaturen kB T εmax realistische Resultate zu erzielen ist es notwendig, dass die lineare Dispersionsrelation bei einer bestimmten maximalen Phononenenergie εmax = ωD abbricht. Die Debye-Frequenz ωD muss so gewählt werden, dass die Integration der Zustandsdichte die richtige, durch die Gesamtzahl der Atom des Festkörpers festgelegte Zahl von Schwingungsmoden ergibt. Der Debye-Frequenz entspricht ein (fiktiver) Wellenvektor qmax , bei dem ε(q) abbricht. Zur Bestimmung der Debye-Frequenz und qmax integrieren wir Gl. 13.17 und berücksichtigen, dass die longitudinalen und transversalen Polarisationsfreiheitsgrade in drei Dimensionen einen Faktor 3 vor der durch Gl. 13.1 gegebenen Zustandsdichte liefern: ωD
3(NEZ − 1) V
ωD
g(ε) dε = V 0
0
(ω ) 3 3ε2 dε =V · 2 D 3 , 2 3 2π (ceff ) 2π (ceff )
(13.17)
wobei NEZ die Zahl der Elementarzellen des Kristalls bezeichnet.9 Für die effektive
9 Multipliziert man die Zahl der Atome pro Elementarzelle mit NEZ , so muss sich natürlich die Gesamtzahl N der Atome des Festkörpers ergeben.
13.2 Phononen im Debye-Modell
g (t)
10
20
30
40
457
Abb. 13.5. Zustandsdichte von Diamant (schwarz) mit der zugehörigen Debye-Approximation (rot). Die scharfen Spitzen bei höheren Frequenzen sind auf die optischen Phononen zurückzuführen, die durch das Debye-Modell nicht oder nur schlecht erfasst werden. Unterhalb von 5 THz stellt das Debye-Modell eine sehr gute Näherung dar, weil die elastischen Eigenschaften des Kristallgitters für große Wellenlängen λ a durch ein Kontinuumsmodell mit den elastischen Konstanten A und B sehr gut beschrieben werden (nach [21]).
Diamant
0
|
tD
t (2/ ·THz
Schallgeschwindigkeit ergibt sich c3eff = 3
2 1 + 3 c3L cT
−1 =
3 V ωD , NEZ 6π 2
oder wegen V /NEZ = a3 (für kubische Kristalle): ωD = ceff · qmax
mit
qmax =
3
6/π ·
π π 1.24 . a a
Setzen wir ceff in Gl. 13.1 ein, so resultiert schließlich für die Zustandsdichte im DebyeModell: g(ε) =
NEZ 9 ε2 · θ(ωD − ε) , V (kB ΘD )3
(13.18)
wobei θ(x) die Heaviside’sche Stufenfunktion ist, welche die Bedingung g(ε) ≡ 0 für ε > ωD sicherstellt. Die Debye-Zustandsdichte ist in Abbildung 13.5 zusammen mit der auf der Basis realistischer Modelle berechneten Zustandsdichte von Diamantkristallen dargestellt. Bei niedrigen Energien ist die Übereinstimmung recht gut, während bei hohen Energien starke Abweichungen auftreten, die vor allem auf scharfe Maxima in der realen Zustandsdichte zurückzuführen sind. Die Flächen unter beiden Kurven sind gleich. Da die im folgenden Abschnitt auszuwertenden Zustandsgleichungen (Gl. 12.28 und Gl. 12.29) aber stets Integrale über die Zustandsdichte beinhalten, wirken sich diese Abweichungen nur schwach auf die Form der Zustandsgleichungen aus, sodass das Debye-Modell auch bei höheren Temperaturen eine überraschend gute Näherung darstellt.
458 | 13 Bose-Systeme 13.2.2 Thermische Eigenschaften des Phononensystems 13.2.2.1 Phononenzahlen Zunächst berechnen wir analog zum Beispiel des Photonengases die mittlere Phononenzahl. k B ΘD
N (T ) = V
(13.19)
g(ε)fB (ε) dε 0
9NEZ = (kB ΘD )3
k B ΘD
ε2 dε = 9NEZ exp(ε/kB T ) − 1
T ΘD
0
3 ΘD /T
x2 dx , ex − 1
0
und kB ΘD = ωD , wobei ΘD die Debye-Temperatur ist. Dies ist die thermische Zustandsgleichung des Phononensystems. Da das hier auftretende Integral nicht bei allen Temperaturen geschlossen auszuwerten ist, betrachten wir die Grenzfälle hoher und niedriger Temperaturen. Bei hohen Temperaturen T ΘD gilt: x2 x2 ≈ = x + ··· x e −1 1 + x + ··· − 1
ΘD /T
und daher
1 x2 dx ex − 1 2
ΘD T
2 .
0
Damit bekommen wir in diesem Grenzfall N (T ) =
9 NEZ 2
T ΘD
∝T .
(13.20)
Für Gold ist beispielsweise bei 300 K: ΘD = 170 K. Bei 300 K erhalten wir damit N 8 akustische Phononen pro Elementarzelle. Die Phononendichte bei Zimmertemperatur kann die Dichte der Atome also erheblich übersteigen. Der typische Phononenimpuls beträgt |p| ˆ π /a 10−24 kg m/s und ist damit nicht viel kleiner als der mittlere Im√ puls eines Atoms in Heliumgas bei 300 K (|p| ˆ 3mk ˆ B T 10−23 kg m/s). Nach dem Bernoulli-Modell (Abschnitt 3.4) werden die an der Innenseite der Kristalloberfläche reflektierten Phononen also einen erheblichen Druck ausüben. Im nächsten Abschnitt werden wir zeigen, dass der Phononendruck bei T ΘD Tausende von Bar betragen kann und damit maßgeblich für die thermische Ausdehnung eines Festkörpers verantwortlich ist (Abschnitt 13.2.3). Bei tiefen Temperaturen mit ΘD /T → ∞ ist ΘD /T
0
und wir erhalten
x2 dx Γ(3)ζ(3) = 2.404 ex − 1
13.2 Phononen im Debye-Modell
N (T ) = 22 · NEZ
T ΘD
|
459
3 (13.21)
.
Für Gold resultiert bei 10 K: N 1 akustisches Phonon pro 227 Elementarzellen. Auch bei tiefen Temperaturen ist die Phononendichte immer noch höher als die Teilchendichte eines idealen Gases unter Standard-Bedingungen (S. 91). Da die Phononen Stoßpartner der Elektronen im Metall darstellen, ist deren Dichte entscheidend für die Temperaturabhängigkeit des elektrischen Widerstands. In der Tat ist der spezifische Widerstand eines Metalls bei hohen Temperaturen ρ(T ) ∝ T , −1 was die Temperaturabhängigkeit der Elektron-Phonon-Streurate τep widerspiegelt. −1 3 Bei tiefen Temperaturen ist dagegen τep ∝ nphonon ∝ T . Für den elektrischen Widerstand spielt allerdings nicht nur die Zahl der Phononen eine Rolle, sondern es kommen noch Phasenraumargumente hinzu, sodass in reinen Metallen ρ(T ) ∝ T 5 beobachtet wird (Abschnitt 14.4.2).
13.2.2.2 Energie, Wärmekapazität und Entropie Aus der kalorischen Zustandsgleichung der Bose-Gase (Gl. 12.29) können wir die übrigen thermischen Eigenschaften ableiten: k B ΘD
E(T ) = V ·
(B)
g(ε)Nε
dε
0
9NEZ = (kB ΘD )3
k B ΘD
0
ε3 dε k T4 = 9NEZ B 3 exp(ε/kB T ) − 1 ΘD
ΘD /T
x3 dx ex − 1
0
Wir betrachten wieder die beiden Grenzfälle. Bei ΘD /T 1 erhalten wir für den Integranden näherungsweise: x3 = x2 + · · · ex − 1
ΘD /T
und daher
x3 dx 1 ex − 1 3
ΘD T
3 .
0
Wir erhalten E(T ) = 3NEZ · kB T
für T ΘD .
(13.22)
Im Hochtemperatur-Grenzfall haben wir damit das Resultat des Gleichverteilungssatzes reproduziert. Für die Wärmekapazität ergibt sich daraus ein konstanter Wert – entsprechend dem Gesetz von Dulong-Petit (Abschnitt 3.7).
460 | 13 Bose-Systeme
NaCl
(b)
FeS2 MgO
Cv / (3NkB)
0.8 Diamant
0.6 0.4 0.2 0
0
200
400
OD (K) RbI 103 NaCl 321 FeS2 637 MgO 946 C 2230
600
800
60 (J mol-1K-1)
RbI
1.0
40
,
(a)
20
1000
0
6R
NaCl
0
200
400
600
800
1000
T (K)
T (K)
Abb. 13.6. a) Molare Wärmekapazitäten bei konstantem Volumen für verschiedene Isolatoren mit verschiedenen Debye-Temperaturen. Zum besseren Vergleich wurden die experimentellen Daten auf gleiche Teilchenzahlen N normiert: 1 mol für C, 1/2 mol für RbI, NaCl, MgO und 1/3 mol für FeS2 . b) Vergleich der molaren Wärmekapazität von NaCl für konstantes Volumen und konstanten Druck. Bei hohen Temperaturen strebt cˆv dem Grenzwert 6R zu, weil NaCl zwei Atome pro Elementarzelle enthält (nach [33]).
Im Tieftemperatur-Grenzfall ΘD /T → ∞ erhalten wir für das Integral näherungsweise ΘD /T
π4 x3 dx ≈ Γ(4)ζ(4) = . x e −1 15
0
Damit folgt E(T ) =
3π 4 k T4 NEZ B 3 5 ΘD
für T ΘD .
(13.23)
Dieses Ergebnis ähnelt stark dem Resultat Gl. 13.5 für die thermische Strahlung. Aus der kalorischen Zustandsgleichung 13.23 bekommen wir sofort die Wärmekapazität des Phononengases bei tiefen Temperaturen: Cv (T ) =
∂E(T ) 12π 4 = NEZ kB ∂T 5
T ΘD
3
= βT 3 .
(13.24)
Dies ist das berühmte Debye-Gesetz für die Wärmekapazität von Isolatoren im Grenzfall tiefer Temperaturen.10 In Abb. 13.6a sind experimentelle Daten für verschiedene Isolatoren dargestellt. Die spezifischen Wärmekapazitäten dieser Kristalle unterscheiden sich bei tiefen Tem-
10 Die Bezeichnung β soll Verwechslungen mit dem thermischen Ausdehnungskoeffizienten β vorbeugen.
13.2 Phononen im Debye-Modell
(a)
Dulong-Petit
1
|
461
(b)
CDulong-Petit CEinstein CDebye
0
/ 3kB
v / 3kB
1.5
1 SDebye SEinstein SDulong-Petit
0.5
0 0
0.5
T/ΘD
1
0.5
0
T/ΘD 1
Abb. 13.7. a) Vergleich der spezifischen Wärmekapazität in den Modellen von Debye, Einstein und nach dem Gleichverteilungssatz (Dulong-Petit). b) Durch Integration von cˆv (T )/T gewonnene Entropie für die verschiedenen Modelle. Die charakteristischen Temperaturen ΘE und T ∗ der Modelle wurden so angepasst, dass sich für S im Hochtemperatur-Grenzfall gleiche Werte ergeben. Während sich SDebye und SEinstein vergleichsweise wenig unterscheiden, weicht S(T ) für einen Körper mit konstanter Wärmekapazität schon bei T 0.5ΘD deutlich ab und wird bei der charakteristischen Temperatur T0 negativ.
peraturen aufgrund ihrer Debye-Temperaturen erheblich. Abb. 13.6b zeigt einen Vergleich der molaren Wärmekapazität von NaCl für konstantes Volumen und konstanten Druck. Die Differenz cˆp − cˆv ist nach Gl. 3.24 durch den thermischen Ausdehnungsdehnungskoeffizienten βp und die isotherme Kompressibilität κT gegeben, die für T ΘD wichtig werden und in folgenden Absatz weiter diskutiert werden. Die Entropie des Systems bekommen wir wieder durch einfaches Integrieren der Wärmekapazität: T S(T ) =
4π 4 Cv dT = NEZ kB T 5
T ΘD
3 =
π2 N (T ) . 55
(13.25)
0
Wie bei den Photonen sind Phononenzahl und Entropie durch einen für das DebyeModell spezifischen Zahlfaktor miteinander verbunden. In Abb. 13.7a sind die spezifische Wärmekapazität bei konstantem Volumen und die molare Entropie für das Debye-Modell, das Einstein-Modell und nach Dulong-Petit im Vergleich dargestellt. Die Einstein-Temperatur ΘE = 0.71 ΘD und die in Gl. 2.11 in Abschnitt 2.3 auftretende charakteristische Temperatur T ∗ = 0.26 ΘD eines Körpers mit konstanter Wärmekapazität wurden so gewählt, dass sich im Grenzfall hoher Temperatur dieselben, logarithmisch ansteigenden Absolutwerte der Entropie ergeben (Abb. 13.7b). Abschließend bleibt noch die Frage zu beantworten, warum das Dulong-Petit-Gesetz für die Wärmekapazität für manche Stoffe bei Zimmertemperatur gut erfüllt ist und für andere nicht. Allgemein lässt sich sagen, dass die longitudinale Schallgeschwindigkeit, wel-
462 | 13 Bose-Systeme
CD
CG
Θ D (K)
Sb
He
Ordnungszahl Abb. 13.8. Debye-Temperaturen der kristallinen Elemente als Funktion der Ordnungszahl. Die Alkalimetalle sind rot markiert. Es sind deutliche Minima von ΘD entsprechend den Hauptgruppen des Periodensystems zu erkennen, welche auf die Besetzung einer neuen Elektronen-Schale zurückzuführen sind (Daten aus [31]).
che die typischen Phononenenergien bestimmt, durch die Massendichte m und die isentrope Kompressibilität κS des Materials bestimmt ist: cSchall = √
1 . mκS
In Abb. 13.8 sind die Debye-Temperaturen für viele der Elemente gezeigt. Den höchsten Wert für ΘD , und damit auch die drastischste Abweichung der Wärmekapazität vom Dulong-Petit-Gesetz, weist Diamant (CD ) auf, was auf die außerordentliche Härte des Kristallgitters und auf das geringe Atomgewicht des Kohlenstoffs zurückzuführen ist. Graphit (CG ) hat aufgrund seiner geschichteten, relativ lockeren Kristallstruktur eine wesentlich niedrigere Debye-Temperatur. Bei mittleren Temperaturen zeigen sich bei allen Materialien feine Abweichungen vom Debye-Gesetz, die auf die Details der Phononen-Dispersionsrelation zurückzuführen sind. Detaillierte theoretische Rechnungen sowie Messungen von ε(q) mittels Neutronenstreuexperimenten erlauben es inzwischen, die realistische Phononenzustandsdichte experimentell und theoretisch mit großer Genauigkeit zu bestimmen. Setzt man diese Resultate in die kalorische Zustandsgleichung ein, so ergibt sich in aller Regel eine hervorragende Übereinstimmung mit den thermodynamischen Daten.
13.2 Phononen im Debye-Modell
|
463
Ein wesentlicher Unterschied zwischen dem Phononen- und dem Photonengas ist der, dass ersteres einen klassischen Grenzfall besitzt, letzteres dagegen nicht. Während man die Temperaturabhängigkeit der Wärmekapazität der Festkörper lange Zeit als „kleine substanzspezifische Abweichung von einem im Prinzip wohlverstandenen Verhalten“ deklarieren konnte, bot die thermische Strahlung keinen Ausweg dieser Art – hier gibt es keinen Hochtemperatur-Grenzfall, und die Begegnung mit der Quantentheorie war unvermeidbar. Ebenfalls wichtig war dabei natürlich die Tatsache, dass die spektrale Energiedichte des Photonengases direkt beobachtet werden konnte und es erlaubte, konkurrierende Theorien auszuschließen. Eine analoges Experiment im Festkörper ist in Ermangelung eines geeigneten Phononen-Detektors schwierig – erst die inelastische Neutronenstreuung brachte direkte spektroskopische Information über die Phononen. Es ist erstaunlich, wieviel konzeptionelle Arbeit, ja, welche Epochen an ideengeschichtlicher Entwicklung erforderlich waren, um die simple, bereits in Abschnitt 2.3 aufgeworfene, Frage nach dem Tieftemperaturverhalten des einfachst-möglichen thermischen Systems „Heißer Körper“ zu beantworten.
13.2.3 Thermische Ausdehnung von Festkörpern - Phononendruck Wie wir bereits in den Abschnitten 2.2 und 4.4 gesehen haben, besteht auch in Festkörpern eine, wenn auch relativ geringe, thermoelastische Kopplung – die thermische Ausdehnung. Diese Kopplung äußert sich nach Gl. 3.24 in der Differenz der Wärmekapazitäten für konstantes Volumen und konstanten Druck, die für NaCl in Abb. 13.6b dargestellt ist. In diesem Abschnitt wollen wir ein mikroskopisches Verständnis für diesen Effekt und seine unterschiedliche Ausprägung in verschiedenen kristallinen Materialien entwickeln. Nachdem wir das Volumen als variabel betrachten, gehen wir von dem Variablensatz {T, V, NEZ } und der zugehörigen Massieu-Gibbs-Funktion F (T, V, NEZ ) aus. Die besitzt in erster Näherung die folgenden Anteile: F (T, V, NEZ ) =
[V − V0 (NEZ )]2 + Fphonon (T, V, NEZ ) . 2V0 (NEZ )κT (T )
(13.26)
Der erste Term in Gl. 13.26 (Aufgabe 1.5) repräsentiert den Beitrag der statischen elastischen Deformation zur Energie des Kristalls, wobei V0 (NEZ ) das Volumen des Festkörpers bei T = 0 ist. Der zweite Beitrag beschreibt den Beitrag der Phononen zur freien Energie. Die Annahme, dass sich die statischen und die dynamischen Freiheitsgrade des Festkörpers auf diese Weise in zwei Anteile zerlegen lassen, ist natürlich nur näherungsweise korrekt. Dennoch ist der Kopplung zwischen den statischen und dynamischen Freiheitsgraden dadurch phänomenologisch Rechnung getragen, dass die messbare Temperaturabhängigkeit von κT und eine Volumenabhängigkeit in Fphonon berücksichtigt werden. Die Ableitung der freien Energie nach V liefert den hydrostati-
464 | 13 Bose-Systeme schen Druck:11 ∂F (T, V, NEZ ) ∂V [V − V0 (NEZ )] = + pphonon (T, V, NEZ ) . V0 (NEZ )κT (T )
pext (T, V, NEZ ) = −
(13.27)
Diese Gleichung ist eine Form der thermischen Zustandsgleichung des Festkörpers und lässt sich als Ausdruck eines Druckgleichgewichts zwischen drei Systemen lesen: der Umgebung des Festkörpers, welche den von außen angelegten Druck p festlegt, dem statisch verformten Kristallgitter und dem Druck des die dynamischen Freiheitsgrade repräsentierenden Phononengases. Für Festkörper im Vakuum ist der externe Druck pext ≡ 0. In dieser Näherung ist die thermische Ausdehnung des Festkörpers nichts anderes als die durch die Kohäsion des Kristallgitters beschränkte thermische Ausdehnung des Phononengases. Wir gewinnen den thermischen Ausdehnungskoeffizienten βp =
1 ∂V (T, p, NEZ ) V ∂T
bei konstantem äußerem Druck, indem wir Gl. 13.27 nach T differenzieren, Gl. A.3 auf ∂p(T, V, N )/∂T anwenden und die T -Abhängigkeit von κT vernachlässigen: ∂pphonon (T, V, NEZ ) ∂V (T, p, NEZ ) 1 + V0 (NEZ )κT (T ) ∂T ∂T ∂pphonon (T, V, NEZ ) βp + . =− κT (T ) ∂T
pext = −
Lösen wir diese Gleichung für pext = 0 nach βp auf, erhalten wir das kompakte Resultat: βp = κ T
∂pphonon (T, V, NEZ ) . ∂T
(13.28)
Zur Berechnung von pphonon müssen wir auf Gl. 12.26 zurückgreifen, weil wir beim Übergang von Gl. 12.26 zu Gl. 12.27 die V -Abhängigkeit der Energien ε(q) der elementaren Bose-Systeme nicht explizit, sondern nur implizit (über die Forderung nach Homogenität) berücksichtigt haben. Die V -Abhängigkeit der ε(q) hat zwei Ursachen: • Die in der Summe auftretenden q -Vektoren verschieben sich bei Volumenänderungen, weil sie stets mit festen oder periodischen Randbedingungen verträglich sein müssen. • Die Dispersionsrelation ε(q) kann sich aufgrund von anharmonischen Beiträgen zum Wechselwirkungspotenzial zwischen den Atomen ändern.12
11 In der Praxis sind natürlich auch anisotrope Verformungen wichtig – diese würden uns jedoch zu weit in die Elastizitätstheorie führen. 12 Im Rahmen der quasi-harmonischen Näherung bewirkt die Verschiebung der Gleichgewichtslage durch eine Auslenkung der Atome durch eine externe Kraft. Bei anharmonischen Wechselwirkungspotenzialen führt dies dazu, dass bei kleinen Schwingungen um die neue Ruhelage eine andere lokale Krümmung des Potenzials und damit eine andere Federkonstante vorliegt.
13.2 Phononen im Debye-Modell
(a)
|
465
(b) 10 4 10
100
3
10 2 50
10 1
NaCl 0 0
100
0.1
300
200
NaCl 10
100
400
Abb. 13.9. a) Messwerte des thermischen Ausdehnungskoeffizienten von NaCl als Funktion der Temperatur (Daten aus [33]). Die durchgezogene Linie stellt die Vorhersage von Gl.13.32 für einen konstanten Wert des Grüneisen-Parameters Γ = 1.5 dar. b) Für Γ = 1.5 nach Gl. 13.31 aus den Messdaten durch Integration von cˆv resultierende Werte des Phononendrucks.
Wir berechnen nun den thermischen Ausdehnungskoeffizienten βp eines würfelförmigen Kristalls mit dem Volumen V = L3 und kubischer Symmetrie der Kristallstruktur über die partielle Ableitung von −Kphonon (T, V, μ = 0) nach V und erhalten aus Gl. 12.26: . * + ∂Kphonon ∂ pphonon = −
=−
∂εj (q) q,j
=−
=−
∂V
∂V
ln 1 − exp εj (q)/kB T
kB T
∂V
q,j
1 exp εj (q)/kB T − 1
εj (q) 1 V ∂εj (q) . V εj (q) ∂V exp εj (q)/kB T − 1 q,j
Γj
(13.29)
Der dritte Faktor in der letzten Zeile von Gl. 13.29 repräsentiert den Beitrag der Schwingungsmode {q, j} zur Gesamtenergie. Zur Vereinfachung nehmen wir jetzt an, dass die dimensionslosen Grüneisen-Parameter Γj (q) := −
∂ ln(εj (q)) V ∂εj (q) =− εj (q) ∂V ∂ ln(V )
(13.30)
von q unabhängig sind. Tatsächlich zeigen Experimente, wie die in Abb. 13.9a für NaCl gezeigten Messungen von βp , dass die Γj für viele Festkörper nur schwach von der Temperatur abhängen, wie wir dies in Aufgabe 5.4 bereits ausgenutzt haben. Unter dieser Annahme liefern die Summen über q die Beiträge ej (T ) der verschiedenen Zweige
466 | 13 Bose-Systeme j der Dispersionsrelation zur Energiedichte des Phononensystems, und wir erhalten13 pphonon (T ) =
Γj ej (T )
(13.31)
j
Bedenken wir noch, dass cv,j (T ) = dej (T )/dT der Beitrag des j -ten Phononenzweiges zur Wärmekapazität pro Volumen ist, so erhalten wir mit Gl. 13.28 schließlich die Grüneisen-Formel für den thermischen Ausdehnungskoeffizienten: βp (T ) = κT
Γj cv,j (T ) .
(13.32)
j
Im Experiment findet man für die Grüneisen-Parameter Γj oft Werte zwischen 1 und 3. Bei Temperaturen oberhalb der Debye-Temperatur, wo cˆv dem Dulong-Petit-Gesetz folgt, ist βp von T unabhängig und das Volumen proportional zu T – damit sind wir zum Anfangpunkt unserer Diskussion thermischer Systeme in Abschnitt 2.2 zurückgekehrt, wo wir eben diese Eigenschaft zur Messung der (empirischen) Temperatur verwendet haben. Umgekehrt führt eine schnelle elastische Dehnung des Kristalls wie in unseren Experimenten in Abschnitt 4.4 (siehe Abb. 4.2) für βp > 0 zu einer Verschiebung der Phononen-Energien nach unten. Bei schneller (isentroper) Expansion kann die Temperatur der Kristalls nicht konstant bleiben, sondern muss abnehmen, weil die niedrigeren Anregungsenergien ε(q) sonst zu höheren Anregungsgraden und damit zu höheren Phononenzahlen und einer höheren Entropiedichte führen würden. Dieser Prozess ist ganz analog zur isentropen Entmagnetisierung eines Spinsystems oder zur isentropen Streckung einer Polymerkette – allein, dass bei Festkörpern das Vorzeichen des thermomechanischen Kopplungskoeffizienten βp (in der Regel) positiv ist. Wir wollen nun plausibel machen, warum der zunächst unanschaulich erscheinende Grüneisen-Parameter geeignet ist, um die beobachtete Ähnlichkeit der T Abhängigkeit von cˆv und βp zu beschreiben. In harmonischer Näherung beträgt die Verschiebung der Quasiteilchen-Energien bei einer Längenänderung in der xRichtung: ∂ε(q) dqx cs (q)qx ε(q) ∂ε(q) = =− =− , (13.33) ∂Lx ∂qx dLx Lx Lx wegen qx (Lx ) = 2π/Lx , wobei cs die Schallgeschwindigkeit ist. Die letzten beiden Gleichheitszeichen gelten nur für eine lineare Dispersion mit ε(q) = cs |q|. Da Lx = L(V ) = V 1/3 und ∂εj (q) ∂εj (q) dL(V ) ε(q) 1 ε(q) 1 =− = =− ∂V ∂L dV L 3L2 V 3
13 Dass die Γi in dieser Beziehung in guter Näherung von T und vˆ unabhängig sind, ist plausibel, wenn die Zustandsdichte des thermisch angeregten Quasiteilchengases im Festkörper näherungsweise durch ein Potenzgesetz beschrieben wird (Aufgabe 12.2).
13.2 Phononen im Debye-Modell
|
467
4.3
(a)
κ (10-11 Pa-1)
4.2
(b) isotherm
4.1 4.0
isentrop
Gl. 13.32 Gl. 13.34
3.9
NaCl 3.8
0
50
100
150 200 T (K)
250
300
Abb. 13.10. a) Isotherme (κT ) und isentrope (κS ) Kompressibilität von NaCl (nach [33]). Die Differenz zwischen κT und κS ist nach Aufgabe 5.1 durch βp und Cp gegeben. b) Vergleich des aus Gl. 13.32 und Gl. 13.34 berechneten Grüneisen-Parameters Γ.
erhalten wir nach Gl. 13.30 das Ergebnis Γ(harmon.) =
1 . 3
In in harmonischer Näherung reproduziert Gl. 13.31 also das vom Photonengas her (Gl. 13.11) bekannte und für Quasiteilchen mit einer linearen Dispersionsrelation typische Resultat14 pphonon (T ) =
1 e(T ) . 3
Allerdings ist die Anharmonizität des Wechselwirkungspotenzials zwischen den Ionenrümpfen so stark, dass die Änderungen der Federkonstante zwischen benachbarten Ionenrümpfen durch die thermische Ausdehnung nicht vernachlässigbar sind. Dies äußert sich im einfachsten Fall in einer Änderung der Schallgeschwindigkeit cs und liefert einen zweiten – in der Regel dominierenden – Beitrag zur Volumenabhängigkeit der Phononenenergien und zum Grüneisen-Parameter: ∂ε(q) ∂cs (q) ∂q =− |q| + cs . ∂Lx ∂Lx ∂Lx
√
Da die Schallgeschwindigkeit für große Wellenlängen gemäß cs = 1/ mκS mit der isentropen Kompressibilität zusammenhängt, benutzen wir die in Abbildung 13.10 gezeigten Messungen von κS , um die durch die T -Abhängigkeit von κS induzierte Änderung der Schallgeschwindigkeit cs zu bestimmen. Nach Gl. 13.30 können wir Γ gemäß Γ=
∂ ln(ε(q)) ∂ ln(cs (q)) ∂ ln(cs (T )) ∂ ln(T ) 1 1 = + = + ∂ ln(V ) ∂ ln(V ) 3 ∂ ln(T ) ∂ ln(V ) 3
(13.34)
14 Für eine quadratische Dispersionsrelation lautet das Ergebnis in Übereinstimmung mit früheren Rechnungen: p = 2/3 e (Aufgabe 12.2).
468 | 13 Bose-Systeme aus den gemessenen T -Abhängigkeiten von κS und V berechnen, wenn wir annehmen, dass die thermische Ausdehnung überwiegend von den niederenergetischen akustischen Phononen bestimmt wird. Der zweite Term beschreibt die Verschiebung der q -Werte bei Volumenänderung.15 Das Ergebnis ist in Abb. 13.10b zusammen mit den aus Gl. 13.32 mit Hilfe der Messdaten für cˆv und βp bestimmten Wert dargestellt. Wir erkennen, dass die beiden Werte für Γ bei hohen Temperaturen recht gut mit dem in Abb. 13.9 ermittelten Wert von Γ 1.5 zusammenpassen. Bei tiefen Temperaturen treten aber Abweichungen auf, welche darauf hinweisen, dass unsere vereinfachende Beschreibung mit Hilfe eines einzigen Grüneisen-Parameters Γ unzureichend ist. Für einen quantitativen Vergleich der gemessenen thermischen Ausdehnung mit der Theorie müssen die Γj (q) der verschiedenen Phononenzweige beispielsweise mit Hilfe der inelastischen Neutronenstreuung unabhängig bestimmt werden. Dabei zeigt sich, dass die Γj (q) sowohl positiv als auch negativ sein können, weil das Gitter bei Expansion sowohl weicher (wie in Abb. 13.10a) als auch härter werden kann. Im zweiten Fall resultiert eine negative thermische Ausdehnung (also besser eine thermisch induzierte Kontraktion). Dieser kontra-intuitive Fall tritt bei Kristallstrukturen mit niedriger Raumerfüllung auf, zum Beispiel für die bei vielen Halbleitern vorliegende Zinkblende-Struktur. Ein anderes Beispiel ist das hexagonale Tellur, welches in Richtung der sechs-zähligen Symmetrieachse einen negativen, senkrecht dazu aber einen positiven Grüneisen-Parameter hat. Die Kopplung zwischen den thermischen und den mechanischen Eigenschaften des Kristallgitters ist auch verantwortlich für das „Weichwerden“ (engl.: „mode softening“) bestimmter Phononenmoden in der Nähe struktureller Phasenübergänge im Kristall. Diese müssen spätestens dann auftreten, wenn die Rückkopplung so stark wird, dass die Stabilitätsbedingung Gl. 7.7 verletzt wird. Zusammenfassend halten wir fest, dass sich die thermische Ausdehnung von Festkörpern durch den Druck des Phononengases anschaulich erklären lässt. Die Argumentation des Bernoulli-Modells zur „mechanischen“ Erklärung des Drucks von Atom- und Molekülgasen durch die Reflexion von Gasteilchen an den Wänden und dem daraus resultierenden Impulsübertrag auf die Wände (Abschnitt 3.3) lässt sich auf die Phononen im Festkörper und deren Reflexion an den Innenwänden des Kristalls übertragen.16 Die thermische Expansion führt aufgrund der Anharmonizität des Kristallgitters in der Regel zu einer Abnahme der Phononenenergien, welche zu
15 Aufgabe 5.4 legt nahe, dass die Schallgeschwindigkeit der akustischen Phononen gemäß einem durch Γ kontrollierten Potenzgesetz vom Molvolumen vˆ = V /N abhängen sollte. 16 Der in Abschnitt 13.4 dargestellte Fontäneneffekt im supraflüssigen Helium stellt eine weitere, wesentlich spektakulärere experimentelle Manifestation des Phononendrucks dar.
13.2 Phononen im Debye-Modell
|
469
einer Zunahme der Phononenzahlen führt und damit den Phononendruck und die thermische Ausdehnung wesentlich verstärkt (Γ > 1/3).17 Abschließend weisen wir darauf hin, dass sich unsere am Beispiel der Phononen angestellten Überlegungen auch auf andere Quasi-Teilchen im Festkörper übertragen lassen. Dies gilt für die im nächsten Kapitel dargestellten Elektronen in Metallen, aber auch für die Magnonen in (anti)-ferromagnetischen Materialien, deren Dispersionsrelation von der Austausch-Konstanten J abhängt. In allen diesen Fällen sind die Energien der Quasiteilchen stark von den Gitterabständen und damit vom Volumen abhängig. Dies bedeutet, dass starke Änderungen im Anregungsspektrum, zum Beispiel in der Nähe von Phasenübergängen, als Anomalien in den thermodynamischen Messgrößen wie der Wärmekapazität, der Kompressibilität und der thermischen Ausdehnung widerspiegeln und zu spektroskopischen Experimenten komplementäre Informationen liefern.
13.2.4 Wärmeleitfähigkeit durch Phononen Nachdem die thermischen Eigenschaften des Phononensystems im Gleichgewicht durch das Modell des Quasiteilchengases gut beschrieben werden, liegt es nahe, auch seine Transporteigenschaften mit seiner Hilfe zu modellieren. Dazu greifen wir auf die in Abschnitt 8.6 abgeleitete Beziehung 8.43 zurück, welche die Wärmeleitfähigkeit λ mit der Wärmekapazität pro Volumen und der Diffusionskonstante D verknüpft. Den Diffusionskoeffizienten der Phononen berechnen wir mit Hilfe von Gl. 8.4, wobei wir für die mittlere Geschwindigkeit die Schallgeschwindigkeit cs einsetzen: λphonon (T ) = cv (T )Dphonon (T ) = cv (T ) ·
1 cs Λphonon (T ) . 3
(13.35)
Der Wert der mittleren freien Weglänge ist nach Gl.8.6 Λ(T ) =
1 σstreu nst (T )
17 Das Phänomen der negativen thermischen Ausdehnung zeigt, dass die Rückwirkung der Ausdehnung des Kristalls auf die Energien der Quasi-Teilchen auch entgegengesetzt sein kann. Das kontraintuitive der negativen thermischen Ausdehnung besteht darin, dass wir instinktiv davon ausgehen, dass die Teilchenzahlen bei der Expansion konstant bleiben und die im Quasiteilchen-System enthaltene Energie mit den εj (q) zunimmt. Tatsächlich nimmt die Energie bei der Expansion aber ab, weil die durch die Bose-Funktion gegebenen Teilchenzahlen mit den εj (q) exponentiell abnehmen, sodass E(T, V ) =
q,j
(B) (T, V j (q)
Nε
)εj (q, V )
insgesamt abnimmt. Steigen die Energien der Quasiteilchen bei Expansion des Kristalls an, so kann das Phononensystem die bei Erwärmung angebotene Energie und Entropie nur dann aufnehmen, wenn sich der Kristall zusammenzieht (Γ < 0).
470 | 13 Bose-Systeme
(a)
(b) LiF
Silizium λ (W cm-1 K-1)
100 λ (W cm-1 K-1)
10 2
10 L (mm) 1
7.25 4.00 2.14 1.06
0.1 1
10 T (K)
10 0 10 -2 10 -4
100
10 -6
poliert aufgeraut 0.1
1
T (K)
10
100
Abb. 13.11. a) Wärmeleitfähigkeit λ(T ) hochreiner LiF-Kristalle mit quadratischem Querschnitt L2 . Die Probenoberflächen wurden durch Sandbestrahlung aufgeraut. b) Wärmeleitfähigkeit eines Siliziumkristalls mit sehr gut polierter beziehungsweise aufgerauter Oberfläche. Bei hohen Temperaturen wird λ in beiden Fällen von der Probengeometrie unabhängig (nach [32]).
durch die Dichte der Streu-Partner und den entsprechenden Streuquerschnitt gegeben. Neben der Streuung an statischen Gitterdefekten wie Punktdefekten, Korngrenzen oder der Oberfläche des Kristalls sind, wegen der Gitteranharmonizität, auch Phonon-Phonon-Streuprozesse möglich. Der dominierende Prozess ist hier die Dreifachstreuung, bei der entweder zwei einlaufende Phononen vernichtet und ein auslaufendes Phonon erzeugt werden oder umgekehrt. Ein Experiment zur Temperaturabhängigkeit von λphonon ist in Abb. 13.11 dargestellt. Wegen der unterschiedlichen Temperaturabhängigkeiten der verschiedenen Streuprozesse müssen verschiedene Temperaturbereiche unterschieden werden: 1. T ΘD : Λ−1 phonon const. In diesem Fall ist Λphonon durch die Kristallabmessungen (perfekte Kristalle ohne Gitterdefekte) oder durch die Dichte nst der Kristalldefekte (gestörte Kristalle) gegeben. Die Phonon-Phonon-Streuung ist zwar vorhanden, reduziert aber nicht die Wärmeleitfähigkeit, weil der Impuls im Phononensystem bleibt und nicht an ein anderes System abgegeben werden kann. Der Wirkungsquerschnitt der Streuung an Defekten, die viel kleiner als die Wellenlänge sind, ist σ ∝ ε4 gemäß der Rayleigh-Streuung.18 Punktdefekte sind bei tiefen Temperaturen ebenfalls nicht effektiv, weshalb die Temperaturabhängigkeit der Wärmeleitfähigkeit durch den Faktor cv ∝ T 3 bestimmt wird und mit T zunächst stark zunimmt. Der Absolutwert von λ hängt stark davon ab, ob die Kristalloberflächen glatt poliert oder rauh sind; die spiegelnde Streuung an glatten Oberflächen reduziert den Wärmestrom
18 Die Streuung von Licht an den Atomen der Atmosphäre folgt demselben ε4 -Gesetz.
13.3 Massive Bose-Gase | 471
2.
3.
nur wenig und bewirkt in isotopenreinen Proben eine extrem hohe, fast ballistische Wärmeleitfähigkeit. 0.1ΘD T 0.5ΘD : Λ−1 phonon ∝ exp ΘD /2T Im Bereich mittlerer Temperaturen nimmt die Zahl der Phononen mit Impulsen am Rande der Brillouin-Zone exponentiell zu. Die Streuung solcher Phononen kann in der Erzeugung von Phononen mit Impulsen resultieren, die außerhalb der 1. Brillouin-Zone liegen. Da die entsprechenden q -Vektoren Wellenlängen entsprechen, die kleiner als der Gitterabstand sind, müssen diese q -Vektoren in die 1. Brillouin-Zone „zurückgefaltet“ werden. Das bedeutet, das auslaufende Phonon hat den Impuls q = (q − G), wobei G ein Vektor des reziproken Gitters19 der Kristallstruktur ist. Physikalisch bedeutet dies, dass der Impuls G auf den Schwerpunkt des Gitters und nur der Impuls q auf das neu erzeugte Phonon übertragen wird. In diesem Fall spricht man von Umklapp-Streuung, weil die Geschwindigkeit v k des neu erzeugten Phonons denen der einlaufenden, bei dem Streuprozess vernichteten Phononen entgegengesetzt sein kann. Dies ist ein Spezialfall der Bragg-Streuung an periodischen Strukturen, für die der Impulsübertrag auf den Schwerpunkt des Gitters in Vielfachen der Basisvektoren des reziproken Gitter quantisiert ist. Derselbe Effekt tritt bei der inelastischen Streuung von Neutronen am Gitter auf. Nur durch die Umklapp-Prozesse kann das Phononensystem als Ganzes Impuls an ein anderes System, hier das statische Gitter, abgeben. Damit ergibt sich ein ausgeprägtes Maximum in der Temperaturabhängigkeit der Wärmeleitfähigkeit, oberhalb dessen λphonon exponentiell abnimmt. T 0.5ΘD : Λ−1 phonon nphonon ∝ 1/T Bei hohen Temperaturen nimmt die Zahl der Phononen, für die Umklapp-Streuung möglich ist, entsprechend Gl. 13.20 nur noch linear mit der Temperatur zu. Zusammen mit der oberhalb ΘD konstanten Wärmekapazität führt dies zu einer Abnahme der Wärmeleitfähigkeit gemäß λ ∝ 1/T .
13.3 Massive Bose-Gase 13.3.1 Die Bose-Einstein Kondensation Worin äußert sich nun der bosonische Charakter zusammengesetzter massiver Teilchen, zum Beispiel von Atomen mit ganzzahligem Gesamtspin wie etwa 4He oder Alkali-Atomen wie etwa 7Li, 39K oder 87Rb? Der wesentliche Unterschied zu den bisher besprochenen Bose-Systemen ist der, dass die Gesamt-Teilchenzahl N in diesem Fall in der Regel nicht thermisch erzeugt, sondern fest vorgegeben ist. Dies hat zur
19 Für Details verweisen wir auf die Lehrbücher der Festkörperphysik, zum Beispiel [32; 31].
472 | 13 Bose-Systeme Konsequenz, dass die Werte des chemischen Potenzial stets endlich und kleiner als die Energie ε0 des elementaren Bose-Systems mit der niedrigsten Energie sein müssen.20 Erhöht man die Dichte des Gases durch isotherme Kompression oder kühlt bei fester Teilchenzahl ab, so wird die durch Gl. 12.37 gegebene Grenze zum entarteten Bereich überschritten, und der Wert von μ(T, n) nähert sich von negativen Werten her der für Bosonen charakteristischen Grenze μ = ε0 an (Abb. 13.12). Um die Folgen der Annäherung von μ an ε0 zu untersuchen, betrachten wir wieder die thermische Zustandsgleichung für Bosonen mit der Dispersionsrelation ε(k) = (k)2 /(2m) ˆ und der Zustandsdichte (Abschnitt 11.9), durch g(ε) =
(2m) ˆ 3/2 √ ε 4π 2 3
gegeben. Setzen wir diese in Gl. 12.36 ein, so ergibt sich im Grenzfall μ → ε0 (2m) ˆ 3/2 nGas (T, μ = ε0 ) = 4π 2 3 =
∞
√
(B)
εNε
(T, μ = ε0 ) dε
0
(2mk ˆ B T )3/2 4π 2 3
∞ ·
√
xdx exp(x) − 1
0
Γ(3/2)ζ(3/2)=
=
√
π 2 ·2.612
2.612 = 2.612 T 2/3 jtrans . λ3T
(13.36)
Im Grenzfall μ → ε0 ist nGas offenbar eine Funktion der Temperatur und geht gemeinsam mit T stetig gegen Null! Andererseits ist die gesamte Teilchendichte n fest vorgegeben. Gleichung 13.36 definiert über
3/2 3/2
n = nGas (TB ) = 2.612 TB jtrans = 2.612
mk ˆ B TB 2π 2
offenbar eine kritische Temperatur TB (n) des Bose-Gases
2/3 TB (n) :=
n 2.612 jtrans
=
2
3π
· 2.6122/3
·
3π 2 2 2/3 , n 2m ˆ
(13.37)
bei der die vorgegebene Teilchendichte in der Gasphase gerade noch untergebracht werden kann. Unterhalb von TB bricht die Kontinuumsnäherung (Gl. 12.28) der thermischen Zustandsgleichung zusammen, da der aus ihr resultierende Wert von n(T, μ → ε0 ) trotz der Divergenz der Bose-Funktion kleiner als die vorgegebene Teilchendichte ist.21
20 In diesem Abschnitt bezeichnet ε0 nicht die Bindungsenergie oder die Ruhenergie, sondern der Nullpunkt der Energie ist durch ε(k = 0) := 0 definiert. 21 Dies liegt daran, dass die im Integranden von Gl. 12.28 bei μ → ε0 auftretende Wurzelsingularität √ (B) von g(ε)Nε ∝ 1/ ε integrabel ist.
13.3 Massive Bose-Gase | 473
gi
¡
3 1
+ (T»TB)
0 + (T
¡ 10
20
30
¡ ¡
TB)
Abb. 13.12. Energien εi und Entartungsgrade der ersten 32 elementaren Bose-Systeme in einem kubischen Potenzialkasten. Das chemische Potenzial μ nähert sich für T → 0 von links dem Wert ε0 .
Was ist die Ursache für das Versagen von Gl. 12.36? In der Praxis wird stets ein endliches Volumen V untersucht. Das bedeutet, dass die Diskretheit der charakteristischen Energien εi der elementaren Bose-Systeme bei hinreichend tiefen Temperaturen nicht ignoriert werden kann (wie dies die Gl. 12.36 zugrundeliegende Kontinuumsnäherung tut), sondern im Grenzfall μ → ε0 spürbar wird (Abb. 13.12). Für einen kubischen Potenzialkasten mit V = L3 ist ε0 durch die Lokalisierungsenergie der Teilchen gegeben: ( k0 ) 2 1 ε0 = 3
∝
, mV ˆ 2/3 wobei k0 = π/L der für die Randbedingung ψ((rrand ) = 0 kleinste mögliche Wellenvektor ist. Für eine feste Teilchenzahl und eine gegebene Teilchendichte n = N/V hängt V und damit ε0 mit der kritische Temperatur TB (n) nach Gl. 13.37 durch TB (n) =
2m ˆ
ε0 ε · 0.112 N 2/3 0 kB kB
(13.38)
zusammen. Für makroskopische Teilchenzahlen ist die kritische Temperatur also viel größer als der typische Niveauabstand und die Lokalisierungsenergie ε0 /kB . Die Annäherung von μ(T, n) an ε0 führt dazu, dass das elementare Bose-System mit der niedrigsten Energie (der Grundzustand des zugrundeliegenden Ein-Teilchensystems) wegen der im Grenzfall μ → ε0 auftretenden Divergenz der Bose-Funktion schließlich alle Teilchen des Gesamtsystems aufnimmt, während die Teilchendichte ngas in den angeregten Zuständen mit weiter abnehmender Temperatur nach Gl. 13.36 wie
ngas (T ) = n ·
T TB (n)
3/2
(13.39)
gegen Null geht. Wir berechnen die Teilchenzahl N0 im Grenzfall μ → ε0 : 1 exp [(ε0 − μ)/kB T ] − 1 1 k T = = B . 1 + (ε0 − μ)/kB T + · · · − 1 ε0 − μ
N0 (T, μ) =
(13.40)
474 | 13 Bose-Systeme N0 wächst mit μ → ε0 dramatisch an und ist nach oben nur durch N beschränkt. Wir wollen nun die Zahl N1 der Teilchen in dem (dreifach entarteten) elementaren BoseSystem mit der nächsthöheren Anregungsenergie ε1 (Abb. 13.12) bestimmen und mit N0 vergleichen. Für einen kubischen ebenen Potenzialtopf beträgt ε1 =
2 π 2 2m ˆ
L
2 2 + 1 2 + 1 2 = 2 · ε0 .
Da gemäß Gl. 13.38, kB TB ε1 = 2 · ε0 ist, erhalten wir N1 =
1 k T = B exp [(ε1 − μ)/kB T ] − 1 ε1 − μ
und mit Gl. 13.40 damit für das Verhältnis k T ε1 − μ N0 2ε − μ ε0 N ε = B = 0 =1+ =1+ 0 0 . N1 ε0 − μ kB T ε0 − μ ε0 − μ kB T
Für T TB /2 gilt N0 N/2 und es folgt mit Gl. 13.38 N ε0 N 1/3 N0 1+ . N1 kB T B 0.112
(13.41)
Bereits bei Temperaturen T TB /2 ε0 /kB und einer makroskopischen Zahl N von Teilchen ist N0 um Größenordnungen höher als N1 und alle anderen Ni ! Dies bedeutet offenbar, dass der Term mit ε0 in der Summe über alle elementaren BoseSysteme in (Gl.12.26) separat berücksichtigt werden muss. Dagegen werden die übrigen elementaren Bose-Systeme mit charakteristischen Energien ε > ε0 , die den angeregten Zuständen des zugrundeliegenden Ein-Teilchensystems entsprechen, im Rahmen der Kontinuumsnäherung durch Gl. 12.27 auch für T < TB (n) näherungsweise korrekt beschrieben. Auf diese Weise erhalten wir die modifizierte Zustandsgleichung ∞ N = N0 (T ) + V ·
(B)
g(ε)Nε
(T, μ = ε0 )dε
0
= N0 (T ) + Ngas (T ) = N0 (T ) + N
T TB (n)
3/2 ,
wenn wir Gl. 13.37 in Gl. 13.36 einsetzen. Diesen Ausdruck können wir nach N0 auflösen und erhalten schließlich
3/2 T für T < TB . N0 (T ) = N 1 − (13.42) TB (n)
In Abb. 13.13 sind die T -Abhängigkeiten von N0 , Ngas und μ skizziert. In idealen BoseSystemen gibt es also eine kritische Temperatur TB (n), unterhalb derer die Teilchenzahl N0 des elementaren Bose-Systems mit der niedrigsten Anregungsenergie (im
13.3 Massive Bose-Gase | 475
N / N0
1 N0
a)
0.5
105 (μ - ε0) / ε0
Ngas 0 -2
b)
N = 10 000 Teilchen -4
0
0.5 T / TB (n)
1
Abb. 13.13. a) Relative Teilchenzahl im Bose-Einstein-Kondensat N0 /N und in der das Kondensat umgebenden thermischen Wolke Ngas /N als Funktion der auf die Bose-Einstein-Temperatur TB (n) normierten Temperatur. b) Mittels Gl. 13.42 aus der Bose-Funktion berechnetes chemisches Potenzial μ(T ). Man beachte, dass die μ-Werte für T < TB (n) extrem dicht unterhalb ε0 liegen.
Gegensatz zu allen anderen) einen nicht-verschwindenden Bruchteil der gesamten 1 Teilchenzahl N = i Ni beträgt. Im Grenzfall T → 0 gilt sogar N0 = N . Für Temperaturen T > TB gilt dagegen für alle i einschließlich i = 0, dass Ni /N → 0 wenn N und V bei konstanter Dichte n = N/V gegen unendlich gehen. Das Einzigartige dieses Phänomens liegt darin, dass die Bildung des Bose-Einstein-Kondensats, das heißt, die „makroskopische Besetzung des Grundzustands“, nicht erst bei der dem energetischen Abstand der „Ein-Teilchenzustände“ entsprechenden Temperatur T ε0 /kB (wie man es nach der Boltzmann-Verteilung erwarten würde), sondern schon bei den um Größenordnungen höheren Temperaturen TB ε0 /kB · N 2/3 eintritt! Diese Überlegungen legen nahe, Bose-Gase für T < TB (n) in zwei Teilsysteme zu zerlegen, die miteinander im thermischen und chemischen Gleichgewicht stehen: • in die Gesamtheit aller elementaren Bose-Systeme mit εi > ε0 , das heißt die „thermisch angeregte Quasi-Teilchen Wolke“ mit einer endlichen Entropie SA , und • in das elementare Bose-System mit ε = ε0 , das heißt das Bose-Einstein-Kondensat mit der vernachlässigbaren Entropie SK ≪ SA .22 Während das System der thermischen Anregungen in vielen Eigenschaften einem idealen Gas ähnlich ist, existiert das System der „Teilchen im Grundzustand“ nur unterhalb der kritischen Temperatur TB und verhält sich wie ein Teilchenreservoir und damit wie ein Kondensat. Selbst in Abwesenheit jeglicher Wechselwirkungen zwischen
22 Wir folgen hier der üblichen Terminologie, nach der der Grundzustand des „Einteilchen-Systems“ (das heißt die Grundmode des Materiefelds in dem betrachteten Potenzial) und nicht etwa der Grundzustand des Vielteilchensystems (das „Vakuum“) gemeint ist. Diese Ausdrucksweise ist strenggenommen etwas irreführend, weil vom Standpunkt der Quantenfeldtheorie aus alle Teilchen, auch die mit der niedrigsten Energie ε0 , angeregten Zuständen des Materiefeldes entsprechen. In diesen semantischen Schwierigkeiten äußert sich wieder der schon mehrfach angesprochene Bedeutungswandel des Wortes „Teilchen“.
476 | 13 Bose-Systeme den Teilchen weist das ideale Bose-Gas bei T = TB also viele Züge eines Phasenübergangs, eben der Bose-Einstein-Kondensation, auf. ähnlich wie bei den üblichen Phasenübergängen zwischen einer Gasphase und einer kondensierten Phase, geht die Dichte der Gasphase mit T → 0 gegen Null, und es bleibt allein das Kondensat übrig. Man kann zeigen, dass dessen Beitrag zur Entropie (im Gegensatz zu seinen Beitrag zur Teilchenzahl) viel schneller gegen Null geht als der Beitrag der Anregungen. Wie wir bereits am Ende von Abschnitt 12.3 festgestellt haben, ist die Zerlegung eines Vielteilchensystems in ein Grundsystem mit S = 0 und ein bei ausreichend tiefen Temperaturen stets ideales (weil beliebig verdünntes) System der thermischen Anregungen typisch für die Annäherung an den absoluten Nullpunkt. Sie tritt auch bei den im nächsten Kapitel besprochenen Fermi-Systemen auf.
13.3.2 Experimente zur Bose-Einstein-Kondensation Die Bose-Einstein-Kondensation war nach ihrer theoretischen Vorhersage im Jahre 1925 70 Jahre lang eine theoretische Spekulation, bis es 1995 der Arbeitsgruppe um Cornell und Wiemann [35] sowie der Gruppe um Ketterle [36] erstmals gelang, solche Kondensate experimentell herzustellen. Dieser fundamentale Fortschritt wurde 2001 durch den Nobelpreis geehrt. Bei den Bose-Einstein-Kondensaten handelt es sich um makroskopische Quantenobjekte. Diese ermöglichen es, quantenmechanische Phänomene fast „mit der Lupe“ zu beobachten. Daher hat dieses Forschungsfeld seitdem einen stürmischen Aufschwung erlebt. Experimentell wurden dazu extrem dünne (n nLuft (300 K)/1000) Dämpfe (bisher überwiegend Alkalimetalle) bei T 100 nK untersucht. Die experimentelle Schwierigkeit ist dabei, das Gas zu den extrem tiefen, in Abb. 12.2 als Funktion des Atomgewichts m ˆ dargestellten Temperaturen abzukühlen, ohne dass das Gas dabei in konventioneller Weise kondensiert. Um dies zu erreichen, muss die Bildung von Kondensationskeimen ausgeschlossen werden. Zunächst sind dazu spezielle Einschlussverfahren wie zum Beispiel magnetische Fallen notwendig, die keine materiellen Wände benutzen, weil diese natürlich ebenfalls Kondensationskeime darstellen. Weiterhin muss das Gas verdünnt genug sein, um die Wahrscheinlichkeit von Dreierstößen sehr klein zu halten. Im Gegensatz zu Zweierstößen, bei denen das ZweiTeilchensystem keine Energie abgeben kann, kann bei einem Dreierstoß eines der Teilchen Energie forttragen, während die beiden anderen einen gebundenen Zustand eingehen. Wenn solche gebundenen Zustände auftreten, kommt es sehr schnell zu einer weiteren Agglomeration von Atomen und damit zur (konventionellen) Kondensation. Zur eigentlichen Abkühlung wird das Verfahren der Laserkühlung benutzt, bei dem ein Teil der Atome in einem aus einen Verdampfungsofen austretenden Atomstrahl mittels eines Lasers abgebremst werden. Die von den Atomen absorbierten Laser-Photonen reduzieren den Impuls pro Photon im Mittel um q photon , weil die
13.3 Massive Bose-Gase | 477
(a)
Ofen
(c) v
(d)
Laser Fscatt
(b)
(e)
ε
(f)
ε
(g)
ε
εemission 0
200 v (m/s)
400
Nε
Nε
Nε
Abb. 13.14. Laser- und Verdampfungskühlung: a) Abbremsung der von einem Ofen thermisch emittierten Atome durch Absorption gerichteter und Emission isotrop verteilter Photonen. b) Geschwindigkeitverteilung nach Abbremsung der mit dem Laserlicht resonanten Atome. c),d) Die Tiefe der magneto-optischen Falle wird abwechselnd erniedrigt (Emission hochenergetische Atome) und erhöht (Thermalisierung des Rests). e)–g) Entsprechende Energieverteilungen (nach [34]).
auf die Absorption folgende Emission statistisch in alle Raumrichtungen erfolgt und daher im zeitlichen Mittel keine Beschleunigung bewirkt. Weil die Linienbreite des Lasers um Größenordnungen kleiner als die Doppler-Verbreiterung der atomaren Linien bei der Ofentemperatur (um 1000 K) ist, kann nur ein kleiner Bruchteil der Atome den Laser-Photonen resonant angeregt werden. Die Effizienz der Abbremsung ist durch die Lebensdauer (τ 30 ns) des angeregten Zustands begrenzt, da die Zeit zwischen zwei Absorptionsprozessen nicht kleiner sein kann. Bei Anfangsgeschwindigkeiten von einigen 100 m/s beträgt die typische Abbremsstrecke etwa einen Meter. Für Na-Atome resultieren Beschleunigungen von etwa 105 g , wobei g = 9.81 m/s2 die Fallbeschleunigung ist. Die Frequenz des Lasers muss im Verlauf der Abbremsung wegen der Doppler-Verschiebung nachgeführt werden („chirp“), um stets dieselbe Atomgruppe abzubremsen. Nach der Abbremsung limitiert die Doppler-Begrenzung die erreichbare Temperatur der verbleibenden Atome gemäß kB T D =
ΓAtom 2
,
(13.43)
wobei ΓAtom = 1/τ die natürliche Linienbreite angeregten Zustands ist. Typische durch Laserkühlung erreichbare Endtemperaturen betragen 240 μK entsprechend thermischen Geschwindigkeiten von 0.5 m/s. Um die Atomwolke zu speichern und weiter abzukühlen, verwendet man magnetische Fallen, welche die in einem inhomogenen Magnetfeld auf das magnetische Moment des Elektronenspins wirkende Kraft auf die Atome ausnutzt. Solche Fallen bestehen aus einer Kombination von mehreren Helmholtz-Spulenpaaren. Mit ihnen
478 | 13 Bose-Systeme wird ein Verfahren ähnlich der Verdampfungskühlung von Flüssigkeiten angewendet: Startend mit hohen Feldgradienten, welche einem tiefen Fallenpotenzial entsprechen, wird der Spulenstrom und damit die Tiefe des Potenzialminimums kurz verringert und dann wieder erhöht. Dabei entkommen Atome in das umgebende Vakuum und hinterlassen eine Nichtgleichgewichts-Verteilung in der Falle, bei welcher der hochenergetische Teil der Bose-Verteilung fehlt. Durch Stöße zwischen den Atomen wird das Gleichgewicht bei einer niedrigeren Temperatur wieder hergestellt. Dieser Vorgang wird wiederholt, wobei die Tiefe des Fallenpotenzials langsam verringert wird. Auf diese Weise lassen sich bisher Temperaturen bis hinab in den Pikokelvin(!)Bereich erreichen. Durch solche Experimente lassen sich Atomgase mit Temperaturen unterhalb der Bose-Entartungstemperatur erzeugen und die Bose-EinsteinKondensation experimentell beobachten. Die realisierbare Zahl der Atome im Kondensat liegt typischerweise zwischen 104 und 106 . Zur Messung der Impulsverteilung in der Wolke werden dabei wieder optische Techniken – im Prinzip der Schattenwurf der Atomwolke – verwendet. Das Fallenpotenzial wird ausgeschaltet und die im Gravitationsfeld frei fallende Wolke mit einer Wiederholungsrate im ms-Bereich photographiert. Die Messzeit ist dabei natürlich durch die realisierbare Fallstrecke begrenzt. Aus der zeitlichen Entwicklung des Dichteprofils in der Wolke kann auf die Impulsverteilung zurückgeschlossen werden. Für T < TB expandiert die das Bose-EinsteinKondensat umgebende thermische Wolke wegen der höheren thermischen Geschwindigkeiten viel schneller als das Kondensat, dessen Impulsverteilung allein durch die Heisenberg’sche Unschärferelation gegeben ist. Bei einer Falle mit einem parabolischen Potenzial wird der Grundzustand der Atome in diesem Potenzial durch die Grundzustandswellenfunktion eines harmonischen Oszillators beschrieben. Diese ist eine Gauss-Funktion mit der Halbwertsbreite π Δx =
mω ˆ
,
wobei die Schwingungsfrequenz der Atome in einer typischen Falle etwa 10 Hz–100 Hz beträgt. Dies führt auf eine räumliche Ausdehnung des Oszillator-Grundzustands und damit der Bose-Einstein-Kondensats von einigen 10 μm. Die entsprechende Impulsunschärfe ist so gering, dass das Kondensat während der beobachtbaren Fallzeit von einigen 10 ms keine merkliche Expansion zeigt, während die thermische Wolke in dieser Zeit mit der thermischen Geschwindigkeit v 2 = 3kB T /m ˆ expandiert. In ihren bahnbrechenden Experimenten gelang es Cornell, Wieman [35] und Ketterle [36], die Bose-Einstein-Kondensation in Rubidium- und Kalium-Dämpfen erstmals experimentell zu realisieren. In Abb. 13.15 ist die entsprechende Evolution des Dichteprofils einer ultrakalten Atomwolke mit ca. 7 · 105 Kaliumatomen gezeigt. Oberhalb der Übergangstemperatur bei TB 2 μK liegt eine (ebenfalls Gauss-förmige) thermisch verbreiterte Maxwell-Verteilung vor. Bei der kritischen Temperatur TB tritt zusätzlich ein scharfes Maximum in Impulsverteilungsfunktion auf, welches
13.4 Quasiteilchen in suprafluidem 4 He
(a)
(b)
|
479
(c)
0.9 mm Abb. 13.15. Evolution des Dichteprofiles einer Wolke mit ca. 7 · 105 Kalium-Atomen a) kurz oberhalb des Übergangspunktes, b) am Übergangspunkt bei ca. 2 μK, und c) nach weiterer Verdampfungskühlung (nach [36]).
bei noch tieferen Temperaturen übrig bleibt und die Bevölkerung des elementaren Bose-Systems mit der niedrigsten Energie – des Oszillator-Grundzustands – mit einer makroskopischen Zahl von Teilchen anzeigt – genauso, wie es Bose und Einstein vor über 85 Jahren vorhersagten. Allein die Exponenten der Temperaturabhängigkeiten sind in einem parabolischen Einschlusspotenzial etwas andere als in dem von uns der Einfachheit halber betrachteten ebenen Potenzialkasten. In der Folgezeit wurden diese Experimente von vielen Gruppen weiter ausgebaut und verfeinert. Es wurden nicht nur einzelne Kondensate, sondern mehrere – bis hin zu durch Interferenz hergestellten optischen Gittern – untersucht, die Kondensate wurden zu Drähten verformt und in Rotation versetzt. Es ist nicht übertrieben zu sagen, dass hier ein neues Teilgebiet der Physik der kondensierten Materie entstanden ist, in welchem neben dem Studium von bisher nur in Gedankenexperimenten zugänglichen Modellsystemen auch völlig neue Phänomene beobachtbar sind. Die experimentelle Beobachtung der Bose-Einstein-Kondensation illustriert also in eindrucksvollster Weise die Abschnitt 12.3 zugrundeliegenden physikalischen Ideen, insbesondere die Zerlegbarkeit von idealen Bose-Gasen in elementare BoseSysteme.
13.4 Quasiteilchen in suprafluidem 4 He In diesem Abschnitt wollen wir einige Eigenschaften des flüssigen Heliums besprechen. Vom atomistischen Standpunkt aus sind die flüssigen Phasen der beiden Helium-Isotope 3He und 4He einfache Flüssigkeiten – die He-Atome weisen bei At-
480 | 13 Bose-Systeme
a)
b) 3 d (Pa s)
(J mol-1K-1)
60
40
20
2
1 Th
0
1
1.5
2 T (K)
4He
Th 2.5
3
0
0
1
2 T (K)
3
4
Abb. 13.16. a) Wärmekapazität von 4 He bei Normaldruck. b) Messung der Viskosität von 4 He bei tiefen Temperaturen, bestimmt mit Hilfe von Durchfluss-Experimenten mit dünnen Kapillaren. Das sprunghafte Verschwinden der Viskosität und die ausgeprägte λ-förmige Anomalie zeigen den Übergang in die suprafluide Phase an. (nach [21])
mosphärendruck eine extrem schwache van der Waals-Wechselwirkung auf, sie sind chemisch inert und kommen dem Modell harter Kugeln sehr nahe. Die schwache Wechselwirkung hat gemeinsam mit der geringen Masse m ˆ eine wichtige Konsequenz: 4 Bis hin zu Drucken von 25 bar ( He) beziehungsweise 33 bar ( 3He) bleibt Helium bis hin zum absoluten Nullpunkt flüssig. Dies ist der wegen der kleinen Masse sehr hohen quantenmechanischen Nullpunktsenergie geschuldet, welche verhindert, dass die Atome durch die attraktive Komponente der Wechselwirkung auf Gitterplätzen lokalisiert werden können. Die schwache Kohäsion bewirkt eine anormal hohe Kompressibilität und eine starke thermische Ausdehnung. Die Helium-Flüssigkeiten eröffnen die Möglichkeit, elektrisch neutrale Flüssigkeiten bei sehr niedrigen Temperaturen zu untersuchen, sodass die Bose- oder FermiNatur der elementaren Teilsysteme, aus denen sie bestehen, zutage treten muss. Dabei treten ähnliche makroskopische Quantenphänomene wie bei Gasen auf, insbesondere ein der Bose-Einstein-Kondensation ähnlicher Phasenübergang beim 4He und die Fermi-Entartung beim 3He.
13.4.1 Die Suprafluidität von 4 He Zunächst wollen wir das Bose-System 4He betrachten, welches bei 4.21 K flüssig wird. Die in Abb. 13.16a dargestellte Messung der spezifischen Wärmekapazität zeigt ein ausgeprägtes Maximum nahe Tλ = 2.18 K. Die extrem scharfe Spitze ist typisch für einen Phasenübergang 2. Ordnung von einer flüssigen Phase zur anderen. Die Natur des Phasenübergangs blieb fast 30 Jahre nach seiner Entdeckung unklar. Erst 1938 entdeckten Kapitza und gleichzeitig Allen und Misener, dass die Viskosität der Flüssigkeit unterhalb von Tλ sehr schnell auf unmessbar kleine Werte fällt (Abb. 13.16b). Diese exoti-
13.4 Quasiteilchen in suprafluidem 4 He
| 481
1 mS m
mN m
0.5
0
1
1.5
2 T (K)
T
Abb. 13.17. Temperaturabhängigkeit der relativen Massendichten mS /m und mN /m der Supra- und der Normalkomponente im Zweiflüssigkeitsmodell. Man beachte, dass diese nicht einfach die Mengenverhältnisse von Atomen widerspiegeln, sondern dass mN über die in Abschnitt 13.4.4 beschriebenen Experimente (Datenpunkte) und die dahinter stehende Theorie sowie mS über mS = m − mN definiert sind.
sche Zustand der Materie wurde deshalb suprafluid genannt, weil er Strömungen der Flüssigkeit erlaubt, die nicht durch viskose Reibung gebremst werden. Dieser Zustand, der bis hin zu T → 0 bestehen bleibt, ist rein quantenmechanischer Natur – er wird durch eine makroskopische Wellenfunktion Ψ beschrieben. Die Phase ϕ dieser Wellenfunktion, die in normalen Systemen von Dekohärenz durch Streuprozesse geplagt wird, ist in diesem System über makroskopische Abstände und beliebige Zeiten hinweg wohldefiniert und bestimmt die Stromdichte j N in der Supraflüssigkeit gemäß der quantenmechanischen Stromformel j N = |Ψ(r, t)|2
m ˆ
grad ϕ(r, t) .
Das Phänomen der Suprafluidität erfordert es, j N und ϕ des suprafluiden Kondensats als neue thermodynamische Variablen aufzufassen. In der Supraflüssigkeit sind die Zustände mit j N = 0 keine Nichtgleichtgewichts-Zustände, wie bei den in Kap. 8 betrachteten diffusiven Transportphänomenen, sondern Zustände des thermodynamischen Gleichgewichts, ähnlich wie die Zustände mit L = 0 in Atomen mit einem magnetischen Moment. Von F. London und Tisza stammt die Idee, die besonderen Eigenschaften des superfluiden Heliums dadurch zu erklären, dass man es als Gemisch zweier Flüssigkeiten auffasst, von denen eine Komponente (das Kondensat) den Supra-Transport übernimmt, während die andere (die Normalkomponente) Reibungsphänomene zeigt. Die relativen Massendichten der beiden Komponenten sind in Abb. 13.17 dargestellt. Die Entropie der Suprakomponente ist Null, daher trägt sie nicht zu den kalorischen Eigenschaften und zum Wärmetransport bei. Tisza hat außerdem die starke Ähnlichkeit mit dem im vorangegangen Abschnitt dargestellten Bose-Einstein-Kondensat und der es umgebenden thermischen Wolke erkannt. Er schlug vor, den in Abb. 13.16a gezeigten λ-Übergang als eine durch die interatomaren Wechselwirkungen in der HeliumFlüssigkeit modifizierte Bose-Einstein-Kondensation zu interpretieren, wie dies auch durch die Ähnlichkeit der Abbildungen 13.17 und 13.13 suggeriert wird. Im Rahmen des Zwei-Flüssigkeitsmodells lassen sich ein Großteil der im Folgenden vorgestellten Eigenschaften des supraflüssigen Heliums erklären. Anders als bei
482 | 13 Bose-Systeme der Bose-Einstein-Kondensation ist es jedoch nicht so, dass ein bestimmter Anteil der 4He-Atome das Kondensat und der Rest die Normalkomponente bildet. Im Temperaturbereich zwischen 0 und 2 K, in dem das Zwei-Flüssigkeits-Modell eine gute Beschreibung liefert, tragen alle 4He-Atome zum Kondensat bei. Aufgrund der Wechselwirkung ist die Zahl der Atome in dem elementaren Bose-System mit der Energie ε0 auch bei T = 0 relativ klein ( 13 %). Die übrigen Atome werden durch die Wechselwirkung in elementare Bose-Systeme mit höheren Energien gedrängt. Dennoch sind diese Atome ebenfalls Teil des korrelierten Vielteilchen-Grundzustands. Die bei endlichen Temperaturen auftretenden Anregungszustände sind (wie im Festkörper, und anders als bei der Bose-Einstein-Kondensation idealer Atomgase) keine freien Atome, sondern kollektive Anregungen, die wir im nächsten Abschnitt genauer besprechend werden. Eine detaillierte Behandlung des Kondensats liegt leider außerhalb des Rahmens dieses Buches. Hier wollen wir uns auf die Normalkomponente, das heißt die thermisch induzierten Anregungszustände des superfluiden Heliums beschränken. Diese lassen sich als Gase von Quasiteilchen auffassen, die sich mit unseren bisher entwickelten Methoden beschreiben lassen.
13.4.2 Dispersionsrelation und Wärmekapazität Wie in den vorangegangenen Abschnitten bildet die Dispersionsrelation ε(k) der Quasiteilchen den Schlüssel für das Verständnis von deren thermodynamischen Eigenschaften. Erste Hinweise auf die Form von ε(k) kamen aus der Temperaturabhängigkeit der Wärmekapazität bei tieferen Temperaturen (Abb. 13.18a). Die dort gezeigte T 3 Abhängigkeit von cˆv (T ) mit dem Zusatzbeitrag oberhalb von 0.6 K veranlasste Landau, eine Dispersionsrelation mit einem linearen – phononenartigen – Zweig und einem weiteren parabolischen Zweig zu postulieren, der für einen exponentiellen Anstieg der Wärmekapazität oberhalb von 0.6 K verantwortlich ist. Die mit dem parabolischen Zweig assoziierten Quasiteilchen werden Rotonen genannt. Aus dem T 3 -Beitrag ergibt sich für den Phononen-Zweig eine Schallgeschwindigkeit von cs = 238 m/s, was gut mit direkten Messungen von cs übereinstimmt. Hier zeigt sich eine Universalität des Tieftemperaturverhaltens aller elastischen Materie: Im Grenzfall großer Wellen√ längen muss stets eine lineare Dispersion auftreten, deren Steigung cs = 1/ κS m allein durch die isentrope Kompressibilität und die Massendichte bestimmt ist. In normalen Flüssigkeiten und Gasen ist die Dämpfung der Wellen jedoch so stark, dass das Quasiteilchenbild keine gute Beschreibung bietet. Hier stellt das suprafluide Helium eine große Ausnahme dar – aufgrund der großen Reinheit (alle Verunreinigungen frieren an den Wänden fest) ist die Lebensdauer der Phononen noch größer als in den meisten Festkörpern. Die exponentielle Temperaturabhängigkeit des Rotonenbeitrags zur Wärmekapazität zeigt an, dass der parabolische Zweig durch eine Energielücke von ΔR /kB 9 K
13.4 Quasiteilchen in suprafluidem 4 He
b)
106 4
∝T3
102
100
cs ~ 238 m/s 15
He
104
ε / kB (K)
(μJ mol-1K-1)
a)
10
}
5
0.05
0.1
| 483
0.25 T (K)
0.5
1
0
0
1
vc ~ 60 m/s
ΔR
2
3
k (A-1)
Abb. 13.18. a) Wärmekapazität von 4He bei tiefen Temperaturen T < 1 K. b) Durch inelastische Neutronenstreuung gemessenes Anregungsspektrum des superfluiden Heliums. Bei niedrigen Wellenvektoren ist die Dispersion nahezu linear (Phononen), bei höheren Wellenvektoren tritt ein charakteristisches Minimum auf (Rotonen). Die durchgezogene Linie zeigt die kritische Geschwindigkeit vc an, oberhalb derer die Anregung von Rotonen durch bewegte Körper in der Supraflüssigkeit, das heißt das Einsetzen von Dissipation, möglich ist (nach [21]).
vom Grundzustand getrennt ist, die Rotonen-Anregung also eine Minimalenergie ΔR benötigt. Aufgrund der hohen Zustandsdichte in der Nähe des Rotonen-Minimums dominieren die Rotonen die thermischen Eigenschaften oberhalb von 1 K. Die Krümmung in der Nähe des Rotonen-Minimums entspricht einer einer effektiven Masse von m ˆ R 0.15 m ˆ 4 , wobei m ˆ 4 die Masse pro 4He Atom ist. Landaus auf der Grundlage des Zwei-Flüssigkeitsmodells erarbeitete hydrodynamische Theorie sagte neben den üblichen Schallwellen eine weitere sehr ungewöhnliche Art von hydrodynamischen Moden voraus, den 2. Schall. Beim 2. Schall handelt es sich um wellenartigen Schwankungen der QuasiteilchenDichte, welche das Analogon zu konventionellen Schallwellen in klassischen Gasen bilden. Der 1. Schall (dessen Quanten die Phononen und Rotonen sind) sind die bekannten wellenartigen Schwankungen der Dichte der 4He-Atome, also der „realen“ Teilchen.23 Unter der Bedingung, dass die Streuraten der Quasiteilchen deutlich größer als die Schwingungsfrequenzen sind, liegt lokales thermodynamisches Gleichgewicht vor, und die Dichteschwankungen im Quasiteilchensystem verhalten sich ganz analog zu denen der Teilchendichte in klassischen Gasen. Der entscheiden-
23 Die Frage, ob die „realen“ Teilchen oder die Quasiteilchen mehr wissenschaftliche „Realität“ für sich beanspruchen können ist diskussionswürdig. Da die thermodynamischen Eigenschaften (mit Ausnahme der Dichte m der Gesamtmasse und der Kompressiblität) Systemkonstanten der Quasiteilchen sind, können wir diesen durchaus denselben Realitätsgrad wie den 4 He-Atomen zubilligen. Im suprafluiden Helium treten die Atome dagegen überhaupt nicht als Teilchen, sondern nur als strukturloses Kontinuum in Erscheinung, weil diese im suprafluiden Kondensat durch eine eigentümliche „Phasenstarre“ miteinander gekoppelt sind.
484 | 13 Bose-Systeme de Unterschied ist der, dass sich der 2. Schall als wellenartige Schwankungen der Entropiedichte (nach Gl. 13.25) und damit als Temperatur-Wellen manifestiert, bei denen die Gesamtmassendichte m konstant bleibt, während der 1. Schall gewöhnliche Massendichte-Wellen darstellt. Weil die Gesamt-Massendichte beim 2. Schall konstant bleibt, müssen die Massendichten der Normal-Komponente und der SupraKomponente gegeneinanderschwingen. Damit wird der 2. Schall neben der Dynamik der Quasiteilchen auch durch die des Kondensats bestimmt, und seine quantitative Behandlung liegt außerhalb unseres Rahmens. Der 2. Schall stellt eine extrem effektive Form des Wärmetransports dar und ist für die extrem hohe Wärmeleitfähigkeit des suprafluiden Heliums verantwortlich. Die Analyse von Peshkovs Messungen der Ausbreitungsgeschwindigkeit des 2. Schalls führte Landau zu der Vermutung, dass das Rotonen-Minimum in der Dispersionsrelation bei endlichen Wellenvektoren liegen müsse – er war in der Lage, aus diesen Messungen Zahlenwerte für k0 zu gewinnen. Diese stimmten bis auf 10% mit den erst über 20 Jahre später, in Abb. 13.18b gezeigten direkten Messungen von ε(k) durch inelastische Neutronenstreuung überein, und Landaus Vorhersage wurde damit glänzend bestätigt. Das Rotonenminimum liegt auf der k-Achse bei k0 18/nm und verschiebt sich mit dem Druck, das heißt mit der Dichte der Flüssigkeit hin zu größeren Werten. Messungen des statischen Strukturfaktors durch elastische Streuexperimente bei verschiedenen Drucken zeigen, dass k0 tatsächlich durch den mittleren Abstand der 4He-Atome in der Flüssigkeit bestimmt wird. Die spezielle Form der Dispersionsrelation in Abb. 13.18 lieferte Landau ein wichtiges Argument für die Möglichkeit reibungsfreien Transports durch die Supraflüssigkeit. Wird ein makroskopischer Körper in der Supraflüssigkeit bewegt, so erlauben die Erhaltungssätze für Energie und Impuls die Erzeugung von Rotonen nur oberhalb einer kritischen Geschwindigkeit vc 60 m/s. Aufgrund anderer DissipationsMechanismen (insbesondere die Erzeugung von Wirbeln) wird im Experiment in der Regel nur etwa die Hälfte dieses Werts erreicht. Bei einer quadratischen Dispersion wären Anregungen bei beliebig kleinen Anregungen möglich – aus diesem Grund wurde Tiszas Erklärung des λ-Übergangs durch eine durch Wechselwirkungen modifizierte Bose-Einstein-Kondensation von Landau lange bekämpft. Ein analoges Argument gilt für den widerstandslosen Ladungstransport in supraleitenden Metallen: Auch hier sind die Quasiteilchen-Anregungen durch eine Energielücke vom stromtragenden Grundzustand getrennt. Inzwischen hat man jedoch auch in gasförmigen BoseEinstein-Kondensaten Dauerstrom-Wirbel (die nur in einer Supraflüssigkeit möglich sind) gefunden und Supraleiter ohne Energielücke entdeckt – daher sind heute Zweifel angebracht, ob die Existenz der Rotonen-Lücke ΔR in Abb. 13.18 tatsächlich eine notwendige Voraussetzung für die Suprafluidität ist.
13.4 Quasiteilchen in suprafluidem 4 He
(a)
| 485
(b)
I
Heizer
nanoporöses Superleck
Abb. 13.19. a) Experimentelle Anordnung zur Demonstration des Fontänen-Effekts. b) Photographie eines realen Experiments (nach [21]).
13.4.3 Der Fontänen-Effekt Eine weitere spektakuläre Manifestion der Suprafluidität ist der Fontänen-Effekt. Wie in dem Schema in Abb. 13.19a dargestellt, handelt es sich dabei um eine Anordnung, in der ein Rohr in supraflüssiges Helium eintaucht, welches am unteren Ende mit einem nanoporösen Material, einem Supraleck, verschlossen ist. Im Normalzustand ist die Viskosität der Flüssigkeit viel zu hoch, als dass Heliumflüssigkeit durch die nanometergroßen Poren in messbaren Mengen in das Rohr eindringen könnte. Unterhalb Tλ ändert sich dies: Für die Suprakomponente stellen diese Poren kein Hindernis dar (daher der Name „Supraleck“), während die Normalkomponente von den Poren ebenfalls zurückgehalten wird. Also werden sich die Flüssigkeitsspiegel innen und außen angleichen. Wenn nun das Helium im Inneren des Rohrs erwärmt wird, beobachtet man, dass der Flüssigkeitsspiegel im Inneren ansteigt, ja sogar durch eine Düse fontänenartig aus dem Rohr herausspritzt (siehe Abb. 13.19b). Solange die Temperaturdifferenz aufrechterhalten wird, bleibt auch die Fontäne bestehen. Die Höhe der Fontäne kann bis zu 30 cm erreichen. Bei dem Experiment wird eine kontinuierlich zugeführte Heizleistung in einen ebenso kontinuierlichen Massenstrom umgesetzt. Da die Aufrechterhaltung des Massenstroms gegen die Schwerkraft eine kontinuierliche Arbeitsleistung erfordert, handelt es sich bei der Anordnung um eine Wärmekraftmaschine. Wegen des reibungsfreien Heliumflusses sind die Verluste der Maschine minimal, sie werden nur durch die Wärmeleitung durch das Material des Supralecks bestimmt. Die Leistung ist jedoch nicht sehr hoch, da der Fontänendruck nur wenige Millibar beträgt. Hebt man umgekehrt das Rohr bei anfänglich gleichen Innenund Außentemperaturen aus der Supraflüssigkeit heraus, so fließt Helium nach unten ab. Dabei wird eine Erwärmung im Inneren festgestellt, die eine adiabatische Kompression des Quasiteilchengases signalisiert. Diese Kopplung von mechanischen und thermischen Eigenschaften wird der mechano-kalorische Effekt genannt. Das Verhalten des supraflüssigen Heliums ist unseren üblichen Erfahrungen bei Heizexperimenten diametral entgegengesetzt. Wird ein normales fluides Medium wie ein Gas oder die Elektronen in einem Draht geheizt, so setzt ein Massenstrom oder ein thermoelektrischer Strom von der heißen zur kalten Seite ein, welcher der Tem-
486 | 13 Bose-Systeme peraturdifferenz entgegen wirkt, weil die zugeführte Entropie von dem Teilchenstrom konvektiv abgeführt wird (Abschnitt 8.9). Beim supraflüssigen Helium setzt ein Massenstrom von der kalten zur heißen Seite ein, der ebenfalls die Temperaturdifferenz abbaut. Da in unserer Anordnung die Normalkomponente der Heliumflüssigkeit blockiert wird, kann nur die Suprakomponente strömen. Die Beobachtungen beweisen daher, dass die vom suprafluiden Kondensat mitgeführte Entropie24 sehr klein sein muss – in der Tat hat das Kondensat sogar die Entropie Null! Thermodynamisch können wir das Experimente so verstehen, dass die Temperaturerhöhung das chemische Potenzial des Heliums lokal erniedrigt. Um diese chemische Potenzialdifferenz auszugleichen, setzt sich ein Suprastrom (mit der Temperatur 0, da S = 0!) von der kalten zur heißen Seite in Bewegung und sorgt so für die Angleichung der Temperaturen und der chemischen Potenziale. Wird die Temperaturdifferenz aufrecht erhalten, so muss der Druck auf der heißen Seite steigen, um die chemische Potenzialdifferenz auf diese Weise abzubauen. Quantitativ können wir dies mit Hilfe der Gibbs-Duhem-Relation (Gl. 5.29) formulieren: !
dμ = −ˆ s dT + vˆ dp = 0 .
Damit erhalten wir für die Ableitung des Fontänendrucks nach der Temperatur: dp(T ) sˆ(T ) = = s(T ) . dT vˆ
(13.44)
In Abb. 13.44 sind Messungen des Fontänendrucks für verschiedene Temperaturen dargestellt. Der Fontänendruck liefert also direkt den Absolutwert der Entropiedichte des supraflüssigen Heliums! Dies ist sehr speziell, denn bislang konnten wir die absolute Entropie eines Systems nur durch die Integration von C(T )/T vom absoluten Nullpunkt an bestimmen – mit allen Unwägbarkeiten, die mit der dabei nötigen Extrapolation von C(T ) für T → 0 verbunden sind. Aus dem Fontänendruck bekommen wir den Absolutwert von S durch ein Experiment zwischen zwei eng benachbarten endlichen Temperaturen! Neben der thermodynamischen Interpretation des Fontänen-Effekts können wir uns auch ein mikroskopisches Bild des Vorgangs machen: Das suprafluide Kondensat bildet (ähnlich wie bei Festkörpern) eine Art Quasi-Vakuum für das Phononen- und Rotonen-Gas. Eine homogene Erwärmung führt, wie in Abschnitt 13.2.3 besprochen, zu einer Zunahme der Quasiteilchendichte. Der entsprechend zunehmende Quasiteilchendruck resultiert dann in der thermischen Ausdehnung der Flüssigkeit. Im Unterschied zum Festkörper ist die Form des für die Quasiteilchen verfügbaren Volumens bei der Supraflüssigkeit aber nicht fest, sondern kann sich durch die Strömung der Supraflüssigkeit verändern. Erfolgt die Erwärmung wie in der Anordnung zum FontänenEffekt lokal auf einer Seite des Supralecks, muss sich das Quasiteilchengas nicht mühevoll gegen die Kohäsionskräfte der Flüssigkeit stemmen. Es kann sich viel leichter
24 Dies entspricht der Tatsache, dass bei Supraleitern der Peltier-Koeffizient verschwindet.
13.4 Quasiteilchen in suprafluidem 4 He
| 487
20
p (mbar)
15 1.97 K 1.74 K 1.58 K 1.47 K 1.33 K
10 5 0
0
2
4
6 8 6T (mK)
10
12
Abb. 13.20. Messung des Fontänendrucks über die Steighöhe in einem Rohr. Der Absolutwert der Entropiedichte bei verschiedenen Temperaturen ergibt sich aus der Steigung der Ausgleichsgeraden (Daten aus [21]).
dadurch ausdehnen, dass es seinen Volumenanteil auf Kosten des Volumenanteils der kalten Seite durch den Strom des Kondensats durch das Supraleck vergrößert, bis sich ein Druckgleichgewicht zwischen den Quasiteilchengasen auf beiden Seiten des Supralecks eingestellt hat. In diesem Sinne bietet die Übertragung des BernoulliModells aus Abschnitt 3.4 auf das Quasiteilchensystem eine sehr anschauliche Erklärung für den Fontänen-Effekt. Die bei der Umkehrung des Fontäneneffekts, das heißt die beim Auslaufen der Supraflüssigkeit durch das Supraleck festgestellte Erwärmung, lässt sich dann als isentrope Kompression des Quasiteilchengases verstehen, bei der sich die steigende Entropiedichte (ebenso wie bei klassischen Gasen) in einer steigenden Temperatur manifestiert. Die Undurchlässigkeit des Supralecks für Quasiteilchen lässt sich im Wellenbild der kollektiven Anregungen verstehen: Das als Supraleck (oder Entropiefilter) verwendete nanopröse Material reflektiert alle Quasiteilchen, deren Wellenlänge größer als der Porendurchmesser ist. Die relativ wenigen Quasiteilchen, deren Wellenlänge so kurz ist, dass sie innerhalb der Poren ausbreitungsfähig sind, fallen neben den Phononen, die innerhalb des festen Materials zum Wärmetransport beitragen, nicht ins Gewicht.
13.4.4 Die Trägheit des Quasiteilchen-Systems In diesem Abschnitt wollen wir auch die in Abb. 13.17 dargestellte Abhängigkeit der Massendichte der Normal- und Supra-Komponente von der Temperatur zurückkommen. Das Experiment, welches dieser Graphik zugrundeliegt, wurde erstmals 1948 von Andronikaschwili durchgeführt. Sein in Abb. 13.21a gezeigter experimenteller Aufbau besteht aus einem in suprafluides Helium eingetauchtes Rotationspendel, dessen Rotator aus einem Stapel aus 50 sehr dünnen Platten bestand. Gemessen wurde die Resonanzkurve des Pendels, dessen Eigenfrequenz über das Trägheitsmoment und dessen Dämpfung über die Viskosität der Supraflüssigkeit Auskunft gibt. Die Idee
488 | 13 Bose-Systeme
a)
b)
4
mn(T) / m(Tλ)
Spiegel
He
1 0.8 4
0.6
He
0.4
Scheiben
Andronikaschwili 2. Schall (Peshkov)
Tλ
0.2 0
1.5
2
2.5 T (K)
3
3.5
Abb. 13.21. a) Versuchanordung von Andronikaschwili zur Messung der Massendichte mN der Normal-Komponente in suprafluidem Helium. Die Position des Drehpendels wird durch die Reflexion eines Lichtzeigers an einem am Torsionsdraht befestigten Spiegel ausgelesen. b) Messdaten von Andronikaschwili (rote Punkte) für mN (T ), normiert bezüglich der Massendichte am λ-Punkt. Die schwarzen Messpunkte wurden mittels des 2. Schalls gewonnen (nach [21]).
des Experimentes besteht darin, dass die viskose Normal-Komponente der Supraflüssigkeit an der Rotation des Plattenstapels teilnimmt und damit zum Trägheitsmoment des Drehpendels beiträgt, während die Supra-Komponente in Ruhe bleibt. Damit dies funktioniert, muss die Masse des Plattenstapels möglichst klein und das Verhältnis von Platten-Durchmesser und -Abstand möglichst groß sein. Andronikaschwili verwendete 50 jeweils etwa 13 μm dicke Al-Platten mit 210 μm Abstand und 3.5 cm Durchmesser. Die Messergebnisse sind in Abb. 13.21b (rote Punkte) gezeigt. Wie die Daten zeigen, fällt die die Massendichte der Normalkomponente beim 4He unterhalb von Tλ viel steiler ab als die der thermischen Wolke in einem idealen Bose-Gas (Abb. 13.17). Dies wird wegen der exponentiellen Zunahme der Rotonendichte in der Nähe von Tλ auch erwartet. Bei tieferen Temperaturen, bei denen die Rotonendichte gegen die Phononendichte vernachlässigt werden kann, findet man experimentell: mN (T ) ∝ T 4
für
T 0.6 K .
Hier nicht gezeigte Messungen der Quasiteilchen-Viskosität über den Gütefaktor des Rotationspendels zeigen einen ähnlichen Abfall von η(T ), der die T -Abhängigkeit der Rotonendichte widerspiegelt. Dieser Abfall ist wesentlich schwächer als der der Viskosität in Abb. 13.16b. Dies liegt daran, dass der Massenfluss durch Kapillaren nur durch die Suprakomponente bestimmt ist. Die schwarzen Messpunkte wurden mit einer völlig anderen Methode gewonnen, nämlich über die Messung der Geschwindigkeit des 2. Schalls (Seite 483). Die gute Übereinstimmung demonstriert die Tragfähigkeit der von Tisza und Landau entwickelten Ideen. Jetzt wollen wir fragen, wie es möglich ist, dass ein Gas aus (zumindest für T 0.6 K) masselosen Quasiteilchen eine dynamische Masse aufweisen kann. Dies wider-
13.4 Quasiteilchen in suprafluidem 4 He
| 489
100
mn / m(Tλ )
10-2
T 5.6
10-4
T4
10-6 10-8 0.1
0.2
0.5 T (K)
1
2
Abb. 13.22. Messungen der normal-fluiden Massendichte mN (T ) in einem gegenüber Abb. 13.21b erweiterten Temperaturbereich. Bei tiefen Temperaturen T 0.5 K dominieren die Phononen mN (T ) ∝ T 4 . Für T 0.5 K werden mehr und mehr Rotonen angeregt und für T 1 K wird ein effektives Potenzgesetz mit dem Exponenten 5.6 beobachtet (nach [21]).
spricht offenbar unserer von klassischen Gasen geprägten Gewohnheit, dass Teilchendichte und Massendichte stets durch eine Systemkonstante, nämlich die Masse pro Teilchen m ˆ , miteinander verknüpft sind: mN (T ) = m ˆ · n(T ) ,
so wie man erwartet, dass die Gesamtmasse eines System einfach die Summe der Massen aller Teilchen ist. Diese Erwartung ist jedoch dann zutreffend, wenn die Teilchen in ihrem Behälter fixiert sind, sodass ihre Geschwindigkeit stets dieselbe wie die des Behälters ist – es ist diese Voraussetzung, die im vorliegenden Fall verletzt ist. Dass die Teilchendichte und die Massendichte nicht proportional sind, sieht man daran, dass in dem von den Phononen dominierten Temperaturbereich n(T ) ∝ S(T ) ∝ T 3 gilt, während mN (T ) ∝ T 4 ist (Abb. 13.22). In dem von den Rotoren dominierten Temperaturbereich wird dagegen ein effektives Potenzgesetz mN (T ) ∝ T 5.6 beobachtet. Die Gesamtmassendichte m ˆ ist weitgehend unabhängig von T . Um die beobachtete T -Abhängigkeit der normalfluiden Massendichte zu verstehen, müssen wir uns zunächst klar machen, was wir unter der dynamischen Masse des Quasiteilchensystems verstehen wollen. Das Andronikaschwili-Experiment misst offenbar die Trägheit des Quasiteilchensystems, das heißt seinen Widerstand gegen Beschleunigung. Wir setzen daher für Volumenelemente des Quasiteilchensystems, in dem die intensiven Größen als konstant angesehen werden können, den Newton’sche Zusammenhang zwischen Impuls und Geschwindigkeit P = P = MN (T ) · w
an, wobei P der thermodynamische Mittelwert des Gesamtimpulses in diesem Volumenelement und w die lokale Geschwindigkeit des Plattenstapels für einen gegebenen Abstand zur Rotationsachse ist. Es ist wichtig, die Geschwindigkeit v = ∂ε(k)/∂(k) der Quasiteilchen von der lokalen Geschwindigkeit w des Plattenstapels
490 | 13 Bose-Systeme zu unterscheiden. Letztere wird durch die Drehbewegung von außen vorgegebenen und spielt die Rolle einer mittels eines Impulsreservoirs definierten intensiven Größe, welche gemeinsam mit der lokalen Temperatur und dem lokalen chemischen Potenzial die Mittelwerte der anderen extensiven Größen der in dem Volumenelement enthaltenen Quasiteilchengases definieren. Es ist die Änderung des lokalen Impulses durch die Streuung der Quasiteilchen an den Plattenoberflächen in Abb. 13.21, welche den Bewegungszustand des Quasiteilchensystems ändert und eine zusätzliche Kraft erfordert. Dabei nehmen wir an, dass die Änderungen des Bewegungszustands während der Drehschwingung so langsam erfolgen, dass das Quasiteilchensystem mit den Platten stets im GeschwindigkeitsGleichgewicht bleibt und (lokal) durch die einheitliche Geschwindigkeit w charakterisiert werden kann. In diesem Sinne muss auch eine nur mit thermischer Strahlung gefüllte Babyrassel einen von den ebenfalls masselosen thermischen Photonen herrührenden Beitrag zur Gesamtmasse haben; allein ist der Photonen-Gesamtimpuls wegen der hohen Lichtgeschwindigkeit so klein, dass dieser Beitrag schwer nachweisbar ist. Die quantitative Auswertung unserer Überlegungen erfordert eine Verallgemeinerung unserer bisher auf ruhende Gase bezogenen Behandlung der Gibbs’schen Verteilung und der elementaren Bose-Systeme in den Abschnitten 12.2 und 12.3. Selbstverständlich ist der Impuls der (Quasi-)Teilchen auch in ruhenden Gasen eine Zufallsgröße. Diese fallen in den thermodynamischen Relationen jedoch nicht ins Gewicht, weil der Mittelwert des Impulses für w = 0 ebenfalls verschwindet. Für mit der Geschwindigkeit w = 0 bewegte Systeme muss der Term wdP in die Gibbs’sche Fundamentalform aufgenommen und analog zu den anderen Termen behandelt werden. Da in idealen Quasiteilchen-Gasen der Impuls der Quasiteilchen mit der Energie und der Teilchenzahl vertauschbar ist, besitzen diese gemeinsame Eigenzustände |εi , ki, Ni , denen die Wahrscheinlichkeiten Wi zugeordnet werden können. Analog zur Energie und der Teilchenzahl sind der Gesamtimpuls des Volumenelements und dessen Differenzial durch P = P i Wi und dP = P i dWi i
i
gegeben. Wird dies zusammen mit den Differenzialen von E, S und N in die Gibbs’sche Fundamentalform dE = T dS − p dV + μdN + w dP
eingesetzt, so ergibt sich unter der Nebenbedingung leicht verallgemeinerte Gibbs’sche Verteilung
1
i Wi
ε − μNi − wPi exp − i kB T Wi (T, μ) = ZG (T, μ, w)
= 1 die gegenüber Gl. 12.7
13.4 Quasiteilchen in suprafluidem 4 He
mit der großkanonischen Zustandssumme ZG (T, μ) :=
exp −
i
εi − μNi − wP i kB T
|
491
.
Ideale Gase können aus elementaren Bose-Systemen mit den Impulseigenwerten Pi = k Ni aufgebaut werden. Entsprechend erhalten wir eine gegenüber Gl. 12.23 modifizierte Bose-Funktion (B)
Nk
(T, μ) = exp
1 ε−kw−μ kB T
−1
,
(13.45)
die nicht mehr nur von |k|, sondern auch von der k-Richtung abhängt. Anstatt die (B) Bose-Funktion zu modifizieren, können wir auch die übliche Bose-Funktion Nε (k) benutzen und sagen, dass die Quasiteilchen-Dispersionsrelation ε (k) = ε(k) − kw
um die Doppler-Verschiebung kw ergänzt werden muss. Die Folge der DopplerVerschiebung der Energien der elementaren Bose-Systeme ist eine Asymmetrie der (B) Teilchenzahlen Nk : Elementare Bose-Systemen mit einer positiven Komponente des Wellenvektors in Bewegungsrichtung haben eine niedrigere Energie und enthalten damit mehr Teilchen als solche mit kw < 0. Dies führt zu endlichen Werten des Gesamtimpulses beziehungsweise der lokalen Gesamtimpuls-Dichte p = P /V . Wird die Doppler-Verschiebung gleich der Energielücke ΔR der Rotonen, so divergiert die Rotonendichte bei k = k0 w/|w|, und der suprafluide Zustand bricht zusammen. Diese ist eine alternative Ableitung des Landau-Kriteriums für die kritische Geschwindigkeit. Unser Ziel, die Berechnung der Massendichte der Normalkomponente, erreichen wir nun dadurch, dass wir den lokalen Mittelwert der Impulsdichte p = mN w als Funktion von w berechnen: 1 (B) p= dk3 Nk (T, μ, w) · k . 2 (2π)
Für kleine Geschwindigkeiten kw ε können wir die Bose-Funktion (Gl. 13.45) in eine Taylor-Reihe um ε entwickeln (B)
Nk
(B)
(T, μ, w) = Nε
(B)
(T, μ, w = 0) −
(B)
Wegen der Isotropie von Nε und wir erhalten: 1 p= (2π)2
∂Nε
(T, μ, w = 0) kw + . . . . ∂ε
(T, μ, w = 0) fällt der erste Term beim Integrieren weg,
(B)
dk3
∂Nε
(T, μ, w = 0) · (kw) · k . ∂ε
492 | 13 Bose-Systeme Dieses Integral lässt sich in Kugel-Koordinaten auswerten25 und ergibt in dem von Phononen dominierten Temperaturbereich: mN (T ) =
3 ephonon (T ) ∝ T4 . 4 c2s
(13.46)
In das Ergebnis geht die Masse m ˆ des 4He-Atoms nur sehr indirekt (über die Schallgeschwindigkeit cs ) ein. Dafür erinnert das Resultat stark an die Einstein-Formel für den relativistischen Zusammenhang zwischen Energie und Masse e = mc2 . Der Faktor 3/4 ist dadurch zu erklären, dass die Energie-Masse-Relation für Körper im Vakuum (das heißt bei p = 0) im Rahmen der relativistischen (Hydro-)Dynamik in eine EnthalpieMasse-Relation übergeht: h = e + p = mc2 .
Wegen p = e/3 stellt Gleichung 13.46 also ein genaues Quasiteilchen-Analogon zu der relativistischen Enthalpie-Massen-Relation dar. Diese Analogie ist durch die Äquivalenz der Dispersionsrelationen von Photonen und Phononen begründet.26
25 Details finden sich zum Beispiel in [37]. 26 Dies lässt sich darauf zurückführen, dass die Ruhemasse M0 des bewegten Gases eine LorentzInvariante sein muss. M0 kann daher nicht die Form M0 (S, V, N ) = E0 (S, V, N )/c2 haben, weil M0 , S und N Lorentz-Invarianten sind, das Volumen V dagegen nicht. Andererseits ist der Druck p Lorentz-invariant. Wie von Planck bereits 1907 am Beispiel des bewegten Photonengases gezeigt wurde, ist die Massieu-Gibbs-Funktion eines bewegten (Quasiteilchen)-Gases nicht durch Gl. 1.6, sondern durch H(P , S, p, N ) = (cP )2 + H0 (S, p, N ) gegeben. Es sei dem Leser als Übung überlassen zu zeigen, dass die Massieu-Gibbs-Funktion H(P , S, p, N ) den Postulaten der Thermodynamik genügt und es gestattet, unter anderem die relativistische Geschwindigkeitsabhängigkeit von T , V und μ zu berechnen, die gegenüber ihren Werten im Ruhesystem um den Faktor (H/H0 )2 = 1 − (v/c)2 reduziert sind.
13.4 Quasiteilchen in suprafluidem 4 He
|
493
Übungsaufgaben 13.1. Einstein-Koeffizienten Einstein leitete 1917 die Planck -Verteilung ab, indem er Photon-induzierte Übergänge zwischen zwei Zuständen |1 und |2 eines Atoms im Strahlungsfeld mit der Energiedifferenz ω = ε2 − ε1 betrachtete. Einstein ging davon aus, dass die drei folgenden Prozesse relevant sind: 1. die spontane Emission eines Photons mit der Rate A21 , 2. induzierte Emission eines Photons mit der Rate B21 u(ω), 3. Absorption eines Photons mit der Rate B12 u(ω), wobei u(ω) die gesuchte spektrale Dichte der Photonen mit der Energie ω ist. Die Koeffizienten Aij und Bij werden Einstein-Koeffizienten genannt. Die Besetzungszahlen Ni werden durch die Ratengleichung dNi dt
Σij Nj (t)
=
1,2
beschrieben, wobei die Σij geeignete Kombinationen der Aij und Bij sind. a) Welche Kombinationen der Raten Aij und Bij u(ω) beschreiben die Absorption und die Emission? b) Im stationären Zustand muss Ni (t) = const. gelten. Welche Bilanzgleichung zwischen N1 und N2 folgt daraus [dies ist ein Beispiel für das detaillierte Gleichgewicht (Gl. 10.40)]? c) Warum ist die Existenz der spontanen Emission (beschrieben durch A21 ) erforderlich? (Dies war die wesentliche Neuerung durch Einsteins Überlegung.) d) Nehmen Sie an, dass das Verhältnis N2 /N1 durch die Boltzmann-Verteilung gegeben ist, und bestimmen Sie daraus u(ω). e) Welchen Wert muss das Verhältnis B12 /B21 haben, wenn Sie bedenken, dass u(ω) für ω → ∞ gegen Null gehen muss? f) Bestimmen Sie das Verhältnis A21 /B21 durch Vergleich mit Gl. 13.6. Machen Sie sich klar, dass diese Beziehung dem Kirchhoff’schen Gesetz (Gl. 13.15) entspricht. 13.2. Thermische Strahlungsleistung Das Stefan-Boltzmann-Gesetz verknüpft die Energiestromdichte j E der von einem heißen Körper abgegebenen thermischen Strahlung mit der Temperatur T : |j E | = S T 4
(13.47)
wobei S die Stefan-Boltzmann-Konstante und das relative Emissionsvermögen ist ( = 1 für schwarze Körper).
494 | 13 Bose-Systeme
a) Berechnen Sie die Strahlungsleistung zwischen zwei konzentrisch angeordneten Hohlkugeln, von denen die eine aus oxidiertem Kupferblech ( 1) bei 300 K und 77 K und die andere aus vergoldetem Kupferblech ( = 0.03) mit einer Fläche von 0.01 m2 bei 4.2 K besteht. b) Berechnen Sie die Verdampfungrate von flüssigem 4 He in einem Helium-Dewar für dieser thermischen Belastung.
13.3. Backofen Ein Backofen mit der Grundfläche A = 2500 cm2 und der Höhe h = 20 cm habe eine Temperatur von 250◦ C. a) Berechen Sie die Photonendichte im Ofen und vergleichen Sie diese mit der Dichte der Gasmoleküle. b) Welchen Beitrag liefern die Photonen zur Energiedichte und zur Wärmekapazität? Vergleichen Sie wieder mit den Beiträgen der im Ofen enthaltenen Luft. c) Jetzt werde ein schwarzes Kuchenblech in den Ofen geschoben. Berechnen und vergleichen Sie den über die thermische Strahlung und den über die Luft übertragenen Wärmestrom als Funktion der Temperatur des Blechs. Nehmen Sie dazu an, dass das Blech die Grundfläche des Ofens ausfüllt und vernachlässigen Sie den Einfluss der Seitenwände des Ofens sowie Konvektionseffekte. 13.4. Debye- und Einstein-Temperatur von Silber Die Standard-Entropie von Silber beträgt 42.7 J/(mol K). Berechnen Sie die entsprechenden Debye- und Einstein-Temperaturen und vergleichen Sie mit dem aus der Schallgeschwindigkeit cSchall abgeschätzten Wert. Hinweis: Die Schallgeschwindigkeit erhalten Sie aus Gl. 3.34. Die gemessene Kompressibilität von Silber beträgt κ = 10−13 m2 /N. 13.5. Schallgeschwindigkeit von 4 He Experimentell findet man für flüssiges 4 He eine molare Wärmekapazität von cˆv (T ) = 0.075 J/(mol · K4 ) · T 3 unterhalb von 0.6 K. a) Wie groß ist die Schallgeschwindigkeit cs ? b) Berechnen Sie die Kompressibilität κT . c) Suchen Sie entsprechende Literaturwerte, und vergleichen Sie! 13.6. Laserkühlung √ a) Berechnen Sie die mittlere thermische Geschwindigkeit v 2 = 3kB T /m ˆ von Rb-Atomen bei 300 K, 1 K, 1 mK, 1 μK und 1 nK. b) Bestimmen Sie die Änderung der Geschwindigkeit eines Rb-Atoms bei Absorption eines Photons mit einer Energie von 1 eV. Für welche Temperaturen wird die Doppler-Verbreiterung mit der natürlichen Linienbreite vergleichbar? Die natürliche Linienbreite ist durch die Lebensdauer τ 10−8 s des angeregten Zustands gegeben, aus dem das Photon emittiert wird.
13.4 Quasiteilchen in suprafluidem 4 He
|
495
c) Benutzen Sie den in (c) berechneten Wert von τ , um die maximale Verzögerungsrate durch die Absorption von Photonen in der Energie von 1 eV zu bestimmen.Nehmen Sie dazu eine mittlere Dauer des Absorptions/Emissionszyklus von 3τ an 13.7. Bose-Einstein-Kondensat Ein Bose-Einstein-Kondensat aus Rb-Atomen befindet sich in einer magnetischen Falle mit einem harmonischen Einschlusspotenzial V (r) = 12 m ˆ Rb ω02 |r|2 mit ω0 = 2π × 100 Hz. Da die Atome elektrisch neutral sind, wirkt das Magnetfeld der Falle auf das magnetische Moment der Atome. a) Berechnen Sie den Niveau-Abstand der Falle in eV und K. b) Wie groß ist der Radius R0 des Bose-Einstein-Kondensats? Berechnen Sie da zu die Ortsunschärfe ΔR = R2 eines Atoms im Grundzustand der Falle. c) Welche r -Abhängigkeit und welche Stärke muss der Betrag des Magnetfeldes der Falle haben, um ω0 = 2π × 100 Hz zu realisieren? d) Berechnen Sie die Zeit, in der das Bose-Einstein-Kondensat seinen Durchmesser verdoppelt, nachdem das Magnetfeld abgeschaltet wurde. Welche Fallstrecke legt das Kondensat in dieser Zeit zurück? e) Welche Kondensationstemperatur TB wird für 105 Rb- und H-Atome in einer Falle mit einem quadratischen Einschlusspotenzial mit dem Volumen R03 erwartet? f) Berechnen Sie den Absolutwert der Wärmekapazität (nicht cˆ !) einer hypothetischen klassischen Atomwolke mit derselben Dichte wie das Bose-EinsteinKondensat und vergleichen Sie mit dessen Wert Cv = 1.926 N kB (T /Tc )3/2 bei T = Tc /2. Vergleichen Sie außerdem die Werte der Energien der klassischen Wolke und des Kondensats. 13.8. Verdampfungskühlung mit flüssigem Helium a) Schätzen Sie die die Änderung des Drucks über flüssigem Helium in einem Kryostaten ab, die für das Erreichen einer He-Badtemperatur von 1.5 K für 4 He und 300 mK für 3 He erforderlich ist. b) Bestimmen Sie die für die Aufrechterhaltung einer Temperatur von 2 K bei einer Kühlleistung vom 10 mW. erforderliche He-Pumprate.
13.9. Das Fließen suprafluider Filme Wird Helium auf einer Oberfläche kondensiert, so liefert die van der WaalsWechselwirkung zwischen dem Helium und der Wand den Beitrag μvdW = −α/d3 zum chemischen Potenzial des Films. Dabei ist d die Filmdicke, und α wird die Hamaker-Konstante genannt. Für Helium auf Glas ist α = 5.2 · 10−50 kg m5 /s2 .
496 | 13 Bose-Systeme
Betrachten Sie das rechts skizzierte zylindriz sche Glasgefäß mit h1 = 1 cm, h2 = 0.5 cm and R = 1 cm. Das besondere an suprafluidem Helium ist, dass die Adsorption von flüssigem Helium an der Becherwand zu einem mikroskopisch beobachtbaren Fluss von Helium führt, solanR ge der Flüssigkeitsspiegel innen und außen verschieden ist – eine Erscheinung, die bei normar len Flüssigkeiten nicht beobachtet wird. . . a) Berechnen Sie die Schichtdicken di,a (z) auf der Innen- und der Außenseite der Becherwand aus der Bedingung gravito-chemischen Gleichgewichts (Abschnitt 8.4.3): !
μfl (z, d) = μ0fl + mgz ˆ − α/d3 = μ0fl (z = 0) ,
wobei μ0fl das chemische Potenzial der Flüssigkeit fern von der Wand, g die Fallbeschleunigung und z die Höhe über dem Flüssigkeitspegel ist. b) Es sei ein gewisser Teilchenstrom IN vorgegeben – berechnen Sie für diesen die Fließgeschwindigkeit |v(z)| an der freien Oberfläche des Films. Nehmen Sie dabei an, dass die Geschwindigkeit innerhalb des Films linear variiert und dass an der Wand v(z) ≡ 0 ist. c) Berechnen Sie die innerhalb des Films durch viskose Reibung dissipierte Gesamtleistung P , wobei die lokal pro Flächeneinheit dissidierte Leistung durch P (z)/A = v · F /A
gegebenund
F /A = ηv/(A · d)
die Scherkraft pro Fläche ist. Integrieren Sie P (z) über die Becherwände. d) Berechnen Sie den Teilchenstrom mit Hilfe der Bedingung, dass sich die dissipierte Leistung und der Energiegewinn im Gravitationsfeld die Waage halten müssen, wenn die Viskosität den Wert η = 2.8 × 10−6 kg/(m·s) für normalfluides Helium nahe Tλ hat. e) Schätzen Sie eine obere Schranke für η im suprafluiden Zustand unterhalb Tλ ab, wenn ein suprafluider Fluss der Größe vˆIN = 0.1 cm3 /min beobachtet wird. f) Gibt es noch einen anderen Weg, auf dem Helium aus dem Becher entkommen kann?
14 Fermi-Systeme Die in diesem Kapitel besprochenen Fermi-Systeme stellen in vieler Hinsicht ein Gegenstück zu den Bose-Systemen dar. Die Ursache für das fundamental verschiedene Tieftemperatur-Verhalten der Fermi-Systeme liegt im Pauli-Prinzip, welches Werte der Teilchenzahlen in den elementaren Fermi-Systemen auf maximal 1 begrenzt. Die Fermi-Statistik ist von entscheidender Wichtigkeit für das Verständnis der elektronischen Eigenschaften von Festkörpern – von Metallen wie auch von Halbleitern. Darüber hinaus bestimmt sie auch die Eigenschaften von flüssigem 3He und verdünnten Lösungen von 3He in 4He. Letztere sind heute unverzichtbar zur routinemäßigen Erzeugung von Temperaturen im Millikelvin-Bereich und eignen sich ausgezeichnet, um den Übergang vom „klassischen“ zum Fermi-Verhalten experimentell zu demonstrieren. Sie zeigen, dass das an Gasen entwickelte Konzept der elementaren FermiSysteme auch auf Flüssigkeiten übertragen lässt. Die elementaren Fermi-Systeme eignen sich ebenfalls zur Diskussion einer wichtigen Klasse von Nichtgleichgewichtszuständen, die durch den Transport von Teilchen, Entropie und Energie charakterisiert sind. Auf dieser Basis gewinnen wir Modelle für die Berechnung der Transportkoeffizienten wie der elektrischen und thermischen Leitfähigkeit sowie der thermoelektrischen Koeffizienten.
14.1 Das ideale Fermi-Gas – Elektronen in Metallen 14.1.1 Dispersionsrelationen – die Bandstruktur Ein wichtiges Anwendungsbeispiel für die nachfolgenden Überlegungen sind die Elektronen in Metallen. In diesem Fall sind die Elektronen nicht als wirklich freie Teilchen anzusehen, weil sie sich in dem (mehr oder weniger) periodischen Potenzial der Atomrümpfe befinden. Das periodische Potenzial hat den wichtigen Effekt, dass die Dispersionsrelation der elementaren Fermi-Systeme in mehrere Zweige zerfällt, die als Energie-Bänder bezeichnet werden. Die Bänder gehen ähnlich wie in Molekülen aus den Tunnelaufspaltungen der Zustände aus den isolierten Atomen hervor (Abschnitt 11.2) und erstrecken sich für die Valenz- und Leitungselektronen über mehrere eV, was 104 K–105 K entspricht. Die Bandstruktur ist in Abb. 14.1 schematisch dargestellt. Die Zahl der elementaren Fermi-Systeme in einem Band ist wie bei den Phononen von der Größenordnung der Atome im Festkörper und für makroskopische Kristalle quasi-kontinuierlich. Bei nicht zu hohen Temperaturen kann die Dispersionsrelation in vielen Fällen entweder linear (für Metalle) oder quadratisch (für Halbleiter) genähert werden und entspricht daher unseren bisher betrachteten StandardDispersionsrelationen. Das Kristallgitter macht sich in diesen Näherungen nur noch dadurch bemerkbar, dass die Masse m ˆ der Ladungsträger von der Masse freier Elektro-
498 | 14 Fermi-Systeme
ε
ε
μ μ
-π/a
Metall
π/a
k
εL
}ε
g
εv
-π/a
Isolator
π/a
k
Abb. 14.1. Schematische Darstellung der Dispersionsrelationen für Elektronen in einem Metall und einem Isolator. Isolatoren mit einer relativ kleinen Bandlücke εg = εL − εG werden auch „Halbleiter“ genannt.
nen zum Teil erheblich abweichen kann. Daher wird sie in der Festkörperphysik meist als effektive Masse bezeichnet. Die Wechselwirkung der Elektronen untereinander ist aufgrund der Kompensation der Elektronen-Ladung durch die positiven Gegenladungen der Ionenrümpfe im wesentlichen abgeschirmt (Abschnitt 8.4.4) und macht sich in der Regel nur in kleinen Effekten bemerkbar. Der wesentliche Unterschied zwischen Metallen und Halbleitern besteht in der Lage des chemischen Potenzials relativ zu den Bändern. Bei Metallen liegt μ im Bereich eines oder mehrerer Bänder. Daher existieren thermisch angeregte Elektron-Loch-Paare bis hin zu beliebig tiefen Temperaturen. Wie wir sehen werden, liegt μ bei Halbleitern innerhalb einer der Bandlücken. Dies hat zur Folge, dass die Anregung von Elektron-Loch-Paaren Temperaturen erfordert, die nicht viel kleiner als die Bandlücke sind. Die Unterschiede in der Lage des chemischen Potenzials führen zu dramatischen Unterschieden in den thermischen und den Transporteigenschaften. Wir beginnen unsere Diskussion mit den Metallen. Bei geladenen Fermionen, wie zum Beispiel Elektronen, ist es streng genommen nicht korrekt, nur deren chemisches Potenzial zu erwähnen. Es ist das elektrochemische Potenzial, welches in die Fermi-Funktion eingeht, weil bei der Herleitung der Gibbs’schen Verteilung in Abschnitt 12.2 auch der elektrische Beitrag φQ dQ zur Gibbs’schen Fundamentalform berücksichtigt werden muss. Um nicht jedesmal zwischen Systemen mit geladenen und solchen mit ungeladenen Teilchen unterschei-
14.1 Das ideale Fermi-Gas – Elektronen in Metallen
| 499
den zu müssen, folgen wir einer in der Festkörperphysik weit verbreiteten Gewohnheit und sprechen in den allgemeinen Abschnitten nur von chemischem Potenzial. Dort, wo speziell von geladenen Teilchen die Rede ist, unterscheiden wir stets μ von μ ¯ = μ + qˆφQ . Dies gilt insbesondere in den Abschnitten über die elektrostatische Abschirmung, die thermoelektrischen Phänomene und die elektrische Leitfähigkeit.
14.1.2 Zustandsgleichungen Wir behandeln den einfachsten Fall von Fermionen mit der Masse m ˆ , dem Spin 1/2 und mit einer quadratischen Dispersionsrelation ε(k) = ε0 +
(k)2 , 2m ˆ
mit der Zustandsdichte
m ˆ 3/2 √ g(ε) = 2 · √ ε − ε0 . 2π 2 3
Die Ruheenergie ε0 = ε(k) = 0 hängt sowohl von der Bandstruktur des Metalls oder Halbleiters (ε0 = εL,V ) als auch vom lokalen Wert des elektrostatischen Potenzials φQ ab. Bis zur Behandlung von Halbleitern wollen wir zur Vereinfachung der Schreibweise ε0 = 0 setzen. Ausgangspunkt unserer Überlegungen ist wieder die allgemeine Darstellung der thermischen (Gl. 12.28) und der kalorischen Zustandsgleichung (Gl. 12.29): ∞ n(T, μ) =
(F)
(T, μ) ,
(14.1)
(F)
(T, μ) · ε ,
(14.2)
dε g(ε)Nε 0
∞ e(T, μ) =
dε g(ε)Nε 0
sowie die Fermi-Funktion: (F)
Nε
(T, μ) =
1 exp( kε−μ )+1 BT
.
14.1.3 Der Grundzustand: Fermi-Entartung Zunächst beschränken wir uns auf den Grenzfall T → 0, in dem sich die Zustandsgleichungen einfach auswerten lassen, weil sich die Fermi-Funktion in diesem Fall durch eine Stufenfunktion (F)
Nε
(T = 0, μ) = θ(μ − ε)
darstellen lässt. In diesem Fall markiert μ(T = 0) eine scharfe Grenze zwischen voll(F) (F) ständig bevölkerten (Nε = 1) und vollständig leeren (Nε = 0) elementaren FermiSystemen, die auch die Fermi-Kante genannt wird. Im Gegensatz zu Bose-Systemen
500 | 14 Fermi-Systeme g(ε)
ky
g(ε F)
(c)
kx
ε
εF
ε (k)
εF
ε(k)=ε F +vF(k-kF)
(b) 2π Δk = L
Fermi -Kugel
(a)
kF
k
Abb. 14.2. a) Die Punkte bezeichnen erlaubte k-Vektoren in der kx , ky -Ebene. Die unbevölkerten elementaren Fermi-Systeme außerhalb der Fermi-Kugel sind grau dargestellt. b) Quadratische Dispersionsrelation ε(k) und c) zugehörige Zustandsdichte g(ε). Die bevölkerten Bereiche unterhalb der Fermi-Energie εF (n) sind schattiert.
ist μ − ε0 im Grenzfall T → 0 stets positiv! In Abb. 14.2a werden die elementaren Fermi-Systeme durch äquidistante Punkte im Raum der erlaubten Wellenvektoren (kRaum) repräsentiert. Für eine kugelsymmetrische Dispersionsrelation bilden die mit Teilchen bevölkerten elementaren Fermi-Systeme eine Kugel im k-Raum, die auch die Fermi-Kugel genannt wird. Die bevölkerten und die unbevölkerten elementaren Fermi-Systeme werden durch die Fermi-Fläche voneinander getrennt.1 Für die Teilchendichte ergibt sich bei T = 0: μ n(T = 0, μ) =
dε 0
=
(2m) ˆ 3/2 √ (2m) ˆ 3/2 2 3/2 ε= μ 2 3 2π 2π 2 3 3
(2mμ) ˆ 3/2 2 = g(μ) · μ . 3 3π 2 3
(14.3)
Lösen wir diesen Ausdruck nach μ auf, so ergibt sich εF (n) := μ(T = 0, n) =
2 (3π 2 n)2/3 2m ˆ
.
(14.4)
1 In Festkörpern sind die Dispersionsrelation und damit die Fermi-Fläche nicht kugelsymmetrisch, sondern spiegeln die Symmetrie des Kristallgitters wider.
14.1 Das ideale Fermi-Gas – Elektronen in Metallen
| 501
Die Größe εF wird die Fermi-Energie2 genannt. Neben εF gibt es noch eine Reihe weiterer für das Fermi-Gas charakteristischer Kenngrößen. Für eine quadratische Dispersionsrelation in drei Dimensionen hängen diese in der nachfolgend aufgeführten Weise von der Teilchendichte ab: TF =
εF (n) kB
pF = kF = (3π 2 n)1/3
(3π 2 n)1/3 m ˆ 2π λF = pF 3 n g(εF ) = 2 εF (n) vF =
Fermi-Temperatur
(14.5)
Fermi-Impuls
(14.6)
Fermi-Geschwindigkeit
(14.7)
Fermi-Wellenlänge
(14.8)
Zustandsdichte bei εF
(14.9)
In Abbildung 14.2b und c sind die Dispersionsrelation und die Zustandsdichte mit den verschiedenen Bestimmungsgrößen des Fermi-Gases skizziert. Um ein Gefühl für Größenordnungen zu bekommen, geben wir die Werte für Kupfer als typischen Repräsentanten für Metalle an: n = 8.5 · 1022 Teilchen/cm3 εF = 1.1 · 10−18 J/Teilchen = 7.1 eV/Teilchen TF = 8 · 104 K 300 K pF = · 1.36 · 1010 /m λF = 0.46 nm ≈ a vF = 1.6 · 106 m/s
Die insgesamt sehr hohen Werte werden alle durch das Pauli-Prinzip erzwungen! Für metallische Teilchendichten ist die Fermi-Energie um Größenordnungen höher als die Raumtemperatur 300 K (26 meV). Die Fermi-Wellenlänge ist mit dem Gitterabstand a vergleichbar und die Fermi-Geschwindigkeit ist etwa einen Faktor 10 größer, als nach der klassischen Maxwell-Verteilung für Elektronen bei Zimmertemperatur erwartet wird. Wegen der großen Fermi-Energie εF kB T unterscheidet sich die Fermi-Funktion bei Zimmertemperatur drastisch von der Boltzmann-Verteilung (Abb. 12.3). Die Elektronen in Metallen bilden also unter keinen Umständen ein „klassisches“ ideales Gas, und insbesondere für die Kompressionseigenschaften ist der Grenzfall T → 0 fast immer eine gute Näherung. In diesem Fall spricht man von Fermi-Entartung.
2 Vielfach ist es üblich, nicht nur den Grenzwert μ(T = 0, n), sondern auch μ(T > 0, n) als FermiEnergie zu bezeichnen.
502 | 14 Fermi-Systeme Als nächstes berechnen wir die Energiedichte im Grundzustand: μ e(T = 0, μ) =
dε 0
(2m) ˆ 3/2 3/2 (2m) ˆ 3/2 2 5/2 3 ε = = μ·n. μ 5 2π 2 3 2π 2 3 5
(14.10)
Mit den auf Seite 501 angegebenen für Metalle typischen Werten erhalten wir e(T = 0, μ) ≈ 56 GJ/m3 . Im Gegensatz zum Bose-Gas weist das Fermi-Gas eine sehr hohe Nullpunktsenergie auf. Eliminieren wir das chemische Potenzial zugunsten der Dichte, so erhalten wir 3 2 (3π 2 n)2/3 e(T = 0, n) = (14.11) ·n. 5
2m ˆ
Die Energie pro Teilchen eˆ =
3 μ 5
sollte also nicht mit dem chemischen Potenzial verwechselt werden. Der Unterschied zwischen eˆ und μ kommt durch den Druck-Term in der Homogenitätsrelation (Gl. 5.32) eˆ = T sˆ − pˆ v+μ
zustande. Der beim „klassischen“ idealen Gas dominierende Entropie-Term T sˆ verschwindet für T TF . Lösen wir die Homogenitätsrelation nach p auf, so können wir den Nullpunktsdruck des Fermi-Gases berechnen: 3 p = −e + T s + μn = − =
5
+ 1 μn
2 2 μn = e . 5 3
(14.12)
Gleichung 14.12 haben wir bereits aus unserem einfachen kinetischen Modell für das klassische Gas erhalten (siehe Abschnitt 3.4). Im Gegensatz zu letzterem gilt beim Fermi-Gas e(T = 0, n) > 0! Die Robustheit von Gleichung 14.12 kommt dadurch, dass sie nur von der Dispersionsrelation ε(k) der Gasteilchen und nicht von der Verteilungsfunktion abhängt. Daher gilt eine analoge Relation Gl. 13.11 für ein Gas aus extrem relativistischen Teilchen, die ebenfalls von der Verteilungsfunktion und damit von der Statistik überhaupt unabhängig ist. Die Werte des Nullpunktsdrucks sind in Metallen ganz erheblich: p(T = 0, n) ≈ 3.7 · 105 bar
Der Nullpunktsdruck wird vom Kristallgitter aufgenommen. Er bewirkt außerdem, dass das Elektronengas etwas über die Ionenrümpfe in das Vakuum hinausragt und eine elektrische Dipolschicht bildet.3 In der Astrophysik ist der Fermi-Druck der Elektronen beziehungsweise der Neutronen der wesentliche Faktor, der im Wettstreit mit
3 In der Oberflächenphysik ist dieses Phänomen als der Smoluchowski-Effekt bekannt. Der elektrische Potenzialabfall über der Dipolschicht hängt von der Orientierung der Kristalloberfläche ab und ist dafür verantwortlich, dass die Austrittsarbeit, die aufgewandt werden muss, um ein Elektron aus dem Metall ins Vakuum zu bringen, entlang der Kristalloberfläche variieren kann.
14.1 Das ideale Fermi-Gas – Elektronen in Metallen
| 503
der Gravitation den Gleichgewichtsradius von weißen Zwergen und Neutronensternen bestimmt. Obwohl weiße Zwerge typische Temperaturen von ca. 107 K aufweisen, sind deren Dichte und Fermi-Energie so hoch, dass μ − ε0 kB T ist und diese als „kalt“ angesehen werden müssen. Da bei T = 0 die Wahrscheinlichkeiten W0 und W1 für die Zustände Nk = 0 und Nk = 1 aller elementaren Fermi-Systeme entweder 0 oder 1 betragen, ist die Entropie jedes elementaren Fermi-Systems und damit die des Fermi-Gases insgesamt gleich Null. Das Fermi-Gas genügt damit dem Dritten Hauptsatz. Die Fermi-Kugel bei T = 0 bildet bei fester Dichte n den Grundzustand des FermiGases. Wird dagegen nur die Teilchenzahl N festgehalten und das Volumen V variiert, so handelt es sich nicht um nur einen Zustand, sondern um eine ganze Zustandsmenge – also ein System –, welche noch Kompressions- und Expansionsprozesse erlaubt. Diese Eigenschaft teilt das Fermi-Gas mit dem Bose-Gas und auch mit allen anderen Systemen am absoluten Nullpunkt. Die Bedingung T = 0 eliminiert zwar den thermischen Freiheitsgrad aus dem System, aber alle anderen Freiheitsgrade folgen weiterhin den Regeln der Thermodynamik.
14.1.4 Abschirmung im entarteten Fermi-Gas Aus der Zustandsgleichung des Fermi-Gases μ n(T = 0, μ) =
dε g(ε) 0
können wir für eine beliebige Dispersionsrelation die Teilchenkapazität4 des FermiGases bei T = 0 ablesen, da die Ableitung eines Integrals nach der oberen Integrationsgrenze gerade den Integranden liefert: ν=
∂n(T = 0, μ) = g(μ) . ∂μ
(14.13)
Dieses Ergebnis ist von großer Bedeutung, weil wir damit alle Erkenntnisse, die wir in den Abschnitten 8.3 und 8.4 über Diffusion und Abschirmung gesammelt haben, auf entartete Fermi-Gase – insbesondere auf die Elektronen in Metallen – übertragen können. Die Abschirmung elektrostatischer Felder im Rahmen der Thomas-Fermi-Beschreibung unterscheidet sich von der Debye-Hückel-Abschirmung in in Elektro-
4 Diese Relation wird von manchen Autoren auch zum Anlass genommen, ∂n/∂μ als „thermodynamische Zustandsdichte“ zu bezeichnen. Diese Ausdrucksweise ist sehr unglücklich, weil eine thermodynamische Suszeptibilität grundsätzlich von allgemeinerer Natur ist als die für das spezielle Modell des entarteten Fermi-Gases spezifische Relation 14.13.
504 | 14 Fermi-Systeme lytlösungen nur in der Teilchenkapazität ν . Setzen wir den neuen Ausdruck für die Teilchenkapazität in Gl. 8.36 ein, so ergibt sich εr ε0 εr ε0 λS = (14.14) = . 2 2 qˆ ν
e g(μ)
Setzt man für Metalle typische Werte der Parameter ein, so ergibt sich, dass die Thomas-Fermi-Abschirmlänge in Metallen nur Bruchteile eines Nanometers beträgt. Die Abschirmung ist damit extrem effektiv, was den überraschenden Erfolg des Modelles freier Elektronen in vielen Metallen erklärt.5 Allerdings beschreibt das Thomas-Fermi-Modell die Abschirmung in Metallen nur grob. Der Grund ist der, dass die Antwort des Elektronengases auf die Störung des zugrunde liegenden elektrochemischen Gleichgewichts durch eine Punktladung im Thomas-Fermi-Modell nicht korrekt beschrieben werden kann, weil das Elektronengas neben λS eine zusätzliche Längenskala, nämlich die Fermi-Wellenlänge enthält. Auf Fourier-Komponenten des Stör-Potenzials mit |q| > kF kann das Elektronengas nicht reagieren, weil keine Elektronen mit Wellenlängen λ = 2π/k < λF vorhanden sind. Dennoch wird die Thomas-Fermi-Näherung häufig verwendet, um den Effekt der Abschirmung zumindest qualitativ zu berücksichtigen. Wie in den Lehrbüchern der Festkörperphysik dargestellt wird, führt die Stufe der Fermi-Funktion bei μ ¯ zu einem recht abrupten Abfall der (q -abhängigen) dielektrischen Suszeptibilität χel (q) bei |q| 2kF . Die Stufe in χel bei 2kF führt bei der FourierRücktransformation in den Ortsraum zu räumlichen Oszillationen in der durch eine punktförmige Störladung induzierten „Antwort“ des Elektronensystems. Diese Oszillationen heißen Friedel-Oszillationen und geben zu mannigfachen Effekten Anlass. Die wohl wichtigste Konsequenz ist die über das System der Leitungselektronen vermittelte oszillatorische Austauschkopplung zwischen lokalisierten magnetischen Momenten, die als RKKY-Wechselwirkung6 bekannt ist. Mit Hilfe von Gl. 5.44 berechnen wir noch den Beitrag des Elektronengases zur Kompressibilität: κT =
1 ∂n 3 1 1 31 9 1 = 2 g(μ) = = = ∝ n−5/3 . 2 nμ 5p 10 e n2 ∂μ n
(14.15)
5 In niedrigeren Dimensionen d = 2 und noch stärker in d = 1 ist die Abschirmung viel weniger effektiv als in drei Dimensionen. Entsprechend sind Effekte der Elektron-Elektron-Wechselwirkung in diesen Fällen, die im Fall von ultradünnen Metallfilmen und zweidimensionalen Elektronensystemen in Halbleiter-Heterostrukturen (Abschnitt 15.1.1) sowie in Quantendrähten (Abschnitt 15.3) experimentell realisiert werden können, viel bedeutsamer als in dreidimensionalen Systemen. In einer Dimension kommt es sogar zu einer fundamentalen Instabilität der Fermi-Systeme, und die Anregungszustände des Systems lassen sich näherungsweise durch Bose-Gase beschreiben. In diesem Fall spricht man von Luttinger-Flüssigkeiten. 6 Ruderman-Kittel-Kasuya-Yoshida-Wechselwirkung
14.1 Das ideale Fermi-Gas – Elektronen in Metallen
| 505
Das Ergebnis ist (bis auf den Faktor 3/5) identisch mit dem für das „klassische“ ideale Gas, aber p(T = 0) ist um den Faktor 105 größer als für das ideale Gas bei Standardbedingungen. Daher ist die Kompressibilität einen Faktor 105 kleiner. Das Ergebnis stimmt grob (bis auf einen Faktor 2–3) mit den experimentellen Werten für κT überein. Neben den freien Elektronen liefern die Ionenrümpfe noch einen vergleichbar großen Beitrag.
14.1.5 Kontaktspannungen In diesem Abschnitt besprechen wir die Eigenschaften einer elektrischen Kontaktfläche zwischen zwei Metallen mit unterschiedlichem chemischem Potenzial μ. Die Verhältnisse vor und nach der Herstellung des Kontakts sind in Abb. 14.3 graphisch veranschaulicht. Solange die beiden Metalle elektrisch isoliert sind, sind ihre elektrochemischen Potenziale verschieden. Der Potenzialunterschied kann zur Arbeitsleistung der Elektronen durch deren Übertritt von einem Metall ins andere ausgenutzt werden.7 Sobald ein Ladungsstrom zwischen beiden Metallen fließen kann, folgen die Elektronen dem Gradienten von μ ¯ und fließen von links nach rechts in das Metall mit dem niedrigeren elektrochemischen Potenzial, entsprechend der höheren Austrittarbeit, bis die Metalle im elektrochemischen Gleichgewicht sind. Die übertretenden Elektronen werden von den zurückbleibenden positiv geladenen Ionenrümpfen elektrostatisch angezogen und bilden eine extrem dünne elektrische Dipol-Schicht an der Grenzfläche. Die Dicke der Dipolschicht ist (in einfachster Näherung) durch die Thomas-FermiAbschirmlänge gegeben. Im Inneren der Metalle ändert sich die Ladungsdichte nicht – dies würde extrem viel elektrostatische Energie kosten. Daher bleiben die chemischen Potenziale μ = μ ¯ + qˆφQ auf beiden Seiten unverändert. Durch einen Ladungstransfer von dem Metall mit der kleineren Austrittsarbeit zu dem mit der größeren stellt sich die Ladungsverteilung an der Grenzschicht so ein, dass die Summe aus elektrostatischer und chemischer Energie minimal wird. Durch die räumliche Variation des elektrostatischen Potenzials φQ (x) in der Nähe der Grenzfläche verschieben sich die Energien der elementaren Fermi-Systeme lokal gemäß ε(k, r) = ε(k) + qˆφQ (r), so dass ε(k, r) − μ(r) von den lokalen Werten des elektrostatischen Potenzials unabhängig ist. ε(k, r) ist die Summe aus kinetischer und potenzieller Energie – analog zur klassischen Mechanik. Streng genommen ist diese Betrachtung nur möglich, wenn die räumlichen Variationen von φQ (r) auf Längenskalen erfolgen, die groß gegen die Fermi-Wellenlänge sind,
7 In diesem Zusammenhang wird in der Literatur auch oft die Austrittsarbeit WA = εvakuum − μ ¯ verwendet, welche die Lage des elektrochemischen Potenzials relativ zum Vakuumniveau außerhalb des Metall angibt. Innerhalb des Metalls ist es üblich, alle Energien relativ zum Boden des Leitungsbands ε0 anzugeben. Hier folgen wir der zweiten Konvention.
506 | 14 Fermi-Systeme
εvakuum
(a)
(b)
WA,L e-
μF,L
WA
WA,R
μF,R
μF,L
ε0
+
−
μF,R
- eφL
μL,R
- e φR
Abb. 14.3. a) Energieschema zweier Metalle A und B mit verschiedenem chemischen Potenzial μA > μB vor der Herstellung eines elektrischen Kontakts. Beide Metalle sind zunächst elektrisch neutral. b) Energieschema nach der Herstellung des Kontakts. Durch den Übertritt von Elektronen von rechts nach links kommt es zur Ausbildung einer Raumladungszone (rote Linie) der Dicke λS an der Grenzfläche zwischen beiden Materialien, bis der dazu gehörige elektrische Potenzialabfall eine Angleichung zwischen beiden elektrochemischen Potenzialen bewirkt. Nach der Angleichung verschwindet der Antrieb Δ¯ μ=μ ¯A − μ ¯B für den Ladungstransfer.
weil die ε(k) den Energieniveaus delokalisierter Elektronenzustände entsprechen. Wegen der sehr kleinen Werte von kS , die mit den Atomabständen vergleichbar sind, ist klar, dass der genaue elektrische Potenzialverlauf in der Nähe der Grenzfläche durch dieses extrem vereinfachende Modell nicht realistisch zu beschreiben ist. Dennoch ist unsere Betrachtung nützlich, weil sie den Wert der auftretenden Kontaktspannung
qˆUKontakt = −e φQ,L − φQ,R = (μL − μR ) = (WA,L − WA,R )
(14.16)
korrekt wiedergibt. Der Wert von UKontakt ist von den Details der Dipolschicht unabhängig. Ganz ähnliche Phänomene treten an Halbleitergrenzflächen auf (Abschnitt 14.5). Wegen der wesentlich geringeren Dichte der Ladungsträger ist die Dicke der Raumladungszone in Halbleitern erheblich größer. Der experimentelle Nachweis der Kontaktspannung kann nicht mit Hilfe eines Voltmeters erfolgen, weil ein Voltmeter stets einen (bei guten Voltmetern mit hohem Innenwiderstand sehr kleinen) elektrischen Strom benötigt, der nur fließt, wenn dafür ein Antrieb, also eine Differenz der elektrochemischen Potenziale besteht. Dies ist hier gerade nicht der Fall! Es ist aber möglich, den bei der Einstellung des Gleichgewichts fließenden Strom zu messen, indem man das Gleichgewicht periodisch stört. Dazu schließt man die Metallstücke an einen kleinen Kondensator an, dessen Ladungskapazität zum Beispiel durch Abstandsänderungen zeitlich variiert werden kann. Der Kondensator lässt sich auch durch die schwingende Spitze eines Rasterkraft-Mikroskops realisieren – auf diese Weise erhält man ein Instrument zur Vermessung von räumlichen Variationen der lokalen Austrittsarbeit, welches nach dem Entdecker der Kontaktspannung „Kelvin-Sonde“ genannt wird.
14.2 Thermische Eigenschaften des Fermi-Gases
| 507
14.2 Thermische Eigenschaften des Fermi-Gases 14.2.1 Sommerfeld-Entwicklung Bei endlichen Temperaturen bewirken die thermisch angeregten Teilchen eine „Verschmierung“ der bei T = 0 scharfen Kante in der Fermi-Funktion. In diesem Fall sind die Zustandsgleichungen für eine extensive Größe X , das heißt Integrale vom Typ (F)
X(T, V, μ) = V · x(T, μ) = V ·
dεg(ε)Nε
(T, μ) · X(ε) ,
nicht mehr in geschlossener Form anzugeben. Ein von Sommerfeld erdachtes Näherungsverfahren zur Auswertung der Zustandsgleichungen nutzt aus, dass sich die Fermi-Funktionen bei 0 < T TF im Vergleich zu T = 0 nur in einem engen Energiebereich von einigen kB T um μ herum etwas ändert. Wir betrachten zwei Funktionen A(ε) und B(ε), für die gilt: ε A(ε) := g(ε)X(ε),
B(ε) =
A(ε )dε ,
0
wobei g(ε) ≡ 0 für ε ≤ ε0 und B(ε) die Stammfunktion von A(ε) ist. Daraus folgt: A(ε) =
dB(ε) = B (ε) dε
(F)
Die partielle Integration von A(ε)Nε (T, μ) liefert: ∞
(F) dε A(ε) Nε (T, μ)
=
0
∞ (F) B(ε)Nε (T, μ) + ε0
=0
+∞
dε B(ε)
(
(F)
−
∂Nε
(T, μ) ∂ε
) .
0
Die (negative) Ableitung der Fermi-Funktion (F)
−
∂Nε
(T, μ) 1 = ∂ε kB T
exp
exp
ε−μ kB T
ε−μ kB T
+1
−2 1 ε−μ 2 = 4k T cosh 2k T B B
(14.17)
hat eine Glockenform mit der Breite 4kB T und fällt zu den Flanken hin exponentiell ab. Im Grenzfall T → 0 strebt die Ableitung der Fermi-Funktion gegen die δ -Funktion, (F) welche bei Ausführung der Integration über A(ε)Nε (T, μ) den Wert B(μ) liefert. Die Idee besteht jetzt darin, die Funktion A(ε) um μ in eine Taylor-Reihe zu entwickeln A(ε) = A(μ) + A (μ)(ε − μ) +
1 A (μ)(ε − μ)2 + · · · . 2
Damit erhalten wir eine Reihenentwicklung für die X -Dichte x(T, μ) 8 8 Die Terme mit ungeraden Potenzen von ε − μ fallen weg, weil cosh(x) eine in x gerade Funktion ist.
508 | 14 Fermi-Systeme (F)
dN¡ ¡
4
(F)
Abb. 14.4. Ableitung von −Nε nach ε. Im Grenzfall T → 0 strebt die Ableitung gegen die Delta-Funktion δ(ε − μ).
¡ +
-4
-2
2
4
x(T, μ) = x(T = 0, μ) + B1 A (μ)(kB T )2 + B2 A (μ)(kB T )4 + · · · ,
(14.18)
wobei die Koeffizienten Bn durch die Integrale 1 Bn = (2n)!
+∞ −∞
x2n dx 4 cosh2 (x/2)
mit x =
ε−μ kB T
(14.19)
gegeben sind. Die (nicht-triviale) Auswertung dieser Integrale liefert schließlich B1 =
π2 , 6
B2 =
7π 4 , 360
··· .
Bei stark entarteten Fermi-Gasen wie den Elektronen in Metallen ist zum Glück der erste T -abhängige Term der Entwicklung hinreichend. Damit sind wir jetzt für die Auswertung der Zustandsgleichungen des Fermi-Gases angemessen vorbereitet. Gleichung 14.18 zeigt, dass alle extensiven Größen X des Fermi-Systems als Summe von zwei Termen darstellbar sind: X(T, V, μ) = X0 (V, μ) + XA (T, V, μ) Grundsystem
(14.20)
Anregungen
Wie bei den Bose-Systemen legt dies nahe, das entartetes Fermi-Gas näherungsweise in ein durch die Größen X0 beschriebenes Grundsystem und das durch die Größen XA beschriebene System der thermischen Anregungen zu zerlegen.
Das in Abschnitt 14.1.3 beschriebene Grundsystem besitzt keine thermischen Variablen und erlaubt nur mechanische (Expansion und Kompression) und chemische (Änderungen der Teilchenzahl) Prozesse.
14.2 Thermische Eigenschaften des Fermi-Gases
| 509
Das in den nachfolgenden Abschnitten beschriebene System der thermischen Anregungen erlaubt neben den mechanischen und chemischen auch thermische Prozesse, welche wie bei den Bose-Systemen vom zweiten Typ (Abschnitt 12.6) stets mit der Erzeugung und Vernichtung von Teilchen verknüpft sind. Es sind zwei Typen von Anregungen zu unterscheiden: Teilchen-artige und Loch-artige Anregungen. Die ersteren leben oberhalb der Fermi-Kante, die letzteren unterhalb. (F) Die Symmetrie der Fermi-Funktion um den Punkt Nε (T, μ) = 1/2 legt für viele Anwendungen nahe, den Nullpunkt der Anregungs-Energie mit μ zu identifizieren und von dort aus die Anregungsenergie sowohl der Teilchen als auch der Löcher positiv zu zählen. Ein ähnliches Vorgehen ist nicht nur bei Metallen, sondern auch in der Halbleiterphysik und in der Physik der Elementarteilchen üblich. Dem liegt die Erkenntnis zugrunde, dass fermionische Anregungs-Zustände stets paarweise, das heißt in Teilchen/Anti-Teilchen-Paaren, auftreten.
14.2.2 Thermische Zustandsgleichung Im Fall der thermischen Zustandsgleichung identifizieren wir die Funktion A(ε) und ihre Ableitung mit A(ε) = g(ε) ,
A (ε) = g (ε) .
Damit erhalten wir für die Teilchendichte n(T, μ) = n(T = 0, μ) +
π2 g (μ) (kB T )2 . 6
(14.21)
Diese Beziehung ist der zu Gleichung 12.36 komplementäre Grenzfall nλ3T 1 der allgemeinen thermischen Zustandsgleichung 12.28. Sie besagt, dass bei festem μ die Teilchendichte von der Temperatur abhängt. Bei „klassischen“ Gasen ist uns dies bekannt – nach Gl. 5.45 gilt für den thermischen Ausdehnungskoeffizienten βμ = −[∂n(T, μ)/∂T ]/n. Bei Fermi-Gasen, flüssigem 3He und den meisten anderen Systemen mit neutralen Fermionen ist g (μ) > 0 und die Zustandsdichte ist für Energien ε > εF oberhalb der Fermi-Kante größer als für Energie unterhalb der FermiKante. Will man diese Systeme bei konstantem μ aufheizen, so ist das nur möglich, wenn Teilchen aus einem Reservoir zufließen.9 Zunächst wollen wir davon ausgehen, dass sich das System im thermischen Gleichgewicht befindet (T (r) = const.) und dass es gegen Teilchenaustausch isoliert ist. Dann ist n(T, μ) konstant, und μ muss sich bei Erwärmung hin zu kleineren
9 Es gibt aber auch Systeme, wie zum Beispiel das Metall Zink, bei denen g (μ) < 0 ist.
510 | 14 Fermi-Systeme
ε
μ1
ε
g(ε)
kalt
kBT2
μ2
kBT1
ε0
ε0
(F)
(F)
Nε 0
0.5
g(ε)
heiß
Nε
1
0
0.5
1
Abb. 14.5. Illustration der Verschiebung des chemischen Potenzials bei Erhöhung der Temperatur von (F) T1 = 0.05(εF − ε0 )/kB auf T2 = 0.5(εF − ε0 )/kB . Bei konstanter Dichte n = dε g(ε)Nε (T, μ) (Flächeninhalt der grau schattierten Bereiche) bewirkt eine Erhöhung der Temperatur wegen der Asymmetrie der Zustandsdichte g(ε) (schwarze Linien) oberhalb und unterhalb von εF eine Verschiebung des chemischen Potenzials. ε0 bezeichnet im Metall die Energie am Boden des Leitungsbands.
Energien verschieben, um dafür zu sorgen, dass oberhalb von μ nicht mehr elementare Fermi-Systeme mit Teilchen besetzt sind, als unterhalb von μ mit Löchern besetzt sind. Die Bedingung n(T, μ) = const. bedeutet, dass sich die durch den ersten Term von Gl. 14.21 beschriebene Änderung der Teilchendichte durch die Verschiebung von μ(0, n) → μ(T, n) und der T -abhängige zweite Term in Gl. 14.21 gegenseitig kompensieren müssen: n(T, μ) = n(0, εF ) + g(εF ) μ(T, n) − εF (n) +
π2 ! g (εF )(kB T )2 + O(kB T )4 = n(0, εF ) . 6
Die Änderungen von g und g bei der Verschiebung von μ können in linearer Näherung vernachlässigt werden. Daraus folgt
0 = g(εF ) μ(T, n) − εF (n) +
π2 g (εF )(kB T )2 + O(kB T )4 . 6
(14.22)
Lösen wir diese Gleichung nach μ auf, so resultiert als thermische Zustandsgleichung des entarteten Fermi-Gases: *
+
π 2 g εF (n) * + (kB T )2 + O(kB T )4 . μ(T, n) = εF (n) − 6 g εF (n)
(14.23)
Für freie Teilchen mit einer quadratischen Dispersionsrelation gilt in drei Dimensionen g (ε) = g(ε)/(2ε) und wir erhalten:
14.2 Thermische Eigenschaften des Fermi-Gases
| 511
1 μ/εF
^ e/ε F
3/5
p/(nεF)
2/5 0
0.1
0.2
Abb. 14.6. Temperaturabhängigkeit von eˆ/εF , μ/εF und p/(nεF ) bei konstanter Dichte n nach der Sommerfeld-Entwicklung.
T/TF
0 μ(T, n) = εF (n)
1−
π2 12
kB T εF (n)
2 + O(kB T )4 .
(14.24)
Sowohl μ als auch pˆ v = p/n sind in Abb. 14.6 dargestellt. Wird ein Metalldraht inhomogen erwärmt, verschiebt sich nicht nur das lokale chemische Potenzial, sondern es kommt auch zu einer thermisch induzierten Ladungsverschiebung. Da es extrem viel elektrostatische Energie kosten würde, die Teilchendichte homogen zu ändern, bilden sich Oberflächenladungen mit einem entsprechenden elektrostatischen Potenzialgradienten aus, die eine Verschiebung des elektrochemischen Potenzials μ ¯ und der Zustandsdichte auf der Energieskala bewirken.
14.2.3 Kalorische Zustandsgleichung Die Anwendung der Sommerfeld-Entwicklung Gl. 14.18 auf die kalorische Zustandsgleichung führt auf die Funktionen A(ε) = εg(ε)
und
A (ε) = g(ε) + εg (ε) .
Damit resultiert für die Energiedichte zunächst
e(T, μ) = e(0, μ) +
π2 g(μ) + μg (μ) (kB T )2 + O(kB T )4 . 6
(14.25)
Diese Form der Zustandsgleichung ist von geringerer praktischer Bedeutung, weil thermische Phänomene meist an Körpern untersucht werden, die gegen Teilchenaus-
512 | 14 Fermi-Systeme tausch isoliert sind.10 Um den Fall konstanter Teilchendichte zu behandeln, müssen wir μ zugunsten von n eliminieren. Ähnliche Überlegungen wie im vorangegangenen Abschnitt führen auf , * + π2 e(T, μ) = e(0, εF ) + εF g(εF ) μ − εF +
6
g (εF )(kB T )2
π2 (14.26) g(εF )(kB T )2 + O(kB T )4 . 6 Wie wir oben gesehen haben, führt die Forderung n(T, μ) = const. auf Gleichung 14.22. +
Daher verschwindet die geschwungene Klammer in Gleichung 14.26 und die kalorische Zustandsgleichung nimmt die Form e(T, n) = e(0, n) +
+ π2 * g εF (n) (kB T )2 + O(kB T )4 6
an. Für eine quadratische Dispersion gilt wegen n = 1/ˆ v: ⎡ 2 ⎤ 2 3 k T π B ⎦ . eˆ(T, vˆ) = εF (ˆ v) ⎣ + 5
6
εF (ˆ v)
(14.27)
(14.28)
Der Verlauf von eˆ(T, n) ist zusammen mit dem von μ(T, n) und p(T, n) in Abb. 14.6 abgebildet. Im Gegensatz zum „klassischen“ idealen Gas ist eˆ(T, vˆ) wegen des PauliPrinzips über εF (ˆ v ) sehr stark vom Volumen abhängig. Durch Ableitung nach der Temperatur erhalten wir sofort die spezifische Wärmekapazität (pro Volumen) des entarteten Fermi-Gases: cv (T, n) = nˆ cv (T, n) =
+ 2 ∂e(T, n) π2 * · T = nγ T . = g εF (n) kB ∂T 3
(14.29)
Die spezifische Wärmekapazität variiert linear mit T , und der Vorfaktor γ = cˆ(T )/T heißt der Sommerfeld-Koeffizient.11 Die molare Entropie, welche die kalorischen Eigenschaften des Fermi-Gases bestimmt, ist nach Gl. 2.16 ebenfalls durch γ bestimmt:
s(T, n) = nˆ s(T, n) =
+ 2 π2 * · T = nγ T . g εF (n) kB 3
(14.30)
Für eine quadratische Dispersionsrelation können wir Gl. 14.9 einsetzen und erhalten die Wärmekapazität pro Teilchen
π 2 kB T cˆv (T, n) = · kB . (14.31) 2
εF
10 Die in den Abschnitten 8.9, 14.4 und 14.5.3 diskutierten thermoelektrischen Phänomene bilden hier eine Ausnahme. 11 Die Bezeichnung γ soll Verwechslungen mit dem Adiabatenexponenten γ vorbeugen.
14.2 Thermische Eigenschaften des Fermi-Gases
1
c^ v / T (mJ/mol K 2 )
8
T (K) 3
2
| 513
4
Au Ag Cu
6 4 2 0
0
5 T
2
10 (K 2 )
15
Abb. 14.7. Molare Wärmekapazität der Edelmetalle in der Auftragung cˆ/T über T 2 . In dieser Auftragung lassen sich der elektronische und der Phononen-Beitrag zur Wärmekapazität trennen. Der Achsenabschnitt der linearen Extrapolation zum Datenpunkt T = 0 ergibt den Sommerfeld-Koeffizienten γ . Die Steigung der Ausgleichsgeraden ergibt den Vorfaktor β des Debye’schen T 3 -Gesetzes aus Gl. 13.24 (nach [31]).
Dieses Ergebnis unterscheidet sich für typische Werte von εF stark von dem für das „klassische“ ideale Gas cˆv =
3 π2 T ·k , · kB 2 2 TF B
nämlich um den Faktor kB T /εF ≈ 300 bei 300 K. Dies ist die Lösung eines anderen großen Rätsels der Physik um 1900 – nämlich die Tatsache, dass sich die Leitungselektronen in Metallen bezüglich der elektrischen Leitfähigkeit wie ein Gas verhalten, ohne in der Wärmekapazität mit dem nach dem Gleichverteilungssatz erwarteten Beitrag cˆv,el = 3kB /2 zu erscheinen. In Abb. 14.7 sind experimentelle Daten für die Edelmetalle Kupfer, Silber und Gold dargestellt. Obwohl diese Metalle in ihren elektronischen Eigenschaften fast identisch sind,12 unterscheiden sich ihre Wärmekapazitäten bei tiefen Temperaturen erheblich. Dies liegt an den Unterschieden in ihrer Debye-Temperatur, die auf das deutlich unterschiedliche Atomgewicht dieser Stoffe zurückzuführen sind.
12 Der auffällige Unterschied in der Farbe dieser Metalle entsteht durch vergleichsweise subtile Unterschiede in der Bandstruktur, das heißt in der elektronischen Dispersionsrelation bei hohen, für das thermische Verhalten irrelevanten Energien.
514 | 14 Fermi-Systeme
2
γ ¶ (mJ / mol K )
10
1
0.1 0
20
40 60 Ordnungszahl
80
100
Abb. 14.8. Sommerfeld-Konstante γ der metallischen Elemente. Der Beginn einer neuen Schale im Atomaufbau durch die Alkali-Metalle ist rot markiert – im Gegensatz zu den Debye-Temperaturen zeigt die Sommerfeld-Konstante hier keine Auffälligkeiten. Dagegen weisen die kleinen Werte von γ für die Halbmetalle Be, As, Sb und Bi auf sehr kleine Fermi-Flächen hin (Daten aus [31]).
In Abb. 14.8 sind die Sommerfeld-Koeffizienten der metallischen Elemente dargestellt. Ähnlich wie bei der Debye-Temperatur ist die Schalenstruktur der Atome im Periodensystem auch in der elektronischen Zustandsdichte an der Fermi-Kante deutlich zu erkennen. Die Alkali-Metalle sind rot eingezeichnet. Auffallend ist die niedrige Zustandsdichte der Halbmetalle Be, As, Sb und Bi sowie die hohe Zustandsdichte der Übergangsmetalle, zu der nicht nur die s- und p-Elektronen, sondern auch die flachen d-Bänder mit ihren hohen Zustandsdichte beitragen. Darüber hinaus gibt es intermetallische Verbindungen13 wie CeCu6 oder UPt3 , die sich durch sehr hohe Werte des Sommerfeld-Koeffizienten (m ˆ 1000 m ˆ 0 ) auszeichnen, wobei m ˆ 0 die Masse von Elektronen im Vakuum ist. In diesen Materialien werden Elektron-Elektron-Wechselwirkungseffekte wichtig, die zu solch exotischem Verhalten führen (Abschnitt 14.3.1). Obwohl das entartete Fermi-Gas, beziehungsweise sein unten beschriebenes Pendant in wechselwirkenden Systemen, die Fermi-Flüssigkeit, den thermodynamischen
13 Darunter versteht man metallische Verbindungen, die im Gegensatz zu einer gewöhnlichen Legierung eine feste Stöchiometrie und eine einheitliche Kristallstruktur haben, die sehr hohe Qualität erreichen kann. In solchen Systemen ist es möglich, auch in einer metallischen Verbindung sehr große freie Weglängen zu erreichen, die nötig sind, um spezifische Effekte von der Bandstruktur solche Systeme sichtbar zu machen und zu untersuchen.
14.2 Thermische Eigenschaften des Fermi-Gases
b)
25
4 3
Γph
20
el
βp / T (10-9 K-2)
a)
| 515
2
15 1 10
0
20
40
60
80
100
0
100
200
300
400
500
T2 (K2)
Abb. 14.9. a) Messwerte des thermischen Ausdehnungskoeffizienten von Platin. Wie bei der Wärmekapazität erlaubt die Auftragung βp /T über T 2 die Trennung von Phononen- (Steigung) und ElektronenBeitrag (Achsenabschnitt). b) Elektronischer (rot) und Phononen-Grüneisen-Parameter (schwarz) für verschiedene Metalle [33].
Grundzustand der Elektronen in vielen Metallen gut beschreibt, entwickelt die Mehrzahl der Metalle unterhalb einer kritischen Temperatur einen anderen fermionischen Grundzustand, nämlich das supraleitende Kondensat, welches in vielen Eigenschaften dem suprafluiden Kondensat im 4He ähnlich ist (Abschnitt 14.6).
14.2.4 Thermische Ausdehnung Die thermische Ausdehnung von Metallen wird neben dem in Abschnitt 13.2.3 besprochenen Druck des Phononensystems auch durch einen elektronischen Beitrag bestimmt. In der Sommerfeld-Näherung erhalten wir p(T, n) =
+ 2 2 π2 * e(T, n) = e(0, n) + g εF (n) (kB T )2 . 3 3 9
Für den elektronischen Beitrag zum thermischen Ausdehnungskoeffizienten ergibt sich damit in Analogie zu Gl. 13.32 βp,el (T ) = κT Γel cel (T )
und liefert einen linearen Beitrag zum thermischen Ausdehnungskoeffizienten, wie in Abb. 14.9a für Platin illustriert ist. Dieser ist wie der elektronische Beitrag zur Wärmekapazität nur bei tiefen Temperaturen von Bedeutung. Der elektronische GrüneisenParameter Γel hat für nicht-wechselwirkende Elektronen mit quadratischer Dispersion den Wert 2/3. In der Realität ist die Dispersionsrelation weder quadratisch noch unabhängig vom Dehnungszustand. Selbst im Modell unabhängiger Elektronen verschieben sich die Energien der elementaren Fermi-Systeme bei Dehnung der Kristalls, weil die quantenmechanischen Überlapp-Integrale der atomaren Wellenfunktionen, welche die Bandstruktur bestimmen, exponentiell vom Gitterabstand abhängen. Weitere
516 | 14 Fermi-Systeme Beiträge resultieren aus der Elektron-Elektron-Wechselwirkung. In Abb. 14.9b sind die Messwerte für den elektronischen und den Phononen-Grüneisen-Parameter verschiedener Metalle dargestellt. Oft liegen beide Grüneisen-Parameter recht nahe beieinander, in einigen Fällen (Cd, W, Re) gibt es jedoch auch große Unterschiede.
14.2.5 Pauli-Suszeptibilität In Gegenwart eines Magnetfeldes zeigt sich, dass in Fermi-Gasen mit dem Spin 1/2 für jeden möglichen Wellenvektor k zwei elementare Fermi-Systeme existieren, die sich in der Orientierung des Spins relativ zum Magnetfeld unterscheiden. Ähnlich wie bei der Betrachtung lokalisierter Spins in Abschnitt 10.3 ist das Fermi-Gas daher in zwei Fermi-Gase mit entgegengesetzter Spin-Polarisation zerlegbar, da sich die Energien aller elementaren Fermi-Systeme mit derselben Spin-Orientierung in einem nach oben gerichteten Magnetfeld um denselben Betrag Δε = ±μB Bext verschieben.14 In Abb. 14.10a macht sich dies in einer starren Verschiebung der Zustandsdichten g↑ (ε) und g↓ (ε) der beiden Teilsysteme bemerkbar. Durch Spin-Flip-Prozesse relaxiert der resultierende Nichtgleichgewichts-Zustand in Richtung des chemischen Gleichgewichts zwischen beiden Teilgasen. Dabei wächst die Dichte n↑ der energetisch begünstigten ↑-Spins mit nach oben gerichteten magnetischen Moment auf Kosten der Dichte n↓ der entgegengesetzt orientierten Spins, bis sich die chemischen Potenziale μ↑ (T, n↑ ) = μ↓ (T, n↓ ) beider Teilsysteme angeglichen haben. Dabei muss die Gesamtdichte n = n↑ + n↓ konstant bleiben. Die Änderungen der Teilchendichten der beiden Spin-Subsysteme betragen im Grenzfall T → 0: δn↑,↓ = ±g↑,↓ (εF ) μB Bext ,
wobei g↑,↓ (εF ) = gF /2 die Zustandsdichte der Spin-Subbänder ohne Magnetfeld ist. Damit erhalten wir die von den unkompensierten Spins herrührende Magnetisierung
M = μB n↑ − n↓ = gF μ2B Bext .
Die Spin-Suszeptibilität des Fermi-Gases ist also paramagnetisch und beträgt im Grenzfall T → 0 χPauli = μ0 μ2B gF
Pauli-Suszeptibilität .
(14.32)
14 Im Falle von Kernspins ist das Bohr’sche Magneton μB durch das Kern-Magneton μK = e/(2m ˆ p) zu ersetzen, wobei m ˆ p die Protonenmasse ist. Aufgrund des Massenverhältnisses m ˆ p /m ˆ e = 1836 sind die magnetischen Momente von Atomkernen typischerweise etwa 2000-mal kleiner als die der Elektronen.
14.2 Thermische Eigenschaften des Fermi-Gases
a)
b)
1.4 T-1
1.0
bn r / r0
bn
| 517
0.6 0.4
3
He
gBBext 0.2
g
0.01
g
T (K)
0.1
1
Abb. 14.10. a) Verschiebung der Zustandsdichten g↑ und g↓ für die Subsysteme mit Spin ↑ und Spin ↓ im äußeren Magnetfeld B (durchgezogene Linien) gegenüber der Zustandsdichte ohne Magnetfeld. b) Gemessene Kernspin-Suszeptibilität von flüssigem 3 He. Die Daten wurden mit χ0 = χ(T = 0) normiert. Die durchgezogene Linie entspricht dem Curie-Gesetz (nach [21]).
Für eine quadratische Dispersionsrelation gilt dann χPauli =
3 μ0 μ2B 3 T = · χCurie . n 2 kB T F 2 TF
Die Pauli-Suszeptibilität des entarteten Fermi-Gases ist also gegenüber der des verdünnten idealen Gases oder eines Festkörpers mit lokalisierten magnetischen Momenten um einen Faktor T /TF unterdrückt, weil selbst bei T = 0 die allermeisten Spins kompensiert sind und nur diejenigen an der Fermi-Kante zur Magnetisierung beitragen. Wie die Wärmekapazität genügt auch die Spin-Suszeptibilität des entarteten Fermi-gases den Anforderungen des 3. Hauptsatzes. Die erste temperaturabhängige Korrektur zur Pauli-Suszeptibilität ist Gegenstand von Aufgabe 14.2. Der Übergang zwischen dem Curie-Verhalten bei hohen Temperaturen und dem Pauli-Verhalten bei tiefen Temperaturen lässt sich experimentell eindrucksvoll an den Kernspins des flüssigen 3He demonstrieren, dessen Fermi-Temperatur nur wenige Kelvin beträgt (Abb. 14.10b) und das wir im Folgenden besprechen werden. Die in Metallen gemessene Magnetisierung enthält noch einen von dem Bahnmoment der freien Elektronen herrührenden diamagnetischen Beitrag, der erstmals von Landau berechnet wurde und den Wert
2 χdia = −
1 3
m ˆ0 m ˆ
· χPauli
hat. Dabei ist m ˆ 0 wieder die Masse freier Elektronen ohne Wechselwirkungseffekte. Aufgrund des Faktors m ˆ 0 /m ˆ können Metalle sowohl paramagnetisch als auch diama-
518 | 14 Fermi-Systeme gnetisch sein. Außerdem kommen noch die in der Regel diamagnetischen Beiträge der Atomrümpfe dazu.15
14.3 Fermi-Flüssigkeiten Das Konzept der elementaren Fermi- (und Bose)-Systeme hat sich als außerordentlich flexibel und breit anwendbar erwiesen. Es ist geeignet, den klassischen Teilchenbegriff in einer Weise zu modifizieren, dass die Prinzipien der Quantentheorie und der Thermodynamik miteinander in Einklang gebracht werden können. Der Preis dafür ist die Aufgabe der Individualität und der Verfolgbarkeit der Teilchen auf einer „Bahn“ r(t). Bewegungsphänomene werden stattdessen durch Nichtgleichgewichtszustände mit einer Differenz der chemischen Potenziale und damit der Teilchenzahlen in elementaren Systemen mit dem Impuls pro Teilchen k und −k beschrieben (Abschnitt 14.4). Die zentralen Größen, mit denen das Konzept operiert, sind die Teilchenzahlen (F) Nε (T, μ) („Besetzungszahlen“) der elementaren Fermi-Systeme. Bisher (mit Ausnahme der Abschnitte 13.2.3 und 14.2.4 über die thermische Ausdehnung) haben wir stets vorausgesetzt, dass die Energien ε(k) charakteristische Konstanten der einzelnen elementaren Teilsysteme sind. Insbesondere haben wir vorausgesetzt, dass die ε(k) von den Nk unabhängig sind. Eine zentrale Frage ist nun, ob und wie das Konzept erweitert werden kann, um Wechselwirkungseffekte zwischen den elementaren Fermi-Systemen in angemessener Weise zu berücksichtigen.
14.3.1 Landaus Fermi-Flüssigkeit Um diese Frage zu beantworten, ging Landau von der Vorstellung aus, dass ein allmähliches Einschalten der Wechselwirkung zwischen den elementaren FermiSystemen nur zu einer stetigen Verschiebung der charakteristischen Energien ε(k) der elementaren Fermi-Systeme führt, ohne deren Zahl zu ändern.16 Die FermiFlüssigkeit ist wie beim idealen Fermi-Gas dadurch ausgezeichnet, dass die Teilchenzahlen der elementaren Fermi-Systeme bei |k| = kF diskontinuierlich von 0
15 Eine interessante Ausnahme sind die Seltenen Erden, von denen die meisten stark lokalisierte Spins der f-Zustände enthalten. Um dem dritten Hauptsatz zu genügen, müssen diese bei tiefen Temperaturen eine magnetische Ordnung, das heißt Ferromagnetismus, Antiferromagnetismus oder noch komplexere magnetische Strukturen ausbilden. 16 Damit sind eine Reihe interessanter Phänomene wie die Supraleitung, die Suprafluidität des 3He und die Quantenphasenübergänge außerhalb der Reichweite der Landau’schen Theorie. Diese Phänomene treten bei Variation gewisser Kontrollparameter wie Temperatur, Druck oder Magnetfeld auf und sind auf thermodynamische Instabilitäten der Fermi-Flüssigkeit zurückzuführen.
14.3 Fermi-Flüssigkeiten
| 519
auf 1 springen, dass also immer noch eine scharfe Fermi-Kante vorhanden ist. Durch die Wechselwirkung verschieben sich aber die Werte der ε(k), und damit das chemische Potenzial. Gegenüber dem idealen Fermi-System bekommen wir daher eine Änderung der Teilchenzahlen (0)
ν k = N k − Nk
,
(0)
wobei Nk die Teilchenzahlen des idealen Systems sowie die νk = 0, 1 für |k| > kF und νk = −1, 0 für |k| < kF sind. Die thermischen Anregungen über dem Grundzustand – die Quasiteilchen – sind immer noch Fermionen; solange ihre Zahl klein genug ist, wird ihr Einfluss auf den Grundzustand vernachlässigbar sein. Dabei hängen die ε(k) von der Zahl νk der angeregten Quasiteilchen ab. Die Gesamtenergie wird bei T = 0 ein Funktional der Teilchenzahlen Nkσ (hier berücksichtigen wir zusätzlich die Spinquantenzahl σ ), welche wir für niedrige Anregungsgrade analog einer TaylorReihe nach den νkσ entwickeln können: ∂E (0) ν E[{Nk }; T, μ] = E[Nk ] + ∂Nkσ kσ 0
k,σ
+ = E (0) +
1 2
kσ,k σ
(0)
εkσ νkσ
kσ
1 + 2V
∂2E ν ν + ... ∂Nkσ ∂Nk σ 0 kσ k σ
ϕ(kσ, k σ )νkσ νk σ + . . .
kσ,k σ
Dabei sind die Funktionen εkσ und ϕ(kσ, k σ ) phänomenologische Parameter, die durch Anpassung an experimentelle Daten zu bestimmen sind.17 Dies ist natürlich (0) nur dann sinnvoll, wenn die Form von εkσ und ϕ(kσ, k σ ) durch ganz wenige phänomenologische Parameter bestimmt ist. Diese wollen wir im folgenden identifizieren. Zunächst erkennen wir, dass die charakteristischen Energien der elementaren Fermi-Systeme durch die (Funktional)-Ableitung der Gesamtenergie nach den νkσ gegeben sind: 1 (0) ε(k, σ) = εkσ + ϕ(kσ, k σ )νk σ + . . . (14.33) (0)
V
k σ
Da es sich bei dieser Beschreibung um eine typische Niederenergie-Näherung handelt, (0) kann εkσ in der Nähe der Fermi-Kante bei kF einfach linear genähert werden: (0)
εkσ = εF + v F (k − kF ) ,
(14.34)
17 Die Doppelsumme über die durch die Randbedingungen bestimmten k liefert beim Übergang zur Kontinuumsnäherung einen Faktor V 2 , der nur dann mit der Homogenitätsrelation verträglich ist, wenn die Wechselwirkungsfunktion zu 1/V proportional ist. Diesen Faktor 1/V haben wir vor die Summe gezogen.
520 | 14 Fermi-Systeme wobei die Fermi-Geschwindigkeit wieder durch vF = kF /m ˆ definiert ist. Dabei ist m ˆ in der Regel größer als die Masse m ˆ 0 der nicht-wechselwirkenden Teilchen, weil die wechselwirkenden Teilchen eine Abschirm-Wolke mit sich herumschleppen, welche zum Impuls k beiträgt. Die Wechselwirkungsfunktion ϕ(kσ, k σ ) braucht ebenfalls nur in der Nähe der Fermi-Fläche bekannt zu sein und kann daher nur vom Winkel θ zwischen den Wellenvektoren sowie den Spinquantenzahlen s, s abhängen. Daher bietet es sich an, ϕ(kσ, k σ ) nach Legendre-Polynomen in cos θ zu entwickeln. In erster Näherung kann die Winkelabhängigkeit ganz vernachlässigt werden. Nur wenn sich das System als Ganzes bewegt, die Verteilung der k also eine Vorzugsrichtung aufweist, spielt der Winkel zwischen der Bewegungsrichtung und den k-Vektoren eine Rolle. Wir setzen daher an: g(ε)ϕ(kσ, k σ ) = F0 + G0 + F1 cos θ ,
(14.35)
wobei g(ε) wieder die Zustandsdichte pro Spin-Richtung bezeichnet. Für ein System mit Galilei-Invarianz lässt sich zeigen, dass
m ˆ =m ˆ0
1+
F1 3
ist, wobei m ˆ 0 die effektive Masse der nicht wechselwirkenden Teilchen ist. Die so aus Gl. 14.33 gewonnenen Energien ε(k, σ) der elementaren Fermi-Systeme setzen wir in die großkanonische Zustandssumme Zkσ des Quasiteilchen-Systems ein. Da die Werte der Nkσ , die sich aus der Ableitung von Zkσ nach μ ergeben, selbst in die ε(k, σ) eingehen, handelt es sich dabei um eine Art Molekularfeld-Näherung, bei der die ε(k, σ) selbstkonsistent bestimmt werden müssen. Dabei ergeben sich die folgenden, hier nicht im Detail abgeleiteten Ergebnisse: • In der kalorischen Zustandsgleichung E(T, V, N ) fällt die Wechselwirkungsfunktion ϕ(kσ, k σ ) heraus, und wir erhalten für die molare Wärmekapazität bis auf die geänderte Masse dasselbe Resultat wie für ideale Fermi-Systeme: cˆv (T ) =
•
(14.36)
Dies erklärt (neben Bandstruktur-Effekten) die in Abb. 14.8 beobachteten Erhöhungen der spezifischen Wärmekapazität von Metallen gegenüber dem Modell freier Elektronen. In die thermische Zustandsgleichung gehen die attraktiven und repulsiven Wechselwirkungen zwischen den Teilchen und damit der Spin- und Richtungs-unabhängige Anteil F0 von ϕ(ks, k s ) ein, und wir erhalten eine im Vergleich zum idealen System reduzierte Teilchenkapazität und isotherme Kompressibilität: ν=
•
π2 g k2 · T . 3 F B
∂n(T, μ) gF . = n 2 κT = ∂μ 1 + F0
(14.37)
In die magnetische Zustandsgleichung geht die Austausch-Wechselwirkungen zwischen den Teilchen und damit der Spin-abhängige Anteil G0 von ϕ(kσ, k σ ) ein,
14.3 Fermi-Flüssigkeiten
| 521
Tab. 14.1. Fermi-Flüssigkeits-Parameter von 3He für verschiedene Drucke: p (bar)
v ˆ (cm3 /mol)
F0
F1
G0
m ˆ 3 /m ˆ 03
0
36.8
9.3
5.4
−2.8
2.8
15
28.9
41.2
9.9
−3.0
4.3
30
26.4
77.0
13.5
−3.0
5.7
und wir erhalten für G0 < 0 eine im Vergleich zum idealen System erhöhte PauliSuszeptibilität: χPauli =
μ0 μ2B gF . 1 + G0 /4
(14.38)
Für hinreichend negatives G0 führt das in Analogie zu den in Abschnitt 10.7 behandelten lokalisierten Spins zum Ferromagnetismus. Von diesen in den meisten Fällen eher kosmetischen Korrekturen abgesehen sind die Unterschiede zwischen idealen und realen Fermi-Systemen gering – dies macht auch das Fermi-Gas zu einem archetypischen System der Physik der kondensierten Materie.
14.3.2 Flüssiges 3 He Neben den Elektronen im Metallen bildet 3He das Paradebeispiel für eine FermiFlüssigkeit. Wie beim 4He bleibt 3He bis zu tiefsten Temperaturen flüssig und verfestigt sich nur unter äußerem Druck ( 30 bar). Qualitativ ähneln die thermodynamischen Eigenschaften der flüssigen Phase unterhalb von etwa 100 mK denen eines idealenFermi-Gases (Abb. 14.10b und 14.11). Vergleicht man die experimentellen Daten aber mit den aus der Dichte n und der Masse m ˆ 03 der 3He-Atome berechenbaren Werten (Gln. 14.29 und 14.32), so stellt man quantitative Diskrepanzen fest, die Landau dazu motivierten, die im vorangegangenen Abschnitt dargestellte phänomenologische Theorie zu entwickeln. In der Tat liefern die Messungen der Wärmekapazität, der Kompressibilität und der Spinsuszeptibilität die in Tabelle 14.1 zusammengefassten Werte der Fermi-Flüssigkeitsparameter. Interessant ist, dass die Dichte von 3He wegen der großen Kompressibilität in dem bis zur Verfestigung zugänglichen Druckbereich um 25 % geändert und die Stärke der Wechselwirkung damit deutlich geändert werden kann. In der Tat vergrößern sich die Fermi-Flüssigkeitsparameter unter Druck erheblich und zeigen so eine Zunahme der Fermi-Flüssigkeitskorrekturen an. Weitere experimentelle Evidenz für die Richtigkeit von Landaus Überlegungen kommt aus den Transporteigenschaften, welche nach Kapitel 8 neben der thermodynamischen Suszeptibilität die Temperaturabhängigkeit der Quasiteilchen-Streurate widerspiegeln. Nach Landau ist die Anwendbarkeit des Quasiteilchen-Konzepts zur Beschreibung der Flüssigkeit dadurch begrenzt, dass die Quasiteilchen-Anregungen
522 | 14 Fermi-Systeme
(J mol-1K-1)
6
4 3
He
2 4He
0
0
0.5
1.0 T (K)
1.5
Abb. 14.11. Gemessene Wärmekapazität von 3He als Funktion der Temperatur (durchgezogene Linie). Zum Vergleich wurde die Wärmekapazität von 4He (gestrichelte Linie) eingezeichnet. Unterhalb von ca. 100 mK zeigt die Wärmekapazität einen für Fermi-Flüssigkeiten typischen linearen Verlauf (gestrichelte Linie), der einer effektiven Masse von m ˆ 3 2.8 m ˆ 03 entspricht (nach [21]).
hinreichend große Lebensdauern aufweisen müssen, damit das Quasiteilchenbild anwendbar ist. Im flüssigen 4He wird dies dadurch möglich, dass die angeregten Zustände der 4He-Atome bei hinreichend tiefen Temperaturen energetisch weit oberhalb derer der kollektiven Anregungen liegen. Mit weiter abnehmender Temperatur nimmt die Dichte der Anregungen immer weiter ab, sodass die Streuzeit im Grenzfall T → 0 divergiert. Ähnliches geschieht im 3He: hier ist es das Pauli-Prinzip, welches den Phasenraum für die Anregung von 3He-Atomen immer weiter einschränkt, bis schließlich nur noch sehr wenige Quasiteilchen in der unmittelbaren Nähe der Fermi-Fläche angeregt sind, die zu Streuprozessen in der Lage sind. Damit bilden die unterhalb der FermiKante eingeschlossenen 3He-Atome (wie im 4He) ein Quasi-Vakuum für das schwach wechselwirkende Quasiteilchengas, welches energetisch nur im Bereich von kB T um die Fermi-Kante lebt. Das fermionische Grundsystem – das Vielteilchen-Gegenstück zur Fermi-Kugel – trägt nur zu den elastischen Eigenschaften des Systems bei, alle dynamischen und thermischen Eigenschaften übernimmt das dünne Quasiteilchen-Gas. Erst unterhalb etwa 2.8 mK wird die Fermi-Kugel als Grundsystem instabil und bildet ein suprafluides fermionisches Kondensat aus Cooper-Paaren, welches analog zum supraleitenden Grundzustand der Metalle ist (Abschnitt 14.6). Um die Abhängigkeit der Quasiteilchen-Streurate τ −1 von der Temperatur abzuschätzen, gehen wir von Fermis Goldener Regel aus. Nach dieser ist τ −1 =
2π
|M |2 ρ(ε1 )δ(ε3 + ε4 − ε1 − ε2 ) ,
wobei M das den Streuprozess bestimmende Übergangs-Matrixelement der Wechselwirkung ist, ρ(ε1 ) das für den Prozess verfügbare Phasenraumvolumen, und die δ 1 Funktion die Erhaltung der Summe der Quasiteilchen-Energien i εi bei dem Prozess sicherstellt. Um ρ abzuschätzen, überlegen wir uns, welche Einschränkungen die Energieerhaltung bei einem Zweiteilchen- Streuprozess in der Nähe der FermiKante mit sich bringt. Wie in Abb. 14.12 dargestellt, betrachten wir als Anfangszustand ein einzelnes Quasiteilchen mit der Energie ε1 > εF über der Fermi-Fläche,
14.3 Fermi-Flüssigkeiten
a)
b)
H1
6
30
H3 H4
η-1 (Pa-1s-1)
H2 K(PPa s)
HF
| 523
20
10
4
2
0
0
20
40
60
80
T2 (10-6 K2)
0
0
1 T (K)
2
Abb. 14.12. a) Schematische Darstellung der Quasiteilchen-Streuung eines abgeschirmten CoulombPotentials in einer Fermi-Flüssigkeit. Wegen des Pauli-Prinzips können nur Quasiteilchen im Bereich ±kB T um die Fermi-Energie εF gestreut werden. Die Teilchen im Inneren des Fermi-Sees (schwarz) bilden ein Quasi-Vakuum, welches das für die thermisch angeregten Quasiteilchen verfügbare Volumen zur Verfügung stellt, sich sonst aber nur in der Renormierung der Systemparameter durch die Fermi-Flüssigkeits-Korrekturen manifestiert. b) Viskosität von 3He als Funktion der Temperatur. Der Einsatz zeigt die Proportionalität der inversen Viskosität zu T 2 bei p = 16 bar im Bereich sehr tiefer Temperaturen. Man beachte, dass die Viskosität am tiefsten Datenpunkt des Einsatzes noch einmal um 4 (!) Größenordnungen höher ist als am höchsten Datenpunkt in der Hauptabbildung. Der scharfe Anstieg von η −1 bei wenigen mK ist auf des Einsetzen der Suprafluidität zurückzuführen (nach [21]).
welches an einem anderen Quasiteilchen mit der Energie ε2 < εF gestreut wird. Bei hinreichend tiefer Temperatur findet das zweite Quasiteilchen nach der Streuung nur dann freie Zustände, wenn ε2 im Intervall [2εF − ε1 ] liegt. Nach der Streuung muss ε3 im Intervall [εF , ε1 ] liegen. Der Wert von ε4 = ε1 + ε2 − ε3 ist dann durch die Energie-Erhaltung festgelegt. Das bedeutet, dass von allen möglichen Endzuständen nur der Bruchteil (ε1 − εF )2 /ε2F zur Verfügung steht. Für Metalle muss man noch berücksichtigen, dass das Matrixelement |M | in einfachster Näherung proportional zur Thomas-Fermi-Abschirmlänge und wegen Gln. 8.36 und ∂n/∂μ ∝ n/εF ist. So gilt |M |2 ∝ λ2S ∝ 1/εF . Da ε1 − εF kB T sein muss, erhalten wir für die QuasiteilchenStreurate τ −1 (T ) = A
1 (kB T )2 . εF
(14.39)
Der dimensionslose Vorfaktor A kann in den verschiedenen Systemen Werte zwischen zwischen 1 und 100 annehmen. Die Streuzeit, und damit die mittlere freie Weglänge Λ = vF τ ∝ 1/T 2 , und die Diffusionskonstante D = vF Λ/3 divergieren bei tiefen Temperaturen also wie 1/T 2 . Dieses Verhalten spiegelt sich in der Transportkoeffizienten wider. Die in Abbildung 14.12b gezeigte Messung der Viskosität η = Dm zeigt in der Tat bei tiefen Tempe-
524 | 14 Fermi-Systeme raturen einen starken Anstieg und erreicht Werte, wie sie bei Honig oder schwerem Maschinenöl auftreten. Dies bedeutet, dass die Quasiteilchen wegen der geringen Streuung sehr effektiv Impuls von einer Grenzfläche transportieren. Bei Temperaturen von einigen mK kann Λ 10 μm überschreiten. Das bedeutet, dass ein Quasiteilchen in der Flüssigkeit einige 10 000 3He-Atome passiert, bevor es einmal streut. Dies ist eine wirklich dramatische Manifestation des Pauli-Prinzips und rechtfertigt die Bezeichnung „Quasi-Vakuum“ für den Fermi-See unterhalb der Fermi-Kante.18 Die Wärmeleitfähigkeit λ = Dcv (T ) divergiert wegen cv = γ T dagegen nur wie 1/T . Bei der kritischen Temperatur Tc = 2.8 mK geht 3He von einer Fermi-Flüssigkeit in einen exotischen suprafluiden Zustand über. Dies äußert sich in einem scharfen Abfall der Viskosität bei dieser Temperatur und kann aus den Tieftemperaturdaten im Einsatz von Abb. 14.12 abgelesen werden.
14.3.3 Verfestigung von 3 He – Pomeranchuk-Kühlung Die Kristallisation eines Materials ist üblicherweise mit einer Abnahme ΔS = Sflüssig − Sfest der Entropie verbunden, wobei die latente Wärme T ΔS beim Gefrieren an die Umgebung abgeführt werden muss. Flüssiges 3He ist die einzige Substanz, bei der die Entropie in der festen Phase höher ist als in der flüssigen Phase.19 Diese verblüffende Eigenschaft muss auf Freiheitsgrade zurückzuführen sein, die im Festkörper für die thermischen Eigenschaften bedeutsam sind, in der Flüssigkeit dagegen nicht. Damit scheiden die Translationsfreiheitsgrade aus, weil diese im festen Zustand (wie bei anderen Festkörpern auch) durch die Phononen bestimmt sind. Die Phononen liefern einen kubischen Beitrag ∝ (T /ΘD )3 zur Entropie, während die Entropie der Flüssigkeit wegen Gl.14.30 ∝ T /TF zunimmt und für T < TF < ΘD , also bei tiefen Temperaturen, dominiert. Es muss also noch ein weiterer Beitrag zur Entropie existieren. Dieser ist wieder mit der Fermi-Natur des 3He verknüpft: der Kernspin. Obwohl das magnetische Moment der Kernspins sehr viel kleiner als bei Elektronenspins ist, liefern sie doch denselben Beitrag zur Entropie. Während die Spin-Suszeptibilität und die Spin-Entropie in der Fermi-Flüssigkeit durch das Pauli-Prinzip stark unterdrückt sind (Abb. 14.10), verhalten sich die Kernspins im 3He-Festkörper bis herab zu 1 mK gemäß dem Curie-Gesetz eines idealen Paramagneten, das heißt χ ∝ 1/T und sˆ = kB ln 2. Unterhalb von 1 mK ordnet das Kernspinsystem antiferromagnetisch und erfüllt so den 3. Hauptsatz. In Abb. 14.13a ist der Verlauf der molaren Entropie sˆ als Funktion der Temperatur für die feste und die flüssige Phase des 3He dargestellt. Unter-
18 Der Druck von Argon bei 300 K darf nur 6 · 10−4 mbar betragen, um eine vergleichbare freie Weglänge zu bekommen! 19 Semantisch provokant kann man sagen, dass 3He die einzige Flüssigkeit ist, die bei Erwärmung gefrieren kann. . .
14.3 Fermi-Flüssigkeiten
/ kB
a)
1
b)
fest
0.5
F
ln(2)
flüssig
4
p (bar)
Faltenbalg
flüssige Phase 1
10
100
He
Druckübertragung
feste Phase
30
Faltenbalg
I
0 40 35
| 525
3
He flüssig
1000
fest
T (mK)
Abb. 14.13. a) Oben: Vergleich der Entropien des festen und flüssigen Heliums. Unten: Schmelzdruckkurve p(T ) von 3He. Wenn die Entropie des festen Heliums größer als die des flüssigen ist, wird die Steigung von p(T ) < 0, und Verfestigung führt zur Abkühlung. b) Schematischer Aufbau einer Pomeranchuk-Zelle zur Kühlung durch die Verfestigung von 3He. Flüssiges 4He wird von oben unter Druck in die Zelle einkondensiert und erzeugt in der oberen Zelle einen Druck unterhalb des Schmelzdrucks von 4He, in der unteren Zelle aber einen Druck oberhalb des Schmelzdrucks von 3He (nach [21]).
halb von 320 mK ist Δˆ s negativ. Da die Differenz der Molvolumina Δˆ v = vˆflüssig − vˆfest stets positiv ist, äußert sich dies nach der Gleichung von Clausius und Clapeyron (Gl. 9.2) auch in einer Anomalie der Schmelzdruckkurve, die ebenfalls in Abb. 14.13a gezeigt ist: Die Steigung der Schmelzdruckkurve ist bei tiefen Temperaturen zunächst negativ und wird erst nach Erreichen eines Minimums bei 320 mK positiv. Das anomale Schmelzverhalten des 3He kann praktisch ausgenutzt werden, um durch die Verfestigung von 3He unterhalb von 320 mK eine Kühlleistung zu erzeugen, die proportional zur Verfestigungsrate N˙ ist:
π2 T PKühl = N˙ T Δˆ s = N˙ kB T ln 2 − . (14.40) 2 TF
Dieses Verfahren wird nach seinem Erfinder Pomeranchuk-Kühlung genannt. Zur Vorkühlung wird in der Regel ein 3He- 4He-Mischkryostat benutzt, dessen Funktionsweise in Abschnitt 14.3.5 erklärt wird. Abbildung 14.13b zeigt eine schematische Darstellung einer Pomeranchuk-Zelle, mit der sich in der Praxis Temperaturen bis herab zu 2 mK erzeugen lassen. Der Druck wird in einer 4He-Zelle aufgebaut und über einen vertikal beweglichen Stab auf die 3He-Zelle übertragen. Die Durchmesser der beiden Zellen müssen so gewählt werden, dass das 4He trotz seines etwas geringeren Verfestigungsdrucks stets flüssig bleibt, damit die Beweglichkeit des oberen Faltenbalgs nicht eingeschränkt wird. Die bei der Dehnung der Faltenbälge auftretende innere Reibung limitiert die theoretische erreichbare Kühlleistung in Gl. 14.40. In einer Zelle dieses Typs wurden 1970 von Osheroff an der Cornell-Universität die ersten Hinweise auf den suprafluiden Übergang des 3He gefunden. Der suprafluide Zustand von 3He ist wesentlich komplizierter als der von 4He. So gibt es nicht eine, sondern (nach bisherigem Wissen) drei verschiedene suprafluide Phasen. Die makroskopische
526 | 14 Fermi-Systeme Wellenfunktion ist kein Skalar wie beim 4He, sondern hat 9 Komponenten, die sich in ihrer Spinstruktur und entsprechend in ihrem Verhalten im Magnetfeld unterscheiden. Die Beschreibung dieses komplexen Verhaltens füllt eigene Bücher und kann hier nicht dargestellt werden. Uns geht es hier darum, dass die Helium-Flüssigkeiten Modellsysteme darstellen, an denen sich die grundlegenden und nicht-klassischen Eigenschaften von Fermi- und Bose-Systemen in besonders klarer Weise experimentell demonstrieren lassen.
14.3.4 Lösungen von 3 He in 4 He Nachdem die Quantenflüssigkeiten 3He und 4He bereits einzeln faszinierende Phänomene zeigen, kann man von deren Mischungen weitere neue Eigenschaften erwarten. Dabei erschien schon die bloße Existenz einer Mischung der Isotope bei sehr tiefen Temperaturen zunächst als thermodynamisches Paradoxon. Denn aufgrund der in Abschnitt 7.4 dargestellten Mischungsentropie (Gl. 7.12) wurde erwartet,20 dass sich jedes zwei-komponentige System bei tiefen Temperaturen entmischen sollte, um dem 3. Hauptsatz zu genügen. In der Tat zeigt sich, dass die Beimischung von 3He in 4He zunächst zu einer Reduktion der suprafluiden Übergangstemperatur Tλ führt und unterhalb von 870 mK tatsächlich eine Instabilität der zunächst homogenen Mischung auftritt. Das System zerfällt, wie schon in Abschnitt 9.4 dargestellt, in zwei Phasen, von denen die eine reich an 3He und die andere reich an 4He ist. Abbildung 14.14a zeigt Messwerte des Molenbruchs x3 von 3He in 4He als Funktion der Temperatur. Es ist klar zu erkennen, dass die Werte von x3 bei einer kritischen Temperatur einen Knick aufweisen, der die einsetzende Entmischung anzeigt und der (0) sich für zunehmende Anfangswerte x3 von x3 zu höheren Temperaturen verschiebt. Unterhalb der Entmischungstemperatur folgen die x3 -Werte einer einheitlichen Kurve. In Abbildung 14.14b ist dargestellt, wie der Sättigungswert von x3 vom Druck abhängt. Das entsprechende Phasendiagramm ist in Abb. 14.15a dargestellt. Die Phasenübergangslinien wurden durch Messungen wie in Abb. 14.14a gewonnen. Der Entmischungsübergang zeigt sich auch in der Wärmekapazität (Abb. 14.15b), wo er sich als Sprung in cˆv (T, n) manifestiert. Dieser Sprung kommt durch die Konzentrationsände-
20 Das Paradox erklärt sich daraus, dass der für die Instabilität der Mischung wichtige steile Anstieg der Mischungsentropie bei kleinen Molenbrüchen (Gl. 7.12 und Abb. 7.9) unter der Bedingung angeleitet wurde, dass die Mischung das ideale Gasgesetz oder zumindest das van’t Hoff’sche Verdünnungsgesetz (Gl. 7.15) befolgt. Genau diese Voraussetzung ist bei einem entarteten Fermi-System verletzt. Aufgrund der Fermi-Entartung geht die Entropie der Mischung ∝ T gegen Null, was in Abb. 14.15 experimentell verifiziert wird. Diese Tatsache zeigt, dass die Entropie einer Mischung im gegenständlichen Sinn durchaus dem dritten Hauptsatz genügen kann. Für die Entropie sind dagegen allein die abstrakten „Mischungen“ von Quantenzuständen nach dem Boltzmann’schen Prinzip relevant (Gl. 11.1).
14.3 Fermi-Flüssigkeiten
a)
0.154 0.150
0.15
b)
0.081 0.070 0.05
x3(0) 1
0.1 T (K)
x3c
x3
0.099
0.10
0.09
0.120 0.10
| 527
0.08
0.07 0.06
3
0
5
10
He/4He
15
20
p (bar)
Abb. 14.14. a) Molenbruch x3 von 3 He in 4 He als Funktion der Temperatur für verschiedene Werte (0) x3 des 3He-Molenbruchs. b) Grenzwerte x3c von x3 als Funktion des Drucks im Grenzfall tiefer Temperaturen. Das Zweiphasengebiet ist jeweils grau hinterlegt (nach [21]).
rungen am Entmischungspunkt zustande, und er wird mit abnehmendem 3He-Gehalt immer kleiner, bis er für x3 0.06 verschwindet. In dem gezeigten Temperaturbereich T < 0.5 K ist der Beitrag des 4He zur Wärmekapazität bereits vernachlässigbar. Mit abnehmender Temperatur erwartet man eine zunehmende Entmischung, bis im Grenzfall T → 0 schließlich reine Phasen vorliegen sollten. Die Messungen in Abb. 14.16 zeigen aber, dass der Molenbruch x3 des 3He in der 3He-armen Phase nicht auf Null fällt, sondern auch bei den tiefsten Temperaturen eine endliche Menge an 3He (etwa 6 %) gelöst bleibt. Nun haben wir aber bereits in Abschnitt 7.5 gesehen, dass sich das Konzept der Idealität auf verdünnte Lösungen übertragen lässt und diese große Ähnlichkeit mit idealen Gasen aufweisen. Dies trifft auch auf die verdünnten Lösungen von 3He in 4He zu, weil sich die 3He-Atome in der superfluiden 4He-Matrix wie freie Fermionen verhalten, deren effektive Masse aber ähnlich wie beim konzentrierten 3He durch die Wechselwirkung mit der Matrix erhöht ist. Aufgrund der Verdünnung erfüllen die gelösten 3He-Atome die Entartungsbedingung (Gln. 6.9) bei „hohen“ Temperaturen T > 0.5 K zunächst nicht und weisen damit Wärmekapazität idealer Gase mit cˆv = 3kB /2 auf. Dies wird durch die in Abb. 14.16 gezeigten Messungen illustriert. Dabei kommt uns die Tatsache entgegen, dass der Beitrag des 4He-Anteils der Mischung erst oberhalb von T 0.6 K sichtbar wird. Zum Vergleich sind auch die Daten für die reinen Komponenten 3He und 4He aufgetragen. In Abb. 14.16b wird der Bereich sehr tiefer Temperaturen gezeigt, in dem die Entartung der gelösten 3He-Atome einsetzt, bis bei sehr tiefen Temperaturen die für hochentartete Fermi-Gase typische lineare Temperaturabhängigkeit beobachtet wird. Da bei der Berechnung der spezifischen Wärmekapazität cˆ die gesamte He-Teilchenzahl NHe = N3 + N4 zugrunde gelegt wurde, streben die Beiträge des 3He-Anteils der Mischung in der normierten Auftragung gegen x3 . Die durchgezogenen Linien ergeben sich aus der numerischen Auswertung der kalorischen Zustandsgleichung (Gl. 14.2) (4) des Fermi-Gases mit einer effektiven Masse m ˆ 3 2.4 m ˆ 30 von 3He-Atomen in supraflui-
528 | 14 Fermi-Systeme
a)
b) da
-Ü
be
rg
suprafluides 3 He / 4He
1
Ph
as e
ns e p
an
0.2
normalfluides 3 He / 4He
3He
/ (3kB)
T (K)
mb
g
ar a
lini e
tions-
x3 0.15
/ 4He
0.12 0.1
0.08
2
La
2
0.06 0.04
Mischungslücke
0
0
0.2
0.4
0.6
0.8
0
1
0
0.2
0.4 T (K)
x3
Abb. 14.15. a) Phasendiagramm von 3He/ 4He-Mischungen als Funktion des 3 He-Molenbruchs x3 . Der Bereich des 2-Phasengebiets, die Mischungslücke ist grau schattiert. b) Mit der Wärmekapazität des klassische idealen Gases (ˆ cv = 3kB /2) skalierte Messungen der Wärmekapazität verdünnter 3He/ 4HeMischungen. Die Wärmekapazität pro Teilchen cˆ bezieht sich auf die gesamte Teilchenzahl NHe = N3 + N4 . Die durchgezogenen Linien ergeben sich aus der kalorischen Zustandsgleichung des FermiGases (nach [21]).
dem 4He für die beiden Werte von x3 . Dabei ist die Fermi-Temperatur (4)
TF3 =
2 (4) 2m ˆ 3 kB
3π 2 n3
2/3
2/3
∝ x3
(14.41)
von 3He in flüssigem 4He natürlich von der Dichte n3 der 3He-Atome abhängig. Auch dies wird durch die Daten hervorragend bestätigt. Damit bilden die verdünnten 3He/ 4He-Mischungen ein ideales Modellsystem zur experimentellen Demonstration des Übergangs vom „klassischen“ zum entarteten Zustandsbereich. Neben der kalorischen Eigenschaft erfüllen die verdünnten 3He/ 4HeMischungen auch die van’t Hoff’sche Gleichung 7.20 für den osmotischen Druck. Torsionspendel-Experimente (Abb. 13.21) mit verdünnten 3He/ 4He-Mischungen zeigen einen zur 3He-Konzentration proportionalen Massenanteil, der bis hin zu den tiefsten bisher zugänglichen Temperaturen bestehen bleibt. Die geringe Löslichkeit von 3He ins 4He und die (im Grenzfall T → 0) ebenfalls beobachtete Unlöslichkeit von 4He in 3He sind zunächst überraschend, weil die Elektronenhülle beider Isotope chemisch identisch ist. Das unterschiedliche Verhalten lässt sich wieder auf den Massenunterschied zwischen den Isotopen und den damit verbundenen Unterschied der quantenmechanischen Lokalisierungsenergien zurückführen. 3 He weist wegen der kleineren Masse eine höhere Nullpunktenergie als 4He auf. Daher sind die 3He-Atome untereinander schwächer gebunden als in der 4He-Phase, und das chemische Potenzial μ3 der reinen 3He-Phase ist größer als das chemische Potenzial
14.3 Fermi-Flüssigkeiten
b)
8
3
4
/ (3kB)
6 He
x3 2
(J mol-1K-1)
a)
| 529
2
4
0.15 0.094 0.046 0 0 0.5
1.0
0.04
x3 = 0.05
0.02
x3 = 0.013
He 1.5
1 T 3 F
0
TF
1 T 3 F 0
100
200
T (mK)
T (K)
Abb. 14.16. a) Gemessene Wärmekapazität von 3He, 4He (durchgezogene Linien) sowie deren Mischungen für verschiedenen x3 (Datenpunkte). Die durchgezogenen Linien durch die Datenpunkte sind die um den Wert x3 3kB /2 nach oben verschobenen Daten für reines 4He. Die Übereinstimmung zeigt an, dass die 3He-Atome den konstanten Beitrag 3x3 kB /2 zur Wärmekapazität liefern, wie dies für ein „klassisches“ Gas erwartet wird. b) Gemessene Wärmekapazität stark verdünnter 3He/ 4He-Mischungen. Die durchgezogenen Linien ergeben sich aus der numerischen Auswertung der kalorischen Zustandsgleichung (Gl. 14.2) des Fermi-Gases (nach [21]).
(4)
μ3 (n3 ) von 3He in 4He. Mit zunehmender 3He-Dichte in der 4He-Phase steigt (4)
(4)
(4)
μ3 (T, n3 ) = eˆ03 (n3 ) + kB TF 3 (n3 ) −
π 2 kB T 2 12 T (4) (n ) 3 F3
(14.42)
aufgrund der Fermi-Entartung gemäß Gl. 14.24 bis zur kritischen Dichte n3c an, bei der chemisches Gleichgewicht (4)
μ3 (T, n03 ) = μ3 (T, n3 )
(14.43)
bezüglich des Austausches von 3He vorliegt, wobei n03 die Dichte der reinen 3HePhase ist. Aus den aus Abb. 14.14 ersichtlichen Grenzwerten von x3 und dem bekann(4) ten Verlauf von μ3 (T, p) lassen sich die Werte von μ3 (T = 0, n) bestimmen. Diese sind für T = 0 in Abb. 14.17 dargestellt. Aus der beobachteten x3 -Abhängigkeit (die 2/3 schwächer als die Proportionalität zu x3 ist) lässt sich schließen, dass die molare (4) Energie eˆ3 (x3 )/kB = ˆ − 2.79 K − αx3 von 3He in 4He um 0.32 K niedriger als in reinem 3 He ist und als Funktion von x3 linear abnimmt. Dies ist auf eine kleine attraktive Wechselwirkung zwischen den 3He-Atomen in der 4He-Matrix zurückzuführen. Bei endlichen Temperaturen erniedrigen sich beide chemischen Potenziale nach Gl. 14.42, (4) wobei μ3 wegen der niedrigeren Fermi-Temperatur in der verdünnten Phase schneller als μ3 sinkt. Auf diese Weise steigt x3c (T ) mit zunehmender Temperatur, bis keine Entmischung mehr eintritt.
530 | 14 Fermi-Systeme -2.2
μ3 / kBT (K)
-2.4
x3c = -0.064
-2.6 -2.8
(4)
-3.0 -3.2 0.00
0.05
x3
0.10
0.15
Abb. 14.17. Chemisches Potenzial μ3 von 3He in 4He als Funktion der Dichte n3 im Grenzfall T → 0. Die kritische Konzentration x3c ist durch das chemische Gleichgewicht bezüglich des Teilchenaustauschs zwischen beiden Phasen bestimmt (nach [21]).
14.3.5 Der 3 He-4 He-Mischkryostat Die Grenzfläche zwischen der konzentrierten und der verdünnten 3He-Phase stellt eine Phasengrenze zwischen zwei Fermi-Systemen mit unterschiedlichen FermiTemperaturen dar, die analog zu den in Abschnitt 14.1.5 behandelten Grenzflächen zwischen zwei Metallen mit verschiedener Austrittsarbeit ist. Da die 3He-Atome elektrisch neutral sind, ist der Übertritt von 3He in die 4He-Phase nicht mit dem Aufbau einer auf die Abschirmlänge λS beschränkten Randzone und der entsprechenden Kontaktspannung, sondern einfach mit einer räumlich homogenen Erhöhung der 3 He-Dichte verbunden. Aufgrund der Differenz der Fermi-Temperaturen TF3 (n03 ) = 1.7 K
(4)
und TF3 (n3c ) = 0.38 K
sind die molaren Entropien sˆ(T, n3 ) =
π 2 RT 2 TF3 (n3 )
der 3He-Quasiteilchen in beiden Phasen verschieden (R = NA kB = 8.31 J/(mol K) ist die Gaskonstante). Daher ist ein kontinuierlicher 3He-Übertritt von der konzentrierten in die verdünnte Phase mit der Kühlleistung Pkühl = T Δˆ s · N˙ 3 π2 = R 2
(
2 TM
2 TW − (4) TF3 (n03 ) TF3 (n3c) )
) · N˙ 3
(14.44)
2 2 = 41 J/(K mol) TM · 2.64/K − TW · 0.59/K · N˙ 3
= 84 J/(K2 mol) T 2 · N˙ 3
verbunden, wobei N˙ = IN die Zirkulationsrate genannt wird. Im letzten Schritt haben wir der Einfachheit halber angenommen, dass die Temperatur TM der Mischung und
14.3 Fermi-Flüssigkeiten
vom 1.5 K Kondensor
| 531
zur Pumpe
fast reines 3He
HauptDurchflußimpedanz
Dampf Heizer > 90% He 3
Wärmetauscher
< 1% 3He
verdünnte Phase
Zweite Durchflußimpedanz Wärmefluß
verdünnte Phase
Wärmetauscher
verdünnte Phase
konzentrierte Phase Phasengrenze
Destille 0.7 K
He
100%
3
6.5%
3
He
Mischkammer 0.01 K
Abb. 14.18. a) Schema der Endstufe eines 3He/ 4He-Mischkryostaten (nach[21]). b) Photo der Endstufe eines kommerziellen Mischkryostaten (Fa. Cryoconcept).
die Temperatur TW des injizierten 3He gleich sind. Dieses Phänomen ist das genaue Analog des Peltier-Effekts (Abschnitt 8.9) an einer stromdurchflossenen Grenzfläche zwischen zwei Metallen.21 Um diesen Effekt für den Bau eines Kryostaten auszunutzen, muss die Mischung zunächst in einem 4He-Verdampferkryostaten oder mit einem Pulsröhrenkühler vorgekühlt werden. Um eine kontinuierliche Kühlleistung zu erzeugen, ist es notwendig, ständig 3He nachzuführen. Der mit der Nachführung verbundene Wärmeeintrag sollte möglichst gering sein, um nicht zuviel von der nach Gl. 14.44 theoretisch erreichbaren Kühlleistung zu verlieren. Dies wird in der in Abb. 14.18 skizzierten Anordnung erreicht. Die Phasengrenze zwischen dem konzentrierten und dem verdünnten 3He befindet sich in der Mischkammer. Um möglichst viel 3He zu zirkulieren, wird der verdünnte Anteil der Mischung in einer zweiten Kammer, der Destille, auf etwa 0.7 K erwärmt. Wird nun der Druck in der Destille mittels einer kräftigen Pumpe auf ca. 1 mbar
21 Wir benutzen hier sˆ und nicht wie in Gl. 8.52 den Ausdruck ∂s(T, n)/∂n = sˆ/3 für den PeltierKoeffizienten, weil sich im nachfolgenden Abschnitt herausstellen wird, dass das elementare Transportmodell in Abschnitt 8.9 den für entartete ideale Fermi-Gase mit quadratischer Dispersionsrelation gültigen Wert um einen Faktor 3 unterschätzt (Gl. 14.62). Streng genommen ist dies etwas irreführend, weil die Relation ∂s(T, n)/∂T = sˆ/3 nur für den speziellen Fall eines entarteten Fermi-Gases mit quadratischer Dispersionsrelation erfüllt ist.
532 | 14 Fermi-Systeme erniedrigt, so wird dort fast ausschließlich 3He abgepumpt, welches anschließend wieder in das System injiziert wird. Dort muss das 3He zunächst wieder kondensiert werden, was eine Vorkühlung auf ca. 1.5 K erfordert. Das flüssige 3He wird dann über eine Kette von Wärmetauschern in die Mischkammer re-injiziert. Die Wärmetauscher nutzen das Gegenstrom-Prinzip, um das nachfließende 3He durch das von den kalten Teilen des Systems aufsteigende 3He so effizient wie möglich vorzukühlen. Die in der Mischkammer erreichbare Kühlleistung ist durch die Zirkulationsrate N˙ und die Temperatur des letzten Wärmetauschers bestimmt, die in den zweiten Term in Gl 14.44 eingeht. Die Kühlleistung eines Mischkryostaten fällt bei tiefen Temperaturen also proportional zu T 2 und ist unterhalb von 0.35 K größer als die gemeinsam mit dem 3HeDampfdruck exponentiell verschwindende Kühlleistung eines 3He-Verdampferkryostaten. Letztlich ist es die auch im Grenzfall T → 0 endliche Teilchendichte von 3He in der 4He-Matrix, das heißt die unvollständige Entmischung, welche dieses Kühlprinzip ermöglicht.
14.4 Transport in Fermi-Systemen 14.4.1 Ströme im Nichtgleichgewicht Wir wollen nun das Konzept der elementaren Fermi-Systeme22 dazu verwenden, die Transportphänomene im diffusiven Grenzfall zu analysieren. Genauer wollen wir das in Kapitel 8 eingeführte Drift-Diffusions-Modell derart verallgemeinern, dass wir jedem elementaren Fermi-System eine eigene (durch die Bandstruktur ε(k) gegebene) Transportgeschwindigkeit v k und seine eigene freie Weglänge Λk = |v k | · τk zugestehen. Die Forderung nach Zeitumkehr-Symmetrie bedingt dann, dass v k = −v −k und Λk = Λ−k ist.23 Analog zu Abb. 8.1 zerlegen wir das von dem Fermi-System eingenommene Volumen in Teilvolumina der Größe Λ3k , die sich jeweils im lokalen Gleichgewicht (Abb. 14.19) befinden, und geben den Strom einer mengenartigen Größe X so vor, dass die zugehörige Stromdichte lokal in z -Richtung zeigt. Dann ist die X -Stromdichte
22 Die nachfolgende Herleitung gilt unterschiedslos auch für Bosonen, wenn entsprechend die Zustandsgleichungen der elementaren Bose-Systeme verwendet werden. 23 Dieser Sachverhalt ist als das Prinzip der Mikro-Reversibilität bekannt. Diese Sprechweise bringt zum Ausdruck, dass unsere Beschreibung der Streuprozesse im Rahmen der reversiblen Hamilton’schen Mechanik erfolgt, obwohl die Irreversibilität des gesamten Transportvorgangs vorausgesetzt werden muss, um die Annahme lokalen Gleichgewichts zu rechtfertigen. Mit anderen Worten: Reversible Streuprozesse stellen die Irreversibilität des Transportvorgangs sicher. . . Hier zeigt sich, dass in unserem mikroskopischen Verständnis der Entropieerzeugung noch Lücken bestehen, die bereits Boltzmann und seinen Zeitgenossen bewusst waren.
14.4 Transport in Fermi-Systemen
|
533
Abb. 14.19. Die nach links (rechts) laufenden, durch den Index „±k“ gekennzeichneten elementaren Fermi-Systeme leisten den Beitrag v k xk(TL , μL ) − xk (TR , μR ) zur gesamten X-Stromdichte j X zwischen zwei benachbarten Volumenelementen der Größe Λ3k .
k
durch die Grenzfläche zwischen zwei benachbarten Volumenelementen als Differenz der gemäß Gln. 12.34 und 12.35 von den Volumenelementen emittierten Stromdichten gegeben: , * + * +jX = v k · xk T (z), μ ¯(z) − xk T (z + Λk ), μ(z + Λk ) , (14.45) k
wobei xk der Beitrag des elementaren Fermi-Systems mit dem Wellenvektor k zur lokalen X -Dichte ist. Der Bequemlichkeit halber legen wir den Nullpunkt des elektrostatischen Potenzials so, dass φQ auf der von uns betrachteten Grenzfläche verschwindet und in den Nachbarzellen ± grad φQ Λk /2 beträgt. Die Differenz der xk können wir berechnen, wenn wir berücksichtigen, dass die Zustandsgleichungen x(T, μ ¯) im lokalen Gleichgewicht allein von der Variablenkombination Y =
ε−μ ¯ kB T
abhängen. Dann erhalten wir in linearer Näherung einfach: xk [T (x), μ ¯(x)] − xk [T (x + Λk ), μ ¯(x + Λk )] =
Die Differenz ΔYk ist durch ΔYk =
1 kB T
grad μ ¯−
∂x(Y ) · ΔYk + O(ΔY )2 . ∂Y
ε−μ grad T T
· v(k)τk
(14.46)
(14.47)
Λk
gegeben. Wie üblich können wir die Summe in Gl. 14.45 gemäß V 3 =
k
(2π)3
·
d k
in ein Integral überführen. Dieses Integral wird am besten ausgeführt, indem zunächst über elementare Fermi-Systeme mit gleicher charakteristischer Energie ε(k) integriert wird. Dies führt auf den Diffusions-Tensor D(ε) = dθdϕ v(ε, θ, ϕ) · v(ε, θ, ϕ) ⊗ τ (ε, θ, ϕ). (14.48)
534 | 14 Fermi-Systeme Dabei ist v k ⊗ v k das dyadische oder Tensorprodukt ⎛ ⎞ ⎛ vx vx2 ⎜ ⎟ ⎜ v k ⊗ v k = ⎝ vy ⎠ · vx , vy , vz = ⎝ vy vx vz
vz v x
vx vy vy2 vz vy
⎞
vx vz ⎟ vy vz ⎠ , vz2
dessen Elemente mit dem Gewicht τk über alle k-Richtungen auf einer Fläche mit konstantem ε gemittelt werden. Der Diffusionstensor trägt möglichen Anisotropien in der Bandstruktur Rechnung. In einem anisotropen System, in dem die Flächen konstanter Energie nicht kugelförmig sind, fließt ein Diffusionsstrom nicht notwendigerweise in die Richtung des Dichtegradienten, sondern in eine andere, auch durch die Nebendiagonalelemente von D(ε) bestimmte Richtung. Bei einer isotropen ε(k)-Fläche verschwinden die Nebendiagonalelemente, und die Winkelmittelung der Diagonalelemente liefert wie bei unserer elementaren Betrachtung in Kapitel 8 das zu Gl. 8.4 äquivalente Ergebnis D(ε) =
1 |v(ε)|2 · τ (ε) · 1 , 3
wobei 1 die Einheitsmatrix ist. Setzen wir den Diffusionstensor in Gl. 14.47 ein und schreiben das verbleibende Integral über |k| mit Hilfe der Zustandsdichte g(ε) in eines über ε um und berücksichtigen noch, dass ∂x(ε)/∂ε = kB T ∂x(Yk )/∂Yk , so erhalten wir für die Stromdichte einer mengenartigen Größe X das allgemeine Resultat ∞ jX =
dε g(ε)D(ε)
∂x(ε) ε−μ ∇¯ μ− ∇T , ∂ε T
(14.49)
0
welches die gesuchte Verallgemeinerung unserer Transportgleichung 8.5 darstellt. Gleichung 14.49 wird üblicherweise im Rahmen einer semi-klassischen Betrachtung mit Hilfe der Boltzmann-Gleichung abgeleitet (Anhang H). Hier ergibt sich dasselbe Resultat wie in der Relaxationszeitnäherung der Boltzmann-Gleichung – ohne dass wir auf ein klassisches Modell zurückgegriffen haben. Insbesondere gilt unsere Herleitung auch für quantenmechanisch delokalisierte Teilchen, wie sie in der Festkörperphysik allgegenwärtig sind. Um die Transportgleichung zur Berechnung des elektrischen Stroms und des Entropiestroms auszuwerten, benötigen wir noch die Ableitungen
und
∂N (Y ) exp(Y ) = 2 ∂Y exp(Y ) + 1
(14.50)
∂S(Y ) exp(Y ) = kB Y · 2 , ∂Y exp(Y ) + 1
(14.51)
die bis auf den Vorfaktor kB Y = (ε − μ)/T identisch sind. Für die Ableitungen der Zustandsgleichungen für Nε und Sε gilt also: ∂Sε (T, μ) ε − μ ∂Nε (T, μ) = . ∂ε T ∂ε
14.4 Transport in Fermi-Systemen
(a)
ky
(b)
k0
|
535
ky
kx
kx
Fermi - Kugel Abb. 14.20. Darstellung des Nicht-Gleichgewichtszustands a) durch Verschiebung der Fermi-Kugel um der Vektor k0 in Gegenwart eines elektrischen Potenzialgradienten und b) durch zwei FermiHalbkugeln mit unterschiedlichen Werten von μ entsprechend einem Gradienten der Teilchendichte (siehe Text). Nur die elementaren Fermi-Systeme in der Nähe der Fermi-Kante (rot), für die Nk von der (F) Gleichgewichtsverteilung Nk (grauer Kreis) abweicht, tragen zum Transport bei.
Diese Ähnlichkeit ist kein Zufall, sondern spiegelt die Gibbs’sche Fundamentalform in der für Systeme im für lokalen Gleichgewicht gültigen Gestalt von Gl. 8.73 wider: jS =
jE + μ ¯j N . T
Die Zustandsgleichungen für die Energie und den Impuls können ebenfalls durch Nk ausgedrückt werden: Ek (T, μ ¯) = ε(k) · Nk (T, μ ¯)
und P k (T, μ ¯) = k · Nk (T, μ ¯) .
Wir sehen also, dass in linearer Näherung sämtliche Transportströme durch die Differenz der Teilchenzahlen δNk =
∂Nε ∂ε
grad μ ¯−
ε−μ grad T T
· Λk
(14.52)
zwischen in entgegengesetzter Richtung propagierenden elementaren Fermi-Systemen bestimmt werden. Man beachte, dass Nk in Gegenwart eines X -Stromflusses zwar in guter Näherung, (F) aber nicht vollständig durch die Fermi-Funktion Nk beschrieben werden kann, weil aus Symmetriegründen sonst beide Summen in Gl. 14.45 einzeln verschwinden würden. Endliche Ströme j N ergeben sich nur, wenn Nk eine Asymmetrie bezüglich der
536 | 14 Fermi-Systeme (F)
Inversion von k aufweist. Entwickeln wir Nk (F)
(F)
Nk−k0 − Nk
=−
in eine Taylor-Reihe in k
∂Nε ∂Nε ∂ε(k) · k0 = − v · k 0 , ∂ε ∂k ∂ε k
so erkennen wir, dass Gl. 14.52 näherungsweise auf die Form (F)
δNk = Nk − Nk
(F)
(F)
Nk−k0 − Nk
gebracht werden kann, wobei der Vektor k0 wegen Λk = v k τk durch 1 ε−μ k0 =
grad μ ¯−
T
grad T τk ,
gegeben ist. Die Nichtgleichgewichtsverteilung Nk entspricht also näherungsweise der in Abb. 14.20a dargestellten Verschiebung der Fermi-Kugel um den Vektor k0 . Dieses Ergebnis lässt sich so interpretieren, dass die Klammer in Gl. 14.52 ε−μ k F eff =
0
τk
= − grad μ ¯−
T
grad T
einer effektiven Kraft pro Teilchen entspricht, welche dem Fermi-System Impuls zuführt, der durch Streuprozesse mit der Rate 1/τk wieder abgegeben wird, und so zu einem stationären Zustand führt. Diese effektive Kraft enthält also nicht nur den elektrischen Potenzialgradienten, sondern auch den chemischen und den Temperaturgradienten. Diese Betrachtungsweise ist zur Ableitung des elektrischen Widerstands von Metallen üblich, wo die Teilchendichte n (und damit auch dass chemische Potenzial) sowie die Temperatur räumlich konstant sind. In diesem Fall gilt k0 = qˆE · τk , und die effektive Kraft ist mit der durch das elektrische Feld E auf einen Ladungsträger ausgeübten Kraft identisch. Im Falle von elektrisch neutralen Fermionen (zum Beispiel bei der Diffusion von 3He im Kühlkreislauf eines Mischkryostaten) ist kein elektrischer, aber ein chemischer Potenzialgradient vorhanden. In diesem Fall wird die am Ort z + Λk /2 vorliegende Verteilungsfunktion besser als aus zwei Fermi-Halbkugeln zusammengesetzt beschrieben, von denen die linke durch die lokalen Werte vom μ und T bei z + Λk /2 und die rechte durch die Werte bei z − Λk /2 beschrieben wird. Dies ist in Abb. 14.20b dargestellt. Anschaulich unterscheiden sich die beiden Halbkugeln im Radius kF beziehungsweise in der thermischen Verschmierung der Fermi-Kante. Praktisch spielen diese Unterschiede im Detail keine Rolle, weil sich nur Beiträge zu δNk im Transport bemerkbar machen, die bezüglich k0 antisymmetrisch sind. Wird der Unterschied zwischen beiden Fermi-Halbkugeln sehr groß, wird dies zu Abweichungen der Werte von n und der anderen mengenartigen Größen von deren Gleichgewichtswerten führen. Um zu prüfen, inwieweit die Annahme lokalen Gleichgewichts gerechtfertigt ist, berechnen wir zunächst grad μ ¯ für einen von 100 A durch2 ◦ flossenen Kupferdraht mit 1 mm Querschnitt bei 0 C. Mit der gemessenen elektrischen Leitfähigkeit von σ(273 K) = 56/(μΩ m) sowie g(εF ) = 1.16 · 1047 Teilchen/(J m3 )
14.4 Transport in Fermi-Systemen
|
537
und der Einstein-Relation erhalten wir eine Diffusionskonstante von D=
σ 190 cm2 /s2 . e2 g(εF )
Mit der Fermi-Geschwindigkeit vF = 1.6 · 106 m/s ergibt sich eine mittlere freie Weglänge von Λ 35 nm .
Die vorgegebene elektrische Stromdichte von 1.3 · 106 A/m2 erfordert eine elektrische Feldstärke von 0.25 V/m und damit eine auf der Skala Λ bestehende elektrochemische Potenzialdifferenz δμ ¯ = e|E| · Λ 9 · 10−8 eV ≪ εF = 7.1 eV .
Verglichen mit εF ist dies extrem klein! Für einen sehr großen T -Gradienten von 1000 K/cm zwischen 300 K und 1300 K (knapp unter des Schmelzpunkts von 1358 K) erhalten wir auf der Skala Λ den Wert δT 35 mK ≪ TF 8 · 104 K ,
was immer noch vier Größenordnungen kleiner als Zimmertemperatur ist. Dies sind Rechenbeispiele für ein extremes Nichtgleichgewicht, das in der Praxis kaum zu realisieren ist, weil in den genannten Anordnungen sehr hohe Heizleistungen produziert beziehungsweise übertragen würden. Die in makroskopischen Proben auf der Skala der freien Weglänge Λ erzeugbaren T - und μ ¯-Differenzen sind um mindestens acht (!) Größenordnungen kleiner als die charakteristische Energie εF des Fermi-Gases. Daher ist es sicher gerechtfertigt, trotz des durch den Transport bedingten anisotropen Beitrags zu Nk vom einem lokalen Gleichgewicht zu sprechen und die für das Gleichgewicht berechneten Werte der thermodynamischen Größen bedenkenlos zu verwenden. Für die in Kapitel 15 betrachteten Nanostrukturen ist dies oft anders. Die Transportströme ergeben sich durch die Differenz δNk der Verteilungsfunktionen in der Nähe der Fermi-Kante. Wegen der Kleinheit der in der Praxis realisierbaren Werte von δ μ ¯ und δT können nur elementare Fermi-Systeme in unmittelbarer Nähe der Fermi-Kante zum Transport beitragen. Mathematisch äußert sich dies in Gl. 14.52 im Auftreten der Ableitung ∂Nε (T, μ)/∂ε der Verteilungsfunktion (Abb. 14.4), die uns bereits bei der Sommerfeld-Entwicklung begegnet ist. Im Grenzfall T /TF → 0 strebt −∂Nε (T, μ)/∂ε gegen die δ -Funktion und reduziert das Integral Gl.14.49 auf den Wert des Integranden bei εF . Damit wird die Energieabhängigkeit des Integranden irrelevant, und aus diesem Grund ist das einfache Drift-Diffusions-Modell aus Kapitel 8 so erfolgreich. Allein bei der Thermokraft ergeben sich Korrekturen.
538 | 14 Fermi-Systeme 14.4.2 Ladungstransport – elektrische Leitfähigkeit Wir wollen nun die in Abschnitt 8.11 eingeführte Matrix Lsn der Transportkoeffizienten des Fermi-Gases berechnen. Die Anwendung der allgemeinen Transportgleichung Gl. 14.49 auf die Teilchendichte ergibt: ∞ jN =
∂Nε (ε) ε−μ ¯ ¯+ · g(ε) D(ε) · grad μ grad T ∂ε T (F)
dε 0
(
∞ =−
dε
)
(F)
∂Nε (ε) − ∂ε
· σ N (ε) · grad μ ¯+
ε−μ ¯ grad T T
(14.53) ,
0
wobei σ N (ε) = g(ε)D(ε)
und D(ε) =
1 v(ε) ⊗ v(ε) · τ (ε) 3
(14.54)
der energieabhängige Leitfähigkeitstensor und der energieabhängige Diffusionstensor sind. Im Grenzfall T → 0 geht (F)
−
∂Nε
(T, μ) → δ(ε − μ ¯) ∂ε
und wir erhalten für den Teilchenstrom: j N = −σN (εF ) grad μ ¯ = −g(εF )D(εF ) · grad μ ¯.
(14.55)
Da die elektrische Leitfähigkeit σQ = qˆ2 σN beträgt, ist dies in Übereinstimmung mit Gl. 8.26. Die in den Diffusionstensor eingehende Streuzeit τ (ε) wird durch die in Abschnitt 13.2.2 berechnete Phononendichte nph (T ) ∝ T 3 sowie der Dichte statischer Gitterdefekte nstat bestimmt. Bei hohen Temperaturen ist nph (T ) ∝ T und der elektrische Widerstand ist ebenfalls ∝ T . Bei tiefen Temperaturen ist nph (T ) ∝ T 3 , der Widerstand aber ∝ T 5 (Bloch-Grüneisen-Gesetz) (Abb. 14.21a). Dies liegt daran, dass bei tiefen Temperaturen nur akustische Phononen mit kleinen Impulsen q angeregt sind. Daher sind ∝ (kF /q)2 ∝ T 2 Streu-Ereignisse notwendig, um die wegen des Pauli-Prinzips hohen Elektronen-Impulse ∝ kF zu relaxieren. Die elastische Streuung an statischen Gitterdefekten resultiert in einem temperaturunabhängigen Restwiderstand, der bei tiefen Temperaturen zutage tritt, wenn die Elektron-PhononStreuung ausgestorben ist. Die Tatsache, dass sich (für unabhängige Streuprozesse) die Streu-Raten addieren, ist als Matthiesen’sche Regel bekannt: −1 −1 τ −1 (T ) = τin (T ) + τelast =
1 n (T )σel-ph + nstat σelast . vF ph
(14.56)
Dabei sind σel-ph und σelast die quantenmechanischen Streuquerschnitte für die Elektron-Phonon Streuung und die elastische Streuung an Störstellen, Korngrenzen und anderen statischen Gitterdefekten (Gl. 8.6). Die Elektron-Phonon Streuung
14.4 Transport in Fermi-Systemen
(a)
5
(b)
|
539
1012
3 2
σ (Ω-1m-1)
103 R / R290 K
4
Natrium
1010
Kupfer
108
1 Manganin 0
tbp
0
5
10 T (K)
15
20
106
1
10
100
1000
T (K)
Abb. 14.21. a) Normierter elektrischer Widerstand als Funktion der Temperatur von drei NatriumKristallen mit unterschiedlichem Restwiderstand. b) Temperaturabhängigkeit der elektrischen Leitfähigkeit eines hochreinen Kupferkristalls (durchgezogen) und der Legierung Manganin (gestrichelt): Cu0.86 Mn0.12 Ni0.02 (nach [21]).
ist inelastisch, das heißt mit einer Änderung der Energie ε der streuenden Teilchen verbunden, weil sie von Prozessen dominiert wird, bei denen Phononen erzeugt und vernichtet werden. Wie wir im nächsten Abschnitt sehen werden, spielen die inelastischen Streuprozesse selbst dann eine entscheidende Rolle für die Anwendbarkeit der kinetischen Transport-Theorie, wenn τ −1 von den elastischen Streuprozessen dominiert wird. Wie Abb. 14.21 zeigt, kann die Elektron-Phonon-Streuzeit die elastische Streuzeit bei tiefen Temperaturen um Größenordnungen übersteigen. Magnetische Störstellen bilden einen Sonderfall: Hier können bereits kleine Verunreinigungen im ppm-Bereich24 zu einer drastischen Änderung des Verhaltens bei tiefen Temperaturen führen. Als Beispiel ist in Abb. 14.22 ein Vergleich der elektrischen Widerstände von hochreinem Kupfer mit Kupfer, das mit 440 ppm Eisen dotiert wurde, gezeigt. Um die gegenüber dem Restwiderstand ρ0 kleinen Änderungen vergleichen zu können, wurde der reduzierte spezifische Widerstand ρ(T )/[ρ(273 K)−ρ0 ] aufgetragen, wobei ρ0 der spezifische Widerstand am Widerstandsminimum ist. Es ist klar erkennbar, dass der Widerstand des Fe-dotierten Kupfers bei T < 27 K wieder ansteigt. Dies liegt an dem resonanten Charakter der spinabhängigen Streuung der Leitungselektronen an den lokalisierten Spins der Fe-Atome, die bei tiefen Temperaturen zutage tritt. Dieses als Kondo-Effekt bekannte Phänomen wurde bereits um 1930 beobachtet, aber erst 1964 von Kondo mit den Spins der Störstellen in Verbindung ge-
24 ppm: „parts per million“ – solche Konzentrationen von Verunreinigungen können bereits auftreten, wenn als Ausgangsmaterial für das Aufdampfen von dünnen Filmen verwendete Drahtstücke mit einer stählernen Zange abgezwickt werden.
540 | 14 Fermi-Systeme 0.06 0.36 0.04
ρ / (ρ273 K - ρmin)
ρ / (ρ273 K - ρmin)
Cu + 440 ppm Fe 0.34
0.02 0.32
Abb. 14.22. Vergleich des reduzierten elektrischen Widerstands von mit 440 ppm Fe dotiertem Kupfer und hochreinem Kupfer. Die resonante Spin-Streuung in dem Fe-dotierten Kupfer führt zu einem Wiederanstieg des Widerstands hin zu tiefen Temperaturen (nach [21])
reines Cu 0
20
40
60
0.00
T (K)
bracht. Im nächsten Abschnitt werden wir sehen, dass diese in der Thermokraft noch wesentlich stärker in Erscheinung treten.
14.4.3 Ladungstransport – Thermokraft Der zweite Term mit grad T in Gl. 14.53, der uns den Tensor der Seebeck-Koeffizienten S(T ) liefern sollte, verschwindet im Grenzfall T → 0 wegen des ungeraden Faktors ε − μ im Integranden von Gl. 14.53. Um S(T ) zu bestimmen, müssen wir zur nächsthöheren Ordnung in der Sommerfeld-Entwicklung gehen. Wir entwickeln σ N (ε) = σ N (μ) + σ N (μ) · (ε − μ) + . . .
in eine Taylor-Reihe um μ und finden gemäß Gl. 14.19 ( ) (F) L12 =
=
dε
−
∂Nε
kB T σ N (εF ) ·
(T, μ) ∂ε
+∞
−∞
· σ N (ε) ·
x2 dx 4 cosh2 (x/2)
2B1 =π 2 /3
ε−μ T
(14.57)
Mit der elektrischen Leitfähigkeit σ Q = qˆ2 σ N erhalten wir für die elektrische Stromdichte 2 T −1 π 2 kB j Q = −σ Q (εF ) · (14.58) σ Q (ε)σ Q (ε) · grad T . 3 qˆ εF S(T )
Damit haben wir das Element L12 = σ N · qˆS der Matrix der Transportkoeffizienten in Gl.8.69 im Rahmen unseres verbesserten Modells abgeleitet. Für die Thermokraft ergibt sich die Mott-Formel 2 T −1 π 2 kB SD = (14.59) σ Q (ε)σ Q (ε) . 3
qˆ
εF
14.4 Transport in Fermi-Systemen
ε
ε
ε
|
541
ε
eμ
μ
μ μ
(F)
Nε
ε
ε
-eΔφ
(F)
Nε
Abb. 14.23. Zustandsdichten gL,V (ε) (schwarze Linien) und Fermi-Funktionen für das kalte und das heiße Ende eines Metalldrahts bei Anlegen eines Temperaturgradienten zwischen T1 = 0.05(εF − ε0 )/kB und T2 = 0.5(εF − ε0 )/kB . Die Flächeninhalte der grau schattierten Bereiche entsprechen den Elektronendichten und sind wegen der Ladungsneutralitätsbedingung gleich groß. Die Reduktion des chemischen Potenzials mit zunehmender Temperatur kompensiert teilweise die sich wegen der Thermodiffusion der Elektronen aufbauende elektrische Potenzialdifferenz Δφ.
Die Thermokraft eines entarteten Elektronengases ist also nur aufgrund der TeilchenLoch-Asymmetrie um die Fermi-Energie endlich, das heißt wegen σ Q (ε) = 0. Die Energieabhängigkeit von σ Q rührt von der von g(ε) und D(ε) her. Für eine isotrope Bandstruktur können wir Gl. 14.59 auch in der Form 2 T d ln σQ (ε) π 2 kB SD = (14.60) 3 qˆ dε εF
darstellen. Auch in diesem Modell ist S proportional zu T, wenn g(ε) ∝ εα und D(ε) ∝ εβ gemäß einem Potenzgesetz von ε abhängen. Für freie Elektronen mit einer energieunabhängigen Stoßzeit τ ist α = 1/2 und β = 1 und daher σ −1 Q σ Q = 3/(2ε) · 1. Setzen wir dies in Gl. 14.59 ein, so finden wir
2 2 π 2 kB π 2 kB T T SD = (α + β) · = (14.61) 3 qˆ
TF
2 qˆ
TF
für die Diffusions-Thermokraft freier Fermionen. Darunter versteht man den Anteil der Thermokraft, der allein von der Thermodiffusion der Elektronen in einem Temperaturgradienten herrührt. Gleichung 14.59 kann Gültigkeit beanspruchen, solange nicht andere kinetische Effekte auftreten. Wegen des Faktors T /TF handelt es sich um einen kleinen Effekt. Verglichen mit dem früher abgeleiteten Ausdruck (Gl. 8.60) 2 2 T g (ε) 1 ∂μ(T, n) π 2 kB π 2 kB T S(T ) = − (14.62) = = qˆ
∂T
3
qˆ
g(ε)
εF
6 qˆ TF
/gF = 1/(2εF ) einen ist das neue Ergebnis für eine quadratische Dispersion wegen gF Faktor (α + β)/α = 3 größer als das in Gl. 8.60. Dies löst das in Abschnitt 8.9 aufgetre-
542 | 14 Fermi-Systeme
(a)
(b)
/T
/T
Abb. 14.24. Durch die Temperatur dividierter Seebeck-Koeffizient S/T als Funktion von sˆ/T im Grenzfall T → 0 für zahlreiche Metalle. Für Loch-artige Quasiteilchen (ˆ q > 0) ist S positiv (a), während S für Elektronen-artige Quasiteilchen (ˆ q < 0) negativ ist (b). Die beiden Linien repräsentieren S = sˆ/(ˆ qT ) (nach [38]).
tene Problem, dass sich die Thermokraft und der Gradient des chemischen Potenzials scheinbar gegenseitig aufheben. Die Kleinheit der thermoelektrischen Effekte in Metallen hat ihre Ursache in der (F) Symmetrie der Verteilungsfunktion Nε um μ ¯: Fasst man die elementaren FermiSysteme für ε < μ als von Löchern oder Defekt-Elektronen mit der spezifischen Ladung qˆ = +e besetzt auf, so kompensieren sich die Beiträge der thermisch induzierten Teilchen- und Lochströme zum Ladungsstrom in dem Maße, in dem g(ε)D(ε) um μ symmetrisch sind. Abbildung 14.24 zeigt einen direkten Vergleich der Seebeck-Koeffizienten mit der Entropie pro Teilchen in einer großen Zahl von Metallen mit zum Teil sehr schweren Elektronen- und Loch-artigen Quasiteilchen (Schwer-Fermion-Systeme) bei sehr tiefen Temperaturen, wobei beide Größen über drei Größenordnungen variieren. Die sehr gute Korrelation zwischen beiden Größen illustriert qualitativ die Tragfähigkeit des Drift-Diffusionsmodells, sofern nicht die im Folgenden diskutierten Effekte einer Energie-abhängigen Streuzeit eine Rolle spielen. Die eingezeichneten Linien stellen S = sˆ/(ˆ q T ) entsprechend den Gleichungen 14.61 und 14.30. Ein Material, in dem die einfache Physik freier Elektronen dagegen über weite Temperaturbereiche realisiert ist, ist Zinn-dotiertes Indiumoxid (ITO: In1.84 Sn0.16 O3−δ ). In diesem Material kann die Elektronendichte durch die Variation des Sauerstoff-Gehalts im Bereich von 2–7 · 1020 Elektronen/cm3 eingestellt werden und ist damit etwa 100-mal kleiner als in konventionellen Metallen. Durch die niedrige Dichte ist die Plasmafrequenz der Elektronen so klein, dass das Material zwar elektrisch leitet, aber im optischen Bereich transparent ist. Daher ist es gegenwärtig für transparente Berührungssensoren (touch screens!) von großer technischer Bedeutung. Wegen der kleinen Dichte liegt auch die Fermi-Energie dicht am Boden des Leitungsbands, wodurch Charakterisierung von ε(k) durch eine effektive Masse na-
14.4 Transport in Fermi-Systemen
a)
b)
9 TF (1000K)
< S/T (nVK-2)
S (+VK-1)
80
TA(°C) 25 150 200 450
-16
-24 0
100
543
100
0
-8
|
60
6 3 0
0
3
6
n (1020 cm-3)
9
40
200 T (K)
300
20
2
4 6 n (1020 cm-3)
8
10
Abb. 14.25. a) Thermokraft von Zinn-dotierten In2 O3 -Filmen mit verschiedenen Ladungsträgerdichten. b) Vergleich der Steigung S/T der Thermokraft als Funktion der aus dem Hall-Koeffizienten gewonnene Ladungsträgerdichte n. Oben links sind die aus der Elektronendichte gewonnenen Werte von TF (n) dargestellt. Die durchgezogenen Linien sind die Erwartungen des Modells freier Elektronen nach Gl. 14.61 für α + β = 1 (nach [39]).
hezu exakt wird. In Abb. 14.25a sind Messungen der Thermokraft in diesem Material für verschiedene Sauerstoff-Konzentrationen gezeigt. S (T) ist negativ und in einem großen Temperaturbereich proportional zu T . Die Sauerstoffkonzentration wurde durch Erwärmen in Luft bis zur Temperatur TA erhöht und bestimmt die Elektronendichte n, die über den Hall-Effekt gemessen wurde. Abb. 14.25b erkennt man sehr schön, wie die Thermokraft mit zunehmender Elektronendichte in dem Maß abnimmt, in dem TF (n) zu- und die Entropie pro Teilchen abnimmt. Die gute Übereinstimmung mit dem Modell freier Elektronen liegt daran, dass die Elektronendichte so niedrig ist – dadurch ist die Fermi-Fläche sehr weit vom Rand der Brillouin-Zone entfernt und die Abweichung von ε(k) von der Parabelform minimal. Außerdem ist die freie Weglänge aufgrund des Zinn-Gehalts von Sauerstoff-Fehlstellen bestimmt, welche die Elektronen-Streuung dominieren. Effekte der Elektron-Phonon-Streuung sind dagegen vernachlässigbar. Aus Bandstrukturrechnungen kennt man die effektive Masse m ˆ 0.4 m ˆ 0 . Daher kann mit Gln. 14.5 und 14.61 und den gemessenen S -Werten die Ladungsträgerdichte bestimmt werden. Diese Werte sind in Abb. 14.25b als Funktion der durch Messung der Hall-Effekts unabhängig bestimmten Ladungsträgerdichte dargestellt. Die Übereinstimmung ist in diesen Fall sehr gut. In Tabelle 14.2 werden die experimentell bestimmten Werte von S für die Alkalimetalle, die sonst sehr gut im Modell freier Elektronen beschreibbar sind, mit der Vorhersage von Gl. 14.61 verglichen. Auch hier zeigen sich deutliche Unterschiede zwischen Metallen aus derselben Spalte des Periodensystems, die bezüglich ihrer elektronischen Eigenschaften sehr ähnlich sein sollten.
544 | 14 Fermi-Systeme (a)
(b) Au
1.0
% Au 1.0 0
Cu
Ag
Sg (+VK-1)
S (+VK-1)
1.5
0.09 0.79
0.5
0.5
2.2
0
50
100
150
200
250
0
T (K)
50 T (K)
100
Abb. 14.26. a) Gemessene Seebeck-Koeffizienten der Edelmetalle Cu, Ag und Au. Der Phonon-Drag führt zu einem ausgeprägten Maximum in S(T ). b) Unterdrückung des Phonon-Drags und der UmklappStreuung in Ag mit kleinen Beimengungen an Au (nach [40]).
Sind neben den Elektronen noch weitere Quasiteilchensysteme vorhanden (Phononen, Magnonen, etc.), so bewirkt der Temperaturgradient neben dem elektronischen noch weitere Beiträge zum Wärmestrom und – sofern die Kopplung zwischen den Quasiteilchensystemen (beispielsweise die Elektron-Phonon-Wechselwirkung) hinreichend stark ist – auch zum thermoelektrischen Strom. In diesem Fall spricht man von Drag-Phänomenen. Das wichtigste Beispiel ist der Phonon-Drag. Die oft sehr starke Energieabhängigkeit der Streuraten ist der Grund dafür, dass die Thermokraft mit Abstand der sensibelste, das heißt am stärksten von den Details des Materials abhängige, Transport-Koeffizient ist. Während die elektrische Leitfähigkeit, die Viskosität und die Wärmeleitfähigkeit entarteter Fermionen bis auf Vorfaktoren im Rahmen des Drift-Diffusions-Modells gut beschrieben werden, ist die Thermokraft stark von den Details der Bandstruktur und des Streumechanismus abhängig. Entsprechend stimmen die Voraussagen von Gl. 14.59 nur in seltenen Fällen mit dem Experiment überein, wobei scheinbar einfache Metalle, wie die Edelmetalle Cu, Ag und Au, noch nicht einmal vom Vorzeichen her richtig wiedergegeben werden. Dies ist in Abb. 14.26a illustriert. Das Maximum in S(T ) ist durch den Phonon-Drag verursacht. Tab. 14.2. Abweichung der Thermokraft der Alkali-Metalle vom Modell freier Elektronen (α + β = 3/2) für Temperaturen T > ΘD . Die theoretischen Werte wurden mit Hilfe verfeinerter Theorien für die Elektron-Phonon-Wechselwirkung berechnet (nach [41]). Metall
T (K)
α + β (Theorie)
Li Na K Rb Cs
424 300 200 100 100
−5.33 3.05 4.04 2.71 0.83
α + β (Experiment) −6.3 2.9 4.0 2.8 0.0
14.4 Transport in Fermi-Systemen
(a)
(b)
0
|
545
0 Au-Fe
-1
S (μVK-1)
S (μVK-1)
Ag in Au
Au in Ag
0.1 %
-10
-2
0
0.5 %
-5
0.02 %
100
200 T (K)
300
-15 0
4
8 T (K)
12
16
Abb. 14.27. a) Die starke elastische Streuung in Au/Ag-Legierungen macht schließlich das für freie Elektronen erwartete Verhalten von S(T ) ∝ −T sichtbar. b) Kleinste Beimengungen an magnetischen Verunreinigungen (hier Fe in Au) führen zu dramatischen Effekten in S(T ), die auf ein resonantes Verhalten der Spin-Streuung zurückzuführen ist – nach beachte die in Vergleich zu (a) zehnmal höheren Absolutwerte der Thermokraft (nach [40]).
Aber auch bei hohen Temperaturen, wo S(T ) linear in T bleibt, ist das Vorzeichen entgegen den Erwartungen nach der Mott-Formel positiv, obwohl Messungen des HallEffekts zeigen, dass die relevanten Ladungsträger in den Edelmetallen eindeutig negativ geladen sind. Das positive Vorzeichen der Thermokraft ist auf eine starke Abnahme der Streuzeit durch Umklapp-Prozesse in der Elektron-Phonon-Streuung bei hohen Temperaturen zurückzuführen (Abschnitt 13.2.4). Dies führt zu einem negativen Vor zeichen von σQ , welches das negative Vorzeichen von qˆ kompensiert. Bereits kleine Mengen an elastischen Streuern (Au in Ag) führen zu einer Unterdrückung sowohl des Phonon-Drag als auch der Umklapp-Streuung (Abb. 14.26b). In Abbildung 14.27a wird gezeigt, dass nach der Mott-Formel erwartete negative Vorzeichen von S(T ) in stark ungeordneten Au/Ag-Legierungen beobachtet wird, in denen die elastische Streuung dominiert. Abbildung 14.27b zeigt schließlich, dass auch kleine Mengen (20 ppm!) von magnetischen Fremdatomen zu einem negativen Seebeck-Koeffizienten führen, dessen Absolutwert zehnmal größer sein kann als der durch den Phonon-Drag gegebene Beitrag. Dies ist auf den bereits im Zusammenhang mit dem elektrischen Widerstand (Abb. 14.22) erwähnten Kondo-Effekt zurückzuführen. Die resonante Spin-Streuung führt zu scharfen Maxima sowohl in der Zustandsdichte als auch in der Streuzeit, die in einer ausgeprägten Teilchen/Loch-Asymmetrie resultiert, falls die Fermi-Energie nicht genau im Maximum der Kondo-Resonanz liegt.Eine solche Verschiebung der Kondo-Resonanz gegenüber μ ¯ tritt auf, wenn das lokalisierte d- oder f-Niveau der magnetischen Fremdatome nicht mit der Wahrscheinlichkeit 1 bevölkert ist, sondern et-
546 | 14 Fermi-Systeme was von 1 abweicht.25 Mit zunehmender Konzentration der magnetischen Störstellen nimmt der Effekt wieder ab, weil die RKKY-Wechselwirkung (Seite 504) zwischen den magnetischen Momenten die Spin-Streurate wieder reduziert.
14.4.4 Entropietransport – Peltier-Koeffizient und Wärmeleitfähigkeit Dem Entropiestrom im Metall können wir mit Hilfe von Gl. 14.49 und 14.51 ähnlich wie den Teilchenstrom berechnen und finden in Analogie zu Gl. 8.41 1 ε−μ ¯ jS = d3 k (14.63) v(k) · δNk 3 4π
=−
T
(
∞
(F)
)
∂Nε − ∂ε
dε
·
ε−μ ¯ ε−μ ¯ ¯+ σ N (ε) · grad μ grad T T T
.
0
Der Vorfaktor vor grad μ ¯ ist entsprechend der Onsager-Symmetrie identisch mit dem vor grad T in Gl. 14.53 und liefert den Peltier-Koeffizienten Π, der mit der Thermokraft über die Kelvin-Relation (Gl. 8.61) Π=T ·S
verknüpft ist. Die Gültigkeit der Onsager-Symmetrie ist in unserem Modell durch die Maxwell-Relation ∂Sk (T, μ) ∂Nk (T, μ) (14.64) = ∂μ
∂T
sichergestellt. Der Vorfaktor vor grad T ist proportional zu (ε − μ)2 die Integration liefert nach der Sommerfeld-Entwicklung analog zu Gl.14.57 ( ) (F) ε − μ ∂N π2 ¯ 2 dε
−
ε
∂ε
·
σ N (ε) = −
T
3
2 σ N (εF ) . kB
Auf diese Weise finden wir für den elektronischen Beitrag zum Wärmeleitfähigkeitstensor
λel (T ) = T ·
π2 3
kB qˆ
2
σQ (εF ) = D(εF )cv (T ) .
(14.65)
Damit haben wir das Ergebnis des Drift-Diffusions-Modells in Abschnitt 8.6 (Gl. 14.4.4) quantitativ bestätigt und gleichzeitig das Wiedemann-Franz-Gesetz L0 =
λ π2 = T σQ 3
kB e
2
25 In diesem Fall spricht man von Valenzfluktuationen.
= 24.4 nW Ω/K2
(14.66)
14.4 Transport in Fermi-Systemen
|
547
10000 hochreines Kupfer
1000 h (W/m K)
Kupfer Aluminium
100 Messing
10 Edelstahl
1 1
10
T (K)
100
1000
Abb. 14.28. Wärmeleitfähigkeit für verschiedene Metalle und Legierungen (nach [42]).
für entartete Fermi-Systeme abgeleitet. Die Lorenz-Zahl L0 stimmt deutlich besser mit den experimentell bestimmten Werten überein als unsere Abschätzung Gl. 8.44 für klassische ideale Gase. Das letztere ist jedoch nur gültig, wenn die freie Weglänge für Elektronen und Phononen durch denselben Streumechanismus begrenzt ist. Die nach Gl. 14.65 erwartete Temperaturabhängigkeit der Wärmeleitfähigkeit von Metallen ist in Abb. 14.28 für einige reine Metalle und Legierungen illustriert: Bei tiefen Temperaturen dominiert die elastische Streuung [Λ(T ) = const.] an statischen Gitterstörungen, und es wird ein linearer Anstieg in λ(T ) beobachtet, der auf den linearen Verlauf von cˆv (T ) = γ T zurückzuführen ist. Bei Legierungen ist die freie Weglänge durch die fehlende Gitterperiodizität extrem kurz und weitgehend T -unabhängig. Erst bei sehr hohen Temperaturen (T 150 K) macht sich zusätzlich die Elektron-Phonon-Streuung bemerkbar. Bei hochreinen Metallen (typisch 99.999%) ist die Diffusionskonstante um Größenordnungen höher als bei Legierungen, weil die Effektivität der Elektron-Phonon-Streuung extrem schwach ist, solange keine Phononen thermisch angeregt sind, deren Impulsbetrag mit einem minimalen Impuls qmin vergleichbar ist. Der Wert von qmin ist für ein halb gefülltes Leitungsband von der Größenordnung kF und allgemeiner durch dem minimalen Abstand zwischen der Fermi-Fläche in einer Brillouin-Zone und deren Wiederholung in der nächsten Brillouin-Zone gegeben. Daher können in einem mittleren Temperaturbereich die bereits erwähnten Umklapp-Prozesse einsetzen, sodass die Diffusionskonstante abnimmt. Bei hohen Temperaturen (T 150 K) wird die freie Weglänge Λ(T ) ∝ nPhonon ∝ T , sodass die Wärmeleitfähigkeit weitgehend T -unabhängig wird. Im Bereich mittlerer Temperaturen ist das Wiedemann-Franz-Gesetz nicht erfüllt,
548 | 14 Fermi-Systeme weil die elektrische und die thermische Leitfähigkeit durch unterschiedliche Streuzeiten bestimmt werden: Für die elektrische Leitfähigkeit ist die Impuls-Relaxationszeit, für die thermische Leitfähigkeit die Energie-Relaxationszeit maßgeblich. Der Phononenbeitrag zur Wärmeleitfähigkeit wird nur in sehr ungeordneten Metallen sichtbar, wo der elektronische Beitrag stark reduziert ist.
14.5 Halbleiter Halbleiter wie Si, Ge, GaAs, InAs oder InSb sind in der Regel Isolatoren mit einer relativ kleinen Bandlücke (Abb. 14.1). Sie verhalten sich bei tiefen Temperaturen daher wie Isolatoren, können aber bei geeigneter Dotierung bei Zimmertemperatur eine für Anwendungen nutzbare Leitfähigkeit aufweisen. Durch Dotierung mit einer geringen Menge an Fremdatomen mit anderer Zahl von Valenz-Elektronen lässt sich das (elektro)-chemische Potenzial in Halbleitern stark verschieben und ihre elektrischen Transporteigenschaften maßgeschneidert beeinflussen. Auf dieser Eigenschaft beruht eine große Zahl elektronischer Bauelemente. Darüber hinaus sind Halbleiter die für die thermoelektrische Energiekonversion bisher interessantesten Materialien, weil sie eine hohe Thermokraft mit einer (relativ) geringen Wärmeleitfähigkeit verbinden.
14.5.1 Quasiteilchen in intrinsischen Halbleitern Zunächst wollen wir idealisierte Halbleiter mit einer vernachlässigbaren Konzentration von Fremdatomen betrachten. Im Grenzfall T → 0 sind diese perfekte Isolatoren. Erst bei endlichen Temperaturen wird eine kleine Zahl von Quasiteilchen thermisch angeregt. Die im Leitungsband erzeugten Elektronen-ähnlichen Quasiteilchen hinterlassen im Valenzband eine gleich große Zahl von positiv geladenen Loch-artigen Quasiteilchen. Statt von Quasiteilchen sprechen wir im folgenden einfach kurz von Elektronen und Löchern. Da sowohl die Elektronen als auch die Löcher vornehmlich in der Nähe der Bandextrema εV und εL auftreten, lässt sich die Bandstruktur im relevanten Energiebereich durch die effektiven Massen26 in guter Näherung beschreiben: m ˆ :=
∂ 2 ε(k) ∂(k)2
−1 .
(14.67)
26 Diese Definition der effektiven Masse bietet sich für die Halbleiterphysik an, weil sie die Dispersionsrelation in der Nähe der Bandextrema charakterisiert. Aufgrund der Anisotropie der Flächen konstanter Energie in realen Kristallen ist die (inverse) effektive Masse in der Regel anisotrop, das heißt ein Tensor, der in klassischer Betrachtungsweise den Vektor der Beschleunigung mit dem Kraftvektor verknüpft. Sie unterscheidet sich von der in Metallen und in der Relativitätstheorie verwendeten Defi-
14.5 Halbleiter |
549
Die Teile der Bandstruktur mit den größten effektiven Massen sind für die thermischen und elektrischen Eigenschaften am wichtigsten, weil diese die niedrigsten Anregungsenergien und damit die höchsten Dichten haben. Die größten effektiven Massen im Leitungsband von Silizium und Germanium (m ˆ L 1–1.5 m ˆ 0 ) sind in der der Regel größer als die im Valenzband (m ˆ B 0.03–0.5 m ˆ 0 ). Dabei ist m ˆ 0 die spezifische Masse freier Elektronen. Wegen der quadratischen Dispersionsrelation können wir für die Zustandsdichten unseren Standard-Ausdruck * + )3/2 (2m ˆ gV,L (ε) =
V,L
±(ε − εV,L ) · θ ± (ε − εV,L )
2π 2 3
verwenden, wobei das Minuszeichen in der Wurzel und der Stufenfunktion θ(ε) auf das Valenzband angewandt werden muss. Solange die Temperaturen klein gegen die Bandlücke sind, können wir die Quasiteilchen als verdünntes „klassisches“ Gas betrachten und die Boltzmann’sche Näherung
1 ε−μ * + Nε (T, μ) = exp − exp (ε − μ)/kB T + 1
kB T
der Fermi-Funktion benutzen und erhalten nach Integration über ε die Elektronendichte im Leitungsband:
∞
3/2 nL (T, μ) =
(2m ˆ L) 2π 2 3
exp
μ kB T
dε
√
εL
(2m ˆ L kB T )3/2 ε −μ = exp − L kB T 2π 2 3
ε − εL exp −
∞ 0
= jL T 3/2 exp −
εL − μ kB T
ε kB T
√ dx x exp(−x)
√ Γ(3/2)= π/2
(14.68)
.
Für die Dichte nV der Löcher im Valenzband erhalten wir den analogen Ausdruck
εV − μ nV (T, μ) = jV T 3/2 exp . (14.69) kB T
Diese Ausdrücke sind identisch mit den durch Gl. 6.17 gegebenen Dichten zweier idealer Gase mit dem Spin 1/2, den chemischen Konstanten27
3/2 jL,V = 2 ·
m ˆ L,V kB 2π 2
nition der Masse nach Gl. 1.4, welche den Vektor der Geschwindigkeit mit dem Impuls verknüpft. Bei Metallen ist kF /vF oft ein besseres Charakteristikum der Bandstruktur, weil ∂ 2 ε(k)/∂k2 Null und das entsprechende m ˆ unendlich werden kann. 27 In der Halbleiterphysik bezeichnet man die Vorfaktoren NL,V = jL,V T 3/2 in Gln. 14.68 und 14.69 auch als effektive Zustandsdichten.
550 | 14 Fermi-Systeme Nε (μ,T)
Nε (μ,T)
g (ε)
(a)
(b)
1
1 gV (ε)
g (ε)
μ(T) gV (ε)
μ(T)
kBT gL (ε)
gL (ε)
1/2
1/2
kBT
εV
μ(T=0)
εL
ε
μ(T=0) εL
εV
ε
Abb. 14.29. Zustandsdichten gL,V (ε) (schwarze Linien) und Fermi-Funktionen für elektronartige (rot) und lochartige (rot gestrichelt) Quasiteilchen. Die entsprechenden Quasiteilchendichten nL und nV sind durch den Flächeninhalt der grau schattierten Bereiche bestimmt. a) Undotierter Halbleiter bei hohen Temperatur: Ladungsträger wurden aus dem Valenzband in das Leitungsband angeregt. Wegen der niedrigeren Masse im Leitungsband (m ˆ L /m ˆ V = 0.79) ist das elektrochemische Potenzial μ bei kB T = 0.15 εg zu höheren Energien verschoben. b) n-dotierter Halbleiter bei niedrigerer Temperatur: Ladungsträger wurden aus dem Donatorbereich dicht unterhalb des Leitungsbandes ins Leitungsband angeregt. Der Akzeptorbereich dicht oberhalb des Valenzbandes enthält sehr viel weniger Störstellen.
und den chemischen Potenzialen von Elektronen (e− )
jL T 3/2 nL
μe− (T, nL ) = εL − kB T ln
(14.70)
,
und Löchern (h+ ) .
μh+ (T, nV ) = − εV − kB T ln
jV T 3/2 nV
/ .
(14.71)
Das negative Vorzeichen vor μh kommt daher, dass die Energien der Löcher in negativer Richtung gezählt werden. Die Tatsache, dass die Verteilungen der Elektronen und der Löcher durch die Funktionen (F)
Nε,e− := Nε
(T, μ − εL )
und
(F)
Nε,h+ := 1 − N−ε (T, εV − μ)
mit denselben Werten von T und μ beschrieben werden, bedeutet nichts anderes, als dass Elektronen und Löcher miteinander im thermischen und chemischen Gleichgewicht stehen, dass also μe− = −μh+ = μ
ist.
14.5 Halbleiter |
551
Wenn wir Gln. 14.70 und 14.71 addieren, erkennen wir, dass das Produkt nL nV nur von T abhängt:28
εg nL (T, μ) · nV (T, μ) = jL jV T 3 exp − (14.72) kB T
Diese Gleichung stellt das Massenwirkungsgesetz (in der Formulierung von Aufgabe 7.4) für die in Abschnitt 10.1 als Beispiel angeführte Reaktion + e− k + hk Phononen (oder Photonen) .
dar. Die Reaktionsgleichung drückt aus, dass bei Fermionen Teilchen und Antiteilchen stets in gleichen Mengen erzeugt werden, und ist in Übereinstimmung mit der Tatsache, dass der Halbleiterkristall bei thermischer Anregung elektrisch neutral bleiben muss: !
nL (T, μ) = nV (T, μ) .
Indem wir aus Gl. 14.72 die Wurzel ziehen, erhalten wir die intrinsische Ladungsträgerdichte
εg 3/2 ni (T ) = nL,i (T ) = nV,i (T ) = jL jV T exp − , (14.73) 2kB T
welche wegen des chemischen Gleichgewichts allein von T abhängt. Lösen wir diese Beziehung nach μ auf, so resultiert schließlich das chemische Potenzial: μ(T ) =
εV + εL 3 + kB T ln 2 4
m ˆV m ˆL
.
(14.74)
Bei tiefen Temperaturen kB T εg und m ˆV = m ˆ L liegt μ also genau in der Mitte der Bandlücke. Wenn die effektiven Massen verschieden sind, verschiebt es sich proportional zu T in die eine oder andere Richtung (Abb. 14.29a). Die Ladungsneutralität als Randbedingung für die Erzeugung oder Rekombination von Teilchen-Loch-Paaren macht sich anders als die freie Erzeugbarkeit von Photonen oder Phononen nicht dadurch bemerkbar, dass μ ≡ 0, sondern dass es allein eine Funktion der Temperatur (und nicht auch von n!) ist. Dies ist typisch für innere Gleichgewichte und analog zu der Dissoziation von H2 O in OH– und H3 O+ oder Tatsache, dass p = p(T ) im Verdampfungsgleichgewicht. Durch Einstrahlung von Licht (Photozelle) oder Injektion von Ladungen (pnÜbergang) kann das innere Gleichgewicht gestört werden: In diesem Nichtgleichgewichts-Zustand sind die Elektron-Loch-Dichten wesentlich höher als im Gleichgewicht. Nach Abschalten der Störung relaxieren Elektronen und Löcher durch Rekombinations-Prozesse (inelastische Streuung und Paar-Vernichtung) wieder ins Gleichgewicht. Wenn die Intraband-Relaxationszeit wesentlich schneller als die
28 Dieselbe Gleichung gewinnen wir auch durch Multiplikation von Gln. 14.68 und 14.69.
552 | 14 Fermi-Systeme Interband-Relaxationszeit ist, etabliert sich ein chemisches Gleichgewicht zwischen den das Leitungsband bildenden elementaren Fermi-Systemen bei einem anderen Wert μe− als zwischen den das Valenzband bildenden elementaren Fermi-Systemen, welche zu dem gemeinsamen Wert μh+ hin relaxieren. Wenn sich die externe Anregung und die Interband-Relaxation die Waage halten, resultiert ein stationärer Nichtgleichgewichtszustand, in dem die erhöhten Ladungsträgerdichten durch zwei Fermi-Funktionen mit verschiedenen elektrochemischen Potenzialen μe− und μh+ beschrieben werden. In diesem Zusammenhang nennt man die (elektro)-chemischen Potenziale der Elektronen und Löcher auch gerne „Quasi-Fermi-Niveaus“.29
14.5.2 Dotierung und Leitfähigkeit Fremdatome in halbleitenden Kristallen sind in der Regel elektrisch aktiv, weil sie zusätzliche Ladungsträger an das Valenz- und das Leitungsband abgeben, welche die geringe Zahl von thermisch angeregten intrinsischen Ladungsträgern leicht übersteigen können. Das kontrollierte Einbringen solcher Fremdatome in Halbleiter nennt man Dotierung. Ein drei- oder fünfwertiges Fremdatom in einem Silizium-Kristall nimmt entweder ein Elektron auf (zum Beispiel Bor) oder gibt eines ab (zum Beispiel Phosphor). Im ersten Fall spricht man von Akzeptoren, im zweiten Fall von Donatoren. Denken wir uns die Ladungsdichte des Wirtskristalls im Rahmen eines einfachen Kontinuums-Modells homogen verteilt, so befinden sich die in der Nähe eines solchen Dotieratoms gebundenen Elektronen oder Löcher in einem durch die statische Dielektrizitätskonstante r des Halbleiters teilweise abgeschirmten Coulomb-Potenzial, welches ein dem Wasserstoff-Atom ähnliches Anregungsspektrum des gebundenen Ladungsträgers erzeugt. Neben der dielektrischen Abschirmung ist die Masse der Ladungsträger durch die effektive Masse des jeweiligen Bandes gegeben. Auf diese Weise ergibt sich die Ionisationsenergie des Dotieratoms durch die modifizierte Bohr’sche Formel εi = −
ˆ L,V e4 1 m 1 · , 2 (4πr 0 )2 2 i 2
wobei der Index i die Hauptquantenzahl bezeichnet. Die in der Regel kleine effektive Masse und große Dielektrizitätskonstante bewirken, dass die Bindungsenergie im Vergleich zum freien H-Atoms um einen Faktor 100–1000 reduziert und der entsprechende Bohr’sche Radius a0 = 4πr 0 2 /m ˆ L,V e2 vergrößert sind.30 Für Donatoren in
29 Das Symbol μ für das chemischen Potenzial ist in der Halbleiterphysik nicht gebräuchlich, weil es bereits durch die Beweglichkeit (die in diesem Buch mit B bezeichnet wird) belegt ist. Stattdessen spricht man meist von (Quasi)-Fermi-Niveaus (εF ). In dieser Sprechweise tritt deren anschauliche thermodynamische Bedeutung etwas in den Hintergrund. 30 Der große Wert für a0 erklärt im Nachhinein, warum das Kontinuumsmodell auch für das Kristallgitter eine brauchbare Näherung ist.
14.5 Halbleiter |
553
ˆ L /m ˆ 0 = 0.3 (0.15) BindungsSi (Ge) finden wir mit Werten für r = 11.7 (15.8) und m energien um (30.0 ± 0.9) meV. Die zusätzlichen Ladungsträger sind damit bei tiefen Temperaturen an die Störstellen gebunden. Bei Zimmertemperatur (300 K= 25 meV) sind die Störstellen aber mit großer Wahrscheinlichkeit ionisiert und haben die zusätzlichen Ladungsträger entweder an das Valenzband oder an das Leitungsband abgegeben. Das Massenwirkungsgesetz (Gl. 14.72) ist eine sehr starke Aussage, die auch in dotierten Halbleitern und Gegenwart von räumlich modulierten elektrischen Potenzialen gültig bleibt, solange thermisches und chemisches Gleichgewicht zwischen dem Elektronensystem und dem Lochsystem besteht. Die Dotierung bewirkt im wesentlichen eine Verschiebung des chemischen Potenzials. Um diese und die damit verbundenen Änderungen der thermisch induzierten Ladungsträgerdichte zu bestimmen, haben wir von der in Abb. 14.29b skizzierten Zustandsdichte auszugehen, in der neben den Energiebändern des Wirtskristalls auch die schärferen Donator- und Akzeptor(F) Bereiche und die Fermi-Funktion Nε eingezeichnet sind.31 Damit haben wir neben Elektronen und Löchern eine weitere Klasse von elementaren Fermi-Systemen, die gemäß der Fermi-Funktion bevölkert werden. Ein Teil der gezielt eingebrachten Dotierung wird durch Rest-Verunreinigungen im Wirtskristall kompensiert. Im folgenden beschränken wir uns auf einen n-dotierten Halbleiter. Beträgt die Donator- (Akzeptor-) Konzentration nD,A , so ist die Dichte der nicht ionisierten Störstellen n0D durch die Fermi-Funktion32 gegeben:
n0D (T, μ) 1 = +1. nD exp εD − μ/kB T 0 Die Dichte der ionisierten Donatoren beträgt dann n+ D = nD − nD . Zur Berechnung der Temperaturabhängigkeit der Ladungsträgerdichte gehen wir wieder von der Forderung nach Ladungsneutralität + nL + n− A = nD + n V
aus, wobei wir für überwiegende n-Dotierung vereinfachend annehmen können, dass − nL = n+ D − nA
ist. Die Lösung dieser Gleichung unter der Annahme chemischen Gleichgewichts zwischen allen elementaren Fermi-Systemen zeigt, dass vier verschiedene Temperaturbereiche unterschieden werden müssen:
31 Bei hoher Dotierung ( 1018 cm3 ) führt der Überlapp der Donator/Akzeptor-Wellenfunktionen auch zur Ausbildung schmaler Störstellen-Bänder, die schließlich zu metallischem Verhalten führen. 32 Wir ignorieren hier der Einfachheit halber, dass die Spinentartung des Donatorzustands dessen statistisches Gewicht um einen Faktor 2 erhöht.
554 | 14 Fermi-Systeme
a)
b) - ¡g / 2kBT
e
1023
- ¡d / 2kBT
e 3
2
- ¡d / kBT
1
+
¡
4
10
1024
¡L ¡D ¡L+¡V 2
¡V
n (Teilchen/cm-3)
log n V
e
T (K) 20
100 50
Ge
1022 1021 1020 1019 1018 1017 0.00
0.02
0.04
0.06
0.08
0.10
1 / T (K-1)
1/T
Abb. 14.30. a) Schematische Darstellung der Elektronendichte im Leitungsband eines n-dotierten Halbleiters (oben) und chemisches Potenzial (unten) als Funktion der inversen Temperatur. Die T Bereiche 1–4 entsprechen der Aufzählung im Text. b) Entsprechende Messung von nL (T ) in n-dotiertem Germanium über den Hall-Effekt. Der Bereich 4 (Eigenleitung) ist rot gestrichelt dargestellt. Die ArsenDotierung nimmt zwischen 1019 /m3 und 1024 /m3 um jeweils etwa eine Größenordnung zu (nach [32]).
1.
Kompensationsbereich: Bei den tiefsten Temperaturen wird ein (kleiner) Teil der Donatoratome dadurch ionisiert, dass die unvermeidlich vorhandenen Akzeptoren Elektronen einfangen. Das chemische Potenzial liegt entsprechend im Donatorbereich:
nL (T ) ∝ exp −
2.
.
Störstellenreserve: Elektronen werden aus den Donator-Zuständen in das Leitungsband angeregt. Das chemische Potenzial liegt zwischen dem Störstellenbereich und dem Leitungsband (dieser Bereich ist in Abb. 14.29b dargestellt).
nL (T ) ∝ exp −
3.
εD kB T
εD 2kB T
.
Störstellenerschöpfung: Die Donator-Atome sind weitgehend ionisiert. Die Ladungsträgerdichte nL = nD ist unabhängig von T , und das chemische Potenzial verschiebt sich in der Bandlücke nach Gl. 6.13 (wie bei einem klassischen idealen Gas):
μe− (T, nD ) = εL − kB T ln
jL T 3/2 nD
.
(14.75)
4. Eigenleitung: Es werden nun auch Löcher im Valenzband angeregt, und die Verhältnisse gleichen sich denen bei einem intrinsischen Halbleiter an. Das chemische Potenzial liegt etwa in der Mitte der Bandlücke, und
nL (T ) ∝ exp −
εL − εV 2kB T
.
14.5 Halbleiter |
T (K)
(a) 105
20
(b)
10
T3/2
4
10
103 102 101
(3) (1) 102
(2)
Mg2Ge
100 0.00
T-3/2
3
n-Ge B (cm2 V-1 s-1)
σ (Ω-1 m-1)
10
100 50
555
0.02
0.04
0.06
1 / T (K-1)
0.08
0.10
101
5
10
20
50
100 200
T (K)
Abb. 14.31. a) Elektrische Leitfähigkeit von n-dotiertem Germanium für dieselben Proben wie in Abb. 14.30. Die Probe mit der höchsten Leitfähigkeit zeigt bereits metallisches Verhalten. b) Elektronenbeweglichkeit B in Mg2 Ge. Die Proben waren mit 1.3 · 1022 , 4.2 · 1022 , 8.2 · 1023 Al-Atomen pro m3 dotiert (nach [32]).
Die Temperaturabhängigkeit von nL (T ) und μ(T ) in diesen vier Temperaturbereichen ist in Abb. 14.30 gezeigt. Der für Anwendungen interessanteste Bereich ist der der Störstellen-Erschöpfung, weil hier die Leitfähigkeit durch die bei der Herstellung vorgegebenen Donator-Konzentration bestimmt wird und relativ temperaturunabhängig ist. Die Ladungsträgerdichte bestimmt zusammen mit der Beweglichkeit B = e2 τ /m ˆ (Abschnitt 8.4.2) die elektrische Leitfähigkeit: σQ (T ) = nL (T ) BL (T ) + nV (T ) BV (T ) .
Mit Hilfe des Hall-Effekts können die Ladungsträgerdichten experimentell bestimmt werden. Wird an denselben Proben die elektrische Leitfähigkeit gemessen, so lässt sich die Beweglichkeit berechnen. Die Beweglichkeiten sind wegen der verschiedenen effektiven Massen m ˆ L,V im Leitungs- und im Valenzband unterschiedlich. In Tabelle 14.3 sind einige Werte aufgelistet. Die Streuzeit τ ist relativ stark temperaturabhängig und geht über ein ausgeprägtes Maximum, weil bei tiefen Temperaturen die Streuung an den geladenen Störstellen33 und bei hohen Temperaturen die an Phononen dominiert.
33 Hierbei handelt es sich um Coulomb-Streuung am (abgeschirmten) Coulomb-Potenzial der Dotieratome und anderen Störstellen.
556 | 14 Fermi-Systeme 14.5.3 Thermoelektrizität in Halbleitern In Abschnitt 14.4 haben wir gesehen, dass die Thermokraft in den meisten Metallen sehr klein ist. Qualitativ betrachtet hat dies zwei Gründe: 1) Die Entropie pro Teilchen sˆ ∝ T /TF ist sehr klein, und 2) die Beiträge von Elektronen (ε > μ) und Löchern (ε < μ) kompensieren sich fast vollständig, so dass nur ein sehr kleiner, von der TeilchenLoch-Asymmetrie herrührender Rest übrig bleibt. Nun wollen wir zunächst die Thermokraft eines intrinsischen Halbleiters mit Hilfe des Drift/Diffusions-Modells aus Kapitel 8 berechnen. Dazu erinnern wir uns an das Ergebnis für die Thermokraft eines nichtentarteten (Elektronen)-Gases, wie wir es in Abschnitt 8.9 abgeleitet haben: . 3/2
/ 1 ∂s(T, n) 3 sˆ − kB jT kB S(T ) = ln + = (14.76) = . qˆ
∂n
qˆ
n
2
qˆ
Wegen der geringen Ladungsträgerdichte ist die Entropie pro Teilchen hoch und entspricht einer hohen Thermokraft. Wie wir in den vorangegangenen Abschnitten gesehen haben, ist die Teilchendichte stark, für intrinsische Halbleiter oder dotierte Halbleiter im Bereich der Eigenleitung sogar exponentiell, von der Temperatur abhängig. Setzen wir n(T ) aus Gl. 14.73 in Gl. 14.76 ein, so erhalten wir 0
3/2
SL (T, n) =
kB qˆ
=
kB qˆ
m ˆL m ˆV
ln
.
exp
εL − εV kB T
εL − εV 3 + ln kB T 4
m ˆL m ˆV
+
3 2
+
3 2
/ (14.77)
.
Für die Löcher erhalten wir wegen nL (T ) = nV (T ) das ganz ähnliche Ergebnis 0
3/2
SV (T ) =
kB qˆ
=
kB qˆ
m ˆV m ˆL
ln
.
exp
εL − εV 3 + ln kB T 4
εL − εV kB T
m ˆV m ˆL
+
3 2
+
/
3 2
(14.78)
.
Für Temperaturen mit kB T < εL − εV dominiert der erste Term in der Klammer, der bei tiefen Temperaturen sehr hohe Werte annehmen kann. Auch in intrinsischen HalbTab. 14.3. Typ, Bandlücke, intrinsische Ladungsträgerdichte, effektive Massen und Beweglichkeiten für verschiedene Halbleiter bei 300 K.
Typ εg (300 K) [eV] ni [cm−3 ] BL [m2 /(Vs)] BV [m2 /(Vs)]
C
Ge
Si
GaAs
InAs
InSb
indir. 5.47
indir. 0.66 2.4 · 1013 3800 1800
indir. 1.12 1.1 · 1010 1900 480
dir. 1.42 1.8 · 106 9200 400
dir. 0.354
dir. 0.18
40 000 500
80 000 1250
1800 1400
14.5 Halbleiter |
557
Abb. 14.32. Thermokraft von n- und pdotiertem Silizium. Die Thermokraft undotierten Siliziums ist gestrichelt eingezeichnet (nach [43]).
leitern tritt eine teilweise Kompensation von Elektronen- und Loch-Beiträgen ein. Diese ist jedoch nicht vollständig, weil die effektiven Massen m ˆ L und m ˆ V (und eventuell auch die Streuzeiten) für das Valenzband und das Leitungsband verschieden sind. Nehmen wir der Einfachheit halber an, dass die Streuzeiten in den verschiedenen Bändern gleich und energieunabhängig sind, setzen die Summe der Beiträge der verschiedenen Bänder zum Thermostrom in Gl. 14.58 gleich Null und dividieren durch die Gesamtleitfähigkeit σQ = σL + σV , dann erhalten wir wegen Gl. 8.25 für die Thermokraft eines undotierten Halbleiters: .
/ εg k 3 m ˆV −m ˆL m ˆL 3 S(T ) = B + ln . (14.79) + e
m ˆV +m ˆL
kB T
2
4
m ˆV
Die Gewichtung der beiden Komponenten des Quasiteilchengases spiegelt die effektiven Massen im Valenz- und Leitungsband wider. Für Teilchen/Loch-Symmetrie (m ˆV = m ˆ L ) kompensieren sich die Beiträge von Elektronen und Löchern, und die Thermokraft verschwindet. Bei tiefen Temperaturen divergiert die Thermokraft mit 1/T , aber die Leitfähigkeit verschwindet exponentiell und damit wesentlich schneller als S divergiert. Der durch Gl. 14.58 gegebene Thermostrom verschwindet also trotz großer Thermokraft. Gemäß den Werten für die Beweglichkeiten in Tabelle 14.3 ist die Beweglichkeit der Elektronen in der Regel größer als die der Löcher; in diesem Fall dominiert der Elektronenbeitrag und die Thermokraft ist negativ. Für quantitativ richtige Ergebnisse muss auch die Temperaturabhängigkeit der Streuzeit berücksichtigt werden. Eine ganz ähnliche Abschätzung ergibt sich bei der näherungsweisen Berechnung von S mit Hilfe der Boltzmann-Gleichung [43]. Für dotierte Halbleiter erhalten wir im Bereich der Störstellen-Reserve ähnliche Ergebnisse, nur muss die Bandlücke εV − εL durch die Ionisierungsenergie der Donatoren ersetzt werden. Im Bereich der Störstellen-Erschöpfung erhält man die höchsten Werte der Thermokraft und eine schwache logarithmische Temperaturabhängigkeit (Ab-
558 | 14 Fermi-Systeme schnitt 8.9). Dies ist in Abb. 14.32 für schwach dotierte Si-Kristalle demonstriert. Mit den effektiven Massen von Silizium und den aus Abb. 14.32 abgelesenen Maximalwerten von S kann man die Dotierungskonzentrationen nD 1.6 · 1012 /cm3 und nA 1.0 · 1012 /cm3 abschätzen, was etwa zwei Größenordnungen höher als die intrinsische Ladungsträgerdichte bei 300 K ist. Bei höheren Temperaturen setzt mit zunehmender intrinsischer Ladungsträgerdichte der Kompensationseffekt ein, bis die Thermokraft von n- und p-dotiertem Silizium gegen die des undotierten Halbleiters konvergiert. Die Thermokraft des undotierten Siliziums folgt der aus dem ersten Term in Gl. 14.79 hervorgehenden 1/T -Abhängigkeit. Für Teilchen/Loch-Symmetrie verschwindet die Thermokraft auch bei intrinsischen Halbleitern. Für Anwendungen zur Energiekonversion muss man einen Kompromiss zwischen einer hohen Thermokraft und einer akzeptablen Leitfähigkeit schließen, um den thermoelektrischen Qualitätsfaktor ZT des Materials zu optimieren (Gl. 8.66). Neben der im Vergleich zu Metallen hohen Thermokraft haben Halbleiter den Vorteil, dass man p(S > 0) und n-dotierte (S < 0) Materialien in einem Thermoelement kombinieren und so deren Differenz maximieren kann. Dies ist natürlich auch für Peltier-Elemente von Vorteil, weil dann Elektronen und Löcher am heißen Kontakt rekombinieren und die mitgeführte Entropie zurücklassen. Am kalten Ende müssen Elektron-Loch-Paare unter Vernichtung von Phononen paarweise erzeugt werden und dazu Energie und Entropie aus der Umgebung abziehen. Auf diese Weise wird ein zirkulierender Wärmestrom vermieden, der nicht zur Nutzleistung der Peltier-Elements beitragen kann.
14.5.4 Halbleiter-Grenzflächen 14.5.4.1 Der pn-Übergang Wesentlich neue Effekte entstehen, wenn ein n- und ein p-dotierter Halbleiter zu einem pn-Übergang zusammengefügt werden. In diesem Fall spricht man von einem inhomogenen Halbleiter. Durch die Dotierung unterscheiden sich die Dichten und chemischen Potenziale der Ladungsträger (selbst bei gleichem Wirtskristall): Wie in Abb. 14.34 dargestellt, liegt μ im n-dotierten Halbleiter in der Nähe des Leitungsbands, im p-dotierten Halbleiter dagegen in der Nähe des Valenzbands. Ein elektrischer Kontakt zwischen beiden Kristallen resultiert daher in einem Ladungstransfer, der ganz analog zu dem in Abschnitt 14.1.5 besprochenen Ladungstransfer zwischen zwei Metallen mit unterschiedlicher Austrittsarbeit ist. Infolge des Ladungstransfers stellt sich ein elektrochemisches Gleichgewicht mit einem räumlich konstanten Wert von μ ¯ = μ(x) + qˆφQ (x) ein, und es bildet sich an der Grenzfläche eine Raumladungszone. Wegen der (verglichen mit einem Metall) wesentlich niedrigeren Ladungsträgerdichte ist die elektrostatische Abschirmlänge λS (T, n) =
0 r kB T nˆ q2
14.5 Halbleiter |
559
(G. 8.36) und damit auch die räumliche Ausdehnung der Raumladungszone wesentlich größer. In der Raumladungszone baut sich ein elektrisches Feld auf, welches einer Kontaktspannung entspricht. In der Halbleiterphysik nennt man diese auch die Diffusionsspannung. In Gegenwart eines elektrostatischen Feldes verschieben sich die Energien der elementaren Fermi-Systeme gemäß (k)2 2m ˆL
ε(k) = εL +
→
ε(k) = εL − eφQ (x) +
(k)2 , 2m ˆL
(14.80)
(k)2 . 2m ˆV
(14.81)
ε¯L (x) ε(k) = εV −
(k)2 2m ˆV
→
ε(k) = εV + eφQ (x) −
ε¯V (x)
Der räumlich modulierte Verlauf der Bandkanten ε¯L (x) und ε¯V (x) wird im Jargon der Halbleiterphysik auch „Bandverbiegung“ genannt. Dieser ist in Abb. 14.34 illustriert. Der Wert der Kontakt-, oder Diffusionsspannung VD ist wie im Fall der Metalle durch die Differenz der chemischen Potenziale im Volumen, das heißt außerhalb der Raumladungszone gegeben. Im Bereich der Störstellen-Erschöpfung können wir die chemischen Potenziale fern von der Grenzfläche voneinander subtrahieren und erhalten mit Hilfe der Gln. 14.70 und 14.71:
3/2 3/2 eVD = −μ0n − μ0p = εL − εV − kB T ln jL
= εg − kB T ln
jL jV T 3 nD nA
T nD
= kB T ln
nD nA n2i (T )
− kB T ln jV
,
T nA
,
(14.82)
wobei μ0n,p die chemischen Potenziale der isolierten n- und p-dotierten Halbleiterkristalle sind. Die Ladungsträgerdichten sind in guter Näherung durch nL nD und nV nA gegeben. Im letzten Schritt haben wir außerdem Gl. 14.73 benutzt. Im Folgenden wollen wir die Breite der Raumladungszone ermitteln. Dazu müssen wir zwischen den Ladungsträgerdichten auf der n- und der p-dotierten Seite unterscheiden. Um nicht zuviele Indizes mitzuschleppen, verwenden wir für die verschiedenen Teilchendichten ab jetzt die Bezeichnungen nn = nL , pn = nV auf der n-dotierten Seite und np = nL , pp = nV auf der p-dotierten Seite. In n- (p-)dotierten Kristallen gilt nn pn (pp np ). Daher bezeichnen wir Elektronen (nn ) auf der n- und Löcher (pp ) auf der p-dotierten Seite als Majoritäts-Ladungsträger und Löcher (pn ) auf der nund Elektronen (np ) auf der p-dotierten Seite als Minoritäts-Ladungsträger. Aufgrund des Massenwirkungsgesetzes (Gl. 14.72) gilt im Gleichgewicht an jeder Stelle im Kristall n(x) · p(x) = n2i (T ) = const. Da das elektrochemische Potenzial an der Grenzfläche zwischen den n- und p-dotierten Bereichen (wie bei einem intrinsischen Halbleiter) etwa in der Mitte der Bandlücke liegt, ist dort n p und die Dichte n + p 2ni (T ) freier Ladungsträger gegenüber der fern von der Grenzfläche um Größenordnungen reduziert. Man spricht daher von der Rekombinations- oder Verarmungszone oder auch von der Sperrschicht. Wegen der Ladungen der fest eingebauten
560 | 14 Fermi-Systeme
p-dotiert
(a)
n-dotiert
q (x)
enD
- grad φQ (x)
(b)
- enA x
0 x
(c) - eφQ (x)
- eφQ
(- ∞)
0 - eφQ
− dp
0
dn
(+ ∞)
x
Abb. 14.33. Schottky-Modell der Raumladungszone. a) Rechteckig genähertes Profil der elektrischen Ladungsdichte. Ein realistischer Verlauf ist gestrichelt eingezeichnet. b) Zugehöriger Verlauf der elektrischen Feldstärke und c) des elektrostatischen Potenzials.
ionisierten Dotieratome ist die Ladungsneutralität in diesem Bereich gestört. Die lokale Ladungsdichte in der Raumladungszone beträgt:
e n+ D − nn (x) + pn (x)
für x > 0 im n-dotierten Gebiet,
q(x) = −e n+ A + np (x) − pp (x)
für x < 0 im p-dotierten Gebiet.
q(x) =
Das elektrostatische Potenzial φQ (x) ergibt sich durch Lösung der Poisson-Gleichung ∂ 2 φQ (x) q(x) =− . r 0 ∂x2
Dabei ergibt sich allerdings die Schwierigkeit, dass die in die lokale Ladungsdichte eingehenden Dichten freier Ladungsträger wegen der Bandverbiegung selbst von φQ (x) abhängen. Eine exakte Lösung kann daher, von einer Anfangsverteilung startend, nur iterativ erfolgen. Alternativ können wir aber auch einen plausiblen Ansatz zur Berechnung einer Näherungslösung verwenden. Der einfachste Ansatz, den wir machen können, ist der einer stückweise konstanten Ladungsdichte (q = −enA im Intervall x ∈ [−dp , 0], q = enA im Intervall x ∈ [0, dn ] und q = 0 sonst), wie sie in Abb. 14.33 zusammen mit dem resultierenden Verlauf des elektrischen Potenzials und der Bandkanten εL,V (x) dargestellt ist (Abb. 14.33). In diesem nach Schottky benannten Modell ist der Potenzialverlauf fern von der Grenzfläche konstant und in der Nähe der Grenzfläche stückweise quadratisch in x: φQ (x) = φQ (∓∞) ±
enA,D (dp,n ± x)2 . 2r 0
Aus der Neutralitätsbedingung nD dn = nA dp und der Randbedingung VD = φQ (−∞) − φQ (+∞)
(14.83)
14.5 Halbleiter |
561
erhalten wir dann im Rahmen der Schottky-Näherung für die Breite der Raumladungszonen dn0 = λS (T, nD ) ·
dp0 = λS (T, nA ) ·
nA 2eVD = kB T (nA + nD )
nD 2eVD = kB T (nA + nD )
2r 0 VD nA enD (nA + nD )
(14.84)
2r 0 VD nA , enD (nA + nD )
wobei die Bezeichnungen dn0 und dp0 zum Ausdruck bringen sollen, dass diese Ausdrücke für den Gleichgewichtsfall U = 0 gelten, in dem keine externe Spannung U an den pn-Übergang angelegt wird. Wie die Randbedingung Gl. 14.83 zeigt, werden die Werte von dn und dp von U abhängen. Im Gegensatz zu unserem Ergebnis für die elektrostatischen Abschirmlänge λS in Abschnitt 8.4.4 sind die Breiten der Raumladungszonen nicht allein durch die Eigenschaften des Elektronen-(Loch)-Gases, sondern auch durch die Diffusionsspannung VD bestimmt. Um ein Gefühl für die Größenordnungen zu bekommen, nehmen wir eVD = εg 1 eV und nA = nD 10 · 1016 /cm3 an und erhalten dn0 = dp0 100 nm und entsprechend eine elektrische Feldstärke von 107 V/m. Obwohl dieser innere elektrische Potenzialgradient die von außen typischerweise angelegten elektrischen Felder um mehrere Größenordnungen übersteigt, fließt nach der Einstellung des elektrochemischen Gleichgewichts kein Strom, da dieser durch den chemischen Potenzialgradienten exakt kompensiert wird. Der chemische Potenzialgradient entspricht dem Gradienten der Teilchendichte und treibt Elektronen in Richtung der p- und Löcher zur n-dotierten Seite, das heißt jeweils gegen das innere elektrische Feld. Das so entstandene elektrochemische Gleichgewicht lässt sich stören, wenn zusätzlich eine externe Spannung angelegt und Strom durch den Kontakt getrieben wird. Wie in Abb. 14.34a dargestellt, wird die Bandverbiegung verkleinert, wenn der Pluspol der auf eine bestimmte Spannung U eingestellten externen Spannungsquelle an der p-dotierten Seite angeschlossen wird. Damit wird die Zahl der thermisch angeregten Elektronen (Löcher), die von der n- (p-)dotierten auf die p- (n-)dotierte Seite diffundieren und dort rekombinieren können, vergrößert – diese Polarität wird die Durchlass-Richtung genannt. Im umgekehrten Fall wird die Zahl der auf die jeweils andere Seite diffundierenden Ladungsträger verkleinert – diese Polarität wird entsprechend die Sperr-Richtung genannt (Abb. 14.34b). Um die im Nichtgleichgewicht entstehenden Verhältnisse zu verstehen, ist es hilfreich, sich zuerst einen entscheidenden Unterschied zwischen dem Ladungstransport durch einen homogenen Leiter und dem durch einen pn-Übergang klarzumachen: Während in einem homogenen Leiter gemeinsam mit der Ladung auch die Teilchenzahl erhalten ist, ist dies beim pn-Übergang anders – wird eine externe Spannungsquelle mit dem Pluspol an der p-dotierten und dem Minuspol an der n-dotierten Seite angeschlossen, so fließen sowohl die Elektronen als auch die Löcher zur Grenzfläche hin. Bei umgekehrter Polung fließen sie dagegen jeweils von der Grenzfläche
562 | 14 Fermi-Systeme a)
¡
p-dotiert
b)
n-dotiert
p
+e-
U
-e (VD - |U|)
¡
n L
+ e-,h+
n-dotiert
¡L
¡ Vp
p-dotiert
p
¡L
+ e-,h+
¡
+ e-,h+
+ h+ U
-e (VD +|U|)
¡Ln
¡ Vp
+ h+
+ e-,h+
¡ Vn
+ e-
¡Vn
x
x
Abb. 14.34. Verlauf der Bänder (schwarze Linien) und der elektrochemischen Potenziale der Elektronen (¯ μe− ) und Löcher (¯ μh+ ) (rote Linien) in a) Durchlass-Richtung und b) Sperr-Richtung. Die Pole der angelegten Spannung U sind mit ⊕ (rot) und (schwarz) bezeichnet. Die Bandverbiegung wird in Durchlassrichtung abgebaut und in Sperrrichtung vergrößert.
weg. Dies ist im stationären Betrieb nur dann möglich, wenn die im ersten Fall einlaufenden Elektron-Loch-Paare in der Nähe der Grenzfläche mit der Rate ΣN = I/e vernichtet und im zweiten Fall mit einer entgegengesetzt-gleichen Rate erzeugt werden. Im ersten Fall spricht man daher von der Rekombinations-Rate, im zweiten von der Generations-Rate und ebenso von Rekombinations- und Generations-Strömen. Daraus ergibt sich eine für Halbleiterbauelemente zentrale Asymmetrie des Leitwerts eines pn-Übergang, nämlich die Charakteristik einer Diode. Während im ersten Fall Ladungsträger durch die externe Spannungsquelle in (prinzipiell) beliebigen Mengen nachgeführt werden können, müssen die Ladungsträger im zweiten Fall in der Nähe der Grenzfläche, das heißt innerhalb der Diode erzeugt werden. Dies geschieht dadurch, dass Elektron-Loch-Paare unter gleichzeitiger Vernichtung von Phononen durch den quantenmechanischen Prozess der Paarerzeugung entstehen. Das bedeutet, dass in einer Diode abhängig von der Stromrichtung entweder die chemische Reaktion + e− in Durchlassrichtung k + hk −→ Phononen oder die umgekehrte Reaktion + Phononen −→ e− k + hk
in Sperrrichtung
abläuft, wie dies in Abschnitt 10.1 bereits angesprochen wurden. Sowohl die Paarerzeugungsrate als auch die Paarvernichtungsrate werden daher durch die kombinierte Elektron-Loch-Phonon-Streuzeit τehp bestimmt, welche auch die Interband-Relaxationszeit genannt wird. Für sehr kleine Spannungen ist die Relaxation effektiv genug, dass die lokalen Ladungsträgerdichten nahe an den Werten im Gleichgewicht bleiben, sodass der Strom zur angelegten Spannung U proportional ist, wobei der Widerstand durch die intrinsische Ladungsträgerdichte und die Beweglichkeiten in der Verarmungszone bestimmt ist. Bei höheren Spannungen in Sperr-
14.5 Halbleiter |
563
500 400
I ( A)
300 200 100
0.1 0 -0.1 - 0.2
0.0 U (V)
0.2
Abb. 14.35. Strom-Spannungs-Kennlinie einer Halbleiterdiode. Der Bereich niedriger Ströme ist in einer um den Faktor 1000 gestreckten Skala dargestellt, um den kleinen Sperrstrom sichtbar zu machen (nach [32]).
richtung kann die Paar-Erzeugung dem Abtransport durch die angelegte Spannung nicht mehr folgen. Die Paarerzeugungsrate ist stark von der Phononendichte und damit von der Temperatur abhängig, aber weitgehend unabhängig von der angelegten Spannung. Der Paarerzeugungs-Prozess führt (für ausreichend hohe Spannungen) daher zu einer von der angelegten Spannung U unabhängigen Sperr-Strom IS (T ), der ein reiner Generations-Strom ist. In Durchlassrichtung nimmt der Strom exponentiell zu, weil die über die (im Gleichgewicht durch eVD gegebene) Diffusions-Barriere Δ(U ) = e(VD − U ) linear abnimmt und der Bruchteil der Elektronen, die über die Barriere hinweg auf die pdotierte Seite diffundieren können, gemäß der Boltzmann-Verteilung exponentiell ansteigt. Bedenkt man, dass der Generations- und der Rekombinations-Strom für kleine |U | gleich sein müssen, um I(U = 0) = 0 zu gewährleisten, so lässt sich die Strom-Spannungs-Kennlinie in erster Näherung durch den Ausdruck .
/ eU I(U ) = IS (T ) exp −1 (14.85) kB T
beschreiben. In Abbildung 14.35 ist dieser Verlauf mit realistischen Parametern dargestellt. Der Sperrstrom IS (T ) enthält Anteile von Elektronen und Löchern und ist im wesentlichen durch Elektron/Loch-Rekombinationszeit τeh gegeben, weil der Beitrag der Minoritätsladungsträger für kleine (und für negative) Spannungen wegen εg kB T bei Raumtemperatur vernachlässigbar ist. Neben der thermisch induzierten Erzeugung von Elektron-Loch-Paaren ist es in direkten Halbleitern auch möglich, diese optisch – durch das Einstrahlen von Licht mit einer Energie, die oberhalb der Bandlücke liegt – zu erzeugen. Wird eine solche Diode in Sperrrichtung gepolt, so hängt der Sperrstrom von der Lichtintensität ab. Dies ist das Funktionsprinzip einer Photodiode. Die für die Einstellung chemischen Gleichgewichts innerhalb eines Bandes verantwortlichen Intraband-Relaxationszeiten τe und τh sind in der Regel wesentlich kür-
564 | 14 Fermi-Systeme zer als die für die Rekombination von Elektronen und Löchern notwendige InterbandRelaxationszeit τeh . Daher relaxieren die Elektronen der p-dotierten Seite erst innerhalb des Leitungsbands in ein lokales Gleichgewicht bei einem gegenüber den Löchern erhöhten chemischen Potenzial μ ¯ e− > μ ¯h+ . Die Elektronendichte ist dort gegenüber dem nach dem Massenwirkungsgesetz erwarteten Gleichgewichtswert neq n = n2i (T )/pp stark erhöht. √ Erst bei Abständen, die größer sind als die Rekombinationslänge De τeh der Elektronen auf der p-dotierten Seite, nimmt deren Dichte langsam in Richtung der (in der Regel vernachlässigbaren) Gleichgewichtswerte ab. Ähnlich sind die Verhältnisse bei den auf die n-dotierte Seite diffundierenden Löcher. Die Injektion und Extraktion von „heißen“ Quasiteilchen über die Diffusionsbarriere in der Sperrschicht hinweg führt also lokal zu einem chemischen Ungleichgewicht zwischen Elektronen-artigen und Loch-artigen Quasiteilchen, welche unter sich aber durchaus in chemischen Gleichgewicht sind, sofern die Interband- und Intraband-Streuzeiten τe,h und τeh hinreichend verschieden sind. Eine obere Schranke für den in Durchlass-Richtung fließenden Strom ist durch die Wärmeentwicklung in der Nähe der Grenzschicht bestimmt. Wir können fragen, ob dabei die Entropie-Erzeugung bei der inelastischen Rekombination über die Bandlücke oder die von den Quasiteilchen herangeführte Peltier-Wärme dominiert. Nach unserer Diskussion in Abschnitt 8.9 beträgt die im Bereich der Störstellen-Erschöpfung von den Quasiteilchen mitgeführte Peltier-Wärme bei Raumtemperatur etwa 10– 20kB T 250 meV–500 meV pro Quasiteilchen. Bei der Rekombination über die Bandlücke werden dagegen je nach Halbleiter 0.5 eV–1 eV pro Quasiteilchen frei. Die beiden Beiträge zur Erwärmung der Nichtgleichgewichtszone sind also von gleicher Größenordnung, und in der Regel wesentlich höher, als die durch den Stromfluss in dem homogenen Halbleitermaterial erzeugte Joule’sche Wärme. Die in Sperrrichtung erwartete Abkühlung der Verarmungszone durch den Peltier-Effekt ist dagegen wegen der Kleinheit des Sperrstroms vernachlässigbar gering. Nach Gl. 14.83 hängt die Breite der Sperrschicht von der extern angelegten Spannung ab. Ersetzt man in Gl. 14.84 VD durch VD − U , so erhält man: dS (U ) = dn (U ) + dp (U ) =
2r 0 (VD − U ) nA + nD , e nD nA
(14.86)
wobei A der Flächeninhalt der Grenzschicht ist. Die Dicke der Sperrschicht nimmt mit zunehmender Spannung in Durchlassrichtung zu und in Sperrrichtung ab. Bei hoher Dotierung ist die Sperrschicht schon bei U = 0 dünn. Mit zunehmender Spannung in Sperrrichtung wird die Sperrschicht noch dünner, und es kommt zum ZenerDurchbruch, weil die Ladungsträger durch die Sperrschicht dann quantenmechanisch durchtunneln können. Die Diode wird ab einer mit dS (U = 0) abnehmenden Spannung dann auch in Sperrrichtung wieder leitend, wobei die Tunnelwahrscheinlichkeit durch die angelegte Spannung bestimmt wird. Weil dieser Durchbruch sehr plötzlich einsetzt, kann man solche Zener-Dioden in elektronischen Schaltkreisen
14.5 Halbleiter |
565
zur Erzeugung einer konstanten Referenzspannung benutzen. Der Zener-Durchbruch konkurriert mit dem Lawinen-Durchbruch, bei dem Ladungsträger durch Stoßionisation von Störstellen weitere Ladungsträger zusätzlich erzeugen, die wiederum durch das hohe elektrische Feld in der Sperrschicht so stark beschleunigt werden, dass auch diese weitere Ionisationsprozesse auslösen. Der Stromfluss nimmt beim Lawinendurchbruch zunächst unbegrenzt zu und führt sehr schnell zu hohen Stromstärken, durch die das Bauelement zerstört wird. Silizium und Germanium sind indirekte Halbleiter, bei denen die Extrema des Leitungsbands und des Valenzbands bei verschiedenen k-Vektoren liegen. Da optische Übergänge wegen der kleinen k-Vektoren der Photonen in der Regel vertikal sind, muss die Quasiteilchen-Relaxation nicht-strahlend, dass heißt über die Emission von Phononen erfolgen. Bei direkten Halbleitern, wie zum Beispiel GaAs, ist auch strahlende Rekombination, also die Emission von Photonen mit der Energie der Bandlücke, möglich. Dies hat zahlreiche technische Anwendungen, zum Beispiel in Leuchtdioden und Laserdioden. Für letztere ist es nötig, ein so starkes TeilchenLoch-Ungleichgewicht zu erzeugen, dass eine Besetzungsinversion im Bereich der Raumladungszonen, also np > pp auf der p-dotierten Seite oder pn > nn auf der n-dotierten Seite, erreicht wird. Umgekehrt kann ein Teilchen-Loch-Ungleichgewicht auch durch Einstrahlen von Licht erzeugt werden. Dies wird beispielsweise bei der Photodiode oder bei Solarzellen technisch ausgenutzt. Die Verarmungszonen in pn-Übergängen liefern auch einen kapazitiven Beitrag zur Impedanz des Kontakts, der gegenüber dem dissipativen Anteil dominiert, wenn die Diode in Sperrrichtung betrieben wird. Mit Gl. 14.86 können wir die Zustandsgleichung des von den p- und n-dotierten Bereichen gebildeten Kondensators berechnen: Die auf einer Seite der Grenzfläche, beispielsweise der n-dotierten Seite, gespeicherte Raumladung beträgt Q(U ) = −enD dn (U ). Durch Differenzieren der Zustandsgleichung Q(U ) nach U erhalten wir die differenzielle Kapazität der Raumladungszone: C(U ) =
A 2
2r 0 nA n D . VD − U n A + n D
Dies schlägt sich im Spektrum der Halbleiterbauelemente in Kapazitätsdioden nieder, die in Hinblick auf einen kleinen Sperrstrom optimiert sind. Im Gegensatz zu einem konventionellen Kondensator ist die Kapazität (wie der Leitwert) von der Spannung abhängig und kann durch diese gesteuert werden. Auf diese Weise können zum Beispiel spannungsgesteuerte Oszillatoren gebaut werden.
14.5.4.2 Metall/Halbleiter-Kontakte Eine Variante des pn-Übergangs liegt an den Grenzflächen zwischen Metallen und Halbleitern vor. Auch hier tritt ein Ladungstransfer auf, dessen Richtung durch das Verhältnis der Austrittsarbeiten WA bestimmt wird. Wie beim Metall (Abschnitt 14.1.5) ist die Austrittsarbeit auch beim Halbleiter als die Differenz zwischen dem elektro-
566 | 14 Fermi-Systeme chemischen Potenzial und dem Vakuum-Niveau bestimmt. Auch diese Grenzflächen sind technisch wichtig, weil jeder Halbleiterkristall in technischen Anwendungen früher oder später mit Metalldrähten kontaktiert werden muss. Diese Kontakte sind oft problematisch, weil an der Grenzfläche für viele Materialkombinationen kein linearer Ohm’scher, sondern ein Kontakt mit einer nicht-linearen I(U )-Charakteristik auftritt. Um diese Schottky-Kontakte genannten Materialkombinationen zu verstehen, betrachten wir die Verhältnisse in Abb.14.36a und b, wo in der linken Spalte die Situation vor und in der rechten Spalte nach der Herstellung des elektrischen Kontakts dargestellt ist. Die obere Reihe zeigt den Fall, dass die Austrittsarbeit des Metalls WA,M kleiner als die des Halbleiter WA,HL ist, wobei wir annehmen wollen, dass der Halbleiter n-dotiert ist. Dann liegt das chemische Potenzial der Elektronen im Metall höher als das des Halbleiters, und wir bekommen einen Elektronentransfer vom Metall zum Halbleiter und eine Anreicherungszone für Elektronen im Halbleiter. Die resultierende elektrische Potenzialdifferenz hebt die Bandstruktur des Halbleiters mit zunehmendem Abstand von der Grenzfläche an, weil das elektrostatische Potenzial der Ladungsträgeranreicherung an der Grenzfläche folgen muss. Fern von der Grenzfläche werden die Bänder wieder flach. Wegen dieses elektrostatischen Potenzialverlaufs schneidet das Leitungsband des Halbleiters das elektrochemische Potenzial, und der resultierende Kontakt verhält sich Ohm’sch. In dem in der unteren Reihe in Abb.14.36c und d dargestellten umgekehrten Fall, dass WA,M > WA,HL ist, fallen Elektronen vom Halbleiter in das Metall und hinterlassen eine positive Raumladungszone, in der die Elektronendichte verarmt. Die Bandstruktur des Halbleiters wird fern von der Grenzfläche abgesenkt und weist nahe der Grenzfläche einen durch die Ladungsträgerverarmung verursachten Anstieg auf. Dieser Anstieg bildet eine Schottky-Barriere für Elektronen die sich der Grenzfläche nähern. Typische Werte für die Schottky-Barriere liegen im Bereich von 0.5 eV–1.5 eV. Die Schottky-Barriere ist der Diffusionsbarriere beim pn-Übergang analog und wird verringert, wenn Elektronen auf der Halbleiterseite injiziert werden. Extraktion von Elektronen auf der Halbleiterseite vergrößert die Schottky-Barriere und den differenziellen Widerstand. Die Dicke der Raumladungszone erhält man aus den Gln. 14.84 im Grenzfall nA nD . Für einen p-dotierten Halbleiter kehren sich die Argumente gerade um. Der Schottky-Kontakt weist damit eine dem pn-Übergang ähnliche Dioden-Charakteristik auf, deren gleichrichtende Eigenschaften in den ersten in der Radiotechnik benutzten Kristall-Detektoren ausgenutzt wurden. Nach diesem einfachen Modell sollte man erwarten, dass sich die Höhe der Schottky-Barriere aus den Austrittsarbeiten und die Lage des chemischen Potenzials relativ zu den Bandkanten des Halbleiters berechnen lässt. Interessanterweise wird dies experimentell nicht bestätigt, sondern es wird beobachtet, dass die Höhe der Schottky-Barriere nur bedingt durch die Volumeneigenschaften von Metall und Halbleiter, sondern in vielen Fällen durch Grenzflächenzustände bestimmt wird. Die Grenzflächenzustände bilden sich durch die Superposition der elektronischen Wellenfunktionen von Metall und Halbleiter bei für die Art der Grenzfläche typischen
14.6 Quasiteilchen in supraleitenden Metallen |
¡
567
¡ WA,ME
¡Vak WA,HL
+ME
WA,HL
¡L ¡D +HL
WA,ME
+ ME, HL
¡V
(a)
Metall
n-Halbleiter
(b)
x
¡ WA,HL
x
WA,ME
¡L
WA,HL
¡D +HL +ME
(c)
Metall
¡V n-Halbleiter x
n-Halbleiter
¡
¡Vak WA,ME
Metall
+ ME, HL
(d)
Metall
n-Halbleiter x
Abb. 14.36. Metall/Halbleiter-Kontakt für Material-Kombinationen, für die das Verhältnis der Austrittsarbeiten WA,ME /WA,HL von Metall und Halbleiter größer als 1 (a und b) oder kleiner als 1 (c und d) ist. Vor der Herstellung eines elektrischen Kontakts sind die chemischen Potenziale μMe und μHL (rot) der Ladungsträger im allgemeinen verschieden (a und c); bei Herstellung des Kontakts findet ein Ladungstransfer statt, der die μMe und μHL zu einem gemeinsamen und räumlich konstanten elektrochemischen Potenzial μ ¯ (rot) angleicht (b und d). Ist WA,ME > WA,HL , so bildet sich ein Ohm’scher Kontakt mit einer Anreicherungzone für Elektronen (blau), während sich für WA,ME < WA,HL ein gleichrichtender Schotty-Kontakt mit einer positiv geladenen Verarmungszone für Elektronen ausbildet.
Energien. Die Zahl dieser Zustände ist oft groß genug, um das chemische Potenzial in diesem Energiebereich festzuhalten. Daher wird dieses Phänomen in der englischsprachigen Literatur als „Fermi-level pinning“ bezeichnet. Solche Oberflächenzustände existieren in Form nicht abgesättigter Bindungen auch an den Oberflächen homogener Halbleiter und können ebenfalls zur Verarmung (GaAs) oder Anreicherung (InAs) von Ladungsträgern in der Oberflächenschicht führen.
14.6 Quasiteilchen in supraleitenden Metallen Auch in der elektronischen Fermi-Flüssigkeit in Metallen kann es, ähnlich wie wie bei den Helium-Flüssigkeiten, zur Ausbildung einer suprafluiden Phase kommen. Historisch wurde dies bereits 1911, also lange vor der Suprafluidität des 4He (1938) und
568 | 14 Fermi-Systeme des 3He (1973), von Kamerlingh-Onnes entdeckt, der in Leiden zuerst ein sprunghaftes (innerhalb von einigen 10 mK) Verschwinden des elektrischen Widerstands von Quecksilber unterhalb einer kritischen Temperatur Tc 4.2 K beobachtete. Als nächstes wurden Anomalien in der Wärmekapazität gefunden (1921). Es dauerte bis 1933, bis Meissner und Ochsenfeld bewiesen, dass es sich bei der Supraleitung nicht um ein reines Transportphänomen, sondern auch um einen neuen thermodynamischen Zustand handelt und bei Tc ein echter Phasenübergang im Sinne der Thermodynamik auftritt. Wie bei den Helium-Flüssigkeiten ist der verlustfreie Ladungstransport eine Eigenschaft des Grundzustands. Die thermischen Eigenschaften wie die Wärmekapazität und die Wärmeleitfähigkeit werden dagegen durch die Anregungen des Grundzustands, die Quasiteilchen, bestimmt. Da Elektronen Fermionen sind, war lange unklar, ob die suprafluide Phase mit einem Bose-Einstein-Kondensat vergleichbar ist. Die mikroskopische Theorie der Supraleitung von Bardeen, Cooper und Schrieffer (BCS) basiert auf der Idee, dass die Elektronen an der Fermi-Kante einen gebundenen Zustand bilden, der aus Paaren von Elektronen – den Cooper-Paaren – aufgebaut ist. Die Teilchen-artigen Anregungen des BCS-Grundzustandes sind keine Elektronen, sondern Superpositionen von Elektronen (ε > εF ) und Löchern (ε < εF ). Im Gegensatz zur Fermi-Flüssigkeit sind keine Anregungen mit beliebig kleiner Energie möglich, sondern es bildet sich eine Energie-Lücke zwischen dem Grundzustand und den Anregungen aus. Diese bewirkt, dass die thermischen Anregungen für T < Tc sehr schnell (exponentiell) aussterben.
14.6.1 Supraleitende Phänomene Die hervorstechende Eigenschaft der suprafluiden Phase ist, wie bereits erwähnt, das Verschwinden des elektrischen Widerstandes. Eine übliche Widerstandsmessung kann dieses Verschwinden bis zu einem Niveau von etwa 10−4 –10−5 RN nachweisen, wobei RN der elektrische Widerstand in der normalfluiden Phase, der FermiFlüssigkeit, ist. Wesentlich höhere Empfindlichkeiten sind mit Dauerstrom-Experimenten möglich, bei denen ein elektrischer Strom in einem supraleitenden Ring durch magnetische Induktion erzeugt und dann magnetisch nachgewiesen wird. In der Normalphase wird nach den Maxwell’schen Gleichungen ebenfalls ein Induktionsstrom angeworfen, der im Laufe der Zeit t aber gemäß
I(t) = I0 exp −
R t L
ausstirbt, wobei I0 der zum Zeitpunkt t = 0 angeworfene Strom, R der elektrische Widerstand und L die Induktivität des Rings sind. In solchen Experimenten konnte nachgewiesen werden, dass der Widerstand eines solchen Ringes unterhalb der Sprungtemperatur um mindestens 14 Größenordnungen abfällt [44]. Damit ist das Verhältnis der Widerstände eines normalen Metalls und eines Supraleiters ebenso groß wie das des besten Isolators und des besten Leiters bei Zimmertemperatur.
569
14.6 Quasiteilchen in supraleitenden Metallen |
a)
b)
Bc Bc(0)
80
Pb
60
normalleitend Bc (mT)
supraleitend Weg B
40
Hg
20
Sn Al
Weg A 0 Tc
T
Cd 0
2
4 T (K)
6
8
Abb. 14.37. a) Schematisches Phasendiagramm eines Supraleiters 1. Art im externen Magnetfeld. Die in Abb. 14.38 beschriebenen Prozesse A (rot und durchgezogen) und B (rot und gestrichelt) sind eingezeichnet. b) Gemessene kritische Felder einiger Supraleiter. Die Linien sind Anpassungen nach Gl. 14.87 (nach [32]).
Aufgrund dieser Stabilität des Suprastroms sind geschlossene supraleitende elektrische Schaltkreise mit Kapazitäten und Induktivitäten makroskopische thermodynamische Objekte im engeren Sinn, die heute ein eigenes Forschungsfeld darstellen. Insbesondere wird der von einem supraleitenden Stromkreis eingeschlossene magnetische Fluss Φ eine Erhaltungsgröße, da ein idealer Leiter den bei Herstellung des Ringschlusses vorliegenden magnetischen Fluss auch bei Änderungen des von außen angelegten Magnetfeldes konstant hält, weil diese durch die bei der Flussänderung angeworfenen Induktionsströme exakt kompensiert werden (Aufgabe 14.12). Fünfzig Jahre nach Entdeckung der Supraleiter wurde gezeigt, dass der in einem supraleitenden Ring eingeschlossene Fluss nicht nur erhalten, sondern in Einheiten des Flussquantums Φ = n · Φ0 ,
Φ0 =
h , 2e
nN
ganzzahlig quantisiert ist ([45] sowie [46]). Ein äußeres Magnetfeld Bext zerstört den supraleitenden Zustand – bei einem kritischen Magnetfeld Bc (T ) wird der normale Zustand mit R = RN wiederhergestellt. Empirisch zeigt sich, dass Bc (T ) für viele Metalle durch die Gleichung
Bc (T ) = Bc (0) · 1 − T /Tc
2
(14.87)
beschrieben wird, wobei Bc (0) das kritische Magnetfeld bei T = 0 ist. Abbildung 14.37 zeigt eine schematische Darstellung des Phasendiagramms (a) und Messdaten für einigen Supraleiter (b).
570 | 14 Fermi-Systeme
T >Tc
T >Tc
b)
T >Tc
T >Tc
Supraleiter
Idealer Leiter
a)
Bext = 0
Bext 0 Bext = 0
Bext = 0
Bext 0
Bext = 0
Abb. 14.38. Idealer Leiter und Supraleiter im Vergleich: a) Zunächst Abkühlung unter die Sprungtemperatur im Nullfeld, dann wird das Magnetfeld erst hoch und dann wieder heruntergefahren (Weg A). Ins Innere beider Proben dringt die ganze Zeit kein Magnetfeld ein. b) Das Magnetfeld wird zuerst hochgefahren und dann erst unter die Sprungtemperatur abgekühlt. Das Feld wird vom Supraleiter, nicht aber vom idealen Leiter verdrängt. Wird dann das Magnetfeld wieder heruntergefahren, so wirft der ideale Leiter Induktionströme ab, während das Innere des Supraleiters nach wie vor feldfrei bleibt (Weg B). Die Endzustände sind in beiden Fällen verschieden (nach [21]).
Eine zweite wichtige Eigenschaft eines Supraleiters 1. Art wird durch den Meissner-Ochsenfeld-Effekt demonstriert.34 In diesem in Abb.14.38 skizzierten Experiment werden ein Zustand in der Normal-Phase ({Bext = 0, T > Tc }) und ein Zustand in der supraleitenden Phase ({0 < Bext = B0 < Bc , T = T0 < Tc }) auf zwei verschiedenen Wegen in der T, Bext -Ebene angestrebt (Abb. 14.37a): Für Weg A wird zunächst im Nullfeld auf T0 < Tc abgekühlt und dann das externe Magnetfeld bei T = T0 auf den Wert B0 hochgefahren. Für Weg B dagegen wird bei T > Tc zuerst das externe Magnetfeld auf den Wert B0 gefahren und erst nach dem Abklingen des dabei auftretenden Induktionsstroms bei konstantem Magnetfeld auf T = T0 < Tc abgekühlt. Wäre der Supraleiter allein durch die Eigenschaft R = 0 (idealer Leiter) charakterisiert, würde man für beide Wege unterschiedliche Werte des magnetischen Moments der Probe erwarten: Für Weg A erwartet man den Wert m = −V B0 /μ0 , wie er aus der Kompensation des externen Magnetfeldes durch den diamagnetischen Induktionsstrom folgt; für Weg B dagegen erwartet man m = 0, weil der Abschirmstrom in der normalleitenden Phase sehr schnell auf Null abklingt und bei der anschließenden Abkühlung im konstanten Magnetfeld keine Induktionseffekte auftreten.
34 Aus dieser Nomenklatur lässt sich schließen, dass es auch Supraleiter 2. Art gibt, die sich anders verhalten. Der wesentliche Unterschied zu den Supraleitern 1. Art besteht darin, dass der magnetische Fluss in Supraleitern 2. Art in Form von quantisierten Wirbeln eindringen kann. Für die Details müssen wir jedoch auf die weiterführende Literatur verweisen.
14.6 Quasiteilchen in supraleitenden Metallen |
571
Bei Eintritt in die supraleitende Phase wirft der Supraleiter in einer dünnen Oberflächenschicht Abschirmströme an, welche das externe Magnetfeld exakt zu Null kompensieren! In diesem Sinne bildet der Supraleiter einen idealen Diamagneten, weil das induzierte magnetische Moment des Supraleiters dem externen Magnetfeld entgegen gerichtet ist und den maximalen mit der thermodynamischen Stabilität der Gesamtsystems (Supraleiter + externes Magnetfeld) verträglichen Betrag annimmt. Man sagt auch, dass der Supraleiter das von außen angelegte Magnetfeld unabhängig von der Prozessführung aus seinem Inneren verdrängt.
14.6.2 Thermodynamische Eigenschaften Das Experiment von Meissner und Ochsenfeld zeigte, dass das magnetische Moment in beiden Fällen den Wert m = −V B0 /μ0 annimmt. Dies beweist, dass die Supraleitung kein rein kinetisches Phänomen (R = 0) ist, sondern der Supraleiter einen Gleichgewichts-Zustand im Sinne der Thermodynamik repräsentiert: Unabhängig von dem gewählten Weg in der Bext , T -Ebene produziert eine dünne zylinderförmige Probe35 in einem zur Zylinderachse parallelen Magnetfeld B ext = (0, 0, Bext ) für einen gegebenen Zustand B0 < Bc , T0 < Tc stets denselben Wert des magnetischen Moments
mz (T, V, Bext , N ) =
⎧ ⎨− V Bext
für |Bext | < Bc (T )
⎩0
für |Bext | > Bc (T )
μ0
Bc (T ) Auf dieser Basis wollen wir jetzt die Massieu-Gibbs-Funktionen des Supraleiters ermitteln. Dazu betrachten wir zunächst die freie Energie im Magnetfeld mit dem Differenzial dF = −S dT − p dV − mz dBext + μ dN ,
35 Für diese Probenform sind die in Anhang F beschriebenen Entmagnetisierungseffekte vernachlässigbar, die zu einem von der Geometrie der Probe abhängigen Korrektur-Faktor, dem Entmagnetisierungsfaktor, führen.
572 | 14 Fermi-Systeme wobei wir p = 0 und N als konstant annehmen. Integration bezüglich Bext liefert Bext
dB
Fs (T, V, Bext , N ) = F (T, V, Bext = 0, N ) +
V B μ0
0
= Fs (T, V, Bext = 0, N ) +
2 V Bext . 2μ0
(14.90)
Das Verdrängen des Magnetfeldes kostet freie Energie und wird den Suprazustand früher oder später thermodynamisch ungünstiger als den Normalzustand machen. Der Übergangspunkt, das heißt das kritische Magnetfeld Bext = BC (T ), ist durch die Bedingung Fs = Fn für das Phasengleichgewicht gegeben. Wenn wir die Magnetfeldabhängigkeit der freien Energie im Normalzustand wegen der kleinen magnetischen Suszeptibilität χn vernachlässigen, sehen wir, dass Fs (T, V, BC , N ) = Fn (T, V, BC , N ) = Fn (T, V, 0, N ) ,
und wir bekommen für die Differenz der freien Energien der supraleitenden und der normalen Phase: ΔF = Fs (T, V, 0, N ) − Fn (T, V, 0, N ) = −
V Bc2 (T ) . 2μ0
(14.91)
Der Verlauf von FS und FN ist in Abb. 14.39a dargestellt. Den Gewinn ΔF an freier Energie durch die Ausbildung des supraleitenden Zustands nennt man auch die Kondensationsenergie. Die freie Energie im Normalzustand Fn (T, V, 0, N ) ist durch unsere Ergebnisse in den Abschnitten 14.1.3 und 14.2.3 gegeben. Damit lautet unser Endergebnis: Fs (T, V, Bext , N ) = E − T S − mz Bext
=V
e0 (n) −
+ B 2 − Bc2 (T ) π2 * g εF (n) (kB T )2 + ext 6 2μ0
(14.92)
,
wobei e0 (n) die Energiedichte des entarteten Fermi-Gases bei T = 0 ist. Durch Ableiten von Gl. 14.92 nach der Temperatur erhalten wir die Entropiedichte: 1 ∂Fs (T, V, Bext , N ) V ∂T + 2 Bc (T ) ∂Bc (T ) π2 * = < sn (T, n) . g εF (n) kB T + 3 μ0 ∂T
ss (T, Bext , n) = −
(14.93)
Bc ).
14.6.3 BCS-Theorie und Bogoliubov-Quasiteilchen Das Ziel dieses Abschnitts ist es, die beobachteten thermodynamischen Eigenschaften des supraleitenden Zustands auf das Spektrum der im Supraleiter vorhandenen Quasiteilchen zurückzuführen.36 Ausgangspunkt ist die Hypothese von Bardeen, Cooper und Schrieffer (BCS), dass der supraleitende Zustand durch eine Korrelation zwischen Paaren {k, ↑ | − k, ↓} von elementaren Fermi-Systemen, den Cooper-Paaren, gekennzeichnet ist. Der Grundzustand des Supraleiters hat dann die Form 2 |ψBCS = uk + vk a†k,↑ a†−k,↓ |vac , (14.95) k
wobei |vac der Vakuum-Zustand ist. Dabei sind uk und vk komplexe Koeffizienten, die der Normierungsbedingung |u|2 + |v|2 = 1 (14.96) genügen. Ohne Beschränkung der Allgemeinheit kann uk reell und vk = |vk | · exp iϕ komplex gewählt werden. Das Besondere an diesem Ansatz ist, dass die Phasendifferenz zwischen den komplexen Koeffizienten uk und vk allen Paaren von elementaren Fermi-Systemen gemeinsam ist. Damit wird diese Phasendifferenz zu einer neuen makroskopischen thermodynamischen Größe des Supraleiters.
36 Wir beschränken uns auf eine Skizze der prinzipiellen Überlegungen – für die Details der Herleitungen verweisen wir auf die weiterführende Literatur, zum Beispiel das Buch von Tinkham [47].
14.6 Quasiteilchen in supraleitenden Metallen |
575
Der Fermi-See ist eine Teilmenge dieser Zustände für uk = 0,
vk = 1
für |k| ≤ kF
und
uk = 1,
vk = 0
für |k| > kF .
In dieser Untermenge der BCS-Zustände bestehen keine37 makroskopischen Phasenkorrelationen zwischen den elementaren Fermi-Systemen mit {k, ↑ | − k, ↓}. Makroskopische Phasenkorrelationen können wegen Gl. 14.96 nur auftreten, wenn vk = 0 und = 1 ist, das heißt die Erwartungswerte Fk := Ψ|a−k↑ al↓ |Ψ = u∗k vk
(14.97)
von Null verschiedene Werte annehmen. Der BCS-Grundzustand ist eine Superposition von Cooper-Paaren und dem Vakuumzustand. In dieser Superposition sind die Paare {k, −k} von Zuständen nur mit der Wahrscheinlichkeit |vk |2 mit einem CooperPaar besetzt und mit der Wahrscheinlichkeit |uk |2 leer. Das bedeutet, dass die Elektronenzahl im Supraleiter bereits bei T = 0 unscharf ist – eine Tatsache, die zu intensiven Diskussionen Anlass gegeben hat. In diesem Buch haben wir einer großkanonischen Beschreibung der Systeme mit nicht-unterscheidbaren Teilchen von vornherein den Vorzug gegeben, sodass wir bereits mit der Idee vertraut sind, dass der Mittelwert der Teilchenzahl des Quasiteilchen-Systems durch die Temperatur und das chemische Potenzial vorgegeben (und keine Systemkonstanten) sind. Für einen isolierten Supraleiter spielt die makroskopische Phase ϕ keine Rolle. Diese kommt erst zum Tragen, wenn der Supraleiter von Strom durchflossen wird oder zwei Supraleiter schwach gekoppelt werden. Im ersten Fall tritt ein Phasengradient entlang des Supraleiters auf, im zweiten Fall eine von der Stromstärke abhängige Phasendifferenz. Die dabei auftretenden Effekte, die Josephson-Effekte, sind von fundamentaler Bedeutung für die Dynamik des suprafluiden Kondensats, sie sprengen aber leider den Rahmen dieses Buches. Im Folgenden werden wir uns daher auf die stromlosen Zustände des Supraleiters beschränken und nicht nur uk , sondern auch vk als reell annehmen. Zur Beschreibung unseres Systems gehen wir jetzt von dem großkanonischen Hamilton-Operator H − μN =
k,σ
ξ(k)a†k,σ ak,σ +
1 U a† a† a a 2 kk k,σ −k,−σ k ,σ −k ,−σ
(14.98)
kk ,σσ
aus, der eine attraktive Wechselwirkung Uk,k < 0 zwischen den Elektronen enthält und so über Gl. 12.2 hinausgeht. Die Eigenwerte diese Operators (und nicht die von H allein) gehen in die großkanonische Verteilung in Gl. 12.7 ein.
37 In normalen Fermi-Systemen mit statischen Streuzentren können ebenfalls Phasenkorrelationen, das heißt Quanten-Interferenzphänomene, auftreten. Diese als schwache und starke Lokalisierung bezeichneten Phänomene sind aber umso schwächer, je höher der Leitfähigkeit des Materials ist.
576 | 14 Fermi-Systeme Zur Diagonalisierung des großkanonischen Hamilton-Operators in Gl. 14.98 werden wir neue Teilchen derart einführen, dass der Hamilton-Operator des Systems wieder die vertraute Gestalt von Gl. 12.2 annimmt. Dabei sind die ξ(k) =
(k)2 − μ vF (|k| − kF ) 2m ˆ
(14.99)
die Energien der elementaren Fermi-System für Uk,k ≡ 0. Da es sich bei der Supraleitung um ein Tieftemperatur-Phänomen handelt, ist es hinreichend, eine lineariserte Form der Dispersionsrelation des nicht-wechselwirkenden System zu benutzen. Zur Diagonalisierung dieses Hamilton-Operators gehen wir ganz ähnlich wie in Abschnitt 10.7 vor und definieren in Analogie zu Gl.10.45 ein Molekularfeld Δ := −U ak,↑ a−k,↓ = −U Fk , (14.100) k k Fk = u∗k vk
welches den Effekt der Wechselwirkungen eines elementaren Fermi-Systems mit dem Wellenvektor k mit den übrigen beschreibt.38 Die Größe Δ heißt das Paarpotenzial; sie muss von der Paaramplitude Fk strikt unterschieden werden. Das Paarpotenzial ersetzt zwei der Leiteroperatoren in dem Wechselwirkungterm in Gl. 14.98 durch deren Mittelwert und resultiert in einem vereinfachten Hamilton-Operator der Form HMF − μN =
ξ(k)a†k,σ ak,σ
k,σ
−
, 1 Δ∗ ak,↑ a−k,↓ + Δa†k,↑ a†−k,↓ − Δ∗ Fk . 2
(14.101)
k
Gleichung 14.100 stellt analog zu Gl.10.48 eine Selbstkonsistenz-Relation dar, weil der Wert von Δ in die Berechnung der Mittelwerte Fk eingeht. Der Effekt des Paarpotenzial besteht darin, Teilchen und Löcher zu mischen! Damit ist gemeint, dass der HamiltonOperator in Gl. 14.98 durch eine Bogoliubov-Transformation auf die Form HMF − μN = E0 + ε(k)b†k,α bk,α (14.102) k,σ
gebracht werden kann. Die Bogoliubov-Transformation führt über die Beziehungen bk0 = uk ak↑ − vk a†−k↓
und
bk1 = uk a−k↓ + vk a†k↑
(14.103)
auf neue elementare Fermi-Systeme, deren Anregungszustände Bogoliubov-Quasiteilchen heißen. Die Operatoren bk0 und bk1 sollen die Vertauschungsrelationen für
38 Wir nehmen ab hier der Einfachheit halber an, dass das Wechselwirkungsmatrixelement Uk,k = −U als konstant angesehen werden kann.
14.6 Quasiteilchen in supraleitenden Metallen |
a)
577
b) 1
4
¡ (k) /6 °j(k)°/ 6
°uk°
0.5
2
°vk°
2
2
6 0
-4
-2
0 (k) /6
2
0
4
-4
-2
0
2
4
6
(k) /6
Abb. 14.41. a) Dispersionsrelationen εk der Bogoliubov-Quasiteilchen und ξ(k) = vF (k − kF ) der Elektronen in einem Supraleiter. Im Supraleiter existieren keine Quasiteilchen mit Energien ε(k) < Δ. b) Die Wahrscheinlichkeitsamplituden uk und vk für Elektronen und Löcher in einem Supraleiter.
Fermi-Operatoren erfüllen; dies führt auf die Normierungsbedingung 14.96. Bei diesen Teilchen handelt es sich um kohärente Superpositionen aus Elektronen und Löchern. Das heißt, jedes ursprüngliche (elektronische) elementare Fermi-System mit dem Wellenvektor und Spin {k, σ} ist stets korreliert mit einem anderen elektronischen elementaren Fermi-System mit dem anti-parallelen Wellenvektor {−k, −σ}, sodass beide gemeinsam für jedes k ein Paar neuer Systeme von Bogoliubov-Quasiteilchen definieren. Eine Besonderheit der Bogoliubov-Quasiteilchen ist die Tatsache, dass ihre spezifische Ladung qˆk = |uk |2 − |vk |2 e
wegen der Superposition von Elektron- und Loch-Komponenten keine Systemkonstante ist, sondern von dessen Impuls k abhängt und kontinuierliche Werte im Intervall qˆ[−e, e] annehmen kann. Dies hat zur Folge, dass die Injektion von Elektronen aus einem Normalmetall in einen Supraleiter einen speziellen Nichtgleichgewichtszustand, das Ladungs-Ungleichgewicht, hervorruft (siehe [47] für weitere Details). Setzen wir die Umkehrung der Bogoliubov-Transformation ak↑ = u∗k bk0 + vk b†k1
und a−k↓ = −vk∗ b†k0 + uk b†k1
(14.104)
in Gl. 14.101 ein, so erhalten wir aus der Forderung, dass der Hamilton-Operator im Molekularfeld-Näherung die diagonale Form Gl. 14.102 annehmen soll, Bestimmungsgleichungen für die Koeffizienten uk und vk : ? ?
uk =
1 2
1+
ξ(k) ε(k)
und
vk =
1 2
1−
ξ(k) ε(k)
sowie die Dispersionsrelation der Bogoliubov-Quasiteilchen:
,
(14.105)
578 | 14 Fermi-Systeme
ε(k) =
ξ 2 (k) + Δ2
(14.106)
Die Cooper-Paarung zerstört also die scharfe Fermi-Fläche – ein Charakteristikum des zu Anfang dieses Kapitels behandelten idealen Fermi-Gases. Auf diese Weise erhalten wir für die Paaramplitude den Wert Fk = Δ0 /[2ε(k)] bei T = 0, wobei Δ0 = Δ(T = 0) ist. Setzen wir dies in die Selbstkonsistenz-Relation Gl. 14.100 ein, so finden wir die Beziehung εc g(εF )U U 1 dξ 1= = 2 arsinh(εc /Δ0 ) , = 2
k
ε(k)
2
∞
ξ 2 + Δ20
wobei die Energie εc das sonst divergente Integral endlich macht. Physikalisch bedeutet dies ein Abschneiden des Energiebereichs, in dem die attraktive Wechselwirkung Vkk wirksam ist. Da die Anziehung zwischen den Elektronen durch den Austausch virtueller Phononen vermittelt wird, liegt es nahe, εc mit einer typischen PhononenEnergie wie ωD (Abschnitt 13.2.1) zu identifizieren.39 Damit erhalten wir für die Energielücke bei T = 0
1 ω D 2ω exp − . (14.107) Δ0 = g(εF )U
sinh 1/[g(εF )U ]
Dieses Ergebnis hängt nicht-analytisch von der Wechselwirkungskonstante U ab und erklärt, warum alle Bemühungen, das Problem der Supraleitung störungstheoretisch zu behandeln, gescheitert sind. Der endliche Energiebereich, in dem die Paaramplitude von Null verschieden ist, definiert neben der magnetischen Eindringtiefe λL (Aufgabe 14.12) eine weitere charakteristische Länge, die supraleitende Kohärenzlänge: vF ξ0 = , (14.108) πΔ0
die so etwas wie die räumliche Ausdehnung eines Cooper-Paars widerspiegelt. Da in der Regel ξ0 λF , überlappen die Cooper-Paare räumlich sehr stark. Dies ist der Grund, warum die Molekularfeld-Theorie zumindest bei den klassischen Supraleitern40 auch quantitativ sehr gute Übereinstimmung mit dem Experiment liefert. Nachdem wir jetzt Δ0 kennen, können wir die in Gl. 14.102 Energie des BCSGrundzustands berechnen und erhalten . / Δ20 1 1 1 E0 = = EN − g(εF )Δ20 , (14.109) − 2
k,σ
2ε(k)
ξ(k) + ε(k)
2
39 Experimentell wird dieser Zusammenhang durch die Beobachtung des Isotopen-Effekts, das heißt einer Variation der Übergangstemperatur mit dem Atomgewicht (ωD ∝ m ˆ −1/2 ) verschiedener Isotope desselben supraleitenden Elements, bestätigt. 40 Bei den in den 1980er Jahren entdeckten Kuprat-Supraleitern ist dies anders, obwohl die Idee der Cooper-Paare auch hier tragfähig zu sein scheint.
14.6 Quasiteilchen in supraleitenden Metallen |
579
wobei EN die Grundzustandsenergie der Fermi-Kugel ist (Gl. 14.10). Damit können wir die in Gl. 14.91 auftretende Kondensationsenergie des supraleitenden Zustands mit den mikroskopischen Größen des Elektronensystems in Verbindung bringen. Damit haben wir auch eine Verbindung mit dem kritischen Magnetfeld Bc (T = 0) aus dem vorangegangenen Abschnitt. Eine Verallgemeinerung der BCS-Theorie auf endliche Temperaturen ist nicht schwierig, weil es uns gelungen ist, die Anregungszustände des Supraleiters als elementare Fermi-Systeme mit bekannter Dispersionsrelation darzustellen. Dazu benötigen wir die Temperaturabhängigkeit der Energielücke Δ(T ). Zunächst berechnen wir die Paaramplituden, indem wir den Operator ak↑ a−k↓ durch die Leiteroperatoren für die Bogoliubov-Quasiteilchen ausdrücken: Fk = ak↑ a−k↓ = uk vk∗ b†k0 bk0 − b†−k1 b−k1
=−
Δ 2ε(k)
Nk − (1 − Nk )
1 − 2Nk = −
Δ tanh 2ε(k)
ε(k) 2kB T
(14.110)
.
Durch Multiplikation mit −U/Δ und Summation über alle k erhalten wir wegen Gl. 14.100 für die Selbstkonsistenzgleichung
1=
|ε(k) αc energetisch günstig wird. Dieses Phänomen wird die Stoner-Instabilität genannt. d) Erklären und skizzieren Sie qualitativ das Verhalten der spontanen Magnetisierung als Funktion von α. e) Geben Sie den Zusammenhang zwischen αc und dem Fermi-Flüssigkeitsparameter G0 an (Abschnitt 14.3.1).
14.6 Quasiteilchen in supraleitenden Metallen |
583
14.4. Kenngrößen von 3 He a) Berechnen Sie die im Modell unabhängiger Teilchen erwartete FermiTemperatur von 3 He bei einem Molvolumen von vˆ = 36.8 cm3 /mol und vergleichen Sie die daraus resultierende Sommerfeld-Konstante γ mit dem gemessenen Wert von γ = kB · 2.78 K−1 . Wie groß ist die effektive Masse m ˆ 3 bei diesem Molvolumen? b) Wie groß ist die Fermi-Temperatur in verdünntem (6.5% 3 He in 4 He), wenn (4) m ˆ 3 = 2.4 m ˆ ◦3 ist? c) Die gemessenen Viskositäten von 3 He bei 1 K und 5 mK betragen 2.5 μPa·s und 7 mPa·s. Berechnen Sie die daraus folgende mittelere freie Weglänge für die Quasiteilchen. Vergleichen Sie mit der Viskosität von H2 O at 293 K (∼ 1 mPa·S) und Kaffesahne (∼ 10 mPa·S). 14.5. Relativistische Fermionen a) Berechnen Sie die das chemische Potenzial und die Kompressibilität eines relativistischen Fermi-Gases. b) Die Energiedichte e(T ) = a T 4 von thermischen Neutrinos ist bis auf den Vorfaktor a mit der des Photonengases identisch. Berechnen Sie a mit Hilfe der Fermi-Integrale aus Anhang C.
14.6. Weiße Zwerge Ein weißer Zwerg (beispielsweise der kleine Partner des Sirius-Doppelgestirns) ist ein Stern, in dem die Wasserstoff-Fusion zum Erliegen gekommen ist, nachdem der anfänglich vorhandene Wasserstoff weitgehend zu Helium verbrannt wurde. Ohne laufende Kernfusion im Inneren des Sterns kontrahiert sich dieser isentrop, und seine Temperatur steigt an, bis der Fermi-Druck der Elektronen den Gravitationsdruck kompensiert. Bleibt die Endtemperatur dabei unterhalb der Schwelle, die für Helium-Fusion erforderlich ist, so bildet der Stern ein zweikomponentiges Plasma aus einem entarteten Elektronengas und einem in der Regel nicht entarteten Gas aus Atomkernen, das elektrisch weitgehend neutral ist und das durch die Gravitation der Atomkerne zusammengehalten wird. In dieser Aufgabe wollen wir eine Relation zwischen der Masse und dem Radius weißer Zwerge ableiten, wobei wir die Dichte als räumlich homogen annehmen (nach [6]). a) Benutzen Sie eine Dimensionsanalyse (Aufgabe 6.3), um zu zeigen, dass die in einer homogenen gravitierenden Kugel mit der Masse M und dem Radius R gespeicherte Gravitationsenergie den Wert Epot = −const.
γG M 2 R
haben muss (in Aufgabe 6.3 haben wir auch den Vorfaktor bestimmt). Erklären Sie das Minuszeichen!
584 | 14 Fermi-Systeme
b) Nehmen Sie an, dass der Stern für jedes Elektron ein Proton und ein Neutron enthält und dass für die Fermi-Geschwindigkeit der Elektronen gilt: vF c (nicht-relativistischer Grenzfall). Zeigen Sie, dass die kinetische Energie der Elektronen 2 M 5/3 Ekin = 0.0086 ·
c)
d) e)
f)
g)
5/3
m ˆ em ˆ p R2
beträgt (der Vorfaktor ist leicht zu berechnen, aber nicht sehr instruktiv). Bestimmen Sie den Gleichgewichtsradius RG der Sterns durch Minimierung der Gesamtenergie E(M, R) = Ekin +Epot bezüglich R (analog zu Aufgabe 8.7). Skizzieren Sie die Gesamtenergie als Funktion von R. Nimmt der Radius mit der Masse zu oder ab? Ist das Ergebnis physikalisch sinnvoll? Berechnen Sie RG für die Masse der Sonne M = 2 · 1030 kg. Bestimmen Sie auch die zugehörige Massendichte m und vergleichen Sie mit der von Wasser. Wie groß sind die Elektronendichte nel und die daraus folgenden Werte für die Fermi-Energie und die Fermi-Temperatur? Vergleichen Sie mit T = 1 · 107 K, einer typischen Temperatur im Inneren weißer Zwerge. Ist die Annahme T TF gerechtfertigt? Nehmen Sie nun an, dass die Fermi-Temperatur so hoch ist, dass vF c. Benutzen Sie das Resultat von Aufgabe 14.5, um zu zeigen, dass in diesem Fall Ekin ∝ 1/R anstatt ∝ 1/R2 ist. Gibt es unter diesen Bedingungen einen stabilen Gleichgewichtsradius? Der Übergang zum relativistischen Regime wird erwartet, sobald μ ≈ εF m ˆ el c2 . In welchem Bereich ist die Sonne? Oberhalb welcher Gesamtmasse Mc,el ist der weiße Zwerg instabil? Was geschieht in diesem Fall?
14.7. Neutronensterne Ein Stern, der zu schwer ist, um einen weißen Zwerg zu bilden, kollabiert weiter, indem Elektronen und Protonen zu Neutronen rekombinieren. Ein solches Gebilde nennt man einen Neutronenstern. In diesem Fall ist es der Fermi-Druck der Neutronen, der den Stern gegen den gravitativen Kollaps stabilisiert. a) Benutzen Sie die Resultate aus Aufgabe 14.6, um die Radius-Masse-Relation RG (M ), die Neutronendichte nn , die Fermi-Temperatur TF (nn ) sowie die kritische Masse Mc,n für den gravitativen Kollaps eines Neutronensterns zu berechnen. Was ist das Schicksal von Sternen mit einer Masse M > Mc,n ? b) Die Bindungsenergie des Neutrons beträgt eˆB = (m ˆn −m ˆ p )c2 0.77 MeV. Stellen Sie die Bedingung chemischen Gleichgewichts (Gl. 7.24) für die Reaktion e− + p + n
auf. Nehmen Sie dabei wieder T TF an. Wie groß ist die Elektronendichte im chemischen Gleichgewicht, und wie hängt sie von der Gesamtmasse ab? 14.8. Pomeranchuk-Kühlung
14.6 Quasiteilchen in supraleitenden Metallen |
585
Die Wärmekapazität von flüssigem 3 He kann für T 1 K durch den folgenden Ausdruck angenähert werden: 0 γ T, for T < Tx cˆv,f l (T ) = (14.117) c0 + γ T, for T > Tx , wobei γ = 16.8 J/mol·K2 , γ = 1.66 J/mol·K2 , und cˆ0 = 2.5 J/mol·K. a) Bestimmen Sie zunächst die Temperatur Tx der Schnittstelle zwischen der Tieftemperatur- und der ’Hoch’temperatur-Näherung. b) Berechnen und skizzieren Sie mit Hilfe eines Plot-Programms die Differenz Δˆ s(T ) zwischen den molaren Entropien von flüssigem und festem 3 He. c) Benutzen Sie die Resultate in (b), um die Temperatur Tm am Minimum der Schmelzdruck-Kurve zu bestimmen. Berechnen Sie die Schmelzkurve pS (T ) durch numerische Integration der Clausius-Clapeyron-Gleichung, mit pS (0) = 33 bar als Anfangswert. Die Differenz der Molvolumina der festen und flüssigen Phase beträgt Δˆ v ≈ 1.27 cm3 /mol und variiert entlang der Schmelzkurve nur um etwa 5%, was vernachlässigt werden kann. d) Vernachlässigen Sie Wechselwirkungseffekte zwischen den Kernspins um die Kühlleistung einer Pomeranchuk-Zelle bei 3 mK abzuschätzen, wenn die Verfestigungsrate 1 mol/h beträgt? 14.9. Mischkryostat Berechnen Sie die Kühlleistung eines Mischkryostaten bei einer Mischungstemperatur TM = 10 mK bei einer Zirkulationsrate von 30 μmol/s, wenn die Temperatur TW des letzten Wärmetauschers 20 mK beträgt und alle anderen Beiträge zum Wärmeleck vernachlässigbar sind. Hinweis: Benutzen Sie die Resultate von Aufgabe 14.4.
14.10. Wärmeleitung in Metallen bei tiefen Temperaturen In Metallen bestimmt in der Regel der elektronische Beitrag die thermische Leitfähigkeit. a) Leiten Sie die stationäre Wärmeleitungsgleichung für einen quasieindimensionalen Metalldraht ab, dessen Wärmeleitfähigkeit nach dem Wiedemann-Franz’schen Gesetz proportional zu T ist. b) Formen Sie dieses Ergebnis in eine Differenzialgleichung für T 2 (x) um und lösen Sie diese. c) Berechnen Sie die Temperaturdifferenz, die sich einstellt, wenn ein 10 cm langer, und 1 mm dicker zylindrischer Kupferdraht (Stahldraht) mit einer Heizleistung von 1 mW belastet wird und dabei an einem Ende bei einer Temperatur von 1 K thermisch verankert ist. Die elektrische Leitfähigkeit bei 10 K betrage σ = 3 · 1011 (Ωm)-1 für Kupfer und 1.4 · 106 (Ωm)-1 für Stahl.
586 | 14 Fermi-Systeme
14.11. Thermodynamische Größen im supraleitenden Zustand Gleichung 14.87 Bc (T ) = Bc (0) 1 − (T /Tc )2
stellt in vielen Fällen eine recht gute Näherung für das kritische Magnetfeld eines Supraleiters dar. Berechnen Sie daraus die Entropie S(T ) und die Wärmekapazität C(T ) des Supraleiters. Gilt das Resultat auch bei T Tc ? Begründen Sie Ihre Antwort! 14.12. Erhaltung des magnetischen Flusses in ideal leitfähigen Ringen Aus dem Verschwinden des elektrischen Widerstands in einem idealen Leiter können wir schließen, dass elektrische Felder entlang des Strompfades für eine stationäre Stromverteilung stets verschwinden müssen. Temporäre, beispielsweise durch magnetische Induktion hervorgerufene elektrische Felder E führen daher immer zu einer Beschleunigung des Systems der Ladungsträger, die nach der Bewegungsgleichung qˆns ˙ qˆ2 ns ∂j = qˆns v˙ = p ˆ= ·E , ∂t m ˆ m ˆ
(14.118)
ˆ die spezifischen Größen (pro Teilˆ und p wobei n die Ladungsträgerdichte und qˆ, m chen) des Systems sind. Diese Gleichung wird auch die 1. London-Gleichung genannt. a) Zeigen Sie mit Hilfe der 1. London-Gleichung und der Maxwell-Gleichung ˙ , dass rot E = −B . / ns qˆ2 ∂ (14.119) B =0. rot j + ∂t
m ˆ
b) Zeigen Sie mit Hilfe des obigen Ergebnisses und der Maxwell-Gleichung ˙ im Inneren eines idealen rot B = μ0 j , dass magnetische Feld-Änderungen B Leiters auf der Skala der magnetischen Eindringtiefe λL =
m ˆ μ0 ns qˆ2
(14.120)
exponentiell abklingen. Leiten Sie dazu eine Differenzialgleichung für den Feldverlauf in der Nähe einer ebene Grenzfläche des Leiters her, wobei das Magnetfeld parallel zu der Grenzfläche sein soll. Unter welcher Voraussetzung ist der von einem Ring aus einem idealen Leiter eingeschlossene magnetische Fluss erhalten? Bemerkung: Der Meissner-Ochsenfeld-Effekt zeigt, dass Gl. 14.119 in Supraleitern nicht nur für die Zeitableitung von B , sondern auch für den Ausdruck in der geschweiften Klammer gilt. Ohne die Zeitableitung heißt Gl. 14.119 die 2. LondonGleichung.
14.6 Quasiteilchen in supraleitenden Metallen |
587
14.13. Meissner-Effekt in dünnen Schichten Eine dünne supraleitende Schicht wird einem Magnetfeld ausgesetzt, das parallel zur Schicht orientiert ist. a) Berechnen Sie mit Hilfe der 2. London-Gleichung 14.119 das Magnetfeldprofil innerhalb der supraleitenden Schicht. b) Was folgt aus der Rechnung, wenn die Schichtdicke kleiner als die magnetische Eindringtiefe λL 14.120 wird? c) Wie groß sind die über den Film gemittelte Magnetisierung und das parallele kritische Magnetfeld Bc|| , wenn Bc (0) gegeben ist?
15 Quasiteilchen in reduzierten Dimensionen Bei freien Teilchen bilden die möglichen Werte von ε, kx , ky und kz ein (vierdimensionales) Kontinuum. Im vorangegangenen Abschnitt haben wir gesehen, dass das Kontinuum der elektronischen elementaren Fermi-Systeme im Festkörper in mehrere Subkontinua, nämlich die Bänder sowie die Donator- und die Akzeptor-Niveaus, aufbricht, die als unabhängige Teilsysteme des Festkörpers angesehen werden können. Ebenso lassen sich das Elektronen- und das Phononensystem näherungsweise1 als unabhängige Teilsysteme des Festkörpers auffassen, die unter bestimmten Bedingungen aus dem Gleichgewicht gebracht werden können. In diesem Abschnitt wollen wir die Effekte einer Einschränkung der Dimensionalität des Quasiteilchensystems untersuchen, welche dazu führt, dass auch das dreidimensionale Quasi-Kontinuum der möglichen k-Vektoren in zwei- und eindimensionale Untermengen aufbricht. Das Konzept der elementaren Fermi- und Bose-Systeme ist flexibel genug, um die sich daraus ergebenden Quanten-Transportphänomene qualitativ und quantitativ richtig zu beschreiben.
15.1 Zweidimensionale Elektronensysteme 15.1.1 Halbleiter-Heterostrukturen Durch die Entwicklung der Molekularstrahl-Epitaxie (MBE) und der Metallorganischen Gasphasenepitaxie (MOVPE) wurde es möglich, Heterostrukturen aus verschiedenen Halbleitern mit zunehmender Perfektion des Kristallgitters aufeinander aufzuwachsen. Wichtige Beispiele sind die Kombinationen GaAs/Alx Ga1−x As oder InAs/Gax In1−x As, bei denen die Gitterfehlanpassung gering genug ist, um die Erzeugung von Gitterdefekten durch elastische Verspannungen im Kristall weitgehend zu vermeiden. Interessant ist bei diesen Systemen, dass die Bandlücke durch die Variation der Zusammensetzung der Mischkristalle in weiten Grenzen verändert werden kann. Im System Alx Ga1−x As sind so Bandlücken zwischen 1.4 eV (GaAs) und 2.2 eV (AlAs) realisierbar. Wir fragen nun, wie sich die Energiebänder verhalten, wenn zwei Kristalle mit unterschiedlicher Bandlücke in einer Heterostruktur kombiniert werden. Aufgrund der hohen Qualität der Kristallgitter und einer geringen Interdiffusion der Atome erfolgt der Übergang von einem Material zum anderen auf der atomaren Skala. Für die Ladungsträger bedeutet dies, dass extrem scharfe Potenzialmodulationen realisierbar
1 Nach Born und Oppenheimer spielt sich die Dynamik der Elektronen und die des Kristallgitters wegen der stark unterschiedlichen Masse auf so verschiedenen Zeitskalen ab, dass diese weitgehend unabhängig voneinander und nur durch die Elektron-Phonon-Streuung gekoppelt sind.
15.1 Zweidimensionale Elektronensysteme | 589
sind, mit denen ein Einschluss von Elektronen und Löchern in sehr dünnen Quantentrögen oder Quantenfilmen erreicht werden kann. Das entsprechende Potenzial nennt man das Einschlusspotenzial. Zunächst sind die Quantentröge nicht dotiert und damit eher wegen ihrer optischen Eigenschaften und weniger für den elektrischen Transport interessant. Um freie Ladungsträger zu erzeugen, ist es notwendig zu dotieren. Die zurückbleibenden ionisierten Dotieratome erzeugen ein Unordnungspotenzial, welches zu einer Begrenzung der Beweglichkeit der Ladungsträger in der eigentlich weitgehend perfekten Kristallstruktur führt. Ein Durchbruch bei dem Versuch, elektronische Systeme mit ballistischen Transporteigenschaften zu realisieren, wurde erreicht, als es gelang, die dotierte Schicht von dem Quantentrog räumlich zu trennen und so Heterostrukturen mit einer extrem hohen Beweglichkeit herzustellen. Dazu wurde die Methode der ModulationsDotierung entwickelt, bei der die dotierte Halbleiterschicht von dem Quantentrog durch Abstände d 30 nm–60 nm räumlich separiert wird. Das Dotierprofil des dotierten Bereichs kann extrem schmal gemacht werden („δ -Dotierung“). Die aus den Donator- und Akzeptor-Zuständen heraus angeregten Elektronen finden in dem Quantentrog die am tiefsten liegenden Zustände, weshalb in diesem eigentlich undotierten Bereich die höchste Elektronendichte vorliegt, während der dotierte Bereich nicht zum Leitwert beiträgt. Die Dichte der Ladungsträger im Quantentrog kann bis in den Entartungsbereich hinein gesteigert werden, wobei Elektronengase mit einer FermiEnergie im Bereich von meV entstehen. Diese Dichte ist hoch genug, um das durch die undotierte dielektrische Zwischenschicht auf e2 /(4πr 0 d) reduzierte Hintergrundpotenzial der ionisierten Dotieratome so weit abzuschirmen, dass Beweglichkeiten von 3 · 107 m2 /(V s) und mehr erreicht werden, was die Beweglichkeit von homogen dotierten Materialien um viele Größenordnungen übersteigt. Bei tiefen Temperaturen T < 1 K kann eine freie Weglänge in diesen Strukturen einen Bruchteil eines Millimeters erreichen und ist damit schon als makroskopisch anzusehen. Interessanterweise können Quantentröge bereits durch eine einzige Grenzfläche realisiert werden. Wie Abb. 15.1a zeigt, findet beim Aufwachsen eines Halbleiters mit großer Bandlücke auf einen mit einer kleineren Bandlücke und einer anderen Austrittsarbeit wiederum ein Ladungstransfer statt. Dieser führt nicht nur zu einer Bandverbiegung, sondern es tritt im Gegensatz zum pn-Übergang auch eine BandDiskontinuität auf (Abb. 15.1b). So entsteht an der Grenzfläche ein annähernd dreieckig geformter Quantentrog. Bei geschickter Einstellung der geometrischen und Dotierungs-Parameter liegt der tiefste Punkt des Leitungsbands unterhalb des elektrochemischen Potenzials, was zur Ausbildung eines quasi-zweidimensionalen entarteten Elektronensystems an der Grenzfläche führt. Die besonderen elektrischen Eigenschaften eines solchen Systems sind Gegenstand des nächsten Abschnitts.
590 | 15 Quasiteilchen in reduzierten Dimensionen
a)
b)
Vakuumniveau
WA,L
Leitungsband
¡C, L
¡g, L
¡C +
WA,R
¡C, R ¡V
¡g, R ¡V, R
6¡V Valenzband
gebundene elektronische Wellenfunktion
Leitungsband
6¡C
¡V, L
b-dotierte Ebene
AlxGa1-xAs
GaAs
Valenzband
Abb. 15.1. a) Band-Fehlanpassung im System GaAlx As1−x /GaAs: Die Substitution von As mit Al vergrößert die Bandlücke. b) Im elektrischen Kontakt kommt es zu einem Ladungstransfer, und wegen der entsprechenden Bandverbiegung. Weil die Band-Diskontinuität ΔεC + ΔεV unabhängig von der Elektrostatik ist, bildet sich an der Grenzfläche ein zweidimensionaler Quantentrog. Bei geeigneter Dotierung in der durch die rot gestrichelte Linie bezeichneten Ebene sind nur elementare Fermi-Systeme bevölkert, die nur einer gebundenen transversalen Wellenfunktion entsprechen (nach [48]).
15.1.2 Elektronische Struktur von Quantentrögen Die im vorangegangenen Abschnitt vorgestellten Halbleiter-Heterostrukturen erlauben es, am unteren Rand des Leitungsbands schmale zweidimensionale Potenzialtröge, sogenannte Quantentröge, experimentell herzustellen, in denen die transversale Komponente ψm (z) der Wellenfunktionen diskret wird, während Komponenten der Wellenfunktion in der Ebene des Quantentrogs weiterhin durch ebene (Bloch)-Wellen mit einem zweidimensionalen Quasi-Kontinuum von {kx , ky }-Vektoren dargestellt werden: * + 1 Ψ(x, y, z) = ψm (z) ·
L
exp i(kx x + ky y) .
Die ψm (z) bilden einen Satz von Energie-Eigenfunktionen zu dem eindimensionalen Potenzial V (z) des Quantentrogs. Typische Breiten der Quantentröge sind 5 nm–50 nm, was zu typischen Abständen der zugehörigen Energie-Eigenwerte εm im meV-Bereich führt. Die Energie-Eigenwerte der dreidimensionalen Wellenfunktionen Ψ(x, y, z) lauten: 2 (kx2 + ky2 ) εm (kx , ky ) = εm +
2m ˆ
.
Das Elektronensystem zerfällt damit näherungsweise2 in zweidimensionale Subbänder mit den Zustandsdichten3 (einschließlich des Spins): gm (ε) =
m ˆ · θ(ε − εm ) , π 2
2 Hier vernachlässigen wir wieder die Wechselwirkungen der Elektronen untereinander. 3 Dieses Ergebnis ist in Aufgabe 15.1 abzuleiten.
15.2 Tunnelkontakte und Punktkontakte
| 591
ˆ die effektive Masse im Leitungsband und θ(ε) wieder die Stufenfunktion ist. wobei m Die Zustandsdichte eines strikt zweidimensionalen Systems mit quadratischer Dispersionsrelation ist also von ε unabhängig.4 Die Dotierung des Halbleiterkristalls kann so eingestellt werden, dass das chemische Potenzial nur das energetisch niedrigste zweidimensionale Subband mit der Nullpunktsenergie ε0 schneidet. Auf diese Weise erhält man ein echt zweidimensionales Elektronensystem (2DES) oder Elektronengas (2DEG), das aus elementaren Fermi-Systemen mit den Wellenvektoren k = (kx , ky ) besteht. Solange nur ein zweidimensionales Subband bevölkert ist, ist die Dynamik in z -Richtung unterdrückt – alle Bewegung findet in der xy -Ebene statt. Es werden typische Elektronendichten von ca. 1011 Teilchen pro cm2 erreicht, was im System GaAs/AlGaAs Fermi-Wellenlängen von ca. 50 nm entspricht. In analoger Weise ist es in p-dotierten Heterostrukturen möglich, auch Loch-Gase zu erzeugen. Diese Systeme sind natürlich an sich interessant (vor allem im Magnetfeld, wo sie den Quanten-Hall-Effekt zeigen); sie erlauben aber auch die Herstellung aller Arten von Halbleiter-Nanostrukturen, von denen ein typischer Vertreter im übernächsten Abschnitt vorgestellt wird.
15.2 Tunnelkontakte und Punktkontakte Tunnelkontakte und Punktkontakte sind zwei entgegengesetzte Grenzfälle des Transports zwischen zwei metallischen Leitern, welche Quasiteilchen-Reservoire darstellen. Im ersten Fall erfolgt der Transport aufgrund des quantenmechanischen Tunneleffekts durch eine dünne isolierende Barriere. Die meist sehr niedrige Transparenz der Kontakte, das heißt die Wahrscheinlichkeit T , mit der ein auf die Barriere einlaufendes Quasiteilchen transmittiert wird (typisch T 10−5 ), wird durch eine große Fläche wieder wettgemacht. Im zweiten Fall erfolgt der Transport durch eine sehr kleine Öffnung mit hoher Transparenz (typisch T 1) der Grenzfläche zwischen den beiden Leitern. Ist der Durchmesser der Öffnung kleiner als die freie Weglänge, spricht man von ballistischen Punktkontakten. Dabei sollte der Widerstand des Kontakts groß gegen den Zuleitungswiderstand der Reservoire sein. Eine elektrochemische Potenzialdifferenz zwischen den Reservoiren führt zum Stromfluss durch die Kontakte.
4 Je nach Stärke der Elektron-Elektron-Wechselwirkung können die Elektronen statt der hier diskutierten zweidimensionalen Fermi-Flüssigkeit theoretisch auch einen zweidimensionalen Wigner-Kristall bilden. Dafür gibt es bisher aber nur wenig experimentelle Evidenz.
592 | 15 Quasiteilchen in reduzierten Dimensionen
a)
Tunnelbarriere (d
Metall 1
1-10 nm)
c)
Metall 2
e-
L
-
UB
-
R
I
+
b)
eU
Metall 1
Metall 2
UB
I
+
Isolation (d > 30 nm)
gL
gR
Abb. 15.2. a) Tunnelkontakt zwischen zwei metallischen Reservoiren. b) Punktkontakt zwischen zwei metallischen Reservoiren. c) Zustandsdichten beider Reservoire. Die Zustandsdichten und die elektrochemischen Potenziale der Reservoire sind um eU gegeneinander verschoben.
15.2.1 Tunnelkontakte Bei Tunnelkontakten (Abb. 15.2a) werden zwei Metalle durch eine dünne isolierende Schicht voneinander getrennt. Je nach Höhe der Barriere kann das Tunneln über Abstände von 1 nm–10 nm erfolgen. Die energetische Höhe der Barriere zwischen den beiden Metallfilmen ist durch die Lage des Leitungsbands im Isolator gegeben. Bei einer homogenen Barriere ist die Tunnelstromdichte ebenfalls homogen verteilt. In Abb. 15.2c ist gezeigt, wie eine an den Kontakt angelegte elektrische Spannung U = (¯ μL − μ ¯R )/ˆ q die Zustandsdichten und die elektrochemischen Potenziale der Kontakte gegeneinander verschiebt, so dass auf der Energieachse ein Vorspannungsfenster der Breite qˆU entsteht, in dem Strom vom linken Reservoir durch den Kontakt in das rechte Reservoir fließen kann. Die im Energie-Intervall [¯ μR , μ ¯L ] injizierten Quasiteilchen geben ihre überschüssige Energie durch inelastische Streuung, zum Beispiel an Phononen, ab und relaxieren, bis sich die elementaren Fermi-Systeme untereinander wieder im Gleichgewicht befinden. Die Stärke der Tunnelstromdichte ist durch die Tunnel- oder Transmissionswahrscheinlichkeit und die Zustandsdichten gL , gR des linken und rechten Reservoirs gegeben. Die Geschwindigkeiten der auf die Barriere zulaufenden Quasiteilchen5 bestimmen zusammen mit der Breite und Höhe der Barriere die von der Energie abhängige Transmissionswahrscheinlichkeit T (ε). Im diesem Modell erhalten wir für den Tun-
5 Genau genommen geht nur die Geschwindigkeitskomponente senkrecht zur Barriere in die Transparenz T ein.
15.2 Tunnelkontakte und Punktkontakte
nelstrom:
| 593
I(U ) = qˆA˜
dε T (ε)gL (ε)gR (ε)
,
(F)
× Nε
= qˆA˜
*
(F)
(T, μ ¯ L ) 1 − Nε
+
(F)
(T, μ ¯ R ) − Nε
,
(F)
dε T (ε)gL (ε)gR (ε) Nε
*
(F)
(T, μ ¯ R ) 1 − Nε (F)
(T, μ ¯ L ) − Nε
(T, μ ¯L )
+-
(T, μ ¯L + qˆU )
,
(15.1)
wobei A˜ eine zur Fläche A des Kontakts proportionale Konstante ist. Ist die Energieabhängigkeit der Tunnelwahrscheinlichkeit und der Zustandsdichten innerhalb des Vorspannungsfensters qˆU vernachlässigbar, so bleibt nur die Integration über die FermiFunktionen, ˜ (εF )gL (εF )gR (εF ) · I(U ) = qˆAT
(F)
dε Nε
(F)
(T, μ ¯ L ) − Nε
(T, μ ¯L + qˆU )
˜ (εF )gL (εF )gR (εF ) · qˆU , = qˆAT
(15.2)
die den Faktor qˆU liefert. Der Tunnelwiderstand ist unter diesen Bedingungen einfach unabhängig von U und wir erhalten ˜ (εF )gL (εF )gR (εF ) . GT = qˆ2 AT
(15.3)
Die Tunnelwahrscheinlichkeit T fällt exponentiell mit der Dicke der Isolierschicht und ist typischerweise von der Ordnung 10−4 oder kleiner. Bei Vorspannungen im mVBereich können die Zustandsdichten und die Tunnelwahrscheinlichkeit in normalen Metallen tatsächlich als konstant angesehen werden. Bei höheren Spannungen U 1 V werden g(ε) und T (ε) energieabhängig, und der Strom ist nicht mehr proportional zur Spannung U . In speziellen Systemen, wie zum Beispiel den im letzten Kapitel besprochenen Supraleitern, ist schon bei Spannungen im mV-Bereich ein nichtlinearer Verlauf von I(U ) zu erwarten. Wir nehmen an, dass der linke Metallfilm in Abb. 15.2.1a supraleitend und der auf der rechten Seite normalleitend ist. In diesem Fall weist gL (ε) auf der Skala der supraleitenden Energielücke nach Abb. 14.42b eine starke Energieabhängigkeit auf. Nehmen wir an, dass die Zustandsdichte gR (ε) des Normal-Metalls auf der rechten Seite des Kontakts innerhalb des Vorspannungsfensters energieunabhängig ist, so ergibt sich für den differenziellen Leitwert GT (U ) =
∂I(U ) ∂U
(15.4)
˜ (0)gR (0) = qˆAT
⎡ dε gL (ε) ⎣−
⎤
(F)
∂Nε,R (¯ μL + qˆU ) ∂U
⎦ .
Das Resultat stellt ein Faltungprodukt zwischen der Zustandsdichte des linken und der Ableitung der Verteilungsfunktion des rechten Reservoirs dar. Sind die Reservoire im
594 | 15 Quasiteilchen in reduzierten Dimensionen
a)
b)
4
1.0
Pb / MgO /Mg 6 / kB = 15.5 K
6(T) / 6(0)
gS(¡)/gN
3
T= 0.33 K 2
1 0 0
0.8 BCS-Theorie
0.6 0.4
Indium Zinn Blei
0.2
5
¡ /6
10
0.0 0.0
15
0.2
0.4
0.6
0.8
1.0
T / TC
Abb. 15.3. a) Mittels Tunnelspektroskopie gemessene Zustandsdichte in einem Pb/MgO/MgTunnelkontakt. b) Gemessene Temperaturabhängigkeit der Energielücke Δ(T ) für verschiedene Supraleiter. Die durchgezogene Linie ist das Resultat der BCS-Theorie (nach [21]).
Gleichgewicht, so ist die Gewichtsfunktion (F)
h(U ) = −
∂Nε,R (¯ μL + qˆU ) ∂U
(15.5)
bekannt (Gl. 14.17), und die Messung von G(U ) liefert im Grenzfall T → 0 direkt die Energieabhängigkeit der Zustandsdichte, weil die Ableitung der Verteilungsfunktion gegen eine δ -Funktion strebt. Bei endlichen Temperaturen müssen gL (ε) und hR (ε) numerisch entfaltet werden.6 Die ist insbesondere dann erforderlich, wenn die Werte der Energielücke Δ(T ) bei höheren Temperaturen bestimmt werden sollen, weil die Gewichtfunktion in diesem Fall die scharfen BCS-Singularitäten in gL (ε) ausschmiert. Auf diese Weise lässt sich die Vorhersage des BCS-Theorie bezüglich der Zustandsdichte von Supraleitern (Abb. 14.42b) experimentell überprüfen. Abbildung. 15.3a zeigt Messungen des differenziellen Leitwerts für einen Normalmetal/SupraleiterTunnelkontakt, der proportional zur Zustandsdichte der Bogoliubov-Quasiteilchen sein sollte. Für Temperaturen kB T Δ und Spannungen eU < Δ ist GT (U ) sehr klein, weil nur noch wenige thermisch angeregte Quasiteilchen in dem Supraleiter vorhanden sind beziehungsweise in ihn eindringen können. Bei höheren Spannun-
6 Das Faltungsprodukt zweier Funktionen f (x) und g(x) ist durch das Integral ∞ f (x) ⊗ g(x) :=
f (x ) · g(x − x ) dx
−∞
definiert. Die Operationen des Faltens und seiner Umkehrung, des Entfaltens, gehören zum StandardRepertoire der numerischen Mathematik.
15.2 Tunnelkontakte und Punktkontakte
| 595
gen ist die thermisch leicht verbreiterte BCS-Singularität in gS (ε) klar erkennbar. Die Stufen bei höheren Energien sind auf die Maxima in der Phononen-Zustandsdichte zurückzuführen, die in der BCS-Theorie nicht berücksichtigt werden. In Abb. 15.3b sind die aus ähnlichen Messungen resultierenden Werte von Δ(T ) für verschiedene Supraleiter aufgetragen. Ist umgekehrt die Zustandsdichte des linken Reservoirs bekannt, kann die Verteilungsfunktion des rechten Reservoirs auch im Falle extremen Nicht-Gleichgewichts durch Entfaltung extrahiert und so aus Messungen von G(U ) experimentell bestimmt werden, wie dies in Abschnitt 15.3.4 exemplarisch gezeigt ist.
15.2.2 Punktkontakte Der Leitwert von diffusiven metallischen Punktkontakten (Abb. 15.2b) mit dem Durchmesser d wurde im Grenzfall d Λ schon von Maxwell berechnet: GMaxwell = dσ ,
(15.6)
wobei σ die lokale elektrische Leitfähigkeit und Λ die mittlere freie Weglänge der Elektronen des Metalls ist. Im umgekehrten Grenzfall Λ d ist der Transport ballistisch. Werden zwei Kontakte durch einen direkten metallischen Kontakt mit der Fläche A verbunden und ist der Durchmesser d des Kontakts kleiner als die freie Weglänge Λ, so erhält man die fermionische Variante des klassischen Effusionsproblems (Abschnitt 8.7). Nach Gleichung 8.45 beträgt die Effusionsrate von Teilchen ins Vakuum: IN =
A |v| n . 4
Wenn wir dieses Ergebnis auf einen Punktkontakt zwischen zwei entarteten FermiGasen mit gleichen Zustandsdichten g(εF ) und der chemischen Potenzialdifferenz qˆU anwenden wollen, müssen wir ein ähnliches Integral über die Energien aller elementaren Fermi-Systeme wie in Gl. 15.2 berechnen. Wegen des Pauli-Prinzips sind aber wieder nur die elementaren Fermi-Systeme an der Fermi-Kante relevant, so dass g(εF ) innerhalb des Bereichs max{kB T, qˆU } als konstant angesehen werden kann. Dann erhalten wir für den nicht kompensierten Bruchteil n(U ) der transmittierten Elektronen n(U ) =
(F)
dε g(ε) Nε
(F)
(T, μ ¯ L ) − Nε
(T, μ ¯L + qˆU ) = g(εF ) · qˆU
und für den Ladungsstrom IQ durch den Kontakt: IQ = qˆA
k2 vF qˆ2 A ·U . g(εF ) · qˆU = qˆ2 A F2 · U = 4 λ2F 4π
Ist die Fläche A des Punktkontakts so klein, dass der Zuleitungswiderstand GMaxwell (Gl. 15.6) der Reservoire vernachlässigt werden kann, so erhalten wir für den Leitwert
596 | 15 Quasiteilchen in reduzierten Dimensionen des Punktkontakts den Sharvin-Leitwert: GSharvin =
Aˆ q 2 vF g(εF ) qˆ2 A . = 4 λ2F
(15.7)
An dieser Stelle begegnet uns zum ersten Mal der nur aus Naturkonstanten gebildete Leitwert G0 = e2 /h. Im nächsten Abschnitt werden wir sehen, dass dieser eine fundamentale Rolle spielt, wenn der Kontaktdurchmesser in die Größenordnung der Fermi-Wellenlänge kommt. Falls die Grenzfläche eine von 1 verschiedene Transmissionswahrscheinlichkeit T aufweist, so reduziert sich der Leitwert GPC = T · GSharvin
des Punktkontakts entsprechend. Auch Punktkontakte sind für spektroskopische Anwendungen geeignet, sofern im Bereich des Punktkontakts keine inelastische Streuung der Elektronen erfolgt [49]. Dazu muss der Kontakt-Durchmesser kleiner als die inelastische freie Diffusionslänge √ Λin = Dτin oder gar Λel sein. Bei den in Abschnitt 15.1.2 betrachteten zweidimensionalen Elektronensystemen in Quantentrögen ist der ballistische Grenzfall experimentell sehr viel leichter realisierbar als in konventionellen Metallen.
15.3 Quasi-eindimensionale Leiter Die im vorletzten Abschnitt eingeführten hoch-beweglichen zweidimensionalen Elektronensysteme bilden den Ausgangspunkt für die Herstellung von HalbleiterNanostrukturen, in denen die Dimensionalität des Elektronensystems mittels typischerweise etwa 50 nm–100 nm oberhalb des 2DESs aufgebrachter Gatterelektroden noch weiter eingeschränkt werden kann. Eine solche Anordnung ist in Abb. 15.5a gezeigt. Wegen der strukturellen Perfektion des der Heterostruktur zugrundeliegenden Kristallgitters kann das zweidimensionale Elektronengas außerhalb des nanostrukturierten Bereiches als ballistisches Reservoir für Elektronen angesehen werden. Die Quasiteilchen unterhalb der Gatterelektroden werden verdrängt, sobald eine hinreichend große Spannung zwischen den Gatterelektroden und dem 2DES angelegt wird. Durch Verwendung von zwei, sagen wir, in y -Richtung etwa 0.2 μm–1 μm auseinander liegenden Gatterelektroden7 kann zwischen zwei Quasiteilchen-Reservoiren mit den elektrochemischen Potenzialen μ ¯L und μ ¯R eine Engstelle im 2DES erzeugt werden, so dass die Wellenfunktionen im Bereich der Engstelle nicht mehr durch ein Quasi-Kontinuum von zweidimensionalen ebenen Wellen dargestellt werden können, sondern die Form 1 Ψ(x, y, z) = ψmn (y, z) · √ exp(ikx x) L
7 In der englischsprachigen Literatur hat sich für solche Anordnungen die Bezeichnung „split-gates“ eingebürgert.
15.3 Quasi-eindimensionale Leiter |
a)
n=1
2
3
c)
4
TL +L
¡nm(k)
TR +R
597
n= 4 3 2 1 eUB
+L
b)
TR +R
TL +L
+R eUB
_Ug
k
Abb. 15.4. a) Transversaler Anteil der elektronischen Wellenfunktionen in einem ballistischen Quantendraht für die ersten vier eindimensionalen Subbänder. b) Rückstreuung zweier rechts- (durchgezogene rote Linie) und links- (gestrichelte rote Linie) laufender Kanäle an einer Tunnelbarriere. Zur besseren Übersicht wurden die rechts- und links-laufenden Kanäle räumlich getrennt gezeichnet – für das Prinzip ist dies jedoch ohne Belang. c) Dispersionsrelationen ε(k) der ersten vier eindimensionalen Subbänder. Die beiden Teilchen-Reservoire auf den elektrochemischen Potenzialen μ ¯L und μ ¯R sind recht und links angedeutet. Die Dispersionsrelationen für rechts- (durchgezogene Linien) und links(gestrichelte Linien) laufende elementare Fermi-Systeme sind um die elektrochemische Potenzialdifferenz eU = μ ¯L − μ ¯R gegeneinander verschoben. Zum Transport tragen nur die elementaren Fermi-Systeme in dem hellgrau schattierten Bereich bei. Die außerhalb des hellgrau schattierten Bereiches liegenden Stücke von ε(k) sind entweder beide bevölkert (rot) und kompensieren sich daher, oder sie sind beide unbevölkert (schwarz). Die Dispersionsrelationen werden durch die zwischen einer Gatterelektrode (Abb. 15.5a, b) und dem Elektronensystem angelegten Gatterspannung (in ersten Näherung) in vertikaler Richtung starr verschoben.7 Auf diese Weise kann die Zahl der zum Transport beitragenden eindimensionalen Subbänder geändert werden.
mit den Energie-Eigenwerten εmn (kx ) = εmn +
( kx ) 2 2m ˆ
annehmen. Die Wellenausbreitung erfolgt unter diesen Umständen nur noch in xRichtung. Damit folgt 1 kx =
2m(ε ˆ − εmn ) .
Die Summen über alle elementaren Fermi- und Bose-Systeme lassen sich wieder mit Hilfe der Zustandsdichte g(ε) berechnen: L 1 dkx (ε) = dkx = L dε (15.8) = L dε g(ε) . kx
2π
2π
dε
7 Der die Effektivität der elektrostatischen Kopplung ε = εnm (kx ) + α Ug angebende Parameter α wird der „Hebelarm“ genannt – in der dargestellten Situation beträgt er typischerweise 0.01 e.
598 | 15 Quasiteilchen in reduzierten Dimensionen Damit ergibt sich für die Zustandsdichte pro Spin-Richtung g(ε) =
1 dkx (ε) 1 1 · · = . 2π dε 2π v(ε)
(15.9)
Das bedeutet, dass das Produkt aus Zustandsdichte und Geschwindigkeit in quasieindimensionalen Systemen sogar unabhängig von der Form der Dispersionsrelation und der Fermi- oder Bose-Statistik stets den universellen Wert v(ε) · g(ε) =
1 2π
(15.10)
annimmt. Diese Besonderheit der quasi-eindimensionalen Systeme ist für die Universalität ihrer in den nachfolgenden Abschnitten beschriebenen Transporteigenschaften verantwortlich. In Quantendrähten zerfällt das Elektronensystem also in eindimensionale Subbänder. Ist die Dispersionsrelation quadratisch, so erhalten wir für die Zustandsdichte pro Spin-Richtung eines Subbands: 1 m ˆ gmn (ε) = (15.11) · θ(ε − εmn ) , 2π 2(ε − εmn ) wobei θ(ε) wieder die Stufenfunktion ist. In diesem Fall weist die Zustandsdichte typische Wurzel-Singularitäten auf, die auch als van Hove-Singularitäten bekannt sind. Über die Gatterspannung lässt sich das transversale Einschlusspotenzial und damit die Geometrie der den elementaren Teilsystemen zugrundeliegenden Moden und die εmn variieren – eine interessante experimentelle Möglichkeit, die in konventionellen Festkörpern in dieser Form nicht besteht. Die Berechnung der thermodynamischen Eigenschaften dieser Systeme ist mit denselben Methoden leicht möglich, die wir in den vorangegangenen Kapiteln auf dreidimensionale Systeme angewandt haben. Wir wollen dies an dieser Stelle aber nicht weiter verfolgen, weil der Absolutwert der Beiträge der niederdimensionalen Teilsysteme zu den thermodynamischen Größen des gesamten Festkörpers in aller Regel so klein ist, dass sie experimentell bisher kaum aufzulösen sind.8 Dies ist bei den Transport-Phänomenen anders, weil das Anlegen einer elektrischen Spannung oder eines Temperaturgradienten auf der μm-Skala und die Messung der resultierenden elektrischen und thermischen Ströme deutlich leichter als die Messung kalorischer Größen wie der Wärmekapazität ist. Solche Untersuchungen bilden seit etwa 20 Jahren einen Schwerpunkt der Forschung. Die Herstellung solcher niederdimensionalen Strukturen mit Abmessungen bis hinab in den Nanometerbereich erfolgt meist mittels der Methode der Elektronen-
8 Erste experimentelle Anstrengungen in dieser Richtung betreffen periodische Anordnungen von vielen nominell identischen Nanostrukturen auf freitragenden SiNx -Membranen [50].
15.3 Quasi-eindimensionale Leiter |
599
strahl-Lithographie.9 Dabei wird ein geeignetes Substrat (meist ein Silizium-Chip) mit einem Polymerfilm, einem Lack, mit einer Dicke von einigen 10 bis einigen 100 nm beschichtet. Das gewünschte Muster wird dann von einem fokussierten Elektronenstrahl in einem Raster-Elektronenmikroskop oder einem kommerziellen ElektronenstrahlSchreiber geschrieben. Der Elektronenstrahl bricht in dem Polymer Bindungen auf, wobei Bereiche mit einem kurzkettigen Polymer entstehen, die bereits mit einem milden Lösungsmittel – dem Entwickler – aufgelöst werden können. Das so entstandene Muster wird dann mit einem Metallfilm von einigen 10 nm Dicke bedampft. Der größte Teil des Metalls bedeckt die Polymer-Maske; das Substrat wird nur mit dem gewünschten Muster bedampft. Danach wird die metallisierte Maske mit einem schärferen Lösungsmittel weggewaschen, und die metallische Struktur liegt frei. Auf diese Weise lassen sich minimale Linienbreiten bis herab zu typisch einigen 10 nm auf einfache Weise schreiben. Daneben existieren auch subtraktive Verfahren der Strukturierung. Bei diesen wird zuerst der Metallfilm aufgebracht oder die Halbleiter-Heterostruktur hergestellt und dann ein negativer Lack verwendet, der an den belichteten Stellen kovalente Bindungen von einer Polymerkette zur anderen ausbildet und bei der Entwicklung an den belichteten Stellen stehen bleibt. Dann werden die nicht gewünschten Flächen mit Hilfe eines Ätzverfahrens entfernt. Für Strukturen mit Linienbreite oberhalb einigen μm lassen sich auch optische Masken verwenden, bei denen der Lack mit ultraviolettem Licht bestrahlt wird. Dies hat den Vorteil, dass sich große Flächen auf einmal belichten lassen.
15.3.1 Elektrischer Transport durch Quanten-Punktkontakte Bei unserer Darstellung der Transporteigenschaften in den Kapiteln 8 und 14 haben wir nur den Fall betrachtet, dass die angelegten Gradienten von μ ¯ und T so klein sind, dass das System im lokalen Gleichgewicht bleibt. Das bedeutet, dass die beim Transport dissipierte Energie auch lokal deponiert wird. Dies ändert sich, wenn wir Leiter betrachten, die deutlich kürzer als die elastische und die inelastische freie Weglänge der Quasiteilchen sind. In diesem Fall behalten die Quasiteilchen die Energie, mit der sie aus einem Reservoir kommen, während des Transports durch die Nanostruktur bei und dissipieren diese erst, wenn sie im anderen Reservoir genügend Zeit zur Relaxation durch inelastische Streuprozesse haben. Die Entropie-Erzeugung findet in diesem Fall also nicht in der Nanostruktur, sondern in den Reservoiren statt.
9 Daneben haben sich auch andere Techniken, wie die lokale Oxidation mittels der leitfähigen Spitze eines Rasterkraft-Mikroskops (AFM-Lithographie) oder in jüngster Zeit die direkte Strukturierung mittels eines fokussierten Ionenstrahls (FIB – focused ion beam), entwickelt.
600 | 15 Quasiteilchen in reduzierten Dimensionen Als Beispiel betrachten wir zunächst einen Quanten-Punktkontakt, welcher der Einfachheit halber zunächst nur ein eindimensionales Subband beinhalten soll und der an zwei (zweidimensionale) Elektronenreservoire angeschlossen ist, die mit makroskopischen Kontaktelektroden verbunden sind, so dass der elektrische Leitwert G der Anordnung gemessen werden kann (Abb. 15.4). Statt von eindimensionalen Subbändern spricht man auch oft von Transport-Kanälen. Eine experimentelle Realisierung eines solchen Systems ist in Abb. 15.5a gezeigt. Um den Ladungstransport durch einen solchen Quanten-Punktkontakt zu verstehen, gehen wir von einer eindimensionalen Variante von Gleichung 12.34 aus. Kombinieren wir die rechts- und linkslaufenden Teilchenströme, so erhalten wir ( ) (F) 1 (F) (15.12) IN = Nk,L v(k) + Nk,R v(k) L
k>0
k 0 und Linksläufer mit kx < 0 bezeichnet werden.10 Die Verteilungsfunktionen der Reservoire sind definitionsgemäß11 Fermi-Funktionen: (F)
Nε; L,R = Nε
(T ± ΔT /2, μ ± qˆU/2) ,
(15.14)
10 In der englischsprachigen Literatur lauten die entsprechenden Bezeichnungen left movers und right movers. 11 In der Realität ist diese Annahme, vor allem bei hohen Strömen und tiefen Temperaturen, oft zu idealisierend.
15.3 Quasi-eindimensionale Leiter |
b) 0.5 +m Mesa 5 +m
-
12
G (2e2/h)
a)
601
8
4
Ug +
275 mK 0 -3.0
2DEG
-2.5
-2.0 Ug (V)
-1.5
Abb. 15.5. a) Raster-Elektronenmikroskopische Abbildung einer Reihenschaltung von drei QuantenPunktkontakten (QPC) in einem zweidimensionalen Elektronensystem (2DES), das in Form einer Mesa aus einer GaAs/Alx Ga1−x As-Heterostruktur herausgeätzt wurde. Links unten ist die verwendete Heterostruktur entlang eines Schnitts parallel zu den Paaren von Gatterelektroden schematisch dargestellt: Das 2DES (rot) befindet sich einige 10 nm unterhalb der auf den Halbleiterkristall aufgedampften Gatter-Elektrode (schwarz). Wird eine relativ zum 2DES negative Spannung Ug an das Gatter angelegt, so wird das 2DES unterhalb des Gatters verdrängt, sodass ein QPC von einstellbarer Breite entsteht. Rechts oben ist eine Nahaufnahmen des Gatterelektrodenpaars eines der QPCs gezeigt. b) Gemessener Leitwert eines der QPCs als Funktion von Ug . Es können mehr als zwölf Leitwertstufen der Höhe 2e2 /h beobachtet werden (Photo: S. Oberholzer, C. Schönenberger, Uni Basel).
wobei U die am Draht anliegende Spannung, ΔT die Temperaturdifferenz ist. Der Quantendraht als Ganzes ist nicht im Gleichgewicht, aber er lässt sich in die beiden Teilsysteme der „Rechts- und Linksläufer“ zerlegen. Die Rechtsläufer sind im Gleichgewicht mit den linken Reservoirs und umgekehrt. Der Strom durch den Quantendraht wird damit durch ein elektrochemisches Ungleichgewicht zwischen zwei Teilsystemen, nämlich den nach links laufenden und den nach rechts laufenden elementaren Fermi-Systemen verursacht. Zwischen den elementaren Fermi-Systemen liegt chemisches Gleichgewicht bei U = 0 vor, wenn die elektrochemischen Potenziale der Reservoire gleich sind. Wie bei allen chemischen Reaktionen ist der Gleichgewichtszustand aber nicht statisch, sondern der Strom durch den Kontakt zeigt ein Johnson-Nyquist-Rauschen, welches von den thermischen Fluktuationen (Gl. 12.21) der Teilchenzahlen in den einzelnen elementaren Fermi-Systemen verursacht wird. Bei endlichen Strömen tritt außerdem Schrotrauschen auf (Abschnitt 15.3.4). Zunächst wollen Gl. 15.13 im Grenzfall kleiner Spannungen auswerten. Dann können wir die Differenz der Teilchenzahlen δNε analog zu Gl. 14.46 auswerten und erhalten (F) ∂Nε (T, μ) ε−μ δNε = qˆU − (15.15) ΔT . ∂ε
T
Nehmen wir zunächst ΔT = 0 an und setzen δNε dann in Gl. 15.13 ein, so nimmt das Integral über die Ableitung der Fermi-Funktion einfach den Wert 1 an. Dann bekommen
602 | 15 Quasiteilchen in reduzierten Dimensionen wir für den elektrischen Strom durch einen perfekt transmittierenden Quantendraht IQ = qˆIN =
qˆ2 · U = G0 · U . 2π
(15.16)
Die Größe G0 =
e2 = 38.74 μS 25.8 kΩ)−1 h
(15.17)
nennt man das elektrische Leitwert-Quantum. Wir erhalten also das überraschende Resultat, dass ein perfekt transmittierender Transportkanal pro Spin-Richtung und für |ˆ q | = e den von Material und Temperatur unabhängigen universellen Quantenleitwert G0 aufweist. Experimentell findet man, wie in Abb. 15.5b gezeigt, bei Durchstimmen der Gatterspannung Ug hin zu negativen Werten eine treppenförmige Abnahme des Leitwerts. Solche Experimente wurden erstmals 1988 von van Wees in Delft und Wharam in Cambridge [51; 52] durchgeführt. Der treppenförmige Verlauf von G(Ug ) lässt sich leicht erklären, wenn wir Gl. 15.13 dahingehend erweitern, dass wir mehrere Transportkanäle entsprechend mehreren eindimensionalen Subbändern mit einem energieabhängigen Transmissionskoeffizienten Tn (ε) annehmen (Abb. 15.4c): IQ
∞ (F) ∂Nε (T, μ) qˆ ε−μ = dε Tn (ε) qˆU − ΔT . 2π ∂ε T
(15.18)
n −∞
Im Rahmen dieses von Landauer und Büttiker vorgeschlagenen Modells wird der Transport auf ein quantenmechanisches Streuproblem, nämlich die Reflexion der einlaufenden Quasiteilchen an einer eindimensionalen Potenzialschwelle, zurückgeführt. Die quantenmechanische Reflexionswahrscheinlichkeit R = 1 − T entspricht dabei einer „Reaktionsrate“ ΓR→L , mit der Linksläufer in Rechtsläufer umgesetzt werden: ΓL→R =
eU · (1 − T ) . h
Vergleichen wir die Stufenhöhe in Abb. 15.5b mit dem Leitwertquantum G0 , so finden wir, dass der Leitwert in Stufen von 2G0 ansteigt – dies liegt daran, dass die Transportkanäle jeweils Spin-entartet sind. Analog zu unserem Vorgehen in Abschnitt 14.4.2 können wir das Integral in Gl. 15.18 im Rahmen der Sommerfeld-Entwicklung auswerten und erhalten IQ = G · U + GS · ΔT .
Für den Leitwert G im ersten Term dieser Gleichung finden wir dann einfach
(15.19)
15.3 Quasi-eindimensionale Leiter |
(b)
1
4
ty / tx =3
2
2
1.6
1
0.6
0
0.3
0
1 0(¡)
0
4.2 K
3
0 3
G (2e2 / h)
G(¡)/G0
d ((¡)/d¡
(a)
603
0
2
4
0
2(¡)
1((¡)
6
8 ¡-¡z / ƫtx
0
-2
-1.8 Ug (V)
-1.6
Abb. 15.6. a) Energieabhängigkeit der Transmissions-Koeffizienten Tn (ε) für n = 0, 1, 2. (berechnet nach Gl. 15.21). Die Summe der Tn (ε) für die verschiedenen Transportkanäle entspricht bei T = 0 nach Gl. 15.20 dem mit Leitwertquantum G0 normierten Leitwert. Zusätzlich ist die Ableitung dT (ε)/dε eingezeichnet, welche die Thermokraft des Quantenpunktkontakts bestimmt. b) Gemessener Leitwert eines Quantenpunktkontakts bei verschiedenen Temperaturen (nach [48]).
G = G0 · 2
Tn (μ) .
(15.20)
n
Diese Gleichung wird auch die Landauer-Büttiker-Formel genannt. Für den speziellen Fall einer sattelförmigen Barriere V (x, y, z) =
1 2 2 m ˆ ωy y − ωx2 x2 + V0 (z) 2
senkrecht zur Transmissionsrichtung ex lässt sich die aus dem eindimensionalen Streuproblem resultierende Transmissionswahrscheinlichkeit Tn (ε) analytisch berechnen und lautet Tn (ε) =
1 1 + exp(−2πεn )
mit
εn =
ε − ωy (n + 1/2) − εz . |ωx |
(15.21)
Das Ergebnis ist in Abb. 15.6a dargestellt. Die an den Gatterelektroden angelegte Spannung UG beeinflusst in erster Linie der Term V0 (z) und hebt oder senkt das Sattelpunkts-Potenzial relativ zum elektrochemischen Potenzial der Kontakt-Elektroden. Die mit 2-DES experimentell realisierbaren Energieskalen ωx und ωy liegen typischerweise im mV-Bereich. Die Experimente erfordern daher tiefe Temperaturen, vorzugsweise im mK-Bereich. Wie Abbildung 15.6b zeigt, schmieren die Stufen bei höheren Temperaturen aus. Für ωy /ωx 1 bekommt man wohlseparierte Leitwertstufen, weil ωy den energetischen Abstand der Subbänder und damit die Breite der Plateaus bestimmt, während ωx die Schärfe der
604 | 15 Quasiteilchen in reduzierten Dimensionen
RQPC (kΩ)
15
0 Utrans (μV)
50 U2
U1 I
0 -2.5
-2
-1.5 UG (V)
0.5
-1
Abb. 15.7. Gemessener Widerstand (oben) und Thermokraft (unten) eines Paars von QuantenPunktkontakten in einem stromdurchflossenen Kanal (Skizze). Ein Quanten-Punktkontakt wurde auf ein Widerstandsplateau eingestellt (S = 0), die Gatterspannung des anderen wurde durchgestimmt. Die Stufen in R(UG ) fallen mit den Maxima in S(UG ) zusammen (nach [53]).
Übergänge regelt. Das Verhältnis ωx /4kB T bestimmt nach Gl. 15.21 die thermische Verschmierung der Leitwertstufen. Die große Ähnlichkeit zwischen den Messdaten und dem theoretischen Verlauf der Transmissionswahrscheinlichkeit legt nahe, dass das von den Gatterelektroden realisierte Potenzial tatsächlich in guter Näherung sattelförmig ist. Bei anderen, zum Beispiel rechteckigen, Formen der Gatterelektroden können kompliziertere Energieabhängigkeiten entstehen, die durch Resonanzphänomene verursacht werden. Ähnliche Phänomene kennt man als Transmissionsresonanzen in Mikrowellenschaltkreisen, bei denen die Impedanzanpassung zwischen verschiedenen Bauelementen nicht perfekt ist. Für kleine U ist der Strom proportional zu U ; für große Spannungen, bei denen mehr als ein Transportkanal in das durch die angelegte Spannung definierte Transportfenster fällt, treten auch im differentiellen Leitwert G(U ) = dI(U )/dU Stufen auf. Auch in diesem Fall zeigen Experimente, dass das einfache Modell den Verlauf des gemessenen differenziellen Leitwerts zumindest qualitativ erklärt. Bei höheren Spannungen entstehen Abweichungen dadurch, dass die angelegte Spannung U anfängt, die Form der Potenzialbarriere zu modifizieren. Der zweite Term in Gl. 15.19, *
2 d ln Tn (ε) π 2 kB S = ·2 3 h dε n
+
liefert den Seebeck-Koeffizienten des Quantendrahts.
, ε=μ
(15.22)
15.3 Quasi-eindimensionale Leiter |
605
Gleichung 15.22 ist das ballistische Gegenstück zur Mott-Formel (Gl. 14.59). Auch die Thermokraft von Quantenpunktkontakten wurde experimentell untersucht. Dazu wurde ein elektrischer Strom durch den in Abb. 15.7 skizzierten, mit seitlichen Quantenpunktkontakten versehener Kanal in einer GaAs/AlGaAs-Heterostruktur geschickt. Die lokale Entropieerzeugung ist so hoch, dass die Elektronen im Kanal von den Phononen thermisch entkoppeln, weil der Joule’sche Energieeintrag in das Elektronensystem nicht durch Elektron-Phonon-Streuung abgeführt werden kann. Bei tiefen Temperaturen geschieht dies relativ leicht, weil die Elektron-Phonon-Streuzeiten nach Abschnitt 14.4.2 sehr lang werden können. Dadurch entsteht eine Temperaturdifferenz zwischen dem Kanal und dem benachbarten zweidimensionalen Elektronensystemen. Abb. 15.7 zeigt ein oszillierendes Verhalten der gemessenen transversalen Spannung mit Maxima bei den Leitwertstufen, welches sehr gut mit den dort erwarteten Maxima der logarithmischen Ableitung in Gl. 15.22 und mit Fig. 15.7 (unten) zusammenpasst.
15.3.2 Entropietransport durch Quanten-Punktkontakte Ebenso wie in Abschnitt 14.4.4 können wir auch den Entropiestrom durch den Quanten-Punktkontakt betrachten. Dazu ersetzen wir die Mittelwerte der Teilchenzahlen in Gln. 15.12 und 15.18 durch die Entropiewerte (Gl. 12.25) und erhalten wegen (F)
(F)
∂Sε (T, μ) ε − μ ∂Nε (T, μ) = ∂ε T ∂ε
anstelle von Gl. 15.18: ∞ (F) 1 ε − μ ∂Nε (T, μ) ε−μ IS = dε Tn (ε) Δ¯ μ− ΔT . 2π T ∂ε T
(15.23)
n 0
Der erste Term (∝ Δ¯ μ = qˆU ) in dieser Gleichung entspricht dem durch die elektrochemische Potenzialdifferenz getriebenen Peltier-Strom. Der zweite Term (∝ ΔT ) beschreibt den durch die Temperaturdifferenz getriebenen Entropiestrom. In linearer Näherung erhalten wir dasselbe Resultat, wenn wir den Energiestrom IE analog zur Herleitung von Gl. 15.18 berechnen. Dann lautet der Entropiestrom 1 IS = IE − μ ¯ IN (15.24) T
∞ (F) 1 ε − μ ∂Nε (T, μ) ε−μ = dε Tn (ε) qˆU − ΔT . 2π T ∂ε T n 0
Drücken wir den thermischen Beitrag zum Energiestrom wieder durch die linearen Transport-Koeffizienten aus, so gilt T IS = L · ΔT + GΠ · U .
(15.25)
606 | 15 Quasiteilchen in reduzierten Dimensionen Die Transportkoeffizienten lassen sich im Rahmen der Sommerfeld-Entwicklung wieder leicht berechnen, und wir finden für den Peltier-Koeffizienten * + d ln Tn (ε) Π(T ) = T · 2L0 dε n
(15.26) ε=μ
und für den thermischen Leitwert L(T ) = T · 2L0
Tn (μ) ,
(15.27)
n
wobei der Vorfaktor 2 wieder die Spin-Entartung widerspiegelt. Die Größe L0 ist das Entropie-Leitwertquantum L0 =
2 π 2 kB = 0.9456 pW/K2 . 3 h
(15.28)
In ballistischen Quantendrähten ist also der Entropieleitwert L =
L T
in Einheiten von L0 quantisiert. Verglichen mit dem elektrischen Leitwertquantum ist die spezifische Ladung e2 durch (πkB )2 /3 ausgetauscht. Das Verhältnis des Entropie-Leitwertquantums und des elektrischen Leitwertquantums 2 2 L0 =
L0 π = G0 3
kB e
= 24.4 nW Ω/K2
ist die bereits aus der Gleichung 14.66 bekannte Lorenz-Zahl (Abschnitt 14.4.4). Die Gültigkeit der Kelvin-Relation Π = T ·S
wird im Rahmen des Modells auch hier wieder durch die Maxwell-Relation Gl. 14.64 sichergestellt. Insgesamt erkennen wir eine verblüffende Ähnlichkeit zwischen der in Kapitel 14 dargestellten, üblicherweise als „klassisch“ eingestuften Transporttheorie und dem in diesem Abschnitt dargestellten „Quanten“-Transport. Der Unterschied zwischen Fermionen und Bosonen tritt nicht nur in den statischen, sondern auch in den Transporteigenschaften makroskopischer Festkörper zutage. Das Konzept der elementaren Fermi- und Bose-Systeme erlaubt außerdem, den Effekt reduzierter Dimensionen • durch die Dimensionalität der Mannigfaltigkeit der elementaren Fermi-Systeme zu berücksichtigen und außerdem • den ballistischen Grenzfall L Λin , Λel zu behandeln.
15.3 Quasi-eindimensionale Leiter |
607
Dies bestätigt die in diesem Buch vertretene These, dass die gesamte Thermodynamik makroskopischer Körper und genauso deren Transport-Eigenschaften genuin quantenmechanischer Natur sind. Nur dann kann der fundamentale Unterschied zwischen Fermi- und Bose-Systemen angemessen berücksichtigt werden. Die Einteilung in „(semi)-klassischen“ und „Quanten“-Transport ist von diesem Standpunkt aus mehr den etablierten Vorstellungen und Lehrgewohnheiten als der Sache geschuldet.
15.3.3 Phononen in reduzierten Dimensionen Die im vorangegangen Abschnitt dargestellten ballistischen Transportphänomene basieren vor allem auf der Welleneigenschaften der Elektronen. Analoge Phänomene sollten also auch in Bose-Systemen existieren. Als Musterbeispiele sind Photonen in der Mikrowellenphysik und -technik zu nennen, bei denen Koaxialkabel und Wellenleiter das genaue Analogon zu den ballistischen Quantendrähten darstellen. In diesem Abschnitt wollen wir eine andere Klasse von Bose-Systemen betrachten, nämlich Phononen in reduzierten Dimensionen. Nachdem die Phononen elektrisch neutral und die Phononenzahlen wegen μ = 0 nicht erhalten sind, sondern durch die lokale Temperatur kontrolliert werden, bleibt als wesentliche Transportgröße die Entropie (und natürlich die Energie). Für einen bosonischen Wellenleiter mit einer perfekt transmittierten Mode mit T = 1 erhalten wir im linearen Transportregime in Analogie zu Gl. 15.23: ∞ (B) ε 1 ε ∂Nε (T ) IS = dε · (15.29) · − ΔT . 2π T ∂ε T 0
Der Entropieleitwert L(T ) ergibt sich dann durch Division durch ΔT : L(T ) =
IS 1 = − ΔT 2π
∞ dε
ε 2 ∂N (B) (T ) ε ·
T
∂ε
.
(15.30)
0
Dieses Integral lösen wir durch partielles Integrieren 1 L(T ) = 2π
∞ dε
2ε (B) · Nε (T ) . T2
(15.31)
0
Wenn wir x = ε/kB T substituieren, sehen wir, dass das Ergebnis für einen einzelnen perfekt transmittierten Kanal T -unabhängig ist, und finden L(T ) = L0 =
2 kB π
∞ 0
2 π 2 kB x dx = . exp(x) − 1 3 h
(15.32)
Γ(1)ζ(2) = π 2 /6
Im letzten Schritt haben wir die Formel Gl. C.9 für die Bose-Integrale benutzt. Im bosonischen Fall ergibt sich also dasselbe Entropie-Leitwertquantum wie in Gl. 15.28 im
608 | 15 Quasiteilchen in reduzierten Dimensionen fermionischen Fall! Der entsprechende thermische Leitwert L(T ) ergibt sich einfach durch Multiplikation mit T . Für Transmissionen T < 1 und mehrere transmittierte Kanäle gilt ein zu Gl. 15.28 analoger Ausdruck. Wir werden zwei Experimente zum ballistischen Wärmetransport in reduzierten Dimensionen vorstellen. Zur Realisierung solcher Experimente ist es notwendig akustische Wellenleiter herzustellen, deren transversale Dimensionen kleiner als die oder zumindest vergleichbar mit der freien Weglänge der thermisch angeregten Phononen sind. Als Materialien bieten sich insbesondere solche mit einer hohen DebyeTemperatur an, bei denen bei tiefen Temperaturen nur noch langwellige Phononen vorhanden sind. Wie bei den elektronischen Wellenleitern ist es entscheidend, dass die Engstelle der Stege zu einer Diskretisierung der transversalen Phononenmoden führt. Das erste Experiment betrifft die Messung des thermischen Leitwertquantums von vier dünnen Stegen aus Siliziumnitrid (SiNx ). Es wurde im Jahr 2000 von Schwab et al. in Stanford, Kalifornien durchgeführt [54]. Dazu wurde eine 60 nm dicke und etwa 4 μm × 4 μm große, frei tragende Plattform aus SiNx aus einer größeren Fläche herausgeätzt, so dass sie nur durch 4 etwa 2 μm und an der engsten Stelle etwa 200 nm breite Stege mit der Außenwelt verbunden ist. Jeder Steg transmittiert bei tiefen Temperaturen nur noch vier Phononen-Moden (eine longitudinalen, zwei transversale und eine Torsions-Mode). Auf der Membran wurden zwei elektrische Heizer aus Gold/Chrom strukturiert, die mit Zuleitungen aus supraleitendem Niob elektrisch kontaktiert wurden. Die Zuleitungen mussten supraleitend sein, um einerseits nicht die Stege zu heizen und andererseits keinen parasitäres Wärmeleck an die Umgebung zu schaffen. Dabei wurde die mit der Temperatur exponentiell verschwindende Wärmeleitfähigkeit von Supraleitern ausgenutzt (Diskussion am Ende von Abschnitt 14.6.3). Mit Hilfe einer externen Stromquelle wurde der Plattform über einen der beiden Heizer eine definierte Heizleistung zugeführt und die resultierende Temperaturerhöhung über das thermische Spannungsrauschen des anderen Heizers gemessen. Das Verhältnis von Heizleistung und Temperaturerhöhung liefert den thermischen Leitwert L. Die gemessene Rauschamplitude beträgt (δV )2 = 4kB T R Δf , wobei R der elektrische Widerstand und Δf die Bandbreite der Detektion ist. Die tiefste erreichbare Temperatur betrug etwa 80 mK. Bei einer Bad-Temperatur von 450 mK genügte eine Heizleistung von 300 fW, um die Temperatur der Plattform auf etwa 500 mK zu erhöhen. Insgesamt handelt es sich bei dieser Messung um eine experimentelle Meisterleistung, weil sie sehr komplexe hybride Nanostrukturen mit höchster MessEmpfindlichkeit miteinander verbindet. So produziert ein Ohm’scher Widerstand mit 50 Ω bei einer Temperatur von 1 K in einem Frequenzintervall von Δf = 40 GHz eine thermische Strahlungsleistung von etwa 2.2 pW. Wenn diese Strahlungsleistung nicht effektiv herausgefiltert wird, kann die Temperatur der Plattform kaum unter 1 K sinken. Das zweite Experiment wurde bei viel höheren Temperaturen von Hansen und Mitarbeitern 2012 in Hamburg durchgeführt. Es beruht auf einem Verfahren zur Her-
15.3 Quasi-eindimensionale Leiter |
a)
100
L (16 L 0)
b)
2+m
609
10
1
0.1
0.1
T (K)
1
Abb. 15.8. a) Raster-Elektronenmikroskopische Aufnahme einer Probe zur Messung der thermischen Leitwertquantums. Die Breite der Stege beträgt an der engsten Stelle etwa 200 nm, vergleichbar mit der Phononen-Wellenlänge bei 1 K. b) Gemessener Entropieleitwert L(T ). Der Sättigungswert bei tiefen Temperaturen entspricht der theoretischen Erwartung für 16 Phononen-Kanälen. Die Linie entspricht einer T 2 -Abhängigkeit, die für einen dreidimensionalen Festkörper erwartet wird, dessen phononische freie Weglänge T -unabhängig ist (nach [54]).
stellung von Luftspalt-Heterostrukturen auf der Basis von GaAs/AlAs. Dazu wurde ein GaAs-Kristall zunächst mit einem 4 und 6 nm dicken AlAs Film überzogen. Dann wurde dieser Film in-situ mit Gallium bedampft, welches sich auf der AlAs-Oberfläche in Form von kleinen Tropfen niederschlägt. Die flüssigen Ga-Tropfen ätzen kleine Löcher in die Oberfläche, die tiefer als der AlAs Film sind. Wird dann der As-Partialdruck in der Kammer erhöht, so werden die Löcher mit GaAs aufgefüllt und eine 50 nm dicke Deckschicht gewachsen. Weil alle diese Schritte bei hohen Temperaturen im Ultra-Hochvakuum ablaufen, bildet sich eine Struktur mit sehr guter Kristallqualität. Schließlich wird der AlAs-Film selektiv mit einem flüssigen Ätzmittel entfernt. Auf diese Weise steht der obere GaAs Film auf Nanosäulen mit 4 nm–6 nm Höhe und etwa 100 nm Durchmesser. Die entstandene Struktur ist in Abb. 15.9b skizziert. Der Entropie-Transport durch Phonon-Transmission von der GaAs-Deckschicht in den Kristall erfolgt also durch die Effusion von Phononen durch die Nanosäulen – ganz analog zur Effusion von Atomen durch feine Poren (Abschnitt 8.7) und von Photonen oder Elektronen, wie wir das in den Abschnitten 13.1.3 und 15.2.2 bereits gesehen haben. Zwischen den Nanosäulen unterdrückt der durch das Ätzen entstandene Luftspalt extrem effektiv die Phononen-Transmission: Wie aus Abb. 15.9a hervorgeht, ist der thermische Leitwert von Proben mit Nanosäulen um mehrere Größenordnungen geringer als der eines massiven GaAs Kristalls. Die einfachste Beschreibung dieses Phänomens greift auf das phononische Analogon des Sharvin-Widerstands in Abschnitt 15.2.2 zurück: Danach würden wir den
610 | 15 Quasiteilchen in reduzierten Dimensionen
a)
10000
b) (+W / K)
2
100
massives GaAs 4 nm Nanosäulen 6 nm Nanosäulen
10
Säule
(W / K)
1000
1
1
0.1 0.01
IE, IS
0 20
50
100 T (K)
300
0
100
200 T (K)
300
Abb. 15.9. a) Vergleich der thermischen Leitwerte L von zwei Luftspalt-Heterostrukturen mit Säulenhöhen von 4 und 6 nm [Skizze in b)] mit einem massiven GaAs-Kristall in doppelt-logarithmischer Auftragung. Der thermische Leitwert wird durch den Luftspalt um Größenordnungen unterdrückt. b) Gemessener thermischer Leitwert pro Nanosäule für dieselben Proben. Die Linie entspricht einer Anpassung von Gl. 15.33, wobei aus dem Fit eine Dichte der Nanosäulen von 4 μm2 –6 μm2 abgeschätzt wurde. Die Skizze zeigt die Geometrie der Anordnung (nach [55]).
Entropiestrom durch den Kontakt im Rahmen des Debye-Modells gemäß IS = A
cs ∂s(T, μ) cs cv (T ) · ΔT = A ΔT 4 ∂T 4 T
berechnen, wobei cs = const. die effektive Schallgeschwindigkeit ist. Die thermische Variante des Sharvin-Leitwert eines Punktkontakts beträgt: T · LPC = A ·
cs cv (T ) . 4
(15.33)
Tatsächlich ähneln die in Abb. 15.9b dargestellten Messergebnisse qualitativ dem Verlauf der Wärmekapazität im Debye-Modell. Quantitativ ergibt sich eine bessere Übereinstimmung, wenn die Schallgeschwindigkeit (Abb. 13.4a) nicht wie in Gl.15.33 als konstant angenommen, sondern deren Energieabhängigkeit berücksichtigt wird. Dann ergibt sich für den entsprechenden thermischen Leitwert 3 (B) ε2 (q) ∂Nε (T ) A 3 T · LPC (T ) = d q c cos(θ) , q,p kB T ∂ε (2π)3 ∞
(15.34)
p=1 0
wobei θ der Winkel zwischen q und der Flächennormalen ist und p die longitudinalen und transversalen akustischen Phononenzweige nummeriert. Wird für die Dispersionsrelation ε(q) ∝ | sin(qa)| angenommen, so ergibt die durchgezogene Linie in Abb. 15.9b eine gute Übereinstimmung mit den Messdaten. Diese Ergebnisse sind von hoher praktischer Bedeutung für die Entwicklung neuartiger Thermoelektrika, weil sich hier die Möglichkeit bietet, die Wärmeleitfähigkeit des Kristallgitters weitgehend zu unterdrücken. Diese stellte bisher einen begrenzenden Faktor für den Wirkungsgrad konventioneller Thermoelektrika (Gl.8.66) dar.
15.3 Quasi-eindimensionale Leiter |
611
15.3.4 Diffusive Quantendrähte Quanten-Punktkontakte aus den klassischen Metallen wie Gold oder Kupfer, bei denen die Fermi-Wellenlänge von der Größenordnung des Atomabstands ist, lassen sich ebenfalls experimentell herstellen, allerdings nicht allein mit lithographischen Techniken. Um Punktkontakte auf der atomaren Skala herzustellen, die nur wenige Transportkanäle besitzen, haben sich die Techniken der Rastersonden-Mikroskopie und der mechanisch kontrollierten Bruchkontakte [56] bewährt und eine Vielzahl neuer Phänomene offenbart. In diesem Abschnitt wollen wir uns dem Thema aber von der anderen, mehr makroskopischen Seite her nähern. Dazu betrachten wir polykristalline metallische Drähte mit einer Querschnittsfläche von 20 × 50 nm2 und einer Länge von L 1 μm. Die elastische freie Weglänge in einem polykristallinen Metallfilm ist in der Regel von der Größenordnung der Schichtdicke, das heißt 10 nm–30 nm L. Der Transport im Draht ist daher diffusiv, wobei die Diffusionskonstante typischerweise D 10 cm2 /s– 100 cm2 /s beträgt. Der Widerstand des Drahtes ist meist von der Größenordnung 10 Ω. Was solche Drähte interessant macht, ist die Tatsache, dass die inelastische freie Weglänge der Elektronen unterhalb von T 1 K größer als 1 μm wird und bei sehr tiefen Temperaturen auf mehrere 10 μm anwachsen kann. Damit kann die Bedingung des lokalen Gleichgewichts verletzt werden, die wir in Abschnitt 14.4.1 als Voraussetzung für die Gültigkeit des Drift-Diffusions-Modells diskutiert haben. Die Leitfähigkeit eines solchen diffusiven Drahtes sollte also wie im vorangegangenen Abschnitt ebenfalls als quantenmechanisches Streuproblem aufgefasst werden. Dies ist im Prinzip auch möglich, da die den Widerstand bestimmende Verteilung von statischen Gitterdefekten als statisches Potenzial in die Schrödinger-Gleichung eingeht und die Phasenkohärenz nicht stört. Auch für dieses Potenzial lassen sich die Streuzustände und die entsprechenden Transmissionwahrscheinlichkeiten berechnen. Allerdings führt die große Zahl ( 200 000) von interferierenden Transportkanälen dazu, dass die daraus resultierenden Quanten-Korrekturen [48] zur DrudeLeitfähigkeit nur klein, nämlich von der Größenordnung G0 sind. Wegen der hohen Hintergrund-Leitfähigkeit von 200 000 G0 sind dies also Beiträge von der Größenordnung 10−5 , die nicht leicht zu messen sind. Dennoch spiegeln diese kleinen Effekte eine Reihe der fundamentalen Aussagen der Quantenphysik wider, zum Beispiel den berühmten Aharonov-Bohm-Effekt, der auf die Empfindlichkeit der quantenmechanischen Phase auf ein externes Magnetfeld zurückzuführen ist.12 Aus der Perspektive der Thermodynamik ist insbesondere die Frage interessant, was geschieht, wenn das chemische Gleichgewicht zwischen den elementaren FermiSystemen stark gestört wird, und wie dieses Gleichgewicht wiederhergestellt wird. Bei hohen Temperaturen wissen wir, dass die Elektron-Phonon-Streuung den dominie-
12 Für eine Einführung siehe zum Beispiel [48].
612 | 15 Quasiteilchen in reduzierten Dimensionen −1 renden Beitrag zur inelastischen Streurate τin liefert. Unterhalb von einigen K stirbt dieser Beitrag jedoch sehr schnell aus, so dass im wesentlichen die Elektron-ElektronStreuung verbleibt. Wegen der hohen Elektronendichte und der deshalb effektiven Abschirmung des Wechselwirkungs-Potenzials zwischen den Elektronen ist außer den Fermi-Flüssigkeitskorrekturen nicht viel über diese Wechselwirkung bekannt, weil sie sich in den üblichen Metallen kaum manifestiert.13 Diffusive Quantendrähte bieten eine Möglichkeit, diese Frage experimentell anzugehen, und zwar über die Abweichungen δNε der Verteilungsfunktion Nε von der (F) Fermi-Funktion Nε , wie sie sich aus dem Wechselspiel zwischen der Injektion von Quasiteilchen aus den Reservoiren und der Relaxation durch Elektron-ElektronStreuung ergeben. Im Gegensatz zu der in Abschnitt 14.4.1 diskutierten Situation des (F ) lokalen Gleichgewichts (δNε Nε ) lassen sich wegen der schwachen ElektronPhonon-Kopplung extreme Nichtgleichgewichts-Zustände erzeugen, die in makroskopischen Proben nicht realisierbar sind. Die entsprechenden starken Abweichungen von der Fermi-Funktion lassen sich durch Messungen des Stromrauschens, aber auch durch direkte Messung der Verteilungsfunktion experimentell untersuchen. Bevor wir auf diese Experimente eingehen, wollen wir uns überlegen, welche Art von Nichtgleichgewichtsverteilung wir erwarten. Dazu nutzen wir aus, dass wir folgende Verhältnisse der charakteristischen Längenskalen Λin (inelastische Streulänge) und Λel (elastische Streulänge) zur Drahtlänge L haben:
Λin /L 1 Λel /L .
Um ein qualitatives Verständnis zu gewinnen, nehmen wir zunächst an, dass wir die Elektron-Elektron-Streuung ganz vernachlässigen können. Der diffusive Quantendraht befindet sich wie im ballistischen Fall zwischen zwei Reservoiren mit den elektrochemischen Potenzialen μ ¯L und μ ¯R < μ ¯L . In der Sprechweise der klassischen Mechanik würden wir sagen, dass Quasiteil(F) chen aus dem linken Reservoir mit dem höheren elektrochemischen Potenzial Nε,L in den Draht injiziert werden und dort mit einer konstanten Energie ε diffundieren, bis sie entweder das rechte Reservoir erreichen und dort ihre Überschuss-Energie von qˆU durch inelastische Streuung relaxieren, oder bis sie auf einem anderen Diffusionspfad in das linke Reservoir zurückfinden. Wir sollten uns jedoch bewusst machen, dass Quasiteilchen mit derselben Energie nicht unterscheidbar sind. Daher haben auf verschiedenen Diffusionspfaden verfolgbare Individuen keine physikalische Relevanz, sondern nur die Diffusionspfade selbst.14 Um solche gelegentlich irreführenden Vorstellungen zu vermeiden, können wir den Draht, entsprechend unseren Betrachtun-
13 In hochkorrelierten Systemen, wie den Kuprat-Supraleitern oder den Schwer-Fermion-Systemen, ist dies anders. 14 Die stationären Superpositionen der Wellenfunktionen entlang der Diffusionspfade (das heißt, diejenigen, die Lösung der zeitunabhängigen Schrödinger-Gleichung sind) entsprechend den quantenmechanischen Streuzuständen, deren Transmissions-Wahrscheinlichkeiten in Gl. 15.20 eingehen
15.3 Quasi-eindimensionale Leiter |
613
gen in Abschnitt 14.4, in kleine Segmente einteilen, die sich in ihrer Position x entlang des Drahtes unterscheiden und zwischen denen Quasiteilchen ausgetauscht werden. Die elastischen Streuprozesse bewirken eine weitgehende Gleichverteilung der verschiedenen Impulsrichtungen k bei festem |k|. Wir können also sagen, dass sich die elementaren Fermi-Systeme mit gleicher Energie ε im lokalen elektrochemischen Gleichgewicht befinden, in dem Sinne, dass der für den Transportstrom verantwortliche richtungsabhängige Beitrag δNk zur Verteilungsfunktion Nk (x) = Nε + δNk (x) viel kleiner als der isotrope Beitrag Nε ist. Dagegen befinden sich elementare FermiSysteme mit verschiedener Energie nicht im elektrochemischen Gleichgewicht, weil ein solches nur durch inelastische Stöße hergestellt werden könnte. Je näher das betrachtete Drahtsegment am linken (rechten) Reservoir liegt, desto größer ist die Wahrscheinlichkeit, dass die darin enthaltenen Quasiteilchen aus dem linken (rechten) Reservoir stammen. Entsprechend wird der isotrope Anteil der Verteilungsfunktion Nε (x) mehr die Fermi-Funktion des linken oder mehr die des rechten Reservoirs widerspiegeln. Um die Verteilungsfunktionen für die verschiedenen Segmente des Drahtes quantitativ zu bestimmen, lösen wir die gewöhnliche eindimensionale Diffusionsgleichung ∂Nε (x) ∂ 2 Nε (x) ! =0 =D ∂t ∂x2
(15.35)
für den stationären Zustand unter den Randbedingungen (F)
Nε (0) = Nε
(TL , μ ¯L )
und
(F)
Nε (L) = Nε
(TR , μ ¯R ) .
Zweimaliges Integrieren liefert die Lösung Nε (x) = a + bx, wobei die Integrationskonstanten a und b an die Randbedingungen angepasst werden müssen. Dann erhalten wir (F) (F) Nε (x) = Nε,R · x + Nε,L · (1 − x) . (15.36) Die Nichtgleichgewichts-Verteilungsfunktion ist im Gegensatz zur Fermi-Funktion also eine Zwei-Stufenfunktion, das heißt eine Superposition der Fermi-Funktionen der Reservoire, wobei das Gewicht des Reservoirs, welches näher am Punkt x liegt, überwiegt. Die Schärfe der Stufen ist in dieser Näherung nur durch die Temperaturen der Reservoire gegeben. Lassen wir nun inelastische Streuprozesse zu, so bedeutet dies, dass ein Teilchenaustausch zwischen elementaren Fermi-Systemen mit verschiedenen Energien möglich ist, den wir nach unserer Diskussion in Abschnitt 10.1 gleichermaßen als einen quantenmechanischen Übergang mit der Streurate Γεε oder als eine chemische Reaktion mit der Reaktionsrate Γεε ansehen können. Für eine quantitative Behandlung
und den Widerstand bestimmen. Es ist die Quanteninterferenz zwischen den Diffusionspfaden, welche für die Quantenkorrekturen zur Leitfähigkeit verantwortlich ist.
614 | 15 Quasiteilchen in reduzierten Dimensionen müssen wir die Kontinuitätsgleichung (Gl. 1.44) und entsprechend die Diffusionsgleichung ∂Nε (x) ∂ 2 Nε (x) ! + ΣNε = 0 =D ∂t ∂x2
um den Quellterm
ΣN ε = =
,
(15.37)
dε Γεε Nε 1 − Nε − Γε ε 1 − Nε Nε
,
dε Γεε Nε − Nε
-
(15.38) (15.39)
erweitern, wobei Γεε = Γε ε ist. Der erste Term in Gl. 15.38 beschreibt den Abfluss von Teilchen aus dem elementaren Fermi-System Sε mit der Energie ε in die übrigen Systeme Sε mit der Energie ε hinein, der zweite Term den Zufluss von Teilchen aus den Systemen Sε in Seε hinein. In beiden Fällen geht nicht nur die Verteilungsfunktion des betrachteten Systems Seε , sondern auch die der übrigen Systeme Sε ein. Eine einfache Relaxationszeitnäherung für den Quellterm wie den Stoßterm in Gl. H.2 erweist sich in diesem Fall als nicht ausreichend. Der Effekt der inelastischen Streuung besteht darin, die Stufen der Verteilungsfunktion noch über die thermische Verschmierung in den Reservoiren hinaus zu verbreitern. Im Grenzfall starker Elektron-Elektron-Streuung ergibt sich wieder eine Fermi-Funktion mit einer erhöhten lokalen Temperatur. Falls auch noch starke Elektron-Phonon-Streuung dazu kommt, wird diese Erhöhung dadurch reduziert, dass Energie aus dem Elektronen-System in das Phononen-System abfließt. Für den Grenzfall starker Elektron-Elektron-Streuung können wir die Verteilungsfunktion auch direkt lösen, indem wir die Wärmeleitungsgleichung für den Draht mit der Wärmeleitfähigkeit aus dem Wiedemann-Franz-Gesetz berechnen (Aufgabe 14.10). Es ergibt sich ein quadratisches Temperaturprofil T (x) mit einem Maximum in der Mitte des Drahtes. Nachdem der elektrische Widerstand des Drahtes nur durch die elastische Streuzeit bestimmt ist, scheidet dieser für einen experimentellen Nachweis dieser Phänomene aus. Wir brauchen eine Messgröße, welche auch von der Breite der Verteilungsfunktion abhängig ist. Eine solche Größe kennen wir bereits aus Gl. 12.21, nämlich das über die Länge des Drahtes gemittelte elektrische Spannungsrauschen, welches durch die statistischen Schwankungen der Teilchenzahlen in den elementaren FermiSystemen verursacht und durch 4R SV (f = 0) = L
L
∞
0
*
+
dε Nε (x) 1 − Nε (x)
dx
(15.40)
0
gegeben ist (siehe z.B. [58]). Setzen wir das Resultat für Nε aus Gl. 15.36 in Gl. 15.40 ein, so erhalten wir für T → 0 das universelle Resultat SV (f = 0) =
1 1 qˆR · U = qˆR2 · I , 3 3
(15.41)
15.3 Quasi-eindimensionale Leiter |
b) Cu Au
Draht
c)
SI [(pA)2s]
a)
615
2 +m
I (+A)
Abb. 15.10. a) Rasterelektronenmikroskopische Aufnahme eines diffusiven Quantendrahts zwischen zwei metallischen Reservoiren mit großem thermischen Leitwert. Der Au-Draht ist etwa 100 nm breit und 15 nm dick. In der Reservoiren beträgt die Schichtdicke 200 nm (1 μm) bei einem Verhältnis R/R = 280 (3350) von Drahtwiderstand und dem Quadratwiderstand R der Reservoire. b) und c) Gemessene spektrale Dichte SI des Rauschens als Funktion des Stroms. Die durchgezogenen Linien entsprechen den Gleichungen 15.40 (schwarz) und 15.41 (rot).
während wir für starke Elektron-Elektron-Streuung das ebenso universelle Resultat √ 3 2 SV (f = 0) = (15.42) qˆR · I 4 √ bekommen. Die universellen Vorfaktoren 1/3 und 3/4 in Gln. 15.41 und 15.42 nennt
man auch Fano-Faktoren. Der Unterschied zwischen beiden Ergebnissen beträgt nur etwa 30 %. Aufgrund der sehr kleinen Rauschspannungen ΔU < 1 nV stellt dies erhebliche Anforderungen an das Experiment. Entscheidend für die experimentelle Beobachtung ist außerdem, dass die Kontakte eine sehr gute Wärmeleitfähigkeit aufweisen, um zu vermeiden, dass bereits in den Zuleitungen eine durch den Strom induzierte lokale Erhöhung der Elektronen-Temperatur auftritt. Dies kann dadurch erreicht werden, dass das Verhältnis zwischen dem Widerstand R des Drahtes und dem QuadratWiderstand R = ρ · t der Zuleitungen möglichst groß gewählt wird, wobei ρ der spezifische Widerstand und t die Filmdicke ist.15 Eine geeignet strukturierte Probe ist in Abb. 15.10a gezeigt: Es handelt sich um eine Serienschaltung aus 12 Gold-Drähten, die mit sehr dicken Reservoiren kontaktiert sind, um eine gute Ableitung der durch den Stromfluss produzierten Joule’schen Wärme zu gewährleisten. Ein großes Volumen dieser Kontakte ist wichtig, weil die Elektron-Phonon-Kopplung, über die die Wärme schließlich an das Substrat abgeleitet wird, bei tiefen Temperaturen wie bereits erwähnt extrem schwach wird. Die Spannungs-Fluktuationen über der Probe wurden mit einem Paar von Vorverstärkern
15 R ist der spezifische Widerstand in zwei Dimensionen: Bei einer rechteckigen Probe mit der Länge L und der Breite W ist er ist unabhängig vom Verhältnis L/W : R = R · W/L = ρ · t.
616 | 15 Quasiteilchen in reduzierten Dimensionen
N¡
¡
Abb. 15.11. Schematische Darstellung der Probengeometrie zur Messung der elektronischen Verteilungsfunktion in diffusiven Drähten mittels Tunnelspektroskopie. An einen Draht der Länge L wird die Spannung U angelegt und der differenzielle Leitwert der in der Mitte angebrachten Tunnelkontakts als Funktion der Spannung V gemessen. Links neben dem Tunnelkontakt sind die nach Gl. 15.36 in den Grenzfällen Λin /L 1 und Λin /L 1 erwarteten Verläufe der Verteilungsfunktion Nε skizziert (nach [59]).
gemessen, deren Eigenrauschen durch eine Kreuz-Korrelationstechnik unterdrückt wurde, um das extrem kleine, durch den Strom durch die Probe erzeugte Rauschsignal detektieren zu können. Abb. 15.10b zeigt Messdaten für verschiedene Werte von R/R – erst bei sehr großen Werten R/R 3300 ist der thermische Leitwert der Reservoire ausreichend, um den universellen Vorfaktor 1/3 in Gl. 15.41 nachweisen zu können. Die Probengeometrie für ein weiteres, noch direkteres Experiment zur Messung der Verteilungsfunktion ist in Abb. 15.11 skizziert: Wieder handelt es sich um einen nanostrukturierten Metall-Draht aus Kupfer zwischen zwei dicken Reservoiren, aber in diesem Fall gibt es noch einen weiteren Kontakt aus Aluminium, der über eine dünnen Aluminiumoxid-Schicht mit dem Kupfer verbunden ist. Die Aluminiumoxid-Schicht bildet einen Tunnelkontakt zwischen dem Kupfer und dem Aluminium. Wegen des hohen Widerstands der Tunnelbarriere ist es möglich, zwischen dem Kupfer und dem Aluminium Spannungen V im mV-Bereich anzulegen. Der Tunnelstrom ist durch die Zustandsdichten und die Verteilungsfunktionen auf beiden Seiten und die sehr kleine Tunnelwahrscheinlichkeit der Elektronen durch das Oxid gemäß (F) I(V ) = GT dε Nε,Cu h(ε − eV )Nε−eV,Al (15.43) gegeben. Dabei ist GT der Tunnelwiderstand für T > TC und enthält die Zustandsdichten gF (εF ) beider Metalle an der Fermi-Kante. Die Gewichtsfunktion h(ε) =
gAl (ε) ε = √ g F,Al ε2 − Δ2
(15.44)
15.3 Quasi-eindimensionale Leiter |
617
1
Nε
dI / dV (mS)
L = 1.5 μm
L = 5 μm
0.2 0.1 0.0 -0.5
0
0.0
0.5
V (mV)
-0.3
-0.2
-0.1
0.0
0.1
-0.3
-0.2
0.0
-0.1
0.1
ε (meV)
ε (meV)
Abb. 15.12. Durch Entfaltung der Rohdaten und der BCS-Zustandsdichte des Al-Tunnelkontaktes gewonnene Verteilungsfunktionen zweier diffusiver Cu-Drähte mit L = 1.5 μm und 5 μm Länge für die Spannungen U = 0.2, 0.1 und 0 mV. Im Feld links ist gepunktet die für U = 0.2 mV und Λin /L 1 bei der Messtemperatur T = 25 mK erwartete Verteilungsfunktion eingezeichnet. Einsatz links: differenzieller Widerstand dGT (V )/dV des mittleren Tunnelkontakts bei U = 0.2 mV (nach [59]).
ist die normierte BCS-Zustandsdichte des supraleitenden Aluminiums (Gl. 14.116). Der differenzielle Leitwert hat also die Form GT (V ) =
∂I(V ) ∂V
(15.45)
˜ (0) gR (0) = qˆAT
⎛ dε gL (ε) ⎝−
⎞
(F)
∂Nε,R (¯ μL + qˆV ) ∂V
⎠ .
Entscheidend ist, dass h(ε) eine von der BCS-Singularität herrührende scharfe Spitze bei ε = ±Δ aufweist, die im Einsatz von Fig. 15.12 links zu sehen ist. Das Integral in Gl 15.43 stellt eine Faltung16 zwischen der Fermi-Funktion Nε,Cu im Kupfer(F) (F) draht und der Funktion h(ε)Nε,Al dar, wobei Nε,Al die Verteilungsfunktion im Aluminium darstellt, welche einfach eine Fermi-Funktion ist. Aufgrund der scharfen Spitze in der Funktion h(ε − eV ), die durch die Spannung V verschoben werden kann, gewinnt das Faltungsintegral spektroskopische Information über die Verteilungsfunktion im Kupfer Nε,Cu an der Stelle des Tunnelkontakts, die durch Entfaltung direkt bestimmt werden kann. Legt man nun zusätzlich eine Spannung U zwischen den großen Reservoiren an, so lässt sich der Einfluss des durch U induzierten Nicht-Gleichgewichts im Draht auf die Verteilungsfunktion verfolgen. Das Ergebnis ist in Abb. 15.12 dargestellt. Für U = 0 ist Nε,Cu eine Fermi-Funktion, welche eine genaue Bestimmung der Elektronentemperatur im Kupferdraht erlaubt. Für U > kB T dagegen bildet sich tat-
16 Abschnitt 15.2.1 und die Fußnote auf Seite 594.
618 | 15 Quasiteilchen in reduzierten Dimensionen sächlich die erwartete doppelstufige Verteilung der Quasiteilchen gemäß Gl. 15.36 und Abb. 15.11. Unter Berücksichtigung das Quellterms in Gl. 15.37 lässt sich Nε,Cu (x) numerisch berechnen. Nach der Fermi-Flüssigkeits-Theorie wird Γεε ∝ (ε − ε )2 erwartet (Abschnitt 14.3.1). Im Gegensatz dazu wurde für die Elektron-Elektron-Wechselwirkung in diffusiven Metallen eine durch die elastische Streuung an Störstellen stark erhöhte Wechselwirkung mit Γεε ∝ (ε − ε )−2/3 vorhergesagt. Die Verteilungsfunktionen lassen sich für beide Modelle berechnen, mit der Theorie vergleichen und erlauben damit einen quantitativen Test der Theorie der Elektron-Elektron-Wechselwirkung in diffusiven Leitern. Dabei wurde die Energieabhängigkeit der Wechselwirkungsfunktion Γεε ∝ (ε − ε )−2/3 durch das Experiment glänzend bestätigt. Ein überraschendes weiteres Ergebnis dieser Experimente war die Entdeckung, dass magnetische Fremdatome die Relaxationsrate weiter stark erhöhen – dabei handelt es sich um eine weitere Konsequenz des in den Abschnitten 14.4.2 und 14.4.3 erwähnten Kondo-Effekts. Für weitere Einzelheiten müssen wir auf die OriginalLiteratur verweisen [59].
Übungsaufgaben 15.1. Zustandsdichte ein- und zweidimensionaler Elektronengase Berechnen Sie die Zustandsdichten für eine parabolische Dispersionsrelation ε(k) = ε0 +
(k)2 2m ˆ
a) in einer und in zwei Dimensionen, und skizzieren Sie die Resultate. b) Drücken Sie das Resultat für eine Dimension durch die dynamische Geschwindigkeit vk =
aus.
∂ε(k) ∂k
15.2. Zustandsgleichungen des zweidimensionalen Fermi-Gases Benutzen Sie das Ergebnis von Aufgabe 15.1a, um die Zustandsgleichungen eines zweidimensionalen Fermi-Gases mit einer quadratischen Dispersionsrelation herzuleiten. a) Geben Sie den Fermi-Wellenvektor kF als Funktion von n2d an. b) Berechnen Sie die thermische Zustandsgleichung n2d (T, μ), wobei A die Fläche des Systems ist. c) Wie lautet das chemische Potenzial μ(T, n2d )? Wie groß sind die FermiWellenlänge λF und die Fermi-Energie εF für ein zweidimensionales Elektronensystem in einer GaAs/AlGaAs-Heterostruktur bei einer typischen Teilchendichte von n2d = 2 · 1012 Teilchen/cm2 ?
15.3 Quasi-eindimensionale Leiter |
619
d) Wie lautet die kalorische Zustandsgleichung e(T, n2d )? Hinweis: Bedenken Sie, dass Sie einige Kapitel zuvor die Fermi-Funktion durch Ableiten eines großkanonischen Potenzials erhalten haben. 15.3. Elektronische Eigenschaften von Graphen Eine ein-atomare Schicht von Kohlenstoff in der Graphit-Modifikation bezeichnet man als Graphen. Dieses erst vor kurzem isolierte neuartige Material ist ein perfekt zweidimensionales Halb-Metall mit der linearen Dispersionsrelation ε(k) = ±vF k ,
wobei k = kx2 + ky2 und vF 8 · 106 m/s ist. a) Berechnen Sie die Zustandsdichte, die (zweidimensionale) Teilchendichte als Funktion von μ sowie μ(T, n2d ) und die Teilchenkapazität ν2d . b) Begründen Sie, warum μ(T, n2d = 0) ≡ 0, das heißt von T unabhängig ist! c) Berechnen Sie den elektronischen Beitrag zur Wärmekapazität. d) Bestimmen Sie die Kapazität eines Kondensators mit dem Plattenabstand d, dessen eine Platte durch eine Graphenschicht ersetzt wurde. Was unterscheidet diesen Kondensator von einem aus konventionellen Metallen? 15.4. Diffusiver Quantenpunktkontakt Nach dem Drude-Modell (Gl. 8.26) beträgt der Leitwert eines zweidimensionalen diffusiven Leiters mit der Länge L und der Breite W GD =
W n2d qˆ2 τ . L m ˆ
Innerhalb des Landauer-Büttiker-Modells (Gl. 15.20) lautet der entsprechende Ausdruck GLB =
qˆ2 MT , h
wobei M die Zahl der zum Transport beitragenden Kanäle und T die mittlere Transmissionwahrscheinlichkeit pro Mode ist. a) Geben Sie die Zahl M der Transportkanäle als Funktion von W/λF an. b) Bestimmen Sie die mittlere Transmissionwahrscheinlichkeit pro Kanal T durch den Vergleich von GD und GLB . Welche Bedingung muss erfüllt sein, damit sowohl die Drude- als auch die Landauer-Büttiker-Formel anwendbar sind?
A Differenzialrechnung im Rn Unter dem Differenzial einer Funktion f = f (x) einer rellen Veränderlichen x verstehen wir 1
df (x) dx , dx wobei df (x)/dx die Ableitung von f (x) nach x und dx eine im Prinzip beliebige, meist aber kleine Zahl ist. Das Differenzial df beschreibt (in linearer Näherung) die Änderung von f in der Nähe des Punktes x0 : df =
f (x0 + dx) − f (x0 ) = df + · · · =
df (x) dx . dx x 0
Die Ableitung f (x0 ) = df (x)/dx von f nach x gibt die Steigung der Funktion f (x) an der Stelle x0 an. Diese Sachverhalte lassen sich auf Funktionen mehrerer Veränderlicher übertragen. Die Ableitung einer skalaren Funktion ist kein Skalar, sondern der Vektor, dessen Komponenten durch die partiellen Ableitungen gegeben sind. Ist eine Funktion f = f (x, y) der beiden Variablen x, y gegeben, so wird deren Ableitung auch als der Gradient von f bezeichnet und lautet: ⎛ ⎞ ∂f (x, y) ⎜ ⎟ f (x, y) = ⎝ ∂f ∂x (x, y) ⎠ = grad f (x, y) ∂y
Bei der Ausführung einer partiellen Ableitung nach einer Variablen (zum Beispiel x) sind die übrigen Variablen als konstant anzusehen. Die Änderungen von f durch eine Änderung der unabhängigen Variablen werden in linearer Näherung durch das totale Differenzial df =
∂f ∂f dx + dy f (x0 + dx, y0 + dy) − f (x0 , y0 ) ∂x ∂y
gegeben; hierbei sind die partiellen Ableitungen jeweils an der Stelle (x0 , y0 ) zu nehmen. Die Funktion f (x, y) und ihr totales Differenzial ist in Abb. A.1 dargestellt. Der Gradient zeigt in Richtung des stärksten Anstiegs von f über der x, y -Ebene.
1 Wir benutzen hier eine in der Physik übliche Bezeichnungsweise, die in gewissem Sinne zweideutig ist: f bezeichnet sowohl den Funktionswert als auch die Rechenvorschrift, um f aus x und y zu erhalten. In mathematischen Texten wird diese Zweideutigkeit durch eine Definition der Art f = g(x) vermieden.
A Differenzialrechnung im Rn
621
f
f
df(x,y) dy df(x,y) dx
df
df(x,y) dy dy
P
P
x
df(x,y) dx dx
y dy
y (a)
|
dx
(b)
x
Abb. A.1. a) Die graue Fläche stellt die Funktion f (x, y) über der {x, y}-Ebene dar. Die partiellen Ableitungen geben die Steigungen in x- und y-Richtung an. b) Das totale Differenzial stellt die Summe der Änderungen von f (x, y) in den beiden Raumrichtungen dar.
Zwischen den partiellen Ableitungen zweier Funktionen f (x, y) und z(x, y) bestehen eine Reihe von nützlichen Beziehungen, die in der Thermodynamik oft verwendet werden: ∂f (x, y) ∂f (x, z) ∂z(x, y) (Kettenregel) = · ∂y ∂z ∂y ∂f (x, y) ∂f (x, z) ∂f (x, z) ∂z(x, y) = + · ∂x ∂x ∂z ∂x ∂f (x, y) ∂f (x, y) ∂y(x, f ) =− · ∂x ∂y ∂x ∂f (x, y) 1 = ∂y(x, f ) ∂y ∂f
(A.1) (A.2) (A.3) (A.4)
B Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten Wahrscheinlichkeiten: Messreihen werden in der Physik dadurch gebildet, dass eine gewisse Einzelmessung unter identischen Bedingungen vielfach wiederholt wird. In vielen Fällen resultiert dabei nicht immer derselbe Messwert, sondern die Messwerte zeigen eine gewisse statistische Streuung. Dabei ist charakteristisch, dass das Resultat der nächsten Einzelmessung (in der Wahrscheinlichkeitsrechnung spricht man auch von einem Ereignis) nicht mit Sicherheit, sondern nur mit einer gewissen Wahrscheinlichkeit vorhergesagt werden kann. Enthält eine Messreihe für eine Größe X n Einzelmessungen (Ereignisse), von bei denen ni -mal das Resultat xi auftritt, definiert die relative Häufigkeit wi :=
ni >0 n
die Wahrscheinlichkeit, mit welcher der Messwert xi unter den Einzelmessungen zu finden ist. Die Gesamtheit der Wahrscheinlichkeiten wi für alle möglichen Resultate xi der Einzelmessungen nennt man die Wahrscheinlichkeitsverteilung der xi . Bei einer endlichen und diskreten (quantisierten) Verteilung der xi können nur m verschiedene Werte xI auftreten. Die Definition der wi beinhaltet die Normierung m
(B.1)
wi = 1
i=1
der Wahrscheinlichkeitsverteilung. Die Wahrscheinlichkeiten wi bestimmen den Mittelwert m X := wi X i (B.2) i=1
und die quadratische Streuung 2 σX = ΔX
= (X − X )2
= X 2 − X
2
≥0
(B.3)
√ des Messgröße X . Die Streuung ΔX = σX wird auch die Unschärfe, die Varianz oder die Standardabweichung von X für eine gegebene Wahrscheinlichkeitsverteilung
genannt. Allgemein heißen Mittelwerte vom Typ r X
:=
wi (xi )r
(B.4)
i
die Momente der Verteilung. Allgemein ist der Mittelwert von Funktionen f (X) der Größe X durch f (X) = wi f (xi ) (B.5) i
B Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten
|
623
w(x) 0.4
2σ 0.2
0
-4
0
δx
4
x
Abb. B.1. Wahrscheinlichkeitsdichte w(x) einer Gauss-Verteilung mit x = σ = 1. Die Fläche unter der roten Kurve ist auf 1 normiert.
gegeben. Die Streuung ΔX der Resultate der Einzelmessungen kann zwei grundsätzlich verschiedene Ursachen haben: • Das Messergebnis hängt von experimentellen Parametern ab, welche während der Messung nicht perfekt konstant gehalten werden können und daher systematische oder statistische Schwankungen der Messwerte verursachen. Diese Schwankungen sind als Resultat der Imperfektion der Messung, das heißt als Folge einer unvollkommenen Kontrolle der Versuchsbedingungen anzusehen. Die Folge ist, dass die Resultate der Einzelmessungen mehr oder weniger dicht um den Mittelwert der Messreihe gruppiert sind. Eine Verbesserung des Experiments bewirkt eine Verringerung der Streuung ΔX . Im Rahmen der klassischen Physik sind alle statistischen Streuungen von Messwerten die Folge von Messfehlern, das heißt ein perfektes Experiment sollte die Streuung ΔX = 0 aufweisen. Auch wenn dies in der Praxis nicht erreichbar ist, weil jedes Messergebnis stets nur mit einer Genauigkeit von endlich vielen Stellen angegeben werden kann, gibt es kein prinzipielles Hindernis, ΔX mit fortschreitender Experimentierkunst immer weiter zu reduzieren. • Manche physikalische Größen sind echte Zufallsvariablen, deren Streuung grundsätzlich nicht unter einen gewissen, vom Zustand des untersuchten Systems abhängigen Wert gedrückt werden kann. Solche fundamentalen unteren Schranken für die Streuung von Messwerten nennt man Unschärfen und die zugehörigen Mittelwerte unscharf. Solche Zustände treten in der Quantenphysik und in der statistischen Thermodynamik auf. In der klassischen Physik bilden die als Resultat von Einzelmessungen auftretenden Werte xi der Größe X ein Kontinuum, das heißt die xi variieren stetig. In diesem Fall beträgt die Wahrscheinlichkeit, einen Messwert in einem infinitesimal kleinen x-Intervall dx zu finden, w(x) dx, wobei w(x) die Wahrscheinlichkeitsdichte heißt. Die Mittelwerte von X und X r sind dann nicht durch Summen, sondern durch die
624 | B Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten Integrale ∞ X =
dX w(X) · X ,
beziehungsweise
(B.6)
−∞ ∞
dx w(x) · f (x)
f (X) =
(B.7)
−∞
gegeben. Die Funktion w(x) wird auch die Verteilungsfunktion für die bei Einzelmessungen auftretenden Werte x der Größe X genannt. Die Normierungsbedingung nimmt dann ebenfalls eine Integralform an: ∞ dx w(x) = 1 . −∞
Der Name Wahrscheinlichkeitsdichte kommt daher, dass die Wahrscheinlichkeit, bei einer Einzelmessung einen bestimmten Wert X zu finden, mit zunehmender Zahl n von stets gegen Null geht. Dagegen beträgt die Wahrscheinlichkeit Einzelmessungen w x ∈ [x1 , x2 ] , dass eine Einzelmessung ein Resultat in dem endlichen X -Intervall [x1 , x2 ] liegt: x2 w x ∈ [x1 , x2 ] =
dx w(x) x1
In der klassischen Physik, in der die Werte der physikalischen Größen stets streuungsfrei sind, muss die gemessene Verteilungsfunktion (in dem physikalisch nicht realisierbaren Idealfall) gegen eine δ -Funktion streben, die den Wert von X für jeden Zustand für eine ideale Messung streuungsfrei festlegt. In vielen Fällen ist w(x) durch die in Abb. B.1 dargestellte Gauss-Funktion
(x − X )2 1 w(x) = √ · exp − (B.8) 2πσX
2σX
gegeben, wobei σX = (ΔX)2 die quadratische Streuung der Gauss-Verteilung angibt und damit ein Maß für deren Breite ist. Die Gauss-Funktion spielt in der Wahrscheinlichkeitsrechnung eine wichtige Rolle, weil die Verteilungsfunktion für die Summe vieler, unkorreliert schwankender Zufallsvariablen meist gegen eine Gauss-Funktion strebt.1 In zweiten Fall dagegen wird ΔX in der Regel nicht allein durch die Auflösung der Messapparatur bestimmt, sondern nimmt bei Verbesserung des Mess-Verfahrens schließlich einen für die Größe X und den betrachteten Zustand des Systems charakteristischen Wert an. Berühmte Beispiele sind die durch die Heisenberg’sche
1 Dieser Sachverhalt wird in der Statistik als Zentraler Grenzwertsatz bezeichnet.
B Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten
|
625
Unschärfe-Relation gegebene Beziehung zwischen den Streuungen von Ort und Impuls ΔX · ΔP oder die Spektrallinien eines Gases. Die Breite der Spektrallinie, die der EnergieUnschärfe der emittierten Photonen entspricht, zeigt selbst nach der Eliminierung aller apparativ bedingten Effekte die auf die thermischen Bewegung der Atome zurückzuführende Doppler-Verbreiterung. Die Doppler-Verbreiterung kann in einer Atomfalle für ein einzelnes Atom unterdrückt werden – aber selbst in diesem Fall wird eine natürliche Linienbreite gemessen, die durch die Lebensdauer des angeregten Zustands bestimmt wird. Das letzte Beispiel zeigt auch sehr schön, dass die Verteilungsfunktion einer Zufallsgröße, wie der Energie der bei quantenmechanischen Übergängen emittierten Photonen, durchaus mehrere Maxima aufweisen kann. Mehrere Zufallsvariablen und Korrelationen: Diese Überlegungen lassen sich leicht auf Wahrscheinlichkeitsverteilungen mit mehreren Zufallsvariablen X1 , . . . , Xr verallgemeinern. Die Verbundwahrscheinlichkeit W (x1 , . . . , xr ) gibt die Wahrscheinlichkeit für ein Ereignis an, bei dem die Variablen X1 , . . . , Xr gleichzeitig die Werte x1 , . . . , xr annehmen. Der Mittelwert einer einzelnen Zufallsgröße Xj ist dann durch ∞ Xj =
dx1 . . . dxr w(x1 , . . . , xr ) xj −∞
gegeben. Die Zufallsgrößen δXj = Xj − Xj , welche die statistischen Schwankung δxj = xj − Xj der Einzelmesswerte xj um den Mittelwert Xj beschreiben, heißen auch die Fluktuationen von Xj . Die Mittelwerte ∞ σij := δXi δXj =
dx1 . . . dxr w(x1 , . . . , xr ) δxi · δxj −∞
der Produkte der Fluktuationen zweier Zufallsvariablen Xi und Xj heißen Korrelationen oder Kovarianzen, und bilden in ihrer Gesamtheit die Korrelationsmatrix der Verteilung. Zufallsgrößen, deren Korrelation verschwindet, heißen statistisch unabhängig. Der Grad der Korrelation lässt die durch den Korrelationskoeffizienten Cij :=
σij Δ i · Δj
ausdrücken, der maximal den Wert Cij = 1 annehmen kann. Bei Summen XN =
N i=1
Xi
626 | B Wahrscheinlichkeiten und Wahrscheinlichkeitsdichten aus N unkorrelierten Zufallsgrößen Xi addieren sich die quadratischen Streuungen @N A N N N 2 σXN = (δXN ) =
δXi ·
i=1
δXj
δXi · δXj =
=
j=1
i,j=1
σXi
i=1
einfach auf, weil deren Korrelationen, das heisst die Mittelwerte δXi δXj der gemischten Terme, verschwinden. Sind außerdem die σXi alle gleich σ , so gilt: σ XN = N σ ,
wohingegen für maximal korrelierte Zufallsgrößen, das heißt, zueinander proportionale Zufallsgrößen, gilt: σXN = N 2 σ .
Die relative Schwankung ΔXN / XN beträgt also für unkorrelierte Zufallsgrößen √ ΔX N σ 1 Nσ = = √ XN N X N X
und für maximal korrelierte Zufallsgrößen √ ΔXN N· σ σ = = . XN N X X √
Bei unkorrelierten Zufallsgröße geht die relative Schwankung mit 1/ N gegen Null, bei korrelierten bleibt sie konstant. Für unabhängige Zufallsgrößen muss die Verteilungsfunktion w(x1 . . . xr ) = w1 (x1 ) · . . . · w(xr )
in variablenfremde Faktoren wi (xi ) zerfallen, weil sonst die Korrelationen zwischen den Zufallsgrößen nicht verschwinden.
C Nützliche Integrale Bei der Berechnung von Mittelwerten in der statistischen Thermodynamik treten häufig Integrale auf, die die Exponential-Funktion enthalten. In diesem Anhang listen wir eine Reihe der am häufigsten auftretenden Fälle auf. Eine explizite Lösung dieser Integrale findet man beispielsweise im Anhang des Buches von Schroeder [6]. Die Werte der Integrale vom Typ ∞ xz exp(−x) dx
Γ(z + 1) =
für
z > −1 .
(C.1)
0
treten besonders häufig in Zusammenhang mit der Boltzmann-Verteilung auf und werden die Gammafunktion genannt. Die Gammafunktion hat die folgenden Eigenschaften: Γ(z + 1) = z · Γ(z) und Γ(0) = 1 . (C.2) Ist z = n eine natürliche Zahl, so gilt Γ(n + 1) = n! = n · (n − 1) · . . . · 2 · 1 ,
(C.3)
wobei für z = 1 folgt: Γ(2) = Γ(1) = 1. Dies bedeutet, dass Γ(z) eine Art Verallgemeinerung der Fakultät n! auf reelle Zahlen z > −1 darstellt. Mit der Substitution x = y 2 (und damit dx = 2y dy ) besteht ein enger Zusammenhang zwischen der Gammafunktion und den Gauss-Integralen ∞ xz exp(−x) dx
Γ(z + 1) =
(C.4)
0
∞ y 2z+1 exp(−y 2 ) dy .
=2·
(C.5)
0
Damit erhalten wir als häufig auftretende Spezialfälle: ∞ exp(−x2 ) dx =
Γ(1/2) =
√ π,
(C.6)
−∞
√ π und 2 √ 3 π Γ(5/2) = . 4 Γ(3/2) =
(C.7) (C.8)
In Zusammenhang mit der Gibbs’schen Verteilung treten häufig Integrale der BoseFunktion ∞ xn (C.9) dx = Γ(n)ζ(n + 1) exp(x) − 1
0
628 | C Nützliche Integrale sowie die Fermi-Funktion: ∞
1 xn dx = 1 − n exp(x) + 1 2
Γ(n)ζ(n + 1) .
(C.10)
0
auf. Dabei ist
∞
ζ(n) := 1 +
1 1 1 1 + n + n + ··· = n 2 3 4 kn
(C.11)
i=1
die Riemann’sche Zeta-Funktion, die auch in der Zahlentheorie eine wichtige Rolle spielt. Für unsere Zwecke sind nur wenige ihrer Werte von Bedeutung: ζ
3
= 2.612 , 2 5 ζ = 1.342 , 2 π4 ζ(4) = = 1.082 , 90
ζ(2) =
π2 = 1.645 , 6
(C.12)
ζ(3) = 1.202 ,
(C.13)
ζ(5) = 1.037 .
(C.14)
D Legendre-Transformation Der durch eine Funktion f (x) definierte Verlauf einer Kurve im R2 wird normalerweise durch die Schar der Wertepaare {x, f (x)} in einem gewissen Interval [x1 , x2 ] kodiert. Das Verfahren der Legendre-Transformation erlaubt es, den Kurvenverlauf noch auf eine andere Weise zu kodieren, nämlich durch die Schar der Tangenten in jedem Punkt x. Die Tangenten sind Geraden, die durch Steigung y(x) =
df (x) dx
und den Achsenabschnitt g(x) = f (x) − x · y(x)
festgelegt sind (Abb. D.1a). Die Schar aller Tangenten an f (x) hüllt die Funktion f (x) ein (Abb. D.1b). In den x-Intervallen, in denen die Umkehrfunktion x(y) existiert, lassen sich die Achsenabschnitte g der Tangenten als Funktion der zugehörigen Steigungen y darstellen und wiederum als Wertepaare {y, g(y)}, das heißt als neue Funktion g(y) kodieren. Die Funktion g(y) heißt die Legendre-Transformierte von f (x). Sie ist in Abb. D.2a dargestellt. Bezeichnen wir die Legendre-Transformierte von f (x) mit L[f (x)], so können wir für die Legendre-Transformierte von g(y) schreiben: *
+
L[g(y)] = L L[f (x)] = g y(x) − y ·
dg(y) = f (x) − xy − y · (−x) = f (x) dy
Die Legendre-Transformation von g(y) führt also wieder zurück auf die Funktion f (x) und ist damit zu sich selbst invers. Abbildung D.3 zeigt einen direkten Vergleich zwischen den Funktionen f (x) und g(y). Man erkennt, dass ein Minimum in f (x) zu einem Maximum in g(y) führt. Da das Argument y der Funktion g(y) der Steigung
a)
f (x)
f (x 0)
b)
y0 =
∂f ∂x
f (x)
x0
g(y0) x0
x
x
Abb. D.1. a) Die Funktion f (x) mit der Tangente am Punkt x = x0 . Die Tangente wird durch ihre Steigung y0 und den Achsenabschnitt g(y0 ) festgelegt. b) Die Schar aller Tangenten bildet die Einhüllenden der Funktion f (x).
630 | D Legendre-Transformation g(y)
a)
b)
f (x 0) g(y0)
x0 = í
g y y0
y
y0
y
Abb. D.2. a) Die Legendre-Transformierte g(y) mit der Tangente am Punkt y = y0 . Die Tangente an g(y) wird durch die Steigung x0 und den Achsenabschnitt f (x0 ) festgelegt. b) Die Schar aller Tangenten an g(y) bildet die Einhüllende der Kurve g(y).
der Funktion f (x) entspricht, gilt für den Minimalwert fmin = g(0). Umgekehrt gilt gmax = f (0)
Dieses Verfahren ist auf Funktionen von mehrere Variablen übertragbar. In der Thermodynamik wird es angewendet, um bei einem Variablenwechsel die zu dem neuen Variablensatz gehörige Massieu-Gibbs-Funktion zu bestimmen. Wenn zum Beispiel die Energie E als Funktion der extensiven Variablen {X1 , . . . , Xr } gegeben ist und wir die Variable Xj durch ihre thermodynamisch konjugierte Variable ξj =
∂E(X1 , . . . , Xr ) ∂Xj
austauschen wollen, so betrachten wir das vollständige Differenzial der Funktion Ψ(X1 , . . . , ξj , . . . , Xr ) = E − ξj Xj .
Mit der Produktregel folgt: dΨ = d(E − ξj Xj ) = dE − d(ξj Xj ) =
ξi dXi − (ξj dXj + Xj dξj )
i
a)
f (x)
b)
g(y)
x=0
f (0) = g max f min = g(0)
g max = f (0)
y=0
g(0) = f min
y = ymax x min
x = í x min x
ymax
y
Abb. D.3. a) Die Funktion f (x) im Vergleich mit b) ihrer Legendre-Transformierten g(y).
D Legendre-Transformation
| 631
Damit erhalten wir für das totale Differenzial der Legendre-Transformierten Ψ(X1 , . . . ; ξj , . . . , X r ): dΨ =
ξi dXj − Xj dξj
i =j
Auf diese Weise wird der Term ξj dXj im Differenzial der alten Massieu-Gibbs-Funktion E(X1 , . . . , Xr ) durch −Xj dξj im Differenzial der neuen Massieu-Gibbs-Funktion Ψ für den Variablensatz {X1 , . . . , ξj , . . . , Xr } ersetzt. Damit haben wir gezeigt, dass Ψ(X1 , . . . , ξj , . . . , Xr ) tatsächlich die Eigenschaft hat, die Zustandsgleichungen zu liefern: ξ1 (X1 , ξj , ..., Xr ) =
.. . −Xj (X1 , ..., ξj , ...Xr ) =
.. .
∂Ψ(X1 , ..., ξj , ..., Xr ) ∂K1
.. . ∂Ψ(X1 ..., ξj , ..., Xr ) ∂ξj
.. .
ξr (X1 , ..., ξj , ..., Xr ) =
∂Ψ(X1 , ..., ξj , ..., Xr ) . ∂Xr
Beispiel: Kondensator mit variablem Plattenabstand Ein Plattenkondensator mit der Plattenabstand x und dem Flächeninhalt yz der Platten wird durch die Massieu-Gibbs-Funktion E(Q, x, y, z) =
Q2 x 20 yz
(D.1)
und die Gibbs’sche Fundamentalform dE = U dQ − Fx dx − Fy dy − Fz dz
beschrieben. Wenn wir annehmen, dass die Länge y und Breite z der Kondensatorplatten nicht variabel sind,1 liefern die Ableitungen von E(Q, x) die beiden Zustandsglei-
1 Diese Annahme entspricht der Vernachlässigung des Effekts der Elektrostriktion, das heißt der Deformation von Körpern in einem elektrischen Feld. Wenn wir dagegen annehmen, dass die Kondensatorplatten etwas elastisch sind, so entsprechen die Ableitungen von E(Q, x, y, z) nach y und z Kräften, welche eine Ausdehnung der Kondensatorplatten parallel zur Oberfläche bewirken. Diese Kräfte spiegeln die im elektrischen Feld senkrecht zu den Feldlinien herrschenden Druckspannungen wider, während die Ableitung nach x der Anziehungskraft zwischen den Platten und damit den parallel zu den Feldlinien herrschenden Zugspannungen in elektrischen Feld entspricht.
632 | D Legendre-Transformation chungen: U (Q, x) = −Fx (Q, x) =
∂E(Q, x) Qx = ∂q 0 yz
(D.2)
∂E(Q, x) Q2 = . ∂x 20 yz
(D.3)
Die erste Zustandsgleichung liefert die elektrische Spannung U und die zweite die Anziehungskraft Fx zwischen den Platten. Nochmaliges Differenzieren führt auf die drei Suszeptibilitäten: ∂U (Q, x) ∂ 2 E(Q, x) x 1 = = = ∂Q 0 yz C(x) ∂x2 ∂(−Fx (Q, x)) = K(Q, x) ≡ 0 ∂x ∂U (Q, x) ∂Fx (Q, x) Q =− = = −Ex ∂x ∂Q 0 yx
inverse Kapazität Federkonstante elektrisches Feld
Der Plattenkondensator hat die etwas pathologische Eigenschaft, dass die Anziehungskraft zwischen den Platten bei konstanter Ladung vom Plattenabstand unabhängig ist. Das liegt daran, dass die Feldstärke (für x y, z ) nur von der Ladungsdichte auf den Platten, aber nicht vom Plattenabstand abhängt (Gauss’sches Gesetz der Elektrostatik). Die Suszeptibilitätsmatrix des Systems hat die Gestalt ( ) ( ) χQx =
Die Determinante
1/C −Ex
−Ex K
2 1 x χQx = 0 y Q
=
1 0 y
Q =− 0
x
Q
Q
0
Q 0 yx
.
(D.4)
2 verschwinden. Daher ist eine Gauss-Verteilung durch die Angabe von Mittelwert X und Streuung ΔX vollständig beschrieben. Die höheren Kumulanten beschreiben also Abweichung der Verteilungsfunktion von der Gauss’schen Form. Bei Wahrscheinlichkeitsverteilungen w(x1 , . . . , xr ) für mehrere Zufallsvariablen X1 , . . . , Xr sind ebenso viele Laplace-Parameter z1 , . . . , zr erforderlich. In diesem Fall treten auch gemischte Ableitungen der charakteristischen Funktion und der Kumulantenfunktion auf. Die Matrix der zweiten Ableitungen der Kumulantenfunktion ist gleich der Korrelationsmatrix ∂ 2 Ψ(z1 , . . . , zr ) σij = δXi δXj = ∂zi ∂zj
z1 ,...,zr =0
644 | G Charakteristische Funktionen in der Statistik der Verteilung. Weil die Verteilungsfunktion w(x1 . . . xr ) = w1 (x1 ) · · · · · w(xr )
für unabhängige Zufallsgrößen in variablenfremde Faktoren wi (xi ) zerfällt (Anhang B), zerfällt die zugehörige Kumulantenfunktion in variablenfremde Summanden. Dies ist analog zum Aufbau zusammengesetzter Systeme aus unabhängigen Teilsystemen, wie dies in Kapitel 7 dargelegt wird. In diesem Fall ist die Korrelationsmatrix diagonal und enthält die quadratischen Streuungen σi auf der Diagonalen. Durch eine Transformation auf neue Variablen kann die Korrelationsmatrix diagonalisiert werden und Korrelationen – zumindest in Gauss’scher Näherung – eliminiert werden. Von dieser Tatsache wird in der Festkörperphysik Gebrauch gemacht, wo die Positionen der einzelnen Atome im Festkörper stark miteinander korreliert sind, die Amplituden der Normalschwingungen dagegen in erster Näherung unkorreliert sind. Eine genauere Behandlung muss Nicht-Linearitäten im Wechselwirkungspotenzial berücksichtigen – dies führt zu Phonon-Phonon-Streuprozessen, welche durch höhere Kumulanten beschrieben werden. Der Witz der charakteristischen Funktion besteht darin, dass deren Ableitungen nach den Laplace-Parametern z1 , ..., zn die Momente der Zufallsvariablen X1 , . . . , Xn liefern. Genau diese Eigenschaft haben auch die Zustandssummen der statistischen Thermodynamik. Ein wesentlicher Unterschied besteht jedoch darin, dass die Laplace-Parameter z1 , . . . , zn bei gewöhnlichen Wahrscheinlichkeits-Verteilungen nach der Bildung der Ableitungen = 0 gesetzt werden, während sie in der statistischen Thermodynamik eine eigene physikalischen Bedeutung haben, da sie den zu den Zufallsgrößen X1 , . . . , Xn (entropie-) konjugierten Größen entsprechen. Der Zusammenhang zwischen der Wahrscheinlichkeitstheorie und der statistischen Thermodynamik wird durch die Feststellung hergestellt, dass es sich bei den Wahrscheinlichkeitsverteilungen der statistischen Physik nicht um einzelne Verteilungsfunktionen, sondern um ganze Scharen von Verteilungsfunktionen handelt, die von einem oder mehreren Parametern abhängen. Die charakteristischen Funktionen dieser Verteilungsfunktionen werden dadurch gewonnen, dass nicht die Verteilungsfunktion selbst, sondern die Zustandsdichte g(ε) des betrachteten System Laplace-transformiert wird und die Laplace-Parameter mit den zu den Zufallsgrößen thermodynamisch konjugierten Variablen identifiziert werden. Aus diesem Grund werden die Laplace-Parameter nach der Ableitung auch nicht gleich Null gesetzt. Das einfachste Beispiel ist die kanonische (Boltzmann-) Verteilung wi =
gi exp − βεi , Z(β)
G Charakteristische Funktionen in der Statistik | 645
sie beschreibt die Verteilung der Zufallsgröße ε. Sie hängt von dem Laplace-Parameter 1 β := (G.1) , kB T
ab. Für ein diskretes Energiespektrum mit den Energien εi mit den Entartungsfaktoren gi erhalten wir gi exp − βεi ,
ΦK (β) = Z(β) =
i
während für ein kontinuierliches Spektrum mit der Zustandsdichte g(ε) ∞
dεg(ε) exp − βε
ΦK (β) = Z(β) =
−∞
resultiert. Ableitungen von Z(β) nach β bringen jeweils einen Faktor ε vor die Exponentialfunktion. Damit bekommen wir die Momente der Verteilung, insbesondere die Mittelwerte von ε und ε2 : dZ(β) ε = −Z (β) = εi gi exp(−βεi ) (G.2) =− dβ
i
2 d2 Z(β) ε = Z (β) = = (−1)2 εi gi exp(−βεi ) . 2 dβ
2
(G.3)
i
Wir halten fest:
Die Momente der Boltzmann-Verteilung lassen sich aus der LaplaceTransformierten Z(β) der Zustandsdichte des Systems gewinnen, die als charakteristische Funktion der Boltzmann-Verteilung fungiert. Die zu Z(β) gehörige Kumulantenfunktion Ψ(β) = ln Z(β)
ist bis auf den Faktor −1/β mit der freien Energie des Systems identisch. Die Kumulantenfunktion liefert durch Ableitung nach β die Kumulanten der Verteilung, insbe 2 sondere den Mittelwert ε und die quadratische Streuung Δε : ε = −
Δε
2
=
d ln Z(β) Z (β) =− dβ Z(β)
d2 ln Z(β) Z (β) = − 2 Z(β) dβ
(G.4)
Z (β) Z(β)
2 .
(G.5)
Diese Beziehungen illustrieren die Strukturverwandtschaft zwischen der Wahrscheinlichkeitsrechnung und der Thermodynamik, da sie einen allgemeinen Zusammenhang zwischen der Gewinnung von Mittelwerten und (quadratischen) Streuungen
646 | G Charakteristische Funktionen in der Statistik einerseits sowie Zustandsgleichungen und Suszeptibilitäten andererseits mit Hilfe einer für das betrachtete System spezifischen Funktion herstellen. Dieser Zusammenhang ist in kompakter Form durch die allgemeine Beziehung ΨK (β) = ln Z(β) = −β F (β)
gegeben. In der großkanonischen (Gibbs’schen-) Verteilung tritt nicht nur die Energie, sondern auch die Teilchenzahl als Zufallsgröße auf. Entsprechend sind zu ihrer Behandlung die zwei Laplace-Parameter, nämlich β und γ := −βμ
(G.6)
erforderlich. Analog erfordert jede weitere Zufallsvariable Xj der Verteilung einen weiteren Laplace-Parameter, welcher mit der zu Xj thermodynamisch konjugierten Größe ξj zusammenhängt. Die charakteristische Funktion der Gibbs’schen Verteilung ist die großkanonische Zustandssumme exp βEi − γNi ,
ΨG (β, γ) =
i
wobei die Summe über alle Zustände läuft. Der Logarithmus der großkanonischen Zustandssumme hängt wiederum über den Faktor β mit dem Landau-Potenzial ΨG (β, γ) = ln Z(β, βμ) = −β K(T, μ)
zusammen. Durch Differenzieren von Z(β, γ) gewinnen wir die zu den Gln. G.4 analogen Gleichungen ∂Z(β, γ) ∂β ∂Z(β, γ) N = . ∂γ E =
(G.7)
Die zweiten Ableitungen von Z(β, γ) gewinnen wir entsprechend die Streuungen und Korrelationen von E und N .
H Die Boltzmann-Gleichung Boltzmann entwickelte als erster eine Theorie, die sich nicht mehr auf die Orte und Impulse einzelner Teilchen, sondern auf die Besetzungs-Wahrscheinlichkeiten fσ (k, r) für Ein-Teilchenzustände als zentrale Größe stützt. Obwohl er selbst seine Überlegungen als eine Theorie der Mittelwerte der Orte und Impulse klassischer Teilchen ableitete, gelten viele der Relationen auch für die sicherlich nicht klassischen Fermi- und Bose-Systeme, und die Theorie ist damit viel allgemeiner anwendbar, als es ihre ursprüngliche Herleitung zunächst glauben macht. Dies liegt daran, dass die klassische und die Quantenmechanik (analog zur geometrischen und Wellen-Optik) zu identischen Ergebnissen kommen, solange Interferenz- und Beugungs-Phänomene nicht zum Tragen kommen. Der Ausgangspunkt unserer Überlegungen ist die Liouville-Gleichung, nach der die Wahrscheinlichkeitsdichte fσ (k, r) im Phasenraum für eine (klassische oder quantenmechanische) Hamilton’sche Zeitentwicklung zeitlich konstant bleibt: ∂fσ ˙ ∂fσ ∂ fσ (k, r) = ·k+ · r˙ = 0 . ∂t ∂k ∂r
(H.1)
Da die Hamilton’sche Dynamik nur reversible Prozesse erlaubt und damit zur Beschreibung unserer grundsätzlich irreversiblen Transportphänomene allein nicht ausreicht, machte Boltzmann die zusätzliche Annahme, dass es auch einen NichtHamilton’schen Beitrag zur zeitlichen Änderung von fσ (k, r) gibt, und erweiterte Gl. H.1 auf der rechten Seite um seinen berühmten Stoßterm,1 sodass fσ (k, r) in der einfachsten Variante der Differenzialgleichung
1 Die Einführung dieses Terms ist seit 140 Jahren umstritten, weil die Stöße nach Auffassung der Mechanik ebenfalls durch eine Hamilton’sche Dynamik beschrieben werden und daher auf der linken Seite dieser Gleichung erscheinen sollten. Dann verliert man aber die Irreversibilität. In den letzten Jahre hat sich die Auffassung durchgesetzt, dass der Stoßterm durch die Wechselwirkung mit einem Wärmebad zustandekommt, welches die erzeugte Entropie aufnimmt. Eine Nicht-Hamilton’sche Dynamik wird dadurch erzeugt, dass man über die Freiheitsgrade des Wärmebads thermisch mittelt, so dass diese auf der linken Seite von Gl. H.2 nicht mehr als dynamische Variable in Erscheinung treten (die dynamischen Variablen sind diejenigen, deren Zeitentwicklung Lösung der Bewegungsgleichungen ist). Dieser Zugang ist erfolgreich, wenn man ein dynamisches System mit einem oder wenigen Freiheitsgraden betrachtet, während das Wärmebad stets unendlich viele Freiheitsgrade haben muss. Es gibt jedoch Situationen, wie zum Beispiel die Gay-Lussac-Expansion eines Gases (Abschnitt 3.8), bei denen unklar ist, wie das Wärmebad realisiert sein soll. Ähnliche Probleme gibt es bei den Stößen hochenergetischer Ionen in der Teilchenphysik, in denen extrem viele neue Teilchen erzeugt werden, deren Dynamik nach nur 10−23 s durch die relativistische Hydrodynamik von Gasen beschreibbar ist, wobei ebenfalls unklar ist, wie die in diesem Gas enthaltene Entropiemenge in so kurzer Zeit erzeugt werden kann. Nach dem besten Wissen des Verfassers hat das Problem bisher keine Lösung gefunden, die in dem Sinne befriedigend ist, dass die Entropie darin als eine dynamische Variable erscheint, die denselben Regeln wie die übrigen dynamischen Variablen folgt.
648 | H Die Boltzmann-Gleichung δfσ (k, r) ∂fσ ˙ ∂fσ ∂ fσ (k, r) = ·k+ · r˙ = − , ∂t ∂k ∂r τσ (k)
(H.2)
genügt. Dabei ist δfσ (k, r) = fσ (k, r) − fG (k, r) die Abweichung von der Verteilungsfunktion fG (k, r) im Gleichgewicht. Diese Form des Stoßterms bewirkt, dass δfσ (k, r) für ein gegebenes {k, σ} unabhängig von der Werten von δf für andere {k , σ } mit der Zeitkonstante τσ (k) exponentiell relaxieren.2 Gl. H.2 wird die Boltzmann-Gleichung in Relaxationszeit-Näherung genannt. Lösen wir nach δf auf, so erhalten wir . / ∂fσ ˙ ∂fσ δfσ (k, r) = − (H.3) ·k+ · r˙ τσ (k) . ∂k
∂r
Beschränken wir uns schließlich auf die lineare Näherung in δf , können wir in fσ in den Ableitungen nach k und r durch fG ersetzen und bekommen damit den folgenden Ausdruck für δfσ : . / ∂fG ˙ ∂f δfσ (k, r) = − (H.4) · k + G · r˙ τσ (k) . ∂k
∂r
Identifizieren wir jetzt 1 k˙ = − grad εσ (k, r)
und
r˙ = v σ (k) =
1 ∂εσ (k, r) , ∂k
so resultiert ∂fG (k, r) ˙ ∂fG (ε) ∂εσ (k, r) 1 ·k = · − grad εσ ∂k ∂ε ∂k ∂fG (k, r) ∂fG (ε) εσ − μ ¯ ¯) − grad μ ¯ · v σ (k) . · r˙ = grad (εσ − μ ∂r ∂ε T Setzen wir dies in Gl. H.4 ein, so erhalten wir schließlich für den NichtgleichgewichtsAnteil der Verteilungsfunktion in der Relaxationszeitnäherung δfσ (k, r) =
∂fG (ε) εσ − μ ¯ ¯+ · v σ (k)τσ (k) grad μ grad T . ∂ε T
(H.5)
Ersetzen wir die Verteilungsfunktion fσ (k, r) der Besetzungswahrscheinlichkeiten durch die Teilchenzahlen Nk der elementaren Fermi- und Bose-Systeme, so ist dieses Ergebnis identisch mit Gl. 14.52, das wir in Kapitel 14 auf einem anderen Weg gewonnen haben, der nicht auf die klassische Mechanik zurückgreift.
2 Selbstverständlich gibt es raffiniertere Varianten des Stoßterms, mit denen auch der Teilchenaustausch zwischen elementaren Fermi-Systemen mit verschiedenen {k, σ} beschrieben werden kann.
Danksagung Ich danke allen Menschen, die zum Entstehen dieses Buches beigetragen haben. Dazu gehören zuallererst diejenigen, von denen ich als Student selbst Thermodynamik gelernt habe, nämlich G. Falk und F. Herrmann an der Universität Karlsruhe, welche die integrierte Darstellungsweise der Physik entwickelt haben, der ich mich in diesem Buch bediene. Ich halte dieses Konzept nicht nur für das Verständnis der modernen Physik, sondern auch für die Ökonomie des Denkens im Physikstudium insgesamt für außerordentlich förderlich. Das liegt daran, dass es sich von vornherein auf allgemeine, den Gültigkeitsbereich der Mechanik überschreitende Prinzipien stützt, die sich bis heute tragfähig erwiesen haben. Für die Entwicklung des Buches waren die Fragen und das Feedback meiner Student(inn)en und Übungsleiter(innen) unverzichtbar – besonders herausheben möchte ich hier Jens Siewert, Magda Marganska und Jonathan Eroms, die einen Großteil der Übungsaufgaben ausgearbeitet und in eine lösbare Form gebracht haben. Meinen Kollegen Karl Renk, Jascha Repp, Jens Siewert, Hans-Gert Boyen, Elke Scheer, Wolfgang Belzig, Hubert Motschmann, Wilfred Schoepe, Klaus Richter, Dieter Weiss und Dominique Bougeard danke ich für die kritische Lektüre, hilfreiche Korrekturen und Anregungen sowohl im Detail als auch bezüglich der Struktur des Textes. Von Herrn Jürgen Putzger stammt das Titelbild und eine Reihe von illustrierenden Vorlesungsexperimenten, die in einige der Abbildungen eingeflossen sind. Elke Haushalter und Claudia Rahm danke ich für das Schreiben meines Vorlesungsmanuskripts und Frau Marei Peischl für unschätzbare Unterstützung bei der Optimierung der „TEX“-Darstellung, Herrn Florian Rödl und Frau Olesia Shyshova für die Erstellung zahlreicher Abbildungen und Herrn Michael Müller und Frau Marei Peischl für sorgfältiges Korrekturlesen. Besonderer Dank gebührt meiner Familie für ihre rückhaltlose Unterstützung einschließlich des Ertragens meiner geistigen und physischen Absencen während der heißen Phasen des Schreibens.
Literaturverzeichnis [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35]
H. B. Callen, Thermodynamics and Introduction to Thermostatistics (Wiley, New York, 1985). H. U. Fuchs, Dynamics of heat, (Springer, New York Heidelberg London, 2010). G. Job, R. Rüffler, Physikalische Chemie, (Vieweg+Teubner, Wiesbaden 2011). L. Tisza, Generalized Thermodynamics, (Cambridge Mass., 1967). G. Falk, W. Ruppel, Energie und Entropie, (Springer, Berlin Heidelberg 1976). D.V. Schroeder, An introduction to Thermal Physics, (Addison Wesley Longman, 2000). W. Demtröder, Experimentalphysik 1, (Springer, Berlin Heidelberg, 1998). I. F. Silvera, Spin-polarized Hydrogen and Deuterium, Physics Letters, 109&110B, 1499 (1982). F. Schwabl, Statistische Physik, (Springer, Berlin Heidelberg New York, 2000). M. Kardar, Statistical Physics of Particles, (Cambridge University Press, 2007). Tabellenwerk Landolt-Börnstein, Zahlenwerte und Funktionen aus Physik, Chemie, Astronomie, Geophysik und Technik, Bd.2, Teil 4, (Springer, Berlin Göttingen Heidelberg 1961). W. M. Haynes, D. R. Lide, T. J. Bruno (Hrsg.), CRC Handbook of Chemistry and Physics, (Taylor & Francis, London, 2014). P. J. Linstrom, W.G. Mallard, (Hrsg.), NIST Chemistry Webbook: NIST Standard Reference Database No. 69, . T. Engel, P. Reid, Physikalische Chemie, (Pearsons Studium, München, 2006). W. Nernst, Theoretische Chemie, (F. Enke, Stuttgart, 1921); Die theoretischen und experimentellen Grundlagen des neuen Wärmesatzes, (Knapp, Halle/Saale, 1924). E. D. Eastman, W. C. McGavock, The Heat Capacity and Entropy of Rhombic and Monoclinic Sulphur, J. Am. Chem. Soc 59, 145 (1937). M. Knudsen, Ann. Phys. (Leipzig), 31, 205 (1910). V. Zlatic, R. Monnier, Modern Theory of Thermoelectricity, (Oxford University Press, 2014). G. Strobl, Physik kondensierter Materie, (Springer, Berlin Heidelberg New York, 2002). A. Einstein, Beiträge zur Quantentheorie, Verhandlungen der Deutschen Physikalischen Gesellschaft 12, 820 (1914). C. Enss, S.Hunklinger, Tieftemperaturphysik, (Springer, Berlin Heidelberg New York, 2000). H. Haken, H.C. Wolf, Atom- und Quantenphysik, (Springer, Berlin Heidelberg New York, 2000). H. Haken, H.C. Wolf, Molekülphysik, (Springer, Berlin Heidelberg New York, 2003). J. Welker, F. de Faria Elsner, und F. J. Giessibl, Application of the equipartition theorem to the thermal excitation of quartz tuning forks, Appl. Phys. Lett. 99, 084102 (2011). J. D. Fast, Entropie, (Philips’s Technische Bibliothek, Eindhoven 1960). W. Göpel und H.-D. Wiemhöfer, Statistische Thermodynamik, (Spektrum Akademischer Verlag, Heidelberg - Berlin, 1999). B. Cowan, Topics in Statistical Mechanics, (Imperial College Press, London, 2005). N. Leisi, Quantenphysik, (Springer, Berlin Heidelberg New York, 2006). Thermalization of a two-dimensional photonic gas in a ’white wall’ photon box J. Klärs, F. Verwiger und M. Weitz, Nature Physics 6, 512 (2010). Bose-Einstein-Kondensat aus Licht J. Klärs, J. Schmitt, F. Verwiger und M. Weitz, Physik in unserer Zeit 42, 58 (2011). N. W. Ashcroft, N. D. Mermin, Solid State Physics, (Saunders College, Philadelphia 1976). S. Hunklinger, Festkörperphysik, (Oldenbourg, München 2009). M. W. Zemansky, Heat and Thermodynamics, (5th edition, McGraw-Hill, New York, 1968). Atomic Physics, C. J. Foot, (Oxford University Press, Oxford, 2004). Observation of a Bose-Einstein-condensation in a dilute atomic vapor M. H. Anderson, J. R. Ensher, M. R. Matthews, C. E. Wieman, E.A. Cornell
Literaturverzeichnis
| 651
Science 269, 198 (1995). [36] K. B. Davies, M.-O. Mewes, M. A. Joffe, M. R. Andrews, W. Ketterle, Bose-Einsteincondensation in a gas of sodium atoms, Phys. Rev. Lett. 75, 3969 (1995). [37] D. L. Goodstein, States Of Matter, (Dover Publications, Mineola, New York, 2002). [38] On the thermoelectricity of correlated electrons in the zero-temperature limit, K. Behnia, D. Jaccard, and J. Flouquet, J. Phys.: Condens. Matter 16, 5187 (2004). [39] C.-Y. Wu, T. V. Thanh, Y.-F. Chen, J.-K. Lee, J.-J. Lin, Free-electronlike diffusive thermopower of indium tin oxide thin films, J. Appl. Phys. 108, 123708 (2010). [40] R. D. Barnard, Thermoelectricity in Metals and Alloys, (Taylor & Francis, London, 1972). [41] R. Taylor, A. H. MacDonald, Density-Wave Instabilities and Thermoelectric Parameters in the Alkali-Metals, Phys. Rev. Lett. 57, 1639 (1986). [42] R. Gross, A. Marx, Festkörperphysik, (Oldenbourg, München, 2012). [43] J. S. Dugdale, The Electrical Properties of Metals and Alloys, (Edward Arnolds, London 1977). [44] D.J. Quin, W.B. Ittner, J. Appl. Phys. 33 748 (1962). [45] R. Doll and M. Näbauer, Experimental Proof of Magnetic Flux Quantization in a Superconducting Ring, Phys. Rev. Lett. 7, 51 (1961). [46] Bascom S. Deaver, Jr. and William M. Fairbank, Experimental Evidence for Quantized Flux in Superconducting Cylinders, Phys. Rev. Lett. 7, 43 (1961). [47] M. Tinkham, Introduction to Superconductivity, (2nd Ed., McGraw-Hill, Singapore 1996). [48] T. Ihn, Semiconductor Nanostructures: Quantum States and Electronic Transport (Oxford University Press, 2009). [49] A. G. M. Jansen, A. P. van Gelder, P. Wyder, Piont-contact spectroscopy in metals, J. Phys. C 13 6073 (1980). [50] F. R. Ong, O. Bourgeois, S. E. Skipetrov, J. Chaussy, Thermal signatures of the Little-Parks effect in the heat capacity of mesoscopic superconducting rings Phys. Rev. B 74, 140503(R) (2006); G. M. Souche, J. Huillery, H. Pothier, P. Gandit, J. I. Mars, S. E. Skipetrov, O. Bourgeois, Searching for thermal signatures of persistent currents in normal-metal rings, Phys. Rev. B 87, 115120 (2013). [51] B. L. van Wees, H. van Houten, C. W. J. Beenakker, J. G. Williamson, L. P. Kouwenhoven, D. van der Marel, C. T.Foxon, Quantized conductance of point contacts in a two-dimensional electron gas, Phys. Rev. Lett. 60, 848 (1988). [52] D. Wharam, T. J. Thornton, R. Newbury, M. Pepper, H. Ahmed, J. E. F. Frost, D. G. Hasko, D. C. Peacock, D. A. Ritchie G. A. C. Jones, One-dimensional transport and the quantisation of the ballistic resistance, J. Phys. C 21, L209 (1988). [53] L. W. Molenkamp, H. van Houten, C. W. J. Beenakker, R. Eppenga, and C. T. Foxon, Quantum oscillations in the transverse voltage of a channel in the nonlinear transport regime, Phys. Rev. Lett. 65, 1052, (1990). [54] K. Schwab, E. A. Henriksen, J. M. Worlock, M. L. Roukes, Measurement of the quantum of thermal conductance, Nature 404, 974 (2000). [55] Th. Bartsch, M. Schmidt, Ch. Heyn, W.Hansen, Thermal Conductance of Ballistic Point Contacts, Phys. Rev. Lett. 108, 075901 (2012). [56] N. Agrait, A. Levy-Yeyati, J. M van Ruitenbeek, Quantum properties of atomic-sized conductors, Physics Reports 377, 81 (2003). [57] M. Henny, S. Oberholzer, C. Strunk, and C. Schönenberger, 1/3-shot-noise suppression in diffusive nanowires, Phys. Rev. B 59, 2871 (1999). [58] T. T. Heikkilä, The Physics of Nanoelectronics, (Oxford University Press, 2013). [59] H. Pothier, S. Guéron, N. O. Birge, D. Esteve, and M. H. Devoret, Energy Distribution Function of Quasiparticles in Mesoscopic Wires, Phys. Rev. Lett. 79, 3490 (1997). [60] J. D. Jackson, Klassische Elektrodynamik, (de Gruyter, Berlin 2006).
Stichwortverzeichnis A Abnahme der Entropie, 57 Abschirmstrom, 571 Abschirmung, 498 – elektrostatische, 503 Abschirm-Wolke, 520 absoluter Nullpunkt, 60, 61, 91 absolutes Vakuum, 61 Absorptionsgrad, 452 Adiabatenexponent, 111 – Messung – Clement und Desormes, 115 – Rüchardt, 115 Adiabatengleichung, 110, 181 adiabatisch, 73, 219, 300 adiabatische Entmagnetisierung, 159, 339, 371 Affinität, 213, 447 Aggregatzustand, 276 Aktivierungsenergie, 217 Aktivität, 291 akustisches Phonon, 455 Akzeptor, 552 Anode, 120 Antrieb, 62 Arbeit, 47, 121, 132 Arbeitsfähigkeit, 146 Arbeitskolben, 138 Arbeitssystem, 128, 156 asymmetrisches Molekül, 381 Atmosphäre, 246 Atom – -gewicht, 85 – -Hypothese, 83 – -masseneinheit, 84 Ausdehnung – thermische, 49, 169, 458 – negative, 469 Ausdehnungskoeffizient – Längen-, 49 – thermischer, 91, 464, 466, 509, 515 – Volumen-, 49 Ausschlussvolumen, 296 Austauschfeld, 351 Austauschsymmetrie, 378 Austausch-Wechselwirkung, 347
Avogadro-Konstante, 83 Azeotrop, 290 B ballistischer Punktkontakt, 591 Band-Diskontinuität, 589 Bandlücke, 498 Bandverbiegung, 559 Bar, 87 barometrische Höhenformel, 246 Bernoulli-Gleichung, 301 Bernoulli-Modell, 116, 444, 450, 458 Besetzungsinversion, 336, 565 Beweglichkeit, 243 Bewegungsgleichung, 35 Bewegungsgröße, 48 bilanzierbare Größe, 16 Bindungsenergie, 85, 95, 216, 278 Binnendruck, 296 Binodale, 295 Bloch-Grüneisen-Gesetz, 538 Bogoliubov-Quasiteilchen, 576 Bogoliubov-Transformation, 576 Bohr’scher Radius, 552 Bohr’sches Magneton, 329 Bohr-Sommerfeld-Quantisierung, 409 Boltzmann – -Faktor, 298, 333, 361 – -Gleichung, 534 – -Konstante, 90 – -’sches Prinzip, 359, 402 – Stefan-Boltzmann-Gesetz, 171 – Stefan-Boltzmann-Konstante, 77, 450 – -Verteilung, 103, 362 Bose– Einstein-Kondensat, 475 – Funktion, 423 – Divergenz, 472 – Gas, 471 – System (elementares), 423, 431 – Entropie, 424 Boson, 379 Boyle, 89 Boyle-Temperatur, 297 Bragg-Streuung, 471
654 | Stichwortverzeichnis Brennstoffzelle, 120 Brillouin-Funktion, 337, 356 Brillouin-Zone, 1., 454 Brown’sche Bewegung, 83, 343, 443 C Carnot-Maschine, 123 Carnot’sches Prinzip, 124 Carnot-Wirkungsgrad, 124, 138 Celsius-Skala, 49 charakteristische Funktion, 345, 643 chemische Kinetik, 220 chemische Konstante, 175, 179, 182, 399, 434, 549 chemische Reaktion, 82, 86, 319 chemische Spannung, 85 chemisches Gleichgewicht, → Gleichgewicht chemisches Potenzial, 82, 85, 165 – Absolutwert, 224 – der Elemente, 225 – des idealen Gases, 181 – des Lösungsmittels, 210, 285 – des realen Gases, 305 – des Spinsystems, 331 – heißer Körper, 113 – und Teilchenströme, 242 – von 3He in 4He, 530 – von Elektronen in Halbleitern, 550, 559 Clausius und Clapeyron, 283 – Gleichung von, 525 Compton-Effekt, 41 Cooper-Paar, 568, 574 Coulomb-Potenzial, 249 Curie-Gesetz, 159, 337 Curie-Temperatur, 351 Curie-Weiss-Gesetz, 354 D Dampfdruckkurve, 280 Debye– Frequenz, 456 – Hückel-Abschirmlänge, 248 – Modell, 456 – Temperatur, 466 – Wärmekapazität, 460 – Zustandsdichte, 457 Destillation, 290 Destille, 531 detailliertes Gleichgewicht, 345
Dichteanomalie des Wassers, 50 Dichtefluktuation, 312 Dichtematrix, 328 dielektrische Suszeptibilität, 504 Dielektrizitätskonstante, 247, 552 Dieselmotor, 137 Differenzial, 620 Diffusion, 238 – Thermo-, 259 – Wärmediffusionskoeffizient, 253 Diffusions– Barriere, 563 – gleichgewicht, 247 – gleichung, 240 – konstante, 236, 244, 469 – spannung, 559 – strom, 86, 207, 243 – tensor, 533 – Thermokraft, 541 Dimensionsanalyse, 186 Diode, 562 direkter Halbleiter, → Halbleiter Dispersionsrelation, 415, 445, 455, 464, 482 – Bogoliubov-Quasiteilchen, 577 – Elektronen, 497 – Phononen, 455 – Photonen, 445 Dissipation, 57 Dissoziation von Ionen, 212 Dissoziation von Molekülen, 215 Donator, 552 Doppelmulden-Potenzial, 364 Doppler-Verbreiterung, 477 Doppler-Verschiebung, 491 Dotierung, 247, 552 Drehimpulsstrom, 35 Drift-Diffusions-Modell, 254, 537 Driftgeschwindigkeit, 243 Drosselventil, 300 Druck, 87 Druckgleichgewicht, → Gleichgewicht Drude-Formel, 245 Dulong und Petit, 459 – Regel von, 55, 104 Durchlass-Richtung, 561 E Edukt, 82 effektive Kraft, 244, 536
Stichwortverzeichnis
effektive Masse, 498, 548 effektive Zustandsdichte, 549 Effusion, 255 – von Elektronen, 595 – von Phononen, 609 – von Photonen, 450 Eigenleitung, 554 Eigenmode, 415 Eigenwert, 323 einatomiges ideales Gas, 95, 104, 177 Eindringtiefe – magnetische, 586 eingefrorene Entropie, 404 eingefrorene Unordnung, 403 Einschlusspotenzial, 495, 589 Einstein– Koeffizienten, 493 – Modell, 456 – Relation, 244 – ’scher freier Körper, 20 – Temperatur, 375 Einteilchen-System, 358 elastischer Freiheitsgrad, 104 elektrisch – Dipolschicht, 502 – Feld, 242, 561 – Leitfähigkeit, 245 – Leitfähigkeitstensor, 538 – Leitwert, 62 – Potenzialdifferenz, 119 – Relaxationszeit, 65 – Widerstand, 459 elektrochemisches Gleichgewicht, 558 elektrochemisches Potenzial, 120, 248, 264, 418, 498 Elektrolytlösung, 120, 247 elektromotorische Kraft, 120, 264 Elektron-Loch-Paar, 498 Elektron-Loch-Phonon-Streuzeit, 562 Elektron-Phonon-Streurate, 459 elektrostatische Abschirmlänge, 558 elektrostatische Abschirmung, 499 Elementarladung, 84 empirische Temperatur, 49, 154 Energie – Aktivierungs-, 217 – -austausch, 135 – -Band, 497 – Bindungs-, → Bindungsenergie
|
655
– -darstellung, 166 – -dichte des Fermigases, 502 – -dichte des Photonengases, 448 – elastische, 42 – Exzess-, 292 – Fermi-, → Fermi– -form, 36 – freie, → freie Energie – im externen Magnetfeld, 150 – -Impuls-Zusammenhang, 21 – -Lücke, 568 – Minimalprinzip, 39 – Nullpunkts-, 278 – Ruhe-, 321 – -strom, 33, 63, 124, 431 – -träger, 33, 36 – -transport, 2 – Wechselwirkungs-, 93 Entartung, 61 – Entartungs– bedingung, 179 – dichte, 179, 183 – grad, 377 – temperatur, 179, 435 Enthalpie, 148, 301, 372 Enthalpie-Masse-Relation, 492 Entmagnetisierung, 158, 641 Entmagnetisierungsfeld, 640 Entropie, 46, 121, 338, 351, 382, 385 – Abnahme, 57 – Absolutwert, 69 – -bilanz, 72 – Clausius’sche Definition, 141 – -darstellung, 165, 270, 406 – -dichte, 449 – eingefrorene, 404 – elementarer Fermi- und Bose-Systeme, 424 – -erzeugung, 202 – Fermigas, 512 – Ferromagnet, 353 – ideales Gas, 175 – -konjugiert, 270 – Kontinuitätsgleichung, 76 – -Leitwertquantum, 606 – Mischungs-, 207, 294, 330, 526 – statistische Interpretation, 208 – molare Reaktions-, 227 – Paramagnet, 340 – Photonen, 449
656 | Stichwortverzeichnis – -produktion – Minimierung, 271 – -produktionsrate, 76, 270 – -strom, 71, 431 – -stromdichte, 253 – Übergangs-, 279 – van der Waals-Gas, 304 – Verdampfungs-, 277, 283, 287 entropische Kraft, 131, 147, 371 Ergoden-Hypothese, 440 Erhaltungsgröße, 16 Erhaltungssatz, 15 Erzeugungsrate, 30 Erzeugungsterm, 239 Eucken-Faktor, 267 Euler-Gleichung, 163 exaktes Differenzial, 141 extensiv, 29 extensive Variable, 161 externes Kraftfeld, 241 externes Magnetfeld, 329 extrem relativistisch, 22 Exzess-Energie, 292 F Faktorisierung, 97 Faltungsprodukt, 594 Faraday-Konstante, 84 Federkonstante, 23, 90 Feinstruktur, 385 Feld, 161 Feldstrom, 243 Fermi– Energie, 501 – Entartung, 501 – Fläche, 500 – Flüssigkeit, 521 – Zustandsgleichung, 520 – Flüssigkeitsparameter, 521 – Funktion, 422 – Gas (entartet), 500 – Grundzustand, 503 – kalorische Zustandsgleichung, 512 – Nullpunktsdruck, 502 – spezifische Wärmekapazität, 512 – thermische Zustandsgleichung, 510 – Transportkoeffizienten, 538 – Zustandsdichte, 501 – Geschwindigkeit, 501, 520
– Impuls, 501 – Kante, 499 – Kugel, 500 – System (elementares), 422, 431, 497, 500 – Dispersionsrelation, 497 – Entropie, 424 – Wechselwirkungseffekt, 518 – Temperatur, 261, 501, 530, 543 – Thomas-Fermi-Abschirmlänge, 248, 504, 505, 523 – Wellenlänge, 501, 504, 591 Fluid, 87 Flüssigkeitsthermometer, 50 Fontänen-Effekt, 485 Fourier-Transformierte, 240 Fraunhofer’sche Linie, 453 freie Energie, 146 – ideales Gas, 180 – im Druckgleichgewicht, 199 – im Magnetfeld, 152, 331, 572 – Phononensystem, 463 – Photonensystem, 447 – und Boltzmann-Verteilung, 389 – und innere Anregungen, 388 – und Zustandssumme, 360, 362 freie Enthalpie, 149, 371 – im Magnetfeld, 152 freie Expansion, 107, 108 freie Weglänge, 251 – elastische, 611 – inelastische , 611 – mittlere, 235, 469 Freiheitsgrad, 12, 103 Friedel-Oszillation, 504 Fugazität, 183, 291, 434 G Galilei-Invarianz, 225 Galilei-Transformation, 22 Gammafunktion, 98, 396, 627 Gas – Bose-, 471 – dreiatomiges, 104, 177 – einatomiges ideales, 95, 104, 177 – elementares ideales, 393 – Fermi, → Fermi – Fermi-, 500, 510 – ideales, → ideal – -strömung, 119
Stichwortverzeichnis
– -temperatur, 92, 155 – -thermometer, 155 – -turbine, 119 Gauss-Integral, 240, 627 Gauss-Verteilung, 623 Gay-Lussac, 107 – -Expansion, 108 – -Experiment, 298 – -Koeffizient, 300 gelöster Stoff, 209 Generations-Rate, 562 Geschwindigkeitsdifferenz, 250 Geschwindigkeitsgleichgewicht, 39, 250, 490 Gesetz der konstanten und multiplen Proportionen, 83 Gibbs– Duhem-Relation, 164, 210, 246, 282, 486 – Helmholtz Gleichung, 220 – Helmholtz-Gleichung, 227 – ’sche Fundamentalform, 31, 48, 89, 100, 110, 242, 245, 270, 298, 360, 418, 490, 535 – reduzierte, 162, 174 – sche Phasenregel, 287 – ’sche Verteilung, 419, 433 – verallgemeinerte, 490 Gitteranharmonizität, 470 Gleichgewicht, 195 – chemisches, 213, 331 – detailliertes, 345 – Druck-, 259 – Druckgleichgewicht – isentropes, 200 – isothermes, 200 – Geschwindigkeits-, 39, 250, 490 – Gleichgewichtskonstante, 214, 216 – inneres, 194, 234, 281, 390 – lokales, 235, 532, 611 – thermisches, 66 Gleichverteilungssatz, 103, 373, 380, 396, 459 Gradient, 19, 620 Graphen, 619 Gravitationsfeld, 118, 242, 245 Gravitationspotenzial, 118, 245 gravitochemisches Potenzial, 246 Grenzgeschwindigkeit, 21 Größe, → Variable – physikalische, 10 – pro Teilchen, 84 großkanonischer Hamilton-Operator, 575
|
657
Grüneisen-Parameter, 171, 465, 467 – elektronischer, 515 H Halbleiter, 247, 261, 498, 548 – direkter, 565 – -grenzfläche, 506 – -Heterostruktur, 588 – Modulations-Dotierung, 589 Halbmetall, 514 Hall-Effekt, 543, 545 Hamaker-Konstante, 495 Hamilton-Operator eines Vielteilchen-Systems, 415 harmonischer Oszillator, 24, 105, 372 Hauptsatz – 1., 15 – 2., 56, 125 – 3., 58 Hauptsatz, 3., 60, 226, 294, 402 heißer Körper, 52 – chemisches Potenzial, 113 Heizpulsverfahren, 68 Henry’sches Gesetz, 291 homogene Funktion, 32, 163 Homogenität, 32, 178, 390, 398 Homogenitätspostulat, 160, 342 Homogenitätsrelation, 164, 209, 305, 420, 449, 502 Hooke’sches Gesetz, 24, 129 hydrostatischer Druck, 87, 464 Hysterese, 308 I ideal – Absorber, 450 – Diamagnet, 571 – einatomiges Gas, 95, 104, 177 – Gas, 174, 185 – Gasgesetz, 90 – Gemisch von Gasen, 205 – Lösung, 289 – Paramagnet, 156 – Wärmekraftmaschine, 127 Idealität, 209, 346, 527 Impulsleitwert, 63 Impulsstrom, 34, 63 Impulsstromdichte, 250 Impulsverteilung, 94
658 | Stichwortverzeichnis indirekter Halbleiter, 565 inhomogener Halbleiter, 558 Inkohärenz, 326 Innenwiderstand, 121 innere Längenskala, 234 innerer Freiheitsgrad, 177, 193 instabiler Bereich, 305 Instabilität – der homogenen Mischung, 291, 312, 526 – ferromagnetische, 351 – reales Gas, 306 – thermodynamische, 198 Integrabilitätsbedingung, 141, 153 integrierender Faktor, 141 intensiv, 29 Interband-Relaxationszeit, 552, 562, 564 Intraband-Relaxationszeit, 551 intrinsische Ladungsträgerdichte, 551 Inversion, 341 Inversions– kurve, 301 – temperatur, 301 Ionisation, 319 irreversibel, 56 isentrop, 219 Isentrope, 134 Isobare, 176 Isochore, 140 Isotherme, 134 J Josephson-Effekt, 575 Joule’sche Wärme, 270, 564 Joule-Thomson-Effekt, 303 Joule-Thomson-Koeffizient, 301 Joule-Thomson-Prozess, 300 K Kalorimeter, 67 Kanal, 36 kanonisch konjugiert, 36 Kapazitätsdiode, 565 Kapillare, 257 Kapillarkräfte, 212 Katalysator, 217 Kathode, 120 Kelvin, 81 Kelvin-Sonde, 506 – Relation, 264, 546
– Skala, 52 Kernspin, 288, 339, 524 kinetischer Koeffizient, 269 klassischer Bereich, 397 klassischer Grenzfall, 381 klassisches ideales Gas, 513 Knudsen-Effekt, 260 Knudsen-Strömung, 258 Kohlestäubchen, 446 Kompensation, 553 Kompensationsbereich, 554 Kompressibilität, 90 – isentrope, 111, 467 – isotherme, 92, 111, 305, 309 Kompression – isentrope, 109 – des Quasiteilchengases, 487 – isotherme, 108 Kondensationsenergie, 572 Kondensationskeim, 308 Kondensationswärme, 307 Kondo-Effekt, 539, 545 konduktiv, 253 konservatives Kraftfeld, 242 Kontaktspannung, 506 Kontinuitätsgleichung, 29 – Entropiedichte, 76, 260 – lokal, 38 – Teilchendichte, 239 Kontinuumsnäherung, 379, 395, 456 Konvektion, 77, 260 konvektiv, 253 Kopplungsrelation, 35, 193 Körper – Einstein’scher freier, 20 – heißer, 52 – Newton’scher freier, 18 Korrelation, 625 Korrelationsmatrix, 643 Kraft-Abstand-Gesetz, 27, 371 Kreisprozess, 131 Kristallgitter, 276, 454 kritisch – Exponent, 313, 316, 354 – Fluktuation, 345, 354 – Isotherme, 309 – Magnetfeld, 569 – Opaleszenz, 312, 345, 421 – Punkt, 280, 309
Stichwortverzeichnis
Kühlung – magnetische, 159, 172, 339 – Verdampfungs-, 284 Kumulantenfunktion, 345, 643 L Ladungstransfer, 505, 558, 565 Lagrange-Multiplikator, 361, 419 laminare Strömung, 251 Landauer-Büttiker-Formel, 619 Landau-Kriterium, 491 Landau-Potenzial, 420 Langevin-Funktion, 372 Laplace-Transformierte, 643 Laserkühlung, 476 latente Wärme, 277, 279 lebendige Kraft, 48 Legendre-Transformation, 147, 189, 271, 331, 629 Leitfähigkeit, 243 – Quanten-, 603 Leitwert – elektrischer, 62 – Impuls-, 63 – thermischer, 606 Lennard-Jones-Potenzial, 252, 298 Lichtstreuung, 312 Linde-Verfahren, 303 lineares Molekül, 106 Liouville-Gleichung, 647 logarithmische Ableitung, 97 lokale Schwankung, 443 Lokalisierungsenergie, 365, 428, 473, 528 London-Gleichung, 586 Lorentz-Transformation, 22 Lorenz-Zahl, 76, 254 Lösungsmittel, 209 M magnetische – Enthalpie, 151 – Falle, 476, 477 – Instabilität, 351 – Kühlung, → Kühlung – Moment, 329, 351 – Suszeptibilität, 337 – Temperatur, 156 – Zustandsgleichung, 349 – des Supraleiters, 571 Magnetisierungskurve, 351
|
659
magnetokalorischer Effekt, 158, 339 Magnon, 351, 355 makroskopisches Quantenobjekt, 476 Mariotte, 89 Masse, 321 – effektive, 498, 548 – Massendefekt, 20 – Massenstrom, 118, 119, 258 – reduzierte, 238, 376, 381, 636 – Ruhe-, 20 masseloses Quasiteilchen, 488 masseloses Teilchen, 445 Massenwirkungsgesetz, 214, 321, 344, 551, 553, 559 Massieu-Gibbs-Funktion, 15, 31, 54, 147, 162, 185, 331, 334 Maßsystemkonstanten, 14 Materiefeld, 415 Matthiesen’sche Regel, 538 Maximum-Klasse, 204 Maxwell– Konstruktion, 307 – Leitwert, 595 – Relation, 128, 154, 158, 174, 267, 298, 301, 304, 546 – Verteilung, 93, 247, 478 mechano-kalorischer Effekt, 485 Meissner-Ochsenfeld-Effekt, 570 mengenartig, 16 Mengendichte, 84 Mengenquantum – elementares, 83, 178 Metall, 247 Metastabilitätsgebiet, 295, 308 Mikro-Reversibilität, 532 Mikrozustand, 166, 439 Minimalprinzip der Energie, 39 Minimum-Klasse, 204 Mischkammer, 531 Mischung – Mischungsentropie, 207, 294, 330, 526 – statistische Interpretation, 208 – Mischungsinstabilität, 295 – Mischungslücke, 293, 294 – reale, 293 Mittelwert, 328, 345 mittlere Geschwindigkeit, 235 mittleres Geschwindigkeitsquadrat, 98 mittleres Verschiebungsquadrat, 240
660 | Stichwortverzeichnis Modulations-Dotierung, 589 Mol, 84 molar – Energie, 95 – Entropie, 177 – freie Reaktionsenthalpie, 214 – Reaktionsenthalpie, 219 – Reaktionsentropie, 227 molare Wärmekapazität, 55 Molekularfeld, 349, 576 Molekularfeld-Näherung, 348, 520 Molekulargewicht, 85, 176 Molenbruch, 205, 289, 526 Molvolumen, 54, 91 Moment, 345 – der Verteilung, 622 N Nahordnung, 277 Naturkonstante, 14 natürliche Einheiten, 14, 179 natürliche Linienbreite, 477 Neutronenstern, 584 Newton’scher freier Körper, 18 Nichtunterscheidbarkeit, 93, 97, 378, 391, → ununterscheidbar Niederenergie-Näherung, 519 normalfluide Massendichte, 489 Normal-Komponente der Supraflüssigkeit, 488 Normierung, 97, 360, 622 Normierungskonstante, 97 Nukleation der stabilen Phase, 308 Nullpunktsdruck des Fermi-Gases, 502 Nullpunktsenergie, 278, 373 O Oberfläche, 32 Ohm’sches Gesetz, 62, 243 Onsager, 264 Onsager-Symmetrie, 269, 546 optisches Phonon, 455 osmotischer Druck, 285, 528 Ottomotor, 137 P Paarerzeugung, 562 Paramagnet, 156 – Kernspin-, 159 – Spin 1/2-, 370
Partialdruck, 205 partielle Ableitung, 620 Pascal, 87 Pauli-Prinzip, 413, 422, 501, 524, 538 Pauli-Suszeptibilität, 516 Peltier – -Effekt, 531 – Element, 120 – Koeffizient, 261 – Peltier-Wärme, 564 – Wärme, 262 permanentes Gas, 311 perpetuum mobile 2. Art, 121 Perry, 80 Persistenzlänge, 370 Petit, 55 Phase, 161, 276 – einkomponentig, 161 – heterogene, 84 – homogene, 84 – magnetisch geordnete, 351 Phasen– diagramm, 279, 295 – gleichgewicht, 282 – gradient, 575 – grenzlinie, 280 – koexistenzlinie, 283, 287 – koexistenzpunkt, 287 – kohärenz, 324 – ordnung, 573 – raum, 94 – übergang, 296 – übergang 1. Art, 308 – übergang 2. Art, 281, 311 – umwandlung, 86 Phononen, 76, 276, 320, 482 – -dichte, 459 – -druck, 469 – -zahl, 458 – -Zustandsdichte, 456 Photodiode, 563 Photonen, 22, 321, 416 – -dichte, 447 – -gas, 116 physikalische Größe, → Variable Planck-Verteilung, 449 Poiseuille-Strömung, 258 Poisson-Gleichung, 247 Polarisationsfreiheitsgrad, 446, 456
Stichwortverzeichnis
Polarisierbarkeit, 247 Polymer, 130, 369 Pomeranchuk-Kühlung, 525 Potenzial, → chemisches Potenzial – Coulomb-Potenzial, 249 – elektrochemisches, → elektrochemisches Potenzial – Gravitations-, 118, 245 – großkanonisches, 420 – thermodynamisches, 15 – Yukawa-Potenzial, 249 Potenzialgradient – innerer elektrischer, 561 Primär-Thermometer, 92 Projektor, 327 Prozess – äußerer, 193 – -größe, 47 – innerer, 193 – irreversibler, 56 – isenthalper, 301 – isentroper, 110 – isobarer, 100 – isochorer, 140 – isoenergetischer, 298 – reversibler, 56 Punktkontakt, 255 Q quadratische Streuung, 363, 622 Quanten – -kapazität, 619 Quanten– film, 589 – flüssigkeit, 526 – gas, 179, 425 – kapazität, 184 – Punktkontakt, 600 – statistik, 165 – trog, 589 – Volumen, 179 Quasi– Fermi-Niveau, 552 – teilchen, 254, 321, 425 – Elektronen-ähnliches, 548 – Impuls, 490 – Loch-artiges, 548 – -Reservoire, 591 – teilchendruck, 486
| 661
– teilchen-Streurate, 523 – Vakuum, 209, 486, 522 quasistatisch, 133 R random walk, 240 Raoult’sches Gesetz, 289 Raumladungszone, 560 Rayleigh-Jeans, 449 Reaktions– enthalpie – freie, 217 – molare, 219 – molare freie, 214 – Standard-, 220 – entropie – molare, 227 – Gleichung, 82, 213 – laufzahl, 83, 213 – produkt, 82 – rate, 86, 345 – wärme, 219 Referenztemperatur, 71 Regenerator, 139 Rekombination, 551 Rekombinations-Rate, 562 relativer Absorptionsgrad, 453 Relaxationsmechanismus, 235 Relaxationszeit, 235, 404 – elektrisch, 65 – Interband-, → Interband-Relaxationszeit – Intraband-, → Intraband-Relaxationszeit – thermische, 65, 79, 109, 200 Relaxationszeit-Näherung, 648 Reservoire, 17 Restwiderstand, 538 reversibel, 17, 56 reversibler Ersatzprozess, 136 reziproker Gittervektor, 454 Reziprozitäts-Theorem, 264 Riemann’sche Zeta-Funktion, 628 RKKY-Wechselwirkung, 504, 546 Rotations– anregung, 105 – energie, 106, 377 – freiheitsgrad, 104, 216 – pendel, 487 – spektrum, 378 Rotationsviskosimeter, 272
662 | Stichwortverzeichnis Rotator, 329, 377 Roton, 482 Rotor, 119 Ruheenergie, 321 Ruhemasse, 20 S Satz von Schwarz, 128, 153 Schall, 2., 254, 483, 488 Schallgeschwindigkeit, 112, 454, 469 Schallquant, 76, 454, → Phononen scharfer Wert, 324 Schmelzdruckkurve, 280, 525 Schmelzpunktserniedrigung, 286 Schottky– Anomalie, 338, 368 – Barriere, 566 – Kontakt, 566 – Näherung, 561 schwarzer Strahler, 453 Seebeck-Koeffizient, → Thermokraft Sekundär-Thermometer, 155 Selbstkonsistenz-Relation, 350, 576 semipermeable Membran, 211 Sharvin-Leitwert, 255, 610 Siedepunktserhöhung, 286 Siedeverzug, 307 Simon, 61 Skaleninvarianz, 160 Sommerfeld-Entwicklung, 507, 537, 540, 546 Sommerfeld-Koeffizient, 512 Soret-Effekt, 262 Spannungstensor, 38, 250 spektrale Energiedichte, 448 Sperr-Richtung, 561 Sperrschicht, 559 Sperrstrom, 563 spezifisches Volumen, 51 Spin, 177, 329 spinodale Entmischung, 295 Spintronik, 333 Spinwellen, 351 Spur, 328 Stabilität – thermodynamische, 168 Stabilitätsbedingung, 203, 345, 364 Stammfunktion, 141 Standardbedingungen, 91, 177, 396 stationärer Zustand, 326
statistisch unabhängig, 358 statistisches Gemisch, 327 Stefan-Boltzmann-Gesetz, 77, 171, 450 Stirling-Motor, 138 stöchiometrischer Koeffizient, 82, 212 Stoffmenge, 82 Stoner-Instabilität, 582 Störstellen-Bänder, 553 Störstellenerschöpfung, 261, 554 Störstellenreserve, 554 Stoßterm, 647 Strahlungsdruck, 449 Streuquerschnitt, 237 Streuung – Elektron-Loch-Phonon-, 562 – Elektron-Phonon-, 459, 538 – quadratische, 325, 344, 421 Strom, 30 Stromdichte, 37 Strom-Phasen-Relation, 430 Sublimation, 280 Sublimationsenthalpie, 284 Sublimationskurve, 280, 314 suprafluid, 481 Suprafluidität, 481 Supra-Komponente, 488 Supraleck, 485 supraleitende Kohärenzlänge, 578 Supraleitung, 568 Suszeptibilität, 56 – magnetische, 155, 345 – thermodynamische, 167, 364 Suszeptibilitätsmatrix, 168, 204, 271 Symmetrie, 402 Symmetriefaktor, 383 symmetrisches Molekül, 381 System, 10, 189 – zusammengesetztes, 192, 426 Systembeschreibung, 167 System-charakterisierende Funktion, → Massieu-Gibbs-Funktion system-charakterisierende Funktion, 31 Systemkonstante, 13 Systemzerlegung, 192, 389, 508 T Taupunkt, 314 Teilchen, 83, 318 – /Anti-Teilchen-Paar, 509
Stichwortverzeichnis
– /Loch-Asymmetrie, 545 – -dichte, 84, 240, 500 – -kapazität, 168, 184, 243, 294, 421, 503 – -Loch-Asymmetrie, 541 – -strom, 258, 269, 431 – -zahl, 82 Temperatur, 45 – absolute, 49, 126, 154, 159 – empirische, 49, 155 – negative, 341 – ultratiefe, 339, 478 Temperaturausgleich – irreversibler, 70 – reversibler, 124 Tensorprodukt, 192, 391, 534 Theorem der korrespondierenden Zustände, 310 thermisch – de Broglie-Wellenlänge, 396, 434 – Fluktuation, 346 – Gleichgewicht, 66 – Leitwert, 606 – Rauschen, 343 – Relaxationszeit, 65, 79, 109, 200 – Strahlung, 255, 342 – Zustandsgleichung, 88 Thermo– diffusion, 259 – dynamisch instabil, 293 – dynamisch konjugiert, 29 – dynamischer Limes, 406 – elastische Kopplung, 129, 130, 371, 463 – elektrischer Qualitätsfaktor, 558 – elektrizität in Halbleitern, 556 – element, 66 – kraft, 264, 540, 604 – Alkali-Metall, 544 – dotiertes In2 O3 , 543 – dotiertes Silizium, 557 – Supraleiter, 265 – phorese, 260 – spannung, 67, 265 Thomas-Fermi-Abschirmlänge, 248, 262, 504, 505, 523 Tonzylinder, 238, 259 totales Differenzial, 32, 620 Translationsanregung, 397 Translationsfreiheitsgrad, 103, 177, 392 Transparenz, 591 Transportgleichung, 237, 534
| 663
Transport-Kanal, 600 Transportkoeffizient, 64, 269 – des Fermi-Gases, 538 – Matrix, 269, 540 Trennung der Veränderlichen, 97, 284 Tripelpunkt, 51, 280 Trouton’sche Regel, 277 Tunnelaufspaltung, 366 Tunneleffekt, 591 Turbine, 118 U Übergangsenthalpie, 277, 286 Übergangsentropie, 279 Übergangstemperatur, 277 überhitzt, 307 überkritisches Fluid, 312 Umklapp-Prozess – in der Elektron-Phonon-Streuung, 545 – in der Phonon-Phonon-Streuung, 471 umlaufene Fläche, 135 Umwandlung von Energie, 37, 135 unabhängige Teilsysteme, 128 universelle Gaskonstante, 90 unkorrelierte Zufallsgröße, 626 Unschärfe, 12, 622 – der Elektronenzahl, 575 – der Energie, 325, 343 – der Teilchenzahl, 423, 424 ununterscheidbar, 178, 319, 397, 411 unvollständige Entmischung, 532 Unzerlegbarkeit, 128, 134, 156 uphill-diffusion, 295 V van der Waals’sche Zustandsgleichung, 296 van Hove-Singularität, 598 Variable – äußere, 193, 281 – extensive, 29 – gleichartige, 193 – innere, 281 – intensive, 29 – thermodynamisch konjugierte, 29 Varianz, 325, 622 Verarmungszone, 559 Verbraucher, 123 Verbrennungsmotor, 137 Verbrennungsreaktion, 119
664 | Stichwortverzeichnis Verdampfungsenthalpie, 283 Verdampfungsentropie, 277 Verdampfungskühlung, 284 Verdrängerkolben, 138 verdünnte Lösung, 209 Verdunstungskälte, 285 Verteilungsfunktion, 94, 96, 624 Verzerrungsfeld, 242 Virialkoeffizient, 297 viskoses Medium, 250 Viskosität, 63, 251 – der Supraflüssigkeit, 480, 487 Volumen, 87, 100 Vorspannung, 592 W Wahrscheinlichkeits – amplitude, 324 Wahrscheinlichkeits-, 324, 622 – dichte, 623 – verteilung, 93, 622 Wärme, 47, 121, 132 – -bad, 342 – -differenzial, 141 – -diffusionskoeffizient, 75, 253 – -inhalt, 47 – -intensität, 45 – -isolation, 77 – -kraftmaschine, 74, 264 – latente, → latente Wärme – -leitung, 253 – -leitungsgleichung, 75 – -leitungsprozess, 73 – -leitwert, 63 – -menge, 45, 46 – Peltier-, 262 – -reservoir, 65, 122 – -schalter, 158 – -strom, 71, 253, 269 Wärmekapazität, 53, 67, 68, 148, 268, 373, 380, 388 – bei konstantem chemischen Potenzial, 102 – bei konstantem Druck, 101 – bei konstantem Magnetfeld, 337 – bei konstantem Volumen, 100 – des Phononengases, 460 – des Photonengases, 449 – ideales Gas, 527 – spezifische, 55, 103
– des entarteten Fermi-Gases, 512 – von Festkörpern, 375 – Temperaturunabhängigkeit, 58 Wärmeleitfähigkeit, 74, 253, 469 – Wärmeleitfähigkeitstensor, 546 Wasserpumpe, 119 Wasserstoff-Halogenid, 381 Wasserstrom, 118 Wasserwert, 68 Wechselwirkung, 289, 518 Weißer Zwerg, 583 Wert (einer Größe), 11, 325, 328 Widerstandsthermometer, 66 Wiedemann-Franz-Gesetz, 76, 254, 266, 546 Wien’sches Verschiebungsgesetz, 449 Windungspunkt, 309 Wirkungsquerschnitt, 237 Y Yukawa-Potenzial, 249 Z Zeitumkehr, 57 Zener-Diode, 564 Zerlegbarkeit, 128, 192, 390, 391 Zerlegung eines Vielteilchensystems, 476 zirkulare Polarisation, 332 Zirkulationsrate, 530 Zufallsgröße, 324, 345 Zufallsvariable, 416 Zusammengesetztes Quantensystem, 391 Zustand, 11 – Nichtgleichgewichts-, 190 Zustandsdichte, 395, 426, 549, 618 – bei der Fermi-Energie, 501 – eines eindimensionalen Kanals, 598 – von Supraleitern, 594 Zustandsdichte des Photonensystems, 445 Zustandsgleichung, 14, 167, 421, 426 – entropische, 427 – Hooke’sches Gesetz, 24 – kalorische, 53, 95, 184, 304, 427, 499 – entartetes Fermi-Gas, 512 – Fermi-Flüssigkeit, 520 – magnetische, 336 – massive Bosonen, 474 – thermische, 88, 184, 427, 499 – entartetes Fermi-Gas, 510 – Fermi-Flüssigkeit, 520
Stichwortverzeichnis
– Phononensystem, 458 – Polymere, 371 Zustandsintegral, 371 Zustandsoperator, 327 Zustandssumme, 345, 373, 379, 386, 390, 391 – für einen Einzelspin, 334 – großkanonische, 419, 491, 520 – kanonische, 333, 361
– Translations-, 396 Zustandsvektor, 324 zweiatomiges Gas, 104, 267 Zwei-Flüssigkeitsmodell, 481 zweikomponentige Mischung, 289 Zwei-Niveausystem, 404 Zweiphasenzustand, 305 zweite Quantisierung, 414
| 665
VIIIA
Gase
2
4.0026
He
Nichtmetalle
Helium
Metalle fcc bcc sc tet orc hex dia rhl mcl
VIIIB
63.546 30
Ni
8.9 3.52 1726 46
Cu
Nickel
fcc 8.96 7.1 3.61 375 1356 106.40 47
Kupfer
Pd
Palladium fcc 9.42 275 195.09
12.0 3.89 1825 78
Pt
10.5 4.09 1234 79
fcc 19.3 6.8 4.08 230 1337 281 111
Ds
Ag
Au
Rg
Zink
hex 0.65 234 112.40
157.25 65
Gd
Cd
hex 0.69 120 200.59
Hg
fcc 13.6 0.75 2.99 170 234.3 280 112
Cn
Gadolinium 8.23 3.64 1585 96
Cm
158.92 66
Terbium
hex 8.54 10 3.60 176 LT 1633 247 97
Curium
Bk
Berkelium
Tl
tet 7.30 1.6 5.82 129 505 204.37 82
Californium
10
Blei
13.51
hex 14.78
hex 15.1
hex 8.84
1600
1259
1173
1133
Bi
Erbium
Fm
Fermium 1125
hex 4.10 6.67 LT 150 266 127.60 53
Te
Po
hex 4.94 7.27 139LT 387 210 85
Thulium
Md
Mendelevium
(4.4)
10
Ytterbium
No
fcc 2.9 118LT 254
Nobelium
117
10
5f 14 6d 7s2 7p5
173.04 71
Yb
LT
73 131.30
Xe
fcc
5
LT
55 222
Rn
Radon
(fcc)
Uuo
14
Lu
Lutetium
Lr
hex 11.3 207LT 257
Lawrencium
10
6
118
5f 6d 7s2 7p6
174.97
9.84 3.51 1929 103
4
Ununoctium
Uus
116
fcc
(202)
Ununseptium
5f 14 6d 7s2 7p4
hex 6.97 10.5 5.49 200LT 1097 256 102
At
orc 3.77 6.20 161.3 210 86
3
85 83.80
Xenon
(575)
Lv
168.93 70
Tm
I
Kr
fcc
Krypton
orc 3.07 5.72 116.5 126.90 54
Astat
sc
Livermorium 115
Argon
orc 1.78 5.26 83.9 79.904 36
Br
2
Ar
Chlor
Brom
fcc
63 39.948
Jod
rhl 9.4 0.021 3.35 120 527
10
hex 9.31 3.54 195LT 1818 257 101
Se
Selen
26 20.18
Neon
mcl 1.56 4.43 24.5 35.453 18
1
LT
Ne
Cl
orc 2.09 6.24 172.2 78.96 35
Polonium
5f 14 6d 7s2 7p3
167.26 69
Er
hex 9.37 3.56 191 LT 1759 254 100
Einsteinium
rhl 6.24 0.105 4.45 200 723 208.98 84
Uup
114
S
(γ)46 53.5 32.064 17
Tellur
Ununpentium
10
Holmium
Sb
Bismut
5f 14 6d 7s2 7p2
164.93 68
rhl 4.79 0.20 4.36 285 490 121.75 52
fcc 9.8 3.0 4.75 88 544.5
F
18.998
Fluor
sc 1.97(α)
2.07 10.47 386 34
Arsen
6.62 4.51 904 83
VIIA
15.999 9
Schwefel
Antimon
Fl
Ho
Es
Sn
Pb
113
5f 14 6d 7s2 7p1
hex 9.05 3.58 186LT 1743 251 99
dia 5.72 4.13 360 1090 118.69 51
Flerovium
Uut
As
Ge
O
hex 1.43 6.83 (ß)79LT 54.7 30.974 16
dia 1.82 orc 7.17 625 317.3 72.63 33 74.92159
tet 1.78 170 207.19
hex 11.4 1.5 4.95 96 601
P
VIA
14.007 8
Phosphor
Zinn
Thallium
162.50 67
Dy
Cf
In
7.31 4.59 429.8 81
Si
Germanium
orc 5.32 0.60 5.66 240 1211 114.82 50
rhl 11.85 1.8 3.46 100 577 277 Ununtrium
Dysprosium
hex 8.78 3.59 188 LT 1680 247 98
Ga
Gallium
2.33 5.43 1683 32
N
dia 1.03 4.039 1860 63.3 28.086 15
Silicium
Indium
Quecksilber
Tb
fcc 1.35 394 69.72
5.91 4.51 303 49
Darmstadtium Roentgenium Copernicium
64
Al
Aluminium
VA 12.01 7
C
tet 2.26 3.57 1250 (4300) 26.982 14
2.34 8.73 2600 13
Cadmium
fcc 8.65 0.650 2.98 215 594 196.97 80
Gold
B
Zn
7.14 2.66 693 48
Silber
Platinum
21.4 3.92 2045 110
fcc 0.668 315 107.87
IVA
10.81 6
Bor
2.70 4.05 IIB 933 65409 31
IB
58.6934 29
28
IIIA 5
kubischkubisch-raumzentriert einfach kubisch tetragonal orthorombisch hexagonal Diamantstruktur rhomboedrisch monoklin
hex
0.179 3.57 ~1.0
6)
7)
7
IA 1
1
2
3
4
5
6
7
1.0079
H
0.089 3.75 14.0 3
Li
bcc 1.63 400 22.9898
0.53 3.49 453 11
Na
Natrium 0.97 4.23 371.0 19
IIA
110 6.94 4
Lithium
bcc 1.4 150 39.09
K
Be
Rb
Rubidium 1.53 5.59 312 55
Cs
Fr
hex 0.17 1160
Schmelztemperatur (K)
(bei 1 bar, mit Ausnahme von He: 25 bar).
bcc 2.4 56LT 85.47
bcc 3.2 LT 40 223
1.74 3.21 922 20
Debye-Temperatur (K)
24.305
Mg
Ca
1.54 5.58 1111 38
hex 1.3 318 40.08 21
Sr
fcc 2.9 230 87.62
IIIB
2.60 6.08 1043 56
Sc
hex 4.51 11 2.95 LT 359 1933 88.91 40
Y
Yttrium
fcc 4.46 3.6 3.65 147LT 1796 137.34
Ba
Ra
Ti
Scandium 2.99 3.31 1812 39
Barium 3.5 5.02 998 88
IVB
44.956 22
Strontium
Francium
bcc 2.7 LT 110 226
hex 6.1 3.5 3.02 380 2163 91.22 41
Hf
*
V
Rf
bcc 9.8 390 92.91
Nb Niob
bcc 7.79 275 180.95
8.4 3.30 2741 73
Hafnium 13.1 3.20 2495 104
50.942 24
Cr
Ta
7.19 2.88 2130 42
Db
bcc 5.9 225 262
Dubnium
Rutherfordium
VIIIB
54.938 26
Mangan
bcc 1.40 460 95.94
Mo
7.43 8.89 1518 43
Tc
Wolfram
Rhenium
W
Sg
bcc 1.21 310 263
Re
21.0 2.76 3453 107
Seaborgium
Bh
VIIIB
55.85 27
58.93
Co
Cobalt
Eisen
sc 14 400 98.91
Technetium hex 11.5 2.74 2445 75 186.2
19.3 3.16 3683 106
Fe
Mn
Molybdän bcc 10.2 2.0 3.15 380 2890 74 183.85
Tantal
hex 16.6 2.16 3.31 252 261 105
VIIB
52.00 25
Chrom
Vanadium
Titan
Zr
VIB
VB 47.90 23
Zirconium hex 6.49 hex 2.80 10.2 3.23 256LT 2125 250 72 178.49
* *
Radium
(bcc) (5.0) (300)
Sommerfeldkonstante γ ‘ (mJ / mol K2)
Magnesium
Caesium 1.90 6.05 302 87
Gitterkonstante a (Å)
Calcium
bcc 2.1 100 85.47
Atomgewicht
hex 1.3 318
1.74 3.21 922
Dichte (g/cm 3 )
Beryllium 1.85 2.29 1550 12
24.305
Mg
Magnesium
9.0122
Kalium 0.86 5.23 337 37
12
Ordnungszahl
hex
7.86 2.87 1808 44
bcc 5.0 420 101.07
Ru
8.9 2.51 1768 45
hex 4.7 385 102.90
Rh
Ruthenium Rhodium hex 12.4 fcc 12.2 3.3 3.80 4.9 2.70 382 LT 2239 350 LT 2583 76 190.20 77 192.22
Ir
Os
Osmium
hex 22.6 2.3 2.74 LT 416 3318 262 108
Bohrium
Hs
Iridium
hex 22.5 2.4 3.84 LT 400 2683 265 109
Hassium
fcc 3.1 430 266
Mt
Meitnerium
973
Seltene Erden 138.91 58
57
*
(Lanthanoide
* *
(Actinoide
140.12 59
La
Lanthan
6.17 3.75 1193 89
Ac
hex 10 132 227
Actinium
10.1 5.31 1323
Ce
6.77 5.61 1071 90
Cer
Th
Thorium
fcc 11.7 5.08 2020
Praseodym
fcc 6.77 3.42 LT 139 1204 232.04 91
Pa
Nd
Neodym
hex 7.00 3.66 LT 152 1283 231 92
Protactinium
fcc 15.4 4.7 3.92 100 1470
144.24 61
140.91 60
Pr
tet 19.07 2.85 1406
hex
157 (1350) 238.03 93
Uran
Sm
Np
Eu
Samarium
hex 7.54 9.00 1345 237.05 94
Neptunium
orc 20.3 10.3 4.72 LT 210 913
150.35 63
145 62
Promethium
LT
U
Pm
Pu
Europium rhl 7.90 bcc 4.61 LT 166 1095 107 244 95 243
Plutonium
orc 19.8 5.8 LT 188 914
Am
Americium
mcl 11.8 13 LT 150 1267
hex
Maßsystem-Konstanten 2.9979 · 108 m/s 6.022 14 · 1023 Teilchen/mol 1.660 54 · 10−24 mol = 1 Teilchen 1.6605 · 10−27 kg/Teilchen 8.3145 J/(mol K) 1.3807 · 10−23 J/(Teilchen K) 24.414 · 10−3 m3 /mol
Lichtgeschwindigkeit c Avogadro-Konstante NA Elementares Mengenquantum τN Atomare Masseneinheit u Universelle Gaskonstante R Boltzmann-Konstante kB = R/NA Molvolumen idealer Gase vˆ◦ (bei T ◦ = 298.15 K, p◦ = 101 325 Pa) Planck’sche Konstante h = h/2π Elementarladung e Faraday-Konstante F = eNA
6.6261 · 10−34 J s/Teilchen 1.0546 · 10−34 J s/Teilchen 1.6022 · 10−19 C/Teilchen 96 485 C/mol
Umrechnung Volt → Hertz Umrechnung Volt → Kelvin Umrechnung Tesla → Kelvin
h/e e/kB μB /kB
4.14 GHz/μV 11 604 K/V 0.6717 K/T
Magnetisches Flussquantum Magnetische Feldkonstante Elektrische Feldkonstante
Φ0 = h/2e 2.07 mT μm2 = 2.07 GHz/μV μ0 4π · 10−7 Vs/(Am) = 1.2566 · 10−6 Vs/(Am) 0 = 1/μ0 c2 8.8542 · 10−12 As/(Vm) 1/4π0 c2 · 10−7 As/(Vm) = 8.9876 · 109 Vm/(As) μB 9.2740 · 10−24 J/(TeilchenT) μN 5.0508 · 10−27 J/(TeilchenT) a0 4π0 2 /Me e2 = 52.918 pm
Bohr’sches Magneton Kern-Magneton Bohr’scher Radius Magnetisches Moment des Elektrons des Protons
|m|e |m|p
9.2848 · 10−24 J/T 1.4106 · 10−26 J/T
Gravitationskonstante Gravitationsfeldstärke bei 50° geographischer Breite
γG
6.6746 · 10−11 N m2 /kg2
g
9.81 m/s2
Ruhemasse des Elektrons
Me Me c2 Mp Mp c2 Mn Mn c2 Mp /Me R∞ α
9.1094 · 10−31 kg 0.511 00 MeV 1.6726 · 10−27 kg 938.27 MeV 1.6749 · 10−27 kg 939.57 MeV 1836.1527 13.6058 eV/Teilchen 7.297 352 57 · 10−3 ≈ 1/137
λc
2.426 315 08 · 10−12 m
Ruhemasse des Protons Ruhemasse des Neutrons Massenverhältnis p+ zu e− Rydberg-Konstante Feinstrukturkonstante Compton-Wellenlänge des Elektrons