134 70 7MB
English Pages 858 [845]
Reinhart Weber
Physik Teil I: Klassische Physik – Experimentelle und theoretische Grundlagen
Reinhart Weber
Physik
Reinhart Weber
Physik Teil I: Klassische Physik – Experimentelle und theoretische Grundlagen
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. Prof. Dr. rer. nat. Reinhart Weber Geboren 1932 in Königsberg, Ostpreußen. Abitur 1953 am Naturwissenschaflichen Gymnasium Spiesergasse (jetzt Albertus-Magnus-Gymnasium). Anschließend Physikstudium in Köln, Frankfurt a. M. und Freiburg, Br. Dissertation unter Professor L. Genzel, Promotion 1967. Danach 2 Jahre Research Associate an der Cornell-University in Ithaca, N.Y., USA bei Prof. A. J. Sievers. Von 1969 bis 1974 Assistent am 2. Physikalischen Institut der Universität Stuttgart bei Professor H. Pick. Habilitation 1974. Seit 1974 Professor an der Fakultät Physik der Universität Konstanz. Forschungsgebiete Festkörperphysik. Clusterphysik, Physik der weichen Materie, hauptsächlich mit Methoden der optischen Spektroskopie. Seit 1997 im Ruhestand.
1. Auflage 2007
Alle Rechte vorbehalten © B. G. Teubner Verlag / GWV Fachverlage GmbH, Wiesbaden 2007 Lektorat: Ulrich Sandten / Kerstin Hoffmann Der B. G. Teubner Verlag ist ein Unternehmen von Springer Science+Business Media. www.teubner.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Waren- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Ulrike Weigel, www.CorporateDesignGroup.de Druck und buchbinderische Verarbeitung: Strauss Offsetdruck, Mörlenbach Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8351-0065-7
Inhaltsverzeichnis Einführung…………………………………...…………………………………………....…I I
Mechanik
1
Kinematik…………………………………………………………………….. 5
1.1
Bewegung in einer Dimension………………………………………………………….. 5 1.1.1 Mittlere Geschwindigkeit und Momentangeschwindigkeit…………………… 5 1.1.2 Beschleunigung………………………………………………………………... 6 Bewegung in drei Dimensionen………………………………………………………… 7 1.2.1 Der Begriff des Massenpunktes……………………………………………….. 7 1.2.2 Ortsvektor und Geschwindigkeit…………………………………………….... 7 1.2.2.1 Relativgeschwindigkeit…………………………………………….. 8 1.2.3 Beschleunigung……………………………………………………………….. 9 1.2.3.1 Bewegung mit konstanter Beschleunigung……………………….. 10 1.2.3.2 Bewegung mit nicht-konstanter Beschleunigung………………… 12
1.2
Zusammenfassung…………………………………………………………………………….. 13 Übungsaufgaben………………………………………………………………………………..15
2
Bezugssysteme in gleichförmiger Geschwindigkeit……………………….. 17
2.1 2.2 2.3
Inertialsysteme……………………………………………………………………….... 17 Die Lichtgeschwindigkeit……………………………………………………………… 18 Lorentz-Transformation………………………………………………………………. 18 2.3.1 Konsequenzen der Lorentz-Transformation………………………………… 20 2.3.1.1 Relativität der Gleichzeitigkeit…………………………………… 20 2.3.1.2 Längenkontraktion……………………………………………….. 22 2.3.1.3 Zeitdilatation……………………………………………………… 23 2.3.1.4 Relativistisches Additionstheorem der Geschwindigkeiten……… 25 2.3.1.5 Struktur der Raumzeit……………………………………………. 26
Ergänzung: Ableitung der Lorentz-Transformation………………………………………….. 26 Zusammenfassung…………………………………………………………………………….. 28 Übungsaufgaben………………………………………………………………………………. 29
3
Die Grundgleichungen der Mechanik……………………………………... 31
3.1 3.2 3.3
Die Newtonschen Axiome…………………………………………………………….. 31 Messung von Massen………………………………………………………………….. 32 Messung von Kräften………………………………………………………………….. 33
VI 3.4
3.5 3.6 3.7
3.8
Inhaltsverzeichnis Bewegungsgleichung eines Massenpunktes unter dem Einfluss einer Kraft…………. 33 3.4.1 Konstante Kräfte…………………………………………………………….. 34 3.4.2 Ortsabhängige Kräfte………………………………………………………… 35 3.4.3 Zeitabhängige Kräfte………………………………………………………… 36 Elementarteilchen und Kräfte in der Natur……………………………..…………….. 37 Kraftfelder……………………………………………………………………………... 39 Der Energieerhaltungssatz der Mechanik……………………………………………… 39 3.7.1 Arbeit und Leistung…………………………………………………………... 40 3.7.2 Wegunabhängige (konservative) Kräfte……………………………………… 41 3.7.3 Potentielle Energie und kinetische Energie…………………………………... 41 3.7.4 Energieerhaltungssatz………………………………………………………… 43 Anwendungen der Energieerhaltungssatzes…………………………………………… 44 3.8.1 Das Federpendel……………………………………………………………… 44 3.8.2 Fluchtgeschwindigkeit eines Projektils………………………………………. 45
Zusammenfassung…………………………………………………………………………….. 46 Übungsaufgaben…………………………………………………………………………….… 47
4
Systeme von Massenpunkten und Impulserhaltungssatz…………..…..… 49
4.1 4.2 4.3 4.4
Impulserhaltung als Folge des dritten Newtonschen Axioms………………………… 49 Schwerpunkt oder Massenmittelpunkt eines Systems von zwei Massenpunkten……... 51 Verallgemeinerung auf mehrere Massenpunkte………………………………………. 52 Anwendungen des Impulserhaltungssatzes……………………………………………. 54 4.4.1 Stoßprozesse…………………………………………………………………. 54 4.4.1.1 Stöße in einer Dimension…………………………………………. 55 4.4.1.1.1 Der elastische Stoß……………………………………... 55 4.4.1.1.2 Der vollkommen inelastische Stoß…………………….. 56 4.4.1.2 Stöße in zwei und drei Dimensionen…………………………….. 57 4.4.2 Elastischer Stoß im Schwerpunkt-System…………………………………….58 4.4.3 Raketenantrieb als Folge des Impulserhaltungssatzes……………………..… 59
Zusammenfassung…………………………………………………………………………….. 61 Übungsaufgaben………………………………………………………………………………..62
5
Der Drehimpulserhaltungssatz…………………………………………….. 65
5.1 5.2 5.3 5.4 5.5
Drehimpuls eines Massenpunktes und Drehmoment………………………………….. 65 Drehimpuls eines Systems von Massenpunkten………………………………………. 68 Eine einfache Anwendung – Statisches Gleichgewicht……………………………….. 70 Drehbewegungen starrer Körper………………………………………………………. 70 Trägheitsmoment eines starren Körpers……………………………………………….. 72
Inhaltsverzeichnis 5.6 5.7 5.8
5.9
VII
Steinerscher Satz………………………………………………………………………. 74 Experimentelle Verifikation des Drehimpulserhaltungssatzes: Drehschemel-Versuche………………………………………………………………... 77 Rotation um freie Achsen……………………………………………………………... 78 5.8.1 Der Trägheitstensor………………………………………………………….. 78 5.8.2 Freie Achsen…………………………………………………………………. 79 5.8.3 Die Eulerschen Gleichungen…………………………………………………. 80 5.8.4 Der kräftefreie symmetrische Kreisel………………………………………... 82 8.5 5. Die Eulerschen Winkel…………………………………………………….… 85 5.8.6 Der Kreisel unter dem Einfluss einer Kraft: Präzession des symmetrischen Kreisels ..………………………………….… 86 Rotationsenergie………………………………………………………………………. 89
Zusammenfassung…………………………………………………………………………….. 91 Übungsaufgaben………………………………………………………………………………. 92
6
Gravitation……………………………………………………………….….. 95
6.1 6.2 6.3 6.4 6.5
Newtonsches Gravitationsgesetz……………………………………………………… 95 Ermittlung der Gravitationskonstante…………………………………………………. 95 Die Keplerschen Gesetze der Planetenbahnen………………………………………… 96 Bestimmung der Masse von Himmelskörpern………………………………………. 100 Swing-by-Methode für Weltraumsonden……………………………………………. 101
Ergänzung: Rutherfordstreuung als Beispiel einer Potentialstreuung ………………………..101 Zusammenfassung…………………………………………………………………………... 103 Übungsaufgaben…………………………………………………………………………..… 104
7
Relativistische Dynamik…………………………………………………... 105
7.1 7.2 7.3
Relativistischer Impuls und relativistische Massenzunahme………………………… 105 Relativistische Kraft………………………………………………………………….. 107 Kinetische Energie, Gesamtenergie, Masse-Energie-Äquivalenz……………………. 109
Zusammenfassung…………………………………………………………………………… 111 Übungsaufgaben……………………………………………………………………………... 113
VIII
8
Inhaltsverzeichnis
Beschleunigte Bezugssysteme………………………………………...…… 115
8.1 8.2
Geradlinig beschleunigte Bezugssysteme……………………………………………. 115 Gleichförmig gegeneinander rotierende Bezugssysteme……………………………. 116 8.2.1 Zentrifugalkraft……………………………………………………………... 116 8.2.2 Corioliskraft………………………………………………………………… 116 8.2.3 Anwendungsbeispiele………………………………………………………. 118 8.2.3.1 Erdbeschleunigung unter dem Einfluss der Zentrifugalkraft……. 118 8.2.3.2 Beispiele für Corioliskräfte……………………………………… 119 Ergänzung: Ableitung von Zentrifugal- und Corioliskraft………………………………….. 119 Zusammenfassung………………………………………………………………………….... 122 Übungsaufgaben…………………………………………………………………………..…. 122
9
Eigenschaften realer Festkörper………………………………………….. 123
9.1 9.2
Atomare Kräfte und Aggregatzustände……………………………………………… 123 Deformierbare Festkörper……………………………………………………………. 124 9.2.1 Kompression……………………………………………………………...… 124 9.2.2 Dehnung bzw. Stauchung………………………………………………...… 125 9.2.3 Scherung……………………………………………………………………. 127 Reibungskräfte zwischen Festkörpern……………………………………………….. 128 9.3.1 Haftreibung…………………………………………………………………. 128 9.3.2 Gleitreibung………………………………………………………………… 129 9.3.3 Rollreibung…………………………………………………………….…… 129 Zur Mechanik deformierbarer fester Körper – Allgemeine Behandlung……………. 130 9.4.1 Der Deformationstensor…………………………………………………….. 130 9.4.2 Lineare Dehnung……………………………………………………………. 132 9.4.3 Winkeländerungen………………………………………………………….. 133 9.4.4 Volumenänderungen……………………………………………………..… 133 9.4.5 Aufspaltung des Deformationstensors……………………………………… 134 9.4.6 Spannungstensor……………………………………………………………. 135 9.4.7 Hookesches Gesetz…………………………………………………………. 135
9.3
9.4
Zusammenfassung……………………………………………………………………….….. 136 Übungsaufgaben……………………………………………………………………………... 138
Inhaltsverzeichnis
IX
10
Eigenschaften flüssiger und gasförmiger Materie……………….………. 139
10.1
Ruhende Flüssigkeiten……………………………………………………………….. 139 10.1.1 Verschiebbarkeit der Flüssigkeitsteilchen……………………………….… 139 10.1.2 Statischer Druck und Auftrieb……………………………………………… 140 10.1.3 Anwendungen………………………………………………………………. 142 Flüssigkeitsgrenzflächen……………………………………………………………... 143 10.2.1 Oberflächen- und Grenzflächenspannung………………………………….. 143 10.2.2 Kapillarität………………………………………………………………….. 146 Gase……………………………………………………………………………….…. 147 10.3.1 Gasdruck als Folge ungeordneter Bewegung der Moleküle……………….. 147 10.3.2 Barometrische Höhenformel……………………………………………….. 148 10.3.3 Diffusion……………………………………………………………………. 149 Strömende Flüssigkeiten und Gase………………………………………………….. 150 10.4.1 Grundbegriffe……………………………………………………………….. 150 10.4.2 Strömungen idealer Flüssigkeiten…………………………………………... 151 10.4.2.1 Eulersche Gleichung…………………………………………….. 151 10.4.2.2 Kontinuitätsgleichung…………………………………………… 152 10.4.2.3 Bernoulli-Gleichung…………………………………………….. 154 10.4.2.4 Anwendungsbeispiele…………………………………………… 156 10.4.3 Innere Reibung……………………………………………………………… 157 10.4.3.1 Allgemeiner Ausdruck für die Reibungskraft…………………… 157 10.4.3.2 Stokessches Reibungsgesetz, Kugelfallviskometer………….….. 159 10.4.3.3 Laminare Strömungen durch Rohre……………………………... 160 10.4.3.4 Navier-Stokes-Gleichung………………………………………... 162 10.4.3.5 Entstehung und Charakterisierung von Wirbeln………………… 164
10.2
10.3
10.4
Zusammenfassung…………………………………………………………………………….169 Übungsaufgaben……………………………………………………………………………... 171
11
Mechanische Schwingungen und Wellen………………………….…..…. 173
11.1 11.2 11.3 11.4 11.5 11.6 11.7
Lineares Kraftgesetz und harmonische Schwingungen……………………………… 173 Freie gedämpfte Schwingungen…………………………………………………… . 174 Erzwungene Schwingungen………………………………………………………….. 178 Energiebilanz bei der linearen Schwingung…………………………………………. 181 Gekoppelte Oszillatoren…………………………………………………………..… 185 Mechanische Wellen…………………………………………………………………. 188 Fortschreitende Wellen, Wellengleichung…………………………………………… 188 11.7.1 Harmonische Wellen……………………………………………………….. 190 Stehende Wellen……………………………………………………………………… 191
11.8
Inhaltsverzeichnis
X
11.9 Überlagerung von Wellen – Dispersion……………………………………………… 196 11.10 Der Dopplereffekt. …………………………………………………………………… 197 11.10.1 Dopplereffekt bei Wellen, die an ein Medium gebunden sind…………… 197 11.10.2 Dopplereffekt bei elektromagnetischen Wellen…………………………….. 200 Zusammenfassung………………………………………………………………………….... 201 Übungsaufgaben………………………………………………………………………….….. 202
12
Analytische Mechanik……………………………………………………... 205
12.1
Das Hamiltonsche Prinzip und die Lagrangesche Form der Mechanik…………….... 205 12.1.1 Das Hamiltonsche Prinzip………………………………………………….. 205 12.1.2 Verallgemeinerte Koordinaten……………………………………………… 207 12.1.3 Verallgemeinerte Kräfte…………………………………………………….. 213 Hamiltonsche Theorie…………………………………………………………………215 12.2.1 Grundlagen………………………………………………………………….. 215 12.2.2 Kanonische Transformation………………………………………………… 219 12.2.3 Hamilton-Jacobische Gleichung……………………………………………. 223 12.2.4 Behandlung des eindimensionalen harmonischen Oszillators im Hamiltonformalismus…………………………………………………… 225 12.2.5 Die Poissonklammer…………………………………………………..…… 228
12.2
Zusammenfassung…………………………………………………………………………... 234 Übungsaufgaben………………………………………………………………………………236
II
Thermodynamik
13
Phänomenologische Wärmelehre……………………………….…….…... 237
13.1 13.2 13.3
Grundgröße Temperatur……………………………………………………………… 237 Wärmemenge und spezifische Wärme……………………………………….………. 242 Wärmeleitung……………………………………………………………………...…. 244 13.3.1 Wärmeleitung in festen Stoffen…………………………………………….. 244 13.3.2 Wärmeleitung in Flüssigkeiten und Gasen…………………………………. 247 13.4 Zustandsgrößen und Zustandsgleichungen…………………………………………… 247 13.5 Einbeziehung der Wärmeenergie in den Energieerhaltungssatz: Der erste Hauptsatz………………………………………………………………........250 13.6 Anwendungen des ersten Hauptsatzes auf einphasige Einkomponentensysteme……. 251 13.6.1 Isochore Prozesse…………………………………………………………… 252 13.6.2 Isobare Prozesse……………………………………………………………. 252
Inhaltsverzeichnis
XI
13.6.3 Isotherme Prozesse…………………………………………………………. 253 13.6.4 Adiabatische Prozesse………………………………………………………. 254 13.7 Verwandelbarkeit von Wärme in Arbeit: Der zweite Hauptsatz…………………….. 256 13.7.1 Reversible und irreversible Prozesse……………………………………….. 256 13.7.2 Der Carnotsche Kreisprozess……………………………………………….. 257 13.7.3 Der Otto-Motor…………………………………………………………….. 260 13.7.4 Der zweite Hauptsatz……………………………………………………….. 262 13.7.5 Entropie…………………………………………………………………….. 262 13.7.6 Thermodynamische Temperaturskala………………………………………. 267 13.7.7 Ableitung der Maxwell-Geraden………………………………………….... 267 13.7.8 Der Joule-Thomson-Versuch……………………………………………….. 268 13.8 Thermodynamische Potentiale……………………………………………………….. 270 13.9 Der dritte Hauptsatz………………………………………………………………….. 276 13.10 Anwendung der Hauptsätze auf mehrphasige Einkomponentensysteme……………. 281 13.10.1 Temperaturabhängigkeit des Gleichgewichtsdruckes verschiedener Phasen 281 13.10.1.1 Einführung in die Theorie………………………………………. 281 13.10.1.2 Dampfdruckkurve……………………………………………….. 283 13.10.1.3 Schmelzdruckkurve und Sublimationsdruckkurve……………… 287 13.11 Anwendung der Hauptsätze auf einphasige Mehrkomponentensysteme……………. 289 13.11.1 Thermodynamische Potentiale von idealen Gasen und Gasmischungen…… 289 13.11.2 Chemisches Gleichgewicht und Massenwirkungsgesetz…………………… 293 13.12 Anwendung der Hauptsätze auf mehrphasige Mehrkomponentensysteme………….. 296 13.12.1 Gibbssche Phasenregel……………………………………………………… 296 13.12.2 Osmose…………………………………………………………………….... 297 13.12.3 Dampfdruckerniedrigung…………………………………………………… 299 13.12.4 Siedepunkterhöhung und Gefrierpunkterniedrigung……………………….. 302 Zusammenfassung…………………………………………………………………………… 303 Übungsaufgaben………………………………………………………………………………306
14
Kinetische Gastheorie……………………………………………………… 309
14.1 14.2 14.3 14.4 14.5 14.6
Temperatur…………………………………………………………………………... 309 Poissongleichungen………………………………………………………………….. 311 Boltzmannverteilung……………………………………………………………….… 313 Maxwell-Boltzmannsche Geschwindigkeitsverteilung…………………….………… 314 Mittlere freie Weglänge……………………………………………………………… 318 Statistische Deutung der Entropie……………………………………………………. 319
Zusammenfassung………………………………………………………………………..…. 322 Übungsaufgaben…………………………………………………………………………..… 324
XII
Inhaltsverzeichnis
III
Elektrik und Optik
15
Elektrostatik……………………………………………………….…..…... 325
15.1 Elektrische Ladung………………………………………………………………….. 325 15.1.1 Das Coulomb-Gesetz……………………………………………………….. 325 15.1.2 Maßsysteme……………………………………………………………….... 327 15.2 Elektrisches Feld……………………………………………………………………... 328 15.2.1 Elektrische Feldstärke.…………………………………………………….. 328 15.2.2 Elektrischer Kraftfluss……………………………………………………… 330 15.3 Elektostatisches Potential und elektrische Spannung………………….……………. 332 15.4 Einige spezielle Felder und zugehörige Potentiale…………………………………… 334 15.4.1 Feld einer Punktladung……………………………………………………… 334 15.4.2 Feld zweier gleichnamiger Punktladungen…………………………………. 334 15.4.3 Feld eines elektrischen Dipols……………………………………………… 335 15.4.4 Feld einer geladenen Platte…………………………………………………. 337 15.4.5 Feld einer homogen geladenen Kugel………………………………………. 337 15.4.6 Felder höherer Multipole: Multipolentwicklung des Potentials……………. 338 15.5 Elektrische Ladungen auf Leitern……………………………………………………. 339 15.5.1 Influenz……………………………………………………………………... 339 15.5.2 Kapazität und Kondensatoren………………………………………………. 341 15.5.2.1 Plattenkondensator………………………………………………. 342 15.5.2.2 Koaxialkabel und Kugel………………………………………… 342 15.5.2.3 Parallel- und Reihenschaltung von Kondensatoren…………….. 344 15.6 Elektrisches Feld als Träger der elektrostatischen Energie………………………….. 344 15.7 Dielektrika im elektrostatischen Feld………………………………………………… 345 15.7.1 Dielektrische Suszeptibilität und Dielektrizitätskonstante…………………. 345 15.7.2 Elektrostatische Feldgleichungen in Materie……………………………….. 350 15.7.3 Elektrostatische Feldenergie im Dielektrikum……………………………… 351 15.8 Elektronen und Ionen im elektrischen Gleichfeld……………………………………. 352 15.8.1 Millikan-Versuch…………………………………………………………… 352 15.8.2 Ablenkung von Ladungsträgern im elektrischen Gleichfeld……………….. 353 15.8.3 Kontaktspannung…………………………………………………………… 354 15.8.4 Hohe Spannungen: Teilchenbeschleuniger und Gewitterentstehung……… 355 15.8.5 Elektrostatische Staubabscheider…………………………………………… 356 15.8.6 Xerografie…………………………………………………………………... 357 Ergänzung 1: Multipolentwicklung in kartesischen Koordinaten ………………………… 357 Ergänzung 2: Lokales elektrisches Feld…………………………………………………… 361 Zusammenfassung………………………………………………………………………….... 363 Übungsaufgaben…………………………………………………………………………...... 364
Inhaltsverzeichnis
XIII
16
Elektrischer Strom……………………………………………….……...… 367
16.1 16.2 16.3 16.4
Stationärer elektrischer Strom……………………………………………………….. 367 Elektrischer Widerstand und Ohmsches Gesetz……………………………………… 368 Elektrische Leistung…………………………………………………………………. 370 Stromverzweigungen………………………………………………………………… 371 16.4.1 Kirchhoffsche Regeln………………………………………………………. 371 16.4.2 Reihenschaltung von Widerständen………………………………………… 372 16.4.3 Parallelschaltung von Widerständen……………………………………….. 372 Messung elektrischer Ströme………………………………………………………… 373 16.5.1 Strommessung………………………………………………………………. 373 16.5.2 Spannungsmessung…………………………………………………………. 373 16.5.3 Widerstandsmessung……………………………………………………….. 374 Leitungsmechanismen in Festkörpern, Flüssigkeiten und Gasen……………………. 375 16.6.1 Elektrische Leitung in Metallen……………………………………………. 375 16.6.2 Elektrische Leitung in Halbleitern…………………………………………. 378 16.6.3 Elektrische Leitung in Supraleitern………………………………………… 380 16.6.4 Ionenleitung in Flüssigkeiten………………………………………………. 381 16.6.5 Ladungstransport in Gasen, Gasentladungen………………………………. 383 Stromquellen…………………………………………………………………………. 388 16.7.1 Galvanische Elemente……………………………………………………… 389 16.7.2 Akkumulatoren……………………………………………………………... 390 16.7.3 Brennstoffzellen……………………………………………………………. 391 16.7.4 Solarzellen……………………………………………………………….…. 393 16.7.5 Thermoelemente………………………………………………………….… 395 16.7.6 Kondensatoren als Energiespender………………………………………… 397
16.5
16.6
16.7
Zusammenfassung…………………………………………………………………………… 398 Übungsaufgaben……………………………………………………………………………... 399
17
Statische Magnetfelder………………………………………………..…... 401
17.1
Eigenschaften des magnetischen Feldes………………………………………….….. 401 17.1.1 Permanentmagnete…………………………………………………………. 401 17.1.2 Die Grundgleichungen des magnetischen Feldes im Vakuum…………….. 403 17.1.3 Magnetische Felder einiger spezieller Leiteranordnungen………………… 406 17.1.3.1 Magnetfeld eines homogenen Zylinders………………………… 406 17.1.3.2 Magnetfeld im Inneren einer langen Spule……………………… 406 17.1.4 Das Vektorpotential………………………………………………………… 407 17.1.5 Biot-Savartsches Gesetz für beliebige Stromverteilungen…………………. 408
Inhaltsverzeichnis
XIV 17.1.6
17.2
17.3 17.4
17.5
Anwendungen des Biot-Savartschen Gesetzes……………………………... 410 17.1.6.1 Magnetisches Feld eines geraden, dünnen Leiters……………… 410 17.1.6.2 Magnetisches Feld einer Stromschleife…………………………. 410 17.1.6.3 Magnetisches Feld einer Helmholtz-Anordnung………………... 412 17.1.6.4 Magnetisches Feld einer zylindrischen Spule…………………… 414 Kräfte auf bewegte Ladungsträger im Magnetfeld………………………………….. 415 17.2.1 Lorentzkraft………………………………………………………………… 415 17.2.1.1 Drehspulmessinstrumente……………………………………….. 416 17.2.1.2 Grundlagen magnetischer Linsen……………………………….. 417 17.2.1.2.1 Abbildung im homogenen magnetischen Längsfeld einer langen Spule………………………………….. 417 17.2.1.2.2 Abbildung im inhomogenen magnetischen Längsfeld einer kurzen Spule………………………. 419 17.2.1.2.3 Abbildung durch ein magnetisches Querfeld………. 421 17.2.1.2.4 Geschwindigkeitsfilter……………………………… 423 17.2.1.3 Hall-Effekt ……………………………………………………… 423 17.2.1.4 Kräfte zwischen stromdurchflossenen Leitern………………...... 425 Relativistischer Zusammenhang zwischen elektrischen und magnetischen Feldern…………………………………………………………… 425 Materie im magnetischen Feld……………………………………………………….. 429 17.4.1 Übersicht……………………………………………………………………. 429 17.4.2 Diamagnetismus…………………………………………………………….. 430 17.4.3 Paramagnetismus…………………………………………………………… 431 17.4.4 Ferromagnetismus………………………………………………………….. 431 17.4.5 Andere Formen des Magnetismus………………………………………….. 434 17.4.6 Grundgleichungen des statischen magnetischen Feldes in Materie………… 434 Das Magnetfeld der Erde…………………………………………………………….. 436
Zusammenfassung…………………………………………………………………………… 438 Übungsaufgaben…………………………………………………………………………..… 440
18
Zeitlich veränderliche Felder……………………………………….…..… 443
18.1 18.2
Faradaysches Induktionsgesetz………………………………………………………. 443 Selbstinduktion………………………………………………………………………. 445 18.2.1 Selbstinduktion einer langen Spule…………………………………………. 446 18.2.2 Selbstinduktion eines Koaxialkabels……………………………………….. 448 Gegeninduktion………………………………………………………………………. 449 Energie des magnetischen Feldes……………………………………………………. 451
18.3 18.4
Inhaltsverzeichnis
XV
18.5
Anwendungen des Induktionsgesetzes………………………………………………. 452 18.5.1 Generatoren und Motoren…………………………………………………... 452 18.5.1.1 Gleichstrom-Maschinen…………………………………………. 453 18.5.1.2 Wechselstrom-Maschinen……………………………………….. 456 18.5.1.3 Drehstrom-Maschinen……………………………………..……. 457 18.5.2 Wechselstromkreise mit komplexen Widerständen………………………… 460 18.5.2.1 Stromkreis mit Induktivität……………………………………... 460 18.5.2.2 Stromkreis mit Kapazität……………………………………….. 461 18.5.2.3 Stromkreis Induktivität, Kapazität und Ohmschem Widerstand……………………………………... 461 18.6 Einfache Netzwerke………………………………………………………………….. 464 18.7 Der Transformator …………………………………………………………………… 467 18.7.1 Der ideale Transformator……………………………………………….….. 467 18.7.2 Anwendungen……………………………………………………………… 469 18.8 Wechselstrom-Gleichrichtung……………………………………………………….. 471 18.9 Leistungsanpassung………………………………………………………………….. 472 18.10 Die Grundgleichungen des elektromagnetischen Feldes im Vakuum: Die Maxwell-Gleichungen…………………………………………………………… 473 18.11 Elektromagnetische Schwingungen und Wellen…………………………………….. 477 18.11.1 Elektromagnetische Schwingungen………………………………………… 477 18.11.1.1 Freie gedämpfte Schwingungen…………………………………. 477 18.11.1.2 Erzwungene Schwingungen…………………………………….. 480 18.11.1.3 Gekoppelte Schwingungskreise…………………………………. 481 18.11.2 Elektromagnetische Wellen………………………………………………… 485 18.11.2.1 Wellengleichung und ebene Wellen als deren Lösung………….. 486 18.11.2.2 Das elektromagnetische Feld des Hertzschen Dipol……………. 489 18.11.2.3 Energie und Leistung einer elektromagnetischen Welle………... 492 18.11.2.4 Erzeugung und Nachweis elektromagnetischer Wellen………… 494 18.11.2.5 Röntgenbremsstrahlung und Synchrotronstrahlung…………….. 496 18.11.2.6 Experimentelle Bestimmung der Lichtgeschwindigkeit………… 498 18.11.3 Koaxialkabel, Hohlleiter und Hohlraumresonatoren……………………….. 500 18.11.3.1 Koaxialkabel…………………………………………………….. 500 18.11.3.2 Rechteck-Hohlleiter………………………………………….…. 503 18.11.3.3 Hohlraumoszillatoren……………………………………………. 507 Ergänzung 1: Das elektromagnetische Feld des Hertzschen Dipols………………………. 509 Ergänzung 2: Die Energiestromdichte in einer elektromagnetischen Welle: Der Poyntingvektor…………………………………………………………. 513 Zusammenfassung………………………………………………………………………….... 514 Übungsaufgaben……………………………………………………………………………... 516
XVI
Inhaltsverzeichnis
19
Elektromagnetische Felder in Materie…………………………….…..…. 519
19.1
Elektromagnetische Felder in optisch dünner Materie………………………………. 519 19.1.1 Brechungsindex…………………………………………………………….. 519 19.1.2 Dispersion und Absorption…………………………………………………. 522 19.1.3 Streuung elektromagnetischer Wellen und Teilchen……………………….. 525 19.1.3.1 Einteilung der Streuprozesse……………………………………. 525 19.1.3.2 Formfaktor und Strukturfaktor………………………………….. 526 19.1.3.3 Streuung an geordneten Strukturen – Kohärente Streuung...…… 529 19.1.3.4 Streuung an ungeordneten Systemen – Inkohärente Streuung…... 531 19.1.3.5 Beispiele für inkohärente Streuung……………………………… 532 19.1.3.6 Formfaktor für Kügelchen………………………………………. 533 19.1.3.7 Polarisation des gestreuten Sonnenlichtes………………….…... 535 Elektromagnetische Felder in optisch dichter Materie………………………………. 536 19.2.1 Maxwell-Gleichungen in Materie…………………………………………... 537 19.2.2 Elektromagnetische Wellen in isotropen Dielektrika………………………. 538 19.2.2.1 Brechungsindex…………………………………………………. 538 19.2.3 Elektromagnetische Wellen in Metallen……………………………………. 541 19.2.4 Reflexion und Brechung elektromagnetischer Wellen an nichtleitenden Grenzflächen……………………………………………………………….. 544 19.2.4.1 Stetigkeitsbedingungen………………………………………….. 544 19.2.4.2 Reflexions- und Brechungsgesetz………………………………. 546 19.2.4.3 Intensitäts- und Polarisationsverhältnisse bei Reflexion und Brechung – die Fresnelschen Formeln……………………… 549 19.2.4.4 Reflexions- und Transmissionsvermögen einer Grenzfläche…… 552 19.2.4.5 Der Fall senkrechter Inzidenz…………………………………… 554 19.2.4.6 Brewsterwinkel………………………………………………….. 554 19.2.4.7 Totalreflexion……………………………………………………. 555 19.2.5 Reflexion an Metalloberflächen……………………………………………. 559 19.2.6 Ausbreitung elektromagnetischer Wellen in anisotropen Medien…………. 559 19.2.6.1 Der dielektrische Tensor………………………………………… 560 19.2.6.2 Ebene Wellen im Medium………………………………………. 562 19.2.6.3 Wellen in optisch einachsigen Kristallen……………………….. 566 19.2.6.4 Doppelbrechung…………………………………………………. 572 19.2.7 Erzeugung und Nachweis polarisierten Lichtes………………………….… 573 19.2.7.1 Erzeugung linear polarisierten Lichtes……………………….… 574 19.2.7.2 Erzeugung zirkular und elliptisch polarisieren Lichtes…………. 576 19.2.7.3 Polarisationsdreher………………………………………………. 577 19.2.7.4 Optische Aktivität……………………………………………….. 578
19.2
Inhaltsverzeichnis
XVII
19.2.8 Durchgang von Licht durch isotrope Medien bei Anlegung äußerer Felder……….... 580 19.2.8.1 Faraday-Effekt………………………………………………..…. 580 19.2.8.2 Elektrische Doppelbrechung (Kerr-Effekt)…………………...… 580 19.2.8.3 Magnetische Doppelbrechung (Cotton-Mouton-Effekt)……...… 582 19.2.8.4 Spannungsdoppelbrechung……………………………………… 583 19.3 Nichtlineare Optik ………………………………………………………………...… 584 19.3.1 Nichtlineare Suszeptibilität…………………………………………………. 584 19.3.2 Optische Frequenzverdopplung…………………………………………….. 584 19.3.3 Optische Frequenzmischung……………………………………………….. 585 19.3.4 Phasenanpassung…………………………………………………………… 585 19.3.5 Die Erhaltungssätze bei der Frequenzverdopplung………………………… 586 19.3.6 Nichtlineare Absorption…………………………………………………….. 587 19.3.7 Selbstfokussierung von Licht……………………………………………….. 587 Zusammenfassung…………………………………………………………………………… 589 Übungsaufgaben…………………………………………………………………………….. 592
20
Geometrische Optik……………………………………………….….….... 593
20.1 20.2 20.3 20.4
Grundlagen der Strahlenoptik………………………………………………………... 593 Optische Abbildung………………………………………………………………….. 594 Abbildung durch Hohlspiegel………………………………………………………... 595 Strahlengang in durch Ebenen begrenzten Körpern…………………………………. 598 20.4.1 Ebener Spiegel……………………………………………………………… 598 20.4.2 Planparallele Platte…………………………………………………………. 598 20.4.3 Prismen……………………………………………………………………... 599 Linsen………………………………………………………………………………... 602 20.5.1 Brechung an einer sphärischen Fläche……………………………………… 603 20.5.2 Dünne Linsen……………………………………………………………….. 604 20.5.3 Dicke Linsen………………………………………………………………... 607 20.5.4 Linsensysteme………………………………………………………………. 610 20.5.5 Abbildungsfehler………………………………………………...…………. 611 20.5.5.1 Chromatische Aberration……………………………………..… 612 20.5.5.2 Sphärische Aberration…………………………………………… 613 20.5.5.3 Koma…………………………………………………………….. 615 20.5.5.4 Astigmatismus…………………………………………………… 616 20.5.5.5 Bildfeldwölbung………………………………………………… 617 20.5.5.6 Verzeichnung……………………………………………………. 618 20.5.5.7 Aplanatische Abbildung…………………………………………. 619
20.5
XVIII
Inhaltsverzeichnis
20.5.6 Die Wirkung von Blenden…………………………………………………………... 619 20.5.6.1 Öffnungsblende………………………………………………….. 620 20.5.6.2 Gesichtsfeldblende………………………………………………. 621 20.6 Anwendung der Strahlenoptik auf die Atmosphäre………………………………….. 622 20.6.1 Lichtablenkung in der Atmosphäre………………………………………… 622 20.6.2 Regenbogen………………………………………………………………… 624 Ergänzung 1: Matrizenmethoden der paraxialen Optik…………………………………... 626 20A1.1 Die Brechungsmatrix…………………………………………………………….. 627 20A1.2 Die Translationsmatrix…………………………………………………………… 628 20A1.3 Die Transformationsmatrix………………………………………………………. 629 20A1.4 Hauptebenen……………………………………………………………………... 630 20A1.5 Anwendung auf dicke Linsen……………………………………………………. 632 20A1.6 Abbildungsmatrix einer Linse…………………………………………………… 633 20A1.7 Darstellung des elektrischen Feldvektors……………………………………….. 635 Ergänzung 2: Abbesche Sinusbedingung…………………………………………………. 635 Zusammenfassung…………………………………………………………………………... 638 Übungsaufgaben…………………………………………………………………………..… 639
21
Interferenz und Beugung………………………………………………….. 641
21.1
Interferenz………………………………………………………………………...…. 641 21.1.1 Zeitliche und räumliche Kohärenz…………………………………………. 641 21.1.2 Anordnungen zur Zweistrahlinterferenz………………………………….... 643 21.1.2.1 Fresnelscher Spiegelversuch……………………………………. 643 21.1.2.2 Fresnelsches Biprisma………………………………………….. 645 21.1.2.3 Youngscher Doppelspaltversuch…………………………….….. 645 21.1.2.4 Erzeugung von Interferenzen mit einer planparallelen Platte…… 646 21.1.2.5 Michelson-Interferometer………………………………………. 648 21.1.2.6 Michelson-Morley-Experiment………………………………… 650 21.1.2.7 Fourierspektroskopie……………………………………………. 652 21.1.3 Vielstrahlinterferenz……………………………………………………..… 655 21.1.3.1 Überlagerung von Wellen gleicher Amplitude……………….… 655 21.1.3.2 Überlagerung von Wellen abnehmender Amplitude……………. 656 21.1.3.3 Fabry-Perot-Interferometer……………………………………… 659 21.1.3.4 Lummer-Gehrcke-Platte………………………………………… 661 21.1.4 Antireflexschicht………………………………………………………….... 662 21.1.5 Dielektrische Spiegel ……………………………………………………… 663
Inhaltsverzeichnis 21.2
21.3
XIX
Beugung……………………………………………………………………………... 663 21.2.1 Huygens-Fresnelsches Prinzip……………………………………………… 663 21.2.2 Fraunhofersche Beugung…………………………………………………... 665 21.2.2.1 Beugung am rechteckigen Spalt……………………………...…. 666 21.2.2.2 Beugung am linearen Gitter……………………………………... 667 21.2.2.3 Beugung am Flächen- und Raumgitter………………………..... 671 21.2.3 Fresnelsche Beugung……………………………………………………….. 673 21.2.3.1 Fresnelsche Zonenplatte…………………………………………. 673 21.2.3.2 Fresnelsche Beugung an einem Spalt und einem Draht…….…… 677 21.2.3.3 Fresnelsche Beugung an einer Kante……………………………. 678 21.2.3.4 Fresnelsche Beugung an einer kreisförmigen Öffnung und einer Scheibe……………………………………………..… 678 21.2.4 Babinetsches Theorem……………………………………………………… 680 21.2.5 Holographie………………………………………………………………… 681 21.2.5.1 Prinzip…………………………………………………………… 681 21.2.5.2 Erzeugung eines Hologramms………………………………….. 682 21.2.5.3 Rekonstruktion………………………………………………….. 683 21.2.5.4 Weißlicht-Holographie………………………………………….. 684 21.2.5.5 Anwendungen…………………………………………………… 685 Spektralapparate……………………………………………………………………... 689 21.3.1 Optischer Aufbau…………………………………………………………… 689 21.3.2 Winkel- und Lineardispersion……………………………………………… 690 21.3.3 Auflösungsvermögen……………………………………………………….. 692 21.3.4 Gegenüberstellung von Interferometer- und Gitterspektrometer…………… 695 21.3.5 Lichtstärke von Monochromatoren…………………………………………. 696
Ergänzung 1: Ableitung der Kirchhoffschen Integralformel…………………………….... Ergänzung 2: Entwicklung der Feldamplitude in der Kirchhoffschen Integralformel……. Zusammenfassung……………………………………………………………………..……. Übungsaufgaben……………………………………………………………………………..
698 701 703 705
XX
Inhaltsverzeichnis
22
Optische Instrumente…………………………………………………….... 707
22.1 22.2 22.3
Das menschliche Auge………………………………………………………………. 707 Die Lupe……………………………………………………………………………... 709 Das Mikroskop………………………………………………………………………. 710 22.3.1 Strahlengang, Vergrößerung und Auflösungsvermögen…………………… 710 22.3.2 Abbesche Theorie der Bildentstehung……………………………………... 712 22.3.3 Spezielle Techniken der Mikroskopie………………………………...…… 713 22.3.3.1 Phasenkontrastverfahren……………………………………..… 713 22.3.3.2 Dunkelfeldverfahren…………………………………………… 714 22.3.3.3 Konfokale Mikroskopie………………………………………… 714 22.3.3.4 Optische Nahfeldmikroskopie…………………………………... 716 Das Fernrohr……………………………………………………………………….… 717 Aktive und adaptive Optik…………………………………………………………… 719 Fourieroptik………………………………………………………………………..… 723 22.6.1 Fourierdarstellung der Fraunhoferschen Beugung…………………………. 723 22.6.2 Beugung an einer rechteckigen Blende…………………………………….. 724 22.6.3 Die Linse als Fouriertransformator…………………………………………. 726 22.6.4 Optische Filterung…………………………………………………………... 729 22.6.4.1 Tiefpassfilter…………………………………………………….. 729 22.6.4.2 Hochpassfilter…………………………………………………… 730 22.6.4.3 Zernikesches Phasenkontrastverfahren………………………….. 732 22.6.5 Optische Mustererkennung…………………………………………………. 733 22.6.6 Wirkungsweise des Nahfeldmikroskops…………………………………… 733
22.4 22.5 22.6
Zusammenfassung…………………………………………………………………………... 735 Übungsaufgaben…………………………………………………………………………..… 737
A1
Mathematischer Formel-Anhang…………………………………………. 739
A1.1 Vektorrechnung……………………………………………………………………… 739 A1.1.1 Definition von Vektoren……………………………………………………. 739 A1.1.2 Polare und axiale Vektoren…………………………………………………. 740 A1.1.3 Addition und Subtraktion von Vektoren……………………………………. 740 A1.1.4 Multiplikation eines Vektors mit einem Skalar oder einem Vektor………... 740 A1.1.4.1 Multiplikation eines Vektors mit einem Skalar…………………. 741 A1.1.4.2 Skalare Multiplikation eines Vektors mit einem Vektor………… 741 A1.1.4.3 Vektorielle Multiplikation eines Vektors mit einem Vektor……. 742
Inhaltsverzeichnis
A1.2
A1.3
A1.4 A1.5 A1.6
XXI
A1.1.5 Multiplikation von mehr als zwei Vektoren………………………………... 743 A1.1.5.1 Skalare Multiplikation eines polaren und eines axialen Vektors... 743 A1.1.5.2 Vektorielle Multiplikation eines polaren und eines axialen Vektors………………………………………. 743 A1.1.6 Differentiation eines Vektors nach einem Skalar………………………...… 745 Elemente der Vektoranalysis………………………………………………………… 746 A1.2.1 Der Gradient einer skalaren Funktion……………………………………… 746 A1.2.2 Die Divergenz eines Vektorfeldes…………………………………………. 747 A1.2.3 Die Rotation eines Vektorfeldes…………………………………………… 749 A1.2.4 Der Nabla-Operator, mehrfache Ableitungen…………………………….... 753 A1.2.5 Der Greensche Satz………………………………………………………… 755 Koordinatensysteme…………………………………………………………………. 755 A1.3.1 Kartesische Koordinaten…………………………………………………… 755 A1.3.2 Zylinderkoordinaten………………………………………………………… 756 A1.3.3 Sphärische Koordinaten…………………………………………………….. 757 Komplexe Zahlen……………………………………………………………………. 758 Elemente der Tensorrechnung……………………………………………………….. 761 Grundzüge der Variationsrechnung…………………………………………………. 768 A1.6.1 Variation ohne Nebenbedingungen………………………………………… 769 A1.6.2 Variation mit Nebenbedingungen………………………………………….. 772
Lösungen der Übungsaufgaben………………………………………………….. 775 Literaturverzeichnis……………………………………………………………… 815 Namen- und Sachverzeichnis…………………………………………………….. 821
XXII
Physikalische Konstanten
Gravitationskonstante
G
6,672591 10-11
m3/kg s2
128
Lichtgeschwindigkeit
c
299792458
m/s
exakt
Avogadro-Konstante
6,0221367 10
NA
Boltzmannkonstante
k
1,380658 10
Gaskonstante
R
8,314510
23
-23
1/mol
0,95
J/K
8,5
J/mol K
8,4
3
Molvolumen
VM
22,41410
m /mol
8,4
Dielektrizitätskonstante
H
8,854187817 10-12
As/Vm
exakt
Vs/Am
exakt
Permeabilitätskonstante
μ0
4
-7
10 =
1,25663706 10-6 Plancksche Konstante
h h/2 S
Elementarladung
e
Elektronenmasse
me
spez. Ladung
e/me
=
6,6260755 10
-34
1,0545726 10
34
1,60217733 10 9,1093897 10
mp
1,6726231 10
Massenverhältnis
me/mp
1836,152701
Atomare Masseneinheit
AME
Bohr-Radius
a0
Feinstrukturkonstante
D
Rydbergkonstante
Ry f
-31
-1,7588196 10
Protonenmasse
1,6605402
-19
-11
-27
Js
0,6
Js
0,60
As
0,30
kg
0,59
As/kg
0,59
kg 0,30
10
5,2917725 10
-27
-11
7,29735308 10
7
1,0973731534 10
7
kg
0,59
m
0,045
-
0,045
1/m
0,0012
Nach E.R. Cohen and B.N. Taylor: The 1986 CODATA Recommended Values of the Fundamental Values of the Fundamental Physics Constants, J. Phys. Chem. Ref. Data 17, 1795 – 1803 (1988)
Umrechnungstabelle
XXIII
Energie-Umrechnungstabelle J
eV
cm-1
kWh 18
2,778 10
-7
5,035 10
K 22
7,244 1022
1J
1
6,242 10
1eV
1,6021 10-19
1
4,450 10-26
8,066 103
1,161 104
1kWh
3,60 106
2,247 1019
1
1,812 1027
2,608 1029
cm-1
1,9863 10-23
1,240 10-4
5,518 10-30
1
1,439
1K
1,3805 10-23
8,620 10-5
3,835 10-30
6,950 10-1
1
Einführung In der Frühzeit der Erdgeschichte waren die Menschen mit der Natur eng verbunden Als Jäger und Sammler lebten sie von deren Früchten, waren dabei natürlich auch ihren Unbilden ausgesetzt. Es ist daher gut nachvollziehbar, dass den Naturkräften Gottheiten zugeordnet wurden. In der ägyptischen Mythologie stand die Sonne in ihrem Mittelpunkt. Der Sonnengott Rê überquerte bei Tag in seiner Sonnenbarke und bei Nacht in seiner Mondbarke den Himmel, für uns heute ein besonders poetisches Bild. Nur langsam wurden solche Vorstellungen abgelöst durch Fragen nach der Struktur der Welt. Die Babylonier gewannen erste Erkenntnisse über ihren Aufbau aus der Beobachtung der Bewegung der Gestirne. So konnten sie die Dauer eines Jahres und Monats bestimmen. Langjährige Beobachtungen versetzten sie in die Lage, Mondfinsternisse vorherzusagen. Im Fortgang der Geschichte gewann die Naturphilosophie, vor allem die Lehren von Aristoteles (350 v. Chr.), großen Einfluss. Über viele Jahrhunderte hinweg dominierte sie die Naturlehre. Bei der Ausarbeitung seiner Lehren stützte sich Aristoteles zwar auch auf empirische Zusammenhänge, aber im Vordergrund stand ein abstraktes Gedankengebäude, das nach der Grundlage allen Seins fragte. Etwa ein Jahrhundert später findet sich mit Archimedes (250 v. Chr.), ein Forscher, der mehr den in seiner Umwelt auftretenden praktischen Fragestellungen nachging. Das Archimedische Prinzip als Ursache des Auftriebs ist ein Beispiel. Die Entwicklung zur exakten Naturwissenschaft setzte etwa mit dem 16. Jahrhundert ein. Herausragende Forscher waren Kopernikus, Galilei, Brahe und Bruno. Zunächst standen die Gesetze unseres Planetensystems und die Rolle der Erde bzw. der Sonne als ihr Zentrum im Vordergrund. Das von ersterem zunächst aus ästhetischen Gründen vorgeschlagene neue Weltbild erschütterte die Stellung des Menschen jener Zeit, denn sie hatten sich bisher mit der Erde als das Zentrum des Universums betrachtet. Galilei verdanken wir seine zahlreichen experimentellen Beiträge zu diesem Thema, aber auch wichtige Beiträge zu den Grundlagen der Mechanik. Zu Beginn des 17. Jahrhunderts entwickelte Kepler auf der Basis von Brahes Beobachtungen die Gesetze der Planetenbewegung. 1666 stellte Newton das fundamentale Gravitationsgesetz auf und formulierte wenig später die nach ihm benannten drei Newtonschen Postulate, welche die Grundlage der gesamten klassischen Mechanik sind. Sie erfuhren Anfang des 20. Jahrhunderts in ihrer Erweiterung durch Lorentz und Einstein ihre endgültige Form. Im Bereich der Optik setzte sich durch die Versuche von Fresnel (1816/17) und Young die bereits von Huygens 1678 formulierte Theorie der Wellennatur des Lichtes durch. In das 19. Jahrhundert fallen auch wichtige Erkenntnisse zu den Erscheinungen der Elektrizität durch Ohm, Faraday und Henry. Sie fanden ihre Krönung durch die Maxwellschen Gleichungen (1873). Kurz danach gelang es Hertz als erstem, elektromagnetische Wellen zu erzeugen und nachzuweisen. Parallel dazu entwickelte sich durch die Einbeziehung der Wärme als weitere Energieform die Thermodynamik mit ihren drei Hauptsätzen. Um 1870 entstand durch Clausius und Boltzmann mit der kinetischen Gastheorie eine erste theoretische Formulierung. Die Zeitenwende ist durch die Begründung der Quantentheorie durch Planck ausgezeichnet. Ihr waren experimentelle Untersuchungen anderer Forscher zur Wärmestrahlung eines schwarzen Strahlers vorausgegangen. Bereits seit Ende des 19. Jahrhunderts hatte das Interesse zunehmend der Struktur der Atome gegolten. Rutherford konnte 1909 mit seinen Mitarbeitern mit einem Streuexperiment von D-Teilchen an Wasserstoffatomen das Thomsonsche Atommodell erweitern und verfeinern. Die Messergebnisse fanden 1911 ihren quantitativen Niederschlag in der nach Rutherford benannten Streuformel. Balmer war bereits 1885 die Einordnung der von
2
Einführung
ihm selbst und anderen entdeckten Spektrallinien von H-Atomen in eine Serienformel gelungen. Die gewonnenen Erkenntnisse führten Bohr zur Aufstellung seines Atommodells, das aus den berühmten drei Bohrschen Postulaten bestand. Wichtigstes Merkmal ist die Quantennatur der Strahlung. Die Übertragung der Postulate in eine allgemeine Theorie gelang Heisenberg (1925) und Schrödinger (1926). in der Formulierung durch Letzteren in der grundlegenden Schrödingergleichung. Durch die Einbeziehung des Elektronenspins in die Theorie durch Dirac konnte ein weites Erfahrungsmaterial theoretisch eingeordnet werden. Pauli hatte schon 1924 das nach ihm benannte Ausschließungsprinzip, das sog. Pauliprinzip aufgestellt, das nun ebenfalls durch die Quantentheorie seine Einordnung fand. Die Quantentheorie enthielt nicht die Wechselwirkung zwischen einem Strahlungsfeld und Atomen oder Molekülen. Die erforderliche Erweiterung wurde in den vierziger Jahren von Feynman, Schwinger und Tomonaga im Rahmen der Quantenelektrodynamik vorgenommen. Sie beschreibt alle Phänomene, die von geladenen punktförmigen Teilchen wie Elektronen und Positronen, und von Photonen verursacht werden. Dieser kurze Streifzug durch die Entwicklung der Physik macht die zentrale Stellung der Physik als Grundlagenwissenschaft der unbelebten Natur deutlich. Mit zunehmender Erweiterung der Forschungsfelder bildeten sich mehrere Wissenschaftszweige heraus, die aus einer Kombination mit anderen naturwissenschaftlichen Fächern bestehen wie etwa die Biophysik, die Geophysik oder die Astrophysik. Die Grundlage chemischer Prozesse bilden die Kräfte zwischen den Atomen und deren Elektronenhüllen. Auch für die Vorgänge in lebenden Organismen sind physikalische Prozesse von großer Bedeutung. Die Übertragung physikalischer Gesetzmäßigkeiten auf praktische Fragestellungen führte zu zahlreichen Anwendungen in Medizin und Technik, die aus unserem Leben nur schwer wegzudenken sind. Das Studium der Physik an den deutschen Universitäten wird meistens in Experimentalphysik und Theoretische Physik unterteilt, wobei in der Regel erstere am Anfang steht. Die Physikalischen Grundlagen werden an Hand vieler Demonstrationsversuche und einfacher Modelle stufenweise induktiv erarbeitet. Der eigentliche theoretische Unterbau erfolgt dann im Rahmen der Theorie-Vorlesungen. Dieses Vorgehen hat aber einige Nachteile. Die Modellvorstellungen im experimentellen Teil können aus Zeitgründen häufig nur qualitativ oder zu stark vereinfacht ausfallen und sind daher unbefriedigend. In der Theorievorlesung fehlt oft das Verständnis der Studierenden, da sie die experimentellen Erläuterungen im Einzelnen nicht mehr im Kopf haben oder noch gar nicht kennen. Auch weiß der Dozent häufig nicht, was in der Experimentalvorlesung bereits behandelt wurde und wie gründlich. Daraus resultiert nicht selten ein unnötiger Verständnis- und Zeitverlust. Deswegen wird an mehreren Universitäten Physik in den ersten Jahren als integrierter Kurs gelehrt, wobei sich ein Experimentalphysiker und ein Theoretiker, die beide in der Vorlesung anwesend sind, nach Bedarf miteinander abwechseln. Dieses auf zwei Bände angelegte Lehrbuch der Physik versucht, dieser Problematik Rechnung zu tragen. Es behandelt den Stoff sowohl aus experimenteller wie aus theoretischer Sicht. Um auch Studierenden, die weiterhin separate Experimental- und Theorievorlesungen hören, oder solchen mit Nebenfach Physik das Buch zugänglich zu machen, werden überwiegend theoretische Abschnitte als Ergänzungen der jeweiligen Stoffes den einzelnen Kapiteln angefügt. Das betrifft vor allem die Analytische Mechanik, die einem gesonderten Kapitel vorbehalten ist. Dagegen sind bei der Darstellung der Phänomenologischen Thermodynamik Experiment und Theorie miteinander verflochten.
Einführung
3
Der erste Teil beginnt mit einer Einführung in die Bewegungslehre unter Einschluss relativistischer Geschwindigkeiten (Kap. 1-2). Anschließend werden die Bewegungen von Körpern unter der Einwirkung von Kräften untersucht (Kap. 3). Ausgangspunkt ist das Modell des Massenpunktes. Darunter ist ein Körper zu verstehen, dessen Masse in einem Punkt vereinigt gedacht wird. So brauchen zunächst Komplikationen, die durch die endliche Ausdehnung eines Körpers bedingt sind, nicht berücksichtigt zu werden. Schrittweise erfolgt die Erweiterung zu einem System von Massenpunkten und zum Begriff des starren Körpers (Kap. 4-5). Die gewonnenen Erkenntnisse werden in Kap. 6 auf die Keplerschen Gesetze angewandt. Alle bis hierher abgeleiteten Gesetzmäßigkeiten der Mechanik (die Kinematik also ausgenommen) setzen voraus, dass die vorkommenden Geschwindigkeiten klein gegenüber der Lichtgeschwindigkeit sind. In Kap. 7 erfolgt eine Ausdehnung auf relativistische Geschwindigkeiten. In Kap. 8 wird besprochen, welche Erweiterungen nötig sind, wenn Vorgänge nicht wie bisher in einem Inertialsystem untersucht werden, sondern in einem beschleunigten Bezugssystem. Die Beschränkung auf starre Körper wird in den nächsten Kapiteln (Kap. 9, 10) auch noch fallen gelassen. Es werden hier einige Eigenschaften realer deformierbarer Festkörper bzw. Flüssigkeiten und Gase behandelt. Unter den Bewegungsmöglichkeiten eines Körpers nehmen periodische Vorgänge in Raum und Zeit einen besonders wichtigen Platz ein. Ihnen ist daher zum Abschluss der Newtonschen Mechanik ein eigenes Kapitel, 11, gewidmet. Kap. 12 bringt die bereits erwähnte Einführung in die analytische Mechanik. Daran schließt sich die Thermodynamik an, indem die Energieformen der Mechanik, potentielle und kinetische Energie, um die thermische Energie erweitert werden. Am einfachsten sind die Auswirkungen auf Gase zu verstehen. Sie sind daher der Untersuchungsgegenstand. Es gibt zwei Zugänge: In diesem Band steht die phänomenologische Behandlung im Vordergrund (Kap. 13). Der andere Weg, die Eigenschaften von Gasen mit den Methoden der statistischen Mechanik zu beschreiben, wird in Kap. 14 lediglich im Rahmen der kinetischen Gastheorie dargestellt, da im Allgemeinen die mathematischen Voraussetzungen für eine weitergehende Behandlung noch fehlen. Kapitel 15-19 sind den Erscheinungen der Elektrostatik und -dynamik gewidmet. Die bisherigen Basisgrößen werden um die neue Grundgröße der elektrischen Ladung q erweitert und der Begriff und die Eigenschaften des statischen elektrischen Feldes, zunächst im Vakuum und dann in Materie formuliert. Um auch den Magnetismus einführen zu können, wird im 16. Kapitel die Stromleitung in Metallen, Halbleitern, Elektrolyten und Gasen besprochen und der Aufbau und die Wirkungsweise der verschiedenen Stromquellen beschrieben. Es zeigt sich, dass die Eigenschaften zeitunabhängiger elektrischer und magnetischer Felder in vier Grundgleichungen zusammengefasst werden können. Im 18. Kapitel folgt die Erweiterung auf zeitabhängige Felder. Zu Beginn steht die Besprechung der magnetischen Induktion. Die Verallgemeinerung des Induktionsgesetzes führt zur 2. Maxwell-Gleichung, die Deutung der Wechselstromleitung in Stromkreisen mit Kondensatoren zum Begriff des Verschiebungsstromes und zur 3. Maxwell-Gleichung. Die vollständige Beschreibung des Elektromagnetismus gelingt durch die Ergänzung dieser Beziehungen durch zwei bereits für statische Felder entwickelte Grundgleichungen. Damit ist der Weg frei zur Einführung elektromagnetischer Schwingungen und Wellen. Ihnen gelten die zwei nächsten Kapitel. Zur besseren Übersicht und damit zu einem leichteren Verständnis wird im 19. Kapitel zunächst der Durchgang von Licht durch optisch dünne Materie besprochen, also
4
Einführung
vor allem durch Gase unter Normalbedingungen. Als ein Beispiel zur Thematik der weichen Materie wird der Lichtstreuung in kolloidalen Suspensionen ein eigener Abschnitt gewidmet. In einem zweiten Schritt folgt die Erweiterung auf optisch dichte Materie, insbesondere auf die Ausbreitung von Licht in Festkörpern. Dazu werden als erstes die Maxwell-Gleichungen so ergänzt, dass sie auch in Materie gültig sind. Anschließend erfolgt die Diskussion der Eigenschaften elektromagnetischer Wellen in isotropen und danach in anisotropen Medien. Der letzte Abschnitt bringt eine kurze Einführung in die nichtlineare Optik, die besonders im Bereich der Laser-Physik und Technik wichtig ist. Die beiden nächsten Kapitel sind der Optik gewidmet. Dem Anliegen dieses Buches folgend beschränkt sich Kap. 20 auf solche Phänomene, die mit Hilfe geometrischer Strahlführung verstanden werden können, also der Ausbreitung von Licht in begrenzten Lichtbündeln. Die Wirkungsweise optischer Elemente wie Spiegel und Linsen lassen sich damit bereits einfach und übersichtlich darstellen. Der Lichtweg durch komplexe optische Systeme, wie sie in vielen optischen Instrumenten eingesetzt werden, ist im Allgemeinen schwierig zu überblicken. In solchen Fällen wird die Berechnung wesentlich erleichtert durch die Benutzung der Matrixmethode. Sie wird daher in einem eigenen Unterabschnitt behandelt. Abweichungen von den geometrischen Strahlengängen treten dann auf, wenn interferenzfähige Lichtbündel auf geometrische Begrenzungen und enge Öffnungen treffen. Bei einer optischen Abbildung sind das z.B. Blenden, welche die Lichtbündel begrenzen. Die dabei auftretenden Beugungserscheinungen begrenzen das geometrische Auflösungsvermögen optischer Instrumente und das spektrale Auflösungsvermögen von Spektrometern. Letztere analysieren das einfallende Licht nach ihrer Frequenz, wodurch Aussagen über den Aufbau der Materie möglich werden. Sie sind Gegenstand von Kap. 21, in dem als weitere wichtige Anwendung auch auf die Holographie eingegangen wird. Die in den beiden Kapiteln gewonnenen Erkenntnisse dienen im letzten Kapitel 22 dazu, Aufbau, Funktionsweise und Leistungsfähigkeit optischer Instrumente darzulegen. Neben dem klassischen Instrumentarium werden moderne Methoden wie die Nahfeldmikroskopie, die aktive und adaptive Optik, die u.a. bei großen Spiegelteleskopen eingesetzt werden, sowie die optische Filterung behandelt. In diesem Zusammenhang werden auch die Grundelemente der Fourieroptik eingeführt. Jedem Kapitel sind eine knappe Zusammenfassung des gebrachten Stoffes sowie einige Übungsaufgaben angefügt, die der Kontrolle und der Festigung des Stoffes dienen sollen. Zur Erarbeitung der theoretischen Abschnitte ist ein gewisses mathematisches Rüstzeug unumgänglich. Dieses wird in einem Formel-Anhang zusammengestellt. An mehreren Stellen werden Sie Hinweise auf die Unvollständigkeit der Modelle finden, die in der atomaren Struktur der Materie und der Wechselwirkung elektromagnetischer Wellen mit dieser ihre Ursache haben. Eine bessere Beschreibung und damit ein vertieftes Verständnis setzt eine Kenntnis der Quantentheorie voraus. Diesem Feld ist der 2. Band gewidmet. Mehreren Personen bin ich zu Dank verpflichtet. Etliche Mitarbeiter der Ebene P10 haben mir bei der Einarbeitung in die relevanten PC-Programme immer wieder geholfen, ganz besonders PD. Dr. M. Deicher, Frau S. Lucas und Dr. R. Tweer. Bei der Zusammenstellung der Übungsaufgaben waren mir meine ehemaligen Mitarbeiter Dr. C. Graf, Dr. C. Johner, Dr. H. Kramer und Dr. C. Martin behilflich. K. Döpfner hat mir den Vorlesungsvorbereitungsraum für die fotographischen Aufnahmen zur Verfügung gestellt und mir zu Beginn tatkräftig zur Seite gestanden. Bei allen bedanke ich mich herzlich. Den Lektoren Herrn U. Sandten und Frau K. Hoffmann schließlich danke ich für ihre große Geduld und Hilfe bei den Korrekturen.
I
Mechanik
1
Kinematik
1.1 Bewegung in einer Dimension 1.1.1 Mittlere Geschwindigkeit und Momentangeschwindigkeit Bewegungsvorgänge werden im Allgemeinen die Beschreibung in einem dreidimensionalen Koordinatensystem notwendig machen. Ihre Beschreibung erfordert wenigstens elementare Kenntnisse der Vektorrechnung. Um den Ungeübten darin den Einstieg zu erleichtern, beginnen wir daher zunächst mit eindimensionalen Bewegungen, also mit solchen, die längs einer geraden Linie erfolgen, wie es der Weg in nebenstehender Abbildung andeutet. Unsere Wanderung möge 4,8 km vor einem in der Ferne sichtbaren Gemäuer beginnen. Er führt uns durch eine ebene, gerade Allee (Abb. 1.1). Zwischendurch bieten sich uns interessante Ausblicke und wir verlangsamen unseren Schritt, um die Landschaft näher zu betrachten. Am Ende der Allee finden wir schließlich ein kleines, altes Schlösschen. Wir machen eine erste kleine Pause und stellen fest, dass wir bereits 1,2 Stunden unterwegs waren; die mittlere Abb. 1.1: Auf dem Weg Geschwindigkeit, definiert als
v:
'x , 't
(1.1)
betrug also 4 km/std. 'x ist die in der Zeit 't zurückgelegte Strecke. Die Zeichenkombination “ : = ” bedeutet “ist definiert als”. Die Geschwindigkeit zu einem bestimmten Zeitpunkt heißt Momentangeschwindigkeit. Darunter verstehen wir den Ausdruck
§ 'x · v lim ¨ ¸ 't o 0 ' t © ¹
(1.2)
Nach den Regeln der Differentialrechnung bedeutet das die erste Ableitung des Weges nach der Zeit. In unserem Beispiel variiert die Momentangeschwindigkeit erheblich.
6
1 Kinematik
1.1.2 Beschleunigung Während der kleinen Wanderung hat sich also unsere Geschwindigkeit mehrfach geändert; eine solche Änderung, dividiert durch die zugehörige Zeit, heißt mittlere Beschleunigung a:
'v . 't
(1.3)
Lassen wir das Zeitintervall beliebig schrumpfen, so geht (1.3) in die Momentanbeschleunigung über:
a : lim
't o 0
'v dv 't dt
(1.4)
Die Geschwindigkeit hat immer einen positiven Zahlenwert; die Beschleunigung kann auch negative Werte annehmen, je nachdem ob die Geschwindigkeit zu- oder abnimmt. Wie groß sind Momentangeschwindigkeit v und zurückgelegter Weg s bei konstanter Beschleunigung als Funktion der Zeit? Es gilt nach (1.4) t
adt
dv o a
v
³
t t0
v
v0 a (t t0 )
dt
³ dv
o a (t t0 )
v v0
(1.5a)
v0
v0 at0 at
(1.5b)
Die Anfangswerte, hier also die der Geschwindigkeit und der Zeit, wurden wie üblich mit dem Index “0” versehen. Eine Bewegung, bei welcher der Geschwindigkeitszuwachs pro Zeit konstant ist, ist der freie Fall eines Körpers (die Luftreibung werde vernachlässigt). Die Beschleunigung wird in diesem Fall mit dem Buchstaben “g” bezeichnet und beträgt g
9.81 m / s 2 .
(1.6)
Integration von (1.5b) ergibt für den zurückgelegten Weg, wenn wir den Zeitnullpunkt t0 = 0 setzen
1 x x0 v 0 t at 2 . 2
(1.7)
1 Kinematik
7
In Abb. 1.2 sind x, v und a als Funktion der Zeit für t0 = 0 dargestellt.
v
x
a a0
v0
x0 t
t
t
Abb. 1.2: Eindimensionale Bewegung mit konstanter Beschleunigung: Weg-Zeit-Relation und Geschwindigkeit-Zeit-Relation
1.2
Bewegung in drei Dimensionen
1.2.1 Der Begriff des Massenpunktes Im Allgemeinen werden Bewegungen nicht längs einer geraden Linie verlaufen, sondern auf einer krummlinigen Bahn in einer Ebene bzw. im dreidimensionalen Raum. Ein Beispiel für eine zweidimensionale Bewegung ist die Bahnkurve beim schiefen Wurf. Eine dreidimensionale Bewegung beschreibt etwa ein Auto, das ein Gebirge mit vielen Serpentinen durchquert oder ein Gefährt auf einer „Achterbahn“. Im Folgenden erweitern wir die Ergebnisse des letzten Kapitels auf zwei und drei Dimensionen. Zur präzisen Beschreibung von Bewegungen eines Körpers ist es zweckmäßig, diesen durch den Begriff des Massenpunktes darzustellen. Darunter wollen wir einen ausdehnungslosen Körper verstehen, dessen Masse in einem Punkt konzentriert ist. Drehbewegungen werden damit vorerst ausgeschlossen.
1.2.2 Ortsvektor und Geschwindigkeit Den Ort eines Massenpunktes legen wir durch den Ortsvektor fest. Dazu wählen wir zunächst ein rechtwinkliges, kartesisches Koordinatensystem. Der Ortsvektor setzt sich nach den Regeln der Vektorrechnung aus seinen Komponenten längs der Koordinatenachsen zusammen.
G r
xeˆx yeˆy zeˆz
G G Damit wird der Verbindungsvektor zwischen zwei Punkten rA und rB (Abb. 1.3)
(1.8)
8
1 Kinematik
G G G 'r rB rA ( xB x A )eˆx ( yB y A )eˆy ( z B z A )eˆz z
(1.9)
r rA
r r r rB
Die Geschwindigkeit ist bestimmt durch die Richtung, in der die Bewegung verläuft, und durch ihren Betrag. Die mittlere Geschwindigkeit ist in Erweiterung der eindimensionalen Bewegung gegeben durch
y
G v:
xG
Abb. 1.3:Verbindungsvektor ' r G G der Ortsvektoren rA und rB
G G dr v: dt
G 'r 't
(1.10)
G wobei 'r durch (1.3) bestimmt ist. Die Momentangeschwindigkeit ist definiert als
dx dy dz eˆx eˆy eˆz dt dt dt
oder
G G dr v: dt
v x eˆx v y eˆy v z eˆz
(1.11a,b)
Nach dem Lehrsatz des Pythagoras gilt für den Betrag der Geschwindigkeit
v 2 v 2x v 2y v 2z
o
v
v 2x v 2y v 2z
(1.12)
1.2.2.1 Relativgeschwindigkeit
Nicht immer ruht der Beobachter. In solchen Fällen kann es zweckmäßig sein, Ort und Bewegung eines Massenpunktes nicht in einem ortsfesten Koordinatensystem zu beschreiben, sondern zu einem bewegten Bezugssystem überzugehen. Betrachten wir zwei Massenpunkte A und B; sie mögen z in einem gemeinsamen Koordinatensystem die OrtsG G r koordinaten rA und rB besitzen und sich mit den Ger rAB rA G G schwindigkeiten v A und v B bewegen (Abb. 1.4). Wir G r interessieren uns für die Geschwindigkeit v AB von A rB relativ zu einem in B verankerten Koordinatensystem:
y x Abb. 1.4: Zur Erläuterung der Relativgeschwindigkeit zweier Teilchen A und B
G drAB G v AB dt
G G v A vB .
(1.13)
Für die Geschwindigkeit von B relativ zu A ergibt sich
G G G G v BA v B v A v AB
(1.14)
1 Kinematik
9
1.2.3 Beschleunigung Die mittlere Beschleunigung ist analog definiert als
G G 'v a: 't
(1.15)
G G wobei 'v analog zu 'r aus (1.3) zu bilden ist. Die Momentanbeschleunigung ist bestimmt durch (1.4)
G G dv a: dt
(1.4)
Einsetzen von (1.11b) und Ausführung der Differentiation liefert
G dv y dv G dv dv x a eˆx eˆy z eˆz . dt dt dt dt
(1.16)
Das ist äquivalent mit
G a ax eˆx a y eˆy az eˆz
(1.17)
Daraus ergibt sich für den Betrag der Beschleunigung
a
ax2 a y2 az2
(1.18)
Benutzen wir für die zeitliche Differentiation die sog. Kurzform, so schreibt sich diese Beziehung
a
x 2 y 2 z2
(1.19)
Diese Art der Formulierung erspart eine Menge Schreibarbeit, doch wir werden sie erst in Kap. 12 benutzen, weil die Punkte über den Formelzeichen leicht übersehen werden.
10
1 Kinematik
1.2.3.1 Bewegung mit konstanter Beschleunigung
Ein einfaches Beispiel einer eindimensionalen Bewegung mit konstanter Beschleunigung wurde bereits in Kap. 1.1.2 angesprochen: der freie Fall eines Teilchens ( a g ). Geschwindigkeit und Weg als Funktion der Zeit ergeben sich durch Integration. Die Geschwindigkeit wird analog zu (1.5b)
dv gdt v v 0 g (t t 0 )
(1.20)
und der zurückgelegte Weg
z
z0 v 0 t t0
1 g t 2 t02 gt0 t t0 . 2
Starten wir den zunächst bei z0
z
0 ruhenden Körper zur Zeit t0
(1.21a) 0 , so folgt
1 gt 2 . 2
(1.21b)
Ein Beispiel einer zweidimensionalen Bewegung mit konstanter Beschleunigung ist der schräge oder („schiefe“) Wurf, dem wir uns jetzt zuwenden wollen. Ein Gegenstand, etwa ein Ball, möge unter einem Winkel - gegen die Horizontale x in die Höhe geworfen werden. Der Einfluss der Luftreibung werde wieder vernachlässigt. Die Anfangsgeschwindigkeit hat die Komponenten (Abb. 1.5a):
v 0 x v 0 cos -
r v
y r v0
P Der Ball erfährt eine negative Beschleunigung in yRichtung. In der dazu senkrechten x-Richtung ist die Geschwindigkeit vx konstant, also ax = 0.
(v 0 ) y (r0 ) y (v 0 ) x (r0 ) x
(1.22)
v 0 y v 0 sin -
ay
g
ax
0
(1.23a,b)
x
Abb. 1.5a: Erläuterung der Anfangsbedingungen beim schiefen Wurf
Durch Integration von (1.23a) folgt für t0 = 0
v y v 0 y gt ; v x v 0 x
(1.24)
1 Kinematik
11
Der zurückgelegte Weg ist in Komponentenschreibweise
x x0
v0 x t (1.25)
1 y y0 v0 y t gt 2 2 Die allgemeine Bahngleichung finden wir durch Elimination der Zeit. Setzen wir x0 so ergibt sich
y
v0 y v0 x
x
g 2 x 2v 02 x
y0
0,
(1.26)
Diese quadratische Gleichung bedeutet, dass die Bahnkurve eine Parabel ist. Sie lässt sich in die allgemeine Form bringen
b · § y ax 2 bx a ¨ x 2 x ¸ a ¹ © 2
b · b2 § a ¨ x ¸ 2 . © 2a ¹ 4a
y (1.27)
Die Bahn (Abb. 1.5b) verläuft durch den Ursprung des Koordinatensystems; ihr Scheitel xS befindet sich bei
xS
v0 x v0 y
(1.28)
g
0
xS
x
Abb. 1.5b: Bahnkurve beim schiefen Wurf für den Fall x0 = y0 = 0
Einsetzen der Komponenten der Anfangsgeschwindigkeit, (1.22), ergibt
xS
v 02 sin 22g
(1.29)
Da die Parabel eine symmetrische Kurve ist, liegt die Auftreffstelle bei dem doppelten Wert, x = 2xs. Die größte Steighöhe yS wird damit
yS
v 02 y 2g
v 02 sin 2 - . 2g
Während die Wurfweite bei - 90q , den größten Wert an.
(1.30) 45q maximal wird, nimmt die Höhe beim senkrechten Wurf,
12
1 Kinematik
1.2.3.2 Bewegung mit nicht-konstanter Beschleunigung
Die Beschleunigung eines Teilchens ist nicht mehr konstant, wenn sich ihr Betrag oder ihre Richtung während der Bewegung ändert. Ein wichtiges Beispiel für letztere Art der Bewegung ist die gleichförmige Kreisbewegung, bei welcher der Betrag der Geschwindigkeit konstant ist. Die Beschleunigung infolge der dauernden Richtungsänderung der Geschwindigkeit bezeichnen wir als Zentripetalbeschleunigung aN, weil sie immer zum Kreismittelpunkt weist. Zur Erläuterung betrachten wir Abb. 1.5a; sie zeigt einen Ausschnitt der Bahnkurve eines rotierenden Körpers. Wir ermitteln zuerst den Betrag der Beschleunigung; dazu bestimmen wir die G Differenz der Geschwindigkeiten 'v zwischen zwei Positionen P1 und P2 des Körpers. Es gilt auf Grund der Ähnlichkeit des Dreiecks OP1P2 in Abb. 1.6a und dem in Abb. 1.6b
a)
b)
P2 R r r
O
'v 'r 'r bzw. 'v v R R v
r v1
r v
P1
R
r v1
r v2
(1.31)
Division durch 't und Bildung des Grenzüberganges 't o 0 liefern
aN
'v v 2 R 't o 0 't lim
(1.32)
r v2
Die Richtung der Beschleunigung erhalten wir, wenn wir berücksichtigen, dass im G Abb. 1.6: Zur Ableitung der ZentripetalbeGrenzfall '4 o 0 der Vektor 'v senkG schleunigung recht auf v steht (s. Abb. 1.6b), also stets zum Kreismittelpunkt weist. Damit ist auch der Beschleunigungsvektor senkrecht zum Kreismittelpunkt gerichtet. Manchmal ist es zweckmäßig, aN als Funktion der Umlaufzeit auszudrücken. Die Geschwindigkeit ist ja, dem Betrage nach, der pro Umlaufzeit T durchlaufene Kreisumfang.
v
2S R T
(1.33)
Setzen wir v in (1.32) ein, so erhalten wir für die Zentripetalbeschleunigung
aN
(2S R / T ) 2 R
4S 2 R T2
(1.34)
1 Kinematik
13
Zusammenfassung x Bei eindimensionaler Bewegung gelten die folgenden Festlegungen: Mittlere Geschwindigkeit:
v:
xE x A 'x { t E t A 't
Momentangeschwindigkeit:
v:
dx { x dt
Mittlere Beschleunigung:
a:
v E v A 'v { . t E t A 't
Momentanbeschleunigung:
a:
dv d 2 x { dt dt 2
x Bei konstanter Beschleunigung gelten für t0 = 0 die Relationen
1 x x0 v 0 t at 2 ; 2
v
v0 a t
x Im dreidimensionalen Raum ist der Ort eines Teilchens gegeben durch
G r : xeˆx yeˆy z eˆz und die Geschwindigkeit durch
v:
G dr dt
dx dy dz eˆx eˆy eˆz . dt dt dt
Ihr Betrag ergibt sich zu
v
v 2x v 2y v 2z .
14
1 Kinematik
x Die Beschleunigung ist gegeben durch
G d vy d vz G d v d vx a eˆx eˆy eˆz . dt dt dt dt Ihr Betrag folgt zu
a
ax2 a y2 az2 .
x Der reibungslose freie Fall ist ein Beispiel einer eindimensionalen Bewegung mit konstanter Beschleunigung, der reibungsfreie, schräge Wurf ein analoges Beispiel in zwei Dimensionen, ay = -g; die Geschwindigkeitskomponenten sind mit t0 = 0
v y v0 y gt ;
v x v0 x .
x Die Bahnkurve ist eine Parabel, die den Koordinatenursprung berührt; sie hat die Gestalt
§ v02 y ¨¨ y 2g ©
· g v0 x v0 y ½ ¸¸ 2 ® x ¾ g ¿ 2v0 x ¯ ¹
2
x Die gleichförmige Kreisbewegung ist ein Beispiel einer Bewegung mit konstantem Betrag der Beschleunigung. Wir bezeichnen sie als Zentripetalbeschleunigung.
1 Kinematik
15
Übungsaufgaben G 1. Ein Flugzeug fliegt mit einer Reisegeschwindigkeit v eine Strecke s hin und zurück. Es G weht ein Wind mit einer Geschwindigkeit u genau in Flugrichtung bzw. beim Rückflug in Gegenrichtung. Gleicht der Gewinn an Flugzeit beim Hinflug den Verlust beim Rückflug aus?
2. Zwei Neutronen bewegen sich im Weltall mit den Geschwindigkeiten G G v1 (104 , v 2, v 1) m/s . Z. Zt. t = 0 s befinden sie sich bei r1 (0, 0, 0) m und G r2 (0,1, 0) m a) Wie groß ist ihr Abstand als Funktion der Zeit? b) Wann ist ihr Abstand am kleinsten und wie groß ist er? G 3. Auf der Autobahn fährt ein Pkw mit der Geschwindigkeit v 130 km/h . Bei einem erforderlichen Abbremsmanöver gelingt es dem Fahrer nur noch, sein Fahrzeug bis auf 10 km/h abzubremsen, bevor es auf einen vor ihm stehen gebliebenen Pkw auffährt. Wie groß war sein (zu geringer) Abstand beim Beginn der Abbremsung, wenn die Bremsverzögerung 6 ms-2 betrug? Welchen Mindestabstand hätte er einhalten müssen, damit er rechtzeitig zum Stillstand gekommen wäre?
4. Eine Maus sei (ohne Schwanz) 10 cm lang. Ein Habicht kann ein Objekt noch erkennen, das seinem Auge mindestens unter einem Winkel von einer Minute erscheint. a) Bis zu welcher Flughöhe h kann der Vogel die Maus noch erkennen? b) Der Habicht greift die Maus im Sturzflug an (Nehmen Sie freien Fall an). Wie viel Zeit hat die Maus, um sich in Sicherheit zu bringen? 5. An einer Schnur, die oben in einem Turm befestigt ist, sind in zunehmendem Abstand Holzkugeln befestigt. Die unterste Kugel berührt gerade den Boden. Wie muss der Abstand der Kugeln bemessen werden, damit nach dem Lösen der Schnurbefestigung alle 0,2 s eine Kugel den Boden erreicht? 6. Eine Kanonenkugel wird auf der Erde unter einem bestimmten Winkel in die Höhe geschossen, steigt bis auf 1000 m und trifft ihr Ziel auf der Erde 10 km vom Abschussort entfernt. Vernachlässigen Sie bei den folgenden Fragen den Luftwiderstand. a) Wie groß ist die Abschussgeschwindigkeit? b) Wie lang ist die Flugzeit? c) Welches Gewicht hat die Kugel? d) Wie weit käme das Geschoss, wenn es zur Erde gemessen unter 45° abgefeuert würde? 7. In einem oben nicht angeschlossenen gekrümmten Abflussrohr gleitet reibungsfrei eine (als G Punkt angenommene) Kugel. Wenn sich das Rohr mit der Winkelgeschwindigkeit Z dreht, soll sich die Kugel an jeder Stelle im Gleichgewicht befinden. Welche Form hat das Rohr?
2
Bezugssysteme in gleichförmiger Geschwindigkeit
2.1
Inertialsysteme
Bisher haben wir dem Bezugspunkt, also etwa der Ursprung eines kartesischen Koordinatensystems wenig Aufmerksamkeit geschenkt. Zur Beschreibung des momentanen Ortes eines Teilchens gibt es im Allgemeinen mehrere Möglichkeiten. Als Beispiel betrachten wir einen langsam fahrenden Bus. Einem der Mitfahrenden fällt durch eine kleine Unachtsamkeit ein Apfel aus einer Tüte, der daraufhin über den Boden des Busses rollt. Nehmen wir vereinfachend an, dass die Bewegung des Apfels auch von einem auf dem Gehweg stehenden Beobachter verfolgt werden kann. Zur Beschreibung der Bahnkurve wird der Businsasse ein Koordinatensystem wählen, das fest mit dem Bus verbunden ist. Der draußen stehende Beobachter beschreibe die Bahn in einem in ihm verankerten Koordinatensystem. Kommen beide Beobachter bez. der Bahnkurve zum gleichen Ergebnis? Zur Untersuchung erweist es sich als zweckmäßig zwei Fälle zu unterscheiden: a) Der Bus fährt mit, nach Richtung und Betrag, konstanter Geschwindigkeit; b) Der Bus bewegt sich beschleunigt, z.B. indem er seine Richtung ändert. In diesem Kapitel befassen wir uns mit dem ersten Fall, der ein Beispiel dafür ist, dass die beiden gewählten Bezugssysteme Inertialsysteme sind. Ein Koordinatensystem ist ein Inertialsystem, wenn in ihm alle Körper, die keinerlei äußeren Kräften unterliegen, ruhen oder sich gleichförmig geradlinig bewegen. Wir können also allgemein ein Inertialsystem S durch ein anderes Bezugssystem S´ ersetzen, sofern sich dieses mit konstanter Geschwindigkeit relativ zum Inertialsystem bewegt, denn von ihm aus gesehen bewegt sich der Körper ebenfalls mit konstanter Geschwindigkeit auf einer geradlinigen Bahn. Wir ergänzen diesen Sachverhalt durch die uns selbstverständlich erscheinende Festlegung, dass die Beobachter bez. der Zeitmessung übereinstimmen. Beide Fakten zusammen genommen werden als Newtonsches Relativitätsprinzip bezeichnet. Beschleunigte Koordinatensysteme, auf die wir in Kap. 9 eingehen, sind demnach keine Inertialsysteme. Der Ort eines Körpers bez. zweier Inertialsysteme lässt sich also beschreiben durch
G G G r c r ut ; t t c .
(2.1)
G u ist die konstante Relativgeschwindigkeit der beiden Bezugssysteme S und S´, wobei vorausG gesetzt wird, dass u “hinreichend” klein ist. Die zeitlichen Abläufe in beiden Bezugssystemen sind gleich. Die Beziehungen (2.1) werden als Galilei-Transformation (Galilei, G. 15641642) bezeichnet.
18
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.2
Die Lichtgeschwindigkeit
Es bleibt die Frage zu klären, was unter einer hinreichend kleinen Geschwindigkeit zu verstehen ist. Wie wir unten sehen werden, ist die Bezugsgeschwindigkeit die Lichtgeschwindigkeit; sie hat unabhängig vom Bezugssystem im Vakuum den Wert
c (299792458r1, 2) m/s
(2.2)
Diese Aussage widerspricht der Galilei-Transformation, denn wie aus (2.1) durch Differentiation folgt, müsste sich die in S´ gemessene Lichtgeschwindigkeit von der in S gemessenen durch die Relativgeschwindigkeit der betreffenden Inertialsysteme unterscheiden. Michelson (1852-1931) und Morley haben in dem nach ihnen genannten Experiment als erste gezeigt, dass dies nicht der Fall ist. Die Versuchsanordnung wird ausführlich in Kap. 21.1.2.6 besprochen. Die Lichtgeschwindigkeit ist in allen Bezugssystemen gleich, unabhängig von deren Relativgeschwindigkeit zur Lichtquelle. Die Galilei-Transformation muss durch ein Transformationsschema ersetzt werden, das sicherstellt, dass alle Naturgesetze in jedem Inertialsystem die gleiche Form haben. Die Forderung wird als Einsteinsches Relativitätsprinzip (Einstein, A. 1879-1955) bezeichnet.
2.3
Lorentz-Transformation
Die richtigen Transformationsformeln, die bei jeder Geschwindigkeit zweier Inertialsysteme gelten, sind in der Lorentz-Transformation (H. Lorentz, 1853-1928) zusammengefasst. Wir beschränken uns bei ihrer Formulierung auf den Spezialfall, dass die Koordinatenachsen der beiden Systeme zueinander parallel sind und dass sich ihre bei t = 0 zusammenfallenden Nullpunkte mit der Geschwindigkeit (vx, 0, 0) bewegen (Abb. 2.1).
O(t = 0) = O´(t = 0) ;
(2.3)
r r r (t) = ct r r r (t) = c t
S´ z
S
r r (t)
x y
z´
P
r r (t)
x´ y´
r v = v x eˆ x
Abb. 2.1: Beschreibung eines Ereignisses P in einem ruhenden Inertialsystem und in einem sich gegenüber S mit der konstanten Geschwindigkeit vx bewegenden System
2 Bezugssysteme in gleichförmiger Geschwindigkeit
19
Die Lorentz-Transformationsformeln lauten dann
x vt
xc yc y zc z tc
xc yc zc tc
1 v2 / c2 bzw.
t v x / c2
J ( x E ct ) y z J (t ( E / c) x)
(2.4)
1 v2 / c2
Dabei bedeutet
J:
1
1 2
1 v / c
2
1 E 2
.
(2.5)
Die Rücktransformation ist
x J ( xc E ct );
y y c; z z c; t J (t c ( E / c) xc)
(2.6)
Der Vergleich mit der Galilei-Transformation zeigt, dass nun auch die Zeitangaben in den beiden Inertialsystemen im Allgemeinen unterschiedlich sind. Außerdem entnehmen wir der ersten der vier Gleichungen, dass Zeit- und Raumangaben nicht mehr unabhängig voneinander sind. Diese Ergebnisse erscheinen uns fremdartig, was aber allein daran liegt, dass unsere Erfahrungen sich auf solche Geschwindigkeiten beziehen, die sehr klein gegenüber der Lichtgeschwindigkeit sind. In solchen Fällen geht die Lorentz-Transformation in die GalileiTransformation über: Vernachlässigen wir nämlich v/c gegenüber 1 bzw. gegenüber t, so folgt aus (2.6)
xc yc zc tc
x vt y z t
Galilei-Transformation
Eine Ableitung der Lorentz-Transformation findet sich am Ende des Kapitels.
(2.7)
20
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1 Konsequenzen der Lorentz-Transformation Die Lorentztransformation hat etliche Konsequenzen. Im Rahmen der Bewegungslehre, mit der wir uns hier beschäftigen, gehören dazu: Die Relativität der Gleichzeitigkeit; darunter verstehen wir, dass Ereignisse, die für einen Beobachter in einem Inertialsystem gleichzeitig ablaufen, für einen Beobachter in einem relativ zu diesem sich bewegenden Inertialsystem zu verschiedenen Zeiten geschehen; die Längenkontraktion: Zwei Inertialsysteme mögen sich relativ zueinander mit konstanter Geschwindigkeit bewegen. Ein Messstab, der parallel zur Bewegungsrichtung liegt, erscheint einem Beobachter, der sich parallel zum Messstab bewegt, kürzer als einem Beobachter in dem Koordinatensystem, in dem der Messstab ruht; die Zeitdilatation: Die Dauer eines Vorganges erscheint in einem sich bewegenden Koordinatensystem länger als in dem Koordinatensystem, in dem die Uhr ruht; das Additionstheorem der Geschwindigkeiten, nach dem Geschwindigkeiten vektoriell zu addieren sind, ist durch einen neuen Zusammenhang zu ersetzen.
2.3.1.1 Relativität der Gleichzeitigkeit Wir wenden uns als Erstes der Relativität von Ereignissen zu. Wie bereits oben angegeben, verstehen wir darunter, dass Ereignisse, die für einen Beobachter gleichzeitig ablaufen, für einen anderen Beobachter, der sich relativ zum ersten bewegt, zu verschiedenen Zeiten geschehen. Zur Zeitbestimmung werden S´ Uhren benötigt, die synchronisiert C´ A´ S B´ sein müssen. Wir betrachten dazu zwei Uhren, die im KoordinatenB C A system S an den Punkten A und B im Abstand l voneinander fest aufAbb. 2.2: Zum Problem der Gleichzeitigkeit gestellt sind (Abb. 2.2). In der Mitte zweier Ereignisse C zwischen A und B befinde sich eine Blitzlampe. Erreicht ein von dieser ausgehender Lichtpuls die beiden Uhren in A und B, so sollen diese starten. Für den Beobachter in C sind damit die Uhren synchronisiert. Natürlich könnte sich der Beobachter auch an einem anderen Ort befinden; zur Synchronisierung müsste er in diesem Fall die unterschiedlichen Zeiten berücksichtigen, die das Licht von den Punkten A und B bis zu ihm benötigte. Gleichzeitigkeit können wir daher wie folgt festlegen:
2 Bezugssysteme in gleichförmiger Geschwindigkeit
21
In einem Inertialsystem geschehen zwei Ereignisse an den Orten A und B gleichzeitig, wenn die von den Ereignissen ausgesandten Lichtsignale einen Beobachter in der Mitte zwischen A und B gleichzeitig erreichen. Wir kommen jetzt zur Relativität der Gleichzeitigkeit zweier Ereignisse. Zur Einführung möge das folgende von Einstein stammende Beispiel dienen: Auf einem Bahnsteig stehe ein Beobachter C. Seine Position sei in einem Bezugssystem S angegeben, das fest mit dem Bahnsteig verbunden ist und damit für ihn ruht. Ein Zug fahre mit konstanter Geschwindigkeit v an ihm vorbei. Im Zug ist ein Koordinatensystem S´ verankert, das sich also relativ zum Beobachter C bewegt. In der Mitte des Zuges soll sich ein Beobachter C´ befinden. Anfang und Ende des Zuges mögen von zwei Blitzen getroffen werden. Die Einschläge sollen im Ruhesystem S des Bahnsteiges gleichzeitig erfolgen. Mit anderen Worten: Der Beobachter C auf dem Bahnsteig in der Mitte zwischen den Orten A und B, an denen die Blitze eingeschlagen sind, sieht diese zur gleichen Zeit. Der Beobachter C´ in der Mitte des Zuges ist mit dieser Aussage nicht einverstanden. Er sieht den Blitz an der Spitze des Zuges vor dem Blitz am Ende des Zuges! Betrachten wir dazu die Bewegung von C´ im Bezugssystem S. In der Zeit, die der Lichtpuls benötigt, um von der Zugspitze bis zum Beobachter C´ zu gelangen, hat sich der Zug mit ihm um eine bestimmte Strecke in Richtung des vorderen Blitzeinschlages bewegt. Die Lichtwege sind also verschieden lang. Der Beobachter C´ kommt daher zum Schluss, dass der Blitz die Spitze des Zuges eher getroffen hat als das Ende. An die Stellen A und B des Bahnsteiges bringen wir zwei synchronisierte Uhren. Der sich im Bezugsystem S´ ergebene Zeitunterschied zweier im Bezugssystem S synchronisierten Uhren lässt sich mittels der Lorentz-Transformation berechnen. Wir ordnen den Punkten A und B die Koordinaten x1 und x2 zu und berechnen die Zeitpunkte t1c und t2c , die diese Uhren für die Zeitpunkte t1 und t2 anzeigen. Wir finden
t1c J (t1
v x1 ) c2
und
t2c
J (t2
v x2 ) . c2
Daraus folgt
(t1c t2c ) J (t1 t2 )
Jv c2
( x1 x2 ) .
Der Begriff “gleichzeitig” ist also nicht absolut, sondern relativ. Er bezieht sich auf das vorgegebene Koordinatensystem.
(2.8)
22
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1.2 Längenkontraktion Ein Koordinatensystem S´ bewege sich relativ zum Koordinatensystem S entlang der x-Achse mit der Geschwindigkeit (vx, 0, 0). Wir fragen nun, ob sich die Länge eines Messstabes, der im Koordinatensystem S´ ruht, für einen Beobachter in S ändert. Es sind zwei Fälle zu unterscheiden. a) Der Messstab liege senkrecht zur Bewegungsrichtung der beiden Koordinatensysteme (Abb. 2.3). Die Lorentz-Transformation ergibt
y c y;
z c z.
z´
z S
(2.9)
S´ vx
x
x´
Abb. 2.3: Ein in S´ ruhender, zu dessen Bewegungsrichtung senkrecht liegender Messstab der Länge l0 erscheint einem Beobachter in S unter der gleichen Länge
y´
y
Die Länge eines Messstabes senkrecht zur Bewegungsrichtung ist unabhängig von der Bewegung. b) Der Messstab in S´ liege in Bewegungsrichtung (Abb. 2.4). Die beiden Enden des Messstabes seien mit 1 und 2 bezeichnet. Die Differenz der Koordinaten wird als Ruhelänge bezeichnet
x1c x2c : l0
(2.10)
Der Beobachter in S hat einen sich bewegenden Messstab vor sich. Um seine Länge zu
z´
z S
S´ vx I0
x y
y´
x´
Abb. 2.4: Ein in S´ ruhender, längs dessen Bewegungsrichtung liegender Messstab der Länge l0 erscheint einem in S befindlichen Beobachter verkürzt
2 Bezugssysteme in gleichförmiger Geschwindigkeit
23
bestimmen, misst er gleichzeitig die Koordinaten x1, x2 und bildet die Differenz für t1 = t2. Die Lorentz-Transformation ergibt
x2c x1c J ( x2 vt2 ) J ( x1 vt1 ) J ( x2 x1 ) J l ;
(2.11a)
also wird
l l0 1 E 2
Lorentzkontraktion
(2.11b)
Ein Beobachter in S misst eine Kontraktion des Messstabes.
2.3.1.3 Zeitdilatation Wir betrachten eine Uhr, die im Koordinatensystem S´ ruht und in regelmäßigen zeitlichen Abständen einen Lichtblitz aussendet. Die Zeit zwischen Ereignissen, die in einem Koordinatensystem am selben Ort stattfinden, heißt Eigenzeit W 0 . Also können wir schreiben
tnc nW 0 ; n 0,1, 2,3,...
(2.12)
Ein in S ruhender Beobachter misst für die zeitliche Abfolge der Lichtpulse, tn nach der Lorentz-Transformation (2.4)
tn
tnc 1 E 2
nW v
wobei
Wv
W0 1 E 2
(2.13)
Die Vorrückzeit der Uhr zwischen zwei Ereignissen in S´ ist die Eigenzeit W 0 , diejenige im bewegten Koordinatensystem ist W v . Da W v ! W 0 , gehen bewegte Uhren langsamer als ruhende. Beispiel: Myonen sind instabile Teilchen der Masse m ~ 207 mElektron, die entsprechend dem Zerfallsgesetz, N N 0 e t / T1/ 2 nach der Halbwertszeit T1/2 zur Hälfte zerfallen sind. In Ruhelage im Labor gemessen, beträgt T1/2 = 1,5 10-6 s. Die Teilchen entstehen in der Atmosphäre in ca. 60 km Höhe als Folge von Zusammenstößen kosmischer Strahlung. Ihre Geschwindigkeit entspricht fast Lichtgeschwindigkeit. Nehmen wir an, dass v = 0,999 c = 2,9947 108 m/s ist. Zur Erreichung der Erde benötigen die Myonen eine Zeit von
t
6 104 s 2 104 s . 8 2.9949 10
(2.14)
24
2 Bezugssysteme in gleichförmiger Geschwindigkeit
Diese Zeit entspricht ungefähr 133 T1/2. Wenn die Zeitmessung auf der Erde und in dem Bezugssystem, in dem das Myon ruht, identisch wäre, so würde nur ein kleiner Bruchteil, nämlich (1/2)133 der ursprünglichen Zahl N0 der Myonen, die Erdoberfläche erreichen ( 1040 N 0 ). Experimentelle Untersuchungen zeigen dagegen, dass die Zahl der Myonen auf Meereshöhe sehr viel größer ist. Die Erklärung für diese Diskrepanz ist die Zeitdilatation. Die Zeit t, die das Myon braucht, um die Atmosphäre zu durchqueren, gemessen vom Beobachter auf der Erde, ist sehr viel größer als die (Eigen-) Zeit t´, die von einem Beobachter gemessen wird, der sich relativ zum Myon in Ruhe befindet. Es ergibt sich quantitativ
t c t 1 v2 / c2 2 104 4,5 102 s | 9 106 s | 6T1/ 2
(2.15)
Die Zahl der auf die Erdoberfläche treffenden Myonen beträgt also N / N 0 (1/ 2)6 1/ 64 , in Übereinstimmung mit den experimentellen Ergebnissen. Die Zeitdehnung können wir uns auch ohne Benutzung der Lorentz-Transformation klarmachen. Sie kann direkt aus dem Relativitätsprinzip und der Konstanz der Lichtgeschwindigkeit abgeleitet werden. Wir führen dazu ein Gedankenexperiment aus, das auf der LichtimpulsB uhr beruht (Abb. 2.5). Letztere besteht aus einem S´ S Kasten der Länge d; auf ihrer unteren Seite befindet d sich eine Blitzlampe, die einen Lichtpuls aussendet und damit eine Uhr startet. Das Lichtsignal wird an einem Spiegel an der oberen Seite des Kastens C reflektiert und von einem Empfänger bei A regisA triert, wodurch die Uhr angehalten wird. Die Zeit Abb. 2.5: Lichtimpulsuhr zur ' t 2 d / c dient im Bezugssystem S, in dem die Messung der Zeitdilatation Lichtuhr ruht, als Zeiteinheit. Wir setzen jetzt die Uhr in ein Bezugssystem S´, das sich senkrecht zu ihrer Längsrichtung relativ zu S mit der Geschwindigkeit v bewegt. Für den Beobachter in S durchläuft der Lichtpuls jetzt die längere Strecke ABC 2
§ v't · 2 ABC 2 ¨ ¸ d . © 2 ¹ Damit folgt für
't
(2.16)
't 2d
c 1 v2 / c2
.
(2.17)
2 Bezugssysteme in gleichförmiger Geschwindigkeit Der Beobachter in S´ misst dagegen die Zeit
't c
25
' t´.
2d . c
(2.18)
Der Beobachter in S misst also eine Zeit, die um den Faktor 1
1-v 2 /c 2 länger ist als in S´.
2.3.1.4 Relativistisches Additionstheorem der Geschwindigkeiten Das Koordinatensystem S´ bewege sich relativ zum Koordinatensystem S entlang der x-Achse G mit der Geschwindigkeit vc (vcx ,0,0) , für das Teilchen P im Koordinatensystem S´ ist sie G u c (vcx , vcy , vcz ) . Wie groß ist die Geschwindigkeit für einen Beobachter im KoordinatenG system S ? Die Geschwindigkeit u ist definiert als
G G u dr / dt ,
(2.19)
also benötigen wir zu ihrer Berechnung die Differentiale dx, dy, dz und dt. Durch Auflösen der Lorentz-Tranformationsformeln (2.6) nach x und t ergibt sich
x J xc JE ct c y yc
dx J dxc JE cdt c dy dy c
o
z zc t J tc
JE c
xc
dz dz c dt J dt c
(2.20)
JE c
dxc
G Damit erhalten wir für u :
ux
dxc E cdt c ; uy dt c ( E / c) dxc
dx dt
dy dt
dy c ; uz J (dt c ( E / c)dxc
dz dt
dz c J (dt c ( E / c)dxc (2.21a)
Ersetzen wir noch die gestrichenen Größen durch die zugehörigen Geschwindigkeiten, so erhalten wir als relativistisches Additionstheorem der Geschwindigkeiten
ux
u cy 1 v 2 / c 2 u cx v u zc 1 v 2 / c 2 ; u ; u y z 1 (v / c 2 ) u xc 1 (v / c 2 ) u xc 1 (v / c 2 ) u cx
(2.21b)
26
2 Bezugssysteme in gleichförmiger Geschwindigkeit
2.3.1.5Struktur der Raumzeit
t
t´
absolute Zukunft
x´
absolutes
Anderswo x
absolute Vergangenheit
Abb. 2.6: Die Bereiche von Vergangenheit, Gegenwart und Zukunft.
Unsere Auffassung von dem Begriff der Gegenwart, mit der wir aufgewachsen sind, setzt stillschweigend eine Allgemeingültigkeit voraus, wie sie in Wirklichkeit nicht existiert. Der Begriff der absoluten Gleichzeitigkeit ist zu revidieren, wenn die relative Geschwindigkeit zweier Inertialsysteme sich der Lichtgeschwindigkeit nähert. An die Stelle einem scharf definierten Gegenwartspunkt tritt ein möglicher breiter Bereich von Gegenwart zwischen den beiden Lichtkegeln (Abb. 2.6), in dem für jeden der beiden Beobachter ein Ereignis „jetzt“ sein kann. Sie stimmen jedoch darin überein, dass dieses „anderswo“ stattfindet. Ereignisse innerhalb der Lichtkegel sind dagegen für die Beobachter kein mögliches „jetzt“. Die Bereiche definieren die absolute Vergangenheit bzw. absolute Zukunft.
Ergänzung: Ableitung der Lorentz-Transformation Die Transformationsformeln, welche an die Stelle der Galilei-Transformation treten, basieren auf den zwei Einstein-Postulaten: 1. Die Naturgesetze haben in allen Inertialsystemen die gleiche Form. Kein Inertialsystem ist vor dem anderen ausgezeichnet (Relativitätsprinzip). 2. Die Lichtgeschwindigkeit im Vakuum ist in jedem Inertialsystem konstant und gleich, unabhängig von der Relativgeschwindigkeit von Lichtquelle und Beobachter. Diese Forderungen wenden wir nun auf zwei Bezugssysteme S und S´ an. Letzteres möge sich gegenüber S mit konstanter Geschwindigkeit bewegen. Der Einfachheit halber nehmen wir an, dass die Bewegung entlang der x-Achse erfolgen soll. Die Koordinaten eines Ereignisses in S seien (x, y, z), der zugehörige Zeitpunkt t. Analog wollen wir die Koordinaten des Ereignisses in S´ mit (x´, y´, z´) bezeichnen und den Zeitpunkt mit t´. Zu den Zeitpunkten t = t´ = 0 mögen die Nullpunkte von S und S´ zusammen fallen. Wir suchen nun nach den richtigen Transformationsformeln für x und t; bezüglich der anderen beiden Koordinaten gilt wegen der speziell gewählten Bewegung der beiden Bezugssysteme y = y´ und z = z´. Wir nehmen an, dass die Transformationsformel für x bis auf einen Faktor J mit der Galilei-Transformationsformel übereinstimmt:
x J ( x ' vt ') .
(2A.1)
2 Bezugssysteme in gleichförmiger Geschwindigkeit
27
Für die inverse Transformation gilt dann
x ' J ( x vt ) .
(2A.2)
Wir denken uns einen Lichtpuls, der im Ursprung von S zum Zeitpunkt t = 0 losgeschickt wird. Entsprechend unserer Annahme startet der Lichtpuls in S´ ebenfalls zur Zeit t´. Wegen der Konstanz der Lichtgeschwindigkeit gilt für die x-Koordinate des Pulses
x ct bzw. x ' ct ' .
(2A.3)
Diese beiden Koordinaten setzen wir in (2A.1) bzw. (2A.2) ein und erhalten
ct J (ct ' vt ') J t '(c v) ,
(2A.4)
ct ' J (ct vt ) J t (c v) .
(2A.5)
Eliminierung von t oder t´ ergibt
J2 J
1 1 v2 / c2 1
1
1 v2 / c2
1 ß2
(2A.6)
Damit haben wir die Transformationsformel für x gefunden. Die Beziehung zwischen t und t´ lässt sich aus (2A.1) und (2A.2) ableiten. Ersetzen wir in (2A.2) x durch (2A.1), so erhalten wir
x ' J ^J ( x ' vt ') vt` , woraus für t folgt
vx ' · § t J ¨ t ' 2 ¸ . c ¹ ©
(2A.7)
Die Ergebnisse zusammengefasst, ergibt
x J ( xc E ct c) y yc z zc t J (t c ( E / c) xc).
(2A.8)
28
2 Bezugssysteme in gleichförmiger Geschwindigkeit
Zusammenfassung x Inertialsysteme sind solche Bezugssysteme, in denen sich ohne Einwirkung einer äußeren Kraft ein Körper geradlinig gleichförmig bewegt. x Die Lichtgeschwindigkeit ist in allen Bezugssystemen gleich groß, unabhängig von deren Relativgeschwindigkeit zur Lichtquelle; sie hat den Betrag c 299792458 m/s . x Die Naturgesetze sind in allen Inertialsystemen gleich, es gibt also kein bevorzugtes Bezugssystem. x Aussagen 2 und 3 stellen die Grundlage für die Lorentz-Transformation dar. Sie liefert eine Beziehung zwischen den Koordinaten (x,y,z) sowie dem Zeitpunkt t eines Ereignisses in einem Inertialsystem S und den Koordinaten (x´,y´,z´) und dem Zeitpunkt t´ desselben G Ereignisses in einem Inertialsystem S´, das sich relativ zu S mit der Geschwindigkeit v bewegt. Für eine Bewegung in der positiven x-Richtung lautet die Transformation
xc
x vt 1 v2 / c2
;
yc
y;
zc z;
tc
t v x / c2 1 v2 / c2
x Aus der Lorentz-Transformation folgen:
a) die Relativität der Gleichzeitigkeit. Wenn zwei Ereignisse, die in x-Richtung die Koordinaten x1, x2 haben, einem Beobachter gleichzeitig erscheinen, so erscheinen sie einem bewegten Beobachter zu unterschiedlichen Zeiten 't ( x1 x2 )v / c 2 . b) die Zeitdehnung: Bewegte Uhren laufen um den Faktor 1/ 1 v 2 / c 2 langsamer als ruhende: c) die Längenkontraktion: Ein in x-Richtung orientierter bewegter Messstab erscheint einem ruhenden Beobachter um den Faktor
1 v 2 / c 2 verkürzt: d) Addition von Geschwindigkeiten: Geschwindigkeiten müssen nach dem relativistischen Geschwindigkeits-Theorem berechnet werden
ux
u cy 1 v 2 / c 2 u cx v u cz 1 v 2 / c 2 ; u ; u . y z 1 (v / c 2 )u xc 1 (v / c 2 )u cx 1 (v / c 2 )u cx
2 Bezugssysteme in gleichförmiger Geschwindigkeit
29
Übungsaufgaben G 1. Ein Raumschiff hat bezüglich des Koordinatensystems S die Geschwindigkeit u . Welche Geschwindigkeit hat es im Koordinatensystem S‘, das sich relativ zu S mit der GeschwindigG a) u1 (u0 , 0, 0) G keit v (v, 0, 0) bewegt? Prüfen Sie, ob für die Zahlenwerte G b) u2 (0, u0 , 0) mit u0 = 10 km/s, v = 100 km/s die Lorentztransformation deutliche Unterschiede gegenüber der Galilei-Transformation liefert.
2. Während einer Prüfung, die mit der Uhr des Professors gemessen genau eine Stunde dauern soll, bewegt sich der Professor relativ zum Prüfling mit der Geschwindigkeit v = 0,5 c, nachdem beide sich zu Beginn der Prüfung an demselben Ort befanden. Nach der vereinbarten Zeit sendet der Professor dem Prüfling ein Lichtsignal zum Zeichen, dass die Prüfung beendet ist. Welche Zeit stand dem Prüfling zur Verfügung? 3. Im Koordinatensystem S´, das sich relativ zu S mit der Geschwindigkeit v = 0,5 c bewegt, bildet ein 1 m langer Stab mit der Bewegungsrichtung den Winkel D = 45°. Welchen Winkel bildet er in S mit der Bewegungsrichtung und welche Länge besitzt er? G 4. Ein radioaktiver Atomkern bewege sich mit der Geschwindigkeit v K
(0,3 c, 0, 0) relativ G zum Laborsystem und emittiere ein Elektron mit der Geschwindigkeit ve,K 0, 75c relativ G zum Kern. Berechnen Sie den Betrag und die Richtung von v e im Laborsystem bei Emission G a) in Richtung von v K , G b) entgegengesetzt zu v K , G c) senkrecht zu v K .
3
Die Grundgleichungen der Mechanik
Unsere bisherigen Überlegungen galten Bewegungsabläufen; dabei haben wir Letztere im Allgemeinen nach der Art der Beschleunigung des betreffenden Körpers eingeteilt. Welche Ursache führt zu der betreffenden Bahnkurve? Dieser Frage wollen wir jetzt nachgehen. Dazu müssen wir die Begriffe Kraft und Masse einführen. Den Begriff der Kraft kennen wir aus dem täglichen Leben; bereits in früher Kindheit haben wir die Erfahrung gemacht, dass wir uns anstrengen müssen, wenn wir z.B. ein größeres Stofftier hochheben oder einen Fußball G den Eltern zuspielen wollen. Die Vorgänge werden durch eine Kraft F ermöglicht. Dabei besteht offensichtlich ein Zusammenhang mit der Masse m eines Körpers. Um einen „schweren“ Ball genau so weit werfen zu können wie einen „leichten“, benötigen wir eine größere Kraft. Zur Quantifizierung ist es zweckmäßig, von den drei Newtonschen Axiomen (Newton, I. 1643-1727) auszugehen.
3.1
Die Newtonschen Axiome
Die Newtonschen Axiome lauten 1. In einem Inertialsystem bleibt ein Körper, auf den keine Kraft einwirkt, in Ruhe oder bewegt sich mit konstanter Geschwindigkeit. 2. Greift in einem Inertialsystem an einem frei beweglichen Körper eine Kraft an, so wird er beschleunigt; es gilt (Aktionsprinzip)
G G d (m v) . F dt
(3.1)
G Ist die Geschwindigkeit v sehr klein gegenüber der Lichtgeschwindigkeit, so ist die Masse konstant und (3.1) lässt sich schreiben
G G F ma
(3.2)
3. Kräfte treten immer paarweise auf. Die Kraft, die ein Körper 1 auf einen Körper 2 ausübt, ist entgegengesetzt gleich der Kraft, die Körper 2 auf Körper 1 ausübt. Von Newton stammt die Formulierung “actio = reactio”,
G G F12 F21 .
(3.3)
Die Axiome 1 und 2 sind von allgemeiner Gültigkeit, d.h. sie gelten auch im Bereich großer Geschwindigkeiten, die vergleichbar mit der Lichtgeschwindigkeit sind. Das dritte Axiom gilt nur mit Einschränkungen (s. Kap. 8.2).
32
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Zunächst sei v c. - Das erste Newtonsche Axiom heißt auch Trägheitsgesetz. Wir ordnen einem Körper der Masse m eine Trägheit zu, auf Grund deren er seine Geschwindigkeit beibehält, die er beim Abschalten einer Kraft besitzt. Die Masse heißt deswegen träge Masse. Dem zweiten Newtonschen Axiom kommt besondere Bedeutung zu. Ist nämlich die Kraft, die auf einen Körper wirkt, bekannt, so lässt sich seine Bahnkurve berechnen. Deswegen heißt das zweite Newtonsche Axiom auch “Grundgesetz der Mechanik”. Es sei angemerkt, dass das erste Newtonsche Axiom bereits im zweiten als Spezialfall a = 0 enthalten ist. Da es aber das Inertialsystem definiert, ist es zweckmäßig, es als eigenständiges Axiom beizubehalten. Das dritte Newtonsche Axiom beschreibt die Tatsache, dass Kräfte immer paarweise auftreten. Denken wir etwa an eine Feder, die an einem Ende an einem Stativ befestigt ist. Wollen wir G die Feder dehnen, so müssen wir dazu am anderen Ende eine Kraft F12 aufwenden. Ihr G G entgegen wirkt die rücktreibende Kraft F21 F12 der Feder.
3.2
Messung von Massen
Zur Messung der Masse eines Körpers gibt es prinzipiell zwei Möglichkeiten. Zum einen können wir die träge Masse bestimmen und zum anderen die schwere Masse. Betrachten wir zunächst eine einfache Messanordnung zur Ermittlung der schweren Masse (Abb. 3.1a). Auf der einen Waagschale einer Balkenwaage befinde sich ein Körper mit unbekannter Masse; auf der anderen Seite werden Körper mit bekannter Masse mN aufgebracht, so dass die Waage ins Gleichgewicht kommt. Auf beide Körper wirkt die “Schwerkraft”, welche durch die Anziehung der Körper durch die Erde bewirkt wird. Mit der Balkenwaage lässt sich also die schwere Masse eines Körpers bestimmen. Als bekannte Massen können wir Körper benutzen, die sich von der Abb. 3.1a: Balkenwaage zur Standardmasse (Massennormal) 1 kg ableiten. 1 kg Messung der schweren Masse ist die Masse eines Platin-Iridium-Zylinders, der als Massennormal in Paris aufbewahrt wird. Die andere Möglichkeit besteht darin, die Trägheit eines Körpers auszunutzen und damit die träge Masse zu bestimmen. Dazu setzen wir einen Gleiter, auf dem sich ein Körper bekannter Masse mN befindet, auf eine Luftkissenschiene und lassen auf ihn eine (beliebige) konstante Kraft wirken Abb. 3.1b: Zur Bestimmung der (Abb. 3.1b). Die sich einstellende Beschleunigung trägen Masse wird gemessen. Dann tauschen wir den Normkörper durch den Körper aus der ersten Versuchsanordnung, dessen Masse ermittelt werden soll, aus und wiederholen den Versuch. Auf den Gleiter möge dieselbe Kraft wirken wie im gerade durchgeführten Versuch.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
33
Es gilt dann nach dem Grundgesetz der Mechanik
mN mx
ax aN
o mx
aN mN ax
(3.4)
Aus den gemessenen Beschleunigungen und den bekannten Masse mN lässt sich also die Masse ermitteln. Wir nennen sie träge Masse; es ergibt sich für sie der gleiche Wert wie für die schwere Masse. Sehr genaue Messungen haben gezeigt, dass schwere und träge Masse mindestens bis auf 1011 einander gleich sind.
ms mt m
3.3
Messung von Kräften
Zur Messung einer Kraft nutzen wir die Verformbarkeit von Körpern durch äußere Kräfte aus. Ein bekanntes Beispiel ist wiederum eine Schraubenfeder, die an ihrem einen Ende an einem Stativ befestigt sei (Abb. 3.2). Lassen wir auf ihr anderes Ende eine Kraft wirken, z.B. die Gewichtskraft eines Körpers der Masse m, so wird sie um eine Strecke x gedehnt. Zwei Körper der Gesamtmasse 2m bewirken die doppelte Auslenkung usw. Eine solche Feder lässt sich daher als Kraftmesser verwenden. Die Eichung kann mittels eines Beschleunigungsversuches mit bekannter Kraft erfolgen.
3.4
(3.5)
Abb. 3.2: Messung der Kraft
Bewegungsgleichung eines Massenpunktes unter dem Einfluss einer Kraft
Im Folgenden wollen wir untersuchen, welche Bahnkurve ein Körper unter der Einwirkung einer äußeren Kraft beschreibt. Da jeder Körper eine endliche Ausdehnung hat, kann er nicht nur reine Translationsbewegungen ausführen, sondern auch um eine beliebige Achse innerhalb des Körpers rotieren. Nichtstarre Körper, wie z.B. Gummi oder Flüssigkeiten, lassen sich ferner verformen. Die vollständige Beschreibung derartiger Bewegungen erfordert einen größeren Aufwand als die der reinen Translationsbewegungen. In diesem Kapitel wollen wir daher zunächst die Ausdehnung eines Körpers vernachlässigen. Wir beschreiben ihn als sog. “Massenpunkt”: Der Körper wird als punktförmig angesehen, seine Masse ist in diesem Punkt vereint. Die Bewegung des Massenpunktes ist durch das Grundgesetz der Mechanik, (3.2), bestimmt. Deswegen bezeichnen wir es auch als Bewegungsgleichung.
34
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.4.1 Konstante Kräfte In diesem Abschnitt wird der Fall besprochen, dass die auf den Massenpunkt einwirkende Kraft konstant ist. Das gilt auf der Erdoberfläche z.B. in sehr guter Näherung für die Gravitationskraft (Schwerkraft). Die Bewegungsgleichung lautet
G F
G d 2r m 2 dt
const. o
G d 2r dt 2
G dv dt
G F m
G a
const
(3.6)
Für die Geschwindigkeit des Massenpunktes folgt durch Integration
G dr dt
G G v(t ) a ³ dt C1
G G v(t ) at C1 .
(3.7) (3.8)
Durch nochmalige Integration ergibt sich die Bahnkurve
G G r (t ) a ³ tdt ³ C1dt C2 .
(3.9)
C1 und C2 sind Integrationskonstanten, die durch die Anfangsbedingungen festgelegt werden. Wir hätten natürlich auch wie im 1. Kapitel gleich die Anfangsbedingungen in den Integralen berücksichtigen können. In der Folge werden beide Methoden benutzt. Aus (3.8 ) folgt für t = 0 die Konstante C1 zu
C1
G G v(t 0) { v0
G G G v(t ) at v0
(3.10)
G Für C2 in (3.9) ergibt sich für t = 0 der zugehörige Ort ro des Teilchens
G r (t )
1G 2 G G at v0 t r0 2
(3.11)
Durch Festlegung der Anfangsbedingungen lassen sich also Geschwindigkeit und Bahnkurve des Massenpunktes in Abhängigkeit von der Zeit berechnen. Die Beziehungen sind schon in G G Kap. 1 hergeleitet worden ( a g ). Wir haben sie aber jetzt aus der Forderung abgeleitet, dass die die Bewegung bestimmende Kraft konstant sein soll.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
35
3.4.2 Ortsabhängige Kräfte Ortsabhängige Kräfte finden sich in vielen Bereichen der Physik. Wichtige Beispiele sind die Gravitationskraft eines Himmelskörpers auf einen Probekörper und die elektrostatische Kraft, die eine geladene Kugel auf eine Probeladung ausübt. In beiden Fällen ist die Ortsabhängigkeit durch ein 1/r2 - Gesetz gegeben; r ist der Abstand zwischen den jeweiligen Körpern. Große Bedeutung haben ortsabhängige Kräfte auch im atomaren Bereich. Da wir uns in diesem Teil mit makroskopischer Physik befassen, wählen wir zur weiteren Erläuterung die Gravitationskraft (die ausführlich in Kap. 7 diskutiert wird).
G G mM F (r ) G 2 rˆ ; r
(3.12)
G ist die Gravitationskonstante. Die Kraft ist attraktiv, wirkt also entgegen dem Einheitsvektor rˆ , der senkrecht auf dem betreffenden Himmelskörper steht und von ihm weg weist; daher steht das Minuszeichen. Wir wollen die Geschwindigkeit eines Geschosses, das in radialer Richtung von der Erde abgeschossen wird, berechnen. Dazu setzen wir (3.12) in das Grundgesetz der Mechanik ein und integrieren. Wir wählen das Koordinatensystem zweckmäßigerweise so, dass etwa die z-Achse in vertikaler Richtung verläuft.
v (0, 0, v z ) . Mit
a
dv dt
(3.13)
dv dz dz dt
dv v. dz
(3.14)
Wir erhalten also
vdv adz
GM dz z2
(3.15)
Durch Integration folgt
1 2 GM v C1 . z 2
(3.16)
Das Projektil werde mit der Anfangsgeschwindigkeit v0 von der Erdoberfläche (z = r0) abgeschossen. Damit wird die Integrationskonstante C1
C1
1 2 GM v0 2 r0
1 2 v0 gr0 2
und (3.16) wird unter Berücksichtigung von GM / r gr02 / z
(3.17)
36
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
v 2
gr02 1 2 v 0 gr0 z 2
(3.18)
Das ist die gesuchte Beziehung für die Geschwindigkeit eines Geschosses in Abhängigkeit von der Höhe. Die maximale Steighöhe zmax ergibt sich aus ihr, indem wir v = 0 setzen:
g r02 zmax
1 gr0 v 02 ; 2
zmax
gr02 gr0 v 02 / 2
zmax
r0 1 (v / 2r0 g ) 2 0
(3.19a)
(3.20)
Welche Anfangsgeschwindigkeit v0 muss dem Geschoss gegeben werden, damit es die Erde verlassen kann? Aus (3.20) folgt, dass Letzteres der Fall ist, wenn gilt
v0 o 2gr0 ,
(3.21)
denn für diesen Wert strebt der Nenner gegen null und der Abstand von der Erdoberfläche, zmax , gegen unendlich. Wir wollen die Geschwindigkeit
v z v0
2 gr0 11, 2 km/s
(3.22)
als Fluchtgeschwindigkeit bezeichnen.
3.4.3 Zeitabhängige Kräfte Häufig sind Kräfte von der Zeit abhängig. Denken wir etwa an ein schwingungsfähiges System, das durch eine zeitlich periodische Kraft zu Schwingungen angeregt wird. Schwingungsprobleme werden wegen ihrer Bedeutung und des großen Umfangs detailliert in einem gesonderten Kapitel, (Kap. 11), behandelt. Mit der Zeit unperiodisch anwachsende oder abfallende Kräfte spielen ebenfalls eine wichtige Rolle. Als Beispiel sei eine exponentiell abfallende Kraft genannt: 2 2
F (t ) Ae a t .
(3.23)
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
37
Wie groß ist die Endgeschwindigkeit eines Massenpunktes der Masse m, der vor Einwirkung der Kraft ruhte? Einsetzen von F(t) in die Bewegungsgleichung ergibt für die Endgeschwindigkeit v f
F ma o
mv
0
v
f
2 2
a t ³ F dt A³ e dt 0
A S 2a
A S . 2am
(3.24a)
(3.24b)
3.5 Elementarteilchen und Kräfte in der Natur Bei der Klassifizierung der Kräfte erscheint es sinnvoll, bereits hier kurz auf die grundlegenden Kräfte der Natur einWechselwirkung Quarks Leptonen zugehen. In Band II werden wir auf diesen Komplex etwas ausStarke Wechelwirkung u s b führlicher zurückkommen. Mit d c t chemischen Mitteln lässt sich die Materie auf die Elemente Elektromagnetische des Periodischen Systems zuWechselwirkung ´´ e μ W rückführen. Die elektrisch neuSchwache tralen Atome bestehen aus dem Wechselwirkung ´´ Qe Qμ QW positiv geladenen Kern und den ihn umgebenden negativ geladeTab. 3.1: Fermionen und zwischen ihnen wirkende nen Elektronen. Letztere sind Kräfte nicht weiter teilbar. Dagegen kann der Kern zweierlei Nukleonen enthalten, die positiv geladenen Protonen und die aus einem Proton und einem Elektron bestehenden, somit neutralen, Neutronen. Protonen setzen sich aus den Grundbausteinen der Materie zusammen, Quarks und Leptonen (Tab. 3.1). Diese besitzen alle einen Spin (anschaulich: einen Eigendrehimpuls, und heißen Fermionen. (L3.1). Das Schema der Abb. 3.3 gibt Ihnen aber einen ersten Überblick über die Fermionen. Es existieren drei Familien, innerhalb derer Quarks und Leptonen die gleichen Eigenschaften haben. Sie unterscheiden sich lediglich in ihrer Masse. Die Elementarteilchen werden durch Kräfte zusammengehalten, die durch Bosonen vermittelt werden. Bosonen sind Teilchen ohne Spin. Der Austausch findet jedoch nicht durch reelle, sondern durch virtuelle Teilchen statt. Um das zu verstehen, müssen wir etwas vorgreifen. In der klassischen (makroskopischen) Physik gilt in geschlossenen Systemen der Energieerhaltungssatz. Die Quantenmechanik zeigt, dass dieser für kurze Zeiten verletzt werden kann. Energieverletzung und zugehörige Zeitspanne sind durch die Heisenbergsche Unbestimmtheitsrelation miteinander verknüpft:
'E 't d h / 2S .
38
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Proton up-Quark -
Gluonen
Elektronen Z+
Kern
up-Quark down-Quark
Protonen und Neutronen
Darin bedeutet h 6, 63 1034 Js das Plancksche Wirkungsquantum (M. Planck, 1858-1947). Auf Grund der MasseEnergie-Relation lässt sich den AustauschBosonen eine Masse m 'E / c 2 zuordnen. Ihre Reichweite 's c 't ist also umso kleiner, desto größer ihre Masse ist. Der Typ der beteiligten Bosonen erklärt die unterschiedliche Stärke von drei der existierenden vier Grundkräfte (Wechselwirkungen).
Abb. 3.3: Zum Aufbau des Atoms
Es sind dies der Größe nach 1. Die starke Wechselwirkung 2. Die elektromagnetische Wechselwirkung 3. Die schwache Wechselwirkung 4. Die Gravitation
1 10-2 10-7 10-40
Schwache und elektromagnetische Wechselwirkung können zu einer einheitlichen Wechselwirkung zusammengefasst werden. An der Vereinigung der verbleibenden drei Grundkräfte wird intensiv gearbeitet (vgl. Kap. 21.1.2.6). Die starke Wechselwirkung wird durch die sog. Gluonen bewirkt; sie besitzt nur eine 14
kurze Reichweite ( d 10 m), wirkt also nur im Atomkern. Die elektromagnetische Kraft wird durch Photonen vermittelt; sie wirkt auf Ladungen (elektrische Kraft) und Ströme (magnetische Kraft) und ist langreichweitig. Da die Atome elektrisch geladene Elektronen und Protonen enthalten, beruht also die Bildung von Molekülen, Flüssigkeiten und Festkörpern aus Atomen auf der elektromagnetischen Wechselwirkung. Folglich sind die meisten im täglichen Leben auftretenden Kräfte ebenfalls elektromagnetischer Natur, z.B. die elastischen Kräfte einer Feder. Die schwache Wechselwirkung wird durch W- und Z-Bosonen vermittelt; diese besitzen eine große Masse. Folglich wirkt sie wie die starke Wechselwirkung nur innerhalb atomarer Dimensionen. Sie ist z.B. verantwortlich für den radioaktiven ß-Zerfall des Neutrons. Alle diese Bosonen lassen sich als reelle Teilchen erzeugen. Das Photon als Quant des Lichts ist uns allen bekannt. Ebenfalls langreichweitig ist die Gravitationskraft. Ein Blick auf die obige Aufstellung der relativen Kräfte zeigt, dass sie mit Abstand die schwächste Grundkraft ist. Aber sie wirkt bekanntlich zwischen elektrisch neutralen Körpern, aus der die makroskopische Materie besteht. Außerdem ist die Masse unserer Erde und die der anderen Himmelskörper sehr groß, daher ihre Bedeutung. Sie lässt sich aber bisher nicht in obiges Konzept einbinden.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.6
39
Kraftfelder
Weiter oben haben wir notiert, dass Kräfte ortsabhängig sein können. Als Beispiel führten wir u.a. die Gravitationskraft an, Gl. (3.12). Wir erläutern jetzt an diesem Beispiel das Konzept des G Kraftfeldes. An jedem Punkt des Raumes wirkt auf einen Massenpunkt eine vom Abstand r zwischen Erde und Massenpunkt abhängige Kraft. Wir können sie uns veranschaulichen r (Abb. 3.4), indem wir für alle Punkte des g (1/r 2 ) rˆ Raumes ihre Stärke gemäß (3.12) berechnen und durch die Länge eines zum Erdmittelpunkt weisenden Pfeils darstellen. Bei dieser Festlegung müssen wir allerdings die Masse m des Massenpunktes kennen. Die Kraft existiert natürlich unabhängig von dem Massenpunkt (Sonden-Masse), mit dessen Hilfe wir ihre Größe und Richtung messen. Daher ist es zweckmäßig, (3.12) durch die Sondenmasse zu teilen. Die so entstandene Größe deAbb. 3.4: Gravitationsfeldstärke finieren wir als Feldstärke (hier Gravitaund Äquipotentiallinien tionsfeldstärke). Ein analoger Fall begegnet uns in der elektromagnetischen Kraft zwischen zwei Punktladungen. In diesen Fällen ist das Feldlinienbild besonders einfach, da es nur eine radiale Komponente hat; die Kraft ist nur G abhängig vom Abstandsvektor r , sie ist kugelsymmetrisch
G G F const f (r ) .
(3.25)
Ein solches Kraftfeld heißt Zentralkraftfeld. Es ist eine Vektorgröße. Es gibt auch skalare Felder wie z.B. das Potentialfeld oder die Temperaturverteilung zwischen zwei Punkten unterschiedlicher Temperatur.
3.7
Der Energieerhaltungssatz der Mechanik
Bleibt bei allen physikalischen Prozessen eine physikalische Größe erhalten, so bezeichnen wir diese als Erhaltungsgröße. Im Bereich der Newtonschen Mechanik gibt es Erhaltungssätze für die Energie, den Impuls und den Drehimpuls. Darüber hinaus existieren zwei weitere Erhaltungssätze für die innere Energie und die elektrische Ladung. Sie werden später besprochen. Zunächst wollen wir den Energieerhaltungssatz der Mechanik ableiten. Ausgangspunkt ist der Begriff der Arbeit.
40
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.7.1 Arbeit und Leistung G Wir betrachten einen Massenpunkt, der durch Einwirkung einer Kraft F vom Ort a zum Ort b verschoben werde (Abb. 3.5). Die Kraft möge vom jeweiligen Ort des Massenpunktes abhängen. Um die im Allgemeinen gekrümmte Bahnkurve anzunähern, setzen wir sie aus r r y kurzen geradlinigen Abschnitten zusammen. r 1 r2 G Wir greifen ein Wegelement 'ri heraus, dessen r G ri Ort also durch den Ortsvektor ri bestimmt wird. r r a F(ri ) Wir definieren nun das Skalarprodukt der an diesem Ort auf den Massenpunkt wirkenden b r G G ri Kraft F (ri ) und der durch sie bewirkten VerG schiebung 'ri des Massenpunktes als Arbeit. x
G G G 'Wi F ( ri ) 'ri
z
(3.26)
Abb. 3.5: Zur Definition der Arbeit Die gesamte Arbeit W (a o b) längs des Weges von a nach b ist dann
W (a ob)
G G G G G G G G G F ( r1 ) 'r1 F (r2 ) 'r2 ... F (ri ) 'ri ... G G G ¦ i F (ri ) 'ri
(3.27)
Je kleiner die Wegelemente gewählt werden, umso genauer wird das Ergebnis. Den exakten G Wert erhalten wir, wenn wir 'ri gegen null streben lassen, d.h. wenn wir integrieren: b
W ( a o b)
G G
G
³ F (r ) dr
(3.28)
a
Bei Anwendungen sind die Richtungen der beiden Faktoren im Skalarprodukt zu beachten. Die Einheit der Arbeit ist das „Newtonmeter“ (Nm). (1 Nm = 1 J (Joule) = 1 Ws (Wattsekunde)). (J. P. Joule, 1818-1889). Eine andere wichtige Größe ist die pro Zeiteinheit verrichtete Arbeit. Sie wird als Leistung P bezeichnet.
P
dW . dt
(3.29)
Da die Einheit der Zeit die Sekunde (s) ist, folgt für die Einheit der Leistung: 1 J/s = 1 W
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
41
3.7.2 Wegunabhängige (konservative) Kräfte Kräfte wollen wir in zwei Klassen einteilen; ist die Arbeit, die eine äußere Kraft an einem Massenpunkt verrichtet, unabhängig von der Form des Weges C, auf dem es sich bewegt, so nennen wir die Kraft konservativ. Die Arbeit hängt also in diesem Fall nur vom Anfangs- und Endpunkt ab. Wir können das in integraler oder differentieller Form schreiben (Anhang 1.2).
G G
v³ Fdr
G G 0 oder differentiell rot F (r ) 0 .
(3.30)
C
Zu dieser Klasse von Kräften gehören die elastische Federkraft, die Gravitationskraft sowie die elektrostatische Kraft zwischen geladenen Körpern. Beispiele für nicht-konservative Kräfte sind Reibungskräfte (s. Kap. 10.5). Ein Beispiel für die Arbeit einer konservativen Kraft ist die Spannarbeit (Abb. 3.6): Um eine Feder zu dehnen, muss die rücktreibende Federkraft kompensiert werden. Die erforderliche Kraft ist also -D (x) F ( x) Dx , (3.31a) r F (x) wobei D eine Konstante, die Federkonstante, ist. x1 x 0 Die Arbeit ergibt sich zu x1
W (0, x1 )
³ D x dx 0
1 2 Dx1 2
(3.31b)
Abb. 3.6: Beispiel einer konservativen Kraft: Spannarbeit einer Feder
3.7.3 Potentielle Energie und kinetische Energie Verrichten wir an einem Massenpunkt Arbeit, so ist diese anschließend als Energie im System gespeichert. Das System kann daher jetzt seinerseits Arbeit verrichten; z.B. kann sich in unserem obigen Beispiel die Feder entspannen und dabei an einem Körper Arbeit verrichten. Oder bringen wir einen an einem Seil befestigten Körper der Masse m mittels einer Rolle entgegen der Schwerkraft auf die Höhe h, so kann dieser Körper beim Herabgleiten einen anderen Körper der Masse m1 m hochziehen. Das Vermögen eines Körpers, Arbeit zu verrichten, wird als potentielle Energie bezeichnet. Sie ist definiert als P1
E pot : W
G G
G
³ F (r ) dr
P0
.
(3.32a)
42
3 Grundgleichungen der Mechanik und Energieerhaltungssatz P1 G G G E pot : ³ F ( r ) dr
(3.32b)
P0
G G Hierin ist F (r ) wiederum die auf den Massenpunkt wirkende Kraft. – Der Nullpunkt der potentiellen Energie kann beliebig gewählt werden, da nur die Differenz definiert ist. Im obigen Beispiel ist die von der gespannten Feder gespeicherte potentielle Energie x1
E pot ³ ( D x) dx 0
1 2 Dx1 . 2
(3.33)
Häufig wird an Stelle der potentiellen Energie der Begriff des Potentials V benutzt. Wir führen diese Bezeichnung in (3.32a) ein. Für ein infinitesimal kleines Wegelement lautet sie
dV { dW pot
dW
G G G F (r ) dr .
(3.32a)
G Nach Kap. A1.2.1 ändert sich das Potential beim Fortschreiten um dr um
dV
G dr gradV .
Gehen wir damit in (3.31a) ein, so folgt
G G G F (r ) grad V (r ) .
(3.34)
Fassen wir die Kraft als Feldgröße auf, so sehen wir, dass an die Stelle des vektoriellen Kraftfeldes ein skalares Potentialfeld getreten ist. Da wir konservative Kraftfelder vorausgesetzt haben, gilt als Bedingung, dass sich eine Kraft als Gradient eines skalaren Potentials darstellen lässt, nach 3.30
G rot grad V ( r )
0
(3.35)
(3.34) ist nichts Anderes als die Umkehr von (3.32b), wie wir bei der Beschränkung auf eine Dimension sofort erkennen. In diesem Fall lautet (3.32a)
dV
F ( x) dx o F ( x)
dV . dx
Eine Kraft kann auch dazu dienen, einen Massenpunkt längs eines Weges zu beschleunigen.
43
3 Grundgleichungen der Mechanik und Energieerhaltungssatz Erinnern wir uns an das Grundgesetz der Mechanik:
G G dv F m dt
(3.3)
Die Arbeit einer Kraft ist durch (3.28) gegeben. Mit (3.2) folgt P1
W
G G G ³ F (r )dr
P0
G dv G m ³ dr dt P0 P1
P1
G G m ³ vd v P0
m 2 m 2 vP vP 2 1 2 0
(3.35a)
Als nichtrelativistische kinetische Energie eines Massenpunktes definieren wir die Größe
Ekin :
m 2 v 2
(3.36)
3.7.4 Energieerhaltungssatz Wir können jetzt den Energieerhaltungssatz der Mechanik formulieren. Potentielle und kinetische Energie an zwei Punkten P0 und P bezeichnen wir mit Epot(P0) und Ekin(P0) usw. Mit (3.32a/b) und (3.36) folgt
G G G F ³ (r )dr E pot ( P) E pot ( P0 ) Ekin ( P) Ekin ( P0 )
(3.37a)
E pot ( P ) Ekin ( P)
(3.37b)
P
P0
oder
E pot ( P0 ) Ekin ( P0 )
E
const.
Die Summe aus potentieller und kinetischer Energie am Ort P ist gleich der Summe aus potentieller und kinetischer Energie am Ort P0.
E pot +E kin = const.
Energieerhaltungssatz.
(3.38)
44
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
3.8 Anwendungen des Energieerhaltungssatzes 3.8.1 Das Federpendel Eine Feder hänge an ihrem einen Ende an einem Stativ (Abb. 3.7); an ihrem unteren Ende sei ein Massenpunkt der Masse m befestigt. Die Feder möge frei schwingen; die Rückstellkraft ist wieder durch F D x gegeben. Die Bewegungsgleichung ist
Abb. 3.7: Zur Erläuterung des Energieerhaltungssatzes am Beispiel des Federpendels
m
d2x Dx 0 dt 2
d2x D x 0 dt 2 m
(3.39a)
(3.39b)
Aus Erfahrung wissen wir, dass das Pendel eine (harmonische) Schwingung ausführt; die Auslenkung ist also gegeben durch
x
x0 cos Zt
(3.40)
Die erste und zweite zeitliche Ableitung sind
dx dt
Z x0 sin Zt ;
d 2x dt 2
Z 2 x0 cos Zt .
(3.41)
Einsetzen von (3.40) und (3.41) in die Bewegungsgleichung, Gl. (3.39b), ergibt für die Frequenz Z
Z
D m
(3.42)
Zu jedem Zeitpunkt muss der Energieerhaltungssatz erfüllt sein. Wir wollen dies nachprüfen.
E E pot Ekin
D 2 m 2 x v 2 2
(3.43)
Einsetzen von x, v liefert
E
D 2 m x0 cos 2 Zt Z 2 x02 sin 2 Zt 2 2
(3.44)
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
45
Mit (3.42) folgt
E
m 2 2 Z x0 (cos 2 Zt sin 2 Zt ) 2
D 2 x0 const. 2
(3.45)
Die Gesamtenergie während einer Schwingungsperiode bleibt konstant. Es findet eine dauernde Umwandlung von potentieller in kinetische Energie und umgekehrt statt.
3.8.2 Fluchtgeschwindigkeit eines Projektils In Kap. 3.4 haben wir die Geschwindigkeit eines Projektils, die zum Verlassen des Anziehungsbereiches der Erde erforderlich ist, berechnet. Dabei sind wir vom Grundgesetz der Mechanik ausgegangen. Um die Momentangeschwindigkeit zu erhalten, mussten wir die Bewegungsgleichung integrieren. Kennen wir dagegen die potentielle und kinetische Energie des Problems, so können wir uns die Integration ersparen. Zunächst berechnen wir die potentielle Energie. Sie ergibt sich aus der Arbeit, die benötigt G wird, um einen Körper von einem unendlich weit entfernten Punkt an den Ort r zu bringen: r
Mm J ³ () 2 dr r f
E pot
r
§ 1 ·º J Mm ¨ ¸» © r ¹¼f
J
Mm r
(3.46)
Also gilt für die Gesamtenergie E
E
E pot Ekin
gmrEr2 m 2 v ; 2 r
(3.47)
die Größe rEr bezeichnet den Erdradius. In unendlicher Entfernung vom Erdmittelpunkt ist neben der potentiellen Energie auch die kinetische Energie gleich null. (Der Einfluss anderer Himmelskörper als der der Erde werde vernachlässigt). Einsetzen von E = 0 in (3.47) ergibt
m 2 v 2
gmrEr2 r
(3.48)
Ist also die Geschwindigkeit des Geschosses größer als
v0
2 grEr ,
(3.49)
so kann es die Erde verlassen. Wie bereits erwähnt, bezeichnen wir v0 als die Fluchtgeschwindigkeit. Das Ergebnis ist in Übereinstimmung mit dem in Kap. (3.4) berechneten Ausdruck für die Fluchtgeschwindigkeit.
46
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
Zusammenfassung x Die Mechanik lässt sich auf den Newtonschen Postulaten aufbauen. Sie lauten
1.1 Wirken auf einen Körper keine Kräfte ein, so verharrt er im Zustand der Ruhe oder bewegt sich mit konstanter Geschwindigkeit längs einer Geraden. Ein Bezugssystem, in dem dieser Sachverhalt gilt, heißt Inertialsystem. 1.2 Die zeitliche Impulsänderung eines Körpers ist gleich der von außen wirkenden Kraft. Der Impuls ist definiert als das Produkt aus Masse und Geschwindigkeit des Körpers.
G dpG F dt
o
G G p m v.
Für nichtrelativistische Geschwindigkeiten (v c) wird
G G F ma ; m const Diese Beziehung heißt auch Grundgesetz der Mechanik oder Bewegungsgleichung. 1.3 Jede Kraft ruft eine Gegenkraft hervor,
G G F12 F21 x Unter einem Massenpunkt ist ein ausdehnungsloser Körper der Masse m zu verstehen x Träge und schwere Masse besitzen den gleichen Wert. x Alle Kräfte in der Natur können auf drei Grundkräfte zurückgeführt werden. x Eine Kraft lässt sich durch ein vektorielles Kraftfeld beschreiben. x Mechanische Arbeit ist definiert als das Wegintegral der auf den Massenpunkt von außen einwirkenden Kraft b
W ( a o b)
G G
G
³ F (r ) dr . a
Die Einheit ist 1 kg m = 1 J = 1Ws. x Leistung ist Arbeit pro Zeiteinheit. Die Einheit ist 1 W.
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
47
x Kräfte, die nicht von der Art des Weges abhängen, heißen konservativ. x Die potentielle Energie ist definiert als die negative Arbeit, die von der WechselG G wirkungskraft (der inneren Kraft) F (r ) verrichtet wird b G G G E pot : ³ F (r ) dr . a
x Die kinetische Energie eines Massenpunktes ist definiert als
Ekin :
1 m v2 . 2
x Für konservative Kräfte gilt der Energieerhaltungssatz
E pot Ekin const. .
Übungsaufgaben 1. Ein punktförmiger Körper der Masse m gleitet reibungsfrei unter dem Einfluss der Schwerkraft vom höchsten Punkt eines Zylinders, der sich auf einer ebenen Tischplatte befindet, herab. Seine Anfangsgeschwindigkeit sei vernachlässigbar. a) Unter welchem Winkel zur Vertikalen löst sich der Körper vom Zylinder ab? b) In welchem Abstand zur fixierten Auflagelinie des Zylinders trifft die Kugel auf den Tisch auf? 2. Ein zur Ausstrahlung von Fernsehprogrammen vorgesehener Satellit soll mit einer Rakete auf eine geostationäre Bahn gebracht werden, d.h. er soll immer über dem gleichen Punkt der Erde stehen. Wie groß muss sein Abstand von der Erdoberfläche sein? Wie viele solcher Satelliten werden benötigt, um jeden Punkt am Äquator zu erreichen? 3. Zwei Fahrer mit ihren identischen Pkw starten zur gleichen Zeit in eine nichtüberhöhte Kurve. Der eine Fahrer benutzt die innere der beiden Fahrspuren, der andere die Außenspur. Wer erreicht das Ziel am Ende der Kurve zuerst, wenn beide gerade so schnell fahren, dass ihr Fahrzeug nicht ausbricht? 4. Warum wird beim Straßenbau eine Kurve überhöht angelegt? Wie muss die Überhöhung gewählt werden, wenn die Kurve mit dem Krümmungsradius r mit der Geschwindigkeit v durchfahren werden soll?
48
3 Grundgleichungen der Mechanik und Energieerhaltungssatz
5. Gegeben seien die Funktionen V x 2 y 2 r 2 und y 1/ r 2 . a) Berechnen Sie für beide Fälle den Gradienten. b) Welche anschauliche Bedeutung kommt dem Gradienten zu? c) Welche anschauliche Bedeutung kommt dem div-Operator zu, welche dem rot-Operator? 6. Was bedeutet der Begriff der Fluchtgeschwindigkeit und welchen Wert besitzt diese? Ist sie an allen Orten gleich groß? 7. Berechnen Sie die potentielle Energie eines Körpers der Masse m0 im Gravitationsfeld einer Kugelschale, wenn sich der Körper innerhalb bzw. außerhalb der Kugelschale befindet. 8. Ein Mann trägt einen 50 kg schweren Sandsack 10m eine Rampe (D=10°). hinauf zu einem Lastwagen. Dort hebt er ihn auf die 0,75 m hohe Ladefläche. Wie groß sind Arbeit und mittlere Leistung, wenn er insgesamt 40 s benötigt? Wie groß wäre die Arbeit für D = 0? 9. Ein Körper mit der Masse von 4 kg bewegt sich auf einer schiefen Ebene (Neigungswinkel
D = 20°) aufwärts. Auf den Körper wirken außer der Schwerkraft eine horizontale Kraft von 80 N, eine Kraft von 100 N parallel zur Ebene und eine Reibungskraft von 10 N. Berechnen Sie die einzelnen Arbeitsbeträge und die Gesamtarbeit, welche das Kräftesystem verrichtet, wenn der Körper 20 m auf der Ebene gleitet.
4
Systeme von Massenpunkten und Impulserhaltungssatz
Bei der bisherigen Entwicklung der Mechanik haben wir uns auf einen Massenpunkt beschränkt. Nun gibt es aber Situationen und Prozesse, an denen mehrere Körper bzw. Teilchen beteiligt sind. Nur zwei Beispiele seien genannt: die Mechanik der Himmelskörper und Streuprozesse von „Elementarteilchen“ im Kraftfeld von Atomen oder anderen Teilchen. Wir wollen unsere Kenntnisse daher jetzt auf ein System von Massenpunkten erweitern. Dabei werden wir als zweiten Erhaltungssatz den Impulserhaltungssatz kennen lernen. Der Energieerhaltungssatz erlaubt, wie wir gesehen haben, in manchen Fällen die Berechnung der Geschwindigkeit eines Massenpunktes ohne Integration und erleichtert damit die Berechnung der Bahnkurve. Wird zusätzlich der Impulserhaltungssatz herangezogen, angewandt auf einen Stoß zweier Teilchen, so lassen sich bei bekannter Anfangsgeschwindigkeit der Stoßpartner die Geschwindigkeiten nach dem Stoß berechnen. Eine explizite Kenntnis der Kräfte ist dazu nicht nötig.
4.1
Impulserhaltungssatz als Folge des dritten Newtonschen Axioms
Der Impuls eines Teilchens (MP) ist definiert als das Produkt aus seiner Masse und Geschwindigkeit,
G p
G mv .
(4.1)
G G Wir betrachten nun ein System aus zwei Massenpunkten, auf die Kräfte F1 bzw. F2 einwirken. Das Grundgesetz der Mechanik lautet
G F1 G F2
G dp1 d G (m1v1 ) dt dt G dp2 d G (m2 v 2 ) dt dt
(4.2a)
Die Summe der Kräfte ist also
G G F1 F2
G G dp1 dp2 dt dt
(4.2b)
G G Wir zerlegen die Kräfte F1 und F2 in einen Anteil, der von äußeren Kräften (a) herrührt, und in einen Anteil, der die innerhalb des Systems wirkenden Kräfte berücksichtigt (i). Da das System nur aus zwei Teilchen besteht, kann eine innere Kraft auf Massenpunkt 1 nur von G G Massenpunkt 2 herrühren und umgekehrt. Sie seien mit F12i und F21i bezeichnet.
50
4 Systeme von Massenpunkten und Impulserhaltungssatz
Es gilt also
G G G F1 F1a F12i G G G F2 F2a F21i
(4.3)
Unabhängig davon, ob es sich um äußere oder innere Kräfte handelt, gilt nach dem dritten Newtonschen Axiom
G G F12 F21
(4.4)
Die zeitliche Ableitung des Gesamtimpulses ergibt sich damit zu
G dp G a G a G i G i G a G a F1 F2 F12 F21 F1 F2 dt
G dp a dt
(4.5)
Der Impuls des Systems wird also durch innere Kräfte nicht beeinflusst. Existieren keine äußeren Kräfte, so entnehmen wir (4.5), dass der Gesamtimpuls erhalten bleibt. Zur experimentellen Verifikation des Impulserhaltungssatzes zeigt Abb. 4.1 zwei auf einer Luftschiene gleitende Reiter. Ihre Geschwindigkeit kann mittels zweier Lichtschranken gemessen werden. Jeder der beiden Reiter ist mit einer Feder ausgestattet, die durch einen Faden gespannt gehalten wird. Der Impulserhaltungssatz fordert (die Vektorzeichen sind hier belanglos)
p1 p2 p1 p 2 Abb. 4.1: Demonstration des Impulserhaltungssatzes. Nach dem Durchbrennen des Fadens haben die identischen Reiter entgegengesetzt gleiche Geschwindigkeiten
m1v 1 m2 v 2
o
v 1 v 2
m2 m1
(4.6)
Links stehen die Impulse vor dem Stoß, rechts die nach dem Stoß. Zu Beginn ruhen beide Reiter (p1 + p2 = 0). Nach dem Durchbrennen des Fadens entspannen sich die Federn; für die Impulse bzw. die Geschwindigkeiten gilt (4.7)
Das Verhältnis der Endgeschwindigkeiten der beiden Massenpunkte ist reziprok zum Verhältnis ihrer Massen. Die Versuchsdurchführung bestätigt den Impulserhaltungssatz für das spezielle Beispiel.
51
4 Systeme von Massenpunkten und Impulserhaltungssatz
4.2
Schwerpunkt oder Massenmittelpunkt eines Systems von zwei Massenpunkten
Wir fragen nun nach der Bewegung zweier Massenpunkte unter dem Einfluss äußerer Kräfte. G G Zunächst führen wir den Begriff des Schwerpunktes ein. Sind r1 (t ) und r2 (t ) die Orte der beiden MP, so definieren wir als Ort des Schwerpunktes der MP die Größe
G R(t )
1 G G m1r1 (t ) m2 r2 (t ) . m1 m2
(4.8)
Der Schwerpunkt ist das mit den beiden Massen gewichtete Mittel der Ortskoordinaten. Er wird daher auch als Massenmittelpunkt bezeichnet. (4.2) lässt sich damit schreiben
G G F1a F2a
G dp a dt
d d G G ^ m1r1 (t )` ^ m2 r2 (t )` dt dt G d (m1 m2 ) R(t ) dt
(4.9)
Bei Anwesenheit äußerer Kräfte bewegt sich der Schwerpunkt des Systems der zwei Massenpunkte so, als ob seine Gesamtmasse (m1 + m2) in ihm vereinigt wäre und alle äußeren Kräfte direkt in ihm angriffen. Als Beispiel zeigt Abb. 4.2 die Bahnkurve einer Hantel; ihr Schwerpunkt beschreibt eine Parabel.
Abb. 4.2: Bahnkurve einer Hantel: Ihr Schwerpunkt beschreibt eine Parabel xx
52
4.3
4 Systeme von Massenpunkten und Impulserhaltungssatz
Verallgemeinerung auf mehrere Massenpunkte
Wir betrachten jetzt N Massenpunkte (Abb. 4.3). Die Kraft auf den i-ten Massenpunkt lässt G G sich wie oben in einen äußeren Anteil Fi a und in Anteile Fi j , j 1, 2,3,...N zerlegen, die von den anderen MP des Systems herrühren. mj
r F aj
m1
(1) r Fji
r rj
r ri
r Fia
mn
r ri
r
S
(2)
i
r R
r Fi j mi
0 G Abb. 4.3b: Ortsvektor Ui eines Massenpunktes im Schwerpunktsystem
Abb. 4.3a: Auf zwei oder mehrere Massenpunkte können äußere und innere Kräfte wirken. Letztere heben sich paarweise auf Eine Kraft auf sich selbst gibt es nicht, d.h.
G Fii
0 .
Weiter gilt analog oben
G G Fi j Fj i .
(4.10)
Die Summation über alle Massenpunkte i ergibt
G ¦ Fi N
i 1
N N G G ¦ Fi a ¦¦ Fi j N
i 1
i 1 j 1
G ¦ Fi a N
i 1
G dpia ¦1 dt N
G dp a dt
(4.11)
G G Die Doppelsumme verschwindet, denn zu jedem Fi j gibt es ein Fji , so dass sie sich nach
dem dritten Newtonschen Postulat paarweise wegheben.
53
4 Systeme von Massenpunkten und Impulserhaltungssatz Erwartungsgemäß finden wir:
Der Gesamtimpuls eines Systems aus N Massenpunkten wird durch innere Kräfte nicht verändert. Sind keine äußeren Kräfte vorhanden, so bleibt der Gesamtimpuls konstant. Definieren wir den Ortsvektor des Schwerpunktes entsprechend (4.8)
G R
1 M
N
G
¦ mr , i
N
¦m ,
M
(4.12)
i
i 1
i 1
so ergibt sich aus (4.11)
G F ¦ Fi N
i 1
G ¦ Fi a N
i 1
G dpi dt
N
d G mi vi ¦ i 1 dt
G d § dR · ¨M ¸ dt © dt ¹
(4.13)
Ist die Masse konstant, so lässt sich (4.13) vereinfachen:
G G d 2R F M 2 dt
(4.14)
Der Schwerpunkt bewegt sich so, als ob die Gesamtmasse M in ihm vereinigt wäre und die Summe der äußeren Kräfte in ihm angriffe. Beim Fehlen äußerer Kräfte bewegt sich der Schwerpunkt geradlinig gleichförmig. Die vorstehenden Überlegungen zum Impuls setzten voraus, dass das Koordinatensystem im Labor verankert ist. Wie wir gleich sehen werden, ist es bei manchen Anwendungen zweckmäßig, den Impuls im Schwerpunktsystem zu Grunde zu legen. Zur Einführung gehen G wir von Abb. 4.03b aus. Der Ortsvektor eines Massenpunktes ri , werde geschrieben als
G ri
G G R Ui , i 1...N .
(4.15)
Den Impuls im Schwerpunkt-System definieren wir als
G d Ui S i : mi . dt G
G
mit o S i
G G dri dR mi mi dt dt
(4.16)
G m G pi pres . M
(4.17)
54
4 Systeme von Massenpunkten und Impulserhaltungssatz
Integration von (4.14) liefert den Gesamtimpuls
G dR M . dt
G pres
(4.18)
Summierung über alle Massenpunkte in (4.17) und Einsetzen von (4.18) führt zu N
G
¦S i i 1
G
S res
4.4
N
G
¦p
i
G pres
G G pres pres
0
(4.19a)
i 1
0
(4.19b)
Anwendungen des Impulserhaltungssatzes
4.4.1 Stoßprozesse Wir wollen zwei Körper betrachten, die sich mit vorgegebenen Geschwindigkeiten aufeinander zu bewegen mögen. Je nach Art der Wechselwirkung können sich die Stoßpartner berühren, wie bei zwei Billard-Kugeln, oder sich nur einander annähern. Im ersten Fall bezeichnen wir den Prozess als Stoß zweier Teilchen. Im zweiten Fall ist der Begriff der Streuung üblich. Allgemein verstehen wir darunter die Richtungsänderung von freie fliegenden Teilchen oder einer Welle beim Auftreffen auf ein Hindernis. Der Begriff wird einschränkend oft benutzt, wenn der korpuskulare Charakter der Materie betont werden soll, an dem ein Teilchen oder auch eine Welle gestreut wird. Ein Beispiel ist die Streuung positiv geladener 4 He 2 -Kerne im Feld der Protonen eines Atomkerns (Rutherford-Streuung). Die abstoßende Wechselwirkung zwischen den gleichnamig geladenen Teilchen bewirkt eine Ablenkung der 4 He 2 -Kerne, bevor eine direkte Berührung erfolgen kann. Ein anderer Fall ist die Streuung von „Lichtpartikeln“, den Photonen, an quasi ruhenden Elektronen, bekannt unter dem Namen ComptonEffekt. Die Stoßzeit mechanischer Stoßprozesse ist mit 1030 s relativ kurz, sie kann aber auch sehr lang werden wie im Bereich der Himmelsmechanik. Es ist zweckmäßig, zwischen elastischen und inelastischen Stößen zu unterscheiden. Elastische Stöße sind dadurch definiert, dass die gesamte kinetische Energie der Stoßpartner vor dem Stoß gleich deren gesamter kinetischen Energie nach dem Stoß ist. Von einem inelastischen Stoß sprechen wir, wenn ein Teil der vor dem Stoß vorhandenen kinetischen Energie beim Stoß in eine andere Energieform übergeht, z. B. in Wärmeenergie. Beim vollständig inelastischen Stoß bewegen sich beide Körper nach dem Stoß mit derselben Geschwindigkeit (sie „kleben“ aneinander). In der makroskopischen Physik besteht im Allgemeinen die Aufgabe darin, aus den bekannten Anfangsgeschwindigkeiten die Endgeschwindigkeiten und die Bahnen zu berechnen.
4 Systeme von Massenpunkten und Impulserhaltungssatz
55
4.4.1.1 Stöße in einer Dimension Wir wenden uns jetzt zentralen Stößen zu, d. h .zwei Körper sollen sich ohne Einwirkung äußerer Kräfte längs einer Geraden aufeinander zu bewegen.
4.4.1.1.1 Der elastische Stoß Zur Berechnung der Endgeschwindigkeit der beiden Stoßpartner benötigen wir zwei Gleichungen. Die erste Gleichung liefert uns der Impulserhaltungssatz, die zweite der Energieerhaltungssatz. Die beiden Körper mögen die Massen m1 und m2 (= const.) haben. Ihre Geschwindigkeiten vor dem Stoß seien v1 und v2, die nach dem Stoß v 1 und v 2 . Die Vektorzeichen lassen wir weg, da die Bewegung längs einer Geraden verläuft. Die beiden Gleichungen sind also
m1v1 m2 v 2 m1 v 1 m2 v 2 m1 2 m2 2 v1 v2 2 2
m1 2 m2 2 v 1 v 2 2 2
(4.20)
Die potentiellen Energien vor und nach dem Stoß seien gleich. Die Endgeschwindigkeiten ergeben sich zu
v 1
m m2 2m2 v2 1 v1 ; m1 m2 m1 m2
v 2
m m2 2m1 v1 1 v2 . m1 m 2 m1 m2
(4.21)
Spezialfälle: a)
m1
v 1
m2
v2 ;
v 2
v1
Reiter der gleichen Masse tauschen ihre Geschwindigkeit aus b)
m1 !! m2
v 1 | v1 ;
v 2 | 2v1 - v 2
Der schwerere Körper behält seine Geschwindigkeit annähernd bei. Der leichtere Körper wird für v1 = 0 am Schwereren reflektiert.
4 Systeme von Massenpunkten und Impulserhaltungssatz
56
4.4.1.1.2 Der vollkommen inelastische Stoß In diesem Fall „kleben“ die Körper nach dem Stoß aneinander, sie bewegen sich mit gleicher Geschwindigkeit. Statt des Energieerhaltungssatzes der Mechanik gilt also jetzt
v 1
v 2 .
(4.22)
Damit folgt aus dem Impulserhaltungssatz
v 1 v 2
m1 v1 m2 v 2 . m1 m2
(4.23)
Lehrreich ist auch der Spezialfall, dass vor dem Stoß Körper 2 ruht. Für die Energie vor dem Stoß gilt
E
m1 2 v1 2
und nach dem Stoß
m1 m2 2 E v 1 2
(4.24)
Einsetzen von v 1 ergibt
E
1 m12 v12 . 2 m1 m2
(4.25)
Wir erhalten also als Differenz der Energien vor und nach dem Stoß
'E
m1 § 2 m1v12 · ¨ v1 ¸ 2 © m1 m2 ¹
1 m1m2 2 1 v1 : Pred v12 . 2 m1 m2 2
(4.26)
μred ist die reduzierte Masse. Die kinetische Energie ' E geht beim vollständig inelastischen Stoß als mechanische Energie verloren; sie wird in Wärmeenergie verwandelt.
57
4 Systeme von Massenpunkten und Impulserhaltungssatz 4.4.1.2 Stöße in zwei und drei Dimensionen
Der Übersichtlichkeit halber werde der Fall betrachtet, dass sich ein Körper der Masse m1 entlang der x-Achse mit der Geschwindigkeit v1 auf einen ruhenden Körper der Masse m2 zu bewegt. Der Stoß soll jetzt aber nicht mehr zentral erfolgen, sondern die zunächst geradlinige Bahn möge in ihrer Verlängerung in einem gewissen Abstand am Mittelpunkt des zweiten Körpers vorbei führen. Dieser seitliche Versatz wird mit dem Buchstaben b bezeichnet und heißt Stoßparameter (Abb. 4.4). Wir beschränken uns im Folgenden auf den Fall, dass die beteiligten Körper nicht rotieren.
r v% 1
r v1
1
b
r1
r2 b 2
r v% 2
Abb. 4.4: Nichtzentraler Stoß, charakterisiert durch den Stoßparameter b Die Bahnen der zwei Stoßpartner spannen eine Ebene auf, wir haben ein zweidimensionales Problem vor uns Die Aufgabe entspricht der bisherigen: in Abhängigkeit vom Stoßparameter sollen aus der bekannten Anfangsgeschwindigkeit des stoßenden Körpers die Endgeschwindigkeiten beider Körper und die Ablenkungswinkel M1 und M2 berechnet werden. Es sind also vier Unbekannte zu bestimmen, wofür wir vier Gleichungen benötigen. Zwei Beziehungen liefert uns der Impulserhaltungssatz für die x- und y-Komponente der Endgeschwindigkeiten
pges x
m1 v1 m1v 1 cos M1 m2 v 2 cos M2
pges y
0
m1 v 1 sin M1 m2 v 2 sin M2
(4.27)
Eine weitere Gleichung folgt aus dem Energieerhaltungssatz. Ist der Stoß elastisch, so gilt
m1 2 m1 2 m2 2 v1 v 1 v 2 2 2 2
(4.28)
Die noch fehlende vierte Gleichung liefert uns die Größe des Stoßparameters b:
sin M2
b /(r1 r2 ) .
Ein typischer Streuprozess, die Rutherford-Streuung, wird in Kap. 6 im Rahmen des Keplerproblems besprochen.
58
4 Systeme von Massenpunkten und Impulserhaltungssatz
4.4.2 Elastischer Stoß im Schwerpunkt-System In manchen Fällen ist es einfacher, Stoßprozesse nicht wie bisher im Laborsystem, sondern im Schwerpunktsystem zu behandeln. Wir wollen uns daher dieser Betrachtungsweise für den Fall des elastischen Stoßes zweier Körper zuwenden. Es gelten weiterhin der Impuls- und Energieerhaltungssatz. Wie weiter oben dargelegt, ist der Gesamtimpuls im Schwerpunktsystem immer gleich null. Es gilt also vor dem Stoß (Abb. 4.5)
G
S
r 1
r r
1
0
G o S1
G S 2
(4.29a)
und nach dem Stoß
r 2
G
G
G
S ' 0 o S '1 S '2 .
2
(4.29b)
Der Energieerhaltungssatz lautet
S 12
Abb. 4.5: Beim elastischen Stoß im Schwerpunktsystem ändern sich die Beiträge der Einzelimpulse nicht, sondern nur ihre Richtungen
2m1
S 22
S 1c2
2m2
2m1
S 2c2 2m2
.
(4.30)
Hierin können wir z.B. den Impuls des Teilchens 2 durch den des Teilchens 1 ausdrücken. Dabei kürzen sich die Massen heraus und es bleibt
S 12 S 1c2 .
(4.31a)
Analog erhalten wir
S 22 S 2c2 .
(4.31b)
Mit (4.29) folgt also für die Beträge der Impulse
S 1 S 2 S 1c S 2c .
(4.31c)
Die Winkel zwischen den Impulsvektoren hängen von den Anfangsbedingungen ab. x
m1 ,v1
m2 , v2 0
Abb. 4.6: Zentraler Stoß zweier Teilchen im Schwerpunktsystem
0
Als Beispiel betrachten wir den zentralen Stoß zweier Teilchen der Massen m1 und m2 (Abb. 4.6). Der Stoß möge längs der x-Achse erfolgen; Teilchen 2 soll vor dem Stoß ruhen. Die Koordinaten der Teilchen im Laborsystem seien x1 bzw. x2 = 0. Die Koordinaten der Teilchen im S-System sind dann gemäß (4.12)
4 Systeme von Massenpunkten und Impulserhaltungssatz
m1 x1 0 m1 m2
m2 x1 ; m1 m2
x1S
x1
x2 S
m1 x1 . 0 m1 m2
59
(4.32)
Aus diesen Gleichungen erhalten wir durch Differentiation die Geschwindigkeiten im SSystem zu
m2 v1 , m1 m2
v1S
v2S
m1 v1 m1 m2
(4.33)
Die Geschwindigkeiten nach dem Stoß folgen aus (4.29) durch Umdrehen der Vorzeichen. Die Rücktransformation in das Laborsystem ergibt sich durch (vektorielle) Addition der Schwerpunktgeschwindigkeit zu
v1c
m2 m1 v1 v1 m1 m2 m1 m2
m1 m2 v1 m1 m2
vc2
m1 m1 v1 v1 m1 m2 m1 m2
2m1 v1 m1 m2
.
(4.34)
4.4.3 Raketenantrieb als Folge des Impulserhaltungssatzes Bei dieser Anwendung handelt es sich um ein Beispiel eines Systems, bei dem sich während des Stoßprozesses die Massen der Stoßpartner ändern: Wir betrachten eine Rakete, die sich so weit von allen Himmelskörpern entfernt befinden soll, dass Gravitations- und Reibungskräfte vernachlässigt werden können (Abb. 4.7). Ihre Masse m nimmt in der Zeit dt durch Verbrennung von Treibstoff um dm ab und wird durch den Rückstoß um den Betrag dv beschleunigt. Die (als konstant angenommene) Geschwindigkeit der ausströmenden Treibstoffgase sei mit vTr bezeichnet. Wir haben ein abgeschlossenes System vor uns, es existieren keine äußeren Kräfte, die Impulsänderung ist null.
dp (m dm) dv (dm) vTr
0
(4.35)
Die von zweiter Ordnung kleine Größe ( dm dv ) kann vernachlässigt werden. Es folgt
m
dv dt
vTr
dm . dt
(4.36)
60
4 Systeme von Massenpunkten und Impulserhaltungssatz Diese Beziehung heißt Raketen-Gleichung oder Ziolkowski-Gleichung (nach K. E. Ziolkowski, 18571935). Wir fragen nach der Geschwindigkeit der Rakete. Division durch m ergibt die Beschleunigung
r dv
a
m + dm
r v Tr
-dm
vTr dm m dt
(4.37)
Auf der rechten Seite stehen zwei negative Größen, so dass die Beschleunigung einen (zu fordernden) positiven Wert besitzt. Die Geschwindigkeit der Rakete wird damit
0
v
Abb. 4.7: Rakete der Masse (m + dm) nach dem Start
³ adt
vTr ³
1 dm dt vTr ln m C . m dt
(4.38)
Die Integrationskonstante folgt aus der Anfangsbedingung m = m0 für v = 0
0 vTr ln m0 C
(4.39)
C vTr ln m0 In (4.38) eingesetzt, ergibt sich
v vTr ln
m0 ; m
m0
mTr mNutzl .
(4.40)
Die Endgeschwindigkeit ist erreicht, wenn der gesamte Treibstoff verbrannt ist:
m o mNutzl ; v max vTr ln
mTr mNutzl . mNutzl
(4.41)
Typische Geschwindigkeiten der Treibstoffgase liegen bei einigen km/s. Beispiel:
v max 5 vTr const .
o
mTr 150 m Nutzl
(4.42)
4 Systeme von Massenpunkten und Impulserhaltungssatz
61
Zusammenfassung x An einem System von Massenpunkten können sowohl Kräfte von außen angreifen als auch solche zwischen den Massenpunkten wirken. Erstere bezeichnen wir kurz als äußere Kräfte, letztere als innere Kräfte. Sind die äußeren Kräfte gleich null, so bleibt der Gesamtimpuls des Systems erhalten. G x Der Schwerpunkt oder Massenmittelpunkt R (t ) ist das mit den einzelnen Massen mi gewichtete Mittel der Ortskoordinaten. Für zwei Massenpunkte gilt
G R (t )
1 G G m1r1 (t ) m2 r2 (t ) m1 m2
Bei Anwesenheit äußerer Kräfte bewegt sich der Schwerpunkt eines Systems von Massenpunkten so, als ob die Gesamtmasse in ihm vereinigt wäre und alle äußeren Kräfte direkt in ihm angriffen. x Der Impulserhaltungssatz spielt eine wichtige Rolle bei Stoßprozessen. Wir unterscheiden zwischen elastischen und inelastischen Stößen. Elastische Stöße liegen vor, wenn die kinetische Energie der Stoßpartner vor dem Stoß gleich der nach dem Stoß ist. Die Endgeschwindigkeiten v i zweier Körper der Masse mi ergeben sich in diesem Fall zu
v 1
m m2 2m2 v2 1 v1 m1 m2 m1 m2
v 2
2m1 m m2 v1 1 v2 . m1 m 2 m1 m2
x Beim vollkommen inelastischen Stoß haften die Körper aneinander; ein Teil ihrer kinetischen Energie wird in nicht-mechanische Energie umgewandelt. Die Geschwindigkeiten werden
v 1 v 2
m1 v1 m2 v 2 . m1 m2
x Eine Anwendung des Impulserhaltungssatzes ist der Raketenantrieb. Aus der Raketengleichung folgt für die Beschleunigung einer Rakete der anfänglichen Masse (m + dm)
a
vTr dm ; m dt
vTr ist die Geschwindigkeit der ausgestoßenen Treibstoffgase.
62
4 Systeme von Massenpunkten und Impulserhaltungssatz
Übungsaufgaben 1. Ein Ball trifft mit der Geschwindigkeit v0 = 5m/s auf eine schiefe Ebene; deren Kippwinkel D = 30° beträgt. a) Skizzieren Sie den weiteren Bewegungsverlauf; b) Wo trifft der Ball die schiefe Ebene zum zweiten Mal? 2. Ein Tennisspieler schlägt einen ihn mit einer Geschwindigkeit von 100 km/h erreichenden Ball (m = 57 g) mit einer Geschwindigkeit von 120 km/h in die gleiche Richtung zurück. Wie groß ist die Kraft auf den Tennisschläger während der 4 ms dauernden Berührung? 3. Bei der Uranspaltung entstehen schnelle Neutronen, die zur Auslösung weiterer Spaltprozesse abgebremst werden müssen. Das geschieht hauptsächlich durch elastische Stöße in einem Moderator. a) Welches Material ist dazu am geeignetsten? Welchen Bruchteil seiner kinetischen Energie kann ein Neutron dabei maximal an den Moderatorkern mit dem Atomgewicht A abgeben? Welches Material ist besonders geeignet? b) Wie groß ist dieser Bruchteil bei Verwendung von Graphit als Moderator und wie viele Stöße sind mindestens nötig, um die Energie des Neutrons auf das 10-6- fache zu reduzieren? 4. Berechnen Sie den Schwerpunkt einer homogenen, massiven Viertelkreisscheibe mit dem Radius R. 5. Ein ruhender 236Urankern zerfällt in zwei Bruchstücke mit den Massen 140mu und 90 mu. Die Differenz der kinetischen Energien nach und vor der Spaltung, Q, beträgt 190 MeV. Bestimmen Sie die Energie und die Geschwindigkeit der beiden Bruchstücke. 6. Ein zunächst in Ruhe befindlicher Kern zerfällt radioaktiv unter Abgabe eines Elektrons mit dem Impuls von 9,22 10-21 mkgs-1 sowie eines Neutrons mit dem Impuls von 5,33 10-21 mkgs-1, das im rechten Winkel zum Elektron abgegeben wird. a) In welcher Richtung stößt der Rest-Kern zurück? b) Wie groß ist sein Impuls? c) Wie groß sind die Geschwindigkeiten und die kinetische Energie des zurückgebliebenen Kerns, wenn dessen Masse 3,90 10-25 beträgt?
G 7. Im Laborsystem stoßen zwei Teilchen mit den Massen m1,2 und den Geschwindigkeiten v1,2 inelastisch zusammen (Einfangreaktion). Das neue Teilchen bewegt sich danach mit der G Schwerpunktsgeschwindigkeit vS weiter. a) Zeigen Sie, dass für die Differenz Q der kinetischen Energien vor und nach dem Stoß im G G G 2 gilt, wobei μ die reduzierte Masse und v12 = v1 × v 2 sind. Wie groß Laborsystem Q - 0,5 P v12 ist die kinetische Energie im Schwerpunktsystem?
4 Systeme von Massenpunkten und Impulserhaltungssatz
63
b) Betrachten Sie jetzt den Fall, dass zwei Autos mit den Massen m1 =1000 kg und G m2 =1500 kg jeweils mit der Geschwindigkeit v frontal zusammenprallen. Berechnen Sie die kinetischen Energien vor und nach dem Stoß im Laborsystem und vergleichen Sie die Differenz mit der kinetischen Energie im Schwerpunktsystem für v = 15 bzw. 30 km/h. Welches Ergebnis erhalten Sie für den Fall m2 = m1?
5
Der Drehimpulserhaltungssatz
5.1 Drehimpuls eines Massenpunktes und Drehmoment Bisher haben wir Translationsbewegungen eines oder mehrerer Massenpunkte untersucht. Jetzt wollen wir uns Drehbewegungen zuwenden. Zunächst beschränken wir uns auf einen einzelnen G Massenpunkt. Ein solcher befinde sich im Abstand r vom Nullpunkt (Abb. 5.1). Der Massenpunkt beschreibe um letzteren eine kreisförmige Bahn mit der Winkelgeschwindigkeit Z . Seine Bahngeschwindigkeit ist
G G dr v dt
r l
(5.1) r v
und sein Impuls
G G p m v; v c.
m
(5.2)
Die Bahngeschwindigkeit hängt bei konstanter Winkelgeschwindigkeit vom Abstand zum Drehzentrum ab. Es ist daher zweckmäßig, G eine neue Größe einzuführen, die sowohl r G wie p enthält. Letzteres leistet der Drehimpuls des Massenpunktes. Er ist definiert als G G das Vektorprodukt aus r und p :
G G G G G l r u p mr u p G G G l mrv sin )(r , v)
r r 0
Abb. 5.1: Ein Massenpunkt der Masse m auf einer krummlinigen Bahn besitzt bezüglich des Drehzentrums O den Drehimpuls G G G l = ruv
(5.3)
G G G Der Vektor l steht senkrecht auf der durch r und v aufgespannten Ebene. Er hat seinen G G G größten Wert, wenn p und r aufeinander senkrecht stehen; er wird null, wenn p parallel zu G r a 2 b 2 ist. Seine Richtung ist durch die Rechte-Hand-Regel festgelegt: Zeigen die Finger G der rechten Hand in Drehrichtung, weist der Daumen in die Richtung von l . Wir lassen nun G eine Kraft F auf den Massenpunkt wirken. Dadurch ändert sich der Drehimpuls. Nach (5.3) gilt
G dl dt
d G G (r u p) dt G G dr G G dp ( u p) (r u ) . dt dt
(5.4)
66
5 Der Drehimpulserhaltungssatz
G G Der erste Term ist null, da (dr dt ) & p ist. Also gilt
G dl dt
G G dp ru dt
G oder mit dem Grundgesetz der Mechanik, F
G dl dt
G G r uF
(5.5a) G dp dt ,
(5.5b)
G G Da die Drehimpulsänderung ebenfalls von zwei Vektorgrößen abhängt, nämlich von r und F , führen wir für die rechte Seite wiederum eine neue Größe ein, die Drehmoment genannt wird.
G dl dt
G D ,
(5.6)
G G G D: r u F
(5.7)
wobei
Die Beziehung (5.6) heißt Drehimpulssatz:
Die zeitliche Änderung des Drehimpulses eines Massenpunktes ist gleich dem wirkenden Drehmoment. Der Drehimpulssatz stellt eine zweckmäßige Form der Newtonschen Bewegungsgleichung (des Grundgesetzes der Mechanik) für Drehbewegungen dar. Sie erleichtert häufig die G Berechnung der Bahnkurve des Massenpunktes. Die Dimensionen und Einheiten von D und G l sind
> D @ > r @> F @ 1Nm = 1 J >l @ > D @>t @ 1 Js
(5.8)
Anwendungsbeispiel: Auf einer gelagerten Welle ist konzentrisch eine Trommel befestigt (Abb. 5.2). Das eine Ende eines auf ihr aufgewickelten Fadens ist über eine Umlenkrolle mit einem Körper verbunden. G G Dieser übt eine Gewichtskraft F G aus. Oberhalb des oberen Lagers ist eine dünne Stange
67
5 Der Drehimpulserhaltungssatz
G durch die Welle gesteckt. Im Abstand r befindet sich eine Kugel der Masse m, die durch die G G Kraft G die Geschwindigkeit v erhält. Gesucht wird der Drehwinkel M in Abhängigkeit der Zeit. Dabei soll die Masse der Trommel vernachlässigt werden. Ferner möge deren Radius r´ sehr klein sein gegenüber r.
G dl dt
G D
G mit l
r r
G G mrv mr Z , ( r const ) (v A r ) G dl mr 2 d Z ; D const , da r c, F const 2
r v r r
(5.9)
m
Einsetzen von dl und D führt zu r G
dZ D dt dZ D D; dt mr 2 (D Winkelbeschleunigung ) mr 2
(5.10)
³ dZ D ³ dt C1 Z
dM 1 D t C1 ; M D t 2 C1t C2 . dt 2
Abb. 5.2: Anwendung des Drehimpulssatzes auf ein im Abstand r vom Zentrum rotierendes Teilchen der Masse m
Die Konstanten können aus den Anfangsbedingungen bestimmt werden. Zurück zur Bewegungsgleichung. Von besonderem Interesse ist der Fall, dass das Drehmoment gleich null ist, denn daraus folgt, dass der Drehimpuls konstant ist.
G G D 0 o l const .
Drehimpulserhaltungssatz
(5.11)
Wenn kein Drehmoment auf den Massenpunkt wirkt, ist der Drehimpuls konstant. G Das Drehmoment ist null für Kräfte, deren Richtung mit der von r übereinstimmt. Solche Zentralkräfte haben wir in Gestalt der Gravitationskraft oder der elektrostatischen Coulombkraft bereits kennen gelernt.
68
5 Der Drehimpulserhaltungssatz
5.2
Drehimpuls eines Systems von Massenpunkten
Wir wollen nun den Erhaltungssatz für den Drehimpuls auf ein System von Massenpunkten erweitern. Wir können etwa die Bewegung der Planeten oder Erdsatelliten denken. Abb. 5.3 G G G zeigt drei Massenpunkte mit den Ortsvektoren r1 , r2 , r3 relativ zu einem beliebigen Bezugspunkt. Auf jeden Körper wirken sowohl innere als auch äußere Kräfte. Die Newtonsche r F1a r F13i
r F2a
r F21i
r F12i r r1
r r2
Abb. 5.3: Zur Erweiterung des Drehimpulserhaltungssatzes auf ein System von N Massenpunkten mit den Abständen ri G vom Drehzentrum. Äußere Kräfte sind mit Fjka bezeichnet,
r r3 r F31i r F3a
r F23i
r F32i
G
innere Kräfte mit Fjik
Bewegungsgleichung für den ersten Massenpunkt lautet
G G G G d G (m1v1 ) F1 F13 F12 F1a dt
(5.12)
G Multiplizieren wir beide Seiten der Gleichung vektoriell mit r1 , so erhalten wir
G G G G G G (r1 u F13 ) (r`1 u F12 ) (r1 u F1a ) d G G m1 (r1 u v1 ) dt
(5.13a)
Analog folgt für die beiden anderen Massenpunkte
G G G G G G (r2 u F23 ) (r2 u F21 ) ( r2 u F2a )
d G G m2 (r2 u v 2 ) dt d G G G G G Ga G G (r3 u F32 ) ( r3 u F31 ) ( r3 u F3 ) m3 (r3 u v3 ) dt
(5.13b,c)
69
5 Der Drehimpulserhaltungssatz G G Addition der drei Gleichungen ergibt unter Berücksichtigung, dass F12 F21 usw.
G
F
12
G G G G G G G G u (r1 r2 ) F23 u ( r2 r3 ) F31 u (r3 r1 )
3 G G ¦ (ri u Fi a )
(5.14)
d§ 3 G G · ¦ mi (ri u vi ) ¸¹ dt ¨© i 1
i 1
G G G Die Kraft F12 wirkt & der Verbindungslinie (r1 r2 ) , also ist das erste Vektorprodukt gleich
null. Aus demselben Grund verschwinden auch die beiden nächsten Terme, so dass 3
G
G
i
i
d§ 3 G G · mi (ri u vi ) ¸ . ¦ ¨ dt © i 1 ¹
¦ (r u F ) i 1
(5.15)
Ein Vergleich der linken Seite mit (5.7) zeigt, dass diese die Summe der Drehmomente bezüglich des Ursprungs darstellt. Das gesamte Drehmoment, das die äußere Kraft auf das System ausübt, ist
G D
3
G
Ga
i
i
¦ (r u F
).
(5.16)
i 1
G Analog stellt die rechte Seite die zeitliche Änderung des Gesamtdrehimpulses L dar.
G L
3
G G
¦ m (r u v ) i
i
i
.
(5.17)
i 1
Also können wir (5.14) schreiben als
G G dL . D dt
(5.18)
Dies ist der Drehimpulssatz für ein System von drei Massenpunkten. Wir können ihn auf eine beliebige Anzahl erweitern, denn die Summation in (6.16) kann auf beliebig große i ausgedehnt werden. (5.18) ist die Grundgleichung für Rotationsbewegungen eines Systems von Massenpunkten. Ist die linke Seite gleich null, so folgt der Drehimpulserhaltungssatz: Ist das Drehmoment null, so ist der Drehimpuls des Systems konstant. G D
G 0oL
const.
(5.19)
70
5.3
5 Der Drehimpulserhaltungssatz
Eine einfache Anwendung – Statisches Gleichgewicht
Wir betrachten einen Waagebalken, dessen Masse wir vernachlässigen wollen (Abb. 5.4). Er G G sei in einem beliebigen Punkt unterstützt. Im Abstand r1 bzw. r2 vom Unterstützungspunkt G G G ( r1 0 ) wirkt die Kraft F1 bzw. F2 . Es herrscht Gleichgewicht, wenn der Waager r r2 r1 balken ruht ( Z 0 ); das ist der Fall, wenn 0 die Summe der Drehmomente verschwindet.
r F2
r F1
2
G
¦D
i
0;
(5.20)
i 1
denn für Abb. 5.4: Statisches Gleichgewicht herrscht, wenn die beiden Drehmomente bezüglich ihres Drehzentrums entgegengesetzt gleich sind
G G D1 D2 0 G G G G (r1 u F1 ) (r2 u F2 ) 0.
(5.21)
Die Kräfte mögen senkrecht zu den Abstandsvektoren gerichtet sein. Damit folgt als Bedingung für statisches Gleichgewicht
r1 F1 r2 F2 0 . F2
5.4
r1 F1 r2
(5.22)
Drehbewegungen starrer Körper
Bisher haben wir den Drehimpuls für ein System von Massenpunkten eingeführt, die sich relativ zueinander bewegen konnten. Wir wollen Letztere jetzt ersetzen durch einen ausgedehnten, beliebig geformten, starren Körper. Wir beschränken uns auf den einfachen Fall einer Kreisbewegung. Ausgangspunkt unserer Überlegungen ist wieder ein einzelner Massenpunkt der Masse mi , der sich ähnlich Abb. 5.2 an einer masselosen Stange im Abstand ri um eine starre Drehachse G bewegen möge (Abb. 5.5). Der Drehimpuls des Massenpunktes bez. des Abstandsvektors ri vom Ursprung ist
G G G G li ri u mi vi o li
G G mi ri vi ; da ri A vi
(5.23)
71
5 Der Drehimpulserhaltungssatz Wir wollen die z-Komponente des Drehimpulses berechnen; gemäß Abb. 5.5 ergibt sie sich zu
eˆ z ,
§S · li z li cos ¨ -i ¸ mi ri vi sin -i ©2 ¹
(5.24)
r r0i
Wir führen den senkrechten Abstand rA i des Massenpunktes von der Drehachse ein:
rA i
ri sin -i ;
o
Zi rAi ,
vi
(5.25)
r li
wobei Z die Winkelgeschwindigkeit ist. Damit er folgt
li z
r
(mi rA i / sin -i )Zi rA i sin -i
i
r ri
r vi
(5.26)
li z mi rA2i Zi
Abb. 5.5: Zur Definition des Drehimpulses eines starren Körpers bezüglich seiner Drehachse z
(5.27)
Die Winkelgeschwindigkeit aller Massenpunkte ist gleich, den Index i können wir daher weglassen. Wir beschränken uns zunächst wieder auf die Berechnung der z-Komponente des Drehimpulses. Der gesamte Drehimpuls setzt sich wie in Kap. 5.2 aus der Summe der Einzeldrehimpulse zusammen, f
Lz
f
¦l
iz
i 1
G G
¦ (m r u v ) i i
i 1 f
i
(5.28a)
z
G
G G
i i
ì
f
G
¦ > m r u (Z u r )@ ¦ > m Z r u (eˆ i
z
i 1
i
z
G u ri ) @z
(5.28b)
i 1
G G G Die Projektion von L auf die z-Achse ist durch das Skalarprodukt Lz eˆz L L cos(eˆz L ) gegeben. Wir erhalten also die z-Komponente des Drehimpulses, indem wir die rechte Seite von (5.28b) skalar mit eˆz multiplizieren: f
Lz
G
G z u ri )
¦ m Zeˆ (r u (eˆ i
z
i
i 1
f
¦ m Z (eˆ i
z
G G u ri )(eˆz u ri )
(5.28c)
i 1
Das rechte Gleichheitszeichen gilt wegen Regel (A1.24c) der Vektorrechnung. Die Vektoren G eˆz und ri schließen den Winkel - ein, folglich ist
G (eˆz u ri )
ri sin -i .
(5.29)
72
5 Der Drehimpulserhaltungssatz
Also ergibt sich für die z-Komponente des Drehimpulses f
¦ miZ (ri sin -i )2
Lz
i 1
f
¦m r
2 i Ai
Z
(5.30)
i 1
f
¦m r
2 i Ai
Die Summe
wollen wir als Trägheitsmoment I des Körpers bez. der Drehachse
i 1
bezeichnen.
5.5
Trägheitsmoment eines starren Körpers
Zur Ermittlung des Drehimpulses eines starren Körpers müssen wir sein Trägheitsmoment bez. der Drehachse a berechnen. f
Ia
¦m r
2 i Ai
(5.31)
i 1
In unserem Fall ist a = z. Die Summe in (5.31) können wir in ein Integral umformen: m
Ia
V
2 2 ³ rA dm U ³ rA dV 0
(5.32)
0
Hierin ist U die als konstant angenommene Dichte des Körpers. Wir betrachten zwei Beispiele:
a)
Beispiel 1: Trägheitsmoment einer Scheibe homogener Dichte U (Abb. 5.6a/b).
b)
z
R
d
dr
R
r
Iz
³r
2
2SU d rdr
0
R
2SU d ³ r 3 dr 2SU d 0
Abb. 5.6a,b: Zur Berechnung des Trägheitsmomentes einer Scheibe bezüglich der z-Achse a
UV
R2 2
1 mR 2 2
R4 4
(5.33)
73
5 Der Drehimpulserhaltungssatz
Beispiel 2: Trägheitsmoment einer Vollkugel homogener Dichte bez. einer Drehachse durch den Mittelpunkt (Abb. 5.7). Dazu denken wir uns die Kugel aus einzelnen Scheiben zusammengesetzt. Für den Radius einer Scheibe im Abstand x vom Mittelpunkt gilt
r
R2 x2
(5.34)
Das Volumen der Scheibe ergibt sich aus dem Produkt aus Fläche x Abstand vom Mittelpunkt, also dV S r 2 dx . Durch Multiplikation mit U erhalten wir dm .
dm U dV US r 2 dx US ( R 2 x 2 ) dx
(5.35)
Das Trägheitsmoment der Scheibe ist durch (5.23) gegeben. Durch Einsetzen von (5.35) für dm folgt dI
1 2 1 2 r dm ( R x 2 ) US ( R 2 x 2 ) dx 2 2 (5.36) 1 2 US ( R x 2 ) 2 dx. 2
Integration über x = 0 bis x = R ergibt die Hälfte des Trägheitsmomentes der Kugel. Also müssen wir das Ergebnis mit 2 multiplizieren. Zur Integration wird der Klammerausdruck ausmultipliziert und die einzelnen Terme separat berechnet. I
S m 8R 5 V
15
2 mR 2 , 5
(5.37)
R 2 -x 2 dx x
R S
Abb. 5.7: Zur Berechnung des Trägheitsmomentes einer Vollkugel bezüglich einer Achse durch den Mittelpunkt
wobei wir U m / V und V 4S R 3 / 3 benutzt haben. In Tabelle 5.1 sind die Trägheitsmomente einiger einfacher Körper zusammengestellt. – Zurück zum Drehimpuls. Wir haben oben die zKomponente Lz für den starren Körper berechnet, wobei z die Drehachse ist. Greifen von außen Kräfte am Körper an, so gilt analog (5.18) dLz dt
Dza
(5.38)
Liegt ein abgeschlossenes System vor, so verschwinden äußere Kräfte und es folgt Lz
const .
Die Komponente des Drehimpulses bez. der Drehachse ist konstant.
(5.39)
74
5 Der Drehimpulserhaltungssatz
Bei einem starren, bez. der Drehachse symmetrischen Körper ist aus Symmetriegründen der gesamte Drehimpuls bez. der Drehachse gleich der z-Komponente des Drehimpulses. Im allgemeinen Fall fällt jedoch die Richtung des Drehimpulses nicht mit der Richtung der Winkelgeschwindigkeit zusammen. Beispiel:
r
r L r r1
m2 r r2
m1
Abb. 5.8: Drehimpuls einer an einer rotierenden Welle schräg befestigten Hantel
5.6
An einer durch zwei Lager geführten Welle ist unter dem Winkel D eine Hantel angebracht (Abb. 5.8), deren Verbindungsstange masselos angenommen werde. Die Hantel rotiere mit der Winkelgeschwindigkeit Z um die z-Achse. Der Drehimpuls des Systems ist
G L
G G G G m`1 (r1 u v1 ) m2 (r2 u v 2 ) .
(5.40)
Die Geschwindigkeiten stehen senkrecht auf der Hantelachse. Bei ihrer Drehung ändert der Drehimpuls dauernd seine Richtung, fällt also nicht mit der Richtung von Z zusammen. Dazu sind Kräfte erforderlich, die von den Lagern aufgebracht werden müssen und diese daher entsprechend beanspruchen. In Kap. 5.8.6 werden wir uns näher mit diesem allgemeineren Fall befassen.
Steinerscher Satz
Im letzten Kapitel haben wir Trägheitsmomente behandelt, bei denen die Drehachse durch den Schwerpunkt verlief. Liegt die Drehachse außerhalb, so scheint die Berechnung des Trägheitsmomentes zunächst schwieriger. In solchen Fällen hilft uns der Steinersche Satz, der das Trägheitsmoment eines Körpers bez. seiner Drehachse durch den Schwerpunkt, Is, mit dem Trägheitsmoment I für eine parallele Achse durch einen beliebigen Punkt A in Beziehung setzt (Abb. 5.9):
I
ma 2 I s
(5.41)
Hierin ist m die Masse des Körpers, und a der Abstand der Drehachse vom Schwerpunkt (J. Steiner, 1796-1863). Der Satz lässt sich folgendermaßen beweisen: Wir wählen ein Koordinatensystem so, dass sich sein Ursprung im Schwerpunkt befindet und die yS-Achse in der Ebene liegt, die durch die beiden Drehachsen gebildet wird. Wie aus Abb. 5.10 ersichtlich, gilt für das Trägheitsmoment des Körpers bezüglich der Achse durch A f
IS
¦m r
2 i Ai
i 1
(5.42)
75
5 Der Drehimpulserhaltungssatz
m1
1
A
S
a 1
x1
A
a Abb. 5.9: Zur Illustration des Steinerschen Satzes I = ma 2 +IS
S
Abb. 5.10: Zur Ableitung des Steinerschen Satzes
Ist Ui der Abstand eines Massenpunktes von der Achse durch den Schwerpunkt und J i der Winkel zwischen a und Ui , so können wir schreiben f
IS
¦ m (a i
i 1
2
Ui2 2a Ui cosJ i ) ma 2 I S 2a ¦ mi xi
(5.43)
i
Die Summe auf der rechten Seite ist gleich null, da xi vom Schwerpunkt, d.h. vom Koordinatenursprung aus gezählt wird.
xS :
¦m x /¦m i i
i
i
0.
i
Damit ist der Steinersche Satz bewiesen.
(5.44)
76
5 Der Drehimpulserhaltungssatz
In Tab. 5.1 sind die Trägheitsmomente einiger symmetrischer Körper zusammengestellt.
Körper
Trägheitsmoment I
Reifen oder Ring, d vS, so wird die Wellenlänge in Abhängigkeit von D gleich null, wenn 0
vS vQ
cos D .
(11.105)
11 Mechanische Schwingungen und Wellen
199
d.h., dass sich Wellen nur innerhalb eines Machschen Kegels (E. Mach, 1838-1916) mit dem Öffnungswinkel E 90q D ausbreiten können, für den gilt
sin E
vS . vQ
(11.106)
Alle Kugelwellen sind auf diesem Kegelmantel in Phase (Abb. 11.20d). Das Verhältnis vQ/vS wird als Machzahl bezeichnet. Machsche Kegel lassen sich als Bugwellenfronten von Schiffen beobachten, wenn die Geschwindigkeit des Schiffes größer wird als die Geschwindigkeit der Oberflächenwellen des Wassers. Unangenehm machen sich die Kopfwellen (auch Stoßwellen genannt) bemerkbar, die von einem mit Überschallgeschwindigkeit fliegenden Flugzeug ausgehen. Es werden zwei Knallwellen wahrgenommen, die von der Bug- und der Heckwelle herrühren. Als zweiten Fall betrachten wir eine ruhende Quelle, die eine Welle der Frequenz Q 0 aussendet (vgl. Abb. 11.20a). Wir fragen nach der Frequenz, die ein sich in Richtung der Quelle bewegender Beobachter wahrnimmt. Da er sich in einer Schwingungsperiode T um die Strecke 'x v B T bewegt, misst er eine zusätzliche Zahl von Schwingungen. Die von ihm gemessene Frequenz liegt also um 'Q 'N / T höher. Sie ergibt sich zu
Ȟ
Ȟ 0 'N Ȟ 0
v
§ v · v0 ¨1 B ¸ . © vS ¹
§ 'x T Ȟ 0 ¨1 O0 T ©
· ¸, ¹
(11.107a)
(11.107b)
Entfernt er sich von der Schallquelle, so erniedrigt sich die Frequenz; es folgt
v
§ v · v0 ¨1 B ¸ . © vS ¹
(11.108)
Bewegen sich sowohl Sender und Empfänger aufeinander zu bzw. voneinander weg, so ergibt sich durch Ersetzung von Q 0 in (11.102) bzw. (11.103) durch (11.107b) bzw. (11.108)
v
v0
1 r vB / vS . 1 B vQ / v S
(11.109)
200
11 Mechanische Schwingungen und Wellen
11.10.2 Dopplereffekt bei elektromagnetischen Wellen Eigenschaften elektromagnetischer Wellen werden in den Kap. 18 und 19 ausführlich besprochen. Um einen direkten Vergleich mit dem Dopplereffekt mechanischer Wellen zu ermöglichen, wollen wir aber jetzt schon den entsprechenden Effekt bei elektromagnetischen Wellen besprechen. Im Gegensatz zu dem oben behandelten Dopplereffekt tritt bei elektromagnetischen Wellen auch ein transversaler Dopplereffekt auf. Deswegen wählen wir eine allgemeinere Ausgangsposition. Quelle bzw. Beobachter sollen sich in x-Richtung so bewegen, dass zwischen den verlängerten x-Achsen ein bestimmter Abstand voneinander besteht (Abb. 11.22). Ein Beobachter B in einem Inertialsystem S, in dem die Quelle verankert ist, beschreibe G z eine ebene Welle mit Wellenvektor k durch S z´ B
Q
vx
x
B´
y
GG
G
\ ( r , t ) \ 0 e i ( k r Z t ) .
S´
x´ y´
Abb. 11.22: Zur Geometrie beim Dopplereffekt elektromagnetischer Wellen
(11.110a)
Ein anderer Beobachter B´ in einem Bezugssystem S´, das sich mit konstanter Geschwindigkeit v in x-Richtung des Ersteren bewegt, beschreibt die gleiche Welle durch eine analoge Beziehung GG
G
\ (r c, t c) \ 0c ei ( k c r cZ ct c)
(11.110b)
Die beiden Beobachter mögen nun einen bestimmten Punkt der Welle ins Auge fassen, etwa das Maximum eines bestimmten Wellenberges. Ein solches beschreibt B dadurch, dass er den Klammerausdruck in (11.103a) gleich einem ganzzahligen Vielfachen von 2S setzt. Der Beobachter B´ argumentiert analog. Auf Grund des Relativitätsprinzips müssen die beiden Exponenten gleich sein:
k x x k y y k z z Zt
k xc xc k yc yc k zc z c Z ct c .
(11.111)
Wellenvektor-Komponenten und Frequenz auf der rechten Seite sind mittels der Lorentztransformation mit denen auf der linken Seite verknüpft durch
k xc
k zc
kx Z v / c2 1 (v / c) 2
Z k Z´ z
Z kx v / c Z´ 1 (v / c) 2
1 (v / c) 2 kz ; Zc 1 (v / c)k x
kx v / c ; k yc 1 (v / c)k x
Z kx v 1 (v / c) 2
Z k Z´ y
kx v k c . Z 1 (v / c) 2
1 (v / c) 2 ky ; 1 (v / c)k x
1
(11.112a-d)
11 Mechanische Schwingungen und Wellen
201
Der Beobachter in S´ empfängt erwartungsgemäß ebenfalls eine ebene Welle, die aber gegenüber der in S beobachteten eine andere Ausbreitungsrichtung und andere Frequenz besitzt. Es ist zu beachten, dass (11.105/106) nicht explizit die Geschwindigkeit der Quelle bzw. des Beobachters enthalten, sondern nur die Relativgeschwindigkeit von Sender und Empfänger. Darin drückt sich die Tatsache aus, dass elektromagnetische Wellen zur Ausbreitung kein Medium benötigen. Wir betrachten nun die beiden Grenzfälle und wenden uns als erstes dem longitudinalen Dopplereffekt zu, d.h. die Quelle in S und der Beobachter in S´ sollen sich in x-Richtung aufeinander zu- bzw. voneinander wegbewegen. In diesem Fall erreicht den Beobachter eine Welle der Frequenz
Zc Z
1 v / c 1 (v / c)
Z
2
1 v / c . 1 v / c
(11.113)
Im Fall des transversalen Dopplereffekts, bei dem sich S und S´ nebeneinander befinden, registriert der Beobachter eine Welle mit der Frequenz
Zc Z
1 1 (v / c) 2
.
(11.114)
Zusammenfassung x Unter einer (mechanischen) Schwingung verstehen wir die zeitlich periodische Ausbreitung einer physikalischen Störung. Die Bewegungsgleichung einer eindimensionalen, gedämpften harmonischen Schwingung eines Körpers der Masse m lautet
d 2x dx 2G Z02 x 2 dt dt
Fa . m
Ist die äußere Kraft Fa gleich null, so geht die Beziehung in die Bewegungsgleichung für die freie gedämpfte Schwingung über. Verschwindet auch der Dämpfungsterm G R / 2m , so liefert die Lösung der Bewegungsgleichung eine freie ungedämpfte Schwingung mit der Eigenfrequenz Z0 D/m . x Sind mehrere gleichartige schwingungsfähige Systeme miteinander gekoppelt, so führt das zu gekoppelten Schwingungen. Durch Entkopplung der Bewegungsgleichungen lassen sich die Normalschwingungen des Systems berechnen. Zwei schwach gekoppelte Oszillatoren können Schwebungen ausführen. Darunter verstehen wir Schwingungen, deren Amplituden mit der halben Differenz der Eigenschwingungen der Einzelsysteme periodisch variieren.
202
11 Mechanische Schwingungen und Wellen
x Unter einer harmonischen Welle verstehen wir die räumliche und zeitliche Ausbreitung einer sinusförmigen Störung. Die ihr zu Grunde liegende Bewegungsgleichung heißt Wellengleichung. Die Welle ist charakterisiert durch ihre Eigenfrequenz Z und den G Wellenvektor k . Im einfachsten Fall einer ebenen Welle gilt
w 2\ wt 2
v ph
w 2\ ; wx 2
v ph = Phasengeschwindigkeit der Welle.
Wir unterscheiden transversal und longitudinal polarisierte Wellen. x Unter einer stehenden Welle verstehen wir einen periodischen Vorgang, bei dem Zeitund Ortsabhängigkeit getrennt sind. Sie kommt durch Reflexion einer laufenden Welle zustande. x Unter dem Dopplereffekt verstehen wir die Frequenz- bzw. Wellenlängenänderung einer Welle, wenn sich der Schallgeber bzw. der Empfänger relativ zueinander bewegen.
Übungsaufgaben 1. Ein Uhrenpendel (als mathematisches Pendel angenommen) hat die Schwingungsdauer T = 2s. Die Erdbeschleunigung betrage 9,81 ms-2. a) Wie lang ist das Pendel? b) Der maximale Auslenkwinkel zur Zeit t = 0 betrage 15°. Geben Sie die Geschwindigkeit des Pendels als Funktion der Zeit an. c) Wie viele Sekunden wird die Uhr in 24 Std. nachgehen, wenn das Pendel um 1 mm verlängert wird? d) An einem anderen Standort beträgt g = 9,75 ms-2. Wie wirkt sich dies auf die Uhr aus (quantitativ)? Welche Länge muss jetzt das Pendel haben, damit die Uhr exakt geht? 2. Von der Decke eines Fahrstuhls hängt ein 1 m langes mathematisches Pendel herab. Wie hängt die Schwingungsdauer des Pendels von der Größe und Richtung der Beschleunigung des Fahrstuhls ab? Berechnen Sie die Schwingungsdauer für den Fall, dass der Fahrstuhl bei Abwärtsfahrt auf einer Strecke von 3 m von der Geschwindigkeit 5m/s auf Stillstand bei konstanter Verzögerung abgebremst wird. (Gl. 6.1) 3. Eine Person (idealisiert als M.P. der Masse M) schaukle in einer masselos angenommenen Schiffsschaukel. Der Abstand des M.P. vom Drehpunkt sei mit R bezeichnet. Die Person verhalte sich zunächst ruhig. Die Amplitude der Schwingung nehme während n Schwingungsperioden um 25% ab. a) Berechnen Sie die Dämpfungskonstante der Schwingung und das logarithmische Dekrement. b) Wie groß ist der relative Verlust an Energie nach n Schwingungsperioden?
11 Mechanische Schwingungen und Wellen
203
c) Nun soll die Person das Schaukeln aktiv unterstützen. Sie tut das, indem sie in Punkten maximaler Auslenkung in die Hocke geht (Verschiebung des M.P. um 'R nach außen) und sich beim Nulldurchgang wieder aufrichtet. Schätzen Sie ab, wie groß 'R sein muss, um einen stationären Zustand zu erreichen. 4. Berechnen Sie die Eigenschwingungen (Normalkoordinaten) der einatomigen und der zweiatomigen linearen Kette
Ein- und zweiatomige lineare Kette 5. Die Straßenbahnwagen der Linie 9 verkehren genau alle 10 min in nördlicher Richtung und ebenso in Gegenrichtung. Glauben Sie Jemandem, der Ihnen erzählt, er habe, ohne dass etwas Besonderes passiert sei, alle 5 min einen Wagen der Linie 9 in nördlicher Richtung vorbeifahren sehen? 6. Ein notorischer Linksfahrer blockiert mit Tempo 80 km/h die Überholspur der Autobahn. Ein herannahender Sportwagen (v = 180 km/h) versucht ihn durch Hupsignale (Q = 250 Hz) zum Fahrbahnwechsel zu bewegen. Welche Tonhöhe vernimmt der Linksfahrer? Nach dem Überholvorgang sendet der Überholte dem Sportwagen einen Hupton nach (Q = 250 Hz). Welche Tonhöhe hört der Sportwagenfahrer? 7.a) Am Abend erscheint die Sonne manchmal als gelb-rote (O = 670 nm) Scheibe (warum?). Wie schnell muss sich ein Beobachter auf die Sonne zu bewegen, damit er sie grün (O = 520 nm) leuchten sieht? b) Wie groß ist die Wellenlängenverschiebung 'O / O des Lichtes eines Fixsterns, wenn seine relative Fluchtgeschwindigkeit v/c = 0,8 beträgt?
12
Analytische Mechanik
Die Mechanik, wie sie im Vorhergehenden entwickelt wurde, basiert auf den Newtonschen Postulaten. Die Grundgröße ist die auf den Massenpunkt wirkende Kraft. Das 2. Newtonsche Axiom ist zugleich die Bewegungsgleichung für das zu lösende Problem. Der Energie-Begriff ist eine mittels einiger zweckmäßiger Definitionen abgeleitete Größe. Die Anwendung auf die Dynamik eines oder mehrer Massenpunkte setzt voraus, dass die wirkenden Kräfte bekannt sind. Das ist aber nicht immer der Fall. Stattdessen bestimmen oft geometrische Bedingungen, als Zwangsbedingungen bezeichnet, den Bewegungsablauf. Hinzu kommt, dass mit zunehmender Anzahl der M.P. die Bewegungsgleichungen sehr unübersichtlich werden, so dass sie nur mühsam zu behandeln sind. Es ist daher wünschenswert, eine Methode zu besitzen, die ohne Kenntnis der Kräfte auskommt. Vor allem J. L. de Lagrange (1736-1813), C. G. J. Jacobi (1804-1851) und W. R. Hamilton (1877-1954) haben solche Theorien entwickelt. An die Stelle der Newtonschen Axiome tritt das Hamiltonsche Prinzip. Aus ihm folgen als neue Bewegungsgleichungen die Lagrangeschen Gleichungen. Ein dritter Ansatz beruht auf dem sogenanten Hamiltonformalismus. In diesem Kapitel sollen diese Wege in ihren Grundzügen beschrieben und durch einige Beispiele erläutert werden.
12.1
Das Hamiltonsche Prinzip und die Lagrangesche Form der Mechanik
12.1.1 Das Hamiltonsche Prinzip Wir wollen ein System ins Auge fassen, das sich in einer vorgegebenen Zeit von einem Punkt zu einem anderen Punkt bewegen kann. Das Hamiltonsche Prinzip sagt dann aus, dass das System denjenigen Weg wählt, der das Zeitintegral der Lagrange-Funktion extremal macht. Wir ordnen einer beliebigen Bahnkurve das Funktional S zu, gegeben als t2
S
³ L( x , x , t )dt . i
i
(12.1)
t1
Die Größe wird als Wirkung bezeichnet. Die Funktion L ist die Lagrange-Funktion, die gleich erläutert wird. Die Parameter xi (t ) bzw. xi sind die Koordinaten bzw. Geschwindigkeiten des betreffenden Systems. Von allen möglichen Wegen, längs denen sich ein System in einer vorgegebenen Zeit von einem Punkt zu einem anderen bewegen kann, wählt es denjenigen, der das Zeitintegral der Lagrange-Funktion extremal macht:
206
12 Analytische Mechanik t2
G S G ³ L( xi , xi , t ) dt 0
(12.2)
t1
Bei der Variation sollen Anfangs- und Endpunkte festgehalten werden. Die Eulerschen Gleichungen (s. Mathematischer Anhang) des Problems sind
wL d wL wxi dt wxi
0.
(12.3)
Die Beziehungen werden als Euler-Lagrangesche oder einfach als Lagrange-Gleichungen bezeichnet. Es erhebt sich die Frage, was unter der Lagrange-Funktion zu verstehen und wie sie zu bestimmen ist. Wir werden sehen, dass sie als die Differenz von kinetischer und potentieller Energie definiert ist.
L( xk , xk , t )
Ekin ( xk ) V ( xk , t ) .
(12.4)
Zum Beweis gehen wir von der Newtonschen Bewegungsgleichung aus:
mxk
Fk ( xl , xl , t ) ;
k, l = 1, 2, 3.
(12.5)
Die kinetische Energie hängt nur von den Geschwindigkeitskomponenten ab. Differentiation nach der Zeit ergibt
Ekin
¦ k
mxk2 2
o
dEkin dxk
mxk
(12.6)
Benutzen wir diese Ableitung in (12.5), so folgt
d dEkin dt dxk
Fk ( xl , xl , t ) .
(12.7)
Beschränken wir uns auf geschwindigkeitsunabhängige Kräfte Fk ( xl , t ) , die sich aus einem Potential V ( xl , t ) herleiten lassen,
Fk ( xl , t )
dV ( xl , t ) , dxk
(12.8)
12 Analytische Mechanik
207
so können wir (12.7) schreiben als
d dEkin dt dxk
dV ( xl , t ) . dxk
(12.9)
Wir definieren nun eine neue Funktion L dergestalt, dass
L( xk , xk , t )
Ekin ( xk ) V ( xk , t ) .
(12.10)
Wegen der Unabhängigkeit der kinetischen Energie von xk und der Unabhängigkeit der potentiellen Energie von xk folgt
wL d wL wxk dt wxk
0.
(12.11)
Damit ist die Lagrange-Funktion erklärt und gleichzeitig die Äquivalenz der Euler-LagrangeGleichungen mit dem 2. Newtonschen Postulat gezeigt. Weiter zeigt der Vergleich von (12.11) und (12.3), dass das Hamiltonsche Prinzip äquivalent zu den Euler-Lagrange-Gleichungen ist.
12.1.2 Verallgemeinerte Koordinaten Zur Beschreibung von Lage bzw. Bewegung eines oder mehrerer Massenpunkte haben wir bisher kartesische Koordinaten benutzt. Das ist zweckmäßig, solange keine Nebenbedingungen vorliegen, welche die Unabhängigkeit der Koordinaten voneinander einschränken. Sind solche zusätzlichen Bedingungen vorhanden, werden die Rechnungen oft erheblich schwieriger. Das lässt sich vermeiden, wenn zur Beschreibung der Bewegung des Punktsystems nicht die 3n kartesiz schen Koordinaten, sondern entsprechend der Zahl r der Freiheitsgrade des Systems neue Koordinaten qk (k = 1, 2,…, r) eingeführt werden. Existieren m Nebenbedingungen, so hat das System l r = 3n - m Freiheitsgrade
(12.12)
Ein sehr einfaches Beispiel stellt ein mathematisches Pendel (Abb. 12.1) der Länge l dar. Es gilt in diesem Fall in kartesischen Koordinaten die Nebenbedingung
f ( x, z )
x2 z 2 l 2
0.
MP x
(12.13)
Ist eine der beiden Koordinaten ermittelt, so ergibt sich
Abb. 12.1: Ebenes mathematisches Pendel
208
12 Analytische Mechanik
die andere durch Einsetzen in (12.13). Das Pendel hat also einen Freiheitsgrad, (r = 1). Wir können seine Bewegung durch eine neue Koordinate beschreiben, als die sich die Auslenkung - aus der Ruhelage als zweckmäßig erweist. Die Nebenbedingung ist durch diese Wahl quasi automatisch erfüllt, denn es gelten zwischen alten und neuen Koordinaten die Relationen
x l sin - ; z
l cos -.
(12.14)
Wir wollen die Euler-Lagrangeschen Gleichungen jetzt in verallgemeinerten Koordinaten formulieren. Gemäß (12.14) schreiben wir die neuen Koordinaten als Funktion der kartesischen durch
qi
qi ( x1 ,...xn , t ) { qi ( xk , t ) .
(12.15)
Diese sollen nach den kartesischen Koordinaten aufzulösen sein:
xk
xk ( q1 ,...qn , t ) { xk (qi , t ) .
(12.16)
Bilden wir die erste Ableitung, so folgt als Zusammenhang zwischen den Geschwindigkeiten xk und qi
xk
n wxk wx ¦ k qi . wt i 1 wqi
(12.17)
Einsetzen in die Lagrange-Funktion ergibt L( xi , xi , t )
L '(qk , qk , t )
L xi (qk , t ), xi (qk , q k , t ), t .
(12.18)
Unser Ziel ist es, die Gültigkeit der Gleichung
wLc d wLc wqi dt wqi
0
(12.19)
zu zeigen. Dazu beschaffen wir uns jetzt die beiden obigen Ableitungen. Unter Verwendung von (12.18) folgt
wLc wqi
§ wL wxl wL wxl · ¸ ; (12.20a) © l wqi wxl wqi ¹
¦ ¨ wx l
wLc wqi
§ wL wxl © l wqi
¦ ¨ wx l
· ¸. ¹
(12.20b)
Jetzt benötigen wir noch die zeitliche Ableitung der rechts in (12.19) stehenden Beziehung.
12 Analytische Mechanik
209
Wir erhalten mit Hilfe von (12.17)
wxl wqi
wxl wqi
d wxl dt wqi
o
wxl . wqi
(12.21)
Damit können wir den rechts stehenden Term in (12.19) bilden. Setzen wir ihn zusammen mit (12.20a) in (12.19) ein, so erhalten wir
wLc d wLc wqi dt wqi
° wL wxl wL wxl d § wL wxl · °½ ¨ ¸¾ ¯° l wqi wxl wqi dt © wxl wqi ¹ °¿
¦ ® wx l
° wxl § wL
¦ ® wq ¨ wx l
°¯
i
©
l
d wL · wL § wxl d wxl · ½° ¸ ¨ ¸¾ dt wxl ¹ wxl © wqi dt wqi ¹ °¿
Der letzte Klammerausdruck verschwindet identisch, der erste stellt die Euler-Lagrangesche Gleichung in kartesischen Koordinaten dar und ist folglich ebenfalls null. Damit ist die Gültigkeit von (12.19) gezeigt. Die Lagrangefunktion L ist im Allgemeinen eine Funktion aller verallgemeinerten Koordinaten und Geschwindigkeiten sowie der Zeit. Es kommen jedoch Fälle vor, in denen L unabhängig von einer dieser Variablen ist. Hängt L nicht explizit von der Zeit ab, so bleibt die Gesamtenergie erhalten, hängt L nicht von den Geschwindigkeitskoordinaten ab, so ist der Impuls konstant. Wir betrachten hier exemplarisch den zweiten Fall. Zunächst zur Definition des Impulses. In kartesischen Koordinaten ist
wL wxi
wEkin wV wxi wxi mi xi pi x
wEkin w wxi wxi
mi
¦ 2 x i
2 i
yi2 zi2
(12.22)
In Übereinstimmung damit wird der verallgemeinerte Impuls definiert als
pi
wL . wqi
(12.23)
pi und qi werden als zueinander kanonisch konjugierte Größen bezeichnet. Ist
wL wqi
0,
o
pi
const.
(12.24)
Allgemein werden solche Variable, von denen die Lagrangefunktion nicht explizit abhängt, zyklische Variable genannt.
210
12 Analytische Mechanik
Die Zweckmäßigkeit der Euler-Lagrangeschen Gleichung in verallgemeinerten Koordinaten sei an einem Beispiel demonstriert. Wir betrachten einen Massenpunkt, der im Inneren eines Hohlkegels reibungsfrei auf einem Kreiskegel gleitet (Abb. 12.2). Zuerst haben wir die verallgemeinerten Koordinaten festzulegen. Der Massenpunkt unterliegt der Nebenbedingung
g ( x, y , z )
x 2 y 2 z 2 tan 2 E
0.
(12.25)
Die Anzahl der Freiheitsgrade reduziert sich durch die Nebenbedingung auf zwei. Das führt auf zwei unabhängige verallgemeinerte Koordinaten. Bei ihrer Festlegung ist es wie im Falle des Kreispendels zweckmäßig, sie der Symmetrie des Problems anzupassen. Dieser Forderung genügen beispielsweise Zylinderkoordinaten. Wir wollen hier neben dem Winkel M den Abstand r des Massenpunktes vom Ursprung des Bezugssystems benutzen. Ist ß der Öffnungswinkel des Kegels, so lauten die Transformationsgleichungen
r
Abb. 12.2: Bewegung eines MP auf einem Kegelmantel unter dem Einfluss der Gravitation
x y z
x(r ,M ) r sin E cos M , y ( r ,M ) r sin E sin M , z (r ,M ) r cos E .
(12.26a)
Als Nächstes bestimmen wir die Lagrange-Funktion. Dazu benötigen wir Ausdrücke für die kinetische und potentielle Energie in den neuen Koordinaten. Zu diesem Zweck berechnen wir die Geschwindigkeitskomponenten
x y z
x (r ,M , r,M ) r sin E cos M r sin E sin M M , y (r ,M , r,M ) r sin E sin M r sin E cos M M , z (r) r cos E .
(12.26b)
Die Energie-Ausdrücke nehmen damit die Form an
Ekin E pot
m 2 m 2 x y 2 z 2 r r 2M 2 sin 2 E ; 2 2 mg z mg r cos E .
(12.27)
Damit ergibt sich die Lagrange-Funktion L zu
L(r , r, M )
Ekin E pot
m 2 r r 2M 2 sin 2 E mgr cos E 2
.
(12.28)
12 Analytische Mechanik
211
Die Bewegungsgleichungen sind
d dt d dt
dL wL dr wr dL wL dM wM
mr mrM 2 sin 2 E mg cos E
0; (12.29)
d mr 2 M sin 2 E 0. dt
In diesen Gleichungen kommt M nicht explizit vor. Daher folgt aus der zweiten Gleichung, dass der Drehimpuls des Systems l = lz konstant ist.
mr 2M sin 2 E
l
const.
(12.30)
Eliminieren wir mit Hilfe dieser Beziehung M aus der E.-Lagrange-Gleichung, so erhalten wir die Bewegungsgleichung für unser Problem:
mr
l2 mg cos E mr 3 sin 2 E
0 .
(12.31)
Das ist eine nichtlineare Differentialgleichung. Um ihren physikalischen Inhalt zu erkennen, brauchen wir sie nicht zu lösen. Wir ziehen stattdessen den Energieerhaltungssatz mit heran. Da weder Ekin noch Epot von der Zeit abhängt, gilt
E
Ekin V
m 2 2 2 2 r r M sin E mgr cos E 2
const.
(12.32)
Darin lässt sich M durch (12.30) ausdrücken:
E Veff
m 2 r Veff 2 l2 mgr cos E 2mr 2 sin 2 E
(12.33)
Das Minimum des effektiven Potentials liegt bei 1/ 3
r0
§ · l2 ¨ 2 ¸ . 2 © m g sin E cos E ¹
(12.34)
Dies ist der Radius einer stabilen Kreisbahn, auf der ein Massenpunkt bei gegebenem Drehimpuls umlaufen kann. Die erste Ableitung r ist null und die Energie des MP ist gleich Veff (r0).
212
12 Analytische Mechanik
Für Energien, die nur wenig größer sind, kann Veff entwickelt werden:
Veff
V
r r0
w 2Veff 1 ( r r0 ) 2 wr 2 2
... .
(12.35)
r r0
Einsetzen in die Bewegungsgleichung (12.31) ergibt formal die Gleichung des harmonischen Oszillators.
U Z02 U 0 , nämlich
Veff E
r
V0
rU2
r0
rU1 r
Abb. 12.3: Effektives Potential
2 (r r0 ) w Veff wr 2 m
0.
(12.36)
r r0
Der Massenpunkt gleitet auf dem Kegel in Form einer Wellenlinie zwischen zwei horizontalen Kreisen mit Radien rmin und rmax periodisch hinauf und herunter (Abb. 12.3). Die quadrierte Frequenz ergibt sich als Quotient aus der Krümmung des effektiven Potentials bei r = r0 und der Masse.
Existieren in einer Aufgabenstellung, wie im vorherigen Fall, Nebenbedingungen, so ist es oft zweckmäßig, von den um die Lagrange-MultiplikatorenO erweiterten Lagrange-Gleichungen (A1.146) auszugehen. Die Herleitung der Bewegungsgleichung ist für unser Beispiel recht einfach, so dass sie hier noch gezeigt werden soll. Die Gleichungen lauten
d dt d dt d dt
wg dL wL 0 O dr wr dr dL wL wg 0 O dM wM wM dL wL wg 0 O dz wz wz g (r ,M , z ) 0.
(12.37)
Die Nebenbedingung lässt sich schreiben
r 2 sin 2 E z 2 tan 2 E
0.
(12.37a)
Wegen der Symmetrie des Problems ist sie unabhängig von M . Zudem hängt die LagrangeFunktion nicht von z ab, so dass aus der Letzten der Gleichungen J sofort O = 0 folgt. Damit sind die beiden ersten Lagrange-Gleichungen identisch mit den Gln. (12.29)!
12 Analytische Mechanik
12.1.3
213
Verallgemeinerte Kräfte
Die Gültigkeit der Lagrange-Gleichungen in der bisherigen Form ist auf konservative Kräfte beschränkt, d.h. die Kräfte müssen aus einem Potential ableitbar sein. Es gibt aber Fälle, bei der diese Prämisse, wie bei geschwindigkeitsabhängigen Kräften, nicht gilt. Es erhebt sich also die Frage, ob wir die Gleichungen so erweitern können, dass sie auch für solche Anwendungen gelten. Es wird sich zeigen, dass an die Stelle der Gleichungen (12.3) die Beziehungen
wL d wL wqi dt wqi
)ci
(12.38)
treten. Hierin ist ) ci der Beitrag der „verallgemeinerten Kräfte“, die sich nicht aus einem Potential ableiten lassen. Wir wollen jetzt diese neue Gleichung ableiten. Es sei ein System von G n Massenpunkten mit den Koordinaten rD gegeben. Wie im Abschnitt 12.2.3 bereits eingeführt, sollen diese Funktionen der verallgemeinerten Koordinaten sein:
G rD
G rD (q1 ,..., q3n ), (D 1,..., n) .
(12.39)
G rD
G wrD ¦i wq qi i
(12.40)
G Ist FD die auf einen Massenpunkt D wirkende Kraft, so ist die von diesen Kräften längs einer Verschiebung
G drD
G wrD ¦i wq dqi i
(12.41)
am System verrichtete Arbeit
G G ¦ FD drD n
dW
D 1
G wrGD FD dqi { ¦ ) i dqi . ¦¦ wqi D i i
(12.42)
Die hier eingeführten Größen
)i
G wrGD FD , (i 1,...,3n) ¦ wqi D
(12.43)
heißen verallgemeinerte Kräfte. Wir kommen gleich auf sie zurück. Zunächst multiplizieren
G
wir die Newtonsche Bewegungsgleichung FD
G G mD rD mit wrD / wqi :
214
12 Analytische Mechanik
G wrGD FD wqi
G G wrD mrD wqi
G G G d wrD d § G wrD · . ¨ mrD ¸ mrD dt © dt wqi wqi ¹
(12.44)
Summieren wir über alle D , so erhalten wir mit
G d wrD dt wqi
G wrD wqi
G wrGD F ¦ D wqi D
)i
G § G wrD · d G mr ¨ D ¸ ¦ mrD ¦ dt D © wqi ¹ D
G wrD . wqi
(12.45)
Zur Umformung der rechten Seite gehen wir wie in Abschnitt 12.1.2 vor. Die kinetische Energie schreibt sich in verallgemeinerten Koordinaten
Ekin
1
G G
mD rD rD , ¦ 2 D
(12.46)
und die erste Ableitung nach qi bzw. qi ist:
G G drD ; mD rD ¦ dqi D
dEkin dqi
dEkin dqi
G G drD ; mD rD ¦ dqi D
(12.47a/b)
lässt sich mit (12.40) schreiben, wenn wir noch die zeitliche Ableitung bilden
d dEkin dt dqi
G d G drD m r ¦ D D dq , dt D i
(12.48)
Die Differenz von (12.48) und (12.47a) ist gleich der rechten Seite von (12.45). Folglich gilt
wEkin d wEkin wqi dt wqi
) i .
(12.49)
Setzen sich die verallgemeinerten Kräfte aus einem konservativen und einem nicht-konservativen Anteil zusammen,
)i
so erhalten wir
wV )ci , wqi
(12.50)
12 Analytische Mechanik
wEkin wV d wEkin wqi wqi dt wqi
215
)ci .
(12.51)
In diese Gleichung lässt sich die Lagrange-Funktion einführen,
L
Ekin V .
Da V wieder nicht von q abhängt, ergibt sich
wL d wL wqi dt wqi
)ci .
(12.52)
Dies ist die auf nicht-konservative Kräfte erweiterte Lagrange-Gleichung, oft als LagrangeGleichungen 2. Art bezeichnet.
12.2
Hamiltonsche Theorie
12.2.1 Grundlagen Die Hamiltonsche Theorie (W. R. Hamilton, 1805-1865) stellt eine weitere Möglichkeit zur Formulierung der Mechanik dar. Neben ihrer Nützlichkeit bei der Lösung von Problemen in der Mechanik ermöglicht sie einen guten Einstieg in die statistische Mechanik und Quantenmechanik. – Im Lagrange-Formalismus sind die unabhängigen Variablen die verallgemeinerten Koordinaten (qi , qi , t ) , im Hamiltonformalismus treten an die Stelle der Geschwindigkeiten die verallgemeinerten Impulse
pi
wL(qi , qi , t ) . wqi
(12.53)
Wir lösen die n Gleichungen nach den n Größen qk auf
qk
qk (q, p, t ) ,
(12.54)
wobei zur Abkürzung
q (q1 ,..., qn ), q ( q1 ,...qn ), geschrieben wurde.
p ( p1 ,... pn )
(12.55)
216
12 Analytische Mechanik
Wir definieren nun die sog. Hamiltonfunktion H (q, p, t ) als
¦ p q (q, p, t ) L(q, q (q, p, t ) t ) .
H ( q, p, t )
i
i
(12.56)
i
Zur Bildung der Hamiltonfunktion haben wir also die Lagrange-Funktion zu bilden und anschließend die verallgemeinerten Geschwindigkeiten durch die Impulse auszudrücken. Dies sei am Beispiel der ebenen Bewegung eines freien Massenpunktes gezeigt. Die Lagrange-Funktion lautet in Polarkoordinaten
m 2 ( U U 2M 2 ) . 2
L( U , U ,M )
pU
wL wU
pM
wL wM
m U
o U 2
mU M
o M
(12.57)
pM
; m pM
mU 2
(12.58)
.
Damit ergibt sich die Hamiltonfunktion entsprechend (12.56) zu
H ( U , pU , pM )
U pU M pM L
pU2 2m
pM2
2m U 2
.
(12.59)
Kehren wir wieder zur Definitionsgleichung von H zurück und berechnen deren partielle Ableitungen.
wH wqk
wqi
n
¦ wq i 1
pi
k
n wL wL wqi ¦ wqk i 1 wqi wqk
(12.60)
d § wL · ¨ ¸ p k dt © wqk ¹
wL wqk n
wqi
wH wpk
¦ wp
wH wt
¦ wt
i 1
n
i 1
k
wqi
wL wqi wqi wpk
qk
wL wqi wL wqi wt wt
n
pi qk ¦ i 1
n
pi ¦ i 1
wL wt
(12.61)
(12.62)
12 Analytische Mechanik
217
Zusammengefasst haben wir die drei Gleichungen gewonnen:
qk
wH ; ( k 1,..., n) wpk
p k
wH ; (k 1,..., n) wqk
wL wt
(12.60a/61a)
wH wt
(12.62a)
Die ersten beiden Gleichungen werden als die Hamiltonschen (oder kanonischen) Bewegungsgleichungen bezeichnet. Sie stellen 2n gekoppelte Differentialgleichungen 1. Ordnung zur Bestimmung der pk und qk dar und sind daher den Euler-Lagrange-Gleichungen, die aus n Differentialgleichungen 2. Ordnung bestehen, gleichwertig. Als Beispiel leiten wir die Hamiltonschen Gleichungen für die Bewegung eines Teilchens in einem Potential ab. Die Lagrange-Funktion ist in kartesischen Koordinaten
L
G mr 2 G V (r , t ) 2 m 2 x y 2 z 2 V ( x, y, z, t ) 2
(12.63)
Die verallgemeinerten Impulse berechnen sich daraus zu
px
wL wx
mx ;
py
wL wy
my ;
wL wz
pz
mz .
(12.64)
Damit erhalten wir für die Hamiltonfunktion
H ( x, y , z , p x , p y , p z )
px2 p y2 pz2 2m
V ( x, y , z , t )
Daraus folgen die Hamiltonschen Gleichungen zu
G p2 G V (r , t ) 2m
(12.65)
218
12 Analytische Mechanik
px
wH wx
wV ; wx
x
wH wpx
px ; m
py
wH wy
wV ; wy
y
wH wp y
py
pz
wH wz
wV ; wz
z
wH wpz
pz . m
m
;
(12.66)
In Vektorform schreiben sie sich als
G p
G grad V ( r ),
G r
G p . m
(12.67)
Hängt die Hamiltonfunktion nicht explizit von der Zeit ab, so ist sie selbst Erhaltungsgröße. Um das zu zeigen, berechnen wir die totale zeitliche Ableitung von H
dH dt
· d § n wL wL qi L ¸ ¨¦ dt © i 1 wqi wt ¹
wH . wt
(12.68)
Im Klammerausdruck wurde (12.53 benutzt; das letzte Gleichheitszeichen folgt mit (12.62a). Nach der Behauptung ist wH / wt 0 o H const. Sind die Potentiale geschwindigkeitsunabhängig, so wird der erste Term des Klammerausdrucks mit (12.56) und der Definitionsgleichung von L,
§ wL · ¸ qi © i¹
¦ ¨ wq
2 Ekin
(12.69)
und die Hamiltonfunktion wird gleich der Gesamtenergie des Systems.
H ( p, q )
Ekin V .
(12.70)
In der Quantenmechanik wird die Hamiltonfunktion (12.70) zum Hamiltonoperator zur Berechnung der Energiezustände von Atomen und Molekülen.
12 Analytische Mechanik
219
12.2.2 Kanonische Transformationen In Kap. 12.1.3 hatten wir gesehen, dass die Gültigkeit der Lagrangeschen Bewegungsgleichungen nicht auf kartesische Koordinaten beschränkt ist, sondern auf beliebige Koordinaten ausgeweitet werden kann. Besondere Bedeutung kam der Transformation auf zyklische Koordinaten zu, durch welche die Lösung eines Problems erheblich erleichtert wird. Hängt z. B. die Lagrange-Funktion nicht explizit von der Koordinate qi ab, so folgt, dass der Impuls pi konstant ist,
wL wqi
0,
o p i
0,
o pi
const .
(12.71)
Es erhebt sich die Frage, ob derart definierte zyklische Koordinaten auch in der Hamiltonfunktion zyklisch sind. Das ist tatsächlich der Fall, denn aus (12.61a) ergibt sich, dass eine Impulskomponente pk erhalten ist, wenn die Hamiltonfunktion nicht explizit von der Koordinate qk abhängt.
wH wqk
0,
o p k
0,
o pk
Dk
const .
(12.72)
Sind alle Koordinaten qk zyklisch, so hängt die Hamiltonfunktion nur von den pk ab:
H
H ( p1 ,..., pn ) .
(12.73)
In diesem Fall lässt sich die Integration der Hamiltonschen Gleichungen vollständig durchführen. Zunächst folgt analog zu (12.72) aus (12.61a) für alle qk
pk
Dk
const .
(12.74)
Damit ergibt sich aus (12.60a)
qk
wH wpk
Zk ,
(12.75)
wobei die Zk ebenfalls zeitunabhängige Größen sind. Durch Integration erhalten wir
qk (t ) Zk t E k .
(12.76)
Darin sind die ßk wiederum unabhängig von der Zeit. Die Hamiltonschen Gleichungen sind damit im Prinzip gelöst. Allerdings ist es häufig nicht möglich, eine solche exakte Lösung zu finden. Wir wollen uns daher jetzt der Frage zuwenden, ob wir im Hamiltonschen Formalismus von den pi und qi zu neuen Koordinaten Qi und Impulsen Pi übergehen können, welche die
220
12 Analytische Mechanik
Bewegungsgleichungen vereinfachen. Deren Form darf sich dabei natürlich nicht ändern, d. h. wir haben zu fordern
wH c ; wPi
Q i
Pi
wH c ; wQi
(12.77)
Wir untersuchen eine Transformation
Qi
Qi (q, p, t );
Pi
Pi ( q, p, t ) ;
(12.78)
Zur Lösung der Fragestellung benötigen wir eine Formulierung der Hamiltonschen Gleichungen in der Form einer Variationsaufgabe. Um eine solche zu gewinnen, drücken wir zunächst im Hamiltonschen Prinzip, Gln. (12.2), die Lagrange-Funktion durch die HamiltonFunktion aus. Das ergibt t2
§
·
G S (q ) G ³ ¨ ¦ pi qi H ( q, p,t ) ¸ dt 0 . t1
©
(12.79)
¹
i
Darin sollen die qi als Funktionen von qi und pi ausdrückbar sein. Wir fassen daher S als Funktional der 2n unabhängigen Funktionen q(t) und p(t) auf. Zunächst folgt t2
§
¦ ³ ¨ q G p
G S (qi , pi )
i
t1
©
i
i
piG qi
· wH wH G qi G pi ¸ dt wqi wpi ¹
0.
(12.80)
Partielle Integration des 2. Terms ergibt t2
³
t2
piG qi dt
t1
³ t1
pi
d G qi dt dt
piG qi
t2 t1
t2
³ p iG qi dt .
Der erste Term auf der rechten Seite verschwindet, da G qi (t1 ) G qi (t2 ) Setzen wir (12.81) in (12.80) ein, so erhalten wir t2
°§
¦ ³ ®¨ q i
t1
°¯©
i
(12.81)
t1
§ wH · wH · °½ ¸ G pi ¨ p i ¸ G qi ¾ dt wpi ¹ wqi ¹ °¿ ©
0.
0.
(12.82)
Die G pi und G qi sind voneinander unabhängig. Daher kann (12.82) nur erfüllt werden, wenn die beiden Klammerausdrücke einzeln verschwinden. Das Resultat sind also die Hamiltonschen Gleichungen (12.60a/61a). Das Variationsproblem (12.79) ist diesen äquivalent. Das muss auch für die neuen Variablen gelten.
12 Analytische Mechanik
221
Das bedeutet, dass die Gleichungen t2
§
·
G S (q ) G ³ ¨ ¦ pi qi H ( q, p,t ) ¸ dt 0 t1
©
(12.83)
¹
i
und t2
§
·
G S (Q, P ) G ³ ¨ ¦ Pi Q i H c(Q, P,t ) ¸ dt 0 t1
©
(12.84)
¹
i
gleichzeitig erfüllt sein müssen. Das wiederum heißt, dass sich die beiden Integranden höchstens um die totale Zeitableitung einer beliebigen Funktion
F
F ( p, q, P, Q, t )
(12.85)
unterscheiden können.
¦ p q i
i
¦ P Q H c(Q, P, t )
H (q, p,t )
i
i
i
i
dF . dt
(12.86)
Die Integration dieser Gleichung liefert t2
½ ³t ®¯¦i pi qi H (q, p,t ) ¾¿dt 1
t2
½
³ ®¯¦ P Q H c(Q, P, t )¾¿dt F i
i
i
t1
t2 t1
.
(12.87)
Bei der vorzunehmenden Variation verschwindet der Term ganz rechts, da die Variablen an den Endpunkten nicht variiert werden. Die Gültigkeit der Gln. (12.83) und (12.84) ist also gewährleistet. Die Funktion F heißt Erzeugende Funktion der Transformation, denn wie im Folgenden gezeigt wird, legen sie die Transformationsgleichungen (12.78) fest. Nach (12.85) ist F eine beliebige Funktion der insgesamt 4n ursprünglichen und neuen Variablen sowie der Zeit. Von diesen können 2n Variable durch die Verknüpfungen (12.78) eliminiert werden, so dass 2n unabhängige Variable verbleiben. Es gibt 4 Typen von erzeugenden Funktionen:
F (q, Q, t ), F (q, P, t ), F ( p, Q, t ), F ( p, P, t ) .
(12.88a-d)
Wählen wir zunächst die erste Funktion. Setzen wir sie in (12.86) ein, so ergibt sich
¦ p q i
i
i
H
wF
wF
¦ P Q H c ¦ wq q ¦ wQ Q i
i
i
i
i
i
i
i
i
wF wt
(12.89)
222
12 Analytische Mechanik
und durch Umordnen
§
§ wF · wF ¸ qi ¦ ¨ Pi wQi i © i ¹
¦ ¨ p wq i
i
©
· § wF · ¸ Qi ¨ H c H ¸ 0. wt ¹ © ¹
(12.90)
Die Gleichung lässt sich erfüllen, wenn die drei Klammerausdrücke null sind. Es muss also gelten
pi
wF wF wF ; Pi ; Hc H . wqi wQi wt
(12.91a-c)
Das Ergebnis bedeutet Folgendes: Nach Wahl einer beliebigen Funktion F (q, Q, t ) ergeben sich die pi durch Differentiation nach der Vorschrift (12.91a). Diese Beziehungen werden nach den Qi Qi (q, p, t ) aufgelöst. Damit haben wir die ersten n Transformationsgleichungen (12.78) gewonnen. Gl. (12.91b) liefert die Pi (q, Q, t ) . In diesen lassen sich die Qi wieder durch (p,q,t) ersetzen, so dass wir die Pi (q, p, t ) gewinnen. Das sind die zweiten n Transformationsgleichungen (12.78). Als Nächstes besprechen wir die Funktion (12.88b). Durch Einsetzen in (12.122) erhalten wir jetzt als Bedingungsgleichungen:
pi
wF ; Qi wqi
wF wF ; Hc H . wPi wt
(12.92a-c)
Analog zum Vorgehen im Fall der Funktion (12.88a) ergeben sich wiederum 2n Transformationsgleichungen. Für den Fall (12.88c) sind die Bedingungsgleichungen
qi
wF wF ; Pi ; Hc wpi wQi
H
wF , wt
und für die Funktion (12.88d) ergibt sich
qi
wF ; Qi wpi
wF wF ; Hc H wPi wt
(12.93)
12 Analytische Mechanik
223
12.2.3 Hamilton-Jacobische Gleichung Es erhebt sich nun die Frage, ob es spezielle kanonische Transformationen gibt, durch welche die Hamiltonschen Gleichungen in eine Form gebracht werden können, in der sie leicht zu integrieren sind. Wir haben bereits erläutert, dass dies sicher dann der Fall ist, wenn die neuen Variablen alle zyklisch sind, d.h. wenn H´ als
Hc
H c( P1 ,..., Pn , t )
(12.94)
gegeben ist. Am einfachsten werden aber die Rechnungen, wenn es eine kanonische Transformation gibt, welche die Hamiltonfunktion H ( pi , qi , t ) in die Form
H c( Pi , Qi , t ) 0
(12.95)
überführt. Die Bewegungsgleichungen lauten in diesem Fall
Q k
wH c wPk
Pk
0;
wH c wQk
0.
(12.96)
Integration dieser Gleichungen ergibt sofort
Pi
const.
Qi
const.
(12.97)
Im Folgenden bezeichnen wir die erzeugende Funktion, welche dies leistet, mit dem Buchstaben S und nennen sie Wirkungsfunktion. Sie möge als Funktion der qi und Pi angenommen werden.
S
S (qi , Pi , t ) .
(12.98)
Diese Wahl entspricht der Funktion (12.88b). Mit F = S werden aus den Gln. (12.92b,c)
pi
wS ; wqi
Hc
H (qi , pi , t )
wS . wt
(12.99)
Wegen der Forderung (12.95) muss H´ verschwinden
Hc
H (qi , pi , t )
wS wt
0.
(12.100)
Damit H von den gleichen Variablen wie S abhängt, drücken wir die pi durch (12.99) aus. Das Ergebnis ist die Hamilton-Jacobische Differentialgleichung
224
12 Analytische Mechanik
§ wS · wS ,t ¸ H ¨ qi , © wqi ¹ wt
0 .
(12.101)
An die Stelle der Hamiltonschen Gleichungen ist also eine nichtlineare partielle Differentialgleichung 1. Ordnung zur Ermittlung der Wirkungsfunktion getreten. Da sie n + 1 Unbekannte qi und t aufweist, enthält die Lösung n + 1 Integrationskonstanten. Wir bezeichnen sie mit (D1,…, Dn + 1). Da aber in (12.101) S nicht explizit auftritt, sondern nur ihre partiellen Ableitungen, ist neben S auch S + D eine Lösung. Dabei ist D eine der n + 1 Konstanten, die in der Lösung auftreten. Diese hat jedoch keinerlei physikalische Bedeutung, da sie in den Transformationsformeln nicht explizit auftritt. Die vollständige Lösung kann also geschrieben werden als
S
S (qi ,..., qn ,D1 ,...,D n , t ) .
(12.102)
Darin können wir die n Integrationskonstanten mit den neuen kanonischen Impulsen Pi gleichsetzen.
Pi
Di
const.
(12.103)
Für die ursprünglichen Impulse folgt damit nach (12.92) mit (12.99)
pi
wS wqi
(12.104)
und für die neuen konstanten Koordinaten ergibt sich
Qi
wS wPi
wS wD i
Qi (qi ,D i , t ) { E i
const.
(12.105)
Lösen wir diese Gleichungen nach den qi auf, so erhalten wir
qi
qi (D i , E i , t )
(12.106)
Mit den beiden Gleichungen (12.104) und (12.106) haben wir die Koordinaten als Funktion der Zeit ausgedrückt. Die auftretenden 2n Integrationskonstanten DI, Ei ergeben sich aus den Anfangsbedingungen. In den meisten Fällen ist die Hamilton-Jacobische Gleichung kaum leichter zu lösen als die ursprünglichen Hamiltonschen Gleichungen. Sie ist aber abgesehen davon wie diese im Hinblick auf die Zusammenhänge zwischen Mechanik und Quantenmechanik von Bedeutung.
12 Analytische Mechanik
225
12.2.4 Behandlung des eindimensionalen harmonischen Oszillators im Hamiltonformalismus Als einfaches Beispiel für die Behandlung einer Bewegungsaufgabe besprechen wir den eindimensionalen Oszillator. Zunächst stellen wir die Hamiltonschen Bewegungsgleichungen auf, anschließend behandeln wir den Fall mit der Methode der Hamilton-Jacobi-Theorie. Zur Bestimmung der Hamiltonfunktion H benötigen wir die kinetische und die potentielle Energie. Es ist
Ekin px
m 2 m 2 D 2 x q ; E pot x 2 2 2 1 wL p mq o q p. wq m
D 2 q ; 2
(12.107)
Damit ergibt sich H zu
H
1 2 D 2 p q 2m 2
und die Bewegungsgleichungen werden
wH wp
1 p m
q ;
wH wq
Dq
p
(12.108)
Zur Überprüfung formen wir die Gleichungen in die Newtonsche Bewegungsgleichung um. Dazu differenzieren wir die linke Beziehung nach der Zeit und eliminieren aus dieser und der zweiten Gleichung (12.108) p . Es entsteht
mq D q
0.
(12.109)
Mit q = x ist das die bekannte Newtonsche Bewegungsgleichung. Nun behandeln wir die Fragestellung mit Hilfe der Hamilton-Jacobischen Differentialgleichung (12.101). Unter Benutzung von (12.104) lautet sie 2
1 § wS · 1 wS 2 ¨ ¸ Dq wt 2m © wq ¹ 2
0.
(12.110)
Da die beiden ersten Terme nur von q abhängen und der dritte Term nur von t, machen wir einen Separationsansatz.
226
12 Analytische Mechanik
S ( q , D , t ) W ( q ) f (t ) ,
(12.111)
mit dem sich ergibt 2
1 § wW · 1 2 ¨ ¸ Dq 2m © wq ¹ 2
wf . wt
(12.112)
Da die linke Seite nur von q abhängt und die rechte nur von t, müssen beide Seiten gleich einer gemeinsamen Konstanten D sein.
f (t ) D ;
(12.113) 2
1 § wW · 1 2 ¨ ¸ Dq 2m © wq ¹ 2
D .
(12.114)
Die Lösung der letzten Gleichung ist 1/ 2
W ( q, D )
1 § · 2m ³ dq ¨ D Dq 2 ¸ 2 © ¹
.
(12.115)
Einsetzen von f(t) = D und W(q, D) in (12.111) liefert 1/ 2
S ( q, D , t )
1 § · 2m ³ dq ¨ D Dq 2 ¸ 2 © ¹
Dt .
(12.116)
Mit diesem Resultat gehen wir in (12.105) ein, womit wir als implizite Lösung erhalten:
E
wS wD
2m ³
dq 1/ 2
§ Dq 2 · 2 ¨D ¸ 2 ¹ ©
t .
(12.117)
Addition von t und Ausführung der Integration führen zu
ßt
§ m D · arc cos ¨¨ q ¸¸ . D © 2D ¹
(12.118)
12 Analytische Mechanik
227
Drücken wir im ersten Faktor
D durch Z m aus, so ergibt sich für q
2D cos Z (t ß) . D
q (t )
(12.119)
Hierin sind die Integrationskonstanten wie üblich durch die Anfangsbedingungen bestimmt. Wählen wir für t = 0 die Auslenkung zu q0 und den Impuls zu p0 = 0, so lautet (12.110) für t=0 2
1 § wS · 1 2 ¨ ¸ Dq0 D 2m © wq ¹0 2
0 .
(12.120)
Mit (12.105) gilt
wS wq
p0
0.
(12.121)
0
Das ergibt für D
D
1 Dq02 . 2
(12.122)
Mit (12.122) wird (12.119)
q(t ) q0 cos Z (t ß) .
(12.123)
Damit für t = 0 q = q0 ist, muss ß = 0 sein. Das ergibt das bekannte Endergebnis
q(t ) q0 cos(Z t ) .
(12.124)
Der harmonische Oszillator ist ein Beispiel für ein konservatives System. Wie wir schon weiter oben gefunden haben, gilt dann
H
Ekin V
E
const.
In einem solchen Fall lässt sich die Hamilton-Jacobische Gleichung vereinfachen. Setzen wir nämlich H in (12.101) ein, so erhalten wir
§ wS H ¨ qi , © wqi
· wS ¸ ¹ wt
E
wS wt
0.
(12.125)
228
12 Analytische Mechanik
Da H nicht von der Zeit abhängt, muss die Wirkungsfunktion S eine in t lineare Funktion sein. Dies folgt aus dem linken Teil der Gleichung. Aus dem rechten Teil ergibt sich die Zeitabhängigkeit zu
S v Et .
(12.126)
Folglich hat die Wirkungsfunktion die Form
S (qi ,D i , t )
S c(qi ,D i ) Et .
(12.127)
S´ wird verkürzte Wirkungsfunktion oder Hamiltonsche charakteristische Funktion genannt. Einsetzen der Lösung in (12.125) ergibt die verkürzte Hamilton-Jacobi-Gleichung
§ wS c · H ¨ qi , ¸ © wqi ¹
E .
(12.128)
12.2.5 Die Poissonklammer Zum Abschluss unseres Exkurses in die Theoretische Mechanik wollen wir die PoissonKlammer einführen. Ihr Wert liegt darin, dass sie gegenüber kanonischen Transformationen invariant ist. Auf Grund dieser Eigenschaft können die Bewegungsgleichungen in neuer Form dargestellt werden. Beim Übergang zur Quantenmechanik geht die Poissonklammer in den Kommutator über. Zur Definition der Poissonklammer betrachten wir ein System, das durch die Koordinaten qi und die Impulse pi beschrieben wird. Eine physikalische Größe dieses Systems kann nur von diesen Variablen und der Zeit t abhängen. Es mögen zwei solcher Größen F und K gegeben sein:
f
f (q1 ,..., q f , p1 ,..., p f , t ) { f (q, p, t ),
g
g (q1 ,..., q f , p1 ,..., p f , t ) { g (q, p, t )
(12.129)
Die Größe
§ wf wg wf wg · ¸ { ^ f , g` © k wpk wpk wqk ¹
¦ ¨ wq k
(12.130)
wird als Poissonklammer der Größen f und g bezeichnet und wie ersichtlich als geschrieben.
^ f , g`
12 Analytische Mechanik
229
Zunächst seien einige Eigenschaften und spezielle Poissonklammern genannt. Aus der Definition (12.130) ersehen wir unmittelbar, dass
^ f , g`
^ g , f ` und
^f, f`
0.
(12.131)
Wir wollen nun g durch die pk und qk im Hamiltonformalismus austauschen. Dazu notieren wir uns zunächst, dass wegen der Unabhängigkeit der Variablen pk , qk , t gilt
wpi wq j
0;
wpi wp j
wqi G ij ; wq j
wqi wp j
G ij ;
wpi wt
0;
0;
wqi wt
0.
(12.132)
Damit erhalten wir aus (12.130)
wf wp j
wf wq j
^ fi , q j ` ;
^ f , p `. i
(12.133)
j
Setzen wir auch f = qi oder f = pi , so ergibt sich
§
i
wp j
©
k
wpk
^q , p ` ¦ ¨ wwqq i
j
k
wqi wp j · ¸ wpk wqk ¹
¦G
ik
G jk
G ij .
(12.134)
k
Weiter finden wir
^p , p ` i
j
^q , q `
0;
i
j
0.
(12.135)
Diese Klammern, in denen f und g die pk und qk selbst sind, werden fundamentale Klammern genannt. Die in (12.134/135) niedergelegten Eigenschaften von qi und pi können auf alle kanonischen Variablen Qi und Pi übertragen werden. Um das zu zeigen, gehen wir z.B. von der zeitlichen Ableitung von Pi aus. Unter Benutzung der Hamiltonschen Gleichungen folgt
Pi
§ wPi
¦ ¨ wq k
©
qk
k
· wPi p k ¸ wpk ¹
§ wPi wH wPi wH · ¸ . © k wpk wpk wqk ¹
¦ ¨ wq k
(12.136)
Da
wH wpk
§ wH wPj
¦ ¨¨ wP j
©
j
wpk
wH wQ j · wH ¸ und wQ j wpk ¹ wqk
§ wH wPj
¦ ¨¨ wP j
©
j
wqk
wH wQ j · ¸ (12.137) wQ j wqk ¹
230
12 Analytische Mechanik
wird (12.136) zu
· wH § wPi wQ j wPi wQ j · wH ½° ¨ ¾ ¸ ¸ k, j ¹ wPj © wqk wpk wpk wqk ¹ wQ j ¿° wH wH ¦j ^Pi , Pj ` wP ¦j ^Pi , Q j ` wQ . j j °§ wPi wPj wPi wPj ¯°© k wpk wpk wqk
Pi
¦ ®¨ wq
(12.138)
Aus dem Vergleich mit den kanonisch transformierten Hamilton-Gleichungen (12.78) ergeben sich zwei der behaupteten Beziehungen.
^P , P ` i
j
0
^P , Q `
und
i
G ij .
j
Der Beweis der noch fehlenden Relation ^Qi , Q j `
(12.139) 0 lässt sich durch eine analoge Rechnung
für Q erbringen. Die Poissonklammern (12.134/135) gelten also unabhängig von der speziellen Wahl der kanonischen Variablen. Wir schreiben dies in der Form
^qk , pl `P ,Q ^qk , pl ` p ,q G kl
usw.
(12.140)
Unter Benutzung der Poissonklammern können wir nun die eingangs aufgestellte These, dass die Klammern gegenüber kanonischen Transformationen invariant sind, beweisen. Wenn also ( p, q ) o ( P, Q) eine kanonische Transformation ist, so soll gelten
^ f , g ` P ,Q ^ f , g ` p , q .
(12.141)
Wir formen die linke Klammer wie folgt um:
§ wf wg wf wg · ¸ © i wPi wPi wQi ¹
^ f , g ` P ,Q ¦ ¨ wQ i
wf § wg wqk wg wpk · wf § wg wqk wg wpk · °½ ¸ ¨ ¸¾ ¯ i © k wPi wpk wPi ¹ wPi © wqk wQi wpk wQi ¹ °¿
¦ ® wQ ¨ wq i ,k
wg
§ wf wqk wf wqk © i wPi wPi wQi
¦ ® wq ¦ ¨ wQ k
¯
k
i
wg ¦ wq ^ f , q ` k
k
k
P ,Q
¦ k
· °½ wg § wf wpk wf wpk ¸¾ ¦ ® ¦¨ ¹ ¿° k ¯ wpk i © w Qi wPi wPi wQi
wg ^ f , pk `P ,Q . wpk
· ½° ¸¾ ¹ ¿°
(12.142)
12 Analytische Mechanik
231
Setzen wir hierin f { ql , so folgt mit (12.141)
wg
wg
^ f , g`P ,Q ¦ ^ql , qk ` p ,q ¦ ^ql , pk ` p ,q wq wp k
k
k
k
und unter Verwendung von (12.133)
^ql , g`P ,Q
wg wpl
^ql , g` p ,q
.
(12.143)
Analog ergibt sich mit f { pl in (12.142)
^ pl , g`P ,Q ^ pl , g` p ,q .
(12.144)
Die Gleichungen (12.143) und (12.144) setzen wir in (12.142) ein. Berücksichtigen wir ferner (12.133), so erhalten wir
ª wg § wf · wg wf º ¨ ¸ » ¬« k © wpk ¹ wpk wqk ¼
^ f , g ` P ,Q ¦ « wq k
^ f , g` p , q
.
(12.141)
Dies war zu beweisen. Wir wollen uns nun der Zeitabhängigkeit der Funktionen f(q,p,t) (und g(q,p,t)) zuwenden. Es gilt für ein beliebiges f
df dt
§ wf · wf wf ¦¨ qk p k ¸ wt wpk k © wqk ¹
Unter Beachtung der Hamiltonschen Gleichungen (12.60a/61a) wird daraus
df dt
wf ^ f , H` . wt
(12.145)
Die Größe f könnte z.B. der Drehimpuls oder die Energie des Systems sein. Aus (12.145) folgt, dass eine Größe f Konstante der Bewegung ist, wenn ihre Poissonklammer mit H verschwindet. So erhalten wir für f = H die bereits aus (12.68) bekannte Beziehung
dH dt
wH . wt
232
12 Analytische Mechanik
Ist wH / wt 0 , so folgt H = const. Sind zwei Konstanten der Bewegung bekannt, so lässt sich eine neue Konstante der Bewegung finden. Dieses Ergebnis folgt mit Hilfe der sog. Jacobi-Identität. Sie lautet
^u,^v, w`` ^v,^w, u`` ^w,^u, v``
0.
(12.146)
Hierin sind u, v, w drei differenzierbare Funktionen der (p, q). Der Ausdruck lässt sich durch Ausrechnen der Klammern überprüfen. Sind nun u und v zwei Konstanten der Bewegung und wird w durch die Hamiltonfunktion ersetzt, so verschwinden die beiden ersten Terme und es bleibt
^H ,^u, v``
0.
(12.147)
Die Poisson-Klammer zweier Konstanten der Bewegung mit H ist wieder Konstante der Bewegung. Setzen wir in (12.145) f = pi bzw. f = qi, so erhalten wir die Hamiltonschen Bewegungsgleichungen in der neuen Form
^ p , H` j
wH wq j
^q , H `
p j ;
j
wH wp j
q j .
(12.148)
Beispiel: Drehimpulserhaltungssatz . Wir betrachten einen Massenpunkt, der sich unter dem Einfluss einer Zentralkraft bewegt. Wir setzen voraus, dass die Bahnkurve in einer Ebene liegt, als die wir die xy-Ebene wählen. Der Drehimpuls ist also in kartesischen Koordinaten
G L
G G m ª¬ r u r º¼
eˆ1 eˆ2 m x x
y y
eˆ3 0 0
m( xy yx ) eˆ3 .
(12.149)
Führen wir hier die verallgemeinerten Impulse ein, so wird daraus
G L ( xPy yPx ) eˆ3 .
(12.150)
G Die zeitliche Änderung des Betrages von L ist durch die Poisson-Gleichung
> L, H @ gegeben.
wH wL wH wL wH wL wH wL wq1 wp1 wq2 wp2 wp1 wq1 wp2 wq2
(12.151)
12 Analytische Mechanik
233
Entsprechend dem speziellen Problem ersetzen wir p1,2 und q1,2 durch Px,y und x,y:
wH wL wH wL wH wL wH wL . wx wPx wy wPy wPx wx wPy wy
> L, H @
(12.152)
Einsetzen von (b) ergibt
> L, H @
Px
wH wH wH wH . Py x y wPy wPx wy wx
(12.153)
Die Hamiltonfunktion lautet nach (12.70)
H
1 Px2 Py2 V ( x, y ) 2m
E.
(12.154)
Damit folgt aus (12.153)
> L, H @
x
wV wV . y wy wx
(12.155)
Das Potential ist von der Form
V
V (r ) .
(12.156)
Es ist daher zweckmäßig, in (12.155) zu Polarkoordinaten überzugehen.
x
r cos M ,
y
r sin M .
(12.157)
Bildung der in (12.155) auftretenden Ableitungen ergibt
wV wx
dV wr dr wx
x dV , r dr
wV wy
dV wr dr wy
y dV , r dr
(12.158)
womit aus (12.155) folgt, dass
> L, H @
0
(12.159)
ist. Der Drehimpuls ist also dem Betrage nach konstant.
L const.
(12.160)
234
12 Analytische Mechanik
Da die Bewegung des Massenpunktes in einer Ebene erfolgt, weist der Drehimpuls immer in die gleiche Richtung, in unserem Beispiel in die z-Richtung, Gl. (12.150). Folglich gilt
G L
const eˆz .
(12.161)
Das ist der Drehimpulserhaltungssatz.
Zusammenfassung x Die Euler-Lagrange-Gleichungen lauten
wf d wf wyi dx wyic
Oj
wg j wyi
g j ( yi , x) 0
;
i 1,..., n j 1,..., m
x Die Lagrange-Funktion ist definiert als Differenz von kinetischer und potentieller Energie
L( xk , xk , t ) x
Ekin ( xk ) V ( xk , t )
Sind qi und pi die verallgemeinerten Koordinaten und Impulse, so gilt per Definition
pi
wL . wqi
pi und qi werden als zueinander kanonisch konjugierte Größen bezeichnet. Ist
wL wqi
0,
o pi
const.
Allgemein werden Variable, von denen die Lagrangefunktion nicht explizit abhängt, zyklische Variable genannt. x
Die um die Kräfte ) ci erweiterte Euler-Lagrange-Gleichung lautet
wL d wL wqi dt wqi
)ci .
12 Analytische Mechanik
235
x Die Hamiltonfunktion ist definiert als
¦ p q (q, p, t ) L(q, q (q, p, t ) t )
H ( q , p, t )
i
i
i
x Die Hamilton-Gleichungen lauten
qk
wH ; (k 1,..., n) wpk
p k
wH ; (k 1,..., n) wqk
x Hängt H nicht explizit von der Zeit ab, so gilt mit E als Gesamtenergie des Systems
H ( p, q )
Ekin V
E.
x Die erzeugende Funktion, welche die Hamiltonfunktion H ( pi , qi , t ) in die Form H c( Pi , Qi , t ) 0 überführt, sei mit S S (qi , Pi , t ) bezeichnet. Mit ihr gilt die HamiltonJacobi Differentialgleichung
§ wS · wS ,t ¸ H ¨ qi , © wqi ¹ wt
0.
x Die Poisson-Klammer zu zwei Größen und f (q, p, t ) und g (q, p, t ) ist definiert als
§ wf wg wf wg · ¸. © k wpk wpk wqk ¹
^ f , g` : ¦ ¨ wq k
x Die Zeitabhängigkeit einer Funktion f (q, p, t) ist gegeben durch
wf ^ f , H` . wt
df dt
Daraus folgt, dass f Konstante der Bewegung ist, wenn die Poissonklammer verschwindet. Die Hamiltonschen Gleichungen schreiben sich unter Verwendung der Poissonklammern als
^ p , H` j
wH wq j
p j ;
^q , H ` j
wH wp j
q j .
236
12 Analytische Mechanik
Übungsaufgaben
y
x1
x2 x
l1 m1
y1
l2
y2
1. Stellen Sie die Bewegungsgleichungen des ebenen Doppelpendels (s. Skizze.) in verallgemeinerten Koordinaten mit Hilfe der Lagrangefunktion auf. Wieso ist dieses Verfahren einfacher als die direkte Aufstellung der Gleichungen ?
m2 2. Stellen Sie mit Hilfe der Lagrange-Gleichungen die Bewegungsgleichungen für eine doppelte Atwoodsche Fallmaschine auf. (Skizze) Berechnen Sie die Beschleunigungen der vier Massenpunkte m1, m2, m3, m4 und diskutieren Sie insbesondere den Spezialfall m2 = m3 = m; m4 = 2m; m1 = 4m.
m2
g m1
m3 m4
3. Suchen Sie diejenige in einer senkrecht angeordneten (x,y)-Ebene liegende Kurve zwischen einem gegebenen Anfangspunkt (x1,y1) und einem ebenfalls gegebenen, tiefer gelegenen Endpunkt (x2,y2), auf der ein Massenpunkt die kürzeste Zeit braucht, um vom Anfangspunkt aus zum Endpunkt hin zu fallen (Brachystochrone).
II Thermodynamik Die Energieformen der Mechanik, potentielle und kinetische Energie, werden in der Thermodynamik durch die der thermischen Energie erweitert. In der Mechanik macht sich diese etwa bei Reibungseffekten bemerkbar; dazu gehört auch die Dämpfung von Schwingungsvorgängen. Das sind häufig störende Effekte. Deswegen haben wir sie oft durch die Idealisierung der physikalischen Systeme aus den Überlegungen ausgeschlossen oder uns lediglich auf die mechanischen Vorgänge und deren Beschreibung beschränkt. Andererseits hätte sich Leben ohne genügend thermische Energie in den uns bekannten Formen nicht entwickeln können. Wir sollten dabei unser Denken und Handeln so ausrichten, dass nicht der gegenteilige Effekt eintritt, nämlich eine zu große Erwärmung, wie sie jetzt mahnend vor uns steht. Wir wollen uns jetzt mit dieser Energieform vom Standpunkt der Physik näher beschäftigen. Prinzipiell gibt es zwei Möglichkeiten, uns Kenntnisse anzueignen, nämlich mit den Methoden der phänomenologischen Thermodynamik und der Statistischen Mechanik. Erstere lässt sich auf vier Erfahrungssätzen als Postulaten aufbauen. Sie werden als Hauptsätze bezeichnet. Dabei wird der Zustand eines Systems durch einige wenige Parameter beschrieben, die durch „Zustandsgleichungen“ miteinander verknüpft sind. Die statistische Mechanik geht von der atomaren Struktur der Materie aus und behandelt die Eigenschaften des Vielteilchensystems mit den Methoden der statistischen Physik. In Erweiterung der phänomenologischen Beschreibungsweise liefert sie auch alle Materialgrößen wie etwa die spezifische Wärmekapazität sowie den Temperaturverlauf dieser Größen. Wir werden hier vor allem phänomenologisch vorgehen. Die statistische Behandlungsweise kann nur in ihrer einfachsten Form der kinetischen Gastheorie entwickelt werden, da die physikalischen und die mathematischen Voraussetzungen noch fehlen. Dementsprechend beginnen wir mit der phänomenologischen Beschreibung.
13
Phänomenologische Wärmelehre
13.1
Grundgröße Temperatur
Um quantitative Aussagen über den Wärmeinhalt eines Stoffes machen zu können, benötigen wir eine Möglichkeit, diesen zu messen. Dazu führen wir eine vierte Grundgröße ein, die Temperatur. Eine grobe Temperaturskala ist uns von der Natur bereits in den Sensoren unserer Haut gegeben, mit denen wir zwischen heiß, warm und kalt unterscheiden können. Allerdings ist diese Skala relativ und subjektiv. Sind wir etwa selbst ausgekühlt und kommen in ein beheiztes Zimmer, so empfinden wir dieses im Allgemeinen als wärmer als jemand, der sich darin schon länger aufgehalten hat. Eine objektive Temperaturmessung basiert auf dem nullten Hauptsatz. Er setzt die Kenntnis des Begriffes „thermisches Gleichgewicht“ voraus. Unter dem thermischen Gleichgewicht verstehen wir den Zustand eines abgeschlossenen Systems, der sich nach hinreichend langer Zeit von selbst einstellt und in dem sich die Größen, die den Zustand des makroskopischen Systems charakterisieren, zeitlich nicht mehr ändern. Der auf der Erfahrung beruhende nullte Hauptsatz der Wärmelehre lautet damit:
238
13 Phänomenologische Wärmelehre
Alle Systeme, die mit einem gegebenen System im thermischen Gleichgewicht stehen, befinden sich auch untereinander im thermischen Gleichgewicht. Sie haben also eine Eigenschaft gemeinsam, die wir als Temperatur bezeichnen. Zur Temperaturmessung geeignete Eigenschaften sind u. a. 1. Die thermische Ausdehnung von festen, flüssigen und gasförmigen Stoffen; praktische Ausführungen in der obigen Reihenfolge sind z. B. das Bimetall-Thermometer, das Quecksilber- oder das Alkohol-Thermometer, das Gasthermometer. 2. Das Thermoelement, bei dem sich die sog. Kontaktspannung zwischen zwei sich berührenden unterschiedlichen Metallen mit der Temperatur ändert. 3. Das Widerstandsthermometer, das auf der Änderung des elektrischen Widerstandes eines Metalls oder Halbleiters beruht. 4. Das Strahlungsthermometer (Pyrometer), das auf der Zunahme der Strahlungsleistung eines heißen Körpers mit der Temperatur basiert. Zur Festlegung einer Temperaturskala werden Fixpunkte benötigt. Diese wurden historisch auf unterschiedliche Weise festgelegt. Wir besprechen kurz die Celsius-Skala und die Fahrenheit-Skala. Die Celsius-Skala geht auf den Astronomen gleichen Namens zurück (A. Celsius, 17011744). Nach ihm wird die Temperatur durch die Ausdehnung einer Quecksilber-Säule gemessen. Als Fixpunkte dienten ursprünglich der Schmelzpunkt von Eis (0 °C) sowie der Siedepunkt von Wasser unter Normaldruck (100 °C). Der Bereich zwischen diesen beiden Fixpunkten wurde gleichmäßig in 100 Teile geteilt. Heutzutage wird statt des Eispunktes der Tripelpunkt von Wasser bei 0.01 °C verwendet. Beim Tripelpunkt stehen feste, flüssige und gasförmige Phase miteinander im Gleichgewicht. Die Fahrenheit-Skala ist nach D. G. Fahrenheit (1686-1736) benannt. Er benutzte als unteren Fixpunkt (T = 0 °F) den Schmelzpunkt einer bestimmten Eis-Wasser-AmmoniumchloridKältemischung (TC = -17.8 °C). Als oberer Fixpunkt diente ihm die (leicht erhöhte) Körpertemperatur von T = 37.7 °C. Sie wurde zu 100° F festgesetzt. Die Verknüpfung dieser Skala mit der Celsius-Skala ist also gegeben durch
TC TF
5 (TF (q F ) 32) qC 9 9 ( TC (qC ) 32) q F 5
Die Fahrenheit-Skala ist auch heute noch in den USA gebräuchlich.
(13.1)
13 Phänomenologische Wärmelehre
239
Ein Nachteil des Flüssigkeitsthermometers besteht darin, dass sich Flüssigkeiten verschieden stark ausdehnen. Für ein Alkohol-Thermometer ergibt sich eine andere Temperaturskala als für ein Quecksilberthermometer (Abb. 13.1). Außerdem ist die thermische Ausdehnung über den gesamten Temperaturbereich im Allgemeinen nicht konstant. Zur genaueren Messung
Abb. 13.1: Die Skalen eines Hg-Thermometers und eines Alkohol-Thermometers unterscheiden sich infolge ungleichmäßiger Ausdehnung der Flüssigkeiten voneinander
Hg
100° 90 80 70 60 50 40 30 20 10 0° Alkohol
benötigen wir Thermometer mit einer gleichmäßigen Temperaturskala. Dazu bietet sich z.B. die Änderung des Druckes eines Gases bei konstantem Volumen an. Ein solches Instrument heißt Gasthermometer. Es setzt das Modell eines idealen Gases und damit die Gültigkeit der idealen Gasgleichung voraus. Die Gasteilchen werden als elastische Kugeln betrachtet, deren Abstände groß gegenüber ihrem Durchmesser sind. Mit dem Thermometer können Temperaturen bis hinunter zu ca. 2,5 K gemessen werden. Wir besprechen es weiter unten. Bei noch tieferen Temperaturen treten zu starke Abweichungen vom idealen Gasgesetz auf. Für solche Temperaturen bis zu etwa 1 mK kann das elektrische Rauschen eines stromdurchflossenen Widerstandes zur Messung herangezogen werden (L13.1). Im Bereich weniger mK bis hinab in den μK-Bereich werden nukleare Suszeptibilitätsthermometer verwendet (s. Kap. 19 und L13.1). Dabei erhebt sich natürlich die Frage, warum es erstrebenswert ist, solche niedrigen Temperaturen zu erzeugen und mit welchen Methoden sie erzielt werden können. Diese Fragen lassen sich erst später beantworten. Es sei aber vorweg genommen, dass es sich dabei ebenfalls um spannende Physik handelt. Wir besprechen hier zunächst quantitativ die thermische Ausdehnung fester und flüssiger Körper. Betrachten wir die Länge l eines Stabes. Mit zunehmender Temperatur dehnt er sich aus. Experimentell finden wir
l (tC ) l (0)(1 D tC ) ;
(13.2a)
Die Größe D bezeichnet den linearen Ausdehnungskoeffizienten. Er gibt die relative Längenänderung pro Grad Temperaturänderung an:
D
l (tC ) l (0) . l (0) tC
(13.2b)
240
13 Phänomenologische Wärmelehre
Die Wärmeausdehnung kommt dadurch zustande, dass die Atome mit zunehmender Temperatur stärker ausgelenkt werden.
Festkörper
Aluminium Eisen Kupfer Germanium Diamant Invar
Linearer Ausdehnungskoeff. D/(10-6.K-1) 23,8 12 16,8 6 1,3 1,5
Flüssigkeiten
Äthylalkohol Benzol Toluol Glyzerin Quecksilber Wasser
Räumlicher Ausdehnungskoeff. J/(10-4 K-1) 11,0 10,6 11,1 48 1,8 2,07
Tab. 13.1: Thermischer Ausdehnungskoeffizient einiger Festkörper und Flüssigkeiten zwischen 0 und 100 °C
Wegen ihrer abstoßenden Wechselwirkung erfolgt die Auslenkung aber nicht mehr symmetrisch bez. der Gleichgewichtslage, sondern ein Atom hält sich länger im kernferneren Bereich des Nachbaratoms auf. Im zeitlichen Mittel verschiebt sich der Abstand zu größeren Werten. In Tab. 13.1 sind die Werte von D für einige feste Stoffe zusammengestellt. Der Ausdehnungskoeffizient hängt leicht von der Temperatur ab.
D (tC ) D (0 qC) ßtC .
(13.3a)
Damit ändert sich die Länge entsprechend
l (t ) l0 (1 D 0tC E tC2 )
(3.3b)
Hierin wurden l(0) bzw. D (0) vereinfacht geschrieben als l0 bzw. D 0 . Abb. 13.2a: Bimetall-ThermoWerden zwei Metallstreifen, die einen unterschiedmeter lichen thermischen Ausdehnungskoeffizienten besitzen, bei einer bestimmten Temperatur miteinander fest verbunden, so wird sich ein solcher Bimetallstreifen bei Änderung der Temperatur krümmen. Diese Krümmung ist in guter Näherung proportional zur Temperaturänderung. Wird sie mittels eines Zeigers auf einer Skala sichtbar gemacht, so stellt die Anordnung ein Thermometer dar (Abb. 13.2a). Wir gehen nun zu Gasen über. Das Volumen eines idealen Gases vergrößert sich proportional zur Temperatur.
13 Phänomenologische Wärmelehre
241
V (tC ) V0 (1 J tC ) , Gas
J/(10-3 Grad-1)
Ideales Gas He Ne Ar O2 CO2
3,661 3,661 3,662 3,671 3,672 3,726
Tab. 13.2: Thermischer Ausdehnungskoeffizient einiger Gase
(13.4a)
wobei V0 V (tC 0q) ist. Der Ausdehnungskoeffizient ist analog zu oben definiert als die relative Volumenänderung pro Grad Celsius Temperaturänderung:
J
V (tC ) V0 . V0 tC
(13.4b)
In Tab. 13.2 ist der Ausdehnungskoeffizient für einige Gase aufgelistet. Das Gas, das dem idealem Gas am nächsten kommt, ist Helium. Der Ausdehnungskoeffizient ergibt sich experimentell zu J 1/(273,15 qC) . Für den Gasdruck bei konstantem Volumen liefern
Experimente analog
p
p0 (1 J tC ) .
(13.5)
Diese Beziehung ist unter dem Namen Gay-Lussac-Gesetz (J. L. Gay-Lussac, 1778-1850) bekannt. Die Erhöhung des Druckes mit der Temperatur bei konstantem Volumen wird beim Gasthermometer ausgenutzt. Es besteht aus einem mit Helium gefüllten VKap Behälter als Messsonde (Abb. 13.2b). Er ist über ein Rohr mit einem U-Rohr-Manometer verbunden, dessen H mittlerer Teil aus einem flexiblen Schlauch besteht. Die Höhe des Quecksilberpegels im linken Schenkel wird so eingestellt, dass er genau eine innerhalb des Rohres angebrachte Spitze berührt. Bei Temperaturänderung hat p,V P,p, V V das Gas die Tendenz, sein Volumen zu verändern. Um es konstant zu halten, wird die Höhe des rechten U-Rohr-Schenkels entsprechend verändert. Der jeweilige Druck ergibt sich aus der Höhendifferenz der beiden Quecksilberkuppen; bei offenem Rohr kommt noch der Luftdruck hinzu. Bei sehr genauen Messungen Abb. 13.2b: Gasthermometer muss auch die Ausdehnung des Gasgefäßes berücksichtigt werden. Gasthermometer können in einem weiten Temperaturbereich eingesetzt werden. Es gibt Anordnungen, die, wie bereits erwähnt, Messungen bis hinab zu ca. -270 °C gestatten. Die obere Grenze ist durch die Erweichungstemperatur des Gasbehälters gegeben und liegt damit bei etwa 1000 °C.
242
13 Phänomenologische Wärmelehre
Bisher haben wir zwei Temperaturskalen, nämlich die Celsius-Skala und die FahrenheitSkala, kennen gelernt. In der Physik wird keine der beiden Skalen benutzt, sondern ausschließlich die Kelvin-Skala (W. Thomson (Lord Kelvin), 1824-1907). Sie entsteht durch Verschiebung des Nullpunktes der Celsius-Skala um -273.15 °. Der neue Nullpunkt heißt absoluter Nullpunkt, weil hier nach (13.6) und (13.8) das extrapolierte Volumen und der extrapolierte Druck null werden. Die absolute Temperatur wird mit dem Buchstaben T bezeichnet; ihre Einheit ist das Kelvin (K). Die Skala ist unabhängig vom benutzten Gas des Gasthermometers, vorausgesetzt, es kann als ideales Gas betrachtet werden. Eine vom Arbeitsstoff unabhängige Temperaturskala liefert der zweite Hauptsatz, den wir in Kap.13.6 kennen lernen werden. Sie ist mit der absoluten T-Skala identisch.
13.2
Wärmemenge und spezifische Wärme
Wird einem Körper Energie zugeführt, so steigt im Allgemeinen seine Temperatur. Die Temperaturerhöhung ist proportional zur zugeführten Energie. Der Proportionalitätsfaktor ist die Wärmekapazität C des erwärmten Körpers.
'W
C 'T
c m 'T
(13.6)
Darunter verstehen wir das Produkt aus der spezifischen Wärme c und der Masse m des erwärmten Körpers. Die spez. Wärme ist in unserem Beispiel die zur Erwärmung von 1 kg Wasser von 14,5 °C auf 15,5 °C erforderliche Wärmemenge. Diese Wärmemenge wurde früher als eine große Kalorie definiert. Zur Umrechnung von Wärmeenergie (kcal) in mechanische Energie (Joule) musste das sog. „mechanische Wärmeäquivalent“ bekannt sein. Das Experiment ergibt M. Wäquiv.:
'Q(kcal ) 'Wmech ( J )
4,186 .
(13.7)
Heute wird, wie schon erwähnt, als Einheit der Energie 1 Joule verwendet. Sie ist uns aus der Mechanik wohlbekannt. Die Einheit der spez. Wärme ist Joule/(kgK). Von der Richtigkeit der Beziehung (13.9) können wir uns überzeugen durch Erwärmung von Wasser mit Hilfe eines thermisch isolierten elektrischen Wasserkochers. Die zugeführte elektrische Energie ist durch das Produkt aus elektrischer Spannung, elektrischem Strom und der Zeit gegeben,
'W
U I 't .
Die spez. Wärme eines Körpers cK kann mit Hilfe eines Mischungskalorimeters bestimmt werden. Es besteht aus einem wärmeisolierten doppelwandigen verspiegelten Glasgefäß, dessen Hohlraum evakuiert ist (Abb. 13.3a). Dieser „Dewar“ ist z. T. mit Wasser der Masse m1 und der Temperatur T1 gefüllt. Der interessierende Körper wird zunächst auf eine Temperatur T2 gebracht, die oberhalb T1 liegt. Bringen wir ihn anschließend in das Dewar, so steigt die Temperatur des Wassers bis zur Mischungstemperatur TM, bei der sich die Temperaturen
13 Phänomenologische Wärmelehre
243
angeglichen haben. Von diesem Zeitpunkt an beginnt die Temperatur infolge von Wärmeverlusten langsam zu sinken (Abb. 13.3b).
a)
b)
Rührer T TM Abb. 13.3a: Kalorimeter zur Bestimmung der spezifischen Wärme eines Stoffes 13.3b: Temperaturverlauf vor und nach dem Einbringen des Thermometers in das Kalori- T 1 meter
A2
T - Abfall durch
Wärmeverluste
A1 t
Die vom Körper K abgegebene und die vom Wasser und dem Dewar-Gefäß D aufgenommene Wärmemenge sind gleich. Damit ergibt sich die spezifische Wärme zu
cK
(mW cW CD )(TM T1 ) . mK (T2 TM )
(13.8)
Die Wärmekapazität des Dewars wird bestimmt, indem zwei Wassermengen der Massen m1W und m2W mit den Temperaturen T1 und T2 miteinander gemischt werden und wie oben die Mischungstemperatur ermittelt wird. In Tab. 13.3 sind die spezifischen Wärmen einiger Stoffe zusammengestellt. Den größten Wert aller flüssigen und festen Stoffe besitzt Wasser. Dieses ist daher ein guter Wärmespeicher. Das wirkt sich auch beim Klima aus; die großen Wassermengen der Weltmeere verhindern große Temperaturschwankungen zwischen Tag und Nacht und zwischen den Jahreszeiten. – Für reine Metalle ergibt sich bei Zimmertemperatur oder etwas darüber ein einheitlicher Wert von cV = 3R (Regel von P. L. Dulong (1785-1838) und A. T. Petit (1791-1820)). Der Index „V“ bedeutet, dass bei der Messung das Volumen konstant zu halten ist, wohingegen bei cp der Druck festgehalten wird. Der Unterschied wird weiter unten erklärt, bei Festkörpern ist er klein. Anders dagegen bei Gasen. Am leichtesten ist die spez. Wärme bei konstantem Druck zu messen. Die spez. Wärme aller Stoffe ist am absoluten Nullpunkt null. Der Temperaturverlauf kann quantitativ mit Hilfe der Quantenstatistik erfasst werden.
244
13.3
13 Phänomenologische Wärmelehre
Wärmeleitung
Die Wärmeleitung ist wie die elektrische Leitung und die bereits behandelte Diffusion ein Transportphänomen. Im Unterschied zu den letztgenannten Vorgängen, die mit einem Massetransport verbunden sind, handelt es sich dabei um einen reinen Energietransport. Diesen Fall wollen wir hier etwas näher untersuchen.
13.3.1 Wärmeleitung in festen Stoffen In festen Stoffen nehmen die Atome im Idealkristall feste Gitterpositionen ein. In amorphen Körpern sind sie dagegen regellos angeordnet. In vielen Fällen liegt das Material polykristallin vor, besteht also aus regellos nebeneinander liegenden winzigen Kriställchen. Die Wärmeleitung hat ihren Ursprung in den kollektiven Schwingungen der Atome und in elektrisch leitenden Stoffen auch in der Energieübertragung durch die beweglichen Elektronen. In einem Einkristall kann die Wärmeleitung wie andere Festkörpereigenschaften richtungsabhängig werden. Diesen Fall wollen wir hier ausschließen. Es kann natürlich nicht auf die mikroskopischen Mechanismen für die Wärmeleitung eingegangen werden; dazu werden detaillierte Kenntnisse über Festkörperphysik benötigt. Wir wollen hier vielmehr eine Gleichung ableiten, die es gestattet, bei gegebener Wärmeleitung die entstehende Temperaturverteilung zu berechnen. Wir gehen in zwei Stufen vor. Zunächst sei ein homogener Stab vorgegeben, dessen Enden durch Kontakt mit Wärmereservoirs auf den Temperaturen T1 und T2 < T1 gehalten werden. Dadurch stellt sich nach einer bestimmten Zeit ein stationärer Zustand ein, der durch ein Temperaturgefälle dT/dx charakterisiert ist. Es hängt von der gewählten Temperaturdifferenz der Reservoirs, der Länge des Stabes l und dessen Querschnitt A, sowie einer Materialkonstante O ab, die Wärmeleitzahl heißt. Die durch den Stab fließende Wärmemenge ist
dQ dT
O A
dT . dx
(13.9)
Dieser Zusammenhang entspricht der Diffusionsgleichung (10.43). Infolge der Homogenität des Stabes kann die Gleichung sofort integriert werden. Dadurch ergibt sich die Temperatur an der Stelle x des Stabes zu
T ( x)
dQ / dx x const . OA
(13.10a)
Zur Bestimmung der Konstante und des Differentialkoeffizienten dQ/dx ziehen wir die Randbedingungen T(0) = T1 und T(l) = T2 heran. Damit ergibt sich
T ( x)
T1 T2 x T1 . l
(13.10b)
13 Phänomenologische Wärmelehre
245
Wir wollen jetzt zum allgemeinen Fall einer nichtstationären Wärmeleitung durch inhomogene Körper mit unterschiedlichem Querschnitt übergehen (Abb. 13.4). Dazu betrachten wir ein Volumenelement zwischen den Ebenen x = x1 und x = x2 mit dem Querschnitt TUmgeb A. Existiert nur ein T-Gefälle längs der dQ V x-Richtung, so ist die durch den Körper dt bei x = x1 zu einem bestimmten Zeitpunkt t fließende Wärmemenge T(x 2 ) T(x1 ) analog (13.9)
dQ dT
O A
dQ 2 dt
dQ1 dt
wT . wx
Die partielle Ableitung bringt zum Ausdruck, dass T = T(x,t) ist. Am Ort der Ebene x2 = x1 + dx ist die Temperatur
dQ V dt x1
dx
x2
x
Abb. 13.4: Zur Ableitung der Wärmeleitungsgleichung
wT T ( x2 ) T ( x1 ) dx . wx
Die dort pro Zeiteinheit hindurchtretende Wärmemenge wird damit
dQ2 dt
O A
w § wT · dx ¸ . ¨T wx © wx ¹
Ist die Temperatur bei x1 größer als bei x2, so strömt in das Volumen dV = A dx pro Zeiteinheit die Wärmemenge dQ1/dt hinein und die Wärmemenge dQ2 wieder heraus. Die Energiezunahme in dV beträgt folglich
dQ dt
dQ1 dQ2 dt dt 2 wT O 2 dV . wx
O
w 2T Adx wx 2
Dadurch steigt die Temperatur nach (13.6) um dT = (1/c) dQ, also um
wT wt
O w 2T , U c wx 2
(13.11a)
wobei U die spez. Dichte des Materials ist. Wärmeverluste im Stab durch Abgabe an die Umgebung sind dabei ebenso vernachlässigt wie in (13.10a). Sie können durch einen Verlustterm L = dQV/dt empirisch berücksichtigt werden:
246
13 Phänomenologische Wärmelehre
wT wt
O w 2T L(T TUmgeb ) . U c wx 2
(13.11b)
Im allgemeinsten Fall, in dem die Temperatur auch von y und z abhängt, tritt an Stelle der Ableitung nach x der Laplace-Operator ':
wT wt
O 'T Uc
(13.11c)
Die Beziehung wird als Wärmeleitungsgleichung bezeichnet. In Tab. 13.3 sind die Wärmeleitzahlen einiger Stoffe zusammengestellt.
Stoff
O/W/mK
Aluminium Blei Gold Magnesium Kupfer Silber
236 35 322 157 401 428
Chlorwasserstoff Kohlendioxid Azeton Benzol Essigsäure Glyzerin Olivenöl
0,189 0,087 0,162 0,146 0.161 0,285 0,17
Helium Argon Wasserstoff Sauerstoff
143 103 16 “ 171 “ 24 “
Mörtel Normalbeton Styropor
0,9-1,4 2,1 0,03- 0,045
T/°C 0 0 0 0 0 0 20 20 20 20 20 20 20 0 0 0 0 10 10 20
Tab. 13.3: Wärmeleitzahlen einiger Stoffe
13 Phänomenologische Wärmelehre
247
13.3.2 Wärmeleitung in Flüssigkeiten und Gasen In Flüssigkeiten ist die Kopplung benachbarter Atome erheblich kleiner als in Festkörpern, in Gasen existiert eine solche überhaupt nicht; Als Folge davon gibt es keine Scherkräfte. Damit kann sich eine lokale Überhitzung nur in Form von Longitudinalwellen ausbreiten. Die Wärmeleitung in nicht elektrisch leitenden Flüssigkeiten und Gasen ist daher im Allgemeinen kleiner. Bei Gasen bewirkt deren geringe Dichte eine weitere Reduzierung. Bei elektrisch leitenden Flüssigkeiten wie in Quecksilber und geschmolzenen Metallen dominieren die nahezu freien Elektronen die Wärmeleitung. Der Beitrag der Ionen kann daher wegen ihrer großen Masse vernachlässigt werden. Neben der Wärmeleitung kann eine Energieübertragung auch durch Konvektion auftreten. Diese wächst umgekehrt proportional zur Wurzel aus der Masse. Das kann im Experiment qualitativ durch Anlegung einer Spannung an einen Wolfram-Draht gezeigt werden, der zwei hintereinander angeordnete Glaszylinder mit unterschiedlichen Molekülen unter gleichem Druck durchzieht. Je größer der Massenunterschied ist, desto unterschiedlich hell glüht der Faden in den beiden Zylindern.
13.4
Zustandsgrößen und Zustandsgleichungen
In Kap. 13.1 hatten wir thermisches Gleichgewicht definiert. Unter diesem verstehen wir den Zustand eines abgeschlossenen Systems, in dem sich die Größen, die den Zustand des makroskopischen Systems charakterisieren, zeitlich konstant sind. Ein solches System heißt stationär. Die betreffenden Größen zur Charakterisierung des Systems werden als Zustandsgrößen bezeichnet. Wir unterscheiden extensive und intensive Zustandsgrößen (Quantitätsund Qualitätsgrößen). Erstere addieren sich bei der Zusammensetzung von Systemen, sie sind mengenproportional; intensive Zustandsgrößen sind mengenunabhängig. Betrachten wir etwa ein abgeschlossenes System eines idealen Gases. Der Gleichgewichtszustand wird durch die extensitiven Zustandsgrößen Volumen V, Druck p und Temperatur T festgelegt. Das Produkt aus Volumen V und Druck p ist proportional zur absoluten Temperatur T. Die Proportionalitätskonstante wird mit R bezeichnet und heißt allgemeine Gaskonstante. A. Avogadro (1776-1856) hat zum ersten Mal die Hypothese aufgestellt, dass R nur von der Zahl und nicht von der Art des Gases abhängt. Für ein Mol eines Gases hat sie den Wert R = 8,31 Joule/Grad (ein Mol ist die Menge eines Gases in Gramm, welche das Molekulargewicht angibt). Die so entstandene Beziehung heißt Zustandsgleichung des idealen Gases oder kurz allgemeine Gasgleichung. Sie lautet für 1 Mol bzw. Q Mole
pV
RT
pV Q RT
(13.12)
und ist in Abb. 13.5 dargestellt. Der Faktor Q ist ein Beispiel für eine intensive Zustandsgröße.
248
13 Phänomenologische Wärmelehre
p/bar 90
p
T=320 K Tkr=304.2 K
70
T=285 K
T2
50
T1
A B T=273.15 K
30 V Abb. 13.5: Isothermen im pV-Diagramm pV-Diagramm
1.0
3.0
5.0 V/ 10-4
m3 mol
Abb. 13.6: Van der Waals Isothermen im
Auch für reale Gase gibt es eine Zustandsgleichung. CO2 ist z.B. ein solches Gas. Wird es bei konstanter Temperatur komprimiert, so verhält sich der Druck zunächst ähnlich wie für ein ideales Gas. Bei weiterer Volumenverkleinerung verflüssigt sich das Gas, der Druck bleibt konstant. Nach Abschluss der Verflüssigung steigt er wegen der geringen Komprimierbarkeit von Flüssigkeiten steil an. Die Messergebnisse werden gut durch die van-der-Waalssche Zustandsgleichung wiedergegeben (J. D. van der Waals, 1837-1923). Sie lautet
(p
Q 2a V2
) (V Q b) Q RT
(13.13a)
Die Größen a und b sind Konstanten, die von dem betreffenden Gas abhängen. Der erste Term heißt Binnendruck; er berücksichtigt die kurzreichweitigen Kräfte zwischen den Atomen bzw. Molekülen. Da durch sie die Moleküle eine anziehende Kraft erfahren, wirkt der Term wie ein zusätzlicher äußerer Druck. Die Konstante b berücksichtigt das Eigenvolumen va der NA Moleküle eines Mols. Sie ergibt sich zu b 4 N A va . Stellen wir die Gleichung grafisch dar, so erhalten wir den in Abb. 13.6 skizzierten Verlauf. Er gibt den Druck als Funktion des Volumens in der rein gasförmigen wie in der rein flüssigen Phase gut wieder. Dagegen nimmt sie zwischen diesen Phasen einen wellenförmigen Verlauf, beschreibt also nicht die Koexistenz von gasförmiger und flüssiger Phase, die experimentell durch eine Gerade AB (p = const.) wiedergegeben wird. Wir werden weiter unten sehen, dass die Gerade so verläuft, dass die beiden schraffierten Bereiche die gleiche Fläche haben (Maxwell-Gerade). Wir benötigen dazu den ersten und zweiten Hauptsatz. Am kritischen Punkt verschwinden die beiden Extrema gerade. Wird die Temperatur immer weiter erhöht, so wird der Bereich, in dem gasförmige und flüssige Phase nebeneinander existieren, immer kleiner, bis bei einer kritischen Temperatur Tk eine Verflüssigung nicht mehr möglich ist. Der Grund liegt in der hohen kinetischen Energie
13 Phänomenologische Wärmelehre
249
der Gasmoleküle, welche über die anziehende Wechselwirkung zwischen den Molekülen dominiert. Die van-der-Waals-Gleichung weist statt eines Minimums eine horizontale Wendetangente auf, d.h. es gilt
§ wp · ¨ ¸ © wV ¹Tk ,Vk
§ w2 p · 0 und ¨ 2 ¸ © wV ¹Tk ,Vk
0.
(13.14)
Mit Hilfe dieser Bedingungen lassen sich die Konstanten a, b auf messbare Größen zurückführen.
a 3 pkVk2 ; und b
1 Vk . 3
(13.15)
Übersättigung und Siedeverzug Kleine Stücke der van-der-Waalsschen „S“-Kurve können bei geeigneten Versuchsbedingungen durchaus durchlaufen werden. Die Kondensation des Gases bei B benötigt Keime, an denen sie beginnen kann. Fehlen solche auf Grund großer Reinheit des Gases, so wird die Kondensation verzögert; der Druck steigt weiter an, das Gas ist übersättigt. Gibt man Kondensationskeime in das übersättigte Gas, so tritt die Kondensation schlagartig ein. Dieses Phänomen wird bei der Wilsonschen Nebelkammer ausgenutzt. Die sog. Kondensstreifen hoch fliegender Flugzeuge beruhen ebenfalls auf dem plötzlichen Einsetzen der Kondensation des unterkühlten Wasserdampfes. Eine Übersättigung kann auch entstehen, wenn die Temperatur eines reinen Gases an der Grenze des Koexistenzbereiches kontinuierlich abgesenkt wird. Wir sprechen von einer Unterkühlung des Gases. Analoge Phänomene treten am Punkt A des Zustandsdiagramms auf. Fehlen Erstarrungskerne, so lässt sich z.B. Wasser bis ca. 10° C unter den Gefrierpunkt abkühlen, ohne dass es zu Eis wird. In Wolken sind Unterkühlungstemperaturen bis zu ca. –80° C gemessen worden. Durch die Einführung reduzierter Größen pred = p/pk, Vred = V/Vk und Tred = T/Tk lässt sich die van-der-Waals-Gleichung in einer Form schreiben, die keine Materialkonstanten mehr enthält und daher für alle Substanzen gelten sollte.
§ 3 ¨ pred 2 Vred ©
· ¸ (3Vred 1) 8Q Tred . ¹
(13.13b)
Befinden sich zwei Substanzen in Zuständen mit den gleichen (pred, Vred und Tred) –Werten, so werden diese korrespondierende Zustände genannt. Die van-der-Waals-Gleichung stellt also zur Beschreibung realer Gase eine wesentliche Verbesserung gegenüber der idealen Zustandsgleichung dar, wenn sie auch durch die MaxwellGerade korrigiert werden muss. Für nicht zu hohe Drucke lässt sich (13.13a) ersetzen durch die Beziehung
250
13 Phänomenologische Wärmelehre
pV
RT B (T ) p; mit
B (T ) b
a ; RT
(13.13c)
Diese Gleichung ist ein Spezialfall einer Reihenentwicklung nach der Teilchendichte N/V, die sich aus der Taylorentwicklung von U(p,V,N)/N und p(T,V,N) nach N/V ableiten lässt.
p
N k BT V
2 ° ½° §N· §N· ®1 B1 ¨ ¸ B2 ¨ ¸ ...¾ . ©V ¹ ©V ¹ °¯ °¿
(13.16)
Die Größen Bi heißen Virialkoeffizienten; sie drücken die Abweichung vom Verhalten des idealen Gases aus. Wir beschränken uns hier auf die Verifikation von (13.13c). Dazu schreiben wir die auf 1 Mol bezogene van-der-Waals-Gleichung in der Form
§ a ·§ b· pv ¨1 1 ¸ 2 ¸¨ pV ¹ © V ¹ ©
RT ;
Daraus folgt für kleine Dichten
pV
§ a ·§ b· 1 ¸ ¨1 2 ¸¨ pV ¹ © V ¹ © § a ·1½ RT ®1 ¨ b ¸ ¾ RT ¹ V ¿ ¯ ©
a § RT ¨ b RT ©
· ¸ p. ¹
Terme, die proportional p2 sind, wurden vernachlässigt.
13.5 Einbeziehung der Wärmeenergie in den Energieerhaltungssatz: Der erste Hauptsatz Die phänomenologische Thermodynamik basiert auf vier Hauptsätzen. Das sind wie die Newtonschen Axiome Erfahrungssätze, die sich also nicht beweisen lassen. Der nullte Hauptsatz wurde später eingeführt als die anderen. Da er die Grundlage zur TemperaturMessung darstellt, die zu Anfang der Wärmelehre eingeführt werden muss, erhielt er zwangsläufig die Nummer „null“. Der erste Hauptsatz erweitert den Energiesatz der Mechanik durch die Einbeziehung der Wärmeenergie. Zunächst ordnen wir jedem thermodynamischen System eine innere Energie U zu. Ein solches geschlossenes System kann mit der Umgebung mechanische Energie oder Wärmeenergie austauschen. Für offene Systeme ist ferner eine Teilchenänderung möglich, womit eine zusätzliche Energieänderung verbunden ist (Teilchenzufuhr-Energie, z.B. Änderung der Bindungsenergie). Wir vereinbaren, dass vom System aufgenommene Energien
13 Phänomenologische Wärmelehre
251
positiv gezählt werden, abgegebene negativ. Der erste Hauptsatz lautet dann für offene Systeme
'U
'Q 'W 'EN
(13.17)
Die Zunahme der inneren Energie eines Systems ist gleich der Summe der ihm von außen zugeführten Wärmeenergie, der an ihm verrichteten Arbeit sowie der Teilchenzufuhr-Energie. Da der erste Hauptsatz „nur“ ein Erfahrungssatz ist, hat es immer wieder Menschen gegeben, die versucht haben, eine periodisch arbeitende Maschine zu konstruieren, die mehr Energie liefert, als sie verbraucht. Ein solches perpetuum mobile erster Art ist aber unmöglich, da es den Energieerhaltungssatz verletzt.
13.6 Anwendungen des ersten Hauptsatzes auf einphasige Einkomponentensysteme (ideale Gase) Wir wollen nun den ersten Hauptsatz auf ideale Gase anwenden. Dazu ist es zweckmäßig, von endlich großen Energiebeträgen auf infinitesimale Größen überzugehen. Es gilt D
dU
G Q G W ¦ Pi dN i
(13.18)
i 1
Hierin bedeutet μi das chemische Potential. Das ist die Energie, die bei G W G Q 0 benötigt wird, um dem System ein zusätzliches Teilchen der Sorte i hinzuzufügen. Die innere Energie ist eine Zustandsgröße; denken wir uns einen beliebigen Prozess im pV-Diagramm aus, der schließlich wieder auf den ursprünglichen Zustand zurückführt (und deswegen als Kreisprozess bezeichnet wird) (Abb. 13.7), so gilt 2
1
³ dU ³ dU v³ dU 1
2
0.
(13.19a)
C
Damit ist dU ein totales Differential:
dU
§ wU · § wU · ¨ ¸ dp ¨ ¸ dV . © wV ¹ p © wp ¹V
(13.19b)
Das Linienintegral von dU über eine geschlossene Kurve C ist null. Der benutzte Weg ist dabei völlig beliebig. Dagegen sind Q und W vom durchlaufenen Weg abhängig. Führen wir einem
252
13 Phänomenologische Wärmelehre
System etwa eine bestimmte Wärmemenge zu, so kann diese auf unterschiedliche Weise zur Arbeitsverrichtung und zur Erhöhung der inneren Energie verwendet werden. Der Zustand des Systems ist also nicht eindeutig p festgelegt. Q und W sind demnach keine P2 Zustandsgrößen, deswegen benutzen wir zur (1) Darstellung infinitesimal kleiner Beträge den Buchstaben „ G “. (2) Es seien zunächst geschlossene Systeme vorausgesetzt. Wir wollen vier Typen von Zustandsänderungen mit einem idealen Gas P1 beschreiben. Dazu stellen wir uns eine VerV suchsanordnung vor, die aus einem zylinAbb. 13.7: Kreisprozess im pV-Diagramm, drischen Behälter besteht, der oben mit einem bestehend aus den Teilwegen (1) von P1 beweglichen Kolben abgeschlossen ist. In dem nach P2 und (2) von P2 zurück nach P1 Behälter möge sich 1 Mol Gas befinden.
13.6.1 Isochore Prozesse (V = const.) Wir arretieren den Kolben, so dass das Volumen konstant bleibt. Es folgt dann aus (13.6) und (13.18)
G Q dU
cmol ,V dT .
(13.20)
Die gesamte zugeführte Wärme wird zur Vergrößerung der inneren Energie verwendet. Die molare Wärmekapazität lässt sich damit schreiben als
Cmol ,V
§ wU · ¨ ¸ . © wT ¹V
(13.21)
13.6.2 Isobare Prozesse (p = const.) Wird der Druck konstant gehalten, so wird sich das Gas ausdehnen, d.h. es verrichtet Arbeit.
GW
pdV .
(13.22)
Setzen wir das in den ersten Hauptsatz ein, so erhalten wir
G Q dU pdV
Cmol , p dT .
(13.23)
13 Phänomenologische Wärmelehre
253
Wir führen eine neue Größe ein, die Enthalpie H:
H : U pV .
(13.24)
Differentiation ergibt
dU pdV V dp .
dH
(13.25)
In den ersten Hauptsatz eingeführt, liefert für isobare Prozesse (dp = 0)
GQ .
dU pdV
dH
(13.26)
Bei isobaren Prozessen ist die von außen zugeführte Wärme gleich der Enthalpiezunahme des idealen Gases. Die molare Wärmekapazität wird
§ wH · ¨ ¸ . © wT ¹ p
Cmol , p
(13.27)
Sie ist größer als Cmol,V, da die zugeführte Wärme nicht nur zur Erhöhung der inneren Energie und damit zur Temperaturerhöhung benutzt werden kann, sondern auch zur Arbeitsverrichtung benötigt wird. Das zeigt auch eine andere oft benutzte Beziehung zwischen Cmol,p und Cmol,V, die wir jetzt ableiten wollen. Dazu ersetzen wir in (13.26) dU durch Cmol ,V dT und erhalten
Cmol , p dT
Cmol ,V dT pdV .
(13.28)
Ausklammern von dT und Benutzung der allgemeinen Gasgleichung ergibt
Cmol , p Cmol ,V
R.
(13.29)
13.6.3 Isotherme Prozesse (T = const.) Die innere Energie eines idealen Gases hängt per definitionem nur von der Temperatur ab, nicht aber vom Druck, unter dem es steht, und dem Volumen, das es einnimmt. Experimentell wird das durch den sog. Überströmungsversuch von Gay-Lussac sichergestellt. Daraus folgt
dU
0,
(13.30)
und damit aus Gl. (13.18)
GQ
pdV .
(13.31)
254
13 Phänomenologische Wärmelehre
Die gesamte zugeführte Wärme wird in Arbeit verwandelt, die nach außen abgegeben wird. Die Zustandsgleichung des idealen Gases geht in das Boyle-Mariottesche Gesetz (Boyle, R. 1627-1691; Mariotte, E. 1620-1684) über.
p V
const.
(13.32)
Wie schon früher ausgeführt, bilden in einem pV-Diagramm die Kurven konstanter Temperatur Hyperbeln. Sie heißen Isothermen. Für praktische Zwecke müssen wir von der infinitesimal kleinen Arbeitsleistung des Gases zu der Arbeit übergehen, die das Gas bei der Volumenvergrößerung von V1 zu V2 verrichtet. Diese ergibt sich durch Integration zu V2
W
³
V2
dV V V1
R T ³
p dV
V1
R T ln
V2 V!
R T ln
V1 V2
(13.33)
13.6.4 Adiabatische Prozesse (GQ = 0) Unter adiabatischen Prozessen verstehen wir Zustandsänderungen ohne Wärmeaustausch mit der Umgebung. Entweder muss also das System gut Wärme isoliert sein oder die Prozesse müssen so schnell verlaufen, dass keine Wärme ausgetauscht werden kann. Beispiele sind Fahrrad-Luftpumpe oder Kühlschrank. Auch Luftströmungen in der Erdatmosphäre verlaufen häufig adiabatisch. Mit G Q = 0 lautet der 1. Hauptsatz
0 dU pdV
Cmol ,V dT
RT dV V
(13.34)
Sortieren nach T und V ergibt die Beziehung
Cmol ,V
dT T
R
dV . V
(13.35)
Deren Integration führt auf
Cmol ,V ln T
§ CR ln T ln ¨ V mol ,V ¨ © wobei R
R ln V const.
· § CR ¸ const o ln ¨ TV mol ,V ¸ ¨ ¹ ©
Cmol , p Cmol ,V benutzt wurde.
(13.36)
· ¸ const o TV ¸ ¹
Cmol , p Cmol ,V Cmol ,V
const . (13.37/38)
13 Phänomenologische Wärmelehre
255
Den Exponenten bezeichnen wir mit N , so dass sich ergibt
TV N 1
N:
const.
Cmol , p
cp
Cmol ,V
cV
.
(13.39a)
Durch Anwendung der allgemeinen Gasgleichung lässt sich T durch p ersetzen.
pV N
const. .
(13.39b)
Eine weitere Beziehung folgt für das Variablen-Paar p,T: 1
Tp
N
1
const. .
(13.39c)
Die drei Gleichungen heißen Poisson-Gleichungen (D. Poisson, 1781-1840) oder Adiabatengleichungen. Vergleichen wir die zweite Gleichung mit dem Boyle-Mariotteschen Gesetz, so erkennen wir, dass die Adiabaten steiler als die Isothermen verlaufen (Abb. 13.8); die Größe „ N “ ist stets positiv.
p
pV= const pV 5/3 = const V Abb. 13.8: Verlauf einer Adiabate und einer Isotherme im pV-Diagramm
Abb. 13.9: Aufbau zum Beweis der Unabhängigkeit der inneren Energie vom Volumen bei einem idealen Gas aa
Zum Schluss erläutern wir den Versuch von Gay-Lussac. Die Versuchsanordnung besteht aus zwei thermisch isolierten Gefäßen (z.B. Stahlflaschen), die durch ein Rohr, das zunächst in der Mitte durch einen Absperrhahn verschlossen ist, miteinander verbunden sind (Abb. 13.9). Das linke Gefäß ist mit einem dem idealen Gas nahekommenden Gas, z.B. Argon, gefüllt; der andere Behälter ist evakuiert. Wird der Hahn geöffnet, strömt Gas aus dem linken in den rechten Behälter. Da dort der Druck null ist, leistet das Gas insgesamt keine Arbeit. Zwar entsteht Beschleunigungsarbeit, die kinetische Energie wird aber im rechten Behälter durch
256
13 Phänomenologische Wärmelehre
Stöße an den Wänden zurückgewonnen. Die zur Expansion notwendige Energie entnimmt das Gas den Wänden des linken Behälters, die Temperatur sinkt um 'T1 ; rechts steigt sie um 'T2 . Experimentell ergibt sich 'T1 'T2 . Insgesamt hat das Gas also keine thermische Energie aufgenommen. Da sowohl G W als auch G Q null sind, folgt aus dem ersten Hauptsatz, dass die innere Energie des Gases nach dem Überströmungsvorgang die Gleiche ist wie die vor Beginn des Versuches; wir können also schließen, dass die innere Energie unabhängig vom Volumen ist.
§ wU · ¨ ¸ © wV ¹T
13.7
0.
(13.40)
Verwandelbarkeit von Wärme in Arbeit: Der zweite Hauptsatz
13.7.1 Reversible und irreversible Prozesse Der erste Hauptsatz erweitert den Energieerhaltungssatz der Mechanik um die Wärmeenergie. Während potentielle und kinetische Energie beliebig ineinander umgewandelt werden können, ist eine uneingeschränkte Verwandelbarkeit von Wärme in andere Energieformen nicht möglich. Es gibt “sogar” Prozesse, die nach unserer Erfahrung nur in einer Richtung verlaufen. Beispielsweise kann potentielle Energie in Wärme (und Verformungsenergie) umgewandelt werden (etwa wenn ein Ziegel vom Dach fällt), aber der umgekehrte Vorgang, also die Anhebung des Ziegels unter der alleinigen Abkühlung des Erdbodens ist nie beobachtet worden. Ein anderes Beispiel wäre die Abkühlung eines Pendels, das sich dadurch in Schwingung versetzte. Der umgekehrte Vorgang ist ganz alltäglich: Ein Federpendel verliert durch Reibung an mechanischer Energie und erwärmt dabei die Feder. Schließlich sei noch an die Wärmeleitung in einem Stab erinnert, die stets vom wärmeren zum kühleren Ende hin erfolgt. Niemals ist der umgekehrte Prozess beobachtet worden, also die alleinige Abkühlung eines Stabendes und der Erwärmung des anderen Endes. Dies ist bedauerlich, denn anderenfalls könnten wir eine periodisch arbeitende Maschine konstruieren (perpetuum mobile zweiter Art), die nichts anderes bewirkt als die Leistung mechanischer Arbeit unter alleiniger Abkühlung eines Wärmereservoirs (Weltmeere). Nicht umkehrbare Prozesse werden irreversibel genannt, wohin gegen umkehrbare reversibel heißen. Letztere sind nur als Idealisierung irreversibler Prozesse anzusehen. Trotzdem sind sie als Gedanken-Experiment von großer Wichtigkeit, wie wir gleich sehen werden. Ein reversibler Prozess wäre etwa der Schwingungsvorgang eines ungedämpften Pendels.
13 Phänomenologische Wärmelehre
257
13.7.2 Der Carnotsche Kreisprozess Ein weiterer reversibler Prozess ist der Carnotsche Kreisprozess. Er bildet die Grundlage einer idealisierten Wärmekraftmaschine. Der Kreisprozess ist aus dem in Abb. 13.10 dargestellten pV-Diagramm ersichtlich. Er möge mit 1 Mol eines idealen Gases geführt werden. Ist der Motor in Betrieb, so ändert sich das Gasvolumen periodisch. Im Zustand (p1,V1) ist das Gas in thermischem Kontakt mit einem Wärmebad der Temperatur T1. Das Volumen vergrößert sich isotherm von V1 auf V2. Dabei fließt die Wärmemenge Q1 aus dem Wärmebad in das Gas. Im p Zustand (p2,V2) wird die Wärmezufuhr unterbrochen. Das Gas dehnt sich adiabatisch weiter aus bis zum 1 Zustand (p3,V3); es kühlt sich dabei von T1 auf T2 ab. Jetzt wird es in thermischen Kontakt mit einem 2 Kühlbad der Temperatur T2 gebracht (T2 < T1) und isotherm von V3 auf V4 komprimiert. Dabei strömt die 4 Wärmemenge Q2 aus dem Gas in das Kühlbad. Im 3 Zustand (p4,V4) wird der Kontakt zum Kühlbad gelöst und das Gas in einem vierten Schritt adiabatisch in V den Ausgangszustand zurückgebracht. Die pro Zyklus gewonnene Arbeit ist durch die Fläche zwischen den Abb. 13.10: Carnotscher Kreisbeiden Isothermen und Adiabaten gegeben. prozess
W
v³
pdV .
(13.41)
1o1
Den Quotienten aus der abgegebenen Arbeit (W < 0) und der dem Wärmebad entnommenen Wärmemenge Q1 (Q1 > 0) wird als Wirkungsgrad K des Kreisprozesses bezeichnet.
K
W . Q1
(13.42)
Zur Berechnung des Wirkungsgrades benötigen wir die verrichtete Arbeit. Für die isotherme Zustandsänderung V1 o V2 wird diese V2
W1o2
³
V2
pdV
V1
dV V V1
RT1 ³
RT1 ln
V2 . V1
(13.43)
Entsprechend finden wir für die isotherme Zustandsänderung V3 o V4
W3o4
RT2 ln
V4 . V3
(13.44)
258
13 Phänomenologische Wärmelehre
Die Arbeitsanteile entlang der Adiabaten sind entgegengesetzt gleich und liefern daher keinen Nettobeitrag zur Arbeit des Kreisprozesses:
W2o3
cmol ,V (T1 T2 ) W4o1
cmol ,V (T1 T2 ) .
(13.45)
Also ergibt sich für die vom Kreisprozess verrichtete Arbeit
W
W1o2 W3o4
RT1 ln
V2 V RT2 ln 4 . V1 V3
(13.46)
Für die adiabatischen Prozesse 2 o 3 und 4 o 1 gilt N 1 TV T2V3N 1 1 2
(13.47)
N 1 TV T2V4N 1 . 1 1
Durch Division der beiden Gleichungen folgt
V1 V2
V4 V o ln 1 V3 V2
ln
V4 . V3
(13.48)
Einsetzen in (13.46) ergibt unter Berücksichtigung von ln (V1 / V2 )
W
R (T2 T1 ) ln
V2 . V1
ln (V2 / V1 )
(13.49)
Da T2 < T1, ist dieser Ausdruck kleiner null; die Maschine verrichtet Arbeit. Die dem System zugeführte Wärmemenge folgt aus dem ersten Hauptsatz zu
G Q1
dU pdV
Cmol ,V dT pdV .
(13.50)
Die Temperatur längs der Isothermen 1 o 2 ist konstant; daher folgt durch Ausdrücken von p durch die allgemeine Gasgleichung
RT1 dV . V
G Q1
(13.51)
Damit erhalten wir für den Wirkungsgrad K
K
W Q1
R (T2 T1 ) ln V2 / V1 RT1 ln V2 / V
1
T2 . T1
13 Phänomenologische Wärmelehre
K 1
259
T2 . T1
(13.52)
Der Wirkungsgrad des Carnotschen Kreisprozesses hängt nur von der Temperatur der beiden Wärmebäder ab. K wird umso größer, je höher die Temperatur T1 desjenigen Wärmebades gewählt werden kann, aus dem der Kreisprozess Wärme bezieht und je kleiner die Temperatur T2 des Kühlbades ist, in das Wärme abgegeben wird. Es ist aber unmöglich, die gesamte aufgenommene Wärmemenge in Arbeit zu verwandeln. Dafür steht nur der Bruchteil T1 T2 / T1 zur Verfügung. Z.B. beträgt der Wirkungsgrad einer Carnot-Maschine, die mit Wärmereservoirs von Wasser bei 0 °C und 10 °C arbeitet, nur 27 %. Der Carnot-Prozess kann auch umgekehrt durchlaufen werden. Wir können Arbeit von außen in das System hineinstecken, indem wir das Schwungrad des Motors in Drehung versetzen. Dabei kühlt sich das Kühlbad ab und das Wärmebad wird aufgeheizt. Nutzen wir den Kühleffekt aus, so führt das zum Prinzip der Kältemaschine, nutzen wir den Erwärmungseffekt aus, so bringt uns das zum Prinzip der Wärmepumpe. Der Wirkungsgrad des Carnot-Prozesses ist T1 unabhängig von der Arbeitssubstanz. Das lässt sich bereits aus der alleinigen Temperaturabhängigkeit von K folgern, es kann aber auch ganz allgemein Q 1A - Q1B gezeigt werden: Gegeben seien zwei Carnot-Maschinen, die zwischen zwei gemeinsamen WärmeWB speichern laufen (Abb. 13.11). Die ArbeitssubstanA B (WA - WB ) zen seien verschieden. Angenommen, sie hätten verschiedene Wirkungsgrade, z.B. Maschine A hätte den größeren Wirkungsgrad. Wir betreiben A als - Q2A Q2B Kraftmaschine und B als Kältemaschine. A entnimmt bei jedem Zyklus die Wärmemenge Q1A aus dem Wärmebad 1. Sie erzeugt die Arbeit T2 < T1 - WA K A Q1 A und gibt die Wärmemenge - Q2 A an das Bad 2 ab. B entnimmt Q2B aus Bad 2, nimmt die Arbeit WB auf und liefert die Wärmemenge Abb. 13.11: Zum Beweis der UnmögQ1B WB / K B an Bad 1 ab. Q1B und Q1A seien so lichkeit eines perpetuum mobile zweidosiert, dass sie gleich sind. Da K A ! K B ist, ist die ter Art Arbeit WB, die B verbraucht, kleiner als die Arbeit WA, die A erzeugt. Das Fazit ist, dass allein der Wärmespeicher 2 abgekühlt wird. Das aber wäre ein perpetuum mobile 2. Art, das es nicht gibt. Folglich ist die oben aufgestellte Hypothese, dass der Wirkungsgrad von der Arbeitssubstanz abhängt, falsch. Q 1A
260
13 Phänomenologische Wärmelehre
13.7.3 Der Otto-Motor In Abb. 13.12 ist die Wirkungsweise eines Viertakt-Benzin-Motors dargestellt. Wie aus Abb. 13.12a zu ersehen ist, bewegt sich der Kolben während eines Zyklus zweimal nach unten und nach oben, daher der Name. Während der Phase (a) wird das Benzin-Luftgemisch durch das Ansaugventil in den Zylinder gezogen und in der Phase (b) adiabatisch komprimiert. Im Zustand der höchsten Verdichtung (c) erfolgt die Zündung. Dadurch steigt der Druck nahezu instantan an. Das Gas wird anschließend adiabatisch expandiert (d) und während der Phase (e) durch das geöffnete Auslassventil aus dem Zylinder gedrückt, wobei der Druck schnell abfällt. Das pV-Diagramm des Kreisprozesses ist in Abb. 13.12b gezeigt. Der Wirkungsgrad des Motors ergibt sich aus
K
W . Qab
(13.53)
Darin ist W die vom Motor während eines Zyklus geleistete Arbeit (W < 0). Qab ist die vom Gasgemisch freigesetzte Verbrennungswärme. W setzt sich aus zwei Beiträgen zusammen: V1
W
W12 W34
³
V2
pdV
V2
³ pdV .
(13.54
V1
Der Druck lässt sich mittels (13.39b) eliminieren. Es ergibt sich
W
p V ° § V · b 1 ®1 ¨ 1 ¸ N 1 ° © V2 ¹ ¯
N 1
½° p V ° § V ·N 1 ½° a 1 1 ¾ ®1 ¨ ¸ ¾ N 1 V ¿° ¯° © 2 ¹ ¿° N 1
( p pa )V1 ° § V1 · b ®1 ¨ ¸ N 1 ° © V2 ¹ ¯
½° ¾ °¿
(13.55a)
Mit Hilfe der allgemeinen Zustandsgleichung und der Definition von R lässt sich dies umschreiben in
W
R (Tb Ta ) (c p cV ) / cV
° § V ·N 1 ½° ° § V ·N 1 ½° 1 1 ®1 ¨ ¸ ¾ CV (Tb Ta ) ®1 ¨ ¸ ¾ V V °¯ © 2 ¹ °¿ °¯ © 2 ¹ °¿
(13.55b)
Die Verbrennungswärme ist
Qab
CV (Tb Ta ) .
(13.56)
13 Phänomenologische Wärmelehre
261
Einlass des Benzin-LuftGemischs
Kompression
Zündung
Expansion des heißen Gases
Entleeren des Zylinders
ef
fa
a
bc
cd
p
b a c e V2
f
Abb. 13.12: Funktionsweise des ViertaktOtto-Motors
d
V1 V
Damit erhalten wir für den Wirkungsgrad N 1
§V · K 1 ¨ 1 ¸ © V2 ¹
.
(13.57)
Der Wirkungsgrad ist also umso höher, desto größer das Kompressionsverhältnis ist. Wählen wir als Beispiel V1/V2 = 8/1, so folgt K = 0,56. Es muss aber einschränkend gesagt werden, dass die praktisch erreichbaren Wirkungsgrade wegen der auftretenden Verluste nur etwa halb so groß sind wie nach (13.57) zu erwarten ist.
262
13 Phänomenologische Wärmelehre
13.7.4 Der zweite Hauptsatz Es gibt verschiedene gleichwertige Formulierungen des zweiten Hauptsatzes. Eine haben wir in Gestalt der Unmöglichkeit des perpetuum mobiles 2. Art bereits kennen gelernt: Als Fazit der Kältemaschine erhalten wir Es ist unmöglich, eine periodisch arbeitende Maschine zu bauen, die lediglich dauernd einem Körper Wärme entzieht und diese vollständig in mechanische Arbeit umwandelt, ohne dass weitere Prozesse ablaufen.
Wärme geht nie von selbst, d.h. ohne Arbeitsaufwand, vom kälteren zum wärmeren Körper über, sondern stets umgekehrt.
13.7.5 Entropie Zur quantitativen Fassung des 1. Hauptsatzes hatten wir die innere Energie U eingeführt. Sie beschreibt den Zustand eines Systems im thermischen Gleichgewicht. Es ist zweckmäßig, auch dem 2. Hauptsatz eine Zustandsgröße zuzuordnen. Dies ist die Entropie. Zu ihrer Einführung wollen wir zunächst den Carnotschen Kreisprozess auf einen beliebigen Kreisprozess erweitern. In Abb. 13.13a ist ein Ausschnitt aus einem solchen gezeigt. Jeder Kurvenverlauf im pV-Diagramm lässt sich, wie angedeutet, durch beliebig viele Carnot-Prozesse mit beliebig
p p
A
B
C'
(1) C D (3)
(2) F Abb. 13.13a: Ausschnitt aus einen beliebigen reversiblen Kreisprozess durch sukzessiv durchlaufene isotherme und adiabatische Prozesse
E C''
Abb. 13.13b: Zur Definition der Entropieänderung bei einem reversiblen Kreisprozess aa
13 Phänomenologische Wärmelehre
263
vielen Wärmebädern annähern. Wir beschränken uns im Folgenden vorerst auf den in Abb. 13.13b gezeigten Kreisprozess, der entlang dreier Isothermen und dreier Adiabaten von A über B, C, D, E, nach F führt und von dort wieder nach A zurück. Er entspricht der Summe der Kreisprozesse (1) + (2) + (3). Bei der Berechnung der Energiebilanz fallen die Beiträge auf der gestrichelten Isotherme bzw. Adiabate heraus, da sie von den betreffenden Kreisprozessen gegensinnig durchlaufen werden. Wärmemengen sind positive Größen. Abgabe von Wärme drücken wir durch ein (-)-Zeichen aus. Die aufgewandten bzw. abgegebenen Wärmemengen sind längs AB : Q1 ; längs EC '' : Q3' längs CC ' : Q2' ; längs C '' F : Q3'' längs CD : Q2
Durch Addition der relevanten Wärmemengen folgt für die drei Kreisprozesse
Q1 Q2' T1 T2
0
Q2 Q3' T2 T3
0
Q2' Q3'' T2 T3
0
(13.58a)
Der Quotient Q/T heißt reduzierte Wärmemenge. Addition ergibt
Q1 Q2 Q3' Q3'' T1 T2 T3 T3
0.
(13.58b)
Mit Q3' Q3'' : Q3 führt das zu
Q1 Q2 Q3 T1 T2 T3
0,
(13.58c)
wobei wir für Q3 formal Q3 geschrieben haben. Diese Schreibweise hat den Vorteil, dass wir (13.58c) schreiben können als 3
Qi
¦T i 1
0.
(13.58d)
i
Zur Verallgemeinerung auf N Carnot-Prozesse haben wir auf der linken Seite von (13.57) die Summe der reduzierten Wärmen zu bilden. Für einen beliebigen Kreisprozess, zerlegt in N Carnot-Prozesse, folgt also N
Qi , rev
i 1
Ti
¦
0,
(13.58e)
264
13 Phänomenologische Wärmelehre
wobei abgegebene Wärmemengen negativ zu rechnen sind. Zur Kennzeichnung, dass es sich um reversible Prozesse handelt, haben wir den Index “rev” angefügt. Wir wollen uns jetzt den Kreisprozess in zwei Teilprozesse zerlegt denken. Gemäß Abb. 13.14 führe er im pV-Diagramm vom Punkt P1 auf einem beliebigen Weg I p zum Punkt P2 und von dort auf einem beliebigen Weg II P2 zum Punkt A zurück. II
I
N
Qi , rev
9;i 1
Ti
¦
P1
B
A
i, A
i,B
Weg I ¦ Qi , rev Weg II ¦ Qi , rev
0, (13.59)
V
Abb. 13.14: Kreisprozess im pV-Diagramm
B
Qi , rev
i, A
Ti
I¦
B
Qi , rev
i, A
Ti
II ¦
.
(13.60)
Die Summe der reduzierten Wärmen ist auf beiden Wegen gleich, unabhängig vom Weg. Sie hängt nur vom Anfangs- und Endpunkt ab und ist deswegen eine Zustandsgröße. Wir definieren nun den Wert der Zustandsgröße zwischen den Zuständen A und B als Entropiedifferenz SA - SB, B
Qi , rev
i, A
Ti
¦
: SB S A .
(13.61)
Die bisherige Darstellung hat noch einen Schönheitsfehler. Der durch N Carnot-Prozesse ersetzte Kreisprozess besitzt, wie in Abb. 13.13a angedeutet, Zacken und Ecken, die von der Anzahl N der Teilprozesse abhängt. Je größer N, desto besser die Übereinstimmung, d.h. wir müssen zum Integral übergehen. Für eine infinitesimal kleine Zustandsänderung gilt
G Qrev T
: dS B
SB S A
³
A
(13.62)
G Qrev T
Wenden wir diese Definition auf einen Kreisprozess an, so ergibt sich: Bei einem reversiblen Kreisprozess bleibt die Entropie konstant.
(13.63)
13 Phänomenologische Wärmelehre
265
Um uns eine Vorstellung zu verschaffen über die Entropieänderungen bei reversiblen Zustandsänderungen, wenden wir auf die Wärmeenergie den ersten Hauptsatz an. Es wird
GQ
dS
dU pdV . T
T
(13.64)
Für ein Mol eines idealen Gases gilt dU = Cmol,V dT. Benutzen wir weiter die allgemeine Gasgleichung, so erhalten wir für isobare Prozesse
dS
dT dV R . T V
Cmol ,V
(13.65)
Bei der Integration setzen wir voraus, dass die molare Wärmekapazität in dem betrachteten Temperaturintervall konstant ist. Die Entropie-Änderung ergibt sich zu
'S
Cmol ,V ln
T2 V R ln 2 . T1 V1
(13.66)
Ein analoger Ausdruck resultiert für isochore Prozesse. Bisher haben wir nur reversible Prozesse betrachtet. Wir wollen jetzt nach der EntropieÄnderung bei irreversiblen Prozessen fragen. In einem irreversiblen Carnot-Prozess ist die von dem betreffenden System verrichtete Arbeit bei gleichen Temperaturen der Wärmebäder stets kleiner als in einem reversiblen Prozess. Sei die zugeführte Wärmemenge Q1 in beiden Fällen die gleiche, so wird bei irreversibler Prozessführung, etwa durch die Entstehung von Wirbeln im Arbeitszylinder, mehr Wärme Q2 an das zweite Wärmebad abgegeben. Es gilt also allgemein
v³ o v³
G Qirr T
G Qirr T
v³
G Qrev T
0.
(13.67)
0.
(13.68)
Der Kreis im Integralzeichen bedeutet, dass es sich um einen geschlossenen Umlauf handelt. Wir teilen den Kreisprozess nun auf in einen von A nach B irreversibel geführten Übergang und einen von B nach A reversibel durchlaufenen Weg.
v³
v³
G Qirr T
G Qirr T
B
³
A
G Qirr T
A
³ B
G Qrev T
( S A SB ) 0 ;
0,
(13.69)
(13.70)
266
13 Phänomenologische Wärmelehre B
³
G Qirr
A
T
SB S A
(13.71)
Die Beziehung ist von besonderer Wichtigkeit für abgeschlossene Systeme. Diese haben keinen Arbeits- und Wärmeaustausch mit der Umgebung. Es gilt also
SB S A t 0
(13.72)
Das obere Zeichen gilt für irreversible Prozesse, das untere für reversible Prozesse. In einem abgeschlossenen System nimmt die Entropie bei irreversiblen Prozessen zu bei reversiblen Prozessen bleibt sie konstant. Beispiel:
A T1
T2 < T1
L
Abb. 13.15: Beispiel eines irreversiblen Prozesses: Wärmeleitung in einem Stab
Wir betrachten die Wärmeleitung in einem Metallstab. Der Stab habe die Länge L und den Querschnitt A (Abb. 13.15). Seine beiden Enden befinden sich in Kontakt mit zwei Wärmebädern der Temperaturen T1 und T2, wobei angenommen wird, dass T1 > T2. Nach entsprechender Zeit hat sich ein stationärer Zustand eingestellt, bei dem im Stab ein Temperaturgefälle
dT / dx (T1 T2 ) /( x1 x2 ) herrscht. Pro Zeiteinheit strömt durch den Stab die Wärmemenge
'Q 't
O A
T1 T2 , x1 x2
(13.73)
wobei O das Wärmeleitvermögen des betreffenden Stabmaterials ist. Wir berechnen die Entropieänderung. Die am ersten Endpunkt (1) vom Stab aufgenommene Wärmemenge Q1 ist dem Betrage nach gleich der am anderen Endpunkt (2) abgegebenen Wärmemenge Q2. Wir lassen daher den Index weg. Die Entropieänderung wird
'S
Q Q T2 T1
Q
T1 T2 . T1 T2
Da T1 > T2 ist, hat die Entropie in der Tat zugenommen.
(13.74)
13 Phänomenologische Wärmelehre
267
13.7.6 Thermodynamische Temperaturskala In Kapitel 13.1 haben wir die Grundgröße Temperatur eingeführt. Eine saubere Definition konnte aber bisher nicht gegeben werden. Wir haben zwar verschiedene Methoden zur Temperaturmessung diskutiert, wobei wir das Gasthermometer als besonders genau kennen gelernt haben. Aber dieses setzt voraus, das sich das Gas als ideales Gas verhält. Diese Voraussetzung ist umso weniger gut erfüllt, je tiefer die zu messende Temperatur wird. Deswegen ist es zweckmäßig, die Temperatur unabhängig vom Arbeitsstoff zu definieren. Eine solche Möglichkeit bietet der zweite Hauptsatz in Gestalt einer reversibel arbeitenden CarnotMaschine. Bedeuten wie oben Qrev,1 und Qrev,2 die bei den Temperaturen T1 bzw. T2 entnommenen bzw. abgegebenen Wärmemengen, so gilt
T1 T2
Qrev ,1 Qrev ,2
.
(13.75)
Wird eine der beiden Temperaturen, z.B. T1, durch irgendeine Messvorschrift festgelegt, und werden die entnommenen und abgegebenen Wärmemengen gemessen, so ist dadurch die Temperatur T2 definiert. Die so gewonnene Temperaturskala wird als thermodynamische Temperaturskala bezeichnet.
13.7.7 Ableitung der Maxwell-Geraden Bei der Einführung der van der Waalsschen Zustandsgleichung wurde die gasförmige und die flüssige Phase im pV-Diagramm durch eine horizontale Gerade verbunden, die dadurch bestimmt war, dass die Flächen oberhalb und unterhalb von ihr gleich waren. Dies können wir jetzt mit Hilfe des ersten und zweiten Hauptsatzes beweisen. Wir betrachten dazu einen isothermen Kreisprozess, der aus folgenden Schritten besteht (Abb. 13.16): 1. Verflüssigung auf dem Weg A B C; 2. Rückkehr in den gasförmigen Zustand auf dem Weg C E B D A. Nach dem ersten Hauptsatz gilt
¦ (Q W ) i
i
0,
D
p C
B
A
(13.19)
9,i
und nach dem zweiten Hauptsatz
E V
Qi ¦ 9 , i Ti
0
Abb. 13.16: Zur Berechnung der Maxwell-Geraden
268
13 Phänomenologische Wärmelehre
Da TI = const, folgt
¦Q
i
9,i
0 o ¦Wi
0.
(13.76)
9,i
Also erhalten wir
WCEB
WADB , d.h. Fläche ADB = Fläche BEC.
Vorstehende Ableitung setzt voraus, dass der Kurvenzug von A über D und E nach C stetig durchlaufen wird. Auf diesem Weg treten jedoch Instabilitäten auf, so dass der Beweis nicht ganz korrekt ist.
13.7.8 Der Joule-Thomson-Versuch Der Joule-Thomson-Versuch bringt eine erhebliche Steigerung der Genauigkeit des GayLussac-Versuches. Er bildet zudem die Grundlage für die Verflüssigung von (realen) Gasen.
Drosselstelle K1
P1, V 1
K2
P2 , V 2
Abb. 13.17: Joule-Thomson-Effekt: Adiabatische Expansion durch ein Drosselventil ohne äußere Arbeitsleistung
Wärmeisolation Die Anordnung besteht aus einem Wärme- isolierten Zylinder, der in der Mitte mit einem Drosselventil ausgestattet ist (Abb. 13.17). Die Druckverhältnisse sind durch zwei bewegliche Kolben K1 und K2 symbolisiert. Ein Gas werde unter konstantem Druck p1 durch das Drosselventil gedrückt; nach der Drosselung besitze das Gas den kleineren Druck p2. Auf Grund der thermischen Isolierung verläuft der Prozess adiabatisch, G Q 0 . Die gesamte vom Gas geleistete Arbeit ist
W
p2V2 p1V1 .
(13.77)
Damit gilt nach dem ersten Hauptsatz
H
U 2 p2V2
U1 p1V1 .
(13.78)
13 Phänomenologische Wärmelehre
269
Für ideale Gase wird
Cmol ,V T1 p1V1
T1 ( R Cmol ,V )
Cmol ,V T2 p2V2
T2 ( R Cmol ,V )
T1 T2
(13.79)
Dieser Sachverhalt impliziert, wie beim Gay-Lussac-Versuch, dass die innere Energie unabhängig vom Volumen. Benutzen wir statt eines idealen Gases ein reales Gas, so erwarten wir, dass wegen der anziehenden Kraft zwischen den Molekülen die innere Energie vom Volumen abhängt. Damit verknüpft ist eine Temperaturänderung, die wir zum Abschluss dieses Kapitels noch berechnen wollen. Die innere Energie eines reales Gases besteht aus zwei Termen; zu der uns vom idealen Gas bekannten kinetischen Energie kommt noch ein Beitrag hinzu, der vom Binnendruck p = -a/V herrührt, also potentielle Energie darstellt. Die Enthalpie wird
H
Cmol ,V T
a § RT a · ¨ 2 ¸V V ©V b V ¹
const.
(13.80)
Der Klammer-Ausdruck stellt den aus der van der Waalsschen Zustandsgleichung berechneten Druck p dar. Die Enthalpieänderung als Funktion der Änderung der Zustandsgrößen T und V ergibt sich zu
'H
0 Cmol ,V 'T
2a RV RTV RT 'V 'T 'V 'V . 2 2 V V b (V b) V b
(13.81)
Zusammenfassung der zu 'T und 'V gehörigen Terme führt zu
§ 2a RV · RbT · § ¸ 'V ¨ Cmol ,V ¸ 'T ¨ 2 V b¹ (V b) 2 ¹ © ©V
0.
(13.82)
woraus für die Temperaturänderung folgt
'T
§ RbT 2a · 2¸ ¨ 2 © (V b) V ¹ 'V . RV · § ¨ Cmol ,V ¸ V b¹ ©
(13.83)
270
13 Phänomenologische Wärmelehre
Unter der (sinnvollen) Annahme, dass b 2a, Abkühlung, wenn RTb < 2a ist. In Tab. 13.4 ist die Temperaturänderung für eine Druckdifferenz von 1 MPa für einige Gase aufgelistet. Es ist ersichtlich, dass Helium und Wasserstoff bei 0 °C oder darüber nicht verflüssigt werden können. Sie müssen zunächst vorgekühlt werden, Wasserstoff bis zu 193 K und Helium sogar bis zu 38 K.
Stoff
ǻT (°C)
Argon Helium Kohlendioxid Stickstoff Wasserstoff
-4,29 +0,61 -12,37 -2,64 +2,47
13.8
Tab. 13.4: Temperaturänderung beim Joule-Thomson Effekt für eine Druckerniedrigung von 1 MPa und Ausgangstemperatur von 0 °C
Thermodynamische Potentiale
Für reversible Zustandsänderungen in geschlossenen Systemen hatten wir mit (13.64) für die innere Energie U den Ausdruck abgeleitet
dU
TdS pdV .
Die Erweiterung auf ein offenes System lautet nach (13.18) D
dU
TdS pdV ¦ Pi dN i . i 1
(13.86)
13 Phänomenologische Wärmelehre
271
Diese Beziehung trägt den Namen Gibbssche Fundamentalgleichung (Gibbs, J. W. 18391903) oder thermodynamische Grundgleichung. Aus ihr lassen sich andere Fundamentalgleichungen ableiten. U ist ein totales Differential, so dass die innere Energie auch als die Erzeugende der abhängigen Variablen dienen kann. Dies führt zu den Beziehungen
T
§ wU · ¨ ¸ ; © wS ¹V , N
§ wU · p ¨ ¸ ; © wV ¹ S , N
Pi
§ wU · . ¨ ¸ © wN i ¹ S ,V , N j , j zì
(13.87)
Die dritte Größe heißt chemisches Potential. Bildung der zweiten Ableitungen ergibt experimentell zugängliche Größen, nämlich die Wärmekapazität bei konstantem Volumen
T
§ w 2U · ¨ 2¸ © wS ¹V , N
§ wT · ¨ ¸ © wS ¹V , N
T ; CV
1
o CV
§ w 2U · T¨ 2 ¸ . © wS ¹V , N
(13.88)
und die adiabatische Kompressibilität:
§ w 2U · ¨ 2¸ © wV ¹ S , N
§ wp · ¨ ¸ © wV ¹ S , N
1 VNS
,
1
NS
1 § w 2U · ¨ ¸ . V © wV 2 ¹ S ,V
(13.89)
Aus den Integrabilitätsbedingungen, also den gemischten zweiten Ableitungen, ergeben sich weitere Relationen:
§ wT · ¨ ¸ © wV ¹ S , N
§ wp · ¨ ¸ ; © wS ¹V , N
§ wT ¨¨ © wN j
· ¸¸ ¹V , S , Ni ,iz j
§ wP j · ¨ ¸ . © wS ¹V , N
(13.90)
Diese Beziehungen heißen Maxwell-Relationen. Wir entnehmen den Gln. (13.87-13.89), dass das Gleichgewichtsverhalten eines Systems festgelegt ist, sobald die innere Energie U U ( S , V , N ) bekannt ist. Eine solche Größe heißt thermodynamisches Potential. Die zugehörigen Zustandsgrößen werden als natürliche Variablen bezeichnet. Mit der Benutzung der inneren Energie ist der Nachteil verbunden, dass die natürlichen Variablen z.T. schlecht messbare Größen darstellen. Das gilt z.B. für die Entropie. In anderen
272
13 Phänomenologische Wärmelehre
Fällen erfordert ein Experiment bestimmte Variablen, etwa bei chemischen Reaktionen. Als Beispiel wollen wir hier in der inneren Energie die Entropie S durch die Temperatur T ersetzen. Die damit durch (T,V,N) festgelegte Zustandsfunktion heißt freie Energie F. Der Übergang lässt sich mit Hilfe einer Legendre-Transformation bewerkstelligen. Es sei Y(x1,x2,x3) eine Funktion der unabhängigen Variablen x1,x2,x3. Ihr Differential ist
wY wY wY dx1 dx2 dx3 . wx1 wx2 wx3
dY
(13.91a)
Wir schreiben dies als
c1dx1 c2 dx2 c3 dx3 .
dY
(13.91b)
Die partiellen Ableitungen in (13.91a) entsprechen den Beziehungen (13.90). Ersetzung des Variablensatzes (S,V,N) durch den Satz (T,V,N), bedeutet, in Y(x1,x2,x3) die Variable x1 durch die partielle Ableitung c1 wY / wx1 zu ersetzen. Zu diesem Zweck setzen wir
c1dx1
d (c1 x1 ) x1dc1 .
(13.92)
Setzen wir dies in (13.91b) ein, so ergibt sich
d (Y c1 x1 ) x1dc1 c2 dx2 c3 dx3 .
(13.93)
Wir erhalten so das Differential einer neuen Funktion
Z
Z (c1 , x2 , x3 ) Y c1 x1 .
(13.93a)
In unserem Fall ist
Y
U ( S ,V , N ) ,
(13.94)
so dass
Z (T ,V , N ) U TS .
(13.93b)
Die so gewonnene Zustandsgröße heißt freie Energie und wird mit F(T,V,N) bezeichnet. Aus (13.93b) folgt
dF
dU TdS SdT .
Auch diese Beziehung trägt den Namen Fundamentalgleichung.
(13.95)
13 Phänomenologische Wärmelehre
273
Nach dem ersten Hauptsatz ist
dU
G Q GW ,
(13.96)
nach dem zweiten Hauptsatz gilt
G Q d TdS ,
(13.62)
je nachdem, ob es sich um einen irreversiblen oder reversiblen Prozess handelt. Einsetzen von (13.18) in (13.96) unter Berücksichtigung von (13.62) ergibt
dF d SdT pdV
(13.97)
Für einen isothermen Prozess wird daraus
dF d G W
bzw.
dW d dF
(13.98)
Die erste Ungleichung besagt, dass bei irreversibler isothermer Prozessführung die Änderung der freien Energie eines Systems kleiner ist als die ihm von außen zugeführte Arbeit; nur wenn der Prozess reversibel erfolgt, stimmt sie mit der zugeführten Arbeit überein. Die zweite Beziehung bedeutet, dass bei irreversiblen Prozessen die vom System geleistete Arbeit immer kleiner als die Abnahme seiner freien Energie ist; nur bei reversiblen Prozessen ist sie mit der Abnahme der freien Energie identisch. Bleibt auch das Volumen konstant, so folgt Eine isotherm-isochore Reaktion (T = const, V = const), läuft solange ab, bis das Minimum der freien Energie erreicht ist. Es erhebt sich die Frage, was aus der Differenz aus innerer Energie und freier Energie, der sog. gebundenen Energie, wird.
U F
TS .
dU dF
TdS t G Q ;
d (U F ) t G Q
(13.99a) (13.99b) (13.99c)
Bei reversiblen isothermen Prozessen wird die gebundene Energie in Wärme umgewandelt. Eine besonders für chemische Reaktionen wichtige Zustandsgröße ist die freie Enthalpie oder Gibbssches Potential; diese Größe ist definiert ist als
G : U TS pV ,
(13.100a)
274
13 Phänomenologische Wärmelehre
dG
dU TdS SdT pdV Vdp .
(13.100b)
Unter Benutzung des ersten Hauptsatzes,
dU d TdS pdV , folgt für dG
dG d SdT Vdp .
(13.100c)
Ein isotherm-isobarer Prozess (T = const, p = const) läuft so lange ab, bis sich das Minimum der freien Enthalpie eingestellt hat. In (13.101) sind die thermodynamischen Potentiale für beliebige Systeme zusammengestellt. U ( S ,V , N )
Innere Energie;
H ( S , p, N ) U pV
Enthalpie;
F (T , V , N ) U TS G (T , p, N ) F pV
Freie Energie; Freie Enthalpie
(13.101)
Wie schon dargelegt, handelt es sich dabei um extensive Zustandsgrößen. Aus der Extensivität von G folgt durch Differentiation nach O, wenn i Gassorten vorliegen
G (T , p, O N )
O G (T , p, N )
d G (T , p, O N ) G (T , p, N ) dO
N
( N1 , N 2 ,..., N i ,...N k ) .
(13.102)
Das beliebige O setzen wir gleich eins:
° k § wG · ½° G (T , p, N ) ®¦ ¨ Ni ¾ ; ¸ °¯ i 1 © w (O N i ) ¹T , p , Nr zi °¿O 1
(13.103)
k
G (T , p, N )
¦P N i
i
.
(13.104)
i 1
Dieser Zusammenhang heißt Gibbs-Duhem-Relation (P.M. Duhem, 1861-1916). Für eine Gassorte i wird sie besonders einfach:
G (T , p, N i )
P Ni
13 Phänomenologische Wärmelehre
275
Die Enthalpie wurde bereits in Kap. 13.5.2 eingeführt. Sie spielt eine wichtige Rolle bei der Verflüssigung von Gasen, die weiter unten behandelt wird. Die totalen Differentiale der Zustandsgrößen H, F und G sind
dU TdS pdV P dN dH TdS Vdp P dN dF SdT pdV P dN dG SdT Vdp P dN
(13.105)
Mit (13.72) können wir auch irreversible Prozesse miteinbeziehen. Mit der Vereinbarung D
¦P G N i
i
{ PG N
und
G N o dN
i 1
ergibt sich
dU d TdS pdV P dN , dH d TdS Vdp P dN , dF d SdT pdV P dN , dG d SdT Vdp P dN .
(13.106)
Das Gleichheitszeichen gilt für reversible, das ( 0 sind die Änderungen 'F und 'U unterschiedlich, wie wir bereits oben gesehen haben. Nernst stellte nun fest, dass mit abnehmender Temperatur die Änderung der freien Energie bei chemischen Reaktionen immer weniger von der Temperatur abhängt. Denken wir uns die Kurven 'F (T ) und 'U (T ) graphisch aufgetragen (Abb. 13.18), so
U F
U
Steigung CV U (0) F(0)
T S0 Steigung F
SV
Abb. 13.18: Zur Herleitung des dritten Hauptsatzes
T nähern sie sich für T o 0 immer mehr einander an, wobei ihre Steigung gegen null tendiert. Nernst folgerte daher ganz allgemein
§ w · lim ¨ ('F ) ¸ 0, T o 0 wT © ¹
§ w · lim ¨ ( 'U ) ¸ 0. T o 0 wT © ¹
(13.112)
Da nach (13.96)
w ('F ) 'S wT
(13.113)
gilt, ist im Grenzfall T o 0 die Entropieänderung gleich null.
lim 'S (T , z ) 0 . T o0
(13.114)
Die Größe „z“ steht stellvertretend für weitere Zustandsvariabeln. (13.114) bedeutet zunächst, dass bei hinreichender Absenkung der Temperatur Reaktionen in reinen kondensierten Stoffen
278
13 Phänomenologische Wärmelehre
reversibel verlaufen (vgl. (13.72)). Dies entspricht der Erfahrung; die Entropie hängt weder von der Kristallmodifikation noch von der Stoffart ab, vorausgesetzt es handelt sich um reine Stoffe. Deswegen kam Nernst zu dem Schluss, dass die Entropie aller reinen Stoffe für T o 0 dem gleichen Grenzwert zustrebt. Dieser Grenzwert wurde von M. Planck (1858-1947) zu null festgelegt.
lim S (T , z )
0
T o0
(13.115)
Dies ist in Übereinstimmung mit der quantentheoretischen Behandlung des Problems. Der dritte Hauptsatz ist daher als Axiom entbehrlich. Wir besprechen zunächst die Konsequenzen für die Wärmekapazitäten
CV
§ GQ · ¨ ¸ © G T ¹V , N
§ wS · und C p T¨ ¸ © wT ¹V , N
§GQ · ¨ ¸ © G T ¹ p, N
§ wS · T¨ ¸ © wT ¹ p , N
.
(13.116)
Lösen wir die Gleichungen nach S auf, so ergibt sich im ersten Fall T
S (T ,V , N )
CV (T ,V , N ) dT . T 0
S0 (V , N ) ³
(13.117)
Nach dem 3. Hauptsatz ist S0 (V , N ) 0 . Bliebe nun für T o 0 CV endlich oder divergierte, so würde S (T , V , N ) mit T o 0 divergieren, im Widerspruch zum 3. Hauptsatz. Analog lässt sich für Cp argumentieren. Also erhalten wir als Ergebnis
lim CV T o0
0 und lim C p T o0
0.
(13.118)
Auch der thermische Ausdehnungskoeffizient
D
1 § wV · ¨ ¸ V © wT ¹ p ,T
(13.119)
verschwindet. Aus der Fundamentalrelation für die freie Enthalpie G folgt
§ wV · ¨ ¸ © wT ¹ p , N und damit
§ wS · ¨ ¸ © wp ¹T , N
(13.120)
13 Phänomenologische Wärmelehre
D
279
1 § wS · ¨ ¸ . V © wp ¹T , N
(13.121)
(13.115) soll für alle Zustandsvariablen gelten. Damit verschwindet auch (wS / wp )T , N (und sämtliche partiellen Ableitungen von S nach z mit T o 0 ), so dass sich ergibt
lim D
0.
T o0
(13.122)
Ebenfalls verschwindet im Grenzfall T o 0 die Differenz der Wärmekapazitäten. Zunächst folgt analog mittels der Fundamentalrelation der freien Energie,
§ wp · lim ¨ ¸ T o0 wT © ¹V , N § wp · lim ¨ ¸ T o 0 wT © ¹V , N
§ wS · lim ¨ ¸ T o0 wV © ¹T , N § wS · lim ¨ ¸ © wV ¹T , N
T o0
0
0.
(13.123)
(13.124)
Für die Differenz der Wärmekapazitäten gilt die Beziehung (s. unten)
§ wp · ¸ . © wT ¹V , N
(13.125)
° § wp · ½° § C p CV · lim ¨ V lim ®D ¨ ¸ ¸ ¾ 0. T o0 T o0 °¯ © wT ¹V , N °¿ © T ¹
(13.126)
C p CV
D TV ¨
Folglich
Der Ausdruck (13.125) ergibt sich aus der Definition der Wärmekapazitäten wie folgt.
Cp
§ GQ · ¨ ¸ © dT ¹ p , N
und CV
§ GQ · ¨ ¸ . © dT ¹V , N
(13.127)
Mit G Q TdS wird die Differenz
C p CV
°§ wS · § wS · ½° T ®¨ ¸ ¨ ¸ ¾. °¯© wT ¹ p , N © wT ¹V , N °¿
(13.128)
280
13 Phänomenologische Wärmelehre
Schreiben wir
S
S (V , T )
S ^T ,V (T , p )` ,
(13.129)
und bilden damit (wS / wT ) , so erhalten wir
§ wS · ¨ ¸ © wT ¹ p , N
§ wS · § wS · § wV · ¨ ¸ ¨ ¸ ¨ ¸ . © wT ¹V , N © wV ¹T , N © wT ¹ p , N
(13.130)
Diese Beziehung setzen wir in (13.128) unter Berücksichtigung von D gemäß (13.119) ein:
C p CV
§ wS · § wV · T¨ ¸ ¨ ¸ © wV ¹T , N © wT ¹ p , N
§ wp · ¸ © wT ¹V , N
D TV ¨
(13.131)
Das letzte Gleichheitszeichen folgt mittels (13.125). Eine weitere Folge des dritten Hauptsatzes ist die Unerreichbarkeit des absoluten Nullpunktes. Wir können ihm zwar beliebig nahe kommen, ihn aber nie erreichen. Zur Erläuterung müssen wir etwas vorgreifen. Wir gehen von einer der wirkungsvollsten Methoden zur Erzielung tiefer Temperaturen aus (T < 0.3 K). Es ist dies die adiabatische Entmagnetisierung. Betrachten wir ein paramagnetisches Salz. Seine Moleküle besitzen magnetische Momente, deren Richtungen im allgemeinen regellos verteilt sind. Bringen wir eine solche Substanz in ein äußeres Magnetfeld, so werden die Elementarmagnete teilweise ausgerichtet. In diesem Zustand befindliche Magnete ziehen sich an. Isolieren wir das Salz nun thermisch von der Umwelt und schalten das äußere Magnetfeld ab, so nehmen die Elementarmagnete wieder eine regellose Lage ein. Dazu wird gegen deren Wechselwirkung Energie benötigt. Sie wird aus der thermischen Energie des paramagnetischen Salzes entnommen, dessen Temperatur infolgedessen sinkt. a)
S
b)
Sum
S Sum
Sm
Sm
0
0
T2
T1
T1
T
T2
Abb. 13.19a,b: Zur Unerreichbarkeit des absoluten Nullpunktes
T1 T
13 Phänomenologische Wärmelehre
281
Wir kehren nun zur anfänglichen Behauptung der Unerreichbarkeit des absoluten Nullpunkts zurück. In Abb. 13.19a und b ist jeweils die Entropie des Salzes gegen die Temperatur aufgetragen. Wie gleich gezeigt wird, ist die Entropie im geordneten Zustand kleiner (im äußeren magnetischen Feld) als im ungeordneten Zustand. Folglich liegt die Entropie-Kurve des unmagnetisierten Salzes bei T z 0 über der des magnetisierten Salzes. Nehmen wir an, dass S(T) einen Verlauf hätte, wie er, im Widerspruch zum dritten Hauptsatz, in Abb. 13.19a skizziert ist. Nun entmagnetisieren wir bei der Temperatur T1 reversibel adiabatisch, wodurch wir in einem Schritt den absoluten Nullpunkt erreichen könnten. Nach dem dritten Hauptsatz müssen aber beide Entropie-Kurven bei T = 0 den Wert S = 0 annehmen (Abb. 13.19b
13.10 Anwendung der Hauptsätze auf mehrphasige Einkomponentensysteme 13.10.1 Temperaturabhängigkeit des Gleichgewichtsdrucks 13.10.1.1 Einführung in die Theorie Beginnen wir mit einem konkreten Beispiel und betrachten eine Flüssigkeit in einem abgeschlossenen Volumen V mit der inneren Energie U, die mit ihrer Dampfphase im Gleichgewicht steht. Der Übergang zwischen den beiden Phasen ist ein Phasenübergang 1. Art. Darunter verstehen wir einen Übergang, bei dem das chemische Potential μ(T, p) stetig von einer Phase A in eine andere, B, übergeht. Die Ableitungen von μ sind dagegen nicht stetig
P A (T , p) P B (T , p) ; § wP A · § wP B · ¨ ¸ z¨ ¸ ; © wT ¹ p © wT ¹ p
§ wP A · § wP B · ¨ ¸ z¨ ¸ . © wT ¹T © wT ¹T
(13.132)
Aus der Gleichheit der chemischen Potentiale kann der Dampfdruck als Funktion der Temperatur gewonnen werden. Zur Ableitung einer solchen Abhängigkeit müssen wir aber zunächst die Eigenschaften eines Phasenübergangs 1. Ordnung kennen, also auch verstehen, wie es zu Gl. (13.132) kommt. Dazu notieren wir uns als Erstes die Entropie. Sie setzt sich additiv aus den Einzelentropien der verschiedenen Phasen (ph) zusammen. Benutzen wir wieder kleine Buchstaben für molare Größen und bedeutet Q wie bisher die Molzahl, so gilt
S
¦Q
s ;
(13.133)
ph ph
ph
Daraus erhalten wir als Gleichgewichtsbedingung
G S U ,V ,Q ¦^s ph (GQ ph )U ,V ,Q Q ph ( s ph )U ,V ,Q ` ph
0.
(13.134)
282
13 Phänomenologische Wärmelehre
Einführung von Lagrange-Multiplikatoren D, E, J ergibt unter Beachtung obiger Nebenbedingungen GU = GV = GQ = 0
¦ ^s
ph
GQ ph Q phG s ph D (u phGQ ph Q phG u ph ) E (v phG v ph v phG v ph ) JG Q ph ` 0
ph
(13.135) Als Nächstes schreiben wir uns die Gibbssche Gleichung (13.77) für die ph-te Phase hin.
p ph P ph 1 dU ph dV ph dN ph , Tph Tph Tph
dS ph
(13.136a)
in molaren Größen
p ph P ph 1 du ph d v ph dQ ph . Tph Tph Tph
ds ph
(13.136b)
Andererseits folgt für eine Phase aus (13.135)
°
½° ° p ph p ph P ph ½° 1 1 du ph d v ph ¾ d Ȟ ph ® s ph u ph v ph ¾ 0 Tph Tph Tph Tph Tph °¿ °¿ °¯
(13.137)
ds ph
p ph 1 du ph d v ph ; Tph Tph
(13.138)
G s ph
p 1 G u ph ph G v ph . Tph Tph
(13.139)
Q ph ®ds ph °¯
Einsetzen von (13.136a) und (13.139) in (13.135) ergibt zunächst
ª °§ 1
¦ «« ®¨¨ T ph
¬ ¯°©
ph
· § p ph · P ph °½ D ¸ u ph ¨ E ¸ v ph J ¾ GQ ¸ ¨ Tph ¸ Tph °¿ ¹ © ¹
°§ 1 ½° º · § p ph · Q ph ®¨ D ¸ G u ph ¨ E ¸ G Ȟ ph ¾» ¨ ¸ ¨ ¸ °¯© Tph °¿ »¼ ¹ © Tph ¹
0.
(13.140)
13 Phänomenologische Wärmelehre
283
Daraus folgen die Beziehungen
§ 1 · § p ph · P ph D ¸ u ph ¨ E ¸ v ph J ¨¨ ¸ ¨ ¸ Tph © Tph ¹ © Tph ¹ § 1 · § p ph · D ¸ 0; E ¸ 0. ¨¨ ¨ ¸ ¨T ¸ © Tph ¹ © ph ¹
0;
(13.141a-c)
Mit den beiden letzten Gleichungen folgt aus (13.140)
P ph
J
Tph
.
(13.142)
Die Gln. (13.141b) und (13.141c) bzw. (13.142) bedeuten, dass alle Phasen des Systems die gleiche Temperatur bzw. gleichem Druck besitzen. Das chemische Potential μ ist für alle Phasen gleich. Daher können wir (13.136b) und (13.139) wie folgt schreiben:
Tph
ds ph
ds ph
dQ
du ph dQ
p ph
d v ph dQ
P ph ;
1 p du ph d v ph . Tph Tph
(13.143) (13.144)
13.10.1.2 Dampfdruckkurve Mit diesen Kenntnissen lässt sich nun unser oben angesprochenes Beispiel behandeln. Dies führt zur Clausius-Clapeyron-Gleichung. (13.132) lautet auf die flüssige und dampfförmige Phase bezogen
P fl (T , p ) Pd (T , p )
(13.145)
Aus dieser Gleichung lässt sich eine Beziehung p (T) gewinnen. Die Gibbssche Fundamentalgleichung schreibt sich bei fester Teilchenzahl
dg
sdT vdp Q d P (T , p )
(13.146)
Wir fassen nun eine Verschiebung dp, dT längs der Koexistenzlinie (der Dampfdruckkurve) ins Auge. Für diese gilt wegen (13.145)
d P fl (T , p) d Pd (T , p ) ;
284
13 Phänomenologische Wärmelehre
also wird (13.146)
s fl dT v fl dp
sd dT v d dp .
(13.147)
Daraus resultiert als Steigung der Dampfdruckkurve
dp dT
sd s fl vd v fl
.
(13.148)
Die Entropiedifferenz zwischen Gas und Flüssigkeit ist mit der molaren Verdampfungswärme / m über (13.62) verknüpft:
/m
T ( sd s fl ) ,
so dass wir erhalten
dp dT
/m . T (v d v fl )
(13.149)
Das ist die Clausius-Clapeyron-Gleichung (R. Clausius, 1822-1888; B. Clapeyron, 1799-1864). Da das Flüssigkeitsvolumen gegenüber dem Dampfvolumen vernachlässigt werden kann, vereinfacht sich (13.149) unter Benutzung der idealen Gasgleichung zu
dp dT
/m T vd
p/ m . RT 2
(13.150)
Nehmen wir weiter vereinfachend an, dass in nicht zu großen T- Bereichen die Verdampfungswärme konstant ist, so folgt durch Integration der Dampfdruck zu
/m RT
p p0 e . (13.151) Zum Schluss kommen wir noch einmal zu (13.132) zurück. Da natürlich sd z s fl und v d z v fl ist, folgen aus (13.144) auch die beiden unteren Ungleichungen. Abb. 13.20a zeigt
eine Anordnung zur Messung des Dampfdruckes, Abb. 13.20b den Druckverlauf.
13 Phänomenologische Wärmelehre
285
p
p = p0 e -
/ kT
T Abb. 13.20a: Anordnung zur Messung des Dampfdruckes einer Flüssigkeit und
Abb. 13.20b: Dampfdruck als Funktion der Temperatur
In Tab. 13.5 sind Werte für die Verdampfungswärme einiger fester Stoffe und Flüssigkeiten zusammengestellt. Der Wert für Wasser ist besonders groß; er ist Ausdruck der relativ hohen intermolekularen Kräfte. Diese müssen überwunden werden, damit sich die Moleküle aus dem Flüssigkeitsverband lösen und in die Gasphase gelangen können. Winzer nutzen diese Eigenschaft aus, um ihre oberirdischen Weinlager im Sommer durch Fluten kühl zu halten.
Stoff
Tab. 13.5: Spez. Wärme bei 20 °C und 1013,25 Pa; spez. Schmelzwärme und spez. Verdampfungswärme einiger Stoffe
Aluminium Eisen Germanium Kupfer Blei Äthylalkohol Quecksilber Wasser
cp (kJ kg-1K-1)
OS (kJ kg-1 )
OV (kJ kg-1)
0,891 0,451 0,323 0,385 0,127 2,428 0,140 4,182
396 275 410 205 52,2 ----
10900 6340 4600 4790 725 815 285 2257
Wir hätten natürlich zur Ableitung der Clausius-Clapeyron-Gleichung auch einen Kreisprozess wählen können. Er ist in Abb. 13.21 dargestellt. Eine Wärmekraftmaschine arbeitet zwischen zwei Wärmebädern mit den Temperaturen T und (T - dT). Ihr Arbeitszylinder sei z.T. mit Wasser gefüllt (Volumen Vfl), der Kolben bedecke zu Beginn die Flüssigkeitsoberfläche. Der Zylinder befinde sich im thermischen Kontakt mit dem Wärmebad der Temperatur T.
286
13 Phänomenologische Wärmelehre
Dampf T -dT
T
T
p
p -dp
T -dT
Flüssigk.
Vfl
Vd V
Abb. 13.21: Kreisprozess zur Ableitung der Clausius-Clapeyron-Gleichung 1. Schritt: Der Kolben wird angehoben, bis alles Wasser verdampft ist. Der Dampf nehme das Volumen Vg ein. Die von der Maschine verrichtete Arbeit ist
p (T )(Vg V fl ) .
(13.152)
Dazu wird dem Wärmebad die Wärmemenge / (Verdampfungswärme) entnommen. 2. Schritt: Das Gas wird vom Wärmebad entkoppelt und durch adiabatische Expansion auf die infinitesimal kleinere Temperatur (T - dT) abgekühlt. Die dabei frei werdende Wärme wird an das “Kühlbad” abgegeben. 3. Schritt: Der Zylinder wird in thermischen Kontakt mit dem Wärmebad der Temperatur (T - dT ) gebracht. Durch Hineinschieben des Kolbens wird das gesamte Gas verflüssigt. Der Druck ist
p (T dT )
p (T )
dp dT dT
p (T ) dp .
(13.153)
Die zur Verflüssigung benötigte Arbeit ist
p (T dT )(Vg V fl ) ( p(T ) dp )(Vg V fl ) .
(13.154)
Insgesamt beträgt also die von der Maschine nach außen abgegebene Arbeit
W
p (T )(Vg V fl ) ( p (T ) dp)(Vg V fl ) dp (Vg V fl ) .
(13.155)
13 Phänomenologische Wärmelehre
287
4. Schritt: Durch adiabatische Expansion wird die Flüssigkeit von der Temperatur (T - dT) auf die Temperatur T gebracht und befindet sich damit wieder im Ausgangszustand. Der Wirkungsgrad des Carnot-Prozesses ergibt sich zu
K dT T
(Vg V fl ) /
T (T dT ) T
dp
(Vg V fl ) /
dT . T
dp .
(13.156)
(13.157)
Diese Beziehung ist mit der Clausius-Clapeyron-Gleichung (13.149) identisch.
13.10.1.3 Schmelzdruckkurve und Sublimationsdruckkurve Genau so wie ein Gleichgewicht zwischen Flüssigkeit und gesättigtem Dampf besteht, existiert ein solches zwischen der Oberfläche eines festen Körpers und der flüssigen oder gasförmigen Phase. Der Druck in diesen Phasen ist gegeben durch die Schmelzdruck- bzw. die Sublimationsdruckkurve. Analog dem gerade besprochenen Fall wird der Druck als Funktion der Temperatur wieder durch die Clausius-Clapeyron-Gleichung beschrieben. Für den Schmelzvorgang lautet sie
dp dT
(/ m ) f , fl T (v fl v f )
.
(13.158)
Darin bedeuten f bzw. fl die feste bzw. die flüssige Phase. (/ m ) f , fl st die molare Schmelzwärme. Im Allgemeinen ist das Volumen der flüssigen Phase größer als das der festen Phase. Dementsprechend führt eine Erhöhung des Druckes über der flüssigen Phase zu einer Erhöhung der Schmelztemperatur. Eine Ausnahme bildet Wasser. Hier gilt Vfl < Vf , d.h. die Schmelztemperatur sinkt mit steigendem Druck (“Relegation” des Eises). Eine qualitative Bestätigung liefert bereits die bekannte Tatsache, dass Eisberge schwimmen. Folglich ist das Eisvolumen größer als das Volumen des Schmelzwassers. Die rechte Seite der ClausiusClapeyron-Gleichung ist also negativ und damit dT/dp negativ. Die Druckabhängigkeit der Schmelztemperatur lässt sich im Experiment leicht zeigen: Legen wir um einen Eisblock eine dünne Drahtschlinge und befestigen an ihr ein Gewicht (Abb. 13.22), so schmilzt das Eis dort, wo der Druck längs der Drahtschlinge erhöht ist, gefriert aber wieder, wenn der Draht weitergewandert ist und der Druck wieder seinen ursprünglichen Wert angenommen hat. Es ist zu beachten, dass die Schlinge hinreichend dünn ist, denn eine Erhöhung des Druckes um 105 Pa bewirkt nur eine geringe Schmelzpunkterniedrigung von 7,5*10-3 K.
288
13 Phänomenologische Wärmelehre
Auch das Wandern der Gletscher beruht auf der Relegation des Eises. Der hohe Druck der Eismassen auf die unteren Schichten führt dazu, dass das Eis lokal schmilzt und dadurch zu Tal zu fließt. Wie bereits erwähnt, besitzen auch feste Stoffe einen Dampfdruck. Dieser ist zwar im Allgemeinen sehr klein, Abb. 13.22: Demonstration der führt aber zu einer langsamen VerdunErniedrigung der Schmelztemstung. Einen solchen direkten Überperatur von Eis durch äußeren gang eines festen Stoffes in die GasDruck phase wird als Sublimation bezeichnet. Der Effekt lässt sich beispielsweise bei Naphtalin (Mottenpulver) beobachten, das an freier Luft langsam verdunstet. Festes Kohlendioxid, bekannt als Trockeneis, besitzt bereits bei 195,1 K (-78,5 °C) einen Sublimationsdruck von 1 bar, so dass es zügig verdunstet, ohne vorher flüssig zu werden. Den umgekehrten Übergang finden wir etwa bei der Bildung von Reif oder Schneekristallen unmittelbar aus Wasserdampf. Wir haben gesehen: Im einfachsten Fall kann ein Stoff in drei Phasen vorkommen: fest, flüssig, gasförmig. In welcher Phase er sich befindet, hängt von Druck und Temperatur ab. Das Volumen ist dann durch die Zustandsgleichung bestimmt. In Abb. 13.23 ist ein Phasendiagramm dargestellt. Kurve (1) ist die Dampfdruckkurve der Flüssigkeit, Kurve (2) die Sublimationsdruckkurve der festen Phase, und (3) gibt die Schmelzdruckkurve wider. Im Allgemeinen ist die Steigung der Phasengrenze fest-flüssig positiv. Wasser bildet eine Ausnahme, hier ist die Steigung negativ. Allen drei Kurven ist ein Punkt gemeinsam; er heißt Tripelpunkt. In ihm stehen alle drei Phasen im Gleichgewicht. Für Wasser liegt er bei p = 6.11 mbar und T = 273,16 K = 0.010° C.
p (3)
flüssig (1)
fest Tripelpunkt
gasförmig
(2) 273,16
T
Abb. 13.23: Phasendiagramm von Wasser
13 Phänomenologische Wärmelehre
289
13.11 Anwendungen der Hauptsätze auf einphasige Mehrkomponentensysteme 13.11.1 Thermodynamische Potentiale von idealen Gasen und Gasmischungen Als Anwendungsbeispiel wollen wir die Potentiale einer Mischung aus idealen Gasen berechnen. Wir werden sie weiter unten zur Ableitung des Massenwirkungsgesetzes verwenden. Da es sich bei den Potentialen um extensive Zustandsgrößen handelt, gilt die Additivität. Wir beginnen mit der inneren Energie. Zunächst gilt
p
QL
nkT
Q NL
N V
N Q NL ; n :
V
;
xi :
Qi Q
pi ; p
(13.159)
k
V
piV Q i LkT Q i RT ;
o
kT
V
¦V ; i
(13.160)
1
Die innere Energie ist k
U
k
¦U ¦Q u (T ) . i
i 1
(13.161)
i i
1
Die Enthalpie einer Gassorte für ein Mol beim Druck p ist gegeben durch (13.24):
hi
ui pVi ;
und für ein Gasgemisch bei p = const
H
¦Q h ¦Q (u i i
i
i
i
pVi ) .
(13.162)
i
Wir kommen zur Entropie: Für ein ideales Gas gilt nach dem ersten und zweiten Hauptsatz
S (T ,V ,Q i )
³
G Qrev
Q i ³ CVmol
T T dV Q i CVmol ln Q i ³ R . T0 V
Si (T ,V ,Q i ) Q i CVmol ln
dT p Q i ³ dV T T
T V Q i R ln S (T0 ,V0 ,Q i ) . T0 V0
(13.163a)
(13.163b)
290
13 Phänomenologische Wärmelehre
Der letzte Term hängt von der Anzahl der Teilchen ab. Diese können wir eliminieren, wenn wir die Eigenschaft der Entropie ausnutzen, eine extensive Zustandsgröße zu sein. !
S (T , OV , OQ i ) O S (T ,V ,Q i ) .
(13.164)
Um diese Forderung zu gewährleisten, müssen wir den letzten Term in (13.163b) speziell formulieren, denn der zweite Term erfüllt die Bedingung nicht. Ausgeschrieben lautet (13.164)
Si 0 (T0 ,V0 , OQ i ) (OQ i ) CVmol ln
T OV (OQ i ) R ln T0 V0
T V O si 0 (T0 ,V0 ,Q i ) OQ i CVmol ln OQ i R ln . T0 V0
(13.165a)
oder
O Si 0 (T0 ,V0 ,Q i ) Si 0 (T0 ,V0 , OQ i ) OQ i R ln O . Wir setzen das beliebig wählbare O gleich Q 0 /Q
Si 0 (T0 ,V0 ,Q i )
(13.165b)
i
Qi Q Si 0 (T0 ,V0 ,Q 0 ) Q 0 R ln 0 . Q0 Qi
(13.166)
Einsetzen in (13.163a)
§ T V /Q Si (T ,V ,Q i ) Q i ¨ 9 CmolV ln R ln T0 V0 /Q 0 © Hierin ist 9
· ¸. ¹
(13.167)
(1/Q 0 ) S (T0 , V0 ,Q 0 ) jetzt eine Konstante.
Die natürlichen Variablen der Entropie sind U,T,Q . Die Umrechnung lässt sich leicht mit Hilfe des 1. Hauptsatzes bewerkstelligen. Für ein ideales Gas gilt entsprechend (13.20)
dU Q Cmol ,V dT
o U Q Cmol ,V T const.
(13.20)
Ersetzung von T in (13.167) durch U ergibt
§ U /Q V /Q · Si (U ,V ,Q i ) Q i ¨ 9 CmolV ln R ln ¸1 . U 0 /Q 0 V0 /Q 0 ¹ ©
(13.168)
13 Phänomenologische Wärmelehre
291
Häufig wird die Entropie als Funktion von T, p, Qi benötigt. Wir drücken daher CVmol durch Cpmol aus. Weiter benutzen wir die ideale Gasgleichung bei den Temperaturen T und T0
pV Q RT
p0V0 Q 0 RT0 .
und
Es ergibt sich
Si (T , p,Q i ) Q i C pmol ln
V /V T Q i R ln i 0 S0 (T0 , p0 ,Q i ) , T0 T / T0
(13.169)
wobei S0 = S(T0, p0, Qi).
Si (T , pi ,Q i ) Q i C p ln Hierin ist 9 c durch 9 c
p T Q i R ln i 9 c . T0 p0
(13.170)
(1/Q 0 ) S (T0 , p0 ,Q 0 ) gegeben.
Für k getrennte Gassorten wird die Gesamtentropie
S
¦ S ¦Q s (T , p,Q ) ¦Q i
i
i i
i
i
i
i
§ · pi T ¨ C pi ln R ln si (T0 , p0 ,Q i ) ¸ . (13.171) T0 p0 © ¹
Dabei ist hinsichtlich des letzten Terms zu beachten, dass der Druck für alle Einzelgase gleich sein soll. Wir wenden uns jetzt der Mischung zu, in der alle Einzelbestandteile das gleiche Volumen mit dem Partialdruck pi ausfüllen. k
S Misch
¦Q s (T , p ) . i i
i
(13.172)
i 1
Elimination von pi mittels (13.171) resultiert in
S Misch
¦Q c
i pi
i
ln
T p Q i R ln ¦ RQ i ln xi S (T0 , p0 ,Q i ) . T0 p0 i
Die molare Entropieänderung bei der Temperatur T ergibt sich aus der Differenz von (13.169) und (13.170) zu
'si
si (T , pi ) si (T , p) R ln xi .
(13.173a)
292
13 Phänomenologische Wärmelehre
Die Gesamtentropie wächst daher um
¦Q 's
SM S
i
R ¦ ln xi ! 0 .
i
i
(13.173b)
i
Dieser Betrag heißt sinngemäß Mischungsentropie. Mit der Kenntnis der Entropie lässt sich nun die freie Enthalpie GM (T,p,Qi) und daraus die freie Energie FM (T,V,Qi) berechnen. Die freie Enthalpie einer Gassorte i pro Mol ist gemäß (13.101)
gi (T , p) hi (T ) Tsi (T , p ) . Im vermischten Zustand erhalten wir mittels (13.173a)
hi (T ) Tsi (T , pi )
gi (T , p) RT ln xi .
(13.174)
Die freie Enthalpie des Gesamtsystems im unvermischten Zustand ist
G
¦ G ¦Q g (T , p) . i
i
i
(13.175)
i
i
Für die Mischung folgt
GM
¦G
M i
i
¦Q P (T , p,Q ) . i
i
(13.176)
i
i
Die freie Enthalpie ändert sich demnach um
'G G M G
¦Q (P i
i
gi )
i
RT ¦Q i ln xi 0 .
(13.177)
i
Die freie Enthalpie der getrennten Gase lässt sich mittels der Gibbs-Duhem-Relation berechnen. Dazu müssen wir das chemische Potential ermitteln. Aus (13.104) folgt mit (13.18)
Q 0V T § wS · ; ¸ ( R CVmol 9 )T CVmol T ln RT ln T0 Q V0 © wQ ¹
P (T ,V ,Q ) T ¨
P (T , p) (CVmol 9 )T (CVmol R )T ln Damit ist die freie Enthalpie bestimmt.
T p /T RT ln . T0 p0 / T0
(13.178)
(13.179)
13 Phänomenologische Wärmelehre
293
Die molare freie Energie einer Gassorte i ist entsprechend (13.105)
fi (T ,V )
gi (T ,V ) pV ; gi (T ,V ) RT ;
(13.180a-c)
Pi (T ,V ) RT . Die freie Energie des Gesamtsystems aus k idealen Gasen beträgt im getrennten Zustand
F (T ,V ,Q )
¦Q
f .
(13.181)
i i
i
Hierin ist μI(T,V) durch (13.178) und fi durch (13.180c) gegeben. Für die Mischung haben wir noch die Mischungsentropie, (13.173b), zu berücksichtigen. Es ergibt sich folglich
F M (T ,V ,Q )
¦Q ^ g (T ,V ) RT (1 ln x )` . i
i
i
(13.182)
i
Damit ist auch die freie Energie bekannt.
13.11.2 Chemisches Gleichgewicht und Massenwirkungsgesetz Wir betrachten jetzt ein System aus mehreren idealen Gasen, die miteinander chemisch reagieren können und dadurch eine Verbindung eingehen. Wir haben also wieder ein abgeschlossenes mehrkomponentiges System mit nur einer Phase vor uns. Es kann sich dabei z.B. aus Stickstoff und Wasserstoff handeln, die miteinander zu Ammoniak reagieren,
N 2 3H 2 R 2 NH 3 .
(13.183)
Eine andere Reaktion ist die Bildung von Wasser aus Wasserstoff und Sauerstoff,
2 H 2 O2 R 2 H 2 O .
(13.184)
Eine solche Reaktion verläuft im Allgemeinen nicht vollständig, sondern es stellt sich ein Gleichgewicht ein, das von Temperatur und Druck abhängt. Es wird durch das Massenwirkungsgesetz geregelt, dem wir uns jetzt zuwenden wollen. Es wurde 1864-1867 von C.M. Guldberg (1836-1902) und P. Waage (1833-1900) auf Grund kinetischer Überlegungen abgeleitet. Gegeben sei ein System mit dem Gesamtvolumen V, welches Q i Mole des i-ten Gases enthalte. Eine Reaktion schreiben wir in der Form
z1 A1 z2 A2 ...zk Ak R zk 1 Ak 1 zk 2 Ak 2 zm Am ... .
(13.185)
294
13 Phänomenologische Wärmelehre
Hierin bedeuten z j die stöchiometrischen Koeffizienten der m beteiligten Gase Aj . In der ersten Reaktionsgleichung ist also A1 = N2, A2 = H2, A3 = NH3 sowie z1 1, z2 3, z3 2 . Zur Vereinfachung der Schreibweise vereinbaren wir, dass die links stehenden Koeffizienten z j der Ausgangsstoffe positiv gerechnet werden und die der Reaktionsprodukte, zk j , negativ. Deshalb setzen wir
zj
zj
für j 1,..., k ;
zj
z j für j
k 1,..., m.
(13.186)
Damit erhält die Reaktionsgleichung die Form m
¦z
j
Aj
0.
(13.187)
1
Während der Reaktion ändern sich die Molzahlen entsprechend der Reaktionsgleichung:
GQ 1 : GQ 2 :...: GQ k : GQ k 1 : GQ k 2 :...: GQ m Q 1 :Q 2 :...:Q k : Q k 1 : Q k 2 :...: Q m .
(13.188)
Damit können wir schreiben
GQ j
z j G[ ,
(13.189)
wobei die zj festliegen, so dass als einzige zu variierende Größe [ bleibt. Da bei der Reaktion neue Moleküle gebildet werden, kann sich auch die Gesamtmolzahl ändern.
GQ
¦ GQ j
j
G[ ¦ z j
z G[ .
(13.190)
j
In unserem ersten Beispiel ist z = 1 + 3 –2 = 2. Die Größe z wird als Molüberschuss bezeichnet. Zur Berechnung des chemischen Gleichgewichtes wollen wir voraussetzen, dass die Reaktion bei konstantem Druck und konstanter Temperatur abläuft. Wir haben also von der freien Enthalpie, Gl. (13.105d), auszugehen:
dG
dH TdS SdT Vdp P dN .
(13.191)
Die Gleichgewichtsbedingung lautet ausgeschrieben, wenn die Teilchenzahl N durch die Anzahl der Mole Q ersetzt wird,
13 Phänomenologische Wärmelehre
295
k
¦ P dQ
(dG )T , p ,Q
i
i
.
(13.192)
1
k
Einsetzen von
¦ dQ
i
entsprechend (13.190) ergibt
1
k
¦P z
(dG )T , p ,Q
0.
i i
(13.193)
1
Für ein ideales Gas wird mit (13.173a) k
¦ z ^( g (T , p) RT ln x ` i
i
i
0;
(13.194a)
1
darin bedeuten gi die molare freie Enthalpie und xi den Molenbruch Q i /Q Umordnung wird k
¦ zi ln xi
1
1 RT
pi / p . Durch
k
¦ z g (T , p) { ln K (T , p) , i
i
(13.194b)
1
wobei wir den in der Mitte stehenden Ausdruck durch den Logarithmus einer Größe K gesetzt haben, die nicht vom Molenbruch xi abhängt. Damit wird k
x
zi i
K (T , p) .
(13.195)
i 1
Diese Beziehung stellt das Massenwirkungsgesetz dar, K heißt Massenwirkungskonstante. Es regelt das Gleichgewicht zwischen den Reaktionspartnern als Funktion der Temperatur und des Druckes, charakterisiert durch deren Molenbruch xi . Zur Berechnung der Temperatur- und Druckabhängigkeit gehen wir von dem Zusammenhang (13.105)
gi
hi Tsi
(13.105)
aus. Für ein ideales Gas wird
hi (T )
Cmol , pi (T T0 ) h0i ;
si (T , p ) Cmol , pi ln
T p R ln h0i Ts0i . T0 p0
(13.196)
296
13 Phänomenologische Wärmelehre
Der Index 0 steht für den Wert der betreffenden Größe bei der Bezugstemperatur T = T0. Einsetzen in (13.105) ergibt
gi (T , p) Cmol , pi (T T0 ) TCmol , pi ln
T p Cmol , pi s0i . ln T0 p0 R R
(13.197)
Tragen wir (13.197) in (13.194b) ein, so erhalten wir für die Massenwirkungskonstante K z § § p· ¨ T K (T , p ) ¨ ¸ ¨ k © p0 ¹ ¨ ( ¦ zi Cmolpi ) / R ©T 1
· ¸ ¸ exp zi li (q p0 / RT ) . ¸ ¹
(13.198)
Darin bedeuten
li
13.12
s0i Cmolpi R
; q p0
¦ z (h i
i
0i
CmolpiT0 ); z
¦z
i
.
(13.199)
i
Anwendung der Hauptsätze auf mehrphasige Mehrkomponentensysteme
13.12.1 Gibbssche Phasenregel Bezeichnen wir wieder mit p bzw. V sowie T die thermodynamischen Zustandsvariablen (häufig als thermodynamische Freiheitsgrade bezeichnet) des betrachteten Systems. Zwischen der Anzahl der Phasen q, der Anzahl der Komponenten k und der Anzahl der Zustandsvariablen f des Systems besteht ein Zusammenhang, der als Gibbssche Phasenregel bekannt ist. Sie lautet:
f
k 2q .
(13.200)
In einkomponentigen Systemen ist k = 1. Ist nur eine Phase vorhanden, so ist f = 2; Druck und Temperatur können unabhängig voneinander gewählt werden. Existieren zwei Phasen nebeneinander, so folgt f = 1. Es kann also nur der Druck oder die Temperatur frei gewählt werden, die andere Zustandsvariable liegt dann fest. Bei Koexistenz von drei Phasen, also am Tripelpunkt, liegen alle Zustandsvariablen fest. Die Phasenregel ist eine Folge der Hauptsätze der Thermodynamik und kann daher mit Hilfe der thermodynamischen Potentiale abgeleitet werden. Damit die Regel in der Form von (13.200) gilt, also auf k Komponenten angewendet werden kann, muss ein Teilchenaustausch berücksichtigt werden. Wir haben also von (13.105) auszugehen und betrachten ein isothermisobares System.
13 Phänomenologische Wärmelehre
297
Die Gleichgewichtsbedingung für die l-te Phase lautet q
¦ P dQ
dGl
li
0.
li
(13.201)
i 1
Die Erweiterung auf das Gesamtsystem ergibt k
q
¦¦ P dQ li
li
0.
(13.202)
l 1 i 1
Das ist ein System von q k Bedingungsgleichungen, die aber nicht voneinander unabhängig sind, da für jede Komponente die Gesamtteilchenzahl konstant sein muss. Es gilt also zusätzlich q
¦ dQ
li
0;
l 1, 2,..., k .
(13.203)
i 1
Die Zahl der unabhängigen Gleichungen ist daher nicht q k , sondern k (q 1) . Wie viele Variable stehen zur Erfüllung dieser Gleichungen zur Verfügung? Nach (13.86) hängt die l-te Phase, wenn k Komponenten existieren, von den Zustandsvariablen p und T sowie den Molzahlen ab. Das sind (2 + k – 1) Variable. Die Gesamtheit der Phasen wird also durch [2 + q (k – 1)] Variable beschrieben. Ist diese Anzahl kleiner als die Zahl der zu erfüllenden Gleichungen, so ist deren Lösung im Allgemeinen nicht möglich. Wir müssen daher fordern
2 q (k 1) t k (q 1) o qdk 2
(13.204)
Das kann auch geschrieben werden als
q f
k2 o
f
k 2q,
(13.205)
worin f die Zahl der Variablen (Freiheitsgrade) ist, die das k-komponentige System noch hat.
13.12.2 Osmose Gegeben sei ein Gefäß mit einer einkomponentigen, verdünnten Lösung. Die Gefäßwände mögen aus einer sog. semipermeablen Membran bestehen, durch die Lösungsmittel treten kann, nicht aber der gelöste Stoff. Der Druck kann z.B. an einem Steigrohr abgelesen werden (Pfeffersche Zelle, Abb. 13.24 (W. Pfeffer, 1845-1920)). Bringen wir das die Lösung
298
13 Phänomenologische Wärmelehre enthaltene Gefäß in ein zweites Gefäß mit reinem Lösungsmittel, so diffundiert ein Teil von diesem in die Lösung. Der hydrostatische Druck steigt bis auf einen bestimmten Betrag, der dadurch gegeben ist, dass keine Netto-Diffusion mehr stattfindet. Der Vorgang wird als Osmose bezeichnet, der Überdruck heißt osmotischer Druck der Lösung. Experimentell ergibt sich für diesen Druck S die von J. H. van’t Hoff (1852-1911) abgeleitete Beziehung
H
Lösung
S V Q RT
(13.206)
Hierin bedeutet Q die Anzahl der bei der Temperatur T im Volumen V gelösten Mole. R ist die Gaskonstante. Der Ausdruck entspricht der allgemeinen GasgleiAbb. 13.24: Demonstration chung. Der osmotische Druck ist also genau so groß wie der Osmose mit einer Pfefder Gasdruck, den die gelösten Moleküle in der Gasphase ferschen Zelle auf die Wände des Behälters ausüben würden. Die Osmose spielt in der Biologie und Medizin eine wichtige Rolle. In pflanzlichen Zellen kann der Druck bis zu mehreren Pascal betragen. Das ist u.a. der Grund dafür, dass auch fragile Pflanzen aufrecht stehen. Das Welken der Pflanzen wird durch eine zunehmende Durchlässigkeit der Zellwände für die im Zellsaft enthaltenen Stoffe hervorgerufen. Auch die in den tierischen und menschlichen Blutkörperchen gelösten Stoffe üben einen osmotischen Druck aus. So beträgt der osmotische Druck des Blutes der Säugetiere 7,5 105 Pa . Den gleichen osmotischen Druck besitzt eine 0,95 prozentige Kochsalzlösung. Eine solche kann daher ohne Nachteil für den Patienten als “physiologische Kochsalzlösung” dem Blut zugeführt werden. Dagegen presst eine konzentriertere Lösung wegen ihres höheren osmotischen Druckes die Blutkörperchen zusammen; eine verdünntere NaCl-Lösung würde die Blutkörperchen aufblähen bzw. zum Platzen bringen.
Lösungsmittel
Zur Ableitung des van’t Hoffschen Gesetzes haben wir von der freien Energie auszugehen, da Gesamtvolumen und Temperatur konstant sind.
V
VLM VL .
Hierin beziehen sich die Indizes LM bzw. L auf das Lösungsmittel bzw. die Lösung. Die Gleichgewichtsbedingung lautet
(G F )T ,V ,Q
(G FLM )T ,VLM ,Q (G FL )T ,VL ,Q ,
wobei Q die Gesamtmolzahl darstellt. Sie setzt sich additiv aus den Molzahlen des Lösungsmittels auf der linken und rechten Seite der Kammer sowie der Molzahl Qgel des gelösten Stoffes zusammen.
13 Phänomenologische Wärmelehre
299
Es gilt also
Q ( LM ) Q ( LM ) r
const.; Q gel
l
const.
Folglich gilt
GQ ( LM ) GQ ( LM ) r
0; GQ gel
l
0.
Entsprechend (13,105) ist
SG T pG V ¦ PiGQ i ,
GF
i
so dass sich ergibt
P( LM ) GQ LM r P( LM ) GQ LM l P gel GQ gel r
l
( P( LM )r P( LM )l )GQ LM r
0.
Daraus folgt für die chemischen Potentiale selbst
P( LM ) (T ,Vr ,Q LM ,Q gel ) P( LM ) (T ,Vl ,Q LM ) . r
l
r
(13.207)
l
Um die Druckabhängigkeit zu erhalten, drücken wir die Volumina durch die zugehörigen Drucke aus:
Vr
Vr (T , pr ,Q LM ,Q gel ); Vl
Vl (T , pl ,Q LM ) .
r
l
Damit schreibt sich (13.207)
P( LM ) (T , pr ,Q LM ,Q gel ) P( LM ) (T , pl ,Q LM ) . r
r
l
(13.207a)
l
13.12.3 Dampfdruckerniedrigung Lösen wir etwa Kochsalz (NaCl) in Wasser, so beobachten wir eine Dampfdruckerniedrigung über der Lösung verglichen mit dem Dampfdruck des reinen Lösungsmittels. Das liegt daran, dass die Anziehungskraft zwischen den Salzionen und den Lösungsmittelmolekülen größer ist als zwischen Letzteren alleine. Um ein Molekül aus der flüssigen in die dampfförmige Phase zu überführen, muss also mehr Energie aufgewandt werden als aus dem reinen Lösungsmittel. Daher sinkt der Dampfdruck über der Lösung. Die Abnahme ist proportional zur Konzentration des gelösten Stoffes. Dies wurde zuerst von F. M. Raoult (1830-1901) experimentell abgeleitet, und zwar gilt das nach ihm benannte erste Raoultsche Gesetz
300
13 Phänomenologische Wärmelehre
'p p0
Q gel Q gel Q LM
(13.208)
Hierin sind Q gel bzw. Q LM die Anzahl der Mole des gelösten Stoffes bzw. des Lösungsmittels. Es wird dabei vorausgesetzt, dass der Dampfdruck des gelösten Stoffes gegenüber Abb. 13.25: Kreisprozess dem Dampfdruck des Lözur Herleitung des ersten sungsmittels, p0, vernachläsRaoultschen Gesetzes sigt werden kann. Zur Ableitung der Beziehung gibt es wieder zwei Hahn Wege: Entweder überlegen wir uns einen künstlichen Kreisprozess oder wir benutzen die thermodynamischen h Potentiale. Im ersten Fall betrachten wir zwei KamL LM mern (Abb. 13.25), die in der Semipermeable Wand Abbildung unten durch eine semipermeable Wand miteinander in Verbindung stehen. Am oberen Ende der Kammern befindet sich ein Hahn, der zu einem Zylinder mit beweglichem Kolben führt. Die linke Kammer enthalte reines Lösungsmittel, die rechte Kammer nehme die Lösung auf. Die Flüssigkeitspegel sind zunächst gleich. Als ersten Schritt lassen wir nun durch Zuführung von Wärme aus der linken Kammer 1 Mol Lösungsmittel verdampfen. Es handelt sich also um einen isothermen Prozess. Dabei entsteht die Arbeit
W
p 'V
p(VD VFl ) | RT
(13.209)
Dieser Dampf gelangt über den Hahn in den Zylinder. Nach Schließen des Hahns lassen wir in einem 2. Schritt den Dampf sich reversibel ausdehnen bzw. komprimieren, bis der Druck mit dem Dampfdruck über der Lösung übereinstimmt. Da pV = const. ist, gilt auch
p'V V 'p 0 .
(13.210)
Also wird die Arbeitsleistung
p'VD
VD 'p ;
(13.211)
' p ist die Differenz (pL – pLM) der Dampfdrucke über der Lösung und dem reinen Lösungsmittel.
13 Phänomenologische Wärmelehre
301
In einem dritten Schritt wird der Zylinder mittels des Hahns mit der rechten Kammer verbunden und der Dampf unter Aufwendung von Arbeit kondensiert. Die dabei frei werdende Wärmemenge wird abgeführt.
W
p(VD VFl ) | RT .
(13.212)
Addieren wir die einzelnen Arbeitsanteile, so verbleibt
Wges
VD 'p .
(13.213)
Diese Arbeit muss nun mit der Hubarbeit übereinstimmen, welche die Osmose zwischen Lösungsmittel und Lösung leistet, wenn wir 1 Mol des Lösungsmittels von der Oberfläche links von der semipermeablen Membran auf die Oberfläche der rechten Seite der Membran übertreten lassen. Diese osmotische Arbeit ist gleich der Hubarbeit
WHub
VFl U Fl g 'h VFl S ,
(13.214)
denn der hydrostatische Überdruck auf der Seite der Lösung entspricht dem osmotischem Druck. Gleichsetzen der beiden Arbeitsbeträge ergibt unter Beachtung von S Q RT
VD ( pL pLM ) VFl S pLM pL
VFlQ RT ,
VFlQ RT VD
(13.215a)
pLM VFlQ .
(13.215b)
Die Größe Q V f l gibt die Zahl der in einem Mol Lösungsmittel gelösten Mole an. Also lässt sich schreiben
pLM pL 'p { pLM pLM
Q gel . Q gel Q LM
Das ist aber das erste Raoultsche Gesetz, was damit bewiesen ist. Das Minuszeichen drückt aus, dass es sich um eine Druckabnahme handelt. Abb. 13.26 zeigt theoretische und experimentelle Ergebnisse miteinander verglichen. Bei kleinen Konzentrationen des gelösten Stoffes findet sich gute Übereinstimmung.
(13.216)
p
Experiment Theorie
Abb. 13.26: Dampfdruckerniedrigung nach dem ersten Raoultschen Gesetz im Vergleich zu experimentellen Ergebnissen gel
/(
gel
+
LM
)
302
13 Phänomenologische Wärmelehre
13.12.4 Siedepunkterhöhung und Gefrierpunkterniedrigung In einer Lösung erhöht sich infolge der Dampfdruckerniedrigung die Siedetemperatur und die Gefriertemperatur sinkt. Die gelösten Salzionen behindern die Ausbildung einer Gitterstruktur. Aus Abb. 13.27 sind die Dampfdruckkurven als Funktion der Temperatur für eine Lösung und reines Lösungsmittel zu ersehen. Eine Flüssigkeit siedet, wenn der Sättigungsdampfdruck gleich dem Außendruck ist. Damit dies für die Lösung der Fall ist, müssen wir deren Temperatur also um 'TS gegenüber der Siedetemperatur des reinen Lösungsmittels erhöhen. Wir wollen 'TS berechnen. Dazu gehen wir von der Dampdruckkurve des reinen Lösungsmittels aus,
p p
p0 e
/ RT
.
(13.105)
Durch Differentiation nach T ergibt sich
Luftdruck
dp dT
/ p , RT 2
(13.217)
Auflösen nach dT, Benutzung des ersten Raoultschen Gesetzes und Übergang zu endlichen Größen führt zur Siedepunkterhöhung 'T (TS ) LM (TS ) L T
Abb. 13.27: Dampfdruckkurve einer Lösung im Vergleich zu der des reinen Lösungsmittels
'TS
RT 2 Q gel / Q gel Q LM
Diese Beziehung Gesetz.
heißt
zweites
(13.218)
Raoultsches
Wir wenden uns nun wieder Abb. 13.24 zu. Wir sehen, dass eine Lösung infolge des erniedrigten Dampfdruckes bei einer tieferen Temperatur gefriert bzw. schmilzt als das reine Lösungsmittel. Es ergibt sich
'TSchm
Q gel RT 2 . / Schm Q gel Q LM
(13.219)
Hierin ist ' Schm die Schmelzwärme. Siedepunkterhöhung und Gefrierpunkterniedrigung hinreichend verdünnter Lösungen sind also in guter Näherung proportional zur Konzentration der gelösten Komponente, denn in diesem Fall kann Q gel gegenüber Q LM vernachlässigt werden. Die Siedepunkterhöhung kann zur Molekulargewichtsbestimmung benutzt werden.
13 Phänomenologische Wärmelehre
303
Die Gefrierpunkterniedrigung ist größer als die Siedepunkterhöhung. Für Wasser ergibt sich
1.986 273, 22 79700
'TSchm , mol
1,860 K .
(13.220)
Für die Siedepunkterhöhung folgt
'TS , mol
1,986 373, 22 539000
0,513K .
(13.221)
Wir erkennen unschwer, dass die Differenz vor allem im Unterschied der Schmelz- und Verdampfungswärme liegt.
Zusammenfassung x Nullter Hauptsatz: Alle Systeme, die mit einem gegebenen System im thermischen Gleichgewicht stehen, befinden sich auch untereinander im thermischen Gleichgewicht. Sie haben also eine Eigenschaft gemeinsam, die wir als Temperatur bezeichnen. x Das Gay-Lussac Gesetz lautet
p
p0 (1 J tC ); J
1/ 273,15 ,
wobei p den Gasdruck und tC die Temperatur in °Celsius darstellen. x Die spezifische Molwärme ist gleich der Wärmemenge, die benötigt wird, um ein Mol eines Stoffes von 14,5 °C auf 15,5 °C zu erwärmen. x Die Zustandsgleichung für ideale Gase lautet für Q Mole
p V Q R T , wobei p, V und T Druck, Volumen und Temperatur des Gases darstellen. R ist die allgemeine Gaskonstante. x Die van-der-Waalssche Zustandsgleichung für reale Gase ist
(p
a ) (V b) Q R T , V2
wobei a und b Gas-spezifische Konstanten sind.
304
13 Phänomenologische Wärmelehre
x Erster Hauptsatz (Energieerhaltungssatz): Die Zunahme der inneren Energie dU eines Systems setzt sich zusammen aus der ihm zugeführten Wärmeenergie G Q und der an ihm geleisteten Arbeit G W .
dU
G Q GW ,
oder: U ist eine Zustandsgröße, dagegen nicht Q und W. x Die Poisson-Gleichungen lauten 1
pV N
const ,
TV N 1
const ,
Tp N
1
const .
Hierin bedeutet J das Verhältnis der spezifischen Wärme bei konstantem Druck und bei konstantem Volumen, N c p / cV . x Der Wirkungsgrad des Carnotschen Kreisprozesses ist gegeben als
K 1 T2 / T1 , wobei T1 und T2 die Temperaturen der beiden Wärmespeicher sind, aus denen Wärmeenergie entnommen bzw. in das Wärme abgeführt wird. x Der zweite Hauptsatz macht eine Aussage über die Richtung, in der Prozesse ablaufen. Eine Formulierung lautet: Es ist unmöglich, eine periodisch arbeitende Maschine zu konstruieren, die nichts anderes bewirkt als einem Körper dauernd Wärme zu entziehen und diese in Arbeit zu verwandeln. x Die Entropiezunahme eines Systems dS ist definiert als die ihm bei der Temperatur T reversibel zugeführte Wärmemenge, dS G Qrev / T . Die Entropie ist daher zunächst nur definiert bis auf eine Konstante SA. B
SB
³
A
G Qrev T
SA .
x Die thermodynamischen Potentiale eröffnen die Möglichkeit, alle Zustandsgrößen durch partielle Differentiation zu gewinnen. x Der dritte Hauptsatz macht die Aussage, dass die Entropie am absoluten Nullpunkt null wird.
13 Phänomenologische Wärmelehre x
305
Die Clausius-Clapeyron-Gleichung für die Dampfdruckkurve lautet
dT T
(Vg V fl ) /
dp .
Hierin bedeuten Vg bzw. Vfl die Volumina der gasförmigen bzw. der flüssigen Phase sowie / die Verdampfungswärme. Eine analoge Beziehung gilt für die Schmelzdruckkurve. x Bei einer Entspannung eines realen Gases mittels eines Drosselventils ändert sich dessen Temperatur. Der Prozess läuft bei konstanter Enthalpie ab. Die Temperaturänderung wird als Joule-Thomson-Effekt bezeichnet. Unterhalb einer bestimmten Inversionstemperatur lassen sich Gase verflüssigen. Es gilt näherungsweise
2a § · 'T | ¨ (b ) / Cmolp ¸ 'p . RT © ¹ Hierin sind a und b die Konstanten der van-der-Waals Gleichung. x Der osmotische Druck S einer Lösung berechnet sich aus der Beziehung
S Q RT / V . x
Die Dampfdruckerniedrigung über Lösungen ergibt sich aus dem ersten Raoultschen Gesetz:
pLM pL 'p { pLM pLM
Q gel Q gel Q LM
1.
Darin bedeuten LM das Lösungsmittel und L die Lösung. x Die Siedepunkterhöhung von Lösungen berechnet sich aus dem zweiten Raoultschen Gesetz:
'TS
RT 2 Q gel , / Q gel Q LM
wobei / die Verdampfungswärme darstellt.
x Für die Gefrierpunkterniedrigung (Schmelzpunkterniedrigung) gilt ein analoger Ausdruck, wobei / Schm die Schmelzwärme bedeutet.
'TSchm
Q gel RT 2 / Schm Q gel Q LM
306
13 Phänomenologische Wärmelehre
Übungsaufgaben 1a) Berechnen Sie den Wärmestrom durch eine 0,2 m dicke Betonmauer, deren Innenseite eine Temperatur Ti = 25 °C und deren Außenseite eine solche von Ta = 0 °C besitzt. In einem zweiten Schritt möge die Mauer mit einer 0,1 m dicken Platte aus Styropor ausgekleidet sein. b) Führen Sie die Berechnung für eine 30 m lange Fernwärmeleitung (Ti = 130 °C, Ta = 20 °C) und einer Isolationsschicht von 0,1 m Dicke durch. Verluste sollen in beiden Fällen vernachlässigt werden. 2. Berechnen Sie die van der Waals-Konstanten a und b für die Werte Pkrit = 2,1 107 Pa und Tkrit = 650 K. 3. Sie pumpen morgens bei 10 °C Ihr Schlauchboot bis zu einem Druck von 1,5 bar auf. Dazu benötigen Sie 32 Mol Luft. a) Wie groß ist das Volumen des Schlauchbootes? b) Zur Mittagszeit ist die Temperatur auf 35 °C angestiegen. Welcher Druck stellt sich im Schlauchboot ein, wenn das Volumen konstant bleibt? c) Welche Wärmemenge wurde dabei zugeführt? (cv = 20,7 J/molK) d) Das Schlauchboot Ihres Freundes hat zwei Kammern. Die eine Kammer hat einen Druck von 1,3 bar bei einem Volumen von 0,3 m3, die zweite Kammer hat einen Druck 1,5 bar und ein Volumen von 0,2 m3. An einer Schwachstelle zwischen den beiden Kammern reißt die Trennwand. Welcher Gesamtdruck stellt sich nach Druckausgleich ein, wenn die Temperatur bei diesem Vorgang konstant bleibt? 4. 1 Mol N2 wird adiabatisch von 300 K und einem Anfangsdruck von 10 atm auf 1 atm entspannt. Berechnen Sie die Endtemperatur, wenn Sie die van der Waals-Korrekturen mit berücksichtigen. Deuten Sie das Ergebnis mikroskopisch. a = 0,1416 m6 Pa/Mol2; b = 3,913 10-5 m3/Mol. 5. Ein Glaskolben von 2 l Inhalt wird bei 20 °C und einem Druck von 0,8 bar mit NO2 gefüllt und zugeschmolzen. Beim Erhitzen auf 520 °C zerfällt NO2 in NO und O2. Welchen Druck muss der Kolben aushalten? 6. Ein Kalorimeter mit einer Wärmekapazität C ist mit Wasser des Volumens Va der Temperatur Ta gefüllt. Zur Bestimmung von C geben Sie eine bestimmte Menge Wasser (V0) der Temperatur T0 hinzu und ermitteln die Endtemperatur TE. Die Messwerte sind Va 1 l Ta 20 qC Te 46 qC V0 0, 6 l T0 95 °C Sie wollen nun die spezifische Wärme eines aus Al bestehenden Körpers und eines solchen aus Cu bestimmen. Dazu messen Sie die Werte a) mAl 0,358 kg TE 24,5 qC b) mCu
0, 658 kg
TE
Welche Werte erhalten Sie?
23, 6 qC.
13 Phänomenologische Wärmelehre
307
7. Wie groß ist die totale Entropieänderung, wenn zwischen zwei Wärmespeichern mit T1 = 553 K und T2 = 278 K die Wärmemenge von 100 kJ ausgetauscht wird? 8. Die Schmelzwärme von Wasser ist
6×103 J/mol
und die Verdampfungswärme
3
40, 69 10 J/mol . Berechnen Sie die Entropieänderung von 1 Mol Wasser, das reversibel bei konstantem Druck von –16 °C auf 160° C erwärmt wird. Die Wärmekapazität von Eis ist 37, 67 J/K×mol , die von Dampf beträgt 36,1 J/kmol .
9. Berechnen Sie die Entropieänderung, die bei der Mischung von 15 g Wasser von 95 °C mit 30 g Wasser von 20 °C auftritt. 10. Der Kompressor eines Kühlschrankes liefert eine mechanische Energie von 1,2 J. Dadurch wird dem Inneren bei 3 °C Wärme entzogen und an die Küche bei 26 °C abgegeben. Setzen Sie einen Carnot-Prozess voraus. a) Wie ändert sich die Entropie im Inneren? b) Wie ändert sich die gesamte Entropie in Küche und Kühlschrank? 11. Die Ausrichtung der magnetischen Einzelmomente einer paramagnetischen Substanz folgt G G bei hinreichend hohen Temperaturen T dem Curie-Gesetz M ^C /( μT )` B . Darin bedeuten G G M die Magnetisierung und B das angelegte magnetische Feld (s. Bd. II). C ist die CurieKonstante und μ die konstante Permeabilität. Berechnen Sie die freie Energie und die freie Enthalpie einer solchen Substanz. Zeigen Sie zunächst, dass die Wärmekapazität Cm(T) nur von der Temperatur abhängt. Im Folgenden möge diese als bekannt betrachtet werden. 12. Bei welcher Temperatur gefriert Wasser mit einem Salzgehalt von 30 g NaCl/l? 13. Sie haben einen guten Freund zu sich nach Hause eingeladen. Sie bereiten zwei Tassen Kaffee und sind gerade im Begriff, Ihrem Freund etwas Milch anzubieten, als Ihr Telefon klingelt. Da Sie ein wichtiges Gespräch erwarten, heben Sie den Hörer ab. Ihr Freund wartet daraufhin mit dem Eingießen, damit der Kaffee möglichst lange heiß bleibt. War sein Vorgehen richtig? 14. Ein Haus soll durch eine Wärmepumpe mit Heizwärme versorgt werden. Wo würden Sie eine solche installieren und wie soll sie betrieben werden? Welches Wärmereservoir können Sie anzapfen? Von welcher Temperatur? Wie groß ist der Wirkungsgrad der Maschine? Rechnen Sie mit einer Heizkörpertemperatur von 60 °C. 15. Wie groß ist bei einer Temperatur von 16 °C der osmotische Druck einer Zuckerlösung, die pro Liter Wasser 12 g Zucker enthält? (mmol = 260 g/mol)
14
Kinetische Gastheorie
14.1
Temperatur
In Kap. 10.3.1 haben wir nach dem durch ein Gas hervorgerufenen Druck gefragt und dabei einen Ausdruck hergeleitet, der den Druck auf die Geschwindigkeit der Atome bzw. Moleküle zurückführt.
p
Nm v 2 3d 3
Nm v 2 3V
1 nm v 2 3
(10.38)
Die Größe d3 stellt das Gasvolumen V dar, N ist die zugehörige Anzahl der Moleküle. Mit m ist die Masse eines Atoms bzw. Moleküls gemeint. Mit Nm = mges ergibt sich
pV
2 mges v 3 2
2
2 Ekin . 3
(10.39)
Die Größe mges v 2 / 2 stellt die mittlere kinetische Translationsenergie der Teilchen dar. Mit Hilfe der allgemeinen Gasgleichung folgt, dass die Translationsenergie proportional zur absoluten Temperatur ist.
2 Ekin , mol 3
2 N Amv2 3 2
RT
(14.1a)
Hierin bedeutet NA die Anzahl der Teilchen in 1 Mol. Sie heißt Avogadro-Zahl (L. R. Avogadro, 1776-1856) Damit ist die Temperatur eines einatomigen Gases zurückgeführt auf dessen mittlere kinetische Energie. Durch Einführung der Boltzmann-Konstante wird aus (14.1a)
k:
m v2 2
R NA
(1,380662 r 0,000044) 1023 J / K .
3
kT . 2
(14.2)
(14.1b)
Jedes Teilchen kann sich in drei Raumrichtungen x, y, z bewegen; wir sagen, es habe drei Freiheitsgrade der Translation. Es gilt
v2
v 2x v 2y v 2z .
310
14 Kinetische Gastheorie
Die mittlere Energie pro Freiheitsgrad beträgt daher
Ekin , Fr
1 kT 2
(14.3a)
Ein Molekül mit f Freiheitsgraden besitzt die mittlere Energie Ekin
f kT / 2 ; (14.3b)
auf jeden Freiheitsgrad entfällt also die mittlere Energie Ekin, Fr
kT / 2 .
Moleküle haben nicht nur drei Freiheitsgrade der Translation, sondern zusätzlich drei Freiheitsgrade der Rotation, da sie um drei zueinander senkrechte Achsen durch den Schwerpunkt rotieren können. Ferner besitzen sie zwei Freiheitsgrade der Schwingung, je einen für die potentielle und die kinetische Schwingungsenergie. Die Rotationsenergie pro Freiheitsgrad beträgt (vgl. Kap. 5.9)
Erot
L2 = 2l (l 1) o , l 1, 2,3.... 2I 2I
(14.4)
und die Schwingungsenergie
Evib
1 =Z (v ) , v 0,1, 2.... 2
(14.5)
l und v sind Quantenzahlen, die aus der Quantenmechanik folgen. Für uns ist zunächst nur wichtig, dass Erot die Größenordnung von kT besitzt, dagegen Evib um eine bis zwei Zehnerpotenzen darüber liegt. Die Rotationsfreiheitsgrade sind daher bei Zimmertemperatur angeregt, die Schwingungsfreiheitsgrade dagegen nicht, sie tragen nicht zur inneren Energie bei. Ein Wort muss noch zur Rotationsenergie eines zweiatomigen Moleküls gesagt werden. Bereits eine klassische Betrachtung zeigt, dass das Trägheitsmoment bezüglich der Kernverbindungsachse sehr viel kleiner ist als das Trägheitsmoment bezüglich der dazu senkrechten Achsen. Die zugehörige Rotationsenergie nimmt also sehr große Werte an und ist bei Zimmertemperatur sicher nicht angeregt. (14.3a) wird als Gleichverteilungssatz der Energie (Äquipartitionstheorem) bezeichnet. Auf die experimentelle Prüfung von (14.3b) kommen wir gleich zurück. Zunächst wollen wir (die uns schon bekannte) Poisson-Gleichung auf der Basis der kinetischen Gastheorie ableiten.
14 Kinetische Gastheorie
14.2
311
Poissongleichungen
Wir betrachten einatomige Gase. Ihre innere Energie besteht lediglich aus Translationsenergie. Nach (14.1b) gilt
U
NA
mv2 . 2
Damit wird (10.22)
2 U. 3
(14.6)
2 d ( pV ) dU . 3
(14.7)
pV
Wir denken uns nun das Gas von der Außenwelt thermisch isoliert ( G Q Arbeit leisten,
pdV
dU .
0 ) und lassen es
(14.8)
Setzen wir dies in die vorhergehende Beziehung ein, so erhalten wir
pdV
3 3 pdV Vdp . 2 2
(14.9)
Zusammenfassung und Trennung der Variablen führt zu
5 dV dp 3 V p
0,
(14.10)
5 ln V ln p const. , 3 pV N
const., N
5 . 3
(14.11)
(14.12)
Dieser Ausdruck entspricht der Poisson-Gleichung, die wir bereits früher auf der Basis der phänomenologischen Thermodynamik aus dem ersten Hauptsatz abgeleitet hatten (Kap. 13.6.4). N war dort definiert als das Verhältnis der spezifischen Wärmen bei konstantem Druck und konstantem Volumen, N c p / cV .
312
14 Kinetische Gastheorie
Der Wert für N blieb unbekannt, er musste experimentell bestimmt werden. Die kinetische Gastheorie liefert jetzt auch den Wert von N für einatomige ideale Gase. Die Übereinstimmung mit den experimentellen Werten für Edelgase ist gut (Tab. 14.1). Geringe Abweichungen sind darauf zurückzuführen, dass die Gase nicht streng ideal sind
Gas
He
Ar
H2
O2
N2
CO2
cp, mol
20,90
20,89
20,88
28,84
29,34
36,84
N
1,63
1,67
1,41
1,40
1,40
1,29
Tab. 14.1: Spezifische Molwärme [J/mol Grad] bei konstantem Druck und Adiabatenexponent einiger Gase bei 20 °C
Wir können unsere Überlegungen auf Moleküle erweitern. Sei f die Zahl der Freiheitsgrade eines Gasmoleküls. Dann ist die innere Energie für ein Mol des Gases
U
NA f
kT 2
f
RT . 2
(13.13)
Wir interessieren uns für die spezifischen Wärmen cmol,p und cmol,V. Für Letztere ergibt sich
dU dT
cmol ,V
f
R . 2
(14.14)
In Kap. 13 hatten wir für die Differenz der spezifischen Wärmen gefunden
cmol , p cmol ,V
R.
(13.29)
Damit erhalten wir für die spezifische Wärme bei konstantem Druck cmol,p
cmol , p
( f 2)
R . 2
(14.15)
Mit (15.14) und (15.15) folgt für N
N
f 2 . f
(14.16)
14 Kinetische Gastheorie
313
Für ein einatomiges ideales Gas, f = 3, ergibt sich wieder N 5 / 3 , für ein zweiatomiges Gas mit Rotationsanregung finden wir N 7 / 5 usw. Ein Blick auf Tab. 14.1 zeigt uns, dass auch für zwei- und dreiatomige Moleküle Experiment und Theorie gut übereinstimmen.
14.3
Boltzmann-Verteilung
In Kap. 10.3.2 hatten wir die barometrische Höhenformel abgeleitet. Sie gibt uns Auskunft darüber, wie der Druck p mit der Höhe h über dem Erdboden abnimmt.
p
U0 g h p0
p0 e
mges g h
p0 e
p0V0
p0 e
mN A g h p0V0
.
(10.42)
Betrachten wir ein Mol eines Gases. Beachtung der allgemeinen Gasgleichung im Nenner des Exponenten ergibt mit R = NAk
p
p0 e
mgh kT
.
(14.17)
Der Faktor kT trägt den Namen „Boltzmann-Faktor“ (Boltzmann, L. 1844-1906). Da bei konstanter Temperatur nach dem Boyle-Mariotteschen Gesetz der Druck proportional zur Teilchenzahldichte n(h) ist, lässt sich schreiben
n(h) n0 e
mgh kT
n0 e
E pot kT
.
(14.17a)
Die barometrische Höhenformel gibt also das Verhältnis der Teilchenzahldichten in verschiedenen Höhen an. Einen Ausdruck dieser Art finden wir häufig. Denken wir z.B. an die Dampfdruckkurve eines gesättigten Dampfes,
p
p0 e
/ RT
.
(14.18)
/ ist dabei die molare Verdampfungswärme. Führen wir stattdessen die zur Verdampfung eines einzelnen Moleküls erforderliche Verdampfungswärme O / / L in den Exponenten ein, so erhalten wir
n
n0 e
O kT
.
(14.19)
Dabei wurde wieder von der Proportionalität zwischen Druck und Anzahldichte Gebrauch gemacht. Der Ausdruck ist also formal identisch mit (14.17). In beiden Fällen steht links die Anzahldichte. Je größer diese ist, umso größer ist die Wahrscheinlichkeit, ein Molekül in einer
314
14 Kinetische Gastheorie
bestimmten Höhe bzw. im Dampf anzutreffen. Es liegt daher nahe, dass ein allgemeingültiger Zusammenhang existiert. Wir postulieren: Besitzt ein System eine Anzahl von Zuständen mit den Energien E1, E2,, …., so ist die Wahrscheinlichkeit, dass sich das System im Zustand i befindet,
Pi
gi e
Ei kT
(14.20)
gi bezeichnet das statistische Gewicht des Zustandes i. Verschiedene Zustände besitzen verschiedene statistische Gewichte, wenn ihre Wahrscheinlichkeiten bereits unabhängig von allen energetischen Betrachtungen verschieden sind. Die Beziehung trägt den Namen „Boltzmann-Verteilung“. Sie kann mit den Methoden der statistischen Mechanik abgeleitet werden.
14.4
Maxwell-Boltzmannsche Geschwindigkeitsverteilung
Der Gasdruck (Kap. 10.3.1.) ist eine Folge der unregelmäßigen Bewegung der Atome oder Moleküle. Um Zahlenwerte zu bekommen, müssen wir die Geschwindigkeitsverteilung der Teilchen kennen. Wir definieren eine Verteilungsfunktion f(v), die angibt, wie sich die Geschwindigkeiten auf die Teilchen verteilt. Für den Bruchteil der Atome oder Moleküle, G G G deren Geschwindigkeitsvektor zwischen v, v dv liegt, gilt also
G dN (v) N
G f (v) d 3 v .
(14.21)
Im Folgenden interessieren wir uns für die Beträge der Geschwindigkeiten; ihre Richtungen sollen alle gleich wahrscheinlich sein. Folglich
dN (v)
N ³ f (v) d 3 v .
(14.22)
V'
V ist gegeben durch das Volumen einer Kugelschale im Geschwindigkeitsraum, für die G v v v dv ist (Abb. 14.1). In diesem infinitesimal kleinen Bereich ist die Verteilungs-
funktion f(v) konstant. Also können wir sie vor das Integral ziehen. Es ergibt sich
dN (v)
N f (v) 4S v 2 d v .
(14.23)
f(v) genügt der Boltzmann-Verteilung,
f (v) Ce
m v2 2 kT
.
(14.24)
14 Kinetische Gastheorie
315
Einsetzen in die vorhergehende Gleichung liefert
dN (v) N
2
C 4S v e
m v2 2 kT
dv .
(14.25)
Die Konstante C lässt sich aus der Normierungsbedingung berechnen. f
1 dN (v) 1 . N ³0
(14.26)
v dv v
Mit der Verteilungsfunktion 3
2
vx
mv § m · 2 2 kT f (v) ¨ e dv ¸ © 2S kT ¹
3
wird (14.23)
2
mv § m · 2 2 kT 4S v ¨ e dv ¸ © 2S kT ¹
dN (v) N
vy
2
(14.27)
Abb. 14.1: Zur Berechnung der Maxwell-Boltzmannschen Geschwindigkeitsverteilung
Der Ausdruck gibt die Zahl der Atome bzw. Moleküle an, die eine Geschwindigkeit zwischen, v, v + dv ohne Berücksichtigung der Richtung besitzen. Sie führt den Namen Maxwell-Boltzmannsche Geschwindigkeitsverteilung. In Abb. (14.2) ist der Bruchteil dN/N (14.27) für zwei Temperaturen dargestellt. Wegen des Faktors 4 S v2 ist sie nicht symmetrisch um einen Mittelwert v verteilt. Ihre Abhängigkeit von der Temperatur ist erheblich. Das Maximum der Verteilung liegt bei der wahrscheinlichsten Geschwindigkeit vw. Durch Differentiation und Nullsetzen der Ableitung ergibt sich
2kT . m
vw
(14.28)
Die mittlere Geschwindigkeit, definiert als f
v
³ v f (v)d v ,
(14.29)
0
erhalten wir durch partielle Integration zu
v
8kT Sm
2 vw
S
,
(14.30)
316
14 Kinetische Gastheorie
dN/N T=100 K
T=300 K v (m/s)
0
400
800
Abb. 14.2: Maxwell-Boltzmannsche Geschwindigkeitsverteilung für zwei Temperaturen
1200
und das mittlere Geschwindigkeitsquadrat wird f
v2
³v
2
f (v)d v
0
3kT m
3 2 vw 2
(14.31)
Aus letzterer Beziehung folgt unmittelbar die mittlere kinetische Energie eines Teilchens mit drei translatorischen Freiheitsgraden f
m 2 v 2
3 kT 2
1 f kT . 2
(14.32)
Das entspricht dem bereits weiter oben eingeführten Wert. Zahlenwerte von v w , v, und sind in Tab. 14.2 zusammengestellt.
Gas
vw
v
He Ne Ar Xe H2 N2 O2 Co2
1065 472 338 186 1501 402 377 320
1202 533 381 210 1694 453 425 361
v2 1304 579 414 228 1839 492 461 392
Tab. 14.2: Geschwindigkeiten einiger idealer Gase bei T = 300 K
v2
14 Kinetische Gastheorie
317
Die Maxwell-Boltzmannsche Geschwindigkeitsverteilung lässt sich durch Ausmessung der Geschwindigkeit von Molekularstrahlen überprüfen. Diese gelangen aus einem Reservoir durch ein kleines Loch in eine Kammer, die an eine Vakuumpumpe angeschlossen ist. Der Druck muss soweit erniedrigt werden, dass die Moleküle auf ihrem Weg durch die Kammer nicht mit Luftmolekülen zusammenstoßen, d.h. die mittlere freie Weglänge der Gasmoleküle muss groß sein gegenüber den Kammerdimensionen. Der Molekularstrahl gelangt nach Passieren eines Geschwindigkeitsselektors in einen Detektor, dessen Funktionsweise hier nicht diskutiert werden soll. Es gibt verschiedene Nachweismöglichkeiten. Der Selektor besteht aus einer Reihe kreisförmiger Scheiben mit je einem Schlitz, die fest auf einer drehbaren Welle angebracht sind. Zunächst wollen wir uns auf zwei Scheiben beschränken (Abb. 14.3). Der Selektor lässt nur Moleküle in einem engen Geschwindigkeitsintervall passieren. Zu diesem Zweck sind die Scheiben gegeneinander verdreht, so dass die Schlitze zueinander einen Versatz aufweisen. Beträgt dieser 's R M , so gelangen nur solche Moleküle durch beide Schlitze, deren Flugzeit t = d/v gleich ist der Zeit RM / RZ , wobei Z die Winkelgeschwindigkeit der rotierenden Scheiben bezeichnet. Die Geschwindigkeit der durchgelassenen Moleküle ist also v
Zd . M
Beträgt die Schlitzbreite b
'v
v
(14.33) R 'M , so hat das Geschwindigkeitsfenster die Größe
'M
(14.34)
M
liegen, denn 'v v (1/ M 2 )'M .
b MolekularR strahl Abb. 14.3: Laufzeitmethode zur Bestimmung der Geschwindigkeitsverteilung in einem Molekularstrahl
d
Durch Änderung der Winkelgeschwindigkeit Z des Selektors lässt sich die Zahl der durchgelassenen Moleküle im betreffenden Geschwindigkeitsfenster messen und damit die Verteilung ermitteln. Bei der praktischen Ausführung eines Geschwindigkeitsselektors muss darauf geachtet werden, dass nicht auch Teilchen den Detektor erreichen, die nach Passieren der ersten Scheibe die zweite Scheibe bei deren nächster Umdrehung passieren; es werden also mindestens drei Scheiben benötigt.
318
14 Kinetische Gastheorie
14.5
Mittlere freie Weglänge
In einem abgeschlossenen Volumen befinden sich die Moleküle nach Maß ihrer kinetischen Energie durch Zusammenstöße mit benachbarten Molekülen in regelloser Bewegung. Die Strecke, um die sie sich zwischen zwei Zusammenstößen frei bewegen können, bezeichnen wir als mittlere freie Weglänge /. Wir wollen in unserem einfachen Modell ableiten, wie sich diese Größe zusammensetzt. Dabei machen wir die Annahme, dass die Dichte hinreichend klein ist, so dass keine Mehrfachstöße stattfinden. Wir erinnern uns an den in Kap. 4.4.1.2 eingeführten Stoßparameter b. Ein Stoß findet statt, wenn b r1 r2 , wobei r1 und r2 die Radien der Stoßpartner sind. Für das Folgende ist es einfacher, ein Teilchen I mit dem Radius r1 r2 zu postulieren. Ein anderes Teilchen wird mit diesem zusammenstoßen, wenn sein Mittelpunkt innerhalb einer Fläche, dem Stoß- oder Wirkungsquerschnitt V (s. Kap. 4.4.1.2), V S (r1 r2 ) 2 auf Teilchen I trifft. Wir betrachten nun N Teilchen in einem Volumen V A 'x . Die Wahrscheinlichkeit des Stoßes eines Teilchens pro Fläche mit den zunächst als ruhend angenommenen N/V anderen Teilchen längs der Wegstrecke 'x ist gleich
¦V N / V V 'x A N / V V 'x . A A
(14.35)
Durchfliegen N Teilchen pro Sekunde eine Schicht der Dicke 'x , so ist die Zahl ' N , die mit den N/V Teilchen zusammenstoßen,
N N / V V 'x .
'N
Als Folge dieser Stöße und der daraus resultierenden Ablenkung wird die Zahl der Teilchen im Volumen V um den Bruchteil dN / N abnehmen. Folglich gilt mit N / V n
dN N
N / V V 'x
o N ( x)
N 0 e nV x .
(14.36)
Der Exponent ist gleich der Zahl der Teilchen im Volumen V x . Nach der Definition des Stoßquerschnittes tritt ein Stoß auf, wenn nV x 1 . Die Länge x ist dann die mittlere freie Weglänge l
l
1 . nV
(14.37a)
Wird berücksichtigt, dass sich alle Teilchen bewegen, so ergibt die Rechnung für l
l
1 2 nV
.
(14.37b)
14 Kinetische Gastheorie
14.6
319
Statistische Deutung der Entropie
Im Rahmen der phänomenologischen Thermodynamik haben wir die Entropie als Zustandsgröße eingeführt. Als solche ist sie definiert als
dS
G Qrev T
,
(13.62)
wobei G Qrev die dem System reversibel zugeführte Wärmemenge ist. Bei von selbst ablaufenden, irreversiblen Prozessen hatten wir gesehen, dass die Entropie stets zunimmt. Beispiele sind die Wärmeleitung in einem Metallstab (s. oben) oder auch die Durchmischung zweier Gase oder Flüssigkeiten durch Diffusion. Auf Grund unserer Erfahrung erscheint uns gerade das letzte Beispiel plausibel. Denken wir uns etwa wasserlösliche blaue Tinte in einen Behälter mit klarem Wasser gegeben, so ist uns selbstverständlich, dass sich die Tinte nach einer gewissen Zeit gleichmäßig verteilt. Dagegen haben wir nie beobachtet, dass sich Tinte und Wasser wieder entmischen. Wir sind in Beurteilung der Situation vorsichtig und sagen, dass uns dieser Fall zumindest extrem unwahrscheinlich erscheint. In der Tat ist der Begriff der Entropie eng mit dem Begriff der Wahrscheinlichkeit eines Zustandes verknüpft. In der Wahrscheinlichkeitsrechnung wird als Wahrscheinlichkeit W der Quotient W
Zahl der günstigen Fälle Zahl der möglichen Fälle
(14.38)
bezeichnet. So ist die Wahrscheinlichkeit, bei einem Wurf einer Münze diese mit der Zahl nach oben zu finden, gleich ½, denn von den zwei möglichen Fällen, Zahl oder Bild, ist einer der günstige. Die so definierten Wahrscheinlichkeiten sind also höchstens gleich eins. Betrachten wir nun zwei noch nicht miteinander wechselwirkende Gase U und V. Sie mögen sich in zwei getrennten Kammern eines Behälters befinden. Die Wahrscheinlichkeit, ein Molekül nach Wegnahme der Trennwand in der linken Kammer zu finden, ist gleich ½. Die Wahrscheinlichkeit, zwei Moleküle der gleichen Sorte gleichzeitig in der linken Kammer anzutreffen, ergibt sich, wenn wir die vier möglichen Fälle betrachten:
r, r; r, l; l, r; l, l; nur der letzte Fall ist ein günstiger Fall. Also erhalten wir die Wahrscheinlichkeit zu
1/ 2 1/ 2 (1/ 2) 2 . Drei Moleküle einer Sorte können in acht Verteilungen auf die beiden Kammern vorkommen:
rrr rrl rlr lrr
rll lrl llr lll.
320
14 Kinetische Gastheorie
Nur die letzte zeigt die drei Moleküle alle in der linken Kammer. Mithin ist die Wahrscheinlichkeit gleich 1/ 8 (1/ 2)3 . Im allgemeinen Fall von N Molekülen haben wir demnach (1/ 2) N zu bilden. Betrachten wir 1 Mol; dann ist N N A R / k . Dieser Zustand, in dem die beiden Molekülsorten getrennt sind, ist also sehr unwahrscheinlich. In der statistischen Theorie der Wärme wird als Maß für die Wahrscheinlichkeit eines Zustandes direkt die Zahl der günstigen Fälle gewählt. Das ist gleichbedeutend mit der Zahl der Realisierungsmöglichkeiten, die für ein System existieren. Vergleichen wir den Zustand der getrennten Gase mit dem Zustand der ineinander diffundierten Gase. Wir wählen zunächst eine kleine Zahl von Molekülen, z.B. 8 für jedes Gas. Das Volumen des Systems teilen wir in 16 gleiche Zellen ein, so dass für jedes Molekül eine Zelle existiert. Die 8 Zellen der linken Kammer (vor Öffnung der Trennwand) können wir auf so viele verschiedene Arten mit den U- Teilchen besetzen wie es Vertauschungsmöglichkeiten der 8 Molekülnummern gibt. Das sind 8!. Das gleiche gilt für die V-Teilchen. Es gibt also 17220 Realisierungsmöglichkeiten für jedes der beiden Gase. Betrachten wir beide Gase zusammen, aber weiter im getrennten Zustand, so gehören zu jeder Art der Besetzung der U-Kammer alle 8! Besetzungen der V-Kammer. Insgesamt existieren also 8! 8! Besetzungsmöglichkeiten des Systems. Wir bezeichnen diese als Mikrozustände des Systems, die zu dem Makrosystem „getrennte Gase“ gehören. Analog verlaufen die Überlegungen für die durchmischten Gase. Wir haben in unserem Beispiel von 8+8 Molekülen auszugehen, die wir auf 16 Plätze verteilen können. Das sind (8+8)! Möglichkeiten. 16! ist wesentlich größer als 8! 8! , d.h. der vermischte Zustand ist erheblich wahrscheinlicher als der entmischte Zustand der beiden Gase. In einem abgeschlossenen System wird also die Diffusion von selbst ablaufen. Der umgekehrte Prozess läuft nicht freiwillig ab. Oben haben wir uns in Erinnerung gerufen, dass bei einem irreversiblen Prozess die Entropie zunimmt. Auf Grund unserer Wahrscheinlichkeitsüberlegungen sehen wir jetzt, dass die Entropiezunahme mit einer Zunahme der Zahl der Realisierungsmöglichkeiten einhergeht. Die Theorie liefert als allgemeinen quantitativen Zusammenhang
'S
k ln P
(14.39)
wobei k die Boltzmann-Konstante und P die Zahl der Realisierungsmöglichkeiten des Systems bedeuten. Wir wollen für unser Beispiel der Diffusion zweier Gase U und V die Entropiezunahme berechnen. Zu Beginn befinden sich in der linken Kammer NU Moleküle, in der rechten NV Moleküle. Druck und Temperatur in den beiden Kammern seien gleich. Die Entropie der getrennten Gase ist gleich der Summe der beiden Entropien
SU k ln( NU !) und SV k ln( NV !) , also SU SV k ln( NU ! NV !) .
(14.40)
Für die ineinander diffundierten Gase ergibt sich
SM
k ln( NU NV )!
(14.41)
14 Kinetische Gastheorie
321
Die Entropiezunahme bei der Diffusion folgt damit zu
'S
S M ( SU SV ) k ln
( NU NV )! . NU ! NV !
(14.42)
Setzen wir z.B.
NU
NV
NA / 2 ,
so schreibt sich (14.39)
'S
k ln
NA ! . § NA · § NA · ¨ ¸! ¨ ¸! © 2 ¹ © 2 ¹
(14.43)
Da NA eine sehr große Zahl ist, können wir zur Berechnung die Stirlingsche Näherungsformel für N! benutzen:
ln N ! N ln N N .
(14.44)
Durch Einsetzen folgt
'S
k ln N A 2
'S
kN A ln 2
'S
R ln 2 .
NA N ln A 2 2
(14.45a) (14.45b) (14.46)
Der gleiche Wert ergibt sich aus der phänomenologischen Thermodynamik (vgl. 13.66). Zur Berechnung der Entropiedifferenz benötigen wir einen reversiblen Prozess. Dazu stellen wir uns zwei Kammern vor, die auf der einander zugewandten Seite eine semipermeable Wand besitzen (Abb. 14.4). Die eine soll nur für die Gassorte U durchlässig sein, U die andere nur für die Gassorte V. Wir können daher die beiden Kammern ohne Arbeitsaufwand ineinander schieben. Im überlappenden Volumen beU+V finden sich dann beide Gase U und V. Um den gleichen Endzustand wie oben Abb. 14.4: Anordnung zur zu erreichen, müssen wir nach dem reversiblen Mischung zweier Zusammenschieben das Volumen noch Gase V isotherm und reversibel auf das Doppelte vergrößern.
322
14 Kinetische Gastheorie
Aus dem ersten Hauptsatz folgt (13.31)
GQ
pdV
Durch Benutzung des zweiten Hauptsatzes auf der linken Seite und der allgemeinen Gasgleichung auf der rechten Seite ergibt sich
TdS
RT
dV ; V
(14.47)
Durch Integration erhalten wir 2V1
'S
R³ V1
'S
dV , V
(14.48)
R ln 2
(14.49)
Zusammenfassung x Die mittlere Translationsenergie eines Atoms oder Moleküls beträgt
mges v 2
Ekin
2
,
sie ist proportional zur Temperatur:
2 Ekin 3
RT
x Die Boltzmannkonstante k hat den Wert
k:
R NA
1,381 102 3 J/K .
x Die mittlere kinetische Energie pro Freiheitsgrad eines Atoms oder Moleküls ist
Ekin , Fr
1 kT . 2
14 Kinetische Gastheorie
323
x Die Poisson-Gleichung in den Variabeln p und V lautet
pV N
const , wobei N :
cp
f 2 . f
cV
x Die Zahl der Atome oder Moleküle, die eine Geschwindigkeit zwischen v, und v + dv besitzen (Maxwell-Boltzmannsche Geschwindigkeitsverteilung) ist gegeben durch den Ausdruck 3
.
dN (v) N
2
mv § m · 2 2 kT 4S v ¨ dv ¸ e © 2S kT ¹ 2
x Die Entropie ist gegeben durch
S
k ln P .
P bezeichnet die Zahl der Realisierungsmöglichkeiten des Systems
Übungsaufgaben 1. Berechnen Sie die mittlere Geschwindigkeit a) eines Heliumatoms bei 2 K und bei 300 K, b) eines Stickstoffmoleküls bei 300 K, c) eines Quecksilberatoms bei 900 K. 2. In einem Glaskolben, der auf ca. 10-3 mbar evakuiert ist, befindet sich ein feines drehbares Schaufelrad mit vier einseitig berußten Glimmerplättchen als Schäufelchen („Lichtmühle“). Bei Beleuchtung dreht es sich, wobei die blanken Flächen nach vorne zeigen. Wird der Druck im Kolben weiter erniedrigt, so bleibt das Rad stehen. Dasselbe passiert bei Normaldruck. Erklären Sie die Wirkungsweise der Lichtmühle und die erwähnten Beobachtungen. 3. Ein annähernd ideales Gas ist durch einen Adiabatenkoeffizienten N = 5/3 (7/5) charakterisiert. Welche Aussagen erlauben diese Zahlenwerte? Wie groß sind die inneren Energien der Gase bei 300 K? 4. Im Jahr 1965 entdeckten A. Penzias und R. Wilson die vom Big-Bang herrührende kosmische Hintergrundstrahlung. Ihre maximale Intensität besitzt sie bei einer Wellenlänge O = 1,1 mm. Nach den noch zu behandelnden Strahlungsgesetzen entspricht das einer Temperatur von T = 3,7 K. Wie groß ist bei dieser die mittlere Geschwindigkeit von Wasserstoff- und Stickstoffmolekülen?
324
14 Kinetische Gastheorie
5. Die Dichte eines Gases aus Sauerstoffmolekülen betrage 1 Molekül/cm3 .Wie groß ist bei T = 300 K der zugehörige Druck? Welche mittlere freie Weglänge haben die Moleküle (V 45 1016 cm 2 ) ? 6. In einem Behälter (V = 5 l) befinde sich bei einer Temperatur von 300 K ein ideales zweiatomiges Gas. Wie groß ist der Druck? Das Gas werde adiabatisch auf 0,8 l komprimiert. Welche Werte nehmen Temperatur und Druck an?
III
Elektrik und Optik
15
Elektrostatik
15.1
Elektrische Ladung
15.1.1 Das Coulomb-Gesetz Wohl jeder hat schon einmal die Erfahrung gemacht, dass er nach dem Aufstehen von einem Stuhl beim Anfassen der Türklinke oder eines anderen metallischen Gegenstandes einen „elektrischen Schlag“ erhielt. Dieser rührt davon her, dass durch Herumrutschen auf der mit einem Kunststoffpolster bezogenen Sitzfläche eine Doppelschicht aus unterschiedlichen elektrischen Ladungen entstanden ist, die beim Aufstehen getrennt werden. Vorausgesetzt, die Schuhe leiten keine Ladung ab, trägt die betreffende Person eine elektrische Ladung. Auch beim Gehen über einen aus Kunststoff bestehenden Teppich kann ein solcher Effekt auftreten oder wenn wir einen Stab aus Bernstein oder Glas mit einem Tuch reiben. Derartige Erscheinungen waren schon im Altertum bekannt und erhielten im Laufe der Zeit den Namen Q Q Q -Q „Elektrizität“ (von dem griechischen Wort -Q -Q -Q Q „elektron“, das Bernstein bedeutet). Zur näheren Untersuchung knüpfen wir an die Abb. 15.1: Gleichnamige Ladungen stoßen bereits oben skizzierten Kraftwirkungen sich ab, ungleichnamige ziehen sich an zwischen Ladungen an. Zunächst betrachten wir zwei an Fäden aufgehängte Korkkugeln (Abb. 15.1). Berühren wir sie beide mit dem aufgeladenen Stab aus Bernstein, so beobachten wir, dass sie sich abstoßen. Dasselbe Ergebnis zeigt ein analoger Versuch mit einem geladenen Glasstab. Geben wir dagegen der einen Kugel eine Ladung vom Bernsteinstab, der anderen aber eine vom Glasstab, so stellen wir fest, dass sich die Kugeln anziehen. Wir schließen daraus, dass es zwei unterschiedliche Ladungstypen gibt, die nach G. Ch. Lichtenberg (17421799) als negative und positive Ladung bezeichnet werden und deren Träger Elektronen und Protonen heißen. Es sind stabile Teilchen mit der Elementarladung e r1, 60 1019 As sowie einer von null verschiedenen Masse von me = 9,1091 10-31 kg bzw. mp = 1,67 10-27 kg. Die experimentelle Verifikation folgt weiter unten. Die Ladungen auf den beiden Stäben entstehen dadurch, dass negativ geladene Elektronen vom Tuch auf den Bernsteinstab übergegangen sind, während im anderen Versuch Elektronen vom Glasstab auf das Tuch übergetreten sind. Protonen tragen wegen ihrer viel gößeren Masse kaum zum Ladungstransport bei. Das Vorgesagte gilt allgemein. Bei einer engen Berührung zweier Körper unterschiedlicher chemischer Zusammensetzung können bei unterschiedlich starker Bindung Elektronen von einem auf einen anderen Körper übergehen.
326
15 Elektrostatik
Zur Ladungsmessung lassen sich Elektroskope benutzen, von denen Ales verschiedene Ausführungen gibt. Bändchen Zwei von ihnen sind in Abb. 15.2 dargestellt, ein Zeiger-Elektroskop aus Metall und ein BlättchenElektroskop. Die Kräfte zwischen den Ladungen führen zu einer AusQuarzfaden lenkung des Zeigers bzw. der Metall-Blättchen. Versehen wir die Geräte mit einer Skala und eichen sie mit einer beliebigen, aber reproduzierbaren Ladung, so werden sie zu Elektrometern. Es zeigt sich, dass Abb. 15.2: Beispiele zweier Elektrometer: die Kraft proportional zur Ladung a) Zeigerelektroskop, zunimmt. Beide Geräte liefern allerb) Blättchen- (Wulfsches ) Elektroskop dings keine Information über das Vorzeichen der Ladung. Um die Kraft zwischen zwei Ladungen quantitativ zu fassen, ist die Coulombsche Drehwaage (Abb. 15.3) auf Grund ihrer Empfindlichkeit besonders geeignet. Die Messanordnung hat große Ähnlichkeit mit der Eötvösschen Drehwaage (Kap. 6). Eine Stange aus isolierendem Material ist in der Mitte an einem dünnen Faden aufgehängt. An den beiden Enden trägt sie je eine Metallkugel, von der eine elektrisch geladen ist. Ihr gegenüber befindet sich verschiebbar eine weitere geladene Metallkugel. Durch die Kraft zwischen den beiden Kugeln entsteht ein Drehmoment. Es dreht die Stange soweit aus ihrer Ruhelage heraus, bis ihr das rücktreibende Drehmoment des verdrillten Fadens das Gleichgewicht hält. Die Ladungsabhängigkeit der Kraft kennen wir bereits, wir können sie durch Messung des Verdrillungswinkels überprüfen. Variieren wir den Abstand der geladenen Kugeln, so Q1 erhalten wir das Abstandsgesetz,
G F
Q2
f
Q1 Q2 rˆ . r2
(15.1)
vom Laser
Fragen wir nach der Kraft von Q2 auf Q1, so ist rˆ der Einheitsvektor in Richtung von Q2 nach Q1. Die Größe f ist positiv; ihr Wert hängt vom benutzten Maßsystem ab, denn nur die Einheiten von F und r liegen bis jetzt fest, die für Q oder f können noch gewählt werden. Die Beziehung trägt den Namen Coulombsches Gesetz (Ch. A. Coulomb, 1736-1806). Abb. 15.3: Anordnung zur Verifikation des Coulombsches Gesetzes
15 Elektrostatik
327
15.1.2 Maßsysteme In der Elektrik werden hauptsächlich zwei Maßsysteme verwandt: das SI-System, das wir schon in Kap. 1 eingeführt haben, und das cgs-System. Hier benutzen wir, wie fast überall im Rahmen der Experimentalphysik üblich, ersteres System. Das cgs-System wird häufig in der Theoretischen Physik verwendet. Im SI-System tritt neben die Basisgrößen Länge, Masse, Zeit als vierte Grundgröße die Stromstärke I. Ihre Einheit wird über die Kraft zwischen zwei parallelen, Strom führenden Drähten bestimmter Geometrie definiert. Wir kommen darauf in Kap. 16.5 zurück. Die Einheit ist das „Ampere (A)“ (A. M. Ampere, 1775-1836). Die Ladung wird wegen der genaueren Messbarkeit auf die Stromstärke zurückgeführt.
I
dQ dt
o Q
³ I dt .
(15.2)
Dadurch erhält die Ladung die Einheit „1 As“; diese Einheit ist identisch mit der Einheit „Coulomb (C)“.
>Q @
1C 1 As .
(15.3)
Betragen die Ladungen im Coulombschen Gesetz 10-4 As, so wird für die Kraft F im Abstand von 1m ein Wert von 89,875 N gemessen,
F
f
108 (As) 2 1m 2
89,875 N .
(15.4)
Hieraus resultiert für den Vorfaktor f
f
8,9875 109
Nm 2 . ( As ) 2
(15.5)
Wir werden später sehen, dass dieser Zahlenwert der Größe
f
1 4SH 0
(15.6)
entspricht. Darin ist H 0 die Dielektrizitätskonstante im Vakuum; sie ist mit der Lichtgeschwindigkeit im Vakuum verknüpft und hat nach dem Obigen den Wert
H0
8,854 1012 As/Vm .
(15.7)
328
15 Elektrostatik
Das Coulombgesetz lautet damit im SI-System
G F
1 Q1 Q2 rˆ 4SH 0 r 2
(15.8)
Kommen wir nun zum cgs-System. In diesem wird der Vorfaktor f gleich eins gesetzt. Die Kraft wird in dyn angegeben, die Länge in cm, so dass wir für die Ladung erhalten
>Q @ > F @> r @
dyn1/ 2 cm .
(15.9)
Die Einheit der Ladung wird so gewählt, dass sich zwei Ladungen im Abstand von 1cm mit einer Kraft von 1dyn anziehen bzw. abstoßen. Sie trägt den Namen „elektrostatische Ladungseinheit (ESL)“ 1 ESL = 1 dyn1/2 cm.
(15.10)
Viele Beziehungen in der Elektrodynamik werden durch diese Festlegung vereinfacht. Der Nachteil liegt darin, dass eine Dimensions-Überprüfung sehr erschwert wird und die Umrechnung mechanischer Größen in elektrische und magnetische Einheiten recht umständlich ist.
15.2
Elektrisches Feld
15.2.1 Elektrische Feldstärke Angenommen, im Raum befindet sich ein ausdehnungsloser Körper, der eine Ladung Q trägt. Wir nennen sie Punktladung. Wir wollen ihre Eigenschaften kennen lernen. Das ist durch Anwendung des Coulomb-Gesetzes möglich, was bedeutet, dass wir mit einer Test- oder Probeladung q die Kraft auf diese als Funktion des Ortes messen. Als Eigenschaft der Ladung Q darf das Messresultat nicht von der Größe der Probeladung abhängen. Deswegen dividieren wir die jeweilig gemessene Kraft durch die Probeladung q. Die so erhaltene Größe spannt im G G Raum ein elektrisches Feld E (r ) der Ladung Q auf. Jedem Raumpunkt ordnen wir eine elektrische Feldstärke zu
G G E (r )
Q 4SH 0 r 2
rˆ .
(15.11)
Dieser Ausdruck hat die Form des Gravitationsfeldes (Bd. I, Kap. 6). Die Feldrichtung ist so festgelegt, dass sie für positive Ladungen radial nach außen weist. In Abb. 15.4 ist die Richtung der Feldlinien durch Pfeile dargestellt, die Stärke des Feldes durch die Dichte der Pfeile. Die Dimension des elektrischen Feldes ist Kraft/Ladung. Seine Einheit ist also 1 J/As. Die Kraft auf eine Ladung q im elektrostatischen Feld schreibt sich
15 Elektrostatik
329
r 1 E : 2 rˆ r
Qi r r1 P
r Ri
0 Abb. 15.5: Zur Überlagerung der Feldstärke mehrerer Punktladungen am Ort P
Abb. 15.4: Elektrische Feldstärke einer geladenen Metallkugel
G F
G qE .
(15.12)
G Sind im Raum mehrere Punktladungen vorhanden (Abb.15.5), so ist E die resultierende
G
elektrische Feldstärke im Raumpunkt R ,
G G Eres ( R )
G G Qi R ri ¦ G G G G. 4SH 0 1 ( R ri ) 2 R ri N
1
G Ist die Ladung mit einer Ladungsdichte U (r ) die Gesamtladung gegeben durch
Q
G
(15.13)
dQ / dV kontinuierlich im Raum verteilt, so ist
3
³ U dV ³ U (r ) d r ,
V
(15.14)
V
und wir erhalten außerhalb des Raumladungsgebietes
G G Eres ( R)
G G G 4SH 0 ³ ( R r ) 2 1
U (r )
G G Rr 3 G G d r. Rr
(15.15)
330
15 Elektrostatik
15.2.2 Elektrischer Kraftfluss G Wir betrachten ein elektrisches Feld E beliebiger Gestalt und Stärke. Ein Teil der Feldlinien G möge ein Flächenelement dA durchsetzen. Als elektrischen Kraftfluss durch dieses Flächenelement definieren wir das Skalarprodukt
G G E dA .
d ) el
(15.16a)
r E r dA r dA
Q
Abb. 15.6a: Zur Definition des elektrischen Flusses
Abb. 15.6b: Elektrischer Fluss einer positiven Raumladung und
G Er ist also ein Maß für die Anzahl der dA durchsetzenden Feldlinien (Abb. 15.6a). Der gesamte Fluss durch eine vorgegebene Fläche ergibt sich durch Integration zu
) el
G G EdA ³ .
(15.16b)
Wenden wir diese Beziehung auf eine geschlossene Fläche (die Flächennormale möge nach außen weisen) an, in deren Innerem sich eine Ladung Q befindet (Abb. 1.6b), so erhalten wir den gesamten elektrischen Fluss als
) el
G G
v³ E dA .
(15.16c)
A
Durch Benutzung des Gaußschen Satzes (Math. Anhang) lässt sich das schreiben als
) el
G G E v³ dA A
³
V ( A)
G di vE dV .
(15.17)
15 Elektrostatik
331
Was bedeuten diese beiden Gleichungen? Dazu betrachten wir zunächst den speziellen Fall des G elektrischen Feldes einer Punktladung, Gl. (15.11). Einsetzen von E in (15.16c) ergibt
Q
) el
4SH 0
rˆ G dA 2
v³ r
Q 4SH 0
v³ d :
1
H0
Q
1
H 0 V³
U dV
(15.18a)
also
G G E v³ dA A
G di v E
1
H0 1
H0
Q
1
H 0 V³
U dV
bzw.
U
(15.18b)
(15.18c)
Diese Beziehungen enthalten keine speziellen geometrischen Größen, so dass es nahe liegt, dass sie allgemeingültig sind. In Worten formuliert bedeuten sie Die Quellen des elektrischen Feldes sind die (positiven) Ladungen. (Gaußscher Satz der Elektrostatik, C. F. Gauß, 1777-1855) Gl. 15.18b gilt unabhängig von der gewählten Geometrie, denn ersetzen wir die Kugeloberfläche durch eine Anzahl von Kugelflächenelementen mit unterschiedlichen Abständen vom Zentrum (Abb. 15.7), in dem sich die Ladung Q befindet, so ist der Kraftfluss, der durch ein solches Flächenstück tritt, unabhängig vom Abstand, sofern der zugehörige Raumwinkel der Gleiche ist:
d ) r1
G G Er1 dAr1
dAr1
r12 dAr2 , r22
d ) r2 ,
(15.19)
(15.20)
Einsetzen in (15.19) ergibt
d ) r1
§ · r22 ·§ r12 E ¨ r2 2 ¸¨ 2 dAr2 ¸ d ) r2 r1 ¹© r2 © ¹
(15.21)
Abb. 15.7: Zur Verallgemeinerung des Gaußschen Satzes auf einen beliebig geformten, geladenen Körper undduauch
Hierin wurde für die Feldstärke das Coulombsche Gesetz benutzt. Eine beliebige geschlossene Oberfläche lässt sich durch unendlich viele infinitesimal kleine Kugelsegmente ersetzen. Die G dabei entstehenden senkrecht zum Radiusvektor bzw. zu E liegenden Flächenelemente liefern keinen Beitrag zum Fluss, da das Skalarprodukt verschwindet.
332
15.3
15 Elektrostatik
Elektrostatisches Potential und Spannung
Das elektrische Feld ist wie das Gravitationsfeld ein konservatives Kraftfeld, d.h. die Arbeit, die wir verrichten müssen, um eine Ladung entgegen dieser Kraft längs eines Weges von P0 nach P zu verschieben, ist unabhängig vom Weg. Ihr Betrag hängt also nur vom Anfangs- und Endpunkt ab (Abb. 15.8) und ist gegeben durch
G G ³ F dr P
W
P0
P
q
G
G
³ E dr
E pot ( P ) E pot ( P0 ) .
(15.22)
P0
2
Wir können diese Aussage auch so formulieren, wie wir es bereits in Kap. 13 getan haben. Führen wir nämlich die Ladung q auf einem anderen Weg vom Zielpunkt P zum Ausgangspunkt zurück, so muss das Integral über den geschlossenen Weg verschwinden. Anderenfalls hätten wir ein perpetuum mobile 1. Art vor uns. Es gilt also
P
1
G G
P1
v³ Edr
0,
bzw.
G rot E
0
(15.23a,b)
Abb. 15.8: Das elektrostatische Feld ist wirbelfrei. Kehren wir noch einmal zu (15.22) zurück. Die an der Ladung im elektrischen Feld verrichtete Arbeit wird im System als potentielle Energie Epot gespeichert. Dabei haben wir den Anfangswert des Integrals zu null normiert. Wir formulieren nun Der Quotient aus Epot und Ladung q heißt elektrostatisches Potential. Bilden wir die Differenz der Potentiale an zwei Punkten P1 und P2: P2
G G
M ( P2 ) M ( P1 ) : ³ Edr
(15.24a)
P1
Die Potentialdifferenz zwischen zwei Punkten P1 und P2 heißt elektrische Spannung. P2 G G U : M ( P2 ) M ( P1 ) : ³ Edr P1
(15.24b)
15 Elektrostatik
333
Spannungen werden in Volt (V) angegeben (A. Volta, 1745-1827).
>U @ > E / Q @
1kgm 2 A -1s -3 1V .
(15.25)
Damit ergibt sich die Einheit der potentiellen Energie zu
>Q U @
ª¬ E pot º¼
1VAs=1Ws .
(15.26a)
Die potentielle Energie pro Zeiteinheit definiert die Leistung. Die Einheit ist also 1VA, die als 1 Watt (W) bezeichnet wird (J. Watt, 1736-1819). Eine kleinere Energieeinheit, die vor allem in der Atom-, Kern- und Elementarteilchenphysik benutzt wird, ist das „Elektronenvolt“. Es ist definiert als die Energie, die benötigt wird, um ein Elektron gegen die Potentialdifferenz von 1Volt zu verschieben.
1eV 1,602 1019 C 1V 1,602 1019 J .
(15.26b)
Bei Kenntnis der elektrischen Feldstärke lässt sich aus (15.22) das elektrische Potential ermitteln. Umgekehrt legt die Beziehung nahe, dass aus dem bekannten Potential einer Ladungsverteilung die elektrische Feldstärke berechnet werden kann. Die entsprechende Gleichung lautet nach (3.34 mit 3.12)
G E
grad M ( x, y, z ) M .
(15.27)
Der gewonnene elektrische Feldvektor steht immer senkrecht auf den Flächen gleichen Potentials, den Äquipotentialflächen. Rufen wir uns den Gaußschen Satz der Elektrostatik in Erinnerung. In der differentiellen Form ergab er sich zu
G di v E
1
H0
U .
(15.28)
G Mit E aus (15.27) ergibt sich die Poisson-Gleichung (S.D. Poisson, 1787-1840).
G div E 'M
div grad M
U . H0
'M
U / H0 ; (15.29)
Bei gegebener Ladungsverteilung lässt sich das Potential aus diesem Ausdruck durch Integration prinzipiell berechnen.
334
15.4
15 Elektrostatik
Einige spezielle elektrische Felder und zugehörige Potentiale
15.4.1 Feld einer Punktladung Das elektrische Feld einer Punktladung beträgt nach (15.11)
G G E (r )
Q 4SH 0 r 2
rˆ
(15.30)
und wurde bereits in Abb. 15.4 dargestellt. Das Potential ergibt sich aus G r
G G
M ( P ) M (f) ³ Edr f
r
³ f
Q 4SH 0 r 2
dr
(15.31)
In unendlicher Entfernung vom Zentrum der Ladung soll das Potential verschwinden. Damit folgt
M (r )
Q 4SH 0 r
.
Die Äquipotentialflächen M (r )
(15.32)
const sind konzentrische Kugeln (Abb. 15.4).
15.4.2 Feld zweier gleichnamiger Punktladungen Wir wollen das elektrische Feld zweier positiver Punktladungen gleichen Betrages kennen lernen. Dazu überlagern wir die beiden Coulombfelder der Einzelladungen. Das resultierende Feld (Abb. 15.9) ist symmetrisch zur Mittelebene zwischen den Ladungen. Die abstoßende Wechselwirkung kommt dadurch zum Ausdruck, dass sich die Feldlinien in diesem Bereich zu meiden suchen.
y
x
Abb. 15.9: Elektrisches Feld zweier gleich großer, positiver Punktladungen
15 Elektrostatik
335
15.4.3 Feld eines elektrischen Dipols Unter einem elektrischen Dipol verstehen wir zwei ungleichnamige Ladungen gleichen Betrages, die in einem bestimmten Abstand d von einander angeordnet sind. Die Feldlinien der Einzelladungen haben entgegengesetzte Richtungen. Die positive Ladung wirkt als Quelle des zugehörigen Feldes, die negative Ladung als Senke, d.h. die Feldlinien des reultierenden Feldes entspringen in der positiven Ladung und enden in der negativen Ladung. Wir wollen elektrisches Feld und Potential in großer Entfernung vom Dipol berechnen. Es ist zweckmäßig, zuerst das Potential zu ermitteln. Es ergibt sich
r E
Abb. 15.10: Elektrisches Feld eines Dipols
Q §1 1· ¨ ¸ 4SH 0 © r1 r2 ¹
M
(15.33a)
Für r1 >> d können wir schreiben
Q r1 r2 4SH 0 r 2
M
Q d cos . 4SH 0 r 2
(15.33b)
Führen wir das Dipolmoment
G G p Q d cos - zˆ Qd ein, so bekommen wir
G
M (r )
GG pr . 4SH 0 r 3
(15.33c)
Das Potential ist rotationssymmetrisch mit der Richtung des Dipolmomentes als Symmetrieachse (Abb. 15.10). Wegen der 1/ r 2 -Abhängigkeit fällt es mit der Entfernung steiler ab als das Potential einer Punktladung. Das rührt daher, dass sich mit wachsendem Abstand die entgegengesetzten Potentiale der beiden Punktladungen zunehmend kompensieren. Die elektrische Feldstärke erhalten wir durch Bildung des Gradienten von M .
G E
gradM .
336
15 Elektrostatik
G Legen wir das Dipolmoment zu p von M
wM eˆx wx
wM eˆy wy
wM eˆz wz
(0, 0, p ) fest, so sind die Komponenten des Gradienten
· z w § eˆ ¨ 2 2 2 3/ 2 ¸ x wx © ( x y z ) ¹
· z w § eˆ ¨ 2 2 2 3/ 2 ¸ y wy © ( x y z ) ¹
4SH 0
· z w§ eˆ ¨ 2 2 2 3/ 2 ¸ z 4SH 0 wz © ( x y z ) ¹
p 4SH 0
p 4SH 0
p 4SH 0
p
p 4SH 0
p 4SH 0
p
3zx eˆx r5
3zy eˆy r5
§ 1 3z 2 · ¨ 3 5 ¸ eˆz r ¹ ©r
(15.34a)
3cos 2 eˆz . r3
Damit ergibt sich das elektrische Feld zu
G E
1 4SH 0 r
3
G (3 prˆ cos - p ) .
(15.34b)
Wird ein elektrischer Dipol in ein elektrisches Feld gebracht, so wirken auf ihn Kräfte. Ist das Feld homogen, d.h. nach Richtung und Betrag konstant, so greift an der positiven Ladung Q G G G G die Kraft F1 QE an und an der negativen die Kraft F1 QE an. Auf Grund des resultierenden Drehmomentes
G D
G G pu E
(15.35)
stellt sich der Dipol parallel zum äußeren Feld ein. Erwartungsgemäß ist in dieser Stellung seine potentielle Energie am kleinsten. Es ist
QM1 QM 2
W pot Mit M1 M2
W pot
Q (M1 M2 ) .
(15.36a)
GG E d ergibt sich
GG pE .
(15.36b)
Im inhomogenen Feld wirkt auf den Dipol die Kraft
G F
G G G G G Q E (r d ) E (r )
^
`
G G dE Qd G , dr
(15.37a)
15 Elektrostatik
G F
337
G G p grad E
(15.37b)
Ein Dipol erfährt demnach eine Kraft in Richtung des elektrischen Feldes.
15.4.4 Feld einer geladenen Platte Alle bisher vorgestellten Beispiele betreffen inhomogene Felder. Ein homogenes Feld ist bei einer geladenen Platte realisiert. Betrachten wir eine positiv geladene Platte (Abb. 15.11). Die Ladung sei gleichmäßig über die Platte verteilt, die Flächenladungsdichte V ist also konstant. Aus Symmetriegründen steht das elektrische Feld senkrecht auf der Platte. Die Feldstärke kann aus dem Gaußschen Satz berechnet werden. Dazu legen wir eine geschlossene Fläche um die Platte. Der Fluss durch die senkrecht zur Platte liegenden Flächenstücke ist null, da das elektrische Feld senkrecht auf der Flächennormale steht. Der Fluss durch r r die zu der Platte parallel liegenden Flächenstücke wird E 1
G G G G E1 A1 E2 A2
1
H0
Q.
(1.38a)
Da die Beträge der Flächen und der Feldstärken jeweils gleich sind, ergibt sich
G E
V xˆ . 2H 0
A1
(15.38b)
r E2
r A2
Abb. 15.11: Elektrisches Feld einer positiv geladenen Platte
Der Feldvektor weist überall auf der Platte 9n die gleiche Richtung und sein Betrag konstant, das Feld ist homogen. Nur am Rand ist mit Abweichungen zu rechnen. Sie lassen sich vermeiden, wenn wir uns einen Ring gleicher Beschaffenheit und gleicher Ladungsdichte um die Platte herumgelegt denken. Inhomogenitäten treten dann erst am äußeren Rand des Ringes auf. Die Äquipotentialflächen liegen stets senkrecht zu den Feldlinien, in diesem Fall also parallel zur geladenen Platte.
15.4.5 Feld einer homogen geladenen Kugel Wir wollen als Erstes das elektrische Feld außerhalb einer positiv geladenen Kugel berechnen. Wir setzen voraus, dass die Ladungsdichte konstant ist. Dem Fall kommt deshalb besondere Bedeutung zu, weil wir es im Makrokosmos streng genommen nie mit ausdehnungslosen geladenen Körpern zu tun haben. Die Ladung ist vielmehr auf ein endliches Volumen verteilt, z.B. auf eine Kugel. Aus Symmetriegründen ist das Feld radial nach außen gerichtet. Um die
338
15 Elektrostatik
Feldstärke zu berechnen, gehen wir wieder vom Gaußschen Satz aus. Wir legen eine Kugelfläche A um die Ladungsverteilung; der Fluss durch A ist
G G EdA v³
1
E 4S r 2
H0
A
G E
Q 4SH 0 r 2
rˆ ;
Q;
(15.39a)
r !R.
(15.39b)
Dieses elektrische Feld ist identisch mit dem Feld einer Punktladung. Das ist erfreulich! Wie groß ist die elektrische Feldstärke im Innern der Kugel? Auch in diesem Fall muss das Feld r r radial nach außen gerichtet sein. Der Gaußsche Q r E E= 3 Satz ergibt 4 R 0
r E=
Q 4
2 0r
rˆ
R
Q r3 , H 0 R3
(15.40a)
G r ; r R. 4SH 0 R 3
(15.40b)
E 4S r 2
r
G E
Q
Abb. 15.12: Elektrisches Feld einer homogen geladenen Kugel
Die Ergebnisse sind in Abb. 15.12 veranschaulicht. Wenn die Kugel hohl ist, gilt für die Feldstärke (15.40b); im Innern ist die Feldstärke null, da die Kugelfläche, die sich an die innere Wandung anschmiegt, keine Ladung umschließt. Die Form der Äquipotentialflächen muss der einer Punktladung entsprechen; es sind ebenfalls konzentrische Kugeln.
15.4.6 Felder höherer Multipole: Multipolentwicklung des Potentials Die oben berechneten Felder bzw. Potentiale bestimmter Ladungsanordnungen können als Spezialfälle einer beliebigen Ladungsverteilung (15.14) angesehen werden; es kann auch eine beliebige Verteilung diskreter Punktladungen, die zu (15.13) führt, sein, deren elektrisches Feld sich nach (15.15) berechnet. Im Allgemeinen lässt sich das Integral nicht geschlossen berechnen. In solchen Fälle ist es aber immer möglich, das Feld in einem Punkt, dessen Entfernung groß gegenüber den Abmessungen der Ladungsverteilung bzw. den Abständen der Ladungen ist, durch eine Taylorreihen-Entwicklung zu gewinnen. Sie wird als Multipolentwicklung bezeichnet und ist am Ende des Kapitels abgeleitet. Auf das Dipolmoment folgt G das Quadrupolmoment. Sein Beitrag zum Potential im Abstand R ist
15 Elektrostatik
MQuad
339
1 8SH 0 R 5
^Q
xx
X 2 QyyY 2 Qzz Z 2 (15.41)
`
2 Qxy XY Qxz XZ QyzYZ , mit dem symmetrischen Quadrupoltensor 2. Stufe
QQuad
§ Qxx ¨ ¨ Qyx ¨ Qzx ©
Qxy Qyy Qzy
Qxz · ¸ Qyz ¸ Qzz ¸¹
(15.42)
Das elektrische Quadrupolmoment ist ein Maß für die Abweichung der Ladungsverteilung von der Kugelsymmetrie. Sie spielen z. B. eine wichtige Rolle in der Kernphysik, wo aus dem Vorhandensein eines solchen Momentes auf die Deformation von Atomkernen geschlossen werden kann. Quadrupolfelder werden ferner in dynamischen Massenfiltern verwandt (vgl. Kap. 17.2). Es kommen auch magnetische Quadrupolmomente vor.
15.5
Elektrische Ladungen auf Leitern
15.5.1 Influenz Nähern wir einen geladenen Glasstab der Elektrode eines Elektroskops, so beobachten wir bereits einen Ausschlag, wenn der Glasstab die Elektrode noch nicht berührt hat. Er kommt dadurch zustande, dass negative Ladungsträger des Elektroskops von den positiven Ladungen des Glasstabes angezogen werden. Daher verarmt das Metall-Blättchen am unteren Ende des Messgerätes an negativer Ladung. Das ist gleichbedeutend mit einer positiven Aufladung, die zur Abstoßung führt. Der gleiche Effekt stellt sich ein, wenn wir einen Bernstein- oder Hartgummistab verwenden. In diesem Fall werden die negativen Ladungsträger des Elektroskops von der Ladung des Stabes abgestoßen. In einem dritten Versuch (Abb. 15.13a) bringen wir zwischen zwei Metallplatten, die ungleichnamig geladen sind, zwei an elektrisch nicht leitenden Griffen befestigte aneinander liegende Metallplatten. Im Innern des geladenen Plattenpaares trennen wir die inneren Platten und testen ihren Ladungszustand nacheinander mit einem Elektrometer. Es stellt sich heraus, dass die Platten entgegengesetzt gleich geladen G G sind. Im elektrischen Feld sind also wieder gemäß F q E Ladungen verschoben worden, die nach der Trennung der Platten nicht mehr zurückfließen konnten. Die Verschiebung der
340
-Q
15 Elektrostatik
+Q
Abb. 13a: Zur Ermittlung der Influenzladung
Ladungen wird Influenz genannt. Sie tritt nicht auf, wenn wir statt der inneren Metallplatten solche aus elektrisch isolierenden Materialien benutzen würden. Daraus folgt, dass ein Metall im Gegensatz zum Isolator quasi frei bewegliche Ladungsträger besitzt, die schon weiter oben erwähnten Elektronen. Anwendung findet die Influenz z.B. beim Van de Graaff-Generator (Van de Graaff, 19011967), mit dem sich hohe Spannungen ( U t 105 V ) erzeugen lassen. Das Prinzip zeigt Abb. (15.13b).
b)
a)
Abb. 15.13b: Demonstration der Influenz mit einem BecherElektrometer
Abb. 15.14: Prinzip des Van-de-Graaf-Generators
15 Elektrostatik
341
Die Elektrode eines Elektrometers ist als Metallbecher ausgebildet. Mittels eines Metalllöffels bringen wir von einer Ladungsquelle solange Ladungsportionen auf die äußere Wandung des Metall-Bechers (a), bis sich ein konstanter Ausschlag eingestellt hat. Nun ändern wir den Versuch in der Weise ab, dass wir die Ladungsportionen auf die innere Becherwand bringen (b). Diese Ladung wird sofort durch die Wandung des Bechers nach außen verschoben, weil dort die gegenseitigen Abstoßungskräfte am kleinsten sind. Das Innere des Bechers bleibt feldfrei. Wir können die Aufladung so lange fortführen, bis auf Grund der großen Kräfte ein plötzlicher Ladungsausgleich zwischen Elektrometer und Umgebung einsetzt. Im Van de Graaff-Generator (Bandgenerator) tritt an die Stelle der Aufladung durch den Ladungslöffel ein Laufband aus isolierendem Material (Abb. 15.14). Durch einen Metallkamm am unteren Ende des zunächst elektrisch neutralen Bandes wird negative Ladung vom Band abgestreift und zur Erde abgeleitet. Das Band lädt sich dadurch positiv auf. Im Innern einer metallischen Hohlkugel werden mittels eines weiteren metallischen Kamms negative Ladungsträger auf das Band aufgesprüht, so dass dessen Ladung wieder neutralisiert wird. Aus dem äußeren Bereich der Hohlkugel werden sofort Elektronen nachgeliefert, so dass die innere Fläche ladungsfrei bleibt. Die Kugel lädt sich auf diese Weise wie der Becher im obigen Beispiel stark positiv auf. Neben Selbsterregung des Generators wird auch Fremderregung durch eine äußere Ladungsquelle angewandt. Die Ladungsfreiheit im Inneren geschlossener metallischer Behälter (Faraday-Käfig) kann zur Abschirmung vor elektrischen Kräften dienen.
15.5.2 Kapazität und Kondensatoren Unsere bisherigen Überlegungen haben gezeigt, dass metallische Leiter-Anordnungen elektrische Ladungen speichern können. Diese Fähigkeit hängt stark von der Geometrie des Leitersystems ab. Wir bezeichnen sie als Kapazität C. Die Ladungsspeicher selbst heißen Kondensatoren. Das einfachste Beispiel ist ein Plattenkondensator. Wie der Name besagt, besteht er aus zwei sich in geringem Abstand gegenüber stehenden Metallplatten (Abb. 15.15). Kondensatoren spielen bei Abb. 15.15: Plattenvielen technischen Anwendungen eine wichtige Rolle. kondensator Zur Definition eines quantitativen Maßes für die Kapazität gehen wir von der Definitionsgleichung der elektrischen Spannung aus.
U
G G Edr ³
(15.24b)
Da die Feldstärke proportional zur Ladung des Systems ist, gilt die Beziehung
U vQ.
(15.43)
Der Proportionalitätsfaktor in dieser Verknüpfung definiert die Kapazität C. Sie hängt nur von den geometrischen Abmessungen der Leiteranordnung ab.
342
15 Elektrostatik
C:
Q . U
(15.43a)
Die Einheit der Kapazität wird als 1 Farad (M. Faraday, 1791-1876) bezeichnet.
1Farad = 1F = 1AsV -1 .
(15.43b)
Für praktische Zwecke ist 1 Farad meistens zu groß; üblich sind
1ȝF = 103 nF = 106 pF . Wir besprechen nun einige spezielle Kondensatoren.
15.5.2.1 Plattenkondensator Die beiden Platten dieses Kondensators mögen den Abstand d haben; die Fläche einer Platte sei A. Der Zwischenraum sei evakuiert (Abb. 15.15). Es gilt nach (15.24) und (15.38, die gesamte Ladung befindet sich auf der Innenseite der jeweiligen Platte)
C
Q U
C
H0
VA Ed
VA , V d H0
A . d
(15.44a)
(15.44b)
Die Kapazität nimmt proportional zur Plattengröße und umgekehrt proportional zum Plattenabstand zu. Das ist einleuchtend: Je größer A ist, umso mehr Ladung kann aufgebracht werden. Je kleiner d ist, desto größer ist die anziehende Kraft zwischen den Ladungen.
15.5.2.2 Koaxialkabel und Kugel Wir betrachten einen Draht mit dem Radius R1, der von einem konzentrischen metallischen Hohlzylinder mit Radius R2 umgeben ist (Abb. 15.16). Die Anordnung heißt Koaxialkabel. Die Ladung pro Längeneinheit bezeichnen wir mit O . Das elektrische Feld zeigt aus Symmetriegründen in radiale Richtung. Wir berechnen zunächst das Feld eines Drahtes. Außerhalb des Drahtes ergibt es sich aus dem Gaußschen Satz. Dazu legen wir um den Draht einen geschlossenen Zylinder.
15 Elektrostatik
343
Der elektrische Fluss durch die Mantelfläche wird
³
G G EdA 2S rl E ,
(15.45a)
Mantel
Der Fluss durch die senkrecht zu den Feldlinien liegenden Stirnflächen ist null. Also folgt
G G
³ EdA G E
2S rl E
1
H0
lO ;
O rˆ . 2SH 0 r
R1
R2
(15.45b)
(15.45c)
l
Abb. 15.16: Zur Kapazität eines Koaxialkabels
Zurück zu unserem Ausgangsproblem. Wir umgeben den Draht mit einem konzentrischen metallischen Hohlzylinder. Das Feld außerhalb des Zylinders ist null, da dort keine Ladungen existieren. Die Anordnung lässt sich daher als abgeschirmtes Kabel verwenden. Die Potentialdifferenz zwischen Draht und Zylinder ist R2
U
G G ³ Edr
R1
O 2SH 0
R2
dr r R1
³
R O ln 2 , 2SH 0 R1
(15.46)
woraus sich die Kapazität berechnet zu
C
Q U
Ol O ln R2 / R1 / 2SH 0
2SH 0
l . ln R2 / R1
Ein Kugelkondensator ist in (Abb. 15.17) gezeigt. Innenund Außenraum sind feldfrei. Im Zwischenraum herrscht das Feld einer im Mittelpunkt lokalisierten Punktladung. Die Potentialdifferenz ergibt sich nach (15.24a) zu
M ( R1 ) M ( R2 ) U
1 · Q § 1 ¨ ¸. 4SH 0 © R1 R2 ¹
(15.48)
(15.47)
R1 R2
Damit folgt für die Kapazität
C
Q U
RR 4SH 0 1 2 . R2 R1
Abb. 15.17: Kugelkondensator (15.49)
344
15 Elektrostatik
15.5.2.3 Parallel- und Reihenschaltung von Kondensatoren Die Kapazität einer Leiter-Anordnung lässt sich dadurch beeinflussen, dass mehrere solcher Elemente parallel zueinander oder hintereinander geschaltet werden (Abb. 15.18). Das ist für praktische Anwendungen sehr nützlich. Schalten wir mehrere Kondensatoren parallel zueinander, so ist die Spannung an ihnen gleich. Die Ladungen addieren sich U (bei einem Plattenkondensator addieren sich die Flächen), so dass sich die Einzelkapazitäten ebenfalls addieren.
Ci
N
U
C ges
¦C
i
.
(15.50)
1
Sind mehrere Kondensatoren in Reihe geschaltet, so werden beim Anschluss an eine Spannungsquelle durch Influenz auch die innen gelegenen Kondensatoren geladen. Die Spannungen addieren sich.
Ci Abb. 15.18: Zur Kapazität von parallel und in Reihe geschalteten Kondensatoren.
U
Q C ges
N
Q
¦C 1
o
;
i
1 C ges
N
1
1
i
¦C
(15.51a,b)
Parallelschaltung vergrößert also die Gesamtkapazität, Hintereinanderschaltung verkleinert sie.
15.6 Elektrisches Feld als Träger der elektrostatischen Energie In einem Kondensator ist elektrostatische Energie gespeichert. Verbinden wir seine Platten mit den Polen eines Glühlämpchens, so leuchtet es kurz auf. Wie groß ist diese Energie und wo ist sie lokalisiert? In einem Gedankenversuch wollen wir den Kondensator erneut laden. Wir bewerkstelligen das diesmal, indem wir sukzessiv negative Ladungen von einer Platte auf die andere Platte bringen. Dabei baut sich ein elektrisches Feld auf, das auf die Ladung eine Kraft ausübt. Um den Kondensator weiter zu laden, müssen wir Arbeit gegen diese Kraft verrichten. G G E und dr haben also verschiedene Vorzeichen. Nach (15.22) gilt
Wel
U G G ³ qEdr 0
U
³ qdU 0
Q
1 qdq C ³0
Q2 ; 2C
(15.52a)
15 Elektrostatik
345
Wir fassen einen Plattenkondensator ins Auge; dann können wir (15.44a) benutzen und schreiben
Wel
Wel
1 CU 2 2
H0 2
H0 A 2 d
U2
H0 2
Ad
U2 ; d2
E 2V ;
(15.52b)
(15.52c)
Diese Gleichung besagt, dass die Energie im elektrostatischen Feld gespeichert ist. Die Aussage darf natürlich nicht von der Geometrie der Leiter-Anordnung abhängen. Um sie zu eliminieren, dividieren wir (15.52c) durch das Volumen und erhalten als Energiedichte des Feldes
w el
H0 2
E2 .
(15.53)
Diese Beziehung gilt allgemein für jede Leiter-Anordnung.
15.7
Dielektrika im elektrostatischen Feld
15.7.1 Dielektrische Suszeptibilität und Dielektrizitätskonstante Bisher haben wir vorausgesetzt, dass der Raum zwischen den Elektroden eines Kondensators evakuiert war. In den Experimenten hatten wir stillschweigend Luft zugelassen. Nähmen wir sehr genaue Messungen vor, so würden wir in letzterem Fall eine sehr geringe Vergrößerung der Kapazität feststellen. Weit größer wird der Effekt, wenn wir zwischen die Platten, bei gleichem Abstand, einen isolierenden Stoff bringen. Die Kapazität steigt je nach Material um über das Zehnfache. Wir tragen dieser Kapazitätsänderung dadurch Rechnung, dass wir einen Faktor H einführen, den wir als Dielektrizitätskonstante bezeichnen. Die auf die Dielektrizitätskonstante im Vakuum bezogene Größe heißt Dielektrizitätszahl H r .
Hr :
H . H0
(15.54)
Es wurden dabei isotrop aufgebaute Materialien vorausgesetzt. In Tab. 15.1a und b sind die Dielektrizitätskonstanten für verschiedene Stoffe zusammengestellt.
346
15 Elektrostatik
Gase He H2 N2 CO2 O2
Flüssigkeiten Metylalkohol, CH3OH Äthanol, C2H5OH Azeton, (CH3)2CO Benzol, C6H6 Wasser flüssiger Wasserstoff flüssiges Helium
Hr
Bedingungen
1,000074 1,000264 1,000606 1,000946 1.000523
0°C, 1 bar, > d an. Skizzieren Sie den Verlauf der Feldlinien und Äquipotentialflächen des Dipols. 6.a) Auf der x-Achse eines kartesischen Koordinatensystems befinden sich symmetrisch zum Nullpunkt im Abstand d zwei Punktladungen q. Eine weitere Ladung, -2q, ist im Nullpunkt angebracht. b) Insgesamt vier Punktladungen befinden sich in der xy-Ebene bei z = 0 im Abstand b vom Nullpunkt. Die Ladungen auf der x-Achse seien positiv, die auf der y-Achse negativ. Berechnen Sie das Quadrupolmoment der Anordnungen. 7. Um die Spannungsdifferenz U zwischen zwei geladenen Kondensatorplatten zu bestimmen, wird mit einer Spannungswaage die Kraft gemessen, mit der sich die Platten anziehen. Wie lautet der Zusammenhang zwischen Kraft und Spannung? 8. Mit welcher Kraft ziehen sich zwei geladene Metallplatten der Seitenlänge a = 2 mm an, wenn der Plattenabstand l= 1,5 mm und die Potentialdifferenz U = 220 V beträgt? Wie ändert sich die Kraft, wenn der Zwischenraum mit einem Dielektrikum der DK H ausgefüllt wird. Wie groß ist die Ladung auf den Platten mit und ohne Dielektrikum, wenn die Spannung konstant gehalten wird? 9. Gegeben sei eine lineare Kette von regelmäßig angeordneten Ionen mit alternierendem Vorzeichen der elektrischen Ladungen. Wie groß ist die potentielle Energie pro Ion? 10. Zwei gleich stark negativ geladene Metallkugeln der Radien R1 und R2, die sich in großem Abstand r >> R1, R2 voneinander befinden, werden durch einen dünnen leitenden Draht miteinander verbunden. Wie groß sind die Potentiale vor der Verbindung und welche stellen sich danach ein?
366
15 Elektrostatik
11. Wird ein dielektrischer elliptisch geformter Körper in ein elektrisches Feld gebracht, so wird er homogen polarisiert. Aufgrund der Polarisation entsteht in der Probe ein dem äußeren G G Feld entgegenwirkendes homogenes Entelektrisierungsfeld Eent NP / H 0 . Der Entelektrisierungsfaktor ist ein Tensor 2. Stufe, der auf Diagonalform gebracht werden kann. Berechnen Sie die drei Komponenten des Tensors für den Fall einer Kugel, eines langen Stabes und einer Scheibe. 12. Innenleiter und Abschirmmantel (Außenleiter, R = 5 mm) eines 100 m langen Koaxialkabels (Hr = 4) werden mit den beiden Enden eines Plattenkondensators der Kapazität C = 0,5 nF verbunden. Wie groß ist die Gesamtkapazität der Parallelschaltung, wenn der Abstand zwischen Innenleiter und Abschirmung 1 mm beträgt? Welche elektrische Energie ist in der Anordnung gespeichert, wenn an sie eine Spannung von 200 V gelegt wird? 13. Berechnen Sie die Gesamtkapazität nebenstehender Kondensatorschaltung; (C1 = 2μF, C2 = 5μF).
C2 C1
C1 C2 C2
C2 C1
14. Das permanente elektrische Dipolmoment eines Wassermoleküls beträgt p = 6,22 10-30 Cm. Wie groß ist die Kraft zwischen einem H2O-Molekül und einem Na+-Ion, das sich im Abstand von 1,2 nm befindet? 15. An einem neutralen He-Atom (Polarisierbarkeit D = 0,2 10-24 cm3) fliegt im Abstand von 2.5 nm ein Elektron mit einer Geschwindigkeit v R@
ª U º 1V « I » 1A :1Ohm : . ¬ ¼
(16.11a)
Damit ergibt sich die Einheit des spezifischen Widerstandes mit (16.11) zu 1 ȍm . Die zu U reziproke Größe heißt elektrische Leitfähigkeit V ,
V
1
U
.
(16.12)
In Tab. 16.1 sind die spezifischen Widerstände einiger Materialien zusammengestellt.
Metall
U 0 /10 6 : m
D /103 K -1
4D / K
Ag Al Ba Bi Cu Hg Ni 0,4 Cu 0,5 Zn 0,1 (Konstantan) W
0,015 0,025 36 107 0,016 0,941 0,5
4,1 4,7 6,1 4,45 4,3 0,99 P@
1V×1A=1W .
Damit folgt für die Einheit der Arbeit
>W @
1Ws .
(16.13)
16 Elektrischer Strom
16.4
371
Stromverzweigungen
16.4.1 Kirchhoffsche Regeln Elektrische Schaltungen bestehen im Allgemeinen aus einer Kombination von hintereinander und parallel Knoten Knoten geschalteten Bauelementen. Es treten Stromverzwei-I2 gungen und Knotenpunkte, in denen mehrere Leitungen zusammen laufen, auf (Abb. 16.3). Die Berechnung der -I3 Teilströme und -spannungen wird erleichtert durch die zwei Kirchhoffschen Regeln (G. R. Kirchhoff, 1824Abb. 16.3: Zur ersten Kirchhoff1887). Aus der Kontinuitätsgleichung folgt, dass an schen Regel einem Verzweigungspunkt (Knotenpunkt) ebenso viel Ladung abfließt wie zufließt. Werden die zufließenden Ströme positiv gezählt und die abfließenden negativ, so gilt, dass die Summe aller Ströme null wird.
¦I
0.
i
(16.14)
i
Das ist die 1. Kirchhoffsche Regel. Wir wenden uns nun Abb. 16.4 zu. Sie zeigt hintereinander geschaltete Bauelemente, in die wir auch die Spannungsquelle miteinbeziehen wollen. Die Schaltung bildet eine Masche. Nach der einen der elektrostatischen Feldgleichungen, die auch beim Vorhandensein stationärer Ströme angewendet werden kann (die Ladungsverteilung im Stromkreis ist zu jedem Zeitpunkt konstant),
G G
v³ Edr
0,
folgt, dass die Summe der Teilspannungen gleich null ist; die Generator-Spannung wird dabei negativ gerechnet.
¦U i
i
0 .
(16.15)
Masche _
+
Abb. 16.4: Zur zweiten Kirchhoffschen Regel
Das ist die 2. Kirchhoffsche Regel, die auch als Maschenregel bezeichnet wird.
372
16 Elektrischer Strom
16.4.2 Reihenschaltung von Widerständen Schalten wir mehrere Widerstände Ri in Reihe (Abb. 16.5), so folgt aus der Maschenregel
I
I ( R1 R2 ...Ri )
UG
I ¦ Ri .
(16.16)
i
R2 R1
UG _
Ri
Der Quotient U/I G ist aber der Gesamtwiderstand Rges der Schaltung, so dass gilt
+
¦R .
Rges
Abb. 16.5: Reihenschaltung von Widerständen
(16.17)
i
i
Bei der Reihenschaltung von Widerständen ist der Gesamtwiderstand gleich der Summe der Einzelwiderstände.
16.4.3 Parallelschaltung von Widerständen Wir fassen nun eine Parallelschaltung von Widerständen ins Auge (Abb. 16.6). Es liegt also eine Stromverzweigung vor, so dass gilt
Ri,Ii
I ges
R2,I2 R1,I1
I
_
U Rges
U U U ... R1 R2 Ri
U¦ i
1 , Ri
(16.18)
Dabei haben wir die jeweilige Stromstärke ersetzt durch den Quotienten aus der anliegenden Spannung und dem jeweiligen Widerstand. Es gilt also
+
UG Abb. 16.6: Parallelschaltung von Widerständen
1 Rges
1
¦R i
.
(16.19)
i
Der Gesamtwiderstand ist also stets kleiner als der kleinste Einzelwiderstand. Bei der Parallelschaltung von Widerständen addieren sich die Kehrwerte der Einzelwiderstände.
16 Elektrischer Strom
16.5
373
Messung elektrischer Ströme
16.5.1 Strommessung Zur Messung elektrischer Ströme gibt es verschiedene Messgeräte. Die Ausnutzung der Längenänderung eines stromdurchflossenen Drahtes durch Erwärmung führt zu einem Hitzdraht-Instrument, die aber kaum noch eingesetzt werden, da sich die Länge proportional 'T P I 2 ändert. Außerdem sind solche Geräte wenig empfindlich. Ihr Messbereich beginnt bei etwa 0,1 A. Wesentlich empfindlicher sind Drehspulinstrumente, die auf der magnetischen Wirkung des Stromes beruhen. Wie in Kap. 17.2 gezeigt wird, übt ein Magnetfeld (erzeugt durch einen Permanentmagneten) auf eine vom Strom durchflossene Drahtschleife ein Drehmoment aus, das proportional zur Stromstärke ist. Die Drehung der S N Drahtschleife wird durch einen mit ihr verbundenen Zeiger auf eine Skala übertragen (Abb. 16.7). Ein geeichtes Strommessinstrument heißt Amperemeter; es wird in Reihe mit dem Abb. 16.7: Prinzip des Amperemeters Bauelement, das die Stromstärke bestimmt, geschaltet. Es ist weiter möglich, die elektrolytische Zersetzung molekularer Stoffe durch den elektrischen Strom zur Strommessung auszunutzen. Die pro Zeit an den Elektroden abgeschie-dene Stoffmenge ist proportional zur Stromstärke.
16.5.2 Spannungsmessung Zur Messung der Spannung einer Stromquelle oder des Spannungsabfalls an einem Verbraucher wird z. B. ein Drehspulinstrument mit einem hohen Vorwiderstand parallel zu Spannungsquelle oder Lastwiderstand geschaltet (Abb. 16.8). Bezeichnet Rv den Wert des Vorwiderstandes und Ri den Innenwiderstand des Messgerätes, so fließt durch Letzteres der Strom I = U/(Rv + Ri).
Da die beiden Widerstände bekannt sind, lässt sich das Strommessgerät direkt in Volt eichen. Damit der Strom im Schaltkreis möglichst wenig verfälscht wird, muss der Vorwiderstand hoch sein.
RV G RL _
RI,IG +
UG Abb. 16.8: Zur Messung der elektrischen Spannung
374
16 Elektrischer Strom
16.5.3 Widerstandsmessung Ein Widerstand R U / I kann im Prinzip durch eine Spannungs- und eine Strommessung ermittelt werden. Allerdings ist das Messverfahren nicht fehlerfrei, wie ein Blick auf Abb. 16.9 zeigt. Entweder wird der Strom korrekt ermittelt und die zugehörige Spannung verfälscht oder umgekehrt. Diese Fehler lassen sich mit einer Nullmethode vermeiden (Ch. Wheatstone, 1843). In der WheatU stoneschen Brückenschaltung wird der auszumessende Widerstand Rx mit drei anderen Widerständen, von I denen mindestens einer (R1) veränderlich sein muss, entsprechend Abb. 16.10 zusammengeschaltet. Zwischen den Punkten C und D liegt ein empfindliches Rx Strommessinstrument. Durch Variation von R1 lässt sich erreichen, dass die Brücke (Messinstrument) stromlos wird. Das ist der Fall, wenn die Potentiale bei C und D _ + gleich sind. Es muss dann also gelten
UG
Abb. 16.9: Zur Problematik der Widerstandsmessung
UAC = UAD
oder
R1 I1
Rx I 3 .
U CB
U DB ;
(16.20) (16.21)
Analog müssen wir fordern
Rx I D I4 R4 3
R2 I 2
(16.22)
R4 I 4 .
(16.23)
Bei abgeglichener Brücke (Stromlosigkeit der Brücke) ist
I C I
oder
I1 R 1 +
R2
I2
B
I1
I2
und
I3
I4 .
(16.24)
Ersetzung von I1 und I3 in (16.21) ergibt mit (16.23)
_
Abb. 16.10: Messung von Widerständen mittels einer Kompensationsschaltung (Wheatstonesche Brückenschaltung)
Rx
R4
R1 . R2
(16.25)
Die Spannung der Quelle ist unwichtig, denn sie ist in dieser Bestimmungsgleichung nicht enthalten.
16 Elektrischer Strom
16.6
375
Leitungsmechanismen in Festkörpern, Flüssigkeiten und Gasen
Bei der Besprechung der Elektrostatik haben wir zwischen elektrischen Leitern und Nichtleitern unterschieden. Gute Leiter sind Metalle, zu den Isolatoren gehören Gläser und viele Kunststoffe. Dazwischen rangieren die Halbleiter. Auch unter Flüssigkeiten gibt es gute und schlechte Leiter; wir wollen uns aber zunächst den „festen“ Körpern zuwenden. Dem allgemeinen Sprachgebrauch folgend, bezeichnen wir sie als Festkörper.
16.6.1 Elektrische Leitung in Metallen Ladungsträger in Metallen sind die Elektronen. Im Atom sind sie als negativ geladene Hülle an den positiv geladenen Atomkern gebunden. Im Metall müssen die Elektronen leicht beweglich sein, anders wäre deren gute elektrische Leitfähigkeit nicht zu erklären. Wenn das aber der Fall ist, sind sie nicht mehr an den einzelnen Atomen lokalisiert, sondern gehören dem ganzen Festkörper an: sie bilden ein Elektronengas, das sich ähnlich verhält wie die Atome eines Gases in einem abgeschlossenen Raum. Die Existenz des Elektronengases lässt sich nach Tolman (R. C. Tolman, 1881-1948) experimentell beweisen. Lassen wir nämlich einen flachen metallischer Zylinder schnell um seine Achse rotieren, so werden quasifreie Elektronen von deren Standpunkt aus durch die Zentrifugalkraft nach außen beschleunigt. Dadurch entsteht ein elektrisches Feld zwischen Mittelachse und Außenrand, das auf die Elektronen eine entgegengesetzt gerichtete Kraft ausübt. Elektronen sammeln sich so lange am Außenrand an, bis sich die beiden Kräfte die Waage halten. Es gilt dann
eE
mZ 2 R .
(16.26)
Der elektrischen Feldstärke entspricht eine Potentialdifferenz zwischen Achse und Außenrand, die gemessen werden kann, so dass sich daraus ein Wert für e/m ergibt. Dieser stimmt gut mit dem Wert überein, der aus der Ablenkung freier Elektronen durch äußere Felder folgt.
e 1,7588047(49) 1011 Askg 11 m
(16.27)
Weiter oben, (16.3), haben wir die Stromdichte geschrieben als
G j
G nq v o
G j
G G nev V E .
(16.28)
Nach dem Ohmschen Gesetz ist die Stromdichte proportional zur Feldstärke. Ist diese konstant, so muss auch die Geschwindigkeit konstant sein. Es ist daher zweckmäßig, für das Verhältnis dieser beiden Größen eine neue Größe einzuführen. Sie wird Beweglichkeit b genannt.
b:
v ; E
(16.29)
376
16 Elektrischer Strom
G G nebE V E ;
G j
V
neb .
(16.30) (16.31)
I
Die Leitfähigkeit hängt vom Produkt aus Ladungsträger-Dichte und Beweglichkeit ab. Die Größen n und b lassen sich aus der r Messung von V und der Hall-Spannung B bestimmen. Unter der Hall-Spannung (E. H. Hall, 1855-1938) verstehen wir die PotenAbb. 16.11: In einem transversalen magtialdifferenz, die auf Grund der Ladungsnetischen Gleichfeld tritt durch Ablenkung anhäufung auf den senkrecht zu den Stirnder Ladungsträger ein elektrisches Feld auf flächen liegenden Seiten eines Leiters durch (Halleffekt) ein Magnetfeld entsteht (Abb. 16.11). Die Methode wird ausführlich in Kap. 17.2.3 besprochen. Werte für n und b sind aus Tab. 16.2 zu ersehen. Die Ladungsträgerdichten für Metalle liegen, unabhängig von der Temperatur, zwischen 1022 und 1023 Elektronen, d.h. am Strom ist etwa ein Elektron pro Atom beteiligt. Diese hohen Anzahldichten führen mit dazu, dass die für Gase geltenden Gesetzmäßigkeiten nicht auf Metalle übertragen werden dürfen. Es bleibt zu verstehen, dass die Elektronengeschwindigkeit im Leiter bei angelegtem Feld G konstant ist. Nach der Newtonschen Bewegungsgleichung werden Ladungsträger im E -Feld beschleunigt. Also muss noch eine „Reibungskraft“ existieren, die ähnlich wie die auf eine Kugel in einer viskosen Flüssigkeit (Kap. 10.4.3.2) wirkende Reibungskraft proportional der Geschwindigkeit ist. Diese Kraft hat ihre Ursache in den Wechselwirkungen der Elektronen mit dem Kristallgitter,
Halbleiter
Eg eV
Ge
0,67
Si
1,12
Diamant InSb
5,47 0,16
GaAs
1,43
ni cm-3
bn bp -1 -1 2 m V s m V-1 s-1 2
0,39
0.19
11
0.15
0,06
0
1,0 10 1,5 1016
0,18 7,80
0,16 0,08
1,3 106
0,85
0,04
2,3 1013 1,8 10
Tab. 16.2: Energielücke Eg, Ladungsträgerkonzentration ni und -beweglichkeiten bn und bp einiger Halbleiter dem Kristallgitter, in dem sie sich bewegen. Es sind hauptsächlich zwei Prozesse. Zum einen werden Elektronen an den schwingenden Atomrümpfen gestreut und übertragen dabei einen Teil ihrer Energie auf diese. Dabei müssen wir daran denken (Kap. 9.1), dass die AtomSchwingungen infolge ihrer Wechselwirkung korreliert erfolgen. Die (quantisierten) Gitter-
16 Elektrischer Strom
377
schwingungen heißen Phononen. Dieser Teil der Wechselwirkung wird deshalb als ElektronPhonon-Streuung bezeichnet. Zum anderen beeinflusst die Streuung an elektrisch neutralen Störstellen, die in jedem Metallgitter vorhanden sind, die Geschwindigkeit der Elektronen. Es kann sich dabei um Gitterfehler oder um Fremdatome handeln. Nennen wir die Zeit zwischen zwei Stößen W , sie wird leicht missverständlich als Stoßzeit (oder auch als Relaxationszeit) G G bezeichnet, so gilt für die „Reibungskraft“ mit v { v D
G FR
G m v D / W ,
(16.32)
so dass die Kräftebilanz im elektrischen Feld lautet
G G eE mv D / W Hierin haben wir v D
0.
(16.33)
G 'v geschrieben, um zum Ausdruck zu bringen, dass vD die mittlere
zusätzliche Geschwindigkeit der Ladungsträger in Gegenwart eines elektrischen Feldes ist. Sie wird als Driftgeschwindigkeit bezeichnet, um sie von der Geschwindigkeit zu unterscheiden, welche die einzelnen Ladungsträger auf Grund ihrer thermischen Bewegung besitzen. Für die Geschwindigkeit der Elektronen im Metall folgt
G vD
G eE W m
G bE .
(16.34)
Führen wir diese Beziehung in (16.28) ein, so sehen wir, dass die Leitfähigkeit unabhängig von der Feldstärke ist. Das entspricht dem Ohmschen Gesetz.
V
ne 2W . m
(16.35)
Messen wir den spezifischen Widerstand eines metallischen Leiters bei verschiedenen Temperaturen, so finden wir bei tieferen Temperatu-ren eine Abhängigkeit ~ T 5 , bei höheren eine ~ T (Abb. 16.12. Der Übergang findet im Bereich der Debye-Temperatur statt. Diese ist ein Maß für die größten Energien der in einem Kristall vorkommenden Gitterschwingungen und hat demzufolge für jedes Material einen charakteristischen Wert. Wie aus Tab. 16.1 hervorgeht, liegen sie bei den meisten Substanzen bei Werten zwischen 100 und 500 K. Der erwähnte Zusammenhang des Widerstandes mit einer
~T
0
~
5
T
T Abb. 16.12: Spezifischer Widerstand eines Metalls als Funktion der Temperatur
378
16 Elektrischer Strom
typischen Größe des schwingenden Kristallgitters lässt vermuten, dass die Temperaturabhängigkeit auf der mit T zunehmenden Anzahl eben dieser Gitterschwingungen (Phononen) beruht (Es werden zunehmend Gitterschwingungen mit höheren Frequenzen bzw. Energien angeregt). Die Theorie zeigt, dass dies zutrifft. Dagegen ist die Streuung an Gitterfehlern und Defekten temperaturunabhängig. Sie ist der Grund für den Restwiderstand eines Leiters, der sich bei Annäherung an den absoluten Nullpunkt einstellt.
16.6.2 Elektrische Leitung in Halbleitern Wie der Name sagt, ist die elektrische Leitfähigkeit von Halbleitern erheblich geringer als in Metallen. Beispielsweise beträgt sie bei Zimmertemperatur für Kupfer 6,5 107 ȍ -1m -1 , während der Wert für Germanium 2 ȍ -1m -1 ist. Weiter zeigt sich, dass die Temperaturabhängigkeit der Leitfähigkeit nicht wie bei Metallen einem 1/T-Gesetz gehorcht, sondern einem Exponentialgesetz
V
V 0e
'W 2 kT
,
(16.36)
Ein solches Verhalten deutet auf einen Aktivierungsprozess für die Ladungsträger hin. Die Größe 'W heißt thermische Aktivierungsenergie. Sie beträgt für Germanium 0,67 eV. Die äußeren Elektronen in einem Halbleiter sind viel stärker an den Atomrümpfen lokalisiert als in Metallen. Nur eine verhältnismäßig kleine Anzahl kann auf Grund ihrer thermischen Energie eine Bindung verlassen und dann zur Leitfähigkeit beitragen. Steigt die Temperatur, so nimmt die thermische Energie des Kristallverbandes zu und die Anzahldichte der Elektronen wächst nach (16.36) exponentiell an. Es ist aber noch ein zweiter Beitrag zur Leitfähigkeit zu berücksichtigen. Das aus einer aufgebrochenen Bindung stammende quasifreie Elektron hinterlässt nämlich eine Lücke. Wegen der Ladungsneutralität des Kristalls entspricht dieses einer positiven Ladung. Wir nennen sie ein positiv geladenes Loch, oder kurz, einfach ein Loch oder auch Defektelektron. Ein solches Loch (Abb. 16.13) kann sich im angelegten elektrischen Feld ebenfalls bewegen, indem von einem benachbarten Atom ein Elektron nachrückt usw. In einem Halbleiter ohne Fremdatome, wir nennen ihn intrinsischen Halbleiter, ist die Anzahldichte p der Löcher gleich der Anzahldichte n der Elektronen, denn er muss nach außen elektrisch neutral sein.
n
p
np
ni .
(16.37)
Wir sehen, dass auch der Löcherleitung die Bewegung von Elektronen zu Grunde liegt. Da aber die Anzahldichte der zur chemischen Bindung beitragenden Elektronen um viele Größenordnungen über denen der Löcher liegt, vereinfacht das Loch-Konzept die Beschreibungsweise von Halbleiter-Eigenschaften ganz wesentlich.
16 Elektrischer Strom
379
Wir schreiben deshalb die Leitfähigkeit
V
e(nbn pbp ) .
(16.38)
Durch Ausnutzung des Hall-Effektes lässt sich herausfinden, ob Elektronen- oder LöcherLeitung überwiegt. Durch Einsetzen der Beweglichkeiten entsprechend (16.34) ergibt sich
V
2 ne2W e pe W p . mn mp
(16.39)
Um die einzelnen Größen bestimmen zu können, müssen zusätzliche Messverfahren herangezogen werden.
Ge
Ge
Ge
Ge
Ge
Ge
Ge - Ge - Ge - Ge
Ge
Ge
Ge
As
Ge
Ge - Ge
Ge
-
Ge
Ge -
-
-
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ga
Ge
Ge
Ge
Ge
Ge
Ge
Ge
Ge
-
-
Ge
Ge
Ge
Ge
Ge
Abb. 16.13: Halbleiterkristall (Ge) mit einem positiven Loch Abb. 16.14a: Halbleiterkristall aus vierwertigem Ge mit einem dreiwertigen bzw. einem fünfwertigen Fremdatom Die große Bedeutung der Halbleiter liegt darin, dass ihre Leitfähigkeit durch Dotierung mit Fremdatomen in weiten Grenzen verändert werden kann. Wir unterscheiden zwei Typen von Störstellenleitung (Abb. 16.14a); werden etwa in Germanium 4-wertige Kristallatome durch 5-wertige Fremdatome, z. B. Phosphor- oder Arsen-Atome, ersetzt, so ist das zur Bindung nicht benötigte Elektron relativ frei beweglich und kann zum Ladungstransport beitragen. Solche Atome wirken also als Elektronenspender und heißen deshalb Donatoren. Werden dagegen 3-wertige Atome, wie etwa Gallium- oder Indium-Atome, substitutionell eingebaut, so fehlt ihnen ein Bindungs-Elektron; es entstehen positive Löcher, die im elektrischen Feld von
380
16 Elektrischer Strom
neutralen Nachbaratomen Elektronen aufnehmen können. Sie wirken demnach als ElektronenFänger und heißen deswegen Akzeptoren. Abb. 16.14b zeigt schematisch die Energieniveaus eines Halbleiterkristalls zusammen mit denen der Donatoren und Akzeptoren. Übersteigt infolge Dotierung die Anzahl der quasifreien Elektronen die der Löcher erheblich, so sprechen wir von n-Leitung, im umgekehrten Fall von p-Leitung.
E
Leitungsband
ED
Leitungsband
DonatorEg niveaus Akzeptorniveaus
Eg
Die Neutralitätsbedingung bei Störstellenleitung lautet
np
ni2 .
(16.40)
EA
0 Valenzband
Valenzband
Abb. 16.14b: Energieniveauschemata in dotierten Halbleitern
16.6.3 Elektrische Leitung in Supraleitern Es gibt viele Materialien, deren spezifischer Widerstand bei Abkühlung unter eine bestimmte Temperatur Tc sprunghaft verschwindet (Tab. 16.3). Der Effekt wurde zuerst 1911 von H. Kamerlingh Onnes (1853-1926) an Quecksilber gefunden. Ein solches Material stellt also einen perfekten Leiter dar. Zusätzlich besitzt ein Supraleiter aber noch eine andere Eigenschaft, Element TC/K Verbindung TC/K die wenige Monate später von W. Meissner (1882-1974) und R. Al 1,19 Al2CMO3 10,0 Ochsenfeld (geb. 1901) entdeckt 4,15 InNbSn 18,1 HgD wurde. Wird eine noch normalLa 6,0 AlGeNb3 20,7 leitende Probe in ein Magnetfeld Pb 7,19 gebracht, so durchsetzen die magNb 9,25 netischen Feldlinien (s. Kap. 3) den Körper ungestört. Wird dieser Tab. 16.3a: Sprungtemperatur TC einiger weiter abgekühlt, so werden am Typ I-Supraleiter Sprungpunkt die Feldlinien aus der Probe herausgedrängt. Wie wir in Kap. 17.4.2 sehen werden, entspricht dies dem Verhalten eines perfekten Diamagneten. Für einen hypothetischen perfekten Leiter ist ein solches Verhalten nicht zu erwarten. Die Supraleitung fand 1957 durch die BCS-Theorie ihre Erklärung. (J. Bardeen, 1908-; L.R. Cooper, geb. 1930; J.R. Schrieffer, geb. 1931). In diesem Modell wird davon ausgegangen, dass sich zwischen den Leitungselektronen eine anziehende Wechselwirkung ausbilden kann.
16 Elektrischer Strom
381
Dadurch kommt es zu einer Paarbildung der Elektronen mit entgegengesetztem Impuls; diese neuen Teilchen werden als Cooper-Paare bezeichnet. Cooper-Paare besitzen also den Gesamtimpuls null. Sie können daher keine kinetische Energie an das Gitter abgeben, vorausgesetzt, die Energie der angeregten Gitterschwingungen (Phononen) ist kleiner als die Bindungsenergie des Cooper-Paares. Da also für sie keine Streuprozesse möglich sind, können sie sich ungehindert durch das Gitter bewegen. Das heißt aber, dass der spezifische Widerstand null ist. Jahrzehnte lang lag die höchste Sprungtemperatur bei ca. 23 K. Da entdeckten 1986 J.G. Bednorz (geb. 1950) und K.A. Müller (geb. 1927) mit speziellen Oxid-Keramiken eine neue Klasse von Supraleitern, deren Sprungpunkt oberhalb der Temperatur des flüssigen Stickstoffs liegt (78 K). Die bis jetzt erreichte höchste Sprungtemperatur wurde für HgBa2Ca2Cu3O8 gemessen; sie beträgt 134 K. Leider ist die Bearbeitung des Materials schwierig. Ein wichtiges
Verbindung
TC/K Verbindung
TC/K
Yba2Cu3O7 Bi2Sr2Ca1Cu2O8 Bi2Sr2Ca2Cu3O10
92 90 120
110 127 134
Tl2Ba2Ca1Cu2O8 Tl2Ba2Ca2Cu3O10 HgBa2Ca2Cu3O8
Tab. 16.3b: Sprungtemperatur TC einiger Typ II-Supraleiter Anwendungsgebiet der Supraleitung liegt in der Herstellung starker Magnete (L16.1), neben dem Einsatz für wissenschaftliche Zwecke vor allem für Kernspintomografen. Die Entwicklung von Stromkabeln mit hoher Stromdichte hat in den letzten Jahren erhebliche Fortschritte gemacht (L16.2,3).
16.6.4 Ionenleitung in Flüssigkeiten Werden zwei Platinelektroden in Wasser getaucht, in dem heteropolare Moleküle gelöst sind, so fließt nach Anlegen einer Spannung ein elektrischer Strom (Abb. 16.15). Wir bezeichnen diesen Vorgang als Elektrolyse und die den Strom leitenden Flüssigkeiten als Elektrolyte. Im Gegensatz zu Metallen wird der Ladungstransport durch Ionen getragen. Ionen sind negativ oder positiv geladene Teilchen, in die ein Molekül im Lösungsmittel zum Teil dissoziiert. Wir wollen im Folgenden von Wasser als Lösungsmittel ausgehen. Wassermoleküle besitzen ein Dipolmoment. Beim Lösungsvorgang schieben sie sich zwischen die Ionen und trennen
+
_
I
Abb. 16.15: Stromleitung in einem Elektrolyten bei Anlegung einer äußeren Spannung
382
16 Elektrischer Strom
diese unter Energiegewinn. Jedes gelöste positive und negative Ion ist von einer Hülle von Wasser-Dipolmolekülen umgeben (Abb. 16.16). Dieser Vorgang heißt Hydratation. Durch die hohe Dielektrizitätskonstante des Wassers ( H = 81 werden die interionischen Kräfte um den Faktor 1/81 herabgesetzt (vgl. 15.12 und 15.63), was den Ionentransport begünstigt.
-
-
+ -
+
-
-
+
+
+
+ -
Bisher war von flüssigen Elektrolyten die Rede. Die heteropolaren Moleküle bestehen aus Säuren, Basen oder Salzen. Elektrolyse kommt aber auch bei Schmel_ zen oder manchen festen Stoffen vor, z.B. + + + + bei Silberhalogeniden. Bei der Elektrolyse wandern die negativen Ionen (die Kationen) zum positiven Pol (der Anode) der Spannungsquelle und die positiven Ionen (die Anionen) zum Abb. 16.16: Zur Entstehung der Hydration negativen Pol (der Kathode). Dort werden sie neutralisiert und scheiden sich in fester oder gasförmiger Form ab. Bezeichnen Z die Ladungszahlen, b die Beweglichkeiten und n die Anzahldichten, so schreibt sich die Stromdichte für verdünnte Lösungen + -
-
+
+
+ -
-
+
-
+ -
-
j j
+
+
j
e ( Z b n Z b n ) E ;
(16.41)
die Leitfähigkeit des Elektrolyten ist also
V
e ( Z b n Z b n ) .
(16.42)
Da die Gesamtladung eines Systems erhalten bleibt, sie ist hier null, gilt
Z n
Z n ,
(16.43)
und wir können (16.42) ersetzen durch
V
en Z (b b ) .
(16.44)
Für verdünnte Lösungen gilt also das Ohmsche Gesetz. Aus der gemessenen Leitfähigkeit kann die Summe der Beweglichkeiten ermittelt werden. Die getrennte Bestimmung der Beweglichkeiten benötigt noch eine weitere Beziehung zwischen ihnen. Dazu kann der mit dem Ladungstransport verknüpfte Masse-Transport dienen. Die Beweglichkeiten betragen etwa das 10-4-fache wie in Metallen. Für die bei der Elektrolyse abgeschiedene Stoffmenge gelten die Faradayschen Gesetze (M. Faraday, 1791-1867). Aus der Faraday-Konstanten und der Avogadro-Zahl lässt sich die Elementarladung bestimmen. Das Verfahren ist aber nicht sehr genau, bereits die 5. Stelle hinter dem Komma ist unsicher.
16 Elektrischer Strom
383
1. Die abgeschiedene Masse m ist der transportierten Ladung Q proportional.
m
AQ
mmol Q . ZF
F
NLe .
Hierin bedeuten F die Faraday-Konstante und NL die Avogadrosche Zahl, der Proportionalitätsfaktor A heißt elektrochemisches Äquivalent. 2. Die durch gleiche Ladungen Q abgeschiedenen Massen m verschiedener Elektrolyte verhalten sich wie die äquivalenten Massen. Die äquivalente Masse mA eines Stoffes ist die Atommasse ma oder die Molekülmasse mm dividiert durch die Wertigkeit Z des entsprechenden Ions.
m1 m2
16.6.5
mA 1 mA2
;.
(16.45)
Ladungstransport in Gasen, Gasentladungen
Betrachten wir einen Glaszylinder (Abb. 16.17), in den zwei Elektroden eingeschmolzen sind. I Der Zylinder möge mit Gas von etwa 102 Pa _ + gefüllt sein. Es besteht aus elektrisch neutralen Atomen, so dass nach Anlegung einer Spannung ein Strom zunächst nicht fließen kann. Erst wenn durch zusätzliche Maßnahmen Ladungsträger erzeugt werden, setzt ein Strom ein. Wir sprechen von einer unselbständigen Gasentladung. Ladungsträger können z.B. durch Heizen Abb. 16.17: Unselbständige Entladung; der Kathode oder durch Ionisation durch UVp | 102 Pa Strahlung bzw. J -Strahlung (hochenergetische elektromagnetische Strahlung) erzeugt werden. Abb. 16.18 zeigt die Strom-Spannungs-Charakteristik. Die Stromstärke steigt zunächst proportional zur Spannung, biegt dann ab und geht in einen nahezu konstanten Wert über. Bei weiterer Erhöhung der Spannung setzt bei einem kritischen Wert ein steiler Anstieg des Stromes an, um dann bei der Zündspannung UZ in eine selbständige Entladung überzugehen, bei der eine von außen vorgenommene Zufuhr von Ladungsträgern nicht mehr erforderlich ist, sondern der Strom sich selbst erhält. Dies geschieht im Wesentlichen durch ElektronenStoßionisation. Werden Elektronen soweit beschleunigt, dass ihre kinetische Energie die Ionisationsenergie der Atome/Moleküle ( 10 eV ) übersteigt, so können sie aus diesen ein
384
16 Elektrischer Strom
I
Elektron herausschlagen. Beim Stoß entsteht also ein positives Ion und ein zusätzliches Elektron.
Bogenentladung anomale Glimmentladung
e A o A e e .
(16.46)
Die beiden Elektronen können durch Stoßionisation weitere zwei Elektronen erzeugen usw. Es entsteht eine Ladungsträgerselbständige Lawine. Die Leuchterscheinungen kommen Entladung dadurch zustande, dass ein Teil der Atome nicht ionisiert werden, sondern Elektronen nur in energetisch höhere Zustände angeregt werden. Beim Zurückfallen in den Ausgangszustand (der Grundzustand heißt) wird diese Energie in Form von Strahlung Proportionalwieder freigesetzt. Deswegen wird die Bereich Entladung nach Zündung als Glimmentladung bezeichnet, während diejenige unRekombina- Sättigungsterhalb der Zündspannung Dunkelentlationsbereich Bereich dung heißt. Uk UZ U US Bei hohen Stromdichten setzt eine Bogenentladung ein. Es entsteht ein LichtAbb. 16.18: Strom-Spannungs-Charakteristik bogen wie etwa beim Elektro-Schweißen einer Gasentladung (Abb. 16.19). Eine kurze Bogenentladung, ist ein Funken. Die hohen Stromdichten werden durch einen höheren Gasdruck erreicht. Durch die große Anzahl WolframArgon stift von Ionen, die auf die Elektroden prallen, werden diese stark erwärmt. Es kommt zu einer Glühemission von Sekundärelektronen, welche die Stromstärke weiter erhöhen. Bei hohem Gasdruck und hohen Feldstärken entsteht eine Coronaentladung. Sie geht einher mit einem bläulichen Leuchten, das wir an Hochspannungsleitungen oder – vor Gewittern – als St. Elms-Feuer an Abb. 16.19: ElektroSchiffsmasten (Spitzenentladung) beobachten könschweißen mittels einen. Für die selbständige Entladung charakterisner Bogenentladung tisch ist eine (im Wesentlichen) fallende Kennlinie. Nach diesem Überblick wollen wir auf den Mechanismus der Stromleitung etwas näher eingehen. Wir betrachten zunächst die Kinetik der Ladungsträger. Wir gehen von einem Gas aus, dass ungefähr gleiche Teile positiver und negativer Ladungsträger (Elektronen und positive Ionen) besitzt.
normale
n | n
n.
(16.47)
16 Elektrischer Strom
385
Anders als bei den bisher besprochenen elektrischen Leitungsvorgängen sind Ionen nicht stabil, sondern können mit Teilchen entgegengesetzter Ladung rekombinieren, wobei neutrale Moleküle entstehen. Die Ladungsträgerdichte wird also bestimmt durch die Erzeugungsrate D (dn / dt )erz und die Vernichtungsrate E (dn / dt )vern . Diese ergibt sich wie folgt. Die mittlere freie Weglänge / eines positiven Ions der Geschwindigkeit v ist gegeben durch die Zeit tl, nach der es von einem negativen Ladungsträger mit einem Rekombinationsquerschnitt A eingefangen wird; es gilt
/
1 . An
(16.48)
Da es n+ positive Ionen gibt, ist die Einfang- oder Rekombinationsrate
n tl
Avn n : ßn n o .
(16.49)
Insgesamt erhalten wir für die zeitliche Änderung der Ladungsträgerdichte
dn D E n2 . dt
(16.50)
Im stationären Gleichgewicht (dn/dt = 0) gilt
nstat
D . E
(16.51)
Hört die Erzeugung von Elektronen zur Zeit t = 0 bei einer Ladungsträgerdichte n0 auf, so hat n(t) nach einer Zeit t abgenommen auf
n(t )
n0 n0 : . 1 ßn0t 1 t / W 1/ 2
(16.52)
Die Halbwertszeit W 1/ 2 gibt an, nach welcher Zeit die Teilchenzahldichte auf die Hälfte ihres Anfangswertes abgesunken ist. Wir kommen nun zur Strom-Spannungs-Kennlinie zurück und betrachten zunächst den Bereich der unselbständigen Entladung. Die künstlich gebildeten Ladungsträger erhalten, wie G bei den Leitungsvorgängen weiter oben, im elektrischen Feld E eine Geschwindigkeit
G vD
eW S t G E; m
(16.53)
386
16 Elektrischer Strom
sofern die Ladungsträger eine Elementarladung tragen. Stoßzeit bzw. mittlere freie Weglänge hängen vom Gasdruck ab. Solange die Zahl der pro Zeiteinheit die Elektroden erreichenden Ladungsträger klein ist gegenüber der Rekombinationsrate, besteht noch Gleichgewicht zwischen Erzeugung und Vernichtung von Ladungsträgern; es gilt (16.51). Die Stromdichte ist
G j
G en (b b ) E , e
G D (b b ) E . E
(16.54)
In diesem Bereich gilt also das Ohmsche Gesetz. Wird die Spannung erhöht, so wächst die Geschwindigkeit der Ionen. Daher sinkt die Zeit, die für Rekombinationsprozesse zur Verfügung steht; die Rekombinationsrate nimmt ab. Stromsättigung tritt ein, wenn alle gebildeten Ladungsträger die Elektroden erreichen, bevor sie rekombinieren können. Die Stromdichte ist in diesem Fall proportional zur LadungsträgerErzeugungsrate D und zum Abstand d der Elektroden:
j
2ed D .
(16.55)
Der Faktor 2 rührt daher her, dass bei einer Ladungsträgererzeugung durch Ionisation immer ein Ladungs-Paar entsteht. Bei Erreichen der Zündspannung setzt, wie schon erläutert, eine selbständige Gasentladung ein. Durch die lawinenartige Zunahme der Ladungsträger steigt die elektrische Leitfähigkeit und der Widerstand nimmt ab. Das ist die Erklärung der negativen Strom-Spannungs-Kennlinie. Um den Strom zu begrenzen und die Spannungsquelle vor Zerstörung zu bewahren, muss ein Widerstand in Reihe mit der Gasentladungsröhre geschaltet werden. Bei Wechsel_ + spannung ist eine Drossel empfehlenswert (Abb. 16.20).. Die einsetzende Glimmentladung zeigt eine ausgeprägte Schichtstruktur. Die in der Nähe der Elektroden befindlichen leuchtenden Streifen heißen Kathoden- und AnodenGlimmlicht. Die säulenartige Schicht zwischen ihnen wird als positive Säule beKathoden- positive Anodenzeichnet. In Richtung auf das Kathodenglimmlicht Säule glimmlicht glimmlicht liegen weitere schmalere leuchtende Zonen, unterbrochen von DunkelAbb. 16.20: Struktur einer selbständigen räumen. Bogenentladung Die Schichtung entspricht der Feldverteilung. Diese ist also nicht mehr räumlich konstant. Durch die unterschiedlichen Beweglichkeiten der Ladungsträger kommt es zur Ausbildung von Raumladungen. Aus Abb. 16.21 sind Feldstärkeverlauf, Potential- und Raumladungsverlauf zu ersehen. Die Feldstärke ist am größten im Kathodenfall. SekundärElektronen, die durch den Aufprall von Ionen auf die Kathode entstehen, werden hier stark
16 Elektrischer Strom
387
beschleunigt, so dass sie nach Durchlaufen einer Strecke x1 genügend Energie besitzen, um Gasatome anzuregen. Dies ist an dem intensiven Kathoden-Glimmlicht zu erkennen. Nach weiterer Beschleunigung reicht die Energie der Elektronen zur Ionisation Lage der Lage der aus. Es entsteht eine hohe Konzentration Anode Kathode von Elektronen und Ionen. Die Ionen staen sich infolge ihrer geringeren Beweglichkeit, es entsteht eine positive Raumladung. Der größte Teil des Feldes fällt zwischen Raumladung und Kathode ab. Unmittelbar dahinter ist die Geschwinx digkeit der Elektronen trotz ihrer größeren Beweglichkeit gering; sie besitzen daher nicht genügend Energie, um Atome E zu ionisieren, es entsteht eine negative Raumladung. Sie sorgt andererseits im Verein mit der positiven Anode dafür, dass sich in der positiven Säule, wieder x ein größeres, konstantes Feld ausbildet, in dem die mittlere Energie der Elektronen gerade ausreicht, dass sich Erzeugungsund Vernichtungsrate der Ionen die Waage halten. Durch die einhergehende Anregung bzw. Abregung der Gasteilchen entsteht ein intensives, diffuses Leuchten. Wird der Gasdruck erniedrigt, x so zerfällt die positive Säule in einzelne Abb. 16.21: Elektrische Feldstärke, Scheiben. Ihre Dicke entspricht der mittPotential und Raumladung innerhalb leren freien Weglänge der Elektronen. einer Gasentladung Die Physik der Gasentladungen bildet die Basis für zahlreiche technische Produte. Die unselbständige Gasentladung wird etwa in Proportional-Zählrohren ausgenutzt. Ein Geiger-Müller-Zählrohr (Abb. 16.22) besteht aus einer mit Argon gefüllten Ionisationskammer, längs deren Achse sich ein dünner Draht befindet. Er ist über einen Widerstand mit dem positiven Pol einer Spannungsquelle verbunden. Der negative Pol von Kammer und Spannungsquelle liegt auf Erdpotential. Der Gasdruck beträgt ca. 104 Pa. Die Feldstärke in der Nähe des Drahtes ist schon bei Spannungen von einigen 100 V so hoch, dass bei Ionisation des Gases durch ein schnelles Teilchen Strom-Sättigung erreicht wird. Der am Widerstand abfallende Spannungsimpuls durchläuft einen Verstärker und kann dann einem Registriergerät zugeführt werden Bei nicht zu hoher Spannung am Zählrohr ist die Anzahl der den Draht erreichenden Teilchen proportional der Energie des Primärteilchens, so dass diese bestimmt werden kann. Bei nicht zu hoher Spannung am Zählrohr ist die Anzahl der den Draht erreichenden Teilchen proportional der Energie des Primärteilchens, so dass diese bestimmt werden kann. Weitere Anwendungen sind Glimmlampen, die den Kathodenfall ausnutzen, Spektrallampen bzw. Leuchtstoffröhren und die als sog. Sparlampen im Handel erhältliche Leucht-
388
16 Elektrischer Strom
+
stofflampen kurzer Bauart. In den beiden Letzteren strahlt die positive Säule ultraviolettes Licht ab, das in der auf der Wandung aufgetragenen Leuchtstoffschicht in sichtbares Licht umgewandelt wird. Licht großer Leuchtdichte kann in Quecksilber- und XenonHochdrucklampen erzeugt werden. Neben die Ausnutzung der Bogenentladung für zum Zwecke der Materialbearbeitung dienen Verstärker Lichtbögen auch als intensive Strahlungsquelle in Projektionsgeräten. Beispiele für eine kurzzeitige Bogenentladung sind das für p 104 Pa _ fotografische Zwecke ausgenutzte „Blitzlicht“, das bei der plötzlichen Entladung eines Kondensators in einer GasentladungsAbb. 16.22: Geiger-Müller-Proporröhre entsteht, und vor allem die Blitze bei tionalzählrohr Gewittern.
16.7
Stromquellen
Ein elektrischer Strom setzt eine Potentialdifferenz U0 voraus. Sie wirkt als treibende Kraft und wird deswegen auch, etwas missverständlich, als elektromotorische Kraft (EMK) bezeichnet. In Wirklichkeit handelt es sich bei ihr ja um Energie pro Ladungseinheit. Die Erzeugung einer Spannung bedeutet, dass an einer Klemme des Generators ein Ladungsüberschuss herrRi schen muss und an der anderen ein Ladungsmangel. Ladungsträger sind die Elektronen. U0 Ra U Damit ein hinreichend starker Strom fließen kann, muss der Generator in der Lage sein, an seinen Klemmen pro Zeiteinheit eine große Zahl von Elektronen abzugeben bzw. aufzunehmen. I Wir werden uns den entsprechenden physikalisch-chemischen Vorgängen gleich zuwenden. Abb. 16.23: Zum Innenwiderstand Die maximal zu entnehmende Stromstärke ist eines Generators durch den Innenwiderstand Ri des Generators begrenzt (Abb. 16.23). Bezeichnen wir wie oben die Klemmenspannung des unbelasteten Generators mit U0, den Widerstand des Leiterkreises, den sog. Lastwiderstand, mit Ra, so ergibt sich für die Stromstärke I
I
U0 Ra Ri
U0 1 . Ra 1 Ri / Ra
(16.56)
16 Elektrischer Strom
389
Nur wenn der Innenwiderstand gegenüber dem Lastwiderstand zu vernachlässigen ist, wird die Stromstärke allein durch Letzteren bestimmt. Wir können den 2. Term auf der rechten Seite auch schreiben als
U
U0
1 . 1 Ri / Ra
(16.57)
Die Klemmenspannung U des belasteten Generators wird durch den Innenwiderstand der Stromquelle herabgesetzt. Stromgeneratoren für technische Zwecke basieren fast ausschließlich auf dem Induktionsgesetz und erzeugen damit Wechselstrom. Sie werden in Kap. 19 behandelt. Etliche elektrische Geräte müssen unabhängig vom öffentlichen Netz arbeiten. Sie haben meist einen kleineren Energiebedarf, der von chemischen Stromquellen in Form von Batterien und Akkumulatoren gedeckt werden kann. Zunehmende Bedeutung erlangen chemische Brennstoffzellen, da sie die Möglichkeit öffnen, als Stromlieferanten in Elektroautos eingesetzt zu werden. Unser größter Energielieferant ist die Sonne. Ihre Strahlungsenergie wird in den Solarzellen ausgenutzt. Wir wollen diese Stromquellen hier in ihren Grundzügen besprechen, soweit das auf dem bisher erworbenen Kenntnisstand schon möglich ist.
16.7.1 Galvanische Elemente Werden zwei Metallelektroden aus unterschiedlichem Material in einen Elektrolyten getaucht, so bildet sich zwischen den Polen eine elektrische Spannung von 1-2 V aus (Abb. 16.24). Diese kommt dadurch zustande, dass an den Elektroden positive Metallionen in Lösung gehen, da dies energetisch günstiger ist als im Metallstab zu verbleiben. Dabei lädt sich die + Elektrode negativ und ihre nähere Umgebung positiv auf; es entsteht eine Potentialdifferenz. Diese bremst weitere Ionen ab; Gleichgewicht Zn Cu herrscht, wenn gerade so viele Ionen zur Elektrode zurück wandern wie in Lösung gehen. Das Gleichgewicht wird gestört durch Anlegung einer äußeren Spannung zwischen Elektrode und Raumladungsschicht. Befindet sich der positive Pol an der Elektrode, so gehen verd. H2SO4 positive Ionen vermehrt in Lösung. Bei umgekehrter Polung werden sich Metallionen aus Abb. 16.24: Aufbau eines galvanischen der Lösung an der Elektrode abscheiden. Die Elementes mit verdünnter Schwefelgleichen Vorgänge spielen sich an der anderen säure Metall-Elektrode ab. Da die Potentialdifferenzen an den beiden Elektroden verschieden sind, entsteht zwischen ihnen eine Spannung
-
'U
U1 U 2 , wobei U1
'M1 , U 2
'M2 .
(16.58)
390
16 Elektrischer Strom
Eine derartige Anordnung aus einem Elektrolyten, in den zwei Metall-Elektroden eintauchen, heißt galvanisches Element. Der Name erinnert an L. Galvani (1737-1798), der als erster mit einem solchen Element (aus Froschschenkel und Metallelektroden experimentierte). Die Spannung eines Elementes im unbelasteten Zustand kann unmittelbar aus Tab. 15.3 abgeleitet werden. Die heute benutzten Primärelemente sind alle Abarten des 1866 von G. Leclanche (1839-1882) erfundenen Zink-Braunstein-Elementes. (Abb. 16.25). Es besteht aus einer KohleBraunstein (MnO2) Mischung als Anode, die von einem Zinkzylinder als Kathode umgeben ist. Als Elektrolyt fungiert im einfachsten Fall Ammoniumchlorid (NH4Cl), das zur Verfestigung mit Stärke und Zellulose vermischt ist. Es spielen sich folgende Reaktionen ab: Kathode: Zn o Zn 2 2e ,
(16.59a)
Anode: 2 MnO2 2 NH 4 2e o MnOOH 2 NH 3 ,
(16.59b)
Elektrolyt: Zn
+
2
2 NH 4Cl 2 NH 3 o Zn( NH 3 ) 2 Cl2 2 NH 4
Kohle-BraunsteinMischung Plastikdeckel fester Stärke-NH4ClElektrolyt Zn-Becher
Abb. 16.25: Zn-Braunstein-Element
(16.59c)
Durch die Bindung von Zn2+-Ionen im DiamminKomplex wird die Zn2+-Konzentration im Elektrolyten klein gehalten. Die Spannung bleibt so bestehen. Die Zelle ist erschöpft, wenn sich soviel [Zn(NH3)2]2+ gebildet hat, dass das Chlorid dieses Ions auskristallisiert und damit die Leitfähigkeit abnimmt. Modernere galvanische Elemente sind die Alkali-Mangan-Batterie (1.5V) oder zunehmend Lithium-Elemente (3V). Die Lebensdauer dieser Batterien sind größer als die der Braunstein-Zelle. Außerdem ist die Beweglichkeit der Ionen größer, so dass die entnehmbare Stromstärke ebenfalls größer ist. Das gilt ganz besonders für LiElemente, die zudem sehr klein gemacht werden können.
16.7.2 Akkumulatoren Neben den Primärelementen gibt es Sekundärelemente (als Akkumulatoren bezeichnet), die erst nach Aufladung zu einer Stromquelle werden. Nach ihrer Erschöpfung lassen sie sich, im Gegensatz zu den oben erläuterten Elementen, wieder regenerieren, indem ihnen von außen elektrische Energie zugeführt wird. Am verbreitesten ist der Blei-Akkumulator. Im Prinzip besteht eine Zelle aus zwei sich gegenüber stehenden Bleiplatten, die in verdünnte Schwefelsäure tauchen. Nach kurzer Zeit überziehen sich beide Platten mit einer dünnen Schicht aus Bleisulfat (PbSO4). Jetzt laden wir die Zelle, indem wir von außen eine Spannung anlegen. Dabei laufen die folgenden Reaktionen ab:
16 Elektrischer Strom Anode:
391
PbSO4 2OH o PbO2 H 2 SO4 2e
Kathode: PbSO4 2 H 2e o Pb H 2 SO4 .
(16.60a) (16.60b)
Durch die Aufladung ist die Anode zu Bleioxid und die Kathode zu metallischem Blei geworden. Es ist also wie oben ein Element mit unterschiedlichen Elektroden entstanden, das selbst als Stromquelle dienen kann; die Spannung beträgt 2,02 V. Bei der Entladung laufen die chemischen Prozesse in umgekehrter Richtung ab. Anschließend kann der Akku wieder aufgeladen werden. Als Wirkungsgrad des Akkus wird das Verhältnis von abgegebener Energie zu Aufladeenergie definiert. Er liegt bei 75-80%. Zur Erreichung einer möglichst großen Speicherkapazität muss die Oberfläche der Elektroden so groß wie möglich sein. Daher werden an Stelle der oben postulierten Blei-Platten Bleigitter benutzt, wodurch eine Speicherkapazität von ca. 30 Wh pro kg Blei erreicht wird. Es ist interessant, einmal auszurechnen, wie groß die Kapazität eines Kondensators sein müsste, der imstande ist, die gleiche Energie zu liefern. Es ergibt sich bei einer Spannung von 2V der Wert C | 6 104 F ! Ließe sich ein solcher Kondensator realisieren? Als weiteres Beispiel soll kurz der Nickel-Cadmium-Akkumulator dargestellt werden. Die beiden Elektroden befinden sich in KOH-Lauge; im ungeladenen Zustand sind sie mit einer Hydroxid-Schicht überzogen. Beim Anlegen einer äußeren Spannung kommt es zu folgenden Reaktionen: Anode:
2 Ni (OH ) 2 2OH o 2 Ni (OH )3 2e ,
Kathode: Cd (OH ) 2 2e o Cd 2OH .
(16.62a) (16.62b)
Es entsteht eine Spannung von 1,2 V. Bei einer Stromentnahme laufen die Reaktionen wieder in umgekehrter Richtung ab.
16.7.3 Brennstoffzellen Die Energieentnahme einer Batterie erfolgt, wie gerade erläutert wurde, durch elektrochemische Prozesse. Bei Akkumulatoren ist diese Reaktion reversibel. Alle Batterien sind folglich Energiespeicher mit einem bestimmten Reservoir an elektrischer Energie. Brennstoffzellen werden besser als Energiewandler bezeichnet, obgleich dies natürlich für eine begrenzte Zeit auch für jede Batterie gilt. Zur Gewinnung elektrischer Energie muss einer Brennstoffzelle kontinuierlich „Betriebs- oder Brennstoffe“ zugeführt werden. Die Energieerzeugung beruht auf der Umkehr des elektrolytischen Prozesses (L2,3,4,5). Die Gesamtreaktion besteht aus zwei Teilreaktionen, die an den räumlich getrennten Elektroden stattfinden. Im einfachsten Fall wird der Anode Wasserstoff zugeführt (Abb. 16.26). Unter Mitwirkung eines Katalysators entstehen H+-Ionen, die in den Elektrolyten eintreten.
392
16 Elektrischer Strom
Die Ionen wandern zur Kathode, wo sie mit dem dort adsorbierten Sauerstoff reagieren. Auch dazu ist ein Katalysator erforderlich. Dabei entsteht in diesem Beispiel Wasser. Die zur Reduktion des SauerAnode Kathode stoffs erforderlichen Elektronen werden von der Anode über einen äußeren Stromkreis herangeführt. Am LastH2 O2 widerstand fällt bei einem solchen Element eine Spannung von etwa 1,2 V ab. Bei einem sauren Elektrolyten erfolgt der Ladungstransport im Elektrolyten durch Protonen, bei einem basischen im Allgemeinen durch die Elektrolyt Hydroxilionen. Wir schreiben die chemischen Prozesse + (K OH ) auf:
Ni
Ag
Abb. 16.26: Prinzip einer Brennstoffzelle
Anode:
H 2 o 2 H 2e
Kathode: 2 H 2e
1 O2 o H 2 O . 2
(16.63a)
(16.63b)
Es wird also Wasserstoff als Brennstoff mit Sauerstoff als Verbrennungsmittel (Oxidans) zu Wasser „verbrannt“. Die Reaktionen laufen schon bei niedrigen Temperaturen (60-130 °C) ab. Es gibt verschiedene Typen von Brennstoffzellen, die sich zum Teil noch in der Erprobung befinden. Sie werden nach dem verwendeten Elektrolyten unterschieden. In obigem Beispiel besteht der Elektrolyt aus KOH. Der Brennstoffzellen-Typus ist daher unter dem Namen Alkaline Fuel Cell (AFC) bekannt. Die Zelle besitzt einen Wirkungsgrad von 60%. Sie werden in Raumfahrzeugen eingesetzt. Nachteilig wirkt sich bei diesem Typ eine mögliche Vergiftung des Elektrolyten durch Karbonate aus, wenn reformierter Wasserstoff aus Kohlenwasserstoffen als Brennstoff benutzt wird. Diese Schwierigkeiten lassen sich in einer PEMF-Zelle (Proton Exchange Membrane Fuel Cell) vermeiden (Abb. 16.27). In ihr übernimmt eine dünne Protonen-leitende Membran die Rolle des Elektrolyten. Die Zelle kann mit Wasserstoff oder Methan betrieben werden. Die Arbeitstemperatur beträgt weniger als 80 °C. Die zugehörigen Wirkungsgrade sind 60 bzw. 40%. Es sind Leistungen bis zu ca. 250 kW möglich. Da die chemischen Reaktionen an der Kontaktfläche stattfinden, d.h. nur im Grenzgebiet von Elektrode (Katalysator) und Elektrolyt ablaufen, ist eine Brennstoffzelle flächenhaft aufgebaut. Sie ist nur einige Zehntel Millimeter dick. Die Elektroden bestehen aus Edelmetall-Katalysatoren auf porösen Substratschichten. Die Spannung beträgt ca. 0.5 V. Eine Vielzahl solcher Einzelzellen ist zu Stapeln zusammengefasst und liefert durch Hintereinanderschaltung die gewünschte Betriebsspannung. Der Wirkungsgrad einer Brennstoffzelle ist definiert als
KB Z
erzeugte Energie 100 (%) 'H
Darin ist 'H die Enthalpieänderung des chemischen Prozesses. Für die Erzeugung elektricher Energie kann aber nur der Anteil der freien Reaktionsenthalpie genutzt werden, im Gegensatz zu einer Wärmekraftmaschine. Der maximale Wirkungsgrad ist also
16 Elektrischer Strom
'G 100 ( %) . 'H
Unter Benutzung der Relation (s. Kap. 13) 'G H TdS ergibt sich
K B(max) Z
'H T 'S 100 ( %) . (16.64) 'H
Fordern wir, dass der Umgebung keine Wärme entzogen wird, so kann der Wirkungsgrad bis zu 100% betragen. Die erreichten Wirkungsgrade liegen bei 5070%. Abb. 16.27: Prinzip einer Proton-ExchangeMembran-Fuel-Cell (PEMF-Zelle)
Poröse Katalysator Sauerstoff Elektroden
Poren
Kathode
Membran
K B(max) Z
393
Anode
Wasserstoff Wasser Kohlepapier
16.7.4 Solarzellen Sonnenergie kann in unterschiedlicher Weise zur Energieerzeugung nutzbar gemacht werden, am einfachsten durch Sonnenkollektoren, die erwärmtes Brauchwasser zur Verfügung stellen. Dagegen sind bisher nur wenige größere Anlagen zur solartechnischen Stromerzeugung in Betrieb, wie z.B. in Kalifornien ein Kraftwerk für 300 MW. Aber auch hier wurden in jüngster Zeit Pläne für Großkraftanlagen ausgearbeitet. 2006 wurde der Grundstein für ein Kraftwerk dieser Art in Spanien gelegt, dass Leistungen im GW-Bereich erzeugen soll. Durch spezielle Kollektoren (Parabolinnenkollektoren, Solartürme mit Nachführungseinrichtung und Paraboloidkraftwerke) werden Temperaturen von über 1000 °C erreicht, die mit Hilfe von Gasoder Dampfturbinen Wärme in elektrische Energie umwandeln können. Eine direkte Erzeugung von elektrischem Strom bietet die Photovoltaik. Abb. 16.28 zeigt einen pnh p Halbleiter, dessen Enden über einen Widerstand miteinander verbunden sind. Wenn Licht auf den Halbleiter fällt, kann am Widerstand eine elektrische Spannung von ca 0,8V auftreten. n Die Entstehung der Spannung soll im Folgenden erläutert werden. Ein pn-Halbleiter besteht aus einem Kristall, dessen eine Seite überwiegend p-leitend ist und dessen andere Seite überwiegend n-leitend ist. Wie in Kap. 16.6.2 dargelegt, wird dies durch Abb. 16.28: pn-Halbleiter als Solarzelle geeignete Dotierung erreicht. Löcher- und Elek-
394
16 Elektrischer Strom
tronenkonzentration sind in Abb. 16.29 skizziert. Auf Grund des Konzentrationsgefälles im Bereich der Grenzschicht kommt es zu einer Diffusion von Elektronen in den p-Teil. Dort werden sie von Akzeptoren eingefangen oder rekombinieren mit den Löchern. Analog diffundieren Löcher in den n-Teil, wo sie mit den Elektronen rekombinieren. Dadurch verarmt die Mitte der Grenzschicht an beweglichen Ladungsträgern und zu beiden Seiten bilden sich Raumladungen mit unterschiedlichem Vorzeichen aus (Abb. 16.29). Das elektrische Feld ist von der n-Seite zur p-Seite gerichtet und wirkt damit dem Diffusionsstrom entgegen. Stationäres Gleichgewicht stellt sich ein, wenn Feld- und Diffusionsstrom gleich sind. Das elektrische Feld verursacht einen Potentialsprung. Damit verbunden ist eine Bandverschiebung, die hier aber nicht berücksichtigt wird. Fällt auf den pn-Halbleiter Licht ein, so erzeugt jedes absorbierte Lichtquant (Photon) n p ein Elektron und ein Loch. Durch die Diffusionsspannung UD über der Grenzschicht wer16 den die Elektronen in den p-Teil und die 10 Löcher in den n-Teil getrieben. Dies führt zur c [p] [n] Erniedrigung 'M ph des Potentialsprungs: 14
10
10
12
'M ph
'M Ddu 'M Dbel .
(16.65)
'M ph kann als Photospannung an den Enden
des Halbleiters abgenommen werden. 0 Typische Werte für maximal erreichbare Leerlaufspannungen einer Photodiode liegen je nach Halbleiter zwischen 0,4 und 1,4 V. Der Wirkungsgrad von Solarzellen ist definiert als E das Verhältnis aus gewonnener elektrischer Leistung zu eingestrahlter Lichtleistung. Wäh0 rend bisher von einer theoretischen Obergrenze von 30% ausgegangen wurde, werden neuerdings Konzepte diskutiert, die Wirkungs0 grade bis zu 86% ermöglichen sollen (L16.6). Kommerzielle Solarzellen haben z. Zt. WirAbb. 16.29: Charakteristische Kennkungsgrade von maximal 17%. Als Ausgangsgrößen eines unbelichteten Halbleiters material wird hauptsächlich kristallines und zunehmend amorphes Silizium und seiner Legierungen verwendet; dazu kommen GaAs und analoge III-V-Verbindungen, Cadmiumtellurid (CdTe) und Chalkopyrit-Verbindungen, sowie organische Materialien. Durch Verschaltung von Solarzellen mit unterschiedlichen Energielücken kann ein breites Spektrum des Sonnenlichtes zur Stromerzeugung ausgenutzt werden (L16.7). Die Herstellungskosten der Zellen sind noch zu hoch, dass sie mit herkömmlich gewonnener elektrischer Energie konkurrieren könnten. Daher werden verstärkt Dünnschicht-Solarzellen aus polykristallinem Silizium, die nur einige Mikrometer dick sind, diskutiert (L16.8). Dadurch könnten die Materialkosten wesentlich verringert werden. Eine Übersicht über den derzeitigen Entwicklungsstand regenerativer Energien findet sich in L16.9.
16 Elektrischer Strom
395
16.7.5 Thermoelemente Thermoelemente als Spannungsquellen beruhen auf der Temperaturabhängigkeit der Kontaktspannung. Letztere wurde bereits in Kap. 16.7.5 eingeführt. Sie beruht auf den unterschiedlichen Elektronen-Austrittsarbeiten zweier Metalle. Näherungsweise genügen die Anzahldichten auf beiden Seiten des Kontaktes einer Boltzmannverteilung
n2 n1
e
'E k BT
(16.66)
wobei die Differenz der Elektronen-Austrittsarbeiten 'E der Kontaktspannung U entspricht.
'E
E2 E1
e(M2 M1 ) eU .
(16.67)
Einsetzen in (16.65) und Auflösen nach U ergibt
U
k BT n1 ln . e n2
(16.68)
Schalten wir zwei gleichartige Kontakte, die sich auf unterschiedlichen Temperaturen befinden, nach dem Schema von Abb. 16.30 gegeneinander, so entsteht zwischen den beiden äußeren Enden eine Thermospannung, die proportional der Temperaturdifferenz ist:
U th
k B § n1 · ln ¨ ¸ (T1 T2 ) a'T e © n2 ¹
Metall 1
Dabei haben wir vorausgesetzt, dass das Verhältnis der Anzahldichten im Wesentlichen durch die unterschiedlichen Austrittsarbeiten der Metalle und nicht durch die Temperatur bestimmt ist. Experimente zeigen, dass die Thermospannung einiger Metallkombinationen wirklich dieser Beziehung folgt; für andere muss sie ergänzt werden durch einen quadratischen Term:
U th
a'T b( 'T ) 2 .
Metall 1
(16.69a)
(16.69b)
Metall 2
T1, U12
T2,U21
Abb. 16.30: Schaltung eines Thermoelementes
Um die Empfindlichkeit eines Thermoelementes zu charakterisieren, ist es zweckmäßig, die differentielle Thermospannung dUth/dT anzugeben. Die Werte liegen für Metalle im Bereich einiger ȝK/T . Das Auftreten einer Thermospannung ist nicht auf Metalle beschränkt. Besonders große Werte der differentiellen Thermospannung finden sich bei Metall-Halbleiter-Kontakten. Die
396
16 Elektrischer Strom
Thermospannungen liegen um bis zu 3 Größenordnungen über denen von Metall-MetallKontakten (Tab.16.4).
Bi
Konst. Co
Ni
K
Pd
Na
Pt
Hg
-7
-3,4
-1,6
-1,5
-0,9
-0,3
-0,2
0,0
0,0
C
Al
Mg
Pb
Sn
Cs
Man- Ir ganin
Zn
0,2
0,4
0,4
0,4
0,45
0,5
0,6
0,65
0,7
Ag
Au
Cu
W
Cd
Mo
Fe
Sb
0,7
0,7
0,75
0,8
0,9
1,2
1,8
4,7
Tab. 16.4: Thermoelektrische Spannungsreihen in bezug auf Wasserstoff in μV/Grad Die Thermospannung wurde von Th. J. Seebeck (1770-1831) 1821 entdeckt. Die Erscheinung ist daher auch unter dem Namen Seebeck-Effekt bekannt. Es gibt auch den umgekehrten Effekt, er heißt Peltier-Effekt (J. Ch. A. Peltier, 1785-1845). Wird an ein Thermoelement, dessen Lötstellen auf gleicher Temperatur liegen, eine äußere Spannung gelegt U12 U21 (Abb. 16.31), so kühlt sich eine Kontaktstelle ab und die andere erwärmt sich. Erwärmung erfolgt an der Kontaktstelle, die sich beim Seebeck-Effekt bei gleicher Richtung des Thermostromes die Kältere ist. Die Wärmeleistung ist proportional zum Strom. Metall 2 Metall 1 Metall 2
T2
T1
P
_
+
dQW dT
3I .
(16.70)
U Abb. 16.31: Zur Demonstration der Wirkungsweise eines Peltierelementes
dU t h dT
3 . T
3 wird als Peltier-Koeffizient bezeichnet. Typische Werte liegen bei 102 J/As. Zwischen ihm und der differentiellen Thermospannung besteht die Relation
(16.71)
Die beiden Effekte sind also eng miteinander verwandt. Das wird im Rahmen der Festkörperphysik ausführlich erläutert. Thermoelemente werden in großem Umfang zur Temperaturmessung verwandt. PeltierElemente können in kleineren Wärmepumpen oder Kühlzellen eingesetzt werden.
16 Elektrischer Strom
397
16.7.6 Kondensatoren als Energiespeicher In Kondensatoren hoher Kapazität lassen sich beträchtliche Energiemengen speichern. Sie reichen aus, um bei Stromausfällen in hochohmigen Verbrauchern, z.B. bei Datenspeichern in Computern oder Fernsehgeräten, die Stromversorgung aufrecht zu erhalten. Solche Ultracaps (Ultra Capacitors) sind aus Kohlenstoff als leitende Flächen aufgebaut. Die dielektrische Schicht bildet sich durch chemische Veränderung des organischen Elektrolyten beim Anlegen der Spannung. Die Dicke des Dielektrikums liegt zwischen 10-4 μm und 10-3 μm. Die Kondensatoren besitzen bei kleinen Volumina Kapazitäten bis zu ca. 103 F. Da die Spannungsbelastbarkeit mit derzeit 2,3 V recht klein ist, müssen für den praktischen Gebrauch entsprechend viele Ultracaps hintereinander geschaltet werden. Ein Beispiel möge die Speicherfähigkeit eines Ultracap demonstrieren: Gegeben sei C 103 F ; der Verbraucherwiderstand betrage RV 0, 25 Mȍ , so dass die Zeitkonstante
W 6,9 104 Std. beträgt. Ausgehend von U0 = 2,3V o I 0 9, 2μA . Der Entladevorgang berechnet sich mittels der 2. Kirchhoffschen Regel (16.15) nach Trennung der Variabeln zu 't W ln
I0 ; I
W
RV C .
(16.72a)
Da die Abnahme der Spannung bzw. der Stromstärke sehr klein gegenüber dem Maximalwert sein soll, können wir ln(I0 /I) entwickeln, wodurch sich ergibt
't W
I0 I ; I0
(16.72b)
Fordern wir I (t ) / I 0 t 0,99 , so ergibt sich, dass eine solche Stromstärke über eine Dauer von 6,87 102 Std. aufrechterhalten werden kann. Selbst wenn eine anfängliche Stromstärke von 1 mA nicht unter 1% sinken soll, ist das also mit einem solchen Kondensator nahezu 7 Std. lang möglich. Neuerdings werden Ultracaps diskutiert, bei denen die wirksame Fläche durch eine „Aufrauung“ der Oberfläche um mehrere Zehnerpotenzen vergrößert ist (L16.10).
398
16 Elektrischer Strom
Zusammenfassung x Ein elektrischer Strom besteht aus einem Transport positiv bzw. negativ geladener G Teilchen; sind n r die entsprechenden Anzahldichten und v ± die zugehörigen DriftG geschwindigkeiten, so ist die Stromdichte j
G j
G G n q v D n q v D
G G G x Mit der elektrischen Feldstärke E ist die Stromdichte j verknüpft durch j wobei V eine Materialkonstante ist und elektrische Leitfähigkeit heißt.
G
VE ,
x Bei Stromverzweigungen gelten die Kirchhoffschen Regeln. In einem Knotenpunkt elektrischer Leiter gilt für die Ströme
¦I
0;
i
i
in einem geschlossenen Stromkreis gilt unter Einschluss der von außen aufgeprägten Spannungen
¦U
i
0.
i
x Bei der Reihenschaltung von Widerständen ist der Gesamtwiderstand gleich der Summe der Einzelwiderstände. Bei Parallelschaltung von Widerständen addieren sich die Kehrwerte der Einzelwiderstände. x In Gasentladungen setzt sich der Strom aus Elektronen und Ionen zusammen. Eine unselbständige Entladung bedarf der dauernden Erzeugung von Ladungsträgern durch äußere Eingriffe; eine selbständige Entladung liegt vor, wenn sich Erzeugung und Vernichtung von Ladungen im Gleichgewicht befinden. x In einer chemischen Batterie werden die unterschiedlichen Kontaktspannungen der Elektroden ausgenutzt. x In einer wieder aufladbaren Batterie (Akkumulator) entsteht die Spannung durch räumliche Trennung der negativen und positiven Ladungen durch Energiezufuhr von außen. x Brennstoffzellen funktionieren umgekehrt wie die Elektrolyse. Der Brennstoff, z.B. Wasserstoff, tritt unter Elektronenabgabe in einen Elektrolyten ein. An der Kathode reagiert er mit dem Verbrennungsmittel, im einfachsten Fall, zu einer neutralen Verbindung (hier Wasser). Die für die Reaktion erforderlichen Elektronen werden der Kathode über einen äußeren Lastwiderstand von der Anode her zugeführt.
16 Elektrischer Strom
399
Übungsaufgaben 1. Ein Drehspulamperemeter hat einen Widerstand von Rg
0,5 kȍ und zeigt bei einem
Strom von 10 μA Vollausschlag. Das Instrument soll als Voltmeter benutzt werden. Welches ist der empfindlichste Spannungsbereich? Durch einen Vorwiderstand wird der Messbereich auf 5 V erweitert. Wie groß muss der Vorwiderstand RV sein? Eine 140 V-Batterie speist 20 hintereinandergeschaltete Widerstände von je R 100 kȍ . Wie groß ist die Spannung U an jedem Einzelwiderstand? Wie weit weicht die Anzeige des Voltmeters davon ab? 2. Zwölf gleich große Widerstände von R0 7 : bilden das Gerüst eines Würfels. Berechnen Sie den resultierenden Widerstand R zwischen den beiden in Richtung einer Raumdiagonale gegenüberliegenden Würfelecken. 3. Eine Person stehe auf einem nichtleitenden Boden. Wie groß ist in etwa der Widerstand zwischen seinen beiden Händen? Ohne gesundheitliche Schäden hervorzurufen, können 5 mA durch den Körper fließen. Bei welcher Spannung wird die Berührung einer Stromquelle gefährlich, wenn ein Strom von ca. 100 mA tödlich ist? Betrachten Sie Blut als physiologische Kochsalzlösung. 4. Eine Halbleiterprobe habe bei 25° C einen Widerstand von 120 : . Bei einer Temperatur von 75 °C beträgt der Widerstand noch 10 : . Was bedeutet der Begriff „Thermische Aktivierungsenergie“? Wie groß ist sie in obigem Beispiel? 5. Der Strom durch eine Al2O3-Schmelze betrage 40 kA. Wie viel Kilogramm Aluminium werden in 1,5 Stunden abgeschieden? 6. Beschreiben und diskutieren Sie einige wiederaufladbare Batterietypen. Wie lässt sich der Ladungszustand eines Blei-Akkumulators überprüfen?
17
Statische Magnetfelder
Im ersten Kapitel wurden das elektrische Feld und das elektrische Potential eingeführt. Eine Potentialdifferenz erzeugt in einem Leiter einen elektrischen Strom. Das daran sich anschließende Kapitel befasste sich mit den Grundlagen stationärer Ströme, wobei die magnetischen Eigenschaften des elektrischen Stromes nur gestreift wurden. Wegen des großen Umfangs ist es zweckmäßig, ihnen ein eigenes Kapitel zu widmen. Zunächst untersuchen wir die magnetischen Wirkungen stationärer Ströme im Vakuum (an Luft), anschließend werden jene von Materie besprochen. Dazu gehört auch der Ferromagnetismus, der uns in Form von Kompassnadeln oder Haftmagneten aus dem täglichen Leben bekannt ist. Als Indikator für das magnetische Feld werden wir die Kraft auf eine solche „Kompassnadel“, einen permanenten magnetischen Dipol, benutzen. Daher wollen wir uns zunächst mit den Grundeigenschaften eines solchen Dipols vertraut machen.
17.1
Eigenschaften des magnetischen Feldes
17.1.1 Permanentmagnete Unter Ferromagnetismus verstehen wir das spontane Auftreten eines makroskopischen magnetischen Momentes in Eisen und einigen anderen Materialien. Hier interessiert zunächst nur die Tatsache, dass sich ein Magnet wie z.B. eine Kompassnadel in einem solchen (äußeren) Magnetfeld ausrichtet. Damit haben wir den gewünschten Indikator für Form und Richtung eines Magnetfeldes gewonnen. Wir führen dazu einige Versuche aus: Wir wissen bereits, dass eine horizontal drehbar aufgehängte Kompassnadel immer in Nord-Süd-Richtung weist. Erinnern wir uns daran, dass sich ein elektrischer Dipol in einem (homogenen) elektrischen Feld in Richtung der Feldlinien einstellt und in einem N S inhomogenen Feld zusätzlich eine Kraft erfährt. Es ist daher naheliegend, der Erde ein magnetisches Feld zuzuordnen, in dessen Richtung sich die Nadel einstellt. Das Magnetfeld muss nach dieser Hypothese in NordSüd-Richtung oder umgekehrt verlaufen (und inhomogen sein). Wir ergänzen diese Beobachtung dadurch, Abb. 17.1: Magnetfeld eines Stabdass wir die Erde durch einen stabartig geformten Mag- magneten neten ersetzen. Über den Stabmagneten wird ein Blatt Papier gespannt. Wir tasten nun den Bereich zwischen den Enden des Magneten mit unserer Kompassnadel ab und markieren ihre Lage auf dem Papier (Abb. 17.1). Dabei entstehen Linien, die sich in der Nähe der beiden Enden verdichten. Wir können sie direkt sichtbar machen, indem wir auf das Papier Eisenfeilspäne streuen, die selbst kleine Magnete darstellen. Diese ordnen sich nach leichtem Klopfen entlang der Linien an. Die beiden Häufungsstellen der Linien bzw. der Eisenspäne bezeichnen wir als die Pole des Stabmagneten. Die Linien heißen magnetische Feldlinien. Die Richtung magnetischer Feldlinien wird dadurch festgelegt, dass der Pol der Kompassnadel (eines Stabmagneten), der zum geographischen Nordpol weist, als Nordpol bezeichnet
402
17 Statische Magnetfelder
wird und der zum Südpol Zeigende als magnetischer Südpol. Nähern wir einer Kompassnadel eine zweite Kompassnadel, so stellen wir fest, dass sich ungleichnamige Pole anziehen und gleichnamige Pole abstoßen. Das entspricht den Erfahrungen, die wir mit elektrischen Ladungen gemacht haben. Die Stärke eines magnetischen Pols, kurz Polstärke p genannt, tritt an die Stelle der elektrischen Ladung. Magnetische Pole kommen allerdings nicht alleine vor, sondern treten immer als Paare von Nord- und Südpol auf, d. h. als Dipol. Es gibt keine magnetischen Monopole. Für die Kraft zwischen zwei punktförmigen Magnetpolen p1 und p2 ergibt das Experiment eine Beziehung, die dem Coulombgesetz entspricht. G F
p1 p2 rˆ . r2
f
(17.1)
Aus später ersichtlichen Gründen wird der Vorfaktor f als 1/(4SP0 ) geschrieben. P0 heißt Permeabilitätskonstante. Zwischen ihr, der Influenzkonstanten und der Lichtgeschwindigkeit besteht die Verknüpfung (s. Kap. 17.3)
1 . c2
H 0 P0
(17.2)
Damit erhält μ0 den Wert
P0
4ʌ×10-7 VsA -1m -1 .
(17.3)
Das Coulombsche Gesetz für Magnetpole ist also
G F
p1 p2 rˆ . 4SP0 r 2 1
(17.4)
Mit der Festlegung der Einheit von μ0 ergibt sich für die Einheit der Polstärke [p] = 1Vs.
(17.5)
Als magnetische Feldstärke wird in Analogie zur elektrischen Feldstärke der Quotient aus der Kraft, die ein Magnetfeld auf einen Magnetpol (Probepol) ausübt, und dem Probepol definiert. G B
G F . p
Die Einheit folgt aus (17,4) und (17,5) zu > B@
Vs m2
Tesla
T (Tesla, Nikola 1856-1943)
17 Statische Magnetfelder
403
17.1.2 Die Grundgleichungen des magnetischen Feldes im Vakuum
_
+
Wir hatten gefunden, dass ein elektrisches Feld in einer positiven Ladung entspringt und in einer negativen Ladung endet. Es ist ein wirbelfreies Quellenfeld. Diese Eigenschaften sind in zwei Grundgleichungen formuliert. Das magnetische Feld unterscheidet sich qualitativ vom elektrischen Feld. Wir haben gerade einige Eigenschaften von Permanentmagneten kennen gelernt. Jetzt wollen wir die magnetischen Eigenschaften des elektrischen Stromes untersuchen und dabei ebenfalls die entsprechenden Grundgleichungen aufstellen. Unsere Versuchsanordnung (Abb. 17.2a) soll aus einem Stromkreis bestehen, der einen langen geraden Draht enthält. Bringen wir eine Magnetnadel in seine Nähe, so stellt diese sich überall senkrecht zum Radiusvektor (Abb. 17.2b). Der Draht ist von einem kreisförmigen Magnetfeld umgeben, das weder Anfang noch Ende hat.
Abb. 17a: Anordnung zur Bestimmung des Magnetfeldes eines geraden stromführenden Drahtes
Abb. 17.2b: Magnetische Dipole ordnen sich in Richtung des Magnetfeldes an
Bei Umkehrung der Stromrichtung dreht sich die Richtung der Magnetnadel um, d.h. das magnetische Feld ändert seine Richtung. Die experimentellen Ergebnisse zur Abhängigkeit des Feldes von Stromstärke, Länge des Leiters und Abstand lassen sich darstellen durch
B(r )
P0 I . 2S r
(17.6)
Das Magnetfeld eines geraden Drahtes ist also proportional zur Stromstärke und umgekehrt proportional zum Abstand von der Drahtachse. Der Vorfaktor wird weiter unten verständlich G werden. Die Richtung von B ist durch die Rechte-Hand-Regel gegeben: Zeigt der Daumen in die Richtung des technischen Stromes, so zeigen die Finger in Richtung des Magnetfeldes.
404
17 Statische Magnetfelder
Das Auftreten ringförmiger magnetischer Feldlinien lässt sich mathematisch dadurch formulieren, dass das Linienintegral über einen geschlossenen Umlauf ungleich null ist. Es ergibt sich
G G Bdr
v³
P0 I 2S r 2S r
Kreis
P0 I .
(17.7)
Der Wert des Integrals ist unabhängig von der Wahl des Integrationsweges. Der Beweis wird wie bei der Herleitung des Gaußschen Satzes der Elektrostatik geführt. Die so verallgemeinerte Beziehung heißt Amperesches Durchflutungsgesetz.
G G
P0 I .
v³ Bdr
(17.8a)
C
Durch Benutzung des Stokesschen Satzes kann diese Gleichung in die Differentialform G G umgewandelt werden. Mit I ³ j dA erhalten wir
G G
G G
v³ Bdr ³ rot B dA C
G G
P0 ³ j dA ,
und damit gilt
G rot B
G
P0 j
.
(17.8b)
G G Früher wurde zwischen der magnetischen Feldstärke H und der magnetischen Induktion B unterschieden. Sie sind im Vakuum verknüpft durch die Relation
G B
G
P0 H .
(17.9)
Wir benutzen wie im Fall des elektrischen Feldes wieder nur eine Feldgröße, nämlich die G G magnetische Feldstärke B . Die Größe H heißt magnetische Erregung. Eine andere wichtige Beziehung betrifft den magnetischen Kraftfluss, den wir analog zum elektrischen Kraftfluss definieren:
)m
G G
³ B dA .
(17.10)
A
G Er ist ein Maß für die Zahl der magnetischen Kraftlinien, die durch die Fläche A treten (Abb. 17.3). Da die magnetischen Feldlinien geschlossen sind, folgt, dass der gesamte
17 Statische Magnetfelder
405
r B
Abb. 17.3a: Zur Definitition des magnetischen Flusses und
r dA
Abb. 17.3b: Der magnetische Fluss durch eine geschlossene Oberfläche ist null geschlossen
Kraftfluss durch die Oberfläche S eines Volumens V null ist, denn es treten genau so viele Feldlinien aus wie ein. Es gilt also
G G
v³ B dS
0.
(17.11a)
S
Formen wir dieses Oberflächenintegral mit Hilfe des Gaußschen Satzes in ein Integral über das G von der Oberfläche S eingeschlossene Volumen V um, so folgt
G G
G
v³ B dS ³ div B dV
0,
S
woraus sich ergibt
G div B 0 .
(17.11b)
Diese Gleichung drückt aus, dass es keine magnetischen Monopole gibt. Die Aussagen der Gln. (17.8) und (17.11) können wir wie folgt zusammenfassen: Das magnetische Feld eines elektrischen Stromes ist ein quellenfreies Wirbelfeld. Die beiden Gleichungen können dazu benutzt werden, die Magnetfelder vor allem symmetrischer stromführender Leiteranordnungen auszurechnen.
406
17 Statische Magnetfelder
17.1.3 Magnetische Felder einiger spezieller Leiteranordnungen 17.1.3.1 Magnetfeld eines homogenen Zylinders Das Magnetfeld eines langen, homogenen Zylinders (Abb. 17.4) im Außenraum ist gleich dem eines dünnen, geraden Drahtes.
G G B (r ) dr
v³
Kreis
2S
³ B (r ) r dM
2S r B (r )
P0 I
(17.12a)
0
B(r )
B
B(r) =
r
I r 2 r02
B(r) =
μ0 I 2 r
2S r B (r )
r
r0
(17.12b)
Im Bereich r < r0 wird das Feld nur von dem Bruchteil S r 2 j des Stromes erzeugt. Es ergibt sich
0
r0
P0 I , r ! r0 . 2S r
Abb. 17.4: Magnetfeld eines stromführenden langen Zylinders
B(r )
P0S r 2 j ,
1 P0 rj 2
(17.13a)
P0 I r , r r0 2S r02 (17.13b)
Die magnetische Feldstärke steigt also innerhalb des zylindrischen Leiters proportional zum Abstand von der Achse an. Für r = r0 erreicht sie demnach den Höchstwert und fällt für größere Abstände mit 1/r ab.
17.1.3.2 Magnetfeld im Inneren einer langen Spule G Wie ein Versuch mit Eisenfeilspänen zeigt, ist das magnetische Feld B im Inneren einer stromdurchflossenen langen Spule nahezu homogen. Wie leicht einzusehen ist, verläuft es in axialer Richtung. Im Außenraum verteilt es sich auf einen größeren Bereich und ist deswegen klein. Für die Berechnung der Größe von B wählen wir einen rechteckigen Integrationsweg wie in Abb. 17.5 gezeigt. Zum Integral tragen die Wegstücke im Außenraum der Spule nichts bei: Für die senkrecht zum Magnetfeld liegenden Wegstücke ist das Skalarprodukt null. Das achsenparallele Wegstück können wir soweit nach außen verlegen, dass dort das Feld vernachlässigt werden kann. Folglich erhalten wir für eine Spule mit N Windungen
G G
v³ B dr ,
lB
P0 N I
o B
P0 nI ,
(17.14)
17 Statische Magnetfelder
407
Beispiel: n 103 , I 1A, μ0
1, 26 u 10-6 Vs/(Am)
o B 0, 00126 T 12, 6 G.
Integrationsweg
Zum Vergleich dazu beträgt das Magnetfeld der Erde am Äquator 0,31 G . Abb. 17.5: Zur Berechnung des Magnetfeldes im Inneren einer langen Spule
7.1.4 Das Vektorpotential Sollen Magnetfelder komplizierterer Leiteranordnungen berechnet werden, so versagt das Amperesche Gesetz. Wir können aber noch auf eine andere Weise Magnetfelder ermitteln. Erinnern wir uns zunächst daran, wie wir in Kap. 1 vorgegangen sind, um ein elektrisches Feld aus seinen Quellen zu berechnen. Es gibt dort zwei Möglichkeiten. Die Erste besteht darin, den Gaußschen Satz der Elektrostatik anzuwenden. Die zweite Möglichkeit geht vom elektrostatischen Potential M (r ) aus. Ist dieses bekannt, so kann das Feld durch Gradientenbildung, G G E (r ) grad M (r ) , gewonnen werden. Wir stellen uns daher die Frage, ob es auch ein magnetisches Potential gibt, aus dem das Magnetfeld abgeleitet werden kann. Dies ist tatsächlich der Fall, aber das Potential ist kein Skalar, sondern eine Vektorgröße. Es heißt deswegen G G G G Vektorpotential des magnetischen Feldes B (r ) und wird mit A (r ) bezeichnet. Wir definieren es als:
G B
G rot A .
(17.15)
G G Damit ist die Quellenfreiheit von B (r ) automatisch gewährleistet, denn es gilt immer
G G di v B ( u A) { 0 .
(17.16)
Das Vektorpotential ist allerdings vieldeutig, denn es ist nur bis auf den Gradienten einer G skalaren Ortsfunktion f (r ) bestimmt. Schreiben wir also
G A'
G G A grad f (r ) ,
(17.17)
G G so besteht weiterhin der Zusammenhang zwischen B und A entsprechend (17.15), denn es G G gilt ebenfalls immer rot grad f = 0. Es ist daher zweckmäßig, A (r ) einer zusätzlichen Bedingung (Eichbedingung) zu unterwerfen.
408
17 Statische Magnetfelder
Es erweist sich als sinnvoll, für den Fall zeitunabhängiger Felder die sog. Coulombeichung zu wählen.
G div A 0 .
(17.18)
Durch diese Einschränkung ist das Vektorpotential bis auf eine additive Konstante eindeutig G bestimmt. Diese wird wie im elektrostatischen Fall so festgelegt, dass A (r o f) 0 wird. Fassen wir die Definitionsgleichungen für das Vektorpotential zusammen, so erhalten wir
G rot A
G G B; di v A 0 .
(17.19)
17.1.5 Biot-Savartsches Gesetz für beliebige Stromverteilungen In der Elektrostatik lässt sich das Potential aus einer gegebenen Ladungsverteilung berechnen. G G Genauso kann das Vektorpotential aus einer gegebenen Stromverteilung j (r ) bestimmt werden. Um das einzusehen, gehen wir vom Ampereschen Gesetz, (17.8a), aus. Unter Benutzung von (A1.62) erhalten wir
G u ( u A) Da
G G G grad div A div grad A P0 j .
(17.20)
G di v A 0 , folgt G 'A P0 j .
(17.21a)
Um das Ergebnis mit dem in der Elektrostatik gefundenen Resultat vergleichen zu können, schreiben wir es in Komponentenform:
'Ax
P0 jx , 'Ay
P0 j y , 'Az
P0 jz .
(17.21b)
Die Gleichungen entsprechen in ihrer Form vollständig der Poisson-Gleichung, 'M G G G G In Analogie zur Lösung letzterer ergibt sich für A (r1 ) im Punkt P (r1 )
G G A(r1 )
P0 4S
³
G G j ( r2 )dV2 , r12
wobei dV2 ein Volumenelement des Leiters ist und r12
U / H 0 .
(17.22) G G r1 r2 ist (Abb. 17.6).
17 Statische Magnetfelder
409
G G G G Bei bekanntem A (r1 ) kann das magnetische Feld am Ort P(r1) aus B rot A berechnet werden. Bei der Differentiation von A ist darauf zu achten, dass diese nach den Koordinaten G des Aufpunktes P(r1) vorzunehmen ist. Differentiation und Integration können vertauscht werden, so dass wir erhalten
G G
G G B (r1 )
P0 j (r )dV2 u 2 . ³ 4S r12
(17.23)
Unter Beachtung von
ergibt die Ausführung der Differentiation
G G B(r1 )
P0 4S
³
G G j (r2 ) u eˆ12 dV2 . r122
(17.24)
r r r12 A r P (r1 ) r2
r r1
( x1 x2 ) 2 ( y1 y2 ) 2 ( z1 z2 ) 2
r12
r j
dV2
0 Abb. 17.6: Zur Definition des Vektorpotentials
G Hierin ist der Einheitsvektor eˆ12 r12 / r12 . Wir interessieren uns hier besonders für das Feld stromführender dünner Leiter. Unter der Voraussetzung konstanter Stromdichte können wir schreiben (Abb. 17.7)
G G ³ j (r )dV
V
G G G G G ds ³ ³ j dA I ds . s
(17.25)
A
Damit reduziert sich (17.24) zu
G G B(r1 )
G
P0 ds2 u eˆ12 . I 4S ³ r122
(17.26)
r ds
r j
Diese Beziehung heißt Biot-Savartsches Gesetz (J. B. Biot, 1774-1862; F. Savart, 1791-1841). Es G bedeutet, dass das von einem Leiterelement ds2 erzeugte Magnetfeld senkrecht steht auf der Ebene, Abb. 17.7: Zum Biot-Savartschen Gesetz die von dem Leiterelement und dem von diesem auf den Aufpunkt gerichteten Vektor aufgespannt wird. Seine Größe ist durch den Wert des Integranden bestimmt.
410
17 Statische Magnetfelder
17.1.6 Anwendungen des Biot-Savartschen Gesetzes Die Berechnung des Gesamtfeldes kann schwierig sein. Wir beschränken uns hier auf drei Beispiele, aus denen auch die Problematik klar wird.
17.1.6.1 Magnetisches Feld eines geraden, dünnen Leiters Abb. 17.8 zeigt einen langen geraden Draht, durch den ein Strom I fließen möge. Wir G interessieren uns für das Magnetfeld im Punkt P ( R ) , wobei R der senkrechte Abstand vom Draht ist. Der Aufpunkt P erscheint einem G Leiterelement unter dem Winkel E . Ist r der Abstandsvektor, so gilt nach Abb. 17.8
ds = dl
r
R . sin E
l
R ctg E , dl { ds
r
l
R
P
(17.27)
R d E (17.28) sin 2 E
Nach dem Biot-Savartschen Gesetz folgt damit für den Betrag des magnetischen Feldes
B( R) Abb. 17.8: Zur Berechnung des Magnetfeldes eines stromführenden dünnen Leiters
B( R)
P0 I S sin E d E 4S R ³0 P0 I . 2S R
(17.29a) (17.29b)
Dieses Ergebnis haben wir bereits in Kap. 17.1.3. gefunden.
17.1.6.2 Magnetisches Feld einer Stromschleife In der xy-Ebene eines kartesischen Koordinatensystems befinde sich ein zum Kreis gebogener dünner Draht mit dem Radius R. Sein Zentrum liege im Nullpunkt. Das Magnetfeld eines Leiterstückes in einem Punkt dieser Ebene steht nach (17.26) senkrecht auf diesem und dem Vektor des Aufpunktes P(x,y,0), hat also nur eine z-Komponente (Abb. 17.9a). Der Betrag des Vektorproduktes im Biot-Savartschen Gesetz ist
G ds2 u eˆ12
sin u ds
( R r cos D ) ds , r12
(17.30)
17 Statische Magnetfelder
411
Bz P(r1) = P1
r r1
r r
r r12 r r2
r r
eˆ12
u
r ds2
-4
-2
0
2
4 z/R
Abb. 17.9: a) Zur Berechnung des Magnetfeldes einer Stromschleife; b) Magnetfeld auf der Achse
so dass für das Magnetfeld folgt
Bz
P0 I 4S
( R r cos D ) ds . r123 9
v³
(17.31)
Die analytische Berechnung für einen beliebigen Punkt in der Schleifenebene ist nicht möglich, da in diesem Fall elliptische Integrale zu lösen sind, was nur numerisch zu bewerkstelligen ist. Das magnetische Feld auf der z-Achse ist dagegen geschlossen angebbar. Für das Feld im Mittelpunkt des Kreisstromes ergibt sich, da r12 = R und u = S / 2 ,
Bz
P0 I 2R
.
(17.32)
Zur Ermittlung des Feldes in anderen Punkten der Achse gehen wir von dem Beitrag eines Leiterelementes aus.
G dB
G G
P0 ds u r . I 4S r3
(17.33)
Betrachten wir seine Komponente BA senkrecht zur Achse, so sehen wir, dass sich bei der Integration Paare von einander gegenüberliegenden Wegelementen wegheben, während sich G G die Parallelkomponenten dB& dB sin D addieren. Da sin D R / r und r A ds , ergibt sich aus (17.33) für das resultierende Magnetfeld B&
Bz
412
17 Statische Magnetfelder
Bz
P0 IR ds 4S r 3 ³
P0 IR 2S R 4S r 3
P0 I S R2 . 2S r 3
(17.34a)
z 2 R 2 können wir stattdessen auch schreiben
Mit r
Bz
P0 I 2
2 3/ 2
2S ( z R )
S R2 .
(17.34b)
Den Verlauf des Feldes auf der Achse zeigt Abb. 17.9b. Das Produkt aus Stromstärke und Fläche eines Kreisstromes heißt magnetisches DipolG moment des Kreisstromes und wird mit pm bezeichnet. Der Flächennormalen-Vektor ist dabei G wie bisher definiert als A S R 2 eˆz .
G pm
G I A.
(17.35)
Wir können demnach das Feld schreiben als
Bz
P0 pm . 2S r 3
(17.34c)
Ein Vergleich mit dem Ausdruck für das elektrische Feld eines elektrischen Dipols, (17.135b) lehrt uns, dass die beiden Fernfelder in ihrem Verlauf übereinstimmen. Das überrascht zunächst, da das Magnetfeld ein quellenfreies Wirbelfeld ist, das elektrische Feld aber ein wirbelloses Quellenfeld.
17.1.6.3 Magnetisches Feld einer Helmholtz-Anordnung In manchen Fällen werden allseitig zugängliche Magnetfelder benötigt, die über einen größeren Bereich homogen sind. Solche Felder lassen sich mit zwei einander gegenüber stehenden Ringspulen erzeugen (Helmholtz, H. L. 1821-1894) (Abb. 17.10). Dabei kommt es sehr auf das Verhältnis des Spulendurchmessers zum Abstand der Spulen an. Wir betrachten hier den Fall zweier Drahtschleifen. Zur Berechnung möge der Koordinatennullpunkt in die Mitte zwischen den Schleifen liegen. Wir konzentrieren uns auf das Magnetfeld auf der Mittelachse. Als solche werde die z-Achse gewählt.
17 Statische Magnetfelder
413
Bz / B (z = 0)
d=R
1 0.0928
R z
Bz
(d = R)
-0.5
0.0
0.5 z/R
Abb. 17.10: a) Helmholtz-Spulenpaar zur Erzeugung homogener Magnetfelder b) Magnetfeld auf der Achse Der Betrag des Feldes im Abstand z vom Nullpunkt ist nach (17.34b)
B( z )
§d · § d · B¨ z ¸ B¨ z ¸ ©2 ¹ © 2 ¹ 2 ½ P0 IR 1 1 . ® 2 2 3/ 2 2 2 3/ 2 ¾ 2 ¯[(d / 2 z ) R ] [(d / 2 z ) R ] ¿
(17.36)
In der Nähe von z = 0 entwickeln wir diesen Ausdruck in eine Taylorreihe. Dabei heben sich die Terme mit ungeradzahligen Potenzen von z heraus. Es ergibt sich
B( z )
P0 IR 2 [(d / 2) 2 R 2 ]3 / 2
3 d 2 R2 ½ 15 d 4 / 2 3d 2 R 2 R 4 4 2 1 z z ...¾ ® 2 2 2 2 2 4 8 (d / 4 R ) ¯ 2 (d / 4 R ) ¿ (17.37)
Wählen wir den Abstand d der Spulen gleich deren Radius R, so verschwindet der Term in z2. Das hat zur Folge, dass das Feld in sehr guter Näherung konstant ist:
B( z ) |
P0 IR 2 2
(5R / 4)
3/ 2
144 z 4 ½ . ®1 4 ¾ ¯ 125 R ¿
Für z/R = 0,17 beträgt die Abweichung nur 1 ‰ .
(17.38)
414
17 Statische Magnetfelder
17.1.6.4 Magnetfeld einer zylindrischen Spule In Abschnitt (17.1.3.2) haben wir das Magnetfeld im Inneren einer langen Spule berechnet. Wir wollen jetzt das Feld auf der Achse, (z), einer beliebigen zylindrischen Spule der Länge L unter Einschluss der Randeffekte behandeln. Der Koordinatennullpunkt liege im Spulenmittelpunkt. Der Beitrag des Magnetfeldes, der von dem Anteil dn ( N / L) d ] { n d ] herrührt, ergibt sich nach (17.34b) zu
P0 nIR 2
dBz
3/ 2
2^( z ] ) 2 R 2 `
d] .
(17.39a)
Dieser Ausdruck ist von –L/2 bis L/2 zu integrieren. Dazu machen wir die Substitution
z ]
R tan D .
Dies führt zu
P0 nI
dBz
2
D2
³ cos D dD
(17.39b)
D1
woraus für das Feld folgt
Bz
P0 nI °
z L/2 z L/2 ® 2 2 2 ° ( z L / 2) R ( z L / 2) 2 R 2 ¯
½° ¾ ¿°
(17.40)
Im Zentrum der Spule ergibt sich
B
L/R=20
P0 nI
Bz
2
L/R=5 L/R=10
-10 -5
0
5
10 z/R
Abb. 17.11: Magnetfeld auf der Achse einer Helmholtzanordnung für verschiedene z/R und
L 2
L / 4 R2
.
(17.40a)
Das Magnetfeld auf der Achse ist in Abb. 17.11 dargestellt. Im Allgemeinen ist es inhomogen und Randeffekte sind nicht zu vernachlässigen. Nur wenn die Spule im Vergleich zu ihrem Radius sehr lang ist, ist es im Inneren annähernd homogen. Für L >> R folgt dann der uns bereits bekannte Ausdruck
Bz
P0 nI
17 Statische Magnetfelder
415
17.2 Kräfte auf bewegte Ladungsträger im Magnetfeld 17.2.1 Lorentzkraft Wir bringen einen geraden Draht so zwischen die Pole eines Hufeisenmagneten, dass er senkrecht zu dessen Magnetfeld liegt (Abb. 17.12). Beim Einschalten eines elektrischen Stromes beobachten wir, dass der I Draht aus dem Magnetfeld hinaus geschleuLitze dert wird. Ändern wir die Stromrichtung, so kehrt sich die Bewegungsrichtung des Drahtes um. Auf das Drahtstück der Länge l (im Magnetfeld) wirkt also eine Kraft, die sowohl senkrecht zu dem im Draht fließenden Strom als auch senkrecht zum Magnetfeld r gerichtet ist. Bis auf einen ProportionalitätsF faktor, der im SI-System den Wert 1 erhält, muss also gelten Abb. 17.12: Auf einen Leiter tritt senkrecht zu der durch Magnetfeld und Stromrichtung G G G F I l u B Lorentzkraft, (17.41a) aufgespannten Ebene die Lorenzkraft auf d Die Kraft wird als Lorentzkraft (H. A. Lorentz, 1853-1932) bezeichnet. Ihre Richtung ist definitionsgemäß durch die Linke-Hand-Regel festgelegt. Weist der Mittelfinger in die G G Richtung des technischen Stromes I und der Zeigefinger in die Richtung von B , so zeigt der G Daumen in die Richtung der Kraft F . G G N G G Da I l j Al e vV Q v , können wir die Lorentzkraft auch schreiben als V
G F
G G Q vu B .
(17.41b)
Setzen wir wie bisher voraus, dass die Stromstärke in „Ampere“ gemessen wird, so kann (17.41a) zur Festlegung der Einheit der magnetischen Feldstärke dienen. Sie ergibt sich zu
[ B] 1
N Vs =1 2 =:1T . Am m
(17.42)
Die Lorentzkraft in der Form von (17.42) lässt sich schön mit dem Fadenstrahl-„Rohr “ demonstrieren. Es besteht aus einem Glaskolben, der ein Gas unter geringem Druck ( p | 103 bar ) enthält (Abb. 17.13). Der Kolben befindet sich zwischen zwei Helmholtzspulen, die für ein homogenes Magnetfeld sorgen. Die aus einer Glühkathode freigesetzten Elektronen werden in einem Wehneltzylinder (A. R. B. Wehnelt, 1871-1944) zu einem feinen
416
17 Statische Magnetfelder
G Strahl gebündelt und von der ringförmigen Anode auf die Geschwindigkeit v senkrecht zum Magnetfeld beschleunigt. Ihr Betrag ist (s. (15.79))
v
2eU / m .
(15.79)
Glaskolben Die Bahnkurve ist ein Kreis in der xy-Ebene, denn die Lorentzkraft steht stets senkrecht auf dem Geschwindigkeitsvektor. Sie wirkt als Zentripetalkraft, so dass wir erhalten
Anode WehneltElektrode
B K
Ionen
e vB
Neongas
m v2 , R
(17.43)
woraus sich mit Hilfe von (15.79) der Bahnradius R zu Abb. 17.13: Fadenstrahlrohr zur Ermittlung der spezifischen Elementarladung e/m Krankheit
R
2U (m / e) . B
(17.44)
ergibt. Längs ihrer Bahn stoßen die Elektronen mit Gasatomen zusammen und regen ein Teil von ihnen zum Leuchten an. Es entsteht ein kreisförmiger, eng begrenzter, leuchtender Faden. Auf den ersten Blick ist das überraschend, denn warum diffundieren die Elektronen hinter der Anode nicht auseinander? Das liegt daran, dass auch Gasatome ionisiert werden. Diese haben wegen ihrer großen Masse eine gegenüber den Elektronen vernachlässigbare Geschwindigkeit. Heraus diffundierende Elektronen bilden mit den positiven Ionen ein radial nach außen gerichtetes elektrisches Feld, das weitere Elektronen zur Umkehr zwingt. Durch Ausmessung des Radius lässt sich bei Kenntnis von U und B die spezifische Elektronenladung e/m bestimmen.
17.2.1.1 Drehspulmessinstrumente
Zur Messung von Stromstärke und Spannung werden, wie in Kap. 2 bereits angeführt, meistens Drehspulinstrumente benutzt. Ein solches Gerät besteht aus einer kurzen rechteckigen Spule mit N Windungen, die zwischen den geeignet geformten Polschuhen eines Permanentmagneten drehbar angeordnet ist (Abb. 17.14). Die Spule habe eine Querschnittsfläche A = 2rl. Wir betrachten zunächst eine einzige Stromschleife. Nach (17.35) ist ihr magnetisches Moment G G pm I A . Auf die zum Magnetfeld senkrechten Abschnitte l wirkt die Lorentzkraft
G F
G G I (l u B ) .
17 Statische Magnetfelder
417
Das Kräftepaar erzeugt ein Drehmoment
G D
G G 2 r uF ,
(17.45)
dessen Betrag sich ergibt zu
D
G G 2rF sin(r , F ) G G 2rlIB sin(r , F ) G G
denn sin(r , F )
N
S
G G pm B sin( pm , B )
G G sin( pm , B ) .
r r
Damit lässt sich das Drehmoment als vekG G torielles Produkt aus pm und B schreiben
G D
G G pm u B .
r l
(17.46)
Das Drehmoment einer Spule mit N Windungen ist dementsprechend N-mal so groß. Beim Einschalten des Stromes wird die Spule solange aus ihrer Ruhelage herausgedreht, bis ihr das entgegen gerichtete Drehmoment einer Spiralfeder das Gleichgewicht hält.
r B
r I
y
x
Abb. 17.14: Aufbau eines Strommessgerätes
17.2.1.2 Grundlagen magnetischer Linsen
Magnetische Felder spielen u.a. in der Elektronen- und Ionenoptik eine wichtige Rolle, denn geladene Teilchen lassen sich durch Magnetfelder fokussieren. Sie übernehmen damit die Rolle von Glaslinsen im Bereich des sichtbaren Lichtes. Es gibt zwei Möglichkeiten: Die Abbildung im magnetischen Längsfeld und die im magnetischen Querfeld. Magnetische Linsen finden Anwendung z.B. bei Bildröhren in Fernsehern oder Monitoren, bei Massenspektrometern und Elektronenmikroskopen. Häufig werden sie mit elektrischen Linsen kombiniert.
17.2.1.2.1 Abbildung im homogenen magnetischen Längsfeld einer langen Spule
Aus einer Glühkathode ausgetretene Elektronen werden wie oben durch elektrische Felder G fokussiert und auf die Geschwindigkeit v beschleunigt. Nach Passieren einer Lochblende im Punkt (0; 0; 0) treten sie dann divergent in ein homogenes magnetisches Längsfeld mit den
418
17 Statische Magnetfelder
Komponenten (0; 0; Bz) ein (Abb. 17.15). Dort beschreiben sie spiralförmige Bahnen. Die Bewegungsgleichung lautet
G ma
G G (e)(v u B ) .
(17.47)
Das entspricht den Komponentengleichungen
Blende
r B
R
z 4f Abb. 17.15: Homogenes magnetisches Längsfeld einer langen Spule als magnetische Linse und
m m
wv x wt wv y
wt wv z m wt
ev y Bz , ev x Bz ,
(17.48)
0.
Integration der letzten Gleichung ergibt eine Bewegung mit konstanter Geschwindigkeit in z-Richtung. Integration der beiden ersten Gleichungen führt auf eine Kreisbahn, so dass die resultierende Bahnkurve eine Spirale darstellt. Ihr Radius stimmt mit dem von (17.44) überein.
R
2U (m / e) , wobei B = Bz . B
(17.49)
Die Steighöhe der Spirale, also die Strecke ' z , die während der Umlaufzeit
T
2S R vR
(17.50)
durchlaufen wird, folgt aus (17.48c) zu
'z
v zT
2S v z m . B e
Sind die Eintrittswinkel M klein, kann in (17.51) v z erhalten
'z
(17.51) v cos M | v gesetzt werden und wir
2S v m . B e
(17.52)
In diesem Abstand werden also alle Elektronen, die unter verschiedenen Winkeln von einem dingseitigen Punkt ausgehen, nach einem Umlauf in einem bildseitigen Punkt wieder vereinigt. Die Brennweite f der magnetischen Linse ergibt sich daher zu 'z / 4 .
17 Statische Magnetfelder
f:
'z 4
S
2mU . B e
419
(17.53)
Die Linse hat einen Abbildungsmaßstab von 1:1. Vergrößerungen sind also nicht zu erzielen. Außerdem befinden sich Gegenstand und Bild im Magnetfeld der Linse, sind also schwer zugänglich.
17.2.1.2.2 Abbildung im inhomogenen magnetischen Längsfeld einer kurzen Spule
Ist die Spule kurz, l d R , so ist das Magnetfeld zwar weiter spiegelsymmetrisch zu ihrer Mittelebene, ist aber jetzt inhomogen. In z-Richtung konvergieren die Feldlinien, um ab der Mittelebene wieder zu divergieren. Das Feld hat also eine Radialkomponente (Abb. 17.16), deren Vorzeichen an der Mittelebene wechselt. Daraus folgt, dass ein (Elektron oder Ion 1), das von einem Punkt P auf der z-Achse unter einem bestimmten Winkel aus startet und in das in Richtung wachsender z-Werte gerichtete Magnetfeld eintritt, durch dessen Querkomponente eine seitliche Ablenkung nach hinten erfährt. Auf Grund dieser seitlichen Geschwindigkeitskomponente entsteht durch die starke Feldkomponente in z-Richtung eine radial nach Innen gerichtete Lorentzkraft, so dass das Teilchen einen Impuls in Richtung der z-Achse erhält. Beim Austritt aus dem Feld tritt eine seitliche Ablenkung in umgekehrter Richtung auf, so dass sich das Elektron (bei geeigneter Feldstärke) parallel zur Achse weiter bewegt. Analoge Überlegungen gelten für ein Elektron 2, dessen Startrichtung in einer Ebene senkrecht zur z-Achse um 180° gegenüber der des Elektrons 1 gedreht ist. Alle Kräfte r auf dieses sind entgegengesetzt, so dass es ebenfalls zum Parallelstrahl wird. Da beide Elektronen im Feld auch eine Drehung erfahren, sind die Ebenen, in der sich die Elektronen vor bzw. hinter der Linse bewegen, gegeneinander verdreht. Natürlich lässt sich der Strahr lengang auch umkehren: Parallel zur z-Achse in die magnetische Linse eintretende Elektronen werden in einem Punkt vereinigt. Der Abstand dieses Punktes Abb. 17.16: Zur Berechnung der von der Mittelebene der Spule wird analog zur LichtBrechkraft einer kurzen Linse optik als Brennweite der Linse bezeichnet. Für achsenund nahe Bahnen erhalten wir
1 f
e 8mU
f
³B
2
dz .
(17.54)
f
Hierin ist U wieder die Spannung, welche nötig ist, um die Elektronen auf die Geschwindigkeit v zu beschleunigen und B das Magnetfeld in Achsenrichtung. (17.54) kommt folgendermaßen
420
17 Statische Magnetfelder
zustande: Ein Elektron möge parallel zur z-Achse in das Magnetfeld der Spule eintreten. Am Ion greift im senkrechten Abstand r von der z-Achse auf Grund des Magnetfeldes eine Kraft an, die entgegengesetzt gleich der Zentrifugalkraft ist.
G d 2r m 2 dt
G mZ 2 r .
(17.55)
Aus (17.35a) folgt für Z
eB . m
Z
(17.56)
G Die Änderung des Radiusvektors r erfolgt aber mit der halben Winkelgeschwindigkeit, da nach dem Sehnen-Tangentensatz D ' D / 2 und damit
Z ' dD '/ dt (1/ 2) dD / dt Z / 2 eB /(2m) .
(17.57)
Berücksichtigen wir dies in (17.55), so ergibt sich
d 2r dt 2
2
1§ e · ¨ ¸ B2r . 4©m¹
(17.58)
Auf Grund der Inhomogenität des Feldes ändert sich der Bahnradius, wenn sich das Ion durch die Spule bewegt. Dem tragen wir Rechnung, indem wir schreiben
dr dr dz dr vz ; dt dz dt dz 2 d r d § dr · d § dr · ¨ vz ¸ vz ¨ ¸ 2 dt dt © dz ¹ dt © dz ¹
d § dr · v ¨ ¸. dt © dz ¹
(17.59)
denn für kleine Einfallswinkel können wir vz durch v ersetzen. Der letzte Term lässt sich umschreiben in
v
d § dr · ¨ ¸ dt © dz ¹
v
d § dr · dz ¨ ¸ dz © dz ¹ dt
v2
d 2r . dz 2
(17.60)
Setzen wir dies in (17.59b) ein und ersetzen in (17.58) die Radialbeschleunigung durch den so erhaltenen Ausdruck, so ergibt sich
17 Statische Magnetfelder
v2
421
2
d 2r dz 2
1§ e · ¨ ¸ B2r . 4© m¹
(17.61)
Die Geschwindigkeit v bestimmt sich aus (17.43) zu
v2
2 eU / m ,
(17.43)
Damit erhalten wir
d 2r dz 2
1 §e· 2 ¨ ¸B r . 8U © m ¹
(17.62)
Durch Integration ergibt sich für den Ablenkungswinkel der Elektronen nach Durchlaufen des Feldes
tan G
f
dr dz
1 §e· 2 ¨ ¸ ³ B rdz 8U © m ¹ f
(17.63a)
Da die Spule kurz sein soll, ändert sich der Abstand r nicht allzu viel. Wir ziehen r deswegen vor das Integral und ersetzen ihn durch den Abstand R beim Eintritt in das Magnetfeld. Da tan G < 0 ist, ist die Bahn hinter der Spule zur Achse hin geneigt. Die reziproke Brennweite ergibt sich nach Abb. 17.17 aus tan G R / f zu
1 f
f
1 §e· 2 ¨ ¸ ³ B dz 8U © m ¹ f
(17.63b)
Um starke Vergrößerungen zu erreichen, muss die Brennweite der Linsen klein sein. Das erfordert große inhomogene Felder, also eng begrenzte, große Felder in Durchstrahlrichtung (vgl. Kap. 17.1.6.4). Das leisten Eisen-gekapselte Spulen.
R f
Abb. 17.17: Zur Definition der Brechkraft einer kurzen Linse
422
17 Statische Magnetfelder
17.2.1.2.3 Abbildung durch ein magnetisches Querfeld
Durch eine Spaltblende mögen Ionen der Masse m und der Ladung Q mit der GeschwinG digkeit v divergent aus einer Quelle IQ in ein senkrecht zur Strahlachse gerichtetes Magnetfeld eintreten (Abb. 17.18). Dort beschreiben sie wie im Fadenstrahlrohr Kreisbahnen mit dem Radius
R
mv . QB
(17.44)
Die Geschwindigkeit v ist durch (17.43) gegeben. Wir betrachten jetzt ein Ion der Masse m1, das senkrecht zu einer Geraden IQA durch den Eintrittsspalt tritt. Nach Durchlaufen eines Halbkreises mit dem Radius R trifft es die Gerade gD im Punkt A. Ein anderes Ion, das die Quelle unter dem Winkel (90q r M ) verlässt, erreicht nach Durchlaufen des Magnetfeldes die Gerade gD im Punkt B. Die Strecke AB ist Detektor-
S
r B
R
ebene
AB | 2 R 2 R cos M
2 R (1 cos M ) ,
gD
(17.64a)
BA was sich für kleine Winkel M vereinfacht:
IQ
AB
RM 2 .
(17.64b)
Alle Ionen, die unter dem Winkel (90q r M ) die Quelle verlassen, werden auf einen Austrittsspalt der Breite RM 2 in Höhe der Geraden gD abgebildet und dort von Halbleiter-Detektoren nach-
Abb. 17.18: Ein homogenes magnetisches Querfeld fungiert als Massenfilter
d { AB gewiesen. Der Radius der Bahnkurve der Ionen hängt von deren Masse ab. Eine Anordnung wie in Abb. 17.18 lässt sich daher als Massenfilter verwenden. Teilchen mit den Massen m1 und m2 können voneinander getrennt werden, solange sich die Auftreffbereiche nicht überlappen. Die Bedingung lautet also
R1 R2 t wobei R
RD 2 , 2
( R1 R2 ) / 2 der mittlere Radius ist. Er ist durch (17.44) bestimmt zu
(17.65)
17 Statische Magnetfelder
423
2U (m / Q) . B
(17.44)
R
Das Massen-Auflösungsvermögen 'm / m ergibt sich durch Auflösen dieser Beziehung nach m unter Berücksichtigung von (17.65) zu
'm m
R12 R22 R2
( R1 R2 ) 2 R , R2
(17.66a)
'm D2. m
(17.66b)
Je größer also die Divergenz der Ionenbahnen am Eintrittsspalt ist (im Rahmen der Gültigkeit von (17.64b)), desto kleinere Massenunterschiede können noch nachgewiesen werden.
17.2.1.2.4 Geschwindigkeitsfilter
Wir schicken einen Ionenstrahl entlang der z-Achse (Abb. 17.19) durch einen Spalt in ein homogenes magnetisches Querfeld (0, By, 0). Gleichzeitig wirke auf ihn ein senkrecht zu diesem gerichtetes homogenes elektrisches Querfeld (Ex, 0, 0). Lorentzkraft und elektrische Feldkraft bewirken eine Ablenkung der Ionen in einander entgegengesetzten Richtungen. Sie gelangen nur dann durch den Austrittsspalt, wenn die resultierende Kraft verschwindet. Das bedeutet
QE
Q vB .
(17.67)
Bei gegebenen Feldstärken E und B ist diese Bedingung (bei unendlich schmalen Spalten) nur für eine bestimmte Geschwindigkeit erfüllbar, gegeben durch das Verhältnis von E und B:
v
E . B
(17.68)
Die Anordnung wirkt also als Geschwindigkeitsfilter. Nach dem Entdecker M. C. W. Wien (1866-1938) heißt es Wien-Filter. Endlich breite Spalte lassen Ionen in einem schmalen Geschwindigkeitsintervall passieren, das von der kinetischen Energie der Ionen und der Länge des durchlaufenen Feldraumes mitbestimmt wird.
Spalte y
x
r v
z r E (E y ,0,0)
r B(0, Bx ,0)
Abb. 17.19: Durch Kombination eines magnetischen und eines elektrischen Querfeldes entsteht ein Geschwindigkeitsfilter
424
17 Statische Magnetfelder
17.2.1.3 Hall-Effekt
Durch einen rechteckigen metallischen Leiter mit dem (Abb. 17.20) fließe ein elektrischer Strom mit der Stromdichte j;
G j
Querschnitt
G nebE .
A
ad
(17.69)
Hierin sind n die Dichte und b v / E die Beweglichkeit der Ladungsträger. Senkrecht zur G Stromrichtung befinde sich ein homogenes magnetisches Feld B . Durch die Lorentzkraft G G werden die Elektronen senkrecht zu j und B abgelenkt. Dies hat eine Ansammlung von Elektronen auf der einen Seite und eine Verarmung auf der anderen Seite zur Folge. Es baut sich solange ein elektrisches Feld EH auf, bis sich elektrische Feldkraft und Lorentzkraft das Gleichgewicht halten.
eEH
e vB .
(17.70)
Durch Einführung der Beweglichkeit wird daraus
EH
bBE .
(17.71)
Auf Grund des entstandenen Feldes entsteht bei der in Abb. 17.20 skizzierten Messanordnung zwischen Vorder- und Rückseite des Leiters eine elektrische Spannung, die als Hallspannung bezeichnet wird.
d
r E
r j
UH Abb. 17.20: Halleffekt. Durch Einwirkung eines homogenen magnetischen Querfeldes auf einen stromdurchflossenen Leiter oder Halbleiter entsteht eine elektrische Spannung und
r B
UH
EH d .
(17.72)
Ersetzung von E in (17.71) durch j mittels (17.69) und Einsetzen in (17.72) ergibt
UH
jb B ne
I B. nea
Die Größe 1/(ne) heißt Hall-Konstante.
(17.73)
17 Statische Magnetfelder
425
Die Beziehung gestattet durch Messung der Hall-Spannung die Bestimmung der Konzentration der Ladungsträger. Das Vorzeichen von UH gibt Auskunft über das Vorzeichen der Ladung. Ist umgekehrt die Ladung bekannt, so kann der Halleffekt zu einer genauen Messung von Magnetfeldern benutzt werden.
17.2.1.4 Kräfte zwischen stromdurchflossenen Leitern
Wir knüpfen an die experimentelle Ableitung der Lorentzkraft zu Beginn des Kap. 3.2.1 an. Dort hatten wir die Kraft auf einen stromdurchflossenen Draht im Feld eines Permanentmagneten untersucht. Wir ersetzen jetzt den Magneten durch einen stromführenden Leiter, im einfachsten Fall durch einen langen geraden Draht. Wie wir wissen, erzeugt er auch ein Magnetfeld. Die beiden Drähte seien parallel zueinander aufgehängt (Abb. 17.21).
Abb. 17.21: Zwei gleichsinnig vom Strom durchflossene parallel verlaufende Drähte ziehen sich an, gegensinnig durchflossene stoßen sich ab aus
I _
+
I
_
+
Fließen die Ströme parallel zueinander, so beobachten wir, dass sich die Drähte anziehen, bei antiparalleler Stromführung stoßen sie sich ab. Quantitativ ergibt sich aus (17.41) durch EinG G G setzen von B aus (17.29b) und Berücksichtigung von I A B für den Betrag der Kraft
F
P0 I1 I 2 l . 2S r12
(17.74)
Auf dieser Beziehung beruht die Definition der Einheit der Stromstärke, des Ampere. 1 A ist die Stärke eines stationären elektrischen Stromes, der zwischen zwei im Abstand von 1 m angeordneten parallelen, unendlich langen Drähten im Vakuum pro Meter die Kraft von 2 10-7 N hervorruft.
426
17.3
17 Statische Magnetfelder
Relativistischer Zusammenhang zwischen elektrischen und magnetischen Feldern
Nach unseren bisherigen Erfahrungen scheinen elektrische und magnetische Felder völlig unabhängig voneinander zu existieren. Wir werden aber im Folgenden sehen, dass in Wirklichkeit eine enge Verknüpfung zwischen ihnen besteht. Betrachten wir das Beispiel einer negativen Probeladung q, die sich parallel zu einem stromdurchflossenen Draht mit der G y Geschwindigkeit v 0 bewegt (Abb. 17.22). r q v Wie stellt sich die Situation in einem fest mit r r r r dem Draht verbundenen Inertialsystem S r v + v, v - 0 dar? Die Antwort kennen wir bereits: Bewegen sich Probeladung und Elektronen x im Inneren des Drahtes in die gleiche Richtung, so wirkt nach (17.12b) und (17.41b) auf die Probeladung eine anzieS hende Kraft der Größe
F
y´ S
q v+
v, v -
0
r r
r v =0
x´
Abb. 17.22: Eine negative Probeladung bewege sich mit der Geschwindigkeit v0 parallel zu einem stromdurchflossenen Draht
P0 I q v 0 . 2S r
(17.75)
Hierin ist r der Abstand zwischen Ladung und Draht. Den Strom I drücken wir aus durch I U vA , wobei U die Dichte der Elektronen ist, v ihre Geschwindigkeit und A die Querschnittsfläche des Drahtes. Wir wollen zunächst den Fall v = v0 betrachten. Wir erhalten dann als Kraft
F
P0 q U A 2 v 2S r
P0 c 2 q U A v 2 (17.76) r c2 2S
Wir merken noch an, dass der Draht natürlich ungeladen ist; positive Ladung der Atomrümpfe und negative Ladung der Elektronen heben sich auf. Die positiven Ladungen ruhen in unserem Koordinatensystem. Wir verlegen nun unseren Beobachtungsort in ein sich mit dem Draht bewegendes Inertialsystem S´. Auf Grund des Relativitätsprinzips erwarten wir, dass die Probeladung mit einer gleich großen Kraft angezogen wird. In der Tat erzeugen die positiv geladenen Atomrümpfe des Drahtes am Ort der Probeladung ein Magnetfeld. Aber nun scheint sich ein Debakel abzuzeichnen: Die Probeladung ist in Ruhe, also ist die Lorentzkraft gleich null. Als rettender Ausweg bietet sich eine elektrische Feldkraft an. Dazu muss der sich bewegende Draht von S´ betrachtet geladen erscheinen. Das ist tatsächlich der Fall, und zwar deswegen, weil der Draht in S´ betrachtet, kürzer ist als in S. Da Ladungen beim Wechsel des Koordinatensystems unverändert bleiben, ändern sich mit der Länge des Drahtes auch die Ladungsdichten, und
17 Statische Magnetfelder
427
zwar für die sich bewegenden positiven Ladungen und die ruhenden negativen Ladungen unterschiedlich. Die Längenkontraktion beträgt nach Kap. 2.3.1.1,
l ' l 1 v2 / c2 ,
(2.10b)
wobei l die Länge eines Drahtstückes im Koordinatensystem S ist, in dem der Draht ruht. Der Querschnitt bleibt gleich, so dass das Volumen gemäß kleiner ist als in S. Bezeichnen wir die stationäre Ladungsdichte in S mit U , so befindet sich im Drahtstück der Länge l und dem Querschnitt A die Ladung Q U l A . Ersetzen wir U 0 durch U ' und l durch l´, so folgt für die Ladungsdichte des Drahtstückes in S´
U
U0
1 1 v2 / c2
.
(17.77)
Daraus ergibt sich die Ladungsdichte der sich in S´ bewegenden positiven Ladungen zu
U '
U
1
.
1 v2 / c2
(17.78)
Die negativen Ladungen ruhen in S´. Folglich ist ihre Ladungsdichte dort gleich der „Ruhedichte“ U 0 . In (17.77) ist dann U0 U ' , denn U ' ist die Dichte, wenn der Draht ruht. Folglich gilt für die Elektronen im Draht
1
U
U '
,
(17.79)
U '
U 1 v2 / c2 .
(17.80)
1 v2 / c2
bzw.
Berücksichtigen wir, dass der Draht in S neutral ist, U ladungsdichte U '
U'
U
'
U U
U , so erhalten wir als Gesamt-
'
v2 / c2 1 v2 / c2
.
(17.81)
Der sich bewegende Draht ist positiv geladen und erzeugt am Ort der Probeladung ein G elektrisches Feld E c .
428
17 Statische Magnetfelder
Die zugehörige Coulombkraft ist durch (15.12) gegeben:
G G F c qE c .
(17.12)
Das elektrische Feld eines geladenen Drahtes im Abstand r von der Achse ist durch (1.45c) gegeben:
G E
O rˆ . 2SH 0 r
(17.45c)
Damit wird der Betrag der elektrischen Kraft
F'
e
U A
v2 / c2
2SH 0
r
1 v2 / c2
(17.82)
sie ist zum Draht gerichtet. Ein Vergleich mit der in S wahrgenommenen Kraft F zeigt, dass die Kräfte bis auf den Wurzelfaktor gleich sind, sofern
H 0 P0 c2
1.
(17.2)
Diese Beziehung hatten wir schon in Kap. 17.1.1 kennen gelernt. Sie folgt hier direkt aus dem Relativitätsprinzip. Es ist also
F'
1 1 v2 / c2
F.
(17.83)
Für kleine Geschwindigkeiten sind die Kräfte also gleich. Allein durch einen Wechsel des Bezugssystems wird aus einer magnetischen Kraft eine elektrische Kraft und umgekehrt. Gehen wir also von einer elektrischen Kraft in S´ aus, so können wir durch eine KoordinatenTransformation in das Ruhesystem des Drahtes die Lorentzkraft ableiten. Dies zeigt, dass zwischen elektrischen und magnetischen Feldern ein enger Zusammenhang besteht, so dass wir zu Recht von einem elektromagnetischen Feld sprechen. Bei der Besprechung der relativistischen Dynamik hatten wir gefunden, dass sich die Kraft bei hohen Geschwindigkeiten selbst transformiert. In unserem Beispiel ist für F´ die transversale Komponente einzusetzen. Für diese gilt
F'
1 1 v2 / c2
F.
(7.13))
Dieser Ausdruck ist aber gerade identisch mit (17.83), so dass letztere Beziehung auch für große Geschwindigkeiten erfüllt ist.
17 Statische Magnetfelder
17.4
429
Materie im magnetischen Feld
17.4.1 Übersicht Wir hatten in Kap. 15 gefunden, dass das elektrische Feld in Materie elektrische Dipole induziert oder schon vorhandene Dipole ausrichtet, woraus eine dielektrische Polarisation G resultiert. Analog dazu bewirkt ein Magnetfeld eine Magnetisierung M einer Probe. Sie wird G durch atomare magnetische Momente pm verursacht, die ebenfalls entweder durch das Feld induziert werden oder, wenn schon vorhanden, in diesem ausgerichtet werden.
G M
1 G ¦ pm . V V
(17.84a)
G Da die Dimension des magnetischen Momentes Am2 ist, ergibt sich für die von M zu
>M @
1A / m .
(17.84b)
Ähnlich wie im elektrischen Fall, wo die Polarisation eine Änderung der elektrischen Feldstärke in Materie zur Folge hat, wird im äußeren Magnetfeld eine Veränderung des G magnetischen Feldes B beobachtet. Stellen wir uns etwa eine stromdurchflossene Spule vor G und bezeichnen wir das Vakuum-Feld in ihrem Inneren mit B0 , so können wir schreiben
G B
G G B0 P0 M .
(17.85)
G Es ist zu beachten, dass erst das Produkt aus P0 und M die Dimension von B hat. Die G Erfahrung zeigt, dass der zweite Term bei nicht zu hohen Temperaturen proportional zu B0 ist. Der Proportionalitätsfaktor heißt magnetische Suszeptibilität F m .
G
P0 M
G
F m B0 .
(17.86)
G Durch Einsetzen und Ausklammern von B0 folgt
G G G B (1 F m ) B0 : P B0 .
(17.87)
Der Klammerausdruck wird als Permeabilität P bezeichnet. Auf Grund des Vorzeichens und Wertes von F m werden die Stoffe bezüglich ihres magnetischen Verhaltens in drei Typen eingeteilt. Alternativ kann die Klassifizierung durch den Wertebereich von μ erfolgen.
430
17 Statische Magnetfelder
In Tab. 17.1 sind die molaren Suszeptibilitäten F m , mol einiger Stoffe bei Raumtemperatur zusammengestellt. Wir besprechen zunächst den Diamagnetismus.
Typ
μ
Fm
Diamagnetische Stoffe
1
Ferromagnetische Stoffe
>> 0
f ( B)
f (T )
>> 1
Tab. 17.1: Einteilung des Magnetismus nach Vorzeichen und Größe der magnetischen Suszeptibilität Fm bzw. der Permeabilität μ
17.4.2 Diamagnetismus Diamagnetische Stoffe besitzen kein permanentes magnetisches Moment. Im Magnetfeld werden aber magnetische Dipole induziert. Die Beobachtung zeigt, dass ein Diamagnet im inhomogenen Feld eine abstoßende Kraft erfährt. Die Magnetisierung ist also dem induzierenden Feld entgegengesetzt, d. h. die magnetische Suszeptibilität ist negativ. Die Kraft ist analog zur Elektrostatik (Gl. 15.37b) gegeben durch
G F
Probe N r B
S
Abb. 17.23: Anordnung zur Ermittlung der magnetischen Suszeptibilität und
G G pm grad B .
(17.88a)
Eine Probe mit dem Volumen V erfährt also eine Kraft
G F
G G M V grad B
G Fm G V B grad B . (17.88b) P0
Ist der Feldgradient bekannt, so lässt sich durch Messung der Kraft, etwa mittels einer geeichten Feder (Abb. 17.23), die Suszeptibilität bestimmen. Da die Werte sehr klein sind, muss die Messanordnung sehr empfindlich sein. Der Diamagnetismus ist eine Eigenschaft aller Stoffe, er wird aber in Para- und Ferromagneten von deren magnetischen Eigenschaften überdeckt. Alleiniger Diamagnetismus tritt auf in Atomen mit abgeschlossenen Elektronenschalen, z.B. in Edelgasen. Eine besonders große negative Suszeptibilität zeigt Wismut (Tab. 17.2a)
17 Statische Magnetfelder
431
Stoff
F m L@
1Vs / A :1Henry 1H
Die Induktivität lässt sich im Prinzip aus den Daten der Spule berechnen.
(18.3)
446
18 Zeitlich veränderliche Magnetfelder
18.2.1 Selbstinduktion einer langen Spule Für eine lange Spule der Länge l und der Windungszahl n pro Meter ergibt sich die Selbstinduktion L wie folgt: Das magnetische Feld im Innern der Spule ist nach (17.14b)
B
P0 nI ,
(17.14b)
womit sich der magnetische Fluss bzw. die zeitliche Flussänderung durch eine ihrer Windungen ergibt zu
)m
AB
d )m dt
P0 n AI
P0 n A
(18.4)
dI dt
In einer Spule mit N nl Windungen entsteht also eine Spannung
U ind
P0 n 2 l A
dI . dt
(18.5)
Durch Vergleich mit (18.2) folgt für L
L
P0 n 2 A l
.
(18.6)
Die Induktivität spielt vor allem in der Wechselstromtechnik eine wichtige Rolle. Wir besprechen zunächst der Einschalt- und Abschaltvorgang in einem Stromkreis mit Induktivität
RV
_
+
Abb. 18.4: Stromkreis mit Spule und Ohmschem Widerstand
a) Einschaltvorgang Wir betrachten einen Stromkreis gemäß Abb. 18.4. Er besteht aus einer Spule der Induktivität L und einem in Reihe geschalteten Ohmschen Widerstand R, der sich aus dem Ohmschen Widerstand der Spule und einem möglichen Außen- oder Verbraucherwiderstand zusammensetzt. Zum Zeitpunkt t = 0 werde der Stromkreis über eine Gleichspannung U0 geschlossen.
18 Zeitlich veränderliche Magnetfelder
447
Nach den Kirchhoffschen Regeln gilt
U 0 U ind U0 R
I
RI
U0 L
dI . dt
(18.7a)
L dI . R dt
(18.7b)
Die Lösung dieser inhomogenen Differentialgleichung lässt sich bereits ohne mathematisches Lösungsverfahren finden: Für t = 0 liegt die ganze Batteriespannung an der Spule. Der Strom ist null, da Uind = -U0 . Nach hinreichend langer Zeit ist die Induktionsspannung null und der Strom ist allein durch den Ohmschen Widerstand gegeben, I = U0/R. An diese Grenzwerte muss der Stromverlauf im Zwischenbereich angepasst werI den. Das leistet eine Exponentialfunktion
I (t ) (U 0 / R )e t / W
I=
U0 1 e R
t/
Vom Maximalwert I = U0/R weicht der Strom um diesen Betrag ab. Also erhalten wir als Lösung
I
U0 1 et /W ; W R
L/R .
(18.8)
Der Quotient aus L und R heißt Zeitkonstante. Sie bestimmt den Anstieg des Stromes. Der Verlauf der Stromstärke ist in Abb. 18.5a dargestellt.
I=U0/R
t Abb. 18.5a: Stromverlauf in einer Spule beim Anlegen einer Spannung
b) Ausschaltvorgang Wir legen den Schalter nach der anderen Seite um, so dass Spule und die jetzt in Reihe geschalteten Widerstände RL und RV einen geschlossenen Stromkreis bilden. Durch die Änderung der Stromstärke beim Abschalten wird in der Spule eine Spannung induziert, die nach der Lenzschen Regel versucht, den Strom aufrecht zu halten. Es gilt
U ind
L
dI dt
RI .
R
RL RV
(18.9)
Trennung der Variablen und Integration führt zu I
dI ³I I 0
t
R dt , L ³0
(18.10a)
448
18 Zeitlich veränderliche Magnetfelder
ln
I I0
R t L
o I
I 0 et /W .
(18.10b)
Die Induktionsspannung ergibt sich durch Einsetzen von (18.10b) in (18.9) zu
U ind
U 0
RL RV t / W ;W e RL
L /( RL RV )
I
(18.11)
U/U0
(c)
(b)
1.0
I
U
0
/R
t
I
I 0e
1/e 0.0
1 0
t
0
t
Abb. 18.5b,c: Verlauf von Strom (b) und Spannung (c) beim Abschalten der äußeren Spannungsquelle und Schließung des Stromkreises über R aber Der Verlauf der Stromstärke ist aus Abb. 18.5b zu ersehen Abb. 18.5c zeigt, dass unmittelbar nach Umlegen des Schalters (t = 0) Spannungen auftreten, die wesentlich über der Batteriespannung liegen.
18.2.2 Selbstinduktion eines Koaxialkabels Neben der Kapazität eines Koaxialkabels, die wir bereits früher berechnet haben, ist für technische Anwendungen seine Induktivität von Wichtigkeit. Zur Erinnerung: Ein solches Kabel besteht aus einem Innenleiter mit kreisförmigem Querschnitt und einem ihn umgebenden konzentrischen Außenleiter (Abb. 18.6). Die Ströme in den Leitern fließen antiparallel zueinander. Um den Innenleiter erzeugt er ein Magnetfeld, das nach (17.12b) gegeben ist durch
R1 R2 Abb. 18.6: Aufbau eines Koaxialkabels
B(r )
P0 I . 2S r
(17.11b)
Der magnetische Fluss durch eine auf den beiden
18 Zeitlich veränderliche Magnetfelder
449
Leitern senkrecht stehende Fläche ist
G G ³ BdA
)m
A
z0 z
³
z0
§ P0 I ¨ ¨ 2S ©
dr · ³ r ¸¸ dz R1 ¹
R2
R2
P0 Iz dr ; 2S R³ r
(18.12)
1
Daraus ergibt sich für den Fluss und dessen zeitliche Änderung
P0 Iz R2 ln ; 2S R1
)m
d )m dt
P0 z R2 dI ln 2S R1 dt
(18.13, 14)
Andererseits gilt
d )m dt
L
dI ; dt
(18.15)
Durch Vergleich folgt
L
18.3
P0 R z ln 2 . 2S R1
(18.16)
Gegeninduktion
Abb. 18.7 zeigt eine lange Spule mit dem Querschnitt A, der Länge l und n1 Windungen pro Meter, durch die ein zeitveränderlicher Strom I1 fließt. Dicht um die Spule ist eine zweite Spule mit n2 Windungen/m gewickelt). Das Magnetfeld im Innern der ersten Spule ist
B
P0 n1 I . 2S l
(17.14a)
Der Fluss ist ) m B A . Er durchsetzt auch die Spule 2; die zeitliche Änderung des Stromes bewirkt in ihr eine Induktionsspannung
U ind ,2
U ind ,2
n2 A
dB ; dt
(18.17)
U~
P0 n1 n2 A dI1 l
l
dt
{ L12
dI1 . dt
Der erste Faktor L12 heißt Gegeninduktivität.
(18.18)
Abb. 18.7: Zur Gegeninduktivität zweier übereinander gewickelter Spulen
450
18 Zeitlich veränderliche Magnetfelder
Aus Symmetriegründen ist zu vermuten, dass der Koeffizient L12 mit L21 identisch ist, nicht nur in diesem speziellen Fall einer langen Spule. Zur Überprüfung betrachten wir einen vom Strom I1 durchflossenen beliebigen Stromkreis 1. Er ruft im Punkt G G P (r2 ) ein Magnetfeld B hervor, das mit dem Biot-Savartschen Gesetz berechnet werden kann (Abb. 18.8). Das Feld r r erzeugt nach (17.22) ein Vektorpotential B dr2 r r P(r2 ) G dA2 G G P0 I1 dr1 A(r2 ) , (18.20)
4S
r r2
r12 r dA1 r dr1 r P(r1 ) r r1
12
G
wobei d r1w y ein Linienelement des Kreises 1 ist. Der den anderen Leiterkreis durchsetzende magnetische Fluss ist
)m
G G
³ B dA
Af
0
³r
G G
³ rot AdA
f
f
.
(18.21)
Af
Daraus folgt mit Hilfe des Stokesschen Satzes:
G G rot AdA f ³
Abb. 18.8: Zur Berechnung der Gegeninduktivität
Af
v³
G G Adr2 .
(18.22)
(2)
Einsetzen von A(r2) aus (18.21) ergibt
G G
)m
P0 I1 dr1 dr2 . v v ³ ³ 4S (1) (2) r12
(18.23)
Damit wird die Induktionsspannung
L12
U ind ,2
dI1 ; dt
(18.24)
mit der Gegeninduktivität
L12
P0 4S
G G dr1 dr2 v³ v³ r12 (1) (2)
(18.25)
Da das Doppelintegral völlig symmetrisch bezüglich der beiden Leiterkreise ist, folgt
L12
L21
(18.26)
18 Zeitlich veränderliche Magnetfelder
18.4
451
Energie des magnetischen Feldes
In Kap. 18.2.1 hatten wir den Ein- und Ausschaltvorgang in einem Stromkreis betrachtet, der eine Spule und einen Ohmschen Widerstand enthielt. Beim Einschalten der Spannung baut sich in der Spule ein Magnetfeld auf. In diesem ist dann magnetische Feldenergie gespeichert. Das leuchtet sofort ein, wenn wir den Ausschaltvorgang nach Abb. 18.5b betrachten. Der Strom fällt nicht sofort auf null ab, sondern klingt je nach Größe der Zeitkonstante erst langsam ab. Die treibende Spannung ist die entstandene Induktionsspannung. Multiplizieren wir sie mit dem Strom, so erhalten wir die momentane Leistung
Wmagn (t ) U ind I
L
dI I. dt
(18.27)
Die gesamte im Magnetfeld gespeicherte Energie bzw. Leistung ergibt sich durch Integration über die Zeit. 0
Wmagn
L ³ I I0
dI dt dt
1 2 LI 0 ; 2
(18.28)
Hierin ist I0 der durch die Spule fließende Strom vor dem Abschalten der Spannung. Diese Leistung wird im Ohmschen Widerstand in Wärme umgewandelt. Allgemein gilt also
Wmagn
LI 2 / 2 .
(18.29)
Die in einer langen Luftspule gespeicherte magnetische Energie wird mit (18.6)
Wmagn
1 μ0 nI 0 Al 2μ0 l
1 B 2 Al . 2μ0
(18.30)
Damit erhalten wir für die Energiedichte, der allgemein gilt
Wmagn V
: w magn
B2 . 2 μ0
(18.31)
452
18.5
18 Zeitlich veränderliche Magnetfelder
Anwendungen des Induktionsgesetzes
18.5.1 Generatoren und Motoren Elektrische Energie wird auch heute noch überwiegend durch mechanisch angetriebene Generatoren erzeugt. Wird umgekehrt einem solchen Generator elektrische Energie zugeführt, so arbeitet er als Elektromotor. Es gibt verschiedene Ausführungsformen, die alle auf dem Induktionsgesetz beruhen. Der prinzipielle Aufbau eines WechselstromMotors/ Generators ist der gleiche wie beim Drehspulinstrument. Er ist in Abb. 18.9a dargestellt. Zwischen den Polschuhen eines fest montierten Elektromagneten (Stators) mit homogenem Feld B ist eine Spule auf einer Welle drehbar (als Rotor) angeordnet. Auf ihr befinden sich zwei Schleifkontakte, an denen die beiden Enden der Spule befestigt sind. Durch den Antrieb der Welle mit der WinkelAbb. 18.9a: Prinzip des Wechselgeschwindigkeit Z entsteht zwischen den beiden strommotors bzw. -generators Kontakten eine Induktionsspannung
U
G G dA NB dt
NB A Z sin Zt .
(18.32)
Wird der Generator umgekehrt an eine Wechselspannung U angeschlossen, so dreht sich die Spule synchron mit der Frequenz Z der Spannungsquelle. Soll die Anordnung als Gleichstrom-Generator/-Motor dienen, so muss die Spannung nach einer halben Umdrehung umgepolt werden, damit das Drehmoment immer die richtige Richtung hat. Das wird durch den Kommutator erreicht, der im einfachsten Fall aus zwei voneinander isolierten Halbzylindern besteht, die gegeneinander um 180° versetzt auf der Welle angebracht sind. Ein Generator dieser Ausführung liefert eine stark pulsierende Spannung, und der entsprechende Motor bringt ein sehr inkonstantes Drehmoment hervor. Dem Übelstand kann abgeholfen werden durch die Anbringung mehrerer gegeneinander versetzter Spulen auf dem Rotor (Als Trommelanker 12 11 10 9 8 7 6 5 4 3 2 1 (Abb. 18.9b) ausgebildet) Der Magnet benötigt keine externe Spannungsquelle; auf Grund seiner remanenten Magnetisierung ist immer ein kleines magnetisches Feld vorhanden. Der in der Spule erzeugte, zunächst schwache Strom wird dazu ausgenutzt, das Feld sukzessive zu verstärken bis Sättigung eintritt. Diese Methode wird als dynamo-elektrisches Abb. 18.9b: Aufbau eines Trommelankers Prinzip bezeichnet.
18 Zeitlich veränderliche Magnetfelder
453
18.5.1.1 Gleichstrom-Maschinen Es gibt zwei Möglichkeiten, das Magnetfeld in der Feldspule zu erzeugen. Bei der Hauptschluss-Maschine sind Induktionsspule und Feldspule in Reihe geschaltet, während sie bei der Nebenschluss-Maschine parallel geschaltet sind. a) Die Hauptschluss-Maschine Im Leerlaufbetrieb liegt nur eine sehr geringe Spannung UK an den Klemmen der Maschine. Der Feldmagnet wird erst dann erregt, wenn der Stromkreis über einen Verbraucher mit dem Widerstand RV geschlossen wird (Abb. 18.10). UK ist gleich der Induktionsspannung Uind, vermindert um den Spannungabfall am Innenwiderstand Ri .Letzterer setzt sich zusammen aus dem Widerstand RA der Induktionsspule (des Ankers) und dem der Feldspule, Rf. Also gilt mit
Ri
RA R f
UK
U ind Ri I ,
(18.33)
12
11
Stator
1
Rotor
10 2
N
9 3
S
8 4 7 6
5
Uind Abb. 18.10: Schaltung der Hauptschlussmaschine
In Abb. 18.11 ist der Verlauf der Induktions- und der Klemmenspannung in Abhängigkeit von der Stromstärke dargestellt. Uind steigt zunächst linear an, biegt aber bei größerer Stromstärke wegen der beginnenden Sättigung der Magnetisierung ab. Der Arbeitspunkt ergibt sich aus dem Schnittpunkt des Graphen Uind(I) mit der Geraden UK = (Ri+RV)I.
Die elektrische Leistung des Generators ist
U ind I
Ri I 2 RV I 2 .
(18.34)
Der Wirkungsgrad ist definiert als das Verhältnis von nach außen abgegebener Leistung zur Gesamtleistung. Er ergibt sich zu
K
Pa P
UK U ind
RV . RV Ri
(18.35)
454
18 Zeitlich veränderliche Magnetfelder
Ukl
a)
Uind
b) U0
U = f (I)
Ukl
IRi
U = (R i + R v ) I
I
I
Abb. 18.11: Hauptschlussmaschine: a) Erregungskurve mit Arbeitspunkt b) Strom-Spannungs-Kennlinie Er ergibt sich zu
K
Pa P
UK U ind
RV . RV Ri
(18.35)
Zur Optimierung muss also der Innenwiderstand klein gegenüber dem Verbraucherwiderstand sein. Dazu werden die Spulen aus relativ dicken Drähten gefertigt. Die Hauptschluss-Maschine liefert eine von der Belastung abhängige Spannung. Ihr Vorteil ist andererseits, dass sie sich der jeweiligen Belastung anpasst.
b) Die Nebenschluss-Maschine Bei der Nebenschluss-Maschine liegen Feldspule und Verbraucher parallel zur Induktionsspule (Abb. 18.12). Der in ihr erzeugte Strom IA setzt sich folglich zusammen aus dem Feldstrom If und dem Strom IV durch den Verbraucher
I f IV .
IA
(18.36)
Es gelten die Beziehungen
IV
UK ,If RV
Daraus folgt
UK . Rf
(18.37)
18 Zeitlich veränderliche Magnetfelder
If IV
455
RV . Rf
(18.38)
Einsetzen in (18.36) ergibt
IV
Rf RV R f
Stator I A und I f
RV IA . R f RV
Rotor 12
11
1
10
2
(18.39)
9
Damit erhalten wir für die Leistungen in den drei Parallelkreisen
PA Pf PV
N
2 A A
R I ; RV2 R f ( RV R f ) 2 R 2f RV ( RV R f ) 2
I A2 ;
3
8 4
7 6
5
S
(18.40) Abb. 18.12: Schaltung der Nebenschlussmaschine
2 A
I .
Der Wirkungsgrad der Nebenschluss-Maschine ergibt sich zu
K
R 1 V Rf
1 . RA ( RV R f ) 2
(18.41)
R 2f RV
Zur Erreichung eines großen Wirkungsgrades müssen Rf groß und RA klein gegen RV sein. Die Statorwicklungen bestehen daher aus dünnen Drähten. Die Kennlinie der Maschine ist in Abb. 18.13 gezeigt.
Ukl
Uind
Ukl
Abb. 18.13: Strom-Spannungs-Kennlinie einer Nebenschlussmaschine und
I(Rf+Rv)
I
456
18 Zeitlich veränderliche Magnetfelder
Im Leerlauf, IV = 0, hat die Klemmenspannung ihren höchsten Wert; sie entspricht der Induktionsspannung. Mit zunehmender Belastung, also größerem Strom IV, steigt auch der Ankerstrom an und UK sinkt infolge des am Anker auftretenden Spannungsabfalls. Da der Feldstrom proportional UK ist, wird das Magnetfeld geschwächt, was eine weitere Abnahme der Klemmenspannung zur Folge hat. Schließlich tritt der Moment ein, dass trotz kleiner werdendem RV der Strom IV = UK/RV zu sinken beginnt, da die Klemmenspannung UK schneller abnimmt als RV. Wird die Maschine kurzgeschlossen, so fällt der Strom auf einen sehr kleinen Wert, der durch die remanente Magnetisierung bestimmt ist. Wie die Kennlinie zeigt, bleibt in ihrem oberen Teil die Klemmenspannung ziemlich konstant. Sie ist aber empfindlich gegenüber starken Belastungsschwankungen.
c) Die Verbund-Maschine Durch Kombination der Hauptschluss- und der Nebenschluss-Maschine lassen sich die jeweiligen Nachteile weitgehend vermeiden. Dazu erhält der Feldmagnet zwei Wicklungen, von denen die eine in Reihe mit der Ankerwicklung geschaltet ist und die andere parallel zu ihr.
18.5.1.2 Wechselstrom-Maschinen Wechselstrom-Maschinen kommen ohne Kommutator aus. Entgegen dem in Abb. 18.9a gezeigten Prinzipschaltbild ist die Induktionsspule als Stator ausgebildet, während der Feldmagnet rotiert. Das hat den Vorteil, dass auch große Ströme ohne Komplikationen durch die nötigen Schleifkontakte abgenommen werden können. Letztere werden nur noch benötigt, um dem Rotor den notwendigen Feldstrom zu liefern. Er wird entweder durch Gleichrichtung eines Teils des Induktionsstromes (Nebenschluss-Anordnung) oder durch einen separaten Gleichstrom-Generator erzeugt. Ein solcher Innenpol-Wechselstrom-Generator ist in Abb. 18.14 gezeigt. In diesem Fall besteht der Feldmagnet aus drei Elektromagneten mit alternierenden Polen. Der Stator trägt sechs Induktionsspulen, die mit ebenfalls abwechselndem Richtungssinn gewickelt und in Reihe geschaltet sind. Auf diese Weise addieren sich am Ausgang die Einzelspannungen. Um eine Wechselspannung von 50 Hz zu erzeugen, muss der Generator mit 50 60 / 3 1000 Umdrehungen/Minute laufen. Nach (18.32) ist die Spannung sinusförmig
UK
U 0 sin Zt .
(18.32)
Die Scheitelspannung hängt vom Aufbau des betreffenden Generators ab. Um die an einen Stromkreis mit Ohmschem Widerstand abgegebene Leistung mit der einer Gleichstrom-Maschine vergleichen zu können, wurden die Effektivwerte von Spannung und Strom eingeführt.
18 Zeitlich veränderliche Magnetfelder
457
Stator
Induktionsspulen
Rotor
Abb. 18.14: Innenpol-Wechselstrom-Generator
Feldspulen
Die momentane Leistung ist
P (t ) U 0 I 0 sin 2 Zt .
(18.42)
Die mittlere Leistung über eine Periode wird damit T
P
1 U 0 I 0 sin 2 Zt T ³0
U 0 I0 2
Dies entspricht der Leistung einer Gleichspannungsquelle der Spannung U Strom I
U eff
(18.43
U 0 / 2 , die den
I 0 / 2 abgibt. Daher werden die Größen
U 0 / 2 ; I eff
I0 / 2
(18.44)
als Effektivwerte von Spannung und Strom bezeichnet.
18.5.1.3 Drehstrom-Maschinen
Werden auf dem Stator drei voneinander um 120° versetzte Spulen angebracht, so entsteht eine Drei-Phasen-Wechselspannung; der entsprechende Strom heißt auch Drehstrom. Werden die drei Klemmenpaare mit den entsprechenden Statorklemmen eines Drehstrommotors verbunden, so entsteht im Innenraum ein Feld, das sich mit einer bestimmten Winkelgeschwin digkeit dreht.
458
18 Zeitlich veränderliche Magnetfelder
Die Drehung lässt sich mit einer Magnetnadel demonstrieren, die sich im Zentrum befindet (Abb. 18.15a). Als Rotor dient ein Kurzschlussanker. Es gibt mehrere Ausführungen.
U1 U 0 sin t U2
U 0 sin( t 120 )
U 3 U 0 sin( t 240 )
Kupferstäbe Abb. 18.15a: Demonstration eines Drehfeldes mit einer rotierenden Magnetnadel
Abb. 18.15b: Kurzschlussanker gegessen
In Abb. (18.15b besteht er aus einem Metallzylinder, der aus geschichteten Eisenblechen zusammengesetzt ist. In seinen längsseitig angebrachten Nuten befinden sich Kupferstäbe, in denen durch das Drehfeld Wirbelströme induziert werden. Durch die Wechselwirkung der Felder wird der Anker „mitgenommen“. Eine andere Möglichkeit besteht darin, als Anker einen Eisenring mit einer geschlossenen Wicklung zu verwenden, in der starke Ströme induziert werden. Sie versuchen, die Rotation der Statorfelder entsprechend der Lenzschen Regel zu verhindern, wodurch der ganze Ring in Drehung versetzt wird. Der Vorteil des Drehstromgenerators liegt darin, dass er erheblich größere Leistungen als ein Ein-Phasen-Wechselstromgenerator abzugeben vermag. Es ist zwischen zwei Schaltungen der Feldspulen zu unterscheiden: In der Sternschaltung (Abb. 18.16a) ist das eine Ende der Spulen miteinander verbunden, in der Dreieckschaltung (Abb. 18.16b) sind die Spulen in Reihe geschaltet, so dass ein geschlossener Kreis entsteht. Das ist möglich, weil die Summe der induzierten Ströme gleich null ist. Die Spannung wird an den Verbindungspunkten zweier Spulen abgegriffen. Werden in einer Sternschaltung zwischen dem jeweiligen Spulenende und dem gemeinsamen anderen Ende nach Abb. 18.16a drei gleich große Ohmsche Widerstände geschaltet, so fließen in den Verbraucherkreisen die Ströme I1
I 0 sin Zt ,
I2
I 0 sin(Zt 120q),
I3
I 0 sin(Zt 240q).
(18.45)
18 Zeitlich veränderliche Magnetfelder
459
Durch Anwendung der Additionstheoreme lässt sich zeigen, dass bei gleichem I0 die Summe der Ströme verschwindet, so dass durch die gemeinsame Rückleitung kein Strom fließt. Er wird deswegen häufig Nullleiter genannt.
1
a)
b)
1 U1
U1,3 U12 U2
U3,2
U3
2
3
U1,2
3
2
Abb. 18.16a: Sternschaltung der Feldspulen in einer Drehstrommaschine cccccccgegessen
Abb. 18.16b: Dreieckschaltung der Feldspulen
Wir fragen nun nach der Spannung U zwischen den Klemmen zweier Spulen. Dazu müssen wir die Einzelspannungen addieren. Beispielsweise erhalten wir für U12
U
2S · § U 0 sin Zt U 0 sin ¨ Zt ¸ 3 ¹ © 2S 2S · § cos Zt sin U 0 ¨ sin Zt sin Zt cos ¸ 3 3 ¹ © §3 · 3 cos Zt ¸¸ U 0 ¨¨ sin Zt 2 ©2 ¹ 2S 2S § · 3 U 0 ¨ sin sin Zt cos cos Zt ¸ 3 3 © ¹
(18.46)
2S · S· § § 3 U 0 cos ¨ Zt ¸ 3 U 0 sin ¨ Zt ¸ . 3 ¹ 6¹ © © Es ergibt sich eine Wechselspannung mit dem
3 -fachen Scheitelwert eines Einphasen-
Wechselstrom-Generators. Die Dreieckschaltung liefert drei um 120° versetzte Wechselspannungen mit gleicher Scheitelspannung wie beim Einphasen-Wechselstromgenerator. Der Strom in jeder Leitung setzt sich dagegen aus zwei Strömen zusammen; z.B. gilt
I1
I A IB .
(18.47)
460
18 Zeitlich veränderliche Magnetfelder
Er beträgt das 3 -fache des in einer Spule fließenden Stromes. Die abgegebene Leistung verteilt sich auf die einzelnen Phasen verteilt. Eine Leitung wird somit weniger belastet als beim Einphasen-Wechselstrom-Generator gleicher Leistung Drehstrom kann zum Betrieb eines Drehstrommotors genutzt werden. Dieser funktioniert nach dem Prinzip von Abb. 18.15a.
18.5.2 Wechselstromkreise mit komplexen Widerständen Bisher haben wir nur den Fall betrachtet, dass an einem Wechselstrom-Generator ein Stromkreis mit Ohmschem Widerstand angeschlossen war. Wir wollen nun auch induktive und kapazitive Widerstände zulassen, die durch Spulen und Kondensatoren entstehen. Wir werden sehen, dass in einem solchen Schaltkreis der Strom gegenüber der Spannung phasenverschoben ist. Beispielsweise beträgt die Phasenverschiebung bei einem Kreis mit rein induktivem Widerstand 90°. Es ist daher naheliegend, zur Darstellung dieses Sachverhaltes die komplexe Zahlenebene zu benutzen und den Spannungsabfall an einer Induktivität auf der imaginären Achse aufzutragen. Die Benutzung komplexer Zahlen erleichtert die Berechnungen erheblich. Wir diskutieren drei Fälle: Einen Stromkreis mit einer Induktivität, einen solchen mit einer Kapazität und einen, in dem sich beide Typen sowie ein Ohmscher Widerstand befinden.
18.5.2.1 Stromkreis mit Induktivität
In einem Stromkreis mit einer Induktivität L (Abb. 18.17) gilt nach den Kirchhoffschen Regeln
U G U ind U(t)
U,I
I(t)
L
U0
t
I
0,
(18.48)
wobei UG die Spannung der Stromquelle ist. Es folgt in der Schreibweise reeller Zahlen
U 0 sin Zt Abb. 18.17: Wechselstromkreis mit Induktivität
L
dI . dt
(18.49)
Integration führt zu
I
U0 sin Zt dt L ³
U0 cos Zt ZL
I 0 cos Zt
I 0 sin(Zt S / 2).
(18.50)
Der Strom hinkt der Spannung um 90° hinterher. Eine Verzögerung des Stromes ist plausibel, denn die auftretende Induktionsspannung verzögert den Strom.
18 Zeitlich veränderliche Magnetfelder
461
18.5.2.2 Stromkreis mit Kapazität
Die Kapazität ist definiert durch
C I
Q U
o U
U 0 Z C cos Zt
Q C
o
dU dt
I 0 cos Zt
Jetzt eilt der Strom der Spannung voraus (Abb. 18.18). Auch das ist einleuchtend, denn damit am Kondensator eine Spannung liegt, muss erst Ladung auffließen.
1 dQ C dt
1 I C
o U 0 Z cos Z t
(18.51)
I 0 sin(Zt S / 2)
(18.52)
U(t)
U,I
I(t)
L
U0
t
I Abb. 18.18: Wechselstromkreis mit Kapazität
18.5.2.3 Stromkreis mit Induktivität, Kapazität und Ohmschem Widerstand
Jetzt behandeln wir eine Reihenschaltung aus L, C, R (Abb. 18.19). Die angelegte Spannung muss gleich der Summe der Spannungsabfälle sein.
R L
U0
dI Q IR U G ; dt C dU G d 2I dI 1 . L 2 R I dt dt C dt
U(t)
I(t) t
U L U C IR U G ; L
U,I
I
C t
t
( / 2 )T
Abb. 18.19: Wechselstromkreis mit Ohmschem Widerstand, Induktivität und Kapazität
Im Folgenden benutzen wir die komplexe Darstellung und setzen für die angelegte Spannung
UG
U 0 eiZt .
(18.54)
Sie bewirkt einen Strom
I
I 0 ei (Zt M ) .
(18.55)
462
18 Zeitlich veränderliche Magnetfelder
Dabei ist M der Phasenwinkel zwischen Strom und Spannung. Einsetzen in die untere der Gln. (18.45) ergibt
1 § · ) R¸I ¨ i (Z L ZC © ¹
UG .
(18.56)
Definieren wir entsprechend dem reellen Ohmschen den komplexen Widerstand Z
Z eiM
durch den Quotienten UG/I, so folgt für die Impedanz Z oder den Scheinwiderstand 2
Z
1 · § R2 . ¨ZL ZC ¸¹ ©
(18.57)
Der Phasenwinkel folgt aus
tg M
Im( Z ) Re( Z )
Z L 1/(ZC ) R
.
(18.58)
Diese Ergebnisse lassen sich in einem sogenannten Zeigerdiagramm darstellen (Abb. 18.20). Der Ohmsche oder Wirkwiderstand wird auf der Abzisse aufgetragen und der Imaginärteil auf der Ordinate. Letzterer besteht aus zwei Anteilen, dem induktiven Widerstand
RL
iZ L ,
(18.59)
und dem kapazitiven Widerstand
RC
1 iZC
i . ZC
(18.60)
Sind die beiden Teilwiderstände dem Betrage nach gleich, so bleibt nur der Ohmsche Widerstand übrig und der Phasenwinkel ist null. Ist umgekehrt der Ohmsche Widerstand sehr klein gegen den Betrag des Imaginärteils, so beträgt die Phasenverschiebung fast 90°. Da in diesem Fall keine Verluste erkennbar sind, sollte die mittlere Leistung der Stromquelle null sein. Zur Verifizierung machen wir zunächst einen kleinen Abstecher und formulieren den Strom in reeller Schreibweise. Die Lösung werde geschrieben als
eiD
cos D i sin D
(18.61)
Aus der Theorie der Differentialgleichungen folgt, dass bei einer komplexen Lösung sowohl der Realteil wie auch der Imaginärteil eine Lösung darstellen. Wir befinden uns im Einklang mit den obigen Ergebnissen, wenn wir den Imaginärteil wählen (Die richtige Lösung wird ganz allgemein durch die Anfangsbedingungen festgelegt).
18 Zeitlich veränderliche Magnetfelder
I (t )
463
I 0 sin(Zt M ) .
(18.62)
Die mittlere Leistung ergibt sich durch Integration über eine Periode T
P U I
U 0 I0 T sin Zt sin(Zt M ) dt T ³0 U 0 I0 T (sin 2 Zt cos M sin Zt cos Zt sin M )dt T ³0
2S / Z zu
.
(18.63)
Nur der erste Term trägt zur mittleren Leistung bei.
P Für M
U 0 I0 cos M U eff I eff cos M . 2
(18.64)
90q wird die mittlere Leistung null.
Im Z i L
i Abb. 18.20: Zeigerdiagramm zur Darstellung komplexer Widerstände
L
1 C i C
tg
Im Z Re Z
1
Z
R Re Z
Der zweite Term in (18.63) liefert in einer halben Periode einen positiven Beitrag und in der Folgenden einen gleich großen negativen Beitrag. Das bedeutet, dass der Stromquelle abwechselnd Leistung entzogen und zurückgegeben wird. Da sie im Mittel verschwindet, heißt dieser Teil Blindleistung. Von der Stromquelle müssen sowohl Wirkleistung wie Blindleistung zur Verfügung gestellt werden.
464
18.6
18 Zeitlich veränderliche Magnetfelder
Einfache Netzwerke
Induktive und kapazitive Widerstände weisen ein gegenläufiges Frequenzverhalten auf. Während ein induktiver Widerstand proportional zur Frequenz Z zunimmt, nimmt ein kapazitiver Widerstand mit wachsendem Z ab. Dieses Verhalten kann zur Herstellung von Hoch- und Tiefpässen benutzt werden; durch die Kombination beider entsteht ein Frequenzfilter. Ein Hochpass besteht im einfachsten Fall aus einer Kapazität und einem Ohmschen Widerstand, die nach Art eines frequenzabhängigen Spannungsteilers geschaltet sind (Abb. 18.21a). Die Ausgangsspannung Ua wird am Ohmschen Widerstand abgenommen. Ist Ue die Eingangsspannung, so gilt für das Verhältnis von Ue/Ua
Ua Ue
UR U R UC
R . 1/(iZC ) R
(18.65a)
Erweiterung mit dem Konjugiert Komplexen ergibt
Ua Ue
Z 2 R 2C 2 iZ RC . 1 Z 2 R 2C 2
(18.65b)
Daraus ergibt sich durch Multiplikation mit dem Konjugiert Komplexen und anschließendem Radizieren
Ua
Z RC
Ue
1 Z 2 R 2C 2
.
(18.66)
Für kleine Frequenzen wird das Spannungsverhältnis gleich dem Wert des Zählers, für große Frequenzen strebt es gegen eins (Abb. 18.21b).
C
1.0
Ua
U0
R
U0
Ue
0.5
0.0
0
5
Abb. 18.21: a) Hochpass aus einer Kapazität und einem Ohmschen Widerstand; b) Verhältnis von Ausgangs- zur Eingangsspannng
18 Zeitlich veränderliche Magnetfelder
465
Werden kapazitiver und Ohmscher Widerstand miteinander vertauscht, so entsteht ein Tiefpass (Abb. 18.22). Wir erhalten
Ua Ue
UC U R UC
R
1/(iZC ) , (18.67) 1/(iZC ) R
Ua
Ue
woraus sich in analoger Weise ergibt
Ua
1
Ue
1 Z 2 R 2C 2
.
(18.68)
Abb. 18.22: In einem Tiefpass sind Ohmscher Widerstand und Kapazität miteinander vertauscht
Für kleine Frequenzen wird das Spannungsverhältnis gleich eins, für große Frequenzen nimmt es wie 1/(Z RC ) ab, strebt also gegen null. Wird in den beiden Schaltungen die Kapazität durch eine Induktivität ausgetauscht, so wird aus einem Hochpass ein Tiefpass und umgekehrt. Allerdings sind die Übertragungseigenschaften wegen des immer vorhandenen Ohmschen Widerstandes etwas schlechter. Eine Induktivität in Kombination mit einer Kapazität und einem Ohmschen Widerstand findet in Frequenzfiltern Einsatz. Eine Reihenschaltung der drei Schaltelemente wie in Abb. 18.23a arbeitet als ein solches Filter, während eine Parallelschaltung von Induktivität und Kapazität einen Sperrkreis darstellt. Wir diskutieren hier den ersten Fall. Das Verhältnis von Ausgangs- zu Eingangsspannung ist
Ua Ue
R 1 · § R i ¨ZL ¸ Z C¹ ©
Ua Ue
;
(18.69) C
Ue
R 1 · § R ¨ZL ¸ C¹ Z © 2
2
L
R
Ua
(18.70) Abb. 18.22a: Die Reihenschaltung von R, Ri und RC bildet ein Durchlass Filter
Für den Fall
Z2
1/ LC
(18.71)
verschwindet der zweite Term und das Spannungsverhältnis wird gleich eins. Wechselstrom mit dieser Frequenz kann das Filter ungeschwächt passieren. Zu größeren und zu kleineren Frequenzen fällt die Ausgangsspannung ab (Abb. 18.23b).
466
18 Zeitlich veränderliche Magnetfelder
Ua Ue
b)
c)
/2 1/ 2
/2 Abb. 18.23: b) Verhältnis der Ausgangsspannung zur Eingangsspannung bei einem Durchgangsfilter c) Phase der Ausgangsspannung
Die Halbwertsbreite der Durchlasskurve ist gegeben durch die Bedingung, dass die Ausgangsspannung auf die Hälfte des Maximalwertes abgefallen ist.
R 1 · § R2 ¨ Z L ZC ¸¹ ©
2
1 . 2
(18.72)
Daraus folgt
Z
3R 3R 2 1 r 2 2 L 4L LC
'Z1/ 2
3R 2 4 . 2 L LC
(18.73)
(18.74)
. Der Phasenwinkel der Ausgangsspannung relativ zur Eingangsspannung als Funktion der Frequenz ist aus Abb. 18.23c zu ersehen.
18 Zeitlich veränderliche Magnetfelder
18.7
467
Der Transformator
Die für technische Anwendungen benötigten Spannungen und Ströme variieren erheblich. Deswegen muss eine Generatorspannung in die jeweilig erforderliche Spannung umgesetzt werden. Das leisten Transformatoren. Sie bestehen aus zwei Spulen (Abb. 18.24), der Primärspule mit N1 Windungen und der Sekundärspule mit N2 Windungen, die sich I1 auf einem gemeinsamen geschlossenen Eisenjoch befinden. Wie bereits erwähnt, ist dieses aus vielen gegeneinander isolierten, dünnen Eisenblechen zusammengesetzt, um Wirbelstromverluste gering zu halten. Auch L1 L2 U1 U2 Ferrit-Kerne (Isolatoren) werden zur Minimierung von Wirbelströmen eingesetzt. Im Folgenden besprechen wir die Eigenschaften des verlustfreien, „idealen“ TransformaI2 tors. Ohmsche Widerstände in den Wicklungen, Verluste im Eisenjoch und Verzögerungen im Aufbau des Magnetfeldes infolge Hysteresis werden vernachlässigt. Abb. 18.24: Aufbau eines Transformators
18.7.1 Der ideale Transformator Wird an die Primärspule eine Wechselspannung U gelegt, so wird durch den in ihr fließenden Strom ein zeitveränderlicher magnetischer Fluss erzeugt. Dieser erzeugt eine Induktionsspannung
U ind ,1
L1
dI1 dt
N1
d )m . dt
(18.75)
Der Strom stellt sich so ein, dass
U1 U ind ,1
0.
(18.76)
Setzen wir voraus, dass der gesamte Fluss auch die Sekundärspule durchsetzt, so entsteht bei offenem Sekundärkreis an ihren Klemmen eine Induktionsspannung
U 2 { U ind ,2
N2
d )m . dt
(18.77)
468
18 Zeitlich veränderliche Magnetfelder
Division von (18.77) durch (18.75) führt zu dem Resultat
U2 U1
N2 . N1
(18.78)
Die Sekundärspannung des unbelasteten, verlustfreien Transformators ist gegenüber der Eingangsspannung (bei gleichem Wicklungssinn der Spulen) um 180° verschoben; ihr Wert beträgt das N2/N1-fache der Eingangsspannung. Die primärseitig vom Trafo aus der Stromquelle entnommene Leistung ist bei Vernachlässigung aller Verluste reine Blindleistung, da Strom und Spannung um 90° phasenverschoben sind. Das ändert sich, wenn der Sekundärkreis über einen Widerstand Z geschlossen wird. Der durch den Verbraucher bestimmte Strom I2 erzeugt jetzt seinerseits einen magnetischen Fluss ) 2 , der sich dem primären Fluss )1 überlagert. Wie wir oben gesehen haben, wird durch die zeitliche Änderung von )1 die Kompensation von U1 gewährleistet. Die zusätzliche Durchflutung N 2 I 2 muss also durch einen zusätzlichen Primärstrom I1c ausgeglichen werden, der gegeben ist durch die Bedingung
N1 I1c
N2 I2 .
(18.79)
Mit der Festsetzung der Vorzeichen nach Abb. 18.24 wird der Primärstrom
I1
I1, Leerl
N2 I2 . N1
(18.80)
Es ist zu beachten, dass I2 gegenüber I1,Leerl nach Maßgabe des komplexen Widerstandes im Sekundärkreis phasenverschoben ist. Im Allgemeinen wird I1 größer sein als I1,Leerl . Die Beziehung lässt sich auf formale Weise auch aus den Transformatorgleichungen finden: Nach der Kirchhoffschen Maschenregel muss in einem geschlossenen Stromkreis die Summe aller eingeprägten Spannungen gleich dem Spannungsabfall am Verbraucher sein. Im Primärkreis treten nur eingeprägte Spannungen auf, nämlich die Spannung der Stromquelle, die Selbstinduktionsspannung L1dI1 / dt und die Gegeninduktionsspannung L12 dI 2 / dt . Im Sekundärkreis finden sich als eingeprägte Spannungen die Selbst- und Gegeninduktionsspannung. Am Verbraucher fällt die Spannung ZI 2 ab. Mit dem Ansatz I ei (Zt M ) ergibt sich nach Umordnung der beiden Induktionsterme
U1 0
iZ ( L1 I1 L12 I 2 ) ZI 2 iZ ( L12 I1 L2 I 2 )
.
(18.81)
18 Zeitlich veränderliche Magnetfelder
469
Aus der ersten Gleichung folgt
I1 da
U1 L 12 I 2 , iZ L1 L1 U1 iZ L1
o I1
I1Leerl ,
I1, Leerl
(18.82)
L12 I 2 , q.e.d . L1
Strom- und Spannungsverhältnis ergeben sich aus den beiden Gleichungen zu
iZ L12 , Z iZ L2
I2 I1
U2 U1
L12 Z . 2 L1 Z iZ ( L12 L1 L2 )
(18.83)
(18.84)
Die Diskussion sei dem Leser überlassen.
18.7.2 Anwendungen Von den zahlreichen Anwendungen erwähnen wir hier nur wenige. Im Allgemeinen befinden sich die Kraftwerke, welche die erforderliche elektrische Energie produzieren, in größerer Entfernung von den Verbrauchern, so dass die Energie diesen über Hochspannungsleitungen zugeführt werden muss. Eine hohe Spannung ist erforderlich, um die Verluste durch Joulesche Wärme gering zu halten. Der auf die übertragene Leistung Pel U I bezogene Leistungsverlust beträgt
'Pel Pel
I 2R UI
R Pel . U2
(18.85)
Bei vorgegebener Leistung nehmen die relativen Verluste mit 1/U 2 ab. Typische Werte für U liegen bei 2 104 V. Die Energieeinsparungen sind enorm, wie wir uns an einem Beispiel klarmachen können. Angenommen, es sollte eine Leistung von 2 kW über eine Leitung von 10 : übertragen werden. Die verfügbare Spannung betrage 230 V. Der relative Leistungsverlust ist
470
18 Zeitlich veränderliche Magnetfelder
'Pel Pel
R Pel U2
10 2000 0,5 , 2002
(18.86)
'Pel Pel
R Pel U2
10 2000 0,5 , 2002
(18.86)
beträgt also 50%. Wird dagegen die Spannung auf 2 104 V hochtransformiert, so verringern sich die relativen Verluste um vier Größenordnungen:
'Pel Pel
R Pel U2
10 2000 0,5 104 . 4 108
(18.87)
Hohe Spannungen sind weiter überall da erforderlich, wo Ladungsträger durch elektrische Schweißdraht
geschmolzenes Metall Werkstücke
U~
U~ leitende Unterlage
Abb. 18.25: Prinzip des elektrischen Schweißapparates
Abb. 18.26: Anordnung zum Schmelzen von Metallen
Felder stark beschleunigt werden müssen, z. B in Bildröhren von Oszilloskopen, Monitoren oder Fernsehern. Hohe Ströme werden zum Punktschweißen oder in Schmelzöfen benötigt. Abb. 18.25 zeigt das Schema eines elektrischen Schweißapparates, Abb. 18.26 das einer Anordnung zum Schmelzen von Metallen.
18 Zeitlich veränderliche Magnetfelder
18.8
471
Wechselstrom-Gleichrichtung
Elektronische Bauelemente müssen mit Gleichstrom betrieben werden. Er wird durch Gleichrichtung des im Allgemeinen verfügbaren Wechselstromes mittels Dioden gewonnen. Die Funktionsweise einer Halbleiter-Diode wurde bereits in Kap. 16.6.2 skizziert. Die einfachste Schaltung nach Abb. 18.27 benutzt eine Diode. Während einer halben Periode lässt
Ue
Ua
Ua
Ue
Ua
Ua t Abb. 18.27: Einweggleichrichtung mit einer Halbleiterdiode; unten: Ausgangsspannung
t Abb. 18.28: Zweiweggleichrichtung
eine Diode den Strom passieren, während der zweiten Halbwelle sperrt sie den Strom. Die Ausgangsspannung bei dieser Einweg-Gleichrichtung ist im unteren Teil gezeigt. Ihre starke Welligkeit kann durch einen parallel zum Ausgang geschalteten Kondensator, der sich während des Spannungsanstieges auflädt, etwas gemindert werden, die Ausgangsspannung ist aber trotzdem für die meisten Zwecke ungeeignet. Nach Verstärkung erzeugt sie in einem Lautsprecher den sog. Netzbrumm. Bessere Eigenschaften weisen Zweiweg-Gleichrichter (Abb 18.28) auf. Sie nutzen beide Halbwellen aus; das verringert die Welligkeit erheblich
Abb. 18.29: Graetz-Brückenschaltung zur Gleichrichtung
Abb. 18.30: Glättung der Welligkeit durch C1 und nachgeschaltetem Tiefpass auch
472
18 Zeitlich veränderliche Magnetfelder
Nachteilig wirkt sich die Halbierung der Spannung durch den Abgriff der Wechselspannung zwischen der Mitte und einem Ende der Sekundärwicklung des Trafos aus. Diesem Missstand lässt sich durch eine Brückenschaltung, der so genannten Grätzschaltung begegnen. Wie Abb. 18.29 zeigt, besteht sie aus vier Dioden. Während die positive Halbwelle an der oberen Klemme des Trafos anliegt, fließt der Strom über D1, Ra, D4 zur unteren Anschlussklemme. Bei umgekehrter Polung gelangt der Strom über D4, Ra, D2 von der unteren zur oberen Klemme. Der Spannungsverlauf entspricht dem bei der Zweiweggleichrichtung mit dem Vorteil, dass die Amplitude jetzt den doppelten Wert aufweist. Wie beim Einweggleichrichter wird die Spannung durch einen Kondensator geglättet. Durch einen nachgeschalteten Tiefpass kann die Welligkeit weiter herabgesetzt werden (Abb. 18.30). Eine noch bessere Glättung lässt sich durch elektronische Stabilisierung erreichen.
18.9 Leistungsanpassung Gegeben sei eine Wechselstromquelle mit der Spannung U und dem Innenwiderstand Z1. An ihren Klemmen liege ein Verbraucher mit dem Widerstand Z2 (Abb. 18.31). Durch den Schaltkreis fließe der Strom I. Welchen Wert muss Z1 bzw. Z2 annehmen, damit der Verbraucher aus der Stromquelle die maximale Leistung erhält? Es sei
Z1
§ 1 · R1 i ¨ Z L1 ¸ , Z2 ZC1 ¹ ©
§ 1 · R2 i ¨ Z L2 ¸. Z C2 ¹ ©
Z1 (18.88)
Z2 Der Effektivwert I eff des Stromes ist
U~
Ie f
Abb. 18.31: Zur Leistungsoptimierung
Ue f f f
Z1 Z 2
.
(18.89)
Die an den Verbraucher abgegebene Wirkleistung ist
Pel
I eff2 R2
I eff
U eff2 Z1 Z 2
2
R2 .
(18.90)
Setzen wir die komplexen Widerstände entsprechend (18.88) ein, so ergibt sich
Pel
U e2 f f R2 1§ 1 1 · °½ ° ( R1 R2 ) ®Z ( L1 L2 ) ¨ ¸¾ Z © C1 C2 ¹ °¿ °¯ 2
2
.
(18.91)
18 Zeitlich veränderliche Magnetfelder
473
Zur Optimierung muss der zweite Term verschwinden, d.h. L2 und C2 ergeben sich aus
§ § 1 · 1 · ¨ Z L2 ¸ ¨ Z L1 ¸ Z C2 ¹ ZC1 ¹ © ©
.
(18.92)
Die Blindwiderstände müssen also entgegengesetzt gleich sein, so dass keine Blindleistung auftritt. Spannung und Strom sind in Phase. Das Maximum bezüglich R2 ergibt sich unter Beachtung dieser Bedingung aus
dPel dt zu
R2
0
(18.93)
R1 .
(18.94)
18.10 Die Grundgleichungen des elektromagnetischen Feldes im Vakuum: Die Maxwell-Gleichungen Die Gln. (15.23/28) und (17.8/11) beschreiben die Eigenschaften stationärer elektromagnetischer Felder. Wir wollen sie jetzt auf zeitveränderliche Felder erweitern. Dazu gehen wir vom Induktionsgesetz aus.
U ind
d )m dt
d G G BdA dt ³A
(18.1)
Bei alleiniger zeitlicher Änderung des Magnetfeldes können wir dafür schreiben
G wB G ³ dA . wt
U ind
(18.95)
Andererseits hatten wir gefunden, dass sich die Spannung aus dem Linienintegral über die elektrische Feldstärke ergibt
U
G G
v³ Edr .
(15.24)
C
Damit können wir (18.87) schreiben als
G G
v³ Edr C
d G G BdA . dt ³A
(18.96)
474
18 Zeitlich veränderliche Magnetfelder
Dabei ist A die Fläche der Leiterschleife und C die sie begrenzende Randkurve (Abb. 18.32). Diese Verknüpfung gilt für beliebige Leiterschleifen, so dass es nahe liegt, sie ganz wegzulassen. Das so verallgemeinerte Induktionsgesetz ist die eine der Grundgleichungen des elektromagnetischen Feldes.
Ein sich zeitlich änderndes Magnetfeld erzeugt ein elektrisches Wirbelfeld.
r A
Abb. 18.32: Ein sich zeitlich änderndes Magnetfeld erzeugt ein elektrisches Wirbelfeld Eine zweite Beziehung ergibt sich durch Erweiterung des Ampereschen Gesetzes
G G
v³ Bdr
P0 I .
(18.97)
C
A2C A1C
I R
C
Abb. 18.33: Zur Einführung des Verschiebungsstromes
Betrachten wir einen geladenen Kondensator, dessen Enden über irgendeine Leitung miteinander verbunden sind (Abb. 18.33). Es gibt nun zwei Möglichkeiten, die Beziehung unter Einschluss des Kondensators anzuwenden. Zunächst konzentrieren wir uns auf die skizzierte Kreisscheibe mit der von C beliebig umrandeten Fläche und sehen, dass Gl. (18.90) erfüllt ist. Der Entladungsstrom ist mit einem Magnetfeld verknüpft, das den Leiter ringförmig umgibt. Nun ersetzen wir die Fläche durch den skizzierten offenen
18 Zeitlich veränderliche Magnetfelder
475
Hohlkörper mit der Oberfläche A2C, dessen Randkurve durch die gleiche Kurve C gebildet wird. Da A2C zwischen den Platten des Kondensators hindurch läuft, umfasst jetzt ein Umlauf über C keinen Strom. Aus (18.97) folgt B = 0. Die beiden Fälle stehen miteinander im Widerspruch. Um ihn aufzulösen, führte J. C. Maxwell (1831-1879) den Verschiebungsstrom ein. Im Plattenkondensator ist eine Ladung Q gespeichert, so dass zwischen den Platten der Fläche A ein elektrisches Feld existiert.
Q H 0 AE .
(15.38)
Dabei ist zu berücksichtigen, dass sich die gesamte Ladung auf der Innenseite der jeweiligen Platte befindet. Fließt im Stromkreis ein (Entladungs-) Strom, so ändert sich die Ladung der G Platten und damit das E - Feld.
dQ dt
H0 A
wE . wt
(18.98)
Dieser zeitlichen Verschiebung von Ladungen von der einen zur anderen Platte wird nun ein Verschiebungsstrom zugeordnet. Berücksichtigen wir auch eine mögliche zeitliche Flächenänderung, so gilt
IV
H0
d G G EdA . dt ³A
(18.99)
Fügen wir den Verschiebungsstrom zu I in (18.97) hinzu, so erhalten wir
G G Bdr v³
P0 I H 0 P0
C
G G
v³ Bdr C
P0 I
d G G EdA , oder dt ³A
1 d G G EdA c 2 dt ³A
(18.100a)
(18.100b)
Dies ist die zweite der Grundgleichungen des elektromagnetischen Feldes.
Leitungsstrom wie Verschiebungsstrom sind von einem ringförmigen Magnetfeld umgeben. G Ist nur E zeitlich veränderlich, so erhalten wir
G G Bdr v³ C
G 1 wE G P0 I 2 ³ dA . c A wt
(18.101)
476
18 Zeitlich veränderliche Magnetfelder
Zu den Grundgleichungen gehören weiter der Gaußsche Satz für das elektrische Feld, (1.18b) und der Gaußsche Satz für das magnetische Feld, (17.11). Die vier Grundgleichungen werden als Maxwell-Gleichungen bezeichnet. Zusammengefasst lauten sie in der Integral- bzw. Differentialform
G wB ; wt G G G 1 wE ; rot B P0 j 2 c wt G 1 di v E U;
d G G BdA dt ³A C G G 1 d G G Bdr P I EdA 0 vC³ c 2 dt ³A G G 1 EdA v³ ³ U dV
G rot E
G G v³ BdA 0
G di v B 0.
G G Edr v³
A
H0 V
(18.102, 103)
H0
A
Die ersten zwei Beziehungen der Differentialform ergeben sich durch Umwandlung von (18.95) und (18.101) in ein Flächenintegral mit Hilfe des Stokesschen Satzes. Der Vergleich mit der rechten Seite der ursprünglichen Gleichung ergibt die gewünschte Differentialform. Die beiden unteren Gleichungen liegen bereits aus vorherigen Kapiteln in dieser Form vor ((15.18c) und (17.11b)). In Abb. 18.34 sind die Gleichungen illustriert. Die Ursache elektrischer Felder sind elektrische Ladungen und sich zeitlich ändernde magnetische Felder. Magnetische Felder entstehen durch elektrische Ströme und sich zeitlich ändernde elektrische Felder.
r dB/dt
r dB/dt
r E
r B
r B
r dB/dt
r B
r E
r B
Abb. 18.34: Erläuterung der Maxwell-Gleichungen. Ein magnetisches Feld B entsteht durch einen elektrischen Strom I und durch ein sich änderndes elektrisches Feld E und umgekehrt ein E-Feld durch ein sich änderndes B-Feld. Ist die Änderung des B-Feldes zeitlich nicht konstant, so entsteht durch das sich dann änderndes E-Feld wiederum ein B-Feld
r E
18 Zeitlich veränderliche Magnetfelder
477
Zu den Maxwell-Gleichungen fügen wir noch den Ausdruck für die Lorentzkraft hinzu:
G F
G G G Q ( E v u B) .
(18.41)
Aus diesen 5 Gleichungen lassen sich alle elektromagnetischen Erscheinungen ableiten.
18.11
Elektromagnetische Schwingungen und Wellen
18.11.1 Elektromagnetische Schwingungen 18.11.1.1 Freie gedämpfte Schwingungen
Ein elektromagnetischer Schwingungskreis besteht aus der Parallelschaltung einer Spule mit der Induktivität L und einem Kondensator der Kapazität C (Abb. 18.35). Verluste vernachlässigen wir vorerst (R = 0). Der Kondensator sei zu Anfang auf die Spannung U aufgeladen. Nach Zuschaltung der Spule beginnt er, sich zu entladen und erzeugt dabei in ihr ein magnetisches Feld. Nach einer Viertelperiode ist die gesamte elektrische Feldenergie als magnetische Feldenergie in der Spule gespeichert. In der zweiten Viertelperiode zerfällt das Feld wieder und der auftretende Induktionsstrom lädt den Kondensator mit umgekehrter Polung auf. In der zweiten Halbperiode wiederholt sich der Vorgang in umgekehrter Richtung
L
C
L
C
Epot Ekin t
Abb. 18.35: Oszillation der elektrischen und magnetischen Energie in einem (verlustfreien) Schwingungskreis bis der ursprüngliche Ladungszustand des Kondensators wieder erreicht ist. Elektrische und magnetische Feldenergie pendeln also wie beim mechanischen Pendel periodisch hin und her.
478
18 Zeitlich veränderliche Magnetfelder
Zur quantitativen Behandlung formulieren wir die Schwingungsgleichung. Dabei wollen wir jetzt auch Verluste berücksichtigen, die etwa durch den Ohmschen Widerstand der Spule auftreten (Abb. 18.36). Der zugehörige Spannungsabfall sei mit UR bezeichnet. Nach der 2. Kirchhoffschen Regel folgt
U ind
(18.104)
Einsetzen der bekannten Ausdrücke für Uind und UC ergibt
L C Abb. 18.36: Parallelschwingungskreis mit Ohmschem Widerstand
R
UC U R ;
L
dI 1 Q IR 0. dt C
(18.105a)
Nochmaliges Differenzieren führt zu der Beziehung
d 2I R dI 1 2 I 0. 2 dt 2 L dt LC
(18.105b)
Vergleichen wir diese Differentialgleichung mit der entsprechenden Gleichung für ein mechanisches Pendel, Gl. (11.7),
d 2x dx 2G Z02 x 0 2 dt dt so erkennen wir, dass sie identisch sind, wenn wir für die Dämpfungskonstante G und die Eigenfrequenz Z0 des ungedämpften Schwingkreises setzen
G
R 2L
und Z0
1 . (Thomsonsche Schwingungsformel) LC
(18.106)
Der Masse entspricht die Induktivität, der Federkonstanten die reziproke Kapazität (Machen Sie sich das plausibel!). Wir können also unter Berücksichtigung von (18.106) alle Ergebnisse von früher übernehmen. Es sind drei Fälle zu unterscheiden:
1. G Z0 2. G ! Z0 3. G
Z0
(18.107)
18 Zeitlich veränderliche Magnetfelder
479
Im ersten Fall beschreibt die Lösung eine gedämpfte Schwingung mit der Frequenz
1 R2 2 : LC 4 L
(18.108)
G § · I 0 e G t ¨ cos Zt sin Zt ¸ . Z © ¹
(18.109)
Z02 G 2
Z
I
Die Amplitude der Schwingung nimmt exponentiell mit der Zeit ab. Nach der Zeit 1/ G ist sie auf den e-ten Teil abgeklungen. Ist G ! Z0 , so ergibt sich der Kriechfall. Für die oben benutzten Anfangsbedingungen wird die Stromstärke
I
I0 O2eO1t O1eO2t , O2 O1
wobei O2 O1
(18.110)
2 G 2 Z02 .
Die Lösung hat höchstens ein Maximum und fällt dann exponentiell ab. Für G Z0 ergibt sich der aperiodische Grenzfall. Er trennt den Schwingungsbereich vom Kriechbereich. Die Stromstärke ist
I
I 0 e G t (1 G t ) .
(18.111)
In Abb. 18.36a,b sind die Lösungen für die drei Fälle dargestellt.
I
T I0 (t) : e
/t
I t
0
0
t Abb. 18.36a: Gedämpfte Schwingung in einem verlustbehafteten Schwingkreis und
Abb. 18.36b: Aperiodischer Grenzfall und Kriechfall
480
18 Zeitlich veränderliche Magnetfelder
18.11.1.2 Erzwungene Schwingungen
R
L
C
~
Generator
Abb. 18.37: Serienschwingungskreis mit Wechselstromgenerator
Der Schwingkreis in Abb. 18.36 werde zwischen Spule und Kondensator aufgetrennt. Zwischen die beiden Enden schalten wir eine Wechselstromquelle mit der Spannung (Abb. 18.37)
Ue
U 0 eiZt .
(18.112)
Der Schwingkreis wird dadurch zu erzwungenen Schwingungen angeregt. Die Schwingungsgleichung folgt jetzt aus
U e U ind Ue d 2I dI 2G Z02 I . 2 dt dt L
UC U R ,
(18.113)
(18.114)
Diese Differentialgleichung stimmt mit der einer mechanischen Schwingung, Gl. (11.27c) überein, wenn wir die rechte Seite ersetzen durch den Quotienten aus äußerer Kraft und Masse des Pendels (bzw. durch den Quotienten aus äußerem Drehmoment und Trägheitsmoment eines Drehpendels).
Abb. 18.38: Stromverlauf in einem Schaltkreis, an den von außen eine frequenzabhängige, sinusförmige Spannung liegt (erzwungene Schwingung) und
Abb. 18.39: Verlauf des Phasenwinkels in Abhängigkeit der Frequenz
18 Zeitlich veränderliche Magnetfelder
481
Sie wird wie dort gelöst durch den Ansatz
I 0 ei (Zt M ) .
I
(18.115)
Die Amplitude I0 und der Phasenwinkel M zwischen äußerer Spannung und Stromstärke im Kreis folgen zu
I0
tan M
U0 / L 2 0
(Z Ze2 ) 2 (2G Ze ) 2
,
(18.116)
2G Ze , Z02 Ze2
(18.117)
wobei Z02 und J durch (18.106) gegeben sind. Die beiden Größen sind als Funktion der Erregerfrequenz Ze in den Abb. 18.38 und 18.39 aufgetragen. Zur näheren Diskussion sei auf Kap. 11 verwiesen.
18.11.1.3 Gekoppelte Schwingungskreise
Ck C1
L1
R1
L2
C2
L
C
C
L
R2
Abb. 18.40: Induktive bzw. kapazitive Kopplung zweier Schwingungskreise Gekoppelte Schwingungskreise haben für die Übertragung und den Empfang elektromagnetischer Signale große Bedeutung. Die Gesetzmäßigkeiten sind die gleichen wie bei der Kopplung mechanischer Schwingungen, die in Kap. 11.5 ausführlich behandelt wurden. Die Kopplung kann z.B. durch gegenseitige Induktion erfolgen. Sie lässt sich aber auch mittels einer Kapazität oder durch einen Ohmschen Widerstand bewerkstelligen. Hier wollen wir uns auf den ersten Fall beschränken (Abb. 18.40; dabei soll am ersten Schwingkreis eine Wechselspannung liegen.
482
18 Zeitlich veränderliche Magnetfelder
Die Kirchhoffschen Regeln ergeben nach einmaligem Differenzieren
L1
d 2 I1 dI 1 R1 1 I1 2 dt dt C1
d 2I dI 1 L2 22 R2 2 I2 dt dt C2
L12
d 2 I 2 dU e dt 2 dt
d 2I L12 21 dt
(18.118)
Zuerst behandeln wir freie Schwingungen, Ue = 0. Den Lösungsansatz
I
I 0 e iZt
(18.118)
differenzieren wir zweimal und setzen die Ableitungen in (18.118) ein. Nach Division durch Z erhalten wir so
1 ½ ) ¾ I1 iZ L12 I 2 ® R1 i (Z L1 ZC1 ¿ ¯ 1 ½ ) ¾ I 2 iZ L12 I1 ® R2 i (Z L2 Z C2 ¿ ¯
0 (18.119)
0
Zur besseren Übersicht spezialisieren wir uns auf den Fall identischer Schwingungskreise, L1 = L2 = L, C1 = C2 = C, R1 = R2 = R. Die Lösungen ergeben sich durch Nullsetzen der Koeffizientendeterminante. Wir erhalten für verlustfreie Kreise
Z1,2
Z0
(18.120)
1r k
Die Resonanzfrequenz Z0 des ungekoppelten Kreises spaltet in zwei Eigenfrequenzen Z1 und Z2 auf. Die Kreise sind „verstimmt“. Wir denken uns jetzt an den Primärkreis eine Wechselspannung gelegt.
Ue
U 0 eiZt
(18.121)
Berücksichtigung dieses Ansatzes in (18.118) liefert jetzt das Gleichungssystem
Z1 I1 iZ L12 I 2
U
Z 2 I 2 iZ L12 I1
0
(18.122)
18 Zeitlich veränderliche Magnetfelder
483
Elimination von I1 ergibt für den Strom I2 im Sekundärkreis
Z 3k / L
I2 Ue
^Z
4
2
2
2 0
2
(k 1) Z (2Z W ) Z
4 2 0
`
(18.123) 2
2
2
2 2 0
4W Z (Z Z )
wobei zur Abkürzung W = R/L und Z02 1/( LC ) gesetzt wurde. Die Größe k L12 / L bezeichnet den Kopplungsgrad der Schwingungskreise. Abb. 18.41 zeigt für ein bestimmtes k den auf die Eingangsspannung bezogenen Stromverlauf als Funktion der Frequenz. Statt eines Maximums bei k = 0 treten jetzt zwei Maxima auf.
1 I2
k2
0, 05
Abb. 18.41: Auf die Eingangsspannung normierte Stromstärke I2 im angekoppelten Schwingkreis
0 1
2
Alle Schaltelemente eines Schwingkreises sind verlustbehaftet, so dass, wie gezeigt, eine Schwingung mit der Zeit abklingt. Zur Erzeugung ungedämpfter Schwingungen muss dem Schwingkreis die in Joulesche Wärme umgewandelte Energie wieder zugeführt werden. Das gelingt mit Hilfe einer Rückkopplungsschaltung nach Abb. 18.42, die den prinzipiellen Aufbau
Ue+kUa _
Ua
Rückkopplungsglied Abb. 18.42: Prinzip der Entdämpfung eines Schwingkreises durch phasenrichtige Rückkopplung eines Teils der verstärkten Spannung auf
_
+
kUa
+
Ue
L _
Verstärker
Abb. 18.43: Meißnersche Rückkopplungsschaltung mit einer Elektronenröhre
C
484
18 Zeitlich veränderliche Magnetfelder
wiedergibt. Wegen der großen Bedeutung für die drahtlose Telekommunikation ist in Abb. 18.43 die zuerst von A. Meißner (1883-1958) realisierte Schaltung mit einer Elektronenröhre gezeigt. Als eine solche verwendete Meißner eine Triode. Sie besteht aus einer Kathode, welche im erhitzten Zustand Elektronen freisetzt, einem die Kathode umgebenden Gitter und der Anode. Liegt zwischen dieser und Kathode eine Spannung, so fließt durch die Röhre ein Elektronenstrom, der sog. Anodenstrom. Er kann durch Anlegung einer (negativen) Spannung an das Gitter gesteuert werden. Der Anoden-Stromkreis enthalte nun einen Schwingkreis, der mit einer zweiten Spule induktiv gekoppelt ist. Diese liegt zwischen Gitter und Kathode. Beim Einschalten der Anodenspannung entsteht eine Schwingung, die durch Induktion auf die zweite Spule übertragen wird. Die oszillierende Gitterspannung steuert bei richtiger Polung den Anodenstrom so, dass dieser verstärkt wird. Bei geeigneter Kopplungsstärke können also durch Rückkopplung eines geringen Teils der Schwingungsenergie Verluste im äußeren Schwingkreis ausgeglichen werden, so dass ungedämpfte Schwingungen entstehen. In modernen Schaltungen ist die Elektronenröhre durch einen Halbleiter ersetzt und zur Rückkopplung werden RC-Glieder verwandt. Mit den geschilderten Methoden können durch Reduktion von Induktivitäten und Kapazitäten Schwingungen bis zu ca. 1010 Hz erzeugt werden. Dieser Grenzwert ist durch die endliche Laufzeit der Elektronen in Röhren und Transistoren bedingt, die größer als die Schwingungsdauer wird. Noch höhere Frequenzen lassen sich mit dem Klystron erreichen, bei dem Laufzeiteffekte gerade dazu ausgenutzt werden, um eine Modulation des Elektronenstroms zu erzielen. Recht einfach lässt sich die Wirkungsweise eines Zweikammer-Klystrons verstehen (Abb. 18.44). Elektronen, die in den ersten Hohlraumresonator eintreten, werden durch das anliegende oszillierende elektrische Feld abwechselnd beschleunigt und HF-Generator abgebremst. Aus der GeschwindigAnode keitsmodulation wird nach einer beKathode stimmten Flugstrecke eine DichteModulation. Die Elektronenpakete gelangen anschließend in einen zweiten Resonator, der sich an einem Ort maximaler Elektronendichte befindet. Die periodische zeitliche Änderung der Rückkopplung Ladungsdichte im Resonator erzeugt + eine elektromagnetische Schwingung _ in diesem. Durch phasenrichtige RückAbb. 18.44: Prinzip des Zweikammerklystrons kopplung der Schwinungsenergie in den ersten Schwingungskreis wird die Dichte-Modulation verstärkt, so dass eine stabile ungedämpfte Schwingung entsteht. Da die Elektronenpakete zunächst annähernd eine Rechteckform haben und damit neben der Grundschwingung viele Oberschwingungen aufweisen, kann der zweite Resonator auch auf ein Vielfaches der Frequenz des ersten Generators abgestimmt werden.
18 Zeitlich veränderliche Magnetfelder
485
Neben diesem Typ gibt es das Reflexklystron, das nur einen Resonator besitzt. Wie der Name besagt, befindet sich hinter diesem ein elektrischer Spiegel, an dem der modulierte Elektronenstrahl reflektiert wird, so dass er erneut den Resonator durchläuft. Damit ist die Rückkopplung (bei geeigneter Einstellung des Spiegels) automatisch gewährleistet.
18.11.2 Elektromagnetische Wellen Elektromagnetische Schwingungen stellen zeitliche Oszillationen elektrischer und magnetischer Feldenergie dar. Wir wollen jetzt fragen, unter welchen Umständen elektromagnetische Wellen entstehen und welche Eigenschaften sie haben. Elektromagnetische Wellen können sich in den freien Raum oder längs elektrischer Leitungen ausbreiten. Betrachten wir zunächst den ersten Fall. Ausgangspunkt ist der uns bekannte geschlossene Schwingkreis. Sukzessive denken wir uns die Kapazität des Kondensators durch Auseinanderziehen der Platten verkleinert (Abb. 18.45).
E(t) E (t)
C
B(t) L
Abb. 18.45: Übergang von einem geschlossenen zu einem offenen Schwingungskreis bis hin zu einer Antenne. Während die elektromagnetische Energie in ersterem gespeichert ist, kann sie von einer Antenne abgestrahlt werden. Außerdem reduzieren wir die Induktivität der Spule, indem wir ihre Windungszahl verringern. Diesen Prozess wiederholen wir, bis Spule und Kondensator ganz verschwunden sind und wir nur noch einen geraden leitenden Draht vor uns haben, der Hertzscher Dipol (H Hertz 18571894), genannt wird. Im Ausgangszustand sind elektrisches und magnetisches Feld im Schwingkreis lokalisiert. Je mehr wir den Kreis aufbiegen, umso weiter reichen die zeitveränderlichen Felder in den Raum hinaus. Nun ist es nicht möglich, dass sich das elektromagnetische Feld während einer
486
18 Zeitlich veränderliche Magnetfelder
Viertelperiode der Schwingung des Dipols beliebig weit ausdehnt, verschwindet und mit umgekehrtem Vorzeichen wieder zurückkehrt. Vielmehr löst sich das elektrische Feld vom Dipol ab und wandert als Wirbel mit Lichtgeschwindigkeit in den Raum hinaus. Nach den Maxwell-Gleichungen erzeugt es ein geschlossenes magnetisches Feld. Dieses hat wieder ein elektrisches Wirbelfeld zur Folge usw. Es entsteht eine elektromagnetische Welle. Die quantitative Berechnung zeigt, dass zwischen dem Nahfeld (Abstand r < Wellenlänge O ) und dem Fernfeld ( r ! O ) des Dipols zu unterscheiden ist. Am wichtigsten ist hier der zweite Fall. Wie wir gleich sehen werden, breitet sich in größerer Entfernung das elektromagnetische Feld in guter Näherung als ebene Welle aus. Zur Vorbereitung zeigen wir zunächst, dass solche Wellen die Maxwell-Gleichungen befriedigen.
18.11.2.1 Wellengleichung und ebene Wellen als deren Lösung
Elektromagnetische Wellen folgen wie mechanische Wellen aus einer Wellengleichung. In diesem Fall haben wir von den Maxwell-Gleichungen auszugehen. Wir beschränken uns zunächst auf die Herleitung der Wellengleichung für das Vakuum. Fehlen Raumladungen und Leitungsströme, so lauten die Maxwell-Gleichungen
G wB ; wt G 1 wE ; c 2 wt
G rot E G rot B
G di v E
0;
G di v B 0.
(18.124)
Durch Anwendung der Rotor-Operation auf die erste Gleichung folgt
G rotrotE
G 'E
G G grad di vE 2 E
G wB rot ; wt
G wB rot . wt
(18.125)
(18.126)
Zeitliche Differentiation der zweiten Gleichung ergibt
G wB rot wt
G w2 E H 0 P0 2 . wt
(18.127)
Durch Einsetzen dieser Gleichung in (18.126) folgt
G G w2 E 'E H 0 P0 2 . wt
(18.128)
18 Zeitlich veränderliche Magnetfelder
487
G G Eine analoge Gleichung erhalten wir durch Eliminierung von E für B . Wir bilden
G rotrotB
G G G wE 2 grad di vB B H 0 P0 rot . wt
(18.129)
Durch Differentiation der ersten Gleichung nach der Zeit folgt
G w rotE wt
G wE rot wt
G w2 B 2 . wt
(18.130)
In (18.129) eingesetzt ergibt sich
G G w2B 'B H 0 P0 2 . wt
(18.131)
Die Gln. (18.128) und (18.131) sind die Wellengleichungen für das elektrische und magnetische Feld. Der Vorfaktor auf der rechten Seite hat die Dimension einer reziproken quadratischen Geschwindigkeit, nämlich der Phasengeschwindigkeit der Welle:
v 2ph
c2
1
H 0 P0
.
(18.132)
Diesen Zusammenhang haben wir in Kap. 17.1 vorausgesetzt. Er folgt jetzt automatisch aus den Maxwell-Gleichungen. Zusammengefasst lauten also die Wellengleichungen
G 'E
G 1 w2 E c 2 wt 2
und
G 'B
G 1 w2 B . c 2 wt 2
(18.133)
Die Lösungen dieser Differentialgleichungen sind transversale Wellen. Wellen in Fortschreitungsrichtung würden Quellen und Senken der Felder erfordern (Abb. 18.46). Sofern sich die Wellen im ladungsfreien Raum aus- Abb. 18.46: Im ladungsfreien Raum existieren G breiten, gilt aber di v E 0 . Magnetische keine longitudinalen elektromagnetischen WeFelder sind per se quellenfrei. Durch llen Einsetzen können wir verifizieren, dass u. a. ebene harmonische Wellen Lösungen der Wellengleichungen sind.
488
18 Zeitlich veränderliche Magnetfelder
Wählen wir z. B. als Fortpflanzungsrichtung die x-Richtung, so können wir E y bzw. Ez schreiben als
E0, y ei (Zt kx ) ;
Ey
Ez
E0, z ei (Zt kx G ) .
(18.134)
E y und Ez sind voneinander unabhängig; der Phasenwinkel kann daher frei gewählt werden.
Im allgemeinsten Fall entsteht eine elliptisch polarisierte Welle. Wir interessieren uns hier für eine linear polarisierte Welle, bei der G 0 ist. Um die zugehörigen Komponenten Bz bzw. By des magnetischen Feldes zu gewinnen, dürfen wir nun nicht von der Wellengleichung G G ausgehen, denn dann blieben relative Amplitude und Phasenverschiebung von E - und B G G Welle unbestimmt. Wir müssen vielmehr beachten, dass E und B durch die MaxwellGleichungen verknüpft sind. Für Ex = 0 folgt aus der zweiten Gleichung
wBy
0;
wt
1 wBz c wt
wE y
H 0 P0
wx
c
iZ E0, y ei (Zt kx ) ;
(18.135a)
Integration ergibt
By
0;
Bz
G B
1 G G (k u E ) .
H0 E0, y ei (Zt kx ) P0
H0 E . P0 y
(18.135b)
(18.136)
Z
Elektrische und magnetische Feldstärke einer ebenen elektromagnetischen Welle stehen also senkrecht aufeinander und sind in Phase (Abb. 18.47).
x
r E (E x ,0,0)
r B(0,B y ,0)
z y
Abb. 18.47: Elektrische und magnetische Feldstärke stehen senkrecht aufeinander und sind in Phase
18 Zeitlich veränderliche Magnetfelder
489
18.11.2.2 Das elektromagnetische Feld des Hertzschen Dipols Wir kehren nun zum Ausgangspunkt unserer Überlegungen zurück und wollen uns klarmachen, wie das Wellenfeld des Hertzschen Dipols zustande kommt und welche Form es hat. Wir beschränken uns dabei auf die Ausbreitung im Vakuum. Grundlage sind also die Maxwell-Gleichungen (18.102/103). Das Wellenfeld wird als Kugelwelle angesetzt. Hier sollen nur die wichtigsten Ergebnisse zusammengestellt und erläutert werden. Die nicht schwierige, aber etwas längliche Berechnung findet sich im Anhang. Sowohl das elektrische als auch das magnetische Feld besteht aus zwei Anteilen, deren Amplituden mit unterschiedlichen Potenzen von r mit der Entfernung abnehmen. Sie werden häufig als Nahfeld (r O ) und Fernfeld (r !! O ) bezeichnet. Das elektrische Feld setzt sich wie folgt zusammen
G G E (r , t ) Nah G
wobei p G p
G G 3( p rˆ)rˆ p 4SH 0 r 3
(r O ) ,
G G § r · wp (t r / c) . p (t r / c ) ¨ ¸ wt ©c¹
(18.137)
(18.138)
G Qd ist das elektrische Dipolmoment. Die Phasenverschiebung berücksichtigt, dass das
Feld zur Zeit t vom Dipol zur Zeit (t r / c) erzeugt wurde (Retardierung).
G G E (r , t ) Fern
2G 1 °§ w p(t r / c) G · G °½ ur ¸u r ¾ ® ¨ 4SH 0 c 2 r 3 ¯°© wt 2 ¹ ¿°
(r !! O ) .
(18.139)
Die Anteile des magnetischen Feldes sind
G G B(r , t ) Nah
G 1 § wp G · ¨ ur ¸ 4SH 0 c 2 r 3 © wt ¹
G G B(r , t ) Fern
G § w2 p G · 1 ur ¸ ¨ 4SH 0 c 3 r 2 © wt 2 ¹
(r O ) ,
(18.140)
und
(r !! O ) .
(18.141)
Wir diskutieren zuerst die beiden Nahfelder. Die Amplitude des elektrischen Feldes fällt mit 1/r3 ab, die des magnetischen mit 1/r2. Der zweite Term des elektrischen Feldes muss aus Gründen der Allgemeinheit mitgenommen werden. Interessiert nur das eigentliche Nahfeld, so kann es vernachlässigt werden. Dann ist auch die Retardierung zu vernachlässigen, so dass das Feld eines schwingenden Dipols (des Hertzschen Oszillators) übrig bleibt. Vergleichen wir das
490
18 Zeitlich veränderliche Magnetfelder
magnetische Nahfeld mit dem durch das Biot-Savartsche Gesetz gegebenen Magnetfeld eines stromführenden Leiters
G B
G G ds u r , 4SH 0 c 2 ³ r 3
I
G so erkennen wir, dass mit wp / wt
(17.26) G
³ Ids die Felder übereinstimmen. Das magnetische Nahfeld
ist also identisch mit dem Feld, das von der oszillierenden Stromstärke erzeugt wird. Wie G G bereits aus (18.137) und (18.140) hervorgeht, stehen BNah und ENah senkrecht aufeinander und haben eine Phasenverschiebung von S / 2 . Wir wenden uns jetzt den Feldern in großer Entfernung vom schwingenden Dipol zu. Der elektrische Feldvektor schwingt als Folge des doppelten Vektorproduktes in der Meridianebene G senkrecht zu r (Abb. 18.48). Die Feldamplitude nimmt mit 1/r ab. Das gilt auch für das G magnetische Feld. Der Betrag des elektrischen Feldes in einem Punkt r , der mit der Dipolachse den Winkel - bildet, schreibt sich
G E ( r ,- , t ) Fern
G sin - w 2 p(t r / c) . 4SH 0 c 2 r wt 2
(18.142)
G Wegen der Proportionalität zu sin - nimmt E bei kleinen - so kleine Werte an, dass der Nahfeld-Anteil, der nicht von - abhängt, nicht vernachlässigt werden darf. Er führt zu den Abrundungen der Feldlinien in diesem Bereich. Abb. 18.48 zeigt Momentaufnahmen der elektrischen Feldlinien im Verlauf einer Periode. Der magnetische Feldvektor schwingt wegen des Vektorproduktes senkrecht zur Dipolachse G G und senkrecht zu r (Abb. 18.49) und damit auch senkrecht zu E . G G G Die drei Vektorgrößen E , B, c bilden ein Rechtssystem. Die Entstehung des elektromagnetischen Feldes in der Fernzone hatten wir bereits zu Anfang des Kapitels angesprochen. Zum Abschluss der theoretischen Erörterungen wiederholen wir die Argumentation: Ein Beobachter an einem bestimmten Raumpunkt des Strahlungsfeldes messe z. B. ein sich zeitlich änderndes elektrisches Feld. Dieses erzeugt nach Maxwell ein zeitveränderliches sekundäres magnetisches Wirbelfeld, das wiederum ein sich zeitlich änderndes sekundäres elektrisches Wirbelfeld erzeugt usw.
18 Zeitlich veränderliche Magnetfelder
491
t=0
t = T/4
t = T/2
t = 3/4 T
t=T Abb. 18.48: Der elektrische Feldvektor schwingt in der Meridianebene senkrecht zum Ortsvektor der Welle (nach L.25.1)
r B(t 0 ) Abb. 18.49: Der magnetische Feldvektor schwingt senkrecht zur Dipolachse und zum Ortsvektor
492
18 Zeitlich veränderliche Magnetfelder
18.11.2.3 Energie und Leistung einer elektromagnetischen Welle Der Energieinhalt einer elektromagnetischen Welle setzt sich additiv aus einem elektrischen und einem magnetischen Anteil zusammen. Für die Energiedichte hatten wir früher gefunden ((15.53) und (18.31))
w
1 1 2 H0E2 B 2 2 P0
1 H 0 E 2 c2 B2 H 0 E 2 . 2
(18.143a)
Damit ergibt sich die pro Zeiteinheit durch eine Fläche senkrecht hindurch tretende Energie, die Energiestromdichte S w c zu
S
H 0 cE 2
G G
H 0 c2 E B .
(18.143b)
Die Abstrahlung der Energie erfolgt in der durch die elektromagnetische Welle festgelegten Richtung. (18.143b) legt daher nahe, dass die Energiestromdichte als Vektorgröße, Poyntingvektor genannt (J. H. Poynting 1852-1914) in der Form
G S
1
P0
G
G
E u B
(18.144)
G geschrieben werden kann (Anhang A.1.1.4.3). Benutzen wir für E das Fernfeld und setzen p Qd 0 sin(Zt kr ) , so erhalten wir
S
Q 2 d 02Z 4 sin 2 - sin 2 Zt kr ) . 16S 2H 0 c 3 r 2
(18.145)
Die stärkste Energieabstrahlung findet senkrecht zur Dipolachse statt. In Richtung der Dipolachse wird dagegen keine Energie abgestrahlt. Durch das Flächenelement einer Kugel mit Zentrum im Dipol-Nullpunkt, dA r 2 sin - d- dM , strömt die Leistung P S dA . Durch Integration ergibt sich die insgesamt in den Raum abgestrahlte Leistung zu
Ptotal
G G S v³ dA
Q 2 d 02Z 4 sin 2 Zt kr ) ; 3 6S H 0 c
(18.146)
Im zeitlichen Mittel wird die Leistung
Ptotal
Q 2 d 02Z 4 12S H 0 c 3
(18.147)
18 Zeitlich veränderliche Magnetfelder
493
abgegebent. Diese Energie wird dem schwingenden Dipol entzogen. Wird sie ihm nicht wieder zugeführt, so nimmt seine Schwingungsamplitude ab. Das entspricht einer Dämpfung des Oszillators. Sie wird als Strahlungsdämpfung bezeichnet. Die Energie sollte also exponentiell mit der Zeit abnehmen. Wir wollen das nachrechnen. Dazu erinnern wir uns daran, dass der Masse m eines mechanischen Federpendels die Ladung Q entspricht. Es vollführe (ungedämpfte) harmonische Schwingungen mit der Amplitude d0 und der Frequenz Z . Die mittlere Schwingungsenergie beträgt
W
E pot Ekin
1 mZ 2 d 02 . 2
(18.148)
Dies gilt für jeden Oszillator. Die relative Energieabnahme des Hertzschen Oszillators ergibt sich also zu
dW / dt W dW
³W
Q 2Z 2 : J . 6SH 0 mc 3
(18.149a)
J ³ dt ,
(18.149b)
W (t ) W0 e J t .
(18.149c)
Die mittlere Energie des Hertzschen Dipols nimmt wie vermutet exponentiell mit der Zeit ab. Zum Abschluss dieses Kapitels wollen wir uns noch überlegen, welches Frequenzspektrum der Hertzsche Oszillator bei Variation der Hochfrequenz des ihn treibenden Generators aussendet. Die pro Zeiteinheit abgestrahlte Energie ist nach (18.147) proportional zum Amplitudenquadrat des elektrischen Dipolmomentes. Dessen Betrag als Funktion der Erregerfrequenz müssen wir also ermitteln. Die Bewegungsgleichung der Elektronen in einem äußeren elektrischen Feld lautet
d2x dx Q 2J Z02 x Ex . 2 dt dt mel
Ex
E0eiZet .
(18.150)
Sie entspricht der eines mechanischen Oszillators mit äußerer Kraft. Die Lösung lässt sich also auf unseren Fall übertragen. Die Amplitude x0 der Auslenkung bzw. die des Dipolmomentes ist gegeben durch
2 0
p
Q 2 0
2
/ m 2 E02
2 2 e
(Z Z ) (2J Ze )
2
; p 2 e 2J t .
(18.151)
Da die Energie nach (18.149b) exponentiell mit J abfällt, muss 2J durch J ersetzt werden.
494
18 Zeitlich veränderliche Magnetfelder
Einsetzen von p02 Q 2 x02 { Q 2 d 02 in (18.147) ergibt das Frequenzspektrum der abgestrahlten Leistung (Abb. 18.50)
Ptotal P
Q 4 E04 Ze4 . 12S H 0 m 2 c3 (Z02 Ze2 ) 2 (J Ze ) 2 (18.152)
Z02 J 2 maximal Die Halbwertsbreite der Verteilung ergibt sich aus der Bedingung, dass der zweite Faktor auf die Hälfte seines Maximalwertes bei Ze abgefallen ist. Setzen wir näherungsweise J Ze | J Z0 , so folgt Die Leistung wird bei Ze
e
/
0
Abb. 18.50: Frequenzspektrum der vom Dipol abgestrahlten Leistung auch
Ze
J
r 2
J2 4
Z02
o ('Ze )1/ 2
J.
(18.153/154)
18.11.2.4 Erzeugung und Nachweis elektromagnetischer Wellen
In Kap. 18.11.1.4 wurde besprochen, wie durch Rückkopplung von Energie ungedämpfte Schwingungen erzeugt werden können. Koppeln wir einen Hertzschen Dipol geeigneter Länge z. B. kapazitiv an den primären Schwingungskreis an, so haben wir UB damit einen Sender geschaffen R1 (Abb. 18.51). Wir wollen nun einige Antenne Experimente durchführen. Zuerst untersuchen wir Spannungs- und StromLC verteilung beim Hertzschen Oszillator. Ohmsche Verluste können wir dabei vernachlässigen. An den Enden des C k K Dipols muss die Stromstärke stets null Ua C2 R2 sein. Das ist nur dadurch zu realisieren, B dass die Stromverteilung die Form einer stehenden Welle hat. Bei jedem Oszillator erreicht die potentielle EnerAbb. 18.51: Durch Ankopplung einer Antenne gie ein Maximum, wenn die kinetische an den Schwingungskreis eines rückgekoppelten Energie null ist. Strom und Spannung Verstärkers entsteht ein Sender haben daher eine Phasenverschiebung
18 Zeitlich veränderliche Magnetfelder
495
von 90°. Die Spannung im Dipol ist ebenfalls durch eine stehende Welle darstellbar. An den Enden des Dipols befinden sich Spannungsbäuche, in der Mitte liegt ein Knoten. Außer diesen Grundschwingungen gibt es (wie etwa bei einer schwingenden Saite) mit geringerer Amplitude Oberschwingungen. Der Spannungsverlauf der Grundschwingung kann mittels einer Glimmlampe und der Stromverlauf mit Hilfe eines kleinen Drahtbügels mit dazwischen geschaltetem Glühlämpchen nachgewiesen werden (Abb. 18.52). Wir erhalten den unten dargestellten Verlauf.
kˆ 0
U (x,t 0 ) I (x,t 0 ) Abb. 18.52: Demonstration des Spannungsund Stromverlaufs eines Sendedipols mit einer Glimmlampe bzw. einer Glühbirne und
Sendedipol
Empfängerdipol
Abb. 18.53: Überprüfung der Polarisation und der Abstrahlcharakteristik der Welle
Jetzt wollen wir die abgeleiteten Eigenschaften der ausgesandten elektromagnetischen Welle überprüfen. Als Sonde dient ein identischer Dipol. Er sei in der Mitte aufgeschnitten, die Enden sind über ein Glühlämpchen oder einen Gleichrichter mit Galvanometer überbrückt (Abb. 18.53). Wir stellen ihn parallel zum Sendedipol und senkrecht zur Wellennormale auf. (a). Das Lämpchen brennt, denn durch die elektrische Komponente der Welle entsteht durch Influenz zwischen den Enden des Dipols eine Spannung. Außerdem wird der Dipol von den sich zeitlich ändernden magnetischen Feldlinien optimal durchsetzt. Wir drehen nun den Dipol in einer Ebene senkrecht zur Ausbreitungsrichtung der Welle. Weist seine Achse senkrecht zum Sendedipol, so erlischt das Birnchen. Das zeigt, dass die Welle wirklich linear polarisiert ist. Im nächsten Versuch (b) untersuchen wir die Winkelabhängigkeit der Strahlungsintensität in der Meridianebene. In Übereinstimmung mit dem theoretischen Befund wird die Stromstärke maximal für - 90q und null für - 0q,180q . – Zum Schluss messen wir noch die Wellenlänge der sich ausbreitenden Welle. Wir könnten sie aus der Länge des Sendedipols ermitteln, wenn wir annehmen, dass die Ausbreitungsgeschwindigkeit vph der Welle auf dem Metallstab gleich der Lichtgeschwindigkeit cVak im Vakuum ist. Zur Überprüfung erzeugen wir durch Reflexion an einem Metallschirm eine stehende Welle. Diese lässt sich mit dem SondenDipol abfahren. Bei richtiger Justierung des Schirms leuchtet das Birnchen im Abstand einer halben Wellenlänge periodisch auf. Am Metallschirm befindet sich ein Knoten der elektrischen Feldstärke. Anderenfalls würde sofort ein Ladungsausgleich stattfinden.
496
18 Zeitlich veränderliche Magnetfelder
Wir können auch die Stellung des Dipols fixieren und den Spiegel langsam verschieben. Die ermittelte halbe Wellenlänge entspricht der Länge des Sendedipols. Es gilt also vph = cVak. Das ist damit zu erklären, dass sich das elektromagnetische Feld des Stabes hauptsächlich im Raum außerhalb des Stabes befindet.
18.11.2.5 Röntgenbremsstrahlung und Synchrotronstrahlung
Die periodische Beschleunigung von Elektronen in einem Hertzschen Dipol führt zur Abstrahlung elektromagnetischer Wellen. Aber auch eine nichtperiodische Beschleunigung ist mit der Aussendung elektromagnetischer Strahlung verbunden. Beispiele sind die Röntgenbremsstrahlung. (Abb. 18.54) ( Röntgen, W. K. 1845-1923) und die Synchrotronstrahlung. Zur Erzeugung a)
b)
Anode
- Kathode
e- , E 0
Ze +
+ e- , E < E 0
Abb. 18.54: a) Ablenkung eines Elektrons im Feld des positiv geladenen Kerns; b) Röntgenröhre ersterer werden Elektronen aus einer Kathode durch eine Spannung von ca. 50 kV beschleunigt und im elektrischen Feld der Atomkerne der Anode (Cu, W) abgebremst. Dabei entsteht ein kontinuierliches Spektrum, das als Bremsstrahlung bezeichnet wird. Es erstreckt sich typischerweise über den Wellenlängenbereich von ca. 2-15 nm. Eine Beschleunigung liegt aber auch vor, wenn freie Elektronen mit konstanter Geschwindigkeit auf einer gekrümmten Bahn umlaufen wie z.B. in einem Elektronen-Synchrotron. In ihm durchlaufen die Elektronen eine Kreisbahn, die durch ein ringförmiges Magnetfeld erzeugt wird. Die Beschleunigung der Elektronen erfolgt an einer oder mehreren Stellen der Kreisbahn durch ein hochfrequentes elektrisches Feld. Magnetfeld und Beschleunigungsspannung müssen sorgfältig aufeinander abgestimmt sein. Nach diesem Prinzip können Elektronenpulse erzeugt werden, deren Geschwindigkeit sehr nahe an der Lichtgeschwindigkeit liegt. Auf Grund ein kontinuierliches Spektrum, das als Bremsstrahlung bezeichnet wird. Es erstreckt sich typischerweise über den Wellenlängenbereich von ca. 2-15 nm. Magnetfeld und Beschleunigungsspannung müssen sorgfältig aufeinander abgestimmt sein. Nach diesem Prinzip können Elektronenpulse erzeugt werden, deren Geschwindigkeit sehr nahe an der Lichtgeschwindigkeit liegt. Auf Grund relativistischer Effekte ist die Strahlung auf einen sehr engen Bereich in Richtung der Bahntangente beschränkt.
18 Zeitlich veränderliche Magnetfelder
497
Der Öffnungswinkel in der Bahnebene ergibt sich (ohne Beweis) zu
2D | 2m0c2/EElektr..
(18.155)
Ein weiterer Vorteil liegt darin, dass die Strahlung vollständig polarisiert ist. In der Bahnebene liegt lineare Polarisation vor, außerhalb ist sie elliptisch polarisiert. Die mittlere Frequenz bzw. Wellenlänge für eine gegebene Elektronenenergie lässt sich aus der Dauer 't eines den Beobachter erreichenden Pulses zu Z | 1/'t abschätzen. Wir berechnen 't. Während ein Lichtkegel den Ort des Beobachters überstreicht, legt es den Kreisbogen 2Dr zurück. Die dazu benötigte Zeit ist t1 = 2rD/c. Das vom Punkt P1 den Beobachter erreichende Licht muss um die Strecke 's = 2rsinD weiter laufen als das von P2 kommende Licht. Die zugehörige Zeit ist t2 = 's/c. Die Pulsdauer beträgt also für den Beobachter
't
t1 t2
2r rD 3 (D sin D ) | c 3c
(18.156a)
Das entspricht nach dem Fouriertheorem einer mittleren Frequenz von
Z|
3c . rD 3
(18.156b)
Die Strahlungsleistung kann weiter erhöht werden, geschickt werden. Dieser besteht aus einer Reihe alternierenden Polen, in dem sie eine wellige Bahn durchlaufen. Abb. 18.55 zeigt die spektrale Verteilung im Hamburger Speicherring DORIS für verschiedene Elektronenenergien (L18.1,2).
wenn die Elektronen durch einen Wiggler hintereinander angeordneter Magnete mit
W/nm 10
Abb. 18.55: Spektrale Strahlungsleistung durch den Speicherring DORIS in Hamburg für einige Elektronenenergien (aus dem Internet nachgezeichnet)
Strahlungsleistung
1
10
1
10
2
10
3
10
4
10
5
6 GeV
4 GeV
2 GeV
10
1 GeV
6
10
3
10 2 10 1 0 1 Wellenlänge (nm)
102
498
18 Zeitlich veränderliche Magnetfelder
18.11.2.6 Experimentelle Bestimmung der Lichtgeschwindigkeit
Elektromagnetische Wellen erstrecken sich über einen Frequenzbereich von mehr als 20 Größenordnungen (Abb. 18.56).
Frequenz/s-1 10
24
10
22
10
20
10
18
10
16
10
14
10
12
8
106 10
-Strahlung
4
102
10
-14
10-12 Röntgenstrahlung UV-Strahlung
10
-10
10-8 10-6
Infrarotstrahlung
1010 10
Wellenlänge/m 10-16
Mikrowellen Kurze Radiowellen TV u.FM-Radio AM-Mittelund Langwellen
10-4 10
-2
1 10
2
10
4
10
6
Abb. 18.56: Das Spektrum der elektromagnetischen Wellen (schematisch) gut
Das Spektrum des sichtbaren Lichtes bildet also nur einen winzigen Ausschnitt. Bis um ca. 1800 war es allein bekannt. Eine wesentliche Erweiterung des Spektrums gelang erst mit der Entdeckung der Hertzschen Wellen 1888. Zu diesem Zeitpunkt war die eigentliche Lichtgeschwindigkeit durch die Arbeiten dreier Forscher bereits mit zunehmender Genauigkeit bestimmt worden. So ist es nicht verwunderlich, dass für die Geschwindigkeit aller elektromagnetischen Wellen wegen ihrer Wesensgleichheit der Name „Lichtgeschwindigkeit“ beibehalten wurde. Als Erster bestimmte O. Römer (1640-1710) die Lichtgeschwindigkeit auf der Basis astronomischer Beobachtungen. Er erhielt bereits die richtige Größenordnung. 1840 gelang es A. H. Fizeau (1819-1896) als Erstem, die Lichtgeschwindigkeit mit Hilfe eines experimentellen Aufbaus (Abb. 18.57) zu ermitteln. Er benutzte eine Laufzeitmessung, auch als ZahnradMethode bekannt. Licht gelangt von einer Quelle auf einen halbdurchlässigen Spiegel und
18 Zeitlich veränderliche Magnetfelder
499
anschließend auf ein rotierendes Zahnrad. Ein von diesem durchgelassener Lichtpuls fällt auf einen Spiegel, von dem er in sich selbst reflektiert wird. Bei passender Umdrehungsgeschwindigkeit des Zahnrades kann er dieses passieren Sind Q die Frequenz des Rades und n die Anzahl der Lücken, so beträgt die Zeit, während sich das Rad um eine Zahnlücke Lichtquelle weiter gedreht hat,
t 1/ nQ .
(18.157)
Der Lichtpuls muss nach Reflexion durch die nächste Zahnlücke treten kann, muss dessen Laufzeit währendes Weges 2s mit dieser Zeit übereinstimmen.
t
2s c
o c
2 snQ
Zahnrad
(18.158)
Abb. 18.57: Bestimmung der Lichtgeschwindigkeit mit Hilfe eines rotierenden Zahnrades (Fizeau, 1840)
Bei Steigerung der Frequenz kann das Licht das Zahnrad dann passieren, wenn die Frequenz Vielfache der kleinstmöglichen Frequenz erreicht. In der Fizeauschen Anordnung betrug der Lichtweg 8.633 km. Die „krumme“ Zahl ergab sich als die Entfernung zweier Berggipfel. L. Foucault (1850) konnte den Lichtweg durch Einsatz eines Drehspiegels auf wenige Meter verkürzen (Abb. 18.58). Ein Lichtbündel gelangt von der Quelle Q auf besagten Drehspiegel SD (Frequenz Z ) und wird von diesem unter 90° auf einen Hohlspiegel SH reflektiert. Das zurücklaufende Lichtbündel trifft den Drehspiegel in einer verdrehten Lage an und weicht daher von der Einfallsrichtung um einen Winkel 2D ab. Werden die Abstände
Q PS D , PS D PS H
Q PE (18.161)
mit s1, s2 und 's bezeichnet, so schreibt sich die Zeit zum Durchlaufen der Strecke zwischen Drehund Hohlspiegel als (18.161) folgt durch Elimination von D aus den beiden letzten Ausdrücken für die Lichtgeschwindigkeit
c
4 s1s2Z . 's
(18.162)
Inzwischen konnte die Genauigkeit
SD PD
PE
SH
PH
Abb. 18.58: Messung der Lichtgeschwindigkeit mittels eines Drehspiegels (Foucault, 1850)
500
18 Zeitlich veränderliche Magnetfelder
der Messungen durch den Einsatz elektrooptischer Komponenten, die höhere Modulationsfrequenzen gestatten, an Stelle eines Drehspiegels erheblich gesteigert werden. Die heute genaueste Messmethode beruht auf der separaten Messung der Frequenz und der Wellenlänge der Lichtwelle eines Lasers, woraus sich c aus c OQ ergibt. Aus solchen Messungen folgt c zu
c
2,99792458 108 m / s .
(18.163)
18.11.3 Koaxialkabel, Hohlleiter und Hohlraumresonatoren Um hochfrequente elektromagnetische Wellen dem „Verbraucher“ zuzuführen, werden geeignete Leitungen benötigt. Die in der Wechselstromtechnik üblichen Drahtleitungen sind dafür nicht brauchbar, da Verluste durch Abstrahlung zu groß sind. Wir müssen uns daher Anordnungen überlegen, welche solche Verluste möglichst vermeiden. Eine Möglichkeit besteht darin, die Wellen in einer nach E. E. Lecher (1856-1926) benannten Paralleldrahtleitung zu führen, die an einem Ende geschlossen ist. Ist der Abstand der beiden Drähte klein gegenüber der Wellenlänge, so zeigt sich, dass die Ströme in den beiden Leitungen um den Winkel S gegeneinander verschoben sind. Die Energieabstrahlung wird dadurch stark reduziert, da sich die von den Drähten ausgehenden Wellen weitgehend auslöschen. Eine noch vollständigere Abschirmung wird beim Koaxialkabel erreicht, das aus einem dünnen Draht in der Mitte eines kreisrunden metallischen Mantels besteht. Der Zwischenraum ist im Allgemeinen mit einem Dielektrikum ausgefüllt. Sie sind als Antennenkabel weit verbreitet. Es ist auch möglich, den Innenleiter wegzulassen. Wir sprechen dann von einem Hohlleiter. Sie spielen in der Mikrowellentechnik eine wichtige Rolle. Auch Lichtwellenleiter (Glasfaser-Kabel) sind dazu zu zählen. Wird ein Hohlleiter an seinen beiden Enden durch metallische Wände verschlossen, so entsteht bei geeigneter Dimensionierung ein Hohlraumresonator. Er dient zur Erzeugung sehr hochfrequenter elektromagnetischer Felder im GHzBereich. Im Folgenden besprechen wir zunächst das Koaxialkabel.
18.11.3.1 Koaxialkabel
Wie wir uns bereits klargemacht haben, verlaufen die elektrischen Feldlinien zwischen Innenund Außenleiter radial, während die magnetischen Feldlinien konzentrische Kreise bilden G G (Abb. 18.59). Die Richtung der E -Linien bzw. der Drehsinn der B -Linien ändert sich in Fortpflanzungsrichtung periodisch im Abstand einer halben Wellenlänge. Zur Ermittlung von Spannungs- und Stromverteilung leiten wir die entsprechenden Wellengleichungen her (Abb. 18.60). Induktivität und Kapazität pro Meter Leitung seien mit L´ und C´ bezeichnet. Den Ohmschen Widerstand können wir vernachlässigen.
18 Zeitlich veränderliche Magnetfelder
501
r E r E
r B
Abb. 18.59: Ausbreitung einer elektromagnetischen Welle in einem Koaxialkabel Nach dem Induktionsgesetz erhalten wir für die Spannungsdifferenz im Abstand eines Leiterelementes ' z
'U
U ( z 'z ) U ( z ) (18.164) dI L ' 'z dt
z
Im Grenzfall 'z o 0 folgt
wU wz
L '
wI . wt
Innenleiter
(18.165)
Die Ladung auf dem Leiterelement ' z beträgt
Q C 'U 'z .
Außenleiter
I(z)
I(z + z)
U(z)
U(z + z)
(z + z)
Abb. 18.60: Zur Ableitung der Wellengleichung
(18.166)
Die zeitliche Änderung dieser Ladung ist
wQ wt
C'
wU 'z . wt
(18.167)
Damit sich die Ladung ändern kann, muss sich der in ' z hinein fließende Strom von dem heraus fließenden Strom unterscheiden.
'I
I ( z 'z ) I ( z ) C '
wU 'z . wt
(18.168)
502
18 Zeitlich veränderliche Magnetfelder
Im Grenzfall 'z o 0 wird
wI wz
C'
wU . wt
(18.169)
Nach Differentiation von (18.165) nach z und von (18.169) nach t lassen sich die erhaltenen Beziehungen entkoppeln:
w 2U wz 2 w2 I wz 2
w 2U wt 2 w2 I L 'C ' 2 wt
L 'C '
(18.170)
Dies sind die Wellengleichungen für Spannung und Strom. Im Hohlleiter breiten sie sich mit der Phasengeschwindigkeit
1
v ph
L 'C '
(18.171)
aus. Der Quotient
Z0
U0 I0
L' C'
(18.172)
heißt Wellenwiderstand des Koaxialkabels. Induktivität und Kapazität haben wir bereits berechnet. Bezeichnen Ra und Ri Außen- und Innenradius, so gilt
L'
1 2SH 0 c 2
ln( Ra / Ri ); (18.173)
C'
2SH 0 . ln( Ra / Ri )
Damit folgt für den Wellenwiderstand
Z0
1 2SH 0 c
ln( Ra / Ri ) .
(18.174)
Der Wert des Faktors 1/ 2SH 0 c beträgt 60 :. Da die Abmessungen des Kabels nur logarithmisch in Z0 eingehen, liegt die Impedanz typischer Weise in der Nähe dieses Wertes.
18 Zeitlich veränderliche Magnetfelder
503
Allerdings muss berücksichtigt werden, dass sich im Allgemeinen zwischen den beiden Leitern ein Dielektrikum mit der Dielektrizitätskonstanten H befindet, so dass sich die Kapazität um diesen Wert vergrößert. Zur Vermeidung von Verlusten muss die Reflexion am Ende der Leitung unterdrückt werden. Das wird durch Abschluss der Leitung mit dem Wellenwiderstand Z0 erreicht.
18.11.3.2 Rechteck-Hohlleiter
Wird der Innenleiter entfernt, so entsteht ein Hohlleiter. Betrachten wir ihn vom Standpunkt der Wechselstromtechnik, so erscheint es zunächst erstaunlich, dass durch ihn elektromagnetische Energie transportiert werden kann. Anders dagegen, wenn wir davon ausgehen, dass sich Licht direkt und durch Reflexion an den gut verspiegelten Wänden ausbreiten kann. Der Hohlleiter kann elliptisch, rund oder rechteckig geformt sein. Wir wollen hier x den letzten Fall betrachten, der wohl der Allgemeinste ist. Wir wählen eine mehr anschauliche Herleitung, die von der Fortpflanzung einer speziellen ebenen Welle entlang zweier metallischer Platten ausgeht -kx kx (Abb. 18.61). Diese mögen sich im Abstand kz kz a gegenüber stehen. Eine schräg einfallende G z elektromagnetische Welle E (0, E y , 0) mit G Abb. 18.61: Zur Herleitung der Wellendem Wellenvektor k (k x , 0, k z ) wird abformen in einem rechteckigen Hohlleiter wechselnd von der oberen und der unteren Platte gespiegelt. Während also kz erhalten bleibt, ändert kx bei jeder Reflexion sein Vorzeichen. Zwischen den Platten entsteht daher eine G G Welle, die aus der Überlagerung zweier Wellen mit k (k x , 0, k z ) und k (k x , 0, k z ) resultiert.
G E
G E0, y sin(Zt k x x k z x) sin(Zt k x x k z x) G 2 E0, y sin(k x x) cos(Zt k z z ).
(18.175)
Die in z-Richtung fortschreitende Welle besitzt eine von x abhängige Amplitude. An den beiden Metallplatten ist die Tangentialkomponente der elektrischen Feldstärke null. Die Werte von kx sind also durch die Randbedingungen
kx festgelegt.
nS a
(18.176)
504
18 Zeitlich veränderliche Magnetfelder
Die elektrische Feldstärke wird demnach null für
kx x S ,
(18.177)
G woraus sich die Knotenebenen von E ergeben zu
x a/n .
(18.178)
Jetzt wollen wir die Phasengeschwindigkeit der Welle berechnen. Wir können sie aus der Wellengleichung ermitteln, indem wir die Lösungsfunktion (18.175) einsetzen. Es ergibt sich die Bedingungsgleichung
k x2 k z2
Z2
.
c2
(18.179)
Die Werte für k x liegen bereits fest. k z muss also der Bedingung genügen
kz
Z
Z2
v ph
c2
Schreiben wir k z
n 2S 2 . a2
2S / Oeff und drücken Z mittels Wellenlänge O0 und Lichtgeschwin-
digkeit c im freien Raum (Vakuum), Z
Oeff
(18.180)
O0 1 (O0 / 2a ) 2
2S c / O0 , aus, so folgt
.
(18.181)
Die Wellenlänge einer elektromagnetischen Welle zwischen zwei metallischen Platten ist also größer als die Wellenlänge einer Welle gleicher Frequenz im freien Raum. Wie (18.180) zeigt, gibt es eine Grenzfrequenz, unterhalb derer sich in dem „Wellenleiter“ keine Welle ausbreiten kann. Sie ergibt sich aus der Forderung, dass der Radikand reell sein muss, zu
Z t ZG
nS c . a
(18.182a)
Dem entspricht eine obere Grenzwellenlänge OG .
O d OG
2a . n
Wir wenden uns nun der Berechnung der Phasengeschwindigkeit zu.
(18.182b)
18 Zeitlich veränderliche Magnetfelder
505
Sie folgt aus (18.180) zu
c
v ph
n 2S 2 c 2 1 2 2 aZ
!c.
(18.183)
An diesem Ausdruck sind mehrere Punkte bemerkenswert. Zunächst fällt auf, dass die Phasengeschwindigkeit größer als die Lichtgeschwindigkeit ist. Darauf kommen wir gleich zurück. Weiter sehen wir, dass die Phasengeschwindigkeit eine Funktion der Frequenz ist. Schließlich geht in den Ausdruck die Knotenzahl n ein. Die Geschwindigkeit der Welle hängt also von ihrer Modenstruktur ab. Die Übertragung eines Signals erfolgt mit der Gruppengeschwindigkeit v g . Sie ist definiert als vg :
dZ . dk
(18.184)
In unserem Fall wird v g
vg
dZ dk z
d Z dk dk dk z
c
kz k
c2 kz
Z
c2 c v ph
(18.185)
Die Gruppengeschwindigkeit der Welle ist also kleiner als die Lichtgeschwindigkeit. Die Abhängigkeit der Frequenz vom Wellenvektor wird als Dispersionsrelation bezeichnet. Sie ergibt sich aus (18.180) zu
Z2
c 2 k z2
n 2S 2 c 2 . a2
(18.186)
In Abb. 18.62 ist Z f (k z ) dargestellt. Wir erweitern nun unsere Überlegungen auf einen Hohlleiter mit rechteckigem Querschnitt. Das bedeutet, dass die elektrische Feldstärke jetzt auch eine Komponente in x-Richtung besitzen G G kann, E E ( Ex , E y ) . Die Lösungsfunktion muss also die Form haben
G E ( x, y , z )
G E0 ( x, y )cos(Zt k z z ). (18.187)
g
kz Abb. 18.62: Frequenz einer elektromagnetischen Welle als Funktion der Wellenvektorkomponente kz, (Dispersionsrelation)
506
18 Zeitlich veränderliche Magnetfelder
Setzen wir diesen Ansatz in die Wellengleichung ein, so ergibt sich als Analogon zu (18.179)
Z2
k x2 k y2 k z2
c2
.
(18.188)
Die Randbedingungen für ky lauten entsprechend denen für kx
ky
mS / b ,
(18.189)
wobei b der Abstand der leitenden Wände in y-Richtung ist. Damit folgt für kz
kz
Z2 c2
n 2S 2 m 2S 2 2 a2 b
(18.190)
und die Grenzfrequenz wird
ZG
nS c
1 1 2 . 2 a b
(18.191)
G Die Komponenten von E ergeben sich zu
E0, x ( x, y ) E0, y ( x, y ) E0 z
§ nS · § mS A cos ¨ x ¸ sin ¨ © a ¹ © b § nS · § mS B sin ¨ x ¸ cos ¨ © a ¹ © b
· y ¸; ¹ · y ¸; ¹
(18.192)
0.
Wir haben uns im Bisherigen nur mit dem elektrischen Feld beschäftigt. Wie bereits in Kap. 18.11.2.1 gezeigt, muss das zugehörige Magnetfeld aus der 2. Maxwell-Gleichung berechnet werden.
G rot E
G wB . wt
(18.96)
Wir betrachten als Beispiel eine Welle mit Ex = Ez = 0 sowie n = 1, m = 0. Sie hat also die Form
Ey
§S E0 sin ¨ ©a
· x ¸ cos(Zt k z z ) . ¹
(18.193)
18 Zeitlich veränderliche Magnetfelder
507
Die Komponenten des zugehörigen Magnetfeldes ergeben sich aus (18.96) zu
kz
Bx
By
0;
Bz
Z kx
Z
E0 sin( k x x)cos(Zt k z z ); (18.194)
E0 cos(k x x)sin(Zt k z z ).
Die Feldverteilungen sind in Abb. 18.63 dargestellt. Es ist zu beachten, dass der magnetische Feldvektor zwar senkrecht zum elektrischen Feldvektor gerichtet ist, aber nicht mehr senkrecht auf der Fortpflanzungsrichtung steht. Da es sich in beiden Fällen um transversale Wellen handelt, werden sie als TEnm-Wellen bzw. als TMnm-Wellen bezeichnet. Die Indizes n und m geben die oben eingeführten Laufzahlen an.
y
x
z
r B Abb. 18.63: Verlauf der elektrischen und magnetischen Feldstärke einer elektromagnetischen Welle in einem Rechteckhohlleiter auf
r E
b a
18.11.3.3 Hohlraumoszillatoren
Wird ein Wellenleiter auf beiden Seiten durch leitende Wände verschlossen, so entsteht ein Hohlraumresonator, der durch Einspeisung elektromagnetischer Energie zu Schwingungen angeregt werden kann (Abb. 18.64). Die Eigenschwingungen können als stehende Wellen angesehen werden, die durch Reflexion an den Wänden entstehen. Die möglichen Frequenzen G ergeben sich wieder aus den Randbedingungen. Für E lauten sie
Ex
0
für
z
0, d und
y
0, b ;
Ey
0
für
x 0, a und
z
0, d ;
Ez
0
für
x 0, a und
y
0, b .
(18.195)
508
18 Zeitlich veränderliche Magnetfelder
G Diese sind erfüllt, wenn die Komponenten des Wellenvektors k
(k x , k y , k z ) auf die folgenden
Werte beschränkt werden:
kx
r nS / a ; k y
r mS / b ; k z
r qS / z
z m, n, q = ganze Zahlen.
(18.196)
G Der Betrag des Wellenvektors k folgt mit
c r k kz
G k
k x2 k y2 k z2
(18.197a)
ky
kx
y
und den Randbedingungen zu
a
x
G k
b
Abb. 18.64: Beispiel einer Feldverteilung in einem Hohlraumoszillator (TE248-Mode)
Z
S
n2 m2 q 2 . a 2 b2 d 2
(18.197b)
Für die Frequenzen erhalten wir mit Q c/O o Z ck
cS n. L
(18.198)
Neben den elektrischen Eigenschwingungen („Moden“) gibt es die zugehörigen Moden des magnetischen Feldvektors. Für spätere Überlegungen benötigen wir den Begriff und den Wert der sog. Zustandsdichte. Sie ist definiert als Maß für die Zahl der Schwingungen pro Frequenzintervall 'Z 1s 1 im Volumen V L3 . Die erlaubten k-Werte bilden im k-Raum ein Punktgitter: In einem Oktanden G des k -Raumes beträgt die Anzahl der Gitterpunkte, wenn wir a b c L setzen
Z
Mit v ph
1 4 3 §S · S kmax / ¨ ¸ 83 ©L¹
3
L3 3 kmax . 6S 2
(18.199)
Z / k ergibt sich für die Zahl aller möglichen Eigenfrequenzen
Z (Z )
Z 3 L3 . 6S 2 v3ph
(18.200)
18 Zeitlich veränderliche Magnetfelder
509
c erhalten wir damit als Zustandsdichte (Modendichte) den Ausdruck
Mit v ph
D(Z )
Z2 V 2S 2 c 3
dZ dZ
(18.201)
Ergänzung 1: Das elektromagnetische Feld des Hertzschen Dipols Ein dünner Metallstab befinde sich im Zentrum eines kartesischen Koordinatensystems längs der z-Achse. Wir betrachten ein Volumenelement dV2, in dem sich Elektronen der Gesamtladung q U dV2 befinden mögen (Abb. 18.A1). Die Ladung möge sich längs des Drahtes mit der Geschwindigkeit v bewegen. Die Stromdichte ist G j
G
Uv.
G
z
Das Vektorpotential A einer stationären Stromverteilung ist durch (17.22) gegeben.
G G A(r1 )
G G
P0 j ( r2 ) dV2 . 4S V³ r12
dV2 (18.A1)
2
x
r j
r r1
r r2
y
G P1 Hierin ist r12 der Abstandsvektor von dV2 zu einem Aufpunkt P1. Im vorliegenden Fall ist die Stromr r1 2 dichte zeitabhängig. Daher ist die endliche Ge0 schwindigkeit des elektromagnetischen Feldes, das vom Dipol ausgeht, zu berücksichtigen. Das zur Abb. 18A.1: Zum Feld eines Dipols Zeit t im Punkt P1 gemessene Vektorpotential G G A (r1 , t ) wird durch eine Stromverteilung verursacht, die zum Zeitpunkt (t r12 / c) bestand, wobei vorausgesetzt ist, dass die Laufzeitdifferenzen ' (r12 / c) (als Retardierung bezeichnet) von unterschiedlichen Punkten des Stabes zum Aufpunkt P1 klein sind gegenüber einer Schwingungsperiode T. Alle vom Stab zur Zeit t1 ausgehenden Wellen erreichen dann im nahezu gleichen Zeitpunkt den Punkt P1. Das ist der Fall, wenn die Geschwindigkeit v der Ladung q klein ist gegenüber der Lichtgeschwindigkeit c.
G G A(r1 , t )
G G
P0 j (r2 , t r12 / c) dV2 . 4S V³ r12 2
(18.A2)
510
18 Zeitlich veränderliche Magnetfelder
Wir setzen ferner voraus, dass die Länge des Stabes l r12 ist. Dann ist r12 | r nahezu G G konstant und kann somit vor das Integral gezogen werden. Setzen wir j U v ein, so wird aus (15A1.1a)
G G A(r1 , t )
P0 G G vU (r2 , t r / c) dV2 . 4S r V³
(18.A3)
2
G Da die Geschwindigkeit v (t ) aller Ladungselemente gleich ist, kann sie ebenfalls vor das Integral gezogen werden. Das Integral stellt demnach die Ladung q dar, die längs des Stabes mit der Geschwindigkeit v gegen den Schwerpunkt der positiven Ladungen (der Atomrümpfe) Schwingungen ausführt. Der Abstand d zwischen den Ladungsschwerpunkten ändert sich also periodisch. Deswegen sprechen wir von einem schwingenden Dipol. Da gilt
G dp dt
G qv ,
(18.A4)
können wir das Vektorpotential schreiben als
G G A(r1 , t )
P0 d G p (t r / c) . 4S r dt
(18.A5)
Das Vektorpotential hat also die Form einer Kugelwelle. Das Magnetfeld ergibt sich aus dem Vektorpotential mittels
G B
G rot A .
(17.19)
G Da A nur eine z-Komponente besitzt, sind nur
Bx
wAz wy
und
By
wAz wx
(18.A6)
zu berechnen. Als Erstes ermitteln wir Bx Wir erhalten
G
Bx
G
P0 ª wp (t r / c) w § 1 · § 1 · w § wp(t r / c) · º ¨ ¸¨ ¸ ¨ ¸» . 4S «¬ wt wy © r ¹ © r ¹ wy © wt ¹¼
Es ist aber wr / wy
y / r und
w §1· y ¨ ¸ 3 , ferner mit u t r / c wy © r ¹ r
(18A7)
18 Zeitlich veränderliche Magnetfelder
G w (w p / w t ) wy
G w (w p / w t ) w u w r wu w r wy
Unter Berücksichtigung von P0
Bx
1 4SH 0 c 2
511
G w2 p 1 y . w t2 c r
(18.A8)
1/(H 0 c 2 ) ergibt sich damit das Magnetfeld Bx zu
ª§ y ·§ wp (t r / c) · § y «¨ 3 ¸¨ ¸¨ 2 wt ¹ © cr ¬© r ¹©
2 · § w p (t r / c ) · º ¸» ¸¨ wt 2 ¹© ¹¼
(18.A9)
In derselben Weise erhalten wir
By
ª§ x ·§ wp (t r / c) · § x · § w 2 p(t r / c) · º «¨ 3 ¸¨ ¸» . ¸ ¨ 2 ¸¨ wt wt 2 4SH 0 c ¬© r ¹© ¹ © cr ¹ © ¹¼ 1
(18.A10)
2
Addition der beiden Beziehungen führt zu
Bx By
1 4SH 0 c 2
x y ª§ wp(t r / c) · § r · § w 2 p(t r / c) · º . r3
Ǭ ©
G
Erinnern wir uns daran, dass p
wt
¸ ¨ ¸¨ ¹ © c ¹©
wt 2
¸» ¹¼
(18.A11)
pz ist, so erkennen wir, dass wir die Gleichung als
Vektorprodukt schreiben können:
G B
1
1 2 3 4SH 0 c r
ª§ w pG (t r / c) · § r · § w 2 pG (t r / c) · º G «¨ ¸» u r . ¸ ¨ ¸¨ wt wt 2 ¹ © c ¹© ¹¼ ¬©
(18.A12)
Das ist die gewünschte Beziehung für das Magnetfeld des Hertzschen Dipols. Die elektrische Feldstärke lässt sich aus der 1. Maxwellgleichung, (18.96) und aus (17.19) ermitteln, wobei zeitliche und räumliche Differentiation bei letzterer zu vertauschen sind. Es ergibt sich
G G dB rotE dt
G G dA rot ( E ) 0 . dt
Wegen des Verschwindens dieser Gleichung lässt sich der Klammerausdruck als Gradient eines elektrischen Potentials Mel schreiben, denn rot grad Mel = 0. Damit folgt mit der Lorentzschen Eichbedingung
G E
G wA grad Mel , wt
(18.A13)
512
18 Zeitlich veränderliche Magnetfelder
Wenden wir uns also der Berechnung des Potentials Mel zu. Wie wir gerade gesehen haben, hat G G A nur eine z-Komponente. Folglich ist div A wAz / wt . Die Differentiation lässt sich in Analogie zur Berechnung von Bx durchführen und ergibt
G A
ª§ wp (t r / c) · w § 1 · 1 w § wp (t r / c) · º ¨ ¸ ¨ ¸ ¨ ¸» , wt wt 4SH 0 c «¬© ¹ wz © r ¹ r wz © ¹¼
G A
1 4SH 0 c 2
1
2
ª§ z ·§ wp(t r / c) · § z «¨ 3 ¸¨ ¸¨ 2 wt ¹ © cr ¬© r ¹©
2 · § w p (t r / c) · º ¸» . ¸¨ wt 2 ¹© ¹¼
(18.A14)
(18.A15)
In vektorieller Schreibweise wird
G A
G G 1 1 ª§ wp(t r / c) · § r · § w 2 p (t r / c) · º G «¨ ¸» r . ¸ ¨ ¸¨ wt wt 2 4SH 0 c 2 r 3 ¬© ¹ © c ¹© ¹¼
(18.A16)
Unter Anwendung von (18.13) erhalten wir für das Potential
Mel
1
1 4SH 0 r 3
G ªG § r ·§ wp(t r / c) · º G ( / ) p t r c ¨ ¸¨ ¸» r . « wt © c ¹© ¹¼ ¬
(18.A17)
Damit folgt aus (18.12) für das elektrische Feld nach etwas langwieriger Rechnung
G G E (r , t )
1
1 4SH 0 r 3
2G ª G* G* § 1 · § w p (t r / c ) G · G º ˆ ˆ ur ¸ur » , p p r r 3( ) « ¨ 2 ¸¨ wt 2 © c ¹© ¹ ¼ ¬
(18.A18)
wobei
G p*
G G § r ·§ wp(t r / c) · p (t r / c) ¨ ¸¨ ¸. wt © c ¹© ¹
(18.A19)
18 Zeitlich veränderliche Magnetfelder
513
Ergänzung 2: Die Energiestromdichte in einer elektromagnetischen Welle: Der Poyntingvektor Die Energiedichte ist nach (18.143a) gegeben durch
w
H0 2
E2
1 1 2 B ; 2 P0
(18..143a)
Daraus folgt für die zeitliche Änderung durch Differentiation
ww wt
H0E
wE 1 wB . B wt P0 wt
(18.A21)
Durch Benutzung der 1. und 2. Maxwell-Gleichung können die beiden zeitlichen Ableitungen durch räumliche Ableitungen ersetzt werden. Wir erhalten
ww wt
G G § G wE 1 G wB · 1 G G G G ¨H0E B ErotB BrotE ¸ wt P0 wt ¹ P0 © G 1 G G ½ di v ® E u B ¾ : di v S ¯ P0 ¿
(18.A22)
G Diese Beziehung besagt, dass sich der Poyntingvektor S aus der Energieänderung der elektromagnetischen Welle speist. Zur Verdeutlichung integrieren wir die Gleichung über ein beliebiges Volumen und wenden auf die rechte Seite den Gaußschen Satz an:
G di v S ³ dV
V
G G w S v³A dA wt V³ (w el w magn )dV .
(18.A23)
Die durch die geschlossene Fläche A eines Volumens V austretende Strahlungsenergie ist gleich der Abnahme der elektromagnetischen Feldenergie in diesem Volumen. Oder: Der Poyntingvektor ist gleich der Energiestromdichte durch die Oberfläche des betreffenden Volumens.
514
18 Zeitlich veränderliche Magnetfelder
Zusammenfassung x Die zeitliche Änderung des magnetischen Flusses ) m bewirkt eine elektrische Spannung
U ind
d)m ; dt
)m
G G
³ B dA ,
(Faradaysches Induktionsgesetz)
x Das negative Vorzeichen besagt, dass die Spannung der sie erzeugenden Ursache entgegen gerichtet ist (Energieerhaltung). Ändert sich der magnetische Fluss allein durch die zeitliche Änderung der elektrischen Stromstärke, so ist die Induktionsspannung
L
U ind
dI . dt
x Der Proportionalitätsfaktor heißt Selbstinduktionskoeffizient oder Induktivität des Leiters. Die in einem gekoppelten zweiten Leiter entstehende Induktionsspannung ist
U ind ,2
L12
dI1 , dt
wobei L12 als Gegeninduktivität bezeichnet wird. G x Die Energiedichte w magn des magnetischen Feldes B im Vakuum ist
w magn
B2 . 2 μ0
x Die Energiedichte des elektromagnetischen Feldes in Materie bzw. im Vakuum ist
w
1 ED BH . 2
x Der Wechselstromwiderstand einer Leiteranordnung (z.B. einer Spule) der Induktivität L ist RL = iZL, der Wechselstromwiderstand eines Kondensators der Kapazität C ist RC iZC . In einem Kreis ohne Ohmsche Verluste hinkt im ersten Fall der Strom der Spannung um 90° hinterher, im zweiten Fall eilt er der Spannung um 90° voraus.
18 Zeitlich veränderliche Magnetfelder
515
x Die mittlere Leistung des Wechselstromes ist
P U eff I eff cos M
1 U 0 I 0 cos M , 2
wobei M der Phasenwinkel zwischen Strom und Spannung ist. x Die Leerlaufspannung U2 auf der Sekundärseite eines Transformators ist bei vollständiger Kopplung proportional zum Verhältnis der Windungszahlen der Sekundär- und der Primärspule: U 2 ( N 2 / N1 )U1 . x Die Maxwell-Gleichungen im Vakuum lauten zusammengefasst in Integral- bzw. Differentialform
d G G ³ BdA dt A
G G ³ Edr
C
G bzw. rot E
G G 1 d G G Bdr μ I EdA 0 vC³ c 2 dt ³A G G 1 EdA ³ U dV v³ A
G G
v³ B dA
H0 V
G wB ; wt
G rot B
G G 1 wE ; P0 j 2 c wt
G div E
1
H0
U;
G div B 0.
0
A
Sie erfüllen die Kontinuitätsgleichung
G wU di v j wt
0.
x Die Frequenz einer ungedämpften elektromagnetischen Schwingung ist
Z0
1/ LC .
x Die Frequenz einer gedämpften Schwingung ist Z
Z02 G 2 ; G
R / 2L .
x Bei einer durch eine von außen angelegte periodische Spannung der Frequenz Z erzwungenen Schwingung ist die Stromamplitude
I0
U0 / L 2 0
2 2 e
(Z Z ) (2G Ze )
2
; wobei G
R 2L
und Z02
1 . LC
516
18 Zeitlich veränderliche Magnetfelder
x Zwei Schwingungskreise können induktiv oder andersweitig miteinander gekoppelt werden. Bei induktiver Kopplung ist der Kopplungsgrad
k
L12 L1 L2
.
x Die Wellengleichungen im Vakuum lauten
G G w2 E 'E H 0 P0 2 ; wt
G G w2 B 'B H 0 P0 2 . wt
Die Lösungen dieser Differentialgleichungen sind transversale Wellen. In einer ebenen elektromagnetischen Welle stehen elektrische und magnetische Feldstärke senkrecht aufeinander und sind in Phase. G x Die Energiestromdichte S einer elektromagnetischen Welle (Poyntingvektor) im Vakuum ist
G S
1
P0
G
G
E u B .
x Die Wellengleichungen für Spannung und Strom in einem beliebigen Leiter sind
w 2U wz 2
L 'C '
w 2U ; wt 2
w2 I wz 2
L 'C '
w2 I . wt 2
Die Striche an L, C bedeuten, dass diese Größen auf die Länge von 1 m bezogen sind.
Übungsaufgaben 1. Bei einer Bergwanderung entdecken Sie einen Weidezaun, der über ein kleines Kästchen mit einer 12 V Batterie verbunden ist. Da es im Kästchen geheimnisvoll klickt, fordert Ihr Begleiter eine physikalische Erklärung. Er fragt weiter, ob für dieses Einsatzgebiet nicht umweltfreundlichere Stromquellen eingesetzt werden können. 2. Ein Ohmscher Widerstand R und eine Induktivität L sind in Serie geschaltet und parallel zu dieser Anordnung eine Kapazität C. Bestimmen Sie die Frequenzabhängigkeit des Wechselstromwiderstandes und skizzieren Sie den Absolutbetrag des Gesamtwiderstandes gegen die Frequenz in einer doppeltlogarithmischen Auftragung. Berechnen und skizzieren Sie den Phasenwinkel und die gesamte von der Schaltung aufgenommene Leistung in Abhängigkeit von der Frequenz.
18 Zeitlich veränderliche Magnetfelder
517
3. Bestimmen Sie das Verhältnis von Ausgangs- zu Eingangsspannung U 2 / U1 der R1 C R1 C beiden Schaltungen (R2 = 10 R1) und tragen U2 U1 U2 U1 R2 R2 Sie den Absolutbetrag dieses komplexen Wertes in Abhängigkeit vom Logarithmus der Frequenz des Wechselspannungssignals auf. Welche Werte ergeben sich für beide Schaltungen bei den Grenzwerten der Frequenz null und unendlich? Welches Spannungsverhältnis folgt für verschwindendes R1 bei Z = 1/R2C und welcher Phasenwinkel? 4. Vergleichen Sie die Differentialgleichung für einen elektrischen Schwingungskreis mit der Bewegungsgleichung eines physikalischen Pendels. Welche Größen entsprechen einander? Wie lassen sich die Parallelen plausibel machen? 5. Was ist unter dem Kopplungsgrad zweier identischer induktiv gekoppelter Schwingungskreise zu verstehen? Welche Konsequenzen folgen für die Stromstärke im angekoppelten Kreis? Berechnen Sie seine Eigenfrequenzen für den Fall Z0 6 106 Hz, L 4 104 H, L12 kL mit k 0.06 . Diskutieren Sie weitere Möglichkeiten der Kopplung. 6. In eine Lecherleitung wird eine elektromagnetische Welle der Frequenz Q = 630 MHz eingespeist. Durch Reflexion der (als verlustfrei angenommenen) Welle entsteht eine stehende Welle. Betrachten Sie zwei Fälle: a) freies Ende der Leitung; b) kurzgeschlossenes Ende. In welchem Abstand vom Ende liegen Spannungs- bzw. Stromknoten und in welcher Entfernung wiederholen sie sich? Wie groß ist die Wellenlänge, wenn sich die Leitung an Luft befindet und welcher Wert ergibt sich, wenn sie in ein Medium der Dielektrizitätskonstante H eingebettet ist? 7. Ein Radiosender mit einer 35 m langen, linearen Antenne strahlt elektromagnetische Wellen ab. Berechnen Sie die Resonanzfrequenz und die gesamte abgestrahlte Leistung (der maximale Strom beträgt 45 A). Welche Intensität wird in 100 km Entfernung gemessen und wie groß G G sind dort das E - und das B -Feld? 8. Ein Rechteck-Hohlleiter habe die Abmessungen a = 20 mm und b = 10 mm. Wie groß ist die Grenzwellenlänge? Welches sind für k 2, 42 cm -1 O 2, 60 cm die möglichen Moden?
19
Elektromagnetische Felder in Materie
Trifft eine elektromagnetische Welle auf Materie, z. B. Licht auf ein Gas oder einen festen Körper, so wird ein Teil in das Medium eindringen, wo er mit den Atomen oder Molekülen in Wechselwirkung tritt. In einem anschaulichen Bild regt sie die Atome oder Moleküle zu erzwungenen Schwingungen an, die darauf ihrerseits Strahlung aussenden. Der andere Teil wird von der Grenzfläche zurückgeworfen. Die modellmäßige Behandlung hat von den Maxwellgleichungen auszugehen. Ist jedoch die Teilchendichte sehr klein, wie in Gasen unter Normalbedingungen, so kann die Amplitude der abgestrahlten Welle gegenüber der der einlaufenden vernachlässigt werden. Wir können dann das uns bekannte mechanische Modell des von außen angeregten Oszillators zu Grunde legen. Das vereinfacht die Diskussion. Dementsprechend wollen wir die Behandlung in zwei Stufen vornehmen. Zunächst besprechen wir den Fall optisch dünner Materie.
19.1 Elektromagnetische Felder in optisch dünner Materie 19.1.1 Brechungsindex Experimente zeigen, dass sich elektromagnetische Felder in Materie langsamer ausbreiten als im Vakuum. Wir können also schreiben
cMed (n)
c ; n !1. n
(19.1)
Der Wert von n hängt vom Medium ab und variiert im Allgemeinen mit der Wellenlänge O der Strahlung. Wir bezeichnen diese Eigenschaft als Dispersion.
cMed
cMed (O ) .
(19.1a)
r r i E = E0e
t z/c
r r i E= E 0 e
(t
t) z /c
r Qualitativ lässt sich die kleinere GeschwinE digkeit in Materie so verstehen: Eine eindringende elektromagnetische Welle regt die Elektronen der Atome oder diese selbst zu z erzwungenen Schwingungen an. Diese strahlen ihrerseits elektromagnetische Wellen der gleichen Frequenz aus, die sich der einVak / n Vak gestrahlten Welle überlagern. Wie in Kap. 18.11 gezeigt wurde, besteht zwischen Abb. 19.1: Verkleinerung der Wellenanregendem Feld und Oszillationen des angelänge einer Lichtwelle beim Durchlaufen regten Dipols eine Phasenverschiebung, so eines Mediums mit dem Brechungsindex dass auch die Abstrahlung verzögert erfolgt. n>1 Durch die Überlagerung der verschiedenen Wellen, die in den einzelnen Ebenen entstehen, ist also am Ende des Mediums die resultierende Welle relativ zu der Welle, die sich im
520
19 Elektromagnetische Felder in Materie
Vakuum fortpflanzt, verzögert (Abb. 19.1). Das bedeutet aber, dass die Geschwindigkeit elektromagnetischer Strahlung in Materie kleiner als im Vakuum ist. Wir wollen nun diese Überlegung in eine quantitative Form bringen. Zum Durchlaufen einer Strecke 'z benötigt eine Welle im Vakuum die Zeit t 'z / cVak . In Materie ist cMed c / n , wobei n > 1 ist. Die zusätzliche Zeit wird daher
't
n 'z / c 'z / c ( n 1) 'z / c .
(19.2)
Damit lässt sich die elektrische Feldstärke in einem Punkt P hinter dem Medium schreiben als
G E( z)
E0 eiZ [( t 't ) z / c ] E0 e
iZ ( t z / c )
e
(19.3)
iZ ( n 1) 'z / c
Die Welle nach Verlassen des Mediums unterscheidet sich von der einlaufenden (Vakuum-) Welle (1. Faktor) durch den Phasenfaktor (2. Faktor). Mit n o 1 geht er gegen null. Wir entwickeln ihn und brechen nach dem linearen Term ab:
e iM | 1 iM
(19.4)
Damit ergibt sich für die Feldstärke
G E
G 'z G E0 eiZ ( t z / c ) iZ (n 1) E0 eiZ ( n 1)( t z / c ) . c
(19.5)
Der erste Term stellt die einlaufende Welle dar, während der zweite Term die von den AtomDipolen des Mediums sekundär abgestrahlten Wellen wiedergibt. Aus Gründen, die später klar werden, wird n als Brechungsindex bezeichnet. Voraussetzung der Gültigkeit der Näherung ist folglich ein hinreichend kleines n, so dass die Amplitude der Sekundärwellen gegenüber der
G
G
der erregenden Welle zu vernachlässigen ist, E0, Medium | E0 . Wir versuchen, den zweiten Term mit dem oben genannten mikroskopischen Modell der zu erzwungenen Schwingungen angeregten Elektronen im Rahmen eines klassischen Modells quantitativ zu fassen. Die quantenmechanische Herleitung führt zu einem Ausdruck, der eine analoge Struktur aufweist. Zur Erinnerung: Das Modell findet seinen Ausdruck in der Bewegungsgleichung
d2x dx 2G Z02 x 2 dt dt
e E0 eiZ ( t kz ) , m
(19.6)
wobei G R / 2m die Dämpfungskonstante und Z02 D / m die quadrierte Eigenfrequenz des ungedämpften Systems darstellen. Die Amplitude der Auslenkung eines elastisch an den Atomrumpf gebundenen Elektrons in der Ebene z = 0 ist
19 Elektromagnetische Felder in Materie
x0
521
eE0 / m
Z
2 0
(19.7)
Z 2 2iGZ
Nach Erweiterung mit dem Konjugiert Komplexen des Nenners folgt
x
x0 ei (Zt M )
eE0 / m
Z
2 0
Z
2 2
e i ( Z t M )
.
(19.8)
(2GZ ) 2
Mit der Auslenkung ist ein induziertes Dipolmoment pind = ex verbunden. Wie gesagt, strahlen die Dipole selbst elektromagnetische Wellen ab. Die elektrische Feldstärke hat im Punkt P(r) unter - 90q entsprechend (18.142) den Wert
E/ Dipol
eZ 2 x0 iZ ( t r / c ) e , 4SH 0 c 2 r
(19.9)
wobei der Retardierung Rechnung getragen wurde. Die Feldstärke setzt sich zusammen aus den Beiträgen aller Dipole im Medium. Die Wellenlänge der Strahlung ist im Allgemeinen groß gegenüber dem Abstand der Dipole. Wir brauchen daher die diskrete Struktur des Mediums nicht zu berücksichtigen. Die Anzahl der Dipole in einer Schicht der Dicke ' z in der Ebene z = const (Abb. 19.2) beträgt
'z ³ N dA ,
(19.10)
Zur Unterscheidung vom Brechungsindex bezeichnet N die Anzahldichte der Dipole. Damit ergibt sich das resultierende elektrische Feld, das von einer Schicht ' z um z = 0 herrührt, im Punkt P zu
E( z)
x
f iZ r / c eZ 2 x0 iZt e e ' z N 2S RdR . 2 ³ 4SH 0 c r r 0
(19.11)
r
R und r sind verknüpft durch
R
r2
R 2 z 2 , rdr
RdR .
(19.12)
P
Damit folgt das Feld zu
E( z)
iZ ex0 N 'z eiZ ( t z / c ) . 2H 0 c
z (19.13)
Abb. 19.2: Zur Berechnung des Brechungsindexes
z
522
19 Elektromagnetische Felder in Materie
Schließlich setzen wir für x0 den Ausdruck (19.8) ein und erhalten für das von den AtomDipolen herrührende elektrische Feld
E( z)
iZ 'z Ne 2 E0 eiZ ( t z / t ) . c 2H m ªZ 2 Z 2 2 (2GZ ) 2 º 0 ¬« 0 ¼»
(19.14)
Durch Vergleich mit (19.5) ergibt sich für n
n 1
Ne 2 2H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.15)
Der Brechungsindex ist eine komplexe Größe.
19.1.2 Dispersion und Absorption Was für eine physikalische Bedeutung hat der komplexe Brechungsindex? Um das zu sehen, schreiben wir (19.15) als Summe seines Real- und Imaginärteils.
n
nc incc
(19.16)
Durch Erweiterung des Bruches mit dem Komplex-Konjugierten des Nenners erhalten wir die Dispersionsrelationen
Re{n} nc 1 Im{n} ncc
Z02 Z 2 Ne 2 2H 0 m Z 2 Z 2 2 (2GZ ) 2 0
GZ Ne 2 2 2 H 0 m Z Z 2 (2GZ ) 2
,
(19.17)
0
die so heißen, weil n´ und n´´ frequenzabhängige Größen sind. Wir betrachten nun eine Welle nach Verlassen eines Mediums der Dicke ' z ((19.5, zweiter Term)). Setzen wir hier (19.16) ein, so folgt
E
E0 eiZ ( t z / c ) e iZ ( n 1) 'z / c E0 e Z ncc'z / c e iZ ( nc1) 'z / c eiZ ( t z / c ) .
(19.18)
19 Elektromagnetische Felder in Materie
523
Der erste Exponentialfaktor beschreibt die Abnahme der Amplitude der Welle durch Absorption im Medium. Die Strahlungsintensität I cH 0 E 2 ist
I
I 0 eD 'z .
(19.19)
Beersches Gesetz
In diesem Ausdruck wird
D
2Z ncc / c
(19.20)
als Absorptionskoeffizient bezeichnet. Er ist näherungsweise proportional zum Dämpfungsfaktor G . An Stelle von n´´ wird in der Literatur auch der Buchstabe N verwendet. An zweiter Stelle steht der oben eingeführte Phasenfaktor, auf Grund dessen die Wellenlänge im Medium verkleinert ist:
'M
Z (nc 1)'z / c 2S (nc 1)'z / OVak .
Wählen wir 'z
'M
(19.21)
OVak , so beträgt die Differenz
( nc 1) 2S .
(19.22)
Die Wellenlänge einer ebenen Welle ist definiert als der Abstand zweier sich um 2S unterscheidender Flächen gleicher Phase. Folglich reduziert sich die Wellenlänge im Medium gegenüber der im Vakuum auf den Wert
OMed
OVak nc
.
(19.23)
In der Literatur findet sich häufig der Buchstabe n statt n´. Das liegt daran, dass für viele Substanzen die Absorption vernachlässigt werden kann, so dass n = n´ gesetzt werden darf. Mit der Wellenlänge ändert sich auch die Phasengeschwindigkeit vph zu
v cMed
OMed v
c v cMed nc
OMed v
c . nc
(19.24)
Die Dispersionskurven (19.17) sind in Abb. 19.3 wiedergegeben. Der Absorptionskoeffizient zeigt in der Nähe einer Eigenfrequenz ein resonanzähnliches Verhalten. In realen Gasen treten im Allgemeinen mehrere solcher Strukturen auf, da es mehrere Eigenschwingungen gibt. In zwei- oder mehratomigen Molekülen kommen auch Schwingungs- und Rotationsanregungen des Kerngerüstes vor. Der komplexe Brechungsindex wird für elektronische Anregungen in einer der Quantenmechanik adäquaten Formulierung
524
19 Elektromagnetische Felder in Materie
n 1
n' n'' n'
e2 2H 0 me
¦ k
Nk fk
Z
2 0k
Z 2 2iG k Z (19.25)
n''~ Darin bedeuten me die Masse der Elektronen und f die quantenmechanisch zu berechnende Oszillatorenstärke. Sie gibt den Bruchteil des Absorptionsvermögens eines klassischen Oszillators an (f < 1). Eine Eigenfrequenz Zk eines quantenmechanischen Systems ist mit dessen Energiezuständen verknüpft durch die Beziehung
1 0
Abb. 19.3: Realteil und Imaginärteil des Brechungsindexes als Funktion der Frequenz (Dispersionsrelationen) aaa quantum ist,
Ek E0
=Z k ,
(19.26)
h / 2S und h das Plancksche Wirkungs-
wobei =
h 6,6260755 1034 Js .
(19.27)
n' n :
1
0 01
02
Abb. 19.4: Verlauf der Dispersionskurven bei mehreren Eigenschwingungen und zugehöriger Absorptionsfrequenz Der Realteil des Brechungsindexes ist ebenfalls frequenz- bzw. wellenlängenabhängig. Bei Frequenzen weit oberhalb der Eigenfrequenz besitzt er den Wert 1. Bei Annäherung an diese nimmt er zunächst ab, um in unmittelbarer Nähe sein Vorzeichen zu wechseln und steil anzuwachsen. Nach Erreichen eines Maximums fällt er bei weiterer Reduzierung der Frequenz auf einen konstanten Wert größer 1. Ein Bereich mit dnc / d Z ! 0 heißt Bereich mit normaler Dispersion, ein solcher mit dnc / d Z 0 Bereich mit anomaler Dispersion. Existieren mehrere Eigenfrequenzen, so ist zu beachten, dass sich mit abnehmender Frequenz die Beiträge der Oszillatoren mit höheren Eigenfrequenzen addieren (Abb. 19.4).
19 Elektromagnetische Felder in Materie
525
19.1.3 Streuung elektromagnetischer Wellen und Teilchen 19.1.3.1 Einteilung der Streuprozesse
Unter Streuung verstehen wir die Ablenkung eines Teils eines in einer bestimmten Richtung laufenden gebündelten Teilchenstrahls bzw. einer ebenen Welle beim Durchgang durch Materie (Abb. 19.5). Diese kann sowohl aus diskreten Korpuskeln als auch einem Kontinuum bestehen. Insofern lässt sich auch die Beugung elektromagnetischer Wellen als Streuung auffassen. Im engeren Sinn wird der Begriff der Streuung verwendet, wenn die streuende Materie als aus Korpuskeln bestehend angesehen wird. Ein einzelner Streuakt besteht in diesem Fall aus der Wechselwirkung der Strahlung mit einem einzelnen Streuzentrum, etwa einem Atom oder einem Atomkern. Im Teilchenbild besteht ein einzelner Streuvorgang in der Ablenkung eines Teilchens. Somit kann auch der nicht zentrale Stoß als Streuvolumen Streuprozess gelten. Im Wellenbild besteht der einzelne Streuvorgang in der Ausstrahlung Abb. 19.5: Streuung, etwa von Licht, einer Kugelwelle. an diskreten Korpuskeln Aus dem täglichen Leben ist uns die Lichtstreuung wohlbekannt. Ohne sie müssten wir auf das schöne Himmelsblau verzichten, der Himmel wäre schwarz. Lichtstreuung an Materie ist nicht das einzige Streuphänomen. Wir finden es auch bei kurzwelligerer Strahlung (z.B. als Röntgenstreuung). Auch Streuung von Teilchenstrahlung spielt eine wichtige Rolle. Z.B. ist die Neutronenstreuung eine wichtige Methode zur Untersuchung von Struktur und Anregungszuständen in kondensierter Materie. Streuvorgänge werden zweckmäßiger Weise in elastische und inelastische Prozesse eingeteilt. Bei Ersteren hat die Streuwelle die gleiche Frequenz wie die einfallende Welle. Bei inelastischen Prozessen dient ein Teil der Energie der einfallenden Welle zur Anregung von Energiezuständen des Mediums. Ein kleiner Teil der Streustrahlung hat dann eine andere Frequenz, sie ist in der „Frequenz verschoben“. Die Energiedifferenz entspricht der Anregungsenergie des Mediums. Im Folgenden wollen wir uns auf die elastische Lichtstreuung beschränken. Die meisten Resultate lassen sich auf Strahlung höherer Frequenzen übertragen. Erfolgt die Streuung an geordneten Strukturen (z.B. an Kristallgittern), so besteht zwischen den Phasenwinkeln der gestreuten Teilwellen eine feste Beziehung. In diesem Fall sprechen wir von kohärenter Streuung. Sind die Atome des Mediums dagegen unregelmäßig verteilt, so sind die Phasenwinkel der Teilwellen statistisch verteilt. Dieser Vorgang heißt inkohärente Streuung. Zwischen diesen beiden Grenzfällen gibt es Übergänge. In vielen Fällen existiert nur eine annähernde Ordnung in kleinen Bereichen, etwa in amorphen Stoffen, in Flüssigkeiten oder in manchen Suspensionen. Ein einfaches, gut untersuchtes System sind Polysterolkügelchen mit
526
19 Elektromagnetische Felder in Materie
Ze
Ze
Ze
Ze
Ze
-
Ze
Ze
Ze
Ze Ze
Ze Ze
Ze
Ze Ze
typischen Durchmessern von 400 nm, die in Wasser gelöst sind. Die Teilchen besitzen auf ihrer Oberfläche saure (oder basische) Gruppen, die z.T. dissoziieren. Dadurch laden sich die Kügelchen negativ auf. Infolge der elektrostatischen Wechselwirkung sind sie nicht mehr unabhängig voneinander, sondern nächste Nachbarn sind miteinander korreliert (Abb. 19.6). Es bildet sich eine Nahordnung aus, die mit Hilfe der Licht- und Neutronenstreuung untersucht werden kann. Ist die Teilchendurchmesser klein gegenüber der Wellenlänge des Lichts, so wird sie als Rayleigh-Streuung bezeichnet, ist er groß, heißt sie Miestreuung.
Ze Ze
Abb. 19.6: Nahordnung in einer Lösung von geladenen Kügelchen
19.1.3.2 Formfaktor und Strukturfaktor
Wir wollen diese Überlegungen nun quantitativ formulieren. Eine ebene, in x-Richtung polarisierte Welle in z-Richtung treffe auf einen punktförmigen Teilchendipol. Dieser wird zu erzwungenen Schwingungen in x-Richtung angeregt. Die von ihm ausgehende Sekundärwelle bezeichnen wir entsprechend der obigen Einführung als Streuwelle. Die elektrische Feldstärke wurde in (19.9) zu
Ee
eZ 2 x0 iZ ( t r / c ) e , 4SH 0 c 2 r
bestimmt, wobei x0 die Amplitude ist. Infolge des Resonanznenners kann es für Frequenzen in der Nähe einer Eigenfrequenz zu einer stark überhöhten Streuamplitude kommen. Dieser Fall heißt Resonanzstreuung. Wir interessieren uns hier primär für die Streuung durch Partikel im Bereich des sichtbaren Lichtes. Ihre Eigenfrequenzen liegen im ultravioletten Spektralbereich. Wir können daher den Nenner näherungsweise gleich Z0 setzen, so dass x0 = const wird. Die resultierende Feldstärke ES am Ort des Empfängers ergibt sich durch Summation der Beiträge aller N Streuzentren im Volumen V. N
ES ( q , t )
¦ bi (q)eiMi (t )) i 1
N
¦ b ( q )e i
i 1
GG iqRi ( t )
(19.28)
19 Elektromagnetische Felder in Materie
527
Hierin ist Mi der Phasenwinkel der vom i-ten Streuzentrum ausgehenden Streuwelle und bi ihre Amplitude. Wie Abb. 19.7 zeigt, kann Mi ausgedrückt werden durch die Differenz der WellenG vektoren von einlaufender und gestreuter Welle, multipliziert mit dem Ortsvektor Ri des jeweiligen Streuzentrums zur Zeit t.
Pi
r Ri
kˆ i
kkˆ a
b
kˆ i
r Ri (kˆa - kˆe ); 2 / (kˆa - kˆe )i Ri r r qi Ri .
kˆ a
r r r (ka - ke )i Ri
a
0
Abb. 19.7: Zur Ableitung der Feldstärke der von punktförmigen Teilchen herrührenden Streuwelle Der Empfänger misst nicht die Feldstärke, sondern die über die Zeit gemittelte Intensität. Sie wird formal geschrieben als I S (q, t ) T und ist definiert durch T
I S (q)
I S ( q, t )
T
1 2 ES (q, t ) dt T of T ³ 0 lim
ES ( q , t )
Wir erweitern unser Modell nun dahingehend, dass die Streuzentren eine endliche Größe haben sollen. In der von Rayleigh, Gans und Debye stammenden Näherung wird der einzelne Streuer in m Segmente unterteilt, deren Abmessungen so klein sind, dass sie wieder als Punktstreuer angesehen werden können. Die von ihnen ausgehenden Teilwellen haben alle die gleiche Amplitude. Der G Ortsvektor RiD des Segments D auf dem i-ten Teilchen ist nach Abb. 19.8 gegeben durch G RiD
G G Ri riD .
(19.30)
G Ri D bezeichnet den Ortsvektor des SchwerG punktes des i-ten Teilchens und riD den Orts-
2
ES (q, t ) ES (q, t ) . (19.29) T
T
Streuteilchen S r Ri
r ri
Segment i r R ia
r r r R ia = R i + ria
0
Abb. 19.8: Erweiterung des Streuvorgangs auf ausgedehnte Teilchen
528
19 Elektromagnetische Felder in Materie
vektor des Segments D bezogen auf den Schwerpunkt des Teilchens. Ersetzen wir in (19.28) Ri durch diesen Ausdruck, so erhalten wir N N GG m GG GG G G ES (q ) ¦ eiqRi ¦ eiqriD : ¦ eiqRi f i (q , riD )
D 1
i 1
(19.31)
i 1
G G Der Term f i (q , riD ) hängt nur von der Anordnung der Segmente ab und heißt deswegen Formamplitude. Die Intensität des Streulichtes ergibt sich daraus durch Multiplikation mit dem Konjugiert Komplexen von ES zu N
I S (q) b 2
N
¦¦ e
G G G iq ( Ri R j )
fi f j .
(19.32)
i 1 j 1
Der besseren Übersicht wegen zerlegen wir die Summierung in eine solche mit i = j und eine mit i z j .
I S (q)
ª 1 Nb 2 « fi 2 N «¬
N
¦e
G G G iq ( Ri R j )
iz j 1
º fi f j » »¼
(19.33)
Wir wollen nun voraussetzen, dass die Streuzentren alle identisch sind, so dass fi = fj .
I S (q)
Der Term
ª 1 Nb 2 f i 2 «1 ¬« N
N
¦e
iz j 1
G G G iq ( Ri R j )
º » . ¼»
(19.34)
f i 2 wird Formfaktor P (q ) genannt. Er ist einfach die zeitlich gemittelte quadra-
tische Formamplitude.
P(q)
1 m iqG ( rGD rGß ) . ¦e m2 D , ß
(19.35)
Der zweite Term in den eckigen Klammern hängt ab von der relativen Anordnung der Teilchen untereinander. Er heißt daher statischer Strukturfaktor S(q). In Kurzform schreibt sich also die Intensität
I S (q)
N b 2 P(q) S (q) .
(19.36)
Für kugelförmige Teilchen faktorisiert I S (q ) in den Formfaktor und den Strukturfaktor. Wir wenden uns nun einigen Spezialfälle zu.
19 Elektromagnetische Felder in Materie
529
19.1.3.3 Streuung an geordneten Strukturen – Kohärente Streuung
Wir betrachten ein Raumgitter, dessen Gitterpunkte mit Streuzentren besetzt sind (Abb. 19.9). Zunächst wollen wir annehmen, dass es sich um punktförmige Teilchen handelt. In diesem G G Fall sind die riD 0 und die Formamplitude G G f i (q , riD ) bzw. der Formfaktor P(q) haben den Wert 1. Im Ausdruck für die Feldstärke, G Gl. (19.28), bzw. im Strukturfaktor sind die Ri Gittervektoren; ein solcher wird üblicherweise G mit Rmnp bezeichnet. Er weist vom Punkt (000) c zu einem durch das Zahlentripel mnp festb G G G gelegten Gitterpunkt. Die Vektoren a , b , c sind die Grundvektoren des Gitters (Abb. 19.9) (0,0,0) a R mnp
G Rmnp
G G G ma nb pc .
(19.37)
Abb. 19.9: Raumgitter aus punktförmig vorausgesetzten Atomen. Die Grundvektoren sind mit a, b, c bezeichnet
Damit wird die elektrische Feldstärke N
GG
ES (q) ¦ eiqRi i 1
GG inqb
GG imqa
¦e ¦e ¦e m
n
GG ipqc
.
(19.38)
p
Maxima der Feldstärke treten auf, wenn die Phasenwinkel ein ganzzahliges Vielfaches von 2S sind. Die Glieder der Summen nehmen dann den Wert 1 an. Es müssen also die folgenden Bedingungen erfüllt sein:
G G a 'q 2S h G G b 'q 2S k . G G c 'q 2S l
(19.39)
Die ganzen Zahlen h, k, l heißen Laue-Indizes, die Gln. (19.39) Laue-Gleichungen. (M. v. Laue, 1879-1960). Zur Ermittlung der Streuintensität müssen obige geometrische Reihen aufsummiert werden. Wir beschränken uns hier auf eine lineare periodische Anordnung von Punktstreuern. Dieses Gitter liege senkrecht zur einfallenden Welle (Abb. 19.10). Es bleibt dann nur eine Summe übrig. GG
ES (q ) ¦ eimqa . m
(19.40)
530
19 Elektromagnetische Felder in Materie Das Resultat ist
r k2
N
¦e
a
rr qa
GG
m 1
e
i
r k1
e Abb. 19.10: Lineare Kette aus punktfömigen Streuteilchen
GG qa
ka cos(90 D )
2S a
O
eiNqa 1 GG eiqa 1
GG i ( m 1) qa
N 1 GG qa 2
e
i
N GG qa 2 GG
eiqa i
N 1 GG qa 2
i
N GG qa
e 2 GG e iqa
GG sin Nqa / 2 GG sin qa / 2
(19.41)
In unserer Geometrie ist der Phasenunterschied gegeben durch
sin D .
(19.42)
Damit wird die Feldstärke
ES e
i
N 1 GG qa 2
sin N S (a / O )sin D sin S ( a / O )sin D
:e
i
N 1 GG qa 2
sin NI sin I
(19.43)
und die Intensität
IS
sin 2 NI
sin 2 > N S (a / O )sin D @
sin 2 I
sin 2 >S (a / O )sin D @
.
(19.44)
Der Wert des Bruches zeigt im Allgemeinen schwache Oszillationen in der Nähe von 1. Nur dort, wo der Nenner und damit der Zähler null wird, ergibt sich mit der l‘Hospitalschen Regel der Wert N2. Der Streuwinkel ist dabei festgelegt durch die Bedingung
S (a / O )sin D sin D m
m
O a
mS .
(19.45)
(19.46)
Die volle Breite der Intensitätskurven, definiert als der Abstand der ersten Nullstellen, ist
'I
S N
.
(19.47)
19 Elektromagnetische Felder in Materie
531
In realen Systemen ist N >> 1, so dass auf einem in den Strahlengang gehaltenen Schirm periodisch schmale Intensitätsmaxima entstehen, sonst aber Dunkelheit herrscht (Abb. 19.11).
Intensität
-0.33
a/
0.33 sin
0.00
3; N = 30
Intensität
a/ 3 N=5
sin
Abb. 19.11: Intensitätsverteilung bei Streuung an einem Punktgitter für N = 5 und N = 30 Derartige Muster werden wir bei der Besprechung von Beugung und Interferenz wiederfinden. Anwendung findet die kohärente Streuung z.B. bei der Ermittlung der Struktur von Kristallen.
19.1.3.4 Streuung an ungeordneten Systemen – Inkohärente Streuung
Sind die weiterhin als punktförmig vorausgesetzten Streuzentren willkürlich im Raum verteilt, so gehen die festen Phasenbeziehungen verloren. In (19.34)
ª 1 Nb 2 f i 2 «1 «¬ N
I S (q)
N
¦e
G G G iq ( Ri R j )
iz j 1
º » »¼
(19.48)
G sind also die Ri , j unabhängig voneinander. Da alle Teilchen identisch sind, lässt sich der
zweite Term in den eckigen Klammern umschreiben in N
¦e
G G G iq ( Ri R j )
G G
G
N ( N 1) eiq ( R1 R2 ) .
(19.49)
iz j 1
Wegen der Unabhängigkeit der Teilchen voneinander kann die Mittelung über Teilchen (1) und Teilchen (2) getrennt vorgenommen werden. G G
G
eiq ( R1 R2 )
GG
eiqR1
GG
eiqR2
0.
(19.50)
532
19 Elektromagnetische Felder in Materie GG
Die Mittelwerte sind null, weil in der Gaußschen Zahlenebene z.B. eiqR1 alle Werte annimmt. (19.48) reduziert sich damit zu
I S (q)
Nb 2 f i 2 .
Der Formfaktor P (q)
fi 2
(19.51) ist für Punktstreuer, wie oben dargelegt, gleich 1. Bei vorgege-
bener Frequenz der einfallenden Lichtwelle ist die elektrische Feldstärke gleich der Summe der (hier als gleich angenommenen) Intensitäten der Einzelwellen und damit konstant.
19.1.3.5 Beispiele für inkohärente Streuung
Zu beachten ist die Frequenzabhängigkeit der Streustrahlung, wie wir sie bereits von (19.9) kennen. Die Intensität ist proportional zur 4-ten Potenz der Frequenz.
I S (q) Z 4 Diese Eigenschaft erklärt den blauen Himmel über uns (Abb. 19.12). Das Sonnenlicht wird an den Luftmolekülen, an Wassertröpfchen und Staubpartikeln unterschiedlichen Ursprungs gestreut. Deswegen erscheint der Himmel auch dort, wo uns die Sonne nicht gegenübersteht, hell. Die blaue Farbe rührt davon her, dass kurzwelliges Licht des Sonnenspektrums entspre-
Abb. 19.12: Entsprechend der Z4-Abhängigkeit der Streuintensität wird der kurzwellige Teil des Sonnenlichtes am stärksten gestreut. Der Himmel erscheint blau
Erde
Blickrichtung
chend (19.9) viel stärker gestreut wird als langwelliges. Das Frequenzverhältnis von blauem und rotem Licht ist etwa Zbl / Zrot | 1, 6 . Damit wird das Intensitätsverhältnis ungefähr 6 : 1. Je länger die von einem Lichtbündel durchstrahlte Strecke ist, umso mehr kurzwelliges Licht wird
19 Elektromagnetische Felder in Materie
533
aus diesem herausgestreut (Abb. 19.13), umso mehr ist das einen Beobachter direkt erreichende Licht in den roten Spektralbereich verschoben. Das ist der Grund, warum morgens und abends die Sonne, wenn sie besonders schräg steht, rötlich erscheint. Der Grad der Rotfärbung hängt dabei stark von der jeweiligen Beschaffenheit der Atmosphäre ab. Jetzt zur Frage, warum das Licht an Wolken so viel stärker gestreut wird als an den Luftpartikeln der weiteren Umgebung. Wir vereinfachen das Problem, indem wir davon ausgehen, dass die Luft außerhalb der Wolken im Wesentlichen aus Atomen und Molekülen besteht. In einer Wolke ist Erde der Wasserdampf zu kleinen Tröpfchen kondensiert. Solange ihr DurchAbb. 19.13: Bei langen Lichtwegen (am Morgen messer sehr klein gegenüber der und am Abend) wird das kurzwellige Licht zum Lichtwellenlänge ist, können wir Ingrößten Teil aus dem Sonnenlicht heraus geterferenzeffekte innerhalb solcher Küstreut, die Sonne erscheint rötlich gelchen vernachlässigen, der Formfaktor ist weiterhin konstant gleich 1. Daher ist die von den Atomdipolen ausgehende Lichtstrahlung kohärent. Nach den obigen Überlegungen bedeutet dies, dass die Streuintensität um den Faktor N größer ist als wenn die N Moleküle, wie in der umgebenden Luft, inkohärent strahlten. Das ist die qualitative Erklärung für die stärkere Streuung an Wolken.
19.1.3.6 Formfaktor für Kügelchen
Werden die Streuzentren größer, so müssen die Phasenverschiebungen der Teilwellen berücksichtigt werden. Solange der Durchmesser klein gegen die Wellenlänge ist, ist der Formfaktor durch (19.35) gegeben. Für Kügelchen kann er unschwer berechnet werden.
P(q)
1 m iqG ( rGiD rGiß ) . ¦e m2 D , ß
(19.52)
Bei sphärischen Teichen entfällt die Mittelung. 2
§ 1 m GG · P (q) ¨ ¦ eiqrD ¸ . © m D, ß ¹ Zur Berechnung formen wir die Summe in ein Integral um
(19.53)
534
19 Elektromagnetische Felder in Materie GG G · §1 P (q) ¨ ³ eiqr dr ¸ ©V V ¹
2
2S
r
(19.54a)
1
1 2 r dr ³ dM ³ eiqr cos D d (cos D ) . V ³0 0 1
(19.54b)
Als Ergebnis der Integration erhalten wir
P(q)
2
ª¬3/( qr )3 (sin( qr ) qr cos( qr )) º¼ .
(19.55)
Wie aus Abb. 19.14 ersichtlich, durchläuft P(q) mit wachsendem q Maxima und Minima. Das GG erste Minimum liegt bei qr = 4,2. Für Lichtstrahlung ist typischerweise qr d 1 . In diesem
1 P(qr) -1 10 10
1.0
a)
0.8
-2
0.6
-3
0.4
10
10-4 10
b)
P(qr)
0.2
-5
0
2
4
6
8
10 qr
0.0
0
1
2
3 qr
Abb. 19.14: a) Formfaktor für Kügelchen als Funktion des Produktes aus dem Betrag des Streuvektors q und dem Teilchenradius r; b) vergrößerter Ausschnitt des Lichtstreubereichs a Bereich hat P(q) einen monoton abfallenden Verlauf. Die Streustrahlung ist in Vorwärtsrichtung im Bereich kleiner qr am intensivsten. Nimmt der Teilchendurchmesser Werte im Bereich der Wellenlänge an, so werden die Phasenverschiebungen zwischen den Teilwellen so groß, dass Interferenzeffekte nicht mehr vernachlässigbar sind. Die Teilwellen können verstärkt oder geschwächt werden. Zur Berechnung müssen die vollständigen Maxwell-Gleichungen herangezogen werden. Die Theorie ist von G. Mie (1868-1957) ausgearbeitet worden
19 Elektromagnetische Felder in Materie
535
19.1.3.7 Polarisation des gestreuten Sonnenlichtes
Jedem fotografisch Interessierten ist bekannt, dass das Himmelslicht teilweise polarisiert ist. Am ausgeprägtesten ist diese Polarisation, wenn wir senkrecht zum einfallenden Sonnenlicht blicken. Das lässt sich mit einem Polarisationsfilter zeigen. Ein solches lässt nur Licht einer Polarisation passieren (Abb. 19.15). Die dazu senkrechte Komponente wird unterdrückt. Der Aufbau eines solchen Filters wird in einem späteren Kapitel beschrieben. Der Grund für die Polarisation des Streulichtes liegt in der Ausstrahlungscharakteristik und der Polarisation der Dipolstrahlung (Kap. 19.11). Abb. 19.15: Eine Polarisationsfolie erzeugt Abb. 19.16 zeigt ein Atom, das durch das linear polarisiertes Licht unpolarisierte Sonnenlicht zu erzwungenen Schwingungen angeregt wird. Die Schwingungsrichtung aller Atome liegt in einer Ebene senkrecht zur Einfallsrichtung. Das von ihnen ausgehende Streulicht stellen wir durch die Strahlung zweier repräsentativer Dipole dar. Der erste oszilliert in der xy-Ebene und der andere senkrecht dazu. Entsprechend ist das Streulicht polarisiert. Die von einem Beobachter unter dem Winkel 4 zwischen der in der xy-Ebene liegenden Dipolachse und Beobachtungsrichtung gemessene Intensität ist
I & S I 0 sin 2 4 wobei E
I 0 cos 2 E ,
90 4 ist. Die von den senkrecht zur xy-Ebene orientierten Dipolen ausgesandte
Strahlung hat unabhängig vom Standort des Beobachters immer den maximalen Wert I S A .
r E Abb. 19.16: Zur Erklärung der Polarisation des Himmelslichtes
r EP
Ersatzdipole
xy-Ebene r k
536
19 Elektromagnetische Felder in Materie
Damit wird der Polarisationsgrad P
P:
I A I& I A I&
1 cos 2 E . 1 cos 2 E
(19.56)
Wie oben bereits vermerkt, ist das Licht unter einem Blickwinkel von E 90q vollständig polarisiert, denn in der xy-Ebene wird in Richtung der Dipolachse kein Streulicht abgestrahlt, I &,90q 0 . Am geringsten ist der Polarisationsgrad in Vorwärts- und Rückwärtsrichtung ( E | 0q,180q ). In einem Demonstrationsexperiment lässt sich eine Mastilklösung in einer länglichen Glasküvette als Streukörper verwenden. Das senkrecht zum einfallenden unpolarisierten Lichtbündel austretende Streulicht ist vollständig in der Ebene senkrecht zur Bündelachse polarisiert (Abb. 19.17). – Licht, das am hinteren Ende der Küvette austritt, ist unpolarisiert und erscheint wegen des längeren Lichtweges rötlich. – Erleuchtung im Hörsaal!
Abb. 19.17: Anordnung zur Polarisation des Himmelslichtes. Die Küvette ist mit einer Mastiklösung gefüllt
19.2 Elektromagnetische Felder in optisch dichter Materie Bei den bisherigen Überlegungen haben wir vorausgesetzt, dass die Atome des durchstrahlten Mediums so weit voneinander entfernt sind, dass die Feldamplitude der von ihnen ausgehenden Sekundärwellen gegenüber der der auftreffenden Welle vernachlässigt werden konnte. Die Erreger-Feldstärke am Ort eines beliebigen Atoms konnte deswegen durch die Feldstärke der einlaufenden Welle ausgedrückt werden. Damit mussten die Resultate auf optisch dünne Medien, also im Wesentlichen auf Gase, beschränkt werden. Nun haben wir es meistens mit kondensierter Materie zu tun, bei denen obige Voraussetzung nicht gegeben ist. Um die Ausbreitung elektromagnetischer Wellen in optisch dichter Materie verstehen zu können, müssen wir von den Maxwell-Gleichungen in Materie ausgehen. Diese wollen wir in einem ersten Schritt formulieren.
19 Elektromagnetische Felder in Materie
537
19.2.1 Maxwell-Gleichungen in Materie Die Maxwell-Gleichungen im Vakuum lauten
G G
v³ Edr C
G G
v³ EdA A
G G
H0 V
P0 I H 0 P0
v³ Bdr C
d G G BdA ; dt ³A 1 ³ U dV ;
G G
v³ BdA
d G G EdA dt ³A
0
(19.57a) (19.57b) (19.57c) (19.57d)
A
Beim Übergang vom Vakuum zu Materie müssen wir die Polarisation der Atome berücksichtigen. Die Gln. (19.57a/b) sind deswegen durch (15.71) zu ersetzen. Die zeitliche Änderung der Polarisationsladung bewirkt in (19.57b) einen zusätzlichen Polarisationsstrom. G G G Wir tragen ihm Rechnung, indem wir unter dem Integral zu E ({ EDiel ) den Term P / H 0 hinzufügen. Entsprechend (15.59b) setzen wir
G G P E
H0
G
HE.
(19.58)
Analog muss in (19.57c/d) das Vakuum-Magnetfeld ersetzt werden durch B / P . Damit ergeben sich die Maxwell-Gleichungen in Materie in Integralform zu
G G
d G G BdA dt ³A
v³ Edr
G G EdA v³
1
HH 0 V³
G G Bdr v³
PP0 I
C
A
C
G G
v³ BdA
0.
A
2 wobei cMed
1/(HH 0 PP0 ) ist.
U dV 1 d G G EdA 2 cMed dt ³A
(19.59a)
(19.59b)
(19.59c) (19.59d)
538
19 Elektromagnetische Felder in Materie
In Differentialform lauten die Gleichungen
G rot E
G wB ; wt
G rot B
G div E
1
G div B
H H0
U;
G G 1 wE ; P P0 j 2 cMed wt
(19.60a-d)
0.
19.2.2 Elektromagnetische Wellen in isotropen Dielektrika 19.2.2.1 Brechungsindex
Wir stellen uns nun die Frage, inwieweit der für verdünnte Materie abgeleitete Ausdruck für den komplexen Brechungsindex, Gl. (19.15), abzuändern ist. In Isolatoren existieren keine Raumladungen und Ströme. Die Maxwell-Gleichungen sind damit formal identisch mit denen für das Vakuum. Daher ergeben sich auch formal die gleichen Wellengleichungen.
G 'E
G 1 w2 E 2 cMed wt 2
G 'B
G 1 w2 B . 2 cMed wt 2
(19.61a,b)
Der einzige Unterschied liegt darin, dass die Lichtgeschwindigkeit im Medium cMed c / HP c / H ist. Diese Beziehung erlaubt eine Verknüpfung des Brechungsindex mit Eigenschaften des Mediums. Der Brechungsindex ist entsprechend (19.1) definiert als das Verhältnis aus Vakuumlicht- und Lichtgeschwindigkeit im Medium. Folglich gilt
n
H .
(19.62)
Um den Brechungsindex mit atomaren Größen zu verbinden, setzen wir (19.58) in (19.61a) ein und erhalten
G 'E
G G w2 E w2 P P 0H 0 2 P 0 2 . wt wt
(19.63)
Im isotropen Medium schwingt die dielektrische Polarisation parallel zur Schwingungsrichtung der einfallenden Welle. Als solche werde die x-Achse gewählt.
G E
Ex
E0 ei (Zt kz ) .
(19.64)
19 Elektromagnetische Felder in Materie
539
G G Wir benötigen nun eine Beziehung zwischen E und P . In einem 1. Schritt setzen wir
G P
NDH 0 Ex .
Px
(19.65)
Es sei noch einmal wiederholt, dass N die Anzahldichte bedeutet. Einsetzen in die Wellengleichung (19.63) führt zu der Beziehung
k 2 Ex
Z2 c2
Ex
Z 2 N H 0D c2
Ex .
(19.66)
Division durch Ex und Berücksichtigung von n Brechungsindex
ck / Z ( cMed
c / n Z / k ) ergibt für den
n 2 1 ND .
(19.67)
Für die Amplitude der erzwungenen Schwingung und damit für das induzierte Dipolmoment pind DH 0 E folgt unter Verwendung von (19.7)
pind
e2 E . m(Z02 Z 2 2iGZ )
(19.67a)
Damit ergibt sich für D
D
e2 / H 0 . m(Z02 Z 2 2iGZ )
(19.68)
Setzen wir dies in (19.67) ein, so erhalten wir
n2 1
n( A) e 2
H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.69)
Dieser Ausdruck unterscheidet sich von dem vorher gefundenen Ausdruck für optisch dünne Medien durch das Quadrat in n; ferner fehlt ein Faktor „2“ im Nenner. Für Werte von n | 1 kann näherungsweise geschrieben werden
n 2 1 ( n 1)( n 1) | 2( n 1) , womit die Beziehung in (19.15) für optisch dünne Medien übergeht.
(19.70)
540
19 Elektromagnetische Felder in Materie
Nun noch einmal zurück zur Verknüpfung von x0 bzw. pind und E, Gl. (19.7 bzw. 19.7a). Dort hatten wir angenommen, dass das polarisierende elektrische Feld das von außen einfallende Feld ist. Die Aussagen galten daher nur für optisch dünne Materie. Jetzt müssen die Felder der umliegenden Atome mit berücksichtigt werden. Wir haben eine ähnliche Situation bereits bei der Untersuchung statischer elektrischer Felder in Dielektrika kennen gelernt (Kap. 15). Wie dort (Ergänzung 2) dargestellt, ist das am Ort eines Atoms zusätzlich auftretende Feld näherungsweise um den Betrag P / 3H 0 größer als das Feld der einlaufenden Welle. Das gilt allerdings nur für isotrope Medien sowie kubische Kristalle. Das gesamte lokale Feld ergibt sich also in solchen Fällen zu
Elokal
E
P . 3H 0
(19.71)
In (19.65) muss mithin E durch Elokal ersetzt werden.
NDH 0 Elokal
P
§ P · NDH 0 ¨ E ¸ 3H 0 ¹ ©
(19.72)
und damit
P
H 0 ND E. 1 ( ND / 3)
(19.73)
(19.67) ist somit umzuschreiben in
n2 1
ND . 1 ( ND / 3)
(19.74)
Diese Beziehung ist gleichbedeutend mit der Clausius-Mosotti-Formel (15.65).
3
n2 1 n2 2
ND ,
so dass (19.69) zu ersetzen ist durch
3
n2 1 n2 2
Ne 2
H 0 m ª¬Z02 Z 2 2iGZ º¼
.
(19.75)
19 Elektromagnetische Felder in Materie
541
19.2.3 Elektromagnetische Wellen in Metallen Im sichtbaren Spektralbereich sind Metalle undurchsichtig, werden aber z. T. schon im Ultravioletten transparent. Wir wollen dieses Verhalten durch ein einfaches Modell beschreiben. Schon früher wurde darauf hingewiesen, dass die äußeren Elektronen in erster Näherung als quasifrei angesehen werden dürfen, d.h. es existieren keine Rückstellkräfte. Den Einfluss zusätzlich vorhandener gebundener Elektronen, der sich erst im UV oder höheren Frequenzen bemerkbar macht, vernachlässigen wir. In der 2. Maxwell-Gleichung muss jetzt G G j V E berücksichtigt werden. Damit erhalten wir auf demselben Weg wie früher die Wellengleichung zu
G G 1 w2 E wE . PP0V 2 cMed wt 2 wt
G 'E
(19.76)
Wir suchen eine Lösung in Form einer ebenen Welle. Wie eine explizite Rechnung zeigt und wie sich durch Einsetzen beweisen lässt, ergibt sich das elektrische Feld zu
G E ( z, t )
G E0 e D z ei (Zt kz ) ,
(19.77)
Dies ist eine gedämpfte Welle mit D als Absorptionskoeffizient. Auf den Wert von D kommen wir unten zurück. Zunächst wenden wir uns dem Brechungsindex zu. Dabei ist zu beachten, dass wir von (19.69) ausgehen, das lokale Feld also gleich dem mittleren Feld setzen. Der Grund ist, dass die punktförmigen Elektronen in dauernder Bewegung sind, so dass feste Phasenbeziehungen nicht existieren. Wegen des Verschwindens der Rückstellkraft ist der Z02 x -Term in der Bewegungsgleichung null. Es wird also
n2 1
Ne 2 . H 0 m(Z 2 2iGZ )
(19.78)
Der Dämpfungsterm rührt davon her, dass die fluktuierenden Elektronen miteinander und mit den Atomrümpfen zusammenstoßen und dadurch in ihrer Bewegung gehemmt werden. Die Dämpfungskonstante 2G lässt sich damit durch die reziproke Stoßzeit ausdrücken.
2G
1/ W .
(19.79)
Dies entspricht der Relaxationszeitnäherung: Durch das äußere elektrische Feld werden die Elektronen beschleunigt gemäß
d vd dt
e E. m
(19.80)
542
19 Elektromagnetische Felder in Materie
Die Geschwindigkeitsänderung allein durch Stöße wird umso größer, desto größer die Differenz zwischen Momentangeschwindigkeit und mittlerer Geschwindigkeit der Elektronen am Ende der (mittleren) Stoßzeit W ist.
d vd dt
v d (t W ) v d (0)
W
:
v d (t )
W
.
(19.81)
Berücksichtigung in (19.80) ergibt die Differentialgleichung
d vd vd dt W
e E, m
(19.82a)
oder
d 2 x 1 dx dt 2 W dt
e E. m
(19.82b)
Wie in Kap. 16.6.1 gezeigt, sind Leitfähigkeit und mittlere Stoßzeit verknüpft durch
V
Ne 2 W. m
(16.35)
Einsetzen von (19.79) und (16.35) in (19.78) ergibt für n2
n2 1
V / H0 . iZ (1 iZW )
(19.83a)
Häufig wird diese Beziehung geschrieben als
n2 1
ZP2 , Z 2 (iZ / W )
(19.83b)
wobei ZP die Plasmafrequenz ist,
ZP :
Ne 2 / mH 0
V . H 0W
(19.84)
Die Plasmafrequenz ist die Frequenz, mit der ein Gas freier Elektronen der Ladung e, der Masse m und der Teilchenzahldichte N gegen die positiv geladenen Atomrümpfe schwingt. Wir wollen (19.83) für die beiden Grenzfälle ZW !! 1 und ZW 1 diskutieren. Für große Frequenzen gilt näherungsweise
19 Elektromagnetische Felder in Materie
n2 | 1
V / H0 , Z 2W
543
(19.85)
oder mit (19.84) 2
n
§Z · 1 ¨ P ¸ . ©Z ¹
(19.86)
Für Z ZP (aber weiterhin ZW !! 1 ) wird der Brechungsindex imaginär, d.h. die eindringende Welle wird – wie wir noch sehen werden – reflektiert. Oberhalb Z ! ZP ist ein metallischer Körper durchsichtig. Für niedrige Frequenzen wird unter Berücksichtigung von
i
(1 i ) / 2
n | V / 2H 0Z (1 i ) nc iN .
(19.87)
Realteil und Imaginärteil sind gleich groß. Für den Absorptionskoeffizienten D erhalten wir mit (19.20)
D
4SN
O0
2k0N
und für die Eindringtiefe G e
Ge
H 0c2 . 2VZ
2VZ , H 0c 2
(19.88)
1/ D
(19.89)
Zwei Beispiele mögen diese Ergebnisse erläutern: In den ionisierten Gasschichten der Atmosphäre ist N | 105 / cm3 und damit ZP | 20 MHz . Dieser Wert liegt oberhalb des Frequenzbereichs der kurzen Radiowellen, aber unterhalb des UKW-Bereichs. Es ist der Grund dafür, dass Radiowellen im Kurz-, Mittel- und Langwellenbereich infolge Reflexion auch in solchen Gebieten empfangen werden können, die nicht in Sichtweite des Senders liegen. Als zweites Beispiel betrachten wir mit Kupfer ein typisches Metall. Die Dichte der Elektronen in einwertigem Kupfer beträgt 8,5 1028 m 3 , die Leitfähigkeit V 5,88 107 ȍ -1m-1 , die aus (2.35) berechnete Stoßzeit W | 2, 7 1014 s . Daraus folgt die Plasmafrequenz zu 1, 6 1016 Hz . Für O 100 nm ist Kupfer transparent. Die Eindringtiefe variiert zwischen einigen cm bei 100 Hz und ca. 10 μm bei 1 GHz. Folglich ist der elektrische Widerstand bei
ZP
544
19 Elektromagnetische Felder in Materie
hohen Frequenzen relativ hoch. Er lässt sich dadurch reduzieren, dass ein kompakter Draht durch ein Bündel gegeneinander isolierter, dünner Drähte (Litze) mit einer insgesamt größeren Oberfläche ersetzt wird. – Bei Halbleitern lässt sich die Plasmafrequenz durch geeignete Dotierung in einem weiten Bereich einstellen. So kann z.B. erreicht werden, dass eine mit einer dünnen Schicht von dotiertem InSb bedampfte Glasscheibe Licht im Sichtbaren durchlässt, dagegen Wärmestrahlung im Infraroten reflektiert.
19.2.4 Reflexion und Brechung elektromagnetischer Wellen an nichtleitenden Grenzflächen In den vorangegangenen Kapiteln wurde die Ausbreitung elektromagnetischer Wellen in räumlich unbegrenzten Medien diskutiert. Jetzt wollen wir die Eigenschaften solcher Wellen beim Übergang von einem Medium zu einem anderen untersuchen. Die erste Aufgabe besteht darin, die Stetigkeitsbedingungen für die elektromagnetischen Feldgrößen aufzustellen.
19.2.4.1 Stetigkeitsbedingungen
Die beiden Medien seien durch die Dielektrizitätskonstante H1 bzw. H 2 und die magnetische G G Permeabilität P1 bzw. P2 charakterisiert. Wie verhalten sich E und B beim Übergang? Wir zerlegen die beiden Feldgrößen in eine Komponente parallel zur Grenzfläche und eine senkrecht zur Grenzfläche.
r E1 r E1t r Sn
r E1
r E1n r S1t r S2t
r E1t r E1t r Sn r E 2t r E2
r r E 2n E 2t
r E1n r r E1n A1ob V A r A 2unt r E 2n
r E2 r r E 2n E 2t
Abb. 19.18: Zur Berechnung der Tangential- und Normalkomponenten (rechts) des elektrischen und magnetischen Feldes an der Grenzfläche zweier nichtleitender Medien)
19 Elektromagnetische Felder in Materie
G E G B
545
G G Et En ; G G Bt Bn .
(19.90)
Gemäß Abb. 19.18a betrachten wir einen Umlauf C um ein beliebiges Teilstück der Grenzfläche. Auf die von C umrandete Fläche wenden wir die 1. Maxwell-Gleichung an.
G G
v³ Edr
C
d G G BdA . dt ³A
(19.59a)
Der Integrationsweg sei so gewählt, dass er sich entlang der Ober- und der Unterseite der G Grenzfläche anschmiegt, so dass die infinitesimal kleinen Wegstücke s senkrecht zur Oberfläche nichts beitragen. Das Flächenintegral auf der rechten Seite ist dann null, und wir erhalten für die Tangentialkomponente der elektrischen Feldstärke
G G G G E1t s1t E2t s2t G Da s1t
0.
(19.91)
G s2t ist, folgt
G E1t
G E2t .
(19.92)
Durch analoge Überlegungen ergibt sich für die Tangentialkomponenten der magnetischen Feldstärke
G B1t G B2t
P2 . P1
(19.93)
Wenden wir uns nun den Normalkomponenten zu. Unsere Ausgangsgleichung ist jetzt der Gaußsche Satz.
G G EdA v³
1
HH 0 V³
A
U dV .
(15.18b)
Abb. 19.18b zeigt einen Teil der Grenzfläche A und ein sie umgebendes Parallelepiped mit dem Volumen V. Wir lassen nun dessen Ausdehnung senkrecht zur Grenzfläche gegen null gehen, so dass V o 0 strebt. Es gilt dann mit V als Flächenladungsdichte
G G
G G
H1H 0 E1n A1ob H 2H 0 E2 n A2unt
G
und mit A1ob
G A2 unt
G
V nˆob A1ob ,
(19.94)
546
19 Elektromagnetische Felder in Materie
G
G
H1H 0 E1n H 2H 0 E2 n V nˆob
(19.95)
Analog ergibt sich für die magnetische Feldstärke
G B1n
G B2 n .
(19.96)
Die Tangentialkomponente der elektrischen Feldstärke und die Normalkomponente der magnetischen Feldstärke einer Welle verhalten sich beim Übergang von einem Medium zum anderen stetig.
Die Normalkomponente der elektrischen Feldstärke und die Tangentialkomponente der magnetischen Feldstärke einer Welle weisen beim Übergang von einem Medium zum anderen einen Sprung auf.
Erfahrungsgemäß wird im Allgemeinen eine schräg auf eine (als ideal glatt vorausgesetzte) Grenzfläche auftreffende Lichtwelle zum Teil reflektiert und zum Teil beim Eintritt in das zweite Medium gebrochen. Wir können nun daran gehen, das Reflexions- und das Brechungsgesetz herzuleiten.
19.2.4.2 Reflexions- und Brechungsgesetz
Auf die ebene Grenzfläche zweier Medien mit den Brechungsindizes n1, n2 falle eine ebene Welle (Abb. 19.19)
r ke
r n Grenzfl
r kr
z y x
r kg
G Ee
(19.97)
Die reflektierte Welle werde beschrieben durch
G Er
GG G E0 r ei (Zr t kr r ) Mr
(19.98)
und die gebrochene Welle durch
G Eg
Abb. 19.19: Zur Ableitung des Reflexions- und Brechungsgesetzes
GG G E0 e ei (Zet ke r ) Me
G i (Z t kG rG ) M E0 g e g g g .
(19.99)
Das Koordinatensystem werde so gewählt, dass die Grenzfläche in der xz-Ebene liegt und G der Wellenvektor ke der einfallenden Welle in
19 Elektromagnetische Felder in Materie
547
G G der xy-Ebene. Als Einfallsebene wird die durch ke und die Normale nGrenzfl auf der Grenz-
fläche definierte Ebene bezeichnet. Auf Grund der Stetigkeit der Tangentialkomponenten der elektrischen Feldstärke gilt
Eet Ert
Egt .
(19.100)
Um die Frequenzverhältnisse der Teilwellen zu untersuchen, betrachten wir am Einfachsten die G G Wellen im Koordinatenursprung, r 0 .
G G E0 et eiZet E0 rt eiZr t
G iZ t E0 gt e g .
(19.101)
Diese Gleichung soll für beliebige Zeiten t gelten. Das ist nur möglich, wenn die Frequenzen gleich sind.
Ze Z r
Zg { Z .
(19.102)
Die Frequenz der einfallenden Welle ändert sich bei der Reflexion und der Transmission nicht. Davon haben wir bereits mehrfach stillschweigend Gebrauch gemacht. Vorgegeben die Einfallsebene der Welle bzw. deren Wellenvektor – in welcher Ebene liegen die Wellenvektoren der reflektierten und der gebrochenen Welle? Zur Klärung setzen wir (19.97), (19.98) und (19.99) in (19.100) ein. Damit die Beziehung für beliebige Ortsvektoren gilt, müssen die Exponenten gleich sein.
GG ke r
GG kr r
G G kg r .
(19.103)
G G Zu den Phasenfaktoren kommen wir weiter unten. Zunächst drücken wir die k und die r durch die Komponenten entlang den kartesischen Koordinatenachsen aus:
G r
xeˆx zeˆz .
(19.104)
Der Wellenvektor der Tangentialkomponente der einfallenden Welle ist
G ke
kex eˆx key eˆy .
(19.105)
G Da die Richtungen von kr , g noch unbestimmt sind, setzen wir zur Wahrung der Allgemeinheit
an
G kr G kg
krx eˆx kry eˆy krz eˆz k gx eˆx k gy eˆy k gz eˆz
(19.106)
548
19 Elektromagnetische Felder in Materie
Setzen wir dies in (19.72) ein, so erhalten wir
krx x krz z
kex x
k gx x k gz z .
(19.107)
Da diese Gleichung für beliebige Werte von x und z gelten muss, ergibt sich
kex
krx
k gx ,
krz
k gz
0.
(19.108)
Die Wellenvektoren von einfallender, reflektierter und gebrochener Welle liegen in einer Ebene.
Wir drücken nun diese Komponenten mit Hilfe der Winkel zwischen den Komponenten des G Wellenvektors und der Normale nGrenzfl aus. Aus Abb. 19.19 lässt sich ablesen
krx
ke sin D , kr sin D c,
k gx
k g sin E .
kex
(19.109)
Unter Berücksichtigung von k
sin D c1Med
sin D c c1Med
Z / c folgt durch Einsetzen von (19.109) in (19.108)
sin E . c2 Med
(19.110)
Es ist also
D Dc .
(19.111)
Einfallswinkel und Reflexionswinkel sind gleich, D
Mit Hilfe von Z / cMed
sin D sin ß
n2 . n1
Dc .
nZ / c erhalten wir das Snelliussche Brechungsgesetz:
(19.112)
19 Elektromagnetische Felder in Materie
549
Zum Schluss fragen wir noch nach den Phasenwinkeln M der reflektierten und der gebrochenen Welle. Sie bestimmen sich aus
E0 et eiMe E0 rt eiMr
E0 gt e
iM g
oder durch Multiplikation mit e
E0 et e E0 rt ei (Mr Me )
(19.113a)
r E 0e
iM e
E0 gt e
i (M g Me )
.
E0ex
E0ey r ke
r kr
(19.113b) Diese Beziehung muss für jedes Me gelten, so dass sich Mr , M g ergeben zu
Mr Mg
Me Mr oder Me Mg
kgy kgx
Me r S (19.114) Me r S .
Es kann also höchstens ein Phasensprung von S auftreten. Wie im folgenden Abschnitt gezeigt wird, findet bei der Reflexion am optisch dichteren Medium ein Phasensprung von S statt. In den anderen Fällen bleibt die Phase erhalten.
r E 0r
E0ry E0rx
r kg
r E 0g
E0gy E0gx
Abb. 19.20: Zur Ableitung der Fresnelschen Formeln
19.2.4.3 Intensitäts- und Polarisationsverhältnisse bei Reflexion und Brechung – Die Fresnelschen Formeln
Zur vollständigen Beschreibung von reflektierter und transmittierter Welle fehlen noch die zugehörigen relativen Intensitäten und die Polarisationseigenschaften. Wir beginnen mit der G Ableitung der relativen Amplituden E0 . Dabei ist es zweckmäßig, diese wieder zu zerlegen G (Abb. 19.20) in eine Komponente E0& ( E0 x , E0 y , 0) parallel zur Einfallsebene und in eine senkrecht zu ihr, E0 A (0, 0, E0 z ) . Letztere ist tangential zur Grenzfläche. Dabei werden die G G G G G G Richtungen von Ee& , Er & , Eg & so festgelegt, dass die jeweiligen Vektoren E& , EA , k ein Rechtssystem bilden. Wir suchen nun nach den Amplitudenverhältnissen
§ E0 r · § E0 g · § E0 r · § E0 g · ¨ ¸ : U A und ¨ ¸ : W A sowie ¨ ¸ : U& und ¨ ¸ © E0 e ¹ A © E0 e ¹ A © E0 e ¹& © E0 e ¹&
:W &
(19.115, 116)
550
19 Elektromagnetische Felder in Materie
Die Größen U ,W heißen Reflexions- bzw. Transmissionskoeffizient.
G Beispielhaft berechnen wir hier U A und W A . Auf Grund der Stetigkeit von Es an der Grenzfläche ergibt sich mit (19.101) und (19.102)
G G E0 e A E0 r A
G E0 g A .
(19.117)
Wir setzen voraus, dass die zu untersuchenden Materialien keinen kollektiven Magnetismus G G G besitzen. Es ist dann nach (18.136) B (k u E ) / Z und es folgt
G G G G (ke u Ee ) x (kr u Er ) x
G G (k g u Eg ) x .
(19.118)
G Für die Komponente EA (0, 0, E0 z ) ergibt sich nach der Definition des Vektorproduktes
key E0 e A kry E0 r A Da kry
k gy E0 g A .
(19.119)
key ist, folgt
E0 e A E0 r A
k gy key
E0 g A : aE0 g A .
(19.120)
Mittels (19.120) lässt sich E0 r A bzw. E0 g A eliminieren und wir erhalten
UA
§ E0 r · ¨ ¸ © E0 e ¹ A
1 a ; 1 a
(19.121a)
WA
§ E0 g · ¨ ¸ © E0 e ¹ A
2 . 1 a
(19.121b)
Es ist zweckmäßig, die Wellenvektorkomponenten durch Einfalls-, Reflexions- und Brechungswinkel auszudrücken (Abb. 19.19).
key ke Damit wird a
cos D ;
k gy kg
k gy n1 ke n2
cos E .
(19.122)
19 Elektromagnetische Felder in Materie
551
n2 cos E . n1 cos D
a
(19.123)
Setzen wir a in (19.121) ein, so erhalten wir als Endergebnis die Fresnelschen Formeln (A. J. Fresnel, 1788-1827):
UA
§ E0 r · ¨ ¸ © E0 e ¹ A
n1 cos D n2 cos E n1 cos D n2 cos E
§ E0 g · ¨ ¸ © E0 e ¹ A
WA
sin(D E ) ; sin(D E )
2n1 cos D n1 cos D n2 cos E 2sin E cos D . sin(D E ) (19.124)
Analog ergibt sich für die Komponenten parallel zur Einfallsebene
U&
§ E0 r · ¨ ¸ © E0 e ¹&
n2 cos D n1 cos E , n2 cos D n1 cos E tg (D E ) ; tg (D E )
W&
§ E0 g · ¨ ¸ © E0 e ¹&
2n1 cos D n2 cos D n1 cos E
.
(19.125)
2sin E cos D . sin(D E ) cos(D E )
Die Fresnelschen Formeln bilden die Grundlage zur Berechnung aller Eigenschaften der reflektierten und transmittierten Wellen. Im Folgenden wollen wir sie benutzen, um die Intensitätsverhältnisse bei der Reflexion und Transmission auszurechnen. Absorption wird dabei zunächst vernachlässigt.
552
19 Elektromagnetische Felder in Materie
19.2.4.4 Reflexions- und Transmissionsvermögen einer Grenzfläche
Unter dem Reflexionsvermögen verstehen wir das Verhältnis der über die Zeit gemittelten Intensitäten der reflektierten und der einfallenden Welle. Die Intensität der einfallenden Welle ist durch den Poynting-Vektor gegeben. Für eine elektromagnetische Welle im Vakuum gilt (18.144).
G S
1
P0
G G ( E u B) .
In einem Medium mit der Dielektrizitätskonstante H und der magnetischen Permeabilität μ ist dieser Ausdruck zu ersetzen durch
G S
1
PP0
G G G G 2 ( E u B) HH 0 cMed ( E u B) .
(19.126)
G Der Betrag von S ist also
G S
GG
HH 0 cMed E02 ei (Zt kr )
(19.127)
und die gemittelte Intensität wird
I
G S
1 c HH 0 E02 . 2 n
(19.128)
Mit diesem „Rüstzeug“ versehen, berechnen wir nun das Reflexionsvermögen (auch als Reflektivität bezeichnet) R und das Transmissionsvermögen T (auch als Transmission bezeichnet). Die auf die Grenzfläche bezogene, auf diese auftreffende Energie pro Fläche und Zeit ist I e cos D und die von dieser reflektierte Intensität I r cos D c . Da D D c , fallen die Kosinusterme heraus und da beide Wellen im gleichen Medium verlaufen, ergibt sich für R
R:
I r cos D c I e cos D
E02r . E02e
(19.129)
Analog ist das Transmissionsvermögen definiert durch
T:
I t cos E . I e cos D
Hierin drücken wir die mittleren Intensitäten entsprechend (19.128) aus.
(19.130)
19 Elektromagnetische Felder in Materie
553
It
1 H 2H 0 c2 Med E02g 2
1 n2 2 E0 g , 2 P0 c
(19.131)
Ie
1 H1H 0 c1Med E02e 2
1 n1 2 E0 e , 2 P0 c
(19.132)
womit wir für T erhalten
T:
n2 cos E E02g n1 cos D E02e
.
(19.133)
Die relative Amplitude ist durch die entsprechende Fresnelsche Formel gegeben. Wir wenden uns nun genauer dem Reflexionsvermögen, (19.129) zu. Quadrieren wir die relative Amplitude E0 r / E0 e , so erhalten wir für die beiden Komponenten senkrecht und parallel zur Einfallsebene 2
§ E0 r · ¨ ¸ © E0 e ¹ A
RA
§ n1 cos D n2 cos E · ¨ ¸ © n1 cos D n2 cos E ¹
2
2
R&
§ E0 r · ¨ ¸ © E0 e ¹&
2
§ n2 cos D n1 cos E · ¨ ¸ © n2 cos D n1 cos E ¹
2
2
§ sin(D E ) · ¨ ¸ ; © sin(D E ) ¹
§ tg (D E ) · ¨ ¸ ; © tg (D E ) ¹ (19.134a,b)
In Abb. 19.21a/b sind Reflexionskoeffizient und Reflexionsvermögen dargestellt. Es wurde
0.2
1.0
0.8
0.8
0.6
0.6
0.4
0.4
R
0.0 -0.2
P
b)
a)
-0.4 -0.6
R
0.2
-0.8 -1.0
1.0
0°
30°
60°
90°
RP
0.0 0°
30°
60°
0.2 0.0 90°
Abb. 19.21: Verlauf des Reflexionskoeffizienten (a) und des Reflexionsvermögens (b) in Abhängigkeit vom Einfallswinkel
554
19 Elektromagnetische Felder in Materie
n2 ! n1 gewählt. Bei der Reflexion am optisch dichteren Medium tritt für U& ein Pha-
sensprung von S auf, wenn D E ! 90q wird (Abb. 19.22). In diesem Fall ist nämlich
U&
§ E0 r · ¨ ¸ ! 0 und U A © E0 e ¹&
§ E0 r · ¨ ¸ 0. © E0 e ¹ A
(19.135)
1.0 0.6 Abb. 19.22: Reflexionskoeffizient U&
0.2
P
0.0 -0.2
B
und UA beim Übergang vom optisch dichteren zum optisch dünneren Medium
Wir wollen nun einige Spezialfälle diskutieren.
19.2.4.5 Der Fall senkrechter Inzidenz
Besonders einfach werden die Ausdrücke für senkrechten Lichteinfall. Aus Symmetriegründen darf in diesem Fall R nicht von der Polarisationsrichtung der Wellen abhängen. Es ergibt sich 2
R (D
§n n · 0) ¨ 2 1 ¸ . © n2 n1 ¹
(19.136)
Das Reflexionsvermögen ist unabhängig davon, ob die Welle am optisch dichteren oder dünneren Medium reflektiert wird.
19.2.4.6 Brewsterwinkel
Aus (19.125) folgt, dass für (D E ) 90q der Nenner gegen unendlich strebt, so dass die Amplitude der Parallelkomponente des reflektierten Lichts null wird. Derjenige Winkel D , bei dem dies eintritt, wird Brewsterwinkel D B (D. Brewster, 1781-1868) genannt. Der Wellenvektor der transmittierten Welle und der der reflektierten Welle bilden in diesem Fall einen
19 Elektromagnetische Felder in Materie
555
rechten Winkel. Das reflektierte Licht ist vollständig in der Ebene senkrecht zur Einfallsebene polarisiert. Dieses Ergebnis lässt sich anschaulich verstehen, wenn wir das Bild der zu Schwingungen angeregten induzierten Dipole zu Hilfe nehmen, das wir schon früher benutzt haben (Abb. 19.23). Wir zerlegen das unter dem Winkel D B einfallende unpolarisierte Licht in einen Anteil, der in der Einfallsebene schwingt und einen, der senkrecht dazu oszilliert. Die von den beiden Teilwellen an der Grenzfläche zu erzwungenen Schwingungen angeregten Atomdipole können in Reflexionsrichtung aber nur die senkrechte Komponente abstrahlen, denn sie sind gerade in Richtung der reflektierten Wellen orientiert. Für den Brewsterwinkel ergibt sich unter Berücksichtigung des Brechungsgesetzes und (D B E ) 90q r r kr
ke
n2 . n1
tgD B
(19.137)
Da keine Energie verloren geht, tritt unter D B einfallendes, parallel zur Einfallsrichtung polarisiertes Licht ohne Reflexionsverluste durch das 2. Medium, d.h. das Transmissionsvermögen ist gleich eins, T& 1 . Solche „Brewsterfenster“ werden vor allem in Verbindung mit Lasern verwendet. Obiger Fall ist ein Spezialfall der allgemeinen Beziehung
T& R&
1
TA RA
1,
B
Ersatzdipole
r kg
Abb. 19.23: Anschauliche Erklärung der Polarisation des unter dem Brewsterwinkel reflektierten Lichtes (19.138)
die ohne Berücksichtigung der Absorption gilt. Überzeugen Sie sich davon!
19.2.4.7 Totalreflexion
Ist der Brechungsindex des 1. Mediums größer als der des 2. Mediums, so gibt es einen kritischen Einfallswinkel, bei dem die Wurzel in
a
n2 cos E n1 cos D
imaginär wird.
n22 n12 sin 2 D n1 cos D
(19.139)
556
19 Elektromagnetische Felder in Materie
Wir tragen diesem Sachverhalt Rechnung, indem wir schreiben
a
iJ { i
n12 sin 2 D n22 n1 cos D
.
(19.140)
Aus früheren Überlegungen wissen wir, dass ein imaginärer Wellenvektor eine Abnahme der Amplitude der eindringenden Welle in dieser Richtung bedeutet. Die elektrische Feldstärke ist
G Eg
G i (Zt kGg rG ) G i (Zt ( kgx x kgy y )) E0 g e E0 g e G i (Zt kgx x ) J key y . E0 g e e
(19.141)
Das ist eine inhomogene Welle, die sich längs der Grenzfläche in x-Richtung ausbreitet und deren Amplitude senkrecht zur Fortpflanzungsrichtung ein Stückchen G in das optisch dünnere Medium hineinreicht. Wir sprechen von einer quergedämpften Welle. Die Eindringtiefe G ist gegeben durch
G
OVak
1 k yJ
.
2 1
2S n sin 2 D n22
(19.142)
Die Intensität ist
I g Eog2 e
2J key y
Eog2 e2 y / G ,
(19.143)
Das Reflexionsvermögen ist in diesem Fall 2
RA
§ E0 r · ¨ ¸ © E0 e ¹A
R&
§ E0 r · ¨ ¸ © E0 e ¹&
2
§ 1 iJ · ¨ ¸ © 1 iJ ¹
2
1 J 2 1 J 2
§ 1 i (n1 / n2 ) 2 J · ¨ 2 ¸ © 1 i (n1 / n2 ) J ¹
2
1;
(19.144a)
1 (n1 / n2 ) 2 J
2
1 (n1 / n2 ) 2 J
2
1.
(19.144b)
Das Licht wird also, obwohl es ein wenig in das 2. Medium eindringt, vollständig reflektiert. Der Grenzwinkel der Totalreflexion ergibt sich aus (19.139) zu
sin DT
n2 . n1
(19.145)
19 Elektromagnetische Felder in Materie
557
Der Eintritt der Totalreflexion lässt sich gut beobachten, wenn ein mit Wasser gefüllter Glastrog von unten mit Licht bestrahlt wird (Abb. 19.24). Bei kleinen Eintrittswinkeln des Lichtstrahls in das Wasser tritt ein Teil des Lichtbündels an der oberen Grenzfläche Wasser ( n 1,33 )-Luft ( n2 1 ) wieder aus. Erreicht der Einfallswinkel D DT 48,8q , so wird das Lichtbündel totalreflektiert. Die Eindringtiefe in Luft Abb. 19.24: Anordnung zur beträgt bei D 60q G 166 nm . Demonstration der TotalreDer gleiche Versuch lässt sich mit Mikrowellen flexion b ( O | 3 c m ) durchführen. Diese werden an der hinteren Fläche eines 45°-Prismas aus Paraffin ( n 1,5 ) totalreflektiert. Wird an die Rückseite ein zweites Prisma gesetzt, so dass die Grenzfläche „verschwindet“, so tritt die Strahlung in das Prisma ein (Abb. 19.25). Zwischen diesen beiden Grenzfällen gibt es einen kontinuierlichen Übergang, der sich wegen der großen Wellenlänge der Mikrowellen gut beobachten lässt. Schieben wir nämlich das zweite Prisma langsam an das erste heran, so beobachten wir bereits einen Energieübertritt, wenn der Abstand noch von der Größe der Wellenlänge ist.
Abb. 19.25: Frustrierte Totalreflexion: Mikrowellenstrahlung wird von einem aus Paraffin gefertigten Prisma total reflektiert. Wird ihm ein zweites Prisma auf einige Wellenlängen genähert, so zeigt der Detektor hinter diesem eine ansteigende Intensität
Dieses Phänomen wird frustrierte (behinderte) Totalreflexion genannt. Es ist das klassische Analogon des quantenmechanischen Tunneleffekts. Mit Hilfe der Totalreflexion lassen sich Lichtbündel umlenken, am einfachsten mittels eines Prismas (Abb. 19.26). Je nach Lichteinfall wird mit einem 90°-Prisma eine Umlenkung um 90° oder 180° erzielt. Letzteres ist das Prinzip eines Rückstrahlers oder Retroreflektors („Katzenauge“). Eine besonders wichtige Anwendung erfährt die Totalreflexion bei Lichtleiterfasern (Abb. 19.27). Diese bestehen im einfachsten Fall aus einem Kern aus Quarzglas mit dem Brechungsindex n1, der von einem Mantel mit optisch dünnerem Material umgeben ist. Liegen die Kerndurchmesser im Bereich einiger Wellenlängen, so werden mehrere Moden angeregt, die analog (18.180) unterschiedliche Phasengeschwindigkeit besitzen.
558
19 Elektromagnetische Felder in Materie
5
1
b)
a)
1 2 3
1
3 2 1
Abb. 19.26: Umlenkung elektromagnetischer Strahlung mit Hilfe von Prismen
5
Dies führt zu einer Verbreiterung eines Lichtpulses. Der Effekt kann durch Verwendung von Ein-Moden-Lichtleitern vermieden werden.
n1 n2
Abb. 19.27: Fortpflanzung einer Lichtwelle in einem Lichtleiter durch Totalreflexion
Die Abhängigkeit des Winkels der Totalreflexion vom Brechungsindex wird in einem Refraktometer zur Messung von n ausgenutzt. Abb. 19.28 zeigt dazu das Prinzip des Abbeschen Refraktometers (E. Abbe, 1840-1905).
Prüfflüssigkeit Abb. 19.28: Prinzip des Abbeschen Refraktometers
19 Elektromagnetische Felder in Materie
559
19.2.5 Reflexion an Metalloberflächen Metalle sind erfahrungsgemäß im sichtbaren Frequenzbereich und bei kleineren Frequenzen undurchsichtig und reflektieren Licht stark. Das ist in Übereinstimmung mit dem Modell des freien Elektronengases (Kap. 19.4.3), nach dem ein Metall unterhalb der Plasmafrequenz für elektromagnetische Strahlung undurchsichtig ist. Jetzt fragen wir, wie wir das Reflexionsvermögen einer Metalloberfläche modellmäßig beschreiben können. Dafür bieten sich die Fresnelschen Formeln an. Um sie anwenden zu können, muss in ihnen zuvor der reelle Brechungsindex durch den komplexen Brechungsindex ersetzt werden.
n nc o nc incc nc iN .
(19.146)
Für senkrechte Inzidenz ergibt sich mit (19. 134)
§n n · R ¨ 1 2¸ © n1 n2 ¹
2
§ n1c ( n2c iN ) · ¨ ¸ © n1c (n2c iN ) ¹
2
(n1c n2c ) 2 2i (n1c n2c )N N 2 (n1c n2c ) 2 2i ( n1c n2c )N N 2
(19.147)
Je größer N wird, umso mehr nähert sich der Bruch dem Wert „1“ an. Im Fall n1c 1 (Luft) und n2 iN (Metall) wird R 1 . Starke Absorption geht also mit starker Reflexion einher. Dabei bedeutet „starke Absorption“ geringe Eindringtiefe der Strahlung, längs derer diese schwach absorbiert wird! Eben dieses Verhalten ist für Metalle charakteristisch. – Bei wellenlängenabhängiger Absorption ist die Farbe des reflektierten Lichts komplementär zu der des durchgehenden Lichts. Z.B. erscheint ein dünnes („goldgelbes“) Goldblättchen in der Durchsicht blau.
19.2.6 Ausbreitung elektromagnetischer Wellen in anisotropen Medien In den vorangegangenen Kapiteln haben wir vorausgesetzt, dass die durchstrahlte Materie im Mittel isotrop war. Das gilt auch für kubische Kristalle, in denen jedes Atom von sechs äquivalenten nächsten Nachbarn umgeben ist. Die drei zueinander senkrecht stehenden kubischen Achsen sind also gleichwertig. Viele in der Natur vorkommende Kristalle besitzen aber eine niedrigere Symmetrie. Das bedeutet, dass auf ein gebundenes äußeres Elektron in unterschiedlichen Richtungen z.T. unterschiedliche elektrische Kräfte wirken. Die PolarisierG barkeit ist demnach jetzt richtungsabhängig. Infolgedessen ist die Polarisation P im AllgeG meinen nicht mehr parallel zum elektrischen Feld E . Es gibt jedoch mindestens einen Satz G G dreier zueinander senkrechter Richtungen, längs derer E und P parallel sind. Sie werden als Hauptachsen bezeichnet. Werden die Koordinatenachsen x, y, z parallel zu diesen HauptG achsen gelegt, so ergeben sich je nach Größe von P in diesen Richtungen unterschiedliche Dielektrizitätskonstanten bzw. Brechungsindizes. Letztere heißen Hauptbrechungsindizes nx , n y , nz .
560
19 Elektromagnetische Felder in Materie
19.2.6.1 Der dielektrische Tensor
Der gerade formulierte Sachverhalt folgt aus den Maxwell-Gleichungen. Für Dielektrika ( P | 1 ) sind sie durch (19.160) mit j U 0 gegeben. Wir schreiben sie in der allgemeinen Form
G rot E
G wB ; wt
G di v D 0;
G rot B
G wD P0 ; wt
G di v B 0.
(19.148)
Darin haben wir zur Abkürzung die in Kap. 15.7.3 eingeführte dielektrische Verschiebung benutzt,
G G G D : H0E P . Für isotrope Medien konnten wir schreiben
G G P H 0 Fe E ,
(15.6.1)
G G In anisotropen Medien sind E und P nicht mehr parallel zueinander, wir wollen aber weiterhin einen linearen Zusammenhang zwischen den beiden Größen annehmen. Das G G bedeutet, dass P jetzt eine lineare Vektorfunktion von E wird und F e bzw. H Tensoren:
G G D HH 0 E ,
(19.149)
wobei H der Dielektrizitätstensor ist.
§ H xx H xy H xz · ¨ ¸ H ¨ H yx H yy H yz ¸ . ¨ ¸ © H zx H zy H zz ¹
(19.150)
G in Komponenten-Schreibweise wird D
Dx
H 0 (H xx Ex H xy E y H xz Ez ),
Dy
H 0 (H yx Ex H yy E y H yz Ez ),
Dz
H 0 (H zx Ex H zy E y H zz Ez ) .
(19.151)
19 Elektromagnetische Felder in Materie
561
Die Zahl der Tensorkomponenten kann noch reduziert werden: Dazu betrachten wir den Energiesatz. Für die elektrische bzw. magnetische Energiedichte soll wie bisher gelten
w el
1 GG E D; 2
w mag
1 2 P0
B2 .
(15.7.4/18.3.1)
G wobei D durch (19.151) gegeben ist. Für isotrope Medien ist w el mit der elektrischen
Energiedichte in (15.7.4) identisch. Die Energiebilanz wird jetzt
G G G G 1 w ° G G 1 2 °½ ( ) B rot E E rot B B ) dV ¾ ®³ ( E D ³ P0 V P0 2 wt °¯V °¿ G G G 1 G wD G wE 2 G wB ³ (E D B )dV . 2V wt wt P0 wt 1
(19.152)
Der dritte Term unter dem Integral ist die zeitliche Ableitung der magnetischen Energiedichte w mag (1/ 2 P0 ) B 2 . Damit sich auch die zeitliche Ableitung der elektrischen Energiedichte ergibt, müssen der erste und der zweite Term gleich sein.
G G G wD G wE E D wt wt
0.
(19.153)
Das führt auf die Bedingungsgleichung
(H yx H xy ) Ex E y (H zx H xz ) Ex E z (H xy H yx ) E y E x (H zy H yz ) E y E z (H xz H zx ) Ez E x (H yz H zy ) Ez E y
(19.154)
0
G Da diese Beziehung für jedes E gelten muss, folgt
H xy
H yx , H yz
H zy , H zx
H xz
(19.155)
Der dielektrische Tensor H ist also symmetrisch. Durch eine geeignete Transformation des Koordinatensystems (Drehung des Koordinatensystems) lässt er sich immer auf Diagonalform bringen. Das neue Koordinatensystem heißt Hauptachsensystem, die Diagonalterme werden als Hauptdielektrizitätskonstanten bezeichnet.
562
19 Elektromagnetische Felder in Materie
§ H1 0 0 · ¨ ¸ ¨ 0 H2 0¸ . ¨0 0 H ¸ 3 ¹ ©
HHa
(19.156)
Im Folgenden legen wir als Koordinatensystem das Hauptachsensystem (x, y, z) zu Grunde.
19.2.6.2 Ebene Wellen im Medium
Wir wollen jetzt die Ausbreitung einer ebenen Welle im Kristall untersuchen. Der elektrische Feldvektor ist also
G E
GG G E0 ei (Zt k r )
G
G iZ ( t cr nˆ ) Med E0 e .
(19.157)
G k bzw. nˆ gibt die Richtung der Phasenfläche der Welle an, cMed deren Geschwindigkeit im Medium. Mit diesem Ansatz folgt aus den beiden unteren Maxwell-Gleichungen (19.154)
G di v D 0 und
G G Dk
0
G di v B 0 , G G und B k 0 .
(19.158)
G G G Sowohl D als auch B stehen senkrecht auf dem Wellenvektor k . Wir wenden nun die beiden anderen Maxwell-Gleichungen an,
G rot E
G wB ; wt
G rot B
G wD P0 ; wt
(19.159)
Wir betrachten zuerst die 1. Gleichung. Es gilt
eˆx G rot E
eˆy
eˆz
w w w . wx wy wz Ex E y Ez eˆx i (k y Ez k z E y ) eˆy i ( k z Ex k x Ez ) eˆz i( k x E y k y Ex ) G G iE u k
(19.160)
19 Elektromagnetische Felder in Materie G Bilden wir wB / wt
G B G wobei k0
G iZ B , so wird mit Z / k
563 cMed
1 G G E u k0 , cMed
(19.161)
G G k / k ist.
Analog folgt aus der zweiten Gl. (19.165)
G D
G G 1 B u k0 . P0 cMed
(19.162)
Für die Energieströmung gilt weiterhin
G S
G sˆ0 S
G
G
H 0 c 2 ( E u B) .
(19.163)
G G G G G G Aus (19.160) und (19.162) ergibt sich, dass B A E und B A D , aus (19.163), dass E A S , sˆ0 . Insgesamt erhalten wir also,
G G G G G B A E , B A sˆ0 sowie B A D
(19.164)
G G G Die Größen kˆ0 , E , D und sˆ0 liegen mithin in einer Ebene. B steht auf dieser Ebene senkrecht.
r D
r E
sˆ 0
r S
kˆ 0
r B
r D r E
sˆ 0 kˆ 0
G G G Abb. 19.29/30: Veranschaulichung von Gl. (19.162) und (19163). Die Vektorgrößen k 0 , D, B G G G sowie s0 , E, B bilden ein rechtwinkliges Dreibein
564
19 Elektromagnetische Felder in Materie
G G G G Die Vektorgrößen kˆ0 , D, B und sˆ0 , E , B bilden jeweils ein rechtwinkliges Dreibein. G und sˆ0 sind nicht mehr parallel zueinander, sondern schließen, wie auch D und einen Winkel - miteinander ein (Abb. 19.29).
kˆ0 G E,
Wir haben demnach zwei Möglichkeiten, ebene Wellen im anisotropen Medium zu G G beschreiben. Das Vektortripel kˆ0 , D, B charakterisiert eine Welle durch die Richtung kˆ0 G G ihrer Phasenebene; in ihr liegen die zueinander senkrechten Größen D und B . Das Tripel G G sˆ0 , E, B beschreibt die in Richtung sˆ0 gerichtete Energieströmung der Welle; per DefinitioG G nem liegen die zueinander senkrechten Vektorgrößen E und B senkrecht zu sˆ0 . G G In beiden Fällen lässt sich der Zusammenhang zwischen E und D durch ein Ellipsoid im Hauptachsensystem veranschaulichen. Wir gehen dazu vom Ausdruck für die Energiedichte aus. Zur Darstellung gibt es zwei Möglichkeiten: G 1) Wir tragen von einem Punkt aus die Vektoren E als gerichtete Strecken ab, für die GG H 01 E D const ist. G 2) Wir tragen von einem Punkt aus die Vektoren D als gerichtete Strecken ab, für die GG E D const ist. G G Im ersten Fall erhalten wir, wenn der Endpunkt von E durch den Vektor r ( x, y, z ) beschrieben wird, bei geeigneter Normierung im Hauptachsensystem die Fläche
H1 x 2 H 2 y 2 H 3 z 2
H0 .
(19.165)
Dieses Ellipsoid heißt Fresnelsches oder Strahlen-Ellipsoid. Es hat die Achsen 1/ H1 , 1/ H 2 , 1/ H 3 . Bewegen wir uns auf dem Ellipsoid vom Punkt (x, y, z) um ein Stück (dx, dy, dz) weiter, so gilt
H1 xdx H 2 ydy H 3 zdz 0 .
(19.166)
G D.h. die Vektorgröße mit den Komponenten (H1 x H 2 y H 3 z ), also D , steht auf dem Ellipsoid im Punkt (x, y, z) senkrecht. G Die Vektorgröße D steht senkrecht auf dem Strahlenellipsoid im Endpunkt des G Durchmessers der Richtung E . Sein Betrag ergibt sich (nach den Methoden der G Tensorrechnung) als reziproker Wert der Projektion von r auf die Normalenrichtung.
19 Elektromagnetische Felder in Materie
565
G Im 2. Fall folgt im Hauptachsensystem, da E
x2
H1
y2
H2
z2
H3
G
H 1 D ,
1.
(19.167a)
Die Achsen dieses Ellipsoids sind also durch die Wurzeln aus den Hauptdielektrizitätskonstanten gegeben. Ersetzen wie Letztere durch die Hauptbrechungsindizes, so ergibt sich
x2 y 2 z 2 n12 n22 n32
1.
(19.167b)
Es heißt daher Index- oder auch Normalen-Ellipsoid. Durch Einführung der zugehörigen Lichtgeschwindigkeiten im Medium, cMed , können wir auch schreiben 2 2 2 2 2 2 cMed , x x cMed , y y cMed , z z
c2 .
(19.167c)
G Die Vektorgröße mit den Komponenten x / H1 , y / H 2 , z / H 3 , also E , steht senkrecht auf dem Normalen-Ellipsoid im Endpunkt (x, y, z) des Durchmessers der G Richtung D .
Wir kehren jetzt wieder zu den Maxwellgleichungen, Gln. (19.154), zurück und fragen nach Geschwindigkeit und Polarisation der ebenen Wellen. Wir stellen zunächst die beiden Aus G G gangsgleichungen zusammen, zunächst für das Vektortripel kˆ0 , D, B . Unter der Benutzung von
G G G GG G GG G A u ( B u C ) ( AC ) B ( AB)C folgt aus (19.161) und (19.162)
G D
G 1 E u kˆ0 u kˆ0 2 P0 cMed
G G 1 E E kˆ0 kˆ0 . 2 P0 cMed
^
G G c2 G D H 0 2 E E kˆ0 kˆ0 . cMed
^
`
`
(19.168)
(19.169)
Der Ausdruck in der geschweiften Klammer entspricht der senkrecht zu kˆ0 stehenden KompoG nente von E (Abb. 19.30).
566
19 Elektromagnetische Felder in Materie
G Eine entsprechende Gleichung ergibt sich für das elektrische Feld E : Nach (19.164) steht G G G E in der sˆ0 , D -Ebene senkrecht auf kˆ0 . Folglich hat E die Richtung der Vektorgröße G G D D kˆ0 kˆ0 . Da cos - nach Abb. 19.30 gegeben ist durch
^
`
G G E E kˆ0 kˆ0 G E
cos -
G G D D sˆ0 sˆ0 G D
(19.170a)
folgt mit (19.163)
G E
2 G G cMed D D sˆ0 sˆ0 ; H 0 c 2 cos 2 -
^
`
(19.171)
- ist gleichzeitig der Winkel zwischen der Richtung der Energieströmung und der der Wellennormalen,
kˆ0 sˆ0
cos G E
cMed / cMed , SG .
(19.170b)
2 G G G cMed ,S D D sˆ0 sˆ0 . H 0c2
^
`
(19.172)
Die Geschwindigkeit cMed , SG heißt auch Strahlgeschwindigkeit.
19.2.6.3 Wellen in optisch einachsigen Kristallen
Wir spezialisieren .nun die abgeleiteten Ergebnisse auf den einfachsten Fall eines anisotropen Kristalls, den einachsigen Kristall (Tab. 19.1) Vertreter sind z. B. Quarz oder Kalkspat.
Substanz
no
nao
TiO2 (Rutil) K2SO4 MgF2 SiO2 (Quarz)
2,6131 1,4550 1,3777 1,5442
2,9089 1,5153 1,3895 1,5533
(+) (+) (+) (+)
CaCO3 (Kalkspat) Al2O3 (Saphir) Turmalin
1,6584 1,7682 1,6425
1,4854 1,6598 1,4864
(-) (-) (-)
Tab. 19.1: Brechungsindizes einiger einachsiger Kristalle, O = 589 nm, Na-DLicht
19 Elektromagnetische Felder in Materie
567
Bei einachsigen Kristallen ist eine Richtung durch die Anordnung seiner Bausteine besonders ausgezeichnet (Abb. 19.31). In einer zu dieser Richtung senkrechten Ebene finden sich drei, vier oder sechs gleichberechtigte Richtungen. Die ausgezeichnete Richtung hat dann drei-, vier- oder sechszählige Symmetrie. Bei geeigneter Wahl der Achsen ist H x H y z H z bzw. vx
v y z v z . Ist H z ! H x
Fall, H z H x
H y , so nennen wir den Kristall optisch positiv, im umgekehrten
H y , optisch negativ einachsig.
Sechszählige optische Achse
z y x
Abb. 19.31: Schematische Darstellung eines einachsigen Kristalls mit Symmetrieachse G Zur Ermittlung der Polarisationsrichtungen der E -Felder der Lichtwellen und der Lichtgeschwindigkeiten für eine gegebene Strahlrichtung sˆ0 haben wir von dem Vektortripel G G G sˆ0 , E , B auszugehen. Wir wissen aus den Verknüpfungen (19.164), dass D in der Ebene liegt, G die durch die Strahlrichtung sˆ0 und dem zu ihr senkrechten elektrischen Feldvektor E gebildet wird (Abb. 19.29). G G Wegen der Rotationssymmetrie des H -Tensors liegt D gleichzeitig in der zˆ, E -Ebene. Das G G ist nur möglich, wenn D entweder die Richtung von E hat oder wenn die beiden Ebenen G zusammenfallen (Abb. 19.32). Im ersten Fall muss E senkrecht auf zˆ und damit senkrecht G auf der sˆ0 , zˆ -Ebene stehen, im zweiten Fall liegt E in der sˆ0 , zˆ -Ebene. Wegen der Rotationssymmetrie fällt die sˆ , zˆ -Ebene mit der aus der Wellennormale kˆ und der z-Achse ge0
0
bildeten Ebene zusammen. Eine aus der Strahlrichtung sˆ0 bzw. der Wellennormale kˆ0 und der dielektrischen HauptG achse (hier die z-Achse) aufgespannte Ebene wird als Hauptschnitt bezeichnet. Das E -Feld der Welle schwingt, also entweder senkrecht zum Hauptschnitt, sˆ0 und kˆ0 sind gleichgerichtet, oder im Hauptschnitt, sˆ und kˆ haben unterschiedliche Richtungen. Im ersten Fall 0
0
sprechen wir vom ordentlichen Strahl, im zweiten Fall vom außerordentlichen Strahl. G G Die Geschwindigkeit des ordentlichen Strahls berechnet sich aus (19.172). Da E & D ist, folgt
568
19 Elektromagnetische Felder in Materie
G c2 G D H0 2 E. cMed , S
z
sˆ 0
(19.173)
G Da E in der x,y-Ebene liegt, gilt
Abb. 19.32: Zur Ermittlung der Eigenschaften eines einachsigen Kristalls
r E
cMed , S
G c2 G D H0 2 E. cMed , x
(19.174)
Die Geschwindigkeit des ordentlichen Strahls ist unabhängig von der Strahlrichtung, (19.175)
cMed , x .
Die Geschwindigkeit des außerordentlichen Strahls ergibt sich ebenfalls mittels (19.172). Lassen wir zunächst den Hauptschnitt mit der xz-Ebene zusammenfallen, so wird
Dx
G c2 s0, x ( sˆ0 D ) H 0 2 Ex , Dz cMed
G c2 s0, z ( sˆ0 D) H 0 2 E z , Dy cMed
Ey
0. (19.176)
Das dielektrische Verhalten ist gegeben durch
Dx
H0
c2 2 Med , x
c
Ex , Dz
H0
c2 2 Med , z
c
Ez .
(19.177)
G Gleichsetzen der jeweiligen Komponenten von D liefert
Ex
2 cMed ,S 2
2 s0, x cMed ,x 2 Med , S
H0 c c
c
2 Med , x
G sˆ0 D , E z
2 cMed ,S 2
2 s0, z cMed ,z 2 Med , S
H0 c c
2 Med , z
c
G sˆ0 D .
(19.178)
Multiplikation der Komponenten mit s0, x bzw. s0 z und Addition führt unter Berücksichtigung G von E sˆ0 0 zu 2 s0,2 x cMed ,x 2 2 cMed , S cMed , x
2 s0,2 z cMed ,z 2 2 cMed , S cMed , z
0.
(19.179a)
19 Elektromagnetische Felder in Materie
569
Daraus folgt für cmed , S
1
s0,2 x
2 cMed ,S
2 cMed ,z
s0,2 z 2 cMed ,x
.
(19.179b)
Lassen wir die Einschränkung fallen, dass der Hauptschnitt mit der xz-Ebene zusammenfällt, ergibt sich
1
s0,2 x s0,2 y
2 G cMed ,S
2 cMed ,z
s0,2 z 2 cMed ,x
.
(19.180)
Zur Veranschaulichung können wir cMed , SG in der Strahlrichtung sˆ abtragen. Die dabei entstehende zweiblättrige Fläche nennen wir die Strahlenfläche. Dem ordentlichen Strahl entspricht eine Kugel, dem außerordentlichen Strahl ein Ellipsoid. Auf der z-Achse berühren sich die beiden Blätter (Abb. 19.33a). Zur Veranschaulichung lässt sich auch das Fresnelsche oder Strahlenellipsoid, Gl. (19.165), heranziehen. Für den einachsigen Kristall vereinfacht sie sich zu
x2 y 2 z2 2 2 cMed cMed ,x ,z
1 . c2
(19.181a)
Wir schneiden das Ellipsoid mit einer zu sˆ senkrechten Ebene, die durch seinen Mittelpunkt verläuft.
s0, x x s0, y y s0, z z
0.
(19.181b)
Die Hauptachsen der Schnittellipse geben die zur Strahlrichtung möglichen beiden Richtungen G von E an. Die Länge der senkrecht zum Hauptschnitt stehenden Halbachse ist cMed , x / c , also cMed , S / c des ordentlichen Strahls. Zur Vereinfachung liege die Strahlrichtung in der xz- Ebene. Für die gemeinsamen Koordinaten x, z des außerordentlichen Strahls und der Schnittellipse müssen dann gleichzeitig die aus obigen Gleichungen (19.181) folgenden Beziehungen erfüllt sein.
x2 2 Med , x
c
z2
1 , c2
2 Med , z
c
s0, x x s0, z z
0
(19.182)
(19.183)
570
19 Elektromagnetische Felder in Materie
cMed,z a)
cMed,x
b)
cMed,x
cMed,z
cMed,z cMed,x
cMed,z cMed,z cMed,x
cMed,z
Optische Achse
Abb. 19.33a: Geschwindigkeiten und Polarisationsrichtungen des o. und ao. Strahls für einen optisch positiven (links) und optisch negativen (rechts) einachsigen Kristall o Die erste Gleichung können wir schreiben
° x 2 z 2 ½° ( s0,2 x s0,2 z ) ® 2 2 ¾ °¯ cMed , x cMed , z °¿
1 , c2
(19.182a)
denn der linke Klammerausdruck hat den Wert 1. Aus der zweiten Gleichung folgt
s0,2 x x 2
s0,2 z z 2 ,
(19.183a)
Ersetzen wir mittels dieser Beziehung x2 bzw. z2 in (19.182a), so erhalten wir
° s0,2 x s0,2 z ½° (x z ) ® 2 2 ¾ °¯ cMed , z cMed , x °¿ 2
2
1 . c2
(19.184)
Für den zweiten Klammerausdruck setzen wir (19.181) ein. Das ergibt
( x2 z 2 )
2 cMed ,S
c2
(19.185)
Die Länge dieser Halbachse ist gleich der Strahlgeschwindigkeit des außerordentlichen Strahls. Wir können also zusammenfassen:
19 Elektromagnetische Felder in Materie
571
Wird das Strahlenellipsoid mit einer Ebene senkrecht zur Strahlrichtung und durch seinen Mittelpunkt geschnitten, so geben die Richtungen der Halbachsen der Schnittellipse die G Schwingungsrichtungen von E und ihre Länge die zugehörigen Brechungsindizes an (Abb. 19.33b). G G Ganz analog lässt sich das Vektortripel kˆ 0 ,D,B behandeln. Entsprechend der AusgangsG G gleichung (19.169) sind E und D bei der Argumentation miteinander zu vertauschen. Für die Normalengeschwindigy keit, also die Geschwindigkeit der Phax senfläche der Welle, folgt
k0,2 x k0,2 y 2 2 cMed cMed ,x
O
k0,2 z 2 2 cMed cMed ,z
0;
n2
A nao
sˆ 0
n2 C
n1
z
(19.186a) 2 cMed
Optische Achse
2 2 2 (k0,2 x k0,2 y ) cMed , z k0, z cMed , x
(19.186b)
19.33b: Fresnelsches oder Strahlenellipsoid
Für die ordentliche Welle ist die Normalengeschwindigkeit
cMed
cMed , x .
(19.187)
Im allgemeinen Fall verschiedener Hauptbrechungsindizes, nD z n ß z nJ , existieren zu jeder Strahlrichtung sˆ0 zwei zueinander senkrecht polarisierte Wellen mit unterschiedlichen Strahlgeschwindigkeiten. Analoges gilt für die Richtung der Wellennormalen. In Erweiterung der Situation in einachsigen Kristallen gibt es jetzt zwei Richtungen, bei denen die beiden Normalen-Geschwindigkeiten zusammenfallen. Diese werden sinngemäß als optische Achsen bezeichnet. Derartige Kristalle heißen deshalb optisch zweiachsig. Tab. 19.2 listet einige Vertreter auf.
Substanz BaSO4 CaSO4 u 2H2O KH2Al3(SO4)2 Al2FSiO3
(Baryt) (Gips) (Glimmer) (Topas)
nD
nß
nJ
1,6480 1,5208 1,5601 1,6190
1,6810 1,5228 1,5936 1,6200
1,5309 1,5298 1,5977 1,6270
Tabelle 19.2. Brechungsindizes einiger zweiachsiger Kristalle (O = 589 nm)
572
19 Elektromagnetische Felder in Materie
19.2.6.4 Doppelbrechung
Die besprochene Aufspaltung einer unpolarisierten Welle in eine ordentliche und eine außerordentliche Welle wird Doppelbrechung genannt. Wir wollen uns die erarbeiteten Zusammenhänge mit Hilfe des Huyghensschen Prinzips veranschaulichen. Die ordentliche Welle befolgt das Snelliussche Brechungsgesetz, die außerordentliche dagegen nicht. Die Teilwellen laufen im Allgemeinen in unterschiedlichen Richtungen durch den Kristall. Nur wenn die Lichtwelle in Richtung der optischen Achse eingestrahlt wird, verhält sie sich „normal“, d.h. sie läuft mit einheitlicher Geschwindigkeit durch den Kristall. Breitet sich die Welle senkrecht zur optischen Achse aus, tritt ebenfalls keine Aufspaltung auf, aber ordentlicher und außerordentlicher Strahl haben unterschiedliche Geschwindigkeiten, so dass die resultierende Welle elliptisch polarisiert ist. Wir hatten oben herausgefunden, dass die Wellenflächen der ordentlichen Welle eine Kugelfläche darstellt, während die der außerordentlichen Welle ein Ellipsoid ist. In der Sprache des Huygensschen Prinzips (s. Kap. 20) gehen von jedem Punkt einer Strahlenfläche Elementarwellen aus, deren Ausbreitungsrichtung durch den Strahlvektor sˆ0 festgelegt ist und deren Tangentialebene die beobachtete Phasenfläche bildet; ihre Richtung wird durch den Vektor kˆ0 charakterisiert. (Abb. 19.34). Bei der ordentlichen Welle fallen Strahlen- und Phasen-
Abb. 19.34: Verlauf des o. und ao. Strahls in einem einachsigen Kristall bei senkrechter Inzidenz, konstruiert nach dem Huygensschen Prinzip. Die Polarisationsrichtungen der beiden Strahlen (Wellen) liegen senkrecht zueinander Wunsch
flächen zusammen. In Abb. 19.34 ist der relativ leicht zu überblickende Fall dargestellt, dass das Lichtbündel unter einem gewissen Winkel zur optischen Achse senkrecht auf den Kristall auftrifft. Die optische Achse möge in der Zeichenebene liegen. Die Ausbreitungsrichtung der kugelförmigen Strahlenfläche, und damit des ordentlichen Strahls, ist, wie gesagt, durch das Snelliussche Brechungsgesetz bestimmt. Lage und Ausbreitung der ellipsoidförmigen Strahlungsfläche ist durch die Richtung der optischen Achse bzw. durch die Hauptlichtgeschwindigkeiten bestimmt. Das Brechungsgesetz versagt, weil es sich entsprechend der Definition des Brechungsindexes auf die Geschwindigkeit der Wellennormale kˆ0 bezieht. Als solches bleibt es auch für anisotrope Medien gültig
19 Elektromagnetische Felder in Materie
573
19.2.7 Erzeugung und Nachweis polarisierten Lichtes Die meisten zu Beleuchtungszwecken dienenden Lampen senden unpolarisiertes Licht aus. In Glühlampen z.B. werden Atom-Elektronen durch Stöße in einen angeregten Zustand versetzt. Beim Übergang in den Grundzustand geben sie ihre Energie in Form von Licht wieder ab. Dabei ist keine Richtung vor einer anderen ausgezeichnet, das Licht ist unpolarisiert. Viele Untersuchungen erfordern aber polarisiertes Licht. Weiter unten werden wir gleich einige Messmethoden kennen lernen. Auf der anderen Seite stehen wir häufig vor der Aufgabe, Licht bezüglich seiner Polarisation analysieren zu müssen, nicht nur im sichtbaren Spektralbereich, sondern auch bei höheren bzw. kleineren Frequenzen. Wir benötigen also Polarisatoren und Analysatoren, die natürlich auf den gleichen Prinzipien beruhen. Hier wollen wir uns auf sichtbares Licht beschränken. Licht kann linear, zirkular oder elliptisch polarisiert sein. Linear polarisiertes Licht ist uns bereits begegnet. Es liegt dann vor, wenn der elektrische Feldvektor in einer bestimmten Richtung senkrecht zur Ausbreitungsrichtung schwingt. Als solche möge die z-Richtung H fungieren. Der E -Vektor muss dann in der xy-Ebene liegen. Die Welle hat also die Form (Abb. 19.35a)
G E
G E0 ei (Zt kz ) ;
G E0
E0, x eˆx E0, y eˆy ,
(19.188,189)
Zirkular polarisierte Wellen entstehen, wenn x- und y-Komponente der Feldamplitude gleich groß sind, aber eine Phasenverschiebung von 90° aufweisen (Abb. 19.35b). Es gilt also z.B.
Ex
E0 ei (Zt kz ) ,
Ey
E0 ei (Zt kz S / 2) .
(19.190)
Die Projektion des Vektors
G E
( E0 eˆx E0 eiS / 2 eˆy ) ei (Zt kz ) E0 (eˆx ieˆy ) ei (Zt kz )
(19.191)
G auf die xy-Ebene beschreibt einen Kreis, der E -Vektor selbst also eine Kreisspirale um die z-Richtung. G Sind die Amplituden der beiden Teilwellen unterschiedlich, so beschreibt der E -Vektor eine elliptische Spirale. Eine solche entsteht auch, wenn bei gleichen Amplituden die Phasenverschiebung ungleich 90° ist. Die Wellen heißen in diesen Fällen elliptisch polarisiert.
574
19 Elektromagnetische Felder in Materie
19.2.7.1 Erzeugung linear polarisierten Lichtes
Wenn unpolarisiertes Licht unter dem Brewsterwinkel auf ein Dielektrikum fällt, z.B. auf eine Glasplatte, ist das reflektierte Licht vollständig linear polarisiert (Kap. 19.2.4), das transmittierte Licht dagegen nur zu einem geringen Teil. Aus den Fresnelschen Formeln ergibt sich mit R T 1 , dass die Intensität der senkrecht zur Einfallsrichtung schwingenden Komponente um 15% gegenüber derjenigen des einfallenden Lichtbündels gleicher Polarisationsrichtung verringert ist. Der Polarisationsgrad des transmittierten Lichts
P
I& I A I& I A
y
y
a) z x
z
b)
x y
y r E0
E 0x = E 0 sin
E 0y = E 0 cos E 0y = E 0 cos
x
E0 (t)
x E 0x = E 0 sin
Abb. 19.35: Darstellung einer linear (a) und einer zirkular polarisierten (b) Welle beträgt daher nur 8%. Er kann jedoch erhöht werden, indem wir das Licht durch mehrere Brewster-Platten schicken. Es wird immer nur die Komponente I A aus dem Lichtbündel heraus reflektiert, während die parallel polarisierte Komponente I & den Plattenstapel ungeschwächt passiert. Daher kann die Hälfte der Intensität des unpolarisiert auf die erste Platte fallenden Lichts transmittiert werden. Eine andere Möglichkeit zur Erzeugung linear polarisierten Lichts besteht in der Ausnutzung der gerade besprochenen Doppelbrechung. Ordentlicher und außerordentlicher Strahl sind senkrecht zueinander linear polarisiert. Da sie im Allgemeinen unter verschiedenen Winkeln durch den Kristall laufen, kann einer der Teilstrahlen ausgeblendet werden, so dass das transmittierte Licht vollständig linear polarisiert ist. Es gibt dazu mehrere Anordnungen, die erste wurde von W. Nicol ( | 1768-1851) ersonnen und trägt den Namen Nicolsches Prisma.
19 Elektromagnetische Felder in Materie
575
Beim Nicolschen Prisma wird der ordentliche Strahl durch Totalreflexion und anschließende Absorption aus dem Strahlengang entfernt. Zur Erzeugung der beiden Teilstrahlen wird ein Optische o Kalkspatkristall verwendet, der die Form eines Achse Rhomboeders hat. Zur Ausblendung des ordent67° lichen Strahls sind die beiden Stirnflächen des Kristalls so weit abgeschliffen, dass sie mit den ao Längskanten einen Winkel von 67° bilden (Abb. 19.36). Der längs der Diagonalebene P1 P2 unpolarisiertes Licht durchgeschnittene Kristall wird mit einer Schicht aus Kanadabalsam versehen und Abb. 19.36: Erzeugung linear polarisierten wieder verkittet. Für den ordentlichen Strahl Lichtes durch ein Nicholsches Prisma ist die Schicht (n = 1,54) optisch dünner als der Kristall (n0 = 1,66). Für den außerordentlichen Strahl gilt mit n = 1,49 das Umgekehrte. Durch den vorgenommenen Schliff fällt der ordentliche Strahl unter einem Winkel auf die Kanadabalsam-Schicht, der größer als der Grenzwinkel der Totalreflexion ist, so dass er total reflektiert wird. Der außerordentliche Strahl passiert dagegen nach entsprechender Brechung den Kristall. Der Nachteil eines solchen Polarisators ist die durch die Brechung entstehende Strahlversetzung. Außerdem ist das Gesichtsfeld ziemlich klein, da mit zunehmender Divergenz Optische des Strahls Totalreflexion nicht mehr möglich Achse ist. Diese Nachteile werden beim Glan-Thompson Prisma (P. Glan, 1846-1898, S. P. Thompson, 1851-1916) vermieden(Abb. 19.37). Es hat senkrechte Endflächen und die optische Achse liegt parallel zur Eintrittsfläche, der einfallende Strahl verläuft also senkrecht zur optischen Achse. Es tritt deshalb keine Doppelbrechung auf, aber wie beim Nicolschen Prisma wird der unpolarisiertesLicht ordentliche Strahl an der Kittfläche total-reflekAbb. 19.37: Erzeugung linear polarisiertiert. Der Öffnungswinkel des einfallenden ten Lichtes durch ein Glan-ThomsenLichtbündels kann bis zu 40° betragen, dagegen Prisma sind beim Nicolschen Prisma nur ca. 27° zulässig. Das Gesichtsfeld ist gleichmäßig polarisiert, weil die Schwingungsrichtungen symmetrisch zu der durch die optische Achse und das Einfallslot gelegten Hauptschwingungsebene orientiert sind, was beim Nicolschen Prisma nicht der Fall ist. Außerdem kann das Glan-Thompson Prisma kürzer sein als dieses. Bei den bis jetzt besprochenen Methoden zur Erzeugung polarisierten Lichtes waren die Materialien farblos, d.h. ihre elektronischen Eigenfrequenzen liegen im UV, so dass sie im Sichtbaren praktisch nicht absorbieren. Jetzt wollen wir eine dritte Möglichkeit besprechen, welche darauf beruht, dass bestimmte Stoffe den ordentlichen und den außerordentlichen Strahl unterschiedlich stark absorbieren (Abb. 19.38). Das liegt daran, dass die Eigenfrequenzen auf Grund der strukturellen Anisotropie von der Polarisationsrichtung abhängen.
576
19 Elektromagnetische Felder in Materie
Solche Materialien werden dichroitisch genannt („zweifarbig“). Sie bestehen entweder aus anisotropen Kriställchen, die orientiert in eine Gelatineschicht eingebettet sind, oder aus einer Zellulosehydratfolie, die durch Dehnung dichroitisch gemacht wird (s. unten).
Stark absorbierte horizontale Komponente
Abb. 19.38: Erzeugung linear polarisierten Lichts mittels eines dichroitischen Kristalls. Strahlung einer Polarisationskomponente wird absorbiert
Nur schwach absorbierte vertikale Komponente
19.2.7.2 Erzeugung zirkular und elliptisch polarisierten Lichtes
Die Erzeugung elliptisch polarisierten Lichtes beruht auf der in Kap. 19.2.6 erläuterten Phasenverschiebung zwischen ordentlichem und außerordentlichem Strahl, wenn diese eine dünne planparallele Platte der Dicke d passieren, die senkrecht zur optischen Achse geschnitten ist (Abb. 19.39). Die beiden Teilstrahlen werden aus linear polarisiertem Licht gewonnen, dessen Polarisationsrichtung mit der optischen Achse einen Winkel von r45q bildet.
Unpolarisiertes Licht r Eo
Optische Achse r E ao
Zirkular polarisiertes Licht
d
Abb. 19.39: Erzeugung elliptisch polarisierten Lichts durch Ausnutzung der Phasenverschiebung von o. und ao. Strahl in einem O / 4 - Plättchen Wunsch
19 Elektromagnetische Felder in Materie
577
Die Phasenverschiebung beträgt
'M
2S
O0
d (nao no ) .
(19.192)
Um zirkular polarisiertes Licht zu erhalten, muss nach Kap. 19.4.7 'M die Dicke so gewählt sein, dass
d ( nao no ) O0 / 4
S / 2 sein. Dazu muss
(19.193)
wird. Ein solches Plättchen heißt „ O / 4 -Plättchen“. Wird als Material Quarz verwendet, so ergibt sich für O0 600 nm eine Dicke von 600 /(4 0, 011) | 15μm .
19.2.7.3 Polarisationsdreher
Bei praktischen Anwendungen muss häufig die Richtung von linear polarisiertem Licht um einen Winkel D gedreht werden. Dies ist durch Verwendung eines O/2-Plättchens möglich. Seine optische Achse möge wieder in der Plattenebene liegen. Ist M der Winkel des G E Vektors des einfallenden Lichtes gegenüber der optischen Achse, so können wir die Welle in die Komponenten parallel und senkrecht zur optischen Achse zerlegen: i (Zt k& d )
E&
E0 cos M e
,
(19.194a)
EA
E0 sin M ei (Zt kA d ) .
(19.194b)
Infolge der geringeren Geschwindigkeit der senkrechten Komponente (des außerordentlichen Strahls) im Plättchen besitzen sie hinter diesem eine Phasenverschiebung von S. Für z = d gilt also
(kA k& ) d
S o kA d
k& d S ,
(19.195)
Es ist ik& d iZt
E&
E0 cos M e
EA
E0 sin M e
e
i ( k& d S ) iZt
E0 sin M e
e
(19.196)
ik& d iZt
e .
G Der Sachverhalt ist in Abb. 19.40 dargestellt. Der E -Vektor hat sich um den Winkel D = 2 M gedreht. Durch Drehung des O/2-Plättchens in der Ebene senkrecht zur Einfalls-
578
19 Elektromagnetische Felder in Materie
richtung des Lichtes kann jeder Winkel M und damit jede gewünschte Drehung D eingestellt werden.
a)
r E (z = 0) E = E sin
b) d
EP = E cos
r E (z = d)
Optische Achse
Optische Achse Abb. 19.40: Drehung der Polarisationsebene des Lichtes infolge optischer Aktivität eines Mediums
19.2.7.4 Optische Aktivität
Bestimmte Festkörper, Flüssigkeiten und Lösungen zeigen bei beliebiger Lage der Polarisationsebene des einfallenden linear polarisierten Lichtes nach Durchstrahlung eine Drehung der Polarisationsebene (Abb. 19.41). Diese Erscheinung wird als optische Aktivität bezeichnet.
d
Abb. 19.41: Drehung der Polarisationsebene einer linear polarisierten Welle infolge optischer Aktivität
Der Drehwinkel ist proportional der Dicke d des Mediums und bei Lösungen auch proportional der Konzentration c des gelösten Stoffes.
D D s (c ) d .
(19.197)
D s heißt spezifisches optisches Drehvermögen. Es existieren rechts- und linksdrehende Stoffe. Sie werden auch als positiv und negativ drehend bezeichnet. Bei Ersteren ist der Drehsinn so definiert, dass die Schwingungsrichtung für einen dem Lichtbündel entgegen blickenden Beobachter im Uhrzeigersinn gedreht wird.
19 Elektromagnetische Felder in Materie
579
Der Grund für die Drehung liegt bei kristallinen Festkörpern in einer schraubenförmigen Kristallstruktur, bei Flüssigkeiten in einer spiralförmigen Struktur der einzelnen Moleküle. Eine genauere Erklärung kann nur mit Hilfe der Quantentheorie gegeben werden. Wir können uns aber das Phänomen in seinen Grundzügen bereits in einem klassischen Modell klarmachen. Dieses geht davon aus, dass gerade umgekehrt wie oben unter Kap. 19.4.7.2 besprochen die linear polarisierte Welle aus zwei zirkular polarisierten Wellen entsteht. Auf CH3 CH3 Grund der Asymmetrie von Struktur bzw. Bausteinen der Stoffe haben die Teilwellen unterschiedliche GeschwinCH2OH digkeiten, woraus eine PhasenverschieCH OH 2 bung und damit eine linear polarisierte C C Welle mit gedrehter Schwingungsebene resultiert. Ein Festkörper dieser H C 2H 5 C 2H 5 H Art ist kristalliner Quarz, der längs der optischen Achse durchstrahlt wird. Er Abb. 19.42: Zwei spiegelsymmetrisch zueinander kommt als rechts- und links-drehender aufgebaute Amylalkohol-Moleküle Quarz vor. In Flüssigkeiten und Lösungen tritt optische Aktivität auf, wenn die Moleküle ein asymmetrisches Kohlenstoffatom enthalten, wie in Rohrzucker, Milchsäure oder Amylalkohol. Abb. 19.42 zeigt die zwei spiegelsymmetrischen Molekülformen. Diese Tatsache heißt Spiegelisomerie. Liegt ein 1:1 Gemisch aus beiden Modifikationen einer chemischen Verbindung vor, so dass sich die Drehungen kompensieren, so nennen wir es ein razemisches Gemisch. Die Messung des Drehwinkels wird in einem Polarimeter zur Konzentrationsbestimmung gelöster (optisch aktiver) Stoffe herangezogen (Abb. 19.43).
Abb. 19.43: Aufbau eines Polarimeters zur Bestimmung der Konzentration gelöster (optisch aktiver) Stoffe b
zu untersuchende Lösung
Laser Polarisator
Detektor Analysator
580
19 Elektromagnetische Felder in Materie
19.2.8 Durchgang von Licht durch isotrope Medien bei Anlegung äußerer Felder 19.2.8.1 Faraday-Effekt
Wir knüpfen an den vorhergehenden Abschnitt an und denken uns ein isotropes Medium in ein Magnetfeld gebracht, dessen Richtung mit der des durchtretenden Lichtbündels übereinstimmt. Ist das einfallende Licht linear polarisiert, so erscheint die Schwingungsebene des austretenden Lichtbündels gedreht. Die Drehung lässt sich wie oben durch zirkulare Doppelbrechung erklären. Im Magnetfeld ist das Medium optisch aktiv geworden. Dieses Phänomen trägt den Namen Faraday-Effekt oder Magnetorotation. Die Drehung der Schwingungsebene ist proportional zur magnetischen Feldstärke.
D ZV d B . Die Proportionalitätskonstante heißt Verdetsche Konstante (M. E. Verdet, 1824-1866). Eine um Größenordnungen stärkere Magnetorotation kann durch Orientierung atomarer Dipole, vor allem in dünnen ferromagnetischen Schichten, auftreten. Befindet sich ein isotropes Medium in einem transversalen äußeren Feld, so wird dieses einachsig und damit doppelbrechend. Hier seien drei solcher Effekte kurz besprochen.
19.2.8.2 Elektrische Doppelbrechung (Kerr-Effekt)
Bestimmte Flüssigkeiten und Suspensionen werden bei hinreichend großen elektrischen Feldern ( E t 10 4 eV/cm ) doppelbrechend. Die optische Achse fällt mit der RichU= tung des Feldes zusammen. Benannt ist dieser elektrooptische Effekt nach seinem Entdecker J. Kerr (1824-1907). Die Flüssigkeit befindet sich in einer transKerrzelle parenten „Kerrzelle“ (Abb. 19.44). Der Polarisator wird so eingestellt, dass die Polarisation des einfallenden Lichtes mit der Richtung des elektrischen Feldes einen Winkel von 45° bildet. Das Licht besteht dann aus zwei Komponenten r E gleicher Intensität, deren Polarisation parallel zum äußeren Feld und senkrecht / 4 -Plättchen Polarisator Elektroden zu diesem liegt. Nach Durchlaufen der Küvette besitzen sie als ordentlicher und Abb. 19.44: Aufbau einer Kerrzelle zur Unteraußerordentlicher Strahl eine Phasenversuchung der elektrischen Doppelbrechung schiebung, die proportional zu E 2 ist:
19 Elektromagnetische Felder in Materie
M
2S
d (n0 nao )
O0
2S
O0
581
K d E2
(19.198)
Infolgedessen ist das Licht nach seinem Austritt elliptisch polarisiert. Mittels eines O/4-Plättchens, dessen langsame Achse mit der Richtung des äußeren Feldes einen Winkel von 3S/4 bildet, wird es wieder in linear polarisiertes Licht umgewandelt, dessen Schwingungsrichtung gegenüber der des einfallenden Lichtes um M / 2 gedreht ist. Dies lässt sich wie folgt einsehen: Das äußere elektrische Feld zeige in x-Richtung, die y-Richtung liegt senkrecht dazu und zur Richtung des k-Vektors des Lichtes. Der Polarisator steht in x-Richtung, wobei gelten soll
X
1 2
( x y ), Y
1 2
( x y ) .
(19.199)
Die linear polarisierte Lichtwelle ist
x
A0,lin 2
sin Zt ,
y
A0,lin 2
sin Zt .
(19.200)
Das austretende Licht ist gegeben durch
x
A0,lin 2
sin(Zt M ),
y
A0,lin 2
sin Zt .
(19.201)
Einsetzen in (19.199) ergibt für die Schwingungsrichtungen
X
A0,lin cos(M / 2) sin(Zt M / 2),
Y
A0,lin sin(M / 2) cos(Zt M / 2).
(19.202)
Diese Beziehungen beschreiben eine elliptisch polarisierte Welle mit den Halbachsen
A0,lin cos(M / 2) , A0,lin sin(M / 2). Nach Passieren des O/4-Plättchens in der oben angegebenen Orientierung gilt
X
A0,lin cos(M / 2) cos(Zt M / 2)
Y
A0,lin sin(M / 2) cos(Zt M / 2).
(19.203)
Das Licht ist demnach linear polarisiert; seine Schwingungsrichtung ist gegenüber der des einfallenden Lichtes um den Winkel M /2 gedreht.
582
19 Elektromagnetische Felder in Materie
Hinter dem in Y-Richtung stehenden Analysator wird die Intensität gemessen
I
A0,2 lin sin 2 M / 2 .
(19.204)
Bei Drehung des Analysators um den Winkel D aus der Y-Richtung wird die Intensität
I
^A
0,lin
sin D cos(M / 2) A0,lin cos D sin(M / 2)`
2
A0,2 lin sin 2 (D M / 2). (19.205)
Die Intensität wird maximal, wenn der Analysator um den Winkel D M / 2 aus seiner ursprünglichen Y-Richtung gedreht wird. Die materialabhängige Proportionalitätskonstante K in (19.196) wird als Kerr-Konstante bezeichnet. Für einige Flüssigkeiten ist ihr Wert aus Tab. 19.3 zu ersehen. Festkörper zeigen einen um ca. eine Größenordnung kleineren Kerr-Effekt, bei Gasen ist er noch wesentlich geringer. Der Kerr-Effekt kann durch die Ausrichtung polarer Moleküle, wie solcher in obiger Tabelle, entstehen sowie durch die Beeinflussung der Elektronenzustände der Materialien. Die Relaxation der Moleküle erfolgt mit einer sehr geringen Zeitkonstante von typischerweise 10 11 s. Der Effekt kann daher zum Bau schneller Lichtverschlüsse eingesetzt werden. Dazu wird die Kerrzelle zwischen zwei gekreuzte Polarisatoren gebracht. Immer dann, wenn das angelegte Hochfrequenzfeld den Wert null passiert, sperrt die Anordnung den Lichtdurchgang.
Flüssigkeit
K/1014 Vm-2
Benzol Kohlenstoffdisulfid Chloroform Wasser Nitrotoluol Nitrobenzol
0,67 3,59 -3,85 5,23 137 245
Tab. 19.3: Kerrkonstante einiger Flüssigkeiten (O = 589 nm, t = 20° C)
19.2.8.3 Magnetische Doppelbrechung (Cotton-Mouton-Effekt)
Wird das elektrische Feld durch ein magnetisches Feld ersetzt, so tritt eine dem Kerr-Effekt analoge magnetische Doppelbrechung auf, die von A. Cotton (1869-1941) und H. Mouton erstmals beobachtet wurde. Es gilt also
'M
2S
O0
d (n0 nao )
2S
O0
K cd B 2 .
Die Cotton-Mouton-Konstante K c ist wesentlich kleiner als die Kerr-Konstante.
(19.206)
19 Elektromagnetische Felder in Materie
583
19.2.8.4 Spannungsdoppelbrechung
Wir wollen nun auf einen isotropen (durchsichtigen) Körper einen einseitigen Druck bzw. Zug ausüben. Als Beispiel wählen wir einen Plexiglasstab, der sich im Strahlengang zwischen zwei gekreuzten Polarisationsfolien befindet (Abb. 19.45). Ohne Einwirkung äußerer Kräfte ist das Gesichtsfeld dunkel. Wird der Stab gebogen, so wird das linear polarisierte Licht infolge Doppelbrechung elliptisch polarisiert und auf dem Schirm tritt Aufhellung an solchen Stellen auf, die einer Stauchung oder Dehnung im Stab entsprechen. Im isotropen Bereich der neutralen Faser (s. Bd. 1, Kap. 12.2) bleibt der Schirm dunkel. Der Versuchsaufbau lässt sich so abändern, dass zwischen Stauchung und Dehnung unterschieden werden kann. Dazu wird die erste Polarisationsfolie durch ein O / 2 -Plättchen ersetzt und die zweite entfernt. In diesem Fall addieren bzw. subtrahieren sich die Phasenunterschiede des Lichtes im Stab und im Plättchen, je nachdem, ob Stauchung oder Dehnung vorliegt. Bei weißem Licht ergeben sich charakteristische Farbeffekte. Die Spannungsdoppelbrechung wird in weitem Umfang bei der Materialprüfung angewandt, z.B. bei der Herstellung optischer Gläser.
Abb. 19.45: Demonstration der Spannungsdoppelbrechung
584
19 Elektromagnetische Felder in Materie
19.3 Nichtlineare Optik 19.3.1 Nichtlineare Suszeptibilität Bei der Behandlung optischer Fragestellungen sind wir bisher davon ausgegangen, dass – im klassischen Oszillatormodell – auf das Elektron bei einer Auslenkung eine ihr proportionale Rückstellkraft wirkt. Auf Grund dieser Feldkraft führt es harmonische Schwingungen aus. Die korrekte Bearbeitung des Problems mittels der Quantenmechanik führt zum gleichen Resultat. Wie bei jedem schwingenden System ist das aber nur eine Näherung für kleine Auslenkungen, also für hinreichend kleine wirkende Feldkräfte. Wächst die Feldstärke mehr und mehr, so machen sich Abweichungen von der linearen Kennlinie bemerkbar. Während im linearen Bereich die Polarisation konstant ist, für die Komponenten also gilt
Pi
H 0 F ij E j ,
(i,j = 1,2,3),
(15.61)
wird sie im nichtlinearen Bereich eine Funktion der Feldstärke.
Pi
H 0 F ij ( E ) E j .
(19.207)
Entwickeln wir die Suszeptibilität in eine Taylorreihe, so wird hieraus
Pi
(3) H 0 ^F ij(1) E j F ijk(2) E j Ek F ijkl E j Ek El ...` .
(19.208)
G
G
Wird nun das Medium von einer ebenen Welle durchlaufen, E E0 cos(Zt kz ) , so erkennen wir durch Einsetzen von E, dass jetzt auch Wellen mit höheren Frequenzen auftreten.
19.3.2 Optische Frequenzverdopplung Im einfachsten Fall der Berücksichtigung nur des ersten nichtlinearen Terms erhalten wir für isotrope Medien bei z = 0
Px
H 0 ^ F (1) E0 x cos Zt F (2) E02x cos 2 Zt` .
(19.209)
Analoge Gleichungen gelten für die beiden anderen Komponenten. Umformung des quadratischen Terms führt zu der Beziehung
Px
1 ¯2
1 2
½ ¿
H 0 ® F (2) E02x F (1) E0 x cos Zt F (2) E02x cos(2Zt ) ¾ .
(19.210)
19 Elektromagnetische Felder in Materie
585
Die Polarisation besteht also aus einem konstanten Anteil, einem Term mit der Frequenz Z und einem Anteil, der mit der Frequenz 2Z schwingt. Jeder induzierte Dipol strahlt also eine Welle mit der Frequenz Z und eine mit der doppelten Frequenz ab.
19.3.3 Optische Frequenzmischung Wir wollen jetzt den Fall untersuchen, dass zwei ebene Wellen mit den Frequenzen Z1 und Z2 im nichtlinearen Medium überlagert werden.
G E1 G E2
GG E01eˆx cos(Z1t k1r ) GG E02 eˆx cos(Z2t k2 r )
(19.211)
Beschränken wir uns auf den Frequenzanteil. Die resultierende Feldstärke bewirkt eine Polarisation, deren nichtlinearer Anteil sich nach (19.211) wie folgt zusammensetzt:
P (2) (Z ) H 0 F (2) ^E012 cos 2 Z1t E022 cos 2 Z2t 2 E01 E02 cos Z1t cos Z2t` 1 H 0 F (2) ª¬( E012 E022 ) E012 cos 2Z1t E022 cos 2Z2t 2 2 E01 E02 ^cos(Z1 Z2 )t cos(Z1 Z2 ) t`¼º
(19.212)
Neben den Wellen mit der doppelten Frequenz treten auch Wellen mit der Summen- und der Differenzfrequenz auf.
19.3.4 Phasenanpassung Die das nichtlineare Medium verlassenden Wellen haben nur dann eine merkliche Amplitude, wenn sich die von den einzelnen Dipolen des Mediums abgestrahlten Wellen phasenrichtig überlagern. Zur Erläuterung kehren wir noch mal zur Erzeugung einer Welle mit der doppelten Frequenz zurück. Wie wir in Kap. 19.3.2 gesehen haben, läuft die lineare Polarisation G zusammen mit dem elektrischen Feld E (t , z ) mit der Phasengeschwindigkeit v1 = c/n durch das Medium. Infolge der Dispersion gilt das für die Oberwelle nicht mehr. Diese breitet sich mit der Geschwindigkeit v2 = c/n(2Z) aus. Deswegen addieren sich die Wellen, die in den einzelnen Bereichen entstehen, nicht mehr phasenrichtig. Die Phasenanpassung,
c1Med (Z ) c2 Med (2Z ) ,
(19.213)
n1Med (Z ) n2 Med (2Z )
(19.214)
586
19 Elektromagnetische Felder in Materie
r k
n ao ( )
no ( ) n o (2 ) n ao (2 )
Abb. 19.46: Zur Phasenanpassung zwischen den Wellen der Frequenz Z und der Oberwelle der Frequenz Z
kann in einem optisch einachsigen Kristall erreicht werden. Die Situation ist in Abb. 19.46 dargestellt. Wie wir gesehen haben, gibt es in einem solchen Kristall eine ordentliche und eine außerordentliche Welle, die im Allgemeinen unterschiedliche Geschwindigkeiten besitzen. Dieser Umstand kann zur Phasenanpassung ausgenutzt werden. Die Phasenflächen von ordentlicher Welle der Frequenz Z und die Phasenfläche der außerordentlichen Welle der Frequenz 2Z schneiden sich nämlich. Der Schnittpunkt definiert also die Richtung, in der die primäre Welle und die frequenzverdoppelte Welle mit gleicher Geschwindigkeit laufen und sich daher phasenrichtig überlagern.
19.3.5 Die Erhaltungssätze bei der Frequenzverdopplung Die Phasenanpassungsbedingung (19.214b) lässt sich auch schreiben als
1
2
O2
O1
,
(19.215a)
G oder durch Einführung des Wellenvektors k
k2
k1 k1 .
2S / O als
(19.215b)
Verwenden wir hierin noch die Verknüpfung von Wellenzahl und Impuls, so folgt, wenn wir dessen Vektorcharakter berücksichtigen
G G p1 p1
G p2
(19.215c)
(19.215b) wird als Wellenvektor-Erhaltungssatz bezeichnet, (19.215c) stellt den Impulserhaltungssatz dar. Zur optimalen Phasenanpassung muss also außer des Energieerhaltungssatzes auch der Impulserhaltungssatz gelten.
=Z =Z 2 =Z , G G G p1 p1 p2
(19.216)
19 Elektromagnetische Felder in Materie
587
Zur Phasenanpassung bei der Erzeugung der Summen- und Differenzfrequenz gilt nach (19.212) und (19.213) entsprechend
k1 k2
k3 .
(19.217)
19.3.6 Nichtlineare Absorption Bisher wurde die Absorption eines nichtlinearen Mediums vernachlässigt. Wir lassen diese Voraussetzung jetzt fallen. Es zeigt sich, dass auch der Absorptionskoeffizient eine Funktion der Bestrahlungsstärke werden kann. An einem Beispiel möge dies verdeutlicht werden. Wir betrachten dazu ein Lösungsmittel, in dem sich N/V Moleküle (V = Volumen der Lösung) befinden mögen. Von ihnen sollen N1/V Moleküle im energetisch niedrigsten Zustand, dem sog. Grundzustand der Energie E1, sein und N2/V im energetisch höheren Zustand der Energie E2. Die Transmission des Mediums ist nach dem Beerschen Gesetz gegeben durch
T
I I0
e D d
(19.19)
wobei d die Dicke des Mediums und D = V N/V der Absorptionskoeffizient ist. Er ist gleich dem Produkt aus Wirkungsquerschnitt V und der Differenz der Besetzungszahlen '(N/V). Wir setzen voraus, dass die Differenz der beiden Energieniveaus einer Frequenz im sichtbaren Spektralbereich entspricht. Da die Frequenz bzw. die Energiedifferenz gegenüber der thermischen Energie sehr groß ist, ist nur der Grundzustand besetzt. In diesem Fall hat der Absorptionskoeffizient seinen größten Wert. Fällt intensives Licht auf die Lösung, so wird intensitätsabhängig ein Teil der Moleküle in den Zustand mit der Energie E2 angeregt. Die Verringerung der Besetzungszahl-Differenz erniedrigt also den Absorptionskoeffizienten. Maximal kann die Hälfte der Moleküle die Energie E2 annehmen. Bei dieser Gleichbesetzung wird nach (19.19) die Lösung transparent.
19.3.7 Selbstfokussierung von Licht Wir haben bis jetzt nur die Auswirkungen des ersten nichtlinearen Terms in der Suszeptibilität diskutiert und wollen es auch dabei belassen. Es sei nur darauf hingewiesen, dass sich auf Grund des kubischen Terms von F u.a. ein geringer intensitätsabhängiger Beitrag zum Brechungsindex ergibt. Der Kristall werde von einem intensiven Laserstrahl der Feldstärke E(t) = E0 cos Zt durchlaufen. Setzen wir diese in den 3. Ordnung-Term der Polarisation ein,
P (3) (Z )
F (3) E 3 cos3 Zt ,
(19.218)
588
19 Elektromagnetische Felder in Materie
so folgt mit der Beziehung
cos3 Zt
1 3 cos(3Zt ) cos Zt . 4 4
(19.219)
1 (3) 3 3 F E cos(3Zt ) F (3) E 3 cos Zt . 4 4
(19.220)
Der Ausdruck
P (3) (Z )
(19.220) zeigt, dass die nichtlineare Polarisation einen Term enthält, der mit der gleichen Frequenz oszilliert wie das eingestrahlte Feld. Folglich liefert er einen Beitrag zum Brechungsindex des Mediums. Dieser führt zur Selbstfokussierung eines intensiven Laserstrahls. Entspricht die Intensitätsverteilung der Laserwelle einer TEM00-Mode (Abb. 19.47), bei der die elektrische Feldstärke im Zentrum maximal ist und nach außen glockenförmig auf null abnimmt, so wird der Brechungsindex in der Strahlmitte am stärksten erhöht. Die Randstrahlen
n
nE=0
r r Abb. 19.47: a) Gauß-Profil der normierten Intensität einer Lasermode; b) Erhöhung des Brechungsindexes eines durch den Term 3. Ordnung in (19.215) durchstrahlten Mediums als Funktion des Abstandes von der Strahlmitte
laufen schneller durch das Medium als der Mittelstrahl, so dass eine Fokussierung der Welle erfolgt. Diese führt in der Mitte zu einer weiteren Vergrößerung des Brechungsindexes, was die Fokussierung verstärkt usw.
19 Elektromagnetische Felder in Materie
589
Zusammenfassung x Die Phasengeschwindigkeit elektromagnetischer Wellen in Materie hängt vom Brechungsindex n(Z) ab. Diese Abhängigkeit wird als Dispersion bezeichnet.
c / n(Z ) .
cmed
Der Brechungsindex ist eine komplexe Größe.
n n ' in '' { n ' iN . Der Realteil gibt den Brechungsindex an, der Imaginärteil den zienten. Beide sind durch die Dispersionsrelation (19.17) verknüpft.
Absorptionskoeffi-
x Die Intensität einer in z-Richtung durch ein Medium laufenden Welle nimmt (bei nicht zu großen Intensitäten) exponentiell ab.
I
I 0 e D 'z ; D
2Z ncc / c ; (Beersches Gesetz)
x Licht wird an Atomen, Molekülen und Partikeln gestreut. Kohärente Streuung liegt vor, wenn die Streuzentren eine räumliche Ordnung aufweisen. Die Phasenwinkel der gestreuten Teilwellen stehen dann zueinander in einer festen Beziehung. Bei willkürlicher Verteilung der Streuzentren existieren keine festen Phasenbeziehungen, und die Streuung heißt inkohärent. Im ersten Fall ergibt sich die Intensität zu
I
¦ A k
k
2
,
im zweiten Fall zu
I
¦
k
Ik .
x Die Maxwell-Gleichungen in Materie lauten in Integralform
G G
v³ Edr C
d G G B dA ; dt ³A
G G BdA 0. v³ A
G G
v³ Bdr C
PP0 I
1 d G G EdA ; c dt ³A 2 Med
590
19 Elektromagnetische Felder in Materie und in Differentialform
G rot E
G wB ; wt
G di v E
1
H H0
G rot B
G G 1 wE P P0 j 2 ; cMed wt
G di v B 0.
U;
x Aus den Maxwell-Gleichungen folgen die Wellengleichungen in Materie zu
G 'E
G 1 w2 E 2 wt 2 cMed
und
G 'B
G 1 w2 B . 2 wt 2 cMed
x An der Grenzfläche zweier Medien mit den Brechungsindizes n1 und n2 wird eine elektromagnetische Welle z.T. reflektiert und z.T. gebrochen. Reflexions- und Transmissionsvermögen lassen sich aus den Fresnelschen Formeln, (19.124/125), berechnet. Für die Summe aus Reflexionsvermögen R und Transmissionsvermögen T gilt bei vernachlässigbarer Absorption R + T = 1. Bei senkrechtem Einfall ist R gegeben durch 2
§n n · R ¨ 2 1¸ . © n2 n1 ¹ x Stark absorbierende Materialien besitzen ein hohes Reflexionsvermögen. Bei schrägem Lichteinfall gibt es einen Winkel DT, bei dem Totalreflexion einsetzt,
sin D T
n2 , n2 > n1. n1
x Fällt Licht unter dem Brewsterwinkel DB auf ein Medium, so ist das reflektierte Licht vollständig in der Ebene senkrecht zur Einfallsebene polarisiert,
tgD B
n2 . n1
x In einem optisch anisotropen Medium wird das dielektrische Verhalten durch einen Tensor 2. Stufe, den Dielektrizitätstensor H beschrieben.
19 Elektromagnetische Felder in Materie
591
G G x In einem optisch anisotropen Medium sind E und D nicht mehr parallel zueinander, G G G G sondern die Vektorgrößen kˆ0 , D, B und sˆ0 , E , B bilden jeweils ein rechtwinkliges Dreibein. Wellennormale kˆ0 und Richtung der Energieströmung sˆ0 sind nicht mehr parallel G G zueinander, sondern bilden, wie auch D und E , miteinander einen Winkel - .
x Eine einfallende ebene Welle spaltet im Allgemeinen in eine ordentliche und eine außerordentliche Welle auf, die senkrecht zueinander polarisiert sind. Der Brechungsindex für die o. Welle ist unabhängig von der Ausbreitungsrichtung, es gilt das Snelliussche Brechungsgesetz. Für die ao. Welle hängt der Brechungsindex von dem Winkel zwischen Ausbreitungsrichtung und optischer Achse ab. x Polarisiertes Licht lässt sich durch Reflexion unter dem Brewsterwinkel erzeugen, mit Hilfe dichroitischer Kristalle und durch Ausnutzung der Doppelbrechung. x Erreicht die elektrische Feldstärke einer elektromagnetischen Welle große Werte, so müssen auch nichtlineare Terme der dielektrischen Polarisation berücksichtigt werden. x Bei Beschränkung auf das zweite Glied der Taylorentwicklung der dielektrischen Suszeptibilität kommt es zur Erzeugung einer Welle der doppelten Frequenz. Die Überlagerung zweier ebener Wellen ergibt Wellen mit der Summenfrequenz und der Differenzfrequenz der beiden Wellen. x Die phasenrichtige Überlagerung der entstehenden und der eingestrahlten Welle in einem nichtlinearen Medium kann mit Hilfe eines optisch einachsigen Kristalls bewerkstelligt werden. x Die Einstrahlung hinreichend intensiven Lichts in ein nichtlineares Medium reduziert die Absorption. x Die Berücksichtigung des kubischen Terms der elektrischen Suszeptibilität liefert u.a einen intensitätsabhängigen Beitrag zum Brechungsindex des Mediums.
592
19 Elektromagnetische Felder in Materie
Übungsaufgaben 1. Welche Bedeutung hat der statische Strukturfaktor einer wässrigen Lösung von Makromolekülen? Was ist unter dem Formfaktor zu verstehen? Wie ist der qualitative Verlauf des Formfaktors in Abhängigkeit vom Streuwinkel? Wie lässt er sich bei sphärischer Form der Moleküle berechnen? 2. Eine ebene elektromagnetische Welle der Frequenz Z = 3 1010 Hz im Vakuum läuft gegen eine Metallwand, an der sie in sich selbst reflektiert wird. Berechnen Sie für einen Punkt 0,804 m vor der Metallwand der Wegunterschied der beiden Wellen, die Amplitude der resultierenden Welle und die relative Intensität im Vergleich zur Maximalintensität der miteinander interferierenden Wellen. 3. Atomarer Wasserstoff absorbiert Licht u.a. bei 656,3 nm. Was für einen Verlauf würde der Brechungsindex n nehmen, wenn nur diese Linie zu berücksichtigen wäre? Welchen Wert hätte n bei 500 nm? In Wirklichkeit werden weitere Linien bei höheren Frequenzen beobachtet. Wie wirkt sich das qualitativ auf den Brechungsindex aus? 4. Tritt Totalreflexion ein, wenn ein Lichtstrahl (O = 500 nm) auf eine Glasscheibe trifft? Wie werden Gläser entspiegelt? Wo ist das wichtig? 5. Ein Lichtstrahl mit der Leistung von 0,5 W läuft durch ein 4 cm langes absorbierendes Medium. Welchen Bruchteil der Ausgangsleistung hat der Lichtstrahl beim Austritt aus dem Medium, wenn a) D = 4 10-3 cm-1; b) D = 10-1 cm-1 ist? 6. Wie dick muss eine Silberschicht sein, damit die Amplitude einer elektromagnetischen Welle der Wellenlänge O = 3 cm auf 2 0/00 abnimmt?
20
Geometrische Optik
20.1
Grundlagen der Strahlenoptik
Licht lernen wir zunächst als Lichtstrahlen oder -bündel kennen. Sprechweisen wie „durch eine Ritze fällt ein Lichtstrahl“ oder „ein von einem Spiegel reflektiertes bzw. von einem Scheinwerfer ausgesandtes Lichtbündel“ etc. sind uns allen geläufig. Die geradlinige Ausbreitung des Lichtes in eng begrenzten Lichtbündeln ist Gegenstand der geometrischen oder Strahlenoptik. Besonders die Abbildungseigenschaften optischer Komponenten, von Spiegeln und Linsen, können so einfach formuliert werden. Die Beschreibung stößt allerdings überall dort an ihre Grenzen, wo räumliche Begrenzungen eines Lichtbündels ins Spiel kommen, also z. B. beim Durchgang von Licht durch Blenden. Nur solange der Durchmesser des Lichtbündels sehr viel größer als die Wellenlänge des Lichtes ist, können solche als Beugungseffekte bekannte Abweichungen von geometrisch konstruierten Strahlengängen vernachlässigt werden. Ein Beispiel möge das verdeutlichen. Denken wir uns eine große Blende mit einem variablen kreisrunden Loch und einer Mattscheibe dahinter (Abb. 20.1). Durch die Schirm Blende wird jeder Punkt eines Gegenstandes als Kreisscheibe abgebildet. Das Bild ist daher undeutlich. Seine „Schärfe“ lässt sich durch Zusammenziehen der Blende erhöhen. Jedes Kreisscheibchen geht dann näherungsweise in einen Punkt über. Aber das funktioniert nicht mehr, wenn das LichtbünAbb. 20.1: Eine Kreisblende bildet jeden del auf Durchmesser von der GrößenordPunkt eines Gegenstandes als Scheibchen nung der Wellenlänge begrenzt wird, denn ab dann setzt zunehmend Beugung ein. Die Grundlagen der Strahlenoptik sind: 1) Können bei der Ausbreitung einer Lichtwelle Interferenz-, Beugungs- und Polarisationseffekte vernachlässigt werden, so kann die Ausbreitung der Welle durch Lichtstrahlen beschrieben werden. In optisch homogenen Medien breiten sich diese geradlinig aus. 2) An den Grenzflächen zweier Medien werden Lichtstrahlen nach dem Reflexionsgesetz (19.110) reflektiert und nach dem Snelliusschen Brechungsgesetz (19.112) gebrochen. 3) Lichtstrahlen beeinflussen sich (im Rahmen der linearen Optik) nicht. Die drei Sätze können auf das Fermatsche Prinzip (P. Fermat, 1601-1665) zurückgeführt werden. Es lautet
594
20 Geometrische Optik
Ein Lichtstrahl durchläuft zwischen zwei Punkten stets den Weg, für den die entsprechende optische Weglänge ein Extremwert ist. 2
Extremwert .
³ nds 1
Ist der Brechungsindex n konstant, so ist der Extremwert ein Minimum. Damit wird auch die Laufzeit des Lichtes minimal. Dazu ein Beispiel: Ein vom Punkt P1 ( x1 , y1 ) ausgehender Lichtstrahl werde in der Ebene y = 0 im Punkt PR ( x, 0) in den Punkt P2 ( x2 , y2 ) reflektiert (Abb. 20.2). Der vom Lichtstrahl zurückgelegte Weg ist
s
P1 (x1 ,x 2 )
s1 s2 ( x x1 ) 2 y12 ( x2 x) 2 y22 .
y s1
(20.1)
PR (x,0)
x s2
Minimale Lichtlaufzeit bedeutet dt/dx = 0, also
x x1 2
2 1
( x x1 ) y
x2 x
0
( x2 x) 2 y22
(20.2)
P2 (x1 ,x 2 ) Abb. 20.2: Anwendung des Fermatschen Prinzips ergibt das Snelliussche Brechungsgesetz
o
sin D1
sin D 2 o D1 D 2 .
Das ist das Snelliussche Reflexionsgesetz.
20.2 Optische Abbildung Die häufigste Aufgabe im Rahmen der linearen Optik besteht in der Vergrößerung eines Gegenstandes. Zur Definition führen wir zunächst einige Grundbegriffe ein (Abb. 20.3). Der Winkel, unter dem wir einen Gegenstand sehen, heißt Sehwinkel. Betrachten wir ohne optische Elemente einen Gegenstand in der Entfernung von s0 25 cm , so nennen wir diese deutliche Sehweite. Die Erfahrung zeigt, dass unser Auge bei weiterer Annäherung einen Gegenstand nur unter stärkerer Anspannung scharf sehen kann. Wird die Größe eines
20 Geometrische Optik
595
Gegenstandes mit YG bezeichnet und die des durch eine optische Anordnung erzeugten Bildes mit YB , so definieren wir als Abbildungsmaßstab oder Lateralvergrößerung das Verhältnis
E:
YB YG
(20.3)
YG Sei nun der Sehwinkel in deutlicher Sehweite H 0 und der Winkel, unter dem der Gegenstand mit einer optischen Anordnung gesehen wird, H , so definieren wir als Vergrößerung den Quotienten
V:
YG
H . H0
YB
(20.4)
a
Zur optischen Abbildung geeignete Elemente sind Hohlspiegel und Linsen.
20.3
a
b
Abb. 20.3: Zur optischen Abbildung
Abbildung durch Hohlspiegel
Zur Abbildung von Gegenständen lassen sich je nach Problemstellung verschiedene Typen konvexer oder konkaver Spiegel verwenden. Wir besprechen zunächst den sphärischen Hohlspiegel (Abb. 20.4). Die vom Mittelpunkt M zum Scheitel S verlaufende Gerade heißt Hauptachse. Betrachten wir einen im Abstand d parallel zur Hauptachse einfallenden Lichtstrahl, der den Spiegel im Punkt A trifft. Er bilde mit der Normalen den Winkel D . Unter dem gleichen Winkel wird er in den Punkt F reflektiert. Nach Abb. 20.4 gilt
MF
FA
MA 2cos D
R , 2cos D
(20.5)
wobei R der Krümmungsradius des Spiegels ist. Da sin D d / R ist, wird für achsennahe, oder paraxiale Strahlen, cos D | 1 . Solche Strahlen schneiden sich also im Schnittpunkt F, dem Brennpunkt. Die Brennweite f ist also
f
R . 2
(20.6)
R
d M
F
f
S
Abb. 20.4: Strahlengang beim sphärischen Hohlspiegel
596
20 Geometrische Optik
Für größere Abstände ergeben sich Abweichungen, die zu fehlerhafter Abbildung führen. Jetzt wollen wir einen Strahl betrachten, der von einem Punkt G auf der Achse außerhalb M im Punkte A auf den Spiegel fällt (Abb. 20.5) und nach Reflexion die Achse in einem Punkt B schneidet. Mittels der Dreiecke GAM und MAB folgt nach dem Sinussatz
sin E sin(S D )
A
R
d G
ß
ß
F b
a
f
S
Abb. 20.5: Zur Ableitung der Abbildungsgleichung beim sphärischen Spiegel
1 1 a b
MG AG
MB . AB (20.7)
B
M
sin E sin D
1 f
Für kleine Winkel D , E , also für paraxiale Strahlen, ist AG = SG = a und AB = SB = b. Damit folgt
aR a
Rb , b
(20.8)
oder nach Umordnung mit 2/R = 1/f
(20.9)
Diese Beziehung heißt Abbildungsgleichung
Die Summe aus reziproker Gegenstandsweite und reziproker Bildweite ist gleich der reziproken Brennweite. Zur Charakterisierung eines Hohlspiegels wird die reziproke Brennweite in Dioptrien (m-1) angegeben. Zur Bestimmung des Abbildungsmaßstabes (s. Abb. 20.6) entnehmen wir aus der Ähnlichkeit der Dreiecke SGGS und SBBS die Beziehung
VA :
YB YG
BBS GGS
b a
(20.10)
oder mit Hilfe der Abbildungsgleichung (20.9)
VA :
YB YG
b a
f a f
b f . f
(20.11)
20 Geometrische Optik
597 a)
GS
b)
R
G G
M BS
F
S
B
c)
G
F
M
B F
Abb. 20.6: Zur Ableitung der Abbildungsgleichung beim sphärischen Hohlspiegel a) Gegenstand außerhalb der doppelten Brennweite: es entsteht ein reelles umgekehrtes und verkleinertes Bild; b) Gegenstand bei der doppelten Brennweite: es entsteht ein reelles umgekehrtes gleich großes Bild c) Gegenstand innerhalb der einfachen Brennweite: es entsteht ein virtuelles aufrechtes und vergrößertes Bild
Dabei haben wir stillschweigend festgelegt, dass die Größen f, a, b positive Werte annehmen, wenn sie vor dem Spiegel liegen und negative, wenn sie hinter dem Spiegel liegen. Die Größen f und a sind beim Hohlspiegel positive Größen; b kann auch negativ werden. Bezüglich der Lage von Gegenstand und Bild und dessen Größe sind bei gegebener Brennweite drei Bereiche zu unterscheiden, die in den Abb. 20.6a-c dargestellt sind. Im Falle a d f erscheint dem Auge des Beobachters das virtuelle Bild hinter dem Spiegel (b < 0), da es die vom beleuchteten Gegenstand ausgehenden Strahlen nach hinten verlängert. Virtuell heißt das Bild, weil es nicht auf einem Schirm aufgefangen werden kann, sondern nur im Auge des Beobachters entsteht. Es wurde eingangs bereits darauf hingewiesen, dass es für spezielle Anforderungen auch spezielle Hohlspiegel gibt. Geht es bietet sich ein Parabolspiegel an. Er konzentriert alle parallel zur optischen Achse einfallenden Strahlen, also auch achsenferne, im Brennpunkt. Solche Spiegel werden in der Astronomie und Astrophysik als Teleskope eingesetzt. Ein Beispiel, bei dem der Lichtweg umgekehrt durchlaufen wird, ist näherungsweise der Autoscheinwerfer. – Soll dagegen ein Punkt in einen anderen Punkt abgebildet werden, so kann das besonders gut mit einem elliptischen Spiegel bewerkstelligt werden. Neben Hohlspiegeln gibt es auch Wölbspiegel. Wie der Name besagt, ist bei diesen eine konkav gekrümmte Fläche verspiegelt. Mit einem solchen Spiegel lassen sich virtuelle, aufrechte, verkleinerte Bilder erzeugen, die dem Auge des Betrachters hinter dem Spiegel erscheinen. Sie finden z. B. als Außen-Rückspiegel von Autos oder an unüberB sichtlichen Straßenverläufen Verwendung. Die R G Bildkonstruktion ist aus Abb. 20.7 zu ersehen, Brennweite und Bildweite sind negativ.
F Abb. 20.7: Bei der Abbildung durch einen sphärischen Wölb- oder Konkavspiegel entsteht ein virtuelles aufrechtes und verkleinertes Bild
M
598
20.4
20 Geometrische Optik
Strahlengang in durch Ebenen begrenzten Körpern
Körper mit ebenen Flächen haben natürlich keine fokussierenden Wirkungen. Im Bereich der Optik sind solche aber trotzdem wichtig, vor allem als ebene Spiegel, planparallele Platten und Prismen.
G
GSP
Abb. 20.8: Abbildung eines Gegenstandes durch einen ebenen Spiegel ergibt ein virtuelles aufrechtes Bild mit dem Abbildungsmaßstab 1:1
20.4.1 Ebener Spiegel Blicken wir in einen ebenen Spiegel, so sehen wir bekanntlich ein virtuelles Bild unser selbst, das uns aus dem Raum hinter dem Spiegel in gleicher Entfernung und Größe anzublicken scheint. Wie alle virtuellen Bilder entsteht es dadurch, dass unser Auge einer Knickung der Lichtstrahlen nicht folgen kann, sondern diese nach hinten verlängert (Abb. 20.8).
20.4.2 Planparallele Platte Ist ein Körper, dessen Dicke klein gegenüber seinen Abmessungen senkrecht dazu ist, durch zwei parallele Ebenen begrenzt, so bezeichnen wir ihn als planparallele Platte. Ein einfallender Lichtstrahl tritt wegen der Brechung an der gegenüberliegenden Seite parallel verschoben aus (Abb. 20.9). Wir wollen diese Parallelverschiebung s ausrechnen. Es ist
s
d c sin(D E ) d
sin(D E ) cos E
d
(sin D cos E cos D sin E ) cos E
§ § sin E cos D · nL cos D · d sin D ¨1 ¸. ¸ d sin D ¨1 © sin D cos E ¹ © nPl cos E ¹
(20.12)
Die Größen nL und nPl sind die Brechungsindizes von Luft und Platte. Den Term cos ß formen wir wie folgt um
20 Geometrische Optik
cos E
1 sin 2 E
599
1
sin 2 E sin 2 D sin 2 D
nL nPl
nPl2 sin 2 D . nL2
(20.13)
Einsetzen in (20.12) ergibt für s
s
§ ¨ ¨ d sin D ¨1 ¨ ¨ ©
· ¸ cos D ¸ ¸ (20.14) 2 nPl sin 2 D ¸¸ nL2 ¹
nL
d Bei gegebener Dicke d und gegebenem Einfallswinkel D kann durch Messung der Parallelverschiebung s der Brechungsindex der Platte oder des umgebenden Mediums bestimmt werden. Planparallele Platten sind auch für die optische Spektroskopie von Bedeutung. Darauf kommen wir im nächsten Kapitel zurück.
nPL d
s Abb. 20.9: Strahlversatz durch eine planparallele Platte
20.4.3 Prismen Ein Prisma ist ein Körper, dessen Grundflächen kongruente Vielecke sind; die Seitenflächen sind Parallelogramme. Im Folgenden betrachten wir ein dreiseitiges, durchsichtiges Prisma (Abb. 20.10). Die zur Einfalls- bzw. Ausfallsebene senkrechten Flächen werden brechende Flächen genannt. Sie schließen miteinander den brechenden Winkel J ein; ihre gemeinsame Schnittlinie heißt brechende Kante. Die der 1 h d a dieser gegenüber liegende Fläche wird 2 1 Basis genannt. Ausfalls- und Einfalls2 winkel unterscheiden sich um einen von der Wellenlänge abhängigen Winkel G . Auf dieser Eigenschaft beruht die optil sche Spektroskopie. Wir überlegen uns nun, wie groß die Abb. 20.10: Strahlverlauf bei einem Prisma; Strahlablenkung G als Funktion des EinJ wird als brechender Winkel bezeichnet trittswinkels D1 bei gegebenem J wird. ausführen
600
20 Geometrische Optik
Es gilt
G
D1 E1 D 2 E 2
J
E1 E 2
(20.15)
und damit
G
D1 D 2 J .
(20.16)
Mit dem Brechungsgesetz folgt
sin D 2
nPr i sin E 2 nL
nPr i sin(J E1 ) nL
sin D 2
nPr i n sin J cos E1 Pr i sin E1 cos J nL nL
(20.17)
Abermalige Benutzung des Brechungsgesetzes führt zu
sin D 2
nPr i n2 sin J 1 2L sin 2 D1 sin D1 cos J nL nPr i
sin D 2
n2 sin J Pr2 i sin 2 D1 sin D1 cos J nL
(20.18)
Setzen wir D 2 in (20.16) ein, so folgt für die Strahlablenkung
G
§
D1 J arcsin ¨ sin J ¨ ©
· nPr2 i sin 2 D1 sin D1 cos J ¸ . 2 ¸ nL ¹
(20.19)
Mit zunehmendem Einfallswinkel wird G zunächst kleiner, erreicht ein Minimum, und wächst dann wieder an. Wir wollen die Minimumbedingung berechnen. Dazu bilden wir die Ableitung d G / dD1 und setzen diese gleich null. Mit (20.16) folgt
dG d D1
1
dD 2 d D1
0.
(20.20)
20 Geometrische Optik
601
Schreiben wir
dD 2 d D1
dD 2 d E 2 d E1 . d E 2 d E1 dD1
Aus dem Brechungsgesetz sin D 2
cos D 2 dD 2
n sin E 2 , n
nPr i / nL folgt nach Differentiation nach E 2
n cos E 2 d E 2 und analog cos D1dD1
Außerdem ergibt sich aus J
d E2 d E1
(20.21)
n cos E1d E1 .
(20.22)
E1 E 2 , da J nicht von E1 abhängt,
1 .
(20.23)
Berücksichtigen wir diese drei Ausdrücke in (20.21), so erhalten wir
dD 2 d D1
cos D1 cos E 2 . cos E1 cos D 2
(20.24)
Setzen wir dies in (20.20) ein, so ergibt sich
dG d D1
1
cos D1 cos E 2 cos E1 cos D 2
0
(20.25)
Eliminieren wir E1 , E 2 mittels des Brechungsgesetzes, so resultiert als Minimumsbedingung
(n 2 1)(sin 2 D1 sin 2 D 2 ) 0 .
(20.26)
Da n z 1 ist, folgt
D1 D 2 .
(20.27)
Es ist ferner d 2G / dD12 ! 0 , so dass ein Minimum vorliegt. Der Fall minimaler Ablenkung bedeutet, dass der Strahl im Prisma senkrecht auf der brechenden Kante steht, das Prisma also symmetrisch durchläuft (Abb. 20.11). Nach Abb. 20.10 wird in diesem Fall E1 J / 2 und damit mit (20.15)
D1
1 (G min J ) , 2
(20.28)
602
20 Geometrische Optik
Setzen wir dies in das Brechungsgesetz ein, so folgt
n
Abb. 20.11: Beim Minimum der Ablenkung verläuft der Strahl in einem gleichschenkligen Prisma parallel zur Basis
20.5
sin D min sin J / 2
sin (G min J ) / 2 sin J / 2
.
(20.29)
Durch Messung des Einfallswinkels beim Minimum der Ablenkung, der sehr genau eingestellt werden kann, und des brechenden Winkels lässt sich der Brechungsindex des Prismenmaterials bestimmen. Ein Hohlprisma, dessen brechende Flächen aus planparallelen Platten bestehen, eignet sich auch zur Untersuchung von Flüssigkeiten. Die Strahlablenkung selbst folgt aus (20.29) zu
G min
2arc sin n sin J / 2 .
(20.30)
Linsen
Die meisten optischen Instrumente sind aus Linsen aufgebaut, z.B. Lupen, Mikroskope, Fotoapparate, Fernrohre und Projektoren. Es ist daher wichtig, ihre Abbildungseigenschaften näher zu untersuchen, wobei wir uns hier nur auf die Brechung durch sphärische Flächen beschränken. Linsen können unterschiedlich dick und auf ihren beiden Seiten unterschiedlich gekrümmt sein. (Abb. 20.12). Ist der größte Abstand d zwischen den zwei Seiten sehr klein gegenüber der Brennweite, so sprechen wir von dünnen Linsen. Bei ihnen können die beiden
Abb. 20.12: Zusammenstellung der unterschiedlichen Linsentypen
R1 > 0
R1 0
R1 > 0
R2< 0
R2 < 0
R2< 0
R1 = R 2
R1
R1 0
R1 R 2 0
R2 0 R2
R1 = R 2
brechenden Flächen in den meisten Fällen durch eine solche in der Mittelebene der Linse ersetzt werden. Dadurch sind ihre Eigenschaften leicht zu übersehen.
20 Geometrische Optik
603
20.5.1 Brechung an einer sphärischen Fläche Stellen wir uns einen durch ein Glas ausgefüllten Halbraum vor, der auf der linken Seite von einer sphärischen Fläche mit Radius R begrenzt ist (Abb. 20.13). Ein achsennaher Lichtstrahl parallel zur Symmetrieachse im Abstand y falle auf die Grenzfläche. Der BrechungsP index von Luft sei mit n1 bezeichnet, der des n2 Glases mit n2. Der Lichtstrahl wird an der h n Grenzfläche im Punkt P gebrochen und 1 R schneidet die Achse im Abstand f von S im F M Punkt F. Da y f, so entstehen reelle, umgekehrte Bilder des Gegenstandes; für a d f ergeben sich virtuelle, aufrecht stehende Bilder. Die Abbildungsgleichung nimmt eine besonders einfache Form an, wenn wir statt a und b die auf die Brennpunkte bezogenen Werte von Gegenstands- und Bildweite einführen.
a
f x und b
f xc .
(20.50)
Wir erhalten dann, je nachdem die Brechungsindizes auf den beiden Seiten der brechenden Fläche gleich oder unterschiedlich sind, die sog. Newtonsche Abbildungsgleichung
xx '
f2
bzw.
x a xb
fa fb
(20.51a,b)
20 Geometrische Optik
607
20.5.3 Dicke Linsen Bei dünnen Linsen konnten wir die Brechung des Lichtstrahls an den beiden Grenzflächen näherungsweise durch eine fiktive Brechung an der Mittelebene ersetzen. Ist aber die Dicke der Linse gegenüber den Krümmungsradien nicht mehr vernachlässigbar, so ist dies nicht mehr statthaft. Fassen wir wieder einen von links kommenden Parallelstrahl ins Auge (Abb. 20.17). Nach der Brechung an den zwei Flächen geht er als Brennstrahl durch den bildseitigen Brennpunkt F´ der Linse. Sein Ort ist bestimmt durch
Abb. 20.17: Zur Ableitung der Brennweiten f und f´ und der Hauptebenen H, H´ bei einer dicken Linse
F2cF c [ ;
f1 n1
f1
F1
F2
f2
f2
F2
n1 = n 2
f 2 f 2c
[G
F
H
f
n2
(20.52)
Die zweite Beziehung entsteht durch Anwendung der Newtonschen Abbildungsgleichung auf die Abbildung von F1c durch die zweite Fläche. Die bildseitige Brennweite der Linse wird festgelegt durch den Abstand des Brennpunktes F´ von der bildseitigen Hauptebene H´. Letztere wird definiert durch die auf der Symmetrieachse senkrecht stehende Ebene durch den Schnittpunkt (als Hauptpunkt bezeichnet) des Parallelstrahles mit dem durch F´ gehenden Brennstrahl. Da wir paraxiale Strahlenführung voraussetzen, erhalten wir mittels des Strahlensatzes für die Brennweite f´ (f´ < 0)
f ' f 2c [ Setzen wir darin
f '1 . f2 G
[
(20.53)
aus (20.52) ein, so ergibt sich nach Ausklammern von f '2
f ' f '1 f '2
1 f2 / G f2 G
f '1 f '2
G
.
(20.54)
Aus Abb. 20.17 entnehmen wir für G
G
d f '1 f 2 ,
wobei d die Dicke der Linse ist.
(20.55)
608
20 Geometrische Optik
Folglich erhalten wir für die bildseitige Brennweite
f'
f '1 f '2 , f '1 f 2 d
(20.55)
Analog ergibt sich für die gegenstandseitige Brennweite
f
f1 f 2 . f '1 f 2 d
(20.56)
Diese Beziehungen enthalten nicht den Abstand von der Symmetrieachse. Im Rahmen der paraxialen Näherung geht also jeder anfängliche Parallelstrahl durch F´ bzw. durch F. Für das Verhältnis f´/f folgt
f '1 f ' 2 f1 f 2
f' f
n'1 n' 2 n1 n2
n' 2 . n1
(20.57)
Sind die Medien auf beiden Seiten der Linse gleich, so ist f f ' . Wir wenden uns nun der Berechnung der Abstände h bzw. h´ der Hauptebenen von den Scheitelpunkten S bzw. S´ zu. Der bildseitige Hauptebenenabstand ist nach Abb. 20.17
h'
f 2 ' [ f ' .
(20.58)
Einsetzen von [ aus (20.52) und von G aus (20.54) resultiert in
h'
f 2 '
f' ( f '1 f 2 ) f '1
f 2 '
f' (d G ) , f '1
(20.59)
Abermaliges Einsetzen von G führt zu
h'
f' d f '1
n1c f ' d. n1 f1
(20.60)
Entsprechend ergibt sich für die gegenstandseitige Brennweite
h
f d f2
n2 f d. n2c f '2
(20.61)
Ist die Linse von Luft umgebe ( n1 n '2 1 ), so erhalten wir, wenn wir für den Brechungsindex n '1 n2 des Linsenmaterials den Buchstaben n verwenden, für die reziproke Brennweite
20 Geometrische Optik
609
§ 1 1 (n 1) d · (n 1) ¨ ¸. nR1 R2 ¹ © R1 R2
1 f
(20.62)
Die Abstände der Hauptebenen von den Scheiteln der Linse ergeben sich zu
h
(n 1) f d nR2
h'
und
(n 1) f d nR1
(20.63a/b)
H1
H
H
H2
1 F
S
F
S
2 h
d
h
f
a
R 1 > R 2 > 0; f < 0
f b
Abb. 20.18: Von Luft umgebene symmetrische Linse, bei der die Hauptebenen innerhalb der Linse liegen auch
Abb. 20.19: Lage der Hauptebenen bei einer Konvexlinse
Die Hauptebenen für eine bikonvexe Linse liegen bei nicht zu großer Dicke im Bereich der Linse (Abb. 20.18). Für andere Linsentypen finden wir sie aber auch außerhalb des Glaskörpers, wie das Beispiel in Abb. 20.19 zeigt. Bei der Bildkonstruktion können wir genau so vorgehen wie bei dünnen Linsen, wenn Gegenstands- und Bildweite wie die Brennweiten von den Hauptebenen aus gemessen werden (Abb. 20.18). Zwischen diesen verlaufen die Strahlen parallel zur Symmetrieachse. Für den Abstand x zwischen Gegenstand G und gegenstandseitigen Brennpunkt F sowie der Abstand x´ zwischen Bild B und bildseitigem Brennpunkt F´ erhalten wir nach dem Strahlensatz
x f
G B
und
x' f'
B , G
xx'
ff'
f2.
(20.64)
Setzen wir wie in Kap. 20.5.2 x = a – f und x´ = b – f’ = b – f, so ergibt sich wiederum die bekannte Linsengleichung, die also so auch für dicke Linsen gilt.
1 1 a b
1 . f
(20.65)
610
20 Geometrische Optik
20.5.4 Linsensysteme Optische Instrumente bestehen im Allgemeinen aus mindestens zwei Linsen. Auch zur Korrektur von Abbildungsfehlern werden Linsenkombinationen verwendet. Es ist daher zweckmäßig, dass wir uns zunächst mit deren Abbildungseigenschaften vertraut machen Als Erstes fragen wir nach der Brennweite eines Systems aus zwei dünnen Linsen, die im Abstand d voneinander angeordnet sind (Abb. 20.20). Wir können die gerade erarbeiteten Ergebnisse auf diesen Fall übertragen, wenn wir den dort verwandten Abstand d der
L1
L2
d
f1
a2
f2
f2
b2
Abb. 20.20: Zur Brennweite eines Systems aus zwei dünnen Bikonvexlinsen (Sammellinsen) und
brechenden Flächen als Abstand der beiden dünnen Linsen voneinander auffassen. Da sich die Linsen an Luft befinden sollen, haben wir zu setzen
n1 ' n1 und n 2 ' n2 .
(20.66)
In (20.55) und (20.56) werden damit f´1 = f1 und f´2 = f2. Die Brennweite des Systems ist folglich
f
f'
f1 f 2 . f1 f 2 d
(20.67)
Eine Kombination aus zwei dünnen bikonvexen Linsen wirkt nur als Sammellinse, solange der Nenner positiv ist. Wird ihr Abstand d > f1+ f2 gewählt, so bilden sie eine Zerstreuungslinse. Werden die Linsen aneinander geschoben ( d o 0 ), so ergibt sich die Brechkraft des Systems als Summe der Brechkräfte der einzelnen Linsen.
1 f
1 1 . f1 f 2
(20.68)
Die Brechkräfte zweier dicht hintereinander angeordneter zentrierter Linsen addieren sich.
20 Geometrische Optik
611
d* F1 F2 Abb. 20.21: Zur Brechkraft zweier dicht hintereinander angeordneter dicker Bikonvexlinsen
h1 h1
f1
F
F2
f2
h2 h2 f2
b2
Dies gilt auch für dicke Linsen, wie wir jetzt zeigen wollen. Die Brennweiten seien f1 und f2 (Abb. 20.21). Ihr Abstand sei durch die Entfernung d* der einander gegenüber liegenden Hauptebenen festgelegt. Ein von links einfallender Parallelstrahl wird in den bildseitigen Brennpunkt F1c abgelenkt. Nach der Brechung durch die zweite Linse L2 schneidet er als Brennstrahl der Linsenkombination die Symmetrieachse im Brennpunkt F c . Auf diese zweite Linse bezogen, ist also F c das Bild des als Gegenstand fungierenden „Zwischenbildes“ F1c . Die Gegenstandsweite bezüglich L2 ist a2 d * f1 . Setzen wir a2 in die Abbildungsgleichung ein, so erhalten wir für die entsprechende Bildweite b2
b2
a2 f 2 a2 f 2
(d * f1 ) f 2 d * f1 f 2
f1 f 2 d * f2 . f1 f 2 d * f1 f 2 d *
(20.69)
Definieren wir den ersten Term als die Brennweite f des Systems, so muss der zweite Term gleich dem Abstand der neuen bildseitigen Hauptebene von der äußeren Hauptebene H 2c der zweiten Linse sein. Die Rechnung verläuft wie in Kap. 20.5.3 und bestätigt die Behauptung. Definieren wir den ersten Term als die Brennweite f des Systems, so muss der zweite Term gleich dem Abstand der neuen bildseitigen Hauptebene von der äußeren Hauptebene H 2c der zweiten Linse sein. Die Rechnung verläuft wie in Kap. 20.5.3 und bestätigt die Behauptung.
20.5.5 Abbildungsfehler Bei der Abbildung eines Gegenstandes durch Hohlspiegel und Linsen hatten wir uns auf die paraxiale Näherung beschränkt. In diesem Fall wird ein Punkt eines senkrecht zur Symmetrieachse liegenden Gegenstandes (näherungsweise) in einen Punkt einer zur Gegenstandsebene parallelen Bildebene abgebildet. Bei Linsen gilt das aber nur bei der Verwendung von monochromatischem Licht. Besteht das Licht aus Wellen verschiedener Wellenlängen, so treten farbige Säume und dergleichen auf. Sie kommen durch die Dispersion des Linsenmaterials zustande: die Brechkraft hängt von der Wellenlänge ab. Weitere Bildfehler entstehen,
612
20 Geometrische Optik
wenn Licht unter größeren Abständen von der Achse oder schief einfallende Strahlen zugelassen werden, die paraxiale Näherung also ihre Gültigkeit verliert. Auf die sphärische Abberation wurde bereits hingewiesen. Das Bild wird zunehmend unscharf und es treten Verzerrungen auf. Durch spezielle Linsenkombinationen können die einzelnen Fehler stark reduziert werden. Im Folgenden sollen die wichtigsten Abbildungsfehler erläutert werden und soweit hier möglich Maßnahmen zu ihrer Korrektur angegeben werden.
20.5.5.1 Chromatische Aberration
Als Folge der Dispersion hängt die Brennweite von der Wellenlänge des Lichtes ab. Wie wir gesehen haben, nimmt der Brechungsindex (bei normaler Dispersion) von rot nach blau zu (Kap. 19). Daher liegt der Brennpunkt für blaues Licht von der Linse aus gerechnet vor dem für rotes Licht. Diese Wellenlängenabhängigkeit lässt sich gut beobachten, wenn weißes Licht durch einen kreisförmigen Schlitz einer Blende auf eine Linse fällt (Abb. 20.22). Wird ein Schirm langsam von der Linse aus in Richtung größerer Abstände verschoben, so tritt als Bild rot zuerst ein blauer Ring mit rotem Rand und dann ein roter Ring mit blauem Rand auf. Eine Verringerung der chromatischen Aberraion ist durch Verwendung eines Linsensystems FblauFrot aus zwei Linsen mit unterschiedlichen Brechungsindizes n1 und n2 möglich. Mit einem blau solchen Achromaten kann erreicht werden, dass die Brennweite für zwei Wellenlängen (Farben) Abb. 20.22: Chromatische Aberration O A und OB gleich sind. Zur Vereinfachung der einer Linse Schreibweise führen wir eine Größe ri ein:
ri
Ri1 Ri 2 , Ri1 Ri 2
(20.70)
wobei Ri1 , Ri 2 die beiden Krümmungsradien der jeweiligen Linse i sind. Setzen wir die Linsen unmittelbar hintereinander, so ist die resultierende Brechkraft des Achromaten nach (20.67) und (20.68)
1 f
(n1 1) r1 (n2 1)r2 .
(20.71)
Damit die Brechkraft für Licht der beiden Wellenlängen O A und OB gleich ist, muss die Beziehung gelten
(n1 A 1)r1 ( n2 A 1)r2
(n1B 1)r1 (n2 B 1)r2
(20.72)
20 Geometrische Optik
613
Es folgt
r1 r2
n 2B n 2A . n1B n1A
(20.73)
Für das Verhältnis der Brennweiten der beiden Linsen folgt durch Einsetzen in (20.55) oder (20.56)
f2 f1
n 2B n 2A n 2 1 . n1B n1A n1 1
(20.74)
aa aa aa aa aa aa
Da beide Brüche positiv sind, ergibt sich, dass die Linsenkombination aus einer Sammellinse und einer Zerstreuungslinse be- Abb. 20.23: Korrektur der chromatischen stehen muss (Abb. 20.23). Sind Aberration für eine gegebene Wellenländie beiden Materialien und die ge durch Kombination einer bikonvexen gewünschte Brennweite f vorge- und einer plankonkaven Linse geben, so können die Brennweiten der Einzellinsen berechnet werden. Bei der Festlegung der Linsenradien haben wir weitgehend freie Hand. Zweckmäßigerweise werden die beiden Innenradien gleich groß gewählt, so dass die Linsen verkittet werden können. Einer der drei Radien kann dann immer noch willkürlich festgelegt werden. Das Linsensystem wirkt als Sammellinse, wenn diese die geringere Dispersion hat.
20.5.5.2 Sphärische Aberration
Schon bei der Diskussion der Abbildungseigenschaften eines sphärischen Spiegels haben wir gesehen, dass ein unendlich ferner axialer punktförmiger Gegenstand nur dann näherungsweise als Punkt abgebildet wird, wenn der Öffnungswinkel bzw. Abstand y des Strahls von der Symmetrieachse hinreichend klein ist. Im Folgenden wollen wir einen zur Achse parallelen Strahl betrachten und die Brennweite als Funktion von y für eine reflektierende und eine brechende Fläche aufschreiben. Betrachten wir zuerst einen Hohlspiegel (Abb. 20.24). Die Brennweite ist
f
R c.
Dabei bestimmt sich c mittels des Sinussatzes :
(20.75)
614
20 Geometrische Optik
c
R 2cos D
R
1 2
1 sin 2 D
R
(20.76)
y2 1 2 R
Damit ergibt sich für f
§ ¨ 1 1 R ¨1 ¨ 2 y2 1 2 ¨ R ©
f
y2 1 2 R
| 1
(20.77)
Mit wachsendem Abstand y nimmt die Brennweite ab. Für nicht zu große D bzw. y/R können wir den zweiten Faktor annähern durch
Abb. 20.24: Sphärische Aberration bei einem sphärischen Spiegel und 1
· ¸ ¸. ¸ ¸ ¹
1 y2 , 2 R2
(20.78)
womit sich für f ergibt
f P y
c´
F
f n1=1
(20.79)
Für die Brechung an einer sphärischen Grenzfläche erhalten wir, wenn der Brechungsindex des ersten Mediums n = 1 und der des zweiten Mediums n = n ist, mit Hilfe des Sinussatzes (Abb. 20.25)
R M
R§ y2 · 1 ¨ ¸. 2 © 2R 2 ¹
n2= n f
Abb. 20.25: Zur Ableitung der Brennweite einer sphärischen Grenzfläche bei unterschiedlichem Achsenabstand des einfallenden Parallelstrahls und
§ · sin E R ¨1 ¸ © sin D cos E sin E cos D ¹
R c' § sin E · R ¨1 ¸ sin J ¹ ©
§ · 1 R ¨1 ¸ © n cos E cos D ¹
§ sin E · R ¨1 ¸ sin( D E) ¹ ©
(20.80a) (20.80b)
20 Geometrische Optik
615
§ 1 R ¨1 ¨ n 1 sin 2 E 1 sin 2 D ©
§ · 1 ¨1 ¸ n 2 sin 2 D 1 sin 2 D ¹ ©
· ¸. ¸ ¹
(20.80c)
§ ¨ 1 R ¨1 2 ¨ y y2 ¨ n 1 2 2 1 2 n R R ©
· ¸ ¸ ¸ ¸ ¹
(20.80d)
Dieser Ausdruck ist in Abb. 20.26 für R = 60 mm und n = 1,5 als Funktion von y aufgetragen. Es zeigt sich, dass auch in diesem Fall die Brennweite mit y abnimmt. Um die Abhängigkeit besser überblicken zu können, entwickeln wir wie oben die Wurzel bis zum zweiten Glied. § · 2nR 2 R ¨1 2 2 2 2 2 ¸ n R y nR ny 2 2 © ¹ 2
2
2
§ n(2nR y ) y · . R¨ 2 2 ¸ © (n 1)(2nR y ) ¹
f
§ · ¨ n ¸ 1 ¸ R¨ ¨ (n 1) 2n(n 1) R 2 ( 1 1 ) ¸ ¨ y 2 2nR 2 ¸¹ © (20.81)
Der zweite Term stellt das Korrekturglied erster Ordnung für die jeweilige Brennweite dar.
Brennweite (mm)
f
180 160 140 120 0.0 0.2 0.4 0.6 0.8 Relativer Strahlabstand y/R Abb. 20.26: Brennweite in Abhängigkeit des relativen Achsenabschnittes
20.5.5.3 Koma
Bei der Diskussion der sphärischen Aberration haben wir Strahlen symmetrisch zur Achse der brechenden Fläche betrachtet. Jetzt soll ein außeraxialer Gegenstandspunkt durch ein Parallelbündel bzw. ein weites Strahlenbündel abgebildet werden. Die Brechwinkel zugehöriger Strahlen diesseits und jenseits der Mittellinie (Abb. 20.27) sind jetzt unterschiedlich. Daher schneiden die Strahlen die Mittellinie an unterschiedlichen Stellen. Der Gegenstandspunkt wird verzerrt abgebildet. Aus einem Punkt wird eine einem Kometenschweif - ähnelnde Figur, die als Koma (vom Griechischen „Haar“) bezeichnet wird. Der Abbildungsfehler heißt KomaFehler. Ein Beispiel zeigt Abb. 20.28.
616
Abb. 20.27: Zur Entstehung des Komafehlers einer sphärischen Linse
20 Geometrische Optik
Abb. 20.28: Komafehler
20.5.5.4 Astigmatismus
Bei der Abbildung eines Gegenstandspunktes außerhalb der Symmetrieachse der Linse tritt auf Grund des unsymmetrischen Strahlengangs bereits bei kleinen Öffnungswinkeln ein weiterer Bildfehler auf. Statt eines Punktes entstehen zwei senkrecht zueinander liegende Bildlinien. Betrachten wir dazu Abb. 20.29. In dem vom abzubildenden Punkt G ausgehenden Strahlenbüschel sind zwei Ebenen hervorgehoben. Die eine Ebene ist durch die Punkte G, P1 , P2 festgelegt. Sie enthält die Symmetrieachse der Linse und die Mittelachse des Büschels und heißt Meridionalebene. Die andere, ebenfalls die Büschelachse enthaltene Ebene liegt senkrecht zu der ersten. Sie wird als Sagittalebene bezeichnet. Die Linsenkrümmungen in diesen Ebenen sind unterschiedlich. In der Meridionalebene wird der Strahl GP1 stärker, der Strahl GP2 schwächer als der Strahl GD gebrochen. Alle drei schneiden sich im Punkt GM . Die Strahlen in der Sagittalebene vereinigen sich aber wegen der schwächeren Brechung erst im Punkt BS , bilden also in der Bildebene von BM eine Linie. Im Punkt BS andererseits sind die Strahlen in der Meridionalebene bereits wieder zu einer Linie auseinandergelaufen. Ein außeraxialer Punkt wird also als zwei zueinander senkrecht liegende Linien in unterschiedlicher Entfernung von der Linse abgebildet. Die Differenz der Bildorte heißt astigmatische Differenz. Eine Korrektur kann durch eine Kombination einer konvexen mit einer Zylinderlinse erreicht werden. Letztere fokussiert ja nur die Strahlen, die senkrecht zur Zylinderachse liegen.
20 Geometrische Optik
617
Meridianebene
Bmeri
Bsag
Sagittalebene
Meridian
G
Abb. 20.29: Astigmatismus: Aus einem außeraxialen Punkt G entstehen in unterschiedlicher Entfernung zwei senkrecht zueinander liegende Linien BM und BS und
20.5.5.5 Bildfeldwölbung
Auch bei korrigiertem Astigmatismus erscheint das Bild von Punkten, die in einer zur Symmetrieachse der Linse senkrechten Ebene in unterschiedlicher Entfernung von der Achse liegen, nicht wieder in einer Ebene, sondern auf einer gewölbten Fläche (Abb. 20.30). Das liegt wieder an der unterschiedlichen Brechung der unter verschiedenen Winkeln einfallenden Strahlen. Auch die Bildfeldwölbung kann durch die Kombination verschiedener Linsen korrgiert werden
618
20 Geometrische Optik
a)
BiSchS BiSchM
b)
P1 P2 P3 Abb. 20.30: Bildfeldwölbung; a) Entstehung b) Je nach Entfernung des Bildschirms sind die abgebildeten Ringe unterschiedlich scharf
20.5.5.6 Verzeichnung
Zur Verringerung der sphärischen Aberration können durch eine kreisförmige Blende die Randstrahlen ausgeblendet werden. Dadurch tritt aber ein zusätzlicher Fehler auf. Der
Abb. 20.31: Tonnenförmige Verzeichnung
Abb. 20.32: Kissenförmige Verzeichnung
Abbildungsmaßstab ändert sich nämlich mit zunehmendem Einfallswinkel. Je nachdem die Blende vor oder hinter der Linse steht, kommt es zu einer tonnen- oder einer kissenförmigen Verzerrung, die als Verzeichnung bezeichnet wird (Abb. 20.31 und 20.32). Abhilfe kann geschaffen werden durch Benutzung eines Systems aus mindestens zwei Linsen, zwischen denen die Blende steht.
20 Geometrische Optik
619
20.5.5.7 Aplanatische Abbildung
In der Praxis geht es darum, nicht nur einen axialen Punkt, sondern auch dessen Umgebung verzerrungsfrei abzubilden. Zur Erzielung einer hinreichend großen Lichtstärke muss dabei der Öffnungswinkel möglichst groß sein. Das ist nur möglich, wenn die Abbesche Sinusbedingung (E. Abbe, 1840-1905) eingehalten wird. Befinden sich Gegenstand G und Bild B in Luft mit n = n´ = 1, lautet sie
sin u sin u c
B . G
(20.82)
Abb. 20.33: Zur Abbeschen Sinusbedingung für aplanatische Abbildung und
G u
u
B
Die Winkel u und u´ beschreiben die Öffnungswinkel zugehöriger Strahlen links und rechts der Linse (Abb. 20.33). Eine Abbildung unter Einhaltung der Sinusbedingung wird aplanatische Abbildung genannt. Soll ein ganzes Volumenelement mittels eines weit geöffneten Strahlenbüschels ohne Verzerrungen abgebildet werden, so müssen auch zwei benachbarte Punkte auf der Symmetrieachse verzerrungsfrei abgebildet werden. Die Bedingung dafür ergibt sich zu
sin 2 (u / 2) sin 2 (u c / 2)
nc dxc . n dx
(20.83)
Die Ableitung findet sich als Ergänzung 2 am Ende des Kapitels. Die beiden Ausdrücke widersprechen sich; ein Volumenelement kann also mittels großer Öffnungswinkel nicht verzerrungsfrei abgebildet werden. Das ist nur im Rahmen der paraxialen Näherung möglich.
20.5.6 Die Wirkung von Blenden Blenden im Strahlengang eines optischen Systems haben große Bedeutung. Wie aus der Entstehung der einzelnen Abbildungsfehler hervorgeht, können fast alle durch eine Verringerung der Öffnung geeigneter Blenden reduziert werden. Damit steigt auch die Schärfentiefe einer Abbildung. Natürlich geht das auf Kosten der Helligkeit. Blenden bestimmen darüber hinaus die Größe des Gesichtsfeldes. Dabei hängt die Güte der Abbildung entscheidend von
620
20 Geometrische Optik
ihrer Positionierung ab. Im Folgenden werden Öffnungsblende (Aperturblende) und Gesichtsfeldblende besprochen. Zunächst sei aber auf die Schärfentiefe bei der Abbildung durch eine Linse (bzw. eines Hohlspiegels) eingegangen. Wir denken uns dazu einen Gegenstand G0 dessen scharfes Bild in der Bildebene B0 erscheint. Bildfehler bleiben unberücksichtigt. Bei G einer Verschiebung des Gegenstandes in Richtung B v v GhG0 oder entgegengesetzt zur Linse entsteht aus einem d Punkt ein verwaschenes Scheibchen mit DurchF D F messer d. Diejenige Abweichung von a0, bei der das Scheibchen gerade so groß wie das Auflösungsvermögen des Auges in der deutlichen Sehgv bh g0 b0 weite ist, wird als Schärfentiefe bezeichnet. Wir gh bv; wollen diesen Bereich 'x zu beiden Seiten einer Blende Bildebene gewählten Gegenstandsweite g0 ermitteln Dazu denken wir uns auch die Brennweite sowie einen Abb. 20.34a: Zur Erläuterung des Blendendurchmesser DBl festgelegt, so dass wir Schärfentiefenbereichs die zugehörige Bildweite b0 ausrechnen können. Bei bekanntem Auflösungsvermögen lassen sich mit Hilfe des Strahlensatzes die Begrenzungen des bildseitigen Schärfebereiches (Abb. 20.34a) bestimmen. Das B -Zeichen steht für die Indizes l, r. 1
b l,r
§ d · b0 ¨1 B ¸ ; © D Bl ¹
Mit der Linsengleichung folgt für die Schärfentiefen 'x h
'x l
b0 f 2 d ; 'x r b0 f DBl b0 D Bl f df
a h a 0 und 'x v
a0 av
b0 f 2 d . b0 f DBl b0 DBlf df
Infolge des verschiedenen Vorzeichens des letzten Terms im Nenner unterscheiden sich die beiden Bereiche etwas.
20.5.6.1 Öffnungsblende
Die Öffnungsblende bestimmt die Helligkeit des Bildes. In Abb. 20.34b ist eine solche eingezeichnet. Es ist offensichtlich, dass sie, in Verbindung mit der vor ihr stehenden Linse, den maximalen Öffnungswinkel auf der Seite des Gegenstandes festlegt. Die von den beiden Linsen erzeugten Bilder der Blende heißen Pupillen. Das auf der Gegenstandseite des optischen Systems entstandene Bild wird als Eintrittspupille bezeichnet, das auf der Bildseite als Austrittspupille. Wird wie in Abb. 20.34c nur eine Linse verwendet, so
20 Geometrische Optik
621
fallen Öffnungsblende und Eintrittspupille (oder Öffnungsblende und Austrittspupille) zusammen. Der abzubildende Gegenstand sei als so klein vorausgesetzt, dass von allen seinen Punkten (gleich viel) Strahlungsenergie den Bildschirm erreicht. Das Verhältnis des Durchmessers der Eintrittspupille zur Brennweite einer Objektivlinse wird als Öffnungsverhältnis bezeichnet, wobei der Gegenstand als im Unendlichen liegend vorausgesetzt ist. Sein Kehrwert heißt Blendenzahl.
B
G E-Pup
Ö-Ble
A-Pup
Abb. 20.34b: Abbildung durch zwei Linsen: Eintrittspupille, Öffnungsblende und Austrittspupille
G Ö-Ble
B A-Pup
Abb. 20.34c: Bei der Abbildung mit nur einer Linse fallen Eintrittspupille und Öffnungsblende zusammen
20.5.6.2 Gesichtsfeldblende
Wir wollen jetzt einen transparenten ausgedehnten flächenhaften Gegenstand G betrachten (Abb. 20.35), der von einer punktförmigen Lichtquelle beleuchtet wird. Er wird von der Linse L in die Bildebene B abgebildet. In ihr befinde sich eine Blende GB L GB, die das zur Abbildung beitragende Lichtbündel begrenzt. Es B G wird also nur der Teil des Gegenstandes abgebildet, der innerhalb dieses Lichtbündels liegen. Die Blende fungiert als Gesichtsfeldblende. Es kann eine reale Blende sein, oder auch nur ihr Bild. Abb. 20.35: Wirkung der Gesichtsfeldblende GB Das gegenstandseitige Bild eines optischen Systems heißt Eintrittsluke, das bildseitige Austrittsluke. In Abb. 20.36 befinde sich im Bildpunkt der Lichtquelle eine Öffnungsblende ÖB. Die Eintrittspupille E-Pup fällt also mit der Quelle zusammen. Jeder im Gesichtsfeld liegende Punkt des Gegenstandes wird durch ein Lichtbündel, dessen Öffnungswinkel durch
622
20 Geometrische Optik
Abb. 20.36: Übersicht über die Lage der in den Abb. 20.34/35 eingeführten Blenden
E-Pup E-Luk
ÖB GB ZB-Eb A-Pup A-Luk
den Blendendurchmesser bestimmt ist, in der Ebene ZB abgebildet. Durch die dort angeordnete Gesichtsfeldblende kann das durch eine zweite Linse entstandene Bild scharf begrenzt werden. Austrittspupille und Austrittsluke sind aus Abb. 20.36 ebenfalls zu entnehmen. – Ist nur eine Linse vorhanden, so fallen Gesichtsfeldblende und Eintrittsluke (oder Gesichtsfeldblende und Austrittspupille) zusammen.
20.6 Anwendung der Strahlenoptik auf die Atmosphäre Das Zusammenwirken von Reflexion, Brechung und Beugung in der Atmosphäre führt zu einer Reihe von optischen Erscheinungen, von denen wir das des Himmelsblaus und einer roten Sonne bereits kennen gelernt haben. Hier wollen wir zwei weitere Phänomene erläutern, die vollständig oder in ihren wesentlichen Zügen auf der Grundlage der Strahlenoptik erklärt werden können. Es sind dies die Auswirkungen der Lichtbrechung und -spiegelung sowie das Auftreten des Regenbogens.
20.6.1 Lichtablenkung in der Atmosphäre Wie uns die barometrische Höhenformel zeigt, nimmt die Dichte der Luft mit wachsender Höhe ab. Damit verringert sich auch der Brechungsindex n. Ein Lichtstrahl, der von der Sonne oder einem Fixstern schräg in die Atmosphäre eintritt, wird daher zur Erdoberfläche hin gekrümmt. Bei hohem Luftdruck und niedrigen Temperaturen am Boden kann diese als atmosphärische Refraktion bezeichnete Abweichung große Werte annehmen. Der Krümmungsradius ergibt sich aus der Bedingung, dass bei einer radialen Abhängigkeit n = n(r) die optischen Wege ds1 und ds2 zwischen zwei Phasenflächen eines Parallelstrahlbündels gleich sein müssen (Abb. 20.37).
20 Geometrische Optik
623
(n-dn) ds1
Scheinbare Sternposition
a)
b)
Phasenflächen
dr n ds2
Zenit wirkliche Sternposition
s
r B Erde
d
Abb. 20.37: a) Astronomische Refraktion des Sternenlichtes; b) Krümmung eines Lichtstrahls durch einen radialen Dichtegradienten
Es sind
n( r ) r d M ;
ds1
ds2
n(r dr ) (r dr ) dM ,
(20.84)
so dass wir erhalten
r
n . dn / dr
(20.85)
Setzen wir dies in die linke obere Gleichung ein, so ergibt sich längs des Weges ds eine Strahlablenkung
dM
1 dn ds . n dr
(20.86)
Der Winkel zwischen dem Zenit und der geraden Verbindungslinie zwischen Beobachtungsort und Stern wird als Zenitdistanz bezeichnet. Es ist als zwischen scheinbarer und wirklicher Zenitdistanz zu unterscheiden. Für Winkel ] 80q lässt sich die atmosphärische Refraktion aus dem Ausdruck r 0,9 tan ] berechnen. Bei größeren ] müssen vertikale Temperaturschwankungen berücksichtigt werden. Auf die Krümmung der Lichtstrahlen ist auch das Auftreten von Luftspiegelungen zurückzuführen, etwa über einem heißen Straßenbelag oder in entsprechenden Wüstengegenden. Die meisten von uns haben sicher mit den erschöpften Reisenden gefühlt, denen eine Fata Morgana eine nahe kühlende Oase vortäuschte! In Abb. 20.38a ist die Situation nachgestellt. Von einer verlockend sprudelnden Quelle ausgehende gekrümmte Lichtstrahlen erreichen eine Karawane im Punkt B. Da die Reisenden mit
624
20 Geometrische Optik
ihren Augen der Krümmung nicht folgen können, erscheint vor Ihnen ein über dem Boden schwebendes umgekehrtes Bild der labenden Quelle
grad n
Wolkenloser, heller Himmel grad n Gleißend heller Bereich
Heiße Autobahn
Abb. 20.38a) dn/dr > 0: Fata Morgana einer Kühlung verheißenden nahen Oase; b) dn/dr < 0
Über heißen Flächen kommt auch der Fall vor, dass sich eine bodennahe heiße Luftschicht bildet, d.h. der Dichtegradient nimmt mit wachsender Höhe zunächst zu (Abb. 20.38b). Fällt ein Lichtbündel unter kleinen Winkeln ein, so wird er von der Erde weg gekrümmt. Das Auge des Beobachters sieht ein aufrechtes Bild des Gegenstandes im Punkt P. Auch der Effekt, dass der Beobachter über heißen Ebenen (z.B. der Autobahn) dicht über dem Horizont eine scheinbar in Bewegung befindliche „Wasseroberfläche“ sieht, beruht auf einer solchen Luftschichtung. Es handelt sich um das scheinbar gespiegelte Himmelslicht.
20.6.2 Regenbogen Ein Regenbogen erscheint einem Beobachter, der in Richtung einer von der Sonne S in seinem Rücken beschienenen Regenwand blickt (Abb. 20.39). Er bildet den Abschnitt eines Kreises, dessen Mittelpunkt M auf der über B hinaus verlängerten Gerade SB liegt. Ein nahezu halbkreisförmiger Regenbogen ist also nur zu beobachten, wenn die Sonne dicht am Horizont steht. Der Winkel zwischen den einfallenden Einfallendes NebenregenSonnenstrahlen und der Richtung, Sonnenlicht bogen unter der ihn der Beobachter sieht, beträgt ca. 42°. Häufig wird noch ein zweiter Regenbogen mit geringerer Intensität beobachtet. Er erscheint Sonne B oberhalb des Ersten unter einem Hauptregen42° 51° Öffnungswinkel von ca. 51°. Der bogen intensivere der beiden Regenbögen, M der Hauptregenbogen, kommt durch einmalige Totalreflexion der LichtAbb. 20.39: Haupt- und Nebenregenbogen
20 Geometrische Optik
625
strahlen in einem Wassertropfen zustande, der Nebenregenbogen durch zweimalige. Deswegen folgen die Spektralfarben einander in umgekehrter Reihenfolge wie im Hauptregenbogen. Entsprechend der normalen Dispersion von Wasser erscheinen hier von außen nach innen die Spektralfarben mit abnehmender Wellenlänge. Der Öffnungswinkel für den Hauptregenbogen ergibt sich wie folgt (Abb. 20.40): Ein Lichtstrahl treffe einen kugelförmigen Regentropfen im Punkt A. Der gebrochene Strahl erreicht die Rückseite im Punkt B. Nach Reflexion gelangt er im Punkt C wieder an den vorderen Rand, wo er erneut gebrochen wird. Die Verlängerung des Einfallsstrahls und des Ausfallsstrahls schneiden sich im Punkt P. Für den Ablenkwinkel M gilt 2(D u ) M 2S . (20.87)
A
P
u
B
Abb. 20.40: Zur Ableitung des Öffnungswinkels des Hauptregenbogens
C Aus dem Dreieck AOB folgt
2ßu S .
(20.88)
Durch Einsetzen von (20.89) in die obere Gleichung lässt sich u eliminieren
2D 4 ß M
0.
(20.89)
Den Winkel ß können wir mit Hilfe des Brechungsgesetzes eliminieren.
sin D sin E
nWasser {n nLuft
(20.90)
Damit erhalten wir für den Zusammenhang zwischen Ablenk- und Einfallswinkel
M
§ sin D 4arcsin ¨ © n
· ¸ 2D . ¹
(20.91)
Mit sin D = z/R können wir dies auch schreiben als
M
4arcsin( z / nR ) 2arcsin( z / R ) .
(20.92)
626
20 Geometrische Optik
Der Ablenkwinkel durchläuft mit wachsendem Einfallswinkel D bzw. z ein Maximum. Differentiation ergibt
dM d ( z / R)
4/n 1 ( z / nR )
2
2 1 ( z / R)2
.
(20.93)
Nullsetzen der Ableitung führt zu
z
R
1 (4 n 2 ) 3
(20.94)
Mit dem Brechungsindex des Wassers, n = 1,33, folgt für den Ablenkwinkel
Mmax
42q .
(20.95)
Auf ähnliche Weise lässt sich der Ablenkwinkel für den Nebenregenbogen finden. Da es sich bei den Winkeln um Extrema handelt, häufen sich in ihrer Nähe die reflektierten Strahlen, so dass die Intensität dort maximal wird. Haupt- und Nebenregenbogen in der beschriebenen Form lassen sich also allein durch Anwendung des Reflexions- und Brechungsgesetzes erklären. Die Betrachtungsweise geht auf R. Descartes (1596-1650) zurück. Allerdings können feinere Details auf diese Weise nicht erklärt werden. Das betrifft z.B. schwache, sog. sekundäre Regenbögen, die im Bereich des Hauptregenbogens auftreten können; dazu muss die Wellennatur des Lichtes berücksichtigt werden.
Ergänzung 1: Matrizenmethoden der paraxialen Optik Wir sprechen von der paraxialen Näherung der Optik, wenn in den Gleichungen für Ausbreitung und Brechung der Lichtstrahlen die Winkelfunktionen so kleine Werte annehmen, dass sie linearisiert werden können. In diesem Sinn ist ein Lichtstrahl in jedem Punkt P(x,y) durch Angabe seines Abstandes y von der optischen Achse und seinen Winkel D gegen die Achse festgelegt (Abb. 20A.1). Die beiden Parameter lassen sich in einer Matrix anordnen. Da
y Abb. 20A.1: Festlegung eines Lichtstrahls in paraxialer Näherung und
P(x,y) x
20 Geometrische Optik
627
das für jeden Punkt des Lichtweges möglich ist, kann wegen der Linearität auch der Verlauf des Lichtstrahls von einem Punkt zu einem anderen Punkt durch eine Matrix dargestellt werden. Durch Einbeziehung des Brechungsgesetzes bzw. des Reflexionsgesetzes lässt sich der Gesamtverlauf eines Lichtstrahls durch die Multiplikation der entsprechenden Matrizen berechnen, was in vielen Fällen die Problemlösung erheblich erleichtert. Wir besprechen hier die Grundoperationen der Matrix-Methode und wenden sie beispielhaft auf einige einfache Fälle an.
20A1.1
Die Brechungsmatrix
Wir betrachten eine sphärische Grenzfläche (1) mit dem Krümmungsradius R1. Der Brechungsindex auf der linken Seite sei mit n bezeichnet, der auf der rechten Seite mit n´ (Abb. 20A.2). Das Brechungsgesetz schreiben wir in der Form
ncß
nD
(20A1.1)
Entsprechend Abb. 20A.2 gelten die Verknüpfungen
D D1 J , ß D1c J .
r r1
1
1
n (20A1.2)
x1
n
R1
ß
r r1
x1
Die Winkel D, ß, Dp sind positiv, wenn sich die Strahlrichtung durch Drehung entgegen dem Uhrzeigersinn ergibt. Damit erhalten wir
n(D1 J ) nc(J D1c) , (20A1.3a)
Abb. 20A.2: Zur Ableitung der Brechungsmatrix
ncD1c nD1 (nc n)J ,
(20A1.3b)
( nc n ) x1 . R1
(20A1.3c)
ncD1c nD1
Der zweite Term auf der rechten Seite stellt die Brechkraft P der Grenzfläche dar.
P1
( nc n ) . R1
(20A1.4)
628
20 Geometrische Optik
Den Lichtstrahl auf der linken und rechten Seite beschreiben wir durch die Spaltenmatrizen
r1
§ nD1 · ¨ ¸. © x1 ¹
§ ncD c · r1c ¨ 1 ¸ © x1c ¹
und
(20A1.5)
und die Brechung des Strahls gemäß (20A1.3c) durch die Brechungsmatrix B1
B1
( nc n ) · § § 1 P1 · ¨ 1 R1 ¸ . ¨ ¸ ¨ ¸ 0 1 © ¹ ¨0 ¸ 1 © ¹
(20A1.6)
Damit können wir die Brechung eines Lichtstrahls durch die Grenzfläche (1) beschreiben durch
r1c B1 r1 .
20A1.2
(20A1.7)
Die Translationsmatrix
Wir fragen nach der Translationsmatrix, die einen Lichtstrahl innerhalb eines Mediums mit Brechungsindex n von der rechten Seite eines optischen Elements zur linken Seite eines zweiten Elements überführt. Nach Abb. 20A.3 ist
nD 2 x2 wobei x12
2
(20A1.8a/b)
x2 x1c | d12 .
In Matrixschreibweise lässt sich das schreiben als
1
x12 x1
nD1c , x1c x12D1c .
x2
§ 1 § nD 2 · ¨ x12 ¨ ¸ © x2 ¹ ¨¨ © n
0· ¸ § nD1c · , (20A.1.9) ¨ ¸ 1 ¸¸ © x1c ¹ ¹
wobei Abb. 20.A3: Zur Ableitung der Transformationsmatrix einer Linse
T12
§ 1 ¨ ¨¨ x12 © n
0· ¸ 1 ¸¸ ¹
(20A1.10)
als Translationsmatrix bezeichnet wird. Der Brechungsindex n in (20A1.8a) wurde aus Gründen der Allgemeinheit hinzugefügt.
20 Geometrische Optik
20A1.3
629
Die Transformationsmatrix
Wir wollen den Fall betrachten, dass ein Lichtstrahl aus einem Medium mit dem Brechungsindex n auf eine Linse mit den Krümmungsradien R und R´ und dem Brechungsindex nL fällt und von dieser in ein Medium mit dem Brechungsindex n´ gebrochen wird (Abb. 20A.4). Die Brechkräfte der linken bzw. rechten Grenzfläche sind entsprechend (20A1.4)
P
( nL n) und Pc R
n
Abb. 20A.4: Zur Berechnung der Transformationsmatrix einer Linse mit den Krümmungsradien R und R´
( n c nL ) Rc
nL
R
n´
R
(20A1.11a/b)
wobei die Vorzeichen von R, R´ zu beachten sind. Die Transformationsmatrix, die den Lichtstrahl r1
§ ncD 2c · § nD1 · ¨ ¸ in den Lichtstrahl ¨ c ¸ x © 1 ¹ © x2 ¹
überführt (s. Abb. 20A.4), muss die Form haben
ML
B 2T12 B1 .
(20A1.12)
Die Matrizen beschreiben (nach den Regeln der Matrizenrechnung von rechts nach links) die Brechung an der linken Grenzfläche (1), die Ausbreitung innerhalb der Linse von der linken zur rechten Seite und die erneute Brechung an der rechten Grenzfläche (2). Die Einzelmatrizen sind folglich nach den Abschnitten 20A1.2 und 20A1.3 gegeben durch:
( n n) · § 1 L ¨ B R ¸ ¨¨ ¸¸ 1 ©0 ¹
T12
§ 1 ¨ ¨ x12 ¨n © L
0· ¸. 1 ¸¸ ¹
und
( nc nL ) · § 1 ¨ c B Rc ¸ ¨¨ ¸¸ 1 ©0 ¹
(20A1.13a/b)
(20A1.14)
630
20 Geometrische Optik
Die Multiplikation ergibt
§ (nc nL ) x12 ¨1 R c nL ¨ ¨ x12 ¨ nL ©
M L
( nL n) (nc nL ) ( nL n) (nc nL ) x12 · R Rc R Rc nL ¸ ¸ (20A1.15) ¸ (nL n) x12 1 ¸ R nL ¹
Für eine dünne Linse gilt x2 – x1 | 0 und die Transformationsmatrix vereinfacht sich zu
M Ldünn
20A1.4
( nL n ) ( n c nL ) · § ¨1 R Rc ¸ . ¨ ¸ ¨0 ¸ 1 © ¹
(20A1.16)
Hauptebenen
Die Brechung durch eine dünne Linse kann bekanntlich ersetzt werden durch eine solche an ihrer Mittelebene. Die Abbildungsgleichung einer dünnen Linse lässt sich auch für eine dicke Linse oder ein Linsensystem beibehalten, wenn die Mittelebene der Linse durch die Hauptebenen H und H´ ersetzt werden, an denen – formal – die Brechung erfolgt. Dieses bewährte Konzept soll hier in Matrixschreibweise formuliert werden. In (Abb. 20A.5) bezeichne H´ H das schraffierte Gebiet ein irgendwie geartetes Linsensystem, z.B. eine dicke Linse. Ihre Scheitelpunkte seien mit S und S´ bezeichnet, die Hauptebenen H und H´ haben von ihnen den Abstand d und d´. Der Wert von d ist größer null, wenn H links von S liegt; entsprechend ist d´ > 0, wenn H´ sich rechts S S´ von S´ befindet. Der Brechungsindex auf der n n´ linken Seite des Linsensystems sei mit n benannt, der auf der rechten Seite mit n´. Wir gehen davon aus, dass die Matrix, die einen d d´ Lichtstrahl in der zur Symmetrieachse der Linse senkrechten Ebene durch S in eine solche Abb. 20A.5: Zur Einführung der Hauptin der Ebene durch S´ überträgt, bekannt ist. ebenen einer dicken Linse in Matrixform und
20 Geometrische Optik
631
Sie hat die allgemeine Form
M SS '
§ M 11 ¨ © M 21
M 12 · ¸ M 22 ¹
(20A1.17)
mit der zusätzlichen Bedingung
det M SS ' 1 .
(20A1.18)
Die Verknüpfung zwischen dieser Matrix und der Matrix der Hauptebenen-Darstellung ist
M HH '
T c M SS ' T ,
(20A1.19)
wobei die Translationsmatrizen gegeben sind durch
§ 1 0· ¸ T c ¨ d c ¨¨ 1 ¸¸ © nc ¹
und
T
§1 ¨ ¨¨ d ©n
0· ¸ . 1 ¸¸ ¹
(20A1.20a/b)
Damit erhalten wir für
M HH '
d § M 11 M 12 ¨ n ¨ c c d d d d ¨M ¨ 11 nc M 12 nnc M 21 M 22 n ©
· ¸ ¸. dc ¸ M 22 M 12 ¸ nc ¹ M 12
(20A1.21)
Diese Matrix muss die gleiche Form wie die entsprechende Matrix (20A1.16) für eine dünne Linse haben; also ist sie von der Gestalt
M HH '
§ 1 M 12 · ¨ ¸. ©0 1 ¹
(20A1.22)
Durch Vergleich ergibt sich
M 11 M 12
d n
1
und
M 22 M 12
dc 1. nc
(20A1.23a/b)
632
20 Geometrische Optik
Lösen wir sie nach d und d´ auf, so folgt für die Lage der Hauptebenen bezogen auf die Scheitelpunkte S, S´
n (1 M 11 ) M 12
d
und
dc
n' (1 M 22 ) . M 12
(20A1.24a/b)
Die Brechkraft des optischen Systems lässt sich durch Vergleich von (20A1.22) mit (20A1.15) ermitteln:
PLi S y
M 12 .
(20A1.25)
Für die rechte Seite erhalten wir durch Vergleich des (2,1)-Elementes in M HH ' und M Ldünn
M 11
dc d dc d M 12 M 21 M 22 nc nnc n
0
(20A1.26)
und mit (20A1.25)
PLi S y
M 12
nM 11 nc M 22 nnc M 21 . d dc d dc
(20A1.27)
20A1.5 Anwendung auf dicke Linsen Als Beispiel wollen wir die allgemeinen Ergebnisse des letzten Abschnitts auf dicke Linsen anwenden. Nach (20A1.15) sind die Elemente der Transformationsmatrix M S , S c , wenn wir der Übersichtlichkeit halber die Brechkräfte P und P´ benutzen
Pcd L ; M 11 1 nL PPcd L P Pc; M 12 nL M 21
dL ; nL
Pd M 22 1 L . nL
(20A1.28)
20 Geometrische Optik
633
Daraus folgt mit (20A1.27) für die Brechkraft
P Pc
PLdick
PPcd L , nL
(20A1.29)
und die Lagen der Hauptebenen ergeben sich zu
d
nPc dL nL Pl
und
dc
nc P dL . nL Pl
(20A1.30a/b)
Schließlich erhalten wir für den Abstand der Hauptebenen voneinander
dH H c
§ nPc nc P · d L d d c d L ¨1 ¸. © nL Pl nL Pl ¹
(20A1.31)
Die Brechkräfte der beiden Grenzflächen der Linse seien hier noch einmal angefügt.
P
( nL n) ; R
Pc
( n c nL ) . Rc
(20A1.4)
20A1.6 Abbildungsmatrix einer Linse Es fehlt noch die Beschreibung der Abbildung eines Objektpunktes A durch eine Linse (oder ein optisches System) in einen Bildpunkt B (Abb. 20A.6). Sie wird dargestellt durch
§ ncD c · ¨ c ¸ © x ¹
§ nD · M ABB ¨ ¸ © x ¹
.(20A1.32)
Hierin bezeichnet M ABB die Abbildungsmatrix. Diese ist gegeben durch
M ABB
T cM HH cT ,
(20A1.33)
wobei M HH c wie in (20A1.15) die Brechung der Lichtstrahlen in der Hauptebenendarstellung bedeutet.
A X
n
n´
B x’
Abb. 20A.6: Abbildung eines Objektpunktes A in einen Bildpunkt B durch ein optisches System
634
20 Geometrische Optik
Die Ausrechnung ergibt
M ABB
§ 1 0· §1 ¨ ¸ § 1 M 21 · ¨ ¨¨ b 1 ¸¸ ¨© 0 1 ¸¹ ¨¨ a © nc ¹ ©n
M ABB
PL a § · PL ¸ ¨ 1 n ¨ ¸; ¨ a b PL ab 1 PL b ¸ ¨ ¸ nc ¹ © n nc nnc
PL
PLdick
P Pc
0· ¸; 1 ¸¸ ¹
(20A1.34a)
(20A1.34b)
PPcd L . nL
(20A1.35)
Für eine Linse, die von Luft umgeben ist (n = n´ = 1), vereinfacht sich die Abbildungsmatrix zu
PL · § 1 PL a ¨ ¸; © a b PL ab 1 PL b ¹
M ABB
PL
1 f
°§ 1 1 · d ½° ( nL 1) ®¨ ¸ (nL 1) L ¾ . RRc °¿ ¯°© R Rc ¹
(20A36)
Setzen wir diesen Ausdruck in die Ausgangsgleichung (20A1.32) ein, so erhalten wir die Abbildungsgleichung für eine Linse in Luft
a 1 · § 1 ¸ ¨ f f §D · § Dc· ¸¨ ¸ ¨ c¸ ¨ © x ¹ ¨ a b ab 1 b ¸ © x ¹ ¨ f f ¸¹ ©
§ § a· D ¨1 ¸ ¨ f ¹ © ¨ ¨ § · ¨ D ¨ a b) ab ¸ ¨ f ¹ © ©
· ¸ ¸. ¸ x f b ¸¸ f ¹
x f
(20A1.37)
20 Geometrische Optik
20A1.7
635
Darstellung des elektrischen Feldvektors
Ein beliebiger elektrischer Feldvektor ist bei Benutzung kartesischer Koordinaten gegeben durch
G E
Ex eˆx E y eˆy .
(20A1.38)
Zwischen den beiden Komponenten können Phasendifferenzen bestehen, so dass die Feldkomponenten komplex werden. In Matrixschreibweise schreibt sich das Feld deswegen
G E
§ Ex · ¨ ¸ © Ey ¹
§ E0 x eiM x ¨ ¨ E eiM y © 0y
· ¸. ¸ ¹
(20A1.39)
Wollen wir allein die Polarisationsrichtung des Feldes darstellen, so ist es zweckmäßig, den auf G E normierten Vektor zu verwenden.
G § Jx · J ¨ ¸ © Jy ¹
1 G E
§ E0 x eiM x ¨ ¨ E0 y eiM y ©
· ¸. ¸ ¹
(20A1.40)
Da es nur auf die Phasendifferenz der Feldkomponenten ankommt, können wir z.B. Mx = 0 G setzen. Der Vektor J heißt Jones-Vektor.
Ergänzung 2: Abbesche Sinusbedingung Es sollen achsennahe Punkte mittels eines weiten Strahlenbündels durch eine brechende Fläche in entsprechende Bildpunkte verzerrungsfrei abgebildet werden (Abb. 20A.7). Dazu muss die Abbesche Sinusbedingung erfüllt werden, die wir hier ableiten wollen. G G Wir betrachten dazu ein Geradenstück dG , das in ein solches mit dB bezeichnetes abgebildet werden soll. Ein vom unteren Ende G1 ausgehender Strahl habe die Richtung sˆ1 , treffe die brechende Fläche im Punkt P1 und erreiche in der Richtung sˆ2 den Bildpunkt B1. Der obere Endpunkt G2 werde durch den Strahl der Richtung sˆ1 dsˆ1 und sˆ2 dsˆ2 in den Bildpunkt B2 überführt. Wird der Brechungsindex auf der linken Seite der brechenden Fläche mit n1 bezeichnet, auf der rechten Seite mit n2 , so gilt nach Abb. 20A.7
L1
(G1 B1 ) n1s1 n2 s2 und L2
(G2 B2 ) n1 ( s1 ds1 ) n2 ( s2 ds2 ) . (20A2.1)
636
20 Geometrische Optik
G G Die Abbildung erfolge durch Lichtbündel, deren Mittelstrahlen s1 und s2 sind. Nach dem Fermatschen Prinzip sind die Lichtwege L1 und L2 für alle Strahlen des Büschels konstant,
r r s + ds
s + ds
r da
G rs
s n
-u
r r s + ds
r db
s’
n´
s + ds u´
s´
r da
B
Abb. 20A.7: Ableitung der Bedingung für verzerrungsfreie Abbildung eines achsennahen Punktes durch weite Strahlenbündel (Abbesche Sinusbedingung) d
G G folglich auch ihre Differenz. Diese können wir durch sˆ1 , sˆ2 , dG, dB ausdrücken.
Die Summe der Begrenzungen im geschlossenen Viereck G1G2P1P2 ist
G G dG ( s1 ds1 )( sˆ1 dsˆ1 ) dc s1sˆ1
0.
(20A2.2)
Multiplizieren wir diesen Ausdruck skalar mit sˆ1 , so ergibt sich
ds1
G G sˆ1 dc sˆ1 dG .
(20A2.3)
Analog erhalten wir durch Betrachtung des Vierecks B1B2P1P2
ds2
G G sˆ2 dB sˆ1 dc .
(20A2.4)
Damit folgt für L1-L2
L1 L2
const
G G G G G n1 sˆ1 dG n1sˆ1 dc n2 s2 dc n2 sˆ2 dB .
(20A2.5)
Es ist nun
G sˆ1 dc
G G dc cos( sˆ1 , dc ) : dc cos J 1 und sˆ2 dc
G dc cos( sˆ2 , dc ) : dc cos J 2 ,
Das Brechungsgesetz lautet
n1 sin D
n1 sin(90 J 1 )
n1 cos J 1
n2 sin E
n2 cos J 2 ,
(20A2.6)
20 Geometrische Optik
637
also erhalten wir durch Einsetzen der Gln. (20A2.6)
G n1sˆ1 dc
G n2 sˆ2 dc .
(20A2.7)
G Es lässt sich zeigen, dass diese Beziehung auch noch gilt, wenn dc nicht in der Einfallsebene G G von s1 bzw. s2 liegt. Durch Einsetzen in (20A2.5) ergibt sich
L1 L2
const
G G n1sˆ 1dG n2 sˆ2 dB .
(20A2.8)
G G Ein Strahl des Lichtbüschels bilde mit dG (dB) den Winkel [ 0,1 ([ 0,2 ) .
Dann gilt für jeden Strahl
n1 dG cos [1 n2 dB cos [ 2
n1 dG cos [ 0,1 n2 dB cos [ 0,2
(20A2.9)
G G Es mögen nun die Vektoren dG, dB senkrecht zur Symmetrieachse eines rotationssymmetrischen abbildenden Systems liegen, so dass [ 0,1 [ 0,2 S / 2 ist.
Da [1
S / 2 u1 , [ 2 S / 2 u2 ist, folgt mit dA o A, dB o B
n1 A sin u1
n2 B sin u2
(20A2.10)
Dies ist die Abbesche Sinusbedingung. Sie muss erfüllt sein, damit ein achsensenkrechter Gegenstand punktweise auch mit großen Öffnungswinkeln verzerrungsfrei abgebildet wird. Um zu prüfen, ob ein Volumenelement verzerrungsfrei abgebildet werden kann, legen wir G dG in die Symmetrieachse. Es ist also
[1 u1 , [ 2
G u2 , dG
G dx1 , dB
dx2 .
(20A2.11)
Damit erhalten wir jetzt als Bedingung für die Tiefenschärfe
n1 dx1 sin 2 (u1 / 2) n2 dx2 sin 2 (u2 / 2)
(20A2.12)
Die beiden Bedingungen widersprechen sich, sofern u1, u2 nicht sehr klein sind. Es ist also nicht möglich, ein Volumenelement mit weiten Lichtbündeln verzerrungsfrei abzubilden. Nur bei der Reflexion an einem ebenen Spiegel (n1 = n2 , A = B, u1 = -u2) finden wir das nicht.
638
20 Geometrische Optik
Zusammenfassung x Können bei der Ausbreitung einer Lichtwelle Interferenz-, Beugungs- und Polarisationseffekte vernachlässigt werden, so kann diese mit Hilfe von Lichtstrahlen beschrieben werden. x Der Winkel, unter dem wir einen Gegenstand sehen, heißt Sehwinkel. Der Abbildungsmaßstab ist definiert als das Verhältnis von Bild- zur Gegenstandsgröße. x Bei einem Prisma mit dem brechenden Winkel J besteht im Minimum der Ablenkung zwischen dem Ablenkungswinkel Gmin und dem Einfallswinkel die Relation
D1 (G min J ) / 2 x Die Abbildungsgleichung einer dünnen Linse mit den Krümmungsradien R1 und R2 und dem Brechungsindex n ist
1 1 a b
§ 1 1 · ( n 1) ¨ ¸ © R1 R2 ¹
1 ; f
a bzw. b sind Gegenstands- bzw. Bildweite. x Bei einer dicken Linse treten an die Stelle der Mittelebene einer dünnen Linse die Hauptebenen. Bei einer beiderseits von Luft umgebenden bikonvexen Linse mit Brechungsindex n der Dicke d und den Krümmungsradien R1 und R2 ist ihr Abstand von den Scheitelpunkten
h
(n 1) f d nR2
bzw.
h'
( n 1) f d . nR1
x Die Brennweite der Linse f ergibt sich aus den Einzelbrennweiten f1 und f2 der beiden Begrenzungsflächen zu
f
f1 f 2 . f1 f 2 d
Diese Beziehung gibt auch die Brennweite eines aus zwei dünnen Linsen bestehenden Systems an, die voneinander den Abstand d haben. x Jedes optische System erzeugt Abbildungsfehler. Bei Linsen sind die wichtigsten Fehler die chromatische und die sphärische Aberration, der Astigmatismus, die Bildfeldwölbung und der Komafehler.
20 Geometrische Optik
639
x Für achsennahe Strahlen (in der paraxialen Näherung) lässt sich die optische Abbildung mit Hilfe von Matrizen darstellen. Die Abbildung durch eine Kombination mehrerer Linsen ergibt sich als Produkt der Matrizen der einzelnen Komponenten. Die Berechnungen von Linsensystemen werden dadurch wesentlich vereinfacht. x Die Öffnungsblende bestimmt die Helligkeit des Bildes; sie legt in Verbindung mit der vor ihr stehenden Linse den maximalen gegenstandseitigen Öffnungswinkel fest. Die Gesichtsfeldblende begrenzt das zur Abbildung beitragende Lichtbündel.
Übungsaufgaben 1. Ein monochromatisches Lichtbündel fällt unter dem Winkel D = 45° auf die Seitenfläche eines gleichseitigen Glasprismas (n = 1,5), das sich in einer Luftatmosphäre befindet. Um welchen Winkel wird das Licht abgelenkt? 2. Ein paralleles Lichtbündel fällt symmetrisch zur optischen Achse auf einen Spiegel und wird von diesem in einem Punkt fokussiert. Was für ein Spiegel leistet das? Begründen Sie ihre Antwort durch Anwendung des Fermatschen Prinzips. 3.
Auf einen sphärischen Hohlspiegel mit dem Krümmungsradius R = 0,8 m fallen achsenparallele Lichtstrahlen im Abstand h von der optischen Achse ein. Wo liegen ihre Schnittpunkte mit der optischen Achse für die Fälle h = 4 cm bzw. h = 30 cm?
4
Eine dünne Linse entwirft von einem 9 m entfernten Gegenstand im Abstand von 4,5 m auf einem Schirm ein scharfes Bild. Welche Brennweite besitzt die Linse?
5.
Es sei eine Bikonvexlinse (n = 1,5) mit dem Krümmungsradius von 9 cm und einer Dicke von 3,5 cm gegeben. Berechnen Sie den Abstand der Hauptebenen von der Mitte der Linse.
6. Ein Teleobjektiv besitze eine Brennweite von 135 mm. Bei der Einstellung auf unendliche Entfernung beträgt der Abstand des Scheitels der Frontlinse von der Filmebene 120 cm. Zur Scharfstellung auf einen 1 m entfernten Gegenstand (gemessen von der Filmebene) muss das Objektiv um 25,8 mm nach vorne verschoben werden. Berechnen Sie die Lage der Hauptebenen bezüglich des Frontlinsenscheitels. 7.
Zum Bau eines Teleobjektivs stehen Ihnen zwei dünne Linsen mit den Brennweiten f1 = 60 mm und f2 = 120 mm zur Verfügung. In welchem Abstand voneinander ordnen Sie die Linsen an?
8. Eine dünne Linse mit den Krümmungsradien R1 = 12 cm und R2 = 25 cm. Wie groß sind die Brechungsindizes, wenn die Brennweite bei O= 600 nm f = 475,8 mm und für O = 400 nm f = 461,5 mm beträgt?
640 9.
20 Geometrische Optik Berechnen Sie mit Hilfe der Matrixmethode die Brechkraft und die Lage der Hauptebenen für die Kombination zweier Linsen mit der gleichen (positiven) Brechkraft P im Abstand d voneinander für die Fälle a) d = 1/P; b) d = (3/4)(1/P). y2
10. In nebenstehender Skizze ist als Gegenstand eine ausgedehnte, flächenhafte Lichtquelle zu sehen. Weiter sind einige charakteristische Strahlen eingezeichnet. Diskutieren Sie die Auswirkungen der beiden Blenden auf das entstehende Bild.
y1 0
-y1 -y2
21
Interferenz und Beugung
Interferenz und Beugung sind typische Welleneigenschaften. Wir haben sie schon bei der Besprechung mechanischer Wellen kennen gelernt; denken wir z.B. an die stehenden Wellen bei Musikinstrumenten, die durch Interferenz zweier gegenläufiger Wellen zustande kommen oder an die Überlagerung zweier sich radial von benachbarten Punkten ausbreitenden Wasserwellen. Auch die Beugung von Schallwellen kennen wir von Kindesbeinen an, denn Schall nehmen wir auch dann wahr, wenn sich etwa die Schallquelle hinter einer Hausecke befindet: Schall geht „um die Ecke“. Das liegt daran, dass die Wellenlänge von Schallwellen vergleichbar ist mit den Abmessungen von Hindernissen im täglichen Leben. Interferenz und Beugung von Lichtwellen machen sich wegen ihrer um Größenordnungen kleineren Wellenlängen nur in Sonderfällen bemerkbar, zumal das Licht der meisten Lichtquellen aus unterschiedlichen Wellenlängen besteht. Ein Beispiel sind die auf Interferenzen beruhenden „Farben dünner Blättchen“, die bei dünnen Ölhäuten oder Seifenblasen zu beobachten sind. Das Auftreten von Interferenzen setzt in der Regel (nahezu) monochromatisches Licht voraus, das Licht muss kohärent sein. Im Folgenden soll dieser Begriff genauer gefasst werden. Anschließend werden typische Interferenzphänomene besprochen. Der zweite Teil behandelt Beugungserscheinungen. Interferenz bzw. Beugung bestimmen das geometrische Auflösungsvermögen optischer Instrumente. Auf ihnen beruhen weiter die Wirkungsweise der Spektralapparate und andere Anwendungen.
21.1
Interferenz
21.1.1 Zeitliche und räumliche Kohärenz Es sei eine Lichtquelle gegeben, die zeitlich begrenzte Wellenzüge der spektralen Breite 'Q bzw. 'Z abstrahlen möge. Wir betrachten zwei Wellen mit den Frequenzen Z + 'Z/2 und Z - 'Z/2.
G E1
G i (Z 'Z / 2)t M1` E01e ^ 0
und
G E2
G i (Z 'Z / 2)t M2 ` E02 e ^ 0 .
(21.1)
Ihre Phasendifferenz in einem gegebenen Raumpunkt P beträgt
'M (t ) (Z1 Z2 )'t
(21.2)
Das Zeitintervall 'tc , in dem sich die Phasendifferenz der zwei (und aller anderer) im Punkt P überlagerten Wellen um maximal 2S ändern, heißt Kohärenzzeit 'tc . Wie wir (21.2) entnehmen können, ist sie mit der spektralen Breite 'Q des gegebenen Lichtfeldes verknüpft. Nach der Kohärenzzeit 'tc wird 'M 2S , so dass sich für erstere ergibt
'tc
1 'Q
2S . 'Z
(21.3)
642
21 Interferenz und Beugung
Unter der Kohärenzlänge verstehen wir die Strecke 'lc , die das Licht während der Kohärenzzeit zurücklegt.
'lc
c 'tc
1 'Q
(21.4)
Weitere wichtige Größen sind Kohärenzfläche und -volumen. Betrachten wir eine flächenhafte Lichtquelle AB (Abb. 21.1), die aus vielen voneinander unabhängig strahlenden Sendern besteht, die alle Licht der gleichen Frequenz, aber unterschiedlicher Phase aussenden können. Jeder Phasensprung eines einzelnen Senders beeinflusst die Phase der am Beobachtungsort eintreffenden Wellen. Für die Wellen, die unter einem Winkel u gegen die Flächennormale ausgesendet werden, kommt noch ein vom Wegunterschied bedingter PhasenunterP2 schied hinzu. Damit die Kohärenz der Wellen gewährleistet ist, muss gelten
s2
AB sin u O / 2
oder ' rMi S . (21.5)
Das Wellenfeld wird in diesem Fall als räumlich kohärent bezeichnet. Die Kohärenzfläche Ac ist dadurch definiert, Q dass auf einer zur Ausbreitungsrichtung s1 P1 senkrechten Ebene die Phasendifferenz null ist. Das Produkt aus Kohärenzfläche Abb. 21.1: Durchlaufen zwei aus der gleichen und -länge definiert schließlich das Kohäpunktförmigen Quelle stammende phasengleirenzvolumen. che Wellen identischer Frequenz unterschiedEin Beispiel für eine kohärente Welle lich lange Wege QP1 und QP2 , so besteht an ist eine monochromatische, ebene Welle den Punkten P1 und P2 zwischen ihnen ein (harmonische W.). Nach (21.4) ist ihre Phasenunterschied durch Kohärenzlänge unendlich. Wie lässt sich interferenzfähiges Licht erzeugen? Dazu existieren zwei Möglichkeiten. Alle Lichtquellen beruhen darauf, dass in ihnen Elektronen durch Zuführung von Energie in einen angeregten Zustand versetzt werden. Meistens werden mehrere energetisch unterschiedliche Niveaus besetzt. Im Allgemeinen gehen die Elektronen nach kurzer Zeit wieder in ihren ursprünglichen stabilen Zustand, den sog. Grundzustand, zurück, wobei sie ihre Anregungsenergie in Form von Lichtquanten, d.h. elektromagnetischer Strahlung, abgeben (Abb. 21.2). Es entstehen also kurze Wellenzüge, die statistisch ausgesandt werden und daher keine Kohärenz ihrer Phasen aufweisen. Das resultierende Wellenfeld ist daher inkohärent. Diesen Prozess nennen wir spontane Emission. Beispiele sind das Licht von Glühlampen und Gasentladungslampen.
21 Interferenz und Beugung
643
Daneben gibt es die induzierte oder stimulierte Emission. Darunter ist die Erzeugung eines Lichtquants (einer Lichtwelle) durch Einstrahlung eines bereits vorhandenen Angeregte Quants der gleichen Energie (einer entZustände sprechender Lichtwelle) zu verstehen. Beide Lichtquanten oder Wellen besitzen die gleiche Phase. Sie regen andere angeregte Atome zu stimulierter Emission von Quanten der gleichen Frequenz und Phase an. Es entsteht so ein kohärentes Wellenfeld hoher Intensität. Die auf dieGrundzustand ser Grundlage basierenden Strahlungsquellen heißen Laser (Light AmplificaAbb. 21.2: Anregung von Elektronen in tion by Stimulated Emission of Radiaenergetisch höhere Energiezustände und ion). Zur Demonstration von Interferenzspontane Aussendung von Licht beim erscheinungen ist das kohärente Laseranschließenden Übergang in den Grundlicht besonders geeignet; aber auch inkozustand härentes Licht kann interferenzfähig gemacht werden. Dazu muss ein Wellenzug durch einen Strahlteiler in zwei oder mehrere Teilwellen aufgespalten werden. Wird dafür gesorgt, dass diese unterschiedlich lange Wege durchlaufen, so führt dies nach Überlagerung der Wellen auf einem Schirm zu Interferenzmustern. Es gibt zahlreiche derartige Anordnungen. Wir besprechen einige von ihnen, zunächst solche, bei denen zwei Strahlen bzw. Wellen miteinander interferieren.
21.1.2 Anordnungen zur Zweistrahlinterferenz 21.1.2.1 Fresnelscher Spiegelversuch Licht einer möglichst kleinen Quelle wird mittels zweier Spiegel Sp1 und Sp2, die gegeneinander um den Winkel H gekippt sind (Abb. 21.3), in zwei Teilbündel aufgespalten. Auf einem Schirm S erzeugen sie ein Interferenzmuster, dessen Struktur wir berechnen wollen. Für einen Beobachter in der Schirmebene scheinen die Lichtbündel von den virtuellen Lichtpunkten L1 und L2 herzukommen. Ihre Koordinaten sind
(x
d / 2, y
0, z
l)
und
Ihre Wegdifferenz an einem Punkt P ( x, y, z
's
(x
d / 2, y
0, z
l) .
(21.6)
0) in der Beobachtungsebene ist
( x d / 2) 2 y 2 l 2 ( x d / 2) 2 y 2 l 2
(21.7)
644
21 Interferenz und Beugung
d L1
L2
Sp2
l
Sp1
Q
z
x Abb. 21.3: Fresnelscher Spiegelversuch zur Erzeugung zweier kohärenter Lichtbündel und
Abb. 21.4: Durch Interferenz entsteht auf dem Schirm ein Muster konfokaler Hyperbeln zusammen
Alle Punkte P( x, y ) , für die ' s konstant ist, liegen auf einer Hyperbel, denn die Hyperbel ist der geometrische Ort, für den die Differenz der Abstände von zwei Punkten (den Brennpunkten) konstant ist. Beträgt die Wegdifferenz ein ganzzahliges Vielfaches m der Wellenlänge, 's mO , so sind die beiden Wellen in Phase und die Intensität wird maximal. Ist dagegen die Wegdifferenz ein ungeradzahliges Vielfaches der halben Wellenlänge, 's (2m 1)O / 2 , so löschen sich die Wellen aus, die Intensität ist null. Auf dem Schirm erscheint folglich ein Intensitätsmuster aus konfokalen hellen Hyperbeln (Abb. 21.4). Die Ausdehnung der Interferenzfigur hängt von der Kohärenzlänge der Lichtwellen ab. Die Wegdifferenz der Wellen darf die Länge eines Wellenzuges nicht überschreiten.
21 Interferenz und Beugung
645
21.1.2.2 Fresnelsches Biprisma Statt zwei Spiegeln können zur Erzeugung zweier kohärenter Teilwellen auch zwei aneinanderstoßende flache Prismen, ein sogenanntes Biprisma, benutzt werden (Abb. 21.5). Das Interferenzmuster ist natürlich mit dem gerade beschriebenen identisch.
d Q L2 L1
l
Abb. 21.5: Anordnung zur Erzeugung kohärenter Teilwellen durch ein Biprisma
z
x
21.1.2.3 Youngscher Doppelspaltversuch Auf T. Young (1773-1829) geht eine andere Anordnung zur Sichtbarmachung von Lichtinterferenzen zurück. Strahlung einer flächenhaften Lichtquelle der Breite b, die Licht mit statistisch verteilten Phasen aussenden möge, fällt auf zwei Spalte Sp1 und Sp2, die voneinander den Abstand d haben (Abb. 21.6). Damit die von den Spalten ausgehenden Lichtwellen
a)
E1 dA Abb. 21.6: a) Erzeugung interferenzfähiger Lichtwellen durch einen Doppelspalt (Young) b) Zugehöriges Interferenzmuster
b E2
x
Sp1
P(x)
b)
d
D
I(x
Sp2
kohärent sind, müssen zwischen dem Abstand der Spalte, ihrer Entfernung von der Quelle und deren seitlicher Ausdehnung bestimmte Relationen bestehen, die wir ausrechnen wollen. Für ein beliebig herausgegriffenes Flächenelement dA der Quelle legen die beiden die Spalte errei-
646
21 Interferenz und Beugung
chenden Wellen im Allgemeinen verschieden lange Wege zurück. Die Wegdifferenz 's wird maximal für Flächenelemente an den beiden Enden der Quelle. Aus Abb. 21.6 folgt
'smax
E1Sp2 E1 Sp1
E2 Sp1 E2 Sp2 .
(21.8)
Wählen wir den Abstand D eines Spaltes von der Quelle hinreichend groß, so ist d O / GO @max
(21.51)
Beispiel 3,1 106 .
Dagegen ist der freie Spektralbereich mit 'O 0,025 nm sehr gering. Das FPI ist daher dort von Nutzen, wo es innerhalb eines schmalen Wellenlängen- bzw. Frequenzbereiches auf sehr hohe Auflösung ankommt, z.B. zur Aussonderung einer einzelnen Resonatormode im EinModen-Laser. In anderen Fällen muss eine Vorzerlegung mit Hilfe eines Prismas oder eines Beugungsgitters erfolgen. Es soll angemerkt werden, dass in der Praxis das Auflösungsvermögen auch empfindlich von der Ebenheit der Spiegel abhängt. Bei einem Reflexionsvermögen von 95% und einer maximalen Abweichung von der Ebenheit von nur O/50 ergibt sich FR | 60 und FS | 50.
21 Interferenz und Beugung
661
Entsprechend
1 F *2
1
¦F i
*2
(21.52)
i
erhalten wir F = 38. Mit FR =100 folgt F = 45 und mit FR = 150 ergibt sich F = 47. Es hat also keinen Sinn, das Reflexionsvermögen der Spiegel über ein bestimmtes Maß zu steigern, wenn es nicht gelingt, die anderen Beiträge zur Finesse zu verkleinern. Ein wesentlich größeres F lässt sich bei Verwendung sphärischer Spiegel erreichen [L21.5].
21.1.3.4 Lummer-Gehrcke-Platte
Das Interferometer nach O. Lummer (1860-1925) und E. Gehrcke (1878-1960) besteht aus einer unverspiegelten streifenförmigen, planparallelen Glasplatte (Abb. 21.17). Die Primärwelle fällt unter einem so großen Winkel auf die Platte, dass das Licht an beiden Seiten fast streifend austritt. Das Reflexionsvermögen beträgt in einem solchen Fall (n = 1,5) ca. 95%. Das bedeutet, dass sehr viele Teilwellen zur Interferenz beitragen. Zur Beobachtung dient ein Fernrohr. Die reflektierten und die transmittierten Wellen verhalten sich wie beim FPI komplementär. Das liegt wie dort an der Sonderstellung der Abb. 21.17: Streifender Ausfall des Lichtes ersten Teilwelle. Es ist zweckmäßig, den bei einer Lummer-Gehrcke-Platte ersten, sehr intensiven reflektierten Teilstrahl zu eliminieren. Das kann mit einem kleinen aufgesetzten gleichschenkligen Prisma der gleichen Glassorte erreicht werden. Gleichzeitig kann dadurch die Lichtenergie optimal ausgenutzt werden. Das ist besonders wichtig, weil die Eintrittsfläche ziemlich klein ist. Die beiden Interferenzmuster sind jetzt natürlich in Phase. Der Vorteil der Lummer-Gehrcke-Platte liegt in der einfachen Handhabung. Nachteilig wirkt sich vor allem der Umstand aus, dass der Wellenlängenbereich durch die vorgegebene Dicke festgelegt ist. Auch ist das Auflösungsvermögen wegen des nach oben begrenzten Reflexionsvermögens kleiner als beim FPI.
662
21 Interferenz und Beugung
21.1.4 Antireflexschicht Spiegelungen an Glasflächen können sich sehr nachteilig bemerkbar machen, vor allem wenn sich, wie in optischen Instrumenten, mehrere von ihnen im Strahlengang befinden. Zum einen entstehen beträchtliche Verluste, zum anderen können lästige Geisterbilder auftreten. Aber auch Spiegelungen an Brillengläsern oder bei verglasten Bildern sind störend. Wird eine dünne dielektrische Schicht auf die Oberfläche aufgebracht, die so ausgelegt ist, dass das von ihr reflektierte Licht mit dem von der zu entspiegelnden Oberfläche zurückgeworfenem Licht destruktiv interferiert, so kann die Reflexion zum Verschwinden gebracht werden. Das ist allerdings streng nur für eine bestimmte Wellenlänge möglich. Durch Aufbringung weiterer Schichten gelingt eine breitbandige Unterdrückung der Reflexion. Um die Bedingungen zu ermitteln, unter denen Auslöschung eintritt, schreiben wir (für den Fall einer Schicht) die Amplituden der reflektierten Wellen auf. Das Vorgehen entspricht der obigen Behandlung der planparallelen Platte. Es ist lediglich zu berücksichtigen, dass jetzt die Brechungsindizes auf den beiden Seiten der Schicht unterschiedlich sind. Wir setzen senkrechte Inzidenz der Lichtwelle voraus. Mit den Bezeichnungen in (Abb. 21.18) folgt
A1
A0 A1 A2
Abb. 21.18: Unterdrückung der Reflexion für eine gegebene Wellenlänge durch Aufbringung einer Antireflexschicht
R1 A0 ;
A2
(1 R1 ) R2 A0
A3
(1 R1 ) R2 R1 A0
A4
(1 R1 ) R23 / 2 R1 A0
A5
(1 R1 ) R22 R13 / 2 A0
A6
(1 R1 ) R25 / 2 R12 A0 ....
(21.53)
Die Amplitude einer Teilwelle (m t 2) unterscheidet sich also von der der Vorhergehenden um den Faktor R1 R2 . Aus der Forderung, dass die resultierende Amplitude gleich null sein muss, ergibt sich für den Brechungsindex n2 der Antireflexschicht unter Beachtung von
R1 n2
2
n1 n2 / n1 n2
2
,
n1n3 .
(21.54)
Damit die Wellen destruktiv miteinander interferieren, müssen sie einen Phasenunterschied von (2m 1) S aufweisen. Daraus folgt für die Dicke d der Schicht
d
2m 1 OVak ; m 0,1, 2,3,.... 4 n1
(21.55)
21 Interferenz und Beugung
663
21.1.5 Dielektrische Spiegel Im vorangegangenen Abschnitt ging es darum, Spiegelungen zu vermeiden. In anderen Fällen ist es wünschenswert, das Reflexionsvermögen R zu optimieren, z. B. im Bereich der LaserTechnik. Durch Bedampfung mit einer metallischen Schicht können Spiegel mit maximal R | 90-95% hergestellt werden, was für solche Anwendungen nicht ausreicht. Eine Steigerung von R lässt sich durch Aufbringung mehrerer dielektrischer Schichten erreichen. Sie müssen so ausgelegt sein, dass die durch Reflexion erzeugten Teilwellen miteinander konstruktiv interferieren. Das lässt sich erreichen, indem ihr Brechungsindex abwechselnd einen hohen (nh) und einen niedrigen (nl) Wert hat, wobei bei senkrechter Inzidenz die einleuchtende Forderung
nh d h
nl d l
OVak
(21.56)
4
erfüllt sein muss. Abb. 21.19 illustriert den Sachverhalt. Das Reflexionsvermögen ergibt sich zu
n2 n2 n2 A0
2
§ 1 ( nh / nl ) 2 N · R ¨ . 2N ¸ © 1 (nh / nl ) ¹
Glas (21.57)
Es ist umso größer, desto größer das Verhältnis (nh / nl ) ist. Mit wachsendem N geht R gegen den Wert 1. In der Praxis werden Spiegel mit 10 - 20 Schichten verwendet.
A7
n1 n1 n1
n3
Abb. 21.19: Dielektrischer Spiegel zur Optimierung des Reflexionsvermögens durch Bedampfung mit Schichten abwechselnd hohen und niedrigen Brechungsindexes
21.2 Beugung 21.2.1 Huygens-Fresnelsches Prinzip In allen optischen Anordnungen werden seitlich begrenzte Lichtbündel verwendet. Diese Einengung des Lichtstromes kann durch Blenden, Linsenfassungen oder Spiegel erfolgen, die sich im Strahlengang befinden. Bei genauem Hinsehen stellen wir fest, dass sich das Licht auch außerhalb des geometrischen Schattenbereichs ausbreitet. Die Lichtwelle wird an dem Hindernis gebeugt. Abhängig von dessen Form entstehen charakteristische Intensitätsmuster. Sie sind besonders ausgeprägt, wenn die Öffnung der Blende nicht viel größer als die Wellenlänge ist. Die entstehenden Beugungsmuster müssen sich aus der Wellengleichung des elektromagnetischen Feldes ableiten lassen. Das ist ein sehr schwieriges Unterfangen. Einen ersten Schritt in dieser Richtung ist das Huygenssche Prinzip (Ch. Huygens, 1629-1695) , das
664
21 Interferenz und Beugung
wir u. a. bereits zur Ableitung des Reflexions- und Brechungsgesetzes benutzt haben. In der von A. J. Fresnel (1788-1827) vorgenommenen Erweiterung lautet es Jeder Ort einer Phasenfläche einer Welle ist selbst wieder Ausgangspunkt einer Elementarwelle. Die an einem Aufpunkt P beobachtete Wellenerscheinung ergibt sich durch Überlagerung dieser Elementarwellen
G. K. Kirchhoff zeigte, dass das H.-F. Prinzip tatsächlich näherungsweise eine Lösung der Wellengleichung darstellt. Allerdings trägt sie nicht dem Vektorcharakter der Feldgrößen Rechnung. Polarisationseigenschaften der Wellen vermag sie folglich nicht zu beschreiben. Für die Feldamplitude E(P) in einem Aufpunkt P(r) ergibt die Kirchhoffsche Theorie mit den Bezeichnungen in Abb. 21.20 (s. Ergänzung 1 am Ende des Kapitels)
y
E ( P)
P( , )
G G E0 ik cos( rQ , dA) 2S rQ r
³³ e
ik ( rQ r )
d [ dK
Öff
x
RQ
(21.58)
z
P
r rP
P
r RP P (r )
Abb. 21.20: Zur Erläuterung der Kirchhoffschen Integralformel aaa
Die Beugungsfiguren hängen von der Entfernung der Quelle und des Beobachtungsschirms ab. Zur Klassifizierung entwickeln wir (rQ + r) nach [ und K . Wie am Ende des Kapitels (Ergänzung 2) abgeleitet, ergibt sich 2
I ( P)
³³ e
ik ) ([ ,K )
d [ dK ,
(21.59)
Öff
wobei
) ([ ,K ) 1 °§ 1 1 · 2 2 ¸ ([ K ) 2 ¯°© RQ RP ¸¹
[ (cos D Q cos D P ) K (cos EQ cos E P ) ®¨ ¨
([ cos D Q K cos E P ) 2 RQ
(21.60)
([ cos D P K cos E P ) 2 ½ ¾ ... KK RP ¿
In diesem Ausdruck stehen die Kosinus-Terme für den Ort der Quelle und des Aufpunktes:
21 Interferenz und Beugung
cos D Q cos E Q
xQ RQ yQ RQ
665
; cos D P
xP ; RP
; cos E P
yP . RP
(21.61)
Werden nur lineare Terme in der Entwicklung berücksichtigt, so sprechen wir von Fraunhoferscher Beugung (A. J. Fraunhofer, 1787-1826). Das bedeutet, dass die Beugungsfigur im Fernfeld ( rQ , r o f ) zu untersuchen ist. Den allgemeinen Fall, in dem also Quelle und Beobachtungsschirm in endlicher Entfernung von der beugenden Öffnung liegen, bezeichnen wir als Fresnelsche Beugung (A. J. Fresnel, 1788-1827). Oft reicht die Mitnahme quadratischer Glieder aus. Besteht die beugende Öffnung aus einem Spalt, dessen Längsausdehnung größer als der Durchmesser des Lichtbündels ist, oder mehreren parallelen Spalten, so muss das Integral nur über [ geführt werden. Ersetzen wir DQ und Dp durch den Einfallswinkel D und den Ausfallswinkel E, so geht 21.59 für Fraunhofersche Beugung über in 2
I ( P) ³ e
ik[ (sin D sin ß )
d[ .
(21.62)
21.2.2 Fraunhofersche Beugung Zur Realisierung von Fraunhoferscher Beugung wird ein Beugungsschirm mit einer oder mehreren Öffnungen mit parallelem monochromatischem Licht bestrahlt (Abb. 21.21). Dieses wird entweder durch eine Quelle im Brennpunkt einer Sammellinse erzeugt oder von einem kleinen Laser, dessen Strahl zunächst mittels einer Zerstreuungslinse aufgeweitet wird. Die Beugungfigur lässt sich nach Fokussierung des abgebeugten Lichtbündels f auf einem Schirm betrachten. Wir besprechen nun einige typische Fälle, wobei zur f einfacheren mathematischen Beschreibung Abb. 21.21: Anordnung zur Demonstration angenommen wird, dass die einfallende ebeder Fraunhoferschen Beugung ne Welle senkrecht auf den Beugungsschirm trifft.
666
21 Interferenz und Beugung
21.2.2.1 Beugung am rechteckigen Spalt
Die beugende Öffnung sei ein Spalt der Breite b und der Länge l >> b (Abb .21.22). Die einfallende monochromatische ebene Welle wird in alle Richtungen gebeugt. Der Winkel zwischen der Betrachtungsrichtung und der Spaltnormalen sei mit - bezeichnet. Das Beugungsbild besteht aus einer Anzahl heller und dunkler Streifen, die gemäß (21.62) durch phasenrichtige Überlagerung unendlich vieler von der Spaltöffnung ausgehender Elementarwellen entstehen. Wir wollen die Bedingungen für das Auftreten der Maxima und Minima ableiten. Dazu denken wir uns den Spalt in unendlich viele Teile zerlegt, von denen Elementarwellen ausgehen. Eine von der Mitte des Spaltes abgestrahlte gebeugte Welle ergibt am Beobachtungsort die Feldstärke
G E ( P)
r rx P
x r rs x
z
x sin
b
Abb. 21.22: Zur Berechnung der Intensitätsverteilung wird die einfallende ebene Welle in unendlich viele Teilwellen zerlegt b/2
E ( P)
³
e ikx sin - dx b
b / 2
(21.63)
Eine in der Spaltebene im Abstand x entstehende Welle besitzt gegenüber dieser einen Phasenunterschied x sin -. Sie wird also beschrieben durch
r r0P
x
G E0 e i (Zt kr0 P ) .
G E' x ( P )
G E0 e i (Zt k ( r0 P x sin - )) .
(21.64)
Wir müssen nun über alle Wellen im Bereich -b/2 < x < b/2 summieren. Gehen wir zu skalaren Größen über und tragen E(P) in (21.58) ein, so haben wir das Integral zu bilden
sin ^(kb sin - ) / 2` (kb sin - ) / 2
S b ½ sin ® sin - ¾ O ¿ b ¯ Sb sin -
(21.65a)
O
Diese Amplitudenfunktion wird auch als Spaltfunktion bezeichnet. Für die Intensität I(P) folgt damit
M
kb sin -
2S
b
O
sin -
(21.65b)
Anstatt zu integrieren, hätten wir auch wie bei der Behandlung der Interferenz in Kap. 21.1.1 über m diskrete Teilwellen summieren und anschließend m o f streben lassen können. Ein Blick auf (21.34) zeigt, dass die Ergebnisse in der Tat identisch sind.
21 Interferenz und Beugung
667
Die Intensität als Funktion von sin- ist in Abb. 21.23 gezeigt. Das Hauptmaximum liegt an der Stelle sin- bzw. - = 0. Es wird als Maximum nullter Ordnung bezeichnet. Kleinere Maxima, sog. „Nebenmaxima“, treten auf für
sin -
r
2N 1 O ; ( N 1, 2,3,...) , 2 b
(21.66a)
Minima liegen an den Stellen
rN
O b
.
(21.66b)
Die Zone gebeugten Lichtes ist nur merklich ausgeprägt, wenn die Wellenlänge in der Größenordnung der Spaltbreite liegt, O | b, und b > O ist. Optische Elemente sind im Allgemeinen kreisrund. Deswegen sind Beugungseffekte, die durch eine Kreisblende (Radius R) verursacht werden, besonders wichtig. Die Rechnung, die nicht mehr elementar durchführbar ist, liefert für die Intensitätsverteilung (L21.6) 2
I (- )
§ 2 I ( x) · I0 ¨ 1 ¸ ; x © x ¹
2S R
O
sin -
0,0625 0,25
1.0 Intensität I/I 0
sin -
0.8 b/
0.4
1
4 16
0.0
0 Beugungswinkel
Abb. 21.23: Intensitätsverteilung bei der Beugung an einem Spalt der Breite b für verschiedene b/O in Abhängigkeit vom Beugungswinkel
(21.67) Darin ist I1(-) die Besselfunktion erster Ordnung. Aus Symmetriegründen ergibt sich eine ringförmige Struktur. Die erste Nullstelle liegt bei x1 = r 1,22 S. Im Vergleich zur Spaltbeugungsfunktion nimmt die Intensität mit wachsendem - schneller ab. Das ist plausibel, weil damit die Radien der Ringe anwachsen und die Intensität pro Fläche somit immer geringer wird. Auf den ersten Blick erstaunlich ist es, dass bei Vertauschung der Blende durch eine kleine Scheibe im Zentrum ebenfalls ein heller Fleck erscheint (Poisson-Fleck). Aber auch dieser ist nur eine Folge der Wellennatur des Lichts.
21.2.2.2 Beugung am linearen Gitter
Wird eine größere Zahl gleichartiger Spalte in einer Reihe angeordnet, so sprechen wir von einem linearen Gitter. Derartige optische Gitter sind für die Spektroskopie von großer Bedeutung, allerdings werden nicht Transmissionsgitter („Strichgitter“), sondern Reflexionsgitter (Abb. 21.24) verwendet, die sich durch Ritzung einer Glasplatte oder durch
668
21 Interferenz und Beugung
holographische Techniken herstellen lassen. Neben der leichteren Herstellbarkeit bieten Reflexionsgitter den Vorteil, nahezu die gesamte Strahlung auszunutzen, während beim Transmissionsgitter immer der auf die Gitterstege fallende Teil verloren geht.
d
d
Abb. 21.24: Echelettegitter und Sinusgitter Hinzu kommt, dass es durch bestimmte Formgebung der Oberfläche möglich ist, das gebeugte Licht eines gegebenen Wellenlängenbereichs im Wesentlichen in eine Beugungsordnung zu konzentrieren. Die prinzipielle Struktur der Beugungsfigur ist unabhängig vom Gittertyp. Die „Spalte“ der Breite b dienen dazu, interferenzfähiges Licht zu erzeugen. Zwei von verschiedenen Spalten ausgehende Teilwellen besitzen einen von der Gitterkonstante d und der x-Koordinate abhängigen Phasenunterschied.
M (nd x)sin - ;
n 1, 2, 3,..., N 1
(21.68)
Die Amplitude ergibt sich zu N 1 b / 2 ½° ° E ( P) ¦ ® ³ e ik ( nd x )sin - dx ¾ °b / 2 n 0¯ ¿°
N 1
¦ eikdn sin- n 0
b/2
³
e ikx sin - dx \ Interf \ Spalt
b / 2
(21.69) Die Interferenzfunktion ist identisch mit der durch 21.34 gegebenen Interferenzfunktion
\ gitter
sin( pM / 2) sin( N ) / 2) , o sin(M / 2) sin() / 2)
Wobei N die Anzahl der Gitteröffnungen („Spalte“) und ) 2
2
sin( N ) / 2) ½ sin(M / 2) ½ I ( P) ® ¾ ® ¾ , ¯ sin() / 2) ¿ ¯ (M / 2) ¿ mit I
2S
d
O
sin - ;
kd sin - ist. E(P) wird so
M
2S
b
O
sin - .
(21.70)
21 Interferenz und Beugung
669
Die Intensität als Funktion von sin- ist in Abb. 21.25a wiedergegeben. Die Intensitätskurve des Einzelspaltes zerfällt in diskrete, schmale durchlässige Bereiche. Entsprechend ihrer Entstehung heißen sie Maxima nullter, erster, …, m-ter Ordnung. Ihre Anzahl und Schärfe wächst mit der Zahl der Gitteröffnungen N. Analog der Diskussion der Interferenzfunktion (21.34) treten Maxima auf, wenn
N
) 2
2S
O
'
2S
O
d sin -
2S m ;
m
0,1, 2,... .
(21.71a)
ist, also wenn bei senkrechter Inzidenz gilt
d sin -
mO ; m 0, r1, r2... ;
(21.71b)
60 40 20
Spaltbeugungsfunktion
Interferenzfunktion
1.0
Intensität I/I 0
I (willk. Einh.)
Die Eigenschaft des Gitters, einfallende Strahlung entsprechend ihrer Wellenlänge aufzufächern, wird in Spektrometern ausgenutzt.
0.8 0.6 0.4 0.2
0
-3. -2. -1. 0. 1. 2. 3. Ordn. sin
0.0
x
Abb. 21.25: a) Intensitätsverteilung beim Strichgitter als Funktion des Sinus des Beugungswinkels-; b) Zur Ableitung des Auflösungsvermögens
Wir wollen wieder ausrechnen, wie groß der Wellenlängenunterschied zweier Spektrallinien sein muss, damit sie infolge der Beugung noch voneinander getrennt werden können. Dabei gehen wir vom Rayleigh-Kriterium aus: Zwei (gleich intensive) Spektrallinien können noch getrennt werden, wenn die durch Beugung verbreiterte Spektrallinie m-ter Ordnung der Wellenlänge O +GO in das erste Minimum der Beugungsfigur m-ter Ordnung der Linie der Wellenlänge O fällt (Abb. 21.25b), wenn also gilt
m(O GO ) mO O / N 1 ; mN GO O .
(21.72a) (21.72b)
670
21 Interferenz und Beugung
Bei vorgegebener Wellenlänge und Ordnung ist der auflösbare Wellenlängenunterschied umgekehrt proportional der Anzahl der interferierenden Teilwellen. Das Auflösungsvermögen wird damit
O GO
Nm .
(21.73)
Der nutzbare Spektralbereich, der dadurch definiert ist, dass eine eindeutige Zuordnung der Wellenlänge möglich ist, folgt wie beim FPI (Kap. 21.1.2.1) zu
'O
O/m .
(21.74)
Zurück zum Reflexionsgitter. Eine wichtige Realisierung ist das Echelettegitter, Abb. 21.26, („Leiterchen“-Gitter). In Spektrometern bilden einfallende und ausfallende Welle einen festen Winkel U miteinander. Zur Wellenlängenanalyse wird das Gitter um einen Winkel D aus der Position der nullten Ordnung herausgedreht. Es ist daher zweckmäßig, die allgemeine Interferenzbedingung (-0 = Einfallswinkel bez. der Gitterebenennormalen, - = Beugungswinkel)
d (sin -0 sin - ) mO
(21.75)
entsprechend umzuschreiben. Gemäß Abb. 21.26 gilt
-0
U / 2 D; - U / 2 D
(21.76)
Setzen wir dies in (21.65) ein, so erhalten wir nach trigonometrischer Umformung als Verknüpfung der Wellenlänge und des Gitterdrehwinkels
2d cos( U / 2) sin D
(21.77)
Wir setzen nun voraus, dass die Furchenbreite d´ groß gegen die Wellenlänge ist, d´ >> O. Die Gitterkonstante d ist mit der Stufenhöhe H und dem Furchenwinkel G verknüpft über
/2
0
d d
mO .
H
H
d sin G .
(21.78)
Berücksichtigen wir dies in der vorhergehenden Beziehung, so ergibt sich im Falle D = G Abb. 21.26: Zur Charakterisierung des Echelettegitters
2 H cos( U / 2) mO .
(21.79)
21 Interferenz und Beugung
671
Das bedeutet, dass in dieser Gitterposition die Beugung einfallender benachbarter Strahlen geometrisch optischer Reflexion an den Furchenflächen entspricht. Die Winkel D´, ß´ zwischen der Einfalls- bzw. Ausfallsrichtung der Wellen und der Furchennormale sind gleich:
-0c -0 G ;
-c - G .
(21.80)
Einsetzen von (21.76) führt für D = G zu -0c - c U / 2 . Alle von den verschiedenen Furchenflächen ausgehenden Teilwellen sind in Phase. Sie merken sozusagen nicht, dass sie durch Beugung und Interferenz entstanden sind und sehen daher – vereinfacht – auch keinen Anlass, einen Teil ihrer Energie in andere Beugungsordnungen zu verteilen. Die gesamte Energie einer einfallenden Welle mit einer durch (21.79) bestimmten Wellenlänge wird in eine Richtung konzentriert. Näherungsweise gilt das auch noch für Strahlung benachbarter Wellenlängen, aber je mehr diese von der Glanzwellenlänge abweichen, desto stärker verteilt sich die Energie auf andere Beugungsordnungen. Der Gitterdrehwinkel D = G wird „Blaze-Winkel oder Glanzwinkel genannt. Bilden die Gitterelemente (im Querschnitt) kleine rechtwinklige Dreiecke, so entsteht ein Stufengitter. Dies wird unmittelbar einsichtig, wenn wir in obiger Darstellung D = 90° wählen. Solche Gitter finden sich in den Flügeln der Schmetterlinge und erzeugen deren vielfältige Farben.
21.2.2.3 Beugung am Flächen- und Raumgitter
Zur Charakterisierung kristalliner Strukturen ist die Beugung kurzwelliger elektromagnetischer Wellen (Röntgen- und J-Strahlen) von großer Bedeutung. Das Auftreten von Intensitätsmaxima ist jetzt in letzteren Fall an drei Bedingungen geknüpft, die in den Laue-Gleichungen formuliert sind und bereits in Kap. 19.3 im Rahmen der Diskussion der (Licht-) Streuung abgeleitet wurden. Sie lauten in der dort angegebenen Form (im Frequenzbereich der Gitterschwingungen wird für die Wellenzahl der Buchstabe q statt k verwendet.)
G G a 'q 2S h G G b 'q 2S k G G c 'q 2S l
h, k , l
0,1, 2, ...
(21.81)
Hierin bedeuten a, b, c die Abstände der als punktförmig angenommenen Atome in den drei G Raumrichtungen. 'q (2S / O )( sˆ0 sˆ) ist die Differenz der Wellenvektoren von einfallender und gebeugter Strahlung (Abb. 21.27). Sind D 0c , E 0c , J 0c und D c, E c, J c die Winkel zwischen den Achsen und den Fortpflanzungsrichtungen sˆ0 , sˆ der einfallenden und der gebeugten Welle, so geht (21.81) über in
672
21 Interferenz und Beugung
a (cos D 0c cos D c) hO ; b (cos E 0c cos E c) k O ; c (cos J 0c cos J c) l O .
sˆ
Translationsr vektor t
(21.82)
(h, k , l ) 1, 2,3 Durch Ersetzung der Winkel durch die zugehörigen Einfalls- und Beugungswinkel werden (D = 90 - D´, ß = 90 - ß´, …)
c
sˆ 0 a
b
Abb. 21.27: Beugung am kubischen Raumgitter
aus diesen Beziehungen die Gleichungen
a (sin D 0 sin D )
hO ;
b (sin E 0 sin E ) k O ; c (sin J 0 sin J )
(21.83)
lO .
Zur Veranschaulichung setzen wir die Einfallswinkel gleich null. Die primäre Welle möge parallel zur z-Achse auf eine kubische Anordnung von Atomen fallen (Abb. 21.28). Zunächst betrachten wir eine lineare Atomkette. Denken wir uns einen kugelförmigen Film um das mittlere Atom gelegt, so zeigen sich auf Ersterem als Beugungsfigur konzentrische Kreise.
Lineares Punktgitter
Abb. 21.28: Lineares Punktgitter im Zentrum einer Kugel. Die gebeugten Strahlen bilden Kegelmäntel, deren Schnittlinien mit der Kugeloberfläche gezeichnet sind
Flächenhaftes Gitter Abb. 21.29: Bei einem flächenhaften Gitter treten Maxima nur dort auf, wo sich die Mäntel der senkrecht zueinander liegenden Kegel schneiden und
21 Interferenz und Beugung
673
Sie entstehen als Schnittlinien der von den Atomen ausgehenden Strahlungskegeln mit dem Film. Jeder Kreis entspricht einer bestimmten Beugungsordnung. Ersetzen wir das lineare Gitter durch ein Flächengitter in der xy-Ebene, so folgen aus (21.83) zusätzliche Schnittlinien in der xz-Ebene. Nur in ihren Schnittpunkten sind beide Interferenzbedingungen erfüllt. Abb. 21.29 zeigt das auf einen ebenen Schirm projizierte Beugungsbild eines Kreuzgitters. Bei einem dreidimensionalen Gitter reduziert sich die Anzahl dieser Punkte auf solche, für welche auch die dritte Laue-Gleichung erfüllt ist. Den Laue-Gleichungen äquivalent ist die von W. L. Bragg (1890-1971) aufgestellte BraggGleichung. Sie beruht auf der Erkenntnis, dass den Atomen eines Kristalls bestimmte Gitterebenen zugeordnet werden können (Abb. 21.30). Auf Grund der periodischen Anordnung der Atome gibt es zu einer gegebenen Gitterebene viele zu ihr parallele Ebenen. Eine einfallende ebene Welle wird an den Atomen dieser Gitterebenen gebeugt. Die gebeugten Teilwellen haben einen bestimmten Gangunterschied '. Damit sie konstruktiv interferieren können, muss dieser ein ganzzahliges Vielfaches der Wellenlänge betragen. Bezeichnen wir den Abstand (die Gitterkonstante) zwischen zwei benachbarten Ebenen mit d, so lautet die Bedingung
2d cos D
mO ; m 1, 2,3,...
(21.84)
Wie Abb. 21.30 zeigt, lässt sich das Zustandekommen der konstruktiven Interferenz formal als Reflexion an den Gitterebenen auffassen. Daraus entstand die Bezeichnung „Bragg-Reflexion“. In Wirklichkeit handelt es sich aber um einen Beugungs- und Interferenzvorgang; die Bragg-Gleichung kann aus den Laue-Gleichungen abgeleitet werden. Einkristalle können wie lineare Gitter im Sichtbaren zur spektralen Zerlegung von Röntgenstrahlung oder Materiewellen (z. B. von Neutronen geeigneter Wellenlänge) eingesetzt werden.
d d d Abb. 21.30: Zur Ableitung der Bragg-Gleichung
21.2.3 Fresnelsche Beugung 21.2.3.1 Fresnelsche Zonenplatte
Auf eine runde Lochblende falle eine ebene monochromatische Welle der Wellenlänge O (Abb. 21.31a/b). Von jedem Punkt der Blendenebene gehen nach dem Huygens-Fresnelschen Prinzip Elementarwellen aus. Die resultierende Amplitude in einem gegebenen Punkt ergibt sich durch Überlagerung der Amplituden der einzelnen Teilwellen (L21.4). Wir fragen nach der Intensität in einem Punkt P auf der Symmetrieachse der Blende. Der Phasenunterschied der
674
21 Interferenz und Beugung
Rm
mr0
r0 +m / 2
r0
Abb. 21.31: a) Zur Ableitung der Fresnelschen Zonen b) Fresnelsche Zonen; zu jedem Punkt einer Zone gibt es einen Punkt in einer benachbarten Zone, dessen Abstand von P sich umO/2 unterscheidet
F
b)
a)
Teilwellen hängt vom Lochdurchmesser 2R und dem Abstand r0 des Punktes P von der Blende ab. Die Punkte mit gleich großem Abstand von P liegen auf Kreisen mit dem Radius R bzw. r = r0 sin -. Zu einem Abstand rm = r0 + mO/2 von P gehört ein Kreis mit eben diesem Radius; ein nächster besitzt den Radius rm+1 = r0 + (m + 1)O/2. Die Bereiche zwischen solchen Kreisen heißen Fresnelsche Zonen. Zu jedem Punkt einer Zone gibt es einen Punkt in der benachbarten Zone, dessen Abstand r von P sich um O/2 unterscheidet. Die elektrische Feldstärke einer von einem Zonenelement dAm ausgehenden Elementarwelle ist gegeben durch
dE
K
E0 i (Zt kr ) e dA . r
(21.85)
Hierin ist
dA 2S RdR
2S rdr .
(21.86)
Der Faktor K berücksichtigt die Abhängigkeit der Amplitude der von dA ausgehenden Welle vom Winkel -; er ist nur schwach veränderlich. Damit ergibt sich rm
E
2S KE0
³e
i (Zt kr )
dr ;
rm1
Em
rm 2S K m E0 ª¬ e ikr º¼ rm1 ik 2S K m ik r ( m 1) O / 2@ E0 e ik ( r0 mO / 2) e > 0 ik 2S K m E0 (1) m 1 . ik
^
`
(21.87)
21 Interferenz und Beugung
675
Wie zu erwarten ändert sich die Phase der elektrischen Feldstärke von Zone zu Zone um den Faktor S. Dieses Faktum wird bei der Fresnelschen Zonenplatte zur Steigerung der im Punkt P auftretenden Intensität ausgenutzt. Setzen wir nämlich eine so bedampfte Glasplatte, dass sie das Licht jeder zweiten Zone zurückhält, hinter die Lochblende, so interferieren die durchtretenden Teilwellen alle konstruktiv miteinander. Es tritt kein Intensitätsverlust durch destruktive Interferenz mehr auf. Die Radien und die Breite der transmittierenden Zonen hängen vom Abstand des Aufpunktes P von der Zonenplatte ab. Der Radius ergibt sich aus
Rm
(r0 mO / 2) 2 r02 | mr0 O .
(21.88)
Die Zonenbreite nimmt mit wachsendem m ab:
'Rm
Rm 1 Rm
r0 O
m 1 m .
(21.88a)
Das ist verständlich, denn damit die den Zonen zugeordneten Feldstärken gleich sind, müssen ihre Flächen gleich sein, d.h. bei zunehmendem Radius muss die Breite abnehmen. Es ergibt sich für A
A S ( Rm2 1 Rm2 ) S r0 O .
(21.89)
Die Flächen der Fresnelschen Zonen sind alle gleich groß. Eine Fresnelsche Zonenplatte wirkt als Sammellinse mit der Brennweite f = r0. Mit (21.88) ergibt sich
f
Rm2 mO
R12
O
.
Die Brennweite ist durch den Radius R1 der ersten Fresnelschen Zone und die Wellenlänge des Lichtes bestimmt. Obgleich solche „Beugungslinsen“ also eine erhebliche chromatische Aberration besitzen, werden sie häufig in Scheinwerfern, Overheadprojektoren, Suchern in Fotoapparaten etc. verwendet. Eine wichtige Rolle spielen sie bei der Fokussierung von Röntgenstrahlen (L21.7) und neuerdings auch von Atomstrahlen. Im weichen Röntgenbereich
(O = 2,4 nm 620 eV bis etwa O = 0,17 nm 7 keV) gibt es keine hinreichend stark fokussierenden „Brechungslinsen“, da der Brechungsindex nahezu eins ist. In dem oben gewählten Beispiel wird die Zonenplatte mit einer ebenen Welle beleuchtet. Der Brennpunkt kann als reelles Bild einer unendlich entfernten punktförmigen Lichtquelle angesehen werden. Zusätzlich entsteht ein virtuelles Bild der Quelle in gleichem Abstand vor der Platte. Bei den bisherigen Überlegungen haben wir nämlich nicht berücksichtigt, dass zu jeder unter einem Winkel - abgestrahlten Welle auch eine unter dem Winkel -- gehört. Das Auge verlängert die entsprechenden Strahlen nach vorne bis zu ihrem virtuellen Schnittpunkt, dem Ort des virtuellen Bildes. Im vorderen Halbraum wirkt die Zonenplatte zusätzlich als Zerstreuungslinse.
676
21 Interferenz und Beugung
Fresnelsche Zonenplatten in der besprochenen Art nutzen nur die Hälfte der auffallenden Strahlung aus. Die andere Hälfte wird von den undurchlässigen Zonen zurückgehalten. Sie kann ebenfalls nutzbar gemacht werden, wenn diese Zonen so angeätzt werden, dass zwischen einem Punkt in einer Rinne und dem entsprechenden Punkt eines benachbarten Steges neben dem bereits vorhandenen Gangunterschied von O/2 ein zusätzlicher Wegunterschied von O/2 entsteht. In diesem Fall können wir uns die kammförmige Zonenplatte als aus zwei Zonenplatten zusammengesetzt denken, deren Teilwellen konstruktiv miteinander interferieren (Abb. 21.32). Der Gangunterschied zwischen dem m-ten und dem (m+1)-ten Strahl ist bei einem Brechungsindex n der Platte
'sm, m 1
(n 1) H
O 2
.
(21.90)
Konstruktive Interferenz im Punkt P tritt ein, wenn der erste Summand zu einem ungeradzahligem Vielfachen von O/2 gewählt wird,
H
(n 1) H
sm
sm+1
O . 2
(21.91)
Das Auflösungsvermögen einer Zonenplatte ist durch die Breite der äußersten Zone gegeben. Eine hochauflösende Zorm n nenplatte mit einer Breite der äußersten Zone von 25 nm ergibt unter ZugrundeleF gung des Rayleigh-Kriteriums ' = 1,22 drn den Wert ' = 30 nm. Soll das Auflösungsvermögen weiter gesteigert werden, etwa für die Mikroskopie einer Materialprobe unter Ausnutzung der Strahlung eines FreieElektronen-Lasers, müssen andere Wege Abb. 21.32: Kammförmige Fresnelsche beschritten werden. Derzeit werden sog. Zonenplatte zur Optimierung der transPhotonensiebe auf ihre Tauglichkeit hin mittierten Intensität aus untersucht (L21.8, 9). Darunter ist eine lichtundurchlässige Folie zu verstehen, die mit vielen tausend nahezu statistisch angebrachten Löchern versehen ist. Betrachten wir der Einfachheit wegen die Abbildung eines Punktes im Abstand a auf der optischen Achse in einen Punkt mit dem Abstand b auf der anderen Seite des Siebes. Sind die Löcher so angeordnet, dass die optische Weglänge von der Röntgenquelle durch das Zentrum eines gegebenen Loches zum Fokus ein ganzzahliges Vielfaches der Wellenlänge O der Strahlung beträgt, so entsteht durch konstruktive Interferenz im Fokus ein heller Lichtfleck. Strahlung, für die diese Bedingung nicht erfüllt ist, wird ausgelöscht. Der Abstand rn der Löcher von der optischen Achse muss also der Bedingung genügen
rn2 a 2 rn2 b 2
a b nO
21 Interferenz und Beugung
677
wobei n eine ganze positive Zahl ist. Durchmesser und Lage eines Loches sind miteinander korreliert. Doch soll auf diese Einzelheiten (L21.8) hier nicht näher eingegangen werden. Es zeigt sich, dass der kleinste auflösbare Abstand kleiner als der kleinste Lochdurchmesser ist.
21.2.3.2 Fresnelsche Beugung an einem Spalt und einem Draht
Die Berechnung der Beugungsfiguren bei Fresnelscher Beobachtungsart ist wegen der quadratischen Terme wesentlich schwieriger als für Fraunhofersche Beobachtungsweise. Im Allgemeinen ist nur eine numerische Integration möglich (L20.1). Als Beispiel betrach1 ten wir den Fall eines unendlich langen Spaltes der Breite b. Liegt dieser längs y in der Fraunhoferxy-Ebene, so wird die Phase in einem Punkt z0 b2 / Beugung P(xP,0) nach (21.60/61)
) ([ ,0) [ (cos D Q cos D P )
1 [ 2 xP2 ½ ®1 ¾. 2 RP ¯ RP2 ¿
(21.92)
1
Dieser Ausdruck ist in (21.59) einzusetzen. Das Integral hängt über RP stark von der Entfernung z0 der Beobachtungsebene von der FresnelSpaltebene ab. Für einige z0 sind die berechBeugung neten Beugungsbilder in Abb. 21.33a zusammengestellt. Bei Annäherung des Beobach1 tungspunktes an die Spaltebene ändert sich z0 b2 / das Beugungsbild erheblich. Die Intensität zeigt jetzt schwache Helligkeitsfluktuationen im Spaltbereich, dagegen verschwinden jene Abb. 21.33a: Beugung am Spalt: im geometrischen Schattenbereich. Im NahÜbergang von Fraunhoferscher feldbereich fällt die Intensität von ¼ des zu Fresnelscher Beobachtungsart mittleren Wertes monoton auf null ab. Die Spaltkanten können deswegen nicht genau erkannt werden. Abb. 21.33b zeigt im oberen Teil das Beugungsbild eines Spaltes bei Fresnelscher Beobachtungsart und zum Vergleich darunter ein solches für einen Draht. Sein Durchmesser ist gleich dem der Spaltöffnung gewählt.
678
21 Interferenz und Beugung
Abb. 21.33b:Fresnelsche FresnelscheBeugung Beugungam amSpalt Spalt(oben) (oben) Abb.7.33b: Abb. 21.33b: Fresnelsche Beugung am Spalt (oben) bzw. am Draht (darunter). Zur Verdeutlichung bzw. am Draht (darunter). Zur Verdeutlichung wurde im unteren Bild der Kontrast nachträglich erhöht und
21.2.3.3 Fresnelsche Beugung an einer Kante
Das Fresnelsche Beugungsbild einer Kante ist in Abb. 21.34 dargestellt. Der Intensitätsverlauf ist nahezu identisch mit der in der Mitte aufgeschnittenen Beugungsfigur eines breiten Spaltes.
21.2.3.4 Fresnelsche Beugung an einer kreisförmigen Öffnung und einer Scheibe
Fällt senkrecht auf eine Lochblende mit dem Durchmesser 2R ein paralleles Lichtbündel, so entstehen auf einem zur Blendenebene parallelem Schirm ringförmige Strukturen, die vom Abstand z0 des Schirmes von der Blende abhängen (Abb. 21.35). Die Intensität im Punkt P0 in der Mitte des Schirmes wird maximal, wenn z0 R 2 / O gewählt wird. In diesem Fall stimmt
21 Interferenz und Beugung
679
Abb. 21.34: Fresnelsche Beugung an einer Kante (links) Abb. 21.35: Fresnelsche Beugung an einer kreisförmigen Öffnung (oben rechts) bzw. an einer Scheibe (unten rechts)
der Radius der ersten Fresnelzone, r1
z0 O , mit dem Blendenradius überein. Mit abneh-
mendem Abstand z0 entsteht auch die zweite Zone. Sie interferiert destruktiv mit der ersten, so dass die Intensität in P0 stark abnimmt. Bei weiterer Annäherung des Schirmes an die Blendenebene enthält die Lochblende auch die dritte Fresnelzone, womit sich die Schirmmitte wieder aufhellt usw. Die Intensität im Punkt P0 schwankt periodisch und es entstehen immer mehr helle und dunkle Ringe. Der rechte untere Teil zeigt das Beugungsbild einer Scheibe.
680
21 Interferenz und Beugung
21.2.4 Babinetsches Theorem Ersetzen wir bei der Fraunhoferschen Beugungsart den Spalt durch einen geraden Draht, dessen Dicke gleich der Spaltbreite ist, so zeigt sich, dass die Beugungsbilder außerhalb des geometrischen Schattenbereichs identisch sind (Abb. 21.36links).
Abb. 21.36: Fraunhofersche Beugung. Demonstration des Babinetschen Prinzips; links: Drei jeweils nebeneinander angeordnete komplemtäre Strukturen; rechts: Beugung am Draht und Spalt
Analog können wir die kreisförmige Öffnung durch eine gleich große undurchlässige Scheibe austauschen. Auch in diesem Fall sind die beiden Beugungsfiguren gleich. Offenbar ergeben komplementäre Strukturen (Abb. 21.36 rechts) gleiche Intensitätsverteilungen. Dieser Sachverhalt wurde zuerst von J. Babinet (1794-1872) erkannt und heißt Babinetsches Theorem. Es kann wie folgt formuliert werden: Komplementäre Beugungsanordnungen (wie Spalt und Draht gleicher Abmessungen) ergeben bei Fraunhofer-Beugung außerhalb des Bereiches geometrischoptischer Abbildung gleiche Beugungsbilder.
Die Aussage des Theorems können wir uns folgendermaßen klarmachen: Die beugende Öffnung führe im Aufpunkt P zu einer Lichterregung (~ der Feldstärke)
21 Interferenz und Beugung
u01 ( P )
E1 ( P ) ,
681 (21.93)
die komplementäre Beugungsanordnung ergebe dort die Lichterregung
u02 ( P)
E2 ( P ) .
(21.94)
Sie ist der ersteren gerade entgegengesetzt, denn zusammen ergäben die beiden Anordnungen in P Dunkelheit. Würden wir sie beide wegnehmen, so entstünden ebenfalls keine Beugungserscheinungen. Es gilt also
u01 ( P ) u02 ( P )
E1 ( P ) E2 ( P) 0 ;
(21.95a)
E1 ( P ) E2 ( P) ;
(21.95b)
I1 ( P)
(21.95c)
I 2 ( P) .
21.2.5 Holographie 21.2.5.1 Prinzip
Wird ein Gegenstand mit fotografischen Methoden auf einer Fotoplatte aufgenommen, so enthält das zweidimensionale Bild keinerlei Information über die Phase des Lichtes. Die Platte wird lediglich proportional der Lichtintensität geschwärzt. Gabor hatte 1948 als erster die Idee, die ursprüngliche Lichtwelle in eine Objektwelle und eine Referenzwelle aufzuspalten (Abb. 21.37a) und beide auf derselben Fotoplatte zu überlagern. Auf dieser entsteht dabei ein Interferenzmuster. Der Abstand der Interferenzstreifen ist proportional der Phasendifferenz der beiden Wellen. Damit ist die vollständige Information über Intensität und Phase des Lichtwellenfeldes auf der Platte gespeichert. Wird das entstandene Hologramm (nach den griechischen Wörtern holos – vollständig und graphein – schreiben) mit der Referenzwelle beleuchtet, so wird diese an der Struktur des Hologramms gebeugt, und zwar in gleicher Weise in die Richtungen +-I und --I. Dadurch entstehen zwei Beugungsbilder (Abb. 21.37b), ein reelles Bild Breell hinter dem Gegenstand (dem Hologramm), und ein virtuelles Bild Bvirt vor dem Gegenstand. Letzteres entspricht in allen Einzelheiten dem ursprünglichen Gegenstand. Im reellen Bild sind Vertiefungen und Erhöhungen vertauscht. D. Gabor (1900-1979) kannte nur natürliche Lichtquellen, die kein monochromatisches Licht hinreichender Intensität aussandten. Deswegen blieben seine Hologramme unvollständig. Erst die Entdeckung des Lasers verhalf seiner Idee zum Durchbruch. Wir besprechen nun im Einzelnen Entstehung und Wiedergabe eines Hologramms (L21.10).
682
21 Interferenz und Beugung
21.2.5.2 Erzeugung eines Hologramms
Zur Erzeugung eines Hologramms wird die ebene Lichtwelle eines aufgeweiteten Laserstrahls mittels eines Strahlteilers in zwei Teilwellen aufgespalten (Abb. 21.37a). Die Referenzwelle wird direkt auf die Fotoplatte, die in der xy-Ebene liegen möge, gerichtet. Die andere Teilwelle, Objektwelle genannt, fällt auf den abzubildenden Gegenstand, von dem sie ebenfalls die Platte erreicht. Durch den Strahlteiler und die große Kohärenzlänge des Laserlichtes ist sichergestellt, dass die beiden Teilwellen auf der Fotoplatte zueinander kohärent sind. Sie werden beschrieben durch
G ERe f
G G G i (Zt kRe f r ) E0 Re f e und
G EO
G i (Z t MObj ( x , y )) . E0Obj e
(21.96)
Die Intensität in einem Punkt P(x, y) ist folglich
I ( x, y )
G G 2 cH 0 ERe f ( x, y ) EObj ( x, y ) G2 G2 G 2 G 2 i^kGObj rGObj MObj ( rGObj )` cH 0 E0,Re f E0,Obj E 0,Re f E0,Obj e (21.97)
G G G G i^k r M ( r )` E E 0,2Obj e Obj Obj Obj Obj G2 G2 G G cH 0 E0,Re f E0,Obj 2 E0,Re f E0,Obj cos (M Re f MObj )
2 0,Re f
Die beiden ersten Terme sind die Intensitäten der Referenz- und der Objektwelle. Der dritte Summand beschreibt das Interferenzstreifensystem. Nach Entwicklung besitzt die Fotoplatte eine Amplitudentransmission T(x, y), auf Grund derer sich die vom Hologramm durchgelassene Amplitude zu
G Etrans
G T ( x, y ) Eei n f
(21.98)
Strahlteiler Referenzwelle
Rekonstruktionswelle
Laser
Objektwelle Objekt Hologramm Abb. 21.37a: Anordnung zur Aufnahme eines Hologramms
Hologramm Virtuelles Bild
Reelles Bild
Abb. 21.37b: Anordnung zur Rekonstruktion eines Bildes
21 Interferenz und Beugung
683
ergibt. Bezeichnet T0 die Transmission der entwickelten Platte an den unbelichteten Stellen und J den Schwärzungskoeffizienten, so wird T(x, y)
T0 J I ( x, y )
T ( x, y )
(21.99)
21.2.5.3 Rekonstruktion
Zur Rekonstruktion des Bildes wird das Hologramm, wie oben ausgeführt, mit der ReferenzG welle oder einer adäquaten kohärenten Welle, ERe ko , gleicher Frequenz
G ERe ko
G G G E0 Re ko ei (Zt kRe ko r )
(21.100)
Beleuchtet Abb. 21.37b). Setzen wir also
G Etrans
G T ( x, y ) ERe ko ,
(21.101)
so erhalten wir durch Berücksichtigung von I(x, y) in T(x, y) und Einsetzen von T(x, y)
G Etrans
G G G G2 G2 G G G i ( kRe f rRe f MObj ) ERe ko T0 J ( ERe E ) J E E E e f Obj Re ko Obj Re f G G G i ( kGRe f rGRe f MObj ) J ERe ko ERe f EObj e .
^
`
(21.102)
Der erste Term stellt die geschwächte Rekonstruktionswelle dar. Der zweite und dritte Term beschreiben die beiden gebeugten Wellen.
G Etrans1
G G G E0,trans ei (Zt kRe ko rRe ko )
G Etrans2
E
1
G
0,trans
G
2
G
e i (Zt kRe ko rRe ko )
G G G G G G i (Z t ( kRe ko kRe f ) rRe f MObj ) J ERe ko EObj ERe f e ; G G G G G G i (Z t ( kRe ko kRe f ) rRe f MObj ) J ERe ko EObj ERe f e .
(21.103)
(21.104)
G G G Der ersten Welle mit dem Wellenvektor k1 kRe ko kRe f entspricht das virtuelle Bild Bvirt und G G G der zweiten mit dem Wellenvektor k2 kRe ko kRe f das reelle Bild Breell . Beide enthalten die
volle Information über Amplitude und Phase der ursprünglichen Objektwelle. Blickt insbesondere ein Beobachter durch das Hologramm hindurch, so sieht er ein dreidimensionales Bild des Objektes. Die andere Welle, auch konjugierte Welle genannt, kann, soweit erforderlich, aus dem Gesichtsfeld ausgeblendet werden. Entsprechend (21.98) haben wir die Holographie bisher an Hand eines Amplituden- oder Transmissionshologramms erläutert. Zur Speicherung der optischen Information können aber auch Veränderungen der Oberflächenstruktur oder des Brechungskoeffizienten dienen. Auf
684
21 Interferenz und Beugung
diese Weise entstehen Phasenhologramme. Die lichtempfindliche Schicht kann nach der Entwicklung gebleicht werden. Das hat den Vorteil, dass bei der Wiedergabe erheblich größere Leuchtdichten erzielt werden können als mit Amplitudenhologrammen. Es soll noch angemerkt werden, dass eine Fotoplatte nur Helligkeitsunterschiede von etwa zwei Größenordnungen speichern kann. Abzubildende Objekte besitzen dagegen meistens erheblich stärkere Kontraste. Da aber die Speicherung jedes einzelnen Punktes des Objektes auf der ganzen Fläche der Fotoplatte erfolgt, können auf das rekonstruierte Bild Helligkeitsunterschiede bis zu ca. sechs Größenordnungen übertragen werden. Was für Konsequenzen hat es, wenn ein Hologramm zur Rekonstruktion mit monochromatischem Licht einer anderen Wellenlänge OReko als der zur Aufnahme verwendeten beleuchtet wird? Das wird klar, wenn wir uns daran erinnern, dass der Beugungswinkel proportional der verwandten Wellenlänge, sin D O , ist. Ist also OReko < O, so wird das Bild kleiner als das ursprüngliche Objekt, im umgekehrten Fall, OReko > O, wird es vergrößert. Soll das Hologramm eines farbigen Objektes erstellt und später rekonstruiert werden, so muss die Aufnahme mit drei verschiedenfarbigen Lasern geschehen, deren Summe weißes Licht ergibt. Die Fotoplatte braucht dazu nicht farbempfindlich zu sein; es genügt eine schwarzweiß-empfindliche Schicht. Wichtig ist nur der unterschiedliche Abstand der Interferenzstreifen. Zur Rekonstruktion müssen wiederum Laser der gleichen Farben eingesetzt werden.
21.2.5.4 Weißlicht-Holographie
Mit einer speziellen Aufnahmetechnik gelingt die Aufnahme von Hologrammen, deren Information auch mit weißem, inkohärentem Licht sichtbar gemacht werden kann. Dazu wird eine wenige μm dicke lichtempfindliche Schicht von der einen Seite mit intensivem monochromatischem Laserlicht und von der anderen Seite mit dem vom Objekt gestreuten Licht beleuchtet (Abb. 21.38). Dabei entsteht eine stehende Lichtwelle, durch die im Abstand d periodisch Strahlteiler Schichten konstanter Absorption bzw. konstanten Brechungsindexes entstehen. Jede der typischerweise 20 geLaser schwärzten Schichten enthält die volle Information über das dreidimensionale Objekt. Bei der späteren Beleuchtung des Hologramms mit wießem Licht wird dieses zum Teil von den einzelnen Schichten reflektiert. Konstruktive Interferenz der einzelFotoschicht nen Teilwellen ist aber nur für solche Objekt Wellenlängen O möglich, für welche die Bragg-Gleichung Abb. 21. 38: Aufnahme eines Weißlicht-Hologramms
2d cos D
mO , m 1, 2,3,. (21.84)
21 Interferenz und Beugung
685
erfüllt ist. Das Bild erscheint daher in der Farbe, die dieser Wellenlänge O zugeordnet ist. Durch Variation des Einfallswinkels D c (90 D ) (D = Braggwinkel) kann die Farbe des Bildes verändert werden.
21.2.5.5 Anwendungen
D) Herstellung eines holographischen Beugungsgitters Die Herstellung eines Beugungsgitters nach dem holographischen Verfahren bietet die Gewähr absoluter Fehlerfreiheit. Bedingt durch den Herstellungsprozess ist allerdings die Spaltfunktion kein Rechteck, sondern sinusförmig. Das wird klar, wenn wir daran denken, dass ein Transmissionsgitter durch Beleuchtung einer auf einer Glasunterlage befindlichen Fotoschicht mit
Kohärente r r TeilwellenE1 , E 2 r E1
Abb. 21.39: Herstellung eines Beugungsgitters mit sinusförmiger Spaltfunktion und
r E2 Fotoschicht
zwei durch einen Strahlteiler aufgespaltenen monochromatischen ebenen Lichtwellen entsteht (Abb. 21.39). Die eine Welle wirkt als Referenzwelle, die andere als Objektwelle. Durch Interferenz entsteht ein sinusförmiges Schwärzungsmuster, ein „Sinusgitter“, das als optisches Transmissionsgitter dienen kann. Auch ein Echelette-ähnliches Reflexionsgitter kann holographisch hergestellt werden. Dazu wird durch zwei einander entgegenlaufende ebene Wellen wiederum ein stehendes Wellenfeld (Abb. 21.40) erzeugt. In diesem befindet sich eine mit einem Fotolack beschichtete, schräg zur Wellennormale stehende ebene Glasplatte. Beim Entwickeln wird der Fotolack entsprechend dem Grad der Belichtung herausgelöst. Die Glasplatte mit ihrer Echelette-ähnlichen Struktur wird anschließend mit einer metallischen Schicht bedampft. Eine andere Möglichkeit besteht darin, ein Sinusgitter durch Ionenätzen auf die gewünschte Form abzuschleifen.
686
21 Interferenz und Beugung
E) Holographische Interferometrie Mit Hilfe der Holographie können Verformungen unterschiedlichen Ursprungs sichtbar gemacht werden. Veränderungen in der Oberflächenbeschaffenheit treten etwa bei der Materialbearbeitung auf oder beim Spielen auf einem Musikinstrument (Abb. 21.41/42). Erstere demonstriert die Verformung eines Werkstückes bei einseitiger Verspannung. Es ist das Resultat einer Doppelbelichtung. Zunächst wird ein Hologramm vor einer Verformung aufgenomen, ein zweites nach erfolgter Verformung. Fotoplatte (und Laser) bleiben dabei ortsfest.
Flächen maximaler Belichtung Fotolack Träger
Entwicklung des Fotolacks
Abb. 21.40: Herstellung eines echeletteähnlichen Reflexionsgitters mit der Methode der Holographie
Bei der Rekonstruktion entstehen gleichzeitig zwei Wellen, die infolge des Phasenunterschiedes ein holographisches Interferogramm erzeugen. Die Interferenzstreifen sind Linien gleichen Abstandes zwischen den aufgenommenen Zuständen.
21 Interferenz und Beugung
Abb. 21.41: Hologramm eines Flansches unter einseitiger Verspannung (Phys. In uns. Zeit 5, 174 (1974)
687
Abb. 21.42: Hologramm einer schwingenden Platte bei Verspannung bei 540 Hz (Phys. In uns. Zeit 5, 176 (1974)
J) Holographische Datenspeicher Zur nichtflüchtigen Speicherung großer Datenmengen lassen sich zwei Typen unterscheiden: Magnetische bzw. optische Speicher und Halbleiterspeicher. Wie der Name besagt, sind auf Ersteren die Informationen mit Hilfe eines mikrofabrizierten Elektromagneten in eine 10-15 nm dicke magnetisierbare Schicht eingeschrieben, von wo sie auch ausgelesen werden können (L21.10). Das analoge Signal wird in eine Folge von Bits umgewandelt. Unter Laborbedingungen wurden Dichten von 20 Gigabit/cm2 erzielt. Ein anderes Speichermedium sind digitale optische Speicher (DOS), bei denen die Informationsbits mit Hilfe eines optischen Modulators durch einen Laser als kleine Vertiefungen (pits) spiralförmig in eine dünne Schicht eingeprägt sind. Die Begrenzung der Speicherdichte ist durch die minimale Ausdehnung des zum Einlesen erforderlichen Lichtflecks gegeben, liegt also bei etwa 1μm. Auf diese Weise entstanden die Videoplattenspeicher und später auch die Digital Versatile (Video) Discs (DVD). Auf ihnen finden bis zu 17 Gigabit Platz. Das ist etwa das 17-fache einer CD. Die pits haben eine Tiefe von O/4, interferieren also mit den von der übrigen Oberfläche reflektierten Lichtstrahlen destruktiv. Diese Maßnahme und die Beugung an den pits ergeben den zum Auslesen erforderlichen Kontrast. Eine weitere Erhöhung der Speicherkapazität wurde mit Hilfe eines blau-violetten Lasers (O = 405 nm) realisiert. Die „Blu-ray Disc (BD) speichert in einer einzelnen Schicht ca. 25 GB. – Bezüglich der Wirkungsweise von Halbleiterspeichern sei auf die Literatur (L21.11) verwiesen. Als weitere optische Methode zur Informationsspeicherung sei zunächst der fotorefraktierte Effekt genannt. Darunter ist eine durch Laserlicht hervorgerufene Änderung des Brechungsindexes zu verstehen. Durch die Bestrahlung werden in einem geeigneten Kristall Ladungs-
688
21 Interferenz und Beugung
träger freigesetzt, die zu einem Raumladungsfeld führen. Diese bewirkt über den Pockelseffekt die genannte Brechungsindexänderung. Durch Anwendung holographischer Methoden kann durch den photorefraktiven Effekt ein Muster im Kristall erzeugt und gespeichert werden. Wir beschränken uns hier auf elektrooptische Materialien, z.B. ein mit Fremdatomen dotierter ferroelektrischer Kristall. Entdeckt wurde der Effekt in LiNbO3 : Fe2+ (L21.12-14). In einen solchen Kristall wird in der üblichen Weise durch Objekt- und Referenzstrahl ein Interferenzmuster erzeugt. Zunächst wird die zu speichernde Information in Form eines Flüssigkristall-Displays in flächige Hell-Dunkel-Muster umgewandelt. Diese Muster werden einem Laserstrahl aufgeprägt, der dadurch zum Objektstrahl wird. Durch Veränderung des Winkels, unter dem der Referenzstrahl die Fotoplatte trifft, können viele Hologramme in einem Kristall gespeichert werden. Das eingeprägte Interferenzmuster setzt an den Fremdatomen der beHell Hell Dunkel leuchteten Stellen die oben genannr r r r ten Ladungsträger frei. Die entstanE E E E denen Elektronen bzw. Löcher diffundieren in unbeleuchtete Bereiche, wodurch zusammen mit den zurückgebliebenen umgekehrt geladenen Atomrümpfen lokale elektrische Felder entstehen (Abb. 21.43). Dadurch Abb. 21.43: Entstehung lokaler Felder durch kommt es zu einer Polarisation und Einprägung eines optischen Interferenzmusters geringen Verzerrung des atomaren Gitters, was makroskopisch zu einer leichten lokalen Änderung des Brechungsindexes führt und damit zu einem optischen Phasengitter. Die Erscheinung wird als fotorefraktiver Effekt bezeichnet. Der Prozess benötigt nur geringe Strahlleistungen; schon solche im mW-Bereich genügen, um Brechungsindexänderungen zu erzeugen. Die Zeit, über welche die Information gespeichert werden kann, hängt stark von dem verwendeten Kristall ab, ferner von den Umgebungsbedingungen. Dotierte LiNbO3-Kristalle verhalten sich in dieser Hinsicht besonders günstig. Ein aufgeprägtes Phasengitter bleibt über Jahrzehnte oder länger stabil. Wird das Hologramm zur Rekonstruktion mit dem Referenzstrahl beleuchtet, so wird er von dem eingeprägten Gitter so abgelenkt, dass wieder das ursprüngliche Objekt entsteht. Eine neue Entwicklung ist die “Holographic Versatile Disc“ (HVD), die mit einem roten und einem blaugrünen Laser arbeitet. Sie besteht im Prinzip aus zwei Schichten. Der blaugrüne Laser dient zur Auslesung der kodierten Interferenzmuster im oberen Bereich, der rote Laser liest in der unteren, CD-adäquaten Schicht, zum Abspielen erforderliche Hilfsinformationen. Die Speicherfähigkeit beträgt etwa das 20-fache einer BD. Die beiden Schichten sind durch eine dichroitische Spiegelschicht optisch voneinander getrennt, so dass Interferenzen von dem an der CD-Schicht reflektierten blaugrünen Laserlicht mit dem Auslesestrahl selbst ausgeschaltet werden.
21 Interferenz und Beugung
689
21.3 Spektralapparate 21.3.1 Optischer Aufbau
Ein Spektralapparat dient zur Analyse des Wellenlängen- bzw. Frequenzspektrums elektromagnetischer Wellen. Wir unterscheiden Prismenspektralapparate, Gitterspektralapparate und Interferenzspektralapparate. Im Allgemeinen geben die Geräte unmittelbar die Wellenlänge des Lichts an, das aus dem Gerät austritt, im einfachsten Fall besitzen sie eine geeichte Skala. Wir sprechen dann von einem Monochromator. Durch Hinzufügung einer geeigneten Strahlungsquelle und eines Detektors wird dieser zu einem Spektrometer. Eine wichtige Kenngröße eines Monochromators bzw. Spektrometers ist sein spektrales Auflösungsvermögen O/GO. Dieses liegt im Allgemeinen unterhalb des berechneten theoretischen Auflösungsvermögens des betreffenden Dispersionselementes bzw. Interferometers. Um das einzusehen, zeigen Abb. 21.44a/b den Strahlengang eines Prismen- und eines Gitterspektrometers. Der Monochromator besteht im Wesentlichen aus dem Dispersionselement und der
A-Spalt Detektor
1
D
Gitter l
Q
f
Abb. 21.44a: Aufbau eines Prismen-Spektralapparates
E-Spalt Abb. 21.44b: Aufbau eines GitterSpektralapparates
zugehörigen Optik. Diese kann sich aus Linsen oder Hohlspiegeln zusammensetzen. Letztere erlauben eine kompakte Bauweise, besitzen eine wellenlängenunabhängige Brennweite und können auch im infraroten und Submillimeterbereich eingesetzt werden. Das vom Eintrittsspalt ausgehende divergente Lichtbündel fällt auf einen im Abstand der Brennweite stehenden Parabolspiegel, von dem es als paralleles Lichtbündel das Gitter erreicht. Das gebeugte Licht trifft auf einen, im Allgemeinen identischen Parabolspiegel, der es auf die Ebene des Austrittsspaltes fokussiert, hinter dem sich im einfachsten Fall der Detektor befindet. Die Wellenlänge des durch den Spalt tretenden Lichtes wird durch Drehung des Gitters eingestellt. Spalt und Detektor sind häufig durch einen flächenhaften Detektor ersetzt, dessen einzelne Zeilen (parallel zu den Gitterfurchen) angesprochen werden können.
690
21 Interferenz und Beugung
21.3.2 Winkel- und Lineardispersion
Zurück zum Auflösungsvermögen des Spektrometers. Wir definieren zunächst die Winkeldispersion und die Lineardispersion des Monochromators. Hinter dem dispergierenden Element unterscheiden sich die Normalenrichtungen der Wellen der Wellenlänge O und der Wellenlänge O+'O um den Winkel '4 (Abb. 21.45).
'4
d4 'O . dO
(21.105)
Die Größe d 4 / d O wird Winkeldispersion genannt. Der zweite Spiegel bildet den durch Licht der Wellenlänge O beleuchteten Eintrittsspalt in die Ebene des Austrittsspaltes ab. Der Abstand 'x zwischen diesem und dem durch die gebeugte Strahlung der Wellenlänge O+'O entstandenen Spaltbild beträgt
'x
dx 'O dO
f 2 '4
f2
d4 'O . dO
(21.106)
Die Größe dx/dO heißt Lineardispersion des Monochromators. Beide Größen werden wir gleich berechnen. Zuvor betrachten wir aber an Hand von Abb. 21.46 den Einfluss der endlichen Apertur auf die Spaltbilder. f2 Unabhängig von dem im Einzelfall begrenzenden optischen Element können x wir sie durch eine Blende der Breite D darstellen. Durch Beugung entsteht in der Brennebene der hinteren Linse (bzw. des zweiten Spiegels) selbst bei verschwindender Breite des Eintrittsspaltes eine endlich breite Intensitätsverteilung mit der Fußpunktsbreite Abb. 21.45: Zur Winkeldispersion 'xBeug 2 f 2 O / D . (21.107) Mit dem Rayleigh-Kriteriums folgt als kleinster auflösbarer Abstand zweier Spektrallinien
f2O / D .
'xmin
(21.108)
Setzen wir diesen Wert in (21.106) ein, so erhalten wir für das maximale Auflösungsvermögen, wenn wir statt 'O GO schreiben
O GO
D
d4 . dO
(21.109)
21 Interferenz und Beugung
I
a)
D
x
691
I
I
b)
f /D
x
c)
f /D+b
x
Abb. 21.46: Intensitätsprofil I(x) in der Beobachtungsebene a) bei endlicher Breite des Eintrittsspaltes und Vernachlässigung der Beugung b) unter Einbeziehung der Beugung c) bei unendlich schmalen Eintrittsspalt
In der Praxis muss der Eintrittsspalt natürlich eine endliche Breite b haben, so dass wir statt (21.108) erhalten
'x2
f
O D
b,
(21.110)
wobei wir vorausgesetzt haben, dass die Brennweiten der beiden Linsen bzw. Hohlspiegel gleich sind. Damit wird das Auflösungsvermögen
O GO
O
d4 . O b ½ dO ® ¾ ¯D f ¿
(21.111)
Die Breite des Eintrittsspaltes sollte einen unteren Wert nicht unterschreiten, der dadurch bestimmt ist, dass die Winkelbreite des Beugungsmaximums nullter Ordnung das Öffnungsverhältnis D/f des auf den Kollimatorspiegel treffenden Lichtbündels nicht überschreitet. Es muss also gelten
2'M |
bmin t
2O D d , bmin f
2O f . D
(21.112)
(21.113)
Wird der Eintrittsspalt weiter zugezogen, so geht durch Überstrahlung des Spiegels zunehmend Lichtenergie verloren.
692
21 Interferenz und Beugung
21.3.3 Auflösungsvermögen
Wir wenden uns jetzt der Winkeldispersion eines Prismenmonochromators und eines Gittermonochromators zu. Zunächst zum Prisma. Wir betrachten den Fall des Minimums der Ablenkung, in dem das Lichtbündel (für eine mittlere Wellenlänge) das Prisma parallel zur Basis durchläuft. Für diesen Fall ergibt sich nach Kap. 20.4.3 als Verknüpfung zwischen Eintrittswinkel, Austritts- und brechendem Winkel, Gl. (20.29)
d4 dO
2sin(J / 2)
dn 1 n 2 sin 2 (J / 2) d O
(21.114)
Für die Beugung am optischen Reflexionsgitter gilt die Relation
d (sin D sin E ) mO .
(21.115)
Der Einfallswinkel D ist dabei positiv zu zählen, der Beugungswinkel ß wird als positiv definiert, wenn er auf der gleichen Seite der Gitternormalen liegt wie der Einfallswinkel und als negativ, wenn er auf der anderen Seite liegt. Bei festem Einfallswinkel D (s. Abb. 21.44b) folgt die Winkeldispersion durch Differentiation nach dem Beugungswinkel E zu
dE dO
m d cos ß m
(21.116)
d 2 (mO d sin D ) 2 1 2
2
d cos D 2d O sin D O2 m2 m
.
Bei fixiertem Ein- und Austrittsspalt wird die Wellenlänge, wie oben bereits vermerkt, durch Drehung des Gitters um einen Winkel H gegen die Stellung in nullter Ordnung eingestellt. Bezeichnet U den Winkel zwischen Eintritts- und Ausfallsrichtung, so gelten die Verknüpfungen
D H U / 2,
ß H U /2
(21.117)
und damit
mO
2d cos( U / 2)sin H .
(21.118)
Wir wollen das Auflösungsvermögen eines Prismenmonochromators mit dem eines Gittermonochromators vergleichen. Dazu genügt es, die Winkeldispersionen auszurechnen.
21 Interferenz und Beugung
693
Als Beispiel wollen wir wählen: O = 500 nm, J = 60°, n = 1,55, dn/dO = 8,9710-3 bzw. m = 1,
d = 1 μm 1200 Furchen/mm, U | 0°. Daraus folgt
< für das Prisma
d T /dO = 1,79 10-2 μm-1,
(21.119)
< für das Gitter
dß /dO = 1,01 μm-1.
(21.120)
Das Gitter hat also eine ca. 60-mal größere Winkeldispersion als das Prisma und ist Letzterem daher bez. des Auflösungsvermögens überlegen. Dagegen besitzt das Prisma den Vorteil, dass jeder Spektrallinie in der Beobachtungsebene eine eindeutige Wellenlänge zugeordnet ist, während beim Gittermonochromator eine Vorfilterung für Wellenlängen d O/2 erforderlich ist. Das Auflösungsvermögen wird mit D = 120 mm, f = 1 m, 's = 0,01 mm
< für das Prisma
O/dO = 895;
< für das Gitter
O/dO = 500 102.
Das maximale Auflösungsvermögen ergibt sich mit b | 0 aus (21.111) zu
ªO º « GO » ¬ ¼ max
D
d4 dO
2 D sin(J / 2)
dn . 1 n sin (J / 2) d O 2
2
(21.121)
Der Ausdruck lässt sich noch vereinfachen. Nach Abb. 44a ist
D
l cos D1 . 2sin(J / 2)
(21.122)
Beim Minimum der Ablenkung gilt ferner
n sin(J 2) sin ^(4 J ) / 2` sin D1 ,
(21.123)
so dass wir für das maximale Auflösungsvermögen erhalten
ªO º « GO » ¬ ¼ max
l
dn . dO
(21.124)
Das Auflösungsvermögen bei unendlich schmalen Spalten ist allein durch die Basislänge und die Dispersion des Prismas bestimmt.
694
21 Interferenz und Beugung
In unserem Beispiel ergibt sich mit l = D/cos 30°
ªO º « GO » ¬ ¼ max,Pr isma
2480 .
(21.125)
Im Fall des Gitters gilt mit D = N d cos(U/2 - D)
ªO º « GO » ¬ ¼ max,Gitter
D
dD dO
Nm 1, 2 105 .
(21.126)
Diese Werte sind etwa dreimal so groß wie die oben angegebenen bei endlich breiten Spalten. Abschließend noch eine ergänzende Bemerkung zum Prisma. Die Ableitung des Auflösungsvermögens verschleiert etwas die Rolle der Wellennatur des Lichtes und der mit ihr einhergehenden Beugungserscheinungen. Deswegen sei hier noch eine andere Ableitung gegeben. Jede Spektrallinie ist ein Beugungsbild der das Strahlenbündel begrenzenden Blende. Selbst bei unendlich schmalem Spalt existiert eine endliche Breite, wie wir beim Gitter gerade gefunden haben. Als Begrenzung wirkt beim Prisma dessen Breite, D h cos D1 ; die daraus resultierende Halbwerts-Winkelbreite beträgt gemäß (21.66a/b) O/D. Damit zwei Spektrallinien der Wellenlängen O und O + dO noch getrennt werden können, müssen sie folglich um diesen Winkel divergieren. Bei symmetrischem Durchgang (s. Fig. 20.10) ändert sich dabei der Ablenkungswinkel G = 2D - 2ß, also bei einer Änderung des Brechungsindexes von
um
dn
dn dO dO
dG
2 dD
2
O
O
D
a cos D
dG
sin(J / 2) dn dO . cos D d O 2
sin(J / 2) dn dO . cos D d O
(21.127a)
(21.127b)
Eliminieren wir hierin sin (J/2) und cos D, so ergibt sich das gleiche Ergebnis wie in (21.124):
O dO
2a sin(J / 2)
dn dO
l
dn . dO
Jetzt ist auch das Auftreten der Basisbreite im Auflösungsvermögen verständlich.
(21.128)
21 Interferenz und Beugung
695
21.3.4 Gegenüberstellung von Interferometer- und Gitterspektrometer
Wir wollen das maximale Auflösungsvermögen von Gitterspektralapparaten mit dem von Interferometern vergleichen. Dazu stellen wir hier die abgeleiteten Ausdrücke zusammen.
< Zweistrahlinterferometer
ªO º « GO » ¬ ¼ max
2
ªO º « GO » ¬ ¼ max
2
N eff 's 2 O
ªO º « GO » ¬ ¼ max
2
N 's 2 O
's
O
2
'smax
O
;
(21.30)
(Fourierspektrometer)
< Vielstrahlinterferometer
2
'smax
O
;
(21.48)
(Fabry-Perot-Interferometer
< Gitterspektrometer
2
'smax
O
.
(21.63)
Hierin ist N/2 bzw. Neff/2 die Anzahl der paarweise miteinander interferierenden Teilwellen. 's ist der Wegunterschied benachbarter Wellen, 'smax der maximale Wegunterschied zwischen einer herausgegriffenen Teilwelle p und der Teilwelle p + N/2. In allen drei Fällen ist das Auflösungsvermögen durch den auf die jeweilige Wellenlänge bezogenen maximalen Wegunterschied zugehöriger (miteinander interferierender) Teilwellen bestimmt. Dass in das Ergebnis nicht die Eigenheiten des speziellen Spektralapparates eingehen, ist nicht verwunderlich. Es handelt sich immer um Interferenz und die Trennbarkeit zweier Spektrallinien hängt allein vom maximalen Wegunterschied ab. Sei dieser gleich einem ganzzahligen Vielfachen Z1 einer Wellenlänge O1/2,
'smax
Z1
O1
(21.129)
2
bzw. gleich einem ganzzahligem Vielfachen Z2 einer Wellenlänge O2/2,
'smax
Z2
O2 . 2
(21.130)
Zwei Wellenlängen lassen sich noch voneinander trennen, wenn Z2 = Z1 + 1 ist. Mit O2 O1 GO O GO und GO O folgt
'smax
O
GO
O 2
.
(21.131)
Bei gegebener Wellenlänge O ist das auflösbare Wellenlängenintervall umso kleiner, je größer der (auf die Wellenlänge bezogene) maximale Wegunterschied ist. Dieses Ergebnis ist in
696
21 Interferenz und Beugung
vollständiger Übereinstimmung mit (21.30), was einleuchtend ist, da sie auf den gleichen Voraussetzungen beruht. Ein großer maximaler Wegunterschied lässt sich entsprechend (21.48) und (21.73) durch einen großen Gangunterschied benachbarter Teilwellen oder/und eine große Anzahl N miteinander interferierender Wellen erreichen. Die Wirkungsweise von Interferometern basiert auf einem großen Gangunterschied m benachbarter Wellen. Der Extremfall ist beim Zweistrahl-Interferometer realisiert, bei dem N/2 = 1 ist. Dagegen arbeiten Gitterspektralapparate mit großen N und kleinen m. Dementsprechend ist der nutzbare Spektralbereich 'O O / m , wie bereits abgeleitet, bei den beiden Gerätetypen ganz unterschiedlich.
21.3.5 Lichtstärke von Monochromatoren
Neben dem spektralen Auflösungsvermögen ist die Lichtstärke eines Spektralapparates von Wichtigkeit. Darunter verstehen wir das Produkt U aus der Fläche des Eintrittsspaltes ASp und dem vom Monochromator erfassten Raumwinkel :. In der Folge wollen wir die Lichtstärke eines Michelsoninterferometers (MI) mit dem eines Gitterspektralapparates bei gleichem spektralen Auflösungsvermögen vergleichen. Dabei sollen Eintritts- und Austrittsspalt sowie die beiden Parabolspiegel gleiche Durchmesser D bzw. Brennweiten f haben. Der Raumwinkel ergibt sich in beiden Fällen zu
: S
D2 ; 4f2
(21.132)
die Fläche der Lochblende ist durch die Fläche des zentralen Maximums gegeben, wobei der Radius mit dem in Abb. 21.11 bereits eingeführten Neigungswinkel D verknüpft ist.
r
2 fD .
(21.133)
Folglich erhalten wir für das Produkt aus Blendenfläche und Raumwinkel
U
S f 2D 2 S
D2 4f 2
S2
D2 2 D 4
(21.134)
Der Winkel D bestimmt sich aus (21.17):
's cos D
O o D 2 # 2(1 O / 's ) .
(21.135)
Drücken wir hierin den Bruch durch das Auflösungsvermögen aus, so folgt
§ ©
2
· ¹
. D 2 # 2 ¨1 O / dO ¸
(21.136)
21 Interferenz und Beugung
697
Damit folgt schließlich
U MI
S2
D2 § 2 · ¨1 ¸. 2 © O / dO ¹
(21.137)
Für den Gitterspektralapparat ergibt sich
UG
bh
D2 , f2
(21.138)
wobei b die Spaltbreite und h dessen Länge ist. Das Auflösungsvermögen beträgt nach (21.111)
O GO
1
O b ½ d4 ¾ . ¯ D f ¿ dO
O®
(21.111)
Bildung der Winkeldispersion ( 4 o H ) mittels (21.118) führt mit D
O GO
Nd cos H zu
O dN cos H m O Nbd cos H / f 2 d cos( U / 2)cos H ^ ` Nm
O 2^O Nbd (cos H ) / f `
(21.139)
.
Dieser Ausdruck lässt sich nach b auflösen und in (21.138) einsetzen. Es ergibt sich
UG
hNd O Rmax ( 1) . f cos H 2 R
(21.140)
R bedeutet hierin das spektrale Auflösungsvermögen. Das Verhältnis der Lichtstärken der beiden Spektralapparate folgt mit (21.124) und (21.140) zu
U MI UG
(S 2 D / 2)(1 2 / R) . (hO / f ) ^( Nm / 2 R ) 1`
(21.141)
Legen wir ein Auflösungsvermögen von R = 105 fest, D = 100 mm, d = 10-2 mm, O = 5*10-3 mm, h = 0,5 cm und f = 103 mm, so erhalten wir
U MI | 102 S 2 . UG
(21.142)
698
21 Interferenz und Beugung
Ergänzung 1: Ableitung der Kirchhoffschen Integralformel Ausgangspunkt zur Lösung einer Beugungsaufgabe ist die Wellengleichung
G G 1 w2 E 'E 2 2 c wt
0.
(21A1.1)
Die Lösung hat bestimmte, durch das betreffende Hindernis und die Lichtquelle festgelegte Randbedingungen zu erfüllen. Beschränken wir uns auf zeitlich periodische Lösungen
G E ( x, y , z , t )
G E ( x, y, z )e iZt
(21A2.2)
so ist die zeitfreie Wellengleichung
G G 'E ( x, y, z ) k 2 E ( x, y, z ) 0
(21A1.3)
zu lösen. Das ist im Allgemeinen eine sehr schwierige Aufgabe. Das Problem wurde daher von Kirchhoff vereinfacht. Ausgehend vom Huygens-Fresnelschen Prinzip soll sich die Feldstärke an einem entfernten Aufpunkt aus Kugelwellen (Elementarwellen) zusammensetzen, die von den einzelnen Punkten einer beleuchteten Öffnung ausgehen. Dementsprechend versuchen wir, das Verhalten einer Lösung der stationären Wellengleichung im Punkt P darzustellen durch ein Oberflächenintegral auf einer den Punkt P umschließenden Fläche, dessen Integrand Kugelwellen um die Punkte der Fläche enthält. Diese Fläche werden wir später mit der Ebene identifizieren, welche die beugende Öffnung enthält. Wir können sie uns im Unendlichen geschlossen denken. Wegen der großen Schwierigkeiten wird nicht die Lösung der vektoriellen Wellengleichung (21A6.1) gesucht, sondern nur die der skalaren Gleichung
'u k 2 u
0.
Ausgangspunkt zur Lösung ist die Greensche Integralformel
³ v'u u'v)dV v³ v grad u u grad v)dA .
V
(21A1.4)
A
In ihr setzen wir
u u0 , v
e ikr . r
(21A1.5)
u0 bedeutet die Lichterregung (~ Feldstärke ). Der Nullpunkt unseres Koordinatensystems liege im Punkt P (Abb. 21A1.1). Um die Formel anwenden zu können, schließen wir P durch eine kleine Kugel mit Radius rK von der
21 Interferenz und Beugung
699
Integration aus. Da u0 Lösung der Wellengleichung ist, verschwindet das Volumenintegral. Aus der rechten Seite wird
§ · G e ikr e ikr u grad grad u0 ¸ dA v³AG ¨© 0 r r ¹
§ · G e ikr e ikr u grad grad u0 ¸ dA (21A1.6) ¨ 0 v ³ G r r ¹ AKugel ©
Lassen wir den Radius der Kugel um P gegen null gehen, so wird das zweite Integral auf der rechten Seite null, da dA r2 ist. Es verbleibt das Integral
³
grad
AKugel
eikr G dA r
(21A1.7)
Die Gradientenbildung ergibt
grad x
eikr r
x § ik 1 · ¨ 2 ¸ e ikr i (21A1.8) r ©r r ¹
und analoge Ausdrücke für die beiden anderen Komponenten. Es wird also
grad
eikr r
Da dAˆ Kugel 4S
³u 0
0
§ ik 1 ¨ 2 ©r r
· ikr ¸ e rˆ . (21A1.9) ¹
rˆ , ergibt die Integration
§ ik 1 · 2 2 ¸ e ikr rKugel d: ¨¨ ¸ r r Kugel ¹ © Kugel 4S u0 (ikrKugel 1)
Abb. 21A.1: Zur Ableitung der Kirchhoffschen Integralformel
(21A1.10) Mit r o 0 folgt aus der Greenschen Formel die Kirchhoffsche Formel
u0 ( P )
1 4S
§ e ikr e ikr · G grad u u grad ¨ ¸ dA . 0 0 v³AG © r r ¹
(21A1.11)
Mit ihr ließe sich die Lichterregung u0 in einem Punkt P berechnen, wenn auf der ganzen, den Aufpunkt P umgebenden Fläche A diese Größe bekannt wäre! Dazu müsste das Problem aber bereits gelöst sein. Um das Dilemma zu umgehen, gehen wir folgendermaßen vor. Die Fläche A sei der Schirm, der die beugende Öffnung enthält. Er werde gegebenenfalls über das Unendliche geschlossen. Wir nehmen nun an, dass in der Öffnung u0 die gleichen Werte
700
21 Interferenz und Beugung
annimmt wie ohne Schirm. In der Schirmebene außerhalb der Öffnung sollen u0 = 0 und grad u0 = 0 sein. Mit diesen Festlegungen lautet die Kirchhoffsche Formel
u0 ( P )
1 4S
§ e ikr e ikr · G grad u u grad ¨ ¸ dA . 0 0 ³ r r ¹ Öff ©
(21A1.12)
Für die Lichterregung in der Öffnung setzen wir eine von der Quelle ausgehende Kugelwelle an:
u0 { E
E0
e
ikrQ
rQ
.
(21A1.13)
Da der Abstand rQ immer groß gegenüber der Wellenlänge ist, wird nach (21A1.9)
grad
eikr r
ik ikr e rˆ . r
(21A1.14)
Einsetzen in die Kirchhoffsche Formel führt zu der Beziehung
ikE E ( P) 0 4S
° e ik ( rQ rP ) G G G G cos( r , dA ) cos( r ® Q P , dA) ³ ° rQ rP Öff ¯
½
°¾ d[ dK .
(21A1.15)
¿°
Aus dem gleichen Grund ( (rQ rP ) !! O ) reagiert der Zähler viel empfindlicher auf eine Änderung von rQ , rP als der Nenner und die Differenz der Kosinusterme. Wir können (21A1.15) daher schreiben als
E ( P)
G G G G ikE0 cos(rQ , dA) cos(rP , dA)
4S rQ rP
³e
ik ( rQ rP )
d [ dK .
(21A1.16)
Öff
Da Beugungsmuster im Wesentlichen nur in der Nähe der geometrischen Schattengrenze auftreten, gilt für nicht zu unterschiedliche rQ, rP
G G G G cos(rQ , dA) | cos(rP , dA) , und damit
(21A1.17)
21 Interferenz und Beugung
E ( P)
701
G G E0 ik cos(rQ , dA)
2S rQ r
³³ e
ik ( rQ r )
d [ dK .
(21A1.18)
Öff
Ergänzung 2: Entwicklung der Feldamplitude in der Kirchhoffschen Integralformel, Gl. (21.58) bzw. (21A1.18) : Wir legen Abb. 21A1.1 zu Grunde. Aus ihr folgt
rP
( xP [ ) 2 ( yP K ) 2 z P2
rQ
( xQ [ ) 2 ( yQ K ) 2 zQ2
RP
xP2 yP2 z P2
RQ
xQ2 yQ2 zQ2
(21A2.1)
Für eine Taylor-Entwicklung werden benötigt
wr wx w2r wx 2
x ; r
wr wy
y r
1 x2 ; r r3
w2r wy 2
1 y2 ; r r3
w2r wx wy
(21A2.2)
xy 3 r
Die Taylor-Entwicklung ist
§ wr · r ( x [ , y K , z ) r ( x, y , z ) [ ¨ ¸ © wx ¹[ ,K
1 ° 2 § w 2 r · ®[ ¨ ¸ 2! ¯° © wx 2 ¹[ ,K
0
0
§ wr · K ¨ ¸ © wy ¹[ ,K
§ w2r · K 2 ¨ 2 ¸ © wy ¹[ ,K
0
§ w2r · 2[K ¨ ¸ © wx wy ¹[ ,K 0
½° ¾ ... ° 0¿ (21A2.3)
Setzen wir die Ableitungen ein, so erhalten wir
rP
RP
[ xP K y P RP
1 [ 2 K 2 ([ xP K P y ) 2 ½ ® ¾ .. RP3 2! ¯ RP ¿
(21A2.4a)
702
21 Interferenz und Beugung
rQ
RQ
[ xQ K yQ RQ
2 1 ° [ 2 K 2 ([ xQ K yQ ) °½ ® ¾ ... 2! ¯° RQ RQ3 ¿°
(21A2.4b)
x und y können wir durch die Richtungskosinus ausdrücken
cos D Q cos E Q
xQ RQ yQ RQ
; cos D P
xP ; RP
; cos E P
yP . RP
(21A2.5)
Das ergibt
) ([ ,K ) [ (cos D Q cos D P ) K (cos EQ cos E P ) 1 °§ 1 1 · 2 2 ®¨ ¸ ([ K ) 2 °¯¨© RQ RP ¸¹
([ cos D Q K cos E P ) 2 RQ
(21A2.6)
½° ([ cos D P K cos E P ) 2 ...¾ RP ¿°
21 Interferenz und Beugung
703
Zusammenfassung x Interferenzerscheinungen entstehen durch Überlagerung kohärenter Lichtbündel mit festen räumlichen und zeitlichen Phasenbeziehungen. x Interferenzfähige Lichtbündel lassen sich durch Aufspaltung eines inkohärenten Lichtbündels in zwei Teilbündel erzeugen. Bei der Überlagerung der Teilwellen wird die Intensität maximal, wenn der herbeigeführte Gangunterschied ein ganzzahliges Vielfaches der Wellenlänge ist. x Die Zweistrahlinterferenz wird beim Michelson-Interferometer ausgenutzt, das auch als Fourierspektrometer Verwendung findet. x Die Intensitätsverhältnisse bei der Vielstrahlinterferenz werden durch die Airy-Formeln beschrieben. Auf der Vielstrahlinterferenz beruht das FabryPerot-Interferometer, die Realisierung von Antireflexschichten und hochreflektierender dielektrischer Spiegel. x Die Beugung von Wellen kann auf der Grundlage des Huyghensschen Prinzips mit Hilfe der Kirchhoffschen Beugungsformel (7.58) beschrieben werden. Jeder Punkt der Phasenfläche einer Welle ist Ausgangspunkt einer neuen „Elementarwelle“. Die resultierende Welle ergibt sich durch Überlagerung der einzelnen Elementarwellen. x Beugungserscheinungen lassen sich in Fraunhofersche und Fresnelsche Beobachtungsart einteilen, je nachdem die Beugung durch parallele oder konvergente Lichtbündel erfolgt. x Bei Fraunhoferscher Beugung ist die Intensitätsverteilung an einem Punkt P hinter einem Spalt der Breite b
S b ½ sin 2 ® sin - ¾ ¯O ¿, I ( P) v b 2 2 S b ½ ® sin - ¾ ¯O ¿ wobei - der Beugungswinkel ist. Im Fall einer Kreisblende ist 2
I (- )
§ 2 I ( x) · I0 ¨ 1 ¸ ; © x ¹
x
2S R
O
I1(x) ist die Besselfunktion erster Ordnung.
sin - .
704
21 Interferenz und Beugung
x Die Intensitätsverteilung hinter einem linearen Gitter der Gitterkonstanten d ist in Fraunhoferscher Beobachtungsart (N = Anzahl der gebeugten Teilwellen, b = Spaltbreite) 2
2
sin( N ) / 2) ½ sin(M / 2) ½ I ( P) ® ¾ ® ¾ ; I ¯ sin() / 2) ¿ ¯ (M / 2) ¿
2S
d
O
sin - ;
M
2S
b
O
sin -
x Bei einem Raumgitter kann die Interferenzbedingung durch die Laue-Gleichungen oder die Bragg-Gleichung beschrieben werden. Ist D der Winkel zwischen einfallendem Strahl und der Gitterebene und d der Abstand benachbarter Gitterebenen, so lautet Letztere 2d cos D mO ; m 1, 2,3,... x Eine Fresnelsche Zonenplatte wirkt als Linse; ihre Brennweite ergibt sich als der Abstand, in dem sich die von allen Zonen herrührenden Teilwellen entsprechend ihren Phasen konstruktiv überlagern. x Das Babinetsche Theorem besagt, dass komplementäre Strukturen, wie z.B. Spalt und Draht, außerhalb ihres Schattenbereiches die gleichen Beugungsbilder ergeben. x Ein Hologramm entsteht durch Überlagerung der vom Objekt gestreuten Lichtwelle mit einer zu dieser kohärenten Referenzwelle auf einer Fotoplatte. Es enthält daher die vollständige Information über Amplituden und Phasen der von den einzelnen Objektpunkten gestreuten Lichtwellen. Durch Beleuchtung des entwickelten Hologramms mit einer kohärenten Lichtwelle gleicher Frequenz entsteht ein räumliches Bild des Gegenstandes. x Durch Kombination der Interferometrie und der Holografie können Verformungen unterschiedlichen Ursprungs sichtbar gemacht werden. x Das maximale (theoretische) Auflösungsvermögen verschiedener auf der Interferenz beruhender Spektralapparate ist im Vergleich a) Zweistrahlinterferometer (FTS)
ªO º « GO » ¬ ¼ max
2
b) Vielstrahlinterferometer (FPI)
ªO º « GO » ¬ ¼ max
2
N eff 's 2 O
c) Gitterspektrometer
ªO º « GO » ¬ ¼ max
2
N 's 2 O
's
O
2
'smax
O 2 2
;
'smax
O
'smax
O
;
.
Hierin ist N/2 bzw. Neff/2 die Anzahl der paarweise miteinander interferierenden Teilwellen. 's der Wegunterschied benachbarter Wellen (beim Gitter wird 's / O : m als Beugungordnung bezeichnet) 'smax der maximale Wegunterschied zwischen einer herausgegriffenen Teilwelle p und der Teilwelle p + N/2.
21 Interferenz und Beugung
705
x Bei einem Prismenspektrometer ist das maximale Auflösungsvermögen im Minimum der Ablenkung
ªO º « GO » ¬ ¼ max
l
dn , wobei l die Basislänge bedeutet. dO
x Ein Maß für die Lichtstärke einer Linse oder eines Hohlspiegels des Durchmessers D und der Brennweite f ist der erfassbare Raumwinkel :.
:
S D2 4 f2
.
Die Lichtstärke eines Spektralapparates ist durch das Produkt aus der Fläche des Eintrittsspaltes ASp und dem vom Monochromator erfassten Raumwinkel : gegeben.
Übungsaufgaben 1a. Berechnen Sie die Interferenzfigur in weiter Entfernung von einem Doppelspalt der Spaltbreite s und dem Spaltabstand d, wobei s < d. b. Wie ändert sich die Intensitätsverteilung, wenn die Spaltbreiten sich wie 2:3 verhalten? 2. In der Empfängerebene eines Michelson-Interferometers treten bei der Verschiebung des beweglichen Spiegels um 0,706 mm 1560 Helligkeitsmaxima auf. a) Wie groß ist die Wellenlänge des Lichtes? b) Wie groß ist das spektrale Auflösungsvermögen eines als Fourierspektrometer arbeitenden Spektralapparates, wenn die maximale Verschiebung des Spiegels 10 mm beträgt? c) Welche Bedeutung haben Eintritts- und Austrittsspalt bei einem Fourierspektrometer? Wo würden Sie die Spalte anordnen? d) Nur bestimmte Wellenlängen erfüllen die Interferenzbedingung. Welche Konsequenzen ergeben sich daraus (qualitativ)? 3. Das Licht von Cs-Dampf enthält zwei schwache Spektrallinien mit den Wellenlängen 684,9 nm und 689,5 nm. Berechnen Sie die Anzahl der beobachtbaren Interferenzmaxima und die Kohärenzlänge für dieses Licht unter der Voraussetzung, dass die Halbwertsbreite gleich dem halben Linienabstand ist. 4. Eine Glasplatte (n = 1,65) werde zur Entspiegelung mit einer Schicht MgF2 (n = 1,38) bedampft. Berechnen Sie für senkrechte Inzidenz die Schichtdicke für eine Wellenlänge von O = 600 nm. Wie groß ist das verbleibende Reflexionsvermögen (die Reflektivität)? Welche Werte ergeben sich bei O = 380 nm und bei 720 nm? Wie lässt sich eine bessere Entspiegelung erreichen?
706
21 Interferenz und Beugung
5. Ein Freund erbittet von Ihnen eine möglichst verlustfreie Fresnel-Linse mit einer Brennweite von f = 12 mm und einem Durchmesser von D = 25 mm. Der Brechungsindex des Linsenmaterials betrage n = 1,5. Wie groß müssen Sie die Radien der Furchen (Tiefe 1 μm) wählen und wie viele Ringe können Sie unterbringen? Ist der Wert des Brechungsindexes von Wichtigkeit? 6. Auf eine Blende mit einem rechteckigen Spalt von 0,8 mm Breite und 5 mm Länge fällt ein monochromatisches Parallelstrahlbündel der Wellenlänge O = 600 nm. Welche Fußpunktbreite hat das Maximum 0. und r 1. Ordnung auf einem 5 m entfernten Schirm? Wie ändert sich die Intensitätsverteilung bei einer quadratischen Öffnung von 4 mm Breite? 7. Es soll ein echelettegitterähnliches Gitter mit 105 Furchen und einer Gitterkonstanten von 0,8 μm mittels holographischer Techniken hergestellt werden. Welche Anordnung ist dazu zu wählen? Wie sind deren Abmessungen (Winkel)? 8. Wie groß sind spektrales Auflösungsvermögen und freier Spektralbereich eines Fabry-PerotInterferometers, das einen Plattenabstand von d = 8 mm hat und ein Reflexionsvermögen von 0,70 (0,90) aufweist? Wie lässt sich erreichen, dass auch ein breiteres Spektrum eindeutig analysiert werden kann? Machen Sie einen quantitativen Vorschlag. 9. Auf ein Beugungsgitter mit 1200 Furchen/mm fällt ein Parallelstrahlbündel mit O = 500 nm. Der Einfallswinkel betrage -0 34q . Unter welchem Austrittswinkel wird die 1. Beugungsordnung beobachtet, unter welchem Licht dieser Wellenlänge 2. Ordnung? Das Gitter habe eine Breite von 100 mm. Wie groß ist das maximale spektrale Auflösungsvermögen und der freie Spektralbereich? Das Dispersionselement bestehe aus einem Echelettegitter, das in der Blaze-Stellung benutzt werden soll. Welchen Furchenwinkel müssen Sie wählen? Was ist der Vorteil dieser Nutzungsart? Welche Breite müsste ein solches Gitter haben, damit es im fernen ultraroten Spektralbereich (O | 50 μm) das gleiche Auflösungsvermögen hätte? Gibt es eine Alternative? 10. Bei der Beugung an Kristallgittern fallen mitunter gewisse Beugungsordnungen aus, was Schlüsse auf deren Struktur erlaubt. Hier werde das vereinfachte Modell eines linearen Gitters betrachtet. Wie muss ein solches beschaffen sein, damit die geradzahligen Ordnungen ausfallen?
22
Optische Instrumente
22.1 Das menschliche Auge Das Abbildungssystem des menschlichen Auges (Abb. 22.1) ist der Augapfel. Er ist nahezu kugelförmig und wird von der undurchsichtigen weißen Sehnenhaut umschlossen. Diese geht an der Vorderseite in die etwas gewölbte, durchsichtige Hornhaut über. Hinter ihr liegt die farbige Regenbogenhaut (Iris), die in der Hornhaut Fovea Mitte eine kreisförmige Öffnung, die Pupille, besitzt. Vom Gehirn gelber Glaskörper gesteuert, reguliert sie den einfalFleck vordere lenden Lichtstrom. Hinter der Iris Augenkammer liegt die aus vielen Schichten zuSehnerv Augenmuskeln hintere sammengesetzte bikonvexe Linse Netzhaut Augenkammer von etwa 11 mm Durchmesser Aderhaut Ziliarmuskel Lederhaut und einer Dicke von ca. 4 mm. Sie besitzt einen mittleren BreAbb. 22.1: Schnitt durch das menschliche Auge chungsindex von n = 1,336; ihre Krümmung und damit ihre Brechkraft kann durch den Augenmuskel variiert werden. Die Abbildungsqualitäten der Linse sind nicht besonders hoch; sie besitzt mehrere Linsenfehler. Zwischen Hornhaut und Linse erstreckt sich die vordere Augenkammer. Diese ist mit einer wässerigen Flüssigkeit gefüllt, deren Brechungsindex mit dem der Linse übereinstimmt. Im Raum hinter der Linse befindet sich der aus einer gallertartigen Flüssigkeit bestehende sog. Glaskörper. Er reicht bis zur lichtempfindlichen Netzhaut N, auf der ein stark verkleinertes reelles Bild des Gegenstandes entsteht. Die Brechkraft des optischen Systems beträgt bei entspanntem Auge ca. 60 Dptr, wobei der Hauptbeitrag mit 43 Dptr von der Grenzfläche Luft-Hornhaut herrührt. Durch Anspannung der Augenmuskel kann ein Jugendlicher Gegenstände bis zu ca. 0,08 m Entfernung scharf sehen. Mit zunehmendem Alter verschiebt sich die Nahgrenze wegen Erschlaffung der Muskulatur zu größeren Abständen. Die geschichtete lichtempfindliche Schicht besteht aus zweierlei Detektoren, aus den ca. 1,3 108 sog. Stäbchen und den ca. 7 106 sog. Zäpfchen. Erstere reagieren nur auf Helligkeit. Ihre Dichte ist mit ca. 14000/mm2 in der Nähe der Stelle, an der die optische Achse die Netzhaut trifft, besonders groß. Die Zäpfchen reagieren auch auf farbliche Reize; sie besitzen Rezeptoren für Rot, Grün und Blau. Da sie weniger empfindlich als die Stäbchen sind, können wir in der Dämmerung Farben nur schwer unterscheiden. Die von den Sehnerven wegführenden Nervenfasern treten im lichtunempfindlichen, dem sog. blinden Fleck S gebündelt aus der Augenhöhle aus. Entsteht das Bild nicht auf der Netzhaut, sondern etwas davor oder dahinter, so bedeutet das eine Kurzsichtigkeit bzw. Weitsichtigkeit (Abb. 22.2). Zur Korrektur dienen Brillen mit Zerstreuungs- bzw. Sammellinsen oder entsprechende Kontaktlinsen. Zur Minimalisierung des Astigmatismus bei solchen Augapfelstellungen, bei denen das Licht durch die Randzonen der Gläser einfällt, werden sog. Meniskusgläser verwendet, deren Grenzflächen also beiderseits (unterschiedlich) gekrümmt sind.
708
22 Optische Instrumente
Abb. 22.2: Kurzsichtigkeit (links) kann durch eine Zerstreuungslinse korrigiert werden, Weitsichtigkeit (rechts) durch eine Sammellinse Das (geometrische) Auflösungsvermögen des Auges ist durch den Abstand der Rezeptoren und durch die Beugung an der Pupille begrenzt. Beide errechneten Werte stimmen miteinander überein. Ein leuchtender Punkt wird auf der Netzhaut als ein Beugungsscheibchen abgebildet. Der Durchmesser des zentralen Maximums ist
d
2, 44O f / D
(22.1)
Bei einer Brennweite von 22 mm, einem Pupillendurchmesser D = 3 mm und einer Wellenlänge O 550 nm ergibt sich
d
2, 44 5,5 107 22 103 m 7, 4 ȝm . 2 103
(22.2)
Dieser Wert entspricht ungefähr dem Abstand zweier Zäpfchen im empfindlichsten Bereich. Zwei Lichtpunkte im Abstand der deutlichen Sehweite werden vom Auge noch getrennt wahrgenommen, wenn die zugehörigen Beugungsmaxima mindestens einen Abstand von d/2 haben.
xmin
d a d a | 2b 2 f
7, 4 250 ȝm 2 22
42ȝm 0,042 mm
(22.3)
Diesem Wert entspricht ein Winkelabstand von
u
xmin s0
1,68 104 rad 0,58c
(22.4)
Die Empfindlichkeit des Auges variiert mit der Wellenlänge. Sie ist im grünen Spektralbereich am größten. Hier können noch Intensitäten bis zu ca. 3 1013 W wahrgenommen werden.
22 Optische Instrumente
709
22.2 Die Lupe Zur Vergrößerung des Sehwinkels gibt es verschiedene Möglichkeiten. Das einfachste Instrument ist die Lupe. Sie besteht aus einer Sammellinse kleiner Brennweite (f > O Wie wir gesehen haben, ändert sich das Beugungsbild bei starker Annäherung von P an das beugende Objekt drastisch. Betrachten wir den Fall der Spaltbeugung. Wird der Spalt immer stärker zugezogen, so dehnt sich das zentrale Maximum bei Fraunhoferscher Beobachtungsart immer mehr aus, so dass es vom Objektiv nur noch teilweise erfasst werden kann. Dagegen ist das Nahfeld in unmittelbarer Nähe des Spaltes, nämlich im Abstand z0