Feynman-Vorlesungen über Physik: Band 4 Struktur der Materie [6 ed.] 9783110444308, 9783110444575

Volume 4 of the revised Millennium Edition covers condensed matter and is suitable for undergraduate and graduate studen

167 44 17MB

German Pages 331 [332] Year 2015

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Inhaltsverzeichnis
1 Innere Geometrie von Kristallen
1.1 Die innere Geometrie von Kristallen
1.2 Chemische Bindung in Kristallen
1.3 DasWachstum von Kristallen
1.4 Kristallgitter
1.5 Symmetrien in zwei Dimensionen
1.6 Symmetrien in drei Dimensionen
1.7 Die mechanische Festigkeit vonMetallen
1.8 Versetzungen und Kristallwachstum
1.9 Das Kristallmodell von Bragg-Nye
2 Tensoren
2.1 Der Polarisationstensor
2.2 Transformation von Tensorkomponenten
2.3 Das Energieellipsoid
2.4 Andere Tensoren; der Trägheitstensor
2.5 Das Vektorprodukt
2.6 Der Spannungstensor
2.7 Tensoren höherer Stufe
2.8 Der Vierertensor des elektromagnetischen Impulses
3 Der Brechungsindex dichter Materialien
3.1 Polarisation vonMaterie
3.2 Maxwells Gleichungen in einem Dielektrikum
3.3 Wellen in einem Dielektrikum
3.4 Der komplexe Brechungsindex
3.5 Der Brechungsindex einerMischung
3.6 Wellen inMetallen
3.7 Näherungen für niedrige und hohe Frequenzen; Eindringtiefe und Plasmafrequenz
4 Reflexion an Grenzflächen
4.1 Reflexion und Brechung von Licht
4.2 Wellen in dichtenMaterialien
4.3 Die Randbedingungen
4.4 Reflektierte und durchgelasseneWellen
4.5 Reflexion anMetallen
4.6 Totalreflexion
5 Der Magnetismus der Materie
5.1 Diamagnetismus und Paramagnetismus
5.2 MagnetischeMomente und Drehimpuls
5.3 Die Präzession atomarerMagnete
5.4 Diamagnetismus
5.5 Der larmorsche Satz
5.6 Die klassische Physik ergibt weder Diamagnetismus noch Paramagnetismus
5.7 Der Drehimpuls in der Quantenmechanik
5.8 Die magnetische Energie von Atomen
6 Paramagnetismus und magnetische Resonanz
6.1 Quantisiertemagnetische Zustände
6.2 Der Stern-Gerlach-Versuch
6.3 Die Rabi-Molekularstrahl-Methode
6.4 Der Paramagnetismus der Stoffe
6.5 Kühlung durch adiabatische Entmagnetisierung
6.6 Magnetische Kernresonanz
7 Ferromagnetismus
7.1 Magnetisierungsströme
7.2 Das Feld H
7.3 DieMagnetisierungskurve
7.4 Induktivitätenmit Eisenkern
7.5 Elektromagnete
7.6 SpontaneMagnetisierung
8 Magnetische Materialien
8.1 Den Ferromagnetismus verstehen
8.2 ThermodynamischeEigenschaften
8.3 Die Hysteresekurve
8.4 FerromagnetischeMaterialien
8.5 UngewöhnlichemagnetischeMaterialien
9 Elastizität
9.1 Das hookescheGesetz
9.2 HomogeneDehnungen
9.3 Der Torsionsstab; Scherwellen
9.4 Der gebogene Balken
9.5 Knicken
10 Elastische Materialien
10.1 Der Dehnungstensor
10.2 Der Elastizitätstensor
10.3 Bewegungen in einem elastischen Körper
10.4 Unelastisches Verhalten
10.5 Berechnung der elastischen Konstanten
11 Die Strömung von trockenemWasser
11.1 Hydrostatik
11.2 Die Bewegungsgleichungen
11.3 Stationäre Strömung – das Theoremvon Bernoulli
11.4 Zirkulation
11.5 Wirbellinien
12 Die Strömung von nassem Wasser
12.1 Viskosität
12.2 Viskose Strömung
12.3 Die Reynolds-Zahl
12.4 Die Strömung an einem kreisförmigen Zylinder vorbei
12.5 Der Grenzfall verschwindenderViskosität
12.6 Couette-Strömung
13 Der gekrümmte Raum
13.1 Gekrümmte Räume in zwei Dimensionen
13.2 Die Krümmung im dreidimensionalen Raum
13.3 Unser Raum ist gekrümmt
13.4 Die Geometrie in Raum und Zeit
13.5 Die Gravitation und das Äquivalenzprinzip
13.6 Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld
13.7 Die Krümmung in Raum und Zeit
13.8 Bewegung in einer gekrümmten Raumzeit
13.9 Einsteins Gravitationstheorie
Index Band IV
Gesamtindex
Personenverzeichnis
Recommend Papers

Feynman-Vorlesungen über Physik: Band 4 Struktur der Materie [6 ed.]
 9783110444308, 9783110444575

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Richard P. Feynman, Robert B. Leighton, Matthew Sands Feynman-Vorlesungen über Physik 4

Richard P. Feynman, Robert B. Leighton, Matthew Sands

Feynman-Vorlesungen über Physik 4

Struktur der Materie New Millennium-Edition

DE GRUYTER

Autoren Richard P. Feynman Robert B. Leighton Matthew Sands Deutsche Übersetzung: Dr. Henner Wessel, Dr. Karen Lippert Wissenschaftliche Beratung der Übersetzung: Prof. Dr. Peter Beckmann, Prof. Dr. Helmut Jarosch

ISBN 978-3-11-044457-5 e-ISBN (PDF) 978-3-11-044430-8 e-ISBN (EPUB) 978-3-11-043675-4 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Coverabbildung: Godruma/iStock/thinkstock Druck und Bindung: Hubert und Co. GmbH & Co. KG, Göttingen ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Über Richard Feynman Richard P. Feynman wurde 1918 in Brooklyn geboren und erlangte 1942 an der Princeton University, New Jersey, USA seinen Ph.D. Trotz seiner Jugend spielte er während des Zweiten Weltkriegs eine wichtige Rolle im Manhattan-Projekt des Los Alamos Laboratory. Anschließend lehrte er an der Cornell University, Ithaca, New York sowie am Caltech, dem California Institute of Technology in Pasadena, USA. 1965 erhielt er zusammen mit Shinichir¯ o Tomonaga und Julian Schwinger den Physik-Nobelpreis für seine Arbeiten zur Quantenelektrodynamik. Feynman erhielt den Nobelpreis für die erfolgreiche Lösung von Problemen im Zusammenhang mit der Theorie der Quantenelektrodynamik. Er entwickelte auch eine mathematische Theorie, die die Phänomene der Suprafluidität bei flüssigem Helium erklärte. Außerdem leistete er, zusammen mit Murray Gell-Mann, grundlegende Arbeiten zur schwachen Wechselwirkung und zum Beta-Zerfall. In späteren Jahren spielte Feynman eine Schlüsselrolle bei der Entwicklung der Quark-Theorie, indem er ein Partonen-Modell hochenergetischer Streuprozesse vorlegte. Zusätzlich zu diesen Leistungen führte Feynman grundlegende neue Berechnungstechniken und Darstellungsformen in die Physik ein, unter anderem die allgegenwärtigen Feynman-Diagramme, die – vielleicht mehr als irgendein anderer Formalismus in der jüngeren Wissenschaftsgeschichte – die Art und Weise veränderten, in der elementare physikalische Prozesse beschrieben und berechnet werden. Feynman war ein außerordentlich erfolgreicher Lehrer. Von all seinen zahlreichen Auszeichnungen war er auf die „Oersted Medal for Teaching“, die er 1972 erhielt, besonders stolz. Die „Feynman-Vorlesungen über Physik“, erstmals 1963 veröffentlicht, wurden von einem Rezensenten im „Scientific American“ wie folgt beschrieben: „Schwierig, aber nahrhaft und sehr appetitlich. Auch noch nach 25 Jahren sind sie der Leitfaden für Dozenten und besonders gute Physikstudenten.“ Mit dem Ziel, das physikalische Verständnis von Laien zu verbessern, schrieb Feynman die beiden Bücher „Vom Wesen physikalischer Gesetze“ und „QED. Die seltsame Theorie des Lichts und der Materie“. Er ist außerdem Autor vieler anspruchsvoller Veröffentlichungen, die zu klassischen Referenzen und Lehrbüchern für Forscher und Studenten wurden. Richard Feynman war eine geschätzte Persönlichkeit des öffentlichen Lebens. Seine Arbeit in der Untersuchungskommission zur Challenger-Katastrophe ist weithin bekannt, insbesondere seine berühmte Demonstration der Anfälligkeit der O-Ringe für Kälte – ein elegantes Experiment, das nichts weiter als ein Glas Eiswasser erfordert. Weit weniger bekannt sind seine Verdienste im „California State Curriculum Committee“, in dem er in den 1960ern gegen die Mittelmäßigkeit von Lehrbüchern polemisierte. Die bloße Aufzählung der unzähligen wissenschaftlichen und pädagogischen Leistungen Richard Feynmans kann das Wesen dieses Mannes nicht angemessen beleuchten. Wie jeder Leser – selbst eines seiner Fachartikel – bemerkt, strahlt Feynmans heitere und vielseitige Persönlichkeit durch sein gesamtes Werk hindurch. Neben seiner Profession als Physiker betätigte

VI

Über Richard Feynman

sich Feynman im Laufe seines Lebens als Panzerschrankknacker, Künstler, Tänzer und BongoSpieler, verdiente Geld mit dem Reparieren von Radios und wirkte sogar an der Entzifferung der Maya-Schrift mit. Immer neugierig auf die Welt, war er ein mustergültiger Empiriker. Richard Feynman starb am 15. Februar 1988 in Los Angeles.

Vorwort zur New Millennium Edition1 Mehr als 50 Jahre sind vergangen, seit Richard Feynman seine einführenden Physikvorlesungen hielt, aus denen die drei2 Bände der „Feynman-Vorlesungen über Physik“ entstanden sind. In diesen 50 Jahren hat sich unser physikalisches Verständnis grundlegend gewandelt, aber die „Feynman-Vorlesungen über Physik“ haben weiterhin Bestand. Sie sind heute noch genauso wertvoll wie damals, als sie erstmals veröffentlicht wurden – dank Feynmans einzigartigen Einsichten in die Physik und seines außergewöhnlichen pädagogischen Talents. Die FeynmanVorlesungen wurden weltweit studiert, von Anfängern ebenso wie von ausgebildeten Physikern; allein in englischer Sprache wurden über anderthalb Millionen Exemplare verkauft, außerdem wurde das Werk in mindestens ein Dutzend Sprachen übersetzt. Vermutlich hat kein anderes mehrbändiges Physikbuch so lange so großen Einfluss ausgeübt. Mit der vorliegenden New Millennium Edition beginnt ein neues Zeitalter für die FeynmanVorlesungen über Physik: das 21. Jahrhundert und damit das Zeitalter des elektronischen Publizierens. Das Manuskript wurde mit dem Satzsystem LATEX gesetzt, und sämtliche Abbildungen wurden mit moderner Software neu gezeichnet.3 Für die Printversion dieser Edition sind die Konsequenzen nicht besonders aufsehenerregend: Sie sieht fast genau so aus wie das Original, jene roten Bücher, die Physikstudenten seit Jahrzehnten kennen und lieben. Die beiden Hauptunterschiede sind zum einen der deutlich erweiterte und verbesserte Index und zum anderen die Korrektur von 885 Errata4 , die von Lesern in den fünf Jahren seit dem Erstdruck der vorherigen Ausgabe gefunden wurden. Auch wird es nun leichter möglich sein, Errata zu korrigieren, die von künftigen Lesern gefunden werden. Darauf werde ich später noch zurückkommen. Die E-Book-Version5 dieser Ausgabe sowie die Enhanced Electronic Version sind echte Innovationen. Im Gegensatz zu den meisten früheren E-Book-Versionen von Fachbüchern, in denen die Formeln und Abbildungen – und manchmal sogar der Text – verpixelt aussahen, wenn man versuchte, sie zu vergrößern, können alle Inhalte des E-Books der New Millennium Edition (außer den Fotos) dank der zugrunde liegenden LATEX-Kodierung ohne Qualitätsverluste beliebig vergrößert werden. Und die Enhanced Electronic Version mit ihren Audios und Tafelbildern aus Feynmans Originalvorlesungen sowie den Links zu weiteren Ressourcen ist eine Innovation, die Feynman sicher großes Vergnügen bereitet hätte. 1 2 3 4

5

Anmerkung des Verlags: Das Vorwort bezieht sich auf die amerikanische Originalauflage. Auf Abweichungen und Besonderheiten der deutschen Ausgabe wir in den folgenden Fußnoten hingewiesen. Die deutsche Übersetzung erscheint in fünf Bänden, da die ersten beiden Bände aufgrund ihres hohen Seitenumfangs geteilt wurden. Bereits die deutschen Vorauflagen wurden mit LATEX gesetzt und mit neu gezeichneten Abbildungen versehen. Der Großteil der Errata war für die Übersetzung irrelevant, da es sich um (englische) typografische Fehler handelte oder falsche Querverweise/fehlende Klammern etc. betraf, die in den meisten Fällen erkannt und korrigiert wurden. Alle auf www.feynmanlectures.info gelisteten Errata wurden berücksichtigt. Im Deutschen erscheint erstmalig die E-Book Version der „New Millennium Edition“.

VIII

Vorwort zur New Millennium Edition

Erinnerungen an die Feynman-Vorlesungen Diese drei Bände bilden eine in sich geschlossene pädagogische Abhandlung. Sie sind auch eine Zusammenstellung der einführenden Physikvorlesungen, die Feynman in den Jahren 1961 bis 1964 gehalten hat und die für alle Studienanfänger und Studenten des zweiten Studienjahres am Caltech unabhängig von ihren Hauptfächern obligatorisch waren. So wie ich fragen sich vielleicht die Leser, wie Feynmans Vorlesungen die Studierenden beeinflusst haben. Feynman selbst gibt in seinem Vorwort zu diesen drei Bänden eine eher pessimistische Einschätzung. „Ich glaube nicht, dass ich mit den Studenten sehr gut zurecht gekommen bin“, schreibt er. Matthew Sands dagegen äußerte sich im Vorwort zu Feynmans Tipps zur Physik sehr viel zuversichtlicher. Aus Neugier kontaktierte ich im Frühjahr 2005 eine quasi-zufällig ausgewählte Gruppe von 17 Studenten (von insgesamt ungefähr 150) aus dem 1961–63er Kurs – einige von ihnen hatten damals große Schwierigkeiten mit dem Kurs, andere hatten ihn mit Leichtigkeit bewältigt; ihre Hauptfächer waren Biologie, Chemie, Ingenieurwissenschaften, Geologie, Mathematik, Astronomie und natürlich auch Physik. Die Zeit mag ihre Erinnerung ein wenig verklärt haben, doch ungefähr 80% der Befragten gaben an, dass Feynmans Kurs ein Höhepunkt ihrer College-Zeit war. „Es war, als ginge man in die Kirche.“ Die Vorlesungen waren „eine grundlegende Erfahrung“, „die Erfahrung meines Lebens, wahrscheinlich das Wichtigste, das ich vom Caltech mitgenommen habe“. „Eigentlich war ich Biologie-Student, aber als Höhepunkt meiner Bachelor-Zeit stachen die Feynman-Vorlesungen hervor . . . obwohl ich zugeben muss, dass ich die Hausaufgaben selten rechtzeitig erledigen konnte und es mir schwer fiel, sie überhaupt zu bewältigen.“ „Ich gehörte zu den am wenigsten aussichtsreichen Studenten im Kurs und ich habe trotzdem nie eine Vorlesung versäumt . . . Ich erinnere mich und spüre immer noch Feynmans Freude an der Entdeckung . . . Seine Vorlesungen hatten eine emotionale Wucht, die vermutlich in den gedruckten Vorlesungen nicht mehr zu spüren ist.“ Einige Studenten haben jedoch auch negative Erinnerungen, und dafür wurden vor allem die beiden folgenden Gründe genannt. Erstens: „In der Vorlesung konnte man nicht lernen, wie man selbst Aufgaben löst. Feynman war zu geschickt – er kannte alle möglichen Tricks, er wusste, welche Näherungen man machen konnte, und er verfügte aufgrund seiner Erfahrung und seiner Genialität über eine Intuition, die ein Studienanfänger einfach nicht haben konnte.“ Feynman und seine Kollegen waren sich dieser Schwachstelle in ihrem Kurs bewusst und versuchten, durch eine Reihe von Exkursen Abhilfe zu schaffen, die später als Ergänzungsband mit dem Titel Feynman’s Tips on Physics6 veröffentlicht wurden. Der Band enthält drei Vorlesungen von Feynman über das Lösen von Problemen sowie eine Sammlung von Übungsaufgaben und Lösungen, die von Robert B. Leighton und Rochus Vogt zusammengestellt wurde. Der zweite Kritikpunkt war folgender: „Frustrierend war, dass man nie wusste, was in der nächsten Vorlesung besprochen wird, und die daraus resultierende Unsicherheit, das Fehlen eines Lehrbuchs oder einer Referenz, um eine Verbindung zu dem herzustellen, was wir in der Vorlesung gehört hatten. . . . Ich fand die Vorlesungen spannend, und im Vorlesungssaal schien auch alles verständlich, aber wenn ich später draußen versuchte, die Details zu rekonstruieren, war es als ob ich Sanskrit gehört hätte.“ Nun, dieses Problem wurde natürlich durch die drei gedruckten Bände der Feynman-Vorlesungen gelöst. Sie wurden das maßgebliche Lehrbuch, aus dem die Caltech-Studenten noch viele Jahre später lernten, und sie sind noch heute lebendig als einer der wichtigsten Teile von Feynmans Erbe. 6

Deutscher Titel: Tipps zur Physik.

Vorwort zur New Millennium Edition

IX

Zur Geschichte der Errata Die Feynman-Vorlesungen über Physik wurden von Feynman und seinen Koautoren, Robert B. Leighton und Matthew Sands, in sehr kurzer Zeit verfasst. Sie arbeiteten auf der Basis von Tonbandaufzeichnungen und Fotos der Tafelbilder, die in Feynmans Vorlesungen gemacht wurden7 (beides wurde in die Enhanced Electronic Version der New Millennium Edition aufgenommen). In Anbetracht des Zeitdrucks, unter dem Feynman, Leighton und Sands standen, war es unvermeidlich, dass sich in die erste Ausgabe viele Fehler eingeschlichen haben. Feynman führte in den Jahren nach der Veröffentlichung lange Listen von mutmaßlichen Errata – Errata, die von Studenten und Fakultatätsangehörigen gefunden wurden, aber auch von Lesern auf der ganzen Welt. In den 1960er- und den frühen 70er-Jahren nahm sich Feynman trotz seines aufregenden Lebens die Zeit, die meisten, wenn auch nicht alle, vermeintlichen Fehler in den Bänden I und II zu prüfen. In den Nachdrucken wurden entsprechende Korrekturen vorgenommen. Allerdings erreichte Feynmans Pflichtgefühl im Vergleich zu seiner Begeisterung für die Entdeckung neuer Dinge nie eine Dimension, die ihn dazu gebracht hätte, sich auch mit den Errata von Band III zu beschäftigen.8 Nach seinem viel zu frühen Tod im Jahr 1988 wurden die Listen der ungeprüften Errata in den Archiven des Caltech deponiert, wo sie in Vergessenheit gerieten. 2002 informierte mich Ralph Leighton (der Sohn Robert Leightons und ein Landsmann Feynmans) über die alten Errata und eine neue lange Liste, zusammengestellt von Ralphs Freund Michael Gottlieb. Leighton schlug dem Caltech vor, eine neue Ausgabe der Feynman-Vorlesungen in Angriff zu nehmen, in der sämtliche Errata korrigiert sind, und diese zusammen mit einem Ergänzungsband, den Tipps zur Physik, zu veröffentlichen, die er selbst zusammen mit Gottlieb vorbereiten wollte. Feynman war mein Held und ein enger persönlicher Freund. Als ich die Listen der Errata und den Stoff des vorgeschlagenen Ergänzungsbandes sah, erklärte ich mich sofort bereit, das Projekt im Auftrag des Caltech zu betreuen (dem langjährigen akademischen Zuhause Feynmans, an das er und seine Koautoren Leighton und Sands alle Rechte an den Feynman-Vorlesungen übertragen hatten). Nach einem Jahr der sorgfältigen Überarbeitung durch Gottlieb und genauer Prüfung der Errata sowie des Ergänzungsbandes durch Michael Hartl (einem herausragenden Postdoc am Caltech) waren 2005 die Definitive Edition der Feynman-Vorlesungen über Physik und der Ergänzungsband mit Feynmans Tipps zur Physik fertig. Jedenfalls dachte ich, dass diese Ausgabe „definitiv“ – im Sinne von abschließend – sein würde. Womit ich nicht gerechnet hatte, war die enthusiastische Reaktion der Leser in aller Welt auf einen Aufruf von Gottlieb, weitere Errata zu identifizieren und sie über die Website www.feynmanlectures.info zu melden, die er zu diesem Zweck eingerichtet hatte und die noch immer existiert. In den fünf Jahren, die seitdem vergangen sind, wurden 965 neue Errata gemeldet, die der sorgfältigen Überprüfung durch Gottlieb, Hartl und Nate Bode (ein herausragender Physikstudent am Caltech und Hartls Nachfolger bei der Überprüfung der Errata) standgehalten haben. Von diesen 965 geprüften Errata wurden 80 bereits im vierten Nachdruck der Definitive Edition (August 2006) korrigiert. Die übrigen 885 wurden im Erstdruck der New Millennium Edition korrigiert (332 in Band I, 263 in Band II und 200 in Band III). Die Einzelheiten zu den Errata sind auf der Website www.feynmanlectures.info dokumentiert. 7 8

Zur Entstehung der Feynman Lectures on Physics siehe „Feynmans Vorwort“ sowie die Vorworte von Robert B. Leighton und Matthew Sands in den einzelnen Bänden. 1975 begann er mit der Überprüfung der Errata von Band III, wurde aber durch andere Aufgaben aufgehalten und konnte diese Arbeit nicht beenden. Deshalb wurden in Band III keine Korrekturen vorgenommen.

X

Vorwort zur New Millennium Edition

Offensichtlich ist es zu einem weltweiten Community-Projekt geworden, die Feynman Lectures fehlerfrei zu machen. Im Namen des Caltech danke ich den 50 Lesern, die seit 2005 Beiträge geliefert haben, und den vielen weiteren, die in den kommenden Jahren zur Verbesserung beitragen werden. Die Namen aller bekannten Einsender sind unter www.feynmanlectures. info/flp_errata.html angegeben. Die Errata lassen sich im Wesentlichen drei Typen zuordnen: (i) typografische Fehler im Text; (ii) typografische und mathematische Fehler in Formeln, Tabellen und Abbildungen – falsche Vorzeichen, falsche Ziffern (z. B. eine „5“, die eigentlich eine „4“ sein sollte), fehlende Indizes oder Exponenten, fehlende Klammern oder Gleichungsterme usw.; (iii) falsche Querverweise auf Kapitel, Tabellen und Abbildungen. Solche Fehler können, auch wenn sie für erfahrene Physiker nicht sonderlich gravierend sind, für Studierende frustrierend und verwirrend sein, und gerade diese sind ja die Leserschaft, die Feynman erreichen wollte. Es ist bemerkenswert, dass unter den 1165 Errata, die unter meiner Obhut korrigiert wurden, nur sehr wenige sind, die ich als echte physikalische Fehler bezeichnen würde. Ein Beispiel hierfür befand sich in Band II9 . Auf Seite 89 heißt es nun „keine statische Ladungsverteilung im Inneren eines geschlossenen geerdeten Leiters [kann] Felder außerhalb erzeugen“ (das Wort „geerdet“ fehlte in früheren Auflagen). Auf diesen Fehler wurde Feynman von etlichen Lesern hingewiesen, unter anderem von Beulah Elizabeth Cox, einer Studentin des College of William and Mary, die sich in einer Prüfung auf Feynmans fehlerhafte Passage verlassen hatte. An Beulah Cox schrieb Feynman 1975:10 „Ihr Dozent hatte recht, Ihnen keine Punkte zu geben, da Ihre Antwort falsch ist, wie er mithilfe des gaußschen Gesetzes zeigte. Sie sollten in der Wissenschaft der Logik und sorgfältig dargelegten Argumenten folgen, und nicht Autoritäten. Auch sollten Sie das Buch genau lesen und es verstehen. Ich habe einen Fehler gemacht, also steht im Buch etwas Falsches. Wahrscheinlich habe ich an eine geerdete leitende Kugel gedacht oder an die Tatsache, dass die sich an verschiedenen Orten im Inneren bewegenden Ladungen nicht die Dinge draußen beeinflussen. Ich bin mir nicht sicher warum, aber ich habe es vermasselt. Und Sie haben es auch vermasselt, weil Sie mir geglaubt haben.“

Wie es zur vorliegenden New Millennium Edition kam Zwischen November 2005 und Juli 2006 wurden über www.feynmanlectures.info 340 Errata gemeldet. Bemerkenswert war, dass der größte Teil dieser Einsendungen von ein und derselben Person stammten: Dr. Rudolf Pfeiffer, damals Postdoc an der Universität Wien. Der Verlag, Addison Wesley, brachte 80 Errata in Ordnung, scheute aber wegen der Kosten davor zurück, noch mehr zu korrigieren, denn die Bücher wurden im Offset-Verfahren gedruckt, wobei die Druckplatten aus den 1960er-Jahren verwendet wurden. Einen Fehler zu korrigieren bedeutete daher, jeweils die ganze Seite neu zu setzen – und um sicherzustellen, dass sich keine neuen Fehler einschleichen, wurde die betreffende Seite von zwei verschiedenen Personen, also doppelt, gesetzt. Die Ergebnisse mussten dann verglichen und wiederum von mehreren Personen Korrektur gelesen werden. Das Ganze wird eine sehr kostenintensive Angelegenheit, wenn es um Hunderte von Errata geht. 9 10

Band III der deutschen Ausgabe. Michelle Feynman (Ed.): Perfectly Reasonable Deviations from the Beaten Track, The Letters of Richard P. Feynman, Basic Books, New York 2005, S. 288f.

Vorwort zur New Millennium Edition

XI

Gottlieb, Pfeiffer und Ralph Leighton waren sehr unglücklich mit dieser Situation, und deshalb formulierten sie einen Plan, der darauf abzielte, alle Errata zu korrigieren und gleichzeitig ein E-Book und die Enhanced Electronic Version der Feynman Lectures herzustellen. Diesen Plan trugen sie im Jahr 2007 an mich als Vertreter des Caltech heran. Ich war vorsichtig begeistert. Nachdem ich die Details gesehen hatte, darunter ein Probekapitel der Enhanced Electronic Version, empfahl ich dem Caltech, Gottlieb, Pfeiffer und Leighton bei der Ausführung ihres Plans zu unterstützen. Der Plan wurde von drei aufeinanderfolgenden Leitern der Abteilung für Physik, Mathematik und Astronomie – Tom Tombrello, Andrew Lange und Tom Soifer – genehmigt. Die komplizierten vertragsrechtlichen Details wurden von Adam Cochran, dem Berater des Caltech in Fragen des Urheberrechts, ausgearbeitet. Mit der Veröffentlichung der vorliegenden New Millennium Edition wurde der Plan trotz seiner Komplexität erfolgreich in die Tat umgesetzt. Pfeiffer und Gottlieb haben alle drei Bände in LATEX konvertiert, ebenso mehr als 1000 Übungsaufgaben aus Feynmans Kurs, die in den Ergänzungsband Feynman’s Tips on Physics eingeflossen sind. Die Abbildungen waren zuvor für die deutsche Ausgabe unter Anleitung des deutschen Bearbeiters, Henning Heinze, in Indien in einem modernen elektronischen Format neu gezeichnet worden. Gottlieb und Pfeiffer haben diese neuen Bilder im Austausch gegen ihre neu gesetzten LATEX-Formeln erhalten. Sie haben den LATEX-Text, die Formeln und die Abbildungen sorgfältig geprüft und dort, wo es notwendig schien, Korrekturen vorgenommen. Nate Bode und ich haben den Text, die Formeln und die Abbildungen im Auftrag des Caltech stichprobenartig geprüft und erfreulicherweise keine Fehler gefunden. Pfeiffer und Gottlieb sind offenbar unglaublich sorgfältig und genau. Außerdem organisierten sie die Digitalisierung der Fotos von Feynmans Tafelbildern (dies besorgte John Sullivan von der Huntington Library) und der Tonbandaufnahmen (Tonstudio George Blood) – mit finanzieller Unterstützung und Ermutigung durch Professor Carver Mead vom Caltech, logistischer Unterstützung durch die Caltech-Archivarin Shelley Erwin und Unterstützung in Rechtsfragen durch Adam Cochran. Die zu klärenden Rechtsfragen waren nicht unerheblich: In den 1960er-Jahren hatte das Caltech das Veröffentlichungsrecht für die Printausgabe an Addison Wesley übertragen, in den 1990er-Jahren wurden auch die Rechte zur Veröffentlichung der Audios sowie einer Variante einer elektronischen Ausgabe erteilt. In den 2000er-Jahren waren in der Folge mehrerer Übernahmen die Printrechte an die Mediengruppe Pearson übergegangen, während die Rechte an der Audioversion und der elektronischen Version mittlerweile bei der Verlagsgruppe Perseus lagen. Cochran gelang es zusammen mit Ike Williams, einem auf Verlagsrecht spezialisierten Anwalt, alle Einzelrechte bei Perseus (Basic Books) zu vereinigen, wodurch die vorliegende New Millennium Edition möglich wurde.

Danksagungen Im Namen des Caltech danke ich den vielen Menschen, die die New Millennium Edition möglich gemacht haben. Besonders habe ich den Personen zu danken, deren Mitwirkung bereits erwähnt wurde: Ralph Leighton, Tom Tombrello, Michael Hartl, Rudolf Pfeiffer, Henning Heinze, Adam Cochran, Carl Mead, Nate Bode, Shelley Erwin, Andrew Lange, Tom Soifer, Ike Williams und den 50 Personen, die Errata gemeldet haben (sie sind namentlich genannt unter www.feynmanlectures.info/flp_errata.html). Und ich danke außerdem Michelle Feynman (der Tochter Richard Feynmans) für ihre fortwährende Unterstützung und Beratung,

XII

Vorwort zur New Millennium Edition

Alan Rice für sein hilfreiches Wirken hinter den Kulissen und Auskünfte am Caltech, Stephan Puchegger und Calvin Jackson für die Hilfestellung, die sie Pfeiffer bei der Konvertierung der Manuskripe in LATEX gaben, Michael Figl, Manfred Smolik und Andreas Stangl für die Diskussionen über die Korrektur von Errata sowie den Mitarbeitern von Perseus/Basic Books und (für frühere Ausgaben) den Mitarbeitern von Addison Wesley. Kip S. Thorne Inhaber der Feynman-Professur für Theoretische Physik California Institute of Technology

Oktober 2010

Feynmans Vorwort Dies sind die Vorlesungen über Physik, die ich im letzten und vorletzten Jahr für Anfänger und Fortgeschrittene am Caltech gehalten habe. Die Vorlesungen werden natürlich nicht wortwörtlich wiedergegeben – sie sind mehr oder weniger umfassend redigiert worden. Die Vorlesungen bilden nur einen Teil des vollständigen Kurses. Die Gruppe von 180 Studenten versammelte sich zweimal wöchentlich in einem großen Hörsaal, um diese Vorlesungen zu hören. Dann teilte sie sich auf in kleine Übungsgruppen von 15 bis 20 Studenten unter der Leitung jeweils eines Assistenten. Zusätzlich wurde einmal in der Woche ein Praktikum durchgeführt. Das Ziel, das wir mit diesen Vorlesungen verfolgten, war es, das Interesse der begeisterten und gescheiten Studenten aufrechtzuerhalten, die von den höheren Schulen ans Caltech kamen. Sie hatten viel davon gehört, wie aufregend und interessant die Physik ist – die Relativitätstheorie, die Quantenmechanik und andere moderne Ideen. Am Ende unseres vorhergehenden zweijährigen Kurses waren viele doch sehr entmutigt, weil ihnen nur sehr wenige große, neue und moderne Ideen geboten wurden. Man hatte sie schiefe Ebenen, Elektroakustik usw. studieren lassen, und im Laufe von zwei Jahren wurde das recht langweilig. Die Frage war, ob wir einen Kurs durchführen könnten, der den fortgeschritteneren und begeisterten Studenten ihren Enthusiasmus erhielte. Diese Vorlesungen sind nicht nur als eine Übersicht gedacht, sondern sind sehr ernst gemeint. Ich gedachte, sie an die Intelligentesten der Gruppe zu richten, und wollte, wenn möglich, errei-

XIV

Feynmans Vorwort

chen, dass auch der intelligenteste Student nicht alles Dargebotene vollständig erfassen kann. Deshalb wies ich auch auf Anwendungen der Ideen und Konzepte in verschiedenen Bereichen außerhalb der Hauptstoßrichtung hin. Aus diesem Grund habe ich mich auch sehr bemüht, alle Konzepte so genau wie möglich zu erklären und in jedem Fall aufzuzeigen, wie sich die Gleichungen und Ideen in den Aufbau der Physik einordnen und wie sich die Dinge beim weiteren Hinzulernen ändern würden. Ich dachte auch, dass es für solche Studenten wichtig sei, gezeigt zu bekommen, was sie sich aus dem bereits Gelernten herleiten können, wenn sie klug genug sind, und was als etwas Neues eingeführt wird. Wenn neue Gedanken aufkamen, wollte ich entweder versuchen, sie nach Möglichkeit herzuleiten oder klarzumachen, dass es eine neue Idee war, die nicht auf schon gelernten Dingen basierte, die nicht beweisbar sein sollte, sondern einfach hinzugefügt wurde. Zu Beginn dieser Vorlesungen habe ich vorausgesetzt, dass die Studenten nach dem Verlassen der Schule Gebiete wie die geometrische Optik, einfache chemische Begriffe usw. kannten. Ich sah auch nicht ein, dass die Vorlesungen unbedingt in einer bestimmten Reihenfolge gehalten werden mussten und dass ich etwas so lange nicht erwähnen durfte, bis es im Einzelnen behandelt wurde. Vielfach wurden Dinge ohne umfassende Diskussion erwähnt. Die umfassende Diskussion würde später, nach eingehenderer Vorbereitung, kommen. Beispiele dafür sind die Induktivität und die Energieniveaus, die anfangs nur in einer eher qualitativen Art erwähnt und erst später ausführlicher entwickelt wurden. Gleichzeitig mit dem aktiveren Studenten wollte ich auch denjenigen ansprechen, der das Extrafeuerwerk und die Nebenanwendungen nur beunruhigend findet und von dem man nicht erwarten kann, dass er den größten Teil des Vorlesungsstoffes überhaupt begreift. Für diesen Studenten wollte ich zumindest ein Kernstück des Stoffes herausarbeiten, das er erfassen konnte. Selbst wenn er eine Vorlesung nicht völlig verstand, hoffte ich doch, er würde nicht nervös werden. Ich erwartete gar nicht, dass er alles verstand, aber doch wenigstens, dass er die Hauptlinien nachvollziehen konnte. Natürlich braucht er eine gewisse Intelligenz, um zu unterscheiden, welches die zentralen Sätze und Grundgedanken und welches die weiterentwickelten Nebenergebnisse und Anwendungen sind, die er erst in späteren Jahren verstehen kann. Bei diesen Vorlesungen trat eine ernsthafte Schwierigkeit auf: Bei der Art, wie der Kurs abgehalten wurde, gab es keinen Kontakt zwischen Studenten und Dozenten, der angezeigt hätte, wie gut die Vorlesungen angenommen wurden. Das ist in der Tat eine sehr ernsthafte Schwierigkeit, und ich weiß nicht, wie gut die Vorlesungen wirklich sind. Das Ganze war im Wesentlichen ein Experiment. Und wenn ich es noch einmal machen würde, dann nicht auf die gleiche Art – ich hoffe, ich muss es nicht noch einmal machen! Dennoch glaube ich, dass sich die Dinge – soweit es die Physik anbelangt – im ersten Jahr ganz zufriedenstellend entwickelt haben. Im zweiten Jahr war ich nicht so zufrieden. Im ersten Teil der Vorlesungsreihe, die sich mit Elektrizität und Magnetismus befasste, fiel mir keine wirklich überragende oder andersartige Methode ein, jedenfalls keine, die erheblich fesselnder wäre als die übliche Darstellungsweise. Daher glaube ich nicht, dass ich in den Vorlesungen über Elektrizität und Magnetismus viel erreicht habe. Ursprünglich hatte ich vorgehabt, am Ende des zweiten Jahres nach Elektrizität und Magnetismus mit einigen Vorlesungen über die Eigenschaften der Materie fortzufahren, aber hauptsächlich wollte ich Themen wie Grundschwingungen, Lösungen der Diffusionsgleichung, Schwingungssysteme, Orthogonalfunktionen . . . aufgreifen, um die ersten Stufen der so genannten „mathematischen Methoden der Physik“ zu entwickeln. Rückblickend denke ich, dass ich auf diese ursprüngliche Idee zurückgreifen würde, wenn ich die Vorlesungen noch ein-

Feynmans Vorwort

XV

mal halten würde. Aber da eine Wiederholung der Vorlesungen nicht vorgesehen war, hielt man es für eine gute Idee zu versuchen, eine Einführung in die Quantenmechanik zu geben – Sie finden sie in Band III. Es ist ganz klar, dass Studenten, die Physik als Hauptfach gewählt haben, mit der Quantenmechanik bis zum dritten Jahr warten können. Andererseits wurde der Einwand erhoben, dass viele unserer Hörer Physik nur als Nebenfach bzw. Hintergrund zu ihrem Hauptinteresse auf anderen Gebieten studieren. Und die übliche Art, die Quantenmechanik zu behandeln, macht sie für die meisten Studenten nahezu unzugänglich, weil sie dafür zu viel Zeit brauchen. In ihren tatsächlichen Anwendungen jedoch – besonders den komplexeren wie in der Elektrotechnik und in der Chemie – ist der ganze Apparat der Differentialgleichungen gar nicht unbedingt erforderlich. Deshalb habe ich versucht, die Grundlagen der Quantenmechanik auf eine Weise zu beschreiben, die ohne die Kenntnis der Mathematik der partiellen Differentialgleichungen auskommt. Selbst für einen Physiker ist es, glaube ich, aus mehreren Gründen, die sich aus den Vorlesungen ergeben, ein interessanter Versuch, Quantenmechanik einmal auf diesem umgekehrten Wege darzustellen. Ich glaube jedoch, dass dieses Experiment mit der Quantenmechanik nicht ganz erfolgreich war – vor allem, weil ich am Schluss nicht genügend Zeit hatte. (Ich hätte z. B. drei oder vier Vorlesungen mehr benötigt, um Themen wie Energiebänder und die räumliche Abhängigkeit der Amplituden gründlicher zu behandeln.) Auch hatte ich dieses Thema so noch nie dargestellt, so dass der fehlende Kontakt mit den Studenten besonders problematisch war. Heute glaube ich, dass die Quantenmechanik zu einem späteren Zeitpunkt gelehrt werden sollte. Vielleicht habe ich eines Tages die Möglichkeit, es noch einmal zu versuchen. Dann werde ich es richtig machen. Vorlesungen über das Lösen von Aufgaben fehlen, weil es ja die Übungsgruppen gab. Obwohl ich im ersten Jahr drei Vorlesungen zu Übungsaufgaben und deren Lösungen hielt, sind sie in diesen Bänden nicht enthalten. Es gab auch eine Vorlesung über Trägheitsnavigation, die sich eigentlich an die Vorlesung über rotierende Systeme anschließen müsste, die aber leider weggelassen wurde. Die fünfte und die sechste Vorlesung sind in Wirklichkeit Matthew Sands zuzuschreiben, da ich verreist war. Es bleibt natürlich die Frage, wie gut dieses Experiment geglückt ist. Meine eigene Meinung – die allerdings von den meisten Leuten, die mit den Studenten arbeiten, anscheinend nicht geteilt wird – ist eher pessimistisch. Ich glaube nicht, dass ich mit den Studenten sehr gut zurechtgekommen bin. Wenn ich mir anschaue, wie die Mehrzahl der Studenten die Prüfungsaufgaben behandelt hat, glaube ich, dass das Experiment fehlgeschlagen ist. Zwar höre ich von befreundeten Kollegen, dass ein oder zwei Dutzend Studenten überraschenderweise in sämtlichen Vorlesungen fast alles verstanden haben, dass sie sehr gut mit dem Stoff umgehen konnten und sich über viele Fragen eifrig und interessiert Gedanken machten. Ich glaube, dass diese Leute jetzt ein erstklassiges Fundament in Physik haben – und sie waren es ja schließlich, die ich ansprechen wollte. Aber: „Die Kraft der Lehre ist selten von großer Wirksamkeit, außer unter jenen glücklichen Umständen, wo sie eigentlich überflüssig ist“ (Gibbon). Ich wollte jedoch keinen Studenten vollständig auf der Strecke lassen, wie ich es vielleicht getan habe. Ich glaube, es wäre eine Möglichkeit, den Studenten besser zu helfen, wenn wir uns intensiver damit beschäftigen würden, eine Aufgabenserie zu entwickeln, die einige Themen der Vorlesungen deutlich machen würde. Aufgaben bieten eine gute Gelegenheit, den Stoff der Vorlesungen abzurunden und die Konzepte, die vorgetragen wurden, realistischer, vollständiger und einprägsamer darzulegen.

XVI

Feynmans Vorwort

Ich glaube jedoch, dass die einzige Lösung für dieses Bildungsproblem die Erkenntnis ist, dass der beste Lehrerfolg dann erzielt wird, wenn eine direkte, persönliche Beziehung zwischen dem Studenten und einem guten Lehrer besteht – ein Zustand, bei dem der Student die Konzepte diskutiert, über die Dinge nachdenkt und darüber spricht. Es ist unmöglich, viel zu lernen, wenn man nur in einer Vorlesung sitzt oder selbst dann, wenn man nur die gestellten Aufgaben löst. Aber in unserer modernen Zeit haben wir so viele Studenten zu unterrichten, dass wir versuchen müssen, einen Ersatz für dieses Ideal zu finden. Vielleicht können meine Vorlesungen etwas dazu beitragen. Vielleicht können an einer kleinen Ausbildungsstätte, wo Lehrer und Studenten noch in persönlichem Kontakt stehen, diese aus meinen Vorlesungen Anregungen und Ideen beziehen. Vielleicht haben sie Spaß daran, sie zu durchdenken oder einige der Gedanken weiterzuentwickeln. Richard P. Feynman

Juni 1963

Vorwort Gute vierzig Jahre lang konzentrierte Richard P. Feynman seine Aufmerksamkeit auf die geheimnisvollen Vorgänge in der physikalischen Welt und bemühte seinen Intellekt, die Ordnung in ihrem Chaos zu entdecken. Nun hat er zwei Jahre lang seine Fähigkeiten und seine Energie auf seine Physikvorlesungen für Studienanfänger verwandt. Für sie hat er das Wesentliche seines Wissens herausgearbeitet und in anschaulicher Weise ein Bild von der Welt der Physik geschaffen. Seine Vorlesungen sind geprägt von der Brillanz und Klarheit seines Denkens, der Originalität und Vitalität, mit der er an die Dinge herangeht, und der mitreißenden Begeisterung seiner Sprache. Es war eine Freude, sie mitzuerleben. Die Vorlesungen des ersten Jahres bilden die Grundlage von Band I dieser Reihe. Im vorliegenden zweiten Band haben wir versucht, einen Teil der Vorlesungen des zweiten Jahres wiederzugeben; sie wurden im akademischen Jahr 1962–1963 für Studenten im zweiten Studienjahr gehalten. Die restlichen Vorlesungen des zweiten Jahres sind in Band III zusammengefasst. Von den Vorlesungen des zweiten Jahres enthalten die ersten zwei Drittel eine nahezu vollständige Behandlung der Physik der Elektrizität und des Magnetismus. Bei ihrer Darstellung wurde eine doppelte Absicht verfolgt. Erstens wollten wir den Studenten einen vollständigen Einblick in eines der großen Kapitel der Physik vermitteln – von den ersten tastenden Versuchen Franklins über die große Synthese Maxwells zur lorentzschen Elektronentheorie der Eigenschaften der Materie und schließlich bis zu den noch ungelösten Problemen der elektromagnetischen Selbstenergie. Zweitens wollten wir mit Hilfe der vorangestellten Vektoranalysis eine solide Einführung in die mathematischen Grundlagen der Feldtheorie bringen. Um die allgemeine Verwendbarkeit der mathematischen Methoden hervorzuheben, wurden zuweilen verwandte Themen aus anderen Gebieten der Physik in Zusammenhang mit den entsprechenden elektrodynamischen Gegenstücken analysiert. Wir haben uns stets bemüht, die Allgemeingültigkeit der Mathematik aufzuzeigen. („Die gleichen Gleichungen haben die gleichen Lösungen.“) Das wurde durch die Auswahl der Übungsaufgaben und Examenstexte unterstrichen, die im Verlauf des Kurses gegeben wurden. Im Anschluss an den Elektromagnetismus entstanden so zwei Kapitel über Elastizität und zwei über Strömungslehre. Im jeweils ersten Abschnitt dieser beiden Kapitelpaare werden die grundlegenden und praktischen Aspekte behandelt. Das jeweils zweite Kapitel bemüht sich um einen Überblick über den gesamten komplexen Bereich der Phänomene, die zum Thema gehören. Diese vier Kapitel können aber ohne Bedenken auch ausgelassen werden, da sie keineswegs als Vorbereitung auf Band III notwendig sind. Ungefähr das letzte Viertel des zweiten Jahres war einer Einführung in die Quantenmechanik vorbehalten. Sie ist das Thema von Band III. Diese Aufzeichnung der Feynman-Vorlesungen will aber mehr als nur eine Wiedergabe des Gesagten sein. Es sollen hier in möglichst klarer Form die Vorstellungen schriftlich herausgestellt werden, auf denen die Originalvorlesungen aufgebaut sind. Bei einigen Vorlesungen waren

XVIII

Vorwort

dazu nur geringfügige Abänderungen des ursprünglichen Wortlauts erforderlich. Bei anderen musste der Stoff neu bearbeitet und neu angeordnet werden. An manchen Stellen erschien es uns notwendig, neues Material hinzuzufügen, um die Klarheit oder auch die Ausgeglichenheit der Darstellung zu verbessern. Bei unserer Arbeit ist uns Professor Feynman fortwährend mit seiner Hilfe und seinem Rat zur Seite gestanden. Mehr als 1 000 000 gesprochener Worte unter zeitlichem Druck in einen zusammenhängenden Text zu bringen, ist eine enorme Aufgabe, insbesondere, wenn viele andere zeitraubende Verpflichtungen anstehen; zu diesen gehörten die Einführung eines neuen Kurses, die Vorbereitung von Tutorenstunden, ferner die Diskussionen mit Studenten, Übungen und Examensfragen, die ausgearbeitet werden mussten, usw. Viele Hände – und Köpfe – waren an der Arbeit. In einigen Fällen ist es uns, wie wir hoffen, gelungen, ein getreues – oder nur wenig retuschiertes – Bild Feynmans wiederzugeben. An manchen Stellen haben wir aber unser Ideal bei weitem nicht erreicht. Unsere Erfolge verdanken wir allen Beteiligten. Wo wir versagt haben, bedauern wir das sehr. Wie im Vorwort zu Band I ausführlich erklärt wird, waren diese Vorlesungen nur ein Aspekt eines Programms, das von dem „Physics Course Revision Committee“ (R. B. Leighton, Vorsitzender, H. V. Neher und M. Sands) am California Institute of Technology in die Wege geleitet und beaufsichtigt wurde. Finanziert wurde es von der Ford Foundation. An der Vorbereitung des Textes für diesen zweiten Band haben in der einen oder anderen Form mitgewirkt: T. K. Caughey, M. L. Clayton, J. B. Curcio, J. B. Hartle, T. W. H. Harvey, M. H. Israel, W. J. Karzas, R. W. Kavanagh, R. B. Leighton, J. Mathews, M. S. Plesset, F. L. Warren, W. Whaling, C. H. Wilts und B. Zimmermann. Andere waren indirekt durch ihre Mitarbeit am Kurs beteiligt: J. Blue, G. F. Chapline, M. J. Clauser, R. Dolen, H. H. Hill und A. M. Title. Unsere Aufgabe wurde in jeder Hinsicht von Professor Gerry Neugebauer unterstützt, dessen Eifer und Hingabe weit über die Gebote der Pflicht hinausgingen. Die hier aufgezeichnete Geschichte der Physik gäbe es jedoch nicht ohne die außerordentlichen Fähigkeiten und die Arbeit von Richard P. Feynman. Matthew Sands

März 1964

Inhaltsverzeichnis 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

Innere Geometrie von Kristallen Die innere Geometrie von Kristallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chemische Bindung in Kristallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Wachstum von Kristallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kristallgitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Symmetrien in zwei Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Symmetrien in drei Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die mechanische Festigkeit von Metallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Versetzungen und Kristallwachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Kristallmodell von Bragg-Nye . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 1 3 5 5 7 10 12 14 16

2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8

Tensoren Der Polarisationstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transformation von Tensorkomponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Energieellipsoid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andere Tensoren; der Trägheitstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Spannungstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tensoren höherer Stufe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Vierertensor des elektromagnetischen Impulses . . . . . . . . . . . . . . . . . . . . . . . . . . .

43 43 45 46 51 53 54 59 60

3 3.1 3.2 3.3 3.4 3.5 3.6 3.7

Der Brechungsindex dichter Materialien Polarisation von Materie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Maxwells Gleichungen in einem Dielektrikum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wellen in einem Dielektrikum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der komplexe Brechungsindex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Brechungsindex einer Mischung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wellen in Metallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Näherungen für niedrige und hohe Frequenzen; Eindringtiefe und Plasmafrequenz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63 63 66 68 72 73 75

4 4.1 4.2 4.3 4.4 4.5 4.6

Reflexion an Grenzflächen 83 Reflexion und Brechung von Licht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Wellen in dichten Materialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 Die Randbedingungen .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Reflektierte und durchgelassene Wellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Reflexion an Metallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 Totalreflexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

77

XX

Inhaltsverzeichnis

5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8

Der Magnetismus der Materie 103 Diamagnetismus und Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Magnetische Momente und Drehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 Die Präzession atomarer Magnete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Diamagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Der larmorsche Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Die klassische Physik ergibt weder Diamagnetismus noch Paramagnetismus . . . 113 Der Drehimpuls in der Quantenmechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Die magnetische Energie von Atomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

6 6.1 6.2 6.3 6.4 6.5 6.6

Paramagnetismus und magnetische Resonanz 121 Quantisierte magnetische Zustände. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Der Stern-Gerlach-Versuch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Die Rabi-Molekularstrahl-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Der Paramagnetismus der Stoffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Kühlung durch adiabatische Entmagnetisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Magnetische Kernresonanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

7 7.1 7.2 7.3 7.4 7.5 7.6

Ferromagnetismus 139 Magnetisierungsströme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Das Feld H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Die Magnetisierungskurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Induktivitäten mit Eisenkern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Elektromagnete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Spontane Magnetisierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156

8 8.1 8.2 8.3 8.4 8.5

Magnetische Materialien 165 Den Ferromagnetismus verstehen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Thermodynamische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Die Hysteresekurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Ferromagnetische Materialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Ungewöhnliche magnetische Materialien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

9 9.1 9.2 9.3 9.4 9.5

Elastizität 185 Das hookesche Gesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 Homogene Dehnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Der Torsionsstab; Scherwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 Der gebogene Balken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 Knicken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

10 10.1 10.2 10.3 10.4 10.5

Elastische Materialien 205 Der Dehnungstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 Der Elastizitätstensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Bewegungen in einem elastischen Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 Unelastisches Verhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Berechnung der elastischen Konstanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

Inhaltsverzeichnis

XXI

11 11.1 11.2 11.3 11.4 11.5

Die Strömung von trockenem Wasser 225 Hydrostatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Die Bewegungsgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Stationäre Strömung – das Theorem von Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 Zirkulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 Wirbellinien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

12 12.1 12.2 12.3 12.4 12.5 12.6

Die Strömung von nassem Wasser 245 Viskosität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Viskose Strömung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 Die Reynolds-Zahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 Die Strömung an einem kreisförmigen Zylinder vorbei . . . . . . . . . . . . . . . . . . . . . . . . 254 Der Grenzfall verschwindender Viskosität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258 Couette-Strömung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258

13 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9

Der gekrümmte Raum 263 Gekrümmte Räume in zwei Dimensionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 Die Krümmung im dreidimensionalen Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 Unser Raum ist gekrümmt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Die Geometrie in Raum und Zeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 Die Gravitation und das Äquivalenzprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld . . . . . . . . . . . . . . . 275 Die Krümmung in Raum und Zeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 Bewegung in einer gekrümmten Raumzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 Einsteins Gravitationstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283

Index Band IV

287

Gesamtindex

291

Personenverzeichnis

307

1

Innere Geometrie von Kristallen

Siehe auch: Ch. Kittel: Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München

1.1

Die innere Geometrie von Kristallen

Wir haben die Darlegung der grundlegenden Gesetze der Elektrizität und des Magnetismus beendet und wollen nun die elektromagnetischen Eigenschaften der Materie untersuchen. Wir beginnen mit der Beschreibung von Festkörpern – und zwar mit Kristallen. Bewegen sich die Atome der Materie nur geringfügig, so bleiben sie beieinander und bilden eine Anordnung mit möglichst niedriger Energie. Haben die Atome an einem bestimmten Ort ein Muster gefunden, das einer niedrigen Energie entspricht, so werden sich die Atome an anderen Stellen wahrscheinlich in derselben Form anordnen. Deshalb finden wir in festen Materialien ein sich wiederholendes Muster der Atome vor. Die Bedingungen in einem Kristall sind also die folgenden: Die Umgebung eines gegebenen Atoms in einem Kristall stellt eine bestimmte Anordnung dar und wenn Sie dieselbe Atomsorte an einem anderen Ort in einigem Abstand dazu betrachten, so finden Sie ein Atom mit genau der gleichen Umgebung. Wählen Sie dann ein Atom, das noch einmal um den gleichen Abstand weiter entfernt liegt, so stellen Sie auch da wieder dieselben Bedingungen fest. Das Muster wiederholt sich endlos – und das natürlich in drei Dimensionen. Stellen Sie sich vor, Sie sollen ein Muster für eine Tapete entwerfen – oder für einen Stoff oder für eine beliebige andere ebene Fläche – bei dem sich ein Element geometrisch ständig wiederholt, sodass Sie die Fläche nach Belieben vergrößern können. Das ist das zweidimensionale Analogon zu dem Problem, das ein Kristall in drei Dimensionen löst. Abbildung 1.1 (a) zeigt zum Beispiel ein sehr häufig anzutreffendes Tapetenmuster. Durch ständige Wiederholung eines einzigen Elementes entsteht ein Muster, das immer weiter fortgesetzt werden kann. Die geometrischen Charakteristika dieses Tapetenentwurfs sind in Abbildung 1.1 (b) angegeben, wobei nur seine Wiederholungseigenschaften, nicht aber die Geometrie der Blume oder sein künstlerischer Wert beachtet sind. Beginnen Sie an einem beliebigen Punkt, so können Sie den entsprechenden Punkt finden, wenn Sie in der Richtung von Pfeil 1 den Abstand a zurücklegen. Einen entsprechenden Punkt können Sie aber auch finden, wenn Sie in der Richtung von Pfeil 2 den Abstand b zurücklegen. Es sind natürlich noch viele andere Richtungen möglich. Sie können beispielsweise vom Punkt α zum Punkt β gehen und erreichen einen entsprechenden Punkt, doch ein solcher Schritt kann als eine Kombination aus einem Schritt in Richtung 1 und einem Schritt in Richtung 2 betrachtet werden. Eine der grundlegenden Eigenschaften des Musters kann durch die beiden kürzesten Schritte zu äquivalenten Nachbarorten beschrieben werden. Mit „äquivalenten“ Orten wollen wir sagen, dass es keine Rolle spielt, ob Sie an dem einen oder an dem anderen Ort stehen: wenn Sie sich umschauen, sehen Sie beide Male dasselbe. Das ist die grundlegende Eigenschaft eines Kristalls.

2

1 Innere Geometrie von Kristallen

Der einzige Unterschied besteht darin, dass ein Kristall keine zweidimensionale, sondern eine dreidimensionale Anordnung ist; und anstelle der Blumen ist natürlich jedes Element des Gitters eine Anordnung von Atomen – vielleicht sechs Wasserstoff- und zwei Kohlenstoffatome –, die ein bestimmtes Muster bilden. Das Atommuster in einem Kristall lässt sich experimentell durch Röntgenbeugung ermitteln. Wir haben diese Methode früher kurz erwähnt und wollen jetzt nichts weiter dazu sagen, außer, dass man damit für die meisten einfachen und für einige kompliziertere Kristalle die genaue Anordnung der Atome im Raum festgestellt hat.

b α

(a)

2

β 1

a

(b)

Abb. 1.1: Ein sich ständig wiederholendes Muster in zwei Dimensionen.

Die innere Struktur eines Kristalls äußert sich auf verschiedene Weise. Erstens ist gewöhnlich die Bindungskraft der Atome in einigen Richtungen stärker als in anderen. Das bedeutet, dass es in dem Kristall bestimmte Ebenen gibt, an denen er leichter zerbricht. Sie werden Spaltebenen genannt. Zerbrechen Sie einen Kristall mit einer Messerklinge, so wird er häufig entlang einer solchen Ebene zerspringen. Zweitens hängt die Tatsache, dass die innere Struktur oft schon auf der Oberfläche zu erkennen ist, mit der Entstehung des Kristalls zusammen. Stellen Sie sich einen Kristall vor, der aus einer Lösung abgeschieden wird. Die Atome schwimmen in der Lösung und setzen sich schließlich ab, wenn sie einen Ort mit der niedrigsten Energie finden. (Als ob die Tapete aus Blumen entstünde, die zunächst umherdriften, bis eine von ihnen einen Platz einnimmt und dort steckenbleibt und desgleichen die nächste und die nächste, sodass das Muster nach und nach wächst.) Sie können verstehen, dass der Kristall in gewissen Richtungen mit einer anderen Geschwindigkeit als in anderen Richtungen wächst und dabei eine bestimmte geometrische Gestalt entwickelt. Aufgrund solcher Effekte lassen die äußeren Oberflächen vieler Kristalle einiges bezüglich der inneren Anordnung der Atome erkennen. Zum Beispiel zeigt Abbildung 1.2 (a) die Form eines typischen Quarzkristalls, dessen inneres Muster hexagonal ist. Betrachten Sie einen solchen Kristall aus der Nähe, so werden Sie feststellen, dass das Äußere kein sehr schönes Hexagon darstellt, weil die Seiten nicht alle gleich lang sind – tatsächlich sind sie oft sehr ungleich. Aber in einer Hinsicht ist er ein sehr gutes Hexagon: die Winkel zwischen den Flächen sind genau 120◦. Die Größe einer gegebenen Fläche ist offensichtlich ein Zufall des Wachstums, aber die Winkel sind eine Widerspiegelung der inneren Geometrie. Folglich hat jeder Quarzkristall eine andere Form, obwohl die Winkel zwischen entsprechenden Flächen immer dieselben sind. Auch die innere Geometrie eines Natriumchloridkristalls ist aus seiner äußeren Form ersichtlich. Abbildung 1.2 (b) zeigt die Gestalt eines typischen Salzkorns. Wiederum ist der Kristall kein vollkommener Würfel, aber die Flächen liegen genau im rechten Winkel zueinander.

1.2 Chemische Bindung in Kristallen

3

(b)

(a)

(c)

Abb. 1.2: Natürliche Kristalle: (a) Quarz, (b) Natriumchlorid, (c) Glimmer.

Ein komplizierterer Kristall ist Glimmer, der die in Abbildung 1.2 (c) gezeigte Form hat. Es handelt sich um einen höchst anisotropen Kristall, was aus der Tatsache hervorgeht, dass er sehr hart ist, wenn Sie versuchen, ihn in der einen Richtung (der horizontalen in der Abbildung) auseinanderzubrechen und dass er in der anderen Richtung (der vertikalen) sehr leicht zu zerbrechen ist. Er wurde häufig verwendet, um dünne, sehr widerstandsfähige Blätter herzustellen. Glimmer und Quarz sind zwei Beispiele für natürliche Mineralien, die Kieselsäure enthalten. Ein drittes Beispiel für ein Mineral mit Kieselsäure ist Asbest, der die interessante Eigenschaft aufweist, dass er sich in zwei Richtungen leicht zerbrechen lässt, aber nicht in der dritten. Er scheint aus sehr starken, linearen Fasern zu bestehen.

1.2

Chemische Bindung in Kristallen

Die mechanischen Eigenschaften der Kristalle hängen stark von der Art der chemischen Bindungen zwischen den Atomen ab. Die so frappierend unterschiedliche Festigkeit von Glimmer in verschiedenen Richtungen hängt von den Typen der interatomaren Bindung in den verschiedenen Richtungen ab. Zweifellos haben Sie schon im Chemieunterricht etwas von den verschiedenen Bindungstypen gehört. Als Erstes gibt es die Ionenbindungen, die wir bereits im Fall von Natriumchlorid untersucht haben. Grob gesprochen geht es um das Folgende: Die Natriumatome haben ein Elektron verloren und sind zu positiven Ionen geworden; die Chloratome haben ein Elektron dazugewonnen und sind zu negativen Ionen geworden. Die positiven und die negativen Ionen sind in Form eines dreidimensionalen Schachbretts angeordnet und werden von elektrischen Kräften zusammengehalten.

4

1 Innere Geometrie von Kristallen

Die kovalente Bindung – in der die Elektronen zu zwei Atomen gleichzeitig gehören – tritt häufiger auf und ist gewöhnlich sehr stark. Beispielsweise haben in einem Diamanten die Kohlenstoffatome kovalente Bindungen in den vier Richtungen ihrer nächsten Nachbarn, sodass der Kristall wirklich sehr fest ist. Es existieren auch kovalente Bindungen zwischen dem Silizium und dem Sauerstoff in einem Quarzkristall, aber in dem Fall ist die Bindung nur teilweise kovalent. Da nicht alle Atome einen gleichen Anteil an den Elektronen haben, sind sie teilweise geladen, und der Kristall ist etwas ionisch. Die Natur ist nicht so einfach, wie wir sie gerne hätten; in Wirklichkeit gibt es alle möglichen Abstufungen zwischen der kovalenten Bindung und der Ionenbindung. Ein Zuckerkristall hat wieder einen anderen Bindungstyp. Er besteht aus großen Molekülen, in denen die Atome durch kovalente Bindungen fest zusammengehalten werden, sodass das Molekül eine feste Struktur hat. Aber da die starken Bindungen vollständig abgesättigt sind, gibt es nur eine verhältnismäßig schwache Anziehung zwischen den einzelnen Molekülen. In solchen Molekularkristallen bewahren die Moleküle gewissermaßen ihre eigene Identität, und die innere Struktur kann wie die in Abbildung 1.3 dargestellt werden. Da die Moleküle untereinander nicht fest zusammengehalten werden, sind die Kristalle leicht zerbrechlich. Sie sind etwas ganz anderes als beispielsweise der Diamant, der wirklich aus einem einzigen riesigen Molekül besteht, das man nirgendwo brechen kann, ohne starke kovalente Bindungen zu zerreißen. Das Paraffin ist ein anderes Beispiel für einen Molekularkristall. ×

×

×

×

×

×

×

×

×

×

× × ×

×

× × ×

× × ×

Abb. 1.3: Das Gitter eines Molekularkristalls.

Ein extremes Beispiel für einen Molekularkristall finden wir in einer Substanz wie in festem Argon. Es wirken nur geringe Anziehungskräfte zwischen den Atomen – jedes Atom ist ein vollständig abgesättigtes einatomiges Molekül. Aber bei niedrigen Temperaturen ist die Wärmebewegung sehr gering, sodass die schwachen interatomaren Kräfte bewirken können, dass sich die Atome wie in einem Stapel dicht gepackter Kugeln regelmäßig anordnen. Die Metalle stellen eine völlig andere Kategorie von Substanzen dar. Der Bindungstyp ist bei ihnen ein vollkommen anderer. In einem Metall bezieht sich die Bindung nicht auf angrenzende Atome, sondern stellt eine Eigenschaft des ganzen Kristalls dar. Die Valenzelektronen sind nicht an ein Atom oder ein Atompaar gebunden, sondern der ganze Kristall hat daran teil. Jedes Atom trägt ein Elektron zu einem universellen Elektronenreservoir bei, und die zurückgebliebenen positiven Ionen schwimmen in einem See von negativen Elektronen. Der Elektronensee hält die Ionen wie eine Art Klebemasse zusammen. Da es in den Metallen keine speziellen Bindungen in einer bestimmten Richtung gibt, besteht auch keine starke Richtungsabhängigkeit der Bindung. Sie sind aber immer noch kristallin, da die Gesamtenergie am niedrigsten ist, wenn die Ionen in einer bestimmten Weise angeordnet sind – obwohl die Energie der bevorzugten Anordnung gewöhnlich nicht viel niedriger als die

1.4 Kristallgitter

5

anderer Anordnungen ist, die gleichfalls möglich sind. In erster Näherung kann man sagen, dass die Atome vieler Kristalle wie kleine Kugeln sind, die so dicht wie möglich zusammengepackt sind.

1.3

Das Wachstum von Kristallen

Versuchen Sie, sich die natürliche Bildung von Kristallen in der Erde vorzustellen. In der Oberflächenzone der Erde gibt es eine breite Mischung aus allen möglichen Atomsorten. Sie werden durch Vulkantätigkeit, Wind und Wasser ständig durcheinandergerührt – ständig umhergeschoben, ständig gemischt. Durch irgendeinen Trick aber beginnen die Siliziumatome nach und nach zueinander zu finden und Sauerstoffatome aufzulesen, um Kieselsäure zu bilden. Ein Atom fügt sich zu den anderen und es wird ein Kristall aufgebaut – aus der inhomogenen Mischung wird etwas Einheitliches. Und irgendwo ganz in der Nähe finden Natrium- und Chloratome zueinander und bauen einen Salzkristall auf. Wie kommt es aber, dass sich ein Kristall, sobald er begonnen wurde, nur mit einer bestimmten Atomsorte zusammentun will? Weil das Gesamtsystem auf die niedrigste mögliche Energie hinarbeitet. Ein wachsender Kristall nimmt nur dann ein neues Atom auf, wenn dies zur Senkung der Energie beiträgt. Aber woher weiß der Kristall, dass ein Siliziumatom – oder ein Sauerstoffatom – an einer bestimmten Stelle zu der niedrigsten möglichen Energie führen wird? Er erkennt es tastend. In einer Flüssigkeit sind alle Atome ständig in Bewegung. Jedes Atom stößt pro Sekunde ungefähr 1013 -mal gegen seine Nachbarn. Trifft es den wachsenden Kristall an der richtigen Stelle, so ist die Wahrscheinlichkeit, dass es wieder zurückspringt, um einiges kleiner, wenn die Energie niedrig ist. Indem die Atome fortwährend mit einer Rate von 1013 Versuchen pro Sekunde über Millionen von Jahre hinweg probieren, finden sie sich nach und nach an den Stellen ein, wo sie die niedrigste Energie erreichen. Schließlich wachsen sie zu großen Kristallen heran.

1.4

Kristallgitter

Die Anordnung der Atome in einem Kristall – das Kristallgitter – kann unterschiedliche geometrische Formen annehmen. Wir wollen zuerst die einfachsten Gitter beschreiben, die für die meisten Metalle und für die feste Form der Edelgase charakteristisch sind. Es handelt sich um kubische Gitter, die in zwei Varianten auftreten können: kubisch-raumzentriert, wie in Abbil-

(a)

(b) Abb. 1.4: Die Einheitszelle von kubischen Kristallen: (a) raumzentriert, (b) flächenzentriert.

6

1 Innere Geometrie von Kristallen

dung 1.4 (a) und kubisch-flächenzentriert, wie in Abbildung 1.4 (b). Die Abbildungen zeigen natürlich nur einen einzigen Würfel des Gitters. Sie müssen sich vorstellen, dass sich das Muster in drei Dimensionen unendlich oft wiederholt. Und damit die Abbildung klarer ist, sind nur die „Mittelpunkte“ der Atome dargestellt. In einem realen Kristall liegen die Atome eher als Kugeln vor, die einander berühren. Die schwarzen und weißen Kugeln in den Abbildungen können im Allgemeinen sowohl verschiedene Atomsorten als auch dieselbe Atomsorte darstellen. Zum Beispiel hat Eisen bei niedrigen Temperaturen ein kubisch-raumzentriertes Gitter, während es bei höheren Temperaturen kubisch-flächenzentriert ist. Die physikalischen Eigenschaften sind in den beiden kristallinen Formen völlig verschieden.

A

(a)

B

(b)

Abb. 1.5: Aufbau eines hexagonal dicht gepackten Gitters.

Wie kommen solche Formen zustande? Stellen Sie sich vor, Sie sollten kugelförmige Atome so dicht wie möglich zusammenpacken. Eine Möglichkeit wäre, dass Sie zunächst eine Schicht in einer „hexagonal dicht gepackten Anordnung“ wie in Abbildung 1.5 (a) bilden. Dann könnten Sie eine zweite Schicht bilden, die wie die erste, aber horizontal verschoben ist, wie in Abbildung 1.5 (b). Als Nächstes würden Sie die dritte Schicht bilden. Aber Vorsicht! Es gibt zwei verschiedene Möglichkeiten, die dritte Schicht zu bauen. Beginnen Sie die dritte Schicht, indem Sie ein Atom in A von Abbildung 1.5 (b) setzen, so liegt jedes Atom der dritten Schicht direkt über einem Atom der untersten Schicht. Beginnen Sie die dritte Schicht andererseits, indem Sie ein Atom an den Punkt B setzen, so haben die Atome der dritten Schicht ihren Mittelpunkt genau an den Punkten, die den Mittelpunkt eines Dreiecks darstellen, das aus drei Atomen der untersten Schicht gebildet wird. Jeder andere Ausgangspunkt ist äquivalent zu A oder B, sodass nur zwei Möglichkeiten für die Bildung der dritten Schicht bestehen. Hat die dritte Schicht ein Atom im Punkt B, so ist das Kristallgitter ein flächenzentrierter Würfel – aber unter einem Winkel gesehen. Es erscheint seltsam, dass man mit Sechsecken anfangen kann und am Ende Würfel erhält. Aber beachten Sie, dass ein Würfel, den man von einer seiner Ecken aus betrachtet, den Umriss eines Sechsecks hat. Abbildung 1.6 könnte beispielsweise ein ebenes Sechseck oder einen Würfel in der Perspektive darstellen! Wird in Abbildung 1.5 (b) eine dritte Schicht hinzugefügt, die mit einem Atom in A beginnt, so liegt keine kubische Struktur vor; stattdessen zeigt das Gitter eine hexagonale Symmetrie.

1.5 Symmetrien in zwei Dimensionen

7

Abb. 1.6: Ist das ein Sechseck oder ein Würfel, der von einer seiner Ecken aus betrachtet wird?

Es ist klar, dass beide Möglichkeiten, die wir beschrieben haben, gleichermaßen dicht gepackte Anordnungen ergeben. Manche Metalle – beispielsweise Kupfer und Silber – wählen die erste Möglichkeit: den flächenzentrierten Würfel. Andere – beispielsweise Beryllium und Magnesium – wählen die anderen Möglichkeiten: sie bilden hexagonale Kristalle. Natürlich ist nicht nur die Packung von kleinen Kugeln ausschlaggebend dafür, welches Kristallgitter entsteht; es müssen dabei auch andere Faktoren mitwirken. Insbesondere spielt die kleine restliche Winkelabhängigkeit der interatomaren Kräfte eine Rolle (oder, im Fall von Metallen, die Energie des Elektronenreservoirs). Von allen diesen Dingen werden Sie zweifellos in Ihren Chemievorlesungen hören.

1.5

Symmetrien in zwei Dimensionen

Wir wollen nun einige Eigenschaften von Kristallen hinsichtlich ihrer inneren Symmetrien untersuchen. Das wesentliche Charakteristikum eines Kristalls besteht darin, dass Sie sich immer in der gleichen Art von Umgebung befinden, wenn Sie bei einem Atom beginnen und dann zum nächsten entsprechenden Atom im Abstand von einer Gittereinheit weitergehen. Das ist die grundlegende Vorstellung. Wären Sie aber ein Atom, so gäbe es noch eine andere Art von Translation, die Sie in die gleiche Umgebung versetzen könnte – das heißt, es gäbe noch eine andere mögliche „Symmetrie“. Abbildung 1.7 (a) zeigt ein anderes mögliches „tapetenartiges“ Muster (obwohl Sie ein solches wahrscheinlich noch nie gesehen haben). Vergleichen wir die Umgebungen der Punkte A und B. Auf den ersten Blick könnten Sie glauben, dass sie identisch sind – aber nicht ganz. Die Punkte C und D sind äquivalent zu A, doch die Umgebung von B ist nur dann wie die von A, wenn sie wie bei einer Spiegelung umgekehrt wird. Das Muster enthält auch Punkte, die auf eine andere Art „äquivalent“ sind. Beispielsweise haben die Punkte E und F die „gleichen“ Umgebungen, nur dass die eine um 90◦ relativ zur anderen gedreht ist. Es handelt sich um ein sehr spezielles Muster. Eine Drehung um 90◦ – oder um jedes Vielfache von 90◦ – um einen Punkt wie A ergibt wieder dasselbe Muster. Ein Kristall mit einer solchen Struktur würde zwar außen rechte Winkel haben, aber im Innern wäre er komplizierter als ein Würfel. Nachdem wir nun einige spezielle Beispiele beschrieben haben, versuchen wir eine Aufstellung aller Symmetrien, die ein Kristall haben kann. Zuerst betrachten wir, was in einer Ebene pas-

8

1 Innere Geometrie von Kristallen y R

E A

C

a F

b

a

R

B

R R

b

R

R

D

y R

(a)

R

(b)

Abb. 1.7: Ein Muster mit hoher Symmetrie.

siert. Ein ebenes Gitter kann durch zwei so genannte primitive Vektoren definiert werden, die einen Punkt des Gitters mit den beiden nächstgelegenen äquivalenten Punkten verbinden. Die beiden Vektoren 1 und 2 sind die primitiven Vektoren des Gitters von Abbildung 1.1. Die beiden Vektoren a und b von Abbildung 1.7 (a) sind die primitiven Vektoren dieses Musters. Wir könnten natürlich ebenso gut a durch −a oder b durch −b ersetzen. Da a und b den gleichen Betrag haben und im rechten Winkel zueinander liegen, transformiert eine Drehung um 90◦ a in b und b in −a und ergibt somit dasselbe Gitter.

Wir sehen, dass es Gitter mit einer „vierzähligen“ Symmetrie gibt. Zuvor haben wir eine hexagonal dicht gepackte Anordnung beschrieben, die eine sechszählige Symmetrie darstellt. Eine Drehung der Anordnung von Kreisen in Abbildung 1.5 (a) um einen Winkel von 60◦ um den Mittelpunkt eines beliebigen Kreises überführt das Muster in sich selbst. Welche anderen Arten von Rotationssymmetrien gibt es? Kann es beispielsweise eine fünfzählige oder eine achtzählige Rotationssymmetrie geben? Es ist leicht zu sehen, dass dies unmöglich ist. Die einzige Symmetrie von höherer Ordnung als vier ist eine Symmetrie der Ordnung sechs. Zeigen wir zunächst, dass eine Symmetrie von höherer Ordnung als sechs unmöglich ist. Versuchen wir, uns ein Gitter mit zwei gleichen primitiven Vektoren vorzustellen, die, wie in Abbildung 1.8 (a), einen Winkel kleiner als 60◦ bilden. Das bedeutet, dass die Punkte B und C äquivalent zu A sind und dass a und b die beiden kürzesten Vektoren sind, die A mit seinen C D

C

D

72◦

b

b�

b�

60◦ A (a)

a

72◦

36◦ B

E

b

A (b)

a

B

Abb. 1.8: (a) Höhere als sechsfache Rotationssymmetrien sind nicht möglich. (b) Eine fünffache Rotationssymmetrie ist nicht möglich.

1.5 Symmetrien in zwei Dimensionen

9

äquivalenten Nachbarn verbinden. Aber das ist offensichtlich falsch, weil der Abstand zwischen B und C kleiner als der von einem der beiden Punkte nach A ist. Es muss in D einen Nachbarn geben, der äquivalent zu A und näher als B oder C ist. b� muss einer unserer primitiven Vektoren sein. Folglich muss der Winkel zwischen zwei primitiven Vektoren gleich oder größer als 60◦ sein. Eine achteckige Symmetrie ist nicht möglich. Wie steht es mit einer Symmetrie der Ordnung fünf? Nehmen wir an, dass die primitiven Vektoren a und b gleich lang sind und einen Winkel von 2π/5 = 72◦ bilden, wie in Abbildung 1.8 (b), so muss auch ein äquivalenter Gitterpunkt in D, im Winkel von 72◦ zu b existieren. Aber der Vektor b� , der E mit D verbindet, ist kleiner als b, sodass b kein primitiver Vektor ist. Es kann keine Symmetrie der Ordnung fünf geben. Die einzigen Möglichkeiten, die uns nicht in diese Art von Schwierigkeit bringen, sind θ = 60◦ , 90◦ oder 120◦ . Auch 0◦ oder 180◦ sind offensichtlich möglich. Unser Resultat kann auch so formuliert werden, dass man sagt: Das Muster kann unverändert bleiben, wenn es einer ganzen Umdrehung (überhaupt keine Änderung), einer halben Umdrehung, einer drittel, einer viertel oder einer sechstel Umdrehung unterworfen wird. Und das sind alle Rotationssymmetrien, die in einer Ebene möglich sind – insgesamt fünf. Ist θ = 2π/n, so sprechen wir von einer Symmetrie „der Ordnung n“. Wir sagen, dass ein Muster mit n gleich 4 oder 6 eine „höhere Symmetrie“ hat als eines mit n gleich 1 oder 2. Kehren wir zu Abbildung 1.7 (a) zurück, so sehen wir, dass das Muster eine Rotationssymmetrie der Ordnung vier hat. In Teil (b) der gleichen Abbildung haben wir ein anderes Muster gezeichnet, das dieselben Symmetrieeigenschaften wie Teil (a) hat. Die kleinen Komma-ähnlichen Figuren sind asymmetrische Objekte, mit denen die Symmetrie des Musters im Innern von jedem Quadrat definiert werden kann. Beachten Sie, dass die Kommata in aufeinanderfolgenden Quadraten umgekehrt sind, sodass die Einheitszelle größer als eines der kleinen Quadrate ist. Gäbe es die Kommata nicht, so hätte das Muster noch immer eine Symmetrie der Ordnung vier, aber die Einheitszelle wäre kleiner. Die Muster von Abbildung 1.7 haben noch andere Symmetrieeigenschaften. Beispielsweise reproduziert eine Spiegelung an einer der unterbrochenen Linien R – R dasselbe Muster. Die Muster von Abbildung 1.7 haben noch eine andere Form der Symmetrie. Wird das Muster an der Linie Y – Y gespiegelt und um ein Quadrat nach rechts (oder links) verschoben, so erhalten wir wieder das ursprüngliche Muster. Die Linie Y – Y wird eine „Gleitlinie“ genannt. Das sind alle Symmetrien, die in zwei Dimensionen möglich sind. Es gibt eine weitere Operation der räumlichen Symmetrie, die in zwei Dimensionen äquivalent zu einer Drehung um 180◦ ist, die aber in drei Dimensionen eine völlig andere Operation darstellt. Es handelt sich um die Inversion. Mit Inversion meinen wir, dass jeder Punkt im vektoriellen Abstand R von einem bestimmten Ursprung [beispielsweise vom Punkt A in Abbildung 1.9 (b)] an den Punkt in −R gebracht wird. Eine Inversion des Musters (a) von Abbildung 1.9 erzeugt ein neues Muster, aber eine Inversion des Musters (b) reproduziert dasselbe Muster. Für ein zweidimensionales Muster ist (wie aus der Abbildung hervorgeht) eine Inversion des Musters (b) am Punkt A äquivalent zu einer Rotation von 180◦ um diesen Punkt. Machen wir jedoch das Muster in Abbildung 1.9 (b) dreidimensional, indem wir uns vorstellen, dass jede der kleinen 6’en und 9’en einen „Pfeil“ hat, der auf den Betrachter zu gerichtet ist. Nach einer Inversion in drei Dimensionen zeigen alle Pfeile in die entgegengesetzte Richtung, sodass das Muster nicht reproduziert wird.Wenn wir

10

1 Innere Geometrie von Kristallen

6

6

6 6 6 6

6 6

6

6

6

6

(c)

9x 9x

6 9x 6 9x

9x 6

6

6 9

6 9x 6

9x 6

9

6 9

9 6

6

9 6

9

6 9

R

(b)

9 6

9

9 6

9

(a)

9 6

6

9 6 9

9

6

6

9 A 6

9 6 9 −R 6

6 6

6 6

6

6

6

6 6

6 9x

9x (d)

Abb. 1.9: Symmetrie bei Inversion. Das Muster (b) bleibt unverändert, wenn R → −R, aber Muster (a) wird geändert. In drei Dimensionen ist Muster (d) bei einer Inversion symmetrisch, aber (c) nicht.

die Spitzen und hinteren Enden der Pfeile durch Punkte bzw. Kreuze kennzeichnen, so können wir ein dreidimensionales Muster herstellen, wie in Abbildung 1.9 (c), das bei Inversion nicht symmetrisch ist, oder wir können ein Muster wie das in (d) bilden, bei dem eine solche Symmetrie vorliegt. Beachten Sie, dass es nicht möglich ist, eine dreidimensionale Inversion durch eine Kombination von Rotationen zu imitieren. Charakterisieren wir die „Symmetrie“ eines Musters – oder eines Gitters – durch die Symmetrieoperationen, die wir beschrieben haben, so stellt sich heraus, dass für zwei Dimensionen 17 verschiedene Muster möglich sind. In Abbildung 1.1 haben wir ein Muster mit der schwächsten möglichen Symmetrie beschrieben und in Abbildung 1.7 eines mit hoher Symmetrie. Wir überlassen es Ihnen, alle 17 möglichen Muster herauszufinden! Es ist verwunderlich, dass nur so wenige der 17 möglichen Muster bei der Herstellung von Tapeten und Stoffen verwendet werden. Man sieht immer dieselben drei oder vier Grundmuster. Liegt das an der mangelnden Phantasie derer, die die Entwürfe machen, oder daran, dass viele der möglichen Muster nicht schön anzusehen sind?

1.6

Symmetrien in drei Dimensionen

Bisher haben wir nur über Muster in zwei Dimensionen gesprochen. Eigentlich interessieren uns aber die Muster von Atomen im Raum. Es ist zunächst einmal klar, dass ein dreidimensionaler Kristall drei primitive Vektoren hat. Fragen wir dann nach den möglichen Symmetrieoperationen in drei Dimensionen, so stellen wir fest, dass es 230 verschiedene mögliche Symmetrien gibt! Es ist zweckmäßig, diese 230 Typen in sieben Klassen einzuteilen, die in Abbildung 1.10 dargestellt sind. Das Gitter mit der kleinsten Symmetrie nennt man triklin. Seine Einheitszelle ist ein Parallelepiped. Die primitiven Vektoren sind verschieden lang und keine

1.6 Symmetrien in drei Dimensionen

11

c b a triklin a

c a

a rhombisch

a trigonal (= rhomboedrisch) c

c b

a 60◦ a hexagonal

a a tetragonal

a monoklin

c

b

a

a a kubisch

Abb. 1.10: Die sieben Kristallklassen.

zwei Winkel zwischen ihnen sind gleich. Es besteht keine Möglichkeit für eine Rotations- oder Reflexionssymmetrie. Dennoch gibt es zwei mögliche Symmetrien – durch eine Inversion am Scheitelpunkt wird die Einheitszelle verändert, oder sie wird es nicht. [Mit einer Inversion in drei Dimensionen meinen wir wiederum, dass die räumlichen Vektoren R durch −R ersetzt werden, oder mit anderen Worten, dass sich (x, y, z) in (−x, −y, −z) transformiert.] Also hat das trikline Gitter nur zwei mögliche Symmetrien, sofern nicht eine spezielle Relation zwischen den primitiven Vektoren besteht. Wenn beispielsweise alle Vektoren gleich lang sind und in gleichen Winkeln zueinander liegen, so handelt es sich um das in der Abbildung dargestellte trigonale (= rhomboedrische) Gitter. Diese Figur kann eine zusätzliche Symmetrie haben; sie kann bei Rotation um die längere Raumdiagonale unverändert bleiben. Liegt einer der primitiven Vektoren, sagen wir c, im rechten Winkel zu den beiden anderen, so erhalten wir eine monokline Einheitszelle. Eine neue Symmetrie ist möglich – eine Drehung von 180◦ um c. Die hexagonale Zelle ist ein besonderer Fall, in dem die Vektoren a und b gleich lang sind und die Winkel zwischen ihnen 60◦ betragen, sodass eine Drehung von 60◦ oder 120◦ oder 180◦ um den Vektor c dasselbe Gitter (für gewisse innere Symmetrien) wiederholt. Wenn alle drei primitiven Vektoren im rechten Winkel zueinander liegen, aber verschieden lang sind, so erhalten wir die rhombische Zelle. Die Figur bleibt bei Drehungen von 180◦ um die drei Achsen dieselbe. Symmetrien höherer Ordnung sind bei der tetragonalen Zelle möglich, die nur rechte Winkel und zwei gleich lange primitive Vektoren aufweist. Schließlich gibt es dann noch die kubische Zelle, die die symmetrischste von allen ist.

12

1 Innere Geometrie von Kristallen

Bei dieser ganzen Diskussion über Symmetrien geht es in erster Linie darum, dass sich die inneren Symmetrien der Kristalle – zuweilen auf subtile Weise – in den makroskopischen physikalischen Eigenschaften des Kristalls widerspiegeln. Beispielsweise weist ein Kristall im Allgemeinen eine tensorielle elektrische Polarisierbarkeit auf. Beschreiben wir den Tensor durch das Polarisationsellipsoid, so können wir erwarten, dass auch einige der Kristallsymmetrien in dem Ellipsoid auftauchen. Ein kubischer Kristall ist zum Beispiel symmetrisch bei Drehungen von 90◦ um jede der drei orthogonalen Achsen. Das einzige Ellipsoid mit dieser Eigenschaft ist offensichtlich die Kugel. Ein kubischer Kristall muss also ein isotropes Dielektrikum sein. Hingegen hat ein tetragonaler Kristall eine Rotationssymmetrie der Ordnung vier. In seinem Ellipsoid müssen zwei der Hauptachsen gleich lang und die dritte parallel zur Achse des Kristalls sein. Ähnliches gilt für den rhombischen Kristall, der eine Rotationssymmetrie der Ordnung zwei um drei orthogonale Achsen hat, sodass seine Achsen mit denen des Polarisationsellipsoids zusammenfallen müssen. In der gleichen Weise muss eine der Achsen eines monoklinen Kristalls parallel zu einer der Hauptachsen des Ellipsoids sein, wobei wir nichts über die anderen Achsen aussagen können. Da ein trikliner Kristall nicht rotationssymmetrisch ist, kann das Ellipsoid beliebig orientiert sein. Wie Sie sehen, können wir uns bestens damit amüsieren, die möglichen Symmetrien herauszufinden und sie mit den möglichen physikalischen Tensoren in Beziehung zu setzen. Wir haben nur den Polarisationstensor betrachtet; die Dinge können jedoch sehr viel komplizierter sein – wie beispielsweise im Fall des Elastizitätstensors. Es gibt einen Zweig der Mathematik, der „Gruppentheorie“ genannt wird und der sich mit diesen Themen beschäftigt, aber gewöhnlich lässt sich mit gesundem Menschenverstand alles finden, was man sucht.

1.7

Die mechanische Festigkeit von Metallen

Wir haben gesagt, dass Metalle gewöhnlich eine einfache kubische Kristallstruktur haben; jetzt wollen wir ihre mechanischen Eigenschaften untersuchen, die von dieser Struktur abhängen. Metalle sind im Allgemeinen sehr „weich“, weil man leicht eine Schicht des Kristalls über die nächste gleiten lassen kann. Sie werden denken: „Das ist lächerlich, Metalle sind fest.“ Keineswegs, ein einzelner Kristall eines Metalls kann sehr leicht verzerrt werden. Betrachten wir zwei Schichten eines Kristalls, die einer Scherkraft ausgesetzt sind, wie es das Diagramm von Abbildung 1.11 (a) zeigt. Sie könnten zunächst glauben, die ganze Schicht würde sich der Bewegung widersetzen, bis die Kraft groß genug ist, um die ganze Schicht „über den Buckel rutschen“ zu lassen, sodass sie um eine Kerbe nach links verschoben würde. Obwohl es ein Gleiten entlang einer Schicht gibt, kommt es doch nicht so zustande. (Wenn das so wäre, würden Sie das Metall als sehr viel fester berechnen, als es in Wirklichkeit ist.) Was pas1

(a) Abb. 1.11: Gleiten von kristallinen Schichten.

2

3

4

(b)

1.7 Die mechanische Festigkeit von Metallen

13

siert ist aber, dass sich die Atome einzeln bewegen. Zuerst macht das linke Atom einen Sprung, dann das nächste und so fort, wie es Abbildung 1.11 (b) zeigt. De facto ist es der leere Raum zwischen zwei Atomen, der sich schnell nach rechts bewegt, und das führt insgesamt zu einer Verschiebung der ganzen Schicht um den Abstand zwischen zwei Atomen. So kommt das Gleiten zustande, denn es erfordert sehr viel weniger Energie, die Atome einzeln über den Buckel zu heben als die ganze Schicht. Sobald die Kraft ausreicht, um den Prozess in Gang zu setzen, läuft alles Weitere sehr schnell ab. In einem realen Kristall ist zu beobachten, dass das Gleiten mehrere Male in einer Schicht auftritt, dann aufhört und in einer anderen Schicht von neuem beginnt. Die Gründe dafür, warum es anfängt und wieder aufhört, sind ein Rätsel. Es ist wirklich sehr merkwürdig, dass aufeinanderfolgende Bereiche, in denen das Gleiten auftritt, oft recht gleichmäßige Abstände aufweisen. Abbildung 1.12 zeigt das Foto eines winzigen dünnen Kupferkristalls, der gedehnt wurde. Sie können die einzelnen Ebenen sehen, in denen ein Gleiten aufgetreten ist. Abb. 1.12: Foto eines kleinen gedehnten Kupferkristalls. [Mit freundlicher Genehmigung von S. S. Brenner, Senior Scientist, United States Steel Research Center, Monroeville, Pa.]

Das plötzliche Gleiten einzelner Kristallschichten wird ganz deutlich, wenn Sie ein Stück Draht aus Zinn nehmen, der große Kristalle enthält, und ihn an Ihr Ohr halten, während Sie ihn dehnen. Sie können es viele Male „knacken“ hören, wenn die Schichten nacheinander in ihre neuen Positionen springen. Ein „fehlendes“ Atom in einer Schicht stellt ein schwierigeres Problem dar, als es nach Abbildung 1.11 der Fall zu sein scheint. Bei mehreren Schichten muss die Situation in etwa die von Abbildung 1.13 sein. Einen solchen Gitterfehler in einem Kristall nennt man eine Versetzung. Man nimmt an, dass solche Versetzungen entweder auftraten, als der Kristall entstand, oder dass sie durch eine Kerbe oder einen Riss in der Oberfläche hervorgerufen wurden. Sind sie einmal entstanden, so können sie sich relativ frei im Kristall bewegen. Die makroskopischen Verzerrungen beruhen auf den Bewegungen vieler solcher Versetzungen.

Abb. 1.13: Eine Versetzung in einem Kristall.

14

1 Innere Geometrie von Kristallen

Versetzungen können sich frei bewegen – das heißt, die Bewegung erfordert wenig zusätzliche Energie – solange der übrige Kristall ein vollkommenes Gitter darstellt. Aber sie können „steckenbleiben“, wenn sie auf eine andere Art von Gitterfehler stoßen. Ist sehr viel Energie erforderlich, um den Fehler zu passieren, so werden sie aufgehalten. Genau das ist der Mechanismus, der zur Festigkeit fehlerhafter Metallkristalle führt. Kristalle aus reinem Eisen sind sehr weich, aber eine kleine Konzentration atomarer Verunreinigungen kann genügend Fehlstellen hervorrufen, um Versetzungen effektiv aufzuhalten. Wie Sie wissen, ist Stahl, der im Wesentlichen aus Eisen besteht, sehr hart. Um Stahl herzustellen, wird eine kleine Menge Kohlenstoff in geschmolzenem Eisen aufgelöst; wird die Schmelze schnell abgekühlt, so präzipiert der Kohlenstoff in Form von kleinen Körpern und ruft viele mikroskopische Verzerrungen im Gitter hervor. Die Versetzungen können sich nicht mehr bewegen und das Metall ist fest.

Abb. 1.14: Eine schraubenförmige Versetzung. [Nach Charles Kittel, Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München.]

Reines Kupfer ist sehr weich, kann aber „gehärtet“ werden. Das erreicht man durch Hämmern oder indem man es hin- und herbiegt. Dadurch werden viele neue Versetzungen der verschiedensten Art erzeugt, die sich gegenseitig beeinflussen und dabei ihre Beweglichkeit herabsetzen. Vielleicht kennen Sie den Trick, bei dem man einen Stab aus „sehr weichem“ Kupfer vorsichtig um das Handgelenk zu einem Armband biegt. Bei diesem Vorgang wird es gehärtet und kann dann nicht mehr so leicht zurückgebogen werden! Ein gehärtetes Metall wie Kupfer kann wieder weich gemacht werden, indem man es bei hohen Temperaturen ausglüht. Die Wärmebewegung der Atome „bügelt“ die Versetzungen glatt, sodass wieder große Monokristalle entstehen. Bisher haben wir nur die so genannte Gleitversetzung beschrieben. Es gibt viele andere Arten, u.a. die in Abbildung 1.14 dargestellte schraubenförmige Versetzung. Solche Versetzungen spielen oft eine wichtige Rolle beim Wachstum von Kristallen.

1.8

Versetzungen und Kristallwachstum

Es war lange Zeit ein großes Rätsel, wie es möglich ist, dass Kristalle wachsen. Wir haben beschrieben, dass jedes Atom durch wiederholtes Probieren prüfen kann, ob es in einem Kristall sein will oder nicht. Das bedeutet aber, dass jedes Atom einen Ort mit niedriger Energie finden muss. Hingegen wird ein Atom, das auf eine neue Oberfläche gesetzt wird, nur durch ein oder zwei Bindungen von unten her festgehalten und hat nicht dieselbe Energie, wie wenn es in eine Ecke gebracht wird, wo es auf drei Seiten von Atomen umgeben ist. Stellen wir uns einen wachsenden Kristall als einen Stapel von Blöcken vor, wie es Abbildung 1.15 zeigt.

1.8 Versetzungen und Kristallwachstum

15

B

A

Abb. 1.15: Wachstum eines Kristalls.

Versuchen wir, einen neuen Block beispielsweise an die Stelle A zu bringen, so findet er dort nur einen der sechs Nachbarn vor, die er am Ende haben sollte. Bei so vielen fehlenden Bindungen ist seine Energie nicht sehr niedrig. Er wäre besser daran an der Stelle B, wo er bereits die Hälfte seines Bindungssolls erreicht. Das Wachstum der Kristalle vollzieht sich tatsächlich so, dass an Stellen wie B Atome angefügt werden. Was passiert aber, wenn diese Reihe zu Ende ist? Um eine neue Reihe zu beginnen, muss ein Atom zur Ruhe kommen, wobei es nur an zwei seiner Seiten festgehalten wird, und das ist wiederum wenig wahrscheinlich. Selbst wenn das vorkäme, was würde passieren, wenn die Schicht zu Ende wäre? Wie könnte eine neue Schicht begonnen werden? Eine Antwort lautet, dass der Kristall es vorzieht, an einer Versetzung zu wachsen, beispielsweise um eine schraubenförmige Versetzung wie die in Abbildung 1.14 dargestellte. In dem Maß, in dem Blöcke zu diesem Kristall hinzugefügt werden, gibt es immer wieder Stellen, an denen drei Bindungen zur Verfügung stehen. Der Kristall zieht es infolgedessen vor, um eine Versetzung herumzuwachsen. Ein solches Wachstumsmuster in Form einer Spirale ist in Abbildung 1.16 veranschaulicht, die ein Foto eines einzelnen Paraffinkristalls zeigt.

Abb. 1.16: Ein Paraffinkristall, der um eine schraubenförmige Versetzung gewachsen ist. [Nach Ch. Kittel, Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München.]

16

1 Innere Geometrie von Kristallen

1.9

Das Kristallmodell von Bragg-Nye

Natürlich können wir nicht beobachten, was mit den einzelnen Atomen in einem Kristall geschieht. Und wie Sie inzwischen wissen, gibt es viele komplizierte Phänomene, die nicht leicht quantitativ zu behandeln sind. Sir Lawrence Bragg und J. F. Nye haben sich ein Schema ausgedacht, nach dem man ein Modell eines Metallkristalls bauen kann, das auf frappierende Weise viele Phänomene zeigt, von denen man annimmt, dass sie in einem realen Metall auftreten. Auf den folgenden Seiten haben wir das Original ihres Artikels abgedruckt, in dem sie ihre Methode und einige damit erzielte Resultate beschreiben. (Der Artikel wurde abgedruckt aus den Proceedings of the Royal Society of London, Bd. 190, September 1947, S. 474–481 – mit Erlaubnis der Autoren und der Royal Society.)

Ein dynamisches Modell einer Kristallstruktur VON SIR LAWRENCE BRAGG, F.R.S. UND J.F. NYE Cavendish Laboratory, Universität Cambridge (Eingegangen am 9. Januar 1947 – Gelesen am 19. Juni 1947) [Aufnahmen 8 bis 21]

Die Kristallstruktur eines Metalls wird als eine Ansammlung von Blasen dargestellt, die einen Durchmesser von einem Millimeter oder weniger haben und auf der Oberfläche einer Seifenlösung schwimmen. Die Blasen werden mithilfe einer feinen Pipette bei konstantem Luftdruck unter die Oberfläche geblasen. Ihre Größe ist bemerkenswert einheitlich. Sie werden durch die Oberflächenspannung entweder als einzelne Schicht an der Oberfläche oder als dreidimensionaler Block zusammengehalten. Eine solche Ansammlung kann Hunderttausende von Blasen enthalten und besteht für eine Stunde oder länger. Diese Ansammlungen zeigen Strukturen, deren Auftreten in Metallen vermutet wurde, und simulieren beobachtete Effekte wie Korngrenzen, Versetzungen und andere Fehlstellen, Gleiten, Rekristallisation, Ausglühen und Deformationen aufgrund von „Fremd“-Atomen.

1. Das Blasenmodell Man hat immer wieder Kristallstrukturmodelle beschrieben, in denen die Atome als kleine schwimmende oder aufgehängte Magnete dargestellt wurden, oder auch als kreisförmige Scheiben, die auf einer Wasseroberfläche schwimmen und von anziehenden Kräften infolge der Kapillarität zusammengehalten werden. Diese Modelle haben gewisse Nachteile; bei fließenden Objekten, die sich in Kontakt befinden, verhindern zum Beispiel Reibungskräfte ihre freie Relativbewegung. Ein schwerwiegenderer Nachteil besteht darin, dass die Zahl der Komponenten beschränkt ist: um den Verhältnissen in einem wirklichen Kristall nahezukommen, braucht man eine große Anzahl von Komponenten. In der vorliegenden Arbeit wird das Verhalten eines Modells beschrieben, in dem die Atome durch kleine Blasen von 2,0 bis 0,1 mm dargestellt werden, die auf der Oberfläche einer Seifenlösung schwimmen. Diese kleinen Blasen sind genügend stabil, um Experimente zu erlauben, die eine Stunde oder länger dauern, sie gleiten aneinander ohne Reibung und können in großer Zahl hergestellt werden. Einige Abbildungen in dieser Arbeit wurden an Ansammlungen von Hunderttausend und mehr Blasen aufgenommen. Das Modell kommt dem Verhalten einer Metallstruktur am nächsten, weil nur Blasen eines Typs vorkommen, die durch eine allgemeine Anziehung infolge der Kapillarität zusammengehalten werden, was der Bindungskraft der freien Elektronen im Metall entspricht. Eine kurze Beschreibung des Modells wurde im Journal of Scientific Instruments angegeben (Bragg 1942 b).

1.9 Das Kristallmodell von Bragg-Nye

17

2. Bildungsmethode Die Blasen werden aus einem dünnen Mundstück unter die Oberfläche einer Seifenlösung geblasen. Wir haben die besten Resultate mit einer Lösung erzielt, deren Zusammensetzung wir Herrn Green von der Royal Institution verdanken. 15,2 cm3 Ölsäure (rein, doppelt destilliert) wird mit 50 cm3 destilliertem Wasser geschüttelt. Das Ganze wird mit 73 cm3 einer 10%-igen Lösung von Tri-Äthanolamin gemischt und auf 200 cm3 ergänzt. Man fügt 164 cm3 reines Glyzerin hinzu. Die Mischung wird stehen gelassen und die klare Flüssigkeit wird von unten abgezogen. In einigen Experimenten wurde sie mit dem dreifachen Volumen Wasser verdünnt, um die Viskosität herabzusetzen. Das Mundstück des Luftstroms liegt ungefähr 5 mm unter der Oberfläche. Ein konstanter Luftdruck von 50 bis 200 cm Wassersäule wird mithilfe von zwei Winchesterflaschen angelegt. Die Größe der Blasen ist normalerweise erstaunlich einheitlich. Gelegentlich entstehen sie auch unregelmäßig, das kann aber durch Änderung des Mundstücks oder des Druckes leicht korrigiert werden. Unerwünschte Blasen können leicht zerstört werden, indem eine kleine Flamme über der Oberfläche bewegt wird. Abbildung 1 zeigt die Vorrichtung. Es erweist sich als günstig, den Boden des Gefäßes zu schwärzen, weil dann strukturelle Details wie Korngrenzen und Versetzungen deutlicher hervortreten.

Abbildung 1: Apparat zur Erzeugung von „Flößen“ von Blasen.

Abbildung 2 (siehe S. 23), zeigt einen Teil eines Floßes oder zweidimensionalen Kristalls aus Blasen. Seine Regelmäßigkeit kann durch Betrachten der Abbildung unter streifendem Gesichtswinkel beurteilt werden. Die Größe der Blasen ändert sich mit der Öffnung des Mundstücks, ist aber offensichtlich weitgehend unabhängig vom Druck oder dem Abstand des Mundstücks von der Oberfläche. Erhöht man den Druck, so bewirkt das hauptsächlich eine Vergrößerung der Produktionsrate der Blasen. So erzeugte beispielsweise ein dickwandiges Rohr mit einer Bohrung von 49 μm bei einem Druck von 100 cm Blasen mit einem Durchmesser von 1,2 mm. Ein dünnwandiges Rohr von 27 μm Durchmesser erzeugte bei einem Druck von 180 cm Blasen von 0,6 mm Durchmesser. Es ist zweckmäßig, Blasen von 2,0 bis 1,0 mm Durchmesser als „große“ Blasen, solche von 0,8 bis 0,6 mm Durchmesser als „mittelgroße“ und solche von 0,3 bis 0,1 mm Durchmesser als „kleine“ Blasen zu bezeichnen, da ihr Verhalten von ihrer Größe abhängt.

Abbildung 3: Apparat zur Erzeugung kleiner Blasen.

18

1 Innere Geometrie von Kristallen

Mit diesem Apparat war es uns nicht möglich, die Größe des Rohres zu verringern und so Blasen mit geringerem Durchmesser als 0,6 mm zu erzeugen. Da es wünschenswert erschien, mit sehr kleinen Blasen zu experimentieren, haben wir die Seifenlösung in ein rotierendes Gefäß gebracht und ein feines Rohr so parallel wie möglich zu einer Stromlinie angebracht. Die Blasen werden während des Entstehens weggeschwemmt und sind bei stabilen Bedingungen hinreichend gleichmäßig. Sie entstehen mit einer Häufigkeit von tausend und mehr Stück pro Sekunde, wobei ein hoher Ton erzeugt wird. Die Seifenlösung bäumt sich entlang des Gefäßrandes zu einer steilen Wand auf, während das Gefäß rotiert. Hört die Rotation auf, so nimmt die Flüssigkeit jedoch die meisten Blasen mit. Mit dieser Anordnung, die in Abbildung 3 dargestellt ist, können Blasen bis zu einem Durchmesser von 0,12 mm erhalten werden. So erzeugt zum Beispiel eine Öffnung von 38 μm in einem dünnwandigen Rohr bei einem Druck von 190 cm Wassersäule und einer Strömungsgeschwindigkeit der Flüssigkeit von 180 cm/s an der Öffnung vorbei Blasen von 0,14 mm Durchmesser. In diesem Fall wurde ein Teller von 9,5 cm Durchmesser und einer Geschwindigkeit von 6 Umdrehungen/Sekunde verwendet. Abbildung 4 (S. 24) zeigt ein vergrößertes Bild dieser „kleinen“ Blasen und ihre Regelmäßigkeit; das Muster ist bei einem rotierenden Gefäß nicht so vollkommen wie bei einem ruhenden; betrachtet man es unter streifenden Gesichtswinkeln, so sieht man, dass die Reihen leicht unregelmäßig sind. Diese zweidimensionalen Kristalle zeigen Strukturen, deren Auftreten in Metallen vermutet wurde. Sie simulieren beobachtete Effekte wie Korngrenzen, Versetzungen und andere Fehlstellen, Gleiten, Rekristallisation, Ausglühen und Deformationen aufgrund von „Fremd“-Atomen. 3. Korngrenzen Die Abbildungen 5a, 5b und 5c (siehe S. 25f.), zeigen typische Korngrenzen für Blasen von 1,87, 0,76 bzw. 0,30 mm Durchmesser. Die Breite der gestörten Zone an der Grenze, wo die Blasen unregelmäßig verteilt sind, ist im Allgemeinen umso größer, je kleiner die Blasen sind. Abbildung 5a zeigt Stücke von mehreren benachbarten Körnern; Blasen an einer Grenze zwischen zwei Körnern haften definitiv an einer oder der anderen kristallinen Anordnung. In Abbildung 5c sieht man eine deutliche „Beilby-Schicht“ zwischen den beiden Körnern. Wie gezeigt werden wird, haben die kleinen Blasen eine größere Steifheit als die größeren, und das gibt offensichtlich Anlass zu einer größeren Unregelmäßigkeit in der Grenzzone. Getrennte Körner treten deutlich als solche hervor, wenn die Aufnahmen polykristalliner Flöße wie in den Abbildungen 5a–c sowie 12a–c (S. 37f.) unter streifendem Winkel betrachtet werden. Bei geeigneter Beleuchtung und Betrachtung unter streifendem Winkel ähnelt das schwimmende Floß von Blasen in bemerkenswerter Weise einem polierten und geätzten Metall. Es kommt oft vor, dass in einem polykristallinen Floß einige „Verunreinigungsatome“ auftreten, das heißt Blasen, die deutlich größer oder kleiner als der Durchschnitt sind. Ist dies der Fall, so befindet sich ein großer Teil von ihnen an den Korngrenzen. Es wäre nicht richtig zu sagen, dass sich die unregelmäßigen Blasen an die Grenzen bewegen; es stellt einen Nachteil des Modells dar, dass keine Diffusion von Blasen durch die Struktur möglich ist; es gibt nur gegenseitige Anpassung von Nachbarn. Anscheinend haben die Grenzen die Tendenz, sich durch das Wachstum eines Kristalls auf Kosten eines anderen so lange zu verändern, bis sie durch die unregelmäßigen Atome verlaufen. 4. Versetzungen Wird ein einzelner Kristall oder ein polykristallines Floß zusammengedrückt, gedehnt oder in anderer Weise deformiert, so zeigt es ein sehr ähnliches Verhalten wie jenes, das man sich für Metalle unter dem Einfluss von Spannungen vorstellt. Bis zu einer gewissen Grenze befindet

1.9 Das Kristallmodell von Bragg-Nye

19

sich das Modell im elastischen Bereich. Oberhalb dieses Punktes gibt es nach, indem entlang einer der drei gleich geneigten Richtungen von dicht gepackten Reihen ein Gleiten eintritt. Das Gleiten erfolgt in der Weise, dass sich die Blasen in einer Reihe gegenüber denen in der nächsten um eine Strecke weiterbewegen, die dem Abstand zwischen Nachbarn entspricht. Es ist sehr interessant, den Verlauf dieses Prozesses zu beobachten. Die Bewegung erfolgt nicht gleichzeitig entlang der ganzen Reihe, sondern beginnt an einem Ende mit dem Auftreten einer „Versetzung“, bei der sich in den Reihen auf einer Seite der Gleitlinie an einer Stelle eine Blase mehr befindet, als in den Reihen auf der anderen Seite. Diese Versetzung läuft dann von einem Ende des Kristalls entlang der Gleitlinie zum anderen, sodass schließlich ein Gleiten um eine „interatomare“ Abstandseinheit entsteht. Ein solcher Prozess wurde von Orowan, von Polanyi und von Taylor vorgeschlagen, um zu erklären, dass für das plastische Fließen in metallischen Strukturen nur schwache Kräfte erforderlich sind. Die von Taylor 1934 aufgestellte Theorie für den Mechanismus der plastischen Deformation von Kristallen untersucht die gegenseitige Wirkung und das Gleichgewicht solcher Versetzungen. Die Blasen geben ein treffendes Bild von den angenommenen Vorgängen im Metall. Manchmal schreiten die Versetzungen recht langsam voran und benötigen Sekunden, um einen Kristall zu durchqueren; in Kristallen, die nicht homogen beansprucht werden, beobachtet man auch stationäre Versetzungen. Sie haben die Form von kurzen schwarzen Linien und können in den Aufnahmen, Abbildung 12a bis 12e (S. 31ff.) gesehen werden. Wird ein polykristallines Floß zusammengedrückt, so sieht man, wie diese dunklen Linien in allen Richtungen durch den Kristall laufen. Die Abbildungen 6a, 6b und 6c (S. 26f.) zeigen Aufnahmen von Versetzungen. In Abbildung 6a, bei der der Durchmesser der Blasen 1,9 mm beträgt, ist die Versetzung räumlich begrenzt und erstreckt sich nur über etwa sechs Blasen. In Abbildung 6c (Durchmesser 0,30 mm) kann ihr Einfluss über eine Länge von ungefähr 50 Blasen verfolgt werden. Die größere Steifheit der kleinen Blasen führt zu längeren Versetzungen. Die Untersuchung einer beliebigen Menge von Blasen zeigt aber, dass es nicht zu jeder Blasengröße eine bestimmte Länge der Versetzung gibt. Die Länge hängt von der Art der Beanspruchung im Kristall ab. Eine Grenzfläche zwischen zwei Kristallen, deren entsprechende Achsen einen Winkel von ungefähr 30◦ einschließen (das ist der größte mögliche Winkel), kann als eine Folge von Versetzungen in aufeinanderfolgenden Reihen angesehen werden, und die Versetzungen sind in diesem Fall sehr kurz. Nimmt der Winkel zwischen benachbarten Kristallen ab, so treten die Versetzungen in größeren Abständen auf und werden gleichzeitig länger, bis man schließlich einzelne Versetzungen in einem großen Gebiet mit vollkommener Struktur erhält, wie das in den Abbildungen 6a, 6b und 6c gezeigt ist. Abbildung 7 (S. 27), zeigt drei parallele Versetzungen. Nennen wir sie (nach Taylor) positiv und negativ, so sind sie, wenn man von links nach rechts liest, positiv, negativ, positiv. Der Streifen zwischen den letzten beiden weist drei überzählige Blasen auf, wie man durch Betrachtung längs der Reihen in horizontaler Richtung sieht. Abbildung 8 (S. 28) zeigt eine Versetzung, die von einer Korngrenze ausgeht, ein oft beobachteter Effekt. Abbildung 9 (S. 28) zeigt eine Stelle, an der zwei Blasen den Ort einer einzigen einnehmen. Das kann als der Grenzfall positiver und negativer Versetzungen in benachbarten Reihen aufgefasst werden, wobei die zusammengedrückten Seiten der Versetzungen einander gegenüberliegen. Der entgegengesetzte Fall würde zu einem Loch in der Struktur führen, das heißt, dass am Treffpunkt der Versetzungen eine Blase fehlt. 5. Andere Typen von Fehlern Abbildung 10 (S. 28) zeigt einen schmalen Streifen zwischen Kristallen mit paralleler Orientierung. Der Streifen wird von einer Anzahl von Defektlinien gekreuzt, an denen die Blasen

20

1 Innere Geometrie von Kristallen

nicht dicht gepackt sind. An Stellen wie diesen kann eine Rekristallisation erwartet werden. Die Grenzen kommen einander nahe und der Streifen wird in ein größeres Gebiet eines vollkommenen Kristalls aufgenommen. Die Abbildungen 11a bis 11g (S. 29f.) sind Beispiele von Anordnungen, die oft an Stellen auftreten, an denen es einen lokalen Mangel an Blasen gibt. Während eine Versetzung in einer Gesamtansicht als dunkler Streifen sichtbar wird, haben diese Strukturen die Form eines V oder eines Dreiecks. Eine typische V-Struktur ist in Abbildung 11a zu sehen. Wird das Modell verzerrt, so bildet sich eine V-Struktur, indem sich zwei Versetzungen unter einem Winkel von 60◦ treffen; schreiten die Versetzungen entlang ihrer Wege fort, so wird die V-Struktur zerstört. Abbildung 11b zeigt ein kleines Dreieck, das außerdem eine Versetzung umschließt: man sieht, dass die Reihen unterhalb des Fehlers eine Blase mehr aufweisen als die oberhalb. Wird die Struktur durch Anregung einer Seite des Kristalls in schwache „thermische Bewegung“ versetzt, so verschwinden solche Defektstellen und es wird eine vollkommene Struktur gebildet. Hier und da treten in den Kristallen leere Stellen auf, an denen eine Blase fehlt, was sich in einer Gesamtansicht als schwarzer Punkt zeigt. Beispiele dafür sind in Abbildung 11g zu sehen. Eine solche Lücke kann nicht durch eine lokale Umordnung geschlossen werden, da das Ausfüllen des Loches zum Auftreten eines anderen führt. Solche Löcher treten auf und verschwinden, wenn der Kristall „kaltbearbeitet“ wird. Diese Strukturen in dem Modell lassen es naheliegend erscheinen, dass ähnliche lokale Fehler in einem realen Metall auftreten können. Sie könnten bei Prozessen wie der Diffusion oder bei Übergängen von geordneten in ungeordnete Zustände eine Rolle spielen, indem in ihrer Nachbarschaft Energiebarrieren reduziert werden, und sie könnten bei allotropen Änderungen als Kristallisationskeime wirken. 6. Rekristallisation und Ausglühen Die Abbildungen 12a bis 12e (S. 31ff.) zeigen dasselbe Floß von Blasen zu aufeinanderfolgenden Zeiten. Ein Floß, das die Oberfläche der Lösung bedeckte, wurde mit einem Glasstab heftig umgerührt und dann sich selbst überlassen. Abbildung 12a zeigt sein Aussehen ungefähr 1 s nach dem Ende des Rührens. Das Floß ist in eine Anzahl kleiner „Kristallite“ zerbrochen; diese befinden sich in einem hohen Zustand inhomogener Spannung, wie die zahlreichen Versetzungen und anderen Fehler zeigen. Das folgende Bild (Abbildung 12b) zeigt dasselbe Floß 32 s später. Die kleinen Körner haben sich zu größeren vereinigt und ein Großteil der Deformationen ist bei diesem Prozess verschwunden. Im Lauf der Zeit kommt es zur Rekristallisation; die letzten drei Aufnahmen der Reihe zeigen das Aussehen des Floßes 2, 14 und 25 min nach dem Umrühren. Es ist nicht möglich, die Umordnung über wesentlich längere Zeiten zu verfolgen, weil die Blasen nach langem Stehenlassen schrumpfen, offensichtlich infolge der Diffusion von Luft durch ihre Wände und weil sie außerdem dünn werden und zum Platzen neigen. Während dieses Prozesses wurde das Modell keiner Anregung ausgesetzt. Ein immer langsamer werdender Umordnungsprozess läuft ab, wobei die Bewegung der Blasen in einem Teil des Floßes Deformationen hervorrufen, die zu einer Umordnung in einem benachbarten Gebiet führen, das wieder auf ein weiteres einwirkt. Einige interessante Aspekte sind in dieser Abfolge zu sehen. Man beachte die drei kleinen Körner an den Punkten mit den Koordinaten AA, BB und CC. AA bleibt, wenn auch in veränderter Form, durch die ganze Folge bestehen. BB ist nach 14 min noch vorhanden, ist aber nach 25 min verschwunden, wobei vier Versetzungen zurückgeblieben sind, die innere Deformationen im Korn anzeigen. Das Korn CC schrumpft und verschwindet schließlich in Abbildung 12d, wobei ein Loch und ein V zurückbleibt, das in Abbildung 12e verschwunden ist. Zugleich ist aus der schlecht definierten Grenze bei DD in Abbildung 12d eine eindeutige in Abbildung 12e

1.9 Das Kristallmodell von Bragg-Nye

21

geworden. Man beachte auch die Ausrichtung der Korngrenze in der Nähe von EE in den Abbildungen 12 b bis e. Man sieht Versetzungen von verschiedener Länge, die alle Übergangsstadien zwischen einer leichten Krümmung der Struktur und einer definierten Grenze aufzeigen. Löcher, an denen Blasen fehlen, zeigen sich als schwarze Punkte. Einige dieser Löcher werden durch Bewegung von Versetzungen gebildet oder ausgefüllt, andere entsprechen Stellen, an denen eine Blase geplatzt ist. Viele Beispiele von V’s und einige von Dreiecken sind zu sehen. Andere interessante Aspekte sind bei Betrachtung dieser Folge von Aufnahmen evident. Die Abbildungen 13a, 13b und 13c (S. 36), zeigen ein Stück eines Floßes 1 sek, 4 sek und 4 min nach dem Rührvorgang und sind insofern interessant, als sie zwei aufeinanderfolgende Stadien im Relaxationsvorgang in Richtung auf eine vollkommenere Anordnung darstellen. Die Änderungen werden gut sichtbar, wenn man die Seite unter streifendem Gesichtswinkel betrachtet. In Abbildung 13a ist die Anordnung stark zerbrochen. In Abbildung 13b haben sich die Blasen in Reihen angeordnet, aber die Krümmung dieser Reihen zeigt, dass große innere Deformationen bestehen. In Abbildung 13c hat diese Deformation durch Bildung einer neuen Grenze bei A − −A nachgelassen, die Reihen auf beiden Seiten sind nun gerade. Es scheint, dass die Energie dieses deformierten Kristalls größer als die der interkristallinen Grenze ist. Die Aufnahmen von Abbildung 13 verdanken wir der Firma Kodak. Sie wurden bei der Herstellung des unten erwähnten Films gemacht. 7. Die Auswirkung eines Fremdatoms Abbildung 14 (S. 37) zeigt den ausgedehnten Effekt einer Blase mit falscher Größe. Vergleicht man diese Abbildung mit den in den Abbildungen 2 und 4 (S. 23f.) gezeigten Flößen, so sieht man, dass drei Blasen, eine größer und zwei kleiner als normal, die Regelmäßigkeit der Reihen über die gesamte Abbildung hinweg stören. Wie bereits erwähnt wurde, treten Blasen mit anomaler Größe im Allgemeinen an den Korngrenzen auf, an denen Löcher von irregulären Abmessungen entstehen, in denen sie Platz finden. 8. Mechanische Eigenschaften des zweidimensionalen Modells Die mechanischen Eigenschaften eines zweidimensionalen vollkommenen Floßes wurden in der bereits erwähnten Arbeit beschrieben (Bragg 1942b). Das Floß liegt zwischen zwei parallelen Federn, die horizontal in die Seifenlösung eintauchen. Der Abstand der Federn wird dem Abstand der Blasenreihen angepasst, die sich dann fest an sie anfügen. Eine Feder kann mithilfe einer Mikrometerschraube parallel zu sich selbst verschoben werden, und die andere wird durch zwei dünne vertikale Glasfasern unterstützt. Die Scherspannung kann über die Verbiegung der Glasfasern gemessen werden. Wird das Floß einer Scherbeanspruchung ausgesetzt, so folgt es dem hookeschen Gesetz der Elastizitätstheorie, bis die Elastizitätsgrenze erreicht wird. Es gleitet dann längs einer Zwischenreihe um einen Betrag, der dem Durchmesser einer Blase entspricht. Die elastische Scherung und das Gleiten können mehrere Male wiederholt werden. Die Elastizitätsgrenze wird ungefähr erreicht, wenn eine Seite des Floßes gegenüber der anderen um einen Betrag verschert ist, der einem Blasendurchmesser entspricht. Dieser Sachverhalt unterstützt die Annahme, die der Berechnung der Elastizitätsgrenze eines Metalls durch einen der Autoren zugrunde gelegt wurde (Bragg 1942a); dort wurde angenommen, dass jeder Kristallit in einem kalt bearbeiteten Metall nur dann nachgibt, wenn die Deformation in ihm ein solches Ausmaß erreicht hat, dass durch das Gleiten Energie freigesetzt wird. Von M. M. Nicolson wurde eine Berechnung der Kräfte zwischen den Blasen vorgenommen, die in Kürze veröffentlicht werden wird. Sie zeigt zwei interessante Aspekte. Die Kurve für die Abhängigkeit der potentiellen Energie vom Abstand zwischen den Mittelpunkten ist den entsprechenden Kurven für Atome sehr ähnlich. Sie hat ein Minimum bei einem Abstand zwischen

22

1 Innere Geometrie von Kristallen

den Mittelpunkten, der etwas kleiner als der Durchmesser einer freien Blase ist und steigt für kleinere Abstände steil an. Die Steigung ist außerdem für Blasendurchmesser von 0,1 mm extrem groß, hingegen für Durchmesser von 1 mm bedeutend kleiner. Das bestätigt den aus dem Modell erhaltenen Eindruck, dass sich kleine Blasen viel steifer verhalten als große. 9. Dreidimensionale Anordnungen Sorgt man dafür, dass sich die Blasen in mehrfachen Schichten an der Oberfläche ansammeln, so bilden sie einen Block aus dreidimensionalen „Kristallen“ mit einer der Anordnungen dichtester Packung. Abbildung 15 (S. 37), zeigt eine Schrägansicht eines solchen Blocks; ihre Ähnlichkeit mit einer polierten und geätzten Metalloberfläche ist bemerkenswert. In Abbildung 16 (S. 38) ist ein ähnlicher Block von oben gesehen dargestellt. Teile der Struktur liegen mit Sicherheit in dichtester kubischer Packung vor, wobei die äußere Oberfläche der (111)- oder (100)-Fläche entspricht. Abbildung 17a (S. 39) zeigt eine (111)-Fläche. Die Umrisse der drei Blasen, auf denen jede oberste Blase aufliegt, sind deutlich sichtbar, und die nächste Lage dieser Blasen kann an einer Stelle schwach gesehen werden, die nicht unterhalb der obersten Schicht liegt, was zeigt, dass die Packung der (111)-Ebenen die bekannte kubische Abfolge aufweist. Abbildung 17d (S. 40) zeigt eine (100)-Fläche, bei der jede Blase auf vier anderen aufliegt. Die Würfelachsen sind natürlich zu den dicht gepackten Reihen der Oberflächenschicht um 45◦ geneigt. Abbildung 17c (S. 40) zeigt einen Zwilling bezüglich der Fläche (111) in der kubischen Struktur. Die obersten Flächen sind (111) und (100) und schließen miteinander einen kleinen Winkel ein, was aus der Abbildung nicht ersichtlich ist; das zeigt sich aus einer Schrägansicht. Abbildung 17d scheint sowohl die kubische als auch die hexagonale Abfolge von dicht gepackten Ebenen zu zeigen; es ist jedoch schwierig nachzuprüfen, ob die linke Seite der wirklichen hexagonalen Struktur dichter Packung folgt, weil es nicht sicher ist, dass die Anordnung an dieser Stelle eine Dicke von mehr als zwei Lagen hat. Viele Beispiele von Zwillingen und von interkristallinen Grenzen können in Abbildung 16 (S. 38), gesehen werden. Abbildung 18 (S. 41) zeigt mehrere Versetzungen in einer dreidimensionalen Struktur, die einer Biegungsbeanspruchung unterworfen wurde. 10. Demonstration des Modells Mithilfe der Firma Kodak wurde ein 16 mm Film aufgenommen, der die Bewegungen der Versetzungen und Korngrenzen zeigt, die auftreten, wenn einzelne Kristalle und polykristalline Flöße geschert, zusammengedrückt oder gedehnt werden. Wird die Seifenlösung in ein Glasgefäß mit flachem Boden gebracht, so ist das Modell selbst für eine Dia-Projektion auf eine große Fläche geeignet. Da für die Erzeugung der Blasen eine bestimmte Tiefe notwendig ist und da die Lösung ziemlich trüb ist, ist es günstig, die Projektion durch einen Glaskörper am Boden des Gefäßes durchzuführen, der bis knapp unter die Oberfläche reicht. Zum Abschluss möchten wir Herrn C.E. Harrold vom King’s College, Cambridge, danken, der einige der Pipetten hergestellt hat, mit denen die Blasen erzeugt wurden. Literatur Bragg, W.L. 1942a Nature, 149, 511. Bragg, W.L. 1942b J. Sci. Instrum. 19, 148. Taylor, G.I. 1934 Proc. Roy. Soc. A, 145, 362.

1.9 Das Kristallmodell von Bragg-Nye

Abbildung 2: Vollkommenes kristallines Floß von Blasen. Durchmesser 1,41 mm.

23

24

1 Innere Geometrie von Kristallen

Abbildung 4: Vollkommenes kristallines Floß von Blasen. Durchmesser 0,30 mm.

1.9 Das Kristallmodell von Bragg-Nye

25 Korngrenzen

Abbildung 5a: Durchmesser 1,87 mm.

Abbildung 5b: Durchmesser 0,76 mm.

26

1 Innere Geometrie von Kristallen

Abbildung 5c: Durchmesser 0,30 mm.

Versetzungen

Abbildung 6a: Eine Versetzung. Durchmesser 1,9 mm.

1.9 Das Kristallmodell von Bragg-Nye

Abbildung 6b: Durchmesser 0,76 mm.

Abbildung 6c: Durchmesser 0,30 mm.

Abbildung 7: Parallelversetzungen. Durchmesser 0,76 mm.

27

28

1 Innere Geometrie von Kristallen

Abbildung 8: Von einer Korngrenze ausgehende Versetzung. Durchmesser 0,30 mm.

Abbildung 9: Versetzungen in benachbarten Reihen. Durchmesser 1,9 mm.

Abbildung 10: Reihen von fehlerhaften Linien zwischen zwei Gebieten mit paralleler Orientierung. Durchmesser 0,30 mm.

1.9 Das Kristallmodell von Bragg-Nye

29

a: Durchmesser 0,68 mm.

b: Durchmesser 0,68 mm.

c: Durchmesser 0,6 mm.

d: Durchmesser 0,30 mm.

Abbildung 11: Typen von Defekten

30

1 Innere Geometrie von Kristallen

e: Durchmesser 0,6 mm.

f: Durchmesser 0,6 mm.

g: Durchmesser 0,68 mm. Abbildung 11: Typen von Defekten

1.9 Das Kristallmodell von Bragg-Nye

a: Unmittelbar nach dem Umrühren.

Abbildung 12: Rekristallisation. Durchmesser 0,60 mm.

31

32

1 Innere Geometrie von Kristallen

b: Nach 33 sek.

Abbildung 12: Rekristallisation. Durchmesser 0,60 mm.

1.9 Das Kristallmodell von Bragg-Nye

33

c: Nach 2 min.

Abbildung 12: Rekristallisation. Durchmesser 0,60 mm.

34

1 Innere Geometrie von Kristallen

d: Nach 14 min.

Abbildung 12: Rekristallisation. Durchmesser 0,60 mm.

1.9 Das Kristallmodell von Bragg-Nye

35

e: Nach 25 min.

Abbildung 12: Rekristallisation. Durchmesser 0,60 mm.

36

1 Innere Geometrie von Kristallen

a: Nach 1 sek.

b: Nach 4 sek.

c: Nach 4 min. Abbildung 13: Zwei Stadien der Rekristallisation. Durchmesser 1,64 mm.

1.9 Das Kristallmodell von Bragg-Nye

37

Abbildung 14: Auswirkung von Fremdatomen. Durchmesser der gleichmäßigen Blasen ungefähr 1,3 mm.

Abbildung 15: Schrägansicht eines dreidimensionalen Floßes.

38

1 Innere Geometrie von Kristallen

Abbildung 16: Ein dreidimensionales Floß von von oben gesehen. Durchmesser 0,70 mm.

1.9 Das Kristallmodell von Bragg-Nye

39

a: (111)-Fläche.

b: (100)-Fläche Flächenzentrierte kubische Struktur Abbildung 17

40

1 Innere Geometrie von Kristallen

c: Zwilling gegenüber (111), kubische Struktur.

d: Eventuelles Beispiel einer hexagonalen dichten Packung. Durchmesser 0,70 mm. Abbildung 17

1.9 Das Kristallmodell von Bragg-Nye

Abbildung 18: Versetzungen in einer dreidimensionalen Struktur. Durchmesser 0,70 mm.

41

2

Tensoren

Siehe auch: Band I, Kapitel 11, Vektoren Band I, Kapitel 20, Drehbewegung im Raum

2.1

Der Polarisationstensor

Physiker haben die Angewohnheit, bei allen Phänomenen immer nur das einfachste Beispiel herauszugreifen; sie nennen das „Physik“ und überlassen die schwierigeren Dinge den Zuständigen für andere Gebiete – etwa der angewandten Mathematik, der Elektrotechnik, der Chemie oder der Kristallographie. Sogar die Festkörperphysik ist eigentlich nur zur Hälfte Physik, denn sie befasst sich zu sehr mit speziellen Substanzen. Wir lassen daher viele interessante Dinge in dieser Vorlesung aus. Eine wichtige Eigenschaft der Kristalle – und der meisten Substanzen – besteht zum Beispiel darin, dass ihre elektrische Polarisierbarkeit in verschiedenen Richtungen unterschiedlich ist. Legen Sie an eine Substanz ein Feld in einer beliebigen Richtung an, so bewirkt das eine kleine Verschiebung der atomaren Ladungen und es wird ein Dipolmoment erzeugt; der Betrag des Moments hängt aber stark von der Feldrichtung ab. Natürlich macht das die Dinge schwieriger. In der Physik beginnen wir aber gewöhnlich mit dem speziellen Fall, in dem die Polarisierbarkeit in allen Richtungen die gleiche ist, was das Leben einfacher macht. Die anderen Fälle sind Aufgabe der betreffenden Fachgebiete. Infolgedessen ist das, was wir in diesem Kapitel besprechen, für unsere weitere Arbeit in keiner Hinsicht von Belang. Für die Beschreibung der Eigenschaften von richtungsabhängigen Substanzen ist die Mathematik der Tensoren besonders gut geeignet – obwohl das nur ein Beispiel für ihre Verwendbarkeit ist. Da die meisten von Ihnen nicht Physiker werden wollen, sondern später vor reale Aufgaben gestellt werden, bei denen die Verhältnisse stark von der Richtung abhängen, werden Sie früher oder später Tensoren benutzen müssen. Damit nichts zu kurz kommt, beschreiben wir jetzt Tensoren, allerdings nicht allzu ausführlich. Wir, die Autoren, wollen das Gefühl haben, dass unsere Darlegung der Physik vollständig ist. Zum Beispiel ist unsere Darlegung der Elektrodynamik vollständig – so vollständig wie jede andere Vorlesung über Elektrizität und Magnetismus, selbst eine für Fortgeschrittene. Unsere Darlegung der Mechanik ist dagegen nicht vollständig, weil wir sie zu einem Zeitpunkt behandelt haben, als Ihre Mathematikkenntnisse es noch nicht zuließen, dass wir Themen wie das Prinzip der kleinsten Wirkung, die LagrangeFunktion oder die Hamilton-Funktion besprechen, mit denen sich die Mechanik auf elegantere Weise darstellen lässt. Aber abgesehen von der allgemeinen Relativitätstheorie haben wir alle Gesetze der Mechanik behandelt. Bei der Quantenmechanik wird das natürlich nicht der Fall sein – es muss ja auch noch etwas für die Zukunft bleiben. Aber Sie sollten zumindest wissen, was ein Tensor ist. In Kapitel 1 haben wir gesagt, dass die Eigenschaften kristalliner Substanzen in verschiedenen Richtungen unterschiedlich sind – wir sagen, sie sind anisotrop. Die Änderung des induzierten

44

2 Tensoren

Dipolmoments mit der Richtung des angelegten elektrischen Feldes ist nur ein Beispiel, aber dieses wollen wir als Modellfall benützen. Nehmen wir an, dass bei vorgegebener Richtung des elektrischen Feldes das induzierte Dipolmoment pro Volumeneinheit P proportional zur Stärke des angelegten Feldes E ist. (Für viele Substanzen ist das eine gute Näherung, wenn E nicht zu groß ist.) Bezeichnen wir die Proportionalitätskonstante mit α.1 Wir wollen nun Substanzen betrachten, in denen α von der Richtung des angelegten Feldes abhängt, zum Beispiel Kristalle wie Kalkspat, bei denen man doppelte Bilder sieht, wenn man durch sie hindurchschaut. Nehmen wir an, wir stellen bei einem speziellen Kristall fest, dass ein elektrisches Feld E1 in der x-Richtung eine Polarisation P1 in der x-Richtung hervorruft. Dann stellen wir fest, dass ein elektrisches Feld E2 in der y-Richtung, das dieselbe Stärke wie E1 hat, eine andere Polarisation P2 in der y-Richtung hervorruft. Was würde passieren, wenn wir ein elektrisches Feld im Winkel von 45◦ dazu anlegten? Dabei handelt es sich um eine Überlagerung von zwei Feldern in Richtung der x- und y-Achsen und folglich wird die Polarisation P die Vektorsumme von P1 und P2 sein, wie das in Abbildung 2.1 (a) dargestellt ist. Die Polarisation hat nun nicht mehr dieselbe Richtung wie das elektrische Feld. Sie können sehen, wie das zustande kommen kann. Es kann Ladungen geben, die sich leicht auf und ab bewegen, die sich aber ziemlich steif verhalten, wenn sie sich seitwärts bewegen sollen. Wird eine Kraft im Winkel von 45◦ ausgeübt, so bewegen sich die Ladungen stärker nach oben als zur Seite. Die Verschiebungen haben nicht die Richtung der äußeren Kraft, denn es gibt innere elastische Kräfte, die unsymmetrisch sind.

E2

P2

E

E

E2

P P2

P

P1 P1

(a)

E1

E1 (b)

Abb. 2.1: Die Vektoraddition von Polarisationen in einem anisotropen Kristall.

Die 45◦ haben natürlich nichts Besonderes zu bedeuten. Es ist allgemein richtig, dass die induzierte Polarisation eines Kristalls nicht in der Richtung des elektrischen Feldes liegt. In unserem oben angeführten Beispiel haben wir „Glück“ gehabt, als wir unsere x- und y-Achsen so wählten, dass Pi sowohl in der x- als auch in der y-Richtung parallel zu Ei lag. Hätten wir den Kristall in Bezug auf die Koordinatenachsen gedreht, so hätte das elektrische Feld E2 in der y-Richtung eine Polarisation P2 mit einer x- und einer y-Komponente erzeugt. Ebenso würde das elektrische Feld in der x-Richtung eine Polarisation mit einer x- und einer y-Komponente erzeugen. Die Polarisationen wären dann wie in Abbildung 2.1 (b) und nicht wie in 2.1 (a). Die Verhältnisse werden komplizierter – aber für jedes Feld E gilt, dass der Betrag von P proportional zum Betrag von E ist. 1

In Band III, Abschnitt 10.4 sind wir der üblichen Konvention gefolgt: wir setzten P = �0 χE und nannten χ („chi“) die „Suszeptibilität“. Hier ist es jedoch besser, wenn wir nur ein Symbol verwenden und deshalb α für �0 χ schreiben. Für isotrope Dielektrika ist α = (κ − 1)�0 , wobei κ die Dielektrizitätskonstante ist.

2.2 Transformation von Tensorkomponenten

45

Besprechen wir nun den allgemeinen Fall, in dem ein Kristall bezüglich der Koordinatenachsen beliebig ausgerichtet ist. Ein elektrisches Feld in der x-Richtung bewirkt eine Polarisation P mit x-, y- und z-Komponenten; wir können dann schreiben P x = α xx E x ,

Py = αyx E x ,

Pz = αzx E x .

(2.1)

Damit ist lediglich gesagt, dass ein elektrisches Feld in der x-Richtung nicht eine Polarisation in derselben Richtung hervorrufen muss, sondern dass diese vielmehr eine x-, eine y- und eine z-Komponente hat – die alle proportional zu E x sind. Wir bezeichnen die Proportionalitätskonstanten mit α xx , αyx , und αzx (der erste Buchstabe bezieht sich auf die betreffende Komponente von P, der zweite auf die Richtung des elektrischen Feldes). In der gleichen Weise schreiben wir für ein elektrisches Feld in der y-Richtung P x = α xy Ey ,

Py = αyy Ey ,

Pz = αzy Ey ;

(2.2)

Pz = αzz Ez .

(2.3)

und für ein elektrisches Feld in der z-Richtung P x = α xz Ez ,

Py = αyz Ez ,

Wir hatten gesagt, dass die Polarisation linear von den Feldern abhängt; hat daher ein elektrisches Feld E sowohl eine x- als auch eine y-Komponente, so ist die resultierende x-Komponente von P die Summe der beiden P x aus (2.1) und (2.2). Liegen die Komponenten von E entlang der x-, y- und z-Achsen, so sind die resultierenden Komponenten von P die Summe der drei Beiträge aus (2.1), (2.2) und (2.3). Mit anderen Worten: P ist gegeben durch P x = α xx E x + α xy Ey + α xz Ez , Py = αyx E x + αyy Ey + αyz Ez , Pz = αzx E x + αzy Ey + αzz Ez .

(2.4)

Das dielektrische Verhalten des Kristalls wird dann durch die neun Größen (α xx , α xy , α xz , αyx , . . . ) vollständig beschrieben; wir können das durch das Symbol αi j darstellen. (Die Indizes i, j stehen für jeweils einen der drei Buchstaben x, y, z.) Jedes elektrische Feld E kann in seine drei Komponenten E x , Ey und Ez zerlegt werden; daraus kann man mithilfe von αi j die Komponenten P x , Py und Pz berechnen, die zusammen die Gesamtpolarisation P ergeben. Das System von neun Koeffizienten αi j nennt man einen Tensor – in diesem Fall den Tensor der Polarisierbarkeit. Ebenso wie wir gesagt haben, dass die drei Zahlen (E x , Ey , Ez ) „den Vektor E bilden“, sagen wir nun, dass die neun Zahlen (α xx , α xy , . . . ) „den Tensor αi j bilden“.

2.2

Transformation von Tensorkomponenten

Sie wissen, dass bei einem Übergang zu einem anderen Koordinatensystem x , y und z die Komponenten E x , Ey und Ez des Vektors völlig andere sind – und desgleichen die Komponenten von P. Infolgedessen sind alle Koeffizienten αi j in jedem Koordinatensystem anders. Sie können im Übrigen sehen, wie sich die αi j ändern müssen, indem Sie die Komponenten von E und P in der richtigen Weise ändern, denn wenn wir dasselbe physikalische elektrische Feld

46

2 Tensoren

in dem neuen Koordinatensystem beschreiben, müssen wir dieselbe Polarisation erhalten. Für jedes neue Koordinatensystem ist P x eine Linearkombination von P x , Py und Pz : P x = aP x + bPy + cPz , und das Entsprechende gilt für die anderen Komponenten. Drücken Sie P x , Py und Pz durch E x , Ey und Ez aus und verwenden dabei (2.4), so erhalten Sie P x = a(α xx E x + α xy Ey + α xz Ez ) + b(αyx E x + αyy Ey + αyz Ez ) + c(αzx E x + αzy Ey + αzz Ez ). Dann drücken Sie E x , Ey und Ez durch E x , Ey und Ez aus; zum Beispiel E x = a  E x + b  E y  + c E z  , wobei a , b , c von a, b, c abhängen, aber nicht mit ihnen übereinstimmen. Sie haben also P x , ausgedrückt durch E x , Ey und Ez ; das heißt, Sie haben das neue αi j . Das ist zwar etwas umständlich, aber folgerichtig. Wenn wir von der Änderung der Achsen sprechen, so nehmen wir an, dass der Kristall im Raum fixiert bleibt. Würde der Kristall mit den Achsen gedreht, so blieben die αi j unverändert. Im Gegensatz dazu erhielten wir aber ein neues System αi j , wenn wir die Richtung des Kristalls bezüglich der Achsen änderten. Sind sie jedoch für eine beliebige Richtung des Kristalls bekannt, so lassen sie sich mithilfe der eben beschriebenen Transformation für jede andere Richtung berechnen. Mit anderen Worten: Die dielektrische Eigenschaft eines Kristalls ist vollständig beschrieben, wenn wir die Komponenten des Polarisationstensors αi j relativ zu einem beliebig gewählten Achsensystem angeben. Ebenso wie wir einem Teilchen einen Geschwindigkeitsvektor v = (v x , vy , vz ) zuordnen können und wissen, dass sich die Komponenten bei Drehung der Koordinatenachsen in einer bestimmten Weise ändern, so ordnen wir auch einem Kristall einen Polarisationstensor αi j zu, dessen neun Komponenten sich bei Änderung des Koordinatensystems in einer bestimmten Weise transformieren. Die in (2.4) formulierte Relation zwischen P und E kann in die folgende kompaktere Form gebracht werden:  Pi = αi j E j . (2.5) j

Dabei steht i für x, y oder z und es wird die Summe über j = x, y und z gebildet. Man hat viele spezielle Notationen für Tensoren erfunden, von denen sich aber jede nur für eine begrenzte Klasse von Problemen eignet. Eine der üblichen Konventionen ist, das Summenzeichen  ( ) in (2.5) wegzulassen, wobei als bekannt vorausgesetzt wird, dass über einen Index, der zweimal vorkommt (hier j), die Summe gebildet werden muss. Da wir Tensoren nur selten verwenden werden, ist es nicht erforderlich, uns für die eine oder die andere spezielle Notation oder Konvention zu entscheiden.

2.3

Das Energieellipsoid

Wir müssen uns nun etwas an den Gebrauch von Tensoren gewöhnen. Stellen wir uns die interessante Frage: Welche Energie ist notwendig, um den Kristall zu polarisieren (zusätzlich zu der

2.3 Das Energieellipsoid

47

Energie des elektrischen Feldes, von der wir wissen, dass sie �0 E 2 /2 pro Volumeneinheit ist)? Betrachten wir kurz die atomaren Ladungen, die verschoben werden. Die Arbeit, die bei einer Verschiebung der Ladung q um eine Strecke dx geleistet wird, ist qE x dx; sind N Ladungen pro Volumeneinheit vorhanden, so beträgt die geleistete Arbeit qE x Ndx. Aber qNdx ist die Änderung dP x des Dipolmoments pro Volumeneinheit. Die pro Volumeneinheit notwendige Energie ist daher E x dP x . Durch Addition der Arbeit für die drei Feldkomponenten erhält man pro Volumeneinheit die Arbeit E · d P. Da der Betrag von P proportional zu E ist, ist die Arbeit, die pro Volumeneinheit geleistet wird, um die Polarisation von 0 auf P zu erhöhen, gleich dem Integral von E · dP. Bezeichnen wir diese Arbeit mit u p ,2 so erhalten wir  uP = 21 E · P = 12 E i Pi . (2.6) i

Nun können wir P mithilfe von (2.5) durch E ausdrücken, und das ergibt  αi j Ei E j . uP = 12 i

(2.7)

j

Die Energiedichte uP ist eine Zahl, die unabhängig von der Wahl der Achsen ist; es handelt sich also um einen Skalar. Ein Tensor hat somit die Eigenschaft, dass er einen neuen Vektor ergibt, wenn er über einen Index (mit einem Vektor) summiert wird, und dass er einen Skalar ergibt, wenn er über beide Indizes (mit zwei Vektoren) summiert wird. Der Tensor αi j müsste eigentlich genauer als „Tensor zweiter Stufe“ bezeichnet werden, denn er hat zwei Indizes. Ein Vektor – mit nur einem Index – ist ein Tensor erster Stufe und ein Skalar – ohne Index – ist ein Tensor nullter Stufe. Wir sagen daher, dass das elektrische Feld E ein Tensor erster Stufe und die Energiedichte uP ein Tensor nullter Stufe ist. Man kann den Begriff eines Tensors auf drei oder vier Indizes erweitern und so Tensoren von höherer als zweiter Stufe konstruieren. Die Indizes des Polarisationstensors können drei mögliche Werte annehmen – es handelt sich um Tensoren in drei Dimensionen. Die Mathematiker betrachten Tensoren in vier, fünf und mehr Dimensionen. Einen vierdimensionalen Tensor Fμv haben wir bereits in unserer relativistischen Beschreibung des elektromagnetischen Feldes (Band III, Kapitel 26) verwendet. Der Polarisationstensor αi j hat die interessante Eigenschaft, symmetrisch zu sein, das heißt α xy = αyx , und analog für jedes andere Paar von Indizes. (Dies ist eine physikalische Eigenschaft eines realen Kristalls, aber nicht zwangsläufig die eines jeden Tensors.) Sie können sich 2

Diese Arbeit, die geleistet wird, um die Polarisation durch ein elektrisches Feld zu erzeugen, darf nicht mit der potentiellen Energie – p0 · E eines permanenten Dipolmoments p0 verwechselt werden.

48

2 Tensoren

davon überzeugen, dass das richtig ist, wenn Sie die Energieänderung eines Kristalls in der folgenden Reihenfolge berechnen: (1) Sie schalten ein Feld in der x-Richtung ein; (2) Sie schalten ein Feld in der y-Richtung ein; (3) Sie schalten das x-Feld ab; (4) Sie schalten das y-Feld ab. Der Kristall befindet sich dann wieder in seinem Ausgangszustand und die gesamte bei der Polarisierung geleistete Arbeit muss null sein. Sie können aber zeigen, dass dies nur dann richtig ist, wenn α xy gleich αyx ist. Dieselbe Überlegung trifft natürlich auch für α xz usw. zu. Somit ist also der Polarisationstensor symmetrisch. Das bedeutet gleichzeitig, dass der Polarisationstensor ausgemessen werden kann, indem man einfach die Energie misst, die für die Polarisation des Kristalls in verschiedenen Richtungen erforderlich ist. Legen wir ein E-Feld mit nur einer x- und einer y-Komponente an, so ist laut (2.7)   uP = 21 α xx E 2x + (α xy + αyx )E x Ey + αyy Ey2 . (2.8)

Mit E x allein können wir α xx bestimmen; mit Ey allein können wir αyy bestimmen; mit sowohl E x als auch Ey erhalten wir eine zusätzliche Energie, die auf dem Ausdruck mit (α xy + αyx ) beruht. Da α xy und αyx aber gleich sind, ist dieser Ausdruck 2α xy und kann mit der Energie verknüpft werden. Der Energieausdruck (2.8) hat eine hübsche geometrische Interpretation. Fragen wir uns, welche Felder E x und Ey einer vorgegebenen Energiedichte entsprechen – etwa uo . Mathematisch gesehen ist das die Lösung der Gleichung α xx E 2x + 2α xy E x Ey + αyy Ey2 = 2u0 .

Diese Gleichung ist eine quadratische Gleichung; wenn wir daher E x und Ey graphisch darstellen, sind alle Lösungen dieser Gleichung Punkte auf einer Ellipse (Abbildung 2.2). (Es muss sich um eine Ellipse und nicht um eine Parabel oder eine Hyperbel handeln, denn die Energie ist für jedes Feld immer positiv und endlich.) Der Vektor E mit seinen Komponenten E x und Ey kann vom Ursprung bis zu einem Punkt auf der Ellipse gezeichnet werden. Insofern ist eine solche „Energieellipse“ eine hübsche Form, sich den Polarisationstensor „vorzustellen“. Verallgemeinern wir das nun auf drei Komponenten, so wird der beliebig gerichtete elektrische Vektor E, der zu einer Einheit der Energie führt, in einem Punkt enden, der auf einem Ellipsoid liegt, vgl. Abbildung 2.3. Die Form dieses Ellipsoids konstanter Energie charakterisiert die tensorielle Polarisierbarkeit in eindeutiger Weise.

Ey

E Ex

Abb. 2.2: Lage des Vektors E = (E x , Ey ), der eine konstante Polarisationsenergie erzeugt.

2.3 Das Energieellipsoid

49

a b

Abb. 2.3: Das Energieellipsoid des Polarisationstensors.

c

Nun hat ein Ellipsoid die schöne Eigenschaft, dass zu seiner Beschreibung nur die Richtungen der drei „Hauptachsen“ und die Durchmesser der Ellipse entlang dieser Achsen angegeben werden müssen. Die drei „Hauptachsen“ sind die beiden Richtungen des längsten und des kürzesten Durchmessers und die zu den beiden ersteren senkrechte dritte Richtung. Sie sind in Abbildung 2.3 durch a, b und c angezeigt. In Bezug auf diese Achsen ist die Gleichung des Ellipsoids besonders einfach αaa Ea2 + αbb Eb2 + αcc Ec2 = 2u0 . In Bezug auf die Hauptachsen sind also nur drei Komponenten des dielektrischen Tensors ungleich null: αaa , αbb und αcc . Damit ist gesagt, dass es auch bei einem noch so komplizierten Kristall immer möglich ist, ein System von drei Achsen zu wählen (nicht notwendigerweise die Achsen des Kristalls), für die der Polarisationstensor nur drei Komponenten hat. Mit einem solchen Achsensystem wird aus 2.4) einfach Pa = αaa Ea ,

Pb = αbb Eb ,

Pc = αcc Ec .

(2.9)

Ein elektrisches Feld in Richtung einer der drei Hauptachsen bewirkt eine Polarisation entlang derselben Achse, aber die Koeffizienten für die drei Achsen können natürlich verschieden sein. Ein Tensor wird häufig dargestellt, indem man die neun Komponenten als Tabelle in eckigen Klammern schreibt ⎡ ⎤ α xy α xz ⎥⎥ ⎢⎢⎢α xx ⎥⎥ ⎢⎢⎢ αyy αyz ⎥⎥⎥⎥ . (2.10) ⎢⎢⎢αyx ⎥⎦ ⎣ αzx αzy αzz

Für die Hauptachsen a, b und c sind nur die diagonalen Komponenten ungleich null; man sagt dann, „der Tensor ist diagonal“. Der vollständige Tensor ist dann ⎡ ⎢⎢⎢αaa ⎢⎢⎢ ⎢⎢⎢ 0 ⎣ 0

0 αbb 0

⎤ 0 ⎥⎥ ⎥⎥ 0 ⎥⎥⎥⎥ . ⎥⎦ αcc

(2.11)

Dabei ist wichtig, dass man jeden Polarisationstensor (de facto jeden symmetrischen Tensor zweiter Stufe in beliebig vielen Dimensionen) durch die Wahl geeigneter Koordinatenachsen auf diese Form bringen kann.

50

2 Tensoren

Sind die drei Elemente des Polarisationstensors in Diagonalform alle gleich, das heißt αaa = αbb = αcc = α,

(2.12)

so wird aus dem Energieellipsoid eine Kugel, und die Polarisierbarkeit ist in allen Richtungen die gleiche. Die Substanz ist dann isotrop. In tensorieller Bezeichnungsweise ist (2.13)

αi j = αδi j , wobei δi j der Einheitstensor ist: ⎡ ⎢⎢⎢1 δi j = ⎢⎢⎢⎢⎣0 0

0 1 0

δi j = 1 δi j = 0

für i = j; für i  j.

Das bedeutet natürlich

⎤ 0⎥⎥ ⎥ 0⎥⎥⎥⎥ . ⎦ 1

(2.14)

(2.15)

Der Tensor δi j wird oft als „Kronecker-Symbol“ bezeichnet. Zu Ihrer Unterhaltung können Sie beweisen, dass der Tensor (2.14) genau diese Form hat, wenn Sie das Koordinatensystem in ein anderes rechtwinkliges System abändern. Der Polarisationstensor (2.13) ergibt � Pi = α δi j E j = αEi , j

was mit unserem früheren Resultat für isotrope Dielektrika übereinstimmt: P = α E. Die Form und die Richtung des Polarisationsellipsoids können manchmal zu den Symmetrieeigenschaften des Kristalls in Beziehung gesetzt werden. In Kapitel 1 haben wir gesagt, dass es in einem dreidimensionalen Gitter 230 verschiedene innere Symmetrien geben kann und dass sie sich je nach der Form der Einheitszelle für viele Zwecke bequem in sieben Gruppen einteilen lassen. Nun muss aber das Ellipsoid der Polarisierbarkeit dieselben geometrischen inneren Symmetrien wie der Kristall haben. Ein trikliner Kristall hat zum Beispiel nur wenige Symmetrien – das Ellipsoid der Polarisierbarkeit hat dann ungleiche Achsen, die im Allgemeinen nicht mit denen des Kristalls zusammenfallen. Hingegen gilt für einen monoklinen Kristall, dass seine Eigenschaften unverändert bleiben, wenn er um 180◦ um eine Achse gedreht wird. Daher muss der Polarisationstensor nach einer solchen Drehung derselbe sein. Daraus folgt, dass das Ellipsoid der Polarisierbarkeit nach einer Drehung um 180◦ in sich übergehen muss. Das kann nur dann geschehen, wenn eine der Achsen des Ellipsoids dieselbe Richtung wie die Symmetrieachse des Kristalls hat. Ansonsten gibt es für die anderen Richtungen und für die Dimensionen des Ellipsoids keine Einschränkungen. Bei einem rhombischen Kristall müssen aber die Achsen des Ellipsoids denen des Kristalls entsprechen, denn eine Drehung von 180◦ um eine der drei Achsen führt immer zu dem gleichen Gitter. Bei einem tetragonalen Kristall muss die Ellipse dieselbe Symmetrie und folglich zwei

2.4 Andere Tensoren; der Trägheitstensor

51

gleiche Durchmesser haben. Bei einem kubischen Kristall müssen dann schließlich alle drei Durchmesser des Ellipsoids gleich sein; er wird zu einer Kugel, und die Polarisierbarkeit des Kristalls ist in allen Richtungen die gleiche. Es gibt einen Hochleistungssport, der darin besteht, für alle möglichen Symmetrien eines Kristalls die möglichen Typen von Tensoren herauszufinden. Man nennt das die „gruppentheoretische“ Analyse. Für den einfachen Fall des Polarisationstensors ist es aber verhältnismäßig leicht zu sehen, wie die Relationen aussehen müssen.

2.4

Andere Tensoren; der Trägheitstensor

Es gibt in der Physik viele Beispiele für Tensoren. So kommt es in einem Metall bzw. in einem beliebigen Leiter häufig vor, dass die Stromdichte j annähernd proportional zum elektrischen Feld E ist; die Proportionalitätskonstante heißt die Leitfähigkeit σ: j = σ E. Bei Kristallen ist die Relation zwischen j und E jedoch komplizierter; die Leitfähigkeit ist nicht in allen Richtungen die gleiche. Die Leitfähigkeit ist ein Tensor und wir schreiben  ji = σi j E j . Ein anderes Beispiel für einen physikalischen Tensor ist das Trägheitsmoment. In Kapitel 18 von Band I haben wir gesehen, dass bei einem starren Körper, der um eine feste Achse gedreht wird, der Drehimpuls L proportional zur Winkelgeschwindigkeit ω ist und wir haben den Proportionalitätsfaktor I das Trägheitsmoment genannt: L = Iω. Für einen starren Körper von beliebiger Form hängt das Trägheitsmoment von der Richtung der Rotationsachse ab. Zum Beispiel hat ein rechteckiger Block um jede seiner drei orthogonalen Achsen verschiedene Trägheitsmomente. Nun sind aber die Winkelgeschwindigkeit ω und der Drehimpuls L beides Vektoren. Bei Rotationen um eine der Symmetrieachsen sind sie parallel. Ist aber das Trägheitsmoment für die drei Hauptachsen verschieden, so haben ω und L im Allgemeinen nicht dieselbe Richtung (vgl. Abbildung 2.4). Sie sind in analoger Weise wie E und P miteinander verknüpft. Im allgemeinen Fall müssen wir schreiben L x = I xx ω x + I xy ωy + I xz ωz , Ly = Iyx ω x + Iyy ωy + Iyz ωz , Lz = Izx ω x + Izy ωy + Izz ωz .

(2.16)

Die neun Koeffizienten Ii j werden der Trägheitstensor genannt. Bleiben wir bei der Analogie mit der Polarisation, so muss die kinetische Energie für einen Drehimpuls eine quadratische Form der Komponenten ω x , ωy , und ωz sein:  Ii j ωi ω j . (2.17) K.E. = 21 ij

52

2 Tensoren ω L

Abb. 2.4: Der Drehimpuls L eines starren Körpers ist im Allgemeinen nicht parallel zur Winkelgeschwindigkeit ω.

Mithilfe der Energie können wir das Trägheitsellipsoid definieren. Außerdem kann man mit energetischen Überlegungen zeigen, dass der Tensor symmetrisch ist – dass Ii j = I ji . Der Trägheitstensor eines starren Körpers kann berechnet werden, wenn die Form des Körpers bekannt ist. Es genügt, einfach die gesamte kinetische Energie aller Teilchen dieses Körpers anzuschreiben. Ein Teilchen der Masse m und der Geschwindigkeit v hat die kinetische Energie 1 2 2 mv , und die gesamte kinetische Energie ist die Summe  2 1 2 mv

über alle Teilchen des Körpers. Die Geschwindigkeit v jedes Teilchens ist mit der Winkelgeschwindigkeit ω des starren Körpers verknüpft. Nehmen wir an, dass sich der Körper um seinen Schwerpunkt dreht, der sich in Ruhe befinden soll. Ist dann r der Abstand eines Teilchens vom Schwerpunkt, so ist seine Geschwindigkeit u durch ω × r gegeben. Die gesamte kinetische Energie ist somit  2 1 KE = (2.18) 2 m( ω × r) .

Es bleibt uns nur noch, ω × r durch die Komponenten ω x , ωy , ωz und x, y, z auszudrücken und das Resultat mit (2.17) zu vergleichen; wir finden Ii j , indem wir die einzelnen Ausdrücke identifizieren. Nach Ausführung der Rechnung erhalten wir ( ω × r)2 =( ω × r)2x + ( ω × r)2y + ( ω × r)2z

=(ωy z − ωz y)2 + (ωz x − ω x z)2 + (ω x y − ωy x)2 = + ω2y z2 − 2ωy ωz zy + ω2z y2

+ ω2z x2 − 2ωz ω x xz + ω2x z2

+ ω2x y2 − 2ω x ωy yx + ω2y x2 .

Wir multiplizieren diese Gleichung mit m/2, summieren über alle Teilchen und vergleichen das Ergebnis mit (2.17); dabei stellen wir fest, dass beispielsweise I xx gegeben ist durch  I xx = m(y2 + z2 ).

Diese Formel haben wir schon früher (Band I, Kapitel 19) für das Trägheitsmoment eines Körpers um die x-Achse erhalten. Da r2 = x2 + y2 + z2 ist, können wir diesen Ausdruck auch schreiben als  I xx = m(r2 − x2 ).

2.5 Das Vektorprodukt

53

Nach Berechnung aller anderen Ausdrücke nimmt der Tensor die folgende Form an: � � ⎤ ⎡� − mxy − mxz ⎥⎥⎥ ⎢⎢⎢ m(r2 − x2 ) � � � ⎥⎥ ⎢⎢ − myz ⎥⎥⎥⎥ . m(r2 − y2 ) Ii j = ⎢⎢⎢⎢ − myx ⎥⎦ ⎢⎣ � � � − mzx − mzy m(r2 − z2 ) Wenn Sie wollen, kann man das auch in „tensorieller Notation“ schreiben: � m(r2 δi j − ri r j ), Ii j =

(2.19)

(2.20)

� wobei die ri die (x, y, z)-Komponenten des Ortsvektors eines Teilchens sind und darauf hinweist, dass die Summe über alle Teilchen gebildet werden muss. Das Trägheitsmoment ist dann ein Tensor zweiter Stufe, dessen Terme charakteristisch für den Körper sind und L in folgender Weise mit ω verknüpfen: � Li = Ii j ω j . (2.21) j

Welche Form ein Festkörper auch haben mag, wir können sein Trägheitsellipsoid ermitteln und infolgedessen auch die drei Hauptachsen. Bezüglich dieser Achsen ist der Tensor diagonal; daher existieren für jeden Körper immer drei orthogonale Achsen, für die die Winkelgeschwindigkeit und der Drehimpuls parallel sind. Sie werden Hauptträgheitsachsen genannt.

2.5

Das Vektorprodukt

Wir sollten darauf hinweisen, dass wir Tensoren zweiter Stufe seit Kapitel 20 von Band I benützen. Dort haben wir ein „Drehmoment in einer Ebene“, wie beispielsweise τ xy , definiert durch τ xy = xFy − yF x . Auf drei Dimensionen verallgemeinert können wir schreiben τi j = ri F j − r j Fi .

(2.22)

Die Größe τi j ist ein Tensor zweiter Stufe. Eine Möglichkeit, das einzusehen, besteht darin, dass man τi j mit einem Vektor, etwa dem Einheitsvektor e, in folgender Weise kombiniert � τi j e j . j

Ist diese Größe ein Vektor, dann muss sich τi j wie ein Tensor transformieren – so lautet unsere Definition eines Tensors. Indem wir den in (2.22) gegebenen Ausdruck für τi j einsetzen, erhalten wir � � � τi j e j = ri F j e j − r j e j Fi j

j

j

= ri ( F · e) − ( r · e)Fi .

54

2 Tensoren

Da es sich bei skalaren Produkten um Skalare handelt, sind die beiden Ausdrücke auf der rechten Seite Vektoren und desgleichen auch ihre Differenz. Also ist τi j ein Tensor. Aber τi j ist ein besonderer Typ eines Tensors; er ist antisymmetrisch, das heißt τi j = −τ ji , sodass er nur drei Komponenten ungleich null hat: τ xy , τyz und τzx . In Kapitel 20 von Band I konnten wir zeigen, dass sich diese drei Komponenten fast „zufällig“ wie die drei Komponenten eines Vektors transformieren; daher konnten wir definieren τ = (τ x , τy , τz ) = (τyz , τzx , τ xy ) . Wir sagen „zufällig“, weil das nur in drei Dimensionen der Fall ist. In vier Dimensionen hat zum Beispiel ein antisymmetrischer Tensor zweiter Stufe sechs von null verschiedene Komponenten und kann gewiss nicht durch einen Vektor mit vier Komponenten ersetzt werden. So wie der Axialvektor τ = r × F ein Tensor ist, gilt das auch für jedes Vektorprodukt aus zwei polaren Vektoren – dieselben Überlegungen gelten hier. Zum Glück lassen sie sich aber auch durch Vektoren (eigentlich durch Pseudovektoren) darstellen, das hat uns die Mathematik sehr erleichtert. Sind a und b zwei beliebige Vektoren, so bilden die neun Größen ai b j in mathematischer Hinsicht einen Tensor (obwohl dieser vielleicht keinen physikalischen Sinn hat). Für den Ortsvektor ri ist ri r j somit ein Tensor und da auch δi j einer ist, sehen wir, dass die rechte Seite von (2.20) tatsächlich ein Tensor ist. Ebenso ist (2.22) ein Tensor, da die beiden Ausdrücke auf der rechten Seite Tensoren sind.

2.6

Der Spannungstensor

Die symmetrischen Tensoren, die wir bisher beschrieben haben, traten als Koeffizienten einer Relation zwischen zwei Vektoren auf. Untersuchen wir nun einen Tensor, der eine andere physikalische Bedeutung hat – den Spannungstensor. Stellen wir uns einen festen Körper vor, auf den verschiedene Kräfte wirken. Wir sprechen von verschiedenen „Spannungen“ innerhalb des Körpers, womit wir sagen wollen, dass es innere Kräfte zwischen benachbarten Teilen der Materie gibt. Wir haben schon einmal kurz über solche Spannungen in einem zweidimensionalen Fall gesprochen, als wir in Band III, Abschnitt 12.3 die Oberflächenspannung einer ausgespannten Membran untersuchten. Jetzt werden wir sehen, dass die inneren Kräfte in der Materie eines dreidimensionalen Körpers mithilfe eines Tensors beschrieben werden können. Betrachten wir einen Körper aus einem elastischen Material – zum Beispiel ein Stück Gelatine. Machen wir einen Schnitt durch das Stück, so wird im Allgemeinen die Materie auf beiden Seiten des Schnitts von den inneren Kräften verschoben. Bevor der Schnitt gemacht wurde, müssen Kräfte zwischen den beiden Teilen des Stücks gewirkt haben, die die Materie zusammenhielten; wir können die Spannungen mithilfe dieser Kräfte definieren. Betrachten wir eine Ebene senkrecht zur x-Achse – wie die Ebene σ in Abbildung 2.5 – und fragen nach den Kräften, die durch ein kleines Flächenstück Δy Δz dieser Ebene wirken. Das Material links der Fläche übt die Kraft ΔF1 auf das Material rechts aus, wie es Teil (b) der Abbildung zeigt. Es gibt natürlich

2.6 Der Spannungstensor

55 σ

σ

ΔF1

Δy Δz

−ΔF1

x

(b)

(a)

Abb. 2.5: Das Material links der Ebene σ übt durch die Fläche Δy Δz die Kraft ΔF1 auf das Material rechts der Ebene aus.

auch die entgegengesetzte Reaktionskraft −ΔF1 , die auf das Material links der Fläche wirkt. Ist der Flächeninhalt klein genug, so muss ΔF1 proportional dem Flächeninhalt Δy Δz sein. Sie kennen bereits eine Art von Spannung – den Druck in einer statischen Flüssigkeit. In diesem Fall ist die Kraft gleich dem Druck mal dem Flächeninhalt und sie ist normal zum Flächenelement. Bei festen Körpern – und auch bei bewegten viskosen Flüssigkeiten – muss die Kraft nicht normal zur Oberfläche sein; zusätzlich zu den Drücken existieren Scherkräfte (positive oder negative). („Scherkräfte“ sind die tangentialen Komponenten der Kraft auf eine Oberfläche.) Alle drei Komponenten der Kraft müssen berücksichtigt werden. Beachten Sie auch, dass die Kräfte andere sind, wenn wir den Schnitt in einer anders gerichteten Ebene ausführen. Eine vollständige Beschreibung der inneren Spannungen ist nur mithilfe eines Tensors möglich. ΔFy1

ΔF1 ΔF x1 Δy Abb. 2.6: Die Kraft ΔF1 auf ein Flächenelement ΔyΔz senkrecht zur x-Achse wird in die drei Komponenten ΔF x1 , ΔFy1 und ΔFz1 zerlegt.

Δz ΔFz1

Wir definieren den Spannungstensor in der folgenden Weise: Zuerst stellen wir uns einen Schnitt senkrecht zur x-Achse vor und zerlegen die Kraft ΔF1 auf den Schnitt in ihre Komponenten ΔF x1 , ΔFy1 , ΔFz1 , vgl. Abbildung 2.6. Das Verhältnis dieser Kraftkomponenten zum Flächeninhalt ΔyΔz nennen wir S xx , S yx und S zx . Zum Beispiel S yx =

ΔFy1 . Δy Δz

56

2 Tensoren

Der erste Index y bezieht sich auf die Richtung der Kraftkomponente; der zweite Index x auf die Normale zur Fläche. Wenn Sie wollen, können Sie die Fläche Δy Δz als Δa x schreiben, was ein Element einer Fläche senkrecht zu x bedeutet. Dann ist S yx =

ΔFy1 . Δa x

Als Nächstes denken wir uns einen Schnitt senkrecht zur y-Achse durchgeführt. Auf eine kleine Fläche ΔxΔz wirkt eine Kraft ΔF2 . Wiederum zerlegen wir diese Kraft in ihre drei Komponenten, wie in Abbildung 2.7, und definieren die drei Komponenten der Spannung S xy , S yy , S zy als die Kraft pro Flächeneinheit in den drei Richtungen. Schließlich legen wir einen Schnitt senkrecht zu z und definieren die drei Komponenten S xz , S yz und S zz . Somit haben wir die neun Zahlen ⎡ ⎤ S xy S xz ⎥⎥ ⎢⎢⎢S xx ⎥ S yy S yz ⎥⎥⎥⎥ . S i j = ⎢⎢⎢⎢⎣S yx (2.23) ⎦ S zx S zy S zz

Wir wollen nun zeigen, dass diese neun Zahlen ausreichen, um den inneren Spannungszustand vollständig zu beschreiben und dass S i j tatsächlich ein Tensor ist. Angenommen, wir fragen nach der Kraft auf eine Fläche, die unter einem beliebigen Winkel geneigt ist. Können wir sie mithilfe von S i j ermitteln? Ja, und zwar in folgender Weise: Stellen wir uns einen kleinen Festkörper vor, dessen eine Seitenfläche N die betrachtete Fläche ist und dessen andere Flächen parallel zu den Koordinatenachsen liegen. Läge die Seitenfläche N zufällig parallel zu z, so hätten wir den dreieckigen Körper aus Abbildung 2.8. (Das ist ein etwas spezieller Fall, aber er macht die allgemeine Methode hinreichend deutlich.) Nun sind die Spannungskräfte auf dem kleinen dreieckigen Körper in Abbildung 2.8 im Gleichgewicht (zumindest im Grenzfall infinitesimaler Dimensionen), sodass die gesamte darauf ausgeübte Kraft null sein muss. Wir kennen die Kräfte auf die Seitenflächen parallel zu den Koordinatenachsen direkt aus S i j . Ihre Vektorsumme muss gleich der Kraft auf die Fläche N sein, sodass wir diese Kraft durch S i j ausdrücken können. ΔFy2

ΔF2

ΔF x2

Δz Δx

ΔFz2

Abb. 2.7: Die Kraft auf ein Flächenelement senkrecht zu y wird in drei rechtwinklige Komponenten zerlegt.

2.6 Der Spannungstensor

57

ΔFyn n

Δz

ΔFn

N ΔF xn

Δy ΔFzn

Abb. 2.8: Die Kraft Fn auf die Seitenfläche N (deren Einheitsnormale n ist) wird in Komponenten zerlegt.

θ

Δx

Unsere Annahme, dass die Flächenkräfte auf das kleine dreieckige Volumen im Gleichgewicht sind, vernachlässigt alle anderen Volumenkräfte, die vorhanden sein könnten, wie beispielsweise die Schwerkraft oder Scheinkräfte, wenn unser Koordinatensystem kein Inertialsystem ist. Beachten Sie jedoch, dass diese Volumenkräfte proportional zum Volumen des kleinen dreieckigen Körpers sind und infolgedessen proportional zu ΔxΔyΔz, während alle Oberflächenkräfte proportional zu den Flächeninhalten wie ΔxΔy, ΔyΔz etc. sind. Wählen wir daher die Abmessungen des kleinen Keils klein genug, so können die Volumenkräfte gegenüber den Flächenkräften immer vernachlässigt werden. Addieren wir nun die Kräfte, die auf den kleinen Keil wirken. Zuerst berechnen wir die xKomponente, die die Summe von fünf Beiträgen ist – ein Beitrag für jede Seitenfläche. Ist jedoch Δz klein genug, so sind die Kräfte auf die Dreiecksflächen (senkrecht zur z-Achse) entgegengesetzt gleich, sodass wir sie vergessen können. Die x-Komponente der Kraft, die auf das untere Rechteck wirkt, ist ΔF x2 = S xy Δx Δz. Die x-Komponente der Kraft auf das vertikale Rechteck ist ΔF x1 = S xx Δy Δz. Diese beiden Komponenten müssen gleich der x-Komponente der Kraft sein, die nach außen auf die Seitenfläche N wirkt. Nennen wir n den Einheitsvektor normal zur Fläche N und die entsprechende Kraft Fn ; so erhalten wir ΔF xn = S xx Δy Δz + S xy Δx Δz. Die x-Komponente  S xn der Spannung durch diese Ebene ist gleich ΔF xn , dividiert durch den Flächeninhalt Δz Δx2 + Δy2 oder S xn = S xx 

Δy

Δx2

Δy2

Δx + S xy  . Δx2 + Δy2

+  Nun ist Δx/ Δx2 + Δy2 der Kosinus des Winkels θ zwischen n und der y-Achse, sodass  wir diesen Ausdruck als ny , die y-Komponente von n, schreiben können. Ebenso ist Δy/ Δx2 + Δy2 gleich sin θ = n x . Wir können daher schreiben S xn = S xx n x + S xy ny .

58

2 Tensoren

Verallgemeinern wir nun auf ein beliebiges Flächenelement, so erhalten wir S xn = S xx n x + S xy ny + S xz nz oder allgemein S in =



S i jn j.

(2.24)

j

Also können wir die Kraft auf jedes Flächenelement mithilfe von S i j ermitteln. Der Tensor S i j beschreibt also vollständig den Zustand der inneren Spannung der Materie. Gleichung (2.24) drückt aus, dass der Tensor S i j die Spannung Sn mit dem Einheitsvektor n verknüpft, so wie αi j eine Beziehung zwischen P und E herstellt. Da n und Sn Vektoren sind, müssen sich die Komponenten von S i j bei Änderung der Koordinatenachsen wie ein Tensor transformieren. S i j ist also tatsächlich ein Tensor. Wir können außerdem zeigen, dass S i j ein symmetrischer Tensor ist, indem wir die Kräfte auf einen kleinen Würfel eines Materials untersuchen. Betrachten wir einen kleinen Würfel, dessen Flächen parallel zu unseren Koordinatenachsen liegen, und betrachten ihn im Querschnitt, wie in Abbildung 2.9. Die Kantenlänge des Würfels betrage eine Einheit; dann können die xund y-Achsen wie in der Abbildung dargestellt werden. Ist der Würfel klein, so ändern sich die Spannungen von einer Würfelseite zur gegenüberliegenden Seite nicht merklich, sodass die Kraftkomponenten entgegengesetzt gleich sind (vgl. Abbildung 2.9). Außerdem darf auf den Würfel kein Drehmoment wirken, sonst würde er anfangen, sich zu drehen. Das gesamte Drehmoment um den Mittelpunkt ist (S yx − S xy ) (mal der Kantenlänge eins des Würfels) und da das Gesamtmoment null ist, muss S yx gleich S xy sein, und der Spannungstensor ist symmetrisch. S yy

S yx S xy S xx S xx S xy S yx

S yy

Abb. 2.9: Die x- und y-Kräfte auf vier Seitenflächen eines kleinen Einheitswürfels.

Da S i j ein symmetrischer Tensor ist, kann er durch ein Ellipsoid mit drei Hauptachsen beschrieben werden. Für Flächen normal zu diesen Achsen sind die Spannungen besonders einfach anzugeben – sie entsprechen einer Zug– oder Schubkraft senkrecht zu den Flächen. Es gibt keine Scherkräfte entlang dieser Flächen. Wir können für jede Spannung die Achsen so wählen, dass die Scherkomponenten null sind. Ist das Ellipsoid eine Kugel, so gibt es in allen Richtungen nur Normalkräfte. Das entspricht einem hydrostatischen Druck (positiv oder negativ). Für einen

2.7 Tensoren höherer Stufe

59

hydrostatischen Druck ist der Tensor diagonal und alle drei Komponenten sind gleich; sie sind genau gleich dem Druck p. Wir können schreiben S i j = pδi j .

(2.25)

Der Spannungstensor – und auch sein Ellipsoid – ändern sich in einem Materiekörper im Allgemeinen von Punkt zu Punkt; um den ganzen Körper zu beschreiben, müssen wir die Werte aller Komponenten von S i j als Funktionen des Ortes angeben. Somit ist der Spannungstensor ein Feld. Wir kennen bisher skalare Felder wie die Temperatur T (x, y, z), die jedem Punkt im Raum eine Zahl zuordnen, und Vektorfelder wie E(x, y, z), die jedem Punkt drei Zahlen zuordnen. Nun haben wir Tensorfelder, die mit jedem Punkt im Raum neun Zahlen verbinden – oder vielmehr sechs für den symmetrischen Tensor S i j . Eine vollständige Beschreibung der inneren Kräfte in einem beliebig verzerrten Festkörper erfordert sechs Funktionen von x, y und z.

2.7

Tensoren höherer Stufe

Der Spannungstensor S i j beschreibt die inneren Kräfte der Materie. Ist das Material elastisch, so beschreibt man die innere Verzerrung (Deformation) bequemerweise in Ausdrücken eines anderen Tensors T i j – den man den Verzerrungstensor nennt. Bei einem einfachen Gegenstand wie einem Metallstab wissen Sie, dass die Änderung der Länge Δ L annähernd proportional zur Kraft ist; wir sagen daher, dass sie dem hookeschen Gesetz gehorcht: ΔL = γF. Bei einem festen elastischen Körper mit beliebigen Verzerrungen ist die Verzerrung T i j mit der Spannung S i j durch ein System von linearen Gleichungen verknüpft:  γi jkl S kl . (2.26) Ti j = k,l

Außerdem kennen Sie die potentielle Energie einer Feder (oder eines Stabes): 1 2F

ΔL = 12 γF 2 .

Die Verallgemeinerung für die elastische Energiedichte in einem festen Körper lautet dann  1 (2.27) Uel. = 2 γi jkl S i j S kl . i jkl

Die vollständige Beschreibung der elastischen Eigenschaften eines Kristalls muss durch die Koeffizienten γi jkl erfolgen. Das führt uns zu einem neuen Ungeheuer. Es handelt sich um einen Tensor vierter Stufe. Da jeder Index einen der drei Werte x, y oder z annehmen kann, gibt es 34 = 81 Koeffizienten. Aber in Wirklichkeit sind das nur 21 verschiedene Zahlen. Erstens ist S i j symmetrisch und hat daher nur sechs verschiedene Komponenten, und in (2.27) werden nur 36 verschiedene Koeffizienten gebraucht. Außerdem können S i j und S kl miteinander vertauscht werden, ohne die Energie zu ändern, sodass γi jkl symmetrisch sein muss, wenn wir i j mit kl vertauschen. Das reduziert die Zahl der verschiedenen Koeffizienten auf 21. Eine Beschreibung

60

2 Tensoren

der elastischen Eigenschaften eines Kristalls mit der kleinst möglichen Symmetrie verlangt also 21 elastische Koeffizienten! Diese Zahl verringert sich natürlich bei Kristallen mit höheren Symmetrien. Zum Beispiel hat ein kubischer Kristall nur drei elastische Koeffizienten und eine isotrope Substanz hat nur zwei. Dass Letzteres richtig ist, kann man wie folgt einsehen. Wie können die Komponenten von γi jkl unabhängig von der Richtung der Achsen sein, was der Fall sein muss, wenn das Material isotrop ist? Antwort: Sie können von den Achsen nur dann unabhängig sein, wenn sie durch den Tensor δi j ausdrückbar sind. Es gibt zwei mögliche Ausdrücke δi j δkl und δik δ jl + δil δ jk , die die erforderliche Symmetrie haben, sodass γi jkl eine Linearkombination davon sein muss. Infolgedessen ist für isotrope Materialien γi jkl = a(δi j δkl ) + b(δik δ jl + δil δ jk ), und es sind zwei Koeffizienten a und b erforderlich, um die elastischen Eigenschaften eines solchen Materials zu beschreiben. Wir überlassen es Ihnen darzulegen, dass für einen kubischen Kristall nur drei erforderlich sind. Als ein letztes Beispiel, und dieses Mal als Beispiel für einen Tensor dritter Stufe, betrachten wir den piezoelektrischen Effekt. Unter dem Einfluss mechanischer Spannungen erzeugt ein Kristall ein elektrisches Feld, das proportional zur Spannung ist; folglich lautet das Gesetz im Allgemeinen  Ei = Pi jk S jk , j,k

wobei Ei das elektrische Feld darstellt und die Pi jk die piezoelektrischen Koeffizienten sind – oder der piezoelektrische Tensor. Können Sie zeigen, dass die piezoelektrischen Koeffizienten alle null sind, wenn der Kristall ein Inversionszentrum (invariant bei x, y, z → −x, −y, −z) hat?

2.8

Der Vierertensor des elektromagnetischen Impulses

Alle Tensoren, die wir bisher in diesem Kapitel untersucht haben, beziehen sich auf die drei Dimensionen im Raum; definitionsgemäß haben sie eine bestimmte Transformationseigenschaft bei räumlichen Drehungen. In Band III, Kapitel 26 hatten wir die Gelegenheit, einen Tensor in den vier Dimensionen der relativistischen Raumzeit kennenzulernen – den elektromagnetischen Feldtensor Fμv . Die Komponenten eines solchen Vierertensors transformieren sich bei einer Lorentz-Transformation der Koordinaten auf eine besondere Weise, die wir berechnet haben. (Obwohl wir nicht so vorgegangen sind, hätten wir die Lorentz-Transformation auch als eine „Drehung“ in einem vierdimensionalen „Raum“ – dem so genannten Minkowski-Raum – betrachten können; dann wäre die Analogie zu dem, was wir hier machen, klarer gewesen.) Als unser letztes Beispiel wollen wir einen anderen Tensor in den vier Dimensionen (t, x, y, z) der Relativitätstheorie betrachten. Als wir den Spannungstensor anschrieben, haben wir S i j als eine Komponente einer Kraft definiert, die auf eine Flächeneinheit wirkt. Aber die Kraft ist gleich der zeitlichen Änderungsrate des Impulses. Statt daher zu sagen „S xy ist die xKomponente des Impulses durch eine Flächeneinheit senkrecht zu y“, könnten wir genauso gut

2.8 Der Vierertensor des elektromagnetischen Impulses

61

sagen „S xy ist die Strömungsrate der x-Komponente des Impulses durch eine Flächeneinheit senkrecht zu y“. Mit anderen Worten: Jede Komponente von S i j stellt außerdem die Strömung der i-Komponente des Impulses durch eine Flächeneinheit senkrecht zur j-Richtung dar. Es handelt sich um reine Raumkomponenten, aber sie sind Teile eines „größeren“ Tensors S μv in vier Dimensionen (μ und ν = t, x, y, z), der zusätzliche Komponenten wie S xt , S yt , S zt etc. enthält. Versuchen wir nun, die physikalische Bedeutung dieser zusätzlichen Komponenten zu ermitteln. Wir wissen, dass die Raumkomponenten die Impulsströmung darstellen. Wir können einen Hinweis erhalten, wie das auf die Zeitdimension zu übertragen ist, indem wir einen anderen „Strömungsvorgang“ untersuchen – die Strömung der elektrischen Ladung. Für die skalare Größe, die Ladung, ist die Strömungsrate (pro Flächeneinheit senkrecht zur Stromrichtung) ein räumlicher Vektor – der Vektor j der Stromdichte. Wir haben gesehen, dass die Zeitkomponente dieses Strömungsvektors die Dichte von dem ist, was strömt. Zum Beispiel kann j mit einer Zeitkomponente jt = ρ, der Ladungsdichte, kombiniert werden, um den Vierervektor jμ = (ρ, j) zu bilden; das heißt, dass μ in jμ die Werte t, x, y, z annimmt, um die „Dichte, die Strömungsrate in der x-Richtung, die Strömungsrate in der y-Richtung, die Strömungsrate in der z-Richtung“ der skalaren Ladung auszudrücken. In Analogie zu unserer Aussage bezüglich der Zeitkomponente der Strömung einer skalaren Größe können wir erwarten, dass es neben S xx , S xy und S xz , die die Strömung der xKomponente des Impulses beschreiben, eine Zeitkomponente S xt geben muss, die die Dichte von dem ist, was fließt; das heißt, dass S xt die Dichte des x-lmpulses sein muss. Wir können also unseren Tensor horizontal um eine t-Komponente erweitern. Dann ist S xt S xx S xy S xz

= Dichte des x-Impulses, = x-Strömung des x-Impulses, = y-Strömung des x-Impulses, = z-Strömung des x-Impulses.

Ebenso haben wir für die y-Komponente des Impulses die drei Komponenten der Strömung – S yx , S yy , S yz –, zu denen wir einen vierten Ausdruck hinzufügen: S yt = Dichte des y-Impulses. Und natürlich ist zu S zx , S zy , S zz hinzuzufügen S zt = Dichte des z-Impulses. Im vierdimensionalen Raum gibt es außerdem eine t-Komponente des Impulses, die bekanntlich die Energie ist. Der Tensor S i j muss sich dann vertikal um S tx , S ty und S tz erweitern, wobei S tx = x-Strömung der Energie, S ty = y-Strömung der Energie, S tz = z-Strömung der Energie;

(2.28)

das heißt, S tx ist die Energieströmung pro Flächen- und Zeiteinheit durch eine Fläche senkrecht zur x-Achse und so fort. Zur Vervollständigung unseres Tensors benötigen wir schließlich

62

2 Tensoren

noch S tt , die Energiedichte. Wir haben unseren dreidimensionalen Spannungstensor S i j zu dem vierdimensionalen Energie-Impuls-Tensor S μv erweitert. Der Index μ kann die Werte t, x, y und z annehmen und bedeutet dann „Dichte“, „Strömung pro Flächeneinheit in der x-Richtung“, „Strömung pro Flächeneinheit in der y-Richtung“ bzw. „Strömung pro Flächeneinheit in der zRichtung“. In derselben Weise nimmt v die vier Werte t, x, y, z an und sagt dann aus, was strömt, nämlich „Energie“, „Impuls in der x-Richtung“, „Impuls in der y-Richtung“ und „Impuls in der z-Richtung“. Um ein Beispiel zu geben, untersuchen wir diesen Tensor nicht in Materie, sondern in einem freien Raumbereich, in dem es ein elektromagnetisches Feld gibt. Wir wissen, dass die Energieströmung der Poynting-Vektor S = �0 c2 E × B ist. Relativistisch gesehen sind die x-, y- und z-Komponenten von S die Komponenten S tx , S ty und S tz unseres vierdimensionalen EnergieImpuls-Tensors. Die Symmetrie des Tensors S i j überträgt sich auch auf die Zeitkomponenten und somit ist der vierdimensionale Tensor S μv symmetrisch: S μν = S νμ .

(2.29)

Mit anderen Worten: Die Komponenten S xt , S yt , S zt , die die Dichten des x-, y- und z-Impulses darstellen, sind auch gleich den x-, y- und z-Komponenten des Poynting-Vektors S, der Energieströmung – was wir schon in einem früheren Kapitel durch eine andere Beweisführung gezeigt haben. Die übrigen Komponenten des elektromagnetischen Spannungstensors S μν können auch durch die elektrischen und magnetischen Feldstärken E und B ausgedrückt werden. Damit ist gesagt, dass wir dem elektromagnetischen Feld auch mechanische Spannungen oder – weniger geheimnisvoll ausgedrückt – Impulsströmung zugestehen müssen. Wir haben das in Band III, Kapitel 27 in Zusammenhang mit Gleichung (27.21) bereits erwähnt, aber wir haben dort nicht die Einzelheiten ausgeführt. Wer von Ihnen sich heldenhaft im Umgang mit vierdimensionalen Tensoren üben will, der möchte vielleicht die Formel für S μv in Termen der Feldstärken sehen: ⎛ ⎞ � ⎜⎜⎜� ⎟⎟⎟ 1 ⎜ Fμα Fνα − 4 δμν Fβα Fβα ⎟⎟⎟⎠ , S μν = −�0 ⎜⎜⎝ α

α,β

wobei die Summen über α und β über t, x, y, z laufen, und � wir (wie in der Relativitätstheorie üblich) eine spezielle Bedeutung für das Summenzeichen und das Symbol δ verwenden. In den Summen müssen die x-, y-, z-Ausdrücke subtrahiert werden, und δtt = +1, während δ xx = δyy = δzz = −1 und für μ  v gilt δ μv = 0 (c = 1). Können Sie beweisen, dass man die Energiedichte S tt = (�0 /2)(E 2 + B2 ) und den Poynting-Vektor �0 E × B erhält? Können Sie zeigen, dass in einem elektrostatischen Feld mit B = 0 die Hauptachsen der mechanischen Spannung in der Richtung des elektrischen Feldes liegen, dass es eine mechanische Spannung (�0 /2)E 2 entlang der Feldrichtung gibt, und dass der Druck in allen Richtungen senkrecht zur Feldrichtung gleich groß ist?

3

Der Brechungsindex dichter Materialien

Siehe auch: Tabelle 3.1.

3.1

Polarisation von Materie

Diskutieren wir nun das Phänomen der Lichtbrechung – und infolgedessen auch die Absorption von Licht – in dichten Materialien. In Kapitel 6 von Band II haben wir die Theorie des Brechungsindex besprochen; aufgrund unserer damals begrenzten mathematischen Möglichkeiten mussten wir uns aber damit begnügen, den Index nur für Materialien von niedriger Dichte, zum Beispiel für Gase, zu bestimmen. Die physikalischen Prinzipien, die den Index verursachen, wurden jedoch klargemacht. Das elektrische Feld der Lichtwelle polarisiert die Moleküle des Gases, wobei es oszillierende Dipolmomente erzeugt. Infolge der Beschleunigung der oszillierenden Ladungen werden neue Wellen des Feldes ausgestrahlt. Dieses neue Feld interferiert mit dem alten und es entsteht ein verändertes Feld, das einer Phasenverschiebung der ursprünglichen Welle entspricht. Da diese Phasenverschiebung proportional zur Dicke des Materials ist, entspricht der Effekt einer anderen Phasengeschwindigkeit in dem Material. Als wir das Thema früher betrachteten, haben wir Komplikationen wie beispielsweise die Änderung der Felder an den oszillierenden Dipolen durch die neue Welle vernachlässigt. Wir nahmen an, dass die Kräfte auf die Ladungen in den Atomen einfach der einlaufenden Welle entstammten, während ihre Oszillationen in Wirklichkeit nicht nur von der einlaufenden Welle, sondern auch von den abgestrahlten Wellen aller anderen Atome bewirkt werden. Zum damaligen Zeitpunkt wäre es für uns schwierig gewesen, diesen Effekt mit einzubeziehen; wir haben daher nur verdünnte Gase untersucht, bei denen diese Effekte nicht wichtig sind. Jetzt aber werden wir dieses Problem leicht lösen, wenn wir es mithilfe der Differentialgleichungen behandeln. Diese Methode verdunkelt zwar den physikalischen Ursprung des Index (der darin besteht, dass die zurückgestrahlten Wellen mit den ursprünglichen Wellen interferieren), aber sie macht die Theorie für dichte Materialien sehr viel einfacher. Dieses Kapitel trägt viele Teile unserer frühen Arbeit zusammen. Wir haben praktisch alles behandelt, was wir brauchen, sodass nur wenige neue Begriffe eingeführt werden müssen. Da Sie vielleicht Ihr Gedächtnis hinsichtlich dessen, was wir brauchen werden, auffrischen müssen, haben wir in Tabelle 3.1 eine Liste der Gleichungen zusammengestellt, die gebraucht werden und zugleich auf die Stellen verwiesen, an denen man sie finden kann. In den meisten Fällen werden wir uns nicht die Zeit nehmen, die physikalischen Argumente zu wiederholen, sondern einfach die Gleichungen verwenden. Erinnern wir uns zunächst an den Mechanismus des Brechungsindex für ein Gas. Wir nehmen an, dass es N Teilchen pro Volumeneinheit gibt und dass sich jedes Teilchen wie ein harmoni-

64

3 Der Brechungsindex dichter Materialien

Tabelle 3.1: Unsere Darlegung in diesem Kapitel basiert auf den folgenden Gleichungen, die bereits in früheren Kapiteln hergeleitet wurden. Thema

siehe

Gleichung

Gedämpfte Schwingungen

Bd. I, Kap. 23

m( x¨ + γ x˙ + ω20 x) = F

Brechungsindex von Gasen

Bd. II, Kap. 6

n=1+

Nq2e 1 2 �0 m(ω20 − ω2 )

n = n� − in��

m x¨ + μ x˙ = F

Beweglichkeit

Bd. II, Kap. 16

Elektrische Leitfähigkeit

Bd. II, Kap. 18

μ=

Polarisierbarkeit

Bd. III, Kap. 10

ρpol = − ∇ · P

Elektrisches Feld in Dielektrika

Bd. III, Kap. 11

Elokal = E +

Nq2e τ τ ; σ= m m 1 P 3�0

scher Oszillator verhält. Wir verwenden ein Modell eines Atoms bzw. eines Moleküls, in dem das Elektron mit einer Kraft gebunden ist, die proportional zu seiner Verschiebung ist (als wenn das Elektron durch eine Feder an seinem Platz gehalten würde). Wir haben betont, dass es sich hierbei nicht um ein einwandfreies klassisches Atommodell handelt, doch später werden wir zeigen, dass die korrekte quantenmechanische Theorie zu Resultaten führt, die diesem Modell (in einfachen Fällen) entsprechen. In unserer früheren Darstellung haben wir die Möglichkeit einer Dämpfungskraft in den atomaren Oszillatoren nicht berücksichtigt; das werden wir jetzt tun. Eine solche Kraft entspricht einem Widerstand gegenüber der Bewegung, das heißt, einer Kraft proportional zur Geschwindigkeit des Elektrons. Die Bewegungsgleichung lautet dann F = qe E = m( x¨ + γ x˙ + ω20 x),

(3.1)

wobei x die Verschiebung parallel zur Richtung von E ist. (Wir nehmen einen isotropen Oszillator an, dessen rücktreibende Kraft in allen Richtungen die gleiche ist. Außerdem wählen wir für den Augenblick eine linear polarisierte Welle, sodass E seine Richtung nicht ändert.) Hängt das elektrische Feld, das auf das Atom wirkt, sinusförmig von der Zeit ab, so schreiben wir E = E0 eiωt .

(3.2)

Die Verschiebung oszilliert dann mit derselben Frequenz, und wir können setzen x = x0 eiωt . Indem wir x˙ = iωx und x¨ = −ω2 x einsetzen, können wir x durch E ausdrücken: x=

−ω2

qe /m E. + iγω + ω20

(3.3)

Da wir die Verschiebung kennen, können wir die Beschleunigung x¨ berechnen und die abgestrahlte Welle angeben, die für den Brechungsindex verantwortlich ist. Auf diese Weise haben wir den Index in Band II , Kapitel 6 berechnet.

3.1 Polarisation von Materie

65

Jetzt wollen wir jedoch einen anderen Weg einschlagen. Das induzierte Dipolmoment p eines Atoms ist qe x oder, unter Verwendung von (3.3), p=

q2e /m E. −ω2 + iγω + ω20

(3.4)

Da p proportional zu E ist, schreiben wir p = �0 α(ω) E,

(3.5)

wobei α die atomare Polarisierbarkeit genannt wird.1 Mit dieser Definition haben wir α=

q2e /m�0 . −ω2 + iγω + ω20

(3.6)

Die quantenmechanische Lösung für die Bewegungen der Elektronen in Atomen gibt ein ähnliches Resultat, wobei aber die folgenden Modifikationen auftreten. Die Atome haben mehrere Eigenfrequenzen, wobei zu jeder Frequenz ihre eigene Dissipationskonstante γ gehört. Auch die effektive „Stärke“ jeder Eigenschwingung ist verschieden; das können wir darstellen, indem wir die Polarisierbarkeit für jede Frequenz mit einem Stärkefaktor f multiplizieren, der eine Zahl ist, die von der Größenordnung 1 sein sollte. Bezeichnen wir die drei Parameter ω0 , γ und f für jede Eigenschwingung mit ω0k , γk und fk und summieren über die verschiedenen Eigenschwingungen, so müssen wir (3.6) abändern in α(ω) =

q2e  fk . �0 m k −ω2 + iγk ω + ω20k

(3.7)

Ist N die Zahl der Atome pro Volumeneinheit im Material, so ist die Polarisation P gleich N p = �0 NαE und das ist proportional zu E: P = �0 Nα(ω) E.

(3.8)

Mit anderen Worten: Wirkt ein sinusförmiges elektrisches Feld in einem Material, so gibt es ein induziertes Dipolmoment pro Volumeneinheit, das proportional zum elektrischen Feld ist – mit einer Proportionalitätskonstanten α, die, wir betonen das, von der Frequenz abhängt. Bei sehr hohen Frequenzen ist α klein; das Material reagiert wenig. Hingegen kann es bei niedrigen Frequenzen eine starke Reaktion geben. Außerdem ist die Proportionalitätskonstante eine komplexe Zahl, was bedeutet, dass die Polarisation nicht genau dem elektrischen Feld folgt, sondern dass sie in gewissem Maße phasenverschoben sein kann. Auf jeden Fall gibt es eine Polarisation pro Volumeneinheit, deren Betrag proportional zur Stärke des elektrischen Feldes ist. 1

In diesem Kapitel folgen wir der Bezeichnungsweise von Kapitel 6 aus Band II und bezeichnen mit α die atomare Polarisierbarkeit, die wir hier definiert haben. Im vorigen Kapitel verwendeten wir α für die Volumenpolarisierbarkeit – für das Verhältnis von P zu E. In der Bezeichnungsweise dieses Kapitels ist P = Nα�0 E (siehe 3.8).

66

3.2

3 Der Brechungsindex dichter Materialien

Maxwells Gleichungen in einem Dielektrikum

Die Existenz einer Polarisation in der Materie bedeutet, dass es Polarisationsladungen und -ströme im Innern des Materials gibt und dass diese in die vollständigen Maxwell-Gleichungen eingesetzt werden müssen, damit man die Felder berechnen kann. Dieses Mal werden wir die Maxwell-Gleichungen für eine Situation lösen, in der die Ladungen und Ströme nicht wie im Vakuum verschwinden, sondern implizit durch den Polarisationsvektor gegeben sind. Unser erster Schritt besteht darin, den Mittelwert der Ladungsdichte ρ und der Stromdichte j über ein kleines Volumen explizit zu berechnen, das dieselbe Größe wie das für die Definition von P verwendete Volumen hat. Dann können wir die gesuchten Größen ρ und j aus der Polarisation erhalten. Wir haben in Band III, Kapitel 10 gesehen, dass bei räumlich variabler Polarisation P eine Ladungsdichte auftritt, die gegeben ist durch ρpol = − ∇ · P.

(3.9)

Dort haben wir uns mit statischen Feldern befasst, aber dieselbe Formel gilt auch für zeitlich variable Felder. Ändert sich jedoch P mit der Zeit, so sind Ladungen in Bewegung und folglich gibt es auch einen Polarisationsstrom. Jede der schwingenden Ladungen trägt einen Strom bei, der gleich der betreffenden Ladung qe mal ihrer Geschwindigkeit u ist. Bei N solchen Ladungen pro Volumeneinheit ist die Stromdichte j j = Nqe u. Da wir wissen, dass v = dx/dt, erhalten wir j = Nqe (dx/dt), und das ist dP/dt. Infolgedessen ist die Stromdichte wegen der variablen Polarisation ∂P . (3.10) ∂t Unser Problem ist nun einfach zu lösen. Wir schreiben die Maxwell-Gleichungen mit der durch P ausgedrückten Ladungs- und Stromdichte an, wobei wir die Beziehungen (3.9) und (3.10) verwenden. (Wir nehmen an, dass es keine anderen Ströme und Ladungen in dem Material gibt.) Mithilfe von (3.8) setzen wir dann P in Beziehung zu E und lösen die Gleichung für E und B – wobei wir die Wellenlösungen suchen. jpol =

Ehe wir das tun, möchten wir eine historische Anmerkung machen. Maxwell schrieb seine Gleichungen ursprünglich in einer anderen Form als in der, die wir verwendet haben. Da die Gleichungen viele Jahre lang in dieser anderen Form geschrieben wurden – und von vielen auch heute noch so geschrieben werden –, wollen wir den Unterschied erklären. In den ersten Jahren wurde der Mechanismus der Dielektrizitätskonstanten noch nicht voll und klar verstanden. Man verstand weder die Natur der Atome, noch wusste man von einer Polarisation des kannte. Folglich bemerkte man nicht, dass ∇ · P zur Ladungsdichte ρ beiträgt. Man konnte sich nur Ladungen vorstellen, die nicht an Atome gebunden sind (wie die Ladungen, die in Drähten strömen oder von Oberflächen abgerieben werden). Heute ziehen wir es vor, die gesamte Ladungsdichte, einschließlich des Anteils der gebundenen atomaren Ladungen durch ρ darzustellen. Bezeichnen wir den letzteren Anteil mit ρpo1 , so können wir schreiben ρ = ρpol + ρandere ,

3.2 Maxwells Gleichungen in einem Dielektrikum

67

wobei ρandere die von Maxwell betrachtete Ladungsdichte ist und sich auf die Ladungen bezieht, die nicht an einzelne Atome gebunden sind. Wir können dann schreiben ∇· E=

ρpol + ρandere . �0

Setzen wir ρpol aus (3.9) ein, so erhalten wir ∇· E=

ρandere 1 − ∇· P �0 �0

oder ∇ · (�0 E + P) = ρandere .

(3.11)

Auch zur Stromdichte, die in den Maxwell-Gleichungen für ∇ × B auftritt, tragen die gebundenen atomaren Ströme bei. Infolgedessen können wir schreiben j = jpol + jandere, und die Maxwell-Gleichung wird zu c2 ∇ × B =

jpol ∂E jandere . + + �0 �0 ∂t

(3.12)

Mit (3.10) erhalten wir �0 c2 ∇ × B = jandere +

∂ (�0 E + P). ∂t

(3.13)

Würden wir nun einen neuen Vektor D durch D = �0 E + P

(3.14)

definieren, so erhielten die beiden Feldgleichungen die Form ∇ · D = ρandere

(3.15)

und �0 c2 ∇ × B = jandere +

∂D . ∂t

(3.16)

In dieser Form verwendete sie Maxwell für Dielektrika. Die beiden übrigen Gleichungen waren ∇× E=−

∂B , ∂t

und ∇ · B = 0, das sind dieselben, die wir benutzt haben.

68

3 Der Brechungsindex dichter Materialien

Maxwell und andere frühere Wissenschaftler hatten auch Schwierigkeiten mit magnetischen Materialien (wir werden demnächst auf diese zurückkommen). Da sie nichts von den Kreisströmen wussten, die für den atomaren Magnetismus verantwortlich sind, verwendeten sie eine Stromdichte, bei der ein weiterer Teil fehlte. Anstelle von Gleichung (3.16) schrieben sie ∇ × H = j� +

∂D , ∂t

(3.17)

wobei sich H von �0 c2 B dadurch unterscheidet, dass es Effekte von atomaren Strömen enthält. (Dann bedeutet j� das, was von den Strömen noch übrig bleibt.) Somit hatte Maxwell vier Feldvektoren – E, D, B und H – D und H waren Hilfsgrößen, in denen die Unkenntnis der Vorgänge im Innern des Materials verborgen war. Sie werden die Gleichungen in dieser Form an vielen Stellen antreffen. Um die Gleichungen zu lösen, war es notwendig, D und H zu den anderen Feldern in Beziehung zu setzen und man schrieb gewöhnlich D=�E

und

B = μ H.

(3.18)

Diese Relationen sind jedoch nur näherungsweise für einige Materialien richtig und auch nur dann, wenn sich die Felder nicht zu schnell mit der Zeit ändern. (Für sinusförmig variierende Felder kann man die Gleichungen oft auf diese Weise schreiben, wenn man � und μ als komplexe Funktionen der Frequenz auffasst; für beliebige Zeitabhängigkeit der Felder ist das jedoch nicht möglich.) Infolgedessen wurde bei der Lösung der Gleichungen viel gemogelt. Mir erscheint es richtig, die Gleichungen in Ausdrücken der fundamentalen Größen zu schreiben, wie wir sie heute verstehen – und so haben wir es auch getan.

3.3

Wellen in einem Dielektrikum

Wir wollen nun feststellen, welche Art von elektromagnetischen Wellen in einem dielektrischen Material existieren kann, in dem es keine zusätzlichen Ladungen außer denen gibt, die in den Atomen gebunden sind. Wir wählen daher ρ = −∇ · P und j = ∂P/∂t. Maxwells Gleichungen lauten dann   ∇· P ∂ P 2 (a) ∇ · E = − , (b) c ∇ × B = +E , �0 ∂t �0 (3.19) ∂B , (d) ∇· B = 0. (c) ∇ × E = − ∂t Wir können diese Gleichungen lösen wie zuvor. Wir bilden zuerst die Rotation von (3.19 c): ∇ × ( ∇ × E) = −

∂ ∇ × B. ∂t

Als Nächstes benützen wir die Vektoridentität ∇ × ( ∇ × E) = ∇( ∇ · E) − ∇2 E,

3.3 Wellen in einem Dielektrikum

69

und setzen ∇ × B aus Gleichung (3.19 b) ein; wir erhalten ∇( ∇ · E) − ∇2 E = −

1 ∂2 P 1 ∂2 E − 2 2. �0 c2 ∂t2 c ∂t

Unter Verwendung von Gleichung (3.19 a) für ∇ · E erhalten wir ∇2 E −

1 ∂2 E 1 1 ∂2 P = − ∇( ∇ · P) + . 2 2 �0 c ∂t �0 c2 ∂t2

(3.20)

Anstelle der Wellengleichung finden wir nun, dass der d’Alembert-Operator von E gleich zwei Termen ist, die die Polarisation P enthalten. Da P jedoch von E abhängt, kann Gleichung (3.20) immer noch Wellenlösungen haben. Beschränken wir uns nun auf isotrope Dielektrika, sodass P immer dieselbe Richtung wie E hat. Versuchen wir, eine Lösung für eine Welle zu finden, die in der z-Richtung läuft. Dann wird sich das elektrische Feld wie ei(ωt−kz) verhalten. Nehmen wir außerdem an, dass die Welle in der x-Richtung polarisiert ist – dass also das elektrische Feld nur eine x-Komponente hat. Wir schreiben E x = E0 ei(ωt−kz) .

(3.21)

Sie wissen, dass jede Funktion von (z − vt) eine Welle darstellt, die mit der Geschwindigkeit v läuft. Der Exponent von (3.21) kann geschrieben werden als  ω  −ik z − t . k Daher beschreibt (3.21) eine Welle mit der Phasengeschwindigkeit vph = ω/k. Der Brechungsindex n wird definiert (siehe Band II, Kapitel 6) durch vph =

c . n

Somit erhält (3.21) die Form E x = E0 eiω(t−nz/c) . Wir können also n ermitteln, indem wir feststellen, für welchen Wert von k der Ausdruck (3.21) die richtigen Feldgleichungen erfüllt und dann verwenden n=

kc . ω

(3.22)

In einem isotropen Material gibt es nur eine x-Komponente der Polarisation; P hängt dann – ebenso wie E – nicht von der x-Koordinate ab, sodass ∇ · P = 0, was uns von dem ersten Ausdruck auf der rechten Seite von Gleichung (3.20) befreit. Da wir außerdem ein lineares

70

3 Der Brechungsindex dichter Materialien

Dielektrikum annehmen, ändert sich P x wie eiωt und ∂2 P x /∂t2 = −ω2 P x . Der Laplace-Operator in Gleichung (3.20) wird einfach zu ∂2 E x /∂z2 = −k2 E x , sodass wir erhalten −k2 E x +

ω2 ω2 E = − Px. x c2 �0 c2

(3.23)

Nehmen wir nun für den Augenblick an, dass wir P wie in (3.8) proportional zu E setzen können, da E sich sinusförmig ändert. (Wir werden später auf diese Hypothese zurückkommen.) Wir schreiben P x = �0 NαE x . Dann fällt E x aus Gleichung (3.23) heraus, und wir stellen fest, k2 =

ω2 (1 + Nα). c2

(3.24)

Wir haben gefunden, dass eine Welle wie (3.21) mit der durch (3.24) gegebenen Wellenzahl k die Feldgleichungen erfüllt. Mithilfe von (3.22) wird der Index n n2 = 1 + Nα.

(3.25)

Vergleichen wir diese Formel mit der, die wir in unserer Theorie des Index eines Gases (Band II, Kapitel 6) gefunden haben. Dort erhielten wir Gleichung (3.19), die besagte, dass ⎛ ⎞ ⎟⎟⎟ 1 Nq2e ⎜⎜⎜ 1 ⎜⎝ ⎟⎠ . n=1+ (3.26) 2 m�0 −ω2 + ω20

Entnehmen wir α aus (3.6), so liefert uns (3.25) ⎛ ⎞ ⎟⎟⎟ Nq2e ⎜⎜⎜ 1 ⎜⎝ ⎟⎠ . n2 = 1 + 2 2 m�0 −ω + iγω + ω0

(3.27)

Erstens erhalten wir den neuen Term mit iγω, weil wir jetzt die Dissipation der Oszillatoren einbeziehen. Zweitens ist die linke Seite n und nicht n2 und es gibt einen zusätzlichen Faktor 1/2. Aber beachten Sie: Wenn N hinreichend klein ist, sodass n nahe bei eins liegt (wie das für 2 2 ein Gas der Fall ist), dann sagt √ (3.27), dass n eins plus einer kleinen Zahl ist: n = 1 + �. Wir können dann schreiben n = 1 + � ≈ 1 + �/2 und die beiden Ausdrücke sind äquivalent. Somit liefert uns unsere Methode für ein Gas dasselbe Resultat, das wir schon früher gefunden haben. Sie könnten nun denken, dass (3.27) uns auch den Brechungsindex für dichte Materialien geben müsste. Sie muss jedoch aus verschiedenen Gründen modifiziert werden. Erstens wurde bei Herleitung dieser Gleichung angenommen, dass das polarisierende Feld für jedes Atom das Feld E x ist. Diese Annahme ist aber nicht richtig, weil es in dichten Materialien auch das Feld gibt, das von den anderen Atomen in der Nachbarschaft erzeugt wird und das vergleichbar mit E x sein kann. Wir betrachteten ein ähnliches Problem, als wir die statischen Felder in Dielektrika untersuchten. (Siehe Band III, Kapitel 11.) Sie werden sich daran erinnern, dass wir das auf ein einzelnes Atom wirkende Feld abgeschätzt haben, indem wir annahmen, dass sich das Atom in einer kugelförmigen Aushöhlung im umgebenden Dielektrikum befindet. Das Feld in einer

3.3 Wellen in einem Dielektrikum

71

solchen Aushöhlung – wir nennen es das lokale Feld – übersteigt das mittlere Feld E um den Betrag P/3�0 . (Erinnern Sie sich aber daran, dass dieses Resultat ausschließlich in isotropen Materialien gilt – einschließlich des speziellen Falls eines kubischen Kristalls.) Dieselben Überlegungen gelten für das elektrische Feld in einer Welle, solange die Wellenlänge der Welle viel größer als der Abstand zwischen den Atomen ist. Wir beschränken uns auf solche Fälle und schreiben Elokal = E +

P . 3�0

(3.28)

Es ist dieses lokale Feld, das für E in Gleichung (3.3) verwendet werden muss; d. h., die Beziehung (3.8) muss umgeschrieben werden: P = �0 Nα Elokal .

(3.29)

Unter Verwendung des in (3.28) gegebenen Ausdrucks für Elokal finden wir   P P = �0 Nα E + 3�0 oder P=

Nα �0 E. 1 − (Nα/3)

(3.30)

Nα . 1 − (Nα/3)

(3.31)

Mit anderen Worten: Auch in dichten Materialien ist P proportional zu E (für sinusförmige Felder). Aber die Proportionalitätskonstante ist nicht �0 Nα, wie wir unterhalb von (3.23) geschrieben haben, sondern sie ist �0 Nα/[1 − (Nα/3)]. Wir müssen daher Gleichung (3.25) korrigieren, sodass sie die folgende Form erhält n2 = 1 +

Es ist bequemer, wenn wir diese Gleichung umschreiben in 3

n2 − 1 = Nα, n2 + 2

(3.32)

was algebraisch äquivalent ist. Sie ist als Clausius-Mossotti-Gleichung bekannt. Es gibt in dichten Materialien eine weitere Komplikation. Da die Nachbaratome so nahe beieinander liegen, gibt es zwischen ihnen starke Wechselwirkungen. Die inneren Eigenschwingungen sind infolgedessen modifiziert. Die Eigenfrequenzen der atomaren Schwingungen werden durch die Wechselwirkungen auseinandergezogen und diese sind gewöhnlich sehr stark gedämpft, weil der Widerstandskoeffizient sehr groß wird. Die ω0 ’s und γ’s des Festkörpers unterscheiden sich also stark von denen der freien Atome. Mit diesen Einschränkungen können wir α zumindest näherungsweise noch durch (3.7) darstellen. Wir haben also 3

n2 − 1 Nq2e  fk = . n2 + 2 m�0 k −ω2 + iγk ω + ω20k

(3.33)

72

3 Der Brechungsindex dichter Materialien

Letzte Komplikation: Ist das dichte Material eine Mischung aus mehreren Komponenten, so trägt jede zur Polarisation bei. Das gesamte α ist die Summe der Beiträge der einzelnen Komponenten der Mischung. (Dies gilt bis auf die Ungenauigkeit der lokalen Näherung für das Feld (3.28) in geordneten Kristallen – Effekte, die wir bei der Analyse der Ferroelektrika betrachten). Schreiben wir N j als die Anzahl der Atome jeder Komponente pro Volumeneinheit, so müssen wir Gleichung (3.32) ersetzen durch    2 n −1 = 3 2 N jα j, (3.34) n +2 j wobei jedes α j durch einen Ausdruck der Form (3.7) gegeben ist. Gleichung (3.34) vervollständigt unsere Theorie des Brechungsindex. Die Größe 3(n2 − 1)/(n2 + 2) ist durch eine komplexe Funktion der Frequenz gegeben, welche die mittlere atomare Polarisierbarkeit α(ω) ist. Die genaue Berechnung von α(ω) (das Auffinden von fk , γk und ω0k ) in dichten Substanzen ist ein schwieriges Problem der Quantenmechanik. Von ersten Prinzipien ausgehend, wurde es nur für wenige besonders einfache Substanzen gelöst.

3.4

Der komplexe Brechungsindex

Betrachten wir nun die Konsequenzen unseres Resultats (3.33). Zunächst stellen wir fest, dass α komplex ist, sodass der Index n eine komplexe Zahl ist. Was bedeutet das? Schreiben wir n als die Summe eines Real- und eines Imaginärteils: n = nR − inI ,

(3.35)

wobei nR und nI reelle Funktionen von ω sind. Wir schreiben inI mit einem Minuszeichen, sodass nI in allen gewöhnlichen optischen Materialien eine positive Größe wird. (In gewöhnlichen inaktiven Materialien – die nicht wie die Laser selbst Lichtquellen sind – ist γ eine positive Zahl, und das verursacht, dass der Imaginärteil von n negativ ist.) Unsere ebene Welle aus (3.21) nimmt in Ausdrücken von n die folgende Form an E x = E0 eiω(t−nz/c) . Schreiben wir n wie in (3.35), so wäre E x = E0 e−ωnI z/c eiω(t−nR z/c) .

(3.36)

Der Ausdruck eiω(t−nR z/c) beschreibt eine Welle, die mit der Geschwindigkeit c/nR läuft, sodass nR das darstellt, was wir gewöhnlich als den Brechungsindex betrachten. Die Amplitude dieser Welle ist aber E0 e−ωnI z/c , was exponentiell mit z abnimmt. Eine graphische Darstellung der elektrischen Feldstärke zu einem bestimmten Zeitpunkt ist als Funktion von z für nI ≈ nR /2π in Abbildung 3.1 gezeigt. Der Imaginärteil des Index stellt die Schwächung der Welle aufgrund des Energieverlustes in den

3.5 Der Brechungsindex einer Mischung

73

e−ωnI z/c

z e−ωnI z/c eiω(t−nR z/c)

Abb. 3.1: Graphische Darstellung von E x zu einer bestimmten Zeit t für nI ≈ nR /2π.

atomaren Oszillatoren dar. Die Intensität der Welle ist proportional zum Quadrat der Amplitude, sodass Intensität ∝ e−2ωnI z/c . Diese Gleichung wird oft geschrieben als Intensität ∝ e−βz , wobei β = 2ωnI /c der Absorptionskoeffizient genannt wird. Somit beschreibt Gleichung (3.33) nicht nur die Theorie des Brechungsindex von Materialien, sondern gleichzeitig auch die Theorie der Lichtabsorption in Materialien. In Materialien, die wir gewöhnlich als transparent betrachten, ist die Größe c/ωnI – die die Dimensionen einer Länge hat – ziemlich groß im Vergleich zu der Dicke des Materials.

3.5

Der Brechungsindex einer Mischung

Es gibt eine weitere Vorhersage unserer Theorie des Brechungsindex, die wir durch Vergleich mit dem Experiment überprüfen können. Betrachten wir eine Mischung aus zwei Materialien. Der Brechungsindex der Mischung ist nicht das Mittel aus den beiden Brechungsindizes, sondern muss durch die Summe zweier Polarisierbarkeiten wie in (3.34) ausgedrückt werden. Fragen wir etwa nach dem Brechungsindex einer Zuckerlösung, so ist die gesamte Polarisierbarkeit die Summe der Polarisierbarkeit des Wassers und der des Zuckers. Jede muss natürlich berechnet werden, indem man für N die Zahl der Moleküle pro Volumeneinheit der speziellen Sorte verwendet. Mit anderen Worten: Für eine gegebene Lösung aus N1 Wassermolekülen, deren Polarisierbarkeit α1 ist, und aus N2 Rohrzuckermolekülen (C12 H22 O11 ), deren Polarisierbarkeit α2 ist, gilt   2 n −1 = N1 α1 + N2 α2 . 3 2 (3.37) n +2

74

3 Der Brechungsindex dichter Materialien

Mithilfe dieser Formel können wir unsere Theorie mit dem Experiment vergleichen, indem wir den Index für verschiedene Rohrzuckerkonzentrationen in Wasser messen. Allerdings machen wir hier einige Annahmen. Unsere Formel gilt unter der Voraussetzung, dass keine chemische Wirkung eintritt, wenn der Rohrzucker gelöst wird, und dass sich die Störungen der einzelnen atomaren Oszillatoren für verschiedene Konzentrationen nicht zu stark ändern. Daher ist unser Resultat wirklich nur näherungsweise gültig. Schauen wir aber, wie gut es ist. Wir haben das Beispiel einer Zuckerlösung gewählt, weil es im Handbook of Chemistry and Physics eine Tabelle von Messungen des Brechungsindex gibt und weil außerdem Zucker ein molekularer Kristall ist, der sich ohne Ionisierung und ohne eine andere Änderung seines chemischen Zustandes löst. In den ersten drei Spalten von Tabelle 3.2 sind die Daten aus dem Handbuch angegeben. Spalte A ist der Prozentsatz an Rohrzucker nach Gewicht, Spalte B ist die gemessene Dichte (g/cm3 ) und Spalte C ist der gemessene Brechungsindex für Licht, dessen Wellenlänge 589,3 Millikron beträgt. Für reinen Zucker haben wir den gemessenen Index von Zuckerkristallen gewählt. Die Kristalle sind nicht isotrop, sodass der gemessene Index in verschiedenen Richtungen verschieden ist. Das Handbuch gibt drei Werte an: n1 = 1,5376,

n2 = 1,5651,

n3 = 1,5705.

Daraus haben wir den Mittelwert gebildet. Nun könnten wir versuchen, n für jede Konzentration zu berechnen, aber wir wissen nicht, welchen Wert wir für α1 bzw. α2 nehmen sollen. Prüfen wir die Theorie in der folgenden Weise: Wir nehmen an, dass die Polarisierbarkeit von Wasser (α1 ) für alle Konzentrationen dieselbe ist, berechnen mithilfe der experimentellen Werte für n die Polarisierbarkeit von Rohrzucker

Tabelle 3.2: Brechungsindex von Rohrzuckerlösungen und Vergleich mit den Vorhersagen von Gleichung (3.37). Daten aus dem Handbuch B

C

A Bruchteil von Rohrzucker nach Gewicht

Dichte (g/m3 )

n bei 20 ◦

0a

0,9982

1,333

0,30 0,50 0,85 1,00b

1,1270 1,2296 1,4454 1,588

1,3811 1,4200 1,5033 1,5577c

a

reines Wasser Zuckerkristalle Mittelwert (siehe Text) d Molekulargewicht von Rohrzucker = 342 e Molekulargewicht von Wasser = 18 b c

D Mole Rohrzuckerd pro Liter N2 /N0

E Mole Wassere pro Liter N1 /N0

F

0

55,5

0,617

0,617

0



0,970 1,798 3,59 4,64

43,8 34,15 12,02 0

0,698 0,759 0,886 0,960

0,487 0,379 0,1335 0

0,211 0,380 0,752 0,960

0,213 0,211 0,210 0,207

3



2

n −1 n2 + 2



G

H

J

N1 α1

N2 α2

N0 α2

3.6 Wellen in Metallen

75

und lösen Gleichung (3.37) für α2 . Wenn die Theorie richtig ist, müssten wir für alle Konzentrationen dasselbe α2 erhalten. Als Erstes müssen wir N1 und N2 kennen: drücken wir sie durch die Avogadro-Zahl N0 aus. Als Volumeneinheit nehmen wir einen Liter (1000 cm3 ). Dann ist Ni /N0 das Gewicht pro Liter dividiert durch das Gewicht des Grammmoleküls. Und das Gewicht pro Liter ist die Dichte (multipliziert mit 1000, um Gramm pro Liter zu erhalten) mal dem Bruchteil des Gewichts des Rohrzuckers bzw. des Wassers. Auf diese Weise erhalten wir N2 /N0 und N1 /N0 in den Spalten D und E der Tabelle. In Spalte F haben wir 3(n2 − 1)/(n2 + 2) aus den experimentellen Werten von n in Spalte C berechnet. Für reines Wasser ist 3(n2 − 1)/(n2 + 2) gleich 0,617, was genau gleich N1 α1 ist. Wir können dann den Rest von Spalte G ausfüllen, da G/E für jede Zeile in demselben Verhältnis – 0,617 : 55,5 – steht. Durch Subtraktion der Spalte G von Spalte F erhalten wir den Rohrzuckerbeitrag N2 α2 , der in Spalte H angegeben ist. Dividieren wir diese Eintragungen durch die N2 /N0 -Werte in Spalte D, so erhalten wir den Wert von N0 α2 in Spalte J. Unserer Theorie nach würden wir erwarten, dass alle Werte von N0 α2 gleich sind. Sie sind zwar nicht genau gleich, liegen aber sehr nahe beieinander. Wir können daraus schließen, dass unsere Vorstellungen fast richtig sind. Wir können sogar darüber hinaus feststellen, dass die Polarisierbarkeit des Zuckermoleküls offenbar nicht sehr stark von seiner Umgebung abhängt – seine Polarisierbarkeit ist in einer verdünnten Lösung fast die gleiche wie im Kristall.

3.6

Wellen in Metallen

Die Theorie, die wir in diesem Kapitel für feste Materialien ausgearbeitet haben, kann mit nur wenig Abänderungen auch auf gute Leiter, wie Metalle, angewandt werden. In Metallen erfahren einige der Elektronen keine Bindungskraft, die sie an irgendeinem bestimmten Atom festhält; es sind diese „freien“ Elektronen, die für die Leitfähigkeit verantwortlich sind. Es gibt andere Elektronen, die gebunden sind, und auf diese ist die aufgestellte Theorie direkt anwendbar. Ihr Einfluss wird jedoch gewöhnlich von den Effekten der Leitungselektronen überdeckt. Wir werden deshalb hier nur die Effekte der freien Elektronen betrachten. Wenn keine rücktreibende Kraft auf das Elektron wirkt – aber trotzdem noch ein gewisser Widerstand gegen seine Bewegung besteht – so unterscheidet sich seine Bewegungsgleichung von Gleichung (3.1) nur dadurch, dass der ω20 x-Term fehlt. Daher haben wir nichts weiter zu tun, als im Rest unserer Ableitungen ω20 = 0 zu setzen – doch gibt es noch einen weiteren Unterschied. Der Grund, dass wir in einem Dielektrikum zwischen dem mittleren und dem lokalen Feld unterscheiden mussten, ist der, dass in einem Isolator jeder der Dipole einen festen Ort hat, sodass er in einer festen Beziehung zu den Orten der anderen Dipole steht. Da sich aber die Leitungselektronen in einem Metall überall umherbewegen, ist das auf sie wirkende Feld im Mittel genau das mittlere Feld E. Also darf die Korrektur, die wir mithilfe von (3.28) an Gleichung (3.8) vorgenommen haben, bei Leitungselektronen nicht angebracht werden. Infolgedessen ist die Formel des Brechungsindex für Metalle die gleiche wie (3.27), nur dass ω0 gleich null gesetzt ist, nämlich   Nq2e 1 2 . (3.38) n =1+ m�0 −ω2 + iγω

76

3 Der Brechungsindex dichter Materialien

Dies berücksichtigt nur den Beitrag der Leitungselektronen, von dem wir annehmen, dass er für Metalle der wichtigste Term ist. uDrift

mittlere Zeit zwischen den Streuungen ist τ

Abb. 3.2: Die Bewegung eines freien Elektrons.

Nun wissen wir auch, wie wir feststellen können, welchen Wert wir für γ verwenden müssen, denn er hängt mit der Leitfähigkeit des Metalls zusammen. In Kapitel 18 von Band II haben wir dargelegt, dass die Leitfähigkeit eines Metalls durch die Diffusion der freien Elektronen durch das Metall bewirkt wird. Die Elektronen laufen auf einem Zickzackweg von einer Streuung zur nächsten; zwischen den Streuungen bewegen sie sich frei, bis auf eine Beschleunigung, die vom mittleren elektrischen Feld verursacht wird (vgl. Abbildung 3.2). In Kapitel 18 von Band II haben wir festgestellt, dass die mittlere Driftgeschwindigkeit genau die Beschleunigung mal der mittleren Zeit τ zwischen den Streuungen ist. Die Beschleunigung ist qe E/m, sodass vDrift =

qe E τ. m

(3.39)

Diese Formel setzte voraus, dass E konstant ist, sodass vDrift eine stetige Geschwindigkeit ist. Da es keine mittlere Beschleunigung gibt, ist die antreibende Kraft gleich der wirkenden Kraft. Wir haben γ definiert, indem wir sagten, dass γmv die antreibende Kraft ist (siehe Gleichung (3.1)), die gleich qe E ist; folglich erhalten wir γ=

1 . τ

(3.40)

Obwohl τ nicht direkt gemessen werden kann, können wir es doch durch Messen der Leitfähigkeit des Metalls bestimmen. Experimentell wurde festgestellt, dass in einem Metall ein elektrisches Feld E einen Strom mit der Stromdichte j erzeugt, der (für isotrope Materialien) proportional zu E ist: j = σ E. Die Proportionalitätskonstante σ heißt die Leitfähigkeit. Genau das erwarten wir nach (3.39), wenn wir setzen j = Nqe vDrift . Dann ist σ=

Nq2e τ. m

(3.41)

Somit können τ – und folglich auch γ – mit der gemessenen elektrischen Leitfähigkeit verknüpft werden. Mithilfe der Beziehungen (3.40) und (3.41) können wir unsere Formel (3.38) für den

3.7 Näherungen für niedrige und hohe Frequenzen

77

Index in der folgenden Form schreiben: n2 = 1 +

σ/�0 , iω(1 + iωτ)

(3.42)

wobei τ=

mσ 1 = . γ Nq2e

(3.43)

Das ist eine bequeme Formel für den Brechungsindex von Metallen.

3.7

Näherungen für niedrige und hohe Frequenzen; Eindringtiefe und Plasmafrequenz

Unser Resultat (3.42) für den Brechungsindex von Metallen sagt ein sehr unterschiedliches Verhalten hinsichtlich der Wellenausbreitung bei verschiedenen Frequenzen vorher. Sehen wir zunächst, was bei niedrigen Frequenzen geschieht. Ist ω hinreichend klein, so können wir (3.42) annähern durch n2 = −i

σ . �0 ω

(3.44)

Nun ist, wie Sie durch Quadrieren nachprüfen können,2 √

1−i −i = √ ; 2

somit ist für niedrige Frequenzen n=

 σ/2�0 ω (1 − i) .

(3.45)

   exp − σω/2�0 c2 z .

(3.46)

e−z/δ ,

(3.47)

Der Real- und der Imaginärteil von n haben also denselben Betrag. Bei einem derart großen Imaginärteil von n wird die Welle in dem Material sehr schnell geschwächt. Mit (3.36) sehen wir, dass die Amplitude einer Welle, die in der z-Richtung läuft, abnimmt wie

Wir schreiben das als

wobei δ der Abstand ist, in dem die Wellenamplitude um den Faktor e−1 = 1/2,72 – oder grob 1/3 – abnimmt. Die Amplitude einer solchen Welle ist in Abbildung 3.3 als Funktion von z 2

Oder Sie schreiben −i = e−iπ/2 ;

√ −i = e−iπ/4 = cos π/4 − i sin π/4, was zu demselben Resultat führt.

78

1

3 Der Brechungsindex dichter Materialien

Amplitude

e−z/δ

0 0



δ Oberfläche



z

Abb. 3.3: Die Amplitude einer transversalen elektromagnetischen Welle in einem Metall als Funktion des Abstands von der Oberfläche.

dargestellt. Da elektromagnetische Wellen nur um diese Strecke in ein Metall eindringen, nennt man δ die Eindringtiefe. Sie ist gegeben durch  δ = 2�0 c2 /σω. (3.48) Was verstehen wir unter „niedrigen“ Frequenzen? Ein Blick auf Gleichung (3.42) zeigt uns, dass sie durch Gleichung (3.44) nur dann angenähert werden kann, wenn ωτ viel kleiner als eins und auch ω�0 /σ viel kleiner als eins ist – das heißt, unsere Näherung für kleine Frequenzen ist anwendbar, wenn ω�

1 τ

ω�

σ . �0

und (3.49)

Sehen wir nach, welchen Frequenzen diese Bedingungen für ein typisches Metall wie Kupfer entsprechen. Wir berechnen τ mithilfe von (3.43) und σ/�0 mithilfe der gemessenen Leitfähigkeit. Die folgenden Daten entnehmen wir einem Handbuch: σ = 5,76 × 107 (Ohm-Meter)−1 , Atomgewicht = 63,5 Gramm, Dichte = 8,9 Gramm cm−3 , Avogadro-Zahl = 6,02 × 1023 (Gramm Atomgewicht)−1 .

Unter der Annahme, dass es pro Atom ein freies Elektron gibt, beträgt die Zahl der Elektronen pro Kubikmeter N = 8,5 × 1028 Meter−3 .

Wir verwenden

qe = 1,6 × 10−19 Coulomb,

�0 = 8,85 × 10−12 Farad · Meter−1 , m = 9,11 × 10−31 kg

3.7 Näherungen für niedrige und hohe Frequenzen

79

und erhalten τ = 2,4 × 10−14 s,

1/τ = 4,1 × 1013 s−1 ,

σ/�0 = 6,5 × 1018 s−1 . Kupfer zeigt also bei kleineren Frequenzen als ungefähr 1012 Hertz das „niederfrequente“ Verhalten, das wir gerade beschrieben haben. (Gemeint sind Wellen, deren Wellenlänge im freien Raum länger als 0,3 mm ist – das sind sehr kurze Radiowellen!) Für diese Wellen beträgt die Eindringtiefe in Kupfer  0,028m2 · s−1 δ= . ω Für Mikrowellen von 10 000 Megahertz (3-cm-Wellen) ist δ = 6,7 × 10−5 cm. Die Welle dringt sehr wenig tief ein. Das erklärt, warum wir bei der Untersuchung von Hohlräumen (oder Wellenleitern) uns nur um die Felder im Innern des Hohlraums und nicht um diejenigen im Metall oder außerhalb des Hohlraums kümmern mussten. Außerdem verstehen wir jetzt, warum die Verluste in einem Hohlraum durch einen dünnen Belag aus Silber oder Gold reduziert werden. Die Verluste beruhen auf den Strömen, die nur in einer dünnen Schicht beträchtlich sind, deren Dicke durch die Eindringtiefe bestimmt ist. Betrachten wir nun den Brechungsindex eines Metalls wie Kupfer bei hohen Frequenzen. Bei sehr hohen Frequenzen ist ωτ sehr viel größer als eins und (3.42) wird gut angenähert durch n2 = 1 −

σ . �0 ω2 τ

(3.50)

Für Wellen mit hohen Frequenzen wird der Index eines Metalls reell – und kleiner als eins! Dies wird auch aus Gleichung (3.38) deutlich, wenn der Dissipationsterm mit γ vernachlässigt wird, wie das für sehr große ω erlaubt ist. Gleichung (3.38) ergibt n2 = 1 −

Nq2e , m�0 ω2

(3.51)

was natürlich dasselbe wie (3.50) ist. Die Größe Nq2e /m�0 haben wir schon früher kennengelernt; wir nannten sie das Quadrat der Plasmafrequenz (Band III, Abschnitt 7.3): ω2p =

Nq2e , �0 m

folglich können wir (3.50) bzw. (3.51) schreiben als n2 = 1 −

 ω 2 p

ω

.

80

3 Der Brechungsindex dichter Materialien

Die Plasmafrequenz ist eine Art „kritische“ Frequenz. Bei ω < ω p hat der Brechungsindex eines Metalls einen Imaginärteil und die Wellen werden geschwächt; doch bei ω >> ω p ist der Index reell und das Metall wird durchlässig. Sie wissen natürlich, dass Metalle einigermaßen durchlässig für Röntgenstrahlen sind. Aber einige Metalle sind sogar im Ultraviolett-Bereich durchlässig. In Tabelle 3.3 geben wir für einige Metalle die experimentell beobachtete Wellenlänge an, bei der sie beginnen, durchlässig zu werden. In der zweiten Spalte geben wir die berechnete kritische Wellenlänge λ p = 2πc/ω p an. Angesichts der Tatsache, dass die experimentelle Wellenlänge nicht allzu gut definiert ist, stimmt die Theorie verhältnismäßig gut mit dem Experiment überein. Tabelle 3.3: Wellenlängen, unterhalb derer das Metall durchlässig wird Metall Li Na K Rb

λ (experimentell) 1550 Å 2100 3150 3400

λ p = 2πc/ω p 1550 Å 2090 2870 3220

Sie fragen sich vielleicht, warum die Plasmafrequenz ω p etwas mit der Ausbreitung elektromagnetischer Wellen in Metallen zu tun haben soll. Die Plasmafrequenz tauchte in Band III, Kapitel 7 als die Eigenfrequenz der Dichteschwingungen der freien Elektronen auf. (Ein Bündel Elektronen wird von elektrischen Kräften abgestoßen und die Trägheit der Elektronen führt zu einer Schwingung der Dichte.) Daher sind longitudinale Plasmawellen bei ω p resonant. Hier aber handelt es sich um transversale elektromagnetische Wellen und wir haben festgestellt, dass transversale Wellen bei Frequenzen unterhalb ω p absorbiert werden. (Es ist eine interessante und keine zufällige Koinzidenz.) Obwohl wir konkret über die Wellenausbreitung in Metallen gesprochen haben, verstehen Sie jetzt die Universalität des Phänomens Physik – dass es nämlich keine Rolle spielt, ob sich die freien Elektronen in einem Metall oder im Plasma der Ionosphäre der Erde oder in der Atmosphäre eines Sterns befinden. Um die Ausbreitung von Radiowellen in der Ionosphäre zu verstehen, können wir dieselben Ausdrücke verwenden – wobei wir natürlich die entsprechenden Werte für N und τ einsetzen müssen. Wir können nun verstehen, warum lange Radiowellen von der Ionosphäre absorbiert oder reflektiert werden, während sie kurze Wellen durchdringen. (Zur Kommunikation mit Satelliten müssen daher kurze Wellen verwendet werden.) Wir haben über die beiden Fälle von extrem hoher und extrem niedriger Frequenz bezüglich der Wellenausbreitung in Metallen gesprochen. Für dazwischenliegende Frequenzen muss die vollständige Formel (3.42) verwandt werden. Im Allgemeinen wird der Brechungsindex sowohl einen Real- als auch einen Imaginärteil haben; die Welle wird geschwächt, während sie sich im Metall ausbreitet. Für sehr dünne Schichten sind Metalle selbst bei optischen Frequenzen etwas durchlässig. Beispielsweise fertigt man für Leute, die an heißen Hochöfen arbeiten, spezielle Schutzbrillen an, indem man eine dünne Schicht Gold auf Glas aufdampft. Das sichtbare Licht kann – mit einem starken Grünstich – verhältnismäßig gut durchdringen, während die Strahlung im Infrarotbereich stark absorbiert wird.

3.7 Näherungen für niedrige und hohe Frequenzen

81

Schließlich auch kann es dem Leser nicht entgangen sein, dass viele dieser Formeln in der einen oder anderen Weise denen für die in Band III, Kapitel 10 besprochene Dielektrizitätskonstante κ ähneln. Die Dielektrizitätskonstante κ bestimmt, wie das Material auf ein konstantes Feld reagiert, das heißt für ω = 0. Wenn Sie die Definition von n und κ sorgfältig betrachten, stellen Sie fest, dass κ einfach der Grenzwert von n2 für ω → 0 ist. Setzen Sie in den Gleichungen dieses Kapitels ω = 0 und n2 = κ, so erhalten Sie tatsächlich die Gleichungen der Theorie der Dielektrizitätskonstanten aus Band III, Kapitel 11.

4

Reflexion an Grenzflächen

Siehe auch: Band II, Kapitel 8, Polarisation

4.1

Reflexion und Brechung von Licht

Das Thema dieses Kapitels ist die Reflexion und Brechung von Licht – oder von elektromagnetischen Wellen im Allgemeinen – an Grenzflächen. Wir haben die Gesetze der Reflexion und der Brechung bereits in den Kapiteln 1 und 8 von Band II besprochen und dort Folgendes gefunden: 1. Der Reflexionswinkel ist gleich dem Einfallswinkel. Mit den Winkeln, die laut Abbildung 4.1 bezeichnet sind, ist (4.1)

θr = θi .

2. Das Produkt n sin θ ist für den einfallenden und den durchgelassenen (gebrochenen) Strahl gleich (snelliussches Gesetz): n1 sin θi = n2 sin θt .

(4.2)

3. Die Intensität des reflektierten Lichts hängt vom Einfallswinkel und auch von der Polarisationsrichtung ab. Für E senkrecht zur Einfallsebene ist der Reflexionskoeffizient R⊥ R⊥ =

refl ekt iert eW elle

θr

θi

lle We e d en fall ein

n1

Ir sin2 (θi − θt ) = . Ii sin2 (θi + θt )

las ge ch r du

(4.3)

e ell W e n se

θt

Grenzfläche

n2

Abb. 4.1: Reflexion und Brechung von Lichtwellen an einer Grenzfläche. (Die Wellenrichtungen sind normal zu den Wellenkämmen.)

84

4 Reflexion an Grenzflächen Für E parallel zur Einfallsebene ist der Reflexionskoeffizient R� R� =

Ir tan2 (θi − θt ) . = Ii tan2 (θi + θt )

4. Für normalen Einfall (und jegliche Polarisation natürlich!) ist 2  Ir n2 − n1 = . Ii n2 + n1

(4.4)

(4.5)

(Früher haben wir i für den Einfalls- und r für den Brechungswinkel gesetzt. Da wir aber r nicht gleichzeitig für den „Refraktions“- und den „Reflexions“-winkel verwenden können, schreiben wir nun θi = Einfallswinkel, θr = Reflexionswinkel und θt = Brechungswinkel.) Unsere früheren Darlegungen gingen eigentlich so weit, wie es das Thema normalerweise verlangt, aber wir werden noch einmal ganz von vorn beginnen und dann einen anderen Weg einschlagen. Warum? Ein Grund dafür ist unsere frühere Annahme, dass die Indizes reell sind (keine Absorption in den Materialien). Aber ein weiterer Grund ist der, dass Sie vom Standpunkt der Maxwell-Gleichungen aus wissen sollten, wie Sie mit Wellenvorgängen an Grenzflächen umzugehen haben. Wir werden natürlich dieselben Antworten wie zuvor erhalten, aber diesmal aus einer direkten Lösung des Wellenproblems und nicht mithilfe einiger geschickter Tricks. Wir wollen betonen, dass die Amplitude bei Grenzflächenreflexion nicht, wie im Fall des Brechungsindex, eine Eigenschaft des Materials ist. Es ist eine „Eigenschaft der Oberfläche“ und zwar eine, die genau davon abhängt, wie die Grenzfläche beschaffen ist. Eine dünne Schicht von fremdem Material auf der Grenzfläche zwischen zwei Materialien mit den Brechungsindizes n1 und n2 wird gewöhnlich die Reflexion ändern. (Dabei gibt es alle Arten von Interferenzphänomenen – beispielsweise die Farben von Ölfilmen. Eine geeignete Schichtdicke kann sogar für eine gegebene Frequenz die reflektierte Amplitude auf null reduzieren; darauf beruht die Wirkungsweise des Antireflexbelages auf Linsen.) Die Formeln, die wir ableiten werden, sind nur dann richtig, wenn die Änderung des Brechungsindex plötzlich geschieht – innerhalb eines Abstands, der klein im Vergleich zu einer Wellenlänge ist. Bei Licht ist die Wellenlänge ungefähr 5000 Å; daher bezeichnen wir mit „glatt“ eine Oberfläche, auf der sich die Bedingungen über einen Abstand von nur wenigen Atomen (oder einigen Ångström) ändern. Unsere Gleichungen werden für Licht bei glatt polierten Grenzflächen gelten. Ändert sich der Index nur langsam, über einen Abstand von mehreren Wellenlängen, so ist die Reflexion im Allgemeinen nur sehr gering.

4.2

Wellen in dichten Materialien

Zunächst erinnern wir uns an den in Kapitel 9 von Band II verwendeten bequemen Weg, eine sinusförmige, ebene Welle zu beschreiben. Jede Feldkomponente in der Welle (wir verwenden E als ein Beispiel) kann in der Form geschrieben werden E = E0 ei(ωt−k·r) ,

(4.6)

4.2 Wellen in dichten Materialien

85

wobei E die Amplitude am Punkt r (vom Ursprung) zur Zeit t darstellt. Der Vektor k zeigt in die Richtung, in der die Welle läuft, und sein Betrag |k| = k = 2π/λ ist die Wellenzahl. Die Phasengeschwindigkeit der Welle ist vph = ω/k; für eine Lichtwelle in einem Material mit dem Index n ist vph = c/n, sodass k=

ωn . c

(4.7)

Nehmen wir an, k zeige in die z-Richtung; dann ist k · r gleich kz, eine Form, die wir schon oft verwendet haben. Für ein k in jeder anderen Richtung müssen wir z durch rk ersetzen, das der Abstand vom Ursprung in der k-Richtung ist; das heißt, wir müssen kz durch krk ersetzen, was gleich k · r ist. (Siehe Abbildung 4.2.) Somit ist (4.6) eine bequeme Darstellung einer Welle in beliebiger Richtung.

y P r k

rk

λ

x Wellenkämme

Abb. 4.2: Für eine in der k-Richtung laufende Welle ist die Phase am Punkt P gleich (ωt − k · r).

Wir müssen uns natürlich daran erinnern, dass k · r = k x x + ky y + kz z, wobei k x , ky und kz die Komponenten von k entlang der drei Achsen sind. Wir haben schon darauf hingewiesen, dass (ω, k x , ky , kz ) ein Vierervektor ist und dass sein Skalarprodukt mit (t, x, y, z) eine Invariante ist. Somit ist die Phase einer Welle eine Invariante und (4.6) kann geschrieben werden als E = E 0 eikμ xμ . Aber im Augenblick brauchen wir nicht so anspruchsvoll zu sein. Für ein sinusförmiges E wie in (4.6) ist ∂E/∂t dasselbe wie iωE, ∂E/∂x ist – ik x E und analog für die anderen Komponenten. Sie sehen, warum es praktisch ist, die Form (4.6) zu verwenden, wenn man es mit Differentialgleichungen zu tun hat – Differentiationen werden durch Multiplikationen ersetzt. Ein weiterer nützlicher Aspekt: Die Operation ∇ = (∂/∂x, ∂/∂y, ∂/∂z) wird durch die drei Multiplikationen (−ik x , −iky , −ikz ) ersetzt. Doch diese drei Faktoren transfor-

86

4 Reflexion an Grenzflächen

mieren sich wie die Komponenten des Vektors k, sodass der Operator ∇ durch Multiplikation mit −ik ersetzt wird: ∂ → iω, ∂t ∇ → −i k.

(4.8)

Das gilt für jede Operation mit ∇− sei es der Gradient, die Divergenz oder die Rotation. Zum Beispiel ist die z-Komponente von ∇ × E ∂Ey ∂E x − . ∂x ∂y Ändern sich sowohl Ey als auch E x wie e−ik·r , so erhalten wir −ik x Ey + iky E x , wobei es sich, wie Sie sehen, um die z-Komponente von −ik × E handelt.

Damit haben wir die sehr nützliche allgemeine Situation vorliegen, dass wir beim Bilden des Gradienten eines Ausdrucks, der sich wie eine Welle in drei Dimensionen verhält (solche Größen sind ein wichtiger Bestandteil der Physik), die Ableitungen immer schnell und fast automatisch ausführen können, wenn wir uns daran erinnern, dass die Operation ∇ äquivalent mit einer Multiplikation mit −ik ist. Beispielsweise wird die Faraday-Gleichung ∇× E=−

∂B ∂t

für eine Welle zu −i k × E = −iω B. Dem entnehmen wir, dass B=

k×E , ω

(4.9)

was dem früher für Wellen im freien Raum gefundenen Resultat entspricht – dass nämlich in einer Welle B im rechten Winkel zu E und zur Wellenrichtung ist. (Im freien Raum ist ω/k = c.) Sie können sich das positive Vorzeichen in (4.9) mithilfe der Tatsache merken, dass k in Richtung des Poynting-Vektors S = �0 c2 E × B zeigt.

Wenn Sie die Regel (4.8) auf die anderen Maxwell-Gleichungen anwenden, so erhalten Sie wiederum die Resultate des vorhergehenden Kapitels und insbesondere, dass k · k = k2 =

ω2 n2 . c2

Aber da wir das bereits wissen, wollen wir es nicht noch einmal herleiten.

(4.10)

4.2 Wellen in dichten Materialien

87

Zu Ihrer Unterhaltung versuchen Sie doch einmal das folgende gefürchtete Problem zu lösen, das um 1890 der schwierigste Test für Diplomanden war: Man löse die Maxwell-Gleichungen für ebene Wellen in einem anisotropen Kristall, das heißt, wenn die Polarisation P über einen Polarisierbarkeitstensor mit der elektrischen Feldstärke E verknüpft ist. Sie sollten Ihre Achsen natürlich entlang den Hauptachsen des Tensors wählen, sodass der Zusammenhang besonders einfach wird (es ist dann P x = αa E x , Py = αb Ey und Pz = αc Ez ), die Wellen sollen aber eine beliebige Richtung und der Polarisation haben. Sie können die Relation zwischen E und B finden und wie sich k mit der Richtung und Polarisation der Welle ändert. Sie werden dann die Optik eines anisotropen Kristalls verstehen. Am besten beginnen Sie mit dem einfacheren Fall eines doppelbrechenden Kristalls – wie Kalzit – bei dem zwei der Polarisierbarkeiten gleich sind (etwa αb = αc ), und sehen dann, ob Sie verstehen können, warum Sie alles doppelt sehen, wenn Sie durch einen solchen Kristall hindurchschauen. Ist Ihnen das gelungen, so versuchen Sie den kompliziertesten Fall, in dem alle drei α’s verschieden sind. Danach werden Sie wissen, ob Sie sich mit einem Diplomanden von 1890 messen können. Wir betrachten aber in diesem Kapitel nur isotrope Substanzen. y

Et

Er k�

�� ky�� k

ky�

k�x

k��x θt

θr θi ky

k kx

Ei

x

n1

Abb. 4.3: Die Ausbreitungsvektoren k, k� und k�� für die einfallende, die reflektierte und die durchgelassene Welle.

n2

Erfahrungsgemäß wissen wir, dass eine reflektierte und eine durchgelassene (gebrochene) Welle entsteht, wenn eine ebene Welle auf eine Grenzfläche zwischen zwei verschiedenen Materialien – etwa Luft und Glas, oder Wasser und Öl – trifft. Nehmen wir nichts weiter als das an und sehen wir, was wir daraus herleiten können. Wir wählen unsere Achsen so, dass die yz-Ebene in der Grenzfläche und die xy-Ebene senkrecht zu den Wellenflächen der einfallenden Welle liegt, wie es in Abbildung 4.3 gezeigt ist. Der elektrische Vektor der einfallenden Welle kann dann geschrieben werden als Ei = E0 ei(ωt−k·r) .

(4.11)

Da k senkrecht zur z-Achse ist, gilt k · r = k x x + ky y.

(4.12)

Er = E�0 ei(ω t−k ·r) ,

(4.13)

Für die reflektierte Welle schreiben wir �



88

4 Reflexion an Grenzflächen

sodass ihre Frequenz ω� , ihre Wellenzahl k� und ihre Amplitude E�0 ist. (Wir wissen natürlich, dass die Frequenz und der Betrag von k� dieselben wie für die einfallende Welle sind, aber wir werden nicht einmal das annehmen. Es soll sich aus dem mathematischen Apparat ergeben.) Schließlich schreiben wir für die durchgelassene Welle Et = E��0 ei(ω

��

t−k�� ·r)

(4.14)

.

Wir wissen, dass eine der Maxwell-Gleichungen (4.9) liefert; infolgedessen haben wir für die drei Wellen Bi =

k × Ei , ω

Br =

k� × Er , ω�

Bt =

k�� × Et . ω��

(4.15)

Bezeichnen wir außerdem die Brechungsindizes der beiden Medien mit n1 und n2 , so erhalten wir aus (4.10) k2 = k2x + ky2 =

ω2 n21 . c2

(4.16)

Da die reflektierte Welle im gleichen Material läuft, ist k� 2 =

ω� 2 n21 , c2

(4.17)

während für die durchgelassene Welle gilt: k�� 2 =

4.3

ω�� 2 n22 . c2

(4.18)

Die Randbedingungen

Bisher haben wir lediglich die drei Wellen beschrieben; unser Problem ist nun, die Parameter der reflektierten und der durchgelassenen Welle durch die der einfallenden Welle auszudrücken. Wie können wir vorgehen? Die drei Wellen, die wir beschrieben haben, erfüllen jeweils die Maxwell-Gleichungen in einem homogenen Material, aber die maxwellschen Gleichungen müssen auch am Rand, also an der Grenzfläche zwischen zwei verschiedenen Materialien erfüllt sein. Wir müssen also jetzt nachsehen, was unmittelbar am Rand geschieht. Es stellt sich heraus, dass die Maxwell-Gleichungen verlangen, dass die drei Wellen in einer gewissen Weise zusammenpassen. Damit ist zum Beispiel gemeint, dass die y-Komponente des elektrischen Feldes E auf beiden Seiten des Randes dieselbe sein muss. Das verlangt das Faradaysche Gesetz ∇× E=−

∂B , ∂t

(4.19)

was wir auf folgende Weise sehen können. Betrachten wir eine kleine rechteckige Schleife Γ, die den Rand enthält, wie es Abbildung 4.4 zeigt. Gleichung (4.19) besagt, dass das Linienintegral von E um Γ gleich der Änderungsrate des Flusses von B durch die Schleife ist:   ∂ B · n da. E·ds = − ∂t Γ

4.3 Die Randbedingungen

89

Stellen wir uns nun vor, dass das Rechteck sehr schmal ist, sodass die Schleife eine infinitesimale Fläche einschließt. Bleibt B endlich (und es gibt keinen Grund, warum es am Rand unendlich werden sollte!), so ist der Fluss durch den Flächeninhalt null. Also muss auch das Linienintegral von E null sein. Sind Ey1 und Ey2 die Komponenten des Feldes auf beiden Seiten der Grenzfläche und ist die Länge des Rechtecks l, so erhalten wir Ey2 l − Ey1 l = 0 oder Ey1 = Ey2 ,

(4.20)

wie behauptet wurde. Das gibt uns eine Relation zwischen den Feldern der drei Wellen. y

Γ Ey2

Ey1

n1

n2

x

Abb. 4.4: Die  Randbedingung Ey1 = Ey2 erhält man aus dem Gesetz Γ E ds = 0.

Die Untersuchung der Konsequenzen der Maxwell-Gleichungen an der Grenzfläche heißt die „Bestimmung der Randbedingungen“. Gewöhnlich geschieht das, indem man möglichst viele Gleichungen wie (4.20) herleitet, und zwar mithilfe von Überlegungen bezüglich kleiner Rechtecke wie Γ in Abbildung 4.4, oder unter Verwendung von kleinen gaußschen Flächen, die die Grenzflächen einschließen. Obwohl das ein völlig legitimer Weg ist vorzugehen, entsteht dabei leicht der Eindruck, dass die Behandlung der Randgebiete für jedes physikalische Problem ein anderes ist. Wie sind beispielsweise beim Problem des Wärmestroms durch eine Trennfläche die Temperaturen auf den beiden Seiten miteinander verknüpft? Nun, Sie könnten erstens einmal bedenken, dass der Wärmestrom zum Rand auf der einen Seite gleich dem Wärmestrom weg vom Rand auf der anderen Seite ist. Es ist meistens möglich und allgemein ganz nützlich, die Randbedingungen mithilfe solcher Überlegungen zu ermitteln. Es kann jedoch vorkommen, dass Sie bei der Lösung eines Problems nur wenige Gleichungen zur Verfügung haben und dass Sie nicht auf den ersten Blick sehen, welche physikalischen Überlegungen anzustellen sind. Obwohl wir im Augenblick an einem konkreten elektromagnetischen Problem interessiert sind, bei dem wir die physikalischen Überlegungen anstellen können, wollen wir Ihnen eine Methode zeigen, nach der man bei jedem Problem vorgehen kann – einen allgemeinen Weg, direkt aus den Differentialgleichungen herzuleiten, was an einer Grenze geschieht.

90

4 Reflexion an Grenzflächen

Wir beginnen damit, alle Maxwell-Gleichungen für ein Dielektrikum aufzuschreiben – diesmal sind wir sehr genau und schreiben explizit alle Komponenten aus: ∇· P �     0 ∂P x ∂Py ∂Pz ∂E x ∂Ey ∂Ez + + =− + + �0 ∂x ∂y ∂z ∂x ∂y ∂z

∇· E=−

∂B ∂t ∂Ez ∂Ey ∂B x − =− ∂y ∂z ∂t ∂By ∂E x ∂Ez − =− ∂z ∂x ∂t ∂Ey ∂E x ∂Bz − =− ∂x ∂y ∂t

∇× E=−

(4.21) (4.22a) (4.22b) (4.22c) (4.22d)

∇· B=0

∂B x ∂By ∂Bz + + =0 ∂x ∂y ∂z

1 ∂P ∂E + �0 ∂t ∂t   ∂B ∂B y z − = c2 ∂y ∂z   ∂B ∂Bz x c2 − = ∂z ∂x  ∂B ∂B x  y − = c2 ∂x ∂y

(4.23)

c2 ∇ × B =

1 ∂P x ∂E x + �0 ∂t ∂t 1 ∂Py ∂Ey + �0 ∂t ∂t 1 ∂Pz ∂Ez + �0 ∂t ∂t

(4.24a) (4.24b) (4.24c)

Diese Gleichungen müssen alle im Bereich 1 (links vom Rand) und im Bereich 2 (rechts vom Rand) gelten. Die Lösungen in den Bereichen 1 und 2 haben wir bereits angeschrieben. Schließlich müssen sie auch im Innern des Randgebietes erfüllt sein, das wir den Bereich 3 nennen. Obwohl wir uns den Rand gewöhnlich als scharfe Unstetigkeit vorstellen, ist er das in Wirklichkeit nicht. Die physikalischen Eigenschaften ändern sich zwar schnell, aber nicht unendlich schnell. Jedenfalls können wir uns vorstellen, dass zwischen Bereich 1 und Bereich 2 auf einer kurzen Strecke, die wir den Bereich 3 nennen, ein sehr schneller, aber stetiger Übergang des Brechungsindex erfolgt. Außerdem erfahren alle Feldgrößen wie P x oder Ey etc. im Bereich 3 eine ähnliche Art von Übergang. Auch in diesem Bereich müssen die Differentialgleichungen erfüllt sein und dadurch, dass wir den Differentialgleichungen in diesem Bereich folgen, ist es möglich, zu den erforderlichen „Randbedingungen“ zu gelangen. Betrachten wir beispielsweise einen Rand zwischen Vakuum (Bereich 1) und Glas (Bereich 2). Es gibt nichts Polarisierbares im Vakuum, deshalb ist P1 = 0. Nehmen wir an, es gibt eine gewisse Polarisation P2 im Glas. Zwischen dem Vakuum und dem Glas gibt es einen stetigen, aber raschen Übergang. Betrachten wir eine Komponente von P, sagen wir P x , so könnte sie sich

4.3 Die Randbedingungen

91

wie in Abbildung 4.5 (a) ändern. Nehmen wir nun unsere erste Gleichung, (4.21). Sie enthält Ableitungen der Komponenten von P nach x, y und z. Die y- und z-Ableitungen sind uninteressant; in diesen Richtungen ereignet sich nichts von Bedeutung. Aber die x-Ableitung von P x nimmt im Bereich 3 aufgrund der enormen Steigung von P x sehr große Werte an. Die Ableitung ∂P x /∂x hat am Rand eine sehr scharfe Spitze, wie das Abbildung 4.5 (b) zeigt. Denken wir uns den Rand zu einer noch dünneren Schicht zusammengedrückt, so reicht die Spitze noch viel höher. Ist der Rand für solche Wellen, an denen wir interessiert sind, wirklich scharf, so ist der Betrag von ∂P x /∂x im Bereich 3 sehr, sehr viel größer als alle Beiträge, die von der Änderung von P in den vom Rand entfernten Teilen der Welle kommen können – folglich vernachlässigen wir alle Änderungen außer denen, die auf den Rand zurückzuführen sind. Px

P x2

(a) P x1 = 0 Bereich 1 Bereich 3

Bereich 2

x

∂P x ∂x (b)

x −�0

∂E x ∂x

(c)

x

Abb. 4.5: Die Felder im Übergangsbereich 3 zwischen zwei verschiedenen Materialien in den Bereichen 1 bzw. 2.

Wie kann nun Gleichung (4.21) erfüllt sein, wenn es auf der rechten Seite eine ungeheuer große Spitze gibt? Nur, wenn es auf der linken Seite eine ebenso ungeheuer große Spitze gibt. Etwas auf der linken Seite muss ebenfalls groß sein. In Frage kommt nur ∂E x /∂x, weil es sich bei den Änderungen mit y und z nur um jene kleinen Effekte der Welle handelt, die wir gerade erwähnt haben. Also muss −�0 (∂E/∂x) wie in der Darstellung von Abbildung 4.5 (c) aussehen – es ist eine genaue Kopie von ∂P x /∂x. Wir erhalten daher �0

∂E x ∂P x =− . ∂x ∂x

92

4 Reflexion an Grenzflächen

Integrieren wir diese Gleichung über x im Bereich 3, so schließen wir, dass �0 (E x2 − E x1 ) = −(P x2 − P x1 ).

(4.25)

Mit anderen Worten: Der Sprung in �0 E x beim Übergang von Bereich 1 nach Bereich 2 muss gleich dem Sprung in – P x sein. Wir können Gleichung (4.25) in der folgenden Form schreiben �0 E x2 + P x2 = �0 E x1 + P x1 ,

(4.26)

woraus hervorgeht, dass die Größe (�0 E x + P x ) die gleichen Werte in Bereich 2 und Bereich 1 hat. Man sagt dann: die Größe (�0 E x + P x ) ist am Rand stetig. Auf diese Weise erhalten wir eine unserer Randbedingungen. Obwohl wir zur Veranschaulichung den Fall gewählt haben, in dem P1 null ist, weil wir als Bereich 1 das Vakuum gewählt haben, ist klar, dass dieselbe Überlegung auch bei zwei beliebigen anderen Materialien in den beiden Bereichen anwendbar ist; somit ist Gleichung (4.26) allgemein richtig. Gehen wir nun die restlichen Maxwell-Gleichungen durch und sehen, was uns jede von ihnen vermittelt. Als Nächstes nehmen wir Gleichung (4.22a). Es gibt keine x-Ableitung, also sagt sie uns gar nichts. (Erinnern Sie sich daran, dass die Felder selbst am Rand nicht besonders groß werden; nur die Ableitungen nach x können so riesig werden, dass sie die Gleichung beherrschen.) Untersuchen wir dann (4.22b). Ah! Da ist eine x-Ableitung! Wir haben links ∂Ez /∂x. Nehmen wir an, es habe eine riesige Ableitung. Aber Moment! Es gibt nichts Entsprechendes auf der rechten Seite; deshalb kann Ez keinen Sprung beim Übergang von Bereich 1 nach Bereich 2 machen. (Würde es das tun, dann gäbe es eine Spitze auf der linken Seite von Gleichung (4.22b), aber keine auf der rechten, und die Gleichung wäre falsch.) Somit haben wir eine weitere Bedingung: Ez2 = Ez1 .

(4.27)

Mit derselben Überlegung ergibt Gleichung (4.22c) Ey2 = Ey1 .

(4.28)

Dieses Ergebnis ist genau das, was wir in (4.20) durch eine Überlegung bezüglich des Linienintegrals erhielten. Wir gehen weiter zu Gleichung (4.23). Der einzige Ausdruck, der eine Spitze haben könnte, ist ∂B x /∂x. Aber rechts gibt es nichts Entsprechendes; daher schließen wir, dass B x2 = B x1 .

(4.29)

Auf zur letzten Gruppe der Maxwell-Gleichungen! Gleichung (4.24a) ergibt nichts, da keine x-Ableitungen vorliegen. Gleichung (4.24b) hat eine, −c2 ∂Bz /∂x, aber auch hier gibt es rechts nichts Entsprechendes dazu. Wir erhalten Bz2 = Bz1.

(4.30)

Die letzte Gleichung ist analog und ergibt By2 = By1 .

(4.31)

4.4 Reflektierte und durchgelassene Wellen

93

Die letzten drei Gleichungen sagen uns, dass B2 = B1 . Wir wollen jedoch betonen, dass wir dieses Resultat nur dann erhalten, wenn die Materialien auf beiden Seiten des Randes nicht magnetisch sind – oder besser, wenn wir alle magnetischen Effekte der Materialien vernachlässigen können. Das ist gewöhnlich bei den meisten Materialien möglich, außer bei den ferromagnetischen. (Wir werden die magnetischen Eigenschaften der Materialien in späteren Kapiteln behandeln.) Unser Programm hat uns auf die sechs Relationen zwischen den Feldern in Bereich 1 und denen in Bereich 2 geführt. Wir haben sie in Tabelle 4.1 zusammengestellt. Wir können sie dazu verwenden, die Wellen in den beiden Bereichen aneinander anzuschließen. Wir wollen jedoch betonen, dass die Idee, die wir gerade benützt haben, in jeder physikalischen Situation funktioniert, in der zwei Differentialgleichungen vorgelegt sind und eine Lösung gesucht wird, die einen scharfen Rand zwischen zwei Gebieten durchdringt, an dem sich eine Eigenschaft ändert. Für unsere augenblicklichen Zwecke hätten wir diese Gleichungen leicht mithilfe von Überlegungen bezüglich der Flüsse und Zirkulationen am Rand herleiten können. (Sie können versuchen, ob Sie auf diese Weise dasselbe Resultat erhalten.) Jetzt aber haben Sie eine Methode gesehen, die funktioniert, falls Sie einmal steckenbleiben und keine einfache physikalische Überlegung finden sollten, die Ihnen sagt, was am Rand passiert – Sie können dann einfach mit den Gleichungen arbeiten. Tabelle 4.1: Randbedingungen an der Trennfläche zu einem Dielektrikum. (Die Trennfläche liegt in der yz-Ebene).

�0 E1 + P1 ) x ( E1 )y ( E1 )z B1

4.4

= (�0 E2 + P2 ) x = ( E2 )y = ( E2 )z = B2

Reflektierte und durchgelassene Wellen

Nun sind wir so weit, dass wir die Randbedingungen auf die Wellen anwenden können, die wir in Abschnitt 4.2 aufgeschrieben haben. Wir hatten: Ei = E0 ei(ωt−kx x−ky y) , � � � Er = E� ei(ω t−kx x−ky y) , 0

Et =

�� �� �� E��0 ei(ω t−kx x−ky y) ,

k × Ei , ω k� × Er Br = , ω� k�� × Et Bt = . ω�� Bi =

(4.32) (4.33) (4.34) (4.35) (4.36) (4.37)

94

4 Reflexion an Grenzflächen

Wir wissen noch ein kleines bisschen mehr: E ist für jede Welle senkrecht zum Ausbreitungsvektor k. Die Resultate hängen von der Richtung des E-Vektors (der „Polarisation“) der einlaufenden Welle ab. Die Analyse wird stark vereinfacht, wenn wir den Fall einer einlaufenden Welle mit ihrem E-Vektor parallel zur „Einfallsebene“ (das ist die xy-Ebene) und den Fall einer einlaufenden Welle mit dem E-Vektor senkrecht zur Einfallsebene getrennt behandeln. Eine Welle mit einer anderen Polarisation ist dann einfach eine Linearkombination von zwei solchen Wellen. Mit anderen Worten: Die Intensitäten der reflektierten und der durchgelassenen Welle sind für verschiedene Polarisationen unterschiedlich und es ist leichter, die beiden einfachsten Fälle zu wählen und sie getrennt zu behandeln. y k

Br

Er

Ei

k

Et

Bt x

k Trennfläche

Bi n1

n2

Abb. 4.6: Polarisation der reflektierten und der durchgelassenen Welle, wenn das E-Feld der einlaufenden Welle senkrecht zur Einfallsebene ist.

Wir führen die Analyse für eine einlaufende Welle durch, die senkrecht zur Einfallsebene polarisiert ist, und geben dann einfach das Resultat für die andere an. Wir mogeln ein wenig, indem wir den einfachsten Fall betrachten, aber das Prinzip ist in beiden Fällen dasselbe. Wir nehmen also an, dass Ei nur eine z-Komponente hat; da alle E-Vektoren in dieselbe Richtung zeigen, können wir die Vektorzeichen weglassen. Wenn beide Materialien isotrop sind, erfolgen auch die induzierten Ladungsschwingungen im Material in der z-Richtung, und das E-Feld der durchgelassenen und das der durch die Polarisation erzeugten Welle hat nur eine z-Komponente. Somit sind für alle drei Wellen E x und Ey und P x und Py null. Die E- und B-Vektoren der Wellen zeigen in die in Abbildung 4.6 angegebenen Richtungen. (Wir weichen jetzt etwas von unserem ursprünglichen Plan, alles aus den Gleichungen abzuleiten, ab und schlagen den kürzeren Weg ein: Dieses Resultat würden wir auch mithilfe der Randbedingungen erhalten, doch ersparen wir uns eine Menge Algebra, wenn wir die physikalische Überlegung verwenden. Wenn Sie Zeit haben, versuchen Sie doch einmal, ob Sie dasselbe Resultat aus den Gleichungen erhalten. Es ist klar, dass das, was wir gesagt haben, mit den Gleichungen übereinstimmt; wir haben nur nicht gezeigt, dass es keine anderen Möglichkeiten gibt.) Unsere Randbedingungen, die Gleichungen (4.26) bis (4.31), liefern Relationen zwischen den Komponenten von E und B in den Bereichen 1 und 2. Im Bereich 2 haben wir nur die durchgelassene Welle, aber im Bereich 1 haben wir zwei Wellen. Welche verwenden wir? Die Felder im Bereich 1 sind natürlich die Überlagerung der Felder der einlaufenden und der reflektierten

4.4 Reflektierte und durchgelassene Wellen

95

Welle. (Da jede von ihnen für sich die maxwellschen Gleichungen erfüllt, gilt das auch für ihre Summe.) Wenn wir daher die Randbedingungen verwenden, müssen wir schreiben E1 = Ei + Er,

E2 = Et

und entsprechend für die B’s. Für die Polarisation, die wir betrachten, liefern uns die Gleichungen (4.26) und (4.28) keine neuen Informationen; nur Gleichung (4.27) ist nützlich. Sie besagt Ei + Er = Et am Rand, das heißt, für x = 0. Somit haben wir E0 ei(ωt−ky y) + E0� ei(ω t−ky y) = E0�� ei(ω �



��

t−ky�� y)

,

(4.38)

was für alle t und für alle y richtig sein muss. Betrachten wir zuerst den Fall y = 0. Wir haben dann E0 eiωt + E0� eiω t = E0�� eiω t . �

��

Diese Gleichung besagt, dass die Summe zweier oszillierender Terme gleich einer dritten Oszillation ist. Das kann nur dann eintreten, wenn alle Oszillationen dieselbe Frequenz haben. (Es ist unmöglich, dass drei – oder jede andere Zahl – solcher Ausdrücke mit verschiedenen Frequenzen eine Summe ergeben, die zu jedem Zeitpunkt null ist.) Somit ist ω�� = ω� = ω.

(4.39)

Wie wir bereits wussten, sind die Frequenzen der reflektierten und der durchgelassenen Welle dieselben wie die der einlaufenden Welle. Wir hätten uns wirklich einige Mühe sparen können, wenn wir diese Erkenntnis gleich zu Anfang verwendet hätten, aber wir wollten Ihnen zeigen, dass man sie auch aus den Gleichungen gewinnen kann. Bei der Lösung eines praktischen Problems ist es gewöhnlich das Beste, wenn man alles Bekannte gleich zu Anfang verwendet, das erspart sehr viel Mühe. Definitionsgemäß ist der Betrag von k durch k2 = n2 ω2 /c2 gegeben, sodass auch die Relation gilt k��2 k�2 k2 = = . n22 n21 n21

(4.40)

Nun untersuchen wir Gleichung (4.38) für t = 0. Mithilfe derselben Art von Überlegung, die wir soeben angewandt haben, aber diesmal von der Tatsache ausgehend, dass die Gleichung für alle Werte von y gelten muss, erhalten wir ky�� = ky� = ky . Laut (4.40) ist k� 2 = k2 , somit ist �2 2 2 k�2 x + ky = k x + ky .

(4.41)

96

4 Reflexion an Grenzflächen

Indem wir dies mit (4.41) kombinieren, finden wir, dass 2 k�2 x = kx

oder dass k�x = ±k x . Das positive Vorzeichen ist sinnlos; das würde keine reflektierte Welle, sondern eine zweite einlaufende Welle ergeben und wir haben am Anfang gesagt, dass wir das Problem nur für eine einlaufende Welle lösen wollen. Somit haben wir k�x = −k x .

(4.42)

Die beiden Gleichungen (4.41) und (4.42) sagen uns, dass der Reflexionswinkel gleich dem Einfallswinkel ist, wie wir es erwartet haben. (Siehe Abbildung 4.3.) Die reflektierte Welle ist Er = E0� ei(ωt+kx x−ky y) .

(4.43)

Für die durchgelassene Welle haben wir bereits gefunden, dass ky�� = ky , und k��2 k2 = ; n22 n21

(4.44)

also können wir k��x berechnen. Wir erhalten ��2 − ky��2 = k��2 x =k

n22

n21

k2 − ky2 .

(4.45)

Nehmen wir einen Augenblick lang an, dass n1 , und n2 reelle Zahlen sind (bzw. dass die Imaginärteile der Brechungsindizes zumindest sehr klein sind). Dann sind auch alle k’s relle Zahlen und wir erhalten aus Abbildung 4.3 ky = sin θi, k

ky�� k��

= sin θt .

(4.46)

Aus (4.44) erhalten wir n2 sin θt = n1 sin θi ,

(4.47)

wobei es sich um das snelliussche Brechungsgesetz handelt – wiederum etwas bereits Bekanntes. Sind die Indizes nicht reell, so sind die Wellenzahlen komplex und wir müssen (4.45) verwenden. (Wir könnten auch jetzt die Winkel θi und θt noch durch (4.46) definieren, und das snelliussche Gesetz, Gleichung (4.47), wäre im Allgemeinen richtig. Aber dann sind auch die „Winkel“ komplexe Zahlen, wodurch ihre einfache geometrische Interpretation als Winkel verloren geht. Es ist daher am besten, das Verhalten der Wellen mithilfe der komplexen Werte für k x oder k��x zu beschreiben.) Bisher haben wir nichts Neues gefunden. Wir hatten lediglich das einfältige Vergnügen, aus einem komplizierten mathematischen Mechanismus einige offenkundige Antworten zu erhalten.

4.4 Reflektierte und durchgelassene Wellen

97

Nun sind wir so weit, die Amplituden der Wellen zu ermitteln, die wir bisher nicht kennen. Mithilfe unserer Resultate für die ω’s und k’s können wir die Exponentialfaktoren in (4.38) eliminieren und erhalten E0 + E0� = E0�� .

(4.48)

Da sowohl E0� als auch E0�� unbekannt sind, benötigen wir eine weitere Relation. Wir müssen eine weitere Randbedingung verwenden. Die Gleichungen für E x und Ey sind uns keine Hilfe, denn alle E’s haben nur eine z-Komponente. Wir müssen also die Bedingungen für B verwenden. Versuchen wir es mit Gleichung (4.29): B x2 = B x1 . Gemäß den Gleichungen (4.35) bis (4.37) ist B xi =

ky E i , ω

B xr =

ky� Er ω�

,

B xt =

ky�� Et ω��

.

Erinnern wir uns daran, dass ω�� = ω� = ω und ky�� = ky� = ky , so erhalten wir E0 + E0� = E0�� . Das ist aber noch einmal Gleichung (4.48)! Wir haben einfach unsere Zeit für die Ermittlung von etwas bereits Bekanntem verschwendet. Wir könnten es mit Gleichung (4.30), Bz2 = Bz1 , versuchen, aber B hat keine z-Komponenten! Es bleibt also nur mehr eine Gleichung übrig: By2 = By1 . Für die drei Wellen ist: Byi = −

k x Ei , ω

Byr = −

k�x Er , ω�

Byt = −

k��x Et . ω��

(4.49)

Setzen wir für Ei , Er und Et den Wellenausdruck für x = 0 ein (um am Rand zu sein), so finden wir die Randbedingung k� k�� kx � � �� �� E0 ei(ωt−ky y) + x� E0� ei(ω t−ky y) = x�� E0�� ei(ω t−ky y) . ω ω ω Wiederum sind alle ω’s und ky ’s gleich, sodass sich diese Relation reduziert auf k x E0 + k�x E0� = k��x E0�� .

(4.50)

Das gibt uns eine Gleichung für die E’s, die verschieden von (4.48) ist. Mit den beiden Gleichungen können wir nach E0� und E0�� auflösen. Erinnern wir uns daran, dass k�x = −k x ist, so erhalten wir k x − k��x E0 , k x + k�� 2k x E0 . E0�� = k x + k��x E0� =

(4.51) (4.52)

98

4 Reflexion an Grenzflächen y

k�

k��

Et Br

Bt

Er Ei

x

k Bi

Oberfläche n1

Abb. 4.7: Polarisation der Wellen, wenn das E-Feld der einfallenden Welle parallel zur Einfallsebene ist.

n2

Zusammen mit (4.45) oder (4.46) für k��x geben uns diese beiden Gleichungen, was wir wissen wollten. Wir werden die Konsequenzen dieses Resultats im nächsten Abschnitt untersuchen. Betrachten wir nun eine polarisierte Welle, deren E-Vektor parallel zur Einfallsebene ist, so hat E sowohl x- als auch y-Komponenten, wie es in Abbildung 4.7 gezeigt ist. Die Algebra ist klar, aber komplizierter. (Die Arbeit kann etwas reduziert werden, indem man in diesem Fall alles in Termen der Magnetfelder ausdrückt, die alle in der z-Richtung zeigen.) Man findet n22 k x − n21 k��x

|E0� | =

n22 k x + n21 k��x

|E0�� | =

2n1 n2 k x |E0 |. n22 k x + n21 k��x

|E0 |

(4.53)

und (4.54)

Überprüfen wir nun, ob unsere Resultate mit den früher gewonnenen übereinstimmen. Gleichung (4.53) ist das Resultat, das wir in Kapitel 8 von Band II für das Verhältnis der Intensität der reflektierten Welle zur Intensität der einfallenden Welle erhalten haben. Damals betrachteten wir allerdings nur reelle Brechungsindizes. Für reelle Indizes (und k’s) können wir schreiben ωn1 k x = k cos θi = cos θi , c ωn2 cos θt . k��x = k�� cos θt = c Durch Einsetzen in (4.51) erhalten wir E0� n1 cos θi − n2 cos θt = , E0 n1 cos θi + n2 cos θt

(4.55)

was nicht wie Gleichung (4.3) aussieht. Das ist jedoch der Fall, wenn wir das snelliussche Gesetz verwenden, um die n’s loszuwerden. Setzen wir n2 = n1 sin θi / sin θt und multiplizieren Zähler und Nenner mit sin θt , so erhalten wir E0� cos θi sin θt − sin θi cos θt = . E0 cos θi sin θt + sin θi cos θt

4.5 Reflexion an Metallen

99

Der Zähler bzw. Nenner ist genau der Sinus von −(θi − θt ) bzw. der von (θi + θt ); wir erhalten E0� sin (θi − θt ) =− . E0 sin (θi + θt )

(4.56)

Da sich E0� und E0 auf das gleiche Material beziehen, sind die Intensitäten proportional zu den Quadraten der elektrischen Feldstärken und wir erhalten dasselbe Resultat wie zuvor. In analoger Weise gibt (4.53) dasselbe wie (4.4). Für Wellen, die normal einfallen, ist θi = 0 und θt = 0. Gleichung (4.56) liefert 0/0, was nicht sehr nützlich ist. Wir können jedoch auf Gleichung (4.55) zurückgehen und sehen dann 2  � 2  E0 Ir n1 − n2 = = . Ii E0 n1 + n2

(4.57)

Dieses Resultat ist natürlich für „jede der beiden“ Polarisationen anwendbar, da es bei normalem Einfall keine spezielle „Einfallsebene“ gibt.

4.5

Reflexion an Metallen

Wir können nun unsere Resultate verwenden, um das interessante Phänomen der Reflexion an Metallen zu verstehen. Warum glänzen Metalle? Im letzten Kapitel haben wir gesehen, dass der Brechungsindex von Metallen für einige Frequenzen einen großen Imaginärteil hat. Sehen wir, welche reflektierte Intensität wir erhalten, wenn Licht aus der Luft (mit n = 1) auf ein Material mit n = −inI trifft. Gleichung (4.55) liefert dann (für normalen Einfall) E0� 1 + inI = . E0 1 − inI Für die Intensität der reflektierten Welle müssen wir das Quadrat der Beträge von E0� und E0 bilden:  2 � Ir  E 0  |1 + inI |2 = = Ii |E0 |2 |1 − inI |2 oder

Ir 1 + n2I = = 1. Ii 1 + n2I

(4.58)

Ein Material mit einem Brechungsindex, der eine rein imaginäre Zahl ist, bewirkt zu 100 % Reflexion! Metalle reflektieren zwar nicht 100 %, aber viele reflektieren das sichtbare Licht sehr gut. Mit anderen Worten: Der Imaginärteil ihrer Brechungsindizes ist sehr groß. Wir haben aber gesehen, dass ein großer Imaginärteil des Brechungsindex eine starke Absorption bedeutet. Wir stoßen also auf eine allgemeine Regel: Ist ein beliebiges Material bei einer bestimmten Frequenz ein

100

4 Reflexion an Grenzflächen

grün

we

rot



Glasplatte getrocknete rote Tinte

Abb. 4.8: Ein Material, das Licht bei der Frequenz ω stark absorbiert, kann es bei dieser Frequenz auch reflektieren.

sehr guter Absorber, so werden die Wellen an der Oberfläche stark reflektiert und sehr wenig Strahlung dringt nach innen und wird absorbiert. Sie können diesen Effekt bei starken Farbstoffen beobachten. Reine Kristalle der stärksten Farbstoffe haben einen „metallischen“ Glanz. Wahrscheinlich haben Sie bemerkt, dass am inneren Rand einer Flasche mit lila Tinte der getrocknete Farbstoff eine goldene metallische Reflexion bewirkt, oder dass getrocknete rote Tinte manchmal eine grünliche metallische Reflexion hervorruft. Rote Tinte absorbiert das Grün aus dem durchgelassenen Licht, sodass sehr konzentrierte Tinte für die Frequenzen von grünem Licht eine starke Oberflächenreflexion zeigt. Man kann diesen Effekt sehr leicht zeigen, indem man eine Glasplatte mit roter Tinte bestreicht und diese trocknen lässt. Richtet man einen Strahl weißen Lichts auf die Rückseite der Platte, wie in Abbildung 4.8, so erhält man einen durchgelassenen Strahl von rotem Licht und einen reflektierten Strahl von grünem Licht.

4.6

Totalreflexion

Tritt Licht aus einem Material mit einem reellen Brechungsindex n größer als 1 (zum Beispiel Glas) in ein Material mit einem Brechungsindex n2 gleich 1 (zum Beispiel Luft) über, so ist nach dem snelliusschen Gesetz sin θt = n sin θi . Der Winkel θt der gebrochenen Welle wird 90◦ , wenn der Einfallswinkel θi gleich dem „kritischen Winkel“ θc ist, der gegeben ist durch n sin θc = 1.

(4.59)

Was passiert, wenn θi größer als der kritische Winkel wird? Sie wissen, dass es dann zur Totalreflexion kommt. Aber wie kommt diese zustande? Gehen wir zurück zu Gleichung (4.45), die uns die Wellenzahl k��x für die durchgelassene Welle liefert. Wir hätten k��2 x =

k2 − ky2 . n2

4.6 Totalreflexion

101 y

|Ey |

x

n1

n2

1/kI ∼ λ0

x

Abb. 4.9: Totalreflexion.

Aber ky = k sin θi und k = ωn/c, sodass k��2 x =

 ω2  2 2 1 − n . sin θ i c2

�� Ist n sin θi größer als eins, so ist k��2 x negativ und k x ist rein imaginär, etwa ± ikI . Sie wissen inzwischen, was das bedeutet. Die „durchgelassene“ Welle (4.34) hat dann die Form

Et = E��0 e±kI x ei(ωt−ky y) . Die Wellenamplitude nimmt mit wachsendem x entweder exponentiell zu oder ab. Es ist klar, dass wir hier das negative Vorzeichen brauchen. Die Amplitude der Welle rechts vom Rand verläuft dann wie in Abbildung 4.9. Beachten Sie, dass kI von der Ordnung ω/c ist – was von der Ordnung 1/λ0 ist, dem reziproken der Wellenlänge des Lichts im freien Raum. Wird Licht am Innern einer Glas-Luft-Trennfläche total reflektiert, so existieren zwar Felder in der Luft, aber diese breiten sich nur über eine Entfernung in der Größenordnung der Wellenlänge des Lichts über die Oberfläche hinaus aus. Wir können nun sehen, wie das folgende Problem zu lösen ist: Trifft Licht im Glas unter einem hinreichend großen Winkel auf die Trennfläche, so wird es reflektiert; wird ein anderes Stück Glas auf die Trennfläche gelegt (sodass die „Trennfläche“ effektiv verschwindet), so wird das Licht durchgelassen. Wann genau passiert das? Gewiss muss es einen stetigen Übergang von totaler Reflexion zu keiner Reflexion geben! Die Lösung ist natürlich die: Ist der Luftzwischenraum so eng, dass das exponentiell abfallende Ende der Welle in der Luft zu einer wahrnehmbaren Intensität an der Oberfläche des zweiten Stück Glases führt, so regt es die dort anwesenden Elektronen zu Schwingungen an und erzeugt eine neue Welle (siehe Abbildung 4.10). Eine gewisse Menge Licht wird durchgelassen. (Offensichtlich ist unsere Lösung unvollständig; man müsste alle Gleichungen noch einmal für eine dünne Luftschicht zwischen den beiden Glasbereichen lösen.) Der Durchtrittseffekt kann mit gewöhnlichem Licht nur dann festgestellt werden, wenn der Luftzwischenraum sehr eng ist (in der Größenordnung der Wellenlänge der Lichtwelle, etwa 10−5 cm), aber er lässt sich leicht mit 3-cm-Wellen demonstrieren. Das exponentiell abnehmende Feld erstreckt sich dann über mehrere Zentimeter. Ein Mikrowellenapparat, mit dem man diesen Effekt zeigen kann, ist in Abbildung 4.11 skizziert. Wellen aus einem kleinen 3-cmSender werden auf ein 45◦ -Prisma aus Paraffin gerichtet. Der Brechungsindex von Paraffin ist

102

4 Reflexion an Grenzflächen

n1 = n

n2 =0

Abb. 4.10: Ist ein kleiner Zwischenraum vorhanden, so ist die Reflexion nicht „total“. Jenseits des Zwischenraumes tritt eine durchgelassene Welle auf.

n3 = n

für diese Frequenzen 1,50, folglich beträgt der kritische Winkel 41,5◦ . Somit wird die Welle an der 45◦ -Seite total reflektiert und vom Detektor A aufgefangen, wie es in Abbildung 4.11 (a) gezeigt ist. Wird ein zweites Paraffinprisma mit dem ersten in Berührung gebracht, siehe Teil (b) der Abbildung, so läuft die Welle direkt hindurch und wird von einem Detektor B aufgefangen. Wird ein Zwischenraum von wenigen Zentimetern zwischen den beiden Prismen offengelassen, wie in Teil (c), so erhalten wir sowohl eine durchgelassene als auch eine reflektierte Welle. Außerdem kann das elektrische Feld außerhalb der 45◦ -Seite des Prismas in Abbildung 4.11 (a) angezeigt werden, wenn man den Detektor B bis auf einige Zentimeter an die Oberfläche heranbringt. B (a)

A Sender

Detektor

Detektor

B (b)

(c)

A Sender

Detektor

B

Detektor

A

Sender

Abb. 4.11: Demonstration des Eindringens totalreflektierter Wellen.

Detektor

Detektor

5

Der Magnetismus der Materie

Siehe auch: Band III, Abschnitt 15.1, Auf eine Stromschleife ausgeübte Kräfte.

5.1

Diamagnetismus und Paramagnetismus

In diesem Kapitel wollen wir über die magnetischen Eigenschaften der Stoffe sprechen. Der Stoff, der die auffallendsten magnetischen Eigenschaften hat, ist natürlich Eisen. Ähnliche magnetische Eigenschaften haben auch die Elemente Nickel, Kobalt und – bei genügend niedrigen Temperaturen (unter 16◦ C) – Gadolinium sowie eine Reihe spezieller Legierungen. Diese Art Magnetismus, die Ferromagnetismus heißt, ist so auffallend und kompliziert, dass wir sie in einem eigenen Kapitel besprechen werden. Alle gewöhnlichen Substanzen zeigen jedoch durchaus einige magnetische Effekte, wenn auch sehr kleine – eintausend bis eine Million mal kleiner als die Effekte in ferromagnetischen Materialien. In diesem Kapitel werden wir den gewöhnlichen Magnetismus beschreiben, das heißt, den Magnetismus von anderen als ferromagnetischen Substanzen. Dieser schwache Magnetismus ist von zweifacher Art. Einige Stoffe werden von Magnetfeldern angezogen; andere abgestoßen. Anders als bei dem elektrischen Effekt in der Materie, der immer eine Anziehung der Dielektrika verursacht, hat die magnetische Wirkung zwei verschiedene Vorzeichen. Diese beiden Vorzeichen können mithilfe eines starken Elektromagneten leicht demonstriert werden, der einen scharf zugespitzten und einen flachen Pol hat, wie in Abbildung 5.1 gezeichnet. Das Magnetfeld ist in der Nähe des spitzen Pols viel stärker als in der Nähe des flachen. Wenn ein kleines Stück Materie an einer langen Schnur befestigt und zwischen die Pole gehängt wird, wird im Allgemeinen eine geringe Kraft darauf einwirken.

Faden

kleines Materialstück N

S

Linien von B Pole eines starken Elektromagneten

Abb. 5.1: Ein kleiner Zylinder aus Wismut wird von dem spitzen Pol schwach abgestoßen; ein Stück Aluminium wird dagegen angezogen.

104

5 Der Magnetismus der Materie

Diese geringe Kraft kann man aus der kleinen Verschiebung erkennen, die das aufgehängte Material erfährt, wenn der Elektromagnet eingeschaltet wird. Die wenigen ferromagnetischen Stoffe werden sehr stark zum spitzen Pol hin gezogen; alle anderen Stoffe erfahren nur eine sehr schwache Kraft. Einige werden von dem spitzen Pol schwach angezogen und einige schwach abgestoßen. Den Effekt sieht man am deutlichsten an einem kleinen Wismutzylinder, der von dem Gebiet hoher Feldstärke abgestoßen wird. Stoffe, die auf diese Art abgestoßen werden, heißen diamagnetisch. Wismut ist einer der am stärksten diamagnetischen Stoffe, aber sogar bei ihm ist der Effekt nur recht schwach. Diamagnetismus ist immer sehr schwach. Wenn man ein kleines Aluminiumstück zwischen die Pole hängt, gibt es auch eine schwache Kraft, aber hin zum spitzen Pol. Substanzen wie Aluminium heißen paramagnetisch. (Bei einem solchen Versuch entstehen Wirbelstromkräfte, wenn der Magnet an- und abgeschaltet wird, und diese können starke Impulse ergeben. Sie müssen sorgfältig auf die Endverschiebung achten, nachdem sich der zunächst schwingende Gegenstand beruhigt hat.) Wir möchten jetzt den Mechanismus dieser beiden Effekte beschreiben. Zuerst einmal haben die Atome in vielen Substanzen keine permanenten magnetischen Momente, oder vielmehr, alle magnetischen Momente innerhalb jedes Atoms gleichen sich aus, sodass das Gesamtmoment des Atoms null ist. Die Elektronenspins und die Bahnbewegungen balancieren sich alle genau aus, sodass jedes Atom kein mittleres magnetisches Moment hat. Wenn Sie unter diesen Umständen ein Magnetfeld einschalten, werden innerhalb des Atoms durch Induktion kleine zusätzliche Ströme erzeugt. Nach der lenzschen Regel sind diese Ströme so gerichtet, dass sie dem anwachsenden Feld entgegenwirken. Daher sind die induzierten magnetischen Momente der Atome dem Magnetfeld entgegengerichtet. Dies ist der Mechanismus des Diamagnetismus. Dann gibt es einige Substanzen, bei denen die Atome durchaus ein permanentes magnetisches Moment haben – bei denen die Elektronenbahnen und Spins einen Gesamtkreisstrom bewirken, der nicht null ist. Daher gibt es neben dem diamagnetischen Effekt (der immer vorhanden ist) auch die Möglichkeit, dass sich die einzelnen atomaren magnetischen Momente ausrichten. In diesem Fall versuchen die Momente sich mit dem Magnetfeld auszurichten (auf die Art, wie die permanenten Dipole eines Dielektrikums vom elektrischen Feld ausgerichtet werden), und der induzierte Magnetismus hat das Bestreben, das Magnetfeld zu verstärken. Dieses sind die paramagnetischen Substanzen. Paramagnetismus ist im Allgemeinen ziemlich schwach, weil die Ausrichtungskräfte relativ klein sind im Vergleich zu den Kräften aus der Wärmebewegung, die versuchen, die Ordnung zu zerstören. Daraus folgt auch, dass der Paramagnetismus gewöhnlich empfindlich gegenüber der Temperatur ist. (Der Paramagnetismus, der von den Spins der für die Leitfähigkeit eines Metalls verantwortlichen Elektronen herrührt, bildet eine Ausnahme. Wir wollen dieses Phänomen hier nicht untersuchen.) Bei gewöhnlichem Paramagnetismus ist der Effekt umso stärker, je niedriger die Temperatur ist. Bei niedrigen Temperaturen, wenn die störenden Effekte der Zusammenstöße geringer sind, gelingt die Ausrichtung besser. Diamagnetismus ist andererseits mehr oder weniger unabhängig von der Temperatur. In Substanzen mit immanenten magnetischen Momenten gibt es sowohl einen diamagnetischen als auch einen paramagnetischen Effekt, aber der paramagnetische dominiert gewöhnlich. In Band III, Kapitel 11 haben wir ein ferroelektrisches Material beschrieben, in dem alle elektrischen Dipole durch ihre eigenen wechselseitigen elektrischen Felder ausgerichtet werden. Man kann sich auch das magnetische Analogon der Ferroelektrizität vorstellen, bei dem sich alle atomaren Momente ausrichten und zusammenschließen. Wenn Sie Berechnungen anstel-

5.2 Magnetische Momente und Drehimpuls

105

len, wie dies passieren kann, werden Sie feststellen, dass, weil die magnetischen Kräfte so viel kleiner als die elektrischen Kräfte sind, die Wärmebewegungen diese Anordnung zerstören müssen, und zwar auch noch bei so tiefen Temperaturen wie einige Zehntel Kelvin. Daher wäre es bei Raumtemperatur unmöglich, eine permanente Ausrichtung der Magnete zu erhalten. Andererseits ist dies genau das, was sich im Eisen ereignet – die Magnete werden ausgerichtet. Es gibt eine effektive Kraft zwischen den magnetischen Momenten der einzelnen Eisenatome, die sehr viel größer als die direkte magnetische Wechselwirkung ist. Es ist ein indirekter Effekt, der nur durch die Quantenmechanik erklärt werden kann. Er ist etwa zehntausendmal stärker als die direkte magnetische Wechselwirkung, und er ist die Ursache dafür, dass sich die magnetischen Momente in ferromagnetischen Stoffen ausrichten. Wir besprechen diese spezielle Wechselwirkung in einem späteren Kapitel. Nun, da wir versucht haben, Ihnen eine qualitative Erklärung für den Diamagnetismus und den Paramagnetismus zu geben, müssen wir uns korrigieren und sagen, dass es nicht möglich ist, die magnetischen Effekte der Materie auf irgendeine ehrliche Art vom Standpunkt der klassischen Physik aus zu verstehen. Diese magnetischen Effekte sind ein rein quantenmechanisches Phänomen. Es ist jedoch möglich, einige faule klassische Argumente anzugeben und eine Vorstellung von dem zu erhalten, was vorgeht. Wir könnten es vielleicht so darstellen. Sie können einige klassische Argumente bringen und Vermutungen erhalten, was das Verhalten der Materie betrifft, doch sind diese Argumente in keiner Weise „legal“, weil es absolut wesentlich ist, dass die Quantenmechanik in jedes dieser magnetischen Phänomene einbezogen wird. Andererseits gibt es Situationen, wie in einem Plasma oder einem Raumgebiet mit vielen freien Elektronen, wo die Elektronen durchaus den Gesetzen der klassischen Mechanik gehorchen. Und unter solchen Umständen sind einige der Sätze aus der klassischen Magnetismus-Theorie angebracht. Auch sind die klassischen Argumente aus historischen Gründen nicht ohne Wert. Die ersten Male, als man Vermutungen über die Bedeutung und das Verhalten magnetischer Stoffe anstellte, benutzte man klassische Argumente. Schließlich kann uns die klassische Mechanik, wie wir besprochen haben, einige nützliche Vermutungen darüber liefern, was vielleicht passieren könnte – obwohl der wirklich ehrliche Weg zum Studium dieses Themas darin bestünde, zuerst die Quantenmechanik zu behandeln und dann den Magnetismus vom Standpunkt der Quantenmechanik aus zu verstehen. Andererseits möchten wir nicht warten, bis wir die Quantenmechanik vollauf gelernt haben, um ein einfaches Phänomen wie den Diamagnetismus zu verstehen. Wir werden uns auf die klassische Mechanik stützen müssen und damit halbwegs erklären, was vorgeht, wobei wir jedoch nicht aus den Augen verlieren dürfen, dass die Argumente in Wirklichkeit nicht richtig sind. Wir werden daher eine Reihe von Sätzen über klassischen Magnetismus angeben, die Sie verwirren werden, weil sie verschiedene Dinge beweisen werden. Bis auf den letzten Satz wird jeder von ihnen falsch sein. Außerdem werden sie als Beschreibung der physikalischen Welt alle falsch sein, weil die Quantenmechanik nicht berücksichtigt worden ist.

5.2

Magnetische Momente und Drehimpuls

Der erste Satz, den wir mit der klassischen Mechanik beweisen wollen, ist der folgende: Wenn sich ein Elektron auf einer Kreisbahn bewegt (es kreist zum Beispiel unter dem Einfluss einer Zentralkraft um einen Kern), dann gibt es ein bestimmtes Verhältnis zwischen dem magneti-

106

5 Der Magnetismus der Materie J μ

r u

m, q

Abb. 5.2: Bei einer kreisförmigen Bahn ist das magnetische Moment μ gleich q/2m mal dem Drehimpuls J.

schen Moment und dem Drehimpuls. Bezeichnen wir den Drehimpuls mit J und das magnetische Moment des Elektrons auf der Kreisbahn mit μ. Der Betrag des Drehimpulses ist gleich der Masse des Elektrons mal der Geschwindigkeit mal dem Radius. (Siehe Abbildung 5.2.) Er steht senkrecht auf der Ebene der Kreisbahn. J = mvr.

(5.1)

(Dies ist natürlich eine nichtrelativistische Formel, aber sie ist eine gute Näherung für Atome, weil bei den beteiligten Elektronen v/c im Allgemeinen von der Größenordnung e2 /c = 1/137 oder etwa 1 Prozent ist.) Das magnetische Moment derselben Bahn ist gleich dem Strom mal der Fläche. (Siehe Band III, Abschnitt 14.5.) Der Strom ist gleich der Ladung, die in der Zeiteinheit einen Punkt der Bahn passiert, nämlich der Ladung q, mal der Rotationsfrequenz. Die Frequenz ist gleich der Geschwindigkeit dividiert durch den Umfang der Bahn; daher ist I=q

v . 2πr

Die Fläche ist gleich πr2 , daher ist das magnetische Moment μ=

qvr . 2

(5.2)

Es steht ebenfalls senkrecht auf der Kreisfläche. Daher zeigen J und μ in dieselbe Richtung. μ=

q J (Bahn). 2m

(5.3)

Ihr Verhältnis ist weder von der Geschwindigkeit noch vom Radius abhängig. Bei jedem Teilchen, das sich auf einer Kreisbahn bewegt, ist das magnetische Moment gleich q/2m mal dem Drehimpuls. Bei einem Elektron ist die Ladung negativ, wir können sie −qe nennen; Daher gilt für ein Elektron qe J (Elektronenbahn). (5.4) μ=− 2m Das ist es, was wir klassisch erwarten würden, und wunderbarerweise ist es auch quantenmechanisch richtig. Das ist so eine Sache. Wenn Sie sich jedoch weiterhin auf die klassische Physik beschränken, finden Sie andere Stellen, wo sie die falschen Antworten gibt, und es ist kein leichtes Spiel, wenn man versucht, sich zu merken, welche Antworten richtig und welche

5.2 Magnetische Momente und Drehimpuls

107

falsch sind. Wir könnten ebenso gut direkt angeben, was in der Quantenmechanik allgemein richtig ist. Zuerst einmal ist Gleichung (5.4) richtig für die Bahnbewegung, das ist aber nicht der einzige Magnetismus, den es gibt. Das Elektron hat auch eine Spindrehung um seine eigene Achse (etwa wie sich die Erde um ihre Achse dreht), und als Folge dieses Spins hat es sowohl einen Drehimpuls als auch ein magnetisches Moment. Aber aus Gründen, die rein quantenmechanisch sind – es gibt dafür keine klassische Erklärung – ist das Verhältnis von μ und J beim Elektronenspin zweimal so groß wie bei der Bahnbewegung des Elektrons: qe μ = − J (Elektronenspin). (5.5) m In einem Atom gibt es im Allgemeinen mehrere Elektronen und eine Kombination von Spinund Bahnbewegungen, die einen Gesamtdrehimpuls und ein gesamtes magnetisches Moment aufbaut. Obwohl es keinen klassischen Grund dafür gibt, warum das so sein sollte, ist es in der Quantenmechanik immer richtig, dass (bei einem isolierten Atom) die Richtung des magnetischen Moments genau entgegengesetzt zu der Richtung des Drehimpulses ist. Das Verhältnis der beiden ist nicht unbedingt entweder −qe /m oder −qe /2m, sondern irgendwo dazwischen, weil eine Mischung der Beiträge von den Bahnen und den Spins vorliegt. Wir können schreiben q  e μ = −g J, (5.6) 2m wobei g ein Faktor ist, der für den Zustand des Atoms charakteristisch ist. Er wäre 1 für ein reines Bahnmoment und 2 für ein reines Spinmoment oder irgendeine andere Zahl dazwischen für ein kompliziertes System wie etwa ein Atom. Diese Formel sagt uns natürlich nicht sehr viel. Sie besagt nur, dass das magnetische Moment parallel zum Drehmoment ist, aber einen Betrag haben kann. Die Form von (5.6) ist jedoch bequem, weil g – genannt der „landésche g-Faktor“ – eine dimensionslose Konstante ist, deren Betrag von der Größenordnung eins ist. Es ist eine der Aufgaben der Quantenmechanik, den g-Faktor für einen speziellen atomaren Zustand vorherzusagen. Sie sind vielleicht auch daran interessiert zu erfahren, was in den Kernen vorgeht. In den Kernen gibt es Protonen und Neutronen, die sich vielleicht in einer Art Kreisbahn umherbewegen und die ebenso wie ein Elektron einen intrinsischen Spin haben. Wieder ist das magnetische Moment parallel zum Drehimpuls. Nur ist jetzt die Größenordnung des Verhältnisses der beiden so, wie Sie es bei einem Proton erwarten würden, das auf einer Kreisbahn umläuft, wobei m in (5.3) gleich der Protonenmasse ist. Daher ist es üblich, für die Kerne zu schreiben   qe μ=g J, (5.7) 2m p wobei m p die Protonenmasse ist und g – der Kern-g-Faktor genannt – eine Zahl nahe bei eins ist, die für jeden Kern bestimmt werden muss. Ein weiterer wichtiger Unterschied zwischen einem Kern und einem Elektron besteht darin, dass das magnetische Spinmoment des Protons nicht einen g-Faktor von 2 hat wie das Elektron. Bei einem Proton ist g = 2 · (2,79). Überraschenderweise hat auch das Neutron ein magnetisches Spinmoment, und sein magnetisches Moment im Verhältnis zu seinem Drehimpuls ist 2 · (−1,93). Das Neutron ist, mit anderen Worten, im magnetischen Sinne nicht ganz „neutral“. Es ist wie ein kleiner Magnet, und sein magnetisches Moment ist von der Art einer rotierenden negativen Ladung.

108

5 Der Magnetismus der Materie

5.3

Die Präzession atomarer Magnete

Eine der Folgen davon, dass das magnetische Moment proportional zum Drehimpuls ist, besteht darin, dass ein atomarer Magnet, der sich in einem magnetischen Feld befindet, präzediert. Zuerst wollen wir klassisch argumentieren. Angenommen, wir haben das magnetische Moment μ frei in einem gleichförmigen Magnetfeld aufgehängt. Es wird ein Drehmoment τ verspüren, das gleich μ × B ist und das versucht, es parallel zur Feldrichtung auszurichten. Der atomare Magnet ist aber ein Kreisel – er hat den Drehimpuls J. Daher wird das von dem Magnetfeld herrührende Drehmoment den Magneten nicht veranlassen, sich auszurichten. Stattdessen wird der Magnet präzedieren, wie wir bei der Untersuchung des Kreisels in Kapitel 20 von Band I gesehen haben. Der Drehimpuls – und damit das magnetische Moment – präzedieren um eine Achse parallel zum Magnetfeld. Wir können die Präzessionsgeschwindigkeit nach demselben Verfahren ermitteln, das wir in Kapitel 20 des ersten Bandes benutzt haben.

| J | sin

θ J ΔJ

J

ωp



θ Abb. 5.3: Ein Objekt mit Drehimpuls J und einem parallelen magnetischen Moment μ, das sich in einem Magnetfeld B befindet, präzediert mit der Winkelgeschwindigkeit ω p .

B

Nehmen wir an, dass sich in einer kurzen Zeit Δt der Drehimpuls von J nach J � ändert, wie in Abbildung 5.3 gezeichnet, und dabei immer denselben Winkel θ in Bezug auf die Richtung des Magnetfelds B beibehält. Nennen wir die Winkelgeschwindigkeit der Präzession ω p , sodass in der Zeit Δt der Winkel der Präzession ω p Δt ist. Aus der Geometrie der Figur erkennen wir, dass die Änderung des Drehimpulses in der Zeit Δt ΔJ = (J sin θ)(ω p Δt) ist. Daher ist die Änderungsgeschwindigkeit des Drehimpulses dJ = ω p J sin θ, dt

(5.8)

was gleich dem Drehmoment sein muss: τ = μB sin θ.

(5.9)

Die Winkelgeschwindigkeit der Präzession ist damit ωp =

μ B. J

(5.10)

5.4 Diamagnetismus

109

Wenn wir μ/J gemäß (5.6) ersetzen, sehen wir, dass für ein atomares System wegen qe B (5.11) 2m die Präzessionsfrequenz zu B proportional ist. Es ist nützlich, sich zu merken, dass für ein Atom (oder Elektron) ωp = (1,4 Megahertz/Gauß) g · B, (5.12) fp = 2π und für einen Kern ωp fp = = (0,76 Kilohertz/Gauß) g · B. (5.13) 2π (Die Formeln für Atome und Kerne sind nur wegen der in den beiden Fällen unterschiedlichen Konventionen bezüglich g verschieden.) ωp = g

Nach der klassischen Theorie sollten also die Elektronenbahnen – und Spins – eines Atoms in einem Magnetfeld präzedieren. Ist das auch quantenmechanisch richtig? Es ist im Wesentlichen richtig, nur hat dort die „Präzession“ eine andere Bedeutung. In der Quantenmechanik kann man über die Richtung des Drehimpulses nicht in demselben Sinne sprechen, wie man es klassisch tut; nichtsdestoweniger gibt es eine sehr gute Analogie – sie ist so gut, dass wir die Bezeichnung „Präzession“ beibehalten. Wir werden darauf später zu sprechen kommen, wenn wir zur quantenmechanischen Behandlung übergehen.

5.4

Diamagnetismus

Als Nächstes möchten wir den Diamagnetismus vom klassischen Standpunkt aus betrachten. Das kann auf mehrere Arten erfolgen, eine hübsche Methode ist aber die folgende. Nehmen wir an, wir schalten in der Nähe eines Atoms langsam ein Magnetfeld ein. Während sich das Magnetfeld ändert, wird durch magnetische Induktion ein elektrisches Feld erzeugt. Nach dem Faradayschen Gesetz ist das Linienintegral von E auf einem geschlossenen Weg gleich der Änderungsgeschwindigkeit des magnetischen Flusses durch die vom Weg eingeschlossene Fläche. Angenommen, wir nehmen einen Weg Γ, der ein Kreis vom Radius r ist, dessen Mittelpunkt mit dem Mittelpunkt des Atoms übereinstimmt, wie in Abbildung 5.4 gezeigt. Die mittlere tangentiale elektrische Feldstärke E auf diesem Weg ist gegeben durch d (Bπr2), dt und es gibt ein umlaufendes elektrisches Feld von der Stärke E2πr = −

r dB . 2 dt Das induzierte elektrische Feld erzeugt, wenn es auf ein Elektron im Atom einwirkt, ein Drehmoment, das gleich −qe Er ist und das gleich der Änderungsgeschwindigkeit des Drehimpulses dJ/dt sein muss: E=−

dJ qe r2 dB = . dt 2 dt

(5.14)

110

5 Der Magnetismus der Materie

Wenn wir, bei der Feldstärke null beginnend, über die Zeit integrieren, erkennen wir, dass die Drehimpulsänderung infolge des Einschaltens des Feldes ΔJ =

qe r 2 B 2

(5.15)

ist. Dies ist der zusätzliche Drehimpuls, der durch den Drall entsteht, den das Elektron erhält, wenn das Feld eingeschaltet wird. B Weg Γ r q

Abb. 5.4: Die induzierten elektrischen Kräfte auf die Elektronen in einem Atom.

F

Dieser zusätzliche Drehimpuls erzeugt ein zusätzliches magnetisches Moment, das, weil es eine Bahnbewegung ist, genau −qe /2m mal dem Drehimpuls ist. Das induzierte diamagnetische Moment ist Δμ = −

q2 r 2 qe ΔJ = − e B. 2m 4m

(5.16)

Das Minuszeichen (das richtig ist, wie Sie durch Anwendung der lenzschen Regel erkennen können) bedeutet, dass das zusätzliche Moment dem Magnetfeld entgegengerichtet ist. Wir möchten (5.16) etwas anders schreiben. Das in der Gleichung auftretende r2 betrifft den Radius bezüglich einer zu B parallelen Achse durch das Atom. Wenn daher B in z-Richtung liegt, ist r2 gleich x2 + y2 . Wenn wir sphärisch symmetrische Atome betrachten (oder über mehrere Atome mitteln, deren natürliche Achsen in alle Richtungen zeigen), dann ist der Durchschnittswert von x2 +y2 gleich 2/3 des Durchschnittswertes des Quadrats des wahren radialen Abstands vom Mittelpunkt des Atoms. Es ist daher gewöhnlich bequemer, Gleichung (5.16) zu schreiben als Δμ = −

q2e 2 �r �mittel B. 6m

(5.17)

Auf jeden Fall haben wir ein induziertes atomares Moment gefunden, das zum Magnetfeld B proportional und ihm entgegengerichtet ist. Dies ist der Diamagnetismus der Materie. Es ist dieser magnetische Effekt, der für die kleine Kraft auf ein Stück Wismut in einem inhomogenen Magnetfeld verantwortlich ist. (Sie können die Kraft ausrechnen, indem Sie die Energie der induzierten Momente im Feld berechnen und sich ansehen, wie sich die Energie ändert, während die Materie in oder aus dem Bereich hoher Feldstärke bewegt wird.) Uns bleibt noch ein Problem: Wie groß ist der mittlere quadratische Radius �r2 �mittel ? Die klassische Mechanik hat darauf keine Antwort. Wir müssen noch einmal die Quantenmechanik zu Rate ziehen. Bei einem Atom können wir nicht konkret sagen, wo sich ein Elektron befindet,

5.5 Der larmorsche Satz

111

sondern wir kennen nur die Wahrscheinlichkeit, dass es an einer Stelle sein wird. Wenn wir �r2 �mittel so interpretieren, dass es den Mittelwert des Abstandsquadrates vom Mittelpunkt der Wahrscheinlichkeitsverteilung bedeutet, dann ist das durch die Quantenmechanik gegebene diamagnetische Moment genau dasselbe wie in (5.17). Diese Gleichung ist natürlich das Moment für nur ein Elektron. Das gesamte Moment ist durch die Summe über alle Elektronen im Atom gegeben. Das Überraschende dabei ist, dass das klassische Argument und die Quantenmechanik dieselbe Antwort geben, obwohl, wie wir sehen werden, das klassische Argument, aus dem sich (5.17) ergibt, in der Quantenmechanik nicht wirklich stichhaltig ist. Derselbe diamagnetische Effekt tritt sogar dann auf, wenn ein Atom schon ein permanentes Moment hat. Dann wird das Atom im Magnetfeld präzedieren. Da das ganze Atom präzediert, nimmt es eine zusätzliche kleine Winkelgeschwindigkeit auf, und diese langsame Drehbewegung ergibt einen schwachen Strom, der eine Korrektur des magnetischen Moments darstellt. Dies ist der nur auf eine andere Art begründete diamagnetische Effekt. Wir brauchen uns darum nicht wirklich zu kümmern, wenn wir über Paramagnetismus sprechen. Falls der diamagnetische Effekt zuerst berechnet worden ist, wie wir es hier gemacht haben, brauchen wir uns nicht darum zu kümmern, dass es durch die Präzession einen zusätzlichen schwachen Strom gibt. Der ist nämlich schon in den diamagnetischen Term einbezogen.

5.5

Der larmorsche Satz

Wir können aus unseren bisherigen Ergebnissen schon einige Schlüsse ziehen. Zu allererst ist in der klassischen Theorie das Moment μ immer proportional zu J, mit einer für jedes spezielle Atom gegebenen Proportionalitätskonstanten. Es gibt keinen Spin der Elektronen und die Proportionalitätskonstante ist immer −qe /2m; das heißt also, dass wir in (5.6) g = 1 setzen müssen. Das Verhältnis von μ zu J ist unabhängig von der Bewegung der Elektronen im Atom. Folglich würden nach der klassischen Theorie alle Elektronensysteme mit derselben Winkelgeschwindigkeit präzedieren. (Dies ist in der Quantenmechanik nicht richtig.) Dieses Ergebnis steht in Beziehung zu einem Satz aus der klassischen Mechanik, den wir jetzt beweisen möchten. Angenommen, wir betrachten eine Gruppe von Elektronen, die alle durch eine auf einen Mittelpunkt hin gerichtete Anziehungskraft zusammengehalten werden – so wie die Elektronen von einem Kern angezogen werden. Die Elektronen treten auch untereinander in Wechselwirkungen, und sie können im Allgemeinen komplizierte Bewegungen ausführen. Nehmen wir an, wir hätten die Lösungen für Bewegungen ohne magnetisches Feld und möchten nun wissen, wie die Bewegungen mit einem schwachen magnetischen Feld aussehen. Der zu beweisende Satz besagt, dass die Bewegung in einem schwachen magnetischen Feld immer eine der Lösungen ohne Feld mit einer zusätzlichen Drehung um die Achse des Feldes mit der Winkelgeschwindigkeit ωL = qe B/2m ist. (Dies ist dasselbe wie ω p , falls g = 1 ist.) Es gibt natürlich viele mögliche Bewegungen. Der wesentliche Aspekt ist, dass es für jede Bewegung ohne Magnetfeld eine entsprechende Bewegung im Feld gibt, die gleich der ursprünglichen Bewegung plus einer gleichförmigen Drehung ist. Dies nennt man den larmorschen Satz, und ωL heißt die Larmor-Frequenz. Wir wollen nun zeigen, wie der Satz bewiesen werden kann, wollen es aber Ihnen überlassen, die Einzelheiten auszuarbeiten. Betrachten Sie zunächst ein Elektron in einem Zentralkraftfeld. Die Kraft auf das Elektron ist F(r) mit der Richtung zum Mittelpunkt. Wenn wir jetzt ein

112

5 Der Magnetismus der Materie

gleichförmiges Magnetfeld anschalten, gibt es eine zusätzliche Kraft, qu × B; daher ist die gesamte Kraft F(r) + q u × B.

(5.18)

Betrachten wir nun dasselbe System von einem Koordinatensystem aus, das sich mit der Winkelgeschwindigkeit ω um eine zu B parallele Achse durch das Kraftzentrum dreht. Dies ist kein Inertialsystem mehr, wir müssen daher die Scheinkräfte berücksichtigen – die Zentrifugal- und die Coriolis-Kraft, über die wir in Kapitel 19 von Band I sprachen. Wir haben dort gesehen, dass es in einem mit der Winkelgeschwindigkeit ω rotierenden System, eine scheinbare tangentiale Kraft gibt, die proportional zu vr ist, der radialen Komponente der Geschwindigkeit: Ft = −2mωvr .

(5.19)

Und es gibt eine scheinbare radiale Kraft, die gegeben ist durch Fr = mω2 r + 2mωvt ,

(5.20)

wobei vt die tangentiale Komponente der Geschwindigkeit gemessen im rotierenden System ist. (Die radiale Komponente vr ist für rotierende Bezugssysteme und Inertialsysteme gleich.) Nun können wir für genügend kleine Winkelgeschwindigkeiten (das heißt ωr � vt ) den ersten (Zentrifugal-)Term in (5.20) im Vergleich zu dem zweiten (Coriolis-Term) vernachlässigen. Dann können die Kraftkomponenten (5.19) und (5.20) zusammen geschrieben werden als F = −2m ω × u.

(5.21)

Wenn wir jetzt die Drehung des Koordinatensystems und das Magnetfeld kombinieren, müssen wir die Kraft in (5.21) zu der in (5.18) addieren. Die gesamte Kraft ist F(r) + q u × B + 2m u × ω

(5.22)

(wir haben das Kreuzprodukt und das Vorzeichen von (5.21) umgedreht.) Wenn wir unser Ergebnis anschauen, sehen wir, dass sich für 2m ω = −q B , der zweite und der dritte Term herausheben und die einzige Kraft in dem rotierenden Bezugssystem F(r) ist. Die Bewegung des Elektrons erfolgt also genauso wie ohne Magnetfeld – und natürlich ohne Drehung des Koordinatensystems. Wir haben damit den larmorschen Satz für ein einzelnes Elektron bewiesen. Da der Beweis ein kleines ω voraussetzt, bedeutet das auch, dass der Satz nur für schwache Magnetfelder richtig ist. Der einzige Aspekt, um dessen Verbesserung wir Sie noch bitten könnten, wäre, dass Sie sich den Fall vornehmen, bei dem viele Elektronen miteinander wechselwirken, aber alle in demselben Zentralfeld sind, und dann denselben Satz beweisen. Ganz gleich also wie komplex ein Atom ist, wenn es ein Zentralfeld hat, ist der Satz richtig. Das ist aber das Ende der klassischen Mechanik, weil es tatsächlich nicht richtig ist, dass die Bewegungen auf diese Art präzedieren. Die in (5.11) gegebene Präzessionsfrequenz ω p ist nur dann gleich ωL , wenn g zufällig gleich 1 ist.

5.6 Die klassische Physik ergibt weder Diamagnetismus noch Paramagnetismus

5.6

113

Die klassische Physik ergibt weder Diamagnetismus noch Paramagnetismus

Jetzt möchten wir zeigen, dass es nach der klassischen Mechanik überhaupt keinen Diamagnetismus und Paramagnetismus geben kann. Das hört sich verrückt an – zuerst haben wir bewiesen, dass es Paramagnetismus, Diamagnetismus, präzessierende Bahnen und so weiter gibt, und nun wollen wir beweisen, dass das alles falsch ist. Ja! – Wir werden beweisen, dass, wenn Sie der klassischen Mechanik weit genug folgen, es diese magnetischen Effekte nicht gibt – sie fallen alle heraus. Wenn Sie mit einer klassischen Beweisführung an einer gewissen Stelle beginnen und nicht weit genug gehen, können Sie jede beliebige Antwort erhalten. Aber der einzige legitime und korrekte Beweis zeigt, dass es gar keinen magnetischen Effekt gibt. Es ist eine Konsequenz der klassischen Mechanik, dass, wenn Sie ein System betrachten – ein Gas mit Elektronen, Protonen oder was auch immer –, das in einem Kasten eingesperrt ist, sodass sich das ganze System nicht drehen kann, es dann keinen magnetischen Effekt geben kann. Es ist möglich, einen magnetischen Effekt zu erhalten, wenn Sie ein isoliertes System betrachten, wie einen Stern, der von selbst zusammenhält und der anfangen kann zu rotieren, wenn Sie das Magnetfeld anlegen. Wenn Sie aber ein Stück Materie betrachten, das an seinem Ort festgehalten wird, sodass es nicht anfangen kann, sich zu drehen, dann kann es keine magnetischen Effekte geben. Was wir mit der Verhinderung der Drehung meinen, lässt sich folgendermaßen beschreiben: Wir nehmen an, dass es bei einer gegebenen Temperatur nur einen Zustand im thermischen Gleichgewicht gibt. Der Satz besagt dann, dass, wenn Sie ein Magnetfeld einschalten und warten, bis sich das System wieder im thermischen Gleichgewicht befindet, es dann keinen Paramagnetismus oder Diamagnetismus geben kann – es kann kein induziertes magnetisches Moment geben. Beweis: Gemäß der statistischen Mechanik ist die Wahrscheinlichkeit dafür, dass ein System einen gegebenen Bewegungszustand einnimmt, proportional zu e−U/kT , wobei U die Energie dieser Bewegung ist. Was ist nun die Bewegungsenergie? Bei einem Teilchen, das sich in einem konstanten Magnetfeld bewegt, ist die Energie gleich der gewöhnlichen potentiellen Energie plus mv2 /2, ohne irgendeinen Zusatz für das Magnetfeld. (Sie wissen, dass die Kraft durch das elektromagnetische Feld q(E + u × B) ist und dass die Änderungsrate der Arbeit F · u gerade qE · u ist, was vom Magnetfeld nicht beeinflusst ist. (Daher ist die Energie eines Systems, ob es sich nun in einem Magnetfeld befindet oder nicht, immer durch die kinetische plus die potentielle Energie gegeben. Da die Wahrscheinlichkeit für einen Bewegungszustand nur von der Energie abhängt – das heißt von der Geschwindigkeit und dem Ort –, ist sie dieselbe, ob nun ein Magnetfeld vorhanden ist oder nicht. Auf das thermische Gleichgewicht hat daher das Magnetfeld keinen Einfluss. Wenn wir ein System in einem Kasten betrachten und dann noch ein weiteres System in einem zweiten Kasten, diesmal mit Magnetfeld, dann ist die Wahrscheinlichkeit für jede spezielle Geschwindigkeit an irgendeinem Punkt im ersten Kasten genauso groß wie im zweiten. Wenn der erste Kasten keinen mittleren Kreisstrom aufweist (was nicht der Fall sein kann, wenn er im Gleichgewicht mit den stationären Wänden ist), gibt es kein mittleres magnetisches Moment. Da in dem zweiten Kasten alle Bewegungen genauso erfolgen, gibt es auch dort kein magnetisches Moment. Folglich kann es, wenn die Temperatur konstant gehalten wird und sich das thermische Gleichgewicht nach dem Einschalten des Feldes wieder eingestellt hat, kein vom Feld induziertes magnetisches Moment geben – nach der klassischen Mechanik. Ein Verständnis der magnetischen Phänomene können wir nur durch die Quantenmechanik bekommen.

114

5 Der Magnetismus der Materie

Leider können wir bei Ihnen kein gründliches Verständnis der Quantenmechanik voraussetzen, daher ist hier kaum der rechte Platz, das Thema weiter zu vertiefen. Andererseits müssen wir auch nicht immer etwas so lernen, dass wir zuerst die exakten Regeln lernen und dann erst untersuchen, wie sie in den verschiedenen Fällen angewandt werden. Fast jedes Thema, das wir uns in dieser Vorlesung vorgenommenm haben, ist auf eine andere Art behandelt worden. Im Fall der Elektrizität schrieben wir die Maxwell-Gleichungen auf „Seite Eins“ und leiteten dann alle Folgerungen ab. Das ist die eine Möglichkeit. Aber wir wollen jetzt nicht versuchen, eine neue „Seite Eins“ anzufangen, indem wir die Gleichungen der Quantenmechanik hinschreiben und dann alles aus ihnen ableiten. Wir werden Ihnen nur einige der Folgerungen aus der Quantenmechanik erläutern müssen, bevor Sie lernen, woher sie kommen. Fangen wir also an.

5.7

Der Drehimpuls in der Quantenmechanik

Wir haben schon eine Beziehung zwischen dem Drehimpuls und dem magnetischen Moment angegeben. Das ist erfreulich. Aber was bedeuten magnetisches Moment und Drehimpuls in der Quantenmechanik? In der Quantenmechanik stellt es sich als das beste heraus, solche Konzepte wie das magnetische Moment durch andere Begriffe wie etwa die Energie zu definieren, damit man mit Sicherheit weiß, was sie bedeuten. Nun ist es leicht, ein magnetisches Moment durch die Energie zu definieren, weil die Energie eines Moments in einem Magnetfeld in der klassischen Theorie μ · B ist. Daher hat man in der Quantenmechanik die folgende Definition vorgenommen: Wenn wir die Energie eines Systems in einem magnetischen Feld berechnen und feststellen, dass sie (bei schwachem Feld) proportional zur Feldstärke ist, dann wird der Proportionalitätsfaktor die Komponente des magnetischen Moments in Feldrichtung genannt. (Wir brauchen uns jedoch für unsere jetzige Arbeit nicht um solche Eleganz zu bemühen; wir können das magnetische Moment immer noch im gewöhnlichen, bis zu einem gewissen Grad klassischen Sinn auffassen.) Nun möchten wir den Begriff des Drehimpulses in der Quantenmechanik erläutern – oder vielmehr die charakteristischen Eigenschaften von dem, was in der Quantenmechanik Drehimpuls genannt wird. Sie sehen, dass Sie beim Übergang zu neuartigen Gesetzen nicht einfach voraussetzen können, dass jedes Wort genau dieselbe Sache bezeichnet. Vielleicht denken Sie etwa: „Oh, ich weiß, was Drehimpuls ist. Das ist die Sache, die sich durch ein Drehmoment ändern lässt.“ Aber was ist ein Drehmoment? In der Quantenmechanik müssen wir für die alten Größen neue Definitionen verwenden. Es wäre daher von rechtswegen am besten, die Größen mit einem anderen Namen zu benennen, wie etwa „Quantendrehimpuls“ oder so etwas, weil es der Drehimpuls ist, so wie ihn die Quantenmechanik definiert. Aber wenn wir in der Quantenmechanik eine Größe finden können, die mit unserem alten Begriff des Drehimpulses identisch ist, sobald das System groß genug ist, erscheint es nicht sinnvoll, ein neues Wort zu erfinden. Wir können es ebenso gut einfach weiterhin Drehimpuls nennen. Mit dieser Vereinbarung ist diese seltsame Größe, die wir zu beschreiben im Begriff sind, der Drehimpuls. Es ist die Größe, die wir in einem großen System als Drehimpuls der klassischen Mechanik erkennen. Als Erstes betrachten wir ein System, in dem der Drehimpuls erhalten bleibt, wie etwa ein Atom, das sich ganz allein im leeren Raum befindet. Nun könnte sich so ein Objekt (wie die Erde, die sich um ihre Achse dreht) im gewöhnlichen Sinn um irgendeine Achse, die man frei wählen kann, drehen. Und für einen gegebenen Drehimpuls könnte es viele verschiedene „Zu-

5.7 Der Drehimpuls in der Quantenmechanik

115

stände“ geben, die alle dieselbe Energie haben, wobei jeder „Zustand“ einer speziellen Achsenrichtung des Drehimpulses entspricht. Daher gibt es in der klassischen Theorie bei gegebenem Drehimpuls eine unendliche Zahl von möglichen Zuständen, die alle dieselbe Energie haben. Es stellt sich jedoch in der Quantenmechanik heraus, dass mehrere eigentümliche Dinge geschehen. Zuerst einmal ist die Anzahl der Zustände, in denen sich solch ein System befinden kann, begrenzt – es gibt nur eine endliche Anzahl. Wenn das System klein ist, ist die beschränkte Anzahl sehr klein, und wenn das System groß ist, wird die beschränkte Anzahl sehr, sehr groß. Zweitens können wir einen „Zustand“ nicht beschreiben, indem wir die exakte Richtung seines Drehimpulses angeben, sondern nur durch Angabe der Komponente des Drehimpulses in irgendeiner Richtung – etwa in der z-Richtung. Klassisch könnte ein Objekt mit einem gegebenen Gesamtdrehimpuls J als z-Komponente jeden beliebigen Wert zwischen +J und −J haben. Quantenmechanisch aber kann die z-Komponente des Drehimpulses nur bestimmte diskrete Werte annehmen. Jedes gegebene System – ein spezielles Atom oder ein Kern oder irgendetwas – mit einer gegebenen Energie hat eine charakteristische Zahl j, und die z-Komponente des Drehimpulses kann nur einen Wert aus folgendem Satz von Werten annehmen: j ( j − 1) ( j − 2) .. . −( j − 2) −( j − 1) − j

(5.23)

Die größte z-Komponente ist j mal ; die nächst kleinere ist um eine Einheit von  niedriger und so weiter bis hinunter zu − j. Die Zahl j heißt „der Spin des Systems“. (Manche Leute nennen sie die „Gesamtdrehimpulsquantenzahl“; aber wir wollen sie einfach „Spin“ nennen.) Sie befürchten vielleicht, dass das, was wir sagen, nur für eine „spezielle“ z-Achse richtig ist. Dem ist aber nicht so. Bei einem System, dessen Spin j ist, kann die Komponente des Drehimpulses in Richtung einer beliebigen Achse nur einen der Werte in (5.23) annehmen. Obwohl das recht mysteriös ist, bitten wir Sie, es im Moment einfach zu akzeptieren. Wir werden darauf zurückkommen und diesen Aspekt später besprechen. Sie werden zumindest erfreut sein zu hören, dass die mögliche z-Komponente von einer Zahl bis zu minus derselben Zahl geht, sodass wir zumindest nicht zu entscheiden brauchen, welches die Plus-Richtung der z-Achse ist. (Sicherlich wäre es außerordentlich rätselhaft, wenn wir sagten, dass sie von + j bis zu minus einem anderen Betrag ginge, weil wir dann nicht die in die Gegenrichtung zeigende z-Achse definieren könnten.) Wenn nun die z-Komponente des Drehimpulses in ganzzahligen Schritten von + j nach − j hinabgehen muss, dann muss j ja wohl eine ganze Zahl sein. Nein! Zweimal j muss eine ganze Zahl sein. Es ist nur die Differenz zwischen + j und − j, die ganzzahlig sein muss. Daher ist im Allgemeinen der Spin j entweder ganzzahlig oder halbzahlig, was davon abhängt, ob 2 j gerade

116

5 Der Magnetismus der Materie

oder ungerade ist. Betrachten wir zum Beispiel einen Kern wie Lithium, der einen Spin von j = 3/2 hat. Dann ist der Drehimpuls um die z-Achse, in Einheiten von , einer der folgenden: +3/2 +1/2 −1/ −3/2 . Es gibt vier mögliche Zustände, die alle dieselbe Energie haben, wenn sich der Kern im leeren Raum ohne äußere Felder befindet. Wenn wir dagegen ein System betrachten, dessen Spin zwei ist, dann hat die z-Komponente des Drehimpulses nur die Werte, in Einheiten von , 2 1 0 −1 −2 . Wenn Sie nachzählen, wie viele Zustände es für ein gegebenes j gibt, finden Sie (2 j + 1) Zustände. Mit anderen Worten, wenn Sie die Energie und den Spin j festlegen, dann stellt sich heraus, dass es genau (2 j + 1) Zustände mit dieser Energie gibt, wobei jeder Zustand einem der verschiedenen möglichen Werte der z-Komponente des Drehimpulses entspricht. Wir möchten gern noch einen anderen Aspekt hinzufügen. Wenn Sie sich ein beliebiges Atom mit bekanntem j herausgreifen und die z-Komponente seines Drehimpulses messen, dann können Sie einen der möglichen Werte erhalten und jeder dieser Werte ist gleich wahrscheinlich. Alle Zustände sind in der Tat Einzelzustände, und einer ist so gut wie der andere. Jeder hat dasselbe „Gewicht“ in der Welt. (Wir setzen voraus, dass nichts getan wurde, um ein spezielles Exemplar auszuwählen.) Diese Tatsache hat übrigens eine einfache klassische Analogie. Wenn Sie dieselbe Frage klassisch stellen: Wie groß ist die Wahrscheinlichkeit, eine spezielle z-Komponente des Drehimpulses zu erhalten, wenn Sie zufällig ein Exemplar aus einer Menge von Systemen herausgreifen, die alle denselben Gesamtdrehimpuls haben? – lautet die Antwort, dass alle Werte vom Maximum bis zum Minimum gleich wahrscheinlich sind. (Sie können das leicht ausrechnen.) Das klassische Ergebnis entspricht der gleichen Wahrscheinlichkeit für die (2 j + 1) Zustände in der Quantenmechanik. Aus dem, was wir bis jetzt gesagt haben, können wir noch einen interessanten und etwas überraschenden Schluss ziehen. In gewissen klassischen Berechnungen ist die im Endergebnis erscheinende Größe das Quadrat des Betrages des Drehimpulses J – mit anderen Worten J · J. Es stellt sich heraus, dass es oft möglich ist, die richtige quantenmechanische Formel zu erraten, indem man die klassische Rechnung und die folgende einfache Regel verwendet: Ersetze J 2 = J · J verwendet j( j + 1)2 . Diese Regel wird allgemein verwendet und ergibt gewöhnlich das richtige Resultat, aber nicht immer. Wir können folgende Überlegungen anstellen, um Ihnen zu zeigen, warum Sie erwarten dürfen, dass diese Regel anwendbar ist. Das Skalarprodukt J · J kann geschrieben werden als J · J = J x2 + Jy2 + Jz2 .

5.8 Die magnetische Energie von Atomen

117

Da es ein Skalar ist, muss es für jede Orientierung des Spins dasselbe sein. Nehmen wir an, wir greifen uns willkürlich irgendwelche Exemplare aus irgendeinem gegebenen atomaren System heraus und führen Messungen von J x2 oder Jy2 oder Jz2 durch; der Mittelwert sollte für jedes derselbe sein. (Keine Richtung ist besonders ausgezeichnet.) Daher ist der Mittelwert von J · J einfach gleich dem dreifachen Mittelwert irgendeiner quadrierten Komponente, sagen wir Jz2 ; � J · J�mittel = 3�Jz2 �mittel . Da aber J · J für alle Orientierungen dasselbe ist, ist sein Mittelwert natürlich einfach sein konstanter Wert; wir haben J · J = 3�Jz2 �mittel .

(5.24)

Wenn wir jetzt sagen, dass wir dieselbe Gleichung für die Quantenmechanik benutzen wollen, können wir �Jz2 �mittel leicht ermitteln. Wir brauchen bloß die Summe über die (2 j+1) möglichen Werte von Jz2 zu bilden und durch die Anzahl der Werte zu dividieren; �Jz2 �mittel =

j2 + ( j − 1)2 + · · · + (− j + 1)2 + (− j)2 2  . 2j + 1

(5.25)

Bei einem System mit einem Spin von 3/2 geht das so: �Jz2 �mittel =

(3/2)2 + (1/2)2 + (−1/2)2 + (−3/2)2 2 5 2  =  . 4 4

Wir folgern daraus J · J = 3�Jz2 �mittel = 3 45 2 = 32 ( 23 + 1)2 . Wir überlassen es Ihnen zu zeigen, dass (5.25) zusammen mit (5.24) das allgemeine Ergebnis liefert J · J = j( j + 1)2 .

(5.26)

Obwohl wir bei klassischer Argumentation denken würden, dass √ der größtmögliche Wert der z-Komponente von J einfach der Betrag von J ist – nämlich J · J –, ist quantenmechanisch  das Maximum von Jz immer etwas kleiner als dieser, weil j immer kleiner als j( j + 1) ist. Der Drehimpuls liegt niemals „ganz in z-Richtung“.

5.8

Die magnetische Energie von Atomen

Jetzt kehren wir wieder zum magnetischen Moment zurück. Wir haben gesagt, dass man in der Quantenmechanik das magnetische Moment eines speziellen atomaren Systems gemäß (5.6) durch den Drehimpuls ausdrücken kann; q  e μ = −g J, (5.27) 2m wobei −qe und m Ladung bzw. Masse des Elektrons sind.

118

5 Der Magnetismus der Materie

Ein atomarer Magnet, der sich in einem äußeren Magnetfeld befindet, besitzt eine zusätzliche magnetische Energie, die von der Komponente seines magnetischen Moments in Feldrichtung abhängt. Wir wissen, dass Umag = − μ · B.

(5.28)

Wenn wir unsere z-Achse in Richtung von B wählen, wird Umag = −μz B.

(5.29)

Unter Verwendung von (5.27) erhalten wir q  e Jz B. Umag = g 2m Die Quantenmechanik besagt, dass Jz nur bestimmte Werte annehmen kann, nämlich j, ( j − 1), . . . , − j. Daher ist die magnetische Energie eines atomaren Systems nicht beliebig; sie kann nur diskrete Werte annehmen. Ihr maximaler Wert ist zum Beispiel q  e  jB. g 2m Der Größe qe /2m gibt man gewöhnlich den Namen „bohrsches Magneton“ und schreibt sie als μB : μB =

qe  . 2m

Die möglichen Werte der magnetischen Energie sind Umag = gμB B

Jz , 

wobei Jz / die Werte j, ( j − 1), ( j − 2), . . . , (− j + 1), − j annimmt.

Mit anderen Worten, die Energie eines atomaren Systems ändert sich, wenn es in ein Magnetfeld gebracht wird, um einen Betrag, der zum Feld und zu Jz proportional ist. Wir sagen, dass die Energie eines atomaren Systems durch ein Magnetfeld „in 2 j + 1 Niveaus aufgespalten“ wird. Ein Atom zum Beispiel, dessen Energie außerhalb eines Magnetfeldes U0 und dessen j gleich 3/2 ist, kann vier verschiedene Energien haben, wenn es in ein Magnetfeld gebracht wird. Wir können diese Energien durch ein Energieniveau-Diagramm darstellen, wie es in Abbildung 5.5 gezeichnet ist. Jedes Atom mit j = 3/2 kann in einem gegebenen Feld B eine der vier möglichen Energien haben. Das ist die Aussage der Quantenmechanik über das Verhalten eines atomaren Systems in einem Magnetfeld. Das einfachste „atomare“ System ist ein einzelnes Elektron. Der Spin eines Elektrons ist 1/2, sodass es zwei mögliche Zustände gibt: Jz = /2 und Jz = −/2. Für ein ruhendes Elektron (ohne Bahnbewegung) hat das magnetische Spinmoment einen g-Wert von 2, daher kann die magnetische Energie ±μB B sein. Die möglichen Energien in einem Magnetfeld sind in Abbildung 5.6 gezeigt. Es hat sich eingebürgert, zu sagen, dass das Elektron entweder den Spin „up“ (in Feldrichtung) oder „down“ (entgegen der Feldrichtung) hat.

5.8 Die magnetische Energie von Atomen Umag

119

Jz = + 23  Jz = + 12 

0

B Jz = − 12  Jz = − 23  U mag

0

Abb. 5.5: Die möglichen magnetischen Energien eines atomaren Systems mit einem Spin von 3/2 in einem Magnetfeld B.

Jz = + 12 

B Jz = − 12 

Abb. 5.6: Die beiden möglichen Energiezustände eines Elektrons in einem Magnetfeld B.

Bei Systemen mit größeren Spins gibt es entsprechend mehr Zustände. Wir können uns vorstellen, dass der Spin „up“ oder „down“ zeigt oder in irgendeinem „Winkel“ dazwischen liegt, der von dem Wert von Jz abhängt. Wir wollen diese quantenmechanischen Erkenntnisse anwenden, um im nächsten Kapitel die magnetischen Eigenschaften der Stoffe zu besprechen.

6

Paramagnetismus und magnetische Resonanz

Siehe auch: Band III, Kapitel 11, Vorgänge im Innern von Dielektrika

6.1

Quantisierte magnetische Zustände

Im vorangegangenen Kapitel haben wir beschrieben, dass in der Quantenmechanik der Drehimpuls eines Objektes keine beliebige Richtung haben kann, sondern dass die Komponente des Drehimpulses längs einer gegebenen Achse nur äquidistante diskrete Werte annehmen kann. Das ist eine erstaunliche und eigenartige Angelegenheit. Sie denken vielleicht, dass wir uns in solche Dinge nicht vertiefen sollten, bis Ihr Verstand aber weiter fortgeschritten und in der Lage ist, derartige Gedanken zu erfassen. In Wirklichkeit wird Ihr Verstand niemals weiter fortgeschritten sein – in dem Sinne, dass er fähig wäre, einen solchen Sachverhalt leicht zu verstehen. Es gibt kein Beschreibungsverfahren, durch das man es verständlich machen könnte, das nicht in seiner eigenen Form so subtil und anspruchsvoll ist, dass es komplizierter ist als der Sachverhalt, den man zu erklären versucht. Das Verhalten der Materie im kleinen Maßstab – wie wir schon mehrfach erwähnt haben – ist anders als irgendetwas, mit dem Sie vertraut sind, und tatsächlich sehr seltsam. Während wir in der klassischen Physik Fortschritte machen, ist es ratsam, dass wir uns um eine zunehmende Kenntnis des Verhaltens der Dinge im kleinen Maßstab zu bemühen, zunächst als eine Art Erkenntnis ohne tieferes Verständnis. Das Verständnis dieser Sachverhalte kommt sehr langsam, wenn überhaupt. Natürlich wird man immer besser befähigt zu erkennen, was in einer quantenmechanischen Situation geschehen wird – wenn es das ist, was man mit Verständnis meint –, aber man bekommt niemals das angenehme Gefühl, dass diese quantenmechanischen Regeln „natürlich“ sind. Selbstverständlich sind sie es, aber sie sind nicht natürlich für unsere eigene Erfahrung auf normalem Niveau. Wir sollten deutlich sagen, dass die Einstellung, die wir hinsichtlich dieser Regel über den Drehimpuls einnehmen werden, sich von vielen der anderen Dinge, über die wir gesprochen haben, deutlich unterscheidet. Wir werden nicht versuchen, sie zu „erklären“, aber wir müssen Ihnen zumindest sagen, was geschieht; es wäre unaufrichtig, die magnetischen Eigenschaften der Stoffe zu beschreiben, ohne dabei die Tatsache zu erwähnen, dass die klassische Beschreibung des Magnetismus – des Drehimpulses und der magnetischen Momente – unkorrekt ist. Eine der erstaunlichsten und verwirrendsten Eigenheiten der Quantenmechanik ist, dass Sie, wenn Sie den Drehimpuls längs einer speziellen Achse betrachten, feststellen werden, dass er immer eine ganze oder halbe Zahl mal  ist. Das ist immer so, ganz gleich, welche Achse Sie nehmen. Die Feinheiten, die in dieser geheimnisvollen Tatsache stecken – dass Sie irgendeine andere Achse nehmen können und feststellen, dass die Drehimpulskomponente für diese Achse ebenfalls mit demselben Satz von Werten verbunden ist –, wollen wir einem späteren Kapitel überlassen. Dort werden Sie sehen, wie dieser scheinbare Widerspruch letztlich gelöst wird.

122

6 Paramagnetismus und magnetische Resonanz

Wir wollen jetzt einfach die Tatsache akzeptieren, dass es für jedes atomare System eine Zahl j gibt, die der Spin des Systems genannt wird – und die eine ganze oder eine halbe Zahl sein muss – und dass die Komponente des Drehimpulses längs einer speziellen Achse immer einen der folgenden Werte zwischen + j und − j annimmt: ⎧ ⎫ j ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ j − 1 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ j − 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎬ . . Jz = einer von ⎪ ·. ⎪ . ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ − j + 2 ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ − j + 1⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩− j ⎭

(6.1)

Wir haben auch erwähnt, dass jedes einfache atomare System ein magnetisches Moment besitzt, das dieselbe Richtung wie der Drehimpuls hat. Dies gilt nicht nur für Atome und Kerne, sondern auch für die Elementarteilchen. Jedes Elementarteilchen hat seinen eigenen charakteristischen Wert von j und sein spezifisches magnetisches Moment. (Für manche Teilchen sind beide null.) Was wir bei dieser Feststellung mit dem „magnetischen Moment“ meinen, ist, dass die Energie des Systems in einem Magnetfeld, sagen wir in z-Richtung, für schwache Magnetfelder als −μz B geschrieben werden kann. Wir müssen die Bedingung stellen, dass das Feld nicht zu stark ist, weil es sonst die innere Bewegung des Systems stören könnte und dann die Energie kein Maß für das magnetische Moment mehr wäre, das vorhanden war, bevor das Feld angelegt wurde. Wenn aber das Feld hinreichend schwach ist, dann ändert das Feld die Energie um den Betrag ΔU = −μz B, mit der Vereinbarung, dass wir in dieser Gleichung μz durch � q � Jz μz = g 2m

(6.2)

(6.3)

ersetzen müssen, wobei Jz einen der in (6.1) aufgelisteten Werte hat. Angenommen, wir betrachten ein System mit einem Spin j = 3/2. Ohne Magnetfeld hat das System vier mögliche Zustände, die den verschiedenen Werten von Jz entsprechen, die aber alle genau dieselbe Energie haben. Aber in dem Moment, wo wir das Magnetfeld einschalten, gibt es eine zusätzliche Wechselwirkungsenergie, die diese Zustände in vier etwas unterschiedliche Energieniveaus aufspaltet. Die Energien dieser Niveaus sind durch eine gewisse Energie proportional zu B multipliziert mit  mal 3/2, 1/2, −1/2 und −3/2 (also mal den Werten von Jz ) gegeben. Die Aufspaltung der Energieniveaus bei atomaren Systemen mit den Spins 1/2, 1 und 3/2 wird in den Diagrammen von Abbildung 6.1 gezeigt. (Bedenken Sie, dass das magnetische Moment für jegliche Anordnung von Elektronen immer dem Drehimpuls entgegen gerichtet ist.) Sie werden in den Diagrammen erkennen, dass der „Schwerpunkt“ der Energieniveaus mit und ohne Magnetfeld derselbe ist. Beachten Sie auch, dass die Abstände von einem Niveau zum nächsten für ein gegebenes Teilchen in einem gegebenen Magnetfeld immer gleich sind. Wir

6.2 Der Stern-Gerlach-Versuch

U

U

j=1

j = 1/2 /2 J z = +

U0

Jz =

B

Jz = − /2

(a)

123

U0 (b)

+

Jz = 0

B

Jz = −

U j = 3/2 Jz =

 /2) +(3

/2 ω p J z = +

U0

ω p ω p

Jz = − /2 Jz

(c)

=−

(3/ 2)

B Abb. 6.1: Ein atomares System mit Spin j hat in einem Magnetfeld B (2 j + 1) mögliche Energiewerte. Die Energieaufspaltung ist bei kleinen Feldern proportional zu B.

werden den Energieabstand für ein gegebenes Magnetfeld B als ω p schreiben – was einfach eine Definition von ω p ist. Unter Verwendung von (6.2) und (6.3) erhalten wir ω p = g oder ωp = g

q B 2m

q B. 2m

(6.4)

Die Größe g(q/2m) ist gerade das Verhältnis des magnetischen Moments zum Drehimpuls – sie ist eine Eigenschaft des Teilchens. Gleichung (6.4) ist dieselbe Formel, die wir in Kapitel 5 für die Winkelgeschwindigkeit der Präzession in einem Magnetfeld für einen Kreisel, dessen Drehimpuls J und dessen magnetisches Moment μ ist, erhalten haben.

6.2

Der Stern-Gerlach-Versuch

Die Tatsache, dass der Drehimpuls quantisiert ist, ist so überraschend, dass wir uns ein wenig über die historische Entwicklung dieser Erkenntnis unterhalten wollen. Von dem Augenblick ihrer Entdeckung an hat sie alle schockiert (obwohl man sie theoretisch erwartet hatte). Sie wurde zuerst in einem Experiment beobachtet, das Stern und Gerlach im Jahre 1922 durchführten. Wenn Sie wollen, können Sie den Stern-Gerlach-Versuch als eine direkte Rechtfertigung unseres Glaubens an die Quantisierung des Drehimpulses ansehen. Stern und Gerlach hatten sich ein Experiment zur Messung des magnetischen Moments einzelner Silberatome ausgedacht. Sie erzeugten einen Strahl von Silberatomen, indem sie Silber in einem heißen Ofen verdampften und etwas von dem Dampf durch eine Reihe kleiner Löcher austreten ließen. Dieser Strahl

124

6 Paramagnetismus und magnetische Resonanz

Ofen Loch

Magnet Glasplatte

Vakuum

Abb. 6.2: Das Experiment von Stern und Gerlach.

wurde zwischen die Polenden eines speziellen Magneten gelenkt, wie in Abbildung 6.2 gezeigt ist. Ihre Idee war folgende. Falls das Silberatom ein magnetisches Moment μ besitzt, dann hat es in einem Magnetfeld B eine Energie −μz B, wobei z die Richtung des Magnetfeldes ist. In der klassischen Theorie ist μz gleich dem magnetischen Moment mal dem Kosinus des Winkels zwischen dem Moment und dem Magnetfeld, daher ist die zusätzliche Energie im Feld ΔU = −μB cos θ.

(6.5)

Natürlich werden die magnetischen Momente, wenn die Atome aus dem Ofen kommen, in alle möglichen Richtungen zeigen, es wird daher alle Werte von θ geben. Wenn sich jetzt das Magnetfeld sehr rasch mit z ändert – wenn es einen starken Feldgradienten gibt – dann wird sich auch die magnetische Energie mit dem Ort ändern, und es wird eine Kraft auf die magnetischen Momente wirken, deren Richtung davon abhängen wird, ob cos θ positiv oder negativ ist. Die Atome werden von einer Kraft proportional zur Ableitung der magnetischen Energie nach oben oder unten gezogen werden. Gemäß dem Prinzip der virtuellen Arbeit ist Fz = −

∂B ∂U = μ cos θ . ∂z ∂z

(6.6)

Stern und Gerlach stellten ihren Magneten mit einer scharfen Kante an einem der Polenden her, um eine sehr rasche örtliche Änderung des Magnetfeldes zu erreichen. Der Strahl der Silberatome wurde genau entlang der scharfen Kante gelenkt, sodass die Atome im inhomogenen Feld eine vertikale Kraft spüren. Ein Silberatom mit horizontal gerichtetem magnetischen Moment würde keine Kraft verspüren und gerade durch den Magneten hindurchlaufen. Auf ein Atom, dessen magnetisches Moment genau vertikal ist, würde eine Kraft wirken, die es nach oben zur scharfen Kante des Magneten hin zieht. Ein Atom, dessen magnetisches Moment nach unten zeigt, würde eine Kraft nach unten spüren. Folglich würden die Atome, wenn sie den Magneten verlassen, entsprechend ihren vertikalen Komponenten des magnetischen Moments aufgespreizt werden. In der klassischen Theorie sind alle Winkel möglich, sodass man, wenn die Silberatome durch Ablagerung auf einer Glasplatte aufgefangen werden, eine Verschmierung der Silberatome auf einer vertikalen Linie erwarten sollte. Die Höhe der Linie wäre proportional zum Betrag des magnetischen Moments. Das völlige Versagen der klassischen Vorstellungen wurde offenbar, als Stern und Gerlach sahen, was wirklich geschah. Sie fanden auf der Glasplatte zwei getrennte Flecke. Die Silberatome hatten zwei Strahlen gebildet. Dass ein Strahl von Atomen, deren Spins offensichtlich zufällig orientiert sind, in zwei getrennte Strahlen aufgespalten wird, ist höchst verwunderlich. Woher wissen die magnetischen Momente, dass es nur erlaubt ist, ganz bestimmte Komponenten in Richtung des Magnetfeldes anzunehmen? Nun ja, das war wirklich der Anfang der Entdeckung der Quantisierung des

6.3 Die Rabi-Molekularstrahl-Methode

125

Drehimpulses, und anstatt zu versuchen, Ihnen eine theoretische Erklärung zu geben, wollen wir einfach sagen, dass Sie sich mit dem Ergebnis dieses Versuchs abfinden müssen, ebenso wie die Physiker jener Tage das Resultat akzeptieren mussten, als das Experiment ausgeführt war. Es ist eine experimentelle Tatsache, dass die Energie eines Atoms in einem Magnetfeld eine Reihe von diskreten Werten annimmt. Für jeden dieser Werte ist die Energie proportional zur Feldstärke. In unserem Beispiel eines inhomogenen Feldes besagt daher das Prinzip der virtuellen Arbeit, dass die mögliche magnetische Kraft auf die Atome einen Satz diskreter Werte annehmen kann; die Kraft ist für jeden Zustand eine andere, der Atomstrahl wird daher in eine kleine Anzahl getrennter Strahlen aufgespalten. Aus der Messung der Ablenkung der Strahlen kann man die Stärke des magnetischen Moments ermitteln.

6.3

Die Rabi-Molekularstrahl-Methode

Wir möchten jetzt einen verbesserten Apparat zur Messung magnetischer Momente beschreiben, der von I. I. Rabi und seinen Mitarbeitern entwickelt wurde. Im Stern-Gerlach-Versuch ist die Ablenkung der Atome nur sehr gering, und die Messung der magnetischen Momente ist nicht sehr genau. Die Rabi-Technik gestattet eine phantastische Präzision bei der Messung magnetischer Momente. Die Methode beruht auf der Tatsache, dass die ursprüngliche Energie der Atome in einem Magnetfeld in eine endliche Anzahl von Energieniveaus aufgespalten wird. Dass die Energie eines Atoms im Magnetfeld nur diskrete Werte haben kann, ist in Wirklichkeit nicht überraschender als die Tatsache, dass Atome im Allgemeinen nur diskrete Energieniveaus haben – etwas, was wir in Band I mehrmals erwähnt haben. Warum sollte dasselbe nicht für Atome in einem Magnetfeld zutreffen? Es trifft zu. Aber es ist der Versuch, dies mit der Vorstellung von einem gerichteten magnetischen Moment in Beziehung zu setzen, der einige der seltsamen Folgerungen der Quantenmechanik demonstriert. Wenn ein Atom zwei Niveaus hat, die sich in ihren Energien um den Betrag ΔU unterscheiden, dann kann es einen Übergang vom oberen Niveau zum unteren Niveau vollführen, indem es ein Lichtquant der Frequenz ω emittiert, wobei ω = ΔU.

(6.7)

Dasselbe kann mit Atomen in einem Magnetfeld passieren. Nur sind dann die Energieunterschiede so klein, dass die Frequenz nicht dem sichtbaren Licht entspricht, sondern den Mikrowellen oder Radiowellen. Übergänge vom unteren Energieniveau zu einem höheren Energieniveau eines Atoms können auch stattfinden, indem Licht absorbiert wird, oder im Falle von Atomen in einem Magnetfeld, indem Mikrowellenenergie absorbiert wird. Folglich können wir, wenn sich ein Atom in einem Magnetfeld befindet, Übergänge von einem Zustand zu einem anderen bewirken, indem wir ein elektromagnetisches Feld mit geeigneter Frequenz anlegen. Mit anderen Worten: Wenn sich ein Atom in einem starken Magnetfeld befindet und wir das Atom mit einem schwachen veränderlichen elektromagnetischen Feld „kitzeln“, wird es eine gewisse Wahrscheinlichkeit dafür geben, dass das Atom auf ein höheres Niveau gehoben wird, falls die Frequenz nahe bei dem durch (6.7) gegebenen ω liegt. Bei einem Atom in einem Magnetfeld ist diese Frequenz gerade das, was wir früher ω p genannt haben, und sie ist, ausgedrückt durch das Magnetfeld, gegeben durch (6.4). Wenn das Atom mit der falschen Frequenz gekitzelt wird, ist die Wahrscheinlichkeit, einen Übergang zu bewirken, sehr gering. Folglich hat die Wahrscheinlichkeit, dass ein Übergang stattfindet, eine scharfe Resonanz bei ω p . Durch Messung

126

6 Paramagnetismus und magnetische Resonanz

dieser Resonanzfrequenz in einem bekannten Magnetfeld B können wir die Größe g(q/2m) – und daraus den g-Faktor – mit großer Genauigkeit bestimmen. B

J ωp

Abb. 6.3: Die klassische Präzession eines Atoms mit dem magnetischen Moment μ und dem Drehimpuls J.

μ

Es ist interessant, dass man vom klassischen Standpunkt aus zu derselben Schlussfolgerung gelangt: Wenn wir einen kleinen Kreisel mit einem magnetischen Moment μ und einem Drehimpuls J in ein äußeres Magnetfeld bringen, wird der Kreisel nach dem klassischen Bild um eine zum Magnetfeld parallele Achse präzedieren. (Siehe Abbildung 6.3.) Angenommen, wir fragen: Wie können wir den Winkel des klassischen Kreisels in Bezug auf das Feld verändern – nämlich in Bezug auf die z-Achse? Das Magnetfeld erzeugt ein Drehmoment um eine horizontale Achse. Sie würden denken, dass solch ein Drehmoment versucht, den Magneten parallel zum Feld auszurichten, aber es bewirkt lediglich die Präzession. Wenn wir den Winkel des Kreisels in Bezug auf die z-Achse ändern wollen, müssen wir auf den Kreisel ein Drehmoment um die z-Achse ausüben. Wenn wir ein Drehmoment ausüben, das dieselbe Richtung wie die Präzession hat, wird sich der Winkel des Kreisels so ändern, dass sich in z-Richtung eine kleinere Komponente von J ergibt. In Abbildung 6.3 würde der Winkel zwischen J und der z-Achse größer werden. Wenn wir versuchen, die Präzession zu hemmen, bewegt sich J zur Vertikalen hin. B

B

J

J μ

μ (a)

B

(b)

B = b cos(ωt)

Abb. 6.4: Der Präzessionswinkel eines atomaren Magneten kann geändert werden durch ein horizontales Magnetfeld, das immer im rechten Winkel zu μ ist, wie in (a), oder durch ein oszillierendes Feld, wie in (b).

Wie können wir bei unserem in einem gleichförmigen Magnetfeld präzedierenden Atom diese Art von gewünschtem Drehmoment ausüben? Die Antwort lautet: Mit einem schwachen Magnetfeld von der Seite. Sie denken vielleicht zuerst, dass sich die Richtung dieses Magnetfeldes mit der Präzession des magnetischen Moments drehen müsste, sodass es immer im rechten Winkel zu dem Moment steht, wie durch das Feld B in Abbildung 6.4 (a) angedeutet wird. Ein solches Feld funktioniert gut, aber ein veränderliches horizontales Feld ist fast ebenso gut. Wenn wir ein schwaches horizontales Feld B anlegen, das immer in x-Richtung (plus oder minus) liegt und das mit der Frequenz ω p oszilliert, dann kehrt sich bei jedem halben Umlauf das auf das magnetische Moment wirkende Drehmoment um, sodass es einen aufschaukeln-

6.3 Die Rabi-Molekularstrahl-Methode

127

den Effekt hat, der fast genauso wirksam ist wie ein rotierendes Magnetfeld. Klassisch würden wir also erwarten, dass sich die Komponente des magnetischen Moments in z-Richtung ändert, wenn wir ein sehr schwaches oszillierendes Magnetfeld mit einer Frequenz, die genau ω p ist, anlegen. Klassisch würde sich natürlich μz kontinuierlich ändern, aber in der Quantenmechanik kann sich die z-Komponente des magnetischen Moments nicht kontinuierlich einstellen. Sie muss plötzlich von einem Wert zu einem anderen springen. Wir haben die Folgerungen aus der klassischen Mechanik und der Quantenmechanik gegenübergestellt, um Ihnen einen Hinweis darauf zu geben, was klassisch passieren könnte und wie es mit dem verknüpft ist, was tatsächlich in der Quantenmechanik geschieht. Sie werden übrigens bemerken, dass die erwartete resonante Frequenz in beiden Fällen dieselbe ist. Eine zusätzliche Bemerkung: Nach dem, was wir über die Quantenmechanik gesagt haben, gibt es keinen ersichtlichen Grund, warum es nicht auch Übergänge bei der Frequenz 2ω p geben sollte. Zufällig gibt es dazu im klassischen Fall kein Gegenstück, und es trifft auch in der Quantentheorie nicht zu – zumindest nicht für die spezielle Methode zur Anregung von Übergängen, die wir beschrieben haben. Bei einem oszillierenden horizontalen Magnetfeld ist die Wahrscheinlichkeit dafür, dass die Frequenz 2ω p einen Sprung von zwei Schritten auf einmal auslöst, null. Nur bei der Frequenz ω p besteht die Möglichkeit, dass Übergänge entweder nach oben oder nach unten auftreten. Wir sind jetzt so weit, dass wir die Rabi-Methode zur Messung magnetischer Momente beschreiben können. Wir wollen hier nur die Wirkungsweise bei Atomen mit dem Spin 1/2 betrachten. Eine Zeichnung des Apparates ist in Abbildung 6.5 gezeigt. Wir haben dort einen Ofen, der einen Strom neutraler Atome erzeugt, der durch eine Reihe von drei Magneten hindurch läuft. Magnet 1 ist ebenso wie der in Abbildung 6.2 und hat ein Feld mit einem starken Feldgradienten – sagen wir mit positivem ∂Bz/∂z. Wenn die Atome ein magnetisches Moment besitzen, werden sie abwärts abgelenkt, wenn Jz = +/2, oder aufwärts wenn Jz = −/2 (da für Elektronen μ antiparallel zu J ist). Wenn wir nur jene Atome betrachten, die durch den Spalt S 1 laufen können, dann gibt es die beiden dargestellten Flugbahnen. Atome mit Jz = +/2 müssen auf der Kurve a entlanglaufen, um durch den Spalt zu gelangen, und Atome mit Jz = −/2 müssen auf der Kurve b entlanglaufen. Atome, die auf anderen Wegen vom Ofen ausgehen, werden nicht durch den Spalt kommen. Jz = +/2 Ofen

a

∂Bz ∂z

B0 B�

b�

∂Bz ∂z b

Jz = −/2 Magnet 1

Detektor

a

b

Magnet 2

a� Magnet 3

Spalt S 2

Spalt S 1 Abb. 6.5: Der Molekularstrahlapparat von Rabi.

Magnet 2 hat ein gleichförmiges Feld. In diesem Gebiet wirken keine Kräfte auf die Atome, sie laufen daher geradewegs hindurch und treten in Magnet 3 ein. Magnet 3 ist ebenso wie Magnet 1, nur mit umgekehrtem Feld, sodass ∂Bz/∂z das entgegengesetzte Vorzeichen hat. Die Atome mit Jz = +/2 (wir sagen „mit Spin up“), die im Magnet 1 einen Stoß nach unten gespürt

128

6 Paramagnetismus und magnetische Resonanz

haben, erhalten nun im Magnet 3 einen Stoß nach oben; sie laufen weiter auf dem Weg a und gehen durch den Spalt S 2 zu einem Detektor. Die Atome mit Jz = −/2 („mit Spin down“) verspüren ebenfalls entgegengesetzte Kräfte in den Magneten 1 und 3, und sie laufen auf dem Weg b, der sie auch durch den Spalt S 2 zum Detektor bringt. Der Detektor kann auf verschiedene Weise gebaut sein, es hängt davon ab, welche Atome verwendet werden. Zum Beispiel kann für Atome eines Alkalimetalls wie Natrium der Detektor ein dünner, heißer Wolframdraht sein, der mit einem empfindlichen Strommessgerät verbunden ist. Wenn Natriumatome auf dem Draht landen, werden sie als Na+ -Ionen verdampft, wobei sie ein Elektron zurücklassen. Es fließt ein Strom von dem Draht, der proportional zur Zahl der pro Sekunde ankommenden Natriumatome ist. In der Öffnung von Magnet 2 befindet sich ein Spulensystem, das ein schwaches horizontales Magnetfeld B� erzeugt. Die Spulen werden mit einem Strom betrieben, der mit der Frequenz ω oszilliert. Also gibt es zwischen den Polen von Magnet 2 ein starkes konstantes vertikales Feld B0 und ein schwaches oszillierendes horizontales Feld B� . Nehmen Sie jetzt an, dass die Frequenz ω des oszillierenden horizontalen Feldes auf ω p – die „Präzessionsfrequenz“ der Atome im Feld B0 – eingestellt ist. Das Wechselfeld wird einige der vorbeikommenden Atome veranlassen, Übergänge von einem Jz zum anderen zu vollziehen. Ein Atom, dessen Spin anfangs „up“ war (Jz = +/2), kann in den Zustand „down“ gekippt werden (Jz = −/2). Dann hat dieses Atom die Richtung seines magnetischen Moments umgekehrt, es wird daher im Magneten 3 eine Kraft „nach unten“ spüren und sich auf dem in Abbildung 6.5 gezeigten Weg a� entlangbewegen. Es wird nicht mehr durch den Spalt S 2 zum Detektor gelangen. Ähnlich wird bei einigen Atomen, deren Spin anfangs „down“ war (Jz = −/2), der Spin „up“ geklappt (Jz = +/2), während sie durch Magnet 2 gehen. Sie werden dann den Weg b� entlanglaufen und ebenfalls nicht zum Detektor gelangen. Wenn das oszillierende Feld B� eine von ω p merklich verschiedene Frequenz hat, wird es keinen Spinumklapp verursachen, und die Atome werden ihren ungestörten Wegen zum Detektor folgen. Sie können also sehen, dass die „Präzessionsfrequenz“ der Atome im Feld B0 ermittelt werden kann, indem man die Frequenz ω des Feldes B� so lange verändert, bis eine Abnahme des Stromes der am Detektor ankommenden Atome beobachtet wird. Eine Abnahme des Stromes tritt dann ein, wenn ω „in Resonanz“ mit ω p ist. Ein Diagramm des Detektorstromes als Funktion von ω könnte etwa wie das in Abbildung 6.6 gezeigte Diagramm aussehen. Bei Kenntnis von ω p können wir den g-Wert des Atoms ermitteln. Detektorstrom

ωp

ω

Abb. 6.6: Der Strom der Atome im Strahl nimmt ab, wenn ω = ω p ist.

6.4 Der Paramagnetismus der Stoffe

129

Solche Atomstrahl- oder, wie man sie gewöhnlich nennt, „Molekularstrahl-“Resonanzversuche sind eine schöne und empfindliche Methode zur Messung der magnetischen Eigenschaften atomarer Objekte. Die Resonanzfrequenz ω p kann mit hoher Genauigkeit bestimmt werden – tatsächlich mit einer größeren Genauigkeit als die, mit der wir das Magnetfeld B0 messen können, das wir allerdings kennen müssen, um g zu finden.

6.4

Der Paramagnetismus der Stoffe

Wir wollen nun das Phänomen des Paramagnetismus von Stoffen beschreiben. Angenommen, wir betrachten eine Substanz, deren Atome permanente magnetische Momente haben, zum Beispiel ein Kristall wie Kupfersulfat. In dem Kristall sind Kupferionen, deren innere Elektronenschalen einen Gesamtdrehimpuls und ein resultierendes magnetisches Moment besitzen. Daher ist das Kupferion ein Objekt, das ein permanentes magnetisches Moment hat. Verlieren wir schnell ein paar Worte darüber, welche Atome magnetische Momente haben und welche nicht. Jedes Atom, wie zum Beispiel Natrium, das eine ungerade Zahl von Elektronen hat, besitzt ein magnetisches Moment. Natrium hat ein Elektron in seiner unaufgefüllten Schale. Dieses Elektron gibt dem Atom einen Spin und ein magnetisches Moment. Wenn Verbindungen gebildet werden, sind jedoch gewöhnlich die Valenzelektronen in der äußeren Schale mit anderen Elektronen, deren Spinrichtungen genau entgegengesetzt sind, zusammengekoppelt, sodass sich im Allgemeinen alle Drehimpulse und magnetischen Momente der Valenzelektronen gegenseitig aufheben. Das ist der Grund dafür, dass die Moleküle im Allgemeinen kein magnetisches Moment haben. Wenn wir ein Gas von Natriumatomen betrachten, gibt es natürlich keine solche Aufhebung.1 Ebenso verhält es sich, wenn wir ein, wie es in der Chemie genannt wird, „freies Radikal“ betrachten – ein Objekt mit einer ungeraden Zahl von Valenzelektronen –, die Bindungen sind dann nicht vollständig abgesättigt und es gibt einen Gesamtdrehimpuls. In den meisten Stoffen tritt ein resultierendes magnetisches Moment nur dann auf, wenn Atome vorhanden sind, deren innere Elektronenschale nicht gefüllt ist. Dann kann es einen Gesamtdrehimpuls und ein magnetisches Moment geben. Solche Atome findet man im Bereich der „Übergangselemente“ des Periodensystems – zum Beispiel sind Chrom, Mangan, Eisen, Nickel, Kobalt, Paladium und Platin Elemente dieser Art. Auch haben alle seltenen Erden unaufgefüllte innere Schalen und somit permanente magnetische Momente. Es gibt ein paar andere seltsame Stoffe, die zufällig auch magnetische Momente haben, wie etwa flüssiger Sauerstoff, aber wir wollen es den Chemikern überlassen, den Grund dafür zu erklären. Betrachten wir nun einen Kasten voller Atome oder Moleküle mit permanenten magnetischen Momenten – sagen wir ein Gas oder eine Flüssigkeit oder einen Kristall. Wir möchten gern wissen, was geschieht, wenn wir ein äußeres Magnetfeld anlegen. Ohne Magnetfeld werden die Atome durch thermische Bewegungen umhergestoßen, und die Momente zeigen schließlich in alle Richtungen. Wenn aber ein Magnetfeld vorhanden ist, bewirkt es eine Ausrichtung der kleinen Magnete; es gibt dann mehr Momente, die zum Feld hin ausgerichtet sind als davon weg. Das Material ist „magnetisiert.“ Wir definieren die Magnetisierung M eines Stoffes als das resultierende magnetische Moment pro Volumeneinheit, womit wir die Vektorsumme aller atomaren magnetischen Momente in der 1

Gewöhnlicher Na-Dampf ist meistens einatomig, obwohl es auch einige Na2 -Moleküle gibt.

130

6 Paramagnetismus und magnetische Resonanz

Volumeneinheit meinen. Wenn es N Atome in der Volumeneinheit gibt und deren durchschnittliches Moment �μ�mittel ist, dann kann M geschrieben werden als N mal dem durchschnittlichen atomaren Moment: M = N� μ�mittel .

(6.8)

Die Definition von M entspricht der Definition der elektrischen Polarisation P in Band III, Kapitel 1. Die klassische Theorie des Paramagnetismus folgt exakt der Theorie der Dielektrizitätskonstanten, die wir in Band III, Kapitel 11 dargelegt haben. Man nimmt an, dass jedes Atom ein magnetisches Moment μ hat, das zwar immer denselben Betrag hat, aber in beliebige Richtung zeigen kann. In einem Feld B ist die magnetische Energie μ · B = −μB cos θ, wobei θ der Winkel zwischen Moment und Feld ist. Gemäß der statistischen Mechanik ist die Wahrscheinlichkeit, irgendeinen Winkel vorzufinden, e−Energie/kT , daher sind Winkel nahe bei null wahrscheinlicher als Winkel nahe bei π. Wenn wir vorgehen wie in Band III, Abschnitt 11.3, sehen wir, dass M für schwache Magnetfelder parallel zu B ist und folgenden Betrag hat M=

Nμ2 B . 3kT

(6.9)

(Siehe Band III, Gleichung (11.20).) Diese Näherung ist nur richtig, wenn μ B/k T viel kleiner ist als eins. Wir stellen fest, dass die induzierte Magnetisierung – das magnetische Moment pro Volumeneinheit – zum Magnetfeld proportional ist. Dies ist das Phänomen des Paramagnetismus. Sie werden sehen, dass der Effekt bei niedriger Temperatur stärker und bei höherer Temperatur schwächer ist. Wenn wir ein Feld an eine Substanz anlegen, bewirkt es bei schwachen Feldern ein zum Feld proportionales magnetisches Moment. Das Verhältnis von M zu B (bei schwachen Feldern) nennt man die magnetische Suszeptibilität. Nun wollen wir uns den Paramagnetismus vom Standpunkt der Quantenmechanik aus ansehen. Wir betrachten zuerst den Fall eines Atoms mit dem Spin 1/2. Bei Abwesenheit eines Magnetfeldes haben alle Atome dieselbe Energie, aber in einem Magnetfeld gibt es zwei mögliche Energien, für jeden Wert von Jz eine. Für Jz = +/2 wird die Energie durch das Magnetfeld um den Betrag   qe  1 ΔU1 = +g · ·B (6.10) 2m 2 geändert. (Die Energieverschiebung ΔU ist bei den Atomen positiv, weil die Elektronenladung negativ ist.) Für Jz = −/2 wird die Energie um den Betrag   qe  1 ΔU2 = −g · ·B (6.11) 2m 2 geändert. Um Schreibarbeit zu sparen, setzen wir   qe  1 · ; μ0 = g 2m 2

(6.12)

dann ist ΔU = ±μ0 B.

(6.13)

6.4 Der Paramagnetismus der Stoffe

131

Die Bedeutung von μ0 ist klar: −μ0 ist die z-Komponente des magnetischen Moments für den Fall, dass der Spin „up“ ist, und +μ0 ist die z-Komponente des magnetischen Moments, falls der Spin „down“ zeigt. Nun sagt uns die statistische Mechanik, dass die Wahrscheinlichkeit dafür, dass ein Atom in dem einen oder anderen Zustand ist, proportional ist zu e−(Energie des Zustands)/kT . Ohne Magnetfeld haben die beiden Zustände die gleiche Energie; wenn also in einem Magnetfeld Gleichgewicht besteht, dann sind die Wahrscheinlichkeiten proportional zu e−ΔU/kT .

(6.14)

Die Zahl der Atome pro Volumeneinheit mit Spin up ist Nup = ae−μ0 B/kT ,

(6.15)

und die Zahl mit Spin down ist Ndown = ae+μ0 B/kT .

(6.16)

Die Konstante a ist so zu bestimmen, dass Nup + Ndown = N

(6.17)

die Gesamtzahl der Atome pro Volumeneinheit ergibt. Wir erhalten also a=

e+μ0 B/kT

N . + e−μ0 B/kT

(6.18)

Was uns interessiert, ist das mittlere magnetische Moment in Richtung der z-Achse. Die Atome mit Spin up werden ein Moment von −μ0 beitragen, und die Atome mit Spin down werden ein Moment von +μ0 haben; das mittlere Moment ist daher �μ�mittel =

Nup (−μ0 ) + Ndown (+μ0 ) . N

(6.19)

Das magnetische Moment pro Volumeneinheit M ist dann N�μ�mittel . Unter Verwendung der Gleichungen (6.15), (6.16) und (6.17) erhalten wir M = Nμ0

e+μ0 B/kT − e−μ0 B/kT . e+μ0 B/kT + e−μ0 B/kT

(6.20)

Dies ist die quantenmechanische Formel für M für Atome mit j = 1/2. Übrigens kann diese Formel auch etwas prägnanter durch die hyperbolische Tangensfunktion ausgedrückt werden: M = Nμ0 tanh

μ0 B . kT

(6.21)

132

6 Paramagnetismus und magnetische Resonanz

M Nμ0

0

3 2 μ0 B/kT

1

4

Abb. 6.7: Die Änderung der paramagnetischen Magnetisierung mit der magnetischen Feldstärke B.

Eine Darstellung von M als Funktion von B ist in Abbildung 6.7 wiedergegeben. Wenn B sehr groß wird, nähert sich der hyperbolische Tangens 1, und M geht gegen den Grenzwert Nμ0 . Daher ist bei starken Feldern die Magnetisierung gesättigt. Wir können sehen, warum das so ist; bei hinreichend starken Feldern sind alle Momente in dieselbe Richtung ausgerichtet. Mit anderen Worten: Sie sind alle im Spin-nach-unten-Zustand, und jedes Atom trägt das Moment μ0 bei. In den meisten normalen Fällen – sagen wir bei typischen Momenten, Raumtemperatur und Feldern, die man normalerweise erhalten kann (wie 10 000 Gauß) – beträgt das Verhältnis μ0 B/k T etwa 0,002. Man muss schon zu sehr niedrigen Temperaturen gehen, um die Sättigung zu sehen. Bei normalen Temperaturen können wir gewöhnlich tanh x durch x ersetzen und schreiben M=

Nμ20 B . kT

(6.22)

Ebenso wie wir in der klassischen Theorie gesehen haben, ist M proportional zu B. In der Tat ist die Formel fast genau die gleiche, nur dass ein Faktor 1/3 zu fehlen scheint. Wir müssen aber noch das μ0 in unserer Quantenformel mit dem μ, das im klassischen Ergebnis (6.9) erscheint, in Beziehung setzen. Was in der klassischen Formel auftritt, ist μ2 = μ · μ, das Quadrat des vektoriellen magnetischen Moments, oder  q 2 e μ· μ= g J · J. (6.23) 2m Wir haben im vorigen Kapitel darauf hingewiesen, dass Sie sehr wahrscheinlich die richtige Antwort aus einer klassischen Rechnung erhalten können, wenn Sie J · J durch j( j + 1)2 ersetzen. In unserem Beispiel haben wir j = 1/2, sodass gilt j( j + 1)2 = 34 2 . Wenn wir dies für J · J in Gleichung (6.23) einsetzen, erhalten wir  q 2 32 e , μ· μ= g 2m 4 oder ausgedrückt durch das in (6.12) definierte μ0 μ · μ = 3μ20 .

6.5 Kühlung durch adiabatische Entmagnetisierung

133

Setzen wir dies für μ2 in die klassische Formel (6.9) ein, so wird tatsächlich die richtige quantenmechanische Formel, Gleichung (6.22), reproduziert. Die Quantentheorie des Paramagnetismus ist leicht auf Atome mit beliebigem Spin j zu erweitern. Die Magnetisierung im schwachen Feld ist M = Ng2

j( j + 1) μ2B B , 3 kT

(6.24)

wobei μB =

qe  2m

(6.25)

eine Kombination von Konstanten mit der Dimension eines magnetischen Moments ist. Die meisten Atome haben Momente von etwa dieser Größe. Man nennt es das bohrsche Magneton. Das magnetische Spinmoment des Elektrons ist fast genau ein bohrsches Magneton.

6.5

Kühlung durch adiabatische Entmagnetisierung

Es gibt eine sehr interessante Anwendung des Paramagnetismus. Bei sehr tiefen Temperaturen ist es möglich, die atomaren Magnete in einem starken Feld auszurichten. Es ist dann möglich, durch einen Prozess, der adiabatische Entmagnetisierung genannt wird, zu extrem tiefen Temperaturen hinunter zu gelangen. Wir können ein paramagnetisches Salz verwenden (zum Beispiel ein Salz, das eine Anzahl von Atomen der seltenen Erden enthält, wie PraseodymiumAmmonium-Nitrat) und es erst einmal in einem starken magnetischen Feld durch flüssiges Helium auf ein oder zwei Grad Kelvin abkühlen. Dann liegt der Faktor μB/k T bei einem Wert größer als 1 – sagen wir etwa bei 2 oder 3. Die meisten Spins sind ausgerichtet und die Magnetisierung ist fast gesättigt. Sagen wir, um es leicht zu machen, dass das Feld sehr stark und die Temperatur sehr tief ist, sodass fast alle Atome ausgerichtet sind. Dann isolieren Sie das Salz thermisch (z. B., indem Sie das flüssige Helium entfernen und ein gutes Vakuum zurückbehalten) und stellen das Magnetfeld ab. Die Temperatur des Salzes sinkt weiter. Wenn Sie das Feld plötzlich abschalten, wird das Zittern und Schütteln der Atome im Kristallgitter allmählich alle Spins aus ihrer gleichmäßigen Anordnung herausstoßen. Einige werden nach oben und einige nach unten zeigen. Wenn aber kein Feld vorhanden ist (und wir die Wechselwirkungen zwischen den atomaren Magneten vernachlässigen, was nur einen geringfügigen Fehler ergibt), bedarf es keiner Energie, um die atomaren Magnete umzudrehen. Sie könnten ihre Spins beliebig einstellen, ohne dass sich die Energie und damit auch die Temperatur irgendwie ändert. Nehmen Sie nun jedoch an, dass, während die atomaren Magnete von der thermischen Bewegung umgeklappt werden, noch etwas vom Magnetfeld vorhanden ist. Dann erfordert es einige Arbeit, um sie in entgegengesetzte Richtung zum Feld umzuklappen – sie müssen Arbeit gegen das Feld verrichten. Dies entzieht den thermischen Bewegungen Energie und erniedrigt die Temperatur. Wenn daher das starke Magnetfeld nicht zu schnell entfernt wird, nimmt die Temperatur des Salzes ab – es wird durch die Entmagnetisierung abgekühlt. Aus quantenmechanischer Sicht sind bei starkem Feld alle Atome im energetisch niedrigsten Zustand, weil es

134

6 Paramagnetismus und magnetische Resonanz

keine endliche Wahrscheinlichkeit für eine Besetzung des höheren Zustands gibt. Wenn aber das Feld verringert wird, wird es immer wahrscheinlicher, dass thermische Fluktuationen das Atom in den höheren Zustand stoßen. Wenn das geschieht, absorbiert das Atom die Energie ΔU = μ0 B. Wenn daher das Feld langsam abgeschaltet wird, können die magnetischen Übergänge Energie aus den thermischen Vibrationen des Kristalls ziehen und ihn dadurch abkühlen. Es ist auf diese Art möglich, von einer Temperatur von wenigen Grad Kelvin zu einer Temperatur von einigen tausendstel Grad zu gelangen. Möchten Sie noch tiefere Temperaturen erreichen? Es stellt sich heraus, dass die Natur eine Möglichkeit dafür vorgesehen hat. Wir haben bereits erwähnt, dass es auch magnetische Momente der Atomkerne gibt. Unsere Formeln für den Paramagnetismus treffen genauso gut auf Kerne zu, nur dass die Momente der Kerne etwa tausendmal kleiner sind. (Sie sind von der Größenordnung q/2m p , wobei m p die Protonenmasse ist, sodass sie um das Verhältnis der Massen von Elektron und Proton kleiner sind.) Bei solchen magnetischen Momenten beträgt sogar bei einer Temperatur von 2 K der Faktor μB/kT nur einige Tausendstel. Aber wenn wir den paramagnetischen Entmagnetisierungsprozess benutzen, um auf eine Temperatur von einigen tausendstel Kelvin zu kommen, wird μB/kT eine Zahl nahe bei 1 – bei diesen tiefen Temperaturen können wir damit anfangen, die Kernmomente zu sättigen. Das ist ein glücklicher Umstand, weil wir dann die adiabatische Entmagnetisierung des Kernmagnetismus benutzen können, um noch tiefere Temperaturen zu erreichen. Somit ist es möglich, die magnetische Abkühlung in zwei Etappen vorzunehmen. Zuerst benutzen wir die adiabatische Entmagnetisierung paramagnetischer Ionen, um einige tausendstel Grad zu erreichen. Dann verwenden wir das kalte paramagnetische Salz, um eine Substanz abzukühlen, die einen starken Kernmagnetismus hat. Wenn wir das Magnetfeld von dieser Substanz entfernen, wird schließlich die Temperatur unter ein millionstel Grad über dem absoluten Nullpunkt absinken – sofern wir alles sehr sorgfältig gemacht haben.

6.6

Magnetische Kernresonanz

Wir haben gesagt, dass der atomare Paramagnetismus sehr klein ist und dass der Kernmagnetismus sogar noch tausendmal kleiner ist. Doch ist es relativ einfach, den Kernmagnetismus durch das Phänomen der „magnetischen Kernresonanz“ zu beobachten. Angenommen, wir nehmen eine Substanz wie Wasser, in der alle Elektronenspins sich vollständig kompensieren, sodass ihr resultierendes magnetisches Moment null ist. Die Moleküle besitzen dann noch ein sehr, sehr geringes magnetisches Moment infolge des nuklearen magnetischen Moments des Wasserstoffkerns. Angenommen, wir bringen eine kleine Probe Wasser in ein Magnetfeld B. Da die Protonen (des Wasserstoffs) den Spin 1/2 haben, besitzen sie zwei mögliche Energiezustände. Wenn das Wasser im thermischen Gleichgewicht ist, werden etwas mehr Protonen in dem niedrigeren Energiezustand sein – ihre Momente sind dabei parallel zum Feld ausgerichtet. Es gibt ein kleines resultierendes magnetisches Moment pro Volumeneinheit. Da das Protonenmoment nur etwa ein Tausendstel eines atomaren Moments ist, ist die Magnetisierung, die mit μ2 geht – bei Benutzung von (6.22) –, nur etwa ein Millionstel mal so stark wie der typische atomare Paramagnetismus. (Deshalb müssen wir auch eine Substanz ohne atomaren Magnetismus wählen.) Wenn Sie es ausrechnen, ist der Unterschied zwischen der Zahl der Protonen mit Spin up und mit Spin down nur eins zu 108 , der Effekt ist also tatsächlich sehr schwach! Er kann jedoch auf folgende Weise beobachtet werden.

6.6 Magnetische Kernresonanz

135

Angenommen, wir umgeben die Wasserprobe mit einer kleinen Spule, die ein schwaches horizontales oszillierendes Magnetfeld erzeugt. Wenn dieses Feld mit der Frequenz ω p oszilliert, induziert es Übergänge zwischen den beiden Energiezuständen – ebenso wie wir es beim RabiExperiment in Abschnitt 6.3 beschrieben haben. Wenn ein Proton von einem höheren Energiezustand in einen niedrigeren übergeht, gibt es die Energie μz B ab, die, wie wir gesehen haben, gleich ω p ist. Falls es aus dem niedrigeren Energiezustand in den höheren übergeht, wird es die Energie ω p der Spule entnehmen. Da etwas mehr Protonen im niedrigeren als im höheren Zustand sind, wird es insgesamt eine Energieentnahme aus der Spule geben. Obwohl der Effekt sehr klein ist, kann man die geringe Energieentnahme mit einem empfindlichen elektronischen Verstärker messen. Ebenso wie in dem Molekularstrahlversuch von Rabi wird man die Energieabsorption nur dann beobachten, wenn das oszillierende Feld in Resonanz ist, das heißt, wenn   qe ω = ωp = g B. 2m p Es ist oft bequemer, nach der Resonanz zu suchen, indem man B variiert und ω festhält. Die Energieabsorption wird offensichtlich auftreten, wenn B=

2m p ω. gqe

Magnetpole

Hilfsspulen

Oszillator Wasser

ω heraus Verlustsignal

Oszillograph

V 60∼ Quelle

H Ablenkung Trigger

Abb. 6.8: Ein magnetischer Kernresonanzapparat.

Ein typischer Kernresonanzapparat ist in Abbildung 6.8 gezeigt. Ein Hochfrequenz-Oszillator betreibt eine kleine Spule, die sich zwischen den Polen eines großen Elektromagneten befindet. Zwei kleine Hilfsspulen um die Polenden werden mit einem 60-Hertz-Strom betrieben, sodass das Magnetfeld um einen sehr kleinen Betrag um seinen Mittelwert „gewobbelt“ wird. Um ein

136

6 Paramagnetismus und magnetische Resonanz

Beispiel anzugeben, sagen wir, dass der Hauptstrom des Magneten so eingestellt ist, dass er ein Feld von 5000 Gauß ergibt, und dass die Hilfsspulen eine Abweichung ±1 Gauß um diesen Wert erzeugen. Wenn der Oszillator auf 21,2 Megahertz eingestellt ist, wird er sich jedes Mal dann bei der Protonenresonanz befinden, wenn das Feld durch 5000 Gauß geht (bei Benutzung von (5.13) mit g = 5,58 für das Proton). Der Oszillator ist so geschaltet, dass er ein zusätzliches Ausgangssignal abgibt, das proportional zur Änderung der dem Oszillator entnommenen Energie ist. Dieses Signal wird auf den Vertikalablenkungsverstärker eines Oszillographen gegeben. Die Horizontalablenkung des Oszillographen wird einmal während jeder Schwingung der Feldwobbelfrequenz ausgesteuert. (Gebräuchlicher ist es, die Horizontalablenkung so zu gestalten, dass sie proportional zum Wobbelfeld ist.) Bevor die Wasserprobe in die Hochfrequenzspule gebracht wird, hat die Energie, die dem Oszillator entnommen wird, einen bestimmten Betrag. (Er ändert sich nicht mit dem Magnetfeld.) Wenn jedoch eine kleine Wasserflasche in die Spule gebracht wird, gibt es ein Signal auf dem Oszillographen, wie in der Abbildung gezeigt. Wir sehen ein Bild der Energie, die durch das Umklappen der Protonen absorbiert wird! In der Praxis ist es schwierig, den Hauptmagneten genau auf 5000 Gauß einzustellen. Man kann das dadurch erreichen, dass man den Strom für den Haupmagneten so lange regelt, bis das Resonanzsignal auf dem Oszillographen erscheint. Es stellt sich heraus, dass dies heute die bequemste Methode ist, eine exakte Messung der magnetischen Feldstärke vorzunehmen. Natürlich musste irgendwann einmal jemand das Magnetfeld und die Frequenz genau messen, um den g-Wert des Protons zu bestimmen. Aber nun, da dies getan ist, kann ein Protonenresonanzapparat, wie der in der Abbildung, als „Protonenresonanzmagnetometer“ verwendet werden. Wir sollten etwas über die Form des Signals sagen. Wenn wir das Magnetfeld sehr langsam wobbeln, erwarten wir, eine normale Resonanzkurve zu sehen. Die Energieabsorption zeigt ein Maximum, wenn ω p genau bei der Oszillatorfrequenz ankommt. Es gäbe etwas Absorption bei benachbarten Frequenzen, weil nicht alle Protonen in genau demselben Feld sind – und verschiedene Felder bedeuten etwas verschiedene Resonanzfrequenzen. Man kann sich übrigens fragen, ob wir bei der Resonanzfrequenz überhaupt ein Signal sehen können. Sollten wir nicht erwarten, dass das Hochfrequenzfeld die Besetzungen der beiden Zustände ausgleicht – sodass es gar kein Signal gibt, außer wenn das Wasser am Anfang hineingebracht wird? Nicht genau, denn, obwohl wir versuchen, die beiden Besetzungen auszugleichen, versuchen die thermischen Bewegungen ihrerseits, die richtigen Verhältnisse für die Temperatur T aufrechtzuerhalten. Wenn wir am Resonanzpunkt sitzen, ist die vom Kern absorbierte Energie genau gleich der Energie, die an die thermische Bewegung verloren geht. Es gibt jedoch relativ wenig „thermischen Kontakt“ zwischen den magnetischen Momenten der Protonen und den atomaren Bewegungen. Die Protonen sind verhältnismäßig isoliert tief im Zentrum der Elektronenverteilungen. Daher ist in reinem Wasser das Resonanzsignal tatsächlich im Allgemeinen zu klein, um erkannt zu werden. Um die Absorption zu steigern, ist es notwendig, den „thermischen Kontakt“ zu vergrößern. Dies erreicht man gewöhnlich, indem man dem Wasser etwas Eisenoxyd zusetzt. Die Eisenatome wirken wie kleine Magnete. Während sie in ihrem thermischen Tanz herumhüpfen, erzeugen sie bei den Protonen winzige vibrierende Magnetfelder. Diese variierenden Felder „koppeln“ die Protonenmagnete mit den atomaren Vibrationen und sind bestrebt, das thermische Gleichgewicht herzustellen. Es ist diese „Kopplung“, durch die Protonen im höheren Energiezustand ihre Energie verlieren können, sodass sie wieder in der Lage sind, Energie aus einem Oszillator aufzunehmen.

6.6 Magnetische Kernresonanz

137

In der Praxis sieht das Ausgangssignal eines Kernresonanzapparates nicht wie eine normale Resonanzkurve aus. Es ist gewöhnlich ein kompliziertes Signal mit Oszillationen – wie dasjenige, das in der Abbildung gezeichnet ist. Solche Signalformen treten wegen der sich ändernden Felder auf. Die Erklärung dafür kann nur quantenmechanisch gegeben werden, aber man kann zeigen, dass bei solchen Experimenten die klassischen Vorstellungen von präzedierenden Momenten immer die richtige Antwort ergeben. Klassisch würden wir sagen, dass wir beim Erreichen der Resonanz damit anfangen, sehr viele präzedierende nukleare Magnete gleichzeitig anzutreiben. Wenn wir das so machen, lassen wir sie gemeinsam präzedieren. Diese sich alle gemeinsam drehenden nuklearen Magnete induzieren eine EMK in der Oszillatorspule bei der Frequenz ω p . Weil aber das Magnetfeld mit der Zeit anwächst, wächst auch die Präzessionsfrequenz und die induzierte Spannung ist bald bei einer Frequenz, die etwas höher als die Oszillatorfrequenz ist. Weil die induzierte EMK abwechselnd in Phase und nicht in Phase mit dem Oszillator ist, wird die „absorbierte“ Energie abwechselnd positiv und negativ. Daher sehen wir auf dem Oszillator die Schwebung zwischen der Protonenfrequenz und der Oszillatorfrequenz. Weil die Protonenfrequenzen nicht alle identisch sind (verschiedene Protonen sind in etwas verschiedenen Feldern) und möglicherweise auch wegen der Störung durch das Eisenoxyd im Wasser, geraten die frei präzedierenden Momente schnell außer Phase, und das Schwebungssignal verschwindet. Diese Phänomene der magnetischen Resonanz haben auf vielerlei Weise Anwendung gefunden als Hilfsmittel, um neue Erkenntnisse über die Materie zu gewinnen, – besonders in der Chemie und in der Kernphysik. Es braucht nicht gesagt zu werden, dass die numerischen Werte der magnetischen Momente der Kerne uns etwas über ihre Struktur sagen. In der Chemie hat man aus der Struktur (oder der Form) der Resonanzen viel gelernt. Wegen der von benachbarten Kernen erzeugten Magnetfelder wird der genaue Ort einer Kernresonanz etwas verschoben, was von der Umgebung, in der sich ein spezieller Kern befindet, abhängt. Die Messung dieser Verschiebungen ermöglicht es festzustellen, welche Atome in der Nähe von welchen anderen sind, und hilft, die Einzelheiten der Molekülstrukturen zu erhellen. Gleichermaßen wichtig ist die Elektronenspinresonanz freier Radikale. Obwohl sie nicht in sehr großem Ausmaß im Gleichgewicht vorliegen, sind solche Radikale oft doch Zwischenzustände bei chemischen Reaktionen. Die Messung einer Elektronenspinresonanz ist ein empfindlicher Test für die Anwesenheit freier Radikale und oft der Schlüssel zum Verständnis des Mechanismus spezieller chemischer Reaktionen.

7

Ferromagnetismus

Siehe auch: Band III, Kapitel 10, Dielektrika Band III, Kapitel 17, Die Induktionsgesetze

7.1

Magnetisierungsströme

In diesem Kapitel werden wir über einige Materialien sprechen, in denen der Gesamteffekt der magnetischen Momente sehr viel größer ist als im Fall des Para- oder Diamagnetismus. Das Phänomen heißt Ferromagnetismus. In paramagnetischen und diamagnetischen Materialien sind die induzierten magnetischen Momente gewöhnlich so schwach, dass wir uns nicht um die von den magnetischen Momenten erzeugten zusätzlichen Felder kümmern müssen. In ferromagnetischen Materialien sind dagegen die von den angelegten Magnetfeldern induzierten magnetischen Momente außerordentlich groß und üben einen beachtlichen Effekt auf die Felder selbst aus. Die induzierten Momente sind tatsächlich so stark, dass sie oft den dominierenden Effekt bei der Erzeugung der beobachteten Felder hervorrufen. Somit ist eines der Probleme, auf das wir uns konzentrieren wollen, die mathematische Theorie großer induzierter magnetischer Momente. Das ist natürlich einfach eine technische Frage. Das eigentliche Problem ist: Warum sind die magnetischen Momente so stark? Was ist der Mechanismus des Ferromagnetismus? Wir werden auf diese Frage sehr bald zurückkommen. Das Bestimmen der Magnetfelder von ferromagnetischen Materialien ist ein ähnliches Problem wie das Bestimmen des elektrostatischen Feldes in Anwesenheit von Dielektrika. Sie werden sich daran erinnern, dass wir zunächst die inneren Eigenschaften eines Dielektrikums mithilfe eines Vektorfeldes P, des Dipolmoments pro Volumeneinheit, beschrieben haben. Dann haben wir uns überlegt, dass die Effekte dieser Polarisation äquivalent zu einer Ladungsdichte ρpol sind, die durch die Divergenz von P gegeben ist: ρpol = − ∇ · P.

(7.1)

Die Gesamtladung kann dann in jeder Situation als die Summe dieser Polarisationsladung plus aller anderen Ladungen geschrieben werden, wobei wir die Dichte der anderen Ladungen mit ρandere bezeichnen.1 Dann wird die Maxwell-Gleichung, die die Divergenz von E mit der Ladungsdichte verknüpft, zu ρpol + ρandere ρ ∇· E= = , �0 �0 oder ∇· E=− 1

∇ · P ρandere + . �0 �0

Befänden sich alle „anderen“ Ladungen auf Leitern, so wäre ρandere dasselbe wie ρfrei in Band III, Kapitel 10.

140

7 Ferromagnetismus

Wir können dann den Anteil der Ladung, der auf der Polarisation beruht, herausziehen und auf die andere Seite der Gleichung bringen, um so das neue Gesetz zu erhalten ∇ · (�0 E + P) = ρandere .

(7.2)

Nach diesem neuen Gesetz ist die Divergenz der Größe (�0 E + P) gleich der Dichte der anderen Ladungen. E Hohlraum = E + P/�0

E Hohlraum = E + P/3�0 E

P

E Hohlraum = E

E

P

E

P

Abb. 7.1: Das elektrische Feld in einem Hohlraum eines Dielektrikums hängt von der Form des Hohlraums ab.

Das Zusammenfassen von E und P wie in (7.2) ist natürlich nur dann nützlich, wenn wir die Beziehung zwischen beiden Größen kennen. Wir haben gesehen, dass die Theorie, die das induzierte elektrische Dipolmoment mit dem elektrischen Feld verknüpft, eine relativ komplizierte Angelegenheit ist, die eigentlich nur auf einfache Situationen anwendbar ist und selbst dann nur näherungsweise. Wir möchten Sie an eine der approximativen Konzepte erinnern, die wir verwendet haben. Um das induzierte Dipolmoment eines Atoms im Innern eines Dielektrikums zu bestimmen, ist es notwendig, dass man das elektrische Feld kennt, das auf ein einzelnes Atom wirkt. Wir haben die Näherung – die in vielen Fällen gar nicht so schlecht ist – verwendet, dass das Feld, das auf ein Atom wirkt, dasselbe ist wie das im Mittelpunkt eines kleinen Hohlraums, der zurückbleibt, wenn wir das betrachtete Atom herausnehmen (wobei wir die Dipolmomente aller Nachbaratome unverändert lassen). Sie werden sich ferner daran erinnern, dass das elektrische Feld in einem Hohlraum eines polarisierten Dielektrikums von der Form des Hohlraums abhängt. Wir fassen unsere früheren Resultate in Abbildung 7.1 zusammen. Für einen dünnen, scheibenförmigen Hohlraum senkrecht zur Polarisationsrichtung ist das elektrische Feld im Hohlraum gegeben durch EHohlraum = EDielektrikum +

P , �0

was wir mithilfe des gaußschen Gesetzes bewiesen haben. Andererseits haben wir für einen nadelförmigen Schlitz parallel zur Polarisation gezeigt – anhand der Tatsache, dass die Rotation von E null ist – dass die elektrischen Felder innerhalb und außerhalb des Schlitzes gleich sind. Schließlich haben wir festgestellt, dass das elektrische Feld in einem kugelförmigen Hohlraum um ein Drittel zwischen dem Feld des Schlitzes und dem Feld der Scheibe liegt: EHohlraum = EDielektrikum +

1 P (kugelförmiger Hohlraum). 3 �0

(7.3)

Mit eben diesem Feld haben wir untersucht, was mit einem Atom im Innern eines polarisierten Dielektrikums geschieht.

7.1 Magnetisierungsströme

141

Nun müssen wir das Analogon zu all dem für den Fall des Magnetismus finden. In einfacher, kurzgefasster Form könnte man sagen, dass M, das magnetische Moment pro Volumeneinheit, genau P, dem elektrischen Dipolmoment pro Volumeneinheit, entspricht und dass somit die negative Divergenz von M äquivalent zu einer „magnetischen Ladungsdichte“ ρm ist – was auch immer das bedeuten mag. Problematisch ist nur, dass es so etwas wie eine „magnetische Ladung“ in der physikalischen Welt nicht gibt. Wie wir wissen, ist die Divergenz von B immer null. Aber das soll uns nicht davon abhalten, ein künstliches Analogon zu bilden und zu schreiben ∇ · M = −ρm ,

(7.4)

wobei ρm rein mathematisch zu verstehen ist. Dann können wir eine vollständige Analogie zum elektrostatischen Fall herstellen und alle unsere Gleichungen aus der Elektrostatik verwenden. Es ist oft dergleichen getan worden. Tatsächlich hat man in der Vergangenheit sogar geglaubt, dass die Analogie richtig sei. Man glaubte, dass die Größe ρm die Dichte der „Magnetpole“ darstellt. Heute aber wissen wir, dass die Magnetisierung der Materialien von Kreisströmen innerhalb der Atome herrührt – wobei die Ursache entweder der Spin der Elektronen oder ihre Bewegung in dem Atom ist. Insofern ist es von einem physikalischen Standpunkt aus korrekter, die Phänomene nicht in Ausdrücken der Dichte irgendwelcher mythischer „Magnetpole“, sondern realistisch in Ausdrücken der atomaren Ströme zu beschreiben. Übrigens werden diese Ströme manchmal auch „ampèresche“ Ströme genannt, weil Ampère als Erster die Idee hatte, dass der Magnetismus der Materie auf atomaren Kreisströmen beruht. Die effektive mikroskopische Stromdichte in magnetisierter Materie ist natürlich sehr kompliziert zu bestimmen. Ihr Wert hängt von dem Punkt ab, den Sie im Atom betrachten – stellenweise ist die Stromdichte groß, stellenweise klein; der Strom läuft in einem Teil des Atoms in der einen und in einem anderen Teil in der entgegengesetzten Richtung (genau so, wie sich das mikroskopische elektrische Feld im Innern eines Dielektrikums beträchtlich ändert). Bei vielen praktischen Problemen sind wir aber nur an den Feldern außerhalb der Materie oder an dem mittleren Magnetfeld im Innern der Materie interessiert – worunter wir das Mittel über sehr viele Atome verstehen. Nur im Fall solcher makroskopischer Probleme ist es angebracht, den magnetischen Zustand der Materie durch M, das mittlere Dipolmoment pro Volumeneinheit, zu beschreiben. Was wir nun zeigen wollen, ist die Tatsache, dass die atomaren Ströme von magnetisierter Materie gewisse Ströme in großem Maßstab hervorrufen können, die mit M in Beziehung stehen. Wir werden also die Stromdichte j – die die wirkliche Quelle der Magnetfelder ist – in verschiedene Anteile aufteilen: Ein Anteil wird die Kreisströme der atomaren Magnete beschreiben und die anderen Anteile werden die anderen Ströme beschreiben, die dort auftreten können. Gewöhnlich ist es sehr nützlich, die Ströme in drei Anteile aufzuteilen. In Kapitel 3 haben wir zwischen den Strömen, die auf Leitern frei strömen, und denen, die auf der Hin- und Herbewegung der gebundenen Ladungen in Dielektrika beruhen, unterschieden. In Abschnitt 3.2 schrieben wir j = jpol + jandere , wobei jpol die Ströme infolge der Bewegung der gebundenen Ladungen in Dielektrika bezeichnete und jandere alle anderen Ströme umfasste. Jetzt wollen wir weiter gehen. Wir wollen jandere

142

7 Ferromagnetismus

noch einmal aufteilen in einen Anteil jmag , der die mittleren Ströme im Innern von magnetisierten Materialien beschreibt, und in einen zusätzlichen Term, den wir jcond nennen wollen und der alles Übrige repräsentiert. Der letzte Term wird sich gewöhnlich auf Ströme in Leitern beziehen, aber er kann auch andere Ströme einschließen – beispielsweise die Ströme von Ladungen, die sich frei durch den leeren Raum bewegen. Somit schreiben wir für die gesamte Stromdichte j = jpol + jmag + jcond .

(7.5)

Natürlich ist es der gesamte Strom, der in der Maxwell-Gleichung für die Rotation von B auftritt: c2 ∇ × B =

j ∂E . + �0 ∂t

(7.6)

Nun müssen wir den Strom jmag mit dem Magnetisierungsvektor M in Beziehung setzen. Damit Sie sehen können, worauf wir hinauswollen, sagen wir Ihnen, dass das Resultat das Folgende sein wird: jmag = ∇ × M.

(7.7)

Ist der Magnetisierungsvektor M überall in einem magnetischen Material bekannt, so ist die Zirkulationsstromdichte durch die Rotation von M gegeben. Sehen wir, ob wir verstehen können, warum das so ist. Betrachten wir zuerst den Fall eines zylindrischen Stabes mit einer homogenen Magnetisierung parallel zu seiner Achse. Physikalisch gesehen wissen wir, dass eine solche homogene Magnetisierung in Wirklichkeit eine homogene Dichte der atomaren Kreisströme überall im Innern des Materials bedeutet. Versuchen wir, uns vorzustellen, wie die Ströme in einem Querschnitt des Materials effektiv aussehen könnten. Wir würden Ströme erwarten, die in etwa so aussehen wie die in Abbildung 7.2. Jeder atomare Strom fließt in einem kleinen Kreis, und alle Ströme zirkulieren in derselben Richtung. Was ist nun in einer solchen Situation der effektive Strom? Nun, im größten Teil des Stabes gibt es überhaupt keinen Effekt, weil gleich neben jedem Strom ein anderer Strom in der entgegengesetzten Richtung fließt. Stellen wir uns eine kleine Fläche vor – die aber noch wesentlich größer als die Fläche eines einzelnen Atoms ist – wie die in Abbildung 7.2 im Schnitt durch die Linie AB angezeigte Fläche, so ist der Gesamtstrom durch eine solche Fläche null. Es gibt keinen Gesamtstrom im Innern des Materials. Beachten Sie jedoch, dass es an der Oberfläche des Materials atomare Ströme gibt, die nicht durch entgegengesetzt fließende Nachbarströme kompensiert werden. An der Oberfläche gibt es einen Gesamtstrom, der überall in derselben Richtung um den Stab fließt. Nun sehen Sie, warum wir früher gesagt haben, dass ein homogen magnetisierter Stab äquivalent zu einem langen Solenoid ist, das einen elektrischen Strom führt. Wie lässt sich diese Erkenntnis mit Gleichung (7.7) vereinbaren? Zunächst einmal ist die Magnetisierung M im Innern des Materials konstant und somit sind alle ihre Ableitungen null. Das stimmt mit unserer geometrischen Beschreibung überein. An der Oberfläche hingegen ist M nicht konstant – M ist konstant bis zur Kante und dann fällt die Magnetisierung plötzlich auf null ab. Folglich gibt es unmittelbar an der Oberfläche ungeheuere Gradienten, die laut (7.7) eine große Stromdichte liefern. Sehen wir, was in der Nähe des Punktes C in Abbildung 7.2 pas-

7.1 Magnetisierungsströme

A

143

B

C

Abb. 7.2: Schematisches Diagramm der atomaren Kreisströme, wie sie sich in einem Querschnitt eines Eisenstabes zeigen, der in der z-Richtung magnetisiert ist.

y x

siert. Wählen wir die x- und y-Richtungen wie in der Abbildung, so zeigt die Magnetisierung M in die z-Richtung. Wenn wir die Komponenten von (7.7) ausschreiben, erhalten wir ∂Mz = ( jmag ) x , ∂y ∂Mz = ( jmag )y . − ∂x

(7.8)

Am Punkt C ist die Ableitung ∂Mz /∂y null, aber ∂Mz /∂x ist groß und positiv. Laut (7.7) gibt es eine große Stromdichte in der negativen y-Richtung. Das stimmt mit unserem Bild eines Oberflächenstroms um den Stab herum überein. Nun wollen wir die Stromdichte für einen komplizierteren Fall ermitteln, in dem sich die Magnetisierung innerhalb eines Materials von Punkt zu Punkt ändert. Qualitativ ist leicht zu sehen, dass es bei unterschiedlicher Magnetisierung in zwei Nachbarbereichen keine vollkommene Kompensation der zirkulierenden Ströme gibt, sodass im Volumen des Materials ein Gesamtstrom vorliegt. Es ist dieser Effekt, den wir quantitativ berechnen wollen. Zunächst müssen wir uns daran erinnern, dass gemäß den Resultaten in Band III, Abschnitt 14.5 ein zirkulierender Strom I ein magnetisches Moment μ hervorruft, das gegeben ist durch μ = IA,

(7.9)

wobei A die Größe der Fläche ist, die durch den Strom begrenzt wird (siehe Abbildung 7.3). μ

I Flächeninhalt A

Abb. 7.3: Das Dipolmoment μ einer Stromschleife ist IA.

144

7 Ferromagnetismus

Betrachten wir nun einen kleinen rechteckigen Block im Innern eines magnetisierten Materials, wie er in Abbildung 7.4 skizziert ist. Wir wählen den Block so klein, dass wir die Magnetisierung im Innern als homogen betrachten können. Hat dieser Block eine Magnetisierung Mz in der z-Richtung, so ist der Gesamteffekt derselbe wie bei einem Oberflächenstrom, der – wie in der Abbildung gezeigt – um die vertikalen Seitenflächen fließt. Den Betrag dieses Stroms können wir aus (7.9) erhalten. Das gesamte magnetische Moment des Blocks ist gleich der Magnetisierung mal dem Volumen: μ = Mz (abc), und (wir erinnern uns daran, dass der Flächeninhalt der Schleife ac ist) das gibt uns I = Mz b. Mit anderen Worten: Der Strom pro vertikaler Längeneinheit auf jeder der vertikalen Oberflächen ist gleich Mz . Mz c a I

b z

y

Abb. 7.4: Ein kleiner magnetisierter Block ist äquivalent zu einem zirkulierenden Oberflächenstrom.

x

Stellen wir uns nun zwei dieser kleinen Blöcke nebeneinander vor, wie das in Abbildung 7.5 gezeigt ist. Da Block 2 gegenüber Block 1 geringfügig verschoben ist, hat er eine etwas andere vertikale Komponente der Magnetisierung, die wir mit Mz + ΔMz bezeichnen. Mz

Mz + ΔMz

c a b

z

I1 I2

I1 1

y x

a I2 2

Abb. 7.5: Ist die Magnetisierung von zwei benachbarten Blöcken nicht gleich, so fließt zwischen ihnen insgesamt ein Oberflächenstrom.

Auf der Trennfläche zwischen den beiden Blöcken gibt es zwei Beiträge zum Gesamtstrom. Block 1 erzeugt einen Strom I1 , der in der positiven y-Richtung fließt, und Block 2 erzeugt einen

7.1 Magnetisierungsströme

145

Oberflächenstrom I2 , der in der negativen y-Richtung fließt. Der gesamte Oberflächenstrom in der positiven y-Richtung ist die Summe: I = I1 − I2 = Mz b − (Mz + ΔMz )b = −ΔMz b.

Wir können ΔMz als die Ableitung von Mz in der x-Richtung mal der Verschiebung von Block 1 nach Block 2 schreiben, die genau a beträgt: ΔMz =

∂Mz a. ∂x

Der Strom, der zwischen den beiden Blöcken fließt, ist dann I=−

∂Mz ab. ∂x

Um nun den Strom I mit einer mittleren Volumenstromdichte j zu verknüpfen, müssen wir uns klar machen, dass der Strom I in Wirklichkeit über die Trennfläche verteilt ist. Stellen wir uns das ganze Volumen des Materials mit solchen kleinen Blöcken ausgefüllt vor, so kann jedem Block eine solche Trennfläche (senkrecht zur x-Achse) zugeordnet werden.2 Dann sehen wir, dass der Flächeninhalt, der dem Strom I zuzuordnen ist, gerade der Flächeninhalt ab von einer der Frontseiten ist. Wir erhalten das Resultat jy =

∂Mz I =− . ab ∂x

Wir haben zumindest den ersten Anteil der Rotation von M. c a b

Mx + ΔMx

I2 I2

b

2 I1 Mx

I1 1

z

y x

Abb. 7.6: Zwei aufeinandergesetzte Blöcke können ebenfalls zu jy beitragen.

Es muss noch einen zweiten Term in jy geben, der von der Änderung der x-Komponente der Magnetisierung in z-Richtung herrührt. Dieser Beitrag zu j stammt von der Oberfläche zwischen zwei kleinen Blöcken, die aufeinandergesetzt sind, wie es Abbildung 7.6 zeigt. Mithilfe derselben Überlegungen, die wir soeben angestellt haben, können wir zeigen, dass diese 2

Oder, mit anderen Worten, der Strom I in jeder Trennfläche sollte 50:50 auf die anliegenden Blöcke aufgeteilt werden.

146

7 Ferromagnetismus

Trennfläche den Betrag ∂M x /∂z zu jy beiträgt. Das sind die einzigen Trennflächen, die zur yKomponente des Stromes beitragen können; somit erhalten wir für die gesamte Stromdichte in der y-Richtung jy =

∂M x ∂Mz − . ∂z ∂x

Durch Berechnung der Ströme auf den restlichen Seitenflächen des Würfels – oder mithilfe der Überlegung, dass unsere z-Richtung ja völlig willkürlich gewählt ist – können wir schließen, dass die Vektorstromdichte tatsächlich durch die Gleichung gegeben ist j = ∇ × M. Wenn wir uns also dazu entschließen, die magnetische Situation in der Materie durch das mittlere magnetische Moment pro Volumeneinheit M zu beschreiben, so stellen wir fest, dass die atomaren Kreisströme äquivalent zu einer durch (7.7) gegebenen mittleren Stromdichte in der Materie sind. Ist das Material außerdem ein Dielektrikum, so kann es zusätzlich einen Polarisationsstrom jpol = ∂P/∂t geben. Und ist das Material zudem ein Leiter, so liegt auch noch ein Leitungsstrom jcond vor. Den Gesamtstrom können wir schreiben als j = jcond + ∇ × M +

7.2

∂P . ∂t

(7.10)

Das Feld H

Als Nächstes wollen wir den Strom aus (7.10) in die Maxwell-Gleichung einsetzen. Wir erhalten   1 ∂E j ∂E ∂P c2 ∇ × B = = + . jcond + ∇ × M + + �0 ∂t �0 ∂t ∂t Wir können den Term in M auf die linke Seite bringen:     P jcond M ∂ c2 ∇ × B − E + = . + �0 ∂t �0 �0 c2

(7.11)

Wie wir in Kapitel 3 gesagt haben, gibt es viele Leute, die (E + P/�0 ) gern als neues Vektorfeld D/�0 schreiben. In ähnlicher Weise ist es oft bequem, (B − M/�0 c2 ) als ein neues Vektorfeld zu schreiben. Wir beschließen, ein neues Vektorfeld H zu definieren: H = B−

M . �0 c2

(7.12)

Aus Gleichung (7.11) wird dann �0 c2 ∇ × H = jcond +

∂D . ∂t

(7.13)

Das schaut zwar einfach aus, aber die Komplikation verbirgt sich in den Symbolen D und H.

7.2 Das Feld H

147

Wir müssen Sie hier warnen. Viele, die die MKS-Einheiten verwenden, haben sich für eine andere Definition von H entschieden. Wenn wir ihr Feld H� nennen (natürlich nennen sie es H ohne Strich), so ist es definiert durch H� = �0 c2 B − M.

(7.14)

(Außerdem schreiben sie �0 c2 gewöhnlich als eine Zahl 1/μ0 ; dann müssen sie aber eine Konstante mehr im Auge behalten!) Mit dieser Definition sieht Gleichung (7.13) sogar noch einfacher aus: ∇ × H� = jcond +

∂D . ∂t

(7.15)

Aber die Probleme mit dieser Definition von H� sind erstens, dass sie nicht mit der Definition jener Leute übereinstimmt, die nicht das MKS-System verwenden, und zweitens, dass dann H� und B verschiedene Maßeinheiten haben. Wir halten es für praktischer, wenn H dieselbe Maßeinheit wie B hat – und nicht diejenige von M, wie das für H� der Fall ist. Sind Sie aber ein künftiger Ingenieur und beschäftigen sich mit der Konstruktion von Transformatoren, Magneten und dergleichen, so müssen Sie vorsichtig sein. Sie werden viele Bücher finden, die H gemäß der Definition (7.14) und nicht gemäß unserer Definition (7.12) verwenden, und dann wiederum andere Bücher – besonders Handbücher über magnetische Materialien –, die H und B so miteinander verknüpfen, wie wir es getan haben. Sie müssen aufpassen, welche Konvention jeweils verwendet wird. Eine Möglichkeit, das herauszufinden, bieten die Einheiten, die verwendet werden. Denken Sie daran, dass im MKS-System B – und folglich unser H – in der Maßeinheit ein Weber pro Quadratmeter gleich 10 000 Gauß gemessen werden. Im MKS-System hat ein magnetisches Moment (ein Strom mal ein Flächeninhalt) die Einheit ein Ampere-Meter2. Die Magnetisierung M hat dann die Einheit ein Ampere pro Meter. Für H� sind die Einheiten dieselben wie für M. Sie können sehen, dass dies auch mit Gleichung (7.15) übereinstimmt, da ∇ die Dimension einer reziproken Länge hat. Diejenigen, die sich mit Elektromagneten befassen, sind auch gewohnt, die Einheit von H (mit der H� -Definition) „eine Amperewindung pro Meter“ zu nennen – wobei sie an die Drahtwindungen in einer Wicklung denken. Aber eine „Windung“ ist in Wirklichkeit eine dimensionslose Zahl, sodass Sie das nicht verwirren muss. Da unser H gleich H� /�0 c2 ist, wenn Sie das MKS-System verwenden, ist H (in Weber/Meter2 ) gleich 4π × 10−7 mal H� (in Ampere pro Meter). Es ist vielleicht bequemer, sich zu merken, dass H (in Gauß) = 0,0126H� (in Ampere/Meter). Es gibt noch etwas Schreckliches. Viele, die unsere Definition von H verwenden, haben beschlossen, den Einheiten von H und B unterschiedliche Namen zu geben! Obwohl sie dieselbe Dimension haben, nennen sie die Einheit von B ein Gauß und die Einheit von H ein Oersted (nach Gauß und Oersted natürlich). Folglich werden Sie in vielen Büchern Kurven finden, in denen B in Gauß und H in Oersted aufgetragen sind. Es handelt sich eigentlich um dieselbe Einheit – das 10−4 -Fache der MKS-Einheit. Wir haben die Verwirrung bezüglich der magnetischen Einheiten in Tabelle 7.1 zusammengefasst.

148

7 Ferromagnetismus

Tabelle 7.1: Magnetische Einheiten

Einheiten der magnetischen Größen [B] [H] [M] [H � ]

= Weber/Meter2 = 104 Gauß = Weber/Meter2 = 104 Gauß oder 104 Oersted = Ampere/Meter = Ampere/Meter

Bequeme Umrechnungen B(Gauß) = 104 B (Weber/Meter2) H(Gauß) = H (Oersted) = 0,0126 H � (Amp/Meter)

7.3

Die Magnetisierungskurve

Betrachten wir nun einige einfache Situationen, in denen das Magnetfeld konstant ist, oder in denen sich die Felder hinreichend langsam ändern, sodass wir ∂ D/∂t im Vergleich zu jcond vernachlässigen können. Dann gehorchen die Felder den Gleichungen ∇ · B = 0,

(7.16) 2

∇ × H = jcond /�0 c ,

(7.17) 2

H = B − M/�0 c .

(7.18)

Betrachten wir einen Torus (einen Ring) aus Eisen, um den eine Spule aus Kupferdraht gewickelt ist, wie es Abbildung 7.7 (a) zeigt. Durch den Draht fließt ein Strom I. Was ist das magnetische Feld? Das Magnetfeld verläuft zum größten Teil innerhalb des Eisens; dort bilden die Feldlinien von B Kreise, wie in Abbildung 7.7 (b). Da der Fluss von B stetig ist, ist seine (a)

(b) � �

I







� ⊗



� ⊗

Kurve Γ



� ⊗









⊗ ⊗







Feldlinien von B

⊗ �







� �



⊗ ⊗

⊗ �



⊗ �

⊗ �





� �



Abb. 7.7: (a) Ein Torus aus Eisen, um den eine Spule aus isoliertem Draht gewickelt ist. (b) Querschnitt des Torus, in den die Feldlinien eingezeichnet sind.

7.3 Die Magnetisierungskurve

149

Divergenz null und Gleichung (7.16) ist erfüllt. Als Nächstes schreiben wir Gleichung (7.17) in einer anderen Form, indem wir um die in Abbildung 7.7 (b) gezeichnete geschlossene Schleife Γ integrieren. Nach dem stokesschen Satz ist   1 H ·ds = jcond · n da, (7.19) �0 c2 S Γ wobei das Integral von j über eine beliebige, von Γ begrenzte Fläche S gebildet werden muss. Diese Fläche wird von jeder Windung der Wicklung einmal durchschnitten. Jede Windung trägt zum Integral den Strom I bei und bei ingesamt N Windungen ist das Integral NI. Aufgrund der Symmetrie unseres Problems ist B entlang der ganzen Kurve Γ konstant; nehmen wir an, dass die Magnetisierung und infolgedessen auch das Feld H entlang Γ konstant sind, so wird aus Gleichung (7.19) Hl =

NI , �0 c2

wobei l die Länge der Kurve Γ ist. Somit ist H=

1 NI . �0 c2 l

(7.20)

Weil H in Fällen wie diesem direkt proportional zum magnetisierenden Strom ist, nennt man es zuweilen das magnetisierende Feld. Alles, was wir nun noch brauchen, ist eine Gleichung, die H und B miteinander verknüpft. Aber eine solche Gleichung gibt es nicht! Natürlich gibt es da Gleichung (7.18), aber sie hilft uns nichts weiter, denn für ein ferromagnetisches Material wie Eisen gibt es keine direkte Relation zwischen M und B. Die Magnetisierung M hängt von der ganzen zurückliegenden Geschichte des Eisens ab und nicht nur von dem momentanen Wert von B. Aber noch ist nicht alles verloren. In gewissen einfachen Fällen können wir Lösungen finden. Beginnen wir mit nichtmagnetisiertem Eisen – etwa mit Eisen, das bei hohen Temperaturen ausgeglüht wurde –, so hat das gesamte Eisen in der einfachen Geometrie des Torus dieselbe magnetische Geschichte. Anhand von experimentellen Messungen können wir dann etwas über M – und infolgedessen auch über die Relation zwischen B und H – erfahren. Das Feld H im Torus ist gemäß (7.20) durch eine Konstante mal dem Strom I in der Wicklung gegeben. Das Feld B kann gemessen werden, indem man die EMK in der Spule (oder in einer zusätzlichen Spule, die über die in der Abbildung gezeigte magnetisierende Spule gewickelt ist) über die Zeit integriert. Diese EMK ist gleich der Änderungsrate des Flusses von B, sodass das Zeitintegral der EMK gleich B mal dem Flächeninhalt des Querschnitts des Torus ist. Abbildung 7.8 zeigt die Relation zwischen B und H, die an einem Torus aus weichem Eisen beobachtet wurde. Wenn der Strom zum ersten Mal eingeschaltet wird, nimmt B mit H entlang der Kurve a zu. Beachten Sie die verschiedenen Maßstäbe von B und H; anfangs genügt ein relativ kleines H, um ein großes B zu erhalten. Warum ist B in Eisen so viel größer als es in der Luft wäre? Weil eine starke Magnetisierung M vorliegt, die äquivalent zu einem großen Oberflächenstrom im Eisen ist – das Feld B leitet sich aus der Summe dieses Stroms und des Leitungsstroms in der Wicklung her. Warum M so groß ist, werden wir später untersuchen.

150

7 Ferromagnetismus B (Gauß)

b

15 000 10 000

a

5 000

c 1

−4 −3 −2 −1

c

2

3

4

5

H (A/m)

−10 000 −15 000

Abb. 7.8: Typische Magnetisierungs- und Hysteresekurven für weiches Eisen.

Bei höheren Werten von H wird die Magnetisierungskurve flacher. Wir sagen, dass das Eisen gesättigt wird. Im Maßstab der Abbildung scheint die Kurve horizontal zu werden, doch tatsächlich steigt sie weiter leicht an. Für große Felder wird B proportional zu H und hat den Anstieg eins. Es gibt kein weiteres Anwachsen von M. Nebenbei sollten wir darauf hinweisen, dass für einen Torus aus nichtmagnetischem Material M null und B für alle Felder gleich H ist. Als Erstes bemerken wir, dass die Kurve a in Abbildung 7.8 – das ist die so genannte Magnetisierungskurve – stark nichtlinear ist. Aber es kommt noch schlimmer. Wenn wir, nachdem die Sättigung erreicht wurde, den Strom in der Spule vermindern, bis H wieder null ist, so fällt das Magnetfeld B entlang der Kurve b ab. Erreicht H den Nullpunkt, so bleibt noch etwas von B übrig. Auch ohne magnetisierenden Strom gibt es im Eisen ein Magnetfeld – es ist permanent magnetisiert worden. Schalten wir nun einen negativen Strom in der Spule ein, so verläuft die B-H-Kurve weiterhin entlang b, bis das Eisen in der negativen Richtung gesättigt ist. Schalten wir dann den positiven Strom wieder an, so verläuft B entlang der Kurve c. Lassen wir den Strom zwischen großen positiven und negativen Werten wechseln, so läuft die B-HKurve ganz in der Nähe der Kurven b und c hin und her. Ändern wir jedoch H in willkürlicher Weise, so können wir kompliziertere Kurven erhalten, die im Allgemeinen irgendwo zwischen den Kurven b und c verlaufen. Die Schleife, die durch wiederholtes Schwingen der Felder beschrieben wird, nennt man eine Hystereseschleife des Eisens. Wir sehen, dass wir keine funktionale Relation wie B = f (H) anschreiben können, weil der Wert von B in jedem Augenblick nicht nur davon abhängt, wie groß H zu diesem Zeitpunkt ist, sondern von der ganzen zurückliegenden Geschichte. Natürlich verlaufen die Magnetisierungsund Hysteresekurven für verschiedene Substanzen unterschiedlich. Die Form der Kurven hängt in kritischer Weise von der chemischen Zusammensetzung des Materials ab und zudem auch von den Einzelheiten seiner Vorbereitung und seiner darauffolgenden physikalischen Behandlung. Einige physikalische Erklärungen für diese Komplikationen werden wir im nächsten Kapitel geben.

7.4 Induktivitäten mit Eisenkern

7.4

151

Induktivitäten mit Eisenkern

Eines der wichtigsten Anwendungsgebiete von magnetischen Materialien sind die elektrischen Schaltkreise – zum Beispiel in Transformatoren, elektrischen Motoren, usw. Ein Grund dafür besteht in der Tatsache, dass wir mit Eisen festlegen können, wie die Magnetfelder verlaufen, und bei vorgegebenem elektrischen Strom auch stärkere Felder erhalten. Zum Beispiel ist eine typische „toroidale“ Induktivität in sehr ähnlicher Weise wie das in Abbildung 7.7 gezeigte Objekt aufgebaut. Für eine gewünschte Induktivität genügt ein sehr viel kleineres Volumen und der Kupferverbrauch ist weit geringer als für eine äquivalente Induktivität mit „Luftkern“. Für eine gewünschte Induktivität wird auch der Widerstand in der Wicklung viel kleiner, sodass die Induktivität dem „Ideal“ näherkommt – insbesondere für niedrige Frequenzen. Es ist qualitativ sehr leicht zu verstehen, wie eine solche Induktivität wirkt. Ist I der Strom in der Wicklung, dann ist das im Innern erzeugte Feld H proportional zu I – wie man anhand von (7.20) sieht. Die Spannung V an den Anschlüssen ist mit dem Magnetfeld B verknüpft. Vernachlässigen wir den Widerstand der Wicklung, so ist die Spannung V proportional zu ∂B/∂t. Die Induktivität L, die das Verhältnis von V zu dI/dt ist (siehe Band III, Abschnitt 17.7), hängt daher von der Relation zwischen B und H im Eisen ab. Da B so viel größer als H ist, erhalten wir für die Induktivität einen großen Faktor. Physikalisch geschieht das Folgende: ein kleiner Strom in der Spule, der normalerweise nur ein kleines Magnetfeld hervorrufen würde, zwingt die kleinen „Sklaven“-Magneten im Eisen, sich auszurichten und einen „magnetischen“ Strom zu erzeugen, der erheblich größer als der äußere Strom in der Wicklung ist. Es sieht so aus, als ob sehr viel mehr Strom durch die Spule fließen würde, als das in Wirklichkeit der Fall ist. Kehren wir den Strom um, so kippen all die kleinen Magnete um – alle inneren Ströme fließen entgegengesetzt – und wir erhalten eine sehr viel größere induzierte EMK als ohne das Eisen. Wollen wir die Induktivität berechnen, so können wir das mihilfe der Energie tun – wie in Band III, Abschnitt 17.8 beschrieben. Die Rate, mit der Energie aus der Stromquelle geliefert wird, beträgt IV. Die Spannung V ist der Flächeninhalt A des Kernquerschnitts, mal N, mal dB/dt. Nach Gleichung (7.20) ist I = (�0 c2 l/N)H. Somit ist dU dB = V I = (�0 c2 lA)H . dt dt Durch Integration über die Zeit erhalten wir  2 U = (�0 c lA) H dB.

(7.21)

Beachten Sie, dass lA das Volumen des Torus ist; folglich haben wir gezeigt, dass die Energiedichte u = U/lA in einem magnetischen Material gegeben ist durch  (7.22) u = �0 c2 H dB. Hier taucht ein interessanter Aspekt auf. Verwenden wir Wechselströme, so durchläuft das Eisen  eine Hystereseschleife. Da B keine eindeutige Funktion von H ist, ist das Integral von H dB bei einem vollständigen Umlauf nicht gleich null. Es ist vielmehr gleich dem von der Hysteresekurve eingeschlossenen Flächeninhalt. Somit gibt die treibende Quelle bei jedem Umlauf eine gewisse Gesamtenergie ab – eine Energie proportional zum Flächeninhalt im Innern der Hystereseschleife. Und diese Energie geht „verloren“. Sie geht aus den elektromagnetischen

152

7 Ferromagnetismus

Vorgängen verloren und taucht als Wärme im Eisen wieder auf. Man nennt das den Hystereseverlust. Um solche Energieverluste klein zu halten, muss die Hystereseschleife so schmal wie möglich sein. Eine Möglichkeit, den Flächeninhalt der Schleife zu verringern, besteht darin, dass man das bei jedem Umlauf erreichte maximale Feld verkleinert. Für kleinere maximale Felder erhalten wir eine Hysteresekurve wie die in Abbildung 7.9 gezeigte. Man hat auch spezielle Materialien entwickelt, um eine sehr enge Schleife zu erzielen. Die so genannten Transformatoreisen – wobei es sich um Eisenlegierungen mit einer kleinen Menge an Silizium handelt – sind im Hinblick auf diese Eigenschaft entwickelt worden. B (Gauß)

10 000

1

−4 −3 −2 −1

2

3

4

H (A/m)

Abb. 7.9: Eine Hystereseschleife, die keine Sättigung erreicht.

Wird eine Induktivität über eine enge Hystereseschleife betrieben, so kann die Relation zwischen B und H durch eine lineare Gleichung angenähert werden. Man schreibt gewöhnlich B = μH.

(7.23)

Die Konstante μ ist nicht das magnetische Moment, das wir zuvor verwendet haben. Sie heißt die Permeabilität des Eisens. (Man nennt sie zuweilen auch die „relative Permeabilität“.) Die Permeabilität von gewöhnlichem Eisen ist eine Zahl in der Größenordnung tausend. Es gibt spezielle Legierungen wie „Supermalloy“, die Permeabilitäten von einer Million haben können. Verwenden wir in (7.21) die Näherung B = μH, so können wir die Energie in einer ringförmigen Induktivität schreiben als    μH 2 2 U = (�0 c lA)μ H dH = �0 c2 lA . (7.24) 2 Die Energiedichte ist dann näherungsweise u≈

�0 c2 2 μH . 2

7.5 Elektromagnete

153

Wir können nun die Energie U aus (7.24) gleich der Energie LI 2 /2 einer Induktivität setzen und nach L auflösen. Wir erhalten   H 2  . L = �0 c2 lA μ I

Unter Verwendung von H/I aus (7.20) erhalten wir L=

μN 2 A . �0 c2 l

(7.25)

Die Induktivität ist proportional zu μ. Brauchen Sie Induktivitäten für Apparate wie Radioverstärker, so werden Sie versuchen, sie auf einer Hystereseschleife zu betreiben, auf der die B-H-Relation so linear wie möglich ist. (Sie werden sich daran erinnern, dass wir in Band II, Kapitel 25 über die Erzeugung von Oberwellen in nichtlinearen Systemen gesprochen haben.) Für solche Zwecke ist (7.23) eine nützliche Näherung. Wollen Sie andererseits Oberwellen erzeugen, so können Sie eine Induktivität verwenden, die absichtlich äußerst nichtlinear betrieben wird. Dann müssen Sie die vollständigen B-H-Kurven verwenden und die Vorgänge mithilfe von graphischen oder numerischen Methoden analysieren. Ein „Transformator“ wird oft so gebaut, dass man zwei Spulen auf denselben Torus – oder Kern – eines magnetischen Materials bringt. (Für größere Transformatoren gibt man dem Kern der Bequemlichkeit halber einen rechteckigen Querschnitt.) Ein veränderlicher Strom in der „Primär“-Wicklung bewirkt dann eine Änderung des Magnetfeldes im Kern, wodurch eine EMK in der „Sekundär“-Wicklung induziert wird. Da der Fluss durch jede Windung der beiden Wicklungen gleich ist, stehen die EMKs in den beiden Wicklungen in demselben Verhältnis wie die Zahl der entsprechenden Windungen. Eine an die Primärwicklung angelegte Spannung wird in eine andere Spannung an der Sekundärwicklung transformiert. Da ein gewisser Gesamtstrom um den Kern notwendig ist, um die erforderliche Änderung des Magnetfeldes zu erzeugen, ist die algebraische Summe der Ströme in den beiden Wicklungen festgelegt und gleich dem erforderlichen „magnetisierenden“ Strom. Nimmt der Strom, der der Sekundärwicklung entnommen wird, zu, so muss auch der primäre Strom proportional zunehmen – es kommt sowohl zu einer „Transformation“ der Spannungen als auch zu einer solchen der Ströme.

7.5

Elektromagnete

Untersuchen wir nun eine reale Situation, die etwas komplizierter ist. Betrachten wir einen Elektromagneten der üblichen Form wie in Abbildung 7.10 – er besteht aus einem „C-förmigen“ Joch aus Eisen und einer Spule aus vielen Drahtwindungen, die um das Joch gewickelt ist. Was ist das Magnetfeld B in dem Zwischenraum? Ist die Breite des Zwischenraums klein im Vergleich zu allen anderen Abmessungen, so können wir in erster Näherung annehmen, dass die Feldlinien von B in dem Magneten umlaufen, genauso wie sie es im Torus tun. Sie sehen mehr oder weniger wie in Abbildung 7.11 (a) aus. Sie haben zwar die Tendenz, in dem Zwischenraum etwas auseinanderzurücken, doch wenn der Zwischenraum eng genug ist, ist das ein kleiner Effekt. Es ist eine angemessene Näherung anzunehmen, dass der Fluss von B durch jeden Querschnitt des Jochs konstant ist. Wenn das Joch eine homogene Querschnittsfläche hat – und wenn wir alle Randeffekte an den Kanten

154

7 Ferromagnetismus

I

Abb. 7.10: Ein Elektromagnet.

und Ecken des Zwischenraums vernachlässigen – so können wir sagen, dass B über das Joch hinweg homogen ist. Insbesondere wird B im Zwischenraum denselben Wert haben. Dies folgt aus Gleichung (7.16). Stellen wir uns die in Abbildung 7.11 (b) gezeigte geschlossene Fläche S vor, deren eine Seite im Zwischenraum und deren andere im Eisen liegt. Der gesamte durch diese Fläche hindurchtretende Fluss von B muss null sein. Bezeichnen wir mit B1 das Feld im Zwischenraum und mit B2 das Feld im Eisen, so erhalten wir B1 A1 − B2 A2 = 0. Da A1 = A2 (in unserer Näherung), folgt, dass B1 = B2 . Betrachten wir nun H. Wir können wiederum (7.19) verwenden, wobei wir das Linienintegral um die Kurve Γ in Abbildung 7.11 (b) bilden. Wie zuvor ist das Integral auf der rechten Seite NI, die Zahl der Windungen mal dem Strom. Jedoch ist H im Eisen und in der Luft verschieden. Bezeichnen wir mit H2 das Feld im Eisen und mit l2 die Weglänge im Joch, so liefert dieser Teil der Kurve den Beitrag H2 l2 zum Integral. Bezeichnen wir mit H1 das Feld im Zwischenraum und mit l1 die Breite des Zwischenraums, so erhalten wir von diesem den Beitrag H1 l1 . Es ist B1 , H1

B2 , H2

Kurve Γ

�1

� NI



�2

⊗ NI



Eisen Kupfer

(a)

Strom

Abb. 7.11: Querschnitt eines Elektromagneten.

(b)

Fläche S

7.5 Elektromagnete

155

dann H1 l1 + H2 l2 =

NI . �0 c2

(7.26)

Nun wissen wir aber noch etwas: In dem Luftzwischenraum ist die Magnetisierung vernachlässigbar, sodass B1 = H1 . Da B1 = B2 , wird Gleichung (7.26) zu B2 l1 + H2 l2 =

NI . �0 c2

(7.27)

Wir haben immer noch zwei Unbekannte. Um B2 und H2 zu ermitteln, benötigen wir eine weitere Beziehung – nämlich jene, die B und H im Eisen miteinander verknüpft. Ist die Näherung B2 = μH2 gerechtfertigt, so können wir die Gleichung algebraisch lösen. Nehmen wir uns jedoch den allgemeinen Fall vor, in dem die Magnetisierungskurve des Eisens wie die in Abbildung 7.8 gezeigte ist. Wir suchen die gleichzeitige Lösung dieser Funktionalbeziehung und von Gleichung (7.27). Wir können sie finden, indem wir (7.27) in die graphische Darstellung der Magnetisierungskurve eintragen, wie das in Abbildung 7.12 geschehen ist. Wo die beiden Kurven einander schneiden, liegt unsere Lösung. I>0

B

I=0

b a d

c

Gl. (36.27)

NI �0 c2 �2

H

Abb. 7.12: Bestimmung des Feldes in einem Elektromagneten.

Für einen vorgegebenen Strom I ist die Funktion (7.27) die gerade Linie, die in Abbildung 7.12 mit I > 0 bezeichnet ist. Die Linie schneidet die H-Achse (B2 = 0) in H2 = NI/�0 c2 l2 , und die Steigung ist −l2 /l1 . Andere Ströme verschieben die Linie horizontal. Aus Abbildung 7.12 sehen wir, dass es zu einem gegebenen Strom mehrere Lösungen gibt, je nachdem, wie die Situation entstanden ist. Haben Sie einfach den Magneten gefertigt und den Strom bis zur Stärke I aufgedreht, so hat das Feld B2 (das auch B1 ist) den Wert, der durch Punkt a gegeben ist. Haben Sie den Strom zuvor auf einen sehr hohen Wert gebracht und sind dann zu I zurückgekommen, so ist das Feld durch Punkt b gegeben. Ließen Sie jedoch erst einen starken negativen Strom

156

7 Ferromagnetismus

durch den Magneten fließen und haben ihn dann auf I anwachsen lassen, so ist das Feld das im Punkt c. Das Feld im Zwischenraum des Jochs hängt davon ab, was Sie vorher getan haben. Ist der Strom im Magneten null, so ist die in (7.27) formulierte Relation zwischen B2 und H2 durch die in der Abbildung mit I = 0 markierte Linie dargestellt. Es gibt immer noch mehrere Lösungen. Haben Sie das Eisen zunächst gesättigt, so kann es im Magneten ein beträchtliches remanentes Feld geben, das Punkt d anzeigt. Sie können die Spule entfernen, und Sie haben einen permanenten Magneten. Sie sehen, dass man für einen guten permanenten Magneten ein Material mit einer breiten Hystereseschleife braucht. Spezielle Legierungen, wie Alnico V, haben sehr breite Hystereseschleifen.

7.6

Spontane Magnetisierung

Wir kommen nun zu der Frage: Warum erzeugt ein kleines Magnetfeld in ferromagnetischen Materialien eine so große Magnetisierung? Die Magnetisierung von ferromagnetischen Materialien wie Eisen und Nickel beruht auf dem magnetischen Moment der Elektronen in der inneren Schale des Atoms. Jedes Elektron hat ein magnetisches Moment μ, das gleich q/2m mal seinem g-Faktor mal seinem Drehmoment J ist. Für ein einzelnes Elektron ohne Bahnbewegung ist g = 2, und die Komponente von J in einer beliebigen Richtung – etwa in der z-Richtung – ist ±/2; somit ist die Komponente von μ in Richtung der z-Achse μz =

q = 0,928 × 10−23 A · m2 . 2m

(7.28)

In einem Eisenatom gibt es zwei Elektronen, die zum Ferromagnetismus beitragen; um aber die Diskussion einfach zu halten, sprechen wir lieber über Nickel, das wie Eisen ferromagnetisch ist, aber nur ein Elektron in der inneren Schale besitzt. (Es ist einfach, die Überlegungen dann auf Eisen zu übertragen.) Die atomaren Magnete haben in Anwesenheit eines äußeren elektrischen Feldes B die Tendenz, sich in Richtung des Feldes auszurichten, werden aber durch Wärmebewegung herumgestoßen, genau so wie wir es für die paramagnetischen Materialien beschrieben haben. Im vorigen Kapitel haben wir festgestellt, dass das Gleichgewicht zwischen einem Magnetfeld, das versucht, die atomaren Magnete auszurichten, und den Wärmebewegungen, die versuchen, sie durcheinanderzubringen, zu dem Resultat führt, dass sich das mittlere magnetische Moment pro Volumeneinheit schließlich herausstellt als M = Nμ tanh

μBa . kT

(7.29)

Mit Ba bezeichnen wir das auf das Atom wirkende Feld und kT ist die Boltzmann-Energie. In der Theorie des Paramagnetismus verwendeten wir für Ba einfach B, wobei wir für jedes Atom den Anteil des Feldes vernachlässigten, der von den Atomen in der Nähe beigetragen wird. Im ferromagnetischen Fall tritt eine Komplikation auf. Wir dürfen das mittlere Feld im Eisen nicht für Ba verwenden, das auf ein einzelnes Atom wirkt. Stattdessen müssen wir hier dasselbe wie im Fall der Dielektrika tun – wir müssen das lokale Feld ermitteln, das auf ein einzelnes Atom wirkt. Für eine genaue Berechnung müssen wir am Ort des betreffenden Atoms alle Felder addieren, die von allen anderen Atomen im Kristallgitter beigetragen werden. Aber wie bei den

7.6 Spontane Magnetisierung

157

Dielektrika machen wir auch hier die Näherung, dass das Feld am Ort des Atoms dasselbe wie das in einem kleinen kugelförmigen Hohlraum in dem Material ist – wobei wir annehmen, dass die Momente der Atome in der Nachbarschaft durch die Anwesenheit des Hohlraums nicht verändert werden. Wenn wir den Überlegungen aus Kapitel 11 in Band III folgen, könnten wir glauben, dass es möglich ist zu schreiben BHohlraum = B +

1 M 3 �0 c2

(falsch!).

Aber das ist nicht richtig. Wir können jedoch die Resultate von Kapitel 11 in Band III verwenden, wenn wir einen sorgfältigen Vergleich zwischen den dort angegebenen Gleichungen und denen für den Ferromagnetismus in diesem Kapitel anstellen. Stellen wir die entsprechenden Gleichungen einander gegenüber. Für Bereiche, in denen keine Leitungsströme oder bewegte Ladungen auftreten, gilt: Elektrostatik   P ∇· E+ =0 �0

Statischer Ferromagnetismus ∇· B=0   M ∇× B− =0 �0 c2

∇× E=0

(7.30)

Diese beiden Gleichungssysteme können als analog betrachtet werden, wenn wir die folgenden rein mathematischen Entsprechungen herstellen E→ B−

M , �0 c2

E+

P → B. �0

Das ist dasselbe, wie wenn wir die Analogie aufstellen E → H,

P → M/c2 .

(7.31)

Mit anderen Worten: Schreiben wir die Gleichungen des Ferromagnetismus in der Form   M = 0, ∇· H+ �0 c2 (7.32) ∇ × H = 0, so sehen sie wie die Gleichungen der Elektrostatik aus. Diese rein algebraische Entsprechung hat in der Vergangenheit zu einiger Verwirrung geführt. Man war geneigt zu glauben, dass H „das magnetische Feld“ ist. Aber wie wir gesehen haben, sind B und E die physikalisch fundamentalen Felder und H ist ein abgeleiteter Begriff. Folglich sind zwar die Gleichungen analog, aber die Physik ist es nicht. Aber das muss uns nicht davon abhalten, das Prinzip zu verwenden, nach dem dieselben Gleichungen dieselben Lösungen haben. Wir können unsere früheren Ergebnisse für das elektrische Feld im Innern von Hohlräumen verschiedener Form in Dielektrika verwenden – sie sind in Abbildung 7.1 zusammengefasst

158

7 Ferromagnetismus

–, um das Feld H im Innern von entsprechenden Hohlräumen zu finden. Wenn wir H kennen, können wir B bestimmen. Zum Beispiel ist (unter Verwendung der in Abschnitt 7.1 zusammengefassten Resultate) das Feld H in einem nadelförmigen Hohlraum parallel zu M dasselbe wie das H in dem Material: HHohlraum = HMaterial . Da aber M im Hohlraum null ist, erhalten wir BHohlarum = BMaterial −

M . �0 c2

(7.33)

Andererseits gilt für einen scheibenförmigen Hohlraum senkrecht zu M EHohlraum = EDielektrikum +

P , �0

was sich übersetzt in HHohlraum = HMaterial +

M . �0 c2

Oder in Ausdrücken von B BHohlraum = BMaterial .

(7.34)

Schließlich erhalten wir für einen kugelförmigen Hohlraum, indem wir die Analogie zu (7.3) herstellen, HHohlraum = HMaterial +

M 3�0 c2

BHohlraum = BMaterial −

2 M . 3 �0 c2

oder (7.35)

Dieses Resultat unterscheidet sich beträchtlich von dem, das wir für E erhalten haben. Es ist natürlich möglich, diese Resultate auf physikalische Weise durch direkte Anwendung der Maxwell-Gleichungen zu erhalten. Zum Beispiel folgt (7.34) direkt aus ∇ · B = 0. (Sie verwenden eine gaußsche Fläche, die halb im Material und halb außen liegt.) Auf ähnliche Weise können Sie (7.33) erhalten, wenn Sie ein Linienintegral entlang einer Kurve verwenden, die im Innern des Holraums nach oben verläuft und durch das Material zurückkehrt. Physikalisch gesehen wird das Feld im Hohlraum aufgrund der Oberflächenströme reduziert, die durch ∇ × M gegeben sind. Wir überlassen es Ihnen zu zeigen, dass man (7.35) auch erhält, indem man die Effekte der Oberflächenströme auf dem Rand des kugelförmigen Hohlraums betrachtet. Beim Auffinden der Gleichgewichtsmagnetisierung (7.29) stellt sich heraus, dass es bequemer ist, mit H zu arbeiten; wir schreiben daher Ba = H + λ

M . �0 c2

(7.36)

7.6 Spontane Magnetisierung

159

M/MSätt 1,0

0,5

Lösung Gleichung (36.37) a

b Gleichung (36.38)

0 0

0,5 μH

1,0

kT

1,5

x

Abb. 7.13: Graphische Lösung der Gleichungen (7.37) und (7.38).

In der Näherung des kugelförmigen Hohlraums gilt λ = 13 , aber, wie Sie sehen werden, ziehen wir später einen anderen Wert vor und behalten daher λ als adjustierbaren Parameter bei. Außerdem nehmen wir alle Felder in derselben Richtung an, sodass wir uns nicht um die Vektorrichtungen kümmern müssen. Würden wir nun Gleichung (7.36) in (7.29) einsetzen, so hätten wir eine Gleichung, die die Magnetisierung M mit dem magnetisierenden Feld H in Beziehung setzt:   H + λM/�0 c2 M = Nμ tanh μ . kT Es handelt sich jedoch um eine Gleichung, die nicht explizit gelöst werden kann; folglich werden wir die Lösung auf graphischem Wege ermitteln. Stellen wir das Problem in einer allgemeinen Form dar und schreiben dazu (7.29) als M = tanh x, MSätt

(7.37)

wobei MSätt der Sättigungswert der Magnetisierung, nämlich Nμ ist und x den Faktor μBa /kT darstellt. Die Abhängigkeit von M/MSätt von x ist durch Kurve a in Abbildung 7.13 gezeigt. Wir können auch x als Funktion von M schreiben – mithilfe von Formel (7.36) für Ba –:   μBa μH μλMSätt M = + x= . (7.38) kT kT �0 c2 kT MSätt Für jeden gegebenen Wert von H ist dies eine lineare Beziehung zwischen M/MSätt und x. Der Schnittpunkt mit der x-Achse liegt in x = μH/kT und die Steigung ist �0 c2 kT/μλMSätt . Für jedes spezielle H erhalten wir eine Linie wie die mit b bezeichnete Linie in Abbildung 7.13. Der Schnittpunkt der Kurven a und b gibt uns die Lösung für M/MSätt . Wir haben das Problem gelöst. Schauen wir uns an, wie die Lösungen unter verschiedenen Umständen aussehen. Wir beginnen mit H = 0. Zwei mögliche Situationen sind durch die Linien b1 und b2 in Abbildung 7.14 angezeigt. Anhand von (7.38) stellen Sie fest, dass die Steigung der Linie proportional zur absoluten Temperatur T ist. Somit erhalten wir für hohe Temperaturen eine Linie wie b1 . Die Lösung ist M/MSätt = 0. Ist das Magnetisierungsfeld H null, so ist auch die Magnetisierung

160

7 Ferromagnetismus

null. Bei niedrigen Temperaturen erhalten wir eine Linie wie b2 und es gibt zwei Lösungen für M/MSätt – eine mit M/MSätt = 0 und eine mit M/MSätt nahe eins. Es stellt sich heraus, dass nur die zweite Lösung stabil ist – wie Sie sehen können, wenn Sie kleine Abweichungen von diesen Lösungen betrachten. M/MSätt

Tc

T hoch

T niedrig

1,0

b1

b3

a

b2

0,5

0 0

0,5

1,0

1,5

x

Abb. 7.14: Auffinden der Magnetisierung für H = 0.

Aufgrund dieser Erkenntnis muss sich ein magnetisches Material bei hinreichend niedrigen Temperaturen spontan selbst magnetisieren. Kurz gesagt: Sind die Wärmebewegungen klein genug, so werden die atomaren Magnete durch die Kopplung zwischen ihnen gezwungen, sich parallel zueinander auszurichten – wir erhalten ein permanent magnetisiertes Material analog zu den Ferroelektrika, die wir in Band III, Kapitel 11 besprochen haben. Beginnen wir bei hoher Temperatur und verringern sie dann, so gibt es eine kritische Temperatur, die so genannte Curie-Temperatur T c , bei der das ferromagnetische Verhalten plötzlich einsetzt. Diese Temperatur entspricht der Linie b3 in Abbildung 7.14, die tangential zur Kurve a verläuft und infolgedessen die Steigung 1 hat. Die Curie-Temperatur ist gegeben durch �0 c2 kT c = 1. μλMSätt Wenn wir wollen, können wir (7.38) unter Verwendung von T c einfacher schreiben:   μH T c M + x= . kT T MSätt

(7.39)

(7.40)

Nun wollen wir sehen, was bei schwachen magnetisierenden Feldern H passiert. Was vor sich geht, können wir anhand von Abbildung 7.14 sehen, wenn wir unsere gerade Linie etwas nach rechts verschieben. Im Fall von niedrigen Temperaturen verschiebt sich der Schnittpunkt etwas entlang des fallenden Teils der Kurve a und M ändert sich verhältnismäßig wenig. Im Fall von hohen Temperaturen rutscht aber der Schnittpunkt den steilen Teil der Kurve a hinauf und M ändert sich verhältnismäßig schnell. Wir können diesen Teil der Kurve a durch eine gerade Linie mit der Steigung eins annähern und schreiben   M μH T c M + . =x= MSätt kT T MSätt Nun können wir die Gleichung für M/MSätt lösen: μH M . = MSätt k(T − T c )

(7.41)

7.6 Spontane Magnetisierung

161

Wir haben ein Gesetz gefunden, das in etwa dem für den Paramagnetismus ähnlich ist. Für den Paramagnetismus hatten wir M μB . = MSätt kT

(7.42)

Ein Unterschied besteht darin, dass die Magnetisierung nun durch H ausgedrückt wird, was einige Effekte der Wechselwirkung der atomaren Magnete einschließt, aber der Hauptunterschied besteht in der Tatsache, dass die Magnetisierung umgekehrt proportional zur Differenz zwischen T und T c ist und nicht allein proportional zur absoluten Temperatur T . Vernachlässigen wir die Wechselwirkungen zwischen Nachbaratomen, so entspricht das der Wahl λ = 0, was laut (7.39) T c = 0 entspricht. Die Resultate sind dann dieselben, die wir in Kapitel 6 gefunden haben. Wir können unsere theoretischen Ergebnisse anhand der experimentellen Daten für Nickel überprüfen. Es ist experimentell beobachtet worden, dass das ferromagnetische Verhalten von Nickel verschwindet, wenn seine Temperatur 631 K übersteigt. Wir können das mit T c vergleichen, das wir aus (7.39) erhalten. Erinnern wir uns daran, dass MSätt = μN, so ist Tc = λ

Nμ2 . k�0 c2

Mit der Dichte und dem Atomgewicht von Nickel erhalten wir N = 9,1 × 1028 m−3 . Wir verwenden μ aus (7.28) und setzen λ = 13 ; dann ist T c = 0,24 K . Das ist eine Diskrepanz von einem Faktor von ungefähr 2600! Unsere Theorie des Ferromagnetismus versagt vollkommen. Wir können versuchen, die Theorie zu „reparieren“, wie Weiss das tat, indem wir annehmen, dass λ aus einem unbekannten Grund nicht ein Drittel, sondern (2600) × 13 oder ungefähr 900 ist. Es zeigt sich, dass man ähnliche Werte für andere ferromagnetische Materialien wie Eisen erhält. Um zu verstehen, was das bedeutet, gehen wir zurück zu Gleichung (7.36). Wir sehen, dass ein großes λ bedeutet, dass Ba , das auf das Atom wirkende lokale Feld, offenbar viel, viel größer ist, als wir es erwartet haben. Schreiben wir H = B − M/�0 c2 , so erhalten wir tatsächlich Ba = B +

(λ − 1)M . �0 c2

Gemäß unserer ursprünglichen Idee – mit λ = 13 – reduziert die lokale Magnetisierung M das effektive Feld Ba um den Betrag − 32 M/�0 c2 . Selbst wenn unser Modell eines kugelförmigen Hohlraums nicht sehr gut wäre, würden wir immer noch eine gewisse Reduktion erwarten. Zur Erklärung des ferromagnetischen Phänomens müssen wir uns stattdessen vorstellen, dass die Magnetisierung das lokale Feld um einen großen Faktor – wie eintausend oder mehr – vergrößert. Es scheint keinen vernünftigen Weg zu geben, auf dem man so ungeheuere auf ein Atom wirkende Felder erzeugen kann – nicht einmal Felder mit dem richtigen Vorzeichen! Es ist klar, dass unsere „magnetische“ Theorie des Ferromagnetismus ein trauriges Fiasko ist.

162

7 Ferromagnetismus

Wir müssen daraus schließen, dass der Ferromagnetismus etwas mit einer nichtmagnetischen Wechselwirkung zwischen den rotierenden Elektronen in Nachbaratomen zu tun hat. Diese Wechselwirkung muss bei allen benachbarten Spins die starke Tendenz hervorrufen, sich in derselben Richtung auszurichten. Wir werden später sehen, dass das mit der Quantenmechanik und mit dem Pauli-Prinzip zusammenhängt. Schauen wir zum Schluss, was bei niedrigen Temperaturen passiert – bei T < T c . Wir haben gesehen, dass dann eine spontane Magnetisierung eintritt – sogar bei H = 0 –, die durch den Schnittpunkt der Kurven a und b2 von Abbildung 7.14 gegeben ist. Ermitteln wir M für verschiedene Temperaturen – indem wir die Steigung der Linie b2 ändern – so erhalten wir die theoretische Kurve, die in Abbildung 7.15 gezeigt ist. Diese Kurve muss für alle ferromagnetischen Materialien gleich sein, bei denen das magnetische Moment auf ein einzelnes Elektron zurückzuführen ist. Die Kurven für andere Materialien unterscheiden sich davon nur geringfügig. Nähert sich T dem absoluten Nullpunkt, so strebt M nach MSätt . Wenn die Temperatur zunimmt, nimmt die Magnetisierung ab und fällt bei der Curie-Temperatur auf null ab. Die Punkte in Abbildung 7.15 sind die experimentellen Werte für Nickel. Sie passen sich der theoretischen Kurve einigermaßen gut an. Obwohl wir den grundlegenden Mechanismus nicht verstehen, scheinen die allgemeinen Züge der Theorie dennoch richtig zu sein. M/MSätt

1,0

Experiment Theorie

0,5

0

0,5

T/T c

1,0

Abb. 7.15: Spontane Magnetisierung als Funktion der Temperatur für Nickel.

Schließlich gibt es noch eine weitere störende Diskrepanz bei unserem Versuch, den Ferromagnetismus zu verstehen. Wir haben gesagt, dass sich das Material oberhalb einer bestimmten Temperatur wie eine paramagnetische Substanz verhalten sollte, deren Magnetisierung proportional zu H (oder B) ist, und dass es unterhalb einer bestimmten Temperatur spontan magnetisiert werden sollte. Aber das ist nicht das, was wir gefunden haben, als wir die Magnetisierungskurve für Eisen gemessen haben. Es wurde erst permanent magnetisiert, nachdem wir es „magnetisiert“ hatten. Nach den soeben entwickelten Konzepten würde es sich selbst magnetisieren! Was stimmt da nicht? Es stellt sich heraus, dass ein hinreichend kleiner Kristall aus Eisen oder Nickel tatsächlich vollkommen magnetisiert ist! Doch in großen Eisenstücken gibt es viele kleine Regionen oder „Bezirke“, die jeweils in verschiedenen Richtungen magnetisiert sind, sodass in großem Maßstab die mittlere Magnetisierung null ist. In jedem kleinen Bereich hat das Eisen jedoch eine lokale Magnetisierung, bei der M fast gleich MSätt ist. Als

7.6 Spontane Magnetisierung

163

Konsequenz dieser Bezirksstruktur sind die globalen Eigenschaften von großen Stücken eines Materials sehr verschieden von den mikroskopischen Eigenschaften, die wir in unserer Theorie behandelt haben. Im nächsten Kapitel werden wir uns mit dem Thema des tatsächlichen Verhaltens von massiven magnetischen Materialien beschäftigen.

8

Magnetische Materialien1

8.1

Den Ferromagnetismus verstehen

In diesem Kapitel wollen wir das Verhalten und die Eigenheiten von ferromagnetischen und anderen ungewöhnlichen magnetischen Materialien besprechen. Ehe wir aber mit der Untersuchung der magnetischen Materialien beginnen, wollen wir kurz einiges wiederholen, was wir im letzten Kapitel über die allgemeine Theorie der Magnete gelernt haben. Zuerst stellen wir uns im Innern des Materials atomare Ströme vor, die für den Magnetismus verantwortlich sind, und anschließend beschreiben wir sie durch eine Volumenstromdichte jmag = ∇ × M. Wir betonen, dass diese nicht die wirklichen Ströme darstellen soll. Wenn die Magnetisierung homogen ist, kompensieren sich die Ströme in Wirklichkeit nicht ganz; das heißt, der Kreisstrom eines Elektrons in einem Atom und derjenige eines Elektrons in einem anderen Atom überlappen sich nicht so, dass die Summe genau null ist. Selbst in einem einzelnen Atom ist die Verteilung des Magnetismus nicht glatt. Zum Beispiel ist die Magnetisierung in einem Eisenatom auf einer mehr oder weniger kugelförmigen Schale verteilt, nicht zu nahe am Kern und nicht zu weit von ihm entfernt. Daher ist der Magnetismus in der Materie in seinen Einzelheiten etwas sehr Kompliziertes; er ist sehr unregelmäßig. Aber wir sind nun gezwungen, diese Komplexität der Details zu ignorieren und ausgemittelte Phänomene im großen Maßstab zu betrachten. Dann ist es richtig, dass im inneren Bereich der mittlere Strom durch eine endliche Fläche, die groß im Vergleich zu einem Atom ist, verschwindet, wenn M = 0. Was wir also mit der Magnetisierung pro Volumeneinheit, mit jmag usw. auf der Ebene, die wir jetzt betrachten, meinen, ist ein Mittel über Bereiche, die groß im Vergleich zu dem Raum sind, den ein einzelnes Atom einnimmt. Im vorigen Kapitel haben wir außerdem festgestellt, dass ein ferromagnetisches Material die folgende interessante Eigenschaft besitzt: Oberhalb einer bestimmten Temperatur ist es nicht stark magnetisch, während es unterhalb dieser Temperatur magnetisch wird. Diese Tatsache lässt sich leicht demonstrieren. Ein Stück Nickeldraht wird bei Raumtemperatur von einem Magneten angezogen. Wenn wir es jedoch mit einer Gasflamme über seine Curie-Temperatur hinaus erwärmen, wird es nichtmagnetisch und wird nicht zum Magneten hingezogen – selbst wenn man es sehr nahe an den Magneten bringt. Lassen wir es neben dem Magneten liegen, während es abkühlt, so wird es in dem Moment, wo seine Temperatur unter die kritische Temperatur fällt, plötzlich wieder von dem Magneten angezogen! Die allgemeine Theorie des Ferromagnetismus, die wir verwenden, nimmt an, dass der Spin des Elektrons für die Magnetisierung verantwortlich ist. Das Elektron hat Spin 1/2 und ein magnetisches Moment von einem bohrschen Magneton: μ = μB = qe /2m. Der Spin des Elektrons kann entweder „up“ oder „down“ gerichtet sein. Da die Ladung des Elektrons negativ ist, hat das Elektron bei Spin „up“ ein negatives Moment und bei Spin „down“ ein positives Moment. 1

Siehe auch: Bozorth, R. M., „Magnetism“, Encyclopaedia Britannica, Vol. 14, 1957, S. 636–667; Kittel, Ch., Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München.

166

8 Magnetische Materialien

Mit unseren Konventionen ist das magnetische Moment μ des Elektrons entgegengesetzt zu seinem Spin. Wir haben festgestellt, dass die Orientierungsenergie eines magnetischen Dipols in einem vorgegebenen, angelegten Feld B gleich −μ · B ist, aber die Energie der rotierenden Elektronen hängt auch von der Ausrichtung der Nachbarspins ab. Ist im Eisen das Moment eines Atoms in der Nähe „up“, so besteht die sehr starke Tendenz, dass das Moment des Atoms daneben ebenfalls „up“ ist. Darum sind Eisen, Kobalt und Nickel so stark magnetisch – alle ihre Momente möchten sich parallel stellen. Die erste Frage, die wir beantworten müssen, ist warum? Schon bald nach der Entwicklung der Quantenmechanik stellte man fest, dass es eine sehr starke Scheinkraft gibt – keine magnetische Kraft oder irgendeine andere Art von echter Kraft, sondern nur eine Scheinkraft – die versucht, die Spins von nahe beieinanderliegenden Elektronen gegeneinander auszurichten. Diese Kräfte hängen eng mit den chemischen Valenzkräften zusammen. Es gibt ein Prinzip in der Quantenmechanik – das so genannte Ausschließungsprinzip – nach dem zwei Elektronen nicht genau denselben Zustand einnehmen können, dass sie nicht genau denselben Bedingungen bezüglich des Ortes und der Spinrichtung genügen können.2 Befinden sie sich beispielsweise am selben Ort, so besteht die einzige Möglichkeit darin, dass ihre Spins entgegengesetzt sind. Gibt es also einen Raumbereich zwischen Atomen, in dem sich die Elektronen gern ansammeln (wie das bei der chemischen Bindung der Fall ist) und wir wollen ein Elektron an den Ort eines anderen Elektrons bringen, das bereits da ist, so ist das nur dann möglich, wenn wir den Spin des zweiten Elektrons entgegengesetzt zum Spin des ersten einstellen. Parallele Spins verletzen das Gesetz, es sei denn, die Elektronen halten Abstand voneinander. Dies hat den Effekt, dass ein Paar von Elektronen mit parallelen Spins, die sich nahe beieinander befinden, sehr viel mehr Energie besitzen als ein Paar von Elektronen mit entgegengesetzten Spins; der Gesamteffekt sieht so aus, als ob eine Kraft versuchte, den Spin umzukehren. Zuweilen wird diese spinumkehrende Kraft die Austauschkraft genannt, aber das macht die Sache nur noch mysteriöser – das ist kein sehr guter Terminus. Es ist allein das Ausschließungsprinzip, das bewirkt, dass benachbarte Elektronen die Tendenz haben, ihre Spins entgegengesetzt einzustellen. Tatsächlich ist das die Erklärung für das Fehlen des Magnetismus in fast allen Substanzen! Die Spins der freien Leitungselektronen im äußeren Bereich der Atome zeigen eine äußerst starke Tendenz, sich durch Einstellung in entgegengesetzten Richtungen auszugleichen. Das Problem ist es nun zu erklären, warum wir bei Materialien wie Eisen genau das Gegenteil von dem vorfinden, was wir erwarten würden. Wir haben den postulierten Ausrichtungseffekt durch Hinzufügen eines geeigneten Terms in der Energiegleichung berücksichtigen: Führen die Elektromagnete in der Umgebung zu einer mittleren Magnetisierung M, so haben wir festgestellt, dass das Moment eines Elektrons die starke Tendenz zeigt, dieselbe Richtung wie die mittlere Magnetisierung der Atome in der Nachbarschaft anzunehmen. Daher können wir für die beiden möglichen Spinrichtungen schreiben 3   λM , Energie für Spin „up“ = +μ H + �0 c2 (8.1)   λM Energie für Spin „down“ = −μ H + . �0 c2 2 3

Siehe Abschnitt 4.7 in Band V. Wir schreiben diese Gleichungen mit H = B − M/�0 c2 anstelle von B, um mit dem vorigen Kapitel übereinzustimmen. Sie schreiben vielleicht lieber U = ± μBa = ± μ(B + λ� M/�0 c2 ), wobei λ� = λ − 1. Das ist dasselbe.

8.1 Den Ferromagnetismus verstehen

167

Als klar war, dass die Quantenmechanik eine ungeheuere spinausrichtende Kraft liefern konnte – wenn auch mit offenbar falschem Vorzeichen – wurde vermutet, dass der Ferromagnetismus auf eben diese Kraft zurückgehen könne und dass aufgrund der Kompliziertheit des Eisens und der großen Zahl der betroffenen Elektronen das Vorzeichen der Wechselwirkungsenergie umgekehrt herauskommen könne. Seit der Zeit, als man so dachte – um 1927, als man anfing, die Quantenmechanik zu verstehen – sind auf der Suche nach einer theoretischen Vorhersage für λ verschiedene Schätzungen und semiquantitative Rechnungen durchgeführt worden. Auch die neuesten Berechnungen der Energie zwischen den beiden Elektronenspins in Eisen – bei denen angenommen wird, dass die Wechselwirkung direkt zwischen den beiden Elektronen in Nachbaratomen erfolgt – ergeben immer noch das falsche Vorzeichen. Augenblicklich muss man immer noch annehmen, die Kompliziertheit der Situation sei irgendwie verantwortlich, und man hofft, der nächste, der die Rechnung für eine kompliziertere Situation durchführt, werde die richtige Lösung erhalten! Man glaubt, dass der nach oben gerichtete Spin eines der Elektronen in der inneren Schale, der die Magnetisierung hervorruft, dazu führt, dass die im äußeren Bereich herumfliegenden Leitungselektronen die entgegengesetzte Spinrichtung einnehmen. Man kann erwarten, dass das passiert, wenn die Leitungselektronen in denselben Bereich wie die „magnetischen“ Elektronen gelangen. Da sie sich umherbewegen, können sie die ihnen nun übertragene Vorliebe dafür, auf dem Kopf zu stehen, auf das nächste Atom übertragen. Das heißt, ein „magnetisches“ Elektron versucht, die Leitungselektronen dazu zu zwingen, ihren Spin entgegengesetzt auszurichten, und das Leitungselektron veranlasst dann das nächste „magnetische“ Elektron, seinen Spin entgegengesetzt zum Spin des Leitungselektrons auszurichten. Die doppelte Wechselwirkung ist dann äquivalent zu einer Wechselwirkung, die versucht, die Spins der beiden „magnetischen“ Elektronen gleich auszurichten. Mit anderen Worten: Die Tendenz zu parallelen Spins ist das Resultat eines Bindeglieds, das gewissermaßen dazu neigt, sich entgegengesetzt zu beiden einzustellen. Dieser Mechanismus erfordert nicht, dass alle Leitungselektronen „auf dem Kopf“ stehen. Sie könnten einfach eine kleine Vorliebe für Spin nach unten haben, gerade genug, um die „magnetischen“ Elektronen anders herum auszurichten. Dies ist der Mechanismus, den nun diejenigen, die solche Dinge ausgerechnet haben, für den Ferromagnetismus verantwortlich machen. Aber wir müssen betonen, dass bis auf den heutigen Tag niemand den Betrag von λ einfach dadurch ausrechnen konnte, dass er nur davon ausging, dass das Material im periodischen System die Nummer 26 hat. Kurz gesagt: Wir verstehen das Ganze noch nicht gründlich. Fahren wir nun mit der Theorie fort und kommen dann später zu diesem Problem zurück, um einen gewissen Fehler zu erkennen, der in unserem Aufbau enthalten ist. Zeigt das magnetische Moment eines bestimmten Elektrons nach „oben“, so stammt die Energie sowohl aus dem äußeren Feld als auch aus der Tendenz der Spins, sich parallel auszurichten. Da die Energie niedriger ist, wenn die Spins parallel sind, betrachtet man den Effekt zuweilen so, als würde er von einem „effektiven inneren Feld“ hervorgerufen. Aber denken Sie daran: Er beruht nicht auf einer echten magnetischen Kraft; es handelt sich um eine Wechselwirkung, die komplizierter ist. Jedenfalls verwenden wir die Gleichungen (8.1) als die Formeln für die Energien der beiden Spinzustände eines „magnetischen“ Elektrons. Bei einer Temperatur T ist die relative Wahrscheinlichkeit dieser beiden Zustände proportional zu e−Energie/kT , das wir als e±x schreiben können, wobei x = μ(H + λM/�0 c2 )/kT . Berechnen wir dann den mittleren Wert des magnetischen Moments, so finden wir für ihn (wie im vorigen Kapitel) M = Nμ tanh x.

(8.2)

168

8 Magnetische Materialien

Nun möchten wir die innere Energie des Materials berechnen. Wir wissen, dass die Energie eines Elektrons proportional zum magnetischen Moment ist, sodass die Berechnung des mittleren Moments und die der mittleren Energie auf dasselbe hinauslaufen – nur dass wir anstelle von μ in (8.2) −μB schreiben werden, was −μ(H + λM/�0 c2 ) ist. Die mittlere Energie ist dann   λM �U�mittel = −Nμ H + tanh x. �0 c2 Das ist aber nicht ganz richtig. Der Ausdruck λM/�0 c2 stellt Wechselwirkungen aller möglichen Paare von Atomen dar, und wir müssen darauf achten, dass wir jedes Paar nur einmal zählen. (Wenn wir die Energie eines Elektrons im Feld aller anderen betrachten und dann die Energie eines zweiten Elektrons im Feld aller anderen, so zählen wir einen Teil der ersten Energie ein zweites Mal.) Folglich müssen wir den Ausdruck der gegenseitigen Wechselwirkung durch zwei dividieren, und unsere Formel für die Energie lautet dann   λM �U�mittel = −Nμ H + tanh x. (8.3) 2�0 c2 Im vorigen Kapitel haben wir eine interessante Tatsache entdeckt – dass das Material unterhalb einer bestimmten Temperatur eine Lösung für die Gleichungen bietet, für die das magnetische Moment nicht null ist, auch wenn kein äußeres Magnetisierungsfeld anwesend ist. Als wir in (8.2) H = 0 setzten, fanden wir   M Tc M , (8.4) = tanh MSätt T MSätt wobei MSätt = Nμ und T c = μλMSätt /k�0 c2 . Lösen wir diese Gleichung (graphisch oder auf andere Weise), so stellen wir fest, dass das Verhältnis M/MSätt als Funktion von T/T c die Kurve ergibt, die in Abbildung 8.1 mit „Quantentheorie“ markiert ist. Die mit „Kobalt, Nickel“ markierte gestrichelte Kurve zeigt die experimentellen Resultate für Kristalle dieser Elemente. Theorie und Experiment stimmen recht gut überein. Die Abbildung zeigt außerdem das Resultat der klassischen Theorie, in der die Rechnung unter der Annahme durchgeführt wird, dass die atomaren Magnete beliebige Richtungen im Raum haben können. Sie sehen, dass diese Annahme eine Vorhersage liefert, die nicht einmal in die Nähe der experimentellen Fakten kommt. Auch die Quantentheorie weicht sowohl bei hohen als auch niedrigen Temperaturen von dem beobachteten Verhalten ab. Der Grund für diese Abweichungen liegt darin, dass wir in der Theorie eine etwas nachlässige Näherung gemacht haben: Wir haben angenommen, dass die Energie eines Atoms von der mittleren Magnetisierung seiner Nachbaratome abhängt. Mit anderen Worten: Für jeden Spin, der in der Nachbarschaft eines gegebenen Atoms „up“ gerichtet ist, gibt es einen Energiebeitrag, der auf dem quantenmechanischen Ausrichtungseffekt beruht. Aber wie viele Spins sind denn „up“? Im Mittel wird ihr Prozentsatz durch die Magnetisierung M angegeben – aber eben nur im Mittel. Ein gegebenes Atom kann an einem gewissen Punkt alle seine Nachbarn Spin „up“ vorfinden. Seine Energie ist dann größer als der Mittelwert. Ein anderes Atom kann vielleicht einige Nachbarn mit Spin „up“ und einige mit Spin „down“ vorfinden, was im Mittel null ergibt, wobei es dann keine Energie aus diesem Term erhält, usw. Wir sollten eine etwas kompliziertere Art von Mittelung verwenden, denn Atome an verschiedenen Punkten haben verschiedene Umgebungen mit unterschiedlich vielen Spins up und down. Statt

8.2 Thermodynamische Eigenschaften

169

1,0 0,9

Eisen

0,8

Kobalt, Nickel

0,7

klassische Theorie

M/MSätt

0,6 0,5

Quanten theorie

0,4 0,3 0,2 0,1 0

0

0,1

0,2

0,3

0,4

T/T c

0,5

0.6

0,7

0,8

0,9

1,0

Abb. 8.1: Die spontane Magnetisierung (H = 0) ferromagnetischer Kristalle als Funktion der Temperatur. [Mit Erlaubnis der Encyclopaedia Britannica.]

nur ein Atom unter dem mittleren Einfluss zu betrachten, müssten wir jedes einzelne in seiner effektiven Situation berücksichtigen, seine Energie berechnen und dann die mittlere Energie bestimmen. Aber wie stellen wir fest, wie viele Spins in der Nachbarschaft „up“ und wie viele „down“? Das ist genau das, was wir zu berechnen versuchen – die Anzahl der Spins „up“ – und „down“ – und so haben wir es hier mit einem sehr komplizierten Problem von miteinander verkoppelten Korrelationen zu tun, ein Problem, das bisher nicht gelöst worden ist. Das Problem ist aufregend und faszinierend, es existiert seit Jahren und einige der größten Köpfe in der Physik haben Arbeiten darüber geschrieben, aber auch sie konnten es nicht vollständig lösen. Es stellt sich heraus, dass es bei niedrigen Temperaturen, wenn fast alle atomaren Magnete „up“ und nur wenige „down“ zeigen, leicht gelöst werden kann; und bei hohen Temperaturen, weit oberhalb der Curie-Temperatur T c , wenn fast alle atomaren Magnete eine zufällige Richtung haben, ist es auch wieder leicht zu lösen. Oft ist es einfach, kleine Abweichungen von einer einfachen, idealisierten Situation zu berechnen; so versteht man recht gut, warum es bei niedriger Temperatur Abweichungen von der einfachen Theorie gibt. Es ist auch im physikalischen Sinne verständlich, dass die Magnetisierung bei hohen Temperaturen aus statistischen Gründen abweichen muss. Aber das genaue Verhalten in der Nähe des Curie-Punktes ist noch nicht lückenlos geklärt worden. Das ist ein interessantes Problem, das Sie eines Tages untersuchen können, falls Sie nach etwas suchen, das noch nicht gelöst worden ist.

8.2

Thermodynamische Eigenschaften

Im vorangegangenen Kapitel haben wir das Fundament gelegt, das zur Berechnung der thermodynamischen Eigenschaften von ferromagnetischen Materialien notwendig ist. Diese hängen natürlich mit der inneren Energie des Kristalls zusammen, die die Wechselwirkungen der

170

8 Magnetische Materialien

verschiedenen Spins enthält, welche durch (8.3) gegeben sind. Für die Energie der spontanen Magnetisierung unter dem Curie-Punkt können wir in (8.3) H = 0 setzen und erhalten – bei Berücksichtigung von tanh x = M/MSätt – eine mittlere Energie proportional zu M 2 : �U�mittel = −

NμλM 2 · 2�0 c2 MSätt

(8.5)

Stellen wir nun die durch den Magnetismus bewirkte Energie als Funktion der Temperatur dar, so erhalten wir eine Kurve wie in Abbildung 8.2 (a), die das negative Quadrat der Kurve von Abbildung 8.1 ist. Wenn wir dann die spezifische Wärme eines solchen Materials experimentell bestimmen, so erhalten wir eine Kurve, die die Ableitung von 8.2 (a) ist. Sie ist in Abbildung 8.2 (b) gezeigt. Sie steigt mit zunehmender Temperatur langsam an, fällt aber bei T = T c plötzlich auf null ab. Der scharfe Abfall beruht auf der Änderung in der Steigung der magnetischen Energie und wird genau am Curie-Punkt erreicht. Somit hätten wir auch ohne jegliche magnetische Messung entdecken können, dass im Innern von Eisen oder Nickel etwas vor sich geht, wenn wir diese thermodynamische Eigenschaft gemessen haben. Doch sowohl das Experiment als auch die verbesserte Theorie (unter Einbeziehung von Fluktuationen) deuten darauf hin, dass diese einfache Kurve falsch und die wirkliche Situation viel komplizierter ist. Die Kurve reicht am Maximum höher hinauf und fällt etwas langsamer auf null ab. Selbst wenn die Temperatur hoch genug ist, um die Ausrichtung der Spins im Mittel zufällig zu machen, gibt es immer noch lokale Bereiche mit einem gewissen Grad an Polarisation, in denen die Spins noch etwas zusätzliche Wechselwirkungsenergie haben, die nur langsam erlischt, wenn die Ausrichtungen bei zunehmender Temperatur mehr und mehr zufällig werden. Somit schaut die wirkliche Kurve wie in Abbildung 8.2 (c) aus. Eine der Herausforderungen an die theoretische Physik unserer Tage ist das Problem, eine genaue theoretische Beschreibung des Charakters der spezifischen Wärme in der Nähe des Curie-Übergangs zu finden – ein faszinierendes Problem, das noch nicht gelöst worden ist. Natürlich steht dieses Problem in engem Zusammenhang mit der Form der Magnetisierungskurve in diesem Temperaturbereich. U

Cv

Tc

Cv

T Tc (a)

(b)

T (c)

Tc

T

Abb. 8.2: Die Energie pro Volumeneinheit und die spezifische Wärme eines ferromagnetischen Kristalls.

Nun wollen wir einige Experimente beschreiben, die nicht thermodynamisch sind, und zeigen, dass doch etwas an unserer Interpretation des Magnetismus richtig ist. Wird das Material bei niedrigen Temperaturen bis zur Sättigung magnetisiert, so ist M fast gleich MSätt – nahezu alle Spins sind parallel und ebenso ihre magnetischen Momente. Das können wir anhand eines Experiments überprüfen: Hängen wir einen Stabmagneten an einem dünnen Faden auf und umgeben ihn dann mit einer Spule, sodass wir sein Magnetfeld umkehren können, ohne den Magneten zu berühren oder ein Drehmoment auf ihn auszuüben. Es handelt sich hier um ein sehr schwieriges Experiment, weil die magnetischen Kräfte so enorm groß sind, dass jede Unregelmäßigkeit, jede Asymmetrie oder jeder Mangel an Perfektion im Eisen unbeabsichtigte

8.3 Die Hysteresekurve

171

Drehmomente erzeugt. Aber man hat das Experiment unter sorgfältigen Bedingungen durchgeführt, wobei alle zufälligen Drehmomente auf ein Minimum reduziert wurden. Mithilfe des Magnetfeldes aus der Spule, die den Stab umgibt, werden alle atomaren Magnete auf einmal umgekehrt. Dabei werden auch die Drehimpulse aller Spins von „up“ nach „down“ gekippt (vgl. Abbildung 8.3). Soll der Drehimpuls erhalten bleiben, wenn alle Spins umgekehrt werden, so muss der Stab eine entgegengesetzte Änderung des Drehimpulses erfahren.

Elektronenspins

Abb. 8.3: Wird die Magnetisierung eines Eisenstabs umgekehrt, so erhält der Stab eine bestimmte Winkelgeschwindigkeit.

Der Stabmagnet sollte sich zu drehen beginnen. Führen wir das Experiment durch, so beobachten wir tatsächlich eine leichte Drehung des Magneten. Wir können den Drehimpuls, den der Stabmagnet erhält, messen und dieser ist einfach N mal , also N-mal die Änderung im Drehimpuls jedes Spins. Das auf diese Weise gemessene Verhältnis zwischen dem Drehimpuls und dem magnetischen Moment kommt bis auf 10% an das berechnete Ergebnis heran. Effektiv gesehen, setzen unsere Berechnungen voraus, dass die atomaren Magnete rein auf dem Elektronenspin beruhen, aber in den meisten Materialien gibt es zudem auch noch einen gewissen Beitrag von der Bahnbewegung. Die Bahnbewegung ist nicht völlig unabhängig vom Gitter und trägt nicht viel mehr als einige Prozent zum Magnetismus bei. Tatsächlich erhält man mit MSätt = Nμ, der Eisendichte 7,9 und dem Moment μ des Elektronenspins ein Magnetfeld der Sättigung von ungefähr 20 000 Gauß. Aber laut Experiment liegt es in der Nähe von 21 500 Gauß. Das ist eine typische Größenordnung für den Fehler – 5 oder 10 Prozent – der darauf beruht, dass die Beiträge der Bahnmomente bei der Analyse vernachlässigt wurden. Daher ist eine kleine Abweichung von den gyromagnetischen Messungen durchaus verständlich.

8.3

Die Hysteresekurve

Aus unserer theoretischen Analyse haben wir die Schlussfolgerung gezogen, dass ein ferromagnetisches Material unterhalb einer bestimmten Temperatur spontan magnetisiert werden müsste, damit der gesamte Magnetismus dieselbe Richtung hat. Aber wir wissen, dass das für ein normales Stück unmagnetisierten Eisens nicht richtig ist. Warum ist nicht jedes Eisen magnetisiert? Wir können das mithilfe von Abbildung 8.4 erklären. Nehmen wir an, dass das Eisen einen einzigen großen Kristall von der in Abbildung 8.4 (a) gezeigten Form bildet und dass es zur Gänze spontan in einer Richtung magnetisiert wird. Es existiert dann ein beträchtliches äußeres Magnetfeld, das sehr viel Energie hat. Diese Feldenergie können wir reduzieren, wenn

172

8 Magnetische Materialien

wir es so einrichten, dass eine Seite des Blocks „nach oben“ und die andere Seite „nach unten“ magnetisiert wird, wie in Abbildung 8.4 (b). Die Felder außerhalb des Eisens erstrecken sich dann über ein kleineres Volumen, und folglich gibt es dort weniger Energie. N N N N

N N S S

S N S N

S S S S

S S N N

N S N S

(a)

(b)

(c)

(d)

(e)

Abb. 8.4: Die Bildung von Bezirken in einem einzelnen Eisenkristall. [Aus Charles Kittel, Einführung in die Festkörperphysik, R. Oldenbourg, München.]

Aber einen Augenblick! In der Schicht zwischen den beiden Bereichen haben wir Elektronen mit Spin up, die an Elektronen mit Spin down angrenzen. Der Ferromagnetismus tritt aber nur in solchen Materialien auf, für die sich die Energie reduziert, wenn die Elektronen parallel und nicht entgegengesetzt eingestellt sind. Deshalb haben wir eine gewisse zusätzliche Energie entlang der gepunkteten Linie in Abbildung 8.4 (b) hinzugefügt; diese Energie nennt man manchmal auch die Wandenergie. Ein Bereich, der eine einheitliche Magnetisierungsrichtung hat, heißt ein Bezirk. An der Trennfläche – der „Wand“ – zwischen zwei Bezirken, wo wir auf gegenüberliegenden Seiten Atome mit Spins in entgegengesetzten Richtungen haben, gibt es eine Energie pro Flächeneinheit der Wand. Diese haben wir so beschrieben, dass an ihr zwei aneinandergrenzende Atome entgegengesetzte Spins haben; es stellt sich aber heraus, dass die Natur die Dinge so anpasst, dass der Übergang allmählicher erfolgt. Doch um derart feine Einzelheiten brauchen wir uns an dieser Stelle nicht zu kümmern. Die Frage ist nun: Wann ist es günstiger, eine Wand einzuziehen und wann ungünstiger? Die Antwort lautet, dass das von der Größe der Bezirke abhängt. Stellen wir uns vor, wir würden einen Block so vergrößern, dass seine Abmessungen am Ende doppelt so groß sind. Das Volumen des Raums außerhalb des Blocks, in dem ein Magnetfeld von vorgegebener Stärke existiert, ist dann achtmal größer, und die Energie in dem Magnetfeld, die proportional zum Volumen ist, ist ebenfalls achtmal größer. Aber der Flächeninhalt der Trennfläche zwischen den beiden Bezirken ist nur viermal so groß. Deshalb zahlt es sich aus, ein hinreichend großes Stück Eisen in mehrere Bezirke aufzuteilen. Und das ist der Grund, warum nur sehr kleine Kristalle aus einem einzigen Bezirk bestehen. Jedes große Objekt – eines, das größer als 1/100 mm ist – wird zumindest eine Wand aufweisen; und jedes gewöhnliche „zentimetergroße“ Objekt wird in viele Bezirke aufgeteilt, wie das die Abbildung zeigt. Die Unterteilung in Bezirke wird solange fortgesetzt, bis die Energie, die notwendig ist, um eine weitere Wand einzuziehen, so groß wie die Energieabnahme im Magnetfeld außerhalb des Kristalls ist. In der Praxis hat die Natur noch einen anderen Weg gefunden, um die Energie abzusenken: Es ist nicht notwendig, dass das Feld das Material überhaupt verlässt, wenn ein kleiner dreieckiger Bereich seitwärts magnetisiert wird, wie in Abbildung 8.4 (d).4 Anhand der Anordnung von 4

Sie fragen sich vielleicht, wie Spins, die entweder „up“ oder „down“ gerichtet sein müssen, das auch „seitwärts“ sein können! Das ist eine berechtigte Frage, aber wir werden uns jetzt nicht damit aufhalten. Wir übernehmen einfach den klassischen Standpunkt und stellen uns atomare Magnete als klassische Dipole vor, die auch seitwärts polarisiert werden können. Im Rahmen der Quantenmechanik ist beträchtlicher Sachverstand notwendig, um verstehen zu können, wie Dinge gleichzeitig „nach oben und nach unten“ und „nach rechts und nach links“ quantisiert werden können.

8.3 Die Hysteresekurve

173

Abbildung 8.4 (d) sehen wir, dass es kein äußeres Feld gibt, dass aber stattdessen etwas mehr Wand erforderlich ist. Aber das bringt eine neue Art von Problem mit sich. Wird ein einzelner Eisenkristall magnetisiert, so stellt sich heraus, dass er seine Länge in der Magnetisierungsrichtung ändert, sodass ein „idealer“ Würfel nach der Magnetisierung – zum Beispiel bei Richtung „nach oben“ – kein perfekter Würfel mehr ist. Die „vertikale“ Abmessung ist dann eine andere als die „horizontale“. Diesen Effekt nennt man Magnetostriktion. Aufgrund solcher geometrischen Veränderungen „passen“ die kleinen dreieckigen Stücke aus Abbildung 8.4 (d) nicht mehr in den zur Verfügung stehenden Raum – der Kristall ist in der einen Richtung zu lang und in der anderen zu kurz geworden. Tatsächlich passt das kleine Dreieck natürlich hinein, aber es muss hineingezwängt werden, und das bringt mechanische Spannungen mit sich. Daher führt diese Anordnung ebenfalls zu einer zusätzlichen Energie. Es ist der Ausgleich aller dieser verschiedenen Energien, der bestimmt, auf welch komplizierte Weise sich die Bezirke schließlich in einem Stück nichtmagnetisierten Eisens verteilen. Was passiert aber, wenn wir ein äußeres Magnetfeld anlegen? Betrachten wir zunächst einen einfachen Fall: einen Kristall, dessen Bezirke wie die in Abbildung 8.4 (d) verteilt sind. Auf welche Weise wird der Kristall magnetisiert, wenn wir ein nach oben gerichtetes äußeres Magnetfeld anlegen? Als Erstes kann sich die zentrale Wand seitwärts verschieben (nach rechts), um die Energie reduzieren. Sie verschiebt sich so, dass der Bereich „aufwärts“ größer als der Bereich „abwärts“ wird. Es gibt dann mehr elementare Magnete, die in Feldrichtung ausgerichtet sind, und das führt zu einer niedrigeren Energie. Somit beginnen sich für ein Stück Eisen in schwachen Feldern – ganz zu Anfang der Magnetisierung – die Wände der Bezirke zu bewegen und schieben sich in Bereiche hinein, die in entgegengesetzter Feldrichtung magnetisiert sind. Während das Feld weiterhin wächst, transformiert sich ein ganzer Kristall nach und nach in einen einzigen großen Bezirk, dem das äußere Feld hilft, ausgerichtet zu bleiben. In einem starken Feld „zieht“ der Kristall es „vor“, vollständig ausgerichtet zu sein, einfach weil seine Energie in dem angelegten Feld herabgesetzt wird – es ist nicht mehr nur das äußere Feld des Kristalls, das zählt. Was passiert, wenn die Geometrie nicht so einfach ist? Wenn die Achsen des Kristalls und seine spontane Magnetisierung in einer Richtung liegen und wir das Magnetfeld in einer anderen Richtung – etwa im Winkel von 45◦ – anlegen? Wir könnten uns vorstellen, dass die Bezirke sich so umordnen, dass ihre Magnetisierung parallel zum Feld verläuft und dass sie dann alle, wie zuvor, zu einem Bezirk zusammenwachsen. Das kann aber das Eisen nicht so leicht durchführen, denn die Energie, die notwendig ist, um einen Kristall zu magnetisieren, hängt von der Magnetisierungsrichtung relativ zur Kristallachse ab. Es ist relativ einfach, Eisen in einer Richtung parallel zu den Kristallachsen zu magnetisieren, aber es verlangt mehr Energie, es in einer anderen Richtung – etwa in 45◦ zu einer der Achsen – zu magnetisieren. Legen wir daher ein Magnetfeld in einer bestimmten Richtung an, so wachsen zunächst die Bezirke, die in einer Richtung orientiert sind, die in der Nähe der Richtung des angelegten Feldes liegt, bis die Magnetisierung dieses Bezirks vollständig in diese Richtung zeigt. Die gesamte Magnetisierung des Kristalls wird dann erst bei sehr viel stärkeren Feldern nach und nach so herumgedreht, dass sie parallel zum Feld ist, wie es in Abbildung 8.5 skizziert ist. In Abbildung 8.6 sind einige Beobachtungen an Magnetisierungskurven von einzelnen Eisenkristallen dargestellt. Um sie zu verstehen, müssen wir zuerst etwas zur Notation sagen, die zur Beschreibung der Richtungen in einem Kristall verwendet wird.

174

8 Magnetische Materialien

M

M

M

H

Abb. 8.5: Ein magnetisierendes Feld H in einem Winkel zur Kristallachse verändert nach und nach die Richtung der Magnetisierung, ohne ihren Betrag zu ändern.

H

H

Ein Kristall kann auf viele Weisen so gespalten werden, dass eine Seitenfläche entsteht, die eine Ebene von Atomen bildet. Jeder, der einmal an einem Obstgarten oder Weinberg vorbeigefahren ist, weiß das – es ist faszinierend zu beobachten. Schauen Sie in eine Richtung, sehen Sie Baumreihen – schauen Sie in eine andere Richtung, sehen Sie andere Baumreihen, und so fort. In ähnlicher Weise hat ein Kristall bestimmte Familien von Ebenen, die viele Atome enthalten, und die Ebenen haben das folgende wichtige Charakteristikum (wir betrachten einen kubischen Kristall, um es einfacher zu machen): Stellen wir fest, wo die Ebenen die drei Koordinatenachsen schneiden, so erkennen wir, dass die reziproken Werte der drei Abstände vom Ursprung in dem Verhältnis einfacher ganzer Zahlen stehen. Diese drei ganzen Zahlen verwendet man zur Definition der Ebenen. Beispielsweise ist in Abbildung 8.7 (a) eine Ebene gezeigt, die parallel zur yz-Ebene ist. Das nennt man eine [100]-Ebene; die reziproken Werte ihrer Schnittpunkte mit der y- und der z-Achse sind beide null. Die Richtung senkrecht zu einer solchen Ebene (in einem kubischen Kristall) erhält dasselbe Zahlensystem. Es ist leicht, die Notation im Fall eines kubischen Kristalls zu verstehen, denn dann bedeuten die Indizes [100] einen Vektor, der die Komponente eins in der x-Richtung und keine in der y- oder z-Richtung hat. Die [110]1800

[100]

1600

[110]

[111]

1400 1200 1000

M 4π 800 600 400 200

0

0

100

200

300

400

500

H

600

700

800

900

1000

Abb. 8.6: Die Komponente von M parallel zu H für verschiedene Richtungen von H (in Bezug auf die Kristallachsen). [Aus F. Bitter, lntroduction to Ferromagnetism, McGraw-Hill Book Co., Inc. 1937.]

8.3 Die Hysteresekurve

175

Richtung liegt 45◦ zur x- und y-Achse, wie in Abbildung 8.7 (b) und die [111]-Richtung ist die der Diagonalen des Würfels, wie in Abbildung 8.7 (c). y

(a)

[100]

100-Ebene

[111]

[110] (b)

x z

y

y

(c) x

x z

z

Abb. 8.7: Wie Kristallebenen bezeichnet werden.

Kehren wir nun zu Abbildung 8.6 zurück; dort sind die Magnetisierungskurven eines einzelnen Eisenkristalls für verschiedene Richtungen dargestellt. Beachten wir zuerst, dass für sehr schwache Felder – die so schwach sind, dass man sie im Maßstab der Abbildung nur mit Mühe sehen kann – die Magnetisierung extrem schnell bis auf ziemlich große Werte anwächst. Liegt das Feld in der [100]-Richtung, nämlich entlang einer dieser hübschen, leichten Magnetisierungsrichtungen, so steigt die Kurve auf einen hohen Wert an, krümmt sich ein bisschen und ist dann gesättigt. Was passiert, ist, dass die Bezirke, die bereits vorhanden sind, sich sehr leicht erweitern lassen. Es ist nur ein schwaches Feld erforderlich, um die Wände der Bezirke in Bewegung zu setzen, sodass sie alle Bezirke auffressen, die „verkehrt“ ausgerichtet sind. Einzelne Eisenkristalle sind enorm permeabel (im magnetischen Sinn), sehr viel mehr als gewöhnliches, polykristallines Eisen. Ein perfekter Kristall wird extrem leicht magnetisiert. Aber warum ist die Kurve überhaupt gekrümmt? Warum steigt sie nicht in einer geraden Linie bis zur Sättigung? Wir wissen es nicht mit Sicherheit. Vielleicht untersuchen Sie das eines Tages selbst. Wir verstehen, warum sie für starke Felder flach verläuft: Wenn der ganze Block einen einzigen Bezirk bildet, dann kann das zusätzliche Magnetfeld keine Magnetisierung mehr erzeugen – sie beträgt bereits MSätt und alle Elektronen sind ausgerichtet. Wenn wir nun versuchen, dasselbe in der [110]-Richtung zu tun – die 45◦ zu den Kristallachsen liegt –, was passiert dann? Wir legen ein sehr, sehr schwaches Feld an, und die Magnetisierung springt in die Höhe, während die Bezirke wachsen. Lassen wir das Feld dann etwas anwachsen, so stellen wir fest, dass es eines großen Feldes bedarf, um die Sättigung zu erreichen, denn nun dreht sich die Magnetisierung von der „leichten“ Richtung weg. Wenn diese Erklärung richtig √ist, müsste der Schnittpunkt der extrapolierten [110]-Kurve mit der vertikalen Achse bei√1/ 2 des Sättigungswertes liegen. Es zeigt sich, dass er tatsächlich sehr, sehr nahe bei liegt 1/ 2 liegt. Ähnlich finden wir für die [111]-Richtung – die entlang der Würfeldiagonalen √ – erwartungsgemäß, dass ihre Extrapolation die Achse in der Nähe von 1/ 3 der Sättigung schneidet. Abbildung 8.8 zeigt die entsprechende Situation für zwei andere Materialien: Nickel und Kobalt. Nickel unterscheidet sich von Eisen. Für Nickel ist die [111]-Richtung die leichte Magnetisierungsrichtung. Kobalt hat die Form eines hexagonalen Kristalls, und in diesem Fall ist das System der Notation erweitert worden. Man will drei Achsen in der Grundfläche des Hexagons

176

8 Magnetische Materialien

M/4π�0 c2 (Gauß)

1600

[100] [110]

300

800

[0001]

[110]

400

1200

1200

[100]

800

200

400 0

[111]

500

[111]

Fe 0

400

100 200

400

600

0

Ni 0

100

200

H (Gauß)

300

0

[1010]

Co 0

2000 4000 6000 8000

Abb. 8.8: Magnetisierungskurven für Einzelkristalle aus Eisen, Nickel und Kobalt. [Aus Charles Kittel, Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München.]

und eine senkrecht dazu haben, folglich verwendet man vier Indizes. Die [0001]-Richtung ist die der Achse des Hexagons, und [1010] ist senkrecht zu dieser Achse. Wir sehen, dass sich Kristalle verschiedener Metalle unterschiedlich verhalten. Nun müssen wir ein polykristallines Material untersuchen, wie es beispielsweise ein gewöhnliches Stück Eisen darstellt. Im Innern dieser Materialien gibt es viele, viele kleine Kristalle, deren Kristallachsen in alle möglichen Richtungen zeigen. Dabei handelt es sich nicht um Bezirke. Erinnern Sie sich daran, dass alle Bezirke Teile eines einzelnen Kristalls sind, während es in einem Stück Eisen viele verschiedene Kristalle mit unterschiedlich gerichteten Achsen gibt, wie das Abbildung 8.9 zeigt. Innerhalb jedes dieser Kristalle gibt es im Allgemeinen auch einige Bezirke. Legen wir ein schwaches Magnetfeld an ein Stück polykristallinen Materials an, so setzen sich die Wände in Bewegung und die Bezirke mit einer günstigen leichten Magnetisierungsrichtung werden größer. Dieses Wachstum ist reversibel, solange das Feld sehr schwach bleibt – schalten wir das Feld ab, so kehrt die Magnetisierung auf null zurück. Dieser Teil der Magnetisierungskurve ist in Abbildung 8.10 mit a bezeichnet. Für starke Felder – im Bereich b der dargestellten Magnetisierungskurve – werden die Dinge sehr viel komplizierter. In jedem kleinen Kristall des Materials gibt es Verzerrungen und Versetzungen; es gibt Verunreinigungen, Schmutz und Unvollkommenheiten. Und für alle Felder,

Abb. 8.9: Die mikroskopische Struktur eines nichtmagnetisierten ferromagnetischen Materials. Jedes Kristallkorn hat eine leichte Magnetisierungsrichtung und ist in Bezirke unterteilt, die (gewöhnlich) parallel zu dieser Richtung spontan magnetisiert sind.

8.3 Die Hysteresekurve B

177

c b a

H

Abb. 8.10: Die Magnetisierungskurve für polykristallines Eisen.

bis auf die allerschwächsten, werden die Wände der Bezirke durch diese Defekte aufgehalten. Es gibt eine Wechselwirkungsenergie zwischen der Wand eines Bezirks und einer Versetzung oder einer Korngrenze oder einer Verunreinigung. Stößt dann die Wand auf etwas Derartiges, so bleibt sie bei einer bestimmten Feldstärke dort stecken. Wird aber die Feldstärke etwas erhöht, so springt die Wand plötzlich über. Somit verläuft die Bewegung einer Wand nicht stetig, wie das in einem perfekten Kristall der Fall ist – sie bleibt immer wieder stecken und bewegt sich ruckartig. Würden wir die Magnetisierung in mikroskopischem Maßstab beobachten, so sähen wir etwas Ähnliches wie in dem eingefügten Kreis in Abbildung 8.10. Wichtig ist nun, dass diese ruckartige Wandbewegung bei der Magnetisierung einen Energieverlust hervorrufen kann. Zunächst einmal bewegt sich eine Wand nach Überwindung eines Hindernisses sehr schnell auf das nächste Hindernis zu, weil die Feldstärke bereits größer ist, als es für eine ungehinderte Bewegung erforderlich wäre. Die schnelle Bewegung bedeutet, dass es rasch veränderliche Magnetfelder gibt, die in dem Kristall Wirbelströme erzeugen. Ein zweiter Effekt ist, dass bei einer plötzlichen Änderung des Bezirks ein Teil des Kristalls aufgrund der Magnetostriktion seine Dimensionen ändert. Jede plötzliche Bewegung einer Bezirkswand erzeugt eine kleine Schallwelle, die Energie abtransportiert. Wegen dieser Effekte ist der zweite Teil der Magnetisierungskurve irreversibel und Energie geht verloren. Das ist der Ursprung des Hysterese-Effektes; denn bewegt man eine Trennungswand vorwärts – schnapp – und dann rückwärts – schnapp –, so erhält man etwas anderes als zuvor. Das ist wie eine „ruckhafte“ Reibung, und die verbraucht Energie. Haben wir schließlich bei hinreichend großen Feldstärken alle Wände der Bezirke bewegt und jeden Kristall in seiner besten Richtung magnetisiert, so gibt es noch immer einige Kristallite, deren leichte Magnetisierungsrichtungen nicht in der Richtung des äußeren Magnetfeldes liegen. Es ist sehr viel zusätzliche Feldstärke erforderlich, um ihre magnetischen Momente herumzudrehen. Deshalb nimmt die Magnetisierung für große Feldstärken langsam aber stetig zu – und zwar in dem mit c markierten Bereich in der Abbildung. Die Magnetisierung erreicht ihren Sättigungswert nicht abrupt, denn im letzten Teil der Kurve drehen sich die atomaren Magnete in dem starken Feld. Wir sehen daher, warum die Magnetisierungskurve eines gewöhnlichen polykristallinen Materials, wie sie in Abbildung 8.10 gezeigt ist, zunächst etwas in reversibler Weise und dann irreversibel ansteigt und dann langsam abbiegt. Natürlich gibt es zwischen den drei Bereichen keine scharfen Grenzen – sie gehen glatt ineinander über. Es ist nicht schwer zu zeigen, dass der Magnetisierungsprozess im mittleren Teil der Magnetisierungskurve ruckhaft ist – dass die Bewegung der Bezirkswände in Rucken und Sprüngen erfolgt. Alles, was Sie brauchen, ist eine Drahtspule mit vielen tausend Wicklungen, die an einen Verstärker und einen Lautsprecher – wie in Abbildung 8.11 – angeschlossen ist. Bringen Sie einige Silikonstahlplatten (von der Art, wie sie in Transformatoren benützt werden) in die

178

8 Magnetische Materialien

Mitte der Spule und führen einen Stabmagneten langsam in die Nähe des Stapels, so erzeugen die plötzlichen Änderungen der Magnetisierung der Platten EMK-Impulse in der Spule, die im Lautsprecher wie ein entferntes Knacken zu hören sind. Bringen Sie den Magneten immer näher an das Eisen heran, so erfolgt das Knacken kaskadenförmig, was sich so anhört wie das Prasseln von Sandkörnern, wenn ein Eimer mit Sand langsam ausgekippt wird. Die Wände der Bezirke springen, schnappen ein und wackeln, während die Feldstärke zunimmt. Dieses Phänomen nennt man den Barkhausen-Effekt. Spule

Silikonstahlband Stabmagnet N

S

Bewegung

Verstärker Lautsprecher

Abb. 8.11: Die plötzlichen Änderungen in der Magnetisierung der Stahlplatten werden im Lautsprecher als Knacken hörbar.

Bringen Sie den Magneten noch näher an die Eisenplatten heran, so wird das Geräusch eine Zeitlang immer lauter, dann aber wird es relativ leise, wenn Sie ganz nahe daran sind. Warum? Weil sich fast alle Wände der Bezirke so weit bewegt haben, wie sie können. Jede größere Feldstärke bewirkt lediglich, dass sich die Magnetisierung in jedem Bezirk dreht, und das ist ein kontinuierlicher Prozess. Ziehen Sie nun den Magneten zurück, um wieder auf den absteigenden Zweig der Hystereseschleife zu kommen, so versuchen alle Bezirke, wieder in ihren Zustand niedrigerer Energie zu gelangen, und Sie hören eine andere Kaskade von rückwärts-laufenden Rucken. Außerdem können Sie feststellen, dass der Magnet relativ wenig Geräusch verursacht, wenn Sie ihn an eine bestimmte Stelle bringen und dann etwas hin- und herbewegen. Auch das ist wieder, wie wenn man einen Eimer mit Sand langsam auskippt. Haben die Körner erst einmal ihren Platz eingenommen, so stören sie kleine Bewegungen des Eimers nicht mehr. Im Eisen sind die kleinen Veränderungen des Magnetfeldes nicht ausreichend, um irgendwelche Wände über die „Buckel“ zu befördern.

8.4

Ferromagnetische Materialien

Wir möchten nun über die verschiedenen Arten von magnetischen Materialien sprechen, denen man in der Welt der Technik begegnet, und einige Probleme betrachten, die beim Entwerfen von magnetischen Materialien für verschiedene Zwecke auftreten. Zunächst einmal ist der oft zu hörende Ausdruck „die magnetischen Eigenschaften von Eisen“ falsch – so etwas gibt es nicht. Das „Eisen“ ist kein gut definiertes Material – die Eigenschaften des Eisens hängen in kritischer Weise von der Menge der Verunreinigungen ab, und auch davon, wie das Eisen geformt ist. Sie können sich klarmachen, dass die magnetischen Eigenschaften damit zusammenhängen, wie leicht sich die Wände der Bezirke bewegen, und dass es sich dabei um eine kollektive Eigenschaft und nicht um eine Eigenschaft der einzelnen Atome handelt. Daher ist

8.4 Ferromagnetische Materialien

179

der Ferromagnetismus keine Eigenschaft eines Eisenatoms – er ist eine Eigenschaft von festem Eisen in einer bestimmten Form. Zum Beispiel kann Eisen zwei verschiedene Kristallformen annehmen. Die übliche Form hat ein raumzentriertes kubisches Gitter, aber es kann auch ein flächenzentriertes kubisches Gitter vorliegen, das jedoch nur bei Temperaturen über 1100◦C stabil ist. Bei dieser Temperatur liegt natürlich die raumzentrierte kubische Struktur bereits über dem Curie-Punkt. Aber durch Legieren von Chrom und Nickel mit dem Eisen (eine mögliche Mischung besteht aus 18 % Chrom und 8 % Nickel) können wir den so genannten rostfreien Stahl erhalten, der zwar hauptsächlich aus Eisen besteht, aber trotzdem das flächenzentrierte Gitter selbst bei niedrigen Temperaturen beibehält. Da seine Kristallstruktur anders ist, hat er völlig andere magnetische Eigenschaften. Die meisten Arten von rostfreiem Stahl sind nicht nennenswert magnetisch, obwohl es einige Sorten gibt, die etwas magnetisch sind – das hängt von der genauen Legierung ab. Selbst wenn eine solche Legierung magnetisch ist, ist sie nicht ferromagnetisch wie gewöhnliches Eisen – obwohl sie hauptsächlich aus Eisen besteht. Beschreiben wir nun einige spezielle Materialien, die zur Erzielung besonderer magnetischer Eigenschaften entwickelt worden sind. Um beispielsweise einen permanenten Magneten zu erhalten, brauchen wir ein Material mit einer besonders breiten Hystereseschleife, sodass die Magnetisierung auch dann noch groß bleibt, wenn wir den Strom abschalten und ein magnetisierendes Feld null erreichen. In derartigen Materialien müssten die Wände der Bezirke weitgehend an Ort und Stelle „eingefroren“ werden. Ein solches Material ist die bemerkenswerte Legierung „Alnico V“ (51 % Fe, 8 % Al, 14 % Ni, 24 % Co, 3 % Cu). (Die ziemlich komplexe Zusammensetzung dieser Legierung ist bezeichnend für die großen Anstrengungen, die unternommen wurden, um gute Magnete zu erhalten. Wie viel Geduld ist nötig, um fünf Elemente zu mischen und dann so lange zu testen, bis die ideale Substanz herauskommt!) Wenn Alnico fest wird, gibt es eine „zweite Phase“, die ausfällt, wobei viele kleine Körner und große innere Verzerrungen entstehen. In diesem Material ist es für die Grenzen zwischen den Bezirken sehr schwer, sich überhaupt zu bewegen. Abgesehen davon, dass Alnico eine präzise Zusammensetzung hat, wird es mechanisch in einer Weise „bearbeitet“, dass die Kristallform diejenige von langen Körnern entlang der Richtung ist, in der die Magnetisierung erfolgen soll. Die Magnetisierung hat dann die natürliche Tendenz, in diesen Richtungen ausgerichtet zu sein, und wird dort von den Anisotropieeffekten festgehalten. Dazu kommt, dass das Material bei der Herstellung sogar in einem äußeren Magnetfeld abgekühlt wird, sodass die Körner mit der richtigen Kristallausrichtung wachsen. Die Hysteresekurve von Alnico V ist in Abbildung 8.12 dargestellt. Sie sehen, dass sie ungefähr 700-mal breiter als die Hysteresekurve für weiches Eisen ist, die wir im vorhergehenden Kapitel in Abbildung 7.8 gezeigt haben. Wenden wir uns nun einer anderen Art von Material zu. Um Transformatoren und Motoren zu bauen, brauchen wir ein Material, das magnetisch „weich“ ist – eines, in dem die Magnetisierung leicht zu ändern ist, sodass aus einem sehr kleinen angelegten Feld eine enorm große Magnetisierung resultiert. Um das zu erreichen, benötigen wir ein reines, gut ausgeglühtes Material, das sehr wenig Versetzungen und Verunreinigungen aufweist, sodass sich die Wände der Bezirke leicht bewegen können. Es wäre auch schön, wenn wir die Anisotropie klein machen könnten. Selbst wenn sich dann ein Korn des Materials im falschen Winkel zum Feld befindet, wird dieses immer noch leicht magnetisiert. Wir haben gesagt, dass Eisen vorzugsweise in der [100]-Richtung magnetisiert wird, während Nickel die [111]-Richtung bevorzugt. Mischen wir daher Eisen und Nickel in verschiedenen Proportionen, so können wir hoffen, dass die Legierung mit genau den richtigen Proportionen keine bevorzugte Richtung mehr hat – die [100]und [111]-Richtungen wären äquivalent. Es stellt sich heraus, dass das mit einer Mischung von

180

8 Magnetische Materialien

70 Prozent Nickel und 30 Prozent Eisen passiert. Außerdem zeigt sich – vielleicht durch einen glücklichen Zufall oder aufgrund einer physikalischen Relation zwischen der Anisotropie und den Effekten der Magnetostriktion – dass die Magnetostriktion im Eisen und im Nickel das entgegengesetzte Vorzeichen hat. Und in einer Legierung der beiden Metalle geht diese Eigenschaft bei ungefähr 80% Nickel durch null. Also erhalten wir irgendwo zwischen 70 und 80 Prozent Nickel sehr „weiche“ magnetische Materialien – Legierungen, die sehr leicht zu magnetisieren sind. Sie werden Permalloys genannt. Permalloys sind nützlich, um hochwertige Transformatoren zu bauen (für schwache Signale), aber sie eignen sich überhaupt nicht für permanente Magnete. Permalloys müssen sehr sorgfältig hergestellt und behandelt werden. Die magnetischen Eigenschaften eines Stücks Permalloy ändern sich drastisch, wenn es über die Elastizitätsgrenze hinaus beansprucht wird: Es darf nicht gebogen werden. Seine Permeabilität wird sonst aufgrund der Versetzungen, des Gleitens der Schichten und so fort herabgesetzt, wobei es sich um Effekte mechanischer Deformationen handelt. Die Grenzen zwischen den Bezirken lassen sich dann nicht mehr leicht bewegen. Die hohe Permeabilität kann jedoch durch Ausglühen bei hohen Temperaturen wiederhergestellt werden. Oft ist es bequem, über einige Zahlen zu verfügen, um die verschiedenen magnetischen Materialien zu charakterisieren. Zwei nützliche Zahlen sind die Schnittpunkte der Hystereseschleife mit der B- und der H-Achse, die in Abbildung 8.12 eingetragen sind. B (Gauß) 15 000

Br

10 000 5 000

−Hc −800 −400

0

400

800 H

(Gauß)

Abb. 8.12: Die Hysteresekurve von Alnico V.

Diese Schnittpunkte heißen das remanente Magnetfeld Br und die Koerzitivkraft Hc . In Tabelle 8.1 haben wir diese Zahlen für einige magnetische Materialien zusammengestellt.

8.5

Ungewöhnliche magnetische Materialien

Wir möchten nun einige ausgefallenere magnetische Materialien vorstellen. Es gibt im periodischen System viele Elemente, die unvollständige innere Elektronenschalen aufweisen und infolgedessen atomare magnetische Momente haben. Zum Beispiel finden Sie gleich neben den ferromagnetischen Elementen Eisen, Nickel und Kobalt das Chrom und das Magnesium.

8.5 Ungewöhnliche magnetische Materialien

181

Tabelle 8.1: Eigenschaften einiger ferromagnetischer Materialien

Material Supermalloy Silikonstahl (für Transformatoren) Armco-Eisen Alnico V

Br Remanentes Magnetfeld (Gauß) (≈ 5 000)

Hc Koerzitivkraft (Gauß) 0,004

12 000 4 000 13 000

0,05 0,6 550

Warum sind sie nicht ferromagnetisch? Die Antwort ist, dass der λ-Term in (8.1) für diese Elemente das entgegengesetzte Vorzeichen hat. Im Chromgitter beispielsweise alternieren die Spins der Chromatome von einem Atom zum nächsten, wie es Abbildung 8.13 (b) zeigt.

(a)

(b)

(c)

(d)

Abb. 8.13: Relative Ausrichtung der Elektronenspins in verschiedenen Materialien: (a) ferromagnetisch, (b) antiferromagnetisch, (c) ferrit, (d) Yttrium-Eisen-Legierung. (Die unterbrochenen Pfeile zeigen die Richtung des Gesamtdrehimpulses einschließlich der Bahnbewegung an.)

Daher ist Chrom von sich aus „magnetisch“, aber es ist technisch uninteressant, weil keine äußeren magnetischen Effekte auftreten. Chrom ist somit ein Beispiel für ein Material, in dem die Spins aufgrund quantenmechanischer Effekte alternieren. Ein solches Material nennt man antiferromagnetisch. Die Ausrichtung der Spins von antiferromagnetischen Materialien ist ebenfalls temperaturabhängig. Unterhalb einer kritischen Temperatur sind alle Spins in der alternierenden Anordnung ausgerichtet, aber wenn das Material über eine bestimmte Temperatur hinaus erwärmt wird – man nennt das auch hier die Curie-Temperatur – so sind die SpinRichtungen plötzlich ganz dem Zufall unterworfen. Es gibt im Innern einen plötzlichen Übergang. Dieser Übergang kann in der Kurve der spezifischen Wärme beobachtet werden und zeigt sich auch in einigen speziellen „magnetischen“ Effekten. Zum Beispiel kann die Existenz der alternierenden Spins durch Streuung von Neutronen an einem Chromkristall nachgewiesen werden. Weil ein Neutron selbst einen Spin (und damit ein magnetisches Moment) hat, ist seine Streuamplitude unterschiedlich, je nachdem, ob sein Spin parallel oder entgegengesetzt zum Spin des Streuzentrums ist. So erhalten wir ein anderes Interferenzmuster, wenn die Spins in einem Kristall alternieren, als wenn sie zufallsverteilt sind. Es gibt eine andere Art von Substanz, in der die Elektronenspins aufgrund quantenmechanischer Effekte alternieren, die aber trotzdem ferromagnetisch ist – das heißt, der Kristall hat eine permanente Gesamtmagnetisierung. Die diesen Materialien zugrundeliegende Struktur ist in Abbildung 8.14 veranschaulicht. Diese Abbildung zeigt die Kristallstruktur von Spinell, ein Magnesium-Aluminium-Oxyd, das – wie es dargestellt ist – nicht magnetisch ist. Das Oxyd hat zwei Sorten von Metallatomen: Magnesium und Aluminium. Ersetzen wir nun das Ma-

182

8 Magnetische Materialien

O2− Mg

2+

Al3+

Abb. 8.14: Kristallstruktur des Minerals Spinell (MgAl2 O4 ); die Mg+2 lonen nehmen Punkte auf einem Tetraeder ein, jedes ist umgeben von vier Sauerstoffionen; die Al+3 Ionen nehmen Punkte auf einem Oktaeder ein, jedes ist umgeben von sechs Sauerstoffionen. [Aus Charles Kittel, Einführung in die Festkörperphysik, R. Oldenbourg, München.]

gnesium und Aluminium durch zwei magnetische Elemente wie Eisen und Zink, oder durch Zink und Mangan – mit anderen Worten, wenn wir magnetische Atome an die Stelle von nichtmagnetischen setzen –, so passiert etwas Interessantes. Bezeichnen wir die beiden Arten von Metallatomen mit a und b; dann ist die folgende Kräftekombination zu betrachten. Es gibt eine a-b-Wechselwirkung, die zu bewirken versucht, dass die a- und die b- Atome entgegengesetzte Spins haben – weil die Quantenmechanik immer das entgegengesetzte Vorzeichen liefert (außer für die mysteriösen Kristalle von Eisen, Nickel und Kobalt). Dann gibt es eine direkte a-a-Wechselwirkung, die versucht, die a’s entgegengesetzt zu stellen, und auch eine b-bWechselwirkung, die versucht, die b’s entgegengesetzt zu stellen. Nun ist es natürlich nicht alles gleichzeitig möglich, dass also jedes Element entgegengesetzt zu jedem anderen ist – a entgegengesetzt zu b, a entgegengesetzt zu a und b entgegengesetzt zu b. Vermutlich wegen der Abstände zwischen den a’s und der Anwesenheit des Sauerstoffs (obwohl wir in Wirklichkeit nicht wissen warum) stellt sich heraus, dass die a-b-Wechselwirkung stärker als die a-a- oder die b-b-Wechselwirkung ist. Deshalb ist die Lösung, die die Natur in diesem Fall verwendet, die, dass sie alle a’s parallel zueinander stellt und alle b’s parallel zueinander stellt, aber die beiden Systeme entgegengesetzt zueinander einstellt. Aufgrund der stärkeren a-b-Wechselwirkung liefert das die niedrigste Energie. Das Resultat: Alle Spins der a’s zeigen nach oben und alle Spins der b’s nach unten – oder natürlich umgekehrt. Sind aber die magnetischen Momente des Atoms vom Typ a und des Atoms vom Typ b nicht gleich, so können wir die Situation von Abbildung 8.13 (c) erhalten und es kann eine Gesamtmagnetisierung des Materials vorliegen. Das Material ist dann ferromagnetisch – wenn auch nur schwach. Solche Materialien nennt man Ferrite. Sie haben keine so hohe Sättigungsmagnetisierung wie Eisen – aus offensichtlichen Gründen – und sind daher nur für schwächere Felder nützlich. Aber sie zeichnen sich durch etwas anderes, sehr Wichtiges aus – sie sind Isolatoren; die Ferrite sind ferromagnetische Isolatoren. In Hochfrequenzfeldern entwickeln sie nur sehr kleine Wirbelströme und können daher zum Beispiel in Mikrowellensystemen verwendet werden. Die Mikrowellenfelder sind in der Lage, in das Innere eines solchen isolierenden Materials einzudringen, während sie bei einem Leiter wie Eisen durch die Wirbelströme daran gehindert werden. Es gibt eine andere Klasse von magnetischen Materialien, die erst kürzlich entdeckt worden ist – es sind Mitglieder jener Familie von Orthosilikaten, die man Granate nennt. Es handelt sich wiederum um Kristalle, in denen das Gitter zwei Sorten von Metallatomen enthält, und wir haben auch hier eine Situation vorliegen, in der zwei Atomsorten fast beliebig ersetzt werden können. Unter den vielen interessanten Verbindungen gibt es eine, die vollkommen fer-

8.5 Ungewöhnliche magnetische Materialien

183

romagnetisch ist. Sie enthält Yttrium und Eisen in der Granatstruktur und der Grund, warum sie ferromagnetisch ist, ist sehr sonderbar. Auch hier stellt die Quantenmechanik benachbarte Spins entgegengesetzt ein, sodass es ein eingeprägtes Spinsystem gibt, in dem die Elektronenspins des Yttriums in der entgegengesetzten Richtung eingestellt sind. Aber das Yttriumatom ist kompliziert. Es ist ein Element der seltenen Erden, und sein magnetisches Moment enthält einen Beitrag von der Bahnbewegung der Elektronen. Für Yttrium ist der Beitrag von der Bahnbewegung entgegengesetzt zu dem des Spins gerichtet und außerdem ist er größer. Obwohl also die Quantenmechanik mithilfe des Ausschließungsprinzips die Spins des Yttriums entgegengesetzt zu denen des Eisens einstellt, richtet sie aufgrund des Bahneffekts das gesamte magnetische Moment des Yttriumatoms parallel zu dem des Eisens aus – wie in Abbildung 8.13 (d) skizziert. Die Verbindung ist daher ein regulärer Ferromagnet. Ein weiteres interessantes Beispiel für Ferromagnetismus tritt in einigen Elementen der seltenen Erden auf. Es hat mit einer noch ausgefalleneren Anordnung der Spins zu tun. Das Material ist weder ferromagnetisch in dem Sinn, dass die Spins alle parallel sind, noch ist es antiferromagnetisch in dem Sinn, dass jeweils zwei Atome entgegengesetzt eingestellt sind. In diesen Kristallen sind alle Spins in einer Schicht parallel und liegen in der Ebene der Schicht. Auch in der nächsten Schicht sind wieder alle Spins parallel zueinander, aber sie zeigen in eine etwas andere Richtung. In der darauffolgenden Schicht zeigen sie wiederum in eine andere Richtung und so fort. Daraus resultiert, dass sich der lokale Magnetisierungsvektor schraubenförmig ändert – die magnetischen Momente der aufeinanderfolgenden Schichten drehen sich, wenn wir entlang einer Linie senkrecht zu den Schichten fortschreiten. Es ist ein interessanter Versuch zu analysieren, was passiert, wenn ein Feld an eine solche Schraube angelegt wird – all die Verdrehungen und Windungen, die in allen diesen atomaren Magneten stattfinden müssen. (Es gibt Leute, die sich gern mit der Theorie dieser Effekte unterhalten!) Es gibt nicht nur Fälle von „flachen“ Schrauben, sondern auch Fälle, in denen die Richtungen der magnetischen Momente von aufeinanderfolgenden Schichten einen Kegel beschreiben, sodass der Magnetisierungsvektor in einer gegebenen Richtung eine Schraubenkomponente und auch eine homogene ferromagnetische Komponente aufweist! Auf einem anspruchsvolleren Niveau, als es uns hier darzulegen möglich war, haben die magnetischen Eigenschaften der Materialien jeden Typ von Physiker fasziniert. An erster Stelle gibt es die praktisch Gesinnten, die Freude daran haben herauszufinden, wie man etwas besser machen kann – wie man sich bessere und interessantere Materialien ausdenkt. Die Entdeckung von Materialien wie die Ferrite und deren Anwendung entzückt Leute, die gern neue, einfallsreiche Anwendungsmöglichkeiten sehen. Neben diesen gibt es den Typ eines Physikers, der von der furchtbaren Kompliziertheit beeindruckt ist, die die Natur mithilfe weniger grundlegender Gesetze hervorbringen kann. Als Ausgangspunkt genügt ein und dieselbe allgemeine Idee: Die Natur geht dann vom Ferromagnetismus des Eisens und seiner Bezirke zum Antiferromagnetismus des Chroms, zum Magnetismus der Ferrite und Granate, zur Schraubenstruktur der Elemente der seltenen Erden und so fort. Es ist faszinierend, auf experimentellem Weg all die seltsamen Dinge zu entdecken, die in diesen speziellen Substanzen vor sich gehen. Der theoretische Physiker fühlt sich dann von den vielen interessanten, ungelösten und schönen Problemen des Ferromagnetismus herausgefordert. Schon die Frage, warum er überhaupt existiert, ist eine Herausforderung. Eine weitere ist die Vorhersage der Statistik von wechselwirkenden Spins in einem idealen Gitter. Auch bei Vernachlässigung aller möglichen äußeren Komplikationen wurde ein volles Verständnis dieses Problems bis jetzt nicht erreicht. Das Problem ist deswegen so interessant, weil es so einfach zu formulieren ist: Gegeben sind viele Elektronen-

184

8 Magnetische Materialien

spins in einem regulären Gitter, sie wechselwirken nach einem bestimmten Gesetz miteinander, aber wie stellen sie sich ein? Die Frage ist einfach gestellt, aber die Antwort hat jahrelang auf sich warten lassen. Obwohl das Problem für Temperaturen nicht zu dicht am Curie-Punkt sehr sorgfältig untersucht wurde, muss die Theorie des plötzlichen Übergangs am Curie-Punkt noch vervollständigt werden. Schließlich hat auch das ganze Thema des Systems von atomaren Spinmagneten – in ferromagnetischen oder paramagnetischen Materialien und beim nuklearen Magnetismus – seine faszinierende Seite für fortgeschrittene Physikstudenten. Mithilfe von äußeren Magnetfeldern kann man an dem System von Spins herumdrehen, und man kann daher viele Tricks mit Resonanzen, mit Relaxationseffekten, mit Spinechos und mit anderen Effekten spielen lassen. Das System dient als Prototyp für viele komplizierte thermodynamische Systeme. In paramagnetischen Materialien ist die Situation meist relativ einfach, und man erfreut sich daran, sowohl Experimente zu machen als auch die Phänomene theoretisch zu erklären. Wir beenden nun unsere Untersuchung der Elektrizität und des Magnetismus. Im ersten Kapitel sprachen wir von den großen Fortschritten, die seit der Beobachtung des seltsamen Verhaltens von Bernstein und von Magneteisenstein durch die alten Griechen gemacht wurden. Doch in unserer ganzen langen und komplizierten Darlegung haben wir weder erklärt, woher es kommt, dass eine Ladung auf einem geriebenen Stück Bernstein auftritt, noch warum ein Magneteisenstein magnetisch ist. Sie sagen vielleicht: „Oh, wir haben nur nicht das richtige Vorzeichen erhalten“. Nein, es ist viel schlimmer. Auch wenn wir das richtige Vorzeichen erhalten hätten, stünden wir immer noch vor der Frage: Warum wird das Stück Magneteisenstein in der Erde magnetisiert? Natürlich gibt es das Magnetfeld der Erde, aber woher stammt das erdmagnetische Feld? Niemand weiß das wirklich – es gibt nur einige gute Hypothesen. So sehen Sie, dass unsere Physik eine Menge Täuschungen enthält – wir beginnen mit den Phänomenen des Magneteisensteins und Bernsteins und verstehen am Ende beide nicht recht gut. Immerhin haben wir bei diesem Lernprozess eine ungeheuere Menge aufregender und praktischer Kenntnisse erworben!

9

Elastizität

Siehe auch: Band II, Kapitel 22, Schall. Die Wellengleichung.

9.1

Das hookesche Gesetz

Die Theorie der Elastizität beschreibt das Verhalten jener Substanzen, die die Eigenschaft haben, dass sie ihre Größe und Form wiedererlangen, wenn die Kräfte, die Deformationen hervorgerufen haben, wieder entfernt werden. Bis zu einem gewissen Grad haben alle Festkörper diese elastische Eigenschaft. Hätten wir für dieses Thema ausreichend Zeit, so gäbe es viele Dinge, die wir gern untersuchen würden: das Verhalten der Materialien, die allgemeinen Gesetze der Elastizität, die allgemeine Theorie der Elastizität, den atomaren Mechanismus, der die elastischen Eigenschaften bestimmt, und schließlich die Grenzen der Elastizitätsgesetze, die berücksichtigt werden müssen, wenn die Kräfte so groß werden, dass die Körper plastisch verformt werden und Brüche auftreten. Doch aus Zeitgründen müssen wir einiges davon auslassen. Zum Beispiel werden wir die Plastizität und die Grenzen der Elastizitätsgesetze nicht besprechen. (Wir haben diese Themen kurz berührt, als wir von den Versetzungen in Metallen sprachen.) Ferner wird es uns nicht möglich sein, den atomaren Mechanismus der Elastizität zu behandeln – insofern wird unsere Darstellung nicht die Vollständigkeit erreichen, um die wir uns in den früheren Kapiteln bemüht haben. Unser Ziel ist es im Wesentlichen, Sie mit einigen Möglichkeiten vertraut zu machen, wie man praktische Probleme, wie das Biegen von Balken, behandelt. Wenn Sie auf ein Stück Material drücken, so „gibt es nach“ – das Material wird deformiert. Ist die Kraft hinreichend klein, so sind die relativen Verschiebungen der verschiedenen Punkte im Material proportional zur Kraft – wir sprechen von elastischem Verhalten. Wir werden nur das elastische Verhalten untersuchen. Zuerst schreiben wir die grundlegenden Gesetze der Elastizität auf und dann wenden wir sie in mehreren verschiedenen Situationen an. Betrachten wir einen rechteckigen Block aus Material mit der Länge l, der Breite w und der Höhe h, wie man ihn in Abbildung 9.1 sieht. Ziehen wir an den Enden mit der Kraft F, so w + Δw w

F

h h + Δh � � + Δ�

F Fläche A

Abb. 9.1: Das Dehnen eines Stabes unter homogener Spannung.

186

9 Elastizität

nimmt die Länge um den Betrag Δl zu. Wir werden in allen Fällen annehmen, dass die Längenänderung ein kleiner Bruchteil der ursprünglichen Länge ist. Tatsächlich ist es so, dass bei Materialien wie Holz und Stahl das Material bricht, wenn die Längenänderung mehr als einige Prozent der ursprünglichen Länge beträgt. Für viele Materialien zeigen die Experimente, dass bei hinreichend kleinen Dehnungen die Kraft proportional zur Verlängerung ist: F ∝ Δl.

(9.1)

Diese Relation ist als hookesches Gesetz bekannt. Die Verlängerung Δl des Stabes hängt auch von seiner Länge ab. Wie der Zusammenhang aussieht, können wir anhand der folgenden Überlegung erkennen. Kleben wir zwei identische Blöcke fest aneinander, genau Ende an Ende, so wirken auf jeden Block dieselben Kräfte; jeder wird um Δl verlängert. Somit wäre die Verlängerung eines Blocks der Länge 2l doppelt so groß wie die eines Blocks, der denselben Querschnitt, aber die Länge l hat. Um eine Zahl zu erhalten, die eher für das Material als für seine Form charakteristisch ist, verwenden wir das Verhältnis Δl/l zwischen der Verlängerung und der ursprünglichen Länge. Dieses Verhältnis ist proportional zur Kraft, aber unabhängig von l: F∝

Δl . l

(9.2)

Die Kraft F hängt auch vom Flächeninhalt des Blocks ab. Stellen wir uns vor, wir setzen zwei Blöcke Seite an Seite nebeneinander. Für eine gegebene Verlängerung Δl müssen wir dann auf jeden Block die Kraft F ausüben, also das Doppelte von F auf die Kombination der beiden Blöcke. Die Kraft für eine vorgegebene Verlängerung muss proportional zur Querschnittsfläche A des Blocks sein. Um ein Gesetz zu erhalten, in dem der Proportionalitätsfaktor unabhängig von den Abmessungen des Körpers ist, schreiben wir das hookesche Gesetz für einen rechteckigen Block in der Form F = YA

Δl . l

(9.3)

Die Konstante Y ist eine Eigenschaft, die nur für das Material charakteristisch ist; sie ist als der youngsche Modul bekannt. (Gewöhnlich werden Sie finden, dass der youngsche Modul mit E bezeichnet wird. Aber wir haben E schon für das elektrische Feld, die Energie und die EMK verwendet, deshalb ziehen wir hier einen anderen Buchstaben vor.) Die Kraft pro Flächeneinheit heißt die Spannung und die Verlängerung pro Längeneinheit – die relative Verlängerung – heißt die (relative) Dehnung1. Gleichung (9.3) kann daher in der folgenden Weise geschrieben werden: F Δl =Y· , A l Spannung = (youngscher Modul) · (Deformation).

(9.4)

Es steckt noch eine andere Aussage im hookeschen Gesetz: Wenn Sie einen Block von Material in einer Richtung dehnen, so zieht er sich rechtwinklig zur Spannung zusammen. Die 1

Dieser Ausdruck wird auch dann verwendet, wenn es sich um die Auswirkung einer Druckkraft handelt. Dann ist das eben eine negative Dehnung.

9.2 Homogene Dehnungen

187

Kontraktion in der Breite ist proportional zur Breite w und auch zu Δl/l. Die Querkontraktion erfolgt sowohl für die Breite als auch für die Höhe in derselben Proportion und wird gewöhnlich geschrieben als Δw Δh Δl = = −σ , w h l

(9.5)

wobei die Konstante σ eine andere Eigenschaft des Materials ist, die man die Poisson-Zahl nennt. Sie hat immer ein positives Vorzeichen und ist kleiner als 1/2. (Es ist „vernünftig“, dass σ im Allgemeinen positiv ist, aber es ist nicht ganz klar, warum das so sein muss.) Die beiden Konstanten Y und σ geben die elastischen Eigenschaften eines homogenen isotropen (das heißt, nichtkristallinen) Materials vollständig an. In kristallinen Materialien sind die Verlängerungen und Kontraktionen in verschiedenen Richtungen unterschiedlich, sodass es sehr viel mehr elastische Konstanten geben kann. Im Augenblick wollen wir unsere Darlegungen auf homogene isotrope Materialien beschränken, deren Eigenschaften durch Y und σ beschrieben werden können. Wie gewöhnlich gibt es verschiedene Möglichkeiten, die Dinge zu beschreiben – manche beschreiben die elastischen Eigenschaften der Materialien lieber mit anderen Konstanten. Es sind aber immer zwei erforderlich und man kann sie mit σ und Y verknüpfen. Das letzte allgemeine Gesetz, das wir brauchen, ist das Überlagerungsprinzip. Da die beiden Gesetze (9.4) und (9.5) für die Spannungen und die Dehnungen linear sind, muss das Überlagerungsprinzip gelten. Lassen Sie ein Kräftesystem wirken und erhalten bestimmte Dehnungen, fügen dann ein neues Kräftesystem hinzu und erhalten zusätzliche Dehnungen, so sind die resultierenden Dehnungen die Summe derer, die Sie erhalten, wenn die beiden Kräftesysteme unabhängig voneinander wirken. Nun haben wir alle allgemeinen Prinzipien – das Überlagerungsprinzip sowie die Gleichungen (9.4) und (9.5) – und das ist alles, was es in der Elastizitätstheorie gibt. Aber genauso könnte man nach dem Aufschreiben der newtonschen Gesetze sagen, dass das alles sei, was es in der Mechanik gibt. Oder sind die Maxwell-Gleichungen gegeben, dann ist das alles, was es beim Elektromagnetismus gibt. Es ist natürlich richtig, dass man mit diesen Prinzipien über sehr viel verfügt, denn mit Ihren augenblicklichen mathematischen Kenntnissen könnten Sie damit weit gelangen. Trotzdem wollen wir einige spezielle Anwendungen behandeln.

9.2

Homogene Dehnungen

Als erstes Beispiel versuchen wir herauszufinden, was mit einem rechteckigen Block unter homogenem hydrostatischem Druck passiert. Bringen wir einen Block unter Wasser in eine Druckkabine. Dann wird auf jede Seitenfläche des Blocks eine Kraft von außen nach innen p p

p p

Abb. 9.2: Ein Block unter homogenem hydrostatischem Druck.

188

9 Elastizität

wirken, die proportional zum Flächeninhalt ist (vgl. Abbildung 9.2). Da der hydrostatische Druck homogen ist, ist die Spannung (Kraft pro Flächeneinheit) auf jeder Seitenfläche des Blocks dieselbe. Ermitteln wir zuerst die Änderung der Länge. Man kann sich die Änderung der Blocklänge als die Summe der Längenänderungen vorstellen, die bei den drei voneinander unabhängigen, in Abbildung 9.3 dargestellten Problemen auftreten würden. F1

F1 F2

F2

F3

Abb. 9.3: Der hydrostatische Druck ist die Überlagerung von drei longitudinalen Kompressionen.

Problem 1. Wirken wir auf die Enden des Blocks mit einem Druck p ein, so beträgt die Dehnung infolge der Kompression −p/Y, und sie ist negativ, Δl1 p =− . l Y

Problem 2. Wirken wir auf die Ober- und Unterseite des Blocks mit einem Druck p ein, so ist die Dehnung infolge der Kompression wiederum −p/Y, aber wir suchen die Dehnung in der Längsrichtung. Diese können wir aus der seitlichen Dehnung durch Multiplikation mit −σ erhalten. Die seitliche Dehnung ist Δw p =− ; w Y sodass Δl2 p = +σ . l Y Problem 3. Drücken wir auf die Vorder- und Rückseite des Blocks, so ist auch hier die Dehnung infolge der Kompression −p/Y, und die entsprechende Dehnung in Längsrichtung ist Δl3 p = +σ . l Y

Durch Zusammenfassen der Resultate aus den drei Problemen – das heißt, durch Bilden von Δl = Δl1 + Δl2 + Δl3 – erhalten wir p Δl = − (1 − 2σ). l Y

(9.6)

9.2 Homogene Dehnungen

189

Das Problem ist natürlich in allen drei Richtungen symmetrisch; es folgt, dass Δw Δh p = = − (1 − 2σ). w h Y

(9.7)

Die Änderung des Volumens unter hydrostatischem Druck ist ebenfalls von einigem Interesse. Da V = lwh, können wir für kleine Dehnungen schreiben ΔV Δl Δw Δh = + + . V l w h Unter Verwendung von (9.6) und (9.7) erhalten wir ΔV p = −3 (1 − 2σ). V Y

(9.8)

Manche nennen ΔV/V die Volumenänderung und schreiben p = −K

ΔV . V

Die Volumenspannung p ist proportional zur Volumenänderung – auch hier gilt wieder das hookesche Gesetz. Der Koeffizient K heißt der Kompressionsmodul; er ist mit den beiden anderen Konstanten verknüpft durch K=

Y . 3(1 − 2σ)

(9.9)

Da K von einigem praktischen Interesse ist, geben viele Handbücher Y und K anstelle von Y und σ an. Wenn Sie σ brauchen, können Sie es immer mithilfe von (9.9) berechnen. Außerdem können wir aus (9.9) sehen, dass die Poisson-Zahl kleiner als 1/2 sein muss. Wäre das nicht der Fall, so wäre der Kompressionsmodul K negativ, und das Material würde sich bei zunehmendem Druck ausdehnen. Das würde es uns erlauben, mechanische Energie aus einem beliebigen Block von Material zu erhalten – es würde bedeuten, dass sich der Block in einem instabilen Gleichgewicht befände, und hätte er einmal angefangen sich auszudehnen, so würde er von sich aus damit fortfahren und dabei Energie freisetzen. G

Abb. 9.4: Ein Würfel bei einer homogenen Scherdeformation.

Betrachten wir nun, was passiert, wenn ein Gegenstand einer „Scherdeformation“ unterworfen wird. Unter einer Scherdeformation verstehen wir die in Abbildung 9.4 gezeigte Art von Verzerrung. Als Vorbereitung dazu untersuchen wir die Deformation eines Würfels von Material, der den in Abbildung 9.5 gezeigten Kräften ausgesetzt ist. Auch das können wir wieder in

190

9 Elastizität

zwei Probleme aufteilen: die vertikalen Drücke und die horizontalen Züge. Nennen wir A den Flächeninhalt der Seitenfläche des Würfels, so erhalten wir für die Änderung der horizontalen Länge Δl 1 F 1 F 1+σ F = +σ = . l Y A Y A Y A

(9.10)

Die Änderung der vertikalen Höhe ist genau das Negative davon. F

F

F

Abb. 9.5: Vorderansicht eines Würfels mit Kompressionskräften oben und unten und gleich starken Dehnungskräften auf die beiden Seiten.

F

Nehmen wir nun an, wir verwenden denselben Würfel und setzen ihn den Scherungskräften aus, die in Abbildung 9.6 (a) gezeigt sind. Beachten Sie, dass alle Kräfte gleich sein müssen, wenn es keinen Gesamtdrehimpuls geben und der Würfel im Gleichgewicht sein soll. (Ähnliche Kräfte müssen auch in Abbildung 9.4 existieren, da sich der Block im Gleichgewicht befindet. Sie werden von dem „Klebstoff“ geliefert, der den Block an den Tisch bindet.) Man sagt dann, dass sich der Würfel in einem Zustand reiner Scherung befindet. Beachten Sie aber: Spalten wir den Würfel entlang einer 45◦ -Ebene – zum Beispiel entlang der Diagonalen A in der Abbildung √ –, so ist die Gesamtkraft, die quer zur Ebene wirkt, √ senkrecht zu dieser und ist gleich 2G. Der Flächeninhalt, auf den diese Kraft wirkt, ist 2A; infolgedessen ist die Dehnungsspannung senkrecht zu dieser Ebene einfach G/A. Untersuchen wir dann entsprechend eine 45◦ -Ebene in der anderen Richtung – die Diagonale B in der Abbildung – so finden wir eine Kompressionsspannung – G/A senkrecht zu dieser



G A (a) G

B

2G

G

Flächen- √ inhalt = 2 A

D

(b) √

G



2G

2G



2G

Flächeninhalt A

Abb. 9.6: Die beiden Paare von Scherungskräften in (a) erzeugen dieselbe Spannung wie die Kompressions- und die Dehnungskräfte in (b).

9.2 Homogene Dehnungen

191

Ebene. Dem entnehmen wir, dass die gesamte Spannung bei einer „reinen Scherung“ äquivalent zu einer Kombination von Dehnungs- und Kompressionsspannungen von gleicher Stärke ist, die aufeinander senkrecht stehen und mit den ursprünglichen Seitenflächen des Würfels einen Winkel von 45◦ bilden. Die inneren Spannungen und Dehnungen sind dieselben, die wir in dem größeren Block von Material finden würden, auf den die in Abbildung 9.6 (b) gezeigten Kräfte einwirken. Aber hierbei handelt es sich um das Problem, das wir bereits gelöst haben. Die Längenänderung der Diagonalen ist durch (9.10) gegeben: ΔD 1 + σ G = . D Y A

(9.11)

(Eine Diagonale wird verkürzt, die andere verlängert.) ΔD

G

δ θ

� D � Abb. 9.7: Die Scherungsdeformation θ ist 2ΔD/D.

Es ist oft bequem, eine Scherungdehnung mithilfe des Scherwinkels auszudrücken, um den der Würfel geneigt wird – das ist der Winkel θ in Abbildung 9.7. Der Geometrie der √ Figur können Sie entnehmen, dass die horizontale Verschiebung δ der oberen Kante gleich 2 ΔD ist. Somit ist √ δ 2 ΔD ΔD θ= = =2 . (9.12) l D D Die Scherspannung g ist definiert als die Tangentialkraft auf eine Seitenfläche, dividiert durch den Flächeninhalt: g = G/A. Durch Einsetzen von Gleichung (9.11) in (9.12) erhalten wir θ=2

1+σ g. Y

Oder wir schreiben dies in der Form „Spannung = Konstante mal Dehnung“ und erhalten g = μθ.

(9.13)

Der Proportionalitätskoeffizient μ heißt der Schermodul (oder manchmal auch der Starrheitskoeffizient). Er ist in Ausdrücken von Y und σ gegeben durch μ=

Y . 2(1 + σ)

(9.14)

Nebenbei bemerkt: Der Schermodul muss positiv sein – anderenfalls könnten Sie Arbeit aus einem selbstscherenden Block erhalten. Laut (9.14) muss σ größer als −1 sein. Wir wissen dann, dass σ zwischen −1 und + 12 liegen muss; in der Praxis aber ist σ immer größer als null.

192

9 Elastizität Fy

Fx

Fz

Fx

Fy

Abb. 9.8: Dehnung ohne seitliche Kontraktion.

Als letztes Beispiel für eine Situation, bei der die Spannungen über das Material hinweg homogen sind, wollen wir einen Block betrachten, der gedehnt wird, wobei er gleichzeitig so eingespannt ist, dass keine seitliche Kontraktion stattfinden kann. (Technisch ist es etwas leichter, ihn zusammenzudrücken, wobei man ein Ausbeulen der Seiten verhindert – aber das ist das gleiche Problem.) Was passiert? Natürlich muss es seitwärts gerichtete Kräfte geben, die eine Änderung des Querschnitts verhindern – wir kennen diese Kräfte zunächst nicht, müssen sie aber berechnen. Es handelt sich um ein Problem des bereits behandelten Typs, nur die Rechnung ist etwas anders. Wir bringen die in Abbildung 9.8 gezeigten Kräfte auf alle drei Seitenflächen an; wir berechnen die Änderungen der Abmessungen und wählen die seitlichen Kräfte so, dass Breite und Höhe konstant bleiben. Mit den üblichen Überlegungen erhalten wir für die drei Deformationen    Fy Fz Δl x 1 F x σ Fy σ Fz 1 Fx , (9.15) = − − = −σ + lx Y A x Y Ay Y Az Y A x Ay Az    Δly 1 Fy F x Fz , (9.16) = −σ + ly Y Ay A x Az    Δlz 1 Fz F x Fy . (9.17) = −σ + lz Y Az A x Ay Da Δly und Δlz als null angenommen werden, erhalten wir aus (9.16) und (9.17) zwei Gleichungen, die Fy und Fz mit F x in Beziehung setzen. Durch Auflösen erhalten wir Fy Fz σ Fx = = . Ay Az 1 − σ A x

Durch Einsetzen in (9.15) finden wir     Δl x 2σ2 F x 1 1 1 − σ − 2σ2 F x 1− = = . lx Y 1 − σ Ax Y 1−σ Ax

(9.18)

(9.19)

Diese Relation finden Sie oft umgekehrt geschrieben; wird dann das Quadrat in σ herausgezogen, so erhält sie die Form 1−σ Δl F = Y . A (1 + σ)(1 − 2σ) l

(9.20)

Spannen wir die Seiten ein, so wird der youngsche Modul mit einer komplizierten Funktion von σ multipliziert. Wie Sie aus (9.19) leicht ablesen können, ist der Faktor vor dem Y immer größer als 1. Es ist schwerer, den Block zu dehnen, wenn die Seiten gestützt sind – was auch bedeutet, dass er unter diesen Bedingungen starrer ist.

9.3 Der Torsionsstab; Scherwellen

9.3

193

Der Torsionsstab; Scherwellen

Wenden wir nun unsere Aufmerksamkeit einem Beispiel zu, das komplizierter ist, weil verschiedene Teile des Materials Spannungen von verschiedener Stärke erfahren. Wir betrachten einen verdrillten Stab, wie Sie ihn bei einer Antriebsachse einer Maschine oder bei einer Quarzfadenaufhängung in einem empfindlichen Instrument vorfinden können. Wie Sie wahrscheinlich von Experimenten mit dem Torsionspendel her wissen, ist das Drehmoment auf einem verdrillten Stab proportional zum Winkel – wobei die Proportionalitätskonstante offensichtlich von der Länge des Stabes, seinem Radius und den Eigenschaften des Materials abhängt. Die Frage ist: auf welche Weise? Wir sind nun in der Lage, diese Frage zu beantworten; es sind lediglich einige geometrische Überlegungen durchzuführen. (a)

a φ

L

Δr (b)

Δr r

(c) ΔF

Δ�

ΔF

θ φ

θ

Abb. 9.9: (a) Ein zylinderförmiger Stab unter Torsion. (b) Eine zylinderförmige Schale unter Torsion. (c) Jedes kleine Stück der Schale erfährt eine Scherung.

Abbildung 9.9 (a) zeigt einen zylinderförmigen Stab mit der Länge L und dem Radius a, dessen eines Ende gegenüber dem anderen um einen Winkel φ verdrillt ist. Wollen wir die Deformationen mit dem, was wir bereits wissen, in Zusammenhang bringen, so können wir uns den Stab als aus vielen zylinderförmigen Schalen bestehend vorstellen und getrennt analysieren, was in jeder Schale passiert. Untersuchen wir zuerst einen dünnen, kurzen Hohlzylinder mit dem Radius r (kleiner als a) und der Dicke Δr – wie er in Abbildung 9.9 (b) gezeichnet ist. Betrachten wir nun ein kleines Stück dieses Hohlzylinders, das ursprünglich ein kleines Quadrat war, so sehen wir, dass das Quadrat zu einem Parallelogramm verzerrt worden ist. Jedes Element des Zylinders erfährt eine Scherung, und der Scherwinkel θ ist θ=

rφ . L

Die Scherspannung g in dem Material ist daher laut (9.13) g = μθ = μ

rφ . L

(9.21)

Die Scherspannung ist die Tangentialkraft ΔF auf das Ende des Quadrats, dividiert durch den

194

9 Elastizität

entsprechenden Flächeninhalt Δl Δr [siehe Abbildung 9.9 (c)] g=

ΔF . Δl Δr

Die Kraft ΔF auf das Ende eines solchen Quadrats bewirkt ein Drehmoment Δτ um die Achse des Stabes, das gegeben ist durch Δτ = r ΔF = rg Δl Δr.

(9.22)

Das gesamte Drehmoment τ ist die Summe aller solcher Teilmomente entlang eines ganzen Zylinderumfangs. Setzen wir also genügend viele Teile zusammen, sodass sich die Δl’s zu 2πr summieren, so erhalten wir als gesamtes Drehmoment für eine hohle Röhre rg(2πr) Δr.

(9.23)

Oder mithilfe von (9.21) τ = 2πμ

r3 Δrφ . L

(9.24)

Wir kommen zu dem Resultat, dass die Drehsteifigkeit τ/φ einer hohlen Röhre proportional zur dritten Potenz des Radius r und zur Dicke Δr und umgekehrt proportional zur Länge L ist. Nun können wir uns den vollen Stab aus einer Reihe von konzentrischen Röhren bestehend vorstellen, von denen jede um denselben Winkel φ verdrillt ist (obwohl die inneren Spannungen für jede Röhre andere sind). Das gesamte Drehmoment ist die Summe der Momente, die notwendig sind, um jede Schicht zu drehen; für den vollen Stab ist  φ τ = 2πμ r3 dr, L wobei das Integral von r = 0 bis r = a – dem Radius des Stabes – zu erstrecken ist. Durch Integration erhalten wir τ=μ

πa4 φ. 2L

(9.25)

Für einen Stab unter Torsion ist das Drehmoment proportional zum Winkel und zur vierten Potenz des Durchmessers – ein doppelt so dicker Stab leistet der Torsion einen sechzehnmal so großen Widerstand. Ehe wir das Thema der Torsion verlassen, wollen wir das eben Gelernte auf ein interessantes Problem anwenden – es handelt sich um Torsionswellen. Betrachten Sie einen langen Stab und verdrillen ihn plötzlich an einem Ende, so läuft eine Torsionswelle den Stab entlang, wie das Abbildung 9.10 (a) zeigt. Das ist etwas interessanter als eine stetige Torsion – sehen wir, ob wir herausfinden können, was passiert. Sei z der Abstand eines Punktes irgendwo auf dem Stab. Bei einer statischen Torsion ist das Drehmoment überall auf dem Stab gleich groß und proportional zu φ/L, dem gesamten Torsionswinkel dividiert durch die ganze Länge. Ausschlaggebend für das Material ist die lokale

9.3 Der Torsionsstab; Scherwellen

195

−(τ + Δτ)

τ

Ende 1

z

Ende 2 z

z + Δz (a) (b) Abb. 9.10: (a) Eine Torsionswelle auf einem Stab. (b) Ein Volumenelement des Stabes.

Torsionsdeformation, die, wie Sie verstehen, ∂φ/∂z ist. Ist die Torsion entlang des Stabes nicht homogen, so wird Gleichung (9.25) ersetzt durch τ(z) = μ

πa4 ∂φ . 2 ∂z

(9.26)

Sehen wir nun, was mit einem Element der Länge Δz passiert, das vergrößert in Abbildung 9.10 (b) dargestellt ist. Es gibt ein Drehmoment τ(z) am Ende 1 des kleinen Stababschnitts und ein anderes Drehmoment τ(z + Δz) am Ende 2. Wenn Δz hinreichend klein ist, können wir eine Taylorentwicklung verwenden und schreiben   ∂τ τ(z + Δz) = τ(z) + Δz. (9.27) ∂z Das Gesamtdrehmoment Δτ, das auf das kleine Stück des Stabs zwischen z und z + Δz wirkt, ist offensichtlich die Differenz zwischen τ(z) und τ(z + Δz), oder Δτ = (∂τ/∂z) Δz. Differenzieren wir (9.26), so erhalten wir Δτ = μ

πa4 ∂2 φ Δz. 2 ∂z2

(9.28)

Der Effekt dieses Gesamtdrehmoments besteht darin, dass die kleine Scheibe des Stabs eine Winkelbeschleunigung erfährt. Die Masse der Scheibe ist ΔM = (πa2 Δz)ρ, wobei ρ die Dichte des Materials ist. In Band II, Kapitel 19 haben wir berechnet, dass das Trägheitsmoment eines kreisförmigen Zylinders mr2 /2 ist; bezeichnen wir das Trägheitsmoment unseres Stückes mit ΔI, so ist ΔI =

π 4 ρa Δz. 2

(9.29)

Nach dem newtonschen Gesetz ist das Drehmoment gleich dem Trägheitsmoment mal der Winkelbeschleunigung oder Δτ = ΔI

∂2 φ . ∂t2

(9.30)

196

9 Elastizität

Kombinieren wir das alles, so erhalten wir μ

πa4 ∂2 φ π ∂2 φ Δz = ρa4 Δz 2 , 2 2 ∂z 2 ∂t

oder ∂2 φ ρ ∂2 φ − = 0. ∂z2 μ ∂t2

(9.31)

Sie erkennen darin die eindimensionale Wellengleichung. Wir haben gefunden, dass sich Torsionswellen entlang des Stabes mit der folgenden Geschwindigkeit ausbreiten: CScherung =



μ . ρ

(9.32)

Je größer die Dichte des Stabes – bei gleicher Steifigkeit – desto langsamer sind die Wellen; und je steifer der Stab, umso schneller laufen die Wellen daran entlang. Die Geschwindigkeit der Wellen hängt nicht vom Durchmesser des Stabes ab. Torsionswellen sind ein spezielles Beispiel für Scherwellen. Im Allgemeinen sind Scherwellen diejenigen, in denen die Deformationen keine Veränderung des Volumens irgendeines Teils des Materials hervorrufen. Bei Torsionswellen liegt eine spezielle Verteilung der Scherspannungen vor – sie sind kreisförmig verteilt. Aber wie auch immer die Scherspannungen angeordnet sind, die Wellen breiten sich mit derselben Geschwindigkeit aus – mit der, die in (9.32) gegeben ist. Die Seismologen haben zum Beispiel festgestellt, dass sich solche Scherwellen im Innern der Erde ausbreiten. Wir können hinsichtlich der „elastischen Welt“ im Innern eines festen Materials noch auf einen anderen Typ von Wellen treffen. Wenn wir auf einen Körper Druck ausüben, so können wir „longitudinale“ Wellen auslösen, die auch „Kompressionswellen“ genannt werden. Sie sind analog zu den Schallwellen in der Luft oder im Wasser – die Verschiebungen erfolgen in derselben Richtung wie die Wellenausbreitung. (Auf den Oberflächen eines elastischen Körpers kann es noch weitere Typen von Wellen geben – die so genannten „Rayleigh-Wellen“ oder „Love-Wellen“ (Oberflächenwellen). In diesen Wellen sind die Dehnungen weder rein longitudinal noch rein transversal. Wir werden keine Zeit haben, uns damit zu beschäftigen.) Da wir gerade beim Thema der Wellen sind: Wie groß ist die Geschwindigkeit von reinen Kompressionswellen in einem großen Festkörper wie der Erde? Wir sagen „groß“, weil die Schallgeschwindigkeit in einem dicken Körper eine andere als beispielsweise die entlang eines dünnen Stabes ist. Mit einem „dicken“ Körper meinen wir einen, in dem die transversalen Abmessungen sehr viel größer als die Wellenlänge des Schalls sind. Üben wir dann einen Druck auf einen Gegenstand aus, so kann er sich nicht seitwärts ausdehnen – er kann nur in einer Dimension zusammengedrückt werden. Glücklicherweise haben wir bereits den speziellen Fall der Kompression eines eingespannten elastischen Materials behandelt. Außerdem haben wir in Band II, Kapitel 22 die Geschwindigkeit von Schallwellen in einem Gas berechnet. Mit denselben  Überlegungen können wir sehen, dass die Schallgeschwindigkeit in einem Festkörper gleich Y � /ρ ist, wobei für den eingespannten Fall Y � der „longitudinale Modul“ ist – oder der Druck dividiert durch die relative Änderung der Länge. Das ist genau das Verhältnis von Δl/l

9.4 Der gebogene Balken

197

zu F/A, das wir in (9.20) erhalten haben. Folglich ist die Geschwindigkeit der longitudinalen Wellen gegeben durch 2 = Clong

1−σ Y Y� = . ρ (1 + σ)(1 − 2σ) ρ

(9.33)

Solange σ zwischen null und 1/2 liegt, ist der Schermodul μ kleiner als der youngsche Modul Y, und auch Y � ist größer als Y, sodass μ < Y < Y�. Das bedeutet, dass longitudinale Wellen schneller laufen als Scherwellen. Eine der genauesten Methoden, die elastischen Moduln einer Substanz zu messen, besteht darin, dass man die Dichte des Materials und die Geschwindigkeiten der beiden Wellentypen misst. Aus diesen Informationen kann man sowohl Y als auch σ ermitteln. Übrigens ist es die gemessene Differenz zwischen den Ankunftszeiten der beiden aus einem Erdbeben stammenden Wellentypen, aus der ein Seismologe – sogar aus Signalen nur einer Station – die Entfernung des Bebens abschätzen kann.

9.4

Der gebogene Balken

Betrachten wir nun eine andere praktische Situation – die Biegung eines Stabes oder eines Balkens. Wie groß sind die Kräfte, wenn wir einen Stab mit beliebigem Querschnitt biegen? Wir werden bei der Behandlung dieses Problems von einem Stab mit einem kreisförmigen Querschnitt ausgehen, aber unser Resultat wird auch für jede Form gelten. Um jedoch Zeit zu sparen, machen wir einige Abkürzungen, sodass die Theorie, zu der wir gelangen, nur approximativ ist. Unsere Resultate werden nur dann richtig sein, wenn der Radius der Biegung viel größer als der Durchmesser des Balkens ist. L

R

Abb. 9.11: Ein gebogener Balken.

Stellen Sie sich vor, Sie fassen die beiden Enden eines geraden Stabes und biegen ihn zu einer Kurve wie die in Abbildung 9.11. Was geht im Innern des Stabes vor sich? Nun, wird er gebogen, so bedeutet das, dass das Material auf der inneren Seite der Kurve zusammengedrückt und das Material auf der äußeren Seite gedehnt wird. Dabei gibt es eine Fläche, die mehr oder weniger parallel zur Achse des Stabes liegt und weder gedehnt noch zusammengedrückt wird.

198

9 Elastizität

Diese Fläche nennt man die neutrale Fläche. Sie erwarten, dass diese Fläche in der Nähe der „Mitte“ des Querschnitts liegt. Es kann gezeigt werden (aber wir werden es hier nicht tun), dass die neutrale Fläche bei geringer Biegung von einfachen Balken durch den „Schwerpunkt“ des Querschnitts geht. Das gilt nur für „reine“ Biegung – wenn sich der Balken nicht zur gleichen Zeit dehnt oder zusammendrückt. θ � � + Δ�

Δy F

(a)

(b) R

neutrale Fläche

y neutrale Fläche

Abb. 9.12: (a) Kleines Segment eines gebogenen Balkens. (b) Querschnitt des Balkens.

Bei reiner Biegung wird ein dünnes transversales Stück des Stabes wie in Abbildung 9.12 (a) verzerrt. Das Material unterhalb der neutralen Fläche zeigt dann eine Kompressionsdeformation, die proportional zum Abstand von der neutralen Fläche ist; und das Material oberhalb wird gedehnt, ebenfalls proportional zum Abstand von der neutralen Fläche. Also ist die longitudinale Dehnung Δl proportional zur Höhe y. Die Proportionalitätskonstante ist nichts anderes als l dividiert durch den Krümmungsradius des Stabes – siehe Abbildung 9.12: Δl y = . l R Folglich ist auch die Kraft pro Flächeneinheit – die Spannung – in einem kleinen Streifen auf der Höhe von y proportional zum Abstand von der neutralen Fläche: ΔF y =Y . ΔA R

(9.34)

Betrachten wir nun die Kräfte, die eine solche Dehnung hervorrufen. Die Kräfte, die auf das kleine Segment in Abbildung 9.12 wirken, sind in der Abbildung dargestellt. Stellen wir uns einen transversalen Schnitt vor, so wirken die Kräfte oberhalb der neutralen Fläche in der einen Richtung und unterhalb in der anderen Richtung. Sie treten in Paaren auf und erzeugen das „Biegemoment“ M – damit bezeichnen wir das Drehmoment um die neutrale Linie. Das Gesamtmoment können wir berechnen, indem wir die Kraft mal dem Abstand von der neutralen Fläche für eine der Seitenflächen des Kreisausschnitts von Abbildung 9.12 integrieren:  M= y dF. (9.35) Querschnitt

Laut (9.34) ist dF = Yy/R dA, sodass  Y y2 dA. M= R

9.4 Der gebogene Balken

199

Abb. 9.13: Ein „I“-Balken.

Das Integral von y2 dA ist das, was wir das „Trägheitsmoment“ des geometrischen Querschnitts um eine horizontale Achse durch seinen „Schwerpunkt“ nennen können;2 wir bezeichnen es mit I: M= I=

YI R

(9.36) y2 dA.

(9.37)

Die Gleichung (9.36) gibt uns dann die Relation zwischen dem Biegemoment M und der Krümmung 1/R des Balkens. Die „Steifigkeit“ des Balkens ist proportional zu Y und zum Trägheitsmoment I. Mit anderen Worten: Wollen Sie mit einer gegebenen Menge von, sagen wir, Aluminium einen so steifen Balken wie möglich erhalten, so müssen Sie so viel wie möglich von dem Material so weit wie möglich von der neutralen Fläche entfernt anbringen, um ein großes Trägheitsmoment zu erzielen. Sie können das jedoch nicht bis ins Extreme steigern, denn dann krümmt sich das Objekt nicht so, wie wir angenommen haben – es wird knicken oder sich verdrillen und wieder schwächer werden. Aber nun verstehen Sie, warum Balken für Bauten in der Form eines I oder eines H gefertigt sind – vgl. Abbildung 9.13. L x

z

W

Abb. 9.14: Ein eingespannter Balken mit einem Gewicht an einem Ende.

Als Beispiel für die Anwendung unserer Balken-Gleichung (9.36) berechnen wir nun die Beugung eines eingespannten Balkens, auf dessen freies Ende eine Kraft W wirkt, wie es in Abbildung 9.14 skizziert ist. (Mit „eingespannt“ meinen wir einfach, dass der Balken so unterstützt wird, dass sowohl sein Ort als auch seine Steigung an einem Ende fest sind – er steckt beispielsweise in einer Mauer aus Zement.) Welche Form nimmt der Balken an? Bezeichnen wir die Ablenkung im Abstand x vom festen Ende mit z; wir suchen also z(x). Wir werden es nur für kleine Ablenkungen berechnen. Außerdem werden wir annehmen, dass der Balken lang im Vergleich zu seinem Querschnitt ist. Wie Sie aus Ihren Mathematikvorlesungen wissen, ist die 2

Natürlich handelt es sich in Wirklichkeit um das Trägheitsmoment einer Scheibe mit der Masse eins pro Flächeneinheit.

200

9 Elastizität

Krümmung 1/R einer Kurve z(x) gegeben durch 1 d2 z/dx2 = . (9.38) R [1 + (dz/dx)2]3/2 Da wir nur an kleinen Steigungen interessiert sind – das ist gewöhnlich bei technischen Bauten der Fall – vernachlässigen wir (dz/dx)2 im Vergleich zu 1 und verwenden 1 d2 z = 2. (9.39) R dx Außerdem müssen wir das Biegemoment M kennen. Es ist eine Funktion von x, da es gleich dem Drehmoment um die neutrale Achse jedes Querschnitts ist. Vernachlässigen wir das Gewicht des Balkens und berücksichtigen nur die nach unten wirkende Kraft W am Ende des Balkens. (Sie können das Balkengewicht selbst einführen, wenn Sie wollen.) Das Biegemoment im Abstand x ist dann M(x) = W(L − x),

denn das ist das vom Gewicht W um den Punkt x ausgeübte Drehmoment – das Drehmoment, das der Balken an der Stelle x aushalten muss. Wir erhalten YI d2 z W(L − x) = = YI 2 R dx oder d2 z W (L − x). (9.40) = dx2 YI Diese Gleichung können wir ohne Weiteres integrieren; wir erhalten   W Lx2 x3 − , (9.41) z= YI 2 6 wobei wir unsere Annahmen verwenden, dass z(0) = 0 und dass dz/dx bei x = 0 ebenfalls null ist. Das ist die Form des Balkens. Die Verschiebung des Endes ist W L3 ; YI 3 die Verschiebung des Balkenendes nimmt mit der dritten Potenz der Länge zu. z(L) =

(9.42)

Bei unserer angenäherten Theorie des Balkens haben wir angenommen, dass sich der Querschnitt des Balkens nicht ändert, wenn der Balken gebogen wird. Ist die Dicke des Balkens klein im Vergleich zum Krümmungsradius, so ändert sich der Querschnitt nur sehr wenig und unser Resultat ist in Ordnung. Im Allgemeinen kann dieser Effekt jedoch nicht vernachlässigt werden, wovon Sie sich selbst leicht überzeugen können, wenn Sie einen weichen Radiergummi zwischen Ihren Fingern biegen. War der Querschnitt ursprünglich rechteckig, so stellen Sie nun fest, dass er sich auf der unteren Seite ausbeult, wenn er gebogen wird (siehe Abbildung 9.15). Das passiert, weil sich das Material seitlich ausdehnt, wenn es auf der unteren Seite zusammengedrückt wird – wie es durch die Poisson-Zahl beschrieben wird. Gummi ist leicht zu biegen oder zu dehnen, aber er ist insofern einer Flüssigkeit ähnlich, als es schwer ist, sein Volumen zu ändern – das wird sehr schön deutlich, wenn Sie den Radiergummi biegen. Für ein inkompressibles Material wäre die Poisson-Zahl genau 1/2 – für Gummi liegt sie sehr nahe bei diesem Wert.

9.5 Knicken

201 A

(a)

A

(b)

Abb. 9.15: (a) Ein gebogener Radiergummi; (b) Querschnitt.

9.5

Knicken

Verwenden wir nun unsere Theorie des Balkens, um die Theorie des „Knickens“ von Balken oder Säulen oder Stäben zu verstehen. Betrachten wir die in Abbildung 9.16 skizzierte Situation, in der ein normalerweise gerader Stab von zwei entgegengesetzten Kräften, die auf die Stabenden einwirken, in einer gebogenen Form gehalten wird. Wir möchten die Form des Stabes und den Betrag der Kräfte an den Enden berechnen. P

F x

y

F L

Abb. 9.16: Ein geknickter Stab.

Die Abweichung des Stabes von der geraden Linie durch die Enden sei y(x), wobei x der Abstand von einem Ende des Stabes ist. Das Biegemoment M am Punkt P in der Abbildung ist gleich der Kraft F multipliziert mit dem Kraftarm, der der senkrechte Abstand y ist, M(x) = Fy.

(9.43)

Mithilfe der Balken-Gleichung (9.36) finden wir YI = Fy. R

(9.44)

Für kleine Abweichungen können wir 1/R = −d2 y/dx2 setzen (mit Minuszeichen, weil die Krümmung nach unten erfolgt). Wir erhalten F d2 y = − y, 2 YI dx

(9.45)

und das ist die Differentialgleichung einer Sinuswelle. Für kleine Abweichungen ist also die Kurve eines solchen gebogenen Balkens eine Sinuskurve. Die „Wellenlänge“ λ der Sinuswelle

202

9 Elastizität

ist zweimal der Abstand L zwischen den Enden. Ist die Biegung gering, so ist das gerade das Doppelte der Länge des gebogenen Stabes. Somit ist die Kurve y = K sin πx/L. Bilden wir die zweite Ableitung, so erhalten wir d2 y π2 = − 2 y. 2 dx L Ein Vergleich mit (9.45) gibt uns die Kraft F = π2

YI . L2

(9.46)

Für kleine Biegungen ist die Kraft unabhängig von der Verschiebung infolge der Biegung y! Physikalisch haben wir dann den folgenden Sachverhalt: Ist die Kraft kleiner als das in (9.46) gegebene F, so gibt es gar keine Biegung. Ist sie aber geringfügig größer als diese Kraft, so biegt sich das Material um einen großen Betrag – das heißt, für Kräfte oberhalb der kritischen Kraft π2 YI/L2 (oft auch die „Euler-Kraft“ genannt) „knickt“ der Balken. Übersteigt die Belastung in der zweiten Etage eines Gebäudes die Euler-Kraft für die tragenden Balken, so bricht das Gebäude zusammen. Eine äußerst wichtige Rolle spielt die Knickungskraft auch bei Raketen. Einerseits muss die Rakete in der Lage sein, ihr eigenes Gewicht auf der Abschussrampe zu halten und die Spannungen während der Beschleunigung auszuhalten; andererseits ist es wichtig, dass das Gewicht der Konstruktion so klein wie möglich gehalten wird, damit der Spielraum für die Nutzlast und die Treibstoffkapazität so groß wie möglich wird. In Wirklichkeit bricht ein Balken nicht notwendigerweise völlig zusammen, wenn die Kraft die Euler-Kraft übersteigt. Werden die Verschiebungen groß, so ist die Kraft größer als die, die wir gefunden haben, und zwar aufgrund der Ausdrücke in Gleichung (9.38) für 1/R, die wir vernachlässigt haben. Um die Kräfte für eine große Biegung des Balkens zu ermitteln, müssen wir zu der genauen Gleichung (9.44) zurückkehren, die wir früher hatten, bevor wir die angenäherte Relation zwischen R und y verwendeten. Gleichung (9.44) hat eine ziemlich einfache geometrische Eigenschaft.3 Sie ist etwas schwierig herauszufinden, aber sehr interessant. Anstatt die Kurve durch x und y zu beschreiben, können wir zwei neue Variablen verwenden: S , den Abstand entlang der Kurve, und θ, die Steigung der Tangente an die Kurve. Siehe Abbildung 9.17. Die Krümmung ist die Änderungsrate des Winkels mit dem Abstand: 1 dθ = . R dS Daher können wir die exakte Gleichung (9.44) in der folgenden Form schreiben: F dθ = − y. dS YI 3

Dieselbe Gleichung tritt übrigens auch in anderen physikalischen Situationen auf – zum Beispiel beim Meniskus an der Oberfläche einer Flüssigkeit, die sich zwischen parallelen Ebenen befindet – dieselbe geometrische Lösung kann verwendet werden.

9.5 Knicken

203 te gen Tan

P

S

θ

R Abb. 9.17: Die Koordinaten S und θ für die Kurve eines gebogenen Balkens.

Bilden wir die Ableitung dieser Gleichung nach S und ersetzen dy/dS durch sin θ, so erhalten wir d2 θ F = − sin θ. YI dS 2

(9.47)

(Ist θ klein, so erhalten wir wieder (9.45). Es ist alles in Ordnung.) Ob Sie sich nun darüber freuen oder nicht, aber (9.47) ist genau dieselbe Gleichung, die Sie für Pendelschwingungen mit großer Amplitude erhalten – wobei natürlich F/YI durch eine andere Konstante ersetzt wird. Es ist lange her, dass wir in Band I, Kapitel 9 gelernt haben, wie man die Lösung einer solchen Gleichung mithilfe einer numerischen Berechnung findet.4 Die Lösungen, die Sie erhalten, sind faszinierende Kurven – die als „Elastika“-Kurven bekannt sind. Abbildung 9.18 zeigt drei Kurven für verschiedene Werte von F/YI.

F1

F1

F2

F3

4

F2

F3

Abb. 9.18: Kurven eines gebogenen Stabes.

Die Lösungen können durch gewisse Funktionen, die so genannten „Jakobischen elliptischen Funktionen“, ausgedrückt werden, die schon ein Anderer ausgerechnet hat.

10

Elastische Materialien

Siehe auch: Ch. Kittel, Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München

10.1

Der Dehnungstensor

Im vorangegangenen Kapitel sprachen wir über die Dehnung spezieller elastischer Objekte. In diesem Kapitel wollen wir betrachten, was im Innern eines elastischen Materials allgemein passieren kann. Wir möchten in der Lage sein, die Spannungs- und Dehnungsbedingungen im Innern eines großen Klumpens Gelatine zu beschreiben, der auf irgendeine komplizierte Weise verdreht und zusammengepresst wird. Dazu müssen wir die lokale Dehnung an jedem Punkt in einem elastischen Körper beschreiben können; wir können das erreichen, indem wir jedem Punkt des Materials ein System von sechs Zahlen zuordnen – die die Komponenten eines symmetrischen Tensors bilden. Früher (Kapitel 2) haben wir von dem Spannungstensor gesprochen; jetzt brauchen wir den Dehnungstensor. nachher

vorher

P P

Flocke r

r



� u P

Flocke Abb. 10.1: Eine Flocke des Materials befindet sich in einem nicht-deformierten Block am Punkt P und bewegt sich bei Deformation des Blocks nach P� .

Stellen Sie sich vor, dass wir von einem anfangs nicht-deformierten Material ausgehen und dann im Verlauf der Deformation die Bewegung einer kleinen „Schmutz“-flocke verfolgen, die in dem Material enthalten ist. Eine Flocke, die sich am Punkt P in r = (x, y, z) befand, bewegt sich zu einem neuen Punkt P� an die Stelle r� = (x� , y� , z� ), wie das Abbildung 10.1 zeigt. Wir nennen u die Vektorverschiebung von P nach P� . Dann ist u = r� − r.

(10.1)

Die Verschiebung u hängt natürlich davon ab, von welchem Punkt P wir ausgehen, und folglich ist u eine vektorielle Funktion von r – oder, wenn Sie wollen, von (x, y, z).

206

10 Elastische Materialien vorher

P

Δl

l nachher

P

u

P

x

Abb. 10.2: Eine homogene Deformation vom Typ einer Dehnung.

ux

Betrachten wir zuerst eine einfache Situation, bei der die Deformation im ganzen Material konstant ist – sodass wir es mit einer so genannten homogenen Deformation zu tun haben. Nehmen Sie beispielsweise an, dass wir einen Block eines Materials gleichförmig dehnen. Es handelt sich lediglich um eine gleichförmige Änderung seiner Abmessungen in einer Richtung – etwa in der x-Richtung wie in Abbildung 10.2. Die Bewegung u x einer Flocke in x ist proportional zu x. Also ist u x Δl = . x l Wir werden u x in folgender Form schreiben: u x = e xx x. Die Proportionalitätskonstante e xx ist natürlich dasselbe wie Δl/l. (Sie werden gleich sehen, warum wir einen doppelten Index verwenden.) Ist die Deformation nicht gleichförmig, so ändert sich die Beziehung zwischen u x und x in dem Material von Punkt zu Punkt. Für den allgemeinen Fall definieren wir e xx durch eine Art lokales Δl/l und schreiben somit e xx = ∂u x /∂x.

(10.2)

Diese Zahl – die nun eine Funktion von x, y und z ist – beschreibt das Ausmaß der Dehnung in der x-Richtung in einer Portion Gelatine. Es kann natürlich auch eine Dehnung in der y- und z-Richtung vorliegen. Wir beschreiben diese durch die Zahlen eyy =

∂uy , ∂y

ezz =

∂uz . ∂z

(10.3)

10.1 Der Dehnungstensor

207

P vorher

nachher

P

u P�

θ 2

Abb. 10.3: Eine homogene Scherungsdeformation.

θ 2

Ferner müssen wir Deformationen vom Typ der Scherung beschreiben können. Stellen wir uns einen kleinen Würfel vor, der in der anfangs ungestörten Gelatine markiert ist. Wird die Gelatine verformt, so kann aus dem Würfel ein Parallelogramm werden, wie es in Abbildung 10.3 dargestellt ist.1 Bei dieser Art von Deformation ist die x-Bewegung jedes Teilchens proportional zu seiner y-Koordinate, ux =

θ y. 2

(10.4)

Und es gibt auch eine y-Bewegung proportional zu x, uy =

θ x. 2

(10.5)

Folglich können wir eine Deformation vom Typ einer Scherung auf die folgende Weise beschreiben: u x = e xy y,

uy = eyx x

mit e xy = eyx =

θ . 2

Bei inhomogenen Deformationen könnte man glauben, dass man die verallgemeinerten Scherdeformationen beschreiben kann, indem man die Größen e xy und eyx definiert durch e xy =

∂u x , ∂y

eyx =

∂uy . ∂x

(10.6)

Aber da gibt es eine Schwierigkeit. Nehmen Sie an, die Verschiebungen u x und uy seien gegeben durch ux = 1

θ y, 2

θ uy = − x . 2

Wir ziehen es im Augenblick vor, den gesamten Scherwinkel θ in zwei gleiche Teile aufzuteilen und die Deformation bezüglich x und y symmetrisch auszuführen.

208

10 Elastische Materialien

Sie sind also dieselben wie in (10.4) und (10.5), nur dass das Vorzeichen von uy entgegengesetzt ist. Bei diesen Verschiebungen wird ein kleiner Würfel in der Gelatine einfach um den Winkel θ/2 gedreht, siehe Abbildung 10.4. Es liegt keinerlei Deformation vor – nur eine Rotation im Raum. Das Material ist nicht verzerrt; die relative Lage aller Atome ist völlig unverändert. Wir müssen unsere Definitionen irgendwie so treffen, dass reine Rotationen in unseren Definitionen einer Scherdeformation nicht enthalten sind. Der springende Punkt ist der: Sind ∂uy /∂x und ∂u x /∂y entgegengesetzt gleich, so tritt keine Deformation auf; folglich können wir die Dinge in Ordnung bringen, wenn wir definieren e xy = eyx = 12 (∂uy /∂x + ∂u x /∂y). Bei einer reinen Drehung sind beide Größen null, doch bei einer reinen Scherung erhalten wir e xy gleich eyx , wie es uns gerechtfertigt erscheint.

P vorher

P nachher θ 2

Abb. 10.4: Eine homogene Rotation – ohne Deformation.

u

P

θ 2

Bei einer Verzerrung der allgemeinsten Form – die eine Dehnung oder Kompression und auch eine Scherung enthalten kann – definieren wir den Zustand der Deformation mithilfe von neun Zahlen ∂u x , ∂x ∂uy , = ∂y .. .

e xx = eyy

(10.7)

e xy = 12 (∂uy /∂x + ∂u x /∂y), .. . Das sind die Komponenten des Dehnungstensors. Da es sich um einen symmetrischen Tensor handelt – gemäß unseren Definitionen ist immer e xy = eyx –, handelt es sich in Wirklichkeit nur um sechs verschiedene Zahlen. Sie erinnern sich daran (siehe Kapitel 2), dass das allgemeine Charakteristikum eines Tensors darin besteht, dass sich seine Komponenten wie die Produkte der Komponenten von zwei Vektoren transformieren. (Sind A und B Vektoren, so ist Ci j = Ai B j

10.2 Der Elastizitätstensor

209

ein Tensor.) Jeder Ausdruck von ei j ist ein Produkt (oder die Summe von solchen Produkten) der Komponenten des Vektors u = (u x , uy , uz ) und des Operators ∇ = (∂/∂x, ∂/∂y, ∂/∂z), von dem wir wissen, dass er sich wie ein Vektor transformiert. Setzen wir x1 , x2 und x3 für x, y und z und u1 , u2 und u3 für u x , uy und uz ; wir können dann den allgemeinen Ausdruck ei j des Dehnungstensors schreiben als ei j = 21 (∂u j /∂xi + ∂ui ∂x j ),

(10.8)

wobei i und j die Werte 1, 2 oder 3 annehmen können. Liegt eine homogene Deformation vor – was sowohl Dehnung als auch Scherung einbeziehen kann –, so sind alle ei j Konstanten, und wir können schreiben u x = e xx x + e xy y + e xz z.

(10.9)

(Wir wählen unseren Ursprung an dem Punkt, in dem u null ist.) In diesem Fall liefert der Dehnungstensor ei j die Beziehung zwischen zwei Vektoren: zwischen dem Koordinatenvektor r = (x, y, z) und dem Verschiebungsvektor u = (u x , uy , uz ). Sind die Deformationen inhomogen, so kann jede Portion Gelatine außerdem eine Torsion erfahren – es gibt eine lokale Rotation. Sind alle Verzerrungen klein, so haben wir  Δui = (ei j − ωi j ) Δx j , (10.10) j

wobei ωi j ein antisymmetrischer Tensor ist, ωi j = 12 (∂u j /∂xi − ∂ui /∂x j ),

(10.11)

der die Rotation beschreibt. Wir wollen uns jedoch nicht mehr um Rotationen kümmern, sondern nur noch um Deformationen, die durch den symmetrischen Tensor ei j beschrieben werden.

10.2

Der Elastizitätstensor

Wir haben die Deformationen beschrieben; setzen wir sie nun zu den inneren Kräften in Beziehung – zu den Spannungen in dem Material. Für jedes kleine Stück Material nehmen wir an, dass das hookesche Gesetz gilt, also sagen wir, dass die Spannungen proportional zu den Dehnungen sind. In Kapitel 2 definierten wir den Spannungstensor S i j als die i-te Komponente der Kraft durch eine Flächeneinheit senkrecht zur j-Achse. Laut hookeschem Gesetz ist jede Komponente von S i j mit jeder Dehnungskomponente linear verknüpft. Da S und e beide neun Komponenten haben, existieren 9 × 9 = 81 mögliche Koeffizienten, die die elastischen Eigenschaften des Materials beschreiben. Sie sind Konstanten, sofern das Material selbst homogen ist. Wir schreiben diese Koeffizienten als Ci jkl und definieren sie durch die Gleichung  S ij = Ci jkl ekl , (10.12) k,l

wobei i, j, k, l alle die Werte 1, 2 oder 3 annehmen. Da die Koeffizienten Ci jkl einen Tensor zu einem anderen in Beziehung setzen, bilden sie gleichfalls einen Tensor – einen Tensor vierter Stufe. Wir können ihn den Elastizitätstensor nennen.

210

10 Elastische Materialien

Nehmen wir an, dass alle C’s bekannt sind und dass Sie eine komplizierte Kraft auf ein Objekt mit einer ausgefallenen Form wirken lassen. Es werden alle möglichen Verzerrungen auftreten und am Ende wird dieses Objekt eine irgendwie verdrehte Form haben. Welches sind die Dehnungen? Sie können sehen, dass es sich um ein kompliziertes Problem handelt. Wären die Dehnungen bekannt, so könnten Sie die Spannungen aus (10.12) berechnen – oder umgekehrt. Aber die resultierenden Spannungen und Dehnungen an jedem Punkt hängen davon ab, was im ganzen übrigen Material passiert. Um das Problem zu lösen, geht man am besten von der Energie aus. Gibt es eine Kraft F proportional einer Verschiebung x, sagen wir F = kx, so ist die für eine Verschiebung x erforderliche Arbeit kx2 /2. Auf analoge Weise erhalten wir für die Arbeit w, die pro Volumeneinheit eines verzerrten Materials aufgewendet wird,  w = 12 Ci jkl ei j ekl . (10.13) i jkl

Die gesamte Arbeit W, die bei der Verzerrung des Körpers geleistet wird, ist das Integral von w über das Volumen:   1 Ci jkl ei j ekl dV. (10.14) W= 2 i jkl

Hierbei handelt es sich um die potentielle Energie, die in den inneren Spannungen des Materials gespeichert ist. Befindet sich dann ein Körper im Gleichgewicht, so muss diese innere Energie ihren Minimalwert annehmen. Folglich kann das Problem des Auffindens der Deformationen in einem Körper gelöst werden, indem man jenes System von Verschiebungen u im ganzen Körper ermittelt, für das W seinen Minimalwert annimmt. In Band III, Kapitel 19 haben wir einige allgemeine Konzepte der Variationsrechnung angeführt, die bei der Behandlung von Minimalwertproblemen wie diesem angewendet werden. Wir können hier keine weiteren Einzelheiten zu diesem Problem angeben. Was uns jetzt hauptsächlich interessiert, sind die allgemeinen Eigenschaften des Elastizitätstensors. Zunächst einmal ist klar, dass es in Wirklichkeit nicht 81 verschiedene Komponenten in Ci jkl gibt. Da sowohl S i j als auch ei j symmetrische Tensoren sind, die jeder nur sechs verschiedene Komponenten haben, kann es in Ci jkl höchstens 36 verschiedene Komponenten geben. Gewöhnlich sind es jedoch viel weniger. Betrachten wir den speziellen Fall eines kubischen Kristalls. Seine Energiedichte w beginnt wie folgt:  w = 21 C xxxx e2xx + C xxxy e xx e xy + C xxxz e xx e xz + C xxyx e xx e xy + C xxyy e xx eyy . . . etc. . . .  + Cyyyy e2yy + . . . etc. . . . etc. . . . , (10.15)

mit insgesamt 81 Termen! Aber ein kubischer Kristall hat gewisse Symmetrien. Insbesondere hat er dieselben physikalischen Eigenschaften, wenn er um 90◦ gedreht wird. Seine Steifigkeit bei Dehnung in der y-Richtung ist dieselbe wie bei Dehnung in der x-Richtung. Vertauschen wir daher unsere Definition der Koordinatenrichtungen x und y in (10.15), so kann sich die Energie nicht ändern. Also ist für einen kubischen Kristall C xxxx = Cyyyy = Czzzz .

(10.16)

10.2 Der Elastizitätstensor

211

Als Nächstes können wir zeigen, dass Komponenten wie C xxxy null sein müssen. Ein kubischer Kristall hat die Eigenschaft, dass er bei Spiegelung an einer Ebene senkrecht zu einer der Achsen symmetrisch ist. Ersetzen wir y durch −y, so ändert sich nichts. Ändern wir aber y in −y ab, so wird e xy zu −e xy – eine Verschiebung, die vorher in der +y-Richtung lag, zeigt nun in die −y-Richtung. Soll die Energie unverändert bleiben, so muss bei Spiegelung C xxxy zu −C xxxy werden. Doch ein gespiegelter Kristall ist der gleiche wie zuvor, also muss C xxxy dasselbe wie −C xxxy sein. Das kann nur dann eintreten, wenn C xxxy null ist.

Sie werden sagen: „Aber mit derselben Überlegung ist auch Cyyyy = 0!“ Nein, denn es gibt vier y’s. Das Vorzeichen ändert sich für jedes y einmal, und vier mal Minus macht ein Plus. Sind zwei oder vier y’s vorhanden, so muss der Ausdruck nicht null sein. Er verschwindet nur dann, wenn eines oder drei y’s auftreten. Für einen kubischen Kristall hat somit jede von null verschiedene Komponente von C nur eine gerade Anzahl von identischen Indizes. (Unsere Überlegungen für y gelten offensichtlich auch für x und z. Wir können es dann mit Ausdrücken zu tun haben wie C xxyy , C xyxy , C xyyx und so fort. Wir haben jedoch bereits gezeigt, dass wir bei Ersetzen aller x’s durch y’s und umgekehrt (oder aller z’s durch x’s und so weiter) – für einen kubischen Kristall – dieselbe Zahl erhalten müssen. Dies bedeutet, dass es nur drei verschiedene Möglichkeiten für Komponenten ungleich null gibt: C xxxx (= Cyyyy = Czzzz ), C xxyy (= Cyyxx = C xxzz , etc.), C xyxy (= Cyxyx = C xzxz , etc.). Für einen kubischen Kristall sieht dann die Energiedichte wie folgt aus: � w = 21 C xxxx (e2xx + e2yy + e2zz ) + 2C xxyy (e xx eyy + eyy ezz + ezz e xx ) � + 4C xyxy (e2xy + e2yz + e2zx ) .

(10.17)

(10.18)

Für ein isotropes – das heißt, nichtkristallines – Material ist die Symmetrie noch höher. Die C’s müssen bei jeglicher Wahl des Koordinatensystems dieselben sein. Es stellt sich dann heraus, dass eine weitere Relation zwischen den C’s existiert, und diese ist C xxxx = C xxyy + 2C xyxy .

(10.19)

Dass das so ist, können wir anhand der folgenden allgemeinen Überlegung sehen. Der Spannungstensor S i j muss mit ei j in einer Weise verknüpft sein, die nicht im geringsten von den Koordinatenrichtungen abhängt – die Beziehung darf nur skalare Größen enthalten. „Das ist einfach“, werden Sie sagen. „Die einzige Möglichkeit, S i j aus ei j zu erhalten, ist durch Multiplikation mit einer skalaren Konstanten. Dabei handelt es sich einfach um das hookesche Gesetz. Es muss also S i j = (Konstante)ei j sein.“ Aber das ist nicht ganz richtig; auch der Einheitstensor δi j , multipliziert mit einem Skalar, der linear mit ei j zusammenhängt, kann auftreten. Die � einzige in den e’s lineare Invariante, die Sie bilden können, ist eii . (Sie transformiert sich wie x2 + y2 + z2 , was ein Skalar ist.) Somit ist die allgemeinste Form der Gleichung, die – für isotrope Materialien – S i j mit ei j verknüpft, ⎛ ⎞ ⎜⎜⎜� ⎟⎟⎟ (10.20) S i j = 2μei j + λ ⎜⎜⎝ ekk ⎟⎟⎠ δi j . k

212

10 Elastische Materialien

(Die erste Konstante wird gewöhnlich als zwei mal μ geschrieben; dann ist der Koeffizient μ gleich dem Schermodul, den wir im vorigen Kapitel definiert haben.) Die Konstanten μ und λ heißen die laméschen Elastizitätskonstanten. Beim Vergleich von (10.20) mit (10.12) sehen Sie, dass C xxyy = λ, C xyxy = μ, C xxxx = 2μ + λ.

(10.21)

Somit haben wir bewiesen, dass Gleichung (10.19) tatsächlich richtig ist. Außerdem sehen Sie, dass die elastischen Eigenschaften eines isotropen Materials durch zwei Konstanten vollständig gegeben sind, wie wir im vorigen Kapitel behauptet haben. Die C’s können durch beliebige zwei der elastischen Konstanten ausgedrückt werden, die wir früher verwendet haben, zum Beispiel durch den Youngschen Modul Y und die Poisson-Zahl σ. Wir überlassen es Ihnen zu zeigen, dass σ  Y  C xxxx = 1+ , 1+σ 1 − 2σ   Y σ C xxyy = , (10.22) 1 + σ 1 − 2σ Y C xyxy = . 2(1 + σ)

10.3

Bewegungen in einem elastischen Körper

Volumen V Fläche A

Abb. 10.5: Ein kleines Volumenelement V, umgrenzt von der Fläche A.

Wir haben gesagt, dass sich in einem elastischen Körper im Gleichgewicht die inneren Spannungen so anpassen, dass die Energie einen Minimalwert annimmt. Schauen wir nun, was passiert, wenn sich die inneren Kräfte nicht im Gleichgewicht befinden. Betrachten wir ein kleines Stück des Materials, das in einer Fläche A enthalten ist. (Siehe Abbildung 10.5.) Befindet sich das Stück im Gleichgewicht, so muss die darauf wirkende Gesamtkraft F null sein. Wir können

10.3 Bewegungen in einem elastischen Körper

213

uns diese Kraft als aus zwei Teilen bestehend vorstellen. Der eine Teil könnte auf „äußere“ Kräfte wie die Schwerkraft zurückgehen, die aus einem größeren Abstand auf die Materie des Stücks wirken und dort eine Kraft pro Volumeneinheit f äuß erzeugen. Die gesamte äußere Kraft Fäuß ist dann das Integral von f äuß über das Volumen des Stücks:  Fäuß = f äuß dV. (10.23) Im Gleichgewicht würde diese Kraft durch die Gesamtkraft Finn aus dem Nachbarmaterial ausgeglichen werden, die durch die Fläche A wirkt. Befindet sich das Stück nicht im Gleichgewicht – ist es also in Bewegung –, so ist die Summe der inneren und der äußeren Kräfte gleich der Masse mal der Beschleunigung. Wir haben dann  Fäuß + Finn = ρ r¨ dV, (10.24) wobei ρ die Dichte des Materials und r¨ seine Beschleunigung ist. Wir können nun die Gleichungen (10.23) und (10.24) zusammenfassen und schreiben  Finn = (− f äuß + ρ r¨ ) dV. (10.25) v

Diese Schreibweise können wir vereinfachen, indem wir definieren f = − f äuß + ρ r¨.

(10.26)

Gleichung (10.25) lautet dann  f dV. Finn =

(10.27)

v

Was wir Finn genannt haben, ist mit den Spannungen im Material verknüpft. Der Spannungstensor S i j wurde (in Kapitel 2) so definiert, dass die x-Komponente der Kraft dF x , die auf ein Flächenelement da wirkt und deren Einheitsnormale n ist, gegeben ist durch dF x = (S xx n x + S xy ny + S xz nz ) da.

(10.28)

Die x-Komponente von Finn auf unser kleines Stück ist dann das Integral von dF x über die Fläche. Wenn wir das in die x-Komponente von (10.27) einsetzen, erhalten wir   (S xx n x + S xy ny + S xz nz ) da = f x dV. (10.29) A

v

Wir haben ein Flächenintegral, das in Beziehung zu einem Volumenintegral steht – dabei erinnern wir uns an etwas, das wir in der Elektrodynamik gelernt haben. Beachten Sie: Wird der erste Index x von jedem der S ’s auf der linken Seite von Gleichung (10.29) weggelassen, so sieht das genauso aus wie das Integral einer Größe „S“ · n – das heißt, der Normalkomponente eines Vektors – über die geschlossene Fläche. Das wäre der Fluss von „S“ aus dem Volumen. Und das könnte mithilfe des gaußschen Satzes als das Volumenintegral der Divergenz von „S“

214

10 Elastische Materialien

geschrieben werden. Das ist tatsächlich richtig, ob der x-Index nun auftritt oder nicht – es handelt sich lediglich um ein mathematisches Theorem, das man durch partielle Integration erhält. Mit anderen Worten: Wir können Gleichung (10.29) abändern in     ∂S xx ∂S xy ∂S xz + + dV = f x dV. (10.30) ∂x ∂y ∂z v v Nun können wir die Volumenintegrale weglassen und sehreiben die Differentialgleichung für die allgemeine Komponente von f als fi =

 ∂S i j j

∂x j

.

(10.31)

Das sagt uns, in welcher Beziehung die Kraft pro Volumeneinheit zum Spannungstensor S i j steht. Die Theorie der Bewegungen im Innern eines Festkörpers folgt diesem Gedankengang. Kennen wir die anfänglichen Verschiebungen – gegeben etwa durch u –, so können wir die Dehnungen ei j berechnen. Aus den Dehnungen können wir mithilfe von (10.12) die Spannungen erhalten. Die Spannungen liefern uns die Kraftdichte f gemäß (10.31). Kennen wir f , so können wir aus (10.26) die Beschleunigung r¨ des Materials berechnen, die darüber Auskunft gibt, wie sich die Verschiebungen ändern. Fassen wir alles zusammen, so erhalten wir die fürchterliche Bewegungsgleichung für einen elastischen Festkörper. Wir schreiben nur einfach die Resultate an, die wir für ein isotropes Material erhalten. Verwenden Sie (10.20) für S i j und schreiben ei j in der Form 21 (∂ui /∂x j + ∂u j /∂xi ), so gelangen Sie zu der Vektorgleichung f = (λ + μ) ∇( ∇ · u) + μ∇2 u.

(10.32)

Sie können tatsächlich sehen, dass die Gleichung, die f mit u verknüpft, diese Form haben muss. Die Kraft muss von den zweiten Ableitungen der Verschiebungen u abhängen. Welche zweiten Ableitungen von u gibt es aber, die Vektoren sind? Eine ist ∇(∇ · u); das ist ein echter Vektor. Die einzige andere ist ∇2 u. Somit ist die allgemeinste Form f = a ∇( ∇ · u) + b ∇2 u, wobei es sich einfach um (10.32) mit einer anderen Definition der Konstanten handelt. Sie fragen sich vielleicht, warum wir keinen dritten Ausdruck mit ∇ × ∇ × u erhalten haben, was ebenfalls ein Vektor ist. Aber erinnern Sie sich daran, dass ∇×∇×u dasselbe wie ∇(∇·u)−∇2 u ist; dabei handelt es sich also um eine Linearkombination der beiden Terme, die wir bereits verwendet haben. Würden wir sie erneut hinzufügen, so brächte das keinen Gewinn. Wir haben noch einmal bewiesen, dass ein isotropes Material nur zwei elastische Konstanten hat. Um die Bewegungsgleichung des Materials zu erhalten, können wir (10.32) gleich ρ ∂2 u/∂t2 setzen – dabei vernachlässigen wir im Augenblick Körperkräfte wie die Schwerkraft – und erhalten ρ

∂2 u = (λ + μ) ∇( ∇ · u) + μ ∇2 u. ∂t2

(10.33)

10.3 Bewegungen in einem elastischen Körper

215

Das sieht aus wie die Wellengleichung, die wir im Elektromagnetismus fanden, nur tritt ein zusätzlicher Term auf, der die Sache kompliziert macht. Für Materialien mit homogenen elastischen Eigenschaften können wir die Form der allgemeinen Lösungen auf die folgende Weise finden. Sie erinnern sich daran, dass jedes Vektorfeld als die Summe von zwei Vektoren geschrieben werden kann: der eine ist divergenzfrei und der andere rotationsfrei. Mit anderen Worten: Wir können setzen u = u1 + u2 ,

(10.34)

wobei ∇ · u1 = 0,

∇ × u2 = 0.

(10.35)

Durch Einsetzen von u1 + u2 für u in (10.33) erhalten wir ρ∂2 /∂t2 [ u1 + u2 ] = (λ + μ) ∇( ∇ · u2 ) + μ∇2 ( u1 + u2 ).

(10.36)

Wir können u1 eliminieren, indem wir die Divergenz dieser Gleichung bilden, ρ ∂2 /∂t2 ( ∇ · u2 ) = (λ + μ)∇2 ( ∇ · u2 ) + μ ∇ · ∇2 u2 . Da die Operatoren (∇2 ) und (∇·) miteinander vertauscht werden können, können wir die Divergenz als Faktor herausziehen und erhalten   (10.37) ∇ · ρ ∂2 u2 /∂t2 − (λ + 2μ) ∇2 u2 = 0.

Da ∇ × u2 definitionsgemäß null ist, ist die Rotation des Ausdrucks in geschweiften Klammern ebenfalls null; also ist die Klammer selbst identisch null und ρ ∂2 u2 /∂t2 = (λ + 2μ) ∇2 u2 .

(10.38)

Dies ist die vektorielle Wellengleichung für Wellen, die sich mit der Geschwindigkeit C2 =  (λ + 2μ)/ρ bewegen. Da die Rotation von u2 null ist, enthält diese Welle keine Scherung; es handelt sich einfach um eine Welle vom Typ der Kompressions- und Schallwellen, die wir im vorigen Kapitel besprochen haben, und ihre Geschwindigkeit hat genau den Wert, den wir für Clong gefunden haben. Analog dazu – wir bilden die Rotation von (10.36) – können wir zeigen, dass u1 die folgende Gleichung erfüllt: ρ ∂2 u1 /∂t2 = μ ∇2 u1 .

(10.39)

Auch das ist wieder die vektorielle Wellengleichung für Wellen mit der Geschwindigkeit C1 =  μ/ρ. Da ∇ · u1 null ist, ruft u1 keinerlei Änderungen in der Dichte hervor; der Vektor u1 entspricht dem transversalen oder Scher-Wellentyp, dem wir im letzten Kapitel begegnet sind, und C1 = CScherung . Wollen wir die statischen Spannungen in einem isotropen Material kennen, so können wir sie im Prinzip durch Lösen von Gleichung (10.32) mit f gleich null – oder gleich den statischen Volumenkräften aus der Schwerkraft wie ρg – erhalten, und zwar unter bestimmten Bedingungen,

216

10 Elastische Materialien

die mit den auf die Flächen unseres großen Blocks von Material wirkenden Kräften zusammenhängen. Das durchzuführen, ist etwas schwieriger als bei den entsprechenden Problemen des Elektromagnetismus. Es ist schwieriger erstens, weil die Gleichungen schwierig zu handhaben sind, und zweitens, weil die Form der elastischen Körper, an denen wir wahrscheinlich interessiert sind, gewöhnlich sehr viel komplizierter ist. Im Elektromagnetismus interessieren wir uns meist für die Lösung der Maxwell-Gleichungen in der Umgebung relativ einfacher geometrischer Formen wie Zylinder, Kugeln usw., da das praktische Formen für elektrische Apparate sind. In der Elastizitätstheorie können die Objekte, die wir analysieren möchten, oft recht komplizierte Formen haben – wie beispielsweise ein Kranhaken oder die Kurbelwelle eines Autos oder der Rotor einer Gasturbine. Solche Probleme können manchmal mithilfe von numerischen Methoden approximativ gelöst werden, wobei man das früher erwähnte Minimalprinzip der Energie verwendet. Eine andere Möglichkeit besteht darin, ein Modell des Objekts zu benützen und die inneren Deformationen mithilfe von polarisiertem Licht experimentell zu messen. Die Methode funktioniert wie folgt: Wird ein durchsichtiges, isotropes Material – zum Beispiel ein durchsichtiges Plastikmaterial wie Plexiglas – unter Spannung gesetzt, so wird es doppelbrechend. Schicken Sie polarisiertes Licht hindurch, so wird die Polarisationsebene um einen Betrag gedreht, der in Beziehung zur Spannung steht: Durch Messen der Drehung können Sie die Spannung ermitteln. Abbildung 10.6 zeigt, wie eine solche Anordnung aussehen kann. Abbildung 10.7 zeigt das Foto eines fotoelastischen Modells mit komplizierter Form unter Spannung.

Polarisatoren

Leuchtschirm

Probe aus Plexiglas unter Spannung

Abb. 10.6: Messung innerer Spannungen mit polarisiertem Licht. Abb. 10.7: Ansicht einer Plastikprobe unter Spannung zwischen gekreuzten Polaroiden. [Aus F .W. Sears, Optics, Addison-Wesley Publishing Co., Reading, Mass., 1949.]

10.4 Unelastisches Verhalten

10.4

217

Unelastisches Verhalten

Bei allem bisher Gesagten haben wir angenommen, dass die Spannung proportional zur Dehnung ist; im Allgemeinen ist das aber nicht richtig. Abbildung 10.8 zeigt eine typische Spannungs-Dehnungs-Kurve für ein biegsames Material. Bei kleinen Deformationen ist die Spannung proportional zur Dehnung. Schließlich aber, oberhalb eines gewissen Punktes, beginnt die Beziehung zwischen Spannung und Dehnung von einer geraden Linie abzuweichen. Für viele Materialien – jene, die wir „zerbrechlich“ nennen – bricht das Objekt bei Deformationen, die nur wenig oberhalb des Punktes liegen, an dem die Kurve abzubiegen beginnt. Im Allgemeinen gibt es in der Spannungs-Dehnungs-Beziehung andere Komplikationen. Wird zum Beispiel ein Objekt deformiert, so können die Spannungen zunächst groß sein, dann aber mit der Zeit langsam abnehmen. Wenn Sie außerdem zu hohen Spannungen übergehen, die aber den „Bruchpunkt“ nicht erreichen, so kann die Spannung bei Verringerung der Deformation entlang einer anderen Kurve zurücklaufen. Es tritt ein kleiner Hysterese-Effekt auf (wie der, den wir in magnetischen Materialien zwischen B und H beobachtet haben).

Spannung

hier tritt der Bruch ein

linearer Bereich Dehnung

Abb. 10.8: Eine typische Spannungs-Dehnungs-Beziehung für große Deformationen.

Die Spannung, bei der ein Material bricht, ist bei den einzelnen Materialien sehr verschieden. Einige Materialien brechen, wenn die maximale Dehnungs-Spannung einen bestimmten Wert erreicht. Andere Materialien geben nach, wenn die maximale Scher-Spannung einen bestimmten Wert erreicht. Kreide ist ein Beispiel für ein Material, das bei Dehnung sehr viel schwächer als bei Scherung ist. Wenn Sie an den Enden eines Stücks Schreibkreide ziehen, so bricht die Kreide senkrecht zur Richtung der angelegten Spannung, wie es Abbildung 10.9 (a) zeigt. Es bricht senkrecht zu der angelegten Kraft, weil es nur ein Bündel von zusammengepackten Teilchen ist, das sehr leicht auseinanderzuziehen ist. Das Material ist jedoch gegenüber Scherung sehr viel widerstandsfähiger, weil sich die Teilchen gegenseitig den Weg versperren. Erinnern Sie sich daran, dass wir bei einem Stab unter Torsion feststellten, dass die Scherung rings um ihn herum auftritt. Außerdem haben wir gezeigt, dass eine Scherung äquivalent zu einer Kombination von Dehnung und Kompression unter 45◦ ist. Das sind die Gründe, warum ein Stück Schreibkreide, das verdrillt wird, entlang einer komplizierten Oberfläche bricht, die unter 45◦ zur Achse einsetzt. Ein Foto eines Stücks Kreide, das auf diese Weise gebrochen wurde, ist in Abbildung 10.9 (b) gezeigt. Die Kreide bricht, wenn sich das Material im Zustand maximaler Dehnung befindet. Andere Materialien zeigen ein merkwürdiges und kompliziertes Verhalten. Je komplizierter die Materialien, desto interessanter ihr Verhalten. Nehmen wir ein Blatt Plastikfolie, mit der man Nahrungsmittel einwickelt, zerknüllen es zu einer Kugel und werfen es auf den Tisch,

218

10 Elastische Materialien

(a)

(b)

Abb. 10.9: (a) Ein durch Ziehen an den Enden gebrochenes Stück Kreide; (b) ein durch Verdrillen gebrochenes Stück Kreide.

so entfaltet es sich langsam und nimmt wieder seine ursprüngliche flache Form an. Auf den ersten Blick könnten wir versucht sein zu denken, dass die Trägheit es daran hindert, seine ursprüngliche Form wiederzuerlangen. Eine einfache Rechnung zeigt jedoch, dass die Trägheit um mehrere Größenordnungen zu klein ist, um dem Effekt Rechnung zu tragen. Es scheinen zwei wichtige, miteinander wetteifernde Effekte aufzutreten: „Etwas“ im Innern des Materials „erinnert sich“ an die anfängliche Form und „versucht“, diese wiederherzustellen, aber etwas anderes „bevorzugt“ die neue Form und „widersetzt“ sich einer Rückkehr in die alte Form. Wir wollen nicht versuchen, den in der Plastikfolie ablaufenden Mechanismus zu beschreiben, sondern Sie können sich anhand des folgenden Modells eine Vorstellung davon machen, wie ein solcher Effekt zustande kommen kann. Stellen Sie sich ein Material vor, das aus langen, biegsamen, aber starken Fasern besteht, die mit Zellen vermischt sind, die mit einer viskosen Flüssigkeit gefüllt sind. Stellen Sie sich außerdem vor, dass enge Verbindungswege von einer Zelle zur nächsten führen, sodass die Flüssigkeit von einer Zelle bis zur Nachbarzelle langsam durchsickern kann. Zerknüllen wir ein Blatt dieses Stoffs, so verzerren wir die langen Fasern, drücken an einer Stelle die Flüssigkeit aus den Zellen und pressen sie in andere gedehnte Zellen hinein. Überlassen wir nun das Blatt sich selbst, so versuchen die langen Fasern, ihre alte Form zurückzuerhalten. Dazu müssen sie aber die Flüssigkeit an ihren ursprünglichen Ort zurückdrängen – was aufgrund der Viskosität relativ langsam geschieht. Die Kräfte, die wir beim Zerknüllen des Blatts angewendet haben, sind sehr viel größer als die von den Fasern ausgeübten Kräfte. Wir können das Blatt schnell zerknüllen, aber das Entfalten wird langsamer erfolgen. Bei der Plastikfolie handelt es sich zweifellos um eine Kombination aus großen steifen und kleinen beweglichen Molekülen, die für ihr Verhalten verantwortlich ist. Diese Vorstellung passt auch zu der Tatsache, dass das erwärmte Material schneller in seine ursprüngliche Form zurückkehrt als das kalte – die Wärme erhöht die Beweglichkeit (vermindert die Viskosität) der kleineren Moleküle. Obwohl wir die Grenzen der Gültigkeit des hookeschen Gesetzes besprochen haben, ist daran vielleicht weniger bemerkenswert, dass das Gesetz für große Deformationen nicht mehr stimmt, sondern dass es so allgemeingültig sein soll. Wir können uns eine Vorstellung davon machen, warum das so ist, wenn wir die Deformationsenergie in einem Material betrachten. Behauptet man, die Spannung sei proportional zur Dehnung, so ist das dasselbe, wie wenn man sagt,

10.5 Berechnung der elastischen Konstanten

219

die Dehnungsenergie verhalte sich wie das Quadrat der Dehnung. Stellen wir uns einen Stab vor, den wir um einen kleinen Winkel verdrillen. Gilt das hookesche Gesetz, so muss die Dehnungsenergie proportional zum Quadrat von θ sein. Nehmen wir aber an, dass die Energie eine beliebige Funktion des Winkels sei; wir können sie dann als eine Taylor-Entwicklung um den Winkel null schreiben: U(θ) = U(0) + U � (0)θ + 12 U �� (0)θ2 + 16 U ��� (0)θ3 · · ·

(10.40)

Das Drehmoment τ ist die Ableitung von U nach dem Winkel; wir erhalten daher τ(θ) = U � (0) + U �� (0)θ + 12 U ��� (0)θ2 + · · ·

(10.41)

Werden die Winkel von der Gleichgewichtslage aus gemessen, so ist der erste Term null. Infolgedessen ist der erste übrigbleibende Term proportional zu θ; für hinreichend kleine Winkel wird er gegenüber dem Ausdruck in θ2 überwiegen. [In Wirklichkeit sind Materialien im Innern hinreichend symmetrisch, sodass τ(θ) = −τ(−θ); der Ausdruck in θ2 ist dann null, und die Abweichungen von der Linearität beruhen auf dem θ3 -Ausdruck. Es liegt jedoch kein Grund vor, warum das für Kompressionen und Dehnungen gelten sollte.] Bisher haben wir aber noch nicht erklärt, warum Materialien gewöhnlich sehr bald brechen, sobald Term höherer Ordnung an Bedeutung gewinnen.

10.5

Berechnung der elastischen Konstanten

Um das Thema der Elastizität abzuschließen, möchten wir zeigen, wie man versuchen kann, die elastischen Konstanten eines Materials zu berechnen, wenn man als Ausgangspunkt über einige Kenntnisse der Eigenschaften der Atome verfügt, aus denen das Material zusammengesetzt ist. Wir betrachten nur den einfachen Fall eines ionischen kubischen Kristalls wie Kochsalz. Wird ein Kristall deformiert, so ändert sich sein Volumen oder seine Form. Diese Änderungen führen zu einer Zunahme der potentiellen Energie des Kristalls. Um die Änderung der Dehnungsenergie zu berechnen, müssen wir wissen, wohin sich jedes Atom bewegt. In komplizierten Kristallen verteilen sich die Atome im Gitter auf sehr komplizierte Weise so, dass die Gesamtenergie so klein wie möglich wird. Das erschwert die Berechnung der Dehnungsenergie erheblich. Im Fall eines einfachen kubischen Kristalls ist es aber einfach zu sehen, was passiert. Die Verzerrungen im Innern des Kristalls sind in geometrischer Hinsicht ähnlich denen der äußeren Ränder des Kristalls. Die elastischen Konstanten für einen kubischen Kristall können auf folgende Weise berechnet werden. Zunächst nehmen wir für jedes Paar von Atomen in dem Kristall ein Kraftgesetz an. Dann berechnen wir die Änderung der inneren Energie des Kristalls, wenn er aus der Gleichgewichtsanordnung verzerrt wird. Das gibt uns eine Relation zwischen der Energie und den Dehnungen, die in allen Dehnungen quadratisch ist. Vergleichen wir die auf diese Weise erhaltene Energie mit (10.13), so können wir den Koeffizienten jedes Ausdrucks mit den elastischen Konstanten Ci jkl identifizieren. Für unser Beispiel nehmen wir ein einfaches Kraftgesetz an – nämlich dass die Kraft, die zwischen Nachbaratomen wirkt, eine Zentralkraft ist, womit gemeint ist, dass sie entlang der Verbindungslinie zwischen den beiden Atomen wirkt. Genauso stellen wir uns die Kräfte in io-

220

10 Elastische Materialien

nischen Kristallen vor, da es sich in erster Linie um Coulomb-Kräfte handelt. (Die Kräfte der kovalenten Bindung sind gewöhnlich komplizierter, da sie einen seitwärts gerichteten Schub auf ein in der Nähe befindliches Atom ausüben können; diese Komplikation lassen wir beiseite.) Im Übrigen betrachten wir nur die Kräfte zwischen jedem Atom und seinem nächsten und übernächsten Nachbarn. Mit anderen Worten: Wir machen eine Näherung, bei der alle Kräfte über den übernächsten Nachbarn hinaus vernachlässigt werden. Die Kräfte, die wir betrachten, sind für die xy-Ebene in Abbildung 10.10 (a) gezeigt. Die entsprechenden Kräfte in der yz- und in der zx-Ebene müssen ebenfalls berücksichtigt werden. (a)

(b) Na

Cl

Na

Cl

Na k2

Na

k2

k2 Cl

Na

Cl

Cl

Na

k1 k2

Cl

Na

Na

Cl

k1 k1

k2 Na

k2

k1

k2 k2

Cl

Na

Abb. 10.10: (a) Die interatomaren Kräfte, die hier betrachtet werden; (b) ein Modell, in dem die Atome durch Federn miteinander verbunden sind.

Da wir nur an den elastischen Koeffizienten interessiert sind, die für kleine Dehnungen zuständig sind, und infolgedessen nur die Energiebeiträge suchen, die quadratisch von den Dehnungen abhängen, können wir uns vorstellen, dass die Kraft zwischen jedem Atompaar linear von den Verschiebungen abhängt. Dann können wir uns vorstellen, dass jedes Atompaar durch eine lineare Feder, wie in Abbildung 10.10 (b), zusammengehalten wird. Alle Federn zwischen einem Natriumatom und einem Chloratom sollen dieselbe Federkonstante, sagen wir k1 , haben. Die Federn zwischen zwei Natriumatomen und zwischen zwei Chloratomen könnten eigentlich verschiedene Konstanten haben, aber um unsere Diskussion zu vereinfachen, betrachten wir sie als gleich; wir nennen sie k2 . (Später können wir sie dann wieder als unterschiedlich betrachten, nachdem wir gesehen haben, wie die Rechnungen ablaufen.) Wir nehmen nun an, dass der Kristall durch eine homogene Dehnung verzerrt wird, die der Dehnungstensor ei j beschreibt. Im Allgemeinen wird er Komponenten bezüglich x, y und z haben; doch hier werden wir nur eine Dehnung mit den drei Komponenten e xx , e xy und eyy betrachten, sodass sie leicht zu veranschaulichen ist. Wählen wir ein Atom als unseren Ursprung, so ist die Verschiebung jedes anderen Atoms durch Gleichungen wie (10.9) gegeben: u x = e xx x + e xy y, uy = e xy x + eyy y.

(10.42)

Nennen wir das Atom im Punkt x = y = 0 „das Atom 1“ und nummerieren seine Nachbarn in der xy-Ebene wie in Abbildung 10.11. Bezeichnen wir dann die Gitterkonstante mit a, so erhalten wir die in Tabelle 10.1 aufgeführten x- und y-Verschiebungen u x und uy .

10.5 Berechnung der elastischen Konstanten

221

Tabelle 10.1: Verschiebungen für die Atome in Abbildung 39.10

Atom 1 2 3 4 5 6 7 8 9

Lage x, y

ux

uy

k

0,0 a, 0 a, a 0, a −a, a −a, 0 −a, −a 0, −a a, −a

0 e xx a (e xx + e xy )a e xy a (−e xx + e xy )a −e xx a −(e xx + e xy )a −e xy a (e xx − e xy )a

0 eyx a (eyx + eyy )a eyy a (−eyx + eyy )a −eyx a −(eyx + eyy )a −eyy a (eyx − eyy )a

− k1 k2 k1 k2 k1 k2 k1 k2

Nun können wir die in den Federn gespeicherte Energie berechnen, die k/2-mal dem Quadrat der Verlängerung jeder Feder ist. Zum Beispiel ist die Energie in der horizontalen Feder zwischen Atom 1 und Atom 2 k1 (e xx a)2 . 2

(10.43)

Beachten Sie, dass die y-Verschiebung von Atom 2 die Länge der Feder zwischen Atom 1 und 2 in erster Ordnung nicht verändert. Um jedoch die Dehnungsenergie in einer diagonalen Feder, wie in der zu Atom 3 führenden, zu erhalten, müssen wir die von den horizontalen und vertikalen Verschiebungen verursachte Längenänderung berechnen. Für kleine Verschiebungen 3

4 5

eyy a 3

exy a a Na

2

eyx a

1

exx a a

6

9 8 7

Abb. 10.11: Die Verschiebungen der nächsten und übernächsten Nachbarn von Atom 1 (übertrieben dargestellt).

222

10 Elastische Materialien

von dem ursprünglichen Würfel weg können wir die Änderung im Abstand von Atom 3 als die Summe der Komponenten von u x und uy in der diagonalen Richtung schreiben, und das ist 1 √ (u x + uy ). 2 Mithilfe der Werte von u x und uy aus der Tabelle erhalten wir die Energie 2  k2 u x + u y k2 a 2 (e xx + eyx + e xy + eyy )2 . = √ 2 4 2

(10.44)

Für die Gesamtenergie aller Federn in der xy-Ebene benötigen wir die Summe von acht Termen wie (10.43) und (10.44). Nennen wir diese Energie U0 , so erhalten wir U0 =

a2  2 k2 k1 e xx + (e xx + eyx + e xy + eyy )2 2 2 k2 2 + k1 eyy + (e xx − eyx − e xy + eyy )2 2 k2 2 + k1 e xx + (e xx + eyx + e xy + eyy )2 2  k2 2 + k1 eyy + (e xx − eyx − e xy + eyy )2 . 2

(10.45)

Um die Gesamtenergie aller mit Atom 1 verbundenen Federn zu erhalten, müssen wir zu der in (10.45) ausgedrückten Energie einen Betrag hinzufügen. Obwohl nur x- und y-Komponenten der Deformation vorliegen, gibt es doch noch eine gewisse Energie, die den übernächsten Nachbarn außerhalb der xy-Ebene zugeordnet ist. Diese zusätzliche Energie ist k2 (e2xx a2 + e2yy a2 ).

(10.46)

Die elastischen Konstanten sind durch (10.13) mit der Energiedichte w verknüpft. Die von uns berechnete Energie entspricht einem Atom; genaugenommen handelt es sich um das Doppelte der Energie pro Atom, da jedem der beiden Atome die Hälfte der Energie einer Feder zugeordnet werden muss, die sie verbindet. Da es 1/a3 Atome pro Volumeneinheit gibt, sind w und U0 verknüpft durch w=

U0 . 2a3

Um die elastischen Konstanten Ci jkl zu finden, müssen wir die Quadrate in Gleichung (10.45) entwickeln – unter Zusatz der Terme (10.46) – und die Koeffizienten von ei j ekl mit den entsprechenden Koeffizienten in (10.13) vergleichen. Fassen wir beispielsweise die Terme in e2xx und in e2yy zusammen, so erhalten wir den Faktor (k1 + 2k2 )a2 , sodass C xxxx = Cyyyy =

k1 + 2k2 . a

10.5 Berechnung der elastischen Konstanten

223

Bei den restlichen Termen tritt eine leichte Komplikation auf. Da wir das Produkt aus zwei Termen wie e xx eyy nicht von eyy e xx unterscheiden können, ist der Koeffizient solcher Ausdrücke in unserer Energiegleichung gleich der Summe der beiden Terme in (10.13). Der Koeffizient von e xx eyy in (10.45) ist 2k2 , folglich haben wir 2k2 . a Aufgrund der Symmetrie in unserem Kristall ist aber C xxyy = Cyyxx , sodass (C xxyy + Cyyxx ) =

k2 . a Ein analoges Vorgehen liefert uns C xxyy = Cyyxx =

k2 . a Schließlich werden Sie feststellen, dass jeder Term, der x oder y nur einmal enthält, null ist – wie wir zuvor aus Symmetrieerwägungen gefolgert haben. Fassen wir unsere Resultate zusammen, so ist k1 + 2k2 C xxxx = Cyyyy = , a k2 C xyxy = Cyxyx = , a (10.47) k2 C xxyy = Cyyxx = C xyyx = Cyxxy = , a C xxxy = C xyyy = etc. = 0. C xyxy = Cyxyx =

Es ist uns gelungen, die elastischen Konstanten zu den atomaren Eigenschaften in Beziehung zu setzen, die in den Konstanten k1 und k2 auftreten. In unserem speziellen Fall ist C xyxy = C xxyy . Es stellt sich heraus – was vielleicht aus dem Rechnungsablauf ersichtlich wurde –, dass diese Ausdrücke für einen kubischen Kristall immer gleich sind, egal wie viele Kraftterme berücksichtigt werden, nur unter der Voraussetzung, dass die Kräfte entlang der jeweils ein Atompaar verbindenden Linie wirken – das heißt, solange sich die Kräfte zwischen Atomen wie Federn verhalten und keine seitlichen Komponenten aufweisen, wie Sie sie im Fall eines eingespannten Balkens erhalten würden (oder bei kovalenten Bindungen). Diese Schlussfolgerungen können wir anhand der experimentellen Messwerte der elastischen Konstanten überprüfen. Tabelle 10.2 enthält die beobachteten Werte der drei elastischen Koeffizienten für mehrere kubische Kristalle.2 Sie werden feststellen, dass im Allgemeinen C xxyy und C xyxy nicht gleich sind. Der Grund dafür ist, dass in Metallen wie Natrium und Kalium die interatomaren Kräfte nicht entlang der die Atome verbindenden Linie wirken, wie wir es in unserem Modell angenommen haben. Auch ein Diamant gehorcht den Gesetzen nicht, da die Kräfte im Diamant kovalent sind und Richtungsabhängigkeiten aufweisen – die Bindungen möchten lieber den Tetraederwinkel miteinander bilden. Die Ionenkristalle wie Lithiumfluorid, Kochsalz usw. haben nahezu alle die physikalischen Eigenschaften, die wir in unserem Modell angenommen haben, und die Tabelle zeigt, dass die Konstanten C xxyy und C xyxy fast gleich sind. Es ist nicht klar, warum Silberchlorid die Bedingung C xxyy = C xyxy nicht erfüllt. 2

In der Literatur werden Sie oft einer anderen Notation begegnen. Zum Beispiel schreibt man gewöhnlich C xxxx = C11 , C xxyy = C12 und C xyxy = C44 .

224

10 Elastische Materialien

Tabelle 10.2: Elastizitätsmoduln von kubischen Kristallen in 1012 Dyn · cm2



Na K Fe Diamant A1 LiF NaCl KC1 NaBr KI AgCl

C xxxx

C xxyy

C xyxy

0,055 0,046 2,37 10,76 1,08 1,19 0,486 0,40 0,33 0,27 0,60

0,042 0,037 1,41 1,25 0,62 0,54 0,127 0,062 0,13 0,043 0,36

0,049 0,026 1,16 5,76 0,28 0,53 0,128 0,062 0,13 0,042 0,062

Aus Ch. Kittel, Einführung in die Festkörperphysik, Oldenbourg Wissenschaftsverlag, München



11

Die Strömung von trockenem Wasser

11.1

Hydrostatik

Das Thema der Flüssigkeitsströmung, besonders der von Wasser, fasziniert jeden. Wir können uns alle daran erinnern, dass wir als Kinder in der Badewanne oder in Schmutzpfützen mit diesem merkwürdigen Stoff gespielt haben. Als wir dann älter wurden, haben wir Flüsse, Wasserfälle und Strudel beobachtet und waren von dieser Substanz fasziniert, die im Vergleich zu Festkörpern fast lebendig zu sein scheint. Das Verhalten der Flüssigkeiten ist in vielerlei Hinsicht unerwartet und interessant – es ist das Thema dieses und des nächsten Kapitels. Die Bemühungen eines Kindes, das ein kleines Rinnsal auf der Straße aufzuhalten versucht, und seine Verwunderung darüber, auf welch merkwürdige Weise das Wasser sich seinen Weg bahnt, finden ihr Analogon in unseren jahrelangen Versuchen, die Strömung von Flüssigkeiten zu verstehen. Wir haben – im übertragenen Sinn – versucht, das Wasser einzudämmen, indem wir die Gesetze und Gleichungen aufstellten, die die Strömung beschreiben. Diese Versuche sollen im vorliegenden Kapitel dargestellt werden. Im folgenden Kapitel werden wir den einzigartigen Weg beschreiben, auf dem das Wasser den Damm durchbrochen hat und allen unseren Bemühungen um ein Verständnis entwichen ist. Wir nehmen an, dass Ihnen die elementaren Eigenschaften des Wassers bereits bekannt sind. Eine Flüssigkeit unterscheidet sich von einem Festkörper hauptsächlich darin, dass eine Flüssigkeit keine Scherspannung aufrechterhalten kann, und sei es für noch so kurze Zeit. Übt man eine Scherung auf eine Flüssigkeit aus, so bewegt sie sich unter ihrem Einfluss. Dickere Flüssigkeiten wie Honig bewegen sich weniger leicht als Flüssigkeiten wie Luft oder Wasser. Das Maß der Leichtigkeit, mit der eine Flüssigkeit nachgibt, ist ihre Viskosität. In diesem Kapitel werden wir nur Situationen betrachten, in denen Auswirkungen der Viskosität vernachlässigt werden können. Die Effekte der Viskosität werden im folgenden Kapitel behandelt. F F

F F

F

F

Abb. 11.1: In einer statischen Flüssigkeit ist die Kraft pro Flächeneinheit auf eine Fläche normal zur Fläche, und sie ist für alle Orientierungen der Fläche gleich.

226

11 Die Strömung von trockenem Wasser

Wir beginnen mit einer Betrachtung der Hydrostatik, der Theorie der Flüssigkeiten im Ruhezustand. Befinden sich Flüssigkeiten in Ruhe, so wirken keine Scherkräfte (nicht einmal bei viskosen Flüssigkeiten). Das Gesetz der Hydrostatik lautet infolgedessen, dass die Spannungen immer normal zu jeder Fläche im Innern der Flüssigkeit sind. Die Normalkraft pro Flächeneinheit heißt der Druck. Aus der Tatsache, dass es in einer stationären Flüssigkeit keine Scherung gibt, folgt, dass der Druck in allen Richtungen der gleiche ist (Abbildung 11.1). Zu Ihrer Unterhaltung sollten Sie beweisen, dass der Druck in einer Flüssigkeit in jeder Richtung gleich ist, wenn es in keiner Ebene eine Scherung gibt. Der Druck in einer Flüssigkeit kann sich von Punkt zu Punkt ändern. Beispielsweise ändert er sich in einer stationären Flüssigkeit an der Erdoberfläche wegen des veränderlichen Gewichts der Flüssigkeit mit der Höhe. Betrachtet man die Dichte ρ der Flüssigkeit als konstant und nennt man den Druck in einem willkürlich gewählten Null-Niveau p0 (Abbildung 11.2), so ist der Druck in einer Höhe h oberhalb dieses Punktes p = p0 − ρgh, wobei g die Gravitationskraft pro Masseneinheit ist. Die Kombination p + ρgh ist infolgedessen für die stationäre Flüssigkeit eine Konstante. Diese Relation ist Ihnen vertraut, aber wir werden nun ein allgemeines Resultat herleiten, von dem sie nur einen Spezialfall darstellt. Oberfläche

p = p0 − ρgh

statische Flüssigkeit

h

p = p0 ; h = 0 Abb. 11.2: Der Druck in einer statischen Flüssigkeit.

Betrachten wir einen kleinen Würfel von Wasser: Welche gesamte Druckkraft wirkt dann darauf? Da der Druck an jedem Punkt in allen Richtungen gleich ist, kann eine Gesamtkraft pro Volumeneinheit nur vorliegen, weil sich der Druck von einem Punkt zum nächsten ändert. Stellen wir uns vor, der Druck ändere sich in der x-Richtung – und wir wählen die Koordinatenrichtungen parallel zu den Würfelkanten. Der Druck auf die Seitenfläche im Punkt x liefert die Kraft p Δy Δz (Abbildung 11.3) und der Druck auf die Seitenfläche im Punkt x + Δx liefert die Kraft − [p + (∂p/∂x)Δx] Δy Δz, sodass die resultierende Kraft − (∂p/∂x) Δx Δy Δz beträgt.

Betrachten wir die übrigen Paare der Seitenflächen des Würfels, so ist leicht ersichtlich, dass die Druckkraft pro Volumeneinheit −∇p ist. Wirken zusätzlich noch andere Kräfte – beispielsweise die Schwerkraft –, so muss der Druck sie ausgleichen, damit das Gleichgewicht erreicht wird.

11.2 Die Bewegungsgleichungen

p+

p

227

∂p Δx ∂x

Δz

x

Δx

Δy x + Δx

Abb. 11.3: Die gesamte Druckkraft auf einen Würfel beträgt −∇p pro Volumeneinheit.

Betrachten wir eine Situation, in der eine solche zusätzliche Kraft durch eine potentielle Energie beschrieben werden kann, wie das für die Schwerkraft zutrifft; es stelle φ die potentielle Energie pro Masseneinheit dar. (Zum Beispiel ist φ für die Schwerkraft einfach gz.) Die Kraft pro Masseneinheit ist als Funktion des Potentials durch −∇φ gegeben; stellt ρ die Dichte der Flüssigkeit dar, so ist die Kraft pro Volumeneinheit −ρ∇φ. Für den Gleichgewichtszustand muss diese Kraft pro Volumeneinheit, die zur Druckkraft pro Volumeneinheit addiert wird, null ergeben: − ∇p − ρ ∇φ = 0.

(11.1)

Gleichung (11.1) ist die Gleichung der Hydrostatik. Im Allgemeinen hat sie keine Lösung. Ändert sich die Dichte im Raum auf beliebige Weise, so haben die Kräfte keine Möglichkeit, ausgeglichen zu sein, und die Flüssigkeit kann sich nicht im statischen Gleichgewicht befinden. Es treten Konvektionsströme auf. Wir können das der Gleichung entnehmen, da der Term für den Druck ein reiner Gradient ist, während der andere Term das nicht ist, wenn ρ variabel ist. Nur bei konstantem ρ stellt der Ausdruck für das Potential einen reinen Gradienten dar; und die Gleichung hat dann die Lösung p + ρφ = konstant. Eine andere Möglichkeit für ein hydrostatisches Gleichgewicht besteht darin, dass ρ nur von p abhängt. Aber wir wollen das Thema der Hydrostatik verlassen, denn es ist nicht annähernd so interessant wie die Situation, in der Flüssigkeiten in Bewegung sind.

11.2

Die Bewegungsgleichungen

Zuerst wollen wir die Bewegungen von Flüssigkeiten rein abstrakt und theoretisch untersuchen und dann spezielle Beispiele betrachten. Um die Bewegung einer Flüssigkeit zu beschreiben, müssen wir ihre Eigenschaften an jedem Punkt angeben. Zum Beispiel bewegt sich das Wasser (nennen wir die Flüssigkeit „Wasser“) an verschiedenen Punkten mit unterschiedlichen Geschwindigkeiten. Um daher den Charakter der Strömung zu spezifizieren, müssen wir die drei Komponenten der Geschwindigkeit an jedem Punkt und zu jeder Zeit angeben. Können wir die Gleichungen finden, die die Geschwindigkeit bestimmen, so wissen wir, wie sich die Flüssigkeit zu jedem Zeitpunkt bewegt. Die Geschwindigkeit ist jedoch nicht die einzige Eigenschaft der Flüssigkeit, die sich von Punkt zu Punkt ändert. Soeben haben wir erläutert, wie der Druck von Punkt zu Punkt variiert. Und es gibt noch andere Variablen. Es kann sich auch die Dichte von Punkt zu Punkt ändern. Außerdem kann die Flüssigkeit ein Leiter sein und einen elektrischen Strom führen, dessen Dichte j sich in Betrag und Richtung

228

11 Die Strömung von trockenem Wasser

von Punkt zu Punkt ändert. Es kann eine Temperatur geben, die sich von Punkt zu Punkt ändert, oder ein Magnetfeld usw. Somit hängt die Zahl der Felder, die zur Beschreibung der vollständigen Situation notwendig sind, von dem Schwierigkeitsgrad des Problems ab. Es treten interessante Phänomene auf, wenn Ströme und der Magnetismus bei der Beschreibung des Flüssigkeitsverhaltens die ausschlaggebende Rolle spielen; man nennt dieses Gebiet Magnetohydrodynamik, und zur Zeit wird diesem Gebiet sehr viel Aufmerksamkeit geschenkt. Doch werden wir diese komplizierteren Situationen nicht betrachten, denn es gibt bereits auf einer weniger komplexen Ebene interessante Probleme und schon diese eher elementare Ebene wird schwierig genug sein. Wir betrachten die Situation, in der es kein Magnetfeld und keine Leitfähigkeit gibt und kümmern uns nicht um die Temperatur, weil wir annehmen, dass die Dichte und der Druck die Temperatur an jedem Punkt in eindeutiger Weise bestimmen. Außerdem reduzieren wir die Komplexität unserer Analyse dadurch, dass wir die Dichte als Konstante betrachten – wir stellen uns vor, dass die Flüssigkeit im Wesentlichen inkompressibel ist. Wir können das auch so ausdrücken, dass wir die Druckänderungen als derart klein annehmen, dass die dadurch hervorgerufenen Änderungen in der Dichte vernachlässigbar sind. Wäre das nicht der Fall, so würden wir auf zusätzliche Phänomene zu den hier untersuchten stoßen – beispielsweise auf die Ausbreitung von Schall- oder Stoßwellen. Wir haben die Ausbreitung des Schalls und von Stößen bereits in groben Zügen behandelt und trennen daher unsere Betrachtung der Hydrodynamik von diesen anderen Phänomenen ab, indem wir die Näherung machen, dass die Dichte ρ konstant ist. Es ist leicht festzustellen, wann ein konstantes ρ eine gute Näherung ist. Wir können sagen, dass wir uns nicht um die Änderung der Dichte kümmern müssen, wenn die Strömungsgeschwindigkeiten viel kleiner als die Geschwindigkeit einer Schallwelle in der Flüssigkeit sind. Die Tatsache, dass es uns nicht gelingt, das Wasser vollständig zu verstehen, hat nichts mit der Näherung konstanter Dichte zu tun. Die Komplikationen, die einem Verständnis des Wassers im Wege stehen, werden im nächsten Kapitel besprochen. In der allgemeinen Theorie der Flüssigkeiten muss man mit einer Gleichung des Flüssigkeitszustands beginnen, die den Druck mit der Dichte verknüpft. In unserer Näherung ist diese Zustandsgleichung einfach ρ = konst. Dies ist die erste Relation für unsere Variablen. Die nächste Relation drückt die Erhaltung der Materie aus – strömt Materie von einem Punkt weg, so muss sich die zurückbleibende Menge verringern. Ist die Flüssigkeitsgeschwindigkeit u, so ist die Masse, die in einer Zeiteinheit durch eine Flächeneinheit der einschließenden Fläche strömt, die Komponente von ρu normal zur Fläche. Eine ähnliche Relation haben wir beim Elektromagnetismus gefunden. Außerdem wissen wir aus der Theorie des Elektromagnetismus, dass die Divergenz einer solchen Größe die Rate liefert, mit der die Dichte pro Zeiteinheit abnimmt. In gleicher Weise drückt die Gleichung ∇ · (ρ u) = −

∂ρ ∂t

(11.2)

die Erhaltung der Masse in einer Flüssigkeit aus; es handelt sich um die hydrodynamische Kontinuitätsgleichung. In unserer Näherung für eine inkompressible Flüssigkeit ist ρ konstant, und die Kontinuitätsgleichung lautet einfach ∇ · u = 0.

(11.3)

11.2 Die Bewegungsgleichungen

229

Die Flüssigkeitsgeschwindigkeit u hat – ebenso wie das Magnetfeld B – die Divergenz null. (Die hydrodynamischen Gleichungen sind oft weitgehend analog zu den elektrodynamischen Gleichungen; aus diesem Grund haben wir die elektrodynamischen Gleichungen zuerst besprochen. Manche Leute sind der entgegengesetzten Ansicht; sie meinen, man sollte die Hydrodynamik zuerst behandeln, damit man die Elektrodynamik danach leichter versteht. Aber in Wirklichkeit ist die Elektrodynamik sehr viel einfacher als die Hydrodynamik.) Unsere nächste Gleichung liefert uns das newtonsche Gesetz, das aussagt, wie sich die Geschwindigkeit infolge der Kräfte ändert. Die Masse eines Volumenelements der Flüssigkeit mal ihrer Beschleunigung muss gleich der auf das Element wirkenden Kraft sein. Betrachten wir ein Element mit dem Volumen eins und bezeichnen wir dann die Kraft pro Volumeneinheit mit f , so erhalten wir ρ · (Beschleunigung) = f . Wir schreiben die Kraftdichte als die Summe von drei Termen. Die Druckkraft pro Volumeneinheit, −∇p, haben wir bereits betrachtet. Dann gibt es die „äußeren“ Kräfte, die aus der Entfernung wirken – wie die Schwerkraft oder die Elektrizität. Handelt es sich dabei um konservative Kräfte mit einem Potential pro Masseneinheit φ, so ergeben sie eine Kraftdichte −ρ∇φ. (Ist eine äußere Kraft nicht konservativ, so müssen wir für die äußere Kraft pro Volumeneinheit f äuß schreiben.) Ferner gibt es eine andere „innere“ Kraft pro Volumeneinheit, die auf der Tatsache beruht, dass es in einer strömenden Flüssigkeit auch eine Scherspannung geben kann. Man nennt sie die Viskositätskraft und schreibt sie als f visk . Unsere Bewegungsgleichung lautet dann ρ · (Beschleunigung) = − ∇p − ρ ∇φ + f visk .

(11.4)

In diesem Kapitel wollen wir annehmen, dass die Flüssigkeit „dünn“ in dem Sinn ist, dass die Viskosität unwichtig ist, und somit lassen wir f visk fort. Durch Weglassen des Viskositätsterms machen wir eine Näherung, die eher eine ideale Materie als reales Wasser beschreibt. John von Neumann war sich sehr wohl der Tatsache bewusst, welch großer Unterschied darin besteht, ob man die Viskositätsterme mitnimmt oder nicht, und er sah auch, dass im Lauf der Entwicklung der Hydrodynamik bis ungefähr 1900 das Hauptinteresse fast ausschließlich darin bestand, mathematische Probleme in dieser Näherung wunderschön zu lösen, wobei diese Näherung nahezu nichts mit realen Flüssigkeiten zu tun hatte. Er nannte den Theoretiker, der solche Analysen durchführte, einen Mann, der „trockenes Wasser“ untersucht. Bei diesen Analysen fehlt eine wesentliche Eigenschaft der Flüssigkeit. Weil wir bei unseren Berechnungen in diesem Kapitel diese Eigenschaft weglassen, haben wir als Überschrift „Die Strömung von trockenem Wasser“ gewählt. Die Behandlung des realen Wassers schieben wir bis zum nächsten Kapitel auf. Lassen wir die f visk weg, so finden wir in Gleichung (11.4) alles, was wir brauchen, nur fehlt noch ein Ausdruck für die Beschleunigung. Sie meinen vielleicht, dass die Formel für die Beschleunigung eines Flüssigkeitsteilchens sehr einfach sein müsste, denn es erscheint offensichtlich, dass die Beschleunigung genau ∂u/∂t sein muss, wenn u die Geschwindigkeit eines Flüssigkeitsteilchens an einem Punkt der Flüssigkeit ist. Das ist aber nicht der Fall, und zwar aus einem subtilen Grund. Die Ableitung ∂u/∂t ist die Rate, mit der sich die Geschwindigkeit u(x, y, z, t) an einem festen Punkt im Raum ändert. Was wir wissen müssen, ist, wie schnell sich die Geschwindigkeit für einen bestimmten Teil der Flüssigkeit ändert. Stellen wir uns vor, wir markieren einen der Wassertropfen mit etwas Farbe,

230

11 Die Strömung von trockenem Wasser u + Δu u(x, y, z, t) P2

P1

Weg eines Teilchens

uΔt

Abb. 11.4: Beschleunigung eines Flüssigkeitsteilchens.

sodass wir ihn verfolgen können. In einem kleinen Zeitintervall Δt wird dieser Tropfen an eine andere Stelle rücken. Bewegt sich der Tropfen entlang eines Weges wie des in Abbildung 11.4 skizzierten Wegs, so rückt er in der Zeit Δt von P1 nach P2 . Dabei legt er in der x-Richtung einen Weg v x Δt zurück, in der y-Richtung einen Weg vy Δt und in der z-Richtung einen Weg vz Δt. Ist u(x, y, z, t) die Geschwindigkeit des Flüssigkeitsteilchens, das sich zur Zeit t am Punkt (x, y, z) befindet, so sehen wir, dass die Geschwindigkeit desselben Teilchens zur Zeit t + Δt durch u(x + Δx, y + Δy, z + Δz, t + Δt) gegeben ist, wobei Δx = v x Δt,

Δy = vy Δt,

und Δz = vz Δt.

Definitionsgemäß gilt für die partiellen Ableitungen in erster Ordnung u(x + v x Δt, y + vy Δt, z + vz Δt, t + Δt) = u(x, y, z, t) +

∂u ∂u ∂u ∂u v x Δt + vy Δt + vz Δt + Δt ∂x ∂y ∂z ∂t

(siehe Band III, Gleichung (2.7)). Die Beschleunigung Δu/Δt ist vx

∂u ∂u ∂u ∂u + vy + vz + . ∂x ∂y ∂z ∂t

Behandeln wir ∇ als einen Vektor, so können wir das symbolisch schreiben als ( u · ∇) u +

∂u . ∂t

(11.5)

Beachten Sie, dass es eine Beschleunigung geben kann, obwohl ∂u/∂t = 0, obwohl sich also die Geschwindigkeit an einem vorgegebenen Punkt nicht ändert. Zum Beispiel wird Wasser beschleunigt, das mit konstanter Geschwindigkeit im Kreis strömt, obwohl sich die Geschwindigkeit an einem gegebenen Punkt nicht ändert. Der Grund dafür ist natürlich der, dass die Geschwindigkeit eines bestimmten Teils des Wassers, der sich anfangs an einem bestimmten Punkt auf dem Kreis befand, einen Augenblick später eine andere Richtung hat; es liegt eine Zentripetalbeschleunigung vor. Der restliche Teil unserer Theorie ist rein mathematisch – es handelt sich um das Auffinden der Lösungen der Bewegungsgleichung, die wir durch Einsetzen der Beschleunigung (11.5) in Gleichung (11.4) erhalten. Sie lautet ∂u ∇p + ( u · ∇) u = − − ∇φ, ∂t ρ

(11.6)

11.2 Die Bewegungsgleichungen

231

wobei die Viskosität weggelassen wurde. Diese Gleichung können wir mithilfe der folgenden Identität aus der Vektoranalysis umschreiben: ( u · ∇) u = ( ∇ × u) × u + 12 ∇( u · u). Definieren wir nun ein neues Vektorfeld Ω, das die Rotation von u ist, (11.7)

Ω = ∇ × u, so kann die Vektoridentität geschrieben werden als ( u · ∇) u = Ω × u + 12 ∇v2 , und unsere Bewegungsgleichung (11.6) lautet dann ∂u 1 ∇p + Ω × u + ∇v2 = − − ∇φ. ∂t 2 ρ

(11.8)

Sie können sich vergewissern, dass die Gleichungen (11.6) und (11.8) äquivalent sind, indem Sie nachprüfen, dass die Komponenten auf beiden Seiten der Gleichung dieselben sind und dabei (11.7) verwenden. Das Vektorfeld Ω heißt der Wirbelvektor. Ist der Wirbelvektor überall null, so bezeichnen wir die Strömung als wirbelfrei. In Band III, Abschnitt 3.5 haben wir bereits etwas definiert, das wir die Zirkulation eines Vektorfeldes nannten. Die Zirkulation um eine geschlossene Schleife in einer Flüssigkeit ist das Linienintegral der Flüssigkeitsgeschwindigkeit um die Schleife zu einem gegebenen Zeitpunkt: (Zirkulation) =



u · d s.

Die Zirkulation ist dann für eine infinitesimale Schleife pro Flächeneinheit – laut stokesschem Theorem – gleich ∇ × u. Somit ist der Wirbelvektor Ω die Zirkulation um eine Flächeneinheit (senkrecht zur Richtung von Ω). Daraus folgt außerdem, dass ein kleines Stück Schmutz – nicht ein infinitesimaler Punkt – das an irgendeine Stelle in die Flüssigkeit gesetzt wird, sich mit der Winkelgeschwindigkeit Ω/2 dreht. Versuchen Sie, ob Sie das beweisen können. Sie können ferner selbst nachprüfen, dass für einen Eimer Wasser auf einer Drehscheibe Ω doppelt so groß ist wie die lokale Winkelgeschwindigkeit des Wassers. Sind wir nur an dem Geschwindigkeitsfeld interessiert, so können wir den Druck aus unseren Gleichungen eliminieren. Bilden wir auf beiden Seiten von Gleichung (11.8) die Rotation und denken daran, dass ρ eine Konstante und dass die Rotation eines Gradienten null ist, so erhalten wir mithilfe von (11.3) ∂Ω + ∇ × ( Ω × u) = 0. ∂t

(11.9)

232

11 Die Strömung von trockenem Wasser

Diese Gleichung gibt uns zusammen mit den Gleichungen Ω= ∇× u

(11.10)

∇· u=0

(11.11)

und

eine vollständige Beschreibung des Geschwindigkeitsfeldes u. Mathematisch gesehen heißt das, dass wir die Rotation des Geschwindigkeitsvektors kennen, wenn Ω zu irgendeinem Zeitpunkt bekannt ist, und dass wir außerdem wissen, dass seine Divergenz null ist, sodass wir bei vorgegebener physikalischer Situation über alles Notwendige verfügen, um u überall zu bestimmen. (Es ist dasselbe wie beim Magnetismus mit ∇ · B = 0 und ∇ × B = j/�0 c2 .) Somit bestimmt ein gegebenes Ω das u genauso, wie ein gegebenes j das B bestimmt. Kennen wir dann u, so gibt uns (11.9) die Änderungsrate von Ω, womit wir das neue Ω für den folgenden Moment ermitteln können. Mithilfe von (11.10) finden wir wiederum das neue u usw. Sie sehen, wie diese Gleichungen den gesamten Mechanismus für die Berechnung der Strömung enthalten. Beachten Sie jedoch, dass dieser Vorgang nur das Geschwindigkeitsfeld liefert; jegliche Information bezüglich des Drucks ist verloren gegangen. Wir weisen auf eine spezielle Konsequenz unserer Gleichung hin. Ist zu jedem Zeitpunkt und überall Ω = 0, so verschwindet auch ∂Ω/∂t, sodass Ω zur Zeit t + Δt immer noch überall null ist. Wir haben eine Lösung der Gleichung erhalten; die Strömung ist ständig wirbelfrei. Wird eine Strömung mit Rotation null in Bewegung gesetzt, so bleibt ihre Rotation immer null. Die zu lösenden Gleichungen sind dann ∇ · u = 0,

∇ × u = 0.

Es handelt sich um dieselben Gleichungen wie für das elektrostatische oder das magnetostatische Feld im freien Raum. Wir werden später darauf zurückkommen und dann einige spezielle Probleme untersuchen.

11.3

Stationäre Strömung – das Theorem von Bernoulli

Kehren wir nun zu der Bewegungsgleichung (11.8) zurück, aber beschränken wir uns auf Situationen, in denen die Strömung „stationär“ ist. Mit einer stationären Strömung meinen wir, dass sich die Geschwindigkeit an einem Punkt in der Flüssigkeit nie ändert. Die Flüssigkeit an einem Punkt wird immer durch neue Flüssigkeit ersetzt, die sich in genau derselben Weise bewegt. Das Flüssigkeitsbild schaut immer gleich aus – u ist ein statisches Vektorfeld. Auf die gleiche Weise, wie wir in der Magnetostatik „Feldlinien“ gezeichnet haben, können wir nun Linien zeichnen, die immer Tangenten an die Strömungsgeschwindigkeit sind, wie es Abbildung 11.5 zeigt. Diese Linien heißen Stromlinien. In einer stationären Strömung handelt es sich dabei offensichtlich um die tatsächlichen Wege der Flüssigkeitsteilchen. (Bei einer nicht-stationären Strömung ändert sich das Stromlinienmuster mit der Zeit, und das Stromlinienmuster stellt zu keinem Zeitpunkt den Weg eines Flüssigkeitsteilchens dar.) Eine stationäre Strömung bedeutet nicht, dass nichts passiert – die Atome in der Flüssigkeit bewegen sich und ändern ihre Geschwindigkeiten. Sie bedeutet nur, dass ∂u/∂t = 0. Bilden wir

11.3 Stationäre Strömung – das Theorem von Bernoulli

233

u

Abb. 11.5: Stromlinien bei stationärer Flüssigkeitsströmung.

dann das Skalarprodukt von u mit der Bewegungsgleichung, so fällt der Ausdruck u · (Ω × u) weg und es bleibt   1 2 p u· ∇ + φ + v = 0. (11.12) ρ 2 Diese Gleichung sagt aus, dass sich die Größe in der Klammer bei einer kleinen Verschiebung in Richtung der Flüssigkeitsgeschwindigkeit nicht ändert. In einer stationären Strömung verlaufen alle Verschiebungen entlang den Stromlinien, und somit sagt uns Gleichung (11.12), dass wir für alle Punkte entlang einer Stromlinie schreiben können p 1 2 + v + φ = konstant (Stromlinie). ρ 2

(11.13)

Das ist das Theorem von Bernoulli. Im Allgemeinen kann die Konstante für verschiedene Stromlinien verschieden sein; wir wissen lediglich, dass die linke Seite von (11.13) entlang einer vorgegebenen Stromlinie überall konstant ist. Nebenbei bemerkt können wir feststellen, dass uns die Bewegungsgleichung (11.8) für eine stationäre wirbelfreie Bewegung, für die Ω = 0, die Relation liefert   p 1 2 ∇ + v + φ = 0, ρ 2 sodass p 1 2 + v + φ = konstant (überall). ρ 2

(11.14)

Das ist dieselbe Gleichung wie (11.13), nur dass jetzt die Konstante überall in der Flüssigkeit denselben Wert hat. Das Theorem von Bernoulli ist eigentlich nichts weiter als eine Formulierung der Energieerhaltung. Ein Erhaltungssatz wie dieser vermittelt uns sehr viele Informationen über die Strömung, ohne dass wir detaillierte Gleichungen lösen müssen. Das Theorem von Bernoulli ist so wichtig und so einfach, dass wir Ihnen zeigen möchten, wie es sich auf eine andere Weise herleiten lässt als mit den formalen Rechnungen, die wir soeben verwendet haben. Stellen wir uns ein Bündel von benachbarten Stromlinien vor, die eine Stromröhre wie in Abbildung 11.6 bilden. Da die Wände der Röhre aus Stromlinien bestehen, strömt keine Flüssigkeit durch die Wand hindurch.

234

11 Die Strömung von trockenem Wasser u2 (a) (b)

u1

v2 Δt

ΔM

A2

v 1Δt

A1

ΔM

Abb. 11.6: Flüssigkeitsbewegung in einer Stromröhre.

Bezeichnen wir den Flächeninhalt an einem Ende der Stromröhre mit A1 , die Flüssigkeitsgeschwindigkeit dort mit v1 , die Dichte der Flüssigkeit mit ρ1 und die potentielle Energie mit φ1 . Am anderen Ende der Röhre haben wir die entsprechenden Größen A2 , v2 , ρ2 und φ2 . Nun hat nach einem kurzen Zeitintervall Δt die Flüssigkeit in A1 eine Strecke v1 Δt und die in A2 eine Strecke v2 Δt zurückgelegt, siehe Abbildung 11.6 (b). Die Erhaltung der Masse erfordert, dass bei A1 gleich viel Masse einströmt, wie bei A2 ausströmt. Die Massen an den beiden Enden müssen die gleichen sein: ΔM = ρ1 A1 v1 Δt = ρ2 A2 v2 Δt. Somit haben wir die Gleichung ρ1 A1 v1 = ρ2 A2 v2 .

(11.15)

Diese Gleichung sagt uns, dass sich die Geschwindigkeit umgekehrt proportional zum Flächeninhalt der Stromröhre verhält, wenn ρ konstant ist. Berechnen wir nun die vom Flüssigkeitsdruck geleistete Arbeit. Die Arbeit, die an der bei A1 eintretenden Flüssigkeit geleistet wird, ist p1 A1 v1 Δt und die Arbeit an der bei A2 austretenden Flüssigkeit ist p2 A2 v2 Δt. Die gesamte Arbeit zwischen A1 und A2 ist somit p1 A1 v1 Δt − p2 A2 v2 Δt,

was gleich der Energiezunahme einer Masse ΔM der Flüssigkeit sein muss, die sich von A1 nach A2 bewegt. Es gilt also p1 A1 v1 Δt − p2 A2 v2 Δt = ΔM(E2 − E1 ),

(11.16)

wobei E1 und E2 die Energien pro Masseneinheit der Flüssigkeit bei A1 bzw. A2 sind. Die Energie pro Masseneinheit der Flüssigkeit kann geschrieben werden als E = 21 v2 + φ + U, wobei 12 v2 die kinetische Energie pro Masseneinheit, φ die potentielle Energie pro Masseneinheit und U ein zusätzlicher Ausdruck ist, der die innere Energie pro Masseneinheit der Flüssigkeit darstellt. Diese innere Energie kann beispielsweise der thermischen Energie in einer

11.3 Stationäre Strömung – das Theorem von Bernoulli

235

kompressiblen Flüssigkeit oder der chemischen Energie entsprechen. Alle diese Größen können sich von Punkt zu Punkt ändern. Mithilfe dieser Formel für die Energien in (11.16) wird p1 A1 v1 Δt p2 A2 v2 Δt 1 2 1 − = v2 + φ2 + U2 − v21 − φ1 − U1 . ΔM ΔM 2 2 Aber wir haben gesehen, dass ΔM = ρAv Δt, und somit erhalten wir p2 1 2 p1 1 2 + v1 + φ1 + U 1 = + v + φ2 + U 2 , ρ1 2 ρ2 2 2

(11.17)

wobei es sich um das Theorem von Bernoulli mit einem zusätzlichen Term für die innere Energie handelt. Ist die Flüssigkeit inkompressibel, so ist der Ausdruck für die innere Energie auf beiden Seiten der gleiche, und wir sehen erneut, dass Gleichung (11.14) für jede Stromlinie gilt. p0 Wasser h Stromlinie

p0 vaus

Abb. 11.7: Strömung aus einem Behälter.

Wir betrachten nun einige einfache Beispiele, bei denen uns das Theorem von Bernoulli eine Beschreibung der Strömung liefert. Stellen wir uns Wasser vor, das aus einem Loch ausströmt, das sich nahe am Boden eines Behälters befindet, wie es in Abbildung 11.7 dargestellt ist. Wir wählen eine Situation, in der die Strömungsgeschwindigkeit vaus am Loch sehr viel größer als die Strömungsgeschwindigkeit nahe der Oberseite des Behälters ist; mit anderen Worten: Wir stellen uns vor, dass der Durchmesser des Behälters so groß ist, dass wir das Absinken des Flüssigkeitsniveaus vernachlässigen können. (Wenn wir wollten, könnten wir eine genauere Berechnung durchführen.) An der Oberseite des Behälters ist der Druck der atmosphärische Druck p0 und derjenige an den Seiten des Strahls ist gleichfalls p0 . Nun schreiben wir unsere Bernoulli-Gleichung für eine Stromlinie wie die in der Abbildung an. An der Oberseite des Behälters setzen wir v gleich null und nehmen auch an, dass dort das Gravitationspotential φ null ist. Am Loch ist die Geschwindigkeit vaus und φ = −gh, sodass p0 = p0 + 12 ρv2aus − ρgh, oder vaus =



2gh.

(11.18)

236

11 Die Strömung von trockenem Wasser

Diese Geschwindigkeit ist dieselbe, die wir für einen Gegenstand erhalten würden, der aus einer Höhe h herabfällt. Das ist nicht allzu überraschend, denn am Ausgang gewinnt das Wasser kinetische Energie auf Kosten der potentiellen Energie des Wassers an der Oberseite. Kommen Sie jedoch nicht auf den Gedanken, Sie könnten die Rate berechnen, mit der die Flüssigkeit aus dem Behälter strömt, indem Sie diese Geschwindigkeit mit dem Flächeninhalt des Lochs multiplizieren. Die Flüssigkeitsgeschwindigkeiten sind, wenn der Strahl durch das Loch austritt, nicht alle parallel zueinander, sondern sie haben nach innen, zum Mittelpunkt des Strahls hin gerichtete Komponenten – der Strahl konvergiert. Hat der Strahl eine kurze Strecke zurückgelegt, so hört die Kontraktion auf und die Geschwindigkeiten werden parallel. Die gesamte Strömung ist somit die Geschwindigkeit mal dem Flächeninhalt an diesem Punkt. Wenn wir eine Ausflussöffnung verwenden, die nichts anderes als ein rundes Loch mit einer scharfen Kante ist, so zieht sich der Strahl tatsächlich bis auf 62 Prozent des Flächeninhalts des Lochs zusammen. Der reduzierte effektive Flächeninhalt des Ausflusses ändert sich mit den verschiedenen Formen der Ausflussröhren, und die experimentell gemessenen Kontraktionen stehen uns als Tabellen der Ausflusskoeffizienten zur Verfügung.

Abb. 11.8: Mit einer nach rückwärts eindringenden Ausflussröhre zieht sich der Strom bis auf den halben Flächeninhalt der Öffnung zusammen.

Dringt die Ausflussröhre nach rückwärts ein, wie in Abbildung 11.8, so kann man auf sehr schöne Weise beweisen, dass der Ausflusskoeffizient genau 50 Prozent ist. Wir geben nur einen Hinweis darauf, wie der Beweis zu führen ist. Wir haben die Energieerhaltung verwendet, um die Geschwindigkeit (11.18) zu erhalten, aber es ist auch die Impulserhaltung zu betrachten. Da es eine nach außen gerichtete Impulsströmung im Ausflussstrahl gibt, muss eine Kraft über den Querschnitt der Ausflussröhre wirken. Woher kommt diese Kraft? Die Kraft muss von dem Druck auf die Wände herrühren. Solange das Ausflussloch klein und von den Wänden weit entfernt ist, ist die Flüssigkeitsgeschwindigkeit in der Nähe der Behälterwände sehr gering. Infolgedessen ist der Druck auf jede Seite fast genauso groß wie der statische Druck einer ruhenden Flüssigkeit – gemäß (11.14). Dann entspricht der statische Druck an jedem Punkt einer Behälterseite einem gleichen Druck an dem jeweiligen Punkt auf der gegenüberliegenden Seite, mit Ausnahme der Punkte auf der Seite, die der Ausflussröhre gegenüber liegen. Berechnen wir den Impuls, der aufgrund dieses Drucks mit dem Strahl ausfließt, so können wir zeigen, dass der Ausflusskoeffizient 1/2 ist. Diese Methode können wir jedoch nicht für ein Ausflussloch wie das in Abbildung 11.7 verwenden, weil die Geschwindigkeitszunahme entlang der Wand in der Nähe des Ausflussbereichs einen Druckabfall bewirkt, den wir berechnen können.

11.3 Stationäre Strömung – das Theorem von Bernoulli

v1

v2

v1

237

Abb. 11.9: Der Druck ist am kleinsten, wo die Geschwindigkeit am größten ist.

Betrachten wir ein anderes Beispiel – eine horizontale Röhre, deren Querschnitt sich wie in Abbildung 11.9 ändert und bei der an einem Ende Wasser herein- und am anderen Ende Wasser hinausfließt. Gemäß der Energieerhaltung, das heißt der Bernoulli-Formel, ist der Druck in dem kontrahierten Bereich niedriger, in dem die Geschwindigkeit größer ist. Wir können diesen Effekt leicht demonstrieren, indem wir den Druck an den verschieden großen Querschnitten mithilfe von kleinen vertikalen Wassersäulen messen, die mit der Stromröhre durch hinreichend kleine Löcher verbunden sind, sodass durch sie die Strömung nicht beeinträchtigt wird. Der Druck wird dann anhand der Wasserhöhe in diesen vertikalen Säulen gemessen. Es stellt sich heraus, dass der Druck an der Verengung kleiner als auf einer der beiden Seiten ist. Wenn der Querschnitt jenseits der Verengung seinen vorherigen Wert wiedererlangt, so steigt der Druck erneut an. Nach der Bernoulli-Formel müsste eigentlich der Druck stromabwärts der Verengung derselbe wie stromaufwärts sein, aber in Wirklichkeit ist er merklich kleiner. Unsere Vorhersage ist deshalb falsch, weil wir die viskosen Reibungskräfte vernachlässigt haben, die einen Druckabfall entlang der Röhre verursachen. Trotz dieses Druckabfalls ist der Druck in der Verengung entschieden niedriger (aufgrund der erhöhten Geschwindigkeit) als auf der einen oder anderen Seite – wie es Bernoulli vorhergesagt hat. Die Geschwindigkeit v2 muss unbedingt größer als v1 sein, um dieselbe Wassermenge durch die engere Röhre zu bringen. Somit wird das Wasser beim Übergang von der weiteren in die engere Röhre beschleunigt. Die Kraft, die diese Beschleunigung bewirkt, beruht auf dem Druckabfall. Wir können unsere Resultate anhand einer anderen einfachen Demonstration überprüfen. Stellen wir uns eine Ausflussröhre an einem Behälter vor, aus der ein Wasserstrahl nach  oben geschleudert wird, wie in Abbildung 11.10. Wäre die Ausflussgeschwindigkeit genau 2gh, so müsste das ausfließende Wasser dieselbe Höhe wie die Wasseroberfläche im Tank erreichen. Experimentell zeigt sich, dass es etwas weniger hoch spritzt. Unsere Vorhersage ist im Großen und Ganzen richtig, aber auch hier führt die viskose Reibung, die nicht in die Formel der Energieerhaltung einbezogen wurde, zu einem Energieverlust. Haben Sie schon einmal zwei Blatt Papier aneinandergehalten und dann versucht, sie auseinander zu blasen? Versuchen Sie es! Sie kommen wieder zusammen. Der Grund dafür ist natürlich der, dass die Luft beim Durchgang durch den verengten Raum eine größere Geschwindigkeit als außerhalb davon hat. Der Druck zwischen den Blättern ist niedriger als der atmosphärische Druck, also bleiben sie beieinander, anstatt auseinander zu flattern.

238

11 Die Strömung von trockenem Wasser

Abb. 11.10: Demonstration, dass v nicht gleich

11.4



2gh ist.

Zirkulation

Zu Beginn des vorigen Abschnitts haben wir gesehen, dass die Strömung in einer inkompressiblen Flüssigkeit ohne Zirkulation die beiden folgenden Gleichungen erfüllt: ∇ · u = 0,

∇ × u = 0.

(11.19)

Es handelt sich um dieselben Gleichungen wie die der Elektrostatik bzw. der Magnetostatik im leeren Raum. Die Divergenz des elektrischen Feldes ist null, wenn keine Ladungen vorhanden sind, und die Rotation des elektrostatischen Feldes ist immer null. Die Rotation des magnetostatischen Feldes ist null, wenn keine Ströme auftreten, und die Divergenz des Magnetfeldes ist immer null. Infolgedessen haben die Gleichungen (11.19) dieselben Lösungen wie die Gleichungen für E in der Elektrostatik und die für B in der Magnetostatik. Tatsächlich haben wir das Problem einer Flüssigkeitsströmung an einer Kugel vorbei bereits in Band III, Abschnitt 12.5 als elektrostatischen Analogiefall gelöst. Das elektrostatische Analogon ist ein gleichförmiges elektrisches Feld plus einem Dipolfeld. Das Dipolfeld ist so angeordnet, dass die Strömungsgeschwindigkeit normal zur Kugeloberfläche null ist. Dasselbe Problem lässt sich auf analoge Weise für die Strömung an einem Zylinder vorbei lösen, indem man einen geeigneten linearen Dipol und ein gleichförmiges Strömungsfeld verwendet. Diese Lösung gilt für eine Situation, in der die Strömungsgeschwindigkeit in großen Abständen konstant ist – sowohl was den Betrag als auch die Richtung betrifft. Eine Skizze dieser Lösung finden Sie in Abbildung 11.11 (a). F

(a)

(b)

(c)

Abb. 11.11: (a) Ideale Flüssigkeitsströmung an einem Zylinder vorbei. (b) Zirkulation um einen Zylinder. (c) Die Überlagerung von (a) und (b).

11.4 Zirkulation

239

Es gibt eine andere Lösung für die Strömung um einen Zylinder, wenn die Bedingungen so sind, dass sich die Flüssigkeit in großen Abständen im Kreis um den Zylinder bewegt. Die Strömung ist dann, wie in Abbildung 11.11 (b), überall kreisförmig. Eine solche Strömung hat eine Zirkulation um den Zylinder, obwohl ∇ × u in der Flüssigkeit immer noch null ist.

Wie kann es eine Zirkulation ohne Rotation geben? Es liegt eine Zirkulation um den Zylinder vor, weil das Linienintegral von u um jede Schleife, die den Zylinder umgibt, nicht null ist. Gleichzeitig verschwindet das Linienintegral von u um jeden geschlossenen Weg, der den Zylinder nicht umgibt. Wir waren schon einmal auf denselben Sachverhalt gestoßen, als wir das Magnetfeld um einen Draht berechneten. Die Rotation von B war außerhalb des Drahtes null, obwohl das Linienintegral von B auf einem Weg, der den Draht umläuft, nicht verschwindet. Das Geschwindigkeitsfeld in einer wirbelfreien Zirkulation um einen Zylinder ist genau dasselbe wie das Magnetfeld um einen Draht. Für einen kreisförmigen Weg, dessen Mittelpunkt mit dem des Zylinders zusammenfällt, ist das Linienintegral der Geschwindigkeit  u · d s = 2πrv. In einer wirbelfreien Strömung muss das Integral unabhängig von r sein. Bezeichnen wir den konstanten Wert mit C, so ergibt sich, dass C , 2πr wobei v die Tangentialgeschwindigkeit und r der Abstand von der Achse ist. v=

(11.20)

Es gibt eine nette Demonstration einer Flüssigkeit, die um ein Loch zirkuliert. Sie verwenden einen durchsichtigen zylinderförmigen Behälter, auf dessen Boden sich in der Mitte ein Abflussloch befindet. Sie füllen ihn mit Wasser, erzeugen durch Rühren mit einem Stab eine Zirkulation und ziehen dann den Stöpsel. Sie erhalten den hübschen Effekt, der in Abbildung 11.12 dargestellt ist. (Etwas Ähnliches haben Sie viele Male in der Badewanne beobachtet!) Obwohl Sie am Anfang ein gewisses ω einführen, hört es aufgrund der Viskosität bald auf und die Strömung wird wirbelfrei – obwohl sie immer noch eine gewisse Zirkulation um das Loch aufweist.

Abb. 11.12: Zirkulierendes Wasser, das aus einem Behälter fließt.

Anhand der Theorie können wir die Gestalt der Oberfläche des Wassers berechnen. Während ein Wasserteilchen nach innen rückt, gewinnt es an Geschwindigkeit. Gemäß (11.20) nimmt

240

11 Die Strömung von trockenem Wasser

die Tangentialgeschwindigkeit wie 1/r zu; das beruht ganz einfach auf der Erhaltung des Drehimpulses, wie bei der Eiskunstläuferin, die ihre Arme an sich zieht. Auch die Radialgeschwindigkeit nimmt wie 1/r zu. Vernachlässigen wir die Tangentialbewegung, so bewegt sich das Wasser radial nach innen auf ein Loch zu; aus ∇ · u = 0 folgt, dass die Radialgeschwindigkeit proportional zu 1/r ist. Somit nimmt auch die Gesamtgeschwindigkeit wie 1/r zu und das Wasser dringt entlang archimedischer Spiralen nach innen. Die Luft-Wasser-Oberfläche steht zur Gänze unter atmosphärischem Druck, sodass sie – laut (11.14) – die Eigenschaft haben muss, dass gz + 12 v2 = konst. v ist aber proportional zu 1/r, folglich ist die Form der Oberfläche (z − z0 ) =

k . r2

Ein interessanter Aspekt – der nicht allgemein gilt, sondern nur für die inkompressible, wirbelfreie Strömung – ist, dass die Summe einer Lösung und einer zweiten Lösung ebenfalls eine Lösung ist. Das ist richtig, weil die Gleichungen in (11.19) linear sind. Die vollständigen Gleichungen der Hydrodynamik, die Gleichungen (11.9), (11.10) und (11.11), sind dagegen nichtlinear, was einen großen Unterschied bedeutet. Für die wirbelfreie Strömung um den Zylinder können wir jedoch die Strömung von Abbildung 11.11 (a) und die von Abbildung 11.11 (b) überlagern und erhalten das neue Strömungsmuster, das in Abbildung 11.11 (c) gezeigt ist. Diese Strömung ist von speziellem Interesse. Die Strömungsgeschwindigkeit ist auf der oberen Seite des Zylinders größer als auf der unteren. Infolgedessen ist der Druck auf der oberen Seite niedriger als auf der unteren. Liegt daher eine Kombination einer Zirkulation um einen Zylinder und eine insgesamt horizontale Strömung vor, so wirkt auf den Zylinder eine insgesamte vertikale Kraft, die die Hebekraft heißt. Natürlich wirkt nach unserer Theorie des „trockenen“ Wassers keine Gesamtkraft auf einen Körper, wenn keine Zirkulation auftritt.

11.5

Wirbellinien

Wir haben bereits die allgemeinen Gleichungen für die Strömung in einer inkompressiblen Flüssigkeit angeschrieben, wenn kein Wirbelvektor vorliegt. Diese sind I. II. III.

∇ · u = 0, Ω = ∇ × u, ∂Ω + ∇ × ( Ω × u) = 0. ∂t

Der physikalische Gehalt dieser Gleichungen wurde von Helmholtz mithilfe von drei Theoremen in Worten ausgedrückt. Stellen Sie sich als Erstes vor, wir zeichnen in der Flüssigkeit Wirbellinien anstelle von Stromlinien. Unter Wirbellinien verstehen wir Feldlinien in der Richtung von Ω, die in jedem Bereich eine Dichte proportional zum Betrag von Ω haben. Laut Gleichung II ist die Divergenz von Ω immer null (erinnern Sie sich daran, dass – Band III, Abschnitt 3.7 – die Divergenz einer Rotation immer null ist). Folglich sind Wirbellinien so wie die Linien

11.5 Wirbellinien

241

von B – sie fangen nirgendwo an, hören nirgendwo auf und bilden geschlossene Schleifen. Die verbale Formulierung von Gleichung III fand Helmholtz mit der folgenden Aussage: Die Wirbellinien bewegen sich mit der Flüssigkeit. Das bedeutet: Wenn Sie die Flüssigkeitsteilchen entlang von Wirbellinien markieren – indem Sie sie beispielsweise mit Tinte färben –, so zeigen diese immer die neue Lage der Wirbellinie an, wenn die Flüssigkeit sich bewegt und diese Teilchen mitführt. Wie auch immer sich die Atome der Flüssigkeit bewegen, die Wirbellinien bewegen sich mit ihnen mit. Das ist eine Möglichkeit, die Gesetze zu beschreiben. Sie verweist uns auch auf eine Methode zur Lösung aller Probleme. Ist das anfängliche Strömungsmuster gegeben – sagen wir u überall –, so können Sie Ω berechnen. Kennen Sie u, so können Sie auch sagen, wo sich die Wirbellinien etwas später befinden – sie bewegen sich mit der Geschwindigkeit u. Kennen Sie das neue Ω, so können Sie mithilfe der Gleichungen I und II das neue u finden. (Es handelt sich um dasselbe Problem wie das Auffinden von B bei vorgegebenen Strömen.) Kennen wir das Strömungsmuster zu einem Zeitpunkt, so können wir es im Prinzip für alle folgenden Zeitpunkte berechnen. Wir haben die allgemeine Lösung für eine nicht-viskose Strömung gefunden.

Flächeninhalt A2

Flächeninhalt A1

(a)

(b)

Ω1

Ω2

Abb. 11.13: (a) Eine Gruppe von Wirbellinien zum Zeitpunkt t; (b) dieselben Linien zu einem späteren Zeitpunkt t .

Wir möchten zeigen, wie die Aussage von Helmholtz – und folglich Gleichung III – zumindest teilweise verstanden werden kann. Es handelt sich letztlich einfach um den Erhaltungssatz des Drehimpulses in Anwendung auf eine Flüssigkeit. Stellen wir uns einen kleinen Flüssigkeitszylinder vor, dessen Achsen wie in Abbildung 11.13 (a) parallel zu den Wirbellinien sind. Zu einem späteren Zeitpunkt befindet sich dieses selbe Stück Flüssigkeit an einer anderen Stelle. Im Allgemeinen wird es einen Zylinder mit einem anderen Durchmesser an anderer Stelle einnehmen. Es kann auch eine andere Ausrichtung, wie beispielsweise die in Abbildung 11.13 (b) haben. Hat sich jedoch der Durchmesser geändert, so hat auch die Länge zugenommen, damit das Volumen konstant bleibt (da wir von einer inkompressiblen Flüssigkeit ausgehen). Da ferner die Wirbellinien mit dem Material verbunden sind, nimmt ihre Dichte bei abnehmender Querschnittsfläche zu. Das Produkt des Betrags des Wirbelvektors Ω und des Flächeninhalts A des Zylinders bleibt konstant, sodass laut Helmholtz Ω2 A2 = Ω 1 A1 .

(11.21)

242

11 Die Strömung von trockenem Wasser

Beachten Sie nun, dass bei fehlender Viskosität alle Kräfte auf die Oberfläche des Zylindervolumens (sowie auf jegliches Volumen) senkrecht zur Oberfläche sind. Die Druckkräfte können dann zwar bewirken, dass das Volumen von einer Stelle an eine andere rückt oder dass es seine Form ändert; doch ohne tangentiale Kräfte kann sich der Betrag des Drehimpulses des Materials im Innern nicht ändern. Der Drehimpuls der Flüssigkeit in dem kleinen Zylinder ist ihr Trägheitsmoment I mal der Winkelgeschwindigkeit der Flüssigkeit, die proportional zu Ω ist. Für einen Zylinder ist das Trägheitsmoment proportional zu mr2 . Also können wir aus der Erhaltung des Drehimpulses schließen, dass     M1 R21 Ω1 = M2 R22 Ω2 . Aber die Masse ist dieselbe, also M1 = M2 , und die Flächeninhalte sind proportional zu R2 , folglich erhalten wir erneut genau (11.21). Die helmholtzsche Aussage – die äquivalent zu Gleichung III ist – ist lediglich eine Konsequenz der Tatsache, dass sich in Abwesenheit von Viskosität der Drehimpuls eines Elements der Flüssigkeit nicht ändern kann.

Abb. 11.14: Demonstration eines sich bewegenden Wirbelrings.

Es gibt eine hübsche Demonstration eines sich bewegenden Wirbels, die mit der einfachen Anordnung von Abbildung 11.14 vorgeführt werden kann. Es handelt sich um eine „Trommel“, deren Durchmesser und Länge je 2/3 m betragen und die aus einer dicken Gummischicht besteht, die über das offene Ende einer zylinderförmigen „Schachtel“ gespannt ist. Die Trommel liegt auf der Seite, und ihr „Boden“, der massiv ist, weist ein Loch mit einem Durchmesser von 8 cm auf. Versetzen Sie der Gummimembran mit der Hand einen scharfen Schlag, so wird ein Wirbelring aus dem Loch geschleudert. Obwohl der Wirbel unsichtbar ist, können Sie zeigen, dass es ihn gibt, weil er eine Kerze in einer Entfernung von 3 bis 6 Metern ausblasen kann. Aufgrund der Verzögerung des Effekts können Sie sagen, dass sich „irgendetwas“ mit einer endlichen Geschwindigkeit bewegt. Sie können das Geschehen jedoch besser beobachten, wenn Sie anfangs etwas Rauch in die Schachtel blasen. Sie sehen dann den Wirbel als wunderschönen runden „Rauchring“. Der Rauchring ist ein torusförmiges Bündel von Wirbellinien, wie sie in Abbildung 11.15 (a) dargestellt sind. Da Ω = ∇×u, stellen diese Wirbellinien die Zirkulation von u wie in Teil (b) der Abbildung dar. Die Vorwärtsbewegung des Rings können wir in der folgenden Weise verstehen: Die Zirkulationsgeschwindigkeit um den unteren Teil des Rings erstreckt sich bis zum oberen Teil des Rings, wo sie eine Vorwärtsbewegung aufweist. Da sich die Linien von Ω mit der Flüssigkeit bewegen, dringen sie auch mit der Geschwindigkeit u nach vorn. (Natürlich ist die Zirkulation von u um den oberen Teil des Rings für die Vorwärtsbewegung der Wirbellinien am unteren Teil verantwortlich.) Nun müssen wir ein ernstes Problem erwähnen. Wir haben bereits bemerkt, dass laut Gleichung (11.9) Ω immer null ist, wenn es zu Anfang null war. Dieses Resultat ist ein großes

11.5 Wirbellinien

243

Wirbellinien (a) Bewegungsrichtung

u oberer Teil (b) Wirbellinien

u u

unterer Teil u

Bewegungsrichtung Abb. 11.15: Ein sich bewegender Wirbelring (ein Rauchring). (a) Wirbellinien. (b) Ein Querschnitt des Rings.

Manko der Theorie des „trockenen“ Wassers, denn es bedeutet, dass Ω immer null ist, wenn es einmal null war – es ist unmöglich, unter irgendwelchen Umständen einen Wirbelvektor zu erzeugen. Hingegen können wir in unserer Demonstration mit der Trommel einen Wirbelring erzeugen, indem wir mit anfänglich ruhender Luft beginnen. (Natürlich war überall in der Schachtel u = 0, Ω = 0, bevor wir ihr einen Schlag versetzten.) Außerdem wissen wir alle, dass wir in einem See mit einem Ruder einen Wirbelvektor erzeugen können. Offensichtlich müssen wir zu einer Theorie des „nassen“ Wassers übergehen, um das Verhalten einer Flüssigkeit vollständig zu verstehen. Ein anderer unrichtiger Aspekt der Theorie des trockenen Wassers ist die Annahme, die wir bezüglich der Strömung an der Grenzfläche zwischen dem Wasser und einem Festkörper machen. Als wir beispielsweise die Strömung an einem Zylinder vorbei – wie in Abbildung 11.11 – diskutierten, ließen wir zu, dass die Flüssigkeit an der Oberfläche des Festkörpers entlangglitt. In unserer Theorie konnte die Geschwindigkeit an einer Festkörperoberfläche je nach Ausgangssituation jeden beliebigen Wert annehmen, und wir haben keinerlei „Reibung“ zwischen der Flüssigkeit und dem Festkörper einbezogen. Es ist jedoch eine experimentelle Tatsache, dass die Geschwindigkeit einer realen Flüssigkeit an der Oberfläche eines festen Gegenstandes immer null ist. Infolgedessen ist unsere Lösung für den Zylinder, mit oder ohne Zirkulation, falsch – und desgleichen unser Resultat bezüglich der Unmöglichkeit der Erzeugung eines Wirbelvektors. Das nächste Kapitel wird Ihnen die richtigen Theorien vermitteln.

12

Die Strömung von nassem Wasser

12.1

Viskosität

Im vorangegangenen Kapitel haben wir das Verhalten von Wasser untersucht, ohne das Phänomen der Viskosität zu beachten. Jetzt wollen wir die Phänomene der Flüssigkeitsströmung einschließlich der Viskositätseffekte betrachten. Wir wollen das reale Verhalten von Flüssigkeiten analysieren. Wir werden das Verhalten der Flüssigkeiten in einigen unterschiedlichen Situationen qualitativ beschreiben, damit Sie das Thema gewissermaßen intuitiv erfassen. Obwohl Sie auf komplizierte Gleichungen stoßen und von komplizierten Dingen hören werden, liegt es nicht in unserer Absicht, dass Sie all das lernen müssen. Es handelt sich hier eher um ein „kulturelles“ Kapitel, das Ihnen eine Vorstellung von der Beschaffenheit der Welt vermitteln soll. Nur eines sollten Sie versuchen sich zu merken, und das ist die einfache Definition der Viskosität, der wir im nächsten Moment begegnen. Alles andere dient nur zu Ihrer Unterhaltung. Im vorangegangenen Kapitel haben wir festgestellt, dass die Bewegungsgesetze einer Flüssigkeit durch die folgende Gleichung gegeben sind: ∂u ∇p f visk + ( u · ∇) u = − − ∇φ + . ∂t ρ ρ

(12.1)

In unserer Näherung des „trockenen“ Wassers haben wir den letzten Term ausgelassen und dadurch alle Viskositätseffekte vernachlässigt. Außerdem haben wir einige Male eine zusätzliche Näherung gemacht, indem wir die Flüssigkeit als inkompressibel betrachtet haben; dann gilt die zusätzliche Gleichung ∇ · u = 0. Diese letzte Näherung ist oft sehr gut – insbesondere dann, wenn die Strömungsgeschwindigkeit sehr viel kleiner als die Schallgeschwindigkeit ist. Doch trifft für reale Flüssigkeiten fast niemals zu, dass wir die innere Reibung, die so genannte Viskosität oder Zähigkeit, vernachlässigen können; die meisten interessanten Dinge, die passieren können, beruhen in der einen oder anderen Weise auf der Viskosität. Beispielsweise haben wir bei „trockenem“ Wasser gesehen, dass sich die Zirkulation nie ändert – ist am Anfang keine vorhanden, so gibt es nie eine. Hingegen ist die Zirkulation in Flüssigkeiten eine alltägliche Erscheinung. Wir müssen also unsere Theorie anpassen. Wir beginnen mit einer wichtigen experimentellen Tatsache. Als wir die Strömung des „trockenen“ Wassers um einen Zylinder oder an einem Zylinder vorbei – die so genannte „Potentialströmung“ – berechneten, hatten wir keinen Grund, die Möglichkeit ausschließen, dass das

246

12 Die Strömung von nassem Wasser

Wasser eine Geschwindigkeit tangential zur Oberfläche hat; nur die Normalkomponente musste null sein. Wir haben jedoch nicht die Möglichkeit einbezogen, dass es zwischen der Flüssigkeit und dem Festkörper eine Scherkraft geben könne. Es stellt sich heraus – obwohl es keineswegs unmittelbar einleuchtend ist –, dass unter allen Umständen, die experimentell überprüft wurden, die Flüssigkeitsgeschwindigkeit an der Oberfläche eines Festkörpers genau null ist. Sie haben zweifellos schon einmal bemerkt, dass sich auf dem Blatt eines Ventilators eine dünne Staubschicht ansammelt und dass diese auch dann noch da ist, wenn der Ventilator die Luft aufgewirbelt hat. Denselben Effekt können Sie sogar bei dem großen Ventilator eines Windkanals beobachten. Warum wird der Staub nicht von der Luft weggeblasen? Obwohl sich das Ventilatorblatt mit großer Geschwindigkeit durch die Luft bewegt, fällt die Luftgeschwindigkeit relativ zum Ventilatorblatt an der Oberfläche auf null ab. Infolgedessen werden die kleinsten Staubteilchen nicht aufgerührt.1 Wir müssen die Theorie dahingehend abändern, dass sie mit der experimentellen Tatsache übereinstimmt, dass in allen üblichen Flüssigkeiten die Moleküle in der Nähe einer festen Oberfläche (relativ zu dieser) die Geschwindigkeit null haben.2 Flächeninhalt A

d

v0

F Flüssigkeit

v

v=0

Abb. 12.1: Viskose Schleppbewegung zwischen zwei parallelen Platten.

Ursprünglich haben wir eine Flüssigkeit durch die Eigenschaft charakterisiert, dass sie keinen Widerstand leistet, wenn man eine – auch noch so kleine – Scherkraft auf sie wirken lässt. Sie strömt. In statischen Situationen gibt es keine Scherkräfte. Aber ehe das Gleichgewicht erreicht wird – solange man noch Druck ausübt – können Scherkräfte auftreten. Die Viskosität beschreibt diese Scherkräfte, die es in einer sich bewegenden Flüssigkeit gibt. Um ein Maß für die Scherkräfte während der Bewegung einer Flüssigkeit zu erhalten, betrachten wir ein Experiment der folgenden Art: Stellen wir uns zwei feste ebene Flächen vor, zwischen denen sich wie in Abbildung 12.1 Wasser befindet, und wir halten die eine stationär, während wir die andere mit der kleinen Geschwindigkeit v0 parallel dazu bewegen. Messen Sie die Kraft, die notwendig ist, um die obere Platte in Bewegung zu halten, so stellen Sie fest, dass die Kraft proportional zum Flächeninhalt der Platten und zu v0 /d ist, wobei d der Abstand zwischen den Platten ist. Daher ist die Scherspannung F/A proportional zu v0 /d: F v0 =η . A d Die Proportionalitätskonstante η heißt der Viskositätskoeffizient (Zähigkeitskoeffizient). 1 2

Man kann große Staubteilchen von einer Tischfläche wegblasen, aber nicht die sehr kleinen. Die großen reichen bis in die Luftströmung hinein. Sie können sich Umstände vorstellen, unter denen das nicht zutrifft: Glas ist theoretisch eine „Flüssigkeit“, aber es kann natürlich entlang einer Stahloberfläche zum Gleiten gebracht werden. Somit muss unsere Behauptung irgendwo an Gültigkeitsgrenzen stoßen.

12.1 Viskosität

ΔA

247

ΔF

vx + Δvx

Δy v

Abb. 12.2: Die Scherspannung in einer viskosen Flüssigkeit.

Liegt eine kompliziertere Situation vor, so können wir immer eine kleine, flache, rechteckige Zelle im Wasser betrachten, deren Seitenflächen wie in Abbildung 12.2 parallel zur Strömung sind. Die Scherkraft zwischen den Seitenflächen dieser Zelle ist gegeben durch ΔF Δv x ∂v x =η =η . ΔA Δy ∂y

(12.2)

Nun ist ∂v x /∂y die Änderungsrate der Scherdehnung, die wir in Kapitel 10 definiert haben, sodass die Scherspannung für eine Flüssigkeit proportional zur Änderungsrate der Scherdehnung ist. Im allgemeinen Fall können wir schreiben   ∂vy ∂v x S xy = η + . ∂x ∂y

(12.3)

Liegt eine gleichförmige Rotation der Flüssigkeit vor, so ist ∂v x /∂y entgegengesetzt gleich ∂vy /∂x und S xy ist null – wie es sein muss, da es in einer gleichförmig rotierenden Flüssigkeit keine Spannungen gibt. (Etwas Ähnliches haben wir gesehen, als wir in Kapitel 10 e xy definiert haben.) Es gibt natürlich auch die entsprechenden Ausdrücke für S yz und S zx . Als ein Beispiel für die Anwendung dieser Konzepte betrachten wir die Bewegung einer Flüssigkeit zwischen zwei koaxialen Zylindern. Der innere Zylinder habe den Radius a und die periphere Geschwindigkeit va und der äußere den Radius b und die Geschwindigkeit vb . Siehe Abbildung 12.3. Wir fragen: Wie ist die Geschwindigkeitsverteilung zwischen den Zylindern? Um diese Frage zu beantworten, suchen wir zunächst eine Formel für die viskose Scherung in der Flüssigkeit in einem Abstand r von der Achse. Aufgrund der Symmetrie des Problems können wir annehmen, dass die Strömung immer tangential ist und dass ihr Betrag nur von r abhängt; v = v(r). Beobachten wir eine Flocke im Wasser im Abstand r von der Achse, so sind ihre Koordinaten als Funktion der Zeit x = r cos ωt,

y = r sin ωt,

wobei ω = v/r ist. Die x- und y-Komponenten der Geschwindigkeit sind v x = −rω sin ωt = −ωy

und

vy = rω cos ωt = ωx.

Aus (12.3) erhalten wir     ∂ ∂ω ∂ω ∂ (xω) − (yω) = η x −y . S xy = η ∂x ∂y ∂x ∂y

(12.4)

(12.5)

248

12 Die Strömung von nassem Wasser y

a

r

b

x va Abb. 12.3: Die Strömung in einer Flüssigkeit zwischen zwei konzentrischen Zylindern, die sich mit verschiedenen Winkelgeschwindigkeiten drehen.

Flüssigkeit vb

Für einen Punkt mit y = 0 ist ∂ω/∂y = 0 und x ∂ω/∂x ist dasselbe wie r dω/dr. Somit ist an diesem Punkt (S xy )y=0 = ηr

dω . dr

(12.6)

(Es ist vernünftig, dass S von ∂ω/∂r abhängt: Wenn sich ω nicht mit r ändert, so befindet sich die Flüssigkeit in gleichförmiger Rotation und es gibt keine Spannungen.) Die Spannung, die wir berechnet haben, ist die tangentiale Scherung, die überall um den Zylinder herum gleich ist. Wir können das Drehmoment bestimmen, das auf eine zylinderförmige Oberfläche mit dem Radius r wirkt, indem wir die Scherspannung mit dem Kraftarm r und dem Flächeninhalt 2πrl multiplizieren (l ist die Länge des Zylinders). Wir erhalten τ = 2πr2 l (S xy )y=0 = 2πηlr3

dω . dr

(12.7)

Da die Bewegung des Wassers stetig ist – es gibt keine Winkelbeschleunigung –, muss das Gesamtdrehmoment auf die zylinderförmige Wasserschale zwischen r und r + dr null sein; das heißt, dass das Drehmoment auf die Oberfläche mit dem Radius r durch ein umgekehrt gleiches Drehmoment auf die Oberfläche mit dem Radius r + dr kompensiert werden muss, so dass τ unabhängig von r ist. Mit anderen Worten: r3 dω/dr ist gleich einer Konstanten, sagen wir A, und dω A = 3. dr r

(12.8)

Durch Integration finden wir, dass sich ω mit r ändert wie ω=−

A + B. 2r2

(12.9)

12.2 Viskose Strömung

249

Die Konstanten A und B müssen so bestimmt werden, dass die Bedingungen ω = ωa für r = a und ω = ωb für r = b erfüllt sind. Wir erhalten 2a2 b2 (ωb − ωa ) , b2 − a2 b2 ωb − a2 ωa B= . b2 − a2

A=

(12.10)

Somit kennen wir ω als Funktion von r, und das liefert uns die Geschwindigkeit v = ωr. Wollen wir das Drehmoment wissen, so können wir es aus den Gleichungen (12.7) und (12.8) erhalten: τ = 2πηlA oder τ=

4πηla2 b2 (ωb − ωa ). b2 − a2

(12.11)

Das Drehmoment ist proportional zur relativen Winkelgeschwindigkeit der beiden Zylinder. Ein klassischer Apparat zur Messung der Viskositätskoeffizienten ist auf nach diesem Prinzip konstruiert. Ein Zylinder – der äußere – ist drehbar befestigt, wird aber von einer Federwaage stationär gehalten, die das auf ihn wirkende Drehmoment misst, während sich der innere Zylinder mit konstanter Winkelgeschwindigkeit dreht. Der Viskositätskoeffizient wird dann mithilfe von (12.11) bestimmt. Anhand dieser Definition sehen Sie, dass die Einheit für η Newton·s/m2 ist. Für Wasser bei 20◦ C ist η = 10−3 N · s/m2 . Es ist gewöhnlich bequemer, wenn man die spezifische Viskosität (kinematische Viskosität) verwendet, die η dividiert durch die Dichte ρ ist. Die Werte für Wasser und Luft sind dann vergleichbar: Wasser bei 20◦ C,

η/ρ = 10−6 m2 /s,

Luft bei 20 C,

η/ρ = 15 × 10



−6

(12.12) 2

m /s

Die Viskositäten hängen gewöhnlich stark von der Temperatur ab. Beispielsweise ist η/ρ für Wasser gerade über dem Gefrierpunkt 1,8-mal größer als bei 20◦ C.

12.2

Viskose Strömung

Gehen wir nun zur allgemeinen Theorie der viskosen Strömung über – zumindest zur allgemeinsten Form, die der Mensch kennt. Wir haben uns bereits klargemacht, dass die Komponenten der Scherspannung proportional zu den räumlichen Ableitungen der Geschwindigkeitskomponenten wie ∂v x /∂y oder ∂vy /∂x sind. Jedoch gibt es im allgemeinen Fall einer kompressiblen

250

12 Die Strömung von nassem Wasser

Flüssigkeit einen anderen Term in der Spannung, der von anderen Ableitungen der Geschwindigkeit abhängt. Der allgemeine Ausdruck ist  ∂vi ∂v j S ij = η + η� δi j ( ∇ · u), + ∂x j ∂xi 

(12.13)

wobei xi jede der kartesischen Koordinaten x, y oder z und vi jede der kartesischen Geschwindigkeitskomponenten sein kann. (Das Symbol δi j ist das Kronecker-Delta, das 1 für i = j und 0 für i  j ist.) Der zusätzliche Term fügt zu allen Diagonalelementen S ii des Spannungstensors η� ∇ · u hinzu. Ist die Flüssigkeit inkompressibel, so ist ∇ · u = 0 und dieser Extraterm tritt nicht auf. Also hängt er mit den inneren Kräften während der Kompression zusammen. Daher sind zwei Konstanten notwendig, um die Flüssigkeit zu beschreiben, genauso wie wir zwei Konstanten benötigten, um einen homogenen elastischen Festkörper zu beschreiben. Der Koeffizient η ist der „gewöhnliche“ Viskositätskoeffizient, dem wir bereits begegnet sind. Er wird auch der erste Viskositätskoeffizient oder der „Koeffizient der Scherviskosität“ genannt und der neue Koeffizient η� heißt der zweite Viskositätskoeffizient. Nun wollen wir die Viskositätskraft pro Volumeneinheit, f visk , bestimmen, damit wir sie in (12.1) einsetzen können, um die Bewegungsgleichung einer realen Flüssigkeit zu erhalten. Die Kraft auf ein kleines würfelförmiges Volumenelement einer Flüssigkeit ist die Resultierende der Kräfte auf alle sechs Seitenflächen. Betrachten wir jeweils zwei Seitenflächen, so erhalten wir Differenzen, die von den Ableitungen der Spannungen und infolgedessen von den zweiten Ableitungen der Geschwindigkeiten abhängen. Das ist angenehm, denn damit kommen wir wieder zu einer Vektorgleichung. Die Komponente der Viskositätskraft pro Volumeneinheit in der Richtung der kartesischen Koordinate xi ist ( fvisk )i =

3  ∂S i j j=1

=

∂x j

   3  ∂ ∂vi ∂v j ∂ � η + + (η ∇ · u). ∂x ∂x ∂x ∂x j j i i j=1

(12.14)

Gewöhnlich ist die Abhängigkeit der Viskositätskoeffizienten vom Ort unwichtig und kann vernachlässigt werden. Die Viskositätskraft pro Volumeneinheit enthält dann nur zweite Ableitungen der Geschwindigkeit. Wie wir in Kapitel 10 gesehen haben, ist die allgemeinste Form, in der zweite Ableitungen in einer Vektorgleichung vorkommen können, die Summe eines Terms mit dem Laplace-Operator (∇ · ∇u = ∇2 u) und einem Term mit dem Gradienten der Divergenz (∇(∇ · u)). Gleichung (12.14) ist genau eine Summe dieser Art mit den Koeffizienten η und (η + η� ). Wir erhalten f visk = η ∇2 u + (η + η� ) ∇( ∇ · u).

(12.15)

Im inkompressiblen Fall ist ∇ · u = 0 und die Viskositätskraft pro Volumeneinheit ist einfach η ∇2 u. Das ist alles, was viele verwenden. Wollen Sie jedoch die Schallabsorption in einer Flüssigkeit berechnen, so brauchen Sie auch den zweiten Term.

12.3 Die Reynolds-Zahl

251

Wir können nun unsere allgemeine Bewegungsgleichung einer realen Flüssigkeit vervollständigen. Durch Einsetzen von (12.15) in Gleichung (12.1) erhalten wir   ∂u + ( u · ∇) u = − ∇p − ρ ∇φ + η ∇2 u + (η + η� ) ∇( ∇ · u). ρ ∂t Das ist kompliziert. Aber so ist die Natur nun einmal. Führen wir den Wirbelvektor Ω = ∇ × u ein, wie wir es schon früher getan haben, so können wir unsere Gleichung schreiben als   1 ∂u 2 + Ω × u + ∇v = − ∇p − ρ ∇φ + η∇2 u + (η + η� ) ∇( ∇ · u). (12.16) ρ ∂t 2 Auch hier nehmen wir wieder an, dass die einzigen Volumenkräfte, die wirken, konservative Kräfte wie die Schwerkraft sind. Um zu sehen, was der neue Ausdruck bedeutet, betrachten wir den Fall einer inkompressiblen Flüssigkeit. Bilden wir dann die Rotation von (12.16), so erhalten wir ∂Ω η + ∇ × ( Ω × u) = ∇2 Ω. ∂t ρ

(12.17)

Das ist bis auf den neuen Ausdruck auf der rechten Seite dasselbe wie Gleichung (11.9). Als die rechte Seite null war, hatten wir das Helmholtz-Theorem, demzufolge der Wirbelvektor mit der Flüssigkeit mitgeführt wird. Nun haben wir rechts den ziemlich komplizierten Ausdruck, der ungleich null ist, der aber direkte physikalische Konsequenzen hat. Lassen wir im Augenblick den Ausdruck ∇ × (Ω × u) beiseite, so liegt eine Diffusionsgleichung vor. Der neue Term bedeutet, dass der Wirbelvektor Ω durch die Flüssigkeit diffundiert. Tritt ein großer Gradient des Wirbelvektors auf, so breitet er sich in die benachbarte Flüssigkeit aus. Das ist der Term, der bewirkt, dass ein Rauchring dicker wird, wenn er sich weiterbewegt. Er wird deutlich sichtbar, wenn man einen „reinen“ Wirbel (einen „rauchlosen“ Ring, der mit dem im vorigen Kapitel beschriebenen Apparat hergestellt ist) durch eine Rauchwolke schickt. Wenn er aus der Wolke herauskommt, hat er einigen Rauch aufgesammelt und Sie werden die hohle Schale eines Rauchrings sehen. Ein Teil von Ω diffundiert nach außen in den Rauch, wobei er aber seine Vorwärtsbewegung mit dem Wirbel beibehält.

12.3

Die Reynolds-Zahl

Nun wollen wir die Veränderungen beschreiben, die im Charakter der Flüssigkeitsströmung infolge des neuen Viskositätsterms auftreten. Wir werden zwei Situationen ausführlich betrachten. Die erste ist die Flüssigkeitsströmung an einem Zylinder vorbei – eine Strömung, die wir in den vorhergehenden Kapiteln mithilfe der Theorie der nicht-viskosen Strömung zu berechnen versucht haben. Es stellt sich allerdings heraus, dass man die Viskositätsgleichungen heutzutage nur in einigen speziellen Fällen lösen kann. Daher beruht einiges, das wir hier sagen werden, auf experimentellen Messungen – unter der Annahme, dass das experimentelle Modell Gleichung (12.17) erfüllt.

252

12 Die Strömung von nassem Wasser

Das mathematische Problem ist das folgende: Wir suchen die Lösung für die Strömung einer inkompressiblen, viskosen Flüssigkeit an einem Zylinder vom Durchmesser D vorbei. Die Strömung sollte durch Gleichung (12.17) und durch (12.18)

Ω= ∇× u

bestimmt sein, wobei die Bedingungen gelten, dass die Geschwindigkeit in großen Abständen eine Konstante, etwa V(parallel zur x-Achse) ist und an der Oberfläche des Zylinders verschwindet. Das heißt, es gilt v x = vy = vz = 0 für x2 + y 2 =

D2 . 4

(12.19)

Damit ist das mathematische Problem genau angegeben. Betrachten Sie die Gleichungen, so sehen Sie, dass das Problem vier verschiedene Parameter enthält: η, ρ, D und V. Vielleicht denken Sie, wir müssten eine ganze Reihe von Fällen für verschiedene V, verschiedene D usw. betrachten. Das ist jedoch nicht der Fall. Alle verschiedenen möglichen Lösungen entsprechen verschiedenen Werten eines Parameters. Das ist die wichtigste allgemeine Tatsache bezüglich der viskosen Strömung. Um zu sehen, warum das so ist, stellen wir zunächst fest, dass die Viskosität und die Dichte nur in dem Verhältnis η/ρ – der spezifischen Viskosität – auftreten. Damit verringert sich die Zahl der unabhängigen Parameter auf drei. Nehmen wir nun an, wir messen alle Abstände in der einzigen Länge, die in dem Problem auftaucht, nämlich im Durchmesser D des Zylinders; das heißt, wir setzen für x, y, z, die neuen Variablen x� , y� , z� ein, wobei x = x� D,

y = y� D,

z = z� D.

Dann verschwindet D in Gleichung (12.19). Auf dieselbe Weise werden wir V los, wenn wir alle Geschwindigkeiten in Einheiten von V messen – das heißt, wenn wir v = v� V setzen, wobei v� in großen Abständen einfach gleich 1 ist. Da wir die Einheiten der Länge und der Geschwindigkeit festgesetzt haben, ist unsere Zeiteinheit jetzt D/V; wir müssen daher setzen t = t�

D . V

(12.20)

Mit diesen neuen Variablen ändern sich die Ableitungen in (12.18) von ∂/∂x in (1/D) ∂/∂x� und so fort; aus (12.18) wird daher Ω= ∇× u=

V � V � ∇ × u� = Ω. D D

Unsere Hauptgleichung (12.17) lautet dann ∂Ω� η ∇�2 Ω� . + ∇� × ( Ω� × u� ) = � ∂t ρV D

(12.21)

12.3 Die Reynolds-Zahl

253

Alle Konstanten werden zu einem Faktor, den wir traditionsgemäß als 1/R schreiben, wobei R die Reynolds-Zahl: R=

ρ V D. η

(12.22)

Denken wir daran, dass alle Größen in allen unseren Gleichungen in den neuen Einheiten geschrieben werden müssen, so können wir die Striche weglassen. Unsere Gleichungen für die Strömung sind dann

und

∂Ω 1 + ∇ × ( Ω × u) = ∇2 Ω ∂t R

(12.23)

Ω= ∇× u mit den Bedingungen u=0 für x2 + y2 = 1/4

(12.24)

und v x = 1,

vy = vz = 0

für x2 + y2 + z2 � 1. Was all das physikalisch bedeutet, ist sehr interessant. Wenn wir beispielsweise das Problem der Strömung für eine Geschwindigkeit V1 und einen bestimmten Zylinderdurchmesser D1 lösen und dann nach der Strömung bei einem anderen Durchmesser D2 und einer anderen Flüssigkeit fragen, so bedeutet es, dass die Strömung für jene Geschwindigkeit V2 dieselbe sein wird, die die gleiche Reynolds-Zahl ergibt, das heißt, wenn R1 =

ρ1 ρ2 V1 D1 = R2 = V 2 D2 . η1 η2

(12.25)

Für beliebige zwei Situationen, die die gleiche Reynolds-Zahl haben, schauen die Strömungen „gleich“ aus – ausgedrückt durch x� , y� , z� , und t� in einer geeigneten Skala. Das ist ein wichtiger Sachverhalt, denn er bedeutet, dass wir das Strömungsverhalten der Luft an einem Flugzeugflügel vorbei bestimmen können, ohne ein Flugzeug bauen und es erproben zu müssen. Wir können stattdessen ein Modell bauen und die Messungen mithilfe einer Geschwindigkeit durchführen, die dieselbe Reynolds-Zahl ergibt. Aufgrund dieses Prinzips können wir die durch „Windkanal“-Messungen an maßstabgerechten kleinen Flugzeugmodellen oder an verkleinerten Modellbooten in einem „Modellkanal“ gewonnenen Resultate auf die Gegenstände in ihrer natürlichen Größe anwenden. Erinnern Sie sich jedoch daran, dass wir das nur dann tun

254

12 Die Strömung von nassem Wasser

können, wenn die Kompressibilität der Flüssigkeit vernachlässigbar ist. Anderenfalls tritt eine weitere Größe auf – die Schallgeschwindigkeit. Und verschiedene Situationen werden nur dann einander wirklich entsprechen, wenn das Verhältnis von V zur Schallgeschwindigkeit ebenfalls dasselbe ist. Dieses letztere Verhältnis nennt man die Machsche Zahl. Somit sind die Strömungen für Geschwindigkeiten nahe bei oder über der Schallgeschwindigkeit in zwei Situationen nur dann dieselben, wenn sowohl die machsche Zahl als auch die Reynolds-Zahl in beiden Situationen gleich sind.

12.4

Die Strömung an einem kreisförmigen Zylinder vorbei

Kehren wir zu dem Problem der Strömung einer langsamen (nahezu inkompressiblen) Flüssigkeit um einen Zylinder zurück. Wir geben eine qualitative Beschreibung der Strömung einer realen Flüssigkeit. Es gibt vieles, was wir bezüglich einer solchen Strömung wissen möchten – beispielsweise die Größe der Widerstandskraft, die auf den Zylinder wirkt. Die auf einen Zylinder wirkende Widerstandskraft ist in Abbildung 12.4 als Funktion von R graphisch dargestellt – wobei R proportional zur Luftgeschwindigkeit V ist, wenn alles andere konstant gehalten wird. Was die Kurve in Wirklichkeit darstellt, ist der so genannte Widerstandsbeiwert C D , bei dem es sich um eine dimensionslose Zahl handelt, die gleich der Kraft dividiert durch 21 ρV 2 Dl ist, wobei D der Durchmesser, l die Länge des Zylinders und ρ die Dichte der Flüssigkeit ist: CD =

F 1 2 2 ρV Dl

.

CD

3

2

stationär periodisch (laminar) ∂v =0 ∂t

1

0

1

10

102

periodisch (turbulent)

103

104

105

turbulente Randzone 106

107 R

Abb. 12.4: Der Widerstandsbeiwert C D eines kreisförmigen Zylinders als Funktionder Reynolds-Zahl.

12.4 Die Strömung an einem kreisförmigen Zylinder vorbei

255

Der Widerstandsbeiwert ändert sich auf komplizierte Weise, weswegen er uns vermuten lässt, dass sich in der Strömung etwas sehr Interessantes und Kompliziertes abspielt. Wir werden nun die Art der Strömung für verschiedene Bereiche der Reynolds-Zahl beschreiben. Zuerst ist die Strömung bei sehr kleiner Reynolds-Zahl nahezu stationär; das heißt, dass die Geschwindigkeit überall konstant ist und dass der Zylinder umströmt wird. Die tatsächliche Verteilung der Stromlinien ist jedoch nicht dieselbe wie bei der Potentialströmung. Die Verteilung ist die Lösung einer etwas anderen Gleichung. Ist die Geschwindigkeit niedrig, oder ist äquivalent dazu die Viskosität sehr hoch, verhält sich also die Materie wie Honig, so sind die Trägheitsterme vernachlässigbar und die Strömung wird beschrieben durch die Gleichung ∇2 Ω = 0.

Diese Gleichung wurde zum ersten Mal von Stokes gelöst. Er löste das analoge Problem auch für eine Kugel. Bewegt sich eine kleine Kugel unter den Bedingungen einer kleinen ReynoldsZahl, so ist die Kraft, die notwendig ist, um sie zu schleppen, gleich 6πηaV, wobei a der Radius der Kugel und V ihre Geschwindigkeit ist. Das ist eine sehr nützliche Formel, denn sie liefert uns die Geschwindigkeit, mit der sich winzige Schmutzkörnchen (oder andere Teilchen, die näherungsweise Kugeln sind) unter der Einwirkung einer vorgegebenen Kraft durch eine Flüssigkeit bewegen – wie beispielsweise in einer Zentrifuge oder beim Niederschlag oder bei der Diffusion. Im Bereich kleiner Reynolds-Zahlen – für R kleiner als 1 – sind die Linien von u um einen Zylinder in Abbildung 12.5 gezeichnet.

Abb. 12.5: Viskose Strömung (niedrige Geschwindigkeiten) um einen kreisförmigen Zylinder.

Erhöhen wir nun die Strömungsgeschwindigkeit, um eine Reynolds-Zahl etwas größer als l zu erhalten, so stellen wir fest, dass die Strömung anders verläuft. Es gibt eine Zirkulation hinter dem Zylinder wie in Abbildung 12.6 (b). Es ist noch immer eine ungelöste Frage, ob es dort immer, selbst bei kleinsten Reynolds-Zahlen eine Zirkulation gibt, oder ob sich die Dinge bei einer bestimmten Reynolds-Zahl plötzlich ändern. Man hat lange geglaubt, dass die Zirkulation stetig zunimmt. Heute ist man jedoch der Ansicht, dass sie plötzlich auftritt, und es ist sicher, dass die Zirkulation mit R zunimmt. Auf jeden Fall hat die Strömung für R im Bereich von ungefähr 10 bis 30 einen anderen Charakter. Es tritt hinter dem Zylinder ein Paar von Wirbeln auf. Die Strömung ändert sich erneut, wenn wir 40 oder eine Zahl nahe daran erreichen. Mit einem Mal ändert sich der Charakter der Bewegung vollkommen. Was passiert ist, dass einer der Wirbel hinter dem Zylinder so lang wird, dass er sich loslöst und mit der Flüssigkeit davonströmt. Dann dreht sich die Flüssigkeit hinter dem Zylinder im Kreis und bildet einen neuen Wirbel. Die Wirbel lösen sich abwechselnd von jeder Seite los, sodass eine Momentaufnahme der Strömung ungefähr wie die Skizze in Abbildung 12.6 (c) aussieht. Der Wirbelstrom heißt eine „kármánsche Wirbelstraße“. Sie tritt für R > 40 stets auf. Abbildung 12.7 zeigt eine Aufnahme einer solchen Strömung.

256

12 Die Strömung von nassem Wasser

(a) R ≈ 10−2

(b) R ≈ 20

(c) R ≈ 100

(d) R ≈ 104

(e) R ≈ 106

Abb. 12.6: Strömung an einem Zylinder vorbei für verschiedene Reynolds-Zahlen.

Zwischen den beiden Strömungen in Abbildung 12.6 (c) und 12.6 (b) oder 12.6 (a) besteht ein fast vollkommener Unterschied. In Abbildung 12.6 (a) oder (b) ist die Geschwindigkeit konstant, während sie sich in Abbildung 12.6 (c) an jedem Punkt mit der Zeit ändert. Es gibt keine stationäre Lösung oberhalb von R = 40 – was wir in Abbildung 12.4 durch eine gestrichelte Linie dargestellt haben. Für diese höheren Reynolds-Zahlen ändert sich die Strömung mit der Zeit, doch in regelmäßiger, zyklischer Weise. Wir können uns eine physikalische Vorstellung davon machen, wie diese Wirbel entstehen. Wir wissen, dass die Flüssigkeitsgeschwindigkeit an der Zylinderoberfläche null sein muss und dass

12.4 Die Strömung an einem kreisförmigen Zylinder vorbei

257

Abb. 12.7: Die „Wirbelstraße“ in der Strömung hinter einem Zylinder, fotografiert von Ludwig Prandtl.

sie außerdem bei zunehmendem Abstand von dieser Oberfläche rasch zunimmt. Durch diese große lokale Schwankung in der Flüssigkeitsgeschwindigkeit entsteht ein Wirbelvektor. Ist nun die hauptsächliche Strömungsgeschwindigkeit hinreichend klein, so hat dieser Wirbelvektor genügend Zeit, aus dem kleinen Bereich nahe der Festkörperoberfläche, wo er erzeugt wird, herauszudiffundieren und zu einem großen Wirbelbereich anzuwachsen. Dieses physikalische Bild soll dabei helfen, uns auf die nächste Veränderung im Strömungsverhalten vorzubereiten, wenn nämlich die hauptsächliche Strömungsgeschwindigkeit, oder R, noch weiter zunimmt.

Während die Geschwindigkeit größer und größer wird, bleibt für den Wirbelvektor immer weniger Zeit, um in einen größeren Flüssigkeitsbereich zu diffundieren. Zu dem Zeitpunkt, da die Reynolds-Zahl mehrere Hundert erreicht, beginnt der Wirbelvektor wie in Abbildung 12.6 (d) einen schmalen Streifen auszufüllen.

In dieser Schicht ist die Strömung chaotisch und völlig unregelmäßig. Man nennt diesen Bereich die Wirbelschicht; mit wachsendem R breitet sich dieser irreguläre Strömungsbereich stromaufwärts aus. Im Turbulenzbereich sind die Geschwindigkeiten sehr unregelmäßig und „geräuschvoll“; auch die Strömung ist nicht länger zweidimensional, sondern verdreht und verdrillt sich in allen drei Dimensionen. Es gibt aber noch immer eine regelmäßige, alternierende Bewegung, die der turbulenten Bewegung überlagert ist. Wächst die Reynolds-Zahl noch weiter an, so arbeitet sich der Turbulenzbereich weiter nach vorn, bis er den Punkt erreicht, an dem die Stromlinien aus dem Zylinder treten – für Strömungen etwas oberhalb von R = 105 . Die Strömung ist wie die in Abbildung 12.6 (e), und wir haben eine so genannte „turbulente Grenzschicht“. Außerdem tritt eine drastische Veränderung im Widerstandsbeiwert ein; er fällt um einen großen Faktor, wie man in Abbildung 12.4 sehen kann. In diesem Geschwindigkeitsbereich nimmt der Widerstandsbeiwert tatsächlich mit zunehmender Geschwindigkeit ab. Es gibt offenbar wenig Anzeichen für eine Periodizität. Was passiert bei noch größeren Reynolds-Zahlen? Erhöhen wir die Geschwindigkeit noch weiter, so nimmt der Totwasserbereich weiter an Größe zu und der Widerstandsbeiwert wächst an. Die neuesten Experimente – die bis zu R = 107 gehen – zeigen, dass eine neue Periodizität im Totwasser auftritt, weil entweder das ganze Totwasser in einer Gesamtbewegung nach vorn und zurück oszilliert, oder weil eine neue Art von Wirbel zusammen mit einer unregelmäßigen, geräuschvollen Bewegung auftritt. Die Einzelheiten sind noch nicht völlig geklärt und werden zur Zeit noch experimentell untersucht.

258

12.5

12 Die Strömung von nassem Wasser

Der Grenzfall verschwindender Viskosität

Wir möchten darauf hinweisen, dass keine der hier beschriebenen Strömungen mit der im vorigen Kapitel gefundenen Lösung für die Potentialströmung vergleichbar ist. Das ist auf den ersten Blick einigermaßen überraschend. Schließlich ist R proportional zu 1/η. Strebt also η gegen null, so ist das äquivalent zu R gegen unendlich. Und bilden wir in Gleichung (12.23) den Grenzfall für großes R, so fällt die rechte Seite weg und wir erhalten die Gleichungen des vorhergehenden Kapitels. Trotzdem werden Sie nur schwerlich glauben, dass die höchst turbulente Strömung bei R = 107 analog zur ruhigen Strömung ist, die anhand der Gleichungen des „trockenen“ Wassers berechnet wurde. Wie kann es kommen, dass die durch (12.23) beschriebene Strömung für R = ∞ zu einer völlig anderen Lösung führt als die anfängliche, die wir mit η = 0 erhalten haben? Die Antwort ist höchst interessant. Beachten Sie, dass der Ausdruck auf der rechten Seite von Gleichung (12.23) das Produkt aus 1/R und einer zweiten Ableitung ist. Das ist eine höhere Ableitung als alle anderen in der Gleichung. Was passiert, ist, dass im Raum nahe der Oberfläche sehr schnelle Veränderungen von Ω auftreten, obwohl der Koeffizient 1/R klein ist. Diese schnellen Veränderungen kompensieren die geringe Größe des Koeffizienten, und bei zunehmendem R strebt das Produkt nicht gegen null. Die Lösungen nähern sich nicht dem Grenzfall, wenn der Koeffizient von ∇2 Ω gegen null strebt.

Sie fragen sich vielleicht, worum es sich bei dieser feinkörnigen Turbulenz handelt und wie sie aufrecht erhalten wird. Wie kann der Wirbelvektor, der irgendwo am Rand des Zylinders entsteht, im Hintergrund so viel Lärm erzeugen? Auch hier ist die Antwort interessant. Ein Wirbelvektor hat die Tendenz, sich zu verstärken. Lassen wir im Augenblick die Diffusion des Wirbelvektors beiseite, die einen Verlust herbeiführt, so sagen die Strömungsgesetze (wie wir gesehen haben), dass die Wirbellinien mit der Geschwindigkeit u mit der Flüssigkeit mitgeführt werden. Wir können uns eine gewisse Anzahl von Ω-Linien vorstellen, die durch das komplizierte Strömungsmuster von u verzerrt und verdrillt werden. Dadurch werden die Linien näher aneinander gezogen und untereinander vermischt. Linien, die vorher einfach waren, verknoten sich und rücken enger zusammen. Sie bleiben dann länger und näher beieinander. Die Stärke des Wirbelvektors nimmt zu, und seine Unregelmäßigkeiten – die positiven und negativen – werden im Allgemeinen größer. Deshalb wächst der Betrag des Wirbelvektors in drei Dimensionen, wenn wir die Flüssigkeit rotieren lassen. Sie können sich sehr wohl fragen, wann die Theorie der Potentialströmung eigentlich zufriedenstellend ist. Zunächst einmal ist sie außerhalb des Turbulenzbereichs zufriedenstellend, dort, wo der Wirbelvektor mittels Diffusion nicht beträchtlich eingedrungen ist. Durch Konstruktion von besonders stromlinienförmigen Körpern können wir den Turbulenzbereich so klein wie möglich halten; die Strömung um die Flügel eines Flugzeugs – die sorgsam entworfen wurden – beruht fast zur Gänze auf echter Potentialströmung.

12.6

Couette-Strömung

Es ist möglich zu zeigen, dass der komplexe und wechselnde Charakter der Strömung an einem Zylinder vorbei nicht etwas Besonderes ist, sondern dass die Strömung im Allgemeinen eine große Reichhaltigkeit an Möglichkeiten aufweist. In Abschnitt 1 haben wir eine Lösung für die viskose Strömung zwischen zwei Zylindern ausgearbeitet, und diese Resultate können wir mit den realen Vorgängen vergleichen. Betrachten wir zwei konzentrische Zylinder, zwischen de-

12.6 Couette-Strömung

(a)

259

(b)

(c)

(d)

Abb. 12.8: Muster der Flüssigkeitsströmung zwischen zwei transparenten rotierenden Zylindern.

nen sich Öl befindet, und suspendieren wir darin feines Aluminiumpulver, so ist die Strömung leicht sichtbar zu machen. Drehen wir dann den äußeren Zylinder langsam, so passiert nichts Unerwartetes, siehe Abbildung 12.8 (a). Auch wenn wir stattdessen den inneren Zylinder drehen, passiert nichts Aufregendes. Drehen wir jedoch den inneren Zylinder schneller, so erleben wir eine Überraschung. Die Flüssigkeit zerlegt sich in horizontale Streifen, wie wir es in Abbildung 12.8 (b) sehen. Dreht sich der äußere Zylinder ähnlich schnell und der innere befindet sich in Ruhe, so tritt kein solcher Effekt auf. Wie kommt es zu diesem Unterschied, wenn sich einmal der innere und einmal der äußere Zylinder dreht? Schließlich hing das Strömungsmuster, das wir in Abschnitt 1 hergeleitet haben, nur von ωb − ωa ab.

Wir können die Antwort finden, indem wir die Querschnitte in Abbildung 12.9 betrachten. Bewegen sich die inneren Schichten der Flüssigkeit schneller als die äußeren, so haben sie die Tendenz, sich nach außen zu bewegen – die Zentrifugalkraft ist größer als die Kraft, die sie an Ort und Stelle hält. Eine ganze Schicht kann sich nicht gleichförmig nach außen bewegen, da die äußeren Schichten im Wege sind. Sie muss in Zellen zerbrechen und zirkulieren, wie es Abbildung 12.9 (b) zeigt. Das ist wie bei den Konvektionsströmen in einem Raum, in dem sich am Boden heiße Luft befindet. Wenn dagegen der innere Zylinder ruht und der äußere eine hohe Geschwindigkeit hat, so bauen die Zentrifugalkräfte einen Druckgradienten auf, der alles im Gleichgewicht hält – siehe Abbildung 12.9 (c) (wie in einem Raum, in dem sich oben heiße Luft befindet). Zentrifugalkräfte v

v

(a)

(b)

Abb. 12.9: Warum die Strömung in Bänder zerbricht.

Zentrifugalkräfte

(c)

260

12 Die Strömung von nassem Wasser

Beschleunigen wir nun den inneren Zylinder. Zunächst wächst die Zahl der Bänder an. Dann werden die Bänder plötzlich wellenförmig, wie in Abbildung 12.8 (c), und diese Wellen bewegen sich um den Zylinder. Die Geschwindigkeit dieser Wellen ist leicht zu messen. Für große Rotationsgeschwindigkeiten liegt sie bei 1/3 der Geschwindigkeit des inneren Zylinders. Und niemand weiß, warum! Das ist eine Herausforderung. Eine einfache Zahl wie 1/3 und keine Erklärung. Tatsächlich wird der gesamte Mechanismus der Wellenbildung nicht sehr gut verstanden; trotzdem handelt es sich nur um eine stationäre laminare Strömung. Lassen wir nun auch den äußeren Zylinder rotieren – aber in der umgekehrten Richtung –, so beginnt das Strömungsmuster auseinanderzubrechen. Wir erhalten Wellenbereiche, die mit scheinbar ruhigen Bereichen abwechseln, wie es in Abbildung 12.8 (d) skizziert ist, wobei das Muster einer Spirale entsteht. In diesen „ruhigen“ Bereichen können wir jedoch feststellen, dass die Strömung in Wirklichkeit ziemlich unregelmäßig ist; sie ist de facto völlig turbulent. Auch die Wellenbereiche beginnen, eine unregelmäßige turbulente Strömung aufzuweisen. Werden die Zylinder dann noch schneller gedreht, so wird die ganze Strömung chaotisch und turbulent. In diesem einfachen Experiment sehen wir viele interessante Verhaltensweisen der Strömung, die sehr verschieden sind und die doch alle in unserer einfachen Gleichung für verschiedene Werte des einen Parameters R enthalten sind. Mit unseren rotierenden Zylindern können wir viele der Effekte beobachten, die in der Strömung an einem Zylinder vorbei auftreten: Erstens gibt es eine stationäre Strömung; zweitens setzt eine Strömung ein, die sich mit der Zeit, aber auf regelmäßige glatte Weise ändert; schließlich wird die Strömung völlig irregulär. Sie haben alle dieselben Effekte bei einer Rauchsäule beobachtet, die bei ruhiger Luft von einer Zigarette aufsteigt. Es gibt eine glatte stationäre Säule, der eine Reihe von Verdrillungen folgen, wenn der Rauchstrom sich aufzulösen beginnt, und die schließlich in einer unregelmäßigen, heftig bewegten Rauchwolke endet. Was wir aus all dem hauptsächlich lernen müssen, ist, dass sich in diesem einfachen System von Gleichungen (12.23) eine ungeheuere Vielfalt des Verhaltens verbirgt. Alle Lösungen sind Lösungen derselben Gleichungen, nur mit verschiedenen Werten von R. Wir haben keinen Grund anzunehmen, dass in diesen Gleichungen Terme fehlen. Die einzige Schwierigkeit besteht darin, dass unser heutiges mathematisches Können nicht ausreicht, um sie zu lösen, ausgenommen für sehr kleine Reynolds-Zahlen – das heißt, im vollständig viskosen Fall. Dass wir eine solche Gleichung angeschrieben haben, nimmt der Flüssigkeitsströmung weder ihren Reiz noch das Geheimnis noch die Möglichkeit von Überraschungen. Wenn eine solche Vielfalt in einer einfachen Gleichung mit nur einem Parameter möglich ist, um wie viel größer muss sie dann in komplizierten Gleichungen sein! Vielleicht ist die grundlegende Gleichung, die die Spiralnebel und die kondensierenden, rotierenden und sich entwickelnden Sterne und Galaxien beschreibt, nichts anderes als eine einfache Gleichung für das hydrodynamische Verhalten von nahezu reinem Wasserstoffgas. Oft sagen Leute aus einer ungerechtfertigten Angst vor der Physik heraus, dass man eine Gleichung des Lebens nicht anschreiben könne. Aber vielleicht kann man es doch. Aller Wahrscheinlichkeit nach haben wir die Gleichung bereits in hinreichender Näherung vor uns, wenn wir die Gleichung der Quantenmechanik anschreiben:  ∂ψ Hψ = − . i ∂t Wir haben soeben gesehen, wie leicht es vorkommen kann, dass die Kompliziertheit der Verhältnisse in drastischem Gegensatz zu der Einfachheit der Gleichungen steht, die diese Verhält-

12.6 Couette-Strömung

261

nisse beschreiben. In Unkenntnis der Tragweite einfacher Gleichungen hat der Mensch oft den Schluss gezogen, dass nicht Gleichungen, sondern nichts Geringeres als Gott die Kompliziertheit der Welt erklären kann. Wir haben die Gleichungen der Wasserströmung angeschrieben. Experimentell haben wir ein System von Begriffen und Näherungen gefunden, anhand dessen die Lösung analysiert werden kann – Wirbelstraßen, Turbulenzzonen, Grenzschichten. Haben wir es mit ähnlichen Gleichungen in einer weniger vertrauten Situation zu tun, in der wir noch nicht experimentieren können, so versuchen wir, die Gleichungen auf eine primitive, hinkende und verworrene Weise zu lösen, um zu bestimmen, welche neuen qualitativen Charakteristika auftauchen können oder welche neuen qualitativen Formen eine Konsequenz der Gleichungen sind. Zum Beispiel beschreiben unsere Gleichungen, die die Sonne als einen Ball aus Wasserstoffgas schreiben, eine Sonne ohne Sonnenflecke, ohne die Granularstruktur der Oberfläche, ohne Protuberanzen, ohne Korona. Doch all das ist in Wirklichkeit in den Gleichungen enthalten. Wir haben einfach noch nicht entdeckt, wie wir es herausbekommen können. Es gibt Leute, die enttäuscht sein werden, wenn kein Leben auf anderen Planeten gefunden wird. Aber ich nicht – ich will, dass die Erforschung des interplanetaren Raumes mich entzückt und überrascht und mich von neuem darauf hinweist, welche unendliche Vielfalt von neuen Phänomenen von so einfachen Prinzipien bewirkt werden kann. Das Kriterium für eine Wissenschaft ist ihre Fähigkeit, Vorhersagen zu machen. Hätten Sie nie die Erde gesehen, könnten Sie dann die Gewitter, Vulkane, Ozeanwellen, die Morgenröte und den farbenprächtigen Sonnenuntergang vorhersagen? Es wird eine heilsame Lektion sein zu erfahren, was auf jenen toten Planeten vor sich geht – jenen acht oder zehn Kugeln, die alle aus derselben Staubwolke zusammengeballt wurden und die alle genau denselben Gesetzen der Physik gehorchen. Die nächste große Epoche der menschlichen Erkenntnis kann sehr wohl eine Methode hervorbringen, mit der man den qualitativen Inhalt von Gleichungen versteht. Heute können wir das noch nicht. Heute können wir nicht sehen, dass die Gleichungen der Wasserströmung Dinge wie die spiralförmigen Muster der Turbulenz enthalten, die man zwischen rotierenden Zylindern beobachtet. Heute können wir nicht sehen, ob die Schrödinger-Gleichung Frösche, Komponisten oder Moral enthält oder nicht. Wir können nicht sagen, ob etwas darüber Hinausgehendes, wie Gott, notwendig ist oder nicht. Und so können wir alle unsere Ansichten in beiden Richtungen haben.

13

Der gekrümmte Raum

13.1

Gekrümmte Räume in zwei Dimensionen

Nach Newton zieht jeder Gegenstand jeden anderen mit einer Kraft an, die umgekehrt proportional zum Abstand der Gegenstände voneinander ist; außerdem reagieren Gegenstände auf Kräfte mit Beschleunigungen, die proportional zu den Kräften sind. Das ist der Inhalt des newtonschen Gravitationsgesetzes und der newtonschen Bewegungsgesetze. Wie Sie wissen, beschreiben diese Gesetze die Bewegung von Kugeln, Planeten, Satelliten, Galaxien und so weiter. Einstein hat eine andere Interpretation des Gravitationsgesetzes gegeben. Danach sind Raum und Zeit – die zu einer Raumzeit zusammengefasst werden müssen – in der Nähe von schweren Massen gekrümmt. Gegenstände versuchen, sich in dieser gekrümmten Welt entlang von „geraden Linien“ zu bewegen, und das führt zu ihren tatsächlichen Bahnen. Das ist nun eine komplizierte Vorstellung – sogar eine sehr komplizierte. Diese Vorstellung wollen wir in diesem Kapitel erklären. Unser Untersuchungsgegenstand besteht aus drei Teilen. Einer betrifft die Wirkung der Gravitation. Ein anderer befasst sich mit den Vorstellungen von Raum und Zeit, wie wir sie bereits kennengelernt haben. Der dritte befasst sich schließlich mit der Vorstellung einer gekrümmten Raumzeit. Wir vereinfachen unseren Gegenstand anfangs, indem wir uns nicht um die Gravitation kümmern und die Zeit weglassen – wir untersuchen nur den gekrümmten Raum. Später behandeln wir die anderen Fragen, jetzt konzentrieren wir uns auf das Konzept eines gekrümmten Raumes – was mit Raumkrümmung gemeint ist und wie sie insbesondere in dieser Theorie Einsteins angewendet wird. Nun ist selbst dieses Wenige in drei Dimensionen einigermaßen schwierig. Daher reduzieren wir das Problem noch weiter und sprechen über die Bedeutung der Worte „gekrümmter Raum“ in zwei Dimensionen. Um das Konzept eines gekrümmten zweidimensionalen Raumes zu verstehen, müssen Sie sich in den begrenzten Gesichtskreis eines Wesens hineinversetzen, das in einem solchen Raum lebt. Stellen wir uns einen blinden Käfer vor, der auf einer Ebene lebt, wie in Abbildung 13.1. Er kann sich nur in der Ebene bewegen und hat keine Möglichkeit zu erfahren, dass es eine „Außenwelt“ gibt. (Er verfügt nicht über Ihr Vorstellungsvermögen.) Wir werden natürlich eine

Abb. 13.1: Ein Käfer auf einer ebenen Fläche.

264

13 Der gekrümmte Raum

Analogiebetrachtung anstellen. Wir leben in einer dreidimensionalen Welt und können uns nicht vorstellen, wie wir aus ihr in einer weiteren Richtung herauskommen können; das müssen wir daher mit Analogiebetrachtungen herausfinden. Das ist so, als wenn wir der Käfer wären, der in einer Ebene lebt, und es gäbe einen Raum in einer anderen Richtung. Deshalb beginnen wir mit dem Käfer und behalten im Auge, dass er auf seiner Fläche leben muss und nicht herauskann. Als weiteres Beispiel für einen Käfer, der in zwei Dimensionen lebt, stellen wir uns einen auf einer Kugel vor. Er soll auf ihrer Oberfläche herumlaufen können, wie in Abbildung 13.2, aber er soll nicht nach „oben“ oder „unten“ oder „außen“ schauen können.

Abb. 13.2: Ein Käfer auf einer Kugel.

Nun wollen wir noch ein drittes Lebewesen betrachten. Es handelt sich wiederum um einen Käfer, der in einer Ebene lebt, wie der erste, aber die Ebene ist diesmal von besonderer Beschaffenheit. Die Temperatur ist an verschiedenen Stellen unterschiedlich. Sowohl der Käfer als auch alle Maßstäbe, die er benützt, bestehen aus demselben Material, das sich bei Erwärmung ausdehnt. Immer wenn er ein Lineal anlegt, um etwas zu messen, dehnt sich dieses sofort auf die Länge aus, die der Temperatur an der entsprechenden Stelle entspricht. Wo auch immer er einen Gegenstand hinbringt – sich selbst, ein Lineal, ein Dreieck, oder irgendetwas – der Gegenstand dehnt sich entsprechend der jeweiligen Temperatur aus. Alles ist an den heißeren Stellen länger als an den kälteren und alles hat denselben Ausdehnungskoeffizienten. Wir nennen den Lebensraum unseres dritten Käfers eine „erwärmte Platte“, wollen uns aber insbesondere eine solche Platte vorstellen, die in der Mitte kalt ist und zum Rand hin wärmer wird (Abbildung 13.3).

30◦ 40◦ 50◦

Abb. 13.3: Ein Käfer auf einer erwärmten Platte.

Nun stellen wir uns vor, dass unsere Käfer anfangen, Geometrie zu betreiben. Obwohl wir sie uns als blind vorstellen, sodass sie keine „Außenwelt“ sehen, können sie doch mit ihren Beinen und Fühlern eine Menge anstellen. Sie können Linien zeichnen, Lineale herstellen und Längen abmessen. Stellen wir uns zunächst vor, dass sie mit dem einfachsten geometrischen Begriff anfangen. Sie lernen, wie man eine gerade Linie zieht – die als kürzeste Verbindung zwischen zwei Punkten definiert ist. Unser erster Käfer – siehe Abbildung 13.4 – lernt sehr gute Geraden zu ziehen. Aber was geschieht mit dem Käfer auf der Kugel? Er zeichnet seine Gerade als – für ihn – kürzesten Abstand zwischen zwei Punkten, wie in Abbildung 13.5. Sie

13.1 Gekrümmte Räume in zwei Dimensionen

265

B B

A

A

Abb. 13.4: Konstruktion einer „Geraden“ in einer Ebene.

Abb. 13.5: Konstruktion einer „Geraden“ auf einer Kugel.

mag uns als Kurve erscheinen, aber der Käfer hat ja keine Möglichkeit, die Kugel zu verlassen und festzustellen, dass es „in Wirklichkeit“ eine kürzere Verbindung gibt. Er weiß nur, dass jede andere Verbindungslinie, die er in seiner Welt zu ziehen versucht, länger als seine „Gerade“ ist. Lassen wir ihm daher seine Gerade als kürzesten Bogen zwischen zwei Punkten. (Natürlich handelt es sich um ein Bogenstück eines Großkreises.) Schließlich wird unser dritter Käfer – der in Abbildung 13.3 – ebenfalls „Geraden“ zeichnen, die wir als Kurven ansehen. Zum Beispiel wird die kürzeste Verbindung zwischen A und B in Abbildung 13.6 auf der eingezeichneten Kurve liegen. Warum? Überstreicht seine Linie die heißeren Teile seiner Platte, so werden seine Maßstäbe (von unserem allwissenden Standpunkt aus betrachtet) länger und man braucht weniger aneinandergelegte „Maßstäbe“, um von A nach B zu gelangen. Für ihn ist die Linie daher gerade – er kann nicht wissen, dass es in einer sonderbaren dreidimensionalen Außenwelt jemanden gibt, der eine andere Linie „gerade“ nennt. B 30◦

A

40◦ ◦ 50

Abb. 13.6: Konstruktion einer „Geraden“ auf der erwärmten Platte.

Sie haben nun wohl begriffen, dass unsere ganze restliche Untersuchung vom Standpunkt der Wesen auf den betreffenden Flächen aus erfolgt und nicht von unserem Standpunkt aus. Behalten wir das im Auge und sehen wir nach, wie ihre Geometrien beschaffen sind. Nehmen wir an, dass die Käfer alle gelernt haben, wie man Linien konstruiert die sich rechtwinklig schneiden. (Sie können herausfinden, wie sie das anstellen könnten.) Unser erster Käfer (der in der Ebene) stellt dann eine interessante Tatsache fest. Beginnt er bei Punkt A und zieht eine 100 cm lange Linie, bildet dann einen rechten Winkel und legt wieder 100 cm zurück, bildet wieder einen rechten Winkel und geht 100 cm weiter, bildet einen dritten rechten Winkel und zieht eine vierte 100 cm lange Linie, so gelangt er zum Ausgangspunkt zurück (vgl. Abbildung 13.7 (a)). Das ist eine Eigenschaft seiner Welt – eine der Tatsachen seiner „Geometrie“. Dann entdeckt er etwas anderes Interessantes. Bildet er ein Dreieck – eine Figur aus drei Geraden – so ist die Winkelsumme gleich 180◦, das heißt, gleich der Summe von zwei rechten Winkeln. Siehe Abbildung 13.7 (b).

266

13 Der gekrümmte Raum 100 cm 90◦

90◦

r

β 100 cm

100 cm α 90◦

90◦ 100 cm (a)

γ

r

r r r

α + β + γ = 180◦ (b)

(c)

Abb. 13.7: Ein Quadrat, ein Dreieck und ein Kreis in einem ebenen Raum.

Dann erfindet er den Kreis. Was ist ein Kreis? Einen Kreis konstruiert man so: Man bewegt sich von einem bestimmten Punkt aus in vielen, vielen Richtungen weg und markiert viele Punkte, die alle denselben Abstand vom Ausgangspunkt haben. Siehe Abbildung 13.7 (c). (Wir müssen bei der Definition dieser geometrischen Objekte sorgfältig vorgehen, weil wir später die Analoga für die anderen Käfer bilden müssen.) Natürlich entspricht das der Kurve, die man bilden kann, indem man ein Lineal um einen Punkt dreht. Wie auch immer: Unser Käfer lernt, wie man Kreise zeichnet. Eines Tages kommt er auf die Idee, den Umfang des Kreises abzumessen. Er misst mehrere Kreise und findet eine schöne Beziehung: Der Umfang ist immer gleich derselben Zahl mal dem Radius r (der natürlich der Abstand vom Mittelpunkt zum Umfang ist). Der Umfang und der Radius stehen immer im gleichen Verhältnis – ungefähr 6,283 – unabhängig von der Größe des Kreises. Nun wollen wir sehen, was unsere anderen Käfer über ihre jeweilige Geometrie herausbekommen. Was geschieht zunächst mit dem Käfer auf der Kugel, wenn er ein „Quadrat“ zu zeichnen versucht? Folgt er der oben gegebenen Vorschrift, so wird er wahrscheinlich meinen, dass das Resultat nicht der Mühe wert sei. Er erhält die in Abbildung 13.8 gezeigte Figur. Sein Endpunkt B stimmt nicht mit dem Anfangspunkt A überein. Es ergibt sich keine geschlossene Figur. Nehmen Sie eine Kugel und versuchen Sie es. Unser Freund auf der erwärmten Platte erhält etwas Ähnliches. Zeichnet er vier gleich lange Geraden – gemessen mit seinen sich ausdehnenden Maßstäben –, die rechte Winkel bilden, so erhält er eine Figur wie in Abbildung 13.9.

A

50◦ 40◦

30◦

A

Abb. 13.8: Versuchte Konstruktion eines „Quadrats“ auf einer Kugel.

Abb. 13.9: Versuchte Konstruktion eines „Quadrats“ auf der erwärmten Platte.

13.1 Gekrümmte Räume in zwei Dimensionen

267

Nehmen wir nun an, dass jeder unserer Käfer seinen Euklid gelesen und von ihm gelernt hat, wie die Geometrie sein „sollte“, und dass sie das ungefähr nachgeprüft haben, indem sie grobe Messungen bei kleinen Maßstäben durchführten. Versuchen sie dann, genaue Quadrate in größerem Maßstab zu zeichnen, so stellen sie fest, dass etwas nicht stimmt. Der springende Punkt ist, dass sie nur durch geometrische Messungen entdecken würden, dass mit ihrem Raum etwas nicht stimmt. Wir definieren einen gekrümmten Raum als einen Raum, in dem die Geometrie nicht die für eine Ebene erwartete Geometrie ist. Die Geometrie des Käfers auf der Kugel oder des Käfers auf der erwärmten Platte ist die eines gekrümmten Raumes. Die Gesetze der euklidischen Geometrie stimmen nicht mehr. Und es ist nicht nötig, dass Sie sich aus ihrer Ebene herausbewegen, um festzustellen, dass die Welt, in der Sie leben, gekrümmt ist. Es ist gar nicht nötig, den Erdball zu umschiffen, um herauszufinden, dass er eine Kugel ist. Sie können feststellen, dass Sie auf einer Kugel leben, indem Sie einfach ein Quadrat zeichnen. Ist das Quadrat klein, so brauchen Sie eine hohe Genauigkeit, ist es jedoch groß, so kann die Messung gröber ausfallen.

90◦ 90◦ 90◦

Abb. 13.10: Auf einer Kugel kann ein „Dreieck“ drei rechte Winkel haben.

Betrachten wir das Dreieck in einer Ebene. Die Winkelsumme beträgt 180 Grad. Unser Freund auf der Kugel kann sehr sonderbare Dreiecke konstruieren. Er kann zum Beispiel Dreiecke zeichnen, die drei rechte Winkel haben. Wirklich! Eines ist in Abbildung 13.10 gezeigt. Unser Käfer möge am Nordpol anfangen und eine Gerade bis zum Äquator zeichnen. Dann beschreibt er einen rechten Winkel und legt eine andere Gerade gleicher Länge zurück. Dasselbe macht er noch einmal. Mit der speziellen Länge, die er gewählt hat, kommt er genau zum Ausgangspunkt zurück und trifft unter rechtem Winkel auf die erste Linie. Er hegt daher keinen Zweifel, dass sein Dreieck drei rechte Winkel oder eine Winkelsumme von 270 Grad hat. Für ihn stellt sich heraus, dass die Winkelsumme eines Dreiecks immer größer als 180 Grad ist. Der Exzess (für das gezeigte Beispiel: die überschüssigen 90 Grad) ist proportional zur Fläche des Dreiecks. Ist das Dreieck auf der Kugel sehr klein, so beträgt die Summe seiner Winkel beinahe 180 Grad, nur etwas mehr. Wird das Dreieck größer, so wächst die Abweichung. Der Käfer auf der erwärmten Platte hätte mit seinen Dreiecken ähnliche Schwierigkeiten. r vorh

r gem

Abb. 13.11: Konstruktion eines Kreises auf einer Kugel.

268

13 Der gekrümmte Raum

Sehen wir als Nächstes nach, was unsere Käfer über Kreise herausfinden. Sie zeichnen Kreise und messen ihren Umfang. Beispielsweise könnte der Käfer auf der Kugel einen Kreis wie den von Abbildung 13.11 zeichnen. Und er würde feststellen, dass der Umfang kleiner als 2π mal dem Radius ist. (Sie können das sehen, weil es mit unserer dreidimensionalen Weisheit klar ist, dass sein „Radius“ eine Kurve ist, die länger ist als der tatsächliche Kreisradius.) Hat der Käfer auf der Kugel seinen Euklid gelesen und sich entschlossen, einen Radius vorherzubestimmen, indem er den Umfang C durch 2π teilt, so erhält er rvorh =

C . 2π

(13.1)

Er stellt dann fest, dass der gemessene Radius größer als der vorherbestimmte ist. Verfolgt er die Sache weiter, so kann er den Unterschied als „Exzessradius“ definieren und setzen rgem − rvorh = rExzess ,

(13.2)

und dann untersuchen, wie der Exzessradiuseffekt von der Größe des Kreises abhängt. Unser Käfer auf der erwärmten Platte würde ein ähnliches Phänomen feststellen. Er möge einen Kreis um den kältesten Punkt auf der Platte zeichnen, wie in Abbildung 13.12. Wenn wir ihm beim Zeichnen des Kreises zusehen, werden wir bemerken, dass seine Maßstäbe in der Nähe des Mittelpunktes kurz sind und nach außen zu immer länger werden – obwohl er das natürlich nicht weiß. Misst er den Umfang, so ist sein Maßstab immer lang; daher findet auch er, dass der gemessene Radius größer als der vorherbestimmte Radius C/2π ist. Der Käfer auf der erwärmten Platte stellt also auch einen „Exzessradiuseffekt“ fest. Wiederum hängt das Ausmaß des Effekts vom Kreisradius ab. 50◦ 40◦ 30◦

Abb. 13.12: Konstruktion eines Kreises auf der erwärmten Platte.

Wir definieren einen „gekrümmten Raum“ als einen Raum, in dem diese Art von geometrischen Irrtümern vorkommt: Die Summe der Winkel eines Dreiecks ist von 180 Grad verschieden; der Umfang eines Kreises dividiert durch 2π ist nicht gleich dem gemessenen Radius; die Regel für die Konstruktion eines Quadrates ergibt keine geschlossene Figur. Sie können sich selbst andere Irrtümer ausdenken. Wir haben zwei Beispiele für den gekrümmten Raum angeführt: die Kugel und die erwärmte Platte. Aber interessanterweise sind die beiden Geometrien genau gleich, wenn wir auf der erwärmten Platte die richtige Temperaturabhängigkeit als Funktion des Abstands wählen. Im Grunde genommen ist das amüsant: Wir können es so einrichten, dass der Käfer auf der erwärmten Platte dieselben Antworten wie der auf der Kugel erhält. Denen, die Freude an der Geometrie und an geometrischen Problemen haben, werden wir sagen, wie man das macht. Nehmen Sie an, dass die Länge der Maßstäbe (die durch die Temperatur bestimmt ist) proportional zu eins plus einer Konstanten mal dem Quadrat des Abstands vom Ursprung ist, so

13.1 Gekrümmte Räume in zwei Dimensionen

269

finden Sie, dass die Geometrie der erwärmten Platte in allen Details1 der Geometrie der Kugel entspricht. Es gibt natürlich auch noch andere Arten von Geometrien. Wir könnten uns für die Geometrie eines Käfers interessieren, der auf einer Birne lebt, also auf etwas, das an einer Stelle eine stärkere und an einer anderen Stelle eine schwächere Krümmung hat, sodass der sphärische Exzess größer ausfällt, wenn er in einem Teil seiner Welt kleine Dreiecke zeichnet als in anderen Teilen. Mit anderen Worten: Die Krümmung eines Raumes kann sich von Punkt zu Punkt ändern. Das ist nur eine Verallgemeinerung der Konzepte. Durch eine geeignete Temperaturverteilung auf einer erwärmten Platte kann das ebenfalls wiedergegeben werden.

Abb. 13.13: Ein „Kreis“ auf einer sattelförmigen Fläche.

Wir möchten anmerken, dass die Resultate auch entgegengesetzte Abweichungen enthalten können. Sie können zum Beispiel feststellen, dass die Winkelsumme aller Dreiecke, die hinreichend groß sind, weniger als 180 Grad beträgt. Das mag unmöglich klingen, ist es jedoch nicht. Einmal könnten wir eine erwärmte Platte haben, bei der die Temperatur mit dem Abstand vom Mittelpunkt abnimmt. Dann wären alle Effekte umgekehrt. Man kann dieses Resultat aber auch rein geometrisch erhalten, indem man die zweidimensionale Geometrie auf der Oberfläche eines Sattels untersucht. Betrachten Sie eine sattelförmige Fläche wie in Abbildung 13.13. Zeichnen Sie nun einen „Kreis“ auf der Fläche, der als der geometrische Ort aller Punkte mit gleichem Abstand vom Mittelpunkt definiert ist. Dieser Kreis ist eine Kurve, die krausenförmig auf und ab verläuft. Daher ist sein Umfang größer als man das durch Berechnung von 2πrgem erwarten würde. Folglich ist nun C/2π kleiner als rgem . Der „Exzessradius“ wäre negativ. Kugeln, Birnen und dergleichen sind alles Flächen mit positiven Krümmungen; und die anderen heißen Flächen mit negativer Krümmung. Im Allgemeinen wird eine zweidimensionale Welt eine Krümmung aufweisen, die sich von Punkt zu Punkt ändert und an manchen Stellen positiv und an anderen negativ ist. Im Allgemeinen bezeichnen wir als gekrümmten Raum einfach einen Raum, in dem die Sätze der euklidischen Geometrie nicht gelten, wobei die Abweichungen beide Vorzeichen haben können. Der Betrag der Krümmung – der zum Beispiel durch den Exzessradius definiert wird – kann sich von Ort zu Ort ändern. Wir möchten darauf hinweisen, dass nach unserer Definition der Krümmung ein Zylinder überraschenderweise nicht gekrümmt ist. Lebt ein Käfer auf einem Zylinder, wie in Abbildung 13.14, so wird er feststellen, dass Dreiecke, Quadrate und Kreise dasselbe Verhalten wie auf einer Ebene haben. Das ist leicht einzusehen, indem man sich überlegt, wie die Figuren aussehen, wenn der Zylinder in eine Ebene abgewickelt wird. Dann entsprechen alle geometrischen Figuren denen in einer Ebene. Ein Käfer, der auf einem Zylinder lebt, hat daher (vorausgesetzt, dass er nicht vollständig herumläuft, sondern nur lokale Messungen durchführt) 1

Mit Ausnahme des unendlich fernen Punktes.

270

13 Der gekrümmte Raum

Abb. 13.14: Ein zweidimensionaler Raum mit innerer Krümmung null.

keine Möglichkeit festzustellen, dass sein Raum gekrümmt ist. Im technischen Sinn fassen wir daher diesen Raum als nicht gekrümmt auf. Genau gesagt befassen wir uns hier mit der so genannten inneren Krümmung; das ist eine Krümmung, die man durch Messungen in einem lokalen Gebiet bestimmen kann. (Ein Zylinder hat keine innere Krümmung.) Diese Bedeutung hatte Einstein im Auge, als er behauptete, dass unser Raum gekrümmt sei. Bisher haben wir aber nur einen gekrümmten Raum in zwei Dimensionen definiert; wir müssen weitergehen und sehen, was das Konzept des gekrümmten Raumes in drei Dimensionen bedeuten könnte.

13.2

Die Krümmung im dreidimensionalen Raum

Wir leben im dreidimensionalen Raum und wollen das Konzept untersuchen, dass der dreidimensionale Raum gekrümmt ist. Sie werden sagen: „Aber wie können Sie sich vorstellen, dass er in irgendeiner Richtung verbogen ist?“ Nun gut, wir können uns den Raum nicht in irgendeiner Richtung verbogen vorstellen, weil unser Vorstellungsvermögen dafür nicht ausreicht. (Vielleicht ist es ganz gut, dass wir uns nicht zu viel vorstellen können, damit wir uns nicht zu weit von der Wirklichkeit entfernen.) Aber wir können immerhin eine Krümmung definieren, ohne unsere dreidimensionale Welt zu verlassen. Alles, worüber wir in zwei Dimensionen gesprochen haben, war nur eine Übung, mit der wir gezeigt haben, wie wir zu einer Definition der Krümmung kommen können, für die es nicht notwendig ist, dass wir „von außen hineinsehen“ können. Ganz analog wie die Käfer, die auf der Kugel bzw. auf der erwärmten Platte leben, können wir feststellen, ob unsere Welt gekrümmt ist oder nicht. Wir sind vielleicht nicht in der Lage, zwischen den beiden Fällen zu unterscheiden, aber wir können diese sicher vom ebenen Raum, der gewöhnlichen Ebene, unterscheiden. Wie? Sehr einfach: Wir zeichnen ein Dreieck und messen die Winkel. Oder wir zeichnen einen riesengroßen Kreis und messen den Umfang und den Radius. Oder wir versuchen, einige exakte Quadrate oder einen Würfel zu konstruieren. In jedem Fall prüfen wir nach, ob die Gesetze der Geometrie stimmen. Bilden wir ein großes Dreieck und seine Winkelsumme ist nicht 180 Grad, so können wir sagen, dass unser Raum gekrümmt ist. Ist der gemessene Radius eines Kreises nicht gleich seinem Umfang dividiert durch 2π, so können wir ebenfalls sagen, dass unser Raum gekrümmt ist.

13.2 Die Krümmung im dreidimensionalen Raum

271

Sie werden feststellen, dass die Situation in drei Dimensionen viel komplizierter als in zwei Dimensionen sein kann. In zwei Dimensionen gibt es an jeder Stelle ein bestimmtes Ausmaß von Krümmung. In drei Dimensionen kann die Krümmung mehrere Komponenten haben. Bilden wir ein Dreieck in einer Ebene, so können wir ein anderes Resultat erhalten, wenn wir die Ebene des Dreiecks anders ausrichten. Oder betrachten wir das Beispiel eines Kreises. Wir zeichnen einen Kreis, messen den Radius und er stimmt nicht mit C/2π überein, sodass es einen Exzessradius gibt. Nun zeichnen wir rechtwinklig dazu einen weiteren Kreis wie in Abbildung 13.15. Der Exzess muss für die beiden Kreise keineswegs der gleiche sein. Es könnte sogar einen positiven Exzess für den Kreis in einer Ebene und einen Defekt (negativer Exzess) für den Kreis in der anderen Ebene geben.

Abb. 13.15: Der Exzessradius kann für Kreise mit verschiedenen Orientierungen unterschiedlich sein.

Vielleicht fällt Ihnen eine bessere Idee ein: Können wir all diese Komponenten nicht vermeiden, indem wir in drei Dimensionen eine Kugel verwenden? Wir können eine Kugel festlegen, indem wir alle Punkte betrachten, die von einem gegebenen Punkt im Raum den gleichen Abstand haben. Dann können wir die Oberfläche messen, indem wir ein feinmaschiges rechtwinkliges Netz auf die Oberfläche der Kugel legen und alle Flächenstücke addieren. Nach Euklid muss die gesamte Fläche A gleich 4π √ mal dem Quadrat des Radius sein; daher können wir einen „vorausberechneten Radius“ als A/4π definieren. Wir können aber auch den Radius direkt messen, indem wir ein Loch zum Mittelpunkt graben und den Abstand messen. Wiederum können wir den gemessenen Radius minus dem vorher bestimmten Radius bilden und die Differenz den Exzessradius nennen, rExzess = rgem −



gemessener Flächeninhalt 4π

1/2

,

und das wäre ein völlig zufriedenstellendes Maß für die Krümmung. Das hat den großen Vorteil, dass es nicht davon abhängt, wie wir ein Dreieck oder einen Kreis ausrichten. Aber der Exzessradius einer Kugel hat auch einen Nachteil; er charakterisiert den Raum nicht vollständig. Er liefert die so genannte mittlere Krümmung der dreidimensionalen Welt, da es zu einer Mittelung über die verschiedenen Krümmungen kommt. Da der Exzessradius ein Mittelwert ist, löst er das Problem der Definition der Geometrie nicht vollständig. Kennen Sie nur diese Zahl, so können Sie nicht alle Eigenschaften der Geometrie des Raumes angeben, weil Sie nicht sagen können, was mit Kreisen von verschiedener Orientierung passiert. Die vollständige Definition erfordert die Angabe von sechs „Krümmungszahlen“ an jedem Punkt. Natürlich wissen die Mathematiker, wie man alle diese Zahlen anschreibt. Sie können eines Tages in einem

272

13 Der gekrümmte Raum

Mathematikbuch nachlesen, wie man sie in anspruchsvoller, eleganter Weise schreibt, aber es ist zunächst ausreichend, in grober Weise zu wissen, was Sie schreiben wollen. Für die meisten unserer Zwecke reicht die mittlere Krümmung aus.2

13.3

Unser Raum ist gekrümmt

Nun kommt die Hauptfrage. Ist das wahr? Das heißt, ist der reale physikalische Raum, in dem wir leben, gekrümmt? Da wir nun genügend Vorstellungsvermögen haben, um die Möglichkeit in Betracht zu ziehen, dass der Raum gekrümmt ist, möchte der menschliche Geist natürlich wissen, ob die reale Welt gekrümmt ist oder nicht. Man hat direkte geometrische Messungen angestellt, um das herauszufinden und hat keine Abweichungen von der euklidischen Geometrie festgestellt. Andererseits hat Einstein mithilfe von Überlegungen über die Gravitation entdeckt, dass der Raum gekrümmt ist. Wir möchten Ihnen sagen, was Einsteins Gesetz über den Betrag der Krümmung aussagt und auch ein wenig darüber berichten, wie er das herausgefunden hat. Einstein behauptete, dass der Raum gekrümmt sei und dass die Materie die Ursache der Krümmung sei (die Materie ist auch die Ursache der Gravitation, also hängt die Gravitation mit der Krümmung zusammen – aber das kommt später in diesem Kapitel). Um die Darlegung einfacher zu machen, wollen wir annehmen, dass die Materie mit einer bestimmten Dichte kontinuierlich verteilt ist, die sich aber von Punkt zu Punkt beliebig ändern kann.3 Das von Einstein angegebene Gesetz für die Raumkrümmung ist das folgende: Greifen wir in einem materieerfüllten Raumgebiet eine Kugel heraus, die hinreichend klein ist, sodass die Dichte ρ der Materie innerhalb der Kugel praktisch konstant ist, so ist der Exzessradius für die Kugel proportional zu der in ihr enthaltenen Masse. Mithilfe der Definition des Exzessradius erhalten wir  A G Exzessradius = rgem − = 2 · M. (13.3) 4π 3c Dabei ist G die Gravitationskonstante (der newtonschen Theorie), c die Lichtgeschwindigkeit und M = 4πρr3 /3 die Masse der Materie innerhalb der Kugel. Das ist das einsteinsche Gesetz für die mittlere Krümmung des Raumes. Betrachten wir als Beispiel die Erde und vergessen, dass sich die Dichte von Punkt zu Punkt ändert – damit wir keine Integrale berechnen müssen. Wir nehmen an, dass wir die Oberfläche der Erde sehr sorgfältig messen und dann ein Loch zum Mittelpunkt graben und den Radius messen. Aus dem Flächeninhalt der Oberfläche können wir den vorherbestimmten Radius berechnen, indem wir die Oberfläche gleich 4πr2 setzen. Vergleichen wir den vorherbestimmten Radius mit dem tatsächlichen, so stellen wir fest, dass der tatsächliche Radius um den durch (13.3) gegebenen Betrag größer ist. Die Konstante G/3c2 beträgt ungefähr 2,5 × 10−29 cm pro Gramm; daher weicht für jedes Gramm der Materie der gemessene Radius um 2,5 × 10−29 cm ab. Setzen wir

2

3

Der Vollständigkeit halber fügen wir eine Bemerkung an. Wenn Sie das Modell des gekrümmten Raumes mit der erwärmten Platte auf drei Dimensionen übertragen wollen, so müssen Sie sich vorstellen, dass die Länge des Maßstabes nicht nur davon abhängt, wo Sie ihn hinbringen, sondern auch davon, wie er ausgerichtet ist. Es handelt sich um eine Verallgemeinerung des einfachen Falles, bei dem die Länge des Maßstabes zwar davon abhängt, wo er sich befindet, aber die gleiche ist, wenn er von Norden nach Süden, von Osten nach Westen oder von oben nach unten zeigt. Diese Verallgemeinerung ist notwendig, wenn Sie mit einem solchen Modell einen dreidimensionalen Raum mit beliebiger Geometrie darstellen wollen; für zwei Dimensionen ist das nicht notwendig. Niemand – auch nicht Einstein – weiß, was man machen soll, wenn die Masse an Punkten konzentriert ist.

13.4 Die Geometrie in Raum und Zeit

273

die Masse der Erde ein, die ungefähr 6 × 1027 Gramm beträgt, so stellt sich heraus, dass der Erdradius um 1,5 Millimeter größer ist als das aus dem Inhalt der Oberfläche folgen würde.4 Führen Sie dieselbe Rechnung für die Sonne durch, so stellen Sie fest, dass der Sonnenradius einen halben Kilometer zu groß ist. Sie werden bemerken, dass das Gesetz beinhaltet, dass die mittlere Krümmung über die Oberfläche einer kleinen Kugel oberhalb der Erdoberfläche verschwindet. Aber das bedeutet nicht, dass alle Komponenten der Krümmung null sind. Oberhalb der Erde kann trotzdem eine Krümmung vorliegen – und es gibt sie tatsächlich. Ein Kreis in einer Ebene hat für eine Orientierung einen Exzessradius mit dem einen Vorzeichen und für eine andere Orientierung einen mit dem entgegengesetzten Vorzeichen. Es stellt sich lediglich heraus, dass der Mittelwert über eine Kugel verschwindet, wenn sie keine Masse enthält. (Nebenbei bemerkt stellt sich heraus, dass es eine Beziehung zwischen den verschiedenen Komponenten der Krümmung und der Änderung der mittleren Krümmung von Punkt zu Punkt gibt.) Obwohl daher die mittlere Krümmung oberhalb der Erde verschwindet, sind nicht alle ihrer Komponenten null, und der Raum ist gekrümmt. Es ist diese Krümmung, die wir als Schwerkraft spüren. Stellen wir uns einen Käfer auf einer Ebene vor und nehmen an, dass die „Ebene“ kleine Pickel an der Oberfläche hat. An jedem Pickel würde der Käfer feststellen, dass sein Raum kleine lokale Gebiete mit Krümmung aufweist. Dasselbe passiert uns in drei Dimensionen. Wo es einen Klumpen Materie gibt, hat unser dreidimensionaler Raum eine lokale Krümmung – eine Art von dreidimensionalem Pickel. Beulen wir eine Ebene an vielen Stellen aus, so kann es außer allen Pickeln auch eine gesamte Krümmung geben – die Oberfläche kann wie eine Kugel aussehen. Es wäre interessant zu wissen, ob unser Raum außer den lokalen Pickeln infolge von Materieklumpen wie der Sonne und der Erde eine mittlere Gesamtkrümmung aufweist. Die Astrophysiker versuchten, diese Frage durch Vermessung von Galaxien in großen Entfernungen zu beantworten. Ist zum Beispiel die Zahl der Galaxien, die wir in einer Kugelschale in großer Entfernung beobachten, anders als wir das aus dem Radius der Schale erwarten, so erhalten wir ein Maß für den Exzessradius einer riesigen Kugel. Aus solchen Messungen hofft man herauszufinden, ob unser ganzes Universum im Mittel flach oder gekrümmt ist – ob es „geschlossen ist“ wie eine Kugel oder „offen“ wie eine Ebene. Sie haben vielleicht von den Diskussionen gehört, die über dieses Problem geführt werden. Es handelt sich bisher nur um Diskussionen, weil die astronomischen Messungen immer noch keine sichere Aussage liefern; die experimentellen Daten sind nicht genau genug, um eine definitive Antwort zu geben. Unglücklicherweise haben wir nicht die leiseste Vorstellung von der Gesamtkrümmung unseres Universums im Großen.

13.4

Die Geometrie in Raum und Zeit

Nun müssen wir uns mit der Zeit befassen. Wie Sie aus der speziellen Relativitätstheorie wissen, hängen Messungen von Raum und Zeit zusammen. Und es wäre etwas verrückt, wenn mit dem Raum etwas passierte, ohne dass die Zeit hereinspielte. Sie erinnern sich, dass die Messung der Zeit von der Geschwindigkeit abhängt, mit der Sie sich bewegen. Beobachten wir zum 4

Ungefähr, da die Dichte nicht, wie wir angenommen haben, unabhängig vom Radius ist.

274

13 Der gekrümmte Raum

Beispiel jemanden, der in einem Raumschiff fliegt, so stellen wir fest, dass sich die Dinge für ihn langsamer ereignen als für uns. Nehmen wir an, dass er zu einer Reise startet und nach unseren Uhren in genau 100 Sekunden zurückkehrt; seine Uhr könnte anzeigen, dass er nur 95 Sekunden unterwegs war. Im Vergleich zu uns ist seine Uhr – und alle anderen Prozesse, wie sein Herzschlag – langsamer gegangen. Betrachten wir nun ein interessantes Problem. Nehmen wir an, Sie seien der Mann im Raumschiff. Wir bitten Sie, bei einem gegebenen Signal zu starten und gerade rechtzeitig bei einem späteren Signal am Startplatz wieder anzukommen – zum Beispiel genau 100 Sekunden später nach unserer Uhr. Und Sie werden außerdem gebeten, die Reise so durchzuführen, dass Ihre Uhr die größtmögliche verstrichene Zeit anzeigt. Wie sollen Sie fliegen? Sie müssen am Ort bleiben. Wenn Sie sich bewegen, wird Ihre Uhr weniger als 100 Sekunden anzeigen, wenn Sie zurückkommen. Wir wollen aber das Problem ein bisschen abändern. Wir bitten Sie, bei Punkt A bei einem gegebenen Signal zu starten und zu Punkt B zu fliegen (die beide relativ zu uns festliegen), und das so zu tun, dass Sie gerade zum Zeitpunkt eines zweiten Signals zurückkehren (beispielsweise 100 Sekunden später nach unserer fixierten Uhr). Wieder werden Sie aufgefordert, die Reise so vorzunehmen, dass Sie mit der spätest möglichen Ablesung auf ihrer Uhr ankommen. Wie machen Sie das? Für welchen Weg und Fahrplan zeigt Ihre Uhr bei Ihrer Ankunft die größtmögliche verstrichene Zeit an? Die Antwort lautet, dass Sie von Ihrem Standpunkt aus die längste Zeit für die Reise benötigen, wenn Sie sich mit gleichförmiger Geschwindigkeit auf einer geraden Linie bewegen. Begründung: Alle zusätzlichen Bewegungen und alle höheren Geschwindigkeiten bewirken, dass Ihre Uhr langsamer läuft. (Da die Zeitabweichungen vom Quadrat der Geschwindigkeit abhängen, können Sie das, was Sie verlieren, indem Sie an einer Stelle besonders schnell fliegen, nie wettmachen, indem Sie sich an einer anderen Stelle besonders langsam bewegen.) Das Wesentliche von all dem besteht darin, dass wir diesen Gedankengang zur Definition einer „geraden Linie“ in Raum und Zeit verwenden können. Das Analogon einer räumlichen Geraden ist in Raum und Zeit eine Bewegung mit gleichförmiger Geschwindigkeit in konstanter Richtung. Der Kurve mit kleinstem räumlichem Abstand entspricht in Raum und Zeit nicht der Weg mit kürzester Zeit, sondern derjenige mit der längsten Zeit, und zwar wegen der verrückten Dinge, die in der Relativitätstheorie mit dem Vorzeichen der t-Terme passieren. „Geradlinige“ Bewegung – das Analogon zu „gleichförmige Geschwindigkeit entlang einer Geraden“ – ist dann die Bewegung, bei der eine Uhr von einer Stelle zu einem Zeitpunkt so an eine andere Stelle zu einem anderen Zeitpunkt gebracht wird, dass auf der Uhr die größtmögliche Zeit abgelesen wird. Das ist unsere Definition für das Analogon zu einer Geraden in Raum und Zeit.

13.5

Die Gravitation und das Äquivalenzprinzip

Nun sind wir darauf vorbereitet, die Gravitationsgesetze kennenzulernen. Einstein wollte eine Gravitationstheorie aufstellen, die mit der von ihm früher entwickelten Relativitätstheorie zusammenpasst. Er mühte sich so lange ab, bis er auf ein wichtiges Prinzip stieß, das ihn zu den richtigen Gesetzen führte. Das Prinzip beruht auf der Feststellung, dass alles, was sich im

13.6 Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld

275

Innern eines frei fallenden Objektes befindet, schwerelos zu sein scheint. Zum Beispiel fällt ein Satellit auf seiner Umlaufbahn im Gravitationsfeld der Erde frei, und ein Astronaut, der sich darin befindet, fühlt sich schwerelos. Formuliert man diese Vorstellung mit größerer Genauigkeit, so heißt sie das einsteinsche Äquivalenzprinzip. Es beruht auf der Tatsache, dass alle Objekte, unabhängig davon, welche Masse sie haben oder woraus sie bestehen, mit genau derselben Beschleunigung fallen. Befindet sich ein Mann in einem Raumschiff, das im Begriff ist zu landen – sodass es frei fällt –, so wird das Fallen des Mannes und des Raumschiffs durch dieselben Gesetze beherrscht. Setzt er sich in die Mitte des Raumschiffs, so bleibt er da. In Bezug auf das Schiff fällt er nicht. Das meinen wir, wenn wir sagen, er sei „schwerelos“. Nehmen wir nun an, dass Sie sich in einer Rakete befinden, die beschleunigt wird. In Bezug auf was wird sie beschleunigt? Sagen wir nur, dass ihre Triebwerke angeschaltet sind und einen Schub hervorrufen, sodass sie nicht in freiem Fall landet. Stellen Sie sich außerdem vor, dass Sie sich weit weg im leeren Raum befinden, sodass auf das Raumschiff praktisch keine Gravitationskräfte wirken. Wird das Raumschiff mit „1g“ beschleunigt, so können Sie auf dem „Boden“ stehen und spüren Ihr normales Gewicht. Lassen Sie einen Ball los, so wird er auf den Boden „fallen“. Warum? Zwar wird das Schiff „nach oben“ beschleunigt, aber es wirken keine Kräfte auf den Ball und er wird daher nicht beschleunigt; er wird zurückgelassen. Innerhalb des Schiffes scheint der Ball eine Beschleunigung von „1 g“ nach unten zu haben. Vergleichen wir das nun mit der Situation in einem Raumschiff, das sich auf der Erdoberfläche in Ruhe befindet. Alles ist genauso! Sie werden auf den Boden gedrückt, ein Ball fällt mit der Beschleunigung von 1 g usw. Wie können Sie nun in einem Raumschiff entscheiden, ob Sie auf der Erde ruhen oder im freien Raum beschleunigt werden? Nach dem einsteinschen Äquivalenzprinzip ist das nicht möglich, sofern Sie nur messen, was mit Gegenständen im Innern passiert! Genaugenommen stimmt das nur für einen Punkt im Innern des Raumschiffs. Das Gravitationsfeld der Erde ist nicht völlig homogen, daher erfährt ein frei fallender Ball an verschiedenen Stellen nicht genau dieselbe Beschleunigung – es ändern sich die Richtung und der Betrag. Stellen wir uns aber ein streng homogenes Gravitationsfeld vor, so wird es in jeder Hinsicht durch ein System mit konstanter Beschleunigung imitiert.

13.6

Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld

Nun wollen wir das Äquivalenzprinzip anwenden, um etwas Seltsames zu verstehen, das in einem Gravitationsfeld vor sich geht. Wir werden Ihnen etwas zeigen, das in einem Raumschiff passiert, wobei Sie wahrscheinlich nicht erwartet hätten, dass das auch in einem Gravitationsfeld geschieht. Nehmen wir an, wir bringen eine Uhr an der „Spitze“ des Raumschiffes an – das heißt, am „vorderen“ Ende – und eine andere identische Uhr am „Schwanz“, wie in Abbildung 13.16. Nennen wir die beiden Uhren A und B. Vergleichen wir diese beiden Uhren, während das Raumschiff beschleunigt wird, so scheint die Uhr an der Spitze schneller zu laufen als die am Schwanz. Um das einzusehen, stellen Sie sich vor, dass die vordere Uhr jede Sekunde einen Lichtblitz aussendet und dass Sie am Schwanzende die Ankunft der Lichtblitze mit dem Ticken von Uhr B vergleichen. Nehmen wir an, dass sich die Rakete beim Aussenden

276

13 Der gekrümmte Raum

Beschleunigung

Uhr A

Uhr B

Abb. 13.16: Eine beschleunigte Rakete mit zwei Uhren.

eines Lichtblitzes durch Uhr A an der Stelle a von Abbildung 13.17 befindet und dass sie beim Eintreffen des Lichtblitzes an der Uhr B an der Stelle b angelangt ist. Später befindet sich die Rakete an der Stelle c, wenn die Uhr A ihren nächsten Lichtblitz absendet und an der Stelle d, wenn Sie diesen bei der Uhr B ankommen sehen. Der erste Blitz legt die Strecke L1 und der zweite die kürzere Strecke L2 zurück. Diese Strecke ist kürzer, weil das Schiff beschleunigt wird und zur Zeit des zweiten Blitzes eine höhere Geschwindigkeit hat. Werden die beiden Blitze von der Uhr A im Abstand von einer Sekunde ausgesandt, so können Sie sehen, dass sie bei der Uhr B mit einem Abstand von etwas weniger als einer Sekunde ankommen, da der zweite Blitz für den Weg weniger Zeit braucht. Dasselbe geschieht auch für alle weiteren Blitze. Befinden Sie sich daher am Schwanzende, so müssen Sie schließen, dass die Uhr A schneller läuft als die Uhr B. Machen Sie dasselbe umgekehrt – lassen Sie die Uhr B das Licht aussenden und beobachten es bei Uhr A – so müssen Sie schließen, dass B langsamer als A läuft. Das passt alles zusammen und es gibt dabei nichts Geheimnisvolles. Aber denken wir nun an das ruhende Raumschiff im Gravitationsfeld der Erde. Dort passiert dasselbe. Sitzen Sie mit einer Uhr am Boden und beobachten eine andere, die sich auf einem hohen Regal befindet, so wird sie schneller zu laufen scheinen als die auf dem Boden. Sie sagen: „Aber das ist falsch. Die Zeiten sollten dieselben sein. Ohne Beschleunigung gibt es keinen Grund dafür, dass die Uhren außer Takt geraten sollten.“ Wenn das Äquivalenzprinzip richtig ist, muss das aber der Fall sein, und Einstein bestand darauf, dass das Prinzip richtig

13.6 Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld

277

Stelle d

A L2

B

Stelle c

Stelle b A L1

Stelle a

B

Abb. 13.17: Eine Uhr an der Spitze einer beschleunigten Rakete scheint schneller zu laufen als eine am Ende.

ist und folgerte kühn und richtig weiter. Er postulierte, dass Uhren an verschiedenen Stellen in einem Gravitationsfeld scheinbar mit verschiedenen Geschwindigkeiten laufen müssen. Scheint aber eine Uhr in Bezug auf eine andere immer mit anderer Geschwindigkeit zu laufen, so läuft die andere mit verschiedener Geschwindigkeit, was die erste betrifft. Nun sehen Sie aber, dass dies für Uhren das Analogon zu dem erwärmten Maßstab ist, über den wir gesprochen haben, als wir den Käfer auf der erwärmten Platte beobachteten. Wir hatten uns vorgestellt, dass Maßstäbe, Käfer und alles bei verschiedenen Temperaturen ihre Länge in derselben Weise ändern, sodass niemand feststellen könnte, dass sein Maßstab sich ändert, wenn er sich auf der erwärmten Platte bewegt. Mit Uhren im Gravitationsfeld passiert dasselbe. Jede Uhr, die wir an einen höheren Punkt bringen, sehen wir schneller laufen. Das Herz schlägt schneller, alle Prozesse laufen schneller ab. Wäre das nicht der Fall, so könnten Sie einen Unterschied zwischen einem Gravitationsfeld und einem beschleunigten Bezugssystem feststellen. Die Vorstellung, dass sich der Zeitablauf von Ort zu Ort ändern kann, ist nicht einfach, aber es ist die von Einstein benützte Vorstellung, und sie ist richtig – ob Sie es nun glauben oder nicht. Mithilfe des Äquivalenzprinzips können wir berechnen, in welchem Maß sich die Ganggeschwindigkeit einer Uhr in einem Gravitationsfeld mit der Höhe ändert. Wir müssen nur den scheinbaren Unterschied zwischen der Ganggeschwindigkeit der beiden Uhren in der beschleunigten Rakete berechnen. Am leichtesten geschieht das mithilfe des Resultates, das wir in

278

13 Der gekrümmte Raum

Band II, Kapitel 9 für den Doppler-Effekt gefunden haben. Ist v die relative Geschwindigkeit einer Quelle bezüglich eines Empfängers, so steht die empfangene Frequenz ω zu der ausgesandten Frequenz ω0 , siehe (9.14), in folgender Beziehung: 1 + v/c . ω = ω0  1 − v2 /c2

(13.4)

Denken wir nun an die beschleunigte Rakete in Abbildung 13.17, so bewegen sich der Empfänger und der Sender zu jedem Zeitpunkt mit gleicher Geschwindigkeit. In der Zeit, die die Lichtsignale brauchen, um von der Uhr A zur Uhr B zu gelangen, wurde die Rakete jedoch beschleunigt. Tatsächlich hat sie die zusätzliche Geschwindigkeit gt erhalten, wobei g die Beschleunigung und t die Zeit ist, die das Licht für die Strecke H von A nach B benötigt. Diese Zeit ist fast genau H/c. Treffen die Signale in B ein, so hat die Geschwindigkeit der Rakete um gH/c zugenommen. In Bezug auf den Sender zu dem Zeitpunkt, in dem dieser das Signal aussendet, hat der Empfänger immer diese Geschwindigkeit. Das ist daher die Geschwindigkeit, die wir in der Formel für die Dopplerverschiebung, Gleichung (13.4), verwenden müssen. Sind die Beschleunigung und die Länge des Schiffes hinreichend klein, so dass diese Geschwindigkeit viel kleiner als c ist, so können wir den Term v2 /c2 vernachlässigen. Wir erhalten  gH  (13.5) ω = ω0 1 + 2 . c Für die beiden Uhren in dem Raumschiff gilt daher die Beziehung  gH  (Frequenz der Signale am Empfänger) = (Frequenz der Signale am Sender) 1 + 2 , (13.6) c wobei H die Höhe des Senders über dem Empfänger ist. Nach dem Äquivalenzprinzip muss dasselbe Resultat für zwei Uhren gelten, die in einem Gravitationsfeld mit der Fallbeschleunigung g den Höhenunterschied H haben. Dieses Ergebnis ist so wichtig, dass wir zeigen möchten, dass es auch aus einem anderen physikalischen Gesetz folgt – aus der Erhaltung der Energie. Wir wissen, dass die Gravitationskraft auf ein Objekt proportional zu seiner Masse M ist, die mit seiner gesamten inneren Energie E durch M = E/c2 verknüpft ist. Beispielsweise stimmen die Massen von Kernen, die man aus den Energien von Kernreaktionen bestimmt, bei denen ein Kern in einen anderen umgewandelt wird, mit den Massen aus den Atomgewichten überein. Stellen Sie sich nun ein Atom vor, das seinen tiefsten Energiezustand mit der gesamten Energie E0 und einen höheren Energiezustand E1 hat und das aus dem Zustand E1 in den Zustand E0 unter Emission von Licht übergehen kann. Die Frequenz ω des Lichts ist gegeben durch ω = E1 − E0 .

(13.7)

Stellen wir uns jetzt ein solches Atom im Zustand E1 vor, das sich auf dem Boden befindet, und wir bringen es von da auf die Höhe H. Dabei müssen wir Arbeit leisten, um die Masse m1 = E1 /c2 gegen die Gravitationskraft zu heben. Der Betrag der geleisteten Arbeit ist E1 gH. c2

(13.8)

13.6 Die Ganggeschwindigkeit von Uhren in einem Gravitationsfeld

279

Dann lassen wir das Atom ein Photon emittieren und in den niedrigeren Energiezustand E0 übergehen. Nachher bringen wir das Atom auf den Boden zurück. Nun ist seine Masse E0 /c2 ; wir gewinnen die Energie E0 gH, c2

(13.9)

daher haben wir insgesamt die folgende Arbeit geleistet ΔU =

E1 − E0 gH. c2

(13.10)

Durch die Emission des Photons hat das Atom die Energie E1 − E0 abgegeben. Nehmen Sie nun an, dass das Photon auf den Boden gelangt und dort absorbiert worden ist. Wie viel Energie gibt es dort ab? Zunächst würden Sie glauben, dass es gerade die Energie E1 − E0 abgibt. Aber das kann nicht richtig sein, wenn die Energie erhalten bleiben muss. Das können Sie aus der folgenden Überlegung sehen. Wir haben mit der Energie E1 am Boden begonnen. Am Ende ist die Energie am Boden gleich der Energie E0 des Atoms in seinem niedrigsten Zustand plus der Energie Eph , die das Photon abgegeben hat. Inzwischen mussten wir die in (13.10) angegebene zusätzliche Energie ΔU bereitstellen. Soll die Energie erhalten bleiben, so muss die Endenergie am Boden genau um die von uns geleistete Arbeit größer sein als die, mit der wir begonnen haben. Es muss also gelten oder

Eph + E0 = E1 + ΔU, Eph = (E1 − E0 ) + ΔU.

(13.11)

Es muss daher so sein, dass das Photon am Boden nicht mit der Energie E1 − E0 ankommt, mit der es ausgesandt wurde, sondern mit etwas mehr Energie. Anderenfalls wäre Energie verloren gegangen. Setzen wir in (13.11) das ΔU aus (13.10) ein, so sehen wir, dass das Photon am Boden ankommt mit der Energie  gH  (13.12) Eph = (E1 − E0 ) 1 + 2 . c Ein Photon der Energie EPh hat die Frequenz ω = Eph /. Nennen wir die Frequenz des emittierten Photons ω0 – sie ist nach (13.7) gleich (E1 − E0 )/ –, so liefert unser Resultat in (13.12) wieder die Beziehung (13.5) zwischen der Frequenz des Photons bei Absorption am Boden und der Frequenz, mit der es emittiert wurde. Dasselbe Resultat kann man auf noch andere Weise erhalten. Ein Photon der Frequenz ω0 hat die Energie E0 = ω0 . Da der Energie E0 die relativistische Masse E0 /c2 zukommt, hat das Photon eine Masse ω0 /c2 (das ist nicht die Ruhemasse) und wird von der Erde „angezogen“. Fällt es die Strecke H herunter, so gewinnt es eine zusätzliche Energie (ω0 /c2 )gH und kommt daher an mit der Energie  gH  E = ω0 1 + 2 . c Seine Frequenz nach dem Fall ist aber E/, und das liefert wiederum das Resultat von (13.5). Unsere Vorstellungen über die Relativitätstheorie, Quantenphysik und Energieerhaltung passen

280

13 Der gekrümmte Raum

nur dann zusammen, wenn Einsteins Aussagen über Uhren in einem Gravitationsfeld richtig sind. Die Frequenzunterschiede, um die es geht, sind gewöhnlich sehr klein. Für einen Höhenunterschied von 20 m auf der Erdoberfläche beträgt zum Beispiel der Frequenzunterschied nur etwa zwei Teile in 1015 . Genau so ein Unterschied wurde jedoch vor kurzem mithilfe des Mößbauer-Effektes experimentell ermittelt.5 Einstein hatte völlig recht.

13.7

Die Krümmung in Raum und Zeit

Nun wollen wir das eben Besprochene mit dem Konzept einer gekrümmten Raumzeit in Beziehung bringen. Wie wir bereits gezeigt haben, ist ein unterschiedlicher Zeitablauf an verschiedenen Stellen analog zu dem gekrümmten Raum auf der erwärmten Platte. Aber das ist mehr als eine Analogie; es bedeutet, dass die Raumzeit gekrümmt ist. Versuchen wir, etwas Geometrie in Raum und Zeit zu bringen. Das mag zunächst etwas sonderbar klingen, aber wir haben schon oft Raum-Zeit-Diagramme gezeichnet, bei denen der Abstand auf einer Achse und die Zeit auf der anderen aufgetragen sind. Versuchen wir, ein Rechteck in Raum und Zeit zu bilden. Wir beginnen mit einer graphischen Darstellung der Höhe H gegen t, wie in Abbildung 13.18 (a). Um die Basis unseres Rechtecks zu bilden, betrachten wir ein Objekt, das sich in der Höhe H1 in Ruhe befindet, und folgen seiner Weltlinie 100 Sekunden lang. Wir erhalten die Linie BD in Teil (b) der Abbildung, die parallel zur t-Achse ist. Betrachten wir nun ein anderes Objekt, das sich zur Zeit t = 0 in einem Abstand von 100 Meter über dem ersten in Ruhe befindet. Es beginnt bei dem Punkt A in Abbildung 13.18 (c). Wir verfolgen seine Weltlinie 100 Sekunden lang, die durch eine Uhr in A angezeigt werden. Das Objekt gelangt von A nach C, wie in Teil (d) der Abbildung gezeigt ist. Beachten Sie aber, dass die beiden Punkte C und D nicht gleichzeitig sind, da der Zeitablauf auf den beiden Höhen verschieden erfolgt – wir nehmen an, dass ein Gravitationsfeld vorhanden ist. Versuchen wir, das Rechteck zu vervollständigen, indem wir eine Gerade zu dem Punkt C  ziehen, der sich zum selben Zeitpunkt 100 Meter oberhalb von D befindet, wie in Abbildung 13.18 (e), so schließt sich das Rechteck nicht. Und das meinen wir, wenn wir sagen, dass die Raumzeit gekrümmt ist.

13.8

Bewegung in einer gekrümmten Raumzeit

Betrachten wir nun ein interessantes kleines Rätselspiel. Wir haben zwei baugleiche Uhren A und B, die sich nebeneinander auf der Erdoberfläche befinden. Nun heben wir die Uhr A auf eine Höhe H, lassen sie eine Zeitlang da und bringen sie auf den Boden zurück, sodass sie gerade in dem Moment ankommt, in dem die Uhr B 100 Sekunden weitergelaufen ist. Dann wird die Uhr A etwas wie 107 Sekunden anzeigen, da sie schneller gelaufen ist, als sie sich oben befand. Nun kommt das Rätsel. Wie sollen wir die Uhr A so bewegen, dass sie die spätestmögliche Zeit anzeigt – wobei wir immer annehmen, dass sie zurückkehrt, wenn B 100 Sekunden anzeigt. Sie werden sagen: „Das ist einfach. Bringen Sie A so hoch wie möglich hinauf. Dann wird sie so schnell wie möglich laufen und bei der Rückkehr am meisten anzeigen.“ Falsch. Sie haben etwas vergessen – für den Hin- und Rückweg stehen uns nur 100 Sekunden zur Verfügung. Gehen wir sehr hoch hinauf, so müssen wir sehr rasch gehen, um in 100 Sekunden hin und zurück zu gelangen. Und Sie dürfen einen Effekt der speziellen Relativitätstheorie nicht vergessen, der 5

R. V. Pound und G. A. Rebka, Jr., Physical Review Letters, Vol. 4, S. 337 (1960).

13.8 Bewegung in einer gekrümmten Raumzeit

281

H

(a) A t

H

H

100 s

C

100 m

(d)

100 s

B

D t

(b) 100 s

B

H D t

H

(e)

A (c)

100 s 100 m

B

C C� 100 m

100 s

D t

100 m B

A

100 s

D t

Abb. 13.18: Versuch, ein Rechteck in Raum und Zeit zu bilden.

 bewirkt, dass bewegte Uhren um den Faktor 1 − v2 /c2 verlangsamt werden. Dieser relativistische Effekt wirkt in der Richtung, dass die Uhr A eine kürzere Zeit anzeigt als die Uhr B. Sie sehen, dass eine Art Spiel vorliegt. Bleiben wir mit der Uhr A in Ruhe, so erhalten wir 100 Sekunden. Steigen wir langsam auf eine geringe Höhe und kommen langsam zurück, so können wir etwas mehr als 100 Sekunden erhalten. Steigen wir etwas höher, so können wir vielleicht etwas mehr gewinnen. Steigen wir aber zu hoch, so müssen wir uns schnell bewegen, um hinzugelangen, und können den Gang der Uhr so stark verlangsamen, dass wir zum Schluss weniger als 100 Sekunden ablesen. Welcher Fahrplan für die Höhe gegen die Zeit – wie hoch wir hinauf müssen und mit welcher Geschwindigkeit, die sorgfältig aufeinander abgestimmt sein müssen, um uns zur Uhr B zurückzubringen, wenn sie 100 Sekunden anzeigt – gibt uns die größtmögliche Zeitanzeige auf der Uhr A? Antwort: Berechnen Sie, wie schnell Sie einen Ball in die Luft werfen müssen, sodass er genau nach 100 Sekunden auf die Erde fällt. Die Bewegung des Balls – schneller Anstieg, Abbremsung, Anhalten und Herunterfallen – ist genau die richtige Bewegung, für die die Zeitanzeige auf einer am Ball befestigten Armbanduhr möglichst groß wird. Betrachten wir nun ein etwas anderes Spiel. Wir haben zwei Punkte A und B auf der Erdoberfläche in einem Abstand voneinander. Wir spielen dasselbe Spiel wie früher, um herauszufinden, was wir eine Gerade nennen sollen. Wir fragen, wie wir uns von A nach B bewegen sollen, sodass die Zeit auf unserer bewegten Uhr am längsten ist – wobei wir annehmen, dass wir bei A auf ein gegebenes Signal hin starten und bei B bei einem anderen Signal eintreffen, das nach einer ortsfesten Uhr um 100 Sekunden später erfolgen soll. Nun werden Sie sagen: „Wir haben doch früher herausgefunden, dass man sich mit abgeschaltetem Motor längs einer Geraden mit

282

13 Der gekrümmte Raum

einer Geschwindigkeit bewegen muss, die so gewählt ist, dass man bei B genau 100 Sekunden später eintrifft. Bewegen wir uns nicht entlang einer Geraden, so brauchen wir eine höhere Geschwindigkeit und unsere Uhr wird verlangsamt.“ Aber einen Augenblick! Das war, bevor wir die Gravitation in Betracht gezogen haben. Ist es nicht besser, sich ein wenig nach oben zu bewegen und dann wieder herunterzukommen? Einen Teil der Zeit sind wir dann höher oben und unsere Uhr wird etwas schneller laufen? Das ist wirklich besser. Lösen Sie das mathematische Problem, die Bahnkurve der Bewegung so anzupassen, dass die verstrichene Zeit auf der bewegten Uhr so lang wie möglich ist, so finden Sie, dass die Bahn eine Parabel ist – dieselbe Kurve, die ein Objekt beschreibt, das sich auf einer freien Wurfbahn im Gravitationsfeld bewegt, wie in Abbildung 13.19. Daher kann das Bewegungsgesetz in einem Gravitationsfeld auch so formuliert werden: Ein Objekt bewegt sich von einem Punkt zum andern immer so, dass eine mitgeführte Uhr eine längere Zeit anzeigt als für jede andere mögliche Trajektorie – natürlich mit den gleichen Anfangs- und Endbedingungen. Die von einer bewegten Uhr gemessene Zeit wird oft ihre „Eigenzeit“ genannt. Beim freien Fall macht die Trajektorie die Eigenzeit eines Objekts maximal.

A

B Erde

Abb. 13.19: In einem homogenen Gravitationsfeld ist die Trajektorie mit maximaler Eigenzeit bei fester verstrichener Zeit eine Parabel.

Sehen wir nach, wie das alles funktioniert. Wir beginnen mit Gleichung (13.5). Sie besagt: Die überschüssige Ganggeschwindigkeit der bewegten Uhr ist ω0 gH . c2

(13.13)

Außerdem müssen wir uns daran erinnern, dass es eine Korrektur mit umgekehrtem Vorzeichen infolge der Geschwindigkeit gibt. Für diesen Effekt wissen wir, dass  ω = ω0 1 − v2 /c2 . Obwohl das Prinzip für jede Geschwindigkeit gilt, betrachten wir ein Beispiel, bei dem die Geschwindigkeiten stets bedeutend kleiner als c sind. Dann können wir diese Gleichung wie folgt schreiben   ω = ω0 1 − v2 /2c2 ,

und die Abnahme in der Ganggeschwindigkeit unserer Uhr beträgt −ω0

v2 . 2c2

Fassen wir die beiden Beiträge in (13.13) und (13.14) zusammen, so erhalten wir   v2 ω0 . Δω = 2 gH − 2 c

(13.14)

(13.15)

13.9 Einsteins Gravitationstheorie

283

Diese Frequenzverschiebung unserer bewegten Uhr bedeutet Folgendes: Messen wir auf einer ortsfesten Uhr eine Zeit dt, so zeigt die bewegte Uhr die Zeit    gH v2 dt 1 + 2 − 2 , c 2c

(13.16)

Der gesamte Zeitüberschuss auf der gesamten Trajektorie ist das Integral des Zusatzterms über die Zeit, nämlich    1 v2 dt, (13.17) gH − 2 c2 was ein Maximum sein soll. Der Term gH ist nichts anderes als das Gravitationspotential φ. Multiplizieren wir das Ganze mit dem konstanten Faktor −mc2 , wobei m die Masse des Objektes ist. Die Konstante ändert die Bedingung für das Maximum nicht, aber das Minuszeichen macht aus dem Maximum ein Minimum. Gleichung (13.16) besagt dann, dass sich das Objekt so bewegt, dass  

 mv2 − mφ dt = Minimum. 2

(13.18)

Aber nun ist der Integrand nichts anderes als die Differenz der kinetischen und der potentiellen Energie. Schlagen Sie in Kapitel 19 von Band III nach, so werden Sie sehen, dass wir bei der Diskussion des Prinzips der kleinsten Wirkung gezeigt haben, dass die newtonschen Gesetze für ein Objekt in einem beliebigen Potential genau in der Form von (13.18) geschrieben werden können.

13.9

Einsteins Gravitationstheorie

Die einsteinsche Form der Bewegungsgleichungen, das heißt, dass die Eigenzeit in der gekrümmten Raumzeit ein Maximum ist, liefert für kleine Geschwindigkeiten dieselben Resultate wie die newtonschen Gesetze. Bei seiner Reise um die Erde zeigte Gordon Coopers Uhr eine spätere Zeit an, als das für jede andere Bahn der Fall gewesen wäre, die Sie sich für seinen Satelliten vorgestellt haben könnten.6 Das Gravitationsgesetz kann daher in dieser bemerkenswerten Weise durch die Konzepte der Geometrie der Raumzeit ausgedrückt werden. Teilchen wählen immer die längste Eigenzeit – das ist in Raum und Zeit eine Größe, die analog zum „kleinsten Abstand“ ist. Das ist das Bewegungsgesetz in einem Gravitationsfeld. Der große Vorteil dieser Formulierung besteht darin, dass das Gesetz nicht von speziellen Koordinaten oder von einer besonderen Beschreibungsweise der Situation abhängt. 6

Genaugenommen handelt es sich nur um ein lokales Maximum. Wir hätten sagen sollen, dass die Eigenzeit größer ist als für jeden anderen Weg in der Nachbarschaft. Zum Beispiel braucht die Eigenzeit auf einer elliptischen Bahn um die Erde nicht größer zu sein als für eine Wurfbahn eines Objektes, der in große Höhe geschossen wird und wieder herunterfällt.

284

13 Der gekrümmte Raum

Fassen wir nun das bisher Erarbeitete zusammen. Wir haben zwei Gesetze für die Gravitation angegeben: 1. Wie sich die Geometrie der Raumzeit bei Anwesenheit von Materie ändert – nämlich, dass die durch den Exzessradius ausgedrückte Krümmung proportional zur Masse innerhalb einer Kugel ist, Gleichung (13.3). 2. Wie sich Objekte unter dem Einfluss von reinen Gravitationskräften bewegen – nämlich, dass sich Objekte so bewegen, dass ihre Eigenzeit zwischen dem Anfangs- und Endpunkt maximal ist. Diese beiden Gesetze entsprechen ähnlichen Paaren von Gesetzen, die uns schon früher begegnet sind. Ursprünglich beschrieben wir die Bewegung in einem Gravitationsfeld mithilfe des newtonschen Gravitationsgesetzes mit dem reziproken Abstandsquadrat und seinen Bewegungsgleichungen. An diese Stelle treten nun die Gesetze (1) und (2). Unser neues Gesetzespaar entspricht auch dem, was wir in der Elektrodynamik gefunden haben. Auch da hatten wir ein Gesetz – das System der Maxwell-Gleichungen –, das die von den Ladungen hervorgerufenen Felder bestimmt. Es sagt aus, wie sich der Charakter des „Raumes“ infolge der Anwesenheit von geladener Materie ändert, und das ist dasselbe, was das Gesetz (1) für die Gravitation leistet. Zusätzlich hatten wir ein Gesetz, das besagt, wie sich Teilchen in den gegebenen Feldern bewegen: d(mu)/dt = q(E + u × B). Für die Gravitation leistet das das Gesetz (2).

Die Gesetze (1) und (2) bilden eine präzise Formulierung der einsteinschen Gravitationstheorie, obwohl Sie diese meist in mathematisch komplizierter Form angeschrieben finden werden. Es soll hier aber noch eine zusätzliche Bemerkung gemacht werden. Wie sich die Zeitskala in einem Gravitationsfeld von Punkt zu Punkt ändert, so ändern sich auch die Längenmaßstäbe. Maßstäbe ändern ihre Länge, wenn Sie sich umherbewegen. Da Raum und Zeit so eng miteinander verquickt sind, ist es nicht möglich, dass etwas mit der Zeit passiert, das sich nicht in irgendeiner Weise auch im Raum äußern würde. Betrachten Sie das einfachste Beispiel: Sie bewegen sich an der Erde vorbei. Was von Ihrem Standpunkt aus „Zeit“ ist, ist von unserem Standpunkt aus Raum. Daher muss es auch Änderungen im Raum geben. Was durch die Anwesenheit von Materie verzerrt wird, ist die ganze Raumzeit, und das ist komplizierter als eine bloße Änderung der Zeitskala. Aber die in (13.3) gegebene Regel genügt für die vollständige Bestimmung aller Gesetze der Gravitation, sofern vorausgesetzt wird, dass diese Regel für die Raumkrümmung nicht nur vom Standpunkt eines speziellen Beobachters aus gilt, sondern für jeden. Jemand, der sich bezüglich einer Masse bewegt, sieht einen anderen Masseninhalt wegen der kinetischen Energie, die die Masse in Bezug auf ihn hat, und er muss die Masse, die dieser Energie entspricht, mit einbeziehen. Die Theorie muss so formuliert werden, dass jeder, unabhängig davon, wie er sich bewegt, feststellt, dass der Exzessradius einer Kugel gleich G/3c2 mal der gesamten Masse (oder besser G/3c4 mal dem gesamten Energieinhalt) in einer Kugel ist. Dass dieses Gesetz – Gesetz (1) – in jedem bewegten System gelten soll, ist eines der großen Gesetze der Gravitation, das die einsteinsche Feldgleichung heißt. Das andere große Gesetz ist (2) – Objekte müssen sich so bewegen, dass die Eigenzeit ein Maximum ist – und heißt einsteinsche Bewegungsgleichung. Diese Gesetze in vollständiger algebraischer Form anzuschreiben, sie mit den newtonschen Gesetzen zu vergleichen oder sie mit der Elektrodynamik in Beziehung zu bringen, ist mathematisch sehr aufwendig. Aber so sehen heute unsere vollkommensten Gesetze der Physik der Schwerkraft aus.

13.9 Einsteins Gravitationstheorie

285

Obwohl diese Gesetze für das einfache Beispiel, das wir untersucht haben, ein Ergebnis geliefert haben, das mit der newtonschen Mechanik übereinstimmt, ist das doch nicht immer der Fall. Die drei zuerst von Einstein vorhergesagten Unterschiede wurden experimentell bestätigt: Die Bahn des Merkur ist keine feste Ellipse; Licht von Sternen, das nahe an der Sonne vorbeigeht, wird doppelt so stark abgelenkt, wie Sie glauben würden; und die Ganggeschwindigkeit von Uhren hängt von ihrer Lage in einem Gravitationsfeld ab. Wo immer die Vorhersagen von Einstein von den Vorstellungen der newtonschen Mechanik abwichen, hat die Natur für Einstein entschieden. Fassen wir alles bisher Gesagte in der folgenden Weise zusammen. Erstens: Zeit- und Entfernungsskalen hängen von dem Ort im Raum ab, an dem Sie sie messen, und außerdem von der Zeit. Das ist äquivalent zu der Feststellung, dass die Raumzeit gekrümmt ist. √ Aus der gemessenen Oberfläche einer Kugel können wir einen vorherbestimmten Radius A/4π bestimmen, aber der wirkliche gemessene Radius wird einen Überschuss aufweisen, der proportional zur gesamten in der Kugel enthaltenen Masse ist (die Proportionalitätskonstante ist G/c2 ). Das legt das genaue Ausmaß der Krümmung der Raumzeit fest. Und die Krümmung muss die gleiche sein, unabhängig davon, wer die Materie betrachtet oder wie sie sich bewegt. Zweitens: Teilchen bewegen sich in dieser gekrümmten Raumzeit auf „geraden Linien“ (Trajektorien zu maximaler Eigenzeit). Das ist der Inhalt der einsteinschen Formulierung der Gravitationsgesetze.

Index Band IV Absorptionskoeffizient, 73 adiabatische Entmagnetisierung, 133 Alnico V, 156, 179 ampèrescher Strom, 141 antiferromagnetisches Material, 181 Äquivalenzprinzip, einsteinsches, 275 atomare Polarisierbarkeit, 65 atomarer Strom, 67, 141 Austauschkraft, 166 Bahnbewegung, 107 Barkhausen-Effekt, 178 Bernoulli-Theorem, 232 Bernstein, 184 Beugung, 2 Bewegung in gekrümmter Raumzeit, 280 Bewegungsgleichung, einsteinsche, 283 Bezirk, 172 bohrsches Magneton, 118, 133, 165 Boltzmann-Energie, 156 Bragg-Nye-Modell, 16 Brechung von Licht, 83 Brechungsindex, 63 chemische Bindung, 3 Clausius-Mossotti-Formel, 71 Coriolis-Kraft, 112 Couette-Strömung, 258 Curie-Temperatur, 160, 162, 165, 170, 179

Einfallswinkel, 83 eingespannter Balken, 199 einsteinsche Bewegungsgleichung, 283 einsteinsche Feldgleichung, 284 einsteinsche Gravitationstheorie, 283 einsteinsches Äquivalenzprinzip, 274 Elastika, 203 elastische Konstanten, 212, 219 elastische Materialien, 205 Elastizität, 185 Elastizitätstensor, 209 Elektromagnet, 153 Energieerhaltung, 278 Entmagnetisierung, adiabatische, 133 Euler-Kraft, 202 Exzessradius, 269, 284 Feld, magnetisierendes, 149 Feldgleichung, einsteinsche, 284 Ferrite, 182 ferromagnetische Isolatoren, 182 ferromagnetische Materialien, 178 Ferromagnetismus, 103, 139, 165 Frequenz Larmor-, 111 Plasma-, 79

Dehnung, 186 Dehnungstensor, 205 Diamagnetismus, 103, 109 doppelbrechendes Material, 87, 216 Doppler-Effekt, 278 Druck, hydrostatischer, 226 durchgelassene Wellen, 93

g-Faktor von Kernen, 107 Gauß (Einheit), 147 gebogener Balken, 197 gekrümmter Raum, 263, 268, 272 gerichtetes magnetisches Moment, 124 Gleitversetzung, 14 Granat, 182 Gravitation, 263, 274 Gravitationstheorie, einsteinsche, 283 Grenzschicht, 257

ebenes Gitter, 8 Eindringtiefe, 78

Helmholtz-Theorem, 241 hexagonales Gitter, 11

288 hookesches Gesetz, 21, 59, 185, 209, 218 Hydrodynamik, 228 Hydrostatik, 225 hydrostatischer Druck, 226 Hysteresekurve, 150, 171 innere Krümmung, 270 innere Reflexion, 100 Ionenbindung, 3 kármánsche Wirbelstraße, 255 Kernresonanz, magnetische, 134 Koeffizient Absorptions-, 73 Viskositäts-, 246 Kompressionsmodul, 189 kovalente Bindung, 4 Kraft Austausch-, 166 Coriolis-, 112 Euler-, 202 Zentrifugal-, 112, 259 Kristall, 1 chemische Bindung, 3 Geometrie, 1 Wachstum, 5 Kristallgitter, 5 Kristallklassen, 10 Kristallmodell von Bragg-Nye, 16 Kronecker-Symbol, 50 Krümmung im dreidimensionalen Raum, 270 in Raum und Zeit, 280 intrinsische, 270 mittlere, 271 von Oberflächen, 269 kubisches Gitter, 11 lamésche Elastizitätskonstanten, 212 landéscher g-Faktor, 107 Larmor-Frequenz, 111 larmorscher Satz, 111 Leitfähigkeit, 76 lenzsche Regel, 104 Licht Brechung, 83 Reflexion, 83

Index Band IV machsche Zahl, 254 Magneteisenstein, 184 magnetische Kernresonanz, 134 magnetische Materialien, 165 magnetische Momente, 105 magnetische Resonanz, 125 magnetische Suszeptibilität, 130 magnetisierendes Feld, 149 Magnetisierungsströme, 139 Magnetismus, 103 Magnetostriktion, 173, 180 maxwellsche Gleichungen, 68, 87, 114, 139, 142, 146, 158, 187, 216, 284 Dielektrikum, 66 Minkowski-Raum, 60 mittlere Krümmung, 271 Molekularkristall, 4 monoklines Gitter, 11 Mößbauer-Effekt, 280 „nasses“ Wasser, 245 negative Krümmung, 269 newtonsche Gesetze, 263, 283 Oersted (Einheit), 147 orthorhombisches Gitter, 11 Paramagnetismus, 103, 121, 129, 130 Pauli-Prinzip, 162 Permalloy, 180 Permeabilität, 152 Plasmafrequenz, 79 Poisson-Zahl, 187, 200 Polarisation von Materie, 63 Polarisationstensor, 43 positive Krümmung, 269 Präzession atomarer Magneten, 108 larmorsche, 111 Präzessionswinkel, 108 quantisierte magnetische Zustände, 117 Rabi-Molekularstrahl-Methode, 125 Raum, gekrümmter, 263, 268, 272 Raumzeit, Krümmung der, 280 Rayleigh-Wellen, 196

Index Band IV reflektierte Wellen, 93 Reflexion, Total-, 100 von Licht, 83 Reflexionswinkel, 83 relative Permeabilität, 152 Reynolds-Zahl, 251 Röntgenbeugung, 2 Schermodul, 191 Scherwelle, 193, 196 schraubenförmige Versetzung, 14 snelliussches Gesetz, 83 Spaltebene, 2 Spannung, 186 Volumen-, 189 Spannungstensor, 54 spezifische Wärme, 170 Spinell, 181 spontane Magnetisierung, 156 stationäre Strömung, 232 Stern-Gerlach-Versuch, 123 Strom ampèrescher, 141 atomarer, 67, 141 Stromlinien, 232 Strömung stationäre, 232 viskose, 249 wirbelfreie, 231 Supermalloy, 152 Suszeptibilität magnetische, 130 Tensor, 43 Dehnungs-, 205 Elastizitäts-, 209 höherer Stufe, 59 Polarisations-, 43 Spannungs-, 54

289 Trägheits-, 51 Transformation der Komponenten, 45 Verzerrungs-, 59, 205 Tensorfeld, 59 tetragonales Gitter, 11 Thermodynamik, 169 Torsion, 193 Totalreflexion, 100 Trägheitstensor, 51 trigonales Gitter, 11 triklines Gitter, 10 „trockenes“ Wasser, 225 Vektorprodukt, 53 Versetzungen, 13 und Kristallwachstum, 14 Verzerrungstensor, 59, 205 viskose Strömung, 249 Viskosität, 245 Viskositätskoeffizient, 246 Volumenänderung, 189 Volumenspannung, 189 Wandenergie, 172 Wärme, spezifische, 170 Welle durchgelassene, 93 reflektierte, 93 Scher-, 196 Widerstandsbeiwert, 254 wirbelfreie Strömung, 231 Wirbellinien, 240 Wirbelschicht, 257 Wirbelvektor, 231 youngscher Modul, 186 Zähigkeit, s. Viskosität, 245 Zentrifugalkraft, 112, 259

Gesamtindex 21-Zentimeter-Linie, V-245 Aberration, II-24, II-125 chromatische, II-24 sphärische, II-24, II-149 Ableitung, I-109 partielle, I-204 absoluter Nullpunkt, I-7, I-22, II-286 Absorption, II-77, V-58, V-173 Absorptionskoeffizient, IV-73 Acetylcholin, I-33 Actomyosin, I-33 Adenin, I-38 adiabatische Entmagnetisierung, IV-133 adiabatische Expansion, II-278 adiabatische Kompression, II-201 Adjungierte, V-231 aktives Schaltelement, III-401 Aktivierungsenergie, I-35, II-251 Akzeptor, V-284 Algebra, I-297 Vierervektoren, I-243 algebraische Gleichungen, V-421 algebraischer Operator, V-428 Alnico V, IV-156, IV-179 Ammoniak-Maser, V-155 Ammoniakmolekül, V-148, V-155 Amperemeter, III-280 ampèrescher Strom, IV-141 ampèresches Gesetz, III-229 Amplitude von Schwingungen, I-291 Amplituden, V-17, V-135 interferierende, V-85 Ortsabhängigkeit der, V-262, V-317 Transformation von, V-95 Wahrscheinlichkeits-, V-13, V-33, V-317 Zeitabhängigkeit der, V-117 Amplitudenmodulation, II-331 Analogrechner, I-346

angeregter Zustand, III-141, V-268 Ångstrom (Einheit), I-4 anomale Brechung, II-108 anomale Dispersion, II-77 antiferromagnetisches Material, IV-181 Antimaterie, II-398, V-222 Antiproton, V-218 Antiteilchen, I-24, V-218 Äquipotentialflächen, III-71 äquivalente Schaltkreise, III-411 Äquivalenzprinzip, einsteinsches, IV-275 Arbeit, I-179, I-193 Argon, V-417 assoziierte Legendre-Funktionen, V-407 Astronomie und Physik, I-39 Äthylenmolekül, V-307 Atom, I-3 Rutherford-Bohr-Modell, III-78 Stabilität des, III-78 Thomson-Modell, III-78 Atom, metastabiles, II-256 atomare Polarisierbarkeit, IV-65 atomare Prozesse, I-7 Paritätserhaltung, V-365 atomare Ströme, III-229 atomare Teilchen, I-24 atomare Umlaufbahnen, III-12 atomarer Strom, IV-67, IV-141 Atomhypothese, I-3 Atomuhr, I-63, V-173 Auflösungsvermögen, II-25, II-56 Auge, Facetten-, II-154 Auge, menschliches, II-129, II-148 Ausbreitung eines Feldes, III-323 Ausbreitung im Kristallgitter, V-257 Ausschließungsprinzip, V-66 Austauschkraft, IV-166 Avogadro-Zahl, II-241 axialer Vektor, I-279, II-393, II-398

292 Bahnbewegung, IV-107 Bahndrehimpuls, V-395 Bar (Einheit), II-319 Barkhausen-Effekt, IV-178 Baryonenzahl, Erhaltung, V-218 Basiszustände, V-82, V-233 der Welt, V-141 Batterie, III-404 beeinflusste Zukunft, I-242 Beleuchtung, III-218 Benzolmolekül, 305, V-190 Bernoulli-Theorem, IV-232 Bernstein, III-15, IV-184 Beschleunigung, I-113 Gravitations-, I-122 Komponenten der, I-121 Winkel-, 252 Bessel-Funktion, III-433 Betatron, III-299, III-547 Beugung, II-49, IV-2 an einem Schirm, II-80 Röntgenstrahlen, II-59, II-187 Beugung an Kristallen, V-22 Beugungsgitter, II-44, II-53 Auflösungsvermögen, II-56 bewegte Ladung, Feldimpuls einer, III-518 Bewegung, I-57, I-103 brownsche, II-227, II-240, II-304, II-309 in gekrümmter Raumzeit, IV-280 harmonische, I-291, I-311 Kreis-, I-291 einer Ladung, III-537 parabolische, I-116 Planeten-, I-87, I-126, I-185 Zwangs-, I-195 Bewegungsgleichung, einsteinsche, IV-283 Bezirk, IV-172 Bildladung, III-103 Biologie und Physik, I-32 Biot und Savart, Gesetz von, III-254, III-385 Blindwiderstand, III-413 Blitz, III-166 bohrscher Radius, II-189, V-26, V-398, V-402 bohrsches Magneton, IV-118, IV-133,

Gesamtindex IV-165, V-248 Boltzmann-Energie, IV-156 Boltzmann-Gesetz, II-213 Boltzmann-Konstante, II-241, III-125, V-282 Boltzmann-Theorie, V-454 Bor, V-417 Bose-Teilchen, V-49, V-304 boylesches Gesetz, II-223 „Boys“-Kamera, III-166 Bragg-Nye-Modell, IV-16 Brechung, II-2 anomale, II-108 von Licht, IV-83 Brechungsindex, II-67, IV-63 Bremsstrahlung, II-119 Brennpunkt, II-9, II-17 Brennweite Linse, II-19 sphärische Fläche, II-16 Brewster-Winkel, II-103 brownsche Bewegung, I-13, I-77, II-227, II-240, II-304, II-309 Bürstenentladung, III-165 Butadienmolekül, V-311 carnotscher Kreisprozess, II-278, II-293 Cavendish-Versuch, I-98 Chemie und Physik, I-31 chemische Bindung, IV-3 chemische Energie, I-46, I-54 chemische Kinetik, II-251 chemische Reaktion, I-10 Chlorophyllmolekül, V-312 chromatische Aberration, II-24 Clausius-Clapeyron-Gleichung, II-298 Clausius-Mossotti-Formel, III-195, IV-71 Clebsch-Gordan-Koeffizienten, V-385 Coriolis-Kraft, I-271, I-281, II-378, II-388, IV-112 Cornea, II-129, II-148 Cornu-Spirale, II-61 Couette-Strömung, IV-258 coulombsches Gesetz, II-29, III-3, III-9, III-56, III-57, III-69, III-84 Curie-Temperatur, IV-160, IV-162, IV-165, IV-170, IV-179

Gesamtindex Curie-Weiss-Gesetz, III-199 curiesches Gesetz, III-191 Cytosin, I-38 Dämpfung, II-78 d’Alembert-Operator, III-473 Debye-Länge, III-126 Dehnung, IV-186 Dehnungstensor, IV-205 Diamagnetismus, IV-103, IV-109 Diamantgitter, V-277 Dichte, I-5 Wahrscheinlichkeits-, I-81 Dielektrikum, III-171, III-185 Dielektrizitätskonstante, III-171 Differentialrechnung, I-108, III-17 Diffusion, II-257 von Neutronen, III-212 Diffusionsgleichung, für Neutronen, III212 Dipol elektrischer, III-92 magnetischer, III-250 molekularer, III-185 schwingender, III-381 Dipolmoment, I-168, III-94 magnetisches, III-252 Dipolpotential, III-95 Dipolstrahler, II-32, II-41 Dirac-Gleichung, I-283 Dispersion, II-74 anomale, II-77 normale, II-77 Dispersionsrelation, II-74 Divergenz (Operator), III-26, III-35 für Vierervektoren, III-471 DNS, I-37 Donator, V-283 Doppelbild, II-149 doppelbrechendes Material, II-108, IV-87, IV-216 Doppelbrechung, II-99, II-108 Doppelspalt, Interferenz, V-38 Doppelsterne, I-94 Doppler-Effekt, I-248, I-324, II-120, II-189, IV-278, V-25, V-245 Drehimpuls, I-96, I-251, I-255, I-275, V-438

293 Bahn-, V-395 des starren Körpers, I-285 Erhaltung, I-54, I-257, I-280 Zusammensetzen von, V-382 Drehimpuls, Licht, II-110 Drehmatrix, V-99 Drehmoment, I-253, I-275 Drehstrom, III-290 Drehung ebene, I-249 eines starren Körpers, I-251 im Raum, I-275 von Achsen, I-148 dreidimensionale Wellen, III-365 dreidimensionales Gitter, V-266 Dreikörperproblem, I-131 Druck, I-5 eines Gases, II-197 hydrostatischer, IV-226 durchgelassene Wellen, IV-93 Dynamik, I-89, I-117 Drehung, I-251 relativistische, I-218 dynamischer Impuls, V-450 ebene Wellen, III-355 ebenes Gitter, IV-8 effektive Masse, V-266 Eigenschwingung, III-438 Eigenwert, V-230 Eigenzustand, V-230 einatomiges Gas, II-200, II-208, II-221 eindimensionales Gitter, V-257 Eindringtiefe, IV-78 Einfallswinkel, II-3, IV-83 einflussnehmende Vergangenheit, I-242 eingespannter Balken, IV-199 Einheitsmatrix, V-203 Einheitsvektor, I-159, III-20 Einheitszelle, II-187, V-23 Einschwingverhalten, I-295 Einschwingvorgang, I-325 elektrischer, I-330 Einstein-Koeffizienten, V-60, V-174 Einstein-Podolsky-Rosen-Paradoxon, 375 einsteinsche Bewegungsgleichung, IV-283

294 einsteinsche Feldgleichung, IV-284 einsteinsche Gravitationstheorie, IV-283 einsteinsches Äquivalenzprinzip, IV-274 Elastika, IV-203 elastische Energie, I-46, I-54 elastische Konstanten, IV-212 elastische Materialien, IV-205 elastischer Stoß, I-141 Elastizität, IV-185 Elastizitätstensor, IV-209 Elektret, III-196 elektrische Energie, I-46, I-54, I-142, III-261 elektrische Kräfte, III-1, III-223 in relativistischer Notation, III-463 elektrische Ladungsdichte, III-27, III-58, III-82, V-452 elektrische Stromdichte, III-27, III-224, V-452 elektrische Suszeptibilität, III-176 elektrischer Dipol, III-99 elektrischer Fluss, III-7 elektrischer Generator, III-279, III-401 elektrischer Strom, III-224 in der Atmosphäre, III-153 elektrisches Feld, I-19, I-169, III-3, III-4, III-115 Relativität, III-232 elektrisches Potential, III-59 Elektrodynamik, III-4 in relativistischer Notation, III-463 Elektromagnet, IV-153 elektromagnetische Energie, II-39 elektromagnetische Masse, III-520 elektromagnetische Strahlung, II-1, II-27, II-28, II-37 elektromagnetische Wellen, I-21, II-1, III-355, III-375 elektromagnetisches Feld, I-17, I-20, I-21, I-143 Elektromagnetismus, III-2 Gesetze des, III-8 Elektromotor, III-279 elektromotorische Kraft, III-282 Elektron, I-19, II-165, II-170, V-1, V-5 Ladung des, I-170 Radius, klassischer, II-87

Gesamtindex Elektron, klassischer Radius, III-520 Elektron-Loch-Paare, V-281 Elektronenkonfiguration, V-418 Elektronenmikroskop, III-542 Elektronenpolarisation, III-186 Elektronenstrahlröhre, I-172 Elektronenvolt (Einheit), II-116 Elektronenwolke, I-86 Elektrostatik, III-55, III-75 elektrostatische Energie, III-131 einer Punktladung, III-148 eines Ionenkristalls, III-137 in Kernen, III-140 von Ladungen, III-131 elektrostatische Gleichungen, III-178 elektrostatische Linse, III-540 elektrostatisches Feld, III-75, III-115 eines Gitters, III-128 Energie im, III-145 elektrostatisches Potential, III-92 Ellipse, I-88 Emission, V-58 Emissionsvermögen, III-112 Energie, I-45, III-413 magnetische, III-311 chemische, I-46, I-54 eines Kondensators, III-133 elastische, I-46, I-54 elektrische, I-46, I-54, I-142, III-261 elektromagnetische, II-39 elektrostatische, III-131, III-137 Erhaltung der, III-499 Gravitations-, I-46 im elektrostatischen Feld, III-145 Kern-, I-46 kinetische, I-11, I-22, I-46, I-52, I-270, II-200, II-202 Massen-, I-46 mechanische, III-261 potentielle, I-47, I-179, I-193, V-124 relativistische, I-223 Rydberg-, V-181 Strahlungs-, I-46, I-54, I-101, I-142 Wärme-, I-46, I-140, I-142 Zustände mit bestimmter, V-260 Energiediagramm, V-278 Energiedichte, III-500

Gesamtindex Energieerhaltung, I-33, I-45, IV-278, V-124 Energiefluss, III-501 Energieniveaudiagramm, V-281 Energieniveaus, II-190, V-27, V-242 harmonischer Oszillator, II-225 Energiesatz, II-365 Entfernung, I-64 Entfernungsmessung Farbhelligkeit, I-65 Triangulation, I-64 Enthalpie, II-297 Entmagnetisierung, adiabatische, IV-133 Entropie, II-286, II-312 EPR-Paradoxon, V-375 Erhaltung Baryonenzahl, V-218 Drehimpuls, I-54, I-257, I-280 Impuls, I-54, I-131 Ladung, I-55, III-225 Energie, I-33, I-45, III-499, V-124, V-218 Strangeness, V-217 euklidische Geometrie, I-1, I-163, I-176, I-239 Euler-Kraft, IV-202 Expansion adiabatische, II-278 isotherme, II-277 exponentionelle Atmosphäre, II-211 Exzessradius, IV-269, IV-284 Exziton, V-269 Facettenauge, II-154 Farad (Einheit), I-345, III-109 faradaysches Induktionsgesetz, III-296, III-317, III-328 Farbdiagramm, II-137 Farbensehen, II-129, II-141, II-145 Farbstoffe, V-193 Feld, I-169 eines geladenen Leiters, III-102 eines Leiters, III-86 elektrisches, I-19, I-169, III-3, III-4, III-75, III-115 elektromagnetisches, I-17, I-20, I-21, I-143

295 elektrostatisches, III-75, III-115 Gravitations-, I-188 in einem Hohlraum, III-88 magnetisches, I-173, III-3, III-4, III-223, III-241 und Potential, I-202 Relativität, III-232 skalares, III-19 Superposition, I-172 Vektor-, III-5, III-6, III-18 zweidimensionales, III-116 Feld, magnetisierendes, IV-149 Feldemissionsmikroskop, III-111 Feldenergie, III-499 einer Punktladung, III-517 Feldgleichung, einsteinsche, IV-284 Feldimpuls, III-511 einer bewegten Ladung, III-518 Feldindex, III-546 Feldlinien, III-71 Feldstärke, III-5 fermatsches Prinzip, II-4 Fermi (Einheit), I-69 Fermi-Teilchen, V-49, V-305 Ferrite, IV-182 Ferroelektrizitat, III-197 ferromagnetische Isolatoren, IV-182 ferromagnetische Materialien, IV-178 ferromagnetischer Kristall, V-297 Ferromagnetismus, IV-103, IV-139, IV-165 Festkörperphysik, III-139 Filter, III-417 Fläche, gaußsche, III-172 Fluor, V-417 Fluss, III-6, III-37, III-64 eines Vektorfeldes, III-37 elektrischer, III-8 flüssiges Helium, V-66 Flüssigkeitsströmung, III-214 Flussquantisierung, V-458 Flussregel, III-295 Fortpflanzungsfaktor, III-418 Fotosynthese, I-34 foucaultsches Pendel, I-225 Fourier, Theorem von, III-128 Fourier-Transformation, I-339 Fourieranalyse, II-357, II-361

296 Fovea, II-129, II-142 Freiheitsgrade, I-336, II-210, II-211 Frequenz Kreis-, I-291 Larmor-, IV-111 Plasma-, III-123, IV-79 Schwingungs-, I-20 fresnelsche Reflexionsformeln, II-107 Führungsfeld in Beschleunigern, III-544 g-Faktor von Kernen, IV-107 Galilei-Transformation, I-175, I-209 galileische Relativität, I-134, I-139 Gallium, V-419 Galvanometer, III-13, III-280 Gammastrahlen, I-21 Gas, einatomiges, II-200, II-208, II-221 Gasdruck, II-197 Gauß (Einheit), IV-147 Gauß-Verteilung, I-83, V-326 gaußsche Fläche, III-172 gaußscher Satz, III-40 gaußsches Gesetz, III-68 Anwendung, III-75 gaußscher Satz, V-450 Gauß (Einheit), II-116 gebogener Balken, IV-197 gedämpfte Schwingung, I-327 geführte Wellen, III-443 Gegeninduktivität, III-307, III-422 Gegenkapazität, III-423 gekoppelte Pendel, II-350 gekrümmter Raum, IV-263, IV-268, IV-272 geladener Leiter, III-102, III-133 gelber Fleck, II-129, II-142 Generator elektrischer, III-279, III-401 Van-de-Graaff-, III-89, III-141 Wechselstrom, III-303 Geologie und Physik, I-40 geometrische Optik, II-1, II-15 Geräusch, II-356 gerichtetes magnetisches Moment, IV-124 Geschwindigkeit, I-106, I-119 Komponenten der, I-120 Licht-, I-207, III-328 Paradoxien, I-106

Gesamtindex Transformation der, I-227 Winkel- , I-252 Geschwindigkeitspotential, III-215 Gesetze der Induktion, III-295 des Elektromagnetismus, III-8 der Quantenmechanik, V-33 der Thermodynamik, II-271 gestreifter Muskel, I-194 Gewitter, III-157 Gezeiten, I-92 Gitter dreidimensionales, V-266 eindimensionales, V-257 glatter Muskel, I-194 Gleichgewicht, I-9 Gleichrichter, III-419 Gleichrichtung, II-366 Gleichrichtung, Halbleiter-Übergang, V-292 Gleichzeitigkeit, I-217 Gleitversetzung, IV-14 Gradient, III-21, III-35 Granat, IV-182 Gravitation, I-18, I-87, I-162, I-183, IV-263, IV-274 Gravitationsbeschleunigung, I-122 Gravitationsenergie, I-46 Gravitationsfeld, I-171, I-188 Gravitationskonstante, I-98 Gravitationstheorie, einsteinsche, IV-283 greensche Funktion, I-340 Grenzfrequenz, III-417 Grenzschicht, IV-257 Grundzustand, III-141, V-118, V-233 Gruppengeschwindigkeit, II-335 Guanin, I-38 haidingersches Büschel, II-155 Halbleiter, V-277 unreine, V-283 von n-Typ, V-284 von p-Typ, V-284 Halbleiter-Übergang, V-288, V-292 Hall-Effekt, V-286 Hamilton-Matrix, V-147

Gesamtindex hamiltonsche erste Prinzipalfunktion, III-345 Harmonische, II-355 harmonische Bewegung, I-291, I-311 harmonischer Oszillator, I-131, I-288, II-225 angetriebener, I-294, I-311 Hauptquantenzahl, V-411 Helium, I-7, I-39, II-350, V-415 flüssiges, V-66 Helmholtz-Theorem, IV-241 Henry (Einheit), I-344 hermitesch adjungierter Operator, V-424 hexagonales Gitter, IV-11 Hochspannungsdurchschlag, III-110 Hohlleiter, III-443, III-444 Hohlraumresonator, III-433 hookesches Gesetz, I-169, III-180, IV-21, IV-59, IV-185, IV-209, IV-218 Hornhaut, II-129, II-148 Hydrodynamik, IV-228 Hydrostatik, IV-225 hydrostatischer Druck, IV-226 Hysteresekurve, IV-150, IV-171 ideales Gasgesetz, II-208 identische Teilchen, V-33, V-49 Impedanz, I-346, III-395 komplexe, I-319 des Vakuums, II-85 Impuls, I-117, I-131, II-182, V-18 des Lichts, II-126 Dreh-, I-96, I-255, I-275, I-279, V-438 dyamischer, V-450 kinematischer, V-450 quantenmechanischer, I-143 relativistischer, I-142, I-223 Impulserhaltung, I-54, I-133, I-136 Impulsoperator, V-423, V-432 Impulsspektrometer, III-538 Impulsspektrum, III-539 Induktionsgesetze, III-295 Induktionsspule, I-344 Induktivität, I-318, III-284, III-311, III-396 Gegen-, III-307, III-422 Selbst-, III-285, III-310 induzierte Ströme, III-280

297 Infrarotstrahlung, I-21, I-321, II-1 innere Krümmung, IV-270 innere Reflexion, IV-100 Integral, I-111 Integralrechnung, III-35 Interferenz, II-34, II-37 und Beugung, II-49 am Doppelspalt, V-38 interferierende Amplituden, V-85 interferierende Wellen, II-169, V-4 Interferometer, I-213 Ion, I-9 Ion des Wasserstoffmoleküls, V-177 Ionenbindung, IV-3 Ionenkristall, III-137 Ionenleitfähigkeit, II-264 Ionenpolarisierbarkeit, III-197 Ionisationsenergie, II-249 von Wasserstoff, II-190, V-26 Ionosphäre, III-122 Irreversibilität, II-309 Isolator, III-3, III-171 Isothermalflächen, III-19 Isotherme, III-19 isotherme Atmosphäre, II-213 isotherme Expansion, II-277 isotherme Kornpression, II-278 Isotope, I-36, II-208 johnsonsches Rauschen, II-230, II-237 Josephson-Übergang, V-464 Joule (Einheit), I-182 joulesche Wärme, I-326 Kalium, V-419 Kapazität, I-317, III-108 eines Kondensators, III-133 Gegen-, III-423 Kapillarwirkung, II-381 kármánsche Wirbelstraße, IV-255 Katalysator, II-253 keplersche Gesetze, I-88, I-117, I-257 Kern, I-19, I-22, I-24 Kernenergie, I-46 Kernkräfte, I-176, III-2, III-140, III-530, III-532, V-184 Kernresonanz, magnetische, IV-134

298 Kernwechselwirkungen, III-141 Kernwirkungsquerschnitt, I-69 Kerr-Effekt, II-102 Kerr-Zelle, II-102 Kilokalorie (Einheit), III-138 kinematischer Impuls, V-450 kinetische Energie, I-11, I-22, I-46, I-52, II-200 der Drehbewegung, I-270 und Temperatur, II-202 kinetische Gastheorie, II-195, II-243 kirchhoffsche Gesetze, I-347, III-405, III-415 klassischer Elektronenradius, II-87, III-520 klassischer Grenzfall, V-128 kleinste Wirkung, Prinzip, III-333 Knarre und Sperrhaken Maschine, II-303 Knoten, II-344 Koaxialleitung, III-443 Koeffizient Absorptions-, IV-73 Viskositäts-, IV-246 Koeffizient des Gravitationsgesetzes, I-99 kolloidale Teilchen, III-124 komplexe Impedanz, I-319 komplexe Variable, III-116 komplexe Zahlen, I-305 und Schwingungen, I-311 Kompression adiabatische, II-201 isotherme, II-278 Kompressionsmodul, IV-189 Kondensator, I-205, I-317, III-107, III-398 bei hohen Frequenzen, III-427 Energie des, III-133 konservative Kraft, I-196 Kontraktionshypothese, I-213 Kopplungskoeffizient, III-313 kosmische Strahlung, I-21, III-153 kosmische Synchrotronstrahlung, II-118 kovalente Bindung, IV-4 Kraft Austausch-, IV-166 Coriolis-, I-271, I-281, II-378, II-388, IV-112

Gesamtindex elektrische, I-18, III-1, III-223 elektromotorische, III-282 Euler-, IV-202 Gravitations-, I-18 Kern-, I-176, III-2, III-140, III-530, III-532 Komponenten, I-120 konservative, I-196 Lorentz-, III-223, III-276 magnetische, I-174, III-3, III-223 Molekular-, I-167 Moment (Drehmoment), I-254 nichtkonservative, I-200 Schein-, I-174 Zentrifugal-, I-93, I-175, I-225, I-271, I-285, II-388, IV-112, IV-259 Zentripetal-, I-272 Kreisbewegung, I-291 Kreisel, I-281 Kreisfrequenz, I-291, II-40, II-346 Kreuzprodukt, III-27 Kristall, IV-1 chemische Bindung, IV-3 Geometrie, IV-1 Ionen-, III-137 Wachstum, IV-5 Kristall, ferromagnetischer, V-297 Kristallbeugung, 187 Kristallgitter, IV-5 Ausbreitung im, V-257 Fehlerstellen, V-270 Kristallklassen, IV-10 Kristallmodell von Bragg-Nye, IV-16 Kronecker-Symbol, IV-50 Krümmung im dreidimensionalen Raum, IV-270 in Raum und Zeit, IV-280 intrinsische, IV-270 mittlere, IV-271 von Oberflächen, IV-269 Krypton, V-419 kubisches Gitter, IV-11 Kugel, geladene, III-82 Kugelfunktionen, V-404, V-407 kugelsymmetrische Lösungen, V-397 Kugelwellen, III-370, III-377 kürzeste Zeit, Prinzip der, II-1, II-4, II-8

Gesamtindex Ladung des Elektrons, I-170 Ladung, Bewegung einer, III-537 Ladung, Polarisations-, III-175 Ladungsdichte, III-27, III-58, III-82 V-452 Ladungserhaltung, I-55, III-224 Ladungsträger, V-279 Ladungstrennung, III-162 Ladungsverteilung geladene Kugel, III-82 geladene Linie, III-79 geladene Schicht, III-80 Lagrange-Funktion, III-345 Lamb-Retherford-Messung, III-85 lamésche Elastizitätskonstanten, IV-212 landéscher g-Faktor, IV-107 Laplace-Gleichung, III-115 Laplace-Operator, III-31 Larmor-Frequenz, IV-111 larmorscher Satz, IV-111 Laser, I-59, II-90, II-256, V-171 Legendre-Funktionen, V-407 Legendre-Polynome, V-381, V-407 Leistung, I-181 Leiter, III-3 Leitfähigkeit, IV-76 ionische, II-264 thermische, II-269 Wärme-, III-28, III-205 Leitungsband, V-277 lenzsche Regel, III-285, IV-104 Licht, I-20, III-375 Brechung, IV-83 Geschwindigkeit des, III-328 Reflexion, IV-83 Licht, polarisiertes, II-94 Lichtabsorption, V-173 Lichtdruck, II-126 Lichtgeschwindigkeit, I-207 Lichtimpuls, II-126 Lichtkegel, I-241 Lichtstreuung, II-90 Lichtwellen, II-327 Liénard-Wiechert-Potential, III-391 lineare Systeme, I-335 lineare Transformation, I-153 Linie, geladene, III-79

299 Linienintegral, III-36 Linse elektrostatische, III-540 magnetische, III-541 Quadrupol-, III-119, III-547 Linsenformel, II-23 Lithium, V-415 Logarithmen, I-301 Lorentz-Formel, III-391 Lorentz-Gruppe, III-467 Lorentz-Kontraktion, I-216 Lorentz-Kraft, III-223, III-276 Lorentz-Transformation, I-209, I-237, II122, II-387, III-391, III-463 der Felder, III-479 Lorenz-Eichung, III-331, III-474 Luftkissenbahn, I-136 machsche Zahl, IV-254 Magenta, V-193 Magneteisenstein, III-15, IV-184 magnetische Energie, III-311 magnetische Induktion, I-174 magnetische Kernresonanz, IV-134 magnetische Kraft, I-174, III-3, III-223 eines Stroms, III-226 magnetische Linse, III-541 magnetische Materialien, IV-165 magnetische Resonanz, IV-125 magnetische Suszeptibilität, IV-130 magnetischer Dipol, III-250 magnetisches Dipolmoment, III-252 magnetisches Feld, I-173, III-3, III-4, III-223, III-241 Relativität, III-232 stationäre Ströme, III-227 magnetisches Moment, IV-105, V-206 magnetisierendes Feld, IV-149 Magnetisierungsströme, IV-139 Magnetismus, I-20, IV-103 Magnetostatik, III-55, III-223 Magnetostriktion, IV-173, IV-180 Magnonen, V-304 Maser, II-256 Maser, Ammoniak-, V-155 Masse, I-118, I-207 effektive, V-266

300 elektromagnetische, III-520 relativistische, I-230 Masse-Energie-Äquivalenz, I-220 Massenenergie, I-46, I-54 Massenmittelpunkt, I-249, I-261 Mathematik und Physik, I-31 Matrix, V-78 Matrixelement des elektrischen Dipols, V-175 Matrizenrechnung, V-90, V-204, V-443 maxwellsche Gleichungen, I-208, I-338, II-312, II-323, III-17, III-27, III-55, III-91, III-123, III-146, III-179, III-227, III-275, III-317, III-395, III-404, III-411, III-428, III-434, III-449, III-472, III-474, III-477, III-480, III-502, III-511, III-517, IV-68, IV-87, IV-114, IV-139, IV-142, IV-146, IV-158, IV-187, IV-216, IV-284 allgemeine Lösung, III-380 Dielektrikum, IV-66 in Anwesenheit von Strömen und Ladungen, III-375 in relativistischer Notation, III-494 Lösen der, III-329 Lösungen im leeren Raum, III-355 Modifikationen, III-524 für Vierervektoren, III-476 maxwellscher Dämon, II-309 mechanische Energie, III-261 Meissner-Effekt, V-455, V-461 menschliches Auge, II-129 metastabiles Atom, II-256 Meter (Einheit), I-70 MeV (Einheit), I-26 Michelson-Morley-Experiment, I-210 Mikroskop Elektronen-, III-542 Feldemissions-, III-111 Minkowski-Raum, IV-60 mittlere freie Weglänge, II-260 mittlere Krümmung, IV-271 mittlere quadratische Entfernung, I-78, II-239, II-240 Moden, II-350 Normal-, II-339

Gesamtindex Mol (Einheit), II-208 Molekül, I-4 nichtpolares, III-186 polares, III-186, III-189 Molekularbewegung, II-227 Molekulardiffusion, II-266 molekulare Anziehung, I-4, I-168 molekularer Dipol, III-185 Molekularkristall, IV-4 Moment Dipol-, I-168 Kraft-, I-253 Trägheits-, I-258, I-266 Moment, magnetisches, V-206 monoklines Gitter, IV-11 Mößbauer-Effekt, IV-280 Motor, elektrischer, III-279 Musik, II-356 mv-Impuls, V-450 n-Typ-Halbleiter, V-284 Nablaoperator, III-23 Näherung unabhängiger Teilchen, V-297 „nasses“ Wasser, IV-245 Natrium, V-417 negative Krümmung, IV-269 negative Ladungsträger, V-279 Neon, V-417 nernstsches Wärmetheorem, II-288 Netzhaut, II-129 neutrales K-Meson, V-217 neutrales Pion, V-185 Neutronen, I-19 Neutronen, Diffusion von, III-212 Newton (Einheit), I-152 Newton-Meter (Einheit), I-182 newtonsche Gesetze, I-22, I-90, I-102, I-117, I-131, I-147, I-149, I-155, I-161, I-175, I-179, I-200, I-207, I-218, I-225, I-233, I-249, I-262, I-275, II-30, II-195, II-197, II-208, II-227, II-303, II-310, II-317, III-121, III-333, IV-263, IV-283 nichtpolares Molekül, III-186 Nichtuniversalität, III-477 normale Dispersion, II-77

Gesamtindex Normalmoden, II-339 Normalverteilung, I-83, 326 Nukleon, V-204 Nullmasse, I-28 Nullpunkt, absoluter, I-7, I-22 numerische Analysis, I-123 Nutation, I-284 Oberflächenspannung, III-209 Oberschwingungen, II-355 Oersted (Einheit), IV-147 Ohm (Einheit), I-344 ohmsches Gesetz, I-318, I-344, II-265, III-353, V-286 Operator, V-140, V-421 algebraischer, V-428 Divergenz, III-26, III-35, III-471 Gradient, III-21, III-35 hermitesch adjungierterer, V-424 Impuls-, V-423, V-432 Laplace-, III-31 Nabla, III-23 Rotation, III-27, III-35 Vektor-, III-25 Optik, geometrische, II-1, II-15 optische Achse, II-100 optischer Nerv (Sehnerv), II-130 Orientierungspolarisation, III-189 orthorhombisches Gitter, IV-11 Ortsabhängigkeit der Amplitude, V-262 Oszillator, harmonischer, I-59, I-131, I-288 angetriebener, I-294, I-311 Pappus, Satz von, I-265 Parabolantenne, II-57 parabolische Bewegung, I-116 Parallel-Achsen-Satz, I-268 Paramagnetismus, IV-103, IV-121, IV-129, IV-130 paraxiale Strahlen, II-17 partielle Ableitung, I-204 pascalsches Dreieck, I-76 passives Schaltelement, III-401 Pauli-Matrizen, V-201 Pauli-Prinzip, IV-162 Pendel, foucaultsches, I-225 Pendel, gekoppelte, II-350

301 Pendeluhr, I-59 Periode der Schwingung, I-289 Periodensystem, V-414 Permalloy, IV-180 permanente Bewegung, II-304 Permeabilität, IV-152 Phase, I-289 Phasengeschwindigkeit, II-335 Phasenverschiebung, I-291 Photon, I-25, I-247, II-1, II-174, V-10, V-58 Absorption, V-58 Emission, V-58 Polarisationszustände des, V-212 Physik und Astronomie, I-39 und Biologie, I-32 und Chemie, I-31 und Geologie, I-40 und Mathematik, I-31 und Psychologie, I-41 vor 1920, I-17 Physiochemie des Farbensehens, II-141 Piezoelektrizität, III-197 p-Impuls, V-450 Pion, neutrales, V-185 plancksche Konstante, II-179 plancksches Wirkungsquantum, I-54, I-70, I-247, III-269, III-347, III-530, V-14, V-440, V-446 Planetenbewegung, I-87, I-126, I-185 Plasma, III-122 Plasmafrequenz, III-123, IV-79 Plasmaschwingungen, III-121 Plattenkondensator, I-205, III-107, 133 Poincaré-Spannung, III-522 Poisson-Gleichung, III-91 Poisson-Zahl, IV-187, IV-200 polarer Vektor, I-279, II-393 polares Molekül, III-186, III-189 Polarisation, II-99 von gestreutem Licht, II-99 von Materie, IV-63 zirkulare, II-98 Polarisationsladungen, III-175 Polarisationstensor, IV-43 Polarisationsvektor, III-173

302 Polarisationszustände des Photons, V-212 polarisiertes Licht, II-94 positive Krümmung, IV-269 positive Ladungsträger, V-279 Potential Quadrupol-, III-101 Vektor-, III-241, III-257 Vierer-, III-474 Potentialgradient der Atmosphäre, III-151 potentielle Energie, I-47, I-179, I-193, V-124 Poynting-Vektor, III-505, III-510 Präzession atomarer Magneten, IV-108 larmorsche, IV-111 Präzession eines Spin- 21 -Teilchens, V-131 Präzessionswinkel, IV-108 Prinzip der kleinsten Wirkung, III-333 der kürzesten Zeit, II-1, II-4, II-8 der Superposition, III-4, III-56 fermatsches, II-4 der Umkehrbarkeit, II-7, II-58 Unbestimmtheits-, I-84, I-102, II-176, II-179, II-184, II-192 der virtuellen Arbeit, I-52 Proton, I-19 Protonspin, III-140 Psychologie und Physik, I-41 Punktladung, III-2 elektrostatische Energie einer, III-148 Feldenergie einer, III-517 Purkinje-Effekt, II-131 Pyroelektrizität, III-197 quadratisches Mittel, I-79 Quadrupollinse, III-119, III-547 Quadrupolpotential, III-101 Quantenelektrodynamik, I-24, II-30, II-256 Quantenmechanik, I-17, I-21, I-84, I-143, II-165, II-181, V-1, V-17, V-33 und Vektorpotential, V-446 quantenmechanische Resonanz, V-181 quantenmechanischer Impuls, I-143 quantenmechanisches Vektorpotential, III-268 Quantenzahlen, V-252

Gesamtindex quantisierte magnetische Zustände, IV-117 quellenfreies Vektorfeld, III-50, III-56 Rabi-Molekularstrahl-Methode, IV-125 radioaktive Isotope, I-36, I-61, II-397 radioaktive Uhr, I-61 Radius des Elektrons, II-87 Radius, bohrscher, V-26, V-398, V-402 Randwertprobleme, III-115 Raum, I-17, I-105 gekrümmter, IV-263, IV-268, IV-272 Raumzeit, I-21, I-237, III-495 Raumzeit, Krümmung der, IV-280 Rayleigh-Gesetz, II-235 Rayleigh-Kriterium, II-56 Rayleigh-Wellen, IV-196 Reaktanz, III-413 reflektierte Wellen, IV-93 Reflexion, II-2 Reflexion, Total-, IV-100 von Licht, IV-83 Reflexionswinkel, II-3, IV-83 Reibung, I-136, I-164 Reibungskoeffizient, I-165 relative Permeabilität, IV-152 relativistische Dynamik, I-218 relativistische Energie, I-223 relativistische Masse, I-230 relativistischer Impuls, I-142, I-223 Relativität, I-102 elektrisches Feld, III-232 galileische, I-134, I-139 magnetisches Feld, III-232 Relativitätstheorie, I-237 spezielle, I-207 Resonanz, I-311 elektrische, I-316 in der Natur, I-320 quantenmechanische, V-181 Resonanzkreise, III-441 Resonanzwechselwirkung, I-27 Resonator, Hohlraum-, III-433 retardierte Zeit, II-29 Retina, II-129 Reversibilität, II-308 Reynolds-Zahl, IV-251

Gesamtindex ritzsches Kombinationsprinzip, II-191, V-28 Röntgenbeugung, II-59, II-187, III-137, IV-2, V-23 Röntgenstrahlen, I-21, II-75, II-334, V-22 Rotation (Operator), III-27, III-35 Rutherford-Bohr-Modell, III-78 Rydberg (Einheit), II-190, V-26 Rydberg-Energie, V-181, V-398 Saha-Gleichung, II-250 Schall, I-18, II-315, II-356, II-357 Schallgeschwindigkeit, II-324 Schaltelemente, III-425 aktive, III-401 passive, III-401 Schaltkreise äquivalente, III-411 Wechselstrom-, III-395 Scheinkraft, I-174 Scheinwiderstand (Impedanz), III-395 Schermodul, IV-191 Scherwelle, II-374, IV-193, IV-196 Schicht, geladene, III-80 schiefe Ebene, I-50 Schrödinger-Gleichung, III-273, V-321, V-331 im klassischen Kontext, V-445 Wasserstoffatom, V-395 schraubenförmige Versetzung, IV-14 Schraubenwinde, I-51 schwarzer Körper, Spektrum, V-60 Schwarzkörperstrahlung, II-234 schwingender Dipol, III-381 Schwingung Amplitude, I-291 Dauer, I-288 Frequenz, I-20 gedämpfte, I-327 periodische, I-122 Phase der, I-289 Sehen, II-145, V-269 Farben-, II-129, II-145 zweiäugiges, II-149 Sehpurpur, II-141 Sehrinde, II-150 Seismograph, II-376

303 Seitenbänder, II-331 Sekunde (Einheit), I-63 Selbstinduktivität, III-285, III-310 „seltsame“ Teilchen, III-141 Sigma-Elektron, V-237 Sigma-Matrizen, V-202 Sigma-Proton, V-237 Sigma-Vektor, V-205 sinusförmige Wellen, II-40 Skalar, I-151 skalares Feld, III-18 Skalarprodukt, I-157, III-22 für Vierervektoren, III-466 snelliussches Gesetz, II-3, II-10, II-70, IV-83 Solenoid, III-231 Spaltebene, IV-2 Spannung, IV-186 Volumen-, IV-189 Spannungstensor, IV-54 Spektrum des schwarzen Körpers, V-60 spezielle Relativitätstheorie, I-207 spezifische Wärme, II-221, IV-170 bei konstantem Volumen, II-293 klassische Physik, Versagen, II-223 sphärisch symmetrische Lösung, V-397 sphärische Aberration, II-24, II-149 Spin- 21 -Teilchen, V-95, V-233 Präzession von, V-131 Spin eins, V-73 Spin-Bahn-Kraft, III-140 Spinaustauschoperator, V-242, V-298 Spinbahnwechselwirkung, V-316 Spinell, IV-181 Spinwellen, V-297 spontane Emission, II-254 spontane Magnetisierung, IV-156 Stäbchenzellen, II-130, II-135, II-141, II-151, II-152, V-269 Standardabweichung, I-83 starrer Körper, I-249, I-275 Drehung des, I-251 Statik, III-55 stationäre Strömung, IV-232 stationärer Zustand, V-117, V-230 statistische Mechanik, I-32, II-211 statistische Schwankungen, I-73

304 Stefan-Boltzmann-Konstante, II-301 steinerscher Satz, I-268 Stepped leader, III-167 Stern-Gerlach-Versuch, IV-123, V-73 Stoß, I-230 elastischer, I-141 Stoßquerschnitt, II-261 stokesscher Satz, III-48 Strahlung Brems-, II-119 elektromagnetische, II-1, II-28, II-37 Gamma-, I-21 Infrarot-, I-21, I-321, II-1 kosmische, I-21 Licht-, I-20 relativistische Effekte, II-111 Röntgen-, I-21, II-1, II-75, II-334 Schwarzkörper, II-234 Synchrotron-, II-115, II-118 Tscherenkow-, II-370 Ultraviolett-, I-21, II-1 Strahlungsdämpfung, II-83 Strahlungsdruck, II-126 Strahlungsenergie, I-46, I-54, I-101, I-142, II-39 Strahlungswiderstand, II-83 Strangeness, I-25, V-217 Streuamplituden, V-274 Streuquerschnitt, II-92 thomsonscher, II-93 Streuung des Lichts, II-90 Strom ampèrescher, IV-141 atomarer, III-229, IV-67, IV-141 elektrischer, III-224 induzierter, III-280 Wärme-, III-19, III-28, III-204 Wirbel-, III-287 Stromdichte, III-224, V-452 Stromlinien, IV-232 Strömung einer Flüssigkeit, III-214 stationäre, IV-232 viskose, IV-249 wirbelfreie, III-214, IV-231 Supermalloy, IV-152 Superposition von Feldern, I-172

Gesamtindex Superpositionsprinzip, I-337, II-28, II-322, III-4, III-56, III-240 Supraleitfähigkeit, V-453 Suszeptibilität elektrische, III-176 magnetische, IV-130 Symmetrie, I-6, I-145 physikalischer Gesetze, I-225, II-385 Synchrotron, I-21, I-219, III-301, III-544, III-547 Synchrotronstrahlung, II-115 kosmische, II-118 Taylor-Entwicklung, III-101 Teilchen Bose-, V-49, V-304 Fermi-, V-49, V-305 identische, V-33, V-49 Spin- 21 -, V-95, V-233 Spin eins, V-73 Teilchen, „seltsame“, III-141 Temperatur, II-202 Tensor, III-490, IV-43 Dehnungs-, IV-205 Elastizitäts-, IV-209 höherer Stufe, IV-59 Polarisations-, IV-43 Spannungs-, IV-54 Trägheits-, IV-51 Transformation, IV-45 Verzerrungs-, IV-59, IV-205 Tensoralgebra, V-139 Tensorfeld, IV-59 tetragonales Gitter, IV-11 thermische Ionisation, II-248 thermische Leitfähigkeit, Gas, II-269 thermisches Gleichgewicht, II-230 Thermodynamik, II-196, IV-169 Gesetze der, II-271 thomsonscher Streuquerschnitt, II-93 thomsonsches Atommodell, III-78 Thymin, I-38 Torsion, IV-193 Totalreflexion, IV-100 Trägersignal, II-331 Trägheit, I-17, I-101 Moment, I-258, I-266

Gesamtindex Prinzip, I-261 Trägheitstensor, IV-51 Transformation von Amplituden, V-95 der Geschwindigkeit, I-227 der Zeit, I-213 Fourier-, I-340 Galilei-, I-175, I-209 lineare, I-153 Lorentz-, I-209, I-237, III-463, III-479 Transformator, III-284 Transistor, V-294 Translation von Achsen, I-146 trigonales Gitter, IV-11 triklines Gitter, IV-10 Triphenylzyklopropenyl, V-315 „trockenes“ Wasser, IV-225 Tropfenaufbrechung, Theorie der, III-164 Tscherenkow-Strahlung, II-370 Übergang, V-288 Übertragungsleitung, III-443 Ultraviolettstrahlung, I-21, II-1 Umkehrbarkeit, Prinzip der, II-7, II-58 Unbestimmtheitsprinzip, I-22, I-84, I-102, II-176, II-179, II-184, II-192, V-11, V-14, V-20, V-22, V-28 unreine Halbleiter, V-283 Unschärferelation, Stabilität des Atoms, III-2, III-78 Van-de-Graaff-Generator, III-89, III-141 Variationsrechnung, III-337 Vektor, I-151, V-135 axialer, I-279, II-393, II-398 Einheits-, III-20 polarer, I-279, II-393 Polarisations-, III-173 Poynting-, III-505, III-510 Vierer-, I-243, III-463 Vektoralgebra, I-153, V-92, V-136, V-139 Vektoranalysis, II-386, III-18, III-24, III-32, III-35, III-51 Vektorfeld, III-5, III-6, III-18 Fluss eines, III-37 quellenfreies, III-50, III-56

305 wirbelfreies, III-50 Vektorintegrale, III-35 Vektoroperator, III-25 Vektorpotential, III-241, III-257, III-265, V-446 bekannter Ströme, III-244 in der Quantenmechanik, III-268 Vektorprodukt, I-279, III-27, IV-53 Verdampfung, I-8, II-215, II-243 Vergrößerung, II-22 Versetzungen, IV-13 und Kristallwachstum, IV-14 Vertauschungsregel, V-440 Verzerrungstensor, IV-59, IV-205 Viererpotential, III-474 Vierervektoren, I-217, I-243, III-463 virtuelle Arbeit, Prinzip der, I-52 virtuelles Bild, II-18 viskose Strömung, IV-249 Viskosität, IV-245 Viskositätskoeffizient, IV-246 Voltmeter, III-280 Volumenänderung, IV-189 Volumenspannung, IV-189 Wahrscheinlichkeit, I-71 Wahrscheinlichkeitsamplitude, II-178, II-181, V-13, V-33, V-317 Wahrscheinlichkeitsdichte, I-81, V-323 Wahrscheinlichkeitsverteilung, I-81, V-323 Wandenergie, IV-172 Wärme, I-4, I-182 Wärme, spezifische, IV-170 Wärme, Versagen der klassischen Physik, II-223 Wärmediffusion, Gleichung der, III-42 Wärmeenergie, I-46, I-140, I-142 Wärmeleitfähigkeit, III-28, III-205 Wärmeleitung, III-39, III-42 Wärmemaschinen, II-271 Wärmestrom, III-19, III-28, III-204 Wasserstoff, V-415 Hyperfeinaufspaltung im, V-233 Ionisierungsenergie, V-26 Wasserstoffatom, V-395 Wasserstoffmolekül, V-187 Wasserstoffwellenfunktionen, V-411

306 Watt (Einheit), I-182 Weber (Einheit), III-224 Wechselstromgenerator, III-303 Wechselstromschaltungen, III-395 Wechselstromwiderstand, III-395 Welle dreidimensionale, III-365 durchgelassene, IV-93 ebene, III-355 elektromagnetische, III-375 Kugel-, III-370, III-377 reflektierte, IV-93 Scher-, II-374, IV-196 sinusförmige, II-40 Wellen, II-369 Licht-, II-327 Wellen, interferierende, II-169, V-4 Wellenfront, II-109, II-318, II-369 Wellenfunktion, V-322 Bedeutung der, V-452 Wellengleichung, II-315, III-329 Wellenknoten, V-129 Wellenlänge, II-1, II-40 Wellenpaket, V-265 Wellenzahl, II-40 Widerstand, I-317, II-230, II-239, III-400 Widerstandsbeiwert, IV-254 Winkel Einfalls-, II-3 Reflexions-, II-3 Winkelbeschleunigung, I-252 Winkelgeschwindigkeit, I-252 wirbelfreie Strömung, IV-231 wirbelfreies Vektorfeld, III-50, III-56 Wirbellinien, IV-240 Wirbelschicht, IV-257 Wirbelstrom, III-287 Wirbelvektor, IV-231 Wirkungsgrad, ideale Maschine, II-281 Wirkungsquerschnitt, I-69

Gesamtindex wissenschaftliche Methode, I-15 youngscher Modul, IV-186 Yukawa-Potential, III-534, V-185 Zähigkeit, s. Viskosität, IV-245 Zapfenzellen, II-130, II-135, II-139, II-146, II-151 Zeemann-Aufspaltung, V-245 Zeit, I-17, I-57, I-103 -normale, I-63 Einheit der, I-63 Transformation der, I-213 Zeit, retardierte, II-29 zeitabhängige Zustände, V-265 Zeitabhängigkeit der Amplituden, V-117 Zeitverzögerung, II-29 Zentrifugalkraft, I-93, I-175, I-225, I-271, I-285, II-262, II-388, IV-112, IV-259, V-410, V-414 Zentripetalkraft, I-272 Zink, V-419 zirkulare Polarisation, II-98 Zirkulation, III-8, III-46 Zufallsbewegung, I-77, II-238 Zustand angeregter, V-268 bestimmter Energie, V-260 Eigen-, V-230 Grund-, V-118 stationärer, V-117, V-230 zeitabhängiger, V-265 Zustandsvektor, V-137 Zerlegung von, V-137 Zwangsbewegung, I-195 zweidimensionales Feld, III-116 Zweizustandssystem, V-177, V-201 Zwillingsparadoxon, I-226 Zykloide, verkürzte, II-114, II-116 Zyklotron, III-544, III-547

Personenverzeichnis Adams, John C. (1819–92), I-94 Aharonov, Yakir (1932), III-273 Ampère, André-Marie (1775–1836), III-227, III-329, III-368 Anderson, Carl D. (1905–91), II-398 Aristoteles (384–322 v. Chr.), I-57 Avogadro, Amedeo (1776–1856), II-196 Becquerel, Antoine Henri (1852–1908), II-30 Bell, Alexander G. (1847–1922), III-283 Bessel, Friedrich (1784–1846), III-433 Boehm, Felix H. (1924), II-398 Bohm, David (1917–92), III-124, III-273 Bohr, Niels (1885–1962), II-254, III-78, V-333, V-401 Boltzmann, Ludwig (1844–1906), II-228 Bopp, Friedrich (1909–87), III-527 Born, Max (1882–1970), II-166, II-193, III-526, III-530, V-1, V-29, V-33, V-452 Bragg, William Lawrence (1890–1971), IV-16 Brewster, David (1781–1868), II-103 Briggs, Henry (1561–1630), I-304 Brown, Robert (1773–1858), II-227 Carnot, N. L. Sadi (1796–1832), I-47, II-273, II-293, II-300 Cavendish, Henry (1731–1810), I-98 Clapeyron, Benoît Paul Émile (1799–1864), II-274 de Coulomb, Charles-Augustin de (1736– 1806), III-85 Dedekind, Richard (1831–1916), I-300 Dicke, Robert H. (1916–97), I-102 Dirac, Paul (1902–84), II-398, III-17, III-526, III-530, V-33, V-137, V-139, V-242, V-328, V-333

Einstein, Albert (1879–1955), I-21, I-54, I-85, I-102, I-172, I-176, I-207, I-210, I-218, I-223, I-229, I-234, II-227, II-238, II-254, II-269, III-233, III-478, III-496, III-512, III-521, IV-263, IV-270, IV-274, IV-280, IV-283, V-59, V-375 Eötvös, Loránd (1848–1919), I-102 Euklid (3. Jhd. v. Chr.), IV-267 Euklid (um 300 v. Chr.), I-17, I-64, I-163 Faraday, Michael (1791–1867), III-171, III-280, III-292, III-294, III-296, III-329, III-368 Fermat, Pierre de (1601–65), II-4, II-12 Fermi, Enrico (1901–54), I-69 Feynman, Richard P. (1918–88), III-381, III-527, III-530 Fourier, J. B. Joseph (1768–1830), II-357 Frank, Ilya M. (1908–90), II-370 Franklin, Benjamin (1706–90), III-85 Galileo Galilei (1564–1642), I-57, I-89, I-117, I-136, II-388 Gauß, Carl Friedrich (1777–1855), III-42, III-281, IV-147 Geiger, Hans (1882–45), III-78 Gell-Mann, Murray (1929), I-25, V-217, V-222 Gerlach, Walther (1889–1979), IV-123 Goeppert-Mayer, Maria (1906–72), V-316 Hamilton, William Rowan (1805–65), V-147 Heaviside, Oliver (1850–1925), III-381 Heisenberg, Werner K. (1901–76), II-166, II-176, II-179, II-193, III-347, V-1, V-11, V-14, V-29, V-327, V-443

308 Helmholtz, Hermann von (1821–94), II-138, IV-240 Hess, Victor F. (1883–1964), III-153 Huygens, Christiaan (1629–95), I-208, II-2, II-108 Infeld, Leopold (1898–1968), III-526, III-530 Jeans, James H. (1877–1946), II-224, II-235, III-25 Jensen, J. Hans D. (1907–1973), V-316 Josephson, Brian D. (1940), V-464 Kepler, Johannes (1571–1630), I-88 Kopernikus, Nikolaus (1473–1543), I-87 Lamb, Willis E. (1913–2008), III-85 Laplace, Pierre-Simon de (1749–1827), II-324 Lawton, Willard E. (1899–1946), III-85 Le Verrier, Urbain (1811–77), I-94 Leibniz, Gottfried Wilhelm (1646–1716), I-108 Liénard, Alfred-Marie (1869–1958), III-387 Lorentz, Hendrik Antoon (1853–1928), I-210, I-216, III-391, III-478, III-521, III-526, III-532 MacCullough, James (1809–47), III-14 Marsden, Ernest (1889–1970), III-78 Maxwell, James Clerk (1831–79), I-71, I-83, II-27, II-30, II-223, II-237, II-309, III-12, III-16, III-85, III-296, III-317, III-329, III-332, III-368, III-380, III-520, IV-66 von Mayer, Julius Robert (1814–78), I-33 Mendelejew, Dmitri (1834–1907), I-25 Michelson, Albert A. (1852–1931), I-210, I-213 Miller, William C. (1910–81), II-131 Minkowski, Hermann (1864–1909), I-248 Morley, Edward E. (1838–1923), I-210, I-213 Mößbauer, Rudolf (1929–2011), I-323, I-324

Personenverzeichnis Nernst, Walter H. (1864–1941), II-288 Neumann, John von (1903–57), III-215, IV-229 Newton, Isaac (1643–1727), I-90, I-99, I-102, I-108, I-117, I-121, I-132, I-143, I-207, II-165, II-324, III-70, III-344, IV-263, V-1 Nishijima, Kazuhiko (1926–2009), I-25, V-217 Nye, John F. (1923), IV-16 Oersted, Hans C. (1777–1851), III-329, IV-147 Pais, Abraham (1918–2000), V-217, V-222 Pasteur, Louis (1822–95), I-43 Pauli, Wolfgang (1900–58), V-52, V-203 Pines, David (1924), III-124 Planck, Max (1858–1947), II-225, II-235, II-254, V-66 Plimpton, Samuel J. (1883–1948), III-85 Poincaré, Henri (1854–1912), I-210, I-213, I-223 Poincaré, J. Henri (1854–1912), III-522 Poynting, John Henry (1852–1914), III-502, III-520 Priestley, Joseph (1733–1804), III-85 Ptolemäus, Claudius (2. Jhd. n. Chr.), II-3 Pythagoras (6. Jhd. v. Chr.), II-355 Rabi, Isidor I. (1898–1988), IV-125 Ramsey, Norman F. (1915–2011), I-63 Retherford, Robert C. (1912–81), III-85 Rømer, Ole (1644–1710), I-93 Rushton, William A. H. (1901–80), II-141 Rutherford, Ernest (1871–1937), III-78 Schrödinger, Erwin (1887–1961), II-136, II-166, II-193, III-347, V-1, V-29, V-33, V-321, V-332, V-443, V-452 Shannon, Claude E. (1916–2001), II-273 Smoluchowski, Marian (1872–1917), II-238 Snellius, Willebrord (1580–1626), II-3 Stern, Otto (1888–1969), IV-123 Stevinus, Simon (1548/49–1620), I-50

Personenverzeichnis Tamm, Igor Y. (1895–1971), II-370 Thomson, Joseph John (1856–1940), III-78 Tscherenkow, Pavel A. (1908–90), II-370 Tycho Brahe (1546–1601), I-87 da Vinci, Leonardo (1452–1519), II-147 Wapstra, Aaldert Hendrik (1922–2006), II-398 Weber, Wilhelm (1804–91), III-281 Weyl, Hermann (1885–1955), I-145, II-386

309 Wheeler, John A. (1911–2008), III-527, III-530 Wiechert, Emil Johann (1861–1928), III-387 Wilson, Charles T. R. (1869–1959), III-164 Young, Thomas (1773–1829), II-138 Yukawa, Hideki (1907–81), I-25, III-533, V-184 Yustova, Elizaveta N. (1910–2008), II-140 Zenon von Elea (5. Jh. v. Chr.), I-106