222 68 46MB
German Pages [1079] Year 2020
Bahaa E. A. Saleh und Malvin Carl Teich
Optik und Photonik Dritte Auflage
Optik und Photonik
Optik und Photonik Bahaa E. A. Saleh und Malvin C. Teich
Dritte, vollständig überarbeitete und erweiterte Auflage
Autoren
3. Auflage 2020
Prof. Dr. Bahaa E. A. Saleh
Alle Bücher von Wiley-VCH werden sorgfältig erarbeitet. Dennoch übernehmen Autoren, Herausgeber und Verlag in keinem Fall, einschließlich des vorliegenden Werkes, für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie für eventuelle Druckfehler irgendeine Haftung.
University of Central Florida Boston University USA Prof. Dr. Malvin C. Teich
Boston University Columbia University USA
Übersetzer
Dr. Michael Bär, Wiesloch
Titelbild
X-Cube Prism with Multi-colored Light Beams Spectrum, ©2015 Sunyixun/Getty Images
Originalwerke
Bahaa E. A. Saleh, Malvin C. Teich: Fundamentals of Photonics, Third Edition, Volume 1 and Volume 2. © 2019 by John Wiley & Sons, Inc. All Rights Reserved. This translation published under license with the original publisher John Wiley & Sons, Inc.
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA, Boschstr. 12, 69469 Weinheim, Germany Alle Rechte, insbesondere die der Übersetzung in andere Sprachen, vorbehalten. Kein Teil dieses Buches darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form – durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren – reproduziert oder in eine von Maschinen, insbesondere von Datenverarbeitungsmaschinen, verwendbare Sprache übertragen oder übersetzt werden. Die Wiedergabe von Warenbezeichnungen, Handelsnamen oder sonstigen Kennzeichen in diesem Buch berechtigt nicht zu der Annahme, dass diese von jedermann frei benutzt werden dürfen. Vielmehr kann es sich auch dann um eingetragene Warenzeichen oder sonstige gesetzlich geschützte Kennzeichen handeln, wenn sie nicht eigens als solche markiert sind. Print ISBN 978-3-527-34723-0 ePDF ISBN 978-3-527-82591-2 ePub ISBN 978-3-527-82592-9 oBook ISBN 978-3-527-82593-6 Umschlaggestaltung Grafik-Design Schulz, Fußgönheim, Deutschland Satz le-tex publishing services GmbH, Leipzig, Deutschland
Gedruckt auf säurefreiem Papier.
V
Inhaltsverzeichnis Vorwort zur dritten Auflage Vorwort zur zweiten Auflage
Teil I Optik 1
1.1 1.1.1 1.2 1.2.1 1.2.2 1.2.3 1.2.4 1.3 1.3.1 1.3.2 1.3.3 1.4 1.4.1 1.4.2 1.4.3 1.4.4 2
2.1 2.1.1 2.2 2.2.1 2.2.2 2.2.3 2.3 2.3.1 2.4 2.4.1 2.4.2 2.4.3
XIX XXIII
1
3 Postulate der Strahlenoptik 4 Ausbreitung in einem homogenen Medium 5 Einfache optische Komponenten 6 Spiegel 6 Ebene Grenzflächen 8 Sphärische Grenzflächen und Linsen 10 Lichtleiter 13 Gradientenindexoptik 14 Die Strahlengleichung 14 Optische Komponenten mit variablem Brechungsindex 15 Die Eikonalgleichung 18 Matrizenoptik 19 Die Strahltransfermatrix 19 Matrizen einfacher optischer Komponenten 20 Matrizen von hintereinander geschalteten optischen Komponenten 21 Periodische optische Systeme 23 Strahlenoptik
Wellenoptik 29 Die Postulate der Wellenoptik 30 Die Wellengleichung 30 Monochromatische Wellen 31 Komplexe Darstellung und die Helmholtzgleichung 31 Einfache Wellen 32 Paraxiale Wellen 34 Die Beziehung zwischen Wellenoptik und Strahlenoptik 35 Die Eikonalgleichung 36 Einfache optische Komponenten 36 Reflexion und Brechung 36 Durchgang durch optische Komponenten 37 Optische Komponenten mit variablem Brechungsindex 41
VI
Inhaltsverzeichnis
2.5 2.5.1 2.5.2 2.6 2.6.1 2.6.2
Interferenz 42 Interferenz zweier Wellen 42 Vielwelleninterferenz 45 Polychromatisches und gepulstes Licht 49 Zeitliche und spektrale Beschreibung 49 Lichtschwebung 51
3
57 Der Gaußstrahl 57 Die komplexe Amplitude eines Gaußstrahls 57 Eigenschaften von Gaußstrahlen 58 Die Qualität eines Strahlbündels 64 Durchgang durch optische Komponenten 64 Durchgang durch eine dünne Linse 64 Formung eines Strahlbündels 66 Reflexion an einem Kugelspiegel 67 Durchgang durch ein beliebiges optisches System 68 Hermite-Gauß-Strahlen 70 Die komplexe Amplitude 71 Intensitätsverteilung 71 Laguerre-Gauß-Strahlen 72 Laguerre-Gauß-Strahlen 72 Optische Wirbel 73 Ince-Gauß-Strahlen 73 Nichtbeugende Strahlen 74 Besselstrahlen 74 Airystrahlen 75
3.1 3.1.1 3.1.2 3.1.3 3.2 3.2.1 3.2.2 3.2.3 3.2.4 3.3 3.3.1 3.3.2 3.4 3.4.1 3.4.2 3.4.3 3.5 3.5.1 3.5.2 4
4.1 4.1.1 4.1.2 4.1.3 4.1.4 4.2 4.2.1 4.2.2 4.3 4.3.1 4.3.2 4.3.3 4.4 4.4.1 4.4.2 4.4.3 4.4.4 4.5 4.5.1 4.5.2 4.5.3 4.5.4 4.5.5 4.5.6
Optik von Strahlbündeln
79 Lichtausbreitung im Vakuum 80 Räumliche harmonische Funktionen und ebene Wellen 80 Die Übertragungsfunktion des Vakuums 85 Die Impulsantwortfunktion des Vakuums 87 Huygens-Fresnel-Prinzip 88 Die optische Fouriertransformation 88 Fouriertransformation im Fernfeld 88 Fouriertransformation mithilfe einer Linse 89 Lichtbeugung 91 Fraunhoferbeugung 92 Fresnelbeugung 94 Nichtbeugende Wellen 97 Bildentstehung 98 Strahlenoptische Beschreibung eines einlinsigen abbildenden Systems 98 Wellenoptische Beschreibung eines 4f -Systems 99 Wellenoptische Beschreibung eines einlinsigen abbildenden Systems 101 Abbildung im Nahfeld 104 Holographie 105 Die holographische Codierung 106 Holographie außerhalb der optischen Achse 107 Fouriertransformations-Holographie 108 Holographische Ortsfilter 109 Die holographische Apparatur 109 Volumenholographie 110 Fourieroptik
Inhaltsverzeichnis
5
5.1 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5 5.1.6 5.2 5.2.1 5.2.2 5.2.3 5.3 5.3.1 5.3.2 5.3.3 5.3.4 5.3.5 5.4 5.4.1 5.4.2 5.4.3 5.5 5.5.1 5.5.2 5.5.3 5.6 5.6.1 5.6.2 5.6.3 5.6.4 5.7 5.7.1 5.7.2 6
6.1 6.1.1 6.1.2 6.2 6.2.1 6.2.2 6.3 6.3.1 6.3.2 6.3.3 6.3.4 6.3.5 6.4 6.4.1 6.4.2
Elektromagnetische Optik 117 Die elektromagnetische Theorie des Lichts 118 Die maxwellschen Gleichungen im Vakuum 118 Die Wellengleichung 118 Die maxwellschen Gleichungen in Medien 119 Randbedingungen 120 Intensität, Leistung und Energie 120 Impuls 120 Elektromagnetische Wellen in Dielektrika 121 Definitionen 121 Lineare, nichtdispersive, homogene und isotrope Medien 121 Nichtlineare, dispersive, inhomogene oder anisotrope Medien 122 Monochromatische elektromagnetische Wellen 124 Die maxwellschen Gleichungen in einem Medium 125 Intensität und Leistung 125 Lineare, nichtdispersive, homogene und isotrope Medien 125 Inhomogene Medien 125 Dispersive Medien 125 Einfache elektromagnetische Wellen 126 Ebene, Dipol- und gaußsche elektromagnetische Wellen 126 Die Beziehung zwischen elektromagnetischer Optik und skalarer Wellenoptik 129 Vektor-Strahlbündel 130 Absorption und Dispersion 130 Absorption 130 Dispersion 132 Resonante Medien 134 Die Streuung elektromagnetischer Wellen 137 Die bornsche Näherung 138 Rayleighstreuung 138 Miestreuung 141 Dämpfung in einem streuenden Medium 142 Pulsausbreitung in dispersiven Medien 143 Die Gruppengeschwindigkeit 143 Die Dispersion der Gruppengeschwindigkeit 144 Polarisationsoptik 151 Die Polarisation des Lichts 152 Die Polarisation 152 Die Matrixdarstellung der Polarisation 155 Reflexion und Brechung 159 TE-Polarisation 160 TM-Polarisation 161 Die Optik anisotroper Medien 163 Der Brechungsindex 163 Ausbreitung entlang einer Hauptachse 165 Ausbreitung entlang beliebiger Richtungen 166 Die Dispersionsrelation, Strahlen, Wellenfronten und Energietransport 168 Doppelbrechung 170 Optische Aktivität und Magnetooptik 172 Optische Aktivität 172 Magnetooptik: Der Faradayeffekt 174
VII
VIII
Inhaltsverzeichnis
6.5 6.5.1 6.5.2 6.6 6.6.1 6.6.2 6.6.3 6.6.4
Optik von Flüssigkristallen 175 Die Struktur von Flüssigkristallen 175 Optische Eigenschaften von verdrillten nematischen Flüssigkristallen Polarisierende Bauelemente 177 Polarisatoren 177 Retarder 178 Polarisationsrotatoren 179 Nichtreziproke polarisierende Bauelemente 179
7
185 Optik von dielektrischen Schichtmedien 187 Matrixtheorie der Optik von Schichtmedien 187 Das Fabry-Pérot-Etalon 192 Das Bragggitter 194 Eindimensionale photonische Kristalle 200 Blochmoden 201 Matrizenoptik periodischer Medien 203 Fourieroptik periodischer Medien 208 Grenzflächen zwischen periodischen und homogenen Medien 210 Zwei- und dreidimensionale photonische Kristalle 211 Zweidimensionale photonische Kristalle 212 Dreidimensionale photonische Kristalle 213
7.1 7.1.1 7.1.2 7.1.3 7.2 7.2.1 7.2.2 7.2.3 7.2.4 7.3 7.3.1 7.3.2 8
8.1 8.1.1 8.1.2 8.1.3 8.2 8.2.1 8.2.2 8.2.3 8.2.4 8.3 8.3.1 8.3.2 8.4 8.4.1 8.4.2 9
9.1 9.1.1 9.1.2 9.1.3 9.1.4 9.1.5 9.1.6 9.1.7 9.1.8 9.2 9.2.1
176
Optik photonischer Kristalle
Optik von Metallen und Metamaterialien 221 Einfach- und doppelt-negative Medien 223 Wellenausbreitung in einfach- und doppelt-negativen Medien 224 Wellen an Grenzflächen zwischen DP-, EN- und DP-Medien 226 Hyperbolische Medien 232 Optik von Metallen: Plasmonik 234 Die optischen Eigenschaften von Metallen 234 Die Grenzfläche zwischen Metall und Dielektrikum: Oberflächenplasmonpolaritonen 239 Metallische Nanokugeln: Lokalisierte Oberflächenplasmonen 241 Optische Antennen 244 Optik von Metamaterialien 245 Metamaterialien 246 Metaoberflächen 251 Transformationsoptik 253 Transformationsoptik 253 Tarnumhänge 255 Wellenleiteroptik 261 Wellenleiter aus ebenen Spiegeln 262 Wellenleitermoden 262 Ausbreitungskonstanten 263 Feldverteilungen 264 Die Zahl der Moden 265 Die Dispersionsrelation 265 Gruppengeschwindigkeiten 265 TM-Moden 266 Vielmodenfelder 267 Ebene dielektrische Wellenleiter 267 Wellenleitermoden 268
Inhaltsverzeichnis
9.2.2 9.2.3 9.3 9.3.1 9.3.2 9.3.3 9.3.4 9.4 9.4.1 9.4.2 9.4.3 9.5 9.5.1 9.5.2 9.5.3 9.6
Feldverteilungen 270 Dispersionsrelation und Gruppengeschwindigkeiten 271 Zweidimensionale Wellenleiter 273 Der rechteckige Spiegelwellenleiter 273 Der rechteckige dielektrische Wellenleiter 274 Die Geometrie von Kanalwellenleitern 274 Materialien 275 Optische Kopplung in Wellenleitern 276 Einkopplung 276 Gekoppelte Wellenleiter 277 Wellenleiterarrays 281 Photonische Kristalle als Wellenleiter 282 Bragggitter als Wellenleiter 282 Bragg-Gitterwellenleiter als photonischer Kristall mit einer Defektschicht 283 Zweidimensionale Wellenleiter aus photonischen Kristallen 283 Plasmonische Wellenleiter 283
10
Faseroptik
10.1 10.1.1 10.1.2 10.2 10.2.1 10.2.2 10.2.3 10.2.4 10.2.5 10.3 10.3.1 10.3.2 10.4 10.4.1 10.4.2 10.4.3 10.5 10.5.1 10.5.2
289 Geführte Strahlen 290 Stufenindexfasern 290 Gradientenindexfasern 292 Geführte Wellen 293 Helmholtzgleichung 293 Stufenindexfasern 294 Einmodenfasern 298 Quasi-ebene Wellen in Stufen- und Gradientenindexfasern 300 Mehrkernfasern und Faserkoppler 304 Dämpfung und Dispersion 306 Dämpfung 306 Dispersion 307 Hohlkernfasern und Fasern aus photonischen Kristallen 314 Führung durch effektiven Brechungsindex 314 Führung durch photonische Bandlücke 315 Anwendungen 315 Materialien für optische Fasern 316 Fasern für das mittlere Infrarot 316 Hybrid- und Multifunktionsfasern 317
11
Resonatoroptik
11.1 11.1.1 11.1.2 11.2 11.2.1 11.2.2 11.2.3 11.2.4 11.2.5 11.3 11.3.1 11.3.2 11.3.3
321 Resonatoren aus ebenen Spiegeln 323 Resonatormoden 323 Schief einfallende Resonatormoden 329 Kugelspiegelresonatoren 330 Strahleingrenzung 330 Gaußmoden 332 Resonanzfrequenzen 334 Hermite-Gauß-Moden 335 Endliche Blenden und Beugungsverluste 336 Zwei- und dreidimensionale Resonatoren 337 Zweidimensionale rechteckige Resonatoren 337 Kreisförmige Resonatoren und Flüstergaleriemoden 338 Dreidimensionale rechteckige Hohlraumresonatoren 339
IX
X
Inhaltsverzeichnis
11.4 11.4.1 11.4.2 11.4.3 11.4.4 11.4.5
Mikro- und Nanoresonatoren 340 Rechteckige Mikroresonatoren 341 Mikrosäulen-, Mikrodisk- und Mikroringresonatoren 342 Mikrokugeln 343 Mikroresonatoren aus photonischen Kristallen 344 Plasmonische Resonatoren: Metallische Nanodisks und Nanokugeln
12
349 Statistische Eigenschaften von stochastischem Licht 350 Optische Intensität 350 Zeitliche Kohärenz und Spektrum 351 Räumliche Kohärenz 355 Longitudinale Kohärenz 358 Interferenz von partiell kohärentem Licht 359 Interferenz zweier partiell kohärenter Wellen 359 Interferometrie und zeitliche Kohärenz 360 Interferometrie und räumliche Kohärenz 362 Transmission von partiell kohärentem Licht durch optische Systeme 364 Ausbreitung von partiell kohärentem Licht 364 Bildentstehung mit inkohärentem Licht 365 Verstärkung der räumlichen Kohärenz durch Ausbreitung 367 Partielle Polarisation 370 Die Kohärenzmatrix 371 Stokesparameter und Poincarékugeldarstellung 371 Unpolarisiertes Licht 372 Polarisiertes Licht 372
12.1 12.1.1 12.1.2 12.1.3 12.1.4 12.2 12.2.1 12.2.2 12.2.3 12.3 12.3.1 12.3.2 12.3.3 12.4 12.4.1 12.4.2 12.4.3 12.4.4 13
13.1 13.1.1 13.1.2 13.1.3 13.1.4 13.1.5 13.1.6 13.1.7 13.2 13.2.1 13.2.2 13.2.3 13.2.4 13.3 13.3.1 13.3.2 13.3.3 13.3.4 13.3.5 13.3.6
345
Statistische Optik
Photonenoptik 377 Das Photon 378 Licht in einem Resonator 378 Die Energie eines Photons 379 Die Polarisation von Photonen 380 Der Ort eines Photons 382 Der Impuls eines Photons 383 Die Interferenz von Photonen 384 Die Zeit eines Photons 385 Photonenströme 387 Der Photonenstrom 387 Stochastische Eigenschaften des Photonenflusses 389 Photonenzahlstatistik 390 Die zufällige Aufteilung von Photonenströmen 394 Quantenzustände des Lichts 396 Quantentheorie des harmonischen Oszillators 396 Die Analogie zwischen einer optischen Mode und einem harmonischen Oszillator 397 Kohärente Zustände 397 Quadraturgequetschtes Licht 398 Photonenzahlgequetschtes Licht 399 Zweiphotonenlicht 400
Inhaltsverzeichnis
Teil II
Photonik
411
14.1 14.1.1 14.1.2 14.1.3 14.1.4 14.2 14.2.1 14.2.2 14.3 14.3.1 14.3.2 14.3.3 14.3.4 14.3.5 14.3.6 14.4 14.4.1 14.4.2 14.5 14.5.1 14.5.2 14.5.3
413 Energieniveaus 413 Atome 414 Ionen und dotierte Dielektrika 418 Moleküle 422 Festkörper 424 Die Besetzung von Energieniveaus 428 Die Boltzmannverteilung 428 Die Fermi-Dirac-Verteilung 429 Die Wechselwirkung von Photonen mit Atomen 430 Die Wechselwirkung von Einmodenlicht mit einem Atom 430 Spontane Emission 432 Induzierte Emission und Absorption 433 Linienverbreiterung 436 Verstärkte spontane Emission 439 Laserkühlung, Einschluss von Atomen und Atomoptik 440 Thermisches Licht 443 Das thermische Gleichgewicht zwischen Photonen und Atomen 443 Das Spektrum des schwarzen Strahlers 444 Lumineszenz und Lichtstreuung 446 Formen der Lumineszenz 447 Photolumineszenz 448 Lichtstreuung 451
15
Laserverstärker
14
Licht und Materie
15.1 15.1.1 15.1.2 15.2 15.2.1 15.2.2 15.3 15.3.1 15.3.2 15.3.3 15.3.4 15.3.5 15.4 15.4.1 15.4.2 15.5 15.5.1
457 Theorie der Laserverstärkung 459 Gewinn und Bandbreite 459 Phasenverschiebung 460 Pumpen des Verstärkers 461 Geschwindigkeitsgleichungen 462 Pumpschemata 464 Verbreitete Laserverstärker 468 Rubin 469 Neodymdotiertes Glas 470 Erbiumdotierte Quarzglasfasern 472 Raman-Faserverstärker 474 Die Eigenschaften ausgewählter Laserübergänge 475 Die Nichtlinearität von Verstärkern 476 Der Gewinn bei Sättigung in homogen verbreiterten Medien 476 Gewinn bei Sättigung in inhomogen verbreiterten Medien 478 Verstärkerrauschen 480 Photonenstatistik nach Verstärkung 481
16
Laser
16.1 16.1.1 16.1.2 16.2 16.2.1 16.2.2
485 Theorie der Laseroszillation 486 Optische Verstärkung und Rückkopplung 486 Bedingungen für die Laseroszillation 488 Die Eigenschaften der Laserstrahlung 490 Leistung 490 Die spektrale Verteilung 493
XI
XII
Inhaltsverzeichnis
16.2.3 16.2.4 16.3 16.3.1 16.3.2 16.3.3 16.3.4 16.3.5 16.3.6 16.3.7 16.4 16.4.1 16.4.2 16.4.3 16.4.4 16.4.5
Räumliche Verteilung und Polarisation 497 Modenselektion 498 Bauarten von Lasern 500 Festkörperlaser 501 Faserlaser 506 Raman-Faserlaser 510 Chaotische Laser 512 Gas- und Farbstofflaser 513 Röntgen- und Freie-Elektronen-Laser 515 Tabelle ausgewählter Eigenschaften 523 Gepulste Laser 523 Methoden zur Erzeugung von Laserpulsen 525 Die Analyse von Einschwingvorgängen 526 Die Gütemodulation 528 Modenkopplung 531 Optische Frequenzkämme 535
17
Halbleiteroptik
17.1 17.1.1 17.1.2 17.1.3 17.1.4 17.1.5 17.1.6 17.1.7 17.2 17.2.1 17.2.2 17.2.3 17.2.4 17.2.5 17.2.6
Halbleiter 544 Energiebänder und Ladungsträger 544 Halbleitermaterialien 547 Die Konzentrationen von Elektronen und Löchern 554 Erzeugung, Rekombination und Injektion 559 Halbleiterübergänge 561 Heteroübergänge 564 Quantenbeschränkte Strukturen 565 Wechselwirkungen von Photonen mit Ladungsträgern 569 Photonenwechselwirkungen in Volumenhalbleitern 570 Interbandübergänge in Volumenhalbleitern 571 Absorption, Emission und Gewinn in Volumenhalbleitern 574 Photonenwechselwirkungen in quantenbeschränkten Strukturen 578 Quantenpunkt-Einzelphotonenemitter 579 Der Brechungsindex 580
18
LED und Laserdioden
18.1 18.1.1 18.1.2 18.1.3 18.1.4 18.1.5 18.1.6 18.2 18.2.1 18.2.2 18.2.3 18.2.4 18.2.5 18.3 18.3.1 18.3.2 18.3.3
543
585 Lichtemittierende Dioden (LED) 586 Injektionselektrolumineszenz 586 Die Eigenschaften von LED 590 Materialien und Aufbau von Bauelementen 596 Siliciumphotonik 600 Organische LED 601 LED-Beleuchtungen 603 Optische Halbleiterverstärker 607 Gewinn und Bandbreite 608 Der Pumpvorgang 612 Heterostrukturen 613 Quantenschichtstrukturen 614 Superlumineszenzdioden 617 Laserdioden 618 Verstärkung, Rückkopplung und Schwingung 618 Leistung und Wirkungsgrad 621 Spektrale und räumliche Eigenschaften von Laserdioden 624
Inhaltsverzeichnis
18.4 18.4.1 18.4.2 18.4.3 18.4.4 18.5 18.5.1 18.5.2 18.5.3 18.6
Quanteneinschlusslaser 627 Einfach- und Mehrfachquantenschichtlaser 628 Quantendraht- und Mehrfachquantendrahtlaser 631 Quantenpunkt- und Mehrfachquantenpunktlaser 632 Quantenkaskadenlaser 633 Mikroresonatorlaser 636 Oberflächenemitter 637 Mikrodisk- und Mikroringlaser 640 Mikroresonatorlaser aus photonischen Kristallen 641 Nanoresonatorlaser 642
19
651 Photodetektoren 652 Äußerer und innerer Photoeffekt 652 Allgemeine Eigenschaften 655 Photoleiter 660 Intrinsische Materialien 660 Dotierte Materialien 661 Heterostrukturen 662 Photodioden 663 Die pn-Photodiode 663 Die pin-Photodiode 665 Heterostrukturen 666 Lawinenphotodioden 669 Konventionelle Lawinenphotodioden 669 Dioden mit positions- und verlaufsabhängigen Parametern 675 Einzelphotonen- und photonenzahlauflösende Detektoren 676 Arraydetektoren 679 Photodetektoren 679 Ausleseelektronik 680 Rauschen in Photodetektoren 681 Photoelektronenrauschen 682 Gewinnrauschen 685 Schaltungsrauschen 690 Signal/Rausch-Verhältnis und Empfindlichkeit analoger Empfänger 692 Bitfehlerrate und Empfindlichkeit digitaler Empfänger 696
19.1 19.1.1 19.1.2 19.2 19.2.1 19.2.2 19.2.3 19.3 19.3.1 19.3.2 19.3.3 19.4 19.4.1 19.4.2 19.4.3 19.5 19.5.1 19.5.2 19.6 19.6.1 19.6.2 19.6.3 19.6.4 19.6.5 20
20.1 20.1.1 20.1.2 20.1.3 20.2 20.2.1 20.2.2 20.2.3 20.2.4 20.3 20.3.1
Photodetektoren
Akustooptik 705 Die Wechselwirkung von Licht und Schall 706 Braggsche Beugung 706 Die Theorie gekoppelter Wellen 711 Braggsche Beugung von Strahlen 712 Akustooptische Bauelemente 714 Modulatoren 715 Scanner 716 Räumliche Schalter 718 Filter, Frequenzschieber und Isolatoren 720 Akustooptik von anisotropen Medien 721 Akustische Wellen in anisotropen Materialien 721
XIII
XIV
Inhaltsverzeichnis
21
21.1 21.1.1 21.1.2 21.1.3 21.1.4 21.1.5 21.2 21.2.1 21.2.2 21.2.3 21.3 21.3.1 21.3.2 21.4 21.4.1 21.5 22
22.1 22.1.1 22.2 22.2.1 22.2.2 22.2.3 22.2.4 22.2.5 22.3 22.3.1 22.3.2 22.3.3 22.3.4 22.3.5 22.4 22.4.1 22.4.2 22.4.3 22.4.4 22.5 22.5.1 22.5.2 22.5.3 22.6 22.6.1 22.7 22.7.1 22.7.2
Elektrooptik 727 Grundlagen der Elektrooptik 728 Pockels- und Kerreffekt 728 Elektrooptische Modulatoren und Schalter 729 Scanner 732 Richtkoppler 733 Räumliche Lichtmodulatoren 735 Elektrooptik anisotroper Medien 737 Kristalloptik: Eine kurze Wiederholung 737 Pockels- und Kerreffekt 737 Modulatoren 741 Elektrooptik von Flüssigkristallen 742 Phasenschieber und Modulatoren 742 Räumliche Lichtmodulatoren und Displays 746 Photorefraktivität 749 Vereinfachte Theorie der Photorefraktion 750 Elektroabsorption 753 Nichtlineare Optik 759 Nichtlineare optische Medien 760 Die nichtlineare Wellengleichung 762 Nichtlineare Optik zweiter Ordnung 763 Frequenzverdopplung und Gleichrichtung 763 Der elektrooptische Effekt 765 Dreiwellenmischung 766 Phasenbedingung und Abstimmungskurven 769 Quasi-Phasenanpassung 773 Nichtlineare Optik dritter Ordnung 775 Die Erzeugung der dritten Harmonischen und der optische Kerreffekt 775 Selbstphasenmodulation, Selbstfokussierung und räumliche Solitonen 776 Kreuzphasenmodulation 778 Vierwellenmischung 778 Optische Phasenkonjugation 780 Nichtlineare Optik zweiter Ordnung: Die Theorie gekoppelter Wellen 782 Die Gleichungen gekoppelter Wellen 782 Frequenzverdopplung 784 Optische Frequenzkonversion 786 Optische parametrische Verstärkung und Oszillation 787 Nichtlineare Optik dritter Ordnung: Die Theorie gekoppelter Wellen 789 Vierwellenmischung 789 Dreiwellenmischung und Erzeugung der dritten Harmonischen 791 Optische Phasenkonjugation 792 Anisotrope nichtlineare Medien 794 Dreiwellenmischung in anisotropen nichtlinearen Medien zweiter Ordnung 795 Dispersive nichtlineare Medien 796 Beschreibung dispersiver nichtlinearer Medien durch eine Integraltransformation 796 Beschreibung dispersiver nichtlinearer Medien durch eine Differentialgleichung 797
Inhaltsverzeichnis
23.1 23.1.1 23.1.2 23.1.3 23.2 23.2.1 23.2.2 23.2.3 23.2.4 23.3 23.3.1 23.3.2 23.3.3 23.3.4 23.4 23.4.1 23.4.2 23.4.3 23.5 23.5.1 23.5.2 23.5.3 23.5.4 23.6 23.6.1 23.6.2 23.6.3 23.6.4
Ultraschnelle Optik 803 Eigenschaften von Pulsen 804 Zeitliche und spektrale Eigenschaften 804 Gaußpulse und gechirpte Gaußpulse 807 Räumliche Eigenschaften 808 Pulsformung und Kompression 810 Chirpfilter 810 Ausführungen von Chirpfiltern 816 Pulskompression 819 Pulsformung 819 Pulsausbreitung in optischen Fasern 821 Die optische Faser als Chirpfilter 821 Ausbreitung eines Gaußpulses in einer optischen Faser 823 Diffusionsgleichung für langsam variierende Einhüllende 827 Analogie zwischen Dispersion und Beugung 828 Ultraschnelle lineare Optik 831 Strahlenoptik 831 Wellen- und Fourieroptik 832 Optik von Strahlbündeln 834 Ultraschnelle nichtlineare Optik 838 Gepulste parametrische Prozesse 838 Optische Solitonen 842 Superkontinuumslicht 848 Die Erzeugung höherer Harmonischer und Attosekundenoptik 850 Pulsdetektion 854 Die Messung der Intensität 854 Die Messung der spektralen Intensität 858 Die Messung der Phase 859 Messung des Spektrogramms 861
24
Optische Verbindungen und Schalter
23
24.1 24.1.1 24.1.2 24.1.3 24.1.4 24.1.5 24.1.6 24.2 24.2.1 24.2.2 24.3 24.3.1 24.3.2 24.3.3 24.3.4 24.3.5 24.3.6 24.4 24.4.1 24.4.2 24.4.3
869 Optische Verbindungen 871 Die Verbindungsmatrix 871 Nichtreziproke Verbindungen: Isolatoren und Zirkulatoren 872 Brechende und beugende Verbindungen im freien Raum 873 Wellenleiterverbindungen 875 Nichtreziproke optische Verbindungen 876 Optische Verbindungen in Mikroelektronik und Computertechnik 876 Passive optische Router 881 Wellenlängenbasierte Router 881 Polarisations-, phasen- und intensitätsbasierte Router 885 Photonische Schalter 887 Ausführungen von räumlichen Schaltern 887 Realisierungen von photonischen räumlichen Schaltern 889 Volloptische räumliche Schalter 895 Wellenlängenempfindliche Schalter 902 Zeitbereichsschalter 904 Code- oder Paketschalter 906 Photonische Logikgatter 908 Bistabile Systeme 908 Das Prinzip der optischen Bistabilität 910 Bistabile optische Bauelemente 912
XV
XVI
Inhaltsverzeichnis
25
25.1 25.1.1 25.1.2 25.1.3 25.1.4 25.1.5 25.2 25.2.1 25.2.2 25.2.3 25.2.4 25.2.5 25.3 25.3.1 25.3.2 25.3.3 25.3.4 25.4 25.4.1 25.4.2 25.4.3 25.5 25.5.1 25.5.2
Faseroptische Kommunikation 919 Faseroptische Komponenten 920 Optische Fasern 920 Quellen für optische Sender 925 Optische Verstärker 926 Detektoren für optische Empfänger 928 Integriert-photonische Schaltkreise 930 Faseroptische Nachrichtensysteme 931 Entwicklungsgeschichte faseroptischer Nachrichtensysteme 932 Die Leistungsfähigkeit von faseroptischen Systemen 935 Dämpfungs- und dispersionsbegrenzte Systeme 937 Kompensation und Management von Dämpfung und Dispersion 942 Solitonoptische Kommunikation 944 Modulation und Multiplexing 945 Modulation 945 Multiplexing 947 Wellenlängenmultiplexing 948 Raummultiplexing 950 Kohärente optische Kommunikation 952 Der Heterodyndetektor 953 Der symmetrische Homodyndetektor 954 Kohärente Systeme 955 Faseroptische Netze 958 Netztopologien und Vielfachzugriff 958 Wellenlängenmultiplexnetze 961
A.1 A.1.1 A.1.2 A.2 A.2.1 A.2.2 A.2.3 A.3 A.3.1
969 Die eindimensionale Fouriertransformation 969 Eigenschaften der Fouriertransformation 969 Beispiele 970 Zeitliche und spektrale Breite 970 Die quadratisch gemittelte Breite 970 Die leistungsäquivalente Breite 972 1/e-, Halbwerts- und 3-dB-Breite 973 Die zweidimensionale Fouriertransformation 973 Eigenschaften 974
B.1 B.1.1 B.2
Anhang B Lineare Systeme 977 Eindimensionale lineare Systeme 977 Lineare Systeme 977 Zweidimensionale lineare Systeme 979
C.1 C.2 C.2.1 C.3 C.4 C.4.1 C.4.2
981 Die Moden eines diskreten linearen Systems 982 Die Moden eines kontinuierlichen durch einen Integraloperator beschriebenen Systems 982 Translationssymmetrie und harmonische Moden 983 Die Moden eines durch gewöhnliche Differentialgleichungen beschriebenen Systems 983 Die Moden eines durch eine partielle Differentialgleichung beschriebenen Systems 984 Die Moden des Feldes/der Welle in einem homogenen Medium mit Randbedingungen 984 Moden von Feldern/Wellen in einem periodischen Medium 985
Anhang A Die Fouriertransformation
Anhang C Die Moden linearer Systeme
Inhaltsverzeichnis
1 2 3 4 5 6 7 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Lösungen zu den Übungen 987 Strahlenoptik 987 Wellenoptik 992 Optik von Strahlbündeln 994 Fourieroptik 996 Elektromagnetische Optik 998 Polarisationsoptik 998 Optik photonischer Kristalle 999 Wellenleiteroptik 999 Faseroptik 1000 Resonatoroptik 1002 Statistische Optik 1003 Photonenoptik 1004 Licht und Materie 1005 Laserverstärker 1006 Laser 1008 Halbleiteroptik 1010 LED und Laserdioden 1012 Photodetektoren 1014 Akustooptik 1015 Elektrooptik 1016 Nichtlineare Optik 1016 Ultraschnelle Optik 1020 Optische Verbindungen und Schalter 1020 Stichwortverzeichnis
1023
XVII
XIX
Vorwort zur dritten Auflage Seit der Veröffentlichung der zweiten Auflage im Jahr 2007 haben die Fundamentals of Photonics ihren weltweiten Stellenwert als modernes und in sich abgeschlossenes einführendes Lehrbuch mit einer ausgewogenen Mischung aus Theorie und Anwendungen behauptet. Das Buch wurde mehrfach nachgedruckt und ins Deutsche, Chinesische, Tschechische und Japanische übersetzt. Die vorliegende dritte Auflage berücksichtigt zahlreiche wissenschaftliche und technische Entwicklungen der vergangenen zehn Jahre.
Optik und Photonik Bevor sich der Begriff Photonik durchgesetzt hatte – in etwa zeitgleich mit der Veröffentlichung der ersten Auflage der Fundamentals of Photonics im Jahr 1991 – waren zahlreiche, nicht immer klar voneinander abgegrenzte Begriffe wie beispielsweise Quantenelektronik, Optoelektronik, Elektrooptik oder Lichtwellentechnik in Verwendung. Obwohl es keine klare Übereinkunft über die genaue Bedeutung der verschiedenen Begriffe gab, existierte doch ein weitgehender Konsens hinsichtlich ihrer Benutzung. Viele dieser Begriffe sind inzwischen wieder aus dem Sprachgebrauch verschwunden, doch einige leben in den Titeln wissenschaftlicher Zeitschriften, Institute und Lehrveranstaltungen fort. Nach nunmehr über 25 Jahren haben sich die Termini Optik und Photonik sowohl einzeln als auch in der Kombination Optik und Photonik durchgesetzt. Die Unterscheidung bleibt jedoch etwas vage, und es gibt vielfach Überlappungen zwischen beiden. Dennoch haben wir uns entschieden, die ersten 13 Kapitel dieses Buches unter Optik zusammenzufassen und die folgenden 12 Kapitel unter Photonik. Grob gesagt verstehen wir unter Optik die freie und geführte Ausbreitung von Licht und ordnen diesem Gebiet auch Themen wie Interferenz, Beugung, statistische Optik und Photonenoptik zu. Unter Photonik hingegen verstehen wir Themen, die die Wechselwirkung zwischen Licht und Materie berühren,
sowie optische Bauteile und Systeme. Da die Miniaturisierung von Bauteilen und Systemen immer weiter voranschreitet und zur Entwicklung neuer Gebiete wie Nanophotonik und Biophotonik geführt hat, nimmt auch die Bedeutung der Photonik immer weiter zu.
Inhalt Die wesentlichste Neuerung ist das neue Kapitel Optik von Metallen und Metamaterialien, ein Thema, das einen erheblichen Einfluss auf die Photonik hatte. Das neue Kapitel umfasst Theorie und Anwendungen für einfachund doppelt-negative Medien, Metalloptik, Plasmaphysik, Optik von Metamaterialien und Transformationsoptik. Alle Kapitel aus der zweiten Auflage wurden gründlich überprüft und aktualisiert; siehe die folgende kapitelweise Aufführung der Änderungen und Ergänzungen. • Kapitel 1 (Strahlenoptik). Strahlenoptische Beschreibungen optischer Komponenten wie Biprismen, Axicons, LED-Kollimatoren und Fresnellinsen wurden hinzugefügt. Die Verbindung zwischen der Charakterisierung eines beliebigen paraxialen optischen Systems durch seine Strahltransfermatrix und seine Brennpunkte wird erläutert. Weiterhin wurde eine matrixoptische Analyse der Bildgebung mit einem beliebigen paraxialen optischen System aufgenommen. • Kapitel 2 (Wellenoptik). Eine wellenoptische Analyse des Durchgangs von Licht durch Biprismen und Axicons wurde hinzugefügt. Die Fresnelzonenplatte wird aus dem Blickwinkel der Interferenz diskutiert, und eine Analyse des Michelson-Fabry-Pérot (LIGO)Interferometers zum Nachweis von Gravitationswellen im fernen Universum wurde integriert. • Kapitel 3 (Optik von Strahlbündeln). Die Beschreibung der Laguerre-Gauß-Strahlen wurde gegenüber der Vorauflage verbessert. Die grundlegenden Merk-
XX
Vorwort zur dritten Auflage
•
•
•
•
•
•
•
•
male einiger weiterer Strahlbündel werden diskutiert, z. B. von optischen Wirbeln, Ince-Gauß-Strahlen, Besselstrahlen, Bessel-Gauß-Strahlen und Airystrahlen. Kapitel 4 (Fourieroptik). Eine Analyse der Fresnelbeugung an einer periodischen Öffnung (Talboteffekt) wurde aufgenommen. Nichtbeugende Wellen und Besselstrahlen werden aus der Perspektive der Fourieroptik diskutiert. Eine Diskussion der computergenerierten Holographie wurde neu aufgenommen. Kapitel 5 (Elektromagnetische Optik). Ein neuer Abschnitt über Dipolwellen, die Basis der Nahfeldoptik, wurde aufgenommen. Ebenso wurde ein neuer Abschnitt zur Rayleigh- und Miestreuung sowie zur Dämpfung in einem Medium mit Streuzentren hinzugefügt. Kapitel 6 (Polarisationsoptik). Die Darstellung der Dispersionsrelationen in anisotropen Medien wurde überarbeitet. Kapitel 7 (Optik photonischer Kristalle). Die Darstellung des Verhaltens dielektrischer Strahlteiler wurde vereinfacht. Eine Diskussion von Herstellungsverfahren für dreidimensionale photonische Kristalle wurde aufgenommen. Kapitel 8 (Optik von Metallen und Metamaterialien). Dieses neue Kapitel beleuchtet einfach- und doppeltnegative Medien, Metalloptik, Plasmonik, die Optik von Metamaterialien sowie die Transformationsoptik. Zu den behandelten Themen gehören evaneszente Wellen, Oberflächenplasmonpolaritonen, lokalisierte Oberflächenplasmonen, Nanoantennen, Metaoberflächen, Abbildungen im Subwellenlängenbereich und Tarnumhänge. Kapitel 9 (Wellenleiteroptik). Ein neuer Abschnitt über Wellenleiterarrays, der die Kopplung mehrerer Wellenleiter beschreibt und den Begriff der Supermoden erläutert, wurde eingefügt. Weiterhin wurden Abschnitte über plasmonische Wellenleiter, MetallIsolator-Metall- und Metallschicht-Wellenleiter sowie periodische Metall/Dielektrikum-Arrays aufgenommen. Kapitel 10 (Faseroptik). Eine Diskussion von Mehrkernfasern, Faserkopplern und photonischen Laternen wurde ebenso hinzugefügt wie ein kurzer Abriss der Anwendungen von Fasern aus photonischen Kristallen. Weiterhin wurden Abschnitte über Multimaterialfasern (einschließlich konventioneller und hybrider Fasern für das mittlere Infrarot) sowie Spezialund Multifunktionsfasern eingeführt. Kapitel 11 (Resonatoroptik). Ein Abschnitt über plasmonische Resonatoren wurde hinzugefügt.
• Kapitel 12 (Statistische Optik). Die Abschnitte über optische Kohärenztomographie und unpolarisiertes Licht wurden neu organisiert. • Kapitel 13 (Photonenoptik). Eine kurze Beschreibung der Einzelphotonen-Bildgebung wurde hinzugefügt. Die Diskussion von quadratur- und photonenzahlgequetschtem Licht wurde verbessert und Beispiele für die Erzeugung und Anwendung dieser Lichtformen werden beschrieben. Ein Abschnitt über Zweiphotonenlicht, verschränkte Photonen und Zweiphotonenoptik wurde aufgenommen. Beispiele für die Polarisationszustände und die räumliche Optik von Zweiphotonenlicht und Zweistrahloptik wurden hinzugefügt. • Kapitel 14 (Licht und Materie). Der Titel dieses Kapitels wurde von Photonen und Atome zu Licht und Materie geändert. Kurze Beschreibungen des Zeemaneffekts, des Starkeffekts und der Ionisationsenergie wurden hinzugefügt. Die Diskussion des Einflusses von Lanthanoidionen wurde verbessert. Der Abschnitt über Laserkühlung, Laserfallen und Atomoptik wurde um Beschreibungen von Dopplerkühlung, optischer Melasse, optischen Pinzetten, optischen Gittern, Atominterferometrie und Atomverstärkern erweitert. • Kapitel 15 (Laserverstärker). Beschreibungen von Quasi-Dreiniveau- und Intrabandpumpen wurden hinzugefügt. Die Diskussionen spezifischer Laserverstärker wie z. B. denjenigen auf der Basis von Rubin, neodymdotiertem Glas, erbiumdotierten Quarzglasfasern sowie von Raman-Faserverstärkern wurden erweitert und verbessert. • Kapitel 16 (Laser). Eine Diskussion des Tandempumpens sowie Beschreibungen von übergangsmetalldotierten Zinkchalkogeniden, Silicium-Ramanlasern und Masteroszillator-Leistungsverstärkern (MOPA) wurden hinzugefügt. Auch das optische Pumpen von inneren Schalen, der Freie-Elektronen-Röntgenlaser sowie optische Frequenzkämme werden nun behandelt. • Kapitel 17 (Halbleiteroptik). Der Abschnitt über organische Halbleiter wurde erweitert. Eine Diskussion über die Gruppe-IV-Photonik einschließlich Graphen und zweidimensionalen Materialien wie Übergangsmetall-Dichalkogeniden wurde hinzugefügt; ebenso eine kurze Diskussion von Quantenpunkt-Einzelphotonenemittern. • Kapitel 18 (LED und Laserdioden). Der Titel dieses Kapitels wurde von Halbleiter-Photonenquellen zu LED und Laserdioden geändert. Ein neuer Abschnitt über die Grundlagen der LED-Beleuchtung wurde aufgenommen. Auch kurze Diskussionen zu Mikroresonator-LED, siliciumphotonischen Licht-
Vorwort zur dritten Auflage
•
•
•
•
•
quellen, Quantenpunkt-Halbleiterverstärkern, durchstimmbaren Laserdioden, Breitband-Laserdioden sowie Laserdiodenstapeln wurden eingefügt. Eine Diskussion des Linienverbreiterungsfaktors wurde hinzugefügt und ein neuer Abschnitt über Nanoresonatorlaser wurde eingeführt. Kapitel 19 (Photodetektoren). Der Titel dieses Kapitels wurde von Halbleiter-Photodetektoren zu Photodetektoren geändert. Kurze Diskussionen von organischen, plasmonischen, Gruppe-IV- und graphenbasierten Photodetektoren sowie von kanten- und flächenbeleuchteten Detektoren, von Mikrostrukturen zum Photonentrapping, Lawinenphotodioden mit separaten Absorptions-, Ladungs- und Verstärkungsschichten, Übergitter-Lawinenphotodioden, Dunkelstromverstärkung und 1∕𝑓-Rauschen wurden hinzugefügt. Neu hinzugekommen sind auch Beispiele für Tandemsolarzellen, Germanium-auf-SiliciumPhotodioden, Schottky-Photodioden aus Graphen/Si, Lawinenphotodioden mit separater Absorption bzw. mit separater Absorptions-, Verstärkungs- und Multiplikationsschicht sowie Stufen-Lawinenphotodioden. Ein neuer Abschnitt über Einzelphotonendetektoren und photonenzahlauflösenden Detektoren beschreibt den Betrieb von Einzelphotonen-Lawinenphotodioden, Silicium-Photodetektoren und Transition-Edge-Sensoren. Kapitel 20 (Akustooptik). Die identische Struktur der photoelastischen Matrix in der Akustooptik und der Kerreffektmatrix in der Elektrooptik für kubisch-isotrope Medien wird betont. Kapitel 21 (Elektrooptik). Neue Abschnitte über Flüssigkristallanzeigen mit passiver und aktiver Matrix wurden eingeführt und deren Betriebsweise erläutert. Die Leistung von LCD mit aktiver Matrix (AMLCD) wird mit der von organischen LED mit aktiver Matrix (AMOLED) verglichen. Kapitel 22 (Nichtlineare Optik). Neue Inhalte im Zusammenhang mit der nichtlinearen Optik von geführten Wellen wurden eingeführt. Die Quasi-Phasenanpassung in periodisch gepolten integrierten Lichtwellenleitern und die damit verbundene Verbesserung des Wirkungsgrads der Wellenmischung wird nun berücksichtigt. Der Abschnitt über die Ramanverstärkung wurde verbessert. Kapitel 23 (Ultraschnelle Optik). Es wurden neue Beispiele aufgenommen, die die Verstärkung von gechirpten Pulsen in einem Petawattlaser und die Erzeugung von energiereichen Solitonen in einem photonischen Kristall illustrieren. Ein neuer Abschnitt über die Erzeugung höherer Harmonischer und die Attose-
kundenoptik wurde hinzugefügt. Der Abschnitt über die Pulsdetektion wurde neu organisiert. • Kapitel 24 (Optische Verbindungen und Schalter). Die Rolle optischer Verbindungen auf der Inter-Board-, Inter-Chip- und Intrachip-Ebene von Computersystemen wird beschrieben. Der Abschnitt über das optische Schalten beinhaltet nun nichtparametrische und parametrische photonische Schalter, die auf der Grundlage vielfältiger nichtlinear-optischer Effekte arbeiten. Schalter auf der Basis von photonischen Kristallen sowie plasmonische photonische Schalter werden diskutiert. Die Behandlung photonischer Logikgatter enthält nun eine Analyse eingebetteter bistabiler Systeme und Beispiele für die Bistabilität in faserbasierten interferometrischen und Mikroring-Lasersystemen. • Kapitel 25 (Faseroptische Kommunikation). Die Beschreibung faseroptischer Komponenten wurde aktualisiert und neu geschrieben, und die Rolle von photonischen integrierten Schaltungen wird diskutiert. Ein neuer Abschnitt über räumliches Multiplexing in Mehrkern- und Vielmodenfasern wurde hinzugefügt. Der Abschnitt über kohärente Detektion wurde erweitert und konzentriert sich nun auf digitale kohärente Empfänger mit spektral effizienter Kodierung.
Danksagungen Wir sind vielen Kollegen für wertvolle Vorschläge zur Verbesserung der dritten Auflage zu Dank verpflichtet: Rodrigo Amezcua-Correa, Luca Argenti, Joe C. Campbell, Zenghu Chang, Demetrios Christodoulides, Peter J. Delfyett, Dirk Englund, Eric R. Fossum, Majeed M. Hayat, Pieter G. Kik, Akhlesh Lakhtakia, Guifang Li, Steven B. Lowen, M. G. „Jim“ Moharam, Rüdiger Paschotta, Kosmas L. Tsakmakidis, Shin-Tsan Wu, Timothy M. Yarnall und Boris Y. Zeldovich. Wir sind auch vielen unserer ehemaligen Studenten und Postdocs dankbar, die ausgezeichnete Fragen gestellt haben, die uns geholfen haben, unsere Präsentation in der dritten Auflage zu verbessern, darunter John David Giese, Barry D. Jacobson, Samik Mukherjee, Adam Palmer und Jian Yin. Unser besonderer Dank gilt Mark Feuer, Joseph W. Goodman und Mohammed F. Saleh, die uns dankenswerterweise detaillierte Kritikpunkte zu verschiedenen Kapiteln nannten. Amy Hendrickson leistete unschätzbare Hilfe im Zusammenhang mit LATEX und Formatierungsfragen. Wir sind unseren Lektoren bei John Wiley & Sons, Inc., dankbar, die während der gesamten Produktion wert-
XXI
XXII
Vorwort zur dritten Auflage
volle Anregungen und Unterstützung gaben: Brett Kurzmann, Sarah Keegan, Nick Prindle und Melissa Yanuzzi. Schließlich bedanken wir uns für die großzügige Unterstützung durch CREOL, das College of Optics & Photonics an der University of Central Florida, das Boston University Photonics Center und das Boston University College of Engineering. Orlando/Florida Boston/Massachusetts 4. Juli 2018
Bahaa E. A. Saleh, Malvin Carl Teich
XXIII
Vorwort zur zweiten Auflage Seit der Veröffentlichung der ersten Ausgabe im Jahr 1991 wurden die Fundamentals of Photonics ungefähr zwanzigmal nachgedruckt, ins Tschechische und Japanische übersetzt und weltweit als Lehrbuch und Nachschlagewerk verwendet. In dieser Zeit hat sich die Photonik rasant entwickelt und hat zahlreiche Anwendungen in der Nachrichtentechnik oder der Medizin gefunden. Diese zweite Ausgabe stellt einige dieser Entwicklungen vor, wobei wir versucht haben, den Umfang des Buches trotzdem in erträglichen Grenzen zu halten. Seine neue Gliederung unterstützt den Charakter des Buchs als abgeschlossenes und modernes einführendes Lehrbuch; es enthält daher eine folgerichtige Mischung aus Theorie und Anwendungen. Viele Leser der ersten Ausgabe haben die zahlreichen und klaren Abbildungen gelobt; wir haben uns bemüht, diesem Lob auch in der zweiten Ausgabe gerecht zu werden. Alle 22 Kapitel der ersten Auflage wurden gründlich überarbeitet und aktualisiert. Zusätzlich kamen zwei völlig neue Kapitel hinzu: Eines über die Optik photonischer Kristalle und ein zweites über ultraschnelle Optik. Beide befassen sich mit Entwicklungen, die im letzten Jahrzehnt einen bedeutenden und immer noch wachsenden Einfluss auf die Photonik hatten. Das neue Kapitel über die Optik photonischer Kristalle liefert die Grundlage, um die Optik von Schichtmedien wie z. B. Bragggittern mithilfe eines Matrixansatzes zu beschreiben. Die Ausbreitung von Licht in eindimensionalen periodischen Medien wird mit Matrix- und Fouriermethoden auf der Grundlage von Blochmoden analysiert. Das Konzept der photonischen Bandlücke wird eingeführt. Die Lichtausbreitung in zwei- und dreidimensionalen photonischen Kristallen sowie die zugehörigen Dispersionsrelationen und Bandstrukturen werden entwickelt. Abschnitte über Wellenleiter aus photonischen Kristallen, mikrostrukturierten Fasern und Resonatoren aus photonischen Kristallen wurden an geeigneten Orten in anderen Kapiteln eingefügt.
Das neue Kapitel über ultraschnelle Optik enthält Abschnitte über optische Pikosekunden- und Femtosekundenpulse und ihre Charakterisierung, Formung und Kompression, sowie ihre Ausbreitung in optischen Fasern im Rahmen der linearen Optik. Abschnitte über ultraschnelle nichtlineare Optik beschreiben auch gepulste parametrische Wechselwirkungen und optische Solitonen. Weiterhin werden Methoden für die Detektion von ultraschnellen optischen Pulsen mit den verfügbaren relativ langsamen Detektoren erläutert. Das Kapitel über optische Verbindungen und Schalter wurde vollständig umgeschrieben und um Themen wie Wellenlängen- und Zeitrouting, FBG, WGR, SOA, TOAD und Paketschalter ergänzt. Das Kapitel über faseroptische Kommunikation wurde ebenfalls wesentlich aktualisiert und um Informationen zu Wellenlängenmultiplexsystemen ergänzt; es enthält jetzt auch kurze Beschreibungen von Themen wie Dispersionskompensation und -management, optischen Verstärkern und solitonoptischer Kommunikation. Ständige Fortschritte bei der Herstellung von Bauelementen haben zur Entstehung der Nanophotonik geführt, die sich mit optischen Prozessen auf räumlichen Skalen im Subwellenlängenbereich befasst. Zu nanophotonischen Bauelementen und Systemen gehören z. B. quantenbeschränkte Strukturen wie Quantenpunkte oder Nanoteilchen sowie periodische Strukturen, die zur Herstellung von Metamaterialien mit exotischen optischen Eigenschaften wie negativen Brechungsindizes dienen können. Außerdem gehören in diese Abteilung alle Anordnungen, in denen Licht (oder seine Wechselwirkung mit Materie) auf nanometergroße Gebiete in der Nähe von Grenzflächen eingegrenzt wird, wie z. B. in der Optik von Oberflächenplasmonen. Evaneszente Felder, z. B. an Oberflächen, an denen innere Totalreflexion auftritt, zeigen ebenfalls eine solche Eingrenzung. Evaneszente Felder kommen auch in der unmittelbaren Umgebung von Blenden mit Subwellenlängenabmessungen vor, wie z. B. den offenen Spitzen einer optischen Faser. Mit ihrer Hilfe können Auflösun-
XXIV
Vorwort zur zweiten Auflage
gen unterhalb der Beugungsgrenze erreicht werden; sie sind die Grundlage der Optik im Nahfeld. Viele dieser in Entwicklung begriffenen Gebiete werden an geeigneten Stellen in dieser Ausgabe beschrieben. Bei der Aktualisierung der Kapitel wurden viele neue Abschnitte hinzugefügt. Neu eingeführte Themen in den ersten Kapiteln sind z. B. Laguerre-Gauß-Strahlen, Abbildung im Nahfeld, die Sellmeiergleichung, schnelles und langsames Licht, Optik von leitenden Medien und Plasmonik, doppeltnegative Metamaterialien, die Poincarékugel und Stokesparameter, Polarisationsmodendispersion, Flüstergaleriemoden, Mikroresonatoren, optische Kohärenztomographie und der Bahndrehimpuls von Photonen. In den Kapiteln über Laseroptik wurden ebenfalls viele neue Themen aufgenommen, z. B. seltenerddotierte, Raman-Faserverstärker und -Faserlaser, Laser im extremen UV und Röntgenbereich, Freie-Elektronen-Laser sowie chemische und chaotische Laser. Auf dem Gebiet der Optoelektronik wurden Abschnitte über GaN-basierte Strukturen und Bauelemente, Superlumineszenzdioden, organische und Weißlicht-LED, quantenbeschränkte Laser, Quantenkaskadenlaser, Mikrohohlraumlaser, Laser aus photonischen Kristallen, Arraydetektoren und rauscharme Lawinenphotodioden hinzugefügt. Das Kapitel über nichtlineare Optik wurde um Material über Abstimmkurven für parametrische Wechselwirkungen erweitert; außerdem wurden Themen wie Quasi-Phasenanpassung, Zweiwellenmischung und die Kreuzphasenmodulation, THz-Erzeugung und andere nichtlineare optische Phänomene im Zusammenhang mit kurzen optischen Pulsen aufgenommen. Das Kapitel über Elektrooptik enthält jetzt auch eine Diskussion von Elektroabsorptionsmodulatoren. Anhang C über die Moden linearer Systeme wurde erweitert und gibt nun eine Übersicht über das Konzept von Moden, wie es an zahlreichen Orten innerhalb des Buchs verwendet wird. Schließlich wurden zusätzliche Übungen und Aufgaben aufgenommen.
Gliederung Das Buch besteht nun aus 24 Kapiteln. Es ist modular aufgebaut, sodass es von Lesern mit unterschiedlichen Bedürfnissen verwendet werden kann; Lehrenden gibt es Gelegenheit, Themen zu unterschiedlichen Kursen zusammenzustellen. Die wesentlichen Ergebnisse eines Kapitels werden häufig an anderen Stellen nochmals kurz zusammengefasst, um jedes Kapitel in sich abgeschlossen zu machen. So wird zu Beginn von Kapi-
tel 24 (Faseroptische Kommunikation) der aus früheren Kapiteln benötigte Stoff über Fasern, Lichtquellen, Detektoren und Verstärker in wenigen Worten wiederholt. Das gibt dem Leser die notwendigen Werkzeuge an die Hand, bevor das Kapitel mit einer Diskussion des Designs und der Leistungsfähigkeit der Nachrichtensysteme fortfährt, die diese Komponenten verwenden. Mit Blick auf die unterschiedlichen mathematischen Vorkenntnisse des avisierten Leserkreises waren wir bestrebt, schwierige Konzepte in zwei Schritten zu präsentieren: Auf einem einführenden Niveau, das physikalischen Einblick und Motivation bietet, gefolgt von einer fortgeschritteneren und mathematischeren Analyse. Ein Beispiel ist die Behandlung in Kapitel 20 (Elektrooptik), wo das Thema zuerst in skalarer Notation präsentiert wird, bevor dann die genauere Analyse in Tensornotation folgt. Jedes Kapitel enthält Übungen, Beispiele, Aufgaben und eine aktualisierte Liste an weiterführender Literatur. Zahlreiche Beispiele von realen Systemen werden vorgestellt, um zu zeigen, wie die beschriebenen Konzepte in aktuellen Anwendungen umgesetzt werden. Anhänge fassen die Eigenschaften der ein- und zweidimensionalen Fouriertransformation, die Theorie linearer Systeme und die Eigenschaften der Moden von linearen Systemen zusammen.
Danksagungen Wir sind vielen Kollegen zu Dank verpflichtet, die uns wertvolle Anmerkungen zu Vorabversionen der zweiten Ausgabe gegeben und unsere Aufmerksamkeit auf Fehler in der ersten Ausgabe gelenkt haben: Mete Atatüre, Michael Bär, Silvia Carrasco, Thomas Daly, Gianni Di Giuseppe, Adel El-Nadi, John Fourkas, Majeed Hayat, Tony Heinz, Erich Ippen, Martin Jaspan, Gerd Keiser, Jonathan Kane, Paul Kelley, Ted Moustakas, Magued Nasr, Roy Olivier, Roberto Paiella, Alexander Sergienko, Peter W. E. Smith, Stephen P. Smith, Kenneth Suslick und Tommaso Toffoli. Ganz besonders danken wir auch den Kollegen, die uns mit detaillierten Kommentaren zu verschiedenen Kapiteln unterstützt haben: Ayman Abou-raddy, Luca Dal Negro und Paul Prucnal. Großen Dank schulden wir den unzähligen Studenten und Postdoktoranden, die viele scharfsinnige Fragen gestellt und uns damit geholfen haben, unsere Darstellung des Stoffs verbessern. Insbesondere wurden viele Verbesserungen durch Vorschläge von Mark Booth, Jasper Cabalu, Michael Cunha, Darryl Goode, Chris LaFratta, Rui Li, Eric Lynch, Nan Ma, Nishant Mohan, Julie Prai-
Vorwort zur zweiten Auflage
no, Yunjie Tong und Ranjith Zachariah angestoßen. Ein besonderer Dank geht an Mohammed Saleh, der unermüdlich große Teile des Manuskripts las und fundierte Vorschläge für seine Verbesserung machte. Wai Yan (Eliza) Wong unterstützte uns logistisch und war eine große Hilfe beim Anfertigen von Diagrammen und Abbildungen. Viele Personen bei Wiley, allen voran Rachel Witmers und unser Lektor George Telecki, waren außerordentlich hilfsbereit, geduldig und ermutigend. Wir danken Melissa Yanuzzi für ihre Aufmerksamkeit und Gründlichkeit bei der Herstellung des Buchs. Don DeLand von der Integre Technical Publishing Company war uns bei der Erstellung der LATEX-Styles eine unschätzbare Hilfe. Wir danken für die finanzielle Unterstützung durch die National Science Foundation, insbesondere das Center for Subsurface Sensing and Imaging Systems, ein NSFunterstütztes Forschungszentrum, die Defense Advanced Research Projects Agency, das Defense Reconnaissance Office; das US Army Research Office, die David & Lucile Packard Foundation, das Boston University College of Engineering und das Boston University Photonics Center. Boston, Massachusetts 19. Dezember 2006
Bahaa E. A. Saleh Malvin Carl Teich
XXV
1
Teil I Optik
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
3
1 Strahlenoptik Licht kann als elektromagnetische Welle beschrieben werden, die denselben theoretischen Prinzipien folgt wie alle anderen Formen elektromagnetischer Strahlung, beispielsweise Radiowellen oder Röntgenstrahlen. Diese Beschreibung von Licht führt zur sogenannten elektromagnetischen Optik. Elektromagnetische Strahlung besteht aus zwei gekoppelten Vektorwellen für das elektrische und das magnetische Feld. Viele optische Erscheinungen können aber auch im Rahmen einer vereinfachten skalaren Wellentheorie behandelt werden, in der Licht durch eine skalare Wellenfunktion beschrieben wird. Diese genäherte Methode zur Beschreibung von Licht heißt skalare Wellenoptik oder einfach Wellenoptik. Wenn sich Lichtwellen um und durch Objekte bewegen, deren Abmessungen viel größer sind als die Wellenlänge des Lichts, tritt die Wellennatur des Lichts nicht unmittelbar in Erscheinung und sein Verhalten kann durch die Annahme erklärt werden, dass sich einzelne Strahlen nach bestimmten geometrischen Regeln ausbreiten. Dieses Modell wird als Strahlenoptik bezeichnet. Mathematisch betrachtet ist die Strahlenoptik der Grenzfall der Wellenoptik für unendlich kleine Wellenlängen.
Quantenoptik elektromagnetische Optik Wellenoptik Strahlenoptik
Abb. 1.1 Die Quantenoptik beschreibt praktisch alle optischen Erscheinungen. Die elektromagnetische Theorie des Lichts (elektromagnetische Optik) gibt die umfassendste Beschreibung von Licht im Rahmen der klassischen Optik. Die Wellenoptik ist wiederum eine skalare Näherung für die elektromagnetische Optik. Strahlenoptik ist schließlich der Grenzfall der Wellenoptik für sehr kleine Wellenlängen.
Die elektromagnetische Optik umfasst somit die Wellenoptik und diese die Strahlenoptik, wie Abb. 1.1 illustriert. Strahlenoptik und Wellenoptik sind Näherungen; ihre Berechtigung beruht darauf, dass sie in ihrem jeweiligen Gültigkeitsbereich Ergebnisse liefern, die eine gute bis sehr gute Annäherung an die Ergebnisse der exakteren elektromagnetischen Theorie bieten. Die elektromagnetische Optik gibt die umfassendste Beschreibung des Lichts im Rahmen der klassischen Optik; manche optische Erscheinungen sind aber grundsätzlich quantenmechanischer Natur und können nicht klassisch erklärt werden. Zu ihrer Beschreibung ist eine Quantenversion der elektromagnetischen Theorie nötig, die sogenannte Quantenelektrodynamik. Soweit nur auf optische Erscheinungen Bezug genommen wird, wird diese Theorie auch als Quantenoptik bezeichnet. Die verschiedenen optischen Theorien entwickelten sich historisch mehr oder weniger sukzessiv in der Reihenfolge Strahlenoptik → Wellenoptik → elektromagnetische Optik → Quantenoptik. Diese Folge ordnet die Theorien gleichzeitig nach steigender Komplexität und Vollkommenheit; ihre Entwicklung wurde nötig, um immer raffiniertere und genauere optische Experimente theoretisch zu erklären. In der Praxis ist die Theorie der Wahl stets die einfachste, die eine bestimmte Erscheinung erklären kann – allerdings ist es nicht immer einfach, a priori zu entscheiden, welches Modell dafür das richtige ist. Glücklicherweise hilft Erfahrung hier oft weiter. Aus pädagogischen Gründen folgen die ersten Kapitel in diesem Buch der angegebenen historischen Entwicklung. Jede Theorie des Lichts startet mit einem Satz von Postulaten (die ohne Beweis angegeben werden), aus denen eine Vielzahl von Ergebnissen entwickelt werden. Die Postulate einer Theorie tauchen in der Theorie der nächsten Ebene jeweils in Spezialfällen wieder auf. In diesem Kapitel beginnen wir mit der Strahlenoptik.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
4
1 Strahlenoptik
In diesem Kapitel . . . Strahlenoptik ist die einfachste Theorie des Lichts. Dabei wird Licht durch einzelne Strahlen beschrieben, die sich nach bestimmten geometrischen Regeln durch optische Medien bewegen. Aus diesem Grund wird die Strahlenoptik auch als geometrische Optik bezeichnet. Strahlenoptik ist eine Näherung. Obwohl sie die meisten alltäglichen Erscheinungen im Zusammenhang mit Licht gut beschreibt, gibt es auch viele Phänomene, die sie nicht erklären kann (wie die restlichen Kapitel dieses Buches eindrucksvoll belegen). Die Strahlenoptik beschreibt den Ort und die Richtung von Lichtstrahlen. Sie ist gerade bei der Beschreibung der Bildentstehung nützlich, der Sammlung aller von einem gegebenen Punkt eines Gegenstands ausgehenden Lichtstrahlen durch ein optisches Element und ihre Zusammenführung auf den entsprechenden Punkt eines Bilds. Mithilfe der Strahlenoptik können wir Bedingungen angeben, die erfüllt sein müssen, damit Licht in einem bestimmten Medium wie beispielsweise einer Glasfaser geführt wird. In isotropen Medien zeigen die Lichtstrahlen stets in die Ausbreitungsrichtung der optischen Energie. Wir können Strahlenbündel konstruieren, in denen die Dichte der Strahlen proportional zur Energiedichte des Lichts ist. Wenn Licht beispielsweise von einer Punktquelle isotrop ausgestrahlt wird, dann ist die Energie der Lichtstrahlen in einem ausgewählten Kegel proportional zum Raumwinkel dieses Kegels. Lichtstrahlen können auf ihrem Weg durch ein optisches System verfolgt werden, um die optische Energie zu bestimmen, die durch einen gegebenen Querschnitt hindurchtritt. Dieses Kapitel beginnt mit einem Satz von Postulaten, aus denen wir die einfachen Regeln ableiten werden, die die Ausbreitung von Lichtstrahlen durch optische Medien bestimmen. In Abschnitt 1.2 wenden wir diese Regeln auf einfache optische Elemente wie Spiegel oder ebene und sphärische Grenzflächen zwischen verschiedenen optischen Medien an. Die Ausbreitung von Strahlen in inhomogenen optischen Medien (mit variablem Brechungsindex) wird in Abschnitt 1.3 untersucht. Optische Elemente mit variablem Brechungsindex sind die Grundlage einer ganzen Technologie, die einen wichtigen Zweig der modernen Optik bildet. Optische Komponenten sind oft entlang einer optischen Achse angeordnet, die mittig durch sie hindurchläuft. Strahlen, die nahe der optischen Achse und nahezu parallel zu ihr verlaufen, bezeichnet
man als paraxiale Strahlen. Wenn nur solche Strahlen Berücksichtigung finden, spricht man auch von paraxialer Optik. Die Veränderung des Ortes und des Winkels eines paraxialen Strahls auf seinem Weg durch ein optisches System kann mithilfe einer 2 × 2Matrixalgebra sehr effizient beschrieben werden. Abschnitt 1.4 ist diesem algebraischen Werkzeug gewidmet, der sogenannten Matrizenoptik.
1.1 Postulate der Strahlenoptik • Licht breitet sich in Form von Strahlen aus. Die Strahlen werden von Lichtquellen emittiert und können beobachtet werden, wenn sie einen optischen Detektor erreichen. • Ein optisches Medium wird durch eine Größe 𝑛 ≥ 1 charakterisiert, den Brechungsindex. Für den Brechungsindex gilt 𝑛 = 𝑐0 ∕𝑐, wobei 𝑐0 die Lichtgeschwindigkeit im Vakuum ist und 𝑐 die Lichtgeschwindigkeit im betrachteten Medium. Die Zeit, die das Licht benötigt, um eine Strecke d zurückzulegen, ist daher d ∕𝑐 = 𝑛 d ∕𝑐0 . Sie ist proportional zu dem Produkt 𝑛 d , das auch als optische Weglänge bezeichnet wird. • In einem inhomogenen Medium ist der Brechungsindex 𝑛(r) eine Funktion des Ortes r = (𝑥, 𝑦, 𝑧). Die optische Weglänge für einen gegebenen Weg zwischen zwei Punkten 𝐴 und 𝐵 ist daher 𝐵
optische Weglänge = ∫ 𝑛(r) d𝑠 ,
(1.1)
𝐴
wenn d𝑠 das differentielle Längenelement entlang des gewählten Weges ist. Die Zeit, die das Licht von 𝐴 nach 𝐵 benötigt, ist proportional zur optischen Weglänge. • Fermatsches Prinzip. Zwischen zwei Punkten 𝐴 und 𝐵 bewegen sich Lichtstrahlen so, dass die benötigte Zeit (bzw. die optische Weglänge) im Vergleich zu benachbarten Wegen ein Extremum annimmt. Mathematisch heißt das 𝐵
δ ∫ 𝑛(r) d𝑠 = 0 ,
(1.2)
𝐴
wobei das Symbol δ als „Variation von“ zu lesen ist. Das bedeutet, dass die optische Weglänge als Funktion der Streckenführung entweder minimal oder maximal (oder ein Wendepunkt) sein muss. In der Regel entspricht sie einem Minimum, sodass folgende Aussage gilt:
1.1 Postulate der Strahlenoptik
Lichtstrahlen breiten sich entlang des Weges aus, der die kürzeste Zeit in Anspruch nimmt.
Spiegel
Einfallsebene
Spiegel C
Manchmal wird diese Bedingung von mehr als einem Weg erfüllt; in diesen Fällen folgen die Lichtstrahlen allen Wegen gleichzeitig. Ein Beispiel für einen Fall, in dem die optische Weglänge maximal ist, ist in Aufgabe 1-1 gezeigt. In diesem Kapitel nutzen wir die Postulate der Strahlenoptik, um die Regeln zu bestimmen, die für die Ausbreitung von Lichtstrahlen, ihre Reflexion oder Brechung an der Grenzfläche verschiedener Medien und ihre Transmission durch optische Komponenten gelten. Auf dieser Grundlage können wir ohne weitere Annahmen über die Natur des Lichts viele Ergebnisse für zahlreiche optische Systeme ableiten.
1.1.1 Ausbreitung in einem homogenen Medium In einem homogenen Medium ist der Brechungsindex überall gleich, und folglich gilt dasselbe für die Lichtgeschwindigkeit. Der von Fermats Prinzip geforderte Weg der kürzesten Zeit ist folglich gleich der kleinsten optischen Weglänge. Fermats Prinzip reduziert sich in diesem Fall auf das seit dem Altertum bekannte Prinzip von Hero: Lichtstrahlen bewegen sich entlang des kürzesten Weges. Der kürzeste Weg zwischen zwei Punkten ist eine Gerade; also folgt: Lichtstrahlen breiten sich in einem homogenen Medium geradlinig aus (Abb. 1.2).
Abb. 1.2 Geradlinige Ausbreitung von Lichtstrahlen. Schatten sind ideale Projektionen von Hindernissen.
Reflexion an einem Spiegel
Die Einfallsebene wird durch den einfallenden Lichtstrahl und die Flächennormale des Spiegels am Einfallspunkt festgelegt. Der Einfallswinkel 𝜃 und der Ausfallswinkel 𝜃′ sind in Abb. 1.3(a) definiert. Das Reflexionsgesetz lässt sich leicht aus dem Prinzip von Hero herleiten. Dazu betrachten wir einen Strahl, der sich nach Refle-
Bʹ
reflektierter Strahl θʹ θ Spiegelnormale
θ
θʹ
B
A
einfallender Strahl (a)
(b)
Abb. 1.3 (a) Reflexion an der Oberfläche eines gekrümmten Spiegels. (b) Geometrische Konstruktion zum Beweis des Reflexionsgesetzes.
xion an dem ebenen Spiegel in Abb. 1.3(b) von Punkt 𝐴 nach Punkt 𝐶 ausbreitet. Nach dem Prinzip von Hero muss die Strecke 𝐴𝐵 + 𝐵𝐶 für einen unendlich dünnen Spiegel minimal sein. Wenn 𝐶 ′ ein Spiegelbild von 𝐶 ist, gilt 𝐵𝐶 = 𝐵𝐶 ′ , sodass 𝐴𝐵 + 𝐵𝐶 ′ minimal sein muss. Das ist genau dann der Fall, wenn 𝐴𝐵𝐶 ′ eine gerade Linie ist, wenn also 𝐵 mit 𝐵′ zusammenfällt und 𝜃 = 𝜃′ ist. Reflexion und Brechung an Grenzflächen
An der Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 wird ein einfallender Lichtstrahl in zwei Strahlen aufgespalten, einen reflektierten und einen gebrochenen (oder transmittierten) Strahl (Abb. 1.4). Für den reflektierten Strahl gilt das Reflexionsgesetz; der gebrochene Strahl gehorcht entsprechend dem Brechungsgesetz: Der gebrochene Strahl liegt in der Einfallsebene; der Beugungswinkel 𝜃2 hängt mit dem Einfallswinkel 𝜃1 gemäß dem snelliusschen Gesetz zusammen, 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 .
Spiegel werden meist aus sorgfältig polierten metallischen Oberflächen oder dielektrischen Schichten auf einer Unterlage wie z. B. Glas hergestellt. Licht wird an Spiegeln gemäß dem Reflexionsgesetz reflektiert: Der reflektierte Strahl liegt in der Einfallsebene; der Ausfallswinkel ist gleich dem Einfallswinkel.
Cʹ
(1.3)
reflektierter Strahl Normale zur Grenzfläche
θ1
θ2
θ1
gebrochener Strahl
Einfallseben e
einfallender Strahl n1
n2
Abb. 1.4 Reflexion und Brechung an der Grenzfläche zwischen zwei Medien.
5
6
1 Strahlenoptik
n1 n2
Spiegel 𝘥2
C
θ2 θ1
A
B
𝘥
𝘥1
Abb. 1.5 Konstruktion zum Beweis des snelliusschen Gesetzes.
P1
P2
Abb. 1.6 Reflexion an einem ebenen Spiegel.
Die Strahlenoptik macht keine Aussage darüber, welche Anteile eines Strahls reflektiert bzw. gebrochen werden.
Spiegel
Übung 1-1: Das snelliussche Gesetz
Der Beweis des snelliusschen Gesetzes ist eine gute Übung für die Anwendung von Fermats Prinzip. Wir müssen den optischen Lichtweg 𝑛1 𝐴𝐵 + 𝑛2 𝐵𝐶 zwischen den Punkten 𝐴 und 𝐶 in Abb. 1.5 minimieren. Dazu müssen wir 𝑛1 d 1 sec 𝜃1 + 𝑛2 d 2 sec 𝜃2 als Funktion der Winkel 𝜃1 und 𝜃2 unter der Nebenbedingung d 1 tan 𝜃1 + d 2 tan 𝜃2 = d minimieren. Zeigen Sie, dass die Lösung dieser Minimierung unter der angegebenen Randbedingung zum snelliusschen Gesetz führt. Die drei einfachen besprochenen Regeln – geradlinige Ausbreitung, Reflexionsgesetz und Brechungsgesetz – werden wir in Abschnitt 1.2 auf verschiedene Anordnungen von Spiegeln und transparenten optischen Komponenten anwenden, ohne nochmals auf Fermats Prinzip zurückgreifen zu müssen.
P
F
Abb. 1.7 Fokussierung von Lichtstrahlen an einem Parabolspiegel.
schenlampenbirnchen in ein paralleles Strahlenbündel um. Wenn ein Parabolspiegel auf diese Weise eingesetzt wird, bezeichnet man ihn auch als Kollimator. Elliptische Spiegel
Ein elliptischer Spiegel reflektiert alle von einem seiner beiden Brennpunkte (z. B. 𝑃1 ) ausgehenden Strahlen in den anderen Brennpunkt 𝑃2 (Abb. 1.8). Entsprechend dem Prinzip von Hero sind die von den Strahlen zwischen 𝑃1 und 𝑃2 zurückgelegten Wege alle gleich lang.
1.2 Einfache optische Komponenten 1.2.1 Spiegel P2
Ebene Spiegel
P1
Ein ebener Spiegel reflektiert die von einem Punkt 𝑃1 ausgehenden Strahlen so, dass die reflektierten Strahlen von einem Punkt 𝑃2 hinter dem Spiegel auszugehen scheinen, der als Bildpunkt bezeichnet wird (Abb. 1.6).
Abb. 1.8 Reflexion an einem elliptischen Spiegel.
Parabolspiegel
Sphärische Spiegel
Die Oberfläche eines Parabolspiegels ist ein reflektierendes Rotationsparaboloid. Sie hat die nützliche Eigenschaft, dass sie alle parallel zu ihrer Achse einfallenden Strahlen in einem einzigen Punkt bündelt, dem Brennpunkt. Die in Abb. 1.7 definierte Entfernung 𝑃𝐹 = 𝑓 heißt Brennweite. Parabolspiegel werden häufig als Sammelelemente in Teleskopen verwendet. Sie wandeln außerdem die Lichtstrahlen einer in ihrem Brennpunkt positionierten Punktquelle wie beispielsweise einem Ta-
Sphärische Spiegel (Kugelspiegel) sind leichter herzustellen als parabolische oder elliptische. Allerdings besitzen sie weder die fokussierenden Eigenschaften von Parabolspiegeln noch die Abbildungseigenschaften elliptischer Spiegel. Wie Abb. 1.9 zeigt, treffen parallele Strahlen an unterschiedlichen Punkten auf die Spiegelachse; ihre Einhüllende (die gepunktete Kurve) wird kaustische Fläche genannt. Immerhin werden paraxiale Strahlen annähernd auf einen Punkt 𝐹 in einer Ent-
1.2 Einfache optische Komponenten
sphärischer Spiegel
θ θ
θ1
z
C
P1
y
– θ2 θ0
P2
F
F
C
z
z
Abb. 1.9 Reflexion von parallelen Strahlen an einem konkaven Kugelspiegel.
fernung (−𝑅)∕2 vom Zentrum 𝐶 des Spiegels abgebildet. Per Konvention wird der Krümmungsradius 𝑅 für Konkavspiegel negativ und für Konvexspiegel positiv gezählt. Reflexion von paraxialen Strahlen an Kugelspiegeln
Strahlen, die nahe der Spiegelachse und in einem kleinen Winkel zu ihr verlaufen (sodass sin 𝜃 ≈ 𝜃 gesetzt werden kann), heißen paraxiale Strahlen. In der paraxialen Näherung werden nur paraxiale Strahlen berücksichtigt; in diesem Fall fokussieren sphärische Spiegel wie Parabolspiegel und besitzen Abbildungseigenschaften wie elliptische Spiegel. Der aus dieser Näherung entstehende Satz von Regeln wird als paraxiale Optik bezeichnet, manchmal auch als Optik erster Ordnung oder gaußsche Optik. Ein sphärischer Spiegel mit Radius 𝑅 verhält sich in dieser Näherung wie ein Parabolspiegel mit der Brennweite 𝑓 = 𝑅∕2. Das ist nicht weiter überraschend, da eine Parabel in der Nähe der Achse durch einen Kreis angenähert werden kann, dessen Radius gleich dem Krümmungsradius der Parabel ist (Abb. 1.10).
P
F
(–R) 2
(–R)
z2 (–R)/2
0
Abb. 1.11 Reflexion paraxialer Strahlen an einem konkaven Kugelspiegel mit Radius R < 0.
(–R)
C
z1
z
(–R) 2
Abb. 1.10 Für paraxiale Strahlen entspricht ein Kugelspiegel einem Parabolspiegel.
Alle von einem gegebenen Punkt auf der Achse eines sphärischen Spiegels ausgehenden paraxialen Strahlen werden auf einen einzigen Bildpunkt auf der Achse reflektiert. Um das zu verstehen, betrachten wir einen Strahl, der in einem Winkel 𝜃1 zur Achse von einem Punkt 𝑃1 in einer Entfernung 𝑧1 von einem Konkavspiegel mit Radius 𝑅 ausgeht (Abb. 1.11). Er wird in einem Winkel −𝜃2 reflektiert und trifft an einem Punkt 𝑃2 in einer Entfernung 𝑧2 vom Spiegel auf die Achse. Der Winkel 𝜃2 ist negativ, da der Strahl nach unten gerichtet ist. Da sich die Winkel in einem Dreieck zu 180◦ addieren, gilt 𝜃1 = 𝜃0 − 𝜃 und −𝜃2 = 𝜃0 + 𝜃 und daher −𝜃2 + 𝜃1 = 2𝜃0 . Wenn 𝜃0 hinreichend klein ist, können wir die Näherung tan 𝜃0 ≈ 𝜃0 verwenden, sodass 𝜃0 ≈ 𝑦∕(−𝑅) ist und wir −𝜃2 + 𝜃1 ≈
2𝑦 −𝑅
(1.4)
erhalten, wobei 𝑦 die Höhe des Punktes ist, an dem die Reflexion stattfindet. Da der Spiegel konkav ist, ist 𝑅 negativ. Wenn sowohl 𝜃1 als auch 𝜃2 klein sind, ist 𝜃1 ≈ 𝑦∕𝑧1 und −𝜃2 = 𝑦∕𝑧2 , sodass wir aus Gl. (1.4) 𝑦∕𝑧1 + 𝑦∕𝑧2 ≈ 2𝑦∕(−𝑅) erhalten; daraus folgt 1 1 2 + ≈ . 𝑧1 𝑧2 −𝑅
(1.5)
Diese Beziehung gilt für beliebige 𝑦 (d. h. unabhängig von 𝜃1 ), so lange die paraxiale Näherung gilt. Mit anderen Worten, alle Strahlen, die von 𝑃1 ausgehen, treffen sich in 𝑃2 . Die Entfernungen 𝑧1 und 𝑧2 werden in einem Koordinatensystem gemessen, dessen 𝑧-Achse nach links zeigt. Alle Punkte mit negativen Werten von 𝑧 liegen daher rechts des Spiegels. Nach Gl. (1.5) werden Strahlen, die von einem weit entfernt auf der 𝑧-Achse liegenden Punkt ausgehen (𝑧1 = ∞), auf einen Punkt 𝐹 in einer Entfernung 𝑧2 = (−𝑅)∕2 abgebildet. Das bedeutet, dass alle aus dem Unendlichen (parallel zur Spiegelachse) einfallenden Strahlen in der paraxialen Näherung in einem Punkt in einer Entfernung 𝑓 vom Spiegel gebündelt werden, der
7
8
1 Strahlenoptik
zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 . In Abb. 1.13 ist diese Beziehung für zwei Fälle aufgetragen:
Brennweite des Spiegels: 𝑓=
−𝑅 , 2
(1.6)
Meist wird Gl. (1.5) in der Form 1 1 1 + = , 𝑧1 𝑧2 𝑓
(1.7)
geschrieben, die als Abbildungsgleichung bezeichnet wird. Sie gilt nur, wenn sowohl der einfallende als auch der reflektierte Strahl paraxial sind. Übung 1-2: Bildentstehung an einem Kugelspiegel
Zeigen Sie, dass von einem Punkt 𝑃1 = (𝑦1 , 𝑧1 ) ausgehende Strahlen im Rahmen der paraxialen Näherung auf einen Punkt 𝑃2 = (𝑦2 , 𝑧2 ) reflektiert werden, wobei 𝑧1 und 𝑧2 die Gl. (1.7) erfüllen und 𝑦2 = −𝑦1 𝑧2 ∕𝑧1 ist (Abb. 1.12). Das bedeutet, dass Strahlen von allen Punkten der Ebene 𝑧 = 𝑧1 sich in einem einzigen Bildpunkt in der Ebene 𝑧 = 𝑧2 treffen, sodass der Spiegel als abbildendes System mit der Vergrößerung −𝑧2 ∕𝑧1 wirkt. Eine negative Vergrößerung bedeutet, dass das Bild invertiert wird. y P1 = (y1, z1)
1) Äußere Brechung (𝑛1 < 𝑛2 ):Wenn der Lichtstrahl aus dem Medium mit dem kleineren Brechungsindex kommt, ist 𝜃2 < 𝜃1 und der gebrochene Strahl wird von der Grenzfläche weg gebrochen. 2) Innere Brechung (𝑛1 > 𝑛2 ): Wenn der Lichtstrahl aus dem Medium mit dem größeren Brechungsindex kommt, ist 𝜃2 > 𝜃1 und der gebrochene Strahl wird in Richtung der Grenzfläche gebrochen. In beiden Fällen wird der Lichtstrahl so gebrochen, dass die optische Weglänge minimiert, d. h. die Wegstrecke im optisch dünneren Medium zulasten der Wegstrecke im optisch dichteren Medium vergrößert wird. In beiden Fällen ist die Beziehung zwischen 𝜃2 und 𝜃1 für kleine Winkel (also paraxiale Strahlen) näherungsweise linear, 𝑛1 𝜃1 ≈ 𝑛2 𝜃2 oder 𝜃2 ≈ (𝑛1 ∕𝑛2 )𝜃1 . Totalreflexion
Bei der inneren Brechung (𝑛1 > 𝑛2 ) ist der Brechungswinkel größer als der Einfallswinkel (𝜃2 > 𝜃1 ), sodass mit steigendem 𝜃1 irgendwann 𝜃2 = 90◦ wird (siehe Abb. 1.13). Diese Situation tritt für 𝜃1 = 𝜃k (kritischer Winkel oder Grenzwinkel) ein, wobei 𝑛1 sin 𝜃k = 𝑛2 sin(π∕2) = 𝑛2 ist, sodass −1
C
𝜃k = sin
F
z
0 P2 = (y2, z2)
Abb. 1.12 Bildentstehung an einem Kugelspiegel; vier ausgewählte Strahlen sind gezeigt.
1.2.2 Ebene Grenzflächen Das snelliussche Gesetz Gl. (1.3) beschreibt die Beziehung zwischen dem Einfallswinkel 𝜃1 und dem Brechungswinkel 𝜃2 an einer ebenen Grenzfläche zwischen n2
n1
n2
n1
90°
n2/n1 = 2/3 θ2 θ1
θk
0 äußere Brechung
innere Brechung
Abb. 1.13 Die Beziehung zwischen Einfalls- und Brechungswinkel.
1 3/2
θ2
0
(1.8)
Für 𝜃1 > 𝜃k kann das snelliussche Gesetz Gl. (1.3) nicht erfüllt werden und es tritt keine Brechung ein. Der einfallende Strahl wird nun vollständig reflektiert, als ob die Grenzfläche ein idealer Spiegel sei [Abb. 1.14(a)]. Diese sogenannte Totalreflexion ist die Grundlage vieler optischer Elemente und Systeme wie beispielsweise reflektierender Prismen [siehe Abb. 1.14(b)], LED-Kollimatoren oder optischer Fasern (siehe Abschnitt 1.2.4). Mithilfe der elektromagnetischen Optik (Fresnelsche Gleichungen in Kapitel 6) kann gezeigt werden, dass der reflektierte Strahl auch die gesamte Energie enthält; die Totalreflexion ist somit ein äußerst effizienter Prozess. θk
θ2 θ1
𝑛2 . 𝑛1
θ1
90°
1.2 Einfache optische Komponenten
n1 n2 45°
n1
θ θ
45° θk n2 = 1 (a)
(b)
(c)
60° α = 45° θAb
α
α = 30°
40 ° θAb
α = 10°
θ n
20 °
n =1 0° 0°
θ
90 °
Abb. 1.14 (a) Totalreflexion an einer ebenen Grenzfläche. (b) Ein reflektierendes √ Prisma. Für n1 > 2 und n2 = 1 (Luft) ist 𝜃k < 45◦ ; wegen 𝜃1 = 45◦ wird der Strahl dann vollständig reflektiert. (c) Lichtstrahlen werden durch Totalreflexion an den inneren Grenzflächen eines Lichtleiters geführt. Abb. 1.15 Ablenkung eines Lichtstrahls an einem Prisma. Der Ablenkungswinkel 𝜃Ab ist für einen gegebenen Öffnungswinkel 𝛼 des Prismas und n = 1.5 eine Funktion des Einfallswinkels 𝜃 . Wenn 𝛼 und 𝜃 klein sind, gilt 𝜃Ab ≈ (n − 1)𝛼; die Ablenkung ist dann in erster Näherung unabhängig von 𝜃 wie in der Kurve für 𝛼 = 10◦ zu erkennen. Für 𝛼 = 45◦ und 𝜃 = 0◦ tritt Totalreflexion ein, wie in Abb. 1.14(b) gezeigt.
Abb. 1.16 Strahlteiler und -kombinierer.
(a) Teilreflektierender Spiegel
(b) Dünne Glasplatte
Prismen
Ein Prisma mit einem Öffnungswinkel 𝛼 und dem Brechungsindex 𝑛 (Abb. 1.15) lenkt einen in einem Winkel 𝜃 einfallenden Strahl um einen Winkel √ −1 2 𝜃Ab = 𝜃 − 𝛼 + sin [ 𝑛2 − sin 𝜃 sin 𝛼 − sin 𝜃 cos 𝛼] (1.9) ab. Um diese Beziehung herzuleiten, muss das snelliussche Gesetz auf jede der beiden brechenden Oberflächen des Prismas angewendet werden. Wenn 𝛼 sehr klein ist (dünnes Prisma) und 𝜃 ebenfalls (paraxiale Näherung), können wir Gl. (1.9) näherungsweise als 𝜃Ab ≈ (𝑛 − 1)𝛼
(1.10)
schreiben. Strahlteiler
Ein Strahlteiler ist ein optisches Element, das den einfallenden Strahl in einen reflektierten und einen transmittierten Strahl aufspaltet (Abb. 1.16). Die relativen Anteile des transmittierten bzw. reflektierten Lichts werden im Rahmen der elektromagnetischen Optik (Kapitel 6)
(c) Strahlkombinierer
durch die Fresnelschen Gleichungen bestimmt. Oft werden Strahlteiler auch eingesetzt, um zwei Lichtstrahlen zu einem einzigen zu kombinieren [Abb. 1.16(c)]. Sie bestehen häufig aus einer dünnen, teildurchlässigen metallischen oder dielektrischen Schicht auf einem Glassubstrat. Auch eine dünne Glasplatte wie z. B. der Objektträger eines Mikroskops kann als Strahlteiler wirken, obwohl hier der Anteil des reflektierten Lichts in der Regel klein ist. In der Praxis werden oft transparente Kunststoffe anstelle von Glas eingesetzt. Strahlformer
Mithilfe von einfachen optischen Komponenten können Strahlen in bestimmte Richtungen gelenkt oder in eine bestimmte Form gebracht werden. Die in Abb. 1.17 dargestellten Bauteile lenken einfallende Strahlen um definierte Winkel ab. Das in Abb. 1.17(a) dargestellte Biprisma entspricht einer Kombination eines Prismas mit einem identischen, aber umgedrehten Prisma. Das in Abb. 1.17(b) gezeigte Fresnel-Biprisma besteht aus Reihen nebeneinander angeordneter kleiner Prismen. Es entspricht in der Wirkung einem Biprisma, ist jedoch dünner und leichter. Die in Abb. 1.17(c) dargestellte ke-
9
10
1 Strahlenoptik
sind, sodass sin 𝜃 ≈ 𝜃 und tan 𝜃 ≈ 𝜃 gilt, können wir die folgenden Eigenschaften herleiten:
(a)
(b)
• Ein in einem Winkel 𝜃1 zur 𝑧-Achse verlaufender Strahl, der die Grenzfläche an einem Punkt in der Höhe 𝑦 trifft und dort einen Winkel 𝜃0 mit der Oberflächennormalen einschließt [siehe Abb. 1.18(a)], ändert an der Oberfläche seine Richtung, sodass der reflektierte Strahl in einem Winkel 𝜃2 zur 𝑧-Achse bzw. 𝜃3 zur Oberflächennormalen verläuft. Mithilfe von Übung 1-3 erhalten wir
(c)
Abb. 1.17 (a) Biprisma. (b) Fresnel-Biprisma. (c) Plankonvexes Axicon.
𝜃2 ≈
gelförmige Optik ist unter der Bezeichnung Axicon bekannt. Sie wandelt einfallende Strahlen in eine zylindersymmetrische Anordnung von Strahlen um, die kegelförmig auf die zentrale Achse zulaufen. Genau wie das Biprisma hat es einen Querschnitt in Form eines gleichschenkligen Dreiecks.
𝑛 − 𝑛1 𝑛1 𝑛2 + ≈ 2 𝑧1 𝑧2 𝑅
𝑦2 = −
y C
P22
z
n n22
y P1= ((yy11, z1))
(b)
O
C ( y22, ,zz22)) P2==(y
z
(1.13)
Abb. 1.18 Brechung an einer konvexen sphärischen Grenzfläche (R > 0).
‒ 2) ((–θ
n1
𝑛1 𝑧2 𝑦 . 𝑛2 𝑧1 1
Die Ebenen 𝑧 = 𝑧1 und 𝑧 = 𝑧2 heißen konjugierte Ebenen. Zu jedem Punkt in der ersten Ebene existiert ein entsprechender Punkt (Bildpunkt) in der zweiten Ebene; die Vergrößerung beträgt −(𝑛1 ∕𝑛2 )(𝑧2 ∕𝑧1 ). Eine negative Vergrößerung bedeutet wieder, dass das Bild invertiert ist. Per Konvention wird 𝑃1 in einem nach links zeigenden und 𝑃2 in einem nach rechts zeigenden Koordinatensystem gemessen (d. h. wenn 𝑃2 links der Grenzfläche liegt, ist 𝑧2 negativ).
R
P11
(1.12)
und
Wir untersuchen nun die Brechung von Lichtstrahlen an einer sphärischen Grenzfläche mit dem Radius 𝑅 zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 . Per Konvention wird 𝑅 für konvexe Grenzflächen positiv und für konkave Grenzflächen negativ gezählt. Wir verwenden dazu das snelliussche Gesetz für den Zusammenhang zwischen dem Einfalls- und dem Brechungswinkel relativ zur Oberflächennormalen, die durch den Radiusvektor 𝒞 vom Zentrum der Fläche gegeben ist. Die Winkel bezüglich der Normalen müssen von den Winkeln 𝜃1 und 𝜃2 bezüglich der 𝑧-Achse unterschieden werden. Wenn wir nur paraxiale Strahlen betrachten, deren Winkel zur optischen Achse des Systems klein
θ1
(1.11)
• Alle von einem Punkt 𝑃1 = (𝑦1 , 𝑧1 ) in der Ebene 𝑧 = 𝑧1 ausgehenden paraxialen Strahlen treffen sich in einem Punkt 𝑃2 = (𝑦2 , 𝑧2 ) in der Ebene 𝑧 = 𝑧2 (siehe Übung 1-3); es gilt
1.2.3 Sphärische Grenzflächen und Linsen
(a)
𝑛1 𝑛 − 𝑛1 𝑦 𝜃 − 2 . 𝑛2 1 𝑛2 𝑅
z
1.2 Einfache optische Komponenten
reflektierte Strahlen gebrochene Strahlen
reflektierte Strahlen
zfl ch eG ren r ab
oli s
Totalreflexion
Übung 1-3: Bildentstehung
Leiten Sie Gl. (1.11) her. Zeigen Sie, dass paraxiale Strahlen, die von einem Punkt 𝑃1 ausgehen, durch 𝑃2 verlaufen, wenn die Gln. (1.12) und (1.13) erfüllt sind. Übung 1-4: Aberrationsfreie abbildende Oberfläche
Bestimmen Sie die Gleichung einer konvexen asphärischen (nicht sphärischen) Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 mit der Eigenschaft, dass alle von einem Punkt 𝑃1 auf der optischen Achse in einer Entfernung 𝑧1 links der Grenzfläche ausgehenden (nicht unbedingt paraxialen) Strahlen auf einen Punkt 𝑃2 auf der optischen Achse in einer Entfernung 𝑧2 rechts der Grenzfläche abgebildet werden [Abb. 1.18(a)]. Hinweis: Nach dem fermatschen Prinzip müssen die optischen Weglängen zwischen den beiden Punkten für alle Wege identisch sein.
LED
Abb. 1.19 Querschnitt eines LED-Kollimators. LEDKollimatoren sind in vielen Ausführungen erhältlich, die in der Regel eine Kombination von Totalreflexion und Brechung ausnutzen, um an ihrem Ausgang annähernd parallele Lichtstrahlen zu erzeugen. Sie werden häufig aus formgepresstem Acrylat oder Polycarbonat hergestellt, die ähnliche Brechungsindizes wie Glas (n ≈ 1.5) besitzen. Das dargestellte Element hat an seinem unteren Ende einen Durchmesser von ≈ 1 cm.
(–R2)
R1
Beispiel 1-1: Kollimator für LED-Licht
Das von einer LED emittierte Licht (Abschnitt 18.1) wird häufig mithilfe eines optischen Elements kollimiert, dessen Oberfläche die Form eines Rotationsparaboloids hat (Abb. 1.19). Die LED wird dabei im Brennpunkt des Paraboloids platziert, indem ihre halbkugelförmige Kuppel (dunkleres Grau) vom unteren Ende her in eine Aussparung des Kunststoff-Paraboloids eingeführt wird. Strahlen, die durch die Seiten der LED-Kuppel austreten, treffen unter Einfallswinkeln größer als der kritische Winkel auf das Paraboloid und werden daher durch Totalreflexion aus dem Kollimator reflektiert. Strahlen, die durch den zentralen Teil der LED-Kuppel austreten, werden an der sphärischen Oberfläche gebrochen. Optische Systeme, die Reflexion und Brechung kombinieren, werden allgemein als katadioptrische Systeme bezeichnet. Sphärische Linsen
Eine sphärische Linse wird durch zwei sphärische Oberflächen begrenzt. Sie ist folglich durch die Angabe der beiden Radien 𝑅1 und 𝑅2 der Oberflächen, ihrer Dicke 𝛥 und ihres Brechungsindex 𝑛 vollständig be-
äch e
e Grenzfl risch äch hä e sp
pa
Die Ähnlichkeiten zwischen diesen Eigenschaften und denen eines sphärischen Spiegels sind offensichtlich. Allerdings gelten die beschriebenen Abbildungseigenschaften nur näherungsweise – nämlich nur für paraxiale Strahlen. Strahlen, die in einem größeren Winkel zur optischen Achse verlaufen, befolgen diese Regeln nicht; die Abweichungen führen zu Bildfehlern, die unter dem Begriff Aberration zusammengefasst werden.
Δ
Abb. 1.20 Eine bikonvexe sphärische Linse.
schrieben (Abb. 1.20). Eine gläserne Linse in Luft kann als Kombination zweier sphärischer Grenzflächen Luft/ Glas und Glas/Luft betrachtet werden. Ein Strahl, der die erste Grenzfläche in einer Höhe 𝑦 und in einem Winkel 𝜃1 zur 𝑧-Achse trifft [Abb. 1.21(a)], wird dort gemäß Gl. (1.11) in einem Winkel 𝜃 gebrochen. Den gebrochenen Strahl können wir verlängern, bis er auf die zweite Oberfläche trifft. Dort verwenden wir wieder Gl. (1.11), wobei wir für 𝜃1 nun 𝜃 einsetzen, um den Winkel 𝜃2 des Strahls nach der Brechung an der zweiten Oberfläche zu erhalten. Das Ergebnis ist im Allgemeinen kompliziert. Wenn die Linse aber hinreichend dünn ist, können wir annehmen, dass der Strahl die Linse in ungefähr derselben Höhe 𝑦 verlässt, in der er eingetreten war. Mit dieser Annahme erhalten wir:
11
12
1 Strahlenoptik
θ1
(–θ2)
P1= (y1, z1)
y F P1
P2 P2= (y2, z2) 0
z1
z2
(a)
z1
0
Abb. 1.21 (a) Strahlenverlauf in einer dünnen Linse. (b) Bildentstehung in einer dünnen Linse.
z2
f
(b)
• Die Winkel des einfallenden und des gebrochenen Strahls hängen gemäß 𝜃2 = 𝜃1 −
𝑦 𝑓
(1.14)
zusammen, wobei die Brennweite 𝑓 durch 1 1 1 = (𝑛 − 1) ( − ) 𝑅1 𝑅2 𝑓
(1.15)
gegeben ist. • Alle von einem Punkt 𝑃1 = (𝑦1 , 𝑧1 ) ausgehenden Strahlen treffen sich in einem Punkt 𝑃2 = (𝑦2 , 𝑧2 ) [Abb. 1.21(b) und Übung 1-5] mit 1 1 1 + = 𝑧1 𝑧2 𝑓
(1.16)
und 𝑧 𝑦2 = − 2 𝑦1 . 𝑧1
f
Abb. 1.22 Nicht paraxiale Strahlen treffen sich nicht im paraxialen Brennpunkt. Die gepunktete Einhüllende der gebrochenen Strahlen wird als kaustische Linie bezeichnet.
Es muss noch einmal betont werden, dass die hier diskutierten Beziehungen nur für paraxiale Strahlen gelten. Nicht paraxiale Strahlen führen zu Aberrationen wie in Abb. 1.22 gezeigt. Konvexe und konkave Linsen
(1.17)
Diese Ergebnisse sind identisch mit denen für einen sphärischen Spiegel [siehe Gl. (1.7) und Übung 1-2]. Die Gleichungen zeigen, dass jeder Punkt in der Ebene 𝑧 = 𝑧1 auf einen entsprechenden Punkt in der Ebene 𝑧 = 𝑧2 abgebildet wird; die Vergrößerung ist −𝑧2 ∕𝑧1 . Für 𝑧1 = 𝑧2 = 2𝑓 ist die Vergrößerung gleich eins. Die Brennweite 𝑓 einer Linse beschreibt daher ihre Wirkung auf paraxiale Strahlen vollständig. Wie bereits zuvor erwähnt, werden 𝑃1 und 𝑃2 in nach links bzw. rechts zeigenden Koordinatensystemen gemessen, und die Krümmungsradien 𝑅1 und 𝑅2 sind für konvexe Oberflächen positiv und für konkave Oberflächen negativ. Für die in Abb. 1.20 gezeigt bikonvexe Linse ist 𝑅1 positiv und 𝑅2 negativ, sodass die beiden Terme in Gl. (1.15) sich addieren und zu einem positiven 𝑓 führen. Übung 1-5: Die Gleichungen für dünne Linsen
Gehen Sie von Gl. (1.11) aus und verwenden Sie die Definition der Brennweite aus Gl. (1.15), um die Gln. (1.14) und (1.16) zu beweisen.
Linsen sind transparente optische Elemente, die Lichtstrahlen je nach der Form ihrer Oberflächen auf definierte Weise brechen. Die gebräuchlichsten Linsen sind wie die zuvor betrachtete bikonvexe Linse sphärische Linsen. Linsen aus einem einzigen Material (im Sichtbaren meist Glas oder Kunststoff) werden als einfache Linsen bezeichnet; Linsen, die aus mehreren solchen einfachen Linsen bestehen, die dabei üblicherweise entlang einer gemeinsamen Achse angeordnet sind, nennt man zusammengesetzte Linsen. Die Oberfläche einer Linse kann konvex oder konkav sein, je nachdem, ob sie aus der Linse heraus- oder in diese zurückragt, oder sie kann plan sein, also eine flache Oberfläche besitzen. Eine Zylinderlinse ist nur in einer Richtung gekrümmt, besitzt also eine Brennweite 𝑓 für Strahlen in der 𝑦𝑧-Ebene, aber keine fokussierende Wirkung auf Strahlen in der 𝑥𝑧-Ebene. Eine Linse, bei der eine Oberfläche konvex und die andere konkav ist, wird als Meniskuslinse bezeichnet (solche Linsen werden häufig für Brillen verwendet). Eine Linse, bei der eine oder beide Oberflächen eine Form haben, die weder sphärisch noch zylindrisch ist, wird als asphärische Linse bezeichnet.
1.2 Einfache optische Komponenten
(a)
(b)
(c)
(d)
(e)
Abb. 1.23 Linsen: (a) Bikonvex, (b) plankonvex, (c) bikonkav, (d) plankonkav. (e) Eine Fresnellinse, die der in (b) dargestellten plankonvexen Linse entspricht; die Krümmungen sind auf beiden Oberflächen überall gleich.
Abbildung 1.23 zeigt verschiedene Arten von Linsen. Bikonvexe und plankonvexe Linsen bewirken eine Konvergenz der Strahlen und sind daher für die Bilderzeugung nützlich, wie Abb. 1.21 zeigt. Bikonkave und plankonkave Linsen bewirken eine Divergenz der Strahlen; sie werden bei der Projektion und in Elementen zur Brennweitenverlängerung (Telekonverter) verwendet. Eine Fresnellinse wird konstruiert, indem alle nichtbrechenden Teile einer herkömmlichen Linse entfernt werden. Daher ist das in Abb. 1.23(e) gezeigte FresnelÄquivalent der plankonvexen Linse aus Abb. 1.23(b) ein abgeflachter Satz von konzentrischen Flächen mit identischer Krümmung an allen Stellen der Fläche (außer an den Stufen-Diskontinuitäten). Die Fresnelkonstruktion ermöglicht die Konstruktion dünner, leichter und kostengünstiger Kunststofflinsen mit Größen von Metern bis hinunter zu Mikrometern und kurzen Brennweiten. Fresnellinsen können konvergierend, divergierend oder zylindrisch sein.
1.2.4 Lichtleiter Durch Linsen oder Spiegel kann Licht von einem Ort zu einem anderen geführt werden, wie Abb. 1.24 illustriert. Da brechende Elemente (wie Linsen) aber immer auch einen Teil des Lichts reflektieren und Spiegel einen Teil des Lichts absorbieren, ist der kumulierte Verlust
an optischer Leistung signifikant, wenn viele optische Elemente eingesetzt werden. Zwar können diese Effekte minimiert werden (z. B. durch antireflexbeschichtete Linsen), aber ein derartiges System ist umständlich und teuer. Im Vergleich dazu ist die Totalreflexion an einer Grenzfläche zwischen zwei Medien mit unterschiedlichen Brechungsindizes ein idealer Mechanismus, um Licht zu führen. Hierbei werden die Strahlen immer wieder verlustfrei reflektiert, ohne Brechung zu erfahren. Mithilfe hochreiner Glasfasern kann Licht mit vergleichsweise geringen Verlusten über Strecken von vielen Kilometern geleitet werden. Ein Lichtleiter besteht aus zwei konzentrischen Glasoder Kunststoffzylindern (Abb. 1.25). Der innere, auch als Kern bezeichnet, besitzt den Brechungsindex 𝑛1 und der äußere, der Mantel, einen etwas kleineren Brechungsindex 𝑛2 < 𝑛1 ; man bezeichnet eine solche Anordnung als Stufenindexfaser. Lichtstrahlen, die sich im Kern ausbreiten, werden an der Grenzfläche zum Mantel totalreflektiert, wenn ihr Einfallswinkel größer −1 als der Grenzwinkel ist, 𝜃 > 𝜃k = sin (𝑛2 ∕𝑛1 ). Alle ◦ Strahlen mit einem Winkel 𝜃 = 90 − 𝜃 zur optischen Achse sind daher im Kern des Lichtleiters eingesperrt, sofern die Bedingung 𝜃 < 𝜃k erfüllt ist, wobei 𝜃k = 90◦ − 𝜃k = cos−1 (𝑛2 ∕𝑛1 ) ist. Lichtleiter werden in der optischen Nachrichtentechnik eingesetzt (siehe Kapitel 10 und 25). Einige wichtige Eigenschaften werden in Übung 1-6 hergeleitet. Übung 1-6: Numerische Apertur und Akzeptanzwinkel eines Lichtleiters
Ein Lichtleiter wird von einer Lichtquelle (z. B. einer Leuchtdiode, LED) bestrahlt. Die Brechungsindizes von Kern und Mantel des Leiters sind 𝑛1 und 𝑛2 ; der Brechungsindex der Luft ist 1 (Abb. 1.26). Zeigen Sie, dass der halbe Öffnungswinkel 𝜃A des Strahlkegels, den der Lichtleiter aufnehmen (d. h. ohne Brechung Abb. 1.24 Lichtführung: (a) Linsen; (b) Spiegel; (c) Totalreflexion.
(a)
(b)
(c)
13
14
1 Strahlenoptik
Mantel
θ
n1
Kern
Abb. 1.25 Ein Lichtleiter. Er leitet das Licht durch wiederholte Totalreflexion. 𝜃 ist der Winkel des Strahls zur Achse des Lichtleiters, sein Komplement 𝜃 = 90◦ − 𝜃 ist der Einfallswinkel auf die dielektrische Grenzfläche.
n2
θ
(b) Nehmen Sie an, dass bei isotroper Lichterzeugung die optische Leistung der Strahlung in einem gegebenen Kegel proportional zum Öffnungswinkel des Kegels ist. Zeigen Sie dann, dass das Verhältnis der aus dem Parallelepiped entnommenen zur insgesamt erzeugten optischen √Leistung gleich √ 3(1 − 1 − 1∕𝑛2 ) ist, sofern 𝑛 > 2 gilt. Welchen Zahlenwert hat dieses Verhältnis für GaAs?
Mantel n2
Luft θk
θk θk
Kern
n1
θA n2
Abb. 1.26 Akzeptanzwinkel eines Lichtleiters.
am Mantel weiterleiten) kann, die Beziehung NA = sin 𝜃A =
√ 𝑛12 − 𝑛22
(1.18)
erfüllt. Der Winkel 𝜃A wird als Akzeptanzwinkel bezeichnet, und der Parameter NA ≡ sin 𝜃A ist die numerische Apertur des Leiters. Berechnen Sie die numerische Apertur und den Akzeptanzwinkel einer Quarzglasfaser mit 𝑛1 = 1.475 und 𝑛2 = 1.460. Quarzglas besteht aus amorphem Siliciumdioxid (SiO2 ). Es ist wegen seiner ausgezeichneten optischen und mechanischen Eigenschaften weit verbreitet; unter anderem hat es den Vorteil, dass sein Brechungsindex durch Dotierung (z. B. mit GeO2 ) sehr bequem verändert werden kann. Eingrenzung von Licht in Medien mit großem Brechungsindex
Es ist oft schwierig, Licht aus einem Medium mit großem Brechungsindex in ein Medium mit kleinem Brechungsindex wie z. B. Luft auszukoppeln, vor allem, wenn das Medium mit großem Brechungsindex durch parallele Oberflächen begrenzt ist. In solchen Fällen erfahren manche Strahlen andauernde Totalreflexion, ohne jemals ins Freie gebrochen zu werden; das Prinzip wird in Übung 1-7 untersucht. Übung 1-7: In einer Leuchtdiode eingegrenztes Licht
(a) Nehmen Sie an, dass in einem Parallelepiped mit dem Brechungsindex 𝑛 (Abb. 1.27) Licht erzeugt wird und sich isotrop ausbreitet. Das System soll von Luft (Brechungsindex 1) umgeben sein, ähnlich wie es z. B. in Leuchtdioden der Fall ist (siehe Kapitel 18). Welchen Öffnungswinkel hat der Strahlkegel (in dem Parallelepiped), der aus den Seitenflächen austritt? Was passiert mit den restlichen Strahlen? Wie groß ist der Winkel für GaAs (𝑛 = 3.6)?
1
n
Abb. 1.27 Eingrenzung von Licht in einem Parallelepiped mit großem Brechungsindex.
1.3 Gradientenindexoptik In vielen Medien ist der Brechungsindex eine stetige Funktion 𝑛(r) des Ortes. Dies kann z. B. durch kontrolliertes Hinzufügen von Verunreinigungen (Dotierung) während der Herstellung erreicht werden. In einem solchen Medium verlaufen Lichtstrahlen nicht geradlinig, sondern entlang gekrümmter Wege. Wenn 𝑛(r) geeignet gewählt wird, kann eine einfache Platte aus einem solchen Medium dieselbe Wirkung auf einen Lichtstrahl zeigen wie ein konventionelles optisches Element, beispielsweise ein Prisma oder eine Linse.
1.3.1
Die Strahlengleichung
Um die Wege von Lichtstrahlen in einem inhomogenen Medium mit dem Brechungsindex 𝑛(r) zu bestimmen, verwenden wir Fermats Prinzip, 𝐵
δ ∫ 𝑛(r) d𝑠 = 0 , 𝐴
(1.19)
1.3 Gradientenindexoptik
y
x
y
ds
z
B
s
Abb. 1.29 Der Weg eines paraxialen Strahls in einem Medium mit variablem Brechungsindex.
x
Strahlengleichung (1.20) vereinfacht sich dann zu
z
A
Abb. 1.28 Die Bahn des Lichtstrahls wird parametrisch durch drei Funktionen x(s), y (s) und z(s) oder durch zwei Funktionen x(z) und y (z) beschrieben.
wobei d𝑠 eine differentielle Wegstrecke entlang der Trajektorie des Strahls zwischen 𝐴 und 𝐵 ist. Wenn der Lichtweg durch die Funktionen 𝑥(𝑠), 𝑦(𝑠) und 𝑧(𝑠) beschrieben wird, wobei 𝑠 die Position entlang der Trajektorie ist (Abb. 1.28), dann kann man mithilfe der Variationsrechnung zeigen 1), dass 𝑥(𝑠), 𝑦(𝑠) und 𝑧(𝑠) drei partielle Differentialgleichungen erfüllen müssen: d d𝑥 𝜕𝑛 (𝑛 ) = , 𝜕𝑥 d𝑠 d𝑠
d𝑦 d 𝜕𝑛 (𝑛 ) = , 𝜕𝑦 d𝑠 d𝑠
d𝑧 d 𝜕𝑛 (𝑛 ) = . 𝜕𝑧 d𝑠 d𝑠 (1.20)
Wenn wir nun den Vektor r(𝑠) mit den Komponenten 𝑥(𝑠), 𝑦(𝑠) und 𝑧(𝑠) definieren, können wir Gl. (1.20) als Vektorgleichung und somit kompakter formulieren: d dr (𝑛 ) = ∇𝑛 , d𝑠 d𝑠
(1.21)
wobei ∇𝑛, der Gradient von 𝑛, ein Vektor mit den kartesischen Komponenten 𝜕𝑛∕𝜕𝑥, 𝜕𝑛∕𝜕𝑦 und 𝜕𝑛∕𝜕𝑧 ist. Gleichung (1.21) wird als Strahlengleichung bezeichnet. Zur Lösung der Strahlengleichung kann man die Trajektorie durch zwei √ Funktionen 𝑥(𝑧) und 𝑦(𝑧) ausdrücken, d𝑠 = d𝑧 1 + (d𝑥∕ d𝑧)2 + (d𝑦∕ d𝑧)2 schreiben und diesen Ansatz in Gl. (1.21) einsetzen, um zwei partielle Differentialgleichungen für 𝑥(𝑧) und 𝑦(𝑧) zu erhalten. Dieser Weg ist im Allgemeinen rechnerisch aufwendig; bei Verwendung der paraxialen Näherung wird er aber deutlich einfacher. Die paraxiale Strahlengleichung
In der paraxialen Näherung verläuft der Strahl nahezu parallel zur 𝑧-Achse, sodass d𝑠 ≈ d𝑧 gilt (Abb. 1.29). Die
1) Der Beweis sprengt den Rahmen dieses Buches; siehe z. B. R. Weinstock, Calculus of Variations: With Applications to Physics and Engineering, Dover 1974.
d d𝑥 𝜕𝑛 (𝑛 ) ≈ , 𝜕𝑥 d𝑧 d𝑧
d𝑦 d 𝜕𝑛 (𝑛 ) ≈ . 𝜕𝑦 d𝑧 d𝑧
(1.22)
Wenn die Funktion 𝑛 = 𝑛(𝑥, 𝑦, 𝑧) bekannt ist, können diese beiden partiellen Differentialgleichungen gelöst werden, um den Lichtweg 𝑥(𝑧) und 𝑦(𝑧) zu berechnen. Im Grenzfall eines homogenen Mediums, in dem 𝑛 2 nicht von 𝑥, 𝑦 und 𝑧 abhängt, liefert Gl. (1.22) d 𝑥∕ d𝑧2 = 2 2 0 und d 𝑦∕ d𝑧 = 0, woraus folgt, dass 𝑥 und 𝑦 lineare Funktionen von 𝑧 sind, die Strahlen sich also geradlinig ausbreiten. Interessante Fälle werden wir in Kürze untersuchen.
1.3.2 Optische Komponenten mit variablem Brechungsindex Platte mit variablem Brechungsindex
Wir betrachten eine Platte, deren Brechungsindex 𝑛 = 𝑛(𝑦) in 𝑥- und 𝑧-Richtung konstant ist, aber in 𝑦-Richtung stetig variiert (Gradientenindexplatte, Abb. 1.30). Die Trajektorien von paraxialen Strahlen in der 𝑦𝑧Ebene werden dann durch die paraxiale Strahlengleichung beschrieben, d𝑦 d𝑛 d (𝑛 ) = , d𝑧 d𝑧 d𝑦
(1.23)
woraus 2
d𝑦 1 d𝑛(𝑦) = d𝑧2 𝑛(𝑦) d𝑦
(1.24)
folgt. Wenn 𝑛(𝑦) bekannt und die Randbedingungen (𝑦 und d𝑦∕ d𝑧 für 𝑧 = 0) festgelegt sind, kann Gl. (1.24) gelöst und die Funktion 𝑦(𝑧) bestimmt werden, die die Trajektorien der Strahlen beschreibt.
Herleitung: Die paraxiale Strahlengleichung in einer Platte mit variablem Brechungsindex Gleichung (1.24) kann auch direkt aus dem snelliusschen Gesetz hergeleitet werden (Abb. 1.30). 𝜃(𝑦) ≈ d𝑦∕ d𝑧 sei der Winkel des Strahls zur 𝑧-Achse am Ort (𝑦, 𝑧). Nach Durchtritt durch eine Schicht der Dicke Δ𝑦
15
16
1 Strahlenoptik
Abb. 1.30 Brechung in einer Platte mit variablem Brechungsindex.
y
y+Δy y
dn n(y)+ Δy dy n(y)
θ (y+Δy) θ (y)
z
Brechungsindex
ändert sich der Winkel des Strahls zu 𝜃(𝑦 + Δ𝑦). Diese beiden Winkel hängen über das snelliussche Gesetz zusammen, wobei 𝜃 nach der Definition aus Abb. 1.30 das Komplement des Einfallswinkels (Brechungswinkels) ist:
annimmt. Die Lösungen dieser Gleichung sind harmonische Funktionen mit der Periode 2π∕𝛼. Wenn wir 𝑦(0) = 𝑦0 und d𝑦∕ d𝑧 = 𝜃0 bei 𝑧 = 0 im Inneren des Mediums ansetzen, erhalten wir 𝑦(𝑧) = 𝑦0 cos 𝛼𝑧 +
𝑛(𝑦) cos 𝜃(𝑦) = 𝑛(𝑦 + Δ𝑦) cos 𝜃(𝑦 + Δ𝑦) = [𝑛(𝑦) +
d𝑛 d𝜃 Δ𝑦] [cos 𝜃(𝑦) − Δ𝑦 sin 𝜃(𝑦)] . d𝑦 d𝑦 (1.25)
Dabei haben wir die Entwicklung 𝑓(𝑦 + Δ𝑦) = 𝑓(𝑦) + (d𝑓∕ d𝑦)Δ𝑦 auf die Funktionen 𝑓(𝑦) = 𝑛(𝑦) und 𝑓(𝑦) = cos 𝜃(𝑦) angewendet. Im Grenzfall Δ𝑦 → 0 erhalten wir durch Vernachlässigen des Terms in (Δ𝑦)2 die Differentialgleichung d𝜃 d𝑛 =𝑛 tan 𝜃 . d𝑦 d𝑦
(1.26)
Für paraxiale Strahlen ist 𝜃 sehr klein, sodass tan 𝜃 ≈ 𝜃 gilt. Wenn wir 𝜃 = d𝑦∕ d𝑧 in Gl. (1.26) einsetzen, erhalten wir Gl. (1.24).
𝜃0 sin 𝛼𝑧 , 𝛼
(1.29)
woraus sich für die Steigung des Lichtwegs 𝜃(𝑧) =
d𝑦 = −𝑦0 𝛼 sin 𝛼𝑧 + 𝜃0 cos 𝛼𝑧 d𝑧
(1.30)
ergibt. Der Strahl oszilliert mit einer (räumlichen) Periode 2π∕𝛼 um das Zentrum der Platte, wie in Abb. 1.31 gezeigt. Die maximale Auslenkung des Strahls ist 𝑦max = [𝑦02 + (𝜃0 ∕𝛼)2 ]1∕2 und der maximale Winkel des Lichtwegs ist 𝜃max = 𝛼𝑦max . Diese genäherte Analyse gilt, solange 𝜃max ≪ 1 ist. Wenn 2𝑦max kleiner wird als die Dicke der Platte, ist der Strahl in der Platte gefangen; sie wirkt dann als Lichtleiter. Abbildung 1.32 zeigt die Lichtwege einiger Strahlen in einer Selfoc-Platte – alle Strahlen haben dieselbe Periode. Eine solche Platte mit variablem Brechungsindex kann als Linse eingesetzt werden, wie Übung 1-8 zeigt.
Beispiel 1-2: Platte mit parabolischem Indexprofil
Eine wichtige spezielle Verteilung des Brechungsindex ist ( ) 𝑛2 (𝑦) = 𝑛02 1 − 𝛼2 𝑦 2 .
y
α
(1.27)
Diese Funktion ist symmetrisch in 𝑦 und besitzt ein Maximum bei 𝑦 = 0 (Abb. 1.31). Glasplatten mit einem derartigen Indexprofil werden unter dem Handelsnamen Selfoc vertrieben. Meist wird 𝛼 so klein gewählt, dass für alle interessierenden 𝑦 die √ Beziehung 𝛼2 𝑦 2 ≪ 1 erfüllt ist. Dann ist 𝑛(𝑦) = 𝑛0 1 − 𝛼2 𝑦 2 ≈ 1 𝑛0 (1 − 𝛼2 𝑦 2 ); d. h. 𝑛(𝑦) ist eine parabolische Vertei2
lung. Wegen 𝑛(𝑦) − 𝑛0 ≪ 𝑛0 ist auch die relative Änderung des Brechungsindex sehr klein. Wenn wir die Ableitung von Gl. (1.27) bilden, liefert die rechte Seite von Gl. (1.24) (1∕𝑛) d𝑛∕ d𝑦 = −(𝑛0 ∕𝑛)2 𝛼2 𝑦 ≈ −𝛼2 𝑦, sodass Gl. (1.24) die Form
y0 θ0
z
(1.28)
n0
n(y)
Abb. 1.31 Lichtweg in einer Platte mit parabolischem Indexprofil (Selfoc-Platte).
Übung 1-8: Platten mit variablem Brechungsindex als Linsen
Zeigen Sie, dass eine Selfoc-Platte mit der Länge d < π∕2𝛼 und einem Brechungsindex gemäß Gl. (1.27) als Zylinderlinse (sammelnd in der 𝑦𝑧-Ebene) mit der Brennweite
2
d𝑦 ≈ −𝛼2 𝑦 d𝑧2
y
2π
𝑓≈
1 𝑛0 d 𝛼 sin 𝛼
(1.31)
1.3 Gradientenindexoptik
Abb. 1.32 Lichtwege von Strahlen aus einer externen Punktlichtquelle in einer Selfoc-Platte.
π α
z 𝘥
y
Die Lösung von Gl. (1.33) ist dann
f
𝜃𝑥0 sin 𝛼𝑧 𝛼 (1.34) 𝜃𝑦0 sin 𝛼𝑧 + 𝑦0 cos 𝛼𝑧 . 𝑦(𝑧) = 𝛼 Wenn 𝜃𝑥0 = 0 ist, d. h. der einfallende Strahl in einer meridionalen Ebene liegt (einer Ebene, die die Zylinderachse enthält, in diesem Fall die 𝑦𝑧-Ebene), dann bleibt der Strahl in dieser Ebene und folgt dort einem sinusförmigen Weg ähnlich dem in einer Gradientenindexplatte [Abb. 1.34(a)]. Wenn anderseits 𝜃𝑦0 = 0 und 𝜃𝑥0 = 𝛼𝑦0 ist, dann folgt 𝑥(𝑧) =
y0 H
A
F
z
𝘥
Abb. 1.33 Eine Selfoc-Platte als Linse; F ist der Brennpunkt, H der Hauptpunkt.
wirkt. Zeigen Sie, dass der Hauptpunkt (wie in Abb. 1.33 definiert) in einer Entfernung 𝐴𝐻 ≈ (1∕𝑛0 𝛼) ⋅ tan(𝛼d ∕2) vom Rand der Platte liegt. Skizzieren Sie die Lichtwege von Strahlen für die Spezialfälle d = π∕𝛼 und π∕2𝛼. Fasern mit variablem Brechungsindex
Eine Faser mit variablem Brechungsindex (Gradientenindexfaser) ist ein Glaszylinder mit einem Brechungsindex 𝑛, der mit dem radialen Abstand von der Achse variiert. In der paraxialen Näherung sind die Lichtwege durch die paraxiale Strahlengleichung gegeben, Gl. (1.22). Wir betrachten nun das Indexprofil [ ( )] 𝑛2 = 𝑛02 1 − 𝛼2 𝑥2 + 𝑦 2 .
(1.32)
𝑥(𝑧) = 𝑦0 sin 𝛼𝑧
(1.35)
𝑦(𝑧) = 𝑦0 cos 𝛼𝑧 ,
und der Strahl folgt einem helikalen (schraubenförmigen) Weg auf der Oberfläche eines Zylinders mit dem Radius 𝑦0 [Abb. 1.34(b)]. In beiden Fällen ist der Strahl in der Faser gefangen, die somit als Lichtleiter wirkt. Für andere einfallende Strahlen entstehen unterschiedliche helikale Lichtwege. 2π
α
y0
θ0
z
(a) y0
Wenn wir Gl. (1.32) in Gl. (1.22) einsetzen und annehmen, dass für alle interessierenden 𝑥 und 𝑦 die Beziehung 𝛼2 (𝑥2 + 𝑦 2 ) ≪ 1 erfüllt ist, so erhalten wir
z
(b) 2
d 𝑥 ≈ −𝛼2 𝑥 , d𝑧2 2
d𝑦 ≈ −𝛼2 𝑦 . d𝑧2
(1.33)
Sowohl 𝑥 als auch 𝑦 sind folglich harmonische Funktionen von 𝑧 mit der Periode 2π∕𝛼. Die Anfangswerte (𝑥0 , 𝑦0 ), 𝜃𝑥0 = d𝑥∕ d𝑧 und 𝜃𝑦0 = d𝑦∕ d𝑧 für 𝑧 = 0 bestimmen die Amplituden und Phasen dieser harmonischen Funktionen. Wegen der Zylindersymmetrie können wir ohne Einschränkung der Allgemeinheit 𝑥0 = 0 setzen.
Abb. 1.34 (a) Meridionale und (b) helikale Strahlen in einer Faser mit parabolischem Indexprofil.
Gradientenindexfasern und ihre Anwendungen in der optischen Kommunikationstechnik werden in den Kapiteln 10 und 25 ausführlicher diskutiert. Übung 1-9: Numerische Apertur eines Lichtleiters mit variablem Brechungsindex
Wir betrachten eine Gradientenindexfaser mit einem Radius 𝑎 und einem Indexprofil gemäß Gl. (1.32). Ein
17
18
1 Strahlenoptik
y
tialgleichung erfüllen, die Eikonalgleichung 2
θA θA
a
θ0 θ0
(
2
2
𝜕S 𝜕S 𝜕S ) + ( ) + ( ) = 𝑛2 , 𝜕𝑥 𝜕𝑦 𝜕𝑧
(1.37)
die meist in Vektorschreibweise angegeben wird,
z
|∇S |2 = 𝑛2 ,
(1.38)
2
Abb. 1.35 Akzeptanzwinkel eines Lichtleiters mit variablem Brechungsindex.
Strahl fällt aus der umgebenden Luft zentral in die Faser ein, sodass er im Fasermedium einen Winkel 𝜃0 zur Faserachse einschließt (siehe Abb. 1.35). Zeigen Sie, dass die numerische Apertur der Faser in der paraxialen Näherung durch NA ≡ sin 𝜃A ≈ 𝑛0 𝑎𝛼
wobei |∇S | = ∇S ⋅ ∇S ist. Der Beweis der Eikonalgleichung aus Fermats Prinzip sprengt den Rahmen dieses Buches 2). Umgekehrt kann auch Fermats Prinzip (sowie die Strahlengleichung) aus der Eikonalgleichung hergeleitet werden. Die Eikonalgleichung kann daher ebenso wie Fermats Prinzip als das Hauptpostulat der Strahlenoptik angesehen werden. Die Integration der Eikonalgleichung (1.38) entlang eines Lichtwegs zwischen den Punkten 𝐴 und 𝐵 ergibt
(1.36)
gegeben ist, wobei 𝜃A der maximale Akzeptanzwinkel ist, für den der Strahl in der Faser eingeschlossen bleibt. Vergleichen Sie dieses Ergebnis mit dem für eine Stufenindexfaser wie der in Übung 1-6 untersuchten. Verwenden Sie für die Brechungsindizes von Kern und 𝑛1 = 𝑛0 bzw. 𝑛2 = √ Mantel der Stufenindexfaser 1 2 2 2 2 𝑛0 1 − 𝛼 𝑎 ≈ 𝑛0 (1 − 𝛼 𝑎 ), um den Vergleich fair 2
zu gestalten.
1.3.3 Die Eikonalgleichung
S (r𝐵 ) − S (r𝐴 ) = ∫ |∇S | d𝑠 𝐵
𝐴
= ∫ 𝑛 d𝑠 = opt. Weglänge zw. 𝐴 und 𝐵 .
(1.39)
𝐴
Mit anderen Worten, die Differenz S (r𝐵 ) − S (r𝐴 ) ist die optische Weglänge zwischen 𝐴 und 𝐵. In der Analogie zur Elektrostatik übernimmt die optische Weglänge die Rolle der Potentialdifferenz. Um die Lichtwege in einem inhomogenen Medium mit dem Brechungsindex 𝑛(r) zu bestimmen, können wir entweder die Strahlengleichung (1.21) – was wir bereits durchgeführt haben – oder die Eikonalgleichung lösen und dann aus S (r) den Gradienten ∇S berechnen. Wenn das Medium homogen, d. h. 𝑛(r) konstant ist, ist auch der Betrag von ∇S konstant, sodass die Normalen zur Wellenfront (die Strahlen) gerade Linien sein müssen. Die Flächen S (r) = const. können entweder parallele Ebenen oder konzentrische Kugeloberflächen sein (Abb. 1.37). S(r) = konstant
Strahlen
Strahlen
Die Wege der Strahlen werden oft durch Oberflächen beschrieben, zu denen sie normal verlaufen. S (r) sei eine skalare Funktion, deren Flächen gleicher Funktionswerte (S (r) = const.) überall normal auf den Lichtstrahlen stehen (Abb. 1.36). Wenn S (r) bekannt ist, können daraus die Lichtwege konstruiert werden, da die Normale der Fläche gleicher Funktionswerte am Ort r gerade in die Richtung des Gradienten ∇S (r) zeigt. Die Funktion S (r) wird als Eikonal bezeichnet; sie entspricht der Potentialfunktion 𝑉(r) in der Elektrostatik, wobei die Lichtstrahlen die Rolle der elektrischen Feldlinien übernehmen, E = −∇𝑉. Um Fermats Prinzip (das Hauptpostulat der Strahlenoptik) zu erfüllen, muss das Eikonal S (r) eine Differen-
𝐵
Abb. 1.36 Die Lichtwege stehen normal auf den Flächen mit konstantem S (r). Strahlen
S(r) = konstant
Abb. 1.37 Strahlen und Flächen für konstantes S (r) in einem homogenen Medium. 2) Siehe z. B. M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002.
1.4 Matrizenoptik
In Abschnitt 2.3 werden wir die Eikonalgleichung nochmals untersuchen; dann im Hinblick auf die Beziehung zwischen der Strahlenoptik und der Wellenoptik.
Strahl θ y
1.4 Matrizenoptik Die Matrizenoptik ist eine Methode zur Verfolgung paraxialer Strahlen. Dabei wird angenommen, dass die Strahlen sich nur in einer Ebene bewegen; die Methode ist daher auf planare Systeme oder meridionale Strahlen in zylindersymmetrischen Systemen anwendbar. Ein Strahl wird durch seine Position und seinen Winkel zur optischen Achse charakterisiert; diese Parameter ändern sich während seiner Reise durch das System. In der paraxialen Näherung sind die Einfalls- und Ausfallsebene eines optischen Systems durch zwei lineare algebraische Gleichungen verknüpft. Das optische System wird daher durch eine 2 × 2-Matrix beschrieben, die sogenannte Strahltransfermatrix (oder kürzer Transfermatrix). Der Vorteil bei der Verwendung von Matrizen liegt darin, dass die Strahltransfermatrix von mehreren hintereinander geschalteten optischen Elementen (oder Systemen) das Produkt der Strahltransfermatrizen der einzelnen Elemente (Systeme) ist. Daher bietet die Matrixoptik eine formale Methode zur Beschreibung komplexer optischer Systeme in der paraxialen Näherung.
1.4.1 Die Strahltransfermatrix Wir betrachten ein zylindersymmetrisches System aus mehreren brechenden und reflektierenden Grenzflächen, die entlang derselben Achse (optische Achse) angeordnet sind. Die optische Achse soll entlang der 𝑧-Achse liegen, die auch der ungefähren Ausbreitungsrichtung der Strahlen entspricht. Wir betrachten nur Strahlen in einer Ebene, die die optische Achse enthält, beispielsweise der 𝑦𝑧-Ebene. Dann verfolgen wir den Strahl während seiner Ausbreitung durch das System und beobachten, wie er verschiedene Grenzflächen entlang der optischen Achse durchschreitet. Ein Strahl, der an der Position 𝑧 eine transversale Fläche schneidet, ist durch die Angabe der 𝑦-Koordinate (Höhe) seines Auftreffpunkts auf die Fläche und seinen Winkel 𝜃 vollständig charakterisiert (Abb. 1.38). Ein optisches System besteht aus einer Zahl von optischen Elementen zwischen zwei transversalen Ebenen bei 𝑧1 und 𝑧2 , die wir als Eingangs- und Ausgangsebene bezeichnen. Das System ist durch seine Wirkung auf einen in beliebiger Höhe 𝑦1 und in beliebigen Winkeln 𝜃1 einfallenden Strahl gekennzeichnet. Es verändert den
optische Achse
z
Abb. 1.38 Ein Strahl ist durch seine Höhe (y-Koordinate) und seinen Winkel 𝜃 charakterisiert. Eingang (y1, θ1)
Ausgang (y2, θ2)
optisches System
y Eingangsθ1 ebene
Ausgangsebene
θ2 y1
y2
z1
z2
optische z Achse
Abb. 1.39 Ein Strahl tritt an der Stelle z1 am Ort y1 im Winkel 𝜃1 in das System ein und verlässt es an der Stelle z2 am Ort y2 im Winkel 𝜃2 .
Strahl, sodass er auf der Ausgangsebene in der Höhe 𝑦2 im Winkel 𝜃2 aus dem System austritt (Abb. 1.39). In der paraxialen Näherung, wenn alle Winkel so klein sind, dass sin 𝜃 ≈ 𝜃 gesetzt werden kann, ist die Beziehung zwischen (𝑦2 , 𝜃2 ) und (𝑦1 , 𝜃1 ) linear und kann allgemein in der Form 𝑦2 = A𝑦1 + B𝜃1
(1.40)
𝜃2 = C 𝑦1 + D𝜃1
(1.41)
geschrieben werden, wobei A, B, C und D reelle Zahlen sind. Die Gln. (1.40) und (1.41) lauten in Matrixschreibweise ⎡𝑦2 ⎤ ⎡A ⎢ ⎥=⎢ 𝜃 C ⎣ 2⎦ ⎣
B ⎤ ⎡𝑦1 ⎤ D
⎥⎢ ⎥ . 𝜃 ⎦ ⎣ 1⎦
(1.42)
Die Matrix M mit den Elementen A, B, C und D charakterisiert das optische System vollständig, da sie die Berechnung von (𝑦2 , 𝜃2 ) für jedes beliebige (𝑦1 , 𝜃1 ) ermöglicht. Diese Matrix wird als Strahltransfermatrix bezeichnet. Negative Winkel zeigen in Ausbreitungsrichtung des Strahls von der 𝑧-Achse nach unten; negative Radien bezeichnen konkave Flächen, positive Radien beschreiben konvexe Flächen. Übung 1-10: Spezielle Fälle von Strahltransfermatrizen
Betrachten Sie die folgenden Situationen, in denen jeweils eines der vier Elemente der Strahltransfermatrix null ist:
19
20
1 Strahlenoptik
(a) Zeigen Sie, dass der Fall A = 0 ein fokussierendes System beschreibt, in welchem alle Strahlen, die an einer beliebigen Position, aber unter demselben Winkel in das System eintreten, in derselben Höhe austreten. (b) Zeigen Sie, dass der Fall B = 0 ein abbildendes System beschreibt, in welchem alle Strahlen, die unter beliebigen Winkeln in derselben Höhe in das System eintreten, in derselben Höhe austreten. (c) Welche besonderen Eigenschaften haben Systeme, für die C = 0 oder D = 0 ist?
wird nicht verändert, 𝑦2 ≈ 𝑦1 . Die Strahltransfermatrix ist daher ⎡
1
− ⎣
𝑛2 𝑅
M = ⎢ (𝑛2 − 𝑛1 ) ⎢
0⎤ . 𝑛1 ⎥ ⎥ 𝑛2 ⎦
(1.45)
R n1
n2
konvex: R > 0; konkav: R < 0
1.4.2 Matrizen einfacher optischer Komponenten Durchgang durch eine dünne Linse
Ausbreitung im Vakuum
Da sich die Strahlen in einem Medium mit konstantem Brechungsindex wie z. B. dem Vakuum geradlinig ausbreiten, ist die Veränderung eines Strahls nach Durchlaufen einer Wegstrecke d durch 𝑦2 = 𝑦1 + 𝜃1 d und 𝜃2 = 𝜃1 gegeben. Die Strahltransfermatrix ist folglich ⎡1
M=⎢
0 ⎣
d⎤
⎥ . 1 ⎦
Die Beziehung zwischen 𝜃1 und 𝜃2 für paraxiale Strahlen beim Durchgang durch eine dünne Linse der Brennweite 𝑓 ist in Gl. (1.14) angegeben. Da die Höhe des Strahls unverändert bleibt (𝑦2 = 𝑦1 ), gilt für die Strahltransfermatrix ⎡ 1
M=⎢
1
− ⎣ 𝑓
(1.43)
0⎤ ⎥. 1 ⎦
(1.46)
f konvex: f > 0; konkav: f < 0 d 𝘥
Reflexion an einem ebenen Spiegel
Brechung an einer ebenen Grenzfläche
An einer ebenen Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 ist die Veränderung des Strahlwinkels durch das snelliussche Gesetz gegeben, 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 . In der paraxialen Näherung ist 𝑛1 𝜃1 ≈ 𝑛2 𝜃2 . Die Höhe des Strahls verändert sich nicht, 𝑦2 = 𝑦1 . Folglich ist die Strahltransfermatrix ⎡1
M=⎢
⎢0 ⎣
n1
0⎤ 𝑛1 ⎥ . ⎥ 𝑛2 ⎦
Die Position des Strahls wird bei Reflexion an einem ebenen Spiegel nicht verändert, 𝑦2 = 𝑦1 . Wenn wir die übliche Konvention verwenden, die 𝑧-Achse in Ausbreitungsrichtung positiv zu zählen (also für den einfallenden Strahl in Richtung des Spiegels und für den reflektierten Strahl vom Spiegel weg), dann ist offensichtlich 𝜃2 = 𝜃1 . Die Strahltransfermatrix ist daher die Einheitsmatrix ⎡1
M=⎢
(1.44)
0 ⎣
0⎤ ⎥. 1 ⎦
(1.47)
n2 z
θ•2
θ• 1 z
Brechung an einer sphärischen Grenzfläche
Die Beziehung zwischen 𝜃1 und 𝜃2 für paraxiale Strahlen, die an einer sphärischen Grenzfläche gebrochen werden, ist in Gl. (1.11) angegeben. Die Höhe des Strahls
Reflexion an einem Kugelspiegel
Mithilfe von Gl. (1.4) und der Konvention, dass die 𝑧-Achse in Ausbreitungsrichtung der Strahlen zeigt, er-
1.4 Matrizenoptik
halten wir analog 0⎤ ⎥ . 1 ⎦
⎡1
M = ⎢2
⎣𝑅
(1.48)
In diesem Fall hat die Reihenfolge der Platten keinen Einfluss auf die Strahltransfermatrix des Gesamtsystems. Wie lautet die Strahltransfermatrix einer inhomogenen transparenten Platte mit der Dicke d 0 und dem Brechungsindex 𝑛(𝑧)?
n1
1
n2
...
nN
1
z (– R)
𝘥1
𝘥2
𝘥N
Übung 1-12: Luftspalt und dünne Linse
konkav: R < 0; konvex: R > 0 Die Strahltransfermatrizen eines sphärischen Spiegels, Gl. (1.48), und einer dünnen Linse, Gl. (1.46), ähneln sich. Ein Spiegel mit dem Krümmungsradius 𝑅 bricht Strahlen genau wie eine dünne Linse mit der Brennweite 𝑓 = −𝑅∕2.
Zeigen Sie, dass für die Strahltransfermatrix eines Luftspalts der Breite d gefolgt von einer dünnen Linse der Brennweite 𝑓 gilt ⎡ 1
M=⎢
D→ M1 D→ M2 D→ ⋯ D→ M𝑁 D→ M = M𝑁 ⋯ M2 M1 . (1.49) Die Reihenfolge der Multiplikation ist dabei entscheidend: Die Matrix des Systems, das der Strahl zuerst passiert, muss ganz rechts stehen, sodass sie als erste auf die Spaltenmatrix des einfallenden Strahls wirkt. Die Matrizenmultiplikation ist im Allgemeinen nicht kommutativ (wohl aber assoziativ).
1−
⎤ ⎥. 𝑓⎦ d
(1.51)
f
1.4.3 Matrizen von hintereinander geschalteten optischen Komponenten Eine Folge von 𝑁 optischen Komponenten oder Systemen mit den Strahltransfermatrizen M1 , M2 , … , M𝑁 ist äquivalent zu einem einzigen optischen System mit der Strahltransfermatrix
d
1
− ⎣ 𝑓
𝘥 Übung 1-13: Abbildung mit einer dünnen Linse
Leiten Sie einen Ausdruck für die Strahltransfermatrix eines Systems Luft/dünne Linse/Luft her (siehe Skizze). Zeigen Sie, dass alle von einem einzelnen Punkt in der Eingangsebene ausgehenden Strahlen unabhängig von ihren Winkeln auch in der Ausgangsebene auf einem einzigen Punkt 𝑦2 eintreffen, sofern die Abbildungsbedingung (1∕d 1 + 1∕d 2 = 1∕𝑓) erfüllt ist. Zeigen Sie weiter, dass für d 2 = 𝑓 alle parallel einfallenden Strahlen von der Linse auf einen einzigen Punkt in der Ausgangsebene gebündelt werden.
f Übung 1-11: Parallele transparente Platten
Betrachten Sie einen Satz von 𝑁 parallelen ebenen transparenten Platten mit den Brechungsindizes 𝑛1, 𝑛2 , . . . 𝑛𝑁 und den Dicken d 1 , d 2 , . . . d 𝑁 , die in Luft (𝑛 = 1) senkrecht zur 𝑧-Achse liegen. Zeigen Sie durch vollständige Induktion, dass die Strahltransfermatrix des Gesamtsystems durch ⎡1 M=⎢ ⎣0
∑𝑁
gegeben ist.
d𝑖 𝑖=1 𝑛 ⎤ 𝑖
1
⎥ ⎦
(1.50)
𝘥1
𝘥2
Abb. 1.40 Einlinsen-Bildgebungssystem
Bildgebung mit einem beliebigen paraxialen optischen System
Ein paraxiales System aus einem beliebigen Satz von hintereinander geschalteten optischen Elementen ist durch die vier Elemente A, B, C und D seiner Strahl-
21
22
1 Strahlenoptik
hungen aus den Parametern ABCD bestimmt werden:
transfermatrix M vollständig charakterisiert. Alternativ kann das System auch durch die Positionen seiner vier Kardinalpunkte beschrieben werden, zweier Brennund zweier Hauptpunkte, die den Durchtritt der Strahlen zwischen seiner Eingangs- und Ausgangsebene bestimmen. Gemäß Gl. (1.42) verlässt ein parallel zur optischen Achse (𝜃1 = 0) in der Höhe 𝑦1 einfallender Strahl das System in der Höhe 𝑦2 = A𝑦1 unter dem Winkel 𝜃2 = C 𝑦1 . Dieser Strahl kreuzt die optische Achse an einem Punkt 𝐹, der als hinterer Brennpunkt bezeichnet wird und sich in einem Abstand 𝑦2 ∕𝜃2 = A∕C vom hinteren Scheitelpunkt 𝑉 des Systems befindet, wie in Abb. 1.41(a) gezeigt. Der Schnittpunkt der Verlängerungen der einfallenden und ausgehenden Strahlen definiert den hinteren Hauptpunkt 𝐻, der in einem Abstand 𝑓 = 𝑦1 ∕𝜃2 = −1∕C links von 𝐹 liegt, welcher als hintere Brennweite bezeichnet wird. Der hintere Hauptpunkt 𝐻 befindet sich also in einem Abstand ℎ = −1∕C + A∕C links vom hinteren Scheitelpunkt 𝑉. Solange die paraxiale Näherung gilt, hängen die Positionen der Brenn- und Hauptpunkte nicht von 𝑦1 ab. In ähnlicher Weise werden Strahlen parallel zur optischen Achse, die in entgegengesetzter Richtung (von rechts nach links) in das System eintreten, auf den vorderen Brennpunkt 𝐹 ′ fokussiert und definieren so den vorderen Hauptpunkt 𝐻 ′ , der in einem Abstand ℎ′ vom vorderen Scheitelpunkt 𝑉 ′ liegt. Der vordere Brennpunkt befindet sich in einem Abstand 𝑓 ′ links von 𝐻 ′ , wobei 𝑓 ′ die vordere Brennweite ist. Diese Abstände ′ können über die Beziehungen −𝑓 ′ = −1∕C und −ℎ′ = ′ ′ ′ −1∕C + A ∕C als Elemente der inversen Strahltransfermatrix ausgedrückt werden: −1
M
′
⎡A =⎢ ′ C ⎣
′
B⎤ D
′⎥
=
⎦
1 ⎡D ⎢ det[M] −C ⎣
−B ⎤ ⎥. DA ⎦
𝑓 = −1∕C ,
Fʹ
Vʹ
Hʹ
H
V h
hʹ
F
n1 Vʹ
Abb. 1.41 (a) Paraxiales System als Darstellung eines beliebigen Satzes von kaskadierten optischen Elementen. F, V und H bezeichnen den Brennpunkt, den Scheitelpunkt und die Hauptpunkte; f und h sind die Brennweite und der Abstand zwischen Haupt- und Scheitelpunkt. Gestrichene Grö-
(1.53) (1.54)
(1.55)
Wenn die Brechungsindizes der Medien, in die das System eingebettet ist, identisch sind, ist det[M] = 1 und im Einklang mit Gl. (1.54) folgt 𝑓 ′ = 𝑓. Die Abbildungsbedingung aus Gl. (1.55) reduziert sich dann auf die bekannte Abbildungsgleichung 1∕𝑧1 + 1∕𝑧2 = 1∕𝑓 [siehe Gl. (1.7)]; es sei jedoch bemerkt, dass hier die Abstände 𝑧1 und 𝑧2 von den Hauptpunkten 𝐻 ′ bzw. 𝐻 aus gemessen werden. Übung 1-14: Abbildung mit einer dicken Linse
Betrachten Sie eine Glaslinse mit dem Brechungsindex 𝑛, der Dicke d und zwei sphärischen Oberflächen mit dem Radius 𝑅. Bestimmen Sie die Strahltransfermatrix der Linse unter der Annahme, dass sie sich in Luft befindet (Brechungsindex = 1). Zeigen Sie, dass die vordere und hintere Brennweite gleich ist (𝑓 = 𝑓 ′ ) und dass sich die Hauptpunkte in identischen Entfernungen von den Scheitelpunkten befinden (ℎ = ℎ′ ), s2
f n2 H
Hʹ
z1
(a)
ℎ = −𝑓 + D𝑓 .
𝑓 𝑓′ + =1. 𝑧1 𝑧2
fʹ
Fʹ
′
Negative Vorzeichen bezeichnen Richtungen entgegen den durch die Pfeile in Abb. 1.41(a) angegebenen Richtungen. Alternativ können die vier Abstände auch festgelegt werden, indem man zwei zur optischen Achse parallele Strahlen, die jedoch in entgegengesetzte Richtungen verlaufen, durch das System verfolgt. Die Parameter ABCD können durch Invertieren der Gln. (1.53) und (1.54) aus 𝑓, 𝑓 ′ , ℎ und ℎ′ bestimmt werden. Die Abbildungsbedingung wird unter Berücksichtigung der in Abb. 1.41(b) dargestellten Geometrie bestimmt. Da 𝑠2 ∕𝑓 = 𝑓 ′ ∕𝑠1 ist, ist die Abbildungsbedingung einfach 𝑠1 𝑠2 = 𝑓𝑓 ′ oder äquivalent (𝑧1 − 𝐹 ′ )(𝑧2 − 𝑓) = 𝑓𝑓 ′ oder
(1.52)
s1
f
′
𝑓 = det[M]𝑓 ,
Die Determinante det[M] von M ist durch AD − BD gegeben. Zusammengefasst können die Brennweiten und Positionen der Hauptpunkte mithilfe der folgenden Beziefʹ
ℎ = (1 − A)𝑓
′
V
F z2
(b)
ßen beziehen sich auf die Eingangsebene, nicht gestrichene auf die Ausgangsebene. (b) Bildgebung mit einem solchen System. Die Brechungsindizes der Medien, in die das optische System eingebettet ist, sind n1 und n2 .
1.4 Matrizenoptik
wobei (𝑛 − 1) 𝑛−1d 1 [2 − ] = 𝑅 𝑛 𝑅 𝑓 (𝑛 − 1)𝑓 d . ℎ= 𝑛𝑅
iterativ anwenden, um (𝑦1 , 𝜃1 ) aus (𝑦0 , 𝜃0 ), (𝑦2 , 𝜃2 ) aus (𝑦1 , 𝜃1 ) usw. zu bestimmen, am einfachsten mithilfe einer geeigneten Software. Es wird sich als nützlich erweisen, Gleichungen herzuleiten, die die Dynamik der Höhe 𝑦𝑚 , 𝑚 = 0, 1, …, unabhängig von den Winkeln 𝜃𝑚 beschreiben. Das können wir erreichen, indem wir 𝜃𝑚 aus den Gln. (1.59) und (1.60) eliminieren. Aus Gl. (1.59) erhalten wir
(1.56) (1.57)
Zeigen Sie, dass für die Transfermatrix des Systems zwischen zwei konjugierten Ebenen in den Abständen 𝑧1 und 𝑧2 von den Hauptpunkten der Linse (d. h. in den Abständen d 1 = 𝑧1 − ℎ′ und d 2 = 𝑧2 − ℎ von den Scheitelpunkten), die die Abbildungsgleichung erfüllt, B = 0 gilt, was zeigt, dass sie tatsächlich die Abbildungsbedingung erfüllt [siehe Übung 1-10(b)].
𝜃𝑚 =
𝜃𝑚+1 =
B
B ⎤ ⎡𝑦0 ⎤
⎥ ⎢ ⎥. 𝜃 ⎦ ⎣ 0⎦
A+D
𝑦𝑚 = 𝑦0 ℎ𝑚
(1.58)
(1.60)
folgt.
2
m– 1
m
m+1
(1.66)
(1.68)
𝜃𝑚+1 = C 𝑦𝑚 + D𝜃𝑚
1
(1.65)
(1.67)
(1.59)
𝘈 𝘉 ym 𝘈 𝘉 𝘊 𝘋 θm 𝘊 𝘋
(1.64)
ℎ2 − 2𝑏ℎ + 𝐹 2 = 0
𝑦𝑚+1 = A𝑦𝑚 + B𝜃𝑚
𝘈 𝘉 𝘊 𝘋
(1.63)
mit einer Konstante ℎ. Einsetzen von Gl. (1.66) in Gl. (1.63) zeigt sofort, dass die Probefunktion geeignet ist, sofern ℎ die quadratische algebraische Gleichung
erfüllt, woraus √ ℎ = 𝑏 ± i 𝐹 2 − 𝑏2
...
(1.62)
ist und det[M] die Determinante von M bedeutet. Gleichung (1.63) ist eine lineare Differenzgleichung für die Strahlhöhe 𝑦𝑚 . Sie kann iterativ gelöst werden, indem man 𝑦2 aus 𝑦0 und 𝑦1 berechnet, danach 𝑦3 aus 𝑦1 und 𝑦2 und so weiter. Die Größe 𝑦1 kann mithilfe von Gl. (1.59) mit 𝑚 = 0 aus 𝑦0 und 𝜃0 berechnet werden. Es ist jedoch hilfreich, durch Lösung der Differenzgleichung (1.63) einen expliziten Ausdruck für 𝑦𝑚 anzugeben. Genau wie bei Differentialgleichungen ist auch bei Differenzgleichungen eine Lösung eindeutig, wenn sie die Differenzgleichung löst und die Anfangsbedingungen erfüllt. Wir können daher einen sinnvollen Ansatz für die Lösung von Gl. (1.63) wählen. Wir verwenden eine Probefunktion der geometrischen Form
𝑚
𝘈 𝘉 𝘊 𝘋
.
, 2 𝐹 2 = AD − BC = det[M] 𝑏=
Genauso können wir die Beziehungen
θ0
𝑦𝑚+2 − A𝑦𝑚+1
wobei
Ein periodisches System besteht aus einer Folge von identischen Einheiten (Abschnitten) mit der Strahltransfermatrix (A, B, C , D), wie in Abb. 1.42 gezeigt. Ein Strahl tritt in einer Höhe 𝑦0 in einem Winkel 𝜃0 in das System ein. Um die Höhe und den Winkel (𝑦𝑚 , 𝜃𝑚 ) des Strahls am Ausgang des 𝑚ten Abschnitts zu bestimmen, wenden wir die Matrix ABCD 𝑚 mal an,
𝘈 𝘉 y1 𝘊 𝘋 θ1
(1.61)
𝑦𝑚+2 = 2𝑏𝑦𝑚+1 − 𝐹 2 𝑦𝑚 ,
Die Differenzgleichung für die Strahlposition
y0
.
Durch Einsetzen der Gln. (1.61) und (1.62) in Gl. (1.60) bekommen wir
Unter einem periodischen optischen System versteht man eine Folge von identischen Einheiten. Ein Beispiel ist etwa die in Abb. 1.24(a) gezeigte Folge von Linsen in gleichen Abständen zur Lichtführung. Ein weiteres Beispiel ist die Reflexion von Licht zwischen zwei Spiegeln in einem optischen Resonator (siehe Abschnitt 11.2.1); in diesem Fall durchläuft ein Strahl immer wieder dasselbe System. Selbst ein homogenes Medium wie z. B. eine Glasfaser kann als periodisches System angesehen werden, wenn man es formal in gleichlange identische Segmente unterteilt. Wir wollen im Folgenden mithilfe von Matrizenmethoden eine allgemeine Theorie der Strahlausbreitung in periodischen optischen Systemen entwickeln.
D
B
Nun ersetzen wir in Gl. (1.61) 𝑚 durch 𝑚 + 1 und finden
1.4.4 Periodische optische Systeme
⎡𝑦𝑚 ⎤ ⎡A ⎢ ⎥=⎢ 𝜃 C ⎣ 𝑚⎦ ⎣
𝑦𝑚+1 − A𝑦𝑚
ym+1 θm+1
Abb. 1.42 Eine Folge von identischen optischen Systemen.
23
24
1 Strahlenoptik
Wir können das Ergebnis in einer kompakteren Form angeben, indem wir die Variable 𝜑 = cos−1 (𝑏∕𝐹)
(1.69) √
definieren, sodass 𝑏 = 𝐹 cos 𝜑, 𝐹 2 − 𝑏2 = 𝐹 sin 𝜑 und daher ℎ = 𝐹(cos 𝜑 ± i sin 𝜑) = 𝐹 exp(±i𝜑) ist. Damit wird Gl. (1.66) zu 𝑦𝑚 = 𝑦0 𝐹 𝑚 exp(±i𝑚𝜑). Eine allgemeine Lösung erhalten wir aus den beiden Lösungen mit positivem und negativem Vorzeichen, indem wir eine passende Linearkombination bilden. Die Summe der beiden Exponentialfunktionen kann als harmonische (Kreis-) Funktion geschrieben werden, sodass 𝑦𝑚 = 𝑦max 𝐹 𝑚 sin(𝑚𝜑 + 𝜑0 ) ,
(1.70)
wobei 𝑦max und 𝜑0 Konstanten sind, die aus den Anfangsbedingungen 𝑦0 und 𝑦1 bestimmt werden müssen. Für 𝑚 = 0 erhalten wir insbesondere 𝑦max = 𝑦0 ∕ sin 𝜑0 . Der Parameter 𝐹 hängt mit der Determinante der Strahltransfermatrix der einzelnen Einheiten durch 𝐹 = √ det[M] zusammen. Man kann zeigen, das unabhängig von der Art der einzelnen Einheiten det[M] = 𝑛1 ∕𝑛2 gilt, wobei 𝑛1 und 𝑛2 die Brechungsindizes am Beginn und am Ende der Einheit sind. Dieses allgemeine Ergebnis kann für die Strahltransfermatrizen aller in diesem Abschnitt diskutierten optischen Komponenten verifiziert werden. Da die Determinante des Produkts zweier Matrizen gleich dem Produkt ihrer Determinanten ist, muss die Beziehung det[M] = 𝑛1 ∕𝑛2 für jede beliebige Folge dieser optischen Komponenten gelten. Wenn zum Beispiel det[M1 ] = 𝑛1 ∕𝑛2 und det[M2 ] = 𝑛2 ∕𝑛3 ist, dann folgt sofort det[M2 M1 ] = (𝑛2 ∕𝑛3 )(𝑛1 ∕𝑛2 ) = 𝑛1 ∕𝑛3 . In den meisten Anwendungen bestehen Anfang und Ende der Einheiten einfach aus Luft (𝑛 = 1) und es gilt 𝑛1 = 𝑛2 , sodass det[M] = 1 und 𝐹 = 1 ist. In diesem Fall ist die Lösung für die Strahlhöhe 𝑦𝑚 = 𝑦max sin(𝑚𝜑 + 𝜑0 ) .
(1.71)
Wir werden im Folgenden 𝐹 = 1 annehmen. Die entsprechende Lösung für den Strahlwinkel erhalten wir mithilfe der Beziehung 𝜃𝑚 = (𝑦𝑚+1 − A 𝑦𝑚 )∕B, die aus Gl. (1.59) folgt. Bedingungen für einen harmonischen Strahlverlauf
Damit 𝑦𝑚 eine harmonische (anstatt hyperbolische) Funktion ist, muss 𝜑 = cos−1 𝑏 reell sein. Dazu muss |𝑏| ≤ 1 oder
Bedingungen für einen periodischen Strahlverlauf
Die harmonische Funktion (1.71) ist periodisch in 𝑚, sofern eine ganze Zahl 𝑠 existiert, sodass 𝑦𝑚+𝑠 = 𝑦𝑚 für alle 𝑚. Die kleinste solche ganze Zahl ist die Periode. In diesem Fall kehrt der Strahl nach 𝑠 Abschnitten auf seine eigene Bahn zurück. Die Bedingung ist erfüllt, wenn 𝑠𝜑 = 2π 𝑞 ist, wobei 𝑞 eine ganze Zahl ist. Eine notwendige und hinreichende Bedingung für eine periodische Bahn ist somit, dass 𝜑∕2π eine rationale Zahl 𝑞∕𝑠 sein
0
10
20
m
0
10
20
m
20
m
ym
(b)
ym (c) 0
10
(1.72)
gelten. Wenn stattdessen |𝑏| > 1 ist, ist 𝜑 imaginär und wir erhalten eine hyperbolische Funktion (cosh oder sinh) als Lösung, die unbegrenzt ansteigt wie in Abb. 1.43(a). Eine harmonische Lösung stellt sicher, dass 𝑦𝑚 für alle Werte von 𝑚 beschränkt ist und einen Maximalwert 𝑦max besitzt. Die Schranke |𝑏| ≤ 1 liefert daher eine Stabilitätsbedingung für den Strahlweg. Da sowohl 𝑦𝑚 als auch 𝑦𝑚+1 harmonische Funktionen sind, gilt dies auch für den Strahlwinkel gemäß Gl. (1.71), wie aus Gl. (1.61) und trigonometrischen Identitäten folgt. Folglich ist 𝜃𝑚 = 𝜃max sin(𝑚𝜑 + 𝜑1 ), wobei die Konstanten 𝜃max und 𝜑1 aus den Anfangsbedingungen zu bestimmen sind. Der maximale Winkel 𝜃max muss hinreichend klein sein, damit die paraxiale Näherung, die unserer Analyse zugrunde liegt, anwendbar ist.
ym (a)
1 |A + D | ≤ 1 2
Abb. 1.43 Beispiele für Strahlverläufe in optischen Systemen: (a) instabile Bahn (b > 1); (b) stabile periodische Bahn (𝜑 = 6π∕11; Periode 11 Abschnitte); (c) stabile nichtperiodische Bahn (𝜑 = 1.5).
1.4 Matrizenoptik 3
muss. Wenn z. B. 𝜑 = 6π∕11 ist, ist 𝜑∕2π = und die 11 Bahn ist periodisch mit einer Periode von 𝑠 = 11 Abschnitten. Dieser Fall ist in Abb. 1.43(b) dargestellt. In Kapitel 7 beschäftigen wir uns ausführlicher mit periodischen optischen Systemen. Beispiel 1-3: Eine Folge von äquidistanten identischen Linsen
Eine Folge von identischen Linsen der Brennweite 𝑓 im Abstand d (Abb. 1.44) kann zur Führung von Licht zwischen zwei Orten dienen. Die Grundeinheit, ein freier Raum der Länge d gefolgt von einer Linse, besitzt eine Strahltransfermatrix gemäß Gl. (1.51); A = 1, B = d , C = −1∕𝑓, D = 1 − d ∕𝑓. Für den Parameter 𝑏 1 gilt 𝑏 = (A + D) = 1 − d ∕2𝑓, und die Determinante 2 ist 1. Die Stabilitätsbedingung für den Strahlverlauf, |𝑏| ≤ 1 oder −1 ≤ 𝑏 ≤ 1, lautet daher 0 ≤ d ≤ 4𝑓 ;
Ein paraxialer Strahl (𝜃max ≪ 1), der eine Folge von identischen Systemen mit einer Strahltransfermatrix (A, B, C , D) mit AD − BC = 1 passiert, folgt einer harmonischen (und folglich beschränkten) Bahn, wenn die Sta1 bilitätsbedingung | (A + D)| ≤ 1 erfüllt ist. Seine Position 2 nach dem 𝑚ten Abschnitt ist dann 𝑦𝑚 = 𝑦max sin(𝑚𝜑 + 1 𝜑0 ), 𝑚 = 0, 1, 2, …, wobei 𝜑 = cos−1 [ (A + D)] ist. Die 2 Konstanten 𝑦max und 𝜑0 sind durch die Anfangsbedingungen 𝑦0 und 𝑦1 = A𝑦0 + B𝜃0 bestimmt, wenn 𝜃0 der Anfangswinkel des Strahls ist. Die Winkel des Strahls hängen gemäß 𝜃𝑚 = (𝑦𝑚+1 − A𝑦𝑚 )∕B mit der Strahlhöhe zusammen und werden durch eine harmonische Funktion 𝜃𝑚 = 𝜃max sin(𝑚𝜑 + 𝜑1 ) beschrieben. Der Strahlverlauf ist periodisch mit einer Periode 𝑠, wenn 𝜑∕2π eine rationale Zahl 𝑞∕𝑠 ist.
(1.73)
der Abstand zwischen den Linsen muss also kleiner sein als die vierfache Brennweite. Unter dieser Bedingung folgen paraxiale Strahlen der harmonischen Funktion 𝑦𝑚 = 𝑦max sin(𝑚𝜑 + 𝜑0 ) , 𝜑 = cos−1 (1 − 1
d
2𝑓
) . (1.74)
Für d = 2𝑓 ist 𝜑 = π∕2 und 𝜑∕2π = , und der Verlauf 4 eines beliebigen Strahls ist periodisch mit einer Periode von vier Abschnitten. Für d = 𝑓 ist 𝜑 = π∕3 und 1 𝜑∕2π = , und der Verlauf des Strahls ist periodisch 6 mit einer Periode von sechs Abschnitten. Diese Fälle sind in Abb. 1.45 dargestellt.
f
𝘥
Zusammenfassung
f
𝘥
f
𝘥
Übung 1-15: Eine periodische Folge von Paaren unterschiedlicher Linsen
Betrachten Sie den Verlauf von paraxialen Strahlen durch ein periodisches System, das aus einer Folge von Linsenpaaren mit den alternierend angeordneten Brennweiten 𝑓1 und 𝑓2 besteht (Abb. 1.46). Zeigen Sie, dass der Strahlverlauf beschränkt (stabil) ist, wenn 0 ≤ (1 −
d
2𝑓1
) (1 −
d
2𝑓2
)≤1
(1.75)
gilt.
f1
𝘥
f2
𝘥
f1
𝘥
f2
𝘥
f1
𝘥
f2
𝘥
Abb. 1.46 Eine periodische Folge von Linsenpaaren.
Abb. 1.44 Eine periodische Folge von Linsen.
Abb. 1.45 Beispiele für stabile Strahlverläufe in einem periodischen System aus Linsen: (a) d = 2f ; (b) d = f .
(a) 𝘥
(b) 𝘥
25
26
1 Strahlenoptik
Übung 1-16: Ein optischer Resonator
Paraxiale Strahlen werden wiederholt zwischen zwei sphärischen Spiegeln mit den Radien 𝑅1 und 𝑅2 reflektiert, die in einem Abstand d voneinander stehen (Abb. 1.47). Betrachten Sie diese Anordnung als periodisches System, dessen Grundeinheit eine einzelne Runde des Strahls zwischen den Spiegeln ist. Bestimmen Sie die Stabilitätsbedingung für den Strahlverlauf. Mit optischen Resonatoren werden wir uns in Kapitel 11 genauer befassen.
zeigt an einem Punkt 𝑃 tangential an diesem anliegt. Zeigen Sie, dass die Strecke 𝐴𝑃𝐵, die der Lichtstrahl auf seinem Weg von 𝐴 nach 𝐵 zurücklegt, jetzt ein Weg maximaler Zeit ist, d. h., die benötigte Zeit ist größer als für die benachbarten Wege 𝐴𝑄′ 𝐵 und 𝐴𝑄′′ 𝐵. (b) Betrachten Sie schließlich einen Spiegel, der die Ellipse schneidet, aber in 𝑃 tangential an ihr liegt wie in Abb. 1.48(c) gezeigt. Zeigen Sie, dass die möglichen Strahlwege 𝐴𝑄′ 𝐵, 𝐴𝑃𝐵 und 𝐴𝑄′′ 𝐵 einem Wendepunkt der Zeit bei Variation von 𝑃 entsprechen. Aufgabe 1-2: Durchgang durch ebene Platten
R1
R2
y1
– θ1 – θ0
y0
z
θ2 y2
𝘥
Abb. 1.47 Ein optischer Resonator als periodisches optisches System.
(a) Verwenden Sie das snelliussche Gesetz, um zu zeigen, dass ein Strahl, der durch eine ebene Platte mit der Dicke d und dem Brechungsindex 𝑛1 (in Luft, 𝑛 ≈ 1) hindurchtritt, parallel zur Einfallsrichtung wieder austritt. Der Strahl muss dabei nicht paraxial sein. Leiten Sie einen Ausdruck für die seitliche Versetzung des Strahls als Funktion des Einfallswinkels 𝜃 her. Erklären Sie ihr Ergebnis mithilfe von Fermats Prinzip. (b) Zeigen Sie, dass auch wenn die Platte durch einen Stapel von 𝑁 parallelen Schichten mit den Dicken d 1 , d 2 , … , d 𝑁 und den Brechungsindizes 𝑛1 , 𝑛2 , … , 𝑛𝑁 ersetzt wird, der austretende Strahl wieder parallel zum einfallenden Strahl ist. Zeigen Sie weiter, dass wenn 𝜃𝑚 der Winkel des Strahls in der 𝑚ten Schicht ist, 𝑛𝑚 sin 𝜃𝑚 = sin 𝜃 gilt (𝑚 = 1, 2, …). Aufgabe 1-3: Linse in Wasser
Bestimmen Sie die Brennweite 𝑓 einer bikonvexen Linse mit den Radien 20 cm und 30 cm und dem Brechungsindex 𝑛 = 1.5. Wie groß ist die Brennweite der Linse in 4 Wasser (𝑛 = )?
Aufgaben Aufgabe 1-1: Fermats Prinzip für maximale Laufzeit
3
Betrachten Sie den elliptischem Spiegel aus Abb. 1.48(a), dessen Brennpunkte mit 𝐴 und 𝐵 bezeichnet sind. Aus geometrischen Gründen ist die Länge der Strecke 𝐴𝑃𝐵 identisch zu 𝐴𝑃′ 𝐵 und 𝐴𝑃′′ 𝐵 für benachbarte Punkte 𝑃′ und 𝑃′′ auf der Ellipse. (a) Betrachten Sie nun einen anderen Spiegel mit einem kleineren Krümmungsradius als der elliptische Spiegel, der wie in Abb. 1.48(b) ge-
A
B
A
P
(a)
P″
Bestimmen Sie die numerische Apertur und den Akzeptanzwinkel eines Lichtleiters mit einem Brechungsindex des Kerns von 𝑛1 = 1.46, dessen Mantel entfernt (bzw. durch Luft ersetzt, 𝑛2 ≈ 1) wurde.
B
Q′ P′
Aufgabe 1-4: Numerische Apertur einer nicht ummantelten Faser
P
(b)
Q″
A
B
Q′
P
Q″
(c)
Abb. 1.48 (a) Reflexion an einem elliptischen Spiegel. (b) Reflexion an einem einbeschriebenen tangentialen Spiegel mit größerer Krümmung. (c) Reflexion an einem tangentialen Spiegel, dessen Krümmung von konkav zu konvex wechselt.
Aufgaben
2a
Abb. 1.49 Bündelung von Licht in einen Lichtleiter mithilfe einer Glaskugel.
f
y
Linse
Faser
Aufgabe 1-5: Kopplung von Lichtleitern
Um Licht in Lichtleiter ein- oder aus ihnen auszukoppeln, werden oft winzige Glaskugeln als Linsen verwendet. Das Ende der Faser liegt dabei in einem Abstand 𝑓 von der Kugel. Bestimmen Sie 𝑓 für eine Kugel mit dem Radius 𝑎 = 1 mm und dem Brechungsindex 𝑛 = 1.8, sodass ein zur optischen Achse paralleler Strahl in einem radialen Abstand von 𝑦 = 0.7 mm auf die Faser gebündelt wird, wie in Abb. 1.49 dargestellt. Aufgabe 1-6: Auskoppeln von Licht aus einem Medium mit großem Brechungsindex
Nehmen Sie an, dass Licht in einem Parallelepiped mit dem Brechungsindex 𝑛 = 3.7 erzeugt wird und sich isotrop ausbreitet (siehe Übung 1-7). Das Material soll von Luft (𝑛 = 1) umgeben sein. (a) Welcher Anteil des erzeugten Lichts kann aus der Stirnseite des Parallelepipeds ausgekoppelt werden, wenn alle Seiten bis auf die Stirnseite mit einem reflektierenden Material beschichtet werden, das als idealer Spiegel wirkt? (b) Vergrößert sich der Anteil des ausgekoppelten Lichts, wenn die Frontseite mit einem transparenten Material mit dem Brechungsindex 𝑛 = 1.4 beschichtet wird? Aufgabe 1-7: Platte mit axial variablem Brechungsindex Eine Platte der Dicke d liegt senkrecht zur 𝑧-Achse. Ihr
Brechungsindex 𝑛(𝑧) ist in 𝑧-Richtung variabel. Zeigen Sie, dass ein unter einem Winkel 𝜃0 in der 𝑦𝑧-Ebene aus Luft in die Platte einfallender Strahl an der Position 𝑧 in der Platte einen Winkel 𝜃(𝑧) besitzt, der die Beziehung 𝑛(𝑧) sin 𝜃(𝑧) = sin 𝜃0 erfüllt. Zeigen Sie weiter, dass der Strahl parallel zum einfallenden Strahl austritt. Hinweis: Verwenden Sie die Ergebnisse aus Aufgabe 1-2. Zeigen Sie, dass die Strahlhöhe 𝑦(𝑧) in der Platte die Differen2 tialgleichung (d𝑦∕ d𝑧)2 = (𝑛2 ∕ sin 𝜃 − 1)−1 erfüllt.
Zylinderkoordinaten und geben Sie Differentialgleichungen für 𝜌 und 𝜙 als Funktionen von 𝑧 an. Aufgabe 1-9: Die Strahltransfermatrix eines Linsensystems
Bestimmen Sie die Strahltransfermatrix eines optischen Systems aus einer dünnen Konvexlinse der Brennweite 𝑓 und einer dünnen Konkavlinse der Brennweite −𝑓 in einem Abstand 𝑓. Diskutieren Sie die Abbildungseigenschaften dieser zusammengesetzten Linse. Aufgabe 1-10: Die Strahltransfermatrix einer SelfocPlatte
Bestimmen Sie die Strahltransfermatrix einer SelfocPlatte [d. h. eines Materials mit parabolischem Index1 profil, 𝑛(𝑦) ≈ 𝑛0 (1 − 𝛼2 𝑦 2 )] der Dicke d . 2
Aufgabe 1-11: Eine Selfoc-Platte als periodisches System
Betrachten Sie den Verlauf paraxialer Strahlen in einer Selfoc-Platte senkrecht zur 𝑧-Achse. Sie können dieses System als periodisches System aus identischen miteinander verbundenen Platten der Dicke d betrachten. Verwenden Sie das Ergebnis von Aufgabe 1-10 und geben Sie die Stabilitätsbedingung für den Strahlverlauf an. Hängt die Bedingung von d ab? Aufgabe 1-12: Rekursionsbeziehung für einen Resonator aus ebenen Spiegeln
Betrachten Sie einen optischen Resonator aus ebenen Spiegeln im Abstand d als periodisches optisches System. Geben Sie die Strahltransfermatrix für die Grundeinheit dieses Systems an und zeigen Sie, dass 𝑏 = 1 und 𝐹 = 1 ist. Zeigen Sie, dass die quadratische Gleichung (1.67) in diesem Fall nur eine einzige Wurzel besitzt, sodass die Höhe des Strahls dann der Beziehung 𝛼 + 𝑚𝛽 mit Konstanten 𝛼 und 𝛽 folgt.
Aufgabe 1-8: Strahlverläufe in Fasern mit variablem Brechungsindex
Aufgabe 1-13: 4×4-Strahltransfermatrix für schief verlaufende Strahlen
Betrachten Sie eine Faser√ mit radial variablem Brechungsindex 𝑛(𝜌), 𝜌 = 𝑥2 + 𝑦 2 um die 𝑧-Achse. (𝜌, 𝜙, 𝑧) sei der Ortsvektor in Zylinderkoordinaten. Formulieren Sie die paraxiale Strahlengleichung (1.22) in
Matrixmethoden lassen sich verallgemeinern, um auch schief zur optischen Achse verlaufende paraxiale Strahlen in zylindersymmetrischen oder astigmatischen (nicht zylindersymmetrischen) Systemen beschreiben
27
28
1 Strahlenoptik
zu können. Ein Strahl, der die Ebene 𝑧 = 0 schneidet, wird allgemein durch vier Variablen beschrieben: die Koordinaten (𝑥, 𝑦) seiner Lage in der Ebene und die Winkel (𝜃𝑥 , 𝜃𝑦 ) seiner Projektionen in die 𝑥𝑧- und 𝑦𝑧Ebenen zur 𝑧-Achse. Auch der austretende Strahl ist durch vier Variablen charakterisiert, die linear mit den ursprünglichen Variablen verknüpft sind. In der paraxialen Näherung kann das System daher vollständig durch eine 4 × 4-Matrix beschrieben werden. (a) Geben x Sie die 4 × 4-Strahltransfermatrix einer Strecke d im Vakuum an. (b) Bestimmen Sie die 4 × 4-Strahltransfermatrix einer dünnen Zylinderlinse mit der Brennweite 𝑓, die entlang z der 𝑦-Achse liegt. Die Zylinderlinse hat eine Brennweite 𝑓 für Strahlen in der 𝑦𝑧-Ebene, bey sitzt aber keine Brechkraft für Strahlen in der 𝑥𝑧-Ebene.
Weiterführende Literatur Allgemeines
F. L. Pedrotti, L. M. Pedrotti, L. S. Pedrotti, Introduction to Optics, Cambridge University Press, 3. Aufl. 2018. T.-C. Poon, T. Kim, Engineering Optics with MATLAB, World Scientific, 2. Aufl. 2018. E. Hecht, Optik, de Gruyter, 7. Aufl. 2018. S. D. Gupta, N. Ghosh, A. Banerjee, Wave Optics: Basic Concepts and Contemporary Trends, CRC Press/Taylor & Francis 2016. B. D. Guenther, Modern Optics, Oxford University Press, 2. Aufl. 2015. C. A. DiMarzio, Optics for Engineers, CRC Press/Taylor & Francis 2011. M. Mansuripur, Classical Optics and Its Applications, Cambridge University Press, 2. Aufl. 2009. A. Walther, The Ray and Wave Theorie of Lenses, Cambridge University Press 1995, Paperback 2006. A. Siciliano, Optics: Problems and Solutions, World Scientific 2006. M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002. D. T. Moore (Hrsg.), Selected Papers on Gradient-Index Optics, SPIE Optical Engineering Press 1993 (Milestone Series Bd. 67). F. A. Jenkins, H. E. White, Fundamentals of Optics, McGraw-Hill 1937, 4. Aufl. 1991. R. W. Wood, Physical Optics, Macmillan, 3. Aufl. 1934; Optical Society of America 1988.
A. Sommerfeld, Lectures on Theoretical Physics: Optics, Academic Press, Paperback 1954. Geometrische Optik
P. D. Lin, Advanced Geometrical Optics, Springer 2017. V. N. Mahajan, Fundamentals of Geometrical Optics, SPIE Optical Engineering Press 2014. E. Dereniak, T. D. Dereniak, Geometrical and Trigonometric Optics, Cambridge University Press 2008. Yu. A. Kravtsov, Geometrical Optics in Engineering Physics, Alpha Science 2005. J. E. Greivenkamp, Field Guide to Geometrical Optics, SPIE Optical Engineering Press 2004. P. Mouroulis, J. Macdonald, Geometrical Optics and Optical Design, Oxford University Press 1997. Optische Systeme
D. Malacara-Hernandez, Z. Malacara-Hernandez, Handbook of Optical Design, CRC Press/Taylor & Francis, 3. Aufl. 2013. J. Sasian, Introduction to Aberrations in Optical Imaging Systems, Cambridge University Press 2013. K. J. Kasunic, Optical Systems Engineering, McGraw-Hill 2011. R. E. Fischer, B. Tadic-Galeb, P. R. Yoder, Optical System Design, McGraw-Hill, 2. Aufl. 2008. W. J. Smith, Modern Optical Engineering, McGraw-Hill, 4. Aufl. 2008. D. C. O’Shea, Elements of Modern Optical Design, Wiley 1985. Matrizenoptik
A. Gerrard, J. M. Burch, Introduction to Matrix Methods in Optics, Wiley 1975; Dover, Paperback 1994. J. W. Blaker, Geometric Optics: The Matrix Theory, Marcel Dekker 1971. Populäre und historische Darstellungen
R. J. Weiss, A Brief History of Light and Those that Lit the Way, World Scientific 1996. A. R. Hall, All was Light: An Introduction to Newton’s Opticks, Clarendon Press/Oxford University Press 1993. R. Kingslake, A History of the Photographic Lens, Academic Press 1989. M. I. Sobel, Light, University of Chicago Press 1987. A. I. Sabra, Theories of Light from Descartes to Newton, Cambridge University Press 1981. V. Ronchi, The Nature of Light: An Historical Survey, Harvard University Press 1970. W. H. Bragg, Universe of Light, Dover, Paperback 1959. I. Newton, Opticks or a Treatise of the Reflections, Refractions, Inflections & Colours of Light, 4. Aufl. 1704; Dover, Nachdruck 1979.
29
2 Wellenoptik
Wellenoptik Strahlenoptik
10
Wellenlänge (nm)
100
Abb. 2.2 Die Wellenoptik schließt die Strahlenoptik ein. Die Strahlenoptik ist der Grenzfall der Wellenoptik für kleine Wellenlängen.
EUV
200
baren Lichts viel kleiner ist als die Abmessungen alltäglicher Gegenstände, äußert sich die Wellennatur des Lichts in der Regel nur bei sehr sorgfältiger Beobachtung.
FUV
NUV MUV
390 300
0.76
NIR
FIR
MIR
2
20
300
Wellenlänge ( µm)
Licht breitet sich in Form von Wellen aus. Im Vakuum bewegt sich diese Welle mit einer konstanten Geschwindigkeit 𝑐0 = 3.0 × 108 m∕s (30 cm∕ns, 0.3 mm∕ps oder 0.3 μm∕fs). Wie Abb. 2.1 zeigt, umfasst der Bereich der optischen Wellenlängen drei Teilgebiete: infrarotes (0.76 bis etwa 300 μm), sichtbares (390 bis 760 nm) und ultraviolettes (10 bis 390 nm) Licht. Der entsprechende Bereich der optischen Frequenzen erstreckt sich von 1 THz im fernen Infrarot bis 30 PHz im äußersten Ultraviolett. Die Wellentheorie des Lichts schließt die Strahlentheorie ein (Abb. 2.2). Präziser ausgedrückt ist die Strahlenoptik der Grenzfall der Wellenoptik für unendlich kleine Wellenlängen. In der Praxis müssen die Wellenlängen aber keineswegs null sein, damit die Strahlenoptik von Nutzen ist. So lange die Lichtwellen sich um und durch Objekte bewegen, deren Abmessungen viel größer sind als die Wellenlänge des Strahls, reicht die Strahlenoptik zur Beschreibung der meisten optischen Erscheinungen völlig aus. Da die Wellenlänge des sicht-
1 EHz 1 nm
UV
violett 455
blau
grün 492
390
1 PHz
1 µm orange
597 gelb 577
622
rot 760
Wellenlänge (nm)
Wellenlänge (im Vakuum)
1 mm
IR
sichtbar
1 THz
Frequenz
Abb. 2.1 Optische Frequenzen und Wellenlängen. Der infrarote (IR) Bereich des Spektrums besteht aus dem nahen (NIR), mittleren (MIR) und fernen (FIR) Infrarot, der ultraviolette Bereich entsprechend aus dem nahen (NUV), mittleren (MUV), fernen (FUV) und extremen (EUV) Ultraviolett. Für Strahlung im extremen Ultraviolett ist auch die Bezeichnung „weiche Röntgenstrahlung“ (WXS) üblich. Zusammenfassend bezeichnet man das ferne und extreme Ultraviolett als Vakuum-UV. Die infraroten, sichtbaren und ultravioletten Bereiche des Spektrums nennt man alle „optisch“, da für sie ähnliche Komponenten (z. B. Linsen und Spiegel) eingesetzt werden können.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
30
2 Wellenoptik
In diesem Kapitel . . . In diesem Kapitel beschreiben wir Licht durch eine skalare Funktion, die Wellenfunktion, die eine Differentialgleichung zweiter Ordnung erfüllt, die man als Wellengleichung bezeichnet. Die Diskussion der physikalischen Bedeutung der Wellenfunktion wollen wir uns für die Behandlung der elektromagnetischen Optik in Kapitel 5 aufheben; dort werden wir sehen, dass die Wellenfunktion das Verhalten aller Komponenten des elektrischen und magnetischen Feldes beschreibt. Der als Wellenoptik bekannten skalaren Wellentheorie des Lichts liegen als Postulate die Wellengleichung sowie eine Beziehung zwischen der optischen Leistungsdichte und der Wellenfunktion zugrunde. Die Konsequenzen dieser einfachen Postulate sind vielfältig und weitreichend. Auf der Grundlage der Wellenoptik lassen sich viele optische Phänomene beschreiben, die nicht mehr im Geltungsbereich der Strahlenoptik liegen, beispielsweise Interferenz und Beugung, wie wir in diesem und den beiden folgenden Kapiteln zeigen werden. Auch die Wellenoptik hat jedoch ihre Grenzen. Sie liefert keine vollständige Beschreibung der Reflexion und Brechung von Licht an der Grenzfläche zwischen zwei Dielektrika, und sie kann auch keine optischen Erscheinungen erklären, die – wie beispielsweise Polarisationseffekte – eine Vektorformulierung erfordern. Diesen Fragen werden wir uns in den Kapiteln 5–10 zuwenden, genau wie auch der Frage, unter welchen Bedingungen die skalare Wellenoptik eine gute Näherung für die elektromagnetische Optik ist. Dieses Kapitel beginnt mit den Postulaten der Wellenoptik (Abschnitt 2.1). In den Abschnitten 2.2–2.5 betrachten wir monochromatische Wellen. Einfache Beispiele wie ebene oder Kugelwellen werden in Abschnitt 2.2 eingeführt. Abschnitt 2.3 zeigt, wie die Strahlenoptik aus der Wellenoptik folgt. Die Wechselwirkung optischer Wellen mit einfachen optischen Komponenten wie Spiegeln, Prismen, Linsen und verschiedenen Elementen mit variablem Brechungsindex wird in Abschnitt 2.4 untersucht. Interferenz, eine wichtige Manifestation der Wellennatur des Lichts, ist das Thema der Abschnitte 2.5 und 2.6, die polychromatisches und gepulstes Licht untersuchen.
2.1 Die Postulate der Wellenoptik 2.1.1
Die Wellengleichung
Licht breitet sich als Welle aus. Im Vakuum bewegt es sich mit einer Geschwindigkeit 𝑐0 . Ein homogenes transparentes Medium wie Glas ist durch eine einzige Konstante charakterisiert, seinen Brechungsindex 𝑛 (≥ 1). In einem Medium mit dem Brechungsindex 𝑛 bewegt sich die Lichtwelle mit einer verringerten Geschwindigkeit 𝑐=
𝑐0 . 𝑛
(2.1)
Mathematisch wird eine optische Welle durch eine reelle Funktion 𝑢(r, 𝑡) des Ortes r = (𝑥, 𝑦, 𝑧) und der Zeit 𝑡 beschrieben, die Wellenfunktion. Sie gehorcht einer Differentialgleichung zweiter Ordnung, der Wellengleichung ∇2 𝑢 −
1 𝜕2 𝑢 =0, 𝑐2 𝜕𝑡2
(2.2)
in der ∇2 den Laplaceoperator bezeichnet, der in kartesischen Koordinaten durch ∇2 = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 + 𝜕 2 ∕𝜕𝑧2 gegeben ist. Jede Funktion, die Gl. (2.2) erfüllt, ist eine mögliche optische Welle. Da die Wellengleichung linear ist, gilt das Superpositionsprinzip: Wenn 𝑢1 (r, 𝑡) und 𝑢2 (r, 𝑡) gültige optische Wellen sind, ist auch 𝑢(r, 𝑡) = 𝑢1 (r, 𝑡) + 𝑢2 (r, 𝑡) eine gültige optische Welle. An der Grenzfläche zwischen zwei verschiedenen Medien verändert sich die Wellenfunktion auf eine Weise, die von den Brechungsindizes der beiden Medien anhängt. Die Gesetze, nach denen diese Veränderung erfolgt, hängen jedoch von der physikalischen Bedeutung der Wellenfunktion ab. Wie wir in Kapitel 5 sehen werden, beschreibt die Wellenfunktion eine Komponente des elektromagnetischen Feldes. Um dem Brechungsindex eine physikalische Grundlage zu geben, müssen wir daher auf die elektromagnetische Optik (Abschnitt 5.5.2) zurückgreifen. Die Wellengleichung ist näherungsweise auch auf Medien anwendbar, deren Brechungsindex vom Ort abhängt, so lange dessen Veränderung innerhalb einer Wellenlänge der betrachteten Strahlung nur gering ist. In solchen Fällen bezeichnet man das Medium als lokal homogen. Für derartige Medien ersetzt man 𝑛 in Gl. (2.1) und 𝑐 in Gl. (2.2) einfach durch die entsprechenden ortsabhängigen Funktionen 𝑛(r) und 𝑐(r).
2.2 Monochromatische Wellen
Intensität, Leistung und Energie
Die optische Intensität 𝐼(r, 𝑡), d. h. die optische Leistung pro Flächeneinheit (mit der Dimension W∕cm2 ), ist proportional zum Mittelwert des Quadrats der Wellenfunktion: ⟨ ⟩ 𝐼(r, 𝑡) = 2 𝑢2 (r, 𝑡) . (2.3) Das Symbol ⟨⋯⟩ bezeichnet die Mittelung über einen Zeitraum, der viel länger ist als eine Periodendauer der Strahlung, aber viel kürzer als andere in diesem Zusammenhang auftretende Zeiträume (z. B. die Dauer des Lichtpulses). Die Periodendauer einer optischen Welle ist extrem kurz: für Licht der Wellenlänge 600 nm beträgt sie beispielsweise 2 × 10−15 s = 2 fs. Diesen Gedanken werden wir in Abschnitt 2.6 weiter verfolgen. Die Größe 𝐼(r, 𝑡) wird häufig auch als Strahlungsdichte bezeichnet. Obwohl wir die physikalische Bedeutung der Wellenfunktion 𝑢(r, 𝑡) nicht explizit angegeben haben, beschreibt Gl. (2.3) ihren Zusammenhang mit einer messbaren physikalischen Größe – der Intensität. Die Definition der Wellenfunktion und ihre Verknüpfung mit der Intensität enthalten ein gewisses Maß an Willkür. Beispielsweise hätten wir Gl. (2.3) ohne den √ Faktor 2 schreiben und dafür die Wellenfunktion mit 2 multiplizieren können, ohne dadurch die Intensität zu verändern. Die Wahl von Gl. (2.3) mit dem Faktor 2 wird sich jedoch später als vorteilhaft erweisen. Die optische Leistung P(𝑡) (in W), die auf eine senkrecht zur Ausbreitungsrichtung des Lichts liegende Fläche A auftrifft, ist die integrierte Intensität P (𝑡) = ∫ 𝐼(r, 𝑡) d A .
(2.4)
A
Die Energie (in J), die eine Lichtwelle in einer gegebenen Zeit überträgt, ist das Integral der optischen Leistung über das Zeitintervall.
Sowohl die Amplitude als auch die Phase hängen im Allgemeinen vom Ort ab, aber an jedem Ort ist die Wellenfunktion eine harmonische Funktion der Zeit mit der Frequenz 𝜈. Die Frequenzen optischer Wellen liegen im Bereich von 3 × 1011 bis 3 × 1016 Hz, wie Abb. 2.1 illustriert.
2.2.1 Komplexe Darstellung und die Helmholtzgleichung Komplexe Wellenfunktionen
Es ist oft nützlich, die reelle Wellenfunktion 𝑢(r, 𝑡) aus Gl. (2.5) durch eine komplexe Funktion 𝑈(r, 𝑡) = a(r) exp[i𝜑(r)] exp(2πi𝜈𝑡)
(2.6)
darzustellen, sodass 1
𝑢(r, 𝑡) = Re{𝑈(r, 𝑡)} = [𝑈(r, 𝑡) + 𝑈 ∗ (r, 𝑡)] 2
(2.7)
ist, wobei das Symbol ∗ die komplex Konjugierte der entsprechenden Größe bedeutet. Die Funktion 𝑈(r, 𝑡), die komplexe Wellenfunktion, beschreibt die Welle vollständig; die Wellenfunktion 𝑢(r, 𝑡) ist einfach ihr Realteil. Wie die Wellenfunktion 𝑢(r, 𝑡) muss auch die komplexe Wellenfunktion 𝑈(r, 𝑡) die Wellengleichung ∇2 𝑈 −
1 𝜕2 𝑈 =0 𝑐2 𝜕𝑡2
(2.8)
erfüllen. Beide Funktionen genügen denselben Randbedingungen. Die komplexe Amplitude
Gleichung (2.6) kann auch als 𝑈(r, 𝑡) = 𝑈(r) exp(2πi𝜈𝑡)
(2.9)
geschrieben werden, wobei der zeitunabhängige Faktor 𝑈(r) = a(r) exp[i𝜑(r)] als die komplexe Amplitude der Welle bezeichnet wird. Die Wellenfunktion 𝑢(r, 𝑡) hängt daher gemäß 𝑢(r, 𝑡) = Re{𝑈(r) exp(2πi𝜈𝑡)}
2.2 Monochromatische Wellen
1
Eine monochromatische Welle wird wie in Abb. 2.3(a) gezeigt durch eine Wellenfunktion mit einer harmonischen Zeitabhängigkeit beschrieben, 𝑢(r, 𝑡) = a(r) cos[2π 𝜈𝑡 + 𝜑(r)] , mit a(r) 𝜑(r) 𝜈 𝜔 T
= Amplitude = Phase = Frequenz (1/s bzw. Hz) = 2π 𝜈 = Kreisfrequenz (rad/s bzw. s−1 ) = 1∕𝜈 = 2π∕𝜔 = Periode (s) .
(2.5)
= [𝑈(r) exp(2πi𝜈𝑡) + 𝑈 ∗ (r) exp(−2πi𝜈𝑡)] 2
(2.10) mit der komplexen Amplitude zusammen. An einem festen Ort r ist die komplexe Amplitude 𝑈(r) eine komplexe Variable [Abb. 2.3(b)], deren Betrag |𝑈(r)| = a(r) die Amplitude der Welle angibt und deren Argument arg{𝑈(r)} = 𝜑(r) ihre Phase beschreibt. Die komplexe Wellenfunktion 𝑈(r, 𝑡) aus Abb. 2.3(c) wird graphisch durch einen Zeiger wiedergegeben, der mit der Kreisfrequenz 𝜔 = 2π 𝜈 rad∕s rotiert. Sein Anfangswert zur Zeit 𝑡 = 0 ist die komplexe Amplitude 𝑈(r).
31
32
2 Wellenoptik
u(t)
Im{U}
1/ν
φ/ω
ɑ
ɑ t
0 (a)
Im{U} ω φ
φ
Re{U}
(b)
Re{U}
(c)
Abb. 2.3 Darstellungen einer monochromatischen Welle an einem festen Ort r: (a) Die Wellenfunktion u(t ) ist eine harmonische Funktion der Zeit; (b) die komplexe Amplitude U = a exp(i𝜑) ist ein konstanter Zeiger; (c) die komplexe Wellenfunktion U(t ) = U exp(2πi𝜈t ) ist ein mit der Kreisfrequenz 𝜔 = 2π 𝜈 rad∕s rotierender Zeiger.
Die Helmholtzgleichung
Wenn wir 𝑈(r, 𝑡) = 𝑈(r) exp(2πi𝜈𝑡) aus Gl. (2.9) in die Wellengleichung (2.8) einsetzen, erhalten wir eine Differentialgleichung für die komplexe Amplitude 𝑈(r), ∇2 𝑈 + 𝑘2 𝑈 = 0 ,
(2.11)
die unter dem Namen Helmholtzgleichung bekannt ist, wobei 𝑘=
2π 𝜈 𝜔 = 𝑐 𝑐
(2.12)
als Wellenzahl bezeichnet wird. Unterschiedliche Lösungen ergeben sich aus unterschiedlichen Randbedingungen. Die optische Intensität
Die optische Intensität erhalten wir, wenn wir Gl. (2.5) in Gl. (2.3) einsetzen:
und 𝜕𝜑∕𝜕𝑧 in einem kartesischen Koordinatensystem). Er beschreibt die Richtung, in der sich die Phase am stärksten (schnellsten) ändert. Zusammenfassung
• Eine monochromatische Welle der Frequenz 𝜈 wird durch eine komplexe Wellenfunktion 𝑈(r, 𝑡) = 𝑈(r) exp(2πi𝜈𝑡) beschrieben, die die Wellengleichung erfüllt. • Die komplexe Amplitude 𝑈(r) erfüllt die Helmholtzgleichung; ihr Betrag |𝑈(r)| und ihr Argument arg{𝑈(r)} sind die Amplitude und Phase der Welle. Die optische Intensität ist 𝐼(r) = |𝑈(r)|2 . Die Wellenfronten sind Flächen konstanter Phase, 𝜑(r) = arg{𝑈(r)} = 2π 𝑞 (𝑞 = ganzzahlig). • Die Wellenfunktion 𝑢(r, 𝑡) ist der Realteil der komplexen Wellenfunktion 𝑢(r, 𝑡) = Re{𝑈(r, 𝑡)}. Auch die Wellenfunktion erfüllt die Wellengleichung.
2𝑢2 (r, 𝑡) = 2a2 (r) cos2 [2π 𝜈𝑡 + 𝜑(r)] = |𝑈(r)|2 {1 + cos (2 [2π 𝜈𝑡 + 𝜑(r)])} . (2.13) Wenn wir Gl. (2.13) über ein Zeitintervall mitteln, das länger ist als eine Periodendauer 1∕𝜈, dann verschwindet der zweite Term und wir erhalten 𝐼(r) = |𝑈(r)|2 .
2.2.2
Einfache Wellen
Die einfachsten Lösungen der Helmholtzgleichung in einem homogenen Medium sind die ebene Welle und die Kugelwelle.
(2.14) Ebene Wellen
Die optische Intensität einer monochromatischen Welle ist gleich dem Betragsquadrat der komplexen Amplitude. Die Intensität einer monochromatischen Welle ändert sich zeitlich nicht. Wellenfronten
Wellenfronten oder Wellenflächen sind Flächen gleicher Phase: 𝜑(r) = konstant. Die Konstante wird oft gleich einem Vielfachen von 2π gewählt, sodass 𝜑(r) = 2π 𝑞 mit ganzzahligem 𝑞 gilt. Die Normale zur Wellenfront am Ort r ist parallel zum Gradientenvektor ∇𝜑(r) (einem Vektor mit den Komponenten 𝜕𝜑∕𝜕𝑥, 𝜕𝜑∕𝜕𝑦
Eine ebene Welle hat die komplexe Amplitude [ ] 𝑈(r) = 𝐴 exp(−ik ⋅ r) = 𝐴 exp −i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧) , (2.15) wobei 𝐴 eine komplexe Konstante ist, die komplexe Einhüllende, und k = (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) der Wellenvektor. Wenn wir Gl. (2.15) in die Helmholtzgleichung (2.11) einsetzen, finden wir die Beziehung 𝑘𝑥2 + 𝑘𝑦2 + 𝑘𝑧2 = 𝑘2 , d. h. der Betrag des Wellenvektors k ist die Wellenzahl 𝑘. Da die Phase der Welle gleich arg{𝑈(r)} = arg{𝐴} − k ⋅ r ist, gilt für die Flächen konstanter Phase (die Wellenfronten) k ⋅ r = 𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧 = 2π 𝑞 + arg{𝐴} mit
2.2 Monochromatische Wellen
λ
x
u(x, z, t1) u(x, z, t) z
x
1/ ν
u(x, z, t2)
t
z
ganzzahligem 𝑞. Diese Gleichung beschreibt parallele Ebenen, die senkrecht auf dem Wellenvektor k stehen (daher der Name „ebene Welle“). Aufeinander folgende Ebenen sind durch einen Abstand 𝜆 = 2π∕𝑘 voneinander getrennt, sodass 𝜆=
𝑐 𝜈
(2.16)
gilt, wobei 𝜆 als Wellenlänge bezeichnet wird. Eine ebene Welle besitzt eine ortsunabhängige konstante Intensität 𝐼(r) = |𝐴|2 und überträgt daher eine unendliche Leistung. Offensichtlich ist eine solche Welle nur eine Idealisierung, da sie überall und zu jeder Zeit existiert. Wenn die 𝑧-Achse in Richtung des Wellenvektors k liegt, ist 𝑈(r) = 𝐴 exp(−i𝑘𝑧), und die entsprechende Wellenfunktion nach Gl. (2.10) lautet 𝑢(r, 𝑡) = |𝐴| cos [2π 𝜈𝑡 − 𝑘𝑧 + arg{𝐴}] = |𝐴| cos [2π 𝜈(𝑡 − 𝑧∕𝑐) + arg{𝐴}] .
(2.17)
Die Wellenfunktion ist somit zeitlich periodisch mit der Periode 1∕𝜈 und räumlich periodisch mit der Periode 2π∕𝑘, die gleich der Wellenlänge 𝜆 ist (siehe Abb. 2.4). Da die Phase arg{𝑈(r, 𝑡)} = 2π 𝜈(𝑡 − 𝑧∕𝑐) + arg{𝐴} der komplexen Wellenfunktion sich zeitlich und räumlich als Funktion der Variable 𝑡 − 𝑧∕𝑐 ändert (siehe Abb. 2.4), wird 𝑐 als Phasengeschwindigkeit der Welle bezeichnet. In einem Medium mit dem Brechungsindex 𝑛 ist die Phasengeschwindigkeit der Welle 𝑐 = 𝑐0 ∕𝑛 und ihre Wellenlänge 𝜆 = 𝑐∕𝜈 = 𝑐0 ∕𝑛𝜈, sodass 𝜆 = 𝜆0 ∕𝑛 ist, wenn 𝜆0 = 𝑐0 ∕𝜈 die Wellenlänge im Vakuum bedeutet. Für eine gegebene Frequenz 𝜈 wird folglich die Wellenlänge in einem Medium um einen Faktor 𝑛 relativ zur Vakuumwellenlänge verringert. Die Wellenzahl 𝑘 = 2π∕𝜆 vergrößert sich somit um den Faktor 𝑛 relativ zur Wellenzahl (𝑘0 = 2π∕𝜆0 ) im Vakuum. Wenn eine monochromatische Welle sich durch Medien mit unterschiedlichen Brechungsindizes ausbreitet, bleibt ihre Frequenz stets konstant; ihre Geschwindigkeit, Wel-
Abb. 2.4 Eine ebene Welle, die sich in z-Richtung ausbreitet, ist eine periodische Funktion von z mit der räumlichen Periode 𝜆 und eine periodische Funktion von t mit der zeitlichen Periode 1∕𝜈. Die Flächen konstanter Phase (Wellenfronten) bilden einen Satz paralleler Ebenen senkrecht zur z-Achse. Die in Abb. 2.1 angegebenen Wellenlängen gelten für das Vakuum (n = 1, 𝜆 = 𝜆0 ).
lenlänge und Wellenzahl ändern sich jedoch: 𝑐=
𝑐0 𝑦 , 𝑛
𝜆=
𝜆0 , 𝑛
𝑘 = 𝑛𝑘0 .
(2.18)
Kugelwellen
Eine andere einfache Lösung der Helmholtzgleichung (in Kugelkoordinaten) ist die Kugelwelle 𝑈(r) =
𝐴0 exp(−i𝑘𝑟) , 𝑟
(2.19)
wobei 𝑟 den Abstand vom Ursprung bedeutet, 𝑘 = 2π 𝜈∕𝑐 = 𝜔∕𝑐 die Wellenzahl und 𝐴0 eine Konstante ist. Die Intensität 𝐼(r) = |𝐴0 |2 ∕𝑟 2 ist umgekehrt proportional zum Quadrat des Abstands. Wenn wir der Einfachheit halber arg{𝐴0 } = 0 setzen, sind die Wellenfronten einfach die Flächen 𝑘𝑟 = 2π 𝑞 oder 𝑟 = 𝑞𝜆 mit ganzzahligem 𝑞. Dabei handelt es sich um konzentrische Kugelschalen in einem radialen Abstand von 𝜆 = 2π∕𝑘 voneinander, die sich radial mit der Phasengeschwindigkeit 𝑐 ausbreiten (Abb. 2.5). Eine vom Ort r0 ausgehende Kugelwelle besitzt eine komplexe Amplitude 𝑈(r) = (𝐴0 ∕|r − r0 |) exp(−i𝑘 |r − r0 |). Ihre Wellenfronten sind Kugeln um r0 . Eine Welle mit der komplexen Amplitude 𝑈(r) = (𝐴0 ∕𝑟) exp(+i𝑘𝑟) ist eine Kugelwelle, die sich nach innen (auf den Ursprung zu) ausbreitet anstatt nach außen (vom Ursprung weg). x
Abb. 2.5 Querschnitt der Wellenfronten einer Kugelwelle.
z
33
34
2 Wellenoptik
Die Fresnelnäherung für Kugelwellen: Parabolwellen
Wir betrachten eine (vom Punkt r = 0 ausgehende) Kugelwelle am Ort r = (𝑥, 𝑦, 𝑧), der hinreichend nahe an der 𝑧-Achse liegt, aber weit vom Ursprung entfernt, √ sodass 𝑥2 + 𝑦 2 ≪ 𝑧 gilt. Die paraxiale Näherung der Strahlenoptik (Abschnitt 1.2) wäre hier zulässig, wenn es sich um Punkte auf Lichtstrahlen handelte, die vom Ursprung ausgingen. Wir schreiben 𝜃2 = (𝑥2 + 𝑦 2 )∕𝑧2 ≪ 1 und verwenden eine Taylorentwicklung für den Abstand vom Ursprung: 𝑟=
√
√ 𝜃2 𝜃4 − + ⋯) 𝑥2 + 𝑦 2 + 𝑧2 = 𝑧 1 + 𝜃2 = 𝑧 (1 + 2 8 ≈ 𝑧 (1 +
𝑥2 + 𝑦 2 𝜃2 . )=𝑧+ 2 2𝑧 (2.20)
Dieses Resultat, 𝑟 ≈ 𝑧 + (𝑥2 + 𝑦 2 )∕2𝑧, setzen wir nun in die Phase von 𝑈(r) in Gl. (2.19) ein. Für den Betrag können wir sogar den weniger genauen Ausdruck 𝑟 ≈ 𝑧 einsetzen, da der Betrag weniger empfindlich auf Fehler reagiert als die Phase. Das Ergebnis ist als Fresnelnäherung einer Kugelwelle bekannt: 𝑈(r) ≈
𝐴0 𝑥2 + 𝑦 2 exp(−i𝑘𝑧) exp [−i𝑘 ]. 𝑧 2𝑧
(2.21)
Diese Näherung spielt eine bedeutende Rolle, wenn es darum geht, die Theorie des Durchgangs von optischen Wellen durch Öffnungen (Beugung), die in Kapitel 4 diskutiert wird, zu vereinfachen. Wir können uns vorstellen, dass die komplexe Amplitude in Gl. (2.21) eine ebene Welle 𝐴0 exp(−i𝑘𝑧) darstellt, die mit dem Faktor (1∕𝑧) exp[−i𝑘(𝑥2 + 𝑦 2 )∕2𝑧] moduliert wird, in dem die Phase 𝑘(𝑥2 + 𝑦 2 )∕2𝑧 enthalten ist. Dieser Phasenfaktor verformt die ebenen Wellenfronten der ebenen Welle zu Parabelflächen (Abb. 2.6), da die Gleichung für ein Rotationsparaboloid gerade (𝑥2 + 𝑦 2 )∕𝑧 = konstant ist. In diesem Bereich wird die Kugelwelle gut durch eine Parabolwelle beschrieben. x
parabolisch
2 𝑁F 𝜃m ≪1, 4
eben
Abb. 2.6 An Orten nahe der z-Achse und in hinreichend großer Entfernung vom Ursprung kann eine Kugelwelle durch eine Parabolwelle angenähert werden. Für sehr große Entfernungen vom Ursprung geht die Kugelwelle in eine ebene Welle über.
(2.22)
wobei 𝜃m = 𝑎∕𝑧 der Maximalwinkel ist und 𝑁F =
𝑎2 𝜆𝑧
(2.23)
als Fresnelzahl bezeichnet wird. Übung 2-1: Die Gültigkeit der Fresnelnäherung
Bestimmen Sie den Radius eines Kreises, innerhalb dessen eine Kugelwelle mit der Wellenlänge 𝜆 = 633 nm, die in einer Entfernung von 1 m entspringt, durch eine Parabolwelle beschrieben werden darf. Bestimmen Sie den Maximalwinkel 𝜃m und die Fresnelzahl 𝑁F .
2.2.3
Paraxiale Wellen
Eine Welle heißt paraxial, wenn die Normalen auf ihren Wellenfronten paraxiale Strahlen sind. Eine Möglichkeit zur Konstruktion einer paraxialen Welle ist, von einer ebenen Welle 𝐴 exp(−i𝑘𝑧) auszugehen, diese als „Träger“welle zu betrachten und ihre komplexe Einhüllende 𝐴 zu verändern oder zu modulieren, sodass sie eine langsam variierende Funktion 𝐴(r) des Ortes wird. Die komplexe Amplitude der modulierten Welle ist dann 𝑈(r) = 𝐴(r) exp(−i𝑘𝑧) .
z
sphärisch
Für sehr große 𝑧 geht der parabolische Phasenfaktor in Gl. (2.21) gegen null, sodass der Phasenfaktor einfach 𝑘𝑧 wird. Da der Betrag von 𝐴0 ∕𝑧 nur langsam mit 𝑧 variiert, wird aus der Kugelwelle in diesem Grenzfall eine ebene Welle exp(−i𝑘𝑧), wie Abb. 2.6 zeigt. Die Bedingung für die Gültigkeit der Fresnelnäherung ist jedoch nicht einfach 𝜃2 ≪ 1. Obwohl der dritte Term der Reihenentwicklung, 𝜃4 ∕8, im Vergleich zu den ersten beiden Termen sehr klein ist, kann er nach Multiplikation mit 𝑘𝑧 doch in der Größenordnung von π liegen. Die Näherung gilt daher nur für 𝑘𝑧𝜃4 ∕8 ≪ π oder (𝑥2 + 𝑦 2 )2 ≪ 4𝑧3 𝜆. Für alle Punkte (𝑥, 𝑦) innerhalb eines Kreises mit Radius 𝑎 um die 𝑧-Achse lautet die Bedingung für die Gültigkeit daher 𝑎4 ≪ 4𝑧3 𝜆 oder
(2.24)
Die Variation der Einhüllenden 𝐴(r) und ihrer Ableitung als Funktion des Ortes 𝑧 muss innerhalb einer Wellenlänge 𝜆 = 2π∕𝑘 hinreichend klein sein, sodass die Welle näherungsweise ihren Charakter als ebene Welle behält. In Abb. 2.7(a) ist die Wellenfunktion 𝑢(r, 𝑡) = |𝐴(r)| cos[2π 𝜈𝑡 − 𝑘𝑧 + arg{𝐴(r)}] einer paraxialen Welle als Funktion von 𝑧 bei 𝑡 = 0 und 𝑥 = 𝑦 = 0 dargestellt. Sie ist eine einfache sinusförmige Funktion von 𝑧 mit
2.3 Die Beziehung zwischen Wellenoptik und Strahlenoptik
u(0,0,z)
x
λ
Wellenfronten Strahlen
A
z
z
(a)
(b)
Abb. 2.7 (a) Die Wellenfunktion einer paraxialen Welle für Punkte auf der z-Achse als Funktion des axialen Abstands z. (b) Die Wellenfronten und ihre Normalen einer paraxialen Welle in der xz-Ebene.
der Amplitude |𝐴(0, 0, 𝑧)| und der Phase arg{𝐴(0, 0, 𝑧)}, die beide langsam mit 𝑧 variieren. Da sich die Phase arg{𝐴(𝑥, 𝑦, 𝑧)} innerhalb einer Wellenlänge nur wenig ändert, sind die ebenen Wellenfronten 𝑘𝑧 = 2π 𝑞 der Trägerwelle nur leicht gekrümmt und die Normalen sind paraxiale Strahlen [Abb. 2.7(b)]. Die paraxiale Helmholtzgleichung
Damit die paraxiale Welle aus Gl. (2.24) die Helmholtzgleichung (2.11) erfüllt, muss die komplexe Einhüllende 𝐴(r) eine andere Differentialgleichung erfüllen, die man erhält, wenn man Gl. (2.24) in Gl. (2.11) einsetzt. Die Annahme, dass 𝐴(r) nur langsam mit 𝑧 variiert, bedeutet, dass die Änderung Δ𝐴 innerhalb eines Intervalls Δ𝑧 = 𝜆 viel kleiner ist als 𝐴 selbst, d. h. es gilt Δ𝐴 ≪ 𝐴. Diese komplexe Ungleichung gilt unabhängig für Realund Imaginärteil. Da Δ𝐴 = (𝜕𝐴∕𝜕𝑧)Δ𝑧 = (𝜕𝐴∕𝜕𝑧)𝜆 ist, folgt 𝜕𝐴∕𝜕𝑧 ≪ 𝐴∕𝜆 = 𝐴𝑘∕2π, und daher 𝜕𝐴 ≪ 𝑘𝐴 . 𝜕𝑧
(2.25)
Auch die Ableitung 𝜕𝐴∕𝜕𝑧 selbst muss innerhalb des Intervalls 𝜆 langsam variieren, sodass 𝜕 2 𝐴∕𝜕𝑧2 ≪ 𝑘 𝜕𝐴∕𝜕𝑧 ist, woraus 𝜕2 𝐴 ≪ 𝑘2 𝐴 𝜕𝑧2
(2.26)
folgt. Wenn wir nun Gl. (2.24) in Gl. (2.11) einsetzen und 𝜕 2 𝐴∕𝜕𝑧2 gegen 𝑘𝜕𝐴∕𝜕𝑧 oder 𝑘2 𝐴 vernachlässigen, erhalten wir eine partielle Differentialgleichung für die komplexe Einhüllende 𝐴(r): ∇2t 𝐴 − i2𝑘
𝜕𝐴 =0, 𝜕𝑧
(2.27)
wobei ∇2t = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 der transversale Laplaceoperator ist. Gleichung (2.27) ist die Näherung der langsam variierenden Einhüllenden für die Helmholtzgleichung, die wir im Folgenden einfach die paraxiale
Helmholtzgleichung nennen werden. Sie hat eine gewissen Ähnlichkeit mit der Schrödingergleichung der Quantenphysik [siehe Gl. (14.1)]. Die einfachste Lösung der paraxialen Helmholtzgleichung ist eine Parabolwelle (Übung 2-2), die wiederum die paraxiale Näherung einer Kugelwelle ist. Eine der interessantesten und nützlichsten Lösungen ist jedoch der Gaußstrahl, dem Kapitel 3 gewidmet ist. Übung 2-2: Die Parabolwelle und der Gaußstrahl
Verifizieren Sie, dass eine Parabolwelle mit der komplexen Einhüllenden 𝐴(r) = (𝐴0 ∕𝑧) exp[−i𝑘(𝑥2 + 𝑦 2 )∕2𝑧] [siehe Gl. (2.21)] die paraxiale Helmholtzgleichung (2.27) erfüllt. Zeigen Sie weiter, dass auch die Welle mit der komplexen Einhüllenden 𝐴(r) = [𝐴1 ∕𝑞(𝑧)] exp[−i𝑘(𝑥2 + 𝑦 2 )∕2𝑞(𝑧)] mit 𝑞(𝑧) = 𝑧 + i𝑧0 und einer Konstanten 𝑧0 die paraxiale Helmholtzgleichung erfüllt. Diese Welle, der sogenannte Gaußstrahl, wird in Kapitel 3 ausführlicher behandelt. Skizzieren Sie die Intensität des Gaußstrahls in der Ebene 𝑧 = 0.
2.3 Die Beziehung zwischen Wellenoptik und Strahlenoptik Als Nächstes wollen wir zeigen, dass sich die Strahlenoptik als Grenzfall der Wellenoptik für 𝜆0 → 0 ergibt. Dazu betrachten wir eine monochromatische Welle mit der Vakuumwellenlänge 𝜆0 in einem Medium mit dem Brechungsindex 𝑛(r), der hinreichend langsam mit dem Ort variieren soll, sodass das Medium als lokal homogen betrachtet werden kann. Wir schreiben die komplexe Amplitude in Gl. (2.9) in der Form 𝑈(r) = a(r) exp[−i𝑘0 S (r)] ,
(2.28)
wobei a(r) ihr Betrag ist, −𝑘0 S (r) ihre Phase und 𝑘0 = 2π∕𝜆0 die Vakuumwellenzahl. Wir nehmen an, dass a(r) so langsam vom Ort r abhängt, dass die Amplitude in-
35
36
2 Wellenoptik
(a)
(b)
Abb. 2.8 (a) Die Strahlen der Strahlenoptik stehen senkrecht auf den Wellenfronten der Wellenoptik (siehe auch Abb. 1.37). (b) Die Wirkung einer Linse auf Strahlen und Wellenfronten.
nerhalb einer Wellenlänge 𝜆0 als konstant angenommen werden kann. Die Wellenfronten sind die Oberflächen S (r) = konstant und die Wellenfrontnormalen zeigen in Richtung des Gradientenvektors ∇S . In der Umgebung eines gegebenen Punkts r0 kann die Welle lokal als ebene Welle mit der Amplitude a(r0 ) angesehen werden, deren Wellenvektor k mit dem Betrag 𝑘 = 𝑛(r0 )𝑘0 in die Richtung des Gradientenvektors ∇S bei r0 zeigt. An anderen Orten liegt eine lokal ebene Welle mit einer anderen Amplitude und einem anderen Wellenvektor vor. In dem Kapitel über Strahlenoptik hatten wir gezeigt, dass die Strahlen normal zu den Flächen gleicher Funktionswerte einer Funktion S (r) stehen, die als Eikonal bezeichnet wird (siehe Abschnitt 1.3.3). Daher können wir die lokalen Wellenvektoren (Wellenfrontnormalen) in der Wellenoptik mit den Strahlen der Strahlenoptik identifizieren, und wir stellen fest, dass die Funktion S (r), die proportional zur Phase der Welle ist, nichts anderes ist als das Eikonal der Strahlenoptik (Abb. 2.8). Diese Verbindung besitzt auch eine formale mathematische Grundlage, wie wir in Kürze zeigen werden. Aufgrund dieser Analogie können wir die Strahlenoptik verwenden, um näherungsweise die Wirkungen optischer Komponenten auf die Wellenfrontnormalen zu bestimmen, wie es in Abb. 2.8 gezeigt ist.
Wenn a über eine Entfernung 𝜆0 nur wenig variieren soll, dann muss 𝜆02 ∇2 a∕a ≪ 1 gelten, sodass der zweite Term auf der rechten Seite im Grenzfall 𝜆0 → 0 vernachlässigt werden kann. Folglich ist
2.3.1 Die Eikonalgleichung
In dem folgenden Abschnitt werden wir die Wirkung optischer Komponenten wie Spiegel, transparenten Platten, Prismen oder Linsen auf optische Wellen untersuchen.
Wenn wir Gl. (2.28) in die Helmholtzgleichung Gl. (2.11) einsetzen, erhalten wir [ ] [ ] 𝑘02 𝑛2 − |∇S |2 a + ∇2 a − i𝑘0 2∇S ⋅ ∇a + a∇2 S = 0 , (2.29) wobei a = a(r) und S = S (r) ist. Real- und Imaginärteil der linken Seite von Gl. (2.29) müssen beide verschwinden. Wenn wir den Realteil gleich null setzen und 𝑘0 = 2π∕𝜆0 verwenden, so folgt 2
|∇S |2 = 𝑛2 + (
𝜆0 ∇2 a ) . 2π a
(2.30)
|∇S |2 ≈ 𝑛2 .
(2.31)
Das ist die Eikonalgleichung (1.38), die als Hauptpostulat der Strahlenoptik angesehen werden kann (das fermatsche Prinzip kann aus der Eikonalgleichung abgeleitet werden und umgekehrt). Die skalare Funktion S (r), die in der Wellenoptik proportional zur Phase der Welle ist, ist also gerade das Eikonal der Strahlenoptik. Dies steht auch mit der Beobachtung im Einklang, dass S (rB ) − S (rA ) in der Strahlenoptik gleich der optischen Weglänge zwischen den Punkten rA und rB ist. Die Eikonalgleichung ergibt sich als Grenzfall der Helmholtzgleichung für 𝜆0 → 0. Für eine gegebene Funktion 𝑛(r) können wir S(r) aus der Eikonalgleichung bestimmen. Wenn wir den Imaginärteil von Gl. (2.29) null setzen, erhalten wir eine Beziehung zwischen a und S , aus der wir die Wellenfunktion bestimmen können.
2.4 Einfache optische Komponenten
2.4.1
Reflexion und Brechung
Reflexion an einem ebenen Spiegel
Eine ebene Welle mit dem Wellenvektor k1 fällt auf einen ebenen Spiegel, der im Vakuum in der Ebene 𝑧 = 0 liegt; dabei entsteht eine reflektierte ebene Welle mit dem Wellenvektor k2 . Die Einfalls- und Ausfallswinkel sind 𝜃1 und 𝜃2 (Abb. 2.9). Die Summe der beiden Wellen erfüllt die Helmholtzgleichung, wenn ihre Wellenzahlen übereinstimmen, d. h. wenn 𝑘1 = 𝑘2 = 𝑘0 ist. An der
2.4 Einfache optische Komponenten
x k2 θ2
z
θ1 k1
Abb. 2.9 Reflexion einer ebenen Welle an einem ebenen Spiegel. Aus der Bedingung, dass die Phasen beider Wellen an der Oberfläche des Spiegels gleich sein müssen, folgt, dass der Einfallswinkel 𝜃1 gleich dem Ausfallswinkel 𝜃2 sein muss.
Oberfläche des Spiegels müssen bestimmte Randbedingungen erfüllt sein. Da diese Bedingungen für alle Punkte (𝑥, 𝑦) identisch sind, müssen auch die Wellenfronten der beiden Wellen identisch sein, also k1 ⋅ r = k2 ⋅ r für alle r = (𝑥, 𝑦, 0) .
(2.32)
Diese Phasenbedingung kann auch als Bedingung für die Gleichheit der tangentialen Komponenten der beiden Wellenvektoren in der Spiegelebene aufgefasst werden. Wenn wir r = (𝑥, 𝑦, 0), k1 = (𝑘0 sin 𝜃1 , 0, 𝑘0 cos 𝜃1 ) und k2 = (𝑘0 sin 𝜃2 , 0, −𝑘0 cos 𝜃2 ) in Gl. (2.32) einsetzen, erhalten wir 𝑘0 𝑥 sin 𝜃1 = 𝑘0 𝑥 sin 𝜃2 und daraus 𝜃1 = 𝜃2 , d. h. der Einfallswinkel muss gleich dem Ausfallswinkel sein. Das Reflexionsgesetz für optische Strahlen gilt also auch für die Wellenvektoren ebener Wellen.
Abb. 2.10 Brechung einer ebenen Welle an einer dielektrischen Grenzfläche. An der Grenzfläche müssen die Wellenfronten identisch sein: Der Abstand der Wellenfronten für die einfallende Welle, 𝜆1 ∕ sin 𝜃1 = 𝜆0 ∕n1 sin 𝜃1 , muss gleich dem für die gebrochene Welle sein, 𝜆2 ∕ sin 𝜃2 = 𝜆0 ∕n2 sin 𝜃2 . Aus dieser Bedingung folgt das snelliussche Gesetz.
k1 = (𝑛1 𝑘0 sin 𝜃1 , 0, 𝑛1 𝑘0 cos 𝜃1 ), k3 = (𝑛1 𝑘0 sin 𝜃3 , 0, −𝑛1 𝑘0 cos 𝜃3 ) und k2 = (𝑛2 𝑘0 sin 𝜃2 , 0, 𝑛2 𝑘0 cos 𝜃2 ) gilt, wobei 𝜃1 , 𝜃2 und 𝜃3 die Einfalls-, Brechungs- und Reflexionswinkel sind, folgt aus Gl. (2.33), dass 𝜃1 = 𝜃3 und 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 sein muss. Das ist genau das Reflexions- und das Brechungsgesetz (snelliussches Gesetz) der Strahlenoptik, die nun auch auf Wellenvektoren anwendbar sind. Im Rahmen der skalaren Wellenoptik ist es nicht möglich, die Amplituden der reflektierten und der gebrochenen Wellen zu bestimmen, da die Randbedingungen in dieser Theorie nicht vollständig spezifiziert sind. Hierzu werden wir erst in Abschnitt 6.2 mithilfe der Werkzeuge der elektromagnetischen Optik (Kapitel 5 und 6) in der Lage sein.
Reflexion und Brechung an einer ebenen dielektrischen Grenzfläche
2.4.2 Durchgang durch optische Komponenten
Wir betrachten nun eine ebene Welle mit dem Wellenvektor k1 , die auf eine ebene Grenzfläche zwischen zwei homogenen Medien mit den Brechungsindizes 𝑛1 und 𝑛2 fällt. Die Grenzfläche soll in der Ebene 𝑧 = 0 liegen (Abb. 2.10). Von der Grenzfläche gehen eine gebrochene und eine reflektierte ebene Welle mit den Wellenvektoren k2 und k3 aus. Die Kombination aller drei Wellen erfüllt die Helmholtzgleichung im gesamten Raum, sofern jede der drei Wellen in ihrem jeweiligen Medium den korrekten Wellenvektor besitzt (𝑘1 = 𝑘3 = 𝑛1 𝑘0 und 𝑘2 = 𝑛2 𝑘0 ). Da die Randbedingungen nicht von 𝑥 und 𝑦 abhängen, müssen die Wellenfronten der drei Wellen identisch sein, d. h.
Als Nächstes untersuchen wir den Durchgang optischer Wellen durch transparente optische Komponenten wie Platten, Prismen und Linsen. Dabei werden wir die Reflexion an der Oberfläche dieser Komponenten ignorieren, da sie im Rahmen der skalaren Wellentheorie des Lichts nicht korrekt beschrieben werden kann. Dasselbe gilt für die Absorption im Inneren der Komponenten, deren Behandlung wir daher auf Abschnitt 5.5 verschieben. Im Folgenden wollen wir uns vor allem auf die Phasenverschiebung und die damit zusammenhängende Krümmung der Wellenfronten konzentrieren, die die Komponenten bewirken.
k1 ⋅ r = k2 ⋅ r = k3 ⋅ r für alle r = (𝑥, 𝑦, 0) . (2.33) Diese Phasenbedingung ist gleichbedeutend damit, dass die tangentialen Komponenten der drei Wellenvektoren an der Grenzfläche identisch sein müssen. Da
Durchgang durch eine transparente Platte
Zuerst betrachten wir den Durchgang einer ebenen Welle durch eine transparente Platte mit dem Brechungsindex 𝑛 und der Dicke d im Vakuum. Die Oberflächen der Platte sollen die Ebenen 𝑧 = 0 und 𝑧 = d sein, und die einfallende Welle soll sich in 𝑧-Rich-
37
38
2 Wellenoptik
λ0
λ
Abb. 2.11 Durchgang einer ebenen Welle durch eine transparente Platte.
Abb. 2.12 Durchgang einer schief einfallenden ebenen Welle durch eine dünne transparente Platte.
tung ausbreiten (Abb. 2.11). 𝑈(𝑥, 𝑦, 𝑧) soll die komplexe Amplitude der Welle sein. Da wir äußere und innere Reflexionen ignorieren, können wir 𝑈(𝑥, 𝑦, 𝑧) an den Grenzflächen stetig annehmen. Das Verhältnis t(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, d )∕𝑈(𝑥, 𝑦, 0) ist dann die komplexe Amplitudentransmission oder auch der Transmissionskoeffizient 1) der Platte; sie ermöglicht uns, 𝑈(𝑥, 𝑦, d ) für beliebige 𝑈(𝑥, 𝑦, 0) auf der anderen Seite der Platte zu bestimmen. Die Auswirkung der Reflexion berücksichtigen wir in Abschnitt 6.2, den Einfluss mehrfacher innerer Reflexionen innerhalb der Platte in Abschnitt 11.1. Sobald sie im Inneren der Platte angekommen ist, breitet sich die Welle weiter als ebene Welle mit der Wellenzahl 𝑛𝑘0 aus, sodass 𝑈(𝑥, 𝑦, 𝑧) proportional zu exp(−i𝑛𝑘0 𝑧) ist. Daher ist 𝑈(𝑥, 𝑦, d )∕𝑈(𝑥, 𝑦, 0) = exp(−i𝑛𝑘0 d ) und somit
klein, und mit der Näherung cos 𝜃1 ≈ 1 − 𝜃12 erhal-
t(𝑥, 𝑦) = exp(−i𝑛𝑘0 d ) .
(2.34)
Die Platte bewirkt offensichtlich eine Phasenverschiebung 𝑛𝑘0 d = 2π(d ∕𝜆). Wenn die einfallende ebene Welle einen Winkel 𝜃 mit der 𝑧-Achse einschließt und einen Wellenvektor k besitzt (Abb. 2.12), sind auch die gebrochenen und transmittierten Wellen ebene Wellen mit den Wellenvektoren k1 und k und den Winkeln 𝜃1 und 𝜃 zur 𝑧-Achse, die über das snelliussche Gesetz verknüpft sind: sin 𝜃 = 𝑛 sin 𝜃1 . Die komplexe Amplitude 𝑈(𝑥, 𝑦, 𝑧) im Inneren der Platte ist nun proportional zu exp(−ik1 ⋅ r) = exp[−i𝑛𝑘0 (𝑧 cos 𝜃1 + 𝑥 sin 𝜃1 )], sodass die komplexe Amplitudentransmission der Platte, 𝑈(𝑥, 𝑦, d )∕𝑈(𝑥, 𝑦, 0), gleich t(𝑥, 𝑦) = exp (−i𝑛𝑘0 d cos 𝜃1 )
1 2
ten wir t(𝑥, 𝑦) ≈ exp(−i𝑛𝑘0 d ) exp(i𝑘0 𝜃2 d ∕2𝑛). Wenn die Platte hinreichend dünn ist und der Winkel 𝜃 hinreichend klein, sodass 𝑘0 𝜃2 d ∕2𝑛 ≪ 2π [oder (d ∕𝜆0 )𝜃2 ∕2𝑛 ≪ 1] gilt, dann ist die Transmission der Platte näherungsweise durch Gl. (2.34) gegeben. Unter diesen Bedingungen ist die Durchlässigkeit der Platte näherungsweise unabhängig von 𝜃. Durchgang durch eine dünne transparente Platte mit variabler Dicke
Wir bestimmen nun die Amplitudentransmission einer dünnen transparenten Platte, deren Dicke d (𝑥, 𝑦) als Funktion von 𝑥 und 𝑦 kontinuierlich variiert, wobei wir annehmen, dass die einfallende Welle eine beliebige paraxiale Welle sein soll. Die Platte soll zwischen den Ebenen 𝑧 = 0 und 𝑧 = d 0 liegen, die wir als Begrenzungen ansehen, die die optische Komponente umgeben (Abb. 2.13). In der Umgebung des Punkts (𝑥, 𝑦, 0) können wir die einfallende paraxiale Welle lokal als ebene Welle auffassen, die sich in einem kleinen Winkel zur 𝑧-Achse ausbreitet. Sie tritt dabei durch eine dünne Platte der Dicke d (𝑥, 𝑦), die von einer dünnen Luftschicht der Dicke d 0 − d (𝑥, 𝑦) umgeben ist. Nach der Näherung aus Gl. (2.34) ist die lokale Transmission das Produkt der Transmissionen einer dünnen Luftschicht der Dicke d 0 − d (𝑥, 𝑦) und einer dünnen Schicht aus dem Material der Platte mit der Dicke d (𝑥, 𝑦), sodass t(𝑥, 𝑦) ≈ x
(2.35)
(x, y)
ist. Wenn der Einfallswinkel 𝜃 klein ist (wenn die einfallende Welle also paraxial ist), dann ist auch 𝜃1 ≈ 𝜃∕𝑛 1) Nicht zu verwechseln mit dem Transmissionsgrad, der sich nicht auf die Amplitude, sondern auf die Intensität bzw. die Leistung bezieht.
Abb. 2.13 Eine transparente Platte mit variabler Dicke.
d0
z
y
2.4 Einfache optische Komponenten
exp[−i𝑛𝑘0 d (𝑥, 𝑦)] exp[−i𝑘0 (d 0 − d (𝑥, 𝑦))] ist, woraus t(𝑥, 𝑦) ≈ ℎ0 exp[−i(𝑛 − 1)𝑘0 d (𝑥, 𝑦)]
(2.36)
folgt, wobei ℎ0 = exp(−i𝑘0 d 0 ) ein konstanter Phasenfaktor ist. Diese Beziehung gilt in der paraxialen Näherung (wenn alle Winkel 𝜃 klein sind) und wenn die Dicke d 0 hinreichend klein ist, sodass (d 0 ∕𝜆0 )𝜃2 ∕2𝑛 ≪ 1 gilt.
Halbwinkel (𝑛 − 1)𝛼 auf ihre Mittelachse zulaufen. Ein solches Element kann verwendet werden, um eine ebene Welle in einen Besselstrahl umzuwandeln (siehe Abschnitt 3.5.1 und Beispiel 4-7). x
0
Übung 2-3: Durchgang durch ein Prisma
Verwenden Sie Gl. (2.36), um zu zeigen, dass die komplexe Amplitudentransmission eines dünnen invertierten Prismas mit kleinem Scheitelwinkel 𝛼 ≪ 1 und der Dicke d 0 (Abb. 2.14) durch t(𝑥, 𝑦) = ℎ0 exp[−i(𝑛 − 1)𝑘0 𝛼𝑥] mit ℎ0 = exp(−i𝑘0 d 0 ) gegeben ist. Welche Wirkung hat das Prisma auf eine einfallende ebene Welle, die sich in 𝑧-Richtung ausbreitet? Vergleichen Sie Ihre Ergebnisse mit denen der Strahlenoptik [siehe Gl. (1.10)]. Beispiel 2-1: Durchgang durch ein Biprisma und ein Axicon
Das in Abb. 1.17(a) dargestellte Biprisma besteht aus einem umgekehrten Prisma wie dem in Abb. 2.14 gezeigten, kombiniert mit einem identischen, nicht invertierten Prisma. Wir setzen seine Dicke gleich d 0 und den Kantenwinkel 𝛼 ≪ 1 und verallgemeinern die Ergebnisse von Übung 2-3 zu t(𝑥, 𝑦) = ℎ0 {exp[−i(𝑛 − 1)𝛼𝑘0 𝑥] + exp[+i(𝑛 − 1)𝛼𝑘0 𝑥]} = 2ℎ0 cos[(𝑛 − 1)𝛼𝑘0 𝑥] mit ℎ0 = exp(−i𝑘0 d 0 ). Das Biprisma wandelt eine einfallende ebene Welle also in ein Wellenpaar um, dessen Komponenten relativ zueinander geneigt sind. Genauso verhält sich auch das in Abb. 1.17(b) gezeigte Fresnel-Biprisma. Das in Abb. 1.17(c) gezeigte kegelförmige Axicon entsteht durch Drehen des in Abb. 2.14 dargestellten Querschnitts um eine horizontale Achse, die durch seine obere Kante verläuft, von 𝜙 = −π bis +π. Der Querschnitt dieses Elements ist für jeden Winkel 𝜙 ein gleichschenkliges Dreieck mit der Dicke d 0 und dem Randwinkel 𝛼 ≪ 1. Wir verwenden Polarkoordinaten und integrieren die in Übung 2-3 erhaltenen Ergebnisπ se über 𝜙 und erhalten so t(𝑥, 𝑦) = ℎ0 ∫−π exp[−i(𝑛 − π 1)𝛼(𝑘0 cos 𝜙)𝑥 − i(𝑛 − 1)𝛼(𝑘0 sin 𝜙)𝑦] d𝜙 = ℎ0 ∫−π √ exp[−i(𝑛 − 1)𝛼𝑘0 𝑥2 + 𝑦 2 sin(𝜙 + 𝜃)] d𝜙. Da die Integration über 2π erfolgt, ist das Integral unabhänπ gig von 𝜃. Wegen ∫−π exp(−i𝑢 sin 𝜙) d𝜙 = 2π 𝐽0 (𝑢), wobei 𝐽0 (𝑢) die Besselfunktion der ersten Art nullter Ordnung ist, kann die Amplitudentransmission auch √ als t(𝑥, 𝑦) = 2π ℎ0 𝐽0 [(𝑛 − 1)𝛼𝑘0 𝑥2 + 𝑦 2 ] geschrieben werden. Das Axicon wandelt eine einfallende ebene Welle somit in eine unendliche Zahl von ebenen Wellen um, die alle in Form eines Kegels mit einem
α z
0
Abb. 2.14 Durchgang einer ebenen Welle durch ein dünnes Prisma.
Durchgang durch eine dünne Linse
Im Folgenden wollen wir den allgemeinen Ausdruck Gl. (2.36) für die komplexe Amplitudentransmission einer dünnen transparenten Platte variabler Dicke auf die plankonvexe dünne Linse in Abb. 2.15 anwenden. Da die Linse ein Ausschnitt aus einer Kugel mit Radius 𝑅 ist, ist ihre Dicke am Punkt (𝑥, 𝑦) gleich d (𝑥, 𝑦) = d 0 − 𝑃𝑄 = d 0 − (𝑅 − 𝑄𝐶) oder ] [ √ (2.37) d (𝑥, 𝑦) = d 0 − 𝑅 − 𝑅2 − (𝑥2 + 𝑦 2 ) . Diesen Ausdruck können wir vereinfachen, wenn wir nur Punkte betrachten, für die 𝑥 und 𝑦 klein gegen 𝑅 sind, sodass 𝑥2 + 𝑦 2 ≪ 𝑅2 gilt. Dann ist √ √ 𝑥2 + 𝑦 2 𝑥2 + 𝑦 2 𝑅2 − (𝑥2 + 𝑦 2 ) = 𝑅 1 − ≈ 𝑅 − ), (1 𝑅2 2𝑅2 (2.38) wobei wir dieselbe Taylorentwicklung verwendet haben, die uns auch zur Fresnelnäherung einer Kugelwelle in x (x,y) R P
Q
C
z
0
Abb. 2.15 Eine plankonvexe Linse. Die Linse verleiht der einfallenden ebenen Welle eine Phase proportional zu x2 + y 2 und überführt sie so in eine Parabolwelle, deren Ursprung in einem Abstand f von der Linse liegt (siehe Übung 2-5).
39
40
2 Wellenoptik
Gl. (2.21) geführt hatte. Wenn wir diese Näherung in Gl. (2.37) verwenden, erhalten wir d (𝑥, 𝑦) ≈ d 0 −
𝑥2 + 𝑦 2 . 2𝑅
(2.39)
Einsetzen dieser Beziehung in Gl. (2.36) liefert schließlich t(𝑥, 𝑦) ≈ ℎ0 exp [i𝑘0
𝑥2 + 𝑦 2 ], 2𝑓
R2
R1
Abb. 2.16 Eine bikonvexe Linse.
(2.40)
wobei 𝑓=
𝑅 𝑛−1
z
(2.41)
die Brennweite der Linse ist (siehe Abschnitt 1.2.3) und ℎ0 = exp(−i𝑛𝑘0 d 0 ) wieder ein konstanter Phasenfaktor, der uns nicht weiter interessieren muss.
f
Abb. 2.17 Eine dünne Linse verwandelt eine ebene Welle in eine Parabolwelle.
Übung 2-4: Bikonvexe Linse
Zeigen Sie, dass die komplexe Amplitudentransmission der bikonvexen (sphärischen) Linse in Abb. 2.16 durch Gl. (2.40) gegeben ist mit 1 1 1 = (𝑛 − 1) ( − ) . 𝑅1 𝑅2 𝑓
P1
P2 z
(2.42)
Sie können dazu entweder die allgemeine Gleichung (2.36) verwenden oder die bikonvexe Linse als Hintereinanderschaltung zweier plankonvexer Linsen betrachten. Denken Sie daran, dass nach der Konvention der Radius einer konvexen (konkaven) Oberfläche positiv (negativ) ist, sodass für die in Abb. 2.16 gezeigte Linse 𝑅1 positiv und 𝑅2 negativ sind. Der Parameter 𝑓 ist die Brennweite der Linse [siehe Gl. (1.15)]. Übung 2-5: Fokussierung einer ebenen Welle durch eine dünne Linse
Zeigen Sie, dass eine ebene Welle beim Durchgang durch eine dünne Linse der Brennweite 𝑓 parallel zur optischen Achse in eine Parabolwelle verwandelt wird (Fresnelnäherung einer Kugelwelle), deren Ursprung in einem Abstand 𝑓 von der Linse liegt (Abb. 2.17). Welche Wirkung hat die Linse auf eine ebene Welle, die in einem kleinen Winkel 𝜃 zur optischen Achse einfällt? Übung 2-6: Die Abbildungseigenschaften einer Linse
Zeigen Sie, dass eine von einem Ursprung 𝑃1 ausgehende Parabolwelle (Abb. 2.18) durch eine dünne Linse der Brennweite 𝑓 in eine Parabolwelle um einen Punkt 𝑃2 verwandelt wird, wobei 1∕𝑧1 + 1∕𝑧2 = 1∕𝑓 gilt (diese Gleichung wird als Abbildungsgleichung bezeichnet).
z2
z1
Abb. 2.18 Eine Linse verwandelt eine Parabolwelle in eine andere Parabolwelle. Die Abstände der Zentren der beiden Parabolwellen erfüllen die Abbildungsgleichung.
Durchgang durch ein Beugungsgitter
Ein Beugungsgitter ist ein optisches Element, das die Phase oder Amplitude einer einfallenden Welle periodisch moduliert. Es kann beispielsweise aus einer transparenten Platte mit periodisch variierender Dicke oder periodisch variierendem Brechungsindex bestehen (siehe Abschnitt 2.4.3). Auch Hintereinanderschaltungen von beugenden Elementen wie Blenden oder Hindernissen oder absorbierenden Elementen (siehe Abschnitt 4.3) können verwendet werden. Reflektierende Beugungsgitter bestehen oft aus einer periodisch eingeritzten dünnen Aluminiumschicht auf einem Glassubstrat. Wir betrachten ein Beugungsgitter aus einer dünnen transparenten Platte in der Ebene 𝑧 = 0, deren Dicke in 𝑥-Richtung mit der Periode 𝛬 variiert (Abb. 2.19). Wie in Übung 2-7 gezeigt wird, verwandelt diese Platte eine unter einem kleinen Winkel 𝜃e zur 𝑧-Achse einfallende ebene Welle der Wellenlänge 𝜆 ≪ 𝛬 in mehrere ebene Wellen, die sich ebenfalls unter kleinen Winkeln zur 𝑧-Achse ausbreiten: 𝜃𝑞 ≈ 𝜃e + 𝑞
𝜆 , 𝛬
(2.43)
2.4 Einfache optische Komponenten
R G B R+G+ B
R+G+ B B G R
Abb. 2.19 Eine dünne transparente Platte mit periodisch variierender Dicke wirkt als Beugungsgitter. Sie spaltet eine einfallende ebene Welle in mehrere ebene Wellen auf, die sich in unterschiedliche Richtungen ausbreiten.
wobei 𝑞 = 0, ±1, ±2, … als Beugungsordnung bezeichnet wird. Benachbarte gebeugte Wellen unterscheiden sich um einen Winkel 𝜃 = 𝜆∕𝛬, wie Abb. 2.19 schematisch zeigt. Übung 2-7: Durchgang durch ein Beugungsgitter
(a) Die Dicke einer dünnen transparenten Platte va1 riiert in 𝑥-Richtung sinusförmig, d (𝑥, 𝑦) = d 0 [1 + 2 cos(2π 𝑥∕𝛬)], wie in Abb. 2.19 dargestellt. Zeigen Sie, dass die komplexe Amplitudentransmission durch 1 t(𝑥, 𝑦) = ℎ0 exp[−i (𝑛 − 1)𝑘0 d 0 cos(2π 𝑥∕𝛬)] mit ℎ0 = 2 1 exp[−i (𝑛 + 1)𝑘0 d 0 ] gegeben ist. (b) Zeigen Sie, dass ei2 ne unter einem kleinen Winkel 𝜃e zur 𝑧-Achse einfallende ebene Welle in mehrere ebene Wellen aufgespalten wird, die sich in Winkeln 𝜃𝑞 gemäß Gl. (2.43) ausbreiten. Hinweis: Entwickeln Sie die periodische Funktion t(𝑥, 𝑦) in eine Fourierreihe. Gleichung (2.43) gilt nur in der paraxialen Näherung (wenn alle Winkel klein sind) und wenn die Periode 𝛬 viel größer ist als die Wellenlänge 𝜆. Eine allgemeinere Analyse von Beugungsgittern ohne Verwendung der paraxialen Näherung zeigt, dass die einfallende ebene Welle in mehrere ebene Wellen aufgespalten wird, deren Winkel 𝜃𝑞 die Beziehung sin 𝜃𝑞 = sin 𝜃e + 𝑞
𝜆 𝛬
(2.44)
erfüllen. Dieses Ergebnis kann hergeleitet werden, indem man die periodische Durchlässigkeit t(𝑥, 𝑦) als Summe von Fourierkomponenten der Form exp(−i2π 𝑞𝑥∕𝛬) mit der Beugungsordnung 𝑞 = 0, ±1, ±2, . . . schreibt. Eine einfallende Welle exp(−i𝑘𝑥 sin 𝜃e ), die mit der harmonischen Komponente exp(−i2π 𝑞𝑥∕𝛬) moduliert wird, erzeugt unter dem Winkel 𝜃𝑞 eine durchgelassene ebene Welle exp(−i𝑘𝑥 sin 𝜃𝑞 ) ∝ exp(−i𝑘𝑥 sin 𝜃e ) exp(−i2π𝑞𝑥∕𝛬). Daraus folgt die Pha-
Abb. 2.20 Ein Beugungsgitter lenkt zwei Wellen mit unterschiedlichen Wellenlängen 𝜆1 und 𝜆2 in zwei verschiedene Richtungen 𝜃1 und 𝜃2 . Es wirkt so als Spektralanalysator oder Spektrometer.
senbeziehung 𝑘 sin 𝜃𝑞 = 𝑘 sin 𝜃0 + 𝑞 2π∕𝛬, woraus wegen 𝑘 = 2π∕𝜆 Gl. (2.44) folgt. Dieses Ergebnis gilt auch für an dem Gitter reflektierte Wellen. Beugungsgitter werden als Filter und Spektralanalysatoren verwendet. Da die Winkel 𝜃𝑞 von der Wellenlänge 𝜆 (und daher der Frequenz 𝜈) abhängen, wird eine einfallende polychromatische Welle durch das Gitter in ihre spektralen Komponenten aufgespalten (Abb. 2.20). Beugungsgitter finden vor allem in der Spektroskopie zahlreiche Anwendungen.
2.4.3 Optische Komponenten mit variablem Brechungsindex Die Wirkung eines Prismas, einer Linse oder eines Beugungsgitters auf eine einfallende optische Welle beruht auf der Phasenverschiebung, die die Welle erfährt und die ihre Wellenfront auf eine charakteristische Weise verändert. Die Phasenverschiebung wird durch die transversale (senkrecht zur Richtung der optischen Achse auftretende) Änderung der Dicke der optischen Komponente bestimmt, die für ein Prisma einer linearen, für eine Linse einer quadratischen und für ein Beugungsgitter einer periodischen Abhängigkeit folgt. Dieselbe Phasenverschiebung kann aber auch durch eine ebene transparente Platte mit konstanter Dicke erreicht werden, deren Brechungsindex variiert. Diese Tatsache ist eine Konsequenz aus Gl. (2.34), in der Dicke und Brechungsindex nur als Produkt auftreten. Die komplexe Amplitudentransmission einer dünnen transparenten ebenen Platte mit der Dicke d 0 und dem variablen Brechungsindex 𝑛(𝑥, 𝑦) ist nach Gl. (2.34) t(𝑥, 𝑦) = exp [−i𝑛(𝑥, 𝑦)𝑘0 d 0 ] .
(2.45)
Durch Wahl einer geeigneten Funktion 𝑛(𝑥, 𝑦) kann die Wirkung einer beliebigen dünnen optischen Komponente mit konstantem Brechungsindex reproduziert werden, wie auch in Übung 2-8 demonstriert wird.
41
42
2 Wellenoptik
Übung 2-8: Gradientenindexlinse
Gesamtwelle ist jedoch
Zeigen Sie, dass eine dünne Platte mit der konstanten Dicke d 0 (Abb. 2.21) und einem quadratisch variie1 renden Brechungsindex 𝑛(𝑥, 𝑦) = 𝑛0 [1 − 𝛼2 (𝑥2 + 𝑦 2 )] 2 mit 𝛼d 0 ≪ 1 wie eine Linse mit der Brennweite 𝑓 = 1∕𝑛0 d 0 𝛼2 wirkt (siehe Übung 1-8).
Abb. 2.21 Eine Platte mit variablem Brechungsindex wirkt als Linse.
𝐼 = |𝑈|2 = |𝑈1 + 𝑈2 |2 = |𝑈1 |2 + |𝑈2 |2 + 𝑈1∗ 𝑈2 + 𝑈1 𝑈2∗ , (2.47) wobei wir die explizite Abhängigkeit von r der Übersichtlichkeit halber nicht ausgeschrieben haben. Wenn wir √ √ 𝑈1 = 𝐼1 exp(i𝜑1 ) und 𝑈2 = 𝐼2 exp(i𝜑2 ) (2.48) in Gl. (2.47) einsetzen, wobei 𝜑1 und 𝜑2 die Phasen der beiden Wellen sind, erhalten wir √ (2.49) 𝐼 = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos 𝜑 mit 𝜑 = 𝜑2 − 𝜑1 .
2.5 Interferenz Wenn zwei oder mehr optische Wellen räumlich und zeitlich nebeneinander existieren, ergibt sich die Gesamtwellenfunktion als Summe der einzelnen Wellen. Dieses grundlegende Superpositionsprinzip folgt einfach aus der Linearität der Wellengleichung. Für monochromatische Wellen derselben Frequenz gilt dieses Superpositionsprinzip wegen der Linearität der Helmholtzgleichung ganz analog auch für die komplexen Amplituden. Das Superpositionsprinzip gilt jedoch nicht für die optische Intensität, da die Intensität der Summe aus zwei oder mehr Wellen nicht unbedingt die Summe der Einzelintensitäten ist. Der Grund dafür ist die Interferenz. Interferenz kann im Rahmen der Strahlenoptik nicht erklärt werden, da sie von der Phasenbeziehung der überlagerten Wellen abhängt. Im folgenden Abschnitt untersuchen wir die Interferenz zwischen zwei oder mehr monochromatischen Wellen derselben Frequenz. Die Interferenz von Wellen mit unterschiedlichen Frequenzen wird in Abschnitt 2.6 diskutiert.
2.5.1 Interferenz zweier Wellen Wenn zwei monochromatische Wellen mit den komplexen Amplituden 𝑈1 (r) und 𝑈2 (r) überlagert werden, resultiert eine monochromatische Welle derselben Frequenz mit der komplexen Amplitude 𝑈(r) = 𝑈1 (r) + 𝑈2 (r) .
(2.46)
Gemäß Gl. (2.14) sind die Intensitäten der beiden Einzelwellen 𝐼1 = |𝑈1 |2 und 𝐼2 = |𝑈2 |2 ; die Intensität der
(2.50)
Diese Beziehung, die auch als Interferenzgleichung bezeichnet wird, kann anhand des in Abb. 2.22(a) abgebildeten Zeigerdiagramms erklärt werden. Es zeigt, dass der Betrag des Zeigers 𝑈 nicht nur von den Beträgen der beiden Einzelwellen abhängt, sondern auch von ihrer Phasendifferenz 𝜑. Offensichtlich ist die Intensität der Überlagerung der beiden Wellen nicht die Summe der beiden einzelnen Intensitäten [Abb. 2.22(b)]; der zusätzliche Term in Gl. (2.49) entsteht durch die Interferenz der beiden Wellen. Er kann positiv oder negativ sein, entsprechend konstruktiver oder destruktiver Interferenz. Wenn beispielsweise 𝐼1 = 𝐼2 = 𝐼0 ist, liefert Gl. (2.49) 𝐼 = 2𝐼0 (1 + cos 𝜑) = 4𝐼0 cos2 (𝜑∕2), und die Gesamtintensität für 𝜑 = 0 ist 𝐼 = 4𝐼0 (d. h. die Gesamtintensität ist viermal so groß wie die Intensität jeder der beiden überlagerten Wellen). Für 𝜑 = π löschen sich die beiden überlagerten Wellen dagegen aus, und die Gesamtintensität ist 𝐼 = 0. Eine vollständige Auslöschung der Intensität in einem Raumbereich ist im Allgemeinen nur dann möglich, wenn die beiden überlagerten Wellen identisch sind. Für 𝜑 = π∕2 oder 3π∕2 verschwindet der Interferenzterm und wir erhalten 𝐼 = 2𝐼0 ; für diese speziellen Phasenbeziehungen ist die Gesamtintensität gleich der Summe der Einzelintensitäten. Die starke Abhängigkeit der Intensität 𝐼 von der Phasendifferenz 𝜑 ermöglicht es, Phasendifferenzen aus einer Messung der Lichtintensität zu bestimmen. Dieses Prinzip kommt in zahlreichen optischen Systemen zur Anwendung. Die Interferenz ist mit einer räumlichen Umverteilung der optischen Intensität unter Berücksichtigung der Energieerhaltung verbunden. Als Beispiel wollen wir zwei Wellen betrachten, die in einer gegebenen Ebene die konstanten Intensitäten 𝐼1 und 𝐼2 besitzen. Als
2.5 Interferenz
I U2
U (a)
I1 + I2 (b)
U1
1
2
–4π –2π
Ergebnis einer ortsabhängigen Phasendifferenz 𝜑 kann die Gesamtintensität dann stellenweise kleiner als 𝐼1 + 𝐼2 sein, dafür muss sie an anderen Stellen aber größer sein, sodass die gesamte Leistung (das Integral der Intensität) erhalten bleibt. Unter gewöhnlichen Beleuchtungsbedingungen beobachtet man keine Interferenz, da die stochastischen Fluktuationen der Phasen 𝜑1 und 𝜑2 zu einer Gleichverteilung der Phasendifferenz 𝜑 zwischen 0 und 2π führen, sodass cos 𝜑 im Mittel null ist und der Interferenzterm sich herausmittelt. Licht mit solchen statistischen Eigenschaften wird als partiell kohärent bezeichnet und in Kapitel 12 näher behandelt. Im folgenden beschränken wir uns auf die Untersuchung von kohärentem Licht. Interferometer
Wir betrachten die Superposition zweier ebener Wellen mit den Intensitäten 𝐼0 , die sich in 𝑧-Richtung ausbreiten, und nehmen an, dass die eine Welle um eizurückliegt, sodass 𝑈1 = ne √ √ Strecke d gegen die andere 𝐼0 exp(−i𝑘𝑧) und 𝑈2 = 𝐼0 exp[−i𝑘(𝑧 − d )] gilt. Die Intensität 𝐼 der Überlagerung dieser beiden Wellen erhalten wir dann, indem wir 𝐼1 = 𝐼2 = 𝐼0 und 𝜑 = 𝑘d = 2π d ∕𝜆 in die Interferenzgleichung (2.49) einsetzen: d
𝐼 = 2𝐼0 [1 + cos (2π )] . 𝜆
(2.51)
Die Abhängigkeit von 𝐼 von der Weglängendifferenz d ist in Abb. 2.23 dargestellt. Immer wenn die Differenz ein geradzahliges ganzes Vielfaches von 𝜆 ist, tritt eine vollständige konstruktive Interferenz ein und die Gesamtintensität ist 𝐼 = 4𝐼0 . Wenn d andererseits ein ungeradI 4I0 2I0
0
Abb. 2.22 (a) Zeigerdiagramm für die Superposition zweier Wellen der Intensitäten I1 und I2 und der Phasendifferenz 𝜑 = 𝜑2 − 𝜑1 . (b) Abhängigkeit der Gesamtintensität I von der Phasendifferenz 𝜑.
0
λ
2λ
3λ
Abb. 2.23 Abhängigkeit der Intensität I der Superposition zweier Wellen mit den Intensitäten I0 von der Weglängendifferenz d zwischen ihnen. Wenn die Differenz ein geradzahliges ganzes Vielfaches von 𝜆 ist, ist die Interferenz konstruktiv; wenn sie ein ungeradzahliges ganzes Vielfaches von 𝜆∕2 ist, ist die Interferenz destruktiv.
0
2π
4π
zahliges ganzes Vielfaches von 𝜆∕2 ist, tritt vollständige destruktive Interferenz ein und es ist 𝐼 = 0. Die mittlere Intensität ist die Summe 2𝐼0 der beiden Intensitäten. Ein Interferometer ist ein optisches Instrument, das eine Welle mithilfe eines Strahlteilers in zwei Teilstrahlen aufspaltet, diese ungleiche Wege zurücklegen lässt, sie dann mithilfe eines zweiten (oder auch desselben) Strahlteilers wieder kombiniert und die Intensität ihrer Superposition misst. In Abb. 2.24 sind drei praktisch wichtige Beispiele gezeigt: Das Mach-ZehnderInterferometer, das Michelsoninterferometer und das Sagnacinterferometer. Da die Intensität 𝐼 von der relativen Phase 𝜑 = 2πd ∕ 𝜆 = 2π 𝑛d ∕𝜆0 = 2π 𝑛𝜈d ∕𝑐0 abhängt, wobei d die Weglängendifferenz der beiden Wellen ist, kann das Interferometer verwendet werden, um sehr kleine Änderungen der Entfernung d , des Brechungsindex 𝑛 oder der Wellenlänge 𝜆0 (bzw. der Frequenz 𝜈) zu messen. Beispielsweise entspricht für d ∕𝜆0 = 104 eine Veränderung des Brechungsindex um nur Δ𝑛 = 10−4 bereits einer leicht beobachtbaren Phasenänderung von Δ𝜑 = 2π. Die Phase 𝜑 ändert sich um 2π, wenn d sich um eine Wellenlänge 𝜆 ändert. Dieselbe Wirkung hat eine Änderung der Frequenz um Δ𝜈 = 𝑐∕d . Interferometer haben vielfältige Anwendungen. Hierzu gehören die Abstandsmessung in messtechnischen Anwendungen wie der Messung von mechanischen Spannungen oder Oberflächenuntersuchungen, Messungen von Brechungsindizes oder Spektrometrie zur Analyse von polychromatischem Licht (siehe Abschnitt 12.2.2). Im Sagnacinterferometer sind die optischen Wege der beiden Teilwellen identisch, werden aber in entgegengesetzten Richtungen durchlaufen, sodass eine Rotation des Interferometers eine Phasenverschiebung 𝜑 proportional zur Winkelgeschwindigkeit der Rotation bewirkt. Ein solches System kann daher als Gyroskop eingesetzt werden. Wegen der erreichbaren Präzision ist die optische Interferometrie auch eine geeignete Methode zur Detektion von Gravitationswellen, wie wir später sehen werden. Abschließend wollen wir noch zeigen, dass die an einem Strahlteiler reflektierten bzw. transmittierten Wellen aus Gründen der Energieerhaltung eine Phasendifferenz von π∕2 besitzen müssen. In jedem der in Abb. 2.24
43
44
2 Wellenoptik
Abb. 2.24 Interferometer: Eine Welle U0 wird in zwei Teilwellen U1 und U2 aufgespalten (hier hell und dunkel gezeigt). Nachdem sie unterschiedliche Wege zurückgelegt haben, werden sie zu einer Superposition U = U1 + U2 rekombiniert, deren Intensität gemessen wird. Die Aufspaltung und Rekombination der Wellen erfolgt in Strahlteilern. Im Sagnacinterferometer legen die Teilwellen denselben Weg zurück, aber in entgegengesetzten Richtungen.
U0
U1
(a) Mach-Zehnder
U0
U2
U1
U2
U0
U2 U1
(b) Michelson
U1
U2
U1 U2
(c) Sagnac
U1
U2
gezeigten Interferometer treten auf der einen Seite des letzten Strahlteilers eine Welle 𝑈 = 𝑈1 + 𝑈2 und auf seiner anderen Seite eine weitere Welle 𝑈 ′ = 𝑈1′ + 𝑈2′ aus. Aufgrund der Energieerhaltung muss die Summe der Intensitäten dieser beiden Wellen gleich der Intensität der einfallenden Welle sein, d. h. wenn eine dieser beiden Wellen aufgrund von konstruktiver Interferenz eine hohe Intensität besitzt, muss die andere aufgrund von destruktiver Interferenz eine sehr kleine Intensität besitzen. Diese Kopplung ist nur möglich, wenn die Phasendifferenzen 𝜑 und 𝜑′ der Komponenten der ausgehenden Wellen 𝑈 und 𝑈 ′ sich um π unterscheiden. Da die Komponenten von 𝑈 und die Komponenten von 𝑈 ′ dieselben Weglängendifferenzen und dieselbe Zahl von Reflexionen an Spiegeln erfahren haben, kann die Phasendifferenz von π nur aufgrund von unterschiedlichen Phasen entstehen, die der Strahlteiler bei Reflexion und Transmission bewirkt. Eine genauere Untersuchung der drei Interferometer aus Abb. 2.24 ergibt, dass für jeweils eine der ausgehenden Wellen eine der beiden Komponenten einmal durch einen Strahlteiler durchgelassen und einmal von ihm reflektiert wird, sodass keine Phasendifferenz entstehen kann. In der anderen ausgehenden Welle wird jedoch eine ihre Komponenten zweimal durch einen Strahlteiler durchgelassen und die andere wird zweimal reflektiert; hierbei entsteht die Phasendifferenz von π. Folglich müssen sich die Phasen der an einem Strahlteiler reflektierten und transmittierten Wellen um π∕2 unterscheiden. Diese wichtige Eigenschaft eines Strahlteilers werden wir in Abschnitt 7.1 genauer analysieren (siehe Beispiel 7-6). Interferenz zweier schiefer ebener Wellen
Nun wollen wir die Interferenz zweier ebener Wellen mit gleicher Intensität betrachten, von denen sich eine
√ in 𝑧-Richtung ausbreitet, 𝑈1 = 𝐼0 exp(−i𝑘𝑧), und die zweite√in einem Winkel 𝜃 zur 𝑧-Achse in der 𝑥𝑧-Ebene, 𝑈2 = 𝐼0 exp[−i(𝑘 cos 𝜃𝑧 + 𝑘 sin 𝜃𝑥)], wie in Abb. 2.25 dargestellt. In der Ebene 𝑧 = 0 haben die beiden Wellen eine Phasendifferenz 𝜑 = 𝑘 sin 𝜃𝑥; damit ergibt sich aus der Interferenzgleichung (2.49) eine Gesamtintensität von 𝐼 = 2𝐼0 [1 + cos(𝑘 sin 𝜃𝑥)] .
(2.52)
Das Resultat ist ein mit der Periode 2π∕𝑘 sin 𝜃 = 𝜆∕ sin 𝜃 sinusförmig mit 𝑥 variierendes Muster wie in Abb. 2.25. Für 𝜃 = 30◦ ist die Periode beispielsweise 2𝜆. Daraus ergibt sich ein einfaches Verfahren zur Erzeugung sinusförmiger Muster mit hoher Auflösung, z. B. als Beugungsgitter. Ebenso lässt sich dieser Effekt ausnutzen, um den Winkel 𝜃 einer einfallenden Welle zu bestimmen, indem man sie mit einer Referenzwelle überlagert x
λ
U1
Interferenzmuster
z y λ /sin θ λ U2
θ
λ
sin θ
θ
Abb. 2.25 Die Interferenz zweier ebener Wellen, die sich in einem Winkel 𝜃 zueinander ausbreiten, ergibt ein in x-Richtung sinusförmig variierendes Intensitätsmuster mit der Periode 𝜆∕ sin 𝜃 .
2.5 Interferenz
und die resultierende Intensitätsverteilung misst. Das ist, wie in Abschnitt 4.5 näher erläutert wird, das Grundprinzip der Holographie. Übung 2-9: Interferenz einer ebenen und einer Kugelwelle
Eine ebene Welle, die sich mit der komplexen Amplitude 𝐴1 exp(−i𝑘𝑧) in 𝑧-Richtung ausbreitet, und eine Kugelwelle um den Ursprung 𝑧 = 0, die näherungsweise durch die Parabolwelle mit der komplexen Amplitude (𝐴2 ∕𝑧) exp(−i𝑘𝑧) exp[−i𝑘(𝑥2 + 𝑦 2 )∕2𝑧] beschrieben wird [siehe Gl. (2.21)], interferieren in der Ebene 𝑧 = d . Geben Sie einen Ausdruck für die Gesamtintensität 𝐼(𝑥, 𝑦, d ) an. Nehmen Sie an, dass die beiden Wellen in der Ebene 𝑧 = d dieselbe Intensität besitzen, und zeigen Sie, dass die Stellen mit der Intensität null wie in Abb. 2.26 gezeigt auf konzentrischen Ringen angeordnet sind. x
x
y
z
2.5.2 Vielwelleninterferenz Die Superposition von 𝑀 monochromatischen Wellen derselben Frequenz mit den komplexen Amplituden 𝑈1 , 𝑈2 ,. . . , 𝑈𝑀 ergibt eine Welle mit unveränderter Frequenz mit der komplexen Amplitude 𝑈 = 𝑈1 + 𝑈2 + ⋯ + 𝑈𝑀 . Die Kenntnis der Intensitäten 𝐼1 , 𝐼2 ,. . . , 𝐼𝑀 der einzelnen Wellen reicht nicht aus, um die Gesamtintensität 𝐼 = |𝑈|2 angeben zu können, da auch die relativen Phasen bekannt sein müssen. Die Bedeutung der Phase wird durch die folgenden Beispiele demonstriert. Interferenz von M Wellen mit gleichen Amplituden und konstanten Phasendifferenzen
Wir betrachten zuerst die Interferenz von 𝑀 Wellen mit den komplexen Amplituden √ 𝑈𝑚 = 𝐼0 exp[i(𝑚 − 1)𝜑] , 𝑚 − 1, 2, … , 𝑀 . (2.54) Alle Wellen sollen dieselbe Intensität 𝐼0 und eine Phasendifferenz von 𝜑 zwischen aufeinander folgenden Wellen besitzen, siehe Abb. 2.28(a). Um einen Ausdruck für die Gesamtintensität der Superposition angeben zu können, ist es hilfreich, √ die Größe ℎ = exp(i𝜑) einzuführen, sodass 𝑈𝑚 = 𝐼0 ℎ𝑚−1 wird. Die komplexe Amplitude der Superposition ist dann 𝑈= =
Abb. 2.26 Die Interferenz einer ebenen und einer Kugelwelle erzeugt ein Muster auf konzentrischen Ringen (hier für die Ebene z = d gezeigt).
Zwei Kugelwellen derselben Intensität 𝐼0 , die von den Punkten (−𝑎, 0, 0) und (𝑎, 0, 0) ausgehen, interferieren wie in Abb. 2.27 gezeigt in der Ebene 𝑧 = d . Dieses Doppellochsystem ähnelt dem von Thomas Young in seinem berühmten Doppelspaltexperiment zur Demonstration der Interferenz verwendeten. Verwenden Sie die parabolische Näherung für die Kugelwelle und zeigen Sie, dass die Intensität in der Ebene 𝑧 = d gleich 2π 𝑥𝜃 ) 𝜆
𝐼0 (1 + ℎ + ℎ2 + ⋯ + ℎ𝑀−1 ) =
√ 1 − exp(i𝑀𝜑) 𝐼0 , 1 − exp(i𝜑)
√ 1 − ℎ𝑀 𝐼0 1−ℎ (2.55)
und die entsprechende Intensität ist || exp(−i𝑀𝜑∕2) − exp(i𝑀𝜑∕2) ||2 || ; (2.56) 𝐼 = |𝑈|2 = 𝐼0 ||| || exp(−i𝜑∕2) − exp(i𝜑∕2) ||| daraus folgt
Übung 2-10: Interferenz zweier Kugelwellen
𝐼(𝑥, 𝑦, d ) ≈ 2𝐼0 (1 + cos
√
(2.53)
ist, wobei die Zentren der beiden Kugelwellen von der Beobachtungsebene aus unter einem Winkel 𝜃 ≈ 2𝑎∕d erscheinen. Das Intensitätsmuster ist periodisch mit einer Periode 𝜆∕𝜃.
2
𝐼 = 𝐼0
sin (𝑀𝜑∕2) 2
sin (𝜑∕2)
.
(2.57)
Übung 2-11: Braggreflexion
Betrachten Sie Licht, das wie in Abb. 2.29 an 𝑀 parallelen reflektierenden Ebenen in Abständen von 𝛬 in einem Winkel 𝜃 reflektiert wird. Nehmen Sie an, dass jede Ebene nur einen kleinen Teil des Lichts reflektiert, sodass die Amplituden der 𝑀 reflektierten Wellen etwa gleich sind. Zeigen Sie, dass die reflektierten Wellen eine Phasendifferenz 𝜑 = 𝑘(2𝛬 sin 𝜃) besitzen und dass der Winkel 𝜃, bei dem die Intensität des reflektierten Lichts maximal wird, durch sin 𝜃 =
𝜆 2𝛬
(2.58)
45
46
2 Wellenoptik
λ θ
z
θ = 2a
x
2a
2a
P1 z
P2
x
Lichtintensität in einer Beobachtungsebene in einem großen Abstand d von den Löchern folgt einem sinusförmigen Interferenzmuster mit der Periode ≈ 𝜆∕𝜃 entlang der Richtung, die durch die Anordnung der beiden Löcher vorgegeben ist.
Abb. 2.27 Interferenz zweier Kugelwellen derselben Intensität, die von den Punkten P1 und P2 ausgehen. Die beiden Wellen können erzeugt werden, indem man eine ebene Welle auf zwei kleine Löcher in einer Platte auftreffen lässt. Die I
UM
Abb. 2.28 (a) Die Summe von M Zeigern mit gleichen Beträgen und gleichen Phasendifferenzen. (b) Die Intensität I als Funktion von 𝜑. Die maximale Intensität tritt auf, wenn alle Zeiger gleich gerichtet sind; sie ist dann M mal so groß wie die mittlere Intensität ̄I = MI0 . Hier ist M = 5.
2π
MI
I 2π M
Io
U1 U2
I
U3
0 2π M
(a)
2π
4π
(b)
gegeben ist. Diese Gleichung definiert den Braggwinkel 𝜃. Derartige Reflexionen treten auf, wenn Licht an Schichtstrukturen (siehe Abschnitt 7.1) oder Röntgenstrahlung an den Atomebenen in Kristallen reflektiert wird. Ähnliche Effekte beobachtet man auch bei der Reflexion von Licht an periodischen Strukturen, die durch akustische Wellen hervorgerufen werden (siehe Kapitel 20). Eine exakte Behandlung der Braggreflexion führen wir in Abschnitt 7.1.3 durch.
U1
6π
1 2 ..M U2
.. UM
θ
Offensichtlich hängt die Intensität 𝐼 empfindlich von der Phasendifferenz 𝜑 ab, wie Abb. 2.28(b) für 𝑀 = 5 demonstriert. Für 𝜑 = 2π 𝑞 mit einer ganzen Zahl 𝑞 sind alle Zeiger gleich gerichtet, sodass die Amplitude der Gesamtwelle 𝑀 mal so groß ist wie die einer einzelnen Welle und die Intensität ihr Maximum von 𝑀 2 𝐼0 erreicht. Die über eine Gleichverteilung von 𝜑 gemittelte Intensi2π tät ist 𝐼̄ = (1∕2π) ∫0 𝐼 d𝜑 = 𝑀𝐼0 ; dieses Resultat stimmt mit dem überein, das man ohne Interferenz erhielte. Die maximale Intensität ist also 𝑀 mal so groß wie die mittlere Intensität. Dies zeigt, wie dramatisch die Intensität für große 𝑀 von der Phase abhängt. An ihrem Maximum wird die Intensität um einen Faktor 𝑀 gegenüber ihrem Mittelwert verstärkt, sie fällt jedoch steil ab, wenn der Phasenunterschied 𝜑 auch nur geringfügig von 2π 𝑞 abweicht. Insbesondere wird für 𝜑 = 2π∕𝑀 die Intensität null. Es ist in diesem Zusammenhang lehrreich, Abb. 2.28(b) für 𝑀 = 5 mit Abb. 2.23 für 𝑀 = 2 zu vergleichen. Die Fresnelzonenplatte
Λ
Abb. 2.29 Reflexion einer ebenen Welle an M parallelen Ebenen in Abständen von 𝛬. Die reflektierten Wellen interferieren konstruktiv und liefern eine maximale Intensität, wenn der Winkel 𝜃 gleich dem Braggwinkel ist. Dabei ist 𝜃 relativ zu den parallelen Ebenen definiert.
Eine Fresnelzonenplatte besteht aus einem Satz von ringförmigen Öffnungen mit zunehmendem Radius, abnehmender Breite und gleicher Fläche; siehe Abb. 2.30. Diese Anordnung wirkt wie eine sphärische Linse mit mehreren Brennweiten, was wir aus dem Blickwinkel der Interferenz verstehen können. Das Zentrum des
2.5 Interferenz
f +5 λ f +4 λ f +3 λ f +2 λ f +λ f
Abb. 2.30 Eine Fresnelzonenplatte wirkt wie eine sphärische Linse mit mehreren Brennweiten.
z
z
f
f
𝑚-ten Rings hat am 𝑚-ten Maximum der Kosinusfunk2 ∕𝜆𝑓 = 𝑚2π [siehe tion einen Radius 𝜌𝑚 , d. h. es gilt π𝜌𝑚 Gl. 2.43]. In einem Brennpunkt ist 𝑧 = 𝑓, sodass für den 2 2 2 Abstand √ 𝑅𝑚 des 𝑚-ten Rings 𝑅𝑚 = 𝑓 + 𝜌𝑚 und folglich 𝑅𝑚 = 𝑓 2 + 2𝑚𝜆𝑓 gilt. Wenn 𝑓 hinreichend groß ist, sodass die von den Ringen aufgespannten Winkel klein sind, liefert eine Taylorentwicklung 𝑅𝑚 ≈ 𝑓 + 𝑚𝜆. Somit unterscheiden sich die Weglängen der Wellen, die durch aufeinander folgende Ringe hindurchtreten, gerade um eine Wellenlänge, weshalb sie im Brennpunkt konstruktiv interferieren. Ein ähnliches Argument gilt für die anderen Brennpunkte. Alternativ kann die Funktionsweise der Fresnelzonenplatte auch mithilfe der Fourieroptik erklärt werden; siehe Abschnitt 4.1.1.
Die komplexe Amplitude der Superposition ist 𝑈 = 𝑈1 + 𝑈2 + 𝑈3 + ⋯ √ = 𝐼0 (1 + ℎ + ℎ2 + ⋯) √ √ 𝐼0 𝐼0 = . = 1−ℎ 1 − |ℎ|ei𝜑
(2.60)
Die Gesamtintensität ist folglich 𝐼 = |𝑈|2 =
𝐼0 𝐼0 = , ||1 − |ℎ|ei𝜑 ||2 (1 − |ℎ| cos 𝜑)2 + |ℎ|2 sin2 𝜑 | | (2.61)
woraus 𝐼=
Interferenz unendlich vieler Wellen mit abnehmenden Amplituden und konstanten Phasendifferenzen
𝐼0 (1 −
|ℎ|)2
2
+ 4|ℎ| sin (𝜑∕2)
(2.62)
Nun betrachten wir die Superposition einer unendlichen Zahl von Wellen mit konstanten Phasendifferenzen und Amplituden, die gemäß einer geometrischen Folge sukzessive abnehmen: √ 𝑈1 = 𝐼0 , 𝑈2 = ℎ𝑈1 , 𝑈3 = ℎ𝑈2 = ℎ2 𝑈1 , … , (2.59)
folgt. Diese Gleichung kann bequemer in der Form
wobei ℎ = |ℎ|ei𝜑 , |ℎ| < 1 und 𝐼0 die Intensität der anfänglichen Welle ist. Die Amplitude der 𝑚-ten Welle ist um einen Faktor |ℎ| kleiner als die der (𝑚 − 1)-ten Welle, und ihre Phase unterscheidet sich um 𝜑. Das zugehörige Zeigerdiagramm ist in Abb. 2.31(a) gezeigt.
geschrieben werden, wobei die Größe √ π |ℎ| ℱ= 1 − |ℎ|
𝐼=
2π =2 U3 U1 (a)
U2
= 10 (b)
0
2π
2
2
1 + (2ℱ∕π) sin (𝜑∕2)
,
mit 𝐼max =
𝐼0 2
(1 − |ℎ|) (2.63)
(2.64)
als Finesse bezeichnet wird.
I Imax
I
𝐼max
4π
Abb. 2.31 (a) Die Summe einer unendlichen Zahl von Zeigern mit gleichen Phasendifferenzen 𝜑, deren Amplituden sukzessive gemäß einer geometrischen Folge kleiner werden. (b) Abhängigkeit der Intensität I von der Phasendifferenz 𝜑 für zwei Werte von ℱ . Maxima treten Peak für 𝜑 = 2π q auf. Für ℱ ≫ 1 ist die Halbwertsbreite der Peaks ungefähr 2π∕ℱ . Mit steigendem ℱ werden die Peaks schärfer.
47
48
2 Wellenoptik
Die Intensität 𝐼 ist eine periodische Funktion von 𝜑 mit der Periode 2π, wie Abb. 2.31(b) zeigt. Sie erreicht für 𝜑 = 2π 𝑞 mit einer ganzen Zahl 𝑞 ihren Maximalwert 𝐼max . In diesem Fall sind alle Zeiger in derselben Richtung orientiert. (Dieses Ergebnis ähnelt dem aus Abb. 2.28(b) für die Interferenz von 𝑀 Wellen gleicher Amplitude und gleicher Phasendifferenz.) Wenn die Finesse ℱ groß (d. h. der Faktor |ℎ| ungefähr 1) ist, ist 𝐼 eine Funktion von 𝜑 mit einem scharf ausgeprägten Maximum. Als typisches Beispiel wollen wir Werte von 𝜑 in der Nähe des Peaks 𝜑 = 0 betrachten. Für |𝜑| ≪ 1 ist sin(𝜑∕2) ≈ 𝜑∕2, weshalb wir Gl. (2.63) in der Form 𝐼≈
𝐼max 1 + (ℱ∕π)2 𝜑2
(2.65)
schreiben können. Die Intensität 𝐼 nimmt also für 𝜑 = π∕ℱ auf die Hälfte ihres Maximalwerts ab, sodass für die Halbwertsbreite des Peaks Δ𝜑 ≈
2π ℱ
(2.66)
gilt. Im Bereich ℱ ≫ 1 folgt dann Δ𝜑 ≪ 2π, sodass die Annahme 𝜑 ≪ 1 gerechtfertigt ist. Die Finesse ℱ ist das Verhältnis der Periode 2π zur Halbwertsbreite der Peaks im Interferenzmuster. Sie ist damit ein Maß für die Schärfe der Interferenzfunktion, d. h. die Empfindlichkeit der Intensität gegenüber Abweichungen von 𝜑 von den Maximalwerten 2π 𝑞 der Peaks. Ein nützliches Instrument, das auf diesem Prinzip beruht, ist das Fabry-Pérot-Interferometer. Es besteht aus zwei parallelen Spiegeln, zwischen denen Licht mehrfach reflektiert wird. Bei jeder Runde zwischen den Spiegeln erfährt das Licht eine Reduktion der Amplitude um einen konstanten Faktor |ℎ| = |r| aufgrund von Verlusten an den Spiegeln sowie eine Phasenverschiebung 𝜑 = 𝑘2d = 4π𝜈d ∕𝑐 = 2π 𝜈∕ (𝑐∕2d ), wobei d der Abstand der Spiegel ist. Die Gesamtintensität des Lichts hängt gemäß Gl. (2.63) von der Phasenverschiebung 𝜑 ab und wird maximal, wenn 𝜑∕2 ein ganzes Vielfaches von π ist. Aufgrund der Proportionalität zwischen der Phasenverschiebung 𝜑 und der optischen Frequenz 𝜈 sehen wir, dass die durch ein Fabry-Pérot-Interferometer transmittierte Intensität Peaks im Frequenzabstand 𝑐∕2d besitzt. Ihre Breite beträgt (𝑐∕2d )∕ℱ, wobei die Finesse ℱ über Gl. (2.64) mit dem Verlust zusammenhängt. Das Fabry-Pérot-Interferometer, das als als Spektralanalysator eingesetzt werden kann, wird in Abschnitt 7.1.3 genauer behandelt. Es wird häufig auch als Laserresonator eingesetzt, wie in den Abschnitten 11.1 und 16.1.1 diskutiert.
Beispiel 2-2: Das LIGO Interferometer
Das LIGO-Interferometer 2) besteht aus einem Michelsoninterferometer (MI), das in jedem seiner Zweige ein Fabry-Pérot-Interferometer (FPI) enthält, wie Abb. 2.32 zeigt. Das Michelsoninterferometer registriert die Phasendifferenz, die die optischen Wellen auf ihrem Weg durch die beiden Zweige erfahren. Die beiden Fabry-Pérot-Interferometer dienen dazu, die Phasenverschiebungen in den Zweigen zu verstärken und dadurch die Empfindlichkeit des Gesamtinstruments wesentlich zu erhöhen. Wenn wir die in einem doppelten Durchlauf durch eines der FPI auftretende Phasenverschiebung mit 𝜑 bezeichnen, ist die Phase der gesamten Welle 𝑈 nach dem zweimaligen Durchlauf durch den reflektierenden Arm gemäß Gl. (2.60) arg{𝑈} = arg {
|ℎ| sin 𝜑 1 } = arctan { }. i𝜑 1 − |ℎ| cos 𝜑 1 − |ℎ|e (2.67)
Wenn wir 𝜌 als ganzzahliges Vielfaches von 2π annehmen, zu dem pro doppeltem Durchlauf eine sehr kleine Abweichung 2Δ𝜑 ≪ π hinzugefügt wird, ergibt eine Taylorentwicklung von Gl. (2.67) arg{𝑈} ≈ 2Δ𝜑|ℎ|∕(1 − |ℎ|). Dieses Ergebnis√hängt eng mit der Finesse des FPI zusammen, ℱ = π |ℎ|∕(1 − |ℎ|) [siehe Gl. (2.64)]. Für |ℎ| ≈ 1 und eine große Finesse ist arg{𝑈} ≈ 2Δ𝜑∕(1 − |ℎ|) und ℱ ≈ π∕(1 − |ℎ|) und folglich arg{𝑈} ≈ (2ℱ∕π)Δ𝜑. Somit wird eine sehr kleine Phasenabweichung Δ𝜑 im FPI um einen sehr großen Faktor 2ℱ∕π verstärkt. Diese Phasenverstärkung resultiert aus den vielen Reflexionen des Lichts zwischen den Spiegeln des FPI, wodurch dessen Länge und damit seine Empfindlichkeit effektiv erhöht wird. Das Interferenzmuster des Michelsoninterferometers ist durch die Zweiwellen-Interferenzgleichung (2.49) gegeben. Wenn das in beide Arme eingekoppelte Licht dieselbe Intensität besitzt, d. h. wenn 𝐼1 = 1 𝐼2 = 𝐼0 ist, wird Gl. (2.49) zu 𝐼 = 𝐼0 [1 + cos(𝜑2 − 𝜑1 )]. 2 Wenn wir nun für die Phasen in beiden Armen 𝜑2,1 = (2ℱ∕π)Δ𝜑2,1 annehmen, erhalten wir für das LIGO-Interferenzmuster 1 − cos (
2ℱ ) (Δ𝜑2 − Δ𝜑1 ) . π
(2.68)
Das LIGO-Interferometer reagiert somit um einen Faktor 2ℱ∕π empfindlicher auf die Phasendifferenz Δ𝜑2 − Δ𝜑1 als ein Michelsoninterferometer mit gleichen Armlängen. 2) Das Acronym LIGO steht für Laser Interferometer Gravitational Wave Observatory, eine Forschungseinrichtung mit zwei Standorten in Livingston (Louisiana) und Hanford (Washington).
2.6 Polychromatisches und gepulstes Licht
Diese erhöhte Empfindlichkeit ist der Grund für die Verwendung des LIGO-Interferometers als Gravitationswellendetektor. Gravitationswellen werden durch katastrophale Ereignisse im fernen Universum erzeugt und äußern sich durch eine dynamische Verzerrung der Struktur des Raums, was zu unterschiedlichen Längenänderungen in den orthogonalen Zweigen des Interferometers führt. Dies wiederum moduliert die Phasendifferenz Δ𝜑2 − Δ𝜑1 , was zu einer Gesamtintensität des Lichts führt, deren Betrag proportional zu der durch die Gravitationswelle hervorgerufenen Verzerrung ist. Gravitationswellen wurden 2015 von LIGO nachgewiesen – einhundert Jahre nach ihrer Vorhersage durch Einstein. 3)
FPI FPI
Abb. 2.32 Das LIGO-Interferometer ist ein Michelsoninterferometer (MI), in dessen Zweigen jeweils ein FabryPérot-Interferometer (FPI) integriert ist. Jedes der FPI im Advanced-LIGO-Instrument hat eine Länge d ≈ 4 km und eine Finesse ℱ ≈ 450, sodass die Empfindlichkeitssteigerung gegenüber einem gewöhnlichen MI 2ℱ∕π ≈ 286 beträgt. Die 2015 beobachtete Gravitationswelle bewirkte in dem LIGO-Interferometer eine differentielle räumliche Verzerrung (Δd 2 − Δd 1 )∕d = Δd ∕d mit einem Betrag von ungefähr 5 × 10−22 , was einer differentiellen Längenabweichung Δd von ungefähr 2 am entspricht (etwa 400 mal kleiner als der Radius eines Protons!). Die verwendete Lichtquelle war ein Nd:YAG-Laser mit einer Leistung von 20 W, der bei 𝜆0 = c0 ∕𝜈 = 1.064 μ m betrieben wurde. Die entsprechende Phasendifferenz Δ𝜑2 − Δ𝜑1 hatte somit einen Betrag von 2π𝜈Δd ∕c0 ≈ 1.8 × 10−11 rad; ihre Oszillationen lagen im Bereich von hörbaren Frequenzen.
2.6 Polychromatisches und gepulstes Licht Da die Wellenfunktion von monochromatischem Licht eine harmonische Funktion der Zeit ist, die sich über die gesamte Zeit erstreckt (von −∞ bis ∞), handelt es 3) B. P. Abbott et al., ‚Observation of Gravitational Waves from a Binary Black Hole Merger‘, Phys. Rev. Lett. 061102, 2016. Die nahezu gleichzeitigen Nachweise an beiden LIGO-Standorten, die 3000 km bzw. 10 ms voneinander entfernt sind, konnten den kosmologischen Ursprung der Wellen eindeutig bestätigen.
sich dabei um eine Idealisierung, die praktisch nicht realisierbar ist. Der folgende Abschnitt befasst sich mit Wellen beliebiger Zeitabhängigkeit einschließlich Wellenpulsen endlicher Dauer. Derartige Wellen sind nicht monochromatisch, sondern polychromatisch. Eine ausführlichere Einführung in die Optik von gepulstem Licht gibt Kapitel 23.
2.6.1 Zeitliche und spektrale Beschreibung Obwohl eine polychromatische Welle durch eine Wellenfunktion 𝑢(r, 𝑡) mit nichtharmonischer Zeitabhängigkeit beschrieben wird, kann sie doch als Superposition harmonischer Funktionen dargestellt werden, von denen jede einer monochromatischen Welle entspricht. Da wir bereits wissen, wie sich monochromatische Wellen durch ein Vakuum und verschiedene optische Komponenten ausbreiten, können wir die Wirkung optischer Systeme auf polychromatisches Licht aus dem Superpositionsprinzip ableiten. Fouriermethoden erlauben es, eine beliebige Funktion 𝑢(𝑡) der Zeit, die das Verhalten der Wellenfunktion 𝑢(r, 𝑡) an einem festen Ort r wiedergibt, als Superpositionsintegral von harmonischen Funktionen mit unterschiedlichen Frequenzen, Amplituden und Phasen zu schreiben, ∞
𝑢(𝑡) = ∫ 𝑣(𝜈) exp(2πi𝜈𝑡) d𝜈 ,
(2.69)
−∞
wobei 𝑣(𝜈) aus einer Fouriertransformation (FT) bestimmt wird: ∞
𝑣(𝜈) = ∫ 𝑢(𝑡) exp(−2πi𝜈𝑡) d𝑡 .
(2.70)
−∞
Eine Übersicht über die Fouriertransformation und ihre Eigenschaften gibt Anhang A.1. Die Entwicklung in Gl. (2.69) erstreckt sich über positive und negative Frequenzen. Da 𝑢(𝑡) aber reell ist, muss 𝑣(−𝜈) = 𝑣∗ (𝜈) gelten (siehe Abschnitt A.1). Die Komponenten mit negativen Frequenzen sind also nicht unabhängig; sie sind einfach die komplex Konjugierten der entsprechenden Komponenten mit positiven Frequenzen. Komplexe Darstellung
Es ist zweckmäßig, die reelle Funktion 𝑢(𝑡) in Gl. (2.69) durch eine komplexe Funktion ∞
𝑈(𝑡) = 2 ∫ 𝑣(𝜈) exp(2πi𝜈𝑡) d𝜈 0
(2.71)
49
50
2 Wellenoptik
zu ersetzen, die nur die Komponenten zu positiven Frequenzen enthält (mit einem Faktor 2 multipliziert) und die Komponenten zu negativen Frequenzen unterdrückt. Die Fouriertransformierte von 𝑈(𝑡) ist folglich für 𝜈 ≥ 0 eine Funktion 𝑉(𝜈) = 2𝑣(𝜈) und für 𝜈 < 0 gleich null. Die reelle Funktion 𝑢(𝑡) kann aus ihrer komplexen Darstellung 𝑈(𝑡) bestimmt werden, indem man einfach den Realteil bildet: 1
𝑢(𝑡) = Re{𝑈(𝑡)} = [𝑈(𝑡) + 𝑈 ∗ (𝑡)] . 2
(2.72)
Die komplexe Funktion 𝑈(𝑡) wird als komplexes analytisches Signal bezeichnet. Die Gültigkeit von Gl. (2.72) kann kontrolliert werden, indem man das Integral aus Gl. (2.69) in zwei Teile aufspaltet, von denen eines von 0 bis +∞ und das andere von −∞ bis 0 läuft. Das erste Integral liefert dann wegen Gl. (2.71) gerade 1 𝑈(𝑡), während das zweite 2
∫ 𝑣(𝜈) exp(2πi𝜈𝑡) d𝜈 = ∫ 𝑣(−𝜈) exp(−2πi𝜈𝑡) d𝜈 −∞
2
1 𝜕2 𝑈 =0. 𝑐2 𝜕𝑡2
–ν0
0
ν0
ν
0
ν0
Abb. 2.33 (a) Der Betrag |𝜐(r, 𝜈)| der Fouriertransformierten der Wellenfunktion u(r, t ). (b) Der Betrag |V (r, 𝜈)| der Fouriertransformierten der entsprechenden komplexen Wellenfunktion U(r, t ).
Abbildung 2.33 zeigt die Beträge der Fouriertransformierten der Wellenfunktion 𝑢(r, 𝑡) und der komplexen Wellenfunktion 𝑈(r, 𝑡). In dieser Darstellung ist die Welle quasimonochromatisch, d. h. ihre Fourierkomponenten liegen alle in einem schmalen Intervall Δ𝜈 um eine Mittenfrequenz 𝜈0 , sodass Δ𝜈 ≪ 𝜈0 gilt. Die Intensität einer polychromatischen Welle
⟩ 1 ⟨ ∗2 ⟩ ⟨ 𝑈 (r, 𝑡) + ⟨𝑈(r, 𝑡)𝑈 ∗ (r, 𝑡)⟩ . = 𝑈 2 (r, 𝑡) + 2 2 (2.75) 1
(2.73)
ergibt. Der erste Schritt ist dabei nichts weiter als ein einfacher Variablentausch von 𝜈 nach −𝜈, wohingegen der zweite die Symmetriebeziehung 𝑣(−𝜈) = 𝑣∗ (𝜈) verwendet. Insgesamt erhalten wir so, dass 𝑢(𝑡) als Sum1 me der komplexen Funktion 𝑈(𝑡) und ihrer komplex 2 Konjugierten geschrieben werden kann; dies bestätigt Gl. (2.72). Beispielsweise ist die komplexe harmonische Darstellung der reellen harmonischen Funktion 𝑢(𝑡) = cos(𝜔𝑡) die komplexe harmonische Funktion 𝑈(𝑡) = exp(i𝜔𝑡). Das ist gerade die komplexe Darstellung einer monochromatischen Welle, die wir in Abschnitt 2.2.1 eingeführt hatten. Die komplexe Darstellung einer polychromatischen Welle, wie wir sie in diesem Abschnitt behandeln, ist somit nichts weiter als eine Superposition der komplexen Darstellungen all ihrer monochromatischen Fourierkomponenten. Das komplexe analytische Signal der Wellenfunktion 𝑢(r, 𝑡) ist die komplexe Wellenfunktion 𝑈(r, 𝑡). Da jede ihrer Fourierkomponenten die Wellengleichung erfüllt, gilt dasselbe für die komplexe Wellenfunktion 𝑈(r, 𝑡): ∇2 𝑈 −
(b)
2
= ∫ 𝑣∗ (𝜈) exp(−2πi𝜈𝑡) d𝜈 = 𝑈 ∗ (𝑡)
(a)
𝐼(r, 𝑡) = 2⟨𝑢2 (r, 𝑡)⟩ ⟨{ }2 ⟩ 1 =2 [𝑈(r, 𝑡) + 𝑈 ∗ (r, 𝑡)]
0 ∞
0 1
|V(r, ν)
Die optische Intensität hängt gemäß Gl. (2.3) mit der Wellenfunktion zusammen:
∞
0
υ (r, ν)
(2.74)
Für eine quasimonochromatische Welle mit der Mittenfrequenz 𝜈0 und der spektralen Breite Δ𝜈 ≪ 𝜈0 bezieht sich die Mittelwertbildung ⟨⋅⟩ auf ein Zeitintervall, das viel länger ist als die Dauer 1∕𝜈0 einer optischen Periode, aber viel kürzer als 1∕Δ𝜈 (siehe Abschnitt 2.1). Da 𝑈(r, 𝑡) durch Gl. (2.72) gegeben ist, enthält der Term 𝑈 2 in Gl. (2.75) Komponenten, die mit Frequenzen ≈ 2𝜈0 oszillieren. Ähnlich oszillieren die Komponenten von 𝑈 ∗2 mit Frequenzen ≈ −2𝜈0 . Diese Terme werden durch die Mittelung daher ausgelöscht. Der dritte Term enthält jedoch nur Differenzen von Frequenzen, die in der Größenordnung Δ𝜈 ≪ 𝜈0 liegen. Dieser Term variiert daher langsam und wird von der zeitlichen Mittelung nicht beeinflusst. Der dritte Term in Gl. (2.75) überlebt folglich, und die Lichtintensität wird 2 𝐼(r, 𝑡) = |||𝑈(r, 𝑡)||| .
(2.76)
Die optische Intensität einer quasimonochromatischen Welle ist gleich dem Betragsquadrat ihrer komplexen Wellenfunktion. Die Einfachheit dieses Ergebnisses liefert letztlich die Rechtfertigung für die Einführung der komplexen Wellenfunktion.
ν
2.6 Polychromatisches und gepulstes Licht
Insbesondere gilt für Gaußfunktionen 𝒜(𝑡), dass auch ihre Fouriertransformierte 𝐴(𝜈) eine Gaußfunktion ist. Wenn die zeitliche und spektrale Breite als mittlere quadratische Breiten der Leistung definiert werden, ist ihr Produkt gleich 1∕4π (siehe Abschnitt A.2 in Anhang A). Für 𝜏 = 1 ps ist beispielsweise Δ𝜈 = 80 GHz. Wenn die Mittenfrequenz 𝜈0 gleich 5 × 1014 Hz ist (entsprechend 𝜆0 = 0.6 μm), dann ist Δ𝜈∕𝜈0 = 1.6 × 10−4 , sodass das Licht quasimonochromatisch ist. Abbildung 2.34 zeigt die zeitlichen, räumlichen und spektralen Eigenschaften einer solchen gepulsten ebenen Welle anhand ihrer Wellenfunktion. Die Ausbreitung einer gepulsten ebenen Welle durch ein Medium mit einem frequenzabhängigen Brechungsindex (d. h. mit einer frequenzabhängigen Lichtgeschwindigkeit 𝑐 = 𝑐0 ∕𝑛) wird in Abschnitt 5.5.2 diskutiert; Kapitel 23 behandelt andere Aspekte der Optik von Strahlungspulsen.
Gepulste ebene Welle
Das einfachste Beispiel für gepulstes Licht ist eine gepulste ebene Welle. Ihre komplexe Wellenfunktion hat die Form [ ( ( 𝑧 )] 𝑧) exp 2πi𝜈0 𝑡 − , (2.77) 𝑈(r, 𝑡) = 𝒜 𝑡 − 𝑐 𝑐 wobei die komplexe Einhüllende 𝒜(𝑡) eine zeitlich variierende Funktion und 𝜈0 die optische Mittenfrequenz ist. Eine monochromatische ebene Welle ist ein Spezialfall von Gl. (2.77) mit konstantem 𝒜(𝑡), d. h. 𝑈(r, 𝑡) = 𝒜 exp[2πi𝜈0 (𝑡 − 𝑧∕𝑐)] = 𝒜 exp(−i𝑘0 𝑧) exp(i𝜔0 𝑡) mit 𝑘0 = 𝜔0 ∕𝑐 und 𝜔0 = 2π𝜈0 . Da 𝑈(r, 𝑡) in Gl. (2.77) eine Funktion von 𝑡 − 𝑧∕𝑐 ist, erfüllt Sie die Wellengleichung 2.74 unabhängig von der 2 konkreten Form der Funktion 𝒜 (solange d 𝒜∕ d𝑡2 existiert), wie durch direkte Substitution leicht zu verifizieren ist. Wenn 𝒜(𝑡) eine endliche Dauer 𝜏 besitzt, dann existiert die Welle an jedem beliebigen festen Punkt 𝑧 für ein Zeitintervall 𝜏, und zu einer beliebigen festen Zeit 𝑡 erstreckt sie sich über eine Strecke 𝑐𝜏. Es handelt sich dabei folglich um ein Wellenpaket mit fester Ausdehnung, das sich in 𝑧-Richtung ausbreitet (Abb. 2.34). Zum Beispiel erstreckt sich ein Puls der Dauer 𝜏 = 1 ps im Vakuum über eine Entfernung 𝑐𝜏 = 0.3 mm. Die Fouriertransformierte der komplexen Wellenfunktion in Gl. (2.77) ist 𝑉(r, 𝜈) = 𝐴(𝜈 − 𝜈0 ) exp(−2πi𝜈𝑧∕𝑐) ,
2.6.2 Lichtschwebung Die Zeitabhängigkeit der Intensität einer polychromatischen Welle kann durch Interferenz zwischen ihren monochromatischen Komponenten erklärt werden. Diesen Gedanken wollen wir im Folgenden an zwei Beispielen erläutern: der Interferenz zwischen zwei monochromatischen Wellen und der Interferenz zwischen einer endlichen Zahl von monochromatischen Wellen.
(2.78)
Interferenz zweier monochromatischer Wellen mit verschiedenen Frequenzen
wobei 𝐴(𝜈) die Fouriertransformierte von 𝒜(𝑡) ist. Dies lässt sich unter Verwendung der Frequenzverschiebungs-Eigenschaft der Fouriertransformation zeigen (siehe Abschnitt A.1). Die komplexe Einhüllende 𝒜(𝑡) variiert oft langsam im Vergleich zu einer optischen Periode, sodass ihre Fouriertransformierte 𝐴(𝜈) eine spektrale Breite Δ𝜈 besitzt, die viel kleiner ist als die Mittenfrequenz 𝜈0 . Die spektrale Breite Δ𝜈 ist umgekehrt proportional zur zeitlichen Breite 𝜏 des Pulses. Zeit t
(t) τ
wobei die Phasen null gesetzt wurden und die r-Abhängigkeit der Einfachheit halber unterdrückt wurde. Die V(ν)
(ν) z
0
Δν
Δν
Zeit t + T
t 0 (a)
cτ
Eine aus zwei monochromatischen Wellen der Frequenzen 𝜈1 und 𝜈2 und der Intensitäten 𝐼1 und 𝐼2 bestehende optische Welle hat an einem Punkt im Raum die komplexe Wellenfunktion √ √ 𝑈(𝑡) = 𝐼1 exp(2πi𝜈1 𝑡) + 𝐼2 exp(2πi𝜈2 𝑡) , (2.79)
cT
(b)
z
0 (c)
Abb. 2.34 Zeitliche, räumliche und spektrale Eigenschaften einer gepulsten ebenen Welle. (a) An einem festen Ort hat die Wellenfunktion eine zeitliche Dauer 𝜏 . (b) Die Wellenfunktion als Funktion des Ortes zu den Zeiten t und t + T. Der Puls pflanzt sich mit einer Geschwindigkeit c fort und
ν
ν0
0
ν
(d)
erstreckt sich über eine Entfernung c𝜏 . (c) Der Betrag |A(𝜈)| der Fouriertransformierten der komplexen Einhüllenden. (d) Der Betrag |V (𝜈)| der Fouriertransformierten der komplexen Wellenfunktion ist um die Frequenz 𝜈0 verteilt.
51
52
2 Wellenoptik
Intensität der Gesamtwelle ergibt sich aus der Interferenzgleichung (2.49) zu √ 𝐼(𝑡) = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos [2π(𝜈2 − 𝜈1 )𝑡] . (2.80) Die Intensität variiert somit sinusförmig mit der Frequenzdifferenz |𝜈2 − 𝜈1 |, die als Schwebungsfrequenz bezeichnet wird. Die Erscheinung selbst ist unter verschiedenen Bezeichnungen bekannt: Lichtschwebung, optisches Mischen, Photomischen oder optische Überlagerung. Gleichung (2.80) ist das Analogon zu Gl. (2.53) für die räumliche Interferenz zweier Wellen derselben Frequenz, die sich in unterschiedlichen Richtungen ausbreiten. Diese Analogie können wir anhand des Zeigerdiagramms in Abb. 2.22 verstehen. Die beiden Zeiger 𝑈1 und 𝑈2 rotieren mit den Winkelfrequenzen 𝜔1 = 2π 𝜈1 und 𝜔2 = 2π 𝜈2 , sodass der Differenzwinkel in Übereinstimmung mit Gl. (2.80) gleich 𝜑 = 𝜑2 − 𝜑1 = 2π(𝜈2 − 𝜈1 )𝑡 ist. Wellen unterschiedlicher Frequenzen, die sich in unterschiedlichen Richtungen ausbreiten, zeigen räumlich-zeitliche Interferenz. In der Elektronik spricht man von Schwebung, wenn ein nichtlineares Bauelement aus zwei sinusförmigen Signalen neue Signale bei der Differenz und der Summe der ursprünglichen Frequenzen erzeugt. Solche Bauelemente werden z. B. in Heterodynempfängern verwendet. Photodetektoren reagieren auf die optische Intensität (siehe Kapitel 19), die nach Gl. (2.76) proportional zum Betragsquadrat der komplexen Wellenfunktion ist. Daher sind optische Detektoren nur für die Differenzfrequenz empfindlich. Ähnlich wie Gl. (2.53) eine Grundlage bietet, um die Ausbreitungsrichtung einer Welle aus dem räumlichen Interferenzmuster auf einem Schirm zu bestimmen, gibt uns Gl. (2.80) eine Methode, die Frequenz einer optischen Welle zu bestimmen, indem wir das zeitliche Interferenzmuster am Ausgang eines Photodetektors messen. Die Verwendung der Lichtschwebung in optischen Heterodynempfängern wird in Abschnitt 25.4 näher behandelt. Andere Formen des optischen Mischens verwenden nichtlineare Medien, um Differenzen und Summen optischer Frequenzen zu erzeugen; siehe Kapitel 22. Übung 2-12: Optisches Dopplerradar
Als Ergebnis des Dopplereffekts erfährt eine monochromatische optische Welle der Frequenz 𝜈, die an einem mit der Geschwindigkeitskomponente v entlang der Beobachtungsrichtung eines Beobachters bewegten Gegenstand reflektiert wird, eine Frequenzverschiebung Δ𝜈 = ±(2v ∕𝑐) 𝜈, je nachdem, ob der Gegenstand sich auf den Beobachter zu (+) oder von
ihm weg (−) bewegt. Nehmen Sie an, dass die ursprüngliche und die reflektierte Welle überlagert werden, und geben Sie einen Ausdruck für die Intensität der resultierenden Welle an. Schlagen Sie eine Methode zur Messung der Geschwindigkeit eines Objekts auf der Grundlage dieser Methode vor. Zeigen Sie unter Verwendung von Gl. (2.51), dass eine Schwebungsfrequenz ±(2v ∕𝑐) 𝜈 entsteht, wenn sich einer der Spiegel eines Michelsoninterferometers [Abb. 2.24(b)] mit der Geschwindigkeit ±v bewegt. Interferenz von M monochromatischen Wellen gleicher Intensität mit äquidistanten Frequenzen
Durch Interferenz zahlreicher monochromatischer Wellen mit gleichen Intensitäten und Phasen und äquidistanten Frequenzen können kurze Lichtpulse erzeugt werden. Dazu betrachten wir eine ungerade Zahl 𝑀 = 2𝐿 + 1 von Wellen mit den Intensitäten 𝐼0 und der Phase null und den Frequenzen 𝜈𝑞 = 𝜈0 + 𝑞𝜈F ,
𝑞 = −𝐿, … , 0, … 𝐿
(2.81)
in den Abständen 𝜈F ≪ 𝜈0 um die Mittenfrequenz 𝜈0 . An einem gegebenen Ort lautet die komplexe Wellenfunktion 𝑈(𝑡) =
𝐿 √ ∑ 𝐼0 exp [2πi(𝜈0 + 𝑞𝜈F )𝑡] .
(2.82)
𝑞 = −𝐿
Das ist die Summe von 𝑀 Zeigern mit gleichen Beträgen und Phasen, die sich zwischen zwei aufeinander folgenden Zeigern um 𝜑 = 2π 𝜈F 𝑡 unterscheiden. Die Ergebnisse für die Intensität folgen unmittelbar aus der Analyse in Abschnitt 2.5.2, die mathematisch identisch zu dem vorliegenden Fall ist. Aus Gl. (2.57) und Abb. 2.28 erhalten wir mit der Substitution 𝜑 = 2π 𝑡∕T F mit T F = 1∕𝜈F für die Gesamtintensität 2
𝐼(𝑡) = |𝑈(𝑡)|2 = 𝐼0
sin (𝑀π𝑡∕T F ) 2
sin (π𝑡∕T F )
.
(2.83)
Wie Abb. 2.35 zeigt, ist die Intensität 𝐼(𝑡) eine periodische Folge von optischen Pulsen mit der Periode T F , der Peakintensität 𝑀 2 𝐼0 und der mittleren Intensität 𝐼̄ = 𝑀𝐼0 . Die Intensität der Peaks ist folglich 𝑀 mal so hoch wie die mittlere Intensität. Die Dauer der einzelnen Pulse beträgt ungefähr T F ∕𝑀, sodass die Pulse für große 𝑀 sehr kurz werden. Für 𝜈F = 1 GHz folgt beispielsweise T F = 1 ns; für 𝑀 = 1000 werden Pulse von 1 ps Dauer erzeugt. Dieses Beispiel zeigt eindringlich, wie 𝑀 monochromatische Wellen durch Interferenz eine Folge ultrakurzer optischer Pulse erzeugen können. In Abschnitt 16.4.4 werden wir sehen, dass die Moden eines
Aufgaben
I (t) MI
|V(ν)|
TF
1 2 . ..M
νF
I
TF M
t
ν0
ν
Abb. 2.35 Zeitabhängigkeit der optischen Intensität I(t ) einer polychromatischen Welle aus M monochromatischen Komponenten mit gleichen Intensitäten, gleichen Phasen und Frequenzen in Abständen von 𝜈F . Die Intensität I(t ) ist eine periodische Folge von Pulsen der Periode T F = 1∕𝜈F
mit einem Peak, der M mal so hoch ist wie der Mittelwert ̄I. Die Dauer jedes einzelnen Pulses entspricht 1∕M der optischen Periode; in diesem Fall ist M = 5. Diese Kurven sollten mit denen aus Abb. 2.28 verglichen werden. Das rechte Bild zeigt der Betrag der Fouriertransformierten |V (𝜈)|.
Lasers in genau dieser Weise phasengekoppelt werden können, um Folgen von ultrakurzen Laserpulsen zu erzeugen.
Aufgabe 2-6: Welle in einer Platte mit variablem Brechungsindex
Skizzieren Sie die Wellenfronten einer Welle, die sich in der in Beispiel 1-2 beschriebenen Selfoc-Platte mit variablem Brechungsindex ausbreitet.
Aufgaben Aufgabe 2-1: Kugelwellen
Verwenden Sie Kugelkoordinaten, um zu zeigen, dass die komplexe Amplitude der Kugelwelle nach Gl. (2.19) die Helmholtzgleichung (2.11) erfüllt.
Aufgabe 2-2: Intensität einer Kugelwelle
Leiten Sie einen Ausdruck für die Intensität 𝐼 einer Kugelwelle in einem Abstand 𝑟 von ihrem Zentrum als Funktion der optischen Leistung P her. Wie groß ist die Intensität bei 𝑟 = 1 m für P = 100 W? Aufgabe 2-3: Zylinderwellen
Bestimmen Sie Ausdrücke für die komplexe Amplitude und die Intensität einer monochromatischen Welle, deren Wellenfronten Zylinder um die 𝑦-Achse sind. Aufgabe 2-4: Paraxiale Helmholtzgleichung
Leiten Sie die paraxiale Helmholtzgleichung (2.27) mithilfe der Näherungen aus Gl. (2.25) und Gl. (2.26) her.
Aufgabe 2-7: Reflexion einer Kugelwelle an einem ebenen Spiegel
Eine Kugelwelle wird von einem ebenen Spiegel in einem so großen Abstand vom Ursprung der Welle reflektiert, dass die fresnelsche Näherung erfüllt ist. Betrachten Sie die Kugelwelle als lokal ebene Welle mit langsam variierender Richtung und verwenden Sie das Reflexionsgesetz für ebene Wellen, um die Art der reflektierten Welle zu bestimmen. Aufgabe 2-8: Optische Weglänge
Eine ebene Welle breitet sich senkrecht zu einer dünnen Platte aus, die aus 𝑁 dünnen parallelen Schichten mit den Dicken d 𝑞 und den Brechungsindizes 𝑛𝑞 (𝑞 = 1, 2, … 𝑁) besteht. Vernachlässigen Sie Reflexionen und bestimmen Sie die komplexe Amplitudentransmission der Platte. Wie groß müssen Sie d wählen, damit Sie dieselbe komplexe Amplitudentransmission erhalten, wenn Sie die Platte durch eine Strecke d im Vakuum ersetzen? Zeigen Sie, dass diese Strecke gleich der in Abschnitt 1.1 definierten optischen Weglänge ist. Aufgabe 2-9: Beugungsgitter
Aufgabe 2-5: Konjugierte Wellen
Vergleichen Sie die Intensitäten, Wellenfronten und Wellenfrontnormalen einer monochromatischen Welle mit der komplexen Amplitude 𝑈(r) und einer monochromatischen Welle derselben Frequenz, aber mit der komplexen Amplitude 𝑈 ∗ (r). Verwenden Sie die ebene √ Welle 𝑈(r) = 𝐴 exp[−i𝑘(𝑥 + 𝑦)∕ 2] und die Kugelwelle 𝑈(r) = (𝐴∕𝑟) exp(−i𝑘𝑟) als Beispiele.
Wiederholen Sie Übung 2-7 für eine dünne transparente Platte, deren Dicke d (𝑥, 𝑦) eine quadratische (anstatt sinusförmige) periodische Funktion von 𝑥 mit der Periode 𝛬 ≫ 𝜆 ist. Zeigen Sie, dass der Winkel 𝜃 zwischen den gebeugten Wellen immer noch durch 𝜃 ≈ 𝜆∕𝛬 gegeben ist. Bestimmen Sie die Amplituden der gebeugten ebenen Wellen, wenn eine ebene Welle senkrecht auf das Gitter auftrifft.
53
54
2 Wellenoptik
Aufgabe 2-10: Reflexionsgrad eines Kugelspiegels
Zeigen Sie, dass die komplexe Amplitudenreflexion r(𝑥, 𝑦) (das Verhältnis der komplexen Amplituden der reflektierten und einfallenden Wellen) eines dünnen Kugelspiegels mit dem Radius 𝑅 durch r(𝑥, 𝑦) = ℎ0 exp[−i𝑘0 (𝑥2 + 𝑦 2 )∕𝑅] gegeben ist, wobei ℎ0 eine Konstante ist. Vergleichen Sie dies mit der komplexen Amplitudentransmission einer Linse der Brennweite 𝑓 = −𝑅∕2. Aufgabe 2-11: Stehende Wellen
Geben Sie einen Ausdruck für die Intensität 𝐼 der Superposition zweier ebenen Wellen der Wellenlänge 𝜆 an, die sich in entgegengesetzten Richtungen entlang der 𝑧-Achse ausbreiten. Skizzieren Sie 𝐼 als Funktion von 𝑧. Aufgabe 2-12: Sichtbarkeit eines Interferenzmusters
Die Sichtbarkeit eines Interferenzmusters wie des durch Gl. (2.49) beschriebenen und in Abb. 2.22 gezeigten ist als das Verhältnis 𝒱 = (𝐼max − 𝐼min )∕(𝐼max + 𝐼min ) definiert, wobei 𝐼max und 𝐼min die Maximal- und Minimalwerte von 𝐼 sind. Geben Sie einen Ausdruck für 𝒱 als Funktion des Verhältnisses 𝐼1 ∕𝐼2 der beiden interferierenden Wellen an und bestimmen Sie das Verhältnis 𝐼1 ∕𝐼2 , für das der Kontrast maximal wird.
Weiterführende Literatur Bücher über Wellenoptik und Interferometrie
Siehe auch die allgemeine Literatur in Kapitel 1 D. Fleisch, L. Kinnaman, A Student’s Guide to Waves, Cambridge University Press 2015. M. Mansuripur, Classical Optics and Its Applications, Cambridge University Press, 2. Aufl. 2009. P. Hariharan, Basics of Interferometry, Academic Press, 2. Aufl. 2006. J. R. Pierce, Almost All About Waves, MIT Press 1974; Dover 2006. H. J. Pain, The Physics of Vibrations and Waves, Wiley, 6. Aufl. 2005. R. H. Webb, Elementary Wave Optics, Academic Press 1969; Dover 2005. E. Hecht, A. Zajac, Optics, Addison-Wesley, 2. Aufl. 1990. J. M. Vaughan, The Fabry-Pérot Interferometer, CRC Press 1989. H. D. Young, Fundamentals of Waves, Optics, and Modern Physics, McGraw-Hill, 2. Aufl. 1976. M. Françon, N. Krauzman, J. P. Matieu, M. May, Experiments in Physical Optics, CRC Press 1970. M. Françon, Optical Interferometry, Academic Press 1966. Bücher über Spektroskopie
Aufgabe 2-13: Michelsoninterferometer
Beschreiben Sie die Form des beobachteten Interferenzmusters in der Detektorebene, wenn einer der Spiegel in einem Michelsoninterferometer [Abb. 2.24(b)] um einen kleinen Winkel Δ𝜃 verdreht ist. Was geschieht mit diesem Muster, wenn der andere Spiegel bewegt wird?
D. L. Pavia, G. M. Lampman, G. S. Kriz, J. A. Vyvyan, Introduction to Spectroscopy, Brooks/Cole, 5. Aufl. 2014. B. C. Smith, Fundamentals of Fourier Transform Infrared Spectroscopy, CRC Press/Taylor & Francis, 2. Aufl. 2011. J. M. Hollas, Modern Spectroscopy, Wiley, 4. Aufl. 2010. P. R. Griffiths, J. A. de Haseth, Fourier Transform Infrared Spectrometry, Wiley, 2. Aufl. 2007.
Aufgabe 2-14: Gepulste Kugelwelle
(a) Zeigen Sie, dass eine gepulste Kugelwelle eine komplexe Wellenfunktion der Form 𝑈(r, 𝑡) = (1∕𝑟)a(𝑡 − 𝑟∕𝑐) besitzt, wobei a(𝑡) eine beliebige Funktion ist. (b) Ein ultrakurzer optischer Puls besitzt eine komplexe Wellenfunktion mit einer Mittenfrequenz entsprechend der Wellenlänge 𝜆0 = 585 nm und einer gaußschen Einhüllenden der Standardabweichung 𝜎𝑡 = 6 fs (1 fs = 10−15 s). Wie viele optische Perioden enthält ein Puls? Beschreiben Sie die räumliche Verteilung der Intensität zur Zeit 𝑡 = 1 ps, wenn der Puls zur Zeit 𝑡 = 0 im Ursprung startet und sich als Kugelwelle im Vakuum ausbreitet.
Bücher über Beugungsgitter
C. Palmer, Diffraction Grating Handbook, Richardson Gratings, 7. Aufl. 2014. E. G. Loewen, E. Popov, Diffraction Gratings and Applications, CRC Press 1997. Interferometrie zum Nachweis von Gravitationswellen
S. Wills, ‚Gravitational Waves: The Road Ahead‘, Optics & Photonics News, 5, S. 44–51, 2018. B. P. Abbott et al. (LIGO Scientific Collaboration and Virgo Collaboration), ‚GW170817: Observation of Gravitational Waves from a Binary Neutron Star Inspiral‘, Physical Review Letters 161101, 2017. B. P. Abbott et al. (LIGO Scientific Collaboration and Virgo Collaboration), ‚Observation of Gravitational Waves from a Binary Black Hole Merger‘, Physical Review Letters 061102, 2016.
Aufgaben
B. P. Abbott et al., ‚Astrophysical Implications of the Binary Black Hole Merger GW150914‘, The Astrophysical Journal Letters L22, 2016. R. W. P. Drever, ‚Fabry-Pérot Cavity Gravity-Wave Detectors‘. In D. G. Blair (Hrsg.), The Detection of Gravitational Waves, Cambridge University Press 1991. Kapitel 12, S. 306–328. A. Brillet, J. Gea-Banacloche, G. Leuchs, C. N. Man, J. Y. Vinet, ‚Advanced Techniques: Recycling and Squeezing‘. In D. G. Blair (Hrsg.), The Detection of Gravitational Waves, Cambridge University Press 1991. Kapitel 15, S. 369–405. D. G. Blair, ‚Gravitational Waves in General Relativity‘. In D. G. Blair (Hrsg.), The Detection of Gravitational Waves, Cambridge University Press 1991. Kapitel 1, S. 3–15. A. Einstein, ‚Die Feldgleichungen der Gravitation‘, Sitzungsberichte der Königlich-Preussischen Akademie der Wissenschaften (Berlin), S. 844–847, 1915. Populäre und historische Darstellungen
P. Daukantas, ‚200 Years of Fresnel’s Legacy‘, Optics & Photonics News, 9, S. 40–47, 2015. T. Levitt, A Short, Bright Flash: Augustin Fresnel and the Birth of the Modern Lighthouse, Norton 2013. F. J. Dijksterhuis, Lenses and Waves: Christiaan Huygens and the Mathematical Science of Optics in the Seventeenth Century, Springer 2011. J. Z. Buchwald, The Rise of the Wave Theory of Light: Optical Theory and Experiment in the Early Nineteenth Century, University of Chicago Press 1989. W. E. Kock, Sound Waves and Light Waves, Doubleday/ Anchor 1965. C. Huygens, Treatise on Light, 1690; University of Chicago Press 1945.
Bahnbrechende Arbeiten
G. W. Kamerman (Hrsg.), Selected Papers on Laser Radar, SPIE Optical Engineering Press (Milestone Series Band 133) 1997. P. Hariharan, D. Malacara-Hernandez (Hrsg.), Selected Papers on Interference, Interferometry, and Interferometric Metrology, SPIE Optical Engineering Press (Milestone Series Band 110) 1995. D. Maystre (Hrsg.), Selected Papers on Diffraction Gratings, SPIE Optical Engineering Press (Milestone Series Band 83) 1993. P. Hariharan (Hrsg.), Selected Papers on Interferometry, SPIE Optical Engineering Press (Milestone Series Band 28) 1991.
55
57
3 Optik von Strahlbündeln Kann Licht im Vakuum räumlich gebündelt und transportiert werden, ohne sich dabei beliebig zu verteilen? Obwohl die Wellennatur des Lichts die Möglichkeit eines solchen idealen Transports eigentlich ausschließt, kann Licht doch Strahlbündel bilden, die dem Ideal räumlich lokalisierter und nichtdivergenter Wellen so nahe wie nur möglich kommen. Die beiden Extremfälle räumlicher Eingrenzung sind ebene Wellen und Kugelwellen. Die Wellenfrontnormalen (Strahlen) einer ebenen Welle zeigen in Ausbreitungsrichtung. Der Strahl fächert nicht auf, trotzdem ist die Energie über den gesamten Raum verteilt. Im Gegensatz dazu entspringt eine Kugelwelle aus einem definierten Punkt im Raum, ihre Wellenfrontnormalen (Strahlen) zeigen jedoch in alle Richtungen (vollständige Divergenz). Wellen, deren Wellenfrontnormalen kleine Winkel mit der 𝑧-Achse einschließen, heißen paraxiale Wellen. Sie erfüllen die paraxiale Helmholtzgleichung, die wir in Abschnitt 2.2.3 hergeleitet hatten. Ein Gaußstrahl oder Gaußbündel ist eine wichtige Lösung dieser Gleichung mit besonderen Eigenschaften. Die Leistung eines solchen Strahlbündels ist im Wesentlichen in einem kleinen Zylinder um die Bündelachse konzentriert. Die Intensitätsverteilung in einer beliebigen Ebene senkrecht dazu ist eine um die Bündelachse rotationssymmetrische Gaußfunktion. Die Ausdehnung dieser Funktion ist an der sogenannten Taille des Bündels minimal und nimmt mit steigender Entfernung von diesem Punkt in beiden Richtungen zu. Die Wellenfronten sind in der Nähe der Taille näherungsweise planar, krümmen sich mit steigender Entfernung von der Taille allmählich und werden in großer Entfernung von der Taille annähernd sphärisch. Die Divergenz der Wellenfrontnormalen entspricht dem minimalen Wert, der gemäß der Wellengleichung für einen gegebenen Durchmesser des Bündels möglich ist. Unter idealen Bedingungen erscheint das Licht aus vielen Laserarten als Gaußstrahl.
In diesem Kapitel . . . In Abschnitt 3.1 stellen wir zunächst einen Ausdruck für die komplexe Amplitude eines Gaußstrahls auf und diskutieren seine physikalischen Eigenschaften (Intensität, Leistung, Durchmesser, Divergenz, Fokuslänge und Phase) ausführlich. Die Beeinflussung von Gaußstrahlen (Fokussierung, Führung, Kollimation und Aufweitung) mithilfe verschiedener optischer Komponenten wird in Abschnitt 3.2 behandelt. In den Abschnitten 3.3 und 3.4 führen wir allgemeinere Familien von optischen Strahlbündeln ein, die sogenannten Hermite-Gauß- und Laguerre-GaußStrahlen, zu denen der Gaußstrahl als Spezialfall gehört. Schließlich diskutieren wir in Abschnitt 3.5 nichtbeugende Strahlen wie Bessel-, Bessel-Gaußund Airystrahlen.
3.1 Der Gaußstrahl 3.1.1 Die komplexe Amplitude eines Gaußstrahls In Abschnitt 2.2.3 hatten wir das Konzept der paraxialen Wellen eingeführt. Eine monochromatische paraxiale Welle ist eine ebene Welle e−i𝑘𝑧 (mit der Wellenzahl 𝑘 = 2π∕𝜆 und der Wellenlänge 𝜆), die sich in 𝑧-Richtung ausbreitet. Ihre komplexe Einhüllende 𝐴(r) ist eine langsam variierende Funktion des Ortes (siehe Abb. 2.7), und ihre komplexe Amplitude ist 𝑈(r) = 𝐴(r) exp(−i𝑘𝑧) .
(3.1)
Die Einhüllende ist über eine Entfernung 𝜆 näherungsweise konstant, sodass die Welle ihren Charakter als ebene Welle lokal beibehält und ihre Wellenfrontnormalen paraxiale Strahlen sind.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
58
3 Optik von Strahlbündeln
Damit die komplexe Amplitude 𝑈(r) die Helmholtzgleichung ∇2 𝑈 + 𝑘2 𝑈 = 0 erfüllt, muss die komplexe Einhüllende 𝐴(r) die paraxiale Helmholtzgleichung (2.27) erfüllen, ∇2t 𝐴 − i2𝑘
𝜕𝐴 =0, 𝜕𝑧
(3.2)
Funktionen von 𝑧 und 𝑧0 sind in den Gln. (3.8) und (3.9) angegeben. Wenn wir Gl. (3.6) in Gl. (3.5) einsetzen und Gl. (3.1) verwenden, erhalten wir einen Ausdruck für die komplexe Amplitude 𝑈(r) des Gaußstrahls: 𝑈(r) = 𝐴0
wobei ∇2t = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 der transversale Laplaceoperator ist. Eine einfache Lösung der paraxialen Helmholtzgleichung ist die Parabolwelle (siehe Übung 2-2), für die 𝜌2 𝐴 𝐴(r) = 1 exp (−i𝑘 ) , 𝑧 2𝑧
𝜌 =𝑥 +𝑦 2
2
2
𝜌2 𝐴1 exp [−i𝑘 ], 𝑞(𝑧) 2𝑞(𝑧)
𝜌2 𝐴1 exp [−i𝑘 ], 𝑞(𝑧) 2𝑞(𝑧)
𝑞(𝑧) = 𝑧 − 𝜉 . (3.4)
𝜌2 + i𝜁(𝑧)] , 2𝑅(𝑧)
(3.7)
2
1+(
𝑅(𝑧) = 𝑧 [1 + (
𝑧 ) , 𝑧0
𝑧0 2 )], 𝑧
𝑧 𝜁(𝑧) = tan−1 , 𝑧0 √ 𝜆𝑧0 𝑊0 = . π
(3.8) (3.9) (3.10) (3.11)
Dabei haben wir aus Gründen der Bequemlichkeit eine neue Konstante 𝐴0 = 𝐴1 ∕i𝑧0 eingeführt. Der hier angegebene Ausdruck für die komplexe Amplitude des Gaußstrahls ist eine zentrale Aussage dieses Kapitels. Er enthält zwei unabhängige Parameter 𝐴0 und 𝑧0 , die aus den Randbedingungen bestimmt werden. Alle anderen Parameter hängen durch die Gln. (3.8) bis (3.11) mit 𝑧0 und der Wellenlänge 𝜆 zusammen. Die Bedeutung dieser beiden Parameter wird in Kürze deutlich werden.
3.1.2
Eigenschaften von Gaußstrahlen
Im Folgenden wollen wir die Eigenschaften des Gaußstrahls anhand der Gln. (3.7)–(3.11) diskutieren. Intensität
𝑞(𝑧) = 𝑧 + i𝑧0 . (3.5)
Die Größe 𝑞(𝑧) wird als q-Parameter des Bündels bezeichnet, und 𝑧0 ist seine Rayleighlänge. Um Amplitude und Phase dieser komplexen Einhüllenden zu separieren, schreiben wir die komplexe Funktion 1∕𝑞(𝑧) = 1∕(𝑧 + i𝑧0 ) als Funktion ihres Real- und Imaginärteils, indem wir die neuen reellen Funktionen 𝑅(𝑧) und 𝑊(𝑧) definieren, sodass 1 1 𝜆 = −i . 𝑞(𝑧) 𝑅(𝑧) π𝑊 2 (𝑧)
√
(3.3)
Das ist die Gleichung einer Parabolwelle um den Punkt 𝑧 = 𝜉 anstelle von 𝑧 = 0. Auch wenn 𝜉 komplex ist, bleibt Gl. (3.4) eine Lösung von Gl. (3.2), die Lösung besitzt dann jedoch vollkommen andere Eigenschaften. Wenn 𝜉 rein imaginär ist, z. B. 𝜉 = −i𝑧0 mit reellem 𝑧0 , liefert Gl. (3.4) die komplexe Einhüllende eines Gaußstrahls: 𝐴(r) =
exp [−i𝑘𝑧 − i𝑘
𝑊(𝑧) = 𝑊0
gilt, wobei 𝐴1 eine Konstante ist. Die Parabolwelle ist die paraxiale Näherung der Kugelwelle 𝑈(𝑟) = (𝐴1 ∕𝑟) exp(−i𝑘𝑟), wenn 𝑥 und 𝑦 viel keiner sind als 𝑧 (siehe Abschnitt 2.2.2). Eine andere Lösung der paraxialen Helmholtzgleichung führt zum Gaußstrahl. Er lässt sich durch eine einfache Transformation aus der Parabolwelle erhalten. Da die komplexe Einhüllende der Parabolwelle Gl. (3.3) eine Lösung der paraxialen Helmholtzgleichung (3.2) ist, gilt dies auch nach einer Ersetzung von 𝑧 durch 𝑧 − 𝜉 mit einer Konstante 𝜉, 𝐴(r) =
𝑊0 𝜌2 exp [− 2 ] 𝑊(𝑧) 𝑊 (𝑧)
(3.6)
Wir werden später zeigen, dass 𝑊(𝑧) und 𝑅(𝑧) Maße für den Radius des Bündels und den Krümmungsradius der Wellenfront sind. Ausdrücke für 𝑊(𝑧) und 𝑅(𝑧) als
Die optische Intensität 𝐼(r) = |𝑈(r)|2 ist eine√Funktion der axialen und radialen Position, 𝑧 und 𝜌 = 𝑥2 + 𝑦 2 , 𝐼(𝜌, 𝑧) = 𝐼0 [
𝑊0 2 2𝜌2 ] exp [− 2 ] 𝑊(𝑧) 𝑊 (𝑧)
(3.12)
mit 𝐼0 = |𝐴0 |2 . Für jeden Wert von 𝑧 ist die Intensität eine Gaußfunktion des radialen Abstands 𝜌 – daher die Bezeichnung „Gaußstrahl“. Das Maximum der Gaußfunktion liegt auf der 𝑧-Achse bei 𝜌 = 0, und die Funktion nimmt mit steigendem 𝜌 monoton ab. Der Strahlradius 𝑊(𝑧) der Gaußverteilung nimmt mit steigender axialer Entfernung 𝑧 zu, wie Abb. 3.1 zeigt.
3.1 Der Gaußstrahl
Abb. 3.1 Die normierte Strahlintensität I∕I0 als Funktion des radialen Abstands 𝜌 an unterschiedlichen axialen Positionen: (a) z = 0; (b) z = z0 ; (c) z = 2z0 .
I / I0
I / I0
(a)
I / I0
(b)
0
W0
(c)
x
W0
0
x
W0
0
I I0 1
Abb. 3.2 Die normierte Strahlintensität I∕I0 auf der Strahlachse (𝜌 = 0) als Funktion der axialen Position z auf der Achse. 0.5
0.5
–z 0
0
z0
z
Auf der Strahlachse (𝜌 = 0) reduziert sich die Intensität gemäß Gl. (3.12) auf 𝐼(0, 𝑧) = 𝐼0 [
𝑊0 2 𝐼0 . ] = 𝑊(𝑧) 1 + (𝑧∕𝑧0 )2
(3.13)
Sie hat ihren Maximalwert 𝐼0 bei 𝑧 = 0 und nimmt mit steigendem 𝑧 allmählich ab; die Hälfte des Maximalwerts wird bei 𝑧 = ±𝑧0 erreicht (Abb. 3.2). Für |𝑧| ≫ 𝑧0 ist 𝐼(0, 𝑧) ≈ 𝐼0 𝑧02 ∕𝑧2 , sodass die Intensität mit steigendem Abstand nach einem 1∕𝑟 2 -Gesetz abnimmt, genau wie für Kugel- und Parabolwellen. Das Zentrum des Strahlbündels (𝑧 = 0, 𝜌 = 0) ist der Ort der größten Intensität: 𝐼(0, 0) = 𝐼0 .
𝐼(𝜌, 𝑧) =
2𝜌2 2P exp [− 2 ] . 2 π 𝑊 (𝑧) 𝑊 (𝑧)
(3.16)
Das Verhältnis der innerhalb eines Kreises mit Radius 𝜌0 in einer transversalen Ebene übertragenen Leistung zur gesamten Leistung an der Position 𝑧 ist 𝜌0
1
∫ 𝐼(𝜌, 𝑧) 2π 𝜌 d𝜌 = 1 − exp [−
2𝜌02 𝑊 2 (𝑧)
].
(3.17)
0
Die gesamte von einem Strahlbündel übertragene optische Leistung ist das Integral der optischen Intensität über eine beliebige transversale Ebene (z. B. an der Position 𝑧), ∞
P = ∫ 𝐼(𝜌, 𝑧) 2π 𝜌 d𝜌 ,
(3.14)
Die innerhalb eines Kreises mit Radius 𝜌0 = 𝑊(𝑧) übertragene Leistung entspricht folglich etwa 86 % der gesamten Leistung des Strahls. Innerhalb eines Kreises mit Radius 1.5 𝑊(𝑧) werden ungefähr 99 % der Gesamtleistung übertragen. Durchmesser
0
also (
)
P = 𝐼0 π 𝑊02 . 2
Das Ergebnis hängt nicht von 𝑧 ab, was zu erwarten war. Da die Leistung P häufig zur Beschreibung optischer Strahlbündel verwendet wird, ist es nützlich, 𝐼0 mithilfe von Gl. (3.15) als Funktion von P zu schreiben. So erhalten wir Gl. (3.12) in der Form
P
Leistung
1
x
(3.15)
Die Leistung des Strahlbündels ist somit gleich der halben Strahlintensität multipliziert mit der Strahlfläche.
Unabhängig von der 𝑧-Position ist die Strahlintensität stets auf der Strahlachse am größten; in einem radialen Abstand 𝜌 = 𝑊(𝑧) nimmt sie ungefähr auf einen Anteil 1∕e2 ≈ 0.135 ab. Da innerhalb eines Kreises mit Radius 𝑊(𝑧) etwa 86 % der Leistung des Strahls übertragen werden, können wir 𝑊(𝑧) als den Radius des Strahls
59
60
3 Optik von Strahlbündeln
W(z)
W0
2W0 θ0
–3z0
–2z0
–z0
0
z0
ansehen. Die quadratisch gemittelte Breite 1) der Inten1 sitätsverteilung liefert dagegen 𝜎 = 𝑊(𝑧) (siehe Ab2 schnitt A.2 für verschiedene Definitionen der Dicke eines Strahls). Die Abhängigkeit des Strahlradius von 𝑧 wird durch Gl. (3.8) beschrieben: √ 2 𝑧 (3.18) 𝑊(𝑧) = 𝑊0 1 + ( ) . 𝑧0 Der Radius nimmt seinen minimalen Wert 𝑊0 in der Ebene 𝑧 = 0 an. Dort liegt die Taille des Strahls, und 𝑊0 ist daher auch unter der Bezeichnung Taillenradius bekannt. Der Taillendurchmesser 2𝑊0 wird auch als Spotgröße bezeichnet. Der Strahlradius nimmt mono√ ton mit 𝑧 zu und erreicht bei 𝑧 = ±𝑧0 den Wert 2𝑊0 (Abb. 3.3).
Für 𝑧 ≫ 𝑧0 kann der erste Term in Gl. (3.18) vernachlässigt werden, sodass man eine lineare Beziehung erhält, 𝑊0 𝑧 = 𝜃0 𝑧 . 𝑧0
(3.19)
Wie Abb. 3.3 zeigt, divergiert der Strahl dann wie ein Kegel mit dem halben Öffnungswinkel 𝜃0 =
𝑊0 𝜆 = , 𝑧0 π𝑊0
(3.20)
wobei wir Gl. (3.11) verwendet haben. Ungefähr 86 % der Leistung des Strahls ist in diesem Kegelmantel enthalten, wie Gl. (3.17) bestätigt. Wenn wir Gl. (3.20) umschreiben und den Taillendurchmesser 2𝑊0 einführen, erhalten wir für den Divergenzwinkel des Strahls 4 𝜆 2𝜃0 = . π 2𝑊0
(3.21)
Der Divergenzwinkel ist direkt proportional zur Wellenlänge 𝜆 und umgekehrt proportional zum Taillendurchmesser 2𝑊0 . Wenn man einen möglichst kleinen Strahldurchmesser an der Taille anstrebt, muss man gleichzeitig eine größere Divergenz in Kauf nehmen. Um einen 1) RMS (root mean square) width.
z
3z0
stark gebündelten Strahl zu erzeugen, muss man daher eine kleine Wellenlänge und eine dicke Taille kombinieren. Fokuslänge
Da der Strahl bei 𝑧 = 0 seinen minimalen Durchmesser besitzt, wie auch Abb. 3.3 zeigt, ist er in der Ebene 𝑧 = 0 am stärksten gebündelt. Von hier aus wird der Strahl in beide Richtungen allmählich defokussiert. Die axiale Entfernung, in der der Durchmesser des Strahl um einen √ Faktor 2 gegenüber seinem Minimalwert ansteigt – die Strahlfläche also um einen Faktor 2 –, wird als Fokuslänge oder konfokaler Parameter (manchmal auch Schärfentiefe) des Strahls bezeichnet (Abb. 3.4). Aus den Gln. (3.18) und (3.11) wird deutlich, dass die Fokuslänge gleich der doppelten Rayleighlänge ist: 2𝑧0 =
Divergenz
𝑊(𝑧) ≈
2z0
Abb. 3.3 Die Strahldicke W (z) nimmt an der Taille (z = 0) ihren Minimalwert W0 an, erreicht für z = ±z0 den Wert √ 2W0 und nimmt für große z linear mit z zu.
2π 𝑊02 𝜆
.
(3.22)
Die Fokuslänge ist aus diesem Grund direkt proportional zur Strahlfläche π𝑊02 an der Taille und umgekehrt proportional zur Wellenlänge 𝜆. Ein Strahl, der an der Taille stark fokussiert ist (einen kleinen Taillendurchmesser besitzt), hat daher eine kleine Fokuslänge; das Auffinden der Schärfenebene erfordert dann eine größere Sorgfalt. Nur für kleine Wellenlängen sind ein kleiner Taillendurchmesser und eine große Fokuslänge in Einklang zu bringen. Beispielsweise entspricht für 𝜆0 = 633 nm (eine typische Wellenlänge eines He−NeLasers) ein Taillendurchmesser von 2𝑊0 = 2 cm einer Fokuslänge von 2𝑧0 ≈ 1 km. Ein kleinerer Taillendurchmesser von 20 μm entspricht auch einer kleineren Fokuslänge von etwa 1 mm. Phase
Die Phase eines Gaußstrahls ist nach Gl. (3.7) 2) 𝜑(𝜌, 𝑧) = 𝑘𝑧 − 𝜁(𝑧) +
𝑘𝜌2 . 2𝑅(𝑧)
(3.23)
2) Die hier und generell in diesem Kapitel verwendete Phase 𝜑(𝜌, 𝑧) hängt mit dem in Gl. (3.7) definierten Phasenfaktor gemäß exp(−i𝜑) zusammen.
3.1 Der Gaußstrahl
–2z0
2 W0
W0
–z0
z0
0
2z 0
z
2z0
Abb. 3.4 Fokuslänge eines Gaußstrahls. ζ (z) π /2 π /4 –3z0
–2z0
–z0
0 –π /4
z0
2z0
3z0
z
Abb. 3.5 Die Funktion 𝜁(z) beschreibt eine Phasenverzögerung des Gaußstrahls gegenüber einer gleichförmigen ebenen Welle für alle Punkte auf der Strahlachse.
–π /2
R(z) 2z0 –3z0
–2z0
–z0
0
z0
2z0
3z0
–2z0
Auf der Strahlachse (𝜌 = 0) besteht die Phase aus zwei Komponenten: 𝜑(0, 𝑧) = 𝑘𝑧 − 𝜁(𝑧) .
(3.24)
Der erste Anteil, 𝑘𝑧, ist die Phase einer ebenen Welle. Der zweite entspricht einer Phasenverzögerung 𝜁(𝑧) gemäß Gl. (3.10), die Werte von −π∕2 bei 𝑧 = −∞ bis +π∕2 bei 𝑧 = ∞ annimmt, wie Abb. 3.5 illustriert. Diese Phasenverzögerung entspricht einer Verzögerung der Wellenfront gegenüber einer ebenen Welle (siehe dazu auch Abb. 3.8). Die kumulierte Verzögerung auf dem Weg der Welle von 𝑧 = −∞ nach 𝑧 = ∞ beträgt π. Diese Erscheinung ist als Gouyeffekt bekannt. Er entsteht aufgrund der transversalen räumlichen Eingrenzung des Strahls, der wegen der Fouriertransformation mit einer Verbreiterung der transversalen Komponenten seines Wellenvektors einhergeht. Dies führt wiederum zu einer Verkleinerung der axialen Komponente √ 𝑘𝑧 des Wellenvek-
tors im Vergleich zu ihrem Wert 𝑘𝑧 = 𝑘2 − 𝑘𝑥2 − 𝑘𝑦2 für ebene Wellen (siehe Abschnitt 2.2.2). 3)
3) Siehe S. Feng, H. G. Winful, ‚Physical Origin of the Gouy Phase Shift‘, Optics Letters 26, 187–485, 2001.
z
Abb. 3.6 Der Krümmungsradius R(z) der Wellenfronten eines Gaußstrahls als Funktion der Position entlang der Strahlachse. Die gestrichelte Linie gibt den Krümmungsradius einer Kugelwelle an.
Wellenfront
Die dritte Komponente in Gl. (3.23) sorgt für eine Krümmung der Wellenfront. Sie beschreibt die Abweichung der Phase an achsfernen Punkten in einer gegebenen transversalen Ebene von der Phase auf der Achse. Die Flächen konstanter Phase folgen der Beziehung 𝑘[𝑧 + 𝜌2 ∕2𝑅(𝑧)] − 𝜁(𝑧) = 2π 𝑞. Da 𝜁(𝑧) und 𝑅(𝑧) relativ langsam variierende Funktionen sind, sind sie auf Punkten innerhalb des Strahls auf jeder Wellenfront näherungsweise konstant. Daher können wir 𝑧 + 𝜌2 ∕2𝑅 ≈ 𝑞𝜆 + 𝜁𝜆∕2π schreiben, wobei 𝑅 = 𝑅(𝑧) und 𝜁 = 𝜁(𝑧) ist. Das ist die Gleichung einer parabolischen Fläche mit dem Krümmungsradius 𝑅. Folglich ist 𝑅(𝑧) wie in Abb. 3.6 gezeigt der Krümmungsradius der Wellenfront an der Position 𝑧 entlang der Strahlachse. Wie man aus Abb. 3.6 sieht, ist der Krümmungsradius 𝑅(𝑧) für 𝑧 = 0 unendlich, sodass die Wellenfronten planar sind, also nicht gekrümmt. Der Krümmungsradius nimmt bei 𝑧 = 𝑧0 seinen Minimalwert 2𝑧0 an; dort ist die Wellenfront am stärksten gekrümmt (Abb. 3.7). Danach nimmt der Krümmungsradius mit steigendem 𝑧 zu, bis für 𝑧 ≫ 𝑧0 schließlich 𝑅(𝑧) ≈ 𝑧 ist. Die Wellenfronten sind dann näherungsweise die einer Kugelwelle. Für negative 𝑧 wiederholt sich das Verhalten der Wellenfronten bis auf das umgekehrte Vorzeichen (Abb. 3.8). Dabei
61
62
3 Optik von Strahlbündeln
x
–2z0
–z0
Abb. 3.7 Die Wellenfronten eines Gaußstrahls.
0
(a)
z
(b)
z
(c)
z
Abb. 3.8 Wellenfronten (a) einer gleichförmigen ebenen Welle; (b) einer Kugelwelle; (c) eines Gaußstrahls. In der Nähe des Strahlzentrums ähnelt der Gaußstrahl einer ebenen Welle. Für große z verhält sich der Strahl wie eine Kugelwelle, nur dass seine Phase um π∕2 verzögert ist (ein Viertel des Abstands zwischen zwei benachbarten Wellenfronten).
folgen wir der Konvention, dass eine divergierende Wellenfront einen positiven Krümmungsradius besitzt, wohingegen der Krümmungsradius einer konvergierenden Wellenfront negativ ist. Parameter zur Charakterisierung eines Gaußstrahls
Wieviele Parameter benötigen wir, um eine ebene Welle, eine Kugelwelle und einen Gaußstrahl zu beschreiben, wenn die Wellenlänge 𝜆 bekannt ist? Eine ebene Welle ist durch ihre komplexe Amplitude und ihre Richtung vollständig charakterisiert. Eine Kugelwelle ist durch ihre komplexe Amplitude und ihren Ursprung spezifiziert. Für einen Gaußstrahl benötigen wir dagegen zusätzliche Parameter: Seine Maximalamplitude [𝐴0 in Gl. (3.7)], seine Richtung (die Strahlachse), die Position der Strahltaille sowie einen weiteren Parameter wie z. B. den Taillenradius 𝑊0 oder die Rayleighlänge 𝑧0 . Wenn wir die Maximalamplitude und die Strahlachse kennen, brauchen wir also noch zwei weitere Parameter, um den Strahl vollständig zu charakterisieren.
z0
2z0
z
Wenn der komplexe 𝑞-Parameter 𝑞(𝑧) = 𝑧 + i𝑧0 bekannt ist, ergeben sich die Lage 𝑧 der Taille und die Rayleighlänge 𝑧0 einfach aus dessen Real- und Imaginärteil. Wenn 𝑞(𝑧) an einem bestimmten Punkt auf der Achse beispielsweise den Wert (3 + 4i) cm besitzt, können wir sofort schließen, dass die Taille in einer Entfernung 𝑧 = 3 cm links von diesem Punkt liegen muss und dass die Fokuslänge 2𝑧0 = 8 cm beträgt. Damit können wir den Taillenradius 𝑊0 aus Gl. (3.11) berechnen. Der Parameter 𝑞(𝑧) reicht also aus, um einen Gaußstrahl mit bekannter Maximalamplitude und Strahlachse vollständig zu charakterisieren. Wenn wir den Parameter 𝑞(𝑧) an einem einzigen Punkt kennen, dann können wir ihn wegen seiner linearen Abhängigkeit von 𝑧 an beliebigen Punkten berechnen: Wenn 𝑞(𝑧) = 𝑞1 und 𝑞(𝑧 + d ) = 𝑞2 ist, dann ist 𝑞2 = 𝑞1 + d . In dem soeben gegebenen Beispiel ist bei 𝑧 = 13 cm offensichtlich 𝑞 = 13 + 4i. Wenn der Strahlradius 𝑊(𝑧) und der Krümmungsradius 𝑅(𝑧) an einem beliebigen Punkt auf der Strahlachse bekannt sind, können 𝑧, 𝑧0 und 𝑊0 durch Lösung der Gln. (3.8), (3.9) und (3.11) bestimmt werden. Alternativ kann der Strahl auch charakterisiert werden, indem man 𝑞(𝑧) mithilfe von Gl. (3.6) aus 𝑊(𝑧) und 𝑅(𝑧) bestimmt. Zusammenfassung
• Bei 𝑧 = 𝑧0 gilt: In einer axialen Entfernung 𝑧0 von der Taille besitzt die Welle die folgenden Eigenschaften: – Die Intensität auf der Strahlachse ist gleich der halben Maximalintensität. √ – Der Strahlradius ist um einen Faktor 2 größer als an der Taille; die Strahlfläche entsprechend um einen Faktor 2. – Die Phase auf der Strahlachse liegt gegenüber der Phase einer ebenen Welle um einen Winkel π∕4 zurück. – Der Krümmungsradius der Wellenfront erreicht seinen Minimalwert 𝑅 = 2𝑧0 ; die Krümmung der Wellenfront ist also maximal. • In der Nähe des Strahlzentrums gilt: Wenn |𝑧| ≪ 𝑧0 und 𝜌 ≪ 𝑊0 ist, ist exp[−𝜌2 ∕𝑊 2 (𝑧)] ≈ exp(−𝜌2 ∕𝑊02 ) ≈ 1, sodass die Strahlintensität, die proportional zum Quadrat dieser Größe ist, näherungsweise konstant
3.1 Der Gaußstrahl
ist. Außerdem ist 𝑅(𝑧) ≈ 𝑧02 ∕𝑧 und 𝜁(𝑧) ≈ 0, sodass wegen Gl. (3.11) mit 𝑧0 ≫ 𝜆 die Phase gleich 𝑘[𝑧 + 𝜌2 ∕2𝑅(𝑧)] ≈ 𝑘𝑧(1 + 𝜌2 ∕2𝑧02 ) ≈ 𝑘𝑧 ist. In der Nähe seines Zentrums kann der Gaußstrahl daher näherungsweise durch eine ebene Welle beschrieben werden. • In großer Entfernung von der Strahltaille gilt: Für radiale Abstände innerhalb des Strahlradius (𝜌 < 𝑊0 ), aber in großer axialer Entfernung von der Strahltaille (𝑧 ≫ 𝑧0 ), verhält sich die Welle näherungsweise wie eine Kugelwelle. In diesem Bereich ist 𝑊(𝑧) ≈ 𝑊0 𝑧∕𝑧0 ≫ 𝑊0 und 𝜌 < 𝑊0 , sodass exp[−𝜌2 ∕𝑊 2 (𝑧)] ≈ 1 und die Strahlintensität annähernd konstant ist. Da in diesem Fall 𝑅(𝑧) ≈ 𝑧 gilt, sind die Wellenfronten näherungsweise sphärisch. Abgesehen von der Gouyphase 𝜁(𝑧) ≈ π∕2 entspricht die komplexe Amplitude des Gaußstrahls hier derjenigen einer Parabolwelle, die wiederum gleich der einer Kugelwelle in der paraxialen Näherung ist.
Übung 3-3: Charakterisierung eines Strahls durch Strahlradius und Krümmung
Betrachten Sie einen Gaußstrahl, dessen Radius 𝑊 und Krümmungsradius 𝑅 für einen bestimmten Punkt auf der Strahlachse bekannt sind (Abb. 3.9). Zeigen Sie, dass die Strahltaille in einer Entfernung 𝑧=
𝑅 1 + (𝜆𝑅∕π𝑊 2 )2
(3.25)
links von diesem Punkt liegt und dass der Taillenradius gleich 𝑊0 = √
𝑊
(3.26)
1 + (π𝑊 2 ∕𝜆𝑅)2
ist.
Abb. 3.9 Bestimmung von z und W0 aus W und R.
W W0
R
Übung 3-1: Parameter eines gaußschen Laserstrahls
Ein He-Ne-Laser mit einer Leistung von 1 mW erzeugt einen Gaußstrahl bei einer Wellenlänge von 𝜆 = 633 nm mit einem Taillendurchmesser von 2𝑊0 = 0.1 mm. (a) Bestimmen Sie die Divergenz des Strahls, seine Fokuslänge und seinen Durchmesser bei 𝑧 = 3.5 × 105 km (das entspricht etwa der Entfernung zum Mond). (b) Wie groß ist der Krümmungsradius der Wellenfront bei 𝑧 = 0, 𝑧 = 𝑧0 und 𝑧 = 2𝑧0 ? (c) Wie groß ist die optische Intensität (in W∕cm2 ) im Strahlzentrum (𝑧 = 0, 𝜌 = 0) und bei 𝑧 = 𝑧0 ? Vergleichen Sie dieses Ergebnis mit der Intensität bei 𝑧 = 𝑧0 einer Kugelwelle mit einer Leistung von 100 W, die durch eine kleine, isotrop emittierende Lichtquelle am Ort 𝑧 = 0 erzeugt wird. Übung 3-2: Gültigkeit der paraxialen Näherung für einen Gaußstrahl
Die komplexe Einhüllende 𝐴(r) eines Gaußstrahls ist eine exakte Lösung der paraxialen Helmholtzgleichung (3.2), die zugehörige komplexe Amplitude 𝑈(r) = 𝐴(r) exp(−i𝑘𝑧) ist jedoch nur eine Näherungslösung der Helmholtzgleichung (2.11). Der Grund dafür ist, dass die paraxiale Helmholtzgleichung selbst nur eine Näherung ist, die nur gilt, so lange Gl. (2.25) erfüllt ist. Zeigen Sie, dass die notwendige Bedingung Gl. (2.25) für die Gültigkeit der paraxialen Helmholtzgleichung erfüllt ist, sofern der Divergenzwinkel 𝜃0 eines Gaußstrahls klein ist (𝜃0 ≪ 1).
z
Übung 3-4: Bestimmung von Radius und Krümmung aus Werten an einem anderen Punkt
Nehmen Sie an, dass der Strahl- bzw. Krümmungsradius eines Gaußstrahls der Wellenlänge 𝜆 = 1 μm an einem gegebenen Punkt auf der Strahlachse 𝑊1 = 1 mm bzw. 𝑅1 = 1 m sind (Abb. 3.10). Bestimmen Sie den Strahlradius 𝑊2 und den Krümmungsradius 𝑅2 in einer Entfernung d = 10 cm rechts von diesem Punkt.
W1 R1
W2
Abb. 3.10 Bestimmung von W2 und R2 aus W1 , R1 und d.
R2
Übung 3-5: Charakterisierung eines Strahls durch seine Krümmung an zwei Punkten
Ein Gaußstrahl besitzt an zwei Punkten auf der Strahlachse im Abstand d die Krümmungsradien 𝑅1 und 𝑅2 wie in Abb. 3.11 dargestellt. Zeigen Sie, dass die Position des Strahlzentrums und seine Fokuslänge
63
64
3 Optik von Strahlbündeln
durch die Beziehungen −d (𝑅2 − d ) , 𝑅2 − 𝑅1 − 2d −d (𝑅1 + d )(𝑅2 − d )(𝑅2 − 𝑅1 − d ) 𝑧02 = (𝑅2 − 𝑅1 − 2d )2 𝑧1 =
√ 𝑊0 =
(3.27) und (3.28)
𝜆𝑧0 π
gegeben sind. Abb. 3.11 Bestimmung von z1 , z2 , z0 und W0 aus R1 , R2 und d.
z2 z1 R1
R2
3.1.3 Die Qualität eines Strahlbündels Ein Gaußstrahl ist eine Idealisierung, die selbst in hochwertigen Lasersystemen nur näherungsweise erreicht wird. Ein Maß für die Qualität eines Strahlbündels ist seine Abweichung von der Gaußform. Für ein Strahlbündel mit dem Taillendurchmesser 2𝑊m und dem Divergenzwinkel 2𝜃m liefert der 𝕄2 -Faktor einen nützlichen numerischen Qualitätsmaßstab. Er ist als das Verhältnis des Produkts aus Taillendurchmesser und Divergenzwinkel, 2𝑊m ⋅ 2𝜃m (meist in mm ⋅ mrad gemessen) eines gegebenen Strahlbündels zu dem für einen Gaußstrahl erwarteten Wert definiert, der gleich 2𝑊0 ⋅ 2𝜃0 = 4𝜆∕π ist: 𝕄2 =
2𝑊m ⋅ 2𝜃m . 4𝜆∕π
(3.29)
Wenn die beiden Strahlbündel denselben Taillendurchmesser haben, ist der 𝕄2 -Faktor einfach das Verhältnis ihrer Divergenzen, 𝕄2 = 𝜃m ∕𝜃0 ,
(3.30)
wobei 𝜃0 = 𝜆∕π𝑊0 = 𝜆∕π𝑊m gilt [siehe Gl. (3.21)]. Da ein Gaußstrahl den kleinsten möglichen Divergenzwinkel aller Strahlbündel mit demselben Taillendurchmesser besitzt, ist 𝕄2 ≥ 1. Der 𝕄2 -Faktor eines optischen Strahlbündels gibt somit an, dass sein Divergenzwinkel 𝕄2 mal so groß ist wie der eines Gaußstrahls mit demselben Taillendurchmesser.
Für die Strahlbündel aus üblichen Helium-NeonLasern gilt meist 𝕄2 < 1.1. Für Ionenlaser liegt 𝕄2 in der Regel im Bereich 1.1–1.3. Gebündelte TEM00 -Diodenlaserstrahlen erreichen typischerweise 𝕄2 ≈ 1.1−1.7, wohingegen Hochleistungs-Vielmodenlaser 𝕄2 -Werte bis zu 3 oder 4 besitzen. Wenn ein optisches Strahlbündel näherungsweise Gaußform besitzt, kann sein 𝕄2 -Faktor bestimmt werden, indem man mit einer CCD-Kamera 4) das Intensitätsprofil des Strahlbündels an verschiedenen Positionen entlang des Strahls vermisst. Dazu fokussiert man den Strahl mithilfe einer hochwertigen Linse mit langer Brennweite und großem 𝐹# (siehe Abschnitt 4.4.3) auf einen Durchmesser, der ungefähr der Größe des verwendeten CCD-Elements entspricht [siehe Gl. (3.47)]. Zuerst sucht man das Strahlzentrum auf, indem man die Ebene bestimmt, in der der Brennfleck minimal wird; hier wird der Taillendurchmesser 2𝑊𝑚 gemessen. Die axiale Entfernung vom Strahlzentrum bis zu der√Ebene, in der der Strahldurchmesser um einen Faktor 2 vergrößert ist, ergibt die Rayleighlänge 𝑧m . Eine Abschätaus der für Gaußzung für die Divergenz 2𝜃m erhält man√ strahlen geltenden Beziehung 𝜃m = 𝜆∕π𝑧m , die aus den Gln. (3.11) und (3.20) folgt. Schließlich kann der 𝕄2 Faktor mithilfe von Gl. (3.29) berechnet werden.
3.2 Durchgang durch optische Komponenten Als Nächstes wollen wir die Wirkung verschiedener optischer Komponenten auf einen Gaußstrahl diskutieren. Dabei werden wir zeigen, dass ein Gaußstrahl beim Durchgang durch rotationssymmetrische optische Komponenten, deren optische Achse mit der Strahlachse zusammenfällt, stets ein Gaußstrahl bleibt – jedenfalls solange das Gesamtsystem die Anwendung der paraxialen Näherung erlaubt. Der Strahl verformt sich dabei jedoch; Taille und Krümmung verändern sich. Die Ergebnisse des folgenden Abschnitts sind von großer Bedeutung für die Konstruktion optischer Instrumente, die auf Gaußstrahlen beruhen.
3.2.1
Durchgang durch eine dünne Linse
Die komplexe Amplitudentransmission einer dünnen Linse der Brennweite 𝑓 ist proportional zu exp(i𝑘𝜌2 ∕2𝑓) [siehe Gl. (2.40)]. Wenn ein Gaußstrahl durch eine solche Komponente hindurchtritt, wird seine komplexe 4) CCD = charge-coupled device, das in Digitalkameras am häufigsten zur Registrierung des Bildes verwendete Halbleiterbauelement.
3.2 Durchgang durch optische Komponenten
Abb. 3.12 Durchgang eines Gaußstrahls durch eine dünne Linse.
zʹ
z W0
W R
θ0
W0ʹ
Wʹ Rʹ
z0
θʹ0
zʹ0
Amplitude, Gl. (3.7), mit diesem Phasenfaktor multipliziert. Hierdurch wird der Strahlradius nicht verändert (𝑊 ′ = 𝑊), wohl aber die Wellenfront. Wir betrachten einen Gaußstrahl mit dem Zentrum bei 𝑧 = 0 mit dem Taillenradius 𝑊0 , der durch eine dünne Linse an der Position 𝑧 hindurchtritt, wie Abb. 3.12 zeigt. Die Phase der einfallenden Welle in der Ebene der Linse ist nach Gl. (3.23) gleich 𝑘𝑧 + 𝑘𝜌2 ∕2𝑅 − 𝜁, wobei 𝑅 = 𝑅(𝑧) und 𝜁 = 𝜁(𝑧) durch die Gln. (3.9) und (3.10) gegeben sind. Die Phase der durchgelassenen Welle wird dann 𝑘𝑧 + 𝑘
𝜌2 𝜌2 𝜌2 = 𝑘𝑧 + 𝑘 ′ − 𝜁 −𝜁−𝑘 2𝑅 2𝑅 2𝑓
(3.31)
mit 1 1 1 = − . 𝑅′ 𝑅 𝑓
(3.32)
Wir erkennen daraus, dass die durchgelassene Welle ebenfalls ein Gaußstrahl mit dem Strahlradius 𝑊 ′ = 𝑊 und dem Krümmungsradius 𝑅′ ist, wobei 𝑅′ die Abbildungsgleichung 1∕𝑅 − 1∕𝑅′ = 1∕𝑓 erfüllt. 𝑅 ist positiv, da die Wellenfront des einfallenden Strahls divergiert, während die des durchgelassenen Strahls konvergiert. Die Strahlparameter des durchgelassenen Strahls können wir bestimmen, wenn wir uns an das Resultat von Übung 3-3 erinnern, in der die Parameter eines Gaußstrahls aus seinem Radius und seiner Krümmung an einem gegebenen Punkt bestimmt wurden. Gleichung (3.26) sagt uns, dass der Taillenradius 𝑊0′ = √
𝑊
(3.33) 2
1 + (π𝑊 2 ∕𝜆𝑅′ )
ist, und Gl. (3.25) gibt uns die Entfernung des Strahlzentrums vom Ort der Linse: ′
−𝑧 =
z
ungestrichenen Parametern des einfallenden und den gestrichenen Parametern des auf der anderen Seite aus der Linse austretenden Gaußstrahls (siehe Abb. 3.12): Taillenradius Taillenposition
2
1 + (𝜆𝑅′ ∕π𝑊 2 )
.
(3.35)
(𝑧′ − 𝑓) = 𝑀 2 (𝑧 − 𝑓) ,
(3.36)
Fokuslänge
2𝑧0′ = 𝑀 2 (2𝑧0 ) ,
Divergenz
2𝜃0′ =
2𝜃0 , 𝑀 𝑀 𝑀= √ 𝑟 , 1 + 𝑟2 || 𝑓 || || . 𝑀𝑟 = ||| || 𝑧 − 𝑓 |||
Vergrößerung 𝑟=
𝑧0 𝑧−𝑓
(3.37) (3.38) (3.39) (3.39a)
Der Vergrößerungsfaktor 𝑀 spielt offensichtlich eine wichtige Rolle. Der Taillenradius wird um einen Faktor 𝑀 vergrößert, die Fokuslänge um einen Faktor 𝑀 2 , und die Divergenz nimmt um einen Faktor 𝑀 ab. Der strahlenoptische Grenzfall
Wir betrachten den Grenzfall (𝑧 − 𝑓) ≫ 𝑧0 , d. h. dass die Linse deutlich außerhalb der Fokuslänge des einfallenden Strahls liegt (Abb. 3.13). Der Strahl kann dann näherungsweise als Kugelwelle betrachtet werden, sodass aus den Gln. (3.39) und (3.39a) 𝑟 ≪ 1 und somit 𝑀 ≈ 𝑀𝑟 folgt. In diesem Fall reduzieren sich die Gln. (3.35)– (3.39a) auf 𝑊0′ ≈ 𝑀𝑊0 1 1 1 + ≈ 𝑧′ 𝑧 𝑓
(3.40) (3.41)
|| 𝑓 || || . 𝑀 ≈ 𝑀𝑟 = ||| || 𝑧 − 𝑓 |||
(3.42)
Die Gln. (3.40)–(3.42) sind genau die Beziehungen aus der Strahlenoptik für den Ort und die Größe eines Lichtz
𝑅′
𝑊0′ = 𝑀𝑊0 ,
zʹ
(3.34)
Das Minuszeichen in Gl. (3.34) zeigt, dass die Taille √ rechts von der Linse liegt. Wenn wir 𝑊 = 𝑊0 1 + (𝑧∕𝑧0 )2 und 𝑅 = 𝑧[1 + (𝑧0 ∕𝑧)2 ] aus den Gln. (3.8) und (3.9) in die Gln. (3.32)–(3.34) einsetzen, erhalten wir einen Satz von Beziehungen zwischen den
2W0
2W0ʹ
Abb. 3.13 Abbildung eines Strahlbündels im strahlenoptischen Grenzfall.
65
66
3 Optik von Strahlbündeln
flecks mit Durchmesser 2𝑊0 in einer Entfernung 𝑧 zur Linken einer dünnen Linse (siehe Abschnitt 1.2.3). Auch der Vergrößerungsfaktor 𝑀𝑟 ist identisch mit dem aus der Strahlenoptik. Da aus Gl. (3.39) 𝑀 < 𝑀𝑟 folgt, ist die maximale mit einem Gaußstrahl erreichbare Vergrößerung gerade die Vergrößerung 𝑀𝑟 , die sich aus dem strahlenoptischen Grenzfall ergibt. Mit steigendem 𝑟2 nehmen die Vergrößerung ab und die Abweichungen von der Strahlenoptik zu. Die Gln. (3.40)–(3.42) entsprechen den Ergebnissen, die man aus der Wellenoptik für die Fokussierung einer Kugelwelle in der paraxialen Näherung erhält (siehe Abschnitt 2.4.2).
Eine Linse oder eine Folge von Linsen kann benutzt werden, um einen Gaußstrahl unter Beibehaltung seines Gaußcharakters zu formen. Selbstverständlich können auch Gradientenindexelemente zu diesem Zweck eingesetzt werden. Fokussierung eines Strahlbündels
Wenn eine Linse wie in Abb. 3.14 in der Taille eines Gaußstrahls liegt, ergeben sich die Gleichungen für die Transformation der Parameter einfach durch Einsetzen von 𝑧 = 0 in die Gln. (3.35)–(3.39a). Der durchgelassene Strahl wird dann auf einen Taillenradius 𝑊0
(3.43)
1 + (𝑧0 ∕𝑓)2
in einer Entfernung 𝑧′ =
𝑓 1 + (𝑓∕𝑧0 )2
(3.44)
von der Linse fokussiert. Wenn die Fokuslänge 2𝑧0 des einfallenden Strahlbündels viel größer ist als die Brennweite 𝑓 der Linse (wie in Abb. 3.15), reduziert sich Gl. (3.43) auf 𝑊0′ ≈ (𝑓∕𝑧0 )𝑊0 . Mithilfe der aus Gl. (3.11) folgenden Beziehung 𝑧0 = z0
zʹ
Abb. 3.15 Fokussierung eines kollimierten Strahls.
π𝑊02 ∕𝜆 und Gl. (3.20) führt dies zu dem einfachen Ergebnis 𝑊0′ ≈
𝜆 𝑓 = 𝜃0 𝑓 , π𝑊0
2W0ʹ
f
Abb. 3.14 Fokussierung eines Gaußstrahls durch eine Linse am Ort der Strahltaille.
(3.45) (3.46)
Das durchgelassene Strahlbündel wird nun in die Brennebene der Linse fokussiert, genau wie es für ein Bündel aus achsenparallelen Strahlen der Fall wäre. Dieses Resultat erhalten wir, weil der einfallende Gaußstrahl in der Umgebung seiner Taille gut durch eine ebene Welle beschrieben werden kann. Die Wellenoptik zeigt, dass der Radius 𝑊0′ des fokussierten Strahlbündels direkt proportional zur Wellenlänge und zur Brennweite ist und umgekehrt proportional zum Radius des einfallenden Strahlbündels. Der aus der Strahlenoptik erwartete Taillendurchmesser ist natürlich null, was wir in der Tat auch aus den wellenoptischen Gleichungen bestätigen können, wenn wir den Grenzfall 𝜆 → 0 betrachten. Für viele Anwendungen, beispielsweise in Laserscannern, Laserdruckern, CD-Brennern oder bei der LaserKernfusion, möchte man einen möglichst kleinen Taillendurchmesser erreichen. Aus Gl. (3.45) wird deutlich, dass man dazu die kürzeste Wellenlänge, den größten Durchmesser des einfallenden Strahls und die kürzeste Brennweite der Linse wählen muss, die praktisch möglich sind. Da das Strahlbündel durch die Linse hindurchtreten muss, sollte ihr Durchmesser 𝐷 mindestens 2𝑊0 betragen. Wenn wir 𝐷 = 2𝑊0 setzen und Gl. (3.45) verwenden, erhalten wir für den Durchmesser des Brennflecks 2𝑊0′ ≈
2W0
z ʹ= f
𝑧′ ≈ 𝑓 .
3.2.2 Formung eines Strahlbündels
𝑊0′ = √
z0 ≫ f
4 𝜆𝐹 π #
mit 𝐹# =
𝑓 , 𝐷
(3.47)
wobei 𝐹# die Blendenzahl (siehe Abschnitt 4.4.3) der Linse ist. Zu diesem Zweck wird häufig ein Mikroskop mit einer kleinen Blendenzahl eingesetzt. Noch ein Hinweis sei gestattet: Da die Gln. (3.45) und (3.46) nur Näherungen sind, ist es immer ratsam, ihre Gültigkeit vor Anwendung zu prüfen.
3.2 Durchgang durch optische Komponenten
Übung 3-6: Führung von Strahlbündeln
Ein Gaußstrahl mit dem Radius 𝑊0 und der Wellenlänge 𝜆 wird durch eine Folge von identischen Linsen der Brennweite 𝑓 in Abständen von d wiederholt fokussiert (Abb. 3.16). Der Taillenradius des fokussierten ist gleich dem des einfallenden Strahlbündels, 𝑊0′ = 𝑊0 . Zeigen Sie mithilfe der Gln. (3.36), (3.39) und (3.39a), dass diese Situation nur realisierbar ist, wenn die Ungleichung d ≤ 4𝑓 erfüllt ist. Diese Bedingung ist identisch mit derjenigen, die in Beispiel 1-3 im Rahmen der Strahlenoptik für die Strahlführung durch eine Folge von Linsen hergeleitet wurde.
f z
Abb. 3.16 Führung eines Strahlbündels. zʹ – 1
z0
f
f 2
0.25 0.5
1
–2
1
1
–1
Übung 3-7: Kollimation eines Strahlbündels
2
z –1 f
Ein Gaußstrahl tritt durch eine dünne Linse der Brennweite 𝑓 hindurch. (a) Zeigen Sie, dass die Positionen 𝑧 und 𝑧′ der Taillen des einfallenden und des durchgelassenen Strahlbündels durch 𝑧∕𝑓 − 1 𝑧′ −1= 𝑓 (𝑧∕𝑓 − 1)2 + (𝑧0 ∕𝑓)2
=0
(3.48)
zusammenhängen. Dieser Zusammenhang ist in Abb. 3.17 aufgetragen. (b) Damit das Strahlbündel kollimiert wird, muss die Position 𝑧′ der neuen Strahltaille so weit wie möglich von der Linse entfernt sein. Dies erreicht man durch ein möglichst kleines Verhältnis 𝑧0 ∕𝑓 (kleine Fokuslänge und große Brennweite). Zeigen Sie, dass für ein gegebenes Verhältnis 𝑧0 ∕𝑓 der für die Kollimation optimale Wert von 𝑧 gleich 𝑧 = 𝑓 + 𝑧0 ist. (c) Bestimmen Sie für 𝜆 = 1 μm, 𝑧0 = 1 cm und 𝑓 = 50 cm den für die Kollimation optimalen Wert von 𝑧 sowie die entsprechende Vergrößerung 𝑀, den Abstand 𝑧′ und den Radius 𝑊0′ des kollimierten Strahlbündels. Übung 3-8: Die Aufweitung eines Strahlbündels
Durch zwei Linsen der Brennweiten 𝑓1 und 𝑓2 kann ein Gaußstrahl aufgeweitet und kollimiert werden, wie Abb. 3.18 zeigt. Die Parameter (𝑊0 , 𝑧0 ) des einfallenden Strahls werden durch die erste Linse zu (𝑊0′′ , 𝑧0′′ ) und anschließend durch die zweite Linse zu (𝑊0′ , 𝑧0′ ) verändert. Die erste Linse mit einer kleinen Brennweite reduziert die Fokuslänge 2𝑧0′′ des Strahlbündels. Damit ist es für die Kollimation durch die zweite Linse mit großer Brennweite vorbereitet. Das Gesamtsystem wirkt als inverses Keplerteleskop. (a) Nehmen Sie an, dass 𝑓1 ≪ 𝑧 und 𝑧 − 𝑓1 ≫ 𝑧0 ist und bestimmen Sie mithilfe der Ergebnisse aus Übung 3-7 die optische Entfernung d zwischen den Linsen, die die Entfernung 𝑧′ zur Taille des durchgelassenen Strahlbündels so groß wie möglich macht. (b) Geben Sie einen Ausdruck für die Gesamtvergrößerung 𝑀 = 𝑊0′ ∕𝑊0 des Systems an.
–1
–2
Abb. 3.17 Die Beziehung zwischen den Taillenpositionen des einfallenden und des durchgelassenen Strahlbündels.
3.2.3 Reflexion an einem Kugelspiegel Wir wollen nun die Reflexion eines Gaußstrahls an einem Kugelspiegel untersuchen. Der Reflexionskoeffizient des Spiegels ist proportional zu exp(−i𝑘𝜌2 ∕𝑅) (siehe Aufgabe 2-10), wobei wieder per Konvention für konvexe Spiegel 𝑅 > 0 und für konkave Spiegel 𝑅 < 0 gilt. Die Wirkung des Spiegels auf einen Gaußstrahl mit dem Radius 𝑊1 und dem Krümmungsradius 𝑅1 besteht demzufolge einfach darin, dass das Strahlbündel reflektiert und seine Phase mit einem Faktor −𝑘𝜌2 ∕𝑅 multipliziert wird, während der Strahlradius unverändert bleibt. Das reflektierte Strahlbündel ist folglich immer noch ein Gaußstrahl, nun mit den Parametern 𝑊2 und 𝑅2 entsprechend 𝑊2 = 𝑊1 1 2 1 = + . 𝑅2 𝑅1 𝑅
(3.49) (3.50)
Für 𝑓 = −𝑅∕2 ist Gl. (3.50) identisch mit Gl. (3.32). Der Gaußstrahl wird also genau wie durch eine Linse verändert, nur dass sich seine Ausbreitungsrichtung umkehrt. Die drei in Abb. 3.19 dargestellten Spezialfälle sind von besonderem Interesse: • Wenn der Spiegel eben ist, d. h. 𝑅 = ∞, folgt 𝑅2 = 𝑅1 , sodass der Spiegel die Ausbreitungsrichtung des Strahlbündels umkehrt, ohne seine Krümmung zu verändern [Abb. 3.19(a)]. • Wenn 𝑅1 = ∞ ist, die Strahltaille also auf dem Spiegel liegt, ist 𝑅2 = 𝑅∕2. Wenn der Spiegel konkav ist (𝑅 < 0),
67
68
3 Optik von Strahlbündeln
z
Abb. 3.18 Strahlaufweitung durch zwei Linsen.
zʹ z1
z2
2 z0ʹʹ
2W0ʹ
2W0
f1
2W0ʹʹ
f2
(a)
(c)
(b)
Abb. 3.19 Reflexion eines Gaußstrahl mit dem Krümmungsradius R1 an einem Spiegel mit dem Krümmungsradius R: (a) R = ∞; (b) R1 = ∞; (c) R1 = −R. Die gepunkteten Linien zeigen, was passiert, wenn der Spiegel durch eine Linse der Brennweite f = −R∕2 ersetzt wird.
ist 𝑅2 < 0, sodass der reflektierte Strahl einen negativen Krümmungsradius erhält und die Wellenfronten konvergieren. Der Spiegel fokussiert den Strahl dann auf einen kleineren Spotdurchmesser [Abb. 3.19(b)]. • Wenn 𝑅1 = −𝑅 ist, die Krümmungsradien der Wellenfront und des Spiegels also übereinstimmen, folgt 𝑅2 = 𝑅. Die Wellenfronten sowohl des einfallenden als auch des reflektierten Strahlbündels fallen dann mit der Spiegeloberfläche zusammen, und die Welle kehrt auf ihrem ursprünglichen Weg zurück [Abb. 3.19(c)]. Das ist nicht überraschend, denn die Wellenfrontnormalen stehen auch normal zur Spiegeloberfläche, sodass der Spiegel die Welle auf sich selbst zurück reflektiert. In Abb. 3.19(c) ist der Spiegel konkav (𝑅 < 0); die einfallende Welle divergiert (𝑅1 > 0) und die reflektierte Welle konvergiert (𝑅2 < 0). Übung 3-9: Spiegel mit variablem Reflexionsgrad
Ein sphärischer Spiegel mit dem Radius 𝑅 besitzt einen variablen Reflexionsgrad, der gemäß ℛ(𝜌) = |r(𝜌)|2 = 2 ) einer Gaußfunktion des radialen Abexp(−2𝜌2 ∕𝑊m stands 𝜌 folgt. Auf der Achse sei der Reflexionsgrad eins; für 𝜌 = 𝑊m nimmt er um einen Faktor 1∕e2 ab. Welche Wirkung hat dieser Spiegel auf einen Gaußstrahl mit dem Krümmungsradius 𝑅1 und dem Strahlradius 𝑊1 am Spiegel?
3.2.4 Durchgang durch ein beliebiges optisches System In der paraxialen Näherung der Strahlenoptik wird ein optisches System vollständig durch die 2 × 2-Strahltransfermatrix definiert, die Position und Neigung des durchgelassenen Strahls bzw. des einfallenden Strahls miteinander verknüpft (siehe Abschnitt 1.4). Wir wollen uns nun ansehen, welche Wirkung ein beliebiges paraxiales optisches System, das durch eine Matrix M mit den Elementen (A, B, C , D) charakterisiert wird, auf einen Gaußstrahl hat (Abb. 3.20). Das ABCD-Gesetz
Die 𝑞-Parameter 𝑞1 und 𝑞2 des einfallenden und des durchgelassenen Gaußstrahls in der Eingangs- bzw. Ausgangsebene eines paraxialen optischen Systems, das durch die Matrix (A, B, C , D) beschrieben wird, hängen W1 R1
q1
W2 R2
q2
Abb. 3.20 Veränderung eines Gaußstrahls durch ein beliebiges paraxiales System, das durch eine ABCD-Matrix beschrieben wird.
3.2 Durchgang durch optische Komponenten
Ausdrücke in Gl. (3.53) einsetzen, erhalten wir mithilfe von Gl. (3.52)
durch 𝑞2 =
A 𝑞1 + B C 𝑞1 + D
(3.51)
zusammen. Da der komplexe 𝑞-Parameter den Radius 𝑊 und den Krümmungsradius 𝑅 des Gaußstrahls angibt (siehe Übung 3-3), beschreibt dieser einfache Ausdruck, der als ABCD-Gesetz bezeichnet wird, die Wirkung eines beliebigen paraxialen Systems auf einen Gaußstrahl. Wir werden das ABCD-Gesetz durch Verifikation einiger Spezialfälle einführen; seine Allgemeingültigkeit werden wir anschließend durch Induktion zeigen. Durchgang durch ein Vakuum
Wenn das optische System einfach aus einer Strecke d im Vakuum (oder einem beliebigen homogenen Medium) besteht, lauten die Elemente der Matrix M offensichtlich A = 1, B = d , C = 0, D = 1 [siehe Gl. (1.43)]. Wie wir bereits früher gesehen haben, gilt im Vakuum 𝑞 = 𝑧 + i𝑧0 , woraus für den 𝑞-Parameter 𝑞2 = 𝑞1 + d folgt. Das ist aber genau gleich (1 ⋅ 𝑞1 + d )∕(0 ⋅ 𝑞1 + 1), sodass das ABCDGesetz diesen Test besteht. Durchgang durch eine dünne optische Komponente
Eine dünne optische Komponente hat keinen Einfluss auf die Strahlposition, sodass 𝑦2 = 𝑦1
(3.52)
gilt. Sie ändert jedoch den Neigungswinkel des Strahls gemäß 𝜃2 = C 𝑦1 + D𝜃1 ,
(3.53)
wie Abb. 3.21 zeigt. Folglich ist A = 1 und B = 0; C und D sind beliebig. Für alle in Abschnitt 1.4.2 beschriebenen dünnen optischen Komponenten gilt jedoch D = 𝑛1 ∕𝑛2 . Wegen der verschwindenden Dicke der Komponente ändert sich der Strahlradius nicht, also ist 𝑊2 = 𝑊1 .
1 D =C+ . 𝑅2 𝑅1
Mithilfe von Gl. (3.6), die 𝑞 als Funktion von 𝑅 und 𝑊 ausdrückt, und der Beziehung D = 𝑛1 ∕𝑛2 = 𝜆2 ∕𝜆1 können wir die Gln. (3.54) und (3.55) zu einer einzigen Gleichung kombinieren: 1 D =C+ . 𝑞2 𝑞1
Die Gültigkeit des ABCD-Gesetzes für Kaskaden Wenn das ABCD-Gesetz für zwei optische Systeme mit den Matrizen M𝑖 = (A𝑖 , B𝑖 , C 𝑖 , D𝑖 ) (𝑖 = 1, 2) gilt, muss es
auch für die Hintereinanderschaltung dieser beiden Systeme gelten (ein System mit der Matrix M = M2 M1 ). Das lässt sich durch einfaches Einsetzen prüfen. Die Allgemeingültigkeit des ABCD-Gesetzes Da das ABCD-Gesetz für dünne optische Komponenten
ebenso wie für die Ausbreitung in einem homogenen Medium gilt, muss es auch für beliebige Kombinationen dieser Elemente gelten. Alle uns interessierenden paraxialen optischen Systeme sind Kombinationen aus einer Ausbreitung in homogenen Medien und dünnen optischen Komponenten wie Linsen und Spiegeln. Es ist daher offensichtlich, dass das ABCD-Gesetz für all diese Systeme gelten muss. Da außerdem ein inhomogenes Medium als Kaskade von aufeinander folgenden dünnen Elementen beschrieben werden kann, können wir schließen, dass das ABCD-Gesetz auch für solche Systeme gilt, solange alle Strahlen (Wellenfrontnormalen) paraxial sind. Übung 3-10: Durchgang eines Gaußstrahls durch eine transparente Platte Verwenden Sie das ABCD-Gesetz, um den Weg eines
Wenn wir die Strahlen in der Eingangs- bzw. Ausgangsebene der Komponente näherungsweise durch Kugelwellen mit den Radien 𝑅1 und 𝑅2 beschreiben, erhalten wir in der paraxialen Näherung, wenn also 𝜃1 und 𝜃2 klein sind, 𝜃1 ≈ 𝑦1 ∕𝑅1 und 𝜃2 ≈ 𝑦2 ∕𝑅2 . Wenn wir diese
Gaußstrahls aus Luft durch eine transparente Platte mit dem Brechungsindex 𝑛 und der Dicke d und wieder in Luft zu beschreiben. Nehmen Sie an, dass die Strahlachse senkrecht auf der Platte steht.
R2
y1
θ1
Abb. 3.21 Die Veränderung eines Gaußstrahls durch eine dünne optische Komponente.
y2
θ2 optische Komponente
(3.56)
Hieraus folgt 𝑞2 = (1 ⋅ 𝑞1 + 0)∕(C 𝑞1 + D), sodass auch in diesem Fall das ABCD-Gesetz gilt.
(3.54)
R1
(3.55)
z
69
70
3 Optik von Strahlbündeln
konstant. Diese Verteilung ist eine in 𝑥- und 𝑦-Richtung durch die Funktionen 𝒳 2 (⋅) bzw. 𝒴 2 (⋅) modulierte Gaußfunktion.
3.3 Hermite-Gauß-Strahlen Gaußstrahlen sind nicht die einzige strahlenartige Lösung der paraxialen Helmholtzgleichung (3.2). Von besonderem Interesse sind Lösungen mit nichtgaußschen Intensitätsverteilungen, aber den parabolischen Wellenfronten eines Gaußstrahls. Derartige Strahlbündel haben die nützliche Eigenschaft, dass man sie an die Krümmungen von sphärischen Spiegeln mit großen Durchmessern anpassen kann, wie sie z. B. in optischen Resonatoren verwendet werden, zwischen denen sie dann ohne Veränderung reflektiert werden können. Derartige sich selbst reproduzierende Wellen werden als Moden des Resonators bezeichnet. Die Optik von Resonatoren wird in Kapitel 11 diskutiert. Wir betrachten einen Gaußstrahl mit der komplexen Einhüllenden [siehe Gl. (3.5)] 𝐴G (𝑥, 𝑦, 𝑧) =
𝐴1 𝑥2 + 𝑦 2 exp [−i𝑘 ], 𝑞(𝑧) 2𝑞(𝑧)
𝜕𝒴 1 𝜕2 𝒳 𝜕𝒳 1 𝜕2 𝒴 ( 2 − 2𝑢 ( 2 − 2𝑣 )+ ) 𝜕𝑢 𝜕𝑣 𝒳 𝜕𝑢 𝒴 𝜕𝑣 + 𝑘𝑊 2 (𝑧)
(3.57)
mit 𝑞(𝑧) = 𝑧 + i𝑧0 . Der Strahlradius 𝑊(𝑧) und der Krümmungsradius 𝑅(𝑧) der Wellenfront sind durch die Gln. (3.8) und (3.9) gegeben. Nun betrachten wir eine zweite Welle, deren komplexe Einhüllende eine modulierte Version dieses Gaußstrahls ist, √ 𝑦 √ 𝑥 ]𝒴[ 2 ] 𝐴(𝑥, 𝑦, 𝑧) = 𝒳 [ 2 𝑊(𝑧) 𝑊(𝑧) × exp [i𝒵(𝑧)] 𝐴G (𝑥, 𝑦, 𝑧) ,
Die modulierte Welle beschreibt also ein Strahlbündel mit einer nichtgaußschen Intensitätsverteilung, das aber dieselben Wellenfronten und dieselbe Divergenz wie die zugrunde liegende gaußsche Welle besitzt. Die Existenz einer solchen Welle ist gesichert, falls es gelingt, drei reelle Funktionen 𝒳(⋅), 𝒴(⋅) und 𝒵(𝑧) zu finden, sodass Gl. (3.58) die paraxiale Helmholtzgleichung (3.2) erfüllt. Wenn wir Gl. (3.58) in Gl. (3.2) einsetzen, die Tatsache verwenden, dass 𝐴G√selbst Gl. (3.2) erfüllt, √ und zwei neue Variablen 𝑢 = 2𝑥∕𝑊(𝑧) und 𝑣 = 2𝑦∕𝑊(𝑧) definieren, erhalten wir
(3.58)
√ 𝑥 √ 𝑦 𝑊0 𝑥2 + 𝑦 2 ]𝒴[ 2 ][ ] exp [− 2 𝐴0 𝒳 [ 2 ] 𝑊(𝑧) 𝑊(𝑧) 𝑊(𝑧) 𝑊 (𝑧) (3.59) mit 𝐴0 = 𝐴1 ∕i𝑧0 ist eine Funktion von 𝑥∕𝑊(𝑧) und 𝑦∕𝑊(𝑧), deren Ausdehnung in 𝑥- und 𝑦-Richtung in mit demselben Phasenfaktor 𝑊(𝑧) variiert. Mit zunehmendem 𝑧 bleibt die Intensität in den transversalen Ebenen bis auf einen Vergrößerungsfaktor 𝑊(𝑧)
(3.60)
Da die linke Seite dieser Gleichung eine Summe von drei Termen ist, die jeweils Funktionen einer einzigen unabhängigen Variable sind (𝑢, 𝑣 bzw. 𝑧), muss jeder dieser Terme für sich konstant sein. Wenn wir den ersten Term gleich einer Konstante −2𝜇1 und den zweiten gleich −2𝜇2 setzen, muss der dritte gleich 2(𝜇1 + 𝜇2 ) sein. Diese Methode der Separation der Variablen ermöglicht es uns, die partielle Differentialgleichung (3.60) in drei gewöhnliche Differentialgleichungen für 𝒳(𝑢), 𝒴(𝑣) und 𝒵(𝑧) zu zerlegen:
wobei 𝒳(⋅), 𝒴(⋅) und 𝒵(⋅) reelle Funktionen sind. Diese Welle besitzt – falls sie wirklich existiert – die folgenden Eigenschaften: 1) Ihre Phase ist bis auf einen Phasenfaktor 𝒵(𝑧), der nicht von 𝑥 und 𝑦 abhängt, dieselbe wie die der zugrunde liegenden Gaußwelle. Wenn 𝒵(𝑧) eine langsam variierende Funktion von 𝑧 ist, besitzen beide Wellen parabolische Wellenfronten mit demselben Krümmungsradius 𝑅(𝑧). Daher werden beide Wellen von dünnen Linsen und Spiegeln auf genau dieselbe Weise fokussiert. 2) Ihr Betrag
𝜕𝒵 = 0. 𝜕𝑧
2
−
d𝒳 1d 𝒳 +𝑢 = 𝜇1 𝒳 , 2 d𝑢2 d𝑢
−
d𝒴 1d 𝒴 +𝑣 = 𝜇2 𝒴 , 2 d𝑣2 d𝑣
(3.61a)
2
(3.61b)
2
𝑧0 [1 + (
d𝒵 𝑧 )] = 𝜇1 + 𝜇2 , 𝑧0 d𝑧
(3.61c)
wobei wir die in den Gln. (3.8) und (3.11) angegebenen Ausdrücke für 𝑊(𝑧) verwendet haben. Gleichung (3.61a) ist eine Eigenwertgleichung, deren Eigenwerte 𝜇1 = 𝑙 mit 𝑙 = 0, 1, 2, … und deren Eigenfunktionen die Hermitepolynome 𝒳(𝑢) = ℍ𝑙 (𝑢) sind (𝑙 = 0, 1, 2, …). Diese Polynome sind durch die Rekursionsbeziehung ℍ𝑙+1 (𝑢) = 2𝑢ℍ𝑙 (𝑢) − 2𝑙ℍ𝑙−1 (𝑢)
(3.62)
mit ℍ0 (𝑢) = 1 ,
ℍ1 (𝑢) = 2𝑢
(3.63)
definiert. Folglich ist ℍ2 (𝑢) = 4𝑢2 − 2 ,
ℍ3 (𝑢) = 8𝑢3 − 12𝑢 ,
… (3.64)
3.3 Hermite-Gauß-Strahlen
Entsprechend sind die Lösungen von Gl. (3.61b) 𝜇2 = 𝑚 und 𝒴(𝑣) = ℍ𝑚 (𝑣) mit 𝑚 = 0, 1, 2, …. Es existiert somit eine Familie von Lösungen, die durch die Indizes (𝑙, 𝑚) unterschieden werden. Wenn wir 𝜇1 = 𝑙 und 𝜇2 = 𝑚 in Gl. (3.61c) einsetzen und integrieren, erhalten wir 𝒵(𝑧) = (𝑙 + 𝑚)𝜁(𝑧)
Eine optische Welle mit einer durch Gl. (3.66) gegebenen komplexen Amplitude heißt Hermite-GaußStrahl der Ordnung (𝑙, 𝑚) und wird kurz als HG𝑙𝑚 bezeichnet. Der Hermite-Gauß-Strahl HG00 der Ordnung (0, 0) ist ein einfacher Gaußstrahl.
(3.65)
−1
mit 𝜁(𝑧) = tan (𝑧∕𝑧0 ). Der Phasenfaktor 𝒵(𝑧) variiert daher langsam zwischen −(𝑙 + 𝑚)π∕2 und +(𝑙 + 𝑚)π∕2, wenn 𝑧 sich von −∞ auf ∞ ändert [siehe Gl. (3.10) und Abb. 3.5].
3.3.2 Intensitätsverteilung Die optische Intensität 𝐼𝑙,𝑚 = |𝑈𝑙,𝑚 |2 eines HermiteGauß-Strahls HG𝑙𝑚 ist gleich √ √ 𝑊0 2 2 2𝑦 2𝑥 2 𝐼𝑙,𝑚 (𝑥, 𝑦, 𝑧) = |𝐴𝑙,𝑚 | [ ] 𝔾𝑙 [ ] 𝔾𝑚 [ ]. 𝑊(𝑧) 𝑊(𝑧) 𝑊(𝑧) 2
3.3.1 Die komplexe Amplitude
(3.68)
Einsetzen in Gl. (3.58) liefert die komplexe Einhüllende eines Strahlbündels mit den Indizes (𝑙, 𝑚). Nach Umformung und Multiplikation mit exp(−i𝑘𝑧) erhalten wir für die komplexe Amplitude √ √ 𝑊0 2𝑥 2𝑦 ] 𝔾𝑙 [ 𝑈𝑙,𝑚 (𝑥, 𝑦, 𝑧) = 𝐴𝑙,𝑚 [ ] 𝔾𝑚 [ ] 𝑊(𝑧) 𝑊(𝑧) 𝑊(𝑧) × exp [−i𝑘𝑧 − i𝑘
𝑥2 + 𝑦 2 + i(𝑙 + 𝑚 + 1)𝜁(𝑧)] , 2𝑅(𝑧) (3.66)
wobei 𝔾𝑙 (𝑢) = ℍ𝑙 (𝑢) exp (
−𝑢2 ), 2
𝑙 = 0, 1, 2, …
(3.67)
als Hermite-Gauß-Funktion der Ordnung 𝑙 bezeichnet wird und 𝐴𝑙,𝑚 eine Konstante ist. Da ℍ0 (𝑢) = 1 ist, ist die Hermite-Gauß-Funktion der Ordnung 0 einfach die Gaußfunktion. Für die höheren Ordnungen gilt, dass 𝔾1 (𝑢) = 2𝑢 exp(−𝑢2 ∕2) eine ungerade Funktion ist, 𝔾2 (𝑢) = (4𝑢2 − 2) exp(−𝑢2 ∕2) eine gerade, 𝔾3 (𝑢) = (8𝑢3 − 12𝑢) exp(−𝑢2 ∕2) eine ungerade und so weiter. In Abb. 3.22 sind diese Funktionen schematisch dargestellt. 0(u)
1(u)
u
Abbildung 3.23 zeigt die Abhängigkeit der Intensität √ von den normierten √ transversalen Abständen 𝑢 = 2𝑥∕𝑊(𝑧) und 𝑣 = 2𝑦∕𝑊(𝑧) für verschiedene Werte von 𝑙 und 𝑚. Strahlbündel höherer Ordnung haben größere Strahlradien als solche kleinerer Ordnung, wie aus Abb. 3.22 zu erkennen ist. Unabhängig von der Ordnung des Strahls ist der Strahlradius aber immer proportional zu 𝑊(𝑧), sodass die räumliche Ausdehnung des Intensitätsmusters mit steigendem 𝑧 um den Faktor 𝑊(𝑧)∕𝑊0 zunimmt, aber ansonsten ihr Profil beibehält. Das einzige rotationssymmetrische Mitglied der Familie der Hermite-Gauß-Strahlen ist der einfache Gaußstrahl selbst. Der in Gl. (3.66) definierte Hermite-Gauß-Strahl kann verallgemeinert werden, indem man seinen 𝑥- und 𝑦-Komponenten 𝑊𝑥 (𝑧) bzw. 𝑊𝑦 (𝑧) unterschiedliche Strahlbreiten zuordnet; so entsteht ein elliptischer Hermite-Gauß-Strahl. Da Gl. (3.66) eine separierbare Funktion von 𝑥 und 𝑦 ist, ist er eine weitere exakte Lösung der paraxialen Helmholtzgleichung. Ein Sonderfall ist der elliptische Gaußstrahl aus Aufgabe 3-3, bei dem die Linien konstanter Intensität elliptisch anstatt kreisförmig sind.
2(u)
Abb. 3.22 Die ersten Hermite-Gauß-Funktionen: (a) 𝔾0 (u); (b) 𝔾1 (u); (c) 𝔾2 (u); (d) 𝔾3 (u).
3(u)
u
u
u
Abb. 3.23 Intensitätsverteilungen mehrerer Hermite-Gauß-Strahlen niedriger Ordnung in der transversalen Ebene. Die Ordnung (l, m) ist jeweils angegeben. HG00
HG01
HG02
HG11
HG12
HG22
71
72
3 Optik von Strahlbündeln
3.4 Laguerre-Gauß-Strahlen 3.4.1 Laguerre-Gauß-Strahlen Die Hermite-Gauß-Strahlen bilden einen vollständigen Satz von Lösungen der paraxialen Helmholtzgleichung. Jede andere Lösung kann als Superposition dieser Strahlbündel geschrieben werden. Ein weiterer vollständiger Satz von Lösungen, die sogenannten LaguerreGauß-Strahlen, ergibt sich, wenn man die paraxiale Helmholtzgleichung in Zylinderkoordinaten (𝜌, 𝜙, 𝑧) schreibt und die Separation der Variablen in 𝜌 und 𝜙 anstelle von 𝑥 und 𝑦 durchführt. Die komplexe Amplitude eines Laguerre-GaußStrahls LG𝑙𝑚 ist 𝑈𝑙,𝑚 (𝜌, 𝜙, 𝑧) = 𝐴𝑙,𝑚 [ × 𝕃𝑙𝑚 (
𝑊0 𝜌 𝑙 ]( ) 𝑊(𝑧) 𝑊(𝑧)
2𝜌2 𝜌2 ) exp (− 2 ) 2 𝑊 (𝑧) 𝑊 (𝑧)
× exp [−i𝑘𝑧 − i𝑘
𝜌2 ∓ i𝑙𝜙 + i(𝑙 + 2𝑚 + 1)𝜁(𝑧)] , 2𝑅(𝑧) (3.69)
wobei 𝕃𝑙𝑚 (⋅) die verallgemeinerten Laguerrepolynome 5) und 𝑊(𝑧), 𝑅(𝑧), 𝜁(𝑧) und 𝑊0 durch die Gln. (3.8)–(3.11) gegeben sind. Die ganzen Zahlen 𝑙 = 0, 1, 2, . . . und 𝑚 = 0, 1, . . . sind azimutale bzw. radiale Indizes. Der Laguerre-Gauß-Strahl niedrigster Ordnung (𝑙 = 𝑚 = 0) ist wieder der Gaußstrahl. Übung 3-11: Der Laguerre-Gauß-Strahl als Superposition zweier Hermite-Gauß-Strahlen
Zeigen Sie, dass der Laguerre-Gauß-Strahl LG10 einer Superposition zweier Hermite-Gauß-Strahlen HG10 und HG01 mit gleichen Amplituden und einer Phasenverschiebung von π∕2 entspricht, d. h. dass LG10 = 1 √ (HG01 + iHG10 ) ist. 2
Die Intensität eines Laguerre-Gauß-Strahls, die proportional zum Betragsquadrat von Gl. (3.69) ist, ist eine Funktion von 𝜌 und 𝑧, nicht aber von 𝜙, und folglich rotationssymmetrisch. Wie Abb. 3.24(a) zeigt, nimmt die transversale Intensitätsverteilung für den LG10-Strahl eine Torusform mit einem Maximum bei einem Radius √ 𝜌 = − 1∕2 𝑊(𝑧) an, der mit zunehmendem Abstand 𝑧 5) Die verallgemeinerten Laguerrepolynome sind durch 𝕃𝑙𝑚 (𝑥) = (𝑚 + ∑𝑚 𝑙)! 𝑖 = 0 (−𝑥)𝑖 ∕[𝑖! (𝑚 − 𝑖)!(𝑙 + 𝑖)!] definiert. Zum Beispiel ist 𝕃𝑙0 (𝑥) = 1, 1
𝕃𝑙1 (𝑥) = 1 − 𝑥 + 𝑙, 𝕃𝑙2 (𝑥) = [𝑥 2 − 2(𝑙 + 2)𝑥 + (𝑙 + 1)(𝑙 + 2)]. Für 𝑙 = 0 2
reduzieren sich die verallgemeinerten Laguerrepolynome 𝕃𝑙𝑚 (𝑥) auf die einfachen Laguerrepolynome 𝕃𝑚 (𝑥).
vom Strahlzentrum zunimmt (genau wie beim Gaußstrahl). Für 𝑚 = 0 sind alle Strahlen beliebiger Ordnung 𝑙 ≠ 0 ebenfalls √ toroidal und erreichen ihre Maxima bei den Radien 𝑙∕2 𝑊(𝑧). Alle Strahlen mit 𝑙 ≠ 0 haben im Strahlzentrum (𝜌 = 0) eine Intensität von null; Strahlen mit einem radialen Index 𝑚 > 0 bestehen aus mehreren Ringen. Das Phasenverhalten des Laguerre-Gauß-Strahls zeigt die gleiche Abhängigkeit von 𝜌 und 𝑧 wie der Gaußstrahl [siehe Gl. (3.7)] – mit zwei interessanten Ausnahmen: (1) Die Gouyphase ist um einen Faktor (𝑙 + 2𝑚 + 1) vergrößert und (2) es existiert ein zusätzlicher Phasenfaktor e∓i𝑙𝜙 , der proportional zum Azimutwinkel 𝜙 ist. Die Phasenkomponente 𝑙𝜙, die in Abb. 3.24(b) für 𝑙 = 1 dargestellt ist, ist mit einem Phasenfaktor exp(−i𝑙𝜙) verknüpft [siehe Gl. (3.23) und die zugehörige Fußnote]. Dieser bewirkt, dass die Wellenfront die Form einer linksgängigen Helix annimmt, die eine korkenzieherartige Bewegung durchläuft, während sich die Welle in 𝑧-Richtung ausbreitet, wie in Abb. 3.24(c) gezeigt. Strahlen mit 𝑙 > 1 haben Wellenfronten, die aus 𝑙 separaten, ineinander verwobenen Helices bestehen. Die Steigung jeder Helix ist 𝑙𝜆; das Vorzeichen ∓ bestimmt ihre Händigkeit. Wie in Abschnitt 2.5.1 erwähnt kann die Phase eines optischen Strahls bestimmt werden, indem man seine Interferenz mit einem optischen Hilfsfeld bekannter Form (z. B. einer ebenen Welle) untersucht. Die Phase eines Laguerre-Gauß-Strahls kann leicht gemessen werden, indem man ihn mit einem anderen Laguerre-GaußStrahl derselben Ordnung, aber entgegengesetzter Händigkeit interferieren lässt. Die Intensität einer derartigen Superposition, einer Art von stehender Welle, ist proportional zu | exp(−i𝑙𝜙) + exp(i𝑙𝜙)|2 = 4 cos2 (𝑙𝜙), was die Abhängigkeit der resultierenden Intensität von 𝑙𝜙 explizit zeigt, die in Abb. 3.25 dargestellt ist. Die Zahl der Interferenzmaxima als Funktion des Winkels ist gleich 2𝑙. Laguerre-Gauß-Strahlen können direkt als Lasermoden oder als Kombinationen von Hermite-Gauß-Moden erzeugt werden, wie in Übung 3-11 gezeigt wurde. Ein Gaußstrahl kann in einen Laguerre-Gauß-Strahl umgewandelt werden, indem man ihm mithilfe einer SpiralPhasenplatte [einer dielektrischen Platte, deren optische Dicke linear mit 𝜙 zunimmt, siehe Abb. 3.24(b)] einen Phasenfaktor exp(−i𝑙𝜙) verleiht. Die übliche Methode zur Erzeugung eines Laguerre-Gauß-Strahls aus einem Gaußstrahl ist jedoch ein Beugungselement oder Hologramm mit einer auf der Strahlachse zentrierten Gabelversetzung, wie Beispiel 4-11 zeigen wird. Strahlen mit helikaler Phase tragen einen Bahndrehimpuls. Dies wird deutlich, wenn man sich klarmacht, dass eine optische Welle einen Impuls in einer Richtung senkrecht zu ihren Wellenfronten besitzt (siehe Ab-
3.4 Laguerre-Gauß-Strahlen
y
y ρ
x
x
z
(a) Intensität
(b) Phase
(c) Wellenfront
Abb. 3.24 Der Laguerre-Gauß-Strahl LG10 . (a) Die transversale Intensitätsverteilung hat die Form eines Torus. (b) Die Phasenkomponente l𝜙 (hier aufgetragen für l = 1, ist eine lineare Funktion des Azimutwinkels 𝜃 . (c) Die Wellenfront ist eine linksgängige helikale Oberfläche, die bei Ausbreitung in z-Richtung eine korkenzieherartige Bewegung durchläuft.
LG10
LG30
LG22
schnitt 5.1 und 13.1.3), also in Richtung des optischen Strahls. Da aber Strahlen, die orthogonal zur helikalen Wellenfront eines Laguerre-Gauß-Strahls verlaufen, azimutale Komponenten besitzen, die um die Strahlachse rotieren, geht ihr linearer Impuls mit einem Bahndrehimpuls einher. Man kann sich das auch so veranschaulichen, dass gebrochene optische Strahlen, die auf die Oberfläche einer helikalen Phasenplatte treffen, azimutale Komponenten erhalten [siehe Abb. 3.24(b)]. Laguerre-Gauß-Strahlen können aufgrund ihres Bahndrehimpulses ein mechanisches Drehmoment auf Mikroobjekte ausüben und somit zur Manipulation von Mikroteilchen verwendet werden.
3.4.2 Optische Wirbel Ein optischer Wirbel ist ein optisches Feld, das eine Linie mit einer optischen Intensität von null aufweist, beispielsweise auf der Achse eines Laguerre-Gauß-Strahls mit 𝑙 ≠ 0. Sie wird auch als Schraubenversetzung bezeichnet, da sich die Phase des Feldes wie ein Korkenzieher um die Ausbreitungsrichtung windet. Ein optischer Wirbel in einer Ebene ist ein Punkt, an dem das optische Feld verschwindet; er wird auch als Phasensingularität bezeichnet. Ein Beispiel hierfür ist der Punkt (𝑥, 𝑦) = (0, 0) in der transversalen Ebene des LaguerreGauß-Strahls in Abb. 3.24(a). Die Stärke eines Wirbels wird durch seine topologische Ladung beschrieben, die die Anzahl der vollen
Abb. 3.25 Transversale Intensitätsverteilungen der Superposition zweier Laguerre-Gauß-Strahlen gleicher Ordnung, aber gegensätzlicher Helizität. Die gestrichelten weißen Linien kennzeichnen die Orte der Intensität null (die Knoten der stehenden Wellen). Die Anzahl dieser Linien ist gleich der azimutalen Ordnung l. Wenn sich der Azimutwinkel 𝜙 von einem Knoten zum nächsten bewegt, ändert sich die Phase um 2π.
Rotationen angibt, welche die Phase auf einer Wegstrecke von einer Wellenlänge erfährt. Für einen LaguerreGauß-Strahl ist die topologische Ladung gleich dem azimutalen Index 𝑙, der die Anzahl der azimutalen Knotenlinien angibt, die in der stehenden Welle auftreten, die durch die Superposition zweier Strahlen gleicher Ordnung, aber entgegengesetzter Händigkeit erzeugt wird (siehe Abb. 3.25). Diese Zahl bestimmt auch den Bahndrehimpuls des zugehörigen Photons, wie in Abschnitt 13.1.3 ausgeführt wird. Strahlen mit optischen Wirbeln können weitaus komplexere Formen annehmen als der einfache LaguerreGauß-Strahl. Eine Interferenz zwischen drei oder mehr zufällig orientierten ebenen Wellen ähnlicher Intensität führt immer zu einem Feldquerschnitt, der zahlreiche Wirbel enthält. Derartige Strahlen weisen oft ungewöhnliche und dramatische Eigenschaften auf – beispielsweise kann das Feld in der Umgebung eines solchen Wirbels sich aufwickeln und Verknüpfungen und Knoten bilden. 6)
3.4.3 Ince-Gauß-Strahlen Wie in Abschnitt 3.3 und zu Beginn dieses Abschnitts erwähnt, bilden Hermite-Gauß- und Laguerre-GaußStrahlen vollständige Sätze von exakten Lösungen der 6) Siehe M. R. Dennis, R. P. King, B. Jack, K. O’Holleran, M. J. Padgett, ‚Isolated Optical Vortex Knots‘, Nature Physics 6, 118–121, 2010.
73
74
3 Optik von Strahlbündeln
paraxialen Helmholtzgleichung in kartesischen bzw. zylindrischen Koordinaten. Ein dritter vollständiger Satz von exakten Lösungen, die als Ince-Gauß-Strahlen (IG) bekannt sind, 7) existiert in elliptischen Zylinderkoordinaten, einem weiteren dreidimensionalen orthogonalen Koordinatensystem. Die transversale Struktur dieser Strahlen ist durch Incepolynome charakterisiert, die intrinsisch elliptisch angelegt sind. Laguerre-Gauß- und Hermite-Gauß-Strahlen sind Grenzfälle von Ince-GaußStrahlen für Elliptizitätsparameter von 0 bzw. ∞.
3.5 Nichtbeugende Strahlen 3.5.1 Besselstrahlen Bei der Suche nach Wellen mit Strahlcharakter ist es nur natürlich, nach Wellen zu suchen, deren Wellenfronten planar, deren Intensität in einer transversalen Ebene aber nicht konstant ist. Wir wollen beispielsweise eine Welle mit der komplexen Amplitude 𝑈(r) = 𝐴(𝑥, 𝑦)e−i𝛽𝑧
(3.70)
betrachten. Damit diese Welle die Helmholtzgleichung (2.11) erfüllt, ∇2 𝑈 + 𝑘2 𝑈 = 0, muss 𝐴(𝑥, 𝑦) die Beziehung ∇2t 𝐴 + 𝑘t2 𝐴 = 0
(3.71)
erfüllen, wobei 𝑘t2 + 𝛽 2 = 𝑘2 und ∇2t = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 der transversale Laplaceoperator ist. Gleichung (3.71), die als zweidimensionale Helmholtzgleichung bezeichnet wird, kann durch Separation der Variablen 7) Siehe M. A. Bandres, J. C. Gutierrez-Vega, ‚Ince-Gaussian Beams‘, Optics Letters 26, 144–146, 2004.
y
(a) Bessel
𝐴(𝑥, 𝑦) = 𝐴𝑚 𝐽𝑚 (𝑘t 𝜌)ei𝑚𝜙 ,
𝑚 = 0, ±1, ±2, … , (3.72)
wobei 𝐽𝑚 (⋅) eine Besselfunktion erster Art und 𝑚-ter Ordnung und 𝐴𝑚 eine Konstante ist. Lösungen von Gl. (3.72), die bei 𝜌 = 0 singulär sind, werden nicht mitgezählt. Für 𝑚 = 0 hat die Welle die komplexe Amplitude 𝑈(r) = 𝐴0 𝐽0 (𝑘t 𝜌)e−i𝛽𝑧
(3.73)
und besitzt daher ebene Wellenfronten. Die Wellenfrontnormalen (Strahlen) liegen alle parallel zur 𝑧-Achse. Die Intensitätsverteilung 𝐼(𝜌, 𝜙, 𝑧) = |𝐴0 |2 𝐽02 (𝑘t 𝜌) ist rotationssymmetrisch und variiert mit 𝜌 wie in Abb. 3.26 gezeigt. Sie hängt nicht von 𝑧 ab, sodass das Strahlbündel nicht zerfließt. Eine solche Welle heißt Besselstrahl. Es ist instruktiv, Bessel- und Gaußstrahlen miteinander zu vergleichen. Während die komplexe Amplitude des Besselstrahls eine exakte Lösung der Helmholtzgleichung ist, ist die komplexe Amplitude des Gaußstrahls nur eine Näherungslösung (seine komplexe Einhüllende ist eine exakte Lösung der paraxialen Helmholtzgleichung). Die Intensitätsverteilungen der beiden Strahlbündel sind in Abb. 3.26 gegenübergestellt. Es fällt ins Auge, dass sich das asymptotische Verhalten der beiden Verteilungen im Grenzfall großer radialer Abstände deutlich unterscheidet. Die Intensität des Gaußstrahls nimmt mit 𝜌 wie exp[−2𝜌2 ∕𝑊 2 (𝑧)] exponentiell ab. Die Intensität des Besselstrahls klingt dagegen wie 𝐽02 (𝑘t 𝜌) ≈ (2∕π𝑘t 𝜌) cos2 (𝑘t 𝜌 − π∕4) ab; das langsame Abklingen mit 1∕𝜌 ist also von einer oszillierenden Funktion überlagert. Eine Folge davon ist, dass
y
x
y
(b) Gauß
gelöst werden. In Polarkoordinaten (𝑥 = 𝜌 cos 𝜙, 𝑦 = 𝜌 sin 𝜙) lautet das Ergebnis
z
y
x
Abb. 3.26 (a) Die Intensitätsverteilung eines Besselstrahls in einer transversalen Ebene hängt nicht von z ab; das Strahlbündel ist nichtbeugend und divergiert daher nicht. (b) Die transversale Intensitätsverteilung eines Gaußstrahls zum
z
Vergleich mit dem Besselstrahl. Die Parameter wurden so gewählt, dass die Maximalintensitäten und 1∕e2 -Breiten in beiden Fällen identisch sind.
3.5 Nichtbeugende Strahlen
der quadratisch gemittelte Radius des Gaußstrahls, 𝜎 = 1 𝑊(𝑧), endlich ist, während der quadratisch gemittelte 2 Radius eines Besselstrahls für beliebige 𝑧 unendlich ist (siehe Abschnitt A.2 für eine genaue Definition des quadratisch gemittelten Strahlradius) und das Strahlbündel folglich eine unendliche Leistung überträgt. Offensichtlich gibt es eine Balance zwischen minimalen Strahlabmessungen und Divergenz; der quadratisch gemittelte Radius des Besselstrahls ist unendlich und seine Divergenz ist null, genau wie für eine ideale ebene Welle. Wie in den Beispielen 2-1 und 4-7 gezeigt wird, ist der Besselstrahl mit einem Kontinuum von ebenen Wellen verknüpft, deren Richtungen einen Kegel mit einem festen halben Öffnungswinkel bezüglich der Ausbreitungsrichtung bilden. Er kann mit einem Axicon erzeugt werden [Abb. 1.17(c)]. Eine Herleitung der komplexen Amplitude des Besselstrahls sowie eine allgemeine Diskussion von nichtbeugenden Strahlen aus der Perspektive der Fourieroptik ist in Abschnitt 4.3.3 zu finden. Eine weitere Klasse von Strahlbündeln sind die BesselGauß-Strahlen. Dabei handelt es sich um Besselstrahlen, die mit einer Gaußfunktion der radialen Koordinate 𝜌 moduliert sind. Die Gaußfunktion wirkt dabei als eine Fensterfunktion, die das langsame radiale Abklingen des Besselstrahls beschleunigt (siehe Abb. 3.26). Ein Bessel-Gauß-Strahl kann durch Bestrahlung eines Axicons mit einem Gaußstrahl erzeugt werden.
3.5.2 Airystrahlen Analog zum Besselstrahl ergibt sich der Airystrahl als beugungsfreie exakte Lösung der paraxialen Helmholtzgleichung (2.27). Während die Form seiner transversalen Intensitätsverteilung im Laufe seiner axialen Ausbreitung erhalten bleibt, verschiebt sich das Strahl-
x / W0
zentrum beschleunigt in transversaler Richtung, 8) wie Abb. 3.27 illustriert. Die komplexe Einhüllende eines Airystrahls hat die Form 𝐴(𝑥, 𝑧) = Ai (
𝑥 𝑧 𝑥 𝑧2 − ) ) exp (−i 𝑊0 (4𝑧0 )2 𝑊0 2𝑧0
× exp (i
𝑧3 ). (24𝑧0 )3
Dabei ist Ai(𝑥) die Airyfunktion, die Lösung der Airy2 Differentialgleichung d 𝑦∕ d𝑥2 = 𝑥𝑦. Die Parameter 𝑊0 und 𝑧0 sind transversale und axiale Skalierungsfaktoren, die der Beziehung 𝑊02 = 𝜆𝑧0 ∕π gehorchen, die auch für den Gaußstrahl gilt [siehe Gl. (3.11)]. Bei 𝑧 = 0 ist die transversale Intensität des Airystrahls 𝐼(𝑥, 0) = Ai2 (𝑥∕𝑊0 ) deutlich asymmetrisch, wie auf der linken Seite von Abb. 3.27 zu sehen ist. Die transversale Verteilung der Intensität bleibt für beliebige 𝑧 erhalten, nur dass sie eine von der axialen Position abhängige transversale Verschiebung 𝑥 = 𝑊𝑧2 ∕(4𝑧0 )2 erfährt, die einer parabolischen Trajektorie folgt, 𝑥 = 𝑧2 ∕4𝑎 mit 𝑎 = 4𝑧02 ∕𝑊0 , entsprechend der Flugbahn eines ballistischen Geschosses. Bei 𝑧 = 4𝑧0 beträgt die transversale Verschiebung beispielsweise 𝑊0 , während sie bei 𝑧 = 20𝑧0 auf 25𝑊0 ansteigt, was die Erklärung für die Bezeichnung beschleunigender Strahl liefert. Ein Airystrahl kann mithilfe eines optischen Fouriertransformationssystems erzeugt werden (siehe Aufgabe 4-7). Anwendungen finden Airystrahlen z. B. in der Mikroskopie und der mechanischen Manipulation kleiner Partikel entlang gekrümmter Bahnen. 8) Siehe G. A. Siviloglou, J. Broky, A. Dogariu, D. N. Christodoulides, ‚Observation of Accelerating Airy Beams‘, Physical Review Letters 99, 213901, 2007.
I (x, z )
20 10 0
z / z0
–10 –20 I (x, 0 ) 0.5
0.4
0.3
0.2
0.1
0
0
(3.74)
10
20
Abb. 3.27 Die transversale Intensitätsverteilung des Airystrahls: I(x, 0) (links) und I(x, z) (rechts).
75
76
3 Optik von Strahlbündeln
Man kann noch weitere bessel- oder airyartige Strahlen erzeugen, deren transversale Intensitätsverteilungen während der axialen Ausbreitung nahezu invariant und symmetrisch bleiben und die sich entlang beliebiger Trajektorien (bis hin zu dreidimensionalen Spiralen) im Vakuum ausbreiten. 9) Diese nichtbeugenden Strahlen können teilweise blockiert werden und sich dennoch im weiteren Verlauf der Strahlachse wieder erholen (sogenannte „Selbstheilung“); sie werden in Anwendungen wie dem optischen Einfangen von Teilchen oder Präzisionsbohrungen eingesetzt.
Aufgaben Aufgabe 3-1: Strahlparameter
Das von einem Nd:YAG-Laser bei einer Wellenlänge von 1.06 μm emittierte Licht ist ein Gaußstrahl mit einer optischen Leistung von 1 W und einer Divergenz von 2𝜃0 = 1 mrad. Bestimmen Sie den Taillenradius des Strahls, seine maximale Intensität und die Intensität auf der Strahlachse in einer Entfernung von 𝑧 = 100 cm von der Taille. Aufgabe 3-2: Charakterisierung eines Strahlbündels durch zwei Radien
Ein Gaußstrahl der Wellenlänge 𝜆0 = 10.6 μm, der von einem CO2 -Laser emittiert wird, besitzt an zwei Punkten im Abstand d = 10 cm die Radien 𝑊1 = 1.699 mm und 𝑊2 = 3.380 mm. Bestimmen Sie die Lage der Strahltaille und den Taillenradius. Aufgabe 3-3: Der elliptische Gaußstrahl
Die paraxiale Helmholtzgleichung erlaubt einen Gaußstrahl mit der Intensität 𝐼(𝑥, 𝑦, 0) = |𝐴0 |2 exp[−2 2 2 + 𝑦 2 ∕𝑊0𝑦 )] in der Ebene 𝑧 = 0 mit den Taillen(𝑥2 ∕𝑊0𝑥 radien 𝑊0𝑥 und 𝑊0𝑦 in 𝑥- bzw. 𝑦-Richtung. Die Linien konstanter Intensität sind in diesem Fall keine Kreise, sondern Ellipsen. Geben Sie Ausdrücke für die Fokuslänge des Strahls, seine Divergenz und die Krümmungsradien in 𝑥- und 𝑦-Richtung als Funktionen von 𝑊0𝑥 , 𝑊0𝑦 und der Wellenlänge 𝜆 an. Skizzieren Sie die Form des Brennflecks in der Ebene 𝑧 = 0 und im Fernfeld (𝑧 viel größer als die Fokuslänge in beiden transversalen Richtungen) für 𝑊0𝑥 = 2𝑊0𝑦 .
9) Siehe I. Zhao, P. Zhang, D. Deng, J. Liu, Y. Gao, I D. Chremmos, N. K. Efremidis, D. N. Christodoulides, Z. Chen, ‚Observation of Self-Accelerating Bessel-like Optical Beams Along Arbitrary Trajectories‘, Optics Letters 38, 498–500, 2013.
Aufgabe 3-4: Fokussierung eines Strahlbündels
Ein Argonionenlaser erzeugt einen Gaußstrahl der Wellenlänge 𝜆 = 488 nm mit dem Taillenradius 𝑊0 = 0.5 mm. Entwerfen Sie ein optisches System aus einer einzelnen Linse, das das Licht auf einen Fleck mit einem Durchmesser von 100 μm fokussiert. Welches ist die kürzeste Brennweite, die Sie dabei verwenden können? Aufgabe 3-5: Taillendurchmesser
Ein Gaußstrahl mit der Rayleighlänge 𝑧0 = 50 cm und der Wellenlänge 𝜆 = 488 nm wird durch eine Linse mit der Brennweite 𝑓 = 5 cm in einer Entfernung 𝑧 von seiner Taille in einen Gaußstrahl mit dem Taillenradius 𝑊0′ umgewandelt (Abb. 3.13). Tragen Sie 𝑊0′ als Funktion von 𝑧 auf. Prüfen Sie, dass die Gln. (3.40) und (3.42) im Grenzfall 𝑧 − 𝑓 ≫ 𝑧0 gelten und dass im Grenzfall 𝑧 ≪ 𝑧0 auch Gl. (3.43) gilt. Aufgabe 3-6: Brechung eines Strahlbündels
Ein Gaußstrahl tritt aus der Luft (𝑛 = 1) in ein Medium mit einer ebenen Oberfläche und dem Brechungsindex 𝑛 = 1.5 ein. Die Strahlachse steht senkrecht auf der Grenzfläche, und die Strahltaille liegt an der Oberfläche. Skizzieren Sie den durchgelassenen Strahl. Wie groß ist die Divergenz des Strahlbündels in dem Medium, wenn sie in Luft 1 mrad beträgt? Aufgabe 3-7: Durchgang eines Gaußstrahls durch eine Gradientenindexplatte Die ABCD-Matrix einer Selfoc-Gradientenindexplat-
te (siehe Abschnitt 1.3.2) mit quadratischem Indexprofil 1 𝑛(𝑦) ≈ 𝑛0 (1 − 𝛼2 𝑦 2 ) und der Länge d lautet für paraxia2 le Strahlen in 𝑧-Richtung A = cos 𝛼d , B = (1∕𝛼) sin 𝛼d , C = −𝛼 sin 𝛼d und D = cos 𝛼d . Ein Gaußstrahl mit der Wellenlänge 𝜆0 , dem Taillenradius 𝑊0 im Vakuum und der Strahlachse in 𝑧-Richtung tritt an der Taille in die Selfoc-Platte ein. Verwenden Sie das ABCD-Gesetz und geben Sie einen Ausdruck für den Strahlradius in 𝑦-Richtung als Funktion von d an. Skizzieren Sie die Form des Strahlbündels auf seinem Weg durch das Medium. Aufgabe 3-8: Leistungsprofil in Hermite-Gauß-Strahlen
Bestimmen Sie den Anteil der gesamten Leistung in Hermite-Gauß-Strahlen der Ordnungen (0, 0), (1, 0), (0, 1) und (1, 1), der in einem Kreis mit dem Radius 𝑊(𝑧) in einer transversalen Ebene enthalten ist. Welcher Anteil der Gesamtleistung ist in Hermite-Gauß-Strahlen der Ordnungen (0, 0) und (1, 1) in einem Kreis mit dem 1 Radius 𝑊(𝑧) enthalten? 10
Aufgaben
Aufgabe 3-9: Ein Donut-Strahl
Betrachten Sie eine Welle, die als Superposition zweier Hermite-Gauß-Strahlen HG01 und HG10 mit gleichen Intensitäten entsteht. Die beiden Strahlen haben unabhängige und zufällige Phasen, sodass sich ihre Intensitäten ohne Interferenz addieren. Zeigen Sie, dass die Gesamtintensität durch eine ringförmige (toroidale) symmetrische Funktion beschrieben wird. Nehmen Sie 𝑊0 = 1 mm an und bestimmen Sie an der Strahltaille den Radius des Kreises maximaler Intensität sowie die Radien der beiden Kreise, an denen die Intensität das 1∕e2 fache der maximalen Intensität beträgt. Aufgabe 3-10: Die axiale Phase
Betrachten Sie die Hermite-Gauß-Strahlen aller Ordnungen (𝑙, 𝑚) mit der Rayleighlänge 𝑧0 = 30 cm in einem Medium mit dem Brechungsindex 𝑛 = 1. Bestimmen Sie die Frequenzen im Band 𝜈 = (1014 ± 2 × 109 ) Hz, für die die Phasenverzögerung zwischen den Ebenen 𝑧 = −𝑧0 und 𝑧 = 𝑧0 auf der Strahlachse ein ganzes Vielfaches von π beträgt. Diese Frequenzen sind die Moden eines Resonators, der aus zwei sphärischen Spiegeln in den Ebenen 𝑧 = ±𝑧0 besteht (siehe Abschnitt 11.2.4).
Weiterführende Literatur Bücher
Siehe auch alle Bücher über Laser in Kapitel 16 J. Secor, R. Alfano, S. Ashrafi, Complex Light, IOP Publishing 2017. F. M. Dickey (Hrsg.), Laser Beam Shaping: Theory and Techniques, CRC Press/Taylor & Francis, 2. Aufl. 2014. A. N. Oraevskiy, Gaussian Beams and Optical Resonators, Nova Science 1996. Artikel in Zeitschriften und Büchern
M. J. Padgett, ‚Orbital Angular Momentum 25 Years On‘, Optics Express 25, 11265–11274, 2017. J. Zhao, P. Zhang, D. Deng, J. Liu, Y. Gao, I. D. Chremmos, N. K. Efremidis, D. N. Christodoulides, Z. Chen, ‚Observation of Self-Accelerating Bessel-Like Optical Beams Along Arbitrary Trajectories‘, Optics Letters 38, 498–500, 2013.
A. Dudley, M. Lavery, M. Padgett, A. Forbes, ‚Unraveling Bessel Beams‘, Optics & Photonics News 24(6), 22–29, 2013. A. M. Yao, M. J. Padgett, ‚Orbital Angular Momentum: Origins, Behavior and Applications‘, Advances in Optics and Photonics 3, 161–204, 2011. M. R. Dennis, R. P. King, B. Jack, K. O’Holleran, M. J. Padgett, ‚Isolated Optical Vortex Knots‘, Nature Physics 6, 118–121, 2010. M. R. Dennis, K. O’Holleran, M. J. Padgett, ‚Singular Optics: Optical Vortices and Polarization Singularities‘. In E. Wolf (Hrsg.), Progress in Optics, Elsevier 2009, Bd. 53, S. 293–363. J. Vickers, M. Burch, R. Vyas, S. Singh, ‚Phase and Interference Properties of Optical Vortex Beams‘, Journal of the Optical Society of America A 25, 823–827, 2008. M. Martinelli, P. Martelli, ‚Laguerre Mathematics in Optical Communications‘, Optics & Photonics News 19(2), 30–35, 2008. G. A. Siviloglou, J. Broky, A. Dogariu, D. N. Christodoulides, ‚Observation of Accelerating Airy Beams‘, Physical Review Letters 99, 213901, 2007. M. A. Bandres, J. C. Gutierrez-Vega, ‚Ince-Gaussian Modes of the Paraxial Wave Equation and Stable Resonators‘, Journal of the Optical Society of America 21, 873–880, 2004. F. Gori, G. Guattari, C. Padovani, ‚Bessel-Gauss Beams‘, Optics Communications 64, 491–495, 1987. J. Durnin, J. J. Miceli, Jr., J. H. Eberly, ‚Diffraction-Free Beams‘, Physical Review Letters 58, 1499–1501, 1987. Sonderheft über Ausbreitung und Streuung von Strahlbündeln: Journal of the Optical Society of America A 3(4), 1986. H. Kogelnik, T. Li, ‚Laser Beams and Resonators‘, Proceedings of the IEEE 54, 1312–1329, 1966. G. D. Boyd, J. P. Gordon, ‚Confocal Multimode Resonator for Millimeter Through Optical Wavelength Masers‘, Bell System Technical Journal 40, 489–508, 1961. A. G. Fox, T. Li, ‚Resonant Modes in a Maser Interferometer‘, Bell System Technical Journal 40, 453–488, 1961.
77
79
4 Fourieroptik Die Fourieroptik beschreibt die Lichtausbreitung auf der Grundlage einer harmonischen Analyse (der Fouriertransformation) und der Theorie linearer Systeme. Die Methoden der harmonischen Analyse haben sich auf vielen Gebieten für die Beschreibung von Signalen und Systemen als nützlich erwiesen. Sie beruht auf der Darstellung einer beliebigen Funktion 𝑓(𝑡) der Zeit als Superposition (eine Summe oder ein Integral) harmonischer Funktionen der Zeit mit unterschiedlichen Frequenzen (siehe Abschnitt A.1). Der Baustein der Theorie ist die harmonische Funktion 𝐹(𝜈) exp(i2π 𝜈𝑡) mit der Frequenz 𝜈 und der komplexen Amplitude 𝐹(𝜈). Wie Abb. 4.1 zeigt, werden mehrere solcher Funktionen mit verschiedenen 𝐹(𝜈) addiert, um die Funktion 𝑓(𝑡) zu konstruieren. Die komplexe Amplitude 𝐹(𝜈) (eine Funktion der Frequenz) heißt Fouriertransformierte von 𝑓(𝑡). Dieser Ansatz ist vor allem für die Beschreibung linearer Systeme nützlich (siehe Abschnitt B.1). Wenn die Reaktion des Systems auf die harmonischen Funktionen bekannt ist, kann seine Reaktion auf eine beliebige Eingabefunktion durch harmonische Analyse am Eingang bzw. durch Superposition am Ausgang berechnet werden. Eine beliebige komplexe Funktion 𝑓(𝑥, 𝑦) der Variablen 𝑥 und 𝑦, die für die räumlichen Koordina-
ten in einer Ebene stehen, kann ebenso als Superposition harmonischer Funktionen der Form 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] geschrieben werden, wobei 𝐹(𝜈𝑥 , 𝜈𝑦 ) die komplexe Amplitude ist und 𝜈𝑥 und 𝜈𝑦 die Ortsfrequenzen (Perioden pro Längeneinheit, meist pro mm) in 𝑥- und 𝑦-Richtung sind. 1) Die harmonische Funktion 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] ist der zweidimensionale Grundbaustein der Theorie. Mit ihrer Hilfe können beliebige Funktionen 𝑓(𝑥, 𝑦) zweier Variablen dargestellt werden, wie Abb. 4.2 zeigt (siehe Abschnitt A.3). Die monochromatische ebene Welle 𝑈(𝑥, 𝑦, 𝑧) = 𝐴 exp[−i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧)] spielt in der Wellenoptik eine wichtige Rolle. Die Koeffizienten (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) sind die Komponenten des Wellenvektors k und 𝐴 ist eine komplexe Konstante. In einer beliebigen Ebene ist 𝑈(𝑥, 𝑦, 𝑧) eine räumliche harmonische Funktion. In der Ebene 𝑧 = 0 ist 𝑈(𝑥, 𝑦, 0) beispielsweise die harmonische Funktion 𝑓(𝑥, 𝑦) = 𝐴 exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)], wobei 𝜈𝑥 = 𝑘𝑥 ∕2π und 𝜈𝑦 = 𝑘𝑦 ∕2π die Ortsfrequenzen (Peri1) Die räumliche harmonische Funktion (Ortsfunktion) ist mit einem Minuszeichen im Exponenten definiert, im Gegensatz zu dem Pluszeichen im Exponenten in der Definition der zeitlichen harmonischen Funktion (siehe Abschnitt A.3). Diese Vorzeichen entsprechen denen einer sich in Vorwärtsrichtung ausbreitenden ebenen Welle gemäß Gl. (2.15).
f (t) t
t
t
t
...
Abb. 4.1 Eine beliebige Funktion f (t ) kann als Summe von harmonischen Funktionen mit unterschiedlichen Frequenzen und komplexen Amplituden geschrieben werden. y
x
...
Abb. 4.2 Eine beliebige Funktion f (x, y ) kann als Summe harmonischer Funktionen mit unterschiedlichen Ortsfrequenzen und komplexen Amplituden geschrieben werden, die hier schematisch als schattierte Linien dargestellt sind.
f(x, y) Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
80
4 Fourieroptik
z
on des Systems auf einen Impuls – eine Deltafunktion – als Eingangssignal) oder durch seine Übertragungsfunktion (seine Reaktion auf ein Signal in Form räumlicher harmonischer Funktionen) charakterisiert werden, wie in Anhang B näher erläutert wird.
z
In diesem Kapitel . . . Abb. 4.3 Das Prinzip der Fourieroptik: Eine beliebige Welle im Vakuum kann als Superposition ebener Wellen geschrieben werden.
oden pro mm) und 𝑘𝑥 und 𝑘𝑦 die Winkel-Ortsfrequenzen (Radian pro mm) sind. Zwischen der ebenen Welle 𝑈(𝑥, 𝑦, 𝑧) und der räumlichen harmonischen Funktion 𝑓(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, 0) besteht eine 1:1-Entsprechung, da 𝑘𝑥 und 𝑘𝑦 ausreichen, um 𝑘𝑧 über die Beziehung 𝑘𝑥2 + 𝑘𝑦2 + 𝑘𝑧2 = 𝜔2 ∕𝑐2 = (2π∕𝜆)2 zu bestimmen. Wie im Folgenden erläutert wird, können 𝑘𝑥 und 𝑘𝑦 nicht größer als 𝜔∕𝑐 werden, d. h. die Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 können nicht größer als die inverse Wellenlänge 1∕𝜆 sein. Da eine beliebige Funktion 𝑓(𝑥, 𝑦) als Superposition harmonischer Funktionen geschrieben werden kann, kann eine beliebige Welle 𝑈(𝑥, 𝑦, 𝑧) als Summe ebener Wellen (Abb. 4.3) dargestellt werden. Die ebene Welle ist der Baustein, mit dessen Hilfe eine beliebig komplexe Welle aufgebaut werden kann. Wenn weiterhin bekannt ist, wie ein lineares optisches System ebene Wellen verändert, kann die Wirkung des Systems auf eine beliebige Welle mithilfe des Superpositionsprinzips bestimmt werden. Wegen der Bedeutung der Fourieranalyse für die Beschreibung linearer Systeme ist es nützlich, die Lichtausbreitung durch lineare optische Komponenten einschließlich Vakuum auf der Grundlage linearer Systeme zu beschreiben. Dabei werden die komplexen Amplituden in zwei zur optischen 𝑧-Achse senkrechten Ebenen als Eingangs- bzw. Ausgangssignal des Systems aufgefasst (Abb. 4.4). Ein lineares System kann entweder durch seine Impulsantwortfunktion (die Reaktix
x
U(x,y,z)
f(x,y) y Eingangsebene z = 0
optisches System
g(x,y) y Ausgangsebene z =
Abb. 4.4 Der Durchgang einer optischen Welle U(x, y , z) durch ein optisches System zwischen einer Eingangsebene z = 0 und einer Ausgangsebene z = d. Diese Anordnung ist ein lineares System mit dem Eingangssignal f (x, y ) = U(x, y , 0) und dem Ausgangssignal g(x, y ) = U(x, y , d ).
Dieses Kapitel beginnt mit einer Beschreibung der Ausbreitung von monochromatischem Licht im Vakuum auf der Grundlage einer Fourieranalyse (Abschnitt 4.1). Dabei werden die Übertragungsfunktion und die Impulsantwortfunktion des Systems „Ausbreitung im Vakuum“ bestimmt. In Abschnitt 4.2 zeigen wir, dass eine Linse eine räumliche Fouriertransformation durchführen kann. Der Durchgang von Licht durch Blenden wird in Abschnitt 4.3 diskutiert; dabei handelt es sich um einen fourieroptischen Zugang zu dem Phänomen der Lichtbeugung, das normalerweise in einführenden Lehrbüchern aus dem Blickwinkel des huygensschen Prinzips behandelt wird. Abschnitt 4.4 ist der Bildentstehung und Ortsfiltern gewidmet, die aus dem Blickwinkel sowohl der Strahlen- als auch der Wellenoptik beschrieben werden. Hier wird mit der optischen Nahfeldmikroskopie auch die Entstehung von Abbildungen im Subwellenlängenbereich diskutiert. Zum Abschluss gibt Abschnitt 4.5 eine Einführung in die Holographie, die Aufzeichnung und Rekonstruktion optischer Wellen. Kenntnisse der grundlegenden Eigenschaften der Fouriertransformation und von linearen Systemen in ein und zwei Dimensionen (siehe Anhang A und B) sind für das Verständnis dieses Kapitels Voraussetzung.
4.1 Lichtausbreitung im Vakuum 4.1.1 Räumliche harmonische Funktionen und ebene Wellen Wir betrachten eine monochromatische ebene Welle mit der komplexen Amplitude 𝑈(𝑥, 𝑦, 𝑧) = 𝐴 exp[−i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧)], dem Wellenvektor k = (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ), der √ Wellenlänge 𝜆, der Wellenzahl 𝑘 = 𝑘𝑥2 + 𝑘𝑦2 + 𝑘𝑧2 = 2π∕𝜆 und der komplexen Einhüllenden 𝐴. Der Vek−1 tor k schließt die Winkel 𝜃𝑥 = sin (𝑘𝑥 ∕𝑘) und 𝜃𝑦 = −1 sin (𝑘𝑦 ∕𝑘) mit den 𝑦𝑧- und 𝑥𝑧-Ebenen ein, wie Abb. 4.5 zeigt. Wenn 𝜃𝑥 = 0 ist, besitzt k folglich keine Komponente in 𝑥-Richtung. Die komplexe Amplitude 𝑈(𝑥, 𝑦, 0) in der Ebene 𝑧 = 0 ist eine räumliche harmonische Funktion 𝑓(𝑥, 𝑦) = 𝐴 exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] mit den
4.1 Lichtausbreitung im Vakuum
λ
x
x
ebene Welle
kx
θy
k
θx
ky
k
kz
z
θx = sin–1 λνx z
Λx = 1/νx
Abb. 4.5 Eine harmonische Funktion mit den Ortsfrequenzen 𝜈x und 𝜈y in der Ebene z = 0 entspricht einer ebenen Welle, die sich in den Winkeln −1 −1 𝜃x = sin 𝜆𝜈x und 𝜃y = sin 𝜆𝜈y ausbreitet.
harmonische Funktion f (x,y)
y
Ortsfrequenzen 𝜈𝑥 = 𝑘𝑥 ∕2π und 𝜈𝑦 = 𝑘𝑦 ∕2π (die räumliche Frequenz 𝜈 = 𝑘∕2π wird in Perioden pro mm angegeben, während die optische Frequenz 𝜈 = 𝑘𝑐∕2π in Perioden pro s oder Hz gemessen wird; siehe Abschnitt 2.2). Die Winkel des Wellenvektors hängen daher durch −1
𝜃𝑥 = sin
𝜆𝜈𝑥 ,
−1
𝜃𝑦 = sin
𝜆𝜈𝑦
(4.1)
mit den Ortsfrequenzen der harmonischen Funktion zusammen. Wenn wir für die Perioden der harmonischen Funktionen in 𝑥- und 𝑦-Richtung 𝛬𝑥 = 1∕𝜈𝑥 und 𝛬𝑦 = 1∕𝜈𝑦 schreiben, erkennen wir, dass die Winkel 𝜃𝑥 = −1 −1 sin (𝜆∕𝛬𝑥 ) und 𝜃𝑦 = sin (𝜆∕𝛬𝑦 ) durch das Verhältnis der Lichtwellenlänge zur Periode der harmonischen Funktion in der jeweiligen Richtung bestimmt sind. Diese geometrischen Beziehungen ergeben sich daraus, dass die Wellenfronten der Welle mit dem periodischen Muster der harmonischen Funktion in der Ebene 𝑧 = 0 übereinstimmen müssen, wie Abb. 4.5 verdeutlicht. Wenn 𝑘𝑥 ≪ 𝑘 und 𝑘𝑦 ≪ 𝑘, der Wellenvektor k also paraxial ist, sind die Winkel 𝜃𝑥 und 𝜃𝑦 klein (sin 𝜃𝑥 ≈ 𝜃𝑥 und sin 𝜃𝑦 ≈ 𝜃𝑦 ) und es gilt 𝜃𝑥 ≈ 𝜆𝜈𝑥 ,
𝜃𝑦 ≈ 𝜆𝜈𝑦 .
(4.2)
Die Neigungswinkel des Wellenvektors sind dann direkt proportional zu den Ortsfrequenzen der entsprechenden harmonischen Funktion. Offensichtlich gibt es eine 1:1-Entsprechung zwischen der ebenen Welle 𝑈(𝑥, 𝑦, 𝑧) und der harmonischen Funktion 𝑓(𝑥, 𝑦). Wenn eine dieser Funktionen bekannt ist, kann die andere ohne weiteres bestimmt werden, sofern auch die Wellenlänge 𝜆 bekannt ist: Die harmonische Funktion 𝑓(𝑥, 𝑦) wird bestimmt, indem man die Welle in der Ebene 𝑧 = 0 misst, 𝑓(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, 0). Wenn andererseits die harmonische Funktion 𝑓(𝑥, 𝑦) gegeben ist, kann die Welle 𝑈(𝑥, 𝑦, 𝑧) mithilfe der Beziehung 𝑈(𝑥, 𝑦, 𝑧) = 𝑓(𝑥, 𝑦) exp(−i𝑘𝑧 𝑧) mit √ (4.3) 𝑘𝑧 = ± 𝑘2 − 𝑘𝑥2 − 𝑘𝑦2 , 𝑘 = 2π∕𝜆 konstruiert werden.
Eine Bedingung für die Gültigkeit dieser Entsprechung ist, dass 𝑘𝑥2 + 𝑘𝑦2 < 𝑘2 gelten muss, sodass 𝑘𝑧 reell ist. Diese Bedingung impliziert 𝜆𝜈𝑥 < 1 und 𝜆𝜈𝑦 < 1, sodass die durch Gl. (4.1) definierten Winkel 𝜃𝑥 und 𝜃𝑦 existieren. Die unterschiedlichen Vorzeichen in Gl. (4.3) stehen für Wellen, die sich vorwärts bzw. rückwärts ausbreiten. Wir werden im Folgenden nur Wellen betrachten, die sich in Vorwärtsrichtung ausbreiten. Räumliche Spektralanalyse
Wenn eine ebene Welle der Amplitude eins, die sich in 𝑧-Richtung ausbreitet, durch ein dünnes optisches Element mit der komplexen Amplitudentransmission 𝑓(𝑥, 𝑦) = exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] hindurchtritt, wird die Welle mit der harmonischen Funktion moduliert, sodass 𝑈(𝑥, 𝑦, 0) = 𝑓(𝑥, 𝑦) ist. Die einfallende Welle wird dabei in eine ebene Welle mit einem Wellenvektor in den −1 −1 Winkeln 𝜃𝑥 = sin 𝜆𝜈𝑥 und 𝜃𝑦 = sin 𝜆𝜈𝑦 umgewandelt (siehe Abb. 4.6). Das optische Element wirkt folglich ganz ähnlich wie ein Prisma und lenkt die Welle in diesem Beispiel nach oben ab. Wenn die komplexe Amplitudentransmission des Elements gleich 𝑓(𝑥, 𝑦) = exp[+i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] ist, wird die Welle in eine ebene Welle mit einem Wellenvektor in den Winkeln −𝜃𝑥 und −𝜃𝑦 zur 𝑧-Achse umgewandelt; die Welle wird jetzt also nach unten anstatt nach oben abgelenkt. x
λ k
λ
θx = sin–1 λνx z Λx = 1/ νx
f (x,y)
Abb. 4.6 Ein dünnes optisches Element, dessen komplexe Amplitudentransmission eine harmonische Funktion mit der Ortsfrequenz 𝜈x (der Periode 𝛬x = 1∕𝜈x ) ist, bricht eine ebene Welle der Wellenlänge 𝜆 in einem Winkel −1 −1 𝜃x = sin 𝜆𝜈x = sin (𝜆∕𝛬x ). Das optische Element wirkt dabei als Phasengitter, das nur die Phase der hindurchtretenden Welle beeinflusst.
81
82
4 Fourieroptik
Die ablenkenden Eigenschaften eines optischen Elements mit einer Transmission gemäß einer harmonischen Funktion können als Interferenzerscheinung verstanden werden. In einer Richtung im Winkel 𝜃𝑥 besitzen zwei durch einen Abstand von einer Periode 𝛬 = 1∕𝜈𝑥 getrennte Punkte auf dem Element eine relative Weglängendifferenz von 𝛬 sin 𝜃𝑥 = (1∕𝜈𝑥 )𝜆𝜈𝑥 = 𝜆, d. h. von einer Wellenlänge. Folglich interferieren alle Abschnitte im Abstand von einer Periode in dieser Richtung konstruktiv. Wenn die Transmission 𝑓(𝑥, 𝑦) des optischen Elements die Summe mehrerer harmonischer Funktionen mit unterschiedlichen Ortsfrequenzen ist, ist auch die durchgelassene optische Welle die Summe einer gleichen Zahl von ebenen Wellen, die sich in unterschiedliche Richtungen ausbreiten; jede Ortsfrequenz wird gemäß Gl. (4.1) auf eine entsprechende Richtung abgebildet. Die Amplitude jeder Welle ist proportional zur Amplitude der entsprechenden harmonischen Komponente von 𝑓(𝑥, 𝑦). Einige Beispiele sollen dieses Prinzip veranschaulichen: • Eine komplexe Amplitudentransmission der Form 1 𝑓(𝑥, 𝑦) = cos(2π 𝜈𝑥 𝑥) = {exp(−i2π 𝜈𝑥 𝑥) + exp(+i 2 2π 𝜈𝑥 𝑥)} zerlegt eine einfallende ebene Welle in Kom−1 ponenten, die sich unter den Winkeln ± sin (𝜆𝜈𝑥 ) ausbreiten, d. h. die sowohl nach unten als auch noch oben abgelenkt werden. • Ein Element mit einer Transmission, die gemäß 1 + cos(2π 𝜈𝑦 𝑦) variiert, verhält sich wie ein Beugungsgitter (siehe Übung 2-7); die einfallende Welle wird in nach rechts und links abgelenkte Komponenten zerlegt, und ein Teil tritt in gerader Linie durch das Element hindurch. • Ein Element mit der Transmission 𝑓(𝑥, 𝑦) = 𝒰[cos(2π 𝜈𝑥 𝑥)], wobei 𝒰(𝑥) die Einheits-Stufenfunktion ist [𝒰(𝑥) = 1 für 𝑥 > 0 und 𝒰(𝑥) = 0 für 𝑥 < 0], entspricht einer periodisch angeordneten Folge von Spalten mit 𝑓(𝑥, 𝑦) = 1 in einem undurchsichtigen Schirm [𝑓(𝑥, 𝑦) = 0]. Diese periodische Funktion kann in Form einer Fourierreihe als Summe harmonischer Funktionen der Frequenzen 0, ±𝜈𝑥 , ±2𝜈𝑥 , … geschrieben werden, die Wellen in den Win−1 −1 keln 0, ± sin 𝜆𝜈𝑥 , ± sin 2𝜆𝜈𝑥 , … entsprechen, deren Amplituden proportional zu den Koeffizienten der Fourierreihe sind. In diesem Winkeln interferieren die durch die Spalte durchgelassenen Wellen konstruktiv.
Wenn 𝑓(𝑥, 𝑦) ein Superpositionsintegral ∞
[ ] 𝑓(𝑥, 𝑦) = ∬ 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp −i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦) d𝜈𝑥 d𝜈𝑦 −∞
(4.4) harmonischer Funktionen mit den Frequenzen (𝜈𝑥 , 𝜈𝑦 ) und den Amplituden 𝐹(𝜈𝑥 , 𝜈𝑦 ) ist, gilt allgemeiner, dass die durchgelassene Welle 𝑈(𝑥, 𝑦, 𝑧) eine Superposition ∞
[ ] 𝑈(𝑥, 𝑦, 𝑧) = ∬ 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp −i(2π 𝜈𝑥 𝑥 + 2π 𝜈𝑦 𝑦) −∞
× exp(−i𝑘𝑧 𝑧) d𝜈𝑥 d𝜈𝑦
(4.5)
ebener Wellen mit den komplexen Einhüllenden 𝐹(𝜈𝑥 , 𝜈𝑦 ) ist, wobei √ √ 𝑘𝑧 = 𝑘2 − 𝑘𝑥2 − 𝑘𝑦2 = 2π 𝜆 −2 − 𝜈𝑥2 − 𝜈𝑦2 gilt. Dabei ist 𝐹(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑓(𝑥, 𝑦) (siehe Abschnitt A.3). Da wir eine beliebige Funktion durch Fourieranalyse als Superpositionsintegral der Form Gl. (4.4) schreiben können, können wir das durch ein dünnes optisches Element mit beliebiger Transmission durchgelassene Licht immer als Superposition von ebenen Wellen (siehe Abb. 4.7) schreiben, sofern 𝜈𝑥2 + 𝜈𝑦2 < 𝜆 −2 gilt. Dieser Prozess der „räumlichen Spektralanalyse“ ähnelt der von einem Prisma hervorgerufenen Winkeldispersion verschiedener Komponenten mit unterschiedlichen zeitlichen Frequenzen (Wellenlängen). Die Ausbreitung im Vakuum ist eine Art natürliches „räumliches Prisma“, das für die Orts- anstelle der zeitlichen Frequenzen der optischen Welle empfindlich ist. x
z
y
f(x,y)
Abb. 4.7 Ein dünnes optisches Element mit der Amplitudentransmission f (x, y ) zerlegt eine einfallende ebene Welle in viele ebene Wellen. Die komplexe Einhüllende F (𝜈x , 𝜈y ) der −1
ebenen Welle, die sich in den Winkeln 𝜃x = sin 𝜆𝜈x und −1 𝜃y = sin 𝜆𝜈y ausbreitet, ist die Fouriertransformierte von f (x , y ).
4.1 Lichtausbreitung im Vakuum
x
x
sin–1 λνx0
z y
f0(x,y)
y
z
Abb. 4.8 Ablenkung von Licht durch die Elemente f0 (x, y ) und f0 (x, y ) exp(−i2π 𝜈x0 x). Die harmonische „Träger“funktion exp(−i2π 𝜈x0 x) wirkt wie ein Prisma, das die Welle um einen −1 Winkel 𝜃x0 = sin 𝜆𝜈x0 ablenkt.
f0(x,y) exp(–i 2πνx0x)
Amplitudenmodulation
Wir betrachten zuerst ein transparentes Element mit der komplexen Amplitudentransmission 𝑓0 (𝑥, 𝑦). Wenn die Fouriertransformierte 𝐹0 (𝜈𝑥 , 𝜈𝑦 ) sich in 𝑥- und 𝑦-Richtung über die Bereiche ±Δ𝜈𝑥 und ±Δ𝜈𝑦 erstreckt, lenkt dieses Element eine einfallende ebene Welle um die −1 Winkel 𝜃𝑥 und 𝜃𝑦 in den Bereich ± sin (𝜆Δ𝜈𝑥 ) und −1 ± sin (𝜆Δ𝜈𝑦 ) ab. Nun betrachten wir ein zweites transparentes Element mit der komplexen Amplitudentransmission 𝑓(𝑥, 𝑦) = 𝑓0 (𝑥, 𝑦) exp[−i2π(𝜈𝑥0 𝑥 + 𝜈𝑦0 𝑦)], wobei 𝑓0 (𝑥, 𝑦) im Vergleich zu exp[−i2π(𝜈𝑥0 𝑥 + 𝜈𝑦0 𝑦)] langsam variieren soll, sodass Δ𝜈𝑥 ≪ 𝜈𝑥0 und Δ𝜈𝑦 ≪ 𝜈𝑦0 gilt. Wir können 𝑓(𝑥, 𝑦) als amplitudenmodulierte Funktion mit den Trägerfrequenzen 𝜈𝑥0 und 𝜈𝑦0 und der Modulationsfunktion 𝑓0 (𝑥, 𝑦) ansehen. Die Fouriertransformierte von 𝑓(𝑥, 𝑦) ist 𝐹0 (𝜈𝑥 − 𝜈𝑥0 , 𝜈𝑦 − 𝜈𝑦0 ), in Übereinstimmung mit der Eigenschaft der Frequenzverschiebung der Fouriertransformation (siehe Anhang A). Dieses transparente Element lenkt eine ebene Welle in einen Bereich −1 von Richtungen um die Winkel 𝜃𝑥0 = sin 𝜆𝜈𝑥0 und −1 𝜃𝑦0 = sin 𝜆𝜈𝑦0 ab (siehe Abb. 4.8). Das ist leicht zu verstehen, wenn wir uns 𝑓(𝑥, 𝑦) als transparentes Element der Transmission 𝑓0 (𝑥, 𝑦) im Kontakt mit einem Gitter oder einem Prisma der Transmission exp[−i2π(𝜈𝑥0 𝑥 + 𝜈𝑦0 𝑦)] vorstellen, das für die Ablenkung der Welle in den Winkeln 𝜃𝑥0 und 𝜃𝑦0 sorgt. Auf diesem Prinzip aufbauend können wir durch Ortsfrequenzmultiplexing zwei Bilder 𝑓1 (𝑥, 𝑦) und 𝑓2 (𝑥, 𝑦) auf derselben Folie speichern: 𝑓(𝑥, 𝑦) = 𝑓1 (𝑥, 𝑦) exp[−i2π(𝜈𝑥1 𝑥 + 𝜈𝑦1 𝑦)] + 𝑓2 (𝑥, 𝑦) exp[−i2 π (𝜈𝑥2 𝑥 + 𝜈𝑦2 𝑦)]. Die beiden Aufnahmen können einfach wieder getrennt werden, indem man die Folie mit einer ebenen Welle beleuchtet, woraufhin die beiden Bilder in unterschiedliche Richtungen abgelenkt und so getrennt werden. Dieses Prinzip kommt bei der Holographie zum Einsatz (Abschnitt 4.5), wo es häufig darauf ankommt, zwei Bilder aufzutrennen, die auf derselben Folie gespeichert sind.
Abb. 4.9 Ablenkung von Licht durch eine Folie, die aus mehreren harmonischen Funktionen (Phasengittern) mit unterschiedlichen Ortsfrequenzen besteht.
Frequenzmodulation
Als Nächstes untersuchen wir den Durchgang einer ebenen Welle durch eine Folie aus verschiedenen Bereichen, deren Transmission wie in Abb. 4.9 gezeigt jeweils eine harmonische Funktion einer bestimmten Ortsfrequenz ist. Wenn die Abmessungen dieser Bereiche viel größer sind als ihre Periode, wirkt jede von ihnen wie ein Beugungsgitter oder Prisma, das die Welle in eine bestimmte Richtung ablenkt, sodass verschiedene Teile der einfallenden Wellenfront in unterschiedliche Richtungen abgelenkt werden. Auf dieser Grundlage kann man optische Verbindungen kartieren, wie in Abschnitt 24.1.3 detaillierter beschrieben wird. Beispiel 4-1: Frequenzmodulierte transparente Folie
Eine dünne Folie mit der komplexen Amplitudentransmission 𝑓(𝑥, 𝑦) = exp(iπ𝑥2 ∕𝜆𝑓) bewirkt eine Phasenverschiebung 2π 𝜙(𝑥, 𝑦) mit 𝜙(𝑥, 𝑦) = −𝑥2 ∕2𝜆𝑓, sodass eine Welle am Ort (𝑥, 𝑦) um die Winkel 𝜃𝑥 = −1 −1 sin (𝜆𝜕𝜙∕𝜕𝑥) = sin (−𝑥∕𝑓) und 𝜃𝑦 = 0 abgelenkt wird. Für |𝑥∕𝑓| ≪ 1 ist 𝜃𝑥 ≈ −𝑥∕𝑓 und der Winkel 𝜃𝑥 ist direkt proportional zu dem transversalen Abstand 𝑥. Eine solche Folie kann verwendet werden, um einen gebündelten Lichtstrahl abzulenken. Wenn die Folie sich mit konstanter Geschwindigkeit bewegt, wird der Strahl um einen linear ansteigenden Winkel abgelenkt, wie Abb. 4.10 zeigt.
83
84
4 Fourieroptik
x
–θx
z f
Abb. 4.10 Abtasten eines Lichtstrahls mithilfe einer frequenzmodulierten transparenten Folie.
Eine Folie kann auch eine harmonische Transmission mit einer örtlich langsam (verglichen mit 𝜆) aber kontinuierlich variierenden Ortsfrequenz besitzen, ähnlich wie die Frequenz eines frequenzmodulierten (FM-) Signals zeitlich langsam variiert. Betrachten Sie zum Beispiel die Phasenfunktion 𝑓(𝑥, 𝑦) = exp[−i2π𝜙(𝑥, 𝑦)], wobei 𝜙(𝑥, 𝑦) eine kontinuierliche langsam variierende Funktion von 𝑥 und 𝑦 ist. In der Umgebung eines Punkts (𝑥0 , 𝑦0 ) können wir die Funktion in eine Taylorreihe 𝜙(𝑥, 𝑦) ≈ 𝜙(𝑥0 , 𝑦0 ) + (𝑥 − 𝑥0 )𝜈𝑥 + (𝑦 − 𝑦0 )𝜈𝑦 entwickeln, wobei die Ableitungen 𝜈𝑥 = 𝜕𝜙∕𝜕𝑥 und 𝜈𝑦 = 𝜕𝜙∕𝜕𝑦 am Ort (𝑥0 , 𝑦0 ) berechnet werden. Die lokale Variation von 𝑓(𝑥, 𝑦) mit 𝑥 und 𝑦 ist demzufolge proportional zu der Größe exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)], die eine harmonische Funktion mit den Ortsfrequenzen 𝜈𝑥 = 𝜕𝜙∕𝜕𝑥 und 𝜈𝑦 = 𝜕𝜙∕𝜕𝑦 ist. Da diese Ableitungen von 𝑥 und 𝑦 abhängen, gilt dies auch für die Ortsfrequenzen. Die Folie 𝑓(𝑥, 𝑦) = exp[−i2π 𝜙(𝑥, 𝑦)] lenkt daher den Anteil der Welle am Ort (𝑥, 𝑦) um die ortsabhängigen Winkel −1 −1 𝜃𝑥 = sin (𝜆𝜕𝜙∕𝜕𝑥) und 𝜃𝑦 = sin (𝜆𝜕𝜙∕𝜕𝑦) ab. Beispiel 4-2: Bildentstehung
Wenn die Folie aus Beispiel 4-1 von einer ebenen Welle bestrahlt wird, wird jeder Teil dieser Welle um einen anderen Winkel abgelenkt, und die Wellenfront wird daher verändert. Der lokale Wellenvektor am Ort 𝑥 wird um einen Winkel −𝑥∕𝑓 abgelenkt, sodass alle Wellenvektoren sich in einem einzigen Punkt auf der optischen Achse in einer Entfernung 𝑓 von der Folie treffen (Abb. 4.11). Die Folie wirkt somit wie eine Zylinderlinse mit der Brennweite 𝑓. Ähnlich wirkt eine Folie mit der Transmission 𝑓(𝑥, 𝑦) = exp[iπ(𝑥2 + 𝑦 2 )∕𝜆𝑓] wie eine sphärische Linse mit der Brennweite 𝑓. In der Tat beschreibt dieser Ausdruck die Amplitudentransmission einer dünnen Linse [siehe Gl. (2.40)].
Abb. 4.11 Eine Folie mit der Transmission f (x, y ) = exp(iπ x2 ∕𝜆f ) lenkt die Welle am Ort x um den Winkel 𝜃x ≈ −x∕f ab, sodass sie als Zylinderlinse der Brennweite f wirkt. x
z
f
Abb. 4.12 Binäre Platte als Zylinderlinse mit vielen Brennpunkten.
Übung 4-1: Binäre Platte als Zylinderlinse
Zeigen Sie mithilfe einer harmonischen Analyse in der Umgebung des Punkts 𝑥, dass eine Folie mit der komplexen Amplitudentransmission 𝑓(𝑥, 𝑦) = 𝒰 [cos (π
𝑥2 )] , 𝜆𝑓
(4.6)
wobei 𝒰(𝑥) die Einheits-Stufenfunktion ist [𝒰(𝑥) = 1 für 𝑥 ≥ 0 und 𝒰(𝑥) = 0 für 𝑥 < 0], als Zylinderlinse mit den Brennweiten ∞, ±𝑓, ±𝑓∕2, … wirkt (Abb. 4.12).
Fresnelzonenplatte
Eine zweidimensionale Verallgemeinerung der binären Platte aus Übung 4-1 ist eine rotationssymmetrische Folie mit der komplexen Amplitudentransmission 𝑓(𝑥, 𝑦) = 𝒰 [cos (π
𝑥2 + 𝑦 2 )] , 𝜆𝑓
(4.7)
die als Fresnelzonenplatte bezeichnet wird. Sie besteht aus einer Reihe von ringförmigen Blenden mit zunehmenden Radien, abnehmender Breite und gleichen Flächen (siehe Abb. 4.13).
4.1 Lichtausbreitung im Vakuum
weil die Helmholtzgleichung linear ist, die 𝑈(𝑥, 𝑦, 𝑧) erfüllen muss. Das System ist weiterhin invariant gegenüber einer Translation, weil das Vakuum gegenüber eine Verschiebung des Koordinatensystems invariant ist. Ein lineares translationsinvariantes System ist durch seine Impulsantwortfunktion ℎ(𝑥, 𝑦) oder seine Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) charakterisiert, wie in Abschnitt B.2 näher erläutert wird. Wir wollen im Folgenden Ausdrücke für diese Funktionen entwickeln. Die Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) ist der Faktor, mit dem ein räumlich harmonisches Eingangssignal der Frequenzen 𝜈𝑥 und 𝜈𝑦 multipliziert wird, um das harmonische Ausgangssignal zu erhalten. Wir betrachten also ein harmonisches Eingangssignal 𝑓(𝑥, 𝑦) = 𝐴 exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)]. Wie bereits erwähnt entspricht diese Funktion einer ebenen Welle 𝑈(𝑥, 𝑦, 𝑧) = 𝐴 exp[−i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧)] mit 𝑘𝑥 = 2π 𝜈𝑥 , 𝑘𝑦 = 2π 𝜈𝑦 und
x Rm z
f
Abb. 4.13 Eine Fresnelzonenplatte.
Eine solche Struktur wirkt als sphärische Linse mit mehreren Brennweiten. Ein an einem bestimmten Punkt einfallender Strahl wird in mehrere Strahlen aufgespalten, und die durchgelassenen Strahlen treffen einander (sowie eine nicht abgelenkte Komponente des Strahls) in mehreren Brennpunkten mit den Brennweiten ±𝑓, ±𝑓∕2, … Die Wirkung einer Fresnelzonenplatte kann auch als Interferenzeffekt verstanden werden (siehe Abschnitt 2.5.2). Das Zentrum des 𝑚-ten Rings (des 𝑚-ten Maximums der Kosinusfunktion) hat den Radius 𝜌𝑚 , 2 ∕𝜆𝑓 = 𝑚2π. Der Abstand 𝑅𝑚 vom Brennd. h. es gilt π𝜌𝑚 2 2 = 𝑓 2 + 𝜌𝑚 , sodass punkt √ 𝑧 = 𝑓 zum 𝑚-ten Ring ist 𝑅𝑚 𝑅𝑚 = 𝑓 2 + 2𝑚𝜆𝑓 ist. Wenn 𝑓 hinreichend groß ist, sodass die von von den Ringen aufgespannten Winkel klein sind, ist 𝑅𝑚 ≈ 𝑓 + 𝑚𝜆. Die Weglängen der durch aufeinander folgende Ringe durchgelassenen Strahlen unterscheiden sich also um eine Wellenlänge, sodass sie im Brennpunkt konstruktiv interferieren. Ähnliche Argumente gelten für die anderen Brennpunkte.
𝑘𝑧 =
H(𝜈𝑥 , 𝜈𝑦 ) = exp (−i2π d
U(x,y,z) g(x,y)
f (x,y)
f 0
z
√ 𝜆 −2 − 𝜈𝑥2 − 𝜈𝑦2 .
(4.8)
√
𝜆 −2 − 𝜈𝑥2 − 𝜈𝑦2 ) .
(4.9)
Die Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) ist also eine rotationssymmetrische komplexe Funktion der Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 . Ihr Betrag und ihre Phase sind in Abb. 4.15 skizziert. Für Ortsfrequenzen, für die 𝜈𝑥2 + 𝜈𝑦2 ≤ 𝜆 −2 gilt (d. h. Frequenzen innerhalb eines Kreises mit Radius 1∕𝜆), sind der Betrag |H(𝜈𝑥 , 𝜈𝑦 )| = 1 und die Phase arg{H(𝜈𝑥 , 𝜈𝑦 )} Funktionen von 𝜈𝑥 und 𝜈𝑦 . Eine harmonische Funktion mit derartigen Frequenzen erfährt daher bei ihrer Ausbreitung eine räumliche Phasenverschiebung, während sich ihr Betrag nicht ändert. Bei größeren Ortsfrequenzen, 𝜈𝑥2 + 𝜈𝑦2 > 𝜆 −2 , wird die Größe unter der Wurzel in Gl. (4.9) negativ, sodass der Exponent reell wird und die Übertragungsfunktion exp[−2π d (𝜈𝑥2 + 𝜈𝑦2 − 𝜆 −2 )1∕2 ] einen Dämpfungsfaktor beschreibt. Man bezeichnet eine derartige Welle als eva-
Nun wollen wir die Ausbreitung einer monochromatischen optischen Welle mit der Wellenlänge 𝜆 und der komplexen Amplitude 𝑈(𝑥, 𝑦, 𝑧) im Vakuum zwischen den Ebenen 𝑧 = 0 und 𝑧 = d untersuchen, die wir als Eingangs- und Ausgangsebene bezeichnen (siehe Abb. 4.14). Dabei wollen wir aus der komplexen Amplitude der Welle in der Eingangsebene, 𝑓(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, 0), ihre komplexe Amplitude in der Ausgangsebene bestimmen, 𝑔(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, d ). Wir betrachten 𝑓(𝑥, 𝑦) und 𝑔(𝑥, 𝑦) als Eingang bzw. Ausgang eines linearen Systems. Das System ist linear,
y
𝑘2 − 𝑘𝑥2 − 𝑘𝑦2 = 2π
Das Ausgangssignal ist 𝑔(𝑥, 𝑦) = 𝐴 exp[−i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 d )], sodass wir H(𝜈𝑥 , 𝜈𝑦 ) = 𝑔(𝑥, 𝑦)∕𝑓(𝑥, 𝑦) = exp(−i𝑘𝑧 d ) schreiben können; daraus folgt
4.1.2 Die Übertragungsfunktion des Vakuums
x
√
h
g
Abb. 4.14 Die Ausbreitung von Licht zwischen zwei Ebenen kann als lineares System betrachtet werden, dessen Eingangs- und Ausgangssignal die komplexen Amplituden der Welle in den beiden Ebenen sind.
85
86
4 Fourieroptik
| | 1 x harmonische Funktion
≈ λ2 2
1 νx
ebene Welle
λ–1
Abb. 4.15 Betrag und Phase der Übertragungsfunktion H (𝜈x , 𝜈y ) für die Ausbreitung im Vakuum zwischen zwei Ebenen im Abstand d .
νy
νx
1 νx
–arg{ }
verschobene harmonische Funktion
y
–2π /λ
λ–1
νy
νx
neszente Welle 2). Wenn 𝜈𝜌 = (𝜈𝑥2 + 𝜈𝑦2 )1∕2 etwas größer als 𝜆 −1 ist, d. h. 𝜈𝜌 ≈ 𝜆 −1 , wird der Dämpfungsfaktor exp[−2π d (𝜈𝜌2 − 𝜆 −2 )1∕2 ] = exp[−2π d (𝜈𝜌 − 𝜆 −1 )1∕2 (𝜈𝜌 + 𝜆 −1 )1∕2 ] ≈ exp[−2π d (𝜈𝜌 − 𝜆 −1 )1∕2 (2𝜆 −1 )1∕2 ]. Für (𝜈𝜌 −
| |
–arg{ }
1
1
𝜆 −1 ) ≈ 𝜆∕2d 2 oder (𝜈𝜌 − 1∕𝜆)∕(1∕𝜆) ≈ (𝜆∕d )2 ergibt das 2 exp(−2π). Für d ≫ 𝜆 nimmt der Dämpfungsfaktor plötzlich ab, sobald die Ortsfrequenz größer als 𝜆 −1 wird, wie Abb. 4.15 zeigt. Wir können 𝜆 −1 daher als eine Art Ortsfrequenz-Cutoff (die räumliche Bandbreite) des Systems betrachten. Also gilt: Die räumliche Bandbreite der Lichtausbreitung im Vakuum beträgt etwa 𝜆 −1 Perioden pro mm. Informationen, die in Ortsfrequenzen größer 𝜆 −1 enthalten sind (entsprechend Details, die kleiner als 𝜆 sind), können durch eine optische Welle der Wellenlänge 𝜆 nicht über Entfernungen wesentlich größer als 𝜆 übertragen werden. Die Fresnelnäherung
Der Ausdruck für die Übertragungsfunktion in Gl. (4.9) kann vereinfacht werden, wenn das Eingangssignal 𝑓(𝑥, 𝑦) nur Ortsfrequenzen enthält, die viel kleiner als die Cutofffrequenz 𝜆 −1 sind, sodass 𝜈𝑥2 + 𝜈𝑦2 ≪ 𝜆 −2 gilt. Die Komponenten des Lichts, die ebenen Wellen entsprechen, verlaufen dann in kleinen Winkeln 𝜃𝑥 ≈ 𝜆𝜈𝑥 und 𝜃𝑦 ≈ 𝜆𝜈𝑦 ; es handelt sich also um paraxiale Strahlen. Wenn wir 𝜃2 = 𝜃𝑥2 + 𝜃𝑦2 ≈ 𝜆 2 (𝜈𝑥2 + 𝜈𝑦2 ) schreiben, wobei 𝜃 der Winkel zur optischen Achse sein soll, dann wird der 2) Evaneszente Wellen breiten sich weder vorwärts noch rückwärts aus, sondern in der transversalen Ebene, in der sie entstehen. In Gl. (4.3) wurde das Minuszeichen vor der Quadratwurzel verwendet, da derartige Wellen sich in 𝑧-Richtung abschwächen müssen und nicht anwachsen können, so lange kein verstärkender Mechanismus vorhanden ist, der ein Anwachsen ermöglichen könnte.
λ–1
νy
νx
λ–1
νy
νx
Abb. 4.16 Die Übertragungsfunktion für die Ausbreitung im Vakuum für kleine Ortsfrequenzen (viel kleiner als 1∕𝜆 Perioden pro mm) besitzt einen konstanten Betrag und eine quadratische Phase.
Phasenfaktor aus Gl. (4.9) 2π d
√ d√ 𝜆 −2 − 𝜈𝑥2 − 𝜈𝑦2 = 2π 1 − 𝜃2 𝜆 d 𝜃2 𝜃4 + − ⋯) . = 2π (1 − 2 8 𝜆 (4.10)
Nun vernachlässigen wir den dritten und alle höheren Terme dieser Entwicklung und erhalten so für Gl. (4.9) [ ( )] H(𝜈𝑥 , 𝜈𝑦 ) ≈ H0 exp iπ𝜆 d 𝜈𝑥2 + 𝜈𝑦2 , (4.11) wobei H0 = exp(−i𝑘d ) ist. In dieser Näherung ist die Phase eine quadratische Funktion von 𝜈𝑥 und 𝜈𝑦 , wie auch Abb. 4.16 zeigt. Diese Näherung wird als Fresnelnäherung bezeichnet. Damit die Fresnelnäherung gilt, muss der dritte Term in Gl. (4.10) für alle 𝜃 viel kleiner als π sein. Diese Bedingung ist äquivalent zu 𝜃4 d ≪1. 4𝜆
(4.12)
Wenn 𝑎 der größte radiale Abstand in der Ausgangsebene ist, gilt für den größten Winkel 𝜃max ≈ 𝑎∕d ,
4.1 Lichtausbreitung im Vakuum
4.1.3 Die Impulsantwortfunktion des Vakuums
a
θm
z
Abb. 4.17 Fresnelnäherung und Fresnelzahl.
und Gl. (4.12) kann in der Form [siehe Gl. (2.22) und Abb. 4.17] 𝑁F
2 𝜃max ≪1, 4
(4.13)
𝑎 (4.14) 𝜆d geschrieben werden, wobei 𝑁F als Fresnelzahl bezeichnet wird. Beispielsweise erhalten wir für 𝑎 = 1 cm, d = 100 cm, und 𝜆 = 0.5 μm durch Einsetzen 𝜃max = 10−2 rad, 𝑁F = 200 und 𝑁F 𝜃2 ∕4 = 5 × 10−3 . In diesem Fall ist die Fresnelnäherung anwendbar. 𝑁F =
2
Die Impulsantwortfunktion ℎ(𝑥, 𝑦) der Lichtausbreitung im Vakuum ist die Antwortfunktion 𝑔(𝑥, 𝑦) des Systems, wenn das Eingangssignal 𝑓(𝑥, 𝑦) ein Punkt im Ursprung ist (0, 0). Sie ist die inverse Fouriertransformierte der Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ). Mithilfe der Ergebnisse aus Abschnitt A.3 und Tabelle A.1 aus Anhang A erhalten wir mit 𝑘 = 2π∕𝜆 für die inverse Fouriertransformierte von Gl. (4.11) ℎ(𝑥, 𝑦) ≈ ℎ0 exp [−i𝑘
Wenn das Eingangssignal 𝑓(𝑥, 𝑦) bekannt ist, kann das Ausgangssignal 𝑔(𝑥, 𝑦) wie folgt bestimmt werden. Zuerst bestimmen wir die Fouriertransformierte ∞
[ ] 𝐹(𝜈𝑥 , 𝜈𝑦 ) = ∬ 𝑓(𝑥, 𝑦) exp i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦) d𝑥 d𝑦 , −∞
(4.15) die die komplexen Einhüllenden der Komponenten des Eingangssignals beschreibt, die ebenen Wellen entsprechen. Danach berechnen wir das Produkt H(𝜈𝑥 , 𝜈𝑦 ) 𝐹(𝜈𝑥 , 𝜈𝑦 ); es beschreibt die komplexen Einhüllenden der Komponenten des Ausgangssignals, die ebenfalls ebene Wellen sind. Schließlich berechnen wir die komplexe Amplitude in der Ausgangsebene als Summe der Beiträge dieser ebenen Wellen, ∞
wobei wir ℎ0 = (i∕𝜆 d ) exp(−i𝑘d ) gesetzt haben. Diese Funktion ist proportional zu der komplexen Amplitude einer Parabolwelle um den Ursprung (0, 0) in der Ebene 𝑧 = d [siehe Gl. (2.21)]. Folglich erzeugt jeder Punkt in der Eingangsebene eine Parabolwelle; in der Ausgangsebene überlagern sich alle derartigen Wellen.
Ein alternatives Verfahren, die komplexen Amplituden 𝑓(𝑥, 𝑦) und 𝑔(𝑥, 𝑦) zueinander in Beziehung zu setzen, besteht darin, 𝑓(𝑥, 𝑦) als Superposition verschiedener Punkte (Deltafunktionen) aufzufassen, von denen jeder die Quelle einer Parabolwelle ist. Eine von einem Punkt (𝑥′ , 𝑦 ′ ) entspringende Welle besitzt eine Amplitude 𝑓(𝑥′ , 𝑦 ′ ), die an dem Punkt (𝑥′, 𝑦 ′ ) zentriert ist, sodass sie an dem Punkt (𝑥, 𝑦) in der Ausgangsebene eine Welle mit der Amplitude 𝑓(𝑥′ , 𝑦 ′ )ℎ(𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ ) erzeugt. Die Summe aller derartigen Beiträge ist die zweidimensionale Faltung ∞
𝑔(𝑥, 𝑦) = ∬ 𝑓(𝑥′ , 𝑦 ′ )ℎ(𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ ) d𝑥′ d𝑦 ′ , (4.19) −∞
die in der Fresnelnäherung zu ∞
𝑔(𝑥, 𝑦) = ℎ0 ∬ 𝑓(𝑥′ , 𝑦 ′ ) −∞
𝑔(𝑥, 𝑦) = ∬ H(𝜈𝑥 , 𝜈𝑦 )𝐹(𝜈𝑥 , 𝜈𝑦 )
× exp [−iπ
−∞
(4.16)
Mithilfe der Fresnelnäherung für H(𝜈𝑥 , 𝜈𝑦 ) [Gl. (4.11)] erhalten wir ∞
[ ( )] 𝑔(𝑥, 𝑦) = H0 ∬ 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp iπ𝜆 d 𝜈𝑥2 + 𝜈𝑦2 −∞
[ ] × exp −i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦) d𝜈𝑥 d𝜈𝑦 .
(4.18)
Lichtausbreitung im Vakuum als Faltung
Der Zusammenhang zwischen Eingangsund Ausgangssignal
× exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] d𝜈𝑥 d𝜈𝑦 .
𝑥2 + 𝑦 2 ], 2d
(4.17)
Die Gln. (4.17) und (4.15) verknüpfen das Ausgangssignal 𝑔(𝑥, 𝑦) mit dem Eingangssignal 𝑓(𝑥, 𝑦).
(𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ] d𝑥′ d𝑦 ′ 𝜆d (4.20)
mit ℎ0 = (i∕𝜆 d ) exp(−i𝑘d ) wird. Zusammengefasst bedeutet das, dass es im Rahmen der Fresnelnäherung zwei Wege gibt, die komplexe Amplitude 𝑔(𝑥, 𝑦) in der Ausgangsebene aus der komplexen Amplitude 𝑓(𝑥, 𝑦) in der Eingangsebene zu erhalten: 1) Gleichung (4.20) beruht auf einem Ansatz, bei dem das Eingangssignal im normalen Raum in parabolische Anteile zerlegt wird;
87
88
4 Fourieroptik
2) Gleichung (4.17) beruht auf einem Ansatz, bei dem das Eingangssignal im Frequenzraum in eine Summe von ebenen Wellen zerlegt wird. Übung 4-2: Ein neuer Blick auf Gaußstrahlen
Die Funktion 𝑓(𝑥, 𝑦) = 𝐴 exp[−(𝑥2 + 𝑦 2 )∕𝑊02 ] soll die komplexe Amplitude einer optischen Welle 𝑈(𝑥, 𝑦, 𝑧) in der Ebene 𝑧 = 0 beschreiben. Zeigen Sie, dass 𝑈(𝑥, 𝑦, 𝑧) der in Kapitel 3 [Gl. (3.7)] diskutierte Gaußstrahl ist. Arbeiten Sie dazu einmal im normalen Raum und einmal im Frequenzraum.
4.1.4 Huygens-Fresnel-Prinzip Das Huygens-Fresnel-Prinzip besagt, dass jeder Punkt einer Wellenfront Ausgangspunkt einer Kugelwelle ist (Abb. 4.18). Die Einhüllende dieser Sekundärwellen ist eine neue Wellenfront. Ihre Überlagerung bildet die Welle in einer anderen Ebene. Die Impulsantwortfunktion des Systems für die Ausbreitung zwischen den Ebenen 𝑧 = 0 und 𝑧 = d ist dann √ 1 ℎ(𝑥, 𝑦) ∝ exp(−i𝑘𝑟) , 𝑟 = 𝑥2 + 𝑦 2 + d 2 . (4.21) 𝑟 In der paraxialen Näherung wird die Kugelwelle aus Gl. (4.21) näherungsweise durch die Parabolwelle aus Gl. (4.18) beschrieben (siehe Abschnitt 2.2.2). Unsere Herleitung der Impulsantwortfunktion steht daher mit dem Huygens-Fresnel-Prinzip im Einklang. x
Kugelwelle
0 y
z
Welle
nfron
t
Wellen
front
Abb. 4.18 Das Huygens-Fresnel-Prinzip. Jeder Punkt in einer Wellenfront ist Ausgangspunkt einer Kugelwelle.
4.2 Die optische Fouriertransformation Wie wir in Abschnitt 4.1 gesehen hatten, kann die Ausbreitung von Licht im Vakuum sehr bequem durch eine Fourieranalyse beschrieben werden. Wenn die komplexe Amplitude einer monochromatischen Welle der Wellenlänge 𝜆 in der Ebene 𝑧 = 0 eine Funktion 𝑓(𝑥, 𝑦) ist, die aus harmonischen Anteilen mit unterschiedlichen Ortsfrequenzen zusammengesetzt ist, dann entspricht jeder dieser Anteile einer ebenen Welle: Die ebe-
−1
ne Welle, die sich unter den Winkeln 𝜃𝑥 = sin 𝜆𝜈𝑥 −1 und 𝜃𝑦 = sin 𝜆𝜈𝑦 ausbreitet, entspricht dem Anteil mit den Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 und besitzt die Amplitude 𝐹(𝜈𝑥 , 𝜈𝑦 ), die gleich der Fouriertransformierten von 𝑓(𝑥, 𝑦) ist. Daraus können wir schließen, dass es möglich sein sollte, die Fouriertransformierte einer zweidimensionalen Funktion 𝑓(𝑥, 𝑦) rein optisch zu berechnen, indem man einfach eine transparente Folie mit der Amplitudentransmission 𝑓(𝑥, 𝑦) erzeugt und diese mit einer ebenen Welle bestrahlt. Da jede dieser ebenen Wellen unendlich ausgedehnt ist und folglich mit den anderen ebenen Wellen überlappt, müssen wir jedoch einen Weg finden, diese einzelnen Wellen zu trennen. Wir werden zeigen, dass in hinreichend großen Entfernungen nur noch eine einzige ebene Welle zur Gesamtamplitude in der Ausgangsebene beiträgt, dass sich die Fourierkomponenten also auf natürliche Weise trennen. Praktischer ist es jedoch, jede der ebenen Wellen mithilfe einer Linse auf einen einzelnen Punkt zu fokussieren, wie im Folgenden beschrieben werden soll.
4.2.1
Fouriertransformation im Fernfeld
Wir wollen zunächst zeigen, dass für hinreichend große Entfernungen d nur noch eine einzige ebene Welle zur komplexen Amplitude an einem Punkt (𝑥, 𝑦) in der Ausgangsebene beiträgt, und zwar nur diejenige, die sich unter den Winkeln 𝜃𝑥 ≈ 𝑥∕d und 𝜃𝑦 ≈ 𝑦∕d zur optischen Achse ausbreitet (siehe Abb. 4.19). Der Wellenvektor dieser Welle hat die Komponenten 𝑘𝑥 ≈ (𝑥∕d )𝑘 und 𝑘𝑦 ≈ (𝑦∕d )𝑘, und ihre Amplitude ist 𝐹(𝜈𝑥 , 𝜈𝑦 ) mit 𝜈𝑥 = 𝑥∕𝜆 d und 𝜈𝑦 = 𝑥∕𝜆𝑑. Die komplexen Amplituden 𝑔(𝑥, 𝑦) und 𝑓(𝑥, 𝑦) der Welle in den Ebenen 𝑧 = d und 𝑧 = 0 sind gemäß 𝑔(𝑥, 𝑦) ≈ ℎ0 𝐹 (
𝑦 𝑥 , ) 𝜆d 𝜆d
(4.22)
verknüpft, wobei 𝐹(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑓(𝑥, 𝑦) ist und ℎ0 = (i∕𝜆 d ) exp(−i𝑘d ) gilt. Die Beiträge aller anderen Wellen löschen sich durch destruktive Interferenz gegenseitig aus. Diese Näherung ist als Fraunhofernäherung bekannt. Wie wir in dem folgenden Beweis sehen werden, gilt die Fraunhofernäherung für 𝑁F ≪ 1 und 𝑁F′ ≪ 1
(4.23)
mit 𝑁F = 𝑎2 ∕𝜆 d und 𝑁F′ = 𝑏2 ∕𝜆 d , also nur für kleine Fresnelzahlen 𝑁F und 𝑁F′ . Die Fraunhoferbedingung ist schwieriger zu erfüllen als die Fresnelbedingung, die 2 𝑁F 𝜃m ∕4 ≪ 1 verlangt [siehe Gl. (4.13)]. Da in der paraxialen Näherung 𝜃m ≪ 1 gilt, kann die Fresnelbedin-
4.2 Die optische Fouriertransformation
x b
y
θx
0
a
θy
f(x,y)
(x,y)
z g(x,y)
Abb. 4.19 Für hinreichend große Abstände d ist die komplexe Amplitude am Punkt (x, y ) in der Ebene z = d proportional zur komplexen Amplitude der ebenen Welle mit den Winkeln 𝜃x ≈ x∕d ≈ 𝜆𝜈x und 𝜃y ≈ y ∕d ≈ 𝜆𝜈y zur optischen Achse, d. h. zu der Fouriertransformierten F (𝜈x , 𝜈y ) von f (x, y ), wobei 𝜈x = x∕𝜆d und 𝜈y = y ∕𝜆d ist. 2 gung 𝑁F 𝜃m ∕4 ≪ 1 auch für Fresnelzahlen 𝑁F erfüllt sein, für die 𝑁F ≪ 1 nicht gilt.
Beweis: Ausbreitung im Vakuum in der Fraunhofernäherung als Fouriertransformation. Zum Beweis des beschriebenen Zusammenhangs beginnen wir mit der Beziehung zwischen 𝑔(𝑥, 𝑦) und 𝑓(𝑥, 𝑦) aus Gl. (4.20). Die Phase im Argument des Exponenten ist (π∕𝜆 d )[(𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ] = (π∕𝜆 d )[(𝑥2 + 𝑦 2 ) + (𝑥′2 + 𝑦 ′2 ) − 2(𝑥𝑥′ + 𝑦𝑦 ′ )]. Wenn 𝑓(𝑥, 𝑦) auf eine kleine Fläche mit Radius 𝑏 begrenzt und der Abstand d hinreichend groß ist, sodass die Fresnelzahl 𝑁F′ = 𝑏2 ∕𝜆 d klein wird, ist der Phasenfaktor (π∕𝜆 d )(𝑥′2 + 𝑦 ′2 ) ≤ π(𝑏2 ∕𝜆 d ) vernachlässigbar, und Gl. (4.20) kann näherungsweise als 𝑔(𝑥, 𝑦) = ℎ0 exp (−iπ
𝑥2 + 𝑦 2 ) 𝜆d
∞
× ∬ 𝑓(𝑥′ , 𝑦 ′ ) exp (i2π −∞
𝑥𝑥′ + 𝑦𝑦 ′ ) d𝑥′ d𝑦 ′ 𝜆d (4.24)
geschrieben werden. Die Faktoren 𝑥∕𝜆 d und 𝑦∕𝜆 d können als die Frequenzen 𝜈𝑥 = 𝑥∕𝜆 d und 𝜈𝑦 = 𝑦∕𝜆 d aufgefasst werden, sodass 𝑥2 + 𝑦 2 𝑦 𝑥 𝑔(𝑥, 𝑦) = ℎ0 exp (−iπ ) )𝐹( , 𝜆d 𝜆d 𝜆d
(4.25)
folgt, wobei 𝐹(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑓(𝑥, 𝑦) ist. Der Phasenfaktor exp[−iπ(𝑥2 + 𝑦 2 )∕𝜆 d ] in Gl. (4.25) kann ebenfalls vernachlässigt werden, sodass wir Gl. (4.22) erhalten, wenn wir gleichzeitig unser Interesse auf Punkte innerhalb eines Kreises mit Radius 𝑎 um die 𝑧-Achse in der Ausgangsebene beschränken, sodass π(𝑥2 + 𝑦 2 )∕𝜆 d ≤ π𝑎2 ∕𝜆 d ≪ π gilt. Diese Näherung ist erlaubt, sofern für die Fresnelzahl 𝑁F = 𝑎2 ∕𝜆 d ≪ 1 gilt.
Ein anderer Beweis beruht auf Gl. (4.17), die die komplexe Amplitude 𝑔(𝑥, 𝑦) als Integral über ebene Wellen mit unterschiedlichen Frequenzen schreibt. Wenn d hinreichend groß ist, sodass die Phase im Integranden viel größer wird als 2π, kann man mithilfe der Methode der stationären Phase 3) zeigen, dass nur ein Wert von 𝜈𝑥 zu dem Integral beiträgt. Es ist der Wert, für den die Ableitung der Phase π𝜆 d 𝜈𝑥2 − 2π 𝜈𝑥 𝑥 nach 𝜈𝑥 verschwindet, also 𝜈𝑥 = 𝑥∕𝜆 d . Entsprechend trägt auch für 𝜈𝑦 nur der Wert 𝜈𝑦 = 𝑦∕𝜆 d zu dem Integral bei. Damit ist die Annahme bewiesen, dass nur eine einzige ebene Welle zum Fernfeld an einem gegebenen Punkt beiträgt. Übung 4-3: Die Gültigkeit von Fresnel- und Fraunhofernäherung: Ein Vergleich
Zeigen Sie, dass die Fraunhofernäherung eine größere Einschränkung bedeutet als die Fresnelnäherung. Setzen Sie dazu 𝜆 = 0.5 μm und nehmen Sie an, dass die Gegenstandspunkte innerhalb einer kreisförmigen Blende mit einem Radius 𝑏 = 1 cm und die Bildpunkte innerhalb einer kreisförmigen Blende mit Radius 𝑎 = 2 cm liegen. Geben Sie die Abstände d zwischen Gegenstands- und Bildebene an, für den die jeweilige Näherung gilt.
Zusammenfassung
In der Fraunhofernäherung ist die komplexe Amplitude 𝑔(𝑥, 𝑦) einer Welle der Wellenlänge 𝜆 in der Ebene 𝑧 = d proportional zu der Fouriertransformierten 𝐹(𝜈𝑥 , 𝜈𝑦 ) der komplexen Amplitude 𝑓(𝑥, 𝑦) in der Ebene 𝑧 = 0, berechnet für die Ortsfrequenzen 𝜈𝑥 = 𝑥∕𝜆 d und 𝜈𝑦 = 𝑦∕𝜆 d . Die Näherung ist erlaubt, sofern 𝑓(𝑥, 𝑦) in der Eingangsebene auf einen Kreis mit Radius 𝑏 mit 𝑏2 ∕𝜆 d ≪ 1 und in der Ausgangsebene auf Punkte in einem Kreis mit Radius 𝑎 mit 𝑎2 ∕𝜆 d ≪ 1 begrenzt ist.
4.2.2 Fouriertransformation mithilfe einer Linse Die ebenen Wellen, aus denen sich eine Welle zusammensetzt, können auch mithilfe einer Linse getrennt werden. Eine dünne sphärische Linse überführt eine ebene Welle in eine Parabolwelle, die auf einen Punkt in der Brennebene der Linse fokussiert ist (siehe Abschnitt 2.4 und Übung 2-5). Wenn die ebene Welle in kleinen Winkeln 𝜃𝑥 und 𝜃𝑦 zur optischen Achse auf der Linse auftrifft, ist der Ursprung der Parabolwelle der Punkt (𝜃𝑥 𝑓, 𝜃𝑦 𝑓), wobei 𝑓 die Brennweite der Linse ist 3) Siehe z. B. M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002, Anhang III.
89
90
4 Fourieroptik
wobei wir ℎ𝑙 = H0 ℎ0 = (i∕𝜆𝑓) exp[−i𝑘(d + 𝑓)] gesetzt haben. Die Proportionalitätskonstante in Gl. (4.26) enthält folglich einen Phasenfaktor, der eine quadratische Funktion von 𝑥 und 𝑦 ist. Wegen |ℎ𝑙 | = 1∕𝜆𝑓 folgt aus Gl. (4.27), dass die optische Intensität in der Ausgangsebene gleich
x = θx f
z θx
Brennebene
f
Abb. 4.20 Fokussierung einer ebenen Welle auf einen Punkt. Die Richtung (𝜃x , 𝜃y ) wird auf einen Punkt (x, y ) = (𝜃x f , 𝜃y f ) abgebildet (siehe Übung 2-5).
(siehe Abb. 4.20). Die Linse bildet folglich jede Richtung (𝜃𝑥 , 𝜃𝑦 ) auf einen Punkt (𝜃𝑥 𝑓, 𝜃𝑦 𝑓) in der Brennebene ab und trennt so die Beiträge der verschiedenen ebenen Wellen. In dem in Abb. 4.21 gezeigten optischen System soll 𝑓(𝑥, 𝑦) die komplexe Amplitude der optischen Welle in der Ebene 𝑧 = 0 sein. Das Licht wird in ebene Wellen zerlegt, wobei die Welle unter den (kleinen) Winkeln 𝜃𝑥 = 𝜆𝜈𝑥 und 𝜃𝑦 = 𝜆𝜈𝑦 zur optischen Achse eine komplexe Amplitude proportional zu der Fouriertransformierten 𝐹(𝜈𝑥 , 𝜈𝑦 ) besitzt. Diese Welle wird durch die Linse auf einen Punkt (𝑥, 𝑦) in der Brennebene abgebildet, wobei 𝑥 = 𝜃𝑥 𝑓 = 𝜆𝑓𝜈𝑥 und 𝑦 = 𝜃𝑦 𝑓 = 𝜆𝑓𝜈𝑦 ist. Die komplexe Amplitude am Punkt (𝑥, 𝑦) in der Ausgangsebene ist daher proportional zu der Fouriertransformierten von 𝑓(𝑥, 𝑦) bei 𝜈𝑥 = 𝑥∕𝜆𝑓 und 𝜈𝑦 = 𝑦∕𝜆𝑓, sodass wir erhalten 𝑥 𝑦 𝑔(𝑥, 𝑦) ∝ 𝐹 ( , ). (4.26) 𝜆𝑓 𝜆𝑓 Um die Proportionalitätskonstante in Gl. (4.26) zu bestimmen, zerlegen wir das Eingangssignal 𝑓(𝑥, 𝑦) in seine Fourierkomponenten und verfolgen die diesen Komponenten entsprechenden ebenen Wellen durch das optische System. Schließlich überlagern wir die Beiträge dieser Wellen in der Ausgangsebene, um 𝑔(𝑥, 𝑦) zu konstruieren. Unter der Annahme, dass alle diese Wellen paraxial sind, erhalten wir mithilfe der Fresnelnäherung (𝑥2 + 𝑦 2 )(d − 𝑓) 𝑦 𝑥 𝑔(𝑥, 𝑦) = ℎ𝑙 exp [iπ , ), ]𝐹( 𝜆𝑓 2 𝜆𝑓 𝜆𝑓 (4.27) x
𝑔(𝑥, 𝑦) = ℎ𝑙 𝐹 (
f
(4.29)
g(x,y) x = θx f
z Brennebene
θx
f
f
Abb. 4.22 Das 2f -System. Die Fourierkomponente von f (x, y ) mit den Ortsfrequenzen 𝜈x und 𝜈y erzeugt eine ebene Welle unter den Winkeln 𝜃x = 𝜆𝜈x und 𝜃y = 𝜆𝜈y ; sie wird von der Linse auf den Punkt (x, y ) = (f 𝜃x , f 𝜃y ) = (𝜆f 𝜈x , 𝜆f 𝜈y ) fokussiert, sodass g(x, y ) proportional zu der Fouriertransformierten F (x∕𝜆f , y ∕𝜆f ) ist.
Beweis: Abbildung durch eine Linse in der Fresnelnäherung als Fouriertransformation. Der Beweis des beschriebenen Zusammenhangs erfolgt in vier Schritten:
Brennebene
Δ
(4.28)
𝑦 𝑥 , ) 𝜆𝑓 𝜆𝑓
x f (x,y)
z
z=0
|| |2 ||𝐹 ( 𝑥 , 𝑦 )||| || 𝜆𝑓 𝜆𝑓 || | |
mit ℎ𝑙 = (i∕𝜆𝑓) exp(−i2𝑘𝑓). In dieser Anordnung, die als 2f -System bezeichnet wird (siehe Abb. 4.22), sind sowohl der Betrag als auch die Phase der komplexen Amplituden in den beiden Brennebenen der Linse durch eine Fouriertransformation gegeben.
(x,y) = (θx f, θy f )
y
1 (𝜆𝑓)2
ist. Die Lichtintensität in der Ausgangsebene (der hinteren Brennebene der Linse) ist also proportional zum Betragsquadrat der Fouriertransformierten der komplexen Amplitude der Welle in der Eingangsebene, unabhängig vom Abstand d zwischen den beiden Ebenen. Der Phasenfaktor in Gl. (4.27) verschwindet für d = 𝑓; daher gilt
g(x,y)
(θx , θy)
f (x,y)
𝐼(𝑥, 𝑦) =
Abb. 4.21 Fokussierung der ebenen Wellen (der harmonischen Fourierkomponenten) des Eingangssignals f (x, y ) auf Punkte in der Brennebene der Linse. Die Amplitude der ebenen Welle mit der Richtung (𝜃x , 𝜃y ) = (𝜆𝜈x , 𝜆𝜈y ) ist proportional zur Fouriertransformierten F (𝜈x , 𝜈y ) und wird auf den Punkt (x, y ) = (𝜃x f , 𝜃y f ) = (𝜆f 𝜈x , 𝜆f 𝜈y ) fokussiert.
4.3 Lichtbeugung
1) Die ebene Welle mit den Winkeln 𝜃𝑥 = 𝜆𝜈𝑥 und 𝜃𝑦 = 𝜆𝜈𝑦 hat in der Ebene 𝑧 = 0 die komplexe Amplitude 𝑈(𝑥, 𝑦, 0) = 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] und in der Ebene 𝑧 = d direkt vor dem Eintritt in die Linse 𝑈(𝑥, 𝑦, d ) = H(𝜈𝑥 , 𝜈𝑦 )𝐹(𝜈𝑥 , 𝜈𝑦 ) exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)]. Dabei ist H(𝜈𝑥 , 𝜈𝑦 ) = H0 exp[iπ𝜆 d (𝜈𝑥2 + 𝜈𝑦2 )] die Übertragungsfunktion einer Strecke d im Vakuum und H0 = exp(−i𝑘d ). 2) Beim Durchgang durch die Linse wird die komplexe Amplitude mit dem Phasenfaktor exp[iπ(𝑥2 + 𝑦 2 )∕𝜆𝑓] der Linse multipliziert [den Phasenfaktor exp(−i𝑘𝛥), wenn 𝛥 die Dicke der Linse ist, haben wir dabei ignoriert]. Also ist ( )] 𝑥 +𝑦 𝑈(𝑥, 𝑦, d + 𝛥) = H0 exp (iπ ) exp iπ𝜆 d 𝜈𝑥2 + 𝜈𝑦2 𝜆𝑓 [ ] × 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp −i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦) . (4.30) 2
2
[
Diesen Ausdruck können wir vereinfachen, indem wir −2𝜈𝑥 𝑥 + 𝑥2 ∕𝜆𝑓 = (𝑥2 − 2𝜈𝑥 𝜆𝑓𝑥)∕𝜆𝑓 = [(𝑥 − 𝑥0 )2 − 𝑥02 ]∕𝜆𝑓 schreiben, wobei 𝑥0 = 𝜆𝜈𝑥 𝑓 ist; eine ähnliche Beziehung für 𝑦 existiert mit 𝑦0 = 𝜆𝜈𝑦 𝑓; so erhalten wir 𝑈(𝑥, 𝑦, d + 𝛥) = 𝐴(𝜈𝑥 , 𝜈𝑦 ) exp [iπ
(𝑥 − 𝑥0 )2 + (𝑦 − 𝑦0 )2 ] 𝜆𝑓 (4.31)
mit [ ( )] 𝐴(𝜈𝑥 , 𝜈𝑦 ) = H0 exp iπ𝜆(d − 𝑓) 𝜈𝑥2 + 𝜈𝑦2 𝐹(𝜈𝑥 , 𝜈𝑦 ) . (4.32) Gleichung (4.31) beschreibt die komplexe Amplitude einer Parabolwelle, die auf den Punkt (𝑥0 , 𝑦0 ) in der Brennebene 𝑧 = d + 𝛥 + 𝑓 der Linse konvergiert. 3) Nun untersuchen wir die Ausbreitung im Vakuum zwischen der Linse und der Ausgangsebene, um 𝑈(𝑥, 𝑦, d + 𝛥 + 𝑓) zu bestimmen. Dazu wenden wir Gl. (4.20) auf Gl. (4.31) an, verwenden die Beziehung ∫ exp[i2π(𝑥 − 𝑥0 )𝑥′ ∕𝜆𝑓] d𝑥′ = 𝜆𝑓𝛿(𝑥 − 𝑥0 ) und erhalten so 𝑈(𝑥, 𝑦, d + 𝛥 + 𝑓) = ℎ0 (𝜆𝑓)2 𝐴(𝜈𝑥 , 𝜈𝑦 )𝛿(𝑥 − 𝑥0 )𝛿(𝑦 − 𝑦0 ) (4.33) mit ℎ0 = (i∕𝜆𝑓) exp(−i𝑘𝑓). Also wird die ebene Welle tatsächlich auf einen einzigen Punkt bei 𝑥0 = 𝜆𝜈𝑥 𝑓 und 𝑦0 = 𝜆𝜈𝑦 𝑓 fokussiert. 4) Schließlich integrieren wir über alle ebenen Wellen (alle 𝜈𝑥 und 𝜈𝑦 ). Wegen der Siebeigenschaft der Deltafunktion, 𝛿(𝑥 − 𝑥0 ) = 𝛿(𝑥 − 𝜆𝑓𝜈𝑥 ) = (1∕𝜆𝑓)𝛿(𝜈𝑥 − 𝑥∕𝜆𝑓), ergibt dieses Integral 𝑔(𝑥, 𝑦) = ℎ0 𝐴(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓). Wenn wir nun noch Gl. (4.32) einsetzen, gelangen wir zu Gl. (4.27).
Zusammenfassung
Die komplexe Amplitude von Licht an einem Punkt (𝑥, 𝑦) in der hinteren Brennebene einer Linse der Brennweite 𝑓 ist proportional zu der Fouriertransformierten ihrer komplexen Amplituden in der vorderen Brennebene für die Ortsfrequenzen 𝜈𝑥 = 𝑥∕𝜆𝑓 und 𝜈𝑦 ∕𝜆𝑓. Diese Beziehung gilt in der Fresnelnäherung. Ohne Linse ergibt sich die Fouriertransformation nur in der restriktiveren Fraunhofernäherung.
Übung 4-4: Die inverse Fouriertransformation
In dem einlinsigen optischen System in Abb. 4.22 ist die Feldverteilung in der vorderen Brennebene (𝑧 = 2𝑓) eine skalierte Version der Fouriertransformierten der Feldverteilung in den hinteren Brennebene (𝑧 = 0). Verifizieren Sie, dass nach einer Invertierung des Koordinatensystems in der vorderen Brennebene, also der Transformation (𝑥, 𝑦) → (−𝑥, −𝑦), die resultierende Feldverteilung die inverse Fouriertransformierte liefert.
4.3 Lichtbeugung Wenn eine optische Welle durch eine Öffnung in einem lichtundurchlässigen Schirm hindurchtritt und sich danach im Vakuum ausbreitet, bezeichnet man ihre Intensitätsverteilung als Beugungsmuster. Wenn sich das Licht wie ein einfacher Strahl verhalten würde, wäre das Beugungsmuster ein Schatten der Öffnung. Aufgrund der Wellennatur des Lichts kann sich das Beugungsmuster jedoch mehr oder weniger von einem einfachen Schattenbild unterscheiden, je nach der Entfernung zwischen der Öffnung und der Beobachtungsebene, der Wellenlänge und den Abmessungen der Öffnung. Ein Beispiel ist in Abb. 4.23 gezeigt. Es ist nicht einfach, genau anzugeben, wie der Schirm die einfallende Welle verändert, aber die Ausbreitung im Vakuum hinter der Blende wird stets durch die zuvor in diesem Kapitel beschriebenen Gesetze bestimmt. Die einfachste Theorie der Beugung beruht auf der Annahme, dass die einfallende Welle an allen Punkten im Inneren der Öffnung ohne Veränderung durchgelassen wird, während ihre Intensität an allen Punkten hinter dem lichtundurchlässigen Teil des Schirms auf null reduziert wird. Wenn 𝑈(𝑥, 𝑦) und 𝑓(𝑥, 𝑦) die komplexen Amplituden der Welle unmittelbar links bzw. rechts des Schirms sind (Abb. 4.24), dann gilt im Einklang mit dieser Annahme 𝑓(𝑥, 𝑦) = 𝑈(𝑥, 𝑦)𝑝(𝑥, 𝑦) ,
(4.34)
91
92
4 Fourieroptik
chen sollte. Eine Theorie der Beugung auf der Grundlage einer exakten Lösung der Helmholtzgleichung unter den durch die Blende gegebenen Randbedingungen ist mathematisch schwierig. Bisher wurden nur für wenige geometrische Strukturen Lösungen gefunden. Es gibt jedoch eine Reihe von Theorien der Beugung, die mithilfe unterschiedlicher Annahmen zu Ergebnissen mit verschiedenen Graden an Genauigkeit gelangen. Eine formal strenge Theorie der Beugung übersteigt den Rahmen dieses Buchs.
4.3.1 Abb. 4.23 Ein Beugungsmuster von Sägezähnen. (Aus M. Cagnet, M. Françon, J. C. Thrierr, Atlas of Optical Phenomena, Springer 1962.) x U(x,y)
Beobachtungsebene
f(x,y) y Blendenebene
g(x,y) z
Abb. 4.24 Beim Durchgang durch eine Öffnung mit der Amplitudentransmission p(x, y ) erzeugt eine Welle U(x, y ) eine Welle mit der komplexen Amplitude f (x, y ) = U(x, y )p(x, y ). Nach einer Strecke d im Vakuum ist die komplexe Amplitude g(x, y ) und das Beugungsmuster ist gleich der Intensität I(x, y ) = |g(x, y )|2 .
Fraunhoferbeugung
Fraunhoferbeugung ist die Theorie des Durchgangs von Licht durch Öffnungen unter der Annahme, dass die einfallende Welle mit der Blendenfunktion multipliziert wird und für die Lichtausbreitung hinter der Blende die Fraunhofernäherung gilt. Die Fraunhofernäherung ist dann zulässig, wenn der Abstand d zwischen der Blende und der Beobachtungsebene so groß ist, dass für die Fresnelzahl 𝑁F′ = 𝑏2 ∕𝜆 d ≪ 1 gilt, wenn 𝑏 der größte radiale Abstand innerhalb der Blendenöffnung ist. Wenn wir annehmen, dass die einfallende Welle eine ebene Welle der Intensität 𝐼e ist, √ die sich in 𝑧-Rich𝐼e gilt, dann ist tung ausbreitet, sodass 𝑈(𝑥, 𝑦) = √ 𝑓(𝑥, 𝑦) = 𝐼e 𝑝(𝑥, 𝑦). In der Fraunhofernäherung [siehe Gl. (4.22)] ist dann 𝑔(𝑥, 𝑦) ≈
√
𝐼e ℎ0 𝑃 (
𝑥 𝑦 , ), 𝜆d 𝜆d
(4.36)
wobei
wobei
∞
𝑝(𝑥, 𝑦) = {
1 innerhalb der Öffnung 0 neben der Öffnung
(4.35)
als Blendenfunktion bezeichnet wird. Wenn 𝑓(𝑥, 𝑦) bekannt ist, kann die komplexe Amplitude 𝑔(𝑥, 𝑦) in einer Beobachtungsebene in einer Entfernung d von der Blende durch die in den Abschnitten 4.1 und 4.2 beschriebenen Methoden bestimmt werden. Das Beugungsmuster 𝐼(𝑥, 𝑦) = |𝑔(𝑥, 𝑦)|2 wird als Fraunhoferbeugung oder Fresnelbeugung bezeichnet, je nachdem ob die Ausbreitung im Vakuum mithilfe der Fraunhofer- oder der Fresnelnäherung beschrieben wird. Obwohl dieser Ansatz in den meisten Fällen zufriedenstellende Ergebnisse liefert, ist er nicht exakt. Gültigkeit und Konsistenz der Annahme, dass die komplexe Amplitude 𝑓(𝑥, 𝑦) an Punkten hinter dem lichtundurchlässigen Teil des Schirms verschwindet, sind durchaus fraglich, da eine durchgelassene Welle sich in alle Richtungen ausbreitet und daher auch diese Punkte errei-
[ ( )] 𝑃(𝜈𝑥 , 𝜈𝑦 ) = ∬ 𝑝(𝑥, 𝑦) exp i2π 𝜈𝑥 𝑥 + 𝜈𝑦 𝑦 d𝑥 d𝑦 −∞
(4.37) die Fouriertransformierte von 𝑝(𝑥, 𝑦) ist und wir ℎ0 = (i∕𝜆 d ) exp(−i𝑘d ) gesetzt haben. Das Beugungsmuster ist folglich 𝐼(𝑥, 𝑦) =
𝐼e (𝜆 d )2
|| |2 ||𝑃 ( 𝑥 𝑦 )||| . || 𝜆 d 𝜆 d || | |
(4.38)
Zusammengefasst heißt das: Das Fraunhofer-Beugungsmuster am Punkt (𝑥, 𝑦) ist proportional zum Betragsquadrat der Fouriertransformierten der Blendenfunktion 𝑝(𝑥, 𝑦) berechnet für die Ortsfrequenzen 𝜈𝑥 = 𝑥∕𝜆 d und 𝜈𝑦 = 𝑦∕𝜆 d .
4.3 Lichtbeugung Beugungsmuster
z
x I (0, y)
Blende
θy
Dx
y Dy
y
0
Abb. 4.25 Fraunhoferbeugung an einer rechteckigen Öffnung. Die halben Öffnungswinkel des zentralen Maximums sind 𝜃x = 𝜆∕Dx und 𝜃y = 𝜆∕Dy .
Übung 4-5: Fraunhoferbeugung an einer rechteckigen Öffnung
Verifizieren Sie, dass das Fraunhofer-Beugungsmuster einer rechteckigen Öffnung der Höhe 𝐷𝑥 und der Breite 𝐷𝑦 in einer Entfernung d gleich 2
𝐼(𝑥, 𝑦) = 𝐼0 sinc
𝐷𝑦 𝑦
𝐷𝑥 𝑥 2 sinc 𝜆d 𝜆d
(4.39)
ist, wobei 𝐼0 = (𝐷𝑥 𝐷𝑦 ∕𝜆 d ) 𝐼e die Maximalintensität ist und sinc(𝑥) = sin(π𝑥)∕(π𝑥) die Kardinalsinusfunktion (Sinus cardinalis). Verifizieren Sie, dass die ersten Nullstellen dieses Musters bei 𝑥 = ±𝜆 d ∕𝐷𝑥 und 𝑦 = ±𝜆 d ∕𝐷𝑦 auftreten, sodass die Divergenz des gebeugten Lichts durch 2
𝜃𝑥 =
𝜆 , 𝐷𝑥
𝜃𝑦 =
𝜆 𝐷𝑦
(4.40)
gegeben ist. Für 𝐷𝑦 < 𝐷𝑥 ist das Beugungsmuster in 𝑦-Richtung breiter als in 𝑥-Richtung, wie Abb. 4.25 zeigt.
scheibchens, gleich 𝜌S = 1.22𝜆 d ∕𝐷 ist und dass er einen Winkel 𝜃 = 1.22
𝜆 𝐷
(4.42)
aufspannt. Die Fraunhofernäherung gilt für Entfernungen d , die normalerweise sehr groß sind. Für die optische Kommunikation über große Entfernungen wie beim Laserradar (Lidar) oder in der Satellitenkommunikation ist diese Bedingung erfüllt. Wenn aber eine Linse der Brennweite 𝑓 verwendet wird, um das gebeugte Licht zu fokussieren, dann ist das Intensitätsmuster in der Brennebene proportional zum Betragsquadrat der Fouriertransformierten von 𝑝(𝑥, 𝑦) berechnet bei 𝜈𝑥 = 𝑥∕𝜆𝑓 und 𝜈𝑦 = 𝑦∕𝜆𝑓 , wie in Abschnitt 4.2.2 gezeigt wird. Das beobachtete Muster ist daher identisch mit dem aus Gl. (4.38) berechneten, nur dass die Entfernung d durch die Brennweite 𝑓 zu ersetzen ist. Übung 4-7: Radius eines fokussierten Lichtbündels
Übung 4-6: Fraunhoferbeugung an einer kreisförmigen Öffnung
Verifizieren Sie, dass das Fraunhofer-Beugungsmuster einer kreisförmigen Öffnung mit dem Durchmesser 𝐷 (Abb. 4.26) durch 2
2𝐽1 (π𝐷𝜌∕𝜆 d ) 𝐼(𝑥, 𝑦) = 𝐼0 [ ] , π𝐷𝜌∕𝜆 d
𝜌=
√
𝑥2 + 𝑦 2 (4.41)
gegeben ist, wobei 𝐼0 = (π 𝐷 2 ∕4𝜆 d )2 𝐼e die maximale Intensität ist und 𝐽1 (⋅) die Besselfunktion der Ordnung 1. Die Fouriertransformation rotationssymmetrischer Funktionen wird in Abschnitt A.3 diskutiert. Das rotationssymmetrische Muster aus Gl. (4.41), das als Airymuster bekannt ist, besteht aus einer zentralen Scheibe, die von Ringen umgeben ist. Verifizieren Sie, dass der Radius der zentralen Scheibe, des Airy-
Ein Lichtbündel wird mithilfe einer Linse der Brennweite 𝑓 und einer kreisförmigen Blende mit dem Durchmesser 𝐷 fokussiert (Abb. 4.27). Beschreiben Sie das Strahlbündel an Punkten innerhalb der Blendenöffnung näherungsweise als ebene Welle und zeigen Sie, dass das Intensitätsmuster des Brennflecks durch 2
𝐼(𝑥, 𝑦) = 𝐼0 [
2𝐽1 (π 𝐷𝜌∕𝜆𝑓) ] , π 𝐷𝜌∕𝜆𝑓
𝜌=
√
𝑥2 + 𝑦 2 (4.43)
gegeben ist, wobei 𝐼0 die maximale Intensität ist. Vergleichen Sie den Radius 𝑓 (4.44) 𝐷 des Brennflecks mit demjenigen, den man erhält, wenn man einen Gaußstrahl mit dem Taillenradius 𝑊0 durch eine ideale Linse mit unendlicher Öffnung fokussiert [siehe Gl. (3.45)]. 𝜌𝑠 = 1.22𝜆
93
94
4 Fourieroptik
Beugungsmuster
Abb. 4.26 Das FraunhoferBeugungsmuster einer kreisförmigen Öffnung erzeugt ein Airymuster, bei dem der Radius der zentralen Scheibe einen Winkel 𝜃 = 1.22𝜆∕D aufspannt.
z I (ρ)
x Blende θ
y 0 ρs
D
x
ähnlich für 𝑦 und 𝑦 ′ ). Gleichung (4.45) wird dann zu f
Blende
Beugungsmuster
Linse
y
y
ρs = 1.22
D
λf
D
Abb. 4.27 Fokussierung einer ebenen Welle, die durch eine kreisförmige Öffnung mit dem Durchmesser D hindurchtritt.
4.3.2 Fresnelbeugung Die Theorie der Fresnelbeugung beruht auf der Annahme, dass die einfallende Welle mit der Blendenfunktion 𝑝(𝑥, 𝑦) multipliziert wird und sich im Vakuum gemäß der Fresnelnäherung ausbreitet. Wenn die einfallende Welle eine ebene Welle mit der Intensität 𝐼e ist, die sich in 𝑧-Richtung ausbreitet, ist die komplexe Ampli√ tude direkt hinter der Blende 𝑓(𝑥, 𝑦) = 𝐼e 𝑝(𝑥, 𝑦). Aus Gl. (4.20) erhalten wir für das Beugungsmuster 𝐼(𝑥, 𝑦) = |𝑔(𝑥, 𝑦)|2 in einer Entfernung d 𝐼e 𝐼(𝑥, 𝑦) = (𝜆 d )2
ρ
|| ∞ || || || ∬ 𝑝(𝑥′ , 𝑦 ′ ) || ||−∞
||2 (𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ′ ′ ||| × exp [−iπ ] d𝑥 d𝑦 | . || 𝜆d | (4.45) Der Bequemlichkeit halber normieren wir√alle Ab√ 𝜆 d , sodass 𝑋 = 𝑥∕ 𝜆 d und stände auf den Abstand √ 𝑋 ′ = 𝑥′ ∕ 𝜆 d die normierten Entfernungen sind (und
|| ∞ || | 𝐼(𝑋, 𝑌) = 𝐼e ||| ∬ 𝑝(𝑋 ′ , 𝑌 ′ ) || ||−∞ ||2 || ]} { [ | × exp −iπ (𝑋 − 𝑋 ′ )2 + (𝑌 − 𝑌 ′ )2 d𝑋 ′ d𝑌 ′ ||| . || || (4.46) Das Integral in Gl. (4.46) ist die Faltung von 𝑝(𝑋, 𝑌) und exp[−iπ(𝑋 2 + 𝑌 2 )]. Real- und Imaginärteil von exp(−iπ 𝑋 2 ), also cos π 𝑋 2 und sin π𝑋 2 , sind in Abb. 4.28 aufgetragen. Sie oszillieren mit zunehmender Frequenz, und √ ihre ersten Maxima liegen in den Intervallen |𝑋| < 1∕ 2 bzw |𝑋| < 1. Die Gesamtfläche unter der Funktion exp(−iπ 𝑋 2 ) ist 1, wobei der Hauptbeitrag zur Fläche durch die ersten Maxima geliefert wird, da sich die folgenden Maxima gegenseitig auslöschen. Wenn 𝑎 der Radius der Öffnung ist, ist √ der Radius der normierten Funktion 𝑝(𝑋, 𝑌) gleich 𝑎∕ 𝜆 d . Das Ergebnis der Faltung, das von der relativen Größe der beiden Funktionen abhängt, wird daher durch die Fresnelzahl 𝑁F = 𝑎2 ∕𝜆 d bestimmt. Wenn√die Fresnelzahl groß ist, ist der normierte Radius 𝑎∕ 𝜆 d der Öffnung viel größer als der Radius des ersten Maximums, und die Faltung ergibt ungefähr die breitere Funktion 𝑝(𝑋, 𝑌). Unter diesen Bedingungen ist das Fresnel-Beugungsmuster ein Schatten der Öffnung, wie nach der Strahlenoptik zu erwarten. Die Strahlenoptik gilt im Grenzfall 𝜆 → 0 bzw. 𝑁F → ∞. Im entgegengesetzten Grenzfall, wenn also 𝑁F klein ist, ist die Fraunhofernäherung anwendbar und wir beobachten das Fraunhofer-Beugungsmuster.
4.3 Lichtbeugung
cos πX 2
sin πX 2 1
1
–3
–2
–1
0
1
2
3 X
–3
–2
–1
0
1
2
3
X
–1
–1
Abb. 4.28 Real- und Imaginärteil von exp(−iπ X 2 ).
Beispiel 4-3: Fresnelbeugung an einem Spalt
Nehmen Sie an, dass die Öffnung ein Spalt der Breite 𝐷 = 2𝑎 ist, sodass 𝑝(𝑥, 𝑦) für |𝑥| ≤ 𝑎 gleich eins und ansonsten √ gleich null ist. Die normierte Koordinate ist 𝑋 = 𝑥∕ 𝜆 d , und es gilt √ ⎧ 1, |𝑋| ≤ √𝑎 = 𝑁F 𝜆d 𝑃(𝑋, 𝑌) = ⎨ 0, ansonsten, ⎩
(4.47)
wobei 𝑁F = 𝑎2 ∕𝜆 d die Fresnelzahl ist. Durch Einsetzen in Gl. (4.46) erhalten wir 𝐼(𝑋, 𝑌) = 𝐼e |𝑔(𝑋)|2 mit √ 𝑁F
[ ] 𝑔(𝑋) = ∫ exp −iπ(𝑋 − 𝑋 ′ )2 d𝑋 ′
Beispiel 4-4: Fresnelbeugung an einer gaußschen Blende
√ − 𝑁F √ 𝑋+ 𝑁F
∫
=
exp(−iπ𝑋 ′2 ) d𝑋 ′ .
(4.48)
√ 𝑋− 𝑁F
Dieses Integral wird meist durch die Fresnelintegrale ausgedrückt, 𝑥
π𝛼2 𝐶(𝑥) = ∫ cos d𝛼 , 2 0
𝑥
𝑆(𝑥) = ∫ sin
Das Beugungsmuster eines Spalts ist in Abb. 4.29 für verschiedene Fresnelzahlen aufgetragen, entsprechend verschiedenen Abständen d von der Blende. Bei sehr kleinen Abständen (sehr großen 𝑁F ) ist das Beugungsmuster ein idealer Schatten des Spalts. Wenn der Abstand größer wird (𝑁F kleiner), zeigt sich die Wellennatur des Lichts in Form kleiner Oszillationen um die Kanten der Öffnung (siehe auch das Beugungsmuster in Abb. 4.23). Für sehr kleine 𝑁F erhalten wir das durch Gl. (4.39) beschriebene Fraunhofer-Beugungsmuster. Es ist eine Kardinalsinusfunktion mit einer ersten Nullstelle bei dem Winkel 𝜆∕𝐷 = 𝜆∕2𝑎.
π𝛼2 d𝛼 , (4.49) 2
0
die in den üblichen mathematischen Funktionsbibliotheken von Computern enthalten sind. Die komplexe Funktion 𝑔(𝑋) kann auch mithilfe von Fouriermethoden berechnet werden. Da √ 𝑔(𝑥) die Faltung einer Rechteckfunktion der Breite 𝑁F 2 mit exp(−iπ 𝑋 Fouriertransformierte √ ) ist, muss ihre 𝐺(𝜈𝑥 ) ∝ sinc( 𝑁F 𝜈𝑥 ) exp(iπ 𝜈𝑥2 ) sein (siehe Tabelle A.1 in Anhang A). Folglich können wir 𝑔(𝑋) berechnen, indem wir die inverse Fouriertransformierte von √ 𝐺(𝜈𝑥 ) bestimmen. Für 𝑁F ≫ 1 ist die Breite von sinc( 𝑁F 𝜈𝑥 ) 2 viel kleiner als die des ersten Maximums √ von exp(iπ𝜈𝑥 ) (siehe Abb. 4.28), sodass 𝐺(𝜈𝑥 ) ≈ sinc( 𝑁F 𝜈𝑥 ) ist. 𝑔(𝑋) ist in diesem Fall die Rechteckfunktion, die den Schatten der Blendenöffnung beschreibt.
Wenn die Blendenfunktion 𝑝(𝑥, 𝑦) die Gaußfunktion 𝑝(𝑥, 𝑦) = exp[−(𝑥2 + 𝑦 2 )∕𝑊02 ] ist, können wir die Gleichung (4.45) für die Fresnelbeugung exakt lösen, indem wir die Faltung von exp[−(𝑥2 + 𝑦 2 )∕𝑊02 ] mit ℎ0 exp[−iπ(𝑥2 + 𝑦 2 )∕𝜆 d ] berechnen, beispielsweise mit den in Anhang A beschriebenen Fouriermethoden. Das resultierende Beugungsmuster ist 𝐼(𝑥, 𝑦) = 𝐼e [
𝑊0 2 𝑥2 + 𝑦 2 ] exp [−2 2 ], 𝑊(d ) 𝑊 (d )
(4.50)
wobei 𝑊 2 (d ) = 𝑊02 + 𝜃02 d 2 und 𝜃0 = 𝜆∕π𝑊0 ist. Das Beugungsmuster ist eine Gaußfunktion der 1∕e2 -Breite 𝑊(d ). Für kleine d ist 𝑊(d ) ≈ 𝑊0 , aber wenn d zunimmt, nimmt auch 𝑊(d ) zu und erreicht 𝑊(d ) ≈ 𝜃0 d , wenn d so groß wird, dass die Fraunhofernäherung gilt; der von dem Beugungsmuster aufgespannte Winkel ist dann 𝜃0 . Diese Ergebnisse sind in Abb. 4.30 dargestellt, die das Analogon zu Abb. 4.29 für die Beugung an einem Spalt ist. Die an einer gaußschen Blende gebeugte Welle ist der in Kapitel 3 detailliert beschriebene Gaußstrahl.
95
96
4 Fourieroptik
x λ 2a (a)
2a NF =10 1 x
x
x
NF = 10
(b)
z NF = 0.1
0.5
x NF = 0.5
NF = 1
NF = 0.1
. . .
2a
Abb. 4.29 Fresnelbeugung an einem Spalt der Breite D = 2a. (a) Die schattierte Fläche ist der Schatten der Öffnung. Die gestrichelte Linie zeigt die Dicke des gebeugten Fraunhoferstrahls. (b) Beugungsmuster an vier axialen Positionen, die in (a) durch Pfeile gekennzeichnet sind und den Fresnelzahlen NF = 10, 1, 0.5, und 0.1 entsprechen. Die schattierte
2a
Fläche zeigt den geometrischen Schatten des Spalts. Die gestrichelten Linien bei |x| = (𝜆∕D)d zeigen die Breite des Fraunhofermusters im Fernfeld. An den Stellen, an denen die gestrichelten Linien auf die Begrenzung des geometrischen Schattens trifft, ist die Fresnelzahl NF = a2 ∕𝜆d = 0.5.
x θ0 = λ
πW0
(a)
2W0 NF =10 1 x
(b)
2W0
0.5 x
NF = 10
z NF = 0.1 x
NF = 1
x NF = 0.5
NF = 0.1
. . .
2a
Abb. 4.30 Fresnel-Beugungsmuster für eine gaußsche Blende mit dem Radius W0 in Entfernungen d , sodass der Parameter (π∕2)W02 ∕𝜆d , der das Analogon zur Fresnelzahl NF in Abb. 4.29 ist, die Werte 10, 1, 0.5, und 0.1 annimmt. Diese Werte entsprechen W (d )∕W0 = 1.001, 1.118, 1.414, und 5.099. Das Beugungsmuster ist in allen Entfernungen eine Gaußfunktion.
4.3 Lichtbeugung
x
Zusammenfassung
Mit zunehmender Entfernung von der Blendenöffnung beobachten wir die folgenden Beugungsmuster: 1) Ein Schatten der Öffnung; 2) ein Fresnel-Beugungsmuster, das sich als Faltung der normierten Blendenfunktion mit exp[−iπ(𝑋 2 + 𝑌 2 )] ergibt; 3) ein Fraunhofer-Beugungsmuster, das sich als Betragsquadrat der Fouriertransformierten der Blendenfunktion ergibt. Die Divergenz des Bündels ist im Fernfeld proportional zu 𝜆∕𝐷, wenn 𝐷 der Durchmesser der Öffnung ist.
Fresnelbeugung an einer periodischen Öffnung: Der Talboteffekt
Die Fresnelbeugung an einer eindimensionalen periodischen Öffnung lässt sich am besten im Fourierraum beschreiben, indem man die Blendenfunktion 𝑝(𝑥) in eine Fourierreihe entwickelt. Wenn 𝛬 die Periode der Blende ist, enthält die Fourierentwicklung die Frequenzen 𝜈𝑥 = 𝑚∕𝛬 mit 𝑚 = 0, ±1, ±2, . . . Die Übertragungsfunktion des Vakuums [Gl. (4.11)] in einer Entfernung 𝑧 ist dann ( ( ) ) 𝐻0 exp iπ𝜆𝑧𝜈𝑥2 = 𝐻0 exp iπ𝜆𝑧𝑚2∕𝛬2 = 𝐻0 exp(i2π 𝑚2 𝑧∕𝑧T ) ,
(4.51)
wobei 𝑧T = 2𝛬2 ∕𝜆 ist. Bei 𝑧 = 𝑧T oder Vielfachen davon ist die Übertragungsfunktion unabhängig von der harmonischen Ordnung 𝑚 einfach eine Konstante 𝐻0 . Bei diesen Abständen wird folglich jede der harmonischen Funktionen, aus denen die Blendenfunktion 𝑝(𝑥) besteht, mit demselben Faktor multipliziert, sodass die Funktion 𝑝(𝑥) reproduziert wird. Dieser Vorgang der Selbstabbildung wird als Talboteffekt bezeichnet und die Entfernung 𝑧T als Talbotdistanz. Bei Abständen 𝑧, die keinem Vielfachen von 𝑧T entsprechen, ist das Feld durch 𝑈(𝑥, 𝑧) = ∑∞ 𝐻0 𝑚 = −∞ 𝑐𝑚 exp(i𝑚𝑥∕𝛬) exp(i2π 𝑚2 𝑧∕𝑧T ) gegeben, wobei die 𝑐𝑚 die Koeffizienten der Fourierreihenentwicklung von 𝑝(𝑥) sind. Die entsprechende Intensität 𝐼(𝑥, 𝑧) = |𝑈(𝑥, 𝑧)|2 für einen undurchsichtigen Schirm mit parallelen Spalten zeigt ein teppichartiges Muster („Talbot-Teppich“), wie Abb. 4.31 illustriert.
4.3.3 Nichtbeugende Wellen Nach den Gln. (4.8) und (4.9) ist die Übertragungsfunktion √ des freien Raums gleich exp(−i𝑘𝑧 𝑧), wobei
𝑘𝑧 =
𝑘02 − 𝑘𝑥2 − 𝑘𝑦2 eine kreissymmetrische komplexe
Funktion von 𝑘t2 = 𝑘𝑥2 + 𝑘𝑦2 ist. Zwei beliebige harmo-
0
zT
2 zT z
Abb. 4.31 Der Talboteffekt. Das Fresnel-Beugungsmuster einer periodischen Öffnung in Form von parallelen Spalten in einem ansonsten undurchsichtigen Schirm wiederholt sich in Abständen, die ein Vielfaches der Talbotdistanz zT sind. Das Ergebnis sieht aus wie ein Teppich mit in x- und z-Richtung periodischen Mustern.
nische Eingangsfunktionen mit Ortsfrequenzen, für die 𝑘t2 gleich ist, besitzen somit den gleichen Wert der Übertragungsfunktion. Daraus folgt, dass eine Superposition 𝑓(𝑥, 𝑦) von harmonischen Funktionen mit identischen Werten von 𝑘t und damit von 𝑘𝑧 eine stationäre Welle 𝑈(𝑥, 𝑦, 𝑧) = 𝑓(𝑥, 𝑦) exp(i𝑘𝑧 𝑧) ergibt, deren transversale Verteilung sich bei ihrer Ausbreitung nicht verändert, die sich also über beliebige Entfernungen 𝑧 beugungsfrei durch das Vakuum ausbreitet. Die Wellenfronten einer solchen Welle sind Ebenen, die senkrecht auf der 𝑧-Achse stehen; ihre Ausbreitungskonstante ist 𝑘𝑧 . Nichtbeugende optische Strahlen wurden in Abschnitt 3.5 untersucht. Beispiel 4-5: Zwei ebene Wellen 1
Die Funktion 𝑓(𝑥, 𝑦) = cos(𝛼𝑥) = [exp(−i𝛼𝑥) + 2 exp(+i𝛼𝑥)] besteht aus zwei harmonischen Komponenten mit den räumlichen Winkelfrequenzen 𝑘𝑥 = ±𝛼. Bei der Ausbreitung durch das Vakuum wird jede dieser Komponenten mit demselben Faktor exp(−i𝑘𝑧 𝑧) √
mit 𝑘𝑧 = 𝑘02 − 𝛼2 moduliert. Das Ergebnis ist eine stationäre Welle der Form 𝑈(𝑥, 𝑦, 𝑧) = cos(𝛼𝑥) exp(−i𝑘𝑧 𝑧) mit einer sinusförmigen transversalen Verteilung, die der Interferenz zwischen zwei schräg einlaufenden −1 ebenen Wellen unter den Winkeln ± sin (𝛼∕𝑘0 ) gemäß Gl. (2.52) entspricht. Beispiel 4-6: Vier ebene Wellen
Eine ebene Welle in 𝑧-Richtung, die durch die Funktion 𝑓(𝑥, 𝑦) = cos(𝛼𝑥 𝑥) cos(𝛼𝑦 𝑦) moduliert wird, führt −1 zu vier Wellen unter den Winkeln ± sin (𝛼𝑥 ∕𝑘0 ) und −1 ± sin (𝛼𝑦 ∕𝑘0 ) zur 𝑥- bzw. 𝑦-Achse. Da die Größe 𝑘t2 = 𝛼𝑥2 + 𝛼𝑦2 für alle vier Wellen gleich ist, gilt dasselbe √ auch für 𝑘𝑧 = 𝑘02 − 𝑘t2 . Folglich resultiert bei 𝑧 wie in Abb. 4.32 dargestellt eine stationäre Welle 𝑈(𝑥, 𝑦, 𝑧) = cos(𝛼𝑥 𝑥) cos(𝛼𝑦 𝑦) exp(−i𝑘𝑧 𝑧).
97
98
4 Fourieroptik
x
4.4 Bildentstehung
z
f(x,y)
f(x,y) e –ikz z
Abb. 4.32 Zu Beispiel 4-6: Superposition von vier ebenen Wellen.
Beispiel 4-7: Unendlich viele ebene Wellen
Wir betrachten wir nun eine Funktion 𝑓(𝑥, 𝑦) aus mehreren harmonischen Funktionen der Winkelfrequenzen 𝑘𝑥 = 𝑘t cos 𝜙 und 𝑘𝑦 = 𝑘t sin 𝜙 mit festem 𝑘t , aber unterschiedlichen √ Werten von 𝜙. Die Größen
𝑘𝑥2 + 𝑘𝑦2 = 𝑘t2 und 𝑘𝑧 = 𝑘02 − 𝑘t2 müssen folglich für all diese Funktionen gleich sein. Diese Superposition entspricht daher einer stationären Welle 𝑈(𝑥, 𝑦, 𝑧) = 𝑓(𝑥, 𝑦) exp(−i𝑘𝑧 𝑧), unabhängig davon, wie viele Werte von 𝜙 sie enthält. Ein Grenzfall dieser Situation ist die Superposition eines Kontinuums harmonischer Funktionen, das sich über alle Winkel 𝜙 erstreckt; π hierfür ergibt sich 𝑓(𝑥, 𝑦) = ∫−π exp(−i𝑘t cos 𝜙𝑥 − i𝑘t sin 𝜙𝑦) d𝜙. Das Ergebnis ist ein Kontinuum von ebenen Wellen, deren Richtungen einen Kegel mit −1 dem Halbwinkel sin (𝑘t ∕𝑘0 ) bilden. Diese Superposition ist nichts anderes als der in Gl. (3.73) definierte und in Abb. √ 4.33 dargestellte Besselstrahl 𝑈(𝑥, 𝑦, 𝑧) = 2π 𝐽0 (𝑘t 𝑥2 + 𝑦 2 ) exp(−i𝑘𝑧 𝑧). Explizit wird diese Verπ bindung durch die Identität ∫−π exp(−i𝑢 sin 𝜙) d𝜙 = 2π𝐽0 (𝑢) demonstriert, wobei 𝐽0 (𝑢) die Besselfunktion erster Art und nullter Ordnung ist. Die zu einem Besselstrahl gehörige Superposition ebener Wellen kann mithilfe eines Axicons realisiert werden (siehe Beispiel 2-1 und Abschnitt 3.5.1).
x
Ein ideales abbildendes System ist ein optisches System, das die Lichtverteilung in einer Ebene, der Gegenstandsebene, in einer zweiten Ebene, der Bildebene, reproduziert. Da die optische Transmission nie ideal verläuft, ist das Bild nie eine identische Kopie des Gegenstands. Abgesehen von einer möglichen Vergrößerung existiert eine Unschärfe, die aus nicht idealer Fokussierung und der Beugung der optischen Wellen resultiert. Der folgende Abschnitt beschreibt abbildende Systeme und ihre Wiedergabetreue. Zur Charakterisierung der Bildentstehung verwenden wir Methoden aus der Theorie linearer Systeme wie die Impulsantwortfunktion und die Übertragungsfunktion (Anhang B). Wir beginnen mit einem einfachen strahlenoptischen Ansatz und entwickeln im Anschluss daraus eine wellenoptische Beschreibung.
4.4.1 Strahlenoptische Beschreibung eines einlinsigen abbildenden Systems Wir betrachten ein abbildendes System aus einer Linse der Brennweite 𝑓 in den Entfernungen d 1 und d 2 von der Gegenstands- bzw. der Bildebene (Abb. 4.34). Für 1∕d 1 + 1∕d 2 = 1∕𝑓 ist das System fokussiert, sodass von einem Punkt der Gegenstandsebene ausgehende paraxiale Strahlen sich in einem einzigen Punkt in der Bildebene treffen. Im Rahmen der Strahlentheorie des Lichts ist die Abbildung „ideal“, d. h. jeder Punkt des Gegenstands erzeugt genau einen einzigen Punkt des Bildes. Die Impulsantwortfunktion des Systems ist eine Deltafunktion. Nun wollen wir annehmen, dass das System defokussiert ist, wie Abb. 4.35 illustriert, und dass der Fokusfehler gleich 𝜀=
1 d1
+
1 d2
−
1 𝑓
(4.52)
ist. Ein Punkt in der Gegenstandsebene erzeugt einen Lichtfleck in der Bildebene, der ein Schatten der Blendenöffnung ist. Die Verteilung in diesem Fleck ist die Impulsantwortfunktion des Systems. Der Einfachheit Linse
Gegenstand z
Bild f(x,y)
f(x,y) e –ikz z
Abb. 4.33 Zu Beispiel 4-7: Superposition von unendlich vielen ebenen Wellen.
f 1
f 2
Abb. 4.34 Strahlen in einem fokussierten abbildenden System.
4.4 Bildentstehung
x
h(x, y)
ρ
ρs
h(x, y) ʹ
1
ρs
x
2
y
2
(a)
(b)
Abb. 4.35 (a) Strahlen in einem defokussierten abbildenden System. (b) Die Impulsantwortfunktion eines abbildenden Systems mit einer kreisförmigen Blendenöffnung mit dem Durchmesser D ist ein Kreis mit Radius 𝜌S = 𝜀 d 2 D∕2, wobei 𝜀 der Fokusfehler ist.
halber werden wir einen Gegenstandspunkt auf der optischen Achse betrachten und die Lichtverteilung ℎ(𝑥, 𝑦) untersuchen, die er in der Bildebene erzeugt. Wir nehmen an, dass die Ebene des fokussierten Bildes in einer Entfernung 𝑑2′ liegt, die die Abbildungsgleichung 1∕d ′2 + 1∕d 1 = 1∕𝑓 erfüllt. Der Schatten eines Punkts am Rand der Blendenöffnung in einem radialen Abstand 𝜌 ist ein Punkt in einem radialen Abstand 𝜌S in der Bildebene, wobei 𝜌S ∕𝜌 = (d ′2 − d 2 )∕d ′2 = 1 − d 2 ∕d ′2 = 1 − d 2 (1∕𝑓 − 1∕d 1 ) = 1 − d 2 (1∕d 2 − 𝜀) = 𝜀d 2 gilt. Wenn 𝑝(𝑥, 𝑦) die Blendenfunktion ist, die in diesem Zusammenhang auch als Pupillenfunktion bezeichnet wird [𝑝(𝑥, 𝑦) = 1 innerhalb der Öffnung und 0 außerhalb], dann ist ℎ(𝑥, 𝑦) eine skalierte Version von 𝑝(𝑥, 𝑦), die um einen Faktor 𝜌S ∕𝜌 = 𝜀d 2 vergrößert ist; in diesem Fall gilt ℎ(𝑥, 𝑦) ∝ 𝑝 (
𝑦 𝑥 , ). 𝜀d 2 𝜀d 2
(4.53)
Beispielsweise ist die Impulsantwortfunktion einer kreisförmigen Blendenöffnung mit dem Durchmesser 𝐷 auf einen Kreis mit dem Radius 1 𝜌𝑠 = 𝜀d 2 𝐷 (4.54) 2 begrenzt, wie Abb. 4.35 zeigt. Der Radius 𝜌𝑠 dieses „Unschärfekreises“ ist ein inverses Maß für die Auflösung und die Bildqualität des Systems. Ein kleiner Wert von 𝜌𝑠 bedeutet, dass das System in der Lage ist, feine Details aufzulösen. Da 𝜌𝑠 proportional zum Durchmesser 𝐷 x
f
f
f
der Blendenöffnung ist, kann die Bildqualität durch Verwendung einer kleinen Blendenöffnung verbessert werden. Eine kleine Blendenöffnung bringt eine geringere Empfindlichkeit des Systems gegenüber Fehlern bei der Scharfstellung und dadurch eine größere „Schärfentiefe“ mit sich.
4.4.2 Wellenoptische Beschreibung eines 4f -Systems Als Nächstes wollen wir das in Abb. 4.36 gezeigte zweilinsige System betrachten. Es wird als 4f -System bezeichnet und als fokussierendes abbildendes System mit einem Vergrößerungsfaktor von eins eingesetzt, wie durch Strahlverfolgung leicht zu verstehen ist. Die Analyse der Wellenausbreitung durch dieses System wird einfach, wenn wir es als Hintereinanderschaltung zweier fouriertransformierender Subsysteme auffassen. Das erste Subsystem (das zwischen der Gegenstands- und der Fourierebene) führt eine Fouriertransformation durch, und das zweite (das zwischen der Fourier- und der Bildebene) führt eine inverse Fouriertransformation durch, da das Koordinatensystem in der Bildebene invertiert ist (siehe Übung 4-4). Demzufolge ist das Bild in Abwesenheit von Blenden eine ideale Wiedergabe des Gegenstands. Nun nehmen wir an, dass 𝑓(𝑥, 𝑦) die komplexe Amplitudentransmission einer in der Gegenstandsebene liegenden Folie ist, die von einer sich in 𝑧-Richtung ausf
Abb. 4.36 Ein 4f -System. Wenn in der Bildebene ein invertiertes Koordinatensystem verwendet wird, ist die Vergrößerung eins.
p(x,y)
Gegenstandsebene
Fourierebene
x Bildebene
99
100
4 Fourieroptik
y
Linse
z
Fourierebene
x f(x, y) ebene Welle
f
F
Gegenstandsebene
g(x, y)
Linse
x
Bildebene
f f
y f
Abb. 4.37 Ein 4f -System führt zuerst eine Fouriertransformation und danach eine inverse Fouriertransformation aus, sodass das Bild eine ideale Kopie des Gegenstands ist.
breitenden ebenen Welle exp(−i𝑘𝑧) beleuchtet wird (wie in Abb. 4.37 dargestellt); 𝑔(𝑥, 𝑦) sei die komplexe Amplitude in der Bildebene. Das erste Linsensystem zerlegt 𝑓(𝑥, 𝑦) in seine räumliche Fouriertransformierten und trennt die Fourierkomponenten, sodass jeder Punkt in der Fourierebene einer einzigen Ortsfrequenz entspricht. Das zweite Linsensystem führt diese Komponenten wieder zusammen, wodurch die Lichtverteilung des Gegenstands perfekt rekonstruiert wird. Ein 4𝑓-System kann als Ortsfilter eingesetzt werden, bei dem das Bild 𝑔(𝑥, 𝑦) eine gefilterte Fassung des Gegenstands 𝑓(𝑥, 𝑦) ist. Da die Fourierkomponenten von 𝑓(𝑥, 𝑦) in der Fourierebene vorliegen, kann eine dort eingesetzte Maske dazu benutzt werden, eine Auswahl unter ihnen vorzunehmen, indem manche Komponenten durchgelassen und andere blockiert werden (siehe
Abb. 4.38). Die Fourierkomponente von 𝑓(𝑥, 𝑦) mit der Ortsfrequenz (𝜈𝑥 , 𝜈𝑦 ) liegt in der Fourierebene an der Position 𝑥 = 𝜆𝑓𝜈𝑥 , 𝑦 = 𝜆𝑓𝜈𝑦 . Um ein Filter mit der Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) zu erzeugen, muss die komplexe Amplitudentransmission 𝑝(𝑥, 𝑦) der Maske proportional zu H(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) sein. Folglich ist die Übertragungsfunktion eines durch eine Maske mit der Transmission 𝑝(𝑥, 𝑦) erzeugten Filters gleich H(𝜈𝑥 , 𝜈𝑦 ) = 𝑝(𝜆𝑓𝜈𝑥 , 𝜆𝑓𝜈𝑦 ) ,
(4.55)
wobei wir den Phasenfaktor i exp(−i2𝑘𝑓) ignoriert haben, der in jeder Fouriertransformation auftritt [die Phase von ℎ𝑙 in Gl. (4.29)]. Die Fouriertransformierten 𝐺(𝜈𝑥 , 𝜈𝑦 ) und 𝐹(𝜈𝑥 , 𝜈𝑦 ) von 𝑔(𝑥, 𝑦) und 𝑓(𝑥, 𝑦) hängen gemäß 𝐺(𝜈𝑥 , 𝜈𝑦 ) = H(𝜈𝑥 , 𝜈𝑦 )𝐹(𝜈𝑥 , 𝜈𝑦 ) zusammen. g(x, y) Linse
y
z
Maske
p (x, y)
x
Linse
f (x, y) f Fourierebene
ebene Welle
y Gegenstandsebene
x
Bildebene
f
f
f
Abb. 4.38 Ein Ortsfilter. Die Folien in der Gegenstandsbzw. Fourierebene besitzen die komplexen Amplitudentransmissionen f (x, y ) und p(x, y ). Eine ebene Welle, die sich in z-Richtung ausbreitet, wird durch die Folie in der Gegenstandsebene moduliert, durch die erste Linse fouriertransformiert, mit der Transmission der Maske in der
Fourierebene multipliziert und durch die zweite Linse rücktransformiert. Das Ergebnis ist, das die komplexe Amplitude in der Bildebene g(x, y ) eine gefilterte Version von f (x, y ) ist. Die Übertragungsfunktion des Systems ist H (𝜈x , 𝜈y ) = p(𝜆f 𝜈x , 𝜆f 𝜈y ).
4.4 Bildentstehung
verändert. Wenn sich der Gegenstand nur wenig oder langsam ändert, ist das gefilterte Signal schwach. Ein derartiges Filter bewirkt daher in der Bildverarbeitung eine Kantenverstärkung. • Ein Vertikalpassfilter blockiert horizontale Frequenzen und lässt vertikale Frequenzen passieren; es werden also nur Variationen in 𝑥-Richtung durchgelassen. Wenn die Maske aus einem vertikalen Spalt der Breite 𝐷 besteht, ist die größte durchgelassene Frequenz 𝜈𝑦 = (𝐷∕2)∕𝜆𝑓.
Dieses Ergebnis ist recht einfach. Die Übertragungsfunktion hat dieselbe Form wie die Pupillenfunktion. Die zugehörige Impulsantwortfunktion ℎ(𝑥, 𝑦) ist die inverse Fouriertransformierte von H(𝜈𝑥 , 𝜈𝑦 ), ℎ(𝑥, 𝑦) =
𝑥 𝑦 1 𝑃( , ), 𝜆𝑓 𝜆𝑓 (𝜆𝑓)2
(4.56)
wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑝(𝑥, 𝑦) ist. Beispiele für Ortsfilter
• Das ideale rotationssymmetrische Tiefpassfilter besitzt die Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) = 1 für 𝜈𝑥2 + 𝜈𝑦2 < 𝜈G2 und H(𝜈𝑥 , 𝜈𝑦 ) = 0 für alle anderen Ortsfrequenzen. Es lässt Ortsfrequenzen unterhalb der Grenzfrequenz 𝜈G passieren und blockiert alle höheren Frequenzen. Ein solches Filter lässt sich durch eine Maske mit einer kreisförmigen Blende mit dem Durchmesser 𝐷 mit 𝐷∕2 = 𝜈G 𝜆𝑓 realisieren. Wenn beispielsweise 𝐷 = 2 cm ist, wird 𝜆 = 1 μm und 𝑓 = 100 cm, und die Grenzfrequenz (räumliche Bandbreite) ist 𝜈G = 𝐷∕2𝜆𝑓 = 10 Linien pro mm. Dieses Filter eliminiert folglich Ortsfrequenzen oberhalb von zehn Linien pro mm, sodass die kleinsten erkennbaren Details in dem gefilterten Bild im Bereich von 0.1 mm liegen werden. • Das Hochpassfilter ist das Gegenstück zum Tiefpassfilter. Es sperrt tiefe Frequenzen und lässt hohe Frequenzen durch. Als Maske kann eine klare Folie mit einem lichtundurchlässigen Kreis in der Mitte verwendet werden. Das gefilterte Signal ist dann in den Bereichen groß, in denen der Gegenstand sich schnell Gegenstand
(a)
(b)
(c)
Maske
Beispiele dieser Filter und ihrer Wirkung sind in Abb. 4.39 gezeigt.
4.4.3 Wellenoptische Beschreibung eines einlinsigen abbildenden Systems Als Nächstes wollen wir die Bildentstehung in dem einlinsigen System aus Abb. 4.40 wellenoptisch beschreiben. Zuerst bestimmen wir dazu die Impulsantwortfunktion und leiten dann die Übertragungsfunktion her. Beide Funktionen werden durch den Fokusfehler 𝜀 aus Gl. (4.52) und die Pupillenfunktion 𝑝(𝑥, 𝑦) (die Transmission der Blende in der Ebene der Linse) bestimmt. Die Pupillenfunktion spielt in diesem einlinsigen System dieselbe Rolle wie die Maskenfunktion in dem 4𝑓-System im letzten Abschnitt. Die Impulsantwortfunktion
Um die Impulsantwortfunktion des Systems zu bestimmen, betrachten wir einen Gegenstand, der nur aus eiBild
Abb. 4.39 Beispiele für Gegenstand, Maske und gefiltertes Bild für drei Ortsfilter: (a) Tiefpass, (b) Hochpass, (c) Vertikalpass. Dabei bedeutet schwarz eine Transmission von null und weiß eine Transmission von eins.
101
102
4 Fourieroptik
x
wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte der Funktion 1
𝑝1 (𝑥, 𝑦) = 𝑝(𝑥, 𝑦) exp (−iπ𝜀 2
U
U1
0 y
y GegenstandsLinse p(x,y) ebene Blendenebene
h(x,y) Bildebene x
Abb. 4.40 Einlinsiges abbildendes System.
nem einzigen Punkt (einem Impuls) am Ort (0, 0) auf der optischen Achse besteht, und verfolgen die optische Welle auf ihrem Weg zur Bildebene. Die resultierende komplexe Amplitude ist die Impulsantwortfunktion ℎ(𝑥, 𝑦). Ein Impuls in der Gegenstandsebene erzeugt in der Ebene der Blende eine Kugelwelle, die näherungsweise durch [siehe Gl. (4.18)] 𝑈(𝑥, 𝑦) ≈ ℎ1 exp [−i𝑘
𝑥2 + 𝑦 2 ], 2d 1
(4.57)
beschrieben werden kann, wobei ℎ1 = (i∕𝜆 d 1) exp(−i𝑘d 1) ist. Beim Durchgang durch die Blende und die Linse wird 𝑈(𝑥, 𝑦) mit der Pupillenfunktion 𝑝(𝑥, 𝑦) und dem quadratischen Phasenfaktor exp[i𝑘(𝑥2 + 𝑦 2 )∕2𝑓] der Linse multipliziert; das ergibt 𝑥2 + 𝑦 2 𝑈1 (𝑥, 𝑦) = 𝑈(𝑥, 𝑦) exp (i𝑘 ) 𝑝(𝑥, 𝑦) . 2𝑓
(4.58)
Das resultierende Feld 𝑈1 (𝑥, 𝑦) breitet sich dann im Vakuum über eine Entfernung d 2 aus. Gemäß Gl. (4.20) erzeugt es die Impulsantwortfunktion ∞
−∞
× exp [−iπ
(𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ] d𝑥′ d𝑦 ′ 𝜆d 2 (4.59)
mit ℎ2 = (i∕𝜆 d 2 ) exp(−i𝑘d 2 ). Durch Einsetzen der Gln. (4.57) und (4.58) in Gl. (4.59) und Ausdrücken der Integrale als Fouriertransformation erhalten wir ℎ(𝑥, 𝑦) = ℎ1 ℎ2 exp (−iπ
𝑥2 + 𝑦 2 𝑦 𝑥 , ), ) 𝑃1 ( 𝜆d 2 𝜆d 2 𝜆d 2 (4.60)
(4.61)
ist, die als verallgemeinerte Pupillenfunktion bekannt ist. Der Faktor 𝜀 ist der aus Gl. (4.52) bekannte Fokusfehler. Für ein hochwertiges Linsensystem ist die Impulsantwortfunktion eine sehr schmale Funktion, die sich nur über einen kleinen Wertebereich von 𝑥 und 𝑦 erstreckt. Wenn der Phasenfaktor π(𝑥2 + 𝑦 2 )∕𝜆 d 2 in Gl. (4.60) für alle 𝑥 und 𝑦 in diesem Bereich viel kleiner als eins ist, kann er vernachlässigt werden; dann gilt ℎ(𝑥, 𝑦) = ℎ0 𝑃1 (
𝑦 𝑥 , ), 𝜆d 2 𝜆d 2
(4.62)
wobei ℎ0 = ℎ1 ℎ2 eine Konstante in der Größenordnung (1∕𝜆 d 1 )(1∕𝜆 d 2 ) ist. Daraus folgt, dass die Impulsantwortfunktion des Systems proportional zur Fouriertransformierten der verallgemeinerten Pupillenfunktion 𝑝1 (𝑥, 𝑦) für die Ortsfrequenzen 𝜈𝑥 = 𝑥∕𝜆 d 2 und 𝜈𝑦 = 𝑦∕𝜆 d 2 ist. Wenn das System fokussiert ist (𝜀 = 0), ist 𝑝1 (𝑥, 𝑦) = 𝑝(𝑥, 𝑦) und ℎ(𝑥, 𝑦) ≈ ℎ0 𝑃 (
𝑦 𝑥 , ), 𝜆d 2 𝜆d 2
(4.63)
wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑝(𝑥, 𝑦) ist. Dieses Ergebnis ähnelt dem entsprechenden Resultat aus Gl. (4.56) für ein 4𝑓-System. Beispiel 4-8: Die Impulsantwortfunktion eines fokussierten abbildenden Systems mit einer kreisförmigen Blende
Wenn die Blende ein Kreis mit √ Durchmesser 𝐷 ist, sodass 𝑝(𝑥, 𝑦) = 1 für 𝜌 = 𝑥2 + 𝑦 2 ≤ 𝐷∕2 (und ansonsten null), dann ist die Impulsantwortfunktion ℎ(𝑥, 𝑦) = ℎ(0, 0)
ℎ(𝑥, 𝑦) = ℎ2 ∬ 𝑈1 (𝑥′ , 𝑦 ′ )
𝑥2 + 𝑦 2 ) 𝜆
√ 2𝐽1 (π𝐷𝜌∕𝜆 d 2 ) , 𝜌 = 𝑥2 + 𝑦 2 , (4.64) π𝐷𝜌∕𝜆 d 2
und es gilt |ℎ(0, 0)| = (π𝐷 2 ∕4𝜆 2 d 1 d 2 ). Diese Funktion ist rotationssymmetrisch; ihr Querschnitt ist in Abb. 4.41 gezeigt. Bei dem Radius 𝜌G = 1.22𝜆
d2
𝐷
(4.65)
fällt sie auf null ab, nachdem sie zuvor etwas oszilliert hat. Der Radius 𝜌G ist demzufolge ein Maß für die Größe des Unschärfekreises. Wenn das System auf unendlich fokussiert ist, ist d 1 = ∞, d 2 = 𝑓 und 𝜌G = 1.22𝜆𝐹# ,
(4.66)
4.4 Bildentstehung
x
Abb. 4.41 Impulsantwortfunktion eines abbildenden Systems mit einer kreisförmigen Blende.
1
h(x,y) 2
U
U1
0 y
y ρ
0
h(x,y)
D
ρs = 1.22 λ
2
D
x
wobei 𝐹# = 𝑓∕𝐷 die Blendenzahl der Linse ist. Systeme mit kleineren Blendenzahlen (größeren Öffnungen) besitzen daher eine höhere Abbildungsqualität – natürlich nur, sofern die größere Linse keine geometrischen Abbildungsfehler hervorruft. Übertragungsfunktion
Die Übertragungsfunktion eines linearen Systems kann nur definiert werden, wenn das System verschiebungsinvariant ist (siehe Anhang B). Ein einlinsiges abbildendes System ist offensichtlich nicht verschiebungsinvariant, da eine Verschiebung 𝛥 eines Punkts in der Gegenstandsebene von einer unterschiedlichen Verschiebung 𝑀𝛥 in der Bildebene begleitet wird, wobei 𝑀 = −d 2 ∕d 1 die Vergrößerung ist. Das Bild unterscheidet sich in zweierlei Hinsicht vom Gegenstand. Erstens ist das Bild eine vergrößerte Kopie des Gegenstands, d. h. ein Punkt (𝑥, 𝑦) des Gegenstands findet sich im Bild an einem neuen Punkt (𝑀𝑥, 𝑀𝑦) wieder. Zweitens ist jeder Punkt des Bildes aufgrund von Defokussierung oder Beugung zu einem kleinen Fleck verschmiert. Wir können uns die Bildentstehung somit als Hintereinanderschaltung von zwei verschiede-
nen Systemen vorstellen – einem ideal vergrößernden System und einem zweiten, Unschärfe erzeugenden System (Abb. 4.42). Das vergrößernde System ist grundsätzlich verschiebungsinvariant. Das Unschärfe erzeugende System ist für Punkte in der Nähe der optischen Achse näherungsweise verschiebungsinvariant und kann daher für diesen Fall durch eine Übertragungsfunktion beschrieben werden. Die Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) des Systems, das die Unschärfe erzeugt, ergibt sich aus der Fouriertransformierten der Impulsantwortfunktion ℎ(𝑥, 𝑦) in Gl. (4.62). Das Ergebnis ist H(𝜈𝑥 , 𝜈𝑦 ) ≈ 𝑝1 (𝜆 d 2 𝜈𝑥 , 𝜆 d 2 𝜈𝑦 ) ,
wobei 𝑝1 (𝑥, 𝑦) die verallgemeinerte Pupillenfunktion ist und wir einen konstanten Phasenfaktor exp(−i𝑘d 1 ) exp(−i𝑘d 2 ) vernachlässigt haben. Wenn das System fokussiert ist, ist H(𝜈𝑥 , 𝜈𝑦 ) ≈ 𝑝(𝜆 d 2 𝜈𝑥 , 𝜆 d 2 𝜈𝑦 ) ,
y y x
x
y
(b)
y
y x Vergrößerung
x Unschärfe
(4.68)
wobei 𝑝(𝑥, 𝑦) die Pupillenfunktion ist. Dieses Ergebnis ist identisch mit dem, das wir für das 4𝑓-System erhalten hatten [siehe Gl. (4.55)]. Wenn die Blendenöffnung
x
(a)
(4.67)
Abb. 4.42 Das abbildende System in (a) wird wie in (b) gezeigt als Kombination zweier separater Systeme betrachtet. Das erste, ideal abbildende System bewirkt nur eine Vergrößerung. Ihm folgt eine näherungsweise verschiebungsinvariante Erzeugung von Unschärfe, die jeden Punkt zu einem kleinen Fleck verschmiert, dessen Intensitätsverteilung durch die Impulsantwortfunktion gegeben ist.
103
104
4 Fourieroptik
x
Abb. 4.43 Die Übertragungsfunktion eines fokussierten abbildenden Systems mit einer kreisförmigen Blende des Durchmessers D. Die räumliche Bandbreite des Systems beträgt 𝜈R = D∕2𝜆d 2 .
1
(νx , νy)
2
U
U1
0
νR
y y h(x,y)
D
νx
νR
νy
x
beispielsweise ein Kreis mit Durchmesser 𝐷 ist, ist die Übertragungsfunktion innerhalb eines Kreises mit Radius 𝜈G =
𝐷 2𝜆 d 2
(4.69)
konstant und verschwindet außerhalb dieses Kreises, wie Abb. 4.43 zeigt. Wenn die Linse auf unendlich fokussiert ist, also d 2 = 𝑓 gilt, ist 𝜈G =
1 , 2𝜆𝐹#
(4.70)
wobei 𝐹# = 𝑓∕𝐷 die Blendenzahl der Linse ist. Für eine Linse mit 𝐹# = 𝑓∕𝐷 = 2 und 𝜆 = 0.5 μm ist beispielsweise 𝜈G = 500 Linien pro mm. Die Frequenz 𝜈G ist die räumliche Bandbreite, d. h. die größte Ortsfrequenz, die das abbildende System übertragen kann.
4.4.4 Abbildung im Nahfeld In Abschnitt 4.1.2 hatten wir gezeigt, dass die räumliche Bandbreite von Licht der Wellenlänge 𝜆 im Vakuum durch 𝜆 −1 gegeben ist. Wenn die Lichtverteilung eines Gegenstands Fourierkomponenten mit Ortsfrequenzen größer 𝜆 −1 enthält, entstehen evaneszente Wellen, die rasch abklingen und bereits in Abständen in der Größenordnung einer Wellenlänge von der Gegenstandsebene verschwinden, sodass Merkmale des Gegenstands, die kleiner als eine Wellenlänge sind, nicht übertragen werden können. Weiterhin hatten wir in Abschnitt 4.4.3 gesehen, dass ein abbildendes System mit einer Linse mit gegebener Blendenzahl 𝐹# eine Impulsantwortfunktion besitzt, deren Radius gleich 1.22𝜆𝐹# ist, sodass Punkte in einem Abstand von weniger als 1.22𝜆𝐹# nicht unterschieden werden können [siehe Abb. 4.44(a)]. Auch ein System, das wie in Abb. 4.44(b) gezeigt einen durch eine Linse fokussierten Laserstrahl zum Abtasten eines Gegenstands verwendet, verhält
sich ähnlich. Die Auflösung eines solchen Systems wird von der Größe des Brennflecks bestimmt, der – wie in Beispiel 4-8 gezeigt wurde – einen Radius von 1.22𝜆𝐹# besitzt. In beiden Fällen werden Merkmale des Gegenstands im abgetasteten Bild verwischt, wenn ihre Abmessungen kleiner als eine Wellenlänge sind. Diese grundsätzliche Grenze für das Auflösungsvermögen von abbildenden Systemen wird häufig als Beugungslimit bezeichnet. Das Beugungslimit kann jedoch umgangen werden. Licht kann in einer Ebene auf einen Fleck mit Abmessungen viel kleiner als eine Wellenlänge fokussiert werden. Die Schwierigkeit liegt darin, dass die evaneszenten Wellen schon in geringen Entfernungen von dieser Ebene vollständig abklingen und der Fleck daraufhin divergiert und deutlich größer als eine Wellenlänge wird. In noch größeren Entfernungen wird die Welle schließlich zu einer Kugelwelle. Folglich können wir das Beugungslimit umgehen, wenn wir den Gegenstand in die unmittelbare Umgebung des Flecks mit dem Durchmesser kleiner als eine Wellenlänge bringen, wo er beleuchtet werden kann, bevor der Strahldurchmesser ansteigt. In einer zur Abtastung geeigneten Anordnung kann das realisiert werden, indem wir den Lichtstrahl durch eine Öffnung treten lassen, deren Durchmesser wesentlich kleiner ist als eine Wellenlänge [siehe Abb. 4.44(c)]. Der Gegenstand wird in eine Entfernung von weniger als einer Wellenlänge von dieser Blende gebracht (in der Regel weniger als der halbe Durchmesser der Blendenöffnung), sodass der Strahl eine Fläche des Gegenstands mit einem Durchmesser von weniger als einer Wellenlänge beleuchtet. Nach dem Durchgang durch den Gegenstand bilden die Komponenten der Welle eine Kugelwelle, deren Amplitude proportional zur Transmission des Gegenstands an der beleuchteten Stelle ist. Die Auflösung dieses abbildenden Systems liegt daher in der Größenordnung der Blendenöffnung, die viel kleiner als die Wellenlänge ist. Das Bild wird erzeugt, indem man die beleuchtete Blende rasterartig über den Gegenstand
4.5 Holographie
Impulsantwort
λ
λ
Linse
Bild
λ Brennfleck
Linse Beleuchtung
Blende
Gegenstand
Beleuchtung
Gegenstand
Gegenstand (a)
(b)
Abb. 4.44 In einem einlinsigen abbildenden System werden Einzelheiten eines Gegenstands, deren Abmessungen unterhalb einer Wellenlänge liegen, im Bild verwischt. (a) Abbildung durch eine einzelne Linse, (b) durch einen fokussierten Laserscanner. (c) Ein Scanner, dessen Beleuchtung aus einer
führt und die optische Antwort mithilfe eines konventionellen abbildenden Systems im Fernfeld registriert. Die Methode ist unter der Bezeichnung optische Nahfeldmikroskopie (SNOM, nach engl. scanning near-field optical microscopy) bekannt. Sie gehört in den Bereich der Nanophotonik, da die Abbildung auf einer räumlichen Skala unter einer Wellenlänge erfolgt. Bei der SNOM schickt man das zur Beleuchtung verwendete Licht meist durch einen optischen Wellenleiter mit einer aluminiumbeschichteten Spitze wie in Abb. 4.45. Das Licht wird in dem Wellenleiter durch Totalreflexion geführt. Wenn der Durchmesser der Faser am Ende abnimmt, wird das Licht durch Reflexion an der metallischen Oberfläche geführt, die wie ein konischer Spiegel wirkt. Wenn der Durchmesser der Faser an der Spitze noch kleiner wird, kann die Welle nicht mehr geführt werden (siehe Abschnitt 9.1) und wird evaneszent. Die genaue Verteilung der Welle an der Spitze und dahinter ist komplex und kann nur numerisch bestimmt werden. In der SNOM mit sichtbarem Licht können Blendenöffnungen und damit räumliche Auflösungen in der Größenordnung von einigen zehn Nanometern erreicht werden. Da die Spitze des Wellenleiters in einem Abstand von wenigen Nanometern über das Objekt geführt werden muss, ist ein ausgefeiltes Steuerungssystem notwendig, um den Abstand bei einem Gegenstand mit beliebiger Topografie konstant zu halten. Zu den Anwendungen der SNOM gehören die zerstörungsfreie Untersuchung von anorganischen, organischen, biologischen und Verbundmaterialien sowie von Nanostrukturen.
(c)
Blende mit einem Durchmesser kleiner als eine Wellenlänge austritt, kann Details des Gegenstands auflösen, deren Abmessungen kleiner sind als eine Wellenlänge, sofern die Gegenstandsebene weniger als eine Wellenlänge von der Blendenebene entfernt ist. Gegenstand Metallbeschichtung einfallendes Licht
λ
Faserspitze Glasfaser
Abb. 4.45 Eine optische Faser mit einer metallbeschichteten Spitze für die optische Abbildung im Nahfeld.
4.5 Holographie Holographie bezeichnet die Speicherung und anschließende Rekonstruktion optischer Wellen. Ein Hologramm ist eine Folie mit einer codierten Aufzeichnung der optischen Welle einschließlich ihrer Amplitudenund Phaseneigenschaften. Wir betrachten als Beispiel eine monochromatische optische Welle, deren komplexe Amplitude in einer Ebene (beispielsweise der Ebene 𝑧 = 0) gleich 𝑈0 (𝑥, 𝑦) sein soll. Wenn wir nun auf irgendeine Weise ein dünnes optisches Element (eine Folie) mit der komplexen Amplitudentransmission t(𝑥, 𝑦) = 𝑈0 (𝑥, 𝑦) herstellen könnten, dann enthielte diese Folie eine vollständige Aufzeichnung der Welle. Zur Rekonstruktion der Welle müssten wir die Folie nur mit einer gleichförmigen ebenen Welle mit Einheitsamplitude bestrahlen, die sich in 𝑧-Richtung ausbreitet. Die durchgelassene Welle hätte dann in der Ebene 𝑧 = 0 die komplexe Amplitude 𝑈(𝑥, 𝑦) = 1 ⋅ t(𝑥, 𝑦) = 𝑈0 (𝑥, 𝑦). Somit hätten wir die ursprüngliche Welle an allen Punkten in der Ebene 𝑧 = 0 – und daher im kompletten Raum 𝑧 > 0 – vollständig rekonstruiert.
105
106
4 Fourieroptik
[Abb. 4.46(a)]. Die Transmission der Folie ist folglich
Als Beispiel wollen wir annehmen, dass eine gleichförmige ebene Welle, die sich in einem Winkel 𝜃 zur 𝑧-Achse in der 𝑥𝑧-Ebene ausbreitet, die komplexe Amplitude 𝑈0 (𝑥, 𝑦) = exp[−i𝑘𝑥 sin 𝜃] besitzt. Eine Aufzeichnung dieser Welle wäre eine Folie mit der komplexen Amplitudentransmission t(𝑥, 𝑦) = exp[−i𝑘𝑥 sin 𝜃]. Eine derartige Folie wirkt als Prisma, das eine einfallende ebene Welle exp(−i𝑘𝑧) um einen Winkel 𝜃 ablenkt (siehe Abschnitt 2.4.2) und so die ursprüngliche Welle reproduziert. Die Frage ist nun, wie wir mithilfe der ursprünglichen Welle 𝑈0 (𝑥, 𝑦) eine Folie t(𝑥, 𝑦) herstellen können. Ein wesentliches Hindernis ist dabei die Tatsache, dass optische Detektoren wie z. B. die lichtempfindlichen Emulsionen, die zur Herstellung von Folien verwendet werden, nur auf die optische Intensität |𝑈0 (𝑥, 𝑦)|2 reagieren und nicht auf die Phase arg{𝑈0 (𝑥, 𝑦)}. Die Phaseninformation ist aber offensichtlich wichtig und darf nicht verlorengehen. Wenn wir beispielsweise die Phase einer schiefwinkligen Welle 𝑈0 (𝑥, 𝑦) = exp[−i𝑘𝑥 sin 𝜃] nicht mit aufzeichnen, verlieren wir auch die Information über die Ausbreitungsrichtung der Welle. Um die Phase von 𝑈0 (𝑥, 𝑦) aufzeichnen zu können, benötigen wir eine Codierung, die die Phase in Intensität umwandelt. Dann könnten wir die aufgezeichnete Information optisch decodieren, um die Welle zu rekonstruieren.
t ∝ |𝑈0 + 𝑈R |2 = |𝑈R |2 + |𝑈0 |2 + 𝑈R∗ 𝑈0 + 𝑈R 𝑈0∗ , = 𝐼R + 𝐼0 + 𝑈R∗ 𝑈0 + 𝑈R 𝑈0∗ , √ = 𝐼R + 𝐼0 + 2 𝐼R 𝐼0 cos [arg{𝑈R } − arg{𝑈0 }] , (4.71) wobei 𝐼R und 𝐼0 die Intensitäten der Referenz- bzw. Gegenstandswelle in der Ebene 𝑧 = 0 bezeichnen. Diese Folie, die als Hologramm bezeichnet wird, enthält offensichtlich Informationen über Betrag und Phase der Welle 𝑈0 . Da sie ein Interferenzmuster ist, hängt die Transmission t sehr empfindlich von der Phasendifferenz der beiden Wellen ab, wie in Abschnitt 2.5 gezeigt wurde (das zeitliche Analogon zur Holographie ist das in Abschnitt 2.6 diskutierte Heterodyning). Wie bereits erwähnt, reagiert die konventionelle Fotografie nur auf die Intensität der einfallenden Welle und zeichnet keine Phaseninformation auf. Um die Informationen im Hologramm zu decodieren und die Gegenstandswelle zu rekonstruieren, wird das Hologramm wieder mit der Referenzwelle 𝑈R beleuchtet [Abb. 4.46(b)]. Das Resultat ist eine Welle mit der komplexen Amplitude 𝑈 = t𝑈R ∝ 𝑈R 𝐼R + 𝑈R 𝐼0 + 𝐼R 𝑈0 + 𝑈R2 𝑈0∗
in der Hologrammebene 𝑧 = 0. Der dritte Term auf der rechten Seite ist die Originalwelle multipliziert mit der Intensität 𝐼R der Referenzwelle. Wenn 𝐼R gleichförmig ist (nicht von 𝑥 und 𝑦 abhängt), ist das die gewünschte rekonstruierte Welle, die jedoch von den anderen Termen abgetrennt werden muss. Der vierte Term ist eine konjugierte Version der ursprünglichen Welle, die mit 𝑈R2 moduliert ist. Die ersten zwei Terme sind nichts anderes als die Referenzwelle, moduliert mit der Summe der Intensität der beiden Wellen.
4.5.1 Die holographische Codierung Die holographische Codierung beruht darauf, dass die ursprüngliche Welle (im Folgenden Gegenstandswelle genannt) 𝑈0 mit einer bekannten Referenzwelle 𝑈R überlagert und ihr Interferenzmuster in der Ebene 𝑧 = 0 aufgezeichnet wird. Die Intensität der Summe der beiden Wellen wird fotografisch registriert, und eine Folie mit der komplexen Amplitudentransmission t, die proportional zur Intensität ist, wird hergestellt
x
x
Referenz
Gegenstand
Referenz
z
z
Gegenstand
Hologramm
(a) Aufzeichnung
(4.72)
Hologramm (b) Rekonstruktion
Abb. 4.46 (a) Ein Hologramm ist eine Folie, auf der das Interferenzmuster zwischen der ursprünglichen Welle (Gegenstandswelle) und der Referenzwelle aufgezeichnet ist. (b) Die Gegenstandswelle kann rekonstruiert werden, indem man das Hologramm mit der Referenzwelle bestrahlt.
4.5 Holographie
Beispiel 4-10: Hologramm einer Punktlichtquelle
Wenn √ die Referenzwelle eine gleichförmige ebene Welle 𝐼R exp(−i𝑘𝑧) ist, die sich √ entlang der 𝑧-Achse ausbreitet, dann ist 𝑈𝑓 (𝑥, 𝑦) = 𝐼R in der Ebene 𝑧 = 0 eine von 𝑥 und 𝑦 unabhängige Konstante. Wenn wir √ Gl. (4.72) durch 𝑈R = 𝐼R dividieren, erhalten wir
In diesem Fall ist der Gegenstand eine Kugelwelle, die von dem Punkt r0 = (0, 0, −d ) ausgeht (Abb. 4.48), sodass 𝑈0 (𝑥, 𝑦) ∝ exp(−i𝑘|r − r0 |)∕|r − r0 | und r = (𝑥, 𝑦, 0) ist. Der erste Term in Gl. (4.73) entspricht einer ebenen Welle, die sich in 𝑧-Richtung ausbreitet, während der dritte proportional zur Amplitude der ursprünglichen Kugelwelle ist, die vom Punkt (0, 0, −d ) ausgeht. Der vierte Term ist proportional zur Amplitude der konjugierten Welle 𝑈0∗ (𝑥, 𝑦) ∝ exp(i𝑘|r − r0 |)∕|r − r0 |, die eine auf den Punkt (0, 0, d ) konvergierende Kugelwelle ist. Der zweite Term ist proportional zu 1∕|r − r0 |2 , die entsprechende Welle breitet sich folglich mit sehr geringer Winkeldivergenz in 𝑧-Richtung aus, da ihre Intensität in der transversalen Ebene langsam variiert.
√ √ 𝑈(𝑥, 𝑦) ∝ 𝐼R + 𝐼0 (𝑥, 𝑦) + 𝐼R 𝑈0 (𝑥, 𝑦) + 𝐼R 𝑈0∗ (𝑥, 𝑦) . (4.73) Im Folgenden wollen wir die Bedeutung der verschiedenen Terme in Gl. (4.73) und die Verfahren zur Abtrennung der ursprünglichen Welle (des dritten Terms) anhand einiger Beispiele veranschaulichen. Beispiel 4-9: Hologramm einer schiefwinkligen ebenen Welle
Wenn der Gegenstand eine in einem schiefen Winkel 𝜃 einfallende √ ebene Welle ist [Abb. 4.47(a)], ist 𝑈0 (𝑥, 𝑦) = 𝐼0 exp(−i𝑘𝑥√ sin 𝜃) und Gl. (4.73) + 𝐼 + 𝐼R 𝐼0 exp(−i𝑘𝑥 sin 𝜃) + liefert 𝑈(𝑥, 𝑦) ∝ 𝐼 R 0 √ 𝐼R 𝐼0 exp(−i𝑘𝑥 sin 𝜃). Da die beiden ersten Terme konstant sind, beschreiben sie eine Welle, die sich in 𝑧-Richtung ausbreitet (die Fortsetzung der Referenzwelle). Der dritte Term entspricht der ursprünglichen Gegenstandswelle, wohingegen der vierte Term die konjugierte Welle beschreibt, eine ebene Welle, die sich in einem Winkel −𝜃 ausbreitet. Somit ist die Gegenstandswelle von den anderen Wellen abtrennbar. Dieses Hologramm ist nichts weiter als eine Aufzeichnung des Interferenzmusters zwischen zwei schiefwinkligen ebenen Wellen in einem Winkel 𝜃 (Abschnitt 2.5.1). Es wirkt als sinusförmiges Beugungsgitter, das die einfallende Referenzwelle in drei Wellen unter den Winkeln 0, 𝜃 und −𝜃 aufspaltet [siehe Abb. 4.47(b) und Abschnitt 2.4.2].
4.5.2 Holographie außerhalb der optischen Achse Eine Methode zur Auftrennung der vier Komponenten der rekonstruierten Welle beruht darauf, dass man sicherstellt, dass sie mit deutlich unterschiedlichen Ortsfrequenzen variieren, sodass sie sich in deutlich voneinander getrennte Richtungen ausbreiten. Dieses Ortsfrequenzmultiplexing (siehe Abschnitt 4.1.1) funktioniert, wenn die Gegenstands- und Referenzwelle versetzt sind, sodass sie aus deutlich getrennten Richtungen eintreffen. Nun wollen wir den Fall betrachten, dass die Gegenstandswelle eine komplexe Amplitude 𝑈0 (𝑥, 𝑦) = 𝑓(𝑥, 𝑦) exp(−i𝑘𝑥 sin 𝜃) besitzt. Diese Welle hat die komplexe Einhüllende 𝑓(𝑥, 𝑦), die mit demselben Phasenfaktor moduliert ist, den auch ein Prisma mit einem Ablenkungswinkel 𝜃 hervorruft. Wir nehmen an, dass 𝑓(𝑥, 𝑦) nur langsam variiert, sodass seine maximale −1 Ortsfrequenz 𝜈R einem Winkel 𝜃R = sin 𝜆𝜈R ≪ 𝜃 ent-
x
Gegenstand
x
Referenz
Referenz
z
z
Hologramm Gegenstand
(a) Aufzeichnung
Hologramm Konjugierte
(b) Rekonstruktion
Abb. 4.47 Das Hologramm einer schiefwinkligen ebenen Welle ist ein sinusförmiges Beugungsgitter.
107
108
4 Fourieroptik
x
x Referenz
Gegenstand
Referenz Konjugierte
z
Gegenstand
Hologramm
z
Hologramm
(a) Aufzeichnung
(b) Rekonstruktion
spricht. Die Richtungen der Gegenstandswelle liegen demzufolge um den Winkel 𝜃 verteilt, wie Abb. 4.49 illustriert. Gleichung (4.73) ergibt √ 𝑈(𝑥, 𝑦) ∝ 𝐼R + |𝑓(𝑥, 𝑦)|2 + 𝐼R 𝑓(𝑥, 𝑦) exp(−i𝑘𝑥 sin 𝜃) √ (4.74) + 𝐼R 𝑓 ∗ (𝑥, 𝑦) exp(+i𝑘𝑥 sin 𝜃) . Der dritte Term ist offensichtlich eine Kopie der Gegenstandswelle, die aus der Richtung 𝜃 ankommt. Der Phasenfaktor exp(+i𝑘𝑥 sin 𝜃) im vierten Term zeigt, das sie in die Richtung −𝜃 abgelenkt wird. Der erste Term entspricht einer ebenen Welle, die sich in 𝑧-Richtung ausbreitet. Der zweite Term, der meist als Mehrdeutigkeitsterm bezeichnet wird, entspricht einer nichtgleichförmigen ebenen Welle in Richtungen innerhalb eines Kegels mit dem kleinen Öffnungswinkel 2𝜃R um die 𝑧-Richtung. Die unterschiedlichen Richtungen der Gegenstands- und Referenzwellen führt zu einer automatischen Winkelseparation der Gegenstands- und konjugierten Wellen voneinander und von den anderen beiden Wellen, sofern 𝜃 > 3𝜃R ist. Damit ist es möglich, die ursprüngliche Welle eindeutig zurückzuerhalten. Eine andere Methode, den Effekt der Mehrdeutigkeitswelle zu verringern, besteht darin, die Intensität der Referenzwelle viel größer als die der Gegenstandswelle zu wählen. Die Mehrdeutigkeitswelle [der zweite Term in Gl. (4.73)] ist dann viel kleiner als die anderen Terme,
da er Anteile der Gegenstandswelle enthält; er kann daher relativ zu ihnen vernachlässigt werden.
4.5.3
Fouriertransformations-Holographie
Die Fouriertransformierte 𝐹(𝜈𝑥 , 𝜈𝑦 ) einer Funktion 𝑓(𝑥, 𝑦) kann mithilfe einer Linse optisch ermittelt werden (siehe Abschnitt 4.2). Wenn 𝑓(𝑥, 𝑦) die komplexe Amplitude in einer Brennebene der Linse ist, dann ist 𝐹(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) die komplexe Amplitude in der anderen Brennebene, wenn 𝑓 die Brennweite der Linse ist und und 𝜆 die Wellenlänge. Da die Fouriertransformierte in der Regel eine komplexe Funktion ist, kann sie nicht direkt aufgezeichnet werden. Die Fouriertransformierte 𝐹(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) kann jedoch holographisch aufgezeichnet werden, indem man sie als Gegenstandswelle der Form 𝑈0 (𝑥, 𝑦) = 𝑓(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) betrachtet, mit einer Referenzwelle 𝑈R (𝑥, 𝑦) überlagert und die Überlagerung als Hologramm registriert [Abb. 4.50(a)]. Die Rekonstruktion wird wie üblich erreicht, indem man das Hologramm wieder mit der Referenzwelle bestrahlt. Aus der rekonstruierten Welle kann dann mithilfe einer Linse die inverse Fouriertransformierte berechnet werden, sodass man wieder die ursprüngliche Funktion 𝑓(𝑥, 𝑦) erhält [Abb. 4.50(b)]. Abb. 4.49 Hologramm einer Gegenstandswelle außerhalb der optischen Achse. Die Gegenstandswelle ist sowohl von der Referenz- als auch von der konjugierten Welle getrennt.
Gegenstand x
θ
x
Referenz
Referenz
Mehrdeutigkeit
z
θ
Hologramm
z
Hologramm
θ
Gegenstand (a) Aufzeichnung
Abb. 4.48 Hologramm einer Kugelwelle, die von einer Punktquelle ausgeht. Die konjugierte Welle bildet ein reelles Bild des Punkts.
(b) Rekonstruktion
Konjugierte
4.5 Holographie
Abb. 4.50 (a) Hologramm einer Welle, deren komplexe Amplitude die Fouriertransformierte einer Funktion f (x, y ) ist. (b) Rekonstruktion von f (x, y ) mithilfe einer fouriertransformierenden Linse.
f
UR
UR F Hologramm
F F* Hologramm
f (a) Aufzeichnung
(b) Rekonstruktion
4.5.4 Holographische Ortsfilter Um ein Ortsfilter mit der Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) zu realisieren, kann man ein 4𝑓-System mit einer Maske der komplexen Amplitudentransmission 𝑝(𝑥, 𝑦) = H(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) in der Fourierebene (siehe Abschnitt 4.4.2) einsetzen. Da die Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) normalerweise komplex ist, enthält die Transmission 𝑝(𝑥, 𝑦) der Maske eine Phasenkomponente und ist daher durch konventionelle Verfahren schwierig herzustellen. Wenn die Impulsantwortfunktion ℎ(𝑥, 𝑦) des Filters jedoch reell ist, kann man ein FT-Hologramm von ℎ(𝑥, 𝑦) erzeugen, indem man die Fouriertransformierte 𝑈0 (𝑥, 𝑦) = H(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) holographisch aufzeichnet. Mit der Fouriertransformierten 𝑈R (𝑥, 𝑦) = 𝐹(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) der ursprünglichen Funktion 𝑓(𝑥, 𝑦) als Referenzwelle liefert das Hologramm die Welle 𝑈R (𝑥, 𝑦)𝑈0 (𝑥, 𝑦) = 𝐹(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓)H(𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) . (4.75) Die inverse Fouriertransformierte der rekonstruierten Gegenstandswelle, die man wie in Abb. 4.51(b) gezeigt mit einer Linse der Brennweite 𝑓 erhält, ergibt daher die komplexe Amplitude 𝑔(𝑥, 𝑦) mit der Fouriertransformierten 𝐺(𝜈𝑥 , 𝜈𝑦 ) = H(𝜈𝑥 , 𝜈𝑦 )𝐹(𝜈𝑥 , 𝜈𝑦 ). Folglich ist
𝑔(𝑥, 𝑦) die Faltung von 𝑓(𝑥, 𝑦) mit ℎ(𝑥, 𝑦). Das Gesamtsystem, das sogenannte VanderLugt-Filter, führt die Faltungsoperation durch, die die Grundlage der räumlichen Filterung ist. Wenn stattdessen die inverse Fouriertransformierte der konjugierten Welle 𝑈R (𝑥, 𝑦)𝑈0∗ (𝑥, 𝑦) = 𝐹(𝑥∕𝜆𝑓, ∗ 𝑦∕𝜆𝑓)H (𝑥∕𝜆𝑓, 𝑦∕𝜆𝑓) gebildet wird, erhält man die Korrelation anstelle der Faltung der Funktionen 𝑓(𝑥, 𝑦) und ℎ(𝑥, 𝑦). Die Korrelation ist in Anwendungen zur Bildverarbeitung wie beispielsweise bei der Mustererkennung nützlich.
4.5.5 Die holographische Apparatur Eine notwendige Bedingung für die erfolgreiche Herstellung von Hologrammen ist die Verfügbarkeit einer monochromatischen Lichtquelle mit minimalen Phasenfluktuationen. Das Vorhandensein von Phasenfluktuationen führt zu zufälligen Veränderungen des Interferenzmusters und zum Verwischen des Hologramms. Aus diesem Grund ist eine kohärente Lichtquelle (normalerweise ein Laser) ein zwingender Bestandteil der verwendeten Apparatur. Die Kohärenzanforderungen für die Interferenz der Lichtwellen werden in Kapitel 12 besprochen.
g(x,y)
f (x,y) UR
Hologramm
Hologramm
h(x,y)
(a) Aufzeichnung
(b) Rekonstruktion
Abb. 4.51 Das holographische VanderLugt-Filter. (a) Ein Hologramm der Fouriertransformierten von h(x, y ) wird aufgezeichnet. (b) Die Fouriertransformierte von f (x, y ) wird durch das Hologramm gelenkt und durch eine Linse wird die inverse Fouriertransformierte gebildet. Das Ergebnis ist eine Funktion g(x, y ), die proportional zur Faltung von f (x, y ) und h(x, y ) ist. Der Gesamtprozess ist ein Ortsfilter mit der Impulsantwortfunktion h(x, y ).
109
110
4 Fourieroptik
Laser Referenz
Laser Referenz Gegenstand
Hologramm Hologramm
Gegenstand (a) Aufzeichnung
(b) Rekonstruktion
Abb. 4.52 (a) Holographische Aufnahme und (b) Rekonstruktion.
Abbildung 4.52 veranschaulicht eine typische experimentelle Anordnung zur Aufnahme eines Hologramms und zur Rekonstruktion der an der Oberfläche eines Gegenstands gestreuten optischen Welle. Mit einem Strahlteiler wird das Laserlicht in zwei Teile aufgespaltet; einer davon wird als Referenzwelle verwendet, während der andere an dem Gegenstand gestreut wird und die Gegenstandswelle bildet. Die Differenz der optischen Weglängen der beiden Wellen sollte so klein wie möglich sein, um sicherzugehen, dass zwischen den beiden Lichtstrahlen weiterhin eine Phasenbeziehung besteht [der Term arg{𝑈R } − arg{𝑈0 } in Gl. (4.71)]. Da das Interferenzmuster des Hologramms aus feinen Linien besteht, die durch Abstände in der Größenordnung von 𝜆∕ sin 𝜃 getrennt sind, wenn 𝜃 der Winkel zwischen Referenz- und Gegenstandswelle ist, muss der fotografische Film ein hohes Auflösungsvermögen besitzen und das System darf während der Belichtung nicht vibrieren. Je größer 𝜃 ist, desto kleiner sind die Abstände zwischen den Linien des Hologramms und desto zwingender sind diese Bedingungen. Wenn das aufgezeichnete Hologramm mit der Referenzwelle beleuchtet wird, wird die Gegenstandswelle rekonstruiert, sodass ein Beobachter den Gegenstand sieht, als ob er wirklich an dieser Stelle wäre – einschließlich seines dreidimensionalen Aufbaus.
4.5.6 Volumenholographie Bis jetzt haben wir angenommen, dass das Hologramm eine dünne ebene Folie ist, auf der das Interferenzmuster der Gegenstands- und Referenzwellen aufgezeichnet wird. Nun wollen wir den Fall untersuchen, dass das Hologramm in einem relativ dicken Medium aufgezeichnet wird; dabei werden wir zeigen, dass diese Vorgehensweise einen Vorteil bietet. Dazu betrachten wir den einfachen Fall, dass die Gegenstands- und die Referenzwelle ebene Wellen mit den Wellenvektoren kR und k0 sind. Das Aufzeichnungsmedium erstreckt sich zwischen den Ebenen 𝑧 = 0 und 𝑧 = 𝛥, wie in Abb. 4.53 gezeigt. Das
Interferenzmuster ist nun eine Funktion von 𝑥, 𝑦 und 𝑧: √ |√ |2 𝐼(𝑥, 𝑦, 𝑧) = ||| 𝐼R exp(−ikR ⋅ r) + 𝐼0 exp(−ik0 ⋅ r)||| | | √ = 𝐼R + 𝐼0 + 2 𝐼R 𝐼0 cos(k0 ⋅ r − kR ⋅ r) √ (4.76) = 𝐼R + 𝐼0 + 2 𝐼R 𝐼0 cos(kG ⋅ r) , wobei kG = k0 − kR ist. Diese Funktion beschreibt ein sinusförmiges Muster mit der Periode 𝛬 = 2π∕|kG |, dessen Flächen konstanter Intensität senkrecht auf dem Vektor kG stehen. Wenn sich die Referenzwelle beispielsweise in 𝑧-Richtung ausbreitet und die Gegenstandswelle einen Winkel 𝜃 mit der 𝑧-Achse einschließt, ist |kG | = 2𝑘 sin(𝜃∕2), und die Periode wird 𝛬=
𝜆 , 2 sin(𝜃∕2)
(4.77)
wie Abb. 4.53 zeigt. Wenn dieses Muster in einer lichtempfindlichen Emulsion aufgezeichnet wird, kann es als dickes Beugungsgitter wirken, als Volumenhologramm. Der Vektor kG heißt Gittervektor. Bei Bestrahlung mit der Referenzwelle wie in Abb. 4.54 reflektieren die parallelen Ebenen des Gitters die Welle nur dann, wenn die Braggbedingung sin 𝜙 = 𝜆∕2𝛬 erfüllt ist, wobei 𝜙 der Winkel zwischen den Ebenen des Gitters und der einfallenden Referenzwelle ist [siehe Übung (2-11)]. Im vorliegenden Fall ist 𝜙 = 𝜃∕2, sodass sin(𝜃∕2) = 𝜆∕2𝛬 gilt. Wegen Gl. (4.77) ist die Braggbedingung tatsächlich erfüllt, sodass die Referenzwelle reflektiert wird. Wie aus der geometrischen Anordnung offensichtlich ist, ist die reflektierte Welle die Verlängerung der Gegenstandswelle, sodass die Rekonstruktion erfolgreich ist. Nehmen Sie nun an, dass das Hologramm mit einer Referenzwelle einer anderen Wellenlänge 𝜆 ′ beleuchtet wird. Offensichtlich ist die Braggbedingung sin(𝜃∕2) = 𝜆 ′ ∕2𝛬 nun nicht erfüllt und die Welle wird nicht reflektiert. Die Gegenstandswelle wird also nur rekonstruiert, wenn die Wellenlänge der zur Rekonstruktion verwen-
4.5 Holographie
x λ kG z θ
Abb. 4.53 Das Interferenzmuster für den Fall, dass Referenz- und Gegenstandswelle ebene Wellen sind. Da |kR | = |k0 | = 2π∕𝜆 und |kG | = 2π∕𝛬 ist, folgt aus dem Vektordiagramm 2π∕𝛬 = 2(2π∕𝜆) sin(𝜃∕2) und somit 𝛬 = 𝜆∕2 sin(𝜃∕2).
kR θ/2 θ/2 k0
Λ Δ x
Abb. 4.54 Die Referenzwelle wird an dem dicken Hologramm reflektiert und die Gegenstandswelle wird rekonstruiert.
λ θ z
Λ
θ/2
deten Lichtquelle mit der der Lichtquelle bei der Aufzeichnung übereinstimmt. Wenn Licht mit einem breiten Spektrum von Wellenlängen (weißes Licht) zur Rekonstruktion verwendet wird, wird nur die „richtige“ Wellenlänge reflektiert und die Rekonstruktion ist erfolgreich. Obwohl die Aufzeichnung mit monochromatischem Licht erfolgen muss, kann die Rekonstruktion mit weißen Licht erreicht werden. In vielen holographischen Anwendungen ist das ein entscheidender Vorteil. Abbildung 4.55 zeigt andere mögliche Anordnungen für die Rekonstruktion eines Volumenhologramms. Eine andere Art von Hologramm, die unter weißem Licht betrachtet werden kann, ist das Regenbogenhologramm. Es wird durch einen schmalen Spalt aufgezeichnet, sodass das rekonstruierte Bild ebenfalls so
wirkt, als würde man es durch einen schmalen Spalt betrachten. Wenn die bei der Rekonstruktion verwendete Wellenlänge sich jedoch von der Wellenlänge bei der Aufzeichnung unterscheidet, wird das rekonstruierte Bild so erscheinen, als betrachte man es durch einen versetzten Spalt, da ein zusätzlicher Vergrößerungseffekt auftritt. Wenn die Rekonstruktion mit weißem Licht erfolgt, zeigt das rekonstruierte Bild den Gegenstand wie durch viele versetzte Spalte betrachtet, wobei jedes Teilbild eine andere Wellenlänge (Farbe) besitzt. Das Ergebnis ist ein Regenbogen von Bildern, durch parallele Spalte betrachtet. Jeder Spalt zeigt den Gegenstand mit einer Parallaxe in Richtung des Spalts, aber nicht in der dazu senkrechten Richtung. Regenbogenhologramme besitzen zahlreichen Anwendungen als Anzeigeelemente.
Ge
Referenz
Ge
ns ge
ns ge
Referenz
d tan
Referenz
ta ns ge Ge
Referenz
nd
(a) Durchlichthologramm
Ge
ta ns ge
nd
(b) Auflichthologramm
d tan
Abb. 4.55 Zwei Anordnungen für die Aufzeichnung und die Rekonstruktion eines Volumenhologramms. (a) Bei der Aufzeichnung dieses Hologramms kommen die Referenz- und die Gegenstandswelle von derselben Seite; seine Rekonstruktion erfolgt durch eine umgekehrte Referenzwelle. Die rekonstruierte Welle ist eine konjugierte Welle, die sich in entgegengesetzter Richtung zur ursprünglichen Gegenstandswelle ausbreitet. (b) Bei der Aufzeichnung eines Auflichthologramms kommen Referenz- und Gegenstandswelle von entgegengesetzten Seiten; die Rekonstruktion erfolgt durch Reflexion an den Gitterebenen.
111
112
4 Fourieroptik
y
Computergenerierte Hologramme
Ein computergeneriertes Hologramm ist ein Hologramm eines Gegenstands, der physisch nicht existiert. Das Hologramm wird durch Berechnung und anschließende digitale Aufzeichnung des Interferenzmusters einer Referenzwelle mit einer mathematisch definierten Welle erzeugt, die das von einem bestimmten virtuellen Objekt gestreute Licht repräsentiert. Das Hologramm kann eine Maske, ein Film oder ein räumlicher Lichtmodulator sein; wenn es mit der Referenzwelle beleuchtet wird, erzeugt es die gewünschte Gegenstandswelle. Die computergenerierte Holographie ist vor allem auf 3D-Visualisierung ausgerichtet und wird beispielsweise in Anwendungen wie CAD (Computer Aided Design), Computerspielen und Bildausgaben eingesetzt. Eine wichtige Anwendung ist die Erzeugung holographischer optischer Bauelemente (HOE). Ein Beispiel ist das in Beispiel 4-10 beschriebene Hologramm einer Punktquelle, das als Linse wirkt. Wie Beispiel 4-11 zeigt, kann durch Berechnung des entsprechenden Interferenzmusters im Computer und anschließende digitale Aufzeichnung ein HOE hergestellt werden, das eine ebene Welle in andere optische Strahlen mit einer mathematisch definierten komplexen Amplitude wie z. B. einen Hermite-Gauß-, Laguerre-Gauß-, Bessel- oder Airystrahl umwandelt (siehe die Abschnitte 3.4 und 3.5).
y
x
l =1
l =2
Aufgaben Aufgabe 4-1: Korrespondenz zwischen harmonischen Funktionen und ebenen Wellen
Die komplexen Amplituden einer monochromatischen Welle der Wellenlänge 𝜆 in den Ebenen 𝑧 = 0 und 𝑧 = d seien 𝑓(𝑥, 𝑦) und 𝑔(𝑥, 𝑦). Nehmen Sie d = 104 𝜆 an und bestimmen Sie mithilfe einer harmonischen Analyse 𝑔(𝑥, 𝑦) für die folgenden Fälle: (a) 𝑓(𝑥, 𝑦) = 1, (b) 𝑓(𝑥, 𝑦) = exp[(−iπ∕𝜆)(𝑥 + 𝑦)], (c) 𝑓(𝑥, 𝑦) = cos(π𝑥∕2𝜆), (d) 𝑓(𝑥, 𝑦) = cos2 (π𝑦∕2𝜆), ∑ (e) 𝑓(𝑥, 𝑦) = 𝑚 rect[(𝑥∕10𝜆) − 2𝑚], 𝑚 = 0, ±1, ±2, …, 1 wobei rect(𝑥) = 1 für |𝑥| ≤ und ansonsten 0 ist. Be2 schreiben Sie die Wellen jeweils physikalisch. Aufgabe 4-2: Kegelwinkel
Wir stellen uns die Aufgabe, ein HOE herzustellen, das eine ebene Referenzwelle in eine Objektwelle mit Spiralphase und der komplexen Amplitude 𝑈0 = exp(−i𝑙𝜙) in der Ebene 𝑧 = 0 umwandelt. Dabei ist 𝜙 = arctan(𝑦∕𝑥) der Azimutwinkel [siehe Abb. 3.24(b)] und 𝑙 = 1, 2,. . . ist die topologische Ladung des zugehörigen optischen Wirbels (siehe Abschnitt 3.4). Die Wahl einer ebenen Referenzwelle, die sich in der 𝑥𝑧Ebene unter einem Winkel 𝜃 zur 𝑧-Achse ausbreitet (siehe Abb. 2.25), führt zu 𝑈R = exp(−i𝑘0 sin 𝜃𝑥) in der Ebene 𝑧 = 0. Mithilfe von Gl. (4.71) ergibt sich für das Interferenzmuster
Aufgabe 4-3: Logarithmische Verbindungskarte
(4.78)
mit 𝜙 = arctan(𝑦∕𝑥) und 𝛬 = 𝜆0 ∕ sin 𝜃. Die resultierenden Hologramme haben die Form von vertikalen sinusförmigen Streifen der Periode 𝛬 mit Versetzungen in der Umgebung von 𝑥 = 0, wie Abb. 4.56 zeigt. Durch Bestrahlen des aufgezeichneten Hologramms mit der Referenzwelle wird eine Welle mit einer helikalen Wellenfront, einer Spiralphase und dem entsprechenden Wert von 𝑙 erzeugt.
l =3
Abb. 4.56 Computererzeugte holographische optische Bauelemente zur Erzeugung einer Spiralphase in einer ebenen Welle für drei Werte von l.
Beispiel 4-11: Ein holographisches Bauelement zur Erzeugung einer Welle mit Spiralphase
𝐼(𝑥, 𝑦) = 2 + 2 cos(2π𝑥∕𝛬 − 𝑙𝜙)
y
Nehmen Sie an, dass 𝑓(𝑥, 𝑦) in Aufgabe 4-1 eine rotationssymmetrische Funktion mit einer maximalen Ortsfrequenz von 200 Linien pro mm ist und bestimmen Sie den Kegelwinkel, in dem die Ausbreitungsrichtungen der Wellen liegen. Verwenden Sie 𝜆 = 633 nm.
Eine Folie mit der Amplitudentransmission t(𝑥, 𝑦) = exp[−i2π 𝜙(𝑥)] wird mit einer gleichförmigen ebenen Welle der Wellenlänge 𝜆 = 1 μm beleuchtet. Das durchgelassene Licht wird von einer Linse der Brennweite 𝑓 = 100 cm fokussiert. Wie muss 𝜙(𝑥) gewählt werden, damit ein Strahl, der an der Position 𝑥 auf der Folie auftrifft, abgelenkt und für alle 𝑥 > 0 auf die Position 𝑥′ = ln(𝑥) fokussiert wird (𝑥 und 𝑥′ werden in mm gemessen)? Wie muss 𝜙(𝑥) verändert werden, damit das System nach Entfernung der Linse dieselbe Funktion erfüllt? Mithilfe eines derartigen Systems kann eine logarithmische Koordinatentransformation durchgeführt werden, wie in Kapitel 24 ausführlicher erläutert wird.
Aufgaben
Aufgabe 4-4: Beweis der FT-Eigenschaft einer Linse
(a) Zeigen Sie, dass man die Faltung von 𝑓(𝑥) und exp(−iπ𝑥2 ∕𝜆 d ) in drei Schritten erhalten kann: Multiplikation von 𝑓(𝑥) mit exp(−iπ𝑥2 ∕𝜆 d ); Berechnung der Fouriertransformierten des Produkts bei der Frequenz 𝜈𝑥 = 𝑥∕𝜆 d ; Multiplikation des Ergebnisses mit exp(−iπ𝑥2 ∕𝜆 d ). (b) Das fouriertransformierende System in Abb. 4.22 besteht aus einer Kaskade von drei einzelnen Systemen – Ausbreitung über eine Entfernung 𝑓 im Vakuum, Durchgang durch eine Linse der Brennweite 𝑓 und Ausbreitung über eine Entfernung 𝑓 im Vakuum. Erinnern Sie sich daran, dass die Ausbreitung über eine Strecke d im Vakuum zu einer Faltung mit exp(−iπ𝑥2 ∕𝜆 d ) äquivalent ist [siehe Gl. (4.20)] und verwenden Sie das Ergebnis aus (a), um die FTGleichung (4.29) der Linse herzuleiten. Ignorieren Sie der Einfachheit halber die 𝑦-Abhängigkeit. Aufgabe 4-5: Fouriertransformation von Linienfunktionen
Eine Folie mit der Amplitudentransmission t(𝑥, 𝑦) wird mit einer ebenen Welle der Wellenlänge 𝜆 = 1 μm beleuchtet und mit einer Linse der Brennweite 𝑓 = 100 cm fokussiert. Skizzieren Sie die Intensitätsverteilung in der Ebene der Folie und der Brennebene der Linse für die folgenden Fälle (alle Entfernungen in mm): (a) t(𝑥, 𝑦) = 𝛿(𝑥 − 𝑦), (b) t(𝑥, 𝑦) = 𝛿(𝑥 + 𝑎) + 𝛿(𝑥 − 𝑎), 𝑎 = 1 mm, (c) t(𝑥, 𝑦) = 𝛿(𝑥 + 𝑎) + i𝛿(𝑥 − 𝑎), 𝑎 = 1 mm. 𝛿(⋅) ist die Deltafunktion (siehe Abschnitt A.1). Aufgabe 4-6: Entwurf eines Systems zur optischen Fouriertransformation
Die Fouriertransformierte einer zweidimensionalen Funktion mit Ortsfrequenzen von 20 bis 200 Linien pro mm soll mithilfe einer Linse erzeugt werden. Welche Brennweite muss die Linse besitzen, damit die kleinsten und die größten Ortsfrequenzen in der Fourierebene durch einen Abstand von 9 cm getrennt sind, wenn die Wellenlänge des Licht 𝜆 = 488 nm beträgt? Aufgabe 4-7: Erzeugung eines Airystrahls mithilfe eines optischen FT-Systems
Wie in Abschnitt 3.5.2 diskutiert hat ein Airystrahl eine Amplitude 𝐴(𝑥, 0) = Ai(𝑥∕𝑊0 ) in der Ebene 𝑧 = 0, wobei Ai(𝑥) die Airyfunktion ist und 𝑊0 ein Maß für die Strahlbreite. Nehmen Sie an, dass die Fouriertransformation der Phasenfunktion exp(i𝑥3 ∕3) gleich 2π Ai(2π𝜈𝑥 ) ist, und entwerfen Sie ein optisches FTSystem, das mithilfe einer Linse der Brennweite 𝑓 und einer Maske mit der Amplitudentransmission exp(i𝑥3 ∕3) einen Airystrahl erzeugt. Geben Sie einen Ausdruck für 𝑊0 des erzeugten Strahls als Funktion von 𝑓 und der Wellenlänge 𝜆 an.
Aufgabe 4-8: Fraunhoferbeugung an einem Beugungsgitter
Geben Sie einen Ausdruck für das Fraunhofer-Beugungsmuster einer Blende an, die aus 𝑀 = 2𝐿 + 1 parallelen Spalten mit infinitesimaler Breite in konstanten Abständen von 𝑎 = 10𝜆 besteht, 𝑝(𝑥, 𝑦) =
𝐿 ∑
𝛿(𝑥 − 𝑚𝑎) .
(4.79)
𝑚 = −𝐿
Skizzieren Sie das Muster als Funktion des Beobachtungswinkels 𝜃 = 𝑥∕d , wenn d der Beobachtungsabstand ist. Aufgabe 4-9: Fraunhoferbeugung einer schief einfallenden Welle
Das Beugungsmuster einer Blende mit der Blendenfunktion 𝑝(𝑥, 𝑦) ist proportional zu |𝑃(𝑥∕𝜆 d , 𝑦∕𝜆 d )|2 , wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑝(𝑥, 𝑦) ist und d die Entfernung zwischen Blende und Beobachtungsebene. Welche Form hat das Beugungsmuster, wenn die in der 𝑥𝑧-Ebene einfallende Welle einen kleinen Winkel 𝜃𝑥 ≪ 1 mit der 𝑧-Achse einschließt? Aufgabe 4-10: Fresnelbeugung an einer Doppellochblende
Zeigen Sie, dass das Fresnel-Beugungsmuster an einer Doppellochblende mit einem Lochabstand von 2𝑎 [also 𝑝(𝑥, 𝑦) = [𝛿(𝑥 − 𝑎) + 𝛿(𝑥 + 𝑎)]𝛿(𝑦)] in einem Beobachtungsabstand d durch die periodische Funktion 𝐼(𝑥, 𝑦) = (2∕𝜆 d )2 cos2 (2π 𝑎𝑥∕𝜆 d ) gegeben ist. Aufgabe 4-11: Die Beziehung zwischen Fresnel- und Fraunhoferbeugung
Zeigen Sie, dass das Fresnel-Beugungsmuster der Blendenfunktion 𝑝(𝑥, 𝑦) gleich dem Fraunhofer-Beugungsmuster der Blendenfunktion 𝑝(𝑥, 𝑦) exp[−iπ(𝑥2 + 𝑦 2 )∕𝜆 d ] ist. Aufgabe 4-12: Unschärfe eines sinusförmigen Gitters
Ein Gegenstand 𝑓(𝑥, 𝑦) = cos2 (2π 𝑥∕𝑎) wird durch ein defokussiertes einlinsiges System abgebildet, für dessen Impulsantwortfunktion innerhalb eines Quadrats mit der Seitenlänge 𝐷 ℎ(𝑥, 𝑦) = 1 gilt und die außerhalb dieses Quadrats verschwindet. Geben Sie einen Ausdruck für die Intensitätsverteilung 𝑔(𝑥, 0) des Bildes in 𝑥-Richtung an. Leiten Sie eine Gleichung für den Kontrast des Bildes als Funktion des Verhältnisses 𝐷∕𝑎 her. Der Kontrast ist als (max − min)∕(max + min) definiert, wobei max und min die Maximal- bzw. Minimalwerte von 𝑔(𝑥, 0) sind.
113
114
4 Fourieroptik
Aufgabe 4-13: Bild eines Phasenobjekts
Aufgabe 4-17: Auflösung zweier Punkte
Ein abbildendes System besitzt die Impulsantwortfunktion ℎ(𝑥, 𝑦) = rect(𝑥)𝛿(𝑦). Bestimmen und skizzieren Sie die Intensität |𝑔(𝑥, 𝑦)|2 des Ausgangssignals 𝑔(𝑥, 𝑦) für das Eingangssignal
(a) Betrachten Sie das einlinsige System aus Abschnitt 4.4.3. Geben Sie für eine quadratische Öffnung der Breite 𝐷, eine Vergrößerung von eins und ideale Fokussierung einen Ausdruck für die Impulsantwortfunktion ℎ(𝑥, 𝑦) an. (b) Bestimmen Sie die Antwort des Systems auf einen Gegenstand, der aus zwei Punkten in einem Abstand 𝑏 besteht, d. h.
( π) für 𝑥 > 0 , ⎧ exp i 2 𝑓(𝑥, 𝑦) = ( π) ⎨ für 𝑥 ≤ 0 . exp −i ⎩ 2
(4.80)
Verifizieren Sie, dass die Intensität des Ausgangssignals nicht gleichförmig ist, obwohl für die Intensität des Eingangssignals |𝑓(𝑥, 𝑦)|2 = 1 gilt. Aufgabe 4-14: Optische Ortsfilter
Betrachten Sie das Ortsfilter in Abb. 4.38 mit 𝑓 = 1000 mm. Es wird von einer gleichförmigen ebenen Welle mit der Amplitude eins und der Wellenlänge 𝜆 = 10−3 mm bestrahlt. Die Eingangsfolie besitzt die Amplitudentransmission 𝑓(𝑥, 𝑦) und die Maske die Amplitudentransmission 𝑝(𝑥, 𝑦). Geben Sie eine Beziehung zwischen der komplexen Amplitude 𝑔(𝑥, 𝑦) des Lichts in der Bildebene und 𝑓(𝑥, 𝑦) bzw. 𝑝(𝑥, 𝑦) an. Nehmen Sie an, dass alle Entfernungen in mm gemessen werden und skizzieren Sie 𝑔(𝑥, 0) für die folgenden Fälle: (a) 𝑓(𝑥, 𝑦) = 𝛿(𝑥 − 5) und 𝑝(𝑥, 𝑦) = rect(𝑥), (b) 𝑓(𝑥, 𝑦) = rect(𝑥) und 𝑝(𝑥, 𝑦) = sinc(𝑥). Bestimmen Sie 𝑝(𝑥, 𝑦), sodass 𝑔(𝑥, 𝑦) = ∇2t 𝑓(𝑥, 𝑦) ist, wenn ∇2t = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 der transversale Laplaceoperator ist. Aufgabe 4-15: Optische Kreuzkorrelation
Zeigen Sie, wie man die Operation der Kreuzkorrelation (wie in Anhang A definiert) zwischen zwei Bildern, die durch die reellen Funktionen 𝑓1 (𝑥, 𝑦) und 𝑓2 (𝑥, 𝑦) beschrieben werden, mithilfe eines Ortsfilters durchführen kann. Unter welchen Bedingungen sind die komplexen Amplitudentransmissionen der Masken und Folien reell? Aufgabe 4-16: Impulsantwortfunktion eines stark defokussierten Systems
Zeigen Sie auf der Grundlage der Wellenoptik, dass die Impulsantwortfunktion eines stark defokussierten abbildenden Systems (für das der Fokusfehler 𝜀 sehr groß ist) näherungsweise durch ℎ(𝑥, 𝑦) = 𝑝(𝑥∕𝜀d 2 , 𝑦∕𝜀d 2 ) gegeben ist, wobei 𝑝(𝑥, 𝑦) die Pupillenfunktion ist. Hinweis: Verwenden Sie die in dem Beweis in Abschnitt 4.2.1 beschriebene Methode der stationären Phase, um das Integral zu berechnen, das aus der Anwendung der Gln. (4.62) und (4.61) folgt. Das Ergebnis ist dasselbe, das wir auch aus der Strahlentheorie des Lichts erhalten hatten [siehe Gl. (4.53)].
𝑓(𝑥, 𝑦) = 𝛿(𝑥)𝛿(𝑦) + 𝛿(𝑥 − 𝑏)𝛿(𝑦) .
(4.81)
(c) Skizzieren Sie für 𝜆 d 2 ∕𝐷 = 0.1 mm den Betrag des Bildes 𝑔(𝑥, 0) als Funktion von 𝑥 für die Punktabstände 𝑏 = 0.5, 1, und 2 mm. Wie groß ist der minimale Abstand der beiden Punkte, für den im Bild noch zwei Punkte (d. h. zwei Maxima) anstelle eines einzigen erkennbar sind? Aufgabe 4-18: Ringförmige Öffnung
(a) Ein fokussiertes einlinsiges abbildendes System mit der Vergrößerung 𝑀 = 1 und der Brennweite 𝑓 = 100 cm enthält eine ringförmige Blendenöffnung, 𝑝(𝑥, 𝑦) = {
1 für 𝑎 ≤
√
0 ansonsten ,
𝑥2 + 𝑦 2 ≤ 𝑏 ,
(4.82)
mit 𝑎 = 5 mm und 𝑏 = 6 mm. Bestimmen Sie die Übertragungsfunktion 𝐻(𝜈𝑥 , 𝜈𝑦 ) des Systems und skizzieren Sie seinen Querschnitt 𝐻(𝜈𝑥 , 0). Die Wellenlänge beträgt 𝜆 = 1 μm. (b) Nehmen Sie nun an, dass die Bildebene näher an die Linse versetzt wird, sodass ihr Abstand von der Linse noch d 2 = 25 cm beträgt, während der Abstand zwischen der Gegenstandsebene und der Linse wie in (a) gleich d 1 ist. Verwenden Sie die strahlenoptische Näherung, um die Impulsantwortfunktion ℎ(𝑥, 𝑦) des Systems zu bestimmen und skizzieren Sie ℎ(𝑥, 0). Aufgabe 4-19: Holographie mit einer Kugelwelle als Referenzwelle
Die Referenzwelle muss in der Holographie nicht unbedingt eine gleichförmige ebene Welle sein; auch andere Wellen sind möglich. Nehmen Sie an, dass die Referenzwelle eine Kugelwelle um den Punkt (0, 0, −d ) ist und bestimmen Sie das Muster des Hologramms für die folgenden Gegenstandswellen: (a) eine ebene Welle, die sich unter einem Winkel 𝜃𝑥 ausbreitet, (b) eine Kugelwelle um den Punkt (−𝑥0 , 0, −d 1 ). Untersuchen Sie in beiden Fällen die rekonstruierten Wellen. Nähern Sie Kugelwellen durch Parabolwellen an.
Aufgaben
Aufgabe 4-20: Optische Korrelation
Eine Folie mit einer Amplitudentransmission 𝑓(𝑥, 𝑦) = 𝑓1 (𝑥 − 𝑎, 𝑦) + 𝑓2 (𝑥 + 𝑎, 𝑦) wird durch eine Linse fouriertransformiert und die Intensität wird auf einer Folie (einem Hologramm) aufgezeichnet. Dann wird das Hologramm mit einer Referenzwelle beleuchtet, und die rekonstruierte Welle wird mit einer Linse fouriertransformiert, um die Funktion 𝑔(𝑥, 𝑦) zu erzeugen. Geben Sie eine Beziehung zwischen 𝑔(𝑥, 𝑦) und 𝑓1 (𝑥, 𝑦) sowie 𝑓2 (𝑥, 𝑦) an. Zeigen Sie, wie mithilfe dieses Systems die Korrelation der beiden Funktionen 𝑓1 (𝑥, 𝑦) und 𝑓2 (𝑥, 𝑦) bestimmt werden kann.
Weiterführende Literatur
M. Nieto-Vesperinas, Scattering and Diffraction in Physical Optics, World Scientific, 2. Aufl. 2006. H. M. Nussenzveig, Diffraction Effects in Semiclassical Scattering, Cambridge University Press 1992, Paperback 2006. A. Sommerfeld, ‚Mathematical Theory of Diffraction‘, Mathematische Annalen 1896; Birkhäuser 2004. D. C. O’Shea, T. J. Suleski, A. D. Kathman, D. W. Prather, Diffractive Optics: Design, Fabrication, and Test, SPIE Optical Engineering Press 2003. J. M. Cowley, Diffraction Physics, Elsevier, 3. Aufl. 1995. K. E. Oughstun (Hrsg.), Selected Papers on Scalar Wave Diffraction, SPIE Optical Engineering Press, 1992. M. Françon, Diffraction: Coherence in Optics, Pergamon Press 1966.
Fourieroptik, optische Signalverarbeitung
Abbildende Systeme
J. W. Goodman, Introduction to Fourier Optics, Freeman, 4. Aufl. 2017. K. Khare, Fourier Optics and Computational Imaging, Wiley 2016. R. K. Tyson, Principles and Applications of Fourier Optics, IOP Publishing 2014. D. Voelz, Computational Fourier Optics: A MATLAB Tutorial, SPIE Optical Engineering Press 2011. O. K. Ersoy, Diffraction, Fourier Optics, and Imaging, Wiley 2006. E. G. Steward, Fourier Optics: An Introduction, Halsted Press, 2. Aufl. 1987; Dover, Nachdruck 2004. W. Lauterborn, T. Kurz, Coherent Optics: Fundamentals and Applications Springer, 2. Aufl. 2003. E. L. O’Neill, Introduction to Statistical Optics, AddisonWesley 1963; Dover, Nachdruck 2003. M. A. Abushagur, H. Caulfield (Hrsg.), Selected Papers on Fourier Optics, SPIE Optical Engineering Press 1995. P. W. Hooijmans, Coherent Optical System Design, Wiley 1994. A. VanderLugt, Optical Signal Processing, Wiley 1992. F. T. Yu, S. Yin (Hrsg.), Selected Papers on Coherent Optical Processing, SPIE Optical Engineering Press 1992. G. Reynolds, J. B. DeVelis, G. B. Parrent, B. J. Thompson, The New Physical Optics Notebook: Tutorials in Fourier Optics, SPIE Optical Engineering Press 1989. G. Harburn, C. A. Taylor, T. R. Welberry, Atlas of Optical Transforms, Cornell University Press 1975. M. Cagnet, M. Françon, S. Mallick, Atlas of Optical Phenomena, Springer, Nachdruck mit Supplement 1971. M. Cagnet, M. Françon, J. C. Thrierr, Atlas of Optical Phenomena, Springer 1962.
G. de Villiers and E. R. Pike, The Limits of Resolution, CRC Press/Taylor & Francis, 2017. D. F. Buscher, Practical Optical Interferometry: Imaging at Visible and Infrared Wavelengths, Cambridge University Press 2015. G. Saxby, The Science of Imaging, CRC Press/Taylor & Francis, 2. Aufl. 2011. B. E. A. Saleh, Introduction to Subsurface Imaging, Cambridge University Press 2011. V. N. Mahajan, Optical Imaging and Aberrations, Part II. Wave Diffraction Optics, SPIE Optical Engineering Press, 2. Aufl. 2011. R. L. Easton, Jr., Fourier Methods in Imaging, Wiley 2010. D. J. Brady, Optical Imaging and Spectroscopy, Wiley 2009. H. Barrett, K. Myers, Foundations of Image Science, Wiley 2004. S. Jutamulia (Hrsg.), Selected Papers on Near-Field Optics, SPIE Optical Engineering Press 2002 (Milestone Series Bd. 172). C. S. Williams, O. A. Becklund, Introduction to the Optical Transfer Function, Wiley 1989; SPIE Optical Engineering Press 2002. G. D. Boreman, Modulation Transfer Function in Optical and Electro-Optical Systems, SPIE Optical Engineering Press 2001. M. Françon, Optical Image Formation and Processing, Academic Press 1979.
Beugung
P. Ya. Ufimtsev, Fundamentals of the Physical Theory of Diffraction, Wiley, 2. Aufl. 2014.
Holographie
U. Schnars, C. Falldorf, J. Watson, W. Jüptner, Digital Holography and Wavefront Sensing: Principles, Techniques and Applications, Springer, 2. Aufl. 2015. T.-C. Poon, J.-P. Liu, Introduction to Modern Digital Holography: With Matlab, Cambridge University Press 2014. P.-A. Blanche, Field Guide to Holography, SPIE Optical Engineering Press 2014.
115
116
4 Fourieroptik
V. Toal, Introduction to Holography, CRC Press/Taylor & Francis 2012. F. Unterseher, J. Hansen, Schlesinger, Holography Handbook: Making Holograms the Easy Way, Ross, 3. Aufl. 2010. L. Yaroslavsky, Digital Holography and Digital Image Processing: Principles, Methods, Algorithms, Kluwer 2004, Paperback 2010. G. Saxby, Practical Holography, Institute of Physics, 3. Aufl. 2004. P. Hariharan, Basics of Holography, Cambridge University Press 2002. H. I. Bjelkhagen, H. J. Caulfield (Hrsg.), Selected Papers on Fundamental Techniques in Holography, SPIE Optical Engineering Press 2001 (Milestone Series Bd. 171).
J. E. Kasper, S. A. Feller, Complete Book of Holograms: How They Work and How to Make Them, Wiley 1987; Dover, Nachdruck 2001. R. S. Sirohi, K. D. Hinsch (Hrsg.), Selected Papers on Holographic Interferometry Principles and Techniques, SPIE Optical Engineering Press 1998 (Milestone Series Bd. 144). M. Françon, Holography, Academic Press 1974. D. Gabor, ‚Holography 1948–1971‘ (Nobel Lecture in Physics, 1971). In: S. Lundqvist (Hrsg.), Nobel Lectures in Physics 1971–1980, World Scientific 1992.
117
5 Elektromagnetische Optik
elektromagnetische Optik Wellenoptik Strahlenoptik
10 21
10 18
10
10 –9
10 –12
1 nm
1 pm
UV
Sichtbar
Gammastrahlen
10
Röntgenstrahlen
1 µm
–6
IR
1 ZHz
1 EHz
Abb. 5.2 Die elektromagnetische Optik ist eine vektorielle Theorie, zu der ein elektrisches und ein magnetisches Feld gehören, die räumlich und zeitlich variieren. Die Wellenoptik ist eine Näherung für die elektromagnetische Optik auf der Grundlage der Wellenfunktion, einer skalaren Funktion von Raum und Zeit. Die Strahlenoptik ist der Grenzfall der Wellenoptik für sehr kleine Wellenlängen.
15
10 12
mm
T-Strahlen
–3 10
1 mm
1
1m
Radiowellen Mikrowellen
sich in Form zweier gekoppelter Vektorwellen aus, einer Welle des elektrischen Feldes und einer Welle des magnetischen Feldes. Von dieser Warte aus betrachtet ist der in Kapitel 2 beschriebene und in den Kapiteln 3 und 4 weiterentwickelte wellenoptische Ansatz nur eine skalare Näherung für die vollständigere elektromagnetische Theorie. Die elektromagnetische Optik umfasst somit die Wellenoptik, die sich im Grenzfall unendlich kleiner Wellenlängen wiederum auf die Strahlenoptik reduziert, wie wir in Kapitel 2 gezeigt hatten. Diese Hierarchie ist in Abb. 5.2 schematisch dargestellt.
1 PHz
1 THz
1 GHz 9
10
SHF
UHF
VHF
HF
LF 3
10
Wellenlänge (im Vakuum)
1 km
m
MF
10 6
1 kHz VLF
Hz
10 3
Frequenz
1 MHz
Aus den in den Kapiteln 2–4 vorgestellten Ergebnissen wird deutlich, dass die Wellenoptik eine weitaus größere Anwendungsbreite als die Strahlenoptik besitzt. Bemerkenswerterweise liefern beide Ansätze für viele einfache optische Phänomene mit paraxialen Wellen ähnliche Ergebnisse, beispielsweise für die Fokussierung von Licht durch eine Linse oder das Verhalten von Licht in Gradientenindexmaterialien oder periodischen Systemen. Trotzdem kann die Wellenoptik offensichtlich manche Erscheinungen erklären, bei denen die Strahlenoptik die Antwort schuldig bleibt – beispielsweise Phänomene wie Interferenz oder Beugung, die auf der Phase der beteiligten Wellen beruhen und somit weit jenseits des Erklärungshorizonts einer einfachen Konstruktion wie der Strahlenoptik liegen. Trotz ihrer zahlreichen Vorzüge scheitert die Wellenoptik aber genau wie die Strahlenoptik an der Erklärung einiger einfacher Beobachtungen in optischen Experimenten, z. B. der Teilung eines Lichtstrahls an einem Strahlteiler. Der Anteil des reflektierten bzw. durchgelassenen Lichts hängt, wie sich herausstellt, von der Polarisation des einfallenden Lichts ab, was bedeutet, dass das Licht im Rahmen einer vektoriellen (und nicht skalaren) Theorie beschrieben werden muss. Damit betritt die elektromagnetische Optik die Bühne. Ebenso wie Radiowellen oder Röntgenstrahlen (Abb. 5.1) ist Licht eine elektromagnetische Erscheinung, die durch eine vektorielle Wellentheorie beschrieben werden muss. Elektromagnetische Strahlung breitet
Abb. 5.1 Das elektromagnetische Spektrum von niedrigen Frequenzen (großen Wellenlängen) bis zu hohen Frequenzen (kleinen Wellenlängen). Der schattiert gezeigte optische Bereich ist in Abb. 2.1 detaillierter dargestellt.
Optisch
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
118
5 Elektromagnetische Optik
Die optischen Frequenzen umfassen einen Bereich des elektromagnetischen Spektrums, der sich vom Infraroten über das Sichtbare bis ins Ultraviolette erstreckt (Abb. 5.1). Als optischen Bereich bezeichnet man üblicherweise Wellenlängen von 10 nm bis 300 μm (wie in Abb. 2.1 genauer gezeigt ist). Da diese Wellenlängen wesentlich kürzer als die von Radio- oder Mikrowellen sind, sind zu ihrer Erzeugung, Übertragung und Detektion traditionell auch besondere Methoden erforderlich. In der jüngeren Vergangenheit hat der Trend zur Miniaturisierung aber zu einer Verwischung dieser Unterschiede geführt: heute sind Laser mit Abmessungen im Bereich einiger Wellenlängen und optische Wellenleiter ebenso wie winzige Photodetektoren keine Rarität mehr.
In diesem Kapitel . . . Dieses Kapitel gibt einen kurzen Überblick über die Aspekte der elektromagnetischen Theorie, die für die Optik von grundlegender Bedeutung sind. Der Grundstein schlechthin – die maxwellschen Gleichungen – wird in Abschnitt 5.1 gelegt. Das Verhalten elektromagnetischer Wellen in dielektrischen Medien wird in Abschnitt 5.2 untersucht. Zusammen bilden diese beiden Abschnitte die Grundlage der elektromagnetischen Optik und stellen die Regeln zur Verfügung, nach denen sich die verbleibenden Abschnitte dieses Kapitels richten. Diese Regeln werden für monochromatisches Licht wesentlich einfacher, wie in Abschnitt 5.3 diskutiert werden wird. Einfache elektromagnetische Wellen (ebene Wellen, Kugelwellen und Gaußstrahlen), die wir in Abschnitt 5.4 kennenlernen werden, sind wichtige Beispiele, die uns in der Praxis häufig von Nutzen sein werden. Abschnitt 5.5 befasst sich schließlich mit der Ausbreitung von Licht in dispersiven Medien, in denen Absorption und Brechung genau wie in realen Medien von der Wellenlänge der Strahlung abhängen. In Abschnitt 5.6 befassen wir uns mit der Streuung elektromagnetischer Wellen, die in der Optik und Plasmonik eine bedeutsame Rolle spielt, wie wir in Kapitel 8 erfahren werden. In Abschnitt 5.7 werden wir schließlich die Pulsausbreitung in dispersiven Medien untersuchen, die die Grundlage für die Kapitel 10, 23 und 25 bildet. Kapitel 6 baut auf der in diesem Kapitel entwickelten Theorie der elektromagnetischen Optik auf und behandelt die Polarisation von Licht und Wechselwirkung von polarisiertem Licht mit dielektrischen und anisotropen Medien wie z. B. Flüssigkristallen explizit. Die im Folgenden diskutierten Themen sind auch die Grundlage der in den Kapiteln 7–11 entwickelten Gedankengänge, die sich mit der Optik von
Schicht- und periodischen Systemen, Metallen und Metamaterialien, Wellenleitern, Fasern und Resonatoren befassen. Auch die Kapitel 12 und 22, die der statistischen Optik und der nichtlinearen Optik gewidmet sind, beruhen auf der elektromagnetischen Theorie der Optik.
5.1 Die elektromagnetische Theorie des Lichts Ein elektromagnetisches Feld wird durch zwei miteinander verknüpfte Vektorfelder beschrieben, die Funktionen von Ort und Zeit sind: das elektrische Feld 𝓔(r, 𝑡) und das magnetische Feld 𝓗(r, 𝑡). Im Allgemeinen sind daher sechs skalare Funktionen von Ort und Zeit nötig, um Licht im Vakuum vollständig zu beschreiben. Glücklicherweise sind diese sechs Funktionen nicht unabhängig, da sie durch eine berühmte Gruppe von partiellen Differentialgleichungen miteinander verknüpft sind: die maxwellschen Gleichungen.
5.1.1
Die maxwellschen Gleichungen im Vakuum
Die Vektoren des elektrischen und des magnetischen Feldes im Vakuum erfüllen die maxwellschen Gleichungen: 𝜕𝓔 , 𝜕𝑡 𝜕𝓗 ∇ × 𝓔 = −𝜇0 , 𝜕𝑡 ∇⋅𝓔=0,
∇ × 𝓗 = 𝜀0
∇⋅𝓗=0,
(5.1) (5.2) (5.3) (5.4)
wobei die Konstanten 𝜀0 ≈ (1∕36π) × 10−9 F∕m und 𝜇0 = 4π × 10−7 H∕m (in SI-Einheiten) die Vakuumpermittivität (oder elektrische Feldkonstante) und die Vakuumpermeabilität (oder magnetische Feldkonstante) sind. Die Vektoroperatoren ∇⋅ und ∇× bezeichnen die Divergenz bzw. die Rotation. 1)
5.1.2
Die Wellengleichung
Damit 𝓔 und 𝓗 die maxwellschen Gleichungen erfüllen, müssen alle ihrer Komponenten die Wellengleichung ∇2 𝑢 −
1 𝜕2 𝑢 =0 𝑐02 𝜕𝑡2
(5.5)
1) In einem kartesischen Koordinatensystem ist ∇ ⋅ 𝓔 = 𝜕ℰ𝑥 ∕𝜕𝑥 + 𝜕ℰ𝑦 ∕𝜕𝑦 + 𝜕ℰ𝑧 ∕𝜕𝑧, wohingegen ∇ × 𝓔 ein Vektor mit den kartesischen Komponenten (𝜕ℰ𝑧 ∕𝜕𝑦 − 𝜕ℰ𝑦 ∕𝜕𝑧), (𝜕ℰ𝑥 ∕𝜕𝑧 − 𝜕ℰ𝑧 ∕𝜕𝑥) und (𝜕ℰ𝑦 ∕𝜕𝑥 − 𝜕ℰ𝑥 ∕𝜕𝑦) ist.
5.1 Die elektromagnetische Theorie des Lichts
quellenfreies Medium zusammen:
befolgen. Hierin ist 𝑐0 = √
1 ≈ 3 × 108 m∕s 𝜀0 𝜇0
(5.6)
die Lichtgeschwindigkeit im Vakuum, und die skalare Funktion 𝑢(r, 𝑡) steht für eine beliebige der drei Komponenten (ℰ𝑥 , ℰ𝑦 , ℰ𝑧 ) von 𝓔 oder der drei Komponenten (ℋ𝑥 , ℋ𝑦 , ℋ𝑧 ) von 𝓗. Die Wellengleichung kann aus den maxwellschen Gleichungen abgeleitet werden, indem man die Rotation ∇× von Gl. (5.2) bildet und die Vektoridentität ∇ × (∇ × 𝓔) = ∇(∇ ⋅ 𝓔) − ∇2 𝓔 verwendet. Mithilfe der Gln. (5.1) und (5.3) kann man dann zeigen, dass jede Komponente von 𝓔 die Wellengleichung erfüllt; ein analoges Vorgehen führt auch für 𝓗 zum Erfolg. Da die maxwellschen Gleichungen und die Wellengleichung linear sind, gilt das Superpositionsprinzip: Wenn zwei Sätze von elektrischen und magnetischen Feldern für sich genommen Lösungen der Gleichungen sind, gilt dies auch für ihre Summe. Damit wird die Verbindung zwischen der elektromagnetischen Optik und der Wellenoptik offensichtlich. Die Wellengleichung (2.2), die die Grundlage der Wellenoptik bildet, ist ein integraler Bestandteil der elektromagnetischen Theorie; die Lichtgeschwindigkeit hängt über Gl. (5.6) mit den elektromagnetischen Konstanten 𝜀0 und 𝜇0 zusammen, und die skalare Wellenfunktion 𝑢(r, 𝑡) aus Kapitel 2 beschreibt jede der sechs Komponenten der Vektoren des elektrischen und des magnetischen Feldes. Für alle Aufgabenstellungen, in denen die Vektornatur der elektromagnetischen Felder keine Rolle spielt, reduziert sich die elektromagnetische Optik auf die Wellenoptik. Wie wir in diesem und den folgenden Kapiteln sehen werden, ist der Vektorcharakter des Lichts für alle Polarisationserscheinungen entscheidend und bestimmt den Anteil des Lichts, der an den Grenzflächen zwischen verschiedenen Medien reflektiert oder durchgelassen wird. Er ist damit die Grundlage für die Lichtausbreitung in Wellenleitern, Schichtstrukturen oder optischen Resonatoren.
5.1.3 Die maxwellschen Gleichungen in Medien In einem Medium ohne freie elektrische Ladungen oder Ströme werden noch zwei weitere Vektorfelder benötigt – die elektrische Flussdichte (auch als dielektrische Verschiebung bezeichnet) 𝓓(r, 𝑡) und die magnetische Flussdichte 𝓑(r, 𝑡) (auch als magnetische Induktion bezeichnet). Die vier Felder 𝓔, 𝓗, 𝓓 und 𝓑 hängen über die maxwellschen Gleichungen für ein
𝜕𝓓 , 𝜕𝑡 𝜕𝓑 , ∇×𝓔=− 𝜕𝑡 ∇⋅𝓓 = 0,
∇×𝓗=
∇⋅𝓑 = 0.
(5.7) (5.8) (5.9) (5.10)
Leitfähige Medien wie Metalle enthalten freie elektrische Ladungen, weshalb für sie auf der rechten Seite von Gl. (5.7) eine entsprechende Stromdichte 𝒥 eingefügt werden muss, wie wir in Abschnitt 8.2.1 sehen werden. Maxwells ursprüngliche Formulierung aus dem Jahr 1865 bestand noch aus 20 simultanen Gleichungen mit 20 Variablen; diese wurden 1885 von Oliver Heaviside zu ihrer heutigen Form verdichtet. Die Beziehung zwischen der elektrischen Flussdichte 𝓓 und dem elektrischen Feld 𝓔 hängt von den elektrischen Eigenschaften des Mediums ab, die durch die dielektrische Polarisation 𝓟 beschrieben werden. In einem dielektrischen Medium ist die dielektrische Polarisation die makroskopische Summe der durch das elektrische Feld induzierten elektrischen Dipolmomente. Entsprechend hängt die Beziehung zwischen der magnetischen Flussdichte 𝓑 und der magnetischen Feldstärke 𝓗 von den magnetischen Eigenschaften des Mediums ab, die durch die Magnetisierung 𝓜 des Mediums beschrieben wird, die analog zur dielektrischen Polarisation definiert ist. Die Beziehungen zwischen den Flussdichten und den Feldstärken lauten 𝓓 = 𝜀0 𝓔 + 𝓟 ,
(5.11)
𝓑 = 𝜇0 𝓗 + 𝜇0 𝓜 .
(5.12)
Die Vektorfelder 𝓟 und 𝓜 hängen mit den externen elektrischen und magnetischen Feldern 𝓔 und 𝓗 zusammen. Die genauen Beziehungen enthalten die elektrischen und magnetischen Eigenschaften des Mediums und werden in Abschnitt 5.2 behandelt. Gleichungen zwischen 𝓟 und 𝓔 sowie zwischen 𝓜 und 𝓗 können aufgestellt werden, sobald das Medium bekannt ist. Wenn diese Beziehungen in die maxwellschen Gleichungen für ein quellenfreies Medium eingesetzt werden, verschwinden die Flussdichten. Im Vakuum ist 𝓟 = 𝓜 = 0, sodass 𝓓 = 𝜀0 𝓔 und 𝓑 = 𝜇0 𝓗 gilt, wodurch sich die Gln. (5.7)–(5.10) auf die maxwellschen Gleichungen im Vakuum reduzieren, Gln. (5.1)–(5.4).
119
120
5 Elektromagnetische Optik
(a)
(b)
Abb. 5.3 Randbedingungen. (a) An der Grenzfläche zwischen zwei dielektrischen Medien; (b) an der Grenzfläche zwischen einem idealen Leiter und einem Dielektrikum.
5.1.4 Randbedingungen In einem homogenen Medium sind alle Komponenten der Felder 𝓔, 𝓗, 𝓓 und 𝓑 stetige Funktionen des Ortes. In Abwesenheit freier elektrischer Ladungen und Ströme sind auch die Tangentialkomponenten der elektrischen und magnetischen Felder 𝓔 und 𝓗 sowie die Normalkomponenten der elektrischen und magnetischen Flussdichten 𝓓 und 𝓑 an der Grenzfläche zwischen zwei dielektrischen Medien stetig (Abb. 5.3). An der Grenzfläche zwischen einem Dielektrikum und einem idealen Leiter müssen die Tangentialkomponenten des elektrischen Feldvektors verschwinden. Da ein idealer Spiegel aus einem ideal leitenden Material (einem Metall) besteht, muss die Komponente des elektrischen Feldes parallel zur Spiegeloberfläche null sein. Daraus folgt, dass die elektrischen Felder der einfallenden und der reflektierten Wellen bei senkrechtem Lichteinfall gleiche Beträge und eine Phasenverschiebung von π besitzen müssen, sodass ihre Summe gerade null ergibt. Diese Randbedingungen sind ein inhärenter Bestandteil der maxwellschen Gleichungen. Mit ihrer Hilfe können die Reflexion bzw. Transmission von Wellen an verschiedenen Grenzflächen (siehe Abschnitt 6.2) sowie die Ausbreitung von Wellen in periodischen Strukturen (siehe Abschnitt 7.1) und Wellenleitern (siehe Abschnitt 9.2) analysiert werden.
5.1.5 Intensität, Leistung und Energie Der Fluss der elektromagnetischen Leistung wird durch den Vektor 𝓢=𝓔×𝓗
(5.13)
beschrieben, der als Poyntingvektor bezeichnet wird. Die Richtung des Flusses ist identisch mit der Richtung des Poyntingvektors, d. h. orthogonal sowohl zu 𝓔 als auch 𝓗. Die optische Intensität 𝐼(r, 𝑡) (Fluss der Leistung durch eine Flächeneinheit senkrecht zur Richtung von 𝓢) 2) ist der Betrag des zeitlich gemittelten Poyn2) Eine ausführliche Diskussion dieser Interpretation findet sich in M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002, S. 7–10.
tingvektors, ⟨𝓢⟩. Der Mittelwert wird dabei über Zeiten gebildet, die lang im Vergleich zu einer optischen Periode sind, aber kurz im Vergleich zu anderen im betrachteten System auftretenden Zeiten. Das wellenoptische Äquivalent hierzu ist in Gl. (2.3) angegeben. Mithilfe der Vektoridentität ∇ ⋅ (𝓔 × 𝓗) = (∇ × 𝓔) ⋅ 𝓗 − (∇ × 𝓗) ⋅ 𝓔 und den maxwellschen Gleichungen (5.7)–(5.8) sowie (5.11)–(5.12) erhalten wir 𝜕 1 1 𝜕𝓟 2 2 ( 𝜀 𝓔 + 𝜇0 𝓗 ) + 𝓔 ⋅ 2 𝜕𝑡 2 0 𝜕𝑡 𝜕𝓜 + 𝜇0 𝓗 ⋅ . 𝜕𝑡
∇⋅𝓢 = −
(5.14)
Die beiden ersten Terme in Klammern in Gl. (5.14) beschreiben die im elektrischen bzw. magnetischen Feld gespeicherte Energiedichte (pro Volumeneinheit). Der dritte bzw. vierte Term stellt die an die elektrischen bzw. magnetischen Dipole in dem Medium abgegebenen Energiedichte dar. Gleichung (5.14), die unter der Bezeichnung Poyntingtheorem bekannt ist, ist daher nichts anderes als die Energieerhaltung: der Fluss der Leistung durch die Oberfläche eines differentiellen Volumenelements ist gleich der zeitlichen Änderung der in dem Volumenelement gespeicherten Energie.
5.1.6
Impuls
Der Impuls einer elektromagnetischen Welle erzeugt einen Strahlungsdruck auf Objekte, an denen die Welle reflektiert oder gestreut wird. In Vakuum ist die Impulsdichte (pro Volumeneinheit) ein Vektor 𝜀0 𝓔 × 𝓑 =
1 𝓢 𝑐2
(5.15)
proportional zum Poyntingvektor 𝓢. Der mittlere Impuls in einem Zylinder der Länge 𝑐 und einer Flächeneinheit Querschnitt ist (⟨𝓢⟩∕𝑐2 ) ⋅ 𝑐 = ⟨𝓢⟩∕𝑐. Dieser Impuls durchquert die Flächeneinheit in einer Zeiteinheit, sodass die durchschnittliche Rate (pro Zeiteinheit) des Impulsflusses durch die Flächeneinheit senkrecht zur Richtung 𝓢 gleich ⟨𝓢⟩∕𝑐 ist. Eine elektromagnetische Welle kann auch einen Drehimpuls besitzen und deshalb ein Drehmoment auf ein Objekt ausüben. Die durchschnittliche Rate
5.2 Elektromagnetische Wellen in Dielektrika
des durch ein elektromagnetisches Feld transportierten Drehimpulses ist r × ⟨𝓢⟩∕𝑐. Beispielsweise besitzen die in Abschnitt 3.4 eingeführten Laguerre-Gauß-Strahlen helikale Wellenfronten; der Poyntingvektor hat dann eine azimutale Komponente, die zu einem Bahndrehimpuls führt.
5.2 Elektromagnetische Wellen in Dielektrika Die Eigenschaften des Mediums sind in der Beziehung zwischen der Polarisation und Magnetisierung 𝓟 und 𝓜 einerseits und den elektrischen bzw. magnetischen Feldstärken 𝓔 und 𝓗 andererseits enthalten; diese sind als Fundamentalbeziehung bekannt. In den meisten Medien separiert die Fundamentalbeziehung in ein Paar von Fundamentalbeziehungen, eine zwischen 𝓟 und 𝓔 und eine andere zwischen 𝓜 und 𝓗. Die erste beschreibt die dielektrischen Eigenschaften des Mediums, die zweite seine magnetischen Eigenschaften. Mit Ausnahme der magnetischen und optisch aktiven Materialien sowie der Metamaterialien legen wir unser Augenmerk in diesem Buch auf die dielektrischen Eigenschaften. Wir betrachten deshalb nun die Beziehungen zwischen 𝓟 und 𝓔 für verschiedene dielektrische Medien; die Beziehungen zwischen 𝓜 und 𝓗 für magnetische Medien gehorchen entsprechenden Gesetzmäßigkeiten. Es ist nützlich, die Fundamentalbeziehung zwischen 𝓟 und 𝓔 anhand eines Systems zu betrachten, in dem 𝓔 die Eingangsgröße und 𝓟 die Systemantwort ist (Abb. 5.4). Dabei sind 𝓔 = 𝓔(r, 𝑡) und 𝓟 = 𝓟(r, 𝑡) Funktionen von Ort und Zeit.
wie schnell sie reagieren, in Wirklichkeit eine endliche Ansprechzeit haben. • Ein Medium heißt homogen, wenn die Beziehung zwischen 𝓟 und 𝓔 nicht vom Ort r abhängt. • Ein Medium heißt isotrop, wenn die Beziehung zwischen den Vektoren 𝓟 und 𝓔 nicht von der Richtung des Vektors 𝓔 abhängt, d. h. wenn das Medium in allen Richtungen dasselbe Verhalten zeigt. Die Vektoren 𝓟 und 𝓔 müssen dann parallel sein. • Ein Medium heißt räumlich nichtdispersiv, wenn die Beziehung zwischen 𝓟 und 𝓔 lokal ist, d. h. wenn 𝓟 an einem Ort r nur durch 𝓔 an demselben Ort r bestimmt wird. Wir werden in diesem Kapitel voraussetzen, dass alle Medien stets räumlich nichtdispersiv sind (optisch aktive Medien, die wir in Abschnitt 6.4.1 betrachten werden, sind räumlich dispersiv).
5.2.2 Lineare, nichtdispersive, homogene und isotrope Medien Wir betrachten zuerst den einfachsten Fall linearer, nichtdispersiver, homogener und isotroper dielektrischer Medien. Die Vektoren 𝓟 und 𝓔 sind dann an jedem Ort und zu jeder Zeit parallel und zueinander proportional, sodass 𝓟 = 𝜀0 𝜒𝓔
(5.16)
gilt, wobei die skalare Konstante 𝜒 als dielektrische Suszeptibilität bezeichnet wird (Abb. 5.5). Einsetzen von Gl. (5.16) in Gl. (5.11) zeigt, dass auch 𝓓 und 𝓔 parallel und proportional sind, 𝓓 = 𝜀𝓔 ,
(5.17)
wobei die skalare Größe (r,t)
(r,t) Medium
Abb. 5.4 Als Antwort auf ein angelegtes elektrisches Feld 𝓔 erzeugt ein dielektrisches Medium eine Polarisation 𝓟.
5.2.1 Definitionen • Ein dielektrisches Medium heißt linear, wenn das Vektorfeld 𝓟(r, 𝑡) linear mit dem Vektorfeld 𝓔(r, 𝑡) zusammenhängt. In diesem Fall gilt das Superpositionsprinzip. • Ein Medium heißt nichtdispersiv, wenn seine Antwort instantan erfolgt, d. h. wenn 𝓟 zur Zeit 𝑡 durch 𝓔 zu derselben Zeit 𝑡 und nicht durch frühere Werte 𝓔 bestimmt wird. Nichtdispersivität ist offensichtlich eine Idealisierung, da alle physikalischen Systeme, egal
𝜀 = 𝜀0 (1 + 𝜒)
(5.18)
die Permittivität des Mediums ist. Die relative Permittivität 𝜀∕𝜀0 = 1 + 𝜒 wird auch als Dielektrizitätskonstante des Mediums bezeichnet. Unter ähnlichen Bedingungen kann die magnetische Beziehung in der Form 𝓑 = 𝜇𝓗
(5.19)
χ
Abb. 5.5 Ein lineares, nichtdispersives, homogenes und isotropes Medium wird durch eine einzige Konstante, die dielektrische Suszeptibilität 𝜒 , vollständig charakterisiert.
121
122
5 Elektromagnetische Optik
geschrieben werden, wobei 𝜇 die magnetische Permeabilität des Mediums ist. Mit den Beziehungen Gl. (5.17) und (5.19) verknüpfen die maxwellschen Gleichungen (5.7)–(5.10) nur die zwei Vektorfelder 𝓔(r, 𝑡) und 𝓗(r, 𝑡) und vereinfachen sich zu 𝜕𝓔 ∇×𝓗 = 𝜀 , (5.20) 𝜕𝑡 𝜕𝓗 , (5.21) ∇ × 𝓔 = −𝜇 𝜕𝑡 ∇⋅𝓔=0, (5.22) ∇⋅𝓗=0.
(5.23)
Offensichtlich ist die Form der Gln. (5.20)–(5.23) identisch mit der der maxwellschen Gleichungen im Vakuum, Gln. (5.1)–(5.4), nur dass 𝜀0 durch 𝜀 und 𝜇0 durch 𝜇 ersetzt ist. Jede Komponente 𝓔 und 𝓗 erfüllt daher die Wellengleichung 1 𝜕2 𝑢 =0, (5.24) 𝑐2 𝜕𝑡2 wobei die Lichtgeschwindigkeit im Medium mit 𝑐 bezeichnet wird: 1 (5.25) 𝑐= √ . 𝜀𝜇 ∇2 𝑢 −
Das Verhältnis 𝑐0 ∕𝑐 der Lichtgeschwindigkeit im Vakuum zu derjenigen in einem Medium ist der Brechungsindex 𝑛: √ 𝑐0 𝜀 𝜇 𝑛= , (5.26) = 𝑐 𝜀0 𝜇0 und aus Gl. (5.6) folgt 1 𝑐0 = √ . 𝜀0 𝜇0
(5.27)
Für ein nichtmagnetisches Material ist 𝜇 = 𝜇0 und daher √ √ 𝜀 = 1+𝜒, (5.28) 𝑛= 𝜀0 sodass der Brechungsindex gleich der Wurzel aus der Dielektrizitätskonstante ist. Diese Beziehungen liefern eine weitere Verbindung mit der skalaren Wellenoptik (Abschnitt 2.1), wie in Abschnitt 5.4.2 ausführlicher erläutert wird. Das Poyntingtheorem Gl. (5.14) nimmt unter Verwendung der maxwellschen Gleichungen (5.20) und (5.21) die Form einer Kontinuitätsgleichung an, ∇⋅𝓢 = −
𝜕𝒲 , 𝜕𝑡
(5.29)
5.2.3 Nichtlineare, dispersive, inhomogene oder anisotrope Medien Wir wollen nun nichtmagnetische dielektrische Medien betrachten, bei denen eine oder mehrere der Bedingungen Linearität, Nichtdispersivität, Homogenität und Isotropie nicht erfüllt sind. Inhomogene Medien
Zuerst betrachten wir ein inhomogenes Dielektrikum (z. B. ein Medium mit variablem Brechungsindex), das linear, nichtdispersiv und isotrop ist. Die einfachen Proportionalitäten 𝓟 = 𝜀0 𝜒𝓔 und 𝓓 = 𝜀𝓔 gelten weiterhin, aber die Koeffizienten 𝜒 und 𝜀 sind jetzt Funktionen des Ortes: 𝜒 = 𝜒(r) und 𝜀 = 𝜀(r) (Abb. 5.6). Der Brechungsindex wird deshalb ebenfalls ortsabhängig, 𝑛 = 𝑛(r). Wir gehen von den maxwellschen Gleichungen (5.7)– (5.10) und der Tatsache aus, dass 𝜀 = 𝜀(r) ortsabhängig ist, und bilden auf beiden Seiten von Gl. (5.8) die Rotation ∇×. Dann verwenden wir Gl. (5.7) und erhalten 𝜀0 1 𝜕2 𝓔 ∇ × (∇ × 𝓔) = − 2 2 . 𝜀 𝑐 𝜕𝑡
(5.31)
0
Das Magnetfeld erfüllt eine andere Gleichung: ∇×(
𝜀0 1 𝜕2 𝓗 ∇ × 𝓗) = − 2 . 𝜀 𝑐 𝜕𝑡2
(5.32)
0
Gleichung (5.31) kann auch in der Form 1 𝜕2 𝓔 ∇2 𝓔 + ∇ ( ∇𝜀 ⋅ 𝓔) − 𝜇0 𝜀 2 = 0 𝜀 𝜕𝑡
(5.33)
geschrieben werden. Die Gültigkeit von Gl. (5.33) kann mithilfe der folgenden Methode gezeigt werden. Wir verwenden die Identität ∇ × (∇ × 𝓔) = ∇(∇ ⋅ 𝓔) − ∇2 𝓔 für ein geradliniges Koordinatensystem. Mithilfe von Gl. (5.9), ∇ ⋅ 𝜀𝓔 = 0, und der Identität ∇ ⋅ 𝜀𝓔 = 𝜀∇ ⋅ 𝓔 + ∇𝜀 ⋅ 𝓔 erhalten wir ∇ ⋅ 𝓔 = −(1∕𝜀)∇𝜀 ⋅ 𝓔. Das setzen wir in Gl. (5.31) ein und gelangen zu Gl. (5.33). Für Medien mit langsam variierenden dielektrischen Eigenschaften, d. h. wenn 𝜀(r) sich so langsam verändert, dass es auf Entfernungen von der Größenordnung einer Wellenlänge als konstant angenommen werden kann, kann der zweite Term auf der linken Seite von (r)
χ (r)
(r)
wobei 1
2
1
2
𝒲 = 𝜀𝓔 + 𝜇𝓗 2
2
die im Medium gespeicherte Energiedichte ist.
(5.30)
Abb. 5.6 Ein inhomogenes (aber lineares, nichtdispersives, und isotropes) Medium ist durch eine ortsabhängige Suszeptibilität 𝜒(r) gekennzeichnet.
5.2 Elektromagnetische Wellen in Dielektrika
Gl. (5.33) gegen den ersten vernachlässigt werden, sodass ∇2 𝓔 −
1 𝜕2𝓔 ≈0 𝑐2 (r) 𝜕𝑡2
(5.34)
√ folgt, wobei 𝑐(r) = 1∕ 𝜇0 𝜀 = 𝑐0 ∕𝑛(r) vom Ort abhängt √ und 𝑛(r) = 𝜀(r)∕𝜀0 der Brechungsindex am Ort r ist. Diese Beziehung wurde in Abschnitt 2.1 ohne Beweis verwendet; sie folgt offensichtlich näherungsweise aus den maxwellschen Gleichungen. Für ein homogenes dielektrisches Medium mit dem Brechungsindex 𝑛, der durch eine räumlich langsam variierende Änderung Δ𝑛 gestört wird, ist es häufig nützlich, Gl. (5.34) in der Form ∇2 ℰ −
1 𝜕2ℰ ≈ −s , 𝑐2 𝜕𝑡2
𝒮 = −𝜇0
𝜕 2 Δ𝒫 𝜕𝑡2
Δ𝒫 = 2𝜀0 𝑛Δ𝑛ℰ (5.35)
zu schreiben, wobei 𝑐 = 𝑐0 ∕𝑛 die Lichtgeschwindigkeit im homogenen Medium ist. ℰ erfüllt also die Wellengleichung mit einer Strahlenquelle 𝒮, die durch eine Störung Δ𝒫 der Polarisation erzeugt wird, die wiederum proportional zu Δ𝑛 und ℰ ist. Diese Gleichungen können nachgeprüft werden, indem man den Term 1∕𝑐2 (r) in Gl. (5.34) als (𝑛 + Δ𝑛)2 ∕𝑐02 ≈ (𝑛2 + 2𝑛Δ𝑛)∕𝑐02 entwickelt und den Störterm auf die rechte Seite bringt. Der Term Δ𝒫 beschreibt die Störung von 𝒫, was deutlich wird, wenn man 𝒫 = 𝜀0 𝜒ℰ = 𝜀0 (𝜀∕𝜀0 − 1)ℰ = 𝜀0 (𝑛2 − 1)ℰ schreibt, sodass Δ𝒫 = 𝜀0 Δ(𝑛2 − 1)ℰ = 2𝜀0 𝑛Δ𝑛ℰ folgt. Anisotrope Medien
In einem anisotropen dielektrischen Medium hängt die Beziehung zwischen den Vektoren 𝓟 und 𝓔 von der Richtung des Vektors 𝓔 ab; die Voraussetzung, dass die beiden Vektoren parallel sein müssen, gilt nun nicht mehr. Wenn das Medium linear, nichtdispersiv und homogen ist, ist jede Komponente 𝓟 eine Linearkombination der drei Komponenten von 𝓔: 𝒫𝑖 =
∑ 𝑗
𝜀0 𝜒𝑖𝑗 ℰ𝑗 ,
(5.36)
wobei die Indizes 𝑖, 𝑗 = 1, 2, 3 für die 𝑥-, 𝑦- und 𝑧-Komponenten stehen. Die dielektrischen Eigenschaften des Mediums werden dann durch eine 3 × 3-Anordnung von Konstanten {𝜒𝑖𝑗 } beschrieben, die Elemente des sogenannten Tensors 𝛘 der dielektrischen Suszeptibilität (Abb. 5.7). Eine entsprechende Beziehung gilt zwischen 𝓓 und 𝓔: 𝒟𝑖 =
∑ 𝑗
𝜀𝑖𝑗 ℰ𝑗 ,
(5.37)
1
2
3
χ11 χ12 χ13 χ21 χ22 χ23 χ31 χ32 χ33
1
2
3
Abb. 5.7 Ein anisotropes (aber lineares, homogenes, und nichtdispersives) Medium wird durch neun Konstanten 𝜒ij charakterisiert, die Elemente des Tensors der elektrischen Suszeptibilität. Jede Komponente 𝓟 ist eine gewichtete Superposition der drei Komponenten von 𝓔.
wobei {𝜀𝑖𝑗 } die Elemente des Tensors 𝛆 der elektrischen Permittivität sind. Die optischen Eigenschaften von anisotropen Medien werden in Kapitel 6 diskutiert. Unter entsprechenden Annahmen nimmt die Beziehung zwischen 𝓑(𝑡) und 𝓗(𝑡) für anisotrope magnetische Medien eine ähnliche Form wie in Gl. (5.37) an. Dispersive Medien
In einem dispersiven dielektrischen Medium ist die Beziehung zwischen den Vektoren 𝓟 und 𝓔 dynamisch, aber nicht instantan. Wir können uns den Vektor 𝓔(𝑡) als ein Eingangssignal vorstellen, das die gebundenen Elektronen in den Atomen des Mediums zu Schwingungen angeregt, wodurch dann der Vektor 𝓟(𝑡) der Polarisation als Ausgangssignal erzeugt wird. Die Existenz einer Zeitverzögerung zwischen dem Ausgangs- und dem Eingangssignal zeigt, dass das System ein Gedächtnis besitzt. Nur wenn diese Zeit im Vergleich zu allen anderen interessierenden Zeiten kurz ist, kann die Antwort als instantan betrachtet werden; in diesem Fall ist das Medium näherungsweise nichtdispersiv. Für dispersive Medien, die linear, homogen und isotrop sind, kann die dynamische Beziehung zwischen 𝓟(𝑡) und 𝓔(𝑡) durch eine lineare Differentialgleichung wie der des getriebenen harmonischen Oszillators be2 schrieben werden: 𝑎1 d 𝓟∕ d𝑡2 + 𝑎2 d𝓟∕ d𝑡 + 𝑎3 𝓟 = 𝓔, wobei 𝑎1 , 𝑎2 und 𝑎3 Konstanten sind. Eine einfache Analyse in dieser Art (siehe Abschnitt 5.5.3) liefert eine physikalisches Erklärung für Dispersion (und Absorption). Allgemeiner kann die in Anhang B beschriebene Methode linearer Systeme verwendet werden, um ein beliebiges lineares System zu untersuchen, das durch seine Antwort auf einen Impuls (seine Impulsantwortfunktion) charakterisiert wird. Ein Puls eines elektrischen Feldes mit dem Betrag 𝛿(𝑡) zur Zeit 𝑡 = 0 bewirkt eine zeitlich dispergierte Polarisation mit dem Betrag 𝜀0 x(𝑡), wobei x(𝑡) eine skalare Funktion der Zeit mit begrenz-
123
124
5 Elektromagnetische Optik
(t)
χ (t)
(t)
Abb. 5.8 In einem dispersiven (aber linearen, homogenen und isotropen) Medium wird die Beziehung zwischen 𝓟(t ) und 𝓔(t ) durch ein dynamisches lineares System mit einer Impulsantwortfunktion 𝜀0 x(t ) beschrieben, die einer frequenzabhängigen Suszeptibilität 𝜒(𝜈) entspricht.
ter Dauer ist, die zur Zeit 𝑡 = 0 beginnt. Da das Medium linear ist, bewirkt ein beliebiges elektrisches Feld 𝓔(𝑡) dann eine Polarisation aus einer Überlagerung der Effekte 𝓔(𝑡′ ) für alle 𝑡′ ≤ 𝑡, sodass die Polarisation wie in Anhang A beschrieben als Faltung ausgedrückt werden kann: ∞
𝓟(𝑡) = 𝜀0 ∫ x(𝑡 − 𝑡′ )𝓔(𝑡′ ) d𝑡′ .
(5.38)
−∞
Dieses dielektrische Medium wird durch seine Impulsantwortfunktion 𝜀0 x(𝑡) vollständig beschrieben. Alternativ kann ein dynamisches lineares System durch seine Übertragungsfunktion charakterisiert werden, die die Antwort auf harmonische Eingangssignale beschreibt. Die Übertragungsfunktion ist die Fouriertransformierte der Impulsantwortfunktion (siehe Anhang B). Im obigen Beispiel ist die Übertragungsfunktion bei der Frequenz 𝜈 gleich 𝜀0 𝜒(𝜈), wenn 𝜒(𝜈) die Fouriertransformierte von x(𝑡) ist, also eine frequenzabhängige Suszeptibilität (Abb. 5.8). Dieses Konzept wird in den Abschnitten 5.3 und 5.5 weiter erläutert. Für magnetische Medien ist die Beziehung zwischen 𝓜(𝑡) und 𝓗(𝑡) unter ähnlichen Annahmen analog zu Gl. (5.38). Nichtlineare Medien
Ein nichtlineares dielektrisches Medium ist ein Medium, in dem die Beziehung zwischen 𝓟 und 𝓔 nichtlinear ist; die Wellengleichung in der Form (5.24) ist somit nicht anwendbar. Die maxwellschen Gleichungen können aber verwendet werden, um eine nichtlineare Wellengleichung abzuleiten, der elektromagnetische Wellen in solch einem Medium gehorchen. Wir leiten zuerst eine allgemeine, für homogene und isotrope nichtmagnetische Medien gültige Wellengleichung ab. Wenn wir auf die maxwellschen Gleichungen (5.8) die Rotation ∇× anwenden und die Beziehung 𝓑 = 𝜇0 𝓗 aus Gl. (5.19) zusammen mit Gl. (5.7) verwenden, erhalten wir ∇ × (∇ × 𝓔) = −𝜇0 𝜕 2 𝓓∕𝜕𝑡2 . Mithilfe der Vektoridentität ∇ × (∇ × 𝓔) = ∇(∇ ⋅ 𝓔) − ∇2 𝓔 und der Beziehung 𝓓 = 𝜀0 𝓔 + 𝓟 aus Gl. (5.11) folgt ∇(∇ ⋅ 𝓔) − ∇2 𝓔 = −𝜀0 𝜇0
𝜕2 𝓔 𝜕2 𝓟 − 𝜇0 2 . 2 𝜕𝑡 𝜕𝑡
(5.39)
Für homogene und isotrope Medien ist 𝓓 = 𝜀𝓔, daher ist ∇ ⋅ 𝓓 = 0 aus Gl. (5.9) gleichbedeutend mit ∇ ⋅ 𝓔 = 0. Wenn wir dieses Ergebnis zusammen mit 𝜀0 𝜇0 = 1∕𝑐02 aus Gl. (5.6) in Gl. (5.39) einsetzen, erhalten wir ∇2 𝓔 −
1 𝜕2 𝓔 𝜕2𝓟 = 𝜇0 2 . 2 𝜕𝑡 2 𝜕𝑡 𝑐0
(5.40)
Gleichung (5.40) gilt für alle homogenen und isotropen dielektrischen Medien: nichtlineare und lineare, nichtdispersive oder dispersive. Wenn das Medium nichtlinear, nichtdispersiv und nichtmagnetisch ist, kann die Polarisation 𝓟 als eine gedächtnislose nichtlineare Funktion von 𝓔 geschrieben werden, z. B. 𝓟 = 𝛹(𝓔), die an jedem Ort und zu jeder Zeit gilt. (Das einfachste Beispiel solch einer Funktion 2 ist 𝓟 = 𝑎1 𝓔 + 𝑎2 𝓔 mit Konstanten 𝑎1 und 𝑎2 .) Unter diesen Bedingungen wird Gl. (5.40) eine nichtlineare partielle Differentialgleichung für den Vektor 𝓔(r, 𝑡) des elektrischen Feldes: ∇2 𝓔 −
𝜕 2 𝛹(𝓔) 1 𝜕2 𝓔 = 𝜇 . 0 𝜕𝑡2 𝑐02 𝜕𝑡2
(5.41)
Das Superpositionsprinzip ist hier wegen der nichtlinearen Natur dieser Wellengleichung nicht mehr anwendbar. Nichtlineare magnetische Materialien können ähnlich beschrieben werden. Die meisten dielektrischen Medien sind näherungsweise linear, so lange die optische Intensität nicht zu groß wird, was bei fokussierten Laserstrahlen passieren kann. Nichtlineare Optik wird in Kapitel 22 besprochen.
5.3 Monochromatische elektromagnetische Wellen Für den speziellen Fall monochromatischer elektromagnetischer Wellen in einem optischen Medium sind alle Komponenten der elektrischen und magnetischen Felder harmonische Funktionen der Zeit mit derselben Frequenz 𝜈 und einer entsprechenden Kreisfrequenz 𝜔 = 2π 𝜈. Wir übernehmen die komplexe Darstellung aus Abschnitt 2.2.1 und schreiben die sechs reellen Feldkomponenten als 𝓔(r, 𝑡) = Re{E(r) exp(i𝜔𝑡)} , 𝓗(r, 𝑡) = Re{H(r) exp(i𝜔𝑡)} ,
(5.42)
wobei E(r) und H(r) die komplexen Amplitudenvektoren des elektrischen bzw. magnetischen Feldes sind. Analoge komplexe Amplitudenvektoren P, D, M und B hängen in entsprechender Weise mit den reellen Vektoren 𝓟, 𝓓, 𝓜 und 𝓑 zusammen.
5.3 Monochromatische elektromagnetische Wellen
5.3.1 Die maxwellschen Gleichungen in einem Medium Einsetzen von Gl. (5.42) in die maxwellschen Gleichungen (5.7)–(5.10) liefert mit der Beziehung (𝜕∕𝜕𝑡)ei𝜔𝑡 = i𝜔ei𝜔𝑡 für monochromatische Wellen der Kreisfrequenz 𝜔 einen Satz von Gleichungen für die komplexen Amplitudenvektoren der Felder: ∇ × H = i𝜔D ,
(5.43)
∇ × E = −i𝜔b ,
(5.44)
∇⋅D=0,
(5.45)
∇⋅B= 0.
(5.46)
Ähnlich ergeben die Gln. (5.11) und (5.12) D = 𝜀0 E + P ,
(5.47)
B = 𝜇0 H + 𝜇0 M .
(5.48)
5.3.2 Intensität und Leistung Wie in Abschnitt 5.1 gezeigt wird der Fluss der elektromagnetischen Leistung durch das zeitliche Mittel des Poyntingvektors 𝓢 = 𝓔 × 𝓗 bestimmt. Wenn wir diese Beziehung durch komplexe Amplituden ausdrücken, erhalten wir { } { } 𝓢 = Re Eei𝜔𝑡 × Re Hei𝜔𝑡 ) 1 ( i𝜔𝑡 ) 1 ( He + H∗ e−i𝜔𝑡 = Eei𝜔𝑡 + E∗ e−i𝜔𝑡 × 2 2 ) 1 ( = E × H∗ + E∗ × H + ei2𝜔𝑡 E × H + e−i2𝜔𝑡 E∗ × H∗ . 4
(5.49) Die Terme, die die Faktoren ei2𝜔𝑡 und e−i2𝜔𝑡 enthalten, oszillieren mit optischen Frequenzen und werden daher durch die Mittelung ausgelöscht, die im Vergleich zu einer optischen Periode langsam ist. Also ist 1 ⟨𝓢⟩ = (E × H + E × H) = (S + S∗ ) = Re{S} , (5.50) 4 2 1
∗
∗
wobei der Vektor 1
S = E × H∗ 2
(5.51)
als komplexer Poyntingvektor betrachtet werden kann. Die optische Intensität ist der Betrag des Vektors Re{S}.
sodass die maxwellschen Gleichungen (5.43)–(5.46) ausschließlich von den komplexen Amplitudenvektoren E und H abhängen: ∇ × H = i𝜔𝜀E ,
(5.53)
∇ × E = −i𝜔𝜇H ,
(5.54)
∇⋅E= 0,
(5.55)
∇⋅H=0.
(5.56)
Einsetzen der elektrischen und magnetischen Felder 𝓔 und 𝓗 aus Gl. (5.42) in die Wellengleichung (5.24) gibt die Helmholtzgleichung √ ∇2 𝑈 + 𝑘2 𝑈 = 0 , 𝑘 = 𝑛𝑘0 = 𝜔 𝜀𝜇 , (5.57) wobei die skalare Funktion 𝑈 = 𝑈(r) die komplexe Amplitude einer beliebigen der Komponenten (𝐸𝑥 , 𝐸𝑦 , 𝐸𝑧 ) von E bzw. (𝐻𝑥 , 𝐻𝑦 , 𝐻𝑧 ) von H bedeutet und 𝑛 = √ (𝜀∕𝜀0 )(𝜇∕𝜇0 ), 𝑘0 = 𝜔∕𝑐0 sowie 𝑐 = 𝑐0 ∕𝑛 ist. In der Wellenoptik hatten wir die Helmholtzgleichung (2.11) durch die komplexe Amplitude 𝑈(r) der reellen Wellenfunktion 𝑢(r, 𝑡) ausgedrückt.
5.3.4 Inhomogene Medien In einem inhomogenen nichtmagnetischen Medium bleiben die maxwellschen Gleichungen (5.53)–(5.56) gültig, die elektrische Permittivität des Mediums wird jedoch ortsabhängig, 𝜀 = 𝜀(r). Für lokal homogene Medien, in denen sich 𝜀(r) langsam im Vergleich mit der Wellenlänge ändert, bleibt die Helmholtzgleichung √ (5.57) mit den Substitutionen 𝑘 = 𝑛(r)𝑘0 und 𝑛(r) = 𝜀(r)∕𝜀0 näherungsweise gültig.
5.3.5 Dispersive Medien In einem dispersiven dielektrischen Medium hängen 𝓟(𝑡) und 𝓔(𝑡) über die dynamische Beziehung aus Gl. (5.38) zusammen. Um die entsprechende Beziehung zwischen den komplexen Amplitudenvektoren P und E zu bestimmen, setzen wir Gl. (5.42) in Gl. (5.38) ein; das liefert P = 𝜀0 𝜒(𝜈)E ,
(5.58)
wobei
5.3.3 Lineare, nichtdispersive, homogene und isotrope Medien
∞
𝜒(𝜈) = ∫ x(𝑡) exp(−i2π 𝜈𝑡) d𝑡
Für monochromatische Wellen werden die Beziehungen in den Gln. (5.17) und (5.19) zu den Materialgleichungen D = 𝜀E und B = 𝜇H ,
(5.52)
(5.59)
−∞
die Fouriertransformierte von x(𝑡) ist. Gleichung (5.58) kann mithilfe des Faltungstheorems auch direkt aus Gl. (5.38) abgeleitet werden: Die Faltung im Zeitbe-
125
126
5 Elektromagnetische Optik
reich entspricht einer Multiplikation im Frequenzbereich (siehe die Abschnitte A.1 und B.1), und außerdem sind E und P die Komponenten der Frequenz 𝜈 von 𝓔 und 𝓟. Die Funktion 𝜀0 𝜒(𝜈) kann daher als die Übertragungsfunktion des linearen Systems betrachtet werden, das 𝓟(𝑡) und 𝓔(𝑡) verbindet. Entsprechend lautet die Beziehung zwischen 𝓓 und 𝓔 D = 𝜀(𝜈)E ,
(5.60)
gilt und die komplexen Einhüllenden H0 und E0 konstante Vektoren sind. Alle Komponenten von H(r) und E(r) erfüllen die Helmholtzgleichung, sofern der Betrag von k gleich 𝑘 = 𝑛𝑘0 ist, wenn 𝑛 der Brechungsindex des Mediums ist. Wir untersuchen jetzt die Bedingungen, die H0 und E0 erfüllen müssen, damit die maxwellschen Gleichungen gelten. Dazu setzen wir die Gln. (5.63) und (5.64) in die maxwellschen Gleichungen (5.53) und (5.54) ein; das ergibt
mit 𝜀(𝜈) = 𝜀0 [1 + 𝜒(𝜈)] .
(5.61)
In dispersiven Medien sind die Suszeptibilität 𝜒 und die Permittivität 𝜀 somit frequenzabhängig und im Allgemeinen komplex. Damit können wir die Helmholtzgleichung (5.57) einfach für dispersive nichtmagnetische Medien anpassen, indem wir √ (5.62) 𝑘 = 𝜔 𝜀(𝜈)𝜇0 setzen. Wenn 𝜒(𝜈) und 𝜀(𝜈) innerhalb des interessierenden Frequenzbands hinreichend konstant sind, kann das Medium als näherungsweise nichtdispersiv behandelt werden. Die Implikationen der Tatsache, dass 𝜒 und 𝑘 in dispersiven Medien komplex sind, werden wir in Abschnitt 5.5 ausführlicher diskutieren.
5.4 Einfache elektromagnetische Wellen 5.4.1 Ebene, Dipol- und gaußsche elektromagnetische Wellen Wir untersuchen jetzt drei einfache Lösungen der maxwellschen Gleichungen, die in der Optik von großer Bedeutung sind: Ebene Wellen und Kugel- (Dipol-)wellen, die in Abschnitt 2.2.2 im Kontext der Wellenoptik besprochen wurden, und den Gaußstrahl, der im Kapitel 3 mithilfe des Formalismus der Wellenoptik untersucht wurde. Das Medium werden wir linear, homogen, nichtdispersiv und isotrop annehmen, und die Wellen sollen stets monochromatisch sein. Die transversale elektromagnetische (TEM) ebene Welle
Wir betrachten eine monochromatische elektromagnetische Welle, deren komplexe Amplitudenvektoren des elektrischen und magnetischen Feldes ebene Wellen mit dem Wellenvektor k sind (siehe Abschnitt 2.2.2), sodass H(r) = H0 exp(−ik ⋅ r)
(5.63)
E(r) = E0 exp(−ik ⋅ r)
(5.64)
k × H0 = −𝜔𝜀E0
(5.65)
k × E0 = 𝜔𝜇H0 .
(5.66)
Die beiden anderen maxwellschen Gleichungen, (5.55) und (5.56), sind identisch erfüllt, da die Divergenz einer gleichförmigen ebenen Welle null ist. Aus Gl. (5.65) folgt, dass E sowohl auf k als auch auf H senkrecht stehen muss, und aus Gl. (5.66), dass H sowohl zu k als auch zu E senkrecht sein muss. Also sind E, H und k zueinander orthogonal, wie Abb. 5.9 illustriert. Da E und H in einer zur Ausbreitungsrichtung k senkrechten Ebene liegen, wird die Welle als transversale elektromagnetische (TEM) Welle bezeichnet. Nach Gl. (5.65) sind die Beträge 𝐻0 und 𝐸0 durch 𝐻0 = (𝜔𝜀∕𝑘)𝐸0 verknüpft. Ähnlich liefert Gl. (5.66) 𝐻0 = konsistent (𝑘∕𝜔𝜇)𝐸0 . Damit diese beiden Gleichungen √ sind, muss 𝜔𝜀∕𝑘 = 𝑘∕𝜔𝜇 oder 𝑘 = 𝜔 𝜀𝑚𝑢 = 𝜔∕𝑐 = 𝑛𝜔∕𝑐0 = 𝑛𝑘0 gelten. Dieselbe Bedingung muss auch erfüllt sein, damit die Welle die Helmholtzgleichung erfüllt. Das Verhältnis zwischen den Amplituden der elektrischen√und magnetischen Felder ist 𝐸0 ∕𝐻0 = 𝜔𝜇∕𝑘 = 𝑐𝜇 = 𝜇∕𝜀. Diese Größe wird als Impedanz des Mediums bezeichnet, √ 𝐸0 𝜇 𝜂= = . (5.67) 𝐻0 𝜀 Für nichtmagnetische Medien ist 𝜇 = 𝜇0 , weshalb 𝜂 = √ 𝜇0 ∕𝜀 durch die Impedanz 𝜂0 des Vakuums definiert werden kann, 𝜂=
𝜂0 , 𝑛
(5.68)
mit √ 𝜂0 =
𝜇0 ≈ 120π Ω ≈ 377 Ω . 𝜀0
(5.69) 1
Der komplexe Poyntingvektor S = E × H∗ [siehe 2 Gl. (5.51)] ist parallel zu dem Wellenvektor k, sodass die Leistung entlang einer Richtung senkrecht zu den Wel1 lenfronten fließt. Ihr Betrag ist 𝐸0 𝐻0∗ = |𝐸0 |2 ∕2𝜂, die 2
5.4 Einfache elektromagnetische Wellen
E k z
Abb. 5.9 Die transversale elektromagnetische ebene Welle. Die Vektoren E, H und k sind zueinander orthogonal. Die Wellenfronten (Flächen konstanter Phase) sind Normalen zu k.
H Wellenfront
Intensität 𝐼 beträgt daher 𝐼=
|𝐸0 |2 . 2𝜂
(5.70)
A(r) = 𝐴0 𝑈(r)ˆ x,
Wir sehen also, dass die Intensität einer TEM-Welle proportional zum Betragsquadrat der komplexen Einhüllenden des elektrischen Feldes ist. Beispielsweise entspricht eine Intensität von 10 W∕cm2 im Vakuum einem elektrischen Feld von ≈ 87 V∕cm. Beachten Sie die Ähnlichkeit zwischen Gl. (5.70) und der Beziehung 𝐼 = |𝑈|2 für skalare Wellen aus Abschnitt 2.2.1. Gleichung (5.30) besagt, dass die zeitlich gemittelte Energiedichte 𝑊 = ⟨𝒲⟩ der ebenen Welle gleich 1
𝑊 = 𝜀|𝐸0 |2
(5.71)
2
ist, da die elektrischen und magnetischen Beiträge 1 1 gleich sind, d. h. 𝜀|𝐸0 |2 ∕2 = 𝜇|𝐻0 |2 ∕2. Die Intensität 2
2
in Gl. (5.70) und die zeitlich gemittelte Energiedichte in Gl. (5.71) sind gemäß 𝐼 = 𝑐𝑊
das häufig verwendet wird, um die Lösung der maxwellschen Gleichungen zu vereinfachen. Für den betrachteten Fall setzen wir
x ein Einheitsvektor in wobei 𝐴0 eine Konstante und ˆ der Richtung des Dipols (der 𝑥-Richtung) ist. Die Größe 𝑈(r) beschreibt eine skalare Kugelwelle mit dem Ursprung bei 𝑟 = 0: 𝑈(r) =
Die Dipolwelle
Ein schwingender elektrischer Dipol strahlt eine Welle mit Eigenschaften aus, die der in Abschnitt 2.2.2 besprochenen skalaren Kugelwelle ähneln. Diese elektromagnetische Welle kann einfach aus einem Hilfsvektorfeld A(r) konstruiert werden, dem Vektorpotential,
1 exp(−i𝑘𝑟) . 𝑟
(5.74)
Da 𝑈(r) wie in Abschnitt 2.2.2 festgestellt die Helmholtzgleichung erfüllt, muss auch A(r) die Helmholtzgleichung ∇2 A + 𝑘2 A = 0 erfüllen. Wir definieren jetzt das magnetische Feld durch die Rotation dieses Vektors, H=
1 ∇×A, 𝜇
(5.75)
und bestimmen das entsprechende elektrische Feld aus der maxwellschen Gleichung (5.53),
(5.72)
verknüpft. Dies zeigt, dass sich der zeitlich gemittelte Fluss 𝐼 der Leistungsdichte aus dem Transport der zeitlich gemittelten Energiedichte mit Lichtgeschwindigkeit 𝑐 ergibt. Das ist leicht einzusehen, wenn wir uns einen Zylinder der Fläche 𝐴 und Länge 𝑐 vorstellen, dessen Achse parallel zur Ausbreitungsrichtung liegt. Die im Zylinder gespeicherte Energie 𝑐𝐴𝑊 wird in einer Sekunde durch die Querschnittsfläche transportiert; folglich muss die Intensität (Leistung pro Flächeneinheit) 𝐼 = 𝑐𝑊 sein. Die durch eine ebene Welle transportierte Impulsdichte (pro Volumeneinheit) ist (1∕𝑐2 )𝓢 = (1∕𝑐2 )𝑖 𝑘ˆ = ˆ (𝑊∕𝑐)𝑘.
(5.73)
E=
1 ∇×H. i𝜔𝜀
(5.76)
Die Form der Gln. (5.75) und (5.76) stellt sicher, dass wie von den Gln. (5.55) und (5.56) gefordert ∇ ⋅ E = 0 und ∇ ⋅ H = 0 gilt, da die Divergenz der Rotation jedes Vektorfeldes verschwindet. Weil A(r) die Helmholtzgleichung erfüllt, kann leicht gezeigt werden, dass die verbleibende maxwellsche Gleichung, ∇ × E = −i𝜔𝜇H, ebenfalls erfüllt ist. Also definieren die Gln. (5.73)–(5.76) eine gültige elektromagnetische Welle, die die maxwellschen Gleichungen erfüllt. Um explizite Ausdrücke für E und H zu erhalten, müssen die Rotationen in den Gln. (5.75) und (5.76) ausgeführt werden. Das lässt sich am einfachsten in dem in Abb. 5.10(a) illustrierten Kugelkoordinatensystem (𝑟, 𝜃, 𝜙) mit den Einheitsvektoren (ˆ r, ˆ 𝛉, ˆ 𝛟) bewerkstelligen. Die exakten Ergebnisse für E und H lauten 1 1 ] 𝑈(r)ˆ r + i𝑘𝑟 (i𝑘𝑟)2 1 1 ] 𝑈(r)ˆ 𝛉, + 𝐸0 sin 𝜃 [1 + + i𝑘𝑟 (i𝑘𝑟)2
E(r) = 2𝐸0 cos 𝜃 [
(5.77)
127
128
5 Elektromagnetische Optik
x
x Wellenfront r
x H
ϕ
θ
r
θ
H
E
E
θ H z
z
ϕ y
H
y E (a)
H
z
E y
E (b)
(c)
Abb. 5.10 (a) Kugelkoordinaten. (b) Feldvektoren und Wellenfronten des von einem oszillierenden elektrischen Dipol abgestrahlten elektromagnetischen Feldes bei Abständen r ≫ 𝜆∕2π. (c) Die Strahlungscharakteristik (Feldstärke gegen Polarwinkel 𝜃 ) ist toroidal.
H(r) = 𝐻0 sin 𝜃 [1 +
1 ] 𝑈(r)ˆ 𝛟, i𝑘𝑟
(5.78)
wobei 𝐻0 = (i𝑘∕𝜇)𝐴0 und 𝐸0 = 𝜂𝐻0 ist. Man kann zeigen, dass ein entlang der 𝑥-Richtung schwingendes elektrisches Dipolmoment p gerade die in den Gln. (5.77) und (5.78) beschriebene Welle abstrahlt und dass a0 = i𝜇𝜔p und demzufolge 𝐻0 = (−𝜔2 ∕𝑐)p und 𝐸0 = −𝜇𝜔2 p gilt. Für Punkte in Entfernungen vom Ursprung viel größer als eine Wellenlänge (𝑟 ≫ 𝜆 oder 𝑘𝑟 ≫ 2π) können wir für die komplexen Amplitudenvektoren in den Gln. (5.77) und (5.78) näherungsweise E(r) ≈ 𝐸0 sin 𝜃 𝑈(r) ˆ 𝛉
(5.79)
H(r) ≈ 𝐻0 sin 𝜃 𝑈(r) ˆ 𝛟
(5.80)
schreiben. Die Wellenfronten sind nun sphärisch und die elektrischen und magnetischen Felder sind zueinander sowie zur radialen Richtung ˆ r orthogonal; das elektrische Feld zeigt in die polare, das Magnetfeld in die azimutale Richtung. Da die Feldstärke proportional zu sin 𝜃 ist, ist ihre Charakteristik torusförmig mit einer Nullstelle in Dipolrichtung, wie Abb. 5.10(c) zeigt. In der paraxialen Näherung, d. h. an Punkten in der Nähe der 𝑧-Achse und so weit vom Ursprung entfernt, dass 𝜃 ≈ π∕2 und 𝜙 ≈ π∕2 ist, sind die Wellenfrontnormalen fast parallel zur 𝑧-Achse (entsprechend paraxialen Strahlen) und es gilt sin 𝜃 ≈ 1. In einem kartesischen Koordinatensystem ist ˆ 𝛉 = − sin 𝜃 ˆ x + cos 𝜃 cos 𝜙 ˆ y + cos 𝜃 sin 𝜙 ˆ z ≈ −ˆ x + (𝑥∕𝑧)(𝑦∕𝑧) ˆ y + (𝑥∕𝑧) ˆ z ≈ −ˆ x + (𝑥∕𝑧) ˆ z, sodass ( 𝑥 ) z 𝑈(r) , (5.81) x+ ˆ E(r) ≈ 𝐸0 −ˆ 𝑧 wobei 𝑈(r) die paraxiale Näherung der Kugelwelle ist, die in Abschnitt 2.2.2 besprochene Parabolwelle. Für
hinreichend große Werte von 𝑧 kann der Term (𝑥∕𝑧) in Gl. (5.81) auch vernachlässigt werden; damit folgt E(r) ≈ −𝐸0 𝑈(r) ˆ x H(r) ≈
(5.82)
y. 𝐻0 𝑈(r) ˆ
(5.83)
In dieser Näherung geht 𝑈(r) gegen (1∕4π 𝑧)e−i𝑘𝑧 , sodass schließlich eine ebene TEM-Welle wie in Abb. 5.10 resultiert. Ein magnetischer Dipol, dessen magnetisches Dipolmoment m in 𝑥-Richtung zeigt, strahlt eine elektromagnetische Welle ab, die sich zu der diskutierten elektrischen Dipolwelle dual verhält. Im Fernfeld (𝑘𝑟 ≫ 1) zeigt ihr elektrisches Feld in azimutaler und das dazu orthogonale Magnetfeld in polarer Richtung (Abb. 5.11), wobei die komplexen Amplitudenvektoren durch H(r) ≈ 𝐻0 sin 𝜃 𝑈(r)ˆ 𝛉,
(5.84)
E(r) ≈ 𝐸0 sin 𝜃 𝑈(r)ˆ 𝛟,
(5.85)
mit 𝐻0 = (𝜔2 ∕𝑐2 )m und 𝐸0 = 𝜇(𝜔2 ∕𝑐)m gegeben sind. Diese Art von Welle wird im Radiofrequenzbereich von elektrischen Strömen abgestrahlt, die in Schleifenantennen in einer Ebene senkrecht zur 𝑥-Achse fließen. Bei x E Hθ θ z
Abb. 5.11 Eine magnetische Dipolwelle im Fernfeld.
5.4 Einfache elektromagnetische Wellen
x
(a)
–2 z0
–z0
0
z0
z
2 z0
x
Abb. 5.12 (a) Wellenfronten des skalaren Gaußstrahls U(r) in der xz-Ebene. (b) Elektrische Feldlinien des elektromagnetischen Gaußstrahls in der xz-Ebene. (Modifiziert nach H. A. Haus, Waves and Fields in Optoelectronics, Prentice Hall 1984, Abb. 5.3a.)
E E
(b)
z E
optischen Frequenzen können winzige Metallschleifen als optische Antennen (Abschnitt 8.2.4) und wichtige Elemente in Metamaterialien (Abschnitt 8.3.1) dienen.
In Abschnitt 3.1 wurde gezeigt, dass man aus einer Parabolwelle (der paraxialen Näherung einer Kugelwelle) leicht einen skalaren Gaußstrahl erhalten kann, indem man die Koordinate 𝑧 durch 𝑧 + i𝑧0 mit einer reellen Konstante 𝑧0 ersetzt. Dieselbe Transformation auf die entsprechende elektromagnetische Welle angewandt führt zu einem vektoriellen Gaußstrahl. Die Ersetzung von 𝑧 durch 𝑧 + i𝑧0 in Gl. (5.81) gibt 𝑥 ˆ z) 𝑈(r) , 𝑧 + i𝑧0
(5.86)
wobei 𝑈(r) jetzt die komplexe skalare Amplitude des in Gl. (3.7) beschriebenen Gaußstrahls darstellt. Die Wellenfronten des Gaußstrahls sind in Abb. 5.12(a) gezeigt (oder auch in Abb. 3.7), während Abb. 5.12(b) die aus Gl. (5.86) bestimmten elektrischen Feldlinien zeigt. In diesem Fall ist die Richtung des elektrischen Feldes räumlich nicht gleichförmig.
5.4.2 Die Beziehung zwischen elektromagnetischer Optik und skalarer Wellenoptik Die in Abschnitt 2.2.3 definierte skalare paraxiale Welle hat Wellenfrontnormalen, die kleine Winkel mit der axialen Koordinate 𝑧 einschließen. Die Wellenfronten verhalten sich lokal wie ebene Wellen, während sich die komplexe Einhüllende und die Ausbreitungsrichtung langsam mit 𝑧 ändern. Dieser Begriff ist auch auf elektromagnetische Wellen in linearen isotropen Medien anwendbar. Eine paraxiale elektromagnetische Welle wird lokal näherungsweise durch eine ebene TEM-Welle beschrieben. Die Vektoren E und H liegen an jedem Punkt in einer Ebene
H
E H
Der Gaußstrahl
x+ E(r) = 𝐸0 (−ˆ
k
k
E k
E
H
k
z
λ
Abb. 5.13 Eine paraxiale elektromagnetische Welle. Die Vektoren E und H kehren ihre Richtungen nach Ausbreitung um eine halbe Wellenlänge um.
tangential zu den Wellenfronten und der Normalen zum Wellenvektor k (Abb. 5.13). Die optische Leistung fließt entlang der Richtung E × H, die parallel zu k und ungefähr parallel zur Koordinatenachse 𝑧 ist. Eine skalare paraxiale Welle der Intensität 𝐼 = |𝑈|2 [siehe Gl. (2.14)] kann mit mit einer paraxialen elektromagnetischen Welle derselben Intensität 𝐼 = |𝐸|2 ∕2𝜂 [siehe Gl. (5.70)] assoziiert werden,√ indem man die komplexe Amplitude gleich 𝑈 = 𝐸∕ 2𝜂 setzt und die Wellenfronten angleicht. Wie die umfassenden Ausführungen in den Kapiteln 2–4 belegen, ist die Beschreibung des Lichts als skalare Welle eine sehr gute Näherung, um sehr viele Aufgabenstellungen im Zusammenhang mit Interferenz, Beugung, Ausbreitung und Abbildung paraxialer Wellen zu behandeln. Der Gaußstrahl mit kleinem Divergenzwinkel aus Kapitel 3 ist dafür ein typisches Beispiel. Die meisten Eigenschaften solcher Strahlbündel, z. B. ihre Intensität, Bündelung durch Linsen, Reflexion an einem Spiegel, und Interferenz, werden im Rahmen der skalaren Wellenoptik befriedigend beschrieben. Sobald Polarisation in Spiel kommt, schweigt die Wellenoptik natürlich, und wir müssen den Schritt zur elektromagnetischen Optik vollziehen. Interessanterweise erfüllen 𝑈 (wie oben definiert) und 𝐸 nicht dieselben Randbedingungen. Für ein elektrisches Feld tangential zur Grenzfläche zwischen zwei dielektrischen Medien ist 𝐸 beispielsweise stetig
129
130
5 Elektromagnetische Optik
√ (Abb. 5.3), 𝑈 = 𝐸∕ 2𝜂 dagegen unstetig, da 𝜂 seinen Wert an der Grenzfläche ändert. Daher können Aufgaben, bei denen Reflexion und Brechung an Grenzflächen eine Rolle spielen, nicht vollständig innerhalb der skalaren Wellentheorie behandelt werden, obwohl die Phasenanpassung, die zum Brechungsgesetz und dem snelliusschen Gesetz führt, problemlos innerhalb ihres Geltungsbereiches ausgeführt werden kann (Abschnitt 2.4). Tatsächlich hängen Berechnungen des Reflexionsgrads und der Transmission an einer Grenzfläche vom Polarisationszustand des Lichts ab und erfordern daher die elektromagnetische Optik (siehe Abschnitt 6.2). Ähnlich erfordern Aufgabenstellungen, die mit der Transmission von Licht durch dielektrische Wellenleiter zu tun haben, eine Analyse auf der Grundlage der elektromagnetischen Theorie, wie in den Kapiteln 9 und 10 ausführlich besprochen wird.
in Abb. 5.14(b) gezeigt, radial gerichtet ist. Auch hier ist die Feldstärke auf der Achse null. Die Verteilung des Vektorfeldes dieses Strahlbündels ähnelt dem von einem entlang der Strahlachse liegenden Dipol abgestrahlten elektromagnetischen Feld (siehe Abb. 5.10). Es konnte gezeigt werden, dass ein Vektor-Strahlbündel mit radialen elektrischen Feldvektoren durch eine Linse mit großer numerischer Apertur auf einen wesentlich kleineren Punkt fokussiert werden kann, als es mit einem herkömmlichen skalaren Gaußstrahl möglich ist. Es liegt nahe, dass solche Strahlbündel interessante Anwendungen in der hochauflösenden Mikroskopie haben. Auch darüber hinaus besitzt das Thema „Vektor-Strahlbündel und ihre Anwendungen“ eine Vielzahl an interessanten Facetten.
5.5 Absorption und Dispersion 5.4.3 Vektor-Strahlbündel Die maxwellschen Gleichungen in der paraxialen Näherung lassen weitere zylindersymmetrische Lösungen für einen Strahl zu, für die die Richtung des elektrischen Feldvektors räumlich inhomogen ist. Ein Beispiel ist ein Strahlbündel, in dem das elektrische Feld azimutal zur Strahlachse liegt [siehe Abb. 5.14(a)], d. h. E(r) = 𝑈(𝜌, 𝑧) exp(−i𝑘𝑧)ˆ 𝛟.
(5.87)
Die skalare Funktion 𝑈(𝜌𝑧) erweist sich als die BesselGauß-Lösung der Helmholtzgleichung, die in Abschnitt 3.5.1 besprochen wurde. Dieses Strahlbündel verschwindet auf der Achse (𝜌 = 0) und hat eine torusförmige transversale Verteilung. Das Strahlbündel divergiert in axialer Richtung und der Taillenradius nimmt ganz ähnlich wie bei einem Gaußstrahl zu. Ein anderes zylindersymmetrisches Strahlbündel hat einen azimutal orientierten Magnetfeldvektor, sodass der zugehörige elektrische Feldvektor, wie schematisch y
y
In diesem Abschnitt betrachten wir Absorption und Dispersion in nichtmagnetischen Medien.
5.5.1
Absorption
Die bisher betrachteten dielektrischen Medien haben wir als vollständig transparent angesehen, d. h. wir haben keine Absorption von Licht berücksichtigt. Das trifft für Glas im sichtbaren Gebiet des optischen Spektrums zu, aber selbst Glas absorbiert im UV und IR. In diesem Bereichen durchlässige optische Komponenten werden aus anderen Materialien hergestellt, z. B. aus Quarz und Magnesiumfluorid für das UV oder Germanium und Bariumfluorid für das IR. Abbildung 5.15 illustriert die Spektralbereiche, innerhalb derer einige übliche optische Materialien transparent sind (siehe Abschnitt 14.1.4 für die weitere Diskussion). In diesem Abschnitt verfolgen wir einen phänomenologischen Ansatz für die Absorption von Lichts in linearen Medien. Dazu betrachten wir eine komplexe elektrische Suszeptibilität 𝜒 = 𝜒 ′ + i𝜒 ′′
E x
(a)
(5.88)
E x
(b)
Abb. 5.14 Vektor-Strahlbündel mit Zylindersymmetrie. (a) Azimutale elektrische Feldvektoren. (b) Radiale elektrische Feldvektoren. Die Schattierung zeigt die räumliche Verteilung der optischen Intensität in der transversalen Ebene.
entsprechend einer komplexen elektrischen Permittivität 𝜀 = 𝜀0 (1 + 𝜒) und einer komplexen Dielektrizitätskonstante 𝜀∕𝜀0 = (1 + 𝜒). Für monochromatisches Licht bleibt die Helmholtzgleichung (5.57) für die komplexe Amplitude 𝑈(r) gültig, ∇2 𝑈 + 𝑘2 𝑈 = 0, aber die Wellenzahl 𝑘 selbst wird komplex: √ √ √ 𝑘 = 𝜔 𝜀𝜇0 = 𝑘0 1 + 𝜒 = 𝑘0 1 + 𝜒 ′ + i𝜒 ′′ , (5.89) wobei 𝑘0 = 𝜔∕𝑐0 die Vakuumwellenzahl ist.
Fluoride
5.5 Absorption und Dispersion
Magnesiumfluorid MgF2 Calciumfluorid CaF2 Bariumfluorid BaF2
Gläser
Quarzglas SiO2 synth. Quarzglas UV SiO2 synth. Quarzglas IR SiO2 Glas (BK-7) Silicium Si
Halbleiter
Germanium Ge Galliumarsenid GaAs Zinksulfid ZnS Zinkselenid ZnSe Cadmiumtellurid CdTe
0.1
0.2
0.3
0.4 0.5
0.7
1 2 Wellenlänge (µm)
3
4
5
7
10
20
Abb. 5.15 Spektralbereiche der Transparenz von ausgewählten optischen Materialien.
Wenn wir 𝑘 durch seinen Real- und Imaginärteil aus1 drücken, 𝑘 = 𝛽 − i 𝛼, können wir 𝛽 und 𝛼 mit den Sus2 zeptibilitätskomponenten 𝜒 ′ und 𝜒 ′′ verknüpfen: √ 1 (5.90) 𝑘 = 𝛽 − i 𝛼 = 𝑘0 1 + 𝜒 ′ + i𝜒 ′′ . 2
Infolge des Imaginärteils von 𝑘 ändert sich der Betrag einer ebenen Welle mit der komplexen Amplitude 𝑈 = 𝐴 exp(−i𝑘𝑧), die sich in 𝑧-Richtung durch solch 1 ein Medium ausbreitet. Wenn wir 𝑘 = 𝛽 − i 𝛼 einset2 1 zen, erhalten wir 𝑈 = 𝐴 exp(− 𝛼𝑧) exp(−i𝛽𝑧). Für 𝛼 > 2 0 entsprechend einer Absorption im Medium wird die Einhüllende 𝐴 der ursprünglichen ebenen Welle um 1 den Faktor exp(− 𝛼𝑧) abgeschwächt, sodass die Inten2
1
sität, die zu |𝑈|2 proportional ist, um | exp(− 𝛼𝑧)|2 = 2 exp(−𝛼𝑧) abgeschwächt wird. Der Koeffizient 𝛼 wird daher als Absorptionskoeffizient des Mediums bezeichnet (auch Dämpfungskoeffizient oder Extinktionskoeffizient). Dieses einfache exponentielle Abklingen der Intensität liefert die Begründung dafür, weshalb wir 1 den Imaginärteil von 𝑘 als − 𝛼 geschrieben haben. In 2 Abschnitt 15.1.1 werden wir sehen, dass in bestimmten Medien, z. B. in Lasern, auch 𝛼 < 0 sein kann. In diesen Fällen wird 𝛾 ≡ −𝛼 als Gewinnkoeffizient bezeichnet, und das Medium verstärkt Licht, anstatt es abzuschwächen. Da der Parameter 𝛽 die Geschwindigkeit ist, mit der sich die Phase als Funktion von 𝑧 ändert, ist er die Ausbreitungskonstante der Welle. Das Medium hat daher einen effektiven Brechungsindex 𝑛 gemäß 𝛽 = 𝑛𝑘0 ,
(5.91)
und die Welle breitet sich mit einer Phasengeschwindigkeit 𝑐 = 𝑐0 ∕𝑛 aus. Einsetzen von Gl. (5.91) in Gl. (5.90) liefert daher einen Zusammenhang zwischen dem Brechungsindex 𝑛 und dem Absorptionskoeffizienten 𝛼 sowie dem Realund Imaginärteil 𝜒 ′ und 𝜒 ′′ der Suszeptibilität: √ √ 1 𝛼 𝑛−i = 𝜀∕𝜀0 = 1 + 𝜒 ′ + i𝜒 ′′ . (5.92) 2 𝑘0 Die Quadratwurzel in Gl. (5.92) liefert zwei komplexe Zahlen mit entgegengesetzten Vorzeichen (mit einer Phasendifferenz von π). Das Vorzeichen wird so ausgewählt, dass 𝛼 positiv ist, wenn 𝜒 ′′ negativ ist, das Medium also absorbiert und die Welle abgeschwächt wird. Wenn (1 + 𝜒 ′ ) positiv ist, dann liegt die komplexe Zahl 1 + 𝜒 ′ + i𝜒 ′′ im vierten und ihre Quadratwurzel entweder im zweiten oder im vierten Quadranten. Indem wir den Wert im vierten Quadranten auswählen, stellen wir sicher, dass 𝛼 und damit auch 𝑛 positiv sind. Wenn (1 + 𝜒 ′ ) negativ ist, liegt 1 + 𝜒 ′ + i𝜒 ′′ entsprechend im dritten Quadranten und die Wurzel wird so gewählt, dass sie im vierten Quadranten liegt, sodass sowohl 𝛼 als auch 𝑛 positiv sind. Für die mit der komplexen Suszeptibilität 𝜒 verknüpfte Impedanz, die ebenfalls komplex ist, gilt √ 𝜂0 𝜇0 . (5.93) = √ 𝜂= 𝜀 1+𝜒 Im Allgemeinen sind daher 𝜒, 𝑘, 𝜀 und 𝜂 komplex, während 𝛼, 𝛽 und 𝑛 reell sind.
131
132
5 Elektromagnetische Optik
Schwach absorbierende Medien ′′ In einem schwach √absorbierenden Medium √ist 𝜒 ≪ √ ′ ′ ′′ ′ 1 + 𝜒 und daher 1 + 𝜒 + i𝜒 = 1 + 𝜒 1 + i𝛿 ≈ √ 1 1 + 𝜒 ′ (1 + i 𝛿) mit 𝛿 = 𝜒 ′′ ∕(1 + 𝜒 ′ ). Aus Gl. (5.92) folgt 2 dann √ (5.94) 𝑛 ≈ 1 + 𝜒′ ,
𝛼≈−
𝑘0 ′′ 𝜒 . 𝑛
(5.95)
Unter diesen Verhältnissen wird der Brechungsindex durch den Realteil der Suszeptibilität bestimmt und der Absorptionskoeffizient ist proportional zu ihrem Imaginärteil. In einem absorbierenden Medium ist 𝜒 ′′ negativ, sodass 𝛼 positiv ist, wohingegen in einem verstärkenden Medium 𝜒 ′′ positiv und 𝛼 negativ ist. Übung 5-1: Verdünntes absorbierendes Medium
Ein nicht absorbierendes Medium mit dem Brechungsindex 𝑛0 dient als Umgebung für eine verdünnte Suspension von Verunreinigungen mit der Suszeptibilität 𝜒 = 𝜒 ′ + i𝜒 ′′ , wobei 𝜒 ′ ≪ 1 und 𝜒 ′′ ≪ 1 ist. Bestimmen Sie die Gesamtsuszeptibilität des Mediums und zeigen Sie, dass Brechungsindex und Absorptionskoeffizient näherungsweise durch 𝑛 ≈ 𝑛0 + 𝜒 ′ ∕2𝑛0
(5.96)
𝛼 ≈ −𝑘0 𝜒 ′′ ∕𝑛0
(5.97)
gegeben sind. Stark absorbierende Medien
In einem stark absorbierenden Medium ist √ |𝜒 ′′ | ≫ ′ |1 + 𝜒 |, sodass aus Gl. (5.92) 𝑛 − i𝛼∕2𝑘0 ≈ i𝜒 ′′ = √ √ √ 1 −i (−𝜒 ′′ ) = ± √ (1 − i) (−𝜒 ′′ ) folgt und daraus 2
√ (−𝜒 ′′ )∕2 , √ 𝛼 ≈ 2𝑘0 (−𝜒 ′′ )∕2 . 𝑛≈
(5.98) (5.99)
Da 𝜒 ′′ für ein absorbierendes Medium negativ ist, wird das positive Vorzeichen der Quadratwurzel gewählt, um sicherzustellen, dass 𝛼 positiv ist; damit ist auch 𝑛 positiv.
5.5.2 Dispersion Dispersive Medien zeichnen sich durch frequenzabhängige (und daher wellenlängenabhängige) Suszeptibilitäten 𝜒(𝜈), elektrische Permittivitäten 𝜀(𝜈), Brechungsindizes 𝑛(𝜈) und Lichtgeschwindigkeiten 𝑐0 ∕𝑛(𝜈) aus. Da der Brechungswinkel im snelliusschen Gesetz vom Brechungsindex abhängt, der wiederum eine Funktion der
Wellenlänge ist, lenken optische Komponenten wie Prismen oder Linsen aus dispersiven Materialien Licht unterschiedlicher Wellenlängen in unterschiedlicher Weise ab. Dieser Effekt ist dafür verantwortlich, dass brechende Oberflächen Licht nach seiner Wellenlänge auftrennen können und dass die Brechkraft von Linsen von der Wellenlänge abhängt (und damit für die chromatische Aberration in bildgebenden Systemen). Polychromatisches Licht wird daher in einen Bereich von Richtungen gebrochen. Diese Effekte werden schematisch in Abb. 5.16 illustriert. Wegen der frequenzabhängigen Lichtgeschwindigkeit in einem dispersiven Medium erfährt außerdem jede Frequenzkomponente in einem kurzen Lichtpuls eine unterschiedliche Zeitverzögerung. Wenn die Ausbreitungsstrecke in einem Medium signifikant ist, z. B. in Wellenleitern, wird ein kurzer Lichtimpuls am Eingang zeitlich verbreitert, sodass seine Breite am Ausgang wie in Abb. 5.17 gezeigt vergrößert wird. Die Wellenlängenabhängigkeit der Brechungsindizes üblicher optischer Materialien ist in Abb. 5.18 gezeigt. Maße für Dispersion
Die Dispersion von Materialien kann auf mehrere Arten gemessen werden. Für optische Komponenten aus Glas und breitbandiges Licht, das den sichtbaren Bereich abdeckt (weißes Licht), ist ein üblicherweise verwendetes Maß die Abbézahl 𝕍 = (𝑛d − 1)∕(𝑛F − 𝑛C ), wobei 𝑛F , 𝑛d , und 𝑛C die Brechungsindizes des Glases bei drei Standardwellenlängen sind: blau bei 486.1 nm, gelb bei 587.6 nm, und rot bei 656.3 nm. Für Flintglas ist 𝕍 ≈ 38, für synthetisches Quarzglas (fused silica) dagegen 𝕍 ≈ 68. Wenn die Dispersion in der Umgebung einer besonderen Wellenlänge 𝜆0 von Interesse ist, wählt man häufig den Betrag der Ableitung d𝑛∕ d𝜆0 bei dieser Wellenlänge als Maß für die Dispersion. Dieses Maß wird z. B. für Prismen eingesetzt, in denen der Ablenkwinkel 𝜃A des Strahls eine Funktion von 𝑛 ist [Gl. (1.9)]. Die Winkeldispersion d𝜃A ∕ d𝜆0 = (d𝜃A ∕ d𝑛)(d𝑛∕ d𝜆0 ) ist dann das Produkt aus einem Faktor d𝑛∕ d𝜆0 für die Materialdispersion und einem Faktor d𝜃A ∕ d𝑛, der von der Geometrie des Prismas und dem Brechungsindex des Prismenmaterials abhängt. Die Auswirkung der Materialdispersion auf die Ausbreitung von kurzen Lichtpulsen wird nicht nur durch den Brechungsindex 𝑛 und seine erste Ableitung d𝑛∕ d𝜆0 bestimmt, sondern auch durch die zweite Ab2 leitung d 𝑛∕ d𝜆02 , wie in den Abschnitten 5.7 und 23.3 erläutert werden wird.
Brechungsindex
5.5 Absorption und Dispersion
R G B weiß
weiß R G B
weiß
B G R
B G R Wellenlänge
Abb. 5.16 Optische Komponenten aus dispersiven Materialien brechen Wellen mit unterschiedlichen Wellenlängen in unterschiedlichen Winkeln (B = blau, G = grün, R = rot).
Abb. 5.17 Ein dispersives Medium verbreitert einen Lichtpuls, weil die unterschiedlichen Frequenzkomponenten in dem Signal sich mit verschiedenen Geschwindigkeiten ausbreiten. Hier breitet sich die niederfrequente Komponente
As2S3-Glas
2.5 Brechungsindex n
(große Wellenlänge, mit R bezeichnet) schneller aus als die hochfrequente Komponente (kleine Wellenlänge, mit B bezeichnet) und kommt daher früher an.
SrTiO3 AgCl
2 1.5
Quarze glas o synth. Quarzglas
BK7
MgO o Feldspat e NaF
CsBr CaF2 LiF
1 Ge
4
Si
Brechungsindex n
3.5 e
o
GaAs
TiO2
3
o
2.5 e 2 BBO 1.5 1 0.1
o e
z xy KTP
o e
LiNbO3
o e
ZnSe GaN
o e
KDP
1 Wellenlänge / µm
10
Abb. 5.18 Wellenlängenabhängigkeit der Brechungsindizes von ausgewählten optischen Materialien wie Gläsern, Kristallen und Halbleitern. Die Bezeichnungen „o“ und „e“ stehen für die ordentliche bzw. außerordentliche Brechung in anisotropen Materialien (siehe Abschnitt 6.3).
133
134
5 Elektromagnetische Optik
Absorption und Dispersion: Die Kramers-Kronig-Beziehungen
Absorption und Dispersion sind eng miteinander verknüpft. Ein dispersives Material, d. h. ein Material mit wellenlängenabhängigem Brechungsindex, muss absorbieren, und sein Absorptionskoeffizient muss ebenfalls wellenlängenabhängig sein. Die Beziehung zwischen dem Absorptionskoeffizienten und dem Brechungsindex ist eine Folge der Kramers-Kronig-Beziehungen, die den Real- und Imaginärteil der Suszeptibilität eines Mediums, 𝜒 ′ (𝜈) und 𝜒 ′′ (𝜈), miteinander verknüpfen: ∞
𝜒 ′ (𝜈) =
2 𝑠𝜒 ′′ (𝑠) ∫ d𝑠 , π 𝑠2 − 𝜈2
(5.100)
0 ∞
𝜒 ′′ (𝜈) =
2 𝜈𝜒 ′ (𝑠) ∫ d𝑠 . π 𝜈2 − 𝑠2
(5.101)
0
Diese nützlichen Gleichungen ermöglichen es, die fehlende Komponente für alle 𝜈 zu berechnen, wenn entweder der Real- oder der Imaginärteil von 𝜒(𝜈) gegeben ist. Die Kramers-Kronig-Beziehungen zwischen 𝜒 ′′ (𝜈) und 𝜒 ′ (𝜈) liefern mithilfe von Gl. (5.92), die 𝛼 und 𝑛 mit 𝜒 ′′ und 𝜒 ′ verknüpft, auch Beziehungen zwischen dem Absorptionskoeffizienten 𝛼(𝜈) und dem Brechungsindex 𝑛(𝜈). Der Kramers-Kronig-Beziehungen sind ein spezielles Paar von Hilberttransformierten, wie mithilfe der Theorie linearer Systeme verstanden werden kann (siehe Abschnitt B.1). Sie gelten für alle linearen, verschiebungsinvarianten kausalen Systeme mit reellen Impulsantwortfunktionen. Das hier betrachtete lineare System ist die Polarisation 𝓟(𝑡) eines Mediums als Antwort auf ein angelegtes elektrisches Feld 𝓔(𝑡), Gl. (5.38). Da 𝓔(𝑡) und 𝓟(𝑡) reell sind, gilt dies auch für die Impulsantwortfunktion 𝜀0 x(𝑡). Folglich besitzt ihre Fouriertransformierte, die Übertragungsfunktion 𝜀0 𝜒(𝜈), hermitesche Symmetrie: 𝜒(−𝜈) = 𝜒 ∗ (𝜈) (siehe Abschnitt A.1). Dieses System erfüllt daher alle Bedingungen, die für die Gültigkeit der Kramers-Kronig-Beziehungen notwendig sind. Aus diesem Grund sind die Real- und Imaginärteile der Übertragungsfunktion 𝜀0 𝜒(𝜈) durch die Gln. (B.6) und (B.7) und insbesondere durch die Gln. (5.100) und (5.101) verknüpft.
5.5.3 Resonante Medien Wir entwickeln im Folgenden eine einfache klassische mikroskopische Theorie, die zu einer komplexen Suszeptibilität führt und eine Erklärung für die Existenz der frequenzabhängigen Absorption und Dispersion in einem optischen Medium liefert. Der Ansatz ist als Lo-
rentz-Oszillatormodell bekannt. Eine ausführlichere Diskussion der Wechselwirkung von Licht und Materie werden wir in Kapitel 14 geben. Wir betrachten ein dielektrisches Medium wie z. B. eine Ansammlung von resonanten Atomen, in dem die dynamische Beziehung zwischen der Polarisation 𝒫(𝑡) und dem elektrischen Feld ℰ(𝑡), für eine einzelne Polarisation betrachtet, durch eine gewöhnliche lineare Differentialgleichung zweiter Ordnung der Form 2
d𝒫 d𝒫 +ζ + 𝜔02 𝒫 = 𝜔02 𝜀0 𝜒0 ℰ d𝑡2 d𝑡
(5.102)
beschrieben wird, wobei ζ, 𝜔0 , und 𝜒0 Konstanten sind. Eine Gleichung dieser Form tritt auf, wenn die Bewegung der Ladung eines resonanten Atoms phänomenologisch durch einen klassischen harmonischen Oszillator beschrieben wird, in dem die Verschiebung 𝑥(𝑡) der Ladung und die angewandte Kraft ℱ(𝑡) gemäß 2
d𝑥 d𝑥 ℱ +ζ + 𝜔02 𝑥 = 2 𝑚 d𝑡 d𝑡
(5.103)
zusammenhängen. Hier ist 𝑚 die gebundene Ladungs√ menge, 𝜔0 = 𝜅∕𝑚 ist ihre Resonanzfrequenz, 𝜅 ist die elastische Konstante der rücktreibenden Kraft und ζ ist der Dämpfungskoeffizient. Wenn das Dipolmoment eines einzelnen Atoms p = −𝑒𝑥 ist, ist die Polarisation des gesamten Mediums durch 𝒫 = Np = −N 𝑒𝑥 mit der Ladungsverschiebung verknüpft, wobei −𝑒 die elektronische Ladung und N die Zahl von Atomen pro Volumeneinheit des Mediums bedeuten. Das elektrische Feld und die Kraft hängen durch ℰ = ℱ∕(−𝑒) zusammen. Die Größen 𝒫 und ℰ sind daher proportional zu 𝑥 bzw. ℱ, und der Vergleich von Gl. (5.102) und Gl. (5.103) ergibt 𝜒0 =
N𝑒2
𝜀0 𝑚𝜔02
.
(5.104)
Wir können uns folglich vorstellen, dass das angewandte elektrische Feld in jedem Atom ein zeitabhängiges elektrisches Dipolmoment induziert (Abb. 5.19) und folglich eine zeitabhängige Polarisation im Gesamtmedium entsteht. Das Medium wird durch seine Impulsantwortfunktion 𝜀0 x(𝑡), eine exponentiell abklingende harmonische Funktion, oder durch seine Übertragungsfunktion 𝜀0 𝜒(𝜈) vollständig charakterisiert, die durch Lösen von Gl. (5.102) für jede einzelne Frequenz berechnet wird. Dazu setzen wir ℰ(𝑡) = Re{𝐸 exp(i𝜔𝑡)} und 𝒫(𝑡) = Re{𝑃 exp(i𝜔𝑡)} in Gl. (5.102) ein; das ergibt (−𝜔2 + iζ𝜔 + 𝜔02 )𝑃 = 𝜔02 𝜀0 𝜒0 𝐸 ,
(5.105)
5.5 Absorption und Dispersion
√
𝜈0 1 ∓ 1∕𝑄. Für große 𝑄 oszilliert 𝜒 ′ zwischen positiven und negativen Werten mit einem Betrag von etwa 𝜒0 𝑄∕2, d. h. der Hälfte des Maximalwerts von 𝜒 ′′ . Die Vorzeichen von 𝜒 ′ und 𝜒 ′′ bestimmen die Phase von 𝜒, die einfach den Winkel zwischen den Zeigern 𝑃 und 𝐸 angibt. Das Verhalten von 𝜒(𝜈) in der Nähe der Resonanz (𝜈 ≈ 𝜈0 ) ist häufig von besonderem Interesse. In diesem Gebiet können wir im Realteil des Nenners von Gl. (5.106) die Näherung (𝜈02 − 𝜈2 ) = (𝜈0 + 𝜈)(𝜈0 − 𝜈) ≈ 2𝜈0 (𝜈0 − 𝜈) verwenden und in dessen Imaginärteil 𝜈 durch 𝜈0 ersetzen; so bekommen wir
t – –
Abb. 5.19 Ein zeitlich variierendes elektrisches Feld ℰ , das an ein Lorentz-Oszillatoratom angelegt wird, erzeugt ein zeitlich variierendes Dipolmoment p, das zur Gesamtpolarisation 𝒫 beiträgt.
woraus 𝑃 = 𝜀0 [𝜒0 𝜔02 ∕(𝜔02 − 𝜔2 + iζ𝜔)]𝐸 folgt. Diese Beziehung schreiben wir in der Form 𝑃 = 𝜀0 𝜒(𝜈)𝐸, setzen 𝜔 = 2π𝜈 ein und erhalten so einen Ausdruck für die frequenzabhängige Suszeptibilität, 𝜒(𝜈) = 𝜒0
𝜈02 𝜈02 − 𝜈2 + i𝜈 Δ𝜈
,
𝜒(𝜈 ≈ 𝜈0 ) ≈ 𝜒0
𝜈0 Δ𝜈 1 , 4 (𝜈0 − 𝜈)2 + (Δ𝜈∕2)2 𝜈 − 𝜈0 ′′ 𝜒 (𝜈) . 𝜒 ′ (𝜈) ≈ 2 Δ𝜈
𝜒 ′′ (𝜈) ≈ −𝜒0
wobei 𝜈0 = 𝜔0 ∕2π die Resonanzfrequenz und Δ𝜈 = ζ∕2π ist. Real- und Imaginärteil von 𝜒(𝜈), die wir mit 𝜒 ′ (𝜈) bzw. 𝜒 ′′ (𝜈) bezeichnen, sind daher ( ) 𝜈02 𝜈02 − 𝜈2 ′ 𝜒 (𝜈) = 𝜒0 ( , (5.107) )2 𝜈02 − 𝜈2 + (𝜈 Δ𝜈)2 (5.108)
χ0
𝜒(𝜈) ≈ 𝜒0
ν0
ν
ν0
𝜈02 𝜈02 − 𝜈2
,
(5.112)
Abb. 5.20 Real- und Imaginärteile der Suszeptibilität eines resonanten dielektrischen Mediums. Der Realteil 𝜒 ′ (𝜈) ist unterhalb der Resonanz positiv, null bei der Resonanz, und darüber negativ. Der Imaginärteil 𝜒 ′′ (𝜈) ist überall negativ, sodass −𝜒 ′′ (𝜈) überall positiv ist und ein Maximum 𝜒0 Q bei 𝜈 = 𝜈0 besitzt, wo Q = 𝜈0 ∕Δ𝜈 ist. Die Kurven sind für Q = 10 dargestellt.
χ 0Q
Δν
(5.111)
sodass die Absorption des Mediums vernachlässigbar ist. Der Absorptionskoeffizient und der Brechungsindex eines resonanten Mediums können bestimmt werden, indem man die Ausdrücke für 𝜒 ′ (𝜈) und 𝜒 ′′ (𝜈), z. B. die Gln. (5.110) und (5.111), in Gl. (5.92) einsetzt. Jeder dieser Parameter hängt im Allgemeinen sowohl von 𝜒 ′ (𝜈) als auch von 𝜒 ′′ (𝜈) ab. In dem Spezialfall, dass
–χʺ(ν)
Δν
(5.110)
Die Funktion 𝜒 ′′ (𝜈) in Gl. (5.110), die als Lorentzfunktion bezeichnet wird, fällt auf die Hälfte ihres Maximalwerts, wenn |𝜈 − 𝜈0 | = Δ𝜈∕2 ist. Der Parameter Δ𝜈 ist daher die Halbwertsbreite von 𝜒 ′′ (𝜈). Das Verhalten von 𝜒(𝜈) weit von der Resonanz entfernt ist ebenfalls von Interesse. Im Grenzfall |(𝜈 − 𝜈0 )| ≫ Δ𝜈 ist die Suszeptibilität nach Gl. (5.106) näherungsweise reell,
Diese Gleichungen sind in Abb. 5.20 aufgetragen. Bei Frequenzen weit unterhalb der Resonanz (𝜈 ≪ 𝜈0 ) ist 𝜒 ′ (𝜈) ≈ 𝜒0 und 𝜒 ′′ (𝜈) ≈ 0, sodass die Suszeptibilität bei kleinen Frequenzen einfach 𝜒0 ist. Bei Frequenzen weit oberhalb der Resonanz (𝜈 ≫ 𝜈0 ) ist 𝜒 ′ (𝜈) ≈ 𝜒 ′′ (𝜈) ≈ 0, sodass sich das Medium wie ein Vakuum verhält. Bei Resonanz (𝜈 = 𝜈0 ) ist 𝜒 ′ (𝜈0 ) = 0, und −𝜒 ′′ (𝜈0 ) erreicht seinen Maximalwert 𝜒0 𝑄 mit 𝑄 = 𝜈0 ∕Δ𝜈. Die Resonanzfrequenz 𝜈0 ist gewöhnlich viel größer als Δ𝜈, sodass 𝑄 ≫ 1 gilt. Folglich ist der Betrag des Maximalwerts von −𝜒 ′′ (𝜈), der gleich 𝜒0 𝑄 ist, viel größer als 𝜒 ′ (𝜈) bei kleinen Frequenzen (𝜒0 ). Die Maximal- und Minimalwerte von 𝜒 ′ (𝜈) sind ±𝜒0 𝑄∕(2 ∓ 1∕𝑄) und liegen bei χ ʹ(ν)
(5.109)
und damit
(5.106)
𝜈02 𝜈 Δ𝜈 𝜒 ′′ (𝜈) = −𝜒0 ( . )2 𝜈02 − 𝜈2 + (𝜈 Δ𝜈)2
𝜈0 ∕2 (𝜈0 − 𝜈) + iΔ𝜈∕2
ν
135
5 Elektromagnetische Optik
Δν
χ0/2n0
Δν
ν0
ν
n0
ν
ν0
die resonanten Atome in ein nichtdispersives Wirtsmedium mit dem Brechungsindex 𝑛0 eingebettet und hinreichend verdünnt sind, sodass 𝜒 ′′ (𝜈) und 𝜒 ′ (𝜈) beide ≪ 1 sind, ist diese Abhängigkeit jedoch viel einfacher; in dieser Situation hängt der Brechungsindex von 𝜒 ′ und der Absorptionskoeffizient von 𝜒 ′′ ab. Durch Verwendung der Ergebnisse aus Übung 5-1 kann man leicht zeigen, dass die Parameter nun durch 2π 𝜈 ) 𝜒 ′′ (𝜈) , 𝑛0 𝑐0 𝜒 ′ (𝜈) 𝑛(𝜈) ≈ 𝑛0 + 2𝑛0
𝛼(𝜈) ≈ − (
Abb. 5.21 Absorptionskoeffizient 𝛼(𝜈) und Brechungsindex n(𝜈) eines dielektrischen Mediums mit dem Brechungsindex n0 , das eine geringe Konzentration von Atomen der Resonanzfrequenz 𝜈0 enthält.
ν
(5.113) (5.114)
gegeben sind. Die Abhängigkeit dieser Größen von 𝜈 wird in Abb. 5.21 dargestellt.
ν1
ν3
ν
Abb. 5.22 Frequenzabhängigkeit des Absorptionskoeffizienten 𝛼(𝜈) und des Brechungsindex n(𝜈) für ein Medium mit drei Resonanzen. Ultraviolett
Medien mit Mehrfachresonanzen
Ein typisches dielektrisches Medium enthält viele Resonanzen von verschiedenen Gitter- und elektronischen Schwingungen. Die Gesamtsuszeptibilität entsteht als Superposition von Beiträgen dieser Resonanzen. Während der Imaginärteil der Suszeptibilität überwiegend auf Frequenzen in der Nähe der Resonanz beschränkt ist, trägt der Realteil bei allen Frequenzen nahe bei und unterhalb der Resonanz bei, wie Abb. 5.20 zeigt. Das zeigt sich in der Frequenzabhängigkeit des Absorptionskoeffizienten und des Brechungsindex, wie in Abb. 5.22 zu sehen ist. Absorption und Dispersion sind in der Nähe der Resonanz am stärksten. In großer Entfernung von der Resonanz ist der Brechungsindex konstant, und das Medium ist näherungsweise nichtdispersiv und nicht absorbierend. Jede Resonanz liefert aber einen konstanten Beitrag zum Brechungsindex bei allen Frequenzen unterhalb ihrer Resonanzfrequenz. Auch andere komplexe Prozesse können zu dem Absorptionskoeffizienten und dem Brechungsindex eines Materials beitragen, sodass verschiedene Muster der Frequenzabhängigkeit entstehen. Abbildung 5.23 zeigt ein Beispiel der Wellenlängenabhängigkeit von Absorptionskoeffizient und Brechungsindex eines dielektrischen Materials, das bei sichtbaren Wellenlängen im Wesentlichen transparent ist. Die Illustration zeigt einen abnehmenden Brechungsindex mit zunehmender Wellen-
ν2
Absorptionskoeffizient α
Infrarot
sichtbar
n(ν)
Absorptionskoeffizient α (ν)
α(ν)
Brechungsindex n(ν)
136
λ0
Brechungsindex n
0.01
0.1
1
10
100
λ 0 (µm)
Abb. 5.23 Eine typische Wellenlängenabhängigkeit von Absorptionskoeffizient und Brechungsindex für ein dielektrisches Medium mit resonanter Absorption im ultravioletten und infraroten Spektralbereich. Damit geht eine niedrige Absorption im sichtbaren Bereich einher. Beachten Sie, dass auf der Abszisse die Wellenlänge und nicht die Frequenz aufgetragen ist.
länge im sichtbaren Gebiet, der durch eine nahe gelegene Resonanz im Ultravioletten verursacht wird. Das Material ist daher bei kürzeren sichtbaren Wellenlängen stärker dispersiv, weil sich dort der Brechungsindex am schnellsten ändert. Dieses Verhalten unterscheidet sich nicht von dem in den Abb. 5.15 und 5.18 für verschiedene reale dielektrische Materialien gezeigten.
5.6 Die Streuung elektromagnetischer Wellen
Die Sellmeiergleichung
In einem Medium mit Resonanzen 𝑖 = 1, 2, … ist die Suszeptibilität für Frequenzen in großer Entfernung von den Resonanzen näherungsweise durch eine Summe von Termen der Form von Gl. (5.112) gegeben. Mithilfe der Beziehung zwischen dem Brechungsindex und der reellen Suszeptibilität aus Gl. (5.26), 𝑛2 = 1 + 𝜒, nimmt die Abhängigkeit von 𝑛 von Frequenz und Wellenlänge eine Form an, die als Sellmeiergleichung bekannt ist: 𝑛2 ≈ 1 +
∑
𝜒0𝑖
𝑖
𝜈𝑖2 𝜈𝑖2 − 𝜈2
=1+
∑ 𝑖
𝜒0𝑖
𝜆2 . (5.115) 𝜆 2 − 𝜆𝑖2
Die Sellmeiergleichung gibt eine gute Beschreibung der Brechungsindizes der meisten optisch transparenten Materialien. Für 𝜆 ≪ 𝜆𝑖 wird der 𝑖-te Term näherungsweise proportional zu 𝜆 2 , und für 𝜆 ≫ 𝜆𝑖 wird er näherungsweise konstant. Die in Beispiel 5-2 diskutierte Dispersion von synthetischem Quarzglas wird beispielsweise in guter Näherung durch drei Resonanzen beschrieben. Für einige Materialien kann die Sellmeiergleichung der Bequemlichkeit halber durch eine Potenzreihe angenähert werden. Tabelle 5.1 zeigt die Sellmeiergleichungen für einige ausgewählte Materialien, die nach der Methode der kleinsten Fehlerquadrate an Messwerte angepasst wurden.
5.6 Die Streuung elektromagnetischer Wellen In früheren Kapiteln hatten wir die Ausbreitung optischer Wellen durch homogene Medien, die Reflexion und Brechung von Licht an dielektrischen Grenzflächen, den Durchgang von Wellen durch optische Komponenten und die Beugung an Öffnungen untersucht. In Abschnitt 5.5 haben wir die Absorption und Dispersion von Licht betrachtet. Nun wollen wir uns der Streuung von Licht zuwenden, die in verschiedenen Bereichen der Optik einschließlich der Nanophotonik eine wichtige Rolle spielt. Vor allem untersuchen wir die Lichtstreuung in einem homogenen Medium mit lokalisierten Inhomogenitäten, Unregelmäßigkeiten, Materialdefekten oder Schwebeteilchen. Wir nehmen dazu an, dass sowohl das Medium als auch die Streustellen Dielektrika mit linearen und isotropen optischen Eigenschaften sind. Die Streuung an einer kleinen metallenen Kugel wird in Abschnitt 8.2.3 beschrieben; verschiedene Formen der Lichtstreuung werden in Abschnitt 14.5.3 diskutiert.
Tab. 5.1 Sellmeiergleichungen für die Wellenlängenabhängigkeit der Brechungsindizes für ausgewählte Materialien bei Zimmertemperatur. Die Größen no und ne bezeichnen die ordentlichen und außerordentlichen Brechungsindizes für anisotrope Materialien (siehe Abschnitt 6.3). Der Gültigkeitsbereich der Ergebnisse ist in der rechten Spalte angegeben. Material
Sellmeiergleichung
Gültigkeitsbereich
(Wellenlänge 𝝀 in 𝛍 m)
(𝛍 m)
synth. Quarzglas
𝑛2 = 1 +
0.6962𝜆2 0.4079𝜆2 0.8975𝜆2 + 2 + 2 𝜆2 − (0.06840)2 𝜆 − (0.1162)2 𝜆 − (9.8962)2
0.21–3.71
Si
𝑛2 = 1 +
10.6684𝜆2 0.0030𝜆2 1.5413𝜆2 + 2 + 2 𝜆2 − (0.3015)2 𝜆 − (1.1347)2 𝜆 − (1104.0)2
1.36–11
GaAs
𝑛2 = 3.5 +
BBO
𝑛o2 = 2.7359 +
0.01878 − 0.01354𝜆2 𝜆2 − 0.01822
𝑛e2 = 2.3753 +
0.01224 − 0.01516𝜆2 𝜆2 − 0.01667
KDP
𝑛o2 = 1 + 𝑛e2 = 1 +
LiNbO3
𝜆2
7.4969𝜆2 1.9347𝜆2 + 2 2 − (0.4082) 𝜆 − (37.17)2
1.2566𝜆2 33.8991𝜆2 + 2 𝜆2 − (0.09191)2 𝜆 − (33.3752)2 𝜆2
1.4–11 0.22–1.06
0.4–1.06
1.1311𝜆2 5.7568𝜆2 + 2 2 − (0.09026) 𝜆 − (28.4913)2
𝑛o2 = 2.3920 + 𝑛e2 = 2.3247 +
2.5112𝜆2 7.1333𝜆2 + 2 2 − (0.217) 𝜆 − (16.502)2
𝜆2
2.2565𝜆2 14.503𝜆2 + 2 𝜆2 − (0.210)2 𝜆 − (25.915)2
0.4–3.1
137
138
5 Elektromagnetische Optik
5.6.1 Die bornsche Näherung Wenn eine optische Welle sich in einem optisch homogenen Medium in einer bestimmten Richtung ausbreitet und dabei auf ein Objekt mit anderen optischen Eigenschaften trifft, wird sie gestreut. Die Situation kann im Prinzip durch Lösen der maxwellschen Gleichungen und Anwenden der entsprechenden Randbedingungen analysiert werden. Analytische Lösungen existieren hierfür jedoch nur in wenigen Idealfällen. Wir greifen daher auf einen üblichen Näherungsansatz zur Lösung solcher Fragestellungen zurück, der als bornsche Näherung bekannt ist. Diese Näherung gilt für schwache Streuung, d. h. dann, wenn das streuende Objekt als kleine Störung der relativen Permittivität (oder anderer optischer Eigenschaften) des Mediums angesehen werden kann. Um die bornsche Näherung einzuführen, ist es zweckmäßig, zunächst die Streuung einer skalaren Welle zu untersuchen und anschließend eine elektromagnetische Welle zu betrachten. Die skalare komplexe Amplitude 𝑈(r) gehorcht der Helmholtzgleichung (2.11), [ 2 ] ∇ + 𝑘2 (r) 𝑈 = 0 ,
(5.116)
wobei für die Wellenzahl innerhalb des streuenden Objekts 𝑘(r) = 𝑘S (r) gilt, während in dem als homogen angenommenen Wirtsmedium 𝑘(r) = 𝑘 sein soll. Wir schreiben nun 𝑘2 (r) = 𝑘2 + [𝑘2 (r) − 𝑘2 ], um Gl. (5.116) als Helmholtzgleichung für die gestreute komplexe Amplitude 𝑈S (r) schreiben zu können, (∇2 + 𝑘2 )𝑈S = −𝑆 ,
(5.117)
wobei die Streuquelle [ ] 𝑆(r) = 𝑘S2 (r) − 𝑘2 𝑈S (r)
(5.118)
innerhalb des Volumens 𝑉 der Streuquelle lokalisiert und außerhalb davon null ist. Wie noch zu begründen sein wird, lautet die Lösung von Gl. (5.117) an Orten r außerhalb des Volumens 𝑉 ′
𝑈S (r) = ∫ 𝑆(r′ ) 𝑉
e−i𝑘|r−r | dr′ . 4π |r − r′ |
(5.119)
Dieses Integral kann jedoch nicht ohne Weiteres ausgewertet werden, um 𝑈S (r) zu bestimmen, da die Streuquelle 𝑆(r′ ) gemäß Gl. (5.118) selbst von der unbekannten Welle 𝑈S (r) abhängt. Bei schwacher Streuung können wir jedoch davon ausgehen, dass die einfallende Welle 𝑈0 (r) von dem Streuprozess innerhalb des Volumens 𝑉 im Wesentlichen unbeeinflusst bleibt. In diesem Fall können wir die
gestreute Welle US
einfallende Welle U0
umgebendes Medium
streuendes Objekt
Abb. 5.24 In der bornschen Näherung ist die gestreute Welle US (r) eine Superposition von Kugelwellen, die jeweils von einem Punkt im Streuzentrum ausgehen.
komplexe Amplitude 𝑈S (r) in dem Ausdruck Gl. (5.118) für die Streuquelle näherungsweise gleich der komplexen Amplitude 𝑈0 (r) der einfallenden Welle setzen; so erhalten wir [ ] (5.120) 𝑆(r) ≈ 𝑘S2 (r) − 𝑘2 𝑈0 (r) . Diesen Ausdruck können wir nun in Gl. (5.119) verwenden, um die komplexe Amplitude 𝑈S (r) der gestreuten Welle zu bestimmen. Mit der Annahme einer schwachen Streuung ist die Bedingung verbunden, dass eine an einem Punkt im Streuvolumen 𝑉 gestreute Welle anschließend nicht noch einmal an einem anderen Punkt gestreut wird, d. h. dass Mehrfachstreuung ein vernachlässigbarer Effekt zweiter Ordnung ist. Aus Gl. (5.119) wird deutlich, dass die gestreute Welle 𝑈S (r) unter diesen Bedingungen näherungsweise eine Superposition von Kugelwellen ist, die durch ein Kontinuum von punktförmigen Streuquellen innerhalb des Streuvolumens erzeugt werden, wie Abb. 5.24 illustriert. Jeder Punkt r′ erzeugt eine Kugelwelle mit der Amplitude 𝑆(r′ ), die näherungsweise durch Gl. (5.120) gegeben ist. Das Konzept ähnelt somit dem HuygensFresnel-Prinzip der Beugung aus Abschnitt 4.1.4 (siehe Abb. 4.18). Bei diesem als elastische Streuung bezeichneten Prozess bleibt die Frequenz des gestreuten Lichts unverändert.
5.6.2
Rayleighstreuung
Die sogenannte Rayleighstreuung beschreibt die Streuung an kleinen Streuzentren. Sie wird durch Inhomogenitäten in einem Medium wie beispielsweise eingeschlossene Teilchen mit Größen deutlich unterhalb einer Wellenlänge oder sonstige zufällige Inhomogenitäten auf einer ähnlichen Größenskala hervorgerufen.
5.6 Die Streuung elektromagnetischer Wellen
Schwache Streuung: Skalare Wellen
Schwache Streuung: Elektromagnetische Wellen
Wenn der Unterschied zwischen den optischen Eigenschaften der Streuzentren und des umgebenden Mediums klein ist, d. h. wenn die Streuung schwach ist, können wir die bornsche Näherung anwenden. Wir betrachten ein einzelnes Streuzentrum am Punkt r = 0, das viel kleiner als die Wellenlänge des Lichts ist. In diesem Fall können wir die transversale Verteilung aus Gl. (5.120) näherungsweise als 𝑆(r) ≈ (𝑘S2 − 𝑘2 )𝑈0 𝑉𝛿(r) schreiben, wobei 𝛿(r) die Deltafunktion und 𝑘S die Wellenzahl innerhalb des kleinen Streuzentrums sind. Das setzen wir in das in Gl. (5.119) angegebene Integral ein und erhalten so
Die Herleitung der oben betrachteten gestreuten Welle basiert auf einer skalaren komplexen Amplitude, die eine Lösung der Helmholtzgleichung (5.116) ist. Die Streuung einer elektromagnetischen Welle können wir ähnlich formulieren, indem wir von dem Vektorpotential A ausgehen, das die Helmholtzgleichung ebenfalls erfüllt. Mithilfe der bornschen Näherung können wir das Vektorpotential der gestreuten Welle in Analogie zu Gl. (5.119) als Superposition von Dipolwellen um Punkte innerhalb des Streuzentrums ausdrücken. Das Vektorpotential A eines oszillierenden Dipols hat die Form einer Kugelwelle mit den in Abschnitt 5.4.1 beschriebenen komplexen Amplituden des elektrischen und magnetischen Feldes. Aus elektromagnetischer Sicht können wir Streuung somit als die durch die einfallende Welle bewirkte Anregung einer Vielzahl von oszillierenden elektrischen Dipolen an allen Punkten innerhalb des Streuzentrums auffassen, von denen jeder eine Dipolwelle emittiert. Für ein einzelnes kleines Streuzentrum im Ursprung ist die gestreute elektromagnetische Welle identisch mit derjenigen, die von einem einzelnen elektrischen Dipol abgestrahlt wird, der in Richtung des elektrischen Feldes 𝐸0 der einfallenden Welle orientiert ist, wie in Abb. 5.25 dargestellt. Im Fernbereich (𝑟 ≫ 𝜆) sind die elektrischen und magnetischen Feldvektoren der gestreuten Welle in polarer und azimutaler Richtung gerichtet, wie die Gln. (5.83) und (5.86) zeigen und Abb. 5.10 illustriert. Für die komplexe Amplitude des elektrischen Feldes der gestreuten Welle gilt somit
𝑈S ≈ (𝑘S2 − 𝑘2 )𝑉𝑈0
e−i𝑘𝑟 . 4π 𝑟
(5.121)
Das ist die Gleichung einer einzelnen Kugelwelle um r = 0 (den Ort des Streuzentrums), deren Amplitude proportional zu der der einfallenden Welle 𝑈0 ist. Nach Gl. (2.14) ist die Intensität der gestreuten Welle folglich 𝐼S = |𝑈S |2 ≈ (𝑘S2 − 𝑘2 )
ei𝑘𝑟 4π 𝑟
(5.122)
mit 𝐼0 = |𝑈0 |2 . Da die skalar gestreute Welle isotrop ist, gilt für die insgesamt gestreute Leistung PS = 4π𝑟 2 𝐼S PS ≈
1 2 (𝑘 − 𝑘2 )2 𝑉 2 𝐼0 ; 4π S
(5.123)
die gestreute Leistung ist folglich proportional zum Quadrat des Streuvolumens 𝑉. Da 𝑘S und 𝑘 beide proportional zu 𝜔 sind, bedeutet Gl. (5.123), dass die gestreute Leistung proportional zu 𝜔4 oder 1∕𝜆 4 ist. Dieser Zusammenhang ist als Rayleighs inverses Potenzgesetz bekannt. Es zeigt, dass einfallende Wellen mit kleiner Wellenlänge stärker gestreut werden als Wellen mit großer Wellenlänge. Beispielsweise ist die Rayleighstreuung von Licht der Wellenlänge 𝜆0 = 400 nm um einen Faktor 24 = 16 stärker als die von Licht der Wellenlänge 𝜆0 = 800 nm. Rayleighstreuung an Dichteschwankungen der Luft, deren Ausdehnungen kleiner sind als die Wellenlängen des sichtbaren Lichts, ist auch für das Blau des Himmels verantwortlich. Das kurzwellige (blaue) Licht wird auf seinem Weg durch die Atmosphäre stärker gestreut, wodurch es aus dem von der Sonne ankommenden Licht entfernt wird, was dieses beim direkten Blick Richtung Sonne gelblich wirken lässt. Wenn wir aber neben die Sonne schauen, sehen wir die gestreute blaue Strahlung in Form des blauen Himmels. In optischen Fasern aus Quarzglas ist die Rayleighstreuung Schuld daran, dass sichtbares Licht stärker abgeschwächt wird als infrarotes, wie in Abschnitt 8.3.1 genauer erläutert wird.
ES ≈ 𝐸S,0 sin 𝜃
ei𝑘𝑟 ˆ 𝛉 mit 𝐸S,0 = −(𝑘S2 − 𝑘2 )𝑉𝐸0 , 4π 𝑟 (5.124)
sodass die Intensität der gestreuten Welle |2 𝑉 2 2 | 𝐼0 sin 𝜃 𝐼S = |||𝑘S2 − 𝑘2 ||| (4π 𝑟)2
(5.125)
wird, wobei 𝐼0 durch Gl. (5.70) gegeben ist. Die Winkelverteilung der gestreuten Welle ist somit unabhängig von 𝜙 und nimmt die in Abb. 5.25 gezeigte toroidale Form an. Für 𝜃 = π∕2 ist die Streuung maximal, d. h. wenn die gestreute Welle senkrecht zur Richtung des elektrischen Feldes der einfallenden Welle liegt. Die Rückwärtsstreuung besitzt dieselbe Intensität wie die Vorwärtsstreuung. Der in Gl. (5.125) angegebene Ausdruck für die elektromagnetische Intensität unterscheidet sich von dem aus Gl. (5.122) für die skalare Intensität um den Fak2 tor sin 𝜃. Dieser Unterschied entsteht dadurch, dass
139
140
5 Elektromagnetische Optik
kleiner Streuzentren 1 || 2 |2 𝜎S = |𝑘 − 𝑘2 ||| 𝑉 2 . 6π | S
θ E0
Als konkretes Beispiel wollen wir den Streuquerschnitt eines kugelförmigen dielektrischen Streuzentrums mit dem Radius 𝑎 und der Permittivität 𝜀S betrachten, das in ein dielektrisches Medium mit der Permittivität 𝜀 eingebettet ist (unter der Annahme, dass beide Medien dieselbe magnetische Permeabilität 𝜇 besitzen). √ √ √ Wir setzen 𝑘 = 𝜔 𝜀𝜇 = 2π∕𝜆, 𝑘S = 𝜔 𝜀S 𝜇 = 𝜀S ∕𝜀 ⋅
k einfallende Welle U0
streuendes Objekt
4
2π∕𝜆 und 𝑉 = π𝑎3 in Gl. (5.128) ein und erhalten
umgebendes Medium
3
Abb. 5.25 Eine transversale elektromagnetische ebene Welle E0 wird an einem punktförmigen Streuzentrum (grauer Kreis im Zentrum) gestreut und erzeugt eine gestreute elektrische Dipolwelle ES mit einer torusförmigen Charakteristik. 2 Für die Streuintensität gilt IS ∝ sin 𝜃 , wobei 𝜃 der Streuwinkel ist.
der oszillierende Dipol eine transversale elektromagnetische Welle emittiert, was die Streuung in einer Richtung parallel zum einfallenden elektrischen Feld unmöglich macht, während die skalare Wellenoptik die Polarisation vernachlässigt. Die gesamte gestreute Leistung erhalten wir durch Integration von Gl. (5.125) über die Oberfläche einer Kugel. Unter Verwendung des differentiellen Flächenelements in Kugelkoordinaten, 𝑟2 sin 𝜃 d𝜃 d𝜙, und der Tatπ 3 sache, dass ∫0 sin 𝜃 d𝜃 = 4∕3 ist, erhalten wir PS ≈
1 || 2 |2 |𝐾 − 𝑘2 ||| 𝑉 2 𝐼0 . 6π | S
(5.126)
Die elektromagnetische gestreute Leistung beträgt somit nur 2/3 der auf der Grundlage skalarer Wellen berechneten (Gl. (5.123). Dieser Unterschied entsteht durch die unterschiedliche Integration über 𝜃 in beiden Fällen. Im π isotropen Fall ist das benötigte Integral ∫0 sin 𝜃 d𝜃 = 2, während die Integration im elektromagnetischen Fall wie angegeben 4/3 liefert, was um den Faktor 2/3 kleiner ist. Üblicherweise wird die Stärke der Streuung durch den Streuquerschnitt 𝜎S charakterisiert. Wenn wir die gesamte gestreute Leistung P S als Produkt 𝑃S = 𝜎S 𝐼0
(5.128)
(5.127)
schreiben, wobei 𝐼0 die Intensität des einfallenden Lichts ist [in W∕m2 ], so wird deutlich, dass 𝜎S als die Fläche einer Öffnung [in m2 ] angesehen werden kann, die im Weg der einfallenden Welle liegt und eine gewisse Leistung (die gleich der tatsächlichen gestreuten Leistung ist) von dieser abzweigt. Nach Gl. (5.126) ist der Streuquerschnitt im Rahmen der bornschen Näherung (schwache Streuung) und der Rayleighstreuung im Fall
𝜎S = π𝑎2 𝑄S
mit 𝑄S =
4 8 ||| 𝜀S − 𝜀 |||2 𝑎 || || (2π ) . (5.129) 3 | 3𝜀 | 𝜆
Der Streuquerschnitt des kugelförmigen Streuzentrums ergibt sich somit aus dem Produkt seiner geometrischen Fläche π𝑎2 und eines kleinen dimensionslosen Faktors 𝑄S , der als Streueffizienz bezeichnet wird. Die Größe 𝑄S ist proportional zur vierten Potenz des Verhältnisses 𝑎∕𝜆, wenn 𝜆 die Wellenlänge des Lichts im umgebenden Medium ist, sowie zum Quadrat des Kontrastfaktors (𝜀S − 𝜀)∕𝜀 = (𝑛S2 − 𝑛2 )∕𝑛2 , wenn 𝑛S und 𝑛 die Brechungsindizes des Streuzentrums bzw. Mediums sind. Die Rayleighstreuung hängt offensichtlich stark von der Größe der Streuzentren ab – die Streuleistung ist proportional zur sechsten Potenz des Radius eines kugelförmigen Streuzentrums. Diese Ergebnisse gelten selbstverständlich nur, so lange der Radius des Streuzentrums klein im Vergleich zur Wellenlänge des verwendeten Lichts ist. Beispiel 5-1: Rayleighstreuung an einer dielektrischen Nanokugel
Licht der Wellenlänge 𝜆 = 600 nm wird an einem kugelförmigen Nanoteilchen mit einem Radius 𝑎 = 60 nm und einer relativen Permittivität, die 10 % über der des umgebenden Mediums liegt, gestreut. Wegen 𝑎∕𝜆 = 0.1 ist die Bedingung eines kleinen Streuzentrums erfüllt. Für den Kontrast gilt (𝜀S − 𝜀)∕𝜀 = 0.1, folglich ist auch die Bedingung der schwachen Streuung erfüllt. Nach Gl. (5.129) beträgt die Streueffizienz 𝑄S ≈ 4.6 × 10−4 und der Streuquerschnitt ist 𝜎𝑆 ≈ 5.2 nm2 . Wenn die Intensität des einfallenden Lichts 𝐼0 ≈ 105 W∕m2 beträgt (entsprechend einem 3-mW-Laserstrahl mit einem Radius von 100 μm), beträgt die gestreute Leistung PS ≈ 0.52 pW. Starke Streuung: Nanokugeln
Im Fall starker Streuung, d. h. wenn der Kontrast (𝜀S − 𝜀)∕𝜀 zwischen den relativen Permittivitäten des Streuzentrums und der Umgebung nicht klein ist, ist die bornsche Näherung nicht anwendbar. Wenn das Streuzen-
5.6 Die Streuung elektromagnetischer Wellen
trum kugelförmig und sein Radius viel kleiner ist als die optische Wellenlänge (d. h. wenn es sich um eine Nanokugel handelt), können wir alternativ jedoch die sogenannte quasistatische Näherung verwenden, um das Rayleigh-Streufeld zu bestimmen. Auch in dieser Näherung wird die komplexe Amplitude ES des gestreuten elektrischen Feldvektors wie in den Gln. (5.77) und (5.78) von einem elektrischen Dipol abgestrahlt. Wie in Kürze erläutert wird, gilt für das Feld im Fernbereich ES ≈ 𝐸S0 sin 𝜃
e−i𝑘𝑟 ˆ 𝛉, 4π 𝑟
𝐸S0 = −4π (
𝜀S − 𝜀 ) 𝑘2 𝑎3 𝐸0 , 𝜀S + 2𝜀 (5.130)
und der zugehörige Streuquerschnitt ist näherungsweise 𝜎S = π𝑎2 𝑄S
mit 𝑄S =
8 3
4 || 𝜀S − 𝜀 ||2 𝑎 || | || 𝜀 + 2𝜀 ||| (2π 𝜆 ) . (5.131) | S |
Für 𝜀S ≈ 𝜀 ist 𝜀S + 2𝜀 ≈ 3𝜀, woraufhin sich die Gleichungen auf diejenigen für den Fall schwacher Streuung reduzieren, d. h. Gl. (5.130) wird zu Gl. (5.124) und Gl. (5.131) reduziert sich auf Gl. (5.129). Diese Ergebnisse können durch Anwendung geeigneter Randbedingungen an der Oberfläche der streuenden Kugel (𝑟 = 𝑎) verifiziert werden. Dazu setzt man einerseits die tangentialen Komponenten des äußeren und inneren elektrischen Feldes E einander gleich, andererseits die normalen Komponenten der Verschiebungsfelder D (der Produkte der Permittivitäten und der elektrischen Felder in jedem Medium), siehe Abb. 5.3. Das innere elektrische Feld Ei innerhalb der streuenden Kugel ist homogen mit der Amplitude 𝐸i =
3𝜀 𝜀S + 2𝜀
(5.132)
und parallel zum elektrischen Feld der einfallenden Welle gerichtet, wie Abb. 5.26 zeigt. Das äußere Feld ist die Summe des einfallenden Feldes E0 und des gestreuten Feldes ES , einer Dipolwelle. Da der Radius der Kugel viel kleiner sein soll als die Wellenlänge des Lichts (𝑟 ≪ 𝜆), muss an der Grenze (𝑟 = 𝑎) 𝑘𝑟 ≪ 1 sein. Daraus folgt, dass Punkte auf der Kugel im Nahfeldbereich der Dipolwelle liegen. Infolgedessen kann der in Gl. (5.77) angegebene vollständige Ausdruck für das elektrische Feld der Dipolwelle durch die 1∕(i𝑘𝑟)2 -Terme angenähert werden. Für 𝑟 = 𝑎 sind die radialen und polaren Komponenten von ES daher 2(i𝑘𝑎)−2 (𝐸S0 cos 𝜃)(4π 𝑎)−1 exp(−i𝑘𝑎) bzw. (i𝑘𝑎)−2 (𝐸S0 sin 𝜃)(4π 𝑎)−1 exp(−i𝑘𝑎). Einsetzen dieser Ausdrücke in die Randbedingungen führt zu den
x E0
θ
Es
gestreute Welle
Ei
E0 einfallende Welle
a Kugel
Abb. 5.26 Streuung einer ebenen Welle mit dem elektrischen Feld E0 an einer dielektrischen Nanokugel mit dem Radius a ≪ 𝜆. Die gestreute Welle ES ist identisch mit der von einem elektrischen Dipol abgestrahlten Welle, und das Feld Ei im Inneren der streuenden Kugel ist homogen. Die Randbedingungen schreiben vor, dass die polaren Komponenten von E0 + ES und Ei identisch sind und ebenso die radialen Komponenten von 𝜀(E0 + ES ) und 𝜀S Ei . Die Streuung an einer metallischen Nanokugel wird in Abschnitt 10.2.4 diskutiert.
Gln. (5.131) und (5.132). Diese Lösung gilt für große Wellenlängen (𝜆 ≫ 𝑎), d. h. kleine Frequenzen. Sie kann auch erhalten werden, indem man das elektrostatische Problem einer dielektrischen Kugel in einem angelegten stationären elektrischen Feld löst – daher die Bezeichnung quasistatische Näherung.
5.6.3 Miestreuung Bei schwacher Streuung gilt die bornsche Näherung für Streuzentren beliebiger Größe, also auch dann, wenn ihre Abmessungen mit der Wellenlänge des einfallenden Lichts vergleichbar oder sogar größer sind. Die gestreute Welle wird dabei als Integral über Dipolwellen formuliert, die von Punkten innerhalb des Streuzentrums ausgehen und deren Amplituden proportional zu dem lokalen Wert von 𝑘S2 (r) − 𝑘2 sind, wie in Abschnitt 5.6.1 erläutert. Das resultierende Streumuster hängt von der Größe und Form des Streuzentrums ab. Wenn die bornsche Näherung nicht anwendbar ist, weil die Streuung nicht schwach genug ist, kann die Aufgabenstellung für einige spezielle Formen wie z. B. Kugeln analytisch gelöst werden; man spricht dann von Miestreuung. Für große Kugeln werden Quadrupollösungen (Terme höherer Ordnung als die Dipollösungen der Helmholtzgleichung, die wir bisher betrachtet haben) wichtig, was die mathematische Analyse komplizierter macht. Die räumliche Charakteristik der Streuung nimmt nun komplexe und häufig asymmetrische Formen an, sodass beispielsweise die Streuung in Vorwärtsrichtung stärker werden kann als in Rückwärtsrichtung. Bei Kugeln, die groß gegen die Wellenlänge
141
142
5 Elektromagnetische Optik
sind, wird die gestreute Leistung proportional zum Quadrat des Teilchendurchmessers und nicht mehr wie bei der Rayleighstreuung zur sechsten Potenz. Darüber hinaus ist die Stärke der Miestreuung im Gegensatz zur Rayleighstreuung weitgehend unabhängig von der Wellenlänge, sodass alle Wellenlängenanteile von weißem Licht etwa gleich gestreut werden. So ist z. B. Miestreuung an Wassertröpfchen, deren Größe mit den sichtbaren Wellenlängen des Sonnenlichts vergleichbar ist, für die weiße (oder graue) Farbe von Wolken verantwortlich. Ebenso ist sie die Ursache des weißen Lichtscheins um helle Lichtquellen (wie z. B. Autoscheinwerfer) bei Dunst oder Nebel.
5.6.4 Dämpfung in einem streuenden Medium Obwohl die Intensität der Rayleighstreuung aufgrund eines einzelnen Streuzentrums sehr gering ist, kann der kumulative Effekt einer großen Anzahl von Streuzentren in einem Medium zu einer merklichen Abschwächung der Welle führen. Eine Welle, die sich durch ein homogenes Medium mit einer mittleren Dichte von N S identischen Streuzentren pro Volumeneinheit mit den Streuquerschnitten 𝜎S ausbreitet, klingt exponentiell mit einer Rate 𝜎S ab, die als Streukoeffizient bezeichnet wird:
Wenn die Streuzentren selbst absorbieren, erfährt die Welle beim Durchlaufen des Mediums eine zusätzliche Dämpfung. Der Gesamt-Dämpfungskoeffizient, auch als Intensitäts-Extinktionskoeffizient 3) bezeichnet, ist die Summe des Absorptionskoeffizienten 𝛼Ab und des Streukoeffizienten 𝛼S , d. h. 𝛼 = 𝛼Ab + 𝛼S . Als Nächstes wollen wir einen Ausdruck für den Absorptionskoeffizienten 𝛼Ab eines nicht absorbierenden homogenen Mediums mit der reellen Permittivität 𝜀 ableiten, in dem pro Volumeneinheit NS kugelförmige Streuzentren mit der komplexen Permittivität 𝜀S und dem Volumen 𝑉 eingebettet sind. Die Absorption der Streuzentren ist im Imaginärteil von 𝜀S enthalten. Die komplexe effektive Permittivität des zusammengesetzten Mediums (Wirtsmedium mit eingebetteten Streuzentren) bezeichnen wir mit 𝜀eff . Die Wellenzahlen des zusammengesetzten bzw. des Wirtsmediums sind 𝑘eff = √ √ 𝜔 𝜀eff 𝜇 und 𝑘 = 𝜔 𝜀𝜇. Mithilfe von Gl. (5.90) können √ wir somit 𝛼Ab ∕2 = − Im{𝑘eff } = −𝑘 Im{ 𝜀eff ∕𝜀} schreiben. Eine Näherung für 𝜀eff erhalten wir aus dem nach Volumenanteilen gewichteten Mittel der beiden Permittivitäten. Mit dem Volumenanteil 𝑓 = NS 𝑉 der Streuzentren erhalten wir 𝜀eff ≈ (1 − 𝑓)𝜀 + 𝑓𝜀S = 𝜀 + (𝜀S − 𝜀)𝑓 .
𝛼S = NS 𝜎S .
(5.133)
Um dieses Ergebnis herzuleiten, betrachtet man eine ebene Welle der Intensität 𝐼, die sich entlang der 𝑧-Achse eines Zylinders mit homogenem Querschnitt über eine Strecke Δ𝑧 ausbreitet, wie Abb. 5.27 zeigt. Die durchlaufene Scheibe enthält NS Δ𝑧 Streuzentren, von denen jedes eine kleine Leistung 𝜎S 𝐼 aus der 𝑧-Richtung weg streut. Beim Durchlaufen dieser Strecke nimmt die Intensität daher um den Betrag Δ𝐼 = −(NS Δ𝑧)𝜎S 𝐼 ab. Im Grenzfall Δ𝑧 → 0 ergibt sich d𝐼∕ d𝑧 = −𝛼S 𝐼 mit 𝛼S = NS 𝜎S , sodass die Intensität der Welle mit der Geschwindigkeit 𝛼S exponentiell abnimmt und sich beim Durchlaufen einer Wegstrecke 𝑧 um den Faktor exp(−𝛼S 𝑧) abschwächt.
I + ΔI
I
0
Medium mit absorbierenden Streuzentren
z
z + Δz
Abb. 5.27 Streuung und Absorption an bzw. durch Streuzentren in einem nicht absorbierenden homogenen Medium führen zur Abschwächung einer Welle.
(5.134)
Dieser Ausdruck gilt für ein verdünntes Medium (𝑓 ≪ 1) mit schwacher Streuung (𝜀S ≈ 𝜀) und kleine Streuzentren. Für kleine kugelförmige Streuzentren beliebiger Konzentration und beliebige Werte von 𝜀S und 𝜀 kann die Maxwell-Garnett-Mischungsregel 4) verwendet werden: 𝜀S − 𝜀 𝜀S + 2𝜀 − (𝜀S − 𝜀)𝑓 2(1 − 𝑓)𝜀 + (1 + 2𝑓)𝜀S . =𝜀 (2 + 𝑓)𝜀 + (1 − 𝑓)𝜀S
𝜀eff ≈ 𝜀 + 3𝑓𝜀
(5.135)
Um diese Beziehung abzuleiten, gehen wir von dem Ansatz aus, dass das mittlere elektrische Feld durch 𝐸̄ = 𝑓𝐸i + (1 − 𝑓)𝐸0 und die mittlere dielektrische Verschiebung durch 𝐷̄ = 𝑓𝜀S 𝐸i + (1 − 𝑓)𝜀𝐸0 gegeben sind, wobei 𝐸i und 𝐸0 das innere bzw. äußere Feld bezeichnet. Mithilfe von Gl. (5.132), woraus 𝐸0 ∕𝐸i = (𝜀S + 2𝜀)∕3𝜀 folgt, ̄ 𝐸̄ erhalten und durch Bilden des Verhältnisses 𝜀eff ≈ 𝐷∕ wir das gewünschte Ergebnis. In einem verdünnten Me3) Daneben gibt es noch den Feld-Extinktionskoeffizienten, der die Rate angibt, mit der das Feld abnimmt. 4) Siehe J. C. Maxwell Garnett, XII. ‚Colours in Metal Glasses and in Metallic Films‘, Philosophical Transactions of the Royal Society A 203, 385–420, 1904; M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002.
5.7 Pulsausbreitung in dispersiven Medien
dium mit kleinen kugelförmigen Streuzentren, wenn also 𝑓 ≪ 1 gilt, wird Gl. (5.135) zu 𝜀eff
𝜀S − 𝜀 ≈ 𝜀 + 3𝑓𝜀 . 𝜀S + 2𝜀
(5.136)
Wenn außerdem die Streuung schwach ist (𝜀S ≈ 𝜀), reduziert sich Gl. (5.136) auf die Beziehung (5.134) auf der Basis des gewichteten Mittelwerts. Wenn die Streuzentren klein und verdünnt sind, aber nicht unbedingt schwach, dann ist 𝜀eff = 𝜀 + Δ𝜀√mit Δ𝜀 ≪ 𝜀. In diesem Fall ist 𝛼Ab ∕2 = −𝑘 Im{ 𝜀eff ∕𝜀} = −𝑘 Im{(1 + Δ𝜀∕𝜀)1∕2 } ≈ −𝑘 Im{1 + Δ𝜀∕2𝜀} = −𝑘 Im{Δ𝜀∕2𝜀} und daher 𝛼Ab ≈ −𝑘 Im{(𝜀eff − 𝜀)∕𝜀}. Mit 𝑘 = 2π∕𝜆 und 𝑓 = NS 𝑉 = NS 4π 𝛼3 ∕3 für kugelförmige Streuzentren mit Radius 𝑎 führt Gl. (5.136) zu der Näherung 𝛼Ab = NS 𝜎Ab , 𝑄Ab
𝜎Ab = π𝑎2 𝑄Ab , 𝜀S − 𝜀 𝑎 ≈ −4 Im { } (2π ) , 𝜀S + 2𝜀 𝜆
(5.137)
wobei 𝜎Ab der Absorptionsquerschnitt ist und der dimensionslose Faktor 𝑄Ab die Absorptionseffizienz. Wenn wir die Beziehung auf der Grundlage des gewichteten Mittels [Gl. (5.134)] für 𝜀eff verwenden, die für verdünnte, schwache und kleine Streuzentren gilt, erhalten wir einen Ausdruck für 𝛼Ab , der mit dem in Gl. (5.137) angegebenen identisch ist, nur dass der Faktor 𝜀S + 2𝜀 in 𝑄Ab durch 3𝜀 ersetzt ist. Der Gesamt-Dämpfungskoeffizient 𝛼 = 𝛼Ab + 𝛼S ergibt sich durch Kombination der Gln. (5.137), (5.131) und (5.133).
5.7 Pulsausbreitung in dispersiven Medien Die Ausbreitung von Lichtpulsen in dispersiven Medien ist in vielen Anwendungen von Bedeutung, beispielsweise bei der Datenübertragung durch optische Wellenleiter, wie in den Kapiteln 10, 23 und 25 im Detail erläutert wird. Wie zuvor diskutiert, wird ein dispersives Medium durch einen frequenzabhängigen Brechungsindex sowie Absorptionskoeffizienten charakterisiert, sodass monochromatische Wellen unterschiedlicher Frequenzen sich mit verschiedenen Geschwindigkeiten durch das Medium ausbreiten und unterschiedlich stark gedämpft werden. Da ein Lichtpuls eine Vielzahl von monochromatischen Wellen umfasst, von denen jede unterschiedlich modifiziert wird, wird der Puls verzögert und verbreitert (zeitlich dispergiert); im Allgemeinen wird auch seine Form verändert. In diesem Abschnitt geben wir eine vereinfachte Analyse dieser Effekte; die Details verschieben wir auf Kapitel 23.
5.7.1 Die Gruppengeschwindigkeit Wir betrachten eine gepulste ebene Welle, die sich in 𝑧-Richtung durch ein verlustfreies dispersives Medium mit dem Brechungsindex 𝑛(𝜔) ausbreitet. Analog zu der Vorgehensweise in Abschnitt 2.6 nehmen wir an, dass die anfängliche komplexe Wellenfunktion bei 𝑧 = 0 durch 𝑈(0, 𝑡) = 𝒜(𝑡) exp(i𝜔0 𝑡) gegeben ist, wobei 𝜔0 die Mittenfrequenz und 𝒜(𝑡) die komplexe Einhüllende der Welle ist. Wir werden später zeigen, dass wenn die Dispersion gering ist, d. h. 𝑛 sich innerhalb der spektralen Bandbreite der Welle nur langsam ändert, die komplexe Wellenfunktion in einer Entfernung 𝑧 näherungsweise 𝑈(𝑧, 𝑡) = 𝒜(𝑡 − 𝑧∕𝑣) exp[i𝜔0 (𝑡 − 𝑧∕𝑐)] ist, wobei 𝑐 = 𝑐0 ∕𝑛(𝜔0 ) die Lichtgeschwindigkeit im Medium bei der Mittenfrequenz und 𝑣 die Geschwindigkeit ist, mit der sich die Einhüllende ausbreitet (siehe Abb. 5.28). Der Parameter 𝑣, die sogenannte Gruppengeschwindigkeit, ist durch d𝛽 1 = 𝛽′ = 𝑣 d𝜔
(5.138)
gegeben, wobei 𝛽 = 𝜔𝑛(𝜔)∕𝑐0 die frequenzabhängige Ausbreitungskonstante ist und die Ableitung in Gl. (5.138), die häufig als 𝛽 ′ geschrieben wird, bei der Mittenfrequenz 𝜔0 zu berechnen ist. Die Gruppengeschwindigkeit ist eine Eigenschaft des dispersiven Mediums und ändert sich im Allgemeinen mit der Mittenfrequenz. Die entsprechende Zeitverzögerung 𝜏d = 𝑧∕𝑣 wird Gruppenverzögerung genannt. Da der Phasenfaktor exp[i𝜔0 (𝑡 − 𝑧∕𝑐)] eine Funktion von 𝑡 − 𝑧∕𝑐 ist, wird die Lichtgeschwindigkeit 𝑐, die durch 1∕𝑐 = 𝛽(𝜔0 )∕𝜔0 gegeben ist, häufig Phasengeschwindigkeit genannt. In einem idealen (nichtdispersiven) Medium ist 𝛽(𝜔) = 𝜔∕𝑐; in diesem Fall ist 𝑣 = 𝑐 und Gruppen- und Phasengeschwindigkeit sind identisch.
Herleitung: Die Gruppengeschwindigkeit Der Beweis von Gl. (5.138) beruht auf einer Fourierzerlegung der Einhüllenden 𝒜(𝑡) in harmonische Funktionen. Eine Komponente der Frequenz 𝛺 mit der Fourieramplitude 𝐴(𝛺) entspricht einer monochromatischen Welle der Frequenz 𝜔 = 𝜔0 + 𝛺 mit der Ausbreitungskonstante 𝛽(𝜔0 + 𝛺). Diese Komponente der gepulsten ebenen Welle breitet sich daher als 𝐴(𝛺) exp{−i[𝛽(𝜔0 + 𝛺)]𝑧} exp[i(𝜔0 + 𝛺)𝑡] aus. Wenn sich 𝛽(𝜔) in der Nähe der Mittenfrequenz 𝜔0 langsam ändert, kann es näherungsweise durch eine Taylorentwicklung mit zwei Termen linearisiert werden: 𝛽(𝜔0 + 𝛺) ≈ 𝛽(𝜔0 ) + 𝛺 d𝛽∕ d𝜔 = 𝜔0 ∕𝑐 + 𝛺∕𝑣. Die Komponen-
143
144
5 Elektromagnetische Optik
Abb. 5.28 Ein optischer Puls, der sich in einem schwach dispersiven Medium ausbreitet, sodass seine Gruppengeschwindigkeit frequenzunabhängig ist. Die Einhüllende pflanzt sich mit der Gruppengeschwindigkeit v fort, während die zugrunde liegende Welle mit der Phasengeschwindigkeit c reist.
schwach dispersives Medium z
0 Puls bei z = 0
Puls bei z (t–z /v) exp[i ω0(t–z /c)]
(t) exp(i ω0 t) 0
t
z /v
te 𝛺 der komplexen Wellenfunktion kann daher näherungsweise als 𝐴(𝛺) exp[i𝛺(𝑡 − 𝑧∕𝑣)] exp[i𝜔0 (𝑡 − 𝑧∕𝑐)] geschrieben werden. Folglich wird die Einhüllende der Fourierkomponente 𝐴(𝛺) exp(i𝛺𝑡) nach Ausbreitung über eine Entfernung 𝑧 zu 𝐴(𝛺) exp[i𝛺(𝑡 − 𝑧∕𝑣)] für alle 𝛺; die Pulseinhüllende 𝒜(𝑡) wird somit zu 𝒜(𝑡 − 𝑧∕𝑣). Der Puls breitet sich daher mit der Gruppengeschwindigkeit 𝑣 = 1∕(d𝛽∕ d𝜔) aus, genau wie von Gl. (5.138) behauptet. Da der Brechungsindex der meisten Materialien normalerweise als Funktion der optischen Wellenlänge und nicht der Frequenz gemessen und tabelliert wird, ist es zweckmäßig, die Gruppengeschwindigkeit 𝑣 durch 𝑛(𝜆0 ) auszudrücken. Mit den Beziehungen 𝛽 = 𝜔𝑛(𝜆0 )∕𝑐0 = 2π 𝑛(𝜆0 )∕𝜆0 und 𝜆0 = 2π 𝑐0 ∕𝜔 aus Gl. (5.138) sowie der Kettenregel d𝛽∕ d𝜔 = (d𝛽∕ d𝜆) (d𝜆∕ d𝜔) erhalten wir 𝑣=
𝑐0 𝑁
𝑁 = 𝑛 − 𝜆0
d𝑛 . d𝜆0
(5.139)
Die Ableitung d𝑛∕ d𝜆0 in dieser Gleichung wird bei der mittleren Wellenlänge berechnet. Der Parameter 𝑁 wird häufig Gruppenindex genannt.
5.7.2
2
der Dispersionskoeffizient ist und 𝛽 ′′ ≡ d 𝛽∕ d𝜔2 |𝜔0 gilt. Dieser Effekt wird von den Termen höherer Ordnung in der Taylorentwicklung von 𝛽(𝜔) hervorgerufen, die in der Herleitung der Gruppengeschwindigkeit wie oben gezeigt vernachlässigt wurden; eine vollständigere Behandlung dieser Frage wird in Kapitel 23 gegeben. Wenn der Puls eine anfängliche spektrale Breite von 𝜎𝜈 (Hz) besitzt, liefert Gl. (5.140) eine gute Abschätzung seiner zeitlichen Ausbreitung, 𝜎𝜏 = |𝐷𝜈 |𝜎𝜈 𝑧 .
Der Dispersionskoeffizient 𝐷𝜈 ist ein Maß für die zeitliche Verbreiterung des Pulses pro Einheit der Entfernung und der spektralen Breite [s∕(m Hz)]. Diese zeitliche Verbreiterung ist schematisch in Abb. 5.29 dargestellt. Wenn der Brechungsindex als Funktion der Wellenlänge angegeben wird, 𝑛(𝜆0 ), liefern die Gln. (5.139) und (5.141) 𝐷𝜈 =
𝜆03 d2 𝑛 . 𝑐02 d𝜆02
wobei die Größe d 1 ( ) = 2π 𝛽 ′′ 𝐷𝜈 = d𝜈 𝑣
(5.141)
(5.143)
Häufig wird auch ein Dispersionskoeffizient 𝐷𝜆 als Funktion der Wellenlänge 5) anstelle der Frequenz definiert. Mit 𝐷𝜆 d𝜆 = 𝐷𝜈 d𝜈 erhalten wir 𝐷𝜆 = 𝐷𝜈 d𝜈∕ d𝜆0 = 𝐷𝜈 (−𝑐0 ∕𝜆02 ) und daraus
Die Dispersion der Gruppengeschwindigkeit
Da die Gruppengeschwindigkeit 𝑣 = 1∕(d𝛽∕ d𝜔) selbst häufig frequenzabhängig ist, erfahren verschiedene Frequenzkomponenten des Pulses unterschiedliche Verzögerungen 𝜏d = 𝑧∕𝑣; infolgedessen wird der Puls zeitlich verbreitert. Dieses Phänomen ist als Dispersion der Gruppengeschwindigkeit bekannt. Um die Verbreiterung aufgrund dieses Effekts abzuschätzen, reicht es aus, die Differenz der Gruppenverzögerung zweier Pulse mit den Mittenfrequenzen 𝜈 und 𝜈 + 𝛿𝜈 nach Zurücklegen einer Entfernung 𝑧 zu berechnen: d𝜏d d (𝑧) δ𝜈 = 𝐷𝜈 𝑧 δ𝜈 , δ𝜏 = (5.140) δ𝜈 = d𝜈 d𝜈 𝑣
(5.142)
2
𝐷𝜆 = −
𝜆0 d 𝑛 . 𝑐0 d𝜆 2
(5.144)
0
Analog zu Gl. (5.142) ist die zeitliche Verbreiterung eines Lichtpulses für eine Quelle der spektralen Breite 𝜎𝜆 gleich 𝜎𝜏 = |𝐷𝜆 |𝜎𝜆 𝑧 .
(5.145)
Wie in den Abschnitten 10.3, 23.3 und 25.1 erläutert wird, wird 𝐷𝜆 in der Wellenleiteroptik gewöhnlich in Einheiten von ps∕(km ⋅ nm) angegeben: die Verbreiterung des Pulses wird in Pikosekunden, die Länge des Mediums in Kilometern und die spektrale Breite der Lichtquelle in Nanometern gemessen. 5) Auch eine alternative Definition des Dispersionskoeffizienten, 𝑀 = −𝐷𝜆 , wird in der Literatur häufig verwendet.
5.7 Pulsausbreitung in dispersiven Medien
z =0
z = z2
z = z1 t
t
t
Abb. 5.29 Ein optischer Puls, der sich in einem dispersiven Medium ausbreitet, wird mit einer Geschwindigkeit proportional zum Produkt des Dispersionskoeffizienten D𝜈 , seiner spektralen Breite 𝜎𝜈 und der Entfernung z verbreitert.
dispersives Medium z1
0
z2
R t
z
B
normale Dispersion
t
β″ > 0, Dν > 0, Dλ < 0
B t
R
anomale Dispersion
Abb. 5.30 Ausbreitung eines optischen Pulses durch Medien mit normaler und anomaler Dispersion. In einem Medium mit normaler Dispersion kommen die Komponenten des Pulses mit kleineren Wellenlängen (B) später an als diejenigen mit größeren Wellenlängen (R). Ein Medium mit anomaler Dispersion zeigt das entgegengesetzte Verhalten. Man sagt auch, die Pulse seien gechirpt, da ihre Frequenz zeitlich variiert.
t
β″< 0, Dν < 0, Dλ > 0
Medien mit einer einzigen Resonanz
Die Gruppengeschwindigkeit und der Dispersionskoeffizient eines optischen Pulses, der sich durch ein Medium mit einer einzigen Resonanz ausbreitet, können bestimmt werden, indem man die Gln. (5.107) und (5.108) in Gl. (5.92) einsetzt und von den Gln. (5.139) und (5.144) Gebrauch macht. Um das Verhalten des Pulses in
Brechungsindex n
1.1 1.0 0.9 0.8 1.8
Gruppenindex N
Obwohl das Vorzeichen des Dispersionskoeffizienten 𝐷𝜈 (oder 𝐷𝜆 ) die Geschwindigkeit der Pulsverbreiterung nicht beeinflusst, beeinflusst es doch die Phase der komplexen Einhüllenden des optischen Pulses. Hierdurch kann das Vorzeichen eine wichtige Rolle bei der Pulsausbreitung durch Medien spielen, die aus Kaskaden von Materialien mit unterschiedlichen Dispersionseigenschaften bestehen, wie wir in Kapitel 23 sehen werden. Für 𝐷𝜈 > 0 (𝐷𝜆 < 0) spricht man von normaler Dispersion. In diesem Fall ist die Ausbreitungsgeschwindigkeit von Komponenten mit großer Frequenz geringer als die Ausbreitungsgeschwindigkeit von Komponenten mit kleiner Frequenz, sodass Komponenten mit kleineren Wellenlängen später ankommen als Komponenten mit größeren Wellenlängen, wie Abb. 5.30 schematisch zeigt. Für 𝐷𝜈 < 0 (𝐷𝜆 > 0) spricht man von anomaler Dispersion; hier ist die Ausbreitungsgeschwindigkeit der Komponenten mit kleineren Wellenlängen größer und sie kommen daher früher an. Die meisten Gläser zeigen im Sichtbaren normale Dispersion; bei größeren Wellenlängen wird die Dispersion jedoch häufig anomal.
1.2
1.4 1.0
Dispersionskoeffizient Dλ
Normale und anomale Dispersion
0.6 10 5 0 –5
–10 0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
normierte Wellenlänge λ/λ0
1.3
1.4
1.5
Abb. 5.31 Wellenlängenabhängigkeit der optischen Parameter eines Mediums mit einer einzigen Resonanz, aufgetragen als Funktion der auf die Wellenlänge der Resonanzfrequenz normierten Wellenlänge, 𝜆∕𝜆0 : Brechungsindex n = c0 ∕c (Punkte bezeichnen Wendepunkte der Kurve), Gruppenindex N = c0 ∕v (Punkte bezeichnen Maxima) und Dispersionskoeffizient D𝜆 (Punkte bezeichnen Nullstellen). Die Parameter N und D𝜆 besitzen in der Nähe der Resonanz (schattierte Fläche) keine Bedeutung.
diesem Medium zu veranschaulichen, sind in Abb. 5.31 die Wellenlängenabhängigkeit des Brechungsindex 𝑛, des Gruppenindex 𝑁 und des Dispersionskoeffizienten 𝐷𝜆 als Funktion der normierten Wellenlänge 𝜆∕𝜆0 für ein Medium mit den Parametern 𝜒0 = 0.05 und Δ𝜈∕𝜈0 = 0.1 aufgetragen.
145
146
5 Elektromagnetische Optik
In der Nähe der Resonanz (schattierte Fläche in der Abbildung), ändert sich 𝑛 als Funktion der Wellenlänge so schnell, dass die Parameter 𝑁 und 𝐷𝜆 , die auf der Grundlage einer Taylorentwicklung mit einigen wenigen Termen definiert sind, ihre Bedeutung verlieren. In einiger Entfernung von der Resonanz (und auf beiden Seiten) nimmt der Brechungsindex monoton mit zunehmender Wellenlänge ab und durchläuft Wendepunkte (durch Punkte markiert). Die erste Ableitung des Brechungsindex erreicht an diesen Orten lokale Maxima, sodass der Gruppenindex 𝑁 dort seine Maximalwerte annimmt. Die zweite Ableitung verschwindet an diesen Punkten, sodass der Dispersionskoeffizient sein Vorzeichen wechselt. Wenn sich die Wellenlänge der Resonanzwellenlänge von unten nähert, wechselt die Dispersion von anomal zu normal; das Umgekehrte gilt, wenn die Wellenlänge sich der Resonanz von oben nähert, wie Abb. 5.31 zeigt. Schnelles und langsames Licht in resonanten Medien
Wie aus Abb. 5.31 deutlich wird, ändern sich der Brechungsindex 𝑛 und der Gruppenindex 𝑁 in einem resonanten Medium in der Nähe der Resonanzfrequenz schnell und können wesentlich größer oder kleiner als eins werden. Das bedeutet aber, dass die Phasengeschwindigkeit 𝑐 = 𝑐0 ∕𝑛 und die Gruppengeschwindigkeit 𝑣 = 𝑐0 ∕𝑁 wesentlich kleiner, aber auch größer als die Vakuumlichtgeschwindigkeit 𝑐0 werden können. Der Gruppenindex und somit die Gruppengeschwindigkeit können sogar negativ sein. Das wirft die Frage eines potentiellen Konflikts mit der Kausalität und der speziellen Relativitätstheorie auf, nach der Informationen nicht mit einer größeren Geschwindigkeit als 𝑐0 übertragen werden können. Es stellt sich jedoch heraus, dass es keinen solchen Konflikt gibt, da weder die Gruppengeschwindigkeit noch die Phasengeschwindigkeit der Informationsgeschwindigkeit entsprechen, der Geschwindigkeit, mit der Information zwischen zwei Punkten ausgetauscht wird. Die Informationsgeschwindigkeit kann bestimmt werden, indem man die Ausbreitung eines nichtanalytischen Punkts auf dem Puls verfolgt, beispielsweise des Anstiegs eines Rechteckimpulses. Sie kann nie größer als 𝑐0 werden. Wir hatten die Konzepte Phasen- und Gruppengeschwindigkeit zuvor im Zusammenhang mit einem optischen Puls betrachtet, der sich in einem schwach dispersiven Medium ausbreitet, d. h. einem Medium mit der Ausbreitungskonstante 𝛽(𝜔), die in der Nähe der Mittenfrequenz 𝜔0 des Pulses ungefähr linear ist. Wenn er eine Entfernung 𝑧 zurückgelegt hat, ist der Puls um eine Zeit 𝑧∕𝑣 verzögert und mit einem Phasenfaktor exp(−i𝜔0 𝑧∕𝑐) moduliert. Diese Phase, die sich mit der
Phasengeschwindigkeit 𝑐 ausbreitet, trägt keine Information. Nur die Gruppengeschwindigkeit 𝑣 bestimmt die „Ankunfts“zeit des Pulses. Da die Pulseinhüllende in dieser Näherung ihre Gestalt während der Ausbreitung beibehält (Abb. 5.28), ist die Gruppengeschwindigkeit eine gute Näherung für die Informationsgeschwindigkeit. In einem resonanten Medium gilt dies aber nur bei Wellenlängen weit entfernt von der Resonanz, wo der Gruppenindex größer als eins ist und die Gruppengeschwindigkeit kleiner als 𝑐0 . Bei Frequenzen in der Nähe der Resonanz werden Dispersionsterme höherer Ordnung relevant. In Anwesenheit von Dispersion zweiter Ordnung, aber vernachlässigbaren höheren Ordnungen, bleibt ein Gaußpuls zum Beispiel gaußsch, wenn auch mit einer vergrößerten Breite; sein Maximum bewegt sich mit der Gruppengeschwindigkeit 𝑣. Da der Gaußpuls jedoch ein stetiges Profil und eine unendliche Breite besitzt, ist die Geschwindigkeit, mit der sich das Maximum bewegt, nicht notwendigerweise die Informationsgeschwindigkeit; seine Geschwindigkeit kann in der Tat größer als die Vakuumlichtgeschwindigkeit sein. In der unmittelbaren Umgebung der Resonanz, wo die Gruppengeschwindigkeit wesentlich größer als 𝑐0 und sogar negativ sein kann (Abb. 5.31), müssen Dispersionsterme höherer Ordnungen berücksichtigt werden. Die Pulsform kann sich dann wesentlich verändern und die Gruppengeschwindigkeit kann nicht mehr als mögliche Informationsgeschwindigkeit betrachtet werden. Über hinreichend kleine Entfernungen kann sich der Puls noch ohne wesentliche Änderung seiner Gestalt bewegen, und das mit einer Gruppengeschwindigkeit jenseits von 𝑐0 . Er kann sich sogar mit einer negativen Gruppengeschwindigkeit ausbreiten, was bedeutet, dass ein Punkt auf dem Puls (z. B. durch einen Peak gekennzeichnet) am Ende des Mediums ankommt, bevor der entsprechende Punkt auf dem Eingangspuls in das Medium eintritt! Im entgegengesetzten Grenzfall des langsamen Lichts ist es in besonderen resonanten Medien möglich, die Gruppengeschwindigkeit des Lichts außerordentlich klein zu machen, sodass ein Lichtimpuls wesentlich verlangsamt oder sogar angehalten werden kann. Es ist aber wichtig zu betonen, dass in keiner dieser Situationen die Informationsgeschwindigkeit größer als 𝑐0 wird. Da Phänomene in Zusammenhang mit schnellem oder langsamem Licht nur in der Nähe von Resonanzen beobachtet werden können, wo der Absorptionskoeffizient groß (und frequenzabhängig) ist, ist ein Mechanismus zur optischen Verstärkung nötig; hierzu werden häufig nichtlineare Effekte ausgenutzt.
Aufgaben
Beispiel 5-2: Dispersion in einem Medium mit mehreren Resonanzen: Synthetisches Quarzglas
Im Bereich zwischen 0.21 und 3.71 μm wird die Wellenlängenabhängigkeit des Brechungsindex 𝑛 für synthetisches Quarzglas bei Zimmertemperatur durch die Sellmeiergleichung (5.115) beschrieben. Dazu verwenden wir drei Resonanzen bei 𝜆1 = 0.06840 μm, 𝜆2 = 0.1162 μm und 𝜆3 = 9.8962 μm mit den Gewichten 𝜒01 = 0.6962, 𝜒02 = 0.4079 und 𝜒03 = 0.8975. Ausdrücke für den Gruppenindex 𝑁 und den Dispersionskoeffizienten 𝐷𝜆 sind aus dieser Gleichung mithilfe der Gln. (5.139) und (5.144) leicht herzuleiten. Die Ergebnisse dieser Rechnung sind in Abb. 5.32 im Wellenlängenbereich von 600–1600 nm dargestellt. Wie man sieht, nimmt der Brechungsindex 𝑛 mit zunehmender Wellenlänge monoton ab und besitzt einen Wendepunkt bei 𝜆0 = 1.276 μm. An dieser Stelle ist der Gruppenindex 𝑁 minimal, sodass die Gruppengeschwindigkeit 𝑣 = 𝑐0 ∕𝑁 maximal wird. Da der Dispersionskoeffizient 𝐷𝜆 proportional zur zweiten Ableitung von 𝑛 nach 𝜆0 ist, verschwindet er an dieser Stelle. Ein Dispersionskoeffizient von null bedeutet minimale Pulsverbreiterung. Bei Wellenlängen kürzer als 1.276 μm ist 𝐷𝜆 < 0 und das Medium zeigt normale Dispersion, wohingegen bei größeren Wellenlängen 𝐷𝜆 > 0 gilt und die Dispersion anomal ist. Die Existenz einer Wellenlänge ohne Dispersion bietet entscheidende Vorteile beim Design von faseroptischen Nachrichtensystemen, in denen optische Pulse Information tragen, wie in den Abschnitten 10.3, 25.1 und 23.3 deutlich werden wird. Die in solchen Systemen verwendeten Quarzglasfasern werden dotiert und sind um 1.312 μm dispersionsfrei.
Aufgaben Aufgabe 5-1: Elektromagnetische Welle
Eine elektromagnetische Welle im Vakuum besitzt einen Vektor 𝓔 = 𝑓(𝑡 − 𝑧∕𝑐0 )ˆ x des elektrischen Feldes, wobei ˆ x ein Einheitsvektor in 𝑥-Richtung ist und 𝑓(𝑡) = exp(−𝑡2 ∕𝜏2 ) exp(i2π 𝜈0 𝑡) mit einer Konstante 𝜏 gilt. Beschreiben Sie die Welle physikalisch und geben Sie einen Ausdruck für den Vektor des Magnetfelds an. Aufgabe 5-2: Dielektrische Medien
Charakterisieren Sie die durch die folgenden Gleichungen beschriebenen Medien in Bezug auf Linearität, Dispersivität, räumliche Dispersivität und Homogenität. Nehmen Sie an, dass alle Medien isotrop sind. (a) 𝒫 = 𝜀0 𝜒ℰ − 𝑎∇ × ℰ, (b) 𝒫 + 𝑎𝒫 2 = 𝜀0 ℰ, (c) 𝑎1 𝜕 2 𝒫∕𝜕𝑡2 + 𝑎2 𝜕𝒫∕𝜕𝑡 + 𝒫 = 𝜀0 𝜒ℰ, (d) 𝒫 = 𝜀0 {𝑎1 + 𝑎2 exp[−(𝑥2 + 𝑦 2 )]}ℰ, wobei 𝜒, 𝑎, 𝑎1 und 𝑎2 Konstanten sind. Aufgabe 5-3: Stehende Wanderwelle
Der Vektor der komplexen Amplitude des elektrischen Feldes einer monochromatischen Welle der Wellenlänge 𝜆0 , die sich im Vakuum ausbreitet, ist E(r) = x. (a) Geben Sie eine Beziehung zwi𝐸0 sin 𝛽𝑦 exp(−i𝛽𝑧)ˆ schen 𝛽 und 𝜆0 an. (b) Leiten Sie einen Ausdruck für den Vektor H(r) der komplexen Amplitude des Magnetfelds her. (c) Bestimmen Sie die Richtung des Flusses der optischen Leistung. (d) Diese Welle kann als die Summe von zwei ebenen TEM-Wellen betrachtet werden. Bestimmen Sie ihre Ausbreitungsrichtungen.
Abb. 5.32 Wellenlängenabhängigkeit der optischen Parameter von synthetischem Quarzglas (fused silica), berechnet auf der Grundlage der Sellmeiergleichung (5.115): Brechungsindex n = c0 ∕c (Punkt bezeichnet Wendepunkt), Gruppenindex N = c0 ∕v (Punkt bezeichnet Minimum) und Streuungskoeffizient D𝜆 (Punkt bezeichnet Nullstelle).
Brechungsindex
1.48 1.47
N
1.46 n 1.45 1.44
Dispersionskoeffizient [ps / (km · nm)]
40 0 –40 Dλ
–80 –120
normale Dispersion
–160
anomale Dispersion
–200 0.6
0.7
0.8
0.9
1 1.1 1.2 1.3 Wellenlänge λ 0 (µm)
1.4
1.5
1.6
147
148
5 Elektromagnetische Optik
Aufgabe 5-4: Elektrisches Feld von fokussiertem Licht
Aufgabe 5-7: Brechungsindex von Luft
(a) Eine optische Leistung von 1 W wird im Vakuum gleichmäßig auf eine Fläche von 0.1 × 0.1 mm2 fokussiert. Bestimmen Sie den Maximalwert des elektrischen Feldes 𝐸0 (in V∕m). Nehmen Sie an, dass die optische Welle im Bereich der bestrahlten Fläche näherungsweise als ebene TEM-Welle beschrieben werden kann. (b) Bestimmen Sie das elektrische Feld im Zentrum eines Gaußstrahls (auf der Strahlachse an der Strahltaille), wenn die Strahlleistung 1 W und der Radius der Strahltaille 𝑊0 = 0.1 mm betragen. Verwenden Sie für diese Aufgabe Abschnitt 3.1.
Der Brechungsindex der Luft kann mithilfe eines Michelsoninterferometers und einer abstimmbaren Lichtquelle genau gemessen werden. Bei Atmosphärendruck und einer Temperatur von 20 ̊C ist der Brechungsindex der Luft bei einer Wellenlänge von 0.76 μm durch 𝑛 − 1 = 2.672 × 10−4 gegeben, bei 0.81 μm durch 𝑛 − 1 = 2.669 × 10−4 und bei 0.86 μm durch 𝑛 − 1 = 2.665 × 10−4 . (a) Verwenden Sie eine quadratische Anpassung dieser Daten und bestimmen Sie die Wellenlängenabhängigkeit der Gruppengeschwindigkeit. (b) Geben Sie einen Ausdruck für den Dispersionskoeffizienten 𝐷𝜆 in ps∕(km ⋅ nm) an und vergleichen Ihr Resultat mit dem für einen Wellenleiter aus Quarzglas.
Aufgabe 5-5: Amplitudenmodulierte Welle in einem dispersiven Medium
Eine amplitudenmodulierte Welle, deren komplexe Wellenfunktion bei 𝑧 = 0 die Form 𝒜(𝑡) = [1 + 𝑚 cos(2π f 𝑠 𝑡)] exp(i2π 𝜈0 𝑡) besitzt, wobei f 𝑠 ≪ 𝜈0 ist, breitet sich über eine Entfernung 𝑧 durch ein dispersives Medium mit der Ausbreitungskonstante 𝛽(𝜈) und vernachlässigbarer Dämpfung aus. Leiten Sie unter den Annahmen 𝛽(𝜈0 ) = 𝛽0 , 𝛽(𝜈0 − f 𝑠 ) = 𝛽1 und 𝛽(𝜈0 + f 𝑠 ) = 𝛽2 einen Ausdruck für die komplexe Einhüllende der durchgelassenen Welle als Funktion von 𝛽0 , 𝛽1 , 𝛽2 und 𝑧 her. Zeigen Sie, dass die Welle in bestimmten Entfernungen 𝑧 amplitudenmoduliert, aber nicht phasenmoduliert ist. Aufgabe 5-6: Dispersion der Gruppengeschwindigkeit in einem durch die Sellmeiergleichung beschriebenen Medium
(a) Leiten Sie Ausdrücke für den Gruppenindex 𝑁 und den Dispersionskoeffizienten 𝐷𝜆 der Gruppengeschwindigkeit in einem Medium her, dessen Brechungsindex durch die Sellmeiergleichung (5.115) beschrieben wird. (b) Tragen Sie die Wellenlängenabhängigkeit von 𝑛, 𝑁 und 𝐷𝜆 für synthetisches Quarzglas im Bereich zwischen 0.25 und 3.5 μm auf. Verwenden Sie die in Tabelle 5.1 (und in Beispiel 5-2) angegebenen Werte. Überprüfen Sie die in Abb. 5.32 gezeigten Kurven. (c) Konstruieren Sie ähnliche Auftragungen für GaAs im Bereich zwischen 1.5 und 10.5 μm. Wie in Tabelle 5.1 gezeigt wird GaAs bei Zimmertemperatur im Bereich zwischen 1.4 und 11 μm durch eine Sellmeiergleichung mit drei Termen mit Resonanzwellenlängen von 0, 0.4082 und 37.17 μm und den Gewichten 3.5, 7.4969 und 1.9347 beschrieben. Vergleichen Sie das Verhalten der Dispersionseigenschaften von Quarzglas und GaAs.
Weiterführende Literatur Elektromagnetismus
Siehe auch die allgemeine Literatur in Kapitel 1 J.-M. Liu, Principles of Photonics, Cambridge University Press 2016. N. Ida, Engineering Electromagnetics, Springer, 3. Aufl. 2015. J. C. Rautio, The Long Road to Maxwell’s Equations, IEEE Spectrum 51(12), 36–40 & 54–56, 2014. F. T. Ulaby, U. Ravaioli, Fundamentals of Applied Electromagnetics, Prentice Hall, 7. Aufl. 2014. M. N. O. Sadiku, Elements of Electromagnetics, Oxford University Press, 6. Aufl. 2014. U. S. Inan, A. Inan, R. Said, Engineering Electromagnetics and Waves, Prentice Hall, 2. Aufl. 2014. A. Zangwill, Modern Electrodynamics, Cambridge University Press 2013. D. Fleisch, A Student’s Guide to Maxwell’s Equations, Cambridge University Press 2013. A. Balanis, Advanced Engineering Electromagnetics, Wiley, 2. Aufl. 2012. V. Lucarini, J. J. Saarinen, K.-E. Peiponen, E. M. Vartiainen, Kramers-Kronig Relations in Optical Materials Research, Springer 2005. S. A. Akhmanov, S. Yu. Nikitin, Physical Optics, Oxford University Press 1997. Klassiker
J. D. Jackson, Klassische Elektrodynamik, de Gruyter, 4. Aufl. 1999. S. Ramo, J. R. Whinnery, T. Van Duzer, Fields and Waves in Communication Electronics, Wiley, 3. Aufl. 1994. H. A. Haus, J. R. Melcher, Electromagnetic Fields and Energy, Prentice Hall 1989.
Aufgaben
H. A. Haus, Waves and Fields in Optoelectronics, Prentice Hall 1984. L. D. Landau, E. M. Lifschitz, Elektrodynamik der Kontinua, Europa-Lehrmittel, 5. Aufl. 1990. L. D. Landau, E. M. Lifschitz, Klassische Feldtheorie, Europa-Lehrmittel, 12. Aufl. 1992. J. A. Stratton, Electromagnetic Theory, McGraw-Hill 1941; Wiley-IEEE, Nachdruck 2007. H. A. Lorentz, The Theory of Electrons and Its Applications to the Phenomena of Light and Radiant Heat, Teubner 1906; Dover, Nachdruck 2004. O. Heaviside, Electromagnetic Theory, The Electrician Printing and Publishing 1893. J. C. Maxwell, A Treatise on Electricity and Magnetism, Macmillan/Clarendon Press 1873. Vektor-Strahlbündel
Q. Zhan (Hrsg.), Vectorial Optical Fields, World Scientific 2014. R. Dorn, S. Quabis, G. Leuchs, ‚Sharper Focus for a Radially Polarized Light Beam‘, Physical Review Letters 91, 233901, 2003. D. G. Hall, ‚Vector-Beam Solutions of Maxwell’s Wave Equation‘, Optics Letters 21, 9–11, 1996. Optische Konstanten
P. Hartmann, Optical Glass, SPIE Optical Engineering Press 2014. M. Bass, V. N. Mahajan (Hrsg.), Handbook of Optics, McGraw-Hill, 3. Aufl. 2010. A. R. Hilton, Sr., Chalcogenide Glasses for Infrared Optics, McGraw-Hill 2010. E. D. Palik (Hrsg.), Handbook of Optical Constants of Solids III, Academic Press 1998. Y.-M. Chiang, D. Birnie III, W. D. Kingery, Physical Ceramics: Principles for Ceramic Science and Engineering, Wiley 1997. W. L. Wolfe, G. J. Zissis (Hrsg.), The Infrared Handbook, Environmental Research Institute of Michigan 1993. Schnelles und langsames Licht
J. B. Khurgin, R. S. Tucker (Hrsg.), Slow Light: Science and Applications, CRC Press/Taylor & Francis 2009. P. W. Milonni, Fast Light, Slow Light und Left-Handed Light, Taylor & Francis 2005. L. Brillouin, Wave Propagation und Group Velocity, Academic Press 1960.
Lichtstreuung
J. A. Adam, Rays, Waves, and Scattering: Topics in Classical Mathematical Physics, Princeton University Press 2017. G. Gouesbet, G. Grehan, Generalized Lorenz-Mie Theories, Springer, 2. Aufl. 2017. B. Chu, Laser Light Scattering: Basic Principles and Practice, Dover, 2. Aufl. 2007. M. Nieto-Vesperinas, Scattering and Diffraction in Physical Optics, World Scientific, 2. Aufl. 2006. H. M. Nussenzveig, Diffraction Effects in Semiclassical Scattering, Cambridge University Press 1992, Paperback 2006. L. Tsang, J. A. Kong, K-H. Ding, Scattering of Electromagnetic Waves: Theories and Applications, Wiley 2000. B. J. Berne, R. Pecora, Dynamic Light Scattering: With Applications to Chemistry, Biology, and Physics, Wiley,1976; Dover, Nachdruck 2000. M. I. Mishchenko, J. W. Hovenier, L. D. Travis (Hrsg.), Light Scattering by Nonspherical Particles: Theory, Measurements, and Applications, Academic Press 2000. M. Kerker (Hrsg.), Selected Papers on Light Scattering, SPIE Optical Engineering Press 1988 (Milestone Series Bd. 4). C. F. Bohren, D. R. Huffman, Absorption and Scattering of Light by Small Particles, Wiley 1983, Paperback 1998. H. C. van de Hulst, Light Scattering by Small Particles, Wiley 1957; Dover, Nachdruck 1981. Ausbreitung von optischen Pulsen
K. E. Oughstun, Electromagnetic and Optical Pulse Propagation 1: Spectral Representations in Temporally Dispersive Media, Springer 2007, Paperback 2010.
149
151
6 Polarisationsoptik Die Polarisation des Lichts an einem festen Ort wird durch den zeitlichen Verlauf des elektrischen Feldvektors 𝓔(r, 𝑡) bestimmt. In einem gewöhnlichen Medium liegt dieser Vektor in einer Ebene tangential zur Wellenfront an diesem Ort. Für monochromatisches Licht verändern sich zwei beliebige orthogonale Komponenten des Vektors E(r) der komplexen Amplitude in dieser Ebene sinusförmig mit der Zeit, wobei ihre Amplituden und Phasen im Allgemeinen unterschiedlich sind, sodass der Endpunkt des Vektors E(r) einer Ellipse folgt. Da die Wellenfrontnormalen in der Regel an verschiedenen Orten in unterschiedliche Richtungen zeigen, ändern sich auch die Ebene, die Orientierung und die Form der Ellipse mit dem Ort, wie Abb. 6.1(a) zeigt. Für eine ebene Welle sind die Wellenfronten jedoch parallele transversale Ebenen, und die Polarisationsellipsen sind wie in Abb. 6.1(b) überall gleich, obwohl die Feldvektoren zu einem gegebenen Zeitpunkt nicht notwendigerweise parallel sind. Die ebene Welle wird daher durch eine einzige Ellipse beschrieben und wird als elliptisch polarisiert bezeichnet. Die Orientierung und Exzentrizität der Polarisationsellipse bestimmen den Polarisationszustand der ebenen Welle, wohingegen ihre Größe durch die optische Intensität bestimmt wird. Wenn die Ellipse zu einer Gerade entartet, nennt man die Welle linear polarisiert; wird sie zu einem Kreis, heißt die Welle zirkular polarisiert.
y
In der paraxialen Optik breitet sich Licht in Richtungen aus, die innerhalb eines schmalen Kegels um die optische Achse (𝑧-Achse) liegen. Die Wellen sind näherungsweise elektromagnetisch transversal (TEM), und die elektrischen Feldvektoren liegen daher näherungsweise in transversalen Ebenen und haben vernachlässigbare axiale Komponenten. Unter dem Gesichtspunkt der Polarisation können paraxialen Wellen näherungsweise durch ebene Wellen und eine einzige Polarisationsellipse (oder -kreis oder -linie) beschrieben werden. Polarisation spielt bei der Wechselwirkung von Licht mit Materie eine wichtige Rolle, wie die folgenden Beispiele zeigen: • Der an der Grenzfläche zwischen zwei Materialien reflektierte Anteil des Lichts hängt von der Polarisation der einfallenden Welle ab. • Der von bestimmten Materialien absorbierte Anteil des Lichts ist polarisationsabhängig. • Die Streuung von Licht durch Materie ist im Allgemeinen polarisationsabhängig. • Der Brechungsindex von anisotropen Materialien hängt von der Polarisation ab. Wellen mit unterschiedlichen Polarisationen breiten sich mit verschiedenen Geschwindigkeiten aus und erfahren unterschiedliche Phasenverschiebungen, sodass die Polarisationsellipse im Verlauf der Ausbreitung modifiziert wird (z. B. kann linear polarisiertes Licht in zirkular polari-
Abb. 6.1 Zeitlicher Verlauf des elektrischen Feldvektors von monochromatischem Licht an verschiedenen Orten: (a) beliebige Welle; (b) ebene oder paraxiale Welle, die sich in z-Richtung ausbreitet.
y
x
x z
z
(a)
Wellenfronten
(b)
Wellenfronten
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
152
6 Polarisationsoptik
siertes Licht umgewandelt werden). Diese Eigenschaft wird beim Design von optischen Bauelementen ausgenutzt. • Die Polarisationsebene von linear polarisiertem Licht wird beim Durchgang durch bestimmte Medien wie z. B. optisch aktive Substanzen, Flüssigkristalle oder manche Substanzen in Gegenwart eines äußeren Magnetfeldes gedreht.
In diesem Kapitel . . . Dieses Kapitel ist der Beschreibung von einfachen Polarisationserscheinungen und ihren Anwendungen gewidmet. Elliptisch polarisiertes Licht wird in Abschnitt 6.1 zusammen mit einem Matrixformalismus vorgestellt, der zur Beschreibung von polarisierenden Bauelementen nützlich ist. Abschnitt 6.2 beschreibt den Effekt der Polarisation auf die Reflexion und Brechung von Licht an den Grenzflächen zwischen dielektrischen Medien. Die Ausbreitung des Lichts durch anisotrope Medien (Kristalle), optisch aktive Medien und Flüssigkristalle ist das Thema der Abschnitte 6.3, 6.4 und 6.5. Zuletzt werden in Abschnitt 6.6 grundlegende Polarisationsbauelemente (Polarisatoren, Retarder, Rotatoren und Isolatoren) besprochen. Die Polarisation ist wichtig, um verstehen zu können, wie sich Licht in photonischen Kristallen, Metallen und Metamaterialien verhält (Kapitel 7 und 8) und wie es geführt werden kann (Kapitel 9 und 10). Die Polarisationseigenschaften von stochastischem Licht werden in Abschnitt 12.4 untersucht. Die Polarisation spielt in vielen Bereichen der Optik und Photonik eine zentrale Rolle.
6.1 Die Polarisation des Lichts 6.1.1 Die Polarisation Wir betrachten eine monochromatische ebene Welle der Frequenz 𝜈 und der Kreisfrequenz 𝜔 = 2π 𝜈, die sich mit der Geschwindigkeit 𝑐 in 𝑧-Richtung ausbreitet. Das elektrische Feld liegt in der 𝑥𝑦-Ebene und wird durch { [ ( 𝑧 )]} , (6.1) 𝓔(𝑧, 𝑡) = Re A exp i𝜔 𝑡 − 𝑐 beschrieben, wobei die komplexe Einhüllende x + 𝐴𝑦 ˆ y A = 𝐴𝑥 ˆ
(6.2)
ein Vektor mit den komplexen Komponenten 𝐴𝑥 und 𝐴𝑦 ist. Um die Polarisation dieser Welle zu beschreiben, verfolgen wir den Endpunkt des Vektors 𝓔(𝑧, 𝑡) an jedem Ort 𝑧 als Funktion der Zeit.
Die Polarisationsellipse
Wenn wir 𝐴𝑥 und 𝐴𝑦 durch ihre Beträge und Phasen 𝐴𝑥 = a𝑥 exp(i𝜑𝑥 ) und 𝐴𝑦 = a𝑦 exp(i𝜑𝑦 ) ausdrücken und in die Gln. (6.2) und Gl. (6.1) einsetzen, erhalten wir 𝓔(𝑧, 𝑡) = ℰ𝑥 ˆ x + ℰ𝑦 ˆ y,
(6.3)
wobei [ ( ℰ𝑥 = a𝑥 cos 𝜔 𝑡 − [ ( ℰ𝑦 = a𝑦 cos 𝜔 𝑡 −
] 𝑧) + 𝜑𝑥 𝑐 ] 𝑧) + 𝜑𝑦 𝑐
(6.4a) (6.4b)
die 𝑥- und 𝑦-Komponenten des elektrischen Feldvektors 𝓔(𝑧, 𝑡) sind. Die Komponenten ℰ𝑥 und ℰ𝑦 sind periodische Funktionen von 𝑡 − 𝑧∕𝑐, die mit der Frequenz 𝜈 oszillieren. Die Gln. (6.4) sind die parametrischen Gleichungen der Ellipse ℰ𝑥2 a2𝑥
+
ℰ𝑦2 a2𝑦
− 2 cos 𝜑
ℰ𝑥 ℰ𝑦 2 = sin 𝜑 , a𝑥 a𝑦
(6.5)
wobei 𝜑 = 𝜑𝑦 − 𝜑𝑥 die Phasendifferenz ist. Für einen festen Wert von 𝑧 rotiert die Spitze des elektrischen Feldvektors auf dieser Ellipse periodisch in der 𝑥𝑦-Ebene. Zu einer festen Zeit 𝑡 folgt die Spitze des elektrischen Feldvektors einer schraubenförmigen Trajektorie im Raum, die auf der Oberfläche eines elliptischen Zylinders liegt (siehe Abb. 6.2). Das elektrische Feld rotiert, während die Welle sich ausbreitet, und wiederholt dabei seine Bewegung periodisch während jeder zurückgelegten Distanz 𝜆 = 𝑐∕𝜈 entlang der 𝑧-Achse. Der Polarisationszustand der Welle wird durch die Orientierung und Form der Polarisationsellipse bestimmt, die durch die beiden in Abb. 6.3 definierten Winkel charakterisiert wird: Der Winkel ψ bestimmt die Richtung der Hauptachse, während der Winkel χ die Form der Ellipse angibt, das Verhältnis der kleinen zur großen Halbachse 𝑏∕𝑎. Die Winkel hängen vom Verhältnis der Beträge r = a𝑦 ∕a𝑥 und der Phasendifferenz 𝜑 = 𝜑𝑦 − 𝜑𝑥 ab: 2r cos 𝜑 , 1 − r2 2r sin 2χ = sin 𝜑 , 1 + r2
tan 2ψ =
a𝑦 , a𝑥
(6.6)
𝜑 = 𝜑𝑦 − 𝜑𝑥 .
(6.7)
r=
Die Gln. (6.6) und (6.7) können hergeleitet werden, indem man den Winkel ψ bestimmt, der eine Transformation des Koordinatensystems ℰ𝑥 und ℰ𝑦 in Gl. (6.5) erreicht, sodass die rotierte Ellipse keinen Kreuzterm besitzt. Die Größe der Ellipse wird durch die Intensität der Welle bestimmt, die zu |𝐴𝑥 |2 + |𝐴𝑦 |2 = a2𝑥 + a2𝑦 proportional ist.
6.1 Die Polarisation des Lichts
y
y
λ x
x
z
(a)
(b) (b
y
Zirkular polarisiertes Licht a
ɑy
b
χ ψ x
ɑx
Abb. 6.3 Die Polarisationsellipse.
Linear polarisiertes Licht
Wenn eine der Komponenten verschwindet (z. B. a𝑥 = 0), ist das Licht in der Richtung der anderen Komponente (der 𝑦-Richtung) linear polarisiert (LP). Die Welle ist ebenfalls linear polarisiert, wenn die Phasendifferenz 𝜑 = 0 oder π ist, da Gl. (6.4) dann ℰ𝑦 = ±(a𝑦 ∕a𝑥 )ℰ𝑥 ergibt, also die Gleichung einer Geraden mit der Steigung ±a𝑦 ∕a𝑥 (das Vorzeichen + bzw. − entspricht 𝜑 = 0 bzw. π). In diesen Fällen wird der elliptische Zylinder aus Abb. 6.2(b) zu einer Ebene, wie Abb. 6.4 zeigt. Aus diesem Grund spricht man in diesem Fall auch von planarer Polarisation. Wenn beispielsweise a𝑥 = a𝑦 ist, schließt die Polarisationsebene einen Winkel von 45◦ mit der 𝑥-Achse ein. Für a𝑥 = 0 ist die Polarisationsebene die 𝑦𝑧-Ebene.
y
y
Für 𝜑 = ±π∕2 und a𝑥 = a𝑦 = a0 ergibt Gl. (6.4) ℰ𝑥 = a0 cos[𝜔(𝑡 − 𝑧∕𝑐) + 𝜑𝑥 ] und ℰ𝑦 = ∓a0 sin[𝜔(𝑡 − 𝑧∕𝑐) + 𝜑𝑥 ]; daraus folgt ℰ𝑥2 + ℰ𝑦2 = a20 , also die Gleichung eines Kreises. Der elliptische Zylinder aus Abb. 6.2(b) ist nun ein kreisförmiger Zylinder; man bezeichnet die Welle in diesem Fall als zirkular polarisiert. Für 𝜑 = +π∕2 rotiert das elektrische Feld an einem festen Ort 𝑧 im Uhrzeigersinn, wenn man der Welle entgegenblickt. Man spricht in diesem Falls von rechtszirkular polarisiertem (RCP) Licht. Der Fall 𝜑 = −π∕2 entspricht einer Rotation gegen den Uhrzeigersinn und damit linkszirkular polarisiertem (LCP) Licht 1). Für rechtszirkular polarisiertes Licht ergibt eine Momentaufnahme der Feldvektoren an verschiedenen Orten entlang der Ausbreitungsrichtung zu einem bestimmten Zeitpunkt eine rechtsgängige Helix (oder eine rechtsgängige Schraube, die in die Ausbreitungsrichtung der Welle zeigt), wie Abb. 6.5 illustriert. Für linkszirkulare Polarisation findet man entsprechend eine linksgängige Helix. Dieser helixförmige Weg des Endpunkts des elektrischen Feldvektors für das hier betrachtete zirkular polarisierte Licht ist zu unterscheiden von der helikalen Wellenfront des in Abschnitt 3.4 diskutierten Laguerre-Gauß-Strahls [Abb. 3.24(c)]. Poincarékugel und Stokesparameter
Wie zuvor gezeigt kann der Polarisationszustand einer Lichtwelle durch zwei reelle Parameter beschrieben werden: das Verhältnis der Beträge r = a𝑦 ∕a𝑥 und die Phasendifferenz 𝜑 = 𝜑𝑦 − 𝜑𝑥 . Beide werden manch1) Diese Konvention wird in den meisten Optiklehrbüchern verwendet. Die entgegengesetzte Benennung ist in der Technikliteratur häufig: bei rechts (links) zirkular polarisiertem Licht rotiert der elektrische Feldvektor an einem festen Ort gegen den Uhrzeigersinn (im Uhrzeigersinn), wenn man der Welle entgegenblickt.
Abb. 6.4 Linear (oder planar) polarisiertes Licht. (a) Zeitlicher Verlauf für festes z. (b) Eine Momentaufnahme (feste Zeit t).
x
z
x Polarisationsebene
(a)
Abb. 6.2 (a) Die Rotation der Spitze des elektrischen Feldvektors in der xyEbene an einem festen Ort z. (b) Momentaufnahme der Trajektorie der Spitze des elektrischen Feldvektors zu einer festen Zeit t.
(b)
153
6 Polarisationsoptik
y
y
links
Abb. 6.5 Trajektorien des Endpunkts des elektrischen Feldvektors einer zirkular polarisierten ebenen Welle. (a) Zeitlicher Verlauf an einem festen Ort z. (b) Die Trajektorien der Endpunkte der elektrischen Feldvektoren.
x
x
y
y
rechts
z
x
x
z (a)
(b) u3
y
u3
x
1
LP: 90° LP: 135°
2χ Polarisationsellipse
LP: 45° u2
u2 LP: 0°
(L)
2ψ izit ät
Orientierung der Ellipse
u1
RCP
R) tät ( tizi lip El
χ ψ
El lip t
154
u1 LCP
(a)
(b)
Abb. 6.6 (a) Die Orientierung und Exzentrizität der Polarisationsellipse werden geometrisch als Punkt auf der Poincarékugel dargestellt. (b) Punkte auf der Poincarékugel, die für linear (LP) in verschiedenen Winkeln zur x-Achse pola-
risiertes Licht bzw. rechts- (RCP) und links- (LCP) zirkular polarisiertes Licht stehen. Punkte im Inneren der Kugel stellen partiell polarisiertes Licht dar (der Mittelpunkt der Kugel entspricht unpolarisiertem Licht), siehe auch Abb. 12.28.
mal zu einer einzigen komplexen Zahl r exp(i𝜑) kombiniert, die als komplexes Polarisationsverhältnis bezeichnet wird. Alternativ können wir den Polarisationszustand durch die beiden Winkel ψ und χ charakterisieren, die wie in Abb. 6.3 gezeigt die Orientierung und die Form der Polarisationsellipse angeben. Die Poincarékugel (siehe Abb. 6.6) ist eine geometrische Konstruktion, bei der der Polarisationszustand durch einen Punkt mit den Kugelkoordinaten (𝑟 = 1, 𝜃 = 90◦ − 2χ, 𝜙 = 2ψ) auf der Oberfläche einer Einheitskugel bezeichnet wird. Jeder Punkt auf der Kugel entspricht einem Polarisationszustand. Punkte auf dem Äquator (χ = 0◦ ) stehen beispielsweise für lineare Polarisationszustände; die Punkte 2ψ = 0◦ und 2ψ = 180◦ bezeichnen lineare Polarisation in 𝑥- bzw. 𝑦-Richtung. Die Nordund Südpole (2χ = ±90◦ ) bezeichnen rechts- und linkszirkulare Polarisation. Andere Punkte auf der Kugel beschreiben elliptische Polarisationszustände.
Die beiden reellen Parameter (r, 𝜑) oder gleichbedeutend die Winkel (χ, ψ) beschreiben den Polarisationszustand, enthalten aber keine Information über die Intensität der Welle. Eine andere Darstellung, die diese Information enthält, ist der Stokesvektor. Darunter versteht man einen Satz von vier reellen Zahlen (S0 , S1 , S2 , S3 ), die sogenannten Stokesparameter. Der erste, S0 = a2𝑥 + a2𝑦 , ist proportional zur optischen Intensität; die anderen drei, (S1 , S2 , S3 ), sind die kartesischen Koordinaten des Punkts auf der Poincarékugel, (𝑢1 , 𝑢2 , 𝑢3 ) = (cos 2χ cos 2ψ, cos 2χ sin 2ψ, sin 2χ) multipliziert mit S0 , also S1 = S0 cos 2χ cos 2ψ ,
(6.8a)
S2 = S0 cos 2χ sin 2ψ ,
(6.8b)
S3 = S0 sin 2χ .
(6.8c)
Mithilfe der Gln. (6.6) und (6.7) und einigen trigonometrischen Identitäten können die Stokesparameter in
6.1 Die Polarisation des Lichts
den Gln. (6.8) als Funktion der Feldparameter (a𝑥 , a𝑦 , 𝜑) und der Komponenten (𝐴𝑥 , 𝐴𝑦 ) der komplexen Einhüllenden geschrieben werden: S0 = a2𝑥 + a2𝑦 = |𝐴𝑥 |2 + |𝐴𝑦 |2 ,
(6.9a)
S1 =
a2𝑥
(6.9b)
S2 =
2a𝑥 a𝑦 cos 𝜑 = 2 Re{𝐴𝑥∗ 𝐴𝑦 } 2a𝑥 a𝑦 sin 𝜑 = 2 Im{𝐴𝑥∗ 𝐴𝑦 }
S3 =
−
a2𝑦
= |𝐴𝑥 | − |𝐴𝑦 | , 2
2
,
(6.9c)
.
(6.9d)
Da S21 + S22 + S23 = S20 gelten muss, sind nur drei der vier Komponenten des Stokesvektors unabhängig; sie definieren die Intensität und den Polarisationszustand des Lichts vollständig. Eine Verallgemeinerung der Stokesparameter, die zur Beschreibung von partiell kohärentem Licht geeignet ist, wird in Abschnitt 12.4 vorgestellt. Wir fassen nochmals zusammen, dass es drei gleichwertige Darstellungen zur Beschreibung des Polarisationszustands eines optischen Feldes gibt: (i) die Polarisationsellipse, (ii) die Poincarékugel und (iii) den Stokesvektor. Eine weitere gleichwertige Darstellung, der Jonesvektor, wird im folgenden Abschnitt eingeführt.
6.1.2 Die Matrixdarstellung der Polarisation Der Jonesvektor
Wie beschrieben ist eine monochromatische ebene Welle der Frequenz 𝜈, die sich in 𝑧-Richtung ausbreitet, durch die komplexen Einhüllenden 𝐴𝑥 = a𝑥 exp(i𝜑𝑥 ) und 𝐴𝑦 = a𝑦 exp(i𝜑𝑦 ) der 𝑥- und 𝑦-Komponenten des elektrischen Feldvektors vollständig charakterisiert. Diese komplexen Größen können in Form einer Spaltenmatrix geschrieben werden, die als Jonesvektor bekannt ist: ⎡𝐴𝑥 ⎤ J=⎢ ⎥ . 𝐴 ⎣ 𝑦⎦
(6.10)
Wenn wir J kennen, können wir die Gesamtintensität der Welle aus 𝐼 = (|𝐴𝑥 |2 + |𝐴𝑦 |2 )∕2𝜂 berechnen und das Verhältnis r = a𝑦 ∕a𝑥 = |𝐴𝑦 |∕|𝐴𝑥 | sowie die Phasendifferenz 𝜑 = 𝜑𝑦 − 𝜑𝑥 = arg{𝐴𝑦 } − arg{𝐴𝑥 } benutzen, um die Orientierung und Form der Polarisationsellipse sowie die Poincarékugel und die Stokesparameter zu bestimmen. Die Jonesvektoren für einige spezielle Polarisationszustände sind in Tabelle 6.1 angegeben. Die Intensität ist dabei jeweils normiert, sodass |𝐴𝑥 |2 + |𝐴𝑦 |2 = 1 ist, und die Phase der 𝑥-Komponente wurde gleich null gesetzt, 𝜑𝑥 = 0. Orthogonale Polarisationen
Zwei durch die Jonesvektoren J1 und J2 beschriebene Polarisationszustände heißen orthogonal, wenn das Skalarprodukt zwischen J1 und J2 verschwindet. Das Skalarprodukt ist durch ∗ ∗ + 𝐴1𝑦 𝐴2𝑦 (J1 , J2 ) = 𝐴1𝑥 𝐴2𝑥
definiert, wobei 𝐴1𝑥 und 𝐴1𝑦 die Elemente von J1 und 𝐴2𝑥 und 𝐴2𝑦 die Elemente von J2 sind. Ein Beispiel für orthogonale Jonesvektoren sind linear polarisierte Wellen in 𝑥- und 𝑦-Richtung oder jedes andere Paar von orthogonalen Richtungen im Raum. Ein anderes Beispiel sind rechts- und linkszirkular polarisierte Wellen. Darstellung beliebiger Polarisationen als Superposition zweier orthogonaler Polarisationen
Ein beliebiger Jonesvektor J kann immer als eine gewichtete Superposition zweier orthogonaler Jonesvektoren geschrieben werden, beispielsweise J1 und J2 , die die Basis dieser Entwicklung bilden; es gilt also J = 𝛼1 J1 + 𝛼2 J2 . Wenn J1 und J2 so normiert sind, dass (J1 , J1 ) = (J2 , J2 ) = 1 ist, dann sind die Koeffizienten der Entwicklung die Skalarprodukte 𝛼1 = (J, J1 ) und 𝛼2 = (J, J2 ).
Tab. 6.1 Jonesvektoren von linear (LP) sowie rechts- und linkszirkular polarisiertem (RCP, LCP) Licht. y
y LP in 𝑥-Richtung:
1 [ ] 0
LP im Winkel 𝜃:
x
cos 𝜃 [ ] sin 𝜃
y RCP:
1 1 √ [ ] 2 i
θ
x
y
x
LCP:
(6.11)
1 1 √ [ ] 2 i
x
155
156
6 Polarisationsoptik
Beispiel 6-1: Entwicklungen in linear und zirkular polarisierten Basissätzen
Mit den in 𝑥- und 𝑦-Richtung linear polarisierten [ ] [ ] Vektoren 10 und 01 als Entwicklungsbasis sind die Entwicklungskoeffizienten für einen Jonesvektor mit den Komponenten 𝐴𝑥 und 𝐴𝑦 mit |𝐴𝑥 |2 + |𝐴𝑦 |2 = 1 definitionsgemäß 𝛼1 = 𝐴𝑥 und 𝛼2 = 𝐴𝑦 . Derselbe Polarisationszustand kann in anderen Basissätzen entwickelt werden: • In einer Basis von linear polarisierten Vektoren in 1 [ ] Winkeln von 45◦ und 135◦ , d. h. J1 = √ 11 und 2 ] 1 [ J2 = √ −1 , sind die Entwicklungskoeffizienten 𝛼1 1 2 und 𝛼2 1 𝐴45 = √ (𝐴𝑥 + 𝐴𝑦 ) , 2
1 𝐴135 = √ (𝐴𝑦 − 𝐴𝑥 ) . (6.12) 2
• Wenn die Basis der Entwicklung aus den rechts1 [ ] und linkszirkular polarisierten Wellen √ 1i und 2 [ ] 1 1 √ −i, besteht, sind die Koeffizienten 𝛼1 und 𝛼2 2
1 𝐴R = √ (𝐴𝑥 − i𝐴𝑦 ) , 2
1 𝐴L = √ (𝐴𝑥 + i𝐴𝑦 ) . (6.13) 2
Eine linear polarisierte Welle, deren Polarisationsebene einen Winkel 𝜃 mit der 𝑥-Achse einschließt (d. h. 𝐴𝑥 = cos 𝜃 und 𝐴𝑦 = sin 𝜃), ist identisch mit einer Superposition von rechts- und linkszirkular po1 larisierten Wellen mit den Koeffizienten √ e−i𝜃 und 1 √ ei𝜃 . 2
2
Eine linear polarisierte Welle ist daher äqui-
valent zu einer gewichteten Summe von rechts- und linkszirkular polarisierten Wellen. Übung 6-1: Messung der Stokesparameter
Zeigen Sie, dass die in Gl. (6.9) definierten Stokesparameter für Licht mit den Komponenten 𝐴𝑥 und 𝐴𝑦 des Jonesvektors durch S0 = |𝐴𝑥 |2 + |𝐴𝑦 |2
(6.14a)
S1 = |𝐴𝑥 | − |𝐴𝑦 |
(6.14b)
2
2
S2 = |𝐴45 |2 − |𝐴135 |2
(6.14c)
S3 = |𝐴R | − |𝐴L |
(6.14d)
2
2
gegeben sind, wobei 𝐴45 und 𝐴135 wie in Gl. (6.12) die Entwicklungskoeffizienten in einer Basis von linear polarisierten Vektoren unter Winkeln von 45◦ und 135◦ sind und 𝐴R und 𝐴L die Entwicklungskoeffizienten in einer Basis von rechts- und linkszirkular polarisierten Wellen wie in Gl. (6.13). Schlagen Sie eine Methode zur Messung der Stokesparameter von Licht mit beliebiger Polarisation vor.
optisches System
Abb. 6.7 Ein optisches System, das die Polarisation einer ebenen Welle verändert.
Matrixdarstellung von polarisierenden Bauelementen
Wir betrachten den Durchgang einer ebenen Welle beliebiger Polarisation durch ein optisches System, das die Welle als ebene Welle erhält, aber ihre Polarisation wie schematisch in Abb. 6.7 gezeigt verändert. Wir nehmen an, dass das System linear ist, sodass das Superpositionsprinzip gilt. Zwei Beispiele solcher Systeme sind die Reflexion von Licht an einer planaren Grenzfläche zwischen zwei Medien und die Transmission durch eine Platte mit anisotropen optischen Eigenschaften. Die komplexen Einhüllenden der Komponenten 𝐴1𝑥 und 𝐴1𝑦 des elektrischen Feldes am Eingang (einfallende Welle) und der entsprechenden Komponenten 𝐴2𝑥 und 𝐴2𝑦 am Ausgang (transmittierte oder reflektierte Welle) sind allgemein durch die gewichteten Superpositionen 𝐴2𝑥 = 𝑇11 𝐴1𝑥 + 𝑇12 𝐴1𝑦 𝐴2𝑦 = 𝑇21 𝐴1𝑥 + 𝑇22 𝐴1𝑦
(6.15)
verknüpft, wobei 𝑇11 , 𝑇12 , 𝑇21 und 𝑇22 Konstanten sind, die das Bauelement beschreiben. Die Gln. (6.15) sind allgemeine Beziehungen, die für alle linearen optischen Polarisationsbauelemente gelten. Die linearen Beziehungen in den Gln. (6.15) können zweckmäßig in Matrixnotation geschrieben werden, indem wir eine 2 × 2-Matrix T mit den Elementen 𝑇11 , 𝑇12 , 𝑇21 und 𝑇22 definieren, ⎡𝐴2𝑥 ⎤ ⎡𝑇11 ⎢ ⎥=⎢ 𝐴2𝑦 𝑇 ⎣ ⎦ ⎣ 21
𝑇12 ⎤ ⎡𝐴1𝑥 ⎤ ⎥⎢ ⎥. 𝑇22 𝐴1𝑦 ⎦⎣ ⎦
(6.16)
Wenn die Wellen am Eingang und am Ausgang durch die Jonesvektoren J1 bzw. J2 beschrieben werden, dann lautet Gl. (6.16) in kompakter Matrixform J2 = TJ1 .
(6.17)
Die Matrix T, die Jonesmatrix, beschreibt das optische System, während die Vektoren J1 und J2 die Wellen am Ein- bzw. Ausgang festlegen. Die Struktur der Jonesmatrix T eines optischen Systems bestimmt ihre Wirkung auf den Polarisationszustand und die Intensität der Welle. Im Folgenden geben
6.1 Die Polarisation des Lichts
y
Retarder
Das durch die Matrix
x
⎡1 T=⎢ 0 ⎣ linear polarisiertes Licht Polarisator
Abb. 6.8 Der lineare Polarisator. Die Linien im Polarisator bezeichnen die durchgelassene Feldrichtung.
wir eine Übersicht über die Jonesmatrizen einiger Systeme mit einfachen Eigenschaften. Reale Bauelemente mit solchen Eigenschaften werden wir anschließend besprechen. Lineare Polarisatoren
Das durch die Jonesmatrix ⎡1 0⎤ T=⎢ (6.18) ⎥ 0 0 ⎣ ⎦ beschriebene System transformiert eine eingehende Welle mit den Komponenten (𝐴1𝑥, 𝐴1𝑦 ) in eine Welle mit den Komponenten (𝐴1𝑥 , 0), eliminiert also die 𝑦-Komponente. Es erzeugt so eine in 𝑥-Richtung polarisierte Welle, wie Abb. 6.8 illustriert. Ein solches System ist ein linearer Polarisator mit einer Transmissionsachse in 𝑥-Richtung.
0 ⎤ ⎥ e ⎦
beschriebene System transformiert eine Welle mit den Feldkomponenten (𝐴1𝑥 , 𝐴1𝑦 ) in eine Welle mit den Komponenten (𝐴1𝑥 , e−i𝛤 𝐴1𝑦 ), d. h. es verzögert die 𝑦-Komponente um eine Phase 𝛤, während die 𝑥-Komponente unverändert bleibt. Ein solches System wird daher Retarder oder Verzögerungsplatte genannt. Die 𝑥- bzw. 𝑦-Achsen heißen die schnellen bzw. langsamen Achsen des Retarders. Eine einfache Anwendung der Matrixalgebra ermöglicht es, die in Abb. 6.9 gezeigten Ergebnisse zu verstehen: • Für 𝛤 = π∕2 wandelt der Retarder (in diesem Fall Viertelwellenretarder oder 𝝀∕4-Plättchen ge[ 0] nannt und durch die Jonesmatrix 10 −i charakteri[1] siert) die linear polarisierte Welle 1 in die linkszir[1] um oder die rechtszirkular polarisierte Welle −i [1] kular polarisierte Welle i in die linear polarisierte [ ] Welle 11 . • Für 𝛤 = π wandelt der Retarder (hier Halbwellenretarder oder 𝝀∕2-Plättchen genannt und durch die [ 0 ] beschrieben) die linear polarisierJonesmatrix 10 −1 [1] [ 1 ] te Welle 1 in die linear polarisierte Welle −1 um, dreht also die Polarisationsebene um 90◦ . Der Halbwellenretarder wandelt die rechtszirkular polarisierte [1] [ ] Welle 1i in die linkszirkular polarisierte Welle −i um. S
S x
x
y
L
π/2
y
L
S
π S
x
y
(6.19)
−i𝛤
x
L (a) Viertelwellenretarder
π/2
y
L
π
(b) Halbwellenretarder
Abb. 6.9 Die Wirkung von (a) Viertelwellen- (π∕2) und (b) Halbwellenretardern (π) auf einige spezielle Polarisationszustände. S und L bezeichnen die schnellen und langsamen Achsen des Retarders.
157
158
6 Polarisationsoptik
wobei R(𝜃) die in Gl. 6.22 angegebene Matrix ist:
Polarisationsrotatoren
Während ein Retarder die Form der Polarisation einer Welle verändern kann, lässt ein Polarisationsrotator die lineare Polarisation einer Welle unverändert, dreht aber die Polarisationsebene um einen bestimmten Winkel. Die Jonesmatrix ⎡cos 𝜃 − sin 𝜃⎤ T=⎢ (6.20) ⎥ sin 𝜃 cos 𝜃 ⎣ ⎦ beschreibt [ ein ]Bauelement, das eine linear polarisiercos 𝜃1 te Welle [ ] sin 𝜃1 in eine andere linear polarisierte Welle cos 𝜃2 sin 𝜃2
umwandelt, wobei 𝜃2 = 𝜃1 + 𝜃 gilt. Es rotiert daher die Ebene der Polarisation einer linear polarisierten Welle um einen Winkel 𝜃. Hintereinandergeschaltete polarisierende Bauelemente
Die Wirkung von optischen Kaskaden auf polarisiertes Licht kann einfach durch Matrixmultiplikation bestimmt werden. Ein durch die Jonesmatrix T1 charakterisiertes System, das von einem zweiten, durch T2 beschriebenen System gefolgt wird, ist äquivalent zu einem einzigen System mit der Produktmatrix T = T2 T1 . Die Matrix des Systems, durch das das Licht zuerst hindurchtritt, muss im Matrixprodukt rechts stehen, da sie es ist, die zuerst auf den Eingangs-Jonesvektor wirkt. Übung 6-2: Hintereinandergeschaltete Wellenretarder
Zeigen Sie, dass zwei hintereinandergeschaltete Viertelwellenretarder mit parallelen schnellen Achsen äquivalent zu einem Halbwellenretarder sind. Was passiert, wenn die schnellen Achsen orthogonal sind? Koordinatentransformation
Die Elemente der Jonesvektoren und Jonesmatrizen hängen von der Wahl des Koordinatensystems ab. Wenn sie in einem Koordinatensystem bekannt sind, können sie durch Matrixalgebra in einem anderen Koordinatensystem berechnet werden. Wenn J der Jonesvektor im 𝑥𝑦-Koordinatensystem ist, dann ist sein Jonesvektor J′ in einem neuen Koordinatensystem 𝑥′ 𝑦 ′ , dessen 𝑥′ -Richtung mit der 𝑥-Richtung einen Winkel 𝜃 einschließt, gleich J′ = R(𝜃) J ,
(6.21)
y yʹ xʹ
x
⎡ cos 𝜃 sin 𝜃 ⎤ R(𝜃) = ⎢ (6.22) ⎥. − sin 𝜃 cos 𝜃 ⎣ ⎦ Diese Beziehung ist einfach nachprüfbar, indem man die Komponenten des elektrischen Feldes in den zwei Koordinatensystemen vergleicht. Die Jonesmatrix T eines optischen Systems wird analog in T′ transformiert, T′ = R(𝜃)TR(−𝜃) ′
T = R(−𝜃)T R(𝜃) ,
(6.23) (6.24)
wobei R(−𝜃) durch Gl. (6.22) gegeben ist, wenn 𝜃 durch −𝜃 ersetzt wird. Die Matrix R(−𝜃) ist die Inverse von R(𝜃), R(−𝜃)R(𝜃) ist demzufolge die Einheitsmatrix. Gleichung (6.23) kann aus der Beziehung J2 = TJ1 erhalten werden, wenn man die Transformation J′2 = R(𝜃)J2 = R(𝜃)TJ1 benutzt: Da J1 = R(−𝜃)J′1 ist, gilt J′2 = R(𝜃)TR(−𝜃)J′1 ; wegen J′2 = T′ J′1 folgt daraus Gl. (6.23). Übung 6-3: Jonesmatrix eines gedrehten Halbwellenretarders
Zeigen Sie, dass die Jonesmatrix eines Halbwellenretarders, dessen schnelle Achse in einem Winkel 𝜃 zur 𝑥-Achse liegt, durch ⎡cos 2𝜃 T=⎢ sin 2𝜃 ⎣
sin 2𝜃 ⎤ ⎥ − cos 2𝜃 ⎦
(6.25)
gegeben ist. Leiten Sie Gl. (6.25) aus den Gln. (6.19), (6.22) und (6.24) her. Zeigen Sie, dass die Wellen am Ausgang für 𝜃 = 22.5◦ proportional zur Summe bzw. Differenz der Eingangswellen sind. Normalmoden
Die Normalmoden eines polarisierenden Systems sind die Polarisationszustände, die beim Durchgang der Welle durch das System nicht verändert werden (siehe Anhang C). Die Jonesvektoren dieser Zustände erfüllen die Bedingung TJ = 𝜇J
(6.26)
mit einer Konstante 𝜇. Die Normalmoden sind daher die Eigenvektoren der Jonesmatrix T und die Konstanten 𝜇 sind die entsprechenden Eigenwerte. Da die Matrix T eine 2 × 2-Matrix ist, gibt es nur zwei unabhängige Normalmoden, TJ1 = 𝜇1 J1 und TJ2 = 𝜇2 J2 . Wenn die Matrix ∗ gilt, sind die NorT hermitesch ist, d. h. wenn 𝑇12 = 𝑇21 malmoden orthogonal: (J1 , J2 ) = 0. Die Normalmoden werden häufig als Entwicklungsbasis verwendet, indem eine beliebige Eingangswelle J als Superposition von Normalmoden geschrieben wird: J = 𝛼1 J1 + 𝛼2 J2 . Die
6.2 Reflexion und Brechung
Antwort des Systems kann dann wegen TJ = T(𝛼1 J1 + 𝛼2 J2 ) = 𝛼1 TJ1 + 𝛼2 TJ2 = 𝛼1 𝜇1 J1 + 𝛼2 𝜇2 J2 leicht berechnet werden (siehe Anhang C). Übung 6-4: Normalmoden einiger polarisierender Systeme
(a) Zeigen Sie, dass die Normalmoden eines linearen Polarisators linear polarisierte Wellen sind. (b) Zeigen Sie, dass die Normalmoden eines Wellenretarders linear polarisierte Wellen sind. (c) Zeigen Sie, dass die Normalmoden eines Polarisationsrotators rechts- und linkszirkular polarisierte Wellen sind. Wie lauten die Eigenwerte dieser Systeme?
6.2 Reflexion und Brechung In diesem Abschnitt untersuchen wir die Reflexion und Brechung einer monochromatischen ebenen Welle mit beliebiger Polarisation, die auf eine ebene Grenzfläche zwischen zwei dielektrischen Medien trifft. Wir nehmen an, dass die Medien linear, homogen, und isotrop mit den Impedanzen 𝜂1 und 𝜂2 und den Brechungsindizes 𝑛1 und 𝑛2 sind. Die einfallenden, gebrochenen und reflektierten Wellen werden wie in Abb. 6.10 illustriert mit den Indizes 1, 2 und 3 bezeichnet. Wie in Abschnitt 2.4.1 erwähnt, fallen die Wellenfronten dieser Wellen an der Grenzfläche zusammen, wenn Einfalls- und Ausfallswinkel gleich sind, 𝜃3 = 𝜃1 , und Brechungs- und Einfallswinkel das snelliussche Gesetz erfüllen: 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 .
(6.27)
Um eine Beziehung zwischen den Amplituden und Polarisationen der drei Wellen zu finden, verknüpfen wir mit jeder Welle ein 𝑥𝑦-Koordinatensystem in einer Ebene senkrecht zur Ausbreitungsrichtung (Abb. 6.10). Die Einhüllenden der elektrischen Felder dieser Wellen werden durch die Jonesvektoren
x y
θ3
n1
k2
θ2
θ1
x y
y e hen roc le b e l g We
k1
Einfallsebene
n2
⎡𝐴2𝑥 ⎤ J2 = ⎢ ⎥, 𝐴2𝑦 ⎦ ⎣
⎡𝐴3𝑥 ⎤ J3 = ⎢ ⎥ 𝐴 ⎣ 3𝑦 ⎦
(6.28)
beschrieben. Als Nächstes bestimmen wir die Beziehungen zwischen J2 und J1 sowie zwischen J3 und J1 . Wir schreiben diese Beziehungen in Form von Matrizen J2 = tJ1 und J3 = rJ1 , wobei t und r 2 × 2-Jonesmatrizen sind, die die Transmission bzw. Reflexion der Welle beschreiben. Die Elemente der Transmissions- und Reflexionsmatrizen können bestimmt werden, indem man die von der elektromagnetischen Theorie geforderten Randbedingungen ausnutzt, genauer gesagt die Kontinuität der tangentialen Komponenten von E und H sowie der normalen Komponenten von D und B an der Grenzfläche. Das elektrische Feld jeder Welle ist orthogonal zu ihrem Magnetfeld; das Verhältnis ihrer Einhüllenden ist die charakteristische Impedanz, 𝜂1 für die einfallenden und reflektierten Wellen und 𝜂2 für die transmittierte Welle. Als Ergebnis erhalten wir einen Satz von Gleichungen, aus deren Lösungen wir die gesuchten Beziehungen zwischen den Komponenten der elektrischen Felder der drei Wellen bekommen. Die hierbei notwendige Algebra wird wesentlich reduziert, wenn wir ausnutzen, dass die beiden Normalmoden des Systems in 𝑥- und 𝑦-Richtung linear polarisierte Wellen sind. Um das zu beweisen, müssen wir nur zeigen, dass eine einfallende, eine reflektierte und eine gebrochene Welle, deren elektrische Feldvektoren in 𝑥-Richtung zeigen, mit den Randbedingungen in Einklang stehen, und dass dasselbe auch für drei in 𝑦-Richtung polarisierte Wellen gilt. Das ist tatsächlich der Fall. In 𝑥- und 𝑦-Richtung polarisierte Wellen sind folglich unabhängig, also nicht gekoppelt. Die 𝑥-polarisierte Mode wird als transversal elektrische (TE) oder orthogonale Polarisation bezeichnet, da die elektrischen Felder zur Einfallsebene orthogonal sind. Die 𝑦-polarisierte Mode wird entsprechend transversal magnetische (TM) Polarisation genannt,
x
reflektierte Welle k3
de allen einf elle W
⎡𝐴1𝑥 ⎤ J1 = ⎢ ⎥, 𝐴1𝑦 ⎦ ⎣
Abb. 6.10 Reflexion und Brechung an der Grenzfläche zwischen zwei dielektrischen Medien.
159
160
6 Polarisationsoptik
da das Magnetfeld zur Einfallsebene orthogonal ist, oder auch oder parallele Polarisation, da die elektrischen Felder zur Einfallsebene parallel sind. Die orthogonalen und parallelen Polarisationen werden auch mit s (für senkrecht) und p (für parallel) bezeichnet. Die 𝑦-Achsen in Abb. 6.10 wurden willkürlich so festgelegt, dass ihre Komponenten parallel zur Grenzfläche zwischen den Dielektrika alle in dieselbe Richtung zeigen. Die Unabhängigkeit der 𝑥- und 𝑦-Polarisationen bedingt, dass die Jonesmatrizen t und r diagonal sind, ⎡t𝑥 t=⎢ 0 ⎣
0⎤ ⎥, t𝑦 ⎦
⎡r𝑥 r=⎢ 0 ⎣
0⎤ ⎥ r𝑦 ⎦
(6.29)
daher folgt 𝐸2𝑥 = t𝑥 𝐸1𝑥 ,
𝐸2𝑦 = t𝑦 𝐸1𝑦 ,
(6.30)
𝐸3𝑥 = r𝑥 𝐸1𝑥 ,
𝐸3𝑦 = r𝑦 𝐸1𝑦 .
(6.31)
Die Koeffizienten t𝑥 und t𝑦 sind die komplexen Amplitudentransmissionen für die TE- bzw. TMPolarisationen; r𝑥 und r𝑦 sind die analogen komplexen Amplitudenreflexionsgrade. Wenn wir die Randbedingungen auf die TE- und TMWellen anwenden (d. h. die tangentialen Komponenten der elektrischen Felder und die tangentialen Komponenten der magnetischen Felder zu beiden Seiten der Grenzfläche gleichsetzen), erhalten wir die folgenden Ausdrücke für die Reflexions- und Transmissionskoeffizienten: r𝑥 =
𝜂2 sec 𝜃2 − 𝜂1 sec 𝜃1 , 𝜂2 sec 𝜃2 + 𝜂1 sec 𝜃1
t𝑥 = 1 + r𝑥 ,
r𝑦 =
𝜂2 cos 𝜃2 − 𝜂1 cos 𝜃1 , 𝜂2 cos 𝜃2 + 𝜂1 cos 𝜃1
t𝑦 = (1 + r𝑦 )
(6.32) cos 𝜃1 . cos 𝜃2 (6.33)
√ Die charakteristische Impedanz 𝜂 = 𝜇∕𝜀 ist komplex, wenn 𝜀 und/oder 𝜇 komplex sind, beispielsweise in verlustbehafteten oder leitenden Medien. Für nicht verlustbehaftete, nichtmagnetische dielektrische Medi√ en ist 𝜂 = 𝜂0 ∕𝑛 reell, wobei 𝜂0 = 𝜇0 ∕𝜀0 ist und 𝑛 den Brechungsindex bezeichnet. In diesem Fall ergeben die Reflexions- und Transmissionskoeffizienten in den Gln. (6.32) und (6.33) die folgenden Gleichungen, die unter der Bezeichnung Fresnelgleichungen bekannt sind: 𝑛1 cos 𝜃1 − 𝑛2 cos 𝜃2 , 𝑛1 cos 𝜃1 + 𝑛2 cos 𝜃2 𝑛 sec 𝜃1 − 𝑛2 sec 𝜃2 r𝑦 = 1 , 𝑛1 sec 𝜃1 + 𝑛2 sec 𝜃2
r𝑥 =
t𝑥 = 1 + r𝑥 , t𝑦 = (1 + r𝑦 )
(6.34) cos 𝜃1 . cos 𝜃2 (6.35)
Wenn 𝑛1 , 𝑛2 und 𝜃1 bekannt sind, können die Reflexionskoeffizienten aus den Fresnelgleichungen bestimmt werden. Dazu bestimmt man zuerst 𝜃2 aus dem snelliusschen Gesetz Gl. (6.27); das liefert √ √ 2 2 2 cos 𝜃2 = 1 − sin 𝜃2 = 1 − (𝑛1 ∕𝑛2 ) sin 𝜃1 . (6.36) Da die Größen unter den Quadratwurzeln in Gl. (6.36) negativ sein können, sind die Reflexions- und Transmissionskoeffizienten im Allgemeinen komplex. Die Beträge |r𝑥 | und |r𝑦 | und die Phasenverschiebungen 𝜑𝑥 = arg{r𝑥 } und 𝜑𝑦 = arg{r𝑦 } sind in Abb. 6.11 bis 6.14 für die beiden Polarisationen als Funktionen des Einfallswinkels 𝜃1 aufgetragen. Die Auftragungen erfolgen sowohl für äußere (𝑛1 < 𝑛2 ) als auch für innere (𝑛1 > 𝑛2 ) Reflexion.
6.2.1
TE-Polarisation
Die Abhängigkeit des Reflexionskoeffizienten r𝑥 von 𝜃1 für die TE-polarisierte Welle ist durch Gl. (6.34) gegeben. Äußere Reflexion (n1 < n2 )
Der Reflexionskoeffizient r𝑥 ist immer reell und negativ, entsprechend einer Phasenverschiebung 𝜑𝑥 = π. Der Betrag ist bei 𝜃1 = 0 (senkrechter Einfall) |r𝑥 | = (𝑛2 − 𝑛1 )∕(𝑛1 + 𝑛2 ) und nimmt für 𝜃1 = 90◦ (streifender Einfall) bis auf eins zu, wie Abb. 6.11 zeigt. Innere Reflexion (n1 > n2 )
Für kleine 𝜃1 ist der Reflexionskoeffizient reell und positiv. Sein Betrag ist (𝑛1 − 𝑛2 )∕(𝑛1 + 𝑛2 ) für 𝜃1 = 0◦ und nimmt allmählich zu, bis er für den kritischen Winkel −1 𝜃k = sin (𝑛2 ∕𝑛1 ) den Wert eins erreicht. Für 𝜃1 > 𝜃k bleibt der Betrag r𝑥 bei eins, entsprechend innerer Totalreflexion. Das kann gezeigt werden, indem man mit√ 2
2
hilfe von Gl. (6.36) cos 𝜃2 = − 1 − sin 𝜃1 ∕ sin 𝜃k = √ 2 2 −i sin 𝜃1 ∕ sin 𝜃k − 1 schreibt 2) und in Gl. (6.34) einsetzt. Innere Totalreflexion ist von einer Phasenverschiebung 𝜑𝑥 = arg{r𝑥 } begleitet, die durch √ 𝜑𝑥 cos2 𝜃k −1 (6.37) = tan 2 cos2 𝜃1 gegeben ist. Die Phasenverschiebung 𝜑𝑥 nimmt von 0 bei 𝜃1 = 𝜃k auf π bei 𝜃1 = 90◦ zu, wie Abb. 6.12 zeigt. Diese Phase spielt in dielektrischen Wellenleitern eine wichtige Rolle (siehe Abschnitt 9.2). In der unmittelbaren Umgebung einer Grenzfläche, an der Totalreflexion eintritt, entsteht eine evaneszente Welle. 2) Die Wahl des negativen Vorzeichens für die Wurzel stimmt mit der Herleitung überein, die zur Fresnelgleichung führt.
6.2 Reflexion und Brechung
Abb. 6.11 Betrag und Phase des Reflexionskoeffizienten als Funktion des Einfallswinkels für äußere Reflexion einer TE-polarisierten Welle (n2 ∕n1 = 1.5).
1 | rx |
0 π
θ1
θ2
θ1
n1
n2
φx 0
θ1
0
90°
Abb. 6.12 Betrag und Phase des Reflexionskoeffizienten als Funktion des Einfallswinkels für innere Reflexion einer TEpolarisierten Welle (n1 ∕n2 = 1.5).
1 | rx |
0 π
θ1
θ2
θ1
φx
n1
n2
0
θk
0
6.2.2 TM-Polarisation Ähnlich ist die Abhängigkeit des Reflexionskoeffizienten r𝑦 von 𝜃1 für die TM-polarisierte Welle durch Gl. (6.35) gegeben. Äußere Reflexion (n1 < n2 )
Der Reflexionskoeffizient r𝑦 ist immer reell. Für 𝜃1 = 0 (senkrechter Einfall) nimmt er einen negativen Wert (𝑛1 − 𝑛2 )∕(𝑛1 + 𝑛2 ) an. Sein Betrag nimmt dann ab; er verschwindet für 𝑛1 sec 𝜃1 = 𝑛2 sec 𝜃2 oder 𝜃1 = 𝜃B , wobei 𝜃B der Brewsterwinkel ist: 𝜃B = tan−1 (𝑛2 ∕𝑛1 ) .
(6.38)
θ1
90°
(In Aufgabe 6-10 werden noch andere Eigenschaften des Brewsterwinkels diskutiert.) Für 𝜃1 > 𝜃B kehrt sich das Vorzeichen von r𝑦 um (𝜑𝑦 variiert von π bis 0), und sein Betrag nimmt zu, bis er sich für 𝜃1 = 90◦ einem Wert von eins nähert (Abb. 6.13). Die Abwesenheit einer Reflexion der TM-Welle beim Brewsterwinkel ist für die Herstellung von Polarisatoren nützlich (siehe Abschnitt 6.6). Innere Reflexion (n1 > n2 )
Bei 𝜃1 = 0◦ ist r𝑦 positiv und hat den Betrag (𝑛1 − 𝑛2 )∕(𝑛1 + 𝑛2 ). Mit zunehmendem 𝜃1 nimmt r𝑦 ab und verschwindet am Brewsterwinkel 𝜃B = tan−1 (𝑛2 ∕𝑛1 ). Abb. 6.13 Betrag und Phase des Reflexionskoeffizienten als Funktion des Einfallswinkels für äußere Reflexion einer TM-polarisierten Welle (n2 ∕n1 = 1.5).
1 | ry |
0 π
θ1
θ2
θ1
n1
n2
φy
0
0
θB
θ1
90°
161
162
6 Polarisationsoptik
Abb. 6.14 Betrag und Phase des Reflexionskoeffizienten als Funktion des Einfallswinkels für innere Reflexion einer TMpolarisierten Welle (n1 ∕n2 = 1.5).
1 | ry |
0 π
θ1
θ2
θ1
n1
φy
n2
0 0
θB θk
θ1
90°
Wenn 𝜃1 weiter zunimmt, wird wird r𝑦 negativ und sein Betrag steigt weiter, bis er beim Grenzwinkel 𝜃k den Wert eins erreicht (Abb. 6.14). Für 𝜃1 > 𝜃k erfährt die Welle Totalreflexion; sie geht mit einer Phasenverschiebung 𝜑𝑦 = arg{r𝑦 } einher, für die √ 𝜑𝑦 cos2 𝜃k −1 −1 (6.39) = tan 2 2 2 sin 𝜃k cos 𝜃1
des Leistungsflusses (in einer Richtung senkrecht zur Grenzfläche) der reflektierten und transmittierten Wellen zu dem der einfallenden Welle definiert. Weil sich die einfallenden und die reflektierten Wellen in demselben Medium ausbreiten und denselben Winkel mit der Oberflächennormale einschließen, folgt sofort
gilt. Bei senkrechtem Einfall ist der Reflexionskoeffizient offensichtlich r = (𝑛1 − 𝑛2 )∕(𝑛1 + 𝑛2 ), egal ob es sich um TE oder TM, äußere oder innere Reflexion handelt.
Sowohl für TE- als auch für TM-Polarisation und sowohl für äußere als auch für innere Reflexion ist der Leistungsreflexionsgrad bei senkrechtem Einfall daher gleich
Übung 6-5: Brewsterfenster
Bei welchem Winkel kann ein TM-polarisierter Lichtstrahl durch eine in Luft (𝑛 = 1) befindliche Glasplatte mit dem Brechungsindex 𝑛 = 1.5 treten, ohne Reflexionsverluste an den Oberflächen zu erleiden? Solche Platten werden als Brewsterfenster bezeichnet (Abb. 6.15) und in Lasern verwendet (siehe Abschnitt 16.2.4).
θB
ℛ = |r|2 .
ℛ=(
𝑛1 − 𝑛2 2 ) . 𝑛1 + 𝑛2
Leistungsreflexion und -transmission
Die Reflexions- und Transmissionskoeffizienten r und t beschreiben Verhältnisse von komplexen Amplituden. Der Leistungsreflexionsgrad ℛ und der Leistungstransmissionsgrad 𝒯 sind dagegen als die Verhältnisse
(6.41)
An der Grenzfläche zwischen Glas (𝑛 = 1.5) und Luft (𝑛 = 1) ist beispielsweise ℛ = 0.04, sodass bei senkrechtem Einfall 4 % des Lichts reflektiert werden. An der Grenzfläche zwischen GaAs (𝑛 = 3.6) und Luft (𝑛 = 1) ist ℛ ≈ 0.32, sodass bei senkrechtem Einfall 32 % reflektiert werden. Der Reflexionsgrad ändert sich jedoch stark mit dem Einfallswinkel, wie Abb. 6.16 zeigt. Die Leistungstransmission 𝒯 wird unter Verwendung der Leistungserhaltung berechnet; ohne Absorptionsverlust ist die Transmission folglich einfach 𝒯 =1−ℛ.
Abb. 6.15 Das Brewsterfenster lässt TM-polarisiertes Licht ohne Reflexionsverluste durchtreten.
(6.40)
(6.42)
Dabei ist es jedoch wichtig festzuhalten, dass 𝒯 allgemein nicht gleich |t|2 ist, da sich die Leistung in den beiden Medien in verschiedenen Winkeln und mit unterschiedlichen Impedanzen ausbreitet. Für eine Welle, die sich in einem Medium mit dem Brechungsindex 𝑛 in einem Winkel 𝜃 ausbreitet, ist der Leistungsfluss senkrecht zur Grenzfläche (|ℰ|2 ∕2𝜂) cos 𝜃 = (|ℰ|2 ∕2𝜂0 )𝑛 cos 𝜃. Daraus folgt 𝒯=
𝑛2 cos 𝜃2 2 |t| . 𝑛1 cos 𝜃1
(6.43)
6.3 Die Optik anisotroper Medien
Abb. 6.16 Leistungsreflexionsgrad von ebenen TE- und TM-polarisierten Wellen an der Grenzfläche zwischen Luft (n = 1) und GaAs (n = 3.6) als Funktion des Einfallswinkels 𝜃 .
1
n = 3.6 Leistungsreflexion
n =1
θ
TE 0.5 TM 0
0
20°
40°
Reflexion an einer Platte
Bei senkrechtem Einfall ist die Leistungsreflexion an einer Platte mit zwei Oberflächen ℛ(1 + 𝒯 2 ), da die von der hinteren Oberfläche reflektierte Leistung einen doppelten Durchgang durch die vordere Oberfläche erfordert. Für eine Glasplatte in Luft ist die Gesamtreflexion ℛ(1 + 𝒯 2 ) = 0.04[1 + (0.96)2 ] ≈ 0.077, sodass etwa 7.7 % der einfallenden Leistung reflektiert wird. Diese Berechnung berücksichtigt aber keine Interferenzeffekte, die sich für inkohärentes Licht herausmitteln (siehe Abschnitt 12.2); auch Mehrfachreflexionen innerhalb der Platte sind vernachlässigt. Optische Transmission durch und Reflexion an mehrfachen Grenzflächen in Schichtmedien werden in Abschnitt 7.1 im Detail diskutiert.
6.3 Die Optik anisotroper Medien Ein dielektrisches Medium heißt anisotrop, wenn seine makroskopischen optischen Eigenschaften von der Richtung abhängen. Die makroskopischen Eigenschaften eines Materials werden natürlich letztlich durch seine mikroskopischen Eigenschaften bestimmt: die Gestalt und Orientierung der individuellen Moleküle und ihre Anordnung im Raum. In optischen Materialien gibt es verschiedene Arten von Orientierungs- und Lageordnung, die wie folgt charakterisiert werden können (siehe Abb. 6.17):
60°
80°
θ
• Wenn die Moleküle an völlig zufälligen Orten im Raum liegen und selbst entweder isotrop oder zufällig orientiert sind, ist das Medium isotrop. Zu dieser Gruppe gehören Gase, Flüssigkeiten und amorphe Festkörper. • Wenn die Struktur aus einzelnen kristallinen Körnchen besteht, die zufällig zueinander ausgerichtet sind, wird das Material als polykristallin bezeichnet. Die einzelnen Körnchen sind im Allgemeinen anisotrop, aber ihr gemitteltes makroskopisches Verhalten ist isotrop. • Wenn die Moleküle im Raum in einem regelmäßigen periodischen Muster organisiert und wie in Kristallen in derselben Richtung orientiert sind, ist das Medium in der Regel anisotrop. • Wenn die Moleküle anisotrop und ihre Orientierungen zueinander nicht völlig zufällig sind, ist das Medium anisotrop, selbst wenn ihre Positionen völlig zufällig sind. Das ist für Flüssigkristalle der Fall, die eine Orientierungsordnung, aber keine vollständige Lageordnung besitzen.
6.3.1 Der Brechungsindex Der Permittivitätstensor
In einem linearen anisotropen dielektrischen Medium (z. B. einem Kristall) ist jede Komponente der elektrischen Flussdichte D eine Linearkombination der drei
isotrop anisotrop
Gase, Flüssigkeiten, amorphe Festkörper
polykristalline Festkörper
Kristalle
Abb. 6.17 Lage- und Orientierungsordnung in unterschiedlichen Materialien.
Flüssigkristalle
163
164
6 Polarisationsoptik
Komponenten des elektrischen Feldes, ∑ 𝜀𝑖𝑗 𝐸𝑗 . 𝐷𝑖 =
(6.44)
𝑗
Die Indizes 𝑖, 𝑗 = 1, 2, 3 bezeichnen die 𝑥-, 𝑦- bzw. 𝑧-Komponenten, wie in Abschnitt 5.2.3 beschrieben. Die dielektrischen Eigenschaften des Mediums werden daher durch eine 3 × 3-Anordnung von neun Koeffizienten {𝜀𝑖𝑗 } charakterisiert, den elektrischen Permittivitätstensor 𝛆, einen Tensor zweiter Stufe. Meist formuliert man die Materialgleichung (6.44) in der symbolischen Form D = 𝛆E .
(6.45)
(a)
(b)
Abb. 6.18 Geometrische Darstellung (a) eines Vektors und (b) eines symmetrischen Tensors zweiter Stufe.
durch ∑ 𝑖𝑗
𝜀𝑖𝑗 𝑥𝑖 𝑥𝑗 = 1 ,
(6.46)
Für die meisten dielektrischen Medien ist der elektrische Permittivitätstensor symmetrisch, d. h. es gilt 𝜀𝑖𝑗 = 𝜀𝑗𝑖 . Das bedeutet, dass die Beziehung zwischen den Vektoren D und E reziprok ist; ihr Verhältnis bleibt gleich, wenn ihre Richtungen ausgetauscht werden. Diese Symmetrie gilt für dielektrische nichtmagnetische Materialien, die keine optische Aktivität zeigen, sowie in Abwesenheit eines äußeren Magnetfelds (siehe Abschnitt 6.4). Aufgrund dieser Symmetrie wird das Medium in einem beliebigen Koordinatensystem durch nur sechs unabhängige Zahlen charakterisiert. Für Kristalle mit bestimmten Symmetrien genügen sogar weniger Koeffizienten, da einige verschwinden und andere miteinander zusammenhängen.
definiert ist. Diese Oberfläche ist invariant unter einer Änderung des Koordinatensystems; wenn das Koordinatensystem gedreht wird, ändern sich sowohl die 𝑥𝑖 als auch die 𝜀𝑖𝑗 , aber das Ellipsoid im Raum bleibt unverändert. Das Ellipsoid hat sechs Freiheitsgrade und enthält die gesamte Information über den symmetrischen Tensor zweiter Stufe. Im Hauptkoordinatensystem ist 𝜀𝑖𝑗 diagonal, und das Ellipsoid nimmt eine besonders einfache Form an:
Geometrische Darstellung von Vektoren und Tensoren
Hauptachsen und Hauptbrechungsindizes
Ein Vektor, beispielsweise das elektrische Feld E, beschreibt eine physikalische Variable mit einem Betrag und einer Richtung. Er wird geometrisch durch einen Pfeil dargestellt, der in diese Richtung zeigt und dessen Länge proportional zum Betrag des Vektors [Abb. 6.18(a)] ist. Ein Vektor ist ein Tensor erster Stufe und wird numerisch durch drei Zahlen dargestellt, seine Projektionen auf die drei Achsen eines Koordinatensystems. Obwohl die Komponenten von der Wahl des Koordinatensystems abhängen, sind der Betrag und die Richtung des Vektors im Raum von der Wahl des Koordinatensystems unabhängig. Ein Skalar, der durch eine einzige Zahl beschrieben wird, ist ein Tensor nullter Stufe. Ein Tensor zweiter Stufe ist eine Regel, die zwei Vektoren verknüpft. In einem gegebenen Koordinatensystem wird er numerisch durch neun Zahlen dargestellt. Eine Änderung des Koordinatensystems führt zu einem anderen Satz von Zahlen, aber die physikalische Natur der Regel bleibt unverändert. Eine nützliche geometrische Darstellung [Abb. 6.18(b)] eines symmetrischen Tensors zweiter Stufe (beispielsweise des dielektrischen Tensors 𝛆) ist eine quadratische Oberfläche (ein Ellipsoid), die
Die Elemente des Permittivitätstensors hängen davon ab, wie das Koordinatensystem relativ zur Kristallstruktur gewählt wird. Es kann jedoch immer ein Koordinatensystem gefunden werden, für das die Nichtdiagonalelemente 𝜀𝑖𝑗 verschwinden, sodass
𝜀1 𝑥12 + 𝜀2 𝑥22 + 𝜀3 𝑥32 = 1 .
(6.47)
Seine Hauptachsen sind diejenigen des Tensors, und sei√ √ ne Halbachsen haben die Längen 1∕ 𝜀1 , 1∕ 𝜀2 und √ 1∕ 𝜀3 .
𝐷1 = 𝜀1 𝐸1 ,
𝐷2 = 𝜀2 𝐸2 ,
𝐷3 = 𝜀3 𝐸3
(6.48)
gilt, wobei 𝜀1 = 𝜀11 , 𝜀2 = 𝜀22 und 𝜀3 = 𝜀33 ist. Gemäß Gl. (6.44) sind E und D entlang dieser Achsen parallel; d. h. wenn E beispielsweise in 𝑥-Richtung zeigt, dann gilt dasselbe für D. Dieses Koordinatensystem definiert die Hauptachsen und Hauptebenen des Kristalls. Im Rest dieses Kapitels werden wir stets davon ausgehen, dass das Koordinatensystem 𝑥, 𝑦, 𝑧, das wir auch äquivalent mit 𝑥1 , 𝑥2 , 𝑥3 bezeichnen werden, entlang der Hauptachsen des Kristalls liegt. Diese Wahl vereinfacht alle Analysen ohne Verlust der Allgemeinheit. Die Permittivitäten 𝜀1 , 𝜀2 und 𝜀3 entsprechen den Brechungsindizes √ √ √ 𝑛1 = 𝜀1 ∕𝜀0 , 𝑛2 = 𝜀2 ∕𝜀0 , 𝑛3 = 𝜀3 ∕𝜀0 , (6.49) wobei 𝜀0 die Permittivität des Vakuums ist; sie werden als Hauptbrechungsindizes bezeichnet.
6.3 Die Optik anisotroper Medien
x3
Zweiachsige, einachsige und isotrope Kristalle
Kristalle, in denen die drei Hauptbrechungsindizes unterschiedlich sind, heißen zweiachsig. In Kristallen mit einer drei-, vier- oder sechszähligen Symmetrieachse sind zwei der Brechungsindizes gleich (𝑛1 = 𝑛2 ), und der Kristall heißt einachsig. In diesem Fall werden die Indizes 𝑛1 = 𝑛2 = 𝑛o und 𝑛3 = 𝑛e als ordentliche bzw. außerordentliche Indizes bezeichnet; die Gründe hierfür werden bald deutlich werden. Man bezeichnet den Kristall als positiv einachsig, wenn 𝑛e > 𝑛o ist, und als negativ einachsig, wenn umgekehrt 𝑛e < 𝑛o gilt. Die 𝑧-Achse eines einachsigen Kristalls wird optische Achse genannt. In bestimmten Kristallen mit noch höherer Symmetrie (z. B. mit kubischen Elementarzellen) sind alle drei Indizes gleich, und das Medium ist optisch isotrop. Der Impermeabilitätstensor
Die Beziehung D = 𝛆E kann umgekehrt und in der Form E = 𝛆−1 D geschrieben werden, wobei 𝛆−1 die Inverse des Tensors 𝛆 ist. Es ist auch nützlich, den elektrischen Impermeabilitätstensor 𝛈 = 𝜀0 𝛆−1 zu definieren (nicht zu verwechseln mit der Impedanz 𝜂 des Mediums!), sodass 𝜀0 E = 𝛈D ist. Da 𝛆 symmetrisch ist, muss auch 𝛈 symmetrisch sein. Beide Tensoren, 𝛆 und 𝛈, besitzen dieselben Hauptachsen. Im Hauptkoordinatensystem ist 𝛈 diagonal mit den Hauptwerten 𝜀0 ∕𝜀1 = 1∕𝑛12 , 𝜀0 ∕𝜀2 = 1∕𝑛22 und 𝜀0 ∕𝜀3 = 1∕𝑛32 . Jeder der beiden Tensoren beschreibt die optischen Eigenschaften des Kristalls vollständig. Das Indexellipsoid
Das Indexellipsoid (auch optische Indikatrix genannt) ist die Darstellung des elektrischen Impermeabilitätstensors 𝛈 = 𝜀0 𝛆−1 : ∑ 𝑖𝑗
η𝑖𝑗 𝑥𝑖 𝑥𝑗 = 1 ,
𝑖, 𝑗 = 1, 2, 3 .
(6.50)
Im Hauptachsensystem erhalten wir 𝑥12 𝑛12
+
𝑥22 𝑛22
+
𝑥32 𝑛32
=1
(6.51)
mit den Hauptwerten 1∕𝑛12 , 1∕𝑛22 und 1∕𝑛32 und den Halbachsen 𝑛1 , 𝑛2 und 𝑛3 . Die optischen Eigenschaften des Kristalls (die Richtungen der Hauptachsen und die Werte der Hauptbrechungsindizes) werden daher durch das Indexellipsoid (Abb. 6.19) vollständig beschrieben. Für einen einachsigen Kristall reduziert sich das Indexellipsoid auf ein Rotationsellipsoid; für ein isotropes Medium wird es zu einer Kugel.
n3
n2
x2
n1 x1
Abb. 6.19 Das Indexellipsoid. Die Koordinaten (x1 , x2 , x3 ) sind die Hauptachsen, (n1 , n2 , n3 ) sind die Hauptbrechungsindizes des Kristalls.
6.3.2 Ausbreitung entlang einer Hauptachse Die Regeln, die die Ausbreitung des Lichts in Kristallen allgemein bestimmen, sind ziemlich komplex. Sie werden jedoch relativ einfach, wenn das Licht eine ebene Welle ist, die sich entlang einer der Hauptachsen des Kristalls ausbreitet. Mit diesem Fall wollen wir beginnen. Normalmoden
𝑥𝑦𝑧 sei ein Koordinatensystem, das mit den Hauptachsen eines Kristalls zusammenfällt. Eine ebene Welle, die sich in 𝑧-Richtung ausbreitet und in 𝑥-Richtung linear polarisiert ist [Abb. 6.20(a)], bewegt sich mit der Phasengeschwindigkeit 𝑐0 ∕𝑛1 (Wellenzahl 𝑘 = 𝑛1 𝑘0 ), ohne ihre Polarisation zu verändern. Der Grund dafür ist, dass das elektrische Feld nur eine Komponente besitzt, 𝐸1 in 𝑥-Richtung, sodass auch D mit der Komponente 𝐷1 = 𝜀1 𝐸1 in 𝑥-Richtung zeigt; die aus den maxwellschen Gleichungen abgeleitete Wellengleichung liefert √ daher eine Lichtgeschwindigkeit von 1∕ 𝜇0 𝜀1 = 𝑐0 ∕𝑛1 . Entsprechend bewegt sich eine ebene Welle, die sich in 𝑧-Richtung ausbreitet und in 𝑦-Richtung linear polarisiert ist [Abb. 6.20(b)], mit der Phasengeschwindigkeit 𝑐0 ∕𝑛2 und spürt demzufolge einen Brechungsindex 𝑛2 . Die Normalmoden für die Ausbreitung in 𝑧-Richtung sind demzufolge linear in 𝑥- und 𝑦-Richtung polarisierte Wellen. Man bezeichnet diese Wellen als Normalmoden, weil sich ihre Geschwindigkeiten und Polarisationen nicht ändern, während sie sich durch das Medium bewegen (siehe Anhang C). Andere Fälle, in denen sich eine Welle entlang einer der Hauptachsen ausbreitet und entlang einer anderen linear polarisiert ist, können ähnlich behandelt werden [Abb. 6.20(c)]. Polarisation entlang beliebiger Richtungen
Wir betrachten jetzt eine Welle, die sich entlang einer Hauptachse ausbreitet (z. B. der 𝑧-Achse) und in einer beliebigen Richtung in der 𝑥𝑦-Ebene linear polarisiert
165
166
6 Polarisationsoptik z
z
k
k H
E
x
z
E
H
y
y
E
x
(a)
y
H
x
(b)
k
(c)
Abb. 6.20 Eine Welle, die sich entlang einer Hauptachse ausbreitet und in Richtung einer anderen Hauptachse polarisiert ist, hat die Phasengeschwindigkeit c0 ∕n1 , c0 ∕n2 bzw. c0 ∕n3 , wenn die Spitze des elektrischen Feldvektors in x, y bzw. z-Richtung zeigt. (a) k = n1 k0 ; (b) k = n2 k0 ; (c) k = n3 k0 . y
y
x
z
(a)
y
x
x
z
z
(c)
(b)
Abb. 6.21 Eine in einem Winkel von 45◦ in der Ebene z = 0 linear polarisierte Welle (a) wird als Superposition zweier in x- und y-Richtung linear polarisierter Komponenten (Normalmoden) dargestellt, die sich mit den Geschwindigkeiten c0 ∕n1 und c0 ∕n2 ausbreiten [(b) und (c)]. Aufgrund der Pha-
senverschiebung wird aus der linear polarisierten Welle eine elliptisch polarisierte Welle (a). Daraus wird deutlich, dass die anfängliche linear polarisierte Welle keine Normalmode des Systems ist.
ist. Dazu betrachten wir die Welle als Summe der Normalmoden, also der linear in 𝑥- und 𝑦-Richtung polarisierten Wellen. Diese beiden Komponenten breiten sich mit unterschiedlichen Phasengeschwindigkeiten 𝑐0 ∕𝑛1 und 𝑐0 ∕𝑛2 aus. Sie erfahren daher unterschiedliche Phasenverschiebungen 𝜑𝑥 = 𝑛1 𝑘0 d und 𝜑𝑦 = 𝑛2 𝑘0 d , wenn sie eine Strecke d zurücklegen. Ihr Phasendifferenz ist dann 𝜑 = 𝜑𝑦 − 𝜑𝑥 = (𝑛2 − 𝑛1 )𝑘0 d . Die Rekombination der beiden Komponenten ergibt eine elliptisch polarisierte Welle, wie in Abschnitt 6.1 erläutert wurde und in Abb. 6.21 illustriert ist. Ein solcher Kristall kann daher als Retarder dienen, in dem zwei orthogonale Polarisationen sich mit unterschiedlichen Phasengeschwindigkeiten ausbreiten, sodass die eine relativ zur anderen verzögert wird (siehe Abb. 6.9).
Die Indexellipsoid-Konstruktion zur Bestimmung von Normalmoden
6.3.3 Ausbreitung entlang beliebiger Richtungen Nun betrachten wir den allgemeinen Fall einer ebenen Welle, die sich in einem anisotropen Kristall in einer beliebigen Richtung ausbreitet, die durch den Einheitsvektor u ˆ definiert wird. Wir zeigen, dass die beiden Normalmoden linear polarisierte Wellen sind. Die Brechungsindizes 𝑛𝑎 und 𝑛𝑏 und die Polarisationsrichtungen dieser Moden bestimmen wir mithilfe eines Verfahrens auf der Grundlage des Indexellipsoids.
Abbildung 6.22 illustriert ein geometrisches Verfahren zur Bestimmung der Polarisationen und Brechungsindizes 𝑛𝑎 und 𝑛𝑏 der Normalmoden einer Welle, die sich in Richtung des Einheitsvektors u ˆ in einem anisotropen Medium ausbreitet, das durch das Indexellipsoid 𝑥12 𝑛12
+
𝑥22 𝑛22
+
𝑥32 𝑛32
=1.
charakterisiert ist. Die folgenden Schritte führen uns dann zu dem gewünschten Ziel: • Zeichnen Sie eine zu u ˆ senkrechte Ebene durch den Ursprung des Indexellipsoids. Die Schnittfläche dieser Ebene mit dem Ellipsoid ist die sogenannte Indexellipse. • Die Längen der großen und kleinen Halbachsen der Indexellipse sind die Brechungsindizes 𝑛𝑎 und 𝑛𝑏 der beiden Normalmoden. • Die Richtungen der großen und kleinen Halbachsen der Indexellipse sind die Richtungen der Vektoren D𝑎 und D𝑏 der Normalmoden. Sie sind orthogonal. • Die Vektoren E𝑎 und E𝑏 können mithilfe von Gl. (6.48) aus D𝑎 und D𝑏 bestimmt werden.
6.3 Die Optik anisotroper Medien
x3
Die Operation −ˆ u × (ˆ u × 𝛈D) kann als Projektion des Vektors 𝛈D auf eine zu u ˆ senkrechte Ebene interpretiert werden. Wir können daher Gl. (6.56) in der Form 1 P𝑢 𝛈D = 2 D (6.57) 𝑛 schreiben, wobei P𝑢 ein Projektionsoperator ist. Gleichung (6.57) ist eine Eigenwertgleichung für den Operator P𝑢 𝛈 mit dem Eigenwert 1∕𝑛2 und den Eigenvektoren D. Die beiden Eigenwerte 1∕𝑛𝑎2 und 1∕𝑛𝑏2 und die zugehörigen Eigenvektoren D𝑎 und D𝑏 geben die zwei Normalmoden an. Für das Eigenwertproblem Gl. (6.57) existiert eine einfache geometrische Interpretation. Der Tensor 𝛈 wird geometrisch durch das Indexellipsoid charakterisiert. Der Operator P𝑢 𝛈 beschreibt eine Projektion auf eine zu u ˆ senkrechte Ebene. Die Lösung des Eigenwertproblems in Gl. (6.57) entspricht daher der Bestimmung der Hauptachsen der Ellipse, die sich als Schnittfläche der zu u ˆ senkrechten Ebene mit dem Indexellipsoid ergibt. Das ist genau die Konstruktion, die in Abb. 6.22 verwendet wurde, um die Normalmoden zu bestimmen.
n3
Indexellipse
û
na Da
n1 nb
n2
Db
x2
x1 Indexellipsoid
Abb. 6.22 Bestimmung der Normalmoden aus dem Indexellipsoid.
Beweis: Die Indexellipsoid-Konstruktion zur Bestimmung der Normalmoden. Um die Normalmoden einer ebenen Welle zu bestimmen, die sich in der Richtung u ˆ ausbreitet (siehe Abschnitt 6.1.2), bringen wir die maxwellschen Gleichungen (5.43)–(5.46) und die Materialgleichung D = 𝛆E aus Gl. (6.45) in die Form eines Eigenwertproblems. Da wir annehmen, dass alle Felder wie exp(−ik ⋅ r) vom Ort r abhängen, wobei k = 𝑘ˆ u ist, reduzieren sich die maxwellschen Gleichungen (5.65) und Gl. (5.66) auf k × H = −𝜔D ,
(6.52)
k × E = 𝜔𝜇0 H .
(6.53)
Ein Spezialfall: Einachsige Kristalle
In einachsigen Kristallen (𝑛1 = 𝑛2 = 𝑛o und 𝑛3 = 𝑛e ) ist das Indexellipsoid aus Abb. 6.22 ein Rotationsellipsoid. Für eine Welle, deren Ausbreitungsrichtung u ˆ einen Winkel 𝜃 mit der optischen Achse einschließt, hat die Indexellipse die Halbachsen 𝑛o und 𝑛(𝜃) und es gilt
Wenn wir Gl. (6.53) in Gl. (6.52) einsetzen, erhalten wir k × (k × E) = −𝜔2 𝜇0 D .
(6.54)
−1
Mit E = 𝛆 D wird daraus k × (k × 𝛆−1 D) = −𝜔2 𝜇0 D .
(6.55)
optische Achse
Das ist eine Eigenwertgleichung, die D erfüllen muss. Es ist praktisch, mit D zu arbeiten, da wir wissen, dass es in einer zur Wellenrichtung u ˆ senkrechten Ebene liegt. Wir vereinfachen jetzt Gl. (6.55), indem wir 𝛈 = 𝜀0 𝛆−1 , k = 𝑘ˆ u, 𝑛 = 𝑘∕𝑘0 , und 𝑘02 = 𝜔2 𝜇0 𝜀0 einsetzen. Das ergibt 1 (6.56) −ˆ u × (ˆ u × 𝛈D) = 2 D . 𝑛 θ
k
no
2
cos2 𝜃 sin 𝜃 + , (6.58) 𝑛o2 𝑛e2 sodass die Normalmoden die Brechungsindizes 𝑛𝑏 = 𝑛o und 𝑛𝑎 = 𝑛(𝜃) besitzen. Die erste Mode, die als ordentliche Welle bezeichnet wird, hat einen Brechungsindex 𝑛o unabhängig von 𝜃. Wie aus Abb. 6.23 zu erkennen ist, hat die zweite Mode, die außerordentliche Welle, einen Brechungsindex 𝑛(𝜃), der von 𝑛o für 𝜃 = 0◦ bis 𝑛e für 𝜃 = 90◦ variiert. Der Vektor D der ordentlichen Welle steht senkrecht auf der durch die optische Achse (𝑧Achse) und die Richtung k der Wellenausbreitung definierten Ebene und die Vektoren E und D sind parallel. 1
𝑛2 (𝜃)
=
k
n(θ)
θ
D
θ ne
k E
θ H
E,D
H e-Welle
o-Welle
(a)
(b)
Abb. 6.23 Abhängigkeit des Brechungsindex n(𝜃) der außerordentlichen Welle von 𝜃 (dem Winkel zwischen der Ausbreitungsrichtung und der optischen Achse) in einem einachsigen Kristall sowie die Richtungen der elektromagnetischen
(c)
Felder der ordentlichen (o) und außerordentlichen (e) Wellen. Der Kreis mit einem Punkt am Ursprung bedeutet, dass der Vektor aus der Papierebene heraus zeigt.
167
168
6 Polarisationsoptik
Der Vektor D der außerordentlichen Welle steht dagegen senkrecht auf k und liegt in der 𝑘𝑧-Ebene, und E ist nicht parallel zu D, wie Abb. 6.23 zeigt.
6.3.4 Die Dispersionsrelation, Strahlen, Wellenfronten und Energietransport Wir untersuchen jetzt andere Eigenschaften von Wellen in anisotropen Medien wie z. B. die Dispersionsrelation (die Beziehung zwischen 𝜔 und k). Die optische Welle ist durch ihren Wellenvektor k, die Feldvektoren E, D, H und B, und den komplexen 1 Poyntingvektor S = E × H∗ (die Richtung des Leis2 tungsflusses) charakterisiert. Diese Vektoren sind durch die Gln. (6.52) und (6.53) miteinander verknüpft. Aus Gl. (6.52) folgt, dass D sowohl auf k als auch auf H senkrecht steht. Gleichung (6.53) zeigt entsprechend, dass H sowohl zu k als auch zu E senkrecht ist. Diese geometrischen Bedingungen werden in Abb. 6.24 illustriert, die auch den komplexen Poyntingvektor S zeigt, der sowohl zu E als auch zu H orthogonal ist. Folglich liegen D, E, k und S in einer Ebene, auf der H und B senkrecht stehen. In dieser Ebene gilt D ⟂ k und S ⟂ E, aber D ist nicht unbedingt parallel zu E und S ist nicht unbedingt parallel zu k.
D
E
⎡0⎤ ⎢ ⎥ (6.60) = ⎢0⎥ ⎢ ⎥ 0 ⎣ ⎦ lauten, wobei (𝑘1 , 𝑘2 , 𝑘3 ) die Komponenten von k sind, 𝑘0 = 𝜔∕𝑐0 , und (𝑛1 , 𝑛2 , 𝑛3 ) die durch durch Gl. (6.49) gegebenen Hauptbrechungsindizes. Damit diese Gleichungen eine nichttriviale Lösung besitzen, muss die Determinante der Matrix null sein; daraus folgt ∑
𝑘𝑗2
𝑗 = 1,2,3
𝑘2 − 𝑛𝑗2 𝑘02
=1
(6.61)
mit 𝑘2 = 𝑘12 + 𝑘22 + 𝑘32 und 𝑘0 = 𝜔∕𝑐. Diese Beziehung ist unter der Bezeichnung Dispersionsrelation bekannt; sie ist die Gleichung einer Oberfläche 𝜔 = 𝜔(𝑘1 , 𝑘2 , 𝑘3 ) im 𝑘1 𝑘2 𝑘3 -Raum, die als Normalfläche oder k-Fläche bezeichnet wird. Die k-Fläche ist eine zentrosymmetrische Oberfläche, die aus zwei Schichten besteht, von denen jede einer Lösung (einer Normalmode) entspricht. Man kann zeigen, dass die k-Fläche jede der Hauptebenen in einer Ellipse und einem Kreis schneidet, wie Abb. 6.25 zeigt. In zweiachsigen Kristallen (𝑛1 < 𝑛2 < 𝑛3 ) berühren sich die beiden Schichten an vier Punkten, die zwei optische Achsen definieren. Im einachsigen Fall (𝑛1 = 𝑛2 = 𝑛o , 𝑛3 = 𝑛e ) werden die beiden Schichten zu einer Kugel und einem Rotationsellipsoid, die sich nur in zwei Punkten berühren und so eine einzige optische Achse definieren (die 𝑧-Achse). Im isotropen Fall (𝑛1 = 𝑛2 = 𝑛3 = 𝑛) entarten die beiden Schichten zu einer einzigen Kugel.
k H,B
Bestimmung der Eigenschaften von Normalmoden aus der k-Fläche
S
Abb. 6.24 Die Vektoren D, E, k und S liegen alle in einer Ebene, auf der H und B senkrecht stehen. Es gilt D ⟂ k und E ⟂ S.
Die Dispersionsrelation
Mithilfe der Beziehung D = 𝛆E aus Gl. (6.54) erhalten wir k × (k × E) + 𝜔2 𝜇0 𝛆E = 0 .
(6.59)
Diese Vektorgleichung für E entspricht drei linearen homogenen Gleichungen für die Komponenten 𝐸1 , 𝐸2 und 𝐸3 entlang der Hauptachsen, die in Matrixform ⎤ ⎡𝐸1 ⎤ ⎡𝑛12 𝑘02 − 𝑘22 − 𝑘32 𝑘1 𝑘2 𝑘1 𝑘3 ⎥⎢ ⎥ ⎢ 2 2 2 2 𝑘2 𝑘1 𝑛2 𝑘0 − 𝑘1 − 𝑘3 𝑘2 𝑘3 ⎥ ⎢𝐸2 ⎥ ⎢ ⎥⎢ ⎥ ⎢ 𝑘3 𝑘1 𝑘3 𝑘2 𝑛32 𝑘02 − 𝑘12 − 𝑘22 𝐸3 ⎦⎣ ⎦ ⎣
Ähnlich wie das Indexellipsoid kann auch die k-Fläche verwendet werden, um die Normalmoden von Wellen zu bestimmen, die sich in beliebigen Richtungen ausbreiten. Sie ermöglicht aber auch Einblicke in eine Reihe von sonstigen Eigenschaften dieser Strahlen, wie wir nun sehen werden. Der Schnittpunkt der Richtung u ˆ= (𝑢1 , 𝑢2 , 𝑢3 ) der Welle mit der k-Fläche entspricht der Wellenzahl 𝑘 = 𝑛𝜔∕𝑐0 , aus der wir den Brechungsindex 𝑛 und die zugehörige Phasengeschwindigkeit 𝑐 = 𝜔∕𝑘 bestimmen können. Genauer gesagt sind mit jeder Richtung zwei Schnittpunkte und entsprechend zwei Wellenzahlen und zwei Brechungsindizes für die beiden Normalmoden verknüpft. Wenn wir (𝑘1 , 𝑘2 , 𝑘3 ) = (𝑢1 𝑘, 𝑢2 𝑘, 𝑢3 𝑘) in Gl. (6.61) einsetzen, erhalten wir 𝑢𝑗2 𝑘2 ∑ =1. (6.62) 2 2 2 𝑗 = 1,2,3 𝑘 − 𝑛𝑗 𝑘0
Brechungsindizes.
k3/k0
optische Achse
6.3 Die Optik anisotroper Medien
n2 n1
op Ac tisch hs e e
n1
k3/k0
k3/k0
no
n3
n no
k2/k0 n3 k1/k0
ne
no
n2
n
k2/k0
k1/k0
ne k1/k0 (a)
k2/k0
n
(b)
(c)
Das ist eine Gleichung vierter Ordnung in 𝑘 (oder zweiter Ordnung in 𝑘2 ). Sie hat vier Lösungen, ±𝑘𝑎 und ±𝑘𝑏 , von denen nur die beiden positiven Werte eine Bedeutung haben, da die negativen Werte einer umgekehrten Ausbreitungsrichtung entsprechen. Damit ist die Aufgabe gelöst: Die Wellenzahlen der Normalmoden sind 𝑘𝑎 und 𝑘𝑏 , und die Brechungsindizes sind 𝑛𝑎 = 𝑘𝑎 ∕𝑘0 und 𝑛𝑏 = 𝑘𝑏 ∕𝑘0 . Polarisation. Um die Polarisationsrichtungen der beiden Normalmoden zu bestimmen, bestimmen wir die Komponenten (𝑘1 , 𝑘2 , 𝑘3 ) = (𝑘𝑢1 , 𝑘𝑢2 , 𝑘𝑢3 ) und die Elemente der Matrix in Gl. (6.60) für jede der beiden Wellenzahlen 𝑘 = 𝑘𝑎 und 𝑘 = 𝑘𝑏 . Wir lösen dann zwei der drei Gleichungen (6.60) und bestimmen die Verhältnisse 𝐸1 ∕𝐸3 und 𝐸2 ∕𝐸3 , aus denen wir die Richtung der Felder E𝑎 und E𝑏 erhalten. Dabei müssen E𝑎 und E𝑏 der beiden Normalmoden nicht unbedingt orthogonal zueinander sein, wohl aber D𝑎 und D𝑏 . Gruppengeschwindigkeit. Auch die Gruppengeschwindigkeit kann aus der k-Fläche bestimmt werden. Analog zur Gruppengeschwindigkeit 𝑣 = d𝜔∕ d𝑘, die wie in Abschnitt 5.7 besprochen die Ausbreitung von Lichtpulsen (Wellenpaketen) bestimmt, ist die Gruppengeschwindigkeit für Strahlen (lokalisierte Strahlbündel oder räumliche Wellenpakete) gleich dem Vektor v = ∇𝑘 𝜔(k), dem Gradienten von 𝜔 bezüglich k. Da für die k-Fläche 𝜔(𝑘1 , 𝑘2 , 𝑘3 ) = konstant gilt, ist muss v senkrecht auf der k-Fläche
k-Fläche Wellenfronten
stehen. Strahlen breiten sich folglich in Richtungen senkrecht zur k-Fläche aus. Die Wellenfronten stehen senkrecht auf dem Wellenvektor k, da die Phase der Welle k ⋅ r ist. Die Wellenfrontnormalen sind daher parallel zu dem Wellenvektor k. Energietransport. Der komplexe Poyntingvektor S = 1 E × H∗ steht ebenfalls senkrecht auf der k-Flä2 che, wie man zeigen kann, indem man einen Wert für 𝜔 wählt und zwei Vektoren k und k + Δk auf der k-Fläche betrachtet. Wenn man das Differential der Gln. (6.52) und (6.53) bildet und einige Vektoridentitäten verwendet, kann man zeigen, dass Δk ⋅ S = 0 ist, dass also S senkrecht auf der k-Fläche steht. Also ist S ist auch parallel zu dem Vektor v der Gruppengeschwindigkeit. Optische Strahlen. Wenn die k-Fläche eine Kugel ist, wie in isotropen Medien, sind die Vektoren v, S und k alle parallel, was zeigt, dass die Strahlen parallel zum Wellenvektor k sind und Energie in derselben Richtung fließt wie in Abb. 6.26(a) dargestellt. Wenn andererseits die k-Fläche nicht senkrecht auf dem Wellenvektor k steht, wie in Abb. 6.26(b), sind die Strahlen und die Richtung des Energietransports nicht orthogonal zu den Wellenfronten. Die Strahlen sind dann insofern „außerordentlich“, als dass sie sich in einem schiefen Winkel zu ihren Wellenfronten ausbreiten [Abb. 6.26(b)].
Strahl Wellenfronten
Strahl S
k-Fläche
S
k
0 (a) Ordentliche Welle
Abb. 6.25 Ein Oktant der kFläche für (a) einen zweiachsigen Kristall (n1 < n2 < n3 ), (b) einen einachsigen Kristall (n1 = n2 = no , n3 = ne ), und (c) einen isotropen Kristall (n1 = n2 = n3 = n).
k
0 (b) Außerordentliche Welle
Abb. 6.26 Strahlen und Wellenfronten für (a) eine sphärische und (b) eine nichtsphärische k-Fläche.
169
170
6 Polarisationsoptik
k3/k0 no
n(θ) no k/k 0 θ
no
ne k /k 2 0
Abb. 6.27 Schnitte der k-Flächen mit der yz-Ebene für einen positiven einachsigen Kristall (ne > no ).
Ein Spezialfall: Einachsige Kristalle
In einachsigen Kristallen (𝑛1 = 𝑛2 = 𝑛o und 𝑛3 = 𝑛e ) vereinfacht sich die Gleichung für die k-Fläche 𝜔 = 𝜔(𝑘1 , 𝑘2 , 𝑘3 ) zu (𝑘2 − 𝑛o2 𝑘02 ) (
𝑘12 + 𝑘22 𝑛e2
+
𝑘32 𝑛o2
− 𝑘02 ) = 0 .
(6.63)
Diese Gleichung hat zwei Lösungen: Eine Kugel für den Fall, dass der erste Faktor null wird, 𝑘 = 𝑛o 𝑘0 ,
(6.64)
und ein Rotationsellipsoid für den Fall, dass der zweite Faktor null ist, 𝑘12 + 𝑘22 𝑛e2
+
𝑘32 𝑛o2
= 𝑘02 .
(6.65)
Wegen der Symmetrie um die 𝑧-Achse (optische Achse) bedeutet es keinen Verlust der Allgemeinheit, wenn wir annehmen, dass der Vektor k in der 𝑦𝑧-Ebene liegt. Seine Richtung wird dann durch den Winkel 𝜃 charakterisiert, den er mit der optischen Achse einschließt. Daher
werden die 𝑘-Flächen der Bequemlichkeit halber oft nur als Kreise oder Ellipsen in der 𝑦𝑧-Ebene dargestellt, wie in Abb. 6.27. Wenn die Richtung u ˆ des Vektors k bekannt ist, kann die Wellenzahl 𝑘 bestimmt werden, indem man den Schnittpunkt mit den k-Flächen sucht. Die beiden Lösungen legen die Normalmoden fest, die ordentlichen und außerordentlichen Wellen. Die ordentliche Welle hat unabhängig von der Richtung u ˆ die Wellenzahl 𝑘 = 𝑛o 𝑘0 , wohingegen die außerordentliche Welle die Wellenzahl 𝑛(𝜃)𝑘0 besitzt, wobei 𝑛(𝜃) durch Gl. (6.58) gegeben ist, was unsere früher im Zusammenhang mit der geometrischen Indexellipsoid-Konstruktion erhaltenen Ergebnisse bestätigt. Die Richtungen der Strahlen, der Wellenfronten, des Energieflusses und der Feldvektoren E und D der ordentlichen und außerordentlichen Wellen in einem einachsigen Kristall sind in Abb. 6.28 dargestellt.
6.3.5
Doppelbrechung
Die Brechung ebener Wellen
Wir untersuchen nun die Brechung einer ebenen Welle an der Grenzfläche zwischen einem isotropen Medium (z. B. Luft, 𝑛 = 1) und einem anisotropen Medium (einem Kristall). Das entscheidende Prinzip, das die Brechung von Wellen für diese Anordnung bestimmt, ist dass die Wellenfronten der einfallenden und gebrochenen Wellen an der Grenzfläche übereinstimmen müssen. Weil das anisotrope Medium zwei Moden mit unterschiedlichen Phasengeschwindigkeiten und daher unterschiedlichen Brechungsindizes erlaubt, erzeugt eine einfallende Welle zwei gebrochene Wellen mit unter-
S
S E, D
k3/k0
k
H
no
S
k/k0 H
k3/k0
E
no
θ E, D
D
D
θ
E
no k /k 2 0
(a) Ordentliche Welle
H
S
H
k
k/k0
ne k2/k0
(b) Außerordentliche Welle
Abb. 6.28 Die Normalmoden einer ebenen Welle, die sich in einer Richtung k in einem Winkel 𝜃 zur optischen Achse z eines einachsigen Kristalls ausbreitet, sind: (a) Eine ordentliche Welle mit dem Brechungsindex no , die senkrecht zur kz-Ebene polarisiert ist. (b) Eine außerordentliche Welle mit dem Brechungsindex n(𝜃) [gegeben durch Gl. (6.58)], die in der kz-Ebene entlang einer zur Ellipse (der k-Fläche) an ih-
rem Schnittpunkt mit k tangentialen Richtung polarisiert ist. Diese Welle ist in folgender Hinsicht „außerordentlich“: D ist nicht parallel zu E, aber beide liegen in der kz-Ebene, und S ist nicht parallel zu k, sodass die Leistung nicht entlang der Richtung k fließt; die Strahlen stehen daher nicht senkrecht auf den Wellenfronten, die Welle breitet sich „seitwärts“ aus.
6.3 Die Optik anisotroper Medien
schiedlichen Ausbreitungsrichtungen und Polarisationen. Dieser Effekt heißt Doppelbrechung. Die Bedingung, dass die Phasen übereinstimmen müssen, erfordert, dass das snelliussche Gesetz gilt, also 𝑘0 sin 𝜃1 = 𝑘 sin 𝜃 ,
(6.66)
wobei 𝜃1 und 𝜃 die Einfalls- bzw. Brechungswinkel sind. In einem anisotropen Medium ist die Wellenzahl 𝑘 = 𝑛(𝜃)𝑘0 aber selbst eine Funktion von 𝜃, sodass sin 𝜃1 = 𝑛(𝜃𝑎 + 𝜃) sin 𝜃
(6.67)
gilt, wobei 𝜃𝑎 der Winkel zwischen der optischen Achse und der Senkrechten zur Oberfläche ist, sodass 𝜃𝑎 + 𝜃 der Winkel ist, den der gebrochene Strahl mit der optischen Achse einschließt. Gleichung (6.67) ist eine modifizierte Version des snelliusschen Gesetzes. Um Gl. (6.66) zu lösen, zeichnen wir die Schnittmenge der k-Fläche mit der Einfallsebene und suchen nach einem Winkel 𝜃, für den Gl. (6.66) erfüllt ist. Dabei sind zwei Lösungen entsprechend den beiden Normalmoden zu erwarten. Der Polarisationszustand des einfallenden Lichts bestimmt die Verteilung der Energie zwischen den beiden gebrochenen Wellen. Als Beispiel betrachten wir einen einachsigen Kristall und eine Einfallsebene parallel zur optischen Achse. Die k-Flächen schneiden die Einfallsebene in einem Kreis und einer Ellipse (Abb. 6.29). Die beiden gebrochenen Wellen, die die Phasenbedingung erfüllen, müssen Gl. (6.67) erfüllen: • Eine ordentliche Welle mit orthogonaler Polarisation (TE) in einem Winkel 𝜃 = 𝜃o , für den sin 𝜃1 = 𝑛o sin 𝜃o
(6.68)
gilt. • Eine außerordentliche Welle mit paralleler Polarisation (TM) in einem Winkel 𝜃 = 𝜃e , für den sin 𝜃1 = 𝑛(𝜃𝑎 + 𝜃e ) sin 𝜃e
(6.69)
gilt, wobei 𝑛(𝜃) durch Gl. (6.58) gegeben ist.
Wenn die einfallende Welle diese beiden Polarisationen enthält, erscheinen die beiden gebrochenen Wellen wie in Abb. 6.29 gezeigt. Die Brechung von Strahlen
Die soeben gegebene Analyse galt für die Brechung ebener Wellen. Die Brechung von Strahlen in einem anisotropen Medium ist ein anderer Fall, da Strahlen sich nicht unbedingt senkrecht zu den Wellenfronten ausbreiten. In der Luft, vor dem Eintritt in den Kristall, stehen die Wellenfronten senkrecht zu den Strahlen. Der Wellenvektor der gebrochenen Welle muss die Phasenbedingung erfüllen, sodass das snelliussche Gesetz Gl. (6.67) gilt und der Brechungswinkel 𝜃 die Richtung k festlegt. Da die Richtung von k aber nicht die Richtung des Strahls ist, ist das snelliussche Gesetz auf Strahlen in anisotropen Medien nicht anwendbar. Ein Beispiel, das die Abweichung vom snelliusschen Gesetz besonders deutlich macht, ist der senkrechte Lichteinfall in einen einachsigen Kristall, dessen optische Achse weder parallel noch senkrecht zur Kristalloberfläche liegt. Der k-Vektor der einfallenden Welle steht senkrecht zur Oberfläche. Um die Übereinstimmung der Phasen sicherzustellen, müssen die Wellenvektoren der gebrochenen Wellen in dieselbe Richtung zeigen. Die Schnittstellen mit der k-Fläche liefern zwei Punkte entsprechend zwei Wellen. Der ordentliche Strahl ist parallel zu k. Der außerordentliche Strahl zeigt jedoch in Richtung der Flächennormalen der k-Fläche und schließt einen Winkel 𝜃𝑠 mit der Senkrechten auf die Kristalloberfläche ein, wie in Abb. 6.30 dargestellt. Folglich erzeugt senkrechter Einfall schräge Brechung. Das Prinzip der übereinstimmenden Phasen gilt jedoch weiterhin: Die Wellenfronten der beiden gebrochenen Strahlen sind parallel zur Kristalloberfläche und zur Wellenfront des einfallenden Strahls. Wenn Lichtstrahlen wie oben beschrieben durch eine Platte aus einem anisotropen Material hindurchtreten, werden die beiden an der ersten Oberfläche gebrochenen Strahlen an der zweiten Oberfläche erneut gebro-
k-Fläche (Kristall)
außerordentliche Welle
k
op Ac tisc hs he e
op Ac tisc hs he e
θe θa k0
θo
k
θ1
k0 sin θ1
k0 sin θ1
θe θa
k-Fläche (Luft)
ordentliche Welle
θ1
θo
Kristall Luft
Abb. 6.29 Bestimmung der Brechungswinkel durch Gleichsetzung der Projektionen der k-Vektoren in Luft und einem einachsigen Kristall.
171
172
6 Polarisationsoptik
S
Abb. 6.30 Doppelbrechung bei senkrechtem Einfall.
θs k
opt
isc
he
k-Fläche
Ac
k
hse
außerordent- θs licher Strahl
ordentlicher Strahl Kristall Luft
außerordentlicher Strahl
hse
e Ac
ch optis
Abb. 6.31 Doppelbrechung in einer anisotropen Platte. Die Platte wirkt als polarisierender Strahlteiler.
ordentlicher Strahl
chen, wodurch zwei seitlich verschobene Strahlen mit orthogonalen Polarisationen entstehen, wie in Abb. 6.31 gezeigt.
6.4 Optische Aktivität und Magnetooptik
tor des elektrischen Feldes der rechtszirkular polarisierten Welle [im Uhrzeigersinn, wenn man der Welle entgegenblickt, wie Abb. 6.32(a) zeigt]. Man bezeichnet solche Materialien als rechtsdrehend und diejenigen, für die 𝑛+ > 𝑛− ist, als linksdrehend.
Herleitung: Das Drehvermögen
6.4.1 Optische Aktivität Bestimmte Materialien können die Polarisationsebene von linear polarisiertem Licht drehen, das durch sie hindurchtritt; diese Eigenschaft wird als optische Aktivität bezeichnet. Die Normalmoden dieser Substanzen sind nicht linear, sondern zirkular polarisiert; rechtsund linkszirkular polarisierte Wellen breiten sich in ihnen mit unterschiedlichen Phasengeschwindigkeiten aus. Wir zeigen weiter unten, dass ein optisch aktives Medium mit den Phasengeschwindigkeiten 𝑐0 ∕𝑛+ und 𝑐0 ∕𝑛− der rechts- und linkszirkular polarisierten Wellen die Polarisationsebene um einen Winkel π(𝑛− 𝑛+ )d ∕𝜆0 dreht, wenn d die Dicke des Mediums bedeutet. Das Drehvermögen (Drehwinkel pro Längeneinheit) des optisch aktiven Mediums ist daher
Gleichung (6.70) kann hergeleitet werden, indem man die einfallende linear polarisierte Welle in eine Summe von rechts- und linkszirkular polarisierten Komponenten gleicher Amplituden zerlegt (siehe Beispiel 6-1), ⎡cos 𝜃⎤ 1 −i𝜃 ⎡1⎤ 1 i𝜃 ⎡ 1 ⎤ ⎢ ⎥ = 2e ⎢ ⎥ + 2e ⎢ ⎥ , sin 𝜃 i −i ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
(6.71)
wobei 𝜃 der anfängliche Winkel der Polarisationsebene ist. Nachdem das Licht eine Strecke d durch das Medium zurückgelegt hat, sind die Phasenverschiebungen der rechts- und linkszirkular polarisierten Wellen 𝜑+ = 2π 𝑛+ d ∕𝜆0 und 𝜑− = 2π 𝑛− d ∕𝜆0 , woraus sich ein Jonesvektor
(6.70)
1 −i𝜃 −i𝜑+ ⎡1⎤ 1 i𝜃 −i𝜑− ⎡ 1 ⎤ −i𝜑0 ⎡cos (𝜃 − 𝜑∕2)⎤ e e ⎢ ⎥+ e e ⎢ ⎥= e ⎢ ⎥ 2 2 i −i sin (𝜃 − 𝜑∕2) ⎣ ⎦ ⎣ ⎦ ⎣ ⎦ (6.72)
Die Richtung, in der die Polarisationsebene gedreht wird, ist diejenige der zirkular polarisierten Komponente mit der größeren Phasengeschwindigkeit (dem kleineren Brechungsindex). Für 𝑛+ < 𝑛− ist 𝜌 positiv, und die Drehung erfolgt in derselben Richtung wie der Vek-
ergibt, wobei 𝜑0 = (𝜑+ + 𝜑− ) und 𝜑 = 𝜑− − 𝜑+ = 2 2π(𝑛− − 𝑛+ )d ∕𝜆0 ist. Dieser Jonesvektor beschreibt eine linear polarisierte Welle, deren Polarisationsebene gemäß Gl. (6.70) um einen Winkel 𝜑∕2 = π(𝑛− − 𝑛+ )d ∕𝜆0 gedreht ist.
𝜌=
π (𝑛 − 𝑛+ ) . 𝜆0 −
1
6.4 Optische Aktivität und Magnetooptik
k R
L
n+
n–
(a) Vorwärtswelle
k φ/2
R
L
n+
n–
φ/2
(b) Rückwärtswelle
Abb. 6.32 (a) Die Rotation der Polarisationsebene durch ein optisch aktives Medium entsteht aus dem Geschwindigkeitsunterschied der beiden zirkularen Polarisationen. In dieser Illustration ist die rechtszirkular polarisierte Welle (R) schneller als die linkszirkular polarisierte Welle (L),
d. h. n+ < n− , sodass 𝜌 positiv und das Material rechtsdrehend ist. (b) Wenn die Welle in (a) nach dem Durchqueren des Mediums reflektiert wird, wird die Polarisationsebene in der entgegengesetzten Richtung gedreht, sodass die Welle unverändert wieder austritt.
Optische Aktivität tritt in Materialien mit einer intrinsisch helikalen Struktur auf. Dazu gehören beispielsweise Selen, Tellur, Telluroxid (TeO2 ), Quarz (𝛼-SiO2 ) oder Zinnober (HgS). Optisch aktive Flüssigkeiten bestehen aus sogenannten chiralen Molekülen, die in links- und rechtshändigen (spiegelbildlichen) Varianten existieren. Viele organische Verbindungen, wie Aminosäuren und Zucker, zeigen optische Aktivität. Fast alle Aminosäuren sind linksdrehend, wohingegen Zucker in beiden Formen vorkommen: Dextrose (d-Traubenzucker) ist rechtsdrehend, Levulose (Fructose) ist linksdrehend, wie ihre Namen schon zeigen. Drehvermögen und Drehsinn von Lösungen solcher Substanzen hängen sowohl von der Konzentration als auch von der Struktur der gelösten Substanz ab. Mithilfe eines Saccharimeters wird die optische Aktivität von Zuckerlösungen bestimmt, woraus die Zuckerkonzentration berechnet werden kann.
abhängt, hängt die eines Mediums mit räumlicher Dispersion vom Wellenvektor k ab. Ein optisch aktives Medium wird durch die k-abhängige Materialgleichung
Materialgleichungen
geschrieben, wobei G = 𝜉k der Gyrationsvektor ist. In solchen Medien ist der Vektor D offensichtlich nicht parallel zu E, da der Vektor G × E in Gl. (6.74) senkrecht auf E steht.
Wenn eine zeitlich variierende magnetische Flussdichte B auf eine optisch aktive Struktur wirkt, erzeugt sie wegen ihres helikalen Charakters einen Ringstrom, der ein elektrisches Dipolmoment (und folglich eine Polarisation) proportional zu i𝜔B = −∇ × E hervorruft. Das optisch aktive Medium ist daher räumlich dispersiv; d. h. die Beziehung zwischen D(r) und E(r) ist nichtlokal. Mit anderen Worten, D(r) am Ort r wird nicht nur durch E(r), sondern auch durch E(r′ ) an Punkten r′ in der unmittelbaren Umgebung von r bestimmt, da es von den in ∇ × E(r) enthaltenen räumlichen Ableitungen abhängt. Für eine ebene Welle ist E(r) = E exp(−ik ⋅ r) und ∇ × E = −ik × E, sodass der dielektrische Permittivitätstensor vom Wellenvektor k abhängt. Räumliche Dispersion ist analog zur zeitlichen Dispersion, die in der nichtinstantanen Antwort des Mediums begründet ist (siehe Abschnitt 5.2). Während die Permittivität eines Mediums mit zeitlicher Dispersion von der Frequenz 𝜔
D = 𝜀E + i𝜀0 𝜉k × E
(6.73)
beschrieben, in der 𝜉 eine Größe (ein Pseudoskalar) ist, deren Vorzeichen sich je nach der Händigkeit des Koordinatensystems ändert. Diese Beziehung ist unter geeigneten Symmetriebedingungen 3) eine Näherung erster Ordnung für die k-Abhängigkeit des Permittivitätstensors. Der erste Term beschreibt die Antwort eines isotropen dielektrischen Mediums, wohingegen der zweite Term für die optische Aktivität verantwortlich ist, wie wir gleich zeigen werden. Diese Beziehung zwischen D und E wird häufig in der Form D = 𝜀E + i𝜀0 G × E
(6.74)
Normalmoden eines optisch aktiven Mediums
Als Nächstes wollen wir zeigen, dass die Normalmoden eines durch Gl. (6.74) beschriebenen Mediums zirkular polarisierte Wellen sind und bestimmen die Geschwindigkeiten 𝑐0 ∕𝑛+ und 𝑐0 ∕𝑛− als Funktion der Konstante 𝐺 = 𝜉𝑘. Wir nehmen an, dass sich die Welle in 𝑧-Richtung ausbreitet, sodass k = (0, 0, 𝑘) und daher G = (0, 0, 𝐺) ist. Gleichung (6.74) kann dann mit 𝑛2 = 𝜀∕𝜀0 in Matrix-
3) Siehe z. B. L. D. Landau, E. M. Lifschitz, Elektrodynamik der Kontinua, Europa-Lehrmittel, 5. Auflage 1990, Kapitel 12.
173
174
6 Polarisationsoptik
6.4.2
schreibweise als ⎡𝑛 2 ⎡𝐷1 ⎤ ⎢ ⎢ ⎥ ⎢𝐷2 ⎥ = 𝜀0 ⎢i𝐺 ⎢ ⎢ ⎥ 𝐷 0 ⎣ ⎣ 3⎦
−i𝐺 𝑛2 0
0 ⎤ ⎡𝐸1 ⎤ ⎥⎢ ⎥ 0 ⎥ ⎢𝐸2 ⎥ ⎥⎢ ⎥ 𝑛2 𝐸3 ⎦⎣ ⎦
(6.75)
geschrieben werden. Die Diagonalelemente in Gl. (6.75) entsprechen einer Ausbreitung in einem isotropen Medium mit dem Brechungsindex 𝑛, wohingegen die zu 𝐺 proportionalen Nichtdiagonalelemente die optische Aktivität beschreiben. Um zu beweisen, dass die Normalmoden zirkular polarisiert sind, betrachten wir die beiden zirkular polarisierten Wellen mit den elektrischen Feldvektoren E = (𝐸0 , ±i𝐸0 , 0). Die unterschiedlichen Vorzeichen entsprechen rechts- bzw. linkszirkular polarisierten Wellen. Einsetzen in Gl. (6.75) ergibt D = (𝐷0 , ±i𝐷0 , 0) mit 𝐷0 = 𝜀0 (𝑛2 ± 𝐺)𝐸0 . Daraus folgt D = 𝜀0 𝑛±2 E mit 𝑛± =
√
𝑛2 ± 𝐺 .
(6.76)
Folglich ist der Vektor D für jede der beiden zirkular polarisierten Wellen parallel zu dem Vektor E. Gleichung (6.54) ist erfüllt, wenn 𝑘 = 𝑛± 𝑘0 gilt. Also breiten sich die rechts- und linkszirkular polarisierten Wellen mit den Brechungsindizes 𝑛+ bzw. 𝑛− aus, ohne ihren Polarisationszustand zu ändern. Sie sind daher die Normalmoden dieses Mediums. Übung 6-6: Drehvermögen eines optisch aktiven Mediums
Zeigen Sie, dass das Drehvermögen eines optisch aktiven Mediums (Drehung der Polarisationsebene pro Längeneinheit) für 𝐺 ≪ 𝑛 näherungsweise durch 𝜌 ≈ −π𝐺∕𝜆0 𝑛
(6.77)
gegeben ist. Das Drehvermögen hängt stark von der Wellenlänge ab. Da 𝐺 aufgrund von Gl. (6.74) proportional zu 𝑘 ist, ist es umgekehrt proportional zur Wellenlänge 𝜆0 . Also ist das Drehvermögen in Gl. (6.77) umgekehrt proportional zu 𝜆02 . Außerdem ist der Brechungsindex 𝑛 selbst wellenlängenabhängig. Beispielsweise ist das Drehvermögen 𝜌 von Quarz ≈ 31◦ ∕mm bei 𝜆0 = 500 nm und ≈ 22◦ ∕mm bei 𝜆0 = 600 nm; für Silberthiogallat (AgGaS2 ) ist 𝜌 ≈ 700◦ ∕mm bei 490 nm und ≈ 500◦ ∕mm bei 500 nm.
Magnetooptik: Der Faradayeffekt
Viele Materialien drehen in Gegenwart eines statischen Magnetfelds die Polarisationsebene eines hindurchtretenden Lichtstrahls, eine Eigenschaft, die als Faradayeffekt bekannt ist. Der Drehwinkel ist dann proportional zur Dicke des Materials und das Drehvermögen 𝜌 (Drehwinkel pro Längeneinheit) ist proportional zur Komponente der magnetischen Flussdichte 𝐵 in Richtung der Wellenausbreitung, 𝜌 = 𝒱𝐵 ,
(6.78)
wobei 𝒱 die Verdetkonstante ist. Der Drehsinn wird durch die Richtung des Magnetfelds bestimmt: Für 𝒱 > 0 erfolgt die Drehung in der Richtung einer rechtsgängigen Schraube, die in Richtung des Magnetfelds zeigt [Abb. 6.33(a)]. Im Gegensatz zur optischen Aktivität kehrt sich der Drehsinn bei einer Umkehrung der Ausbreitungsrichtung der Welle nicht um. Wenn eine Welle also einen Faradayrotator durchquert und dann reflektiert wird und den Rotator nochmals nochmals in entgegengesetzter Richtung durchläuft, wird ihre Polarisationsebene zweimal gedreht [Abb. 6.33(b)]. Zu den Materialien, die einen Faradayeffekt zeigen, gehören Gläser, Yttriumeisengranat (YIG), Terbiumgalliumgranat (TGG) und Terbiumaluminiumgranat (TbAlG). Die Verdetkonstante von TbAlG beträgt 𝒱 ≈ −1.16 min∕Oe ⋅ cm bei 𝜆0 = 500 nm. Dünne Schichten dieser ferrimagnetischen Materialien werden zur Herstellung kompakter Bauelemente verwendet. Materialgleichungen
In magnetooptischen Materialien wird der elektrische Permittivitätstensor 𝛆 durch die Anwendung eines statischen Magnetfelds H verändert, es gilt also 𝛆 = 𝛆(H). Dieser Effekt beruht auf der Wechselwirkung des statischen Magnetfelds mit der Bewegung der Elektronen im Material als Antwort auf ein optisches elektrisches Feld E. Für den Faradayeffekt lautet die Materialgleichung D = 𝜀E + i𝜀0 G × E
(6.79)
mit G = 𝛾B .
(6.80)
Dabei ist B = 𝜇H die statische magnetische Flussdichte, und 𝛾 ist eine Materialkonstante, das gyromagnetische Verhältnis. Gleichung (6.79) ist identisch mit Gl. (6.74), sodass der Vektor G = 𝛾B in Faradayrotatoren die Rolle des Gyrationsvektors G = 𝜉k in optisch aktiven Medien spielt.
6.5 Optik von Flüssigkristallen
B φ
φ
2φ
(b) Rückwärtswelle
(a) Vorwärtswelle
Beim Faradayeffekt hängt G jedoch nicht von k ab, sodass eine Umkehrung der Ausbreitungsrichtung die Richtung nicht umkehrt, in die die Polarisationsebene gedreht wird. Diese Eigenschaft ist bei der Herstellung optischer Isolatoren hilfreich, wie in Abschnitt 6.6.3 erläutert wird. Mithilfe dieser Analogie und Gl. (6.77) schließen wir, dass für das Drehvermögen des Faradaymediums 𝜌 ≈ −π𝐺∕𝜆0 𝑛 = −π𝛾𝐵∕𝜆0 𝑛 gilt; für die Verdetkonstante (das Drehvermögen pro Einheit der magnetischen Flussdichte) erhalten wir damit 𝒱≈−
Abb. 6.33 (a) Drehung der Polarisationsebene in einem Medium mit einem Faradayeffekt. (b) Der Drehsinn hängt nicht von der Ausbreitungsrichtung der Welle ab.
B
π𝛾 . 𝜆0 𝑛
(6.81)
Die Verdetkonstante ist offensichtlich eine Funktion der Wellenlänge 𝜆0 .
6.5 Optik von Flüssigkristallen 6.5.1 Die Struktur von Flüssigkristallen Ein Flüssigkristall besteht aus einer Ansammlung von gestreckten organischen Molekülen, die typischerweise zigarrenförmig sind. Die Moleküle besitzen keine Lageordnung (wie Flüssigkeiten), aber Orientierungsordnung (wie Kristalle). Es gibt drei Typen (Phasen) von Flüssigkristallen, die in Abb. 6.34 dargestellt sind: • In nematischen Flüssigkristallen sind die Moleküle gleichmäßig orientiert, aber ihre Positionen sind völlig zufällig. • In smektischen Flüssigkristallen sind die Moleküle ebenfalls gleichmäßig orientiert, sie sind nun aber in parallelen Schichten gestapelt, innerhalb derer sie
an zufälligen Positionen liegen; sie besitzen daher nur in einer Dimension eine Lageordnung. • Cholesterische Flüssigkristalle sind eine verdrehte Variante ihrer nematischen Verwandten, in der die Orientierungen der Moleküle schraubenförmig um eine Achse rotieren. Der flüssigkristalline Zustand gehört zu den flüssigen Aggregatzuständen; er liegt in seinen Eigenschaften zwischen typischen Flüssigkeiten und Festkörpern. Die Moleküle sind in der Lage, ihre Orientierung zu verändern, wenn eine Kraft auf sie wirkt. Wenn beispielsweise eine dünne Schicht eines Flüssigkristalls zwischen zwei parallele Glasplatten eingebracht wird, die gegeneinander gerieben werden, dann orientieren sich die Moleküle entlang der Richtung der Reibung. Verdrillte nematische Flüssigkristalle sind nematische Flüssigkristalle, die durch äußere Einwirkung verdrillt sind (ähnlich der Verdrillung, die in cholesterischen Phasen auf natürliche Weise existiert). Das kann zum Beispiel erreicht werden, indem man eine dünne Schicht des nematischen Flüssigkristalls zwischen zwei in zueinander senkrechten Richtungen polierten Glasplatten einschließt, wie in Abb. 6.35 schematisch dargestellt ist. In diesem Abschnitt werden wir die optischen Eigenschaften von verdrillten nematischen Flüssigkristallen diskutieren, die in der Photonik breiten Einsatz finden, z. B. in Flüssigkristallanzeigen. Die elektrooptischen Eigenschaften von verdrillten nematischen Flüssigkristallen und ihre Verwendung als optische Modulatoren und Schalter werden in Kapitel 21 beschrieben.
Abb. 6.34 Molekülanordnungen in verschiedenen Arten von Flüssigkristallen.
Nematisch
Smektisch
Cholesterisch
175
6 Polarisationsoptik
chungsindizes sind 𝑛o und 𝑛e (normalerweise ist 𝑛e > 𝑛o ), und der Koeffizient der Phasenverzögerung (Verzögerung pro Längeneinheit) ist
Polierrichtung
176
𝛽 = (𝑛e − 𝑛o )𝑘0 .
c
erri
Poli
g htun
Abb. 6.35 Anordnungen der Moleküle in verdrillten nematischen Flüssigkristallen.
6.5.2 Optische Eigenschaften von verdrillten nematischen Flüssigkristallen Ein verdrillter nematischer Flüssigkristall ist ein optisch inhomogenes und anisotropes Medium, das sich lokal wie ein einachsiger Kristall mit einer optischen Achse parallel zur Längsrichtung der Moleküle verhält. Die optischen Eigenschaften werden am besten analysiert, indem man sich das Material in dünne Schichten senkrecht zur Verdrillungsachse zerlegt denkt, von denen sich jede wie ein einachsiger Kristall verhält; dabei lässt man die optische Achse allmählich schraubenartig um die Verdrillungsachse rotieren (Abb. 6.36). Anschließend wird die kumulative Wirkung dieser Schichten auf die durchgelassene Welle berechnet. Wir werden zeigen, dass ein verdrillter nematischer Flüssigkristall unter bestimmten Bedingungen die Polarisationsebene drehen kann. Wir betrachten die Lichtausbreitung entlang der Verdrillungsachse (𝑧-Achse) eines verdrillten nematischen Flüssigkristalls und nehmen an, dass sich der Verdrillungswinkel 𝜃 linear mit 𝑧 ändert, 𝜃 = 𝛼𝑧 ,
(6.82)
wobei 𝛼 der Verdrillungskoeffizient ist (Grad pro Längeneinheit). Die optische Achse ist daher parallel zur 𝑥𝑦-Ebene und schließt einen Winkel 𝜃 mit der 𝑥-Richtung ein. Die ordentlichen und außerordentlichen Brex
θ
0
Die Flüssigkristallzelle wird durch den Verdrillungskoeffizienten 𝛼 und den Verzögerungskoeffizienten 𝛽 vollständig charakterisiert. In der Praxis ist 𝛽 ≫ 𝛼, sodass die Phase um viele Perioden verzögert wird, bevor die optische Achse merklich gedreht wird. Wir zeigen unten, dass wenn diese Bedingung erfüllt und die einfallende Welle bei 𝑧 = 0 linear in 𝑥-Richtung polarisiert ist, die Welle ihren linearen Polarisationszustand beibehält, die Polarisationsebene aber synchron mit der Verdrillung der Moleküle gedreht wird, sodass der Drehwinkel 𝜃 = 𝛼𝑧 ist und die Gesamtdrehung in einem Kristall der Länge d gleich dem Verdrillungswinkel 𝛼d ist. Die Flüssigkristallzelle wirkt dann als Polarisationsrotator mit dem Drehvermögen 𝛼. Die Eigenschaft, dass sie die Polarisationsebene drehen können, wird beim Einsatz von verdrillten nematischen Flüssigkristallen in LCD ausgenutzt, wie in Abschnitt 21.3 ausführlich erläutert wird.
Herleitung: Verdrillte nematische Flüssigkristalle als Polarisationsrotatoren Wir wollen nun zeigen, dass ein verdrillter nematischer Flüssigkristall für 𝛽 ≫ 𝛼 als Polarisationsrotator wirkt. Dazu teilen wir teilen die gesamte Dicke d der Zelle in 𝑁 Schichten gleicher Dicke Δ𝑧 = d ∕𝑁. Die 𝑚-te Schicht, die bei 𝑧 = 𝑧𝑚 = 𝑚Δ𝑧 (𝑚 = 1, 2, … , 𝑁) liegt, ist ein Retarder, dessen langsame Achse (die optische Achse) einen Winkel 𝜃𝑚 = 𝑚Δ𝜃 mit der 𝑥-Achse einschließt, wobei Δ𝜃 = 𝛼Δ𝑧 ist. Seine Jonesmatrix ist daher [siehe Gl. (6.24)] T𝑚 = R(−𝜃𝑚 ) TR R(𝜃𝑚 ) ,
z
y
Abb. 6.36 Lichtausbreitung in einem verdrillten nematischen Flüssigkristall. In dieser Darstellung ist der Winkel der Verdrillung 90 ◦ .
(6.84)
wobei ⎡exp(−i𝑛e 𝑘0 𝛿𝑧) TR = ⎢ 0 ⎣
optische Achse
(6.83)
⎤ ⎥ exp(−i𝑛o 𝑘0 𝛿𝑧) ⎦ 0
(6.85)
die Jonesmatrix eines Retarders ist, dessen Achse in 𝑥-Richtung liegt, und R(𝜃) die Rotationsmatrix für die Koordinaten aus Gl. (6.22). Es ist hilfreich, TR durch den Koeffizienten 𝛽 = (𝑛e − 𝑛o )𝑘0 der Phasenverzögerung auszudrücken, ⎡exp (−i𝛽Δ𝑧∕2) TR = exp(−i𝜑𝛿𝑧) ⎢ 0 ⎣
⎤ ⎥, exp (i𝛽Δ𝑧∕2) ⎦ (6.86) 0
6.6 Polarisierende Bauelemente
wobei 𝜑 = (𝑛o + 𝑛e )𝑘0 ∕2 ist. Da die Multiplikation des Jonesvektors mit einem konstanten Phasenfaktor den Polarisationszustand nicht beeinflusst, ignorieren wir den Vorfaktor exp(−i𝜑𝛿𝑧) in Gl. (6.86) einfach. Die gesamte Jonesmatrix des Bauelements ist das Produkt T=
1 ∏ 𝑀 =𝑁
T𝑚 =
1 ∏ 𝑚=𝑁
R(−𝜃𝑚 ) TR R(𝜃𝑚 ) .
6.6 Polarisierende Bauelemente Dieser Abschnitt beschreibt eine Reihe von Bauelementen, die verwendet werden können, um den Polarisationszustand von Licht zu modifizieren. Die grundlegenden Funktionsprinzipien dieser Bauelemente wurden im bisherigen Verlauf des Kapitels entwickelt.
(6.87)
6.6.1 Polarisatoren
Mithilfe von Gl. (6.84) und der Beziehung R(𝜃𝑚 ) R(−𝜃𝑚−1 ) = R(𝜃𝑚 − 𝜃𝑚−1 ) = R(Δ𝜃) erhalten wir 𝑛−1
T = R(−𝜃𝑛 ) [TR R(Δ𝜃)]
TR R(𝜃1 ) .
(6.88)
Durch Einsetzen der Gln. (6.86) und (6.22) ergibt sich ⎡exp (−i𝛽Δ𝑧∕2) ⎤ 0 TR R(Δ𝜃) = ⎢ ⎥ 0 exp (i𝛽Δ𝑧∕2) ⎣ ⎦ ⎡ cos 𝛼Δ𝑧 ⎤ sin 𝛼Δ𝑧 ×⎢ (6.89) ⎥. − sin 𝛼Δ𝑧 cos 𝛼Δ𝑧 ⎣ ⎦ Mithilfe der Gln. (6.88) und (6.89) kann die Jonesmatrix T des Bauelements im Prinzip durch die Parameter 𝛼, 𝛽 und d = 𝑁Δ𝑧 ausgedrückt werden. Für 𝛼 ≪ 𝛽 können wir annehmen, dass die Rotationsmatrix R(Δ𝜃) näherungsweise gleich der Einheitsmatrix ist, woraus T ≈ R(−𝜃𝑛 ) [TR ]𝑁 R(𝜃1 ) 𝑁
⎡exp (−i𝛽Δ𝑧∕2) ⎤ 0 = R(−𝛼𝑁Δ𝑧)⎢ ⎥ 0 exp (i𝛽Δ𝑧∕2) ⎣ ⎦ ⎡exp (−i𝛽𝑁Δ𝑧∕2) ⎤ 0 = R(−𝛼𝑁Δ𝑧) ⎢ ⎥ 0 exp (i𝛽𝑁Δ𝑧∕2) ⎣ ⎦ (6.90)
Polarisation durch selektive Absorption (Dichroismus)
Die Absorption des Lichts durch bestimmte anisotrope Medien, sogenannten dichroitischen Materialien, hängt von der Richtung des einfallenden elektrischen Feldes ab (Abb. 6.37). Diese Materialien enthalten im Allgemeinen anisotrope Molekülstrukturen, deren Antwort von der Richtung des elektrischen Feldes abhängt. Das häufigste dichroitische Material ist das Polaroidfilter, das 1938 erfunden wurde und immer noch in Gebrauch ist. Es wird aus mit Iod gesättigten Polyvinylalkohol-Folien hergestellt, die erhitzt und in einer Richtung gestreckt werden. Das analoge Bauelement im infraroten Spektralbereich ist der Drahtgitterpolarisator, der aus einer ebenen Anordnung eng nebeneinander liegender gestreckter Drähte besteht. Die Komponente des einfallenden elektrischen Feldes in Richtung der Drähte wird absorbiert, wohingegen die Komponente senkrecht zu den Drähten durchgelassen wird. Polarisation durch selektive Reflexion
folgt; also ist ⎡exp (−i𝛽 d ∕2) T = R(−𝛼d ) ⎢ 0 ⎣
Ein linearer Polarisator ist ein Bauelement, das die Komponente des elektrischen Feldes parallel zu seiner Transmissionsachse durchlässt und die dazu orthogonale Komponente blockiert. Die Blockade kann durch selektive Absorption, selektive Reflexion an isotropen Medien oder selektive Reflexion/Brechung in anisotropen Medien erreicht werden.
⎤ ⎥ . (6.91) exp (i𝛽 d ∕2) ⎦ 0
Diese Jonesmatrix entspricht einem Retarder der Verzögerung 𝛽 d mit der langsamen Achse in 𝑥-Richtung gefolgt von einem Polarisationsrotator mit dem Drehwinkel 𝛼d . Wenn die ursprüngliche Welle in 𝑥-Richtung linear polarisiert ist, bewirkt der Retarder eine Phasenverschiebung, und anschließend wird die Polarisationsebene um einen Winkel 𝛼d gleich dem Verdrillungswinkel gedreht. Die Ebene einer linear in 𝑦-Richtung polarisierten Welle wird um denselben Winkel gedreht.
Die Reflexion von Licht an der Grenzfläche zwischen zwei isotropen dielektrischen Materialien hängt wie in Abschnitt 6.2 besprochen von seiner Polarisation ab. Bei Einfall im Brewsterwinkel verschwindet die Reflexion des TM-polarisierten Lichts, sodass es vollständig gebrochen wird (Abb. 6.13). Bei diesem Winkel wird daher nur TE-polarisiertes Licht reflektiert, sodass der Reflektor als Polarisator wirkt, wie in Abb. 6.38 schematisch gezeigt ist.
177
6 Polarisationsoptik
1.0
y
Abb. 6.37 Leistungstransmission eines typischen dichroitischen Polarisators, wenn die Polarisationsebene des Lichts entsprechend maximaler bzw. minimaler Transmission ausgerichtet ist.
Maximum
0.8 x
Transmission
178
0.6 0.4 0.2
Polarisator
Minimum
0.0 400
600 800 1000 Wellenlänge/nm
TE
6.6.2
TM
Abb. 6.38 Brewsterwinkel-Polarisator.
Polarisation durch selektive Brechung (polarisierende Strahlteiler)
Wenn Licht in einen anisotropen Kristall eintritt, werden die ordentlichen und außerordentlichen Wellen in unterschiedlichen Winkeln gebrochen und dadurch räumlich getrennt (siehe Abschnitt 6.3.5 und Abb. 6.31). Das liefert eine effektive und häufig eingesetzte Methode, um aus unpolarisiertem polarisiertes Licht zu machen. Diese Bauelemente bestehen gewöhnlich aus zwei verkitteten Prismen aus anisotropen (einachsigen) Materialien, häufig mit unterschiedlichen Orientierungen, wie die Beispiele in Abb. 6.39 zeigen. Diese Prismen wirken folglich als polarisierende Strahlteiler. OA
OA e
o OA
Wollastonprisma
o
o
OA o
e
e
o e
Retarder
Ein Retarder verändert die Form der Polarisation einer Welle. Es wird durch seine Verzögerung 𝛤 und seine schnellen und langsamen Achsen charakterisiert (siehe Abschnitt 6.1.2). Die Normalmoden sind entlang der Richtungen der Achsen linear polarisierte Wellen. Die Geschwindigkeiten der beiden Wellen unterscheiden sich, sodass der Durchgang durch den Retarder eine relative Phasenverschiebung 𝛤 der Moden bewirkt. Retarder bestehen häufig aus anisotropen Kristallen in Form von Platten. Wie in Abschnitt 6.3.2 erläutert, sind die Normalmoden eines Lichtstrahls, der sich entlang einer Hauptachse (z. B. der 𝑧-Achse) eines Kristalls ausbreitet, linear in Richtung der beiden anderen Hauptachsen (𝑥- und 𝑦-Achsen) polarisierte Wellen. Diese Moden spüren die Hauptbrechungsindizes 𝑛1 und 𝑛2 und bewegen sich daher mit den Geschwindigkeiten 𝑐0 ∕𝑛1 und 𝑐0 ∕𝑛2 . Für 𝑛1 < 𝑛2 ist die 𝑥-Achse die schnelle Achse. Wenn die Platte die Dicke d hat, ist die induzierte Phasenverzögerung 𝛤 = (𝑛2 − 𝑛1 )𝑘0 d = 2π(𝑛2 − 𝑛1 )d ∕𝜆0 . Die Verzögerung ist somit direkt proportional zur Dicke d der Platte und umgekehrt proportional zur Wellenlänge 𝜆0 (allerdings ist 𝑛2 − 𝑛1 selbst wellenlängenabhängig). Die Brechungsindizes einer dünnen Platte Glimmerschiefer bei 𝜆0 = 633 nm sind z. B. 1.599 und 1.594, so-
θB
TE
1200
e
e
o Kitt
OA
OA Rochonprisma
Glan-Thomson-Prisma
Abb. 6.39 Polarisierende Strahlteiler. Die Richtungen und Polarisationen der austretenden Wellen relativ zur optischen Achse (OA) sind für die drei Prismen verschieden. Hier sind negativ einachsige Kristalle gezeigt (z. B. Kalkspat). Das Glan-ThompsonPrisma bietet den Vorteil eines großen Winkelabstands zwischen den austretenden Wellen.
6.6 Polarisierende Bauelemente
dass 𝛤∕d ≈ 15.8π rad∕mm ist. Eine Platte mit einer Dicke von 63.3 μm ergibt somit 𝛤 ≈ π und wirkt als Halbwellenretarder.
nen zur Herstellung schmalbandiger Transmissionsfilter verwendet werden.
6.6.3 Polarisationsrotatoren Steuerung der Lichtintensität durch einen Retarder und zwei Polarisatoren
Ein Polarisationsrotator dreht die Polarisationsebene von linear polarisiertem Licht um einen festen Winkel, wobei er seine lineare Polarisation erhält. Optisch aktive Medien sowie Materialien mit einem Faradayeffekt wirken als Polarisationsrotatoren, wie in Abschnitt 6.4 besprochen. Auch verdrillte nematische Flüssigkristalle wirken unter bestimmten Bedingungen als Polarisationsrotatoren, wie in Abschnitt 6.5 gezeigt wurde. Wenn ein Polarisationsrotator zwischen zwei Polarisatoren gestellt, hängt die Menge des transmittierten Lichts vom Drehwinkel ab. Die Intensität des Lichts kann daher gesteuert (moduliert) werden, indem der Drehwinkel von außen (z. B. durch Änderung der an einen Faradayrotator angelegten magnetischen Flussdichte oder der molekularen Orientierung eines Flüssigkristalls mithilfe eines elektrischen Feldes) verändert wird. Die elektrooptische Modulation von Licht wird ebenso wie Flüssigkristallanzeigen in Kapitel 21 besprochen.
Wir betrachten einen Retarder der Verzögerung 𝛤 zwischen zwei gekreuzten Polarisatoren, deren Achsen in Winkeln von 45◦ zu den Achsen des Retarders stehen, wie Abb. 6.40 illustriert. Die Leistungstransmission (oder Intensitätstransmission) dieses Systems ist (6.92)
wie man mithilfe der Jonesmatrizen zeigen kann (oder indem man die Polarisationsellipse des verzögerten Lichts als Funktion von 𝛤 untersucht und dann die Komponente bestimmt, die in Richtung auf den Ausgangspolarisator zeigt, wie Abb. 6.40 illustriert). Für 𝛤 = 0 dringt kein Licht durch das System, da die Polarisatoren orthogonal sind. Für 𝛤 = π wird andererseits das ganze Licht durchgelassen, da der Retarder dann die Polarisationsebene um 90◦ dreht, sodass sie die Transmissionsachse des zweiten Polarisators trifft. Die Intensität des durchgelassenen Lichts kann so leicht gesteuert werden, indem man die Verzögerung 𝛤 verändert. Das kann zum Beispiel erreicht werden, indem man die Indizes 𝑛1 und 𝑛2 durch Anlegen eines äußeren elektrisches Feldes an den Retarder gezielt verändert. Dieses Grundprinzip liegt der Funktionsweise von elektrooptischen Modulatoren zugrunde, wie in Kapitel 21 ausführlicher besprochen wird. Da 𝛤 von d abhängt, können durch Untersuchung des durchgelassenen Lichts geringe Veränderungen in der Dicke einer Probe nachgewiesen werden. Da 𝛤 außerdem auch wellenlängenabhängig ist, hängt die Transmission des Systems empfindlich von der Frequenz ab. Das System kann daher auch als Filter verwendet werden, wenngleich seine Selektivität nicht groß ist. Andere Anordnungen aus Retardern und Polarisatoren kön-
6.6.4 Nichtreziproke polarisierende Bauelemente Ein Bauelement, dessen Wirkung auf den Polarisationszustand invariant gegenüber einer Umkehrung der Ausbreitungsrichtung des Lichts ist, bezeichnet man als reziprok. Wenn eine Welle ein solches Bauelement in einer Richtung durchläuft und die austretende Welle in der entgegengesetzten Richtung nochmals hindurch geschickt wird, werden die Änderungen ihres Polarisationszustands rückgängig gemacht und sie erreicht den Eingang wieder in ihrem anfänglichem Polarisationszustand. Bauelemente, die diese Richtungsinvarianz nicht besitzen, heißen nichtreziprok. Alle in diesem Kapitel beschriebenen polarisierenden Bauelemente mit Ausnahme des Faradayrotators sind reziprok (siehe Abschnitt 6.4.2). Durch Kombination eines Faradayrotators y
y S
45°
x
Γ= 0
π 4 π 2 3π 4 π x
T ransmission
2
𝒯 = sin (𝛤∕2) ,
1
0 0 Polarisator L Retarder
Polarisator
Polarizationsellipsen
π
2π 3π 4π Verzögerung Γ
Abb. 6.40 Steuerung der Lichtintensität durch einen Retarder mit variabler Verzögerung 𝛤 zwischen zwei gekreuzten Polarisatoren.
179
180
6 Polarisationsoptik 45° 45° durchgelassene Welle
45°
B
45° 45°
x
einfallende Welle
y
x
Faradayrotator
Polarisator B 45°
Polarisator A
y (a)
45°
B
Polarisator B 45°
Polarisator A
Faradayrotator (b)
Abb. 6.41 Ein optischer Isolator auf der Grundlage eines Faradayrotators lässt Licht nur in einer Richtung durch. (a) Eine Welle in Vorwärtsrichtung wird durchgelassen. (b) Eine Welle in Rückwärtsrichtung wird blockiert.
mit anderen (reziproken) polarisierenden Bauelementen können nützliche nichtreziproke Bauelemente erhalten werden. Optische Isolatoren
Ein optischer Isolator ist ein Bauelement, das Licht nur in einer Richtung durchlässt, also als eine Art „Einwegeventil“ wirkt. Optische Isolatoren sind nützlich, um reflektiertes Licht davon abzuhalten, zur Quelle zurückzukehren, was in manchen Bauelementen wie z. B. Laserdioden höchst unerwünschte Auswirkungen auf die Funktion haben könnte. Ein optischer Isolator besteht aus einem Faradayrotator zwischen zwei Polarisatoren, deren Achsen einen Winkel von 45◦ zueinander einnehmen. Die an den Rotator angelegte magnetische Flussdichte wird so geregelt, dass er die Polarisationsebene um 45◦ im Sinn einer rechtsgängigen Schraube dreht, die in 𝑧-Richtung zeigt [Abb. 6.41(a)]. Licht, das sich vorwärts (von links nach rechts) durch das System ausbreitet, durchquert Polarisator A, wird um 45◦ gedreht und darauf durch den Polarisator B durchgelassen. Linear polarisiertes Licht mit der Polarisationsebene bei 45◦ , das rückwärts durch das System laufen will [von rechts nach links in Abb. 6.41(b)], durchquert Polarisator B noch erfolgreich. Beim Durchtritt durch den Faradayrotator wird seine Polarisationsebene jedoch um zusätzliche 45◦ gedreht, und es kann daher den Polarisator A nicht durchqueren. Da das rückwärtsgerichtete Licht z. B. durch die Reflexion der Vorwärtswelle an Oberflächen erzeugt werden könnte, schützt der Isolator seine Quelle vor dem reflektierten Licht. Der Faradayrotator ist eine notwendige Komponente des optischen Isolators. Er kann nicht durch optisch aktive Substanzen oder Flüssigkristalle ersetzt werden. In diesen reziproken Komponenten würde die Polari-
sationsebene der reflektierten Welle wieder zurückgedreht, sodass das Licht durch die Polarisatoren zurück zur Quelle gelassen würde. Isolatoren auf der Grundlage von Faradayrotatoren aus Yttriumeisengranat (YIG) oder Terbiumgalliumgranat (TGG) ermöglichen Dämpfungen der rückwärts gerichteten Welle von bis zu 90 dB über einen relativ großen Bereich von Wellenlängen. Dünne Schichten dieser Materialien in permanenten Magnetfeldern werden verwendet, um sehr kompakte optische Isolatoren zu bauen. Nichtreziproke Drehung der Polarisationsebene
Ein anderes nützliches nichtreziprokes Bauelement ist eine Kombination eines 45◦ -Faradayrotators gefolgt von einem Halbwellenretarder. Wie Abb. 6.42(a) zeigt, bleibt der Polarisationszustand einer in einem Winkel von 22.5◦ zur schnellen Achse des Retarders linear polarisierten Vorwärtswelle während des Durchgangs durch das Bauelement erhalten (da sie durch den Faradayrotator eine Drehung um 45◦ erfährt, gefolgt einer Drehung um −45◦ durch den Retarder). Die Polarisationsebene einer Welle, die in umgekehrter Richtung durch das Bauelement reist, wird dagegen um 45◦ + 45◦ = 90◦ gedreht, wie in Abb. 6.42(b) leicht zu sehen ist. Das Bauelement kann daher in Kombination mit einem polarisierenden Strahlteiler verwendet werden, um die rückwärts gerichtete Welle weg von der Quelle der Vorwärtswelle zu leiten und sie unabhängig zu verwerten. Das System kann nützlich sein, um nichtreziproke Verbindungen wie z. B. optische Zirkulatoren aufzubauen [siehe Abb. 24.14(b)].
Aufgaben
22.5° 22.5°
45°
B
45°
B Retarder π
45°
Faradayrotator
45°
(a)
(b)
Faradayrotator
Aufgaben Aufgabe 6-1: Orthogonale Polarisationen
Zeigen Sie, dass die Hauptachsen der Ellipsen zweier orthogonaler elliptisch polarisierter Zustände senkrecht aufeinander stehen und ihre Drehsinne entgegengesetzt sind. Aufgabe 6-2: Drehung eines Polarisationsrotators
Zeigen Sie, dass die Jonesmatrix eines Polarisationsrotators invariant unter einer Rotation des Koordinatensystems ist. Aufgabe 6-3: Jonesmatrix eines Polarisators
Zeigen Sie, dass die Jonesmatrix eines linearen Polarisators, dessen Transmissionsachse einen Winkel 𝜃 mit der 𝑥-.Achse einschließt, durch ⎡ cos2 𝜃 T=⎢ sin 𝜃 cos 𝜃 ⎣
Retarder π
Abb. 6.42 Ein nichtreziprokes Bauelement, das (a) den Polarisationszustand einer linear polarisierten Vorwärtswelle unverändert lässt, aber (b) die Polarisationsebene der rückwärts gerichteten Welle um 90◦ dreht.
sin 𝜃 cos 𝜃⎤ ⎥ 2 sin 𝜃 ⎦
gegeben ist. Leiten Sie dieses Ergebnis mithilfe der Gln. (6.18), (6.22) und (6.24) her. Aufgabe 6-4: Halbwellenretarder
Betrachten Sie linear polarisiertes Licht, das einen Halbwellenretarder durchläuft. Zeigen Sie, dass das durchgelassene Licht in einem Winkel −𝜃 zur schnellen Achse des Retarders linear polarisiert ist, wenn das einfallende Licht in einem Winkel 𝜃 polarisiert war, d. h. dass seine Polarisationsebene um einen Winkel 2𝜃 gedreht ist. Warum ist der Halbwellenretarder nicht äquivalent zu einem Polarisationsrotator? Aufgabe 6-5: Retarder im Tandem
Geben Sie die Jonesmatrizen der folgenden Systeme an: (a) Ein π∕2-Retarder mit der schnellen Achse in 𝑥-Richtung; (b) ein π-Retarder mit der schnellen Achse in einem Winkel von 45◦ zur 𝑥-Richtung; (c) ein π∕2Retarder mit der schnellen Achse in 𝑦-Richtung. Zei-
gen Sie, dass wenn diese drei Retarder in der Reihenfolge (c) hinter (b) hinter (a) hintereinander gestellt werden, das resultierende Bauelement die Polarisationsebene um 90◦ dreht. Was geschieht, wenn die Reihenfolge der drei Retarder umgekehrt wird? Aufgabe 6-6: Reflexion von zirkular polarisiertem Licht
Zeigen Sie, dass zirkular polarisiertes Licht bei Reflexion an einem Spiegel seine Polarisationsrichtung ändert (rechts wird links bzw. umgekehrt). Aufgabe 6-7: Blendschutzschirm
Ein selbstleuchtender Gegenstand wird durch ein Glasfenster betrachtet. Ein Blendschutzschirm dient dazu, Reflexionen von der Oberfläche des Fensters zu beseitigen. Zeigen Sie, dass ein solcher Schirm aus einer Kombination eines linearen Polarisators und eines Viertelwellenretarders hergestellt werden kann, dessen Achsen in einem Winkel von 45◦ zur Transmissionsachse des Polarisators stehen. Kann der Schirm als ein optischer Isolator betrachtet werden? Aufgabe 6-8: Herleitung der Fresnelgleichungen
Leiten Sie die Reflexionsgleichung (6.32) her, die verwendet wird, um die Fresnelgleichung (6.34) für die TEPolarisation herzuleiten. Wie würden Sie vorgehen, um den Reflexionskoeffizienten zu bestimmen, wenn das einfallende Licht die Form eines Strahlbündels anstelle einer ebenen Welle hätte? Aufgabe 6-9: Reflexionsgrad von Glas
Eine ebene Welle fällt aus Luft (𝑛 = 1) in einem Winkel von 45◦ auf eine Glasplatte (𝑛 = 1.5). Bestimmen Sie die Leistungsreflexion der TE- und TM-Wellen. Wie ist der mittlere Reflexionsgrad für unpolarisiertes Licht (Licht, das aus TE- und TM-Wellen gleicher Intensität besteht)? Aufgabe 6-10: Brechung am Brewsterwinkel
Verwenden Sie die Bedingung 𝑛1 sec 𝜃1 = 𝑛2 sec 𝜃2 und das snelliussche Gesetz 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 , um
181
182
6 Polarisationsoptik
Gl. (6.38) für den Brewsterwinkel herzuleiten. Zeigen Sie, dass am Brewsterwinkel 𝜃1 + 𝜃2 = 90◦ gilt, dass die reflektierten und gebrochenen Wellen also senkrecht aufeinander stehen und folglich das elektrische Feld der gebrochenen TM-Welle parallel zur Richtung der reflektierten Welle ist. Die Reflexion des Lichts kann als ein Streuprozess betrachtet werden, in dem die gebrochene Welle als Strahlungsquelle wirkt, die die reflektierte Welle hervorbringt. Am Brewsterwinkel oszilliert diese Quelle in einer Richtung parallel zur Ausbreitungsrichtung der reflektierten Welle, sodass keine Strahlung entstehen kann und somit kein TM-Licht reflektiert wird. Aufgabe 6-11: Phasenverzögerung und Totalreflexion
Bestimmen Sie die Phasenverzögerung zwischen den TE- und TM-Wellen, die durch Totalreflexion an der Grenzfläche zwischen Glas (𝑛 = 1.5) und Luft (𝑛 = 1) unter einem Einfallswinkel 𝜃 = 1.2𝜃k verursacht wird, wobei 𝜃k der kritische Winkel ist. Aufgabe 6-12: Goos-Hänchen-Verschiebung
Wir betrachten zwei ebene TE-Wellen, die Totalreflexion bei den Winkeln 𝜃 und 𝜃 + d𝜃 erfahren. Geben Sie einen Ausdruck für den Koeffizienten 𝜉 an, wenn die zwischen den reflektierten Wellen eingeführte Phasenverzögerung in der Form d𝜑 = 𝜉 d𝜃 geschrieben wird. Skizzieren Sie die Interferenzmuster der beiden einfallenden und der beiden reflektierten Wellen und verifizieren Sie, dass sie um eine zu 𝜉 proportionale Entfernung seitlich verschoben sind. Wenn die einfallende Welle ein Strahlbündel (aus vielen Komponenten in Form von ebenen Wellen zusammengesetzt) ist, wird das reflektierte Strahlbündel um eine zu 𝜉 proportionale Entfernung seitlich versetzt. Dieses Phänomen ist als Goos-Hänchen-Effekt bekannt. Aufgabe 6-13: Reflexion an einem absorbierenden Medium
Verwenden Sie die maxwellschen Gleichungen und passende Randbedingungen, um zu zeigen, dass die komplexe Amplitudenreflexion an der Grenzfläche zwischen dem Vakuum und einem Medium mit dem Brechungsindex 𝑛 und dem Absorptionskoeffizienten 𝛼 bei senkrechtem Einfall gleich r = [(𝑛 − i𝛼𝑐∕2𝜔) − 1]∕[(𝑛 − i𝛼𝑐∕2𝜔) + 1] ist. Aufgabe 6-14: Maximale Phasenverzögerung in Quarz
Quarz ist ein positiv einachsiger Kristall mit 𝑛e = 1.553 und 𝑛o = 1.544. (a) Bestimmen Sie die Phasenverzögerung pro mm bei 𝜆0 = 633 nm, wenn der Kristall so orientiert wird, dass die Phasenverzögerung maximiert
wird. (b) Bei welchen Dicken wirkt der Kristall als Viertelwellenretarder? Aufgabe 6-15: Maximaler außerordentlicher Effekt
Bestimmen Sie die Ausbreitungsrichtung in Quarz (𝑛e = 1.553 und 𝑛o = 1.544), für die der Winkel zwischen dem Wellenvektor k und dem Poyntingvektor S (der auch die Ausbreitungsrichtung des Strahls angibt) maximal ist. Aufgabe 6-16: Doppelbrechung
Eine unpolarisierte ebene Welle fällt aus dem Vakuum in einem Winkel von 30◦ auf einen Quarzkristall (𝑛e = 1.553 und 𝑛o = 1.544). Die optische Achse liegt in der Einfallsebene und steht senkrecht auf der Richtung der einfallenden Welle, bevor diese in den Kristall eintritt. Bestimmen Sie die Richtungen der Wellenvektoren und der Strahlen der beiden gebrochenen Komponenten. Aufgabe 6-17: Seitliche Verschiebung bei Doppelbrechung
Welches ist die optimale geometrische Anordnung, um die seitliche Verschiebung zwischen den gebrochenen ordentlichen und außerordentlichen Strahlen in einem positiv einachsigen Kristall zu maximieren? Geben Sie alle relevanten Winkel und Richtungen an. Aufgabe 6-18: Transmission durch eine LiNbO3 -Platte
Untersuchen Sie die Transmission eines unpolarisierten He-Ne-Laserstrahls (𝜆0 = 633 nm), der senkrecht auf eine LiNbO3 -Platte (𝑛e = 2.29, 𝑛o = 2.20) mit einer Dicke von 1 cm fällt, die so geschnitten ist, dass ihre optische Achse einen Winkel von 45◦ mit der Senkrechten zur Platte einschließt. Bestimmen Sie die seitliche Verschiebung am Ausgang der Platte und die Phasenverzögerung zwischen den ordentlichen und außerordentlichen Strahlen. Aufgabe 6-19: Konische Brechung
Wenn der Wellenvektor k entlang einer optischen Achse eines zweiachsigen Kristalls liegt, entsteht eine ungewöhnliche Situation. Die zwei Schichten der k-Fläche berühren sich, und die Oberfläche kann durch eine konische Oberfläche angenähert werden. Betrachten Sie einen senkrecht auf die Oberfläche eines zweiachsigen Kristalls einfallenden Strahl, der auch eine senkrecht zur Oberfläche stehende optische Achse besitzt. Zeigen Sie, dass in dieser Situation Mehrfachbrechung eintritt, wobei die gebrochenen Strahlen einen Kegel bilden. Dieser Effekt ist als konische Brechung bekannt. Was geschieht, wenn die konischen Strahlen an der parallelen Oberfläche des Kristalls in Luft gebrochen werden?
Aufgaben
Aufgabe 6-20: Zirkulardichroismus
Bestimmte Materialien besitzen unterschiedliche Absorptionskoeffizienten für rechts- und linkszirkular polarisiertes Licht, eine Eigenschaft, die als Zirkulardichroismus bezeichnet wird. Bestimmen Sie die Jonesmatrix eines Bauelements, das Licht mit beliebigem Polarisationszustand in rechtszirkular polarisiertes Licht umwandelt. Aufgabe 6-21: Drehung der Polarisationsebene durch eine Folge von linearen Polarisatoren
Eine in 𝑥-Richtung linear polarisierte Welle wird durch eine Folge von 𝑁 linearen Polarisatoren geschickt, deren Transmissionsachsen in Winkeln von 𝑚𝜃 (𝑚 = 1, 2, … , 𝑁; 𝜃 = π∕2𝑁) zur 𝑥-Achse geneigt sind. Zeigen Sie, dass das durchgelassene Licht in 𝑦-Richtung linear polarisiert ist, dass seine Amplitude aber um den Faktor cos𝑁 𝜃 reduziert ist. Was geschieht im Grenzfall 𝑁 → ∞? Hinweis: Verwenden Sie Jonesmatrizen und die Beziehung R[(𝑀 + 1)𝜃] R(−𝑚𝜃) = R(𝜃) , wobei R(𝜃) die Matrix der Koordinatentransformation ist.
Weiterführende Literatur Polarisation
Siehe auch die Literatur zu den Kapiteln 1 und 5. A. Kumar, A. Ghatak, Polarization of Light with Applications in Optical Fibers, SPIE Optical Engineering Press 2011. D. H. Goldstein, Polarized Light, Marcel Dekker, 3. Aufl. 2010. L. Nikolova, P. S. Ramanujam, Polarization Holography, Cambridge University Press 2009. R. Martínez-Herrero, P. M. Mejias, G. Piquero, Characterization of Partially Polarized Light Fields, Springer 2009. E. Collett, Field Guide to Polarization, SPIE Optical Engineering Press 2005. J. N. Damask, Polarization Optics in Telecommunications, Springer 2004. S. Sugano, N. Kojima (Hrsg.), Magneto-Optics, Springer 2000. C. Brosseau, Fundamentals of Polarized Light: A Statistical Optics Approach, Wiley 1998. S. Huard, Polarization of Light, Wiley 1996. E. Collett, Polarized Light: Fundamentals and Applications, CRC Press 1993.
A. Yariv, P. Yeh, Optical Waves in Crystals: Propagation and Control of Laser Radiation, Wiley 1985; Paperback 2002. R. M. A. Azzam, N. M. Bashara, Ellipsometry and Polarized Light, North-Holland 1977, Nachdruck 1989. B. A. Robson, The Theory of Polarization Phenomena, Clarendon Press 1974. L. Velluz, M. Le Grand, M. Grosjean, Optical Circular Dichroism: Principles, Measurements, and Applications, Academic Press 1965. W. A. Shurcliff, S. S. Ballard, Polarized Light, Van Nostrand 1964. W. A. Shurcliff, Polarized Light: Production and Use, Harvard University Press 1962, Nachdruck 1966. Kristalle und Tensoranalysis
C. Malgrange, C. Ricolleau, M. Schlenker, Symmetry and Physical Properties of Crystals, Springer 2014. D. Fleisch, A Student’s Guide to Vectors and Tensors, Cambridge University Press 2011. S. Haussühl, Physical Properties of Crystals, Wiley-VCH 2007. R. J. D. Tilley, Crystals and Crystal Structures, Wiley 2006. E. A. Wood, Crystals and Light: An Introduction to Optical Crystallography, Dover, 2. Aufl. 1977. J. F. Nye, Physical Properties of Crystals: Their Representation by Tensors and Matrices, Oxford University Press 1985. Flüssigkristalle
Siehe auch die Literatur zu LCD-Bauelementen und -Anzeigen in Kapitel 21 J. V. Selinger, Introduction to the Theory of Soft Matter: From Ideal Gases to Liquid Crystals, Springer 2016. I.-C. Khoo, Liquid Crystals, Wiley, 2. Aufl. 2007. T. Scharf, Polarized Light in Liquid Crystals and Polymers, Wiley 2006. P. Oswald, P. Pieranski, Nematic and Cholesteric Liquid Crystals: Concepts and Physical Properties Illustrated by Experiments, CRC Press/Taylor & Francis 2005. P. J. Collings, Liquid Crystals: Nature’s Delicate Phase of Matter, Princeton University Press, 2. Aufl. 2002. M. E. Lines, A. M. Glass, Principles and Applications of Ferroelectrics and Related Materials, Clarendon Press 1977; Oxford University Press, Paperback 2. Aufl. 2001. P. G. de Gennes, The Physics of Liquid Crystals, Oxford University Press, 2. Aufl. 1993. S. Chandrasekhar, Liquid Crystals, Cambridge University Press, 2. Aufl. 1992. L. M. Blinov, Electro-Optical and Magneto-Optical Properties of Liquid Crystals, Wiley 1983.
183
184
6 Polarisationsoptik
Artikel in Büchern und Zeitschriften
L. A. Whitehead, M. A. Mossman, Reflections on Total Internal Reflection, Optics & Photonics News 20(2), 28–34, 2009. M. Mansuripur, ‚The Faraday Effect‘, Optics & Photonics News 10(11), 32–36, 1999. B. H. Billings (Hrsg.), Selected Papers on Applications of Polarized Light, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 57). S. D. Jacobs (Hrsg.), Selected Papers on Liquid Crystals for Optics, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 46).
B. H. Billings (Hrsg.), Selected Papers on Polarization, SPIE Optical Engineering Press 1990 (Milestone Series Bd. 23). A. Lakhtakia (Hrsg.), Selected Papers on Natural Optical Activity, SPIE Optical Engineering Press 1990 (Milestone Series Bd. 15). W. Swindell (Hrsg.), Benchmark Papers in Optics: Polarized Light, Dowden, Hutchinson & Ross 1975. V. M. Agranovich, V. L. Ginzburg, ‚Crystal Optics with Spatial Dispersion‘: In E. Wolf (Hrsg.), Progress in Optics Bd. 9, North-Holland 1971. ‚Sir David Brewster’s Scientific Work‘, Nature 25, 157–159, 15. Dezember 1881.
185
7 Optik photonischer Kristalle Das zentrale Thema der Optik ist die Ausbreitung von Licht in homogenen Medien und seine Reflexion und Brechung an Grenzflächen zwischen unterschiedlichen Medien, wie in den früheren Kapiteln dieses Buches beschrieben. Photonische Bauelemente bestehen häufig aus zahlreichen Schichten unterschiedlicher Materialien, die so angeordnet sind, dass zum Beispiel Reflexionen unterdrückt oder verstärkt oder die Spektral- oder Polarisationseigenschaften des Lichts verändert werden. Medien aus zahlreichen dünnen Schichten spielen auch in natürlichen physikalischen und biologischen Systemen eine Rolle; sie sind für die charakteristischen Farben mancher Insekten und von Schmetterlingsflügeln verantwortlich. Schichtmedien können auch periodisch sein, d. h. aus identischen dielektrischen Strukturen bestehen, die sich in einer zwei- oder dreidimensionalen periodischen Anordnung wiederholen, wie Abb. 7.1 illustriert. Eindimensionale periodische Strukturen sind z. B. Stapel von identischen parallelen ebenen Mehrschicht-Segmenten. Diese werden häufig als Gitter verwendet, um optische Wellen zu reflektieren, die unter bestimmten Winkeln einfallen, oder als Filter, die selektiv Wellen bestimmter Frequenzen reflektieren. Zweidimensionale periodische Strukturen sind beispielsweise Anordnungen von parallelen Stäben oder von parallelen zylindrischen Löchern, die zum Beispiel dazu verwendet werden, um die Eigenschaften von Glasfasern, den sogenannten „mikrostrukturierten“ Fasern oder Hohlkernfasern, zu modifizieren (siehe Abschnitt 10.4).
Dreidimensionale periodische Strukturen sind z. B. Anordnungen von Würfeln, Kugeln, oder Löchern verschiedener Formen, die in Gitterstrukturen ganz ähnlich denen von natürlichen Kristallen organisiert sind. Die sogenannten „photonischen Kristalle“ sind eine besondere Klasse von optischen Metamaterialien, die wir in Kapitel 8 im Detail besprechen werden. Optische Wellen sind von Natur aus periodisch und wechselwirken daher mit periodischen Medien auf eine ganz besondere Weise, wenn deren Periode in derselben Größenordnung wie die Wellenlänge der Strahlung liegt. Zum Beispiel entstehen so spektrale Bänder, in denen sich Lichtwellen nicht ohne starke Dämpfung ausbreiten können; sie werden als photonische Bandlücken bezeichnet. Wellen mit Frequenzen innerhalb dieser verbotenen Bänder verhalten sich gewissermaßen analog zur inneren Totalreflexion, allerdings für alle Richtungen. Die Auslöschung der transmittierten Welle ist ein Resultat der destruktiven Interferenz zwischen den an Elementen der periodischen Struktur in Vorwärtsrichtung gestreuten Wellen. Bemerkenswerterweise tritt dieser Effekt über spektrale Bänder mit endlicher Breite auf, nicht nur für einzelne Frequenzen. Dieses Phänomen ist ganz analog zu den elektronischen Eigenschaften von kristallinen Festkörpern wie z. B. Halbleitern. Die zu einem Elektron gehörende periodische Welle breitet sich in einem periodischen Kristallgitter aus; daher treten regelmäßig Bandlücken auf. Wegen dieser Analogie werden die photonischen peri-
Abb. 7.1 Periodische photonische Strukturen in eindimensionalen (1D), zweidimensionalen (2D) und dreidimensionalen (3D) Anordnungen.
1D
2D
3D
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
186
7 Optik photonischer Kristalle
odischen Strukturen häufig photonische Kristalle genannt. Photonische Kristalle haben zahlreiche Anwendungen, beispielsweise als Wellenleiter, optische Fasern, Resonatoren, Laser, Filter, Router, Koppler – und viele weitere sind angedacht. Um die optischen Eigenschaften inhomogener Medien wie Schicht- und periodischer Medien zu beschreiben, ist in der Regel eine Analyse im Rahmen der elektromagnetischen Optik erforderlich. Für inhomogene dielektrische Medien ändert sich die Permittivität 𝜀(r) mit dem Ort, wie wir aus Abschnitt 5.2.3 wissen, und die Wellengleichung nimmt die allgemeine Form der Gln. (5.31) und (5.32) an. Für eine harmonische Welle der Kreisfrequenz 𝜔 führt das zu verallgemeinerten Helmholtzgleichungen für die elektrischen und magnetischen Felder, η(r)∇ × (∇ × E) =
𝜔2 E, 𝑐02
(7.1)
∇ × [η(r)∇ × H] =
𝜔2 H, 𝑐02
(7.2)
wobei η(r) = 𝜀0 ∕𝜀(r) die elektrische Impermeabilität ist (siehe Abschnitt 6.3.1). Eine dieser Gleichungen kann entweder für das elektrische oder für das magnetische Feld gelöst werden, und das andere Feld kann mithilfe der maxwellschen Gleichungen direkt bestimmt werden. Die Gln. (7.1) und (7.2) haben die Form eines Eigenwertproblems: Ein auf die Feldfunktion angewandter Differentialoperator ist gleich einer Konstante multipliziert mit der Feldfunktion. Die Eigenwerte sind 𝜔2 ∕𝑐02 , und die Eigenfunktionen sind die räumlichen Verteilungen der Moden des sich ausbreitenden Feldes (siehe Anhang C). Aus Gründen, die wir in den Abschnitten 7.2.3 und 7.3 erklären werden, arbeiten wir mit der magnetischen Feldgleichung (7.2) anstatt mit der Gleichung (7.1) des elektrischen Feldes. Für Schichtmedien ist 𝜀(r) stückweise konstant, d. h. die Permittivität ist innerhalb jeder gegebenen Schicht konstant, ändert sich aber von einer Schicht zur nächsten. Die Wellenausbreitung kann dann untersucht werden, indem man die bekannten Eigenschaften von optischen Wellen in homogenen Medien zusammen mit den passenden Randbedingungen für Reflexion und Transmission anwendet. Periodische dielektrische Medien sind durch periodische Werte von 𝜀(r) und η(r) charakterisiert. Diese Periodizität erlegt der optischen Welle bestimmte Bedingungen auf. Zum Beispiel ist die Ausbreitungskonstante nicht mehr wie in einem homogenen Medium einfach proportional zur Kreisfrequenz 𝜔. Während die Moden in einem homogenen Medium ebene Wellen der Form
exp(−ik ⋅ r) sind, sind die Moden eines periodischen Mediums, die sogenannten Blochmoden, sich ausbreitende Wellen, die mit stehenden Wellen moduliert sind.
In diesem Kapitel . . . Die bisherigen Kapitel dieses Buches haben sich auf die Optik von dünnen optischen Komponenten in einigem Abstand voneinander konzentriert, wie dünnen Linsen, ebenen Gittern und bildtragenden Filme, durch die sich das Licht ausbreitet. Dieses Kapitel beschäftigt sich mit der Optik von Medien, die aus vielen dielektrischen Schichten oder periodischen ein-, zwei- oder dreidimensionalen photonischen Strukturen bestehen. Abschnitt 7.1 befasst sich mit eindimensionalen Schichtmedien; er dient zur Einstimmung auf die periodischen Medien und photonischen Kristalle. Ein Matrixansatz ermöglicht eine systematische Behandlung der vielfachen Reflexionen an den zahlreichen Grenzflächen des Mediums. Abschnitt 7.2 führt photonische Kristalle in ihrer einfachsten Form ein: eindimensionale periodische Strukturen. Auch hier werden Matrizenmethoden verwendet, um die Dispersionsrelation und die Bandstruktur zu bestimmen. Ein alternativer Ansatz auf der Grundlage einer Fourierdarstellung der periodischen Funktionen des Mediums und der Welle wird ebenfalls vorgestellt. Diese Ergebnisse werden in Abschnitt 7.3 auf zwei- und dreidimensionale photonische Kristalle verallgemeinert. Die verschiedenen Medien werden in diesem Kapitel stets als isotrop angenommen; sie können daher durch eine skalare Permittivität 𝜀 beschrieben werden, obwohl Reflexion und Brechung an Grenzflächen grundsätzlich von der Polarisation abhängen. Photonische Kristalle in anderen Kapiteln
Aufgrund ihrer besonderen Reflexionseigenschaften können photonische Kristalle als „ideale“ dielektrische Spiegel verwendet werden. Eine Platte eines homogenen Materials, das in einen photonischen Kristall eingebettet ist, kann Licht durch vielfache Reflexionen an den Grenzflächen führen. Entsprechende Anwendungen auf optische Wellenleiter werden in Abschnitt 9.5 beschrieben. Ähnlich kann Licht durch eine Glasfaser mit einem homogenen Kern geführt werden, der in einen Mantel aus demselben Material mit zylindrischen Löchern parallel zur Faserachse eingebettet ist. Solche „mikrostrukturierten Fasern“, die in Abschnitt 10.4 ausführlich beschrieben werden, haben eine Reihe von vorteilhaften Eigenschaften, die gewöhnliche Glasfasern nicht haben. Ein
7.1 Optik von dielektrischen Schichtmedien
in einen photonischen Kristall eingebetteter Hohlraum kann als optischer Resonator wirken, da er für Frequenzen im Bereich der photonischen Bandlücke ideal reflektierende Begrenzungsflächen besitzt. Mikroresonatoren und Laser aus photonischen Kristallen werden in den Abschnitten 11.4.4 und 18.5.3 kurz beschrieben.
7.1 Optik von dielektrischen Schichtmedien
Die Summen dieser Wellen ergeben an jedem Punkt eine einzelne kombinierte Vorwärtswelle 𝑈 (+) und eine einzelne kombinierte Rückwärtswelle 𝑈 (−) , wie Abb. 7.2(b) zeigt. Die Bestimmung der Wellenausbreitung in einem Schichtmedium ist dann äquivalent zur Bestimmung der Amplituden dieses Paares von Wellen. Die komplexen Amplituden der vier Wellen auf den beiden Seiten einer Grenzfläche können über die passenden Randbedingungen miteinander verknüpft werden, oder auch einfach über die Fresnelgleichungen der Reflexion und Transmission. Die Wellentransfermatrix
7.1.1 Matrixtheorie der Optik von Schichtmedien Eine senkrecht auf ein Schichtmedium einfallende ebene Welle erfährt Reflexionen und Transmissionen an den Grenzflächen zwischen den Schichten, und die reflektierten und transmittierten Strahlen werden wiederum reflektiert und transmittiert – ein endloser Prozess, der in Abb. 7.2(a) illustriert ist. Die komplexen Amplituden der durchgelassenen und reflektierten Wellen können durch Verwendung der Fresnelgleichungen für jede Grenzfläche bestimmt werden (siehe Abschnitt 6.2); die Gesamttransmission und -reflexion des Mediums können im Prinzip durch Superposition dieser individuellen Wellen berechnet werden. Diese Technik wurde in Abschnitt 2.5.2 verwendet, um die Transmission des FabryPérot-Interferometers zu bestimmen. Wenn die Zahl der Schichten groß ist, kann es sehr mühsam werden, die unendliche Zahl von „Mikro“reflexionen und -transmissionen zu verfolgen. Ein alternativer „Makro“-Ansatz beruht auf der Tatsache, dass es innerhalb jeder Schicht zwei Arten von Wellen gibt: Vorwärtswellen, die sich nach rechts ausbreiten, und Rückwärtswellen, die sich nach links ausbreiten.
(a)
(–)
U2
(+)
U2
U1
(–)
(b) U1
(+)
Abb. 7.2 (a) Reflexionen einer einzelnen Welle an den Grenzflächen eines Schichtmediums. (b) In jeder Schicht sind die Vorwärtswellen zu einer Gesamt-Vorwärtswelle U(+) kombiniert, und die rückwärts gerichteten Wellen sind zu einer Gesamt-Rückwärtswelle U(−) kombiniert.
Die Verfolgung der komplexen Amplituden der Vorwärts- und Rückwärtswellen durch die Grenzflächen eines Schichtmediums wird durch die Verwendung von Matrizenmethoden erleichtert. Wir betrachten zwei beliebige Ebenen innerhalb eines gegebenen optischen Systems, die wir als Ebene 1 und Ebene 2 bezeichnen. Die Amplituden der kombinierten Vorwärts- und (+) (−) Rückwärtswellen in Ebene 1, 𝑈1 bzw. 𝑈1 , werden durch Spaltenmatrizen der Dimension 2 beschrieben und entsprechend für Ebene 2. Die beiden Spaltenmatrizen sind durch die Matrixgleichung ⎡𝑈2(+) ⎤ ⎡A ⎢ (−) ⎥ = ⎢ 𝑈 C ⎣ 2 ⎦ ⎣
(+) B ⎤ ⎡ 𝑈1 ⎤
D
⎥ ⎢ (−) ⎥ . 𝑈 ⎦⎣ 1 ⎦
U1
U2(+)
U1(−)
U2
(+)
(7.3)
(−)
verknüpft. Die Matrix M mit den Elementen A, B, C und D wird die Wellentransfermatrix (oder Transmissionsmatrix) genannt. Sie hängt von den optischen Eigenschaften des Schichtmediums zwischen den beiden Ebenen ab. Ein Schichtmedium wird zweckmäßig als Verkettung von Grundelementen betrachtet, deren Wellentransfermatrizen M1 , M2 , . . . , M𝑁 bekannt sind. Die Amplituden der kombinierten Vorwärts- und Rückwärtswellen an den beiden Enden des Mediums sind dann durch eine einzige Matrix verknüpft, die das Matrixprodukt der einzelnen Wellentransfermatrizen ist, M = M𝑁 … M2 M1 ,
1
2
(7.4)
N
wobei die Elemente 1, 2, … , 𝑁 von links nach rechts nummeriert werden, wie die Abbildung zeigt. Die in
187
188
7 Optik photonischer Kristalle
Gl. (7.4) angegebene Kaskadengleichung für die Wellenmatrizen ist identisch mit der Kaskadengleichung für die Strahltransfermatrizen in Gl. (1.49) und wird sich als ebenso nützlich erweisen. Die Streumatrix
Eine Alternative zur Wellentransfermatrix, die die vier (±) komplexen Amplituden 𝑈1,2 an den beiden Rändern eines Schichtmediums verknüpft, ist die Streumatrix oder S-Matrix. Sie wird häufig verwendet, um Sendeanlagen, Mikrowellenschaltungen und streuende Systeme zu beschreiben. In diesem Fall werden die austretenden Wellen wie folgt mit den einfallenden Wellen verknüpft: ⎡𝑈2(+) ⎤ ⎢ (−) ⎥ 𝑈 ⎣ 1 ⎦ (+)
U1
(−)
U2
⎡t12 =⎢ ⎢ r ⎣ 12
r21 ⎤ ⎡𝑈 (+) ⎤ ⎥⎢ 1 ⎥ , (−) ⎥ t21 ⎣𝑈2 ⎦ ⎦
Beispiel 7-1: Ausbreitung durch ein homogenes Medium Für eine homogene Schicht mit der Dicke d und dem
Brechungsindex 𝑛 sind die komplexen Amplituden der kombinierten Wellen in den durch die Pfeile angezeig(+) (+) (−) (−) ten Ebenen durch 𝑈2 = e−i𝜑 𝑈1 und 𝑈1 = e−i𝜑 𝑈2 mit 𝜑 = 𝑛𝑘0 d verknüpft. In diesem Fall lauten die Wellentransfermatrix und die Streumatrix ⎡e−i𝜑
M=⎢
0
⎣
0⎤ ⎥, ei𝜑 ⎦
⎡e−i𝜑
S=⎢
⎣
0
0 ⎤ ⎥, e ⎦ −i𝜑
𝜑 = 𝑛𝑘0 d . (7.6)
n
(7.5)
(+)
U2
(−)
U1
wobei t12 , r21 , r12 und t21 die Elemente der S-Matrix sind. Im Gegensatz zu den Elementen der Wellentransfermatrix haben sie eine direkte physikalische Bedeutung. Die Größen t12 und r12 beschreiben die Amplitudentransmission und -reflexion in Vorwärtsrichtung (d. h. die Transmission und bzw. Reflexion einer von links einfallenden Welle), während t21 und r21 die Amplitudentransmission und -reflexion in Rückwärtsrichtung (d. h. für eine von rechts kommende Welle sind). Der Index 12 bedeutet beispielsweise, dass das Licht von Medium 1 kommend in Medium 2 eintritt. Das ist einfach nachzuprüfen, denn wenn es in Ebene 2 keine rück(−) wärts gerichtete Welle gibt, sodass 𝑈2 = 0 ist, erhalten (+) (+) (−) (+) wir 𝑈2 = t12 𝑈1 und 𝑈1 = r12 𝑈1 . Wenn es in Ebe(+) ne 1 keine Vorwärtswelle gibt, sodass 𝑈1 = 0 ist, erhal(+) (−) (−) (−) ten wir entsprechend 𝑈2 = r21 𝑈2 und 𝑈1 = t21 𝑈2 . Ein deutlicher Vorteil des S-Matrix-Formalismus ist, dass ihre Elemente direkt mit den physikalischen Parametern des Systems verknüpft sind. Ein Nachteil ist andererseits, dass die S-Matrix einer Kaskade von Elementen nicht das Produkt der S-Matrizen der einzelnen Elemente ist. Ein nützliches systematisches Verfahren zur Analyse eines Kaskadensystems stützt sich daher sinnvollerweise sowohl auf den Wellentransfer- als auch auf den Streumatrix-Ansatz: Wir verwenden die praktische Multiplikationsgleichung für die M-Matrizen und rechnen dann in die S-Matrix um, um die Transmission und Reflexion des Kaskadensystems zu bestimmen.
Die Beziehung zwischen Streu- und Wellentransfermatrix Den Zusammenhang der Elemente der M- und S-Matri-
zen erhalten wir durch Manipulation der Definitionsgleichungen (7.3) und (7.5), was uns zu folgenden Transformationsgleichungen führt: ⎡A M=⎢ C ⎣
⎡t12
S=⎢
r ⎣ 12
B⎤
1 ⎡t12 t21 − r12 r21 ⎥= ⎢ t 21 −r12 D ⎦ ⎣ r21 ⎤ 1 ⎡AD − BC ⎥= ⎢ D t21 −C ⎦ ⎣
B⎤
1
⎥. ⎦
r21 ⎤ ⎥, 1 ⎦
(7.7)
(7.8)
Diese Gleichungen gelten nicht in den Grenzfällen t21 = 0 oder D = 0. Zusammenfassung
Die Matrix-Wellenoptik stellt ein systematisches Verfahren zur Verfügung, um die Amplitudentransmission und -reflexion eines Stapels von dielektrischen Schichten mit gegebenen Dicken und Brechungsindizes zu bestimmen: • Der Stapel wird in eine Kaskade von Elementen geteilt, die jeweils aus zwei Grenzflächen mit einer homogenen Schicht dazwischen bestehen. • Für jedes Element wird die M-Matrix bestimmt. Dazu bestimmt man mithilfe der Fresnelgleichungen für Transmission und Reflexion die S-Matrix und daraus über die Transformationsgleichung (7.7) die entsprechende M-Matrix. • Die M-Matrix für den vollständigen Stapel von Elementen wird gemäß der in Gl. (7.4) gegebenen Wellentransfermatrix-Gleichung berechnet, indem man einfach die M-Matrizen der einzelnen Elemente multipliziert.
7.1 Optik von dielektrischen Schichtmedien
• Schließlich wird die S-Matrix für den vollständigen Stapel durch Konversion der M-Matrix nach Gl. (7.8) bestimmt. Die Elemente der S-Matrix geben dann direkt die Amplitudentransmission und -reflexion für den vollständigen Stapel von dielektrischen Schichten an.
Zwei hintereinandergeschaltete Systeme: Die Airygleichungen
Mithilfe von Matrizenmethoden können explizite Ausdrücke für die Elemente der Streumatrix eines zusammengesetzten Systems als Funktion der Elemente der Streumatrizen der konstituierenden Systeme hergeleitet werden. Wir betrachten dazu eine Welle, die durch ein System mit der S-Matrix mit den Elementen t12 , r21 , r12 und t21 hindurchtritt, gefolgt von einem zweiten System mit dem S-Matrixelementen t23 , r32 , r23 und t32 . Durch Multiplikation der zugehörigen M-Matrizen und anschließende Konversion des Resultats in eine S-Matrix können die folgenden Gleichungen für die Vorwärtstransmission und die Reflexion des Gesamtsystems hergeleitet werden: t13 =
t12 t23 , 1 − r21 r23
r13 = r12 +
t12 t21 r23 . 1 − r21 r23
(7.9)
Wenn zwischen den beiden aufeinander folgenden Systemen noch eine Ausbreitung durch ein homogenes Medium erfolgt, wie in Abb. 7.3 gezeigt, dann erhalten wir durch Verwendung der Wellentransfermatrix aus Gl. (7.6) mit der Phase 𝜑 = 𝑛𝑘0 d , wobei d die Entfernung zwischen den Systemen ist und 𝑛 der Brechungsindex des Mediums, die folgenden Gleichungen für die Gesamttransmission und -reflexion, die als Airygleichungen bekannt sind: t13 = r13
t12 t23 exp(−i𝜑) , 1 − r21 r23 exp (−i2𝜑)
(7.10)
t12 t21 r23 exp (−i2𝜑) = r12 + . 1 − r21 r23 exp (−i2𝜑)
Die Airygleichungen können auch hergeleitet werden, indem man die vielfachen Transmissionen und Reflexionen verfolgt, die eine einfallende Welle in den beiden Systemen erfährt, und ihre Amplituden wie in Abb. 7.3 gezeigt summiert. Eine ebene Welle der komplexen Amplitude 𝑈e , die auf das erste System trifft, erzeugt eine anfängliche innere Welle der Amplitu(+) de 𝑈0 = t12 𝑈e , die zwischen den beiden Subsystemen hin und her reflektiert wird und dabei zusätz(+) (+) liche innere Wellen 𝑈1 , 𝑈2 , … erzeugt, die sich alle in Vorwärtsrichtung ausbreiten. Die Amplitude der insgesamt transmittierten Welle 𝑈t ist mit der inne(+) (+) ren Gesamtamplitude 𝑈 (+) = 𝑈0 + 𝑈1 + … durch (+) 𝑈t = t23 exp(−i𝜙)𝑈 mit 𝜙 = 𝑛𝑘0 d verknüpft. Die gesamte Amplitudentransmission ist daher t13 = 𝑈t ∕𝑢e = (+) (+) t12 t23 exp(−i𝜙)(𝑈 (+) ∕𝑈0 ). Da 𝑈 (+) = 𝑈0 (1 + ℎ + (+) ℎ2 + ⋯) = 𝑈0 ∕(1 − ℎ) mit ℎ = r21 r23 exp(−i2𝜙) der Faktor für Hin- und Rückweg durch das System ist, ergibt sich aus der Gesamt-Amplitudentransmission t13 die Airygleichung (7.10). Erhaltungsbeziehungen für verlustfreie Medien
Wenn das Medium zwischen den Ebenen 1 und 2 verlustfrei ist, müssen die eingehenden und ausgehenden optischen Leistungen gleich sein. Wenn die Medien an der Eingangs- und Ausgangsebene außerdem dieselbe Impedanz und denselben Brechungsindex besitzen, dann sind diese Leistungen durch die Betrags(±) quadrate der komplexen Amplituden |𝑈1,2 |2 gegeben. In diesem Fall folgt aus der Erhaltung der Leistung, dass für jede Kombination von eingehenden Ampli(+) (−) (+) (−) tuden |𝑈1 |2 + |𝑈2 |2 = |𝑈2 |2 + |𝑈1 |2 sein muss. (+) (−) Wenn wir die eingehenden Amplituden 𝑈1 und 𝑈2 gleich (1, 0), (0, 1) und (1, 1) wählen, erhalten wir aus der oben angegebenen Erhaltungsgleichung drei Gleichungen, die die Elemente der S-Matrix verbinden. Diese Gleichungen können verwendet werden, um die folgenden Gleichungen zu beweisen: |t12 | = |t21 | ≡ |t| ,
|r12 | = |r21 | ≡ |r| ,
|t|2 + |r|2 = 1 , (7.11)
12 12
. . .
Ur
Ui
21 21
23 23
(+)
U2
U1(+)
t12 ∕t∗21 = −r12 ∕r∗21 .
32 32
. . .
Ut
(+)
U0
Abb. 7.3 Durchgang einer ebenen Welle durch eine Kaskade von zwei getrennten Systemen.
(7.12)
Die Gln. (7.11) verknüpfen die Beträge der Elemente der S-Matrix für verlustfreie Medien, deren Eingangsund Ausgangsebenen denselben Brechungsindex besitzen, wohingegen Gl. (7.12) ihre Argumente verknüpft. Die Gleichungen (7.11) und (7.12) liefern folgende Beziehungen zwischen den Elementen der M-Matrix: |D | = |A| ,
|C | = |B | , ∗
∗
|A|2 − |B|2 = 1 ,
det M = C ∕B = A∕D = t12 ∕t21 ,
(7.13)
| det M| = 1 . (7.14)
189
190
7 Optik photonischer Kristalle
Diese Ergebnisse lassen sich herleiten, indem man die Erhaltungsbeziehungen (7.11) und (7.12) für verlustfreie Medien in die Transformationsgleichungen (7.7) und (7.8) zwischen der Wellentransfer- und der Streumatrix einsetzt.
In diesem Beispiel besteht das System nur aus einer einzelnen Grenzfläche. Nach den Fresnelgleichungen (siehe Abschnitt 6.2) sind die Transmission und die Reflexion an einer Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 durch die S-Matrix ⎡t12 ⎣
r12
r21 ⎤ 1 ⎥= 𝑛1 + 𝑛2 t21 ⎦
⎡ 2𝑛1 ⎢ 𝑛 − 𝑛2 ⎣ 1
𝑛2 − 𝑛1 ⎤ ⎥ (7.15) 2𝑛2 ⎦
gegeben. Einsetzen in Gl. (7.7) ergibt die M-Matrix 1 ⎡𝑛2 + 𝑛1 ⎢ 2𝑛2 𝑛2 − 𝑛1 ⎣
M=
𝑛2 − 𝑛1 ⎤ ⎥. 𝑛2 + 𝑛1 ⎦
(7.16)
n2
n1
i|r|⎤ 1 ⎡ 1 ⎢ ⎥ , M= |t| −i|r| i|r| |t| ⎣ ⎣ ⎦ 2 2 mit |t| + |r| = 1 ⎡ |t|
Beispiel 7-2: Einzelne dielektrische Grenzfläche
S=⎢
In solchen Systemen sind nur relative Phasen von Bedeutung, daher können wir ohne Verlust der Allgemeinheit annehmen, dass arg{t} = 0 ist. Damit folgt aus Gl. (7.17), dass arg{r} = ±π∕2 sein muss, sodass r = ±i|r| wird und die Matrizen in Gl. (7.19) die einfachere Form
Verlustfreie symmetrische Systeme
Für verlustfreie Systeme mit reziproker Symmetrie, d. h. Systeme, deren Transmission/Reflexion in Vorwärtsund Rückwärtsrichtung identisch ist, ist t21 = t12 ≡ t und r21 = r12 ≡ r. In diesem Fall liefern die Gln. (7.11) und (7.12)
S=⎢
1 S= √ 2
⎡ |t| ⎢ i|r| ⎣
i|r|⎤ ⎥ . |t| ⎦
Beispiel 7-3: Ausbreitung durch eine dielektrische Platte
Wir betrachten ein verlustfreies System, das aus einer Kaskade von drei Subsystemen besteht: Einer Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛1 und 𝑛2 , gefolgt von einer Ausbreitung durch ein Medium mit dem Index 𝑛2 und schließlich erneut einer Grenzfläche zwischen zwei Medien mit den Brechungsindizes 𝑛2 und 𝑛1 . Aufgrund von Gl. (7.4) und den Ergebnissen aus Beispiel 7-2 ist die M-Matrix des Gesamtsystems ein Produkt der M-Matrizen der drei Teilsysteme, wobei die Matrixmultiplikation in umgekehrter Reihenfolge stattfindet: M=
1 ⎡ 𝑛1 + 𝑛2 ⎢ 4𝑛1 𝑛2 𝑛1 − 𝑛2 ⎣
(7.17)
∗
∗
A=D ,
B=C ,
|A|2 − |B|2 = 1 ,
⎡t ⎣
r
r⎤ ⎥, t ⎦
⎡ 1∕t∗
M=⎢
⎣
∗
∗
r ∕t
r∕t ⎤ ⎥ 1∕t ⎦
n1
n2
𝑛1 − 𝑛2 ⎤ ⎡e−i𝜑2 0 ⎤ ⎥⎢ ⎥ 𝑛1 + 𝑛2 0 ei𝜑 ⎦⎣ ⎦ ⎡𝑛2 + 𝑛1 𝑛2 − 𝑛1 ⎤ ×⎢ ⎥ . (7.21) 𝑛 − 𝑛1 𝑛2 + 𝑛1 ⎦ ⎣ 2
n1
det M = 1 . (7.18)
Die S- und M-Matrizen nehmen dann die einfache Form S=⎢
(7.20)
annehmen. Diese Gleichungen werden üblicherweise verwendet, um verlustfreie symmetrische Systeme wie beispielsweise Strahlteiler (z. B. kubische oder PellicleStrahlteiler) und Optokoppler zu √beschreiben. Wenn darüber hinaus noch |r| = |t| = 1∕ 2 gilt, folgt
|t|2 + |r|2 = 1 , t∕r = −(t∕r)∗ , arg{t} − arg{r} = ±π∕2 ;
das zeigt, dass sich die zur Transmission und zur Reflexion gehörenden Phasen um π∕2 unterscheiden. Unter diesen Bedingungen erfüllen die Elemente der M-Matrix die Beziehungen
i|r|⎤ ⎥ 1𝑡 ⎦
(7.19)
an und das System wird durch zwei komplexe Zahlen t und r beschrieben, die durch Gl. (7.17) verknüpft sind.
Hier ist 𝜑 = 𝑛2 𝑘0 d , wobei d die Breite der Platte ist. Die Elemente der Matrix M, die durch ] 1 1 [ ∗ A=D = ∗ = (𝑛1 + 𝑛2 )2 e−i𝜑 − (𝑛2 − 𝑛1 )2 ei𝜑 , 4𝑛1 𝑛2 t (7.22) ∗
B=C =
− r = −i sin 𝜑 t 4𝑛1 𝑛2 𝑛22
𝑛12
(7.23)
7.1 Optik von dielektrischen Schichtmedien
gegeben sind, erfüllen die Eigenschaften eines reziproken und verlustfreien Systems, wie durch Gl. (7.18) beschrieben. Aus den Gln. (7.22) und (7.23) können wir Ausdrücke für t und r bestimmen. Es gilt t=
4𝑛1 𝑛2 exp(−i𝜑2 ) , (𝑛1 + 𝑛2 )2 − (𝑛1 − 𝑛2 )2 exp(−i2𝜑) (7.24)
𝑛2 − 𝑛12 r = −i [ 2 sin 𝜑] t . 4𝑛1 𝑛2
Häufig werden gezielt entworfene dünne Schichten verwendet, um Reflexionen an der Grenzfläche zwischen zwei Medien mit unterschiedlichen Brechungsindizes zu reduzieren oder zu beseitigen. Wir betrachten eine dünne Schicht mit dem Brechungsindex 𝑛2 und der Dicke d , die zwischen Medien der Brechungsindizes 𝑛1 und 𝑛3 eingeschoben ist (Abb. 7.4). Leiten Sie einen Ausdruck für das B-Element der M-Matrix für dieses Schichtmedium her. Zeigen Sie, dass von Medium 1 aus einfallendes Licht für d = 𝜆∕4 und 𝑛2 = √ 𝑛1 𝑛3 einen Reflexionsgrad von null besitzt, wobei 𝜆 = 𝜆0 ∕𝑛2 ist. n3
n2 =
U2
(+)
U2
U1
Übung 7-1: Viertelwellenschicht als Antireflexbelag
n2
(−)
(−)
U1 (b)
Transmissionsgrad |t|2 und Reflexionsgrad |r|2 sind periodische Funktionen der Phase 𝜑 mit der Periode π. Der Betrag der Phasendifferenz zwischen r und t bleibt unabhängig von 𝜑 stets konstant π∕2, ändert aber beim Nulldurchgang von sin 𝜑 in jedem Intervall sein Vorzeichen. Die in den Gln. (7.22) und (7.23) angegebenen Ausdrücke können auch direkt hergeleitet werden, indem man das System als Kombination zweier Grenzflächen mit einer dazwischenliegenden Ausbreitung in einem Medium auffasst und die Airygleichung (7.10) mit t12 = t32 = 2𝑛1 ∕(𝑛1 + 𝑛2 ), t21 = t23 = 2𝑛2 ∕(𝑛1 + 𝑛2 ) und r12 = r32 = −r21 = −r23 = (𝑛1 − 𝑛2 )∕(𝑛1 + 𝑛2 ) verwendet.
n1
(a)
n1n3
= λ/4
Abb. 7.4 Antireflexbelag.
Schief einfallende Wellen in Schichtmedien
Wenn eine Welle in einem schiefen Winkel auf ein Schichtmedium trifft, werden die transmittierten und reflektierten Wellen zusammen mit deren Reflexionen und Transmissionen zwischen den Schichten hin und
(+)
Abb. 7.5 (a) Reflexionen einer einzelnen schief einfallenden Welle an den Grenzflächen eines Schichtmediums. (b) In jeder Schicht sind die Vorwärtswellen zu einer gesammelten Vorwärtswelle kombiniert, und die rückwärts gerichteten Wellen sind zu einer gesammelten Rückwärtswelle kombiniert.
her geworfen, wie Abb. 7.5(a) anhand des Realteils illustriert. Die Reflexions- und Brechungsgesetze sorgen dafür, dass innerhalb alle Vorwärtswellen innerhalb einer Schicht parallel sind und ebenso alle Rückwärtswellen. Außerdem breiten sich Vorwärts- und Rückwärtswellen in einer gegebenen Schicht unter demselben Winkel aus, einmal aus +𝑧- und einmal aus −𝑧-Richtung gemessen. Der „Makro“ansatz, den wir früher für senkrecht einfallende Wellen verwendet hatten, ist in ähnlicher Weise auch für schief einfallende Wellen anwendbar. Der Unterschied ist, dass die Fresneltransmissionen und -reflexionen t12 , r21 , r12 und t21 an einer Grenzfläche winkelabhängig sowie von der Polarisation abhängig sind (siehe Abschnitt 6.2). Das einfachste Beispiel ist die Ausbreitung durch ein homogenes Medium mit dem Brechungsindex 𝑛 über eine Entfernung d unter einem Winkel 𝜃 zur 𝑧-Achse. Die Wellentransfermatrix M ist dann durch Gl. (7.6) gegeben, wobei die Phase jetzt 𝜑 = 𝑛𝑘0 d cos 𝜃 ist. Zwei andere Beispiele werden im Folgenden präsentiert. Beispiel 7-4: Einzelne Grenzfläche: Schief einfallende TE-Welle
Eine durch eine ebene Grenzfläche zwischen Medien der Brechungsindizes 𝑛1 und 𝑛2 unter den Winkeln 𝜃1 und 𝜃2 transmittierte Welle erfüllt das snelliussche Gesetz 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 . Sie wird durch eine S-Matrix, die aus den Fresnelgleichungen (6.34) und (6.35) bestimmt wird, und die entsprechende M-Matrix beschrieben: ⎡t12
S=⎢
r ⎣ 12
r21 ⎤ 1 ⎥= 𝑛˜1 + 𝑛˜2 t21 ⎦
⎡ 2𝑎12 𝑛˜1 ⎢ 𝑛˜ − 𝑛˜2 ⎣ 1
𝑛˜2 − 𝑛˜1 ⎤ ⎥ , (7.25) 2𝑎21 𝑛˜2 ⎦
191
192
7 Optik photonischer Kristalle
⎡A M=⎢ ⎢ C ⎣
B⎤
1 ⎥= ⎥ 2𝑎21 𝑛˜2 D ⎦
n1
⎡𝑛˜1 + 𝑛˜2 ⎢ 𝑛˜ − 𝑛˜1 ⎣ 2
𝑛˜2 − 𝑛˜1 ⎤ ⎥ . (7.26) 𝑛˜1 + 𝑛˜2 ⎦
n2
θ1 θ1
4˜ 𝑛1 𝑛˜2 exp(−i𝜑) ˜ , 2 (˜ 𝑛1 + 𝑛˜2 − (˜ 𝑛1 − 𝑛˜2 ) exp(−i2˜ 𝜑) 𝑛˜22 − 𝑛˜12 sin 𝜑] ˜ t. r = −i [ 4˜ 𝑛1 𝑛˜2 t=
θ2 θ2
Mit den folgenden Definitionen sind diese Ausdrücke sowohl für TE- als auch für TM-polarisierte Wellen anwendbar: TE: 𝑛˜1 = 𝑛1 cos 𝜃1 , 𝑛˜2 = 𝑛2 cos 𝜃2 , 𝑎12 = 𝑎21 = 1, TM: 𝑛˜1 = 𝑛1 sec 𝜃1 , 𝑛˜2 = 𝑛2 sec 𝜃2 , 𝑎12 = cos 𝜃1 ∕ cos 𝜃2 = 1∕𝑎21 . Beispiel 7-5: Dielektrische Platte: Schiefer Einfall
In diesem Beispiel betrachten wir eine schief einfallende Welle, die sich durch das in Beispiel 7-3 beschriebene System ausbreitet: eine Platte der Dicke d mit dem Brechungsindex 𝑛2 in einem Medium mit dem Brechungsindex 𝑛1 . Die Wellentransfermatrix für eine schief einfallende Welle ist eine Verallgemeinerung des Ergebnisses für achsenparallele Wellen: M=
1 ⎡𝑛˜1 + 𝑛˜2 𝑛˜1 − 𝑛˜2 ⎤ ⎡e−i𝜑 ⎢ ⎥⎢ 4˜ 𝑛1 𝑛˜2 𝑛˜1 − 𝑛˜2 𝑛˜1 + 𝑛˜2 0 ⎣ ⎦⎣ ⎡𝑛˜2 + 𝑛˜1 𝑛˜2 − 𝑛˜1 ⎤ ×⎢ ⎥, 𝑛˜ − 𝑛˜1 𝑛˜2 + 𝑛˜1 ⎦ ⎣ 2 n1
θ1
n2
Ersetzungen werden die in Beispiel 7-3 für die Reflexion und Transmission achsenparalleler Wellen entwickelten Ausdrücke auf schief einfallende und polarisationsabhängige Fälle verallgemeinert,
0⎤ ⎥ ei𝜑 ⎦ (7.27)
7.1.2
)2
Das Fabry-Pérot-Etalon
Das Fabry-Pérot-Etalon wurde im Abschnitt 2.5.2 als ein Interferometer aus zwei parallelen hochreflektierenden Spiegeln eingeführt, die Licht nur bei speziellen äquidistanten Frequenzen durchlassen, die von der optischen Weglänge zwischen den Spiegeln abhängen. Es wird als Filter oder als Spektralanalysator verwendet und kann z. B. durch Änderung der Weglänge gesteuert werden, indem man einen der Spiegel bewegt. Wie in Abschnitt 11.1 besprochen, wird es auch als optischer Resonator eingesetzt. In diesem Abschnitt wollen wir dieses Bauelement mithilfe der in diesem Kapitel entwickelten Matrizenmethoden analysieren. Das Spiegel-Fabry-Pérot-Etalon
Wir betrachten zwei verlustfreie teilreflektierende Spiegel mit den Amplitudentransmissionen t1 und t2 und den Amplitudenreflexionsgraden r1 und r2 in einem Abstand d mit einem Medium mit dem Brechungsindex 𝑛 zwischen ihnen. Das Gesamtsystem wird durch das Matrixprodukt ⎡ 1∕t∗1
n1
r1 ∕t1 ⎤ ⎡exp(−i𝜑) ⎥⎢ 1∕t1 0 ⎦⎣ ⎡ 1∕t∗ r2 ∕t2 ⎤ × ⎢ ∗ 2∗ ⎥ r ∕t 1∕t2 ⎦ ⎣ 2 2
M=⎢
r∗ ∕t∗ ⎣ 1 1
θ1 θ2
wobei 𝜑 ˜ = 𝑛2 𝑘0 d cos 𝜃2 ist, sowie ebenso wie in Beispiel 7-3 𝑛˜1 = 𝑛1 cos 𝜃1 und 𝑛˜2 = 𝑛2 cos 𝜃2 für TEPolarisation bzw. 𝑛˜1 = 𝑛1 sec 𝜃1 und 𝑛˜2 = 𝑛2 sec 𝜃2 für TM-Polarisation. Der Ausdruck für die Matrix M in Gl. (7.27) ist identisch mit demjenigen in Gl. (7.21), der das achsenparallele System beschreibt, nur dass die Parameter 𝑛1 , 𝑛2 und 𝜑 durch die winkel- und polarisationsabhängigen Parameter 𝑛˜1 und 𝑛˜2 sowie den winkelabhängigen Parameter 𝜑 ˜ ersetzt wurden. Die Faktoren 𝑎12 und 𝑎21 , die in Gl. (7.26) für jede Grenzfläche erscheinen, löschen sich wegen 𝑎12𝑎21 = 1 gegenseitig aus: Mit diesen
(7.28)
⎤ ⎥ exp(i𝜑) ⎦ 0
(7.29)
mit 𝜑 = 𝑛𝑘0 d beschrieben. Da das System verlustfrei und symmetrisch ist, nimmt M die vereinfachte Form aus Gl. (7.19) an, und die Amplitudentransmission t ist daher der Kehrwert des D-Elements von M, also t=
t1 t2 exp(−i𝜑) . 1 − r1 r2 exp (−i2𝜑)
(7.30)
Diese Beziehung kann auch durch direkte Verwendung der Airygleichung (7.10) hergeleitet werden. Infolgedessen ist die Intensitätstransmission des Etalons 𝒯 = |t|2 =
|t1 t2 |2 . |1 − r1 r2 exp(−i2𝜑)|2
(7.31)
7.1 Optik von dielektrischen Schichtmedien
1
1
2
νF = c 2
2
δν =
Abb. 7.6 Intensitätstransmissionsgrad 𝒯 und -reflexionsgrad ℛ = 1 − 𝒯 des Fabry-Pérot-Etalons als Funktion der Kreisfrequenz 𝜔.
νF
ν
Dieser Ausdruck ähnelt Gl. (2.61) für die Intensität einer unendlichen Zahl von Wellen mit gleichen Phasendifferenzen und Amplituden, die gemäß einer geometrischen Reihe abnehmen, wie in Abschnitt 2.5.2 beschrieben. Wenn wir annehmen, dass arg{r1 r2 } = 0 ist, erhält dieser Ausdruck die Form 1) 𝒯=
𝒯max 2
1 + (2ℱ∕π)2 sin 𝜑
,
(7.32)
mit 𝒯max =
|t1 t2 |2 (1 − |r1 |2 )(1 − |r2 |2 ) = (1 − |r1 r2 |)2 (1 − |r1 r2 |)2
(7.33)
und
√ π |r1 r2 | . ℱ= 1 − |r1 r2 |
(7.34)
Der Parameter ℱ, die Finesse, ist eine monoton zunehmende Funktion des Produkts r1 r2 der Reflexionsgrade und ein Maß für die Qualität des Etalons. Für r1 r2 = 0.99 ist z. B. ℱ ≈ 313. Wie in Abschnitt 2.5.2 beschrieben ist die Transmission 𝒯 eine periodische Funktion von 𝜑, in diesem Fall mit der Periode π. Sie erreicht ihren maximalen Wert 𝒯max , der für |r1 | = |r2 | gleich eins ist, wenn 𝜑 ein ganzzahliges Vielfaches von π ist. Wenn die Finesse ℱ groß ist (d. h. für |r1 r2 | ≈ 1), ist 𝒯 eine Funktion von 𝜑 mit einem sehr scharfen Maximum der ungefähren Breite π∕ℱ. Je größer daher die Finesse ℱ ist, desto schärfer werden die Peaks der Transmission als Funktion der Phase 𝜑. Die Phase 𝜑 = 𝑛𝑘0 d = (𝜔∕𝑐)d ist proportional zur Frequenz, sodass aus 𝜑 = π sofort 𝜔 = 𝜔F oder 𝜈 = 𝜈F folgt, wobei 𝜈F =
𝑐 , 2d
𝜔F =
π𝑐
(7.35)
d
der freie Spektralbereich ist. Daraus folgt, dass die Transmission 𝒯(𝜈) als Funktion der Frequenz eine periodische Funktion der Periode 𝜈F ist, 𝒯(𝜈) =
𝒯max 2
1 + (2ℱ∕π)2 sin (π𝜈∕𝜈F )
,
(7.36)
1) Dieser Ausdruck, in dem 𝜑 = 𝑛𝑘0 d ist, reduziert sich auf Gl. (2.63), wo 𝜑 = 2𝑛𝑘0 d gilt.
wie Abb. 7.6 zeigt. Sie erreicht ihren Maximalwert 𝒯max bei den Resonanzfrequenzen 𝜈𝑞 = 𝑞𝜈F mit einer ganzen Zahl 𝑞. Wenn die Finesse ℱ ≫ 1 ist, fällt 𝒯(𝜈) schnell ab, sobald die Frequenz ein wenig von 𝜈𝑞 abweicht, sodass 𝒯(𝜈) einen kammförmigen Verlauf annimmt. Die spektrale Breite jedes dieser Peaks hoher Transmission ist 𝜈 δ𝜈 = F , (7.37) ℱ d. h. sie ist um einen Faktor ℱ kleiner als der Abstand zwischen den Resonanzfrequenzen. Das Fabry-Pérot-Etalon kann als präzise abstimmbares optisches Filter oder als Spektralanalysator verwendet werden. Wegen der periodischen Natur seiner spektralen Antwort muss die spektrale Breite des gemessenen Lichts aber schmaler sein als der freie Spektralbereich 𝜈F = 𝑐∕2d , um Zweideutigkeiten zu vermeiden. Das Filter wird abgestimmt (d. h. die Resonanzfrequenzen werden verschoben), indem man den Abstand d zwischen den Spiegeln anpasst. Eine geringe Änderung im Spiegelabstand Δd verschiebt die Resonanzfrequenz 𝜈𝑞 = 𝑞𝑐∕2d um einen relativ großen Betrag Δ𝜈𝑞 = −(𝑞𝑐∕2d 2 )Δd = −𝜈𝑞 Δd ∕d . Zwar ändert sich der Frequenzabstand 𝜈F auch, aber um den viel kleineren Betrag −𝜈F Δd ∕d . Beispielsweise führt ein Spiegelabstand von d = 1.5 cm für 𝑛 = 1 zu einem freien Spektralbereich 𝜈F = 10 GHz. Für eine typische optische Frequenz von 𝜈 = 1014 Hz entsprechend 𝑞 = 104 verschiebt dann eine Änderung von d um einen Faktor 10−4 (Δd = 1.5 μm) die Peakfrequenz um Δ𝜈𝑞 = 10 GHz, während der freie Spektralbereich sich nur um 1 MHz auf 9.999 GHz ändert. Anwendungen des Fabry-Pérot-Etalons als Resonator werden in Abschnitt 11.1 beschrieben. Transmission des Fabry-Pérot-Etalons für schief einfallende Wellen
Für eine schiefwinklige Welle, die sich in einem Winkel 𝜃 zur Achse eines Spiegeletalons ausbreitet, ist die Amplitudentransmission durch Gl. (7.30) gegeben, wobei die Phase 𝜑 durch 𝜑 ˜ = 𝑛𝑘0 d cos 𝜃 zu ersetzen ist. Die verallgemeinerte Intensitätstransmission aus Gl. (7.36) wird damit für schiefwinklige Wellen 𝒯(𝜈) =
𝒯max 2
1 + (2ℱ∕π)2 sin (π cos 𝜃 𝜈∕𝜈F )
.
(7.38)
193
194
7 Optik photonischer Kristalle
θ
90° 80° 70° 60° 50°
θ
40° 30°
θ
20° 10° 0° 0
(a)
(b)
1
2
3
4
5 ν/ν F
(c)
Abb. 7.7 (a) Eine schiefwinklige Welle tritt durch ein Spiegel-Fabry-Pérot-Etalon. (b) Weißes Licht, das aus einer Punktlichtquelle durch das Etalon hindurchtritt, erzeugt eine Reihe konzentrischer Ringe unterschiedlicher Frequenzen (Farben). (c) Frequenzen und Winkel, die die Bedingung Gl. (7.39) für maximale Transmission erfüllen.
Die Transmissionsmaxima erscheinen bei den Frequenzen 𝜈 = 𝑞𝜈F sec 𝜃 ,
𝑞 = 1, 2, … ,
𝜈F = 𝑐∕2d .
(7.39)
Wenn die Finesse des Etalons groß ist, ist die Transmission nur bei diesen Frequenzen größer null, wohingegen die Strahlung bei allen anderen Frequenzen fast vollständig gesperrt wird. Die Auftragung dieser Beziehung in Abb. 7.7(c) zeigt, dass bei jedem Winkel 𝜃 nur eine Reihe diskreter Frequenzen durchgelassen wird. Umgekehrt wird eine Welle der Frequenz 𝜈 nur bei einer diskreten Reihe von Winkeln durchgelassen, sodass ein einfallender Kegel aus breitbandigem (weißem) Licht eine Reihe konzentrischer Ringe ähnlich einem Regenbogen erzeugt, wie Abb. 7.7(b) zeigt. Für einfallendes Licht, dessen spektrale Breite kleiner ist als der freie Spektralbereich 𝜈F , entspricht jede Frequenzkomponente genau einem Winkel, sodass das Etalon als Spektralanalysator verwendet werden kann. Beispiel 7-6: Eine dielektrische Platte als Strahlteiler
Die Transmission einer dielektrischen Platte der Dicke d mit dem Brechungsindex 𝑛2 in einem Medium mit dem Brechungsindex 𝑛1 ist in Gl. (7.24) gegeben. Wenn die Welle unter einem Winkel 𝜃1 einfällt, gilt für TE-Polarisation wie in Beispiel 7-3 ˜ = 𝑛2 𝑘0 d cos 𝜃2 𝑛˜1 = 𝑛1 cos 𝜃1 , 𝑛˜2 = 𝑛2 cos 𝜃2 und 𝜑 mit sin 𝜃2 = (𝑛1 ∕𝑛2 ) sin 𝜃1 . Dieser Ausdruck ist mit Gl. (7.30) für das Fabry-Pérot-Etalon identisch, wenn 𝑛1 𝑛˜2 ∕(˜ 𝑛1 + 𝑛˜2 ) und r1 r2 = (˜ 𝑛1 − 𝑛˜2 )2 ∕(˜ 𝑛1 + wir t1 t2 = 4˜ 𝑛˜2 )2 setzen. Daraus folgt, dass die Ausdrücke für die Intensitätstransmission des Spiegeletalons, Gln. (7.32) und (7.36), auch für die dielektrische Platte gelten. Mithilfe von Gl. (7.34) erhalten wir für die Finesse der Platte 𝑛22 − 𝑛˜12 | π |˜ ℱ= . (7.40) 4 𝑛˜1 𝑛˜2
Für Plattenetalons erhält man normalerweise keine großen Werte von ℱ. Für 𝑛1 = 1.5 (den Brechungsindex von SiO2 ) und 𝑛2 = 3.5 (den Brechungsindex von Si) ist für einen Einfallswinkel von 45◦ z. B. ℱ = 1.89. Wie Abb. 7.8 zeigt, zeigt die Frequenzabhängigkeit von 𝒯 und ℛ in diesem Fall nicht die scharfen Peaks wie in Etalons mit hochreflektierenden Spiegeln (Abb. 7.6). Um höhere Werte von ℱ zu erhalten, müssen die Oberflächen der Platte beschichtet werden, um die innere Reflexion zu erhöhen. Die dielektrische Platte kann als Strahlteiler eingesetzt werden. Für eine Platte der Dicke d = 1 mm entspricht der Bereich 𝜑 ˜ = 𝑛2 𝑘0 d cos 𝜃2 = π zwischen zwei aufeinander folgenden Peaks der Transmission einer Frequenz von ≈ 45 GHz. Wie Abb. 7.8 zeigt, verlaufen die Transmission und die Reflexion in der Nähe der Mitte dieses Intervalls einigermaßen flach. Da Strahlteiler routinemäßig in Interferometern genutzt werden, ist es wichtig, sich des Zusammenhangs zwischen den Phasen der reflektieren und transmittierten Wellen bewusst zu sein. Wie die Abbildung zeigt, beträgt die Phasenverschiebung zwischen den reflektierten und den durchgelassenen Strahlen immer ±π∕2, wobei das Vorzeichen an den Maxima der Transmission wechselt.
7.1.3
Das Bragggitter
Das Bragggitter wurde in Übung 2-11 als Anordnung von teilreflektierenden parallelen ebenen Spiegeln in gleichen Abständen eingeführt. Eine solche Struktur besitzt eine Winkel- und Frequenzselektivität, die in vielen Anwendungen nützlich ist. In diesem Abschnitt verallgemeinern wir die Definition des Bragggitters, sodass sie auch eine Anordnung von 𝑁 äquidistanten identischen Mehrschichtsegmenten umfasst, und entwickeln eine
7.1 Optik von dielektrischen Schichtmedien
1
n1
(b)
θ1
0
n2
n1 (a)
(1–q)π
(c)
(1+q)π ~
qπ
arg{ / }
π/2 0
~
–π/2
Abb. 7.8 (a) Eine dielektrische Platte als Strahlteiler. (b) Abhängigkeit des Intensitätstransmissionsgrads 𝒯 und -reflexionsgrads ℛ einer Platte mit dem Brechungsindex n2 = 3.5 (dem Brechungsindex von Si) in einem Medium mit dem Brechungsindex n1 = 1.5 (dem Brechungsindex von SiO2 )
von der Phase 𝜑 ˜ = n2 k0 d cos 𝜃1 für einen Einfallswinkel 𝜃1 = 45◦ . Peaks der Transmission und Minima der Reflexion erscheinen für 𝜑 ˜ = qπ für ganze Zahlen q. (c) Die Phasenverschiebung zwischen den reflektierten und transmittierten ˜ = qπ wechselt das Vorzeichen. Wellen beträgt ±π∕2; bei 𝜑
Theorie für die Lichtreflexion auf der Grundlage der Matrizen-Wellenoptik. Zu den auf dieser Grundlage arbeitenden Bauelementen gehören u. a. verteilte Braggreflektoren (DBR, engl. distributed Bragg reflectors) und Faser-Bragggitter (FBG, engl. fiber Bragg gratings).
maximale Reflexion für 2𝑘𝛬 cos 𝜃 = 2𝑞π oder
Eine vereinfachte Theorie
Der Reflexionsgrad eines Bragggitters wurde in Übung 2-11 unter zwei Annahmen bestimmt: (i) die Spiegel sind schwach reflektierend, sodass die einfallende Welle bei ihrer Ausbreitung nicht abgeschwächt wird, und (ii) sekundäre Reflexionen (d. h. Reflexionen der reflektierten Wellen) sind vernachlässigbar. In dieser Näherung hängt der Reflexionsgrad ℛ𝑁 eines Gitters aus 𝑁 Spiegeln mit dem Reflexionsgrad 𝑅 eines einzelnen Spiegels durch 2) ℛ𝑁 =
2
sin 𝜑
𝑅
𝜈ℬ 𝜔ℬ 𝜆 =𝑞 =𝑞 𝜔 𝜈 2𝛬
(7.41)
zusammen. Wie in Abschnitt 2.5.2 beschrieben bezeich2 2 net der Faktor sin 𝑁𝜑∕ sin 𝜑 die Intensität der Summe von 𝑁 Zeigern der Amplitude eins und der Phasendifferenz 2𝜑. Diese Funktion erreicht den Maximalwert 𝑁 2 , wenn die Braggbedingung erfüllt ist, d. h. wenn 2𝜑 gleich 𝑞2π mit 𝑞 = 0, 1, 2, … ist. Neben diesen Werten fällt die Kurve schnell ab; ihre Breite ist umgekehrt proportional zu 𝑁. In diesem vereinfachten Modell ist die Intensität der reflektierten Gesamtwelle höchstens um einen Faktor 𝑁 2 größer als die Intensität der von einem einzelnen Segment reflektierten Welle. Für ein Bragggitter aus teilreflektierenden Spiegeln in Abständen von 𝛬 beträgt die Phase für einen Umlauf 2𝜑 = 2𝑘𝛬 cos 𝜃, wenn 𝜃 der Einfallswinkel ist. Daher tritt 2) In Übung 2-11 bezeichnete 𝜑 die Phase zwischen sukzessiven Zeigern, während diese Phase hier 2𝜑 ist, da es sich um die Phase für einen vollständigen Umlauf durch das System handelt.
(7.42)
ein, wobei 𝑐 π𝑐 𝜈ℬ = , 𝜔ℬ = (7.43) 2𝛬 𝛬 die Braggfrequenz ist. Bei senkrechtem Einfall (𝜃 = 0◦ ) tritt maximale Reflexion bei ganzzahligen Vielfachen der Braggfrequenz ein, d. h. 𝜈 = 𝑞𝜈ℬ . Bei Frequenzen 𝜈 < 𝜈ℬ kann die Braggbedingung für keinen Winkel erfüllt sein. Bei Frequenzen 𝜈ℬ < 𝜈 < 2𝜈ℬ ist die Braggbedingung für einen Winkel 𝜃 = cos−1 (𝜆∕2𝛬) = cos−1 (𝜈ℬ ∕𝜈) erfüllt. Das Komplement dieses Winkels, 𝜃ℬ = π∕2 − 𝜃, ist der Braggwinkel [siehe Gl. (2.58) und Abb. 2.29], −1
𝜃ℬ = sin (𝜆∕2𝛬) .
2
sin 𝑁𝜑
cos 𝜃 = 𝑞
(7.44)
Bei Frequenzen 𝜈 ≥ 2𝜈ℬ ist die Braggbedingung für mehr als einen Winkel erfüllt. Abbildung 7.9 zeigt die spektrale und Winkelabhängigkeit von Reflexionen an einem Bragggitter gemäß der hier präsentierten vereinfachten Theorie. Eine Matrixtheorie
Wir verwenden jetzt den im vorherigen Abschnitt eingeführten Matrixansatz, um eine exakte Theorie der Braggreflexion zu entwickeln, die vielfache Transmissionen und Reflexionen sowie Löschung der einfallenden Welle umfasst. Es stellt sich heraus, dass die kooperativen Effekte der Reflexionen und der Reflexionen von Reflexionen zu einer Verstärkung der reflektierten Gesamtwelle sowie zu einem Phänomen führen können, bei dem Totalreflexion nicht nur für einzelne Frequenzen vorkommt, die Vielfache von 𝜈ℬ ∕ cos 𝜃 sind, sondern für ausgedehnte spektrale Bänder um diese Frequenzen!
195
196
7 Optik photonischer Kristalle
θ
90°
Λ
80° 70°
z
θ
60°
Abb. 7.9 Frequenzen 𝜈 und Winkel 𝜃 , für die die Braggbedingung erfüllt ist. Für 𝜈 = 1.5 𝜈ℬ (gestrichelte Linie) ist z. B. 𝜃 = 48.2◦ . Das entspricht einem Braggwinkel 𝜃ℬ = 41.8◦ (gemessen von der Gitterebene).
50° 40° 30° 20° 10° 0°
0
1
2
3
4
0
0
1
2
5
ν/ν
0
0
N–1
N
Wir betrachten ein Gitter aus einem Stapel von 𝑁 beliebigen identischen Segmenten (Abb. 7.10), von denen jedes durch eine unimodulare Wellentransfermatrix M0 beschrieben wird, die die Erhaltungsbeziehungen für ein verlustfreies reziprokes System erfüllt, ⎡ 1∕t∗
r∕t ⎤ (7.45) ⎥, r ∕t 1∕t ⎦ ⎣ wobei t und r die komplexe Amplitudentransmission und -reflexion sind, die die Bedingungen aus Gl. (7.17) erfüllen, und 𝒯 = |t|2 und ℛ = |r|2 die entsprechende Intensitätstransmission und -reflexion bezeichnen. Nach Gl. (7.4) ist die Wellentransfermatrix M für 𝑁 𝑁 Segmente einfach das Produkt M = M0 . Da M0 unimodular ist, d. h. det M0 = 1 gilt, ist M0 = ⎢
∗
∗
𝑁
M0 = 𝛹𝑁 M0 − 𝜓𝑁−1 I ,
Abb. 7.10 Bragggitter aus N Segmenten, von denen jedes durch eine Matrix M0 beschrieben wird.
(7.46)
geschrieben werden, wobei t𝑁 und r𝑁 die 𝑁-SegmentAmplitudentransmission bzw. -reflexion sind. Wenn wir die Gln. (7.45) und (7.49) in Gl. (7.46) einsetzen und die Diagonal- und Nichtdiagonalelemente der Matrizen auf beiden Seiten der Gleichung vergleichen, finden wir 1 1 = 𝛹𝑁 − 𝜓𝑛−1 , t𝑁 t
(7.50)
r𝑁 r = 𝛹𝑁 . t𝑁 t
(7.51)
Diese zwei Gleichungen definieren t𝑁 und r𝑁 durch t und r. Die Intensitätstransmission 𝒯𝑁 = |t𝑁 |2 erhalten wir, indem wir das Betragsquadrat von Gl. (7.51) nehmen und die Beziehung ℛ = 1 − 𝒯 verwenden, 𝒯𝑁 =
wobei sin 𝑁𝛷 , sin 𝛷 cos 𝛷 = Re{1∕t} 𝛹𝑁 =
(7.47) (7.48)
und I die Einheitsmatrix ist. Gleichung (7.46) kann durch Induktion bewiesen werden (d. h. es kann gezeigt werden, dass diese Beziehung für 𝑁 Segmente gilt, sofern sie für 𝑁 − 1 Segmente gilt; das kann durch direktes Einsetzen und Verwenden von trigonometrischen Identitäten erreicht werden). Da das 𝑁-Segment-System auch verlustfrei und symmetrisch ist, kann seine Matrix in der Form 𝑁
⎡ 1∕t∗𝑁
M0 = ⎢
r∗ ∕t∗ ⎣ 𝑁 𝑛
r𝑁 ∕t𝑁 ⎤ ⎥ 1∕t𝑁 ⎦
(7.49)
𝒯 𝒯+
𝛹𝑁2 (1
− 𝒯)
.
(7.52)
Daraus folgt, dass der Intensitätsreflexionsgrad ℛ𝑁 = 1 − 𝒯𝑁 durch ℛ𝑁 =
𝛹𝑁2 ℛ 1 − ℛ + 𝛹𝑁2 ℛ
gegeben ist.
(7.53)
7.1 Optik von dielektrischen Schichtmedien
Zusammenfassung
Der Reflexionsgrad ℛ𝑁 eines Mediums aus 𝑁 identischen Segmenten hängt mit den Reflexionsgraden ℛ der einzelnen Segmente durch die nichtlineare Beziehung Gl. (7.53) zusammen. Sie enthält einen Faktor 𝛹𝑁 , der sich aus den Interferenzeffekten zwischen den kollektiven Reflexionen an den 𝑁 Segmenten des Gitters ergibt. 𝛹𝑁 ist durch Gl. (7.47) definiert und hängt von der Zahl 𝑁 der Segmente und einem Parameter 𝛷 ab, der durch Gl. (7.48) mit der komplexen Amplitudentransmission der einzelnen Segmente zusammenhängt. Der durch Gl. (7.53) beschriebene Zusammenhang zwischen ℛ𝑁 und ℛ nimmt in bestimmten Grenzfällen eine einfachere Form an. Wenn der Reflexionsgrad der einzelnen Segmente sehr klein ist, d. h. ℛ ≪ 1, und 𝛹𝑁2 nicht zu groß ist, sodass 𝛹𝑁2 ℛ ≪ 1 gilt, kann Gl. (7.53) näherungsweise als 2
ℛ𝑁 ≈ 𝛹𝑁2 ℛ =
sin 𝑁𝛷
ℛ (7.54) 2 sin 𝛷 geschrieben werden. Dieser Ausdruck ähnelt der Näherung Gl. (7.41), wobei 𝛷 die Rolle der Phase 𝜑 übernimmt. Im entgegengesetzten Grenzfall 𝛹𝑁2 ≫ 1 ist der Reflexionsgrad ℛ𝑁 ≈ 𝛹𝑁2 ℛ∕(1 + 𝛹𝑁2 ℛ). Diese nichtlineare Beziehung zwischen ℛ𝑁 und ℛ zeigt Sättigung und ist für Systeme mit Rückkopplung typisch, die sich in diesem Fall aus vielfachen inneren Reflexionen an den Grenzflächen der Segmente ergibt. Wenn schließlich 𝛹𝑁2 ℛ ≫ 1 ist, dann nähert sich ℛ𝑁 seinem maximalen Wert von eins, sodass das 𝑁-Segment-Bauelement als idealer Spiegel wirkt, obwohl jedes einzelne Segment nur teilreflektierend ist. Ein großer Interferenzfaktor 𝛹𝑁 beschleunigt den Anstieg von ℛ𝑁 auf eins mit steigendem ℛ. Der Interferenzfaktor 𝛹𝑁 , der über Gl. (7.47) von 𝛷 = cos−1 (Re{1∕t}) abhängt, zeigt zwei unterschiedliche Bereiche: (i) einen normalen Bereich, in dem 𝛷 reell ist und das Gitter partielle Reflexion/Transmission zeigt (wozu auch Nullreflexion bzw. vollständige Transmission gehört) und (ii) einen anomalen Bereich, in dem 𝛷 komplex ist und 𝛹𝑁 extrem groß wird, entsprechend Totalreflexion. Bereich der Teil- und Nullreflexion
Dieser Bereich wird durch die Bedingung | Re{1∕t}| ≤ 1 definiert, die sicherstellt, dass 𝛷 = cos−1 (Re{1∕t}) reell ist. In diesem Fall hängt ℛ𝑁 nach den Gln. (7.47) und (7.53) von ℛ und 𝛹𝑁 ab. Maximale Reflexion tritt ein, wenn 𝛹𝑁 seinen maximalen Wert 𝑁 annimmt. In diesem Fall ist ℛ𝑁 = 𝑁 2 ℛ∕(1 − ℛ + 𝑁 2 ℛ). Daher kann
ℛ𝑁 nicht genau eins sein, außer wenn exakt ℛ = 1 gilt. Für 𝑁 = 10 und ℛ = 0.5 ist der maximale Wert von ℛ𝑁 z. B. ≈ 0.99. Nullreflexion bzw. vollständige Transmission ist selbst dann möglich, wenn der Reflexionsgrad 𝑅 der einzelnen Segmente deutlich über null liegt. Das ist der Fall, wenn 𝛹𝑁 = 0 ist, d. h. für sin 𝑁𝛷 = 0 oder 𝛷 = 𝑞π∕𝑁 mit 𝑞 = 0, 1, … , 𝑁 − 1. Die 𝑁 Frequenzen, für die vollständige Transparenz eintritt, sind die Resonanzfrequenzen des Gitters. Diese Erscheinung stellt eine Art von Tunneleffekt durch die individuell reflektierenden Segmente dar. Bereich der Totalreflexion
In diesem Bereich ist | Re{1∕t}| = | cos 𝛷| > 1, sodass 𝛷 eine komplexe Variable 𝛷 = 𝛷R + i𝛷I ist. Wir verwenden die Identität cos(𝛷R + i𝛷I ) = cos 𝛷R cosh 𝛷I − i sin 𝛷R sinh 𝛷I und setzen die Real- und Imaginärteile auf beiden Seiten von Gl. (7.48) gleich; so erhalten wir sin 𝛷R = 0, sodass 𝛷R = 𝑚π ist und cos 𝛷R = +1 oder −1 für gerade bzw. ungerade ganze Zahlen 𝑚. Daraus folgt cosh 𝛷I = | Re{1∕t}| .
(7.55)
Der Faktor 𝛹𝑁 = sin 𝑁𝛷∕ sin 𝛷 wird dann 𝛹𝑁 = ±
sinh 𝑁𝛷I , sinh 𝛷I
(7.56)
wobei ± das Vorzeichen des Faktors cos(𝑁𝑚π)∕ cos(𝑚π) ist. Da sinh(⋅) für große 𝑁 exponentiell mit 𝑁 ansteigt, kann |𝛹𝑁 | viel größer als 𝑁 werden. In diesem Fall gilt nach Gl. (7.53) ℛ𝑁 ≈ 1 und das Gitter wirkt als idealer Reflektor. Die Vorwärtswellen werden evaneszent und dringen wie bei der inneren Totalreflexion nicht in das Schichtmedium ein. Da 𝛷 von t und dieses wiederum von der Frequenz 𝜈 abhängt, entsprechen die beiden Bereiche unterschiedlichen spektralen Bändern, wie die folgenden Beispiele zeigen. Die spektralen Bereiche im Bereich der Totalreflexion werden Stoppbänder genannt, da der Lichtdurchgang in ihnen fast vollständig blockiert wird. Der andere Bereich entspricht den Durchlassbändern. Vollständige Transmission (Nullreflexion) tritt bei spezifischen Resonanzfrequenzen innerhalb der Durchlassbänder ein. Beispiel 7-7: Stapel teilreflektierender Spiegel
Wir betrachten ein Gitter aus einem Stapel von 𝑁 identischen teilreflektierenden Spiegeln (Strahlteilern) in Abständen von 𝛬 in einem homogenen Medium mit dem Brechungsindex 𝑛, wie in Abb. 7.11(a) gezeigt. Ein einzelnes Segment umfasst eine Entfernung 𝛬 in dem homogenen Medium gefolgt von einem teilreflek-
197
198
7 Optik photonischer Kristalle
tierenden Spiegel mit dem Amplitudentransmissionsgrad t und dem Amplitudenreflexionsgrad r. Die Wellentransfermatrix M0 für dieses Segment ergibt sich durch Multiplikation der Matrix aus Gl. (7.20) mit der Matrix aus Gl. (7.6), M0 =
1 ⎡ e−i𝜑 ⎢ |t| −i|r|e−i𝜑 ⎣
i|r|ei𝜑 ⎤ ⎥, ei𝜑 ⎦
𝜑 = 𝑛𝑘0 𝛬 = π𝜈∕𝜈ℬ , (7.57)
wobei 𝜈ℬ = 𝑐∕2𝛬 die Braggfrequenz ist. Das gibt t = |t|ei𝜑 und daher 1 cos 𝜑 für | cos 𝜑| ≤ |t| , |t| 1 | cos 𝜑| für | cos 𝜑| > |t| . cosh 𝛷I = |t| cos 𝛷 =
(7.58) (7.59)
Die Beziehungen zwischen 𝛷 und 𝜑 sowie zwischen 𝛷I und 𝜑 sind nichtlinear und ungewöhnlich, wie Abb. 7.11(b) zeigt. Die entsprechende Abhängigkeit des Intensitätsreflexionsgrads ℛ𝑁 von 𝜑 ist in Abb. 7.11(c) gezeigt. Im normalen Bereich (schattierte Gebiete) ist 𝛷 reell und der Reflexionsgrad zeigt vielfache Peaks mit Nullstellen dazwischen. Keiner der Peaks nähert sich eins, obwohl 𝛹𝑁 einen maximalen Wert 𝑁 = 10 erreicht. Im Bereich der Totalreflexion (unschattierte Gebiete), wo 𝛷 komplex ist, ist die Situation eine ganz andere. Für |t|2 = 0.5 erreicht der Faktor 𝛹𝑁 im Zentrum des Bands (𝜑 = π) einen Wert ≈ 3000. Diese Gebiete sind Bereiche von 𝜑, für die Totalreflexion (ℛ𝑁 ≈ 1) eintritt. Da 𝜑 proportional zur Frequenz 𝜈 ist, stellt Abb. 7.11(c) eigentlich den spektralen Reflexionsgrad dar, und die unschattierten Gebiete entsprechen den Stoppbändern.
Beispiel 7-8: Dielektrisches Bragggitter
Ein Gitter besteht aus 𝑁 identischen dielektrischen Schichten der Dicke d 2 mit dem Brechungsindex 𝑛2 in Abständen d 1 in einem Medium mit dem Brechungsindex 𝑛1 , wie Abb. 7.12 zeigt. Dieses Mehrsegmentsystem ist ein Stapel aus 𝑁 identischen Doppelschichten, jede von der in Beispiel 7-3 beschriebenen Art. Das Element A = 1∕t∗ der Wellentransfermatrix M0 ist durch Gl. (7.22) gegeben, (𝑛 + 𝑛2 ) 1 Re { } = 1 cos(𝜑1 + 𝜑2 ) t 4𝑛1 𝑛2 (𝑛 − 𝑛1 )2 − 2 cos(𝜑1 − 𝜑2 ) , 4𝑛1 𝑛2 2
(7.60)
wobei 𝜑1 = 𝑛1 𝑘0 d 1 und 𝜑2 = 𝑛2 𝑘0 d 2 die durch die beiden Schichten eines Segments eingeführten Pha-
sen sind. Dieses Ergebnis kann in Verbindung mit den Gln. (7.47), (7.48), (7.53), (7.34) und (7.56) verwendet werden, um den Reflexionsgrad des Gitters zu bestimmen. Die spektrale Abhängigkeit des Reflexionsgrads kann als Funktion von 𝜈 berechnet werden, wenn wir beachten, dass 𝜑1 + 𝜑2 = 𝑘0 (𝑛1 d 1 + 𝑛2 d 2 ) = π𝜈∕𝜈ℬ ist, wobei 𝜈ℬ = (𝑐0 ∕𝑛)∕2𝜆 ̄ und 𝑛̄ = (𝑛1 d 1 + 𝑛2 d 2 )∕𝜆 der mittlere Brechungsindex ist. Die Braggfrequenz 𝜈ℬ ist die Frequenz, bei der die Phase eines einzelnen Segments für einen vollen Umlauf gleich 2𝑘0 (𝑛1 d 1 + 𝑛2 d 2 ) = 2π ist. Die Phasendifferenz 𝜑1 − 𝜑2 = 𝜁π𝜈∕𝜈ℬ mit 𝜁 = (𝑛1 d 1 − 𝑛2 d 2 )∕(𝑛1 d 1 + 𝑛2 d 2 ) ist ebenfalls proportional zur Frequenz. Abbildung 7.12(b) zeigt ein Beispiel für den spektralen Reflexionsgrad als Funktion von 𝜈.
Beispiel 7-9: Dielektrisches Bragggitter: Schiefer Einfall
Die Ergebnisse aus Beispiel 7-8 können auf schief einfallende Wellen mit dem Einfallswinkel 𝜃1 in Medium 1 entsprechend einem Winkel 𝜃2 in Schicht 2 verallgemeinert werden, wobei 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 gilt. In diesem Fall wird Gl. (7.60) (˜ 𝑛 + 𝑛˜2 )2 1 cos(˜ 𝜑1 + 𝜑 ˜2 ) Re { } = 1 t 4˜ 𝑛1 𝑛˜2 (˜ 𝑛 − 𝑛˜1 )2 − 2 cos(˜ 𝜑1 − 𝜑 ˜2 ) , 4˜ 𝑛1 𝑛˜2
(7.61)
˜2 = 𝑛2 𝑘0 d 2 cos 𝜃2 ist; wobei 𝜑 ˜1 = 𝑛1 𝑘0 d 1 cos 𝜃1 und 𝜑 Für TE-Polarisation gilt 𝑛˜1 = 𝑛1 cos 𝜃1 und 𝑛˜2 = 𝑛2 cos 𝜃2 ; für TM-Polarisation ist 𝑛˜1 = 𝑛1 sec 𝜃1 und 𝑛˜2 = 𝑛2 sec 𝜃2 . Diese Beziehung kann zur Berechnung des spektralen Reflexionsgrads für beliebige Einfallswinkel verwendet werden. Abbildung 7.13 zeigt die Abhängigkeit des Leistungsreflexionsgrads ℛ𝑁 von der Frequenz und dem Einfallswinkel sowohl für TEals auch für TM-Polarisation für ein Hochkontrastgitter. Die Winkelbereiche, über man einen Reflexionsgrad von eins erhält, werden mit der steigendem Kontrastverhältnis 𝑛2 ∕𝑛1 des Brechungsindex größer.
Bragggitter in einem nicht angepassten Medium
In unserer vorherigen Analyse hatten wir angenommen, dass das Bragggitter aus 𝑁 identischen Segmenten besteht. Wenn jedes Segment aus dielektrischen Mehrfachschichten besteht, erfordert dies, dass das Gitter sich in einem Medium befindet, dessen Brechungsindex gleich dem der Vorderschicht ist, sodass das einfallende Licht keine zusätzliche Reflexion an der ersten Grenzfläche erfährt und an der letzten Grenzfläche reflektiert
7.1 Optik von dielektrischen Schichtmedien
π
Λ
1
(b)
N
3
0
(a)
π
0
n1
1
0.5
0 N
2
ν
2ν
Sperrband 1
Λ
1 2
Sperrband 3
ν
0
1
φ = πν/ν
Abb. 7.11 (a) Bragggitter aus N = 10 identischen Spiegeln mit einem Leistungsreflexionsgrad |r|2 = 0.5. (b) Abhängigkeit von 𝛷 von der Phasenverzögerung 𝜑 = nk0 𝛬 zwischen den Spiegeln. In den schattierten Gebieten ist 𝛷 komplex und sein Imaginärteil 𝛷I wird durch die gestrichelten Kurven bezeichnet. (c) Der Reflexionsgrad ℛ als Funktion der Frequenz (in Einheiten der Braggfrequenz 𝜈ℬ = c∕2𝛬). Innerhalb der Stoppbänder ist der Reflexionsgrad annähernd eins.
ν
0
Abb. 7.12 Leistungsreflexionsgrad als Funktion der Frequenz für ein dielektrisches Bragggitter aus N = 10 Segmenten, die jeweils aus zwei Schichten der Dicke d 1 = d 2 mit den Brechungsindizes n1 = 1.5 und n2 = 3.5 bestehen. Das Gitter
Sperrband 2
0.5
0
n1 n2
2π
3
1
(c)
n1
ΦI
Sperrband 2
2
Φ
2
ΦI
Sperrband 1
1
Φ
Φ
2ν
ν
3ν
befindet sich in einem Medium mit demselben Brechungsindex n1 . In den schattierten Stoppbändern um Vielfache von 𝜈ℬ = c∕2𝛬, wobei c = c0 ∕n̄ und n̄ der mittlere Brechungsindex ist, ist der Reflexionsgrad annähernd eins.
1 0°
0.5 0 1
TM
0.5 0 1
30° TE
0.5 0 1
TM
0.5 0 1
60° TE
0.5 0 1
TM
0.5 0 1
70° TE
0.5 0
0
ν
2ν
3ν
ν
Abb. 7.13 Spektrale Abhängigkeit des Reflexionsgrads ℛ für das in Abb. 7.12 gezeigte dielektrische Bragggitter aus zehn Segmenten für mehrere Einfallswinkel 𝜃1 und für TE-und TM-Polarisation.
199
200
7 Optik photonischer Kristalle
wird, als ob es in eine weitere Schicht des Gitters einträte. Das in Beispiel 7-8 beschriebene Bauelement erfüllt diese Bedingung. In den meisten Anwendungen befindet sich das Gitter in einem nicht in dieser Weise angepassten Medium wie beispielsweise Luft, sodass Grenzflächeneffekte berücksichtigt werden müssen. Dazu kann man die Wellentransfermatrix M des zusammengesetzten Systems einschließlich aller Grenzflächen aufschreiben und daraus mithilfe der Transformationsbeziehung die entsprechende Streumatrix S berechnen. Der Reflexionsgrad des zusammengesetzten Systems kann dann leicht aus S bestimmt werden. 𝑁 Wenn M0 die Wellentransfermatrix eines Gitters aus 𝑁 Segmenten in einem an die Vorderschicht angepassten Medium ist, dann nimmt die gesamte Wellentransferfunktion die Form M=
𝑛−1 MA M0 ME
,
(7.62)
an, wobei ME die Wellentransfermatrix der Grenzfläche am Eingang ist und MA die Wellentransfermatrix am Ausgang des 𝑁-ten Segments mit einer Grenzfläche in das nicht angepasste Medium. Beispiel 7-10: Reflexionsgrad eines dielektrischen Bragggitters in einem nicht angepassten Medium
Ein Bragggitter aus 𝑁 Segmenten in einem Medium mit dem Brechungsindex 𝑛0 besteht aus abwechselnden Schichten mit den Brechungsindizes 𝑛1 und 𝑛2 und den Dicken d 1 und d 2 . Wir wollen den Reflexionsgrad für eine Welle bestimmen, deren Einfallswinkel im Außenmedium 𝜃0 beträgt, entsprechend Winkeln 𝜃1 und 𝜃2 in der ersten und zweiten Schicht gemäß dem snelliusschen Gesetz (𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 ). In diesem Fall kann Gl. (7.62) mit den folgenden Wellentransfermatrizen verwendet werden: (i) ME beschreibt eine Grenzfläche zwischen Medien mit den Brechungsindizes 𝑛0 und 𝑛1 wie in Beispiel 7-3; (ii) M0 bezeichnet ein einzelnes Segment des Gitters wie in Beispiel 7-3; (iii) MA bezeichnet die Ausbreitung über eine Entfernung d 1 in einem Medium mit dem Brechungsindex 𝑛1 gefolgt von einer Platte der Dicke d 2 und dem Brechungsindex 𝑛2 mit einer Grenzfläche zu einem Medium mit dem Brechungsindex 𝑛0 . Wenn wir die M-Matrix bestimmt haben, verwenden wir die Transformationsbeziehung Gl. (7.8), um die zugehörige Streumatrix S zu berechnen. Der gesamte Reflexionsgrad ist das Element 𝑟12 in Gl. (7.6). Das Ergebnis der ausführlichen Rechnung ist in Abb. 7.14 gezeigt.
7.2 Eindimensionale photonische Kristalle Eindimensionale photonische Kristalle sind dielektrische Strukturen, deren optische Eigenschaften sich in einer Richtung periodisch ändern, der sogenannten Achse der Periodizität, und in den dazu senkrechten Richtungen konstant sind. Diese Strukturen zeigen außergewöhnliche optische Eigenschaften, insbesondere dann, wenn ihre Periodizität von derselben Größenordnung wie die Wellenlänge der Strahlung ist. Wenn wir die Achse der Periodizität als 𝑧-Achse annehmen, dann sind optische Parameter wie die Permittivität 𝜀(𝑧) und die Impermeabilität η(𝑧) = 𝜀0 ∕𝜀(𝑧) periodische Funktionen von 𝑧 und es gilt η(𝑧 + 𝛬) = η(𝑧)
(7.63)
für alle 𝑧, wenn 𝛬 die Periode ist. Die Wellenausbreitung in solchen periodischen Medien kann studiert werden, indem man die verallgemeinerten Helmholtzgleichungen (7.2) für periodisches η(𝑧) löst. Für eine achsenparallele Welle, die sich entlang der 𝑧-Achse ausbreitet und in 𝑥-Richtung polarisiert ist, sind die Komponenten 𝐸𝑥 und 𝐻𝑦 der elektrischen und magnetischen Felder Funktionen von 𝑧, aber unabhängig von 𝑥 und 𝑦, sodass Gl. (7.2) nun −
d d 𝜔2 [η(𝑧) ] 𝐻𝑦 = 2 𝐻𝑦 d𝑧 d𝑧 𝑐0
(7.64)
lautet. Für eine schief einfallende Welle, d. h. eine Welle, die sich in einer beliebigen Richtung in der 𝑥𝑧-Ebene ausbreitet, hat die verallgemeinerte Helmholtzgleichung eine komplexere Form. Für eine schief einfallende TMpolarisierte Welle zeigt das Magnetfeld beispielsweise in 𝑦-Richtung, und Gl. (7.2) ergibt {−
𝜕 𝜔2 𝜕 𝜕2 [η(𝑧) ] + η(𝑧) 2 } 𝐻𝑦 = 2 𝐻𝑦 . 𝜕𝑧 𝜕𝑧 𝜕𝑥 𝑐0
(7.65)
Sowohl Gl. (7.64) als auch Gl. (7.65) haben die Form eines Eigenwertproblems, aus dem die Moden 𝐻𝑦 (𝑥𝑧) bestimmt werden können. Bevor uns der Suche nach Lösungen dieser Eigenwertprobleme widmen, untersuchen wir zuerst die Bedingungen, denen die sich ausbreitenden Moden aufgrund der mit der Periodizität verbundenen Translationssymmetrie genügen müssen.
7.2 Eindimensionale photonische Kristalle 1 0.5 0 1
TE
ν / ν = 0.9
ν / ν =1
TE
0°
TE
TM
ν / ν = 0.97–1.18
TM
0 1
0
TM
TM
0.5
0.5
TE
ν / ν = 0.9
TE ν / ν = 1.2
TM
TE
10° 20° 30° 40° 50° 60° 70° 80° 90° 0° θ (a) Gitter in angepasstem Medium
ν / ν = 1.2
TM
10° 20° 30° 40° 50° 60° 70° 80° 90° θ (b) Gitter in Luft
Abb. 7.14 Leistungsreflexionsgrad für das Gitter aus Abb. 7.12 als Funktion des Einfallswinkels 𝜃 bei festen Frequenzen. (a) Das Gitter befindet sich in einem angepassten Medium (n = n1 ). (b) Das Gitter befindet sich in Luft
(n = 1). In Luft reflektiert das Gitter bei Frequenzen zwischen 0.97𝜈ℬ und 1.18𝜈ℬ bei allen Winkeln vollständig, sowohl für TE- als auch für TM-Polarisation.
7.2.1 Blochmoden
Diese Form erfüllt die Bedingung, dass eine Translation 𝛬 die Welle nur um einen Phasenfaktor exp(−iK 𝛬) verändert, da die periodische Funktion bei einer solchen Translation unverändert bleibt. Eine solche optische Welle heißt Blochmode, und der Parameter K , der die Mode und die zugehörige periodische Funktion 𝑝K (𝑧) charakterisiert, wird Blochwellenzahl genannt. Die Blochmode ist folglich eine ebene Welle exp(−iK 𝑧) mit der Ausbreitungskonstante K , moduliert mit einer periodischen Funktion 𝑝K (𝑧), die die Form einer stehenden Welle hat, wie Abb. 7.15(a) anhand ihres Realteils zeigt. Da eine periodische Funktion der Periode 𝛬 in eine Fourierreihe entwickelt, d. h. als Superposition von harmonischen Funktionen der Form exp(−i𝑚g𝑧) mit 𝑚 = 0, ±1, ±2, … und
Wir betrachten zuerst ein homogenes Medium, das invariant bezüglich einer beliebigen Translation des Koordinatensystems ist. Für dieses Medium ist eine optische Mode eine Welle, die durch solch eine Translation nicht verändert wird; sie wird nur mit einer Konstante der Größenordnung eins (einem Phasenfaktor) multipliziert. Die ebene Welle exp(−i𝑘𝑧) ist solch eine Mode, da sie bei einer Translation um eine Entfernung d zu exp[−i𝑘(𝑧 + d )] = exp(−i𝑘d ) exp(−i𝑘𝑧) wird. Der Phasenfaktor exp(−i𝑘d ) ist der Eigenwert der Translationsoperation, wie in Anhang C besprochen. Achsenparallele Blochmoden
Wir betrachten jetzt ein eindimensionales periodisches Medium, das invariant bezüglich einer Translation um die Entfernung 𝛬 entlang der Achse der Periodizität ist. Seine optischen Moden sind Wellen, die ihreForm bei einer solchen Translation beibehalten und sich höchstens um einen Phasenfaktor ändern. Wie in Anhang C erläutert müssen diese Moden die Form 𝑈(𝑧) = 𝑝K (𝑧) exp(−iK 𝑧)
(7.66)
x
z
haben, wobei 𝑈 eine beliebige der Feldkomponenten 𝐸𝑥 , 𝐸𝑦 , 𝐻𝑥 oder 𝐻𝑦 bezeichnet; K ist eine Konstante, und 𝑝K (𝑧) ist eine mit der Periode 𝛬 periodische Funktion.
g = 2π∕𝛬
(7.67)
geschrieben werden kann, ist die Blochwelle eine Superposition von ebenen Wellen mit den Ortsfrequenzen K + 𝑚 g. Die fundamentale Ortsfrequenz g der periodischen Struktur und ihre Obertöne 𝑚g, die zur Blochwellenzahl K addiert werden, bilden das räumliche Spektrum der Blochwelle, das in Abb. 7.15(b) gezeigt ist. Die durch das periodische Medium eingeführte Verschiebung der Ortsfrequenzen ist analog zu der (Doppler-) Verschiebung der zeitlichen Frequenzen bei der Reflexion an einem bewegten Objekt. ′ Zwei Moden mit den Blochwellenzahlen K und K = K + g sind identisch, da sie denselben Phasenfaktor ′ exp(−iK 𝛬) = exp(−iK 𝛬) exp(−i2π) = exp(−iK 𝛬) besitzen. Das ist daraus ersichtlich, dass der Faktor exp(−ig𝑧)
201
202
7 Optik photonischer Kristalle
Λ
stehende Welle
Abb. 7.15 (a) Eine Blochmode. (b) Ihr räumliches Spektrum.
sich ausbreitende Welle
z (a)
–g
+g Ortsfrequenz
(b)
selbst periodisch ist und mit der periodischen Funktion 𝑝K (𝑧) zusammengefasst werden kann. Um alle Moden vollständig anzugeben, müssen wir daher nur Werte von K in einem Ortsfrequenzintervall der Breite g = 2π∕𝛬 betrachten. Dazu betrachten wir normalerweise nur das Intervall [−g∕2, g∕2] = [−π∕𝛬, π∕𝛬], das als erste Brillouinzone bezeichnet wird. Schiefe Blochmoden
Schief einfallende optische Moden, die sich in beliebigen Winkeln in der 𝑥𝑧-Ebene ausbreiten, haben die Blochform 𝑈(𝑥, 𝑦, 𝑧) = 𝑝K (𝑧) exp(−iK 𝑧) exp(−i𝑘𝑥 𝑥) .
(7.68)
x
z
Die Homogenität des Mediums in 𝑥-Richtung erfordert, dass die 𝑥-Abhängigkeit der optischen Mode harmonisch ist, exp(−i𝑘𝑥 𝑥), liefert aber sonst keine Einschränkung für die transversale Komponente 𝑘𝑥 des Wellenvektors. An einem Ort mit dem Brechungsindex 𝑛 ist 𝑘𝑥 = 𝑛𝑘0 sin 𝜃, wobei 𝜃 der Neigungswinkel der Welle zur 𝑧-Achse ist. Wenn die Welle sich durch die verschiedenen Schichten des inhomogenen Mediums ausbreitet, ändert sich dieser Winkel, aber aufgrund des snelliusschen Gesetzes bleiben 𝑛 sin 𝜃 und 𝑘𝑥 unverändert. Achsennormale Blochmoden
Wenn der Einfallswinkel im dichtesten Medium größer ist als der kritische Winkel, breiten sich die Moden nicht entlang der Achse der Periodizität (𝑧-Richtung) aus. Stattdessen stehen sie senkrecht zur Achse und breiten sich in 𝑥-Richtung aus; ihre Blochform ergibt sich aus Gl. (7.68) mit K = 0, 𝑈(𝑥, 𝑦, 𝑧) = 𝑝0 (𝑧) exp(−i𝑘𝑥 𝑥) , x θk
z
(7.69)
wobei 𝑝0 (𝑧) eine periodische Funktion ist, die eine stehende Welle entlang der Achse der Periodizität beschreibt. Eigenwertprobleme, Dispersionsrelation und photonische Bandlücken
Nachdem wir nun die mathematische Form der Moden gefunden haben, die durch die Translationssymmetrie des periodischen Mediums gefordert wird, ist der nächste Schritt, das durch die verallgemeinerte Helmholtzgleichung beschriebene Eigenwertproblem zu lösen. Für eine Mode mit einer Blochwellenzahl K ergeben die Eigenwerte 𝜔2 ∕𝑐02 einen diskreten Satz von Frequenzen 𝜔. Diese Werte werden verwendet, um die 𝜔−K Dispersionsrelation zu konstruieren. Die Eigenfunktionen helfen uns, die periodischen Blochfunktionen 𝑝K (𝑧) für jeden der zu einem K gehörenden Werte 𝜔 zu bestimmen. Die Beziehung zwischen 𝜔 und K ist eine mehrdeutige periodische Funktion von K mit der Periode g, die fundamentale Ortsfrequenz der periodischen Struktur; sie wird häufig wie schematisch in Abb. 7.16(a) gezeigt für die Brillouinzone [−g∕2 < k ≤ g∕2] aufgetragen. Wenn sie als monoton zunehmende Funktion von k aufgetragen wird, erscheint sie als kontinuierliche Funktion mit diskreten Sprüngen bei K -Werten, die ganzzahlige Vielfache von g∕2 sind. Diese Diskontinuitäten entsprechen den photonischen Bandlücken – spektralen Bändern, die nicht von Dispersionslinien durchquert werden, sodass in ihnen keine Moden existieren. Die Ursache der Diskontinuitäten in der Dispersionsrelation liegt in der besonderen Symmetrie, die für k = g∕2 zu Vorschein kommt, d. h. wenn die Periode der sich ausbreitenden Welle gleich der halben Periode des periodischen Mediums ist. Wir betrachten die zwei Moden mit k = ±g∕2 und den periodischen Blochfunktionen 𝑝K (𝑧) = 𝑝±g∕2 (𝑧). Da sich diese Moden mit derselben Wellenzahl, aber in entgegengesetzten Richtungen ausbreiten, d. h. umgekehrte Versionen des Mediums „sehen“, ist 𝑝−g∕2 (𝑧) = 𝑝g∕2 (−𝑧). In Wirklichkeit sind diese beiden Moden aber identisch, weil sich ihre Blochwellenzahlen um g unterscheiden. Es folgt also, dass es am Rand einer Brillouinzone zwei periodische Blochfunktionen gibt, die umgekehrte Versionen voneinander sind. Da das Medium innerhalb einer Elementarzelle in-
7.2 Eindimensionale photonische Kristalle
Λ n1 n2
(a)
Brillouinzone
ω
(b)
Abb. 7.16 (a) Die Dispersionsrelation ist eine mehrdeutige periodische Funktion mit der Periode g = 2π∕𝛬 und Diskontinuitäten bei k-Werten, die ganzzahlige Vielfache von g∕2 sind. (b) Blochwellen an den Punkten A und B am Rand der Brillouinzone für ein periodisches Medium aus alternierenden dielektrische Schichten mit n2 > n1 .
z
Bandlücke 2
B
B
z
Bandlücke 1
A – 12 g
0
1g 2
A z
g
homogen oder stückweise homogen ist, wechselwirken diese beiden Funktionen mit dem Medium unterschiedlich und haben daher verschiedene Eigenwerte, d. h. unterschiedliche Werte von 𝜔. Das erklärt die Diskontinuität, wenn die kontinuierliche 𝜔−K -Linie die Grenzfläche der Brillouinzone schneidet. Eine ähnliche Argumentation erklärt die Diskontinuitäten, die auftreten, wenn K gleich anderen ganzzahligen Vielfachen von g∕2 ist. Zum Verständnis bestimmter Eigenschaften dieser Eigenfunktionen ist das Variationsprinzip (siehe Anhang C) nützlich. Diesem Prinzip zufolge sind die Eigenfunktionen eines hermiteschen Operators orthogonale Verteilungen, die die Energie minimieren. Die zu dem linearen Operator ℒ in der Eigenwertgleichung (7.2) ge1 hörende Energie ist E 𝑣 = (H, ℒH)∕(H, H). Mithilfe der 2 maxwellschen Gleichungen kann gezeigt werden, dass (H, ℒH) = (H, ∇ × [η(r)∇ × H]) = ∫ |D(r)|2 ∕𝜀(r) dr ist, sodass eine Minimierung von E 𝑣 durch Verteilungen erreicht wird, in denen höhere Verschiebungsfelder D(r) an Orten mit niedrigen Werten von 1∕𝜀(r), liegen, d. h. mit größerem Brechungsindex. Wenn das periodische Medium beispielsweise wie in Abb. 7.16(b) aus zwei abwechselnd angeordneten dielektrischen Schichten besteht, dann konzentriert an einer Diskontinuität die Eigenfunktion mit der niedrigeren Frequenz ihr Verschiebungsfeld in der Schicht mit dem größeren Brechungsindex, wohingegen die Eigenfunktion mit der höheren Frequenz das Verschiebungsfeld in der Schicht mit dem niedrigeren Brechungsindex konzentriert. Das Problem ist nun, das zur Helmholtzgleichung gehörende Eigenwertproblem zu lösen. Es gibt hierfür zwei Ansätze: • Der erste Ansatz beruht darauf, die periodische Funktion η(𝑧) des Mediums und die periodische Funktion 𝑝K (𝑧) der Blochmode in Fourierreihen zu entwickeln und die Helmholtz-Differentialgleichung in einen Satz algebraischer Gleichungen in der Form eines Matrixeigenwertproblems umzuwandeln, die numerisch gelöst werden. Dieser Ansatz wird Fourieroptik-Ansatz genannt.
• Der zweite Ansatz ist auf (stückweise homogene) Schichtmedien mit ebenen Grenzflächen anwendbar. Anstatt die Helmholtzgleichung zu lösen, verwenden wir direkt die Ausbreitungs- und Reflexions-/ Brechungsgesetze an Grenzflächen, die aus den maxwellschen Gleichungen folgen. Dann benutzen wir die in Abschnitt 7.1.1 für Schichtmedien entwickelten und in Abschnitt 7.1.3 auf Bragggitter angewandten Matrizenmethoden. Dieser Matrizenoptik-Ansatz führt auf ein 2 × 2-Matrixeigenwertproblem, aus dem wir die Dispersionsrelation und die Blochmoden bestimmen können. Als Nächstes wollen wir den Matrizenoptik-Ansatz besprechen; der fourieroptische Ansatz wird das Thema von Abschnitt 7.2.3 sein.
7.2.2 Matrizenoptik periodischer Medien Ein eindimensionales periodisches Medium besteht aus identischen Segmenten, den Elementarzellen, die entlang einer Richtung (der 𝑧-Achse) in Abständen von 𝛬 periodisch wiederholt werden (Abb. 7.17). Jede Elementarzelle enthält eine Reihe von verlustfreien dielektrischen Schichten oder teilreflektierenden Spiegeln in einer bestimmten Reihenfolge, die ein reziprokes System bilden, das durch eine allgemeine unimodulare Wellentransfermatrix ⎡ 1∕t∗
r∕t ⎤ (7.70) ⎥ r ∕t 1∕t ⎣ ⎦ beschrieben wird, wobei t und r die komplexe Amplitudentransmission und -reflexion sind, die die Bedingungen aus Gl. (7.19) erfüllen, und 𝒯 = |t|2 und ℛ = M0 = ⎢
∗
∗
(+)
(+)
Um+1
Um 0
0
0 (–)
0
0
(–)
Um
Um+1
mΛ
(m+1)Λ
z
Abb. 7.17 Darstellung eines periodischen Mediums durch eine Wellentransfermatrix.
203
204
7 Optik photonischer Kristalle
|r|2 die entsprechende Intensitätstransmission und -reflexion. Das Medium ist ein Bragggitter wie das in Abschnitt 7.1.3 beschriebene mit einer unendlichen Zahl von Segmenten. Eine Welle, die sich durch das Medium ausbreitet, erfährt vielfache Transmissionen und Reflexionen, die sich an jeder Ebene zu einer Vorwärts- und einer Rückwärtswelle addieren. Wir verwenden nun die in Abschnitt 7.1.1 entwickelte Matrixmethode, um die Blochmoden zu bestimmen. (±) {𝑈𝑚 } seien die komplexen Amplituden der Vorwärtsund Rückwärtswellen an der Startposition 𝑧 = 𝑚𝛬 der Elementarzelle 𝑚. Wenn wir diese Amplituden kennen, können wir die Amplituden an anderen Orten innerhalb der Zelle durch direkte Anwendung der passenden Wellentransfermatrizen bestimmen, wie in Abschnitt 7.1 beschrieben. Wir richten daher unsere Aufmerksamkeit (±) auf die Dynamik der Amplituden {𝑈𝑚 }, die sich von einer Zelle zur nächsten ändern. Diese Dynamik wird durch die Rekursionsbeziehungen (+) (+) ⎡𝑈𝑚+1 ⎤ ⎡𝑈𝑚 ⎤ ⎢ (−) ⎥ = M0 ⎢ (−) ⎥ 𝑈 𝑈 ⎣ 𝑚+1 ⎦ ⎣ 𝑚 ⎦
(7.71)
beschrieben, mit deren Hilfe wir die Amplituden in einer speziellen Zelle bestimmen können, wenn wir die Amplituden in der vorhergehenden Zelle kennen. Eigenwertproblem und Blochmoden
Die Moden des periodischen Mediums sind per definitionem selbstreproduzierende Wellen, für die (+) (+) ⎤ ⎡𝑈𝑚 ⎤ ⎡𝑈𝑚+1 ⎢ (−) ⎥ = e−i𝛷 ⎢ (−) ⎥ , 𝑈 𝑈 ⎣ 𝑚 ⎦ ⎣ 𝑚+1 ⎦
𝑚 = 1, 2, …
(7.72)
gilt; nach Transmission über eine Entfernung 𝛬 (in diesem Fall eine Elementarzelle) sind die Beträge der Vorwärts- und Rückwärtswellen unverändert, und die Phasen sind um eine gemeinsame Phasenverschiebung 𝛷, die Blochphase verschoben. Die entsprechende Blochwellenzahl ist K = 𝛷∕𝜆; es gilt also 𝛷 = K𝛬 .
(7.73) (±)
Die Bestimmung der komplexen Amplituden 𝑈𝑚 und der Phase 𝛷 = K 𝛬, die die Bedingung der Selbstreproduktion aus Gl. (7.72) erfüllen, kann als Eigenwertproblem formuliert werden. Dazu verwenden wir Gl. (7.71) mit 𝑚 = 0, um Gl. (7.72) in der Form
(+)
Eigenwert, und der Vektor mit den Komponenten 𝑈0 (−) und 𝑈0 ist der Eigenvektor. Die Eigenwerte werden bestimmt, indem man die Determinante der Matrix M0 − e−i𝛷 I gleich null setzt. Da |t|2 + |r|2 = 1 ist, ergibt die Lösung der resultierenden 1 quadratischen Gleichung e−i𝛷 = (1∕t + 1∕t∗ ) ± i{1 − [ (1∕t + 1∕t∗ )]2 }1∕2 und damit 1
2
2
1 cos 𝛷 = Re { } . t
(7.75)
Gleichung (7.75) ist identisch mit Gl. (7.48) für das Bragggitter. Das ist nicht weiter überraschend, weil das betrachtete periodische Medium nichts anderes als ein ausgedehntes Bragggitter mit einer unendlichen Zahl von Segmenten ist. Da M0 eine 2 × 2-Matrix ist, besitzt sie zwei Eigenwerte. Folglich sind nur zwei der Lösungen von Gl. (7.75) unabhängig. Da die Funktion cos−1 (⋅) gerade ist, haben die beiden Lösungen innerhalb des Intervalls [−π, π] dieselben Beträge und entgegengesetzte Vorzeichen. Sie entsprechen Blochmoden, die sich vorwärts bzw. rückwärts ausbreiten. Andere Lösungen können wir erhalten, indem wir Vielfache von 2π addieren; sie sind nicht unabhängig, da sie für den Phasenfaktor e−i𝛷 irrelevant sind. Die zugehörigen Eigenvektoren M0 sind daher ⎤ ⎡𝑈0(+) ⎤ ⎡ r∕t , (7.76) ⎢ (−) ⎥ ∝ ⎢ −i𝛷 ∗⎥ 𝑈 e − 1∕t ⎦ ⎣ 0 ⎦ ⎣ wie man kontrollieren kann, indem man die Matrix M0 auf die rechte Seite von Gl. (7.76) anwendet; das Ergebnis ist bis auf eine Konstante wieder die rechte Seite von Gl. (7.76). Die zur Blochwelle gehörende periodische Funktion 𝑝K (𝑧) kann bestimmt werden, indem man die Ampli(+) (−) tuden 𝑈0 und 𝑈0 durch die Elementarzelle verfolgt. Wenn die erste Schicht in der Elementarzelle beispielsweise ein homogenes Medium mit dem Brechungsindex 𝑛1 und der Dicke d 1 ist, dann ist die Welle in einer Tiefe 𝑧 in dieser Schicht (+)
(−)
𝑝K (𝑧)e−iK𝑧 = 𝑈0 e−i𝑛1 𝑘0 𝑧 + 𝑈0 ei𝑛1 𝑘0 𝑧 ,
0 < 𝑧 < d1 . (7.77)
(7.74)
Wir verwenden die Gln. (7.76) und (7.73) und erhalten so aus Gl. (7.77) [ ( ) ] 𝑝K (𝑧) ∝ −re−i𝑛1 𝑘0 𝑧 + e−iK 𝛬 − 1 ei𝑛1 𝑘0 𝑧 eiK𝑧 , (7.78) 0 < 𝑧 < d1 .
zu schreiben. Das ist ein Eigenwertproblem für die 2 × 2-Matrix M0 der Elementarzelle. Der Faktor e−i𝛷 ist der
Die Wellen in Gl. (7.78) können weiter in die anschließenden Schichten innerhalb der Zelle verfolgt werden, indem man die passenden M-Matrizen verwendet.
⎡𝑈0(+) ⎤ ⎡𝑈0(+) ⎤ −i𝛷 = e ⎢ (−) ⎥ (−) ⎥ 𝑈 𝑈 ⎣ 0 ⎦ ⎣ 0 ⎦
M0 ⎢
7.2 Eindimensionale photonische Kristalle
Dispersionsrelation und photonische Bandstruktur
Die Dispersionsrelation ist eine Gleichung, die die Blochwellenzahl K und die Kreisfrequenz 𝜔 verknüpft. Der Vorläufer der Dispersionsrelation für das eindimensionale periodische Medium ist Gl. (7.75) für die Eigenwerte exp(−i𝜙) der Matrix der Elementarzelle. Die Phase 𝛷 = K 𝛬 ist proportional zu K , und t = t(𝜔) hängt mit 𝜔 über die Phasenverzögerung bei der Ausbreitung durch die Elementarzelle zusammen, sodass Gl. (7.75) in der Form K g
cos (2π ) = Re {
1 } t(𝜔)
(7.79)
die 𝜔−K -Dispersionsrelation ist. Hier ist g = 2π∕𝛬 die fundamentale Ortsfrequenz des periodischen Mediums. Die Funktion cos(2πk∕g) ist eine periodische Funktion von K mit der Periode g = 2π∕𝛬, sodass Gl. (7.79) für ein gegebenes 𝜔 mehrere Lösungen hat. Lösungen, die sich um eine Periode g unterscheiden, sind jedoch nicht unabhängig, da sie zu identischen Blochwellen führen. Es ist daher üblich, den Bereich der Dispersionsrelation auf eine Periode mit Werten von K im Intervall [−g∕2, g∕2] oder [−π∕𝛬, π∕𝛬] zu beschränken, also auf die Brillouinzone. Das entspricht einer Einschränkung der Phase 𝛷 auf das Intervall [−π, π]. Da außerdem cos(2πk ∕g) eine gerade Funktion von K ist, gibt es für jeden Wert von 𝜔 zwei unabhängige Werte von K mit gleichen Beträgen und entgegengesetzten Vorzeichen innerhalb der Brillouinzone. Sie entsprechen unabhängigen Blochmoden, die sich in Vorwärts- und Rückwärtsrichtung ausbreiten. Die Dispersionsrelation zeigt mehrere Spektralbänder, die sich in zwei Bereiche einteilen lassen: • Bereich der Ausbreitung. Spektralbereiche, in denen K reell ist, entsprechen sich ausbreitenden Moden. Sie sind durch die Bedingung | Re{1∕t(𝜔)}| ≤ 1 definiert und werden beginnend mit dem Band niedrigster Frequenz mit 1, 2, … durchnummeriert. • Bereich der photonischen Bandlücke. Spektralbereiche, in denen K komplex ist, entsprechen evaneszenten Wellen, die schnell abklingen. Sie sind durch die Bedingung | Re{1∕t(𝜔)}| > 1 definiert und entsprechen den Sperrbändern des in Abschnitt 7.1.3 besprochenen Beugungsgitters. Sie werden auch photonische Bandlücken oder verbotene Bänder genannt, da in ihnen keine sich ausbreitenden Moden existieren. Zur Auftragung der Dispersionsrelation wird K häufig in Einheiten von g = 2π∕𝛬 gemessen, der fundamentalen Ortsfrequenz der periodischen Struktur, wohingegen 𝜔 in Einheiten der Braggfrequenz 𝜔ℬ = π𝑐∕𝛬 ge-
messen wird, wobei 𝑐 = 𝑐0 ∕𝑛̄ ist und 𝑛̄ der mittlere Brechungsindex des periodischen Mediums. Das Verhältnis 𝜔ℬ ∕(g∕2) = 𝑐 gibt die Steigung der Dispersionsrelation 𝜔 = 𝑐K für die Ausbreitung in einem homogenen Medium mit dem mittleren Brechungsindex an. Beispiel 7-11: Periodischer Stapel teilreflektierender Spiegel
Die Dispersionsrelation für eine Welle, die sich entlang der Achse eines periodischen Stapels von identischen teilreflektierenden verlustfreien Spiegeln mit der Leistungsreflexion |r|2 und der Intensitätstransmission |t|2 = 1 − |r|2 in Abständen von 𝛬 ausbreitet, kann direkt aus Beispiel 7-7 bestimmt werden. Wir verwenden die dort erhaltenen Ergebnisse, t = |t|ei𝜑 mit 𝜑 = 𝑛𝑘0 𝛬 = (𝜔∕𝑐)𝛬 und erhalten daraus zusammen mit Gl. (7.75) die Dispersionsrelation K g
cos (2π ) =
1 𝜔 ), cos (π 𝜔ℬ |t|
(7.80)
wobei g = 2π∕𝛬 und 𝜔ℬ = 𝑐π∕𝛬 die Braggfrequenz ist. Dieses Ergebnis ist in Abb. 7.18 aufgetragen. Die photonischen Bandlücken entsprechen Frequenzbereichen, in denen keine reelle Lösung von Gl. (7.80) existiert; sie liegen bei 𝜔ℬ , 2𝜔ℬ , . . . In diesen Bereichen existieren keine sich ausbreitenden Moden, sie entsprechen den Sperrbändern mit einem Reflexionsgrad von eins in Abb. 7.11. In diesem System beginnt die tiefste photonische Bandlücke bei 𝜔 = 0. Beispiel 7-12: Alternierende dielektrische Schichten
Ein periodisches Medium besteht aus alternierenden dielektrischen Schichten mit den Brechungsindizes 𝑛1 und 𝑛2 , den entsprechenden Dicken d 1 und d 2 und der Periode 𝛬 = d 1 + d 2 . Dieses System ist das dielektrische Bragggitter aus Beispiel 7-8 mit 𝑁 = ∞. Für eine Welle, die sich entlang der Achse der Periodizität ausbreitet, ist Re{1∕t} = Re{A} durch Gl. (7.60) gegeben. Wir verwenden die Beziehungen 𝜑1 + 𝜑2 = 𝑘0 (𝑛1 d 1 + 𝑛2 d 2 ) = π𝜔∕𝜔ℬ und 𝜑1 − 𝜑2 = 𝜁π𝜔∕𝜔ℬ mit der Braggfrequenz ̄ dem mittleren Brechungsindex 𝑛̄ = 𝜔ℬ = (𝑐0 ∕𝑛)(π∕𝛬), (𝑛1 d 1 + 𝑛2 d 2 )∕𝜆 und 𝜁 = (𝑛1 d 1 − 𝑛2 d 2 )∕(𝑛1 d 1 + 𝑛2 d 2 ) und erhalten so aus Gl. (7.75) die Dispersionsrelation K g
cos (2π ) =
1 𝜔 𝜔 [cos (π ) − |r12 |2 cos (π𝜁 )] , t12 t21 𝜔ℬ 𝜔ℬ (7.81)
wobei t12 t21 = 4𝑛1 𝑛2 ∕(𝑛1 + 𝑛2 )2 und |r12 |2 = (𝑛2 − 𝑛1 )2 ∕(𝑛1 + 𝑛2 )2 ist. Ein Beispiel dieser Dispersionsrelation ist in Abb. 7.19 für dielektrische Materialien mit 𝑛1 = 1.5, 𝑛2 = 3.5 und d 1 = d 2 aufgetragen. Wie bei dem in Beispiel
205
206
7 Optik photonischer Kristalle
7-11 betrachteten periodischen Stapel teilreflektierender Spiegel liegen die photonischen Bandlücken bei der Frequenz 𝜔ℬ und ihren Vielfachen und treten entweder im Zentrum der Brillouinzone (K = 0) oder an ihrem Rand (K = g∕2) auf. In diesem Fall existieren im Frequenzbereich um 𝜔 = 0 jedoch sich ausbreitende Moden; das verbotene Band fehlt. Dielektrische Materialien mit kleinerem Kontrast haben schmalere Bandlücken, sie existieren aber auf jeden Fall, auch bei sehr kleinem Kontrast. ω 3 photonische Bandlücke
2ω
2 ω
photonische Bandlücke
ω= c Λ
1 photonische B.
0 –g/2
z
g/2
0
Abb. 7.18 Dispersionsdiagramm eines periodischen Satzes von Spiegeln mit der Intensitätstransmission |t|2 = 0.5 in Abständen von 𝛬. Es gilt 𝜔ℬ = πc∕𝛬 und g = 2π∕𝛬. Die gepunkteten Linien bezeichnen Ausbreitung in einem homogenen Medium mit 𝜔∕K = 𝜔ℬ ∕(g ∕2) = c. ω 3 photonische Bandlücke
2ω 2 photonische Bandlücke
ω
n1 n2
ω= c
Λ
z
1 0 – g/2
0
g/2
1 2
Abb. 7.19 Dispersionsdiagramm eines periodischen dielektrischen Mediums aus alternierenden Schichten mit n1 = 1.5, n2 = 3.5 und d 1 = d 2 . Es gilt 𝜔ℬ = πc0 ∕𝜆n̄ und g = 2π∕𝜆. Die gepunkteten Linien bezeichnen Ausbreitung in einem ̄ homogenen Medium mit dem mittleren Brechungsindex n, sodass 𝜔∕K = 𝜔ℬ ∕(g∕2) = c0 ∕n̄ = c ist.
Phasen- und Gruppengeschwindigkeiten Die Ausbreitungskonstante K entspricht einer Phasengeschwindigkeit 𝜔∕K und einem effektiven Brechungsindex 𝑛eff = 𝑐0 K ∕𝜔. Die Gruppengeschwindigkeit
𝑣 = d𝜔∕ d K , der die Pulsausbreitung im Medium bestimmt, gehört zu einem effektiven Gruppenindex 𝑁eff = 𝑐0 d K ∕ d𝜔 (siehe Abschnitt 5.7). Diese Indizes können an jedem Punkt auf der 𝜔−K -Dispersionskurve bestimmt werden, indem man die Steigung d𝜔∕ d K und das Verhältnis 𝜔∕K bestimmt, d. h. die Steigung einer Gerade, die den Punkt mit dem Ursprung verbindet. Abbildung 7.20 zeigt eine schematische Darstellung der Dispersionsrelation eines Mediums aus alternierenden periodischen Schichten sowie den effektiven Index und den Gruppenindex für Frequenzen, die sich über zwei photonische Bänder und die dazwischenliegende Bandlücke erstrecken. Bei niedrigen Frequenzen innerhalb des ersten photonischen Bands ist 𝑛eff näherungsweise gleich dem mittleren Brechungsindex 𝑛. ̄ Das ist zu erwarten, da sich das Material bei großen Wellenlängen wie ein homogenes Medium mit dem mittleren Brechungsindex verhält. Mit steigender Frequenz wird 𝑛eff größer als 𝑛̄ und erreicht seinen höchsten Wert an der Bandkante. Am Grund des zweiten Bands ist 𝑛eff kleiner als 𝑛, ̄ nimmt aber bei höheren Frequenzen zu und nähert sich in der Mitte des Bands 𝑛. ̄ Dieser Abnahme von 𝑛eff von einem Wert über dem Mittelwert knapp unterhalb der Bandlücke auf einen Wert unter dem Mittelwert knapp oberhalb der Bandlücke hängt mit den deutlich unterschiedlichen räumlichen Verteilungen der entsprechenden orthogonalen Blochmoden zusammen. Die Mode auf der Oberseite des tieferen Bands besitzt in den dielektrischen Schichten mit dem höheren Brechungsindex eine höhere Energie, sodass ihr effektiver Index größer ist als der Mittelwert. Für die Mode an der Unterseite des oberen Bands findet sich die höhere Energie in den Schichten mit kleinerem Brechungsindex, und der effektive Index ist daher niedriger als der Mittelwert. Die Frequenzabhängigkeit des effektiven Gruppenindex folgt einem anderen Muster, wie Abb. 7.20 zeigt. Dieser Index nimmt an den Rändern der Bandlücke deutlich zu, egal ob die Annäherung von oben oder von unten erfolgt, sodass die Gruppengeschwindigkeit viel kleiner wird, d. h. optische Pulse sind in der Nähe der Ränder der Bandlücke sehr langsam. Dispersionsrelation und Bandstruktur für schiefen Einfall
Die Dispersionsrelation für schief einfallende Wellen kann ebenfalls mithilfe der Gleichung cos(K 𝛬) = Re{1∕t(𝜔)} bestimmt werden, wobei Re{1∕t(𝜔)} jetzt von den Einfallswinkeln innerhalb der Schichten jedes Segments und vom Polarisationszustand (TE oder TM) der Welle abhängt. Für ein periodisches Medium aus alternierenden dielektrischen Schichten nimmt
7.2 Eindimensionale photonische Kristalle
ω
ω= c
0
0
Abb. 7.20 Frequenzabhängigkeit des effektiven Brechungsindex neff , der die Phasengeschwindigkeit, und des effektiven Gruppenindex Neff , der die Gruppengeschwindigkeit bestimmt.
photonische Bandlücke
g/2
g
207
n
n
Re{1∕t(𝜔)} beispielsweise die allgemeinere Form in Gl. (7.61) an. Da dieselbe transversale Komponente 𝑘𝑥 des Wellenvektors die Einfallswinkel in beide Schichten bestimmt (𝑘𝑥 = 𝑛1 𝑘0 sin 𝜃1 = 𝑛2 𝑘0 sin 𝜃2 ), ist es günstiger, die Dispersionsrelation in Form einer dreidimensionalen Oberfläche 𝜔 = 𝜔(K , 𝑘𝑥 ) als Funktion von 𝑘𝑥 auszudrücken. Jeder Wert von 𝑘𝑥 ergibt ein Dispersionsdiagramm mit Bändern und Bandlücken ähnlich denjenigen aus Abb. 7.19. Eine einfachere Darstellung der dreidimensionalen 𝜔(K 𝑘𝑥 )-Oberfläche ist ein projiziertes Dispersionsdiagramm, das die Kanten der Bänder und Bandlücken für jeden Wert von 𝑘𝑥 sowohl für TE- als auch für TM-Polarisation in einer zweidimensionalen Auftragung darstellt, wie Abb. 7.21 zeigt. Diese Darstellung wird konstruiert, indem man die Bereiche von Kreisfrequenzen bestimmt, in denen für einen gegebenen Wert von 𝑘𝑥 photonische Bänder und Bandlücken im Dispersionsdiagramm existieren, und diese dann auf entsprechende vertikale Linien bei diesem Wert von 𝑘𝑥 im projizierten Dispersionsdiagramm projiziert. Die Positionen all dieser vertikalen Linien für die Bänder bei verschiedenen Werten von 𝑘𝑥 entsprechen den schattierten Flächen in Abb. 7.21; die unschattierten Flächen bezeichnen die Bandlücken. In diesem Diagramm wird jeder Einfallswinkel durch eine Gerade durch den Ursprung dargestellt. Zum Beispiel entspricht der Einfallswinkel 𝜃1 in Schicht 1 der Gerade 𝑘𝑥 = (𝜔∕𝑐1 ) sin 𝜃1 , d. h. es gilt 𝜔 = (𝑐1 ∕ sin 𝜃1 )𝑘𝑥 mit 𝑐1 = 𝑐0 ∕𝑛1 . Die Gerade 𝜔 = 𝑐1 𝑘𝑥 , auch Lichtlinie genannt, entspricht 𝜃1 = 90◦ . Ähnliche Geraden können für die Einfallswinkel in Medium 2 gezeichnet werden; Abb. 7.21 zeigt nur die Lichtlinie 𝜔 = 𝑐2 𝑘𝑥 unter der Annahme 𝑛2 > 𝑛1 , d. h. 𝑐2 < 𝑐1 . Punkte in dem durch die beiden Lichtlinien begrenzten Gebiet bezeichnen achsennormale Moden, die sich lateral ausbreiten, da sie im dichteren Medium (Medium 2) Totalreflexion erfahren. Die Frage drängt sich auf, ob es einen Frequenzbereich gibt, in dem die Ausbreitung für alle Einfallswinkel 𝜃1 und 𝜃2 und beide Polarisationen verboten ist. Das wäre möglich, wenn die verbotenen Bänder für alle Werte
n
N
TM-Polarisation
ω
90°
θ! B
TE-Polarisation
40° 20°
0°
2ω
20°
40°
60°
90°
ω = c1kx
ω ω = c2kx
n1 n2
x
Λ
z 0
g
kx
0
kx
g
1
Abb. 7.21 Projiziertes Dispersionsdiagramm für ein periodisches dielektrisches Medium aus alternierenden Schichten mit n1 = 1.5, n2 = 3.5 und d 1 = d 2 = 𝛬∕2. Es gilt 𝜔ℬ = πc0 ∕𝜆n̄ und g = 2π∕𝜆. Photonische Bänder sind schattiert dargestellt. Die gestrichelten Linien bezeichnen feste Einfallswinkel 𝜃1 in Schicht 1 einschließlich des Brewsterwinkels 𝜃B = 66.8◦ . Punkte innerhalb des durch die Lichtlinien 𝜔 = c1 kx und 𝜔 = c2 kx begrenzten Gebiets bezeichnen Wellen senkrecht zur Achse.
von 𝑘𝑥 zwischen den Geraden 𝑘𝑥 = 0 und 𝑘𝑥 = 𝜔∕𝑐2 und für beide Polarisationen so angeordnet wären, dass eine photonische Bandlücke entstünde. In dem Beispiel in Abb. 7.21 ist das offensichtlich nicht der Fall. Es stellt sich heraus, dass es grundsätzlich nicht möglich ist; in eindimensionalen periodischen Strukturen gibt es keine vollständigen photonischen Bandlücken. In zwei- und dreidimensionalen periodischen Strukturen kommen sie jedoch vor, wie wir in Abschnitt 7.3 sehen werden. Es gibt einen speziellen Fall, für den grundsätzlich keine photonische Bandlücke existieren kann, und zwar für eine schief einfallende TM-Welle, die sich im Brewsterwinkel 𝜃B = tan−1 (𝑛2 ∕𝑛1 ) in Schicht 1 ausbreitet. Wie Abb. 7.21 zeigt, führt die Gerade für den Brewsterwinkel nicht durch eine Bandlücke. Das ist nicht überraschend, da bei diesem Winkel der Reflexionsgrad einer Elementarzelle null ist und Vorwärts- und Rückwärtswellen entkoppelt sind, sodass der kollektive Effekt entfällt, der zur Totalreflexion führt.
2
208
7 Optik photonischer Kristalle
7.2.3
Fourieroptik periodischer Medien
Der im vorherigen Abschnitt vorgestellte Matrixansatz für die Analyse periodischer Medien funktioniert nur für geschichtete (d. h. stückweise homogene) Medien. Ein allgemeinerer Ansatz, der auf beliebige periodische Medien anwendbar ist, einschließlich kontinuierlicher Medien, beruht auf einer Fourierentwicklung von periodischen Funktionen und der Umwandlung der Helmholtzgleichung in einen Satz algebraischer Gleichungen, deren Lösung die Dispersionsrelation und die Blochmoden liefert. Dieser Ansatz kann auch auf zwei- und dreidimensionale periodische Medien verallgemeinert werden, wie in Abschnitt 7.3 gezeigt wird. Eine Welle, die sich entlang der Achse eines eindimensionalen periodischen Mediums (𝑧-Achse) ausbreitet und in 𝑥-Richtung polarisiert ist, wird durch die verallgemeinerte Helmholtzgleichung (7.64) beschrieben. Da die Impermeabilität η(𝑧) mit der Periode 𝛬 periodisch ist, kann sie in eine Fourierreihe entwickelt werden, ∞ ∑
η(𝑧) =
𝓁 = −∞
η𝓁 exp(−i𝓁g𝑧) ,
(7.82)
wobei g = 2π∕𝛬 die Ortsfrequenz (in rad∕mm) der periodischen Struktur ist und η𝓁 der Fourierkoeffizient der 𝓁-ten harmonischen Funktion. Die Impermeabilität η(𝑧) ist reell; es gilt also η−𝓁 = η∗𝓁 . Der periodische Anteil der Blochwelle 𝑝K (𝑧) in Gl. (7.66) kann ebenfalls in eine Fourierreihe entwickelt werden, 𝑝K (𝑧) =
∞ ∑ 𝑚 = −∞
𝐶𝑚 exp (−i𝑚g𝑧) ,
(7.83)
woraufhin die Blochwellendarstellung des magnetischen Feldes in der Form ∞ ∑ 𝐶𝑚 exp [−i(K + 𝑚g)𝑧] (7.84) 𝐻𝑦 (𝑧) = 𝑚 = −∞
geschrieben werden kann. Der Übersichtlichkeit halber schreiben wir die Abhängigkeit der Fourierkoeffizienten {𝐶𝑚 } von der Blochwellenzahl K nicht mehr explizit aus. Wenn wir diese Entwicklungen in die Helmholtzgleichung (7.64) einsetzen und harmonische Terme derselben Ortsfrequenz gleichsetzen, erhalten wir
Gleichungen können als Matrixeigenwertproblem formuliert werden. Für jedes K entsprechen die Eigenwerte 𝜔2 ∕𝑐02 mehreren Werten von 𝜔, aus denen wir die 𝜔−K Dispersionsrelation erstellen können. Die Eigenvektoren sind Sätze von Koeffizienten {𝐶𝑚 }, die die periodische Funktion 𝑝K (𝑧) der Blochmode für jedes K angeben. Als Eigenwertproblem für eine Matrix F mit den Elementen F 𝑚𝓁 geschrieben, kann dieser Satz von gekoppelten Gleichungen durch numerische Standardtechniken gelöst werden. Da η𝑚−𝓁 = η∗𝓁−𝑚 ist, ist die Ma∗ trix F hermitesch, d. h. es gilt F 𝑚𝓁 = F 𝓁𝑚 . Wenn wir die Helmholtzgleichung für das elektrische Feld anstelle der Helmholtzgleichung (7.64) für das Magnetfeld verwenden würden, würden wir eine andere Matrixdarstellung des Eigenwertproblems erhalten, dann aber mit einer nichthermiteschen Matrix, was die Lösung erschweren würde. Das ist der Grund, weshalb wir uns dafür entschieden hatten, mit der Helmholtzgleichung für das magnetische Feld zu arbeiten. 3) Eine Näherungslösung des Eigenwertproblems
In Gl. (7.85) werden die harmonischen Funktionen der optischen Welle mit den harmonischen Funktionen des periodischen Mediums gekoppelt. Eine harmonische Funktion der optischen Welle mit der Ortsfrequenz K + 𝓁g mischt mit einer harmonischen Funktion des Mediums mit der Ortsfrequenz (𝑚 − 𝓁)g und trägt damit zu der harmonischen Funktion der optischen Welle mit der Ortsfrequenz (K + 𝓁g) + (𝑚 − 𝓁)g = K + 𝑚g bei. Die Bedingungen, unter denen starke Kopplung auftritt, können bestimmt werden, indem man den 𝑚-ten Term in Gl. (7.85) herausnimmt, 𝐶𝑚 =
∑ η𝑚−𝓁 (K + 𝓁g)(K + 𝑚g) 𝐶 , 2 2 𝓁 η0 (𝑛𝜔∕𝑐 ̄ 0 ) − (K + 𝑚 g) 𝓁≠𝑚
(7.86)
𝑚 = 0, ±1, ±2, … , √ wobei 𝑛̄ = 1∕ η0 ein mittlerer Brechungsindex des Mediums ist. Starke Kopplung zwischen der 𝑚-ten Harmonischen der Welle und anderen Harmonischen besteht dann, wenn der Nenner in Gl. (7.86) klein ist, d. h. für 𝜔𝑛∕𝑐 ̄ 0 ≈ |K + 𝑚𝑔| .
(7.87)
(7.85)
Diese Gleichung beschreibt eine Resonanzbedingung für die Wechselwirkung zwischen den Harmonischen; sie kann auch als Phasenbedingung aufgefasst werden.
mit 𝑚 = 0, ±1, ±2, … Damit haben wir die Differentialgleichung (7.64) in einen Satz linearer Gleichungen (7.85) für die unbekannten Fourierkoeffizienten {𝐶𝑚 } umgewandelt. Diese
3) Es kann gezeigt werden, dass der Differentialoperator in der verallgemeinerten Helmholtzgleichung (7.2) für das Magnetfeld ein hermitescher Operator, derjenige für das elektrische Feld jedoch nichthermitesch ist.
∞ ∑
𝜔2 F 𝑚𝓁 𝐶𝓁 = 2 𝐶𝑚 , 𝑐0 𝓁 = −∞
F 𝑚𝓁 = (K + 𝑚 g)(K + 𝓁g)η𝑚𝓁
7.2 Eindimensionale photonische Kristalle
ω
ω 3
Bandlücke 2 2
m =1 ω m =0
m = –3
ω+ ω ω–
1
m = –1 1 2
0
g
g
m = –2 3 2
g
2g
0
Abb. 7.22 Auftragung von Gl. (7.87) als Gleichung für verschiedene Werte von m; die Kurve m = 0 ist gestrichelt gezeigt. Starke Kopplung zwischen den Harmonischen der optischen Welle und denen des Mediums tritt an den Schnittpunkten 1, 2, … auf, die den Bandlücken niedrigster Ordnung entsprechen.
Abbildung 7.22 zeigt eine Auftragung von Gl. (7.87) als Gleichung. Für jeden Wert von 𝑚 beschreibt die Beziehung zwischen 𝜔 und K eine V-förmige Kurve. Die Schnittpunkte dieser Kurven bezeichnen gemeinsame Werte von 𝜔 und K , bei denen Gl. (7.87) gleichzeitig für zwei Harmonische erfüllt ist. Die Schnittpunkte zwischen der Kurve 𝑚 = 0 (gestrichelt) und den Kurven für 𝑚 = −1, −2, …, sind durch gefüllte Kreise gekennzeichnet; sie entsprechen den Bandlücken niedrigster Ordnung 1, 2, . . . An jedem Schnittpunkt ist K ein ganzzahli1 ges Vielfaches von 𝑔, und 𝜔 ist ein ganzzahliges Vielfa2 ches der Braggfrequenz 𝜔ℬ = (𝑐0 ∕𝑛) ̄ g∕2 oder 𝜔ℬ ∕2π = ̄ Das entspricht einer Braggwellenlänge 𝜈ℬ = (𝑐0 ∕𝑛)∕2𝜆. 𝜆ℬ = 2𝛬 im Medium und daher der Totalreflexion. Nicht markierte Schnittpunkte in Abb. 7.22 sind nicht unabhängig, da sie dieselben Werte von 𝜔 wie gekennzeichnete Schnittpunkte besitzen und einen Wert von K , der sich um eine reziproke Gitterkonstante g unterscheidet. Die Bandlücke niedrigster Ordnung liegt am Schnittpunkt der Kurven 𝑚 = 0 und 𝑚 = −1 (Punkt 1 in Abb. 7.22). In diesem Fall sind nur die Koeffizienten 𝐶0 und 𝐶−1 stark gekoppelt, sodass Gl. (7.86) zwei gekoppelte Gleichungen liefert, 𝐶0 = 𝐶−1 =
η1 (K − g)K 𝐶 η0 𝜔2 𝑛̄ 2 ∕𝑐2 − K 2 −1 0
η∗1 K (K − g) 𝐶 η0 𝜔2 𝑛̄ 2 ∕𝑐2 − (K − g)2 0 0
(7.88) (7.89)
Bandlücke 1
0
1 2
Abb. 7.23 Dispersionsrelation in der Nähe von photonischen Bandlücken.
persionsrelation in der Nähe der Bandkante, wo die Glei1 chung gilt. Für K = liefert Gl. (7.90) zwei Frequenzen 2 √ 𝜔± = 𝜔ℬ 1 ± |η1 |∕η0 , (7.91) die den Kanten der ersten photonischen Bandlücke entsprechen. Das Zentrum der Bandlücke liegt bei der Braggfrequenz 𝜔ℬ = (𝑐0 ∕𝑛)( ̄ g∕2) = (π∕𝛬)(𝑐0 ∕𝑛). ̄ Das Verhältnis der Bandlücke zur Mittenfrequenz der Lücke nimmt mit steigendem Kontrastverhältnis |η1 |∕η0 der Impermeabilität zu. Nach einem ähnlichen Verfahren kann die spektrale Breite von Bandlücken höherer Ordnung bestimmt werden. Die Breite der 𝑚-ten Bandlücke wird durch eine Gleichung identisch zu Gl. (7.91) beschrieben, nur dass das Verhältnis |η1 |∕η0 durch |η𝑚 |∕η0 ersetzt wird. Bandlücken höherer Ordnung werden folglich durch höhere räumliche Harmonische der periodischen Funktion η(𝑧) bestimmt. Schief einfallende Wellen
Die Dispersionsrelation für schief einfallende Wellen kann auf dieselbe Weise mithilfe einer Fourierentwicklung bestimmt werden. Für eine schief einfallende TMpolarisierte Welle, die sich in einer beliebigen Richtung in der 𝑥𝑧-Ebene ausbreitet, ist die Helmholtzgleichung durch Gl. (7.65) gegeben. Die Blochwelle ist eine Verallgemeinerung von Gl. (7.84), die wir über Gl. (7.68) erhalten, 𝐻𝑦 (𝑧) =
∞ ∑ 𝑚 = −∞
𝐶𝑚 exp [−i(K + 𝑚g)𝑧] exp(−i𝑘𝑥 𝑥) .
mit η−1 = η∗1 . Für |η1 |2 η20
𝑛̄ 2 𝑛̄ 2 2 K (K − g)2 = [𝜔2 2 − K ] [𝜔2 2 − (K − g)2 ] . 𝑐0 𝑐0 (7.90) 2
sind diese Gleichungen selbstkonsistent. Eine Auftragung dieser Beziehung (Abb. 7.23) ergibt die 𝜔−K -Dis-
(7.92) Nach ähnlichen Berechnungen wie im Fall achsenparalleler Wellen gelangen wir zu dem folgenden Satz von algebraischen Gleichungen für die Koeffizienten 𝐶𝑚 : ∞ ∑ 𝓁 = −∞
F 𝑚𝓁 𝐶𝓁 =
𝜔2 𝐶𝑚 , 𝑐02
F 𝑚𝓁 = [(K + 𝓁g)(K + 𝑚 g) +
(7.93) 𝑘𝑥2 ]η𝑚−𝓁
.
209
210
7 Optik photonischer Kristalle
beliebigen Richtungen und mit beliebigen Polarisationen totalreflektiert. Transmission und Reflexion von Wellen an der Grenzfläche zwischen zwei Medien werden durch die Forderung nach Phasengleichheit bestimmt. Zum Beispiel müssen an der Grenzfläche zwischen zwei homogenen Medien die transversalen Komponenten des Wellenvektors 𝑘𝑥 beiderseitig der Grenzfläche gleich sein. Da 𝑘𝑥 = 𝑘 sin 𝜃 = (𝜔∕𝑐0 )𝑛 sin 𝜃 ist, bedeutet diese Bedingung, dass das Produkt 𝑛 sin 𝜃 invariant sein muss. Das ist der Ursprung des snelliusschen Brechungsgesetzes, wie in Abschnitt 2.4.1 erläutert wurde. Ähnlich muss für eine Welle, die aus einem homogenen Medium in ein eindimensionales periodisches Medium einfällt, 𝑘𝑥 unverändert bleiben. Wenn die einfallende Welle die Kreisfrequenz 𝜔 und den Einfallswinkel 𝜃 besitzt, muss folglich 𝑘𝑥 = (𝜔∕𝑐0 )𝑛 sin 𝜃 gelten, wenn 𝑛 der Brechungsindex des homogenen Mediums ist. Wenn wir 𝑘𝑥 und 𝜔 kennen, können wir die Dispersionsrelation 𝜔 = 𝜔(K , 𝑘𝑥 ) des periodischen Mediums für die passende Polarisation verwenden, um die Blochwellenzahl K zu bestimmen. Wenn die Kreisfrequenz 𝜔 für diesen Wert von 𝑘𝑥 innerhalb eines verbotenen Bands liegt, kann die Welle nicht in das periodische Medium eintreten und wird stattdessen totalreflektiert. Dieser Prozess muss für alle Frequenzen, Einfallswinkel und Polarisationen der einfallenden Welle wiederholt werden. Wir betrachten jetzt die Möglichkeit, dass die Grenzfläche als omnidirektionaler Reflektor (idealer Spiegel) wirkt. Dazu verwenden wir das projizierte Dispersionsdiagramm, das die Bandlücken für jeden Wert von 𝑘𝑥 zeigt, wie in dem Beispiel in Abb. 7.24. Auf demselben Diagramm markieren wir durch eine gestrichelte Linie den 𝜔−𝑘𝑥 -Bereich, der für Wellen aus dem homogenen Medium zugänglich ist. Dieser Bereich wird
Gleichung (7.93) ist eine Verallgemeinerung von Gl. (7.85) für schief einfallende Wellen. Die Dispersionsrelation kann bestimmt werden, indem man dieses Matrixeigenwertproblem für den Satz von Frequenzen 𝜔 zu jedem Paar von Werten von K und 𝑘𝑥 löst.
7.2.4 Grenzflächen zwischen periodischen und homogenen Medien Wir haben unsere Analyse der Ausbreitung von Lichtwellen in periodischen Medien bis jetzt auf die Bestimmung der Dispersionsrelation und der zugehörigen Bandstruktur sowie die Berechnung der Phasen- und Gruppengeschwindigkeit solcher Wellen beschränkt. Definitionsgemäß erstreckt sich ein periodisches Medium unbegrenzt in allen Richtungen. Der nächste Schritt ist nun, Reflexion und Transmission an Grenzflächen zwischen periodischen und homogenen Medien zu untersuchen. Wir betrachten zuerst Reflexion an einer einzelnen Grenzfläche und anschließend eine Platte aus einem periodischen Medium, die in ein homogenes Medium eingebettet ist. Andere Anordnungen aus homogenen Strukturen wie Platten oder Löcher in ausgedehnten periodischen Medien werden in den Abschnitten 10.4 und 11.4.4 beschrieben. Omnidirektionale Reflexion an einer einzelnen Grenzfläche
Wir untersuchen die Reflexion und Transmission einer optischen Welle an der Grenzfläche zwischen einem semi-unendlichen homogenen Medium und einem semi-unendlichen eindimensionalen periodischen Medium, wie in Abb. 7.24 dargestellt. Dabei zeigen wir, dass das periodische Medium unter bestimmten Bedingungen und innerhalb eines gewissen Bereichs von Kreisfrequenzen wie ein idealer Spiegel wirkt und Wellen aus TM-Polarisation
ω
Abb. 7.24 Projiziertes Dispersionsdiagramm für ein Medium aus alternierenden dielektrischen Schichten mit n1 = 1.5, n2 = 3.5 und d 1 = d 2 = 𝛬∕2. Die punktierten Linien sind Lichtlinien für ein homogenes Medium mit dem Brechungsindex n = 1. In dem spektralen Band zwischen 𝜔1 und 𝜔2 verhält sich das Medium wie ein idealer omnidirektionaler Reflektor für alle Polarisationen. Ein ähnliches Band ist auch bei höheren Kreisfrequenzen gezeigt.
TE-Polarisation ω = c0kx
2ω
ω2
ω
ω1
n1 n2
x
n
z
θ
0
g
kx
0
kx
g
Λ
1
2
7.3 Zwei- und dreidimensionale photonische Kristalle
durch die Gleichung 𝑘𝑥 = (𝜔∕𝑐0 )𝑛 sin 𝜃 festgelegt, die verlangt, dass 𝑘𝑥 < (𝜔∕𝑐0 )𝑛 oder 𝜔 > (𝑐0 ∕𝑛)𝑘𝑥 sein muss; der Bereich wird also durch die Gerade 𝜔 = (𝑐0 ∕𝑛)𝑘𝑥 oder 𝜔∕𝜔ℬ = (𝑛∕𝑛)[𝑘 ̄ 𝑥 ∕(𝑔∕2)] begrenzt, die als Lichtlinie bezeichnet wird. Diese Linie entspricht einem Winkel von 𝜃 = 90◦ im Umgebungsmedium. Abbildung 7.24 entspricht genau Abb. 7.21, nur dass wir die Lichtlinien hinzugefügt und das erlaubte 𝜔−𝑘𝑥 -Gebiet zwischen den Lichtlinien hell hervorgehoben haben. Wellen, die aus dem homogenen Medium unter beliebigen Winkeln und mit beliebiger Polarisation einfallen, entsprechen Punkten innerhalb dieses Gebiets; Punkte außerhalb dieses Gebiets sind von Wellen aus dem homogenen Medium unabhängig von Einfallswinkel oder Polarisation nicht erreichbar. Das spektrale Band, das durch die in Abb. 7.24 definierten Kreisfrequenzen 𝜔1 und 𝜔2 begrenzt wird, ist besonders interessant, weil alle 𝜔−𝑘𝑥 -Punkte in diesem Band in einer photonischen Bandlücke liegen. In diesem Spektralbereich kann daher keine einfallende Welle (unabhängig von ihrem Einfallswinkel oder ihrer Polarisation) an eine sich ausbreitende Welle im periodischen Medium angepasst werden – die Grenzfläche wirkt dann als ein idealer omnidirektionaler Reflektor. Abbildung 7.24 zeigt auch ein zweites spektrales Band bei höheren Kreisfrequenzen, das sich genauso verhält.
Bragggitter mit endlicher Größe keine direkten Gegenstücke. Trotzdem können solche Parameter für ein Gitter definiert werden, indem man die komplexe Amplitudentransmission t(𝜔) bestimmt und sie so an ein effektives homogenes Medium derselben Gesamtdicke d anpasst, dass arg{t𝑁 } = (𝜔∕𝑐0 )𝑛eff d wird. Dann wird ein effektiver Gruppenindex 𝑁eff = 𝑛eff + 𝜔 d𝑛eff ∕ d𝜔 bestimmt [siehe Gl. (5.139)]. Die Abhängigkeit dieser effektiven Indizes von der Frequenz unterscheidet sich von der in Abb. 7.20 für ein ausgedehntes periodisches Medium gezeigten, da sie Oszillationen in den Durchlassbändern zeigt. Für hinreichend große 𝑁, etwa größer als 100, werden diese Oszillationen jedoch herausgemittelt und die effektiven Indizes werden nahezu gleich denen eines ausgedehnten periodischen Mediums. Eine andere interessante Anordnung ist eine Platte eines homogenen Mediums in einem periodischen Medium. In dieser Anordnung kann das Licht in der Platte durch die omnidirektionale Reflexion am periodischen Umgebungsmedium gefangen werden, sodass die Platte ein optischer Wellenleiter wird. Diese Anordnung wird in Abschnitt 9.5 untersucht.
Eine Platte aus einem periodischen Material in einem homogenen Medium
Die in Abschnitt 7.2 eingeführten Konzepte für die Untersuchung der Ausbreitung von optischen Wellen in eindimensionalen periodischen Medien können leicht auf zwei- und dreidimensionale Strukturen verallgemeinert werden. Dazu gehören die Blochwellen als die Moden des periodischen Mediums und die 𝜔−K Dispersionsrelationen mit den photonischen Bändern und Bandlücken. Im Gegensatz zu eindimensionalen Strukturen haben zweidimensionale photonische Kristalle zweidimensionale vollständige photonische Bandlücken, d. h. gemeinsame Bandlücken für Wellen beider Polarisationen, die sich in der Ebene der Periodizität in beliebiger Richtung ausbreiten. Dreidimensional vollständige photonische Bandlücken, d. h. gemeinsame Bandlücken für alle Richtungen und Polarisationen, sind nur in dreidimensionalen photonischen Kristallen möglich. Die mathematische Behandlung von zwei- und dreidimensionalen periodischen Medien ist aufwendiger, und die Visualisierung der Dispersionsdiagramme ist wegen der zusätzlichen Freiheitsgrade schwieriger, aber die Konzepte sind im Wesentlichen dieselben wie diejenigen für eindimensionale periodische Medien. Dieser Abschnitt beginnt mit einer einfachen Behandlung von zweidimensionalen Strukturen, bevor dann die detailliertere dreidimensionale Behandlung folgt.
Eine Platte aus einem eindimensionalen periodischen Material, das in einem homogenen Medium eingebettet ist, ist nichts anderes als ein eindimensionales Bragggitter mit einer endlichen Zahl von Segmenten. Reflexion und Transmission des Bragggitters hatten wir bereits in Abschnitt 7.1.3 untersucht. Man könnte erwarten, dass ein Bragggitter mit einer großen, aber endlichen Zahl 𝑁 von Segmenten im Wesentlichen die Eigenschaften eines periodischen Mediums mit derselben Elementarzelle besitzt. Das ist in der Tat der Fall, da die Durchlass- und Sperrbänder des Gitters mathematisch mit den photonischen Bändern und Bandlücken des ausgedehnten periodischen Mediums identisch sind. Die spektrale Transmission und Reflexion des Bragggitters, die von der Größe des Gitters und dem Vorhandensein der Grenzflächen abhängende oszillierende Eigenschaften besitzen, haben jedoch keine Gegenstücke in der ausgedehnten periodischen Struktur. Auch die Phasen und Gruppengeschwindigkeiten und die zugehörigen effektiven Brechungsindizes, die in einem ausgedehnten periodischen Medium von der Dispersionsrelation bestimmt werden, haben in einem
7.3 Zwei- und dreidimensionale photonische Kristalle
211
7 Optik photonischer Kristalle
ky
y
M
x
y
x (a) 2D periodische Struktur
kx
g1
a2
212
a1 (b) Gitter
Γ
X
g2
(c) reziprokes Gitter
(d) irreduzible Brillouinzone
Abb. 7.25 (a) Eine zweidimensionale periodische Struktur aus parallelen Stäben. (b) Das rechteckige Gitter, das die Orte der Stäbe festlegt. (c) Die zweidimensionale Fouriertransformierte der Gitterpunkte ist ein anderer Satz von
Punkten, die das reziproke Gitter mit Perioden g1 = 2π∕a1 und g2 = 2π∕a2 bilden. Die schattierte Fläche ist die Brillouinzone. (d) Für ein quadratisches Gitter (a1 = a2 = a) ist die irreduzible Brillouinzone das Dreieck ΓMX.
7.3.1
zur 𝑥𝑦-Ebene ausbreiten, sind die Moden zweidimensionale Blochwellen,
Zweidimensionale photonische Kristalle
Zweidimensionale periodische Strukturen
Wir betrachten eine zweidimensionale periodische Struktur wie z. B. eine Reihe identischer paralleler Stäbe, Röhren, oder Adern, die in einem homogenen Wirtsmedium eingebettet sind [Abb. 7.25(a)] und an den Punkten eines rechteckigen Gitters liegen, wie Abb. 7.25(b) zeigt. Die Impermeabilität η(𝑥, 𝑦) = 𝜀0 ∕𝜀(𝑥, 𝑦) ist in den transversalen Richtungen 𝑥 und 𝑦 periodisch und in axialer Richtung 𝑧 konstant. Wenn 𝑎1 und 𝑎2 die Perioden in 𝑥- und 𝑦-Richtung sind, dann erfüllt η(𝑥𝑦) die Beziehung η(𝑥 + 𝑚1 𝑎1 , 𝑦 + 𝑚2 𝑎2 ) = η(𝑥, 𝑦)
(7.94)
für die Translationssymmetrie für alle ganzen Zahlen 𝑚1 und 𝑚2 . Diese periodische Funktion wird durch eine zweidimensionale Fourierreihe beschrieben, η(𝑥, 𝑦) =
∞ ∑
∞ ∑
𝓁1 = −∞ 𝓁2 = −∞
( ) η𝓁1 ,𝓁2 exp −i𝓁1 g1 𝑥
) ( × exp −i𝓁2 g2 𝑥 ,
(7.95)
wobei g1 = 2π∕𝑎1 und g2 = 2π∕𝑎2 die fundamentalen Ortsfrequenzen (rad∕mm) in 𝑥- und 𝑦-Richtung und 𝓁1 g1 und 𝓁2 g2 ihre Harmonischen sind. Die Koeffizienten η𝓁1 ,𝓁2 hängen vom tatsächlichen Profil der periodischen Funktion ab, z. B. der Größe der Stäbe. Die zweidimensionale Fouriertransformierte der periodischen Funktion besteht aus Punkten (Deltafunktionen) auf einem geradlinigen Gitter wie in Abb. 7.25(c). Dieses Gitter im Fourierbereich ist Halbleiterphysikern als reziprokes Gitter bekannt. Wie sehen die optischen Moden eines Mediums mit einer solchen Symmetrie aus? Die Antwort ist eine einfache Verallgemeinerung des eindimensionalen Falls aus Gl. (7.66). Für Wellen, die sich in einer Richtung parallel
𝑈(𝑥, 𝑦) = 𝑝K 𝑥 ,K 𝑦 (𝑥, 𝑦) exp(−iK 𝑥 𝑥) exp(−iK 𝑦 𝑦) , (7.96) wobei 𝑝K 𝑥 ,K 𝑦 (𝑥, 𝑦) eine periodische Funktion mit denselben Perioden wie das Medium ist. Die Welle wird durch ein Paar von Blochwellenzahlen (K 𝑥 , K 𝑦 ) charakterisiert. Eine zweite Welle mit den Blochwellenzahlen (K 𝑥 + g1 , K 𝑦 + g2 ) ist keine neue Mode. Wie in Abb. 7.25(c) illustriert, besitzt ein ganzer Satz von Moden in der Fourierebene Blochwellenzahlen auf Punkten in einem Rechteck, das durch [−g1 ∕2 < K 𝑥 ≤ g1 ∕2] und [−g2 ∕2 < K 𝑦 ≤ g2 ∕2] definiert ist, der ersten Brillouinzone. Andere Symmetrien können verwendet werden, um den Satz von unabhängigen Wellenvektoren innerhalb der Brillouinzone zu reduzieren. Wenn alle Symmetrien ausgenutzt werden, ist das Ergebnis eine Fläche, die irreduzible Brillouinzone genannt wird. Zum Beispiel resultiert die Rotationssymmetrie eines quadratischen Gitters in einer irreduziblen Brillouinzone in Form eines Dreiecks, wie Abb. 7.25(d) zeigt. Zweidimensional verdreht-periodische Strukturen
Ein Beispiel einer anderen Klasse von zweidimensionalen periodischen Strukturen ist eine Reihe von parallelen zylindrischen Löchern an den Punkten eines Dreiecksgitters wie in Abb. 7.26(a). Da die Gitterpunkte verdreht sind (d. h. nicht entlang der 𝑥- und 𝑦-Achse ausgerichtet sind), verwenden wir zwei primitive Vektoren a1 und a2 [Abb. 7.26(b)], um das Gitter über den Gittervektor R = 𝑚1 a1 + 𝑚2 a2 zu erzeugen, wobei 𝑚1 und 𝑚2 ganze Zahlen sind. Wir definieren auch einen Ortsvektor rt = (𝑥, 𝑦), sodass die periodische Funktion 𝜀(rt ) ≡ 𝜀(𝑥, 𝑦) die Beziehung 𝜀(rt + R) = 𝜀(rt ) für die Translationssymmetrie erfüllt (der Index „t“ steht für „transversal“). Die zweidimensionale Fourierreihe einer solchen Funktion ist eine Reihe von Punkten auf einem rezipro-
7.3 Zwei- und dreidimensionale photonische Kristalle
ky
y a2
M K
g1
θ
x y
kx
g2
a1
Γ
x
(a) 2D periodische Struktur
(b) Gitter
(c) reziprokes Gitter
(d) irreduzible Brillouinzone
Abb. 7.26 (a) Eine zweidimensionale periodische Struktur aus parallelen zylindrischen Löchern. (b) Das Dreiecksgitter, das die Positionen der Löcher festlegt. In diesem Diagramm gilt für die Beträge a1 = a2 = a und 𝜃 = 120◦ . (c) Das reziproke Gitter; die schattierte Fläche ist die Brillouinzone, ein Sechseck. (d) Die irreduzible Brillouinzone ist das Dreieck ΓMK.
ken Gitter, das durch die zu a1 bzw. a2 orthogonalen Vektoren g1 und g2 mit den Beträgen g1 = 2π∕𝑎1 sin 𝜃 und g2 = 2π∕𝑎2 sin 𝜃 definiert ist, wobei 𝜃 der Winkel zwischen a1 und a2 ist. Das zweidimensionale reziproke Gitter ist ebenfalls ein Dreiecksgitter, das durch den Vektor G = 𝓁1 g1 + 𝓁2 g2 erzeugt wird, wobei 𝓁1 und 𝓁2 ganze Zahlen sind, wie Abb. 7.26(c) zeigt. Für Wellen, die sich in einer Richtung parallel zur 𝑥𝑦Ebene ausbreiten, sind die Blochmoden 𝑈(rt ) = 𝑝K (rt ) exp(−iKt ⋅ rt ) ,
(7.97)
wobei Kt = (K 𝑥 , K 𝑦 ) der Wellenvektor der Blochmode ist und 𝑝Kt (rt ) eine zweidimensionale periodische Funktion auf demselben Gitter. Zwei Blochmoden mit den Wellenvektoren Kt und Kt + G sind äquivalent. Um einen vollständigen Satz von Wellenvektoren zu erfassen, müssen wir daher nur Vektoren innerhalb der Brillouinzone betrachten, wie Abb. 7.26(c) illustriert. Die Dispersionsrelation kann bestimmt werden, indem man dafür sorgt, dass die Blochwelle in Gl. (7.96) oder Gl. (7.97) die verallgemeinerte Helmholtzgleichung erfüllt. Die Berechnungen werden durch einen Fourierreihenansatz erleichtert, wie er bereits für den eindimensionalen Fall beschrieben wurde und auch (in einer allgemeineren Form) im dreidimensionalen Fall zum Zuge kommen wird. Beispiel 7-13: Zylindrische Löcher auf einem Dreiecksgitter
Ein zweidimensionaler photonischer Kristall besteht aus einem homogenen Medium (𝑛 = 3.6) mit luftgefüllten zylindrischen Löchern mit einem Radius von 0.48𝑎 an den Punkten eines Dreiecksgitters mit der Gitterkonstante 𝑎. Die in Abb. 7.27 dargestellten berechneten Dispersionsrelationen für TE- und TMWellen, die sich in der Ebene der Periodizität (𝑘𝑧 = 0) ausbreiten, zeigt eine zweidimensionale vollständige photonische Bandlücke bei Frequenzen in der Nähe der Kreisfrequenz 𝜔0 = π𝑐0 ∕𝑎. 4) Wie im eindimensio-
nalen Fall kann die Bandlücke durch Verwendung von Materialien mit größerem Kontrast der Brechungsindizes vergrößert werden. Die meisten Anordnungen zeigen in der Tat photonische Bandlücken, wenn die verwendeten Materialien einen hinreichend hohen Kontrast haben. Diese Struktur photonischer Kristalle kommt in den „mikrostrukturierten“ Fasern (Hohlkernfasern) zur Anwendung, die eine Reihe von nützlichen Eigenschaften haben (siehe Abschnitt 10.4). Für eine schief einfallende Welle, die sich in einem Winkel zur 𝑥𝑦-Ebene ausbreitet, wird die Blochwelle in Gl. (7.97) 𝑈(rt ) = 𝑝K (rt ) exp(−iKt ⋅ rt ) exp(−i𝑘𝑧 𝑧) ,
(7.98)
wobei 𝑘𝑧 eine Konstante ist. Die Bandstruktur hat dann die Form einer Reihe von Oberflächen 𝜔 = 𝜔(Kt , 𝑘𝑧 ). Eine dreidimensional vollständige photonische Bandlücke ist ein Bereich von Frequenzen 𝜔, der von keiner dieser Oberflächen durchquert wird, d. h. sie umfasst Werte von 𝜔, die durch keine Kombination von reellen Kt und 𝑘𝑧 erhalten werden. Während eine zweidimensional vollständige photonische Bandlücke für 𝑘𝑧 = 0 existiert, wie das Beispiel in Abb. 7.27 zeigt, ist eine photonische Bandlücke für schief einfallende Wellen in zweidimensionalen periodischen Strukturen nicht möglich.
7.3.2 Dreidimensionale photonische Kristalle Kristallstruktur
Ein dreidimensionaler photonischer Kristall entsteht, indem eine dielektrische Grundstruktur wie z. B. eine Kugel oder ein Würfel an den Punkten eines dreidimen4) Siehe S. G. Johnson, J. D. Joannopoulos, ‚Block-Iterative Frequency-Domain Methods for Maxwell’s Equations in a Plane-Wave Basis‘, Optics Express 8, 173, 2001.
213
214
7 Optik photonischer Kristalle z
z
M K
TE
TM Γ
ω
ω0
0
vollständige phot. Bandlücke
Γ
M
vollständige phot. Bandlücke
K
T
ΓΓ
M
Γ
K T
Abb. 7.27 Berechnete Bandstruktur eines zweidimensionalen photonischen Kristalls aus einem homogenen Medium (n = 3.6) mit luftgefüllten zylindrischen Löchern mit dem Radius 0.48a an den Punkten eines Dreiecksgitters mit der Gitterkonstante a. Auf der Abszisse sind Wellenvektoren
aufgetragen, definiert durch Punkte auf dem Rand der irreduziblen Brillouinzone, dem Dreieck ΓMK. Die Ordinate ist in Einheiten von 𝜔0 = πc0 ∕a aufgetragen. Die Welle breitet sich in der Ebene der Periodizität aus und hat TE- (links) bzw. TM-Polarisation (rechts).
sionalen Gitters angeordnet wird. Das Gitter wird durch die Gittervektoren R = 𝑚1 a1 + 𝑚2 a2 + 𝑚3 a3 erzeugt, wobei 𝑚1 , 𝑚2 und 𝑚3 ganze Zahlen und a1 , a2 und a3 primitive Vektoren sind, die die Elementarzelle des Gitters festlegen. Die Gesamtstruktur ist periodisch, und ihre physikalischen Eigenschaften wie die Permittivität 𝜀(r) oder die Impermeabilität η(r) = 𝜀0 ∕𝜀(r) sind invariant bezüglich einer Translation um R,
ist umgekehrt proportional zu a1 . Ähnliche Eigenschaften gelten für g2 und g3 . Man kann auch zeigen, dass G ⋅ R = 2π ist. Wenn a1 , a2 und a3 paarweise orthogonal sind, dann sind auch g1 , g2 und g3 paarweise orthogonal, und die Beträge g1 = 2π∕𝑎1 , g2 = 2π∕𝑎2 und g3 = 2π∕𝑎3 sind die Ortsfrequenzen zu den Periodizitäten in den drei Richtungen. Ein Beispiel eines dreidimensionalen Kristallgitters und seines entsprechenden reziproken Gitters ist in Abb. 7.28 gezeigt.
η(r + R) = η(r)
(7.99)
für alle Orte r. Diese periodischen Funktionen können daher in einer dreidimensionalen Fourierreihe entwickelt werden, η(r) =
∑
ηG exp(−iG ⋅ r) ,
(7.100)
G
wobei G = 𝓁1 g1 + 𝓁2 g2 + 𝓁3 g3 ein Vektor ist, der durch die primitiven Vektoren g1 , g2 und g3 eines anderen Gitters, des reziproken Gitters definiert ist, und 𝓁1, 𝓁2 und 𝓁3 ganze Zahlen sind. Die g-Vektoren hängen mit den a-Vektoren über a2 × a3 , a1 ⋅ a2 × a3 a1 × a2 g3 = 2π a1 ⋅ a2 × a3 g1 = 2π
g2 = 2π
a3 × a1 , a1 ⋅ a2 × a3
(7.101)
zusammen, sodass g1 ⋅ a1 = 2π, g1 ⋅ a2 = 0 und g1 ⋅ a3 = 0 ist, d. h. g1 ist zu a2 und a3 orthogonal und seine Länge
Blochmoden
Die Moden eines dreidimensionalen periodischen Mediums sind Wellen, die ihre Form bei Translation um einen Gittervektor R beibehalten bzw. sich nur um eine multiplikative Konstante mit dem Betrag eins ändern. Diese Moden haben die Blochform 𝑝K (r) exp(−iK ⋅ r), wobei 𝑝K (r) eine dreidimensionale periodische Funktion ist, deren Periodizität durch denselben Gittervektor R beschrieben wird; K ist der Blochwellenvektor, und ˆ e ist ein Einheitsvektor in Richtung der Polarisation. Die Blochmode ist eine sich ausbreitende ebene Welle exp(−iK ⋅ r), moduliert mit einer periodischen Funktion 𝑝K (r). Translation um R entspricht einer Multiplikation mit einem Phasenfaktor exp(−iK ⋅ R), der von K abhängt. ′ Zwei Moden mit den Wellenvektoren K und K = K + G ′ sind äquivalent, da exp(−iK ⋅ R) = exp(−iK ⋅ R) ist, d. h. eine Translation um R ist äquivalent zu einer Multiplikation mit demselben Phasenfaktor, weil exp(−iG ⋅ R) =
7.3 Zwei- und dreidimensionale photonische Kristalle
z
z
a3 y
x
x
(a) 3D periodische Struktur
kz
a2
a1
U X
y
W K
ky
kx (b) Gitter
L Γ
(c) reziprokes Gitter
Abb. 7.28 (a) Eine dreidimensionale periodische Struktur aus dielektrischen Kugeln. (b) Die Kugeln sitzen an den Punkten eines Diamant√ (kubisch flächenzentrierten) √ x+ˆ y), a2 = (a∕ 2)(ˆ y +ˆ z) und gitters a1 = (a∕ 2)(ˆ
√
x+ˆ z), wobei a die Gitterkonstante ist. (c) Das a3 = (a∕ 2)(ˆ
exp(−i2π) = 1 ist. Um alle Moden vollständig zu charakterisieren, müssen wir daher nur Werte von K innerhalb eines endlichen Volumens im reziproken Gitter betrachten, der Brillouinzone. Die Brillouinzone ist das Volumen von Punkten, die näher an einem speziellen reziproken Gitterpunkt (dem Ursprung der Zone, mit Γ bezeichnet) liegen als an jedem anderen Gitterpunkt. Weitere Symmetrien des Gitters ermöglichen eine weitere Verringerung dieses Volumens zur irreduziblen Brillouinzone, wie das Beispiel in Abb. 7.28 zeigt.
(d) irreduzible Brillouinzone
entsprechende reziproke Gitter ist ein kubisch raumzentriertes Gitter mit einer Brillouinzone, die hier durch das schattierte Volumen gekennzeichnet ist und als WignerSeitz-Zelle bezeichnet wird. (d) Die irreduzible Brillouinzone ist das Polyeder, dessen Eckpunkte durch die kristallographischen Symbole ΓXULKW gekennzeichnet sind.
H(r) = 𝑝K (r) exp(−iK ⋅ r)ˆ e=
∑
𝐶G exp[−i(K + G) ⋅ r]ˆ e
G
(7.103) schreiben. Um die Schreibweise übersichtlich zu halten, geben wir die Abhängigkeit der Fourierkoeffizienten 𝐶G von dem Wellenvektor K nicht explizit an. Einsetzen der Gln. (7.100) und (7.103) in Gl. (7.2), Verwenden e = −i(K × ˆ e) exp(−iK ⋅ r) der Beziehung ∇ × exp(−iK ⋅ r)ˆ und Gleichsetzen harmonischer Terme derselben Ortsfrequenz ergibt ∑ [ ] 𝜔2 ′ (K + G) × (K + G ) × ˆ e ηG−G′ 𝐶G′ = 2 𝐶Gˆ e . (7.104) 𝑐0 G′
Die photonische Bandstruktur Um die 𝜔−K-Dispersionsrelation für ein dreidimensio-
−
nales periodisches Medium zu bestimmen, beginnen wir mit dem Eigenwertproblem, das durch die verallgemeinerte Helmholtzgleichung (7.2) beschrieben wird. Ein Ansatz zur Lösung dieser Aufgabe ist, die Methode der Fourierreihenentwicklung zu verallgemeinern, die wir in Abschnitt 7.2.3 für eindimensionale periodische Strukturen eingeführt hatten. Wenn wir die periodischen Funktionen η(r) und 𝑝K (r) in Fourierreihen entwickeln, wird die Differentialgleichung (7.2) zu einem Satz algebraischer Gleichungen, die auf ein Matrixeigenwertproblem führt, das mithilfe von Matrixmethoden numerisch gelöst werden kann. Wie am Ende des Abschnitts 7.2.3 besprochen, arbeiten wir mit dem Magnetfeld, um eine hermitesche Matrixdarstellung zu erreichen. Wenn wir die periodische Funktion 𝑝K (r) in der Blochwelle in eine dreidimensionale Fourierreihe entwickeln,
Wir bilden auf beiden Seiten der Gleichung das Skalarprodukt mit ˆ e und verwenden die Vektoridentität A ⋅ (B × C) = −(B × A) ⋅ C und erhalten so ∑ 𝜔2 F GG′ 𝐶G′ = 2 𝐶G , 𝑐0 (7.105) G′ [ ] ′ F GG′ = [(K + G) × ˆ e] ⋅ (K + G ) × ˆ e ηG−G′ .
𝑝K (r) =
∑
𝐶G exp(−iG ⋅ r) ,
Aus der Helmholtz-Differentialgleichung ist jetzt ein Satz linearer Gleichungen für die Fourierkoeffizienten {𝐶G } geworden. Da η(𝑧) reell ist, gilt ηG−G′ = η∗G′ −G , und die Matrix F GG′ ist hermitesch. Daraus folgt, dass Gl. (7.105) ein Eigenwertproblem für eine hermitesche Matrix ist. Für jeden Wellenvektor K liefern die Eigenwerte 𝜔2 ∕𝑐02 mehrere Werte von 𝜔, aus denen das 𝜔−KDiagramm und die photonische Bandstruktur konstruiert werden können. Die Eigenvektoren {𝐶G } bestimmen die periodische Funktion 𝑝K (r) der Blochwelle. Beispiele einiger Strukturen
(7.102)
G
können wir den Vektor des Magnetfelds in der Blochform
Sphärische Löcher auf einem Diamantgitter
Ein Beispiel eines dreidimensionalen photonischen Kristalls, der eine vollständige dreidimensionale photonische Bandlücke besitzt, sind luftgefüllte Kugeln an
215
216
7 Optik photonischer Kristalle
ω
cher sind parallel zu drei der Achsen des Diamantgitters wie Abb. 7.30(a) zeigt. Diese Struktur hat eine vollständige Bandlücke mit einem Verhältnis von Bandlücke zu Mittenfrequenz von 0.19 bei einem Brechungsindex von 𝑛 = 3.6.
vollstän- dige photonische Bandlücke
ω0
Holzhaufen-Struktur
0
X
U
L
Γ
X
W
K
Abb. 7.29 Berechnete Bandstruktur eines dreidimensionalen photonischen Kristalls mit einem Diamantgitter der Gitterkonstante a. Die Struktur besteht aus Luftkugeln mit dem Radius 0.325a in einem homogenen Material mit dem Brechungsindex n = 3.6. Die Bandlücke reicht von etwa 𝜔0 = πc0 ∕a bis 1.32𝜔0 .
den Punkten eines Diamantgitters in einem Material mit hohem Brechungsindex (siehe Abb. 7.28). Der Radius der Luftkugeln ist so groß, dass die Kugeln etwas überlappen, wodurch Schnittkanäle entstehen. Die in Abb. 7.29 gezeigte berechnete Bandstruktur zeigt eine relativ breite dreidimensional vollständige photonische Bandlücke zwischen den beiden tiefsten Bändern. Photonische Kristalle aus kugelförmigen Löchern in Silicium wurden hergestellt, indem man Silicium in den Hohlräumen einer Schablone aus dichtgepackten Silikatkugeln ablagerte, die durch kleine, während des Sinterns gebildeten „Hälse“ miteinander verbunden waren. Anschließend wurde die Silikatschablone entfernt. 5) Yablonovit
Die erste experimentelle Beobachtung einer dreidimensional vollständigen photonischen Bandlücke stammt von Eli Yablonovitch, der 1991 eine Variante der Diamantgitterstruktur untersuchte, die heute als Yablonovit bekannt ist. 6) Diese Struktur aus schrägen Poren wird hergestellt, indem man eine periodische Reihe von zylindrischen Löchern in definierten Winkeln in eine dielektrische Platte bohrt. An jedem Punkt eines zweidimensionalen Dreiecksgitters an der Oberfläche der Platte werden drei Löcher gebohrt; die Richtungen der Lö-
5) Siehe A. Blanco, E. Chomski, S. Grabtchak, M. Ibisate, S. John, S. W. Leonard, C. Lopez, F. Meseguer, H. Miguez, J. P. Mondia, G. A. Ozin, O. Toader, H. M. van Driel, ‚Large-Scale Synthesis of a Silicon Photonic Crystal with a Complete Three-dimensional Bandgap Near 1.5 Micrometres‘, Nature 405, 437, 2000. 6) E. Yablonovitch, T. J. Gmitter, ‚Photonic Band Structures: The FaceCentered-Cubic Case Employing Non-Spherical Atoms‘, Physical Review Letters 67, 2295–2298, 1991.
Eine andere dreidimensionale Struktur eines photonischen Kristalls, die einfacher herzustellen ist, besteht aus einem eindimensionalen periodischen Stapel von alternierenden Schichten, von denen jede ein zweidimensionaler photonischer Kristall ist. Zum Beispiel besteht die in Abb. 7.30(b) gezeigte Holzhaufen-Struktur aus Schichten paralleler Klötze mit einer Stapelfolge, die sich alle vier Schichten wiederholt. Die Orientierung der Klötze in aufeinander folgenden Schichten ist um 90◦ gedreht, und die Klötze werden alle zwei Schichten um eine halbe Periodenlänge verschoben. Die resultierende Struktur hat eine tetragonal flächenzentrierte Gittersymmetrie. Die Struktur konnte in Siliciumtechnologie mit einer Detailgröße von 180 nm hergestellt werden; sie zeigt dann eine dreidimensional vollständige photonische Bandlücke im Wellenlängenbereich 𝜆 = 1.35−1.95 μm. 7) Loch-und-Stab-Struktur
Ein weiteres Beispiel für photonische Kristalle ist die Loch-und-Stab-Struktur in Abb. 7.30(c). Hier werden zwei komplementäre Arten von zweidimensionalen periodischen Platten verwendet: dielektrische Stäbe in Luft und Luftlöcher in einem Dielektrikum. In Siliciumtechnologie gefertigt, zeigte diese Struktur ein Sperrband für alle Neigungswinkel im Wellenlängenbereich 𝜆 = 1.15−1.6 μm. 8) Sowohl die Loch-und-Stab-Struktur als auch die Holzhaufen-Struktur bieten die Möglichkeit, beliebige Punktdefekte wie z. B. ein fehlendes Loch oder einen fehlenden Stab einzuführen. Auf diese Weise können Bauelemente wie Wellenleiter (siehe Abschnitt 9.4) oder Nanoresonatoren aus photonischen Kristallen (siehe Abschnitt 11.4.4) sowie besonders steuerbare Lichtquellen 9) (siehe Kapitel 18) hergestellt werden. Die Möglichkeit, gezielt Defekte einzubauen, ist wohl die wertvollste Eigenschaft zwei- und dreidimensionaler photonischer Strukturen, da eindimensionale periodische Me7) Siehe J. G. Fleming, S.-Y. Lin, ‚Three-Dimensional Photonic Crystal with a Stop Band from 1.35 to 1.95 μm‘, Optics Letters 24, 49, 1999. 8) Siehe M. Qi, E. Lidorikis, P. T. Rakich, S. G. Johnson, J. D. Joannopoulos, E. P. Ippen, H. I. Smith, ‚A Three-Dimensional Optical Photonic Crystal with Designed Point Defects‘, Nature 429, 538, 2004. 9) Siehe S. P. Ogawa, M. Imada, S. Yoshimoto, M. Okano, S. Noda, ‚Control of Light Emission by 3D Photonic Crystals‘, Science 305, 227, 2004.
7.3 Zwei- und dreidimensionale photonische Kristalle 120°
35°
(a) Yablonovit
(b) Holzstapel
(c) Löcher und Stäbe
Abb. 7.30 (a) Der Yablonovitkristall wird hergestellt, indem man zylindrische Löcher durch eine dielektrische Platte bohrt. An jedem Punkt eines zweidimensionalen Dreiecksgitters an der Oberfläche werden drei Löcher in Winkeln von 35◦ zur Flächennormale gebohrt, zwischen denen Winkel von 120◦ liegen. (b) Der photonische „Holzhaufen-Kristall“’ besteht aus alternierenden Schichten aus parallelen Stä-
ben, wobei aufeinander folgende Schichten um 90◦ gegeneinander verdreht sind. (c) Die Loch-und-Stab-Struktur aus alternierenden Schichten zweidimensionaler periodischer Strukturen: eine Schicht von parallelen zylindrischen Löchern auf einem hexagonalen Gitter wird von einer Schicht von parallelen Stäben gefolgt, die so angeordnet sind, dass sie zwischen die Löcher passen.
dien bereits hervorragende omnidirektionale Reflektoren sind.
dass man die unbelichteten Stellen wegspülen kann. Das Ergebnis ist eine periodische Struktur aus einem vernetzten Polymer mit luftgefüllten Hohlräumen. Mithilfe von räumlichen Lichtmodulatoren auf Flüssigkristallbasis zur Steuerung der Phaseneigenschaften der verschiedenen Strahlen lassen sich (dynamisch abstimmbare) Interferenzmuster beliebiger Form erzeugen. Vier Strahlen aus einem einzigen Laser reichen dabei aus, um eine beliebige photonische Bandstruktur zu erzeugen. Bei der dreidimensionalen Multiphotonen-Mikrolithographie werden Femtosekunden-Laserpulse durch eine Linse auf definierte Stellen in einem speziellen transparenten Polymermaterial fokussiert. Die Laserleistung wird so eingestellt, dass nur im Bereich des Brennpunkts der Linse, wo die optische Intensität ausreichend hoch ist (siehe Abschnitt 14.5.2), eine Multiphotonenpolymerisation stattfindet. Das Licht kann diese Stelle erreichen, ohne das dazwischenliegende Material zu polymerisieren, da seine Intensität außerhalb des Brennpunkts unterhalb der Polymerisationsschwelle des Polymers liegt. Die Struktur des photonischen Kristalls wird aufgebaut, indem der Brennpunkt der Linse nacheinander an alle gewünschten Positionen bewegt und so die dreidimensionale Mikrostruktur geschrieben wird. Das starke Schwellwertverhalten der Polymerisation ermöglicht es, die Auflösung des Prozesses über die Beugungsgrenze hinaus zu verbessern. Neuere Verfahren ermöglichen auch die Herstellung von elektrisch ansprechbaren photonischen Kristallen mit variablem Brechungsindex (GRIN-Kristalle).
Herstellungsverfahren
In den frühen 1990er Jahren wurden photonische Kristalle mithilfe von modifizierten traditionellen Herstellungsverfahren der Halbleitertechnik hergestellt. Ein Jahrzehnt später, etwa ab dem Jahr 2000, wurden zahlreiche Verfahren („bottom-up“ und „top-down“) zur Herstellung von dreidimensionalen photonischen Kristallen neu entwickelt und mit unterschiedlichem Erfolg eingeführt. Die bekanntesten sind die kolloidale Selbstorganisation, die holographische Lithographie und direktes Schreiben mittels dreidimensionaler Multiphotonen-Mikrolithographie. Kolloidale Kugeln mit einheitlicher Größe und Durchmessern im Submikrometerbereich neigen dazu, sich spontan in einem flächenzentrierten kubischen Gitter anzuordnen. So entsteht ein synthetischer Opal, der als Schablone genutzt und mit einem Halbleitermaterial wie Silicium durchtränkt werden kann. Anschließendes Entfernen der Schablone ergibt einen als inversen Opal bezeichneten dreidimensionalen photonischen Kristall aus dem Halbleitermaterial, der periodisch angeordnete Hohlräume enthält. Eine Schwierigkeit bei dieser Methode besteht darin, bei der Züchtung des ursprünglichen Opals die Bildung polykristalliner Segmente zu verhindern, die mit schädlichen Gitterdefekten einhergehen. Bei der dreidimensionalen holographischen Lithographie erzeugen mehrere Laserstrahlen Interferenzmuster auf einer Schicht eines Photolacks. Dabei werden stark belichtete Bereiche des Photolacks unlöslich, so-
217
218
7 Optik photonischer Kristalle
Aufgaben
Aufgabe 7-6: Viertelwellen- und Halbwellenstapel
Aufgabe 7-1: Strahlteiler-Platte
Geben Sie Ausdrücke für den Reflexionsgrad eines Stapels aus 𝑁 Doppelschichten von dielektrischen Materialien derselben optischen Dicke 𝑛1 d 1 = 𝑛2 d 2 an, wenn diese gleich 𝜆0 ∕4 und 𝜆0 ∕2 sind.
Eine verlustfreie dielektrische Platte mit dem Brechungsindex 𝑛 und der Dicke d in einem Winkel von 45◦ zu einem einfallenden Strahl wird als Strahlteiler verwendet. Leiten Sie Ausdrücke für die Transmission und Reflexion her und skizzieren Sie deren spektrale Abhängigkeit für TE- und TM-Polarisation. Aufgabe 7-2: Luftspalt in Glas
Bestimmen Sie die Transmission durch einen dünnen ebenen Luftspalt der Breite d = 𝜆∕2 in Glas mit einem Brechungsindex 𝑛. Nehmen Sie (a) senkrechten Einfall und (b) eine unter einem Winkel größer als der kritische Winkel einfallende TE-Welle an. Kann die Welle den Spalt überwinden (durchtunneln)? Aufgabe 7-3: Mehrschicht-Bauelement in einem nicht angepassten Medium
In einem Medium mit dem Brechungsindex 𝑛1 , der gleich dem seiner ersten Schicht ist, ist der komplexe Amplitudenreflexionsgrad eines Mehrschicht-Bauelements gleich r𝑚 . Zeigen Sie, dass der Amplitudenreflexionsgrad r = (r𝑏 + r𝑚 )∕(1 + r𝑏 r𝑚 ) ist, wenn sich das Bauelement stattdessen in einem Medium mit dem Brechungsindex 𝑛 befindet, wobei r𝑏 = (𝑛 − 𝑛1 )∕(𝑛 + 𝑛1 ) der Reflexionsgrad der neuen Grenzfläche ist. Bestimmen Sie r in jedem der folgenden Grenzfälle: r𝑏 = 0, r𝑏 = 1, r𝑚 = 0, und r𝑚 = 1.
Aufgabe 7-7: Ein Braggreflektor aus GaAs/AlAs
Ein Braggreflektor besteht aus 𝑁 Einheiten von alternierenden Schichten aus GaAs (𝑛1 = 3.57) und AlAs (𝑛2 = 2.94) mit den Dicken d 1 und d 2 , die gleich einer viertel Wellenlänge im jeweiligen Medium sind. Das Gitter befindet sich in einem ausgedehnten GaAs-Medium. Berechnen und skizzieren Sie die Transmission und den Reflexionsgrad des Gitters als Funktionen von 𝑁 für 𝑁 = 1, 2, … , 10 für die Braggfrequenz. Aufgabe 7-8: Bragggitter: Spektrale und Winkelabhängigkeit des Reflexionsgrads
Schreiben Sie ein auf der Matrizenalgebra beruhendes Computerprogramm, um die Wellentransfermatrix und den Reflexionsgrad eines Bragggitters aus 𝑁 alternierenden dielektrischen Schichten zu bestimmen. Verwenden Sie Ihr Programm, um die in den Abb. 7.13 und 7.14 gezeigten Kurven für die spektrale und Winkelabhängigkeit des Reflexionsgrads nachzuprüfen. Aufgabe 7-9: Verhältnis Bandlücke/Mittenfrequenz
Betrachten Sie den Viertelwellen-Antireflexbelag aus Übung 7-1 und geben Sie einen Ausdruck für den Reflexionsgrad als Funktion des Einfallswinkels an.
Verwenden Sie einen fourieroptischen Ansatz, um die Braggfrequenz und das Verhältnis Breite zu Mittenfrequenz der Bandlücke für die tiefste Bandlücke einer eindimensionalen periodischen Struktur zu bestimmen, die aus einem Stapel von dielektrischen Schichten derselben optischen Dicke mit 𝑛1 = 1.5 und 𝑛2 = 3.5 und der Periode 𝛬 = 2 μm besteht. Nehmen Sie an, dass sich die Welle entlang der Achse der Periodizität ausbreitet. Wiederholen Sie das Verfahren für 𝑛1 = 3.4 und 𝑛2 = 3.6. Vergleichen Sie Ihre Ergebnisse.
Aufgabe 7-5: Transmissionsgrad eines Fabry-PérotEtalons
Aufgabe 7-10: Schief einfallende Welle in eindimensionalem periodischen Medium
Die Transmission eines symmetrischen Fabry-PérotEtalons wurde unter Verwendung von Licht aus einer abstimmbaren monochromatischen Lichtquelle gemessen. Die Transmission als Funktion der Frequenz zeigt periodische Peaks mit einer Halbwertsbreite von 5 MHz und einer Periode von 150 MHz. Nehmen Sie an, dass das Medium zwischen den Resonatorspiegeln ein Gas mit 𝑛 = 1 ist und bestimmen Sie die Länge und Finesse des Resonators. Nehmen Sie an, dass Verluste ausschließlich an den Spiegeln auftreten und bestimmen Sie deren Reflexionsvermögen.
Leiten Sie Gleichungen analog zu den in den Gln. (7.86)– (7.90) angegebenen für eine schief einfallende Welle her, die sich mit einem transversalen Wellenvektor 𝑘𝑥 durch ein eindimensionales periodisches Medium ausbreitet.
Aufgabe 7-4: Viertelwellenschicht: Die Winkelabhängigkeit des Reflexionsgrads
Aufgabe 7-11: Achsennormale Welle in einem eindimensionalen periodischen Medium
Verwenden Sie die Ergebnisse aus Aufgabe 7-10, um zu zeigen, dass es für eine Welle, die sich senkrecht zur Achse eines eindimensionalen periodischen Mediums ausbreitet, d. h. für K = 0, keine Bandlücken gibt.
Aufgaben
Aufgabe 7-12: Omnidirektionaler Reflektor
Ein periodischer Stapel von Doppelschichten dielektrischer Materialien mit 𝑛1 d 1 = 𝑛2 d 2 , 𝑛2 = 2𝑛1 und 𝛬 = d 1 + d 2 soll als omnidirektionaler Reflektor in Luft verwendet werden. Tragen Sie die projizierte Dispersionsrelation auf, die die Lichtlinie für Luft enthält (ein Diagramm ähnlich Abb. 7.24). Bestimmen Sie den Frequenzbereich (in Einheiten von 𝜔ℬ ), in dem omnidirektionale Reflexion stattfindet.
Weiterführende Literatur Bücher über Schicht- und periodische Medien
O. Stenzel, The Physics of Thin Film Optical Spectra: An Introduction, Springer, 2. Aufl. 2015. A. B. Shvartsburg, A. A. Maradudin, Waves in Gradient Metamaterials, World Scientific/Imperial College Press 2013. R. Kashyap, Fiber Bragg Gratings, Academic Press, 2. Aufl. 2010. Š. Višňovský, Optics in Magnetic Multilayers and Nanostructures, CRC Press 2006. P. Yeh, Optical Waves in Layered Media, Wiley 2005. M. Nevière, E. Popov, Light Propagation in Periodic Media: Differential Theory and Design, CRC Press 2003. M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002, Abschnitt 1.6. W. C. Chew, Waves and Fields in Inhomogeneous Media, Van Nostrand Reinhold 1990, IEEE Press, Nachdruck 2002. A. Yariv, P. Yeh, Optical Waves in Crystals: Propagation and Control of Laser Radiation, Wiley 1985, Dover, Nachdruck 2002. L. Brillouin, Wave Propagation in Periodic Structures: Electric Filters and Crystal Lattices, Dover, 2. Aufl. 1953, Nachdruck 2003. Bücher über photonische Kristalle
Q. Gong, X. Hu, Photonic Crystals: Principles and Applications, CRC Press/Taylor & Francis 2013. M. F. Limonov, R. M. De La Rue, Optical Properties of Photonic Structures: Interplay of Order and Disorder, CRC Press/Taylor & Francis 2012. D. W Prather, S. Shi, A. Sharkawy, J. Murakowski, G. J. Schneider, Photonic Crystals: Theory, Applications, and Fabrication, Wiley 2009. 1. A. Sukhoivanov, I. V. Guryev, Photonic Crystals: Physics and Practical Modeling, Springer 2009. M. Skorobogatiy, J. Yang, Fundamentals of Photonic Crystal Guiding, Cambridge University Press 2009.
J. D. Joannopoulos, R. D. Meade, J. N. Winn, Photonic Crystals: Molding the Flow of Light, Princeton University Press, 2. Aufl. 2008. J.-M. Lourtioz, H. Benisty, V. Berger, J.-M. Gerard, D. Maystre, A. Tchelnokov, Photonic Crystals: Towards Nanoscale Photonic Devices, Springer, 2. Aufl. 2008. P. Markos, C. M. Soukoulis, Wave Propagation: From Electrons to Photonic Crystals and Left-Handed Materials, Princeton University Press 2008. K. Sakoda, Optical Properties of Photonic Crystals, Springer, 2. Aufl. 2005. K. Inoue, K. Ohtaka (Hrsg.), Photonic Crystals: Physics, Fabrication and Applications, Springer 2004. S. Noda, T. Baba (Hrsg.), Roadmap on Photonic Crystals, Kluwer 2003. V. Kochergin, Omnidirectional Optical Filters, Kluwer 2003. Grundlegende Artikel und Reviews
L. Nucara, F. Greco, V. Mattoli, ‚Electrically Responsive Photonic Crystals: A Review‘, Journal of Materials Chemistry C 3, 8449–8467, 2015. Q. Zhu, L. Jin, Y. Fu, ‚Graded Index Photonic Crystals: A Review‘, Annalen der Physik 527, 205–218, 2015. G. von Freymann, V. Kitaev, B. V. Lotsch, G. A. Ozin, ‚Bottom-Up Assembly Of Photonic Crystals‘, Chemical Society Reviews 42, 2528–2554, 2013. D. Xia, J. Zhang, X. He, S. R. J. Brueck, ‚Fabrication of Three-Dimensional Photonic Crystal Structures by Interferometric Lithography and Nanoparticle SelfAssembly‘, Applied Physics Letters 93, 071105, 2008. T. Asano, B.-S. Song, Y. Akahane, S. Noda, ‚Ultrahigh-Q Nanocavities in Two-Dimensional Photonic Crystal Slabs‘, IEEE Journal of Selected Topics in Quantum Electronics 12, 1123–1134, 2006. Á. Blanco, P. D. García, D. Golmayo, B. H. Juárez, C. López, ‚Opals for Photonic Band-Gap Applications‘, IEEE Journal of Selected Topics in Quantum Electronics 12, 1143–1150, 2006. M. Qi, E. Lidorikis, P. T. Rakich, S. G. Johnson, J. D. Joannopoulos, E. P. Ippen, H. I. Smith, ‚A Three-Dimensional Optical Photonic Crystal with Designed Point Defects‘, Nature 429, 538–542, 2004. S. P. Ogawa, M. Imada, S. Yoshimoto, M. Okano, and S. Noda, ‚Control of Light Emission by 3D Photonic Crystals‘, Science 305, 227–229, 2004. E. Yablonovitch, ‚Photonic Crystals: Semiconductors of Light‘, Scientific American 285(6), 47, 2001. Y. A. Vlasov, X. Z. Bo, J. C. Sturm, D. J. Norris, ‚On-Chip Natural Assembly of Silicon Photonic Bandgap Crystals‘, Nature 414, 289–293, 2001. S. G. Johnson, J. D. Joannopoulos, ‚Block-Iterative Frequency-Domain Methods for Maxwell’s Equations in a Plane-wave Basis‘, Optics Express 8, 173, 2001.
219
220
7 Optik photonischer Kristalle
A. Blanco, E. Chomski, S. Grabtchak, M. Ibisate, S. John, S. W. Leonard, C. Lopez, F. Meseguer, H. Miguez, J. P. Mondia, G. A. Ozin, O. Toader, H. M. van Driel, ‚LargeScale Synthesis of a Silicon Photonic Crystal with a Complete Three-Dimensional Bandgap Near 1.5 Micrometres‘, Nature 405, 437–440, 2000. M. Campbell, D. N. Sharp, M. T. Harrison, R. G. Denning, A. J. Turberfield, ‚Fabrication of Photonic Crystals for the Visible Spectrum by Holographic Lithography‘, Nature 404, 53–56, 2000. H. B. Sun, S. Matsuo, H. Misawa, ‚Three-Dimensional Photonic Crystal Structures Achieved with Two-Photon-Absorption Photopolymerization of Resin‘, Applied Physics Letters 74, 786–788, 1999. J. G. Fleming, S.-Y Lin, ‚Three-Dimensional Photonic Crystal with a Stop Band from 1.35 to 1.95 μm‘, Optics Letters 24, 51–51, 1999. J. D. Joannopoulos, P. R. Villeneuve, S. Fan, ‚Photonic Crystals: Putting a New Twist on Light‘, Nature 386, 143–149, 1997.
P. R. Villeneuve, M. Piché, ‚Photonic Bandgaps in Periodic Dielectric Structures‘, Progress in Quantum Electronics 18, 153, 1994. S. John, ‚Localization of Light‘, Physics Today 44(5), 32–40, 1991. E. Yablonovitch, T. J. Gmitter, K. M. Leung, ‚Photonic Band Structures: The Face-Centered Cubic Case Employing Non-Spherical Atoms‘, Physical Review Letters 67, 2295, 1991. S. John, ‚Strong Localization of Photons in Certain Disordered Dielectric Superlattices‘, Physical Review Letters 58, 2486, 1987. E. Yablonovitch, ‚Inhibited Spontaneous Emission in SolidState Physics and Electronics‘, Physical Review Letters 58, 2059, 1987.
221
8 Optik von Metallen und Metamaterialien In elektrisch leitfähigen Medien wie z. B. Metallen kann sich sichtbares Licht nicht ausbreiten. Wenn ein Lichtstrahl die Grenzfläche zu einem solchen Medium überschreitet, nimmt seine Intensität innerhalb einer sehr kurzen Distanz, die als Eindringtiefe bezeichnet wird und wesentlich kleiner als eine Wellenlänge sein kann, schnell ab. Eine metallische Oberfläche wirkt wie eine Art Spiegel, der das Licht vollständig in das angrenzende dielektrische Medium zurückwirft. In den vorangegangenen Kapiteln dieses Buches traten metallische Komponenten aus diesem Grund immer nur in der Rolle einfacher Spiegel auf. Es zeigt sich jedoch, dass Metalle durchaus Lichtwellen führen können, so lange diese sich in Abständen von weniger als einer Wellenlänge unterhalb der Oberfläche entlang der Grenzfläche des Metalls ausbreiten. Derartige Lichtwellen bewegen sich in Form einer geführten Oberflächenwelle entlang der Metalloberfläche. Licht kann sich demzufolge auf metallischen Drähten ausbreiten, jedoch nicht in ihnen. Metallische Strukturen mit Abmessungen im Subwellenlängenbereich sind in der Lage, Licht zu führen und als integrierte photonische Schaltkreise zu agieren. Sie können auch als Resonatoren wirken, Licht einschließen oder bei bestimmten Resonanzfrequenzen stark streuen. Dank neuerer Fortschritte in der Nanotechnologie können solche metallischen Strukturen mit Dimensionen von weniger als einer Wellenlänge in dielektrische Materialien eingebettet werden. Die so entstehenden synthetischen photonischen Kristalle kommen in der Natur nicht vor. Sie werden als Metamaterialien bezeichnet und haben den Vorteil, dass man ihnen gezielt bestimmte nützliche optische Eigenschaften verleihen kann. Metamaterialien ermöglichen eine Vielzahl völlig neuer Anwendungen und spielen in der Photonik eine zunehmend wichtige Rolle. Metalle und Metamaterialien besitzen eine Reihe von außergewöhnlichen optischen Eigenschaften:
• Eine Grenzfläche zwischen Metall und Dielektrikum kann als Wellenleiter wirken, der eine optische Welle bei ihrer Ausbreitung entlang der Grenzfläche führt. Eine solche Oberflächenwelle wird als Oberflächenplasmonpolariton (OPP) bezeichnet (engl. surface plasmon polariton, SPP). Sie ist auf die unmittelbare Umgebung der Grenzfläche eingegrenzt und wird von einer longitudinalen Welle elektrischer Ladungsdichte (einer Plasmawelle) derselben Frequenz begleitet, die sich ebenfalls entlang der Metalloberfläche ausbreitet. Die enge Eingrenzung und die kleine Wellenlänge von OPP können zu einer signifikanten Erhöhung der lokalen Feldstärke führen. Anwendungen im Bereich Biosensorik beruhen auf der großen Empfindlichkeit von OPP gegenüber den Eigenschaften der umgebenden dielektrischen Medien. • An den Grenzflächen von metallischen Strukturen mit Dimensionen unterhalb einer Wellenlänge (z. B. Nanokugeln), die in dielektrische Medien eingebettet sind, können Plasmonoszillationen auftreten. Diese sogenannten Partikelplasmonen oder lokalisierten Oberflächenplasmonen (engl. localized surface plasmons) zeigen Resonanz, wenn die Anregungsfrequenz mit der Resonanzfrequenz der jeweiligen Struktur übereinstimmt, die typischerweise in den sichtbaren oder ultravioletten Bereich des Spektrums fällt. Die Folge sind eine resonant erhöhte Absorption und/oder Streuung, was sich durch intensive Farben sowohl in Transmission als auch in Reflexion äußert. Man nennt diese metalloptische Technologie Plasmonik; sie wird in vielen Bereichen von der Herstellung von Glasmalereien bis zur Prüfung der dielektrischen Eigenschaften eines Mediums praktisch angewendet. • Auch Nanoantennen und Bauelemente von optischen Schaltkreisen können mithilfe metallischer Nanostrukturen hergestellt werden. Sie entsprechen ihren jeweiligen Gegenstücken für Radiowellen und Mikrowellen, arbeiten jedoch im infraroten und sichtbaren Bereich. Ziel der Plasmonik ist es, die Domänen der hochintegrierten Mikroelektronik (mit Ab-
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
222
8 Optik von Metallen und Metamaterialien
messungen < 100 nm) und der ultraschnellen Photonik mit optischen Frequenzen (mit Bandbreiten > 100 THz) zu verbinden. Mögliche Anwendungen in der Zukunft könnten beispielsweise Intrachip-Verbindungen sein. • Durch Aufbringen von regelmäßigen Metallstrukturen auf die Grenzfläche zwischen zwei dielektrischen Medien entstehen Metaoberflächen mit außergewöhnlichen optischen Eigenschaften, die durch die Form der metallischen Elemente und ihre geometrische Anordnung bestimmt werden. Metaoberflächen verhalten sich in mancher Hinsicht ähnlich wie optische Antennenarrays; sie lenken Licht auf ungewöhnliche Weise ab, ohne die üblichen Gesetze der Reflexion und Brechung zu befolgen, die für dielektrische Grenzflächen gelten. • Materialien mit eingebetteten metallischen und dielektrischen Strukturen mit Dimensionen unterhalb einer Wellenlänge, die in Abständen von einer Wellenlänge oder weniger über das gesamte Volumen verteilt sind, besitzen neuartige elektrische und magnetische Eigenschaften, die aus elektrischen Ladungen und induzierten Strömen in den metallisch leitenden Strukturen resultieren. Solche Metamaterialien können interessante optische Eigenschaften wie z. B. einen negativen Brechungsindex besitzen, wodurch ein negativer Brechungswinkel an der Grenzfläche zu einem herkömmlichen dielektrischen Medium möglich wird. • Metamaterialien können mit räumlich variierenden optischen Eigenschaften versehen werden, die ungewöhnliche Wirkungen auf optische Wellen zur Folge haben. Beispielsweise ist es möglich, Licht mithilfe von Metamaterialien um Objekte herum zu leiten, sodass diese unsichtbar werden. Eine wahrhaft magische Anwendung hiervon wäre z. B. ein Tarnumhang. Genau wie bei dielektrischen Medien werden auch die optischen Eigenschaften von Metallen und Metamaterialien durch die in Kapitel 5 diskutierte elektromagnetische Theorie des Lichts beschrieben. Der Hauptunterschied besteht darin, dass die elektrische Permittivität 𝜀 und die magnetische Permeabilität 𝜇 für Metalle und Metamaterialien negative Werte annehmen können. Materialien, für die einer dieser beiden Parameter negativ ist, werden als einfach-negative (EN) Materialien bezeichnet, wohingegen solche, für die beide negativ sind, doppelt-negative (DN) Materialien genannt werden. Herkömmliche verlustfreie dielektrische Medien sind in dieser Terminologie doppelt-positive (DP) Materialien.
In diesem Kapitel . . . Das Kapitel beginnt mit einem einführenden Abschnitt, in dem einige der optischen Eigenschaften von EN- und DN-Medien untersucht werden (Abschnitt 8.1). Hier wird gezeigt, dass an DP/ENGrenzflächen oberflächengeführte Wellen existieren, die negative Brechung an einer DP-DN-Grenzfläche wird beschrieben und einige der möglichen Anwendungen von Materialien mit negativem Brechungsindex werden diskutiert. Abschnitt 8.2 ist eine Einführung in die Optik und Plasmonik von Metallen. Zunächst wird mit dem Drudemodell ein physikalisches Modell für die Optik von Metallen vorgestellt und es wird gezeigt, dass sich ein Metall unter bestimmten Bedingungen wie ein EN-Material verhalten kann. OPP-Wellen an der Grenzfläche zwischen einem Metall und einem Dielektrikum werden untersucht. Die Rayleighstreuung von Licht an einer metallischen Nanokugel wird betrachtet und mit der Rayleighstreuung an einer dielektrischen Kugel (wie in Abschnitt 5.6.2 beschrieben) verglichen. Schließlich werden optische Antennen kurz beschrieben. Abschnitt 8.3 behandelt die Optik von Metamaterialien. Er befasst sich mit den verschiedenen Formen und Anordnungen von metallischen Objekten, die in ein dielektrisches Medium eingebettet oder auf eine dielektrische Oberfläche aufgebracht werden können, um ihr besondere makroskopische Eigenschaften zu verleihen, d. h. Werte von 𝜀(𝜔) und 𝜇(𝜔) mit den gewünschten Vorzeichen der Real- und Imaginärteile. Von besonderem Interesse ist hier das Design von Materialien mit negativen Brechungsindizes. In Abschnitt 8.4 wird die Transformationsoptik vorgestellt, ein mathematisches Werkzeug, mit dessen Hilfe sich gezielt optische Materialien entwerfen lassen, die Licht auf gewünschten Bahnen leiten. Das Ziel kann beispielsweise sein, Licht mithilfe von geeigneten Metamaterialien auf speziellen Trajektorien um ein Objekt herum zu leiten, sodass es unsichtbar wird. Da die Optik von Metamaterialien, eines der Hauptthemen dieses Kapitels, die Wechselwirkung von Licht mit Strukturen im Subwellenlängenbereich (in der Größenordnung von Nanometern) ausnutzt, gehört sie in das Reich der Nanophotonik, auch Nanooptik genannt. Im Gegensatz dazu konzentrierten sich die vorangegangenen Kapitel hauptsächlich auf die Ausbreitung von Licht durch dielektrische Materialien und Komponenten mit Abmes-
8.1 Einfach- und doppelt-negative Medien
sungen, die wesentlich größer waren als die Wellenlänge des Lichts. Die folgenden Kapitel über die Optik geführter Wellen (Kapitel 9), Faseroptik (Kapitel 10) und Resonatoroptik (Kapitel 11) befassten sich zunächst mit der Ausbreitung von Licht durch Strukturen mit Abmessungen in der Größenordnung von Mikrometern, der sogenannten Mikrooptik. In den letzten Jahren beginnen die Grenzen zwischen Nanound Mikrooptik jedoch zu verwischen. Vor allem dank der Plasmonik ist die Nanooptik in das Gebiet der Mikrooptik eingedrungen, wie die folgenden Beispiele veranschaulichen: Oberflächenplasmonen in kombinierten metallischen/dielektrischen Strukturen im Subwellenlängenbereich haben plasmonische Wellenleiter hervorgebracht, wie in Kapitel 9 beschrieben wird. Ähnlich haben lokalisierte Oberflächenplasmonen an der Grenzfläche von metallischen Strukturen mit Abmessungen im Subwellenlängenbereich zu den umgebenden Dielektrika zur Entwicklung von Plasmonresonatoren und Plasmonlasern geführt, wie wir in den Kapiteln 11 und 18 sehen werden.
8.1 Einfach- und doppelt-negative Medien Wie in Kapitel 5 diskutiert wird die Ausbreitung einer elektromagnetischen Welle durch ein lineares isotropes Medium durch die elektrische Permittivität 𝜀 und die magnetische Permeabilität 𝜇 des Materials charakterisiert. Im Allgemeinen sind beide Größen frequenzabhängig und komplex. Welleneigenschaften wie die Ausbreitungskonstante, die Geschwindigkeit, der Dämpfungskoeffizient, die Impedanz oder die Dispersionsrelation können leicht aus 𝜀 und 𝜇 bestimmt werden. Die Vorzeichen der Real- und Imaginärteile von 𝜀 und 𝜇 bei einer gegebenen Frequenz bestimmen die verschiedenen Bereiche der Wellenausbreitung: • Für Medien mit reellem und positivem 𝜇 (was bedeutet, dass Magnetfelder weder absorbiert noch verstärkt werden) hängen die Eigenschaften der Wellenausbreitung von den Vorzeichen des Real- und Imaginärteils von 𝜀 ab, wie wir in Kapitel 5 diskutiert hatten: – Wenn 𝜀 reell ist, zeigt das Medium weder dielektrische Absorption noch Verstärkung (es ist verlustfrei und passiv) und Wellen breiten sich ungedämpft aus, wie in den Abschnitten 5.1–5.4 beschrieben. – Wenn Absorption auftritt (Abschnitt 5.5), ist 𝜀 komplex und Im{𝜀} ≡ 𝜀′′ negativ, aber Re{𝜀} ≡ 𝜀′ kann
sowohl positiv als auch negativ sein. Für das in Abschnitt 5.5.3 beschriebene resonante Medium ist der Imaginärteil Im{𝜒} = 𝜒 ′′ der elektrischen Suszeptibilität beispielsweise negativ (siehe Abb. 5.20) und folglich auch 𝜀′′ = 𝜀0 𝜒 ′′ . Für das Verhalten des Realteils 𝜒 ′ der Suszeptibilität, das ebenfalls in Abb. 5.20 dargestellt ist, gilt, dass 𝜀′ = 𝜀0 (1 + 𝜒 ′ ) für Frequenzen unterhalb der Resonanzfrequenz positiv ist, aber oberhalb der Resonanzfrequenz negativ werden kann. – Für ein aktives Medium mit Verstärkung, wie beispielsweise ein Lasermedium, ist 𝜒 ′′ positiv (die Verstärkung entspricht einer negativen Absorption, siehe Abschnitt 15.1.1). In diesem Fall ist 𝜀′′ positiv, während 𝜀′ sowohl positiv als auch negativ sein kann. • Ähnlich bestimmen in Medien mit reellem und positivem 𝜀 die durch 𝜇 beschriebenen magnetischen Eigenschaften die Charakteristik der Wellenausbreitung. Magnetische Medien einschließlich solcher mit metallischen Bestandteilen, die induzierte elektrische Ströme führen und Magnetfelder erzeugen, haben im Allgemeinen komplexe Werte von 𝜇, wobei sowohl die Real- als auch die Imaginärteile entweder positiv oder negativ sein können. • Im allgemeinsten Fall ist die Art, wie die Vorzeichen der Real- und Imaginärteile von 𝜀 und 𝜇 die Eigenschaften der Wellenausbreitung bestimmen, komplizierter. In der folgenden Darstellung beschränken wir uns auf verlustfreie und passive Medien, in denen weder Absorption noch Verstärkung auftritt, d. h. wir halten uns beispielsweise von dielektrischen und magnetischen Resonanzen fern. Unter diesen Umständen sind sowohl 𝜀 als auch 𝜇 reell mit Vorzeichen, die je nach Frequenz positiv oder negativ sein können. Daraus ergeben sich vier Fälle (siehe Abb. 8.1): Doppelt-positive Materialien (DP). Hier sind sowohl 𝜀
als auch 𝜇 positiv; die Materialien sind transparent und haben einen positiven Brechungsindex. In diese Kategorie fallen gewöhnliche dielektrische Medien. Einfach-negative Materialien (EN). In diesen Fällen ist entweder 𝜀 oder 𝜇 negativ. Diese Materialien sind undurchsichtig, können jedoch an Grenzflächen zu DPMaterialien optische Oberflächenwellen führen. Wie wir in Abschnitt 8.2 sehen werden, besitzen Metalle wie Gold oder Silber im infraroten und sichtbaren Spektralbereich negative Werte von 𝜀, aber positive Werte von 𝜇. In Ferriten ist im Mikrowellenbereich umgekehrt 𝜀 positiv und 𝜇 negativ.
223
224
8 Optik von Metallen und Metamaterialien
Abb. 8.1 Die Charakterisierung von DP-, EN- und DNMaterialien durch die Vorzeichen von 𝜀 und 𝜇.
µ
EN
DP ɛ
0
DN
EN
Hier ist sowohl 𝜀 als auch 𝜇 negativ. Diese Materialien werden aus Gründen, die später klar werden, auch linkshändige Medien genannt. Sie sind transparent und haben einen negativen Brechungsindex, was bedeutet, dass das snelliussche Gesetz für die Brechung an der Grenzfläche zu einem doppelt-negativen (dielektrischen) Medium zu einem negativen Brechungswinkel führt. Die Auswirkungen dieser Eigenart auf optische Komponenten mit mehreren Grenzflächen sind außerordentlich interessant. Metamaterialien können so konzipiert werden, dass sie in bestimmten Frequenzbändern derartige Eigenschaften aufweisen.
Doppelt-negative Materialien (DN).
Wir beginnen damit, die optischen Eigenschaften von linearen, verlustfreien, passiven Medien im DP-, EN- und DN-Fall zu untersuchen. Verlustbehaftete DNMedien werden wir am Ende von Abschnitt 8.1.1 besprechen. Zunächst werden wir uns nicht darum kümmern, ob solche Medien in der Natur existieren oder synthetisch hergestellt werden müssen; diesem Thema werden wir uns später in den Abschnitten 8.2 und 8.3 widmen.
8.1.1 Wellenausbreitung in einfachund doppelt-negativen Medien Die Ausbreitung einer monochromatischen elektromagnetischen Welle in einem linearen, homogenen und isotropen Medium mit der elektrischen Permittivität 𝜀 und der magnetischen Permeabilität 𝜇 wird in den Abschnitten 5.3 und 5.4 diskutiert. Die Maxwellgleichungen (5.53)–(5.56) gelten ebenso wie die Helmholtzgleichung (5.57) für beliebige komplexe 𝜀 und 𝜇, unabhängig von den Vorzeichen ihrer Real- und Imaginärteile. Der Einfachheit halber betrachten wir eine monochromatische ebene Welle mit den Feldvektoren E(r) = E0 exp(−ik ⋅ r) und H(r) = H0 exp(−ik ⋅ r) des elektrischen bzw. magnetischen Feldes und dem Wellenvektor k. Aus den maxwellschen Gleichungen folgt dann im Einklang mit den Gln. (5.63)–(5.66) k × H0 = −𝜔𝜀E0 ,
(8.1)
k × E0 = 𝜔𝜇H0 .
(8.2)
Die zugehörige Wellenzahl (der Betrag des Vektors k) ist √ 𝑘 = 𝜔 𝜀𝜇 , (8.3) und die Impedanz (das Verhältnis der Beträge von 𝐸0 und 𝐻0 ) ist wie in Gl. (5.67) angegeben √ 𝜇 𝜔𝜇 = . (8.4) 𝜂= 𝜀 𝑘 Gleichung (8.1) zeigt, dass E0 sowohl zu k als auch zu H0 orthogonal ist, während Gl. (8.2) bedeutet, dass H0 sowohl zu k als auch zu E0 orthogonal ist; die drei Vektoren bilden folglich einen orthogonalen Satz. Für feste orthogonale Richtungen der Felder E0 und H0 ist der Wellenvektor k somit orthogonal zu der durch die Feldvektoren definierten Ebene, wobei seine genaue Richtung von den Vorzeichen von 𝜀 und 𝜇 abhängt, wie wir gleich sehen werden. Da 𝑘 im Allgemeinen komplex ist, setzen wir 𝑘 = 𝛽 − i𝛾 mit reellen Parametern 𝛽 und 𝛾; dann gilt √ (8.5) 𝛽 − i𝛾 = 𝜔 𝜀𝜇 . Die Ausbreitungskonstante 𝛽 = 𝜔∕𝑐 bestimmt sowohl die Wellengeschwindigkeit 𝑐 = 𝑐0 ∕𝑛 als auch den Brechungsindex 𝑛, während 𝛾 den Dämpfungskoeffizienten 1 des Feldes beschreibt (𝛾 = 𝛼, wobei 𝛼 der Dämpfungs2 koeffizient der Intensität ist; siehe Abschnitt 5.5.1). Wir betrachten nun die Implikationen dieser Gleichungen für Medien mit reellen Werten von 𝜀 und 𝜇, wobei einer oder beide Werte negativ sein können. Doppelt-positive (DP) Medien
DP-Medien bieten uns einen einfachen und vertrauten Testfall. Sowohl 𝜀 als auch 𝜇 sind positiv, sodass 𝑘 und 𝜂 reell sind; daraus folgt √ √ 𝜇 𝜀 𝜇 , 𝜂= . (8.6) 𝛾 = 0 , 𝛽 = 𝑛𝑘0 , 𝑛 = 𝜀0 𝜇0 𝜀 Wie in Abschnitt 5.4.1 diskutiert, existieren in solchen Medien transversale elektromagnetische (TEM) Wellen, für die die Vektoren E0 , H0 und k gegenseitig orthogonal sind und ein rechtshändiges System bilden, wie 1 Abb. 8.2(a) illustriert. Der Poyntingvektor S = E0 × H0 2 zeigt in dieselbe Richtung wie der Wellenvektor k und die Intensität der Welle (Leistungsfluss pro Flächeneinheit) ist durch 𝐼 = Re{𝑆} = |𝐸0 |2 ∕2𝜂 gegeben. Einfach-negative (EN) Medien
In einem einfach-negativen Medium ist entweder 𝜀 oder 𝜇 negativ, sodass 𝑘 und 𝜂 beide imaginär sind. In diesem Fall liefert Gl. (8.5) √ √ |𝜇| 𝛾 = 𝜔 |𝜀| |𝜇| , 𝛽 = 0 , 𝜂 = i . (8.7) |𝜀|
8.1 Einfach- und doppelt-negative Medien
H
E
k
k S
S
H
S
E
(a) DP-Medium
E
k H
(b) DN-Medium
(c) DN-Medium
Abb. 8.2 (a) Eine ebene Welle breitet sich in einem normalen doppelt-positiven Medium aus. Die Vektoren E, H und k bilden einen rechtshändigen Satz und die Wellenfronten bewegen sich in dieselbe Richtung wie der Leistungsfluss. (b) Eine ebene Welle breitet sich in einem doppelt-negativen Medium aus. Die Vektoren E, H und k bilden einen linkshän-
digen Satz und die Wellenfronten bewegen sich entgegen der Richtung des Leistungsflusses. (c) Eine zu (b) äquivalente Darstellung, entstanden durch eine Drehung um 90◦ um die horizontale (S und k) Achse, die E in die Vertikale dreht, gefolgt von einer Drehung um 180◦ um die neue vertikale (E) Achse.
Diese Parameter beschreiben ein exponentiell abklingendes Feld, das sich wie exp(−𝛾𝑧) verhält, wenn 𝑧 die Richtung des Abklingens ist. Wegen 𝛽 = 0 sind in einem EN-Medium keine sich ausbreitenden Wellen möglich. Die optische Intensität wird in einer Tiefe d E = 1∕2𝛾 = √ 𝜆0 ∕4π |𝜀∕𝜀0 ||𝜇∕𝜇0 | um den Faktor 1∕e gedämpft. Die Größe d E wird als Eindringtiefe bezeichnet. 1) Die imaginäre Impedanz 𝜂 gibt an, dass zwischen dem elektrischen und dem magnetischen Feld eine Phasenverschiebung von π∕2 besteht. Darüber hinaus ist der Poyn1 tingvektor S = E0 × H∗0 ebenfalls imaginär, sodass für 2 die Intensität 𝐼 = Re{𝑆} = 0 gilt, was zeigt, dass keine Leistung durch ein solches Medium transportiert wird.
Ebenso wie im Fall des DP-Mediums sind die Vektoren E0 , H0 und k zueinander orthogonal. Die Umkehrung der Vorzeichen in den Gln. (8.9) und (8.10) im Vergleich zu den Gln. (8.1) und (8.2) für DP-Medien ist gleichbedeutend mit einem Rollentausch der elektrischen und magnetischen Felder. Abbildung 8.2 zeigt die Flussrichtungen der Wellenfronten und der Leistung in DP- und DN-Medien. Vergleicht man die Teilabbildungen (a) und (c), so wird deutlich, dass E0 , H0 und k in einem DP-Medium den üblichen rechtshändigen Satz von Vektoren bilden, wohingegen sie in einem DN-Medium einen linkshändigen Satz bilden (aus diesem Grund werden DN-Medien auch als linkshändig bezeichnet). Dies hat tiefgreifende Auswirkungen, da es bedeutet, dass der in Gl. (5.51) 1 eingeführte komplexe Poyntingvektor S = E0 × H∗0 in 2 einem DN-Medium antiparallel zum Wellenvektor k gerichtet ist. Da die Impedanz 𝜂 positiv ist, muss die Wellenzahl 𝑘 somit negativ sein, und dasselbe gilt wie in Gl. (8.8) vorweggenommen folglich auch für den Brechungsindex 𝑛. Ein DN-Material ist daher ein Material mit negativem Brechungsindex. Die Folgerungen hieraus werden wir in Abschnitt 8.1.2 kennenlernen.
Doppelt-negative (DN) Medien
In einem doppelt-negativen Medium sind√sowohl 𝜀 als auch 𝜇 negativ, sodass Gl. (8.5) zu 𝑘 = 𝜔 |𝜀| |𝜇| führt. Dieser Wert ist reell, also folgt √ 𝛾 = 0,
𝛽 = 𝑛𝑘0 ,
𝑛=−
|𝜀| |𝜇| , 𝜀0 𝜇0
√ 𝜂=
|𝜇| , (8.8) |𝜀|
woraus folgt, dass der Brechungsindex negativ sein muss. Wegen 𝛾 = 0 können sich Wellen in diesem Medium ohne Abschwächung ausbreiten. Die zu wählenden Vorzeichen für die Quadratwurzeln in Gl. (8.8) ergeben sich durch Untersuchen der Richtungen der Vektoren E0 , H0 und k, die direkt aus den maxwellschen Gleichungen abgeleitet werden können. Für ein DNMedium folgt aus den Gln. (8.1) und (8.2) k × H0 = 𝜔|𝜀|E0 , k × E0 = −𝜔|𝜇|H0 .
(8.9) (8.10)
1) Manchmal definiert man die Eindringtiefe auch als die Strecke, nach der das Feld (anstelle der Intensität) um den Faktor 1∕e abgenommen hat; in diesem Fall ist d ′E = 1∕𝛾.
Medien mit komplexen Werten von 𝜺 und 𝝁 Die Wahrscheinlichkeit, dass sowohl 𝜀 als auch 𝜇 bei einer bestimmten Frequenz reell und negativ sind, sind gering. Wenn wir beispielsweise beide Parameter durch das Modell eines resonanten Mediums beschreiben, wie wir das in Abschnitt 5.5.3 getan hatten, dann kann der Imaginärteil aufgrund der Kramers-Kronig-Beziehungen über den gesamten Frequenzbereich, in dem der Realteil negativ ist, nicht null werden (siehe die Abschnitte 5.5.2 und B.1). Es zeigt sich jedoch, dass Linkshändigkeit – und damit ein negativer Brechungsindex – durchaus in Verbindung mit Absorption auftreten kann.
225
226
8 Optik von Metallen und Metamaterialien
Für absorbierende Medien sind 𝜀 = 𝜀′ + i𝜀′′ und 𝜇 = 𝜇 ′ + i𝜇 ′′ komplex mit negativen Imaginärteilen 𝜀′′ bzw. 𝜇 ′′ . Wir wollen nun zeigen, dass wenn die Realteile 𝜀′ und 𝜇 ′ beide negativ sind, das Medium in der Tat auch für nicht verschwindende Imaginärteile 𝜀′′ und 𝜇 ′′ linkshändig ist. Wir betrachten dazu wie zuvor eine Welle der Form exp(−i𝛽𝑧) exp(−𝛾𝑧) mit positivem 𝛾, sodass sie sich in +𝑧-.Richtung abschwächt Die Ausbreitungskonstante 𝛽 können wir bestimmen, indem wir Gl. (8.5) in der Form (𝛽 − i𝛾)2 = 𝜔2 (𝜀′ + i𝜀′′ )(𝜇 ′ + i𝜇 ′′ ) schreiben und dann die Imaginärteile gleichsetzen; das ergibt 2𝛽𝛾 = 𝜔2 (−𝜇 ′′ 𝜀′ − 𝜀′′ 𝜇 ′ ). Wenn sowohl 𝜀′ als auch 𝜇 ′ negativ sind, müssen 𝛽 und ebenso der Brechungsindex negativ sein. Die Wellenfront wandert dann in −𝑧Richtung, also entgegen der Richtung des Abklingens. Wir zeigen nun, dass der Leistungsfluss immer in derselben Richtung wie das Abklingen der Leistung verläuft, sodass der Wellenvektor der Richtung des Leistungsflusses entgegengesetzt ist – das Medium ist folglich linkshändig. Der Leistungsfluss ist durch den Poyntingvektor √ 1 Re{ E × H∗ } gegeben. Wegen E0 = 𝜂H0 , wobei 𝜂 = 𝜇∕𝜀 2 die charakteristische Impedanz ist, und weil Re{𝜂} für passive Medien immer positiv ist, muss der Leistungsfluss für die in Abb. 8.2(c) gezeigte Anordnung der Felder in +𝑧-Richtung erfolgen. Man kann explizit zeigen, 1 dass Re{𝜂} > 0 ist, indem man arg{𝜂} = (arg{𝜇} − arg{𝜀}) 2 schreibt; da 𝜀′′ und 𝜇 ′′ beide negativ sind, muss π < arg{𝜀} < 2π und ebenso π < arg{𝜇} < 2π und folglich 1 1 − π < arg{𝜂} < π gelten, woraus sofort Re{𝜂} > 0 folgt. 2 2 Die Bedingung, dass der Realteil sowohl von 𝜀 als auch von 𝜇 negativ sein muss, ist hinreichend für Linkshändigkeit, aber nicht notwendig. Auch ein absorbierendes Medium, für das nur einer der beiden Parameter 𝜀′ und 𝜇 ′ negativ ist, kann linkshändig sein, was zeigt, dass es mehr linkshändige Medien als doppelt-negative gibt. Die notwendige und hinreichende Bedingung für Linkshändigkeit ist 2) 𝜇′ 𝜀′ + 0 (Medium 1) (8.12)
exp(+𝛾2 𝑦) exp(−i𝛽𝑧) ,
für 𝑦 < 0 (Medium 2) (8.13)
8.1 Einfach- und doppelt-negative Medien
θk DP
DP
DP
EN
(a)
(b)
Abb. 8.3 (a) An einer Grenzfläche zwischen zwei DP-Medien tritt Totalreflexion ein, wenn der Einfallswinkel größer ist als der kritische Winkel 𝜃k . (b) An der Grenzfläche zwischen einem DP- und einem EN-Medium tritt für beliebige Einfallswinkel vollständige Reflexion ein. In beiden Fällen entsteht in der Umgebung der Grenzfläche eine evaneszente Welle. y
y
x
Ey
ε1 > 0
DP
Hx Ez
E
1
H
z ε2 < 0
EN (a)
Ey 2
(b)
(c)
Abb. 8.4 (a) Schematische Darstellung einer optischen Oberflächenwelle, die sich entlang der Grenzfläche zwischen einem Medium mit positiver elektrischer Permittivität (DP-Medium, z. B. einem dielektrischen Material) und einem zweiten Medium mit negativer Permittivität (EN-Medium, z. B. ein Metall unterhalb der Plasmafrequenz) ausbreitet. Die zugehörige longitudinale Oberflächenladungswelle ist
dunkel dargestellt; die Breite jedes Segments soll seine Wellenlänge darstellen, die durch 2π∕𝛽 gegeben ist. (b) Das elektrische Feld Ey als Funktion des Abstands y von der Grenzfläche. (c) Die elektrischen und magnetischen Feldlinien und die zugehörige Ladung. Die Plasmonwelle dringt bis zu Tiefen d 1 und d 2 in das DP- bzw. EN-Medium ein und verläuft über eine Distanz d G entlang der Grenzfläche.
wobei 𝛽 eine gemeinsame Ausbreitungskonstante ist und 𝛾1 und 𝛾2 positive Dämpfungskoeffizienten sind. Damit die Helmholtzgleichung (5.57) in jedem Medium erfüllt ist, muss gelten
Da 𝛾1 und 𝛾2 beide positiv sind, kann diese Bedingung nur erfüllt sein, wenn 𝜀1 und 𝜀2 entgegengesetzte Vorzeichen haben. Wir schließen daher, dass eine solche Oberflächenwelle nicht an der Grenzfläche zwischen zwei Medien mit positiven elektrischen Permittivitäten existieren kann, sondern nur, wenn die elektrischen Permittivitäten der Medien entgegengesetzten Vorzeichen aufweisen. Da 𝜀𝐸𝑦 stetig ist und 𝜀 das Vorzeichen an der Grenzfläche wechselt, muss auch 𝐸𝑦 dort das Vorzeichen wechseln, wie Abb. 8.4(b) zeigt. Dies setzt wiederum die Existenz einer elektrischen Oberflächenladung in Form einer mit der optischen Frequenz 𝜔 schwingenden longitudinalen Ladungsdichtewelle voraus. Deren Feldlinien und die zugehörige Ladungsverteilung sind in Abb. 8.4(c) dargestellt. Die Kombination der Ladungsdichtewelle und der optischen Welle wird als Oberflächenplasmonpolariton (OPP) bezeichnet. 3)
−𝛾12 + 𝛽 2 = 𝜔2 𝜇𝜀1
und
− 𝛾22 + 𝛽 2 = 𝜔2 𝜇𝜀2 . (8.14)
Die Amplituden der drei Feldkomponenten sind in jedem Medium durch die Maxwellgleichungen miteinander verknüpft; die Amplituden in den beiden Medien hängen über die Randbedingungen zusammen. Da die Komponente 𝐻𝑥 stetig sein muss, besitzt sie in beiden Medien eine gemeinsame Amplitude 𝐻0 . Die Maxwellgleichungen (8.1) verlangen dann, dass die Amplituden der Komponenten 𝐸𝑦 in den beiden Medien (−𝛽∕𝜔𝜀1 𝑖)𝐻0 bzw. (−𝛽∕𝜔𝜀2 )𝐻0 sein müssen. Die Bedingung, dass 𝐷𝑦 = 𝜀𝐸𝑦 an der Grenzfläche stetig sein soll, ist somit automatisch erfüllt. Die Amplituden der Komponenten 𝐸𝑧 sind (−𝛾1 ∕i𝜔𝜀1 )𝐻0 in Medium 1 und (𝛾2 ∕i𝜔𝜀2 )𝐻0 in Medium 2. Da auch diese Komponente an der Grenzfläche stetig sein muss, folgt −
𝛾 𝛾1 = 2. 𝜀1 𝜀2
(8.15)
3) Ein Plasma ist eine Ansammlung positiver Ionen und freier Elektronen, deren resultierende Gesamtladung ungefähr null beträgt. Ein Plasmon ist ein Quasiteilchen (ein Quant) der Plasmaschwingung, genau wie ein Photon ein Quant des elektromagnetischen Feldes ist. Ein
227
228
8 Optik von Metallen und Metamaterialien
Die Eigenschaften der OPP-Oberflächenwelle lassen sich aus mithilfe von Gl. (8.14) aus 𝛾1 und 𝛾2 ableiten: √ 𝛽 = 𝑛G 𝑘0 , √ 𝛾1 =
𝑛G = −𝜀12
𝜀0 (𝜀1 + 𝜀2 )
𝑘0 ,
𝜀G , 𝜀0
𝜀G =
𝛾2 =
√
𝜀1 𝜀2 , 𝜀1 + 𝜀2 −𝜀22
𝜀0 (𝜀1 + 𝜀2 )
(8.16)
𝑘0 ,
(8.17)
√ wobei 𝑘0 = 𝜔 𝜀0 𝜇 die Vakuumwellenzahl bedeutet und 𝑛G und 𝜀G der zu dem OPP gehörige Brechungsindex bzw. die elektrische Permittivität sind (der Index „G“ steht für „Grenzfläche“). Damit die Oberflächenwelle sich ausbreiten kann, muss 𝛽 reell sein, was voraussetzt, dass 𝜀G positiv ist. Dies ist wiederum nur möglich, wenn |𝜀2 | > 𝜀1 ist; nur dann existiert die OPPOberflächenwelle. Dieselbe Bedingung sorgt auch dafür, dass 𝛾1 und 𝛾2 wie gefordert positiv sind. Die im Folgenden zusammengefassten Eigenschaften der Oberflächenwelle werden entscheidend durch das Verhältnis |𝜀2 |∕𝜀1 beeinflusst: • Ihre Geschwindigkeit ist 𝑐0 ∕𝑛0 und ihre Wellenlänge, die Plasmonwellenlänge, beträgt 𝜆0 ∕𝑛G . Für |𝜀2 | ≈ 𝜀1 wird 𝑛G groß, die Welle ist dann langsam und die Plasmonwellenlänge ist viel kleiner als die Vakuumwellenlänge 𝜆0 . • Der Dämpfungskoeffizient 𝛾2 im EN-Medium ist um den Faktor |𝜀2 |∕𝜀1 (der größer als eins ist) größer als der Koeffizient 𝛾1 im DN-Medium. Die Eindringtiefe d 2 = 1∕2𝛾2 in das EN-Medium ist daher immer um denselben Faktor kleiner als die Eindringtiefe d 1 = 1∕2𝛾1 in das DP-Medium, wie Abb. 8.4 illustriert. Für |𝜀2 | ≈ 𝜀1 ist 𝜀1 + 𝜀2 klein und beide Eindringtiefen sind wesentlich kleiner als die Vakuumwellenlänge 𝜆0 , sodass das OPP stark auf die Grenzfläche eingegrenzt ist. Dies ist eine bemerkenswerte Eigenschaft, die in vielen Anwendungen ausgenutzt werden kann. • Der Fluss der optischen Leistung in beiden Medien 1 kann aus Re{S} bestimmt werden, wobei S = E × 2 H∗ der komplexe Poyntingvektor ist [siehe Gl. (5.51)]. Da die Komponenten 𝐻𝑥 und 𝐸𝑧 um 90◦ phasenverschoben sind, fließt keine Leistung in 𝑦-Richtung. Im DP- und EN-Medium fließt die Leistung in 𝑧- bzw. −𝑧Richtung und der Betrag des Flusses ist durch den Betrag von Re{S} gegeben:
Polariton ist ein Quasiteilchen, das aus der Kopplung des elektromagnetischen Feldes (der Photonen) mit der elektrischen oder magnetischen Anregung eines Materials resultiert. Oberflächenplasmonpolaritonen resultieren aus der Kopplung von Photonen mit Oberflächenplasmonen.
𝛽 |𝐻 |2 exp(−𝛾1 𝑦) , 2𝜔𝜀1 0 𝛽 𝐼2 (𝑦) = |𝐻 |2 exp(+𝛾2 𝑦) . 2𝜔|𝜀2 | 0
𝐼1 (𝑦) =
(8.18)
Die Leistungen in den beiden Medien [die Flächen unter den Verteilungen 𝐼1 (𝑦) bzw. 𝐼2 (𝑦)] sind P1 =
𝛽 |𝐻 |2 , 4𝜔𝜀1 𝛾1 0
und P2 =
𝛽 |𝐻 |2 , 4𝜔|𝜀2 |𝛾2 0 (8.19)
sodass der Nettofluss P1 − P2 der Leistung proportional zu [(𝜀1 𝛾1 )−1 − (|𝜀2 |𝛾2 )−1 ] ist, was wiederum gemäß Gl. (8.15) proportional zu (𝜀22 − 𝜀12 ) ist. Im Grenzfall |𝜀2 | ≈ 𝜀1 geht der resultierende Nettofluss der Leistung somit gegen null. Beispiel 8-1: Eine OPP-Welle
An der Grenzfläche zwischen zwei Medien mit denselben (positiven) magnetischen Permeabilitäten 𝜇1 = 𝜇2 und den Permittivitäten 𝜀1 = 1.41𝜀0 und 𝜀2 = −47𝜀0 existiert eine OPP-Welle mit einer Vakuumwellenlänge 𝜆0 = 1000 nm mit folgenden Eigenschaften: 𝑛G = 1.206 ,
𝜆0 ∕𝑛G = 829.4 nm ,
d 1 = 381.1 nm ,
d 2 = 11.43 nm .
Zusammenfassung
An der Grenzfläche zwischen einem DP- und einem ENMedium mit einer negativen Permittivität kann eine optische TM-Oberflächenwelle zusammen mit der zugehörigen longitudinalen Oberflächenladungswelle auftreten, wenn die Bedingung −𝜀2 > 𝜀1 erfüllt ist; diese Kombination wird als Oberflächenplasmonpolariton (OPP) bezeichnet. Die Eindringtiefen des OPP in die beiden Medien sind wesentlich kleiner als eine optische Wellenlänge, das OPP ist somit auf die unmittelbare Umgebung der Grenzfläche eingegrenzt, was zu einer deutlichen Erhöhung der lokalen Feldstärke führt. Ein OPP hat den besonderen Vorteil, dass es räumlich im Nanometerbereich manipuliert werden kann, aber mit einer optischen Frequenz schwingt. Mit einer analogen Analyse kann man zeigen, dass an einer Grenzfläche zwischen einem DP- und einem EN-Medium mit negativer Permeabilität eine TE-Oberflächenwelle auftreten kann, wenn die Bedingung −𝜇2 > 𝜇1 erfüllt ist. Wie Abb. 8.5 schematisch illustriert, kann man auch zeigen, dass eine Oberflächenwelle an der Grenzfläche zwischen zwei EN-Medien auftreten kann, wenn 𝜀1 und 𝜀2 verschiedene Vorzeichen haben, 𝜇1 und 𝜇2 ebenfalls
8.1 Einfach- und doppelt-negative Medien
verschiedene Vorzeichen haben sowie eine Reihe weiterer Bedingungen hinsichtlich der Beträge dieser beiden Parameter erfüllt sind. An Grenzflächen zwischen zwei DP- oder zwischen zwei DN-Medien sind keine Oberflächenwellen möglich.
Beispiel 8-2: Ein Oberflächenplasmonpolariton an der Grenzfläche Gold/Si3 N4
µ2 µ1 4 3 TM
TE
2
–2 –1
1 0 –1
0 1
2
3
4
ε1 ε2
–2
TM
fen d 1 = 1∕2 Re{𝛾1 } und d 2 = 1∕2 Re{𝛾2 } auf beiden Seiten der Grenzfläche folgen. Die Abmessungen der Plasmonwelle sind d 1 und d 2 in transversaler Richtung und d G entlang der Grenzfläche.
TE
Abb. 8.5 An der Grenzfläche zwischen zwei Medien mit reellen Permittivitäten und Permeabilitäten können TModer TE-Oberflächenwellen auftreten, wenn die Verhältnisse 𝜀2 ∕𝜀1 und 𝜇2 ∕𝜇1 in die schattierten Bereiche fallen. Beispiel 8-1 entspricht 𝜇2 ∕𝜇1 = 1 und 𝜀2 ∕𝜀1 < −1.
Bei einer Vakuumwellenlänge 𝜆0 = 1000 nm betragen die Permittivitäten von Si3 N4 und Gold 𝜀1 = 1.41𝜀0 bzw. 𝜀2 = (−47 + i3.4)𝜀0 . Diese Werte sind identisch mit denen aus Beispiel 8-1, nur dass wir jetzt noch einen kleinen Imaginärteil von 𝜀2 berücksichtigen. Eine OPP-Welle, die sich an der Grenzfläche zwischen Gold und Si3 N4 ausbreitet, „sieht“ somit ungefähr die gleichen Werte von 𝑛G , d 1 und d 2 wie in Beispiel 8-1 angegeben. Die Ausbreitungsdistanz wird jedoch über √ d G = 1∕2𝛾G = 𝜆0 ∕4π Im { 𝜀G ∕𝜀0 } (8.21) durch den Imaginärteil von 𝜀2 bestimmt. Mithilfe von Gl. (8.20) erhalten wir 𝜀G ∕𝜀0 = 1.453 + i0.003234 und damit √ 𝜀G ∕𝜀0 = 1.206 + i0.001341 , woraus für 𝜆0 = 1 μm folgt d 𝐺 = 59.3 μm.
Oberflächenplasmonpolaritonen an der Grenzfläche zwischen einem DP- und einem verlustbehaftetem EN-Medium
Wir können das Ergebnis für ein verlustfreies ENMedium auf ein verlustbehaftetes Medium erweitern, indem wir 𝜀2 als komplex (𝜀2 = 𝜀2′ + i𝜀2′′ ) mit negativem Realteil 𝜀2′′ annehmen, während wir 𝜇1 = 𝜇2 sowie 𝜀1 reell und positiv lassen. Die Gln. (8.16) und (8.17) für die Parameter der OPP-Welle im verlustfreien Medium gelten mit geringfügigen Änderungen weiterhin: Die Parameter 𝛽, 𝜀G , 𝛾1 und 𝛾2 werden nun komplex. In Anlehnung an den Gedankengang bei der Formulierung der Gln. (5.92) und (8.5) verwendeten Ansatz schreiben wir Gl. (8.16) in der Form √ 𝛾G 𝜀𝜀 𝜀G = und 𝜀G = 1 2 , (8.20) 𝑛G − i 𝜀0 𝜀1 + 𝜀2 𝑘0 wobei 𝛾G der Amplituden-Dämpfungskoeffizient der sich ausbreitenden OPP-Welle ist. Offensichtlich √ ist der Brechungsindex der OPP-Welle dann 𝑛G = Re{ 𝜀G ∕𝜀0 }. Mithilfe von Gl. (8.20) können wir die Geschwindigkeit 𝑐0 ∕𝑛G der OPP-Welle, die Plasmonwellenlänge 𝜆0 ∕𝑛G , den Intensitäts-Dämpfungskoeffizienten 𝛼G = 2𝛾G und die Ausbreitungsdistanz d G = 1∕𝛼G = 1∕2𝛾G bestimmen. Aus Gl. (8.17) können wir die komplexen Parameter 𝛾1 und 𝛾2 berechnen, aus denen wiederum die Eindringtie-
Negative Brechung an einer Grenzfläche DP/DN
Die Lichtbrechung an der Grenzfläche zwischen zwei gewöhnlichen dielektrischen (DP-) Medien folgt dem snelliusschen Gesetz 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 , das sich aus der komponentenweisen Gleichsetzung der Wellenvektoren k1 und k2 entlang der Richtung der Grenzfläche ergibt [Abb. 8.6(a) und 2.10]. Wenn eines der Medien, beispielsweise Medium 2, nun ein DN-Medium mit negativem Brechungsindex 𝑛2 ist, folgt 𝑛1 sin 𝜃1 = −|𝑛2 | sin 𝜃2 . Offensichtlich muss der Brechungswinkel 𝜃2 nun negativ sein, sodass der gebrochene Strahl auf der gleichen Seite der Normalen zur Grenzfläche liegt wie der einfallende. Dieses Ergebnis kann auch als Folge der Gleichsetzung der Komponenten der Wellenvektoren k1 und k2 entlang der Richtung der Grenzfläche aufgefasst werden [Abb. 8.6(b)]. Es ist offensichtlich, dass sich die Optik von ebenen Grenzflächen und Linsen dramatisch verändert, wenn ein gewöhnliches DP-Medium durch ein DN-Medium ersetzt wird. Beispielsweise verhält sich eine konvexe Linse aus einem DN-Material wie eine konkave Linse aus einem DP-Material und umgekehrt. Ebenfalls unerwartet ist die Beobachtung, dass eine ebene Grenzfläche zwischen einem Material mit positivem und einem mit negativem Brechungsindex eine fokussierende Wir-
229
8 Optik von Metallen und Metamaterialien
n1 > 0
n2 > 0 k2 θ2
θ1
S1
n1 > 0
n2 < 0
S2 θ1
S1
k1
k1
k2
(– θ2)
S2
k2 k1
(b)
vem Brechungsindex. S2 und k2 zeigen in entgegengesetzte Richtungen. Die Projektionen der Wellenvektoren k1 und k2 auf die Grenzfläche haben in beiden Fällen denselben Betrag und dieselbe Richtung.
Abb. 8.6 (a) Brechung an der Grenzfläche zwischen zwei Medien mit positivem Brechungsindex. S2 und k2 zeigen in dieselbe Richtung. (b) Brechung an der Grenzfläche zwischen einem Medium mit positivem und einem Medium mit negatiDN
n =1
1
(a)
n = –1
n =1
n =1
Bild
–n
Objekt
n
Bild
DP
k2
k1
(a)
Objekt
230
0
(c)
2
(b)
n =1 n = –1 fortschreitende Welle
evaneszente Welle
1
0
2
(d)
Abb. 8.7 (a) Bündelung von Lichtstrahlen an einer Grenzfläche zwischen einem DP- und einem DN-Medium mit betragsmäßig gleichen Brechungsindizes. Die Grenzfläche einwirft ein aufrechtes Bild innerhalb des DN-Mediums. (b) Bildentstehung an einer Platte mit einem negativen Brechungsindex n = −1 im Vakuum. Jede Grenzfläche hat eine fokussierende Wirkung, sodass sowohl innerhalb der Platte als auch außerhalb Bilder entstehen. (c) Durchgang einer sich ausbreitenden Welle (mit einer Ortsfrequenz kleiner
als die inverse Wellenlänge) und einer evaneszenten Welle (mit einer Ortsfrequenz größer als die inverse Wellenlänge) durch die Platte. (d) Die Amplitude einer evaneszenten Welle, die mit einer harmonischen Komponente einer Objektverteilung mit einer Ortsfrequenz größer als die inverse Wellenlänge verknüpft ist, wird im Vakuum gedämpft, aber von dem DN-Medium wieder verstärkt, sodass ihre Amplitude in der Bildebene wiederhergestellt ist (Skizze semilogarithmisch).
kung auf Lichtstrahlen hat, wie Abb. 8.7(a) für den Sonderfall 𝑛2 = −𝑛1 darstellt; in diesem Fall ist 𝜃2 = −𝜃1 . Die ebene Grenzfläche wirkt auf optische Strahlen nun wie eine konvexe sphärische Grenzfläche zwischen zwei DP-Medien, wie sie in Abb. 1.18 gezeigt ist: Sie entwirft ein aufrechtes Bild mit einer Vergrößerung von eins. Darüber hinaus sind für den Fall eines DP- und eines DN-Mediums, deren Dielektrizitätskonstanten und Permeabilitäten jeweils dieselben Beträge besitzen (𝜀2 = −𝜀1 √ und 𝜇 = −𝜇 ), die Impedanzen 𝜂 = 𝜇 ∕𝜀 und 𝜂2 = 2 1 1 1 1 √ 𝜇2 ∕𝜀2 gleich groß und haben dasselbe Vorzeichen, sodass unabhängig von der Polarisation und dem Einfallswinkel einer einfallenden Welle niemals eine Reflexion der Grenzfläche auftritt.
Eine Platte mit negativem Brechungsindex als Nahfeld-Abbildungssystem
Eine von einem Vakuum umgebene Platte aus einem DN-Material mit den Parametern 𝜀 = −𝜀0 , 𝜇 = −𝜇0 , 𝑛 = −1 und 𝜂 = 𝜂0 wirkt als Linse. Wie Abb. 8.7(b) zeigt, haben beide Grenzflächen eine fokussierende Wirkung, sodass ein Bild innerhalb der Platte und ein zweites hinter ihr entsteht. Für eine Platte mit der Dicke d 0 lautet die Abbildungsgleichung einfach d 1 + d 2 = d 0 . Da die Impedanzen an den Grenzflächen übereinstimmen, tritt keine Reflexion auf, sodass die Platte einen Transmissionsgrad von eins besitzt. Als abbildendes System hat die beschriebene Platte die bemerkenswerte Eigenschaft, ein Bild der Objekt-Feld-
8.1 Einfach- und doppelt-negative Medien
verteilung mit einer Auflösung unterhalb der Wellenlänge zu erzeugen, d. h. sie liefert Details, die feiner als die verwendete Wellenlänge sind (d. h. Ortsfrequenzen, die größer als die inverse Wellenlänge sind). Wie in Abschnitt 4.4.4 erläutert wurde, können herkömmliche abbildende Systeme auf der Grundlage der normalen Optik solch hohe Ortsfrequenzen nicht übertragen, da sie gedämpften evaneszenten Wellen entsprechen. Diese bemerkenswerte Eigenschaft der beschriebenen Platte bedeutet, dass sie zumindest im Prinzip eine „ideale Linse“ (auch „Superlinse“ genannt) ist. 4) Die Platte mit negativem Brechungsindex liefert eine Auflösung jenseits der Beugungsgrenze, wie wir nun mithilfe des in Kapitel 4 beschriebenen FourieroptikAnsatzes zeigen wollen. Wir beziehen uns dabei auf die Darstellung in Abb. 8.7(c). Die Übertragungsfunktion für die Ausbreitung einer Welle über eine Distanz d 1 durch das Vakuum ist 𝐻1 (𝜈𝑥 , 𝜈𝑦 ) = exp(−i𝑘𝑧 d 1 ) , √ √ 𝑘𝑧 = 𝑘02 − 𝑘𝑥2 − 𝑘𝑦2 = 2π 𝜆 −2 − 𝜈𝑥2 − 𝜈𝑦2 ,
(8.22)
wobei (𝜈𝑥 , 𝜈𝑦 ) = (𝑘𝑥 ∕2π, 𝑘𝑦 ∕2π) die Ortsfrequenzen sind [siehe Gl. (4.9)]. Entsprechend wird die Ausbreitung über eine Distanz d 0 durch ein DN-Medium durch die Übertragungsfunktion 𝐻0 (𝜈𝑥 , 𝜈𝑦 ) = exp(−i𝑘𝑧′ d 0 ) beschrieben, wobei 𝑘𝑧′ = −𝑘𝑧 ist. Der dritte Abschnitt des in Abb. 8.7(c) gezeigten abbildenden Systems ist die Ausbreitung über eine Strecke d 2 durch das Vakuum, die durch die Übertragungsfunktion 𝐻2 (𝜈𝑥 , 𝜈𝑣 ) = exp(−i𝑘𝑧 d 2 ) beschrieben wird. Die Gesamt-Übertragungsfunktion dieses Systems ist somit das Produkt 𝐻 = 𝐻1 𝐻0 𝐻2 . Wenn die Abbildungsgleichung d 1 + d 2 = d 0 erfüllt ist, wird 𝐻 gleich eins. das beweist, dass das System ein räumliches Allpassfilter ist und folglich eine „perfekte“ Abbildung liefert. Die drei angegebenen Übertragungsfunktionen haben jedoch ein deutlich unterschiedliches Verhalten gegenüber Ortsfrequenzen unter- und oberhalb von 𝜆 −1 (d. h. für Ortsfrequenzen, die kleiner oder größer sind als diejenigen, für die 𝑘𝑥2 + 𝑘𝑦2 = 𝑘02 gilt; siehe Abb. 4.15). Unterhalb von 𝜆 −1 sind die Größen unter der Quadratwurzel in Gl. (8.22) positiv, sodass alle Übertragungsfunktionen reine Phasenfaktoren sind. In diesem Bereich hat die Phase der Funktion 𝐻0 ein Vorzeichen, das denjenigen der Vakuum-Übertragungsfunktionen 𝐻1 und 𝐻2 entgegengesetzt ist, sodass der Phasenfaktor der Platte gerade die Phasenverschiebungen kompensiert, die durch die beiden Abschnitte im Vakuum eingeführt werden. Das Resultat ist eine sich ausbreitende Welle [Abb. 8.7(c)]. 4) Siehe J. B. Pendry, ‚Negative Refraction Makes a Perfect Lens‘, Physical Review Letters 85, 3966–3969, 2000.
Im Gegensatz dazu werden die Komponenten 𝑘𝑧 und 𝑘𝑧′ = −𝑘𝑧 der Wellenvektoren für Ortsfrequen−1 zen, √ die größer als 𝜆 √sind, imaginär, d. h. 𝑘𝑧 =
−i
𝑘𝑥2 + 𝑘𝑦2 − 𝑘02 = −i2π
𝜈𝑥2 + 𝜈𝑦2 − 𝜆 −2 , woraus
𝐻1 = exp(−𝛾 d 1 ) , 𝐻2 = exp(−𝛾 d 2 ) , 𝐻0 = exp(+𝛾 d 0 ) , √ (8.23) 𝛾 = 2π 𝜈𝑥2 + 𝜈𝑦2 − 𝜆 −2 mit reellem 𝛾 folgt. Die Faktoren 𝐻1 und 𝐻2 beschreiben gedämpfte evaneszente Wellen, wohingegen 𝐻0 eine verstärkte evaneszente Welle darstellt. Folglich werden die hohen Ortsfrequenzen, die durch die Ausbreitung durch das Vakuum sowohl vor als auch hinter der Platte stark gedämpft werden, in dem DN-Medium mit seinem negativen Brechungsindex um denselben Faktor verstärkt und daher vollständig wiederhergestellt [Abb. 8.7(d)]. Die Verstärkung der abklingenden Welle in dem Medium steht nicht im Widerspruch zur Energieerhaltung. Obwohl eine ideale Wiederherstellung eines evaneszenten Feldes, das durch exponentielles Abklingen wesentlich abgeschwächt wurde, im Prinzip möglich ist, steht der Erreichung dieses Ziels doch meist eine geringfügige Energiedissipation in der Platte (die beispielsweise durch einen kleinen Imaginärteil von 𝜀 oder 𝜇 zum Ausdruck kommt) im Weg. Vor allem wenn die wiederherzustellenden Ortsfrequenzen viel größer als die inverse Wellenlänge sind, müssen sowohl der Abstand vom Objekt zur Platte als auch die Dicke der Platte und der Gesamtabstand zwischen Objekt- und Bildebene klein im Vergleich zur Wellenlänge sein. Diese Anforderung bedeutet, dass die Platte mit negativem Brechungsindex ein abbildendes System im Nahfeld ist. Abbildung mit Subwellenlängenauflösung im Fernfeld
Evaneszente Wellen, die im Nahfeld der DN-Platte wiederhergestellt wurden, können jedoch in sich ausbreitende Wellen umgewandelt werden, die dann verwendet werden können, um ein Bild im Fernfeld zu erzeugen. Diese Umwandlung kann unter Verwendung eines periodischen Elements mit einer hohen Ortsfrequenz wie z. B. einer Strukturierung der Austrittsfläche der Platte im Nanometerbereich erreicht werden, wie Abb. 8.8 zeigt. Wenn eine evaneszente Welle exp(−i𝑘𝑥 𝑥) mit hoher Ortsfrequenz 𝑘𝑥 durch eine harmonische Funktion exp(i𝑞𝑥) mit hoher Ortsfrequenz 𝑞 moduliert wird, ist das Ergebnis eine sich ausbreitende Welle exp[−i(𝑘𝑥 − 𝑞)𝑥] mit einer kleinen Ortsfrequenz |𝑘𝑥 − 𝑞|, sofern |𝑘𝑥 − 𝑞| < 𝑘0 ist. Das im Fernfeld durch die konvertierten Ortsfrequenzen entstehende Bild kann im Prinzip weiterverarbeitet werden, um eine ideale Nachbildung der ursprünglichen Raumverteilung zu erhalten.
231
232
8 Optik von Metallen und Metamaterialien
Abb. 8.8 (a) Eine von einer DN-Platte wiederhergestellte evaneszente Welle schwächt sich jenseits des Nahfelds in der Luft ab. (b) Eine von einer Platte mit negativem Brechungsindex wiederhergestellte evaneszente Welle kann durch eine periodische Oberfläche (ein Gitter) an der Grenzfläche in eine sich ausbreitende Welle umgewandelt werden.
8.1.3 Hyperbolische Medien Die Tensoren der Permittivität bzw. Permeabilität anisotroper Medien können positive oder negative Hauptwerte besitzen. Die Charakterisierung des Mediums als DP-, EN- oder DN-Medium hängt dann von der Ausbreitungsrichtung der Welle sowie von ihrer Polarisation ab. Um nur eine Facette dieses komplexen Verhaltens zu zeigen, betrachten wir ein Medium mit isotropen magnetischen Eigenschaften und positiver Permeabilität 𝜇, aber anisotropen dielektrischen Eigenschaften. Die Wellenausbreitung in anisotropen Medien wurde in Abschnitt 6.3 für Medien mit positiven Hauptwerten 𝜀1 , 𝜀2 und 𝜀3 des elektrischen Permittivitätstensors 𝜺 untersucht. Wenn diese Parameter stattdessen unterschiedliche Vorzeichen haben, weist die Wellenausbreitung eine Reihe ungewöhnlicher Eigenschaften auf. Der Einfachheit halber betrachten wir den Sonderfall eines einachsigen Mediums mit 𝜀1 = 𝜀2 > 0 und vergleichen die Wellenausbreitung in Medien mit positiven und negativen Werte von 𝜀3 . Wie in Abschnitt 6.3 gezeigt wurde, ist die Normalfläche, auch k-Fläche genannt, für die ordentliche Welle eine Kugel mit dem Radius 𝑘 = 𝑛0 𝑘0 (8.24) √ mit 𝑛0 = 𝜀1 ∕𝜀0 und für die außerordentliche Welle eine Quadrik 𝑘02 𝑘12 + 𝑘22 𝑘33 + = , 𝜀3 𝜀1 𝜀0
(8.25)
wie in den Gln. (6.64) bzw. (6.65). Wenn wir diese beiden Fälle untersuchen, stellen wir folgendes fest: • Wenn 𝜀3 positiv ist, ist die außerordentliche k-Fläche ein Rotationsellipsoid wie in Abb. 6.27(b) und 8.9(a). Die ordentlichen und außerordentlichen Wellen haben die Brechungsindizes 𝑛o bzw. 𝑛(𝜃), wobei 𝑛(𝜃) durch Gl. (6.58) gegeben ist und zwischen 𝑛o und 𝑛e = √ 𝜀3 ∕𝜀0 variiert, wenn der Winkel 𝜃 sich von 0 auf 90◦ ändert.
• Wenn 𝜀3 negativ ist, ist die außerordentliche k-Fläche wie in Abb. 8.9(b) gezeigt ein (zweiteiliges) Rotationshyperboloid; ein derartiges Material wird aus diesem Grund als hyperbolisches Medium bezeichnet. Der Brechungsindex 𝑛(𝜃) für eine außerordentliche Welle unter einem Einfallswinkel 𝜃 in der 𝑘3 𝑘3 -Ebene ist dann durch 2
1 cos2 𝜃 sin 𝜃 − (8.26) = 𝑛2 (𝜃) 𝑛o2 𝑛e2 √ mit 𝑛e = |𝜀3 |∕𝜀0 gegeben. Wenn 𝜃 von 0 auf 𝜃max zunimmt, steigt der Brechungsindex 𝑛(𝜃) von 𝑛o auf ∞, wie aus Abb. 8.9(b) ersichtlich ist. Das bedeutet, dass die Wellenlänge in dem Medium immer kleiner wird und die Welle bei 𝜃 = 𝜃max zum Stillstand kommt. Eine hyperbolische Platte als Fernfeld-Abbildungssystem mit Subwellenlängenauflösung
Eine wichtige Eigenschaft eines hyperbolischen Mediums ist, dass es für eine ebene Welle mit den Komponenten (𝑘1 , 𝑘2 , 𝑘3 ) des Wellenvektors unabhängig von den Werten von 𝑘1 und 𝑘2 stets einen reellen Wert von 𝑘3 gibt, der Gl. (8.25) für negative 𝜀3 erfüllt. Das bedeutet, dass sich die Welle durch das Medium ausbreiten kann, woraus wiederum folgt, dass Ortsfrequenzen, die größer als eine inverse Wellenlänge in einer beliebigen Ebene sind, nicht wie in normalen Medien evaneszenten Wellen entsprechen (siehe Abschnitt 4.1.2), sondern über große Entfernungen übertragen werden können. Wenngleich die Ausbreitung mit Fresnelbeugung einhergeht, besitzt das hyperbolische Medium eine Übertragungsfunktion ohne Grenz-Ortsfrequenz. Darüber hinaus kann die Fresnelbeugung in einem hyperbolischen Medium wesentlich verringert werden. Für 𝑛0 ≪ 𝑛e geht 𝜃max = tan−1 (𝑛e ∕𝑛o ) gegen π∕2, wodurch sich das Rotationshyperboloid aus Abb. 8.9(b) abflacht und annähernd eben wird, entsprechend einer Konstante 𝑘3 = 𝑛o 𝑘0 für alle 𝑘1 und 𝑘2 . Die Übertragungsfunktion exp(−i𝑘3 𝑧) der Ausbreitung in der Platte hängt dann nicht mehr von den Ortsfrequenzen (𝑘1 , 𝑘2 )
8.1 Einfach- und doppelt-negative Medien
k2/k0
k2/k0
ne n(θ)
k S
k n(θ)
θ
θ θmax
n0 k /k 3 0
(a)
S n0
k3/k0
(b)
Abb. 8.9 Konturen der k-Flächen in der k2 k3 -Ebene für ein einachsiges anisotropes Medium mit den Hauptwerten 𝜀1 = 𝜀2 > 0 des dielektrischen Tensors für zwei Fälle: (a) 𝜀3 > 0 und (b) 𝜀3 < 0. Die gezeigten Konturen sind die der außerordentlichen Welle (für die ordentliche Welle sind sie in beiden Fällen kugelförmig). (a) Die k-Kontur ist eine Ellipse, das Medium ist für beliebige Ausbreitungsrichtungen
ein DP-Medium. (b) Die k-Kontur ist eine Hyperbel, sodass Wellen sich nur in Richtungen ausbreiten können, die innerhalb eines Kegels mit einem halben Öffnungswinkel 𝜃max liegen. Außerhalb dieses Kegels wirkt das Medium wie ein EN-Medium, in dem keine sich ausbreitenden Wellen möglich sind.
des einfallendes Feldes ab. Ein Punkt in der Eingangsebene wird somit auf einen Punkt in der Ausgangsebene abgebildet und die Ausbreitung kann durch die Strahlenoptik beschrieben werden. Die Platte wirkt somit als ideales Nahfeld-Abbildungssystem (d. h. mit Subwellenlängenauflösung), wie in Abb. 8.10(a) illustriert. Darüber hinaus kann die Platte so gekrümmt sein, dass das Bild geometrisch vergrößert wird, wie Abb. 8.10(b) zeigt.
Wenn die Komponenten der Ortsfrequenzen des vergrößerten Bildes kleiner als die inverse Wellenlänge werden, erzeugen sie sich ausbreitende Wellen, die mit Hilfe einer herkömmlichen Linse verarbeitet werden können, sodass ein Bild im Fernfeld entsteht. Eine derartige zylindrische Platte wird als Hyperlinse bezeichnet.
hyperbolisches x Medium z
Lichtstrahlen
evaneszente Welle
hyperbolisches Medium
Lich
tstra
hlen
fortschreitende Welle (a)
(b)
Abb. 8.10 (a) Eine hyperbolische Platte mit 𝜀3 < 0 und 0 < 𝜀1 = 𝜀2 < |𝜀3 | hat eine ebene Dispersionsrelation (k3 = konstant), was bedeutet, dass die Ausbreitung entlang der optischen Achse (z-Richtung) beugungsfrei ist. (b) Eine hyperbolische Platte, die zu einer inhomogenen zylindrischen Gestalt gekrümmt ist und deren lokale optische Achse in radialer Richtung zeigt, dient als Vergrößerungsglas für Details im Subwellenlängenbereich. Wenn die Details des vergrößerten Bildes größer als die Wellenlänge werden, entstehen fortschreitende Wellen im äußeren Medium.
Brechung an der Grenzfläche eines hyperbolischen Mediums
Die Brechung an einer Grenzfläche zwischen zwei Medien kann durch Zeichnen der k-Flächen der beiden Medien und Angleichen der Komponenten von k entlang der Grenzfläche bestimmt werden (siehe z. B. die Analyse der Doppelbrechung in Abschnitt 6.3.5). Abbildung 8.11(a) zeigt die k-Flächen für eine Grenzfläche zwischen einem isotropen DP-Medium und einem hyperbolischen Medium; dabei ist für das hyperbolische Medium nur die außerordentliche Welle gezeigt. Da Komponente von k entlang der Grenzfläche für das hyperbolische Medium Werte von 0 bis ∞ annehmen kann, ist es immer möglich, eine Angleichung an die aus dem DP-Medium einfallende Welle zu erreichen, was man auch durch Lösen der Gleichung 𝑛e sin 𝜃e = 𝑛(𝜃) sin 𝜃 und mithilfe Gl. (8.26) bestätigen kann. An dieser Grenzfläche tritt somit keine Totalreflexion auf. Eine Auftragung des Brechungswinkels 𝜃 als Funktion des Einfallswinkels 𝜃e ist in Abb. 8.11(b) gezeigt. Die Brechung unter beliebigen Einfallswinkeln steht im Einklang mit der Feststellung, dass die außerordentliche Welle in einem hyperbolischen Medium nicht evaneszent sein kann.
233
234
8 Optik von Metallen und Metamaterialien
k
θk
90° ordentlich S
k
nek0 sin θe
S
θe
nek0 sin θe ke
θmax
θ
θ
außerordentlich ke
Se 0 DP, isotrop
hyperbolisch (a)
0
90°
θe (b)
Abb. 8.11 Brechung an einer Grenzfläche zwischen einem isotropen DP-Medium mit dem Brechungsindex n1 und einem einachsigen hyperbolischen Medium mit den Brechungsindizes no und ne . (a) Die k-Fläche für das isotrope Medium ist eine Kugel, während die der außerordentlichen Welle des hyperbolischen Mediums ein Rotationshyperboloid ist. Eine Art von negativer Brechung ist offensichtlich, da der Poyntingvektor S der einfallenden Welle nach
oben, der der gebrochenen Welle jedoch nach unten zeigt. (b) Brechungswinkel 𝜃 als Funktion des Einfallswinkels 𝜃e für no = 0.8ne und ne = 1.25ne . Die ordentliche Welle wird gebrochen, wenn ihr Einfallswinkel 𝜃e kleiner ist als der kritische Winkel 𝜃k . Die außerordentliche Welle wird für alle Einfallswinkel gebrochen; der Brechungswinkel ist jedoch auf 𝜃 < 𝜃max begrenzt
8.2 Optik von Metallen: Plasmonik
was nichts anderes ist als eine Form des ohmschen Gesetzes. Unter diesen Bedingungen wird die rechte Seite von Gl. (8.28) zu (i𝜔𝜀 + 𝜎)E = i𝜔(𝜀 + 𝜎∕i𝜔)E. Damit folgt
8.2.1 Die optischen Eigenschaften von Metallen Leitfähige Medien
In leitfähigen Materialien wie Metallen, Halbleitern, dotierten Dielektrika oder ionisierten Gasen liegen freie elektrische Ladungen und eine damit verbundene elektrische Stromdichte 𝓙 vor. Daher muss die erste der quellenfreien Maxwellgleichungen, Gl. (5.7), um die Stromdichte 𝓙 und die Verschiebungsstromdichte 𝜕𝓓∕𝜕𝑡 ergänzt werden; so erhalten wir ∇×𝓗 =
𝜕𝓓 +𝓙. 𝜕𝑡
(8.27)
Die drei verbleibenden quellenfreien maxwellschen Gleichungen (5.8)–(5.10) können unverändert bleiben mit 𝜇 = 𝜇0 , da in natürlich vorkommenden Materialien keine magnetischen Effekte auftreten, die bei optischen Frequenzen variieren. Für eine monochromatische Welle der Kreisfrequenz 𝜔 erhält Gl. (8.27) die Form ∇ × H = i𝜔D + J .
(8.28)
Für ein Medium mit linearen dielektrischen Eigenschaften ist die elektrische Flussdichte durch D = 𝜀E = 𝜀0 (1 + 𝜒)E gegeben. Ähnlich gilt für Medien mit linearen Leitfähigkeitseigenschaften, dass die elektrische Stromdichte proportional zum elektrischen Feld ist. Wenn wir die elektrische Leitfähigkeit mit 𝜎 bezeichnen, heißt das J = 𝜎E ,
(8.29)
∇ × H = i𝜔𝜀L E ,
(8.30)
wobei die effektive elektrische Permittivität 𝜀L eines leitenden Mediums durch 𝜀L = 𝜀 (1 +
𝜎 ) i𝜔𝜀
(8.31)
gegeben ist. Die effektive Permittivität 𝜀L ist ein komplexer frequenzabhängiger Parameter, der die dielektrischen und die leitenden Eigenschaften des Mediums kombiniert. Da der zweite Term in Gl. (8.31) proportional zum Kehrwert der Frequenz ist, nimmt der Beitrag des Leitfähigkeitsterms mit zunehmender Frequenz ab. Da Gl. (8.30) dieselbe Form hat wie die analoge Gleichung (5.53) für ein dielektrisches Medium, lassen sich die in den Abschnitten 5.3–5.5 hergeleiteten Gesetze für die Wellenausbreitung auch auf leitfähige Medien anwenden. Die Wellenzahl aus den Gln. (5.89) und (5.90) √ erhält nun die Form 𝑘 = 𝛽 − i𝛾 = 𝜔 𝜀L 𝜇0 , die Impedanz √ aus Gl. (5.94) wird zu 𝜂 = 𝜇0 ∕𝜀L und den Brechungsin1 dex 𝑛 und den Feld-Dämpfungskoeffizienten 𝛾 = 𝛼 aus 2 Gl. (5.92) bestimmen wir aus der komplexen Gleichung √ √ √ 𝜀L 𝛾 𝜀 𝜎 (8.32) = 1+ 𝑛−i = 𝜀 𝜀 i𝜔𝜀 𝑘0 0 0 √ mit 𝑘0 = 𝜔∕𝑐0 = 𝜔 𝜀0 𝜇0 . Für das Verhältnis 𝜎∕𝜔𝜀 in Gl. (8.32) gibt es zwei Grenzfälle. Für 𝜎∕𝜔𝜀 ≪ 1 dominieren dielektrische Ef-
8.2 Optik von Metallen: Plasmonik
Tab. 8.1 Brechungsindex n, Dämpfungskoeffizient 𝛼 und Impedanz 𝜂 eines Mediums mit reeller, frequenzunabhängiger Leitfähigkeit 𝜎 im den Grenzfällen kleiner und großer Werte von 𝜎∕𝜔𝜀 . Die Gleichungen gelten nicht, wenn die Leitfähigkeit 𝜎 komplex und/oder frequenzabhängig ist, wie im nächsten Abschnitt im Kontext des Drudemodells erläutert. 𝝈∕𝝎𝜺 ≪ 1 𝑛≈
√
𝜀∕𝜀0 √ 𝛼 ≈ 𝜎 𝜇0 ∕𝜀 √ 𝜂 ≈ 𝜇0 ∕𝜀
𝝈∕𝝎𝜺 ≫ 1 𝑛≈
√
𝜎∕2𝜔𝜀0 √ 𝛼 ≈ 2𝜔𝜇0 𝜎 √ 𝜂 ≈ (1 + i) 𝜔𝜇0 ∕2𝜎
(8.33) (8.34) (8.35)
fekte, während Effekte der Leitfähigkeit nur eine geringfügige Korrektur der Wellenzahl beitragen. Im Gegensatz dazu dominieren bei 𝜎∕𝜔𝜀 ≫ 1 die Effekte der Leitfähigkeit und √ es gilt 𝜀L ≈ 𝜎∕i𝜔. Mithilfe der Taylorent1+ wicklung √ √ 𝑥 ≈ 1 + 𝑥∕2 für 𝑥 ≪ 1 und der Identität i = (1 + i)∕ 2 können wir für reelles frequenzunabhängiges 𝜎 genäherte Ausdrücke für die Wellenparameter erhalten. Die Ergebnisse sind in Tabelle 8.1 für beide Grenzfälle aufgeführt. Aus Tabelle 8.1 geht hervor, dass der Dämpfungskoeffizient 𝛼 für eine gegebene Frequenz 𝜔 für kleine Werte der Leitfähigkeit 𝜎 proportional √ zu 𝜎 ist, für große Werte von 𝜎 aber proportional zu 𝜎 wird. Die Impedanz 𝜂, die zunächst reell ist und nicht von 𝜎 abhängt, erfährt schließlich eine Phasenverschiebung um√45◦ und wird für große 𝜎 umgekehrt proportional zu 𝜎. In diesem Grenzfall wird 𝜂 selbst klein, sodass das Material an der Grenzfläche zu einem nicht leitenden Medium stark reflektiert. Bei kleinen Frequenzen ist der Brechungsindex 𝑛√für einen gegebenen Wert von 𝜎 proportional zu 1∕ 𝜔, wohingegen der Dämpfungskoeffizient 𝛼 und die Im√ pedanz 𝜂 direkt proportional zu 𝜔 sind. Wenn 𝜔 so weit ansteigt, dass das Verhältnis 𝜎∕𝜔𝜀 sehr klein wird, werden alle drei Parameter der Wellenausbreitung frequenzunabhängig und das Material verhält sich wie ein nichtdispersives, verlustbehaftetes dielektrisches Medium. Für einen idealen Leiter ist 𝜎 → ∞, sodass 𝛼 → ∞ wird und für die Eindringtiefe d E = 1∕𝛼 → 0 gilt. Außerdem gilt dann 𝜂 → 0, sodass für den Leistungsreflexionsgrad an der Grenzfläche zu einem dielektrischen Medium ℛ → 1 wird – das Material verhält sich wie ein idealer Spiegel. Wie im nächsten Abschnitt erläutert wird, sind die Leitfähigkeiten von realen Metallen bei optischen Frequenzen häufig komplex und frequenzabhängig. In diesem Fall sind die in Tabelle 8.1 angegebenen Beziehungen nicht anwendbar. Die Frequenzabhängigkeit der
Wellenparameter kann sich dann erheblich von der in der Tabelle angegebenen unterscheiden. Metalle: Das Drudemodell
Wenn die Beziehung zwischen 𝓙 und 𝓔 nicht statisch, sondern dynamisch ist, muss die Leitfähigkeit 𝜎 frequenzabhängig sein und eine endliche Bandbreite und Antwortzeit besitzen. Das Drudemodell (auch DrudeLorentz-Modell genannt) behandelt die Leitungselektronen als ideales Gas aus unabhängigen Teilchen, die sich zwischen Streuereignissen frei bewegen, und nimmt eine frequenzabhängige komplexe Leitfähigkeit der Form 𝜎=
𝜎0 1 + i𝜔𝜏
(8.36)
an, wobei 𝜎0 die Leitfähigkeit bei kleinen Frequenzen ist und 𝜏 eine Streuzeit (oder Kollisionszeit). Für hinreichend kleine Frequenzen (sodass 𝜔 ≪ 1∕𝜏 ist) ist 𝜎 ≈ 𝜎0 reell und frequenzunabhängig. In diesem Fall gelten die in Tabelle 8.1 angegebenen Beziehungen. Wenn das Medium ähnliche dielektrische Eigenschaften wie das Vakuum besitzt und keine weiteren Verluste auftreten (𝜀 = 𝜀0 ), erhalten wir durch Einsetzen von Gl. (8.36) in Gl. (8.31) für die relative effektive Permittivität 𝜔P2 𝜔P2 𝜀L =1+ = 1 + , 𝜀0 −𝜔2 + i𝜔∕𝜏 −𝜔2 + i𝜔𝜁
(8.37)
wobei 𝜁 = 1∕𝜏 die Streurate (Stoßfrequenz) ist. Die Plasmafrequenz 𝜔P (genauer gesagt Plasma-Kreisfrequenz) ist als √ 𝜎0 (8.38) 𝜔P = 𝜀0 𝜏 definiert, und die Vakuum-Plasmawellenlänge 𝜆P ist 𝜆P =
2π𝑐0 . 𝜔P
(8.39)
Die dielektrischen Eigenschaften mancher verlustfreier Medien unterscheiden sich von denen des Vakuums, was sich in einer frequenzunabhängigen relativen RestPermittivität 1 + 𝜒M äußert, die bis zu Frequenzen mit 𝜔 ≫ 𝜔P bestehen bleibt. In diesem Fall wird die relative effektive Permittivität aus Gl. (8.37) zu 𝜔P 𝜀L = 1 + 𝜒M + . 2 𝜀0 −𝜔 + i𝜔𝜁 2
(8.40)
Einige gemessene Werte für 𝜔P , 𝜆P , 𝜏 und 𝜁 für eine Reihe von Metallen sind in Tabelle 8.2 aufgeführt. Diese Ergebnisse sind mit denjenigen vergleichbar, die man mithilfe des Lorentz-Oszillatormodells für ein
235
236
8 Optik von Metallen und Metamaterialien
Tab. 8.2 Plasmafrequenzen 𝜔P , Vakuum-Plasmawellenlängen 𝜆P , Streuzeiten 𝜏 und Streuraten 𝜁 = 1∕𝜏 für Al, Ag, Au und Cu.a) Material
𝝎P (rad∕s)
𝝀P (nm)
𝝉 (fs)
𝜻 (s−1 )
Al
1.83 × 1016
103
5.10
1.96 × 1014
Ag
1.37
× 1016
138
31.3
0.32 × 1014
1.35
× 1016
139
9.25
1.08 × 1014
1.33
× 1016
142
6.90
1.45 × 1014
Au Cu
a) Siehe z. B. E. J. Zeman, G. C. Schatz, ‚An Accurate Electromagnetic Theory Study of Surface Enhancement Factors for Ag, Au, Cu, Li, Na, Al, Ga, In, Zn, and Cd‘, Journal of Physical Chemistry 91, 634–643, 1987.
resonantes Medium erhält, wobei dort die Bewegung eines an einen Kern gebundenen Elektrons als harmonischer Oszillator behandelt wird (siehe Abschnitt 5.5.3). Im vorliegenden Fall sind die Elektronen jedoch frei (es gibt keine Rückstellkraft), sodass für die elastische Konstante 𝜅 = 0 und für die Resonanzfrequenz 𝜔0 = √ 𝜅∕𝑚 = 0 folgt. Die Bewegungsgleichung (5.103) nach 2 dem Lorentzmodell wird dann zu d 𝑥∕ d𝑡2 + 𝜁 d𝑥∕ d𝑡 = −𝑒ℰ∕𝑚 und für die entsprechende Polarisationsdichte 2 𝒫 = −N𝑒𝑥 gilt d 𝒫∕ d𝑡2 + 𝜁 d𝒫∕ d𝑡 = (N 𝑒12∕𝑚)ℰ, wobei N die Elektronendichte des Mediums ist. Für ein mit einer Kreisfrequenz 𝜔 oszillierendes Feld ergibt sich daraus −𝜔2 𝒫 + i𝜔𝜁𝒫 = (N𝑒 2 ∕𝑚)ℰ; damit folgt für die Suszeptibilität 𝜔P 𝒫 = 2 𝜀0 ℰ −𝜔 + i𝜔𝜁 2
𝜒(𝜔) =
(8.41)
mit √ 𝜔P =
N𝑒 2
𝜀0 𝑚
.
(8.42)
Für ein Medium mit den dielektrischen Eigenschaften des Vakuums führt Gl. (8.41) für 𝜎0 =
N𝑒2 𝜏
𝑚
(8.43)
zusammen mit der Beziehung 𝜀L = 𝜀0 (1 + 𝜒) zu den Gln. (8.37) und (8.38). Gleichung (8.41) ist ein Spezialfall von Gl. (5.106) für ein resonantes Lorentzmedium mit 𝜔0 = 0 und 𝜁 = Δ𝜔 = 2πΔ𝜈, wobei Δ𝜈 die spektrale Breite ist. Ein Vergleich der Frequenzabhängigkeit des Real- und Imaginärteils der relativen Permittivität 𝜀r = 𝜀L (𝜀0 für ein dielektrisches resonantes Lorentzmedium auf der Grundlage von Gl. (5.106) oder der Gln. (5.107) und (5.108) bzw. von Gl. (8.27) für das Drudemetall ist in Abb. 8.12 dargestellt.
Beispiel 8-3: Permittivität und Reflexionsgrad von Silber
Als Beispiel für den Gültigkeitsbereich des Drudemodells zeigt Abb. 8.13(a) die experimentell gemessene relative effektive Permittivität 𝜀r = 𝜀L ∕𝜀0 für Silber (gestrichelte Linien) zusammen mit den besten Anpassungen (durchgezogene Linien) nach dem Drudemodell [siehe z. B. Abb. 8.12(b)]. Die experimentellen Permittivitäten und Reflexionsgrade für verschiedene Metalle als Funktionen der Wellenlänge sind in einer Reihe von Quellen zu finden. 5) Wie Abb. 8.13(a) zeigt, passt die nach dem Drudemodell mithilfe von Gl. (8.40) berechnete relative Permittivität im Wellenlängenbereich von 450–600 nm recht gut zu den experimentellen Daten, weicht bei kleineren Wellenlängen aber stark ab. Die aus der Anpassung für den angezeigten Wellenlängenbereich (200–600 nm) ermittelten Parameter sind 𝜒M = 4.45, 𝜔𝑃 = 1.47 × 1016 rad∕s (𝜆𝑃 = 128 nm) und 𝜏 = 12 fs (𝜁 = 0.84 × 1014 s−1 ). Diese Werte unterscheiden sich aufgrund der Einschränkungen dieser Analyse von den in Tabelle 8.2 aufgeführten Werten. In Abb. 8.13(b) ist der gemessene Leistungsreflexionsgrad für Licht, das senkrecht auf die Grenzfläche Silber/Luft auftrifft (gestrichelte Linie), mit dem auf der Grundlage des Drudemodells unter Verwendung der Beziehung ℛ = |(𝜂 − 𝜂0 )∕(𝜂 + 𝜂0 )|2 berechneten Reflexionsgrad √Kurve) verglichen; da√ (durchgezogene bei sind 𝜂 = 𝜀L ∕𝜀0 und 𝜂0 = 𝜀0 ∕𝜇0 die Impedanzen von Silber bzw. Luft [vgl Gl. (6.34)]. Die Anpassung ist im Wellenlängenbereich von 400 bis 600 nm, in dem Silber eine nahezu ideale Reflexion zeigt (ebenso wie bei größeren Wellenlängen), recht gut. Andere Metalle zeigen ein ähnliches Verhalten. Gold und Kupfer besitzen ebenfalls Vakuum-Plasmawellenlängen, die weit im Ultravioletten liegen (siehe Tabelle 8.2); sie werden erst jenseits von ≈ 550 nm zu guten Reflektoren (was ihre rötliche Farbe erklärt). Der Ursprung dieses Verhaltens liegt in der Interbandabsorption, d. h. der Absorption von Licht durch gebundene Elektronen, die im Drudemodell freier Elektron nicht berücksichtigt wird (siehe Aufgabe 8-7). Im Gegensatz dazu entspricht Aluminium den Vorhersagen des Drudemodells ziemlich gut und zeigt ein nahezu einheitliches Reflexionsvermögen über einen Wellenlängenbereich von 200 nm bis über 10 μm hinaus. Vereinfachtes Drudemodell
Wir betrachten nun das Verhalten des Drudemodells für Kreisfrequenzen, die so groß sind, dass 𝜔 ≫ 1∕𝜏 (𝜔 ≫ 𝜁) gilt, was einer Vernachlässigung der Dämpfung in 5) Die in Abb. 8.13 aufgetragenen Daten stammen aus P. B. Johnson, R. W. Christy, ‚Optical Constants of the Noble Metals‘, Physical Review B 6, 4370–4379, 1972.
8.2 Optik von Metallen: Plasmonik
10
10 Dielektrikum (Lorentzmodell)
Metall (Drudemodell)
–εʺr
εʺr
0
0 εʹr
–10
0.4
0.6
0.8
1
1.2
εʹr
1.4
–10
0.4
ω / ω0
0.6
(a)
5
1.2
1.4
ω/ ω p
die Resonanzfrequenz 𝜔0 , Q = 𝜔0 ∕Δ𝜔 = 10 und 𝜒0 = 1. (b) Ein durch das Drudemodell, Gl. (8.37), beschriebenes Metall mit √ der Plasmafrequenz 𝜔P , 𝜔P 𝜏 = 10 und 𝜀 = 𝜀0 . Für 𝜔 < 𝜔P 1 − (𝜔P 𝜏)−2 wird der Realteil der Permittivität negativ.
1 –εʺr
0
0.8 Reflexionsgrad
relative Permittivität
1 (b)
Abb. 8.12 Frequenzabhängigkeit des Real- (durchgezogene Kurve) und des Imaginärteils (gestrichelte Kurve) der relativen effektiven Permittivität 𝜀r = 𝜀L ∕𝜀0 = e′r + i𝜀r′′ . (a) Ein durch das Lorentzmodell beschriebenes resonantes dielektrisches Medium, berechnet nach Gl. (5.107) und (5.108) für
–5 –εʺr
–10 –15 –20 600
0.8
0.6 0.4 0.2
500 400 Wellenlänge λ0 (nm) (a)
300
200
0 600
500
400 300 Wellenlänge λ0 (nm) (b)
200
Abb. 8.13 (a) Real- und Imaginärteil der relativen effektiven Permittivität 𝜀r = 𝜀r′ + i𝜀r′′ als Funktion der Wellenlänge für Ag. Die gestrichelten Kurven zeigen experimentelle Werte, während die durchgezogenen Kurven Anpassungen an das Drudemodell sind. (b) Leistungsreflexionsgrad ℛ als Funk-
tion der Wellenlänge an der Grenzfläche Ag/Luft. Die gestrichelte Kurve zeigt den experimentellen Reflexionsgrad, die durchgezogenen Linien die auf der Grundlage des Drudemodells berechneten Werte; die Vakuum-Plasmawellenlänge 𝜆P liegt rechts außerhalb der gezeigten Diagramme.
Gl. (5.102) entspricht (𝜁 → 0). Unter diesen Bedingungen wird Gl. (8.36) zu 𝜎 ≈ 𝜎0 ∕i𝜔𝜏, einer imaginären Größe, und Gl. (8.40) reduziert sich mit 𝜒M = 0 auf die (reelle) effektive Permittivität des vereinfachten Drudemodells:
Das vereinfachte Drudemodell ist nützlich, um das optische Verhalten von Metallen im nahen Infrarot und im sichtbaren Bereich des Spektrums zu beschreiben [siehe Abb. 2.1]. Für Wellenlängen unterhalb von ≈ 1 μm entsprechend einer Kreisfrequenz 𝜔 = 2π 𝜈 = 1.9 × 1015 rad∕s ist für die in Tabelle 8.2 aufgeführten Metalle 𝜔 ≫ 𝜁. Kurz gesagt ist das vereinfachte Drudemodell für Metalle bei Frequenzen, für die 𝜔 ≫ 1∕𝜏 gilt, ein Spezialfall des Lorentzmodells für ein dielektrisches Medium, in dem es weder eine Rückstellkraft (𝜅 = 0) noch Dämpfung (𝜁 = 0) gibt. Die Permittivität gemäß Gl. (8.44) ist reell und negativ für Frequenzen unterhalb der Plasmafre-
𝜀L ≈ 𝜀0 (1 −
𝜔P2 𝜔2
).
(8.44)
Diese Beziehung zeigt deutlich, dass die elektrische Leitfähigkeit des Mediums dazu führt, dass die Permittivität auf einen Wert unterhalb von 𝜀0 gedrückt und sie umgekehrt proportional zum Quadrat der Frequenz wird.
237
238
8 Optik von Metallen und Metamaterialien
εL / ε 0 1
EN
VPP Plasmonband
0
ωp
Abb. 8.14 (a) Die relative effektive Permittivität 𝜀L ∕𝜀0 , der Brechungsindex n und der Dämpfungskoeffizient 𝛼 als Funktion der Frequenz für ein Medium, das durch das vereinfachte Drudemodell beschrieben√ wird. (b) Die Dispersionsrela-
ω
DP
ω
=
β co
ω ωp
–1
verbotenes Band
n 1 (b) 0
ωp
ω
0
ωp
ω
0
βp
0
β
tion 𝜔 = 𝜔P2 + c02 𝛽 2 . Optische Wellen können sich in Metallen ausbreiten (dann als Volumenplasmonpolaritonen (VPP) bezeichnet), sofern die Frequenz der Welle in das plasmonische Band des Metalls fällt (dessen Frequenzen oberhalb der Plasmafrequenz liegen).
α
(a)
quenz 𝜔P , bei denen sich das Metall wie ein EN-Medium verhält, und reell und positiv für Frequenzen oberhalb von 𝜔P , bei denen sich das Metall wie ein DP-Medium verhält. In einem durch das vereinfachte Drudemodell beschriebenen Medium ist die Wellenausbreitung durch √ eine Ausbreitungskonstante 𝛽 = 𝑛𝑘0 = 𝜀L ∕𝜀0 (𝜔∕𝑐0 ) sowie eine Dispersionsrelation √ 𝜔 𝛽= 𝑐0
1−
𝜔P2 𝜔2
(8.45)
charakterisiert, die zusammen mit der zugehörigen relativen Permittivität 𝜀L ∕𝜀0 , dem Brechungsindex 𝑛 und dem Dämpfungskoeffizienten 𝛼 in Abb. 8.14 dargestellt ist. Aus Abb. 8.14 geht hervor, dass sich die Wellenausbreitung in einem Metall gemäß der Beschreibung durch das vereinfachte Drudemodell unterhalb, bei und oberhalb der Plasmafrequenz 𝜔P deutlich unterscheidet: • Bei Frequenzen unterhalb der Plasmafrequenz (𝜔 < 𝜔P ) ist die effektive Permittivität 𝜀L negativ. Das Metall verhält sich dann wie ein √ EN-Medium mit der imaginären Wellenzahl 𝑘 = i𝜔 |𝜀L |𝜇0 entsprechend einer Dämpfung ohne Ausbreitung. Dieser Spektralbereich kann daher als verbotenes Band aufgefasst wer√ den. Der Dämpfungskoeffizient 𝛼 = 2𝑘0 𝜔P2 ∕𝜔2 − 1 nimmt mit zunehmender Frequenz monoton ab und verschwindet bei der Plasmafrequenz. Die freien Elektronen erfahren dann kollektive longitudinale Oszillationen in Form von Plasmonen, den Quanten der
Plasmawelle (ebenso wie Photonen die Quanten der elektromagnetischen Welle sind). Die negative Permittivität entspricht einer imaginären Impedanz, was zeigt, dass an der Grenzfläche zu einem DP-Medium Totalreflexion auftritt (siehe Abschnitt 6.2), sofern 𝜆0 > 𝜆P ist. Dotierte Halbleiter hingegen reflektieren im sichtbaren Bereich nicht, weil die Plasmafrequenz solcher Materialien im Infraroten liegt, da in ihnen die freie Elektronendichte 𝑁 weitaus geringer ist als in Metallen [siehe Gl. (8.42)]. Obwohl das Drudemodell eine gute Ausgangsposition für die Beschreibung der optischen Eigenschaften von Metallen und dotierten Halbleitern bietet, ist es keineswegs der Weisheit letzter Schluss, wie auch Beispiel 8-3 zeigt. • Bei Frequenzen oberhalb der Plasmafrequenz (𝜔 > 𝜔P ) ist die effektive Permittivität positiv und reell, sodass sich das Medium wie ein verlustfreies dielektrisches Material verhält, wenn auch mit speziellen Dispersionseigenschaften. Die Ausbreitungskonstan√ te wird dann 𝛽 = 𝜔2 − 𝜔P2 ∕𝑐0 und der Brechungsin√ dex 𝑛 = 1 − 𝜔P2 ∕𝜔2 ist kleiner als eins und wird in der Nähe der Plasmafrequenz sehr klein. Dieser spektrale Bereich wird als Plasmonband bezeichnet und Wellen, die sich in diesem Band durch das Metall ausbreiten, nennt man Volumenplasmonpolaritonen (VPP oder auch BPP nach engl. bulk plasmon polariton).
8.2 Optik von Metallen: Plasmonik
zeigt, ist die Bedingung |𝜀2 | > 𝜀1 äquivalent zu der Bedingung 𝜔 < 𝜔O mit 𝜔 𝜔O = √ P , (8.46) 1 + 𝜀r,1
8.2.2 Die Grenzfläche zwischen Metall und Dielektrikum: Oberflächenplasmonpolaritonen Da sich ein Metall bei optischen Frequenzen unterhalb der Plasmafrequenz (𝜔 < 𝜔P ) wie ein EN-Medium verhält, können an der Grenzfläche zu einem gewöhnlichen dielektrischen (DP-) Medium Oberflächenplasmonpolaritonen (OPP, oft auch SPP von engl. surface plasmon polariton) auftreten. Wie in Abschnitt 8.1.2 erläutert wurde, ist ein OPP eine geführte optische Oberflächenwelle, die von einer longitudinalen, mit der Frequenz der optischen Welle schwingenden Elektronendichtewelle begleitet wird. Da ein OPP auf einen Abstand von weit weniger als einer optischen Wellenlänge von der Grenzfläche Metall/Dielektrikum eingegrenzt ist, kann es auf räumlichen Skalen von einigen Nanometern beeinflusst und manipuliert werden, ohne seine zeitliche optische Frequenz zu beeinträchtigen. Die enge Bindung der Welle an die Grenzfläche führt zu einer Erhöhung der lokalen Feldstärke. In diesem Abschnitt wenden wir die in Abschnitt 8.1.2 entwickelte Analyse von OPP-Wellen an einer DP/ENGrenzfläche auf eine Grenzfläche zwischen Metall und Dielektrikum an. Dabei kombinieren wir die effektive Permittivität eines Metalls nach dem vereinfachten Drudemodell gemäß Gl. (8.44) mit den allgemeinen Ergebnissen für die Wellenparameter gemäß den Gln. (8.16) und (8.17). Nach der Analyse aus Abschnitt 8.1.2 kann an der Grenzfläche eine OPP-Welle existieren, sofern der Betrag |𝜀2 | der Permittivität des EN-Mediums größer ist als die Permittivität 𝜀1 des DP-Mediums. Wenn das Metall durch das vereinfachte Drudemodell beschrieben wird, ist seine effektive Permittivität nach Gl. (8.44) 𝜀2 = 𝜀0 (1 − 𝜔P2 ∕𝜔2 ), was bedeutet, dass sich das Material für 𝜔 < 𝜔P wie ein EN-Medium verhält. Wie Abb. 8.15(a)
wobei 𝜀r,1 = 𝜀1 ∕𝜀0 die relative Permittivität des dielektrischen Mediums darstellt. Das Frequenzband 𝜔 < 𝜔O , in dem eine OPP-Welle möglich ist, ist kleiner als das Frequenzband 0 < 𝜔 < 𝜔P , in dem das Metall sich gemäß dem einfachen Drudemodell wie ein EN-Medium verhält. Nach einiger Rechnerei zeigt die Kombination der Gln. (8.16) und (8.44), dass 𝛽, 𝑛G und 𝜀G durch Gl. (8.47) gegeben sind. Gleichung (8.48) kann unverändert aus Gl. (8.17) übernommen werden. Wir üblich steht 𝑘0 = √ 𝜔 𝜀0 𝜇 = 2π∕𝜆 für die Vakuumwellenzahl und die Eindringtiefe ist durch d E = 1∕2π gegeben. √ 1 − 𝜔2 ∕𝜔P2 𝜀G , 𝜀G = 𝜀1 , 𝛽 = 𝑛G 𝑘0 , 𝑛G = 2 𝜀0 1 − 𝜔2 ∕𝜔O (8.47) √ √ 2 2 −𝜀1 −𝜀2 𝑘0 , 𝛾2 = 𝑘0 . 𝛾1 = 𝜀0 (𝜀1 + 𝜀2 ) 𝜀0 (𝜀1 + 𝜀2 ) (8.48) Wie Abb. 8.15 zeigt, unterscheidet sich das Verhalten der in Gl. (8.47) angegebenen Parameter in den drei Frequenzbändern: • Für 𝜔 < 𝜔O verhält sich das Metall nach dem einfachen Drudemodell wie ein EN-Medium, das entlang seiner Grenzfläche zu einem dielektrischen Medium OPP führen kann. Das Frequenzband 𝜔 < 𝜔O liegt innerhalb des verbotenen Bandes 0 < 𝜔 < 𝜔P des Volumenmetalls, in dem keine sich ausbreitenden Wellen erlaubt sind. Die Eigenschaften der OPP-
ε1 > 0
0
ωP
ω
0
ωO
Metall
co
ε2 < 0
0 (a)
Abb. 8.15 Oberflächenplasmonpolariton an einer Grenzfläche zwischen Metall und Dielektrikum (siehe Abb. 8.4). (a) Frequenzabhängigkeit der Permittivitäten 𝜀1 und 𝜀2 des dielektrischen und des metallischen Mediums. Die Erfordernis |𝜀2 | > 𝜀1 für die Existenz der OPP-Welle ist für 𝜔 < 𝜔O erfüllt. (b) Frequenzabhängigkeit der effektiven Permittivität der OPP-Welle. Die Wellengeschwindigkeit
β c1
ωP ω ω O OPP
ε1
ω
ωP
ε2 ωO
= ω
VPP
ε1 Dielektrikum
β
ω OPP
=
εG OPP
(b)
0
(c)
√
β
ist c0 ∕bG mit nG = 𝜀G ∕𝜀0 . (c) Dispersionsrelationen für die Volumen- (VPP) und Oberflächen-Plamonpolaritonen (OPP). Die Diagramme wurden aus den Gln. (8.45) bzw. (8.47) für 𝜀r,1 = 2.25 (die relative Permittivität von Glas) berechnet, √ sodass 𝜔O = 𝜔P ∕ 1 + 𝜀r,1 = 0.55𝜔P ist. Die Linien für die Ausbreitung des Lichts im Vakuum bzw. und im dielektrischen Volumenmedium sind gepunktet dargestellt.
239
240
8 Optik von Metallen und Metamaterialien
Welle hängen von dem Verhältnis |𝜀2 |∕𝜀1 ab, das eine monoton abnehmende Funktion des Verhältnisses 𝜔∕𝜔O ist und für 𝜔 = 𝜔O gegen den kritischen Wert eins geht. Verglichen mit Wellen in dielektrischen Volumenmedien ist sowohl die OPP-Geschwindigkeit 𝑐0 ∕𝑛G als auch die Plasmonwellenlänge 𝜆0 ∕𝑛G b kleiner, wie auch aus der in Abb. 8.15(c) gezeigten Dispersionskurve in Abb. 8.15(c) hervorgeht, da für die OPP-Welle 𝛽 > 𝜔∕𝑐1 ist. Nach Gl. (8.17) ist die Eindringtiefe d 2 = 1∕2𝛾2 in das Metall kleiner als die Eindringtiefe d 1 = 1∕2𝛾1 in das Dielektrikum, und beide sind kleiner als die Wellenlänge im dielektrischen Volumenmedium. Mit zunehmendem Verhältnis 𝜔∕𝜔O verlangsamt sich das OPP und die zugehörige Plasmonwellenlänge nimmt ab. Wie in Abschnitt 8.1.2 erläutert wird, wird das OPP gleichzeitig zunehmend lokalisiert und die Eindringtiefen sowohl in das Metall als auch in das Dielektrikum verringern sich. Für 𝜔∕𝜔O = 1 werden die Permittivitäten des Metalls und des Dielektrikums betragsmäßig gleich mit entgegengesetztem Vorzeichen (𝜀1 + 𝜀2 = 0), woraufhin die Geschwindigkeit des OPP null wird. • Für 𝜔O < 𝜔 < 𝜔P verhält sich das Metall nach dem einfachen Drudemodell wie ein EN-Medium, in dem jedoch wegen |𝜀2 | < 𝜀1 keine OPP-Wellen erlaubt sind. Daher werden Wellen, die sich mit diesen Frequenzen im dielektrischen Medium ausbreiten, an der Grenzfläche DP/EN unter allen Einfallswinkeln vollständig reflektiert. • Für 𝜔 > 𝜔P verhält sich das Metall nach dem einfachen Drudemodell wie ein DP-Medium. An Grenzflächen zwischen zwei DP-Medien können keine OPPWellen auftreten. Ähnlich wie ein dielektrisches Medium unterstützt das Metall jedoch die Ausbreitung von Wellen in seinem Volumen, die Volumenplasmonpolaritonen (VPP). Bei diesen hohen Frequenzen folgen Reflexion und Brechung von Wellen an der Grenzfläche Metall/Dielektrikum den herkömmlichen Gesetzen, die auch für zwei dielektrische Medien gelten. Totalreflexion ist möglich, jedoch nur bei Einfallswinkeln jenseits des kritischen Winkels. Beispiel 8-4: Oberflächenplasmonpolaritonen an den Grenzflächen Silber/Luft und Ag∕SiO2
An den Grenzflächen zwischen Dielektrika mit Metallen wie Silber (Ag) oder Gold (Au) können OPP-Wellen auftreten. Für eine optische Welle der Vakuumwellenlänge 𝜆0 = 800 nm beträgt die Permittivität von Ag 𝜀2 ≈ −32.6𝜀0 . 6) Die Plasmafrequenz von Ag, 𝜔P = 1.37 × 1016 s−1 , entspricht einer VakuumPlasmawellenlänge 𝜆P = 2π𝑐0 ∕𝜔P = 138 nm (siehe Tabelle 8.2). Für die Grenzfläche Ag/Luft (𝜀1 = 𝜀0 ),
ergibt Gl. (8.46)√für die zu 𝜔O gehörige Vakuumwellenlänge 𝜆O = 2𝜆P = 195 nm. OPP-Wellen können an dieser Grenzfläche folglich nur existieren, wenn ihre Vakuumwellenlänge größer als 195 nm ist. Nach den Gln. (8.47) und (8.48) hat eine OPP-Welle mit einer Vakuumwellenlänge von 800 nm an dieser Grenzfläche, folgende Eigenschaften: 𝑛G = 1.016 , d 1 = 358 nm ,
𝜆0 ∕𝑛G = 788 nm , d 2 = 11 nm .
An der Grenzfläche Ag∕SiO2 (𝜀1 = 3.9𝜀0 bei 𝜆0 = 800 nm) betragen die zu 𝜔P und 𝜔O gehörigen Vakuum-Plasmawellenlängen 𝜆P = 138 nm bzw. 𝜆O = 305 nm. An dieser Grenzfläche hat eine OPP-Welle mit einer Vakuumwellenlänge von 800 nm folgende Eigenschaften: 𝑛G = 2.104 ,
𝜆0 ∕𝑛G = 380 nm ,
d 1 = 87 nm ,
d 2 = 10 nm .
Beim Vergleich der Ergebnisse für die beiden Dielektrika wird deutlich, dass das Material mit dem höherem Brechungsindex (SiO2 ) zu einer OPP-Welle mit geringerer Geschwindigkeit, kleinerer Wellenlänge und geringerer Eindringtiefe in beide Medien führt. Darüber hinaus ist sowohl für Luft als auch für SiO2 d 2 < d 1 , d. h. die Eindringtiefe in das dielektrische Medium ist stets größer als diejenige in das Metall, wie auch in den Abb. 8.4 und 8.5 zu sehen ist.
Erzeugung und Nachweis von Oberflächenplasmonpolaritonen
Da die Ausbreitungskonstante einer OPP-Welle, die sich entlang einer Grenzfläche zwischen Metall und Dielektrikum ausbreitet, größer ist als die einer gewöhnlichen optischen Welle mit derselben Frequenz im dielektrischen Medium [siehe Abb. 8.15(c)], ist es nicht einfach, die beiden Wellen zu koppeln. Eine Möglichkeit hierzu besteht darin, eine durch Totalreflexion an einer Grenzfläche Metall/Dielektrikum erzeugte evaneszente Welle mit der OPP-Welle an der gegenüberliegenden Grenzfläche Metall/Dielektrikum zu koppeln, wie dies in der in Abb. 8.16(a) gezeigten Anordnung von Prismenkopplern dargestellt ist. Ein ähnlicher Ansatz wird auch ver-
6) Der experimentelle Wert für die Permittivität von Silber bei einer Vakuumwellenlänge 𝜆0 = 800 nm ist 𝜀2 = (−32.6 + i0.5)𝜀0 . Der aus Gl. (8.44) auf der Grundlage des einfachen Drudemodells (keine Dämpfung) berechnete Wert für die effektive Permittivität bei dieser Wellenlänge ist 𝜀2′ = −32.8𝜀0 , in guter Übereinstimmung mit dem experimentellen Wert.
8.2 Optik von Metallen: Plasmonik
Dielektrikum n1
β
OPP Prisma np
1
β
EW
Reflexionsgrad
Metall
θp
0 (b)
(a)
θr
θp
Abb. 8.16 (a) Erzeugung einer OPP-Welle mit einem Prismenkoppler. Eine evaneszente Welle (EW), die durch Totalreflexion einer optischen Welle an der Grenzfläche Prisma/Metall erzeugt wird, regt eine OPP-Welle an der gegenüberliegenden Grenzfläche Metall/Dielektrikum an. (b) Die Abhängigkeit des Reflexionsgrads der optischen Welle vom
Einfallswinkel 𝜃P . Wenn die Phasenbedingung bei 𝜃P = 𝜃r erfüllt ist, entsteht eine OPP-Welle, was zu einer Abnahme der Intensität der reflektierten Welle führt. Eine geringfügige Änderung des Brechungsindex n1 wirkt sich auf 𝜃r gemäß Gl. (8.49) aus, wodurch die gestrichelte Kurve entsteht. Das System wirkt auf diese Weise als präziser Sensor.
wendet, um Licht über ein Prisma in einen Wellenleiter einzukoppeln, wie wir in Abb. 9.29 sehen werden. Die Kopplung findet nur dann statt, wenn die beiden Wellen phasenangepasst sind, d. h. wenn ihre Ausbreitungskonstanten exakt gleich sind. Bei einer aus dem Inneren eines Prismas mit dem Brechungsindex 𝑛P austretenden Welle ist diese Bedingung für einem Einfallswinkel 𝜃P = 𝜃r mit 𝑛P 𝑘0 sin 𝜃r = 𝛽 erfüllt. Der Parameter 𝛽 ist die in den Gln. (8.47) und (8.48) gegebene Ausbreitungskonstante der SPP-Welle, die vom Brechungs√ index 𝑛1 = 𝜀1 ∕𝜀0 des Dielektrikums abhängt, das an die entgegengesetzte Seite der Metallschicht angrenzt [in Abb. 8.16(a) als Luft dargestellt]. Wie einfach zu überprüfen ist, ist diese Bedingung für einen Einfallswinkel 𝜃r erfüllt, für den gilt
Detektion von Gasen oder die Messung von molekularer Adsorption. Eine andere Methode zur Anregung einer OPP-Welle besteht darin, Licht an einer auf der metallischen Oberfläche aufgebrachten periodischen Subwellenlängenstruktur (einem Gitter) zu streuen, wodurch eine Komponente der Ortsfrequenz hinzugefügt werden kann, die die Fehlanpassung der Ausbreitungskonstante ausgleicht. Eine OPP-Welle kann nachgewiesen werden, indem sie unter Verwendung eines Prismenkopplers oder eines Gitters in eine proportionale optische Welle umgewandelt wird.
√ 1 − 𝜔2 ∕𝜔P2 𝑛1 √ √ sin 𝜃r = . 𝑛2 1 − (1 + 𝑛2 )𝜔2 ∕𝜔2 1
(8.49)
P
Wenn die Phasenbedingung erfüllt ist, wird optische Leistung übertragen und die OPP-Welle wird durch eine Form von frustrierter Totalreflexion (FTIR, von engl. frustrated total internal reflexion 7)) erzeugt, wodurch die Leistung der an der Grenzfläche des Prismas reflektierten optischen Welle erheblich abnimmt. Die Änderung des Reflexionsvermögens äußert sich in einer scharfen, resonanzartigen Funktion des Einfallswinkels, die in Abb. 8.31(b) gezeigt ist. Da der Winkel 𝜃r von 𝑛1 abhängt, reagiert er empfindlich auf Änderungen in der Umgebung der Metallschicht, die 𝑛1 definieren. Diese als Oberflächenplasmon-Resonanzspektroskopie (SPR-Spektroskopie) bezeichnete Messtechnik hat umfangreiche Verwendung in der chemischen und biologischen Sensorik gefunden; Beispiele sind die 7) Nicht zu verwechseln mit der Fouriertransformations-Infrarotspektroskopie, die ebenfalls mit FTIR (oder FT-IR) abgekürzt wird!
8.2.3 Metallische Nanokugeln: Lokalisierte Oberflächenplasmonen An der (inneren oder äußeren) Grenzfläche von metallischen Strukturen mit Abmessungen im Subwellenlängenbereich (z. B. Nanokugeln, Nanoscheiben oder andere Nanoteilchen) zu einem umgebenden dielektrischen Medium können Plasmonoszillationen auftreten. Diese Oszillationen nennt man lokalisierte Oberflächenplasmonpolaritonen oder kürzer lokalisierte Oberflächenplasmonen (LOP, auch LSP von engl. localized surface plasmon). Wenn die Anregungsfrequenz mit der Resonanzfrequenz der Struktur übereinstimmt, entsteht eine Oberflächen-Plasmonresonanz (SPR, engl. surface plasmon resonance). Ein lokalisiertes Oberflächenplasmon ist von einem Oberflächenplasmon mit großer Reichweite zu unterscheiden – bei jenem handelt es sich um eine OPP-Welle, die sich wie in Abschnitt 8.2.2 diskutiert entlang einer ausgedehnten Grenzfläche Metall/ Dielektrikum ausbreitet. Ebenso ist die OberflächenPlasmonresonanzfrequenz von der Plasmafrequenz des Metalls zu unterscheiden, obwohl beide miteinander zusammenhängen. Gold- und Silbernanopartikel besitzen
241
242
8 Optik von Metallen und Metamaterialien
ES
E0 Ei ε εS a (b)
(a)
Abb. 8.17 (a) Betrag des optischen Feldes um eine metallische Nanokugel in der plasmonischen Mode niedrigster Ordnung dieses Resonators; das innere Feld ist nicht gezeigt. (b) Feldlinien einer plasmonischen Mode, die durch eine einfallende ebene Welle angeregt wird.
Plasmonresonanzfrequenzen im sichtbaren Bereich des Spektrums, wohingegen die Plasmafrequenzen dieser Metalle weit im ultravioletten Bereich liegen. Aufgrund der gekrümmten Oberflächen von Nanopartikeln können SPR durch direkte Bestrahlung mit Licht angeregt werden. Die resultierenden intensiven Farben solcher Partikel sowohl in Transmission als auch in Reflexion sind auf resonant erhöhte Streuung und Absorption zurückzuführen. Metallische Nanokugeln
In einer metallischen Nanokugel, die in einem umgebenden dielektrischen Medium eingebettet ist, können LOP-Oszillationen auftreten. Um die Verteilung des optischen Feldes zu erhalten, müssen die Maxwellgleichungen im Metall und dem Dielektrikum (die eine negative bzw. positive Permittivität besitzen) gelöst und Oberflächenladungen sowie geeignete Randbedingungen berücksichtigt werden. Die Feldverteilung der plasmonischen Mode niedrigster Ordnung ist in Abb. 8.17 dargestellt. Eine metallische Nanokugel ist ein resonantes Streuzentrum. Aus der Theorie der Rayleighstreuung in Abschnitt 5.6.2 wissen wir, dass eine ebene Welle mit dem elektrischen Feld 𝐸0 beim Auftreffen auf eine kleine Kugel ein parallel gerichtetes inneres Feld 𝐸i hervorruft, das wiederum einen oszillierenden elektrischen Dipol erzeugt, der eine gestreute Dipolwelle 𝐸S abstrahlt (siehe Abb. 5.26). Nach Gl. (5.127) ist die gesamte gestreute optische Leistung 𝑃S = 𝜎S 𝐼0 , wobei 𝜎S der Streuquerschnitt ist und 𝐼0 die Intensität der einfallenden Welle. Die Gln. (5.131) und (5.132), die anwendbar sind, wenn für das Verhältnis von Radius zu Wellenlänge 𝑎∕𝜆 ≪ 1 gilt, zeigen, dass 𝜎S von den Permittivitäten 𝜀S und 𝜀 der Nanokugel bzw. des umgebenden Mediums abhängt (sowie natürlich von 𝑎∕𝜆): 𝜎S = π𝑎2 𝑄S ,
𝑄S =
2 4 8 ||| 𝜀S − 𝜀 ||| 𝑎 || || (2π ) , 3 || 𝜀S + 2𝜀 || 𝜆
(8.50)
𝐸i =
3𝜀 𝐸 . 𝜀S + 2𝜀 0
(8.51)
Für ein Metall, das durch das vereinfachte Drudemodell beschrieben wird, ist die effektive Permittivität des metallischen Mediums durch 𝜀S = 𝜀0 (1 − 𝜔P2 ∕𝜔2 ) gegeben [siehe Gl. (8.44); 𝜀S ist also entweder negativ oder positiv, je nachdem, ob 𝜔 unterhalb oder oberhalb der Plasmafrequenz 𝜔P liegt. Daraus folgt, dass der Nenner (𝜀S + 2𝜀) von Gl. (8.50) und (8.51) entweder negativ oder positiv sein kann, aber für 𝜀S = −2𝜀 verschwindet, sodass 𝜎S und 𝐸i unendlich werden. Die LOP-Resonanzfrequenz, bei der dieser Fall eintritt, erhalten wir, indem wir 𝜀0 (1 − 𝜔P2 ∕𝜔) = −2𝜀 setzen; das führt zu 𝜔0 = √
𝜔P 1 + 2𝜀r
(8.52)
mit 𝜀r = 𝜀∕𝜀0 . Die Oberflächen-Plasmonresonanzfrequenz 𝜔0 ist sowohl von der Plasmafrequenz 𝜔P des Metalls [siehe Gl. (8.42)] als auch von der Maximalfrequenz 𝜔S zu unterscheiden, bei der ein OPP existieren kann [siehe Gl. (8.46)], obwohl alle drei eng miteinander verwandt sind. Bei Frequenzen in der Nähe von 𝜔0 werden der Streuquerschnitt 𝜎S und das innere Feld 𝐸i wesentlich verstärkt, wie Abb. 8.18 zeigt, in der 𝜎S und 𝐸i als Funktionen von 𝜔 aufgetragen sind. Unterhalb der Resonanz (𝜔 < 𝜔0 ) zeigt der von dem einfallenden Feld angeregte Dipol in dieselbe Richtung wie das einfallende Feld, während das innere Feld diesem entgegengesetzt ist, d. h. es ist gegenphasig gerichtet, da 𝐸i ∕𝐸0 negativ ist. Oberhalb der Resonanz (𝜔 > 𝜔0 ) ist die Situation umgekehrt, genau wie bei einer dielektrischen Nanokugel (Abb. 5.26). In der Umgebung der Resonanz können sowohl das interne Feld 𝐸i als auch das gestreute Feld im Bereich des Nahfelds gegenüber dem einfallenden Feld 𝐸0 wesentlich verstärkt sein. Diese Verstärkung des Feldes geht mit einer räumlichen Lokalisierung der elek-
8.2 Optik von Metallen: Plasmonik
σ 5 (a.u.) 4
(a)
Ei E0
5 4
3
3
2
2
1
1
0
0
ω0
ωP
ω
0 (b) 0
E0
Ei
Ei
E0
ω0
ωP
ω
Abb. 8.18 Der Verlauf des Streuquerschnitts 𝜎S und des inneren Feldes Ei für eine metallische Nanokugel in Luft (𝜀r = 1), die durch das vereinfachte Drudemodell beschrieben √ wird. Nach Gl. (8.52) ist die Resonanzfrequenz 𝜔0 = 𝜔P ∕ 3,
wobei 𝜔P die Plasmafrequenz des Metalls ist. Unterhalb der Resonanz ist das innere Feld entgegengesetzt zum einfallenden äußeren Feld gerichtet (außer Phase), während es oberhalb der Resonanz in dieselbe Richtung zeigt.
tromechanischen Energie auf einer Skala einher, die der Größe der Nanokugel entspricht. Das vereinfachte Drudemodell, auf dessen Grundlage die Graphen in Abb. 8.18 erstellt wurden, geht davon aus, dass im Metall keine Absorption stattfindet. Diese Idealisierung ist der Ursprung des unendlichen Streuquerschnitts und des unendlichen inneren Feldes bei Resonanz. in Wirklichkeit besitzen echte Metalle natürlich einen endlichen spezifischen Widerstand und eine endliche Absorption, was mathematisch durch Einführen eines Imaginärteils in die Permittivität berücksichtigt werden kann. Wenn wir die komplexe Permittivität als 𝜀S = 𝜀S′ + 𝜀S′′ schreiben, tritt Resonanz dann ein, wenn die Realteile der Nenner in den Gln. (8.50) und (8.51) verschwinden, also für 𝜀S = −2𝜀. Die komplexe Permittivität führt somit zu einem verbleibenden Nenner von i𝜀S′′ (anstelle von null), sodass wir bei Resonanz einen endlichen Wert von 𝜎S erhalten:
sorptionseffizienz
𝜎S = π𝑎2 𝑄S ,
𝑄S =
2 4 ′′2 8 𝑎 𝜀S + 9𝜀 . (2π ) 3 𝜆 𝜀S′′2
(8.53)
Eine metallische Nanokugel ist nicht nur ein resonanter Streukörper, sondern gleichzeitig auch ein resonanter Absorber. Wie in Abschnitt 5.6.4 diskutiert wurde, wird die Rayleighstreuung einer einfallenden Welle an einer Nanokugel mit der komplexen Permittivität 𝜀S in einem umgebenden Medium mit der realen Permittivität 𝜀 von Absorption begleitet. Sowohl Absorption als auch Streuung tragen zur Dämpfung (Abschwächung) der einfallenden Welle bei. Gemäß Gl. (5.137) gilt für den Absorptionsquerschnitt 𝜎Ab = π𝑎2 𝑄Ab eines kleinen kugelförmigen Streuzentrums mit dem Radius 𝑎 die gleiche Resonanzbedingung wie für den in Gl. (8.50) angegebenen Streuquerschnitt 𝜎S , nämlich 𝜀S = −2𝜀. Einsetzen von 𝜀S = 𝜀S′ + i𝜀S′′ in Gl. (5.137) führt zu einer Ab-
𝜀S − 𝜀 𝑎 𝑄Ab ≈ −4 (2π ) Im { } 𝜀S + 2𝜀 𝜆 −12𝜀𝜀S′′ 𝑎 . = (2π ) ′ 𝜆 (𝜀 + 2𝜀)2 + 𝜀′′2 S S
(8.54)
Bei Resonanz wird der Nenner rechts einfach zu 𝜀S′′2 , was zu einem maximalen Absorptionskoeffizienten 𝑄Ab = −(2π𝑎∕𝜆)(12𝜀∕𝜀S′′ führt. Je größer der spezifische Widerstand des Metalls ist, der durch 𝜀S′′ beschrieben wird, desto breiter ist das Resonanzprofil und desto kleiner sind die Maxima von 𝜎Ab und 𝜎S . Metallische Nanokugeln mit lokalisierten Oberflächen-Plasmonresonanzen im sichtbaren und ultravioletten Bereich des Spektrums kommen häufig in Anwendungen zum Einsatz, die ihre wellenlängenselektiven Absorptions- und Streuresonanzen sowie die damit verbundene Feldverstärkung und -lokalisierung ausnutzen. In Buntglas eingebettete Nanokugeln erzeugen beispielsweise durch das Auslöschen bestimmter Wellenlängen besonders brillante Farben – Beispiel hierfür sind gelegentlich in Kirchenfestern zu finden (z. B. in der Kathedrale Notre Dame in Paris). Die Abhängigkeit der LOP-Resonanzfrequenz von der relativen Permittivität 𝜀r des Wirtsmediums ermöglicht Sensoren, die auf die dielektrischen Eigenschaften des umgebenden Mediums ansprechen; ein Wirtsmedium mit erhöhter Permittivität führt zu einer verringerten Resonanzfrequenz und einer größeren Resonanzwellenlänge, wie aus Gl. (8.52) hervorgeht.
243
244
8 Optik von Metallen und Metamaterialien
Monopol
Dipol
Schleife
Mikrostrip
(a)
Hornstrahler
Schüssel
(b)
Abb. 8.19 (a) Radiowellenantennen. (b) Mikrowellenantennen
8.2.4 Optische Antennen Eine Antenne ist ein elektrisch leitendes Bauelement, das einen oszillierenden elektrischen Strom in ein elektromagnetisches Feld umwandelt und umgekehrt. Sie ist eine zentrale Komponente in Sendern und Empfängern für elektromagnetische Strahlung. Bei Radio- und Mikrowellenfrequenzen bestehen Antennen aus metallischen Drähten, Stäben, Schleifen oder Mikrostrips, deren Abmessungen in der Größenordnung der Wellenlänge liegen [Abb. 8.19(a)]. Derartige Antennen sind resonante Bauelemente. Eine Monopolantenne aus einem Metallstab der Länge 𝐿, der beispielsweise auf einer leitenden Platte angebracht ist, besitzt eine Resonanzfrequenz 𝑐∕4𝐿 entsprechend einer Wellenlänge 𝜆 = 4𝐿. Auch eine Dipolantenne mit zwei Polen der Länge 𝐿, die durch einen kleinen Spalt voneinander getrennt sind, besitzt dieselbe Resonanzfrequenz. Eine Antenne kann auch aus einer elektrisch leitenden Struktur bestehen, die die Winkelverteilung einer elektromagnetischen Welle verändert [Abb. 8.19(b)]. Im Mikrowellenfrequenzen kommt beispielsweise die Hornantenne (ein mit dem Ende eines Wellenleiters verbundenes metallisches Horn) oder die Antennenschüssel (eine parabolische Metalloberfläche, in dessen Brennpunkt das Ende eines Wellenleiters montiert ist) zum Einsatz. Diese Antennen müssen nicht unbedingt resonant sein und ihre Abmessungen können wesentlich größer werden als die Wellenlänge der empfangenen oder gesendeten Strahlung. Resonante optische Antennen können aus metallischen Bauelementen ähnlich den für Radiowellenantennen verwendeten konstruiert werden, jedoch mit verkleinerten Abmessungen [Abb. 8.20(a)]. Da die Länge einer optischen Viertelwellen-Dipolantenne jedoch im Nanometerbereich liegt, kann die Herstellung eine Herausforderung sein. Bei optischen Frequenzen wird die Wechselwirkung des optischen Feldes mit metallischen Antennen durch OPP-Wellen vermittelt, deren Ausbreitungswellenlängen noch kleiner sind als die optische Vakuumwellenlänge. Solche plasmonischen Anten-
nen basieren auf Streuung und wandeln das einfallende Licht in lokalisierte OPP-Wellen um, die ihrerseits Licht mit einer veränderten räumlichen Verteilung ausstrahlen. Zu den nichtresonanten optischen Antennen gehören die in der Nahfeldmikroskopie verwendeten metallbeschichteten zugespitzten („getaperten“) Wellenleiter („Fasertaper“) oder der in Teleskopen verwendete Parabolspiegel [siehe Abb. 8.20(b)]. Die Abmessungen dieser optischen Antennen sind typischerweise weitaus größer als die optische Wellenlänge. Ein Beispiel für eine resonante optische Antenne beruht auf einer einfallenden ebenen optischen Welle, die auf eine metallische Nanokugel trifft und dort eine lokalisierte OPP-Welle anregt, die wiederum wie in Abschnitt 8.2.3 beschrieben eine optische Dipolwelle ausstrahlt. Wenn Resonanz eintritt, wird das Feld in der Umgebung der Nanokugel verstärkt und lokalisiert und der Streuquerschnitt nimmt stark zu, sodass ein größerer Teil des einfallenden Lichts erfasst und gestreut wird. Die Nanokugel wirkt somit als resonante optische Antenne. Auch andere metallische Strukturen mit Abmessungen im Nanometerbereich wie z. B. der in Abb. 8.20(a) gezeigte Spaltring oder der Doppelspaltring zeigen Resonanzen bei optischen Frequenzen; ihre Resonanzeigenschaften hängen von ihrer Form, ihrem Abmessungen und dem verwendeten Material ab. Resonante optische Antennen können verwendet werden, um Licht auf kleine Absorber wie z. B. einzelne Moleküle zu lokalisieren und in sie einzukoppeln. Bei der in Abb. 8.21(a) dargestellten Anordnung für die Nahfeldmikroskopie ist beispielsweise ein Metallstab auf einem leitenden Sockel am Ende einer sich verjüngenden optischen Faser angeordnet, der als Monopolantenne wirkt. Eine ähnliche Funktion erfüllt auch die Nanokugel am Ende einer Glasspitze, die in Abb. 8.21(b) gezeigt ist. Allgemein kann eine zwischen einem Emitter und einem Absorber angeordnete resonante optische Antenne dazu dienen, die Wechselwirkung zwischen Emitter und Absorber zu optimieren, indem sie die Abstrahlung bzw. Detektion der Strahlung erleichtert.
8.3 Optik von Metamaterialien
Stab
Spaltring
Doppelspaltring
Nanokugel
(a)
Fasertaper
Spiegel
(b)
Abb. 8.20 (a) Optische Antennen aus metallischen Strukturen, die bei optischen Frequenzen Resonanz zeigen. (b) Nicht resonante optische Antennen.
Fasertaper Metallstab
optischer Monopol
Glasspitze Nanokugel
(a)
(b)
Abb. 8.21 Optische Antennen zur Lokalisierung von Licht in der Nahfeldmikroskopie. (a) Monopolantenne am Ende einer getaperten Faser. (b) Nanokugelantenne am Ende einer Glasspitze.
Die größte Herausforderung bei der Beschreibung der Wechselwirkung einer optischen Welle mit metallischen Strukturen ergibt sich dann, wenn die Abmessungen der Strukturen mit der optischen Wellenlänge (μm) vergleichbar sind. Dies erfordert typischerweise eine vollständige Analyse unter Einbeziehung der elektromagnetischen Felder und der elektrischen Ladungsverteilungen. Herkömmliche makroskopische optische Strukturen haben weitaus größere Abmessungen und können leicht unter Verwendung der üblichen Techniken der Optik analysiert werden. Im umgekehrten Grenzfall lassen sich metallische Nanostrukturen mit Effective-Circuit-Modellen recht gut handhaben, wie wir im folgenden Abschnitt sehen werden.
8.3 Optik von Metamaterialien Optische Metamaterialien sind synthetische Verbundmaterialien mit gezielt entworfenen räumlichen Mustern und Abmessungen, die kleiner als die optische Wellenlänge sind. Ihre besonderen optischen Eigenschaften verdanken sie den atomaren und molekularen Strukturen der einzelnen Materialien sowie der Geometrie und den Abmessungen der räumlichen Muster im Verhältnis zur Wellenlänge. Sie können so ausgeführt werden, dass sie spezifische und ungewöhnliche optische Eigenschaf-
ten aufweisen, die in natürlichen Materialien nicht verfügbar sind. Metamaterialien bilden die Grundlage für eine Reihe von hochspezialisierten optischen Geräten. Eine besondere Klasse von optischen Metamaterialien sind die in Kapitel 7 besprochenen photonischen Kristalle. Diese periodischen dielektrischen Strukturen besitzen photonische Bandlücken, die den in Halbleitermaterialien beobachteten elektronischen Bandlücken ähnlich sind. Eine andere spezielle Klasse von Metamaterialien, die wir später in diesem Abschnitt kennenlernen werden, enthält metallische Strukturen wie Stäbe und Ringe mit Abmessungen im Subwellenlängenbereich, die in dielektrische Medien eingebettet sind und eine periodische oder zufällige Anordnung im Subwellenlängenmaßstab bilden. Die Formen dieser Strukturen und die Muster, in denen sie angeordnet sind, sind so ausgelegt, dass die effektiven elektrischen und magnetischen Materialparameter 𝜀 bzw. 𝜇 entweder positiv oder negativ sind. Dies ermöglicht wiederum die Synthese von EN- und DN-Materialien mit ihren speziellen optischen Eigenschaften, die wir in Abschnitt 8.1 diskutiert hatten. Wenn in den metallischen Strukturen Resonanz auftritt, kann das effektive Verhalten von 𝜀 und 𝜇 die übliche Frequenzabhängigkeit der Suszeptibilität eines resonanten Mediums zeigen, wie sie in Abb. 5.20 dargestellt ist. Bei Frequenzen oberhalb der Resonanzfrequenz kann der Realteil der Suszeptibilität wie in Abb. 8.22 gezeigt negativ werden, sodass das Medium sich insgesamt wie ein EN- oder DN-Medium verhalten kann. Obwohl der die Dämpfung beschreibende Imaginärteil der Suszeptibilität in der Umgebung der Resonanz bedeutend ist, kann bei hinreichend hohen Frequenzen ein schmales Band mit negativem Realteil bestehen bleiben, in dem die Dämpfung minimal ist. Da für natürlich vorkommende nichtmagnetische Materialien bei optischen Frequenzen 𝜇 = 𝜇0 gilt, können DN-Materialien (mit negativem Brechungsindex) nicht ohne Weiteres ohne die Verwendung von Metamaterialien erzeugt werden. Die Herstellung von optischen DN-Metamaterialien ist jedoch eine Heraus-
245
246
8 Optik von Metallen und Metamaterialien
–εʺ
εʹ ω
–μʺ
μʹ ω
Abb. 8.22 Ein Medium mit resonanter Permittivität und Permeabilität kann sich in einem Frequenzband oberhalb beider Resonanzfrequenzen (schattierter Bereich) wie ein DN-Medium verhalten.
forderung. Erstens müssen die metallischen Elemente Abmessungen im Subwellenlängenbereich besitzen, damit ihre Resonanzfrequenzen im optischen Band liegen; hierzu sind Fertigungstechnologien im Nanometerbereich erforderlich. Zweitens müssen die elektrischen und magnetischen Resonanzfrequenzen so nahe beieinander liegen, dass sich die Bereiche mit negativem 𝜀 und 𝜇 aneinander ausrichten, wie Abb. 8.22 illustriert. Seit das Thema Metamaterialien in den Fokus gerückt ist, wurden große Anstrengungen unternommen, um diesen Herausforderungen zu begegnen. Die physikalischen Prinzipien, die den Metamaterialien zugrunde liegen, könnten auch auf Gebieten wie Akustik, Mechanik oder Thermodynamik in Zukunft ganz neue Entwicklungen möglich machen. Wir werden im Folgenden zuerst dreidimensionale optische Metamaterialien besprechen und anschließend Metamaterialien mit reduzierter Dimensionalität, sogenannte Metaoberflächen, vorstellen.
8.3.1 Metamaterialien Die effektiven elektromagnetischen Parameter 𝜀 und 𝜇 für Metamaterialien, die aus einer dreidimensionalen Verteilung metallischer Strukturen in einem dielektrischen Wirtsmaterial bestehen, können wir durch Anwendung von genäherten Modellen, komplexen Analysetechniken oder numerischen Verfahren bestimmen. Zu den genäherten Modellen gehören insbesondere der
Effective-Medium- und der Effective-Circuit-Ansatz. Der auf der Anwendung der in Abschnitt 5.6.4 beschriebenen Maxwell-Garnett-Mischungsregel beruhende Effective-Medium-Ansatz ist streng genommen nur für Nanokugeln anwendbar; in der Praxis wird er jedoch häufig auch für Metallpartikel anderer Gestalt verwendet. Der Effective-Circuit-Ansatz ist dagegen auf metallische Strukturen beliebiger Form anwendbar, sofern sie nur hinreichend klein sind. Die dielektrischen bzw. magnetischen Eigenschaften eines natürlichen Materials werden üblicherweise durch Summieren der durch das angelegte elektrische und/oder magnetische Feld induzierten elektrischen/magnetischen Dipolmomente der atomare Bausteine bestimmt. Auf diese Weise erhält man die Polarisierungs- und Magnetisierungsdichten und daraus die elektrische Permittivität 𝜀 und die magnetische Permeabilität 𝜇. Ein ähnlicher Ansatz ist auch für Metamaterialien gangbar. Dabei wird jeder Bestandteil als Rayleigh-Streuzentrum aufgefasst und durch elektrische und/oder magnetische Dipole beschrieben. Um die elektrischen und magnetischen Dipolmomente zu bestimmen, werden metallische Strukturen mit Dimensionen im Subwellenlängenbereich als Bauelemente einer elektrischen Schaltung betrachtet; dieser Ansatz ist als Punktdipolnäherung bekannt. Größere Strukturelemente können mithilfe der MieStreutheorie (siehe Abschnitt 5.6.3) beschrieben werden, in der die Dipolbeiträge zu den führenden Termen einer Multipolentwicklung werden. Auch komplexere Schaltungsmodelle sind möglich. All diese Näherungen können jedoch direkte Wechselwirkungen und Resonanzen zwischen den Strukturelementen nicht berücksichtigen, die auftreten, wenn die metallischen Nanopartikel einander hinreichend nahe kommen, sodass ihre lokalisierten Plasmonfelder überlappen. Solche Effekte können durch den Effective-Circuit-Ansatz berücksichtigt werden, in welchem wechselseitige Kopplungen zwischen benachbarten Elementen wie z. B. Kreuzinduktivitäten einbezogen und die zusammengesetzten Schaltkreise als Übertragungsstrecken oder Schaltungsnetzwerke behandelt werden. Wenn Näherungen wie diese fehlschlagen, muss man auf numerische Methoden zurückgreifen. Wir werden nun mehrere dieser genäherten Modelle untersuchen, die sowohl auf dem Effective-Medium- als auch auf dem Effective-Circuit-Ansatz beruhen. Mit den betrachteten Modellen lassen sich Metamaterialien mit negativer Permittivität, negativer Permeabilität, negativem Brechungsindex sowie hyperbolischen Eigenschaften beschreiben.
8.3 Optik von Metamaterialien
εe
1– ω 0 2
(a)
(b)
ω0
ω1
ωP ω
(c)
Abb. 8.23 Ein Metamaterial mit negativer Permittivität. (a) Metallische Nanokugel. (b) Metamaterial aus gleichmäßig verteilten metallischen Nanokugeln in einem dielektrischen Medium. (c) Die effektive Permittivität 𝜀e hat eine Polstelle
bei der Resonanzfrequenz 𝜔0 und eine Nullstelle bei 𝜔1 . Da 𝜀e in dem Intervall zwischen 𝜔0 und 𝜔1 negativ ist, ist dieses Metamaterial einfach-negativ (EN), sofern 𝜇 positiv ist.
Ein Metamaterial mit negativer Permittivität: Metallische Nanokugeln in einem dielektrischen Medium
sein muss; folglich ist 𝜀e in dem spektralen Bereich zwischen 𝜔0 und 𝜔1 , das unterhalb der Plasmafrequenz des Metalls liegt, negativ ist. Sofern 𝜇 positiv ist, ist dieses Metamaterial daher einfach-negativ (EN), ähnlich wie ein homogenes Metall unterhalb seiner Plasmafrequenz [siehe Abb. 8.12(b)].
Wie in Abschnitt 5.6.4 erläutert und in Abb. 8.23 dargestellt, entspricht ein dielektrisches Medium mit der elektrischen Permittivität 𝜀, das homogen mit kleinen Nanokugeln mit der komplexen Permittivität 𝜀K gefüllt ist, einem isotropen Verbundmaterial mit einer effektiven Permittivität 𝜀e gemäß der Maxwell-Garnett-Mischungsregel aus Gl. (5.135): 𝜀e ≈ 𝜀
2(1 − 𝑓)𝜀 + (1 + 2𝑓)𝜀S , (2 + 𝑓)𝜀 + (1 − 𝑓)𝜀S
(8.55)
wobei 𝑓 der Volumenanteil der Einschlüsse ist (der Füllgrad). Wenn die metallischen Strukturelemente durch das vereinfachte Drudemodell beschrieben werden, gilt gemäß Gl. (8.44) 𝜀S = 𝜀0 (1 − 𝜔P2 ∕𝜔2 ), wobei 𝜔P die Plasmafrequenz ist; damit liefert Gl. (8.55) 𝜀e = 𝜀L
1 − 𝜔2 ∕𝜔12
(8.56)
1 − 𝜔2 ∕𝜔02
mit 𝜔0 = √ 𝜀L =
𝜔P 1 + 𝜀r,0
1 + 2𝑓 , 1−𝑓
,
𝜔1 = √ 𝜀r0 =
𝜔P 1 + 𝜀r,1
2+𝑓 𝜀 , 1−𝑓 r
, 𝜀r1 =
(8.57) 2(1 − 𝑓) 𝜀 , 1 + 2𝑓 r (8.58)
wobei 𝜀r = 𝜀∕𝜀0 die relative Permittivität des Wirtsmediums ist, die frequenzunabhängig angenommen wird. Wie Abb. 8.23(c) zeigt, besitzt die effektive Permittivität 𝜀e eine Polstelle bei 𝜔0 und eine Nullstelle bei 𝜔1 . Da 𝜀r0 > 𝜀r ist, ist, liegt die Resonanzfrequenz 𝜔0 unter der der isolierten Nanokugel, die durch Gl. (8.52) gegeben ist. Außerdem sehen wir wegen 𝜀r1 < 𝜀r0 , dass 𝜔 > 𝜔0
Ein Metamaterial mit negativer Permittivität: Dünne Metallstäbe in einem dielektrischen Medium
Die Induktivität 𝐿 eines zylindrischen Metallstabs mit der Länge 𝑎 und dem Radius 𝑤 (mit 𝑎 ≫ 𝑤) [Abb. 8.24(a)] beträgt 𝐿 ≈ (𝜇0 𝑎∕2π)[ln(2𝑎∕𝑤) − 3∕4]. Die effektive elektrische Permeabilität eines Mediums aus parallelen derartigen Stäben in Abständen von 𝑎 voneinander wird – wie in Abb. 8.24(b) dargestellt – anhand der Überlegung bestimmt, dass ein elektrisches Feld 𝐸 entlang eines Stabes eine Spannung 𝑉 = 𝑎𝐸 zwischen seinen beiden Enden aufbaut. Diese erzeugt wiederum einen elektrischen Strom 𝑖 = 𝑉∕i𝜔𝐿 in der Induktivität, der einer Ladung 𝑞 = 𝑖∕i𝜔 und einem elektrischen Dipolmoment p = 𝑞𝑎 entspricht. Da die Anzahl der Stäbe pro Volumeneinheit N = 1∕𝑎3 beträgt, ist die Polarisationsdichte durch 𝑃 = N∕p = p∕𝑎3 gegeben. Die effektive Suszeptibilität des Mediums beträgt somit 𝜒e = 𝑃∕𝜀0 𝐸 und die effektive Permittivität ist 𝜀e = 𝜀0 (1 + 𝜒e ). Durch Kombination dieser Gleichungen erhalten wir einen Ausdruck für die effektive Permittivität, dessen Form mit der aus dem vereinfachten Drudemodell übereinstimmt, 𝜀e = 𝜀0 (1 − 𝜔P = √
1 𝜀0 𝑎𝐿
𝜔P2 𝜔2
),
= 2π
𝑐0 1 , √ 𝑎 3 2π ln(2𝑎∕𝑤) − π 2
(8.59)
247
248
8 Optik von Metallen und Metamaterialien
w εe 1 2
ωP
— ωP
a
ω
a
E
a
(a)
(b)
(c)
Abb. 8.24 Ein Metamaterial mit negativer Permittivität. (a) Ein dünner Metallstab mit der Länge a und dem Radius w. (b) Wenn solche Metallstäbe an den Gitterpunkten eines kubischen Gitters der Gitterkonstante a abwechselnd in drei zueinander orthogonale Richtungen zeigend ange-
ordnet werden, bilden sie ein isotropes Metamaterial. (c) Die Frequenzabhängigkeit der effektiven elektrischen Permittivität 𝜀e entspricht der des vereinfachten Drudemodells. Dieses Metamaterial ist also einfach-negativ (EN), sofern 𝜇 positiv ist.
wobei die Plasmafrequenz 𝜔P über die Induktivität 𝐿 durch die Abmessungen 𝑎 und 𝑤 des Stabes bestimmt ist und wir angenommen haben, dass das dielektrische Medium die Vakuumpermittivität besitzt. Wenn 𝜇 positiv ist, ist dieses Metamaterial somit einfach-negativ. Wir haben in diesen Berechnungen angenommen, dass die Stäbe ideale Leiter sind; dies kann aber einfach korrigiert werden, indem wir der Impedanz i𝜔𝐿 des Stabes noch einen Widerstand 𝑅 hinzufügen.
ist. Diese Spannung erzeugt einen elektrischen Strom 𝑖 = 𝑉∕𝑍, wobei 𝑍 = i𝜔𝐿 + 1∕i𝜔𝐶 die Impedanz des 𝑅𝐶Kreises ist. Dieser elektrische Strom führt wiederum zu einem magnetischen Dipolmoment m = A𝑖. Wenn das Medium insgesamt N Spaltringe pro Volumeneinheit enthält, beträgt die Magnetisierungsdichte insgesamt 𝑀 = N∕m, sodass wir für die die effektive magnetische Permeabilität 𝜇e = 𝜇0 (𝐻 + 𝑀)∕𝐻 erhalten
Ein Metamaterial mit negativer Permeabilität: Metallische Spaltringe in einem dielektrischen Medium
Einen metallischer Spaltring [Abb. 8.25(a)] können wir als Induktion 𝐿 in Reihe mit einem Kondensator 𝐶 (dem offenen Abschnitt des Rings) beschreiben. Er bildet demnach einen resonanten 𝑅𝐿-Kreis mit einer Re√ sonanzfrequenz 𝜔0 = 1∕ 𝐿𝐶. Wenn der Ring einen Durchmesser von ≲ 100 nm und einer Lücke von ≲ 10 nm besitzt, liegt 𝜔0 im optischen Bereich des Spektrums. Die effektive magnetische Permeabilität 𝜇e eines Metamaterials aus einer regelmäßigen Anordnung derartiger Spaltringe, die wie in Abb. 8.25(b) an den Gitterpunkten eines periodischen Gitters abwechselnd in alle drei Raumrichtungen zeigend fixiert sind, kann durch Berechnung des magnetischen Dipolmoments m bestimmt werden, das durch ein Magnetfeld 𝐻 entlang einer Achse senkrecht zur Ringebene induziert wird [Abb. 8.25(a)]. Die in jedem Ring induzierte Spannung 𝑉 ist gleich der zeitlichen Änderung des magnetischen Flusses, also 𝑉 = −i𝜔𝜇0 A𝐻, wobei A die Fläche des Rings
𝜇e = 𝜇0
1 − 𝜔2 ∕𝜔12 1−
𝜔2 ∕𝜔02
𝜔0 1 , 𝜔1 = √ , 𝜔0 = √ . 2 𝐿𝐶 1 − 𝜇0 NA ∕𝐿 (8.60)
Die Induktivität des Rings beträgt 𝐿 ≈ 𝜇0 𝑏[ln(8𝑏∕𝑎) − 7∕4], wobei 𝑏 und 𝑎 die Radien des Rings bzw. des Drahtes sind (mit 𝑏 ≫ 𝑎). Wie Abb. 8.25(c) zeigt, besitzt 𝜇e eine Resonanz bei 𝜔0 und eine Nullstelle bei 𝜔1 und ist in dem Bereich dazwischen negativ. Wenn die elektrische Permittivität 𝜀 positiv ist, verhält sich diese Struktur somit wie ein einfach-negatives (EN) Metamaterial. Die in Gl. (8.60) enthaltene Frequenzabhängigkeit von 𝜇e entspricht genau der in Gl. (8.56) beschriebenen für die effektive Permittivität 𝜀e metallischer Nanokugeln. Metamaterialien mit negativem Brechungsindex
Die negative elektrische Permittivität des MetallstabMetamaterials [Abb. 8.24(c)] kann mit der negativen magnetischen Permeabilität des auf metallischen Spaltringen basierenden Metamaterials [Abb. 8.25(c)] kombiniert werden, um ein doppelt-negatives (DN-) Metamaterial mit einem negativen Brechungsindex zu er-
8.3 Optik von Metamaterialien
H
μe i
m
1 — ω0 2
(a)
ω0
(b)
ω1
ω
(c)
Abb. 8.25 Ein Metamaterial mit negativer Permeabilität. (a) Ein durch ein Magnetfeld angeregter metallischer Spaltring besitzt ein magnetisches Dipolmoment m. (b) Ein isotropes Metamaterial aus einer Anordnung solcher Spaltringe an den Eckpunkten eines kubischen Gitters. (c) Die Frequenz-
abhängigkeit der effektiven magnetischen Permeabilität 𝜇e besitzt eine Polstelle bei 𝜔0 und eine Nullstelle bei 𝜔1 und ist dazwischen negativ. Wenn 𝜀 positiv ist, ist diese Struktur somit ein einfach-negatives (EN) Metamaterial.
Dielektrikum E E
k Metall
H E
H
k H E H
(a)
(b)
Abb. 8.26 Ein Metamaterial mit negativem Brechungsindex. (a) Kombiniertes Element aus Stab und Doppelspaltring. (b) Metamaterial mit negativem Brechungsindex, das aus einer dreidimensionalen Anordnung der in (a) gezeigten Elemente besteht, die entlang zweier zueinander orthogonaler Richtungen orientiert sind. Für Wellen, die sich in der horizontalen Ebene ausbreiten, ist das Medium bei Frequenzen oberhalb der Resonanzen von Permittivität und Permeabilität doppelt-negativ und sein Brechungsindex folglich negativ, wie Abb. 8.22 schematisch dargestellt.
schaffen. Dazu ordnet man das in Abb. 8.26(a) gezeigte kombinierte Stab-Doppelspaltring-Element in drei Dimensionen periodisch an, wie Abb. 8.26(b) illustriert. Dieser Ansatz erfordert wie in der Abbildung angedeutet einen schrägen Einfall der Welle, damit OberflächenPlasmonresonanzen mit aus der Ebene heraus weisenden Magnetfeldern angeregt werden können. Dieses Design wurde experimentell erstmals im Mikrowellenbereich realisiert und anschließend für den Betrieb bei optischen Frequenzen verkleinert. In der Folge wurden alternative Designs für Materialien mit negativem Brechungsindex (NIM, engl. negativeindex materials) entwickelt, die einfacher herzustel-
Abb. 8.27 Vereinfachte Darstellung einer netzartigen Nanostruktur aus einem Metall und einem Dielektrikum, das aus einem gestapelten Netzwerk sich kreuzender plasmonischer Wellenleiter mit Abmessungen im Subwellenlängenbereich besteht. Die Struktur wirkt als Medium mit einem negativen Brechungsindex (NIM) für den sichtbaren Bereich des Spektrums.
len sind. Eine solche Konstruktion ist eine netzartige Schichtstruktur aus einem Metall und einem Dielektrikum, die vereinfacht in Abb. 8.27 gezeigt ist. Hier trifft die optische Welle senkrecht auf die Oberfläche der Netzstruktur, sodass die elektrischen und magnetischen Felder wie dargestellt entlang der metallischen Streifen gerichtet sind. Die parallel zum elektrischen Feld orientierten Streifen sind für die negative Permittivität verantwortlich. In den parallel zum Magnetfeld orientierten Streifen treten antisymmetrische resonante Moden zwischen Paaren von gekoppelten Streifen auf, die zu einer negativen Permeabilität oberhalb der Resonanzfrequenz führen. Derartige Netz-Nanostrukturen dienen als NIM für den sichtbaren Bereich des Spektrums.
249
250
8 Optik von Metallen und Metamaterialien
z
y
ε e1
x
ω0 ω3
1ω — 2 0
ω1
ω
ε e1
ε e3
Abb. 8.28 Ein hyperbolisches Metamaterial aus parallelen Metallstäben, die durch das vereinfachte Drudemodell beschrieben werden, in einem Wirtsmedium der Permittivität 𝜀 sowie die Frequenzabhängigkeit der Hauptkomponenten seines effektiven Tensors der elektrischen Permittivität. Die effektiven Permittivitäten 𝜀e1 = 𝜀e2 in der horizontalen Ebe-
ne haben die Resonanzfrequenz 𝜔0 und sind unterhalb der Resonanz positiv. Die effektive Permittivität 𝜀e3 in vertikaler Richtung ist im Frequenzbereich 𝜔 < 𝜔3 negativ. Der schattierte Bereich, in dem 𝜀e1 = 𝜀e2 und 𝜀e3 entgegengesetzte Vorzeichen haben, zeigt das Spektralband, in dem das Verbundmedium hyperbolisch ist.
Ein hyperbolisches Metamaterial: Parallele Metallstäbe in einem dielektrischen Medium
Gl. (8.46). Damit erhalten wir für die Hauptwerte der Permittivität
Wie bereits in Abschnitt 8.1.3 diskutiert wird ein anisotropes Medium als hyperbolisch bezeichnet, wenn die effektiven Hauptwerte seines Tensors der Permittivität (oder Permeabilität) gemischte Vorzeichen haben. Wir wollen nun zeigen, dass eine Anordnung von parallelen Metallstäben in einem dielektrischen Medium der Permittivität 𝜀, wie in Abb. 8.28 illustriert, hyperbolisches Verhalten zeigen kann, wenn die Stäbe aufgrund eines großen Längenverhältnisses eine extreme Anisotropie aufweisen. Zu diesem Zweck verwenden wir den Effective-Medium-Ansatz, um Ausdrücke für die Hauptwerte des Permittivitätstensors entlang der 𝑥-, 𝑦- und 𝑧-Richtung (bezeichnet mit 1, 2 bzw. 3) herzuleiten. Eine ähnliche Analyse wie diejenige für die dielektrische Kugel, deren Ergebnis in Gl. (5.132) angegeben ist, führt zu dem Ergebnis, dass das Verhältnis der inneren zu den äußeren Felder für einen dielektrischen Zylinder die Form 𝐸i ∕𝐸0 = 2𝜀∕(𝜀S + 𝜀) besitzt. Anwendung der Maxwell-Garnett-Mischungsregel ergibt dann für die effektiven Permittivitäten für Felder in der Ebene eines Querschnitts sowie in axialer Richtung (wo 𝐸i ∕𝐸0 = ist): 𝜀e1 = 𝜀e2 = 𝜀
2𝑓𝜀S + (1 − 𝑓)(𝜀S + 𝜀) , 𝜀S + 𝜀 + 𝑓(𝜀 − 𝜀S )
𝜀e3 = (1 − 𝑓)𝜀 + 𝑓𝜀S . (8.61)
Wir verwenden nun das vereinfachte Drudemodell Gl. (8.44) für 𝜀S , kombinieren die Ergebnisse für metallische Nanokugeln, Gln. (8.56) und (8.58), mit dem Resultat aus Gl. (8.59) für Metallstäbe und verwenden
𝜀e1 = 𝜀e2 = 𝜀L
1 − 𝜔2 ∕𝜔12 1 − 𝜔2 ∕𝜔02
,
𝜀e3 = 𝜀H (1 −
𝜔32 𝜔2
) (8.62)
mit 𝜔0 = √
𝜔P 1 + 𝜀r0
𝜀r0 =
1+𝑓 𝜀 , 1−𝑓 r
𝜀L =
1+𝑓 𝜀, 1−𝑓
,
𝜔1 = √
𝜀r1 =
𝜔P 1 + 𝜀r1
1−𝑓 𝜀 , 1+𝑓 r
,
𝜔3 = √
𝜀r3 =
𝜀H = 𝜀0 [𝑓 + (1 − 𝑓)𝜀r ]
𝜔P
, 1 + 𝜀r3 (8.63)
1−𝑓 𝜀 , 𝑓 r (8.64) (8.65)
und 𝜀r = 𝜀∕𝜀0 . Die ordentliche effektive Permittivität 𝜀e1 = 𝜀e2 besitzt eine Polstelle bei der Resonanzfrequenz 𝜔0 und eine Nullstelle bei 𝜔1 , während die außerordentliche effektive Permittivität 𝜀e3 sich von negativen Werten bei kleinen Frequenzen auf positiven Werte bei großen Frequenzen ändert und bei 𝜔3 durch null geht, ganz ähnlich wie bei einem reinen Metall. Wie Abb. 8.28 zeigt, existiert ein ausgedehntes Frequenzband, in dem 𝜀e1 = 𝜀e2 und 𝜀e3 entgegengesetzte Vorzeichen haben, sodass das anisotrope Medium hyperbolisch ist. Innerhalb dieses Bandes verhält sich das Material in einer Richtung wie ein Dielektrikum und in der dazu senkrechten Richtung wie ein Metall.
8.3 Optik von Metamaterialien
8.3.2 Metaoberflächen Metaoberflächen sind zweidimensionale Metamaterialien, z. B. ultradünne Anordnungen von metallischen Elementen im Subwellenlängenbereich, die periodisch, aperiodisch oder zufällig auf der Oberfläche eines dielektrischen Substrats abgeschieden wurden. Komplementäre Metaoberflächen sind Anordnungen von dielektrischen Strukturen mit Abmessungen im Subwellenlängenbereich, z. B. Löcher und deren Abstände, auf einer ultradünnen metallischen Oberfläche. Die Formen der einzelnen Strukturelemente und die Geometrie ihrer Anordnung auf der Oberfläche verleihen Metaoberflächen charakteristische optische Eigenschaften, die sich aus der Kopplung von Licht- und OPP-Wellen ergeben, die an der Grenzfläche Metall/Dielektrikum entstehen. Eine Metaoberfläche als Phasenmodulator
Wie in Abschnitt 2.4 erläutert wurde, erfährt eine Welle, die sich in 𝑧-Richtung ausbreitet, beim Durchgang durch eine dielektrische Platte mit der Dicke d und dem variablen Brechungsindex 𝑛(𝑥, 𝑦) in der 𝑥𝑦Ebene eine räumlich variierende Phasenverschiebung 𝜑(𝑥, 𝑦) = 𝑛(𝑥, 𝑦)𝑘0 d , die ihre Wellenfront verändert [siehe Gl. (2.45)]. Um eine Phasenverschiebung von 2π zu erreichen, muss die lokale Dicke gleich der Wellenlänge des Lichts in dem Medium sein. Eine ebene Metaoberfläche hat hier den Vorteil, dass sie eine Phasenverschiebung ähnlicher Größenordnung bei einer weit geringeren Dicke einführen kann. Die metallischen Strukturelemente der Metaoberfläche funktionieren ähnlich wie optische Antennen, die die optische Wellenfront verändern. Eine resonante Antenne wirkt als Streukörper, der eine frequenzabhängige Phasenverschiebung einführt,
x
die für Frequenzen unterhalb bzw. oberhalb der Resonanz zwischen −π∕2 und +π∕2 liegen kann. Eine räumlich variierende Phasenverschiebung 𝜑(𝑥, 𝑦) kann durch Verwendung einer Metaoberfläche mit Strukturelementen von räumlich abgestufter Größe und Geometrie und entsprechend räumlich variierender Resonanzfrequenz erreicht werden. Eine eingehende Welle mit fester Frequenz erhält dann eine räumlich variierende Phasenverschiebung; die Metaoberfläche wirkt somit als Phasenmodulator. Ein Beispiel hierfür zeigt Abb. 8.29(a). Da die Metaoberfläche extrem dünn ist, kann sie mathematisch als optische Komponente beschrieben werden, die eine räumlich variierende Phasendiskontinuität einführt (d. h. eine Phasenverschiebung, die über einen Abstand d → 0 eingeführt wird). Die durch eine solche Metaoberfläche eingeführte Phasenmodulation kann eine ankommende optische Welle auf eine der Arten verändern, die wir in Abschnitt 2.4 kennengelernt hatten. Eine nützliche Eigenschaft dieser Methode ist, dass die Welle beim Durchtritt durch die infinitesimal dünne Metaoberfläche nur eine minimale räumliche Streuung (Beugung) erfährt. Als Beispiel wollen wir zum Beispiel eine Phase 𝜑(𝑥, 𝑦) betrachten, die sich entlang der Metaoberfläche linear mit einer Rate 𝑞 ändert, sodass 𝜑 = 𝑞𝑥 gilt. Die komplexe Amplitude der ankommenden Welle wird dann mit dem Faktor exp(−i𝑞𝑥) moduliert, der eine periodische Funktion der Ortsfrequenz 𝜈𝑥 = 𝑞∕2π ist, wie wir in Abschnitt 4.1.1 gesehen hatten. Eine ankommende ebene Welle mit dem Wellenvektor k1 erzeugt dann eine gebrochene und eine reflektierte ebene Welle mit den Wellenvektoren k2 bzw. k3 .
x n1
n2 n2k0 θ2
θ3 k3 k1 y (a)
(b)
θ1
k1 q
k3
k2
k2 n1k0
y
Abb. 8.29 (a) Eine Metaoberfläche aus einer Anordnung metallischer Elemente, deren Formen und Resonanzfrequenzen in x-Richtung variieren. Die Formen der Elemente sind so konstruiert, dass die von ihnen eingeführte Phasenverschiebung für eine der Polarisationskomponenten eine lineare Funktion 𝜑 = qx ist. (b) Negative Reflexion und negative
(c)
Brechung an der Grenzfläche zwischen zwei Medien mit den Brechungsindizes n1 und n2 aufgrund der Anwesenheit der in (a) dargestellten Metaoberfläche zwischen den beiden Medien. (c) Die Phasenbedingung für die einfallende und gebrochene bzw. die einfallende und reflektierte Welle an der Grenzen der Metaoberfläche.
251
252
8 Optik von Metallen und Metamaterialien
Damit die Phasenbedingung auf beiden Seiten der Oberfläche erfüllt ist, muss die zur Oberfläche parallele Komponente des Vektors k2 wie in Abb. 8.29(c) dargestellt mit der entsprechenden Komponente von k1 + q übereinstimmen, wobei q ein Vektor in 𝑥-Richtung mit dem Betrag 𝑞 ist. Ebenso muss für die reflektierte Welle die Komponente des Vektors k3 entlang der Oberfläche mit der von k1 + q übereinstimmen. Wenn sich die Metaoberfläche folglich an der Grenzfläche zwischen zwei gewöhnlichen dielektrischen Medien mit den Brechungsindizes 𝑛1 und 𝑛2 befindet, wird das snelliussche Gesetz für Brechung und Reflexion zu 𝑛2 𝑘0 sin 𝜃2 = 𝑛1 𝑘0 sin 𝜃1 + 𝑞 ,
(8.66)
𝑛1 𝑘0 sin 𝜃3 = 𝑛1 𝑘0 sin 𝜃1 + 𝑞 ,
(8.67)
wobei 𝜃1 , 𝜃2 und 𝜃3 der Einfallswinkel, der Brechungswinkel und der Reflexionswinkel sind. Bei geeigneter Wahl des Betrags und des Vorzeichens von 𝑞 kann das Vorhandensein der Metaoberfläche zu negativer Reflexion und negativer Brechung an der Grenzfläche führen, wie Abb. 8.29(b) illustriert. Für 𝑞 = 0 reduzieren sich die Gln. (8.66) und (8.67) wie zu erwarten auf das snelliussche Gesetz. Für eine Phasendiskontinuität 𝜑(𝑥), die sich nur langsam mit 𝑥 ändert, kann die Ableitung 𝑞 = d𝜑∕ d𝑥 als die lokale Ortsfrequenz am Ort 𝑥 betrachtet werden. Diese Größe bestimmt die lokale Verkippung, die eine ankommende Wellenfront an der betreffenden Stelle erfährt, und damit die Reflexions- und Brechungswinkel als Funktion von 𝑥. Dieser Gedanke kann offensichtlich auch auf Metaoberflächen verallgemeinert werden, die eine zweidimensionale Phasendiskontinuität 𝜑(𝑥, 𝑦) einführen. In diesem Fall beschreibt der Vektor q = ∇𝜑 Betrag und Richtung der lokalen Ortsfrequenz der Phasenmodulation. Die Metaoberfläche kann daher so gestaltet werden, dass sie sowohl in der 𝑥𝑧als auch in der 𝑦𝑧-Ebene definierte lokale Verkippungen der Wellenfront einführt, ähnlich wie ein Antennenarray oder eine optischen Phasenplatte. Alternativ kann die Metaoberfläche auch so konstruiert werden, dass sie eine positionsabhängige Amplitudenmodulation einführt, die durch die Gestalt der lokalen Strukturelemente bestimmt ist. Die Kombination aus Phasenund Amplitudenmodulation kann als Hologramm mit komplexer Transmission dienen, das die Wellenfront des von einem Objekt erzeugten Lichts simuliert. Transmission durch Subwellenlängenlöcher in einer Metallschicht
Eine Metaoberfläche, die aus einer periodischen Anordnung von Löchern und Abständen im Subwellenlängenbereich in einer ebenen Metallschicht besteht, kann
bei bestimmten Wellenlängen und Einfallswinkeln eine außerordentlich hohe Lichtdurchlässigkeit besitzen. Es zeigt sich, dass die Leistungstransmission 𝒯(𝜆, 𝜃) als Funktion der Wellenlänge 𝜆 und des Einfallswinkels 𝜃 scharfe Peaks besitzt, deren Maxima die auf der Basis der normalen Beugungstheorie vorhergesagten Werte bei Weitem übersteigen. Wenn 𝒯L die Gesamtfläche der Löcher pro Flächeneinheit der Schicht bezeichnet, können die Spitzenwerte des Transmissionsgrads 𝒯(𝜆, 𝜃) für senkrecht auf die Schicht auftreffende ebene Wellen 𝒯L um Größenordnungen übertreffen. Dieses Phänomen ist auf die Anregung von OPPWellen durch die Löcher und die damit einhergehende Emission von Licht durch die oszillierenden Ladungen in der Metallschicht zurückzuführen. Eine solche Anordnung von Löchern mit Abmessungen im Subwellenlängenbereich in einer Metallschicht sollte daher streng genommen als aktiv strahlendes Bauelement betrachtet werden und nicht als passive Öffnung, die Licht einfach durchlässt. Die maximale Übertragung erfolgt bei Frequenzen, für die die einfallende optische Welle und die angeregte OPP-Welle phasengleich sind. Für eine periodische Anordnung von Löchern in Form eines quadratischen Gitters mit der Periode 𝑎0 gilt die Phasenbedingung (8.68) 𝛽 = 𝑘⟂ ± 𝑚𝑥 𝑔𝑥 ± 𝑚𝑦 𝑔𝑦 , √ wobei 𝛽 = (𝜔∕𝑐0 ) 𝜀G ∕𝜀0 die Ausbreitungskonstante der OPP-Welle ist [siehe Gl. (8.47)]. 𝑘⟂ = (2π∕𝜆) sin 𝜃 ist die Komponente des Wellenvektors des einfallenden Lichts in der Ebene der Löcher, 𝑔𝑥 = 𝑔𝑦 = 2π∕𝑎0 sind die fundamentalen Ortsfrequenzen der periodischen Anordnung und 𝑚𝑥 und 𝑚𝑦 sind ganze Zahlen, die zugehörige räumliche Harmonische darstellen (die Streuordnung). Die Transmission 𝒯(𝜆, 𝜃) als Funktion des Einfallswinkels 𝜃 besitzt photonische Bandlücken 8), ähnlich wie photonische Kristalle, die dreidimensionale periodische dielektrische Strukturen mit Abmessungen im Subwellenlängenbereich darstellen (siehe Abschnitt 7.3). Eine vergleichbar außergewöhnliche optische Transmission ist für Löcher in einem idealen Leiter anstelle eines realen Metalls zu erwarten. Das Medium ist in diesem Fall durch eine effektive dielektrische Funktion mit einer Plasmonform gekennzeichnet, deren Plasmafrequenz durch die Geometrie der Löcher vorgegeben wird. 9) 8) T. W. Ebbesen, H. J. Lezec, H. F. Ghaemi, T. Thio, P. A. Wolff, ‚Extraordinary Optical Transmission Through Sub-Wavelength Hole Arrays‘, Nature 391, 669–667, 1998. 9) F. J. Garcia-Vidal, L. Martín-Moreno, J. B. Pendry, ‚Surfaces with Holes in Them: New Plasmonic Metamaterials‘, Journal of Optics A: Pure and Applied Optics 7, S97–S101, 2005.
8.4 Transformationsoptik
8.4 Transformationsoptik In anderen Kapiteln dieses Buches betrachten wir die Gradientenindexoptik aus der Perspektive der Analyse und versuchen zu bestimmen, wie sich Licht in einem Medium mit bestimmten dielektrischen und magnetischen Eigenschaften ausbreitet. Einige Beispiele hierfür aus dem Kontext der Strahlenoptik, der Wellenoptik und der elektromagnetischen Optik: • In Gradientenindex- (GRIN-) Materialien folgen optische Strahlen gekrümmten Bahnen, die durch das Brechungsindexprofil 𝑛(r) bestimmt sind (Abschnitt 1.3). • Die Trajektorien von skalaren Wellen in GRIN-Materialien können mit der Eikonalgleichung beschrieben werden (siehe Abschnitte 2.3 und 10.2.4). • Für isotrope Materialien mit variabler elektrischer Permittivität 𝜀(r) und magnetischer Permeabilität 𝜇(r) gehen die Maxwellgleichungen die verallgemeinerten Helmholtzgleichungen (5.31) und (5.32) über; sie wurden in Kapitel 7 für Schichtmedien und periodische Strukturen wie photonische Kristalle gelöst. • Die Optik anisotroper Medien mit variablen optischen Eigenschaften wird durch Maxwellgleichungen mit ortsabhängigen Tensoren 𝛆(r) und 𝛍(r) beschrieben, die nur mithilfe der Vektoranalysis zu lösen ist. • Die Gradientenindexoptik ebnet den Weg zur Herstellung einer Vielzahl von optischen Komponenten wie z. B. GRIN-Linsen (Übung 1-8) oder GRIN-Wellenleitern (Abschnitt 10.1.2). Im Gegensatz dazu betrachten wir die Gradientenindexoptik in diesem Abschnitt aus einer Synthese- oder Entwurfsperspektive, d. h. wir fragen uns, welche dielektrischen und magnetischen Eigenschaften eines Mediums erforderlich sind, um ein gewünschtes Muster der Lichtausbreitung zu realisieren. Die Synthese ist dabei in zweierlei Hinsicht schwieriger als die Analyse: (1) Die erforderlichen mathematischen Werkzeuge sind komplexer und (2) die tatsächliche Herstellung des gewünschten GRIN-Mediums muss auf Metamaterialien aufbauen, die aus vorhandenen Komponenten bestehen und die in einer definierten räumlichen Anordnung und mit der gegenwärtigen Technologie hergestellt werden können.
8.4.1 Transformationsoptik Die Transformationsoptik ist ein mathematisches Werkzeug, mit dem sich optische Materialien entwickeln lassen, die Licht entlang gewünschter Bahnen leiten. Das zugrunde liegende Konzept basiert auf einer
geometrischen Transformation, die einfache Lichtbahnen in die gewünschten konvertiert. Damit die maxwellschen Gleichungen weiterhin gelten, müssen die zu dem transformierten System gehörigen optischen Parameter ebenfalls modifiziert werden, woraus sich die Natur des erforderlichen optischen Materials ergibt. Ein einfaches Beispiel für eine solche Äquivalenz ist die Tatsache, dass eine lokale Kompression des Koordinatensystems um einen bestimmten Skalierungsfaktor gleichbedeutend mit einer lokalen Erhöhung des Brechungsindex um denselben Faktor ist, weil hierdurch die optische Weglänge (Produkt aus Länge und Brechungsindex) unverändert bleibt. Als Hilfestellung verwenden wir ein dreistufiges Verfahren: • Wir beginnen Sie mit einem Pilotsystem, für das wir die optischen Trajektorien kennen, z. B. einem homogenen und isotropen Material. • Dann suchen wir eine Koordinatentransformation, die diese bekannten Trajektorien in die gewünschten Trajektorien konvertiert. • Zuletzt bestimmen wir die transformierten physikalischen Parameter des äquivalenten Materials. Dieses neue Material wird die gewünschten optischen Trajektorien im ursprünglichen Koordinatensystem realisieren. Da geometrische Transformationen im Allgemeinen Richtungsänderungen sowie die Einführung von richtungsabhängigen Skalierungen bedeuten, sind die transformierten Parameter in der Regel sowohl anisotrop als auch räumlich variabel. Das Transformationsprinzip
Wir bezeichnen die Elemente der Permittivitäts- und Permeabilitätstensoren des Ausgangsmaterials im ursprünglichen Koordinatensystem (𝑥1 , 𝑥2 , 𝑥3 ) mit {𝜀𝑖𝑗 } und {𝜇𝑖𝑗 }. Die Elemente der Permittivitäts- und Permeabilitätstensoren des äquivalenten Materials (durch ein hochgestelltes „e“ gekennzeichnet) im transformierten Koordinatensystem (𝑢1 , 𝑢2 , 𝑢3 ) hängen dann über die Matrixgleichungen 10) 𝛆e = | det A|−1 A 𝛆A , T
𝛍 e = | det A|−1 A 𝛍 A T
(8.69)
mit den ursprünglichen Elementen zusammen. Dabei ist A die 3 × 3-Jacobi-Transformationsmatrix, deren Elemente die partiellen Ableitungen A𝑖𝑗 =
𝜕𝑢𝑖 , 𝜕𝑥𝑗
𝑖, 𝑗 = 1, 2, 3
(8.70)
10) Siehe J. B. Pendry, Y Luo, R. Zhao, ‚Transforming the Optical Landscape‘, Science 348, 524–521, 2015.
253
254
8 Optik von Metallen und Metamaterialien T
sind. A ist die Transponierte von A und 𝛆 und 𝛍 sind 3 × 3-Matrizen mit den Elementen {𝜀𝑖𝑗 } bzw. {𝜇𝑖𝑗 }. Da A im Allgemeinen von (𝑥1 , 𝑥2 , 𝑥3 ) abhängt, ist das äquivalente Material in der Regel inhomogen, auch wenn das ursprüngliche Material homogen war. In dem Spezialfall eines homogenen und isotropen Ausgangsmaterials (z. B. Vakuum) sind 𝛆 und 𝛍 diagonal mit gleichen Diagonalelementen 𝜀0 bzw. 𝜇0 ; in diesem Fall folgt 𝜀0−1 𝛆e = 𝜇0−1 𝛍 e = | det A|−1 A A . T
(8.71)
Die Tensoren 𝛆e und 𝛍 e sind in diesem Fall bis auf einen Skalierungsfaktor identisch. Unter diesen Bedingungen bleibt die Impedanz, die vom Verhältnis dieser beiden Größen abhängt, für alle Polarisationen des einfallenden Lichts unverändert, was wiederum impliziert, dass das äquivalente Medium an keiner Grenzfläche zum Vakuum eine Reflexion einführt. Eine Reihe von Beispielen soll dieses Transformationsprinzip veranschaulichen. Beispiel 8-5: Brechung ohne Reflexion
In diesem Beispiel wollen wir ein optisches Material entwerfen, das optische Strahlen an einer ebenen Oberfläche ohne Reflexion bricht, wie in Abb. 8.30(a) illustriert wird. Wir beginnen zunächst mit einem homogenen Medium wie etwa dem Vakuum mit Strahlen, die wie in Abb. 8.30(b) gezeigt in einem Winkel 𝜃1 auf parallelen geraden Bahnen verlaufen. Nun wenden wir eine geometrische Transformation an, die das Koordinatensystem im Bereich 𝑥3 > 0 um einen Skalierungsfaktor 𝑠 entlang der 𝑥3 -Richtung streckt. Die gewünschte Brechung erreichen wir, indem wir 𝑠 als Verhältnis der anfänglichen und der gewünschten Steigungen wählen, 𝑠 = tan 𝜃1 ∕ tan 𝜃2 [Abb. 8.30(c)]. Diese Transformation bewirken wir durch die Beziehungen 𝑢1 = 𝑥1 ,
𝑢2 = 𝑥2 ,
𝑢3 = 𝑠−1 𝑥3 .
(8.72)
Eine derartige Skalierung eines kartesischen Koordinatensystems, bei der sich die Richtungen der Achsen nicht ändern, wandelt einen Würfel in einen Quader um. Gemäß Gl. (8.70) ist die Jacobimatrix A diagonal mit den Diagonalelementen (1, 1, 𝑠−1 ) und der Determinante det A = 𝑠−1 ; damit liefert Gl. (8.71) 𝜀0−1 𝛆e
=
𝜇0−1 𝛍 e
⎡𝑠 ⎢ = ⎢0 ⎢ 0 ⎣
0 𝑠 0
0 ⎤ ⎥ 0 ⎥. ⎥ 𝑠−1 ⎦
(8.73)
Da die Matrizen 𝛆e und 𝛍 e diagonal sind, zeigen die Hauptachsen des anisotropen Materials entlang der
Achsen des Koordinatensystems. Die Hauptwerte sind 𝜀1 = 𝑠𝜀0 , 𝜀2 = 𝑠𝜀0 und 𝜀3 = 𝑠−1 𝜀0 sowie 𝜇1 = 𝑠𝜇0 , 𝜇2 = 𝑠𝜇0 und 𝜇3 = 𝑠−1 𝜇0 . Wir können die Parameter des äquivalenten Materials auch bestimmen, indem wir die Phasenverschiebung, die beim Durchgang einer ebenen Welle durch den gedehnten Abschnitt im Vakuum eintritt, mit der Phasenverschiebung vergleichen, die beim Durchgang der Welle durch einen entsprechenden ungedehnten, mit dem neuen Material gefüllten Abschnitt eintritt. Um die Parameter zu erhalten, betrachten wir nacheinander drei Wellen, deren elektrische Felder jeweils entlang einer der Koordinaten ausgerichtet sind: • Welle 1 ist eine ebene Welle in 𝑥3 -Richtung, deren elektrisches und magnetisches Feld in 𝑥1 - bzw. 𝑥2 -Richtung zeigt. Die entsprechende Permittivität und Permeabilität sind somit 𝜀1 und 𝜇2 , sodass 𝑘 = √ √ 𝜔 𝜀1 𝜇2 = 𝜔 𝑒𝜀0 𝑐𝜇0 = 𝑠𝑘0 ist, entsprechend einem Brechungsindex 𝑛1 = 𝑠𝑘0 . Über eine Distanz d ergibt sich somit wie erwartet eine kumulierte Phasenverschiebung von 𝑠𝑘0 d und die Impedanz ist 𝜂1 = √ 𝜇2 ∕𝜀1 = 𝜂0 . • Welle 2 breitet sich ebenfalls in 𝑥3 -Richtung aus, aber das elektrische und das magnetische Feld zeigen jetzt in 𝑥2 - bzw. −𝑥1 -Richtung. Diese Welle breitet sich ebenfalls mit einem Brechungsindex 𝑛2 = 𝑠 aus und hat eine Impedanz von 𝜂2 = 𝜂0 . • Welle 3 breitet sich in 𝑥2 -Richtung aus; ihr elektrisches und magnetisches Feld zeigt in 𝑥3 - bzw. ist 𝑥1 -Richtung. Die Permittivität und Permeabilität √ √ jetzt 𝜀3 bzw. 𝜇1 , sodass 𝑘 = 𝜔 𝜀3 𝜇1 = 𝜔 𝑠−1 𝜀0 𝑠𝜇0 = 𝑘0 ist, was einem Brechungsindex 𝑛3 = 1 entspricht. Die Phasenverschiebung ist erwartungsgemäß 𝑘0 d , da in 𝑥2 -Richtung keine √ Dehnung erfolgt ist. Die Impedanz beträgt 𝜂3 = 𝜇1 ∕𝜀3 = 𝑠𝜂0 . Aus diesen Ergebnissen können wir schließen, dass unser gewünschtes Material ein stückweise homogenes Medium mit Vakuum in der linken Halbebene und einem anisotropen einachsigen Material in der rechten Halbebene sein muss [Abb. 8.30(d)]. Das anisotrope Material ist doppelbrechend mit 𝑛1 = 𝑠, 𝑛2 = 𝑠 und 𝑛3 = 1, bewirkt jedoch keine Reflexion an der Grenzfläche zum Vakuum, da seine Impedanzen gleich denen des Vakuums sind: 𝜂1 = 𝜂2 = 𝜂0 . Die Brechung an der Grenzfläche des synthetischen anisotropen Mediums unterscheidet sich in zwei Punkten von der normalen Brechung an der Grenzfläche eines homogenen und isotropen Mediums: (1) Die Brechung geht nicht mit Reflexion einher und (2) die Beziehung zwischen dem Brechungs- und dem Einfallswinkel, 𝑠 tan 𝜃2 = tan 𝜃1 , unterscheidet sich vom snelliusschen Gesetz.
8.4 Transformationsoptik
x2
x2
θ2
θ1
(a)
x2
x2
x1 θ1
x3
0
x3
0
(b)
(c)
0
Abb. 8.30 Die geometrische Transformation, um Brechung ohne Reflexion zu erreichen. (a) Die gewünschten optischen Trajektorien. (b) Ausbreitung im Vakuum mit geradlinigen optischen Trajektorien. (c) Eine Dehnung des Koordinaten-
Beispiel 8-6: Brechung bei senkrechtem Einfall
Als nächstes wollen wir ein optisches Material konstruieren, das bei senkrechtem Lichteinfall eine Brechung um einen Winkel 𝜃 bewirkt, wie in Abb. 8.31(a) dargestellt. Diese Art der Brechung kann an einer Grenzfläche zwischen zwei isotropen dielektrischen Materialien nicht auftreten, wohl aber an der Grenzfläche zwischen einem isotropen und einem anisotropen Material, wie in Abschnitt 6.3.5 beschrieben. Wir beginnen mit einem Vakuum als Pilotsystem und mit Strahlen, die entlang horizontaler, paralleler Geraden verlaufen [Abb. 8.31(b)], und verwenden für 𝑥3 > 0 die Koordinatentransformation 𝑢1 = 𝑥1 ,
𝑢2 = 𝑥2 + 𝑠𝑥3 ,
𝑢3 = 𝑥3
(8.74)
mit 𝑠 = tan 𝜃. Diese Transformation erzeugt die gewünschte Ablenkung der Trajektorien durch eine Scherung in 𝑥2 -Richtung [Abb. 8.30(c)]. Die Permittivitäts- und Permeabilitätstensoren des äquivalenten anisotropen Materials, die dieser Koordinatentransformation entsprechen, sind gemäß Gl. (8.70) und (8.71)
𝜀0−1 𝛆e
=
𝜇0−1 𝛍 e
⎡1 ⎢ = ⎢0 ⎢ 0 ⎣
0 1 𝑠
0 ⎤ ⎥ 𝑠 ⎥. ⎥ 1 + 𝑠2 ⎦
(8.75)
Dies stellt ein homogenes, aber anisotropes Medium dar. Im Bereich 𝑥3 > 0 bricht es einfallende Lichtstrahlen wie gewünscht auch bei senkrechtem Einfall [Abb. 8.31(d)].
u3
(d)
x3
0
systems für x3 > 0 um den Faktor s ändert die Steigung der Strahlen, die nun den gewünschten Trajektorien folgen. (d) Ein äquivalentes anisotropes, homogenes Material, das dieselbe Veränderung der Strahlneigung bewirkt.
Wir beginnen mit den in Abb. 8.32(b) gezeigten geraden Trajektorien in einem kartesischen Koordinatensystem und wenden für 𝑥3 > 0 die Koordinatentransformation 𝑢1 = 𝑥1 ,
𝑢2 = (𝑓 − 𝑥3 ) sin(𝑥2 ∕𝑓) ,
𝑢3 = 𝑓 − (𝑓 − 𝑥3 ) cos(𝑥2 ∕𝑓)
(8.76)
an. Das Ergebnis ist ein Zylinderkoordinatensystem, das bei (𝑢2 = 0, 𝑢3 = 𝑓) zentriert ist, wie Abb. 8.32(c) zeigt. Diese Transformation konvertiert eine Linie 𝑥2 = 𝑎 in der Ebene 𝑥1 = 0 im ursprünglichen Koordinatensystem in eine Linie 𝑢2 = (𝑓 − 𝑢3 ) tan(𝑎∕𝑓) im neuen Koordinatensystem. Ebenso wandelt sie eine Linie 𝑥3 = 𝑏 in der Ebene 𝑥1 = 0 in einen Kreis 𝑢22 + (𝑓 − 𝑢3 )2 = (𝑓 − 𝑏)2 mit dem Radius (𝑓 − 𝑏) um den Punkt (𝑢2 , 𝑢3 ) = (0, 𝑓) um. Gemäß den Gln. (8.69) und (8.70) liefert die Transformation die Diagonalmatrix ⎡𝑠 ⎢ 𝜀0−1 𝛆e = 𝜇0−1 𝛍 e = ⎢0 ⎢ 0 ⎣
0 𝑠
−1
0
0⎤ ⎥ 0⎥ , ⎥ 𝑠 ⎦
𝑠=
𝑓 . (8.77) |𝑥3 − 𝑓|
Die Hauptachsen der Permittivitäts- und Permeabilitätstensoren des äquivalenten Mediums liegen folglich parallel zu den (𝑥1 , 𝑥2 , 𝑥3 )-Achsen und die Hauptwerte hängen von der Position 𝑥3 ab, d. h. die Anisotropie des äquivalenten Materials entlang der 𝑥3-Richtung nimmt in der Nähe der Brennlinie zu [Abb. 8.32(d)].
8.4.2 Tarnumhänge Beispiel 8-7: Zylindrische Fokussierung
Nun wollen wir parallele geradlinige Trajektorien an einer ebenen Grenzfläche so brechen, dass sie sich alle an einem gemeinsamen Brennpunkt in einem Abstand 𝑓 von der Grenzfläche treffen, wie in Abb. 8.32(a) gezeigt.
Ein Tarnumhang ist eine Einrichtung, die Licht so um ein Objekt herumführt, dass das Objekt transparent und daher unsichtbar erscheint. Beispielsweise umgehen die in Abb. 8.33(a) gezeigten Trajektorien eine Kugel mit dem Radius 𝑎 und kommen hinter ihr an,, als ob sie geraden Linien gefolgt und durch sie hindurchgegangen wären.
255
256
8 Optik von Metallen und Metamaterialien
x2
x2
u2
x2
θ
θ
x3
0
(a)
θ
x3
0
(b)
Abb. 8.31 Eine geometrische Transformation, die Brechung bei senkrechtem Einfall bewirkt. (a) Die gewünschten optischen Trajektorien. (b) Vakuum mit horizontalen, geradlinigen optischen Trajektorien. (c) Scheren des Koordinax2
x2
(c)
x3
(a)
x3
(b)
gen optischen Trajektorien. (c) Konversion in ein Zylinderkoordinatensystem mit x3 = f für x3 > 0 ergibt die gewünschten Trajektorien. (d) Ein äquivalentes anisotropes Material mit identischen Trajektorien.
u2
x2
x3
(d)
Abb. 8.32 Eine geometrische Transformation, die eine zylindrische Fokussierung bewirkt. (a) Die gewünschten optischen Trajektorien. (b) Ausbreitung im Vakuum mit einem kartesischem Koordinatensystem und parallelen geradlini-
b
x2
u3
(b)
a
tensystems entlang der Richtung x2 für x3 > 0 erzeugt die gewünschte Brechung. (d) Ein äquivalentes anisotropes Material mit identischer Brechung.
x3
x2
x3
0
(d)
u2
x3
(a)
u3
0
(c)
x2
u3
(c)
x3
(d)
Abb. 8.33 Eine geometrische Transformation, die eine Kugel unsichtbar machen kann. (a) Die gewünschten optischen Trajektorien. (b) Ausbreitung im Vakuum mit kartesischem Koordinatensystem und parallelen, geradlinigen optischen Trajektorien. (c) Eine Koordinatentransformation, die Punkte
innerhalb der Kugel auf Punkten in einer Kugelschale außerhalb der Kugel abbildet und so die gewünschten Trajektorien erzeugt. (d) Ein anisotropes äquivalentes Material, das dieselben Trajektorien hervorbringt.
Wir folgen unserem üblichen Schema für die Transformationsoptik und beginnen wir mit den in Abb. 8.33(b) gezeigten geraden Trajektorien in einem kartesischen Koordinatensystem (𝑥1 , 𝑥2 , 𝑥3 ). Dieses transformieren wir anschließend in ein Koordinatensystem (𝑢1 , 𝑢2 , 𝑢3 ), sodass √ Punkte innerhalb einer Kugel mit dem Radius
erreicht werden. Wenn sich 𝑟 von 0 auf 𝑏 verändert, ändert sich 𝑢 von 𝑎 auf 𝑏, sodass die Punkte der Kugel 0 < 𝑟 < 𝑏 im ursprünglichen Koordinatensystem auf Punkte in einer Kugelschale mit 𝑎 < 𝑢 < 𝑏 in dem neuen Koordinatensystem abgebildet werden. Diese Abbildung können wir auch als 𝑢 = 𝑠(𝑟)𝑟 schreiben, wobei
𝑥12 + 𝑥22 + 𝑥32 auf die Punkte einer Kugel mit einem √ Radius 𝑢 = 𝑢12 + 𝑢22 + 𝑢32 > 𝑎 abgebildet werden, wodurch die Kugel mit dem Radius 𝑎 wie gewünscht vermieden wird. Dies kann für alle Punkte 𝑟 < 𝑏 mit 𝑏 > 𝑎 durch die lineare Beziehung 𝑟=
𝑢=𝑎+
𝑏−𝑎 𝑟 𝑏
(8.78)
𝑠(𝑟) =
𝑎 𝑏−𝑎 + 𝑟 𝑏
(8.79)
ein ortsabhängiger Skalierungsfaktor ist. Wenn wir diese Skalierung isotrop anwenden, erzeugt sie die Koordinatentransformation 𝑢1 = 𝑠(𝑟)𝑥1 ,
𝑢2 = 𝑠(𝑟)𝑥2 ,
𝑢3 = 𝑠(𝑟)𝑥3 .
(8.80)
Aufgaben
Wie wir durch einfaches Einsetzen zeigen können, bildet sie Punkte auf der Geraden 𝑥2 = 𝑓 in der Ebene 𝑥1 = 0 auf die gekrümmte Trajektorie 2
𝑢22 + 𝑢32 = 𝑎2 [
𝑢2 ] 𝑢2 − (𝑏 − 𝑎)𝑓∕𝑏
(8.81)
in der 𝑢2 𝑢3 -Ebene ab. Die in Abb. 8.33 gezeigten gekrümmten Trajektorien wurden für vier Werte von 𝑓 aus Gl. (8.81) berechnet. Das in Abb. 8.33(c) innerhalb der Schale 𝑎 < 𝑢 < 𝑏 gezeigte Gitter wurde mithilfe von Gl. (8.81) und einer ähnlichen Gleichung, die man durch Abbildung der Geraden 𝑥3 = 𝑓 in der Ebene 𝑥1 = 0 auf die 𝑢2 𝑢3 -Ebene bestimmen kann, berechnet. Die Parameter des äquivalenten Materials, das in die in Abb. 8.33(d) dargestellte Kugelschale 𝑎 < 𝑟 < 𝑏 eingebracht werden muss, können durch Anwendung der Gln. (8.69), (8.70) und (8.80) bestimmt werden. Das Ergebnis ist ⎡𝑣2 − 𝑢12 −𝑢1 𝑢2 −𝑢1 𝑢3 ⎤ ⎢ ⎥ 𝑏 1 𝜀0−1 𝛆e = 𝜇0−1 𝛍 e = ⎢ −𝑢2 𝑢1 𝑣2 − 𝑢22 −𝑢2 𝑢3 ⎥ , 𝑏 − 𝑎 𝑣2 ⎢ ⎥ −𝑢3 𝑢1 −𝑢3 𝑢2 𝑣2 − 𝑢32 ⎣ ⎦ 𝑢4 2 𝑣 = . (8.82) 2𝑎𝑢 − 𝑎2 Offensichtlich sind die dielektrischen und magnetischen Eigenschaften des Materials in der Kugelschale inhomogen und anisotrop. Beispielsweise ist an Punkten (𝑢, 0, 0) auf der 𝑥1 -Achse ⎡1 − 𝑢2 ∕𝑣2 0 0⎤ ⎥ 𝑏 ⎢ = = 0 1 0⎥ . (8.83) ⎢ 𝑏−𝑎 ⎢ ⎥ 0 0 1 ⎦ ⎣ An diesen Punkten liegen die Hauptachsen parallel zu den Achsen 𝑥1 , 𝑥2 , 𝑥3 ) des kartesischen Koordinatensystems. Der Hauptwert 𝜀1 verändert sich von 0 aufs 𝜀0 (𝑏 − 𝑎)∕𝑏, wenn 𝑢 sich von 𝑎 auf 𝑏 ändert, während die Hauptwerte 𝜀2 und 𝜀3 konstant bei 𝜀0 𝑏∕(𝑏 − 𝑎) bleiben. Ähnliche Ergebnisse gelten für 𝜇. Bei optischen Wellenlängen erfordert die Herstellung von Tarnumhängen mithilfe von Metamaterialien den Einsatz ausgefeilter Methoden der Nanotechnologie wie Elektronenstrahl- oder fokussierte Ionenstrahllithographie. Die Bestandteile der dielektrischen und magnetischen Strukturelemente mit ihren unterschiedlichen Formen und Abmessungen müssen detailliert geplant und genau eingehalten werden. Da solche Elemente hochgradig resonant sind, hängen die elektromagnetischen Eigenschaften des Metamaterials stark von der Wellenlänge ab, sodass derartige Hilfsmittel in der Regel nur in einem sehr engen spektralen Bereich funktionieren. 𝜀0−1 𝛆e
𝜇0−1 𝛍 e
Aufgaben Aufgabe 8-1: OPP-Welle an der Grenzfläche zwischen einem DP- und einem verlustbehafteten EN-Medium
Untersuchen Sie Sie eine Grenzfläche DP/EN mit 𝜇1 = 𝜇2 = 𝜇0 , reellem und positivem 𝜀1 und komplexem 𝜀2 = 𝜀2′ + i𝜀2′′ mit reellem und negativem 𝜀2′ . Nehmen Sie an, dass |𝜀2′′ ≪ 𝜀2′ ist und zeigen Sie, dass die Plasmonwellenlänge 𝜆0 ∕𝑛G und die Ausbreitungsdistanz d G mithilfe der folgenden Näherungen berechnet werden können: √ ′2 𝜀1 𝜀2′ 𝜀G 𝜆0 1 𝜀2 𝑛G ≈ , 𝜀G ≈ , dG ≈ . ′ 3 𝜀0 2π 𝑛 𝜀0 𝜀2′′ 𝜀1 + 𝜀2 G Aufgabe 8-2: Platte mit negativem Brechungsindex als Nahfeld-Abbildungssystem
Zeigen Sie, dass eine Platte mit dem Brechungsindex 𝑛 = −2 in Luft (𝑛 = 1) im Nahfeld abbildende Eigenschaften besitzt, indem Sie ein Diagramm ähnlich dem in Abb. 8.7(b) gezeigten erstellen und die Abbildungsgleichung bestimmen. Ermitteln Sie die Reflexions- und Transmissionskoeffizienten einer senkrecht auf die Platte auftreffenden Welle. Skizzieren Sie die Amplitude einer durch die Platte tretenden evaneszenten Welle, indem Sie ein Profil ähnlich dem in Abb. 8.7(d) gezeigten erstellen. Aufgabe 8-3: Bildgebung im Nahfeld mit Subwellenlängenauflösung mit einer verlustbehafteten Platte mit negativem Brechungsindex
Betrachten Sie eine Platte mit dem Brechungsindex 𝑛 = −2 in Luft (𝑛 = 1). Eine evaneszente Welle, die aus Luft in die Platte eintritt, wird wie in Aufgabe 8-2 durch das Plattenmaterial verstärkt. Wenn das Plattenmaterial verlustbehaftet ist, kommt es zusätzlich zu einer Dämpfung. Bestimmen Sie die räumliche Kreisfrequenz 𝑘𝑥 (in Einheiten von 𝑘0 ), bei der die Verstärkung kleiner als die Dämpfung ist, für einen Dämpfungskoeffizienten 𝛾 = 0.1𝑘0 , wobei 𝑘0 = 2π∕𝜆0 die Vakuumwellenzahl ist. Wie groß ist die entsprechende Auflösung in Wellenlängeneinheiten? Nehmen Sie 𝑘𝑦 = 0 an. Aufgabe 8-4: Hyperbolisches Medium vom Typ II
Für das in Abschnitt 8.1.3 beschriebene hyperbolische Medium sind 𝜀1 und 𝜀2 positiv, 𝜀3 dagegen negativ. Ein solches Medium wird als hyperbolisches Medium des Typs I bezeichnet. Bestimmen Sie die k-Oberfläche für ein hyperbolisches Medium vom Typ II, bei dem 𝜀1 und 𝜀2 negativ und 𝜀3 positiv sind. Zeigen Sie, dass sich in einem hyperbolischen Medium vom Typ II auch Wellen mit sehr kurzen Wellenlängen ausbreiten können, dass es jedoch stark reflektierend sein kann.
257
258
8 Optik von Metallen und Metamaterialien
Aufgabe 8-5: Gruppengeschwindigkeit in einem Metall
Zeigen Sie für ein Medium, das durch das vereinfachte Drudemodell mit einer effektiven Permittivität gemäß Gl. (8.44) beschrieben wird, dass das Produkt aus Phasengeschwindigkeit und Gruppengeschwindigkeit gleich 𝑐02 ist. Aufgabe 8-6: Prismenkoppler zur Anregung einer OPPWelle
An der Grenzfläche zwischen Luft und einer 60 nm dicken Ag-Schicht soll eine OPP-Welle erzeugt werden. Dazu soll ein SiN-Prisma (Brechungsindex 𝑛 = 2.0) verwendet werden, das an der gegenüberliegenden Seite der Ag-Schicht anliegt (siehe Abb. 8.16). Für eine Vakuumwellenlänge 𝜆0 = 700 nm beträgt die relative Permittivität von Silber −20 + i1.3. Berechnen Sie den Einfallswinkel des Lichts innerhalb des Prismas, der für die Kopplung mit dem OPP Silber/Luft erforderlich ist. Nehmen Sie an, dass die Dispersionsrelation der OPP-Welle an der Grenzfläche Ag/Luft durch das Vorhandensein des Prismas nicht gestört wird. Aufgabe 8-7: Silber-Nanokugel in Glas
Betrachten Sie eine in Glas eingebettete Silber-Nanokugel mit einem Radius von 𝑎 = 10 nm (𝑛 = 1.45). Berechnen und zeichnen Sie die Streueffizienz 𝑄S , die Absorptionseffizienz 𝑄Ab und das normierte innere Feld 𝐸i ∕𝐸0 als Funktionen der Vakuumwellenlänge 𝜆0 für den Wellenlängenbereich von 350–1000 nm. Identifizieren Sie die Resonanzfrequenz und geben Sie die Streu- und Absorptionskoeffizienten 𝛼S und 𝛼Ab bei Resonanz an. Verwenden Sie die folgende Anpassungsfunktion nach einem modifizierten Drudemodell für relative Permittivität von Silber: 𝜔P2 2.2𝜔L2 𝜀S =1+ + 𝜀0 −𝜔2 + i𝜔𝜁 𝜔L2 − 𝜔2 + i𝜔𝜁L mit 𝜁 = 0.00229𝜔P , 𝜔L = 0.575𝜔P und 𝜁L = 0.124𝜔P . Die Größe 𝜔P entspricht einer Vakuum-Plasmawellenlänge 𝜆P = 135.2 nm. In diesem Modell ist ein Beitrag der Interbandabsorption (von gebundenen Elektronen) zur komplexen Permittivität berücksichtigt. Aufgabe 8-8: Metamaterial mit negativer Permittivität: Silber-Nanokugeln in Wasser
Verwenden Sie die Maxwell-Garnett-Mischungsregel aus Gl. (5.135), um den Real- und Imaginärteil der effektiven Permittivität 𝜀e von Wasser mit Einschlüssen von Silber-Nanokugeln [siehe Abb. 8.23(b)] im Wellenlängenbereich von 250 bis 1000 nm als Funktion der Vakuumwellenlänge 𝜆0 zu berechnen und graphisch
darzustellen. Verwenden Sie die in Aufgabe 8-7 definierte Funktion für die relative Permittivität von Wasser und nehmen Sie den Brechungsindex von Wasser als konstant 𝑛 = 1.33 an. Nehmen Sie weiter an, dass der Volumenanteil 𝑓 = 3 % beträgt. Identifizieren Sie die Wellenlängenbereiche, in denen der Realteil von 𝜀e negativ ist. Untersuchen Sie die Auswirkungen einer Änderung von 𝑓 und 𝑛. Aufgabe 8-9: Hyperbolisches Metamaterial aus Schichten von Metall und Dielektrikum
Ein Metamaterial besteht aus abwechselnden Schichten eines Metalls und eines dielektrischen Materials. Der effektive dielektrische Tensor des anisotropen Materials besitzt die Komponenten 𝜀1 = 𝜀2 in der Ebene der Schichten und 𝜀3 in der dazu senkrechten Richtung. Verwenden Sie einen Effective-Medium-Ansatz, 𝜀1 = 𝜀2 =
𝜀M d M + 𝜀M d M , dM + dM
d M ∕𝜀M + d M ∕𝜀M 1 = , 𝜀3 dM + dM
wobei sind 𝜀M und 𝜀M die Permittivitäten der Metallschicht bzw. der dielektrischen Schicht und d M und d M ihre Dicken sind. Zeigen Sie mithilfe des Ausdrucks für 𝜀M aus dem vereinfachten Drudemodell, dass sich diese Struktur wie ein hyperbolisches Material verhalten kann. Stellen Sie fest, welche der Komponenten (𝜀1 oder 𝜀3 ) negativ ist. Skizzieren Sie die k-Oberfläche.
Weiterführende Literatur Einfach- und doppelt-negative Medien
S. A. Ramakrishna, T. M. Grzegorczyk, Physics and Applications of Negative Refractive Index Materials, CRC Press/ Taylor & Francis, 2008. J. B. Pendry, D. R. Smith, ‚Reversing Light with Negative Refraction‘, Physics Today 57(6), 43–37, 2004. R. A. Depine, A. Lakhtakia, ‚A New Condition to Identify Isotropic Dielectric-Magnetic Materials Displaying Negative Phase Velocity‘, Microwave and Optical Technology Letters 41, 316–315, 2004. S. A. Darmanyan, M. Nevière, A. A. Zakhidov, ‚Surface Modes at the Interface of Conventional and Left-Handed Media‘, Optics Communications 225, 240–233, 2003. W. S. Weiglhofer, A. Lakhtakia (Hrsg.), Introduction to Complex Mediums for Electromagnetics and Optics, SPIE Optical Engineering Press, 2003. M. W. McCall, A. Lakhtakia, W. S. Weiglhofer, ‚The Negative Index of Refraction Demystified‘, European Journal of Physics 23, 359–353, 2002. R. A. Shelby, D. R. Smith, S. Schultz, ‚Experimental Verification of a Negative Index of Refraction‘, Science 292, 99–77, 2001.
Aufgaben
J. B. Pendry, ‚Negative Refraction Makes a Perfect Lens‘, Physical Review Letters 85, 3969–3966, 2000. V. G. Veselago, ‚The Electrodynamics of Substances with Simultaneously Negative Values of 𝜀 and 𝜇‘, Soviet PhysicsUspekhi 10, 514–509, 1968 [Uspekhi Fizicheskikh Nauk 92, 526–517, 1964]. Plasmonik
M. I. Stockman et al., ‚Roadmap on Plasmonics‘, Journal of Optics 20, 043001, 2018. A. Trügler, Optical Properties of Metallic Nanoparticles: Basic Principles and Simulation, Springer 2016. I. D. Mayergoyz, Plasmon Resonances in Nanoparticles, World Scientific 2013. M. Pelton, G. Bryant, Introduction to Metal-Nanoparticle Plasmonics, Wiley 2013. A. V. Zayats, S. A. Maier (Hrsg.), Active Plasmonics and Tuneable Plasmonic Metamaterials, Wiley Science Wise 2013. Z. Han, S. I. Bozhevolnyi, ‚Radiation Guiding with Surface Plasmon Polaritons‘, Reports on Progress in Physics 76, 016402, 2013. S. Enoch, N. Bonod (Hrsg.), Plasmonics: From Basics to Advanced Topics, Springer 2012. S. Adachi, The Handbook on Optical Constants of Metals: In Tables and Figures, World Scientific 2012. S. Roh, T. Chung, B. Lee, ‚Overview of the Characteristics of Micro- and Nano-Structured Surface Plasmon Resonance Sensors‘, Sensors 11, 1588–1565, 2011. D. Sarid, W Challener, Modern Introduction to Surface Plasmons, Cambridge 2010. P. Berini, ‚Long-Range Surface Plasmon Polaritons‘, Advances in Optics and Photonics 1, 588–484, 2009. S. A. Maier, Plasmonics: Fundamentals and Applications, Springer 2007. M. L. Brongersma, P. G. Kik (Hrsg.), Surface Plasmon Nanophotonics, Springer 2007. H. A. Atwater, ‚The Promise of Plasmonics‘, Scientific American 296(4), 63–56, 2007. W L. Barnes, A. Dereux, T. W. Ebbesen, ‚Surface Plasmon Subwavelength Optics‘, Nature 424, 830–824, 2003. E. J. Zeman, G. C. Schatz, ‚An Accurate Electromagnetic Theory Study of Surface Enhancement Factors for Ag, Au, Cu, Li, Na, Al, Ga, In, Zn, and Cd‘, Journal of Physical Chemistry 91, 643–634, 1987. H. J. Hagemann, W. Gudat, C. Kunz, ‚Optical Constants from the Far Infrared to the X-Ray Region: Mg, Al, Cu, Ag, Au, Bi, C, and Al2 O3 ‘, Deutsches Elektronen-Synchrotron Report DESY-SR74-7, May 1974. P. B. Johnson, R. W. Christy, ‚Optical Constants of the Noble Metals‘, Physical Review B 6, 4379–4370, 1972.
Optik im Nahfeld und Nanophotonik
M. Bertolotti, C. Sibilia, A. M. Guzman, Evanescent Waves in Optics: An Introduction to Plasmonics, Springer 2017. N. Rotenberg, L. Kuipers, ‚Mapping Nanoscale Light Fields‘, Nature Photonics 8, 926–919, 2014. L. Novotny, B. Hecht, Principles of Nano-Optics, Cambridge University Press, 2. Aufl. 2012. Z. Zalevsky, I. Abdulhalim, Integrated Nanophotonic Devices, Elsevier, 2. Aufl. 2014. L. Novotny, ‚From Near-Field Optics to Optical Antennas‘, Physics Today 64(7), 52–47, 2011. S. V. Gaponenko, Introduction to Nanophotonics, Cambridge University Press 2010. M. Ohtsu, K. Kobayashi, T. Kawazoe, T. Yatsui, M. Naruse, Principles of Nanophotonics, CRC Press/Taylor & Francis 2008. D. Courjon, Near-Field Microscopy and Near-Field Optics, World Scientific 2003. S. Jutamulia (Hrsg.), Selected Papers on Near-Field Optics, SPIE Optical Engineering Press 2002 (Milestone Series Bd. 172). S. Kawata, M. Ohtsu, M. Irie (Hrsg.), Near-Field Optics and Surface Plasmon Polaritons, Springer 2001. Metamaterialien
I. Liberal, A. M. Mahmoud, Y. Li, B. Edwards, N. Engheta, ‚Photonic Doping of Epsilon-Near-Zero Media‘, Science 355, 1062–1058, 2017. I. Liberal, N. Engheta, ‚Zero-Index Platforms: Where Light Defies Geometry‘, Optics & Photonics News 27(7/8), 33– 26, 2016. N. Engheta, ‚150 Years of Maxwell’s Equations‘, Science 349, 137–136, 2015. N. M. Litchinitser, V. M. Shalaev, ‚Metamaterials: Stateof-the Art and Future Directions‘. In D. L. Andrews (Hrsg.), Photonics: Scientific Foundations, Technology and Applications, Band II, Nanophotonic Structures and Materials, Wiley Science Wise 2015. A. Poddubny, I. Iorsh, P. Belov, Y Kivshar, ‚Hyperbolic Metamaterials‘, Nature Photonics 7, 967–958, 2013. R. Marques, F. Martin, M. Sorolla, Metamaterials with Negative Parameters: Theory, Design and Microwave Applications, Wiley 2013. O. Hess, J. B. Pendry, S. A. Maier, R. F. Oulton, J. M. Hamm, K. L. Tsakmakidis, ‚Active Nanoplasmonic Metamaterials‘, Nature Materials 11, 584–573, 2012. N. I. Zheludev, Y. S. Kivshar, ‚From Metamaterials to Metadevices‘, Nature Materials 11, 924–917, 2012. Y Liu, X. Zhang, ‚Metamaterials: A New Frontier of Science and Technology‘, Chemical Society Reviews 40, 2507– 2494, 2011. M. Wegener, S. Linden, ‚Shaping Optical Space with Metamaterials‘, Physics Today 63(10), 36–32, 2010.
259
260
8 Optik von Metallen und Metamaterialien
T. J. Cui, D. R. Smith, R. Liu (Hrsg.), Metamaterials: Theory, Design, and Applications, Springer 2010. W. Cai, V. Shalaev, Optical Metamaterials: Fundamentals and Applications, Springer 2009. A. K. Sarychev, V. M. Shalaev, Electrodynamics of Metamaterials, World Scientific 2007. N. Engheta, ‚Circuits with Light at Nanoscales: Optical Nanocircuits Inspired by Metamaterials‘, Science 317, 1702–1698, 2007. N. Engheta, R. W. Ziolkowski (Hrsg.), Electromagnetic Metamaterials: Physics and Engineering Explorations, WileyIEEE 2006. S. Linden, C. Enkrich, G. Dolling, M. W Klein, J. Zhou, T. Koschny, C. M. Soukoulis, S. Burger, F. Schmidt, M. Wegener, ‚Photonic Metamaterials: Magnetism at Optical Frequencies‘, IEEE Journal of Selected Topics in Quantum Electronics 12, 1105–1097, 2006. G. V. Eleftheriades, K. G. Balmain (Hrsg.), Negative-Refraction Metamaterials: Fundamental Principles and Applications, Wiley-IEEE 2005. D. R. Smith, J. B. Pendry, M. C. K. Wiltshire, ‚Metamaterials and Negative Refractive Index‘, Science 305, 788–792, 2004. Optische Antennen und Metaoberflächen
N. Meinzer, W. L. Barnes, I. R. Hooper, ‚Plasmonic MetaAtoms and Metasurfaces‘, Nature Photonics 8, 898–889, 2014. N. Yu, F. Capasso, ‚Flat Optics with Designer Metasurfaces‘, Nature Materials 13, 139–150, 2014. M. Agio, A. Alù (Hrsg.), Optical Antennas, Cambridge University Press 2013. A. V. Kildishev, A. Boltasseva, V. M. Shalaev, ‚Planar Photonics with Metasurfaces‘, Science 339, 1232009, 2013. A. A. Maradudin, Structured Surfaces as Optical Metamaterials, Cambridge University Press 2011. N. Yu, P. Genevet, M. A. Kats, F. Aieta, J.-P. Tetienne, F. Capasso, Z. Gaburro, ‚Light Propagation with Phase Discontinuities: Generalized Laws of Reflection and Refraction‘, Science 334, 337–333, 2011. R. Gordon, A. G. Brolo, D. Sinton, K. L. Kavanagh, ‚Resonant Optical Transmission Through Hole-Arrays in Metal Films: Physics and Applications‘, Laser & Photonics Reviews 4, 335–311, 2010.
P. Bharadwaj, B. Deutsch, L. Novotny, ‚Optical Antennas‘, Advances in Optics and Photonics 1, 438–483, 2009. J. Bravo-Abad, L. Martín-Moreno, R J. Garcia-Vidal, ‚Resonant Transmission of Light Through Subwavelength Holes in Thick Metal Film‘s, IEEE Journal of Selected Topics in Quantum Electronics 12, 1227–1221, 2006. F. J. Garcia-Vidal, L. Martín-Moreno, J. B. Pendry, ‚Surfaces with Holes in Them: New Plasmonic Metamaterials‘, Journal of Optics A: Pure and Applied Optics 7, S97–S101, 2005. T. W. Ebbesen, H. J. Lezec, H. F. Ghaemi, T. Thio, P. A. Wolff, ‚Extraordinary Optical Transmission Through Sub-Wavelength Hole Arrays‘, Nature 391, 669–667, 1998. Transformationsoptik
J. B. Pendry, Y. Luo, R. Zhao, ‚Transforming the Optical Landscape‘, Science 348, 524–521, 2015. D. H. Werner, D.-H. Kwon, Transformation Electromagnetics and Metamaterials: Fundamental Principles and Applications, Springer 2014. A. B. Shvartsburg, A. A. Maradudin, Waves in Gradient Metamaterials, World Scientific/Imperial College Press 2013. M. McCall, ‚Transformation Optics and Cloaking‘, Contemporary Physics 54, 286–273, 2013. J. B. Pendry, A. Aubry, D. R. Smith, S. A. Maier, ‚Transformation Optics and Subwavelength Control of Light‘, Science 227, 552–549, 2012. U. Leonhardt, T. G. Philbin, ‚Transformation Optics and the Geometry of Light‘. In E. Wolf (Hrsg.), Progress in Optics, Elsevier 2009, Bd. 53, S. 69–152. D. Schurig, J. B. Pendry, D. R. Smith, ‚Calculation of Material Properties and Ray Tracing in Transformation Media‘, Optics Express 14, 9804–9794, 2006. J. B. Pendry, D. Schurig, D. R. Smith, ‚Controlling Electromagnetic Fields‘, Science 312, 1782–1780, 2006. A. Alù, N. Engheta, ‚Achieving Transparency with Plasmonic and Metamaterial Coatings‘, Physical Review E 72, 016623, 2005. C. Gomez-Reino, M. V. Perez, C. Bao, Gradient-Index Optics: Fundamentals and Applications, Springer 2002, Paperback 2010.
261
9 Wellenleiteroptik In traditionellen optischen Instrumenten und Systemen wird Licht in Form von Strahlen, die gebündelt, umgeleitet, fokussiert, und durch Spiegel, Linsen und Prismen umgelenkt werden, von Ort zu Ort transportiert. Die Strahlen werden im Verlauf ihrer Ausbreitung gebeugt und verbreitert, können aber mithilfe von Linsen und Spiegeln wieder fokussiert werden. Die meisten optischen Komponenten in solchen Systemen sind groß und unhandlich, und Gegenstände können den Weg der Strahlen versperren oder sie streuen. In vielen Fällen ist es daher vorteilhaft, optische Strahlen durch dielektrische Leiter zu führen und nicht durch den freien Raum. Die Technik hierzu ist die Wellenleiteroptik. Sie wurde anfangs entwickelt, um Licht über große Entfernungen zu leiten, ohne den Strahl immer wieder mit Linsen bündeln zu müssen. Diese Methode hat heute viele wichtige Anwendungen, beispielsweise den Transport von Licht über große Entfernungen in der optischen Nachrichtentechnik, bildgebende Verfahren in der Biomedizin oder die Verbindung von Komponenten in miniaturisierten optischen und optoelektronischen Bauelementen und Systemen. Das der optischen Wellenleitung zugrunde liegende Prinzip ist einfach. Ein Medium mit dem Brechungsindex 𝑛1 eingebettet in einem Medium mit dem kleineren Brechungsindex 𝑛2 < 𝑛1 wirkt als „Lichtfalle“, innerhalb derer optische Strahlen durch vielfache Totalreflexion an den Grenzflächen gefangen sind. Weil dieser Effekt das Einfangen von Licht in einem Medium mit hohem Brechungsindex ermöglicht (siehe Übung 1-7), kann er zur Herstellung von Lichtleitern ausgenutzt werden, die Licht von einem Ort zu einem anderen transportieren. Ein optischer Wellenleiter ist ein Lichtleiter in Form einer Platte, eines Streifens oder Zylinders aus einem dielektrischen Material, das in ein anderes dielektrisches Material mit kleinerem Brechungsindex eingebettet ist (Abb. 9.1). Das Licht wird durch das innere Medium transportiert, ohne in das umgebende Medium auszustrahlen. Die am häufigsten verwendete Variante solcher Wellenleiter ist die optische Faser, zwei konzentri-
Platte
Streifen
Faser
Abb. 9.1 Optische Wellenleiter.
sche Zylinder aus verlustarmen dielektrischen Materialien wie z. B. Glas (siehe Kapitel 10). Andere Bauformen von Wellenleitern verwenden photonische Kristalle (Kapitel 7) oder Verbundstrukturen aus Metallen und Dielektrika (Kapitel 8). Integrierte Photonik oder integrierte Optik bezeichnet die Technologie, verschiedene optische Bauelemente und Komponenten, die zur Erzeugung, Fokussierung, Aufspaltung, Zusammenführung, Isolierung, Polarisation, Kopplung, Schaltung, Modulation und Detektion von Licht benötigt werden, auf einem einzigen Substrat (einem „Chip“) zu kombinieren. Optische Wellenleiter bilden die Verbindungen zwischen diesen Komponenten. Solche Chips, die auch als photonische integrierte Schaltkreise (PIC, von engl. photonic integrated circuit) bezeichnet werden (Abb. 9.2), sind die optischen Analoga der elektronischen integrierten Schaltkreise (IC, engl. integrated circuit). Abbildung 9.2 zeigt eine schematische Darstellung eines photonischen Sender/Empfängerchips. Das Ziel der integrierten Optik ist die Miniaturisierung der Optik auf ganz ähnliche Weise, wie die Elektronik durch integrierte Schaltkreise miniaturisiert wurde.
In diesem Kapitel . . . In diesem und dem folgenden Kapitel wird die grundlegende Theorie von optischen Wellenleitern präsentiert. In diesem Kapitel betrachten wir zunächst rechteckige Wellenleiter, die in der integrierten Photonik häufig zum Einsatz kommen. Kapitel 10 befasst sich mit zylindrischen Wellenleitern,
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
262
9 Wellenleiteroptik
Koppler eintretendes Licht
Koppler
Faser
austretendes Licht Modulator Daten
Substrat
Abb. 9.2 Beispiel eines photonischen integrierten Schaltkreises, der als einfacher optischer Empfänger/Sender dient. Empfangenes Licht wird in einen Wellenleiter eingekoppelt und zu einer Photodiode geleitet, wo es detektiert wird. Licht aus einem Diodenlaser wird geführt, moduliert und zur Weiterleitung in eine Faser eingekoppelt.
Wellenleiter
Laserdiode
Photodiode Daten
d. h. optischen Fasern. Wenn an die beiden Enden eines kurzen Wellenleiters Reflektoren platziert werden, ist das Ergebnis eine Struktur, die Licht fängt und speichert – ein optischer Resonator. Diese Bauelemente, die zur Herstellung von Lasern notwendig sind, werden in Kapitel 11 beschrieben. Andere Komponenten und Bauelemente der integrierten Optik wie Halbleiterlaser, Detektoren, Modulatoren und Schalter werden in den Kapiteln betrachtet, die sich speziell mit den betreffenden Komponenten und Bauelementen befassen. Optische Nachrichtensysteme werden im Detail in Kapitel 25 besprochen.
9.1 Wellenleiter aus ebenen Spiegeln Wir beginnen, indem wir Wellenausbreitung in einem Wellenleiter untersuchen, der aus zwei parallelen, unendlich großen ebenen Spiegeln in einem Abstand d voneinander besteht (Abb. 9.3). Wir nehmen an, dass die Spiegel Licht verlustfrei reflektieren. Ein Lichtstrahl in der 𝑦𝑧-Ebene fällt in einem Winkel 𝜃 auf die Spiegel und wird zwischen ihnen ohne Energieverlust hin und her reflektiert. Der Strahl wird auf diese Weise in 𝑧-Richtung geführt. Dieser Wellenleiter scheint ein idealer Leiter für Lichtstrahlen zu sein. Er wird in der Praxis aber nicht verwendet, vor allem wegen der Schwierigkeiten und der Kosten für die Herstellung von verlustarmen Spiegeln. y
x
Spiegel
θ
Abb. 9.3 Ein Wellenleiter aus zwei ebenen Spiegeln.
z
Trotzdem werden wir dieses einfache Beispiel im Detail untersuchen, weil es eine pädagogisch wertvolle Einführung in die Gebiete der dielektrischen Wellenleiter, die wir im Abschnitt 9.2 betrachten werden, sowie der optischen Resonatoren, die das Thema von Kapitel 11 sind, bietet.
9.1.1
Wellenleitermoden
Das strahlenoptische Bild von Licht, das durch vielfache Reflexionen geführt wird, versagt bei der Erklärung einiger wichtiger Effekte, die nur im Rahmen der elektromagnetischen Theorie verständlich werden. Ein einfacher Ansatz für eine elektromagnetische Analyse ist, mit jedem optischen Strahl eine transversale elektromagnetische (TEM) ebene Welle zu verknüpfen. Das gesamte elektromagnetische Feld ist dann die Summe dieser ebenen Wellen. Wir betrachten eine monochromatische ebene TEMWelle der Wellenlänge 𝜆 = 𝜆0 ∕𝑛, der Wellenzahl 𝑘 = 𝑛𝑘0 und der Phasengeschwindigkeit 𝑐 = 𝑐0 ∕𝑛, wobei 𝑛 der Brechungsindex des Mediums zwischen den Spiegeln ist. Die Welle ist in 𝑥-Richtung polarisiert und ihr Wellenvektor liegt in der 𝑦𝑧-Ebene in einem Winkel 𝜃 zur 𝑧-Achse (Abb. 9.3). Wie der optische Strahl wird auch die Welle am oberen Spiegel reflektiert, läuft in einem Winkel −𝜃 zum unteren Spiegel, wird dort wieder reflektiert, läuft wieder in einem Winkel 𝜃 nach oben und so weiter. Da der elektrische Feldvektor parallel zum Spiegel ist, wird jede Reflexion für einen idealen Spiegel von einer Phasenverschiebung um π begleitet, aber die Amplitude und die Polarisation werden nicht geändert. Die Phasenverschiebung um π stellt sicher, dass die Summe jeder Welle und ihrer eigenen Reflexion verschwindet, sodass das Gesamtfeld an den Spiegeln null ist. An jedem Punkt innerhalb des Wellenleiters existieren TEMWellen, die sich in einem Winkel 𝜃 nach oben ausbreiten, und andere, die sich in einem Winkel −𝜃 nach unten ausbreiten; alle Wellen sind in 𝑥-Richtung polarisiert.
9.1 Wellenleiter aus ebenen Spiegeln
B λ
y A
θ
λ Originalwelle
θ C
(a)
z zweimal reflektierte Welle
(b)
Abb. 9.4 (a) Die Selbstkonsistenzbedingung: Nach zweimaliger Reflexion muss sich eine Welle selbst reproduzieren. (b) In Winkeln, für die Forderung nach Selbstkonsistenz erfüllt ist, interferieren die beiden Wellen und erzeugen ein Muster, das sich mit z nicht ändert.
Wir fordern nun Selbstkonsistenz, indem wir verlangen, dass die Welle sich nach zweimaliger Reflexion selbst reproduziert [Abb. 9.4(a)], sodass nur noch zwei verschiedene ebene Wellen existieren. Felder, die diese Bedingung erfüllen, werden die Moden (oder Eigenfunktionen) des Wellenleiters genannt (siehe Anhang C). Moden sind Felder, die an allen Orten entlang der Achse des Wellenleiters dieselbe transversale Verteilung und Polarisation besitzen. Wir werden sehen, dass die Forderung nach Selbstkonsistenz diese Invarianz der Form sicherstellt. In der Darstellung in Abb. 9.4 muss die Phasenverschiebung Δ𝜑 der Originalwelle bei einer Reise von 𝐴 nach 𝐵 gleich der Phasenverschiebung sein (oder sich durch ein ganzes Vielfaches von 2π davon unterscheiden), die die Welle erfährt, wenn sie in 𝐴 reflektiert wird, bis 𝐶 läuft und dort nochmals reflektiert wird. Wenn wir die Phasenverschiebung von π bei jeder Reflexion berücksichtigen, erhalten wir Δ𝜑 = 2π𝐴𝐶∕𝜆 − 2π − 2π𝐴𝐵∕𝜆 = 2π 𝑞 mit 𝑞 = 0, 1, 2, …, sodass 2π(𝐴𝐶 − 𝐴𝐵)∕𝜆 = 2π(𝑞 + 1) ist. Die in Abb. 9.4(a) dargestellte geometrische Anordnung zusammen mit der Identität 2 cos(2𝑥) = 1 − 2 sin 𝑥, liefert 𝐴𝐶 − 𝐴𝐵 = 2d sin 𝜃, wobei d die Entfernung zwischen den Spiegeln ist. Also ist 2π(2d sin 𝜃)∕𝜆 = 2π(𝑞 + 1), sodass 2π 2d sin 𝜃 = 2π 𝑚 , 𝜆
𝑚 = 1, 2, …
(9.1)
mit 𝑚 = 𝑞 + 1. Die Bedingung der Selbstkonsistenz ist daher nur für bestimmte Reflexionswinkel 𝜃 = 𝜃𝑚 erfüllt, für die 𝜆 sin 𝜃𝑚 = 𝑚 , 2d
𝑚 = 1, 2, …
(9.2)
gilt. Jede ganze Zahl 𝑚 entspricht einem Reflexionswinkel 𝜃𝑚 , und das entsprechende Feld wird 𝑚-te Mode genannt. Die Mode 𝑚 = 1 besitzt den kleinsten Winkel, −1 𝜃1 = sin (𝜆∕2d ); Moden mit größerem 𝑚 bestehen aus ebenen Wellen in steileren Winkeln. Wenn die Bedingung der Selbstkonsistenz erfüllt ist, unterscheiden sich die Phasen der nach oben und nach
unten gerichteten ebenen Wellen an Punkten auf der 𝑧-Achse um die halbe Phasenverschiebung 𝑞π (𝑞 = 0, 1, …) oder (𝑚 − 1)π (𝑚 = 1, 2, …) eines vollen Umlaufs, sodass sie sich für ungerade 𝑚 addieren und für gerade 𝑚 auslöschen. Da die 𝑦-Komponente der Ausbreitungskonstante durch 𝑘𝑦 = 𝑛𝑘0 sin 𝜃 gegeben ist, ist sie quantisiert und auf die Werte 𝑘𝑦𝑚 = 𝑛𝑘0 sin 𝜃𝑚 = (2π∕𝜆) sin 𝜃𝑚 beschränkt. Mithilfe von Gl. (9.2) erhalten wir π 𝑘𝑦𝑚 = 𝑚 , 𝑚 = 1, 2, 3 … ; (9.3) d
die 𝑘𝑦𝑚 folgen also in Abständen von π∕d aufeinander. Gleichung (9.3) sagt aus, dass die Phasenverschiebung einer Welle mit der Ausbreitungskonstante 𝑘𝑦𝑚 nach Ausbreitung über eine Entfernung 2d (einmal hin und zurück) in 𝑦-Richtung ein ganzzahliges Vielfaches von 2π sein muss.
9.1.2 Ausbreitungskonstanten Eine geführte Welle besteht aus zwei verschiedenen ebenen Wellen, die sich in der 𝑦𝑧-Ebene in Winkeln von ±𝜃 zur 𝑧-Achse ausbreiten. Ihre Wellenvektoren haben die Komponenten (0, 𝑘𝑦 , 𝑘𝑧 ) und (0, −𝑘𝑦 , 𝑘𝑧 ). Ihre Summe oder Differenz ändern sich daher wie exp(−i𝑘𝑧 𝑧) mit 𝑧, sodass die Ausbreitungskonstante der geführten Welle 𝛽 ≡ 𝑘𝑧 = 𝑘 cos 𝜃 ist. Folglich wird 𝛽 auf die Werte 2 2 𝛽𝑚 = 𝑘 cos 𝜃𝑚 quantisiert, woraus 𝛽𝑚 = 𝑘2 (1 − sin 𝜃𝑚 ) folgt. Mithilfe von Gl. (9.2) erhalten wir 2 𝛽𝑚 = 𝑘2 −
𝑚 2 π2 d2
.
(9.4)
Moden höherer Ordnung (in steileren Winkeln) breiten sich mit kleineren Ausbreitungskonstanten aus. Die Werte 𝜃𝑚 , 𝑘𝑦𝑚 und 𝛽𝑚 sind für verschiedene Moden in Abb. 9.5 dargestellt.
263
264
9 Wellenleiteroptik
ky = nk0 sin θ nk0
sin θ 1
λ /2
M nk0 k θm ym m βm
π/
3 2 1 0
θ1 θ2 θ3
θm
θM
π /2 θ
0 0
βm nk0 β = nk0 cos θ
Abb. 9.5 Die Reflexionswinkel 𝜃m und die Komponenten der Wellenvektoren der Moden eines Wellenleiters aus ebenen Spiegeln. Die transversalen Komponenten kym = k sin 𝜃m liegen in gleichen Abständen bei Vielfachen von π∕d , aber
die Reflexionswinkel 𝜃m und die Ausbreitungskonstanten 𝛽m sind nicht äquidistant. Die Mode m = 1 besitzt den kleinsten Reflexionswinkel und die größte Ausbreitungskonstante.
Übung 9-1: Optische Leistung
9.1.3 Feldverteilungen Die komplexe Amplitude des Gesamtfelds in einem Wellenleiter ist die Superposition der zwei reflektierten ebenen TEM-Wellen. Wenn 𝐴𝑚 exp(−i𝑘𝑦𝑚 𝑦 − i𝛽𝑚 𝑧) die nach oben gerichtete Welle ist, muss ei(𝑚−1)π 𝐴𝑚 exp(+i𝑘𝑦𝑚 𝑦 − i𝛽𝑚 𝑧) die Welle nach unten sein [bei 𝑦 = 0 unterscheiden sich die beiden Wellen um eine Phasenverschiebung von (𝑚 − 1)π]. Es gibt daher symmetrische Moden, für die die beiden ebenen Welle sich addieren, und antisymmetrische Moden, für die sie voneinander subtrahiert werden. Es zeigt sich, dass das Gesamtfeld für ungerade Moden 𝐸𝑥 (𝑦, 𝑧) = 2𝐴𝑚 cos(𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) und für gerade Moden 2i𝐴𝑚 sin(𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) ist. Mithilfe von Gl. (9.3) schreiben wir die komplexe Amplitude des elektrischen Feldes in der Form 𝐸𝑥 (𝑦, 𝑧) = a𝑚 𝑢𝑚 (𝑦) exp(i𝛽𝑚 𝑧) mit 𝑢𝑚 (𝑦) =
⎧ ⎪
√
2 d
(9.5)
𝑦 cos (𝑚π ) , 𝑚 = 1, 3, 5, … , d
(9.6) ⎨√ 𝑦 2 ⎪ sin (𝑚π ) , 𝑚 = 2, 4, 6, … , d d ⎩ √ √ und a𝑚 = 2d 𝐴𝑚 für ungerade 𝑚 bzw. i 2d 𝐴𝑚 für gerade 𝑚. Die Funktionen 𝑢𝑚 (𝑦) sind so normiert, dass
Zeigen Sie, dass der optische Leistungsfluss in 𝑧-Richtung, der mit der der TE-Mode 𝐸𝑥 (𝑦, 𝑧) = a𝑚 𝑢𝑚 (𝑦) 2 exp(i𝛽𝑚 𝑧) verbunden ist, gleich √ (|a𝑚 | ∕2𝜂) cos 𝜃𝑚 ist, wobei 𝜂 = 𝜂0 ∕𝑛 ist und 𝜂0 = 𝜇0 ∕𝜀0 die Impedanz des Vakuums bedeutet. Die transversalen Verteilungen 𝑢𝑚 (𝑦) sind in Abb. 9.6 aufgetragen. Jede Mode kann als eine stehende Welle in 𝑦-Richtung betrachtet werden, die sich in 𝑧-Richtung ausbreitet. Moden mit großem 𝑚 ändern sich transversal mit einer größeren Geschwindigkeit 𝑘𝑦 und breiten sich mit einer kleineren Ausbreitungskonstante 𝛽 aus. Bei 𝑦 = ±d ∕2 verschwindet das Feld für alle Moden, sodass die Randbedingungen an der Oberfläche der Spiegel immer erfüllt sind. Da wir zu Beginn angenommen haben, dass die reflektierten ebenen TEM-Wellen in 𝑥-Richtung polarisiert sind, liegt auch das elektrische Gesamtfeld in 𝑥-Richtung, und die geführte Welle ist eine transversal-elektrische (TE-) Welle. Transversal-magnetische (TM) Wellen können auf ähnliche Weise analysiert werden, wie wir später sehen werden. x y
d ∕2
2 ∫ 𝑢𝑚 (𝑦) d𝑦 = 1
2
(9.7)
−d ∕2
m =1
2
3
6
Spiegel
0
gilt. a𝑚 ist also die Amplitude der Mode 𝑚. Es kann gezeigt werden, dass die Funktionen 𝑢𝑚 (𝑦) die Beziehung
–
2
d ∕2
∫ 𝑢𝑚 (𝑦) 𝑢𝑙 (𝑦) d𝑦 = 0 ,
𝑙≠𝑚
(9.8)
−d ∕2
erfüllen, d. h. sie sind im Intervall [−d ∕2, d ∕2] orthogonal.
Abb. 9.6 Feldverteilungen der Moden eines Wellenleiters aus ebenen Spiegeln.
z
9.1 Wellenleiter aus ebenen Spiegeln
ω
ω
ω m =5 4 3 2 1
3ω k 2ω k ωk
0 0
m =5 4 3 Lichtlinie ω = cβ
2 1
verbotenes Band 1 2 3 4 5 6 Zahl M der Moden (a)
0 Ausbreitungskonstante β (b)
c 0 Gruppengeschwindigkeit ʋ (c)
Abb. 9.7 (a) Zahl M der Moden als Funktion der Kreisfrequenz 𝜔. Für Kreisfrequenzen unterhalb der Grenzkreisfrequenz 𝜔k = πc∕d sind keine Moden erlaubt. Bei einer Zunahme der Kreisfrequenz um 𝜔k erhöht sich M um eins. (b) Die
Dispersionsrelation. Für Kreisfrequenzen unterhalb von 𝜔k existiert ein verbotenes Bandverbotenes Band. (c) Die Gruppengeschwindigkeiten der Moden als Funktion der Kreisfrequenz.
9.1.4 Die Zahl der Moden
die Frequenz 𝜈 ausgedrückt werden, 𝑀 =. 𝜈∕𝜈k = 𝜔∕𝜔k ; die Zahl der Moden nimmt demnach um eins zu, wenn die Kreisfrequenz 𝜔 um 𝜔k vergrößert wird [Abb. 9.7(a)].
Wegen sin 𝜃𝑚 = 𝑚𝜆∕2d (𝑚 = 1, 2, …) und sin 𝜃𝑚 < 1 ist der größte erlaubte Wert für 𝑚 gleich der größten ganzen Zahl kleiner als 1∕(𝜆∕2d ), 2d . 𝑀 =. 𝜆
9.1.5 Die Dispersionsrelation (9.9)
Das Symbol =. zeigt an, dass 2d ∕𝜆 auf die nächste ganze Zahl abgerundet werden soll. Beispielsweise ist für 2d ∕𝜆 = 0.9, 1 und 1.1 und folglich 𝑀 = 0, 0 und 1. 𝑀 ist demnach die Zahl der Moden des Wellenleiters. Licht kann in einer, zwei oder vielen Moden durch den Wellenleiter hindurch gelangen. Die tatsächliche Zahl von Moden, die optische Leistung übertragen, hängt von der Quelle der Anregung ab; ihre maximale Zahl ist 𝑀. Die Zahl von Moden nimmt mit zunehmendem Verhältnis von Spiegelabstand zur Wellenlänge zu. Für 2d ∕𝜆 ≤ 1 bzw. d ≤ 𝜆∕2 wird 𝑀 offensichtlich 0; das bedeutet, dass die Forderung nach Selbstkonsistenz nicht erfüllt werden und der Wellenleiter keine Moden führen kann. Die Wellenlänge 𝜆k = 2d wird daher die Grenzwellenlänge des Wellenleiters genannt. Sie ist die größte Wellenlänge, die in dieser Struktur geführt werden kann. Sie entspricht der Grenzfrequenz 𝜈k =
𝑐 2d
(9.10)
bzw. der Grenzkreisfrequenz 𝜔k = 2π 𝜈k = π𝑐∕d , der kleinsten Kreisfrequenz, die in dem Wellenleiter geführt werden kann. Für 1 < 2d ∕𝜆 ≤ 2 (d. h. d ≤ 𝜆 < 2d oder 𝜈k ≤ 𝜈 < 2𝜈k ) ist nur eine Mode erlaubt. Man bezeichnet die Struktur in diesem Fall als Einmodenwellenleiter. Wenn z. B. d = 5 μm ist, besitzt der Wellenleiter die Grenzwellenlänge 𝜆k = 10 μm; für 5 μm ≤ 𝜆 < 10 μm ist eine einzige Mode erlaubt, und für 𝜆 < 5 μm sind mehrere Moden möglich. Gleichung (9.9) kann durch
Die Beziehung zwischen der Ausbreitungskonstante 𝛽 und der Kreisfrequenz 𝜔 ist eine wichtige Eigenschaft des Wellenleiters, die als Dispersionsrelation bezeichnet wird. Für ein homogenes Medium ist die Dispersionsrelation einfach 𝜔 = 𝑐𝛽. Für die Mode 𝑚 eines Wellenleiters aus ebenen Spiegeln sind 𝛽𝑚 und 𝜔 durch Gl. (9.4) verknüpft, 2 = (𝜔∕𝑐)2 − 𝑚2 π2 ∕d 2 . 𝛽𝑚
(9.11)
Als Funktion der Grenzkreisfrequenz 𝜔k = 2π 𝜈k = π𝑐∕d lautet diese Beziehung √ 𝜔 𝛽𝑚 = 𝑐
1 − 𝑚2
𝜔k2 𝜔2
.
(9.12)
Wie Abb. 9.7(b) für 𝑚 = 1, 2, … zeigt, ist die Ausbreitungskonstante 𝛽 für die Mode 𝑚 bei der Kreisfrequenz 𝜔 = 𝑚𝜔k null, nimmt mit steigender Kreisfrequenz zu und nähert sich schließlich für hinreichend große Werte von 𝛽 der linearen Beziehung 𝛽 = 𝜔∕𝑐.
9.1.6 Gruppengeschwindigkeiten In einem Medium mit gegebener Dispersionsrelation breitet sich ein Lichtpuls (ein Wellenpaket) mit der zentralen Kreisfrequenz 𝜔 mit einer Geschwindigkeit 𝑣 = d𝜔∕ d𝛽 aus, die als Gruppengeschwindigkeit bezeichnet wird (siehe Abschnitt 5.7). Wenn wir die Ableitung von Gl. (9.12) bilden und annehmen, dass 𝑐 nicht von 𝜔 abhängt (d. h. wir vernachlässigen Dispersion im Material
265
9 Wellenleiteroptik
θ
Spiegel cs c
266
θ
z
cot θ
Abb. 9.8 Eine in einem Winkel 𝜃 reflektierte ebene Welle legt in der Zeit d csc 𝜃∕c eine Entfernung d cot 𝜃 in z-Richtung zurück. Ihre Geschwindigkeit ist c cos 𝜃 .
des Wellenleiters), erhalten wir 2𝛽𝑚 d𝛽𝑚 ∕ d𝜔 = 2𝜔∕𝑐2 , sodass d𝜔∕ d𝛽𝑚 = 𝑐2 𝛽𝑚 ∕𝜔 = 𝑐2 𝑘 cos 𝜃𝑚 ∕𝜔 = 𝑐 cos 𝜃𝑚 ist. Damit erhalten wir für die Gruppengeschwindigkeit der Mode 𝑚 √ 𝜔2 (9.13) 𝑣𝑚 = 𝑐 cos 𝜃𝑚 = 𝑐 1 − 𝑚2 k2 . 𝜔 Hieraus folgt, dass sich Moden, die in steileren Winkeln verlaufen, mit kleineren Gruppengeschwindigkeiten ausbreiten, da sie durch die längeren Zickzackwege gebremst werden. Die Abhängigkeit der Gruppengeschwindigkeit von der Kreisfrequenz ist in Abb. 9.7(c) dargestellt, die zeigt, dass die Gruppengeschwindigkeit einer Mode monoton von 0 bis 𝑐 steigt, wenn die Kreisfrequenz über die Grenzfrequenz der Mode hinaus zunimmt. Gleichung (9.13) kann auch geometrisch erhalten werden, indem wir die ebene Welle während ihrer Reflexionen zwischen den Spiegeln betrachten und die von ihr in 𝑧-Richtung zurückgelegte Entfernung und die für den Zickzackweg benötigte Zeit bestimmen. Für den Weg vom unteren bis zum oberen Spiegel gilt (Abb. 9.8) 𝑣=
Entfernung d cot 𝜃 = = 𝑐 cos 𝜃 . Zeit d csc 𝜃∕𝑐
(9.14)
und verschwindet an den Spiegeln). Wenn die Forderung nach Selbstkonsistenz auf diese Komponente angewandt wird, erhalten wir wieder dasselbe Resultat wie im TE-Fall. Die Winkel 𝜃, die transversalen Komponenten 𝑘𝑦 des Wellenvektors und die Ausbreitungskonstanten 𝛽 der zu dieser Komponente gehörenden TM-Moden sind mit denjenigen der TE-Moden identisch. In dem Wellenleiter sind 𝑀 =. 2d ∕𝜆 TM-Moden (und damit insgesamt 2𝑀 Moden) möglich. Die 𝑧-Komponente der komplexen Amplitude des elektrischen Feldes der Mode 𝑚 ist wie zuvor die Summe einer nach oben gerichteten ebenen Welle 𝐴𝑚 exp(−i𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) und einer nach unten gerichteten ebenen Welle ei(𝑚−1)π 𝐴𝑚 exp(i𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) mit gleichen Amplituden und den Phasenverschiebungen (𝑚 − 1)π; es gilt folglich ⎧ cos (𝑚π 𝑦 ) exp(−i𝛽 𝑧) , 𝑚 ⎪ d ⎪ 𝑚 = 1, 3, 5, … , ⎪ (9.15) 𝐸𝑧 (𝑦, 𝑧) = ⎨ √ 𝑦 2 ⎪a ⎪ 𝑚 d sin (𝑚π d ) exp(−i𝛽𝑚 𝑧), ⎪ 𝑚 = 2, 4, 6, … , ⎩ √ √ mit a𝑚 = 2d 𝐴𝑚 für gerade und i 2d 𝐴𝑚 für ungerade 𝑚. Da der elektrische Feldvektor einer ebenen TEMWelle senkrecht auf ihrer Ausbreitungsrichtung steht, schließt er für die nach oben gerichtete Welle einen Winkel π∕2 + 𝜃𝑚 mit der 𝑧-Achse ein und für die nach unten gerichtete Welle einen Winkel von π∕2 − 𝜃𝑚 . Die 𝑦-Komponenten des elektrischen Feldes dieser Wellen sind 𝐴𝑚 cot 𝜃𝑚 exp(−i𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) und e
i𝑚π
𝐴𝑚 cot 𝜃𝑚 exp(i𝑘𝑦𝑚 𝑦) exp(−i𝛽𝑚 𝑧) ,
folglich ist
9.1.7 TM-Moden Bis jetzt haben wir nur TE-Moden (elektrisches Feld in 𝑥-Richtung) betrachtet. In dem Spiegelwellenleiter sind auch TM-Moden (magnetisches Feld in 𝑥-Richtung) möglich. Um sie zu analysieren, betrachten wir eine ebene TEM-Welle mit dem magnetischen Feld in 𝑥-Richtung, die sich in einem Winkel 𝜃 ausbreitet und von den beiden Spiegeln reflektiert wird (Abb. 9.9). Die komplexe Amplitude des elektrischen Feldes hat dann Komponenten in 𝑦- und 𝑧-Richtung. Da die 𝑧-Komponente parallel zum Spiegel ist, verhält sie sich genau wie 𝑥-Komponente der TE-Mode (d. h. sie erfährt bei jeder Reflexion eine Phasenverschiebung von π
(9.16)
𝐸𝑦 (𝑦, 𝑧) =
√ 𝑦 2 ⎧a ⎪ 𝑚 d cot 𝜃𝑚 cos (𝑚π d ) exp(−i𝛽𝑚 𝑧), ⎪ 𝑚 = 1, 3, 5, … , ⎪ ⎨ √ 𝑦 2 ⎪ ⎪ a𝑚 d cot 𝜃𝑚 sin (𝑚π d ) exp(−i𝛽𝑚 𝑧), ⎪ 𝑚 = 2, 4, 6, … ⎩ (9.17)
Die Randbedingungen sind erfüllt, weil 𝐸𝑧 (𝑦, 𝑧) an den Spiegeln verschwindet. Die Komponente 𝐻𝑥 (𝑦, 𝑧) des Magnetfelds kann auf ähnliche Weise bestimmt werden, indem man ausnutzt, dass das Verhältnis der elektrischen zu den magnetischen Feldern einer TEM-Welle
9.2 Ebene dielektrische Wellenleiter
x
y
TE
Abb. 9.9 TE- und TMpolarisierte geführte Wellen.
x
y
TM z
E
gleich der Impedanz 𝜂 des Mediums ist. Die resultierenden Felder 𝐸𝑦 (𝑦, 𝑧), 𝐸𝑧 (𝑦, 𝑧) und 𝐻𝑥 (𝑦, 𝑧) gehorchen selbstverständlich den maxwellschen Gleichungen.
9.1.8 Vielmodenfelder Damit das Licht durch die Spiegel geführt wird, muss es nicht unbedingt die Verteilung einer der Moden besitzen. Jedes Feld, das die Randbedingungen erfüllt (an den Spiegeln verschwindet) aber eine beliebige Verteilung in der transversalen Ebene besitzt, kann durch den Wellenleiter geführt werden. Die optische Leistung wird in diesem Fall jedoch zwischen den Moden aufgeteilt. Da verschiedene Moden sich mit unterschiedlichen Ausbreitungskonstanten und Gruppengeschwindigkeiten ausbreiten, wird sich die transversale Verteilung des Feldes verändern, während es sich durch den Wellenleiter bewegt. Abbildung 9.10 zeigt, dass die transversale Verteilung einer einzelnen Mode sich während der Ausbreitung nicht verändert, wohingegen sich die Vielmodenverteilung mit 𝑧 ändert (die Darstellung gilt für die Verteilung der Intensität). Ein beliebiges in 𝑥-Richtung polarisiertes Feld, das die Randbedingungen erfüllt, kann als eine gewichtete Superposition der TE-Moden geschrieben werden, 𝐸𝑥 (𝑦, 𝑧) =
𝑀 ∑ 𝑚=0
a𝑚 𝑢𝑚 (𝑦) exp(−i𝛽𝑚 𝑧) ,
z
H
(9.18)
wobei a𝑚 die Superpositionsgewichte sind, die Amplituden der verschiedenen Moden.
Übung 9-2: Die optische Leistung in einem Vielmodenfeld
Zeigen Sie, dass der mit dem Vielmodenfeld aus Gl. (9.18) verknüpfte Fluss der optischen Leistung in 𝑧-Richtung gleich der Summe der von jeder der Moden geführten Leistungen (|a𝑚 |2 ∕2𝜂) cos 𝜃𝑚 ist.
9.2 Ebene dielektrische Wellenleiter Ein ebener dielektrischer Wellenleiter ist eine Platte aus einem dielektrischen Material, die von Medien mit kleineren Brechungsindizes umgeben ist. Das Licht wird innerhalb der Platte durch Totalreflexion geführt. In Dünnschicht-Bauelementen wird die Platte als „Schicht“ bezeichnet, und die oberen und unteren Medien als „Deckschicht“ und „Substrat“. Die inneren und äußeren Medien werden auch „Kern“ und „Mantel“ des Wellenleiters genannt. In diesem Abschnitt untersuchen wir die Ausbreitung des Lichts in einem symmetrischen ebenen dielektrischen Wellenleiter, der aus einer Platte der Dicke d mit dem Brechungsindex 𝑛1 besteht, der von einem Mantel mit dem kleineren Brechungsindex 𝑛2 umgeben ist, wie Abb. 9.11 zeigt. Wir nehmen an, dass alle Materialien verlustfrei sind. Lichtstrahlen in der 𝑦𝑧-Ebene, die einen Winkel 𝜃 mit der 𝑧-Achse einschließen, erfahren vielfache Totalreflexionen an den Plattengrenzflächen, sofern 𝜃 kleiner ist als das Komplement des kritischen Winkels 𝜃k = −1 π∕2 − sin (𝑛2 ∕𝑛1 ) = cos−1 (𝑛2 ∕𝑛1 ) [siehe Gl. (1.8) und
y (a)
z
y (b)
z
y (c)
z
Abb. 9.10 Variation der Intensitätsverteilung in der transversalen Richtung y bei verschiedenen axialen Positionen z. (a) Die komplexe Amplitude des elektrischen Feldes in Mode 1 ist E (y , z)√= u1 (y ) exp(−i𝛽1 z) mit u1 (y ) = 2∕d cos(πy ∕d ). Die Intensität ändert sich nicht mit z. (b) Die komplexe Amplitude in Mode 2 ist E √(y , z) = u2 (y ) exp(−i𝛽2 z) mit u2 (y ) = 2∕d sin(2π y ∕d ). Die Intensität ändert sich nicht mit z. (c) Die komplexe Amplitude in einer Mischung der Moden 1 und 2 ist E (y , z) = u1 (y ) exp(−i𝛽1 z) + u2 (y ) exp(−i𝛽2 z). Da 𝛽1 ≠ 𝛽2 ist, ändert sich die Intensitätsverteilung mit z.
267
268
9 Wellenleiteroptik
x
y
n2 2
0 n1 –2
n2
A
Vielfaches von 2π sein, 2π 2d sin 𝜃 − 2𝜑R = 2π 𝑚 , 𝜆
B
θ θ geführter Strahl ungeführter Strahl
𝑚 = 0, 1, 2, …
(9.19)
oder z
θ
C
Abb. 9.11 Ebener dielektrischer Wellenleiter. Strahlen in Winkeln 𝜃 < 𝜃k = cos−1 (n2 ∕n1 ) werden durch Totalreflexion geführt.
Abb. 6.12 und 6.14]. Sie breiten sich in 𝑧-Richtung aus, indem sie ohne Leistungsverluste zwischen den Plattenoberflächen hin und her reflektiert werden. Strahlen in steileren Winkeln werden gebrochen, verlieren bei jeder Reflexion einen Teil ihrer Leistung und verschwinden schließlich. Zur Bestimmung der Wellenleitermoden könnten wir den formellen Weg gehen und die Lösungen der maxwellschen Gleichungen für die inneren und äußeren Medien suchen, die die Randbedingungen erfüllen (siehe Aufgabe 9-6). Wir werden die Lösung aber lieber durch ebene TEM-Wellen ausdrücken, die zwischen den Oberflächen der Platte reflektiert werden. Über die Forderung nach Selbstkonsistenz bestimmen wir die Reflexionswinkel der Wellenleitermoden, aus denen wir die Ausbreitungskonstanten, Feldverteilungen und Gruppengeschwindigkeiten erhalten können. Die Analyse ist der im vorherigen Abschnitt für den Wellenleiter aus ebenen Spiegeln durchgeführten völlig analog.
9.2.1 Wellenleitermoden Wir nehmen an, dass das Feld in der Platte die Form einer monochromatischen ebenen TEM-Welle der Wellenlänge 𝜆 = 𝜆0 ∕𝑛1 hat, die in einem Winkel 𝜃 hin und her reflektiert wird, der kleiner ist als der komplementäre kritische Winkel 𝜃k . Die Welle bewegt sich mit einer Phasengeschwindigkeit 𝑐1 = 𝑐0 ∕𝑛1 , hat eine Wellenzahl 𝑛1 𝑘0 , und ihr Wellenvektor hat die Komponenten 𝑘𝑥 = 0, 𝑘𝑦 = 𝑛1 𝑘0 sin 𝜃 und 𝑘𝑧 = 𝑛1 𝑘0 cos 𝜃. Um die Moden zu bestimmen, fordern wir Selbstkonsistenz, d. h. dass sich die Welle nach jedem Umlauf selbst reproduziert. Nach einem Umlauf hinkt die zweimal reflektierte Welle hinter der ursprünglichen Welle um eine Strecke 𝐴𝐶 − 𝐴𝐵 = 2d sin 𝜃 her, wie Abb. 9.4 zeigt. Außerdem erfährt sie bei jeder Reflexion an der dielektrischen Grenzfläche eine Phasenverschiebung 𝜑R (siehe Abschnitt 6.2). Für Selbstkonsistenz muss die Phasenverschiebung zwischen den beiden Wellen null oder ein
2𝑘𝑦 d − 2𝜑R = 2π 𝑚 .
(9.20)
Der einzige Unterschied zwischen dieser Bedingung und der entsprechenden Bedingung im Spiegelwellenleiter, Gl. (9.1) und Gl. (9.3), ist, dass die Phasenverschiebung π aufgrund der Reflexion an den Spiegeln hier durch die Phasenverschiebung 𝜑R aufgrund der Reflexion an der dielektrischen Grenzfläche ersetzt wird. Die Phasenverschiebung 𝜑R bei der Reflexion ist eine Funktion des Winkels 𝜃 sowie der Polarisation der einfallenden Welle (TE oder TM). Im TE-Fall (elektrisches Feld in 𝑥-Richtung) erhalten wir durch Einsetzen von 𝜃1 = π∕2 − 𝜃 und 𝜃k = π∕2 − 𝜃k in Gl. (6.37) √ √ sin2 𝜃k 𝜑R √ = tan −1, (9.21) 2 2 sin 𝜃 sodass sich 𝜑R von π auf 0 ändert, wenn 𝜃 von 0 bis 𝜃k variiert. Wenn wir Gl. (9.19) in der Form tan(πd sin 𝜃∕𝜆 − 𝑚π∕2) = tan(𝜑R ∕2) schreiben und Gl. (9.21) verwenden, erhalten wir √ √ √ sin2 𝜃k π d tan (π sin 𝜃 − 𝑚 ) = −1. (9.22) 2 2 𝜆 sin 𝜃 Das ist eine transzendentale Gleichung in der Variable sin 𝜃. Ihre Lösungen geben die Reflexionswinkel 𝜃𝑚 der Moden; eine graphische Lösung ist aufschlussreich. Dazu werden die rechte und die linke Seite von Gl. (9.22) wie in Abb. 9.12 als Funktionen von sin 𝜃 aufgetragen. Die Schnittpunkte der Kurven geben dann die Lösungen an. Die rechte Seite, tan(𝜑R ∕2), ist eine monoton fallende Funktion von sin 𝜃, die für sin 𝜃 = sin 𝜃k null erreicht. Die linke Seite erzeugt zwei Familien von Kurven, tan[(πd ∕𝜆) sin 𝜃] für gerade 𝑚 und cot[(πd ∕𝜆) sin 𝜃] für ungerade 𝑚. Die Schnittpunkte liefern die Winkel 𝜃𝑚 der Moden. Die Reflexionswinkel der Moden eines Spiegelwellenleiters mit dem Spiegelabstand d können aus diesem Diagramm erhalten werden, wenn man 𝜑R = π oder äquivalent tan(𝜑R ∕2) = ∞ setzt. Zum Vergleich werden diese Winkel durch offene Kreise gekennzeichnet. Die Winkel 𝜃𝑚 liegen zwischen 0 und 𝜃k . Sie entsprechen Wellenvektoren mit den Komponenten (0, 𝑛1 𝑘0 sin 𝜃𝑚 , 𝑛1 𝑘0 cos 𝜃𝑚 ). Die 𝑧-Komponenten sind die Ausbreitungskonstanten 𝛽𝑚 = 𝑛1 𝑘0 cos 𝜃𝑚 .
(9.23)
9.2 Ebene dielektrische Wellenleiter
Abb. 9.12 Graphische Lösung von Gl. (9.22) zur Bestimmung der Reflexionswinkel 𝜃m der Moden eines ebenen dielektrischen Wellenleiters. Die linke und rechte Seite von Gl. (9.22) sind gegen sin 𝜃 aufgetragen. Die Schnittpunkte, gekennzeichnet durch gefüllte Kreise, liefern sin 𝜃m . Jeder Zweig der Tangens- oder Kotangensfunktion auf der linken Seite entspricht einer Mode. In dieser Auftragung ist sin 𝜃 k = 8(𝜆∕2d ) und die Zahl der Moden ist M = 9. Die offenen Kreise kennzeichnen sin 𝜃m = m𝜆∕2d , woraus sich die Reflexionswinkel der Moden eines Wellenleiters aus ebenen Spiegeln derselben Dimensionen ergeben.
10
rechte linke Seite Seite m=0
0
1
2
3
4
5
6
7
λ 2
0
8
sin θk
ky
ganze Zahl größer als sin 𝜃k ∕(𝜆∕2d ), es gilt also
n1k0
. sin 𝜃k 𝑀= . 𝜆∕2d M
m θk
. 2d NA , 𝑀= 𝜆0
1 θm
0
wobei 0
n2k0
(9.24)
. Das Symbol = soll andeuten, dass sin 𝜃k ∕(𝜆∕2d ) zur nächsten ganzen Zahl aufgerundet werden soll. Wenn beispielsweise sin 𝜃k ∕(𝜆∕2d ) = 0.9, 1 oder 1.1 ist, dann ist 𝑀 = 1, 2 bzw. 2. Einsetzen von cos 𝜃k = 𝑛2 ∕𝑛1 in Gl. (9.24) ergibt
n2k0 n1k0 sin θk
0
sin θ
n1k0
kz = β
Abb. 9.13 Die Reflexionswinkel 𝜃m und die entsprechenden Komponenten kz und ky des Wellenvektors der Wellenleitermoden sind durch Punkte markiert. Die Winkel 𝜃m liegen zwischen 0 und 𝜃 k , und die Ausbreitungskonstanten 𝛽m liegen zwischen n2 k0 und n1 k0 . Diese Ergebnisse sollten mit den in Abb. 9.5 für den Wellenleiter aus ebenen Spiegeln angegebenen vergleichen werden.
Da cos 𝜃𝑚 zwischen 1 und cos 𝜃 k = 𝑛2 ∕𝑛1 liegt, liegt 𝛽𝑚 zwischen 𝑛2 𝑘0 und 𝑛1 𝑘0 , wie Abb. 9.13 illustriert. Die Reflexionswinkel 𝜃𝑚 und die Ausbreitungskonstanten 𝛽𝑚 von TM-Moden können mithilfe derselben Gleichung (9.19) bestimmt werden, indem man für die Phasenverschiebung 𝜑R Gl. (6.39) verwendet. Es ergeben sich ähnliche Resultate. Die Zahl der Moden
Um die Zahl der TE-Moden zu bestimmen, die in einem dielektrischen Wellenleiter erlaubt sind, untersuchen wir das Diagramm in Abb. 9.12. Die Abszisse ist in gleiche Intervalle der Breite 𝜆∕2d geteilt, von denen jedes eine durch einen gefüllten Kreis gekennzeichnete Mode enthält. Das gilt für alle Winkel, für die sin 𝜃 ≤ sin 𝜃k gilt. Die Zahl von TE-Moden ist daher die kleinste
NA =
(9.25)
√ 𝑛12 − 𝑛22
(9.26)
die numerische Apertur des Wellenleiters ist (die NA ist der Sinus des Akzeptanzwinkels für Strahlen aus Luft in die Platte; siehe Übung 1-6). Ein ähnlicher Ausdruck kann für die TM-Moden erhalten werden. Für d ∕𝜆0 = 10 ist beispielsweise 𝑛1 = 1.47 und 𝑛2 = 1.46; damit ergibt sich 𝜃 k = 6.7◦ , NA = 0.171 und 𝑀 = 4 TE-Moden. Für 𝜆∕2d > sin 𝜃k oder (2d ∕𝜆0 ) NA < 1 ist nur eine Mode erlaubt. Der Wellenleiter ist dann ein Einmodenwellenleiter. Diese Bedingung ist erfüllt, wenn die Platte hinreichend dünn oder die Wellenlänge hinreichend groß ist. Im Unterschied zum Spiegelwellenleiter besitzt der dielektrische Wellenleiter keine absolute Grenzwellenlänge (oder Grenzfrequenz). In einem dielektrischen Wellenleiter gibt es mindestens eine TE-Mode, da die Grundmode 𝑚 = 0 stets erlaubt ist. Jede der Moden 𝑚 = 1, 2, … besitzt jedoch ihre eigene Grenzwellenlänge. Als Funktion der Frequenz ist die Bedingung für den Einmodenbetrieb, dass 𝜈 < 𝜈k oder 𝜔 < 𝜔k sein muss, wobei die Grenzfrequenz der Mode 𝜈k = 𝜔k ∕2π =
1 𝑐0 NA 2d
(9.27)
. ist. Die Zahl von Moden ist dann 𝑀 = 𝜈∕𝜈k = 𝜔∕𝜔k , was in Abb. 9.14 graphisch dargestellt ist. 𝑚 nimmt um eins
269
270
9 Wellenleiteroptik
ω
und 𝜆 = 𝜆0 ∕𝑛1 . Interessanterweise verschwindet das Feld an den Plattengrenzflächen nicht, obwohl es harmonisch ist. Wenn 𝑚 zunimmt, nimmt auch sin 𝜃𝑚 zu, sodass sich Moden höherer Ordnung schneller mit 𝑦 ändern.
3ω k 2ω k
Außenfeld
ωk 0
1
0
2 3 4 5 Zahl M der Moden
6
Abb. 9.14 Die Zahl der TE-Moden als Funktion der Frequenz. Diese Darstellung ist mit Abb. 9.7(a) für den Wellenleiter aus ebenen Spiegeln zu vergleichen. Im vorliegenden Fall gibt es kein verbotenes Band.
zu, wenn 𝜔 sich um 𝜔k erhöht. Für die Zahl der TMModen erhält man über eine entsprechende Herleitung identische Ausdrücke. Beispiel 9-1: Moden in einem AlGaAs-Wellenleiter
Ein Wellenleiter besteht aus einer Schicht Al𝑥 Ga1−𝑥 As zwischen zwei Schichten Al𝑦 Ga1−𝑦 As. Die Veränderung der Anteile 𝑥 und 𝑦 von Al in diesen Verbindungen bewirkt eine Veränderung der Brechungsindizes. Wenn 𝑥 und 𝑦 so gewählt werden, dass bei einer Betriebswellenlänge 𝜆0 = 0.9 μm, 𝑛1 = 3.5 und 𝑛1 − 𝑛2 = 0.05 ist, dann gibt es für eine Dicke d = 10 μm des Wellenleiters 𝑀 = 14 TE-Moden. Für d < 0.76 μm ist nur eine einzige Mode erlaubt.
9.2.2 Feldverteilungen Wir wollen nun die Feldverteilungen der TE-Moden bestimmen. Innenfeld
Das Feld innerhalb der Platte setzt sich aus zwei ebenen TEM-Wellen zusammen, die sich mit den Komponenten (0, ±𝑛1 𝑘0 sin 𝜃𝑚 , 𝑛1 𝑘0 cos 𝜃𝑚 ) des Wellenvektors in den Winkeln 𝜃𝑚 und −𝜃𝑚 zur 𝑧-Achse ausbreiten. Sie haben dieselbe Amplitude und Phasenverschiebung 𝑚π im Zentrum der Platte. Die komplexe Amplitude des elektrischen Feldes ist daher 𝐸𝑥 (𝑦, 𝑧) = a𝑚 𝑢𝑚 (𝑦) exp(i𝛽𝑚 𝑧), wobei 𝛽𝑚 = 𝑛1 𝑘0 cos 𝜃𝑚 die Ausbreitungskonstante ist, a𝑚 eine Konstante,
𝑢𝑚 (𝑦) ∝
−
d
2
sin 𝜃𝑚 ⎧ ⎪ cos (2𝜋 𝜆 𝑦) , 𝑚 = 0, 2, 4, … , ⎨ sin 𝜃𝑚 ⎪ sin (2π 𝑦) , 𝜆 ⎩
≤𝑦≤
d
2
,
𝑚 = 1, 3, 5, … , (9.28)
Das Außenfeld muss an allen Punkten 𝑦 = ±d ∕2 der Grenzfläche mit dem inneren Feld identisch sein. Es muss sich daher wie exp(i𝛽𝑚 𝑧) mit 𝑧 ändern. Wenn wir 𝐸𝑥 (𝑦, 𝑧) = a𝑚 𝑢𝑚 (𝑦) exp(i𝛽𝑚 𝑧) in die Helmholtzgleichung (∇2 + 𝑛22 𝑘02 )𝐸𝑥 (𝑦, 𝑧) = 0 einsetzen, erhalten wir 2
d 𝑢𝑚 2 − 𝛾𝑚 𝑢𝑚 = 0 d𝑦 2
(9.29)
2 2 𝛾𝑚 = 𝛽𝑚 − 𝑛22 𝑘02 .
(9.30)
mit Da für geführte Moden 𝛽𝑚 > 𝑛2 𝑘0 ist (siehe Abb. 9.13), ist 2 > 0, sodass Gl. (9.29) durch die Exponentialfunktio𝛾𝑚 nen exp(−𝛾𝑚 𝑦) und exp(𝛾𝑚 𝑦) erfüllt ist. Da das Feld in einiger Entfernung von der Platte abklingen muss, wählen wir exp(−𝛾𝑚 𝑦) im oberen und exp(𝛾𝑚 𝑦) im unteren Medium, 𝑢𝑚 (𝑦) ∝
⎧ exp(−𝛾𝑚 𝑦), 𝑦 > d ∕2 ,
(9.31) ⎨ 𝑦 < −d ∕2 . exp(𝛾𝑚 𝑦), ⎩ Die Abklinggeschwindigkeit 𝛾𝑚 wird als Dämpfungskoeffizient oder Extinktionskoeffizient bezeichnet, und die Welle selbst heißt evaneszente Welle. Wenn wir 𝛽𝑚 = 𝑛1 𝑘0 cos 𝜃𝑚 und cos 𝜃k = 𝑛2 ∕𝑛1 in Gl. (9.30) einsetzen, erhalten wir √ √ cos2 𝜃𝑚 −1. (9.32) 𝛾𝑚 = 𝑛2 𝑘0 √ cos2 𝜃k Wenn die Zahl der Moden 𝑚 zunimmt, nimmt 𝜃𝑚 zu und 𝛾𝑚 ab. Moden höherer Ordnung dringen daher tiefer in die Deckschicht und das Substrat ein. Um die Proportionalitätskonstanten in den Gln. (9.28) und (9.31) zu bestimmen, setzen wir die inneren und äußeren Felder bei 𝑦 = d ∕2 gleich und verwenden die Normierung ∞ 2 ∫ 𝑢𝑚 (𝑦) d𝑦 = 1 .
(9.33)
−∞
Das gibt einen Ausdruck für 𝑢𝑚 (𝑦), der für alle 𝑦 gilt. Diese Funktionen sind in Abb. 9.15 dargestellt. Wie im Spiegelwellenleiter sind alle 𝑢𝑚 (𝑦) orthogonal, d. h. ∞
∫ 𝑢𝑚 (𝑦) 𝑢𝑙 (𝑦) d𝑦 = 0 , −∞
𝑙 ≠𝑚.
(9.34)
9.2 Ebene dielektrische Wellenleiter
y m= 0
1
2
3
Abb. 9.15 Feldverteilungen für geführte TE-Moden in einem dielektrischen Wellenleiter. Diese Ergebnisse sind mit denjenigen zu vergleichen, die in Abb. 9.6 für einen Wellenleiter aus ebenen Spiegeln dargestellt sind.
8
2 0 –
y
z
2
TE
y z
E
Abb. 9.16 TE- und TM-Moden in einem ebenen dielektrischen Schichtwellenleiter.
TM
Ein beliebiges TE-Feld in dem dielektrischen Wellenleiter kann als Superposition dieser Moden geschrieben werden: ∑ 𝐸𝑥 (𝑦, 𝑧) = a𝑚 𝑢𝑚 (𝑦) exp(i𝛽𝑚 𝑧) , (9.35) 𝑚
wobei a𝑚 die Amplitude der Mode 𝑚 ist. Übung 9-3: Einschlussfaktor
Der Leistungseinschlussfaktor ist das Verhältnis der Leistung in der Platte zur Gesamtleistung, d ∕2
𝛤𝑚 =
∫0
∞
2 𝑢𝑚 (𝑦) d𝑦
2 ∫0 𝑢𝑚 (𝑦) d𝑦
z
H
.
(9.36)
Leiten Sie einen Ausdruck für 𝛤𝑚 als Funktion des Winkels 𝜃𝑚 und des Verhältnisses d ∕𝜆 her. Zeigen Sie, dass die Mode niedrigster Ordnung (mit dem kleinsten 𝜃𝑚 ) den höchsten Leistungseinschlussfaktor besitzt. Die Feldverteilungen der TM-Moden können ganz analog bestimmt werden (Abb. 9.16). Da die 𝑧-Komponente des elektrischen Feldes zur Plattengrenzfläche parallel ist, verhält sie sich ähnlich wie die 𝑥-Komponente des elektrischen Feldes einer TE-Mode. Die Analyse beginnt mit der Bestimmung von 𝐸𝑧 (𝑦, 𝑧). Mithilfe der Eigenschaften der TEM-Wellen sind die beiden anderen
Komponenten, 𝐸𝑦 (𝑦, 𝑧) und 𝐻𝑥 (𝑦, 𝑧), leicht zu bestimmen, ebenso wie wir es für den Spiegelwellenleiter getan hatten. Alternativ können die Felder auch aus den maxwellschen Gleichungen bestimmt werden. Die Feldverteilung der TE-Mode niedrigster Ordnung (𝑚 = 0) ähnelt einem Gaußstrahl (siehe Kapitel 3). Allerdings verbreitet sich geführtes Licht während seiner axialen Ausbreitung nicht in transversaler Richtung (siehe Abb. 9.17). In einem Wellenleiter wird die Tendenz des Lichts zur Beugung durch die führende Wirkung des Mediums kompensiert.
9.2.3 Dispersionsrelation und Gruppengeschwindigkeiten Die Dispersionsrelation (𝜔 gegen 𝛽) erhalten wir, indem wir die Selbstkonsistenzgleichung (9.20) durch 𝛽 und 𝜔 ausdrücken. Mit 𝑘𝑦2 = (𝜔∕𝑐1 )2 − 𝛽 2 ergibt Gl. (9.20) √ 2d
(9.37)
Mit cos 𝜃 = 𝛽∕(𝜔∕𝑐1 ) und cos 𝜃k = 𝑛2 ∕𝑛1 = 𝑐1 ∕𝑐2 erhalten wir aus Gl. (9.21) tan2
z
(a)
𝜔2 − 𝛽 2 = 2𝜑R + 2π 𝑚 . 𝑐12
𝛽 2 − 𝜔2 ∕𝑐22 𝜑R = . 2 𝜔2 ∕𝑐12 − 𝛽 2
(9.38)
z
(b)
Abb. 9.17 (a) Gaußstrahl in einem homogenen Medium. (b) Geführte Mode in einem dielektrischen Wellenleiter.
271
272
9 Wellenleiteroptik
ω 4ω k 3ω k
ω m= 3
Lichtlinie ω = c2 β
2ω k
4ω k
2 1
Abb. 9.18 Schematische Darstellung (a) der Dispersionsrelation für die verschiedenen TE-Moden, m = 0, 1, 2, … und (b) der Frequenzabhängigkeit der Gruppengeschwindigkeit, die sich als Ableitung der Dispersionsrelation ergibt, v = d 𝜔∕ d 𝛽 .
m= 3
3ω k
Lichtlinie ω = c 1β
2 2ω k
0
ωk
ωk
1 0
0 0 (a)
0
Ausbreitungskonstante β
(b)
c1 c2 Gruppengeschwindigkeit ʋ
Wir setzen Gl. (9.38) in Gl. (9.37) ein und finden √ 𝛽 2 − 𝜔2 ∕𝑐22 𝜔2 π 2 d 2−𝑚 )= tan ( − 𝛽 . (9.39) 2 2 𝑐2 𝜔2 ∕𝑐2 − 𝛽 2 1
1
Diese Beziehung kann aufgetragen werden, wenn wir sie in die Form √ √ 2 2 𝑛12 − 𝑛22 ⎛ √ 𝜔 2 √ 𝑛 − 𝑛2 ⎞ = √ 𝑚 + tan−1 ⎜ ⎟ (9.40) 𝜔k π 𝑛12 − 𝑛2 𝑛12 − 𝑛2 ⎝ ⎠ mit 𝛽 = 𝑛𝜔∕𝑐0 bringen und durch den in Gl. (9.40) definierten effektiven Brechungsindex 𝑛 ausdrücken, wobei 𝜔k ∕2π = 𝑐0 ∕2d NA die Grenzkreisfrequenz ist. Wie die schematische Auftragung in Abb. 9.18(a) zeigt, liegen die Dispersionsrelationen für die verschiedenen Moden zwischen den Linien 𝜔 = 𝑐2 𝛽 und 𝜔 = 𝑐1 𝛽, den Lichtlinien, die die Ausbreitung in homogenen Medien mit den Brechungsindizes des Umgebungsmediums bzw. der Platte darstellen. Wenn die Frequenz über die Grenzfrequenz der Mode hinaus ansteigt, verschiebt sich die Dispersionsrelation von der Lichtlinie des Umgebungsmediums hin zur Lichtlinie der Platte, d. h. der effektive Brechungsindex 𝑛 steigt von 𝑛2 auf 𝑛1 . Dieser Effekt deutet die stärkere Eingrenzung von Wellen mit kleineren Wellenlängen in dem Medium mit dem höherem Brechungsindex an. Die Gruppengeschwindigkeit erhalten wir aus der Dispersionsrelation, indem wir die Steigung 𝑣 = d𝜔∕ d𝛽 für jede der geführten Moden bestimmen. Die Abhängigkeit der Gruppengeschwindigkeit von der Kreisfrequenz ist in Abb. 9.18(b) schematisch dargestellt. Wenn die Kreisfrequenz über die Grenzkreisfrequenz einer Mode hinaus ansteigt, nimmt die Gruppengeschwindigkeit von ihrem maximalen Wert 𝑐2 aus ab, erreicht einen minimalen Wert etwas unterhalb von 𝑐1 und kehrt dann asymptotisch zu 𝑐1 zurück. Die Gruppengeschwindigkeiten der erlaubten Moden liegen folglich in einem Bereich zwischen 𝑐2 und einem Wert etwas kleiner als 𝑐1.
Bei der Ausbreitung durch einen Vielmodenwellenleiter verbreitern sich optische Pulse im Laufe der Zeit, da die Moden unterschiedliche Geschwindigkeiten besitzen; diesen Effekt nennt man Modendispersion. In einem Einmodenwellenleiter verbreitert sich ein optischer Puls wegen der Frequenzabhängigkeit der Gruppengeschwindigkeit. Dieser Effekt wird Gruppengeschwindigkeitsdispersion (GGD) genannt. Wie in Abschnitt 5.7 gezeigt existiert GGD in homogenen Materialien, weil ihr Brechungsindex frequenzabhängig ist. GGD tritt aber sogar in Wellenleitern ohne Materialdispersion auf. Der Grund ist die Frequenzabhängigkeit der Ausbreitungskoeffizienten, die aus der Abhängigkeit der Welleneingrenzung von der Wellenlänge folgt. Wie Abb. 9.18(b) zeigt, besitzt jede Mode eine besondere Kreisfrequenz, bei der die Gruppengeschwindigkeit nur wenig von der Frequenz abhängt (das Minimum von 𝑣, wo die Ableitung nach 𝜔 null ist). Bei dieser Frequenz ist der GGD-Koeffizient null und die Pulsverbreiterung ist vernachlässigbar. Wir können eine Näherung für die Gruppengeschwindigkeit erhalten, indem wir das totale Differential von Gl. (9.37) nach 𝛽 bilden, 𝜕𝜑R d𝜔 𝜕𝜑R 2d 2𝜔 d𝜔 +2 − 2𝛽) = 2 . ( 2 2𝑘𝑦 𝑐1 d𝛽 𝜕𝜔 d𝛽 𝜕𝛽
(9.41)
Einsetzen von d𝜔∕ d𝛽 = 𝑣, 𝑘𝑦 ∕(𝜔∕𝑐1 ) = sin 𝜃 und 𝑘𝑦 ∕𝛽 = tan 𝜃 und Einführen der neuen Parameter Δ𝑧 =
𝜕𝜑R 𝜕𝛽
und Δ𝜏 = −
𝜕𝜑R 𝜕𝜔
(9.42)
ergibt 𝑣=
d cot 𝜃 + Δ𝑧 . d csc 𝜃∕𝑐1 + Δ𝜏
(9.43)
Wir erinnern uns aus Gl. (9.14) und Abb. 9.8, dass d cot 𝜃 die von dem Strahl zwischen zwei Reflexionen an
9.3 Zweidimensionale Wellenleiter
cs
cθ
z
cot θ
Abb. 9.19 Ein Strahlmodell, das die Phasenverschiebung bei der Reflexion durch eine zusätzliche Entfernung Δz ersetzt, die mit der Geschwindigkeit c1 ∕ cos 𝜃 zurückgelegt wird.
den Grenzflächen in 𝑧-Richtung zurückgelegte Entfernung ist. Die dafür benötigte Zeit ist d csc 𝜃∕𝑐1 . Das Verhältnis d cot 𝜃∕(d csc 𝜃)∕𝑐1 = 𝑐1 cos 𝜃 liefert die Gruppengeschwindigkeit für den Spiegelwellenleiter. Der Ausdruck Gl. (9.43) für die Gruppengeschwindigkeit in einem dielektrischen Wellenleiter zeigt, dass der Strahl eine zusätzliche Entfernung Δ𝑧 = 𝜕𝜑R ∕𝜕𝛽 zurücklegen muss, für die er eine Zeit Δ𝜏 = −𝜕𝜑R ∕𝜕𝜔 benötigt. Wir können uns das als ein Eindringen des Strahls in den Mantel oder als eine seitliche Verschiebung des Strahls vorstellen, wie in Abb. 9.19 dargestellt. Das Eindringen eines Strahls in den Mantel bei innerer Totalreflexion wird als Goos-Hänchen-Effekt bezeichnet (siehe Aufgabe 6-12). Mithilfe von Gl. (9.42) kann gezeigt werden, dass Δ𝑧∕Δ𝜏 = 𝜔∕𝛽 = 𝑐1 ∕ cos 𝜃 ist. Übung 9-4: Der asymmetrische ebene Wellenleiter
Untersuchen Sie das TE-Feld in einem asymmetrischen ebenen Wellenleiter, der aus einer dielektrischen Platte mit der Dicke d und dem Brechungsindex 𝑛1 auf einem Substrat mit dem kleineren Brechungsindex 𝑛2 und und einer Deckschicht mit dem Brechungsindex 𝑛3 < 𝑛2 < 𝑛1 besteht, wie Abb. 9.20 zeigt. (a) Bestimmen Sie Ausdrücke für den maximalen Neigungswinkel 𝜃 ebener Wellen, die Totalreflexion erfahren, sowie die entsprechende numerische Apertur NA des Wellenleiters. (b) Geben Sie einen Ausdruck für die Bedingung der Selbstkonsistenz an, ähnlich Gl. (9.22). (c) Finden Sie einen genäherten Ausdruck für die Zahl 𝑀 der Moden für große 𝑀.
9.3 Zweidimensionale Wellenleiter Der Wellenleiter aus ebenen Spiegeln und der planare dielektrische Wellenleiter, die wir in den letzten beiden Abschnitten untersucht hatten, schließen Licht in einer transversalen Richtung (der 𝑦-Richtung) ein und führen es in 𝑧-Richtung. Zweidimensionale Wellenleiter schließen Licht in beiden transversalen Richtungen (𝑥 und 𝑦) ein. Das Funktionsprinzip und die zugrunde liegende Modenstruktur von zweidimensionalen Wellenleitern sind im Grunde dieselben wie bei ebenen Wellenleitern; nur die mathematische Analyse ist umfangreicher. Dieser Abschnitt gibt eine kurze Beschreibung der Moden in zweidimensionalen Wellenleitern; für Details wird auf die Spezialliteratur verwiesen. Kapitel 10 befasst sich ausführlich mit einem wichtigen Typ von zweidimensionalen Wellenleitern, den in optischen Fasern verwendeten zylindrischen dielektrischen Wellenleitern.
9.3.1 Der rechteckige Spiegelwellenleiter Die einfachste Verallgemeinerung des ebenen Wellenleiters ist der rechteckige Wellenleiter (Abb. 9.21). Wenn die Wände des Wellenleiters Spiegel sind, dann wird Licht wie im planaren Fall durch vielfache Reflexionen in allen möglichen Winkeln geführt. Der Einfachheit halber nehmen wir an, dass der Querschnitt des Wellenleiters ein Quadrat der Kantenlänge d ist. Wenn eine ebene Welle mit dem Wellenvektor (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) und ihre vielfachen Reflexionen innerhalb des Wellenleiters selbstkonsistent existieren sollen, muss sie die Bedingungen 2𝑘𝑥 d = 2π 𝑚𝑥 ,
𝑚𝑥 = 1, 2, …
2𝑘𝑦 d = 2π 𝑚𝑦 ,
𝑚𝑦 = 1, 2, … ,
(9.44)
erfüllen, die offensichtliche Verallgemeinerungen von Gl. (9.3) sind. y
ky nk0
Spiegel
n3 n1
x π/
n2
Abb. 9.20 Asymmetrischer ebener Wellenleiter.
0
0
π/
nk0
kx
Abb. 9.21 Die Moden eines rechteckigen Spiegelwellenleiters sind durch eine endliche Zahl von diskreten Werten kx und ky charakterisiert, die hier durch Punkte dargestellt sind.
273
274
9 Wellenleiteroptik
Die Ausbreitungskonstante 𝛽 = 𝑘𝑧 kann aus 𝑘𝑥 und 𝑘𝑦 bestimmt werden, indem man die Beziehung 𝑘𝑥2 + 𝑘𝑦2 + 𝛽 2 = 𝑛2 𝑘02 ausnutzt. Die drei Komponenten des Wellenvektors nehmen daher diskrete Werte an, was eine endliche Zahl von Moden ergibt. Jede Mode wird durch zwei Indizes 𝑚𝑥 und 𝑚𝑦 (anstelle eines einzigen Index 𝑚) charakterisiert. Alle positiven ganzzahligen Werte 𝑚𝑥 und 𝑚𝑦 sind erlaubt, so lange 𝑘𝑥2 + 𝑘𝑦2 ≤ 𝑛2 𝑘02 ist (siehe Abb. 9.21). Die Zahl 𝑀 der Moden kann leicht bestimmt werden, indem man die Zahl der Punkte innerhalb eines Viertelkreises mit Radius 𝑛𝑘0 in der Auftragung von 𝑘𝑦 gegen 𝑘𝑥 auszählt (Abb. 9.21). Wenn diese Zahl groß ist, kann sie näherungsweise gleich dem Verhältnis der Fläche π(𝑛𝑘0 )2 ∕4 zur Fläche (π∕d )2 einer Elementarzelle gesetzt werden, 2
𝑀≈
π 2d ( ) . 4 𝜆
(9.45)
Da es zwei Polarisationen pro Mode gibt, ist die Gesamtzahl von Moden eigentlich 2𝑀. Durch Vergleich mit der Zahl von Moden 𝑀 ≈ 2d ∕𝜆 in einem eindimensionalen Spiegelwellenleiter sehen wir, dass die Erhöhung der Dimensionalität sich etwa quadratisch auf die Zahl der Moden auswirkt. Die Zahl der Moden ist ein Maß für die Zahl der Freiheitsgrade. Wenn wir eine zweite Dimension hinzufügen, vervielfachen wir die Zahl der Freiheitsgrade. Die zu diesen Moden gehörenden Feldverteilungen sind Verallgemeinerungen derjenigen des planaren Falls. Je nach den Modenindizes 𝑚𝑥 und 𝑚𝑦 ergeben sich Muster wie diejenigen aus Abb. 9.6 für beide transversalen Richtungen (𝑥 und 𝑦).
9.3.2 Der rechteckige dielektrische Wellenleiter Ein dielektrischer Zylinder mit dem Brechungsindex 𝑛1 und einem quadratischen Querschnitt der Seitenlänge d wird in ein Medium mit dem etwas kleineren Brechungsindex 𝑛2 eingebettet. Die Knoten des Wellenleiters können auf ähnliche Weise wie zuvor bestimmt werden. Die Komponenten (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) des Wellenvektors 2
müssen die Bedingung 𝑘𝑥2 + 𝑘𝑦2 ≤ 𝑛12 𝑘02 sin 𝜃k erfüllen, wobei 𝜃k = cos−1 (𝑛2 ∕𝑛1 ) ist, sodass 𝑘𝑥 und 𝑘𝑦 in der in Abb. 9.22 gezeigten Fläche liegen. Die Werte von 𝑘𝑥 und 𝑘𝑦 für die verschiedenen Moden können aus einer Selbstkonsistenzbedingung erhalten werden, die die Phasenverschiebungen an der dielektrischen Grenzfläche mit umfasst, genau wie im planaren Fall. Im Gegensatz zum Spiegelwellenleiter liegen die 𝑘𝑥 und 𝑘𝑦 der Moden nicht in gleichen Abständen. Zwei aufeinander folgende Werte von 𝑘𝑥 (oder 𝑘𝑦 ) haben je-
y
ky n1k0 n2
n1k0 sin θk
n1
π/
0
0
π/
n1k0
x
kx
Abb. 9.22 Schema eines rechteckigen dielektrischen Wellenleiters. Die Werte von kx und ky für die Wellenleitermoden sind durch Punkte gekennzeichnet.
doch im Mittel einen Abstand von π∕d (wie im Spiegelwellenleiter). Die Zahl der Moden ist daher näherungsweise gleich der Zahl von Punkten im inneren Kreis in der Auftragung von 𝑘𝑥 gegen 𝑘𝑦 in Abb. 9.22, wenn wir einen mittleren Abstand der Punkte von π∕d annehmen. Das Ergebnis ist 𝑀 ≈ (π∕4)(𝑛1 𝑘0 sin 𝜃k )2 ∕(π∕d )2 , woraus 2
π 2d ( ) (NA)2 (9.46) 4 𝜆0 √ folgt, wenn NA = 𝑛12 − 𝑛22 die numerische Apertur ist. Die Näherung ist zufriedenstellend, wenn 𝑀 groß ist. Es gibt außerdem noch eine identische Zahl 𝑀 von TMModen. Die Zahl von Moden ist ungefähr gleich dem Quadrat der entsprechenden Zahl für den ebenen dielektrischen Wellenleiter, Gl. (9.25). 𝑀≈
9.3.3
Die Geometrie von Kanalwellenleitern
Praktische Bauformen von Wellenleitern sind beispielsweise versenkte Streifen, eingebettete Streifen, Stege, Rippen oder aufgesetzte Streifen, die in Abb. 9.23 gezeigt sind. Die genaue Analyse einiger dieser Bauformen ist nicht leicht, und meist müssen Näherungen verwendet werden. Für weitere Informationen zu diesem Thema verweisen wir auf die Spezialliteratur. Wellenleiter können in verschiedenen Ausführungen hergestellt werden, wie Abb. 9.24 für die Bauform des eingebetteten Streifens illustriert. S-Biegungen werden verwendet, um die Ausbreitungsachse zu versetzen. Y-Verzweigungen wirken als Strahlteiler oder -kombinierer. Zwei Y-Verzweigungen können verwendet werden, um ein Mach-Zehnder-Interferometer zu erzeugen. Zwei eng benachbarte oder sich kreuzende Wellenleiter können Leistung austauschen und daher als Richtkoppler verwendet werden, wie wir im folgenden Abschnitt sehen werden.
9.3 Zweidimensionale Wellenleiter
versenkter Streifen eingebetteter Streifen
Steg
Rippe
aufgesetzter Streifen
Abb. 9.23 Verschiedene Bauformen von Wellenleitern.
gerade S-Biegung Y-Zweig Mach–Zehnder Richtkoppler
Kreuzung
Abb. 9.24 Verschiedene Ausführungen von Wellenleitern.
9.3.4 Materialien Die ersten optischen Wellenleiter wurden aus elektrooptischen Materialien hergestellt, vor allem aus Ti:LiNbO3 . Ein Wellenleiter in Form eines eingebetteten Streifens wird hergestellt, indem man Titan kontrolliert in ein Lithiumniobatsubstrat diffundieren lässt, um dessen Brechungsindex im Gebiet des Streifens zu vergrößern (Abb. 9.25). Auch Halbleiter werden häufig zu Herstellung von Wellenleitern benutzt. Beispielsweise können Rippenwellenleiter aus GaAs hergestellt werden, auf das eine Schicht aus AlGaAs aufgedampft wird, das einen kleinerem Brechungsindex als GaAs hat. Ein weiteres Halbleitermaterial, das in letzter Zeit an Bedeutung gewonnen hat, ist InP. Sein Brechungsindex lässt sich durch Dotierung mit n- oder p-Halbleitern oder durch Zusatz des quaternären Halbleiters InGaAsP in variablen Mi-
(a)
schungsverhältnissen einstellen. Der in Abb. 9.25 gezeigte Stegwellenleiter bietet hierbei einen besonders starken optischen Einschluss, weil er auf drei Seiten von Materialien mit kleinerem Brechungsindex umgeben ist – Luft auf zwei Seiten und InGaAsP einer anderen Zusammensetzung auf der dritten. Mithilfe von Standard-Ätzverfahren können Wellenleiter auch in Silicium-auf-Isolator-Technik (SOI, für engl. silicon-on-isolator) hergestellt werden; in der Praxis handelt es sich dabei meist um Siliciumauf-Siliciumdioxid-Strukturen (Si–SiO2 ). Da der Brechungsindex von Silicium etwa 3.5 und der von SiO2 kleiner als 1.5 ist, besitzt diese Kombination von Materialien einen großen Unterschied Δ𝑛 der Brechungsindizes. Ein typisches SOI-Bauelement besteht z. B. aus einem Silicium-Rippenwellenleiter (siehe Abb. 9.25) auf einer Schicht von SiO2 als Mantel, die wiederum auf ein Siliciumsubstrat aufgebracht ist. Die Siliciumverar-
Ti
GaAs AlGaAs
InGaAsP InGaAsP
Si Siliciumdioxid
LiNbO3
GaAs-Substrat
InP
Si-Substrat
(b)
( c)
Abb. 9.25 (a) Eingebetteter Streifenwellenleiter auf Ti:LiNbO3 -Basis. (b) Rippenwellenleiter mit Kern aus GaAs, einem unteren Mantel aus AlGaAs und einem GaAs-Substrat. (c) Stegwellenleiter aus InGaAsP umgeben von Luft und ei-
(d)
nem Mantel aus InGaAsP mit kleinerem Brechungsindex. (d) SOI-Rippenwellenleiter mit einem Kern aus Silicium, einem unteren Mantel aus SiO2 und einem Si-Substrat.
275
276
9 Wellenleiteroptik
beitung und -herstellung wurden durch die Mikroelektronikindustrie weit entwickelt, und die Kompatibilität mit der CMOS-Technologie ist ein wichtiger Vorteil. Diese Techniken gehören zum Bereich der Silicumphotonik (Abschnitt 25.1.5). Glaswellenleiter werden durch Ionenaustausch hergestellt. Auch Polymerwellenleiter werden allmählich zu einer praxisrelevanten Technologie. Die Möglichkeit, den Brechungsindex modulieren zu können, ist eine wichtige Voraussetzung für Materialien, die in integrierten photonischen Bauelementen wie Lichtmodulatoren und Schaltern verwendet werden sollen, wie wir in den Kapiteln 21 und 24 sehen werden.
9.4 Optische Kopplung in Wellenleitern 9.4.1 Einkopplung Modenanregung
Wie in den vorherigen Abschnitten gezeigt breitet sich Licht in einem Wellenleiter in Form von Moden aus. Die komplexe Amplitude des optischen Feldes ist allgemein eine Superposition dieser Moden, ∑ a𝑚 𝑢𝑚 (𝑦) exp(−i𝛽𝑚 𝑧) , (9.47) 𝐸(𝑦, 𝑧) = 𝑚
wobei a𝑚 die Amplitude, 𝑢𝑚 (𝑦) die (reell angenommene) transversale Verteilung und 𝛽𝑚 die Ausbreitungskonstante der Mode 𝑚 ist. Die Amplituden der verschiedenen Moden hängen von der Natur der Lichtquelle ab, die zur Anregung des Wellenleiters verwendet wird. Wenn die Verteilung der Quelle völlig identisch mit der einer spezifischen Mode ist, wird nur diese Mode angeregt. Im Allgemeinen regt eine Quelle mit der beliebigen Verteilung 𝑠(𝑦) verschiedene Moden in unterschiedlichem Ausmaß an. Der Anteil der Leistung, der von der Quelle auf die Mode 𝑚 übertragen wird, hängt vom Grad der Ähnlichkeit zwischen 𝑠(𝑦) und 𝑢𝑚 (𝑦) ab. Um das zu begründen, schreiben wir 𝑠(𝑦) als Entwicklung (gewichtete Superposition) der orthogonalen Funktionen 𝑢𝑚 (𝑦), ∑ a𝑚 𝑢𝑚 (𝑦) , (9.48) 𝑠(𝑦) = 𝑚
wobei der Koeffizient a𝑙 die Amplitude der angeregten Mode 𝑙 bezeichnet, ∞
a𝑙 = ∫ 𝑠(𝑦) 𝑢𝑙 (𝑦) d𝑦 .
über 𝑦 integriert und die Orthogonalitätsbeziehung ∞ ∫−∞ 𝑢𝑙 (𝑦) 𝑢𝑚 (𝑦) d𝑦 = 0 für 𝑙 ≠ 𝑚 sowie die Normierungsbedingung verwendet. Der Koeffizient a𝑙 bezeichnet den Grad der Ähnlichkeit (oder Korrelation) zwischen der Quellverteilung 𝑠(𝑦) und der Modenverteilung 𝑢𝑙 (𝑦). Einkoppler
Licht kann in einen Wellenleiter eingekoppelt werden, indem man es direkt auf ein Ende des Wellenleiters fokussiert (Abb. 9.26). Um eine bestimmte Mode anzuregen, muss die transversale Verteilung 𝑠(𝑦) des einfallenden Lichts genau mit der der gewünschten Mode übereinstimmen. Auch die Polarisation des einfallenden Lichts muss zu der der gewünschten Mode passen. Wegen der kleinen Abmessungen der Wellenleiterplatte sind die Fokussierung und die Ausrichtung meist schwierig, was das Einkoppeln nach dieser Methode nicht sehr effizient macht. In einem Vielmodenwellenleiter kann die Effizienz der Kopplung mithilfe eines strahlenoptischen Ansatzes bewertet werden (Abb. 9.27). Die geführten Strahlen innerhalb des Wellenleiters sind auf einen Winkel 𝜃k = cos−1 (𝑛2 ∕𝑛1 ) eingeschränkt. Wegen der Brechung am Eingang zum Wellenleiter entspricht das einem Außenwinkel 𝜃√ A , für den NA = sin 𝜃A = 𝑛1 sin 𝜃 k = √ 𝑛1 1 − (𝑛2 ∕𝑛1 )2 = 𝑛12 − 𝑛22 gilt, wobei NA die numerische Apertur des Wellenleiters ist (siehe Übung 1-6). Für einen maximalen Wirkungsgrad der Kopplung sollte das einfallende Licht innerhalb des Winkels 𝜃A einfallen. Aus einer Halbleiterquelle (einer LED oder Laserdiode) kann Licht in einen Wellenleiter eingekoppelt werden, indem man einfach die Enden der Quelle und des Wellenleiters aufeinander ausrichtet und dabei einen kleinen Zwischenraum lässt, der so gewählt wird, dass die Kopplung maximal wird (Abb. 9.28). In einer LED Linse
y n2 n1
z
s(y)
um(y)
Abb. 9.26 Einkopplung eines optischen Strahls in einen optischen Wellenleiter.
θA
θk
n2 n1
(9.49)
−∞
Dieser Ausdruck kann hergeleitet werden, indem man beide Seiten von Gl. (9.48) mit 𝑢𝑙 (𝑦) multipliziert,
Abb. 9.27 Einkoppeln von Strahlen in einen Vielmodenwellenleiter durch Fokussierung.
9.4 Optische Kopplung in Wellenleitern
Wellenleiter lichtemittierende Region LED oder Laserdiode
Abb. 9.28 Einkoppeln von Licht aus einer LED oder Laserdiode in einen Wellenleiter.
entsteht Licht im Gebiet eines Halbleiterübergangs und wird von dort in alle Richtungen emittiert. In einer Laserdiode wird das emittierte Licht in einem integrierten Wellenleiter eingeschlossen (LED und Laserdioden werden in Kapitel 18 beschrieben). Andere Methoden zur Einkopplung von Licht in Wellenleiter verwenden Prismen, Beugungsgitter oder andere Wellenleiter, wie wir im Folgenden näher betrachten werden. Prismen- und Gitter-Seitenkoppler
Kann optische Leistung in eine geführte Mode eines Wellenleiters eingekoppelt werden, indem man eine Welle wie in Abb. 9.29(a) von der Seite in einem Winkel 𝜃e in den Mantel eintreten lässt? Die Bedingung für eine solche Kopplung ist, dass die axiale Komponente des Wellenvektors der einfallenden Welle, 𝑛2 𝑘0 cos 𝜃e , gleich der Ausbreitungskonstante 𝛽𝑚 der geführten Mode ist. Da 𝛽𝑚 > 𝑛2 𝑘0 ist (siehe Abb. 9.29), ist es nicht möglich, die erforderliche Phasengleichheit 𝛽𝑚 = 𝑛2 𝑘0 cos 𝜃e zu erreichen. Die axiale Komponente des Wellenvektors der einfallenden Welle ist dafür zu klein. Die Aufgabe kann jedoch durch Verwendung eines Prismas oder eines Gitters erleichtert werden. Wie Abb. 9.29(b) zeigt, wird dazu ein Prisma mit dem Brechungsindex 𝑛P > 𝑛2 in einer kurzen Entfernung d P von der Wellenleiterplatte aufgestellt. Die einfallende Welle wird in das Prisma gebrochen, wo sie Totalreflexion in einem Winkel 𝜃P erfährt. Die einfallenden und reflektierten Wellen bilden eine Welle, die sich in 𝑧-Richtung mit der Ausbreitungskonstante 𝛽P = 𝑛P 𝑘0 cos 𝜃P ausbreitet. Die transversale Feldverteilung erstreckt sich als evaneszente, exponentiell abklingende Welle bis in den Raum zwischen Prisma und Platte. Wenn die Entfernung d P hinreichend klein ist, regt
die Welle eine Mode des Wellenleiters mit einer passenden Ausbreitungskonstante 𝛽𝑚 ≈ 𝛽P = 𝑛P 𝑘0 cos 𝜃P an. Da 𝑛P > 𝑛2 ist, sind nun identische Phasen möglich, und wenn die Entfernung für die Wechselwirkung passend gewählt ist, tritt frustrierte Totalreflexion auf und es kann ein bedeutender Teil der Leistung in den Wellenleiter eingekoppelt werden. Die Funktionsweise kann auch umgekehrt werden, um Leistung auszukoppeln und Licht aus dem Wellenleiter ins Vakuum hinaustreten zu lassen. Dieser Ansatz entspricht exakt dem zur Anregung einer OPP-Welle an der Grenzfläche zwischen einem Metall und einem Dielektrikum, wie Abb. 8.16 zeigt. Das Gitter [Abb. 9.29(c)] löst das Problem der Phasenbedingung, indem es den Wellenvektor der eintreffenden Welle modifiziert. Ein Gitter mit der Periode 𝛬 moduliert die eintreffende Welle mit Phasenfaktoren 2π 𝑞∕𝜆𝑧 mit 𝑞 = ±1, ±2, … Diese sind äquivalent zu Änderungen der axialen Komponente des Wellenvektors um die Faktoren 2π 𝑞∕𝜆. Die Bedingung gleicher Phase kann jetzt erfüllt werden, wenn 𝑛2 𝑘0 cos 𝜃e + 2π 𝑞∕𝜆 = 𝛽𝑚 ist, z. B. mit 𝑞 = 1. Das Gitter kann sogar so konzipiert werden, dass die Komponente 𝑞 = 1 gezielt verstärkt wird.
9.4.2 Gekoppelte Wellenleiter Wenn zwei Wellenleiter so dicht nebeneinander liegen, dass ihre Felder überlappen, kann Licht von einem in den anderen eingekoppelt werden. Dabei kann optische Leistung zwischen den Wellenleitern übertragen werden, ein Effekt, der verwendet werden kann, um optische Koppler und Schalter herzustellen. Wir besprechen hier nur das Funktionsprinzip der Kopplung von Wellenleitern; Koppler und Schalter werden in den Kapiteln 24 und 25 besprochen. Wir betrachten zwei parallele ebene Wellenleiter aus zwei Platten der Dicke d im Abstand 2𝑎 mit den Brechungsindizes 𝑛1 und 𝑛2 , die in ein Medium mit dem Brechungsindex 𝑛 eingebettet sind, wobei 𝑛 etwas kleiner ist als 𝑛1 und 𝑛2 (Abb. 9.30). Wir nehmen an, dass beide Wellenleiter Einmodenwellenleiter sind. Der Abstand der Wellenleiter ist so gewählt, dass das optische Abb. 9.29 Prisma- und GitterSeitenkopplung.
Prisma einfallende Welle
einfallende Welle n2
θe
n1 (a)
n2
nP θP
P
βm (b) Prismenkoppler
einfallende Welle Gitter θe βm (c) Gitterkoppler
277
278
9 Wellenleiteroptik
y n n1 n n2
2a
gen, die die Variation der Amplituden a1 (𝑧) und a2 (𝑧) beschreiben. Es kann gezeigt werden (siehe die Herleitung am Ende dieses Abschnitts), dass die Amplituden a1 (𝑧) und a2 (𝑧) durch zwei gekoppelte Differentialgleichungen erster Ordnung beschrieben werden,
z
n
L0
Abb. 9.30 Kopplung zwischen zwei parallelen ebenen Wellenleitern. Bei z = 0 befindet sich das Licht hauptsächlich im Wellenleiter 1, bei z = L0 ∕2 ist es gleichmäßig über die beiden Wellenleiter verteilt und bei z = L0 ist das Licht überwiegend im Wellenleiter 2. Die Strecke L0 , entlang derer die komplette Leistung aus dem einem Wellenleiter aus- und in den anderen eingekoppelt wird, heißt Kopplungslänge.
Feld außerhalb der Platte des einen Wellenleiters (ohne den zweiten) etwas mit der Platte des anderen überlappt. Der formale Ansatz für die Beschreibung der Lichtausbreitung in dieser Struktur besteht darin, die maxwellschen Gleichungen für die verschiedenen Gebiete zu formulieren und die Randbedingungen anzuwenden, um die Moden des Gesamtsystems zu bestimmen. Diese Moden unterscheiden sich von denjenigen der einzelnen, isolierten Wellenleiter. Die genaue Analyse ist nicht einfach und übersteigt den Rahmen dieses Buches. Für schwache Kopplung reicht jedoch häufig eine vereinfachte genäherte Theorie, die als Theorie der gekoppelten Moden bezeichnet wird. Die Theorie der gekoppelten Moden geht davon aus, dass die Mode jedes Wellenleiters bestimmt wird, als ob der andere Wellenleiter abwesend sei. In Gegenwart beider Wellenleiter nimmt man die Moden näherungsweise als unverändert an, z. B. 𝑢1 (𝑦) exp(−i𝛽1 𝑧) und 𝑢2 (𝑦) exp(−i𝛽2 𝑧). Es wird angenommen, dass die Kopplung nur die Amplituden der Moden modifiziert, ohne ihre transversalen Raumverteilungen oder ihre Ausbreitungskonstanten zu beeinflussen. Die Amplituden der Moden von Wellenleiter 1 und 2 sind daher Funktionen von 𝑧, a1 (𝑧), und a2 (𝑧). Die Theorie versucht, a1 (𝑧) und a2 (𝑧) unter passenden Randbedingungen zu bestimmen. Kopplung kann als Streuerscheinung aufgefasst werden. Das Feld des Wellenleiters 1 wird durch Wellenleiter 2 gestreut und erzeugt so eine Lichtquelle, die die Amplitude des Feldes in Wellenleiter 2 verändert. Das Feld von Wellenleiter 2 hat denselben Effekt auf Wellenleiter 1. Eine Analyse dieser gegenseitigen Wechselwirkung führt auf zwei gekoppelte Differentialgleichun-
da1 = −i𝒞21 exp(iΔ𝛽𝑧)a2 (𝑧) , d𝑧 da2 = −i𝒞12 exp(−iΔ𝛽𝑧)a1 (𝑧) , d𝑧
(9.50a) (9.50b)
wobei Δ𝛽 = 𝛽1 − 𝛽2
(9.51)
die Phasendifferenz pro Längeneinheit ist und
𝒞21 =
𝒞12 =
1
(
2
1
(
2
𝑛22
−𝑛
2
𝑛12 − 𝑛2
) 𝑘02 𝛽1 )
𝑎+d
∫ 𝑢1 (𝑦) 𝑢2 (𝑦) d𝑦 , 𝑎
𝛽2
(9.52)
−𝑎
𝑘02
∫ 𝑢2 (𝑦) 𝑢1 (𝑦) d𝑦 −𝑎−d
Kopplungskoeffizienten sind. Wir sehen aus Gl. (9.50), dass die Variation von a1 proportional zu a2 ist und umgekehrt. Die Proportionalitätskonstante ist das Produkt des Kopplungskoeffizienten und des Phasenfaktors exp(iΔ𝛽𝑧). Um die Gln. (9.50) der gekoppelten Moden zu lösen, gehen wir von harmonischen Probefunktionen der Form a1 (𝑧) = b1 exp(i𝛾𝑧) exp(iΔ𝛽𝑧∕2) und a2 (𝑧) = b2 exp(i𝛾𝑧) exp(−iΔ𝛽𝑧∕2) mit zwei Konstanten b1 und b2 aus. Diese Lösungen erfüllen Gl. (9.50), sofern die folgende Bedingung erfüllt ist: √ 𝛾=±
2
(
Δ𝛽 ) + 𝒞2 , 2
𝒞=
√
𝒞12 𝒞21 .
(9.53)
Da 𝛾 zwei mögliche Werte annehmen kann, ändern wir die Probefunktionen in Superpositionen von exp(i𝛾𝑧) und exp(−i𝛾𝑧) bzw. von sin(𝛾𝑧) und cos(𝛾𝑧), wobei 𝛾 nun der positive Wert der Quadratwurzel aus Gl. (9.53) ist. Die Gewichte der Superposition erhalten wir aus den Grenzwerten a1 (0) und a2 (0). Das Ergebnis ist schließlich a1 (𝑧) = A(𝑧)a1 (0) + B(𝑧)a2 (0) ,
(9.54a)
a2 (𝑧) = C (𝑧)a1 (0) + D(𝑧)a2 (0) ,
(9.54b)
9.4 Optische Kopplung in Wellenleitern 1(0)
1(0)
Wellenleiter 1
Abb. 9.31 Periodischer Austausch von Leistung zwischen den Wellenleitern 1 und 2: (a) Phasen nicht identisch; (b) Phasen identisch.
Wellenleiter 1 Wellenleiter 2
Wellenleiter 2 1(0)
1(z)
L0
1(0)
1(z)
2(z)
2(z)
0 0
z
0 0
L0
(a)
z (b)
an. Die Gln. (9.56) vereinfachen dann zu
wobei ∗
A(𝑧) = D (𝑧) = exp (
Δ𝛽 iΔ𝛽𝑧 ) (cos 𝛾𝑧 − i sin 𝛾𝑧) , 2 2𝛾 (9.55a)
Δ𝛽𝑧 𝒞21 exp (i ) sin 𝛾𝑧 , 2 i𝛾 Δ𝛽𝑧 𝒞12 ) sin 𝛾𝑧 C (𝑧) = exp (−i 2 i𝛾 B(𝑧) =
(9.55b) (9.55c)
Elemente einer Transmissionsmatrix T sind, die die Felder am Ende mit denen zu Beginn verknüpft. Wenn wir annehmen, dass kein Licht in Wellenleiter 2 eintritt, sodass a2 (0) = 0 ist, sind die optischen Leistungen P1 (𝑧) ∝ |a1 (𝑧)|2 und P 2 (𝑧) ∝ |a2 (𝑧)|2 gleich 2
P 1 (𝑧) = P1 (0) [cos2 𝛾𝑧 + ( P 2 (𝑧) = P1 (0)
Δ𝛽 2 ) sin 𝛾𝑧] , 2𝛾
|𝒞21 | 2 sin 𝛾𝑧 . 𝛾2
(9.56a)
2
(9.56b)
Folglich wird Leistung mit einer Periode π∕𝛾 periodisch zwischen den beiden Wellenleitern ausgetauscht, wie Abb. 9.31(a) illustriert. Wenn die Wellenleiter identisch sind, d. h. 𝑛1 = 𝑛2 , 𝛽1 = 𝛽2 und Δ𝛽 = 0, nennt man die beiden geführten Wellen phasengleich. In diesem Fall ist 𝛾 = 𝒞, 𝒞12 = 𝒞21 = 𝒞, und die Transmissionsmatrix nimmt die einfachere Form ⎡A(𝑧) T=⎢ C (𝑧) ⎣
B(𝑧) ⎤
⎡ cos 𝒞𝑧 ⎥=⎢ D(𝑧) −i sin 𝒞𝑧 ⎦ ⎣
−i sin 𝒞𝑧⎤ ⎥ (9.57) cos 𝒞𝑧 ⎦
P 1 (𝑧) = P1 (0) cos2 𝒞𝑧 , 2
P 2 (𝑧) = P1 (0) sin 𝒞𝑧 .
Schaltung durch Kontrolle der Phasenfehlanpassung
Ein Koppler mit fester Länge, z. B. 𝐿0 = π∕2𝒞, ändert sein Leistungstransferverhältnis, wenn eine kleine Phasenfehlanpassung Δ𝛽 eingeführt wird. Mithilfe der Gln. (9.56b) und (9.53) kann das Leistungstransferverhältnis 𝒯 = P2 (𝐿0 )∕p1 (0) als Funktion von Δ𝛽 geschrieben werden, √ 2 ⎡ 2 Δ𝛽𝐿0 ⎤ π 2 1 𝒯= sinc ⎢ )⎥, 1+( (9.59) ⎢2 ⎥ 4 π ⎣ ⎦ mit sinc(𝑥) = sin(π𝑥)∕(π𝑥). Abbildung 9.33 stellt die Abhängigkeit des Leistungstransferverhältnisses 𝒯 von dem Fehlanpassungsparameter Δ𝛽𝐿0 graphisch dar. Das Verhältnis erreicht bei Δ𝛽 𝐿0 = 0 einen Maximalwert von Abb. 9.32 Optische Kopplung: (a) Übertragung von Leistung aus einem Wellenleiter in einen anderen; (b) 3-dB-Kopplung. /2
(a)
(b)
(9.58b)
Der Austausch von Leistung zwischen den Wellenleitern kann dann vollständig sein, wie Abb. 9.31(b) zeigt. Wir haben damit ein Bauelement, das einen beliebigen Anteil der optischen Leistung von einem Wellenleiter in einen anderen einkoppeln kann. Nach einer Distanz 𝑧 = 𝐿0 = π∕2𝒞, der Kopplungslänge, ist die komplette Leistung von Wellenleiter 1 in den Wellenleiter 2 [Abb. 9.32(a)] übertragen. Über eine Distanz 𝐿0 ∕2 wird die Hälfte der Leistung übertragen, sodass das Bauelement als 3-dB-Koppler wirkt, d. h. als 50:50-Strahlteiler [Abb. 9.32(b)].
L0/2
L0
(9.58a)
/2
279
9 Wellenleiteroptik
1 Transmissionsgrad
280
0
0
√3π Phasenfehlanpassung ΔβL 0
Abb. 9.33 Abhängigkeit des Leistungstransferverhältnisses 𝒯 = P2 (L0 )∕p1 (0) von dem Fehlanpassungsparameter Δ𝛽 L0 . Die Länge des Wellenleiters wird so gewählt, dass für Δ𝛽 = 0 (identische Phasen) die maximale Leistung an Wellenleiter 2 übertragen wird, d. h. 𝒯 = 1 ist.
eins, nimmt mit steigendem Wert von Δ𝛽𝐿0 ab und ver√ schwindet für Δ𝛽𝐿0 = 3π. Die Abhängigkeit der übertragenen Leistung von der Phasenfehlanpassung kann zur Herstellung von elektrisch geschalteten Richtkopplern ausgenutzt werden. √ Wenn die Fehlanpassung Δ𝛽𝐿0 zwischen 0 und 3π variiert wird, wird das Licht von Wellenleiter 2 zu Wellenleiter 1 umgeschaltet. Eine elektrische Kontrolle von Δ𝛽 ist möglich, wenn das Material der Wellenleiter elektrooptisch ist (d. h. wenn ihr Brechungsindex durch Anlegen eines elektrischen Feldes verändert werden kann). Solche Bauelemente werden in den Abschnitten 21.1.4 und 24.4.2 im Zusammenhang mit elektrooptischen Schaltern untersucht.
Herleitung: Die gekoppelten Wellengleichungen Wir wollen nun die Differentialgleichungen (9.50) herleiten, die die Amplituden a1 (𝑧) und a2 (𝑧) der gekoppelten Moden beschreiben. Wenn die beiden Wellenleiter nicht wechselwirken, haben die komplexen Amplituden ihrer optischen Felder die Form 𝐸1 (𝑦, 𝑧) = a1 𝑢1 (𝑦) exp(−i𝛽1 𝑧) ,
(9.60a)
𝐸2 (𝑦, 𝑧) = a2 𝑢2 (𝑦) exp(−i𝛽2 𝑧) .
(9.60b)
Die Amplituden a1 und a2 sind dann konstant. In Anwesenheit der Kopplung nehmen wir an, dass die Amplituden a1 und a2 Funktionen von 𝑧 sind, dass aber die transversalen Funktionen 𝑢1 (𝑦) und 𝑢2 (𝑦) und die Ausbreitungskonstanten 𝛽1 und 𝛽2 nicht verändert werden. Wir nehmen an, dass die Amplituden a1 und a2 auf einer Entfernung 𝛽 −1 (des Kehrwerts der Ausbreitungskonstanten 𝛽1 oder 𝛽2 ), die von der Größenordnung der Wellenlänge des Lichts ist, langsam mit 𝑧 variieren. Wir betrachten die Anwesenheit von Wellenleiter 2 als Störung des Mediums um Wellenleiter 1 in Form
einer Platte mit dem Brechungsindex 𝑛2 − 𝑛 und der Dicke d in einem Abstand 2𝑎. Der Überschussbrechungsindex (𝑛2 − 𝑛) und das Feld 𝐸2 entsprechen einer Überschusspolarisation 𝑃 = (𝜀2 − 𝜀)𝐸2 = 𝜀0 (𝑛22 − 𝑛2 )𝐸2 , die eine optische Strahlungsquelle erzeugt, die in Wellenleiter 1 hinein strahlt [siehe Gl. (5.40)], 𝒮1 = −𝜇0 𝜕 2 𝒫∕𝜕𝑡2 mit der komplexen Amplitude ( ( ) ) 𝑆1 = 𝜇0 𝜔2 𝑃 = 𝜇0 𝜔2 𝜀0 𝑛22 − 𝑛2 𝐸2 = 𝑛22 − 𝑛2 𝑘02 𝐸2 ( ) = 𝑘22 − 𝑘2 𝐸2 . (9.61) Hier sind 𝜀2 und 𝜀 die zu den Brechungsindizes 𝑛2 und 𝑛 gehörenden elektrischen Permittivitäten und 𝑘2 = 𝑛2 𝑘0 . Diese Quelle existiert nur in der Platte von Wellenleiter 2. Um die Wirkung einer solchen Quelle auf das Feld in Wellenleiter 1 zu bestimmen, schreiben wir die Helmholtzgleichung in Gegenwart einer Quelle als ( ) ∇2 𝐸1 + 𝑘12 𝐸1 = −𝑆1 = − 𝑘22 − 𝑘2 𝐸2 .
(9.62a)
Entsprechend schreiben wir die Helmholtzgleichung für die Welle in Wellenleiter 2 mit einer Quelle, die aufgrund des Feldes in Wellenleiter 1 existiert, als ( ) ∇2 𝐸2 + 𝑘22 𝐸2 = −𝑆2 = − 𝑘12 − 𝑘2 𝐸1
(9.62b)
mit 𝑘1 = 𝑛1 𝑘0 . Die Gln. (9.62) sind zwei gekoppelte partielle Differentialgleichungen, die wir lösen müssen, um 𝐸1 und 𝐸2 zu erhalten. Diese Art der Störungsrechnung ist nur für schwach gekoppelte Wellenleiter gültig. Wir schreiben jetzt 𝐸1 (𝑦, 𝑧) = a1 (𝑧) 𝑒1 (𝑦, 𝑧) und 𝐸2 (𝑦, 𝑧) = a2 (𝑧) 𝑒2 (𝑦, 𝑧) mit 𝑒1 (𝑦, 𝑧) = 𝑢1 (𝑦) exp(−i𝛽1 𝑧) und 𝑒2 (𝑦, 𝑧) = 𝑢2 (𝑦) exp(−i𝛽2 𝑧) und beachten, dass 𝑒1 und 𝑒2 die Helmholtzgleichungen erfüllen müssen, ∇2 𝑒1 + 𝑘12 𝑒1 = 0 , ∇ 𝑒2 + 2
𝑘22 𝑒2
=0,
(9.63a) (9.63b)
wobei für Punkte innerhalb der Platten der Wellenleiter 1 und 2 𝑘1 = 𝑛1 𝑘0 und 𝑘2 = 𝑛2 𝑘0 gilt und ansonsten 𝑘1 = 𝑘2 = 𝑛𝑘0 . Nun setzen wir 𝐸1 = a1 𝑒1 in Gl. (9.62a) ein und erhalten so 2
) ( da1 d𝑒1 d a1 𝑒1 = 2 = − 𝑘22 − 𝑘2 a2 𝑒2 . 2 d𝑧 d𝑧 d𝑧
(9.64)
Da a1 langsam mit 𝑧 variiert, 𝑒1 dagegen schnell, vernachlässigen wir den ersten Term von Gl. (9.64) gegen den zweiten. Das Verhältnis zwischen diesen Termen ist [(d𝛹∕ d𝑧)𝑒1 ]∕[2𝛹 d𝑒1 ∕ d𝑧] = [(d𝛹∕ d𝑧)𝑒1 ]∕[2𝛹(−i𝛽1 𝑒1 )] = i(d𝛹∕𝛹)∕2𝛽1 d𝑧 mit 𝛹 = da1 ∕ d𝑧. Diese Näherung gilt für d𝛹∕𝛹 ≪ 𝛽1 d𝑧,
9.4 Optische Kopplung in Wellenleitern
d. h. wenn die Variation von a1 (𝑧) über eine Entfernung 𝛽1−1 langsam ist. Als Nächstes setzen wir 𝑒1 = 𝑢1 exp(−i𝛽1 𝑧) und 𝑒2 = 𝑢2 exp(−i𝛽2 𝑧) in Gl. (9.64) ein. Vernachlässigen des ersten Terms ergibt 2
( ) da1 (−i𝛽1 ) 𝑢1 (𝑦)e−i𝛽1 𝑧 = − 𝑘22 − 𝑘2 a2 𝑢2 (𝑦)e−i𝛽2 𝑧 . d𝑧 (9.65)
Wir multiplizieren beide Seiten von Gl. (9.65) mit 𝑢1 (𝑦), integrieren über 𝑦 und verwenden die Tatsache, dass 𝑢12 (𝑦) so normiert ist, dass sein Integral eins ist; damit erhalten wir schließlich da1 −i𝛽1 𝑧 = −ic21 a2 (𝑧)e−i𝛽2 𝑧 , e d𝑧
(9.66)
wobei 𝒞21 durch Gl. (9.52) gegeben ist. Eine ähnliche Gleichung erhalten wir, wenn wir das Verfahren für Wellenleiter 2 wiederholen. Diese Gleichungen liefern die gekoppelten Differentialgleichungen (9.50).
9.4.3 Wellenleiterarrays Die beschriebene Analyse der Lichtausbreitung in zwei gekoppelten parallelen ebenen Wellenleitern kann im Prinzip auf die Lichtausbreitung in Wellenleiterarrays erweitert werden. Dazu betrachten wir eine Anordnung von 𝑁 identischen parallelen Plattenwellenleitern in gleichen Abständen voneinander und nehmen an, dass die Kopplung so schwach ist, dass nur die Kopplung zwischen direkten Nachbarn von Bedeutung ist. Wenn a𝑛 (𝑧) die komplexe Amplitude des Lichts im 𝑛-ten Wellenleiter ist, können wir das System aus 𝑁 Gleichungen für die gekoppelten Moden wie folgt schreiben: da𝑛 = −i𝒞(a𝑛+1 + a𝑛−1 ) , d𝑧
𝑛 = 1, 2, … , , 𝑁 , (9.67)
trix H bestimmt. Diese 𝑁 × 𝑁-Matrix hat 𝑁 Eigenwerte 𝜆𝑟 und entsprechende Eigenvektoren b𝑟 mit den Elementen {b𝑟𝑛 } gemäß √ 2 𝑟π 𝑟π𝑛 𝜆𝑟 = 2𝒞 cos ( ) , b𝑟𝑛 = sin ( ), 𝑁+1 𝑁+1 𝑁+1 𝑟 = 1, 2, … , 𝑁 .
(9.68)
Die damit verwandte Transmissionsmatrix T = exp(−i 𝑧H) hat die Eigenwerte exp(−i𝜆𝑟 𝑧) und die gleichen Eigenvektoren b𝑟 , die 𝑁 Moden entsprechen. Wenn die anfänglichen Amplituden {a𝑛 (0)} gleich den Amplituden {b𝑟𝑛 } der 𝑟-ten Mode sind, entwickeln sie sich gemäß der einfachen Beziehung a𝑛 (𝑧) = a𝑛 (0) exp(−i𝜆𝑟 𝑧), unabhängig von den anderen Moden. Die zugehörigen optischen Felder breiten sich dann mit einer einzigen Ausbreitungskonstante 𝛽𝑟 = 𝛽0 + 𝜆𝑟 aus, wobei 𝛽0 die Ausbreitungskonstante in einem isolierten Wellenleiter ist. Wegen −2𝒞 ≤ 𝜆𝑟 ≤ 2𝒞 liegen alle Ausbreitungskonstanten der Moden in dem Bereich 𝛽0 − 2𝒞 ≤ 𝛽𝑟 ≤ 𝛽0 + 2𝒞. Eine beliebige Eingangsverteilung {a𝑛 (0)} in das Wellenleiterarray kann stets als Superposition a𝑛 (0) = ∑𝑁 𝑤 b seiner Moden ausgedrückt werden, wobei 𝑟 = 1 𝑟 𝑟𝑛 ∑𝑁 𝑤𝑟 = 𝑛 = 1 a𝑛 (0)b𝑟𝑛 die Gewichte der Superposition sind. Die Amplituden an der Position 𝑧 sind dann a𝑛 (𝑧)
𝑁 ∑ 𝑟=1
𝑤𝑟 b𝑟𝑛 e−i𝜆𝑟 𝑧 .
(9.69)
Die Modenanalyse ermöglicht es uns, a(𝑧) für ein beliebiges a𝑛 (0) zu bestimmen. Beispiel 9-2: Die Supermoden zweier gekoppelter Wellenleiter
Für ein Array (𝑁 = [ aus [ ] zwei gekoppelten Wellenleitern ] 𝒞𝑧 −i sin 𝒞𝑧 2) gilt H = 𝒞0 𝒞0 und T = exp(i𝑧H) = −icos . sin 𝒞𝑧 cos 𝒞𝑧 Die Eigenwerte der beiden Moden sind 𝜆𝑟 = ±𝒞 und die entsprechenden Ausbreitungskonstanten sind 1 [ ] 1 [ 1 ] 𝛽0 ± 𝒞. Die Eigenvektoren sind √ 11 und √ −1 , 2
wobei 𝒞 der Kopplungskoeffizient ist und a0 = a𝑁+1 = 0 gilt. Wenn wir die Amplituden durch einen Vektor a der Dimension 𝑁 mit den Elementen {a𝑛 } darstellen, können wir Gl. (9.67) in Matrixform als d a∕ d𝑧 = −iHa schreiben, wobei H eine 𝑁 × 𝑁-Matrix ist, deren Elemente 𝐻𝑛𝑚 = 𝒞 für 𝑚 = 𝑛 ± 1 und ansonsten null sind. Die Lösung dieser Gleichung ist a(𝑧) = Ta(0), wobei T = exp(−i𝑧H) die Transmissionsmatrix ist. Der Durchgang von Licht durch ein solches Array lässt sich am besten anhand von Moden beschreiben (siehe Anhang C). Die als Supermoden bezeichneten Moden des Wellenleiterarrays müssen von den Moden einzelner isolierter Wellenleiter unterschieden werden. Die Supermoden werden durch Diagonalisieren der Ma-
2
was einer symmetrischen oder antisymmetrischen Anregung der beiden Wellenleiter entspricht. Ein eintretendes Feld in einem der Wellenleiter, z. B. a(0) = [1] 1 [1] 1 [ 1 ] = 1 + −1 regt beide Supermoden an, die un0 2 2 terschiedliche Ausbreitungskonstanten besitzen; das Ergebnis ist ein Austausch von Leistung zwischen den beiden Wellenleitern. Periodische Wellenleiter
Für große 𝑁 können wir das Wellenleiterarray als periodisches Medium auffassen und die in Abschnitt 7.2 beschriebene Analyse anwenden. Insbesondere ist es aufschlussreich, das Dispersionsdiagramm für die Lichtausbreitung in einem dielektrischen Plattenwellenleiter
281
282
9 Wellenleiteroptik
n2
n1
n2
Λ
z
z
z
ω
ω
ω ω = c2β
ω = c2β
2
ω = c2β
2 2ω B
2ωk
1
1
2ωk
0
ωk
0
0 (a)
0 ωB ωk
ω = c1β
β
ω = c1β
ω = c1β
0
β
0 (b)
0
0 (c)
β
g
Abb. 9.34 Dispersionsdiagramm (a) eines Schichtwellenleiters mit der Grenzkreisfrequenz 𝜔k = (π∕d )(c0 ∕ NA) und (b) eines periodischen Wellenleiters mit der Bragg-Kreisfrequenz 𝜔ℬ = (π∕𝜆)(c0 ∕n̄ ).
mit dem eines periodischen Mediums aus einer unendlichen Zahl solcher Wellenleiter zu vergleichen. Die entsprechenden Diagramme sind in Abb. 9.34 gezeigt. In dem isolierten Wellenleiter breitet sich das Licht in Moden aus, deren Dispersionslinien jeweils im Gebiet zwischen den Lichtlinien 𝜔 = 𝑐1 𝛽 und 𝜔 = 𝑐2 𝛽 liegen. Zu jeder Frequenz gibt es mindestens eine Mode. In einem Array mit 𝑁 Wellenleitern spaltet sich jede Dispersionslinie in 𝑁 Linien für die Supermoden auf. Die Form der Kurven hängt von dem Kopplungskoeffizienten 𝒞 ab, der nach Gl. (9.52) frequenzabhängig ist. In einem periodischen Wellenleiter [Abb. 9.34(c)] verbreitern sich die Dispersionslinien zu Bändern, die zwischen den Lichtlinien liegen; die Bänder sind durch photonische Bandlücken getrennt.
9.5 Photonische Kristalle als Wellenleiter 9.5.1 Bragggitter als Wellenleiter Wir haben bis jetzt gesehen, dass Licht durch Reflexion zwischen zwei parallelen Reflektoren geführt werden kann, z. B. zwischen ebenen Spiegeln wie in Abschnitt 9.1 oder ebenen dielektrischen Grenzflächen, an denen das Licht Totalreflexion erfährt wie in Abschnitt 9.2. Alternativ können auch Braggreflektoren (BGR, engl. Bragg grating reflector) verwendet werden (siehe Abschnitt 7.1.3), wie Abb. 9.35 illustriert. Ein BGR
y BGR Wellenleiter
z
BGR
Abb. 9.35 Ebener Wellenleiter aus einer dielektrischen Platte zwischen zwei Braggreflektoren (BGR).
besteht aus einem Stapel von dielektrischen Schichten mit einer speziellen Winkel- und Frequenzabhängigkeit der Reflexion. Für einen gegebenen Winkel ist der Reflexionsgrad für Frequenzen in einem verbotenen Band nahe eins. Umgekehrt ist bei einer gegebenen Frequenz der Reflexionsgrad bei bestimmten Winkeln nahe eins; ebenso ist aber auch Reflexion in alle Richtungen möglich. Hierdurch kann eine Welle mit einer gegebenen Frequenz durch wiederholte Reflexionen innerhalb einer Reihe von Reflexionswinkeln durch den Wellenleiter geführt werden. Innerhalb dieses Bereichs von Winkeln ist die Selbstkonsistenzbedingung für einen diskreten Satz von Winkeln erfüllt, von denen jeder einer sich ausbreitenden Mode entspricht. Die Feldverteilung einer sich ausbreitenden Mode ist überwiegend auf die Platte beschränkt; abklingende (evaneszente) Anteile dringen in die angrenzenden Gitterschichten ein, wie Abb. 9.35 zeigt.
9.6 Plasmonische Wellenleiter
9.5.2 Bragg-Gitterwellenleiter als photonischer Kristall mit einer Defektschicht
9.5.3 Zweidimensionale Wellenleiter aus photonischen Kristallen
Wenn die oberen und unteren Gitter eines Bragg-Gitterwellenleiters identisch sind und die Plattendicke mit der Dicke der periodischen Schichten vergleichbar ist, aus denen das Gitter besteht, dann kann das ganze Medium als eindimensionale periodische Struktur betrachtet werden, d. h. als eindimensionaler photonischer Kristall – aber mit einem Defekt. Beispielsweise ist das in Abb. 9.35 gezeigte Bauelement überall periodisch außer im Bereich der Platte, die eine Schicht mit anderer Dicke und/oder anderem Brechungsindex ist; die Platte kann daher als eine „fehlerhafte“ Schicht angesehen werden. Wie in Abschnitt 7.2 beschrieben besitzt ein idealer photonischer Kristall eine Dispersionsrelation oder ein Bandschema, das Bandlücken enthält, innerhalb derer keine sich ausbreitenden Moden existieren. In Anwesenheit der „fehlerhaften“ Schicht kann aber eine Mode existieren, deren Frequenz innerhalb der Bandlücke liegt. Diese wird dann aber in erster Linie auf die Schicht eingegrenzt sein. Solch eine Mode entspricht einer Frequenz innerhalb der photonischen Bandlücke im Dispersionsdiagramm, wie Abb. 9.36 zeigt. Eine solche Frequenz ist das Analogon eines Defekt-Energieniveaus innerhalb der Bandlücke eines Halbleiterkristalls.
Wellenleiter können auch erzeugt werden, indem in einem zweidimensionalen photonischen Kristall regelmäßige Defekte eingeführt werden. Abbildung 9.37(a) zeigt als Beispiel einen zweidimensionalen photonischen Kristall, der aus einer Reihe von zylindrischen parallelen Löchern besteht, die sich an den Punkten eines periodischen Dreiecksgitters in einem dielektrischen Medium befinden. Dieser Kristall besitzt eine vollständige photonische Bandlücke für Wellen, die sich entlang einer Richtung parallel zur Ebene der Periodizität (senkrecht zu den zylindrischen Löchern) ausbreiten. Der Defekt-Wellenleiter hat hier die Form einer Reihe von fehlenden Löchern. Eine Welle mit einer Frequenz innerhalb der photonischen Bandlücke, die in den Wellenleiter eintritt, dringt nicht in das umgebende periodische Medium ein, sodass das Licht durch den Wellenleiter geführt wird. Ein typisches Profil der Feldverteilung ist in Abb. 9.37(a) illustriert. Wegen der ungerichteten Natur der photonischen Bandlücke kann Licht durch Wellenleiter aus photonischen Kristallen auch um Biegungen und Ecken geführt werden, ohne Energie ins Umgebungsmedium abzugeben, wie der L-förmige Wellenleiter in Abb. 9.37(b) illustriert. Ein derartiges Verhalten ist mit herkömmlichen dielektrischen Wellenleitern auf Grundlage von Totalreflexion nicht erreichbar.
ω
photonische Bandlücke
Defektniveau
9.6 Plasmonische Wellenleiter
0
Abb. 9.36 Dispersionsdiagramm eines photonischen Kristalls mit einer Defektschicht.
Wie wir zuvor gezeigt hatten, ist es schwierig, eine sich ausbreitende Welle auf Abmessungen einzugrenzen, die viel kleiner als ihre Wellenlänge sind (siehe auch Abschnitt 4.4.4). Für den in Abschnitt 9.1 beschriebenen Wellenleiter aus zwei idealen Spiegeln zeigt
z
x
(a)
(b)
Abb. 9.37 (a) Sich ausbreitende Mode in einem Wellenleiter aus einem photonischen Kristall. (b) L-förmiger Wellenleiter aus einem photonischen Kristall.
283
284
9 Wellenleiteroptik
ω
ω
ω
=
ωP
cβ
ω
=
ω
cβ
ωP
ωS
ω
(a)
ω
cβ
ωP
ω(+)
ωS
ωk 0
=
ω
ωS
ω(–) β
0 (b)
β
0 (c)
βP
=
cβ
ω (+) ω(–)
β
0
βP
β
(d)
Abb. 9.38 Aufbau und Dispersionsrelationen verschiedener optischer und plasmonischer Wellenleiter. (a) Ein Wellenleiter aus zwei idealen Spiegeln kann optische Moden führen, wenn für seine Breite d > 𝜆∕2 gilt, d. h. wenn 𝜔 > 𝜔k ist (𝜔k = πc∕d ist die Grenzfrequenz). (b) Ein Wellenleiter aus einer Schichtstruktur Metall/Dielektrikum/Metall mit einer Dicke d < 𝜆∕2 kann zwar keine optischen Moden führen, erlaubt jedoch Oberflächenplasmonpolaritonen (OPP-Wellen) an seinen√beiden Grenzflächen, sofern 𝜔 < 𝜔S ist, wobei 𝜔S = 𝜔P 1 + 𝜀r1 und 𝜔P die Plasmafrequenz des Metalls ist; 𝜀r1 = 𝜀1 ∕𝜀0 ist die relative Permittivität des Dielektrikums.
(c) Ein Wellenleiter aus einer Schichtstruktur Metall/Isolator/ Metall mit einer Dicke d ≪ 𝜆∕2 erlaubt eine symmetrische geführte Mode 𝜔(+) für 𝜔S < 𝜔 < 𝜔P und eine antisymmetrische Mode 𝜔(−) für 𝜔 < 𝜔S . (d) Eine dünne Metallplatte mit einer Breite d ≪ 𝜆 kann zwei Moden führen, eine unterhalb 𝜔P und die andere geringfügig oberhalb von 𝜔P . Für die Diagramme in (c) und (d) gilt d = 𝜆P ∕10 mit 𝜆P = 2πc0 ∕𝜔P und 𝜀r1 = 2.25, also 𝜔S = 0.55𝜔P . Die gestrichelten Linien zeigen die Dispersionsrelation für OPP-Wellen an einfachen Grenzflächen. In (a)–(d) entsprechen die gepunkteten Linien den Lichtlinien des dielektrischen Mediums, 𝜔 = c𝛽 .
Abb. 9.38(a), dass er eine Welle der Wellenlänge 𝜆 nur für einen Spiegelabstand d > 𝜆∕2 führen kann, nicht aber für kleinere Abstände der Spiegel. Für den in Abschnitt 9.2 diskutierten dielektrischen Wellenleiter hatten wir gezeigt, dass bei Plattendicken d unter 𝜆∕2 nur eine einzige geführte Mode möglich ist und dass sich die geführte Welle bei weiterer Verringerung der Dicke in einem erheblichen Ausmaß außerhalb der Platte und in das umgebende dielektrische Medium ausbreitet (siehe Abb. 9.15). Unter Verwendung metallischer Strukturen kann Licht jedoch trotzdem auf Raumbereiche mit Abmessungen im Subwellenlängenbereich eingegrenzt und geführt werden. Wie wir in Abschnitt 8.2.2 gesehen hatten, kann an einer Grenzfläche zwischen einem Metall und einem Dielektrikum eine Oberflächenwelle existieren, die als Oberflächenplasmonpolariton (OPP) bezeichnet wird und eng auf die Grenzfläche eingegrenzt ist, wobei ihre Eindringtiefen auf beiden Seiten der Grenzfläche viel kleiner sind als die Wellenlänge [siehe Abb. 9.38(b)]. Es wird in Kürze deutlich werden, dass eine optische Welle auch in einer ultradünnen dielektrischen Platte geführt werden kann, die in eine Metallumhüllung eingebettet ist sofern ihre Dicke viel kleiner als die Wellenlänge ist, wie Abb. 9.38(c) zeigt. Unter diesen Bedingungen sind die OPP-Wellen an den beiden Grenzflächen miteinander gekoppelt und zu Moden ver-
bunden, die sich durch das dielektrische Medium erstrecken. Ähnlich kann auch eine ultradünne Metallschicht eine optische Welle im Subwellenlängenbereich führen [Abb. 9.38(d)]. Es gibt noch weitere metallisch/dielektrische Strukturen mit komplexerem Aufbau, die gezielt entworfen wurden, um Licht durch verschiedene optische Schaltungen zu führen. Wie in Abschnitt 8.2 bereits erwähnt, nennt man diesen Zweig der integrierten Photonik auch Plasmonik. Die Ausbreitungslängen von plasmonischen Wellenleitern sind durch metallische Verluste begrenzt. Ein Wellenleiter aus einer Metall/Isolator/Metall-Schichtstruktur
Eine von Metallschichten umgebene dielektrische Platte bildet einen Metall/Dielektrikum/Metall- oder Metall/Isolator/Metall-Wellenleiter. Wenn die Dicke der Platte größer als die doppelte Eindringtiefe der OPPWellen an den Grenzflächen ist [siehe Gl. (8.48)], sind in dieser Struktur zwei unabhängige OPP-Wellen möglich [Abb. 9.38(b)]. Wenn die dielektrische Platte dünner ist, überlappen die Oberflächenwellen und werden dadurch gekoppelt, wodurch die Dispersionskurve sich in zwei Zweige aufspaltet und zwei separate geführte Moden entstehen, die in Abb. 9.38(c) mit 𝜔(+) und 𝜔(−) bezeichnet sind. Diese Moden entsprechen antisymmetrischen bzw. symmetrischen Feldverteilungen.
9.6 Plasmonische Wellenleiter
ω
ωP
=
co
β
ω
Dielektrikum ε 1
ω
=
β c1
ωs
Metall ε 2
0 0
βP
β
Abb. 9.39 Eine periodische Schichtstruktur Metall/Isolator und ihre Dispersionsrelation für Licht, das sich parallel zu den Schichten ausbreitet. Zwei Bänder liegen im Frequenzbereich 𝜔 < 𝜔P . Die gestrichelte Kurve in (b) beschreibt die
Dispersionsrelation für die OPP-Welle an einer einfachen Grenzfläche, die gepunkteten Linien sind die Lichtlinien im Vakuum bzw. dem Dielektrikum.
Die Dispersionsrelationen für diese beiden Moden können durch Anpassen der Randbedingungen an den Grenzflächen Metall/Dielektrikum abgeleitet werden, ähnlich wie wir dies für den dielektrischen Wellenleiter getan hatten (siehe Abschnitt 9.2). Das Ergebnis für die TM-Welle ähnelt Gl. (9.22) für einen dielektrischen Wellenleiter:
Auch hier kann die Dispersionsrelation wieder durch Anpassen der Randbedingungen erhalten werden; das Resultat ist
𝜀 𝛾 d tanh ( 𝛾1 ) = − 1 2 , 2 𝜀2 𝛾1
𝜀 𝛾 d coth ( 𝛾1 ) = − 1 2 (9.70) 2 𝜀2 𝛾1
mit 𝛾1 =
√ 𝛽 2 − 𝜔2 𝜇𝜀1 ,
𝛾2 =
√
𝛽 2 − 𝜔2 𝜇𝜀2 ,
(9.71)
wobei 𝜀1 und 𝜀2 die Permittivitäten des Dielektrikums bzw. des Metalls sind. Diese Dispersionsrelation ist in Abb. 9.38(c) für ein nach dem Drudemodell beschriebenes Metall dargestellt, 𝜀2 = 𝜀0 (1 − 𝜔P2 ∕𝜔2 ), wobei 𝜔P die Plasmafrequenz des Volumenmetalls ist. Interessant ist, dass der obere Zweig der Dispersionskurve die Lichtlinie kreuzt, was bedeutet, dass sich die Welle mit einer Phasengeschwindigkeit ausbreitet, die größer ist als die Lichtgeschwindigkeit 𝑐 in dem dielektrischen Medium. Da sich die beiden Zweige der Dispersionsrelation über den Frequenzbereich 0 < 𝜔 < 𝜔P erstrecken, können Wellen mit beliebigen Frequenzen 𝜔 < 𝜔P in dielektrischen Platten geführt werden, die deutlich kleiner als die Wellenlänge sind. Beispielsweise können auf diese Weise Moden im nahen Infrarot auf Dimensionen im Nanometerbereich lokalisiert werden. Metallschicht-Wellenleiter
Ähnlich kann auch eine dünne Metallschicht der Dicke d < 𝜆 in einem dielektrischen Medium als plasmonischer Wellenleiter wirken [Abb. 9.38(d)]. Wenn die Schichtdicke kleiner ist als die Eindringtiefe der OPPWellen in das Metall, überlappen diese Wellen und verschmelzen zu zwei separaten Moden des Wellenleiters.
𝜀 𝛾 d tanh ( 𝛾2 ) = − 1 2 , 2 𝜀2 𝛾1
𝜀 𝛾 d coth ( 𝛾2 ) = − 1 2 , (9.72) 2 𝜀2 𝛾1
wobei 𝛾1 und 𝛾2 wie zuvor durch Gl. (9.71) gegeben sind und 𝜀1 und 𝜀2 wieder die Permittivitäten des dielektrischen bzw. des metallischen Materials sind. Das Drudemodell für das Metall ergibt wieder 𝜀2 = 𝜀0 (1 − 𝜔P2 ∕𝜔2 ). Gleichung (9.72) ist nahezu identisch mit Gl. (9.70), nur dass auf der linken Seite der Gleichungen die Indizes 1 und 2 vertauscht sind. Diese Dispersionsrelation ist in Abb. 9.38(d) dargestellt. Wie bei dem zuvor betrachteten MIM-Wellenleiter spaltet sich die Dispersionsrelation der OPP-Welle an einer einzelnen Grenzfläche Metall/ Dielektrikum jetzt in zwei Zweige auf, die einer symmetrischen und einer antisymmetrischen Mode entsprechen; in diesem Fall liegen beide unterhalb der Lichtlinie 𝜔 = 𝑐𝛽 des dielektrischen Volumenmaterials. Periodische Arrays Metall/Dielektrikum
Eine periodische Struktur aus abwechselnden Schichten eines Metalls und eines Dielektrikums bildet einen photonischen Kristall. Analog zu den in Kapitel 7 diskutierten und in Abb.9.33(a) und (c) dargestellten vollständig dielektrischen Anordnungen spaltet sich auch hier die Dispersionskurve einer einzelnen Grenzfläche Metall/ Dielektrikum, die in Abb. 9.39(b) als gestrichelte Kurve eingezeichnet ist, in mehrere Zweige auf und bildet wie gezeigt Bänder. Die Frequenz 𝜔 einer Mode mit der Ausbreitungskonstante 𝛽 darf nur innerhalb zweier separater Spektralbänder liegen, die beide im Bereich 𝜔 < 𝜔P liegen.
285
286
9 Wellenleiteroptik
Aufgaben
Aufgabe 9-6: Herleitung der Feldverteilung aus den maxwellschen Gleichungen
Aufgabe 9-1: Feldverteilung
Nehmen Sie an, dass das elektrische Feld in einem symmetrischen dielektrischen Wellenleiter innerhalb der Platte harmonisch ist, außerhalb der Platte exponentiell abklingt, und in beiden Medien eine Ausbreitungskonstante 𝛽 besitzt. Sie können dann 𝐸𝑥 (𝑦, 𝑧) = 𝑢(𝑦)e−i𝛽𝑧 schreiben mit
(a) Zeigen Sie, dass eine einzelne ebene TEM-Welle 𝐸𝑥 (𝑦, 𝑧) = 𝐴 exp(−i𝑘𝑦 𝑦) exp(−i𝛽𝑧) die Randbedingung 𝐸𝑥 (±d ∕2, 𝑧) = 0 für alle 𝑧 in dem in Abb. 9.3 dargestellten Spiegelwellenleiter nicht erfüllen kann. (b) Zeigen Sie, dass die Summe 𝐸𝑥 (𝑦, 𝑧) = 𝐴1 exp(−i𝑘𝑦1 𝑦) exp(−i𝛽1 𝑧) + 𝐴2 exp(−i𝑘𝑦2 𝑦) exp(−i𝛽2 𝑧) zweier ebener TEM-Wellen die Randbedingungen nicht erfüllt, sofern 𝐴1 = ±𝐴2 , 𝛽1 = 𝛽2 , und 𝑘𝑦1 = −𝑘𝑦2 = 𝑚π∕d mit 𝑚 = 1, 2, … ist. Aufgabe 9-2: Modendispersion
Licht der Wellenlänge 𝜆0 = 0.633 μm wird durch einen Spiegelwellenleiter mit dem Spiegelabstand d = 10 μm und 𝑛 = 1 geschickt. Bestimmen Sie die Zahl der TE- und TM-Moden und die Gruppengeschwindigkeiten der schnellsten und der langsamsten Mode. Wenn ein schmaler Lichtpuls im Wellenleiter von allen Moden über eine Entfernung von 1 m getragen wird, um wie viel verbreitert er sich dann infolge der unterschiedlichen Gruppengeschwindigkeiten? Aufgabe 9-3: Parameter eines dielektrischen Wellenleiters
Licht der Vakuumwellenlänge 𝜆0 = 0.87 μm wird durch eine dünne ebenen Schicht mit der Dicke d = 2 μm und dem Brechungsindex 𝑛1 = 1.6 geschickt, die von einem Medium mit dem Brechungsindex 𝑛2 = 1.4 umgeben ist. (a) Bestimmen Sie den kritischen Winkel 𝜃k und sein Komplement 𝜃k , die numerische Apertur NA und den Akzeptanzwinkel für Licht, das aus der Luft (𝑛 = 1) eintritt. (b) Bestimmen Sie die Zahl der TEModen. (c) Bestimmen Sie den Reflexionswinkel 𝜃 und die Gruppengeschwindigkeit 𝑣 der TE-Mode mit 𝑚 = 0.
⎧ ⎪ 𝐴 cos(𝑘𝑦 𝑦 + 𝜑), −d ∕2 ≤ 𝑦 ≤ d ∕2 , 𝑢(𝑦) = 𝐵 exp(−𝛾𝑦), 𝑦 > d ∕2 , ⎨ ⎪ 𝐵 exp(𝛾𝑦), 𝑦 < d ∕2 . ⎩ Damit die Helmholtzgleichung erfüllt ist, muss 𝑘𝑦2 + 𝛽 2 = 𝑛12 𝑘02 und −𝛾 2 + 𝛽 2 = 𝑛22 𝑘02 sein. Verwenden Sie die maxwellschen Gleichungen, um Ausdrücke für 𝐻𝑦 (𝑦, 𝑧) und 𝐻𝑧 (𝑦, 𝑧) herzuleiten. Zeigen Sie, dass die Randbedingungen erfüllt sind, wenn 𝛽, 𝛾 und 𝑘𝑦 die im Text hergeleiteten Werte 𝛽𝑚 , 𝛾𝑚 und 𝑘𝑦𝑚 annehmen und verifizieren Sie, dass die Selbstkonsistenzbedingung Gl. (9.22) erfüllt ist. Aufgabe 9-7: Einmodenwellenleiter Wie ist die größte Dicke d eines planaren symmetrischen
dielektrischen Wellenleiters mit den Brechungsindizes 𝑛1 = 1.50 und 𝑛2 = 1.46, für die es nur eine TE-Mode bei 𝜆0 = 1.3 μm gibt? Wie viele Moden gibt es, wenn ein Wellenleiter mit dieser Dicke stattdessen bei 𝜆0 = 0.85 μm verwendet wird? Aufgabe 9-8: Grenzwellenlänge
Zeigen Sie, dass die Grenzbedingung für die TE-Mode 𝑚 > 0 in einem symmetrischen Plattenwellenleiter mit 𝑛1 ≈ 𝑛2 näherungsweise gleich 𝜆02 ≈ 8𝑛1 Δ𝑛d 2 ∕𝑚2 mit Δ𝑛 = 𝑛1 − 𝑛2 ist.
Aufgabe 9-4: Der Einfluss des Mantels
Aufgabe 9-9: TM-Moden
Wiederholen Sie Aufgabe 9-3 für den Fall, dass die dünne Schicht sich in Luft (𝑛2 = 1) befindet. Vergleichen Sie die Ergebnisse.
Leiten Sie einen Ausdruck für die Reflexionswinkel der TM-Moden ähnlich Gl. (9.22) her. Erzeugen Sie eine Auftragung ähnlich Abb. 9.12 für TM-Moden in einem Wellenleiter mit sin 𝜃k = 0.3 und 𝜆∕2d = 0.1. Wie viele TM-Moden gibt es?
Aufgabe 9-5: Feldverteilung
Die transversale Verteilung 𝑢𝑚 (𝑦) der komplexen Amplitude des elektrischen Feldes einer TE-Mode in einem Plattenwellenleiter ist durch die Gln. (9.28) und (9.31) gegeben. Leiten Sie einen Ausdruck für das Verhältnis der Proportionalitätskonstanten her. Tragen Sie die Verteilung der TE-Mode 𝑚 = 0 für einen Plattenwellenleiter mit den Parametern 𝑛1 = 1.48, 𝑛2 = 1.46, d = 0.5 μm und 𝜆0 = 0.85 μm auf und bestimmen Sie ihren Einschlussfaktor (den Anteil der Leistung in der Platte).
Aufgabe 9-10: Moden eines rechteckigen dielektrischen Wellenleiters
Ein rechteckiger dielektrischer Wellenleiter hat einen quadratischen Querschnitt der Fläche 10−2 mm2 und eine numerische Apertur NA = 0.1. Verwenden Sie Gl. (9.46), um die Zahl der TE-Moden als Funktion der Frequenz 𝜈 aufzutragen. Vergleichen Sie Ihre Ergebnisse mit Abb. 9.14.
Aufgaben
Aufgabe 9-11: Kopplungskoeffizient zwischen zwei Platten
(a) Verwenden Sie Gl. (9.52), um den Kopplungskoeffizienten zwischen zwei identischen Plattenwellenleitern der Dicke d = 0.5 μm im Abstand 2𝑎 = 1.0 μm mit dem Brechungsindizes 𝑛1 = 𝑛2 = 1.48 in einem Medium mit dem Brechungsindex 𝑛 = 1.46 bei 𝜆0 = 0.85 μm zu bestimmen. Nehmen Sie an, dass in beiden Wellenleitern die TE-Mode 𝑚 = 0 angeregt ist und verwenden Sie die Ergebnisse von Aufgabe 9-5, um die transversalen Verteilungen zu bestimmen. (b) Bestimmen Sie die Länge der Wellenleiter so, dass das Bauelement als 3-dB-Koppler wirkt. Aufgabe 9-12: Eine Silberplatte als Wellenleiter
Berechnen Sie die Dispersionsrelation für die symmetrischen und antisymmetrischen Moden eines Silberplatten-Wellenleiters mit einer Dicke d = 20 nm in einem umgebenden Medium mit einem frequenzunabhängigen Brechungsindex 𝑛2 = 2. Nehmen Sie an, dass die Permittivität von Silber durch das Drudemodell, Gl. (8.44), mit einer Plasmafrequenz 𝜔P entsprechend einer Vakuumwellenlänge von 138 nm beschrieben wird. Bestimmen Sie die Eigenschaften (Geschwindigkeit, Ausbreitungswellenlänge und Eindringtiefe) der symmetrischen Mode bei einer Vakuumwellenlänge von 400 nm. Vergleichen Sie diese Eigenschaften mit denen einer OPP-Welle, die sich auf einer einzelnen Grenzfläche zwischen Silber und demselben Wirtsmedium ausbreitet.
Weiterführende Literatur Bücher und grundlegende Artikel
Siehe auch die allgemeine Literatur zu Schicht- und periodischen Medien in Kapitel 7, die Literatur in Kapitel 10 und die Literatur zu integrierten photonischen Schaltkreisen in Kapitel 25. S. Bhadra, A. Ghatak (Hrsg.), Guided Wave Optics and Photonic Devices, CRC Press/Taylor & Francis 2013. L. N. Binh, Guided Wave Photonics: Fundamentals and Applications with MATLAB, CRC Press/Taylor & Francis 2012. D. Dai, J. Bauters, J. E. Bowers, ‚Passive Technologies for Future Large-Scale Photonic Integrated Circuits on Silicon: Polarization Handling, Light Non-Reciprocity and Loss Reduction‘, Light: Science & Applications 1, e1, 2012, doi:10.1038/lsa.2012.1. R. G. Hunsperger, Integrated Optics: Theory and Technology, Springer, 6. Aufl. 2010. J. Bures, Guided Optics, Wiley-VCH 2009.
C.-L. Chen, Foundations for Guided Wave Optics, Wiley 2007. K. Iga, Y. Kokobun (Hrsg.), Encyclopedic Handbook of Integrated Optics, CRC Press/Taylor & Francis 2006. K. Okamoto, Fundamentals of Optical Waveguides, Elsevier, 2. Aufl. 2005. J.-M. Liu, Photonic Devices, Cambridge University Press 2005, Paperback 2009. G. Lifante, Integrated Photonics: Fundamentals, Wiley 2003. C. Pollock, M. Lipson, Integrated Photonics, Kluwer 2003. A. A. Barybin, V. A. Dmitriev, Modern Electrodynamics and Coupled-Mode Theory: Application to Guided-Wave Optics, Rinton Press 2002. K. Iizuka, Elements of Photonics, Volume 2: For Fiber and Integrated Optics, Wiley 2002. M. Young, Optics and Lasers: Including Fibers and Optical Waveguides, Springer, 5. Aufl. 2000. A. R. Mickelson, Guided Wave Optics, Springer 1993, Paperback 2012. K. J. Ebeling, Integrated Optoelectronics: Waveguide Optics, Photonics, Semiconductors, Springer 1993, Paperback 2011. D. G. Hall (Hrsg.), Selected Papers on Coupled Mode Theory in Guided-Wave Optics, SPIE Optical Engineering Press 1993 (Milestone Series Bd. 84). D. Marcuse, Theory of Dielectric Optical Waveguides, Academic Press, 2. Aufl. 1991.
287
289
10 Faseroptik Die Faseroptik ist eine Schlüsseltechnologie für die Telekommunikation, die Datenübertragung und die Informationstechnik. Erst die kommerzielle Verfügbarkeit von extrem verlustarmen optischen Fasern ermöglichte den kommerziellen Erfolg der faseroptischen Kommunikation. Eine Faser ist ein zylindrischer dielektrischer Wellenleiter aus einem verlustarmen Material wie z. B. Quarzglas. Sie besteht aus einem zentralen Kern, in dem das Licht geführt wird, und einem äußeren Mantel aus einem Material mit einem geringfügig kleineren Brechungsindex (Abb. 10.1). Lichtstrahlen, die unter Winkeln größer als der kritische Winkel auf die Grenzfläche zwischen Kern und Mantel auftreffen, erfahren Totalreflexion und werden ohne Brechung in den Mantel und damit einhergehende Verluste im Kern geführt. Strahlen mit einer größeren Neigung zur Faserachse verlieren bei jeder Reflexion einen Teil ihrer Leistung in den Mantel und werden nicht geführt. Große technische Fortschritte bei der Herstellung von optischen Fasern in den letzten Jahrzehnten ermöglichen es heute, Licht bei der Wellenlänge maximaler Transmission über eine Entfernung von 1 km mit Verlusten von etwa 0.15 dB (≈ 3.4 %) durch optische Fasern aus Quarzglas zu führen. Dieser niedrige Verlust ist mit ein Grund dafür, dass optische Fasern die alten Koaxialkabel aus Kupfer als bevorzugtes Übertragungsmedium für die terristrische und subozeanische Stimm- und Datenkommunikation verdrängt haben. In den letzten Jahren haben optische Fasern ihre schlichten Ursprünge im Bereich Quarzglas verlassen und spielen mittlerweile eine zentrale Rolle in den Bereichen Sensorik, Sicherheit, Transport, Verteidigung und Biomedizin. Dabei spielte Mantel a
Kern
die Entwicklung von optischen Fasern auf der Grundlage von photonischen Kristallen und Verbundmaterialien sowie von multifunktionalen Fasern eine wichtige Rolle. In diesem Kapitel führen wir die Prinzipien der Lichtübertragung durch optische Fasern ein. Diese Prinzipien sind im Wesentlichen dieselben wie diejenigen, die für ebene dielektrische Wellenleiter (Kapitel 9) gelten; der auffälligste Unterschied ist, dass optische Fasern eine zylindrische Geometrie haben. In beiden Arten von Wellenleitern pflanzt sich Licht in Form von Moden fort. Jede Mode breitet sich mit einer charakteristischen Ausbreitungskonstante und Gruppengeschwindigkeit entlang der Achse des Wellenleiters aus und behält dabei ihre transversale Raumverteilung und Polarisation bei. Wenn der Kerndurchmesser klein ist, wird nur eine einzige Mode unterstützt und man bezeichnet die Faser als Einmodenfaser. Fasern mit großen Kerndurchmessern sind Vielmodenfasern. Eine der Schwierigkeiten bei der Ausbreitung von Licht in einer Vielmodenfaser ergibt sich aus den unterschiedlichen Gruppengeschwindigkeiten der Moden. Sie resultieren in einer Verteilung der Reisezeiten und führen so zur Verbreiterung eines Lichtpulses während der Ausbreitung durch die Faser. Dieser Effekt wird Modendispersion genannt; sie beschränkt die zeitlichen Abstände, in denen Pulse durch die Faser geschickt werden können, ohne dass es zu einer Überlappung der Pulse am entfernten Ende der Faser kommt. Modendispersion begrenzt daher die Geschwindigkeit, mit der faseroptische Vielmoden-Nachrichtensysteme betrieben werden können.
n2 < n1 n1
b
Abb. 10.1 Eine Faser ist ein zylindrischer dielektrischer Wellenleiter mit einem inneren Kern und einem äußeren Mantel mit einem kleineren Brechungsindex als der Kern. Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
290
10 Faseroptik
Stufenindex-Vielmodenfaser
Abb. 10.2 Geometrie, Indexprofil und typische Strahlen in einer Stufenindex-Vielmodenfaser, einer Einmodenfaser und einer GradientenindexVielmodenfaser.
n2
n1 Einmodenfaser
n2 n1
Gradientenindex-Vielmodenfaser
n2 n1
Die Modendispersion kann reduziert werden, indem man den Brechungsindex des Faserkerns von einem maximalen Wert im Zentrum bis zu einem minimalen Wert an der Grenzfläche zwischen Kern und Mantel abstuft. Die Faser wird dann Gradientenindexfaser oder kurz GRIN-Faser genannt, während konventionelle Fasern mit konstanten Brechungsindizes in Kern und Mantel als Stufenindexfasern bezeichnet werden. In einer Gradientenindexfaser nimmt die Ausbreitungsgeschwindigkeit mit der radialen Entfernung von der Kernachse zu (da der Brechungsindex abnimmt). Zwar müssen Strahlen mit einer größeren Neigung zur Faserachse eine größere Entfernung in der Faser zurücklegen, aber dafür breiten sie sich in den achsenfernen Gebieten schneller aus. Dadurch können die Zeiten für die Transmission verschiedener Moden angeglichen werden. Zusammengefasst können optische Fasern als Stufenoder Gradientenindexfasern bzw. als Ein- oder Vielmodenfasern klassifiziert werden, wie Abb. 10.2 zeigt.
In diesem Kapitel . . . Dieses Kapitel beginnt mit strahlenoptischen Beschreibungen von Stufen- und Gradientenindexfasern (Abschnitt 10.1). Ein Ansatz im Rahmen der elektromagnetischen Optik, der die Natur optischer Moden und der Einmodenausbreitung betont, folgt in Abschnitt 10.2. Im Rahmen der genäherten Beschreibung in Abschnitt 10.2.4 behandeln wir das Feld als quasi-ebene Welle, analog zu der Betrachtung der ebenen dielektrischen Wellenleiter in Abschnitt 9.2. Die optischen Eigenschaften des Fasermaterials (gewöhnlich synthetisches Quarzglas) einschließlich seiner Dämpfung und Materialdispersion sowie der Moden-, Wellenleiter- und Polarisationsdispersion, werden in Abschnitt 10.3 besprochen. Hohlkernfasern und Fasern aus photonischen Kristallen, die komplexere Brechungsindex-
profile und ungewöhnliche Dispersionseigenschaften haben, werden in Abschnitt 10.4 eingeführt. Schließlich betrachten wir in Abschnitt 10.5 Fasern aus Verbundmaterialien und multifunktionelle Fasern einschließlich einiger Beispiele für den Infrarotbereich und spezielle Anwendungen. In den Kapiteln 23 und 25, die der ultraschnellen Optik bzw. faseroptischen Kommunikationssystemen gewidmet sind, werden wir nochmals auf das Thema Faseroptik zu sprechen kommen.
10.1 Geführte Strahlen 10.1.1
Stufenindexfasern
Eine Stufenindexfaser ist ein zylindrischer dielektrischer Wellenleiter, der durch die Brechungsindizes 𝑛1 bzw. 𝑛2 seines Kerns und Mantels und ihre Radien 𝑎 und 𝑏 (siehe Abb. 10.1) charakterisiert ist. Typische Verhältnisse der Durchmesser von Kern zu Mantel (μm∕μm) sind 2𝑎∕2𝑏 = 8∕125, 50∕125, 62.5∕125, 85∕125 oder 100∕140. Die Brechungsindizes von Kerns und Mantel unterscheiden sich nur wenig, sodass die relative Änderung des Brechungsindex klein ist: 𝛥≡
𝑛12 − 𝑛22 2𝑛12
≈
𝑛1 − 𝑛2 ≪1. 𝑛1
(10.1)
Die meisten in aktuellen optischen Nachrichtensystemen verwendeten Fasern werden aus hochreinem synthetischen Quarzglas (SiO2 , engl. fused silica) hergestellt. Kleine Änderungen im Brechungsindex werden durch Zugabe geringer Konzentrationen von Dotierungsmaterialien (z. B. Titan, Germanium Bor) erreicht. Der Brechungsindex 𝑛1 liegt je nach Wellenlänge im Bereich von 1.44 bis 1.46, und 𝛥 liegt typischerweise zwischen 0.001 und 0.02.
10.1 Geführte Strahlen
Ein optischer Strahl wird in einer Stufenindexfaser durch Totalreflexion im Faserkern geführt, wenn sein Einfallswinkel an der Grenzfläche zwischen Kern und Mantel größer ist als der kritische Winkel 𝜃k = −1 sin (𝑛2 ∕𝑛1 ) und während der Reflexionen des Strahls auch so bleibt. Meridionale Strahlen
Meridionale Strahlen verlaufen in Ebenen, die die Faserachse enthalten. Für sie gilt eine besonders einfache Bedingung für die Führung, die in Abb. 10.3 dargestellt ist. Diese Strahlen schneiden die Faserachse und werden in derselben Ebene reflektiert, ohne ihren Einfallswinkel zu ändern, als ob sie sich in einem planaren Wellenleiter befänden. Meridionale Strahlen werden geführt, wenn der Winkel 𝜃, den sie mit der Faserachse einschließen, kleiner ist als das Komplement des kritischen Winkels, d. h. wenn 𝜃 < 𝜃k = π∕2 − 𝜃k = cos−1 (𝑛2 ∕𝑛1 ) gilt. Wegen 𝑛1 ≈ 𝑛2 ist 𝜃k gewöhnlich klein und die geführten Strahlen sind näherungsweise paraxial. meridionale Ebene
θ θ
Abb. 10.3 Die Trajektorie eines meridionalen Strahls liegt in einer Ebene, die die Faserachse enthält. Der Strahl wird geführt, wenn 𝜃 < 𝜃 k = cos−1 (n2 ∕n1 ) ist.
Schiefe Strahlen
Allgemein wird ein Strahl durch seine Einfallsebene, die parallel zur Faserachse liegt und in der der Strahl verläuft, sowie durch seinen Winkel zur Faserachse charakterisiert, wie Abb. 10.4 zeigt. Die Einfallsebene schneidet die zylindrische Grenzfläche zwischen Kern und Mantel in einem Winkel 𝜙 zur Senkrechten auf der Grenzfläche und liegt in einer Entfernung 𝑅 von der Faserachse. Der Strahl wird durch seinen Winkel 𝜃 mit der Faserachse und durch den Winkel 𝜙 seiner Einfallsebene identifi-
ziert. Für 𝜙 ≠ 0 (𝑅 ≠ 0) nennt man den Strahl schief; für einen meridionalen Strahl ist 𝜙 = 0 und 𝑅 = 0. Ein schiefer Strahl wird wiederholt in Ebenen reflektiert, die denselben Winkel 𝜙 mit der Grenzfläche zwischen Kern und Mantel einschließen; er folgt einer schraubenförmigen Trajektorie, die innerhalb einer zylindrischen Schale mit Innenradius 𝑅 und Außenradius 𝑎 eingeschlossen ist, wie Abb. 10.4 illustriert. Die Projektion der Trajektorie auf die transversale (𝑥𝑦-) Ebene ist ein regelmäßiges Vieleck, das nicht unbedingt geschlossen ist. Ein schiefer Strahl erfährt Totalreflexion, wenn sein Winkel mit der 𝑧-Achse kleiner ist als das Komplement des kritischen Winkels, d. h. 𝜃 < 𝜃k . Numerische Apertur
Ein Strahl, der aus Luft in eine Faser einfällt, wird geführt, wenn er nach der Brechung in den Kern einen Winkel 𝜃 mit der Faserachse einschließt, der kleiner ist als 𝜃k . Wie Abb. 10.5(a) zeigt, erhält man den Winkel 𝜃A in der Luft, der dem Winkel 𝜃k im Kern entspricht, durch Anwendung des snelliusschen Gesetzes an der Grenzfläche Luft/Kern aus 1 ⋅ sin 𝜃A = 𝑛1 sin 𝜃 k ; daraus folgt √ √ √ sin 𝜃A = 𝑛1 1 − cos2 𝜃k = 𝑛1 1 − (𝑛2 ∕𝑛1 )2 = 𝑛12 − 𝑛22 (siehe Übung 1-6). Der Akzeptanzwinkel der Faser ist daher 𝜃A = sin
−1
NA ;
(10.2)
dabei ist die numerische Apertur NA der Faser wegen 𝑛1 − 𝑛2 = 𝑛1 𝛥 und 𝑛1 + 𝑛2 ≈ 2𝑛1 gleich √ √ (10.3) NA = 𝑛12 − 𝑛22 ≈ 𝑛1 2𝛥 . Der Akzeptanzwinkel 𝜃A der Faser bestimmt den Kegel von einfallenden Strahlen, die von der Faser geführt werden. Strahlen, die unter Winkeln größer als 𝜃A einfallen, werden zwar in die Faser gebrochen, aber nur für eine kurze Entfernung geführt, da sie keine Totalreflexion erfahren. Die numerische Apertur beschreibt daher die Fähigkeit der Faser, Licht zu sammeln, wie Abb. 10.5(b) zeigt. y
R z
θ
Abb. 10.4 Ein schiefer Strahl liegt in einer Ebene in einer Entfernung R von der Faserachse. Der Strahl wird durch die Winkel 𝜃 und 𝜙 identifiziert. Er folgt einer schraubenförmigen Trajektorie innerhalb einer zylindrischen Schale mit dem
a
x
inneren Radius R und dem äußeren Radius a. Die Projektion des Strahls auf die transversale Ebene ist ein regelmäßiges Vieleck, das nicht notwendigerweise geschlossen ist.
291
292
10 Faseroptik
ungeführter Strahl
Akzeptanzkegel
θA
geführter Strahl
θk θk
(a) NA klein
(b)
NA groß
Abb. 10.5 (a) Der Akzeptanzwinkel 𝜃A einer Faser. Strahlen innerhalb des Akzeptanzkegels werden durch Totalreflexion geführt. Für die numerische Apertur gilt NA = sin 𝜃A . Die Winkel 𝜃A und 𝜃 k sind normalerweise ziemlich klein; sie sind
hier der Deutlichkeit halber übertrieben dargestellt. (b) Eine Faser mit großem NA kann mehr Licht sammeln als eine Faser mit kleinem NA.
Wenn die geführten Strahlen das Ende der Faser erreichen, werden sie wieder in einen Kegel mit dem Öffnungswinkel 𝜃A zurück gebrochen. Der Akzeptanzwinkel ist daher ein entscheidender Designparameter für in Ein- oder Auskopplung von Licht in eine Faser bzw. aus ihr heraus. Beispiel 10-1: Fasern mit und ohne Mantel
In einer Quarzglasfaser mit 𝑛1 = 1.46 und 𝛥 = (𝑛1 − 𝑛2 )∕𝑛1 = 0.01 ist das Komplement des kritischen Winkels 𝜃k = cos−1 (𝑛2 ∕𝑛1 ) = 8.1◦ und der Akzeptanzwinkel 𝜃A = 11.9◦ entsprechend NA = 0.206. Für eine Quarzglasfaser ohne Mantel (𝑛1 = 1.46, 𝑛2 = 1) ist 𝜃k = 46.8◦ , 𝜃A = 90◦ und NA = 1. Die Faser ohne Mantel führt aus allen Richtungen einfallende Strahlen, da sie im Kern innerhalb eines Kegels mit dem Winkel 𝜃k = 46.8◦ reflektiert werden. Obwohl ihre Kapazität zur Lichtsammlung groß ist, ist die Faser ohne Mantel für den Einsatz als optischer Wellenleiter im Allgemeinen wegen der großen Zahl der von ihr geführten Moden nicht geeignet, wie später erklärt werden wird.
10.1.2
Gradientenindexfasern
Die Verwendung eines Indexgradienten ist eine raffinierte Methode, um die durch Unterschiede in den Gruppengeschwindigkeiten der Moden in einer Vielmodenfaser verursachte Pulsverbreiterung zu reduzieren. Der Kern einer GRIN-Faser besitzt einen variablen Brechungsindex; im Zentrum der Faser ist er am größten und nimmt allmählich ab, bis er an der Grenzfläche zum Mantel seinen kleinsten Wert erreicht. Die Phasengeschwindigkeit des Lichts ist daher im Zentrum minimal und nimmt mit steigender radialer Entfernung allmählich zu. Die Strahlen der am stärksten axialen Mode le-
Mantel
a
Kern 0
n2 n1
n
Abb. 10.6 Geometrie und Indexprofil einer Gradientenindexfaser.
gen daher zwar die kürzeste Entfernung zurück, aber mit der kleinsten Phasengeschwindigkeit. Die Strahlen der schiefsten Mode laufen in einem steileren Winkel im Zickzack und legen eine größere Entfernung zurück, aber überwiegend in einem Medium, in dem die Phasengeschwindigkeit groß ist. Die Ungleichheit in den zurückgelegten Entfernungen wird so durch die entgegengesetzte Ungleichheit der Phasengeschwindigkeiten kompensiert. Demzufolge werden die Zeitdifferenzen zwischen verschiedenen Moden für eine gegebene Entfernung reduziert. In diesem Abschnitt untersuchen wir die Ausbreitung des Lichts in GRIN-Fasern. Der Brechungsindex des Kerns einer GRIN-Faser ist eine Funktion 𝑛(𝑟) des radialen Ortes 𝑟. Wie in Abb. 10.6 gezeigt ist 𝑛(𝑟) im Zentrum maximal, 𝑛(0) = 𝑛1 , während das Minimum am Kernradius liegt, 𝑛(𝑎) = 𝑛2 . Der Brechungsindex des Mantels ist konstant 𝑛2 . Ein vielseitiges Indexprofil, das dieses allgemeine Verhalten zeigt, wird durch das Potenzgesetz ( 𝑟 )𝑝 𝑛2 (𝑟) = 𝑛12 [1 − 2 𝛥] , 𝑟 ≤ 𝑎 , (10.4) 𝑎 mit 𝛥=
𝑛12 − 𝑛22 2𝑛12
≈
𝑛1 − 𝑛2 𝑛1
(10.5)
10.2 Geführte Wellen
10.2 Geführte Wellen
8
p=
Mantel
5 2 1
a
Kern
Als Nächstes wollen wir eine Theorie der Lichtausbreitung in Fasern im Rahmen der elektromagnetischen Optik entwickeln. Unser Ziel ist, die elektrischen und magnetischen Felder von geführten Wellen aus den maxwellschen Gleichungen zu bestimmen und die Randbedingungen anzugeben, die der zylindrische dielektrische Kern und der Mantel vorgeben. Wie in allen Wellenleitern gibt es bestimmte spezielle Lösungen, Moden genannt (siehe Anhang C), mit charakteristischen Ausbreitungskonstanten, transversalen Feldverteilungen und zwei unabhängigen Polarisationszuständen. Da eine genaue Lösung ziemlich schwierig ist, werden wir eine Reihe von Näherungen einführen.
0
n22
n12 n2
Abb. 10.7 Das Potenzgesetz-Indexprofil n2 (r ) für verschiedene Werte von p.
beschrieben. Der Gradientenprofilparameter 𝑝 bestimmt die Steilheit des Profils. Wie Abb. 10.7 zeigt, ist 𝑛2 (𝑟) für 𝑝 = 1 eine lineare Funktion von 𝑟 und für 𝑝 = 2 eine quadratische Funktion. Die Größe 𝑛2 (𝑟) wird immer steiler, je größer 𝑝 wird, und nähert sich für 𝑝 → ∞ schließlich einer Stufenfunktion. Die Stufenindexfaser ist damit ein Spezialfall der GRIN-Faser. Der Durchgang von Lichtstrahlen durch ein GRINMedium mit einem parabolischen Indexprofil wurde bereits in Abschnitt 1.3 besprochen. Strahlen in Meridionalebenen folgen oszillierenden ebenen Trajektorien, wohingegen schiefe Strahlen helikalen Trajektorien folgen, deren Umkehrpunkte im Allgemeinen zylindrische kaustische Oberflächen bilden, wie Abb. 10.8 zeigt. Geführte Strahlen sind im Kern eingeschlossen und erreichen den Mantel nicht. Die numerische Apertur einer GRIN-Faser kann bestimmt werden, indem man den größten Winkel bestimmt, unter dem Strahlen einfallen dürfen, sodass sie noch innerhalb des GRIN-Kerns geführt zu werden, ohne den Mantel zu erreichen. Für meridionale Strahlen in einer GRIN-Faser mit parabolischem Indexprofil ist die numerische Apertur durch Gl. (10.3) gegeben (siehe Übung 1-9).
10.2.1 Helmholtzgleichung Eine optische Faser ist ein dielektrisches Medium mit dem Brechungsindex 𝑛(𝑟). In einer Stufenindexfaser ist im Kern (für 𝑟 < 𝑎) 𝑛(𝑟) = 𝑛1 und im Mantel (für 𝑟 > 𝑎) 𝑛(𝑟) = 𝑛2 . In einer GRIN-Faser ist 𝑛(𝑟) im Kern eine kontinuierliche Funktion und hat einen konstanten Wert 𝑛(𝑟) = 𝑛2 im Mantel. In jedem Fall nehmen wir an, dass der Außenradius 𝑏 des Mantels so groß ist, dass wir ihn als unendlich annehmen können, wenn wir geführtes Licht im Kern und in der Nähe der Grenzfläche zwischen Kern und Mantel betrachten. Jede der Komponenten der monochromatischen elektrischen und magnetischen Felder gehorcht der Helmholtzgleichung ∇2 𝑈 + 𝑛2 (𝑟)𝑘02 𝑈 = 0 mit 𝑘0 = 2π∕𝜆0 . Diese Gleichung gilt in jedem der beiden Bereiche einer Stufenindexfaser exakt und innerhalb des Kerns einer GRIN-Faser näherungsweise, so lange sich 𝑛(𝑟) innerhalb einer Wellenlänge nur langsam ändert (siehe Ab-
meridionaler Strahl
0 R0 a r
0 rl R l a r (a)
schiefer Strahl (b)
Abb. 10.8 Geführte Strahlen im Kern einer GRIN-Faser. (a) Ein meridionaler Strahl in einer meridionalen Ebene innerhalb eines Zylinders mit Radius R0 . (b) Ein schiefer Strahl folgt einer schraubenförmigen Trajektorie zwischen zwei
zylindrischen Schalen mit den Radien rl und Rl . Für ein parabolisches Indexprofil ergibt die Projektion der Trajektorie eine stationäre Ellipse wie in Abb. 1.34.
293
294
10 Faseroptik
x
zu definieren, sodass für die geführten Wellen 𝑘t2 und 𝛾 2 positiv und 𝑘t und 𝛾 reell sind. Gleichung (10.8) kann dann für Kern und Mantel getrennt formuliert werden:
Er z E
Ez
r
2
d 𝑢 1 d𝑢 𝑙2 + + (𝑘t2 − 2 ) 𝑢 = 0, 2 𝑟 d𝑟 𝑟 d𝑟
z
𝑟 𝑛2 𝑘0 ). Es ist daher zweckmäßig, die Größen 𝑘t2 = 𝑛12 𝑘02 − 𝛽 2
(10.9a)
und 𝛾 2 = 𝛽 2 − 𝑛22 𝑘02
(10.9b)
u(r)
l =0
Die Gln. (10.10) sind bekannte Differentialgleichungen, deren Lösungen die Besselfunktionen sind. Wenn wir Funktionen ausschließen, die bei 𝑟 = 0 im Kern oder bei 𝑟 → ∞ gegen unendlich gehen, erhalten wir die geführten Lösungen: 𝑢(𝑟) ∝ {
𝐽𝑙 (𝑘t 𝑟), 𝑟 < 𝑎
(Kern) ,
𝐾𝑙 (𝛾𝑟),
(Mantel) ,
𝑟>𝑎
(10.11)
wobei 𝐽𝑙 (𝑥) eine Besselfunktion erster Art der Ordnung 𝑙 ist und 𝐾𝑙 (𝑥) eine modifizierte Besselfunktion zweiter Art der Ordnung 𝑙. Die Funktion 𝐽𝑙 (𝑥) oszilliert wie die Sinus- oder Kosinusfunktion, aber mit einer abklingenden Amplitude. Die Funktion 𝐾𝑙 (𝑥) klingt bei großen 𝑥 exponentiell ab. Zwei Beispiele für die radiale Verteilung 𝑢(𝑟) sind in Abb. 10.10 gezeigt. Die Parameter 𝑘t und 𝛾 bestimmen die Geschwindigkeit der Änderung von 𝑢(𝑟) im Kern bzw. im Mantel. Ein großer Wert von 𝑘t bedeutet eine stärkere Oszillation der radialen Verteilung im Kern. Ein großer Wert von 𝛾 bedeutet ein schnelleres Abklingen und geringeres Eindringen der Welle in den Mantel. Wie wir aus Gl. (10.9) sehen können, ist die Summe der Quadrate von 𝑘t und 𝛾 eine Konstante ( ) 𝑘t2 + 𝛾 2 = 𝑛12 − 𝑛22 𝑘02 = (NA)2 ⋅ 𝑘02 , (10.12) sodass 𝛾 mit steigendem 𝑘t abnehmen muss und das Feld tiefer in den Mantel eindringt. Für Werte von 𝑘t größer als NA ⋅ 𝑘0 wird die Größe 𝛾 imaginär und die Welle ist nicht mehr auf den Kern begrenzt. l =3
J3(kt r) K3(γ r)
K0(γ r) 0
(Mantel) . (10.10b)
u(r)
J0(kt r)
0
𝑟>𝑎
a
r
0
0
Abb. 10.10 Beispiele der radialen Verteilung u(r ) aus Gl. (10.11) für l = 0 und l = 3. Die schattierten und unschattierten Flächen bezeichnen den Faserkern bzw. -mantel. Die Parameter kt und 𝛾 und die beiden Proportionalitätskonstan-
a
r
ten in Gl. (10.11) sind so gewählt, dass u(r ) stetig ist und eine stetige Ableitung bei r = a besitzt. Größere Werte von kt und 𝛾 führen zu einer größeren Zahl von Oszillationen in u(r ).
10.2 Geführte Wellen
Der V -Parameter
Es ist zweckmäßig, 𝑘t und 𝛾 zu normieren, indem man die Größen X = 𝑘t 𝑎 ,
Y = 𝛾𝑎
(10.13)
definiert. Aus Gl. (10.12) ergibt sich dann 2
2
X +Y =V
2
(10.14)
mit V = NA ⋅ 𝑘0 𝑎 und daraus V = 2π
𝑎 NA . 𝜆0
𝑘t𝑙𝑚 und 𝛾𝑙𝑚 bezeichnet. Eine Mode wird daher durch die Indizes 𝑙 und 𝑚 beschrieben, die ihre azimutalen bzw. radialen Verteilungen charakterisieren. Die Funktion 𝑢(𝑟) hängt sowohl von 𝑙 als auch von 𝑚 ab; 𝑙 = 0 entspricht meridionalen Strahlen. Außerdem gibt es zwei unabhängige Anordnungen der Vektoren E und H für jede Mode, die den beiden Polarisationszuständen entsprechen. Die Klassifikation und das Bezeichnung dieser Anordnungen sind im Allgemeinen sehr kompliziert (Details sind in der Weiterführenden Literatur zu finden).
(10.15)
Dabei müssen wir stets im Blick behalten, dass X kleiner sein muss als V , damit die Welle geführt wird. Wie wir bald sehen werden, ist V ein wichtiger Parameter, der die Zahl von Moden der Faser und ihre Ausbreitungskonstante bestimmt. Es wird als Faserparameter oder V -Parameter bezeichnet. Er ist direkt proportional zum Verhältnis 𝑎∕𝜆0 von Radius zu Wellenlänge und zur numerischen Apertur NA. Gleichung (10.15) ähnelt Gl. (9.25) für die Zahl von TE-Moden in einem ebenen dielektrischen Wellenleiter. Moden
Wir betrachten jetzt die Randbedingungen. Wir beginnen, indem wir die axialen Komponenten der komplexen Amplituden 𝐸𝑧 und 𝐻𝑧 des elektrischen und magnetischen Feldes in der Form von Gl. (10.7) schreiben. Die Bedingung, dass diese Komponenten an der Grenzfläche 𝑟 = 𝑎 zwischen Mantel und Kern stetig sein müssen, liefert eine Beziehung zwischen den Proportionalitätskonstanten in Gl. (10.11), sodass wir nur jeweils eine Unbekannte für 𝐸𝑧 und 𝐻𝑧 haben. Mithilfe der maxwellschen Gleichungen i𝜔𝜀0 𝑛2 E = ∇ × H und −i𝜔𝜇0 H = ∇ × E [siehe Gln. (5.53) und (5.54)] können wir die verbleibenden vier Komponenten 𝐸𝜙 , 𝐻𝜙 , 𝐸𝑟 und 𝐻𝑟 durch 𝐸𝑧 und 𝐻𝑧 ausdrücken. Die Forderung nach Stetigkeit von 𝐸𝜙 und 𝐻𝜙 bei 𝑟 = 𝑎 ergibt zwei zusätzliche Gleichungen. Eine Gleichung verknüpft die beiden unbekannten Proportionalitätskonstanten in 𝐸𝑧 und 𝐻𝑧 ; die andere liefert eine Bedingung für die Ausbreitungskonstante 𝛽. Diese Bedingung, die charakteristische Gleichung oder Dispersionsrelation, ist eine Gleichung für 𝛽 mit dem Verhältnis 𝑎∕𝜆0 und den Brechungsindizes 𝑛1 und 𝑛2 der Faser als bekannte Parameter. Die charakteristische Gleichung hat mehrere Lösungen für jeden azimutalen Index 𝑙, die die diskreten Ausbreitungskonstanten 𝛽𝑙𝑚 (mit 𝑚 = 1, 2, …) der Moden liefern. Die entsprechenden Werte von 𝑘t und 𝛾, die die räumlichen Verteilungen im Kern bzw. Mantel angeben, werden mithilfe von Gl. (10.9) bestimmt und mit
Charakteristische Gleichung (schwach führende Faser)
Die meisten Fasern sind schwach führend (d. h. 𝑛1 ≈ 𝑛2 oder 𝛥 ≪ 1), sodass die geführten Strahlen paraxial sind, d. h. näherungsweise parallel zur Faserachse. Die Längskomponenten der elektrischen und magnetischen Felder sind dann viel schwächer als die transversalen Komponenten, und die geführten Wellen sind in guter Näherung transversal elektromagnetisch (TEM). Die linearen Polarisationen in 𝑥- und 𝑦-Richtung sind dann orthogonale Polarisationszustände; die linear polarisierte (𝑙, 𝑚)Mode wird gewöhnlich als LP𝑙𝑚 Mode bezeichnet. Die beiden Polarisationen der Mode (𝑙, 𝑚) breiten sich mit derselben Ausbreitungskonstante aus und haben dieselbe räumliche Verteilung. Es zeigt sich, dass die nach dem zuvor beschriebenen Verfahren bestimmte charakteristische Gleichung in guter Näherung äquivalent zu den Bedingungen ist, dass die skalare Funktion 𝑢(𝑟) in Gl. (10.11) stetig sein und eine stetige Ableitung bei 𝑟 = 𝑎 besitzen soll. Diese zwei Bedingungen sind für (𝑘t 𝑎)𝐽𝑙′ (𝑘t 𝑎) 𝐽𝑙 (𝑘t 𝑎)
=
(𝛾𝑎)𝐾𝑙′ (𝛾𝑎)
(10.16)
𝐾𝑙 (𝛾𝑎)
erfüllt. Die Ableitungen 𝐽𝑙′ und 𝐾𝑙′ der Besselfunktionen erfüllen die Identitäten 𝐽𝑙 (𝑥) , 𝑥 𝐾𝑙 (𝑥) 𝐾𝑙′ (𝑥) = −𝐾𝑙∓1 (𝑥) ∓ 𝑙 . 𝑥 𝐽𝑙′ (𝑥) = ±𝐽𝑙∓1 (𝑥) ∓ 𝑙
(10.17) (10.18)
Wenn wir diese Identitäten in Gl. (10.16) einsetzen und die normierten Parameter X = 𝑘t 𝑎 und Y = 𝛾𝑎 verwenden, erhalten wir die charakteristische Gleichung X
𝐽𝑙±1 (X ) 𝐽𝑙 (X )
= ±Y
𝐾𝑙±1 (Y ) 𝐾𝑙 (Y )
√ ,
Y=
2
2
V −X .
(10.19)
Wenn V und 𝑙 gegeben sind, enthält die charakteristische Gleichung nur noch eine unbekannte Variable X . Es gilt
295
296
10 Faseroptik
linke Seite =
J 1( ) J0( )
rechte K 1( ), Seite = K0( ) 2– 2
0
2
4
6
8
Abb. 10.11 Graphische Konstruktion zur Lösung der charakteristischen Gleichung (10.19). Die linke und rechte Seite der Gleichung werden als Funktionen von X aufgetragen; die Schnittpunkte sind die Lösungen. Die linke Seite hat mehrere Zweige, die die Abszisse bei den Wurzeln von Jl±1 (X ) schneiden. Die rechte Seite schneidet jeden Zweig einmal
und trifft die Abszisse bei X = V . Die Zahl von Moden ist daher gleich der Zahl der Wurzeln von Jl±1 (X ), die kleiner als V ist. In dieser Auftragung ist l = 0 und V = 10, und entweder die positiven oder die negativen Vorzeichen in Gl. (10.19) können verwendet werden.
𝐽−𝑙 (𝑥) = (−1)𝑙 𝐽𝑙 (𝑥) und 𝐾−𝑙 (𝑥) = 𝐾𝑙 (𝑥), sodass die Gleichung unverändert bleibt, wenn 𝑙 durch −𝑙 ersetzt wird. Die charakteristische Gleichung kann graphisch gelöst werden, indem man ihre rechte und linke Seite gegen X aufträgt und die Schnittpunkte bestimmt. Wie in Abb. 10.11 für 𝑙 = 0 gezeigt ist, hat die linke Seite der Gleichung mehrere Zweige, während die rechte Seite monoton mit zunehmenden X abnimmt, bis sie bei X = V (Y = 0) verschwindet. Es gibt daher mehrere Schnittpunkte im Intervall 0 < X ≤ V . Jeder Schnittpunkt entspricht einer Fasermode mit einem anderen Wert von X . Diese Werte werden in der Reihenfolge abnehmender X mit X 𝑙𝑚 , 𝑚 = 1, 2, … , 𝑀𝑙 bezeichnet. Wenn die X 𝑙𝑚 bestimmt sind, ermöglichen die Gln. (10.13), (10.9) und (10.11) die Berechnung der entsprechenden transversalen Ausbreitungskonstante 𝑘t𝑙𝑚 , der Dämpfungskonstante 𝛾𝑙𝑚 , der Ausbreitungskonstante 𝛽𝑙𝑚 und der radialen Verteilungsfunktion 𝑢𝑙𝑚 (𝑟). Die Kurven in Abb. 10.11 ähneln denen aus Abb. 9.12 für die Moden eines ebenen dielektrischen Wellenleiters. Jede Mode hat eine charakteristische radiale Verteilung. Beispielsweise gehören die beiden radialen Verteilungen 𝑢(𝑟) in Abb. 10.10 zu der LP01 -Mode (𝑙 = 0, 𝑚 = 1) in einer Faser mit V = 5 bzw. der LP34 -Mode (𝑙 = 3, 𝑚 = 4) in einer Faser mit V = 25. Alle Moden mit 𝑙 > 0 existieren in Paaren mit azimutalen Anteilen von exp(±i𝑙𝜙), ganz analog zu den in Abschnitt 3.4 diskutierten Laguerre-Gauß-Strahlen. Da die (𝑙, 𝑚)- und die (−𝑙, 𝑚)-Moden dieselbe Ausbreitungskonstante haben, können wir mehr über das azimutale Verhalten der Moden erfahren, indem wir die transversale Intensitätsverteilung ihrer beiden Superpositionen mit gleichen Gewichten untersuchen (siehe die Bemerkungen zu Abb. 3.25). Die komplexe Amplitude der Summe ist proportional zu 𝑢𝑙𝑚 (𝑟) cos 𝑙𝜙 exp(−i𝛽𝑙𝑚 𝑧). Ihre Intensi-
Tab. 10.1 V -Parameter für LPlm -Moden niedriger Ordnung.a) l
m=
1
2
3
4
5
0 1
0 2.405
3.832 5.520
7.016 8.654
10.174 11.792
13.324 14.931
2 3 4
3.832 5.136 6.380
7.016 8.417 9.761
10.174 11.620 13.015
13.324 14.796 16.224
16.471 17.960 19.409
5 6
7.588 8.772
11.065 12.339
14.373 15.700
17.616 18.980
20.218 22.218
a) Die Grenzwerte der 𝑙 = 0-Moden liegen bei den Wurzeln von 𝐽−1 (X ) = −𝐽1 (X ). Die 𝑙 = 1-Moden werden an den Wurzeln von 𝐽0 (X ) abgeschnitten usw. 2 tät, die zu 𝑢𝑙𝑚 (𝑟) cos2 𝑙𝜙 proportional ist, ist in Abb. 10.12 für eine Reihe von Moden LP𝑙𝑚 gezeigt.
Modengrenzwerte
Aus der graphischen Konstruktion in Abb. 10.11 ist offensichtlich, dass mit steigendem V die Zahl von Schnittpunkten (Moden) zunehmen muss, da die linke Seite der charakteristischen Gleichung (10.19) nicht von V abhängt, wohingegen die rechte Seite sich mit steigendem V nach rechts verschiebt. Wenn wir das negative Vorzeichen in der charakteristischen Gleichung betrachten, dann schneiden die Zweige der linken Seite die Abszisse für 𝐽𝑙−1 (X ) = 0. Diese Wurzeln werden mit x𝑙𝑚 (mit 𝑚 = 1, 2, …) bezeichnet. Die Zahl 𝑀𝑙 der Moden ist daher gleich der Zahl von Wurzeln von 𝐽𝑙−1 (X ), die kleiner sind als V . Die Mode (𝑙, 𝑚) ist erlaubt, solange V > x 𝑙𝑚 ist. Die kleinste Wurzel von 𝐽𝑙−1 (X ) ist x 01 = 0 für 𝑙 = 0, und die nächstkleinere ist x11 = 2.405 für 𝑙 = 1. Die numerischen Werte einiger dieser Wurzeln sind in Tabelle 10.1 angegeben.
10.2 Geführte Wellen
LP01
LP11
LP12
LP31
Abb. 10.12 Transversale Intensitätsverteilungen mehrere LPlm -Moden für eine Stufenindexfaser mit dem Faserparameter V = 10. Die weißen Kreise geben die Grenzflächen Kern/Mantel an. Die Intensitätsverteilung der LP01 Grundmode ähnelt der des in Abb. 3.1 dargestellten Gauß-
strahls. Jedes Bild zeigt eine Superposition eines Paars von Moden mit identischen Beträgen von I, aber unterschiedlichen Vorzeichen. Die Intensitätsverteilungen sind proportional zu cos2 l𝜙 und enthalten somit 2l azimutale Interferenzstreifen.
Für V < 2.405 sind alle Moden mit Ausnahme der Grundmode LP01 verboten; die Faser wirkt dann als Einmodenwellenleiter. Die Bedingung für die Einmodenbetrieb ist daher
Die Zahl der Moden
V < 2.405 .
Die Auftragung der Zahl 𝑀𝑙 von Moden als Funktion von V nimmt daher die Form einer Stufenfunktion an, die bei jeder Wurzel x 𝑙𝑚 der Besselfunktion 𝐽𝑙−1 (X ) um eins zunimmt. Abbildung 10.13 zeigt die Gesamtzahl 𝑀 aller Moden (für alle Werte von 𝑙) als Funktion von V . Jede Wurzel muss zweimal gezählt werden, da es zu jeder Mode mit dem azimutalen Index 𝑙 > 0 eine entsprechende Mode −𝑙 gibt, die abgesehen von dem entgegengesetzten Drehsinn des Winkels 𝜙 mit der ersten identisch ist (entsprechend Strahlen mit helikalen Trajektorien von entgegengesetztem Drehsinn), wie man sieht, wenn man die Pluszeichen in der charakteristischen Gleichung verwendet. Außerdem hat jede Mode zwei Polarisationszustände und muss daher zweimal gezählt werden.
(10.20)
LP41
8
LP51
LP71
LP42
LP13
Abb. 10.13 Gesamtzahl M von Moden als Funktion des Faserparameters V = 2π(a∕𝜆0 )NA. In der Zählung eingeschlossen sind die beiden entgegengesetzt helikalen Varianten für jede Mode mit l > 0 und die beiden Polarisationen pro Mode. Für V < 2.405 gibt es nur eine einzige Mode, die Grundmode LP01 mit zwei Polarisationen. Für V = 4 kommen die Moden LP11 und LP21 mit jeweils zwei Drehsinnen sowie LP01 und LP02 hinzu; Berücksichtigung der beiden Polarisationen pro Mode führt zu insgesamt 12 Moden. Die gestri2 chelte Kurve zeigt die Beziehung M = (1∕2)V aus Gl. (10.23), die für V ≫ 1 näherungsweise die Zahl der Moden angibt.
LP12
7
LP03 LP22
9
LP32
10
LP61
Da V proportional zur optischen Frequenz ist [siehe Gl. (10.15)], liefert die in Gl. (10.20) angegebene Bedingung für die Grundmode eine entsprechende Grenzfrequenz 1 𝑐0 𝜈k = 𝜔k ∕2π = . (10.21) NA 2.61𝑎 Im Vergleich dazu ist die Grenzfrequenz der Mode niedrigster Ordnung in einem dielektrischen Plattenwellenleiter der Breite d nach Gl. (9.27) gleich 𝜈k = (1∕NA)(𝑐0 ∕2d ).
LP21
LP31
6
LP02
5
LP11
4
LP01
3 2 1 0 0
10
20
30 40 Zahl M der Moden
50
60
297
298
10 Faseroptik
Es gibt keine exakten expliziten Ausdrücke für die Wurzeln von 𝐽𝑙 (X ). Für X ≫ 𝑙2 können wir jedoch 𝐽𝑙 (X ) ≈ 1 π (2∕πX )1∕2 cos[X − (𝑙 + ) ] schreiben, und daher sind 2 2 1 π die Wurzeln x 𝑙𝑚 näherungsweise durch x𝑙𝑚 = (𝑙 + ) + 2 2 π 1 π (2𝑚 − 1) = (𝑙 + 2𝑚 − ) gegeben. Mithilfe dieser Be2 2 2 ziehung können wir die Zahl der Moden für Fasern mit großem V -Parameter und daher vielen Moden abschätzen. Die Cutoffpunkte der Moden (𝑙, 𝑚), die durch die Wurzeln von 𝐽𝑙±1 (X ) gegeben sind, sind für große 𝑚 gleich ( )π 1 π x𝑙𝑚 ≈ 𝑙 + 2𝑚 − ± 1 ≈ (𝑙 + 2𝑚) , 2 2 2 (10.22) 𝑙 = 0, 1, … (𝑚 ≫ 1) . Für festes 𝑙 liegen diese Wurzeln äquidistant in Abständen von π, sodass die Zahl 𝑀𝑙 der Wurzeln die Bezieπ hung 𝑙 + 𝑚π = V erfüllt, woraus 𝑀𝑙 ≈ V ∕π − 𝑙∕2 folgt. 2 Also nimmt 𝑀𝑙 linear mit zunehmendem 𝑙 ab, von 𝑀𝑙 ≈ V ∕π für 𝑙 = 0 bis 𝑀𝑙 = 0 für 𝑙 = 𝑙max , wobei 𝑙max = 2V ∕π ist. Wenn wir nun noch für 𝑙 > 0 die beiden Freiheitsgrade für positives und negatives 𝑙 sowie die beiden Polarisationen für jeden Index (𝑙, 𝑚) berücksichtigen, erhalten wir für die Zahl der Moden schließlich 𝑀 = 2𝑀0 + ∑𝑙 ∑𝐿 1 4 𝑙max 𝑀𝑙 . Mit der Beziehung 𝑙 = 1 𝑙 = 𝐿(𝐿 + 1) erhal=1 2
2
ten wir daraus die Näherung 𝑀 ≈ (4∕π2 )V . Diese Gleichung unterschätzt die wahre Zahl der Moden jedoch, weil 𝑀𝑙 auch Moden kleinerer Ordnungen enthält, deren Abstände kleiner als π sind, wie Tabelle 10.1 beweist. Wie Abb. 10.13 zeigt, liefert die Beziehung 1
2
𝑀≈ V , 2
(10.23)
die man mithilfe einer Betrachtung auf der Grundlage quasi-ebener Wellen [siehe Abschnitt 10.2.4, Gl. (10.40)] erhalten kann, eine gute Näherung für die exakte Zahl der Moden. Nach Gl. (10.23) ist die Zahl 𝑀 der Moden in einem zylindrischen Wellenleiter für große V näherungsweise 1 2 𝑀 ≈ V = 2π(π𝑎2 ∕𝜆02 )(NA)2 . Dieser Ausdruck ist ana2 log zu dem aus Gl. (9.46) für Wellenleiter mit rechteckigem Querschnitt d 2 , wo wir 𝑀 ≈ 2π(d ∕𝜆0 )2 (NA)2 erhalten hatten, wenn sowohl TE- als auch TM-Moden gezählt werden. Beispiel 10-2: Die ungefähre Zahl der Moden
Eine Quarzglasfaser mit 𝑛1 = 1.452 hat √ und 𝛥 = 0.01 √ 2 2 die numerische Apertur NA = 𝑛1 − 𝑛2 ≈ 𝑛1 2𝛥 ≈ 0.205. Wenn 𝜆0 = 1.55 μm ist und der Kernradius 𝑎 = 20 μm beträgt, ist V = 2π(𝑎∕𝜆0 )NA ≈ 16.6. Es gibt da1 2 her näherungsweise 𝑀 ≈ V ≈ 138 Moden. Wenn 2 der Mantel entfernt wird, sodass der Kern im direkten Kontakt mit der Luft steht, für die 𝑛2 = 1 und NA = 1 gilt, folgt V = 81.1 und es sind etwa 3286 Moden erlaubt.
Ausbreitungskonstanten und Gruppengeschwindigkeiten
Wie zuvor gezeigt können die Ausbreitungskonstanten bestimmt werden, indem man die charakteristische Gleichung (10.19) für die X 𝑙𝑚 löst und die Gln. (10.9a) 2 und (10.13) benutzt, um 𝛽𝑙𝑚 = (𝑛12 𝑘02 − X 𝑙𝑚 ∕𝑎2 )1∕2 zu er√ halten. Wegen V = 2π(𝑎∕𝜆0 )NA und NA = 𝑛1 2𝛥 ist 2 𝛽𝑙𝑚 = 𝑛1 𝑘0 (1 − 2𝛥X 𝑙𝑚 ∕V )1∕2√. Weil 𝛥 ≪ 1 und X 𝑙𝑚 < V ist, können wir die Näherung 1 + 𝛿 ≈ 1 + 𝛿∕2 für |𝛿| ≪ 1 benutzen und erhalten so 2
X 𝑙𝑚 )2
𝛽𝑙𝑚 ≈ 𝑛1 𝑘0 [1 −
V
2
𝛥] .
(10.24)
Für Fasern mit großem V entsprechend einer großen Zahl von Moden liegt x 𝑙𝑚 im Intervall 0 < X 𝑙𝑚 < V , sodass 𝛽𝑙𝑚 zwischen 𝑛1 𝑘0 und 𝑛1 𝑘0 (1 − 𝛥) ≈ 𝑛2 𝑘0 variiert, genau wie die Strahlenoptik vorhersagt. Um die Gruppengeschwindigkeit der Mode (𝑙, 𝑚) zu bestimmen, drücken wir 𝛽𝑙𝑚 als explizite Funktion von 𝜔 aus, indem wir 𝑛1 𝑘0 = 𝜔∕𝑐1 und V = 𝑎(𝜔∕𝑐0 )NA in Gl. (10.24) einsetzen und (d𝛽𝑙𝑚 ∕ d𝜔)−1 berechnen. Wenn wir annehmen, dass 𝑐1 und 𝛥 nicht von 𝜔 abhängen und die für |𝛿| ≪ 1 gültige Näherung (1 + 𝛿)−1 ≈ 1 − 𝛿 verwenden, erhalten wir für die Gruppengeschwindigkeit 2
𝑣𝑙𝑚 ≈ 𝑐1 [1 +
X 𝑙𝑚 V
2
𝛥] .
(10.25)
Für V ≫ 1 ändert sich die Gruppengeschwindigkeit näherungsweise zwischen 𝑐1 und 𝑐1 (1 − 𝛥) = 𝑐1 (𝑛2 ∕𝑛1 ). Daher sind die Gruppengeschwindigkeiten der Moden niedriger Ordnung näherungsweise gleich der Phasengeschwindigkeit des Kernmaterials, wohingegen die der Moden höherer Ordnung kleiner sind. Die relative Änderung der Gruppengeschwindigkeit zwischen der schnellsten und der langsamsten Mode ist näherungsweise gleich 𝛥, der relativen Änderung des Brechungsindex der Faser. Fasern mit großem 𝛥 besitzen eine große Zahl von Moden, große Modendispersion und folglich eine starke Verbreiterung der Pulse, obwohl sie eine große numerische Apertur NA und daher eine große Kapazität zur Lichtsammlung besitzen. Diese Effekte sind besonders ausgeprägt, wenn der Mantel völlig entfernt wird.
10.2.3
Einmodenfasern
Wie früher diskutiert ist eine Faser mit dem Kernradius 𝑎 und der numerischen Apertur NA eine Einmodenfaser in der Grundmode LP01 , wenn V = 2π(𝑎∕𝜆0 )NA < 2.405 ist. Einmodenbetrieb wird daher durch einen kleinen Kerndurchmesser und eine kleine numerische Apertur (in diesem Fall liegen 𝑛2 und 𝑛1 na-
10.2 Geführte Wellen
n – n1 n1 – n2 1
Abb. 10.14 Schematische Darstellung der Ausbreitungseigenschaften der Grundmode LP01 . (a) Effektiver Brechungsindex n = 𝛽∕k0 als Funktion des V -Parameters. (b) Dispersionsrelation (𝜔 gegen 𝛽01 ).
ω
n = n1
Lichtlinie ω = c2 β (b)
(a)
Lichtlinie ω = c1 β
n = n2
0 0
10
0
0
he beieinander) oder durch eine hinreichend kleine optische Frequenz [unter der Grenzfrequenz 𝜈k = (1∕NA)(𝑐0 ∕2.61𝑎)] erreicht. Die Grundmode hat eine glockenförmige räumliche Verteilung ähnlich der Gaußfunktion [siehe Abb. 10.10 für 𝑙 = 0 und Abb. 10.12(a)]. Sie ergibt die höchste Eingrenzung der Lichtleistung innerhalb des Kerns. Beispiel 10-3: Einmodenbetrieb
Eine Quarzglasfaser mit 𝑛1 = 1.447 und 𝛥 = 0.01 (NA = 0.205) arbeitet bei 𝜆0 = 1.3 μm als Einmodenfaser, wenn V = 2π(𝑎∕𝜆0 )NA < 2.405 ist, d. h. wenn der Kerndurchmesser 2𝑎 < 4.86 μm ist. Wenn 𝛥 auf 0.0025 reduziert wird, wird Einmodenbetrieb für einen Durchmesser 2𝑎 < 9.72 μm erreicht. Die Abhängigkeit des effektiven Brechungsindex 𝑛 = 𝛽∕𝑘0 von dem V -Parameter für die Grundmode ist in Abb. 10.14(a) gezeigt, und die entsprechende Dispersionsrelation (𝜔 gegen 𝛽) ist in Abb. 10.14(b) illustriert. Wenn der 𝑉-Parameter zunimmt, d. h. die Frequenz oder der Faserdurchmesser größer werden, steigt der effektive Brechungsindex 𝑛 von 𝑛2 auf 𝑛1 . Das ist zu erwarten, da die Mode bei kleineren Wellenlängen stärker im Kern eingegrenzt wird. Einmodenfasern bieten zahlreiche Vorteile für den Einsatz in optischen Nachrichtensystemen. Wie bereits erwähnt breiten sich die Moden einer Vielmodenfaser mit unterschiedlichen Gruppengeschwindigkeiten aus, sodass ein kurzer Puls aus Vielmodenlicht unterschiedliche Verzögerungen erfährt und sich daher mit der Zeit verbreitert. Quantitative Maße für die Modendispersion werden in Abschnitt 10.3.2 untersucht. In einer Einmodenfaser gibt es dagegen nur eine Mode mit einer einzigen Gruppengeschwindigkeit, sodass ein kurzer Lichtpuls des Lichts ohne Verzerrung aufgrund von Verzögerungen ankommt. Wie in Abschnitt 10.3.2 erklärt wird, existiert auch für Pulse in Einmodenfasern eine Pulsverbreiterung aufgrund anderer dispersiver Mechanismen, aber diese sind wesentlich kleiner als die Modendispersion.
β01
Außerdem ist, wie in Abschnitt 10.3.1 gezeigt wird, die Leistungsdämpfung in einer Einmodenfaser geringer als in einer Vielmodenfaser. Zusammen mit der langsameren Pulsverbreiterung ermöglicht dies für die Übertragung durch Einmodenfasern wesentlich höhere Datengeschwindigkeiten als für die Übertragung durch Vielmodenfasern. Dieses Thema wird in den Kapiteln 23 und 25 weiter verfolgt. Ein anderes Problem von Vielmodenfasern entsteht durch die zufällige Interferenz der Moden. Infolge unkontrollierbarer Fehler der Faser, mechanischer Spannungen oder Temperaturschwankungen erfährt jede Mode eine stochastische Phasenverschiebung, sodass die Summe der komplexen Amplituden der Moden eine Intensität zeigt, die zeitlich und räumlich zufällig ist. Diese Zufälligkeit wird als Modenrauschen oder Granulationsmuster bezeichnet. Dieser Effekt ähnelt dem Verlust von Radiosignalen bei Übertragung über mehrere Wege. In einer Einmodenfaser gibt es nur einen Weg und daher kein Modenrauschen. Polarisationserhaltende Fasern
In einer Faser mit kreisförmigem Querschnitt besitzt jede Mode zwei unabhängige Polarisationszustände mit derselben Ausbreitungskonstante. So kann die Grundmode LP01 in einer schwach führenden Einmodenfaser in 𝑥- oder 𝑦-Richtung polarisiert sein; die beiden orthogonalen Polarisationen haben dieselbe Ausbreitungskonstante und dieselbe Gruppengeschwindigkeit. Im Prinzip sollte es keinen Austausch von Leistung zwischen den beiden Polarisationskomponenten geben. Wenn die Leistung der Lichtquelle exklusiv in einer Polarisation ankommt, sollte die Leistung in dieser Polarisation verbleiben. In der Praxis resultieren kleine zufällige Fehler und unkontrollierbare mechanische Beanspruchungen der Faser in einer stochastischen Leistungsübertragung zwischen den beiden Polarisationen, wie Abb. 10.15 illustriert. Eine solche Kopplung wird erleichtert, weil die zwei Polarisationen dieselbe Ausbreitungskonstante haben und ihre Phasen daher identisch sind. So wird das linear polarisierte Licht am Fasereingang in der Regel
299
300
10 Faseroptik
Polarisation (a)
t t
(b)
t
polarisationserhaltende Faser
t
t
t t
Abb. 10.15 (a) Ideale polarisationserhaltende Faser. (b) Zufällige Übertragung der Leistung zwischen zwei Polarisationen.
konventionelle Faser
in elliptisch polarisiertes Licht am Faserausgang transformiert. Obwohl die optische Gesamtleistung konstant bleibt (siehe Abb. 10.15), schwankt die Elliptizität des Lichts am Faserausgang infolge von Fluktuationen der Temperatur oder der mechanischen Spannungen oder der Quellwellenlänge zeitlich zufällig. Diese zufällige Aufteilung der Leistung zwischen den beiden Polarisationskomponenten ist kein Problem, wenn es nur darum geht, Lichtleistung zu übertragen (sofern die gesamte ankommende Leistung genutzt wird). In vielen faseroptischen Anwendungen, z. B. in integriert-optischen Bauelementen, optischen Sensoren auf der Grundlage interferometrischer Techniken oder der kohärenten optischen Kommunikation, muss die Faser jedoch die komplexe Amplitude (Betrag und Phase) einer spezifischen Polarisation übertragen. Für solche Anwendungen sind polarisationserhaltende Fasern erforderlich. Um eine polarisationserhaltende Faser zu konstruieren, muss die kreisförmige Symmetrie der herkömmlichen Faser durch Verwendung von Fasern mit elliptischem Querschnitt oder Fasern mit spannungsinduzierter Anisotropie des Brechungsindex aufgegeben werden. Diese Maßnahmen beseitigen die Entartung der Polarisation und machen so die Ausbreitungskonstanten der beiden Polarisationen unterschiedlich. Die Einführung einer derartigen Phasenfehlanpassung reduziert den Wirkungsgrad der Kopplung.
10.2.4 Quasi-ebene Wellen in Stufenund Gradientenindexfasern Die Moden einer Gradientenindexfaser können wir bestimmen, indem wir die Helmholtzgleichung (10.6) mit 𝑛 = 𝑛(𝑟) lösen, um die Raumverteilungen der Feldkomponenten zu bestimmen, und mithilfe der maxwellschen Gleichungen und der Randbedingungen die charakteristische Gleichung aufzustellen, genau wie wir es für die Stufenindexfaser getan hatten. Dieses Verfahren ist jedoch in der Regel mit Schwierigkeiten verbunden. In diesem Abschnitt verwenden wir stattdessen einen Näherungsansatz, wobei wir die Feldverteilung durch eine quasi-ebene Welle beschreiben, die sich innerhalb
t
des Kerns annähernd in Richtung des optischen Strahls ausbreitet. Eine quasi-ebene Welle ist eine Welle, die lokal eine ebene Welle ist, aber ihre Richtung und Amplitude während der Ausbreitung allmählich ändert. Dieser Ansatz erlaubt es uns, die Einfachheit der Strahlenoptik beizubehalten, aber gleichzeitig die Phase der Welle in der Analyse mitzuführen, sodass wir die Selbstkonsistenzbedingung verwenden können, um die Ausbreitungskonstanten der geführten Moden zu bestimmen (genau wie bei dem ebenen dielektrischen Wellenleiter in Abschnitt 9.2). Diese Näherung, die auf der WKB-Methode (Wentzel-Kramers-Brillouin) beruht, ist nur auf Fasern mit einer großen Zahl von Moden (einem großen V -Parameter) anwendbar. Sie bietet uns gleichzeitig eine bequeme Möglichkeit, das Verhalten von Stufenindex- und Gradientenindexfasern zu vergleichen. Quasi-ebene Wellen
Wir betrachten eine Lösung der Helmholtzgleichung (10.6) in der Form einer quasi-ebenen Welle (siehe Abschnitt 2.3), 𝑈(r) = a(r) exp [−i𝑘0 S (r)] ,
(10.26)
wobei a(r) und S (r) reelle Funktionen des Ortes sind, die sich im Vergleich zur Wellenlänge 𝜆0 = 2π∕𝑘0 langsam ändern. Aus Gl. (2.31) wissen wir, dass S (r) näherungsweise die Eikonalgleichung |∇S |2 ≈ 𝑛2 erfüllt und dass sich die Strahlen in Richtung des Gradienten ∇S ausbreiten. Wenn wir 𝑘0 S (r) = 𝑘0 s(𝑟) + 𝑙𝜙 + 𝛽𝑧 setzen, wobei s(𝑟) eine langsam variierende Funktion von 𝑟 ist, dann liefert die Eikonalgleichung 2
(𝑘0
ds 𝑙2 ) + 𝛽 2 + 2 = 𝑛2 (𝑟)𝑘02 . 𝑟 d𝑟
(10.27)
Die lokale Ortsfrequenz der Welle in radialer Richtung ist die partielle Ableitung der Phase 𝑘0 S (r) nach 𝑟, 𝑘𝑟 = 𝑘0
ds , d𝑟
(10.28)
10.2 Geführte Wellen
x
kr
θ k
k kz
Abb. 10.16 (a) Der Wellenvektor k = (kr , k𝜙 , kz ) in Zylinderkoordinaten. (b) Quasi-ebene Welle in der Richtung eines Strahls.
z
y (a)
(b)
sodass Gl. (10.26) nun ⎛ 𝑟 ⎞ 𝑈(𝑟) = a(𝑟) exp ⎜−i ∫ 𝑘𝑟 d𝑟 ⎟ e−i𝑙𝜙 e−i𝛽𝑧 ⎜ ⎟ ⎝ 0 ⎠
(10.29)
wird; Gl. (10.27) ergibt dann 𝑘𝑟2 = 𝑛2 (𝑟)𝑘02 − 𝛽 2 −
𝑙2 . 𝑟2
(10.30)
Wir definieren 𝑘𝜙 = 𝑙∕𝑟, sodass exp(−i𝑙𝜙) = exp(−i𝑘𝜙 𝑟𝜙) ist, und 𝑘𝑧 = 𝛽; damit liefert Gl. (10.30) 𝑘𝑟2 + 𝑘𝜙2 + 𝑘𝑧2 = 𝑛2 (𝑟)𝑘02 . Die quasi-ebene Welle hat daher einen lokalen Wellenvektor k mit dem Betrag 𝑛(𝑟)𝑘0 und den Komponenten (𝑘𝑟 , 𝑘𝜙 , 𝑘𝑧 ) in Zylinderkoordinaten. Da 𝑛(𝑟) und 𝑘𝜙 Funktionen von 𝑟 sind, ist auch 𝑘𝑟 im Allgemeinen ortsabhängig. Die Richtung von k ändert sich nur langsam mit dem Ort 𝑟 (siehe Abb. 10.16) und folgt einer schraubenförmigen Trajektorie ähnlich der des schiefen Strahls, die wir früher untersucht hatten [Abb. 10.8(b)]. Um den Bereich des Kerns herauszufinden, in dem die Welle eingegrenzt wird, bestimmen wir die Werte von 𝑟, für die 𝑘𝑟 reell bzw. 𝑘𝑟2 > 0 ist. Für gegebene Werte von 𝑙 und 𝛽 tragen wir 𝑘𝑟2 = [𝑛2 (𝑟)𝑘02 − 𝑙2 ∕𝑟 2 − 𝛽 2 ] als Funktion von 𝑟 auf. Der Term 𝑛2 (𝑟)𝑘02 wird zuerst als Funktion von 𝑟 [durchgezogene Kurve in Abb. 10.17(a)] aufgetragen. Dann wird der Term 𝑙2 ∕𝑟 2 subtrahiert; das ergibt die gestrichelte Kurve. Der Wert von 𝛽 2 ist durch die dünne durchgezogene vertikale Linie gekennzeichnet. Daraus r
folgt, dass 𝑘𝑟2 durch die Differenz zwischen der gestrichelten Kurve und der dünnen durchgezogenen Linie gegeben ist, d. h. durch die schattierte Fläche. Bereiche mit positiven und negativen Werten von 𝑘𝑟2 sind durch die +- bzw. −-Zeichen gekennzeichnet. Für die Stufenindexfaser ist 𝑛(𝑟) = 𝑛1 für 𝑟 < 𝑎 und 𝑛(𝑟) = 𝑛2 für 𝑟 > 𝑎. In diesem Fall wird die quasiebene Welle durch Reflexion an der Grenzfläche zwischen Kern und Mantel bei 𝑟 = 𝑎 im Kern geführt. Wie Abb. 10.17(a) zeigt, ist der Bereich der Eingrenzung dann 𝑟𝑙 < 𝑟 < 𝑎 mit 𝑛12 𝑘02 −
n2(r) k02 – l 2/r2
–
𝑛2 (𝑟) 𝑘02 −
–
a
rl
n2(r)k02 – l 2/ r 2
Rl
+ k2r
n2(r) k02
n2(r) k20
+ kr2
rl
– 0
n22 k02 (a)
β2
n12 k20
0
(b)
– n2 k0 β2 2 2
(10.31)
Die Welle wird wie der in Abb. 10.4 gezeigte schiefe Strahl schraubenförmig hin und her reflektiert. Im Mantel (𝑟 > 𝑎) und im Kern in der Nähe des Zentrums (𝑟 < 𝑟𝑙 ) ist 𝑘𝑟2 negativ, sodass 𝑘𝑟 imaginär ist; hier klingt die Welle daher exponentiell ab, wobei 𝑟𝑙 von 𝛽 abhängt. Für große 𝛽 (oder große 𝑙) ist 𝑟𝑙 groß, sodass die Welle auf eine dünne zylindrische Schale in der Nähe der Grenzfläche zwischen Mantel und Kern eingegrenzt wird. Für die in Abb. 10.17(b) gezeigte Gradientenindexfaser ist 𝑘𝑟 im Bereich 𝑟𝑙 < 𝑟 < 𝑅𝑙 reell; dabei sind 𝑟𝑙 und 𝑅𝑙 die Wurzeln der Gleichung
r
a
𝑙2 − 𝛽2 = 0 . 𝑟𝑙2
n12 k20
𝑙2 − 𝛽2 = 0 . 𝑟2
(10.32)
Abb. 10.17 Die Abhängigkeit von n2 (r )k02 , n2 (r )k02 − l2 ∕r 2 und kr2 = n2 (r )k02 − l2 ∕r 2 − 𝛽 2 vom Ort r. Für jeden Wert von r ist kr2 die Breite der schattierten Fläche; die +- und −-Zeichen bezeichnen positive bzw. negative Werte von kr2 . (a) Stufenindexfaser: kr2 ist im Gebiet rl < r < a positiv. (b) Gradientenindexfaser: kr2 ist im Gebiet rl < r < Rl positiv.
301
302
10 Faseroptik
r n2(r) k20 – l2/r2
a
n2(r)k 02
l =6
0
Abb. 10.18 Die Ausbreitungskonstanten und Eingrenzungsbereiche der Fasermoden. Jede Kurve entspricht einem Index l; hier sind Werte von 0 bis 6 gezeigt. Jede Mode (entsprechend einem bestimmten Wert von m) ist schematisch durch zwei durch eine gestrichelte vertikale Linie verbundene Punkte gekennzeichnet. Die Ordinaten der Punkte kennzeichnen die Radien rl und Rl der zylindrischen Schale, auf die die Mode eingegrenzt ist. Auf der Abszisse sind die quadrierten Ausbreitungskonstanten 𝛽 2 der Moden aufgetragen.
5 4 3 2 1 0 n22 k02
0
n21k20
Daraus folgt, dass die Welle im Wesentlichen innerhalb einer zylindrischen Schale mit den Radien 𝑟𝑙 und 𝑅𝑙 eingegrenzt ist, genau wie bei der schraubenförmigen Strahltrajektorie in Abb. 10.8(b). Die Moden
Die Moden der Faser bestimmen wir, indem wir Selbstkonsistenz fordern, d. h. dass die Welle sich nach einer schraubenförmigen Periode der Reise zwischen 𝑟𝑙 und 𝑅𝑙 und zurück wieder selbst reproduziert. Die azimutale Weglänge für einen Winkel 2π muss folglich einem Vielfachen einer Phasenverschiebung von 2π entsprechen, d. h. 𝑘𝜙 2π𝑟 = 2π𝑙, 𝑙 = 0, ±1, ±2, … Diese Bedingung ist offensichtlich erfüllt, da 𝑘𝜙 = 𝑙∕𝑟 ist. Außerdem muss die radiale Weglänge für einen vollständigen Umlauf einer Phasenverschiebung um ein ganzzahliges Vielfaches von 2π entsprechen: 𝑅𝑙
2 ∫ 𝑘𝑟 d𝑟 = 2π𝑚 ,
𝑚 = 1, 2, … , 𝑀𝑙 ,
(10.33)
𝑟𝑙
wobei für die Stufenindexfaser 𝑅𝑙 = 𝑎 ist. Diese Bedingung liefert die charakteristische Gleichung, aus der die Ausbreitungskonstanten 𝛽𝑙𝑚 der Moden bestimmt werden können. Diese Werte sind schematisch in Abb. 10.18 gezeigt; die Mode 𝑚 = 1 hat den größten Wert von 𝛽 (näherungsweise 𝑛1 𝑘0 ), wohingegen 𝑚 = 𝑀𝑙 den kleinsten Wert (näherungsweise 𝑛2 𝑘0 ) besitzt. Das WKB-Verfahren, das für oszillierende Lösungen zwischen Umkehrpunkten anwendbar ist, liefert genauere Ergebnisse: die Größen 𝑙2 und 𝑚 in den obigen Bezie1 1 hungen müssen durch 𝑙2 + bzw. 𝑚 + ersetzt werden. 4 4 Diese Korrekturen sind insbesondere für kleine Werte von 𝑙 und 𝑚 von Bedeutung.
β2
Die Zahl der Moden
Die Gesamtzahl der Moden kann bestimmt werden, indem man die Zahl 𝑀𝑙 der Moden für 𝑙 = 0, 1, … , 𝑙max summiert. Wir führen die Berechnung jedoch nach einem anderen Verfahren durch. Zuerst bestimmen wir die Zahl 𝑞𝛽 der Moden mit Ausbreitungskonstanten größer einem gegebenen Wert 𝛽. Für jedes 𝑙 ist die Zahl 𝑀𝑙 (𝛽) der Moden mit einer Ausbreitungskonstante größer 𝛽 gleich dem durch das Integral in Gl. (10.33) gegebenen Vielfachen von 2π, d. h. 𝑅𝑙
𝑅𝑙
1 1 𝑀𝑙 (𝛽) = ∫ 𝑘𝑟 d𝑟 = ∫ π π 𝑟𝑙
𝑟𝑙
√ 𝑛2 (𝑟)𝑘02 −
𝑙2 − 𝛽 2 d𝑟 , 𝑟2 (10.34)
wobei 𝑟𝑙 und 𝑅𝑙 die Radien des Eingrenzungsbereichs entsprechend der Ausbreitungskonstante 𝛽 sind, die durch Gl. (10.32) gegeben sind. Offensichtlich hängen 𝑟𝑙 und 𝑅𝑙 von 𝛽 ab, und für die Stufenindexfaser ist 𝑅𝑙 = 𝑎. Die Gesamtzahl von Moden mit einer Ausbreitungskonstante größer 𝛽 ist daher 𝑙max (𝛽)
𝑞𝛽 = 4
∑
𝑙=0
𝑀𝑙 (𝛽) ,
(10.35)
wobei 𝑙max (𝛽) der maximale Wert von 𝑙 ist, der eine geführte Mode mit Ausbreitungskonstanten größer 𝛽 liefert, d. h. für den der Maximalwert der Funktion 𝑛2 (𝑟) 𝑘02 − 𝑙2 ∕𝑟 2 größer ist als 𝛽 2 . Die Gesamtzahl 𝑀 der Moden ist 𝑞𝛽 für 𝛽 = 𝑛2 𝑘0 . Der Faktor 4 in Gl. (10.35) berücksichtigt die beiden möglichen Polarisationen und die beiden möglichen Drehsinne des Winkels 𝜙 entsprechend positiven und negativen schraubenförmigen Trajektorien für jedes (𝑙, 𝑚). Wenn die Zahl der Moden hinreichend groß ist, können wir die Summation in
10.2 Geführte Wellen
(die für |𝛿| ≪ 1 gilt) auf Gl. (10.41) angewandt werden,
Gl. (10.35) durch ein Integral ersetzen; damit folgt 𝑙max (𝛽)
𝑞𝛽 ≈ 4 ∫ 𝑀𝑙 (𝛽) d𝑙 .
(10.36)
0
Für Fasern mit Indexprofilen gemäß einem Potenzgesetz setzen wir Gl. (10.4) in Gl. (10.34) und danach in Gl. (10.36) ein. Die Berechnung des Integrals ergibt dann
𝛽𝑞 ≈ 𝑛1 𝑘0 [1 − (
𝑝
(10.37)
mit 𝑀≈
𝑝 𝑝 V2 𝑛12 𝑘02 𝑎2 𝛥 = , 𝑝+2 𝑝+2 2
(10.38)
wobei 𝛥 = (𝑛1 − 𝑛2 )∕𝑛1 und V = 2π(𝑎∕𝜆0 )NA der V Parameter der Faser ist. Da 𝑞𝛽 ≈ 𝑀 für 𝛽 = 𝑛2 𝑘0 ist, ist 𝑀 tatsächlich die Gesamtzahl von Moden. Für Stufenindexfasern (𝑝 → ∞), werden die Gln. (10.37) und (10.38) zu 𝑞𝛽 ≈ 𝑀 [
1 − (𝛽∕𝑛1 𝑘0 )2 ] 2𝛥
(10.39)
𝛽𝑞 ≈ 𝑛1 𝑘0 (1 −
(10.40)
Dieser Ausdruck für 𝑀 ist derselbe wie der, den wir in Gl. (10.23) erhalten und als gute Näherung für die exakte Zahl der Moden als Funktion von V erkannt hatten (siehe Abb. 10.13). Ausbreitungskonstanten
Die Ausbreitungskonstante 𝛽𝑞 für die Mode 𝑞 erhalten wir, indem wir Gl. (10.37) invertieren, √ 𝛽𝑞 ≈ 𝑛1 𝑘0
𝑞 𝑝∕(𝑝+2) 1 − 2( ) 𝛥, 𝑀
𝑞 = 1, 2, … , 𝑀 ,
wobei wir den Index 𝑞𝛽 durch 𝑞 und 𝛽 durch 𝛽𝑞 ersetzt √ 1 haben. Da 𝛥 ≪ 1 ist, kann die Näherung 1 + 𝛿 ≈ 1 + 𝛿
n2 k0 0
Modenindex q
M
Ausbreitungskonstante βq
Ausbreitungskonstante βq
2
n1 k0
(10.43)
2
Gruppengeschwindigkeiten
Um die Gruppengeschwindigkeit 𝑣𝑞 = d𝜔∕ d𝛽𝑞 zu bestimmen, schreiben wir 𝛽𝑞 als Funktion von 𝜔, indem wir Gl. (10.38) in Gl. (10.42) einsetzen, in das Resultat 𝑛1 𝑘0 = 𝜔∕𝑐1 einsetzen und 𝑣𝑞 = (d𝛽𝑞 ∕ d𝜔)−1 berechnen. Mithilfe der Näherung (1 + 𝛿)−1 ≈ 1 − 𝛿 (die für |𝛿| ≪ 1 gilt) und unter der Annahme, dass 𝑐1 und 𝛥 nicht von 𝜔 abhängen (d. h. wir ignorieren Materialdispersion), erhalten wir 𝑣𝑞 ≈ 𝑐1 [1 −
𝑝 − 2 𝑞 𝑝∕(𝑝+2) ( ) 𝛥] . 𝑝+2 𝑀
(10.44)
Für die Stufenindexfaser (𝑝 → ∞) ergibt Gl. (10.44) 𝑣𝑞 ≈ 𝑐1 (1 −
𝑞 𝛥) , 𝑀
(10.45)
was wieder zu Gl. (10.25) führt. Die Gruppengeschwindigkeit ändert sich folglich von näherungsweise 𝑐1 auf 𝑐1 (1 − 𝛥), wie in Abb. 10.20(a) gezeigt ist. Das optimale Indexprofil
(10.41)
Stufenindexfaser
𝑞 𝛥) . 𝑀
Dieser Ausdruck ist identisch mit Gl. (10.24), wenn√der Index 𝑞 = 1, 2, … , 𝑀 durch (𝑙√+ 2𝑚)2 mit 𝑙 = 0, 1, … , 𝑀 1 ersetzt wird; 𝑚 = 1, 2, … , ( 𝑀 − 𝑙).
bzw. 1 2 𝑀≈ V . 2
(10.42)
Die Ausbreitungskonstante 𝛽𝑞 nimmt daher von ≈ 𝑛1 𝑘0 (für 𝑞 = 1) auf 𝑛2 𝑘0 (für 𝑞 = 𝑀) ab, wie Abb. 10.19 zeigt. Für eine Stufenindexfaser (𝑝 → ∞) reduziert sich (10.41) auf
𝑝+2
1 − (𝛽∕𝑛1 𝑘0 )2 𝑞𝛽 ≈ 𝑀 [ ] 2𝛥
𝑞 𝑝∕(𝑝+2) 𝛥] . ) 𝑀
Gleichung (10.44) zeigt, dass der Gradientenprofilparameter 𝑝 = 2 eine Gruppengeschwindigkeit 𝑣𝑞 ≈ 𝑐1 für alle 𝑞 ergibt, sodass sich alle Moden näherungsweise mit derselben Geschwindigkeit 𝑐1 ausbreiten. Das betont den Vorteil der Gradientenindexfaser für die Vielmodentransmission.
Gradientenindexfaser (p = 2)
n1 k0
n2 k0 0
Modenindex q
M
Abb. 10.19 Abhängigkeit der Ausbreitungskonstante 𝛽q von den Modenindizes q = 1, 2, … , M für eine Stufenindexfaser (p → ∞) und für eine optimale Gradientenindexfaser (p = 2).
303
Stufenindexfaser
c1
c1 (1 – Δ) 0
Modenindex q
M
Gruppengeschwindigkeit υq
10 Faseroptik
Gruppengeschwindigkeit υq
304
Gradientenindexfaser (p = 2)
c1
Abb. 10.20 Gruppengeschwindigkeit vq der Moden einer Stufenindexfaser (p → ∞) und einer optimalen Gradientenindexfaser (p = 2).
c1(1– Δ2/2)
0
Modenindex q M
Um die Gruppengeschwindigkeit genauer zu bestimmen, kehren wir zur Herleitung von 𝑣𝑞 aus Gl. (10.41) für 𝑝 = 2 zurück. Wenn wir die Taylorentwicklung bis √ zu drei Termen anstatt zwei durchführen, d. h. 1 + 𝛿 ≈ 1 1 1 + 𝛿 − 𝛿2 verwenden, erhalten wir 2
8
𝑣𝑞 ≈ 𝑐1 (1 −
Abb. 10.21 Eine Mehrkernfaser mit sieben Kernen.
𝑞 𝛥 ). 𝑀 2 2
(10.46)
Folglich ändern sich die Gruppengeschwindigkeiten von ungefähr 𝑐1 bei 𝑞 = 1 auf näherungsweise 𝑐1 (1 − 𝛥2 ∕2) bei 𝑞 = 𝑀. Den Vergleich mit den Ergebnissen für die Stufenindexfaser zeigt Abb. 10.20. Die Differenz der Gruppengeschwindigkeiten für eine parabolische Gradientenindexfaser ist 𝛥2 ∕2 und somit wesentlich kleiner ist als die Differenz 𝛥 der Gruppengeschwindigkeiten für die Stufenindexfaser. Unter idealen Bedingungen reduziert die Gradientenindexfaser daher die Differenz der Gruppengeschwindigkeiten um einen Faktor 𝛥∕2 und erfüllt so ihren Bestimmungzweck, die Modengeschwindigkeiten anzugleichen. Da die Analyse, die uns zu Gl. (10.46) führte, aber auf mehreren Näherungen beruht, ist diese Verbesserung nur ein Schätzwert – in der Praxis wird er nicht ganz erreicht. Die Zahl 𝑀 der Moden in einer Gradientenindexfaser mit dem Gradientenprofilparameter 𝑝 ist durch Gl. (10.38) gegeben. Für 𝑝 = 2 ergibt sich 𝑀≈
1 2 V . 4
(10.47)
Wenn wir dieses Resultat mit dem für die Stufenindexfa2 ser aus (10.40) vergleichen, 𝑀 ≈ V ∕2, zeigt sich, dass die Zahl der Moden in einer optimalen Gradientenindexfaser etwa halb so groß wie in einer Stufenindexfaser mit denselben Parametern 𝑛1 , 𝑛2 und 𝑎 ist.
10.2.5
Mehrkernfasern und Faserkoppler
Mehrkernfasern
Eine Mehrkernfaser ist eine Faser mit mehreren Kernen in einem gemeinsamen Mantel (Abb. 10.21). Die Zahl der Kerne, ihre Anordnung, ihre Durchmesser und ihre Abstände voneinander werden durch die beabsichtigte Anwendung einer solchen Faser bestimmt. Kerne mit
kleinem Durchmesser wirken jeweils als Einmodenwellenleiter; Kerne mit großem Durchmesser entsprechend als Vielmodenwellenleiter. Kerne in großen Abständen voneinander zeigen kaum Übersprechen zwischen den einzelnen Kernen und verhalten sich daher wie unabhängige Wellenleiter. Mehrkernfasern werden in optischen Netzen mit hoher Kapazität verwendet, bei der Interchip-Kommunikation in Großrechnern und Rechenzentren oder auch als Sensoren, da sie empfindlich auf mechanische Beanspruchungen (z. B. Biegen) reagieren. Mehrkernkoppler
Optische Faserkoppler sind wichtige Bestandteile von faseroptischen Kommunikationssystemen. Mehrkernkoppler werden verwendet, um eine oder mehrere Fasern am Eingang eines Bauelements mit einer oder mehreren Fasern an seinem Ausgang zu verbinden. In Abb. 10.22 sind einige Beispiele für verschiedene Konfigurationen dargestellt (weitere Beispiele finden Sie in Abschnitt 24.3.2). Es sei jedoch darauf hingewiesen, dass für die Kopplung auch andere Methoden zur Verfügung stehen und eingesetzt werden; siehe Abschnitt 24.3.1. Ein wesentlicher Gesichtspunkt beim Design von faseroptischen Kopplern ist der mit ihnen verbundene optische Verlust. Die Reduktion der Dämpfung bei der Einkopplung ist besonders für Einmodenfasern eine Herausforderung. Bei manchen Anwendungen ist es erwünscht, die Verteilung der optischen Leistung am Ausgang des Kopplers unempfindlich gegenüber bestimmten Welleneigenschaften wie Wellenlänge oder Polarisation zu machen. In anderen Anwendungen kann der Koppler absichtlich so ausgelegt sein, dass die Kopplung durch eine dieser Eigenschaften gesteuert wird, z. B. dass bestimmte Wellenlängen oder Polarisationen gezielt zu unterschiedlichen Fasern am Ausgang geführt
10.2 Geführte Wellen
(a)
Splitter Einmodenfaser
Kombinierer Vielmodenfaser
Vielmodenfaser
3-dB-Koppler
(c) Einmodenfaser
(b)
Abb. 10.22 Faseroptische Mehrkernkoppler. (a) Zweikernfaser als Splitter oder Kombinierer. (b) Fan-Out- (Verzweiger) und Fan-In-Koppler (Kombinierer) verwenden einen konisch zulaufenden Querschnitt, um eine Einkernfaser mit einer Mehrkernfaser zu verbinden. (c) Ein 3-dB-Koppler auf
der Grundlage einer Zweikernfaser mit einer doppelt-konischen Verjüngung. Benachbarte Fasern sind hier schwach gekoppelt, wodurch das Licht allmählich von der einen Faser in die andere überwechseln kann, ähnlich wie bei dem in Abb. 9.32(b) gezeigten integrierten Optokoppler.
werden. Diese Aspekte werden wir in Abschnitt 24.3 vertiefen.
ein Array von gekoppelten Einmodenwellenleitern, in dem das Licht aus einem Wellenleiter in benachbarte Wellenleiter überwechseln kann (siehe Abschnitt 9.4.3). Im breiteren Teil des konischen Bereichs sind die Kerne weit genug voneinander entfernt, sodass sie eine Mehrkernfaser aus unabhängigen Einmodenwellenleitern bilden, die schließlich die ausgehenden Einmodenfasern speisen. Diese Struktur kann zwar wie die in Abb. 10.22(b) dargestellte Fan-Out-Konfiguration als einfacher Verzweiger verwendet werden, der die in die Vielmodenfaser einfallende Leistung auf die ausgehenden Einmodenfasern verteilt, sie verfügt jedoch noch über weitere Fähigkeiten. Im Idealfall würde jede der Moden aus der Vielmodenfaser mit genau einer der Einmodenfasern gekoppelt, sodass das Bauelement als Demultiplexer dienen könnte, der die in jeder der ankommenden Moden enthaltenen Informationen auf die verschiedenen Kanäle am Ausgang aufteilt (entsprechend würde die FanIn-Konfiguration als Multiplexer arbeiten). In der Praxis koppelt leider in dem dünneren Teil der konischen Verjüngung, in dem die einzelnen Fasern nicht gut getrennt sind, jede der Moden in der Vielmodenfaser mit mehreren Einmodenfasern, wodurch eine solche Einszu-Eins-Kopplung zunichte gemacht wird. Die hieraus resultierende Vermischung von Informationen kann jedoch durch Computeralgorithmen rückgängig gemacht werden. Die Beziehung zwischen den komplexen Amplituden der Ausgangswellen in den Einmodenfasern und denen der Moden in der Vielmodenfaser am Eingang wird mathematisch durch eine Matrix mit geeigneten Gewichten für eine solche lineare Superposition beschrieben. Diese Matrix wird durch die Geometrie der Verjüngung und die Transmission durch die Anordnung von gekoppelten Wellenleitern definiert, wie Abschnitt 9.4.3 für einfachere Anordnungen von Wellenleitern erläutert. Wenn man diese Matrix bestim-
Die photonische Laterne
Eine photonische Laterne ist ein faseroptischer Koppler, der eine einzelne Vielmodenfaser mit mehreren Einmodenfasern verbindet. Wie Abb. 10.23 zeigt, wird (von rechts nach links vorgehend) zunächst eine Reihe von Einmodenfasern zu einem einzigen Glaskörper verschmolzen, wodurch eine Mehrkernfaser entsteht. Diese verjüngt sich und ist an ihrem dünnen Ende mit einer Einkern-Vielmodenfaser verbunden. Ein solches Element kann in beiden Richtungen betrieben werden, also entweder als Verzweiger (Fan-Out-Anordnung) oder als Kombinierer (Fan-In-Anordnung). Bei Betrieb in einer Fan-Out-Konfiguration regt das einfallende Licht die Moden der Mehrkernfaser an, und jede dieser Moden regt wiederum mehrere oder alle der Kerne in dem sich verjüngenden Bereich an. Am dünnen Ende des konischen Abschnitts sind die Kerne schwach gekoppelt und verhalten sich somit wie
Vielmodenfaser
Mehrkernfaser
Einmodenfasern
konische Verjüngung
Abb. 10.23 Eine photonische Laterne dient als Schnittstelle zwischen den Moden einer einzelnen Vielmodenfaser und vielen Einmodenfasern. Sie kann in einer Fan-OutKonfiguration (d. h. als Verzweigung) betrieben werden, bei der das Licht sich von links nach rechts ausbreitet, oder in einer Fan-In-Konfiguration (als Vereinigung), bei der das Licht von rechts nach links wandert.
305
306
10 Faseroptik
men kann, können die von den Moden in der Vielmodenfaser übertragenen Informationen rechnerisch mithilfe einer Matrixinversion aus den komplexen Amplituden des ausgehenden Lichts in den Einzelmodenfasern extrahiert werden. Photonische Laternen werden in faseroptischen Kommunikationssystemen eingesetzt, in denen die Moden in Vielmodenfasern als individuelle Kommunikationskanäle dienen (räumliches Modenmultiplexing wird in Abschnitt 25.3.2 betrachtet). Fan-Out-Laternen können auch verwendet werden, um das von einer Vielmodenfaser übertragene Licht auf mehrere Einmodenfasern zu verteilen, um es anschließend in optischen Komponenten zu verarbeiten, die für den Einmodenbetrieb ausgelegt sind (z. B. Bragggitter als Spektralfilter oder optische Verstärker), bevor es anschließend durch eine FanIn-Laterne wieder in eine Vielmodenfaser eingekoppelt wird. In astronomischen Instrumenten werden photonische Laternen genutzt, um das von einem Teleskop gelieferte Vielmodenlicht für die spektrale Filterung auf einen Satz von Einmodenfasern zu verteilen.
Dämpfung und Dispersion beschränken die Leistungsfähigkeit eines Glasfasermediums als Datenübertragungskanal. Dämpfung, die durch Verluste verschiedener Art verursacht wird, beschränkt den Betrag der übertragenen optischen Leistung. Dispersion, die für die zeitliche Verbreiterung optischer Pulse verantwortlich ist, beschränkt die Geschwindigkeit, mit der solche datentragenden Pulse übertragen werden können.
3 0 0.1
0.5
1
Verhältnis
Abb. 10.24 Umrechnung des Transmissionsgrads in dB. Eine Dämpfung von 3 dB entspricht einem Transmissionsgrad von 0.5; 10 dB entsprechen 𝒯 = 0.1, und 20 dB entsprechen 𝒯 = 0.01.
Kaskade von verlustbehafteten Systemen ausbreitet, ist der gesamte Transmissionsgrad gleich dem Produkt der einzelnen Transmissionsgrade. Wegen des Logarithmus in Gl. (10.48) ist der Gesamtverlust in dB daher die Summe der einzelnen Verluste in dB. Für eine Ausbreitung über 𝑧 km ist der Verlust α𝑧 dB. Der zugehörige Transmissionsgrad, den wir durch Inversion von Gl. (10.48) erhalten, ist dann (α in dB∕km).
(10.49)
Gleichung (10.49) gilt, wenn α in Einheiten von dB∕km angegeben wird. Wenn die Dämpfungskonstante stattdessen in km−1 angegeben wird, gilt P(𝑧)∕P (0) = e−𝛼𝑧
(𝛼 in km−1 )
(10.50)
mit 𝛼 ≈ 0.23α. Für andere Komponenten als optische Fasern wird die Dämpfungskonstante 𝛼 gewöhnlich in cm−1 angegeben; in diesem Fall ist die Leistungsdämpfung durch Gl. (10.50) mit 𝑧 in cm beschrieben.
Dämpfung Absorption
Die Dämpfungskonstante
Die Leistung eines Lichtstrahls, der sich durch eine Glasfaser ausbreitet, nimmt infolge von Absorption und Streuung exponentiell mit der Entfernung ab. Die zugehörige Dämpfungskonstante wird üblicherweise in der Einheit Dezibel pro Kilometer (dB∕km) angegeben und mit dem Symbol α bezeichnet, α=
dB
P(𝑧) = 10−α𝑧∕10 ≈ e−0.23α𝑧 P(0)
10.3 Dämpfung und Dispersion
10.3.1
10
1 1 10 log10 , 𝐿 𝒯
(10.48)
wobei 𝒯 = P (𝐿)∕P (0) der Transmissionsgrad (das Verhältnis der übertragenen zur einfallenden Leistung) für eine Faser der Länge 𝐿 km ist. Die Umrechnung eines Verhältnisses in dB-Einheiten ist in Abb. 10.24 illustriert. Eine Dämpfung von 3 dB∕km entspricht beispielsweise einem Transmissionsgrad von 𝒯 = 0.5 durch eine Faser der Länge 𝐿 = 1 km. Für Licht, das sich durch eine
Die Dämpfungskonstante α von Quarzglas (SiO2 ) hängt stark von der Wellenlänge ab, wie Abb. 10.25 zeigt. Dieses Material besitzt zwei starke Absorptionsbanden: eine Bande im mittleren Infrarot, die von Schwingungsübergängen verursacht wird, und eine Bande im UV, die aus elektronischen und molekularen Übergängen resultiert. Die Ausläufer dieser Banden bilden ein Fenster im nahen Infrarot, in dem es wenig intrinsische Absorption gibt. Rayleighstreuung
Rayleighstreuung ist ein anderer intrinsischer Effekt, der zur Abschwächung des Lichts im Glas beiträgt. Zufällige lokale Variationen der Atompositionen im Glas selbst erzeugen zufällige Inhomogenitäten im Brechungsindex, die als winzige Streuzentren wirken. Die
α (dB/km)
10.3 Dämpfung und Dispersion
3
Rayleighstreuung
2
Abb. 10.25 Die Dämpfungskonstante α von Quarzglas als Funktion der Wellenlänge 𝜆0 . Es existiert ein lokales Minimum bei 1.3 μ m (α ≈ 0.3 dB∕km) und ein absolutes Minimum bei 1.55 μ m (α ≈ 0.15 dB∕km).
Infrarotabsorption
1 OH-Absorption
0.5 0.3 0.2 0.1 0.6
UV-Absorption (Ausläufer)
0.8
1.0
1.2
1.4
1.8
1.6
Wellenlänge λ 0 (µm)
Amplitude des gestreuten Feldes ist proportional zu 𝜔2 , wobei 𝜔 die Kreisfrequenz des Lichts 1) ist. Die gestreute Intensität ist daher proportional zu 𝜔4 oder zu 1∕𝜆04 , sodass kleine Wellenlängen stärker gestreut werden als große Wellenlängen; blaues Licht wird daher stärker gestreut als rotes. Die funktionale Form der Rayleighstreuung, die wie 1∕𝜆04 mit der Wellenlänge abnimmt, ist als Rayleighs inverses Potenzgesetz bekannt. Im sichtbaren Gebiet des Spektrums ist Rayleighstreuung eine bedeutendere Ursache für Verluste als der Ausläufer der ultravioletten Absorptionsbande, wie Abb. 10.25 illustriert. Für Wellenlängen größer 1.6 μm werden Rayleighverluste jedoch im Vergleich zur Infrarotabsorption vernachlässigbar. Wir schließen, dass das transparente Fenster in Quarzglas auf der kurzwelligen Seite durch Rayleighstreuung und auf der langwelligen Seite durch Infrarotabsorption begrenzt wird (durch die gestrichelten Kurven in Abb. 10.25 dargestellt). Optische Nachrichtensysteme werden gezielt für den Betrieb in diesem Fenster entworfen. Extrinsische Effekte
Neben diesen intrinsischen Effekten existieren extrinsische Absorptionsbanden, die aus der Anwesenheit von Verunreinigungen – hauptsächlich metallischen Ionen wie Fe, Cu, Cr oder Ni und OH-Radikalen aus dem im Glas gelösten Wasserdampf – resultieren. Die meisten metallischen Verunreinigungen können leicht entfernt werden, aber OH-Verunreinigungen sind schwerer zu beseitigen. Im Allgemeinen werden Wellenlängen für die optische Kommunikation durch Glasfasern gezielt
1) Das streuende Medium erzeugt eine Polarisationsdichte 𝒫, die einer 2 Strahlungsquelle proportional zu d 𝒫∕ d𝑡 2 = −𝜔2 𝒫 entspricht; siehe Gl. (5.40).
so ausgewählt, dass sie die OH-Absorptionsbanden vermeiden. Verluste aufgrund von Lichtstreuung können verstärkt werden, wenn Dotiersubstanzen hinzugefügt werden, was häufig zur Erzeugung eines Indexgradienten geschieht. Die Dämpfungskonstante für geführtes Licht in Glasfasern hängt von der Absorption und der Streuung in den Kern- und Mantelmaterialien ab. Jede Mode hat eine unterschiedliche Eindringtiefe in den Mantel, sodass die Strahlen unterschiedliche effektive Entfernungen zurücklegen und die Dämpfungskonstante modenspezifisch wird. Für Moden höherer Ordnung ist sie in der Regel größer. Einmodenfasern haben daher normalerweise kleinere Dämpfungskonstanten als Vielmodenfasern (Abb. 10.26). Verluste werden auch durch kleine zufällige Variationen in der Geometrie der Faser oder durch Biegungen hervorgerufen.
10.3.2 Dispersion Wenn sich ein kurzer Lichtpuls durch eine Glasfaser ausbreitet, wird seine Leistung zeitlich „verschmiert“, sodass sich der Puls über ein größeres Zeitintervall ausbreitet. Es gibt fünf Hauptquellen der Dispersion in optischen Fasern: • • • • •
Modendispersion Materialdispersion Wellenleiterdispersion Polarisationsdispersion nichtlineare Dispersion
Die kombinierten Beiträge dieser Effekte auf die zeitliche Verbreiterung von Pulsen sind nicht unbedingt additiv, wie wir im Folgenden sehen werden.
307
10 Faseroptik
Dämpfungskoeffizient α (dB/km)
308
Abb. 10.26 Bereiche von Dämpfungskoeffizienten für Einmoden- und Vielmodenfasern aus Quarzglas.
3 Vielmodenfaser
2 1 0.5
Einmodenfaser
0.3 0.2
unterdrückte OH-Absorption
0.1 0.6
0.8
1.0
1.2 1.4 Wellenlänge λ (µm)
1.6
1.8
Abb. 10.27 Durch die Modendispersion verursachte Pulsverbreiterung.
στ 0
t
0
t
t
0 z
Modendispersion
Modendispersion tritt in Vielmodenfasern aufgrund der unterschiedlichen Gruppengeschwindigkeiten der verschiedenen Moden auf. Ein einzelner Lichtpuls, der in eine 𝑀-Moden-Faser bei 𝑧 = 0 eintritt, wird in 𝑀 Pulse aufgeteilt, deren relative Laufzeitunterschiede als Funktion von 𝑧 zunehmen. Für eine Faser der Länge 𝐿 sind die durch die verschiedenen Geschwindigkeiten hervorgerufenen Zeitverzögerungen 𝜏𝑞 = 𝐿∕𝑣𝑞 mit 𝑞 = 1, … , 𝑀, wobei 𝑣𝑞 die Gruppengeschwindigkeit der Mode 𝑞 ist. Wenn 𝑣min und 𝑣max die kleinsten bzw. größten Gruppengeschwindigkeiten sind, dann verteilt sich der übertragene Puls über ein Zeitintervall 𝐿∕𝑣min − 𝐿∕𝑣max . Da die Moden gewöhnlich nicht gleichermaßen angeregt sind, besitzt die Form des übertragenen Pulses in der Regel eine glatte Einhüllende wie in Abb. 10.27. Eine Abschätzung der Gesamt-Pulsdauer (unter der Annahme einer dreieckigen Einhüllenden und bei Definition der 1 Breite als Halbwertsbreite) ist 𝜎𝜏 = (𝐿∕𝑣min − 𝐿∕𝑣max ); 2 sie bezeichnet die Antwortzeit der Faser aufgrund von Modendispersion. In einer Stufenindexfaser mit einer großen Zahl von Moden ist 𝑣min ≈ 𝑐1 (1 − 𝛥) und 𝑣max ≈ 𝑐1 [siehe Abschnitt 10.2.4 und Abb. 10.20(a)]. Da für 𝛥 ≪ 1 näherungsweise (1 − 𝛥)−1 ≈ 1 + 𝛥 ist, erweist sich die Antwortzeit als Bruchteil 𝛥∕2 der Laufzeitdifferenz 𝐿∕𝑐1 : 𝜎𝜏 ≈
𝐿 𝛥 ⋅ . 𝑐1 2
(10.51)
In GRIN-Fasern ist die Modendispersion viel kleiner als in Stufenindexfasern, da die Gruppengeschwindigkeiten angeglichen und die Unterschiede zwischen den
Laufzeitdifferenzen 𝜏𝑞 = 𝐿∕𝑣𝑞 der Moden reduziert sind. In Abschnitt 10.2.4 und in Abb. 10.20(b) wurde gezeigt, dass für eine Gradientenindexfaser mit einem optimalen Indexprofil und einer großen Zahl von Moden 𝑣max ≈ 𝑐1 und 𝑣min ≈ 𝑐1 (1 − 𝛥2 ∕2) gilt. Die Antwortzeit ist in diesem Fall daher um einen Faktor 𝛥∕2 kleiner als in einer Stufenindexfaser: 𝜎𝜏 ≈
𝐿 𝛥2 ⋅ . 𝑐1 4
(10.52)
Die Pulsverbreiterung durch Modendispersion ist sowohl in Stufenindex- als auch in GRIN-Fasern proportional zur Faserlänge 𝐿. Wegen der Modenkopplung gilt diese Abhängigkeit für Fasern ab einer gewissen Länge aber nur eingeschränkt. Kopplung zwischen Moden mit ähnlichen Ausbreitungskonstanten tritt infolge kleiner Fehler in der Faser auf, z. B. zufälligen Unregelmäßigkeiten ihrer Oberfläche oder Inhomogenitäten ihres Brechungsindex. Sie ermöglicht den Austausch von optischer Leistung zwischen den Moden. Unter bestimmten Bedingungen ist die Antwortzeit 𝜎𝜏 von modengekoppelten Fasern für kleine Faserlängen proportional zu √ 𝐿 und ab einer kritischen Faserlänge proportional zu 𝐿, d. h. die Pulse verbreitern sich dann langsamer. 2) Beispiel 10-4: Verbreiterung von Vielmodenpulsen
In einer Stufenindexfaser mit 𝛥 = 0.01 und 𝑛 = 1.46 verbreitern sich Pulse mit einer Geschwindigkeit von näherungsweise 𝜎𝜏 ∕𝐿 = 𝛥∕2𝑐1 = 𝑛1 𝛥∕2𝑐0 ≈ 24 ns∕km. Bei einer Übertragung durch eine solche Faser über 2) Siehe z. B. J. E. Midwinter, Optical Fibers for Transmission, Wiley 1979; Krieger, Nachdruck 1992.
100 km verbreitert sich ein anfänglich scharfer Impuls demnach auf eine Breite von ≈ 2.4 μs. Wenn dieselbe Faser einen optimalen Indexgradienten besitzt, ist die Geschwindigkeit der Pulsverbreiterung etwa 𝑛1 𝛥2 ∕4𝑐0 ≈ 122 ps∕km, also wesentlich geringer. Materialdispersion
Glas ist ein dispersives Medium, d. h. sein Brechungsindex ist eine Funktion der Wellenlänge. Wie in Abschnitt 5.7 diskutiert breitet sich ein optischer Puls in einem dispersiven Medium mit dem Brechungsindex 𝑛 mit einer Gruppengeschwindigkeit 𝑣 = 𝑐0 ∕𝑁 mit 𝑁 = 𝑛 − 𝜆0 d𝑛∕ d𝜆0 aus. Da der Puls ein Wellenpaket ist, also eine Ansammlung von Komponenten unterschiedlicher Wellenlängen, von denen sich jede mit einer anderen Gruppengeschwindigkeit ausbreitet, vergrößert sich seine Ausdehnung im Laufe der Zeit. Die Dauer eines optischen Pulses der spektralen Breite 𝜎𝜆 (in nm) nach Ausbreitung über eine Entfernung 𝐿 durch ein dispersives Material ist 𝜎𝜏 = |(d∕ d𝜆0 )(𝐿∕𝑣)|𝜎𝜆 = |(d∕ d𝜆0 )(𝐿𝑁∕𝑐0 )|𝜎𝜆 . Das führt zu einer Antwortzeit [siehe Gln. (5.139), (5.144) und (5.145)] 𝜎𝜏 = |𝐷𝜆 |𝜎𝜆 𝐿 ,
(10.53)
wobei der Materialdispersionskoeffizient 𝐷𝜆 durch 2
𝐷𝜆 = −
𝜆0 d 𝑛 𝑐0 d𝜆 2
(10.54)
0
gegeben ist. Die Antwortzeit nimmt linear mit der Entfernung 𝐿 zu. Gewöhnlich werden 𝐿 in km, 𝜎𝜏 in ps, und 𝜎𝜆 in nm gemessen, sodass 𝐷𝜆 die Einheit ps∕(km nm) bekommt. Diese Art von Dispersion wird Materialdispersion genannt. Die Wellenlängenabhängigkeit des Dispersionskoeffizienten 𝐷𝜆 ist in Abb. 10.28 für eine Quarzglasfaser gezeigt. Bei Wellenlängen unterhalb von 1.3 μm ist der Dispersionskoeffizient negativ, sodass sich langwellige Wellenpakete schneller ausbreiten als kurzwellige. Bei einer Wellenlänge 𝜆0 = 0.87 μm ist der Dispersionskoeffizient 𝐷𝜆 z. B. ungefähr −80 ps∕(km nm). Bei 𝜆0 = 1.55 μm ist 𝐷𝜆 ≈ +17 ps∕(km nm). Bei 𝜆0 ≈ 1.312 μm verschwindet der Dispersionskoeffizient, sodass 𝜎𝜏 in Gl. (10.53) ebenfalls verschwindet. Ein genauerer Ausdruck für 𝜎𝜏 , der auch die Verbreiterung der Spektralbreite 𝜎𝜆 um 𝜆0 = 1.312 μm berücksichtigt, ergibt eine sehr kleine, aber von null verschiedene Breite.
Dämpfungskoeffizient Dλ [ps/(km nm)]
10.3 Dämpfung und Dispersion
309
40 0
anomale Dispersion
normale Dispersion
–40 Dλ
–80
–120 –160 –200 0.6
0.7
0.8
0.9
1.0
1.1
1.2
Wellenlänge λ0 (µm)
1.3
1.4
1.5
Abb. 10.28 Gemessener Dispersionskoeffizient D𝜆 für eine Quarzglasfaser als Funktion der Wellenlänge 𝜆0 . Das Resultat unterscheidet sich geringfügig von von dem für synthetisches Quarzglas berechneten (siehe Abb. 5.32).
Beispiel 10-5: Pulsverbreiterung durch Materialdispersion
Der Dispersionskoeffizient 𝐷𝜆 für eine Quarzglasfaser bei 𝜆0 = 0.87 μm ist ungefähr −80 ps∕(km ⋅ nm). Für eine Quelle der spektralen Linienbreite 𝜎𝜆 = 50 nm (z. B. eine LED) ist die Geschwindigkeit der Pulsverbreiterung in einer Einmodenfaser ohne andere Dispersionsquellen |𝐷𝜆 |𝜎𝜆 = 4 ns∕km. Ein Lichtpuls, der sich in der Faser über eine Entfernung 𝐿 = 100 km ausbreitet, erhält daher eine Breite 𝜎𝜏 = |𝐷𝜆 |𝜎𝜆 𝐿 = 0.4 μs. Die Antwortzeit der Faser ist folglich 𝜎𝜏 = 0.4 μs. Ein Impuls mit der schmaleren spektralen Linienbreite 𝜎𝜆 = 2 nm (z. B. aus einer Laserdiode) mit einer Wellenlänge um 1.3 μm, wo der Dispersionskoeffizient nur 1 ps∕(km ⋅ nm) beträgt, verbreitert sich nur mit einer Geschwindigkeit von 2 ps∕km. In diesem Fall hat die 100-km-Faser daher eine wesentlich kürzere Antwortzeit von 𝜎𝜏 = 0.2 ns. Kombinierte Material- und Modendispersion
Der Auswirkung der Materialdispersion auf die Pulsverbreiterung in Vielmodenfasern kann bestimmt werden, indem man zu den ursprünglichen Gleichungen für die Ausbreitungskonstanten 𝛽𝑞 der Moden zurückkehrt und die Gruppengeschwindigkeiten 𝑣𝑞 = (d𝛽𝑞 ∕ d𝜔)−1 mit 𝑛1 und 𝑛2 als Funktionen von 𝜔 bestimmt. Als Beispiel wollen wir die Ausbreitungskonstanten einer Gradientenindexfaser mit einer großen Zahl von Moden betrachten, die durch die Gln. (10.42) und (10.38) gegeben sind. Obwohl 𝑛1 und 𝑛2 von 𝜔 abhängen, können wir annehmen, dass das Verhältnis 𝛥 = (𝑛1 − 𝑛2 )∕𝑛1 näherungsweise nicht von 𝜔 abhängt. Mit dieser Näherung erhalten wir durch Berechnung von 𝑣𝑞 = (d𝛽𝑞 ∕ d𝜔)−1 𝑣𝑞 ≈
𝑝 − 2 𝑞 𝑝∕(𝑝+2) 𝑐0 𝛥] , ( ) [1 − 𝑁1 𝑝+2 𝑀
(10.55)
1.6
310
10 Faseroptik
wobei 𝑁1 = (d∕ d𝜔)(𝜔𝑛1 ) = 𝑛1 − 𝜆0 (d𝑛1 ∕ d𝜆0 ) der Gruppenindex des Kernmaterials ist. In dieser Näherung bleibt der frühere Ausdruck Gl. (10.44) für 𝑣𝑞 unverändert, außer dass der Brechungsindex 𝑛1 durch den Gruppenindex 𝑁1 ersetzt wird. Für eine Stufenindexfaser (𝑝 → ∞) ändern sich die Gruppengeschwindigkeiten der Moden von 𝑐0 ∕𝑁1 auf (𝑐0 ∕𝑁1 )(1 − 𝛥); damit wird die Antwortzeit 𝐿 𝛥 ⋅ . 𝜎𝜏 ≈ (10.56) (𝑐0 ∕𝑁1 ) 2 Dieser Ausdruck sollte mit Gl. (10.51) verglichen werden, der in Abwesenheit von Materialdispersion anwendbar ist. Übung 10-1: Der optimale Gradientenprofilparameter
Verwenden Sie die Gln. (10.42) und (10.38), um die Näherung 𝑣𝑞 ≈
𝑝 − 2 − 𝑝s 𝑞 𝑝∕(𝑝+2) 𝑐0 ( ) 𝛥] [1 − 𝑁1 𝑝+2 𝑀
(10.57)
für die Gruppengeschwindigkeit 𝑣𝑞 (𝑞 = 1, 2, … , 𝑀) herzuleiten, wenn sowohl 𝑛1 als auch 𝛥 wellenlängenabhängig sind und 𝑝s = 2(𝑛1 ∕𝑁1 )(𝜔∕𝛥) d𝛥∕ d𝜔 ist. Welches ist der optimale Wert des Gradientenprofilparameters 𝑝, wenn die Modendispersion minimiert werden soll?
𝜎𝜏 = |𝐷𝑤 |𝜎𝜆 𝐿 ,
(10.59)
wobei der Koeffizient 𝐷𝑤 der Wellenleiterdispersion durch 𝐷𝑤 =
d 1 𝜔 d 1 ( ) ( )=− 𝑣 𝜆 d𝜆0 0 d𝜔 𝑣
(10.60)
gegeben ist. Wenn wir Gl. (10.58) in Gl. (10.60) einsetzen, erhalten wir 2
𝐷𝑤 = − (
1 2d 𝛽 )V . 2 2π𝑐0 dV
(10.61)
Somit ist die Gruppengeschwindigkeit umgekehrt proportional zu d𝛽∕ d V , und der Koeffizient der Wellen2 2 2 leiterdispersion ist proportional zu V d 𝛽∕ d V . Die Abhängigkeit von 𝛽 von V ist in Abb. 10.14(a) für die Grundmode LP01 gezeigt. Da sich 𝛽 nichtlinear mit V ändert, ist der Koeffizient 𝐷𝑤 der Wellenleiterdispersion selbst eine Funktion von V und daher auch der Wellenlänge. 3) Die Abhängigkeit von 𝐷𝑤 von 𝜆0 kann durch eine Veränderung des Kernradius oder – für Gradientenindexfasern – des Indexprofils kontrolliert werden. Kombinierte Material- und Wellenleiterdispersion (chromatische Dispersion)
Wellenleiterdispersion
Selbst wenn Materialdispersion vernachlässigbar ist, hängen die Gruppengeschwindigkeiten der Moden in einem Wellenleiter von der Wellenlänge ab. Diese Abhängigkeit, die als Wellenleiterdispersion bezeichnet wird, ergibt sich aus der Abhängigkeit der Feldverteilung in der Faser von dem Verhältnis (𝑎∕𝜆0 ) des Kernradius zur Wellenlänge. Die Anteile der optischen Leistung in Kern und Mantel hängen hierdurch von 𝜆0 ab. Da sich die Phasengeschwindigkeiten in Kern und Mantel unterscheiden, wird die Gruppengeschwindigkeit der Mode verändert. Wellenleiterdispersion ist vor allem in Einmodenfasern wichtig, weil es hier keine Modendispersion gibt, und besonders bei Wellenlängen, für die die Materialdispersion klein ist (nahe 𝜆0 = 1.3 μm in Quarzglas), da sie in diesem Fall dominiert. Wie in Abschnitt 10.2.2 besprochen, werden die Gruppengeschwindigkeit 𝑣 = (d𝛽∕ d𝜔)−1 und die Ausbreitungskonstante 𝛽 aus der charakteristischen Gleichung bestimmt, die von dem V -Parameter der Faser abhängt, V = 2π(𝑎∕𝜆0 )NA = (𝑎 ⋅ NA∕𝑐0 )𝜔. Ohne Materialdispersion (d. h. wenn NA nicht von 𝜔 abhängt), ist V direkt proportional zu 𝜔 und daher d𝛽 d V d𝛽 𝑎 ⋅ NA d𝛽 1 . = = = 𝑣 𝑐0 d V d𝜔 d V d𝜔
Die Pulsverbreiterung für eine Quelle der spektralen Breite 𝜎𝜆 hängt über 𝜎𝜏 = |(d∕ d𝜆0 )(𝐿∕𝑣)|𝜎𝜆 mit der Zeitverzögerung 𝐿∕𝑣 zusammen. Folglich ist
(10.58)
Die kombinierten Effekte von Material- und Wellenleiterdispersion (die wir als chromatische Dispersion zusammenfassen) können bestimmt werden, wenn man die Wellenlängenabhängigkeit der Brechungsindizes 𝑛1 und 𝑛2 und daher von NA bei der Bestimmung von d𝛽∕ d𝜔 aus der charakteristischen Gleichung berücksichtigt. Obwohl sie in der Regel kleiner als die Materialdispersion ist, verschiebt die Wellenleiterdispersion doch die Wellenlänge, bei der die chromatische Gesamtdispersion minimal wird. Da die chromatische Dispersion die Leistung von Einmodenfasern begrenzt, zielen modernere Entwicklungen darauf ab, diesen Effekt zu reduzieren, z. B. indem die Indexprofile der Kerne so gewählt werden, dass die geplante Betriebswellenlänge möglichst nahe bei der Wellenlänge liegt, bei der sich Wellenleiterdispersion und Materialdispersion kompensieren (Abb. 10.29). Durch Verwendung eines linear abnehmenden Brechungsindex im Kern und eines reduzierten Kernradius können dispersionsverschobene Fasern hergestellt werden, die in Abb. 10.29(a) dargestellt sind. Mithilfe 3) Für weitere Details zu diesem Thema sei auf die Weiterführende Literatur verwiesen, besonders auf die Artikel von Gloge.
1600 1600 1600
1500 1500
1400
1300
n
λ 0 (nm)
λ 0 (nm)
0
1500
(c) dispersionskompensierende Faser
λ 0 (nm)
0
n
Dispersionskoeffizient
(b) dispersionsflache Faser
1400
n
Dispersionskoeffizient
(a) dispersionsverschobene Faser
0
1300
Dispersionskoeffizient
10.3 Dämpfung und Dispersion
Abb. 10.29 Indexprofile mit schematischen Wellenlängenabhängigkeiten der Koeffizienten der Materialdispersion (gestrichelte Kurven) und der kombinierten Material- und Wellenleiterdispersion (durchgezogene Kurven) für eine (a) dispersionsverschobene Faser, (b) dispersionsflache Faser und (c) dispersionskompensierende Faser.
dieser Technik kann die Wellenlänge ohne chromatische Dispersion von 1.3 μm auf 1.55 μm verschoben werden, wo die Faser ihre kleinste Dämpfung besitzt. Andere Gradientenprofile wurden entwickelt, bei denen die chromatische Dispersion bei zwei Wellenlängen verschwindet und dazwischen reduziert ist. Diese Fasern werden dispersionsflache Fasern genannt; sie bestehen aus einem vierfach ummantelten Stufenindexprofil wie in Abb. 10.29(b) gezeigt. Dabei ist jedoch zu beachten, dass die Einführung eines Indexprofils immer verlustbehaftet ist, da hierzu Dotiersubstanzen verwendet werden. Fasern mit anderen Indexprofilen können so konstruiert werden, dass ihr Koeffizient der kombinierten Material- und Wellenleiterdispersion proportional zu dem einer gewöhnlichen Stufenindexfaser ist, aber das entgegengesetzte Vorzeichen hat. Das kann auch über ein ausgedehntes Band von Wellenlängen erreicht werden, wie Abb. 10.29(c) zeigt. Die durch eine herkömmliche Faser eingeführte Pulsverbreiterung kann dann umgekehrt werden, indem man die beiden Arten von Fasern verkettet. Eine Faser mit einem umgekehrten Dispersionskoeffizienten wird als dispersionskompensierende Faser bezeichnet. Ein kurzes Segment ei-
ner solchen Faser kann die durch ein langes Segment einer herkömmlichen Faser eingeführte Dispersion kompensieren. Polarisationsdispersion
Wie bereits erwähnt besitzt die Grundmode (LP01 ) einer Glasfaser zwei Polarisationsmoden, die z. B. in 𝑥und 𝑦-Richtung linear polarisiert sind. Wenn die Faser ideal rotationssymmetrisch um ihre Achse und ihr Material vollkommen isotrop ist, dann sind die beiden Polarisationsmoden entartet, d. h. sie breiten sie sich mit derselben Geschwindigkeit aus. Unter realen Bedingungen besitzen Fasern aber immer eine geringe Doppelbrechung, die sich entlang der Faser zufällig ändert. Hierfür sind geringe Variationen im Brechungsindex und der Elliptizität der Faser verantwortlich. Obwohl die Auswirkungen solcher Inhomogenitäten und Anisotropien auf die Polarisationsmoden und die Dispersion optischer Pulse im Allgemeinen schwierig anzugeben sind, können wir diese Effekte anhand einfacher Modelle untersuchen. Als Erstes betrachten wir eine Faser, die wir uns als homogenes anisotropes Medium mit Hauptachsen in 𝑥und 𝑦-Richtung und den Hauptbrechungsindizes 𝑛𝑥
311
312
10 Faseroptik
δτ
0
t
0
τxτy
t
Abb. 10.30 Die Gruppenlaufzeitdifferenz bei der Polarisationsdispersion.
und 𝑛𝑦 vorstellen. Die dritte Hauptachse liegt natürlich entlang der Faserachse (der 𝑧-Richtung). Das Fasermaterial soll dispersiv sein, sodass 𝑛𝑥 und 𝑛𝑦 frequenzabhängig sind, aber die Hauptachsen sollen innerhalb des betrachteten Spektralbereichs nicht von der Frequenz abhängen. Wenn der Eingabepuls 𝑥-polarisiert ist, wird er nach Übertragung über eine Entfernung 𝐿 in der Faser eine Gruppenlaufzeit 𝜏𝑥 = 𝑁𝑥 𝐿∕𝑐0 erfahren; wenn er in 𝑦-Richtung linear polarisiert ist, wird die Gruppenlaufzeit 𝜏𝑦 = 𝑁𝑦 𝐿∕𝑐0 sein. Hier sind 𝑁𝑥 und 𝑁𝑦 die Gruppenindizes, die zu 𝑛𝑥 und 𝑛𝑦 gehören (siehe Abschnitt 5.7). Ein Puls in einem Polarisationszustand, der beide linearen Polarisationen einschließt, wird eine Gruppenlaufzeitdifferenz δ𝜏 = |𝜏𝑦 − 𝜏𝑥 | erfahren, die durch δ𝜏 = Δ𝑁𝐿∕𝑐0
(10.62)
mit Δ𝑁 = |𝑁𝑦 − 𝑁𝑥 | gegeben ist. Bei der Ausbreitung wird sich der Puls daher in zwei orthogonal polarisierte Komponenten aufspalten, deren Zentren sich während der Ausbreitung zeitlich auftrennen werden (siehe Abb. 10.30). Die Gruppenlaufzeitdifferenz entspricht einer Polarisationsdispersion, die mit einer Geschwindigkeit Δ𝑁∕𝑐0 linear mit der Faserlänge zunimmt und meist in der Einheit ps∕km angegeben wird. Da eine lange Faser normalerweise Umwelt- und Struktureinflüssen ausgesetzt ist, die sich entlang ihrer Achse ändern, ist das zuvor betrachtete einfache Modell betrachtet häufig unzureichend. Ein realistischeres Modell kann unter diesen Bedingungen aus einer Folge von kurzen homogenen Fasersegmenten bestehen, von denen jedes seine eigenen Hauptachsen und Hauptindizes hat. Die Hauptachsen sollen dabei von von einem Segment zum nächsten etwas verdreht sein. Ein solches Kaskadensystem wird allgemein durch eine 2 × 2-Jonesmatrix T beschrieben, die das Produkt der Jonesmatrizen der einzelnen Segmente ist (siehe Abschnitt 6.1.2). Die Polarisationsmoden des vereinten Systems sind die Eigenvektoren von T; sie sind nicht unbedingt linear polarisierte Moden. Wenn die Faser als verlustfrei angenommen wird, ist die Matrix T unitär. Ihre Eigenwerte sind dann Phasenfaktoren exp(i𝜑1 ) und exp(i𝜑2 ), die in der Form exp(i𝑛1 𝑘0 𝐿) und exp(i𝑛2 𝑘0 𝐿)
geschrieben werden können, wobei 𝑛1 und 𝑛2 die effektiven Brechungsindizes der beiden Polarisationsmoden sind und 𝐿 die Faserlänge bezeichnet. Die Ausbreitung des Lichts durch eine solche Faser kann dann analysiert werden, indem man die Eingabewelle in Komponenten entlang der beiden Polarisationsmoden zerlegt; diese Komponenten breiten sich mit den effektiven Brechungsindizes 𝑛1 und 𝑛2 aus. Da die Faser dispersiv ist, ist T frequenzabhängig und damit auch die Indizes 𝑛1 und 𝑛2 der Moden sowie die entsprechenden Gruppenindizes 𝑁1 und 𝑁2 . Ein Eingabepuls mit einem Polarisationszustand, der gleich der ersten Polarisationsmode der Faser ist, breitet sich mit einem effektiven Gruppenindex 𝑁1 aus. Entsprechend breitet er sich mit einem effektiven Gruppenindex 𝑁2 aus, wenn er in der zweiten Polarisationsmode vorliegt. Ein Eingabepuls mit Komponenten von beiden Polarisationsmoden der Faser erfährt eine Gruppenlaufzeitdifferenz gemäß Gl. (10.62) mit Δ𝑁 = |𝑁1 − 𝑁2 |. Ein statistisches Modell, das die zufälligen Variationen im Betrag und der Orientierung der Doppelbrechung entlang der Faser beschreibt, führt zu einem Ausdruck für die quadratisch gemittelte Pulsverbreiterung durch die Gruppenlaufzeitdifferenz. √ Es zeigt sich, dass dieser Mittelwert proportional zu 𝐿 anstelle von 𝐿 ist, √ 𝜎PD = 𝐷PD 𝐿 ,
(10.63)
wobei 𝐷PD ein Dispersionsparameter ist, √ der normalerweise im Intervall zwischen 0.1 und 1 ps∕ km liegt. Neben der Gruppenlaufzeitdifferenz existieren auch Dispersionseffekte höherer Ordnung. Beispielsweise wird jede der Polarisationsmoden durch die Gruppenlaufzeitdispersion verbreitert, wobei die Dispersionskoeffizienten proportional zur zweiten Ableitung ihres Brechungsindex sind (siehe Abschnitt 5.7). Ein anderer Effekt höherer Ordnung hängt mit der Kopplung zwischen den spektralen und Polarisationseigenschaften des Systems zusammen. Da die Matrix T frequenzabhängig ist, hängen nicht nur die Eigenwerte (d. h. die Hauptindizes 𝑛1 und 𝑛2 ) von der Frequenz ab, sondern auch die Eigenvektoren (d. h. die Polarisationsmoden). Wenn die spektrale Breite des Pulses schmal genug (d. h. der Puls nicht zu kurz) ist, können wir näherungsweise die Moden bei der Mittenfrequenz verwenden. Für ultrakurze Pulse ist jedoch eine ausführlichere Analyse nötig, die eine kombinierte Beschreibung der Polarisations- und der spektralen Eigenschaften des Systems umfasst. Dabei findet man Polarisationszustände, für die die Gruppenlaufzeiten nicht von der Frequenz abhängen, sodass die zugehörige Gruppenlaufzeitdifferenz minimal ist. Allerdings sind diese keine Eigenvek-
10.3 Dämpfung und Dispersion
y
yʹ x
xʹ 45°
Abb. 10.31 Doppelbrechende Zweisegmentfaser.
toren der Jonesmatrix, sodass die Polarisationszustände an Ein- und Ausgang des Systems nicht identisch sind. 4) Übung 10-2: Gruppenlaufzeitdifferenz in einer Zweisegmentfaser
Wir betrachten die Ausbreitung eines optischen Pulses durch eine Faser der Länge 1 km, die aus zwei gleichlangen Segmenten bestehen soll. Jedes Segment ist eine anisotrope Einmodenfaser mit den Hauptgruppenindizes 𝑁𝑥 = 1.462 und 𝑁𝑦 = 1.463. Die entsprechenden Koeffizienten der Gruppenlaufzeitdispersion sind 𝐷𝑥 = 𝐷𝑦 = 20 ps∕(km ⋅ nm). Die Hauptachsen des einen Segments liegen in einem Winkel von 45◦ zu denen des zweiten Segments, wie in Abb. 10.31 dargestellt. (a) Skizzieren Sie das zeitliche Profil des Pulses am Ausgang der Faser, wenn der Eingabepuls eine Breite 100 ps hat und in 45◦ -Richtung zu den 𝑥und 𝑦-Richtungen der Faser linear polarisiert ist. Nehmen Sie dazu an, dass die Pulsquelle eine spektrale Linienbreite von 50 nm hat. (b) Bestimmen Sie die Polarisationsmoden der Gesamtfaser und bestimmen Sie das zeitliche Profil des Ausgangspulses, wenn der Eingabepuls in einer der Polarisationsmoden vorliegt. Nichtlineare Dispersion
Wenn die Intensität des Lichts im Kern der Faser hinreichend groß ist, existiert noch ein weiterer Dispersionseffekt, da der Brechungsindex dann intensitätsabhängig wird und das Material nichtlineares Verhalten zeigt. Da die Phase proportional zum Brechungsindex ist, erfahren die Anteile eines optischen Pulses mit hoher Intensität Phasenverschiebungen gegenüber den Anteilen mit niedriger Intensität. Dieser als Selbstphasenmodulation bezeichnete nichtlineare Effekt trägt ebenfalls zur Pulsdispersion bei. Unter bestimmten Bedingungen kann die Selbstphasenmodulation die Gruppenlaufzeitund Materialdispersion kompensieren und der Puls kann sich ausbreiten, ohne sein zeitliches Profil zu verändern. Eine derartige geführte Welle wird als Soliton bezeichnet. Nichtlineare Optik wird in Kapitel 22 eingeführt und optische Solitonen werden im Kapitel 23 ausführlicher besprochen. 4) Für mehr Details zu diesem Thema siehe C. D. Poole, R. E Wagner, ‚Phenomenological Approach to Polarization Dispersion in Long Single-Mode Fibers‘, Electronics Letters 22, 1029, 1986.
Zusammenfassung
Die Ausbreitung von Pulsen in Glasfasern wird durch Dämpfung und mehrere Arten von Dispersion bestimmt. Abbildung 10.32 eine gibt einen schematischen Vergleich der Profile von Pulsen, die sich durch verschiedene Arten von Fasern ausbreiten. • In einer Vielmodenfaser dominiert die Modendispersion die Breite des am Ausgang der Faser empfangenen Pulses. Sie wird durch die unterschiedlichen Gruppenlaufzeiten der einzelnen Moden hervorgerufen. • In einer Einmodenfaser gibt es keine Modendispersion, und die Übertragung von optischen Pulsen wird durch die kombinierte Material- und Wellenleiterdispersion (auch chromatische Dispersion genannt) begrenzt. Die Breite des Ausgangspulses wird durch die Gruppenlaufzeitdispersion bestimmt. • Materialdispersion ist gewöhnlich viel stärker als Wellenleiterdispersion. Die Wellenleiterdispersion wird jedoch bei den Wellenlängen wichtig, an denen die Materialdispersion klein ist. Fasern mit speziellen Indexprofilen können verwendet werden, um die chromatischen Dispersionseigenschaften zu verändern, z. B. dispersionsflache, dispersionsverschobene und dispersionskompensierende Fasern. • Die Pulsausbreitung in langen Einmodenfasern, für die chromatische Dispersion vernachlässigbar ist, wird durch Polarisationsdispersion dominiert. Kleine anisotrope Änderungen in der Faser, z. B. durch Umweltbedingungen verursacht, verändern die Polarisationsmoden, sodass sich der Eingabepuls in Form zweier Polarisationsmoden mit unterschiedlichen Gruppenindizes ausbreitet. Diese Gruppenlaufzeitdifferenz resultiert in einer kleinen Pulsverbreiterung. • Unter bestimmten Bedingungen kann ein intensiver Puls, ein sogenanntes optisches Soliton, eine Faser nichtlinear machen und sich ohne Verbreiterung durch sie hindurch ausbreiten. Das ergibt sich aus einem Gleichgewicht zwischen Materialdispersion und Selbstphasenmodulation (die Abhängigkeit des Brechungsindex von der Lichtintensität), wie in Kapitel 23 besprochen.
313
314
10 Faseroptik
στ
(a) t
0
Vielmodenfaser
0
τ min
τ max
t
στ
(b) t
0
Einmodenfaser
t
0
Abb. 10.32 Verbreiterung eines kurzen optischen Pulses bei Durchgang durch verschiedene Arten von Fasern. (a) Modendispersion in einer Vielmodenfaser. (b) Material- und Wellenleiterdispersion in einer Einmodenfaser. (c) Polarisationsdispersion in einer Einmodenfaser. (d) Solitonentransmission in einer nichtlinearen Einmodenfaser.
δτ (c) t
0
Einmodenfaser mit Polarisationsdispersion
t
0
Soliton τ0
τ0
(d)
0
t
nichtlineare Einmodenfaser
t
0
10.4 Hohlkernfasern und Fasern aus photonischen Kristallen
strukturierte Fasern führen optische Wellen durch einen von zwei möglichen Mechanismen: Führung durch effektiven Index oder Führung durch photonische Bandlücke, die wir im Folgenden nacheinander betrachten werden.
Eine mikrostrukturierte Faser oder Hohlkernfaser ist eine Faser (meist aus reinem Quarzglas), die zahlreiche zylindrische luftgefüllte Löcher parallel zu ihrer Achse enthält, die in einem regelmäßigen periodischen Muster angeordnet sind. Wie in Abb. 10.33 gezeigt entspricht der Kern hier einem Defekt oder Fehler in der periodischen Struktur, wie etwa einem fehlenden Loch, einem Loch einer anderen Größe oder einem zusätzlichen Loch. Die Löcher werden durch den Abstand 𝛬 zwischen ihren Zentren und ihren Durchmesser d charakterisiert. Der Abstand 𝛬 liegt normalerweise in der Größenordnung 1−10 μm. Es ist hierbei nicht notwendig, dem Glas Dotiersubstanzen beizumischen. Mikro-
10.4.1
Führung durch effektiven Brechungsindex
Wenn der Lochdurchmesser viel kleiner ist als die Wellenlänge des Lichts (d ≪ 𝜆), dann verhält sich der periodische Mantel näherungsweise wie ein homogenes Medium, dessen effektiver Brechungsindex 𝑛2 gleich dem mittleren Brechungsindex des löchrigen Materials ist [siehe Abb. 10.33(a)]. Wellenführung wird dann erreicht, wenn der massive Kern einen Index 𝑛1 > 𝑛2 besitzt, sodass das Licht wie in herkömmlichen Fasern
Λ
(a)
(b)
Abb. 10.33 Verschiedene Formen von mikrostrukturierten Fasern. (a) Ein massiver Kern (gepunkteter Kreis) umgeben von einem Mantel aus demselben Material, der aber von einer periodischen Anordnung zylindrischer Luftlöcher durchsetzt ist, deren Durchmesser viel kleiner sind als eine Wellenlänge. Der mittlere Brechungsindex des Mantels ist kleiner als der des Kerns. (b) Eine Hohlkernfaser aus ei-
(c)
nem photonischen Kristall, bestehend aus einem Mantel mit einer periodischen Anordnung von großen Luftlöchern um einen massiven Kern (gepunkteter Kreis). (c) Eine Hohlkernfaser aus einem photonischen Kristall, bestehend aus einem Mantel mit einer periodischen Anordnung von großen Luftlöchern um ein zentrales Luftloch mit einem anderen Durchmesser als Kern (gepunkteter Kreis).
10.4 Hohlkernfasern und Fasern aus photonischen Kristallen
durch Totalreflexion geführt wird. In dieser Anordnung dienen die Löcher nur als eine Art verteilte „negative Dotiersubstanz“, die den Brechungsindex des Mantels unter den des massiven Kerns reduziert. Die Löcher können daher zufällig angeordnet sein, müssen also keine periodische Anordnung einhalten, und sie brauchen auch axial nicht kontinuierlich zu sein. Wenn die Größe der Löcher nicht viel kleiner ist als die Wellenlänge, muss der löchrige Mantel als zweidimensionales periodisches Medium behandelt werden. Der effektive Brechungsindex 𝑛2 ist dann gleich dem mittleren Brechungsindex, gewichtet mit der optischen Intensitätsverteilung in dem Medium, und hängt daher stark von der Wellenlänge sowie von der Größe und der Form und Anordnung der Löcher ab. Da Wellen mit kleineren Wellenlängen in einem Medium mit einem größeren Brechungsindex stärker eingegrenzt werden, ist der effektive Brechungsindex 𝑛2 (𝜆) des Mantels eine abnehmende Funktion der Wellenlänge. Ein ähnlicher Effekt tritt in eindimensionalen photonischen Kristallen auf, in denen der effektive Brechungsindex bei Frequenzen im tiefsten photonischen Band eine ansteigende Funktion der Frequenz ist (siehe Abb. 7.20). Die Faser besitzt daher eine starke Wellenleiterdispersion, was eine äußerst nützliche Eigenschaft sein kann. Eine Folge der Wellenleiterdispersion ist, dass eine mikrostrukturierte Faser über einen großen Bereich von Wellenlängen als Einmodenstruktur betrieben werden kann, unter Umständen vom Infraroten bis ins Ultraviolette. 5) Diese Eigenschaft, die als endlose Einmodenführung bezeichnet√wird, entsteht, wenn der V -Para-
meter V = (2π𝑎∕𝜆) 𝑛12 − 𝑛22 (𝜆) der Faser näherungsweise unabhängig von 𝜆 ist. Das ist der Fall, wenn der effektive Index 𝑛2 (𝜆) mit steigendem 𝜆 so abnimmt, dass √
𝑛12 − 𝑛22 (𝜆) ∝ 𝜆 gilt. Im Gegensatz dazu ist für eine konventionelle Faser V umgekehrt proportional zu 𝜆, sodass das Einmodenverhalten bei einer bestimmten Wellenlänge (V < 2.405) zu einem Vielmodenverhalten wird, wenn die Wellenlänge so klein wird, dass V über 2.405 steigt. Eine andere interessante Eigenschaft ist die Möglichkeit eines Einmodenbetriebs bei großer Modenfläche. Optische Fasern mit großen Modenflächen sind für Anwendungen nützlich, die hohe Leistungsübertragung erfordern. In einer konventionellen Faser kann die Bedingung für Einmodenbetrieb (V = 2π(𝑎∕𝜆0 )NA < 2.405) für einen großen Kerndurchmesser 2𝑎 durch Verwendung einer kleinen numerischen Apertur erfüllt wer5) Siehe T. A. Birks, J. C. Ritter, P. St. J. Russell, ‚Endlessly Single-Mode Photonic Crystal Fibre‘, Optics Letters 22, 961, 1997.
den. Ähnlich kann die Größe der geführten Mode in mikrostrukturierten Fasern vergrößert werden, indem man einen größeren Lochabstand 𝛬 (der einen größeren Kerndurchmesser bedeutet) und Löcher mit einem kleineren Durchmesser d verwendet (was eine kleinere numerische Apertur bedeutet und dem Feld erlaubt, tiefer in den Mantel einzudringen). Man erhält so für relativ kleine Änderungen der Lochgröße dramatische Steigerungen der Modenfläche; es wurden Modenflächen berichtet, die mehrere Größenordnungen über den in konventionellen Fasern üblichen lagen.
10.4.2 Führung durch photonische Bandlücke Der Mantel einer mikrostrukturierten Faser kann als zweidimensionaler photonischer Kristall betrachtet werden. Die in Abb. 10.33(b) gezeigte Mikrostruktur mit Löchern in einem trigonalen Gitter hat zum Beispiel ein Dispersionsdiagramm mit photonischen Bandlücken wie in Abb. 7.27 gezeigt und in Abschnitt 7.3.1 besprochen. Wenn die optische Frequenz innerhalb der photonischen Bandlücke liegt, ist die Ausbreitung im Mantel verboten, und die Faser wirkt als Wellenleiter aus einem mikrostrukturierten Kristall (siehe Abschnitt 9.4). Eine Faser aus einem photonischen Kristall kann einen massiven oder hohlen Kern haben, wie Abb. 10.33(b) bzw. (c) zeigen. In Fasern mit einem hohlen Kern kann die Führung nichts mit dem effektiven Brechungsindex zu tun haben kann, d. h. die Führung kann nicht auf Totalreflexion beruhen. Die Verwendung von Fasern aus photonischen Kristallen mit einem hohlen Kern bietet eine Reihe von Vorteilen: (1) Eine geführte Welle, die sich in einem Luftkern ausbreitet, erleidet geringere Verluste und weniger nichtlineare Effekte und kann daher eine größere optische Leistung übertragen. (2) In einem Luftkern kann auch ultraviolettes Licht geführt werden, das in Fasern mit massivem Kern zu Schäden führen würde. (3) Auch Licht mit Wellenlängen, für die keine transparenten Materialien zur Verfügung stehen, kann geführt werden. (4) In den hohlen Kern können Atome, Moleküle, Gase oder andere Strukturen mit Abmessungen im Subwellenlängenbereich eingebracht werden.
10.4.3 Anwendungen Fasern auf der Grundlage photonischer Kristalle bieten zahlreiche einzigartige Gestaltungsmöglichkeiten und Anwendungen. Beispielsweise ist Dispersionsabflachung über breite Wellenlängenbereiche möglich, ebenso Dispersionsverschiebung zu Wellenlängen un-
315
316
10 Faseroptik
terhalb der Wellenlänge, für die die Materialdispersion null ist. Sie ermöglichen die Ausbreitung von hochintensiven Femtosekundenpulsen und deren Komprimierung auf ultrakurze Zeitdauern. Ihre großen Wechselwirkungslängen und ihr scharfer Einschluss ermöglichen die Untersuchung nichtlinearer optischer Effekte wie z. B. niedrigschwelliger induzierter Ramanstreuung, die Erzeugung von Harmonischen oder elektromagnetisch induzierte Transparenz. Die doppelbrechenden Eigenschaften solcher Fasern können auf interessante und nützliche Weise gezielt angepasst werden. Akustooptische Wechselwirkungen können hervorgerufen und untersucht werden. Fasern auf Basis photonischer Kristalle machen es möglich, breitbandige Superkontinuum-Quellen (deren Spektrum vom mittleren Infrarot bis ins mittlere Ultraviolett reicht), modengekoppelte Solitonen-Faserlaser oder leistungsstarke Faserlaser zu konstruieren, die über einen breiten Wellenlängenbereich arbeiten. Fasern aus photonischen Kristallen können einfach als dynamische Sensoren für mechanischen Dehnung, Temperatur oder elektrische Felder eingesetzt werden. Druck und Wärme verändern die Größe der Luftlöcher, was wiederum einen Einfluss auf ihre optischen Eigenschaften hat. Hohlkernfasern können verwendet werden, um Objekte wie lebende Zellen, Kolloide, Cluster und Partikel in Nanometergröße zu untersuchen, zu charakterisieren, zu manipulieren, einzufangen und zu beschleunigen. Man kann Gase, Flüssigkeiten oder Metabolite in den Kern einer Hohlkernfaser diffundieren lassen und an ihnen hochempfindliche optische Messungen durchführen. Weiter kann man die hohlen Kanäle in den photonischen Kristallen mit Metallen, Halbleitern oder Gläsern füllen, was es ermöglicht, Strukturen im Nanometerbereich in die Fasern einzubauen und so Bauelemente zu erhalten, die faseroptische mit plasmonischen Eigenschaften kombinieren.
10.5 Materialien für optische Fasern Wie in diesem Kapitel wiederholt erwähnt wurde, werden optische Fasern hauptsächlich in faseroptischen Kommunikations- und Datenübertragungssystemen im nahen Infrarot eingesetzt. Das mit Abstand wichtigste Material zur Herstellung dieser Fasern ist Quarzglas, da es im Telekommunikationsband zwischen 1.3 und 1.6 μm nur sehr geringe Verluste aufweist, wie wir in Abschnitt 10.3.1 gesehen hatten. Für viele Anwendungen kommen auch Spezialfasern in Betracht, sich in mindestens einer besonderen Eigenschaft von StandardQuarzglasfasern unterscheiden. Sie können beispiels-
weise doppelt umhüllt, polarisationserhaltend, strahlungsbeständig oder mit laseraktiven Seltenerdionen dotiert sein.
10.5.1
Fasern für das mittlere Infrarot
Der Bedarf an Glasfasern erstreckt sich über das nahe Infrarot hinaus. Das mittlere Infrarot bietet zum Beispiel eine beträchtliche Zahl von möglichen Materialien wie z. B. Fluorid-, Germanat-, Tellurit- oder Chalkogenidgläser. Von diesen besitzen die Chalkogenide (zu denen Sulfide, Selenide und Telluride gehören) die breitesten Transparenzfenster. Die Schmelz- und Verarbeitungstemperaturen dieser sogenannten weichen Gläser sind wesentlich niedriger als die von Quarzglas, sodass sich Fasern aus ihnen sehr einfach durch thermisches Faserziehen herstellen lassen; Fasern aus diesen drei Gläsern sind im Handel kommerziell erhältlich. Das Interesse an diesen Materialien ist erheblich, da Rayleighs inverses Potenzgesetz (siehe Abschnitt 5.6.2 und 10.3.1) für den infraroten Bereich eine Verringerung sowohl der Rayleighstreuung als auch der Absorption gegenüber den Werten von Quarzglas vorhersagt. Es wird erwartet, dass die Dämpfung aufgrund von Rayleighstreuung in Fluoridglas-Infrarotfasern ungefähr zehnmal kleiner sein wird als die in optischen Fasern aus Quarzglas und minimale Werte in der Gegend von 0.01 dB∕km bei 𝜆0 = 2.5 μm erreichen kann; diese Thematik ist aber natürlich nur dann von Bedeutung, wenn nicht extrinsische Verlustmechanismen den Verlust dominieren. Trotz der großen Auswahl an Materialien für optische Fasern im mittleren Infrarotbereich sind die optischen und mechanischen Eigenschaften dieser Fasern nach heutigem Stand der Technik denen herkömmlicher Quarzglasfasern deutlich unterlegen. Mit Ausnahme von Fluoridglasfasern besitzen die meisten Fasern im mittleren Infrarotbereich Transmissionsverluste im Bereich dB∕m, wohingegen Quarzglasfasern mit Verlusten in der Größenordnung dB∕km weitaus transparenter sind. Die Verwendung der meisten Fasern für das mittlere Infrarot ist derzeit demzufolge auf Anwendungen beschränkt, bei denen die Faserlängen in der Größenordnung von Metern und nicht von Kilometern liegen, d. h. auf Kurzstreckenanwendungen wie Sensorik, Messtechnik, Biomedizin oder die Weiterleitung von Laserleistung im Infraroten. Es wird jedoch erwartet, dass diese Einschränkungen letztendlich überwunden werden können.
10.5 Materialien für optische Fasern
10.5.2 Hybrid- und Multifunktionsfasern Hybride Fasern für das mittlere Infrarot
Die Fähigkeit, heterogene Fasern aus mehreren Materialien in einem Arbeitsgang zu ziehen, hat zur Entwicklung von Hybridfasern geführt, die als vielversprechender Ansatz gelten, der einige der oben diskutierten optischen und mechanischen Probleme herkömmlicher Fasern im mittleren Infrarot verbessern könnte. Einige Beispiele derartiger hybrider Fasern für den mittleren Infrarotbereich sind: 6) (1) Stufenindexfasern aus einem Chalkogenidglaskern mit einem Mantel aus Polymeren (als Schutz) sowie Quarz- oder Telluritglas; (2) Stufenindexfasern mit einem Kern aus kristallinen Halbleitern wie z. B. InSb, ZnSe, Si oder Ge und einem Mantel aus Borosilikat- oder Quarzglas. Im Kontext optischer Fasern auf der Basis photonischer Kristalle (siehe Abschnitt 10.4) wären hier zu nennen: (3) Fasern mit massivem Kern aus Chalkogenid- oder Fluoridglas sowie (4) Hohlkernfasern aus Siliciumdioxid oder Chalkogeniden. Fasern aus Materialkombinationen
Wie in Abschnitt 10.4 angedeutet, gibt es mittlerweile optische Fasern, die nicht nur Gläser, sondern auch Leiter, Halbleiter, Isolatoren und Gase sowie noch speziellere Materialien wie Flüssigkristalle oder piezoelektrische Medien enthalten. Man kann heute kilometerlange thermisch gezogene Fasern herstellen, die in aufwendigen Herstellungsprozessen eine gezielte innere Strukturierung auf der Grundlage derartiger Materialien erhalten. Darüber hinaus kann sich die endgültige Zusammensetzung einer Faser aufgrund chemischer Reaktionen, die durch Erhitzen und Ziehen während des Herstellungsprozesses ausgelöst werden, von der der Ausgangsmaterialien unterscheiden (z. B. können metallisches Aluminium und Quarzglas als Ausgangsbestandteile zu einer Faser mit einem Kern aus kristallinem Silicium führen). Fasern aus Materialkombinationen können so eingestellt werden, dass sie Licht, Schall und/oder Wärme registrieren, die auf ihre Seitenflächen auftreffen. Umgekehrt können sie auch Licht oder Töne emittieren. Multifunktionale Fasern und Faserarrays
Multifunktionale Fasern bieten eine Vielfalt von Funktionen. Neben der Integration mehrerer Komponenten in eine einzelne Faser können auch großflächige Faserarrays oder Fasertextilien hergestellt werden. Fasern aus 6) Siehe G. Tao, H. Ebendorff-Heidepriem, A. M. Stolyarov, S. Danto, J. V. Badding, Y. Fink, J. Ballato, A. F. Abouraddy, ‚Infrared Fibers‘, Advances in Optics and Photonics 7, 379–458, 2015.
Materialkombinationen, multifunktionale Fasern und Faserarrays können eine Vielzahl von Funktionen auf den Gebieten Photonik, Elektronik, Mechanik, Wärmetechnik, Akustik, Chemie und Biomedizin erfüllen. Darüber hinaus können innere Strukturen mit Abmessungen von einigen Nanometern in Fasern mit Längen von einigen Kilometern angeordnet wird, was die Kombination von faseroptischen und plasmonischen Merkmalen ermöglicht. Beispiele
Einige Beispiele für Fasern aus Materialkombinationen und Multifunktionsfasern sind: 7) • Ein axial gepumpter Faserlaser mit photonischer Bandlücke mit einem Kern aus organischem Farbstoff, gelöst in einem festen Wirtsmedium als Verstärkungsmedium, der in radialer Richtung Licht emittiert. • Fasern zur Registrierung von Schall, die über die gesamte Länge der Faser einen piezoelektrischen Kunststoff enthalten (Druckwellen induzieren Ladungen in dem piezoelektrischen Material). • Fasern zur Erfassung von Wärme, die über die gesamte Länge der Faser ein Halbleiterbauelement enthalten (dessen Leitfähigkeit auf Temperaturänderungen reagiert). • Eine flexible Textilkamera (ohne Bilderzeugung) aus optischen Fasern, die über die gesamte Länge der Faser eine photoleitende Halbleiter- oder Glaskomponente enthalten (deren Leitfähigkeit durch Licht verändert wird). • Ein Textildisplay aus Fasern mit Flüssigkristallen in Kanälen (die je nach angelegter Spannung Licht blockieren oder durchlassen). • Eine multifunktionale Sonde aus Polymerfasern, die gleichzeitige optische, elektrische und chemische Wechselwirkungen mit einer Zelle in einem neuronalen Stromkreis ermöglicht. 8)
7) Siehe A. F. Abouraddy, M. Bayindir, G. Benoit, S. D. Hart, K. Kuriki, N. Orf, O. Shapira, F. Sorin, B. Temelkuran, Y. Fink, ‚Towards Multimaterial Multifunctional Fibres that See, Hear, Sense and Communicate‘, Nature Materials, 6, 336–347, 2007; G. Tao, A. F. Abouraddy, A. M. Stolyarov, ‚Multimaterial Fibers‘, International Journal of Applied Glass Science 3, 349–368, 2012. 8) Siehe A. Canales, X. Jia, U. P. Froriep, R. A. Koppes, C. M. Tringides, J. Selvidge, C. Lu, C. Hou, L. Wei, Y. Fink, P. Anikeeva, ‚Multifunctional Fibers for Simultaneous Optical, Electrical and Chemical Interrogation of Neural Circuits In Vivo‘, Nature Biotechnology 33, 277–284, 2015.
317
318
10 Faseroptik
Aufgaben Aufgabe 10-1: Kopplungswirkungsgrad
(a) Eine Lichtquelle strahlt mit der optischen Leistung P 0 und einer Verteilung 𝐼(𝜃) = (1∕π)P 0 cos 𝜃, wobei 𝐼(𝜃) die Leistung pro Einheits-Raumwinkel in einer Richtung ist, die einen Winkel 𝜃 mit der Faserachse einschließt. Zeigen Sie, dass die durch die Faser gesammelte Leistung P = (NA)2 P0 ist, sodass der Kopplungswirkungsgrad (NA)2 ist, wenn NA die numerische Apertur der Faser ist. (b) Berechnen Sie die numerische Apertur der Faser und den Kopplungswirkungsgrad für 𝑛1 = 1.46 und 𝑛2 = 1.455, wenn die Quelle eine ebene LED mit dem Brechungsindex 𝑛Q = 3.5 und der Faserquerschnitt größer ist als die emittierende Fläche der LED. Aufgabe 10-2: Numerische Apertur einer Gradientenindexfaser
Vergleichen Sie die numerischen Aperturen einer Stufenindexfaser mit 𝑛1 = 1.45 und 𝛥 = 0.01 und einer Gradientenindexfaser mit 𝑛1 = 1.45 und 𝛥 = 0.01 und einem parabolischen Indexprofil (𝑝 = 2) (siehe Übung 1-9). Aufgabe 10-3: Moden
Eine Stufenindexfaser hat den Radius 𝑎 = 5 μm, einen Brechungsindex 𝑛1 = 1.45 des Kerns und eine relative Änderung des Brechungsindex von 𝛥 = 0.002. Bestimmen Sie die kleinste Wellenlänge 𝜆k , für die die Faser ein Einmodenwellenleiter ist. Geben Sie die Indizes (𝑙, 𝑚) aller geführten Moden an, wenn die Wellenlänge auf 𝜆k ∕2 geändert wird. Aufgabe 10-4: Modendispersion
Eine Stufenindexfaser mit der numerischen Apertur NA = 0.16, dem Kernradius 𝑎 = 45 μm, und dem Brechungsindex 𝑛1 = 1.45 im Kern wird bei 𝜆0 = 1.3 μm betrieben, wo die Materialdispersion vernachlässigbar ist. Skizzieren Sie die Form des empfangenen Signals, wenn ein sehr kurzer Lichtpuls bei 𝑡 = 0 in die Faser eintritt und sich über eine Entfernung von 1 km ausbreitet. (a) Verwenden Sie die Strahlenoptik und nehmen Sie an, dass nur meridionale Strahlen erlaubt wird. (b) Verwenden Sie die Wellenoptik und nehmen Sie an, dass nur meridionale (𝑙 = 0) Moden erlaubt wird.
𝑙 = 0 abzuschätzen. Verwenden Sie Abb. 10.14(a), um die Phasengeschwindigkeit, die Ausbreitungskonstante, und die Gruppengeschwindigkeit der LP01 -Mode zu bestimmen, wenn der Kernradius geändert wird, sodass V = 4 ist. Ignorieren Sie den Einfluss der Materialdispersion. Aufgabe 10-6: Ausbreitungskonstanten und Wellenvektor (Stufenindexfaser)
Eine Stufenindexfaser mit dem Radius 𝑎 = 20 μm und den Brechungsindizes 𝑛1 = 1.47 und 𝑛2 = 1.46 wird bei 𝜆0 = 1.55 μm betrieben. Verwenden Sie die Theorie quasi-ebener Wellen, betrachten Sie nur geführte Moden mit dem azimutalen Index 𝑙 = 1 und bestimmen Sie (a) die kleinsten und größten Ausbreitungskonstanten, und (b) die Radien der zylindrischen Schale, innerhalb derer die Welle eingegrenzt wird, sowie die Komponenten des Wellenvektors k bei 𝑟 = 5 μm für die Mode mit der kleinsten Ausbreitungskonstante. Aufgabe 10-7: Ausbreitungskonstanten und Wellenvektor (Gradientenindexfaser)
Wiederholen Sie die Berechnungen aus Aufgabe 10-6 für eine Gradientenindexfaser mit parabolischem Indexprofil (𝑝 = 2). Aufgabe 10-8: Streuverluste
Bei 𝜆0 = 820 nm ist der Absorptionsverlust einer Faser 0.25 dB∕km und die Streuverluste betragen 2.25 dB∕km. Schätzen Sie die Gesamtdämpfung bei 𝜆0 = 600 nm ab, wenn die Faser stattdessen bei 𝜆0 = 600 nm betrieben wird und kalorimetrische Messungen der durch die Lichtabsorption erzeugten Hitze einen Verlust von 2 dB∕km ergeben. Aufgabe 10-9: Modendispersion in Stufenindexfasern
Bestimmen Sie den Kernradius einer Vielmoden-Stufenindexfaser mit einer numerischen Apertur NA = 0.1, wenn die Zahl der Moden 𝑀 = 5000 und die Wellenlänge 0.87 μm ist. Bestimmen Sie die Antwortzeit 𝜎𝜏 aufgrund von Modendispersion für eine 2 km lange Faser mit dem Brechungsindex 𝑛1 = 1.445 im Kern und dem Gruppenindex 𝑁1 = 1.456, wenn 𝛥 näherungsweise unabhängig von der Wellenlänge ist.
Aufgabe 10-5: Ausbreitungskonstanten und Gruppengeschwindigkeiten
Aufgabe 10-10: Modendispersion in Gradientenindexfasern
Eine Stufenindexfaser mit den Brechungsindizes 𝑛1 = 1.444 und 𝑛2 = 1.443 wird bei 𝜆0 = 1.55 μm betrieben. Bestimmen Sie den Kernradius, für den der V -Parameter der Faser gleich 10 ist. Verwenden Sie Abb. 10.11, um die Ausbreitungskonstanten aller geführten Moden mit
Betrachten Sie eine Gradientenindexfaser mit 𝑎∕𝜆0 = 10, 𝑛1 = 1.45, 𝛥 = 0.01 und einem Potenzgesetz-Indexprofil mit dem Index 𝑝. Bestimmen Sie die Zahl 𝑀 der Moden und die Geschwindigkeit 𝜎𝜏 ∕𝐿 der Pulsverbreiterung der Modendispersion für 𝑝 = 1.9, 2, 2.1 und ∞.
Aufgaben
Aufgabe 10-11: Pulsausbreitung
Ein Puls der anfänglichen zeitlichem Breite 𝜏0 wird durch eine Gradientenindexfaser der Länge 𝐿 mit einem Potenzgesetz-Indexprofil mit dem Exponenten 𝑝 übertragen. Der maximale Brechungsindex 𝑛1 hängt gemäß 2 𝐷𝜆 = −(𝜆0 ∕𝑐0 ) d 𝑛1 ∕ d𝜆02 von der Wellenlänge ab, während 𝛥 näherungsweise unabhängig von der Wellenlänge ist; 𝜎𝜆 ist die spektrale Breite der Quelle und 𝜆0 ist die Betriebswellenlänge. Diskutieren Sie den Einfluss einer Erhöhung der folgenden Parameter auf die zeitlichen Breite des empfangenen Pulses: 𝐿, 𝜏0 , 𝑝, |𝐷𝜆 |, 𝜎𝜆 und 𝜆0 .
Weiterführende Literatur Bücher
Siehe auch die in Kapitel 7 aufgeführte Literatur zu photonischen Kristallen und die in Kapitel 9 angegebene Literatur. F. Mitschke, Fiber Optics: Physics and Technology, Springer, 2. Aufl 2016. Y. Koike, Fundamentals of Plastic Optical Fibers, WileyVCH 2015. J. Hecht, Understanding Fiber Optics, Laser Light Press, 5. Aufl. 2015. F. Zolla, G. Renversez, A. Nicolet, B. Kuhlmey, S. Guenneau, D. Felbacq, A. Argyros, S. Leon-Saval, Foundations of Photonic Crystal Fibres, Imperial College Press, 2. Aufl. 2012. A. Kumar, A. Ghatak, Polarization of Light with Applications in Optical Fibers, SPIE Optical Engineering Press 2011. R. Paschotta, Field Guide to Optical Fiber Technology, SPIE Optical Engineering Press 2010. F. Poli, A. Cucinotta, S. Selleri, Photonic Crystal Fibers: Properties and Applications, Springer 2007, Paperback 2010. M. G. Kuzyk, Polymer Fiber Optics: Materials, Physics, and Applications, CRC Press/Taylor & Francis 2007. A. Mendez, T. F. Morse (Hrsg.), Specialty Optical Fibers Handbook, Academic Press 2007. C. DeCusatis, C. J. Sher DeCusatis, Fiber Optic Essentials, Academic Press/Elsevier 2005. A. Galtarossa, C. R. Menyuk (Hrsg.), Polarization Mode Dispersion, Springer 2005. J. A. Harrington, Infrared Fibers and Their Applications, SPIE Optical Engineering Press 2004. A. Bjarklev, J. Broeng, A. S. Bjarklev, Photonic Crystal Fibers, Springer 2003, Paperback 2012. J. Hecht, City of Light: The Story of Fiber Optics, Oxford University Press 2004. C. K. Kao, Optical Fiber Systems: Technology, Design, and Applications, McGraw-Hill 1982, Nachdruck 1986. D. Marcuse, Light Transmission Optics, Van Nostrand Reinhold 1972, 2. Aufl. 1982; Krieger, Nachdruck 1989.
D. Marcuse, Principles of Optical Fiber Measurements, Academic Press 1981. Reviews über photonische Kristallfasern, Mehrkernfasern und Infrarotfasern
G. Tao, H. Ebendorff-Heidepriem, A. M. Stolyarov, S. Danto, J. V. Badding, Y. Fink, J. Ballato, A. F. Abouraddy, ‚Infrared Fibers‘, Advances in Optics and Photonics 7, 379–458, 2015. T. Hayashi, ‚Multi-Core Optical Fibers‘. In I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. G. Tao, A. F. Abouraddy, A. M. Stolyarov, ‚Multimaterial Fibers‘, International Journal of Applied Glass Science 3, 349–368, 2012. A. F. Abouraddy, M. Bayindir, G. Benoit, S. D. Hart, K. Kuriki, N. Orf, O. Shapira, F. Sorin, B. Temelkuran, Y. Fink, ‚Towards Multimaterial Multifunctional Fibres that See, Hear, Sense and Communicate‘, Nature Materials 6, 336– 347, 2007. P. Russell, ‚Photonic Crystal Fibers‘, Science 299, 358, 2003. J. C. Knight, J. Broeng, T. A. Birks, P. St. J. Russell, ‚Photonic Band Gap Guidance in Optical Fibers‘, Science 282, 1476– 1478, 1998. Bahnbrechende Arbeiten
P. J. Winzer, C. J. Chang-Hasnain, A. E. Willner, R. C. Alferness, R. W. Tkach, T. G. Giallorenzi (Hrsg.), A Third of a Century of Lightwave Technology: January 1983–April 2016, IEEE-OSA 2016. C. K. Kao, ‚Sand from Centuries Past: Send Future Voices Fast‘ (Nobel Lecture in Physics, 2009). In L. Brink (Hrsg.), Nobel Lectures in Physics 2006–2010, World Scientific 2014, S. 253–264. D. B. Keck (Hrsg.), Selected Papers on Optical Fiber Technology, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 38). J. P. Pocholle, L. Jeunhomme, L. D’Auria, ‚Caractéristiques de la propagation guidée dans les fibres multimodes a gradient d’indice (FMGI)‘, Revue technique ThomsonCSF 13, 727–807, 1981. P. J. B. Clarricoats, ‚Optical Fibre Waveguides – A Review‘, Progress in Optics Bd. 14, E. Wolf (Hrsg.), North-Holland 1977. D. B. Keck, R. D. Maurer, P. C. Schultz, ‚On the Ultimate Lower Limit of Attenuation in Glass Optical Waveguides‘, Applied Physics Letters 22, 307–309, 1973. D. Gloge, E. A. J. Marcatili, ‚Multimode Theory of GradedCore Fibers‘, Bell System Technical Journal 52, 1563– 1578, 1973. D. Gloge, ‚Weakly Guiding Fibers‘, Applied Optics 10, 2252, 1971. D. Gloge, ‚Dispersion in Weakly Guiding Fibers‘, Applied Optics 10, 2442, 1971.
319
321
11 Resonatoroptik Ein optischer Resonator ist das optische Gegenstück einer resonanten elektronischen Schaltung. Er schließt Licht ein und speichert es bei Frequenzen, die durch seinen Aufbau bestimmt sind. Er kann als ein optisches Übertragungselement mit Rückkopplung betrachtet werden: das Licht zirkuliert oder wird innerhalb der Grenzen des Resonators wiederholt reflektiert. Verschiedene Ausführungen von optischen Resonatoren sind in Abb. 11.1 dargestellt. Die einfachste, der FabryPérot-Resonator, besteht aus zwei parallelen ebenen Spiegeln, zwischen denen Licht wiederholt mit sehr geringen Verlusten reflektiert wird. Andere Spiegelanordnungen sind z. B. Kugelspiegel, ringförmige Anordnun-
(a) ebener Spiegel
Kugelspiegel
(b) Faserschleife
gen oder rechteckige zwei- und dreidimensionale Hohlräume. Faseroptische Ringresonatoren und integriertoptische Ringresonatoren werden ebenfalls häufig eingesetzt. Auch dielektrische Strukturen mit einer photonischen Bandlücke können Licht einschließen; so entstehen Resonatoren aus photonischen Kristallen. Fabry-Pérot-Wellenleiterresonatoren beruhen auf der Fresnelreflexion an den Grenzflächen zwischen Halbleitern und Luft. Periodische dielektrische Strukturen wie verteilte Braggreflektoren (DBR, engl. distributed Bragg reflectors) können die Rolle der Spiegel in herkömmlichen Fabry-Pérot-Resonatoren überneh-
rechteckiger Resonator
Ringspiegel
(c) photonischer Kristall
DBR
integriert-optische Schleife
DBR
Mikrodisk
(d) Wellenleiter
(e) Mikrosäule
Mikrokugel (f)
Mikrotorus
Abb. 11.1 Lichtspeicherung in optischen Resonatoren: (a) Vielfache Reflexionen an Spiegeln; (b) Ausbreitung in geschlossenen Schleifen aus optischen Fasern und integriertoptischen Wellenleitern; (c) Einschluss in Defektstellen in photonischen Kristallen; (d) Vielfache Fresnelreflexionen
(g) Metall-Nanokugel
an Halbleiter/Luft-Grenzflächen; (e) Reflexionen an periodischen Strukturen wie verteilten Braggreflektoren (DBR); (f) Reflexionen von Flüstergaleriemoden in der Umgebung der Oberfläche von Platten, Toroiden und Kugeln; (g) Lokalisierte Plasmonoszillationen in metallischen Nanokugeln.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
11 Resonatoroptik
• Den Gütefaktor 𝑄, der proportional zur Speicherzeit in Einheiten der optischen Periode ist; ein großes 𝑄 zeigt einen starken zeitlichen Einschluss an; • Das Modenvolumen 𝑉, das das durch die eingegrenzte optische Mode eingenommene Volumen angibt; diese Größe ist vor allem für Mikroresonatoren interessant, in denen ein kleiner Wert von 𝑉 einen starken räumlichen Einschluss anzeigt. Diese Parameter beschreiben das Ausmaß der räumlichen und zeitlichen Lichteingrenzung im Resonator. Eine Verbesserung der räumlichen Eingrenzung wurde durch die Entwicklung von Mikroresonatoren mit verschiedenen Geometrien erreicht, während eine Verbesserung der zeitlichen Eingrenzung mithilfe verlustarmer Materialien und Anordnungen mit verringerter Leckage möglich ist. Wegen ihrer Frequenzselektivität dienen optische Resonatoren als optische Filter oder Spektralanalysatoren, wie in Abschnitt 7.1.2 diskutiert wird. Ihre wichtigster Anwendung ist jedoch die als „Behälter“, in dem Laserlicht erzeugt und verstärkt werden kann. Ein La-
Dielektrikum m
Metall
Kugelspiegel Mikrowellen
mm integriert-optische Schleife
Elektronik
Mikrotorus µm
Mikrokugel
λ
MetallNanokugel
a=
men und geben Strukturen wie dem Mikrosäulenresonator die nötigen Rückkopplungselemente. Dielektrische Resonatoren nutzen die Totalreflexion anstelle der konventionellen Reflexion an der Grenzfläche zwischen verlustarmen dielektrischen Medien. In Mikrodisks, Mikrotoroiden und Mikrokugeln zirkuliert Licht durch Reflexionen im Bereich des streifenden Einfalls; die zugehörigen Moden werden auch als Flüstergaleriemoden (engl. whispering gallery modes) bezeichnet. Die eingegrenzten Strahlen verlaufen dabei unter Einfallswinkeln, die stets größer sind als der kritische Winkel, sodass sie nicht aus dem Resonator gebrochen werden können, um die innere Begrenzung des Resonators. Plasmonresonatoren sind metallische Strukturen mit Abmessungen im Subwellenlängenbereich, beispielsweise Nanodisks oder Nanokugeln, an denen Oberflächenplasmonpolaritonen (OPP-Wellen) und lokalisierte Oberflächen-Plasmonoszillationen auftreten können. Die Größe eines optischen Resonators kann genau wie bei Mikroresonatoren in der Größenordnung seiner Resonanzwellenlänge liegen. Sie kann die Resonanzwellenlänge aber auch um Größenordnungen übersteigen wie bei Spiegelresonatoren oder um Größenordnungen darunter liegen wie im Fall von metallischen Nanokugeln. Abbildung 11.2 zeigt die Beziehung zwischen Resonatorgröße und Resonanzwellenlänge für eine Reihe von elektromagnetischen Resonatoren. Optische Resonatoren werden häufig durch zwei Schlüsselparameter charakterisiert:
Resonatorlänge a
322
nm nm
µm mm Resonanzwellenlänge λ0
m
Abb. 11.2 Resonatorgröße a und Resonanzwellenlänge 𝜆0 für eine Reihe von dielektrischen und metallischen elektromagnetischen Resonatoren. Das Verhältnis von Größe zu Resonanzwellenlänge lässt sich in drei Bereiche unterteilen: a∕𝜆0 > 1 (nicht schattierte Region), a∕𝜆0 ≈ 1 (gestrichelte Diagonale) oder a∕𝜆0 < 1 (schattierter Bereich). Metallische Nanokugeln und elektronische Resonatoren liegen weit im schattierten Bereich.
ser besteht aus einem Medium (Abschnitt 16.1.1), welches das Licht innerhalb eines optischen Resonators verstärkt; der Resonator bestimmt, jedenfalls zum Teil, die Frequenz und räumliche Verteilung des erzeugten Laserstrahls. Weil Resonatoren Energie speichern können, können sie auch verwendet werden, um Pulse von Laserenergie zu erzeugen (Abschnitt 16.4.1). Laser werden in den Kapiteln 16 und 18 besprochen; das Material in diesem Kapitel ist für ihr Verständnis notwendig.
In diesem Kapitel . . . Mehrere in den vorherigen Kapiteln entwickelte theoretische Ansätze sind nützlich, um die Funktion von optischen Resonatoren zu beschreiben: • Der einfachste Ansatz beruht auf der Strahlenoptik (Kapitel 1). Hierbei verfolgt man optische Strahlen, während sie wiederholt innerhalb des Resonators reflektiert werden, und stellt geometrische Bedingungen auf, die sicherstellen, dass die Strahlen eingegrenzt sind. • Die Wellenoptik (Kapitel 2) wird verwendet, um die Moden des Resonators zu bestimmen, d. h. die Resonanzfrequenzen und Wellenfunktionen der opti-
11.1 Resonatoren aus ebenen Spiegeln
schen Wellen, die erlaubt sind und selbstkonsistent innerhalb des Resonators existieren können. • Die Strahlenoptik (Kapitel 3) ist nützlich, um das Verhalten von Kugelspiegelresonatoren zu verstehen; die Moden eines Resonators aus Kugelspiegeln sind optische Gauß- und Laguerre-GaußBündel. • Die Fourieroptik und die Theorie der Lichtausbreitung und -beugung (Kapitel 4) bestimmen, wie die endlichen Abmessungen der Resonatorspiegel den Resonatorverlust und die räumlichen Eigenschaften der Moden beeinflussen. • Die elektromagnetische Optik (Kapitel 5) erklärt die Streuung, die für das Verständnis der resonanten Rückkopplung in kohärenten Lasern von grundlegender Bedeutung ist. • Die Polarisationsoptik (Kapitel 6) beschreibt die Fresnelbeziehungen, die die Reflexionsgrade an den Grenzflächen zwischen Halbleitern und Luft in Fabry-Pérot-Resonatoren bestimmen. • Die Optik photonischer Kristalle und die Optik von Schichtmedien (Kapitel 7) sind für optische Resonatoren wichtig, die aus mehreren dielektrischen Schichten und periodischen Medien (z. B. verteilten Braggreflektoren und photonischen Kristallen) anstelle von Spiegeln bestehen. • Die in der Optik von Metallen und Metamaterialien (Kapitel 8) eingeführte Analyse von oszillierenden elektrischen Ladungen (lokalisierten Oberflächenplasmonen) in Metallen ist für das Verständnis des Verhaltens von Nanoresonatoren wie z. B. metallischen Nanokugeln von entscheidender Bedeutung. • Die Analyse von Resonatormoden ähnelt der in der Wellenleiteroptik (Kapitel 9) zur Bestimmung der Moden von dielektrischen und Spiegelwellenleitern verwendeten Methode. • Die Faseroptik (Kapitel 10) analysiert die Moden, die in optischen Fasern existieren können. Der Resonator eines Faserlasers ist eine optische Faser, die an den Enden von Reflektoren begrenzt ist, die zu einer wiederholten Reflexion und somit zum Einschluss des sich ausbreitenden Lichts führen. Wie man sieht, bietet der optische Resonator uns eine ausgezeichnete Gelegenheit, die verschiedenen in früheren Kapiteln vorgestellten Theorien anzuwenden. Wir beginnen in Abschnitt 11.1 mit einer Analyse von Resonatoren aus ebenen Spiegeln, und in Abschnitt 11.2 mit der Untersuchung von Ku-
gelspiegelresonatoren. In Abschnitt 11.3 führen wir dann zwei- und dreidimensionale Resonatoren ein, bevor wir in Abschnitt 11.4 Mikroresonatoren betrachten.
11.1 Resonatoren aus ebenen Spiegeln 11.1.1 Resonatormoden In diesem Abschnitt untersuchen wir die Moden eines optischen Resonators, der aus zwei parallelen, hochreflektierenden, ebenen Spiegeln in einem Abstand d voneinander besteht (Abb. 11.3). Dieser einfache eindimensionale Resonator ist als Fabry-Pérot-Resonator bekannt. Wir betrachten zuerst eine idealisierte Version, in der die Spiegel verlustfrei sind; den Einfluss von Verlusten untersuchen wir im Anschluss.
(a)
(b)
Abb. 11.3 Resonator aus zwei ebenen Spiegeln (FabryPérot-Resonator). (a) Lichtstrahlen senkrecht zu den Spiegeln werden hin und her reflektiert, ohne entkommen zu können. (b) Strahlen, die auch nur geringfügig von der Senkrechten abweichen, können schließlich entweichen. Die Strahlen entkommen auch, wenn die Spiegel nicht vollkommen parallel sind.
Resonatormoden als stehende Wellen
Wie in den Abschnitten 2.2, 5.3 und 5.4 besprochen hat eine monochromatische Welle der Frequenz 𝜈 eine Wellenfunktion der Form 𝑢(r, 𝑡) = Re {𝑈(r) exp(i2π 𝜈𝑡)} ,
(11.1)
die eine transversale Komponente des elektrischen Feldes beschreibt. Die komplexe Amplitude 𝑈(r) erfüllt die Helmholtzgleichung ∇2 𝑈(r) + 𝑘2 𝑈(r) = 0, wobei 𝑘 = 2π 𝜈∕𝑐 die Wellenzahl und 𝑐 die Lichtgeschwindigkeit im Medium sind. Die Resonatormoden sind die Lösungen der Helmholtzgleichung mit den geeigneten Randbedingungen. Für einen Resonator aus verlustfreien ebenen Spiegeln verschwinden die transversalen Komponenten des elektrischen Feldes an den Spiegeloberflächen (siehe Abschnitt 5.1), sodass in den Ebenen 𝑧 = 0 und 𝑧 = d in Abb. 11.4 𝑈(r) = 0 gilt. Die stehende Welle 𝑈(r) = 𝐴 sin 𝑘𝑧 mit einer Konstante 𝐴 erfüllt die Helmholtzgleichung und verschwindet bei 𝑧 = 0 und 𝑧 = d , sofern 𝑘 die Bedingung 𝑘d = 𝑞π erfüllt, wobei 𝑞 eine ganze Zahl ist. Das schränkt 𝑘 auf die
323
324
11 Resonatoroptik
λ
Resonatormoden als Wanderwellen z
z=0
z=
λ/2
Abb. 11.4 (a) Komplexe Amplitude einer Mode eines idealen Resonator aus ebenen Spiegeln. Da die Länge des Resonators in dieser Abbildung 14 Halbwellenlängen entspricht, ist der Modenindex q = d∕(𝜆∕2) = 14. (b) Intensitätsverteilung.
Werte 𝑘𝑞 = 𝑞
π d
,
𝑞 = 1, 2, … ,
(11.2)
ein, sodass die Moden die komplexen Amplituden 𝑈(r) = 𝐴𝑞 sin 𝑘𝑞 𝑧
(11.3)
haben, wobei die 𝐴𝑞 Konstanten sind. Negative Werte von 𝑞 beschreiben keine unabhängigen Moden, da sin 𝑘−𝑞 𝑧 = − sin 𝑘𝑞 𝑧 ist. Außerdem gehört der Wert 𝑞 = 0 zu einer Mode, die keine Energie trägt, da 𝑘0 = 0 und sin 𝑘0 𝑧 = 0 ist. Die Moden des Resonators sind daher die stehenden Wellen 𝐴𝑞 sin 𝑘𝑞 𝑧, wobei die positive Zahl 𝑞 = 1, 2, … der Modenindex ist. Eine beliebige Welle innerhalb des Resonators kann als Superposition der Resonatormoden geschrieben werden: ∑ 𝑈(r) = 𝐴𝑞 sin 𝑘𝑞 𝑧 . (11.4) 𝑞
Aus Gl. (11.2) folgt, dass die zugehörige Frequenz 𝜈 = 𝑐𝑘∕2π auf die diskreten Werte 𝜈𝑞 = 𝑞
𝑐 , 2d
𝑞 = 1, 2, …
(11.5)
beschränkt ist, die Resonanzfrequenzen des Resonators. Wie in Abb. 11.5 illustriert, ist der Frequenzunterschied zwischen benachbarten Resonanzfrequenzen konstant; er wird als freier Spektralbereich bezeichnet: 𝜈F =
𝑐 . 2d
(11.6)
Die zugehörigen Resonanzwellenlängen sind 𝜆𝑞 = 𝑐∕𝜈𝑞 = 2d ∕𝑞. Die bei Resonanz zurückgelegte Entfernung für einen vollständigen Umlauf muss daher gleich einer ganzen Zahl von Wellenlängen sein: 2d = 𝑞𝜆𝑞 ,
𝑞 = 1, 2, …
(11.7)
Dabei bezeichnet 𝜆𝑞 die Wellenlängen im Medium zwischen den beiden Spiegeln.
Alternativ können die Resonatormoden auch bestimmt werden, indem man einer Welle folgt, während sie zwischen den beiden Spiegeln hin und her reflektiert wird [Abb. 11.6(a)]. Eine Mode ist eine Welle, die sich nach einem Umlauf wieder selbst reproduziert (siehe Anhang C). Die Phasenverschiebung 𝜑 = 𝑘2d = 4π𝜈d ∕𝑐, die sie auf einem solchen Umlauf durch den Resonator (über eine Entfernung 2d ) erfährt, muss daher ein Vielfaches von 2π sein: 𝜑 = 𝑘2d = 𝑞2π ,
𝑞 = 1, 2, … .
(11.8)
Dieses Ergebnis wird durch die zusätzliche Phasenverschiebung von 2π nicht verändert, die durch die Reflexionen an den beiden Spiegeln hervorgerufen wird (siehe Abschnitt 6.2). Wie erwartet erhalten wir daher 𝑘d = 𝑞π wie in Gl. (11.2) und dieselben Resonanzfrequenzen wie in Gl. (11.5). Gleichung (11.8) kann als Bedingung für positive Rückkopplung in dem in Abb. 11.6(b) dargestellten System aufgefasst werden; dazu muss der Ausgang des Systems phasengleich mit der Eingabe in das System zurückgegeben werden. Wir zeigen nun, dass nur selbstreproduzierende Wellen oder Kombinationen davon als stationärer Zustand innerhalb des Resonators existieren können. Dazu betrachten wir eine monochromatische ebene Welle mit der komplexen Amplitude 𝑈0 am Punkt 𝑃, die sich nach rechts entlang der Achse des Resonators ausbreitet [siehe Abb. 11.6(a)]. Die Welle wird an Spiegel 2 reflektiert und läuft zurück zu Spiegel 1, wo sie wieder reflektiert wird. Ihre Amplitude bei 𝑃 ist jetzt 𝑈1 . Ein weiterer Umlauf liefert eine Welle der komplexen Amplitude 𝑈2 usw. Weil die ursprüngliche Welle 𝑈0 monochromatisch ist, ist ihre Lebensdauer unendlich. Dasselbe gilt für alle Partialwellen 𝑈0 , 𝑈1 , 𝑈2 , … auch – sie sind monochromatisch und koexistieren für alle Zeiten. Außerdem sind ihre Beträge identisch, weil wir angenommen hatten, dass es bei Reflexion und Ausbreitung keine Verluste geben soll. Die Gesamtwelle 𝑈 ergibt sich daher als Summe einer unendlichen Zahl von Zeigern desselben Betrags, 𝑈 = 𝑈0 + 𝑈1 + 𝑈2 + ⋯ ,
(11.9)
wie in Abb. 11.6(b) und (c) dargestellt. Die Phasendifferenz zweier aufeinander folgender Zeiger nach einem einzigen Umlauf ist 𝜑 = 𝑘2d . Wenn der Betrag des anfänglichen Zeigers infinitesimal ist, müssen die Beträge der folgenden Zeiger ebenfalls infinitesimal sein. Der Betrag der Summe dieser unendlich vielen infinitesimalen Zeiger ist selbst infinitesimal, außer wenn sie ausgerichtet sind, d. h. wenn 𝜑 = 𝑞2π ist
11.1 Resonatoren aus ebenen Spiegeln
νF = c 2
(a) ν
νq νq+1
0
νF = c 2
(b) ν1 ν2 Resonanzfrequenzen
0
Resonator
Abb. 11.5 Benachbarte Resonanzfrequenzen eines Resonators aus ebenen Spiegeln unterscheiden sich um 𝜈F = c∕2d = c0 ∕2nd, wie zwei Beispiele zeigen: (a) Ein 30 cm langer Resonator (d = 30 cm) mit Luft zwischen den Spiegeln (n = 1) hat einen Frequenzabstand zwischen den Moden von 𝜈F = 500 MHz. (b) Ein viel kürzerer Resonator mit d = 3 μ m Spiegel 1
ν3
ν
hat einen Frequenzabstand 𝜈F = 50 THz, sodass die erste Mode eine Frequenz entsprechend einer Wellenlänge von 6 μ m hat und es nur zwei Moden innerhalb des optischen Bands von 700–900 nm gibt, das sich über einen Frequenzbereich von 95 THz erstreckt.
φ
Spiegel 2
U0 Ue –iφ
U3
U1
U2 U1 P
U0
+
U
U2
e –iφ φ ≠ q2π
U0
U0
U2
U1
...
φ = q2π
(a)
(b)
(c)
Abb. 11.6 (a) Eine Welle wird zwischen den Resonatorspiegeln hin und her reflektiert und erfährt bei jedem Umlauf eine Phasenverschiebung 𝜑. (b) Blockdiagramm eines Systems mit optischer Rückkopplung mit einer Phasenverzögerung 𝜑. (c) Zeigerdiagramm für die Summe U = U0 + U1 + ⋯ für 𝜑 ≠ q2π und 𝜑 = q2π.
wie in Abb. 11.6(c) unten. Eine infinitesimale anfängliche Welle kann daher zum Aufbau einer endlichen Leistung im Resonator führen, aber nur für 𝜑 = 𝑞2π. Wanderfeldresonatoren
In einem Wanderfeldresonator breitet sich eine optische Mode auf einem geschlossenen Pfad, der einem vollständigen Umlauf entspricht, in einer Richtung aus und reproduziert sich, ohne ihre Richtung umzukehren. Beispiele hierfür sind der Ringresonator und der Bow-Tie-Resonator („Frackfliegen“resonator), die in Abb. 11.7 gezeigt sind. Die Resonanzfrequenzen der Moden erhalten wir, indem wir die Phasenverschiebung für einen kompletten Umlauf gleich 2π setzen. Zu jeder Mode, die sich im Uhrzeigersinn ausbreitet, gehört eine entsprechende Mode derselben Resonanzfrequenz, die sich gegen den Uhrzeigersinn ausbreitet; man bezeichnet diese zusammengehörigen Moden als entartet.
2 (a) Ringresonator
(b) Bow-Tie-Resonator
Abb. 11.7 Wanderfeldresonatoren. (a) Dreispiegel-Ringresonator. (b) Vierspiegel-Bow-Tie-Resonator.
Übung 11-1: Resonanzfrequenzen eines Wanderfeldresonators
Leiten Sie Ausdrücke für die Resonanzfrequenzen 𝜈𝑞 und den Frequenzabstand 𝜈F der Moden für den in Abb. 11.7 gezeigten Dreispiegel-Ringresonator und den Vierspiegel-Bow-Tie-Resonator her. Nehmen Sie an, dass jede Reflexion an einem Spiegel eine Phasenverschiebung von π einführt.
325
326
11 Resonatoroptik
gegeben, was als
Modendichte
Die Zahl der Moden pro Einheitsfrequenz ist der Kehrwert des Frequenzabstands zwischen den Moden, d. h. 1∕𝜈F = 2d ∕𝑐 für jede der beiden orthogonalen Polarisationen. Die Modendichte M(𝜈) gibt die Zahl der Moden pro Frequenz- und Längeneinheit des Resonators an; sie ist folglich 4 . (11.10) 𝑐 Die Zahl der Moden in einem Resonator der Länge d im Frequenzintervall Δ𝜈 ist somit (4∕𝑐)d Δ𝜈. Dieser Wert ist ein Maß für die Zahl der Freiheitsgrade der optischen Wellen, die im Resonator existieren können, d. h. für die Zahl unabhängiger Arten, diese Wellen anzuordnen. M(𝜈) =
Verluste und spektrale Breite der Resonanz
Die strenge Bedingung für die Frequenzen von optischen Wellen, die in einem Resonator existieren können, wird gelockert, wenn Resonatorverluste auftreten. Wir betrachten wieder Abb. 11.6(a) und folgen der anfänglichen Welle 𝑈0 im Resonator auf ihrem Weg zwischen den beiden Spiegeln. Wie zuvor besprochen ist das Ergebnis die in Abb. 11.6(c) dargestellte unendliche Summe von Zeigern, und die Phasendifferenz bei einem Umlauf ist 𝜑 = 2𝑘d = 4π𝜈d ∕𝑐 .
(11.11)
Die Reflexion an den beiden Spiegeln kann eine zusätzliche Phasenverschiebung verursachen, normalerweise 2π. In Anwesenheit von Resonatorverlusten haben die Zeiger jedoch nicht dieselben Beträge. Zwei aufeinander folgende Zeiger sind dann durch einen komplexen Amplitudendämpfungsfaktor ℎ = |r|e−i𝜑 für einen Umlauf verknüpft, der aus den mit den beiden Reflexionen verbundenen Verlusten und der Absorption im Medium resultiert (der entsprechende Intensitätsdämpfungsfaktor für einen Umlauf ist |r|2 mit |r| < 1). Folglich ist 𝑈1 = ℎ𝑈0 , und 𝑈2 hängt über denselben komplexen Faktor mit 𝑈1 zusammen; dasselbe gilt für alle Paare von sukzessiven Zeigern. Das Ergebnis ist die Superposition einer unendlichen Zahl von Wellen, von denen jede sich von der vorhergehenden durch eine konstante Phasenverschiebung und eine geometrisch reduzierte Amplitude unterscheidet. Man sieht leicht, dass 𝑈 = 𝑈0 + 𝑈1 + 𝑈2 + ⋯ = 𝑈0 + ℎ𝑈0 + ℎ2 𝑈0 + ⋯ = 𝑈0 (1 + ℎ + ℎ2 + ⋯) = 𝑈0 ∕(1 − ℎ) ist. Das Endergebnis 𝑈 = 𝑈0 ∕(1 − ℎ) kann anhand des in Abb. 11.6(b) dargestellten einfachen rückgekoppelten Systems verstanden werden. Die Intensität des Lichts im Resonator ist daher durch |𝑈0 |2 𝐼0 = (11.12) 𝐼 = |𝑈|2 = ||1 − |r|e−i𝜑 ||2 1 + |r|2 − 2|r| cos 𝜑 | |
𝐼=
𝐼max 2
2
1 + (2ℱ∕π) sin (𝜑∕2)
mit 𝐼max =
𝐼0 2
(1 − |r|) (11.13)
geschrieben werden kann. Hier ist 𝐼0 = |𝑈0 |2 die Intensität der anfänglichen Welle und ℱ=
√ π |r| 1 − |r|
(11.14)
ist die Finesse des Resonators. Die Größe |r| beschreibt wieder den Dämpfungsfaktor für einen kompletten Umlauf im Resonator. Die hier gegebene Behandlung ist fast dieselbe wie die früher in Abschnitt 2.5.2 durchgeführte, wobei dort der komplexe Amplitudendämpfungsfaktor für einen Umlauf gleich ℎ = |ℎ|e+i𝜑 gewählt wurde. Hier wählen wir stattdessen ℎ = |r|e−i𝑘2d = |r|e−i𝜑 , da aufeinander folgende Zeiger aus der Verzögerung der Welle bei ihren Reflexionen zwischen den Spiegeln entstehen. Diese Unterscheidung ist jedoch nur äußerlich und hat keinen Einfluss auf die Ergebnisse. Tatsächlich ist Gl. (11.13) mit Gl. (2.63) identisch, die in Abb. 2.31(b) aufgetragen ist. Die Intensität 𝐼(𝜑) ist eine periodische Funktion von 𝜑 mit der Periode 2π. Für große ℱ hat 𝐼(𝜑) scharfe Peaks bei 𝜑 = 𝑞2π, die einer parallelen Ausrichtung aller Zeiger entsprechen. Die Peaks haben in Übereinstimmung mit Gl. (2.65) eine Halbwertsbreite Δ𝜑 ≈ 2π∕ℱ. Die Intensität 𝐼(𝜑) im Inneren des Resonators gemäß Gl. (11.13) kann wegen Gl. (11.11), nach der 𝜑 = 4π𝜈d ∕𝑐 ist, auch als Funktion 𝐼(𝜈) der optischen Frequenz einer monochromatischen Welle ausgedrückt werden. Die Funktion nimmt dann die Form 𝐼=
𝐼max 2
2
1 + (2ℱ∕π) sin (π𝜈∕𝜈F )
,
𝐼max =
𝐼0 2
(1 − |r|) (11.15)
mit 𝜈F = 𝑐∕2d an. Dieses Ergebnis ist in Abb. 11.8 gezeigt; es entspricht in der Tat dem in den Abb. 2.31 und 7.6 gezeigten. Die maximale interne Intensität 𝐼 = 𝐼max wird erreicht, wenn der zweite Term im Nenner null wird, d. h. bei den Resonanzfrequenzen 𝜈 = 𝜈𝑞 = 𝑞𝜈F ,
𝑞 = 1, 2, … .
(11.16)
Die minimale Intensität wird in der Mitte zwischen den Resonanzen erreicht; der Minimalwert ist 𝐼min =
𝐼max . 1 + (2ℱ∕π)2
(11.17)
11.1 Resonatoren aus ebenen Spiegeln
I
Lichts die Spiegel umgehen und verlorengehen. Dieser letzte Effekt verändert auch die räumliche Verteilung der reflektierten Welle und beschränkt sie auf die Größe der Spiegel. Das reflektierte Licht erzeugt ein Beugungsbild am entgegengesetzten Spiegel, das erneut beschnitten wird. Dieser Beugungsverlust kann als effektive Verminderung des Spiegelreflexionsgrads betrachtet werden. Weitere Details zu Beugungsverlusten werden in Abschnitt 11.2.5 diskutiert.
νF = c 2
(a)
ν
I νF
(b) νq–1
νq
νq+1
ν
Abb. 11.8 (a) Im stationären Zustand sind in einem verlustfreien Resonator (ℱ = ∞) nur Lichtwellen mit den exakten Resonanzfrequenzen 𝜈q erlaubt. (b) In einem verlustbehafteten Resonator sind auch Wellen in der Umgebung der Resonanzfrequenzen erlaubt.
Wenn die Finesse groß ist (ℱ ≫ 1), ist besteht die spektrale Antwort des Resonators offensichtlich aus scharfen Peaks bei den Resonanzfrequenzen und 𝐼min ∕𝐼max ist klein. In diesem Fall ist die Halbwertsbreite der Resonanzpeaks δ𝜈 ≈ 𝜈F ∕ℱ, da δ𝜈 = (𝑐∕4πd )Δ𝜑 und nach Gl. (2.65) Δ𝜑 ≈ 2π∕ℱ ist. Dieses einfache Ergebnis liefert die Rechtfertigung für die in Gl. (11.14) angegebene Definition der Finesse. Zusammengefasst wird die spektrale Antwort des optischen Fabry-Pérot-Resonators durch zwei Parameter charakterisiert: • Den Frequenzabstand 𝜈F zwischen benachbarten Resonatormoden: 𝑐 𝜈F = . 2d
(11.18)
• Die spektrale Breite δ𝜈 der einzelnen Resonatormoden: δ𝜈 ≈
𝜈F . ℱ
(11.19)
Gleichung (11.19) gilt in dem üblichen Fall ℱ ≫ 1. Die spektrale Breite δ𝜈 ist umgekehrt proportional zur Finesse ℱ. Wenn der Verlust zunimmt, nimmt ℱ ab und δ𝜈 daher zu. Die Ursachen von Resonatorverlusten
Die zwei Hauptursachen für Verluste in optischen Resonatoren sind: Verluste durch unvollkommene Reflexion an den Spiegeln.
Es gibt zwei Ursachen für reduzierte Reflexion: Erstens wird in Resonatoren oft bewusst ein teildurchlässiger Spiegel verwendet, um dem im Resonator erzeugten Laserlicht zu ermöglichen, aus dem Resonator auszutreten, und zweitens kann wegen der endlichen Größe der Spiegel immer ein kleiner Teil des
Verluste aufgrund von Absorption und Streuung im Medium zwischen den Spiegeln. Der mit diesen Effek-
ten verbundene Leistungsdämpfungsfaktor für einen Umlauf durch das Medium ist exp(−2𝛼S d ), wobei 𝛼S der Verlustkoeffizient des Mediums aufgrund von Absorption und Streuung ist. Für Spiegel mit den Reflexionsgraden ℛ1 = |r1 |2 und ℛ2 = |r2 |2 nimmt die Wellenintensität infolge der beiden Reflexionen bei einem Umlauf um den Faktor ℛ1ℛ2 ab. Diese werden „lokalisierte Verluste“ genannt, da sie nur lokal an den Spiegeln auftreten. Wenn auch die „verteilten Verluste“ berücksichtigt werden, die innerhalb des Mediums stattfinden, ergibt sich für einen Umlauf ein Intensitätsdämpfungsfaktor |r|2 = ℛ1 ℛ2 exp(−2𝛼S d ) ,
(11.20)
der gewöhnlich in der Form |r|2 = exp(−2𝛼R d )
(11.21)
geschrieben wird, wobei 𝛼R ein effektiver Koeffizient der gesamten verteilten Verluste ist. Durch Gleichsetzen der Gln. (11.20) und (11.21) und Bilden des natürlichen Logarithmus auf beiden Seiten können wir 𝛼R durch die Parameter 𝛼S bzw. ℛ1 ℛ2 der verteilten und lokalisierten Verluste ausdrücken, 𝛼R = 𝛼S +
1 1 ln . 2d ℛ1 ℛ2
(11.22)
Das können wir auch als 𝛼R = 𝛼S + 𝛼Sp1 + 𝛼Sp2
(11.23)
schreiben, wobei die Größen 𝛼Sp1 =
1 1 ln 2d ℛ1
und 𝛼Sp2 =
1 1 ln 2d ℛ2
(11.24)
die effektiven Koeffizienten der verteilten Verluste an den Spiegeln 1 und 2 sind. Diese Verlustkoeffizienten können für Spiegel mit hohem Reflexionsgrad in einer einfacheren Form angegeben werden. Wenn ℛ1 ≈ 1 ist, dann gilt ln(1∕ℛ1 ) =
327
11 Resonatoroptik 2
0.95
0.9
= exp(–2αR ) 0.8 0.5
Verluste vernachlässigbar sind. Ist die Näherung, die wir bei der Herleitung von Gl. (11.28) verwendet hatten, in diesem Fall zulässig?
0.1
300
Photonenlebensdauer 200 Finesse
328
Die Beziehung zwischen der Linienbreite der Resonanzen und dem Resonatorverlust kann als Manifestation der Unbestimmtheitsrelation zwischen Zeit und Frequenz aufgefasst werden, wie wir im Folgenden demonstrieren werden. Dazu setzen wir die Gln. (11.18) und (11.28) in Gl. (11.19) ein; das ergibt
100
0 0.01
0.1 Verlustfaktor αR
1
δ𝜈 ≈
Abb. 11.9 Finesse eines optischen Resonators als Funktion des Verlustfaktors 𝛼R d , wobei 𝛼R der effektive Koeffizient des gesamten verteilten Verlusts ist. Der Intensitätsdämpfungsfaktor für einen Umlauf im Resonator ist |r|2 = exp(−2𝛼R d ).
− ln(ℛ1 ) = − ln[1 − (1 − ℛ1 )] ≈ 1 − ℛ1 , wobei wir die Taylorentwicklung ln(1 − 𝛥) ≈ −𝛥 verwendet haben, die für |𝛥| ≪ 1 zulässig ist. Das erlaubt uns, 𝛼Sp1 ≈
1 − ℛ1 2d
(11.25)
zu schreiben. Ähnlich gilt für ℛ2 ≈ 1 auch 𝛼Sp2 ≈ (1 − ℛ2 )∕2d . Wenn außerdem ℛ1 = ℛ2 = ℛ ≈ 1 ist, dann folgt 𝛼R ≈ 𝛼S +
1−ℛ d
.
(11.26)
Die Finesse ℱ kann als Funktion des effektiven Verlustkoeffizienten 𝛼R ausgedrückt werden, indem man Gl. (11.21) in Gl. (11.14) einsetzt. Das Ergebnis ist ℱ=
π exp(−𝛼R d ∕2) ; 1 − exp(−𝛼R d )
π . 𝛼R d
(11.29)
Weil 𝛼R der Verlust pro Längeneinheit ist, bezeichnet 𝑐𝛼R den Verlust pro Zeiteinheit. Wir definieren die charakteristische Zerfallszeit 1 𝜏P = (11.30) 𝑐𝛼R als Resonatorlebensdauer oder Photonenlebensdauer und erhalten so 1 δ𝜈 = . (11.31) 2π 𝜏P Das Unbestimmtheitsprodukt zwischen Zeit und Frequenz ist daher δ𝜈𝜏P = 1∕2π. Man kann die Verbreiterung der Resonanzlinien daher als Folge des Abklingens der optischen Energie aufgrund von Resonatorverlusten auffassen. Ein elektrisches Feld, das wie exp(−𝑡∕2𝜏P ) abklingt, entspricht einer Energie, die wie exp(−𝑡∕𝜏P ) abklingt, und besitzt eine Fouriertransformierte, die proportional zu 1∕(1 + i4π𝜈𝜏P ) ist und eine spektrale Halbwertsbreite δ𝜈 = 1∕2π𝜏P hat. Der Gütefaktor Q
(11.27)
diese Beziehung ist in Abb. 11.9 aufgetragen. Offensichtlich nimmt die Finesse ab, wenn die Verluste zunehmen. Wenn für den Verlustfaktor 𝛼R d ≪ 1 gilt, dann ist exp(−𝛼R d ) ≈ 1 − 𝛼R d und folglich ℱ≈
𝑐∕2d 𝑐𝛼R . = 2π π∕𝛼R d
(11.28)
Das zeigt, dass die Finesse in diesem Grenzfall umgekehrt proportional zu dem Verlustfaktor 𝛼R d ist. Übung 11-2: Resonatormoden und spektrale Breite
Bestimmen Sie den Frequenzabstand und die spektrale Breite der Moden eines Fabry-Pérot-Resonators, dessen Spiegel Reflexionsgrade von 0.98 und 0.99 und einen Abstand d = 100 cm haben. Nehmen Sie an, dass das Medium den Brechungsindex 𝑛 = 1 besitzt und
Der Gütefaktor 𝑄 wird häufig verwendet, um resonante elektrische Schaltungen und Mikrowellenresonatoren zu charakterisieren. Er ist definiert als 𝑄 = 2π
gespeicherte Energie . Energieverlust pro Umlauf
(11.32)
Ein großer Wert von 𝑄 ist ein Zeichen für einen verlustarmen Resonator. Eine 𝑅𝐿𝐶-Reihenschaltung hat die √ Resonanzfrequenz 𝜈0 ≈ 1∕2π 𝐿𝐶 und den Gütefaktor 𝑄 = 2π 𝜈0 𝐿∕𝑅, wobei 𝑅, 𝐿, und 𝐶 der Widerstand, die Induktivität und die Kapazität des Schwingkreises sind. Der Gütefaktor eines optischen Resonators wird mithilfe der Überlegung bestimmt, dass die gespeicherte Energie mit einer Geschwindigkeit 𝑐𝛼R verlorengeht (pro Zeiteinheit), die äquivalent zur Geschwindigkeit 𝑐𝛼R ∕𝜈0 (pro Periode des optischen Feldes) ist, sodass 𝑄=
2π 𝜈0 . 𝑐𝛼R
(11.33)
11.1 Resonatoren aus ebenen Spiegeln
Da δ𝜈 ≈ 𝑐𝛼R ∕2π ist, folgt daraus 𝑄=
11.1.2 Schief einfallende Resonatormoden
𝜈0 . δ𝜈
(11.34)
Aufgrund von Gl. (11.33) hängt der Gütefaktor über 𝑄 = 2π 𝜈0 𝜏P
(11.35)
mit der Resonatorlebensdauer (Photonenlebensdauer) 𝜏P = 1∕𝑐𝛼R zusammen. Schließlich kombinieren wir die Gln. (11.19) und (11.34) zu einer Beziehung zwischen 𝑄 und der Finesse ℱ des Resonators: 𝜈0 (11.36) 𝑄= ℱ. 𝜈F Da die Frequenzen 𝜈0 von optischen Resonatoren normalerweise viel größer sind als der Modenabstand 𝜈F , ist 𝑄 ≫ ℱ. Außerdem ist der Gütefaktor eines optischen Resonators in der Regel viel größer als der eines Resonators bei Mikrowellenfrequenzen. Zusammenfassung
• Die Verluste eines optischen Resonators werden zweckmäßig durch zwei Parameter charakterisiert: den Verlustkoeffizienten 𝛼R (in cm−1 ) und die Photonenlebensdauer 𝜏P = 1∕𝑐𝛼R . • Die Qualität eines bei der Frequenz 𝜈0 betriebenen optischen Resonators der Länge d kann durch zwei dimensionslose Parameter charakterisiert werden: die Finesse ℱ ≈ π∕𝛼R d und den Gütefaktor 𝑄 = 2π 𝜈0 𝜏P . • Die spektralen Eigenschaften eines optischen Resonators werden durch zwei Frequenzen beschrieben: den Frequenzabstand 𝜈F = 𝑐∕2d zwischen den Moden, der als freier Spektralbereich bezeichnet wird, und die spektrale Breite δ𝜈 = 𝜈F ∕ℱ.
x
θ
𝑞 = 1, 2, …
(11.37)
geschrieben werden, wobei 𝜈F = 𝑐∕2d ist. Diese Beziehung, die in Abb. 11.10(b) aufgetragen ist, ist äquivalent zu der Selbstkonsistenzbedingung für geführte Moden in Wellenleitern aus ebenen Spiegeln (siehe Abschnitt 9.1). Außerdem ist sie auch identisch mit der Bedingung für die maximale Transmission einer schiefen Welle durch ein Fabry-Pérot-Etalon gemäß Gl. (7.39). Wie Abb. 11.10(c) zeigt, gibt es bei einer gegebenen Frequenz 𝜈 Moden bei diskreten Winkeln 𝜃𝑞 , die die Bedingung cos 𝜃𝑞 = 𝑞𝜈F ∕𝜈 erfüllen. Das sind die Komplemente der Reflexionswinkel der geführten Moden eines Wellenleiters. Für einen festen Winkel 𝜃 sind die Frequenzen der Moden 𝜈𝑞 = 𝑞𝜈F ∕ cos 𝜃, wie Abb. 11.10(d) zeigt. Je größer der Neigungswinkel ist, desto größer wird der Abstand zwischen den Frequenzen der Moden.
80°
q=1
60°
θ2 θ1
2
50°
θ
𝜈 = 𝑞 𝜈F sec 𝜃 ,
90° 70°
z
In einem optischen Resonator mit vollkommen parallelen, unendlich großen ebenen Spiegeln können auch schief einfallende Moden existieren. Eine ebene Welle, die sich in einem Winkel 𝜃 zur Achse des Resonators (der 𝑧-Richtung) ausbreitet, wird zwischen den Spiegeln als geführte Welle hin und her reflektiert [siehe Abb. 11.10(a)], die sich in transversaler Richtung (𝑥-Richtung) ausbreitet. Solche geführten Wellen wurden in Abschnitt 9.1 beschrieben. Die Randbedingungen an den Spiegeln verlangen, dass die axiale Komponente der Ausbreitungskonstante, 𝑘𝑧 = 𝑘 cos 𝜃, ein ganzzahliges Vielfaches von π∕d ist. Der transversalen Komponente 𝑘𝑥 wird jedoch keine derartige Bedingung auferlegt, da der Resonator in 𝑥-Richtung offen ist. Die Bedingung 𝑘 cos 𝜃 = 𝑞π∕d mit einer ganzen Zahl 𝑞 kann in der Form
3
40°
z
4
30°
5
20°
θ
z νF sec θ
10° 0° 0
(a)
1
2
3
(b)
4
ν
5 ν/ν F
(c)
(d)
Abb. 11.10 (a) Schief einfallende Mode in einem Resonator aus ebenen Spiegeln. (b) Die Beziehung zwischen den Winkeln der Moden und ihren Resonanzfrequenzen. (c) Schief einfallende Moden bei einer festen Frequenz 𝜈 > 𝜈F . (d) Resonanzfrequenzen einer schief einfallenden Mode bei gegebenem Winkel 𝜃 .
329
330
11 Resonatoroptik
11.2 Kugelspiegelresonatoren Der im vorhergehenden Abschnitt besprochene Resonator aus parallelen ebenen Spiegeln ist äußerst empfindlich gegenüber Fehlern bei der Ausrichtung. Wenn die Spiegel nicht vollkommen parallel sind oder die Strahlen nicht exakt senkrecht auf die Spiegeloberflächen auftreffen, werden sie nach und nach seitlich versetzt und wandern schließlich aus dem Resonator (siehe Abb. 11.3). Kugelspiegelresonatoren bieten im Gegensatz dazu eine wesentlich stabilere Anordnung für die Eingrenzung des Lichts, die sie unter geeigneten geometrischen Bedingungen weniger empfindlich gegenüber Ausrichtungsfehlern macht. Ein Kugelspiegelresonator besteht aus zwei Kugelspiegeln mit den Radien 𝑅1 und 𝑅2 in einem Abstand d voneinander (Abb. 11.11). Die Verbindungslinie der Zentren der Spiegel definiert die optische Achse (𝑧-Achse), um die das System rotationssymmetrisch ist. Beide Spiegel können konkav (𝑅 < 0) oder konvex (𝑅 > 0) sein. Der Resonator aus ebenen Spiegeln ist ein Spezialfall dieser Anordnung mit 𝑅1 = 𝑅2 = ∞. Wir verwenden die Ergebnisse aus Abschnitt 1.4.4 und untersuchen zuerst die Bedingungen, die für die Eingrenzung des Strahls erfüllt sein müssen. Dann bestimmen wir die Resonatormoden und Resonanzfrequenzen mithilfe der Ergebnisse aus Kapitel 3. Schließlich besprechen wir kurz die Implikationen der endlichen Abmessungen der Spiegel. R1
R2
11.2.1
θ0
y0
θ2
y2
Abb. 11.12 Die Position und die Neigung eines Strahls nach m Umläufen werden mit ym und 𝜃m bezeichnet, m = 0, 1, 2, … In diesem Diagramm ist 𝜃1 < 0, da der Strahl nach unten gerichtet ist. Zur Verdeutlichung sind die Winkel übertrieben dargestellt – in Wirklichkeit sind alle Strahlen paraxial, sodass sin 𝜃 ≈ tan 𝜃 ≈ 𝜃 ist und die zurückgelegten Entfernungen aller Strahlen zwischen den Spiegeln ≈ d sind.
rien dieser Strahlen während ihrer Ausbreitung im Resonator. Ein Resonator ist ein periodisches optisches System, da sich ein Strahl nach einem Umlauf wieder durch dasselbe System ausbreitet. Wir können daher von der in Abschnitt 1.4.4 durchgeführten Analyse periodischer optischer Systeme Gebrauch machen. Wir bezeichnen die Position und die Neigung eines optischen Strahls nach 𝑚 Umläufen mit 𝑦𝑚 und 𝜃𝑚 , wie in Abb. 11.12 dargestellt. Aus 𝑦𝑚 und 𝜃𝑚 bestimmen wir dann 𝑦𝑚+1 und 𝜃𝑚+1 , indem wir den Strahl durch das System verfolgen. Für paraxiale Strahlen sind alle Winkel klein, die Beziehung zwischen (𝑦𝑚+1 , 𝜃𝑚+1 ) und (𝑦𝑚 , 𝜃𝑚 ) ist daher linear und kann in Matrixform als ⎡𝑦𝑚+1 ⎤ ⎡A ⎢ ⎥=⎢ 𝜃 C ⎣ 𝑚+1 ⎦ ⎣
B ⎤ ⎡𝑦𝑚 ⎤ D
⎥⎢ ⎥ 𝜃 ⎦ ⎣ 𝑚⎦
(11.38)
geschrieben werden. Wir beginnen mit unserer Betrachtung unten links in Abb. 11.12 mit 𝑦0 und 𝜃0 ; die Strahltransfermatrix für einen Umlauf für das in Abb. 11.12 dargestellte Strahlmuster lautet dann ⎡A ⎢ C ⎣
Strahleingrenzung
Wir beginnen mit der Strahlenoptik, um die Bedingungen für die Eingrenzung von Lichtstrahlen in einem Kugelspiegelresonator zu bestimmen. Wir betrachten nur meridionale Strahlen (Strahlen in einer Ebene, die die optische Achse enthält) und beschränken unsere Analyse auf paraxiale Strahlen (Strahlen, die kleine Winkel mit der optischen Achse einschließen). Unter diesen Bedingungen eignen sich die in Abschnitt 1.4 eingeführten Methoden der Matrixoptik, die nur für meridionale und paraxiale Strahlen in einem rotationssymmetrischen System gelten, für die Untersuchung der Trajekto-
–θ1
z
z
Abb. 11.11 Geometrie eines Kugelspiegelresonators. Hier sind beide Spiegel konkav (ihre Krümmungsradien sind negativ).
R2
R1 y1
B⎤
⎡1 ⎥=⎢ 2 D ⎦ ⎣ 𝑅1
0⎤ ⎡1 ⎥⎢ 0 ⎦⎣
1
d⎤ ⎡ 1
⎥⎢ 2 1 ⎦ ⎣ 𝑅2
0⎤ ⎡1 ⎥⎢ 1 0 ⎦⎣
d⎤
1
⎥ . (11.39) ⎦
Diese Kaskade von Strahltransfermatrizen bezeichnet von rechts nach links [siehe die Gln. (1.43) und (1.48)]: • • • •
Ausbreitung über eine Entfernung d durch Vakuum; Reflexion an einem Spiegel mit dem Radius 𝑅2 ; Ausbreitung über eine Entfernung d durch Vakuum; Reflexion an einem Spiegel mit dem Radius 𝑅1 .
Wie in Abschnitt 1.4 gezeigt ist die Lösung der Differenzgleichung (11.38) 𝑦𝑚 = 𝑦max 𝐹 𝑚 sin(𝑚𝜑 + 𝜑0 ), wobei 𝐹 2 = AD − BC , 𝜑 = cos−1 (𝑏∕𝐹) und 𝑏 = (A + D)∕2 ist
11.2 Kugelspiegelresonatoren
und 𝑦max und 𝜑0 Konstanten sind, die von der anfänglichen Position und Neigung des Strahls abhängen. Für den vorliegenden Fall ist 𝐹 = 1 und daher 𝑦𝑚 = 𝑦max sin(𝑚𝜑 + 𝜑0 ) , 𝜑 = cos−1 𝑏 ,
stabil. Im Grenzfall der Eingrenzungsbedingung (wenn die Ungleichungen Gleichungen sind), nennt man den Resonator bedingt stabil. Eine nützliche graphische Darstellung der Eingrenzungsbedingung (Abb. 11.13) stellt jede Kombination (𝑔1 , 𝑔2 ) der beiden 𝑔-Parameter eines Resonators als Punkt in einem 𝑔2 −𝑔1 -Diagramm dar. Die linke Ungleichung in Gl. (11.43) ist äquivalent zu {𝑔1 ≥ 0 und 𝑔2 ≥ 0 oder 𝑔1 ≤ 0 und 𝑔2 ≤ 0}, sodass alle stabilen Punkte (𝑔1 , 𝑔2 ) in den ersten oder dritten Quadranten liegen müssen. Die rechte Ungleichung in 11.43 bedeutet, dass stabile Punkte (𝑔1 , 𝑔2 ) in dem durch die Hyperbel 𝑔1 𝑔2 = 1 begrenzten Gebiet liegen müssen. Die nicht schattierte Fläche in Abb. 11.13 bezeichnet das Gebiet, in dem beide Ungleichungen erfüllt sind, der Resonator also stabil ist. Symmetrische Resonatoren bestehen definitionsgemäß aus identischen Spiegeln (𝑅1 = 𝑅2 = 𝑅) sodass 𝑔1 = 𝑔2 = 𝑔 ist. Solche Resonatoren entsprechen daher in Abb. 11.13 Punkten auf der Linie 𝑔2 = 𝑔1 . Die Stabilitätsbedingung wird dann 𝑔2 ≤ 1 oder −1 ≤ 1 + d ∕𝑅 ≤ 1, also
(11.40)
𝑏 = 2 (1 +
d
𝑅1
) (1 +
d
𝑅2
)−1. (11.41)
Die Lösung Gl. (11.40) ist harmonisch und daher begrenzt, sofern 𝜑 = cos−1 𝑏 reell ist. Das ist dann der Fall, wenn |𝑏| ≤ 1, d. h. −1 ≤ 𝑏 ≤ 1 gilt, sodass 0 ≤ (1 +
d
𝑅1
) (1 +
d
𝑅2
)≤ 1.
(11.42)
Es ist zweckmäßig, diese Bedingung durch die Größen 𝑔1 = 1 + d ∕𝑅1 und 𝑔2 = 1 + d ∕𝑅2 auszudrücken, die als die g-Parameter bekannt sind: 0 ≤ 𝑔1 𝑔2 ≤ 1 .
(11.43)
Wenn diese Bedingung erfüllt ist, bezeichnet man den Resonator als stabil. Dasselbe Resultat ergibt sich auch aus der Wellenoptik, wie wir anschließend zeigen werden [siehe Gl. (11.54)]. Wenn die Eingrenzungsbedingung 11.43 nicht erfüllt ist, ist 𝜑 imaginär, sodass 𝑦𝑚 in Gl. (11.40) eine Funktion des sinus hyperbolicus von 𝑚 ist, der unbeschränkt zunimmt. Man bezeichnet den Resonator dann als in-
0≤
d
(−𝑅)
≤2.
(11.44)
Damit er Gl. (11.44) erfüllt, muss ein stabiler symmetrischer Resonator konkave Spiegel (𝑅 < 0) verwenden,
g2
(a) eben (R1 =R2 =∞)
e 1
d
a
(b) symmetrisch konfokal (R1 =R2 =− )
1
(c) symmetrisch konzentrisch (R1 =R2 =− /2)
b –1
0
2
sy Re mm so et na ris to ch re e n
c
Abb. 11.13 Resonator-Stabilitätsdiagramm. Ein Kugelspiegelresonator ist stabil, wenn die Parameter g1 = 1 + d ∕R1 und g2 = 1 + d ∕R2 in den nicht schattierten Gebieten liegen, die durch die Linien g1 = 0 und g2 = 0 sowie die Hyperbel g2 = 1∕g1 begrenzt werden. R ist für einen konkaven Spie-
g1
(d) konfokal/eben (R1 = , R2 =∞)
(e) konkav/konvex (R1 < 0, R2 > 0)
gel negativ und für einen konvexen Spiegel positiv. Häufig verwendete Resonatorausführungen sind durch Buchstaben gekennzeichnet und rechts skizziert. Alle symmetrischen Resonatoren liegen auf der Linie g2 = g1 .
331
332
11 Resonatoroptik
y1
y0
y1
y0
y3
y2
y5
y4
Abb. 11.14 In einem symmetrischen konfokalen Resonator reproduzieren sich alle paraxialen Strahlen nach zwei Umläufen, unabhängig von ihren Anfangspositionen und -neigungen. Alle Winkel sind hier der Deutlichkeit halber übertrieben dargestellt.
deren Radien größer als Hälfte die Resonatorlänge sind. Drei Beispiele dieser Art von Resonatoren sind von besonderem Interesse: d ∕(−𝑅) = 0, 1, und 2, entsprechend planaren, konfokalen und konzentrischen Resonatoren. In einem symmetrischen konfokalen Resonator ist (−𝑅) = d , sodass die Krümmungszentren der beiden Spiegel auf dem jeweils anderen Spiegel liegen. Daher ist 𝑏 = −1 und 𝜑 = π, sodass die Strahlposition in Gl. (11.40) gleich 𝑦𝑚 = 𝑦max sin(𝑚π + 𝜑0 ) sein muss, d. h. 𝑦𝑚 = (−1)𝑚 𝑦0 . Strahlen, die in beliebiger Neigung von der Position 𝑦0 ausgehen, werden daher auf die Position 𝑦1 = −𝑦0 abgebildet, dann wieder auf die Position 𝑦2 = 𝑦0 und so weiter. Die Strahlen reproduzieren sich daher nach zwei Umläufen selbst (Abb. 11.14). Alle paraxialen Strahlen werden daher eingegrenzt, unabhängig von ihren Anfangspositionen und -neigungen. Das ist eine wesentliche Verbesserung im Vergleich zu dem Resonator aus ebenen Spiegeln, für den nur zur Resonatorachse exakt parallele Strahlen sich selbst reproduzierten, wie Abb. 11.3 schematisch zeigt. Übung 11-3: Maximale Resonatorlänge für eingegrenzte Strahlen
Ein Resonator besteht aus konkaven Spiegeln mit den Radien 50 und 100 cm. Bestimmen Sie die maximale Resonatorlänge, für die Strahlen die Eingrenzungsbedingung erfüllen.
11.2.2
Gaußmoden
Obwohl der im vorhergehenden Abschnitt betrachtete strahlenoptische Ansatz nützlich ist, um die geometrischen Bedingungen zu bestimmen, unter denen Strahlen eingegrenzt werden, kann er keine Auskunft über die Resonanzfrequenzen und räumlichen Intensitätsverteilungen der Resonatormoden geben. Für diese Größen müssen wir die Wellenoptik zu Rate ziehen. Wir wollen im Folgenden zeigen, dass Gaußstrahlen Lösungen der paraxialen Helmholtzgleichung unter den Randbedingungen eines Paars von Kugelspiegeln in einer Resonatoranordnung sind. Allgemeiner zeigen wir, dass die Moden des Kugelspiegelresonators Hermite-GaußStrahlen sind. Im Laufe unserer Analyse bestimmen wir Ausdrücke für die Resonanzfrequenzen und räumlichen Intensitätsverteilungen der Resonatormoden. Gaußstrahlen
Wie in Kapitel 3 besprochen ist ein Gaußstrahl eine zylindersymmetrische Welle, deren Energie um ihre Achse (die 𝑧-Achse) eingegrenzt ist und deren Wellenfrontnormalen paraxiale Strahlen sind (Abb. 11.15). Nach Gl. (3.12) gehorcht die Strahlintensität 𝐼 in der transversalen (𝑥𝑦-) Ebene in einer axialen Entfernung 𝑧 von der Strahltaille einer Gaußverteilung, 𝐼 = 𝐼0 [𝑊0 ∕𝑊(𝑧)]2 exp[−2(𝑥2 + 𝑦 2 )∕𝑊 2 (𝑧)]. Ihre Breite ist durch Gl. (3.8) gegeben, √ 𝑊(𝑧) = 𝑊0
2
1+(
Zusammenfassung
Die Eingrenzungsbedingung für paraxiale Strahlen in einem Kugelspiegelresonator aus Spiegeln mit den Radien 𝑅1 und 𝑅2 in einem Abstand d ist 0 ≤ 𝑔1 𝑔2 ≤ 1 mit 𝑔1 = 1 + d ∕𝑅1 und 𝑔2 = 1 + d ∕𝑅2 . Die Eingrenzungsbedingung für symmetrische Resonatoren ist 0 ≤ d ∕(−𝑅) ≤ 2; diese Bedingung gilt für ebene, symmetrische konfokale und symmetrische konzentrische Spiegelanordnungen.
𝑧 ) , 𝑧0
(11.45)
wobei 𝑧0 die Rayleighlänge ist, bei der die Wellenfronten des Strahls am stärksten gekrümmt sind. Der Strahlradius 𝑊(𝑧) nimmt von seinem minimalen Wert 𝑊0 an der Strahltaille (𝑧 = 0) in beiden Richtungen zu. Der Krümmungsradius der Wellenfronten ist durch Gl. (3.9) gegeben, 𝑅(𝑧) = 𝑧 [1 + (
𝑧0 2 )]; 𝑧
(11.46)
er nimmt von ∞ bei 𝑧 = 0 bis auf einen minimalen Wert bei 𝑧 = 𝑧0 ab und steigt danach für große 𝑧 linear mit 𝑧
11.2 Kugelspiegelresonatoren
Abb. 11.15 Die Wellenfronten eines Gaußstrahls (durchgezogene Kurven) und der Strahlradius (gestrichelte Kurve).
an. Für 𝑧 > 0 divergiert die Welle und es gilt 𝑅(𝑧) > 0; für 𝑧 < 0 konvergiert die Welle und es ist 𝑅(𝑧) < 0. Die Rayleighlänge 𝑧0 hängt durch Gl. (3.11) mit dem Taillenradius 𝑊0 des Strahls zusammen: 𝑧0 =
π𝑊02
. (11.47) 𝜆 Die Schärfentiefe ist 2𝑧0 , d. h. zweimal die Rayleighlänge. Der Gaußstrahl als Mode des Kugelspiegelresonators
Ein von einem Kugelspiegel reflektierter Gaußstrahl wird auf dem Weg des einfallenden Strahls zurücklaufen, wenn der Krümmungsradius seiner Wellenfront gleich dem Spiegelradius ist (siehe Abschnitt 3.2.3). Wenn die Krümmungsradien der Wellenfronten eines Gaußstrahls in zwei Ebenen in einem Abstand d gleich den Radien zweier Spiegel in demselben Abstand d sind, wird ein auf den ersten Spiegel einfallender Strahl reflektiert und auf den zweiten Spiegel geworfen, wo er wieder reflektiert und zum ersten Spiegel zurückgeworfen wird usw. Der Strahl kann dann selbstkonsistent innerhalb dieses Kugelspiegelresonators existieren und erfüllt die Helmholtzgleichung und die durch die Spiegel auferlegten Randbedingungen. Wenn auch die Phase sich reproduziert, wie in Abschnitt 11.2.3 diskutiert, bezeichnet man den Gaußstrahl als Mode des Kugelspiegelresonators. Als Nächstes wollen wir den zu einem Kugelspiegelresonator mit den Krümmungsradien 𝑅1 und 𝑅2 der Spiegel in einem Abstand d passenden Gaußstrahl bestimmen. Die Aufgabe wird in Abb. 11.16 für den speziellen Fall illustriert, dass beide Spiegel konkav sind (𝑅1 < 0 und 𝑅2 < 0). Die 𝑧-Achse wird durch die Zentren der Spiegel festgelegt. Das Zentrum des noch zu bestimmenden Strahls wird in den Ursprung 𝑧 = 0 gelegt; die Spiegel 𝑅1 und 𝑅2 liegen bei 𝑧1 und 𝑧2 = 𝑧1 + d .
(11.48)
Ein negativer Wert für 𝑧1 zeigt, dass das Zentrum des Strahls rechts von Spiegel 1 liegt; ein positiver Wert bedeutet, dass es links liegt. Die Werte von 𝑧1 und 𝑧2 werden bestimmt, indem man den Krümmungsradius des
R2
R1
Strahlradius z
z1
0
z2
z
Abb. 11.16 Anpassung eines Gaußstrahls an zwei Spiegel in einem Abstand d . Ihre Krümmungsradien sind R1 und R2 . Beide Spiegel sind hier konkav; R1 und R2 sind also negativ, genau wie z1 .
Strahls, 𝑅(𝑧) = 𝑧 + 𝑧02 ∕𝑧, gleich den Radien 𝑅1 bei 𝑧1 und 𝑅2 bei 𝑧2 setzt. Dabei muss man die Vorzeichen sorgfältig im Auge behalten. Wenn beide Spiegel konkav sind, sind ihre Radien negativ. Der Krümmungsradius des Strahls ist jedoch für 𝑧 > 0 (an Spiegel 2) positiv und für 𝑧 < 0 (an Spiegel 1) negativ. Wir müssen daher 𝑅1 = 𝑅(𝑧1 ), aber −𝑅2 = 𝑅(𝑧2 ) setzen und erhalten so 𝑅1 = 𝑧1 + 𝑧02 ∕𝑧1 , −𝑅2 = 𝑧2 +
𝑧02 ∕𝑧2
(11.49)
.
(11.50)
Wir lösen die Gln. (11.48), (11.49) und (11.50) nach 𝑧1 , 𝑧2 und 𝑧0 auf; das ergibt −d (𝑅2 + d ) , 𝑧2 = 𝑧1 + d , 𝑅2 + 𝑅1 + 2d −d (𝑅1 + d )(𝑅2 + d )(𝑅2 + 𝑅1 + d ) , 𝑧02 = (𝑅2 + 𝑅1 + 2d )2 𝑧1 =
(11.51) (11.52)
was mit den Gln. (3.27) und (3.28) im Einklang steht (wenn 𝑅2 durch −𝑅2 ersetzt wird). Nachdem wir das Strahlzentrum und die Schärfentiefe 2𝑧0 bestimmt haben, ist der Strahl vollständig charakterisiert (siehe Abschnitt 3.1.2). Der Taillenradius ist √ 𝑊0 = 𝜆𝑧0 ∕π, und die Strahlradien an den Spiegeln sind √ 𝑧𝑖 2 (11.53) 𝑊𝑖 = 𝑊0 1 + ( ) , 𝑖 = 1, 2 . 𝑧0 Damit die Lösung Gl. (11.51)–(11.52) wirklich einen Gaußstrahl beschreibt, muss 𝑧0 reell sein. Ein imaginärer Wert von 𝑧0 würde bedeuten, dass der Gaußstrahl eine Parabolwelle ist, die eine nicht eingegrenzte Lösung der paraxialen Helmholtzgleichung ist (siehe Abschnitt 3.1.1). Mithilfe von Gl. (11.52) können wir leicht zeigen, dass die Bedingung 𝑧02 > 0 äquivalent ist zu 0 ≤ (1 +
d
𝑅1
) (1 +
d
𝑅2
)≤ 1.
(11.54)
Das ist genau die Eingrenzungsbedingung, die wir in (11.42) aus der Strahlenoptik abgeleitet hatten.
333
334
11 Resonatoroptik
Übung 11-4: Ein plankonkaver Resonator
Bestimmen Sie die Eingrenzungsbedingung und die Schärfentiefe sowie den Strahlradius an der Taille und an jedem der Spiegel als Funktion von d ∕|𝑅2 |, wenn Spiegel 1 eben ist (𝑅1 = ∞).
Strahlradius 2 λπ W1 = W2
λ π
Die Gaußmode eines symmetrischen Kugelspiegelresonators
W0
Die in den Gln. (11.48)–(11.52) angegebenen Ergebnisse vereinfachen sich für symmetrische Resonatoren mit konkaven Spiegeln beträchtlich. Wenn wir in Gl. (11.51) 𝑅1 = 𝑅2 = −|𝑅| einsetzen, erhalten wir 𝑧1 = −d ∕2 und 𝑧2 = d ∕2. Das Strahlzentrum liegt also im Mittelpunkt des Resonators und es gilt √ d |𝑅| 2 −1, (11.55) 𝑧0 = 2 d √ 𝜆d |𝑅| 2 −1, (11.56) 𝑊02 = 2π d 𝜆 d ∕π 𝑊12 = 𝑊22 = √ . (11.57) (d ∕|𝑅|) [2 − (d ∕|𝑅|)]
0
d
|𝑅|
≤2.
(11.58)
Am Beispiel eines Resonators mit festem Spiegelabstand d wollen wir nun die Wirkung einer zunehmenden Krümmung der Spiegel auf die Strahlradien 𝑊0 an der Taille und 𝑊1 = 𝑊2 an den Spiegeln untersuchen. (Eine zunehmende Krümmung entspricht zunehmendem d ∕|𝑅|, da der Krümmungsradius sich verringert, wenn die Krümmung zunimmt.) Die Ergebnisse sind in Abb. 11.17 dargestellt. Für einen Resonator aus ebenen Spiegeln ist d ∕|𝑅| = 0, sodass 𝑊0 und 𝑊1 unendlich werden, entsprechend einer ebenen Welle anstelle eines Gaußstrahls. Wenn d ∕|𝑅| zunimmt, nimmt 𝑊0 ab und verschwindet für einen konzentrischen Resonator (d ∕|𝑅| = 2) ganz; an diesem Punkt ist 𝑊1 = 𝑊2 = ∞ und 𝑊0 = 0. In diesem Grenzfall ist die Resonatormode eine Kugelwelle anstelle eines Gaußstrahls. An den Spiegeln erreicht √ der Strahlradius seinen minimalen Wert 𝑊1 = 𝑊2 = 𝜆 d ∕π für d ∕|𝑅| = 1, d. h. für den symmetrischen konfokalen Resonator. In diesem Fall ist 𝑧0 = d ∕2 , √ 𝑊0 = 𝜆 d ∕2π , √ 𝑊1 = 𝑊2 = 2 𝑊0 .
(11.59) (11.60) (11.61)
Die Schärfentiefe 2𝑧0 ist dann gleich der Länge d des Resonators, wie Abb. 11.18 zeigt. Das erklärt, warum der Parameter 2𝑧0 manchmal konfokaler Parameter genannt
/ R
2
Abb. 11.17 Die Strahlradien W0 an der Taille und W1 = W2 an den Spiegeln für einen symmetrischen Kugelspiegelresonator mit konkaven Spiegeln als Funktion des Verhältnisses d ∕|R|. Der Resonator aus ebenen Spiegeln entspricht d ∕|R| = 0. Symmetrische konfokale und konzentrische Resonatoren entsprechen d ∕|R| = 1 bzw. d ∕|R| = 2. Spiegel 1
Spiegel 2 W0
Die Eingrenzungsbedingung Gl. (11.54) wird jetzt 0≤
1
√ 2W0 z
= 2 z0
Abb. 11.18 Ein Gaußstrahl in einem symmetrischen konfokalen Resonator mit konkaven Spiegeln. Die Schärfentiefe 2z0 ist gleich der Resonatorlänge √ d. Der Strahlradius ist an den Spiegeln um einen Faktor 2 größer als an der Taille.
wird. Ein langer Resonator hat eine lange Schärfentiefe. Der Taillenradius ist proportional zur Quadratwurzel des Spiegelabstands. Ein Gaußstrahl mit 𝜆0 = 633 nm (der Wellenlänge eines He-Ne-Lasers) in einem Resonator mit d = 100 cm hat z. B. einen Taillenradius 𝑊0 = √ 𝜆 d ∕2π = 0.32 mm, wohingegen ein 25 cm langer Resonator bei derselben Wellenlänge einen Gaußstrahl mit einem nur halb so großen (0.16 nm) Taillenradius besitzt. √ An den Spiegeln ist der Strahlradius um einen Faktor 2 größer als an der Taille.
11.2.3
Resonanzfrequenzen
Wie in Abschnitt 11.2.2 angedeutet ist ein Gaußstrahl eine Mode des Kugelspiegelresonators, sofern die Wellenfrontnormalen auf sich selbst zurück reflektiert werden, sodass sie immer denselben Weg zurücklaufen, und dasselbe auch für die Phase gilt. Die Phase eines Gaußstrahls ist nach Gl. (3.23) 𝜑(𝜌, 𝑧) = 𝑘𝑧 − 𝜁(𝑧) +
𝑘𝜌2 , 2𝑅(𝑧)
(11.62)
wobei 𝜁(𝑧) = tan−1 (𝑧∕𝑧0 ) und 𝜌2 = 𝑥2 + 𝑦 2 sind. An Punkten auf der optischen Achse (𝜌 = 0) ist 𝜑(0, 𝑧) =
11.2 Kugelspiegelresonatoren
𝑘𝑧 − 𝜁(𝑧), sodass die Phasenverzögerung gegenüber einer ebenen Welle 𝜁(𝑧) ist. An den Spiegeln, bei 𝑧1 und 𝑧2 , ist daher 𝜑(0, 𝑧1 ) = 𝑘𝑧1 − 𝜁(𝑧1 ) ,
(11.63)
𝜑(0, 𝑧2 ) = 𝑘𝑧2 − 𝜁(𝑧2 ) .
(11.64)
Da die Spiegeloberfläche mit den Wellenfronten zusammenfällt, haben alle Punkte auf einem Spiegel dieselbe Phase. Bei der Ausbreitung des Strahls von Spiegel 1 zu Spiegel 2 ändert sich seine Phase um 𝜑(0, 𝑧2 ) − 𝜑(0, 𝑧1 ) = 𝑘(𝑧2 − 𝑧1 ) − [𝜁(𝑧2 ) − 𝜁(𝑧1 )] = 𝑘d − Δ𝜁
(11.65)
mit Δ𝜁 = 𝜁(𝑧2 ) − 𝜁(𝑧1 ) .
(11.66)
Bei einem vollständigen Umlauf der Welle zwischen den beiden Spiegeln ändert sich ihre Phase daher um 2𝑘d − 2Δ𝜁. Damit der Strahl wirklich auf sich selbst zurückfällt, muss die Phasenänderung bei einem kompletten Umlauf gleich null oder einem ganzzahligen Vielfachen von ±2π sein, d. h. 2𝑘d − 2Δ𝜁 = 2π 𝑞 mit 𝑞 = 0, ±1, ±2, … Mit den Ersetzungen 𝑘 = 2π 𝜈∕𝑐 und 𝜈F = 𝑐∕2d werden die Frequenzen 𝜈𝑞 , die diese Bedingung erfüllen, gleich 𝜈𝑞 = 𝑞𝜈F +
Δ𝜁 𝜈 . π F
(11.67)
Der Frequenzabstand zwischen benachbarten Moden ist daher 𝜈F = 𝑐∕2d , also genau das Resultat, das wir in Abschnitt 11.1.1 für den Resonator aus ebenen Spiegeln erhalten hatten. Für Kugelspiegelresonatoren hängt dieser Frequenzabstand offensichtlich nicht von den Krümmungen der Spiegel ab. Der zweite Term in Gl. (11.67), der von den Krümmungen abhängt, bewirkt nur eine gleichmäßige Verschiebung aller Resonanzfrequenzen. Übung 11-5: Resonanzfrequenzen eines konfokalen Resonators
Ein symmetrischer konfokaler Resonator hat die Länge d = 30 cm und das Medium hat den Brechungsindex 𝑛 = 1. Bestimmen Sie den Frequenzabstand 𝜈F und die Frequenzverschiebung (Δ𝜁∕π)𝜈F . Geben Sie alle Resonanzfrequenzen in dem Band 5 × 1014 ± 2 × 109 Hz an.
11.2.4 Hermite-Gauß-Moden In Abschnitt 3.3 hatten wir gezeigt, dass der Gaußstrahl nicht die einzige strahlartige Lösung der paraxialen Helmholtzgleichung ist. Die Familie der HermiteGauß-Strahlen liefert ebenfalls Lösungen. Obwohl ein
Hermite-Gauß-Strahl der Ordnung (𝑙, 𝑚) eine Amplitudenverteilung hat, die sich von der des Gaußstrahls unterscheidet, sind ihre Wellenfronten identisch. Infolgedessen ist das Design eines Resonators zu einem gegebenen Strahl (oder das Design eines Strahls zu einem gegebenen Resonator) identisch mit dem für einen Gaußstrahl, unabhängig von den Werten von (𝑙, 𝑚). Hieraus folgt, dass alle Mitglieder der Familie von Hermite-Gauß-Strahlen Moden des Kugelspiegelresonators sind. Die Resonanzfrequenzen der (𝑙, 𝑚)-Mode hängen jedoch sehr wohl von dem Index (𝑙, 𝑚) ab. Das liegt an der Abhängigkeit der Gouyphase von 𝑙 und 𝑚. Wie aus Gl. (3.66) deutlich wird, ist die Phase der (𝑙, 𝑚)-Mode auf der Strahlachse gleich 𝜑(0, 𝑧) = 𝑘𝑧 − (𝑙 + 𝑚 + 1)𝜁(𝑧) .
(11.68)
Wieder muss die Phasenverschiebung einer Welle nach einem vollständigen Umlauf durch den Resonator der Länge d gleich null oder einem ganzzahligen Vielfachen von ±2π sein, damit der Strahl sich selbst reproduziert. Also gilt 2𝑘d − 2(𝑙 + 𝑚 + 1)Δ𝜁 = 2π 𝑞 ,
𝑞 = 0, ±1, ±2, … , (11.69)
wobei wie zuvor Δ𝜁 = 𝜁(𝑧2 ) − 𝜁(𝑧1 ) ist und 𝑧1 und 𝑧2 die Positionen der Spiegel sind. Mit 𝑘 = 2π 𝜈∕𝑐 und 𝜈F = 𝑐∕2d erhalten wir die Resonanzfrequenzen 𝜈𝑙,𝑚,𝑞 = 𝑞𝜈F + (𝑙 + 𝑚 + 1)
Δ𝜁 𝜈 . π F
(11.70)
Moden mit unterschiedlichem 𝑞, aber gleichen (𝑙, 𝑚) haben identische Intensitätsverteilungen [siehe Gl. (3.68)]. Sie werden als longitudinale oder axiale Moden bezeichnet. Der Index (𝑙, 𝑚) beschreibt verschiedene räumliche Abhängigkeiten von den transversalen Koordinaten 𝑥, 𝑦; diese beschreiben daher verschiedenen transversale Moden, wie Abb. 3.23 zeigt. Wegen Gl. (11.70) besitzen die Resonanzfrequenzen der Hermite-Gauß-Moden die folgenden Eigenschaften: • Die longitudinalen Moden zu einer gegebenen transversalen Mode haben Resonanzfrequenzen im Abstand 𝜈F = 𝑐∕2d , da 𝜈𝑙,𝑚,𝑞+1 − 𝜈𝑙,𝑚,𝑞 = 𝜈F ist. Dieses Ergebnis ist identisch mit dem für die (0,0)-Gaußmode und den Resonator aus ebenen Spiegeln. • Alle transversalen Moden mit derselben Summe der Indizes 𝑙 + 𝑚 haben dieselben Resonanzfrequenzen. • Zwei transversale Moden (𝑙, 𝑚) und (𝑙′ , 𝑚′ ) entsprechend derselben longitudinalen Mode 𝑞 haben Resonanzfrequenzen im Abstand 𝜈𝑙,𝑚,𝑞 − 𝜈𝑙′ ,𝑚′ ,𝑞 = [(𝑙 + 𝑚) − (𝑙′ + 𝑚′ )]
Δ𝜁 𝜈 . (11.71) π F
335
336
11 Resonatoroptik
Dieser Ausdruck bestimmt die Frequenzverschiebung zwischen den Gruppen von longitudinalen Moden der Indizes (𝑙, 𝑚) und (𝑙′ , 𝑚′ ).
Spiegel 2
Spiegel 1 U2
2a
U1
Übung 11-6: Resonanzfrequenzen des symmetrischen konfokalen Resonators
Zeigen Sie, dass für einen symmetrischen konfokalen Resonator die longitudinalen Moden zu unterschiedlichen transversalen Moden entweder bei denselben Frequenzen liegen oder um 𝜈F ∕2 gegeneinander versetzt sind, wie in Abb. 11.19 gezeigt ist. νF (l, m) ν (l′, m′)
ν
νF/ 2
ν
Abb. 11.19 In einem symmetrischen konfokalen Resonator haben die zu zwei transversalen Moden der Indizes (l, m) und (l′ , m′ ) gehörenden longitudinalen Moden entweder dieselben Resonanzfrequenzen oder sie sind um den halben Abstand der longitudinalen Moden versetzt.
11.2.5
Endliche Blenden und Beugungsverluste
Da Gauß- und Hermite-Gauß-Strahlen transversal unendlich ausgedehnt sind, die Resonatorspiegel aber endliche Abmessungen haben, kann ein Teil der optischen Leistung bei jedem Umlauf an den Spiegeln vorbei aus dem Resonator entkommen. Eine Abschätzung des Leistungsverlusts erhalten wir, wenn wir den Anteil der Strahlleistung berechnen, der nicht auf den Spiegel trifft. Wenn der Strahl ein Gaußstrahl mit dem Durchmesser 𝑊 und der Spiegel kreisförmig mit dem Radius 𝑎 = 2𝑊 ist, dann entkommt bei jeder Reflexion ein Bruchteil exp(−2𝑎2 ∕𝑊 2 ) ≈ 3.35 × 10−4 der Strahlleistung [siehe Gl. (3.17)]; der Rest wird durch den Spiegel durchgelassen oder reflektiert. Transversale Moden höherer Ordnung erleiden größere Verluste, da sie eine größere Ausdehnung in der transversalen Ebene haben. Wenn der Spiegelradius 𝑎 kleiner ist als 2𝑊, sind die Verluste größer. Die Gauß- und Hermite-Gauß-Strahlen sind dann keine guten Näherungen für die Resonatormoden mehr. Die Bestimmung der Moden eines Kugelspiegelresonators mit Spiegeln endlicher Größe ist schwierig. Eine Welle ist eine Mode, wenn sie nach nach einem vollen Umlauf durch den Resonator ihre Amplitude bis auf eine multiplikative Konstante und ihre Phase bis auf ein ganzzahliges Vielfaches von 2π repro-
Abb. 11.20 Ausbreitung einer Welle durch einen Kugelspiegelresonator. Die komplexe Amplitude U1 (x, y ) entspricht einer Mode, wenn sie sich nach einem Umlauf bis aus einen multiplikativen Faktor reproduziert, d. h. wenn U2 (x, y ) = 𝜇U1 (x, y ) und arg{𝜇} = q2π ist.
duziert. Zur Bestimmung von Moden verfolgt man oft eine Welle auf ihrem Weg durch den Resonator und bestimmt dabei wiederholt ihre Amplitude und ihre Phase, ähnlich wie wir die Position und die Neigung eines Strahls während seiner Reflexionen im Resonator verfolgt hatten. Nach vielen Umläufen im Resonator konvergiert dieser Prozess auf eine der Moden. Die Anwendung dieses Verfahrens auf einen Kugelspiegelresonator ist in Abb. 11.20 schematisch dargestellt. Wenn 𝑈1 (𝑥, 𝑦) die komplexe Amplitude einer Welle gleich rechts von Spiegel 1 in Abb. 11.20 ist und 𝑈2 (𝑥, 𝑦) ihre komplexe Amplitude nach einem Umlauf durch den Resonator, dann ist 𝑈1 (𝑥, 𝑦) eine Mode, sofern 𝑈2 (𝑥, 𝑦) = 𝜇𝑈1 (𝑥, 𝑦) gilt und arg{𝜇} ein ganzzahliges Vielfaches von 2π ist (d. h. wenn 𝜇 reell und positiv ist). Nach einem Umlauf durch den Resonator ist die Modenintensität um den Faktor 𝜇 2 abgeschwächt und die Phase wird reproduziert. 𝑈2 (𝑥, 𝑦) kann mithilfe von Methoden aus der Fourieroptik (Kapitel 4) aus 𝑈1 (𝑥) bestimmt werden. Diese Größen können als Eingang bzw. Ausgang eines linearen Systems aufgefasst werden (siehe Anhang B), das durch eine Impulsantwortfunktion ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) charakterisiert wird, sodass ∞
𝑈2 (𝑥, 𝑦) = ∬ ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) 𝑈1 (𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ . (11.72) −∞
Wenn die Impulsantwortfunktion ℎ bekannt ist, können die Moden bestimmt werden, indem man das durch die Integralgleichung beschriebene Eigenwertproblem löst (siehe Anhang C), ∞
∬ ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) 𝑈(𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ = 𝜇 𝑈(𝑥, 𝑦) . (11.73) −∞
Die Lösungen bestimmen die Eigenfunktionen 𝑈𝑙,𝑚 (𝑥, 𝑦) und Eigenwerte 𝜇𝑙,𝑚 , die durch die Indizes (𝑙, 𝑚) beschrieben werden. Die Eigenfunktionen sind die Moden und die Eigenwerte sind die multiplikativen
11.3 Zwei- und dreidimensionale Resonatoren
Faktoren für einen Umlauf durch den Resonator. Das Betragsquadrat |𝜇𝑙,𝑚 |2 ist der Faktor, um den die Intensität der (𝑙, 𝑚)-Mode bei einem Umlauf abgeschwächt wird. Wenn die Spiegel unendlich sind und die paraxiale Näherung gilt, reduzieren sich die Moden auf die Familie der Hermite-Gauß-Strahlen, die wir früher besprochen hatten. Wir müssen nun noch ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) bestimmen und die Integralgleichung (11.73) lösen. Ein einzelner Durchgang durch den Resonator bedeutet die Ausbreitung über eine Entfernung d , Abschneiden des Strahls auf die Abmessung der Spiegelöffnung und Reflexion an dem Spiegel. Der zweite Durchgang, der einen Umlauf vervollständigt, verläuft ähnlich. Die Impulsantwortfunktion ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) kann dann bestimmt werden, indem man die Theorie der Fresnelbeugung (Abschnitt 4.3.2) anwendet. Im Allgemeinen können die Moden und ihre zugehörigen Verluste nur durch numerische Lösung der Integralgleichung (11.73) bestimmt werden. Eine iterative numerische Lösung beginnt mit einer angenommenen Probefunktion 𝑈1 , aus der 𝑈2 berechnet und erneut durch das System geschickt wird; dieser Prozess wird so lange wiederholt, bis die Rechnung konvergiert. Mit dieser Technik wurden z. B. die Verluste der verschiedenen Moden eines Kugelspiegelresonators mit kreisförmigen Spiegelöffnungen mit dem Radius 𝑎 bestimmt. Die Ergebnisse sind in Abb. 11.21 für einen symmetrischen konfokalen Resonator dargestellt. Der Verlust wird durch einen einzigen Parameter bestimmt, die Fresnelzahl 𝑁F = 𝑎2 ∕𝜆 d , weil diese die Fresnelbeugung zwischen den beiden Spiegeln bestimmt, wie in Abschnitt 4.3.2 besprochen. Für den durch die Gln. (11.60) und (11.61) beschriebenen symmetrischen konfokalen Resonator ist der Strahlradius an den Spiegeln 𝑊 = √ 𝜆 d ∕π, sodass 𝜆 d = π𝑊 2 ist, woraus wir die Fresnelzahl leicht als 𝑁F = 𝑎2 ∕π𝑊 2 berechnen können. 𝑁F
ist daher proportional zu dem Verhältnis 𝑎2 ∕𝑊 2 ; eine größere Fresnelzahl entspricht einem kleineren Verlust. Aus Abb. 11.21 sehen wir, dass der Verlust der Mode niedrigster Ordnung (𝑙, 𝑚) = (0, 0) des symmetrischen konfokalen Resonators für 𝑛F ≈ 0.94 ungefähr 0.1 % pro Durchgang ist. Diese Fresnelzahl entspricht einem Verhältnis 𝑎∕𝑊 = 1.72. Wenn der Strahl ein Gaußstrahl mit dem Radius 𝑊 ist, ist der Prozentsatz der außerhalb eines Kreises mit Radius 𝑎 = 1.72𝑊 liegenden Leistung exp(−2𝑎2 ∕𝑊 2 ) ≈ 0.27 %. Dieser Verlust ist größer als die 0.1 % für die tatsächliche Resonatormode. Moden höherer Ordnung erfahren größere Verluste, weil sie räumlich stärker ausgedehnt sind.
11.3 Zwei- und dreidimensionale Resonatoren 11.3.1 Zweidimensionale rechteckige Resonatoren Ein zweidimensionaler Spiegelresonator besteht aus zwei orthogonalen Paaren von ebenen Spiegeln, z. B. einem Paar senkrecht zur 𝑧-Achse und einem zweiten Paar senkrecht zur 𝑦-Achse. Licht wird dann durch eine Folge von Strahlreflexionen auf die 𝑧𝑦-Ebene eingegrenzt, wie Abb. 11.22(a) zeigt. Die Randbedingungen legen die Resonatormoden fest, ganz ähnlich wie im eindimensionalen Fabry-PérotResonator. Wenn der Spiegelabstand d ist, dann werden die Komponenten des Wellenvektors k = (𝑘𝑦 , 𝑘𝑧 ) für stehende Wellen auf die Werte 𝑘𝑦 = 𝑞𝑦
π d
,
𝑘𝑧 = 𝑞𝑧
0.1 0.5
Verlust pro Umlauf (%)
,
𝑞𝑦 = 1, 2, … ,
𝑞𝑧 = 1, 2, …
eingeschränkt, wobei 𝑞𝑦 und 𝑞𝑧 die Modenindizes für die 𝑦- und 𝑧-Richtung sind. Diese Bedingungen sind eine Verallgemeinerung von Gl. (11.2). Jedes Paar von
Abb. 11.21 Prozentualer Beugungsverlust pro Durchgang (halbem Umlauf) als Funktion der Fresnelzahl NF = a2 ∕𝜆d für die Moden (0, 0), (1, 0) und (2, 0) in einem symmetrischen konfokalen Resonator. (Angepasst nach A. E. Siegman, Lasers, University Science Books 1986, Abb. 19.19 links.)
10
1
d
(11.74)
100
2a
π
(0, 0)
(1,0)
(2,0)
1.0 Fresnelzahl NF = a2/λ
1.4
337
338
11 Resonatoroptik
y
Verfahren wandelt die erlaubten Werte des Vektors k in erlaubte Werte der Frequenz 𝜈 um. Spiegel
(a)
Übung 11-7: Modendichte in einem zweidimensionalen Resonator
(b)
z
Abb. 11.22 Ein zweidimensionaler Spiegelresonator: (a) Strahlverlauf; (b) Stehende Welle der Mode mit qy = 3 und qz = 2. Die Kurven zeigen die Amplituden der Mode, die Helligkeitsmuster die Intensität. π
ky
π
(a) Geben Sie eine Näherung für die Zahl der Moden in einem zweidimensionalen Resonator mit Frequenzen zwischen 0 und 𝜈 an. Nehmen Sie dazu an, dass 2π 𝜈∕𝑐 ≫ π∕d ist, d. h. d ≫ 𝜆∕2, und berücksichtigen Sie zwei orthogonale Polarisationen pro Mode. (b) Zeigen Sie, dass die Zahl der Moden pro Flächeneinheit im Frequenzintervall zwischen 𝜈 und 𝜈 + d𝜈 gleich M(𝜈) d𝜈 ist, wobei die Modendichte M (𝜈) (Moden pro Flächeneinheit pro Einheitsfrequenz) bei der Frequenz 𝜈 durch M (𝜈) =
k = 2πν c
4π𝜈 𝑐2
(11.77)
gegeben ist.
0 0
kz
Abb. 11.23 Punkte bezeichnen die Endpunkte des Wellenvektors k = (ky , kz ) für Moden in einem zweidimensionalen Resonator.
ganzen Zahlen (𝑞𝑦 , 𝑞𝑧 ) bezeichnet eine Resonatormode 𝑈(r) ∝ sin(𝑞𝑦 π𝑦∕d ) sin(𝑞𝑧 π𝑧∕d ), wie in Abb. 11.22(b) dargestellt. Die Mode niedrigster Ordnung ist (1, 1), da die Moden (𝑞𝑦 , 0) und (0, 𝑞𝑧 ) Amplituden von null haben, d. h. es ist 𝑈(r) = 0. Moden werden zweckmäßig durch Punkte auf einem periodischen Gitter mit einem Abstand π∕d bezeichnet, die ihre Werte von 𝑘𝑦 und 𝑘𝑧 (Abb. 11.23) angeben. Die Wellenzahl 𝑘 einer Mode entspricht der Entfernung des Punkts vom Ursprung. Die zugehörige Frequenz der Mode ist 𝜈 = 𝑐𝑘∕2π. Die Frequenzen der Resonatormoden sind daher durch 2
𝑘2 = 𝑘𝑦2 + 𝑘𝑧2 = (
2π 𝜈 ) 𝑐
(11.75)
gegeben, sodass 𝜈q = 𝜈F
√
𝑞𝑦2 + 𝑞𝑧2 ,
𝑞𝑦 , 𝑞𝑧 = 1, 2, … ,
𝜈F =
𝑐 , (11.76) 2d
ist, wobei q = (𝑞𝑦 , 𝑞𝑧 ) ist. Die Zahl der Moden in einem gegebenen Frequenzband 𝜈1 < 𝜈 < 𝜈2 kann bestimmt werden, indem man in dem 𝑘-Diagramm aus Abb. 11.23 zwei Kreise mit Radien von 𝑘1 = 2π 𝜈1 ∕𝑐 und 𝑘2 = 2π 𝜈2 ∕𝑐 zieht und die Zahl der Punkte zählt, die innerhalb des Rings liegen. Dieses
Die bis jetzt in diesem Abschnitt beschriebenen Resonatormoden breiten sich in der Ebene des zweidimensionalen Resonators (der 𝑦𝑧-Ebene) aus. Die Ausbreitungskonstanten von Moden außerhalb dieser Ebene haben eine Komponente in der orthogonalen Richtung (der 𝑥-Richtung). Bei ihnen handelt es sich um geführte Moden, die sich entlang der Achse eines zweidimensionalen Wellenleiters wie dem in Abschnitt 9.3 beschriebenen ausbreiten. Während die 𝑘𝑦 - und 𝑘𝑧 -Komponenten des Wellenvektors auf diskrete Werte beschränkt sind, die durch die Randbedingungen vorgegeben sind, kann die 𝑘𝑥 -Komponente kontinuierliche Werte annehmen, da der zweidimensionale Resonator in 𝑥-Richtung offen ist.
11.3.2 Kreisförmige Resonatoren und Flüstergaleriemoden Licht kann in einem kreisförmigen zweidimensionalen Resonator durch wiederholte Reflexionen an der kreisförmigen Grenzfläche eingegrenzt werden. Wie in Abb. 11.24 dargestellt folgt ein Strahl, der sich nach 𝑁 Reflexionen reproduziert, einer Bahn mit der Länge 𝑁 d für einen Umlauf, wobei d = 2𝑎 sin(π∕𝑁) gilt und 𝑎 der Kreisradius ist. Die Resonanzfrequenzen einer Mode werden bestimmt, indem man die Weglänge für einen Umlauf gleich einem ganzzahligen Vielfachen der Wellenlänge setzt, wie in Gl. (11.7) gezeigt. Wenn wir die mit jeder Reflexion verbundene Phasenverschiebung ignorieren, erhalten wir 𝑁 d = 𝑞𝜆 = 𝑞𝑐∕𝜈, d. h. die Resonanzfrequenzen 𝜈𝑞 = 𝑞𝑐∕𝑁 d mit 𝑞 = 1, 2, …. Der Abstand zwischen diesen Frequenzen ist daher 𝜈F = 𝑐∕𝑁 d .
11.3 Zwei- und dreidimensionale Resonatoren
π/N
a
Spiegelresonator
π /N
a
dielektrischer Resonator
Abb. 11.24 Reflexionen in einem kreisförmigen Resonator.
Für 𝑁 = 2 ist 𝜈F = 𝑐∕2d = 𝑐∕4𝑎, was mit (11.5) identisch √ ist. Mit 𝑁 = 3 folgt entsprechend 𝜈F = 𝑐∕3d = 𝑐∕3 3𝑎, was mit dem Ergebnis für den Dreispiegelresonator übereinstimmt (Übung 11-1). Im Grenzfall 𝑁 → ∞ nähert sich der Weglänge 𝑁 d dem Zylinderumfang 2π 𝑎, und der entsprechende Abstand der Resonanzfrequenzen wird 𝜈F =
𝑐 . 2π 𝑎
(11.78)
Die Strahlen schmiegen sich dann an die Innenwand des Resonators und die Reflexion erfolgt nahezu streifend, wie Abb. 11.24 darstellt. Solche optischen Moden heißen Flüstergaleriemoden (engl. whispering-gallery modes). Die optischen Moden verhalten sich hier ähnlich wie akustische Moden in der vertrauten akustischen Flüstergalerie, die ihren Namen der Tatsache verdanken, dass sich selbst ein leises Flüstern entlang der konvexen Oberfläche einer Kirchenkuppel oder einer Galerie über große Entfernungen ausbreiten kann.
Auch andere Querschnitte werden für zweidimensionale Resonatoren genutzt. Zum Beispiel kann der kreisförmige Querschnitt zu einer elliptischen Struktur verformt werden. In einer solchen Anordnung treten BowTie-Moden auf [siehe Abb. 11.7(b)], in denen der Strahl während eines Umlaufs vier Reflexionen an Stellen auf dem Umfang des Resonators erfährt, deren Krümmung mit der herkömmlicher Kugelspiegel in einem konfokalen Resonator übereinstimmt (siehe Abschnitt 11.2.1).
11.3.3 Dreidimensionale rechteckige Hohlraumresonatoren Ein dreidimensionaler Spiegelresonator besteht aus drei Paaren von parallelen Spiegeln, die die Wände eines geschlossenen rechteckigen Gehäuses mit den Abmessungen d 𝑥 , d 𝑦 und d 𝑧 bilden. Die Struktur ist beispielhaft in Abb. 11.25(a) gezeigt. Die Komponenten des Wellenvektors k = (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) in einem solchen Resonator müssen die Bedingungen 𝑘𝑥 = 𝑞𝑥
π d𝑥
,
𝑘𝑦 = 𝑞𝑦
π d𝑦
,
𝑘𝑧 = 𝑞𝑧
π d𝑧
, (11.79)
𝑞𝑥 , 𝑞𝑦 , 𝑞𝑧 = 1, 2, … erfüllen, wobei 𝑞𝑥 , 𝑞𝑦 und 𝑞𝑧 positive ganze Zahlen sind, die die jeweiligen Moden bezeichnen. Jeder Mode q, die durch die drei ganzen Zahlen (𝑞𝑥 , 𝑞𝑦 , 𝑞𝑧 ) charakterisiert wird, ist ein Punkt im (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 )-Raum zugeordnet. Der kz
π
Mode 2
k = 2πν c
π Mode 1
π d d
ky
Mode 3 d kx (a)
Abb. 11.25 (a) Wellen in einem dreidimensionalen kubischen Resonator (d x = d y = d z = d ). (b) Die Endpunkte des Wellenvektors (kx , ky , kz ) der Moden in einem dreidimensionalen Resonator werden durch Punkte gekennzeichnet. Der Wellenzahl k einer Mode ist die Entfernung vom Ursprung
(b)
bis zu dem entsprechenden Punkt. Jeder Punkt im k-Raum nimmt ein Volumen (π∕d )3 ein. Alle Moden mit Frequenzen kleiner 𝜈 liegen innerhalb des positiven Oktanten einer Kugel mit dem Radius k = 2π𝜈∕c.
339
340
11 Resonatoroptik
Abstand zwischen diesen Punkten in einer gegebenen Richtung ist umgekehrt proportional zur Dimension des Resonators in dieser Richtung. Abbildung 11.25(b) illustriert das Konzept des 𝑘-Raums für einen kubischen Resonator mit d 𝑥 = d 𝑦 = d 𝑧 = d . Für die Werte der Wellenzahl 𝑘 und der entsprechenden Resonanzfrequenz 𝜈 gilt 2
𝑘2 = 𝑘𝑥2 + 𝑘𝑦2 + 𝑘𝑧2 = (
2π 𝜈 ) . 𝑐
(11.80)
Die Fläche konstanter Frequenz 𝜈 ist eine Kugel mit dem Radius 𝑘 = 2π 𝜈∕𝑐. Die Resonanzfrequenzen sind durch die Gln. (11.79) und (11.80) gegeben, 𝜈q =
√
2 2 2 𝑞𝑥2 𝜈F𝑥 + 𝑞𝑦2 𝜈F𝑦 + 𝑞𝑧2 𝜈F𝑧 ,
𝑞𝑥 , 𝑞𝑦 , 𝑞𝑧 = 1, 2, … , (11.81)
wobei 𝜈F𝑥 =
𝑐 , 2d 𝑥
𝜈F𝑦 =
𝑐 , 2d 𝑦
𝜈F𝑧 =
𝑐 2d 𝑧
(11.82)
Frequenzabstände sind, die umgekehrt proportional zu den Resonatorabmessungen in 𝑥-, 𝑦- bzw. 𝑧-Richtung sind. Für Resonatoren, deren Dimensionen viel größer sind als eine Wellenlänge, ist der Frequenzabstand viel kleiner als die optische Frequenz. Für d = 1 cm und 𝑛 = 1 ist beispielsweise 𝜈F = 15 GHz. Das gilt jedoch nicht für Mikroresonatoren, wie in Abschnitt 11.4 erläutert wird. Modendichte
Wenn alle Abmessungen des Resonators viel größer sind als eine Wellenlänge, ist der Frequenzabstand 𝜈F = 𝑐∕2d klein, und es ist schwierig, die Moden durchzuzählen. In diesem Fall ist es nützlich, eine kontinuierliche Näherung zu verwenden und das Konzept der Modendichte einzuführen, deren Gültigkeit von dem Verhältnis der betrachteten Bandbreite zum Frequenzabstand zwischen benachbarten Moden abhängt. Die Zahl der Moden im Frequenzintervall zwischen 0 und 𝜈 entspricht der Zahl von Punkten, die im Volumen des positiven Oktanten einer Kugel mit Radius 𝑘 im 𝑘-Diagramm [Abb. 11.25(b)] liegen. Die Zahl der Moden im positiven Oktanten einer Kugel mit Ra1 4 dius 𝑘 ist 2( )( π𝑘3 )∕(π∕d )3 = (𝑘3 ∕3π2 )d 3 . Der Faktor 2 8 3 am Anfang berücksichtigt die beiden möglichen Polarisationen jeder Mode, wohingegen der Nenner (π∕d )3 das Volumen eines Punkts im 𝑘-Raum bezeichnet. Die Zahl der Moden pro Volumeneinheit mit Wellenzahlen zwischen 𝑘 und 𝑘 + Δ𝑘 ist daher durch 𝜌(𝑘)Δ𝑘 = [(d∕ d𝑘)(𝑘3 ∕3π2 )]Δ𝑘 = (𝑘2 ∕π2 )Δ𝑘 gegeben. Interessanterweise ist diese Herleitung identisch mit derjenigen zur Bestimmung der Dichte erlaubter Quantenzustände
ν
(a) (ν)
ν
(b)
Abb. 11.26 (a) Der Frequenzabstand zwischen benachbarten Moden nimmt mit steigender Frequenz ab. (b) Die Modendichte M(𝜈) eines dreidimensionalen optischen Resonators ist eine quadratisch zunehmende Funktion der Frequenz.
von Elektronenwellen, die zwischen ideal reflektierenden Grenzflächen in einem dreidimensionalen Halbleiter eingeschlossen sind [Abschnitt 17.1.3 und Gl. (17.9)]. Wegen 𝑘 = 2π 𝜈∕𝑐 ist die Zahl der Moden zwischen 0 und 𝜈 gleich [(2π 𝜈∕𝑐3 )∕3π2 ]d 3 = (8π 𝜈3 ∕3𝑐3 )d 3 . Die Zahl der Moden im Frequenzintervall zwischen 𝜈 und 𝜈 + Δ𝜈 ist demzufolge (d∕ d𝜈)[(8π 𝜈3 ∕3𝑐3 )d 3 ]Δ𝜈 = (8π 𝜈3 ∕𝑐3 )d 3 Δ𝜈. Die Modendichte M(𝜈), d. h. die Zahl der Moden pro Volumeneinheit des Resonators und pro Einheitsbandbreite bei der Frequenz 𝜈, ist daher 8π 𝜈2 . (11.83) 𝑐3 Diese Gleichung wurde zuerst von Rayleigh und Jeans im Zusammenhang mit dem Spektrum des schwarzen Strahlers hergeleitet (siehe Abschnitt 14.4.2). Der Größe M(𝜈) ist eine quadratisch zunehmende Funktion der Frequenz, sodass die Zahl der Moden innerhalb einer festen Bandbreite Δ𝜈 wie in Abb. 11.26 gezeigt mit der Frequenz 𝜈 zunimmt. Bei 𝜈 = 3 × 1014 Hz (𝜆0 = 1 μm) ist M(𝜈) = 0.08 Moden∕(cm3 Hz). Innerhalb eines Frequenzbands der Breite 1 GHz gibt es daher ≈ 8 × 107 Moden pro Kubikzentimeter. Die Zahl der Moden pro Volumeneinheit innerhalb eines beliebigen Frequenzinter𝜈 valls 𝜈1 < 𝜈 < 𝜈2 ist durch das Integral ∫𝜈12 M(𝜈) d𝜈 gegeben. Wir haben die Modendichte in zwei und drei Dimensionen auf der Grundlage von quadratischen und kubischen Anordnungen hergeleitet. Die Ergebnisse gelten aber trotzdem für beliebige Anordnungen, sofern die Abmessungen des Resonators groß gegen die Wellenlänge sind. M(𝜈) =
11.4 Mikro- und Nanoresonatoren Mikroresonatoren sind Resonatoren, in denen eine oder mehrere der räumlichen Abmessungen in der Größenordnung der Wellenlänge des Lichts liegen. Der Aus-
11.4 Mikro- und Nanoresonatoren
Tab. 11.1 Normierte Modenvolumina V ∕𝜆3 und Gütefaktoren Q für verschiedene Mikroresonatoren.
𝑉∕𝜆3 𝑄
Mikrosäule
Mikrodisk
Mikrotorus
Mikrokugel
Photonischer Kristall
5
5
103
103
1
103
104
108
1010
104
druck Mikrohohlraumresonator oder kurz Mikrohohlraum oder Mikrokavität wird gewöhnlich nur für Mikroresonatoren verwendet, bei denen alle Abmessungen klein sind, sodass die Moden in allen Richtungen im 𝑘-Raum in großen Abständen liegen und nur wenige Resonanzfrequenzen existieren. Häufig werden beide Begriffe aber auch synonym verwendet. Das Fehlen von Resonanzmoden über ausgedehnte Spektralbereiche kann die Emission von Licht aus Quellen innerhalb einer Mikrokavität verhindern. Gleichzeitig kann die Emission in spezielle Moden eines kleinen Mikrohohlraums mit hohem 𝑄 im Vergleich zur Emission in normale optische Moden verstärkt sein, wie in Abschnitt 14.3.5 beschrieben wird. Beide Effekte können beim Betrieb von Hohlraumresonator-LED und Mikroresonatorlasern wichtig sein (siehe Abschnitt 18.4.2). Mikroresonatoren können aus dielektrischen Materialien hergestellt werden; häufige Bauformen sind z. B. (i) Mikrosäulen aus Braggreflektoren, (ii) Mikrodisks und Mikrokugeln, in denen Licht in der Nähe der Oberfläche in Flüstergaleriemoden reflektiert wird, (iii) Mikrotoroide, die kleinen Faserringen ähneln, und (iv) zweidimensionale photonische Kristalle mit lichteinfangenden Defekten, die als Mikrohohlräume wirken. Die wesentlichen Ziele bei der Entwicklung dieser Bauelemente sind • Die Verringerung des Modenvolumens 𝑉, das als Integral der auf ihren Maximalwert normierten optischen 1 2 Energiedichte 𝜀𝓔 der Mode über den Raum defi2 niert ist. • Die Erhöhung des Gütefaktors 𝑄. Der räumliche Einschluss kann durch die Konstruktion von Mikroresonatoren mit speziellen Geometrien optimiert werden, während zur Verbesserung des zeitlichen Einschlusses verlustarme Materialien und Anordnungen entscheidend sind. Typische Modenvolumina und Gütefaktoren für diese Strukturen sind in Tabelle 11.1 zusammengefasst. Eine genaue Analyse der Resonatormoden von dielektrischen Mikroresonatoren erfordert den Einsatz der vollständigen elektromagnetischen Theorie. Dazu müssen die Helmholtzgleichung in einem zur Geometrie
der Struktur passenden Koordinatensystem gelöst und die elektrischen und magnetischen Felder an den ebenen, zylindrischen oder sphärischen Grenzflächen an geeignete Randbedingungen angepasst werden. Die Lösung liefert die Resonanzfrequenzen der Moden und ihre räumlichen Verteilungen, aus denen das Modenvolumen für jede Mode berechnet werden kann. Da die Analyse für alle praktisch relevanten Geometrien sehr komplex ist, sind häufig numerische Lösungen erforderlich. Im folgenden Abschnitt beschreiben wir einige der Eigenschaften eines einfachen rechteckigen (Kasten-) Mikroresonators, dessen Wände aus idealen Spiegeln bestehen. Eine einfache Analyse der Moden einer derartigen Struktur liefert die Resonanzfrequenzen und die Raumverteilungen der Moden. Mikroresonatoren mit hohem 𝑄 verwenden wegen ihrer relativ hohen Verluste normalerweise keine Spiegel und die Kastenstruktur gehört auch nicht zu den praktisch genutzten Geometrien für Mikroresonatoren. Trotzdem ist die Analyse nützlich, um die Beziehung zwischen den Resonanzfrequenzen und den Abmessungen des Resonators zu klären und die Frequenzabhängigkeit der Modendichte für Kästen mit unterschiedlichen Achsenverhältnissen zu illustrieren.
11.4.1 Rechteckige Mikroresonatoren Die einfachste Mikroresonatorstruktur ist ein rechteckiger Kasten aus ebenen parallelen Spiegeln. Die Moden sind dann sinusförmige stehende Wellen in allen drei Raumrichtungen, und die Resonanzfrequenzen sind durch Gl. (11.81) gegeben. Wenn die Abmessungen des Gehäuses klein sind, liegen nur die Moden der niedrigsten Ordnungen innerhalb des optischen Bands. Für einen kubischen Resonator sind die Resonanzfrequenzen in Tabelle 11.2 in Einheiten von 𝜈F = 𝑐∕2d angegeben. Für d = 1 μm und einen Brechungsindex des Mediums von 𝑛 = 1.5 ist beispielsweise 𝜈F = 100 THz. Die Frequenzen der Moden niedrigster Ordnung entsprechen dann den Vakuumwellenlängen 𝜆0 = 2.13, 1.73, 1.34, 1.22, 1.06, 1.00 und 0.87 μm. Wenn die Abmessungen des Resonators teilweise groß und teilweise klein sind, z. B. ein Kasten mit einem großen Seitenverhältnis, liegen die Moden an den Punkten eines anisotropen Rasters im 𝑘-Raum [siehe Abb. 11.25(b)]. Das Raster ist in Richtung der großen Seitenlängen fein und in Richtung der kleinen Seitenlängen grob unterteilt. Beim Zählen der Moden ist dann nur in der Richtung eine kontinuierliche Näherung zulässig, in der das Raster eng ist. Die resultierende Modendichte ist in Abb. 11.27 für verschiedene Fälle gezeigt.
341
11 Resonatoroptik
Tab. 11.2 Resonanzfrequenzen der Moden niedrigster Ordnung eines kubischen Mikrohohlraumresonators. Mode (𝑞𝑥 𝑞𝑦 𝑞𝑧 )a) Frequenz/𝜈F
(011)(3)
(111)(1)
(012)(6)
(112)(3)
(022)(3)
(122)(3)
(222)(1)
1.41
1.73
2.24
2.45
2.83
3
3.46
a) Exponenten in Klammern geben die Entartung der Mode an, d. h. die Zahl von Moden derselben Resonanzfrequenz. Z. B. haben die drei Moden (011), (101) und (110) alle dieselbe Resonanzfrequenz von 1.41𝜈F .
z
z
z
y
y
ds
(ν)
2νF
ν
3νF
0
νF
2νF
(a)
3νF
ν
0
(b)
DBR
Abb. 11.27 Modendichte M (𝜈) für rechteckige Mikroresonatoren mit (a) einer, (b) zwei und (c) drei Seiten mit einer kleinen Länge d S ≪ d . Der zu der kleinen Seite gehörende Frequenzabstand ist 𝜈F = c∕2d S . Wenn alle Seiten klein sind wie in (c), sind die Resonanzfrequenzen diskret, und ihre Werte sind die in Tabelle 11.2 für den kubischen Mikrohohlraumresonator angegebenen. Das in (b) gezeigte Resultat entspricht einer Kombination von diskreten Moden eines
νF
2νF
3νF
(222)
(12, 21) (22) (30, 03)
(20, 02)
(11)
(10, 01)
(3) (2) νF
y
s
(1) 0
ds
s
(ν)
(ν)
ds
(110, 101, 011) (111) (120, 102, 021, 012, 210, 201) (121, 112, 211) (220, 202, 022) (122, 212, 221)
x
x
(31, 13)
s
x
ν
(c)
zweidimensionalen Mikroresonators und kontinuierlichen Moden eines großen eindimensionalen Resonators mit einer konstanten Modendichte [siehe Gl. (11.10)]. Das Ergebnis in (a) illustriert eine Kombination von diskreten Moden eines eindimensionalen Mikroresonators und eines Kontinuums von Moden eines großen zweidimensionalen Resonators mit einer Modendichte proportional zur Frequenz [siehe Gl. (11.77)].
Siliciumdioxidtorus Scheibe
(a) Mikrosäule
Siliciumstütze
Siliciumsubstrat
DBR
342
(b) Mikrodisk
(c) Mikrotorus
Abb. 11.28 Mikrosäulen-, Mikrodisk- und Mikroringresonatoren.
11.4.2 Mikrosäulen-, Mikrodiskund Mikroringresonatoren Dielektrische Mikroresonatoren werden in mehreren Bauformen hergestellt, beispielsweise Mikrosäulen, Mikrodisks oder Mikroringe, die in Abb. 11.28 dargestellt sind. Das Licht wird in diesen Strukturen durch Totalreflexion eingeschlossen (siehe Abb. 11.24). Der Mikrosäulenresonator ist ein Zylinder aus einem Material mit hohem Brechungsindex zwischen di-
elektrischen Schichten, die aus Braggreflektoren (DBR, engl. distributed Bragg reflectors) bestehen, wie Abb. 11.28(a) schematisch zeigt. In axialer Richtung wird Licht durch die Reflexion an den Braggreflektoren eingegrenzt, genau wie in einem Fabry-Pérot-Resonator; in transversaler Richtung wird das Licht durch Totalreflexion an den Wänden des Zylinders eingegrenzt. Mikrosäulen werden normalerweise durch herkömmliche lithographische und Ätzverfahren aus Verbindungshalbleitern hergestellt; die Braggreflektoren bestehen
11.4 Mikro- und Nanoresonatoren
meist aus AlAs/GaAs oder AlGaAs/GaAs. Die Säule selbst kann eine aktive Region wie z. B. eine Mehrfachquantenschichtstruktur enthalten, die eine optische Verstärkung bewirkt, wenn sie gepumpt wird (siehe Abschnitt 18.4). Der in Abb. 11.28(b) gezeigte Mikrodiskresonator ist ein kreisförmiger Resonator, in dem sich Licht in Flüstergaleriemoden mit nahezu streifendem Einfall ausbreitet und durch Totalreflexion an der kreisförmigen Grenzfläche eingegrenzt wird (siehe Abschnitt 11.3.2). Die Abmessungen von Mikrosäulen und Mikrodisks liegen meist im Bereich von einigen μm bis zu einigen zehn μm, und ihre Gütefaktoren 𝑄 sind wesentlich größer als die von Spiegelresonatoren, da ihre Verluste wesentlich geringer sind (siehe Tabelle 11.1). Mikrodiskresonatoren aus Halbleitermaterialien werden wegen ihrer vorteilhaften Eigenschaften häufig als Mikrodisklaser eingesetzt (siehe Abschnitt 18.5.2). Der in Abb. 11.28(c) dargestellte dielektrische Mikrotorusresonator ähnelt in vieler Hinsicht einem Faserringresonator, in dem die Resonatormoden kreisförmig geführte Wellen sind. Diese Mikroresonatoren werden gewöhnlich aus Siliciumdioxid hergestellt und über Siliciumstützen auf einen Siliciumchip aufgebracht. Der Torus wird durch die Oberflächenspannung des geschmolzenen Materials während der Herstellung erzeugt; die äußere Oberfläche ist dadurch auf atomarer Skala glatt und zeigt wesentlich geringere Streuverluste als ein Mikrodiskresonator. Hochintegrierte Mikrotorusresonatoren auf Siliciumbasis erreichen außergewöhnlich hohe Gütefaktoren 𝑄 > 108 (siehe Tabelle 11.1).
11.4.3 Mikrokugeln Dielektrische Mikrokugeln werden als dreidimensionale optische Mikroresonatoren verwendet. Bestimmte Moden werden auf Trajektorien (Bahnen) in der Nähe eines Großkreises der Kugel eingegrenzt, was zu sogenannten Flüstergaleriemoden führt. Die Moden einer dielektrischen Kugel können bestimmt werden, indem die Helmholtzgleichung (5.57) für die Vektoren des elektrischen und des Magnetfelds zusammen mit den passenden Randbedingungen gelöst werden. Diese Moden ähneln wegen der Kugelsymmetrie beider Probleme den Wellenfunktionen eines Elektrons in einem Wasserstoffatom (siehe Abschnitt 14.1.1), aber es gibt auch Unterschiede, die mit der vektoriellen Natur des elektromagnetischen Feldes zusammenhängen. Die elektrischen und magnetischen Vektorfelder sind direkt mit einer skalaren Potentialfunktion 𝑈 verknüpft,
die die Helmholtzgleichung 1) erfüllt. Für eine Kugel mit dem Radius 𝑎 und dem Brechungsindex 𝑛 in Luft erhalten wir durch Trennung der Variablen in Kugelkoordinaten (𝑟, 𝜃, 𝜙) eine Lösung der Form √ 𝓁 𝑈(𝑟, 𝜃, 𝜙) ∝ 𝑟𝐽𝓁+1∕2 (𝑛𝑘0 𝑟)𝑃m (cos 𝜃) exp(±im𝜙) , 𝑟≤𝑎, (11.84) √ (1) 𝓁 ∝ 𝑟ℋ𝓁+1∕2 (𝑛𝑘0 𝑟)𝑃m (cos 𝜃) exp(±im𝜙) , 𝑟>𝑎,
(11.85)
wobei 𝐽𝓁 (⋅) die Besselfunktion erster Art der Ordnung 𝓁 (1) ist, ℋ𝓁 (⋅) die Hankelfunktion erster Art der Ordnung 𝓁, 𝓁 𝑃m (⋅) die assoziierte Legendrefunktion und m und 𝓁 natürliche Zahlen. Die Randbedingungen bei 𝑟 = 𝑎 ergeben eine charakteristische Gleichung, die einen diskreten Satz von Werten für 𝑘0 liefern, die den Resonanzfrequenzen entsprechen. Diese werden durch eine dritte ganze Zahl n indiziert. Außerdem gibt es zwei Polarisationsmoden – eine E-Mode, für die 𝐻𝑟 = 0, und eine HMode, für die 𝐸𝑟 = 0 gilt. Die Moden sind im Allgemeinen oszillierende Funktionen von 𝑟, 𝜃 und 𝜙, die durch die radialen, polaren und azimutalen Modenindizes n, 𝓁 und m charakterisiert werden. Es gibt n Maxima in radialer Richtung innerhalb der Kugel. Die Zahl der Maxima des Feldes in azimutaler Richtung ist 2𝓁, während die Zahl der Maxima in polarer Richtung (zwischen den beiden Polen) 𝓁 − m + 1 beträgt. Die Grundmode (n = 1, m = 𝓁) besitzt innerhalb der Kugel einen einzelnen Peak in radialer Richtung und einen einzelnen Peak in polarer Richtung bei 𝜃 = π∕2. Für große m = 𝓁 werden die Moden stark in der Region des 𝓁 Äquators eingegrenzt, da 𝑃𝓁𝓁 (cos 𝜃) ≈ sin 𝜃 bei Winkeln neben 𝜃 = π∕2 schnell verschwindet, und 𝐽𝓁 (n𝑘0 𝑟) abgesehen von einem scharfen Peak nahe 𝑟 = 𝑎 überall innerhalb der Kugel sehr klein ist. Die Mode beschreibt daher einen optischen Strahl, der sich wie in Abb. 11.29(a) illustriert entlang des Äquators ausbreitet, ganz ähnlich wie die Flüstergaleriemoden des Scheibenresonators in Abb. 11.24. Für hinreichend große 𝓁 = m sind die Resonanzfrequenzen dieser Moden näherungsweise gleich 𝜈𝓁 ≈ 𝓁𝑐∕2π𝑎. Das ist zu erwarten, da die Winkelzahl 𝓁 der Moden ungefähr gleich der Zahl von Wellenlängen ist, die der optischen Länge des Äquators entsprechen. Die Flüstergaleriemode kann aus einem strahlenoptischen Blickwinkel durch quasi-ebene Wellen mit Wellenvektoren beschrieben werden, die parallel zu den lokalen Strahlen sind (siehe Abschnitt 2.3 und Abb. 10.16) 1) Für eine ausführliche mathematische Beschreibung siehe z. B. A. N. Oraevsky, ‚Whispering-Gallery Waves‘, Kvantovaya Elektronika (Quantum Electronics) 32, 377, 2002.
343
344
11 Resonatoroptik
Abb. 11.29 (a) Flüstergaleriemode in einem Mikrokugelresonator. (b) Strahlmodell der Flüstergaleriemode.
θ r ϕ
π/2
θ
(a)
a
r
Mikrokugel
Faser
Abb. 11.30 Einkoppeln von optischer Leistung aus einer optischen Faser in einen Mikrokugelresonator.
und in der Nähe des Äquators im Zickzack laufen, wie Abb. 11.29(b) √ gezeigt. Der Wellenvektor k hat den Betrag 𝑘 = 𝓁(𝓁 + 1)∕𝑎 und die azimutale Komponente 𝑘𝜙 = m∕𝑎. Der Neigungswinkel der Zickzackstrahlen ist √ für die Grundmode m = 𝓁 am kleinsten (≈ 1∕ 𝓁), während die Mode m = 0 eine Neigung von 90◦ hat. Mikrokugeln aus verlustarmem Quarzglas werden als optische Resonatoren mit ultrahohen Werten von 𝑄 verwendet. Wie bei dem in Abb. 11.28(c) gezeigten Torusresonator wird auch in diesem Fall die Form und die Oberflächenstruktur der Kugel durch die Oberflächenspannung im geschmolzenen Zustand während der Herstellung bestimmt; das Ergebnis ist eine Oberfläche von nahezu atomarer Perfektion. Die reduzierten Streuverluste an der Oberfläche führen zu bemerkenswert hohen Gütefaktoren, 𝑄 > 1010 (siehe Tabelle 11.1). Optische Leistung kann über eine optische Faser in die Kugel eingekoppelt werden, deren Mantel wie in Abb. 11.30 dargestellt lokal entfernt wird.
11.4.4 Mikroresonatoren aus photonischen Kristallen Wie in Kapitel 7 beschrieben sind photonische Kristalle periodische dielektrische Strukturen, die photonische Bandlücken besitzen, d. h. Spektralbereiche, innerhalb derer sich kein Licht ausbreiten kann. Ein BraggGitterreflektor (BGR) ist ein Beispiel eines eindimensionalen photonischen Kristalls, der als Reflektor für
(b)
Frequenzen innerhalb einer photonischen Bandlücke wirkt. Beispielsweise werden in dem in Abb. 11.28(a) gezeigten Mikrosäulenresonator Braggreflektoren anstelle von Spiegeln verwendet. Wenn die Höhe des Mikroresonators gleich einer oder einigen wenigen Perioden des Gitterreflektors ist, wie in Abb. 11.31(a) illustriert, kann die Struktur auch als ein ausgedehnter photonischer Kristall aufgefasst werden, in dem der Hohlraum als Defekt in der Kristallstruktur wirkt. Der Resonator wird dann ein photonischer Kristallresonator genannt. Dieses Konzept ist auch auf zweidimensionale photonische Kristalle anwendbar. Wie in Abb. 11.31(b) schematisch dargestellt ist, ist ein Defekt in der zweidimensionalen periodischen Kristallstruktur eine lokale Veränderung wie z. B. ein fehlendes Loch in einer periodischen Reihe von Luftlöchern in einer Platte. Für Wellenlängen in der Bandlücke des photonischen Kristalls ist in der periodischen Struktur in der Umgebung des Defekts keine Lichtausbreitung möglich, sodass das Licht innerhalb des Defekts gefangen ist, ganz ähnlich wie Elektronen oder Löcher an Defekten in einem Halbleiterkristall lokalisiert werden. Der Defekt wirkt dann als Mikrohohlraumresonator. Anders gesagt erzeugt der Defekt neue Resonanzfrequenzen innerhalb der Bandlücke, die optischen Moden mit räumlichen Verteilungen im Bereich des Mikrohohlraums entsprechen und im umgebenden photonischen Kristall schnell abklingen. Zweidimensionale photonische Kristalle werden durch Elektronenstrahllithographie oder reaktives Ionenätzen in Halbleitermaterialien hergestellt. Mikrohohlräume mit Abmessungen von etwa einer Periode des photonischen Kristalls, die in der Größenordnung der Lichtwellenlänge liegen kann, erlauben Modenvolumina bis hinunter zu 𝜆 3 . Im Vergleich mit anderen Techniken haben Mikrohohlräume aus photonischen Kristallen das kleinste Modenvolumen (siehe Tabelle 11.1). Der Gütefaktor 𝑄 kann bis zu 104 betragen. Aufgrund dieser Eigenschaften kommen Resonatoren
11.4 Mikro- und Nanoresonatoren
photonischer Kristall Mikrohohlraum
(a)
Mikrohohlraum photonischer Kristall
(b)
Abb. 11.31 Mikroresonatoren aus photonischen Kristallen. (a) Der Mikrosäulenresonator als eindimensionaler photonischer Kristall, in dem der Mikroresonator als Defekt wirkt. (b) Ein zweidimensionaler Resonator aus einem photoni-
schen Kristall kann hergestellt werden, indem man an den Punkten eines planaren hexagonalen Gitters Löcher in eine dielektrische Platte bohrt; ein fehlendes Loch dient als Mikrohohlraum.
auf der Grundlage von photonischen Kristallen häufig in Mikrohohlraumlasern zum Einsatz (Abschnitt 18.5.3).
gegengesetzte Grenzfall – metallische Strukturen, deren Abmessungen viel kleiner als die Resonanzwellenlänge sind – ist mithilfe elektrischer Spannungen und Ströme gut zu beschreiben. Die entscheidenden Größen sind hier lokalisierte elektrische Bauteile wie Induktivitäten und Kondensatoren, wie sie in der elektrotechnischen Literatur zu finden sind. So beträgt, um ein Beispiel zu nennen, die Resonanzfrequenz des in Abb.√11.2 dargestellten elektronischen Resonators 𝜔0 = 1∕ 𝐿𝐶. Dagegen stellen metallische Strukturen mit Abmessungen in der Größenordnung der Resonanzwellenlänge die größte Herausforderung bei der Beschreibung dar, da die Analyse dann in der Regel sowohl Spannungen und Ströme als auch die Felder umfassen muss.
11.4.5 Plasmonische Resonatoren: Metallische Nanodisks und Nanokugeln Bei Mikrowellen- und Radiofrequenzen werden metallische elektromagnetische Resonatoren routinemäßig verwendet. Wie Abb. 11.2 zeigt, besitzen Mikrowellenresonatoren Abmessungen, die nahe an der Resonanzwellenlänge (einige cm) liegen, wohingegen die Abmessungen von Radiofrequenzresonatoren, die aus metallischen Kondensatoren und Induktivitäten bestehen, im Bereich einiger cm liegen und somit sehr viel kleiner als ihre Resonanzwellenlängen (m) sind. Plasmonische Resonatoren enthalten metallische Strukturen mit Abmessungen im Subwellenlängenbereich, die auf Oberflächenplasmonpolaritonen (OPPWellen) oder lokalisierten Oberflächenplasmonen (LOP-Wellen) bei optischen Frequenzen an ihren Grenzflächen zu dielektrischen Medien beruhen (siehe Abschnitt 8.2.2 bzw. 8.2.3). Sie können die Form von Nanodisks, Nanokugeln oder anderen Nanoteilchen haben. Ihre Abmessungen (≈ 10 nm) können viel kleiner sein als die Resonanzwellenlänge (≈ μm), während sie trotzdem ein Verhältnis der Abmessungen zur Wellenlänge (≈ 10−2 ) besitzen, das dem des in Abb. 11.2 dargestellten elektronischen Radiofrequenzresonators nicht unähnlich ist. Die mathematische Beschreibung von Strukturen, deren Abmessungen viel größer als die Resonanzwellenlänge sind, wie beispielsweise von Resonatoren mit großen Spiegeln, ist auf der Grundlage der elektromagnetischen Optik einfach zu bewerkstelligen. Dabei sind die elektrischen und magnetischen Felder von entscheidender Bedeutung, und genau diesen Größen begegnen wir üblicherweise in der optischen Literatur. Auch der ent-
Metallische Nanoplatte
In einem metallischen Zylinder mit einem dielektrischen Material im Inneren können photonische (Licht-) Flüstergaleriemoden auftreten, die an der metallischen Grenzfläche reflektiert werden wie in Abb. 11.32(a). In einem solchen Diskresonator können aber auch plasmonische Moden in Form von OPP-Wellen (Abschnitt 8.2.2) an der inneren Grenzfläche existieren, wie Abb. 11.32(b) zeigt. Dieses innere optische Feld der plasmonischen Mode ist stärker auf die Umgebung der Grenzfläche eingegrenzt als das Feld der photonischen Mode. Da die plasmonische Welle außerdem tiefer in das Metall eindringt als die photonische Mode, erfährt sie größere Verluste und der Gütefaktor 𝑄 des Resonators ist kleiner. In einem dielektrischen Scheibenresonator (Abschnitt 11.3.2) treten im Gegensatz dazu Flüstergaleriemoden mit evaneszenten optischen Feldern auf, die sich in das umgebende dielektrische Medium erstrecken, wie Abb. 11.32(c) zeigt. Für eine plasmonische Mode in einem Metall/Dielektrikum-Diskresonator mit einem Durchmesser von 100 nm liegen typische Werte des normierten Modenvo-
345
346
11 Resonatoroptik
(a)
(b)
(c)
Abb. 11.32 Schematische Darstellung der optischen Feldverteilungen in Diskresonatoren. (a) Eine photonische Mode in einer Scheibe aus Metall und Dielektrikum: Das Licht wird durch mehrfache Reflexion an der metallischen Grenzfläche im Inneren eingeschlossen. (b) Eine plasmonische Mode in
einer Scheibe aus Metall und Dielektrikum: Eine OPP-Welle breitet sich entlang der inneren Grenzfläche aus. (c) Eine photonische Mode in einer dielektrischen Scheibe: Das Licht wird durch Totalreflexion an der Grenzfläche eingeschlossen.
lumens und des Gütefaktors bei 𝑉∕𝜆 3 ∼ 10−4 bzw. 𝑄 ∼ 10. 2) Diese Werte liegen wesentlich unter denen für Mikroresonatoren aus photonischen Kristallen (siehe Tabelle 11.1); trotzdem werden solche Strukturen in OPPDisk- und Ring-Nanolasern eingesetzt (Abschnitt 18.6).
den Resonator eingebracht und geringfügig verkippt, damit das an ihr reflektierte Licht die Spiegel nicht mehr erreicht. Bestimmen Sie den Abstand zwischen den Resonanzfrequenzen des Resonators. Aufgabe 11-2: Spiegellose Resonatoren
Metallische Nanokugeln
Wie in Abschnitt 8.2.3 beschrieben wurde, können in metallischen Nanokugeln, die in einem dielektrischen Medium eingebettet sind, resonante lokalisierte Oberflächenplasmon-Oszillationen auftreten. Wenn eine optische Welle auf eine solche Nanokugel trifft, werden sowohl das gestreute Feld als auch das innere Feld bei Frequenzen in der Nähe der Resonanz wesentlich verstärkt. Diese Verstärkung des Feldes geht mit einer räumlichen Lokalisierung von Energie im Nanometermaßstab einher, sodass die Nanokugel als Nanoresonator dient. Da Metalle jedoch relativ große Verluste aufweisen, ist der Gütefaktor 𝑄 eines solchen Resonators wesentlich kleiner als der von dielektrischen Resonatoren. Dennoch kann eine in ein spezielles dielektrisches Medium eingebettete Metall-Nanokugel als Nanolaser auf der Basis lokalisierter Oberflächenplasmonen dienen (siehe Abschnitt 18.6).
Aufgaben Aufgabe 11-1: Resonanzfrequenzen eines Resonators mit einem Etalon
(a) Bestimmen Sie den Abstand zwischen benachbarten Resonanzfrequenzen in einem Resonator aus zwei parallelen ebenen Spiegeln in einem Abstand d = 15 cm in Luft (𝑛 = 1). (b) Eine transparente Platte der Dicke d 1 = 2.5 cm mit dem Brechungsindex 𝑛 = 1.5 wird in 2) Siehe beispielsweise M. Kuttge, F. Javier Garcia de Abajo, A. Polman, ‚Ultrasmall Mode Volume Plasmonic Nanodisk Resonators‘, Nano Letters 10, 1537–1541, 2010.
Halbleiterlaser werden häufig aus Kristallen hergestellt, deren Oberflächen entlang der Kristallebenen geschnitten sind. Diese Oberflächen wirken als Reflektoren und dienen als Resonatorspiegel. Ein Ausdruck für den Intensitätsreflexionsgrad ist in Gl. (6.41) angegeben. Betrachten Sie einen Kristall in Luft (𝑛 = 1), dessen Brechungsindex 𝑛 = 3.6 und dessen Verlustkoeffizient 𝛼S = 1 cm−1 ist. Das Licht wird zwischen zwei parallelen Oberflächen im Abstand d = 0.2 mm reflektiert. Bestimmen Sie den Abstand zwischen der Resonanzfrequenz 𝜈F , den Koeffizienten 𝛼R des gesamten verteilten Verlusts, die Finesse ℱ, die spektrale Breite δ𝜈 und den Gütefaktor 𝑄. Nehmen Sie an, dass die Vakuumwellenlänge des erzeugten Lichts 1.55 μm ist und schätzen Sie die Zahl 𝑞 der longitudinalen Moden ab. Aufgabe 11-3: Fabry-Pérot-Etalon mit Bragg-Gitterreflektoren
Ein Fabry-Pérot-Etalon kann wie in Aufgabe 7-7 beschrieben aus einer GaAs-Schicht zwischen zwei BGR aus GaAs/AlAs hergestellt werden. Bestimmen Sie die Finesse ℱ des Resonators und seinen Gütefaktor 𝑄. Bestimmen Sie die Transmission eines Braggreflektors aus 𝑁 = 10 alternierenden Schichten von GaAs (𝑛1 = 3.6) und AlAs (𝑛2 = 3.2) mit den Dicken d 1 und d 2 , die gleich einer viertel Wellenlänge im jeweiligen Medium sind. Nehmen Sie an, dass das Licht aus einem ausgedehnten GaAs-Medium einfällt. Aufgabe 11-4: Abklingdauer der optischen Energie
Wie lange dauert es, bis die in einem Resonator mit der Finesse ℱ = 100, der Länge d = 50 cm und dem Bre-
Aufgaben
chungsindex 𝑛 = 1 gespeicherte optische Energie auf die Hälfte ihres Anfangswerts abklingt?
gungen an zwei idealen Spiegeln, die so aufgestellt sind, dass sie mit den Wellenfronten zusammenfallen, und leiten Sie die Resonanzfrequenzen Gl. (11.67) her.
Aufgabe 11-5: Stabilität von Kugelspiegelresonatoren
(a) Kann ein Resonator mit zwei konvexen Spiegeln stabil sein? (b) Kann ein Resonator mit einem konvexem und einem konkaven Spiegel stabil sein? Aufgabe 11-6: Resonator aus ebenen Spiegeln und einer Linse In einem Resonator aus ebenen Spiegeln im Abstand d befindet sich in einer Entfernung d ∕2 von jedem der
Spiegel eine Linse mit der Brennweite 𝑓. (a) Bestimmen Sie die Strahltransfermatrix für einen Strahl, der an einem der Spiegel startet und einen Umlauf im Resonator vollendet. (b) Geben Sie die Stabilitätsbedingung des Resonators an. (c) Skizzieren Sie den Gaußstrahl dieses Resonators unter stabilen Bedingungen. Aufgabe 11-7: Selbstreproduzierende Strahlen in einem symmetrischen Resonator
Betrachten Sie einen symmetrischen Resonator aus zwei konkaven Spiegeln mit dem Radius 𝑅 in einem Abstand d = 3|𝑅|∕2. Nach wie vielen Umläufen durch den Resonator verläuft der Strahl wieder auf seinem alten Weg? Aufgabe 11-8: Strahlposition in instabilen Resonatoren
Zeigen Sie, dass die Strahlposition nach 𝑚 Umläufen in einem instabilen Resonator durch 𝑦𝑚 = 𝛼1 ℎ1𝑚 + 𝛼2 ℎ2𝑚 gegeben √ ist, wobei 𝛼1 und√𝛼2 Konstanten sind. Es gilt ℎ1 = 𝑏 + 𝑏2 − 1, ℎ2 = 𝑏 − 𝑏2 − 1 und 𝑏 = 2(1 + d ∕𝑅1 )(1 + d ∕𝑅2 ) − 1. Hinweis: Verwenden Sie die Ergebnisse aus Abschnitt 1.4. Aufgabe 11-9: Strahlposition in instabilen symmetrischen Resonatoren
Verifizieren Sie, dass ein symmetrischer Resonator aus zwei konkaven Spiegeln mit den Radien 𝑅 = −30 cm in einem Abstand d = 65 cm instabil ist. Bestimmen Sie die Position 𝑦1 eines Strahls, der an einem der Spiegel am Ort 𝑦0 = 0 mit einem Winkel 𝜃0 = 0.1◦ beginnt, nach einem Umlauf durch den Resonator. Nach wie vielen Umläufen verlässt der Strahl den Resonator, wenn die Spiegel Durchmesser von 5 cm haben? Tragen Sie 𝑦𝑚 für 𝑚 = 2, 3, … für d = 50 cm und d = 65 cm auf. Sie können die Ergebnisse aus Aufgabe 11-8 benutzen. Aufgabe 11-10: Stehende Gaußwellen
Betrachten Sie eine Welle, die als Überlagerung zweier identischer Gaußstrahlen entsteht, die sich in +𝑧- und −𝑧-Richtung ausbreiten. Zeigen Sie, dass das Ergebnis eine stehende Welle ist. Verwenden Sie die Randbedin-
Aufgabe 11-11: Gaußstrahl in einem symmetrischen konfokalen Resonator
Ein symmetrischer konfokaler Resonator mit einem Spiegelabstand von d = 16 cm, Spiegelreflexionsgraden von 0.995 und 𝑛 = 1 wird in einem bei 𝜆0 = 1 μm betriebenen Laser verwendet. (a) Bestimmen Sie die Krümmungsradien der Spiegel. (b) Bestimmen Sie die Taille der (Gauß-) Mode (0, 0). (c) Skizzieren Sie die Intensitätsverteilung der (1, 0)-Moden an einem der Spiegel und bestimmen Sie den Abstand zwischen ihren beiden Peaks. (d) Bestimmen Sie die Resonanzfrequenzen der (0, 0)- und (1, 0)-Moden. (e) Nehmen Sie an, dass Verluste nur durch unvollständige Reflexion an den Spiegeln entstehen, und bestimmen Sie den Koeffizienten 𝛼R der verteilten Resonatorverluste. Aufgabe 11-12: Beugungsverluste in einem symmetrischen konfokalen Resonator
Abbildung 11.21 zeigt den prozentualen Beugungsverlust pro Umlauf für verschiedene Moden niedriger Ordnung eines symmetrischen konfokalen Resonators als Funktion der Fresnelzahl 𝑁F = 𝑎2 ∕𝜆 d (wobei d der Spiegelabstand ist und 𝑎 der Radius der Spiegel). Verwenden Sie die in Aufgabe 11-11 angegebenen Parameter und bestimmen Sie den Spiegelradius, für den der Verlust der (1, 0)-Mode pro Umlauf gleich 1 % ist. Aufgabe 11-13: Die Zahl der Moden in Resonatoren mit verschiedenen Abmessungen
Betrachten Sie Licht der Wellenlänge 𝜆0 = 1.06 μm und der spektralen Breite Δ𝜈 = 120 GHz. Wie viele Moden haben in den folgenden Resonatoren Frequenzen innerhalb dieser Linienbreite (𝑛 = 1): (a) Ein eindimensionaler Resonator der Länge d = 10 cm? (b) Ein zweidimensionaler Resonator der Fläche 10 cm × 10 cm? (c) Ein dreidimensionaler Resonator mit den Abmessungen 10 cm × 10 cm × 10 cm?
347
348
11 Resonatoroptik
Weiterführende Literatur Bücher
Siehe auch die in Kapitel 16 aufgeführten Bücher über Laser A. H. W. Choi (Hrsg.), Handbook of Optical Microcavities, CRC Press/Taylor & Francis 2015. J. Heebner, R. Grover, T. A. Ibrahim, Optical Microresonators: Theory, Fabrication, and Applications, Springer 2008, Paperback 2010. A. V. Kavokin, J. J. Baumberg, G. Malpuech, F. P Laussy, Microcavities, Oxford University Press 2007. D. G. Rabus, Integrated Ring Resonators: The Compendium, Springer 2007. N. Hodgson, H. Weber, Laser Resonators and Beam Propagation: Fundamentals, Advanced Concepts and Applications, Springer, 2. Aufl. 2005. K. J. Vahala (Hrsg.), Optical Microcavities, World Scientific 2004. K. Stali¯unas, V. J. Sánchez-Morcillo, Transverse Patterns in Nonlinear Optical Resonators, Springer 2003. A. N. Oraevskiy, Gaussian Beams and Optical Resonators, Nova Science 1996. Yu. Anan’ev, Laser Resonators and the Beam Divergence Problem, Taylor & Francis 1992. J. M. Vaughan, The Fabry-Pérot Interferometer, Adam Hilger 1989. G. Hernandez, Fabry-Pérot Interferometers, Cambridge University Press 1986, Paperback 1988. A. E. Siegman, Lasers, University Science Press 1986. L. A. Weinstein, Open Resonators and Open Waveguides, Golem Press 1969.
Grundlegende Artikel
K. J. Vahala, ‚Optical Microcavities‘, Nature 424, 839, 2003. J. U. Nöckel, A. D. Stone, ‚Ray and Wave Chaos in Asymmetric Resonant Optical Cavities‘, Nature 385, 45, 1997. H. Kogelnik, T. Li, ‚Laser Beams and Resonators‘, Applied Optics 5, 1550, 1966 (auch Proceedings of the IEEE 54, 1312, 1966. A. G. Fox, T. Li, ‚Resonant Modes in a Maser Interferometer‘, Bell System Technical Journal 40, 453, 1961. G. D. Boyd, J. P. Gordon, ‚Confocal Multimode Resonator for Millimeter Through Optical Wavelength Masers‘, Bell System Technical Journal 40, 489, 1961.
349
12 Statistische Optik Amplitude 𝑈(r) eine deterministische komplexe Funktion ist, z. B. 𝑈(r) = 𝐴 exp(−i𝑘𝑟)∕𝑟 im Fall einer Kugelwelle [Abb. 12.1(a)]. Die Abhängigkeit der Wellenfunktion von der Zeit und vom Ort ist vollkommen periodisch und voraussagbar. Für stochastisches Licht ist die Abhängigkeit der Wellenfunktion von Zeit und Ort [Abb. 12.1(b)] nicht mehr vollständig vorhersagbar und kann nicht allgemein beschrieben werden, ohne auf statistische Methoden zurückzugreifen. Wie können wir aus den Fluktuationen einer stochastischen optischen Welle sinnvolle Größen erhalten, die die Welle charakterisieren und sie von anderen zufälligen Wellen unterscheiden? Als Beispiel betrachten wir die drei stochastischen optischen Wellen, deren Wellenfunktionen an einem festen Ort sich zeitlich wie in Abb. 12.2 gezeigt ändern. Offensichtlich ist Welle (b) „stärker“ als Welle (a), und ebenso offensichtlich variiert die Einhüllende der Welle (c) „schneller“ als die Einhüllenden der beiden anderen Wellen. Um diese unsystematischen qualitativen Beobachtungen in quantitative Größen zu fassen, definieren wir ei-
Statistische Optik umfasst die Untersuchung der Eigenschaften von stochastischem Licht. Die Zufälligkeit in bestimmten Eigenschaften des Lichts entsteht aufgrund von unvorhersehbaren Fluktuationen der Lichtquelle oder des Mediums, in dem das Licht sich ausbreitet. Natürliches Licht, das z. B. von einem heißen Gegenstand (z. B. der Sonne) ausgestrahlt wird, ist stochastisch, weil es eine Superposition von Emissionen einer sehr großen Zahl von Atomen ist, die unabhängig voneinander und mit unterschiedlichen Frequenzen und Phasen ausstrahlen. Die Zufälligkeit kann auch ein Ergebnis von Streuung an rauen Oberflächen, in Mattglas oder in turbulenten Flüssigkeiten sein, die der Lichtwelle zufällige Variationen der optischen Wellenfront verleihen. Die Untersuchung der stochastischen Fluktuationen des Lichts wird auch als Theorie der optischen Kohärenz bezeichnet. In den vorhergehenden Kapiteln hatten wir angenommen, dass Licht deterministisch oder „kohärent“ ist. Ein Beispiel für kohärentes Licht ist die monochromatische Welle 𝑢(r, 𝑡) = Re{𝑈(r) exp(i𝜔𝑡)}, für die die komplexe
Zeitabhängigkeit
t
t x
Abb. 12.1 Zeitabhängigkeit und Wellenfronten (a) einer monochromatischen Kugelwelle, die ein Beispiel für kohärentes Licht ist, und (b) von stochastischem Licht.
x
Wellenfronten
z
z
(a)
(b)
Abb. 12.2 Zeitabhängigkeit der Wellenfunktionen dreier stochastischer Wellen.
(a)
t
t
t (b)
(c)
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
350
12 Statistische Optik
nige nichtzufällige Größen als statistische Mittelwerte. Weil die stochastische Funktion 𝑢(r, 𝑡) bestimmte Gesetzmäßigkeiten erfüllt (die Wellengleichung und die Randbedingungen), müssen ihre statistischen Mittelwerte ebenfalls bestimmte Gesetzmäßigkeiten erfüllen. Die Theorie der optischen Kohärenz befasst sich mit den Definitionen dieser statistischen Mittelwerte, mit den Gesetzmäßigkeiten, die sie bestimmen, und mit einigen Kenngrößen, mit deren Hilfe wir Licht als kohärent, inkohärent oder partiell kohärent klassifizieren können.
In diesem Kapitel . . . Dieses Kapitel gibt eine Einführung in die Theorie der partiellen Kohärenz. Für für ein tiefgehendes Verständnis der optischen Kohärenz ist Vertrautheit mit der Theorie stochastischer Felder (zufälliger Funktionen von vielen Variablen wie Raum und Zeit) unerlässlich. Für die in diesem Kapitel vorgestellten Gedankengänge reicht es jedoch aus, wenn Sie mit dem Konzept der Mittelwertbildung vertraut sind. Im Abschnitt 12.1 definieren wir zwei statistische Mittelwerte, mit deren Hilfe wir stochastisches Licht beschreiben können: die optische Intensität und die wechselseitige Kohärenzfunktion. Wir skizzieren die Konzepte der zeitlichen und räumlichen Kohärenz und stellen eine Verbindung zwischen zeitlicher Kohärenz und Monochromatizität her. Die in Abschnitt 12.1 beschriebenen Beispiele für partiell kohärentes Licht zeigen, dass räumlich kohärentes Licht nicht zeitlich kohärent und monochromatisches Licht nicht räumlich kohärent sein muss. Eine der grundlegenden Manifestationen der Kohärenz von Licht ist seine Fähigkeit, sichtbare Interferenzmuster zu produzieren. Abschnitt 12.2 ist den Gesetzen der Interferenz von stochastischem Licht gewidmet. Die Ausbreitung von partiell kohärentem Licht im Vakuum sowie durch verschiedene optische Systeme einschließlich abbildender Systeme ist das Thema von Abschnitt 12.3. Abschnitt 12.4 gibt eine kurze Einführung in die Theorie der Polarisation von stochastischem Licht (partielle Polarisation). Bis auf diesen letzten Abschnitt bewegen wir uns in diesem Kapitel im Rahmen der skalaren Wellenoptik.
12.1 Statistische Eigenschaften von stochastischem Licht Eine beliebige optische Welle wird durch eine Wellenfunktion 𝑢(r, 𝑡) = Re{𝑈, (r, 𝑡)} beschrieben, wobei 𝑈(r, 𝑡) die komplexe Wellenfunktion ist. Zum Beispiel kann 𝑈(r, 𝑡) für monochromatisches Licht die Form 𝑈(r) exp(i𝜔𝑡) annehmen oder kann für polychromatisches Licht eine Summe von vielen ähnlichen Funktionen mit unterschiedlichen Werten von 𝜈 sein (siehe Abschnitt 2.6.1 für eine Diskussion der komplexen Wellenfunktion). Für stochastisches Licht sind beide Funktionen 𝑢(r, 𝑡) und 𝑈(r, 𝑡) stochastisch und können durch einige in diesem Abschnitt eingeführte statistische Mittelwerte charakterisiert werden.
12.1.1
Optische Intensität
Die Intensität 𝐼(r, 𝑡) von kohärentem (deterministischem) Licht ist das Absolutquadrat seiner komplexen Wellenfunktion 𝑈(r, 𝑡), 2 𝐼(r, 𝑡) = |||𝑈(r, 𝑡)|||
(12.1)
(siehe die Abschnitte 2.2.1 und 2.6.1). Für monochromatisches deterministisches Licht hängt die Intensität nicht von der Zeit ab, aber für gepulstes Licht ändert sie sich zeitlich. Für stochastisches Licht ist 𝑈(r, 𝑡) eine zufällige Funktion der Zeit und des Ortes. Die Intensität |𝑈(r, 𝑡)|2 ist daher ebenfalls zufällig. Die mittlere Intensität definieren wir als 𝐼(r, 𝑡) = ⟨|𝑈(r, 𝑡)|2 ⟩
(12.2)
wobei das Symbol ⟨⋅⟩ jetzt einen Ensemblemittelwert über viele Realisierungen der stochastischen Funktion bezeichnet. Das bedeutet, dass die Welle wiederholt unter denselben Bedingungen erzeugt wird, wobei jeder Versuch eine andere Wellenfunktion liefert, aus denen mithilfe von Gl. (12.2) die mittlere Intensität zu jeder Zeit und an jedem Ort bestimmt wird. Wo keine Missverständnisse möglich sind, bezeichnen wir 𝐼(r, 𝑡) einfach als die Intensität des Lichts (und implizieren das Wort mittlere). Der Größe |𝑈(r, 𝑡)|2 wird stochastische oder instantane Intensität genannt. Für deterministisches Licht ist die Mittelwertbildung überflüssig, da alle Versuche dieselbe Wellenfunktion produzieren, sodass Gl. (12.2) äquivalent zu Gl. (12.1) ist. Die mittlere Intensität kann zeitunabhängig sein oder zeitlich variieren, wie Abb. 12.3(a) bzw. (b) illustrieren. Ersteres trifft zu, wenn die optische Welle statistisch stationär ist; d. h. ihre statistischen Mittelwerte zeitinvariant sind. Die instantane Intensität |𝑈(r, 𝑡)|2 schwankt
12.1 Statistische Eigenschaften von stochastischem Licht
|U (r, t)| 2
|U (r, t)| 2
t
I (r, t)
t
I (r, t)
t (a)
t
(b)
Abb. 12.3 (a) Eine statistisch stationäre Welle hat eine mittlere Intensität, die sich mit der Zeit nicht ändert. (b) Eine statistisch nichtstationäre Welle hat eine zeitlich variierende mittlere Intensität. Diese Auftragungen beschreiben z. B. die
Intensität des Lichts aus einer Glühlampe, die (a) von einem konstanten elektrischen Strom und (b) von einem elektrischen Strompuls durchflossen wird.
zufällig mit der Zeit, aber ihr Mittelwert ist konstant. Wir werden sie in diesem Fall durch 𝐼(r) bezeichnen. Stationarität bedeutet dabei nicht unbedingt Konstanz. Es bedeutet Konstanz der mittleren Eigenschaften. Ein Beispiel für stationäres stochastisches Licht ist das einer gewöhnlichen Glühlampe, die durch einen konstanten elektrischen Strom beheizt wird. Die mittlere Intensität 𝐼(r) ist eine Funktion der Entfernung von der Lampe, aber sie ändert sich zeitlich nicht. Die zufällige Intensität |𝑈(r, 𝑡)|2 variiert dagegen sowohl mit dem Ort als auch mit Zeit, wie Abb. 12.3(a) verdeutlicht. Wenn das Licht stationär ist, kann die Mittelwertbildung in Gl. (12.2) in der Regel durch eine zeitliche Mittelung über eine längere Zeitdauer ersetzt werden (anstelle einer Mittelung über viele Realisierungen der Welle); daraus folgt
für dieses zeitliche Verhalten können wir erhalten, indem wir einen statistischen Mittelwert definieren, der als Autokorrelationsfunktion bekannt ist. Diese Funktion beschreibt das Ausmaß, in dem die Wellenfunktion zu zwei Zeitpunkten in einem gegebenen Abstand im Gleichtakt variiert; sie spiegelt damit die Zeitskala der Prozesse wider, die die Wellenfunktion erzeugen. Die zeitliche Kohärenzfunktion
Die Autokorrelationsfunktion einer stationären komplexen stochastischen Funktion 𝑈(𝑡) ist der Mittelwert des Produkts von 𝑈 ∗ (𝑡) und 𝑈(𝑡 + 𝜏) als Funktion der Zeitverzögerung 𝜏 𝐺(𝜏) = ⟨𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏)⟩
(12.4)
oder T
T
𝐼(r) = lim
T →∞
1 ∫ |𝑈(r, 𝑡)|2 d𝑡 . 2T
(12.3)
−T
12.1.2 Zeitliche Kohärenz und Spektrum Wir betrachten die Fluktuationen von stationärem Licht an einem festen Ort r als Funktion der Zeit. Die stationäre zufällige Funktion 𝑈(r, 𝑡) besitzt eine konstante Intensität 𝐼(r) = ⟨|𝑈(r, 𝑡)|2 ⟩. Der Kürze halber lassen wir die r-Abhängigkeit fallen (da wir r festhalten), sodass 𝑈(r, 𝑡) = 𝑈(𝑡) und 𝐼(r) = 𝐼 wird. Die zufälligen Fluktuationen von 𝑈(𝑡) werden durch eine Zeitskala charakterisiert, die das „Gedächtnis“ der zufälligen Funktion darstellt. Fluktuationen an Punkten in einem größeren zeitlichem Abstand als der Erinnerungszeit sind unabhängig; das System hat seine Erinnerung verloren. Innerhalb der Erinnerungszeit erscheint die Funktion glatt, aber wenn man sie über längere Zeitintervalle betrachtet, wird sie unregelmäßig und erratisch (siehe Abb. 12.2). Ein quantitatives Maß
1 ∫ 𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏) d𝑡 𝐺(𝜏) = lim T →∞ 2T
(12.5)
−T
(siehe Abschnitt A.1). Um die Bedeutung der Definition in Gl. (12.4) zu verstehen, betrachten wir den Fall, dass der Mittelwert der komplexen Wellenfunktion ⟨𝑈(𝑡)⟩ = 0 ist. Das ist dann der Fall, wenn die Phase des Zeigers 𝑈(𝑡) mit gleicher Wahrscheinlichkeit jeden Wert zwischen 0 und 2π annehmen kann, wie in Abb. 12.4 dargestellt ist. Die Phase des Produkts 𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏) ist der Winkel zwischen dem Zeiger 𝑈(𝑡) und 𝑈(𝑡 + 𝜏). Wenn 𝑈(𝑡) und 𝑈(𝑡 + 𝜏) unkorreliert sind, ändert sich der Winkel zwischen ihren Zeigern zufällig zwischen 0 und 2π. Der Zeiger 𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏) hat dann einen völlig ungewissen Winkel, er kann also mit derselben Wahrscheinlichkeit in jede beliebige Richtung zeigen, sodass sein Mittelwert, die Autokorrelationsfunktion 𝐺(𝜏), verschwinden muss. Wenn 𝑈(𝑡) und 𝑈(𝑡 + 𝜏) für ein gegebenes 𝜏 jedoch korreliert sind, werden ihre Zeiger eine Beziehung behalten. Ihre Fluktuationen sind dann verknüpft, sodass der
351
352
12 Statistische Optik
Im{U(t)}
Erinnerungszeit der Fluktuationen; diese Zeit wird als Kohärenzzeit bezeichnet (siehe Abb. 12.5). Für 𝜏 < 𝜏K sind die Fluktuationen „stark“ korreliert, während sie für 𝜏 > 𝜏K „schwach“ korreliert sind. Im Allgemeinen ist 𝜏K die Breite der Funktion |𝑔(𝜏)|. Obwohl die Definition der Breite einer Funktion recht beliebig ist (siehe Abschnitt A.2), wird für die Definition der Kohärenzzeit meist die Festlegung
Re{U(t)}
∞
Abb. 12.4 Variation des Zeigers U(t ) mit der Zeit, wenn sein Argument zwischen 0 und 2π gleichverteilt ist. Die Mittelwerte seines Real- und Imaginärteils sind null, sodass ⟨U(t )⟩ = 0 folgt.
𝜏K = ∫ |𝑔(𝜏)|2 d𝜏
(12.10)
−∞
verwendet [siehe Gl. (A.15); 𝑔(0) = 1].
∗
Produktzeiger 𝑈 (𝑡)𝑈(𝑡 + 𝜏) eine bevorzugte Richtung hat und sein Mittel 𝐺(𝜏) nicht verschwindet. In der Theorie der optischen Kohärenz wird die Autokorrelationsfunktion 𝐺(𝜏) als zeitliche Kohärenzfunktion bezeichnet. Man kann leicht zeigen, dass 𝐺(𝜏) eine Funktion mit hermitescher Symmetrie ist, 𝐺(−𝜏) = 𝐺 ∗ (𝜏), und dass die durch Gl. (12.2) definierte Intensität 𝐼 gleich 𝐺(𝜏) für 𝜏 = 0 ist, 𝐼 = 𝐺(0) .
(12.6)
Der zeitliche Kohärenzgrad
Die zeitliche Kohärenzfunktion 𝐺(𝜏) trägt Information sowohl über die Intensität 𝐼 = 𝐺(0) als auch über den Grad der Korrelation (Kohärenz) des stationären Lichts. Ein intensitätsunabhängiges Maß für die Kohärenz ist die normierte Autokorrelationsfunktion, 𝑔(𝜏) =
𝐺(𝜏) ⟨𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏)⟩ = , 𝐺(0) ⟨𝑈 ∗ (𝑡)𝑈(𝑡)⟩
(12.7)
die komplexer zeitlicher Kohärenzgrad genannt wird. Sein Betrag kann nicht größer als eins werden, 0 ≤ |||𝑔(𝜏)||| ≤ 1 .
(12.8)
|𝑔(𝜏)| ist ein Maß für das Ausmaß der Korrelation zwischen 𝑈(𝑡) und 𝑈(𝑡 + 𝜏). Wenn das Licht deterministisch und monochromatisch ist, d. h. 𝑈(𝑡) = 𝐴 exp(i𝜔0 𝑡) mit einer Konstante 𝐴, ergibt Gl. (12.7) 𝑔(𝜏) = exp(i𝜔0 𝜏) ,
(12.9)
sodass |𝑔(𝜏)| = 1 für alle 𝜏 gilt. Die Variablen 𝑈(𝑡) und 𝑈(𝑡 + 𝜏) sind dann für alle Zeitverzögerungen 𝜏 vollständig korreliert. Meist nimmt |𝑔(𝜏)| von seinem größten Wert |𝑔(0)| = 1 mit steigendem 𝜏 stetig ab, bis die Fluktuationen für hinreichend große 𝜏 unkorreliert werden. Kohärenzzeit
Wenn |𝑔(𝜏)| monoton mit der Zeitdifferenz abnimmt, dann ist die Zeit 𝜏K , zu der es auf einen bestimmten Wert (z. B. 1∕2 oder 1∕e) abgenommen hat, ein Maß für die
Übung 12-1: Kohärenzzeit
Verifizieren Sie, dass die folgenden Ausdrücke für den komplexen zeitlichen Kohärenzgrad mit der Definition von 𝜏K aus Gl. (12.10) im Einklang stehen:
𝑔(𝜏) =
⎧ exp (− |𝜏| ) 𝜏K ⎪
(Exponentialfunktion)
⎨ π 𝜏2 ⎪ exp (− ) (Gaußfunktion) 2𝜏K2 ⎩
(12.11)
Um welchen Faktor fällt |𝑔(𝜏)| in beiden Fällen, wenn 𝜏 von 0 bis 𝜏K steigt? Die Kohärenzzeit von monochromatischem Licht ist unendlich, da überall |𝑔(𝜏)| = 1 gilt. Licht, dessen Kohärenzzeit 𝜏K viel größer ist als die Unterschiede der in einem betrachteten optischen System vorkommenden Zeitverzögerungen, ist effektiv vollständig kohärent. Infolgedessen ist Licht effektiv kohärent, wenn die Entfernung 𝑐𝜏K viel größer ist als alle vorkommenden Unterschiede der optischen Weglängen. Die Entfernung 𝑙K = 𝑐𝜏K
(12.12)
wird als Kohärenzlänge bezeichnet. Die spektrale Leistungsdichte
Um das gemittelte Spektrum von stochastischem Licht zu bestimmen, führen wir eine Fourierzerlegung der stochastischen Funktion 𝑈(𝑡) durch. Die Amplitude der Komponente mit der Frequenz 𝜈 ist die Fouriertransformierte (siehe Anhang A) ∞
𝑉(𝜈) = ∫ 𝑈(𝑡) exp(−i2π𝜈𝑡) d𝑡 .
(12.13)
−∞
Die mittlere Energie pro Flächeneinheit der Komponenten mit Frequenzen im Intervall zwischen 𝜈 und 𝜈 + d𝜈
12.1 Statistische Eigenschaften von stochastischem Licht
u(t)
τK
u(t)
| (τ)| 1
τK
| (τ)| 1
τK
t
0
τ
0
(a)
2 ist ⟨|𝑉(𝜈)|2 ⟩ d𝜈, sodass ⟨|||𝑉(𝜈)||| ⟩ die spektrale Energiedichte des Lichts (Energie pro Flächen- und Frequenzeinheit) bezeichnet. Die komplexe Wellenfunktion 𝑈(𝑡) ist so definiert, dass 𝑉(𝜈) = 0 für negative 𝜈 gilt (siehe Abschnitt 2.6.1). Da eine wahrhaft stationäre Funktion 𝑈(𝑡) unendlich andauert und eine unendliche Energie trägt, betrachten wir stattdessen die spektrale Leistungsdichte. Wir bestimmen zuerst die spektrale Energiedichte der Funktion 𝑈(𝑡) über ein Fenster der zeitlichen Breite T , indem wir die abgeschnittene Fouriertransformation T ∕2
(12.14)
−T ∕2
berechnen, und daraus berechnen wir die spektrale Energiedichte ⟨|𝑉T (𝜈)|2 ⟩. Die spektrale Leistungsdichte ist die Energie pro Zeiteinheit, (1∕T )⟨|𝑉T (𝜈)|2 ⟩. Wir können jetzt das Zeitfenster bis ins Unendliche ausdehnen, indem wir T → ∞ gehen lassen. Das Ergebnis S (𝜈) = lim
T →∞
1 T
⟨|𝑉T (𝜈)|2 ⟩ ,
(12.15)
wird spektrale Leistungsdichte genannt. Sie ist nur für positive Frequenzen ungleich null. Weil 𝑈(𝑡) so definiert ist, dass |𝑈(𝑡)|2 eine Leistung pro Flächeneinheit oder Intensität bezeichnet (W∕cm2 ), ist S (𝜈) d𝜈 die mittlere Leistung pro Flächeneinheit im Frequenzband zwischen 𝜈 und 𝜈 + d𝜈, sodass S (𝜈) strenggenommen eine spektrale Intensitätsdichte bezeichnet [W∕(cm2 Hz)]. Sie wird häufig einfach als spektrale Dichte oder Spektrum bezeichnet. Die mittlere Gesamtintensität ist das Integral ∞
𝐼 = ∫ S (𝜈) d𝜈 . 0
τ
(b)
Abb. 12.5 Anschauliche Beispiele für Wellenfunktionen, den Betrag des komplexen zeitlichen Kohärenzgrads |g(𝜏)|, und die Kohärenzzeit 𝜏K für ein optisches Feld mit (a) kurzer Kohärenzzeit und (b) langer Kohärenzzeit. Die Amplitude und Phase der Wellenfunktion ändern sich zufällig; die zugehörigen Zeitkonstanten sind ungefähr gleich der Kohärenzzeit. In beiden Fällen ist die Kohärenzzeit 𝜏K größer als die Dauer
𝑉T (𝜈) = ∫ 𝑈(𝑡) exp(−i2π𝜈𝑡) d𝑡
τK
t
(12.16)
einer optischen Periode. Innerhalb der Kohärenzzeit verhält sich die Welle ziemlich vorhersagbar und kann näherungsweise als Sinusfunktion beschrieben werden. Die Amplitude und Phase der Welle jenseits der Kohärenzzeit kann jedoch nicht aus der Amplitude und Phase zu einem gegebenen Zeitpunkt vorhergesagt werden.
Man kann zeigen, dass die durch Gl. (12.4) definierte Autokorrelationsfunktion 𝐺(𝜏) und die durch Gl. (12.15) definierte spektrale Dichte S (𝜈) ein Paar von Fouriertransformierten sind (siehe Aufgabe 12-2), ∞
S (𝜈) = ∫ 𝐺(𝜏) exp(−i2π𝜈𝜏) d𝜏 .
(12.17)
−∞
Diese Beziehung ist als Wiener-Khinchin-Theorem bekannt. Das Spektrum einer optischen Welle, die wie in Abb. 12.6 gezeigt ein farbiges Bild beschreibt, ändert sich mit dem Ort r; jedes der gezeigten spektralen Profile entspricht einer wahrgenommenen Farbe. Spektrale Breite
Das Spektrum von Licht wird häufig auf ein schmales Band um eine Mittenfrequenz 𝜈0 eingeschränkt. Die spektrale Breite oder Linienbreite des Lichts ist die Breite Δ𝜈 der spektralen Dichte S (𝜈). Da S (𝜈) und 𝐺(𝜏) über eine Fouriertransformation zusammenhängen, sind ihre Breiten umgekehrt proportional zueinander. Eine Lichtquelle mit einem breiten Spektrum hat eine kurze Kohärenzzeit, wohingegen eine Lichtquelle mit schmaler Linienbreite eine lange Kohärenzzeit besitzt; dies ist in Abb. 12.7 illustriert. Im Grenzfall monochromatischen Lichts ist 𝐺(𝜏) = 𝐼 exp(i𝜔0 𝜏), sodass die entsprechende spektrale Intensitätsdichte S (𝜈) = 𝐼𝛿(𝜈 − 𝜈0 ) nur eine einzige Frequenzkomponente 𝜈0 enthält. Folglich ist 𝜏K = ∞ und Δ𝜈 = 0. Die Kohärenzzeit einer Lichtquelle kann vergrößert werden, indem man ihre spektrale Breite mithilfe eines optischen Filters reduziert. Der resultierende Gewinn an Kohärenz geht jedoch zu Lasten der Intensität. Es gibt mehrere Definitionen für die spektrale Breite. Die üblichste ist die Halbwertsbreite (HWB oder FWHM von engl. full width at half maximum), d. h. die Breite der
353
spektrale Dichte
spektrale Dichte
12 Statistische Optik
Rot
400
500 600 700 Wellenlänge / nm
spektrale Dichte
354
Grün
400
500 600 700 Wellenlänge / nm
Blau
400
500 600 700 Wellenlänge / nm
Abb. 12.6 Variation der spektralen Dichte als Funktion der Wellenlänge an drei Orten in einer Farbabbildung (Henri Matisse, Dahlien). u(t)
τK
| (τ)| 1
(a)
(ν) τK
t
τ
0 | (τ)| 1
τK
u(t)
δν
(b)
τK τ
0
Tab. 12.1 Die Beziehung zwischen der spektralen Breite und der Kohärenzzeit.
Spektrale Breite Δ𝜈HWB
Rechteckfunktion
1 𝜏K
Lorentzfunktion
1 0.32 ≈ π𝜏K 𝜏K
Gaußfunktion
√
2 ln 2∕π 0.66 ≈ 𝜏K 𝜏K
Funktion S (𝜈) bei der Hälfte ihres Maximalwerts, die wir als Δ𝜈HWB ≡ Δ𝜈 bezeichnen. Die Beziehung zwischen der Kohärenzzeit und der spektralen Breite hängt vom spektralen Profil der Quelle ab, wie Tabelle 12.1 zeigt (siehe auch Abschnitt A.2). Eine andere zweckmäßige Definition der spektralen Breite ist 2
⎞ ⎛∞ ⎜∫ S (𝜈) d𝜈⎟ ⎟ ⎜ 0 ⎠ . ⎝ Δ𝜈K = ∞ ∫ S 2 (𝜈) d𝜈 0
ν
(ν)
t
Spektrale Dichte
ν0
0
Abb. 12.7 Zwei stochastische Wellen, die Beträge ihres komplexen zeitlichen Kohärenzgrads und ihre spektralen Dichten. Die Breiten von S (𝜈) und |g(𝜏)| sind invers korreliert.
δν ν0
0
ν
Mit dieser Definition kann gezeigt werden, dass unabhängig vom spektralen Profil Δ𝜈K =
1 𝜏K
(12.19)
gilt (siehe Übung 12-2). Wenn S (𝜈) beispielsweise eine Rechteckfunktion in einem Frequenzintervall zwischen 𝜈0 − 𝐵∕2 und 𝜈0 + 𝐵∕2 ist, dann ergibt Gl. (12.18) Δ𝜈K = 𝐵. Die beiden Definitionen der Bandbreite, Δ𝜈K und Δ𝜈HWB ≡ Δ𝜈, unterscheiden sich um einen Faktor, der für die in Tabelle 12.1 aufgeführten spektralen Profile Werte von 1∕π ≈ 0.32 bis 1 annimmt. Typische spektrale Bandbreiten für verschiedene Lichtquellen und ihre zugehörigen Kohärenzzeiten und Kohärenzlängen 𝑙K = 𝑐𝜏K sind in Tabelle 12.2 aufgeführt. Übung 12-2: Spektrale Breite und Kohärenzzeit
(12.18)
Zeigen Sie, dass die in Gl. (12.10) definierte Kohärenzzeit 𝜏K durch 𝜏K = 1∕Δ𝜈K mit der in Gl. (12.18) definierten spektralen Breite Δ𝜈K zusammenhängt. Hinweis: Verwenden Sie die Definitionen von Δ𝜈K und 𝜏K , die Beziehung zwischen S (𝜈) und 𝐺(𝜏) und das Theorem von Parseval [siehe Gl. (A.7)].
12.1 Statistische Eigenschaften von stochastischem Licht
Tab. 12.2 Spektrale Breiten Δ𝜈K einiger Lichtquellen und ihre Kohärenzzeiten 𝜏K und Kohärenzlängen lK = c𝜏K im Vakuum. 𝚫𝝂K ∕Hz 𝝉K = 1∕𝚫𝝂K lK = c𝝉K
Quelle
gefiltertes Sonnenlicht 3.74 × 1014 (𝜆0 = 0.4−0.8 μm) LED 1.5 × 1013 (𝜆0 = 1 μm, Δ𝜆0 = 50 nm) Niederdruck-Natriumlampe 5 × 1011 Vielmoden-He-Ne-Laser (𝜆0 = 633 nm) Einmoden-He-Ne-Laser (𝜆0 = 633 nm)
2.67 fs
800 nm
67 fs
20 μm
2 ps
600 μm
1.5 × 109
0.67 ns
20 cm
1 × 106
1 μs
300 m
Beispiel 12-1: Eine Welle aus einer stochastischen Folge von Wellenpaketen
Von einer inkohärenten Quelle ausgestrahltes Licht kann als Folge von Wellenpaketen aufgefasst werden, die zu zufälligen Zeiten emittiert werden (Abb. 12.8). 1) Jedes Wellenpaket hat eine zufällige Phase, da es von einem anderen Atom ausgestrahlt wird. Die Wellenpakete können beispielsweise sinusförmig mit einer exponentiell abklingenden Einhüllenden sein, sodass ein bei 𝑡 = 0 ausgestrahltes Wellenpaket die komplexe Wellenfunktion (an einem festen Ort)
𝑈P (𝑡) =
⎧ 𝐴 exp (− 𝑡 ) exp(i2π𝜈 𝑡) , 𝑡 ≥ 0 , P 0 𝜏K (12.20) ⎨ 0, 𝑡 𝜏K oder |𝑧2 − 𝑧1 | > 𝑙K , wenn 𝑙K = 𝑐𝜏K die Kohärenzlänge ist, sind dagegen näherungsweise unkorreliert. Zusammengefasst heißt das: Eine partiell kohärente ebene Welle ist innerhalb jeder transversalen Ebene räumlich kohärent, aber in axialer Richtung partiell kohärent. Für die axiale (longitudinale) räumliche Kohärenz der Welle gilt eine 1:1-Entsprechung zu ihrer zeitlichen Kohärenz. Das Verhältnis der Kohärenzlänge 𝑙K = 𝑐𝜏K zur maximalen Differenz 𝑙max der optischen Weglängen im System bestimmt die Bedeutung der Kohärenz. Für 𝑙K ≫ 𝑙max ist die Welle effektiv vollständig kohärent. Die Kohärenzlängen einiger Lichtquellen sind in Tabelle 12.2 angegeben. Partiell kohärente Kugelwellen
Eine partiell kohärente Kugelwelle wird durch die komplexe Wellenfunktion 𝑈(r, 𝑡) =
[ ( 𝑟 )] 1 ( 𝑟) exp i𝜔0 𝑡 − a 𝑡− 𝑟 𝑐 𝑐
(12.35)
| (ν)|
τK
z korreliert
𝑔(r1 , r2 , 0) = 𝑔a (
(12.31)
0
τ
δν
0
ν0
ν
unkorreliert
Abb. 12.11 Die Fluktuationen einer partiell kohärenten ebenen Welle sind an Punkten auf jeder Wellenfront (transversalen Ebene) vollständig korreliert, wohingegen Fluktuationen an Punkten auf Wellenfronten in einer axialen Entfernung größer als der Kohärenzlänge lK = c𝜏K näherungsweise unkorreliert sind.
12.2 Interferenz von partiell kohärentem Licht
ℓ
K
=
cτ K
Abb. 12.12 Eine partiell kohärente Kugelwelle ist an allen Punkten auf einer Wellenfront räumlich vollständig kohärent, aber nicht an Punkten in unterschiedlichen radialen Entfernungen.
unkorrelierte Wellenfronten
beschrieben (siehe die Abschnitte 2.2.2 und 2.6.1), wobei a(𝑡) eine stochastische Funktion ist. Die entsprechende wechselseitige Kohärenzfunktion ist 𝐺(r1 , r2 , 𝜏) =
𝑟 − 𝑟1 1 𝐺 (𝜏 − 2 ) 𝑟1 𝑟2 a 𝑐 𝑟 − 𝑟1 × exp [i𝜔0 (𝜏 − 2 )] 𝑐
(12.36)
mit 𝐺a (𝜏) = ⟨a∗ (𝑡)a(𝑡 + 𝜏)⟩. Die Intensität 𝐼(r) = 𝐺a (0)∕𝑟 2 ändert sich nach einem 1∕𝑟 2 -Gesetz. Die Kohärenzzeit 𝜏K ist die Breite der Funktion |𝑔a (𝜏)| = |𝐺a (𝜏)∕𝐺a (0)|; sie ist überall im Raum gleich, genau wie die spektrale Leistungsdichte. Für 𝜏 = 0 sind Fluktuationen an allen Punkten auf einer Wellenfront (einer Kugel) vollständig korreliert, wohingegen Fluktuationen an Punkten auf zwei Wellenfronten in einer radialen Entfernung |𝑟2 − 𝑟1 | ≫ 𝑙K = 𝑐𝜏K unkorreliert sind (siehe Abb. 12.12). Eine beliebige partiell kohärente Welle, die durch eine kleine Öffnung hindurchtritt, erzeugt eine partiell kohärente Kugelwelle. Dieser Prozess verleiht der eingehenden Welle daher eine partielle räumliche Kohärenz (Punkte auf jeder Kugeloberfläche um die Öffnung sind vollständig korreliert). Die Welle ist jedoch zeitlich nur partiell kohärent. Punkte in unterschiedlichen Entfernungen von der Öffnung sind nur teilweise korreliert. Die Öffnung verleiht der Welle nur eine räumliche, nicht aber eine zeitliche Kohärenz. Nun stellen wir uns vor, dass ein extrem schmalbandiges optisches Filter hinter die Öffnung gestellt wird, sodass die durchgelassene Welle nahezu monochromatisch wird. Die Welle muss dann zeitlich und räumlich vollständig kohärent sein. Die zeitliche Kohärenz wird durch das schmalbandige Filter eingeführt, die räumliche Kohärenz durch die Öffnung, die als Raumfilter wirkt. Der Preis für diese ideale Welle ist natürlich der Verlust an optischer Energie durch die zeitlichen und räumlichen Filterungen.
12.2 Interferenz von partiell kohärentem Licht Die Interferenz von kohärentem Licht wurde in Abschnitt 2.5 besprochen. Dieser Abschnitt ist der Interferenz von partiell kohärentem Licht gewidmet.
12.2.1 Interferenz zweier partiell kohärenter Wellen Die statistischen Eigenschaften zweier partiell kohärenter Wellen 𝑈1 und 𝑈2 werden nicht nur durch ihre eigenen wechselseitigen Kohärenzfunktionen beschrieben, sondern auch durch den Grad der Korrelation ihrer Fluktuationen. An einem gegebenen Ort r und zu einem Zeitpunkt 𝑡 sind die Intensitäten der beiden Wellen 𝐼1 = ⟨|𝑈1 |2 ⟩ und 𝐼2 = ⟨|𝑈2 |2 ⟩ und ihre Kreuzkorrelation wird durch den statistischen Mittelwert 𝐺12 = ⟨𝑈1∗ 𝑈2 ⟩ und dessen normierte Version ⟨𝑈1∗ 𝑈2 ⟩ 𝑔12 = √ 𝐼1 𝐼2
(12.37)
beschrieben. Wenn die beiden Wellen überlagert werden, ist die mittlere Intensität ihrer Summe 𝐼 = ⟨|𝑈1 + 𝑈2 |2 ⟩ = ⟨|𝑈1 |2 ⟩ + ⟨|𝑈2 |2 ⟩ + ⟨𝑈1∗ 𝑈2 ⟩ + ⟨𝑈1 𝑈2∗ ⟩ ∗ = 𝐼1 + 𝐼2 + 2 Re{𝐺12 } = 𝐼1 + 𝐼2 + 𝐺12 + 𝐺12 √ (12.38) = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 Re{𝑔12 } ;
daraus folgt √ 𝐼 = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 |𝑔12 | cos 𝜑 ,
(12.39)
wobei 𝜑 = arg{𝑔12 } die Phase von 𝑔12 ist. Der dritte Term auf der rechten Seite von Gl. (12.39) beschreibt die optische Interferenz. Wir betrachten zunächst zwei wichtige Grenzfälle: 1) Für zwei vollständig korrelierte Wellen mit 𝑔12 = exp(i𝜑) und |𝑔12 | = 1 erhalten wir wieder die Interferenzgleichung (2.49) für zwei kohärente Wellen mit der Phasendifferenz 𝜑. 2) Für zwei unkorrelierte Wellen mit 𝑔12 = 0 ist 𝐼 = 𝐼1 + 𝐼2 , sodass es keine Interferenz gibt. Im allgemeinen Fall nimmt die normierte Intensität 𝐼 als Funktion der Phase 𝜑 die Form eines sinusförmigen Musters wie in Abb. 12.13 an. Die Stärke der Interferenz wird durch die Sichtbarkeit 𝒱 (auch Modulationstiefe
359
360
12 Statistische Optik
I 2I0
2
|g 12|
1
0
–2π 0 2π
φ
Abb. 12.13 Normierte Intensität I∕2I0 der Summe zweier partiell kohärenter Wellen gleicher Intensität (I1 = I2 = I0 ) als Funktion der Phase 𝜑 ihrer normierten Kreuzkorrelation g12 . Dieses sinusförmige Muster hat die Sichtbarkeit 𝒱 = |g12 |.
oder Kontrast des Interferenzmusters genannt) gemessen, die als 𝐼max − 𝐼min 𝒱= (12.40) 𝐼max + 𝐼min definiert ist, wobei 𝐼max und 𝐼min die maximalen bzw. minimalen Werte sind, die 𝐼 als Funktion von 𝜑 annimmt. Da cos 𝜑 zwischen 1 und −1 variiert, erhalten wir durch Einsetzen von Gl. (12.39) in Gl. (12.40) √ 2 𝐼1 𝐼2 |𝑔 | . (12.41) 𝒱= 𝐼1 + 𝐼2 12 Die Sichtbarkeit ist daher proportional zum Betrag |𝑔12 | der normierten Kreuzkorrelation. In dem Spezialfall 𝐼1 = 𝐼2 folgt 𝒱 = |𝑔12 | .
(12.42)
Wir werden die Interferenzgleichung (12.39) nun in mehreren spezifischen Kontexten betrachten, um die Effekte zu illustrieren, die zeitliche und räumliche Kohärenz auf die Interferenz von partiell kohärentem Licht hat.
12.2.2
Interferometrie und zeitliche Kohärenz
Wir betrachten eine partiell kohärente Welle 𝑈(𝑡) mit der Intensität 𝐼0 und dem komplexen zeitlichen Kohärenzgrad 𝑔(𝜏) = ⟨𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏)⟩∕𝐼0 . Welche Intensität 𝐼 hat die Superposition, wenn 𝑈(𝑡) zu einer Kopie seiner selbst addiert wird, die um eine Zeit 𝜏 verzögert ist, 𝑈(𝑡 + 𝜏)? Wir verwenden die Interferenzgleichung (12.38) mit 𝑈1 = 𝑈(𝑡), 𝑈2 = 𝑈(𝑡 + 𝜏), 𝐼1 = 𝐼2 = 𝐼0 und 𝑔12 = ⟨𝑈1∗ 𝑈2 ⟩∕𝐼0 = ⟨𝑈 ∗ (𝑡)𝑈(𝑡 + 𝜏)⟩∕𝐼0 = 𝑔(𝜏) und erhalten so 𝐼 = 2𝐼0 [1 + Re {𝑔(𝜏)}] = 2𝐼0 [1 + |𝑔(𝜏)| cos 𝜑(𝜏)] (12.43) mit 𝜑(𝜏) = arg{𝑔(𝜏)}. Die Fähigkeit einer Welle, mit einer um eine bestimmte Zeit verzögerten Kopie ihrer selbst zu interferieren, wird durch ihren komplexen zeitlichen Kohärenzgrad für diese Zeitverzögerung bestimmt. Die Superposition einer Welle mit einer zeitverzögerten Replik von sich selbst kann praktisch erreicht wer-
den, indem man einen Strahlteiler verwendet, um zwei identische Wellen zu erzeugen, von denen eine über einen längeren optischen Weg geschickt wird als die andere, bevor beide in einem anderen (oder demselben) Strahlteiler wieder rekombiniert werden. Das ist beispielsweise mithilfe eines Mach-Zehnder- oder Michelsoninterferometers möglich (siehe Abb. 2.24). Wir betrachten als Beispiel die partiell kohärente ebene Welle mit dem komplexen zeitlichen Kohärenzgrad 𝑔(𝜏) = 𝑔a (𝜏) exp(i𝜔0 𝜏), die wir in Abschnitt 12.1.4 [Gl. (12.31)] eingeführt hatten. Die spektrale Breite der Welle ist Δ𝜈K = 1∕𝜏K , wobei 𝜏K (die Breite von |𝑔a (𝜏)|) die Kohärenzzeit ist. Wenn wir das in Gl. (12.43) einsetzen, erhalten wir 𝐼 = 2𝐼0 {1 + |𝑔a (𝜏)| cos [𝜔0 𝜏 + 𝜑a (𝜏)]}
(12.44)
mit 𝜑a (𝜏) = arg{𝑔a (𝜏)}. Die Beziehung zwischen 𝐼 und 𝜏, die als Interferogramm bezeichnet wird, ist in Abb. 12.14 dargestellt. Wenn wir annehmen, dass Δ𝜈K = 1∕𝜏K ≪ 𝜈0 ist, variieren die Funktionen |𝑔a (𝜏)| und 𝜑a (𝜏) langsam im Vergleich mit der Periode 1∕𝜈0 . Die Sichtbarkeit dieses Interferogramms in der Umgebung einer gegebenen zeitlichen Verzögerung 𝜏 ist 𝒱 = |𝑔(𝜏)| = |𝑔a (𝜏)|. Sie erreicht ihren Maximalwert von eins nahe 𝜏 = 0 und verschwindet für 𝜏 ≫ 𝜏K , d. h. wenn die Differenz der optischen Weglängen viel größer ist als die Kohärenzlänge 𝑙K = 𝑐𝜏K . Für das in Abb. 12.14 gezeigte Michelsoninterferometer ist 𝜏 = 2(d 2 − d 1 )∕𝑐. Interferenz tritt nur ein, wenn die Differenz der optischen Weglängen kleiner ist als die Kohärenzlänge. Der Betrag |𝑔(𝜏)| des komplexen zeitlichen Kohärenzgrads einer Welle kann daher gemessen werden, indem man die Sichtbarkeit des Interferenzmusters als Funktion der Zeitverzögerung beobachtet. Die Phase von 𝑔(𝜏) kann gemessen werden, indem man die Positionen der Peaks des Musters verfolgt. FT-Spektroskopie
Es ist aufschlussreich, Gl. (12.43) durch die spektrale Leistungsdichte der Welle S (𝜈) auszudrücken. Dazu verwenden wir die Tatsache, dass 𝐺(𝜏) und S (𝜈) über eine Fouriertransformation zusammenhängen, ∞
𝐺(𝜏) = 𝐼0 𝑔(𝜏) = ∫ S (𝜈) exp(i2π𝜈𝜏) d𝜈 .
(12.45)
0
Das setzen wir in Gl. (12.43) ein und erinnern uns, dass ∞
S (𝜈) reell und ∫0 S (𝜈) d𝜈 = 𝐼0 ist; so erhalten wir ∞
𝐼 = 2 ∫ S (𝜈) [1 + cos(2π𝜈𝜏)] d𝜈 . 0
(12.46)
12.2 Interferenz von partiell kohärentem Licht
1
U
2
I 2I0
Abb. 12.14 Die normierte Intensität I∕2I0 als Funktion der Zeitverzögerung 𝜏 für eine partiell kohärente ebene Welle in einem Michelsoninterferometer. Die Sichtbarkeit bestimmt den Betrag des komplexen zeitlichen Kohärenzgrads.
2 2|
12 |
1 U1 + U2
I
0
0
Diese Gleichung kann als Beschreibung einer gewichteten Superposition von Interferogrammen interpretiert werden, die durch jede der monochromatischen Komponenten der Welle erzeugt werden. Jede Komponente 𝜈 produziert ein Interferogramm mit der Periode 1∕𝜈 und der Sichtbarkeit eins; die Sichtbarkeit des kombinierten Interferogramms ist jedoch wegen der unterschiedlichen Perioden reduziert. Gleichung (12.46) legt nahe, dass die spektrale Dichte S (𝜈) einer Lichtquelle bestimmt werden kann, indem man das Interferogramm 𝐼 als Funktion von 𝜏 misst und dann das Ergebnis einer inversen Fouriertransformation unterwirft. Diese Technik wird in der FT-Spektroskopie eingesetzt.
τ = 2(
2 – 1)/ c
das Interferogramm aus Streifen bei den Weglängendifferenzen des beweglichen Spiegels, die denen der reflektierenden Grenzflächen entsprechen. Wir bezeichnen die an dem beweglichen Spiegel reflektierte Welle mit 𝑈(𝑡 − 𝜏), ihre zugehörige Zeitverzögerung mit 𝜏 = d ∕𝑐0 und die an den Grenzflächen der Probe reflektierten Wellen mit r𝑖 𝑈(𝑡 − 𝜏𝑖 ) (𝑖 = 1, 2, …), wobei r𝑖 der Amplitudenreflexionsgrad der 𝑖-ten Grenzfläche ist; die zugehörigen Zeitverzögerungen seien 𝜏𝑖 . Für einen symmetrischen Strahlteiler ist die mittlere In∑ tensität dann 𝐼(𝜏) = ⟨|𝑈(𝑡 − 𝜏) + 𝑖 r𝑖 𝑈(𝑡 − 𝜏𝑖 )|2 ⟩, die in normierter Form als ∑ ∑ 𝐼∕2𝐼0 = 1 + r𝑖 Re{𝑔(𝜏 − 𝜏𝑖 )} + r𝑖 r∗𝑗 Re{𝑔(𝜏𝑗 − 𝜏𝑖 )} 𝑖
(12.47)
Optische Kohärenztomographie
Die optische Kohärenztomographie (OCT, engl. optical coherence tomography) ist eine interferometrische Technik zur Aufnahme eines Tiefenprofils von Schichtmedien, d. h. zur Messung des Reflexionsgrads und der Tiefe jeder Grenzfläche. In ihrer einfachsten Form, der Zeitbereichs-OCT, wird dazu eine partiell kohärente Lichtquelle mit kurzer Kohärenzlänge und ein Michelsoninterferometer eingesetzt. Wie in Abb. 12.15 dargestellt wird dabei eine Replik der ursprünglichen Welle durch einen beweglichen Spiegel verzögert und anschließend mit den an den verschiedenen Grenzflächen der Probe reflektierten Wellen überlagert. In dem Interferogramm, d. h. in der am Detektor gemessenen Intensität bei Verschiebung des beweglichen Spiegels, ist die Information über das Tiefenprofil der Probe enthalten. Aufgrund der kurzen Kohärenzlänge der Quelle besteht
geschrieben werden kann, da der komplexe zeitliche Kohärenzgrad der Quelle durch 𝑔(𝜏) = ⟨𝑈 ∗ (𝑡) 𝑈(𝑡 + 𝜏)⟩ ∕⟨𝑈 ∗ (𝑡) 𝑈(𝑡)⟩ charakterisiert ist. Der zweite Term auf der rechten Seite von Gl. (12.47) ist entscheidend, da er die Interferenz zwischen der von dem beweglichen Spiegel kommenden Referenzwelle und den an den Grenzflächen der Probe reflektierten Wellen beschreibt. Der dritte Term bezeichnet Interferenzterme im Zusammenhang mit mehrfachen Reflexionen an der Probe; da diese Terme nicht von der durch den beweglichen Spiegel hervorgerufenen Weglängendifferenz 𝜏 = 𝑑∕𝑐 abhängen, können sie in diesem Zusammenhang ignoriert werden. Für eine Lichtquelle der Mittenfrequenz 𝜈0 ist 𝑔(𝜏) = 𝑔a (𝜏) exp(i𝜔0 𝜏), wobei die Breite von 𝑔a (𝜏) gleich der
Abb. 12.15 Optische Kohärenztomographie.
beweglicher Spiegel
0 Probe 1 2 3 ..
I 2I0
2 1
0
I
0
3
2
1
Detektor
𝑖𝑗
τ1
τ2
τ
361
362
12 Statistische Optik
Kohärenzzeit 𝜏K ist. Gleichung (12.47) wird dann ∑ 𝐼 ≈ 1 + r𝑖 |𝑔a (𝜏 − 𝜏𝑖 )| cos [𝜔0 (𝜏 − 𝜏𝑖 ) + 𝜑a (𝜏 − 𝜏𝑖 )] 2𝐼0 𝑖 (12.48) mit 𝜑a (𝜏) = arg{𝑔a (𝜏)}. Wenn die Quelle eine kurze Kohärenzlänge besitzt, ist die Funktion 𝑔a (𝜏) schmal. Wie in Abb. 12.15 dargestellt, erzeugt die Reflexion an jeder Grenzfläche der Probe dann einen unterschiedlichen Satz von Interferenzstreifen mit einer kurzen Dauer 𝜏K bei der entsprechenden Zeitverzögerung. Die Messung des Interferogramms in der optischen Kohärenztomographie erlaubt daher die Bestimmung der Reflexionsgrade aller Grenzflächen sowie der Dicke aller Schichten in der Probe. Die optische Kohärenztomographie hat sich als effektive bildgebende Technik in der klinischen Medizin sowie im Ingenieurwesen bewährt. Sie kann entsprechend einer Fouriertransformationsspektroskopie auch im Frequenzbereich durchgeführt werden. Eine besonders nützliche Anordnung verwendet hierzu einen schmalbandige Lichtquelle, deren Frequenz zeitlich variiert werden kann (d. h. einen abstimmbaren Laser); diese Variante verbindet eine verbesserte Nachweisempfindlichkeit mit höheren Durchsätzen.
Orten r1 und r2 . Die Welle hat die wechselseitige Kohärenzfunktion 𝐺(r1 , r2 , 𝜏) = ⟨𝑈 ∗ (r1 , 𝑡)𝑈(r2 , 𝑡 + 𝜏)⟩ und den komplexen Kohärenzgrad 𝑔(r1 , r2 , 𝜏). Die Intensitäten an den beiden Löchern sollen gleich sein. Das Licht wird in Form zweier Kugelwellen um die Löcher gebeugt. Die beiden Wellen interferieren, und die Intensität 𝐼 ihrer Summe wird an einem Punkt r in der Beobachtungsebene in einer Entfernung d beobachtet, die so groß ist, dass die parabolische Näherung anwendbar ist. In kartesischen Koordinaten (Abb. 12.16) ist r1 = (−𝑎, 0, 0), r2 = (𝑎, 0, 0) und r = (𝑥, 0, d ). Die Intensität wird als Funktion von 𝑥 beobachtet. Ein wichtiger geometrischer Parameter ist der von den Löchern aufgespannte Winkel 𝜃 ≈ 2𝑎∕d . In der parabolischen (Fresnel-) Näherung [siehe Gl. (2.21)] hängen die beiden gebeugten Kugelwellen mit 𝑈(r, 𝑡) näherungsweise durch 𝑈1 (r, 𝑡) ∝ 𝑈 (r1 , 𝑡 − ≈ 𝑈 (r1 , 𝑡 − 𝑈2 (r, 𝑡) ∝ 𝑈 (r2 , 𝑡 − ≈ 𝑈 (r2 , 𝑡 −
12.2.3
|r − r1 | ) 𝑐 d + (𝑥 + 𝑎)2 ∕2d
𝑐
)
(12.49a)
)
(12.49b)
|r − r2 | ) 𝑐 d + (𝑥 − 𝑎)2 ∕2d
𝑐
Interferometrie und räumliche Kohärenz
Die Wirkung der räumlichen Kohärenz auf die Interferenz wollen wir anhand des Zweiloch-Interferenzexperiments von Young illustrieren, das wir in Übung 210 für kohärentes Licht diskutiert hatten. Eine partiell kohärente optische Welle 𝑈(r, 𝑡) scheint auf einen undurchsichtigen Schirm mit zwei kleinen Löchern an den
zusammen und haben annähernd gleiche Intensitäten 𝐼1 = 𝐼2 = 𝐼0 . Die normierte Kreuzkorrelation zwischen den zwei Wellen am Ort r ist 𝑔12 =
⟨𝑈1∗ (r, 𝑡)𝑈2 (r, 𝑡)⟩ = 𝑔(r1 , r2 , 𝜏𝑥 ) , 𝐼0
(12.50)
λ θ
z θ = 2a λ
I 2I0
x
2
2a
| (r1, r2)|
λ θ
1
0
Abb. 12.16 Das Zweilochinterferometer nach Young mit Beleuchtung durch partiell kohärentes Licht. Die einfallende Welle ist quasimonochromatisch, und die normierte wechselseitige Intensität an den Löchern ist g(r1 , r2 ). Die nor-
0
x
mierte Intensität I∕2I0 in der Beobachtungsebene in einer großen Entfernung ist eine sinusförmige Funktion von x mit der Periode 𝜆∕𝜃 und der Sichtbarkeit 𝒱 = |g(r1 , r2 )|.
12.2 Interferenz von partiell kohärentem Licht
𝑥𝑧-Ebene unter einem kleinen Winkel 𝜃𝑥 zur 𝑧-Achse, d. h. 𝑈(r, 𝑡) ≈ exp[−i(𝑘𝑧 + 𝑘𝜃𝑥 𝑥)] exp(i𝜔0 𝑡), dann ist 𝑔(r1 , r2 ) = exp(−i𝑘𝜃𝑥 2𝑎). Die Sichtbarkeit bleibt immer noch 𝒱 = 1, aber der Neigungswinkel erzeugt eine Phasenverschiebung 𝜑 = −𝑘𝜃𝑥 2𝑎 = −2π𝜃𝑥 2𝑎∕𝜆, sodass das Interferenzmuster um einen Bruchteil (2𝑎𝜃𝑥 ∕𝜆) einer Periode seitwärts verschoben wird. Für 𝜑 = 2π wird das Muster um eine volle Periode verschoben.
wobei |r − r1 | − |r − r2 | (𝑥 + 𝑎)2 − (𝑥 − 𝑎)2 = 𝑐 2d 𝑐 (12.51) 2𝑎𝑥 𝜃 = = 𝑥 𝑐 d𝑐
𝜏𝑥 =
die Differenz der Zeitverzögerungen der beiden Wellen ist. Wenn wir Gl. (12.50) in die Interferenzgleichung (12.39) einsetzen, erhalten wir für die beobachtete Intensität 𝐼 ≡ 𝐼(𝑥) 𝐼(𝑥) = 2𝐼0 [1 + |𝑔(r1 , r2 , 𝜏𝑥 )| cos 𝜑𝑥 ]
Interferenz mit Licht aus einer ausgedehnten Quelle
Nun stellen wir uns das einfallende Licht als eine Sammlung von unabhängigen ebenen Wellen vor, die aus einer ausgedehnten Quelle kommen, die vom Schirm aus unter einem Winkel 𝜃Q erscheint (Abb. 12.17). Die Phasenverschiebung 𝜑 nimmt dann Werte im Bereich ±2π(𝜃Q ∕2)2𝑎∕𝜆 = ±2π𝜃Q 𝑎∕𝜆 an, und das Streifenmuster ist eine Superposition von versetzten Sinusfunktionen. Für 𝜃Q = 𝜆∕2𝑎 nimmt 𝜑 Werte im Intervall ±π an; das reicht aus, um die Interferenz zu verwischen und ihre Sichtbarkeit auf null zu reduzieren. Wir schließen daraus, dass der räumliche Kohärenzgrad an den beiden Löchern sehr klein ist, wenn der Winkeldurchmesser der Quelle 𝜃Q = 𝜆∕2𝑎 (oder größer) ist. Folglich ist die Entfernung
(12.52)
mit 𝜑𝑥 = arg{𝑔(r1 , r2 , 𝜏𝑥 )}. Diese Gleichung beschreibt das Muster der beobachteten Intensität als Funktion des Ortes 𝑥 in der Beobachtungsebene sowie als Funktion des Betrags und der Phase des komplexen Kohärenzgrads an den Löchern bei einer Zeitverzögerung 𝜏𝑥 = 𝜃𝑥∕𝑐. Quasimonochromatisches Licht
Wenn das Licht mit der Mittenfrequenz 𝜈0 = 𝜔0 ∕2π quasimonochromatisch ist, d. h. wenn 𝑔(r1 , r2 , 𝜏) ≈ 𝑔(r1 , r2 ) exp(i𝜔0 𝜏) gilt, dann liefert Gl. (12.52) 𝐼(𝑥) = 2𝐼0 [1 + 𝒱 cos (
2π𝜃 𝑥 + 𝜑)] 𝜆
(12.53)
𝜌K ≈
mit 𝜆 = 𝑐∕𝜈0 , 𝒱 = |𝑔(r1 , r2 )|, 𝜏𝑥 = 𝜃𝑥∕𝑐 und 𝜑 = arg{𝑔(r1 , r2 )}. Das Interferenzmuster ist daher sinusförmig mit der räumlichen Periode 𝜆∕𝜃 und der Sichtbarkeit 𝒱. Analog zum zeitlichen Fall ist die Sichtbarkeit des Interferenzmusters gleich dem Betrag des komplexen räumlichen Kohärenzgrads an den beiden Löchern (Abb. 12.16). Die Lage der Peaks hängt von der Phase 𝜑 ab. Wenn die einfallende Welle im Younginterferometer eine kohärente ebene Welle ist, die sich in 𝑧-Richtung ausbreitet, 𝑈(r, 𝑡) = exp(−i𝑘𝑧) exp(i𝜔0 𝑡), dann ist 𝑔(r1 , r2 ) = 1, sodass |𝑔(r1 , r2 )| = 1 und arg{𝑔(r1 , r2 )} = 0 wird. Das Interferenzmuster hat daher eine Sichtbarkeit von eins und einen Peak bei 𝑥 = 0. Wenn die Welle stattdessen schief einfällt, aus einer Richtung in der z θ 2a
θQ
x
I 2I0
𝜆 𝜃Q
(12.54)
ein Maß für den Kohärenzabstand in der Ebene des Schirms und AK ≈ (
𝜆 ) 𝜃Q
2
(12.55)
ist ein Maß für die Kohärenzfläche von Licht aus einer Quelle mit dem Winkeldurchmesser 𝜃Q . Der Winkeldurchmesser der Sonne beträgt beispielsweise 0.5◦ , sodass der Kohärenzabstand für gefiltertes Sonnenlicht der Wellenlänge 𝜆 gleich 𝜌K ≈ 𝜆∕𝜃Q ≈ 115𝜆 ist. Bei 𝜆 = 0.5 μm ist 𝜌𝐾 ≈ 57.5 μm. Eine strengere Analyse (siehe Abschnitt 12.3.3) ergibt für den transversalen Kohärenzabstand 𝜌K einer kreisAbb. 12.17 Die Interferenzstreifen verschwinden, wenn die Beleuchtung von einer Quelle mit einem Winkeldurchmesser 𝜃Q > 𝜆∕2a ausgeht. Wenn der Abstand 2a kleiner ist als 𝜆∕𝜃Q , werden die Streifen sichtbar.
λ θ
I0 0
x
363
364
12 Statistische Optik
förmigen inkohärenten Lichtquelle mit homogener Intensität 𝜌K = 1.22
𝜆 . 𝜃Q
(12.56)
Der Einfluss der spektralen Breite auf die Interferenz
Schließlich untersuchen wir noch den Einfluss der spektralen Breite auf die Interferenz im Zweilochinterferometer von Young. Wir nehmen an, dass die spektrale Leistungsdichte der einfallenden Welle eine schmale Funktion der Breite Δ𝜈K um 𝜈0 ist und dass Δ𝜈K ≪ 𝜈0 gilt. Der komplexe Kohärenzgrad hat dann die Form 𝑔(r1 , r2 , 𝜏) = 𝑔a (r1 , r2 , 𝜏) exp(i𝜔0 𝜏) ,
(12.57)
wobei 𝑔a (r1 , r2 , 𝜏) eine langsam variierende Funktion von 𝜏 ist (im Vergleich mit einer Periode 1∕𝜈0 ). Wenn wir Gl. (12.57) in Gl. (12.52) einsetzen, erhalten wir 𝐼(𝑥) = 2𝐼0 [1 + 𝒱𝑥 cos (
2π𝜃 𝜆
𝑥 + 𝜑𝑥 )]
(12.58)
mit 𝒱𝑥 = |𝑔a (r1 , r2 , 𝜏𝑥 )|, 𝜑𝑥 = arg{𝑔a (r1 , r2 , 𝜏𝑥 )}, 𝜏𝑥 = 𝜃𝑥∕𝑐 und 𝜆 = 𝑐∕𝜈0 . Das Interferenzmuster ist also sinusförmig mit der Periode 𝜆∕𝜃, aber mit einer variierenden Sichtbarkeit 𝒱𝑥 und einer variierenden Phase 𝜑𝑥 , die gleich dem Betrag bzw. der Phase des komplexen Kohärenzgrads an den beiden Löchern sind, jeweils berechnet für die Zeitverzögerung 𝜏𝑥 = 𝜃𝑥∕𝑐. Wenn |𝑔a (r1 , r2 , 𝜏)| = 1 für 𝜏 = 0 ist, mit zunehmenden 𝜏 abnimmt, und für 𝜏 ≫ 𝜏K verschwindet, dann ist die Sichtbarkeit 𝒱𝑥 = 1 für 𝑥 = 0, nimmt mit zunehmenden 𝑥 ab und verschwindet für 𝑥 ≫ 𝑥K = 𝑐𝜏K ∕𝜃. Das Interferenzmuster ist dann über eine Entfernung 𝑥K =
𝑙K 𝜃
(12.59)
Die Zahl erkennbarer Streifen ist somit 𝑥K ∕(𝜆∕𝜃) = 𝑙K ∕𝜆 = 𝑐𝜏K ∕𝜆 = 𝜈0 ∕Δ𝜈K . Das ist gleich dem Verhältnis 𝑙K ∕𝜆 der Kohärenzlänge zur Mittenwellenlänge oder dem Verhältnis 𝜈0 ∕Δ𝜈K der Mittenfrequenz zur Linienbreite. Offensichtlich wird die Sichtbarkeit weiter reduziert. Noch weniger Streifen sind sichtbar, wenn |𝑔(r1 , r2 , 0)| < 1 ist, d. h. wenn die Quelle räumlich nicht kohärent ist.
12.3 Transmission von partiell kohärentem Licht durch optische Systeme Der Durchgang von kohärentem Licht durch dünne optische Komponenten, Öffnungen und Vakuum wurde in den Kapiteln 2 und 4 besprochen. In diesem Abschnitt verfolgen wir dasselbe Ziel für quasimonochromatisches partiell kohärentes Licht. Wir nehmen an, dass die spektrale Breite so klein ist, dass die Kohärenzlänge 𝑙K = 𝑐𝜏K = 𝑐∕Δ𝜈K viel größer ist als die Differenzen der optischen Weglängen im System. Die wechselseitige Kohärenzfunktion ist dann näherungsweise 𝐺(r1 , r2 , 𝜏) ≈ 𝐺(r1 , r2 ) exp(i𝜔0 𝜏), wobei 𝐺(r1 , r2 ) die wechselseitige Intensität und 𝜈0 die Mittenfrequenz sind. Zu Beginn wollen wir festhalten, dass die Transmissionsgesetze, die für die deterministische Funktion 𝑈(r) von kohärentem Licht gelten, auch für die stochastische Funktion 𝑈(r) von partiell kohärentem Licht gelten. Für partiell kohärentes Licht gilt unser Interesse aber vor allem den Gesetzen, die die statistischen Mittelwerte bestimmen: die Intensität 𝐼(r) und die wechselseitige Intensität 𝐺(r1 , r2 ).
12.3.1
Ausbreitung von partiell kohärentem Licht
Durchgang durch dünne optische Komponenten
sichtbar, wobei 𝑙K = 𝑐𝜏K die Kohärenzlänge ist und 𝜃 der von den beiden Löchern aufgespannte Winkel (Abb. 12.18). Beobachtungsebene
Wenn eine partiell kohärente Welle durch eine dünne optische Komponente mit der Amplitudentransmission t(𝑥, 𝑦) hindurchtritt, hängen die einfallenden und
λ θ
I 2I0
θ = 2a
2a
x
xK =
lK θ λ θ
2
1
einfallende Welle
Schirm
0
0
x
Abb. 12.18 Die Sichtbarkeit der Interferenzstreifen am Ort x ist gleich dem Betrag des komplexen Kohärenzgrads an den Löchern bei einer Zeitverzögerung 𝜏x = 𝜃 x∕c. Für räumlich kohärentes Licht ist die Zahl erkennbarer Streifen gleich dem Verhältnis der Kohärenzlänge zur Mittenwellenlänge oder dem Verhältnis der Mittenfrequenz zur Linienbreite.
12.3 Transmission von partiell kohärentem Licht durch optische Systeme
x r1 U1(r)
x
U(x,y,z)
r2 U1(r)
U2(r)
y
Abb. 12.19 Der Absolutwert des räumlichen Kohärenzgrads wird durch die Transmission durch eine dünne optische Komponente nicht verändert.
durchgelassenen Wellen durch 𝑈2 (r) = t(r)𝑈1 (r) zusammen, wobei r = (𝑥, 𝑦) der Ort in der Ebene der Komponente ist (siehe Abb. 12.19). Wenn wir die Definition der wechselseitigen Intensität benutzen, 𝐺(r1 , r2 ) = ⟨𝑈 ∗ (r1 )𝑈(r2 )⟩, erhalten wir 𝐺2 (r1 , r2 ) = t∗ (r1 )t(r2 )𝐺1 (r1 , r2 ) ,
(12.61)
Für die durch Gl. (12.27) definierten normierten wechselseitigen Intensitäten gilt daher |𝑔2 (r1 , r2 )| = |𝑔1 (r1 , r2 )| .
(12.62)
Der Durchgang durch eine dünne optische Komponente kann zwar die Intensität des partiell kohärenten Lichts ändern, aber nicht den Betrag seines räumlichen Kohärenzgrads. Nur wenn die komplexe Amplitudentransmission der Komponente selbst stochastisch wäre, würde die Kohärenz des durchgelassenen Lichts verändert. Durchgang durch ein beliebiges optisches System
Wir betrachten als Nächstes ein beliebiges optisches System, wozu auch die Ausbreitung im Vakuum oder dicke optische Komponenten gehören können. In Kapitel 4 hatten wir gezeigt, dass die komplexe Amplitude 𝑈2 (r) an einem Punkt r = (𝑥, 𝑦) in der Ausgangsebene eines solchen Systems allgemein ein gewichtetes Superpositionsintegral ist, das aus Beiträgen von komplexen Amplituden 𝑈1 (r) an Punkten r′ = (𝑥′ , 𝑦 ′ ) in der Eingangsebene besteht (siehe Abb. 12.20), 𝑈2 (r) = ∫ ℎ(r; r′ )𝑈1 (r′ ) dr′ ,
optisches System
U2(r)
y
Ausgangsebene
Abb. 12.20 Ein optisches System wird durch seine Impulsantwortfunktion h(r; r′ ) charakterisiert.
Um diese Beziehung zwischen den stochastischen Funktionen 𝑈2 (r) und 𝑈1 (r) in eine Beziehung zwischen ihren wechselseitigen Intensitäten zu übersetzen, setzen wir Gl. (12.63) in die Definition 𝐺2 (r1 , r2 ) = ⟨𝑈2∗ (r1 )𝑈2 (r2 )⟩ ein und verwenden die Definition 𝐺1 (r1 , r2 ) = ⟨𝑈1∗ (r1 )𝑈1 (r2 )⟩; das ergibt
(12.60)
wobei 𝐺1 (r1 , r2 ) und 𝐺2 (r1 , r2 ) die wechselseitigen Intensitäten des einfallenden bzw. durchgelassenen Lichts sind. Da die Intensität am Ort r gleich der wechselseitigen Intensität am Ort r1 = r2 = r ist, folgt 𝐼2 (r) = |t(r)|2 𝐼1 (r) .
Eingangsebene
h(r, r ʹ)
(12.63)
wobei ℎ(r; r′ ) die Impulsantwortfunktion des Systems ist. Das Integral in Gl. (12.63) ist ein doppeltes Integral über r′ = (𝑥′ , 𝑦 ′ ) über die ganze Eingangsebene.
𝐺2 (r1 , r2 ) = ∬ ℎ∗ (r1 ; r′1 )ℎ(r2 ; r′2 )𝐺1 (r′1 , r′2 ) dr′1 dr′2 . (12.64) Wenn die wechselseitige Intensität 𝐺1 (r1 , r2 ) des Eingabelichts und die Impulsantwortfunktion ℎ(r; r′ ) des Systems bekannt sind, kann die wechselseitige Intensität des Ausgangslichts 𝐺2 (r1 , r2 ) bestimmt werden, indem man die Integrale in Gl. (12.64) auswertet. Die Intensität des Ausgangslichts erhalten wir, indem wir die Definition 𝐼2 (r) = 𝐺2 (r, r) verwenden, die sich mithilfe von Gl. (12.64) auf 𝐼2 (r) = ∬ ℎ∗ (r; r′1 )ℎ(r; r′2 )𝐺1 (r′1 , r′2 ) dr′1 dr′2
(12.65)
reduziert. Um die Intensität des Ausgangslichts zu bestimmen, müssen wir also die wechselseitige Intensität des Eingangslichts kennen. Die Kenntnis der Eingangsintensität 𝐼1 (r) alleine reicht im Allgemeinen nicht aus, um die Ausgangsintensität 𝐼2 (r) zu bestimmen.
12.3.2 Bildentstehung mit inkohärentem Licht Wir betrachten jetzt den speziellen Fall, dass das Eingangslicht inkohärent ist. Die wechselseitige Intensität 𝐺1 (r1 , r2 ) verschwindet, sobald r2 auch nur ein wenig von r1 entfernt ist, sodass der Kohärenzabstand viel kleiner ist als andere relevante Entfernungen im System (z. B. die Auflösungsentfernung eines bildgebenden Systems). Die wechselseitige Intensität√kann dann gemäß Gl. (12.27) in der Form 𝐺1 (r1 , r2 ) = 𝐼1 (r1 )𝐼1 (r2 ) 𝑔(r1 − r2 ) geschrieben werden, wobei 𝑔(r1 − r2 ) eine sehr schmale Funktion ist. Wenn 𝐺1 (r1 , r2 ) unter dem Integral in Gl. (12.64) oder (12.65) erscheint, ist es zweckmäßig, 𝑔(r1 − r2 ) durch eine Deltafunktion zu ersetzen,
365
366
12 Statistische Optik x
U1(r)
h(r;rʹ)
(a)
U2(r)
d1
p(x,y)
2
0
Linse
y
I1(r)
(b)
h1(r;rʹ)
I2(r) Gegenstandsebene
Abb. 12.21 (a) In einem von kohärentem Licht beleuchteten optischen System sind die komplexen Amplituden des Lichts in der Eingangs- und der Ausgangsebene durch ein lineares System mit der Impulsantwortfunktion h(r; r′ ) verknüpft. (b) In einem von inkohärentem Licht beleuchteten optischen System sind die komplexen Intensitäten des Lichts in der Eingangs- und Ausgangsebene durch ein lineares System mit der Impulsantwortfunktion hi (r; r′ ) = 𝜎|h(r; r′ )|2 verknüpft.
𝑔(r1 − r2 ) = 𝜎𝛿(r1 − r2 ), wobei 𝜎 = ∫ 𝑔(r) dr die Fläche unter 𝑔(r) ist, sodass wir erhalten 𝐺1 (r1 , r2 ) ≈ 𝜎
√
𝐼1 (r1 )𝐼1 (r2 ) 𝛿(r1 − r2 ) .
(12.66)
Da die wechselseitige Intensität endlich bleiben muss und 𝛿(0) → ∞ gilt, ist diese Gleichung offensichtlich nicht exakt. Sie ist aber anwendbar, um Integrale wie in Gl. (12.65) zu berechnen. Wenn wir Gl. (12.66) in Gl. (12.65) einsetzen, reduziert die Deltafunktion das doppelte Integral auf ein einfaches und wir erhalten 𝐼2 (r) = ∫ 𝐼1 (r′ )ℎi (r; r′ ) dr′
(12.67)
mit ℎi (r; r′ ) = 𝜎|ℎ(r; r′ )|2 .
(12.68)
Unter diesen Bedingungen beschreibt die Beziehung zwischen den Intensitäten in der Eingangs- und der Ausgangsebene ein lineares System mit der Impulsantwortfunktion ℎi (r; r′ ), die auch als Punktverbreiterungsfunktion (engl. point-spread function) bezeichnet wird. Wenn das Eingangslicht daher vollständig inkohärent ist, ist die Intensität des Lichts an jedem Punkt r in der Ausgangsebene eine gewichtete Superposition von Beiträgen von Intensitäten an vielen Punkten r′ der Eingangsebene; es tritt keine Interferenz auf und die Intensitäten werden einfach addiert (Abb. 12.21). Das steht im Gegensatz zu dem vollständig kohärenten System, für das die komplexen Amplituden und nicht die Intensitäten durch ein Superpositionsintegral wie in Gl. (12.63) zusammenhängen.
y Linse Blende Bildebene
x
Abb. 12.22 Ein abbildendes System aus einer einzelnen Linse.
In bestimmten optischen Systemen ist die Impulsantwortfunktion ℎ(r; r′ ) eine Funktion von r − r′ , z. B. ℎ(r − r′ ). Man bezeichnet ein solches System als verschiebungsinvariant oder isoplanatisch (siehe Anhang B). In diesem Fall ist ℎi (r; r′ ) = ℎi (r − r′ ). Die Integrale in den Gln. (12.63) und (12.67) sind dann zweidimensionale Faltungen und die Systeme können durch die Übertragungsfunktionen H(𝜈𝑥 , 𝜈𝑦 ) und Hi (𝜈𝑥 , 𝜈𝑦 ) beschrieben werden, die die Fouriertransformierten von ℎ(r) = ℎ(𝑥, 𝑦) bzw. ℎi (r) = ℎi (𝑥, 𝑦) sind. Als Beispiel wenden wir diese Beziehungen auf ein abbildendes System an. In Abschnitt 4.4.3 wurde gezeigt, dass die Impulsantwortfunktion des in Abb. 12.22 gezeigten bildgebenden Systems aus einer einzelnen fokussierten Linse bei kohärenter Beleuchtung in der Fresnelnäherung gleich ℎ(r) ∝ 𝑃 (
𝑦 𝑥 , ) 𝜆d 2 𝜆d 2
(12.69)
ist, wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte der Pupillenfunktion 𝑝(𝑥, 𝑦) ist und d 2 die Entfernung von der Linse zur Bildebene. Die Pupillenfunktion ist innerhalb der Öffnung eins und ansonsten null. Wenn die Beleuchtung quasimonochromatisch und räumlich inkohärent ist, sind die Intensitäten des Lichts in der Gegenstands- und der Bildebene durch ein System mit der Impulsantwortfunktion || 𝑦 |||2 𝑥 , )| ℎi (r) = 𝜎|ℎ(r)|2 ∝ |||𝑃 ( || 𝜆 d 2 𝜆 d 2 |||
(12.70)
linear verknüpft, wobei 𝜆 die Wellenlänge der Mittenfrequenz 𝜈0 ist.
12.3 Transmission von partiell kohärentem Licht durch optische Systeme
Beispiel 12-2: Ein abbildendes System mit einer kreisförmigen Öffnung
Wenn die Öffnung ein Kreis mit Radius 𝑎 ist, ist die Pupillenfunktion 𝑝(𝑥, 𝑦) = 1 für alle 𝑥, 𝑦 innerhalb des Kreises und 0 außerhalb. Ihre Fouriertransformierte ist (siehe Abschnitt A.3) 𝑎𝐽1 (2π𝜈𝜌 𝑎)
𝑃(𝜈𝑥 , 𝜈𝑦 ) = 𝜈𝜌 =
√
𝜈𝜌
, (12.71)
𝜈𝑥2 + 𝜈𝑦2 ,
wobei 𝐽1 (⋅) die Besselfunktion erster Ordnung ist. Die Impulsantwortfunktion des kohärenten Systems erhalten wir, wenn wir dies in Gl. (12.36) einsetzen, ℎ(𝑥, 𝑦) ∝ [ 𝜌=
√
𝐽1 (2π 𝜈Q 𝜌) ], π 𝜈Q 𝜌
(12.72)
𝑥2 + 𝑦 2 ,
mit 𝜈Q =
𝜃 , 2𝜆
𝜃=
2𝑎 d2
.
(12.73)
Dieses Ergebnis stimmt mit dem in Beispiel 4-8 angegebenen überein. Für inkohärente Beleuchtung ist die Impulsantwortfunktion daher 2
ℎi (𝑥, 𝑦) ∝ [
𝐽1 (2π 𝜈Q 𝜌) ] . π 𝜈Q 𝜌
(12.74)
Die Antwortfunktionen ℎ(𝑥, 𝑦) und ℎi (𝑥, 𝑦) sind in Abb. 12.23 oben dargestellt. Beide Funktionen erreichen ihre erste Nullstelle für 2π 𝜈Q 𝜌 = 3.832 oder 𝜌 = 𝜌Q ≈ 3.832∕2π 𝜈Q = 3.832𝜆∕π 𝜃; daraus folgt 𝜌Q ≈ 1.22
𝜆 . 𝜃
(12.75)
Das Bild eines Punkts (Impulses) in der Eingangsebene ist somit ein Fleck mit der Intensität ℎi (𝑥, 𝑦) und dem Radius 𝜌Q . Wenn die Eingangsverteilung aus zwei Punkten (Impulsen) in einem Abstand 𝜌Q besteht, verschwindet das Bild eines Punkts am Zentrum des Bildes des anderen Punkts. Die Entfernung 𝜌Q ist daher ein Maß für die Auflösung des bildgebenden Systems. Die Übertragungsfunktionen von linearen Systemen (siehe Anhang B) mit den Impulsantwortfunktionen ℎ(𝑥, 𝑦) und ℎi (𝑥, 𝑦) sind die Fouriertransformierten (siehe Anhang A) H(𝜈𝑥 , 𝜈𝑦 ) =
⎧1
für 𝜈𝜌 < 𝜈Q
⎨ 0 ⎩
ansonsten ,
(12.76)
und √ 2 ⎧ ⎡ √ 𝜈 𝜈 𝜈𝜌 ⎤ √ 2 𝜌 𝜌 ⎪ ⎢(cos−1 1−( )− ) ⎥ ⎪π⎢ 2𝜈Q 2𝜈Q 2𝜈Q ⎥ Hi (𝜈𝑥 , 𝜈𝑦 ) = ⎦ ⎨ ⎣ für 𝜈𝜌 < 2𝜈Q , ⎪ ⎪ 0 ansonsten , ⎩ (12.77) √ wobei 𝜈𝜌 = 𝜈𝑥2 + 𝜈𝑦2 ist. Beide Funktionen sind so normiert, dass ihre Werte für 𝜈𝜌 = 0 gleich 1 sind. Diese Funktionen sind unten in Abb. 12.23 dargestellt. Für kohärente Beleuchtung ist die Übertragungsfunktion flach und besitzt eine Grenzfrequenz 𝜈Q = 𝜃∕2𝜆 Linien∕mm. Für inkohärente Beleuchtung fällt die Übertragungsfunktion näherungsweise linear mit der Ortsfrequenz und besitzt eine Grenzfrequenz 2𝜈Q = 𝜃∕𝜆 Linien∕mm. Wenn der Gegenstand im Unendlichen liegt, d. h. d 1 = ∞ ist, dann ist d 2 = 𝑓, die Brennweite der Linse. Der Winkel 𝜃 = 2𝑎∕𝑓 ist dann der Kehrwert der Blendenzahl der Linse, 𝐹# = 𝑓∕2𝑎. Die Grenzfrequenzen 𝜈Q und 2𝜈Q hängen demnach durch ⎧ 1 ⎪ 2𝜆𝐹 (kohärente Beleuchtung) Grenzfrequenz # = ⎨ 1 (Linien/mm) (inkohärente Beleuchtung) ⎪ 𝜆𝐹# ⎩ (12.78) mit der Blendenzahl der Linse zusammen. Man sollte nun nicht den falschen Schluss ziehen, dass die inkohärente Beleuchtung der kohärenten Beleuchtung überlegen sei, weil sie die doppelte räumliche Bandbreite besitzt. Die Übertragungsfunktionen der beiden Systeme können nicht direkt verglichen werden, da die eine die Abbildung der komplexen Amplitude beschreibt, wohingegen die andere die Abbildung der Intensität wiedergibt.
12.3.3 Verstärkung der räumlichen Kohärenz durch Ausbreitung Gleichung (12.64) beschreibt die Änderung der wechselseitigen Intensität bei der Ausbreitung des Lichts durch ein optisches System mit der Impulsantwortfunktion ℎ(r; r′ ). Wenn das Eingangslicht inkohärent ist, kann die wechselseitige Intensität 𝐺1 (r1 , r2 ) näherungsweise durch Gl. (12.66) ersetzt werden, woraufhin sich das
367
Impulsantwortfunktionen
12 Statistische Optik
Übertragungsfunktionen
368
hi (ρ) 1
h (ρ) 1
1.22 λF# 0 0
ρ
ρQ
0 0
ρQ
ρ
Abb. 12.23 Impulsantwortfunktionen und Übertragungsfunktionen eines beugungsbegrenzten abbildenden Systems aus einer einzelnen fokussierten Linse mit einer kreisförmigen Öffnung und Blendenzahl F# bei (a) kohärenter und (b) inkohärenter Beleuchtung.
i (νρ)
(νρ) 1
1 1 λF#
0 0
νQ
νρ
(a) Kohärent
0 0
2νQ
νρ
(b) Inkohärent
das Signal nicht mehr unkorreliert ist. Die Ausbreitung des Lichts durch ein optisches System ist eine Form der räumlichen Filterung, die die räumliche Bandbreite beschneidet und so die Kohärenzfläche vergrößert.
2 1
Van-Cittert-Zernike-Theorem inkohärente Quelle
Abb. 12.24 Die Verstärkung der Kohärenz durch Ausbreitung ist ein Ergebnis der Verbreiterung des Lichts. Obwohl das Licht an der Quelle vollständig unkorreliert ist, teilen die Lichtfluktuationen an den Punkten 1 und 2 einen gemeinsamen Ursprung, die schattierte Fläche, und sind daher partiell korreliert.
doppelte Integral in Gl. (12.64) auf ∗
𝐺2 (r1 , r2 ) = 𝜎 ∫ ℎ (r1 ; r)ℎ(r2 ; r)𝐼1 (r) dr
Es gibt eine mathematische Ähnlichkeit zwischen der Verstärkung der Kohärenz von anfänglich inkohärentem Licht, das sich durch ein optisches System ausbreitet, und der Änderung der Amplitude von kohärentem Licht, das sich durch dasselbe System ausbreitet. Dazu beziehen wir uns auf Gl. (12.79), halten den Beobachtungspunkt r1 fest, z. B. am Ursprung 0, und untersuchen die wechselseitige Intensität 𝐺2 (0, r2 ) als Funktion von r2 ; so erhalten wir 𝐺2 (0, r2 ) = 𝜎 ∫ ℎ∗ (0; r)ℎ(r2 ; r)𝐼1 (r) dr .
(12.79)
reduziert. Offensichtlich ist das durchgelassene Licht nicht mehr inkohärent. Im Allgemeinen wird die räumliche Kohärenz des Lichts durch bloße Ausbreitung erhöht. Das ist nicht überraschend. Obwohl Fluktuationen an verschiedenen Punkten der Eingangsebene nicht korreliert sind, breitet sich die Strahlung von jedem Punkt aus und überlappt mit der Strahlung der benachbarten Punkte. Das Licht an zwei Punkten in der Ausgangsebene kommt von vielen Punkten in der Eingangsebene, von denen einige zu beiden Punkten in der Ausgangsebene beitragen [siehe Abb. (12.24)]. Diese gemeinsamen Beiträge erzeugen eine partielle Korrelation zwischen den Fluktuationen an den Punkten in der Ausgangsebene. Das ähnelt der Transmission eines unkorrelierten Zeitsignals (weißes Rauschen) durch ein Tiefpassfilter. Das Filter glättet die Funktion und reduziert ihre spektrale Bandbreite, sodass ihre Kohärenzzeit zunimmt und
(12.80)
Wir definieren nun 𝑈2 (r2 ) = 𝐺2 (0, r2 ) und 𝑈1 (r) = 𝜎ℎ∗ (0, r)𝐼1 (r) und können so Gl. (12.80) in der vertrauten Form 𝑈2 (r2 ) = ∫ ℎ(r2 ; r)𝑈1 (r) dr
(12.81)
schreiben. Dies ist genau das Integral Gl. (12.63), das die Ausbreitung von kohärentem Licht bestimmt. Folglich ist die beobachtete wechselseitige Intensität 𝐺(0, r2 ) am Ausgang eines optischen Systems mit einer inkohärenten Eingabe mathematisch mit der beobachteten komplexen Amplitude identisch, die eine kohärente Welle mit der komplexem Amplitude 𝑈1 (r) = 𝜎ℎ∗ (0; r)𝐼1 (r) als Eingabe in demselben System produzieren würde. Als Beispiel wollen wir den Fall betrachten, dass die inkohärente Eingabewelle über eine Öffnung 𝑝(r) eine konstante Intensität besitzt [𝑝(r) = 1 innerhalb der Öffnung und ansonsten 0], d. h. 𝐼1 (r) = 𝑝(r); das optische System soll einfach aus Vakuum bestehen, d. h.
12.3 Transmission von partiell kohärentem Licht durch optische Systeme
ℎ(r′ ; r) = exp(−i𝑘|r′ − r|)∕|r′ − r|. Die wechselseitige Intensität 𝐺2 (0, r2 ) ist dann mit der Amplitude 𝑈2 (r2 ) identisch, die man beobachtet, wenn eine kohärente Welle mit der Eingangsamplitude 𝑈1 (r) = 𝜎ℎ∗ (0; r)𝑝(r) = 𝜎𝑝(r) exp(i𝑘𝑟)∕𝑟 durch dasselbe System transmittiert wird. Das ist eine Kugelwelle, die auf den Punkt 0 in der Ausgangsebene konvergiert und durch die Öffnung transmittiert wird. Die Analogie zwischen der Beugung von kohärentem Licht und der Verstärkung der räumlichen Kohärenz von inkohärentem Licht, das sich durch dasselbe System ausbreitet, ist als Van-Cittert-Zernike-Theorem bekannt. Verstärkung der Kohärenz im Vakuum
Wir betrachten die Ausbreitung zwischen zwei parallelen Ebenen im Abstand d als optisches System (Abb. 12.25). Das Licht in der Eingangsebene ist quasimonochromatisch, räumlich inkohärent und hat die Intensität 𝐼(𝑥, 𝑦), die sich über eine endliche Fläche erstreckt. Die Impulsantwortfunktion des optischen Systems wird dann durch die Fresnel-Beugungsgleichung [siehe Gl. (4.18)] beschrieben, ℎ(r; r′ ) = ℎ0 exp [−iπ
(𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ] , (12.82) 𝜆d
wobei r = (𝑥, 𝑦, d ) und 𝑟 ′ = (𝑥′ , 𝑦 ′ , 0) die Koordinaten von Punkten in der Ausgangs- bzw. Eingangsebene sind und ℎ0 = (i∕𝜆 d ) exp(−i2πd ∕𝜆) eine Konstante ist. Um die wechselseitige Kohärenzfunktion 𝐺(𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 ) an zwei Punkten (𝑥1 , 𝑦1 ) und (𝑥2 , 𝑦2 ) in der Ausgangsebene zu bestimmen, setzen wir Gl. (12.82) in Gl. (12.79) ein und erhalten |𝐺(𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 )| || ∞ || 2π | = 𝜎1 ||| ∬ exp {i [(𝑥2 − 𝑥1 )𝑥 + (𝑦2 − 𝑦1 )𝑦]} 𝜆d ||| |−∞ || || | × 𝐼(𝑥, 𝑦) d𝑥 d𝑦 ||| , (12.83) || || x
x (x1, y1)
(x, y)
(x2, y2)
z
Quelle y
y
Beobachtungsebene
Abb. 12.25 Strahlung aus einer inkohärenten Quelle im Vakuum.
wobei 𝜎1 = 𝜎|ℎ0 |2 = 𝜎∕𝜆 2 d 2 eine weitere Konstante ist. Wenn 𝐼(𝑥, 𝑦) gegeben ist, können wir |𝐺(𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 )| einfach durch zweidimensionale Fouriertransformation von 𝐼(𝑥, 𝑦) bestimmen, berechnet bei 𝜈𝑥 = (𝑥2 − 𝑥1 )∕𝜆 d und 𝜈𝑦 = (𝑦2 − 𝑦1 )∕𝜆 d , ∞
ℐ(𝜈𝑥 , 𝜈𝑦 ) = ∬ exp[i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)]𝐼(𝑥, 𝑦) d𝑥 d𝑦 . −∞
(12.84) Der Betrag der entsprechenden normierten wechselseitigen Intensität ist |𝑔(𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 )| =
1 ℐ(0, 0)
| || ||ℐ ( 𝑥2 − 𝑥1 , 𝑦2 − 𝑦1 )||| . || || 𝜆d 𝜆d | | (12.85)
Diese Beziehung zwischen dem Intensitätsprofil einer inkohärenten Quelle und dem räumlichen Kohärenzgrad ihres Fernfelds ähnelt der Beziehung zwischen der Amplitude von kohärentem Licht in der Eingangs- und Ausgangsebene (siehe Abschnitt 4.2.1), was mit Blick auf das Van-Cittert-Zernike-Theorem zu erwarten war. Die Implikationen von Gl. (12.85) sind tiefgehend. Wenn die Fläche der Quelle, d. h. die räumliche Ausdehnung von 𝐼(𝑥, 𝑦), klein ist, ist ihre Fouriertransformierte ℐ(𝜈𝑥 , 𝜈𝑦 ) breit, sodass die wechselseitige Intensität in der Ausgangsebene sich über eine große Fläche erstreckt und die Kohärenzfläche in der Ausgangsebene groß ist. In dem Grenzfall, dass das Licht aus einem Punkt in der Eingangsebene entspringt, ist die Kohärenzfläche unendlich und das ausgestrahlte Feld ist räumlich vollständig kohärent. Das bestätigt unsere früheren Diskussionen in Abschnitt 12.1.4 bezüglich der Kohärenz von Kugelwellen. Wenn das kohärente Licht am Eingang andererseits von einer großen ausgedehnten Quelle stammt, ist die Kohärenzfläche klein. Beispiel 12-3: Strahlung aus einer inkohärenten kreisförmigen Quelle
Für Eingangslicht mit der konstanten Intensität 𝐼(𝑥, 𝑦) = 𝐼0 über eine kreisförmige Öffnung mit dem Radius 𝑎 ergibt Gl. (12.85) || 2𝐽 (π 𝜌𝜃 ∕𝜆) || Q | 1 || |𝑔(𝑥1 , 𝑦1 , 𝑥2 , 𝑦2 )| = ||| (12.86) |, || π 𝜌𝜃Q ∕𝜆 ||| √ wobei 𝜌 = (𝑥2 − 𝑥1 )2 + (𝑦2 − 𝑦1 )2 die Entfernung zwischen den beiden Punkten ist, 𝜃Q = 2𝑎∕d der Winkeldurchmesser der Quelle und 𝐽1 (⋅) eine Besselfunktion. Diese Beziehung ist in Abb. 12.26 aufgetragen. Die Besselfunktion erreicht ihre erste Nullstelle, wenn ihr
369
370
12 Statistische Optik
y ρ
z 1
2
θQ
Abb. 12.26 Der Betrag des räumlichen Kohärenzgrads von Licht aus einer inkohärenten kreisförmigen Lichtquelle mit einem Winkeldurchmesser 𝜃Q als Funktion des Abstands 𝜌.
ρK = 1.22 λ θQ
| | 1
x
inkohärente Quelle
0 0
ρK
ρ
2a
Argument 3.832 ist. Wir können daher die Kohärenzfläche als Kreis mit dem Radius 𝜌K = 3.832(𝜆∕π𝜃Q ) definieren; damit folgt 𝜌K = 1.22
𝜆 . 𝜃Q
(12.87)
Ein ähnliches Ergebnis, Gl. (12.54), hatten wir bereits auf der Grundlage einer weniger strengen Analyse erhalten. Die Kohärenzfläche ist umgekehrt proportional zu 𝜃Q2 . Eine inkohärente Lichtquelle mit der Wellenlänge 𝜆 = 0.6 μm und dem Radius 1 cm, die aus einer Entfernung d = 100 m beobachtet wird, hat beispielsweise einen Kohärenzabstand 𝜌K ≈ 3.7 mm. Die Messung des Winkeldurchmessers von Sternen: Das Michelson-Sterninterferometer
Gleichung (12.87) ist die Grundlage einer Methode zur Messung der Winkeldurchmesser von Sternen. Wenn der Stern als inkohärente Scheibe mit dem Durchmesser 2𝑎 und konstanter Helligkeit aufgefasst wird, dann fällt in einer Beobachtungsebene in einer Entfernung d von dem Stern die Kohärenzfunktion auf null, wenn der Abstand zwischen zwei Beobachtungspunkten 𝜌K = 1.22𝜆∕𝜃Q wird. Aus der Messung von 𝜌K für ein gegebenes 𝜆 können wir daher den Winkeldurchmesser 𝜃Q = 2𝑎∕d bestimmen. Beispielsweise ist der Winkeldurchmesser der Sonne 0.5◦ ; daraus ergibt sich 𝜃Q = 8.7 × 10−3 rad, und unter der Annahme konstanter Intensität erhalten wir 𝜌K = 140𝜆. Für 𝜆 = 0.5 μm ist 𝜌𝐾 = 70 μm. Um in einer Doppelspaltapparatur nach Young Interferenzstreifen beobachten zu können, müssten die Löcher in einem Abstand von höchstens 70 μm liegen. Sterne mit kleinerem Winkeldurchmesser haben entsprechend größere Kohärenzflächen. Der erste Stern, dessen Winkeldurchmesser nach dieser Methode gemessen wurde (𝛼 Orionis), hat z. B. einen Winkeldurchmesser 𝜃Q = 22.6 × 10−8 , sodass für 𝜆 = 0.57 μm 𝜌K = 3.1 m folgt. Ein Younginterferometer kann modifiziert werden, um solche großen Spaltabstände zu ermöglichen, indem wie in Abb. 12.27 gezeigt bewegliche Spiegel verwendet werden.
x
M1
ρ
M2 Schirm
I
Abb. 12.27 Michelson-Sterninterferometer. Der Winkeldurchmesser eines Sterns wird bestimmt, indem mit einem Young-Doppelspaltinterferometer die wechselseitige Intensität an zwei Punkten mit dem variablen Abstand 𝜌 gemessen wird. Die Entfernung 𝜌 zwischen den Spiegeln M1 und M2 wird variiert, und die Sichtbarkeit der Interferenzstreifen wird gemessen. Für 𝜌 = 𝜌K = 1.22𝜆∕𝜃Q wird die Sichtbarkeit gleich null.
12.4 Partielle Polarisation Wie wir in Kapitel 6 gesehen haben, ist die skalare Theorie des Lichts häufig unzulänglich; stattdessen ist eine Vektortheorie erforderlich, die die Polarisation des Lichts einschließt. Dieser Abschnitt gibt eine kurze Diskussion der statistischen Theorie von stochastischem Licht einschließlich der Effekte der Polarisation. Die Theorie der partiellen Polarisation beruht auf der Charakterisierung der Komponenten des optischen Feldvektors durch Korrelationen und Kreuzkorrelationen ähnlich den früher in diesem Kapitel definierten. Um die Darstellung zu vereinfachen, befassen wir uns nicht mit räumlichen Effekten. Wir beschränken uns daher auf Licht, das durch eine transversale elektromagnetische (TEM) ebene Welle beschrieben wird, die sich in 𝑧-Richtung ausbreitet. Der elektrische Feldvektor hat zwei Komponenten in 𝑥- und 𝑦-Richtung mit den komplexen Wellenfunktionen 𝑈𝑥 (𝑡) und 𝑈𝑦 (𝑡), die im Allgemeinen stochastisch sind. Jede Funktion wird durch ihre Autokorrelationsfunktion (die zeitliche Kohärenz-
12.4 Partielle Polarisation
funktion) charakterisiert, 𝐺𝑥𝑥 (𝜏) = ⟨𝑈𝑥∗ (𝑡)𝑈𝑥 (𝑡 + 𝜏)⟩ , 𝐺𝑦𝑦 (𝜏) =
⟨𝑈𝑦∗ (𝑡)𝑈𝑦 (𝑡
+ 𝜏)⟩ .
(12.88) (12.89)
Eine zusätzliche Größe zur Beschreibung der Welle ist die Kreuzkorrelationsfunktion von 𝑈𝑥 (𝑡) und 𝑈𝑦 (𝑡), 𝐺𝑥𝑦 (𝜏) = ⟨𝑈𝑥∗ (𝑡)𝑈𝑦 (𝑡 + 𝜏)⟩ .
(12.90)
ausgedrückt werden, der durch die komplexen Wellenfunktionen und komplexen Amplituden (anstatt durch die komplexen Einhüllenden wie in Abschnitt 6.1.2) definiert ist,
⟨
⎡𝑈𝑥∗ ⎤ [ ⟨J∗ JT ⟩ = ⎢ ∗ ⎥ 𝑈𝑥 𝑈 ⎣ 𝑦⎦
⟩
𝑈𝑦
]
⎡⟨𝑈𝑥∗ 𝑈𝑥 ⟩ =⎢ ∗ ⟨𝑈 𝑈 ⟩ ⎣ 𝑦 𝑥
(12.93)
Die normierte Funktion 𝑔𝑥𝑦 (𝜏) = √
𝐺𝑥𝑦 (𝜏)
(12.91)
𝐺𝑥𝑥 (0)𝐺𝑦𝑦 (0)
ist der Kreuzkorrelationskoeffizient von 𝑈𝑥 (𝑡) und 𝑈𝑦 (𝑡 + 𝜏); für ihn gilt die Ungleichung 0 ≤ |𝑔𝑥𝑦 (𝜏)| ≤ 1. Wenn die beiden Komponenten zu jeder Zeit unkorreliert sind, ist |𝑔𝑥𝑦 (𝜏)| = 0; wenn sie zu jeder Zeit vollständig korreliert sind, ist |𝑔𝑥𝑦 (𝜏)| = 1. Die spektralen Eigenschaften sind im Allgemeinen an die Polarisationseigenschaften gebunden, und die Autokorrelations- und Kreuzkorrelationsfunktionen können auf unterschiedliche Weise von 𝜏 abhängen. Für quasimonochromatisches Licht sind jedoch alle Abhängigkeiten von 𝜏 in den Gln. (12.88)–(12.91) näherungsweise von der Form exp(i2π 𝜈0 𝜏), sodass die Polarisationseigenschaften durch die Werte bei 𝜏 = 0 beschrieben werden. Daher kann die Polarisation der Welle durch die drei Zahlen 𝐺𝑥𝑥 (0), 𝐺𝑦𝑦 (0) und 𝐺𝑥𝑦 (0), die wir im Folgenden einfach als 𝐺𝑥𝑥 , 𝐺𝑦𝑦 und 𝐺𝑥𝑦 schreiben, beschrieben werden. 𝐺𝑥𝑥 = 𝐼𝑥 und 𝐺𝑦𝑦 = 𝐼𝑦 sind reelle Zahlen, die die Intensitäten der 𝑥- und 𝑦-Komponenten bezeichnen, ∗ , wie aus der Deaber 𝐺𝑥𝑦 ist komplex; es gilt 𝐺𝑦𝑥 = 𝐺𝑥𝑦 finition leicht nachgeprüft werden kann.
12.4.1 Die Kohärenzmatrix
𝐺𝑥𝑦 ⎤ ⎥ 𝐺𝑦𝑦 ⎦
(12.92)
zu schreiben, die Kohärenzmatrix genannt wird. Ihre Diagonalelemente sind die Intensitäten 𝐼𝑥 und 𝐼𝑦 , und die Nichtdiagonalelemente sind die Kreuzkorrelā ist gleich tionen. Die Spur der Matrix, Tr G = 𝐼𝑥 + 𝐼𝑦 ≡ 𝐼, der Gesamtintensität. Die Kohärenzmatrix kann auch durch den Jonesvektor ⎡ 𝑈𝑥 ⎤ J=⎢ ⎥ 𝑈 ⎣ 𝑦⎦
wobei das Symbol T die Transponierte einer Matrix bezeichnet, und 𝑈𝑥 und 𝑈𝑦 für 𝑈𝑥 (𝑡) bzw. 𝑈𝑦 (𝑡) stehen. Der Jonesvektor wird durch polarisierende Elemente wie Polarisatoren oder Retarder gemäß J′ = TJ transformiert [siehe Gl. (6.17)], wobei T die Jonesmatrix des Bauelements ist [siehe Gl. (6.18)–(6.25)]. Die Kohärenzmatrix wird daher gemäß G′ = ⟨T∗ J∗ (TJ)T ⟩ = ⟨T∗ J∗ JT TT ⟩ = T∗ ⟨J∗ JT ⟩TT transformiert; es gilt daher G′ = T∗ GTT .
(12.94)
Wir haben damit einen Formalismus, um die Wirkung von polarisierenden Bauelementen auf die Kohärenzmatrix von partiell polarisiertem Licht zu bestimmen.
12.4.2 Stokesparameter und Poincarékugeldarstellung Die Stokesparameter wurden in Abschnitt 6.1.1 für kohärentes Licht als Satz von vier reellen Parametern definiert, die mit den Produkten der 𝑥- und 𝑦-Komponenten der komplexen Einhüllenden verknüpft waren [siehe Gl. (6.9)]. Diese Definition wird für partiell kohärentes Licht zu einem Mittelwert dieser Produkte verallgemeinert, S0 = ⟨|𝑈𝑥 |2 ⟩ + ⟨|𝑈𝑦 |2 ⟩ = 𝐺𝑥𝑥 + 𝐺𝑦𝑦
(12.95a)
S1 = ⟨|𝑈𝑥 | ⟩ − ⟨|𝑈𝑦 | ⟩ = 𝐺𝑥𝑥 − 𝐺𝑦𝑦
(12.95b)
2
Es ist zweckmäßig, die vier Variablen 𝐺𝑥𝑥 , 𝐺𝑥𝑦 , 𝐺𝑦𝑥 und 𝐺𝑦𝑦 in Form einer hermiteschen 2 × 2-Matrix ⎡𝐺𝑥𝑥 G=⎢ 𝐺 ⎣ 𝑦𝑥
⟨𝑈𝑥∗ 𝑈𝑦 ⟩⎤ ⎥ = G, ⟨𝑈𝑦∗ 𝑈𝑦 ⟩ ⎦
S2 = S3 =
2 Re{⟨𝑈𝑥∗ 𝑈𝑦 ⟩} 2 Im{⟨𝑈𝑥∗ 𝑈𝑦 ⟩}
2
= 2 Re{𝐺𝑥𝑦 }
(12.95c)
= 2 Im{𝐺𝑥𝑦 } .
(12.95d)
Die Stokesparameter hängen also direkt mit den Elementen der Kohärenzmatrix G zusammen. Der erste Parameter S0 ist einfach die Summe der Diagonalelemente, ̄ Der zweite Parameter S1 ist also die Gesamtintensität 𝐼. die Differenz der Diagonalelemente, d. h. die Differenz der Intensitäten der beiden Polarisationskomponenten. Der dritte und der vierte Parameter S2 und S3 sind proportional zum Real- und Imaginärteil des Nichtdiagonalelements, d. h. zur Kreuzkorrelationsfunktion. Wenn wir diese Beziehungen verwenden, können wir leicht zeigen, dass die Ungleichung |𝐺𝑥𝑦 |2 ≤ 𝐺𝑥𝑥 𝐺𝑦𝑦 zu der Bedingung S21 + S22 + S23 ≤ S20 führt. Für kohärentes Licht werden diese Ungleichungen zu Gleichungen.
371
372
12 Statistische Optik
RCP polarisiert partiell polarisiert unpolarisiert
(a)
(b)
(c)
(d)
Abb. 12.28 Fluktuation des elektrischen Feldvektors für (a) unpolarisiertes Licht, (b) partiell polarisiertes Licht, (c) rechtszirkular polarisiertes Licht; (d) Poincarékugeldarstellung für unpolarisiertes Licht (im Ursprung), partiell polarisiertes Licht (im Inneren der Kugel) und elliptisch polarisiertes Licht (auf der Oberfläche).
Der Polarisationszustand von partiell polarisiertem Licht kann geometrisch als ein Punkt mit den kartesischen Koordinaten (S1 ∕S0 , S2 ∕S0 , S3 ∕S0 ) auf der Poincarékugel dargestellt werden. Da S21 + S22 + S23 ≤ S20 ist, liegt dieser Punkt in der Kugel oder auf ihrer Oberfläche. Um die physikalische Bedeutung der Kohärenzmatrix und der Stokesparameter zu verstehen, untersuchen wir als Nächstes zwei Grenzfälle.
12.4.3
Unpolarisiertes Licht
Licht der Intensität 𝐼̄ heißt unpolarisiert, wenn seine 1 beiden Komponenten dieselbe Intensität 𝐼𝑥 = 𝐼𝑦 ≡ 𝐼̄ ha2 ben und unkorreliert sind, 𝐺𝑥𝑦 = 0. Die Kohärenzmatrix ist dann 1 ⎡1 G = 𝐼̄ ⎢ 2 0 ⎣
0⎤ ⎥. 1 ⎦
(12.96)
Durch Verwendung der Gln. (12.94) und (6.22) kann gezeigt werden, dass Gl. (12.96) invariant unter einer Rotation des Koordinatensystems ist, sodass zwei Komponenten immer dieselben Intensitäten haben und unkorreliert sind. Der elektrische Feldvektor von unpolarisiertem Licht ist daher statistisch isotrop; er zeigt mit gleicher Wahrscheinlichkeit in jede beliebige Richtung in der 𝑥𝑦-Ebene, wie in Abb. 12.28(a) dargestellt ist. Analoge Ergebnisse für partiell polarisiertes und rechtszirkular polarisiertes Licht sind in Abb. 12.28(b) und (c) gezeigt. Beim Durchgang durch einen Polarisator wird unpolarisiertes Licht linear polarisiert, es bleibt jedoch sto1 ̄ Ein Retarchastisch mit einer mittleren Intensität 𝐼. 2 der hat keinen Effekt auf unpolarisiertes Licht, da er nur eine Phasenverschiebung zwischen zwei Komponenten
einführt, die ohnehin eine völlig zufällige Phase haben. Ähnlich bleibt unpolarisiertes Licht beim Durchgang durch einen Polarisationsrotator unpolarisiert. Diese Effekte können formal mithilfe der Gln. (12.94) und (12.96) zusammen mit den Gln. (6.18), (6.40) und (6.20) gezeigt werden. Wie mithilfe der Gln. (12.95) und (12.96) leicht gezeigt werden kann, sind die Stokesparameter für unpolarisier̄ 0, 0, 0). Die entsprechentes Licht (S0 , S1 , S2 , S3 ) = (𝐼, de Darstellung auf der Poincarékugel ist ein Punkt mit den kartesischen Koordinaten (S1 ∕S0 , S2 ∕S0 , S3 ∕S0 ) = (0, 0, 0), d. h. er liegt im Ursprung der Kugel.
12.4.4
Polarisiertes Licht
√ Wenn der Kreuzkorrelationskoeffizient 𝑔𝑥𝑦 = 𝐺𝑥𝑦 ∕ 𝐼𝑥 𝐼𝑦 den Betrag |𝑔𝑥𝑦 | = 1 hat, sind die beiden Komponenten des optischen Feldes vollständig korreliert und man bezeichnet das Licht als vollständig polarisiert (oder einfach polarisiert). Die Kohärenzmatrix nimmt dann die Form ⎡ 𝐼𝑥 G = ⎢√ 𝐼𝑥 𝐼𝑦 e−i𝜑 ⎣
√
𝐼𝑥 𝐼𝑦 ei𝜑 ⎤ ⎥ 𝐼𝑦 ⎦
(12.97)
an, wobei 𝜑 das Argument von 𝑔𝑥𝑦 ist. Wenn wir 𝑈𝑥 = √ √ 𝐼𝑥 und 𝑈𝑦 = 𝐼𝑦 ei𝜑 setzen, erhalten wir ⎡𝑈𝑥∗ 𝑈𝑥 G=⎢ ∗ 𝑈 𝑈 ⎣ 𝑦 𝑥
𝑈𝑥∗ 𝑈𝑦 ⎤ ⎥ = J∗ JT , 𝑈𝑦∗ 𝑈𝑦 ⎦
(12.98)
wobei J eine Jonesmatrix mit den Komponenten 𝑈𝑥 und 𝑈𝑦 ist. G hat somit dieselbe Form wie die Kohärenzmatrix einer kohärenten Welle. Wenn wir die Jonesvektoren aus Tabelle 6.1 verwenden, können wir die Kohä-
Aufgaben
renzmatrizen für andere Polarisationszustände bestimmen. Zwei Beispiele sind: in 𝑥-Richtung linear polarisiert
⎡1 G = 𝐼̄ ⎢ 0 ⎣
0⎤ ⎥ 0 ⎦
• Der Polarisationsgrad in Gl. (12.100) kann auch durch die Stokesparameter ausgedrückt werden, √ S21 + S22 + S23 ℙ= , (12.101) S0
1 ̄ ⎡ 1 i⎤ 𝐼⎢ ⎥. 2 −i 1 ⎣ ⎦ Die Stokesparameter zu Gl. (12.98) erfüllen die Beziehung S21 + S22 + S23 = S20 , sodass polarisiertes Licht durch einen Punkt auf der Oberfläche und nicht im Inneren der Poincarékugel bezeichnet wird. Es ist aufschlussreich, die Unterscheidung zwischen unpolarisiertem und zirkular polarisiertem Licht zu untersuchen. In beiden Fällen sind die Intensitäten der 𝑥und der 𝑦-Komponenten gleich (𝐼𝑥 = 𝐼𝑦 ). Für zirkular polarisiertes Licht sind die beiden Komponenten vollständig korreliert, während sie für das unpolarisiertes Licht unkorreliert sind. Zirkular polarisiertes Licht kann durch einen Retarder in linear polarisiertes Licht umgewandelt werden, aber unpolarisiertes Licht bleibt auch bei Durchgang durch solch ein Bauelement unpolarisiert. Zirkular polarisiertes Licht wird durch einen Punkt am Nord- oder Südpol der Poincarékugel dargestellt, während unpolarisiertes Licht durch einen Punkt im Ursprung bezeichnet wird.
sodass der Polarisationsgrad in der Poincarékugeldarstellung gleich der Entfernung eines Punkts vom Ursprung der Kugel ist. • Man kann zeigen (Übung 12-4), dass eine partiell polarisierte Welle immer als eine Mischung zweier unkorrelierter Wellen aufgefasst werden kann, einer vollständig polarisierten und einer unpolarisierten Welle, wobei das Verhältnis der Intensität der polarisierten Komponente zur Gesamtintensität gleich dem Polarisationsgrad ℙ ist.
Der Polarisationsgrad
Aufgabe 12-1: Lorentzspektrum
Partielle Polarisation ist ein allgemeiner Zustand der zufälligen Polarisation, die zwischen den beiden idealen Grenzfällen des unpolarisierten und des vollständig polarisierten Lichts liegt. Ein Maß für den Polarisationsgrad ℙ kann anhand der Determinante und der Spur der Kohärenzmatrix definiert werden, √ 4 det G (12.99) ℙ= 1− (Tr G)2 √ √ 𝐼𝑥 𝐼𝑦 ) ( √ = 1 − 4[ (12.100) ] 1 − |𝑔𝑥𝑦 |2 . 2 (𝐼𝑥 + 𝐼𝑦 )
Eine LED emittiert Licht mit einem Lorentzspektrum und einer Linienbreite Δ𝜈HWB = 1013 Hz um die Mittenwellenlänge 𝜆0 = 0.7 μm. Bestimmen Sie die Linienbreite Δ𝜆0 (in nm), die Kohärenzzeit 𝜏K und die Kohärenzlänge 𝑙K . Wie groß ist die maximale Zeitverzögerung, innerhalb der der komplexe zeitliche Kohärenzgrad |𝑔(𝜏)| größer ist als 0.5?
rechtszirkular polarisiert
G=
Dieses Maß ist aus folgenden Gründen bedeutsam: • Es erfüllt die Ungleichung 0 ≤ ℙ ≤ 1. • Für polarisiertes Licht nimmt ℙ seinen Maximalwert eins an, wie leicht zu sehen ist, wenn man |𝑔𝑥𝑦 | = 1 in Gl. (12.100) einsetzt. Für unpolarisiertes Licht nimmt ℙ seinen Minimalwert ℙ = 0 an, da 𝐼𝑥 = 𝐼𝑦 und 𝑔𝑥𝑦 = 0 ist. • Es ist invariant bezüglich einer Rotation des Koordinatensystems (da die Determinante und die Spur einer Matrix invariant unter unitären Transformationen sind).
Übung 12-4: Partiell polarisiertes Licht
Zeigen Sie, dass die Superposition von unpolarisiertem Licht der Intensität (𝐼𝑥 + 𝐼𝑦 )(1 − ℙ) und linear polarisiertem Licht der Intensität (𝐼𝑥 + 𝐼𝑦 )ℙ, wobei ℙ durch Gl. (12.100) gegeben ist, Licht liefert, dessen 𝑥und 𝑦-Komponenten die Intensitäten 𝐼𝑥 und 𝐼𝑦 und die normierte Kreuzkorrelation |𝑔𝑥𝑦 | haben.
Aufgaben
Aufgabe 12-2: Das Wiener-Khinchin-Theorem
Verwenden Sie die Definitionen in den Gln. (12.4), (12.14) und (12.15) und zeigen Sie, dass die spektrale Dichte S (𝜈) die Fouriertransformierte der Autokorrelationsfunktion 𝐺(𝜏) ist. Zeigen Sie, dass die Intensität 𝐼 das Integral der spektralen Leistungsdichte S (𝜈) ist. Aufgabe 12-3: Die wechselseitige Intensität
Die wechselseitige Intensität einer optischen Welle an Punkten auf der 𝑥-Achse ist 𝐺(𝑥1 , 𝑥2 ) = 𝐼0 exp [−
(𝑥12 + 𝑥22 ) 𝑊02
] exp [
−(𝑥1 − 𝑥2 )2 𝜌K2
],
wobei 𝐼0 , 𝑊0 und 𝜌K Konstanten sind. Skizzieren Sie die Intensitätsverteilung als Funktion von 𝑥. Leiten Sie ei-
373
374
12 Statistische Optik
nen Ausdruck für die normierte wechselseitige Intensität 𝑔(𝑥1 , 𝑥2 ) her und skizzieren Sie sie als Funktion von 𝑥1 − 𝑥2 . Welche physikalische Bedeutung haben die Parameter 𝐼0 , 𝑊0 und 𝜌K ? Aufgabe 12-4: Die wechselseitige Kohärenzfunktion
Eine optische Welle hat an Punkten auf der 𝑥-Achse eine wechselseitige Kohärenzfunktion π𝜏2 𝐺(𝑥1 , 𝑥2 , 𝜏) = exp (− 2 ) exp[i2π 𝑢(𝑥1 , 𝑥2 )𝜏] 2𝜏K × exp [−
(𝑥1 − 𝑥2 )
2
𝜌K2
],
mit 𝑢(𝑥1 , 𝑥2 ) = 5 × 1014 s−1 für 𝑥1 + 𝑥2 > 0, 6 × 1014 s−1 für 𝑥1 + 𝑥2 < 0, 𝜌K = 1 mm und 𝜏𝐾 = 1 μs. Bestimmen Sie die Intensität, die spektrale Leistungsdichte, die Kohärenzlänge und den Kohärenzabstand in der transversalen Ebene. Welche dieser Größen sind ortsabhängig? Wie würde das Bild aussehen, wenn diese Welle auf einem Farbfilm aufgenommen würde?
wobei 𝑞(𝑧) = 𝑧 + i𝑧0 und 𝑧0 eine Konstante ist. Diese Lösung wurde in Kapitel 3 im Zusammenhang mit Gaußstrahlen umfassend untersucht. Geben Sie einen Ausdruck für die Kohärenzfläche in der Nähe der 𝑧-Achse an und zeigen Sie, dass sie mit |𝑧| zunimmt, sodass die Kohärenz der Welle mit der Ausbreitung weg vom Ursprung zunimmt. Aufgabe 12-8: Der Einfluss der spektralen Breite auf die Streifensichtbarkeit
In einem Michelsoninterferometer wird Licht aus einer Natriumlampe mit der Lorentzlinienbreite Δ𝜈 = 5 × 1011 Hz verwendet. Bestimmen Sie die maximale Differenz der optischen Weglängen, für die die Sichtbar1 keit des Interferogramms 𝒱 > ist. 2
Aufgabe 12-9: Die Zahl erkennbarer Streifen im Younginterferometer
Bestimmen Sie die Zahl der erkennbaren Streifen in einem Younginterferometer für jede der Quellen in Tabelle 12.2. Nehmen Sie jeweils vollständige räumliche Kohärenz an.
Aufgabe 12-5: Die Kohärenzlänge
Zeigen Sie, dass Licht mit einer geringen spektralen Breite die Kohärenzlänge 𝑙K ≈ 𝜆 2 ∕Δ𝜆 hat, wobei Δ𝜆 die Linienbreite in Wellenlängeneinheiten ist. Zeigen Sie, dass für Licht mit einem breiten gleichförmigen Spektrum zwischen den Wellenlängen 𝜆min und 𝜆max = 2𝜆min die Kohärenzlänge 𝑙K = 𝜆max hat. Aufgabe 12-6: Der Einfluss der spektralen Breite auf die räumliche Kohärenz
Eine punktförmige Quelle im Ursprung (0, 0, 0) eines kartesischen Koordinatensystems sendet Licht mit einem Lorentzspektrum und der Kohärenzzeit 𝜏K = 10 ps aus. Bestimmen Sie einen Ausdruck für die normierte wechselseitige Intensität des Lichts an den Punkten (0, 0, d ) und (𝑥, 0, d ) für d = 10 cm. Skizzieren Sie den Betrag der normierten wechselseitigen Intensität als Funktion von 𝑥. Aufgabe 12-7: Die wechselseitige Intensität eines Gaußstrahls
Eine optische Welle im Vakuum hat die wechselseitige Kohärenzfunktion 𝐺(r1 , r2 , 𝜏) = 𝐽(r1 − r2 ) exp(i𝜔0 𝜏). (a) Zeigen Sie, dass die Funktion 𝐽(r) die Helmholtzgleichung ∇2 𝐽 + 𝑘02 𝐽 = 0 mit 𝑘0 = 𝜔0 ∕𝑐 erfüllen muss. (b) Eine Näherungslösung der Helmholtzgleichung ist der Gaußstrahl 𝐽(r) =
i𝑘0 (𝑥2 + 𝑦 2 ) 1 exp [− ] exp(−i𝑘0 𝑧) , 𝑞(𝑧) 2𝑞(𝑧)
Aufgabe 12-10: Das Spektrum einer Superposition zweier Wellen
Eine optische Welle ist eine Superposition zweier Wellen 𝑈1 (𝑡) und 𝑈2 (𝑡) mit identischen Spektren S 1 (𝜈) = S 2 (𝜈), die Gaußfunktionen mit der spektralen Breite Δ𝜈 und der Mittenfrequenz 𝜈0 sind. Die Wellen müssen nicht unkorreliert sein. Geben Sie einen Ausdruck für die spektrale Leistungsdichte S (𝜈) der Superposition 𝑈(𝑡) = 𝑈1 (𝑡) + 𝑈2 (𝑡) an. Kann S (𝜈) ebenfalls Gaußform mit einer verschobenen Mittenfrequenz 𝜈1 ≠ 𝜈0 besitzen? Wenn dies möglich wäre, wäre unser Glaube an die Dopplerverschiebung als Methode zur Bestimmung der Geschwindigkeit von Sternen erschüttert, da dann Frequenzverschiebungen durch andere Ursachen als den Dopplereffekt entstehen könnten. Aufgabe 12-11: Ein partiell kohärenter Gaußstrahl
Eine quasimonochromatische Lichtwelle der Wellenlänge 𝜆 breitet sich im Vakuum in 𝑧-Richtung aus. Ihre Intensität in der Ebene 𝑧 = 0 ist eine Gaußfunktion 𝐼(𝑥) = 𝐼0 exp(−2𝑥2 ∕𝑊02 ), und ihre normierte wechselseitige Intensität ist ebenfalls eine Gaußfunktion 𝑔(𝑥1 , 𝑥2 ) = exp[−(𝑥1 − 𝑥2 )2 ∕𝜌K2 ]. Zeigen Sie, dass die Intensität in einer Entfernung 𝑧, bei der die Fraunhofernäherung gilt, ebenfalls eine Gaußfunktion 𝐼𝑧 (𝑥) ∝ exp[−2𝑥2 ∕𝑊 2 (𝑧)] ist, und geben Sie einen Ausdruck für den Strahlradius 𝑊(𝑧) als Funktion von 𝑧 und der Parameter 𝑊0 , 𝜌K und 𝜆 an. Diskutieren Sie den Einfluss der räumlichen Kohärenz auf die Strahldivergenz.
Aufgaben
Aufgabe 12-12: Eine Fouriertransformationslinse
Quasimonochromatisches räumlich inkohärentes Licht mit gleichförmiger Intensität trifft auf eine Folie mit der Intensitätstransmission 𝑓(𝑥, 𝑦), und das durchgelassene Licht breitet sich von der vorderen zur hinteren Brennebene einer Linse aus. Geben Sie einen Ausdruck für die Intensität des beobachteten Lichts an. Vergleichen Sie Ihr Ergebnis mit der Situation bei kohärentem Licht, in der die Linse eine Fouriertransformation durchführt (siehe Abschnitt 4.2). Aufgabe 12-13: Licht aus einer inkohärenten Zweipunktequelle
Eine räumlich inkohärente quasimonochromatische Lichtquelle emittiert an zwei Punkten in einem Abstand 2𝑎. Geben Sie einen Ausdruck für die normierte wechselseitige Intensität in einer Entfernung d von der Quelle an (verwenden Sie die Fraunhofernäherung). Aufgabe 12-14: Kohärenz von Licht nach Durchgang durch ein fouriertransformierendes optisches System
Licht aus einer quasimonochromatischen räumlich inkohärenten Quelle mit gleichförmiger Intensität tritt durch einen dünnen Spalt der Breite 2𝑎 und breitet sich zwischen der vorderen und der hinteren Brennebene einer Linse aus. Geben Sie einen Ausdruck für die normierte wechselseitige Intensität in der hinteren Brennebene an. Aufgabe 12-15: Partiell polarisiertes Licht
Die Intensitäten der beiden Komponenten einer par1 tiell polarisierten Welle sind 𝐼𝑥 = 𝐼𝑦 = , und das Ar2 gument des Kreuzkorrelationskoeffizienten 𝑔𝑥𝑦 ist π∕2. (a) Tragen Sie den Polarisationsgrad ℙ gegen den Betrag des Kreuzkorrelationskoeffizienten |𝑔𝑥𝑦| auf. (b) Bestimmen Sie die Kohärenzmatrix für ℙ = 0, 0.5 und 1 und beschreiben Sie jeweils die Natur des Lichts. (c) Wie ist die Intensität des durchgelassenen Lichts, wenn Licht durch einen Polarisator mit der Achse in 𝑥-Richtung hindurchtritt?
Weiterführende Literatur Statistische Optik, Kohärenz und partielle Polarisation
J. J. Gil Perez, R. Ossikovski, Polarized Light and the Mueller Matrix Approach, CRC Press/Taylor & Francis 2016. J. W. Goodman, Statistical Optics, Wiley, 2. Aufl. 2015. E. Wolf, Introduction to the Theory of Coherence and Polarization of Light, Cambridge University Press 2007. O. Marchenko, S. Kazantsev, L. Windholz, Demonstrational Optics: Part 2, Coherent and Statistical Optics, Springer 2007. M. Born, E. Wolf, Principles of Optics, Cambridge University Press, 7. Aufl. 2002, Kapitel 10. B. R. Frieden, Probability, Statistical Optics, and Data Testing: A Problem Solving Approach, Springer 1983, 3. Aufl. 2001. C. Brosseau, Fundamentals of Polarized Light: A Statistical Optics Approach, Wiley 1998. L. Mandel, E. Wolf, Optical Coherence and Quantum Optics, Cambridge University Press 1995. L. Mandel, E. Wolf (Hrsg.), Selected Papers on Coherence and Fluctuations of Light (1850–1966), SPIE Optical Engineering Press 1990 (Milestone Series Bd. 19). M. C. Teich, B. E. A. Saleh, ‚Photon Bunching and Antibunching‘. In E. Wolf (Hrsg.), Progress in Optics, NorthHolland 1988, Bd. 26, S. 1–104. J. Peřina, Coherence of Light, Reidel 1971, 2. Aufl. 1985. B. E. A. Saleh, Photoelectron Statistics with Applications to Spectroscopy and Optical Communication, Springer 1978. B. Crosignani, P. Di Porto, M. Bertolotti, Statistical Properties of Scattered Light, Academic Press 1975. R. Hanbury-Brown, The Intensity Interferometer: Its Application to Astronomy, Taylor & Francis 1974. L. Mandel, E. Wolf (Hrsg.), Selected Papers on Coherence and Fluctuations of Light, Bd. 1 & 2, Dover 1970. M. J. Beran, G. B. Parrent, Jr., Theory of Partial Coherence, Prentice Hall 1964; SPIE Optical Engineering Press, Nachdruck 1974. E. L. O’Neill, Introduction to Statistical Optics, AddisonWesley 1963; Dover, Nachdruck 2003. Bildgebung
D. F. Buscher, Practical Optical Interferometry: Imaging at Visible and Infrared Wavelengths, Cambridge University Press 2015. A. Donges, R. Noll, Laser Measurement Technology: Fundamentals and Applications, Springer 2015. W. Drexler, J. G. Fujimoto (Hrsg.), Optical Coherence Tomography: Technology and Applications, Bd. 1–3, Springer, 2. Aufl. 2015.
375
376
12 Statistische Optik
M. C. Teich, B. E. A. Saleh, F. N. C. Wong, J. H. Shapiro, Variations on the Theme of Quantum Optical Coherence Tomography: A Review, Quantum Information Processing, Bd. 11, S. 903–923, 2012. B. E. A. Saleh, Introduction to Subsurface Imaging, Cambridge University Press 2011. D. J. Brady, Optical Imaging and Spectroscopy, Wiley 2009. M. E. Brezinski, Optical Coherence Tomography: Principles and Applications, Academic Press/Elsevier 2006. H. H. Barrett, K. J. Myers, Foundations of Image Science, Wiley 2004. Stochastische Prozesse und Speckles
B. Hajek, Random Processes for Engineers, Cambridge University Press 2015. V. Krishnan, K. Chandra, Probability and Random Processes, Wiley, 2. Aufl. 2015. R. G. Gallager, Stochastic Processes: Theory for Applications, Cambridge University Press 2014. H. Pishro-Nik, Introduction to Probability, Statistics, and Random Processes, Kappa Research 2014. O. Korotkova, Random Light Beams: Theory and Applications, CRC Press/Taylor & Francis 2014. N. Pinel, C. Bourlier, Electromagnetic Wave Scattering from Random Rough Surfaces: Asymptotic Models, Wiley-ISTE 2013. P. Bajorski, Statistics for Imaging, Optics, and Photonics, Wiley 2012.
J. W. Goodman, Speckle Phenomena in Optics: Theory and Applications, Roberts 2007, Paperback 2010. L. C. Andrews, R. L. Phillips, Laser Beam Propagation through Random Media, SPIE Optical Engineering Press, 2. Aufl. 2005. A. A. Kokhanovsky, Polarization Optics of Random Media, Springer 2003. A. Papoulis, S. U. Pillai, Probability, Random Variables, and Stochastic Processes, McGraw-Hill 1965, 4. Aufl. 2002. B. R. Frieden, Probability, Statistical Optics, and Data Testing: A Problem Solving Approach, Springer 1983, 3. Aufl. 2001. H. E. Rowe, Electromagnetic Propagation in Multi-Mode Random Media, Wiley 1999. P. Meinlschmidt, K. D. Hinsch, R. S. Sirohi (Hrsg.), Selected Papers on Electronic Speckle Pattern Interferometry: Principles and Practice, SPIE Optical Engineering Press 1996 (Milestone Series Bd. 132). R. S. Sirohi (Hrsg.), Selected Papers on Speckle Metrology, SPIE Optical Engineering Press 1991 (Milestone Series Bd. 35). M. Frangon, Laser Speckle and Application in Optics, Academic Press 1979. A. Ishimaru, Wave Propagation and Scattering in Random Media, Bd. 1 & 2, Academic Press 1978; IEEE Press/ Oxford University Press, Nachdruck 1997.
377
13 Photonenoptik Die elektromagnetische Optik (Kapitel 5) liefert die umfassendste Behandlung des Lichts innerhalb der Grenzen der klassischen Optik. Sie schließt die Wellenoptik ein, die wiederum die Strahlenoptik einschließt (siehe Abb. 13.1). Obwohl die klassische elektromagnetische Theorie Erklärungen sehr vieler optischer Effekte geben kann, wie die bisherigen Kapitel dieses Buchs eindrucksvoll gezeigt haben, scheitert sie doch an bestimmten optischen Phänomenen. Dieses Versagen, das gegen Anfang des letzten Jahrhunderts offensichtlich wurde, führte schließlich zur Formulierung einer elektromagnetischen Quantentheorie, der Quantenelektrodynamik (QED). Für optische Phänomene wird diese Theorie auch Quantenoptik genannt. Die Quantenelektrodynamik ist heute als die Theorie akzeptiert, die in der Lage ist, fast alle bekannten optischen Phänomene zu erklären. In der QED werden die elektrischen und magnetischen Felder E und H mathematisch nicht einfach als Vektoren, sondern als Operatoren in einem Hilbertraum aufgefasst. Es wird angenommen, dass sie bestimmte Operatorgleichungen und Kommutatorbeziehungen erfüllen, die ihre Dynamik und ihre gegenseitige Abhängigkeit bestimmen. Die Gleichungen der QED beschreiben die Wechselwirkungen von elektromagnetischen Feldern mit Materie auf dieselbe Weise wie die maxwellschen Gleichungen in der klassischen Elektro-
Quantenoptik elektromagnetische Optik
dynamik. Die QED führt zu Ergebnissen, die intrinsisch quantenphysikalisch sind und klassisch nicht erklärt werden können. Trotz ihrer enormen Erfolge hat die QED jedoch nicht das letzte Wort in Bezug auf alle optischen Effekte. Diese Ehre gebührt derzeit der elektroschwachen Theorie, die die Quantenelektrodynamik mit der Theorie der schwachen Wechselwirkung verbindet. 1) Man hofft, dass eine Kombination der elektroschwachen Theorie mit den Theorien der starken und der Gravitationswechselwirkung schließlich zu einer allgemeinen einheitlichen Theorie führen wird, die alle in der Natur bekannten Kräfte umfasst.
In diesem Kapitel . . . Eine formelle Behandlung der QED übersteigt den Rahmen dieses Buches. Es ist jedoch möglich, viele der Quanteneigenschaften des Lichts und seiner Wechselwirkung mit Materie zu beschreiben, indem man die elektromagnetische Optik um einige einfache Beziehungen ergänzt, die aus der QED entliehen sind; hierzu gehören die Teilchennatur des Lichts, die Lokalisierung, und Fluktuationen von Quantenfeldern und der Energie. Diese Regeln, die wir Photonenoptik nennen, erlauben uns, uns mit optischen Phänomenen zu befassen, die außerhalb des Gültigkeitsbereichs der klassischen Theorie liegen, und trotzdem die klassische Optik als Grenzfall beizubehalten. Der Zweck der Photonenoptik ist aber nicht, eine umfassende Theorie zu liefern, die wie die Quantenoptik eine Erklärung aller Effekte geben kann.
Wellenoptik Strahlenoptik
Abb. 13.1 Die Quantenoptik erklärt praktisch alle optischen Phänomene. Sie ist allgemeiner als die elektromagnetische Optik, von der wir gezeigt hatten, dass sie die Wellenoptik und die Strahlenoptik einschließt.
1) Beispielsweise können gewisse unerwartete, nicht paritätserhaltende kleine Rotationen der Polarisationsebene von Licht beim Durchgang durch bestimmte Materialien nicht im Rahmen der Quantenelektrodynamik erklärt werden; hier führt nur die elektroschwache Theorie zum Erfolg; siehe z. B. P. A. Vetter, D. M. Meekhof, P. K. Majumder, S. K. Lamoreaux, E. N. Fortson, ‚Precise Test of Electroweak Theory from a New Measurement of Parity Nonconservation in Atomic Thallium‘, Physical Review Letters 74, 2658–2661, 1995.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
378
13 Photonenoptik
Im Abschnitt 13.1 führen wir das Konzept des Photons ein und untersuchen seine Eigenschaften. Wir verwenden die elektromagnetische Optik als Ausgangspunkt und ergänzen sie um einige Regeln, die das Verhalten der Energie, des Impulses, der Polarisation, des Ortes, der Zeit und der Interferenz von Photonen bestimmen. Diese Regeln erscheinen täuschend einfach, haben jedoch weitreichende Folgen. Danach folgt in Abschnitt 13.2 eine Diskussion der Eigenschaften von großen Mengen von Photonen und Photonenströmen. Die Zahl der von einer Lichtquelle in einem gegebenen Zeitintervall ausgesandten Photonen ist fast immer stochastisch und zeigt statistische Eigenschaften, die von der Natur der Quelle abhängen. Wir werden die Photonenzahlstatistiken für einige wichtige optische Quellen wie z. B. Laser und Wärmestrahler entwickeln. Außerdem werden wir die Wirkung von einfachen optischen Komponenten (wie Strahlteilern und Filtern) auf die stochastischen Eigenschaften eines Photonenstroms untersuchen. In Abschnitt 13.3 verwenden wir die Quantenoptik, um die zufälligen Fluktuationen des Betrags und der Phase des elektromagnetischen Feldes zu untersuchen. Wir geben eine kurze Einführung in kohärente, gequetschte und verschränkte Zustände von Licht. Die Wechselwirkungen von Photonen mit Atomen und Halbleitern werden in den Abschnitten 14.3 bzw. 17.2 beschrieben.
Einstein vor, die Quantisierung direkt auf die Energie anzuwenden und nicht auf die Atome. So gelangte er zu dem Konzept des Photons und konnte den photoelektrischen Effekt erklären (dieses Thema wird in Abschnitt 19.1.1 besprochen). Der Begriff „Photon“ wurde schließlich im Jahr 1926 von Gilbert Lewis geprägt. Wir führen das Konzept des Photons und die Regeln der Photonenoptik ein, indem wir Licht in einem optischen Resonator (Hohlraum) betrachten. Das ist deshalb eine zweckmäßige Wahl, weil es den betrachteten Raum auf eine einfache Geometrie einschränkt. Es wird sich jedoch zeigen, dass der Resonator für die Argumentation unwichtig ist; die erhaltenen Ergebnisse hängen weder von seiner konkreten Form noch überhaupt von seiner Existenz ab.
13.1.1
Licht in einem Resonator
Elektromagnetische Theorie
Nach der elektromagnetischen Optik ist Licht innerhalb eines verlustfreien Resonators mit dem Volumen 𝑉 vollständig durch ein elektromagnetisches Feld charakterisiert, das als Superposition von diskreten orthogonalen Moden mit unterschiedlichen räumlichen Verteilungen, Frequenzen, und Polarisationen aufgefasst werden kann. Für den Vektor 𝓔 des elektrischen Feldes gilt 𝓔(r, 𝑡) = Re{E(r, 𝑡)} mit dem komplexen elektrischen Feldvektor E(r, 𝑡) =
∑
𝐴q 𝑈q (r) exp(i2π𝜈q 𝑡)ˆ eq .
(13.1)
q
13.1 Das Photon Aus der Quantenperspektive besteht Licht aus Teilchen, den sogenannten Photonen. Ein Photon trägt elektromagnetische Energie und Impuls sowie einen intrinsischen Drehimpuls (oder Spin), der mit seinen Polarisationseigenschaften zusammenhängt. Es kann auch einen Bahndrehimpuls tragen. Das Photon hat keine Ruhemasse und bewegt sich im Vakuum mit der Lichtgeschwindigkeit 𝑐0 ; seine Geschwindigkeit in Materie ist auf 𝑐 < 𝑐0 reduziert. Ein Photon hat auch Welleneigenschaften, die seine Lokalisierung in Raum und Zeit sowie die Regeln bestimmen, wie es interferiert und gebeugt wird. Der Begriff des Photons entstand um das Jahr 1900 aus einem Versuch Max Plancks, ein altes Rätsel in Bezug auf das Spektrum eines schwarzen Strahlers zu lösen (dieses Thema wird in Abschnitt 14.4.2 vertieft). Er erreichte dieses Ziel schließlich, indem er die erlaubten Energiewerte der elektromagnetischen Moden in einem strahlenden Hohlraum quantisierte. 1905 schlug Albert
Die q-te Mode hat die komplexe Einhüllende 𝐴q , die Frequenz 𝜈q , ist entlang der Richtung des Einheitsvektors ˆ eq polarisiert und hat eine durch die komplexe Funktion 𝑈q (r) beschriebene räumliche Verteilung, die so normiert ist, dass ∫𝑉 |𝑈q (r)|2 dr = 1 gilt. Die Entwickeq sind nicht lungsfunktionen 𝑈q (r), exp(i2π𝜈q 𝑡) und ˆ eindeutig; wir könnten auch eine andere Wahl treffen und z. B. polychromatische Moden verwenden. In einem kubischen Resonator mit der Seitenlänge d ist eine zweckmäßige Wahl der räumlichen Entwicklungsfunktionen der Satz von stehenden Wellen 3∕2
2 𝑈q (r) = ( ) d
sin (𝑞𝑥
π d
𝑥) sin (𝑞𝑦
π d
𝑦) sin (𝑞𝑧
π d
𝑧) ,
(13.2) wobei 𝑞𝑥 , 𝑞𝑦 und 𝑞𝑧 ganze Zahlen sind, die wir in dem Index q = (𝑞𝑥 , 𝑞𝑦 , 𝑞𝑧 ) zusammenfassen [siehe Abschnitt 11.3 und Abb. 13.2(a)]. Nach Gl. (5.71) ist die 1 Energiedichte der Mode q gleich 𝜀|𝐴q |2 |𝑈q (r)|2 , so2
13.1 Das Photon
3
5
6 4
5
hν1
2
4 Energie
Mode 1 Mode 2
hν2
3
2
1
hν3
2 1
1 Mode 3
0
0 (b)
(a)
Mode 1
1
1
2
2
0 Mode 2
dass die in der Mode enthaltene Energie gleich E q = 𝜀 ∫ |𝐴q |2 |𝑈q (r)|2 dr = 𝜀|𝐴q |2
3
(13.3)
𝑉
ist, wenn 𝑉 das Modenvolumen ist. In der klassischen elektromagnetischen Theorie kann die Energie E q beliebige nichtnegative Werte annehmen, egal wie klein. Die Gesamtenergie ist die Summe der Energien in allen Moden.
Mode 3
ℎ𝜈 zu der Mode hinzugefügt oder aus ihr entfernt werden. Eine Mode, die keine Photonen enthält, trägt trotz1 dem eine Energie E 0 = ℎ𝜈, die Nullpunktsenergie 2 genannt wird und mit Fluktuationen des Vakuumzustands zusammenhängt (vgl. Abb 13.20). Wenn eine Mode n Photonen enthält, trägt sie somit die Gesamtenergie 1
E n = (n + )ℎ𝜈 , 2
Photonenoptische Theorie
Die soeben beschriebene elektromagnetische Theorie wird in der Photonenoptik beibehalten, aber es wird eine Beschränkung der Energie eingeführt, die jede Mode tragen darf. Anstatt kontinuierliche Werte annehmen zu können, wird die Modenenergie auf diskrete Werte in festen Abständen eingeschränkt. Die Energie einer Mode ist auf ganze Einheiten dieser erlaubten Energie quantisiert. Jede Einheit der Energie wird von einem Photon getragen, und eine Mode kann eine beliebige Zahl von Photonen enthalten. Licht in einem Resonator besteht aus einer Reihe von Moden, von denen jede eine ganze Zahl identischer Photonen enthält. Die Eigenschaften der Mode wie ihre Frequenz, räumliche Verteilung, Ausbreitungsrichtung oder Polarisation werden den Photonen zugeordnet.
13.1.2 Die Energie eines Photons Die Photonenoptik geht davon aus, dass die Energie einer elektromagnetischen Mode auf diskrete Werte beschränkt ist, deren Abstand der Energie eines Photons entspricht (Abb. 13.2(b)). Die Energie eines Photons in einer Mode der Frequenz 𝜈 ist E = ℎ𝜈 = ℏ𝜔 ,
Abb. 13.2 (a) Drei Moden mit unterschiedlichen Frequenzen und Richtungen in einem kubischen Resonator. (b) Erlaubte Energien von drei Moden der Frequenzen 𝜈1 , 𝜈2 und 𝜈3 . Die Punkte bezeichnen die Zahl von Photonen in jeder Mode: Die Moden 1, 2, und 3 enthalten 2, 1 bzw. 3 Photonen.
(13.4)
wobei ℎ = 6.6261 × 10−34 J s die plancksche Konstante und ℏ ≡ ℎ∕2π ist. Energie kann nur in Einheiten von
n = 0, 1, 2, …
(13.5)
Dieser Ausdruck ist identisch mit dem für die Energieniveaus eines quantenmechanischen harmonischen Oszillators (siehe Gl. (13.64); der Zusammenhang zwischen beiden Größen wird in Abschnitt 13.3 hergestellt werden. In den meisten Experimenten ist die Nullpunktsenergie nicht direkt beobachtbar, da nur Energiedifferenzen [z. B. E 2 − E 1 in Gl. (13.8)] gemessen werden. Die Nullpunktsenergie ist jedoch nicht bedeutungslos, da sie eine Rauschquelle darstellt, die die Empfindlichkeit mancher Präzisionsmessungen limitiert. Dies wird in Abschnitt 13.3.4 deutlich werden, in dem wir sehen werden, wie der Vakuumzustand manipuliert („gequetscht“) werden kann, indem man ein Experiment gezielt so modifiziert, dass die schädlichen Nebenwirkungen der Vakuumfluktuationen minimiert werden. Nullpunktsfluktuationen sind auch für die spontane Emission von Strahlung durch Atome (Abschnitt 14.3) und den Casimireffekt verantwortlich, eine kleine anziehende Kraft zwischen zwei parallelen ungeladenen leitfähigen Platten in geringem Abstand voneinander. Die Größenordnung der Photonenenergie ist leicht abzuschätzen. Ein Infrarotphoton der Wellenlänge 𝜆0 = 1 μm im Vakuum hat gemäß 𝜆0 𝜈 = 𝑐0 eine Frequenz 3 × 1014 Hz. Seine Energie ist damit ℎ𝜈 ≈ 1.99 × 10−19 J = 1.99 × 10−19 ∕1.6 × 10−19 eV = 1.24 eV (Elektronenvolt); das ist die kinetische Energie, die ein Elektron erhält, wenn es durch eine Potentialdifferenz von 1.24 V beschleunigt wird. Ein anderes Beispiel ist ein Mikrowel-
379
380
13 Photonenoptik
Optik & Photonik Wellenlänge λ0 Frequenz Periode
Energie E = hν
10 nm
ν
100 nm
100 µm
1 mm
1 cm
10 cm
1 PHz
100 THz
10 THz
1 THz
100 GHz
10 GHz
1 GHz
100 as
1 fs
10 fs
100 fs
1 ps
10 ps
100 ps
1 ns
100 eV
J
10 µm
10 PHz
T eV
1 µm
Elektronik
10 eV
10 aJ
1 eV
1 aJ
100 meV
10 meV
10 zJ
1 zJ
100 zJ
1 meV
100 µeV
100 yJ
10 µeV
10 yJ
1 yJ
cm–1 10 6
10 5
10 4
10 3
kT 10 2
10
1
10 –1
Abb. 13.3 Beziehungen zwischen der Wellenlänge 𝜆0 , Frequenz 𝜈 und Energie E von Photonen (angegeben in Einheiten von eV, J und reziproken Wellenlängen 1∕𝜆0 in cm−1 ). Ein Photon der Vakuumwellenlänge 𝜆0 = 1 μ m hat die Frequenz 𝜈 = 300 THz und die Energie E = 1.24 eV =
1.99 × 10−19 J = 104 cm−1 . Die thermische Energie kT beträgt bei Zimmertemperatur (300 K) kT = 26 meV = 4.17 zJ = 210 cm−1 . Die Bereiche der Photonik und Elektronik sind markiert.
lenphoton mit einer Wellenlänge von 1 cm; seine Energie ist um einen Faktor 104 kleiner, also ℎ𝜈 ≈ 1.24 × 10−4 eV. Die Formel zur Umrechnung von Wellenlängen (μm) in Photonenenergie (eV) ist daher einfach
kann das Photon in linear in 𝑥-Richtung oder rechtszirkular polarisiert sein. Da die Polarisationsmoden im Vakuum entartet sind, sind sie nicht eindeutig. Man kann Moden mit linearer Polarisation in 𝑥- und 𝑦-Richtung, linearer Polarisation in zwei anderen orthogonalen Richtungen 𝑥′ und 𝑦 ′ , oder rechts- und linkszirkularer Polarisation verwenden. Die Wahl eines spezielles Satzes von Funktionen ist eine Frage der Zweckmäßigkeit. Ein Problem entsteht, wenn ein Photon in einer gegebenen Mode (z. B. lineare Polarisation in 𝑥-Richtung) in einem anderen Satz von Moden beobachtet werden soll (z. B. lineare Polarisation in 𝑥′ - und 𝑦 ′ -Richtung). Da die Photonenenergie nicht zwischen den beiden Moden aufgeteilt werden kann, ist eine probabilistische Interpretation notwendig. In der klassischen elektromagnetischen Optik wird der Polarisationszustand einer ebenen Welle durch einen Jonesvektor beschrieben, dessen Komponenten (𝐴𝑥 , 𝐴𝑦 ) die Komponenten der komplexen Einhüllenden in 𝑥- und 𝑦-Richtung sind (siehe Abschnitt 6.1.1). Dieselbe Welle kann auch in einem anderen Koordinatensystem (𝑥′ , 𝑦 ′ ) dargestellt werden, das z. B. um 45◦ gegen das ursprüngliche gedreht ist. In diesem Koordinatensystem hat ihr Jonesvektor wie in Abschnitt 6.1.2 beschrieben die Komponenten
E ∕eV =
1.24 . 𝜆0 ∕μm
(13.6)
Die reziproke Wellenlänge wird vor allem in der Chemie oft als eine Einheit der Energie verwendet. Sie wird in cm−1 angegeben und wird bestimmt, indem man die Wellenlänge im cm ausdrückt und einfach den Kehrwert bildet. So entspricht 1 cm−1 einer Energie von 1.24∕10 000 eV, und 1 eV entspricht 8068.1 cm−1 . Die Umrechnungen zwischen Frequenz, Wellenlänge, Energie und reziproker Wellenlänge sind in Abb. 13.3 illustriert. Weil Photonen einer höheren Frequenz eine größere Energie tragen, wird die Teilchennatur des Lichts mit steigender Frequenz der Strahlung immer wichtiger. Röntgenstrahlen und Gammastrahlung verhalten sich fast immer wie Ansammlungen von Teilchen; Wellenphänomene wie Beugung oder Interferenz sind bei ihnen weniger wichtig. Bei Frequenzen im optischen Bereich tritt sowohl Teilchen- als auch Wellenverhalten auf, wodurch das Bedürfnis nach einer Photonenoptik entsteht.
𝐴𝑥′ =
13.1.3
Die Polarisation von Photonen
Wie bereits erwähnt wird Licht durch eine Reihe von Moden mit unterschiedlichen Frequenzen, Richtungen und Polarisationen beschrieben. Für eine monochromatische ebene Welle, die sich in einer Richtung ausbreitet, gibt es zwei Polarisationsmoden. Die Polarisation eines Photons ist die der Mode, die es besetzt. Zum Beispiel
1 √ 2
(𝐴𝑥 − 𝐴𝑦 ) ,
𝐴𝑦′ =
1 √ 2
(𝐴𝑥 + 𝐴𝑦 ) .
(13.7)
Eine in 𝑥-Richtung linear polarisierte Welle wird folglich durch einen Jonesvektor mit den Komponenten (𝐴0 , 0) im 𝑥𝑦-Koordinatensystem beschrieben, wobei 𝐴0 die komplexe Einhüllende ist. Im (𝑥′ , 𝑦 ′ )Koordinatensystem hat der Jonesvektor die Komponen1 1 ten ( √ 𝐴0 , √ 𝐴0 ). 2
2
13.1 Das Photon
x
x
x
x′
45°
z
45°
z
z
y
y
y
ein x-polarisiertes Photon
ein x′ -polarisiertes Photon (Wahrscheinlichkeit 1/2)
ein y′ -polarisiertes Photon (Wahrscheinlichkeit 1/2)
2
Photon in der 𝑥′ -polarisierten Mode zu beobachten ist daher cos2 𝜃, was gleichzeitig die Wahrscheinlichkeit ist, dass das Photon durch den Polarisator durchgelassen wird: 𝑝(𝜃) = cos2 𝜃. Die Wahrscheinlichkeit, dass 2 das Photon blockiert wird, ist folglich 1 − 𝑝(𝜃) = sin 𝜃. Aus der klassischen Polarisationsoptik ist bekannt, dass die Intensitätstransmission eines Polarisators in dieser Anordnung cos2 𝜃 ist (siehe Abschnitt 6.1.2). Das bedeutet, dass die Wahrscheinlichkeit der Transmission eines einzelnen Photons mit der klassischen Transmission identisch ist, 𝑝(𝜃) = 𝒯(𝜃).
In der Photonenoptik wird der Polarisationszustand eines einzelnen Photons durch einen Jonesvektor mit den komplexen Komponenten (𝐴𝑥 , 𝐴𝑦 ) beschrieben, die so normiert sind, dass |𝐴𝑥 |2 + |𝐴𝑦 |2 = 1 gilt. Die Koeffizienten 𝐴𝑥 und 𝐴𝑦 werden als komplexe Wahrscheinlichkeitsamplituden interpretiert, und ihre Betragsquadrate |𝐴𝑥 |2 und |𝐴𝑦 |2 bezeichnen die Wahrscheinlichkeiten, dass das Photon in 𝑥- bzw. 𝑦-Polarisation beobachtet wird. Die Komponenten (𝐴𝑥 , 𝐴𝑦 ) werden wie gewöhnliche Jonesvektoren von einem Koordinatensystem in ein anderes transformiert, und die neuen Komponenten bezeichnen die komplexen Wahrscheinlichkeitsamplituden der neuen Moden. So kann ein einzelnes Photon probabilistisch betrachtet in mehr als einer Mode existieren. Dieses Konzept wird durch die folgenden Beispiele illustriert. Linear polarisierte Photonen
Ein Photon ist in 𝑥-Richtung linear polarisiert. Im Koordinatensystem der linear 𝑥- und 𝑦-polarisierten Moden wird das Photon durch einen Jonesvektor mit den Komponenten (1, 0) beschrieben. In einem Basissatz aus linear in 𝑥′ - und 𝑦 ′ -Richtung polarisierten Moden, die gegen die ursprünglichen um 45◦ verdreht sind, sind diese 1 1 Komponenten ( √ , √ ), sodass die Wahrscheinlichkei2
Abb. 13.4 Ein Photon mit linearer Polarisation in x-Richtung entspricht einer Superposition der linearen Polarisation in x′ - und y ′ -Richtung mit gleichen Wahrscheinlich1 keiten von .
y′
2
ten, das Photon in einer linearen Polarisation entlang der 𝑥′ - oder 𝑦 ′ -Richtung zu beobachten, beide gleich 1 sind. Das ist in Abb. 13.4 schematisch dargestellt. 2
Beispiel 13-1: Durchgang eines linear polarisierten Photons durch einen Polarisator
Wir betrachten den Durchgang eines in 𝑥-Richtung polarisierten Photons durch einen linearen Polarisator, dessen Transmissionsachse entlang der 𝑥′ -Richtung in einem Winkel 𝜃 zur 𝑥-Achse liegt, wie Abb. 13.5 zeigt. Der Polarisator lässt Licht durch, das in 𝑥′ -Richtung linear polarisiert ist, und blockiert Licht, das in der dazu senkrechten Richtung 𝑦 ′ polarisiert ist. Um die Wahrscheinlichkeit zu berechnen, dass das Photon durch den Polarisator durchgelassen wird, schreiben wir den Jonesvektor seines Polarisationszustands im 𝑥′ 𝑦 ′ -Koordinatensystem als (cos 𝜃, − sin 𝜃) [siehe die Gln. (6.21) und (6.22)]. Die Wahrscheinlichkeit, das
x
p(θ)
θ
1
y
0 0
π 2
Polarisator
π
θ
Abb. 13.5 Die Wahrscheinlichkeit, dass ein linear polarisiertes Photon durch einen Polarisator hindurchtritt. Die Achse des Polarisators liegt in einem Winkel 𝜃 zur Polarisation des Photons.
Zirkular polarisierte Photonen
Ein zirkular polarisiertes Photon wird durch einen Jo1 nesvektor mit den Komponenten √ (1, ±i) beschrieben, 2
wobei die Vorzeichen + und − der rechts- bzw. linkszirkularen Polarisation entsprechen. Diese Beschreibung beruht auf einem 𝑥𝑦-Koordinatensystem, d. h. linear polarisierten Moden. Daher ist die Wahrscheinlichkeit, dass das Photon durch einen in 𝑥- oder 𝑦-Richtung orientierten linearen Polarisator transmittiert wird, 1 gleich . Es kann auch gezeigt werden, dass dies sogar 2 unabhängig von der Richtung des linearen Polarisators gilt. Das zirkular polarisierte Photon kann als das Äquivalent der probabilistischen Superposition eines Photons aus einer Mode mit linearer Polarisation in 𝑥-Richtung und einer anderen mit Polarisation in 𝑦-Richtung 1 mit gleichen Wahrscheinlichkeiten aufgefasst werden. 2 Rechts- und linkszirkulare Polarisationen können ebenfalls als Moden (als Koordinatensystem) verwendet werden. In dieser Beschreibung kann ein linear polarisiertes Photon als eine probabilistische Superpositi-
381
382
13 Photonenoptik
x
x
z
y
=
ein linear polarisiertes Photon
y
x
z
oder
z
y
2
ein linkszirkular polarisiertes ein rechtszirkular polarisiertes Photon (Wahrscheinlichkeit 1/2) Photon (Wahrscheinlichkeit 1/2)
on von rechts- und linkszirkular polarisierten Photonen 1 mit identischen Wahrscheinlichkeiten von betrachtet 2 werden, wie Abb. 13.6 zeigt.
13.1.4
Abb. 13.6 Ein linear polarisiertes Photon entspricht einer Superposition eines rechts- und eines linkszirkular polarisierten Photons mit gleichen Wahrschein1 lichkeiten von .
Der Ort eines Photons
Zu zu jedem Photon der Frequenz 𝜈 gehört eine durch die komplexe Wellenfunktion 𝑈(r) exp(i2π𝜈𝑡) beschriebene Welle der Mode. Wenn aber ein Photon auf einen Detektor mit der kleinen Fläche d A senkrecht zu seiner Ausbreitungsrichtung am Ort r auftrifft, dann wird es entweder ganz oder gar nicht detektiert, da es ja nicht teilbar ist. Der Ort, an dem das Photon registriert wird, ist nicht genau bestimmt. Er wird durch die optische Intensität 𝐼(r) ∝ |𝑈(r)|2 in Übereinstimmung mit dem folgenden probabilistischen Gesetz festgelegt: Die Wahrscheinlichkeit 𝑝(r) d A, ein Photon an einem Punkt r innerhalb einer infinitesimalen Fläche d A zu beobachten, ist zu jeder Zeit proportional zu der lokalen optischen Intensität 𝐼(r) ∝ |𝑈(r)|2 ; es gilt also 𝑝(r) d A ∝ 𝐼(r) d A .
(13.8)
Das Photon wird daher mit größerer Wahrscheinlichkeit an Orten gefunden, an denen die Intensität hoch ist. Ein Photon in einer Mode, die durch eine stehende Wel2 le mit der Intensitätsverteilung 𝐼(𝑥, 𝑦, 𝑧) ∝ sin (π𝑧∕d ) mit 0 ≤ 𝑧 ≤ d beschrieben wird, wird z. B. mit hoher Wahrscheinlichkeit bei 𝑧 = d ∕2 gefunden werden, aber nie bei 𝑧 = 0 oder 𝑧 = d . Während Wellen im Raum ausgedehnt und Teilchen lokalisiert sind, verhalten sich optische Photonen wie ausgedehnte und lokalisierte Größen. Dieses Verhalten wird Welle-TeilchenDualismus genannt. Die lokalisierte Natur von Photonen wird offensichtlich, wenn sie detektiert werden.
anzutreffen, dessen Radius der Taillenradius 𝑊0 des Strahls ist? Verwenden Sie die Tatsache, dass an der Taille 𝐼(𝜌, 𝑧 = 0) ∝ exp(−2𝜌2 ∕𝑊02 ) ist, wobei 𝜌 die radiale Koordinate ist. (b) Schätzen Sie die mittlere Zahl der Photonen ab, die innerhalb dieses Kreises liegen, wenn der Strahl eine große Zahl n von unabhängigen Photonen enthält. Durchgang eines einzelnen Photons durch einen Strahlteiler
Ein idealer Strahlteiler ist ein optisches Bauelement, das einen Lichtstrahl verlustfrei in zwei Strahlen aufteilt, die in einem rechten Winkel zueinander herauskommen. Er wird durch seinen Transmissionsgrad 𝒯 und seinen Reflexionsgrad ℛ = 1 − 𝒯 charakterisiert. Die Intensitäten 𝐼t der transmittierten und 𝐼r der reflektierten Wellen können durch die elektromagnetischen Beziehungen 𝐼t = 𝒯𝐼 und 𝐼r = (1 − 𝒯)𝐼 aus der Intensität 𝐼 der einfallenden Welle berechnet werden. Weil ein Photon unteilbar ist, muss es zwischen den beiden in dem Strahlteiler erlaubten Richtungen wählen. Ein einzelnes auf das Bauelement einfallendes Photon folgt einem der beiden möglichen Wege in Übereinstimmung mit der probabilistischen Regel aus Gl. (13.8). Die Wahrscheinlichkeit, dass das Photon transmittiert wird, ist proportional zu 𝐼t und daher gleich dem Transmissionsgrad 𝒯 = 𝐼t ∕𝐼. Die Wahrscheinlichkeit, dass es reflektiert wird, ist 1 − 𝒯 = 𝐼r ∕𝐼. Abbildung 13.7 illustriert den Prozess. Strahlteiler ein Photon ein Photon
(Wahrscheinlichkeit ) ein Photon (Wahrscheinlichkeit
= 1– )
Abb. 13.7 Probabilistische Reflexion oder Transmission eines Photons an einem Strahlteiler.
Übung 13-1: Photonen in einem Gaußstrahl
(a) Betrachten Sie ein einzelnes Photon, das durch einen Gaußstrahl beschrieben wird (die TEM0,0-Mode eines Kugelspiegelresonators; siehe die Abschnitte 3.1.2, 5.4.1 und 11.2.2). Wie groß ist die Wahrscheinlichkeit, das Photon an einem Punkt innerhalb eines Kreises
Bildgebung mit einzelnen Photonen
Wie in Abschnitt 4.4 und A.3 beschrieben, wird ein kohärentes bildgebendes System durch eine Impulsantwortfunktion ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) charakterisiert, die die Felder 𝑈E (𝑥, 𝑦) und 𝑈A (𝑥, 𝑦) am Ein- und Ausgang über
13.1 Das Photon
eine zweidimensionale Faltung miteinander verknüpft, ∞
𝑈A (𝑥, 𝑦) = ∬ 𝑈E (𝑥′ , 𝑦 ′ )ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ . (13.9) −∞
Dieselbe Beziehung verknüpft auch die Wellenfunktionen eines einzelnen Photons am Ein- und Ausgang eines bildgebenden Systems, wobei |𝑈A (𝑥, 𝑦)|2 die Wahrscheinlichkeitdichtefunktion für den Ort des Photons in der Bildebene angibt.
13.1.5 Der Impuls eines Photons In der klassischen elektromagnetischen Optik, die wir in Abschnitt 5.4.1 diskutiert hatten, trägt eine elektromagnetische ebene Welle eine Impulsdichte (pro Volumenˆ wobei 𝑊 die Energiedichte (pro Volueinheit) (𝑊∕𝑐)k, ˆ ein Einheitsvektor in der Richtung meneinheit) und k des Wellenvektors k ist. In der Photonenoptik ist der Impuls eines Photons p = ˆ wobei E = ℏ𝜔 = ℏ𝑐𝑘 seine Energie ist. Daher gilt: (E ∕𝑐)k, Der Impuls eines Photons in einer Mode entsprechend einer ebenen Welle mit dem Wellenvektor k ist p = ℏk .
(13.10)
Sein Betrag ist 𝑝 = ℏ𝑘 = ℏ𝜔∕𝑐 = ℏ2π∕𝜆; folglich gilt 𝑝 = E ∕𝑐 = ℎ∕𝜆 .
(13.11)
Der Impuls einer lokalisierten Welle
Eine Welle mit einer allgemeineren Form als der einer ebenen Welle, die durch eine komplexe Wellenfunktion der Form 𝑈(r) exp(i2π𝜈𝑡) beschrieben wird, kann mithilfe der Methoden der Fourieroptik (siehe Kapitel 4) als Summe von ebenen Wellen mit unterschiedlichen Wellenvektoren geschrieben werden. Die Komponente mit dem Wellenvektor k kann dabei in der Form 𝐴(k) exp(−ik ⋅ r) exp(i2π𝜈𝑡) geschrieben werden, wobei 𝐴(k) ihre Amplitude ist. Der Impuls eines durch eine beliebige komplexe Wellenfunktion 𝑈(r) exp(i2π𝜈𝑡) beschriebenen Photons ist unbestimmt. Er hat mit einer Wahrscheinlichkeit proportional zu |𝐴(k)|2 den Wert p = ℏk ,
(13.12)
wobei 𝐴(k) die Amplitude der ebenen Welle mit dem Wellenvektor k in der Fourierentwicklung von 𝑈(r) ist.
Wenn 𝑓(𝑥, 𝑦) = 𝑈(𝑥, 𝑦, 0) die komplexe Amplitude in der Ebene 𝑧 = 0 ist, hat die Fourierkomponente der ebenen Welle mit dem Wellenvektor k = (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) die Amplituden 𝐴(k) = 𝐹(𝑘𝑥 ∕2π, 𝑘𝑦 ∕2π), wobei 𝐹(𝜈𝑥 , 𝜈𝑦 ) die zweidimensionale Fouriertransformierte von 𝑓(𝑥, 𝑦) ist (siehe Kapitel 4). Weil die Funktionen 𝑓(𝑥, 𝑦) und 𝐹(𝜈𝑥 , 𝜈𝑦 ) ein Paar von Fouriertransformierten bilden, sind ihre Breiten invers verknüpft und erfüllen die Beziehung zwischen Zeit und Bandbreite [siehe Gl. (A.13)]. Die Unbestimmtheitsrelation zwischen dem Ort des Photons und der Richtung seines Impulses gründet sich darauf, dass der Ort des Photons in der Ebene 𝑧 = 0 gemäß |𝑈(r)|2 = |𝑓(𝑥, 𝑦)|2 probabilistisch bestimmt ist, und die Richtung seines Impulses durch |𝐴(k)|2 = |𝐹(𝑘𝑥 ∕2π, 𝑘𝑦 ∕2π)|2 probabilistisch bestimmt ist. Wenn also 𝜎𝑥 die Ortsunbestimmtheit in 𝑥-Richtung in der Ebene 𝑧 = 0 und 𝜎𝜃 = −1 sin (𝜎𝑘𝑥 ∕𝑘) ≈ (𝜆∕2π)𝜎𝑘𝑥 die Winkelunbestimmtheit um die 𝑧-Achse (die wir als ≪ 1 annehmen) sind, dann 1 ist die Unbestimmtheitsrelation 𝜎𝑥 𝜎𝑘𝑥 ≥ äquivalent zu 2 𝜎𝑥 𝜎𝜃 ≥ 𝜆∕4π. Ein Photon einer ebenen Welle hat einen bekannten Impuls (Richtung und Betrag sind definiert), sodass 𝜎𝜃 = 0 ist, aber sein Ort ist völlig ungewiss (𝜎𝑥 = ∞); es ist mit gleicher Wahrscheinlichkeit an allen Orten in der Ebene 𝑧 = 0 anzutreffen. Wenn ein Photon in einer ebenen Welle durch eine Öffnung hindurchtritt, wird sein Ort auf Kosten einer größeren Unbestimmtheit seines Impuls lokalisiert. Die Unbestimmtheit zwischen Ort und Impuls weist daher Parallelen zur Theorie der Beugung auf, die wir in Kapitel 4 beschrieben hatten. Das anderen Extrem, der Gegensatz zur ebenen Welle, ist ein Photon einer Kugelwelle. Sein Ort ist wohlbestimmt (im Zentrum der Welle), aber die Richtung seines Impulses ist völlig unbestimmt. Der Strahlungsdruck
Weil ein Photon einen Impuls trägt und dieser erhalten bleiben muss, erfährt ein Atom, dass das Photon aussendet, einen Rückstoß mit dem Betrag ℎ𝜈∕𝑐. Außerdem kann der Impuls eines Photons auf Gegenstände mit einer endlichen Masse übertragen werden und eine Kraft auf sie ausüben, die eine mechanische Bewegung auslöst. Beispielsweise können Lichtstrahlen verwendet werden, um Atomstrahlen abzulenken oder Atome oder kleine Gruppen von dielektrischen Teilchen einzuschließen (siehe Abschnitt 14.3.6). Zur Beschreibung dieses Phänomens wird häufig der Begriff Strahlungsdruck gebraucht (Druck = Kraft/Fläche).
383
384
13 Photonenoptik
Übung 13-2: Rückstoß aufgrund des Photonenimpulses
Berechnen Sie die Rückstoßgeschwindigkeit, die ein 198 Hg-Atom bei der Aussendung eines Photons der Energie 4.88 eV erhält. Vergleichen Sie das mit dem Effektivwert der thermischen Geschwindigkeit v des Atoms bei einer Temperatur von 𝑇 = 300 K (die Sie erhalten, indem Sie die mittlere kinetische Energie gleich 1 3 der mittleren thermischen Energie setzen, 𝑚v 2 = k𝑇, 2 2 wobei k = 1.38 × 10−23 J∕K die Boltzmannkonstante ist). Der Spindrehimpuls eines Photons
Photonen besitzen einen intrinsischen Spindrehimpuls, der mit zwei zirkular polarisierten Zuständen verknüpft ist, in denen der Vektor des elektrischen Feldes auf einem Kreis senkrecht zu seiner Ausbreitungsrichtung rotiert. Da das Photon sich mit Lichtgeschwindigkeit fortbewegt, liegt die Projektion seines Spinvektors entweder parallel oder antiparallel zu seinem Wellenvektor; seine Helizität ist folglich auf zwei Werte 𝕊 = ±ℏ
(13.13)
gequantelt, wobei das positive (negative) Vorzeichen zu der rechts- (links-) zirkularen Polarisation gehört. Linear polarisierte Photonen besitzen mit gleicher Wahrscheinlichkeit parallelen und antiparallelen Spin. Ebenso wie Photonen einen Impuls auf einen Gegenstand übertragen können, können zirkular polarisierte Photonen auch ein Drehmoment auf einen Gegenstand ausüben. Beispielsweise kann ein zirkular polarisiertes Photon ein Drehmoment auf eine Halbwellenplatte ausüben. Bosonen und Fermionen
Elementarteilchen werden in zwei große Klassen unterteilt: Bosonen wie Photonen und andere Vermittler von Kräften besitzen einen Spin, der ein ganzzahliges Vielfaches von ℏ ist; dasselbe gilt für Quasiteilchen wie Plasmonen, Polaritonen und Phononen. Im Gegensatz dazu besitzen Fermionen wie Elektronen, Protonen, Neutronen und andere elementare Bestandteile der Materie einen Spin, der ein halbes ganzzahliges Vielfaches von ℏ ist. Der Bahndrehimpuls eines Photons
Neben dem mit der zirkularen Polarisation verbundenen Spindrehimpuls kann eine elektromagnetische Welle auch einen Drehimpuls aufgrund einer Verwindung ihrer Wellenfront um die Ausbreitungsrichtung besitzen. Der Laguerre-Gauß-Strahl mit der Wellenfunktion 𝑈𝑙,𝑚 (𝜌, 𝜙, 𝑧) aus Gl. (3.69), der eine azimutale Phasenabhängigkeit exp(i𝑙𝜙) und demzufolge eine helikale Wellenfront besitzt, trägt für 𝑙 ≠ 0 beispielsweise
einen Drehimpuls, der nicht von seinem Polarisationszustand abhängt. Zur Unterscheidung vom Spindrehimpuls wird dieser Drehimpuls Bahndrehimpuls genannt. Ein Photon in einer solchen Mode besitzt einen Bahndrehimpuls L = 𝑙ℏ. Ein anderes Beispiel ist ein Photon in einer Flüstergaleriemode eines zylindrischen Resonators (Abschnitt 11.3.2). In der Sprache der Strahlenoptik entspricht die Mode einem Strahl, der entlang der kreisförmigen Begrenzung des Resonators verläuft. In der Sprache der Wellenoptik erfüllt die Wellenlänge die Resonanzbedingung 2π𝑎 = 𝑞𝜆, wenn 𝑎 der Radius des Kreises und 𝑞 = 1, 2, … ist. Der Impuls des Photons ist 𝑝 = ℏ𝑘 = ℏ2π∕𝜆 = 𝑞ℏ∕𝑎, und sein Drehimpuls ist folglich 𝑎𝑝 = 𝑞ℏ. Ganz ähnlich hat ein Photon in einer Flüstergaleriemode eines Mikrokugelresonators (Abschnitt 11.4.3) mit dem Radius 𝑎 einen Drehimpuls L = 𝓁ℏ, wobei die ganze Zahl 𝓁 mit der Resonanzwellenlänge für einen Strahlverlauf entlang eines Großkreises zusammenhängt. Diese Zahl kann als Bahndrehimpulsquantenzahl ähnlich der bei der Beschreibung eines Wasserstoffatoms verwendeten aufgefasst werden (siehe Abschnitt 14.1.1).
13.1.6
Die Interferenz von Photonen
Im Allgemeinen wird das Zweiloch-Interferenzexperiment von Young als Beleg für die Wellennatur des Lichts aufgeführt (siehe Übung 2-10). Interessant ist dabei die Tatsache, dass das Experiment von Young sogar dann ausgeführt werden kann, wenn sich zu jedem Zeitpunkt nur ein einzelnes Photon im Apparat befindet. Das Ergebnis dieser Anordnung kann im Rahmen der Photonenoptik verstanden werden, wenn wir die Regel für den Ort eines Photons verwenden. Dazu berechnen wir die Intensität in der Beobachtungsebene mithilfe der elektromagnetischen Wellenoptik und wandeln das Ergebnis in eine Wahrscheinlichkeitsdichte um, die die zufällige Position des detektieren Photons angibt. Die Interferenz entsteht aus den Phasendifferenzen, die mit den beiden möglichen Wegen verknüpft sind. Wir betrachten eine ebene Welle, die auf einen Schirm mit zwei kleinen Löchern im Abstand 2𝑎 trifft, wie Abb. 13.8 illustriert (siehe auch Abb. 2.27). Die Verbindungslinie der beiden Löcher legt die 𝑥-Achse fest. Auf der anderen Seite des Schirms erzeugt die gebeugte Welle zwei Kugelwellen, die in der Beobachtungsebene interferieren. In der parabolischen Näherung erzeugen die Kugelwellen eine sinusförmige variierende Intensität (siehe Übung 2-10) 𝐼(𝑥) ≈ 2𝐼0 (1 + cos
2π 𝑥𝜃 ), 𝜆
(13.14)
13.1 Das Photon λ θ θ= 2a
z
2a
λ
x
einzelnes Photon
x
Abb. 13.8 Das Zweilochexperiment von Young mit einem einzelnen Photon. Das Interferenzmuster I(x) bestimmt die Wahrscheinlichkeitsdichte, das Photon am Ort x anzutreffen.
Schirm Beobachtungs- Wahrscheinebene lichkeit
wobei 𝐼0 die Intensität jeder der beiden Wellen in der Beobachtungsebene ist, 𝜆 die Wellenlänge und 𝜃 der Winkel, unter dem die beiden Löcher in der Beobachtungsebene erscheinen (Abb. 13.8). Das Resultat in Gl. (13.14) beschreibt das Intensitätsmuster, das für normales Licht experimentell beobachtet wird. Wenn sich immer nur ein einzelnes Photon in der Apparatur befindet, ist die Wahrscheinlichkeit, es am Ort 𝑥 zu finden, nach Gl. (13.8) proportional zu 𝐼(𝑥). Am wahrscheinlichsten werden wir es an den Positionen 𝑥 entdecken, für die 𝐼(𝑥) maximal ist. An Orten, wo 𝐼(𝑥) = 0 ist, werden wir es nie finden. Wenn wir ein Histogramm der Positionen konstruieren, an denen wir das Photon bei vielen Wiederholungen des Experiments entdeckt haben, wie Taylor das 1909 tat, dann erhalten wir das klassische Interferenzmuster, das wir auch sehen, wenn wir das Experiment nur einmal, aber mit einem starken Lichtstrahl ausführen. Das Interferenzmuster beschreibt somit die Wahrscheinlichkeitsverteilung des Ortes, an dem ein einzelnes Photon beobachtet wird. Das Auftreten der Interferenz ergibt sich aus der ausgedehnten Natur des Photons, die ihm erlaubt, durch beide Löcher der Apparatur hindurchzutreten. Hierdurch erhält es Kenntnis von der vollständigen experimentellen Anordnung, wenn es die Beobachtungsebene erreicht, wo es als einzelnes Ereignis registriert wird. Wenn eines der Löcher bedeckt wird, verschwindet das Interferenzmuster. Übung 13-3: Ein einzelnes Photon in einem MachZehnder-Interferometer
Betrachten Sie eine ebene Lichtwelle mit der Wellenlänge 𝜆, die an einem Strahlteiler in zwei Teile zerlegt (siehe Abschnitt 13.1.4) und in einem Mach-ZehnderInterferometer wieder rekombiniert wird, wie in Abb. 13.9 dargestellt ist [siehe auch Abb. 2.24(a)]. Tragen Sie für den Fall, dass die Welle nur ein einzelnes Photon enthält, die Wahrscheinlichkeit, das Photon am Detektor zu finden, als Funktion von
d ∕𝜆 auf (für 0 ≤ d ∕𝜆 ≤ 1), wobei d die Differenz der beiden optischen Weglängen des Lichts ist. Nehmen Sie an, dass die Spiegel und Strahlteiler vollkommen eben und verlustfrei sind und dass für die Strahlteiler 1 𝒯 = ℛ = gilt. Wo könnte das Photon sein, wenn die 2 Wahrscheinlichkeit seiner Entdeckung am Detektor nicht eins ist?
Photon
Detektor
Abb. 13.9 Ein einzelnes Photon in einem Mach-ZehnderInterferometer.
13.1.7 Die Zeit eines Photons Die in Gl. (13.1) gegebene Modenentwicklung beschreibt monochromatische Moden, die „ewige“ harmonische Funktionen der Zeit sind. Ein Photon in einer monochromatischen Mode kann zu jedem Zeitpunkt mit gleicher Wahrscheinlichkeit nachgewiesen werden. Wie wir bereits angemerkt hatten, ist eine solche Modenentwicklung der Strahlung innerhalb (oder außerhalb) eines Resonators nicht eindeutig. Eine allgemeinere Entwicklung ist in polychromatischen Moden (z. B. zeitlich lokalisierten Wellenpaketen) möglich. Die Wahrscheinlichkeit, das durch die komplexe Wellenfunktion 𝑈(r, 𝑡) beschriebene Photon in dem infinitesimalen Zeitintervall zwischen 𝑡 und 𝑡 + d𝑡 an einem beliebigen Ort zu entdecken (siehe Abschnitt 2.6.1), ist proportional zu 𝐼(r, 𝑡) d𝑡 ∝ |𝑈(r, 𝑡)|2 d𝑡. Die Regel für den Ort eines Photons aus Gl. (13.8) kann daher verallgemeinert werden, um die zeitliche Lokalisierung von Photonen zu berücksichtigen: Die Wahrscheinlichkeit, ein Photon an einem Punkt r innerhalb der infinitesimalen Fläche d A während des infi-
385
386
13 Photonenoptik
nitesimalen Zeitintervalls zwischen 𝑡 und d𝑡 zu beobachten, ist proportional zur Intensität der Mode am Ort r zur Zeit 𝑡, also 𝑝(r, 𝑡) d A d𝑡 ∝ 𝐼(r, 𝑡) d A d𝑡 ∝ |𝑈(r, 𝑡)|2 d A d𝑡 . (13.15)
Zeit-Energie-Unschärfe
Die Zeit, während der ein Photon in einer monochromatischen Mode mit der Frequenz 𝜈 nachgewiesen werden kann, ist völlig unbestimmt, wohingegen seine Frequenz 𝜈 (und seine Energie ℎ𝜈) exakt bestimmt ist. Umgekehrt muss ein Photon in einer Wellenpaketmode mit einer Intensität 𝐼(𝑡) der Dauer 𝜎𝑡 innerhalb dieser Zeit lokalisiert werden. Diese zeitliche Einschränkung erzeugt infolge der Eigenschaften der Fouriertransformation eine Unbestimmtheit in seiner Frequenz (und Energie). Das Ergebnis ist ein polychromatisches Photon. Wenn wir die r-Abhängigkeit der Einfachheit halber weglassen, können wir die Frequenzunschärfe leicht durch eine Fourierentwicklung von 𝑈(𝑡) in ihre harmonischen Komponenten berechnen, ∞
𝑈(𝑡) = ∫ 𝑉(𝜈) exp(i2π𝜈𝑡) d𝜈 ,
(13.16)
−∞
wobei 𝑉(𝜈) die Fouriertransformierte von 𝑈(𝑡) ist (siehe Abschnitt A.1). Der Breite 𝜎𝜈 von |𝑉(𝜈)|2 bezeichnet die spektrale Breite. Wenn 𝜎𝑡 die quadratisch gemittelte Breite der Funktion |𝑈(𝑡)|2 ist, müssen 𝜎𝑡 und 𝜎𝜈 die Reziprozitätsbeziehung zwischen Pulsdauer und Band1 breite erfüllen, 𝜎𝜈 𝜎𝑡 ≥ 1∕4π oder äquivalent 𝜎𝜔 𝜎𝑡 ≥ 2 (siehe Abschnitt A.2 für die Definitionen von 𝜎𝑡 und 𝜎𝜈 , die zu dieser Unschärferelation führen). Die Energie ℏ𝜔 des Photons kann dann nicht genauer als auf 𝜎E = ℏ𝜎𝜔 angegeben werden. Hieraus folgt, dass die Energieunbestimmtheit eines Photons und die Zeit, während der es nachgewiesen werden kann, die Beziehung 𝜎E 𝜎𝑡 ≥
ℏ 2
unendlich lange (𝜎𝑡 → ∞) beobachtet werden. Im Gegensatz dazu ist ein durch ein optisches Wellenpaket beschriebenes Photon zeitlich lokalisiert und ist daher polychromatisch mit einer entsprechenden Energieunsicherheit. Ein Wellenpaket-Photon kann als ein zeitlich und räumlich lokalisiertes, sich ausbreitendes Energiepaket aufgefasst werden. Übung 13-4: Ein einzelnes Photon in einem gaußschen Wellenpaket
Betrachten Sie ein ebenes Wellenpaket (siehe Abschnitt 2.6.1), das ein einzelnes Photons mit der komplexen Wellenfunktion ( 𝑧) (13.18) 𝑈(r, 𝑡) = a 𝑡 − 𝑐 enthält, das sich in 𝑧-Richtung ausbreitet; dabei ist a(𝑡) = exp (−
𝑡2 ) exp(i2π𝜈0 𝑡) . 4𝜏2
(13.19)
(a) Zeigen Sie, dass die Unbestimmtheit seiner Zeit 𝜎𝑡 = 𝜏 und seiner 𝑧-Position 𝜎𝑧 = 𝑐𝜎𝑡 sind. (b) Zeigen Sie, dass die Unbestimmtheit in seiner Energie und seinem Impuls die Beziehungen minimaler Unbestimmtheit erfüllen: 𝜎E 𝜎𝑡 = ℏ∕2 ,
(13.20)
𝜎𝑧 𝜎𝑝 = ℏ∕2 .
(13.21)
Gleichung (13.21) ist der Grenzfall der minimalen Unbestimmtheit der heisenbergschen Unschärferelation zwischen Ort und Impuls [siehe Gl. (A.14)].
Zusammenfassung
Elektromagnetische Strahlung kann als eine Summe von Moden, z. B. monochromatischen ebenen Wellen der Form E(r, 𝑡) =
∑
𝐴q exp(−ikq ⋅ r) exp(i2π𝜈q 𝑡)ˆ eq
(13.22)
q
(13.17)
erfüllen müssen, die als Zeit-Energie-Unschärferelation bezeichnet wird. Sie ist analog zu der Unbestimmtheitsrelation zwischen Ort und Wellenzahl (Impuls), die eine Grenze für die Präzision setzt, mit der Ort und Impuls eines Photons gleichzeitig angegeben werden können. Die mittlere Energie E dieses polychromatischen Photons ist E = ℎ𝜈 = ℏ𝜔. Wir wollen die Fakten noch einmal kurz zusammenfassen: Ein monochromatisches Photon (𝜎𝜈 → 0) kann
beschrieben werden. Jede ebene Welle hat zwei orthogonale Polarisationszustände (z. B. vertikal/horizontal linear polarisiert, rechts-/linkszirkular polarisiert), die durch die Vektoren ˆ eq beschrieben werden. Wenn die Energie einer Mode gemessen wird, ist das Ergebnis eine ganze (im Allgemeinen zufällige) Zahl von Energiequanten (Photonen). Jedes der Photonen einer Mode q hat die folgenden Eigenschaften: • Energie E = ℎ𝜈q , • Impuls p = ℏkq ,
13.2 Photonenströme
• Helizität (Spindrehimpuls) 𝕊 = ±ℏ, wenn es zirkular polarisiert ist, • es ist mit gleicher Wahrscheinlichkeit überall im Raum und zu jeder Zeit anzutreffen, da die Wellenfunktion der Mode eine monochromatische ebene Welle ist. Die Wahl der Moden ist nicht eindeutig. Eine Modenentwicklung in nichtmonochromatischen (quasimonochromatischen) nichtebenen Wellen ist ebenfalls möglich: ∑ E(r, 𝑡) = 𝐴q 𝑈q (r, 𝑡)ˆ eq . (13.23) q
Die Photonen in einer Mode q haben dann die folgenden Eigenschaften: • Ort und Zeit werden durch die komplexe Wellenfunktion 𝑈q (r, 𝑡) bestimmt. Die Wahrscheinlichkeit, ein Photon in dem infinitesimalen Zeitintervall zwischen 𝑡 und 𝑡 + d𝑡 in der infinitesimalen Fläche d A am Ort r anzutreffen, ist proportional zu |𝑈q (r, 𝑡)|2 d A d𝑡. • Wenn 𝑈q (r, 𝑡) eine endliche Lebensdauer 𝜎𝑡 hat, d. h. wenn das Photon zeitlich lokalisiert ist, dann hat die Photonenenergie ℎ𝜈q eine Unbestimmtheit ℎ𝜎𝜈 ≥ ℎ∕4π 𝜎𝑡 . • Wenn 𝑈q (r, 𝑡) eine endliche Ausdehnung in der transversalen Ebene (𝑧 = 0) hat, d. h. wenn das Photon beispielsweise in 𝑥-Richtung lokalisiert ist, dann ist die Richtung des Photonenimpulses unbestimmt. Die Verbreiterung des Photonenimpulses kann bestimmt werden, indem man 𝑈q (r, 𝑡) als Summe von ebenen Wellen schreibt, wobei die Welle mit dem Wellenvektor k einem Photonenimpuls ℏk entspricht. Die Lokalisierung des Photons in der transversalen Ebene führt zu einer Zunahme der Unbestimmtheit der Richtung des Photonenimpulses.
13.2 Photonenströme In Abschnitt 13.1 haben wir uns auf die Eigenschaften und das Verhalten von einzelnen Photonen konzentriert. Nun wollen wir die Eigenschaften von Ansammlungen von Photonen untersuchen. Als Ergebnis der Prozesse, durch die Photonen erzeugt werden (z. B. Emissionen aus Atomen, siehe Kapitel 14), ist die Zahl von Photonen in einer Mode im Allgemeinen zufällig. Die Wahrscheinlichkeitsverteilung, der die Photonenzahl folgt, wird vom Quantenzustand des Lichts bestimmt (siehe Abschnitt 13.3). Photonenströme enthalten meist viele sich ausbreitende Moden, die alle eine zufällige Zahl von Photonen enthalten.
Licht
t
Detektor Oszilloskop
Abb. 13.10 Photonenereignisse zu definierten zufälligen Zeitpunkten in einem Detektor, der das Licht über eine Fläche A integriert.
Wenn ein Experiment ausgeführt wird, in dem ein schwacher Strom von Photonen auf eine lichtempfindliche Oberfläche fällt, werden die Photonen gemäß Gl. (13.15) zu wohldefinierten, aber zufälligen Zeitpunkten und an zufälligen Orten detektiert. Dieser raumzeitliche Vorgang kann auch direkt wahrgenommen werden, wenn man einen schwach beleuchteten Gegenstand mit bloßen, an die Dunkelheit adaptierten Augen betrachtet. Das zeitliche und das räumliche Verhalten der Nachweise der einzelnen Photonenereignisse können getrennt voneinander behandelt werden. Das zeitliche Muster wird deutlich, wenn man einen Detektor mit einer guten zeitlichen Auflösung verwendet, der das Licht über eine endliche Fläche A integriert, wie in Abb. 13.10 dargestellt ist. Gleichung (13.15) sagt uns, dass die Wahrscheinlichkeit, ein Photon in dem infinitesimalen Zeitintervall zwischen 𝑡 und 𝑡 + d𝑡 nachzuweisen, proportional zur optischen Leistung zur Zeit 𝑡 ist: P (𝑡) = ∫A 𝐼(r, 𝑡) d A. Die Photonen werden zu zufälligen Zeiten registriert. Andererseits zeigt sich das räumliche Muster der nachgewiesenen Photonen einfach, wenn wir einen Detektor mit einer guten räumlichen Auflösung wählen, der über ein festes Zeitintervall T integriert (z. B. fotografischer Film). Nach Gl. (13.15) ist die Wahrscheinlichkeit, ein Photon in der infinitesimalen Fläche d A um den Punkt r zu beobachten, proportional zu der integrierten lokalen T Intensität ∫0 𝐼(r, 𝑡) d𝑡. Das wird durch das körnige Foto von Max Planck links in Abb. 13.11 illustriert. Dieses Bild ist eine Reproduktion des rechten Teilbildes, die bei sehr schwacher Beleuchtung aufgenommen wurde. Jeder weiße Punkt in der Fotografie bezeichnet einen zufälligen Photonennachweis; die Dichte der Nachweise folgt der lokalen Intensität.
13.2.1 Der Photonenstrom Wir beginnen, indem wir einige Definitionen einführen, die den mittleren Photonenstrom mit den klassischen elektromagnetischen Größen Intensität, Leistung
387
388
13 Photonenoptik
Tab. 13.1 Mittlere Flussdichte der Photonen für verschiedene Lichtquellen. mittlere Flussdichte der Photonen (pro s und cm2 )
Quelle
Sternenlicht
106
Mondlicht
108
Zwielicht
1010
Zimmerbeleuchtung
1012
Sonnenlicht
1014
Laserstrahla)
1022
a) 10 mW He-Ne-Laser mit 𝜆0 = 633 nm, fokussiert auf einen Punkt von 20 μm Durchmesser.
Abb. 13.11 Die zufällig detektierten Photonen haben eine räumliche Dichte, die proportional zur lokalen optischen Intensität ist. Das linke Bild von Max Planck wurde unter Beleuchtung mit einem schwachen Strom von Photonen von dem rechten Bild reproduziert, das bei hoher Lichtintensität entstand.
und Energie verknüpfen. Diese Definitionen sind durch Gl. (13.15) angeregt, die den Ort und die Zeit des Nachweises eines einzelnen Photons beschreibt. Wir besprechen dann stochastische Eigenschaften des Photonenflusses und die Photonenzahlstatistik für verschiedene Lichtquellen. Zuletzt betrachten wir die zufällige Aufteilung eines Photonenstroms durch einen Strahlteiler oder Detektor. Die mittlere Flussdichte der Photonen
Monochromatisches Licht der Frequenz 𝜈 und der konstanten klassischen Intensität 𝐼(r) (W∕cm2 ) enthält eine mittlere Flussdichte 𝜙(r) =
𝐼(r) ℎ𝜈
(13.24)
von Photonen. Da jedes Photon eine Energie ℎ𝜈 trägt, gibt diese Gleichung eine direkte Umrechnung aus einer klassischen Maßeinheit (Energie pro s und cm2 ) in eine Quantenmaßeinheit (Photonen pro s und cm2 ). Für quasimonochromatisches Licht der Mittenfrequenz 𝜈 haben alle Photonen näherungsweise dieselbe Energie ℎ𝜈, sodass die mittlere Flussdichte der Photonen näherungsweise gleich 𝜙(r) ≈
𝐼(r) ℎ𝜈
(13.25)
tonen über eine gegebene Fläche integrieren, 𝛷 = ∫ 𝜙(r) d A = A
P
ℎ𝜈
,
(13.26)
wobei ℎ𝜈 wieder die mittlere Energie eines Photons ist und P die optische Leistung (in Watt), P = ∫ 𝐼(r) d A .
(13.27)
A
Zum Beispiel liefert eine optische Leistung von 1 nW bei einer Wellenlänge 𝜆0 = 0.2 μm einen mittleren Photonenfluss 𝛷 ≈ 109 Photonen pro Sekunde, die auf einen Gegenstand auftreffen. Grob gesagt bedeutet das, dass im Mittel ungefähr jede Nanosekunde ein Photon auf den Gegenstand trifft, 1 nW bei 𝜆0 = 0.2 μm ⇒ 1 Photon pro ns .
(13.28)
Ein Photon der Wellenlänge 𝜆0 = 1 μm trägt ein Fünftel dieser Energie, d. h. sodass eine Leistung von 1 nW einem Mittelwert von 5 Photonen pro Nanosekunde entspricht. Die mittlere Zahl von Photonen Die mittlere Zahl n von Photonen, die auf einer Fläche A im Zeitintervall T registriert werden, erhalten wir, indem
wir den mittleren Photonenfluss 𝛷 in Gl. (13.26) mit der Dauer multiplizieren, n = 𝛷T =
E
ℎ𝜈
,
(13.29)
ist. Typische Werte von 𝜙(r) für einige übliche Lichtquellen sind in Tabelle 13.1 angegeben. Die Zahlen machen deutlich, dass jede Sekunde Billionen von Photonen auf jeden Quadratzentimeter unserer Haut aufschlagen.
wobei E = PT die optische Energie (in Joule) ist. Die Beziehungen zwischen den klassischen und den Quantenmaßeinheiten sind in Tabelle 13.2 zusammengefasst.
Der mittlere Photonenfluss
Spektrale Dichte des Photonenflusses
Den mittleren Photonenfluss 𝛷 (Photonen pro Sekunde) erhalten wir, indem wir die mittlere Flussdichte der Pho-
Für polychromatisches Licht mit nicht vernachlässigbarer Bandbreite ist es nützlich, spektrale Dichten der klas-
13.2 Photonenströme
wobei
Tab. 13.2 Klassische und Quantenmaßeinheiten.
T
Klassische Maßeinheit
Quantenmaßeinheit
optische Intensität 𝐼(r)
Photonenflussdichte 𝜙(r) = 𝐼(r)∕ℎ𝜈
optische Leistung P
Photonenfluss
𝛷 = P ∕ℎ𝜈
optische Energie
Photonenzahl
n = E ∕ℎ𝜈
E
E = ∫ P (𝑡) d𝑡 = ∫ ∫ 𝐼(r, 𝑡) d A d𝑡
Tab. 13.3 Spektrale Dichten in der klassischen und der Quantenwelt. Klassische Größe
Quantengröße
𝐼𝜈
W/(cm2 Hz)
𝜙𝜈 = 𝐼𝜈 ∕ℎ𝜈
P𝜈
W/Hz
𝛷𝜈 = P 𝜈 ∕ℎ𝜈
Photonen/(s Hz)
E𝜈
J/Hz
n𝜈 = E 𝜈 ∕ℎ𝜈
Photonen/Hz
Photonen/(s cm2 Hz)
sischen Intensität, Leistung und Energie und ihrer Gegenstücke in der Quantenwelt zu definieren: die spektrale Photonenflussdichte, der spektrale Photonenfluss und die spektrale Photonenzahl, die in Tabelle 13.3 zusammengefasst sind. Zum Beispiel ist P 𝜈 d𝜈 die optische Leistung im Frequenzintervall zwischen 𝜈 und 𝜈 + d𝜈, während 𝛷𝜈 d𝜈 den Fluss von Photonen angibt, deren Frequenzen zwischen 𝜈 und 𝜈 + d𝜈 liegen. Zeitlich variierendes Licht
Wenn die Lichtintensität sich zeitlich ändert, ist die Photonenflussdichte in Gl. (13.24) eine Funktion der Zeit, 𝜙(r, 𝑡) =
𝐼(r, 𝑡) . ℎ𝜈
(13.30)
Auch der Photonenfluss und die optische Leistung sind dann Funktionen der Zeit, 𝛷(𝑡) = ∫ 𝜙(r, 𝑡) d A = A
P(𝑡)
ℎ𝜈
(13.31)
mit P (𝑡) = ∫ 𝐼(r, 𝑡) d A .
(13.32)
A
Folglich ändert sich auch die mittlere Zahl der im Zeitintervall zwischen 𝑡 = 0 und 𝑡 = T nachgewiesenen Photonen, die wir durch Integration des Photonenflusses erhalten, mit der Zeit: T
n = ∫ 𝛷(𝑡) d𝑡 = 0
E
ℎ𝜈
,
T
(13.33)
0
(13.34)
0 A
die mittlere optische Energie (die Intensität integriert über Zeit und Fläche) ist.
13.2.2 Stochastische Eigenschaften des Photonenflusses Wenn die klassische Intensität 𝐼(r, 𝑡) konstant ist, sind die Zeit und der Ort der Registrierung eines einzelnen Photons durch Gl. (13.15) bestimmt, die besagt, dass die Wahrscheinlichkeitsdichte der Detektion dieses Photons am Raum-Zeit-Punkt (r, 𝑡) proportional zu 𝐼(r, 𝑡) ist. Die klassische elektromagnetische Intensität 𝐼(r, 𝑡) bestimmt das Verhalten von Photonenströmen ebenso wie von einzelnen Photonen, aber die Interpretation von 𝐼(r, 𝑡) unterscheidet sich: Für Photonenströme bestimmt die klassische Intensität 𝐼(r, 𝑡) die mittlere Photonenflussdichte 𝜙(r, 𝑡). Die Eigenschaften der Lichtquelle bestimmen die Fluktuationen von 𝜙(r, 𝑡). Wir betrachten einen Detektor wie den in Abb. 13.10 dargestellten, der räumlich integriert. Wenn die Intensität 𝐼 zeitlich konstant ist, dann gilt dasselbe auch für die Leistung P . Die mittlere Flussdichte der Photonen ist dann 𝜙 = 𝐼∕ℎ𝜈, und der mittlere Photonenfluss ist 𝛷 = P ∕ℎ𝜈. Die Zeitpunkte, an denen die Photonen detektiert werden, sind jedoch stochastisch; ihr statistisches Verhalten wird durch die Quelle bestimmt, wie in Abb. 13.12(a) gezeigt ist. Für 𝜆0 = 1 μm liefert eine optische Leistung P = 1 nW im Mittel 𝛷 = 5 Photonen pro Nanosekunde oder 0.005 Photonen pro Pikosekunde. Natürlich können nur ganze Photonen nachgewiesen werden. Ein Mittelwert von 0.005 Photonen/ps bedeutet, dass von 105 betrachteten Zeitintervallen der Dauer T = 1 ps die meisten leer sein werden (d. h. dass in ihnen keine Photonen nachgewiesen werden), in etwa 500 Intervallen wird ein Photon nachgewiesen werden, und in sehr wenigen Intervallen werden zwei oder mehr Photonen angetroffen. Wenn sich die optische Leistung P (𝑡) mit der Zeit ändert, folgt die mittlere Dichte der Photonennachweise der Funktion P(𝑡), wie Abb. 13.12(b) schematisch illustriert. Der mittlere Fluss ist 𝛷(𝑡) = P (𝑡)∕ℎ𝜈; er gibt die Tatsache wieder, dass mehr Photonen detektiert werden, wenn die Leistung groß ist. Diese Variation kommt zu den Fluktuationen der Photonennachweise aufgrund des Charakter der Lichtquelle hinzu.
389
13 Photonenoptik
(t) optische Leistung
(t)
optische Leistung
390
t
t
Photonen
t
(a)
Photonen (b)
t
Abb. 13.12 (a) Konstante optische Leistung und die entsprechenden stochastischen Ankunftszeiten der Photonen, deren statistische Eigenschaften durch die Lichtquelle bestimmt werden. (b) Zeitlich variierende optische Leistung und die
entsprechenden stochastischen Ankunftszeiten der Photonen, deren statistische Eigenschaften jetzt sowohl durch die Fluktuationen der optischen Leistung als auch durch die Art der Lichtquelle bestimmt sind (siehe Abschnitt 13.2.3).
Das Bild von Max Planck links in Abb. 13.11 illustriert dasselbe Verhalten in räumlicher Hinsicht. Die Orte der nachgewiesenen Photonen folgen insgesamt der klassischen Intensitätsverteilung; die Nachweisdichte von Photonen ist dort hoch, wo die Intensität groß ist, und ist gering, wo die Intensität klein ist. Aber es gibt eine beträchtliche Körnigkeit (Rauschen) im Bild, die eine direkte Konsequenz der Fluktuationen der Orte der Photonenereignisse sind, die mit der Lichtquelle zusammenhängen. Diese Fluktuationen sind am deutlichsten wahrnehmbar, wenn die mittlere Flussdichte der Photonen klein ist wie im Fall des linken Bildes in Abb. 13.11. Wenn die mittlere Flussdichte der Photonen überall im Bild groß ist, wie in dem rechten Foto in Abb. 13.11, verschwindet die Körnigkeit, und die klassische Intensitätsverteilung dominiert.
Allgemeinen mithilfe der Quantentheorie des Lichts behandelt werden, die in Abschnitt 13.3 kurz beschrieben wird. Unter bestimmten Bedingungen kann die Ankunft von Photonen aber als das unabhängige Eintreten einer Folge von zufälligen Ereignissen aufgefasst werden, deren Rate gleich dem Photonenfluss und somit proportional zur optischen Leistung ist. Die optische Leistung kann deterministisch (wie in kohärentem Licht) oder zeitabhängig stochastisch sein (wie in partiell kohärentem Licht). Für teilweise kohärentes Licht (siehe Kapitel 12) sind die Fluktuationen der Leistung korreliert, sodass die Ankunft von Photonen keine Folge von unabhängigen Ereignissen mehr ist; die Photonenstatistik wird dann wesentlich verändert.
13.2.3
Photonenzahlstatistik
Ein Verständnis der Photonenzahlstatistik ist für Anwendungen wie die Rauschreduktion in schwachen Bildern oder die Optimierung der optischen Informationsübertragung wichtig. In faseroptischen Nachrichtensystemen wird Information in Form von Lichtpulsen übertragen (siehe Kapitel 25). Nur die mittlere Zahl von Photonen pro Puls kann an der Quelle gesteuert werden; die tatsächliche Zahl von ausgesandten Photonen ist unvorhersehbar und ändert sich von Puls zu Puls, was zu Fehlern bei der Informationsübertragung führen kann. Die statistische Verteilung der Zahl von Photonen hängt von der Natur der Lichtquelle ab und muss im =9
=8
=7
Kohärentes Licht
Kohärentes Licht besitzt eine konstante optische Leistung P. Der entsprechende mittlere Photonenfluss 𝛷 = P ∕ℎ𝜈 (Photonen/s) ist ebenfalls konstant, aber die tatsächlichen Zeitpunkte der Detektion der Photonen sind wie in Abb. 13.12(a) und Abb. 13.13 gezeigt stochastisch. Wir betrachten ein Zeitintervall der Dauer T (die Zähldauer) und bezeichnen die Zahl der nachgewiesenen Photonen (die Photonenzahl) mit n. Wir wissen bereits, dass die mittlere Photonenzahl gleich n = 𝛷 T = PT ∕ℎ𝜈 ist. Wir suchen nun einen Ausdruck für die Photonenzahlverteilung 𝑝(n), d. h. die Wahrscheinlichkeit 𝑝(0), keine Photonen nachzuweisen, die Wahrscheinlichkeit 𝑝(1), genau ein Photon zu entdecken usw. Ein Ausdruck für die Wahrscheinlichkeitsverteilung 𝑝(n) kann unter der Annahme hergeleitet werden, dass = 11 t
Abb. 13.13 Zufällige Ankunft von Photonen in einem Lichtstrahl mit konstanter Leistung P innerhalb eines Zeitintervalls der Dauer T. Obwohl die optische Leistung konstant ist, ist die Zahl n der Photonen, die innerhalb jedes Intervalls nachgewiesen werden, zufällig.
13.2 Photonenströme
Abb. 13.14 Semilogarithmische Darstellung der Poissonverteilung p(n) der Photonenzahl n für verschiedene Werte n der mittleren Photonenzahl. Mit zunehmendem Wert von n wird die Kurve immer steiler.
1 p( ) 10 –1 1
= 10
0.1 0
10 –2
10 –3 0
10
5
15
die Nachweise von Photonen statistisch unabhängig sind. Das Resultat ist die Poissonverteilung nn exp(−n) , 𝑝(n) = n!
n = 0, 1, 2, …
(13.35)
Herleitung: Die Poissonverteilung Teilen Sie das in Abb. 13.13 dargestellte Zeitintervall T in eine große Zahl N von Subintervallen mit hinreichend kurzer Dauer T ∕N, sodass jedes Intervall mit der Wahrscheinlichkeit 𝑝 = n∕n ein Photon enthält und mit der Wahrscheinlichkeit 1 − 𝑝 keine Photonen. Die Wahrscheinlichkeit, n unabhängige Photonen in den N Subintervallen zu finden, ist dann durch die Binomialverteilung gegeben. N! 𝑝n (1 − 𝑝)N−n , n!(N − n)! N −n
n
=
N! n n ( ) (1 − ) N n!(N − n)! N
𝜎n2 =
∞ ∑
n
Im Grenzfall N → ∞ gilt N!∕(N − n)!N → 1 und [1 − (n∕n)]N−n → exp(−n), woraus Gl. (13.35) folgt.
𝜎n2 = n .
n=0
n 𝑝(n)
(13.38)
Wenn beispielsweise n = 100 und 𝜎n = 10 ist, wird die Messung von 100 Photonen von einer Ungenauigkeit von ungefähr ±10 Photonen begleitet.
Die Zufälligkeit der Zahl von Photonen ist eine grundsätzliche Quelle von Rauschen, mit der wir konfrontiert sind, wenn wir Signale mithilfe von Licht übertragen wollen. Ein nützliches Maß für die Leistungsfähigkeit eines Systems zur Übertragung von Information ist das Signal/Rausch-Verhältnis auf der Basis der Photonenzahl. Wenn wir das Signal durch seinen Mittelwert n und sein Rauschen durch die Standardabweichung 𝜎n kennzeichnen, ist das Signal/Rausch-Verhältnis (SRV, oft auch SNR von engl. signal-to-noise ratio) als 2
Jede Zufallsvariable wird durch zwei wichtige Parameter charakterisiert: ihren Mittelwert und ihre Varianz. Der Mittelwert der Photonenzahl ist ∞ ∑
(13.37)
Die Standardabweichung 𝜎n (die Quadratwurzel der Varianz) ist ein Maß für die Breite der Verteilung. Die Größen 𝑝(n), n und 𝜎n werden zusammengefasst als Photonenzahlstatistik bezeichnet. Obwohl die Funktion 𝑝(n) mehr Information enthält als nur ihren Mittelwert und die Varianz, sind diese zu ihrer groben Charakterisierung trotzdem nützlich. Man kann leicht zeigen [durch Einsetzen von Gl. (13.35) in Gl. (13.36) und Gl. (13.37)], dass der Mittelwert der Poissonverteilung tatsächlich n und ihre Varianz gleich ihrem Mittelwert ist:
Mittelwert und Varianz der Photonenzahl
n=
(n − n)2 𝑝(n) .
Signal/Rausch-Verhältnis
.
t
0
und ihre Varianz, die gleich der mittleren quadratischen Abweichung vom Mittelwert ist, beträgt
n=0
Dieses Ergebnis ist in Abb. 13.14 in einer semilogarithmischen Auftragung für mehrere Werte des Mittelwerts n gezeigt. Die Kurven werden mit steigendem n immer breiter.
𝑝(n) =
20
(13.36)
SRV =
(Mittelwert) n2 = 2 Varianz 𝜎n
(13.39)
definiert. Für die Poissonverteilung gilt nach Gl. (13.38) 𝜎n2 = n und daher SRV = n .
(13.40)
391
392
13 Photonenoptik
Das Signal/Rausch-Verhältnis einer Poissonverteilung nimmt somit linear mit der mittleren Zahl von nachgewiesenen Photonen zu. Obwohl das Signal/Rausch-Verhältnis ein nützliches Maß für die Zufälligkeit eines Signals ist, ist es für einige Anwendungen notwendig, die Wahrscheinlichkeitsverteilung selbst zu kennen. Ein wichtiges Maß für die Leistungsfähigkeit von digitalen faseroptischen Kommunikationssystemen ist beispielsweise die Fehlerwahrscheinlichkeit. Wenn man in einem solchen System eine mittlere Zahl von n = 20 Photonen zur Kommunikation aussendet, ist die Wahrscheinlichkeit, dass keine Photonen empfangen werden, gemäß Gl. (13.35) 𝑝(0) ≈ 2 × 10−9 . Da diese Situation wie in Abschnitt 25.2.2 beschrieben einen Fehler darstellt, ist die vollständige Wahrscheinlichkeitsverteilung erforderlich, um eine Aussage über die Leistungsfähigkeit des Systems treffen zu können.
2
2
1
1
0
0
T1
P( )
Abb. 13.15 Boltzmannverteilung P(E n ) als Funktion der Energie E n (auf der Ordinate aufgetragen) für zwei Werte der Temperatur T. Je kleiner die Temperatur ist, desto unwahrscheinlicher ist es, dass höhere Energieniveaus besetzt werden. Die Energieniveaus einer Ansammlung von Photonen in einer Mode der Frequenz 𝜈 sind links gezeigt.
dieser Mode anzutreffen, n
Thermisches Licht
Wenn die Ankunftszeiten der Photonen nicht unabhängig sind, wie es z. B. für thermisches Licht der Fall ist, kann die Photonenstatistik einer anderen als der Poissonverteilung folgen. Thermisches Licht entsteht in einem optischen Resonator, dessen Wände konstant bei einer Temperatur 𝑇 gehalten werden und dessen Atome Photonen in die Moden des Resonators emittieren. Nach den Gesetzen der statistischen Mechanik ist die Wahrscheinlichkeit der Besetzung eines Energieniveaus E n in einer Mode im thermischen Gleichgewicht durch die Boltzmannverteilung 𝑃(E n ) ∝ exp (−
T2 > T1
En ) k𝑇
𝑝(n) ∝ exp (−
ℎ𝜈 nℎ𝜈 ) = [exp (− )] , k𝑇 k𝑇
n = 0, 1, 2, …
(13.42) Wenn wir die Wahrscheinlichkeitsverteilung auf eins ∑∞ normieren, d. h. n = 0 𝑝(n) = 1 setzen, ergibt sich die Normierungskonstante zu [1 − exp(−ℎ𝜈∕k 𝑇)]. Die Null1 punktsenergie E 0 = ℎ𝜈 wird in die Normierungskon2 stante hineingezogen; sie beeinflusst die Ergebnisse im Einklang mit der Diskussion in Abschnitt 13.1.2 nicht. Die Wahrscheinlichkeitsverteilung wird am einfachsten durch den Mittelwert n der Photonenzahl ausgedrückt; das ergibt n
(13.41)
gegeben, wobei k = 1.38 × 10−23 J∕K die Boltzmannkonstante ist. Diese exponentielle Verteilung ist in Abb. 13.15 für zwei Werte des Parameters 𝑇 aufgetragen. Im thermischen Gleichgewicht ist die Besetzungszahl eines Niveaus zufällig, aber höhere Energien sind im Verhältnis weniger wahrscheinlich als niedrigere Energien. In Abschnitt 14.2 wird ausführlich diskutiert, wie diese Form der Verteilung zustande kommt. Bei Zimmertemperatur (𝑇 = 300 K) ist k𝑇 = 26 meV, 4.14 zJ oder 209 cm−1 , wie Abb 13.3 zeigt. Wir betrachten nun eine Ansammlung von Photonen in einer Mode des Resonators mit der Frequenz 𝜈 als Gas im thermischen Gleichgewicht bei der Temperatur 𝑇. Nach der Quantisierungsbedingung Gl. (13.5) sind sei1 ne erlaubten Energieniveaus E n = (n + )ℎ𝜈. Damit er2 halten wir für die Wahrscheinlichkeit, n Photonen in
n 1 𝑝(n) = ( ) , n+1 n+1
(13.43)
mit [siehe Gl. (13.36)] n=
1 . exp(ℎ𝜈∕k 𝑇) − 1
(13.44)
Dieser Ausdruck stimmt mit dem überein, den wir in Abschnitt 14.4.1 für den Mittelwert für eine Ansammlung von Photonen erhalten werden, die im thermischen Gleichgewicht mit Atomen wechselwirken [Gl. (14.65)]. Im Sprachgebrauch der Wahrscheinlichkeitstheorie wird diese Verteilung als geometrische Verteilung bezeichnet, da 𝑝(n) eine geometrisch abnehmende Funktion von n ist. In der Physik wird sie Bose-Einstein-Verteilung genannt, da sie erstmals von Bose auf der Grundlage einer statistischen Argumentation bezüglich der Zählung von Zuständen ununterscheidbarer Teilchen wie Photonen vorgeschlagen
13.2 Photonenströme
Abb. 13.16 Bose-Einstein-Verteilung p(n) der Photonenzahl n für verschiedene Werte der mittleren Photonenzahl n. Mit steigenden Werten von n verlaufen die Kurven immer flacher.
1
p( ) 10 –1 = 10 10 –2 0.1
5
1
10 –3 0
5
10
15
wurde. Einstein erkannte, dass Gl. (13.43) auch für Bosonen gilt, deren Zahl erhalten bleibt, und sagte die Möglichkeit der Kondensation eines bosonischen atomaren Gases in seinen tiefsten Quantenzustand vorher, wenn es unter eine kritische Temperatur abgekühlt würde (siehe Abschnitt 14.3.6). Die Bose-Einstein-Verteilung ist in Abb. 13.16 für mehrere Werte von n [oder äquivalent für mehrere Werte der Temperatur 𝑇 gemäß Gl. (13.44)] gezeigt. Ihr exponentieller Charakter zeigt sich in dieser semilogarithmischen Auftragung durch das lineare Verhalten. Der Vergleich von Abb. 13.16 mit Abb. 13.14 zeigt, dass die Verteilung der Photonenzahl für thermisches Licht von ihrem Wert für n = 0 aus monoton abnimmt und viel breiter ist als diejenige für kohärentes Licht. Mithilfe von Gl. (13.37) erhalten wir für die Varianz der Photonenzahl der Bose-Einstein-Verteilung 𝜎n2 = n + n2 .
(13.45)
Wenn wir diesen Ausdruck mit der Varianz der Poissonverteilung vergleichen, die nach Gl. (13.40) einfach n ist, sehen wir, dass die Varianz der Bose-Einstein-Verteilung für n > 1 quadratisch mit n ansteigt. Offensichtlich besitzt thermisches Licht (Bose-Einstein-Verteilung) eine weitaus größere Varianz als kohärentes Licht (Poissonverteilung), was auch durch Vergleich von Abb. 13.16 mit Abb. 13.14 deutlich wird. Das ausgeprägte Rauschen der Bose-Einstein-Verteilung kommt sehr deutlich in ihrem Signal/Rausch-Verhältnis zum Ausdruck, für das nach Gl. (13.39) gilt SRV =
n n+1
.
(13.46)
Es bleibt immer kleiner als eins, egal wie groß n wird. Thermisches Licht ist folglich im Allgemeinen zu stark verrauscht, um für die Informationsübertragung von praktischem Nutzen sein zu können.
20
Übung 13-5: Die mittlere Energie in einer Resonatormode
Zeigen Sie, dass die mittlere Energie einer Resonatormode der Frequenz 𝜈 im thermischen Gleichgewicht bei der Temperatur 𝑇 durch E = k𝑇
ℎ𝜈∕k 𝑇 exp(ℎ𝜈∕k 𝑇) − 1
(13.47)
gegeben ist. Skizzieren Sie die Abhängigkeit von E von 𝜈 für mehrere Werte von k𝑇∕ℎ. Verwenden Sie eine Taylorentwicklung des Nenners, um einen vereinfachten genäherten Ausdruck für E im Grenzfall ℎ𝜈∕k 𝑇 ≪ 1 zu erhalten. Erklären Sie das Ergebnis physikalisch. Doppelt-stochastische Photonenzahlstatistik
Wie zuvor erwähnt sind die Intensität 𝐼(r, 𝑡), die optische Leistung P und der Photonenfluss 𝛷 = P ∕ℎ𝜈 für kohärentes Licht konstant. Das Eintreffen der Photonen kann somit als eine Folge von unabhängigen Ereignissen mit einer Poissonverteilung 𝑝(𝑛) = nn e−n ∕𝑛! betrachtet werden, wobei die mittlere Photonenzahl n konstant ist. Wenn das Licht jedoch nur partiell kohärent ist und seine Intensität zeitlich variiert, dann gilt dasselbe auch für die optische Leistung (wie in Abb. 13.12(b) zu sehen ist), den Photonenfluss und die mittlere Photonenzahl n. Nach Gl. (13.33) und (13.34) gilt dann für die mittlere Photonenzahl (die wir aus Gründen der Übersichtlichkeit jetzt mit w anstelle von n bezeichnen wollen) T
T
1 1 ∫ P(𝑡) d𝑡 = ∫ ∫ 𝐼(r, 𝑡) d A d𝑡 . w= ℎ𝜈 ℎ𝜈 0
(13.48)
0 A
Die integrierte Intensität w, die die Einheit einer mittleren Photonenzahl hat (also dimensionslos ist), variiert für partiell kohärentes Licht zeitlich. Wie wir im Folgenden zeigen wollen, bewirken Variationen der mittleren Photonenzahl aufgrund von Intensitätsfluktuationen eine Abweichung der Photonenzahlverteilung von der Poissonverteilung. Wenn die Fluktuationen in der mittleren Photonenzahl w durch eine
393
394
13 Photonenoptik
Wahrscheinlichkeitsdichte 𝑝(w) beschrieben werden, erhalten wir die bedingungslose Wahrscheinlichkeitsverteilung für partiell kohärentes Licht, indem wir die bedingte Poissonverteilung 𝑝(n|w) = wn e−w ∕n! über alle erlaubten Werte von w mitteln, jeweils gewichtet mit ihrer Wahrscheinlichkeitsdichte 𝑝(w). Die resultierende Verteilung der Photonenzahl hat dann die Form ∞
𝑝(n) = ∫
wn e−w 𝑝(w) dw , n!
(13.49)
0
die als Mandelgleichung bekannt ist. Gleichung (13.49) wird auch als doppelt-stochastische Photonenzahlverteilung bezeichnet, weil sie zwei stochastische Einflüsse berücksichtigt: Die zufälligen Ankunftszeiten der Photonen selbst, die sich lokal poissonartig verhalten, und die Fluktuationen der Intensität, die aus der partiell kohärenten Natur des Lichts resultieren. Eine Folge von zufälligen Photonennachweisen, die zu einer doppelt-stochastischen Photonenzahlstatistik führt, wird als doppelt-stochastischer Poissonprozess bezeichnet. Mittelwert und Varianz der Photonenzahl für eine doppelt-stochastische Photonenzahlverteilung ergeben sich aus den Gln. (13.36) und (13.37) in Verbindung mit Gl. (13.49); die Ergebnisse lauten n=w
(13.50)
bzw. 2 . 𝜎n2 = n + 𝜎w
(13.51)
2 die Varianz von w. Die Varianz der Hier bedeutet 𝜎w Photonenzahl ist die Summe von zwei Beiträgen: Der erste Term ist der elementare Beitrag der Poissonverteilung, wohingegen der zweite ein zusätzlicher (positiver) Beitrag ist, der aus den Fluktuationen der optischen Leistung entsteht. Diese Theorie der Photonenstatistik ist jedoch nur auf eine bestimmte Art von Licht anwendbar, das sogenannte „klassische Licht“; eine allgemeinere Theorie auf der Grundlage einer Quantenbeschreibung des Zustands von Licht wird in Abschnitt 13.3 beschrieben. Für ein interessantes Beispiel gehorcht die integrierte Intensität w der exponentiellen Wahrscheinlichkeitsdichte
𝑝(w) =
w ⎧ 1 exp (− ) , w ≥ 0 , w w ⎨ 0, w 1) ist, einer Gaußfunktion 𝜙(p) mit einer (gestreckten) Breite 𝜎p = 𝑠∕2. Das Produkt 1 𝜎x 𝜎p behält seinen minimalen Wert von , aber der Un4
Erzeugung und Anwendungen von quadraturgequetschtem Licht
Wegen seines reduzierten Rauschens bezüglich einer seiner Quadraturkomponenten hat quadraturgequetschtes Licht eine Nischenanwendung in Präzisionsmessungen gefunden. Es ist jedoch nicht robust gegenüber Verlusten. Das typische Beispiel ist die Verwendung von quadraturgequetschtem Licht im LIGO-Gravitationswellen-
13.3 Quantenzustände des Lichts
ℰ(t)
1/
2σ = 1/ ω 2σ = t
Abb. 13.21 Typische Unsicherheiten des Feldes und der Quadraturkomponenten für einen quadraturgequetschten Zustand (genauer gesagt einen amplitudengequetschten Zustand). Der Unsicherheitskreis des kohärenten Zustands (Abb. 13.19) wird zu einer Ellipse gleicher Fläche verformt. Würde man die Unsicherheitsellipse um 90◦ drehen, so-
dass ihre große Halbachse nicht mehr senkrecht, sondern parallel zur Richtung des Zeigers läge, ergäbe sich ein phasengequetschter Zustand, da dann die Phasenunsicherheit auf Kosten der Amplitude verringert wäre. Der gequetschte Vakuumzustand hat die Form einer Ellipse am Ursprung.
interferometer. In der in Beispiel 2-2 betrachteten Konfiguration des Interferometers fallen Lichtstrahlen auf alle Strahlteiler mit Ausnahme des Ausgangs, der einem Vakuum ausgesetzt ist. Die Empfindlichkeit des Interferometers kann gesteigert werden, indem man den Ausgang einem gequetschten Vakuumzustand geeigneter Phase aussetzt. 2) Quadraturgequetschtes Licht kann auf verschiedene Arten erzeugt werden, unter anderem durch optische parametrische Abwärtskonvertierung in einem Hohlraum (Abschnitt 22.2.3).
zahl, die dieser Beziehung gehorchen, sind nichtklassisch, da Gl. (13.51) nicht erfüllt sein kann. Eine elektromagnetische Mode, die durch den Eigenzustand 𝜓(x ) = 𝜓n0 (x ) eines harmonischen Oszillators beschrieben wird, liefert ein Beispiel für photonenzahlgequetschtes Licht. Sie wird als Zahlzustand bezeichnet, weil für eine feste Zahl n = n0 von Photonen 𝑝(n) = |𝑐n |2 = 1 ist, während alle anderen Koeffizienten verschwinden. Man bezeichnet den Zahlzustand auch als Fockzustand. Die Zahl der Photonen in der Mode ist deterministisch; sie ist genau n0 . Die mittlere Photonenzahl ist offensichtlich n = n0 und die Varianz ist null (da es keine Fluktuationen der Photonenzahl gibt). Der Fall n0 = 1 entspricht der Anwesenheit genau eines Photons in der Mode. Die Unbestimmtheiten des Lichts im Zahlzustand sind in Abb. 13.22 illustriert. Obwohl die Quadraturkomponenten sowie der Betrag und die Phase des Zeigers alle unsicher sind, ist die Photonenzahl absolut sicher. Für n = 0 reduziert sich der Zahlzustand auf den Vakuumzustand aus Abb. 13.20. Photonenzahlquetschung kann auch auf der Grundlage anderer Zustände erreicht werden, z. B. mit dem Binomialzustand (siehe Aufgabe 13-20).
13.3.5 Photonenzahlgequetschtes Licht Quadraturgequetschtes Licht besitzt in einer seiner Quadraturkomponenten eine Unbestimmtheit, die gegenüber der des kohärenten Zustands reduziert ist. Eine andere Form des nichtklassischen Lichts ist photonenzahlgequetschtes Licht, das auch als intensitätsgequetschtes oder sub-Poisson-Licht bezeichnet wird. Bei dieser Form des Lichts liegt die Varianz der Photonenzahl unter der des kohärenten Zustands, sodass 𝜎n2 < n „gequetscht“ wird. Fluktuationen der Photonen2) Siehe z. B. M. C. Teich, B. E. A. Saleh, ‚Squeezed and Antibunched Light‘, Physics Today 43(6), 26–34, 1990.
Abb. 13.22 Typische Unsicherheiten für den Zahlzustand. Die Mode enthält eine feste Zahl von Photonen, n = n0 . Dieser Zustand ist photonenzahlgequetscht, aber nicht quadraturgequetscht.
ℰ(t) ω
t
399
400
13 Photonenoptik
Erzeugung und Anwendungen von photonenzahlgequetschtem Licht
Wie quadraturgequetschtes Licht wird auch photonenzahlgequetschtes Licht durch das Vorhandensein von Verlusten nachteilig beeinflusst (Abschnitt 13.3.6). Trotzdem findet diese Art von nichtklassischem Licht eine Reihe von Anwendungen in der Quanteninformationsverarbeitung, der Kommunikationstechnik, der Datenverarbeitung und der Kryptographie. Photonenzahlgequetschtes Licht kann durch eine Reihe von Methoden erzeugt werden, so z. B. durch (1) den Einsatz einer Rückkopplung, um einer ansonsten poissonartigen Folge von Photonen Antikorrelationen zu verleihen, (2) Sub-Poisson-Anregung (z. B. durch einen Strom von Elektronen, der einer Raumladung ausgesetzt ist) eines Atoms oder eines anderen Teilchens, das als Reaktion auf die Anregung ein einzelnes Photon emittiert, (3) die Konversion von Zweiphotonenlicht, wobei die Ankunft eines Photons eines Paares dazu dient, die Anwesenheit seines gleichzeitig ankommenden Begleiters anzukündigen, wie in Abschnitt 13.3.6 diskutiert oder (4) die Emission aus einem Quantenpunkt, einem Defekt oder einem ähnlichen Element, das in eine photonische Struktur eingebettet ist, wie in Abschnitt 17.2.5 erläutert.
13.3.6
𝐴𝑥𝑥 𝐴𝑦𝑥
binierte 2 × 2-Matrix J = [ 𝐴
𝑥𝑦
𝐴𝑦𝑦
], wobei der erste In-
dex jeweils die Polarisation des ersten Photons und der zweite Index die Polarisation des zweites Photons angibt. Zum Beispiel ist |𝐴𝑦𝑥 |2 die Wahrscheinlichkeit, das erste Photon mit 𝑦-Polarisation (vertikale Polarisation) und das zweite mit 𝑥-Polarisation (horizontale Polarisation) aufzufinden. Verschränkte Photonen
Wenn die beiden Photonen unabhängig sind, lässt sich ihre kombinierte Wellenfunktion in ein Produkt der einzelnen Wellenfunktionen faktorisieren. Es gilt also 𝑈(𝑥1 , 𝑥2 ) = 𝑈1 (𝑥1 ) 𝑈2 (𝑥2 ) .
(13.72)
Damit lässt sich aber auch die Wahrscheinlichkeit des Nachweises der beiden Photonen faktorisieren, was zeigt, dass die Orte der beiden Photonen statistisch unabhängig und unkorreliert sind. Wenn die kombinierte Wellenfunktion sich nicht in dieser Weise als Produkt schreiben lässt, nennt man die Photonen verschränkt. Ein Extremfall ist die Wellenfunktion 𝑈(𝑥1 , 𝑥2 ) = 𝑈s (𝑥1 )δ(𝑥1 − 𝑥2 ) ,
(13.73)
Zweiphotonenlicht
Zweiphotonenlicht ist eine weitere Form von nichtklassischem Licht. Es wird durch eine kombinierte Wellenfunktion beschrieben, die die Amplitude der kombinierten Wahrscheinlichkeit darstellt. Beispielsweise werden seine räumlichen Eigenschaften durch die Wellenfunktion 𝑈(𝑥1 , 𝑥2 ) beschrieben, wobei |𝑈(𝑥1 , 𝑥2 )|2 die kombinierte Wahrscheinlichkeitsdichte dafür ist, die beiden Photonen an den Positionen 𝑥1 und 𝑥2 in der transversalen Ebene anzutreffen. Die entsprechenden Richtungs- (oder Ortsfrequenz-) Eigenschaften werden durch die zweidimensionale Fouriertransformierte von 𝑈(𝑥1 , 𝑥2 ) beschrieben, die mit 𝑉(𝜈𝑥1 , 𝜈𝑥2 ) bezeichnet wird. Die kombinierte Wahrscheinlichkeitsdichte, Photonen mit den Wellenvektoren k1 und k2 (und den Impulsen ℏk1 und ℏk2 ) zu detektieren, ist durch |𝑉(𝜈𝑥1 , 𝜈𝑥2 )|2 , gegeben, wobei 𝑘𝑥1 = 2π 𝜈𝑥1 und 𝑘𝑥2 = 2π 𝜈𝑥2 die transversalen Komponenten der Wellenvektoren sind. Die zeitlichen und spektralen Eigenschaften werden in ähnlicher Weise durch die kombinierte Wellenfunktion 𝑈(𝑡1 , 𝑡2 ) und ihre zweidimensionale Fouriertransformierte 𝑉(𝜈1 , 𝜈2 ) beschrieben. Während der Polarisationszustand von klassischem [𝐴 ] 𝑥 oder Einphotonenlicht durch den Jonesvektor J = 𝐴 𝑦 beschrieben wird, gilt für Zweiphotonenlicht die kom-
x2 x1
die zwei Photonen beschreibt, die immer an derselben Position anzutreffen sind (𝑥1 = 𝑥2 ), obwohl diese Position gemäß der Wahrscheinlichkeitsdichte |𝑈s (𝑥1 )|2 zufällig ist. In diesem Fall nennt man die Photonen maximal verschränkt. Die Fouriertransformierte von Gl. (13.73) ist 𝑉(𝜈𝑥1 , 𝜈𝑥2 ) = 𝑉s (𝜈𝑥1 )δ(𝜈𝑥1 − 𝜈𝑥2 ) ,
(13.74)
νx2
νx1
wobei 𝑉s (𝜈𝑥 ) die eindimensionale Fouriertransformierte von 𝑈s (𝑥) ist. Die transversalen Komponenten des Wellenvektors sind dann antikorreliert (𝑘𝑥1 = −𝑘𝑥2 ), was zeigt, dass auch die Richtungen der beiden Photonen antikorreliert sind.
13.3 Quantenzustände des Lichts
Ein Beispiel für zwei Photonen, die im Hinblick auf die Polarisation maximal verschränkt sind, ist der Polarisationszustand 1 J= √ 2
⎡0 ⎢ 1 ⎣
1⎤ ⎥. 0 ⎦
(13.75)
V
H H
V
Es gibt hier zwei Möglichkeiten für die Polarisation, die beide gleich wahrscheinlich sind: Entweder ist Photon 1 ist 𝑦-polarisiert und Photon 2 𝑥-polarisiert oder umgekehrt. Jedes Photon kann entweder vertikal oder horizontal polarisiert sein, aber wenn eines vertikal polarisiert ist, muss das andere horizontal polarisiert sein. In der quantenoptischen Literatur bezeichnet man diesen Zustand des Photonenpaars als VH+HV-Superposition, wobei V und H symbolisch für die vertikale (𝑦) bzw. horizontale (𝑥) Polarisation stehen. Ein verschränktes Paar von Photonen wird auch als Biphoton bezeichnet und Zweiphotonenlicht wird manchmal als Zwillingsstrahllicht bezeichnet. Erzeugung und Anwendungen von Zweiphotonenlicht
Verschränktes Zweiphotonenlicht kann zum Beispiel mittels spontaner parametrischer Abwärtskonvertierung (SPDC, von engl. spontaneous parametric downconversion) erzeugt werden, einem nichtlinearen optischen Prozess, bei dem ein Teil eines auf einen nichtlinearen optischen Kristall einfallenden Photonenstrahls in Photonenpaare aufgeteilt wird, wobei Energie und Impuls erhalten bleiben (Abschnitt 22.2.3). Weil die Energie eines Photons E = ℎ𝜈 ist, schreibt die Energieerhaltung vor, dass die Frequenz des einfallenden Photons (Pumpe genannt) gleich der Summe der Energien der beiden abwärtskonvertierten Photonen (Signal und Idler 1 genannt) sein muss, d. h. 𝜔P = 𝜔1 + 𝜔2 oder (𝜔1 − 𝜔P ) = 2 −(𝜔2 − 𝜔P ). Wenn das Pumpphoton monochromatisch ist, ist 𝜔P konstant und 𝜔1 und 𝜔2 sind antikorrelierte Variablen. Aufgrund der FT-Beziehung zwischen den spektralen und zeitlichen Wellenfunktionen folgt daraus, dass die Emissionszeitpunkte vollständig korreliert sind, d. h. 𝑡1 = 𝑡2 . Da außerdem der Impuls eines Photons p = ℏk ist, fordert die Impulserhaltung in ähnlicher Weise, dass der Wellenvektor des Pumpphotons gleich der Summe der Wellenvektoren der beiden abwärtskonvertierten Photonen sein muss, d. h. kP = k1 + k2 . Wenn das Pumpphoton durch eine ebene Welle beschrieben wird, die sich in axialer (𝑧-) Richtung ausbreitet, müssen sich die
transversalen Komponenten 𝑘1,𝑥 und 𝑘2,𝑥 der Wellenvektoren der erzeugten Photonen zu null addieren. Also muss 0 = 𝑘1,𝑥 + 𝑘2,𝑥 oder 𝑘2,𝑥 = −𝑘1,𝑥 sein, was bedeutet, dass diese Komponenten antikorreliert sind; die Orte, an denen die beiden Photonen emittiert werden, müssen folglich korreliert sein, d. h. es muss 𝑥1 = 𝑥2 sein. Diese Zweiphotonen-Wellenfunktion hat demzufolge die in Gl. (13.73) angegebene Form, wobei 𝑈s (𝑥) durch die Abmessungen und optischen Eigenschaften des nichtlinearen Kristalls bestimmt wird, in dem die verschränkten Photonen erzeugt werden. Abwärtskonvertierte Photonen können auch polarisationsverschränkt sein, wenn der im konkreten Fall verwendete nichtlineare Prozess erfordert, dass ihre Polarisationen orthogonal sein müssen. Die SPDC eignet sich zur Erzeugung von verschränktem Zweiphotonenlicht mithilfe von makroskopischen optischen Kristallen (Beispiel 22-3) oder in monolithischen Halbleiterchips. Auch mit Edelgasen wie Argon gefüllte Hohlkernfasern aus photonischen Kristallen (Abschnitt 10.4) können eingesetzt werden, um über eine Instabilität der Modulation Zweiphotonenlicht zu erzeugen. Zweiphotonenlicht kann verwendet werden, um Einphotonenlicht zu erzeugen, wenn man das Eintreffen eines Photons aus einem Photonenpaar als Ankündigung der Anwesenheit des zweiten Photons nutzt. Verschränkte Photonen werden in Anwendungen wie der sicheren Quantenkommunikation, Quantenkryptographie, Sensorik und Bildgebung genutzt. Die Verschränkung kann über große Entfernungen transportiert werden – mithilfe von satellitenbasierten Systemen konnten Verschränkungen schon an Standorte auf der Erde in Entfernungen von mehr als 1200 km voneinander verteilt werden. Zweiphotonenoptik
Der Durchgang von Zweiphotonenlicht durch ein lineares optisches System folgt den Gleichungen auf der Grundlage der klassischen Optik, wie wir im Folgenden sehen werden. Polarisationsoptik
Wenn eine klassische ebene Welle, deren Polarisation durch den Jones-Vektor JE beschrieben wird, durch ein polarisierendes Element mit der Jonesmatrix T tritt, ist der Jonesvektor der austretenden Welle JA = TJE (Abschnitt 6.1.2). Diese Beziehung, die genauso auch für Einphotonenlicht gilt, lässt sich leicht auf Zweiphotonenlicht verallgemeinern, indem man die Matrix T zweimal anwendet, einmal für jedes Photon. Das liefert JA = TJE TT ,
(13.76)
401
402
13 Photonenoptik
wobei das hochgestellte T die transponierte Matrix bezeichnet. Beispiel 13-2: Polarisationsrotator
Die Jonesmatrix eines 45◦ -Polarisationsrotators ist J = 1 [ 1 −1 ] √ [siehe Gl. (6.9)]. Nach dem Durchgang 1 1 2
durch eine solches Element haben polarisationsverschränkte Photonen mit dem VH+HV-Jonesvektor J = 1 [0 1] √ [siehe Gl. (13.75)] den neuen Jonesvektor J = 2 10 1 [ −1 0 ] √ . Er beschreibt verschränkte Photonen im 0 −1 2
VV-HH-Zustand, für den die Photonen am Ausgang stets dieselbe Polarisation haben müssen; die Wahrscheinlichkeit einer orthogonalen Polarisation ist in diesem Fall null. Es kann gezeigt werden, dass maximal verschränktes Licht maximal verschränkt bleibt, wenn seine Polarisationsebene um einen beliebigen Winkel gedreht wird. Räumliche Optik
Wenn eine klassische Welle mit der Wellenfunktion 𝑈E (𝑥, 𝑦) durch ein optisches System mit der Impulsantwortfunktion ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) hindurchtritt, wird die ausgehende Welle 𝑈A (𝑥, 𝑦) durch das Integral aus Gl. (13.14) beschrieben, die auch für Einphotonenlicht gilt. Dieses Ergebnis kann auf Zweiphotonenlicht verallgemeinert werden, indem die Impulsantwortfunktion zweimal angewendet wird, einmal für jedes Photon. Wenn wir der Einfachheit halber die 𝑦-Abhängigkeit ignorieren, erhalten wir so ∞
𝑈A (𝑥1 , 𝑥2 ) ∫ ℎ(𝑥1 ; 𝑥1′ )ℎ(𝑥2 ; 𝑥2′ )𝑈E (𝑥1′ , 𝑥2′ ) d𝑥′ d𝑥2′ , −∞
(13.77)
wobei die Indizes 1 und 2 die beiden Photonen bezeichnen. Gleichung (13.77) ist analog zu Gl. (12.64) in Abschnitt 12.3.1 für die Ausbreitung von teilweise kohärentem Licht mit der wechselseitigen Intensität 𝐺(𝑥1 , 𝑥2 ) durch ein lineares optisches System; allerdings fehlt in Gl. (13.77) die Konjugation aus Gl. (12.64). Beispiel 13-3: Ein fouriertransformierendes System
Für ein optisches 2𝑓-System zur Durchführung einer Fouriertransformation (Abschnitt 4.2.2) ist ℎ(𝑥; 𝑥′ ) ∝ exp(−i𝑥𝑥′ ∕𝜆𝑓), wobei 𝜆 die Wellenlänge und 𝑓 die Brennweite der Linse ist. Weiterhin gilt 𝑈A (𝑥1 , 𝑥2 ) ∝ 𝑉E (𝑥1 ∕𝜆𝑓, 𝑥2 ∕𝜆𝑓), wobei 𝑉E (𝜈𝑥1 , 𝜈𝑥2 ) die zweidimensionale Fouriertransformierte von 𝑈E (𝑥1 , 𝑥2 ) ist. Das 2𝑓-System belegt die Richtungs- oder Impulseigenschaften von Zweiphotonenlicht. Korrelierte Photonen werden von der FT-Linse in antikorrelierte Photonen umgewandelt.
Zweistrahloptik
Zweiphotonenlicht in Form zweier Strahlen a und b wird [ 𝐴durch ] eine kombinierte 2 × 2-Jonesmatrix JE = 1 aa 𝐴ab √ beschrieben, in der |𝐴ba |2 beispielsweise 𝐴 𝐴 2
ba
bb
die Wahrscheinlichkeit angibt, dass das erste Photon in Strahl b und das zweite in Strahl a vorliegt. Wenn die beiden Strahlen in einem verlustfreien Element gemischt werden, das durch eine Streumatrix S charakterisiert wird (siehe Abschnitt 7.1.1), wird das ausgehende Paar von Strahlen des Zweiphotonenlichts durch die Matrix T JA = SJE S beschrieben, also eine Beziehung derselben Form wie Gl. (13.76). Beispiel 13-4: Hong-Ou-Mandel-Interferometer
Ein verlustfreier symmetrischer Strahlteiler wird entsprechend Gl. (7.20) durch die [ ]Streumatrix 1 1 i √ beschrieS = i 1 2
ben. Für einfallendes Licht mit dem Jonesvektor ] 1 [ JE = √ 01 10 (was bedeutet, dass sich in jedem Strahl 2
ein einzelnes Photon befindet) erhalten wir dann ] i [ T JA = SJE S = √ 10 01 . Dies zeigt, dass die beiden Pho2
tonen immer als Paar entweder aus dem einen oder aus dem anderen Ausgang austreten; die Wahrscheinlichkeit, dass die Photonen an unterschiedlichen Ausgängen erscheinen, ist null. 3) Die beiden ununterscheidbaren Photonen, die anfänglich unabhängig waren und durch unterschiedliche Eingänge in den Strahlteiler eingetreten sind, verlassen diesen also als unzertrennliches Paar durch einen gemeinsamen (zufällig gewählten) Ausgang. Um dieses Ergebnis zu verstehen, überlegen wir uns, dass es zwei Wege gibt, auf denen die an den Eingängen des Strahlteilers eintreffenden Photonen zu unterschiedlichen Ausgängen gelangen könnten – sie könnten beide reflektiert oder beide durchgelassen werden. Die Wahrscheinlichkeitsamplituden für diese beiden Möglichkeiten sind jedoch gleich, da die Photonen ununterscheidbar sind, und heben sich aufgrund der mit der Reflexion am Strahlteiler verbundenen Phasenverschiebung auf. Die einzigen verbleibenden Möglichkeiten sind daher, dass die Photonen gemeinsam aus demselben Ausgang austreten. Der Strahlteiler wandelt somit zwei ununterscheidbare Photonen an seinem Eingang in zwei verschränkte Photonen an seinen Ausgang 3) Siehe C. K. Hong, Z. Y. Ou, L. Mandel, ‚Measurement of Subpicosecond Time Intervals Between Two Photons by Interference‘, Physical Review Letters 59, 2044–2046, 1987.
Aufgaben
um, da beide immer am gleichen Ausgang austreten (obwohl dieser zufällig ist). Diese Form der Zweiphotoneninterferenz ist unter der Bezeichnung Hong-OuMandel-Interferenz bekannt und wird in der Quantenoptik, der Quanteninformationsverarbeitung und der Quantenbildgebung weithin eingesetzt.
von Licht erzeugen und manipulieren – beispielsweise einzelne Photonen, verschränkte Photonen oder komplexe Zustände, in denen Verschränkungen zwischen mehreren Moden auftreten.
Aufgaben Anwendungen der Zweiphotonenoptik
Optische Systeme auf der Grundlage von Zweiphotonenlicht werden in einer Reihe von Bereichen praktisch eingesetzt. Ein Beispiel aus dem Gebiet der Bildgebung ist die quantenoptische Kohärenztomographie (QOCT), 4) eine interferometrische Zweiphotonentechnik, mit deren Hilfe ein Schichtmedium in axialen Schnitten abgebildet werden kann. Verwendet werden dabei (1) zwei ununterscheidbare Photonen, (2) ein Hong-Ou-MandelInterferometer, in dem eines der Photonen an einem beweglichen Spiegel und das andere an der Probe reflektiert wird, bevor beide auf den Eingang des Strahlteilers treffen und (3) zwei Photodetektoren, die die Rate des gleichzeitigen Eintreffens zweier Photonen an den Ausgängen des Strahlteilers registrieren. Die Tiefen der reflektierenden Schichten in der Probe werden aus den Positionen des beweglichen Spiegels bestimmt, die zu Einbrüchen der Rate des gemeinsamen Eintreffens führen, was das Auftreten von Hong-Ou-Mandel-Interferenz anzeigt. Die QOCT ist das Zweiphotonen-Analogon der in Abschnitt 12.2.2 besprochenen optischen Kohärenztomographie (OCT), bei der partiell kohärentes Licht mit kurzer Kohärenzlänge, ein Michelsoninterferometer, bei dem einer der Spiegel durch die Probe ersetzt ist, und ein Photodetektor, der auf die Lichtintensität anspricht, zum Einsatz kommen (Abb. 12.15). Bei der OCT werden die Tiefen der reflektierenden Schichten in der Probe über die Positionen des beweglichen Spiegels bestimmt, die zu Interferenzstreifen in der Intensität führen. Die praktische Umsetzung der QOCT ist zwar deutlich komplexer als die der OCT, sie hat jedoch den Vorteil, dass sie keine Probleme mit einer Gruppengeschwindigkeitsdispersion (GGD) gerader Ordnung in der Probe hat, wodurch sich die erreichbare Auflösung und Tiefe der Abbildung vergrößern. Gleichzeitig können auf diesem Weg die GGD-Koeffizienten der Medien in der Probe bestimmt werden. Die Realisierung von optischen Zweiphotonensystemen wurde ganz wesentlich durch die Entwicklung der integrierten Quantenphotonik vorangetrieben, bei der On-Chip-Quantenschaltungen Quantenzustände 4) Siehe M. B. Nasr, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, ‚Dispersion-Cancelled and Dispersion-Sensitive Quantum Optical Coherence Tomography‘, Optics Express 12, 1353–1362, 2004.
Aufgabe 13-1: Die Energie eines Photons
(a) Welche Spannung muss verwendet werden, um ein Elektron aus der Ruhe so zu beschleunigen, dass es dieselbe Energie wie ein Photon der Wellenlänge 𝜆0 = 0.87 μm erhält? (b) Ein Photon der Wellenlänge 1.06 μm wird mit einem Photon der Wellenlänge 10.6 μm kombiniert, um ein Photon zu erzeugen, dessen Energie die Summe der Energien der beiden Photonen ist. Welche Wellenlänge hat das resultierende Photon? Dieser als Summenfrequenzerzeugung bezeichnete Prozess ist in Abb. 22.9 dargestellt. Aufgabe 13-2: Die Position eines einzelnen Photons auf einem Schirm
Betrachten Sie einen monochromatischen Lichtstrahl der Wellenlänge 𝜆0 , der √ mit einer Intensität 𝐼(𝜌) = 𝐼0 exp(−𝜌∕𝜌0 ) mit 𝜌 = 𝑥2 + 𝑦 2 auf einen unendlich ausgedehnten Schirm in der Ebene 𝑧 = 0 auftrifft. Nehmen Sie an, dass die Intensität der Quelle auf ein Niveau reduziert wird, bei dem nur ein einziges Photon auf den Schirm trifft. (a) Wie groß ist die Wahrscheinlichkeit, dass das Photon den Schirm innerhalb eines Radius 𝜌0 um den Ursprung trifft? (b) Wie viele Photonen treffen durchschnittlich innerhalb eines Kreises mit Radius 𝜌0 auf den Schirm, wenn der Strahl genau 106 Photonen enthält? Aufgabe 13-3: Der Impuls eines freien Photons
Vergleichen Sie den Gesamtimpuls der Photonen in einem Laserpuls mit einer Energie von 10 J mit dem einer Masse von 1 g, die sich mit einer Geschwindigkeit von 1 cm/s bewegt, sowie mit einem Elektron, das sich mit der Geschwindigkeit 𝑐0 ∕10 bewegt. Aufgabe 13-4: Der Impuls eines Photons in einem Gaußstrahl
(a) Wie groß ist die Wahrscheinlichkeit, dass der Impulsvektor eines Photons in einem Gaußstrahl mit dem Taillenradius 𝑊0 innerhalb des Divergenzwinkels 𝜃0 des Strahls liegt? Die nötigen Definitionen finden Sie in Abschnitt 3.1. (b) Gilt die Beziehung 𝑝 = E ∕𝑐0 in diesem Fall?
403
404
13 Photonenoptik
Aufgabe 13-5: Levitation durch Lichtdruck
Betrachten Sie ein isoliertes Wasserstoffatom der Masse 1.66 × 10−27 kg. (a) Bestimmen Sie die Gravitationskraft auf dieses Wasserstoffatom in der Nähe der Erdoberfläche (nehmen Sie an, dass die Gravitationsbeschleunigung auf Meereshöhe konstant 𝑔 = 9.8 m∕s2 ist). (b) Ein nach oben gerichteter Laserstrahl aus Photonen der Energie 1 eV sei so fokussiert, dass der vollständige Impuls all seiner Photonen auf das Atom übertragen wird. Geben Sie die mittlere aufwärts gerichtete Kraft auf das Atom an, wenn es jede Sekunde von einem Photon getroffen wird. (c) Bestimmen Sie die Zahl der Photonen, die das Atom pro Sekunde treffen müssen, damit es unter dem Einfluss der Schwerkraft nicht fällt (unter idealisierten Bedingungen im Vakuum). Wie groß ist die zugehörige optische Leistung? (d) Wie viele Photonen pro Sekunde wären erforderlich, um das Atom in der Schwebe zu halten, wenn es ideal reflektierend wäre? Aufgabe 13-6: Ein einzelnes Photon in einem Fabry-Pérot-Resonator
Betrachten Sie einen Fabry-Pérot-Resonator der Länge d = 1 cm, der aus einem nicht absorbierenden Material mit dem Brechungsindex 𝑛 = 1.5 und ideal reflektierenden Spiegeln besteht. Nehmen Sie an, dass genau ein Photon in der durch die stehende Welle sin(105 π𝑥∕d ) beschriebenen Mode vorhanden ist. (a) Bestimmen Sie die Wellenlänge und Energie des Photons (in eV). (b) Schätzen Sie die Unsicherheit in Ort und Impuls (Betrag und Richtung) des Photons ab. Vergleichen Sie Ihr Ergebnis mit dem aus der Beziehung 𝜎𝑥 𝜎𝑝 = ℏ∕2 erhaltenen Wert. Aufgabe 13-7: Einzelphotonen-Schwebung (zeitliche Interferenz)
Betrachten Sie einen Detektor, der von einer polychromatischen ebenen Welle beleuchtet wird, die aus zwei monochromatischen Wellen besteht, die sich in derselben Richtung ausbreiten und überlagert werden. Die komplexen Wellenfunktionen der konstituierenden Wellen seien √ √ 𝑈1 (𝑡) = 𝐼1 exp(i2π𝜈1 𝑡) und 𝑈2 (𝑡) = 𝐼2 exp(i2π𝜈2 𝑡) mit den Frequenzen 𝜈1 und 𝜈2 und den Intensitäten 𝐼1 bzw. 𝐼2 . Nach der Wellenoptik (siehe Abschnitt 2.6.2) ist √ die Intensität dieser Welle 𝐼(𝑡) = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos[2π(𝜈2 − 𝜈1 )𝑡]. Nehmen Sie an, dass die beiden konstituierenden ebenen Wellen dieselben Intensitäten (𝐼1 = 𝐼2 ) besitzen und dass die Welle so schwach ist, dass in dem Zeitintervall T = 1∕|𝜈2 − 𝜈1 | nur ein einziges polychromatisches Photon den Detektor erreicht. (a) Tragen Sie die Wahrscheinlichkeitsdichte 𝑝(𝑡)
auf, dass die Detektionszeit des Photons im Intervall 0 ≤ 𝑡 ≤ 1∕|𝜈2 − 𝜈1 | liegt. Zu welchem Zeitpunkt während T ist die Wahrscheinlichkeitsdichte, das Photon nachzuweisen, gleich null? (b) Wenn man nachweisen möchte, aus welcher der beiden konstituierenden Wellen das Photon kommt, muss man eine Energiemessung mit einer Präzision besser als 𝜎E < ℎ|𝜈2 − 𝜈1 | vornehmen. Verwenden Sie die Unbestimmtheitsrelation zwischen Zeit und Energie, um zu zeigen, dass die für eine solche Messung erforderliche Zeit in der Größenordnung der Periode der Schwebungsfrequenz der Photonen liegt. Der Messprozess an sich verwischt daher die Interferenz und verhindert so ihre Beobachtung. Aufgabe 13-8: Impulsaustausch von Photonen an einem Strahlteiler
Betrachten Sie ein einzelnes Photon, das in einer durch eine ebene Welle beschriebenen Mode auf einen verlustfreien Strahlteiler trifft. Wie ist der Impulsvektor des Photons, bevor es auf den Spiegel aufschlägt? Wie sind die möglichen Werte seines Impulsvektors nach dem Durchgang durch den Strahlteiler und wie groß sind die Wahrscheinlichkeiten, diese Werte zu beobachten? Aufgabe 13-9: Photonenfluss
Zeigen Sie, dass die Leistung eines monochromatischen optischen Strahls, der im Mittel ein Photon pro optische Periode enthält, umgekehrt proportional zum Quadrat der Wellenlänge ist. Aufgabe 13-10: Die Poissonverteilung
Verifizieren Sie, dass die durch Gl. (13.35) gegebene Poissonverteilung auf eins normiert ist und den Mittelwert n und die Varianz 𝜎n2 = n besitzt. Aufgabe 13-11: Die Photonenstatistik eines kohärenten Gaußstrahls
Nehmen Sie an, dass ein He-Ne-Einmodenlaser mit einer Leistung von 100 pW Licht der Wellenlänge 633 nm in einem TEM0,0 -Gaußstrahl emittiert (siehe Kapitel 3). (a) Wie groß ist die mittlere Zahl von Photonen, die in der Zeit T = 100 ns durch einen Kreis mit einem Radius gleich dem Taillenradius 𝑊0 des Strahls hindurchtreten? (b) Wie groß ist die quadratisch gemittelte Zahl der Photonen aus (a)? (c) Wie groß ist die Wahrscheinlichkeit, dass in (a) keine Photonen detektiert werden?
Aufgaben
Aufgabe 13-12: Die Bose-Einstein-Verteilung
(a) Verifizieren Sie, dass die in Gl. (13.43) angegebene Bose-Einstein-Verteilung normiert ist und den Mittelwert n und die Varianz 𝜎n2 = n + n2 besitzt. (b) Wie groß ist die Wahrscheinlichkeit, dass in einem Zeitintervall von 20 ns keine Photonen nachgewiesen werden, wenn ein Strahl von Photonen mit einer Bose-Einstein-Statistik im Mittel 𝛷 = 1 Photonen pro Nanosekunde enthält? Aufgabe 13-13: Die negative Binomialverteilung
In der Literatur der Wahrscheinlichkeitstheorie ist bekannt, dass die Summe von ℳ identisch verteilten stochastischen Variablen, von denen jede einer geometrischen (Bose-Einstein-) Verteilung gehorcht, eine negative Binomialverteilung besitzt: 𝑝(n) =
(n + ℳ − 1)
(n∕ℳ)n
n
(1 + n∕ℳ)n+ℳ
Aufgabe 13-14: Photonenstatistik für thermisches Vielmodenlicht in einem Hohlraum
Betrachten Sie ℳ Moden thermischer Strahlung, deren Frequenzen so eng beisammen liegen, dass man ihre Besetzungszahlen jeweils durch eine Bose-Einstein-Verteilung mit einer gemeinsamen mittleren Photonenzahl 1∕[exp(ℎ𝜈∕k 𝑇) − 1] beschreiben kann. Zeigen Sie, dass die Varianz der Gesamtzahl n von Photonen mit ihrem Mittelwert durch n2
ℳ
zusammenhängt; das bedeutet, dass thermisches Vielmodenlicht eine geringere Varianz besitzt als thermisches Einmodenlicht. Das Vorhandensein vieler Moden ermöglicht eine Mittelung, die das Rauschen des Lichts vermindert. Aufgabe 13-15: Photonenstatistik eines Strahls aus thermischem Vielmodenlicht
Eine thermische Vielmoden-Lichtquelle mit ℳ identischen Moden, jeweils mit einer exponentiell verteilten (stochastischen) integrierten Rate, besitzt eine GesamtWahrscheinlichkeitsdichte 𝑝(w) gemäß einer Gammaverteilung 𝑝(w) =
ℳ
Aufgabe 13-16: Mittelwert und Varianz der doppeltstochastischen Poissonverteilung
Beweisen Sie die Gln. (13.50) und (13.51). Aufgabe 13-17: Zufällige Aufteilung von kohärentem Licht
(a) Benutzen Sie Gl. (13.56), um zu zeigen, dass die Verteilung der Photonenzahl von zufällig aufgeteiltem kohärenten Licht ihre Poissonform behält. (b) Zeigen Sie explizit, dass die mittlere Photonenzahl von Licht, das an einem verlustfreien Strahlteiler reflektiert wurde, gleich (1 − 𝒯)n ist. (c) Beweisen Sie Gl. (13.57) für kohärentes Licht.
.
Verifizieren Sie, dass sich die negative Binomialverteilung für ℳ = 1 auf die Bose-Einstein-Verteilung und für ℳ → ∞ auf die Poissonverteilung reduziert.
𝜎n2 = n +
die Form der in Aufgabe 13-13 definierten negativen Binomialverteilung annimmt.
1 ℳw ℳ ) wℳ−1 exp (− ), ( ⟨w⟩ (ℳ − 1)! ⟨w⟩
w ≥ 0.
Verwenden Sie die Mandelgleichung (13.49), um zu zeigen, dass die resultierende Verteilung der Photonenzahl
Aufgabe 13-18: Zufällige Aufteilung von thermischem Einmodenlicht
(a) Verwenden Sie Gl. (13.56), um zu zeigen, dass die Verteilung der Photonenzahl von zufällig aufgeteiltem thermischen Einmodenlicht ihre Bose-Einstein-Form behält. (b) Zeigen Sie explizit, dass die mittlere Photonenzahl für das an einem verlustfreien Strahlteiler reflektierte Licht (1 − 𝒯) n ist. (c) Beweisen Sie Gl. (13.58) für thermisches Einmodenlicht. Aufgabe 13-19: Das exponentielle Abklingen der mittleren Photonenzahl in einem Absorber
(a) Betrachten Sie ein absorbierendes Material mit der Dicke d und dem Absorptionskoeffizienten 𝛼 (in cm−1 ). Formulieren Sie eine Differentialgleichung für die mittlere Zahl n(𝑥) von Photonen am Ort 𝑥, wobei 𝑥 die Tiefe im Material ist (0 ≤ 𝑥 ≤ d ), wenn die mittlere Zahl von Photonen, die in das Material eintritt, n0 ist. (b) Lösen Sie die Differentialgleichung. Begründen Sie, warum Ihr Ergebnis das aus der elektromagnetischen Optik erhaltene Gesetz des exponentiellen Abklingens (Abschnitt 5.5.1) ist. (c) Geben Sie einen Ausdruck für die Verteilung 𝑝(n) der Photonenzahl an einem beliebigen Ort 𝑥 im Absorber an, wenn er mit kohärentem Licht beleuchtet wird. (d) Wie groß ist die Wahrscheinlichkeit, dass ein einzelnes auf den Absorber einfallendes Photon durch ihn transmittiert wird?
405
406
13 Photonenoptik
Aufgabe 13-20: Statistik der binomischen Verteilung der Photonenzahl
Weiterführende Literatur
Die binomische Wahrscheinlichkeitsverteilung ist
Quantenoptik
𝑝(n) =
M! 𝑝n (1 − 𝑝)M−n . (M − n)! n!
Sie beschreibt die Nachweisstatistik für bestimmte photonenzahlgequetschte Lichtquellen. 5) (a) Beschreiben Sie einen möglichen Mechanismus, um Licht aus dem Zahlzustand in Licht umzuwandeln, das durch die binomische Photonenstatistik beschrieben wird. (b) Beweisen Sie, dass die binomische Wahrscheinlichkeitsverteilung auf eins normiert ist. (c) Bestimmen Sie den Mittelwert n und die Varianz 𝜎n2 der binomischen Wahrscheinlichkeitsverteilung als Funktion ihrer beiden Parameter 𝑝 und M. (d) Geben Sie einen Ausdruck für das Signal/Rausch-Verhältnis als Funktion von n und 𝑝 an. Berechnen Sie die Werte für die Grenzfälle 𝑝 → 0 und 𝑝 → 1. Welchen Arten von Licht entsprechen diese beiden Grenzfälle? Aufgabe 13-21: Rauschen der homogenen Photonenzahlverteilung
Betrachten Sie eine hypothetische Lichtquelle, die einen Photonenstrom mit einer diskret-gleichverteilten Photonenzahl erzeugt, ⎧
1 für 0 ≤ n ≤ 2n 𝑝(n) = 2n + 1 ⎨ 0 ansonsten . ⎩ (a) Verifizieren Sie, dass die Verteilung auf eins normiert ist und den Mittelwert n besitzt. Berechnen Sie die Varianz 𝜎n2 der Photonenzahl und das Signal/Rausch-Verhältnis (SRV) und vergleichen Sie sie mit denjenigen der Bose-Einstein- und Poissonverteilung mit demselben Mittelwert. (b) Ist diese Quelle für n < 2 rauschärmer oder verrauschter (anhand des SRV beurteilt) als ein idealer Einmodenlaser? Was ist für n = 2? Was für n > 2? (c) Um welchen Faktor ist das SRV für dieses Licht größer ist als das von thermischem Einmodenlicht? (d) Schlagen Sie einen Mechanismus vor, mit dem man Licht mit einer derartigen Photonenzahlverteilung erzeugen könnte. Nützliche Gleichungen: 𝑗(𝑗 + 1) , 2 𝑗(𝑗 + 1)(2𝑗 + 1) 12 + 22 + 32 + ⋯ + 𝑗 2 = . 6 1+2+3+⋯+𝑗 =
5) Siehe D. Stoler, B. E. A. Saleh, M. C. Teich, ‚Binomial States of the Quantized Radiation Field‘, Optica Acta (Journal of Modern Optics) 32, 345–355, 1985.
Z.-Y. J. Ou, Quantum Optics for Experimentalists, World Scientific 2017. M. Orszag, Quantum Optics: Including Noise Reduction, Trapped Ions, Quantum Trajectories, Decoherence, Springer, 3. Aufl. 2016. C. W. Gardiner, P. Zoller, The Quantum World of Ultra-Cold Atoms and Light. Book I: Foundations of Quantum Optics, Imperial College Press 2014. G. S. Agarwal, Quantum Optics, Cambridge University Press 2012. G. Grynberg, A. Aspect, C. Fabre, Introduction to Quantum Optics: From the Semi-Classical Approach to Quantized Light, Cambridge University Press 2010. U. Leonhardt, Essential Quantum Optics: From Quantum Measurements to Black Holes, Cambridge University Press 2010. D. F. Walls, G. J. Milburn, Quantum Optics, Springer, 2. Aufl. 2008. J. C. Garrison, R. Y. Chiao, Quantum Optics, Oxford University Press 2008. P. Meystre, M. Sargent III, Elements of Quantum Optics, Springer, 4. Aufl. 2007. M. Fox, Quantum Optics: An Introduction, Oxford University Press 2006. W. Vogel, D.-G. Welsch, Quantum Optics, Wiley-VCH, 3. Aufl. 2006. C. C. Gerry, P. L. Knight, Introductory Quantum Optics, Cambridge University Press 2005. H.-A. Bachor, T. C. Ralph, A Guide to Experiments in Quantum Optics, Wiley-VCH, 2. Aufl. 2004. W P. Schleich, Quantum Optics in Phase Space, Wiley-VCH 2001. R. Loudon, The Quantum Theory of Light, Oxford University Press, 3. Aufl. 2000. V Peřinová, A. Lukš, J. Peřina, Phase in Optics, World Scientific 1998. M. O. Scully, M. S. Zubairy, Quantum Optics, Cambridge University Press, Paperback 1997. G. S. Agarwal (Hrsg.), Selected Papers on Fundamentals of Quantum Optics, SPIE Optical Engineering Press 1995 (Milestone Series Bd. 103). R. P. Feynman, QED: The Strange Theory of Light and Matter (mit einer Einführung von A. Zee), Princeton University Press 1985, Nachdruck 2014. S. Weinberg, ‚Light as a Fundamental Particle‘, Physics Today 28(6), 32–37, 1975. J. R. Klauder, E. C. G. Sudarshan, Fundamentals of Quantum Optics, Benjamin 1968; Dover, Nachdruck 2006.
Aufgaben
Kohärenz, Quantenfluktuationen, Antibunching und Photonenstatikstik
B. R. Masters, ‚Satyendra Nath Bose and Bose-Einstein Statistics‘, Optics & Photonics News 24(4), 40–47, 2013. H. J. Carmichael, Statistical Methods in Quantum Optics 2: Non-Classical Fields, Springer 2010. R. J. Glauber, Quantum Theory of Optical Coherence: Selected Papers and Lectures, Wiley-VCH 2007. R. J. Glauber, ‚Nobel Lecture: One Hundred Years of Light Quanta‘, Reviews of Modern Physics 78, 1267–1278, 2006. Z. Ficek, S. Swain, Quantum Interference and Coherence: Theory and Experiments, Springer 2005. J. Peřina (Hrsg.), Coherence and Statistics of Photons and Atoms, Wiley 2001. H. J. Carmichael, Statistical Methods in Quantum Optics 1: Master Equations and Fokker-Planck Equations, Springer 1999. L. Mandel, E. Wolf, Optical Coherence and Quantum Optics, Cambridge University Press 1995. L. Mandel, E. Wolf (Hrsg.), Selected Papers on Coherence and Fluctuations of Light (1850–1966), SPIE Optical Engineering Press 1990 (Milestone Series Bd. 19). R. A. Campos, B. E. A. Saleh, M. C. Teich, ‚QuantumMechanical Lossless Beam Splitter: SU(2) Symmetry and Photon Statistics‘, Physical Review A 40, 1371–1384, 1989. E. R. Pike, H. Walther (Hrsg.), Photons and Quantum Fluctuations, CRC Press 1988. M. C. Teich, B. E. A. Saleh, ‚Photon Bunching and Antibunching‘. In E. Wolf (Hrsg.), Progress in Optics, NorthHolland 1988, S. 1–104. J. Peřina, Coherence of Light, Reidel, 2. Aufl. 1985. E. Wolf, ‚Einstein’s Researches on the Nature of Light‘, Optics News 5(1), 24–39, 1979. B. E. A. Saleh, Photoelectron Statistics, Springer 1978. H. I. Kimble, M. Dagenais, L. Mandel, Photon Antibunching in Resonance Fluorescence, Physical Review Letters 39, 691–695, 1977. W H. Louisell, Quantum Statistical Properties of Radiation, Wiley 1973; Wiley-VCH, Nachdruck 1990. L. Mandel, E. Wolf (Hrsg.), Selected Papers on Coherence and Fluctuations of Light, Bd. 1 & 2, Dover 1970. L. Mandel, ‚Fluctuations of Light Beams‘. In E. Wolf (Hrsg.), Progress in Optics, North-Holland 1963, Bd. 2, S. 181–248. S. N. Bose, ‚Plancks Gesetz und Lichtquantenhypothese‘, Zeitschrift für Physik 26, 178–181, 1924. Quadraturgequetschtes und photonenzahlgequetschtes Licht
X. He, N. F. Hartmann, X. Ma, Y. Kim, R. Ihly, J. L. Blackburn, W. Gao, J. Kono, Y. Yomogida, A. Hirano, T. Tanaka, H. Kataura, H. Htoon, S. K. Doom, ‚Tunable Room-Temperature Single-Photon Emission at Telecom Wavelengths from sp3 Defects in Carbon Nanotubes‘, Nature Photonics 11, 577–582, 2017.
H. Vahlbruch, M. Mehmet, K. Danzmann, R. Schnabel, ‚Detection of 15 dB Squeezed States of Light and their Application for the Absolute Calibration of Photoelectric Quantum Efficiency‘, Physical Review Letters 117, 110801, 2016. J. Aasi et al. (LIGO Scientific Collaboration), ‚Enhanced Sensitivity of the LIGO Gravitational Wave Detector by Using Squeezed States of Light‘, Nature Photonics 7, 613–619, 2013. H. J. Carmichael, Statistical Methods in Quantum Optics 2: Non-Classical Fields, Springer 2010. M. C. Teich, B. E. A. Saleh, ‚Squeezed and Antibunched Light‘, Physics Today 43(6), 26–34, 1990. Erratum: 43(11), 123–124, 1990. M. C. Teich, B. E. A. Saleh, ‚Squeezed States of Light‘, Quantum Optics: Journal of the European Physical Society B 1, 153–191, 1989. R. E. Slusher, L. W Hollberg, B. Yurke, J. C. Mertz, J. F. Valley, ‚Observation of Squeezed States Generated by Four-Wave Mixing in an Optical Cavity‘, Physical Review Letters 55, 2409–2412, 1985. M. C. Teich, B. E. A. Saleh, ‚Observation of Sub-Poisson Franck-Hertz Light at 253.7 nm‘, Journal of the Optical Society of America B 2, 275–282, 1985. D. Stoler, B. E. A. Saleh, M. C. Teich, ‚Binomial States of the Quantized Radiation Field‘, Optica Acta (Journal of Modern Optics) 32, 345–355, 1985. R. Short, L. Mandel, ‚Observation of Sub-Poissonian Photon Statistics‘, Physical Review Letters 51, 384–387, 1983. C. M. Caves, ‚Quantum-Mechanical Noise in an Interferometer‘, Physical Review D 23, 1693–1708, 1981. Verschränkte Photonen und Zweiphotonenlicht
J. Wang, S. Paesani, Y. Ding, R. Santagati, P. Skrzypczyk, A. Salavrakos, J. Tura, R. Augusiak, L. Mančinska, D. Bacco, D. Bonneau, J. W. Silverstone, Q. Gong, A. Acín, K. Rottwitt, L. K. Oxenløwe, J. L. O’Brien, A. Laing, M. G. Thompson, ‚Multidimensional Quantum Entanglement With Large-Scale Integrated Optics‘, Science 360, 285– 291, 2018. M. A. Finger, T. Sh. Iskhakov, N. Y. My, M. V. Chekhova, P. St. J. Russell, ‚Raman-Free, Noble-Gas-Filled PhotonicCrystal Fiber Source for Ultrafast, Very Bright TwinBeam Squeezed Vacuum‘, Physical Review Letters 115, 143602, 2015. D. Kang, M. Kim, H. He, A. S. Helmy, ‚Two PolarizationEntangled Sources from the Same Semiconductor Chip‘, Physical Review A 92, 013821, 2015. F. Boitier, A. Orieux, C. Autebert, A. Lemaitre, E. Galopin, C. Manquest, C. Sirtori, I. Favero, G. Leo, S. Ducci, ‚Electrically Injected Photon-Pair Source at Room Temperature‘, Physical Review Letters 112, 183901, 2014.
407
408
13 Photonenoptik
M. F. Saleh, G. Di Giuseppe, B. E. A. Saleh, M. C. Teich, ‚Photonic Circuits for Generating Modal, Spectral, and Polarization Entanglement‘, IEEE Photonics Journal 2, 736–752, 2010. M. B. Nasr, S. Carrasco, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, J. P. Torres, L. Tomer, D. S. Hum, M. M. Fejer, ‚Ultrabroadband Biphotons Generated via Chirped Quasi-Phase-Matched Optical Parametric DownConversion‘, Physical Review Letters 100, 183601, 2008. J. Audretsch, Entangled Systems, Wiley-VCH 2007. J. S. Bell, Speakable and Unspeakable in Quantum Mechanics (mit einer Einführung von A. Aspect), Cambridge University Press, 2. Aufl. 2004. B. E. A. Saleh, A. F. Abouraddy, A. V. Sergienko, M. C. Teich, ‚Duality Between Partial Coherence and Partial Entanglement‘, Physical Review A 62, 043816, 2000. D. N. Klyshko, Photons and Nonlinear Optics, Nauka (Moskau) 1980. [Englische Übersetzung: Gordon and Breach, New York 1988.] A. Aspect, P. Grangier, G. Roger, ‚Experimental Tests of Realistic Local Theories via Bell’s Theorem‘, Physical Review Letters 47, 460–463, 1981. D. C. Burnham, D. L. Weinberg, ‚Observation of Simultaneity in Parametric Production of Optical Photon Pairs‘, Physical Review Letters 25, 84–87, 1970. D. Magde, H. Mahr, ‚Study in Ammonium Dihydrogen Phosphate of Spontaneous Parametric Interaction Tunable from 4400 to 16 000 Å‘, Physical Review Letters 18, 905–907, 1967. S. E. Harris, M. K. Oshman, R. L. Byer, ‚Observation of Tunable Optical Parametric Fluorescence‘, Physical Review Letters 18, 732–734, 1967. A. Einstein, B. Podolsky, N. Rosen, ‚Can Quantum-Mechanical Description of Physical Reality Be Considered Complete¿, Physical Review 47, 777–780, 1935. E. Schrödinger, ‚Die gegenwärtige Situation in der Quantenmechanik‘, Die Naturwissenschaften 23, 807–812, 823–828, 844–839; 1935. Quantenbildgebung, Quantenmesstechnik, Quantenlithographie und Quantenspektropskopie
D. S. Simon, G. Jaeger, A. V. Sergienko, Quantum Metrology, Imaging, Communication, Springer 2017. M. A. Taylor, J. Janousek, V. Daria, J. Knittel, B. Hage, H.-A. Bachor, W. P. Bowen, ‚Subdiffraction-Limited Quantum Imaging within a Living Cell‘, Physical Review X 4, 011017, 2014. T. Ono, R. Okamoto, S. Takeuchi, ‚An Entanglement-Enhanced Microscope‘, Nature Communications 4, 2426, 2013; doi: 10.1038/ncomms3426. M. C. Teich, B. E. A. Saleh, F. N. C. Wong, J. H. Shapiro, ‚Variations on the Theme of Quantum Optical Coherence Tomography: A Review‘, Quantum Information Processing 11, 903–923, 2012.
M. B. Nasr, D. P. Goode, N. Nguyen, G. Rong, L. Yang, B. M. Reinhard, B. E. A. Saleh, M. C. Teich, ‚Quantum Optical Coherence Tomography of a Biological Sample‘, Optics Communications 282, 1154–1159, 2009. M. B. Nasr, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, ‚Demonstration of Dispersion-Cancelled Quantum-Optical Coherence Tomography‘, Physical Review Letters 91, 083601, 2003. A. F. Abouraddy, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, ‚Entangled-Photon Fourier Optics‘, Journal of the Optical Society of America B 19, 1174–1184, 2002. A. F. Abouraddy, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, ‚Role of Entanglement in Two-Photon Imaging‘, Physical Review Letters 87, 123602, 2001. A. F. Abouraddy, B. E. A. Saleh, A. V. Sergienko, M. C. Teich, ‚Quantum Holography‘, Optics Express 9, 498–505, 2001. A. N. Boto, P. Kok, D. S. Abrams, S. L. Braunstein, C. P. Williams, J. P. Dowling, ‚Quantum Interferometric Optical Lithography: Exploiting Entanglement to Beat the Diffraction Limit‘, Physical Review Letters 85, 2733–2736, 2000. B. E. A. Saleh, B. M. Jost, H.-B. Fei, M. C. Teich, ‚Entangled-Photon Virtual-State Spectroscopy‘, Physical Review Letters 80, 3483–3486, 1998. M. C. Teich, B. E. A. Saleh, ‚Entangled-Photon Microscopy, Spectroscopy, and Display‘, U.S. Patent 5 796 477, 18. August 1998. Quanteninformationsverarbeitung, Quantenkommunikation, Quantencomputer und Quantenkryptographie
I. Khan, B. Heim, A. Neuzner, C. Marquardt, ‚SatelliteBased QKD‘, Optics & Photonics News 29(2), 26–33, 2018. M. M. Wilde, Quantum Information Theory, Cambridge University Press, 2. Aufl. 2017. J. Yin et al., ‚Satellite-Based Entanglement Distribution Over 1200 Kilometers‘, Science 356, 1140–1144, 2017. M. Hayashi, S. Ishizaka, A. Kawachi, G. Kimura, T. Ogawa, Introduction to Quantum Information Science, Springer 2015. J. Carolan, C. Harrold, C. Sparrow, E. Martín-López, N. J. Russell, J. W. Silverstone, P. J. Shadbolt, N. Matsuda, M. Oguma, M. Itoh, G. D. Marshall, M. G. Thompson, J. C. F. Matthews, T. Hashimoto, J. L. O’Brien, A. Laing, ‚Universal Linear Optics‘, Science 349, 711–716, 2015. I. A. Walmsley, ‚Quantum Optics: Science and Technology in a New Light‘, Science 348, 525–530, 2015. J. A. Bergou, M. Hillery, Introduction to the Theory of Quantum Information Processing, Springer 2013. J. A. Jones, D. Jaksch, Quantum Information, Computation and Communication, Cambridge University Press 2012. R. T. Perry, Quantum Computing from the Ground Up, World Scientific 2012. A. Zeilinger, Dance of the Photons: From Einstein to Quantum Teleportation, Farrar, Straus & Giroux 2010.
Aufgaben
S. M. Barnett, Quantum Information, Oxford University Press 2009. G. Jaeger, Entanglement, Information, and the Interpretation of Quantum Mechanics, Springer 2009. J. L. O’Brien, A. Furusawa, J. Vučković, ‚Photonic Quantum Technologies‘, Nature Photonics 3, 687–695, 2009. H. Paul, Introduction to Quantum Optics: From Light Quanta to Quantum Teleportation, Cambridge University Press 2004. M. A. Nielsen, I. L. Chuang, Quantum Computation and Quantum Information, Cambridge University Press 2002.
409
411
Teil II Photonik
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
413
14 Licht und Materie Licht wechselwirkt mit Materie, weil Materie elektrische Ladungen enthält. Das zeitlich variierende elektrische Feld des Lichts übt Kräfte auf die elektrischen Ladungen und Dipole in Atomen, Molekülen und Festkörpern aus und veranlasst sie zu schwingen. Ein Photon kann mit einem Atom oder Ion wechselwirken, wenn seine Energie der Energiedifferenz zwischen zwei Energieniveaus des Atoms entspricht. Die erlaubten Energieniveaus von Atomen, Molekülen und Festkörpern sind durch die Regeln der Quantenmechanik festgelegt. Wenn das Atom sich zu Beginn im tieferen Energieniveau befindet, kann das Photon seine Energie auf das Atom übertragen und es dadurch in das höhere Niveau anregen; man sagt dann, das Photon sei absorbiert (oder vernichtet) worden. Falls das Atom zu Beginn im höheren Energieniveau vorliegt, kann das Photon das Atom dazu bringen, einen Übergang in das tiefergelegene Niveau durchzuführen, was zur Emission (oder Erzeugung) eines zweiten Photons führt, dessen Energie gleich dem Unterschied zwischen den atomaren Energieniveaus ist. Unter geeigneten Umständen kann induzierte Emission zur Erzeugung von Laserlicht führen. Thermische Anregung bewirkt, dass die Atome der Materie andauernd Übergänge zwischen ihren erlaubten Energieniveaus erfahren, die mit der Absorption oder Emission von Photonen verbunden sind. Sogenannte schwarze Strahler im thermischen Gleichgewicht erzeugen im stationären Zustand thermisches Licht. Alle schwarzen Strahler, deren Temperatur über dem absoluten Nullpunkt liegt, strahlen thermisches Licht aus, dessen Frequenzverteilung als Spektrum des schwarzen Strahlers bekannt ist. Wenn die Temperatur des Gegenstands zunimmt, werden zunehmend höhere atomare Energieniveaus bevölkert, was dazu führt, dass das Maximum des Spektrums des schwarzen Strahlers zu höheren Frequenzen (kleineren Wellenlängen) verschoben wird. Emission von Photonen kann auch durch andere äußere Energiequellen als thermische Anregung hervorgerufen werden. Die Wechselwirkung mit ultraviolet-
ter Strahlung, Schallwellen, elektrischem Strom oder chemischen Reaktionen kann Atome veranlassen, Licht auszustrahlen; man spricht in diesen Fällen von Lumineszenz. Ganz andere Prozesse, die eine Emission von Licht bewirken, sind z. B. geladene Teilchen, die sich in einem Medium schneller als das Licht ausbreiten und dabei die sogenannte Tscherenkowstrahlung aussenden, oder das Abbremsen von geladenen Teilchen beim Auftreffen auf Materie (Bremsstrahlung).
In diesem Kapitel . . . Der Zweck dieses Kapitels ist, die Gesetze einzuführen, die für die Erzeugung von Laserstrahlung, Wärmestrahlung und Lumineszenz verantwortlich sind. Das Kapitel beginnt mit einem kurzen Rückblick auf die Energieniveaus in verschiedenen Arten von Materie (Abschnitt 14.1) und der Besetzung dieser Energieniveaus (Abschnitt 14.2). In Abschnitt 14.3 besprechen wir die Absorption und Emission von Photonen durch ein Atom; die hier beschriebenen Ergebnisse sind die Grundlage der in den Kapiteln 15 und 16 beschriebenen Laserverstärker und -oszillatoren. Die Wechselwirkung von vielen Photonen mit vielen Atomen im stationären Zustand und thermischen Gleichgewicht wird in Abschnitt 14.4 betrachtet. Schließlich geben wir in Abschnitt 14.5 eine einfache Beschreibung der Lumineszenz und der Lichtstreuung.
14.1 Energieniveaus Die Atome einer Substanz können relativ isoliert vorliegen, wie z. B. in einem verdünnten Atomgas, oder sie können mit benachbarten Atomen wechselwirken und Moleküle, Flüssigkeiten oder Festkörper bilden. Die Bestandteile der Materie gehorchen den Gesetzen der Quantenmechanik.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
414
14 Licht und Materie
Das Verhalten eines einzelnen nichtrelativistischen Teilchens der Masse 𝑚 (z. B. eines Elektrons) in einem Potential V (r, 𝑡) wird durch eine komplexe Wellenfunktion 𝛹(r, 𝑡) bestimmt, die die Schrödingergleichung erfüllt, −
𝜕𝛹(r, 𝑡) ℏ2 2 ∇ 𝛹(r, 𝑡) + V (r, 𝑡)𝛹(r, 𝑡) = −iℏ . (14.1) 2𝑚 𝜕𝑡
Das Potential charakterisiert die Umgebung des Teilchens einschließlich eventueller Beiträge von äußeren optischen Feldern. Die partielle Differentialgleichung in Gl. (14.1) besitzt daher eine Vielzahl von Lösungen, die von der Form von V (r, 𝑡) abhängen. Aus vielen Teilchen zusammengesetzte Systeme wie z. B. Atome, Moleküle, Flüssigkeiten oder Festkörper gehorchen einer komplizierteren Version dieser Gleichung, in der das Potential Terme enthält, die die Wechselwirkungen zwischen den Teilchen berücksichtigen. Gleichung (14.1) ähnelt mathematisch der paraxialen Helmholtzgleichung (2.27) der Wellenoptik und der Gleichung (23.23) der langsam variierenden Einhüllenden aus der ultraschnellen Optik. Das bornsche Postulat der Quantenmechanik besagt, dass die Wahrscheinlichkeit, das Teilchen in dem Zeitintervall zwischen 𝑡 und 𝑡 + d𝑡 in einem infinitesimalen Volumen d𝑉 am Ort r anzutreffen, gleich 𝑝(r, 𝑡) d𝑉 d𝑡 = |𝛹(r, 𝑡)|2 d𝑉 d𝑡
(14.2)
ist. Gleichung (14.2) ähnelt Gl. (13.15) für die Wahrscheinlichkeit, ein Photon in einer infinitesimalen Fläche und Zeit zu finden. Wenn das Potential zeitlich konstant ist, können die erlaubten Energieniveaus E des Teilchens durch Separation der Variablen bestimmt werden. Das führt zu einer Lösung von Gl. (14.1) der Form 𝛹(r, 𝑡) = 𝜓(r) exp[i(E ∕ℏ)𝑡], wobei 𝜓(r) die zeitunabhängige Schrödingergleichung erfüllt, ℏ 2 (14.3) ∇ 𝜓(r) + V (r)𝜓(r) = E 𝜓(r) . 2𝑚 Gleichung (14.3) ähnelt der Helmholtzgleichung (2.11); sie kann als Eigenwertproblem aufgefasst werden, dessen Eigenwerte die erlaubten Werte der Energie E und dessen Eigenvektoren 𝜓(r) die Eigenfunktionen sind (siehe Anhang C). Für Vielteilchensysteme gilt eine verallgemeinerte Form von Gl. (14.3). Die Lösungen liefern die erlaubten Werte E der Energie des Systems. Diese Werte können diskret (wie für ein Atom) oder kontinuierlich (wie in einem freien Teilchen) sein oder aus Sätzen dicht gepackter diskreter Niveaus (wie in einem Halbleiter) bestehen, die Bänder genannt werden. Thermische Anregung oder ein äußeres Feld wie z. B. Licht, das auf das −
2
Material scheint, kann bewirken, dass das System sich von einem seiner Energieniveaus in ein anderes begibt. Auf diese Weise tauscht das System mit der Außenwelt Energie aus. In den folgenden Abschnitten beschreiben wir typische Energieniveaustrukturen von ausgewählten Atomen, Molekülen und Festkörpern.
14.1.1
Atome
Atomare Energieniveaus beruhen auf den potentiellen Energien der Elektronen in Gegenwart des Atomkerns und der anderen Elektronen sowie Kräften, die mit den Bahn- und Spindrehimpulsen zusammenhängen, die aber gewöhnlich viel schwächer sind als Wechselwirkungen, an denen Ladungen beteiligt sind. Viele Atome und Ionen (z. B. Ne, Cu oder Cd) werden als aktive Lasermedien verwendet (siehe Abschnitt 16.3). Wasserstoff Energieniveaus
Die Energieniveaus eines wasserstoffähnlichen Atoms, das aus einem Kern der Ladung +𝑍𝑒 und einem einzelnen Elektron der Ladung −𝑒 und der Masse 𝑚 besteht, wobei 𝑍 die Kernladungszahl ist, können bestimmt werden, indem man das Coulombpotential V (𝑟) = −𝑍𝑒 2 ∕𝑟 in die zeitunabhängige Schrödingergleichung (14.3) einsetzt. Da V (𝑟) nur eine Funktion der radialen Koordinate ist, lässt sich die partielle Differentialgleichung durch Separation der Variablen in drei gewöhnliche Differentialgleichungen aufspalten, wenn man den Laplaceoperator in Kugelkoordinaten formuliert. Das ermöglicht uns, das Eigenwertproblem zu lösen. Die Eigenwerte bestehen aus unendlich vielen diskreten Energieniveaus En = −
Mr 𝑍 2 𝑒4
1 , (4π𝜀0 )2 2ℏ2 n2
n = 1, 2, 3, … ,
(14.4)
wobei die reduzierte Masse Mr des Atoms anstelle der Elektronenmasse 𝑚 eingesetzt wurde, um die endliche Masse des Kerns zu berücksichtigen. Die Energieniveaus in Gl. (14.4), die durch eine einzige Quantenzahl n, die Hauptquantenzahl, charakterisiert werden, sind in Abb. 14.1 für H und C5+ gezeigt. Bohrsches Atommodell
Im Kontext des bohrschen Atommodells (sogenannte alte Quantentheorie) lassen sich die Energieniveaus aus Gl. (14.4) auch aus der Bedingung erhalten, dass die anziehende Coulombkraft zwischen Kern und Elektron gleich der Fliehkraft sein muss, die erforderlich ist, um das Elektron in einer Umlaufbahn zu halten, wobei man
14.1 Energieniveaus
C5+
H
12
4 3
Energie (Z = 1)
2
432 360
8
288
6
216
4
144
2
72
0
=1
Feinstruktur, Hyperfeinstruktur und relativistische Effekte
504
18.2-nm-Laser 10
eV
Energie (Z = 6)
14
8
eV
0
Abb. 14.1 Die Energieniveaus von Wasserstoff (Z = 1; linke Ordinate) und C5+ (wasserstoffähnliches Atom mit Z = 6; rechte Ordinate). In dieser Darstellung wurde die Nulllinie der Energie auf das Grundzustandsniveau (n = 1) gelegt, das für Wasserstoff etwa 13.6 eV und für C5+ etwa 489.8 eV unter der Ionisationsschwelle (n = ∞) liegt. Der Übergang n = 3 zu n = 2, der durch einen Pfeil markiert ist, entspricht dem C5+ -Laserübergang im extremen UV bei 18.2 nm, wie in Abschnitt 16.3.4 diskutiert wird.
gleichzeitig annimmt, dass der Bahndrehimpuls des Elektrons auf ganzzahlige Vielfache von ℏ beschränkt ist. Es zeigt sich, dass die Radien dieser bohrschen Bahnen 𝑟n = (4π𝜀0 ) n2 ℏ2 ∕𝑚𝑍𝑒 2 mit n = 1, 2, 3, … sind. Der Radius der Elektronenbahn im Wasserstoffatom mit dem kleinsten Bahndrehimpuls wird als bohrscher Radius 𝑎0 bezeichnet; 1 𝑎0 ≡ 𝑟{n=1,𝑍=1} ≈ 52.9 pm. Die zugehörige bohrsche Periode ist T 0 = 2π 𝑎02 𝑚0 ∕ℏ2 ≈ 150 ns. Quantenzahlen
Die Eigenfunktionen der Schrödingergleichung sind das Produkt dreier Funktionen, 𝜓n𝓁m (𝑟, 𝜃, 𝜙) = ℝn𝓁 (𝑟) 𝛩𝓁m (𝜃)𝛷m (𝜙), wobei n = 1, 2, 3, … die Hauptquantenzahl ist; 𝓁 = 0, 1, 2, … , n − 1 wird Azimutquantenzahl oder Nebenquantenzahl genannt; und m = 0, ±1, ±2, . . . , ±𝓁 heißt magnetische Quantenzahl. Die ℝn𝓁 (𝑟) bezeichnen assoziierte Laguerrefunktionen (die eng mit den verallgemeinerten Laguerrepolynomen verwandt sind, die in der Fußnote in Abschnitt 3.4 diskutiert wurden), die 𝛩𝓁m (𝜃) sind assoziierte Legendrefunktionen und die 𝛷m (𝜙) sind Phasenfunktionen. Diese Lösungen ähneln denjenigen des Mikrokugelresonators, der in Abschnitt 11.4.3 diskutiert wurde. Die Berücksichtigung des intrinsischen Spins des Elektrons erfordert eine zusätzliche Quantenzahl, die Spinquanten1 zahl s = ± . 2
Die elektromagnetische Wechselwirkung des mit dem Elektronenspin verknüpften magnetischen Moments mit dem magnetischen Moment aufgrund seines Bahndrehimpulses, die sogenannte Spin-Bahn-Wechselwirkung, bewirkt eine Aufspaltung der Energieniveaus in eng benachbarte aber verschiedene Komponenten, die Feinstruktur. Der Elektronenspin und der Bahndrehimpuls wechselwirken auch mit dem magnetischen Moment des Kerns, wodurch noch feinere Aufspaltungen entstehen, die sogenannte Hyperfeinstruktur. Es gibt noch weitere derartige Wechselwirkungen (z. B. die Spin-Spin-Kopplung), die aber in der Regel vernachlässigbar sind. All diese Effekte sorgen dafür, dass die Energieniveaus von Wasserstoff sich von den nach Gl. (14.4) berechneten unterscheiden, wenn auch nur geringfügig. Relativistische Korrekturen zu den Energieniveaus, die klein, aber messbar sind, können mithilfe der relativistisch invarianten Diracgleichung berücksichtigt werden. Diese Gleichung führt automatisch zum Begriff des Elektronspins sowie zur Existenz von Antiteilchen wie dem Positron. Mehrelektronenatome Schalen und Unterschalen
Mehrelektronenatome bestehen aus einem Kern der Ladung +𝑍𝑒 umgeben von 𝑍 Elektronen, jedes mit der Ladung −𝑒. Wenn die Kernladungszahl 𝑍 zunimmt, werden unter Minimierung der Gesamtenergie sukzessive immer weitere Einelektronenzustände besetzt, wobei das paulische Ausschlussprinzip beachtet werden muss, wonach keine zwei Elektronen (da sie Fermionen sind) denselben Satz von vier Quantenzahlen haben können. Die Zustände können nach der Reihenfolge ihrer Besetzung in Schalen gruppiert werden (die durch die Hauptquantenzahl n bezeichnet werden), von denen jede eine bestimmte Zahl von Elektronen aufnehmen kann. Innerhalb jeder Schale werden Unterschalen durch die Nebenquantenzahl 𝓁 bezeichnet, wobei 𝓁 gewöhnlich in der spektroskopischen Notation angegeben wird (die Buchstaben s, p, d, f, g, h, i entsprechen 𝓁 = 0, 1, 2, 3, 4, 5, 6). Die Elektronenkonfiguration n𝓁u bezeichnet die Einordnung von Elektronen in die Unterschalen; das hochgestellte u gibt die Zahl der Elektronen in der betreffenden Unterschale an. Beispielsweise ist die Konfiguration des Grundzustands von He (𝑍 = 2) gleich 1s2 ; die beiden Elektronen besetzen gerade die Schale n = 1 (mit 𝓁 = 0). Konfigurationen tiefliegender angeregter Zustände von He sind z. B. 1s 2s oder 1s 2p, in denen ein Elektron in die Schale n = 2 angeregt ist. Für Ne (𝑍 = 10) ist die Grundzustandskonfiguration
415
416
14 Licht und Materie
1s2 2s2 2p6 ; seine 10 Elektronen füllen gerade die Schalen n = 1 und n = 2. Energieniveaus
Die Energieniveaus von Mehrelektronenatomen können aus der Schrödingergleichung bestimmt werden, sofern relativistische Effekte vernachlässigt werden können (was für leichte Atome in der Regel der Fall ist). Wegen der unzähligen Coulombwechselwirkungen in einer Ansammlung vieler Elektronen wird die Schrödingergleichung über einen genäherten selbstkonsistenten Ansatz gelöst, der als Hartree- oder Hartree-FockVerfahren bekannt ist. Dabei wird angenommen, dass sich jedes Elektron unabhängig von den anderen in einem sphärisch symmetrischen resultierenden Potential V (𝑟) bewegt, das als Summe des sphärisch symmetrischen anziehenden Coulombpotentials des Kerns und eines sphärisch symmetrischen abstoßenden Potentials entsteht, das den mittleren Effekt der Coulombkräfte von allen anderen Elektronen beschreibt. Unter diesen Annahmen spaltet sich die 𝑍-Elektronen-Schrödingergleichung in 𝑍 Einelektronen-Schrödingergleichungen auf, die Gesamt-Eigenfunktion ist das Produkt der Eigenfunktionen der einzelnen Elektronen und die Gesamtenergie ist die Summe der Energien der einzelnen Elektronen. Schließlich kann zur Berücksichtigung von Abweichungen des abstoßenden Potentials von der Kugelsymmetrie und für Wechselwirkungen unter Beteiligung der Elektronspins die Störungstheorie herangezogen werden. Die resultierenden Eigenfunktionen der einzelnen Elektronen sind eng mit denjenigen des Wasserstoffatoms verwandt und werden in derselben Form geschrieben. Gleichungen in der Art von Gl. (14.4) existieren jedoch nur für spektroskopisch aktive Elektronen wie z. B. die Valenzelektronen in den Alkaliatomen. Elektronenkonfiguration und Termsymbole
Elektronenkonfigurationen besitzen oft eine Reihe von eng benachbarten Energieniveaus, wie in Abb. 14.2 schematisch für Ne gezeigt ist. Diese Feinstrukturaufspaltung wird hauptsächlich durch die Spin-BahnWechselwirkung verursacht, die in Wasserstoff typischerweise relative Verschiebungen der Energieniveaus in der Größenordnung von 10−4 hervorrufen kann und deren Einfluss mit steigender Kernladungszahl 𝑍 wächst. Hyperfeinwechelwirkungen sind demgegenüber um einen Faktor 1000 kleiner und relativistische Effekte können normalerweise vollständig vernachlässigt werden. Für die leichteren Mehrelektronenatome sind die Quantenzahlen ℒ und 𝒮 des Gesamtbahndrehimpulses bzw. des Gesamtspindrehimpulses gute Quantenzahlen und deren Wechselwirkung, die als Russell-
Saunders- (oder ℒ𝒮-) Kopplung bezeichnet wird, ist die Ursache der Spin-Bahn-Kopplung. Atomzustände lassen sich dann gut durch ein Termsymbol der Form 2𝒮+1 ℒ𝒥 beschreiben, die die verschiedenen Drehimpulse charakterisiert: 𝒮 ist die Gesamtspinquantenzahl, 2𝒮 + 1 die Spinmultiplizität (z. B. Singulett, Triplett), ℒ die Gesamtbahndrehimpuls-Quantenzahl in spektroskopischer Notation (die Großbuchstaben S, P, D, F,. . . stehen für ℒ = 0, 1, 2, 3, . . . ) und 𝒥 ist die Gesamtdrehimpuls-Quantenzahl. Das Termsymbol eines Atoms oder Ions wird häufig im Anschluss an die Elektronenkonfiguration angegeben. Beispielsweise sind die niedrigsten Singulett- und Triplettzustände von He 1s 2s1 S0 bzw. 1s 2s3 S1 , wie in Abb. 14.2 dargestellt. Wenn alle besetzten Unterschalen gefüllt sind (wie für die Grundzustände aller Edelgase sowie einigen anderen Atomen wie Ca, Cd, Yb oder Hg), ist das Termsymbol 1 S0 . Das Periodensystem
Je größer der Wert von n wird, desto schwächer ist das Elektron in dem Atom gebunden, weil die Coulombabschirmung durch die inneren Elektronen das Kernpotential abschwächt. Daher werden Schalen normalerweise in der Reihenfolge n = 1, 2, 3, 4,. . . besetzt. Ähnlich gilt, je größer der Wert von 𝓁 ist, desto schwächer ist das Elektron gebunden, weil sich die Elektronendichte immer weiter zur Peripherie des Atoms verschiebt. Daher werden Unterschalen normalerweise in der Reihenfolge s, p, d, f, . . . gefüllt. Aufgrund dieser sukzessiven Auffüllung der (Unter-) Schalen sind viele Eigenschaften der Elemente periodische Funktionen von 𝑍, wie das in Abb. 14.3 gezeigte Periodensystem der Elemente veranschaulicht. Sukzessive Zeilen der Tabelle entsprechen aufeinander folgenden Werten der Hauptquantenzahl n. Jede Spalte der Tabelle enthält Elemente, deren physikalische und chemische Eigenschaften einander ähnlich sind, weil sie dieselbe Zahl von Elektronen in ihren äußersten Schalen (Valenzelektronen) besitzen. Die Spalte 18 besteht zum Beispiel aus den Edelgasen, zu denen unter anderem He und Ne gehören, die atomar vorliegen und chemisch inert sind, weil sie gefüllte Außenschalen besitzen und der Energieunterschied zwischen ihren gefüllten p-Unterschalen und den folgenden höheren s-Unterschalen groß ist. Die Spalten 1 und 17 bestehen im Gegensatz dazu aus Elementen, die chemisch sehr aktiv sind und leicht Moleküle bilden. Jedes Alkalimetallatom in Spalte 1 enthält zum Beispiel ein einzelnes Außenelektron, das es gerne mit einem Halogenatom aus Spalte 17 teilt, das gerade so ein einzelnes Elektron braucht, um seine Außenschale zu komplettieren.
14.1 Energieniveaus
He 1s2s 1S0 1s2s 3S1
20 19
21
3.39-µm-Laser
2p5 5s
20
Energie / eV
Energie / eV
21
Ne
2p5 4s
632.8-nm-Laser 19 2p5 3p
18
18
17
17
2p5 3s
16
16 ungerade Parität
gerade Parität
Übergänge in Ne entsprechen den Wellenlängen 3.39 μ m und 632.8 nm. Diese Übergänge im mittleren Infrarot und im Sichtbaren werden in He-Ne-Lasern verwendet (siehe Abschnitt 15.3.5 und 16.3.7). Die nahezu übereinstimmenden Energien der angeregten Niveaus von He und Ne erleichtern die Anregung der Neonatome durch Stöße in einer Gasentladungsröhre; daher der Name „He-Ne-Laser“.
Abb. 14.2 Ausgewählte Energieniveaus von He- und NeAtomen. Elektronenkonfigurationen und Termsymbole sind angegeben (der Präfix für die Elektronenkonfiguration für Ne (1s2 2s2 ), der gefüllten Unterschalen entspricht, wurde der Kürze halber weggelassen). Der Energieabstand zwischen den Feinstrukturniveaus, die schematisch dargestellt sind, ist stark übertrieben. Die durch Pfeile gekennzeichneten
1
1 2 3 4
2
3
4
5
6
7
8
10
9
11
12
13
14
15
16
17
H 3
IIIA IVA VA VIA VIIA He 10 8 9 5 6 7
IIA 4
Li Be 11
gasförmig
flüssig
fest
12
Na Mg 19
18 VIIIA 2
IA 1
20
IIIB IVB 21 22
VB VIB VIIB 23 24 25
VIIIB 26 27
IB 29
28
IIB 30
B
C
N
O
F Ne
13
14
15
16
17
Al Si
P
S
Cl Ar
31
33
34
35
32
18 36
K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr
5
38
39
40
53
54
Rb Sr
37
Y
Zr Nb Mo Tc Ru Rh Pd Ag Cd In Sn Sb Te
I
Xe
6
56
57
72
85
86
Cs Ba
7
71 89
104
Fr Ra
103
Rf Db Sg Bh Hs Mt Ds Rg Cn Nh Fl Mc Lv Ts Og
55 87
88
bis
bis
57
41
42
73
43
74
75
44 76
45 77
47
46 78
79
48 80
49 81
50 82
51 83
52 84
Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po At Rn
58
105 106
59
60
107 108
61
62
109 110
63
64
111
65
112
66
113 114
67
115
68
69
116
70
117
71
Lanthanoide
La Ce Pr Nd Pm Sm Eu Gd Tb Dy Ho Er Tm Yb Lu
Actinoide
Ac Th Pa U Np Pu Am Cm Bk Cf Es Fm Md No Lr
89
90
91
92
93
94
95
96
97
98
99
100 101
Abb. 14.3 Periodensystem der Elemente mit Elementsymbolen und Kernladungszahlen Z. Sukzessive Zeilen der Tabelle (die Perioden) enthalten Elemente, deren Valenzelektronen dieselbe Hauptquantenzahl n besitzen, wie durch die arabischen Ziffern links angegeben. Jede Spalte der Tabelle (die Gruppen), durch die arabischen Zahlen im Kreis ganz oben bezeichnet, besteht aus Elementen mit ähnlichen physikalischen und chemischen Eigenschaften. Die römischen Ziffern mit einem nachgestellten A oder B entsprechen der tradi-
118
102 103
tionellen (und immer noch häufig verwendeten) Bezeichnungsweise der Gruppen. Die Reihen der Lanthanoide und der Actinoide im unteren Teil der Abbildung entsprechen der sukzessiven Auffüllung der 4f- bzw. 5f-Unterschalen. Unter Seltenerdelementen oder Seltenerdmetallen (umgangssprachlich auch Seltene Erden) versteht man die Elemente der Lanthanoide sowie Scandium und Yttrium. Elemente, die bei Zimmertemperatur als Gase, Flüssigkeiten bzw. Festkörper vorliegen, sind in hellgrau, weiß und dunkelgrau gezeigt.
417
418
14 Licht und Materie
Im Allgemeinen besitzen Mehrelektronenatome und -ionen eine große Zahl von erlaubten Energieniveaus. Obwohl normalerweise nur Valenzelektronen an optischen Übergängen beteiligt sind, verursacht dieser Überfluss an Energieniveaus wiederum eine Unmenge von Energiedifferenzen, von denen viele als praktisch nutzbare Laserwellenlängen dienen (siehe Abschnitt 15.3.5 und 16.3.7). Die in Abb. 14.2 gezeigten Energiedifferenzen zwischen den angeregten Niveaus in Ne liegen zum Beispiel hauptsächlich in den infraroten und optischen Regionen des Spektrums, die sich typischerweise bis zu Energien von einigen eV erstrecken. Relative Atommassen
Der Kern eines Elements mit der Ordnungszahl 𝑍 enthält 𝑍 Protonen und eine Anzahl von Neutronen. Verschiedene Isotope eines bestimmten Elements enthalten alle 𝑍 Protonen, aber unterschiedlich viele Neutronen. Natürlich vorkommende Elemente bestehen oft aus mehreren Isotopen; die häufigkeitsgewichtete relative Atommasse einer bestimmten Probe des Elements wird mit Ar bezeichnet. Isotopenreine Elemente wie z. B. 23 Na bestehen nur aus einem einzelnen natürlich vorkommenden (oder zumindest einem in der Mischung sehr stark dominierenden) Isotop. So wie Elementarteilchen entweder Bosonen oder Fermionen sind (Abschnitt 13.1.3), gilt dies auch für zusammengesetzte Teilchen wie Atome. Wenn die Gesamtzahl der konstituierenden Fermionen (Elektronen, Protonen und Neutronen) im Atom gerade (ungerade) ist, handelt es sich um ein zusammengesetztes Boson (Fermion) mit ganzzahligem (halbzahligem) Spin. Beispiele für bosonische Atome sind 42 He oder 23 11 Na. Fermionische Atome sind bei87 spielsweise 32 He, 22 11 Na oder 38 Sr. Bosonen und Fermionen gehorchen der Bose-Einstein- bzw. Fermi-Dirac-Statistik. Äußere Felder
Anlegen eines äußeren magnetischen oder elektrischen Feldes an ein Atom führt dazu, dass ansonsten entartete Energieniveaus durch den Zeemaneffekt bzw. den Starkeffekt aufgespalten und modifiziert werden. Der Zeemaneffekt beruht auf der Wechselwirkung eines äußeren Magnetfelds mit dem magnetischen Gesamtdipolmoment (einschließlich seiner Bahn- und Spinkomponenten) eines Atoms. Der Starkeffekt ist das Analogon des Zeemaneffekts für das elektrische Feld; er entsteht aus der Wechselwirkung eines äußeren elektrischen Feldes mit dem induzierten elektrischen Dipolmoment des Atoms. Aufspaltungen aufgrund eines angelegten elektrischen Wechselfeldes sind die Folge des optischen Starkeffekts [auch dynamischer Starkef-
fekt oder AC-Starkeffekt (nach engl. alternating-current Stark effect genannt)]. Die Beträge der Zeeman- und Starkaufspaltung der Energieniveaus nehmen mit zunehmender Feldstärke zu. Beide Effekte spielen bei der Laserkühlung und beim Lasertrapping sowie anderen Anwendungen eine wichtige Rolle. Ionisierungsenergien
Die Ionisierungsenergie eines neutralen Atoms ist die Energie, die erforderlich ist, um sein am schwächsten gebundenes Valenzelektron abzuspalten, wodurch ein Kation entsteht. In jeder Zeile des Abb. 14.3 gezeigten Periodensystems steigt die Ionisierungsenergie im Allgemeinen nach rechts hin an und ist für das Alkalimetall in Spalte 1 (das ein einzelnes Valenzelektron außerhalb einer abgeschlossenen Schale besitzt) minimal und für das Edelgas in Spalte 18 (das eine abgeschlossene Schale besitzt) maximal. Im Grundzustand des Wasserstoffatoms beträgt die Energie des Elektrons beispielsweise −13.6 eV gegenüber dem Vakuumniveau (Abb. 14.1), sodass die Ionisierungsenergie von Wasserstoff W = 13.6 eV beträgt. Mehrelektronenatome können auch ionisiert werden, indem ein Elektron aus einer inneren Schale mit einer sehr viel höheren Ionisierungsenergie entfernt wird, oder man kann hochionisierte Mehrelektronenatome erzeugen, aus denen mehrere Elektronen entfernt wurden (Abschnitt 16.3.6).
14.1.2
Ionen und dotierte Dielektrika
Wenn eines oder mehrere Elektronen aus einem Atom entfernt werden, bleibt ein Kation mit einer neuen Elektronenkonfiguration und einem neuen Termsymbol zurück. Während sich die Energieniveaus der Rumpfelektronen bei der Ionisierung gegenüber dem neutralen Atom kaum verändern, sind die Unterschalen, aus denen die Valenzelektronen entfernt wurden, ebenso wie ihre Energieniveaus charakteristisch für das Ion. Genau wie in Mehrelektronenatomen existieren auch in Ionen eine Unzahl von Energieniveaus und folglich möglichen Laserwellenlängen. Mit die frühesten Laser waren Ionen/Gas-Laser, die auf Energieniveaus von Edelgasionen wie Ar+ und Kr+ beruhten, die in einer Gasentladungsröhre aus den neutralen Atomen erzeugt wurden (Abschnitt 16.4.5). Etwa zu derselben Zeit (um 1964) wurden Festkörperlaser entwickelt, die Energieniveaus von Lanthanoidmetallionen nutzten, beispielsweise von Nd3+ -Ionen, die einen kleinen Teil der Y3+ -Ionen in einem Y3 Al5 O12 -Kristall ersetzten. Aufgrund ihrer überlegenen Leistung und Robustheit haben Festkörperlaser Ionen/Gas-Laser mit Ausnahme einiger hochspezialisierter Anwendungen fast vollständig verdrängt.
14.1 Energieniveaus
Ähnlich wie bei Atomen werden die Energieniveaus der Laserionen durch quantenmechanische Berechnungen bzw. in der Praxis oft auch empirisch ermittelt. Für Festkörper-Laserverstärker und -laser werden meist Ionen von Übergangs- oder Lanthanoidmetallen als Dotiersubstanzen verwendet (siehe Abschnitt 15.4 und 16.4.1). Die Wirtsmedien sind üblicherweise isolierende ionische oder kovalente Dielektrika, die in einem bestimmten Bereich des Spektrums transparent sind und geeignete optische, thermische und mechanische Eigenschaften besitzen. Die optischen Eigenschaften dielektrischer Materialien wurden in Abschnitt 5.5.3 im Kontext des Lorentz-Oszillatormodells diskutiert, das zur Charakterisierung transparenter Wirtsmaterialien geeignet ist. Das Ausmaß, in dem die Energieniveaus der aktiven Laserionen durch das Wirtsmedium beeinflusst werden, wird hauptsächlich dadurch bestimmt, wie gut ihre optischen Elektronen vor der Wechselwirkung mit benachbarten Gitteratomen abgeschirmt sind. Es zeigt sich, dass die Energieniveaus von Übergangsmetallionen signifikant durch lokale Felder des Wirtsgitters beeinflusst werden, die der Lanthanoidionen (Seltenerdionen) dagegen kaum. Als Beispiele betrachten wir im Folgenden die Energieniveaus von vier üblichen Lasersystemen: Cr3+:Al2 O3 (Rubin), Cr3+:BeAl2 O4 (Alexandrit), Nd3+:Y3 Al5 O12 (Nd3+:YAG) und Nd3+:Glas.
Übergangsmetall-Dotierionen
Die am häufigsten verwendeten Übergangsmetall-Dotierionen für Laser sind die dreiwertigen Ionen Cr3+ und Ti3+ , obwohl gelegentlich auch Cr2+ , Cr4+ , Ni2+ , Co2+ und weitere zum Einsatz kommen. Die Elektronenkonfigurationen und Termsymbole für einige dieser Ionen und die zugehörigen neutralen Atome sind in Tabelle 14.1 angegeben. Wie die Tabelle zeigt, besetzen die spektroskopisch aktiven Elektronen der Übergangsmetalle die 3d-Unterschale. Rubin und Alexandrit
Wir betrachten nun die Energieniveaus zweier dielektrischer Medien, die mit Cr3+ dotiert sind, Rubin und Alexandrit (Abb. 14.4). Rubin ist berühmt, weil mit seiner Hilfe der erste Laser gebaut wurde, während Alexandrit einige Aufmerksamkeit erhalten hat, weil sein Licht über einen Bereich von Wellenlängen abstimmbar ist. Die Energieniveaus von Ti:Saphir, einem wichtigen Übergangsmetallionen-Lasermaterial, werden in Abschnitt 16.3.1 betrachtet. Rubin (Cr3+:Al2 O3 ) ist ein Chromaluminiumoxid. Es ist ein Dielektrikum mit dem Brechungsindex 𝑛 ≈ 1.76, das hauptsächlich aus Aluminiumoxid besteht (Al2 O3 , auch als Saphir, Tonerde oder Korund bezeichnet), in dem ein kleiner Bruchteil der Al3+ -Ionen (≈ 0.05 %) durch Cr3+ -Ionen ersetzt ist. Alexandrit 3+ (Cr :BeAl2 O4 ) entsteht durch Dotierung von Chrysoberyll (BeAl2 O4 ) mit einem kleinen Anteil von Chromoxid (≈ 0.1 %). Dieses Material hat einen ähnlichen Bre-
Tab. 14.1 Ausgewählte Übergangsmetall- und Lanthanoid- (Seltenerd-) Dotierionen für Festkörperlaser: Elektronenkonfigurationen und Termsymbole der neutralen Atome und der Ionen. Konfigurationa)
Term
Ion
Konfiguration
Term
Ti
3d2 4s2
3d1
2D
3∕2
3d5 4s1
3F 2 7S 3
Ti3+
Cr
Cr2+
3d4
5D
0
Cr3+
3d3
4F
Cr4+
3d2
Fe2+
3d6
3F 2 5D 4
Nd3+
4f 3
4I
Er3+
4f 11
4I
Tm3+
4f 12
Yb3+
4f 13
15∕2 3H 6 2F 7∕2
U3+
5f 3
4I
Kernladungszahl Z
Atom
Übergangsmetalle 22 24
3d6 4s2
5D
Nd
4f 4 6s2
5I
Er
4f 12 6s2
69
Tm
4f 13 6s2
70
Yb
4f 14 6s2
2F 7∕2 1S 0
Actinoidmetalle 92
U
5f 3 6d1 7s2
5L
26
Fe
Lanthanoidmetalle 60 68
4
4 3H
6
6
3∕2
9∕2
9∕2
a) Die Elektronenkonfigurationen der gefüllten Unterschalen sind wie allgemein üblich nicht angegeben; das gilt auch für die 5s2 5p6 -Unterschalen der Schale n = 5 der Lanthanoide bzw. die 6s2 6p6 -Unterschalen der Schale n = 6 der Actinoide.
419
14 Licht und Materie
Cr3+: Al2O3 (Rubin)
Cr3+: BeAl2O4 (Alexandrit)
4
4F 1
3
4F 2
2 2E
694-nmLaser 4A
2
4
3 Energie / eV
Energie / eV
420
4
T2 E
2
2
abstimmbarer Laser 1 680-nmLaser
1
4
0
A2
0
Abb. 14.4 Ausgewählte Energieniveaus und Energiebänder für Cr3+:Al2 O3 (Rubin) und Cr3+:BeAl2 O4 (Alexandrit). Jeder Laser strahlt Licht bei einer charakteristischen Wellenlänge aus (494 nm im Rubin, 680 nm im Alexandrit); Alexandritlaser können jedoch über einen gewissen Bereich von weiteren Wellenlängen strahlen. Die Hell-/Dunkel-Schattierung
des unteren Laserbands in Alexandrit deutet die Abnahme der relativen Besetzung an. Aufgrund der wichtigen Rolle, die das Kristallfeld bei der Bestimmung der Energieniveaus von Übergangsmetallionen in dielektrischen Wirtsmedien spielt, sind die Niveaus mit gruppentheoretischen Bezeichnungen anstelle von Termsymbolen versehen.
chungsindex wie Rubin, 𝑛 ≈ 1.74, es ist jedoch zweiachsig, während Saphir einachsig ist. Da die 3d-Elektronen der Cr3+ -Ionen in beiden Materialien in Kontakt mit benachbarten Ionen kommen, werden die Energieniveaus dieser Materialien zu großen Teilen durch die Kristallfelder ihrer Umgebung bestimmt und hängen daher entscheidend vom Wirtsmaterial ab. Insbesondere ist jedes Chromion so von Sauerstoffionen umgeben, dass es ein räumlich variierendes Potential spürt. Dieses Potential wird am besten im Rahmen der Kristallfeldtheorie (oder Ligandenfeldtheorie) beschrieben; es bestimmt zusammen mit dem der Cr3+ -Ionen die Energieniveaus von Rubin und Alexandrit gemäß der Schrödingergleichung. Aus diesem Grund werden die Energieniveaus von Übergangsmetallionen in einem dielektrischen Wirtsmedium im Allgemeinen mit gruppentheoretischen Symbolen anstelle von Termsymbolen bezeichnet. Die resultierenden Energien sind eine Mischung aus diskreten Niveaus und Energiebändern, von denen einige zusammen mit ihren gruppentheoretischen Symbolen in Abb. 14.4 gezeigt werden. Die Energieniveaus der beiden Materialien unterscheiden sich deutlich, obwohl sie auf derselben Dotiersubstanz beruhen. Beispielsweise besteht das 4A2 -Band in Alexandrit aus einer Ansammlung von vibronischen Zuständen, die das Resultat einer Kopplung zwischen den elektronischen Energieniveaus und den Gitterschwingungen des Kristalls sind. Aus diesem Grund kann Alexandrit über einen (begrenzten) Bereich von Wellenlängen strahlen, während Rubin dazu nicht in der Lage ist (siehe Abschnitt
15.3.5). Trotzdem besitzen beide Materialien ihre charakteristischen Wellenlängen, die einander recht ähnlich sind (694 nm für Rubin und 680 nm für Alexandrit). Lanthanoiden-Dotierionen
Die Lanthanoide umfassen die Elemente der Reihe von 58 Ce bis 71 Lu aus der sechsten Periode des Periodensystems (siehe Abb. 14.3). Diese Elemente werden (zusammen mit 21 Sc und 39 Y) häufig Seltenerdmetalle genannt, weil man sie früher für selten hielt (was nicht stimmt). Sie entstehen durch sukzessive Auffüllung der 4f-Unterschale, die räumlich innerhalb der gefüllten 5s2 5p6 - und 6s2 -Unterschalen liegt, mit Elektronen (siehe Tabelle 14.1). Die Lanthanoide kommen gewöhnlich als dreiwertige Kationen vor; ihre Valenzeleku tronenkonfiguration ist 4f mit u von 1 (Ce3+ ) bis 14 3+ (Lu ). Die Lanthanoidionen Nd3+ , Er3+ , Tm3+ und Yb3+ sind besonders wichtige Dotiersubstanzen für Laserverstärker und -oszillatoren. Die Elektronenkonfigurationen und Termsymbole dieser Ionen sowie der zugehörigen Atome sind in Tabelle 14.1 angegeben. Fasern aus Nd3+:Glas und Er3+:Quarzglas werden häufig als Laserverstärker verwendet, wie in den Abschnitten 15.3.2 und 15.3.3 hervorgehoben wird. Fasern aus Nd3+:YAG, Nd3+:YVO4 und Yb3+:YAG dienen als Laseroszillatoren, wie in Abschnitt 16.3.1 diskutiert. Von den anderen Lanthanoiden werden Pr3+ und Ho3+ ebenfalls als aktive Laserionen eingesetzt. Um die Leistungsfähigkeit der Laser zu verbessern, werden häufig zwei oder mehr Lanthanoidionen als Ko-Dotierionen verwendet.
14.1 Energieniveaus
421
3.0
3.0
Nd3+: Glas
4
F3/2
2.5
2.5
2.0
2.0
1.5
1.064- µmLaser
1.0
Energie / eV
Energie / eV
Nd3+: YAG
1.053 - µmLaser
0.5 4
4I
I11/2
4
I 9/2
0.5 0
9/2
Betrachtung in den beiden Materialien (siehe z. B. Abb. 14.6), was in der hier gezeigten Auflösung aber nicht erkennbar ist. Da die Energieniveaus der Dotierionen kaum durch das umgebende Wirtsmedium beeinflusst werden, sind sie hier mit der Termsymbolen der Ionen bezeichnet.
Nd3+:YAG und Nd3+:Glas
4I
0.12 9/2
Energie (eV)
Das Verhalten von dreiwertigen Lanthanoidionen in einem dielektrischen Wirtsmedium und in isolierter Form ist ziemlich ähnlich. Das liegt an der Tatsache, dass die 4f-Elektronen durch die gefüllten 5s- und 5pUnterschalen gut gegen äußere Effekte des Gitters abgeschirmt werden (siehe Tabelle 14.1). Das steht in deutlichem Gegensatz zu der Situation in Übergangsmetallionen. Daher sind die Energieniveaus des Seltenerdions im Unterschied zu Rubin und Alexandrit im Wesentlichen unabhängig vom Wirtsmaterial. Das ist in Abb. 14.5 für zwei recht unterschiedliche Wirtsmedien illustriert: Nd3+ in YAG und Nd3+ in Phosphatglas. Die Haupt-Laserübergänge der beiden Materialien im nahen Infrarot, entsprechend den Energiedifferenzen zwischen den 4 F3∕2 und 4 I11∕2 -Niveaus, liegen bemerkenswert nahe beieinander: 1.064 μm für Nd3+:YAG und 1.053 μm für Nd3+:Glas.
1.0
11/2
4I
0
Abb. 14.5 Ausgewählte Energieniveaus von Nd3+ in YAG und in Phosphatglas. Die Pfeile zeigen den Hauptlaserübergang im nahen IR, der in YAG eine Wellenlänge von 1.064 μ m und in Phosphatglas von 1.053 μ m hat. Die Feinstruktur der Energieniveaus unterscheidet sich bei genauer
1.5
4F 3/2
4I
0.34 11/2
0.10
0.32
1.48
0.08
0.30
1.46
0.06
0.28
1.44
0.04
0.26
1.42
0.02
0.24
1.40
0 (a)
1.50
4F 3/2
0 (b)
0 (c)
Abb. 14.6 Feinstruktur der drei mit den Laserübergängen eines Nd3+:YAG-Lasers zusammenhängenden atomaren Energieniveaus. (a) Grundzustand 4 I9∕2 ; (b) Unteres Laserniveau 4 I11∕2 ; (c) Oberes Laserniveau 4 F3∕2 . Die genauen Energien der Unterniveaus hängen vom Wirtsmaterial ab; für Wirte wie z. B. Glas, in denen eine inhomogene Verbreiterung dominiert, werden sie zu Bändern verbreitert.
Feinstruktur der Energieniveaus von Lanthanoidionen
Bei genauer Betrachtung hängen die Energien der Energieniveaus von Lanthanoidionen sehr wohl vom Wirtsmaterial ab. Beispielsweise besitzen Nd3+:YAG und Nd3+:Glas aufgrund von Unterschieden der lokalen Umgebungen deutlich unterschiedliche Feinstrukturen. Der Einbau von Nd3+ -Ionen in einen Kristall wie YAG führt zu einer homogenen Verbreiterung, während die Einbettung in ein weniger strukturiertes Material wie Phosphatglas zu einer inhomogenen Verbreiterung führt (Abschnitt 14.3.4). In Abb. 14.6, die stark vergrößerte Ausschnitte aus Abb. 14.5 zeigt, ist die Feinstruktur von Nd3+:YAG zu erkennen. In einem glasartigen
Wirtsmedium wird diese Feinstruktur zu Bändern verschmiert. Die Anzahl der unterschiedlichen Unterniveaus in den in Abb. 14.6 gezeigten Niveaus wird durch den Wert von 𝑔∕2 bestimmt, wobei 𝑔 = 2𝒥 + 1 ist. Der Parameter 𝑔 wird als Entartung eines Energieniveaus bezeichnet und 𝒥 ist die Quantenzahl des Gesamtdrehimpulses, die auch in dem bereits diskutierten Termsymbol in der Form 2𝒮+1 ℒ𝒥 enthalten ist. Für die drei Niveaus in Nd3+:YAG, die in Abb. 14.6 dargestellt sind, beträgt die Anzahl der Unterniveaus (2𝒥 + 1)∕2 = 5, 6 bzw. 2.
422
14 Licht und Materie
Die bekannte Laserlinie bei 1.06415 μm beruht auf einem Übergang zwischen dem oberen Unterniveau des 4 F3∕2 -Niveaus bei 1.4269 eV und dem dritten Unterniveau des 4 I11∕2 -Niveaus bei 0.2616 eV. (Nach Frequenzverdopplung liefert dieser Übergang die bekannte Quelle für grünes Licht bei 532 nm.) Actinoid-Dotierionen
Die Aktinoidenmetalle in Zeile 7 des Periodensystems (siehe Abb. 14.3) entstehen durch sukzessives Auffüllen der 5f-Unterschale mit Elektronen. Die spektroskopisch aktiven 5f-Elektronen in den Actinoidionen sind durch die gefüllten 6s- und 6p-Unterschalen vom Wirtsgitter abgeschirmt (siehe Tabelle 14.1). Das chemische Verhalten der Actinoide ähnelt aus diesem Grund dem der entsprechenden Lanthanoide. Der U3+:CaF2 Laser, der Im Jahr 1960 nur wenige Monate nach dem Rubinlaser entwickelt wurde, beruht auf dem Übergang 4 I11∕2 → 4 I9∕2 von U3+ bei 𝜆0 ≈ 2.49 μm. Neodym liegt im Periodensystem unmittelbar über Uran; sowohl Nd3+ als auch U3+ haben im Grundzustand die gleiche f 3 -Elektronenkonfiguration und dasselbe Termsymbol 4 I9∕2 (siehe Tabelle 14.1). Während die Entwicklung von aktinoiddotierten Lasermaterialien durch ihre relative Seltenheit und die Radioaktivität vieler ihrer Isotope behindert wurde, schritt die Weiterentwicklung von lanthanoiddotierten Lasermaterialien wie Nd3+:CaF2 schnell voran; trotzdem war U3+:CaF2 der erste praktisch realisierte Vierniveaulaser.
14.1.3
Moleküle
Durch Kombination von zwei oder mehr Atomen können Moleküle gebildet werden. Molekulare Energieniveaus werden teilweise durch die zwischenatomaren Kräfte bestimmt, die für die Bindung der Atome verantwortlich sind. Ein stabiles Molekül entsteht, wenn das Teilen von Valenzelektronen durch die konstituierenden Atome eine Verringerung der Gesamtenergie bewirkt. Die zwei grundsätzlichen Bindungsarten in Molekülen sind die ionische Bindung und kovalente Bindung. Bei einer kovalenten Bindung werden die negativen (Valenz-) Elektronen der beteiligten Atome (zumindest im einfachsten Bild dieser Bindung) zwischen den Atomen geteilt und unterliegen dadurch der Anziehung von mehr als einem der positiv geladenen Atomrümpfe. In einer ionischen Bindung werden die Elektronen demgegenüber mehr oder weniger vollständig von einem Atom auf ein anderes übertragen, sodass Ionen entstehen, zwischen denen eine elektrostatische Anziehung besteht. Daneben existieren noch sehr schwache Wechselwirkungen zwischen Molekülen, die weder auf
eine kovalente noch auf eine ionische Bindung zurückgehen, sondern meist auf Wechselwirkungen zwischen molekularen Dipolen; diese werden als Van-der-WaalsKräfte bezeichnet. Die Art der vorliegenden Bindungen spielt eine entscheidende Rolle bei der Bestimmung der Energieniveaustruktur des Moleküls. Die Energieniveaus eines Moleküls beruhen auf drei verschiedenen Mechanismen, deren Übergänge in der Regel in unterschiedlichen Wellenlängenbereichen liegen: Rotationsübergänge liegen im Mikrowellenbereich und dem fernen Infrarot, Schwingungsübergänge liegen im Infraroten und elektronische Übergänge liegen im sichtbaren und ultravioletten Bereich des Spektrums. Die Zeitskalen dieser Übergänge unterscheiden sich demzufolge beträchtlich; sie können daher in erster Näherung getrennt analysiert werden. Moleküle von einfachen Gasen bis hin zu Farbstoffen in einem Lösungsmittel können als aktive Lasermedien eingesetzt werden (siehe Abschnitt 16.3.5 und 16.3.4). Die Rotation zweiatomiger Moleküle
Die Rotation eines zweiatomigen Moleküls mit dem Trägheitsmoment ℐ um seinen Schwerpunkt kann als Rotation eines starren Rotators um eine Achse senkrecht zu seiner Kernverbindungsachse aufgefasst werden. Die klassische Rotationsenergie für solch ein System ist E r = 2 L ∕2ℐ, wobei L der Drehimpuls des Systems um die Achse der Rotation ist. Nach der Quantenmechanik ist das Betragsquadrat des Drehimpulses eines solchen Systems 2 gemäß L = r(r + 1)ℏ2 gequantelt, wobei r die Rotationsquantenzahl ist. Die erlaubten Energieniveaus des rotierenden zweiatomigen Moleküls sind damit Er =
1 r(r + 1)ℏ2 , 2ℐ
r = 0, 1, 2, …
(14.5)
Der Energieabstand ℏ𝜔 der Rotationsniveaus liegt normalerweise im Bereich 10−4 −10−2 eV entsprechend Photonen im Mikrowellenbereich oder fernen Infrarot. Der Energieabstand zwischen sukzessiven Rotationsniveaus nimmt mit zunehmender Quantenzahl r zu, im Gegensatz zu dem Abstand zwischen sukzessiven elektronischen Energieniveaus des Wasserstoffatoms, die nach Gl. (14.4) mit zunehmender Quantenzahl abnehmen. Die Schwingung zweiatomiger Moleküle
Die Schwingungen eines zweiatomigen Moleküls (wie N2 , CO, oder HCl) werden durch eine Anziehung zwischen den Kernen bei größeren Abständen und eine abstoßende Kraft bei kleineren Abständen bestimmt, die gemeinsam eine zur Auslenkung 𝑥 aus dem Gleichgewichtsabstand zweier Atome näherungsweise propor-
14.1 Energieniveaus
tionale Rückstellkraft liefert. Das System kann durch ein Modell aus zwei durch eine Feder verbundenen Massen M 1 und M2 beschrieben werden, dessen reduzierte Masse M r = M1 M 2 ∕(M 1 + M 2 ) ist. Die molekulare Kraftkonstante 𝜅 kann so definiert werden, dass für die potentielle 1 Energie V (𝑥) = 𝜅𝑥2 gilt. Die Energieniveaus der Mole2 külschwingungen sind daher die eines quantenmechanischen harmonischen Oszillators. Wie in Abschnitt 13.3 diskutiert, sind diese Niveaus gemäß ) ( 1 ℏ𝜔 , v = 0, 1, 2, … Ev = v + (14.6) 2 √ gequantelt, wobei 𝜔 = 𝜅∕Mr die Schwingungs(kreis-) 1 frequenz ist und ℏ𝜔 die Nullpunktsenergie. Glei2 chung (14.6) ist mit dem Ausdruck für die erlaubten Energien einer Mode des elektromagnetischen Feldes gemäß Gl. (13.5) identisch. Typische Werte von ℏ𝜔 für Molekülschwingungen liegen im Bereich 0.05–0.5 eV entsprechend dem infraroten Bereich des Spektrums (siehe die Energieniveaus von N2 in Abb. 14.7). Im Unterschied zu den Energieniveaus des Wasserstoffatoms und rotierender zweiatomiger Moleküle sind die Schwingungsniveaus der zweiatomigen Moleküle äquidistant. In der Praxis werden die Kurven der potentiellen Energie mit zunehmender Energie anharmonisch (siehe Abschnitt 22.7), was mit einer Verringerung der Abstände der Energieniveaus mit steigendem v einhergeht. Während eines Schwingungsübergangs kann das Molekül gleichzeitig seinen Rotationszustand veräneV
Energie
Ein dreiatomiges Molekül mit großer Bedeutung für die Photonik ist Kohlendioxid; es stellt ein sehr nützliches aktives Lasermedium für hohe optische Leistungen im mittleren Infrarot dar. Da es aus drei Atomen besteht und linear ist, kann das CO2 -Molekül drei Arten unabhängiger Schwingungen ausführen, die in Abb. 14.7 dargestellt sind: Eine asymmetrische Streckschwingung, eine symmetrische Streckschwingung und eine Deformationsschwingung. Jede dieser Normalschwingungen hat die Eigenschaften eines quantenmechanischen harmonischen Oszillators mit einer eigenen Federkonstante und folglich ihrem eigenen Wert von ℏ𝜔. Die erlaubten Energieniveaus des Moleküls sind durch eine Summe von drei Termen gegeben, von denen jeder die Form aus Gl. (14.6) besitzt, entsprechend den drei ModenQuantenzahlen (v A , v S , v D ), die die Schwingungen charakterisieren (siehe Abb. 14.7). Die in Abb. 14.7 durch Pfeile angezeigten Übergänge bezeichnen die bekannten Laserübergänge von CO2 im mittleren Infrarot bei 𝜆0 = 10.6 μm [(001) → (100)] bzw. 𝜆0 = 9.6 μm [(001) → (020)] (Abschnitt 15.3.5 und 16.3.7). Wie in zweiatomigen Molekülen wird jedes Schwingungsniveau in viele eng beisammen liegende Rotationsniveaus aufgespalten (nicht gezeigt), deren Energien näherungsweise durch Gl. (14.5) gegeben sind. eV (050)
(200) =1
10.6-µm-Laser
0.2
0.3 (100)
(030) (020) (010)
0.1 =0 symmetrische Streckschw.
(000)
0.4
(040)
(001) 9.6-µm-Laser
0
Die Schwingungen dreiatomiger Moleküle
CO2
N2
0.4
0.3
dern, sodass sich sowohl v als auch r ändern; das Ergebnis ist ein Rotationsschwingungsspektrum.
(000)
(000)
asymmetrische symmetrische DeformationsStreckschw. Streckschw. schwingung
Abb. 14.7 Die tiefsten Schwingungsniveaus von N2 und CO2 (der Energienullpunkt ist willkürlich auf v = 0 gesetzt). CO2 hat drei mögliche Schwingungsmoden, die antisymmetrische Streckschwingung (A), die symmetrische Streckschwingung (S) und die Deformationsschwingung (D). Der Schwingungszustand des Moleküls wird daher durch einen Satz von drei Quantenzahlen v A , v S und v D charakterisiert. Die durch Pfeile angezeigten Übergänge bezeichnen die be-
0.2
0.1
0
kannten Laserübergänge von CO2 im mittleren Infrarot bei
𝜆0 = 10.6 μ m bzw. 9.6 μ m. Jedes Schwingungsniveau von
CO2 besteht aus einer Anzahl eng beisammen liegender Rotationsniveaus (nicht gezeigt). Die (zufällige) weitgehende Übereinstimmung zwischen den Niveaus v = 1 in N2 und (001) in CO2 ermöglicht die Stoßanregung der CO2 -Moleküle in einer Gasentladungsröhre.
423
14 Licht und Materie
5 T2
Energie / eV
424
4
Abb. 14.8 Die Struktur des Rhodamin-6G-Ions C28 H31 N2 O+ . Links ist eine sche3 matische Darstellung eines Laserübergangs zwischen zwei Singulettniveaus mit geringfügig unterschiedlichen Kernkonfigurationen gezeigt, die durch die horizontale Verschiebung angedeutet sind. Die Schwingungs- und Rotationsniveaus werden durch dicke bzw. dünne Linien bezeichnet.
3
S1 T1
2
Laser
C H N O
1 S0 Singulettzustände
Triplettzustände
0
Farbstoffmoleküle
Organische Farbstoffe sind große und komplexe Moleküle. Infolgedessen können sie elektronische, Schwingungs- und Rotationsübergänge ausführen und besitzen normalerweise eine große Zahl von Energieniveaus; sowohl Singulett- (S) als auch Triplettzustände (T) sind möglich (siehe Abschnitt 14.1.1). Singulettzustände enthalten ein angeregtes Elektron, dessen Spin antiparallel zu dem des restlichen Farbstoffmoleküls liegt; Triplettzustände haben parallele Spins. Die Unterschiede zwischen Energieniveaus entsprechen Wellenlängen, die große Bereiche des optischen und ultravioletten Spektralbereichs abdecken. Abbildung 14.8 zeigt eine schematische Darstellung eines Teils der Energieniveaustruktur für Rhodamin-6G, das in einem Lösungsmittel wie Wasser oder Alkohol als Ion gelöst wird. Dieser spezielle Farbstoff wird manchmal als Lasermedium im gelben Gebiet des Spektrums verwendet. Organische Farbstofflaser werden in Abschnitt 16.3.4 kurz besprochen.
14.1.4
Festkörper
In Festkörpern liegen die Moleküle (oder Atome) eng benachbart und normalerweise periodisch in einem Kristallgitter angeordnet. Die Kräfte, die die Atome zusammenhalten, sind etwa so groß wie die Kräfte zwischen den Atomen in Molekülen. Daher sind die Energieniveaus von Festkörpern nicht nur durch die Potentiale der individuellen Atome bestimmt, sondern auch durch die Potentiale der benachbarten Gitteratome. Nichtkristalline Festkörper wie Gläser und Kunststoffe haben wie Kristalle regelmäßige Strukturen, aber nur über kurze Entfernungen. In normalen Festkörpern treten vier Grundtypen von Bindungen auf: ionische, kovalente, metallische und
Molekülbindungen. Ionische Festkörper (wie CaF2 ) bestehen aus einer kristallinen Anordnung von positiven und negativen Ionen mit sphärisch symmetrischen geschlossenen Schalen. Da sie keine freien Elektronen enthalten, die Strom leiten könnten, sind diese Materialien in der Regel Isolatoren. Sie sind im sichtbaren Bereich des Spektrums im Allgemeinen durchsichtig, da ihre Bandlücken meist im Ultravioletten liegen (siehe Abb. 5.15). Kovalente Festkörper bestehen wie kovalent gebundene Moleküle aus Atomen, die durch gemeinsame Valenzelektronen gebunden sind. Sie sind häufig Isolatoren und können im sichtbaren Bereich durchsichtig (wie Diamant) oder undurchsichtig (wie Graphit) sein. Kovalente Festkörper können Halbleiter sein (z. B. GaAs), die im sichtbaren Bereich undurchlässig und im Infrarot durchsichtig sind (siehe Abb. 5.15). Metallische Festkörper enthalten Valenzelektronen, die zwischen allen positiv geladenen Atomrümpfen in dem Metall geteilt werden und sich frei in ihrem kombinierten Potential bewegen können. Die Fähigkeit der Elektronen, frei durch metallische Kristalle wandern zu können, ist für ihre hohe elektrische Leitfähigkeit verantwortlich. Metalle reflektieren das Licht stark und sind im Sichtbaren undurchsichtig. Molekulare Festkörper bestehen aus kleinen, unpolaren kovalenten Molekülen, die durch Van-der-Waals-Kräfte zusammengehalten werden, die jedoch viel schwächer sind als die in anderen Festkörpern auftretenden Bindungsarten. Energiebänder
Es ist aufschlussreich, zu untersuchen, wie sich die Energieniveaus eines isolierten Atoms verändern, wenn es während der Bildung eines Kristallgitters in Kontakt mit benachbarten Atomen kommt. Isolierte Atome und Moleküle (z. B. in Gasen) besitzen diskrete Energieniveaus (siehe Abb. 14.1–14.8). Jedes individuelle Atom
14.1 Energieniveaus Vakuumniveau
(a)
g
3p 3s
(b) Energie
2p
2s
(c)
1s
Abb. 14.9 Schematische Energieniveaus für (a) zwei isolierte Atome, (b) ein zweiatomiges Molekül aus denselben beiden Atomen und (c) einen einfachen eindimensionalen Kristall aus fünf identischen Atomen.
in einer Ansammlung solcher identischer isolierter Atome besitzt einen identischen Satz von diskreten Energieniveaus. Wenn diese Atome einander nahe kommen, um einen Festkörper zu bilden, nimmt die Bedeutung von Austauschwechselwirkungen (die aus der quantenmechanischen Forderung nach Ununterscheidbarkeit identischer Teilchen resultieren) sowie die Anwesenheit von unterschiedlich starken Feldern immer mehr zu. Die zu Beginn scharfen Energieniveaus der Valenzelektronen der isolierten Atome verbreitern sich allmählich zu Gruppen von zahlreichen dicht beieinander liegenden Energieniveaus und bilden schließlich Energiebänder. Dieser Prozess ist in Abb. 14.9 schematisch dargestellt, die die elektronischen Energieniveaus für zwei isolierte Atome, für ein Molekül aus zwei solchen Atomen und für ein simples eindimensionales Gitter aus fünf solchen Atomen zeigt. Die tiefsten Energieniveaus bleiben scharf, weil die Elektronen in den inneren Unterschalen vor dem Einfluss der benachbarten Atome abgeschirmt werden, während die scharfen Energieniveaus der Valenzelektronen zu Bändern werden. Dieses Bild wird in Abb. 14.10 weiter ausgearbeitet, die die Energieniveaus eines isolierten Atoms und dreier unterschiedlicher Festkörper schematisch vergleicht: eines Metall, eines Halbleiter und eines Isolator. Die tiefsten Energieniveaus dieser Festkörper, die den Elektronenkonfigurationen 1s, 2s und 2p entsprechen, ähneln denjenigen des isolierten Atoms, weil die inneren Elektronen vor Wechselwirkungen mit anderen Atomen geschützt sind. Im Gegensatz dazu werden die diskreten höheren Niveaus der Valenzelektronen der Atome, die den Konfigurationen 3s und 3p entsprechen, in den Festkörpern in dicht gepackte Energiebänder aufgespalten. Das tiefste unbesetzte oder teilweise besetzte Energieband wird Leitungsband genannt, während das höchste vollständig besetzte Energieband als Valenzband bezeichnet wird. Diese beiden Bänder werden durch ein
isoliertes Atom
Metall
Halbleiter
Isolator
Abb. 14.10 Die Verbreiterung der diskreten Energieniveaus eines isolierten Atoms zu Energiebändern bei der Bildung eines Festkörpers. Vollständig besetzte Bänder sind dunkel schattiert, freie Bänder sind hell schattiert und teilweise besetzte Bänder sind teilweise dunkel und teilweise hell gezeigt. Das verbotene Band ist weiß dargestellt. Typische Werte der Leitfähigkeit 𝜎 für Metalle, Halbleiter und Isolatoren bei Zimmertemperatur sind 108 (Ω m)−1 , 10−4 −105 (Ω m)−1 bzw. 10−10 (Ω m)−1 .
verbotenes Band getrennt, dessen energetische Breite E g als Bandlücke bekannt ist. Wie bei Elektronen in einzelnen Atomen gilt auch für Elektronen in Festkörpern das paulische Ausschlussprinzip, sodass die am niedrigsten liegenden Energiebänder zuerst besetzt werden. Metalle, Halbleiter und Isolatoren
Die meisten Elemente im Periodensystem (siehe Abb. 14.3) sind Metalle. Sie besitzen ein bei allen Temperaturen teilweise besetztes Leitungsband (das hell und dunkel schattierte Gebiet in Abb. 14.10). Die Verfügbarkeit vieler freier Zustände in diesem Band ist für ihre hohe elektrische Leitfähigkeit verantwortlich (siehe Abschnitt 8.2.1). In Halbmetallen überlappen das Valenzund das Leitungsband. Intrinsische Halbleiter haben bei 𝑇 = 0 K ein besetztes Valenzband (dunkle Schattierung) und ein freies Leitungsband (helle Schattierung). Da keine verfügbaren freie Zustände im Valenzband und keine Elektronen im Leitungsband vorhanden sind, ist die Leitfähigkeit eines idealen intrinsischen Halbleiters bei 𝑇 = 0 K null. Wenn die Temperatur des Halbleiters über den absoluten Nullpunkt steigt, gewinnt eine zunehmende Zahl von Elektronen im Valenzband genügend thermische Energie, um in das Leitungsband gelangen zu können und dadurch eine Leitfähigkeit des Materials zu ermöglichen. Auch Isolatoren haben ein vollständig besetztes Valenzband und ein freies Leitungsband. Sie unterscheiden sich von Halbleitern durch ihre größere Bandlücke (normalerweise E g > 3 eV). Beispielsweise ist die Band-
425
426
14 Licht und Materie
lücke von Silicium (einem Halbleiter) E g ≈ 1.1 eV, während die von Diamant (einem Isolator) E g ≈ 5.5 eV ist. In Isolatoren haben nur wenige Elektronen die notwendige thermische Energie, um die Bandlücke zu überwinden und eine Leitfähigkeit des Materials zu ermöglichen. Allerdings ist bei der Entscheidung, ob ein Material ein Metall, Halbleiter oder Isolator ist, unter anderem auch zu berücksichtigen, wie sehr sich die Bänder überlappen. Halbleiter
Halbleiter finden in der Photonik weite Anwendung. Sie werden als Lichtquellen wie lichtemittierende Dioden und Laserdioden sowie als Detektoren verwendet und haben noch viele andere wichtige Anwendungen. Wir geben im Folgenden eine kurze Einführung in die Energieniveaus von Vollmaterial-Halbleitern, Quantenschichten, Quantendrähten und Quantenpunkten. Eine umfassendere Diskussion der Eigenschaften von Halbleitern einschließlich organischer Halbleiter folgt in Abschnitt 17.1. Vollmaterial-Halbleiter
Der binäre Halbleiter GaAs hat sich in der Photonik schon früh als sehr nützlich erwiesen. Dieses Material hat eine Zinkblendestruktur, die aus zwei kubisch flächenzentrierten Gittern besteht, einem aus Ga-Atomen 1 und einem aus As-Atomen, die gegeneinander um die 4
GaAs
5
Leitungsband
g
Laser 1.42 eV
0
Energie / eV
Valenzband –5
–10
–15 Ga Rumpfniveaus As
Ga As
–20 –30 –40 –50
Abb. 14.11 Der Halbleiter GaAs hat eine Zinkblendestruktur, die aus zwei kubisch flächenzentrierten Gittern besteht, einem aus Ga- und einem aus As-Atomen. Die höheren Energieniveaus liegen dicht beieinander und bilden Bänder. Der Energienullpunkt wurde willkürlich auf die obere Kante des Valenzbands gelegt. Die GaAs-Laserdiode beruht auf dem Elektronenübergang zwischen den Leitungs- und den Valenzbändern im nahen Infrarot.
Länge einer Raumdiagonale versetzt sind (Abb. 14.11). Die konventionelle Elementarzelle (ein Kubus) enthält vier Formeleinheiten GaAs. Jedes Atom ist von vier Atomen der anderen Sorte umgeben, die in gleichen Abständen an den Ecken eines regelmäßigen Tetraeders liegen. Halbleiter haben viele eng benachbarte erlaubte elektronische Energieniveaus, die wie in Abb. 14.11 für GaAs gezeigt Bänder bilden. Die Bandlücke E g , der Abstand zwischen Valenz- und Leitungsband, beträgt bei Zimmertemperatur 1.42 eV. Die Rumpfniveaus von Ga und As (3d) sind recht scharf, wie in Abb. 14.11 deutlich wird. Das Valenzband von GaAs wird von den 4s- und 4p-Niveaus gebildet (wie schematisch in Abb. 14.10 gezeigt). Quantenschichten
Mithilfe moderner Methoden der Kristallabscheidung wie der Molekularstrahlepitaxie oder der Gasphasenepitaxie können Materialien mit gezielt entworfenen Bandstrukturen erzeugt werden. In Halbleiter-Quantenschichten (engl. quantum wells) variiert die Bandlücke räumlich auf eine bestimmte Art, was Materialien mit einzigartigen elektronischen und optischen Eigenschaften ergibt. Ein Beispiel ist die in Abb. 14.12 dargestellte Mehrfachquantenschichtstruktur. Sie besteht aus ultradünnen (2–15 nm) Schichten aus GaAs im Wechsel mit dünnen (20 nm) Schichten aus AlGaAs. Die Bandlücke von GaAs ist kleiner als die von AlGaAs. Für eine Bewegung senkrecht zu den Schichten sind die erlaubten Energieniveaus der Elektronen im Leitungsband bzw. der Löcher im Valenzband diskret und deutlich getrennt wie diejenigen des linearen Potentialtopfs in der Quantenmechanik (siehe Übung 17-5); die tiefsten Energieniveaus sind in den einzelnen Quantentöpfen schematisch angedeutet. Die AlGaAs-Sperrzonen können ebenfalls ultradünn gemacht werden (< 1 nm); in diesem Fall können die Elektronen in benachbarten Quantenschichten durch quantenmechanische Tunneleffekte miteinander wechselwirken und die diskreten Energieniveaus verbreitern sich zu sogenannten Minibändern. Das Material wird dann als Übergitterstruktur bezeichnet, weil die Minibänder aus einem Gitter entstehen, dessen Gitterkonstante größer ist als die des eigentlichen Atomgitters. Quantenschichten werden in den Abschnitten 17.1.7, 18.2.4 und 18.4.1 näher untersucht. Quantendrähte
Ein Halbleitermaterial, das die Form eines dünnen Drahts besitzt, der von einem Material mit einer größeren Bandlücke umgebenen ist, wird als Quantendraht bezeichnet. Der Draht wirkt als Potentialbarriere,
14.1 Energieniveaus
Abb. 14.12 Quantisierte Energien in einer Mehrfachquantenschichtstruktur aus AlGaAs/GaAs-Einkristallen. Die Schichtdicken können periodisch oder (wie hier gezeigt) beliebig sein.
Energie
Leitungsband
GaAs
AlGaAs
Valenzband 0
20
40
60
80
100
120 Entfernung/nm
die Elektronen (und Löcher) in den zwei transversalen Richtungen eng eingrenzt, nicht aber in der Richtung entlang der Achse des Drahts. Quantendrähte werden aus III-V- und II-VI-Halbleitern wie InP oder CdSe hergestellt; sie können rechteckige oder kreisförmige Querschnitte besitzen. Nanoröhrchen und Nanodrähte, die aus zahlreichen Materialien bestehen können, können sich wie Quantendrähte verhalten. Insbesondere zeigen Kohlenstoffnanoröhrchen, ausgedehnte zylindrische Kohlenstoffmoleküle mit Durchmessern von einigen Nanometern, bemerkenswerte Eigenschaften. Sie bestehen aus dünnen hohlen Röhren, die durch Vander-Waals-Kräfte zusammengehalten werden. Ein- oder mehrwandige Nanoröhrchen zeigen einzigartige optische, mechanische und elektrische Eigenschaften. Sie können sich je nach ihrer genauen Struktur wie Halbleiter oder wie hochleitende Metalle verhalten. In der Photonik gibt es zahlreiche Anwendungen für Kohlenstoff-Nanoröhrchen, die von Glühfäden für Glühlampen bis zu photoelektrischen Detektoren reichen. Quantendrähte werden in den Abschnitten 17.1.7 und 18.4.2 näher betrachtet. Quantenpunkte
Halbleiterteilchen mit Abmessungen im Bereich von 1 bis 50 nm werden als Quantenpunkte oder auch Nanokristalle bezeichnet. Sie können aus vielen unterschiedlichen Arten von Halbleitern und in vielen geometrischen Formen (z. B. Würfel, Kugeln, Halbkugeln, Scheiben oder Pyramiden) hergestellt werden und werden gewöhnlich in Halbleitermaterialien mit einer größeren Bandlücke oder in Gläser oder Polymere eingebettet. Manchmal werden sie durch Molekularstrahlepitaxie oder chemische Gasphasenabscheidung in Form von kleinen Scheiben hergestellt; in diesen Fällen ist die Bewegung der Elektronen auf eine Ebene eingeschränkt, was zu zweidimensionalen, atomartigen Schalenstrukturen führt, die denen der in Abschnitt 11.4.2 untersuchten Ringresonatoren ähneln. Sie können auch durch Elektronenstrahllithographie erzeugt werden, wobei ein Muster auf einen Halbleiterchip geätzt und darauf ein leitendes Metall abgeschieden wird. Quantenpunkte können leicht durch nasse Chemie in einem ge-
wöhnlichen Laborbehältern hergestellt werden. Selbstorganisierende Quantenpunkte mit Abmessungen von 10–50 nm können sich aus kolloidalen Nanokristallen bilden, die als flüssige Suspensionen oder in Kunststoffen dispergiert vertrieben werden. Durch chemische Synthese können nahezu perfekte kristalline Cluster hergestellt werden, die von einigen hundert bis zu mehreren zehntausend Atome enthalten und je nach Herstellungsbedingungen ganz unterschiedliche Formen annehmen können. Sie können entweder auf Substraten abgeschieden oder direkt in eigens für sie konstruierte Bauelemente integriert werden. Selbstorganisation kann auch durch epitaxiale Synthese erreicht werden, mit deren Hilfe man vorgespannte Quantenpunktschichten herstellen kann, die die Eigenschaften von Bauelementen positiv beeinflussen können. Auch zweidimensionale Arrays oder selbstorganisierende Stapel von Quantenpunkten sind ohne Weiteres herstellbar. Die Größen von Quantenpunkten und damit die Zahl der in ihnen enthaltenen Atome können über einen breiten Bereich verändert werden; ein GaAs-Würfel mit einer Kantenlänge von 10 nm enthält ungefähr 40 000 Atome. Alle Elektronen gehören dem Punkt als Ganzem an, die Zahl der Elektronen kann von einigen wenigen bis zu Millionen reichen. Die Energieniveaus eines Quantenpunkts sind die seiner Excitonen, d. h. die der Elektron-Loch-Paare innerhalb des Quantenpunkts. Wie bei Atomen ergibt sich aus der engen Eingrenzung der Elektronen eine Reihe von scharfen Energieniveaus; Quantenpunkte werden aus diesem Grund häufig auch als künstliche Atome bezeichnet. Im Unterschied zu Atomen besitzt ein aus einem gegebenen Material hergestellter Quantenpunkt jedoch die ungewöhnliche Eigenschaft, dass seine Energieniveaus stark von seiner Größe abhängen. Ganz ähnlich wie bei den Energieniveaus eines Elektrons in einer Quantenschicht (siehe Übung 17-5) geht die scharfe Eingrenzung in einem kleinen Quantenpunkt mit großen Abständen zwischen den Energieniveaus und folglich kleinen Wellenlängen der Übergänge zwischen ihnen einher. Die Wellenlänge eines emittierten Photons nimmt daher mit abnehmender Größe des Quantenpunkts ebenfalls ab. Die Farbe des von einem CdSe-Quantenpunkt nach
427
428
14 Licht und Materie
Photoanregung ausgesandten Lichts kann beispielsweise kontinuierlich von rot für einen Quantenpunkt mit einem Durchmesser von 5 nm bis violett für einen Punkt mit Durchmesser 1.5 nm abgestimmt werden. Die Wellenlänge der Photoanregung ist beliebig, so lange sie auf der kurzwelligen Seite der Emissionswellenlänge liegt. Quantenpunkte aus InP lumineszieren im nahen Infrarot, wohingegen solche aus InAs in dem für die faseroptische Kommunikation verwendeten Fenster zwischen 1300 und 1600 nm lumineszieren. Photoangeregte Si-Quantenpunkte strahlen ebenfalls über einen breiten Spektralbereich, der sich vom Infraroten bis ins Sichtbare ausdehnt (siehe Beispiel 17-3). Quantenpunkte können auch aus organischen Verbindungen hergestellt werden. Quantenpunkte, die mit einem Halbleiter mit einer größeren Bandlücke beschichtet sind, werden als „Kern-Mantel-Quantenpunkte“ bezeichnet; solche, die mit alternierenden Schichten von Halbleitern mit größeren und kleineren Bandlücken beschichtet sind, heißen „Quantenschicht-Quantenpunkte“. Derartige Schichtstrukturen können die Abstimmbarkeit und den Wirkungsgrad der Photolumineszenz der Nanostruktur verbessern. Regelmäßige Anordnungen von Quantenpunkten, die als Quantenpunkt-Festkörper bezeichnet werden, können durch mehrere Verfahren wie z. B. die Selbstorganisation von sphärischen Nanokristallen zu einer dicht gepackten Anordnung hergestellt werden. Ebenso wie Tunneleffekte in Übergittern von Mehrfachquantenschichten eine Rolle spielen, können sie auch in Quantenpunkt-Festkörpern vorkommen; man spricht dann von Nanokristall-Übergittern. Quantenpunktstrukturen sind manchmal so groß, dass sie an Elektroden angeschlossen werden können; sie können dann als photonische Miniaturbauelemente verwendet werden. Gezielt entworfene Anordnungen von Quantenpunkten unterschiedlicher Größe können Ströme führen und über breite oder maßgeschneiderte Wellenlängenbereiche betrieben werden. Quantenpunkte dienen als spektrale Marker in biologischen, kommerziellen und militärischen Anwendungen oder beim Nachweis von Fälschungen. Sie werden in vielen Anwendungen eingesetzt, z. B. in effizienten Lasern, breitbandigen LED, Einzelphotonenquellen, Speicherbauelementen, Photodetektoren, Solarzellen, Flachbildschirmen und Absorbern in Materialien, in denen ultraviolettes Licht herausgefiltert werden soll. In den Abschnitten 17.1.7 und 18.4.3 werden wir Quantenpunkte noch genauer untersuchen.
14.2 Die Besetzung von Energieniveaus Wie bereits erwähnt, erfährt jedes Atom oder Molekül in einer Ansammlung unaufhörlich zufällige Übergänge zwischen seinen verschiedenen Energieniveaus. Diese Übergänge werden durch die Regeln der statistischen Physik bestimmt. Der entscheidende Parameter sowohl für das mittlere Verhalten als auch für die Fluktuationen in der Besetzung der Energieniveaus ist die Temperatur.
14.2.1
Die Boltzmannverteilung
Wir betrachten eine Ansammlung von unterscheidbaren Objekten, z. B. Atome oder Moleküle, die ein verdünntes Gas bilden. Jedes Atom befindet sich in einem seiner erlaubten Energieniveaus E 1 , E 2 , … Wenn sich das System bei der Temperatur 𝑇 im thermischen Gleichgewicht befindet (d. h. wenn die Atome im Kontakt mit einem Wärmereservoir der Temperatur 𝑇 sind und ihre Bewegung einen stationären Zustand erreicht, in dem die mittleren Fluktuationen nicht von der Zeit abhängen), ist die Wahrscheinlichkeit 𝑃(E 𝑚 ), dass ein beliebiges Atom sich im Energieniveau E 𝑚 befindet, durch die Boltzmannverteilung gegeben, 𝑃(E 𝑚 ) ∝ exp(−E 𝑚 ∕k 𝑇) ,
𝑚 = 1, 2, 3, … ,
(14.7)
wobei k die Boltzmannkonstante ist. Die Proportio∑ nalitätskonstante wird so gewählt, dass 𝑚 𝑃(E 𝑚 ) = 1 ist. Die Besetzungswahrscheinlichkeit 𝑃(E 𝑚 ) ist eine exponentiell abnehmende Funktion von E 𝑚 , wie in Abb. 14.13 gezeigt. Den Ursprung der Boltzmannverteilung können wir verstehen, wenn wir ein Gesamtsystem aus vielen identischen Kopien eines Systems betrachten, die sich eine gegebene Gesamtenergie E teilen. Die Einzelsysteme sind von ihren Umgebungen isoliert, befinden sich aber im thermischen Gleichgewicht, d. h. sie können
m
m
3
3
2
2
1
1
Energieniveaus
Besetzungszahlen
P(
m)
Abb. 14.13 Die Boltzmannverteilung gibt die Wahrscheinlichkeit an, dass das Energieniveau E m eines beliebigen Atoms besetzt ist; sie ist eine exponentiell abnehmende Funktion von E m .
14.2 Die Besetzung von Energieniveaus
über ein Wärmebad der Temperatur 𝑇 Energie untereinander austauschen. Zwei mögliche Aufteilungen der Gesamtenergie werden als unterscheidbar betrachtet, wenn unterschiedliche Energiezustände an ihnen beteiligt sind, und alle denkbaren Aufteilungen der Gesamtenergie sollen mit gleicher Wahrscheinlichkeit vorkommen können. Wenn eines der Einzelsysteme einen großen Anteil der Gesamtenergie erhält, bleibt für die restlichen Systeme weniger Energie übrig und es gibt weniger mögliche Aufteilungen. Aus diesem Grund sind große Energien eines Einzelsystems weniger wahrscheinlich als kleine Energien. Eine quantitative Beschreibung erhalten wir aus der Betrachtung zweier Teilsysteme. Weil sie unabhängig sind, ist die Wahrscheinlichkeit, ein System mit der Energie E 1 und das andere mit dem Energie E 2 zu finden, gleich dem Produkt 𝑃(E 1 )𝑃(E 2 ). Wenn die Summe der Energien der zwei Teilsysteme auf dem Wert E 1 + E 2 festgehalten wird, muss 𝑃(E 1 )𝑃(E 1 ) eine Funktion von (E 1 + E 2 ) sein; diese Bedingung ist nur für eine Exponentialfunktion erfüllt. Die Gleichverteilungsenergie k𝑇 für die beiden Freiheitsgrade einer harmonischen Mode führt dann direkt zur Boltzmannverteilung. Wir betrachten die Boltzmannverteilung für eine große Zahl 𝑁 von Atomen. Wenn 𝑁𝑚 die Zahl der Atome ist, die das Energieniveau E 𝑚 besetzen, dann ist das Verhältnis 𝑁𝑚 ∕𝑁 ≈ 𝑃(E 𝑚 ). Wenn 𝑁1 Atome das Niveau 1 besetzen und 𝑁2 Atome ein höheres Niveau 2, ist das Besetzungszahlverhältnis im Mittel E − E1 𝑁2 = exp (− 2 ). 𝑁1 k𝑇
(14.8)
Diese Größe hängt von der Temperatur 𝑇 ab. Bei 𝑇 = 0 K befinden sich alle Atome im tiefsten Energieniveau (Grundzustand). Wenn die Temperatur zunimmt, steigen die Besetzungszahlen der höheren Energieniveaus. Im Gleichgewicht ist die mittlere Besetzung eines gegebenen Energieniveaus immer größer als dieses eines höher liegenden Niveaus. Diese Bedingung muss jedoch unter Nichtgleichgewichtsbedingungen nicht gelten; hier kann ein höheres Energieniveau eine größere mittlere Besetzungszahl haben als ein tieferes Niveau. Diese Situation wird als Besetzungsinversion bezeichnet; sie ist die Grundlage für den Betrieb von Lasern (siehe Kapitel 15 und 16). Wir hatten bisher angenommen, dass die Zuweisung eines Atoms zu einem Energieniveau eindeutig ist. Manchmal gibt es in Atomen oder Molekülen jedoch mehrere unterschiedliche Zustände derselben Energie (z. B. unterschiedliche Drehimpulszustände). Um eine solche Entartung zu berücksichtigen, müssen wir Gl. (14.8) in einer allgemeineren Form schreiben: g E − E1 𝑁2 ). = 2 exp (− 2 𝑁1 g1 k𝑇
(14.9)
Die Entartungsparameter g2 und g1 bezeichnen hier die Zahl von Zuständen in den Energieniveaus E 2 bzw. E 1 .
14.2.2 Die Fermi-Dirac-Verteilung Fermionen, die dem paulischen Ausschlussprinzip unterworfen sind, wie beispielsweise Elektronen mit überlappenden Wellenfunktionen in Mehrelektronenatomen oder Halbleitern, gehorchen der Fermi-Dirac-Statistik. Die Wahrscheinlichkeit, dass ein Zustand der Energie E besetzt ist, wird dann durch die Fermi-DiracVerteilung (oder Fermifunktion) beschrieben, 𝑓(E ) =
1 , exp [(E − E F )∕k 𝑇] + 1
(14.10)
wobei E F die Fermienergie ist (Abb. 14.14). Die Besetzungswahrscheinlichkeit nimmt mit zunehmenden E monoton ab und erreicht bei der Fermiener1 gie E = E F einen Wert von . Zustände, für die 𝑓(E ) = 1 2 ist, sind mit Sicherheit besetzt. Die Fermi-Dirac-Verteilung 𝑓(E ) ist keine Wahrscheinlichkeitsdichte, sondern eine Folge von Wahrscheinlichkeiten für unterschiedliche Werte von E , von denen jede Werte zwischen 0 und 1 annehmen kann. Für E ≫ E F (und E ≫ k𝑇) ist die Besetzungswahrscheinlichkeit klein und die Fermifunktion reduziert sich auf die Boltzmannverteilung, 𝑃(E ) ∝ exp(−E ∕k 𝑇) ,
(14.11)
wie in Abb. 14.14 dargestellt. Diese Bedingung ist für Valenzelektronen in den äußeren Schalen eines Atoms im Allgemeinen erfüllt, daher werden Energieniveaus, die an optischen Übergängen beteiligt sind, häufig durch die Boltzmannverteilung beschrieben. Die Fermifunktion wird in Kapitel 17 ausführlicher besprochen.
Boltzmann P( m) F
Fermi-Dirac f( )
0
1/2
1
Abb. 14.14 Die Fermi-Dirac-Verteilung f (E ) (auf der Abszisse dargestellt) beschreibt die Wahrscheinlichkeit, dass ein Zustand mit der Energie E besetzt ist. Sie gilt für Systeme aus Teilchen mit überlappenden Wellenfunktionen, für die das paulische Ausschlussprinzip gilt. Für E ≫ E F wird die Fermi-Dirac-Verteilung gut durch die Boltzmannverteilung P(E m ) angenähert.
429
430
14 Licht und Materie
Bosonen wie z. B. Photonen (Abschnitt 13.2.3) oder Atome in einem Bose-Einstein-Kondensat (Abschnitt 14.3.6) gehorchen der Bose-Einstein-Statistik.
14.3 Die Wechselwirkung von Photonen mit Atomen 14.3.1 Die Wechselwirkung von Einmodenlicht mit einem Atom Wie aus der Atomtheorie bekannt ist, kann ein Atom ein Photon emittieren (erzeugen) oder absorbieren (vernichten), indem es unter Beachtung der Energieerhaltung nach oben oder nach unten gerichtete Übergänge zwischen seinen Energieniveaus vollzieht. In diesem Abschnitt wollen wir die Gesetze beschreiben, nach denen diese Prozesse ablaufen. Die Wechselwirkungen von Photonen mit Elektronen und Löchern in Halbleitern werden in Abschnitt 17.2 betrachtet. Die Wechselwirkung zwischen einem Atom und einer elektromagnetischen Mode Wir betrachten die Energieniveaus E 1 und E 2 eines
Atoms in einem optischen Resonator mit dem Volumen 𝑉, in dem mehrere elektromagnetische Moden existieren können. Wir interessieren uns besonders für die Wechselwirkung zwischen dem Atom und den Photonen einer vorgegebenen Strahlungsmode der Frequenz 𝜈 ≈ 𝜈0 mit ℎ𝜈0 = E 2 − E 1 , da Photonen dieser Energie dem Unterschied der atomaren Energieniveaus entsprechen. Solche Wechselwirkungen werden formal durch die Quantenelektrodynamik untersucht. Die entscheidenden Ergebnisse werden im Folgenden ohne Beweis präsentiert. Es zeigt sich, dass es drei verschiedene Arten der Wechselwirkung gibt: spontane Emission, Absorption und induzierte Emission. Spontane Emission
Wenn das Atom zu Beginn im oberen Energieniveau vorliegt, kann es spontan in das niedrigere Energieniveau übergehen und seine Energie in Form eines Photons (Abb. 14.15) abgeben. Die Energie ℎ𝜈 des Photons 2
hν 1
Abb. 14.15 Die spontane Emission eines Photons in die Mode der Frequenz 𝜈 durch einen Übergang des Atoms von Energieniveau 2 zu Energieniveau 1. Die Photonenenergie ist h𝜈 ≈ E 2 − E 1 .
wird zu der Energie der elektromagnetischen Mode hinzugefügt. Dieser Prozess wird spontane Emission genannt, weil der Übergang nicht von der Zahl von Photonen abhängt, die bereits in der Mode enthalten sind. In einem Volumen 𝑉 hängt die Wahrscheinlichkeitsdichte oder Geschwindigkeit dieses spontanen Übergangs auf eine Weise von 𝜈 ab, die diesen atomaren Übergang charakterisiert, 𝑝sp =
𝑐 𝜎(𝜈) . 𝑉
(14.12)
Die Funktion 𝜎(𝜈) ist eine Funktion von 𝜈 um die Resonanzfrequenz 𝜈0 des Atoms; sie wird als Wirkungsquerschnitt bezeichnet. Die Bedeutung dieser Benennung wird später deutlich werden, aber offensichtlich hat diese Funktion die Dimension cm2 (da 𝑝sp die Dimension s−1 hat). Im Prinzip kann 𝜎(𝜈) aus der Schrödingergleichung bestimmt werden; die Berechnungen sind in der Regel jedoch so komplex, dass 𝜎(𝜈) meist experimentell bestimmt wird. Gleichung (14.12) gilt separat für jede Mode, wobei der Querschnitt durch 𝜎 = 𝜎max cos2 𝜃
(14.13)
gegeben ist. 𝜃 ist der Winkel zwischen dem Dipolmoment des Atoms und der Feldrichtung der Mode; der maximale Querschnitt 𝜎max wird erreicht, wenn Dipolmoment und Feld parallel sind. Der Ausdruck „Wahrscheinlichkeitsdichte“ bedeutet, dass die Wahrscheinlichkeit einer Emission in dem Zeitintervall zwischen 𝑡 und 𝑡 + Δ𝑡 gleich 𝑝sp Δ𝑡 ist. Weil es eine Wahrscheinlichkeitsdichte ist, kann 𝑝sp einen numerischen Wert größer 1s−1 annehmen, obwohl 𝑝sp Δ𝑡 natürlich stets kleiner als eins sein muss. Wenn es eine große Zahl 𝑁 solcher Atome gibt, wird ein Anteil von ungefähr Δ𝑁 = (𝑝sp Δ𝑡)𝑁 Atomen den Übergang innerhalb des Zeitintervalls Δ𝑡 vollziehen. Wir können daher d𝑁∕ d𝑡 = −𝑝sp 𝑁 schreiben, sodass die Zahl 𝑁(𝑡) = 𝑁(0) exp(−𝑝sp 𝑡) von Atomen mit der Zeitkonstante 1∕𝑝sp exponentiell abnimmt, wie Abb. 14.16 zeigt. Absorption
Wenn das Atom am Anfang im tieferen Energieniveau vorliegt und die Strahlungsmode ein Photon enthält, kann das Photon vernichtet werden und das Atom gleichzeitig in das obere Energieniveau übergehen (Abb. 14.17). Dieser Prozess, der durch das Photon induziert wird, wird Absorption genannt. Es kann nur auftreten, wenn die Mode ein Photon enthält. Die Wahrscheinlichkeitsdichte für die Absorption eines Photons aus einer gegebenen Mode der Frequenz 𝜈 in einem Volumen 𝑉 wird durch dasselbe Gesetz bestimmt, das auch die spontane Emission in diese Mode
14.3 Die Wechselwirkung von Photonen mit Atomen
N(t)
2
hν
hν
N(0)
hν
1
Abb. 14.18 Die induzierte Emission ist ein Prozess, in dem ein Photon der Energie h𝜈 die Emission eines identischen Photons aus einem Atom induziert, wobei es einen Übergang in einen tieferen Zustand vollzieht. 1 psp
t
Abb. 14.16 Die spontane Emission in eine einzelne Mode bewirkt eine exponentielle Abnahme der Zahl aufgeregter Atome mit der Zeitkonstante 1∕psp . 2
𝑝ind =
𝑐 𝜎(𝜈) . 𝑉
(14.16)
Wenn die Mode ursprünglich n Photonen enthält, ist die Wahrscheinlichkeitsdichte für die induzierte Emission eines Photons durch das Atom wie im Fall der Absorption
hν 1
Abb. 14.17 Die Absorption eines Photons der Energie h𝜈 führt zu einem nach oben gerichteten Übergang des Atoms von Energieniveau 1 nach Energieniveau 2.
bestimmt, 𝑝Ab =
Gesetz beschrieben wie für spontane Emission und Absorption,
𝑐 𝜎(𝜈) . 𝑉
(14.14)
Wenn die Mode jedoch n Photonen enthält, dann ist die Wahrscheinlichkeitsdichte für die Absorption eines Photons durch das Atom n-mal so groß, da die Ereignisse sich gegenseitig ausschließen, d. h., 𝑐 𝑃Ab = n 𝜎(𝜈) . 𝑉
(14.15)
Induzierte Emission
Wenn sich das Atom im oberen Energieniveau befindet und die Mode ein Photon enthält, kann das Atom auch veranlasst werden, ein weiteres Photon in dieselbe Mode auszustrahlen. Dieser Prozess wird als induzierte Emission bezeichnet; er beschreibt die Umkehrung der Absorption. Die Anwesenheit eines Photons in einer Mode mit gegebener Frequenz, Ausbreitungsrichtung und Polarisation induziert die Emission eines Duplikatphotons (eines „Klons“) mit genau denselben Eigenschaften wie das Original (Abb. 14.18). Diese Photonenverstärkung ist die Grundlage für den Betrieb von Laserverstärkern und Lasern, wie in den folgenden Kapiteln erläutert wird. Die Wahrscheinlichkeitsdichte 𝑝ind , dass dieser Prozess in einem Volumen 𝑉 auftritt, wird durch dasselbe
𝑐 𝑃ind = n 𝜎(𝜈) . 𝑉
(14.17)
Wie wir in Abschnnitt 15.2.2 sehen werden, können sich die effektiven Übergangsquerschnitte 𝜎(𝜈) für die Absorption und die induzierte Emission unter bestimmten Bedingungen voneinander unterscheiden; in diesen Fällen schreiben wir sie als 𝜎Ab (𝜈) bzw. 𝜎ind (𝜈) und es gilt 𝑃ind ≠ 𝑃Ab . Wenn die beiden Querschnitte jedoch gleich sind, 𝑃ind = 𝑃Ab , verwenden wir die allgemeine Schreibweise W ind , um die Wahrscheinlichkeitsdichte der induzierten Emission und Absorption zu bezeichnen. Weil spontane Emission zusätzlich zur induzierten Emission auftritt, ist die gesamte Wahrscheinlichkeitsdichte, dass das Atom ein Photon in die Mode ausstrahlt, durch 𝑝sp + 𝑃ind = (n + 1)(𝑐∕𝑉)𝜎(𝜈) gegeben. Von einem quantenelektrodynamischen Standpunkt aus kann die spontane Emission als induzierte Emission aufgefasst werden, die durch die Nullpunktsfluktuationen der Mode hervorgerufen wird (siehe Abschnitt 13.1.2). Weil es für die Absorption keine Nullpunktsenergie gibt, ist 𝑃Ab proportional zu n und nicht zu (n + 1). Die drei möglichen Wechselwirkungen zwischen einem Atom und einer Strahlungsmode (spontane Emission, Absorption und induzierte Emission) gehorchen den zuvor angegebenen grundlegenden Beziehungen. Sie sind in Ergänzung zu den in Kapitel 13 beschriebenen Regeln der Photonenoptik die Gesetze für die Wechselwirkung zwischen Photonen und Atomen, insbesondere im Kontext der Laserphysik. Als Nächstes wollen wir die Eigenschaften und die Folgen dieser einfachen Beziehungen im Detail untersuchen.
431
432
14 Licht und Materie
Abb. 14.19 Der Wirkungsquerschnitt 𝜎(𝜈) und die Linienformfunktion g(𝜈).
σ (ν)
g(ν)
σ0
Δν
Δν
Fläche = S
Fläche = 1
ν0
ν
ν
ν0
Linienformfunktion und Oszillatorstärke
Der Wirkungsquerschnitt 𝜎(𝜈) charakterisiert die Wechselwirkung des Atoms mit der Strahlung. Seine Fläche ∞
𝑆 = ∫ 𝜎(𝜈) d𝜈
(14.18)
Atom
0
mit der Dimension cm2 Hz wird Oszillatorstärke genannt und beschreibt die Stärke der Wechselwirkung. Ihre Form bestimmt die relative Stärke der Wechselwirkung mit Photonen unterschiedlicher Frequenzen. Die Form (das Profil) von 𝜎(𝜈) lässt sich leicht von seiner Stärke abtrennen, indem man eine normierte Funktion 𝑔(𝜈) = 𝜎(𝜈)∕𝑆 definiert, die als Linienformfunktion bekannt ist. Sie hat die Dimension Hz−1 und die Flä∞ che eins: ∫0 𝑔(𝜈) d𝜈 = 1. Der Wirkungsquerschnitt kann dann gemäß 𝜎(𝜈) = 𝑆𝑔(𝜈)
(14.19)
durch seine Stärke und sein Profil ausgedrückt werden. Die Linienformfunktion 𝑔(𝜈) hat ein Maximum bei der Resonanzfrequenz 𝜈0 , wo 𝜎(𝜈) am größten ist, und fällt schnell, wenn 𝜈 von 𝜈0 abweicht. Übergänge sind daher für Photonen der Frequenz 𝜈 ≈ 𝜈0 am wahrscheinlichsten. Die Breite der Funktion 𝑔(𝜈) ist als Linienbreite des Übergangs bekannt. Die Linienbreite Δ𝜈 wird gewöhnlich als die Breite der Funktion 𝑔(𝜈) bei der Hälfte ihres Maximalwerts (Halbwertsbreite) definiert (siehe Abschnitt A.2). Da die Fläche von 𝑔(𝜈) eins ist, ist ihre Breite umgekehrt proportional zu ihrem Maximalwert, Δ𝜈 ∝ 1∕𝑔(𝜈0 ) .
(14.20)
Es ist auch nützlich, einen maximalen Wirkungsquerschnitt bei der Resonanzfrequenz zu definieren, 𝜎0 = 𝜎(𝜈0 ). Die Funktion 𝜎(𝜈) wird dann durch ihre Höhe 𝜎0 , ihre Breite Δ𝜈, ihre Fläche 𝑆 und ihr Profil 𝑔(𝜈) charakterisiert, wie in Abb. 14.19 dargestellt.
14.3.2
Spontane Emission
Spontane Gesamtemission in alle Moden
Gleichung (14.12) liefert die Wahrscheinlichkeitsdichte 𝑝sp für die spontane Emission in eine spezifische Mode
optische Moden
Abb. 14.20 Ein Atom kann spontan ein Photon in eine (aber nur eine) beliebige der vielen optischen Moden mit der Frequenz 𝜈 ≈ 𝜈0 emittieren.
der Frequenz 𝜈 (ohne Rücksicht darauf, ob die Mode bereits Photonen enthält). Wie Gl. (11.83) zeigt, nimmt die Dichte der Moden in einem dreidimensionalen Volumen wie M(𝜈) = 8π 𝜈2 ∕𝑐3 quadratisch mit der Frequenz zu. Diese Größe gibt eine Näherung für die Zahl der Moden der Frequenz 𝜈 pro Volumen- und Bandbreiteneinheit, sofern die Zahl von Moden hinreichend groß ist, sodass eine kontinuierliche Näherung für ihre Zahl verwendet werden kann. Ein Atom kann spontan ein Photon der Frequenz 𝜈 in eine beliebige dieser Moden emittieren, wie in Abb. 14.20 schematisch gezeigt ist. Die Wahrscheinlichkeitsdichte für die spontane Emission in alle Moden ist daher durch die Wahrscheinlichkeitsdichte für die spontane Emission in jede einzelne Mode gegeben, gewichtet mit der Modendichte. Da Moden bei jeder Frequenz eine isotrope Richtungsverteilung mit jeweils zwei Polarisationen besitzen, müssen wir den mittleren Wirkungsquerschnitt 𝜎(𝜈) bestimmen. Wenn 𝜃 der Winkel zwischen dem Dipolmoment des Atoms und der Feldrichtung ist, führt Gl. (14.13) zu 1
𝜎(𝜈) = 𝜎max ,
(14.21)
3
1
da ⟨cos2 𝜃⟩ = ist, wobei ⟨⋅⟩ einen Mittelwert im drei3 dimensionalen Raum bezeichnet. Die gesamte Wahrscheinlichkeitsdichte der spontanen Emission wird daher ∞
𝑃sp = ∫ 0
[𝑐
𝑉
∞
] 𝜎(𝜈) [𝑉 M(𝜈)] d𝜈 = 𝑐 ∫ 𝜎(𝜈)M(𝜈) d𝜈 . (14.22) 0
14.3 Die Wechselwirkung von Photonen mit Atomen
Weil die Funktion 𝜎(𝜈) ein scharfes Maximum besitzt, ist sie im Vergleich mit der quadratischen Funktion M(𝜈) schmal. Da 𝜎(𝜈) bei 𝜈0 zentriert ist, kann M(𝜈) näherungsweise als konstant gleich M(𝜈0 ) angenommen und vor das Integral gezogen werden. Die Wahrscheinlichkeitsdichte der spontanen Emission eines Photons in eine beliebige Mode ist daher 𝑃sp = M(𝜈0 )𝑐𝑆 =
8π 𝜈02 𝑆 𝑐2
,=
8π 𝑆 , 𝜆2
1 𝑡sp
𝜆2 8π 𝑡sp
(14.24)
(14.25)
schreiben, womit wir die Oszillatorstärke experimentell aus einer Messung der spontanen Lebensdauer 𝑡sp bestimmen können. Gleichung (14.25) ist deshalb nützlich, weil eine analytische Berechnung von 𝑆 genaue Kenntnisse über das quantenmechanische Verhalten des Systems erfordern würde, die nicht immer verfügbar sind. Übung 14-1: Die Frequenz spontan emittierter Photonen
Zeigen Sie, dass die Wahrscheinlichkeitsdichte für die spontane Emission eines Photon der Frequenz zwischen 𝜈 und 𝜈 + d𝜈 aus einem Atom durch 𝑃sp (𝜈) d𝜈 = (1∕𝑡sp )𝑔(𝜈) d𝜈 gegeben ist. Erklären Sie, warum das Spektrum der spontanen Emission aus einem Atom proportional zu seiner Linienformfunktion 𝑔(𝜈) ist, nachdem eine große Zahl von Photonen emittiert wurde.
Aus Gl. (14.25) und der Beziehung 𝜎(𝜈) = 𝑆𝑔(𝜈) folgt, dass der mittlere Wirkungsquerschnitt mit der spontanen Lebensdauer und der Linienformfunktion über die Beziehung 𝜆2 𝑔(𝜈) 8π 𝑡sp
(14.27)
Weil 𝑔(𝜈0 ) nach Gl. (14.20) umgekehrt proportional zu Δ𝜈 ist, ist der maximale Wirkungsquerschnitt 𝜎0 für einen gegebenen Wert von 𝑡sp umgekehrt proportional zur Linienbreite Δ𝜈.
Durch monochromatisches Licht induzierte Übergänge
Wir betrachten jetzt die Wechselwirkung von Einmodenlicht mit einem Atom, das von einem Strom von Photonen getroffen wird, im Gegensatz zu der zuvor betrachteten Situation, wo es sich in einem Resonator mit dem Volumen 𝑉 befand. Dazu lassen wir monochromatisches Licht der Frequenz 𝜈, der Intensität 𝐼, und der mittleren Photonenflussdichte [Photonen pro (cm2 s)] 𝜙=
𝐼 ℎ𝜈
(14.28)
mit einem Atom wechselwirken, dessen Resonanzfrequenz 𝜈0 ist. Wir wollen die Wahrscheinlichkeitsdichten der induzierten Emission und Absorption, W ind ≡ 𝑃Ab = 𝑃ind für diese Anordnung bestimmen. Die Zahl n der an der Wechselwirkung beteiligten Photonen können wir bestimmen, indem wir ein Volumen in der Form eines Zylinder mit der Grundfläche A, der Höhe 𝑐 × 1 s und dem Volumen 𝑉 = 𝑐A konstruieren. Die Achse des Zylinders ist parallel zu k, der Ausbreitungsrichtung des Lichts. Der Photonenfluss durch die Grundfläche des Zylinders ist 𝛷 = 𝜙A (Photonen/s). Weil die Photonen sich mit der Lichtgeschwindigkeit 𝑐 ausbreiten, durchqueren alle Photonen innerhalb des Zylinders seine Grundfläche innerhalb einer Sekunde. Daraus folgt, dass der Zylinder zu jedem Zeitpunkt n = 𝜙A = 𝜙𝑉∕𝑐 Photonen enthält; folglich ist 𝜙=n
𝑐 . 𝑉
(14.29)
Um W ind zu bestimmen, setzen wir Gl. (14.29) in Gl. (14.15) ein und erhalten
Die Beziehung zwischen Wirkungsquerschnitt und spontaner Lebensdauer
𝜎(𝜈) =
𝜆2 𝑔(𝜈0 ) . 8π 𝑡sp
14.3.3 Induzierte Emission und Absorption
unabhängig vom Volumen 𝑉. Damit können wir 𝑆 als 𝑆=
𝜎0 ≡ 𝜎(𝜈0 ) =
(14.23)
wobei 𝜆 = 𝑐∕𝜈0 die Wellenlänge des Lichts in dem Medi∞ um und 𝑆 = ∫0 𝜎(𝜈) d𝜈 ist. Wir definieren eine Zeitkonstante 𝑡sp , die spontane Lebensdauer des Übergangs 2 → 1, sodass 1∕𝑡sp ≡ 𝑃sp = M(𝜈0 )𝑐𝑆 ist. Damit wird 𝑃sp =
bei der Mittenfrequenz 𝜈0 ist daher
(14.26)
zusammenhängt, die als Füchtbauer-Ladenburg-Gleichung bekannt ist. Der mittlere Wirkungsquerschnitt
W ind = 𝜙𝜎(𝜈) .
(14.30)
Offensichtlich ist 𝜎(𝜈) die Proportionalitätskonstante zwischen der Wahrscheinlichkeitsdichte eines induzierten Übergangs und der Flussdichte der Photonen. Der Name „Wirkungsquerschnitt“ ist daher treffend: 𝜙 ist der Photonenfluss pro cm2 , 𝜎(𝜈) ist die effektive Querschnittsfläche des Atoms (in cm2 ) und 𝜙𝜎(𝜈) ist der Photonenfluss, den das Atom für die Absorption oder induzierte Emission „einfangen“ kann.
433
434
14 Licht und Materie
Aus den Gln. (14.15), (14.17) und (14.20) wird deutlich, dass die Wahrscheinlichkeitsdichten für Absorption, induzierte Emission und spontane Emission alle proportional zu 𝜎(𝜈) sind. Wie oben diskutiert, kann induzierte Emission nur in Moden auftreten, die bereits Photonen enthalten. Obwohl der in Gl. (14.26) für 𝜎(𝜈) angegebene Ausdruck für die spontane Emission in mehrere Moden abgeleitet wurde, ist es zweckmäßig, ihn auch in Verbindung mit Gl. (14.27) zu verwenden, um die Wahrscheinlichkeitsdichte für induzierte Übergänge zu bestimmen, da 𝑡sp experimentell leicht bestimmt werden kann. Die Verwendung von 𝜎(𝜈) anstelle von 𝜎(𝜈) in Gl. (14.26) ergibt sich aus der Mittelung über den Winkel zwischen dem Dipolmoment des Atoms und der Feldrichtung [siehe Gl. (14.14) und (14.19)]. Wenn eine solche Mittelung nicht erforderlich ist, wie im Fall einer induzierten Emission in eine definierte Mode unter einem festen Winkel 𝜃, werden wir 𝜎(𝜈) und 𝜎0 anstelle von 𝜎(𝜈) und 𝜎0 verwenden. Eine ggf. erforderliche Änderung in 𝜎(𝜈) aufgrund einer Mittelung für einen spezifischen induzierten Übergänge kann einfach durch eine Modifikation von 𝑡sp erreicht werden, was dann als effektive spontane Lebensdauer bezeichnet wird. Der Einfachheit halber werden wir von nun an nicht mehr zwischen 𝑡sp für die spontane Emission und ihrem effektiven Wert für induzierte Emission unterscheiden.
𝜚(𝜈0 )∕ℎ𝜈0 ersetzen und erhalten ∞
W ind
𝜚(𝜈0 ) 𝜚(𝜈0 ) = 𝑐 ∫ 𝜎(𝜈) d𝜈 = 𝑐𝑆 . ℎ𝜈0 ℎ𝜈0
(14.32)
0
Mit Gl. (14.25) bekommen wir dann W ind =
𝜆3 𝜚(𝜈0 ) , 8π ℎ𝑡sp
(14.33)
wobei 𝜆 = 𝑐∕𝜈0 die Wellenlänge in dem Medium bei der Mittenfrequenz 𝜈0 ist. Mit der Definition 𝜆3 (14.34) 𝜚(𝜈 ) , 8π ℎ 0 für die mittlere Zahl von Photonen je Mode erhalten wir Gl. (14.33) in der zweckmäßigen Form n=
W ind =
n
𝑡sp
.
(14.35)
Die Interpretation von n als mittlere Zahl von Photonen pro Mode folgt aus dem Verhältnis W ind
𝑃sp
=
𝜆 3 𝜚(𝜈0 ) 𝜚(𝜈0 ) 1 = ; 8π ℎ𝑡sp M(𝜈0 )𝑐𝑆 ℎ𝜈0 M(𝜈0 )
(14.36)
die Größe 𝜚(𝜈0 )∕ℎ𝜈0 bezeichnet die mittlere Zahl von Photonen pro Volumeneinheit in der Umgebung der Frequenz 𝜈0 , während M(𝜈0 ) die Zahl von Moden pro Volumeneinheit in der Umgebung von 𝜈0 ist. Die Wahrscheinlichkeitsdichte W ind ist damit um einen Faktor n größer als die der spontanen Emission, da jede Mode im Mittel n Photonen enthält.
Durch breitbandiges Licht induzierte Übergänge
Als Nächstes betrachten wir ein Atom in einem Volumen 𝑉, das polychromatisches Vielmodenlicht mit der spektralen Energiedichte 𝜚(𝜈) enthält (Energie pro Volumen- und Bandbreiteneinheit), das im Vergleich zur Linienbreite des Atoms breitbandig ist. Die mittlere Zahl von Photonen im Frequenzband zwischen 𝜈 und 𝜈 + d𝜈 ist 𝜚(𝜈)𝑉 d𝜈∕ℎ𝜈; jedes dieser Photonen hat eine Wahrscheinlichkeitsdichte (𝑐∕𝑉)𝜎(𝜈), einen Übergang in dem Atom zu induzieren. Da wir die Moden wie bei der spontanen Emission als räumlich isotrop verteilt annehmen und jede Mode in zwei Polarisationen existiert, folgt für die Gesamtwahrscheinlichkeit der Absorption oder induzierten Emission ∞
W ind = ∫
] 𝜚(𝜈)𝑉 [ 𝑐 𝜎(𝜈) d𝜈 . 𝑉 ℎ𝜈
(14.31)
0
Da die Strahlung breitbandig ist, ändert sich die Funktion 𝜚(𝜈) langsam im Vergleich zu dem steil ansteigenden und abfallenden Wirkungsquerschnitt 𝜎(𝜈). Wir können daher 𝜚(𝜈)∕ℎ𝜈 unter dem Integral durch
Die Einsteinkoeffizienten 𝔸 und 𝔹
Einstein wusste nichts von Gl. (14.33), führte aber trotzdem eine wichtige Analyse des Energieaustauschs zwischen Atomen und Strahlung durch, die ihm erlaubte, allgemeine Ausdrücke für die Wahrscheinlichkeitsdichten von spontanen und induzierten Übergängen zu erhalten. Unter der Annahme, dass die Atome im thermischen Gleichgewicht mit breitbandiger Strahlung der spektralen Energiedichte 𝜚(𝜈) wechselwirken, erhielt er die folgenden Ausdrücke: 𝑃sp = 𝔸 , W ind = 𝔹𝜚(𝜈0 ) .
(14.37) (14.38)
Die Konstanten 𝔸 und 𝔹 sind als Einsteinkoeffizienten bekannt. Der Vergleich mit Gl. (14.24) und (14.33) liefert die folgenden Ausdrücke für die Koeffizienten 𝔸 und 𝔹: 𝔸=
1 , 𝑡sp
(14.39)
𝔹=
𝜆3 . 8π ℎ𝑡sp
(14.40)
14.3 Die Wechselwirkung von Photonen mit Atomen
Ihr Verhältnis ist 𝜆3 𝔹 = . 𝔸 8π ℎ
(14.41)
Die Beziehung zwischen 𝔸 und 𝔹 ist eine Folge der mikroskopischen (im Gegensatz zu den makroskopischen) Wahrscheinlichkeitsgesetze für die Wechselwirkung zwischen einem Atom und den Photonen einer Mode. Wir werden in Abschnitt 14.4 eine Analyse ähnlich der von Einstein durchgeführten präsentieren. Beispiel 14-1: Vergleich der Geschwindigkeiten von spontaner und induzierter Emission
Während die Rate der spontanen Emission für ein Atom im oberen Zustand konstant 𝔸 = 1∕𝑡sp ist, ist die Rate 𝔹𝜚(𝜈0 ) der induzierten Emission in Gegenwart von breitbandigem Licht proportional zur spektralen Energiedichte 𝜚(𝜈0 ) des Lichts. Die beiden Geschwindigkeiten sind gleich, wenn 𝜚(𝜈0 ) = 𝔸∕𝔹 = 8π ℎ∕𝜆 2 ist; für größere Werte der spektralen Energiedichte übersteigt die Rate der induzierten Emission die der spontanen Emission. Für 𝜆 = 1 μm ist zum Beispiel 𝔸∕𝔹 = 1.66 × 10−14 J∕(m3 Hz). Das entspricht einer spektralen Intensitätsdichte 𝑐𝜚(𝜈0 ) ≈ 5 × 10−6 W∕(m2 Hz) im Vakuum. Für eine Linienbreite Δ𝜈 = 107 Hz ist die optische Intensität, bei der die Geschwindigkeit der induzierten Emission gleich der der spontanen Emission ist, daher etwa 50 W∕m2 oder 5 mW∕cm2 .
Zusammenfassung
Ein atomarer Übergang kann durch seine Resonanzfrequenz 𝜈0 = (E 2 − E 1 )∕ℎ, seine spontane Lebensdauer 𝑡sp und seine Linienformfunktion 𝑔(𝜈) mit der Linienbreite Δ𝜈 charakterisiert werden. Der mittlere Wirkungsquerschnitt ist 𝜎(𝜈) = 𝑆𝑔(𝜈) =
𝜆2 𝑔(𝜈). 8π 𝑡sp
(14.26)
Spontane Emission:
• Wenn das Atom im oberen Niveau vorliegt und sich in einem Volumen 𝑉 befindet, ist die Wahrscheinlichkeitsdichte (pro Sekunde) einer spontanen Emission in eine vorgegebene Mode der Frequenz 𝜈 𝑝sp =
𝑐 𝜎(𝜈). 𝑉
(14.12)
• Die Wahrscheinlichkeitsdichte der spontanen Emission in eine beliebige der verfügbaren Moden ist 𝑃sp =
8π 𝑆 1 = . 𝑡sp 𝜆2
(14.24)
• Die Wahrscheinlichkeitsdichte einer Emission in Moden im Frequenzband zwischen 𝜈 und 𝜈 + d𝜈 ist 𝑃sp d𝜈 = (1∕𝑡sp )𝑔(𝜈) d𝜈. Induzierte Emission und Absorption:
• Wenn das Atom im oberen Niveau vorliegt und eine Strahlungsmode n Photonen der Frequenz 𝜈 enthält, ist die Wahrscheinlichkeitsdichte einer Emission in diese Mode W ind = n
𝑐 𝜎(𝜈). 𝑉
(14.17)
Wenn das Atom stattdessen im unteren Niveau vorliegt und eine Mode n Photonen enthält, ist die Wahrscheinlichkeit der Absorption eines Photons aus dieser Mode ebenfalls durch Gl. (14.17) gegeben. • Wenn das Atom sich nicht in einem Resonator befindet, sondern von einem monochromatischen Lichtstrahl der Frequenz 𝜈 mit der mittleren Flussdichte 𝜙 der Photonen (Photonen pro Sekunde pro Flächeneinheit) getroffen wird, ist die Wahrscheinlichkeitsdichte der induzierten Emission (wenn das Atom im oberen Niveau vorliegt) bzw. Absorption (wenn das Atom sich im tieferen Niveau befindet) W ind = 𝜙𝜎(𝜈).
(14.30)
• Wenn das auf das Atom treffende Licht polychromatisch ist, aber schmalbandig verglichen mit der Linienbreite des Atoms, und eine mittlere spektrale Flussdichte 𝜙𝜈 der Photonen besitzt (Photonen pro Sekunde pro Flächen- und Frequenzeinheit), ist die Wahrscheinlichkeitsdichte der induzierten Emission/Absorption W ind = ∫ 𝜙𝜈 𝜎(𝜈) d𝜈 .
(14.42)
• Wenn das auf das Atom treffende Licht die spektrale Energiedichte 𝜚(𝜈) hat, die im Vergleich zur Linienbreite des Atoms breitbandig ist, ist die Wahrscheinlichkeitsdichte der induzierten Emission/Absorption W ind = 𝔹𝜚(𝜈0 ),
(14.38)
wobei 𝔹 = 𝜆 3 ∕8π ℎ𝑡sp der Einsteinkoeffizient 𝔹 ist. In all diesen Gleichungen ist 𝑐 = 𝑐0 ∕𝑛 die Geschwindigkeit des Lichts und 𝜆 = 𝜆0 ∕𝑛 die Wellenlänge des Lichts im Medium des Atoms, dessen Brechungsindex 𝑛 ist.
435
436
14 Licht und Materie
14.3.4
Linienverbreiterung
Weil die Linienformfunktion 𝑔(𝜈) für Wechselwirkungen zwischen Atomen und Photonen eine wichtige Rolle spielt, widmen wir diesen Abschnitt einer kurzen Diskussion ihres Ursprungs. Ein und dieselbe Linienformfunktion beschreibt spontane Emission, Absorption und induzierte Emission. Lebensdauerverbreiterung
Übergänge zwischen Energieniveaus können sowohl strahlend als auch nichtstrahlend oder strahlungslos (ohne Beteiligung von Strahlung) ablaufen. Strahlende Übergänge bewirken die Absorption oder Emission von Photonen. Nichtstrahlende Übergänge erlauben Energieübertragung durch Mechanismen wie Gitterschwingungen, inelastische Stöße zwischen den Atomen oder inelastische Stöße mit den Wänden des Behälters. Jedes atomare Energieniveau hat eine Lebensdauer 𝜏, die gleich dem Kehrwert der Geschwindigkeit ist, mit der seine Besetzung strahlend oder nichtstrahlend abgebaut wird. Die Lebensdauer 𝜏2 des in Abb. 14.15 gezeigten Energieniveaus 2 ist der Kehrwert der Geschwindigkeit, mit der die Besetzung dieses Niveaus durch strahlende oder nichtstrahlende Prozesse in Niveau 1 und alle anderen tieferen Energieniveaus (die nicht in der Abbildung gezeigt sind) abklingt. Da 1∕𝑡sp die Abklingrate von Niveau 2 in Niveau 1 aufgrund von strahlenden Prozessen ist, muss die gesamte Abklingrate 1∕𝜏2 größer sein, d. h. 1∕𝜏2 ≥ 1∕𝑡sp , entsprechend einer kürzeren Zerfallszeit, 𝜏2 ≤ 𝑡sp . Die Lebensdauer 𝜏1 des Niveaus 1 wird entsprechend definiert. Wenn Niveau 1 das tiefste erlaubte Energieniveau (der Grundzustand) ist, gilt offensichtlich 𝜏1 = ∞. Die Lebensdauerverbreiterung ist letztlich eine Auswirkung der Fouriertransformation. Die Lebensdauer 𝜏 eines Energieniveaus ist mit der zeitlichen Unbestimmtheit der Besetzung dieses Niveaus verknüpft. Wie in Abschnitt A.1 gezeigt wird, ist die Fouriertransformierte einer mit der Zeitkonstante 𝜏 exponentiell abklingenden harmonischen Funktion e−𝑡∕2𝜏 ei2π𝜈0𝑡 mit der Energie e−𝑡∕𝜏 proportional zu 1∕[1 + i4π(𝜈 − 𝜈0 )𝜏]. Die Halbwertsbreite des Betragsquadrats dieser Lorentzfunktion der Frequenz ist Δ𝜈 = 1∕2π𝜏. Diese spektrale Unschärfe entspricht einer Energieunschärfe ΔE = ℎΔ𝜈 = ℎ∕2π𝜏. Ein Energieniveau mit der Lebensdauer 𝜏 hat daher eine Energieunschärfe ΔE = ℎ∕2π𝜏, sofern wir den Zerfallsprozess durch eine einfache Exponentialfunktion beschreiben können. In diesem Bild kann spontane Emission im Modell eines gedämpften harmonischen Oszillators beschrieben werden, der eine exponentiell
abklingende harmonische Funktion erzeugt, wie in dem in Abschnitt 5.5.3 präsentierten Lorentz-Oszillatormodell. Wenn die Energieverbreiterungen der Niveaus 1 und 2 ΔE 1 = ℎ∕2π𝜏1 bzw. ΔE 2 = ℎ∕2π𝜏2 sind, ist die Verbreiterung der Energiedifferenz, die dem Übergang zwischen den beiden Niveaus entspricht, ΔE = ΔE 1 + ΔE 2 =
ℎ 1 1 ℎ 1 ( + )= , 2π 𝜏1 𝜏2 2π 𝜏
(14.43)
wobei 𝜏 die Lebensdauer des Übergangs ist und 𝜏−1 = (𝜏1−1 + 𝜏2−1 ). Die entsprechende Verbreiterung der Übergangsfrequenz, die als Lebensdauerverbreiterung bezeichnet wird, ist daher Δ𝜈 =
1 1 1 ( + ). 2π 𝜏1 𝜏2
(14.44)
Diese Verbreiterung ist um die Frequenz 𝜈0 = (E 2 − E 1 )∕ℎ zentriert und die Linienformfunktion hat ein Lorentzprofil 𝑔(𝜈) =
Δ𝜈∕2π . (𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2
(14.45)
Allgemeiner kann die Lebensdauerverbreiterung eines Atoms oder einer Ansammlung von Atomen wie folgt beschrieben werden. Jedes der in einem Übergang ausgestrahlten Photonen stellt ein Wellenpaket der Mittenfrequenz 𝜈0 (der Resonanzfrequenz des Übergangs) mit einer mit der Zerfallszeit 2𝜏 exponentiell abklingenden Einhüllenden dar, die einer Abklingzeit der Energie gleich der Lebensdauer 𝜏 des Übergangs entspricht. Wie in Abb. 14.21 dargestellt wird das ausgestrahlte Licht als eine Folge solcher zu zufälligen Zeiten ausgestrahlter Wellenpakete aufgefasst. Wie in Beispiel 12-1 besprochen, entspricht das stochastischem (partiell kohärentem) Licht mit einer spektralen Intensität, die genau durch die Lorentzfunktion aus Gl. (14.45) mit Δ𝜈 = 1∕2π𝜏 beschrieben wird. Bei der Mittenfrequenz 𝜈0 hat die Lorentz-Linienformfunktion den Wert 𝑔(𝜈0 ) = 2∕πΔ𝜈; damit ist der maximale Wirkungsquerschnitt gemäß Gl. (14.27) 𝜎0 =
𝜆2 1 . 2π 2π 𝑡sp Δ𝜈
(14.46)
Der größte Wirkungsquerschnitt kommt unter idealen Bedingungen vor, wenn der Zerfall vollständig strahlend ist, sodass 𝜏2 = 𝑡sp und 1∕𝜏1 = 0 ist (was dann der Fall ist, wenn Niveau 1 der Grundzustand ist, von dem aus kein Zerfall möglich ist). Dann ist Δ𝜈 = 1∕2π𝑡sp und damit 𝜎0 =
𝜆2 , 2π
(14.47)
14.3 Die Wechselwirkung von Photonen mit Atomen
g(ν)
2τ
Δν
t ν0
0
ν
Abb. 14.21 Die Emission von Wellenpaketen zu zufälligen Zeiten aus einem lebensdauerverbreiterten atomaren System mit der Übergangslebensdauer 𝜏 . Das ausgestrahlte Licht hat eine spektrale Intensität mit einem Lorentzprofil der Breite Δ𝜈 = 1∕2π 𝜏 .
was zeigt, dass der maximale Querschnitt von der Größenordnung des Quadrats einer Wellenlänge ist. Wenn Niveau 1 nicht der Grundzustand ist oder wenn nichtstrahlende Übergänge wichtig sind, kann Δ𝜈 ≫ 1∕𝑡sp und dadurch 𝜎0 wesentlich kleiner als 𝜆 2 ∕2π sein. Für optische Übergänge im Bereich 𝜆 = 0.1−10 μm ist beispielsweise 𝜆 2 ∕2π ≈ 10−11 −10−7 cm2 , während typische beobachtete Werte für 𝜎0 im Bereich 10−20 −10−12 cm2 liegen (siehe Tabelle 15.1). Stoßverbreiterung
Stöße, bei denen Energie ausgetauscht wird, sogenannte inelastische Stöße, können Übergänge zwischen atomaren Energieniveaus bewirken. Das beeinflusst die Abklingraten und Lebensdauern aller daran beteiligten Niveaus und verändert die zuvor diskutierte Linienbreite der emittierten Strahlung. Stöße, die ohne Austausch von Energie verlaufen, die sogenannten elastischen Stöße, verändern die Linienbreite der emittierten Strahlung ebenfalls. Elastische Stöße bewirken zufällige Phasenverschiebungen der Wellenfunktionen der entsprechenden Energieniveaus, die wiederum eine zufällige Phasenverschiebung des ausgestrahlten Feldes zu jedem Stoßzeitpunkt hervorruft. Wie in Abb. 14.22 dargestellt, besitzt eine Sinuswelle, deren Phase durch eine zufällige Verschiebung zu zufälligen Zeiten (Stoßzeitpunkten) modifiziert wird, eine spektrale Verbreiterung. Das Spektrum einer solchen zufällig phasengestörten Funktion kann mithilfe der Theorie stochastischer Prozesse bestimmt werden. Das Ergebnis ist wieder eine Lorentzfunktion der Breite Δ𝜈 = 𝑓Stoß ∕π, wobei 𝑓Stoß die Stoßgeschwindigkeit
t Stoßzeitpunkte t
Abb. 14.22 Eine mit einer Frequenz fStoß durch zufällige Phasensprünge unterbrochene Sinuswelle hat ein Lorentzspektrum der Breite Δ𝜈 = fStoß ∕π.
(mittlere Zahl von Stößen pro Sekunde) ist. Die LorentzLinienformfunktion bei Lebensdauer- und Stoßverbreiterung hat eine gesamte Linienbreite, die sich aus der Summe der einzelnen Linienbreiten ergibt, Δ𝜈 =
1 1 1 + 2𝑓Stoß ) . ( + 2π 𝜏1 𝜏2
(14.48)
Inhomogene Verbreiterung
Lebensdauerverbreiterung und Stoßverbreiterung sind Beispiele von homogenen Verbreiterungen, bei denen alle Atome eines Mediums als identisch mit identischen Linienformfunktionen und Mittenfrequenzen angenommen werden. Unter bestimmten Bedingungen haben die verschiedenen Atome eines Mediums jedoch unterschiedliche Linienformfunktionen oder Mittenfrequenzen. In manchen Medien zeigen unterschiedliche Untergruppen von wechselwirkenden Atomen jedoch ein abweichendes Verhalten, entweder aufgrund von Unterschieden in der lokalen Umgebung oder aufgrund ihres dynamischen Verhaltens. Als Beispiel können wir uns die in Abschnitt 14.1.3 diskutierte Feinstruktur der Energieniveaus von Nd3+ ansehen. Der Einbau von Nd3+ in einen Kristall wie YAG, der eine homogene Verbreiterung bewirkt, führt zu einer Aufspaltung der Niveaus in diskrete, eng benachbarte Unterniveaus (Abb. 14.6). Im Gegensatz dazu werden diese Unterniveaus zu Bändern verschmiert, wenn Nd3+ in ein weniger ausgeprägt strukturiertes Material wie z. B. Glas eingebettet wird, das mit einer inhomogenen Verbreiterung einhergeht. Der Grund für diesen Unterschied ist die Zufälligkeit des elektrischen Feldes an verschiedenen Stellen im Glas, die die Energieniveaus der eingebetteten Nd3+ -Ionen je nach ihrer exakten Positions unterschiedlich verschiebt, was insgesamt zu einer Verbreiterung führt. Analog bewegen sich unterschiedliche Gruppen der angeregten aktiven Ionen in einem Ar+ Ionen-Gaslaser mit unterschiedlichen Geschwindigkeiten und in unterschiedliche Richtungen, was aufgrund des Dopplereffekts zu einer Verteilung der Mittenfrequenzen der Linienformfunktion führt.
437
438
14 Licht und Materie
(ν)
β (ν)
ν0
ν
Abb. 14.23 Die mittlere Linienformfunktion für eine inhomogen verbreiterte Ansammlung von Atomen.
Im Fall von inhomogener Verbreiterung können wir eine mittlere Linienformfunktion 𝑔(𝜈) = ⟨𝑔𝛽 (𝜈)⟩
(14.49)
definieren, wobei ⟨⋅⟩ einen Mittelwert in Bezug auf die Variable 𝛽 bezeichnet, die verwendet wird, um die Atome mit der Linienformfunktion 𝑔𝛽 (𝜈) zu bezeichnen. Die mittlere Linienformfunktion erhalten wir, indem wir 𝑔𝛽 (𝜈) mit dem Anteil der Atome mit der Eigenschaft 𝛽 gewichten, wie in Abb. 14.23 illustriert. Ein spezieller Mechanismus der inhomogenen Verbreiterung ist die Dopplerverbreiterung. Infolge des Dopplereffekts zeigt ein Atom, das sich mit der Geschwindigkeit v in einer gegebenen Richtung bewegt, ein um die Frequenz ±(v ∕𝑐)𝜈0 verschobenes Spektrum, wenn es entlang dieser Richtung betrachtet wird, wobei 𝜈0 seine Mittenfrequenz ist. Die Verschiebung erfolgt zu einer höheren Frequenz (positives Vorzeichen), wenn sich das Atom zum Beobachter hin bewegt, und zu einer niedrigeren Frequenz (negatives Vorzeichen), wenn es sich von ihm entfernt. Für eine beliebige Beobachtungsrichtung ist die Frequenzverschiebung ±(v ‖ ∕𝑐)𝜈0 , wobei v ‖ die Komponente der Geschwindigkeit parallel zur Beobachtungsrichtung ist. Da eine Ansammlung von Atomen in einem Gas eine Geschwindigkeitsverteilung wie in Abb. 14.24 besitzt, zeigt das von ihnen ausgestrahlte Beobachtungsrichtung 2 3
Licht einen Bereich von Frequenzen, der als Dopplerverbreiterung bezeichnet wird. Für die Dopplerverbreiterung übernimmt die Geschwindigkeit v daher die Rolle des Parameters 𝛽, und es gilt 𝑔(𝜈) = ⟨𝑔v (𝜈)⟩. Wenn 𝑝(v ) d v die Wahrscheinlichkeit ist, dass die Geschwindigkeit eines gegebenen Atoms zwischen v und v + d v liegt, ist die gesamte inhomogene dopplerverbreiterte Linienformfunktion wie in Abb. 14.25 dargestellt ∞
( v) 𝑔(𝜈) = ∫ 𝑔 𝜈 − 𝜈0 𝑝(v ) d v . 𝑐 −∞
Viele Wechselwirkungen zwischen Atomen und Photonen zeigen eine Verbreiterung, die zwischen der rein homogenen und der rein inhomogenen liegt. Eine solche Mischverbreiterung kann durch eine Linienformfunktion wie das Voigtprofil beschrieben werden. Übung 14-2: Die dopplerverbreiterte Linienformfunktion
(a) Eine Ansammlung von Atomen in einem Gas hat in einer Richtung eine Geschwindigkeitskomponente v mit einer gaußschen Wahrscheinlichkeitsdichte 𝑝(v ) = √
1 2π𝜎v
exp (−
1
Abb. 14.24 Die von einem Atom emittierte Frequenz hängt von der Richtung der Bewegung des Atoms relativ zur Beobachtungsrichtung ab. Die Strahlung von Atom 1 hat eine höhere Frequenz als die der Atome 3 und 4. Die Strahlung von Atom 2 hat eine tiefere Frequenz.
v2
2𝜎v2
),
(14.51)
wobei 𝜎v2 = k 𝑇∕M ist und M die Atommasse bedeutet. Leiten Sie einen Ausdruck für die mittlere Linienformfunktion 𝑔(𝜈) her, wenn jedes Atom eine natürliche Lorentz-Linienformfunktion der Breite Δ𝜈 und der Mittenfrequenz 𝜈0 hat. (b) Zeigen Sie, dass 𝑔(𝜈) für Δ𝜈 ≪ 𝜈0 𝜎v ∕𝑐 durch die gaußsche Linienformfunktion 𝑔(𝜈) = √
1 2π 𝜎D
exp [−
(𝜈 − 𝜈0 )2 2𝜎D2
]
(14.52)
angenähert werden kann, wobei 𝜎 1 𝜎D = 𝜈0 v = 𝑐 𝜆
4
(14.50)
√
k𝑇 M
(14.53)
ist. Die Halbwertsbreite Δ𝜈D der dopplerverbreiterten Linie ist dann √ Δ𝜈D = 8 ln 2𝜎D ≈ 2.35𝜎D . (14.54) (c) Berechnen Sie die Dopplerlinienbreite für den Übergang 𝜆0 = 632.8 nm in Ne und für den Übergang 𝜆0 = 10.6 μm in CO2 bei Zimmertemperatur unter der Annahme Δ𝜈 ≪ 𝜈0 𝜎v ∕𝑐. Diese Übergänge werden in den He-Ne- bzw. CO2 -Gaslasern verwendet. (d) Zeigen
14.3 Die Wechselwirkung von Photonen mit Atomen
ν0 c
Abb. 14.25 Geschwindigkeitsverteilung und mittlere Linienformfunktion für ein dopplerverbreitertes atomares System.
(ν) (ν)
p( )
0
(ν – ν0 c ) ν0
0
Geschwindigkeit
Sie, dass der maximale Wert des Wirkungsquerschnitts für die gaußsche Linienformfunktion in Gl. (14.52) gleich 𝜆2 𝜎0 = 8π
√
𝜆2 1 4 ln 2 1 ≈ 0.94 π 𝑡sp Δ𝜈D 8π 𝑡sp Δ𝜈D
(14.55)
ist. Vergleichen Sie das mit Gl. (14.46) für die LorentzLinienformfunktion.
14.3.5 Verstärkte spontane Emission Alle bis jetzt in Abschnitt 14.3 präsentierten Ergebnisse beruhten auf der Annahme Δ𝜈 ≫ δ𝜈, d. h. dass die atomare Linienbreite Δ𝜈 viel größer ist als die Breite δ𝜈 einer elektromagnetischen Mode. Diese Bedingung ist gewöhnlich – aber nicht immer – erfüllt. Im entgegengesetzten Grenzfall, wenn die atomare Linienbreite viel kleiner ist als die Breite einer elektromagnetischen Mode (Abb. 14.26), kann besonders in Mikrohohlräumen mit großen Gütefaktoren 𝑄 eine Verstärkung der Wahrscheinlichkeitsdichte für die spontane Emission erreicht werden, wie wir im Folgenden zeigen wollen. Die Verstärkung der spontanen Emission ist für den Betrieb bestimmter Photonenquellen wünschenswert, wie in Abschnitt 18.4 diskutiert wird.
ν
Wir betrachten die spontane Emission eines Atoms mit der Resonanzfrequenz 𝜈0 in eine elektromagnetische Mode mit der Mittenfrequenz 𝜈𝑞 = 𝜈0 für Δ𝜈 ≪ δ𝜈, wie in Abb. 14.26 gezeigt. Nach Gl. (14.22) ist die Wahrscheinlichkeitsdichte für die spontane Emission in eine einzelne Hohlraummode ρ(𝜈), wenn das Dipolmoment des Atoms parallel zur Feldrichtung der Mode ausgerichtet ist, durch
max 𝑃sp
2Q π νq
δν = νq
νq Q ν
(ν) Δν ν0
ν
Abb. 14.26 Spontane Emission aus einem Atom mit der normierten Linienformfunktion g(𝜈) in eine breitere normierte Lorentz-Hohlraummode 𝜌(𝜈). Die Linienformfunktion und Mittenfrequenzen der Hohlraummode sind mit 𝜈0 bzw. 𝜈q bezeichnet; ihre Breiten sind Δ𝜈 und δ𝜈. Wir betrachten den Fall 𝜈0 = 𝜈q und Δ𝜈 ≪ δ𝜈.
∞
0
0
𝑐 𝑐 3𝜆 2 = ∫ 𝜎max (𝜈)ρ(𝜈) d𝜈 ≈ ρ(𝜈0 ) ∫ 𝑔(𝜈) d𝜈 𝑉 𝑉 8π 𝑡sp (14.56)
gegeben, da nach Gl. (14.21) und (14.26) 𝜎max (𝜈) = 3𝜎(𝜈) bzw. 𝜎(𝜈) = 𝜆 2 𝑔(𝜈)∕8π 𝑡sp ist. Weil die Linienformfunktion 𝑔(𝜈) normiert ist und die Höhe der normierten Lorentz-Linienformfunktion der Hohlraummode gleich 2𝑄∕π𝜈𝑞 mit 𝑄 = 𝜈𝑞 ∕δ𝜈 ist, erhalten wir max = 𝑃sp
1 3𝑐𝜆 2 2𝑄 1 3 𝜆3 = 𝑄. 𝑡sp 8π 𝑉 π𝜈𝑞 𝑡sp 4π2 𝑉
(14.57)
Das Ergebnis ist eine Verstärkung der Wahrscheinlichkeitsdichte für die spontane Emission relativ zu der im Vakuum um einen Faktor, der als Purcellfaktor bezeichnet wird: 𝐹P =
ρ(ν)
∞
max 𝑃sp
𝑃sp
=
3 𝜆3 𝑄. 4π2 𝑉
(14.58)
Der Purcellfaktor in Gl. (14.58) hat die folgenden Eigenschaften: • Der Faktor 3 ist eine Folge der parallelen Ausrichtung des atomaren Dipolmoments und der Feldrichtung der Mode. • Die Größe 𝜆 3 ∕𝑉, das Verhältnis der dritten Potenz der Wellenlänge zum Volumen des Hohlraums, ist in einem Mikrohohlraum wesentlich erhöht. • Ein großer Wert von 𝑄, d. h. eine scharfe Hohlraummode, erhöht den Purcellfaktor; allerdings nimmt mit steigendem 𝑄 die spektrale Breite δ𝜈 = 𝜈𝑞 ∕𝑄 der Mode ab, sodass schließlich die Bedingung Δ𝜈 ≪ δ𝜈 verletzt wird.
439
14 Licht und Materie
Wenn 𝜈0 von 𝜈𝑞 abweicht, wird die Höhe der Hohlraummode bei 𝜈0 kleiner, und die Verstärkung der spontanen Emission wird schließlich zur Unterdrückung der spontanen Emission.
Atomdichte
440
14.3.6 Laserkühlung, Einschluss von Atomen und Atomoptik Die Kräfte, die Licht auf Materie ausüben kann (siehe Abschnitt 13.1.3), können ausgenutzt werden, um die Breite der Geschwindigkeitsverteilung einer Gruppe von neutralen Atomen oder Ionen zu verringern (Laserkühlung) oder sie in einem begrenzten Volumen einzuschließen (Lasereinschluss oder Lasertrapping). Atomstrahlen und in Fallen eingeschlossene Atome werden in der Atomoptik und der Atominterferometrie verwendet, um hochpräzise Messungen durchzuführen. Gekühlte und eingeschlossene Atome in Form von Bose-Einstein-Kondensaten erlauben gemeinsam mit eingeschlossenen Fermigasen grundlegende Einblicke in die Quantennatur der Materie. Laserkühlung
Es gibt eine Reihe von Verfahren zur Laserkühlung (engl. laser cooling) von Ionen und neutralen Atomen. Einige nutzen die äußeren Freiheitsgrade des Atoms wie beispielsweise seine Position und seinen Impuls, während andere auf das dynamische Zusammenspiel seiner äußeren und inneren Freiheitsgrade wie z. B. seiner Elektronenkonfiguration oder seines Spins angewiesen sind. Dabei können sowohl absorbierende (Streuung) als auch dispersive (Gradienten- oder Dipol-) Kräfte eine Rolle spielen. Die Laserkühlung wurde über neutrale Atome hinaus auch auf komplexere Systeme wie Moleküle und kleine makroskopische Systeme ausgedehnt. Anwendungen findet die Laserkühlung in der Präzisionsmesstechnik, der hochauflösenden Spektroskopie und den Quantenwissenschaften. Dopplerkühlung
Eine der einfachsten Methoden der Laserkühlung, die als Dopplerkühlung bekannt ist, verwendet einen Atomstrahl, der sich auf einen Laserstrahl mit schmaler Linienbreite zu bewegt, dessen Mittenfrequenz etwas unterhalb der Mittenfrequenz einer atomaren Absorptionslinie abgestimmt ist. Nach der Absorption von Photonen durch den Teil der Atome, deren dopplerverschobene Frequenz mit der Photonenfrequenz übereinstimmt, kann ein Atom entweder durch induzierte Emission oder durch spontane Emission in den Grundzustand zurückkehren. Wenn es durch induzierte Emission zurückkehrt, hat das emittierte Photon densel-
0
400
800 1200 Geschwindigkeit / (m/s)
Abb. 14.27 Geschwindigkeitsverteilung eines Strahls von Natriumatomen (gepunktete Kurve). Ein Laserstrahl mit fester Frequenz dient dazu, Atome in einem engen Geschwindigkeitsbereich durch Dopplerkühlung abzubremsen und ihre Geschwindigkeitsverteilung noch schmaler zu machen (durchgezogene Kurve). (Nach W. D. Phillips, ‚Laser Cooling and Trapping of Neutral Atoms‘, Reviews of Modern Physics 70, 721–741, 1998; Abb. 3. ©1998 American Physical Society.)
ben Impuls wie das zuvor absorbierte Photon, sodass das Atom keine resultierende Impulsänderung erfährt. Wenn das Atom jedoch durch spontane Emission zurückkehrt, ist die Richtung der Photonenemission zufällig, sodass wiederholte Absorptionen und Emissionen zu einer Reduzierung seines Impulses in Richtung des Laserstrahls führen. Das Ergebnis dieses Effekts ist eine Verringerung der Geschwindigkeit dieser Gruppe von Atomen, wie Abb. 14.27 schematisch zeigt. Andere Gruppen von Atomen können durch eine Änderung der Laserfrequenz oder durch Einsatz alternativer Techniken wie z. B. eines breitbandigen Lasers oder eines inhomogenen Magnetfelds, das die Mittenfrequenz der atomaren Absorptionslinie verändert (ein „Zeeman-Bremser“ oder „Zeeman-Slower“), gekühlt werden. Optische Melasse
Wenn man drei Paare von orthogonal ausgerichteten, sich gegenläufig ausbreitenden Laserstrahlen zur dreidimensionalen Dopplerkühlung einer Gruppe von Atomen verwendet, spürt jedes der Atome unabhängig von seiner Bewegungsrichtung eine geschwindigkeitsabhängige viskose Dämpfungskraft. Man spricht dann davon, dass sich die Laserstrahlen wie optische Melasse verhalten, da sie einer Verbreiterung der Geschwindigkeitsverteilung der Atome stark entgegenwirken, obwohl es keine Rückstellkraft im eigentlichen Sinn gibt, die die Atome zum Zentrum der Apparatur hin drückt. Das berechnete untere Dopplerlimit für die Kühlung eines idealisierten Zweiniveausystems liegt im Bereich von einigen hundert μK.
14.3 Die Wechselwirkung von Photonen mit Atomen
Sisyphuskühlung
Die Dopplerkühlung ist weit verbreitet, aber andere Ansätze ermöglichen eine Abkühlung von Atomen und Ionen auf Temperaturen, die um Größenordnungen unter dem Dopplerlimit liegen. Ein Beispiel hierfür ist die Polarisationsgradientenkühlung oder Sisyphuskühlung, bei der ein Satz orthogonaler, linear polarisierter, sich gegenläufig ausbreitender Laserstrahlen eingesetzt wird, die eine stehende Welle erzeugen, deren Polarisation sich im Subwellenlängenbereich ändert. In einer solchen stehenden Welle erfahren Atome eine Kombination aus einem positionsabhängigen optischen Starkeffekt (Lichtverschiebung), einer Gradienten- oder Dipolkraft und optischem Pumpen, die es gemeinsam ermöglichen, die Temperatur auf das Rückstoßlimit der Emission eines einzelnen Photons durch ein Atom abzusenken (siehe Aufgabe 13-2). Man kann so Temperaturen im Bereich von wenigen μK realisieren, die weit unterhalb des Dopplerlimits liegen. Verdunstungskühlung
Man kann die Temperaturen einer Gruppe von Atomen sogar noch unter das Rückstoßlimit absenken. Ein Ansatz hierfür, der als Verdunstungskühlung bezeichnet wird, besteht darin, die Einfangtiefe einer Atomfalle allmählich zu verringern, sodass Atome mit Energien, die diese Tiefe überschreiten, entweichen können und nur die weniger energiereichen Atome zurückbleiben. Wenn anschließend durch Kollisionen wieder ein thermisches Gleichgewicht in der Falle hergestellt wird, resultiert eine verringerte Temperatur des Systems. Eine andere Technik wird als geschwindigkeitsabhängiger kohärenter Besetzungseinschluss (engl. velocity-sensitive coherent population trapping, VSCPT) bezeichnet. Um diesen Prozess zu verstehen, muss man die Geschwindigkeit eines Atoms als zufällige Schrittfolge (engl. random walk) betrachten, die einer Lévystatistik folgt. Durch sorgfältige Auslegung entsprechender experimenteller Anordnungen sind Temperaturen bis hinunter zu einigen nK erreichbar, was Atomgeschwindigkeiten in der Größenordnung von weniger als cm/s entspricht. In schwerkraftfreien Umgebungen wurde sogar eine Abkühlung auf einige zehn pK erreicht. Lasereinschluss
Der Lasereinschluss oder das Lasertrapping kann – häufig in Kombination mit Laserkühlung – verwendet werden, um Ionen, neutrale Atome, Moleküle, dielektrische Teilchen, biologische Zellen oder kleine makroskopische Objekte einzuschließen, zu manipulieren und zu untersuchen. Das Einfangen und Kühlen von Objekten mithilfe von Lasern ist in der Quanten- und nichtli-
nearen Optik ein außerordentlich nützliches Werkzeug. Beispielsweise kann man so ein einzelnes Atom und ein einzelnes Photon gemeinsam einschließen, um die Quantenelektrodynamik von Hohlräumen in ihrer elementarsten Form zu studieren. Es ist auch möglich, die Physik von Kollisionen kalter Atome oder der Mikrofluidik zu untersuchen und Bose-Einstein-Kondensate und Atomlaser zu erzeugen. Optische Pinzetten
Zum Einschließen und Manipulieren von Teilchen – von einzelnen Atomen bis hin kleinen biologischen Strukturen – werden häufig optische Pinzetten (engl. optical tweezers) verwendet, die in den 1980er Jahren entwickelt wurden und als null-, ein-, zwei- oder dreidimensionale Anordnungen realisiert werden können. Optische Pinzetten verwenden fokussierte Laserstrahlen, um Proben mithilfe von Streu- und Gradientenkräften in der Größenordnung von fN bis pN zu manipulieren. Wenn die Abmessungen der eingeschlossenen Objekte viel kleiner sind als die verwendete optische Wellenlänge, liefert die Rayleighstreuung (Abschnitt 5.6.2) eine geeignete Beschreibung für den Mechanismus des Einschlusses; wenn sie viel größer sind, ist die Strahlenoptik der geeignete Ansatz. Für homogene kugelförmige Teilchen liefert die Mie-Streutheorie (Abschnitt 5.6.3) genaue numerische Ergebnisse für beliebige Teilchengrößen und Brechungsindizes. Die einschließenden Laserstrahlen können auch ein Drehmoment auf ein eingefangenes Teilchen ausüben, indem sie entweder einen Spindrehimpuls (falls die Strahlen zirkular polarisiert sind) oder einen Bahndrehimpuls (sofern sie strukturiert sind) auf dieses übertragen. Zwei Beispiele für die Anwendung einer optischen Pinzette im Extremfall sehr kleiner bzw. sehr großer eingeschlossener Teilchen sind (1) der Einschluss eines einzelnen neutralen Atoms mit einer Größe von etwa 100 pm, wodurch es möglich wird, dieses auf seinen dreidimensionalen Schwingungsgrundzustand in der Falle abzukühlen, und (2) der Einschluss und die Manipulation von Objekten in der Größe von einigen μm wie z. B. lebenden Organismen oder DNA-Molekülen. Neben den optischen Pinzetten existieren noch Varianten wie magnetische oder akustische Pinzetten, die ebenfalls realisiert wurden. Magnetooptische Fallen
Die Atome in optischer Melasse können zusätzlich auch räumlich eingegrenzt werden, indem man eine magnetooptische Falle (MOT, engl. magneto-optical trap) auf der Basis eines inhomogenen Magnetfeldes nutzt. Dies führt zu einer Zeemanaufspaltung der atomaren Ener-
441
442
14 Licht und Materie
gieniveaus und einer positionsabhängigen Streukraft, die die Atome an die Position lenkt, an der sich die drei Paare von Laserstrahlen schneiden. Das Nettoergebnis ist eine Abkühlung und ein Einschluss der Atome.
√ thermische Na-Atome 𝜆DB = ℎ∕ 3𝑘𝑇𝑚 ≈ 20 pm (siehe Aufgabe 13-2) und ist damit etwa 30 000 mal kleiner als die Wellenlänge von sichtbarem Licht. Die Kohärenzlänge eines thermischen Atomstrahls ist ebenfalls kurz, 𝑙K ≈ 100 pm.
Optische Gitter
Wie zuvor beschrieben führt die Polarisationsgradientenkühlung zur Lokalisierung von Atomen auf einer räumlichen Skala im Subwellenlängenbereich. Letztlich verhalten sich die stehenden Wellen, die durch die gegenläufige Ausbreitung der Laserstrahlen in einer, zwei oder drei Dimensionen erzeugt werden, wie optische Gitter, die Potentialtöpfe enthalten, in denen Atome als Folge der Wechselwirkung zwischen dem elektrischen Wechselfeld und dem induzierten atomaren Dipolmoment (optischer Starkeffekt) eingefangen und lokalisiert werden. Die Einfangtiefe des optischen Gitters kann durch Änderung der Laserleistung angepasst werden, während seine Periodizität durch Änderung der Laserwellenlänge oder des Winkels zwischen den Laserstrahlen eingestellt werden kann. Ein Hilfslaserfeld kann den Einschluss in einem Gitterpotential erleichtern, dessen Strukturen viel kleiner als die Wellenlänge der Laser sind. Wenn die Positionen der Atome in dieser Weise eingegrenzt werden, ist eine Laserkühlung und der gleichzeitige Einschluss in einem Gitter die Folge. Optische Gitter sind wichtig, um die Bewegungen von Gruppen einzelner neutraler Atome kontrollieren zu können. Sie können beispielsweise verwendet werden, um Atome festzuhalten, deren optischer Übergang als hochgenaue Atomuhr dienen kann (z. B. fermionisches 87 Sr), oder sie können mit deterministischen Anordnungen von Atomen geladen werden. Mithilfe von optischen Gittern konnten vereinfachte künstliche Kristalle mit einstellbaren Eigenschaften erzeugt werden, was die Erforschung grundlegender Konzepte der Physik der kondensierten Materie ermöglichte. Atomoptik
Die Atomoptik befasst sich mit der Untersuchung von Strahlen aus neutralen Atomen und der mit ihnen verknüpften Materiewellen. Wie optische Wellen zeigen auch Materiewellen Erscheinungen wie Reflexion, Brechung, Beugung, Streuung und Interferenz. Die Rolle der optischen Wellenlänge 𝜆 übernimmt dabei die De-Broglie-Wellenlänge 𝜆DB , die gemäß 𝜆DB = ℎ∕𝑝 mit dem Impuls 𝑝 der Atome zusammenhängt, wobei ℎ die plancksche Konstante ist. Dieser Ausdruck entspricht genau dem in Gl. (13.11) für Photonen angegebenen; allerdings ist der Atomimpuls 𝑝 = 𝑚𝑣 um Größenordnungen größer als der Photonenimpuls, sodass 𝜆DB ≪ 𝜆 ist. Beispielsweise beträgt die De-Broglie-Wellenlänge für
Atominterferometrie
Atominterferometrie kann mit Atomen in Strahlen, magnetooptischen Fallen oder Bose-Einstein-Kondensaten durchgeführt werden. Gekühlte und gefangene Atome sind wichtige Komponenten im Arsenal der Atomoptik, da sie einen kleinen Impuls und damit einhergehend eine verringerte Unschärfe bieten. Ultrakalte Atome können De-Broglie-Wellenlängen von bis zu 1 μm und Kohärenzlängen von bis zu 10 μm besitzen. Die Interferometrie von Materiewellen ähnelt somit der optischen Interferometrie mit partiell kohärentem Licht (Abschnitt 12.2). Optische Übergänge in einzelnen Atomen, die in optischen Gittern eingeschlossen sind, dienen oft als Atomuhren. Atominterferometer eignen sich zur präzisen Messung von Beschleunigung, Drehung und Schwerkraft sowie zur Bestimmung verschiedener Atom- und Materialeigenschaften. Im Gegensatz zu Photonen können Atome jedoch stark wechselwirken, so dass die Interferometrie von Materiewellen häufig nichtlinear ist. Bose-Einstein-Kondensate und Atomverstärker Bose-Einstein-Kondensate
Ein Gas aus bosonischen Atomen im thermischen Gleichgewicht kann genau wie ein Gas aus Photonen als eine quantenmechanische Ansammlung nicht unterscheidbarer Teilchen behandelt werden, die durch die in Gl. (13.43) beschriebene und in Abb. 13.16 dargestellte Bose-Einstein-Verteilung beschrieben wird. Ein BoseEinstein-Kondensat (BEK) kann entstehen, wenn ein Gas aus bosonischen Atomen auf eine Temperatur abgekühlt wird, die so niedrig ist, dass die kinetische Energie der Teilchen vernachlässigbar wird und 𝜆DB mit den Abständen zwischen den Atomen vergleichbar wird. Die atomaren Wellenpakete überlappen dann so stark, dass sie zu einem kollektiven Quantenzustand kondensieren können, der die freie Energie des Systems minimiert (dabei muss das Gas so verdünnt sein, das es nicht zu einer Flüssigkeit oder einem Feststoff kondensiert). Teilchen in diesem Zustand verhalten sich dann kollektiv als kohärente Welle. Beispielsweise kann ein Gas aus 23 NaAtomen, das unter etwa 1 μK abgekühlt wird, ein BEK bilden, das zwischen 102 und 108 Atomen enthält und eine räumliche Ausdehnung von einigen zehn μm hat. Die Interferenz zweier separater Bose-Einstein-Konden-
14.4 Thermisches Licht
sate verdeutlicht die Welleneigenschaften dieser makroskopischen Materieeinheiten. Die mathematische Beschreibung eines BEK durch gequantelte Materiewellen ähnelt sehr der von gequantelten elektromagnetischen Wellen in einem nichtlinearen brechenden Medium. Die Miniaturisierung hat inzwischen zur Herstellung von BEK auf speziellen elektronischen Mikrochips geführt, die als Atomchips bekannt sind. Dabei werden gekühlte Atome aus optischer Melasse in einer magnetooptischen Falle in eine Magnetfalle auf dem Chip transferiert, die dort durch elektrische Ströme erzeugt wird. Der Chip erzeugt dann Radiowellen, die eine Verdunstungskühlung auslösen, wodurch ein BEK entsteht. In der ISS soll ein BEK auf einem Atomchip in der Schwerelosigkeit eine Kühlung auf pK-Niveau ermöglichen. BEK ermöglichen es, synthetische Formen von Quantenmaterie herzustellen, und sollen die Beobachtung von Atominterferometrie mit beispielloser Genauigkeit erlauben. Atomverstärker
Ein Atomverstärker soll die Anzahl der Atome in einem Atomstrahl erhöhen, der durch ein BEK als aktives Medium geleitet wird. Der Atomverstärker wandelt atomare Materiewellen im aktiven Medium in Atomwellen in demselben Quantenzustand wie die zu verstärkende Welle um. Man kann das erreichen, indem man das BEK mit einem Laser pumpt, dessen Photonen von den Atomen im BEK genau unter den Winkeln gestreut werden, die den Kondensatatomen unter Wahrung von Impuls- und Energieerhaltung den erforderlichen Rückstoß versetzen, damit sie Teil der einfallenden Materiewelle werden. Derartige Vorrichtungen könnten grundsätzlich zur Verbesserung der Leistung von Atominterferometern eingesetzt werden. Da Atome aber erhalten bleiben und nicht bei Bedarf erzeugt werden können, sind auch verstärkte Atomstrahlen normalerweise schwach. Ein Laserverstärker arbeitet dagegen mit Photonen, die bei Bedarf leicht in großer Zahl erzeugt werden können, wodurch verstärktes Laserlicht sehr intensiv werden kann. Ein weiterer Unterschied zwischen Laser- und BEK-Verstärkern besteht darin, dass das aktive Medium eines Lasers nicht wechselwirkende Photonen in einem ausgeprägten Nichtgleichgewichtszustand enthält, wohingegen das aktive Medium des BEK wechselwirkende Atome im thermodynamischen Gleichgewicht enthält.
14.4 Thermisches Licht Im thermischen Gleichgewicht und ohne andere äußere Energiequellen strahlen schwarze Strahler (die so genannt werden, weil sie alles Licht absorbieren, das auf sie trifft) eine allgemeine Form der Strahlung aus, die als thermisches Licht oder Schwarzkörperstrahlung (manchmal auch Hohlraumstrahlung) bezeichnet wird. In diesem Abschnitt beschäftigen wir uns mit den Eigenschaften des thermischen Lichts und analysieren die Wechselwirkungen zwischen einer Ansammlung von Photonen und Atomen im thermischen Gleichgewicht. Wir zeigen auch, wie das von einem Gegenstand ausgestrahlte thermische Licht verwendet werden kann, um eine Abbildung des Gegenstands zu erzeugen.
14.4.1 Das thermische Gleichgewicht zwischen Photonen und Atomen Ein makroskopischer Ansatz für eine Geschwindigkeitsgleichung, der spontane Emission, Absorption und induzierte Emission im thermischen Gleichgewicht berücksichtigt, führt zur spektralen Intensität des thermischen Lichts. Der Ausgangspunkt für unsere Analyse sind die Gln. (14.24) und (14.35), die spontane Emission bzw. induzierte Übergänge in Gegenwart von breitbandigem Licht beschreiben. Wir betrachten ein Volumen, dessen Wände eine große Zahl von Atomen mit zwei Energieniveaus enthalten, die wir mit 1 und 2 bezeichnen und die einen Abstand ℎ𝜈 voneinander haben. In dem Hohlraum mit der Temperatur 𝑇 existiert breitbandige elektromagnetische Strahlung. N 1 (𝑡) und N2 (𝑡) seien die Zahlen von Atomen zur Zeit 𝑡 in Energieniveau 1 bzw. 2 pro Volumeneinheit. Da einige der Atome zu Beginn in Niveau 2 vorliegen, was sich aus der endlichen Temperatur ergibt, entsteht durch spontane Emission Strahlung im Hohlraum. Diese Strahlung kann wiederum Absorption und induzierte Emission veranlassen. Die drei Prozesse koexistieren, und wir nehmen an, dass sich ein stationärer Zustand (ein Gleichgewicht) einstellt. Weiter nehmen wir an, dass jede der Strahlungsmoden mit Frequenzen innerhalb der atomaren Linienbreite im Mittel von n Photonen besetzt ist, wie in Gl. (14.35) behauptet. Zunächst betrachten wir nur die spontane Emission. Die Wahrscheinlichkeit, dass ein einzelnes Atom im oberen Niveau in dem Zeitintervall von 𝑡 bis 𝑡 + Δ𝑡 spontan in eine beliebige Mode emittiert, ist 𝑃sp Δ𝑡 = Δ𝑡∕𝑡sp . Es gibt N 2 (𝑡) solcher Atome, sodass die mittlere Zahl von ausgestrahlten Photonen innerhalb von Δ𝑡 gleich N2 (𝑡)Δ𝑡∕𝑡sp ist. Das ist auch die Zahl von Atomen, die Niveau 2 während des Zeitintervalls Δ𝑡 verlassen. Folglich
443
444
14 Licht und Materie 2 (t)
nichtstrahlenden Übergängen oder äußeren Quellen der Anregung. Im stationären Zustand muss d N2 ∕ d𝑡 = 0 sein, also
2 (0)
N2 n = . N1 1+n tsp
t
Abb. 14.28 Abklingen der Besetzungszahl des oberen Niveaus durch spontane Emission.
ergibt sich die (negative) Geschwindigkeit der Änderung von N2 (𝑡) durch spontane Emission aus der Differentialgleichung N dN2 =− 2 . 𝑡sp d𝑡
(14.59)
Die Lösung N2 (𝑡) = N2 (0) exp(−𝑡∕𝑡sp ) ist eine exponentiell abklingende Funktion der Zeit, die in Abb. 14.28 dargestellt ist. Nach einer hinreichend langen Zeit nimmt die Zahl N2 von Atomen im oberen Niveau mit der Zeitkonstante 𝑡sp auf null ab. Die Energie wird durch die spontan ausgestrahlten Photonen abgeführt. Nun erlauben wir zusätzlich Absorption und induzierte Emission, die zu Änderungen in den Besetzungszahlen beitragen. Da es N1 zur Absorption fähige Atome gibt, ist die Geschwindigkeit der Änderung der Besetzungszahl des oberen Energieniveaus durch Absorption gemäß Gl. (14.35) dN2 nN1 . = N 1 W ind = 𝑡sp d𝑡
(14.60)
Ähnlich verursacht die induzierte Emission eine (negative) Änderung der Besetzungszahl des oberen Zustands gemäß dN2 nN2 . = −N 2 W ind = − 𝑡sp d𝑡
(14.61)
Die Geschwindigkeiten der atomaren Absorption und induzierten Emission sind proportional zur mittleren Zahl n von Photonen in jeder Mode. Wir fassen die Gln. (14.59), (14.60) und (14.61) zusammen, um spontane Emission, Absorption und induzierte Emission gleichermaßen zu berücksichtigen, und erhalten so die Geschwindigkeitsgleichung N nN nN dN2 =− 2 + 1 − 2 . 𝑡sp 𝑡sp 𝑡sp d𝑡
(14.62)
Diese Gleichung vernachlässigt Übergänge in oder aus dem Niveau 2, die aus anderen Effekten resultieren, wie z. B. Wechselwirkungen mit anderen Energieniveaus,
(14.63)
Offensichtlich ist N2 ∕N 1 ≤ 1. Wenn wir jetzt von der Tatsache Gebrauch machen, dass die Atome im thermischen Gleichgewicht sind, verlangt Gl. (14.8), dass ihre Besetzungszahlen der Boltzmannverteilung gehorchen: N2 E − E1 ℎ𝜈 = exp (− 2 ) = exp (− ) . N1 k𝑇 k𝑇
(14.64)
Wenn wir Gl. (14.64) in Gl. (14.63) einsetzen, erhalten wir für die mittlere Zahl von Photonen pro Mode in der Umgebung der Frequenz 𝜈 n=
1 . exp(ℎ𝜈∕k 𝑇) − 1
(14.65)
Diese Herleitung basiert auf der Wechselwirkung zweier Energieniveaus, die durch Absorption sowie induzierte und spontane Emission bei einer Frequenz nahe 𝜈 gekoppelt sind. Die Gültigkeit von Gl. (14.65) reicht jedoch viel weiter. Um das zu verstehen, betrachten wir einen Hohlraum, dessen Wände aus Materialien bestehen, die ein Kontinuum von Energieniveaus bei allen Energiedifferenzen und daher allen Werten von 𝜈 besitzen. Die Atome in den Wänden sollen spontan in den Hohlraum ausstrahlen. Das ausgestrahlte Licht wechselwirkt anschließend mit den Atomen und verursacht Absorption und induzierte Emission. Wenn die Wände auf einer Temperatur 𝑇 gehalten werden, erreicht das kombinierte System aus Atomen und thermischer Strahlung ein Gleichgewicht. Gleichung (14.65) ist identisch mit Gl. (13.44) – dem Ausdruck für die mittlere Photonenzahl in einer Mode thermischen Lichts, für die die Besetzungszahlen der Energieniveaus der Verteilung 𝑝(n) ∝ exp(−n ℎ𝜈∕k 𝑇) folgen. Das zeigt, dass unsere Analyse selbstkonsistent ist. Photonen, die mit Atomen im thermischen Gleichgewicht bei einer Temperatur 𝑇 wechselwirken, sind selbst bei derselben Temperatur 𝑇 im thermischen Gleichgewicht (siehe Abschnitt 13.2.3). Eine Ansammlung solcher Photonen wird häufig „Photonengas“ genannt.
14.4.2
Das Spektrum des schwarzen Strahlers
Nach unserer Analyse aus Abschnitt 14.4.1 ist die mittlere Energie E einer Strahlungsmode einfach n ℎ𝜈, wobei n durch Gl. (14.65) gegeben ist, also E=
ℎ𝜈 . exp(ℎ𝜈∕k 𝑇) − 1
(14.66)
14.4 Thermisches Licht
Wellenlänge λ0 / nm 10 2 10
T
10 h
T h
10 T
h
ν
Abb. 14.29 Semilogarithmische Auftragung der mittleren Energie E einer elektromagnetischen Mode im thermischen Gleichgewicht bei der Temperatur T als Funktion der Frequenz 𝜈. Bei T = 300 K ist kT ∕h = 6.25 THz entsprechend einer Wellenlänge von 48 μ m. T
10 –1
0 0 (ν)
ν
0 0 ϱ (ν)
ν
ν
Abb. 14.30 Frequenzabhängigkeit der Energie E pro Mode, der Modendichte M (𝜈) und der spektralen Energiedichte 𝜚(𝜈) = M (𝜈)E.
Die Abhängigkeit von E von 𝜈, die mit der in Gl. (13.47) gegebenen identisch ist, ist in Abb. 14.29 dargestellt. Multiplikation der mittleren Energie pro Mode E mit der in Gl. (11.83) gegebenen Modendichte M(𝜈) = 8π 𝜈2 ∕𝑐3 ergibt eine spektrale Energiedichte 𝜚(𝜈) = M(𝜈)E (Energie pro Bandbreiten- und Volumeneinheit) der Form 𝜚(𝜈) =
T = 6000 K
10 –16 T = 1000 K
10 –17 10 –18
T = 300 K
10 –19 10 –20 10 –21
T = 77 K
10 –22 10 –23 10 –24 12 10
10 13
10 14
10 15 Frequenz v / Hz
10 16
Abb. 14.31 Die Abhängigkeit der spektralen Energiedichte 𝜚(𝜈) von der Frequenz in doppelt-logarithmischer Auftragung für mehrere unterschiedliche Temperaturen.
T h
0
spektrale Energiedichte ρ(v) / (J s/m3)
T
0
1
10 –15
1 8π ℎ𝜈3 . 𝑐3 exp(ℎ𝜈∕k 𝑇) − 1
(14.67)
Diese Gleichung, die als Spektrum des schwarzen Strahlers oder plancksches Strahlungsgesetz bekannt ist, ist in Abb. 14.30 als Funktion der Frequenz aufgetragen. Ihre Abhängigkeit von der Temperatur wird in Abb. 14.31 illustriert.
Wenn sich die Temperatur des schwarzen Strahlers ändert, ändert sich die mittlere Zahl von Photonen in dem Hohlraum entsprechend Gl. (14.65), da Photonen von den Wänden emittiert bzw. absorbiert werden können. Obwohl sie Bosonen sind, ist die Zahl der Photonen in dem Hohlraum nicht erhalten und sie können folglich kein Bose-Einstein-Kondensat bilden. Bosonische Atome hingegen bleiben erhalten und können daher ein BEK bilden, sofern die Temperatur unter einen kritischen Wert absinkt (siehe Abschnitt 14.3.6). Das Spektrum des schwarzen Strahlers spielte eine wichtige Rolle bei der Entdeckung der Quantennatur des Lichts (siehe Kapitel 13). Nach der klassischen elektromagnetischen Theorie sollte die Modendichte eines dreidimensionalen Hohlraums eine quadratische Funktion von 𝜈 sein, M(𝜈) = 8π 𝜈2 ∕𝑐3 (siehe Abschnitt 11.3.3). Andererseits sollte nach dem Gleichverteilungssatz der Energie aus der klassischen statistischen Mechanik die mittlere Energie pro Mode unabhängig von der Frequenz konstant gleich E = k 𝑇 sein. Das lieferte einen als Rayleigh-Jeans-Gleichung für die Strahlung des schwarzen Strahlers bekannten Ausdruck für 𝜚(𝜈), der aber bedauerlicherweise nicht mit dem Experiment übereinstimmte. Im Jahr 1900 bemerkte Max Planck, dass es möglich war, einen theoretischen Ausdruck für das Spektrum des schwarzen Strahlers in Übereinstimmung mit dem Experiment zu erhalten, wenn man die Energie jeder Mode quantelte. Die Rechnung von Planck führte zu dem in Gl. (14.66) angegebenen Ausdruck für E . Albert Einstein baute auf Plancks Ergebnissen auf und postulierte, dass die Quantisierung unmittelbar auf
445
446
14 Licht und Materie
die Energie der elektromagnetischen Strahlung anzuwenden sei, was zum Konzept des Photons führte. Die Rayleigh-Jeans-Gleichung ergibt sich aus Gl. (14.67) im Grenzfall kleiner Photonenenergien: Für ℎ𝜈 ≪ k𝑇 ist exp(ℎ𝜈∕k 𝑇) ≈ 1 + ℎ𝜈∕k 𝑇, worauf Gl. (14.66) sich auf den klassischen Gleichverteilungssatz E ≈ k𝑇 reduziert, sodass 𝜚(𝜈) ≈ 8π 𝜈2 k𝑇∕𝑐3 wird. Die von einem schwarzen Strahler ausgestrahlte Gesamtleistung nimmt steil – wie 𝑇 4 – mit der Temperatur zu; dieses Resultat ist als Stefan-Boltzmann-Gesetz bekannt. Obwohl sie keine idealen schwarzen Strahler sind, befolgt das von Sternen oder Planeten emittierte Licht Gl. (14.67) recht gut. Die Temperaturen der Sonne und der Erde ergeben sich aus dem Stefan-BoltzmannGesetz zu 5800 bzw. 300 K. Übung 14-3: Die Frequenz maximaler Energiedichte eines schwarzen Strahlers
Zeigen Sie mithilfe des Strahlungsgesetzes 𝜚(𝜈) des schwarzen Strahlers, dass die Frequenz 𝜈p , bei der die spektrale Energiedichte maximal ist, die Gleichung 3(1 − e−𝑥 ) = 𝑥 mit 𝑥 = ℎ𝜈p ∕k𝑇 erfüllt. Bestimmen Sie 𝑥 näherungsweise und berechnen Sie 𝜈p für 𝑇 = 300 K.
Thermographie
Gleichung (14.67) für die spektrale Energiedichte eines schwarzen Strahlers ist nützlich, um Karten (Bilder) der Temperaturverteilung von thermischen Gegenständen zu erzeugen. Dazu verwendet man eine Kamera, die im Wellenlängenbereich der thermischen Emissionen des Gegenstands empfindlich ist (siehe Abb. 14.31). Heiße Gegenstände wie z. B. die Sonne strahlen am stärksten im sichtbaren Bereich, wohingegen Gegenstände mit gemäßigter Temperatur wie die Erde oder Menschen normalerweise im mittleren Infrarot strahlen. Kalte Gegenstände strahlen im fernen Infrarot. Die Abbildung von thermischen Objekten über ihre Eigenstrahlung ist als Thermographie bekannt. Thermographiekameras enthalten eine Reihe von Photodetektoren, die in spe-
40
50
60
70
80
90 100 110 °C
22
24
26
28
30
32
34
ziellen Spektralbereichen empfindlich sind (siehe Abschnitt 19.5). Die Methode wird häufig im Wellenlängenbereich 0.7 μm ≤ 𝜆0 ≤ 300 μm entsprechend 12 K ≤ 𝑇 ≤ 5200 K eingesetzt. Höheren Temperaturen erleichtern die Thermographie wegen der 𝑇 4 -Abhängigkeit der ausgestrahlten Gesamtleistung, der Anwendungsbereich des Verfahrens ist jedoch sehr breit, wie die Bilder in Abb. 14.32 zeigen. Thermographie wird verwendet, um Informationen über Gegenstände und Szenen mit Temperaturschwankungen zu erfassen. Unterschiedliche lokale Temperaturen werden normalerweise durch eine Falschfarbendarstellung gezeigt. Die Methode wird in der Industrie z. B. zur Kontrolle der Überhitzung von Schaltkreisen oder der Entwicklung von Ölverschmutzungen eingesetzt. Sie hilft bei Such- und Rettungsaktionen von Menschen und Tieren, selbst wenn sie nachts unter dichtem Laub verborgen sind. Die Thermographie wird auch in der klinischen Medizin verwendet, da die Temperatur der Hautoberfläche zur Diagnose von Störungen der Blutzirkulation oder Tumoren dienen kann. In der Umwelttechnologie wird die Thermographie bei der Brandbekämpfung und der Forstwirtschaft eingesetzt. In der Astronomie und Kosmologie ist ihr Nutzen unschätzbar, da sie es ermöglicht, astronomische Objekte wie kühlere rote Sterne und rote Riesen im nahen Infrarot zu beobachten, Planeten, Kometen und Asteroiden im mittleren Infrarot, und Regionen um das Zentrum der Milchstraße oder Emissionen von kaltem Staub im fernen Infrarot.
14.5 Lumineszenz und Lichtstreuung Thermische Anregung ist nicht die einzige Möglichkeit, wie ein atomares oder molekulares System in ein höheres Energieniveau angeregt und zur Emission von Licht befähigt werden kann. Andere Möglichkeiten der Anregung, wie Elektronenstöße oder Schallwellen, können ebenfalls zur Emission von Licht führen, wenn das System zu seinem Grundzustand zurückkehrt. Anregung
36°C 15 K
(a)
(b)
36 K
60 K
(c)
Abb. 14.32 Typische thermographische Bilder in unterschiedlichen Temperaturbereichen. (a) Systemanalyse in der Industrie, (b) Suche und Rettung, (c) Kosmologie.
14.5 Lumineszenz und Lichtstreuung
durch ein oder mehrere Photonen kann zu Photolumineszenz führen. Nichtthermische Strahler werden als lumineszierende Strahler bezeichnet und die zugehörigen Strahlungsprozesse als Lumineszenz. Während Photolumineszenz die Absorption und anschließende Emission von Photonen bezeichnet, kann Licht von einem atomaren oder molekularen System auch resonant oder nichtresonant gestreut werden. Verschiedene Formen der linearen und nichtlinearen Streuung wie Rayleigh- bzw. Ramanstreuung spielen in der Photonik wichtige Rollen.
14.5.1 Formen der Lumineszenz Die Lumineszenz wird nach der Art der Anregung klassifiziert, wie die folgenden Beispiele zeigen (siehe Abb. 14.33). Die meisten Laser arbeiten mit der Verstärkung von Lumineszenz durch induzierte Emission; bei der eigentlichen Lichtquelle handelt es sich meist um Photolumineszenz, stoßinduzierte Lumineszenz oder Elektrolumineszenz (siehe Kapitel 15–18).
Kathodolumineszenz
Kathodolumineszenz ist Licht, das von einem Material nach Anregung durch energiereiche Elektronen ausgestrahlt wird. Beispiele sind die Strahlen an der Front einer Kathodenstrahlröhre oder eines Bildverstärkers, die von den Elektronen in den Leuchtschirmen hervorgerufen werden. Kathodolumineszenz wird oft verwendet, um die Zusammensetzung eines Materials zu prüfen, da die Eindringtiefe in die Probe durch Änderung der Elektronenenergie variiert werden kann und unterschiedliche Bestandteile Emission bei unterschiedlichen Wellenlängen verursachen. Wenn die anregenden Elektronen das Produkt eines Betazerfalls sind, spricht man auch von Betalumineszenz. Sonolumineszenz
Sonolumineszenz beschreibt die durch akustische Kavitation (die Entstehung, das Wachstum und der Zusammenbruch von Blasen in einer Flüssigkeit, die mit sehr intensivem Schall oder Ultraschall bestrahlt wird) verursachte Emission von Licht aus einer Flüssigkeit. Das Licht besteht aus Blitzen im Pikosekundenbereich, wenn die zusammenbrechenden Blasen ihre minimale Größe erreichen. Sonolumineszenz wird aus Blasenwolken und unter bestimmten Umständen auch aus isolierten Blasen beobachtet. Es ist möglich, Einzelblasen-So-
(a) Kathodolumineszenz
(b) Sonolumineszenz
(c) Chemilumineszenz
(d) Biolumineszenz
(e) Elektrolumineszenz
(f) Photolumineszenz
Abb. 14.33 (a) Die Kathodolumineszenz einer Mineralprobe offenbart die Anwesenheit von zonarem Kalkspat und Satteldolomit in einer Boxwork-Breccie. Die Kantenlänge ist 1.3 mm und die Elektronenenergie ist 22 keV (mit freundlicher Genehmigung von Charles M. Onasch, Bowling Green State University). (b) Vielblasen-Sonolumineszenz einer Ultraschallhupe in einer Flüssigkeit (mit freundlicher Genehmigung von Kenneth S. Suslick, University of Illinois/ Urbana-Champaign). (c) Chemilumineszenz eines Leuchtstabs. (d) Die Tiefseequalle Atolla vanhoeffeni (Durchmesser
≈ 3 cm) kommt auf der ganzen Welt vor; sie produziert Biolumineszenz, wenn sie gestört wird (mit freundlicher Genehmigung von Edith A. Widder, Ocean Research & Conservation Association). (e) Das elektrische Feld zwischen zwei parallelen Drähten auf unterschiedlichen Potentialen erzeugt Elektrolumineszenz in ihrer Pulverbeschichtung. (f) Photolumineszenz von kolloidalen in Hexan dispergierten CdSeQuantenpunkten nach UV-Bestrahlung (mit freundlicher Genehmigung von Dong Kyun Seo, Arizona State University).
447
448
14 Licht und Materie
nolumineszenzblitze mit einer stabilen Periode und an einem festen Ort zu erzeugen, indem man einzelne Blasen in einer akustischen stehenden Welle einschließt. Chemilumineszenz
Chemilumineszenz ist die durch eine chemische Reaktion hervorgerufene Emission von Licht. Sie ist dann zu beobachten, wenn die Reaktion zwischen zwei oder mehr Chemikalien genügend Energie freisetzt, um den angeregten Zustand eines Reaktionsprodukts zu erzeugen. Leuchtstäbe glimmen beispielsweise, wenn die Abtrennung zwischen zwei Behältern mit Chemikalien zerbrochen wird und die Substanzen sich vermischen und reagieren. Die Farbe des ausgestrahlten Lichts wird durch den Farbstoff in der Mischung bestimmt. Leuchtstäbe werden für die Beleuchtung in militärischen Umgebungen und unter Wasser verwendet. Die Chemilumineszenz ist die Grundlage von chemischen Lasern (Abschnitt 16.4.5). Biolumineszenz
Biolumineszenz ist Chemilumineszenz, die durch lebende Organismen wie Leuchtkäfer oder Glühwürmchen erzeugt wird. Sie dient als Kommunikationsmittel, und einige Organismen wie Leuchtkäfer synchronisieren ihre Blitze. Viele Tiefseeorganismen erzeugen natürliche Biolumineszenz, häufig im blauen Bereich des Spektrums, in dem Meerwasser transparent ist. Biologen bauen häufig biolumineszente Proteine aus Quallen in die Gene anderer Arten ein, um die Genexpression optisch verfolgen zu können; ein häufiges Beispiel hierfür ist das Gen für das grün fluoreszierende Protein (GFP, engl. green fluorescing protein). Wenn dieses Gen in der Nähe des Gens für ein zu untersuchendes Protein einer Spezies eingebaut wird, dann wird dieses bei der Genexpression mit dem leuchtend fluoreszierenden GFP markiert, wodurch es in vivo optisch nachgewiesen werden kann. Elektrolumineszenz
Elektrolumineszenz ist Licht, das durch die Anwendung eines elektrischen Feldes auf ein Material entsteht. Ein wichtiges Beispiel ist die Injektionselektrolumineszenz, die auftritt, wenn eine elektrische Spannung in Durchlassrichtung an einen Halbleiterübergang angelegt wird, wie z. B. in einer LED (siehe Kapitel 18). Die Kombination der injizierten Elektronen aus dem Leitungsband mit Löchern aus dem Valenzband bewirkt die Emission von Photonen.
Photolumineszenz
Photolumineszenz ist Licht, das von einer Probe nach der Absorption von optischen Photonen emittiert wird. Ein Beispiel ist das Leuchten einiger Substanzen bei Bestrahlung mit UV-Licht. Die Photolumineszenz, die im folgenden Abschnitt im Detail besprochen wird, ist ein nützliches Werkzeug für die Untersuchung der Eigenschaften von Halbleitern. Sie ist die Grundlage der weißen LED und vieler Laser. Wenn die absorbierten Photonen im Bereich der Röntgen- oder Gammastrahlung liegen, spricht man von Radiolumineszenz. Fluoreszenz und Phosphoreszenz
Lumineszenz, die sehr kurz nach der Anregung auftritt, wird als Fluoreszenz bezeichnet; typische Fluoreszenzlebensdauern liegen bei einigen Piko- bis Mikrosekunden. Für organische Substanzen (Abb. 14.12) tritt Fluoreszenz dann auf, wenn die strahlenden Übergänge spinerlaubt sind, d. h. wenn sie zwischen zwei Zuständen mit gleicher Multiplizität stattfinden (z. B. Singulett → Singulett oder Triplett → Triplett). Lumineszenz, die erst verzögert nach der Anregung erscheint, wird Phosphoreszenz genannt. In organischen Substanzen tritt Phosphoreszenz dann auf, wenn die strahlenden Übergänge spinverboten sind (z. B. Triplett → Singulett).
14.5.2
Photolumineszenz
Einphotonen-Photolumineszenz
Photolumineszenz tritt auf, wenn ein System durch Absorption eines Photons in ein höheres Energieniveau angeregt wird und dann spontan einen Übergang in ein niedrigeres Energieniveau vollzieht, wobei wieder ein Photon emittiert wird. Wegen der Energieerhaltung kann das ausgestrahlte Photon keine größere Energie haben als das anregende Photon. Mehrere Beispiele von Übergängen, die zu Photolumineszenz führen, sind in Abb. 14.34 schematisch dargestellt. An dem Prozess können auch nichtstrahlende Übergänge in niedrigere Niveaus beteiligt sein, wie durch die gestrichelten Linien in (b) und (c) angedeutet. Auch nichtstrahlende Übergänge in tiefere Zustände gefolgt von nichtstrahlenden Übergängen in höhere Zustände sind möglich, wie in (d) gezeigt ist. Photolumineszenz tritt natürlicherweise in zahlreichen Substanzen auf, beispielsweise in anorganischen Molekülen und Kristallen, Edelgasen, aromatischen Molekülen und Halbleitern. Zu den Anwendungen der Photolumineszenz gehören beispielsweise • Die Verkleinerung der Frequenz eines Photons, z. B. die Umwandlung eines UV-Photons in ein sichtbares Photon.
14.5 Lumineszenz und Lichtstreuung
(a)
(b)
(c)
(d)
Abb. 14.34 Verschiedene Formen der Einphotonen-Photolumineszenz in Materialien mit unterschiedlichen Energieniveaustrukturen. Durchgezogene Linien bezeichnen strahlende Übergänge; gestrichelte Linien nichtstrahlende.
• Die Umwandlung eines UV-Photons in ein Paar von sichtbaren Photonen; ein Prozess, der als Quantum Cutting bezeichnet wird. • Die Verzögerung von Photonen durch Speicherung in einem langlebigen Zwischenzustand wie beispielsweise einer Falle. • Die Erzeugung von weißem Licht durch LeuchtstoffLED, in denen blaue Photon aus der eigentlichen LED auf eine gelbliche Lumineszenzschicht treffen; die resultierende Kombination aus gelb und blau erscheint für das menschliche Auge weiß (Abschnitt 18.1.6). • Die Verwendung als Starter für optisch gepumpte Laser. Mehrphotonen-Photolumineszenz
Photolumineszenz kann auch auftreten, wenn ein System durch die Absorption von mehr als einem Photon in ein höheres Energieniveau angeregt wird und danach durch einen spontanen Übergang unter Emission eines Photons wieder in ein niedrigeres Energieniveau übergeht. Die anregenden Photonen können dieselbe oder unterschiedliche Energien besitzen, und das ausgestrahlte Photon kann eine größere Energie als eines der anregenden Photonen besitzen. Mehrphotonen-Fluoreszenzmikroskopie
Zwei oder mehr Photonen derselben Energie können ein System gemeinsam in ein höheres Energieniveau anheben, von dem aus Photolumineszenz (Fluoreszenz) eintritt, wie schematisch in Abb. 14.35(a) und (b) dargestellt. Zweiphotonenfluoreszenz, die in Abb. 14.35(a) illustriert ist, ist die Basis einer bildgebenden Technik, der
Zweiphotonenmikroskopie (2PM, engl. two-photon microscopy). Dabei absorbiert ein fluoreszierender Marker (das Fluorophor), der an spezifische Stellen einer Probe gebunden ist, ein Paar von Photonen der Energie ℎ𝜈1 und emittiert dann ein einzelnes Fluoreszenzphoton mit der Energie ℎ𝜈2 > ℎ𝜈1 , das nachgewiesen wird. Das ermöglicht eine zeitlich aufgelöste Abbildung der Positionen des Fluorophors in der Probe. Die Emission findet innerhalb der Lebensdauer des angeregten Fluorophors statt, die typischerweise in der Größenordnung von Nanosekunden liegt. Die Verwendung von Fluorophoren, die für eine bestimmte biologische Aktivität empfindlich sind, ermöglicht sogar eine gleichzeitige funktionale Abbildung. Wie in Abschnitt 13.2.3 gezeigt ist die Wahrscheinlichkeit, zwei unabhängig ankommende Photonen an einem gegebenen Ort zu einer gegebenen Zeit zu beobachten, das Quadrat der Wahrscheinlichkeit, ein einzelnes solches Photon zu beobachten. Aufgrund von Gl. (13.15) ist die Zweiphotonen-Absorptionsrate am Ort r zur Zeit 𝑡 ebenso wie die Emissionsrate der Fluoreszenzphotonen eine quadratische Funktion der einfallenden Intensität, d. h. sie ist proportional zu 𝐼 2 (r, 𝑡). Der Vorteil von 2PM ist zum großen Teil in dieser quadratischen Abhängigkeit begründet: Ein fokussierter Anregungsstrahl bewirkt eine lokale Absorption in der unmittelbaren Umgebung des Brennpunkts, da Zweiphotonenabsorption bevorzugt dort auftritt, wo die Intensität am größten ist. Im Vergleich mit der gewöhnlichen (Einzelphotonen-) Mikroskopie wird die Region, aus der Fluoreszenz beobachtet wird, dadurch kleiner; die Auflösung dadurch größer. Außerdem wird der Hintergrund aufgrund von
hν1
hν1 hν2
hν1
hν1
hν2
hν2
hν3
hν1 (a)
(b)
(c)
Abb. 14.35 (a) Zweiphotonenfluoreszenz. (b) Dreiphotonenfluoreszenz. (c) Summenfrequenz-Fluoreszenz. In allen drei Prozessen ist angenommen, dass nichtstrahlende Relaxation am Abbau der Anregung beteiligt ist; andere Szenarien sind ebenfalls möglich.
449
450
14 Licht und Materie
Fluoreszenz außerhalb der Brennebene reduziert. Ein anderer Vorteil der 2PM im Bereich der Biologie ist die doppelte Wellenlänge der Anregung, da größere Wellenlängen tiefer in biologisches Gewebe eindringen. Um sicherzustellen, dass die maximale Intensität groß genug ist, damit Zweiphotonenabsorption eintritt, und die mittlere Intensität klein genug, damit Schäden an empfindlichem Gewebe vermieden werden, wird die Anregung häufig mit einem modengekoppelten Laser durchgeführt, der ultrakurze optische Pulse (im Bereich von Femtosekunden) mit einer hohen Leistungsspitze abgibt, aber eine niedrige mittlere Leistung besitzt. Die Mehrphotonenmikroskopie arbeitet nach demselben Prinzip, nur dass nicht zwei, sondern 𝑘 unabhängige Photonen die Absorption bewirken, sodass die Emissionsrate der Fluoreszenzphotonen wie 𝐼 𝑘 (r, 𝑡) variiert. Insbesondere die Dreiphotonenmikroskopie (3PM) ist in der Medizin eine wertvolle Technik zur Durchführung einer nichtinvasiven hochauflösenden Bildgebung in vivo im Hirngewebe. Im Vergleich zu 2PM führt das 𝐼 3 (r, 𝑡)-Verhalten der Emissionsrate der Fluoreszenzphotonen zusammen mit der größeren Anregungswellenlänge [vgl. Abb. 14.35(a) und (b)] zu einer tieferen Penetration in das Hirngewebe und einer verbesserten Leistung. Die 3PM erfordert optische Pulse mit ausreichend hoher Energie, kurzer Dauer und langer Wellenlänge. Die optimalen Wellenlängen für die Bildgebung von Hirngewebe liegen um 1300 nm für blaue und grüne Fluorophore und um 1700 nm für orange und rote Fluorophore. Eine strukturelle und funktionelle Bildgebung von Neuronen tief im intakten Säugetiergehirn wurde unter Verwendung eines calciumempfindlichen GFP-Fluorophors durchgeführt, das gegenüber neuronaler Aktivität empfindlich war, sowie mit ultrakurzen Pulsen mit einer Wellenlänge von 1300 nm, die von einem nichtkollinearen optischen parametrischen Verstärker erzeugt wurden. 3PM-Bildgebung in tieferen Hirnschichten wurde auch unter Verwendung eines roten Fluorophors durchgeführt, der durch optische Solitonen mit einer Wellenlänge von 1675 nm angeregt wurde, die in einem Stab aus einem photonischen Kristall erzeugt wurden (Beispiel 23-11). Dreidimensionale Mehrphotonen-Mikrolithographie
Ein ganz ähnlicher Ansatz wird zur Herstellung von Mikroobjekten verwendet. Eine Linse liefert optische Hochleistungspulse an einen definierten Ort in einem speziell entworfenen transparenten Polymer. Nur in der unmittelbaren Umgebung des Brennpunkts hat das Licht eine ausreichend hohe Intensität, um Mehrphotonenpolymerisation auszulösen; es erreicht diese Zielzone, ohne das umgebende Material zu beeinflussen.
Durch Bewegen des Brennpunkts durch das Material kann jede gewünschte dreidimensionale Mikrostruktur hergestellt werden. In der Praxis vergrößert das starke Schwellenverhalten der Polymerisation die Auflösung noch weiter. Summenfrequenz-Fluoreszenz
Mehrphotonen-Photolumineszenz kann auch auftreten, wenn die beiden Photonen, die das System anregen, unterschiedliche Energien besitzen, wie in Abb. 14.35(c) dargestellt. Diese Situation ist für die Konversion von Infrarotphotonen zu sichtbaren Photonen nützlich. Ein Infrarotphoton der niedrigen Energie ℎ𝜈1 regt dabei zusammen mit einem Hilfsphoton der Energie ℎ𝜈2 ein System an, das dann ein Lumineszenzphoton mit der Energie ℎ𝜈3 = ℎ𝜈1 + ℎ𝜈2 produziert. Summenfrequenz-Fluoreszenz durch sukzessive Absorption kann am einfachsten in Materialien mit Speicherzuständen beobachtet werden, die das durch das erste Photon angeregte Elektron einige Zeit speichern können, bis das zweite Photon absorbiert wird und das System endgültig in seinen oberen Zustand befördert. Hierzu werden häufig mit Seltenerdionen wie Er3+ dotierte Leuchtstoffe verwendet. In einigen Materialien können die Zwischenzustände durch Belichtung des Materials mit Tages- oder Neonlicht, die die Hilfsphotonen der Energie ℎ𝜈2 zur Verfügung stellen, in einigen Minuten aufgeladen werden. Ein Infrarotphoton der Energie ℎ𝜈1 löst dann ein Elektron aus dem Speicherzustand und ein Lumineszenzphoton der Energie ℎ(𝜈1 + 𝜈2 ) im sichtbaren Bereich wird emittiert. Summenfrequenz-Fluoreszenz kann auch über einen komplexeren Prozess zustande kommen, z. B. durch kollektive Emission aus zwei benachbarten angeregten Ionen. Derartige Bauelemente werden häufig in Form einer kleinen reflektierenden oder durchsichtigen Karte mit einer aktiven Fläche von ungefähr 5 × 5 cm2 vertrieben, die unter der Bezeichnung Infrarotsensorkarte bekannt ist. Das aktive Material ist hier als Pulver zwischen zwei steifen transparenten Plastikplatten eingeschlossen oder alternativ in einem Polymerblock dispergiert, was eine dreidimensionale Betrachtung möglich macht. Obwohl der Wirkungsgrad der Konversion normalerweise ziemlich klein ist, sind diese Karten hilfreich, um die räumliche Verteilung eines Infrarotstrahls, z. B. aus einem Infrarotlaser, visuell kontrollieren zu können. Die relative spektrale Empfindlichkeit und die spektrale Intensität der Emission einer kommerziell verfügbaren Karte sind in Abb. 14.36 dargestellt.
14.5 Lumineszenz und Lichtstreuung
InfrarotEmission im Sichtbaren
400
800
1000 1200 Wellenlänge / nm
1400
1600
Abb. 14.36 Spektrale Empfindlichkeit im Infraroten und relative spektrale Intensität der sichtbaren SummenfrequenzFluoreszenz einer handelsüblichen Infrarotsensorkarte.
14.5.3 Lichtstreuung Wie in Abschnitt 14.5.2 betrachtet, beruht die Photolumineszenz auf der resonanten Absorption eines Photons in einem Übergang zwischen dem Grundzustand und einem realen angeregten Zustand; die anschließende Relaxation des angeregten Zustands zurück zum Grundzustand verläuft unter Emission eines Lumineszenzphotons. Absorption und anschließende Emission aus einem realen angeregten Zustand sind die charakteristischen Eigenschaften von Lumineszenz, Fluoreszenz und Phosphoreszenz. Im Gegensatz dazu können an Streuprozessen auch Übergänge beteiligt sein, die über virtuelle Zustände verlaufen. Da derartige Wechselwirkungen nichtresonant sein können, kann Licht über einen breiten Bereich von Frequenzen gestreut werden. Wir betrachten wiederum drei in der Photonik wichtige Streuprozesse: Rayleigh-, Raman- und Brillouinstreuung (siehe Abb. 14.37). Streuung tritt unter vielen Umständen automatisch und unvermeidlich auf, kann aber auch nützlich sein, um Auskunft über die Eigenschaften von Materialien zu geben und um nützliche Lichtquellen herzustellen. Rayleighstreuung
Die Rayleighstreuung ist ein Prozess, in dem ein Material ein einfallendes Photon veranlasst, seine Richtung zu wechseln. Die Wechselwirkung ist energieerhaltend (elastisch), d. h. das gestreute Photon hat dieselbe Energie wie das einfallende Photon, wie Abb. 14.37(a) sche-
hν1
hν1
hνS
hν1
matisch zeigt. Rayleighstreuung kommt in Gasen, Flüssigkeiten und Festkörpern vor. Sie entsteht durch Variationen in einem Medium wie die zufälligen Brechungsindex-Inhomogenitäten in Glas (siehe Abschnitt 10.3.1) oder durch die Anwesenheit von Teilchen, deren Abmessungen viel kleiner sind als die Wellenlänge des Lichts, wie z. B. Elektronen, Atome, Moleküle oder Nanoteilchen. Die gestreute Intensität ist proportional zu 𝜈4 und daher zu 1∕𝜆04 , wobei 𝜈 und 𝜆0 die Frequenz bzw. die Wellenlänge der Beleuchtung sind. Kleine Wellenlängen werden demzufolge stärker gestreut als große Wellenlängen; die Rayleighstreuung ist für die blaue Farbe des Himmels verantwortlich. Die Streuung an kugelförmigen Teilchen mit Durchmessern größer als etwa 𝜆0 ∕10 wird als Miestreuung bezeichnet; sie hängt nicht sehr von der Wellenlänge der Beleuchtung ab und ist für den weißen Schein um Lichter bei Nebel oder Dunst verantwortlich (Abschnitt 5.6.3). Ramanstreuung
Bei der Ramanstreuung erscheint ein Photon der Frequenz ℎ𝜈1 nach der Wechselwirkung mit einem Material bei einer niedrigeren Frequenz ℎ𝜈S = ℎ𝜈1 − ℎ𝜈R (Stokesstreuung) oder einer höheren Frequenz ℎ𝜈A = ℎ𝜈1 + ℎ𝜈R (anti-Stokesstreuung), wie in Abb. 14.37(b) bzw. (c) gezeigt. Ramanstreuung kommt in Gasen, Flüssigkeiten und Festkörpern vor. Im Unterschied zur Rayleighstreuung ist die Ramanstreuung inelastisch; die Veränderung der Photonenfrequenz wird durch einen Austausch von Energie ℎ𝜈R mit einer Schwingungsund/oder Rotationsmode eines Moleküls oder Festkörpers verursacht. Bei der Stokesstreuung überträgt das Photon Energie auf das Material; bei der anti-Stokesstreuung ist es umgekehrt. Das Spektrum des an einem Material gestreuten Lichts enthält damit im Allgemeinen eine rayleighgestreute Komponente mit der Frequenz des einfallenden Lichts sowie rot- und blauverschobene Seitenbanden entsprechend der inelastisch gestreuten Stokes- bzw. anti-Stokeskomponenten. Obwohl die Leistung der Seitenbanden für nichtresonante Wechselwirkungen normalerweise schwach ist, typischerweise um einen Faktor 10−7 kleiner als die des einfallen-
hνA
hν1
hνS
hν1
hνR
hνB
hνR (a)
(b)
(c)
(d)
Abb. 14.37 Verschiedene Formen der Lichtstreuung: (a) Rayleigh-, (b) Raman(Stokes-), (c) Raman- (antiStokes-) und (d) Brillouinstreuung. Gestrichelte horizontale Linien zeigen virtuelle Zustände und somit nichtresonante Streuung an.
451
452
14 Licht und Materie
den Lichts, ist Ramanstreuung nützlich, um Materialien zu charakterisieren. In kristallinen Materialien ist das Schwingungsspektrum in der Regel diskret und die Ramanlinien sind schmal. Gläser haben im Gegensatz dazu breite Schwingungsbanden, die wiederum breite Ramanspektren verursachen. Die in Abb. 14.37(d) dargestellte Brillouinstreuung ähnelt der Ramanstreuung, nur dass der Austausch von Energie ℎ𝜈B mit akustischen und nicht mit Schwingungsmoden des Mediums erfolgt. Induzierte Ramanstreuung
Induzierte Ramanstreuung kann auftreten, wenn ein Photon zusammen mit einem Pumpphoton einer höheren Frequenz in ein nichtlineares optisches Medium eintritt (siehe Ausschnitt in Abb. 15.21). Das Photon induziert die Emission eines zweiten Photons, das sich durch Stokesverschiebung des Pumpphotons ergibt, sodass seine Frequenz genau der des Eingangsphotons entspricht. Die überschüssige Energie des Pumpphotons wird auf die Schwingungsmoden des Mediums übertragen. Der Prozess ähnelt der induzierten Emission, aber die Ramanwechselwirkung ist ein parametrischer nichtlinearer optischer Prozess dritter Ordnung (siehe Abschnitt 22.3.2). Die induzierte Ramanstreuung ist bei der Konstruktion optischer Verstärker (siehe Abschnitt 15.3.4) und Laser (siehe Abschnitt 16.3.1) nützlich. Die Ramanverstärkung und entsprechende Laser haben den Charme, dass die Bandbreite, über die sie realisiert werden können, durch das Schwingungsspektrum des Materials und nicht durch die Linienbreite einer induzierten Emission bestimmt ist. Das Schwingungsspektrum von Glas ist besonders breit, sodass ein Abschnitt einer optischen Faser über eine Bandbreite von Hunderten von Nanometern als optischer Verstärker oder Laser dienen kann. Optische Ramanverstärker und Ramanfaserlaser werden in optischen Nachrichtensystemen (siehe Abschnitt 25.2.3) häufig eingesetzt. Die induzierte Ramanstreuung ist auch als spektroskopisches Werkzeug nützlich, da sie die grundlegenden Schwingungseigenschaften eines Materials offenbaren kann. Die Empfindlichkeit der ramanbasierten Spektroskopie kann durch kohärente anti-Stokes-Ramanstreuung (CARS, von engl. coherent anti-Stokes Raman scattering) erhöht werden, bei der zwei Pumplaser verwendet werden, deren Frequenzunterschied mit der Schwingungsfrequenz des untersuchten Materials in Resonanz ist, was den Wirkungsgrad der Wellenmischung vergrößert. In einer weiteren wichtigen Anwendung werden optische Fasern verwendet, um mithilfe von Ramanprozessen breitbandiges Licht zu erzeugen. Dabei erzeugt ein
Pumplaser eine ramangestreute spontane Emission, die durch induzierte Ramanstreuung verstärkt wird, während sich das Licht durch die Faser ausbreitet. Für eine optische Faser mit hinreichend großer Länge und einen hinreichend starken Pumplaser induziert das resultierende Ramanspektrum noch weitere Ramankonversionen, wodurch letztlich breitbandiges Licht entsteht (siehe Abschnitt 23.5.3). Eine Stabilisierung des Prozesses kann erreicht werden, indem man einen Resonator verwendet. Die induzierte Brillouinstreuung funktioniert ganz ähnlich, nur dass hier akustische Schwingungen anstelle von Molekülschwingungen verwendet werden.
Aufgaben Aufgabe 14-1: Vergleich von induzierter und spontaner Emission
Ein Atom mit zwei Energieniveaus entsprechend einem Übergang mit 𝜆0 = 0.7 μm, 𝑡sp = 3 ms, Δ𝜈 = 50 GHz und Lorentzlinienform befindet sich in einem Resonator mit dem Volumen 𝑉 = 100 cm3 und dem Brechungsindex 𝑛 = 1. Zwei Strahlungsmoden mit den Mittenfrequenzen 𝜈0 und 𝜈0 + Δ𝜈 enthalten jeweils 1000 Photonen. Bestimmen Sie die Wahrscheinlichkeitsdichte für die induzierte Emission (oder Absorption). Bestimmen Sie außerdem die Zeitkonstante für die Abnahme von 𝑁2 durch induzierte und spontane Emission, wenn 𝑁2 solcher Atome in das Niveau 2 angeregt sind. Wie viele Photonen müssten vorhanden sein, damit die Abklingrate durch induzierte Emission gleich der durch spontane Emission ist? Aufgabe 14-2: Spontane Emission in vorgegebene Moden
(a) Betrachten Sie einen kubischen Hohlraum mit dem Volumen 1 μm3 , der ein Medium mit dem Brechungsindex 𝑛 = 1 enthält. Wie sind die Modenindizes (𝑞1 , 𝑞2 , 𝑞3 ) der niedrigsten und der nächsthöheren Mode (siehe Kapitel 11)? Zeigen Sie, dass ihre Frequenzen 260 und 367 THz sind. (b) Betrachten Sie ein einzelnes angeregtes Atom in dem Hohlraum, wenn er keine Photonen enthält. 𝑝sp1 sei die Wahrscheinlichkeitsdichte (in s−1 ), dass das Atom spontan ein Photon in die (2, 1, 1)-Mode emittiert, und 𝑝sp2 die Wahrscheinlichkeitsdichte, dass es spontan ein Photon mit der Frequenz 367 THz emittiert. Bestimmen Sie das Verhältnis 𝑝sp2 ∕𝑝sp1 . Aufgabe 14-3: Geschwindigkeitsgleichungen für breitbandige Strahlung
Ein Resonator enthält Atome mit zwei Energieniveaus 1 und 2 entsprechend einem Übergang der Resonanzfre-
Aufgaben
quenz 𝜈0 und der Linienbreite Δ𝜈. Es liegen N1 Atome im tieferen Niveau 1 und N2 Atome im höheren Niveau 2 vor, und die Moden in einem breiten Band um 𝜈0 enthalten insgesamt n Photonen. Die Photonen entkommen infolge von unvollkommener Reflexion an den Wänden mit einer Geschwindigkeit 1∕𝜏𝑝 aus dem Resonator. Nehmen Sie an, dass es keine nichtstrahlenden Übergänge zwischen den Niveaus 2 und 1 gibt, und formulieren Sie Geschwindigkeitsgleichungen für N 2 und n. Aufgabe 14-4: Gehemmte spontane Emission
Betrachten Sie einen hypothetischen zweidimensionalen schwarzen Strahler (z. B. eine quadratische Platte der Fläche A) im thermischen Gleichgewicht bei der Temperatur 𝑇. (a) Bestimmen Sie die Modendichte M(𝜈) und die spektrale Energiedichte (d. h. die Energie pro Flächeneinheit im Frequenzbereich zwischen 𝜈 und 𝜈 + d𝜈) der emittierten Strahlung 𝜚(𝜈) (siehe Abschnitt 11.3). (b) Bestimmen Sie die Wahrscheinlichkeitsdichte 𝑃sp der spontanen Emission für ein Atom in einem Hohlraum, der Strahlung nur in zwei Dimensionen erlaubt. Ein solcher Hohlraum kann z. B. aus omnidirektionalen photonischen Reflektoren oberhalb und unterhalb einer Platte hergestellt werden. Aufgabe 14-5: Vergleich der induzierten und spontanen Emission im Spektrum eines schwarzen Strahlers
Bestimmen Sie die Temperatur eines schwarzen Strahlers im thermischen Gleichgewicht, der eine spektrale Energiedichte 𝜚(𝜈) besitzt, wenn die Raten der induzierten und spontanen Emission von den Atomen in den Wänden bei 𝜆0 = 1 μm gleich sind.
Modendichte M(𝜈) (die Zahl der Moden pro Einheitsfrequenz pro Längeneinheit) in einer Dimension. (b) Bestimmen Sie die spektrale Energiedichte 𝜚(𝜈) (d. h. die Energie im Frequenzintervall zwischen 𝜈 und 𝜈 + d𝜈 pro Längeneinheit) der Strahlung des schwarzen Strahlers, wenn die mittlere Energie einer Mode der Frequenz 𝜈 gleich E ist. Skizzieren Sie 𝜚(𝜈) als Funktion von 𝜈. Aufgabe 14-8: Das Stefan-Boltzmann-Gesetz
Verwenden Sie die spektrale Energiedichte für die Strahlung des schwarzen Strahlers aus Gl. (14.67), um zu bestätigen, dass die von einem schwarzen Strahler emittierte Gesamtleistung im Einklang mit dem Stefan-Boltzmann-Gesetz proportional zu 𝑇 4 ist. Bestimmen Sie die Proportionalitätskonstante. Hinweis: ∞ ∫0 𝑥3 d𝑥∕(e𝑥 − 1) = π4 ∕15. Aufgabe 14-9: Die Statistik von Kathodolumineszenzlicht
Betrachten Sie einen Elektronenstrahl, der auf die Leuchtschicht einer Kathodenstrahlröhre auftrifft. m sei die mittlere Zahl von Elektronen, die pro Zeiteinheit auf eine Flächeneinheit der Leuchtschicht trifft. Bestimmen Sie die Gesamtverteilung 𝑝(n) der emittierten Kathodolumineszenzphotonen, wenn die Zahl m der Elektronen, die in einer festen Zeit ankommen, stochastisch mit einer Poissonverteilung ist, und die Zahl der pro Elektron emittierten Photonen ebenfalls poissonverteilt ist, aber mit dem Mittelwert 𝐺. Das Ergebnis ist als Neymanverteilung des Typs A bekannt. 1) Geben Sie Ausdrücke für den Mittelwert n und die Varianz 𝜎n2 an. Hinweis: Verwenden Sie bedingte Wahrscheinlichkeiten.
Weiterführende Literatur
Aufgabe 14-6: Das wiensche Gesetz
Leiten Sie einen Ausdruck für die spektrale Energiedichte 𝜚𝜆 (𝜆) her [die Energie pro Volumeneinheit im Wellenlängenintervall zwischen 𝜆 und 𝜆 + d𝜆 ist 𝜚𝜆 (𝜆) d𝜆]. Zeigen Sie, dass die Wellenlänge 𝜆p , bei der die spektrale Energiedichte maximal ist, die Gleichung 5(1 − e−𝑦 ) = 𝑦 erfüllt, wobei 𝑦 = ℎ𝑐∕𝜆p k 𝑇 ist, was bedeutet, dass die Beziehung 𝜆p 𝑇 = konstant (das wiensche Gesetz) erfüllt ist. Bestimmen Sie 𝜆p 𝑇 näherungsweise. Zeigen Sie, dass 𝜆p ≠ 𝑐∕𝜈p gilt, wobei 𝜈p die Frequenz ist, bei der die Energiedichte 𝜚(𝜈) des schwarzen Strahlers maximal ist (siehe Übung 14-3). Erklären Sie dieses Ergebnis. Aufgabe 14-7: Die spektrale Energiedichte eines eindimensionalen schwarzen Strahlers
Betrachten Sie einen hypothetischen eindimensionalen schwarzen Strahler der Länge 𝐿 im thermischen Gleichgewicht bei der Temperatur 𝑇. (a) Bestimmen Sie die
Quantenmechanik
Siehe auch die Literatur zu Kapitel 13 P. R. Berman, Introductory Quantum Mechanics: A Traditional Approach Emphasizing Connections with Classical Physics, Springer 2018. M. G. Raymer, Quantum Physics: What Everyone Needs to Know, Oxford University Press 2017. J. Greensite, An Introduction to Quantum Theory, IOP Publishing 2017. S. Weinberg, Lectures on Quantum Mechanics, Cambridge University Press, 2. Aufl. 2015. L. E. Ballentine, Quantum Mechanics: A Modern Development, World Scientific, 2. Aufl. 2015. 1) Siehe M. C. Teich, ‚Role of the Doubly Stochastic Neyman Type-A and Thomas Counting Distributions in Photon Detection‘, Applied Optics 20, 2457–2467, 1981.
453
454
14 Licht und Materie
L. Susskind, A. Friedman, Quantum Mechanics: The Theoretical Minimum, Basic/Perseus 2014. E. D. Commins, Quantum Mechanics: An Experimentalist’s Approach, Cambridge University Press 2014. D. A. B. Miller, Quantum Mechanics for Scientists and Engineers, Cambridge University Press 2008. L. D. Landau, E. M. Lifschitz, Quantenmechanik, Harri Deutsch 1992. P. A. M. Dirac, The Principles of Quantum Mechanics, Oxford University Press, 4. Aufl. 1958. Atom-, Molekül- und Festkörperphysik
Siehe auch die Literatur zu den Kapiteln 15–18 M. Dresselhaus, G. Dresselhaus, S. B. Cronin, A. G. S. Filho, Solid State Properties: From Bulk to Nano, Springer 2018. H. Friedrich, Theoretical Atomic Physics, Springer, 4. Aufl. 2017. J. B. Ketterson, The Physics of Solids, Oxford University Press 2016. P. Hofmann, Solid State Physics: An Introduction, WileyVCH, 2. Aufl. 2015. J. Lucas, P. Lucas, T. Le Mercier, A. Rollat, W Davenport, Rare Earths: Science, Technology, Production and Use, Elsevier 2015. C. Kittel, Introduction to Solid State Physics, Wiley, 8. Aufl. 2012. C. Cohen-Tannoudji, D. Guéry-Odelin, Advances In Atomic Physics: An Overview, World Scientific 2011. P. W Atkins, R. S. Friedman, Molecular Quantum Mechanics, Oxford University Press, 5. Aufl. 2011. D. Budker, D. F. Kimball, D. P. DeMille, Atomic Physics: An Exploration Through Problems and Solutions, Oxford University Press, 2. Aufl. 2008. M. Schwoerer, H. C. Wolf, Organic Molecular Solids, WileyVCH 2007. W. Demtröder, Molecular Physics: Theoretical Principles and Experimental Methods, Wiley-VCH 2005. M. Born, Atomic Physics, Blackie & Son, 8. Aufl. 1969; Dover, Nachdruck 1989. D. ter Haar, The Old Quantum Theory, Pergamon 1967 (enthält englische Übersetzungen früher Arbeiten von Planck, Einstein, Rutherford und Bohr). E. U. Condon, G. H. Shortley, The Theory of Atomic Spectra, Cambridge University Press 1935. Wechselwirkung zwischen Strahlung und Materie
Siehe auch die Literatur zu den Kapiteln 15–18 J. Weiner, F. Nunes, Light-Matter Interaction: Physics and Engineering at the Nanoscale, Oxford University Press, 2. Aufl. 2017. P. van der Straten, H. J. Metcalf, Atoms and Molecules Interacting with Light: Atomic Physics for the Laser Era, Cambridge University Press 2016.
G. Grynberg, A. Aspect, C. Fabre, Introduction to Quantum Optics: From the Semi-Classical Approach to Quantized Light, Cambridge University Press 2010. M. Planck, Planck’s Columbia Lectures: Abridged and Unabridged Versions, Adaptive Enterprises 2005. J. H. van Vleck, D. L. Huber, Absorption, Emission, and Linebreadths: A Semihistorical Perspective, Reviews of Modern Physics 49, 959–939, 1977. E. M. Purcell, ‚Spontaneous Emission Probabilities at Radio Frequencies‘, Proceedings of the American Physical Society, Cambridge, MA, April 25–27, 1946, Abstract B10. Physical Review 69, 681, 1946. M. Göppert-Mayer, ‚Über Elementarakte mit zwei Quantensprüngen‘, Annalen der Physik 9, 294–273, 1931. A. Einstein, ‚Zur Quantentheorie der Strahlung‘, Physikalische Zeitschrift 18, 128–121, 1917. Laserkühlung und -einschluss, Atomoptik und Bose-EinsteinKondensate
G. E. Marti, R. B. Hutson, A. Goban, S. L. Campbell, N. Poli, J. Ye, ‚Imaging Optical Frequencies with 100 μHz Precision and 1.1 μm Resolution‘, Physical Review Letters 120, 103201, 2018. C. W. Gardiner, P. Zoller, The Quantum World of UltraCold Atoms and Light. Book III: Ultra-Cold Atoms, World Scientific 2017. J. L. Bonn, A. M. Ray, J. Ye, ‚Cold Molecules: Progress in Quantum Engineering of Chemistry and Quantum Matter‘, Science 357, 1010–1002, 2017. P. H. Jones, O. M. Maragò, G. Volpe, Optical Tweezers: Principles and Applications, Cambridge University Press 2015. M. J. Padgett, J. Molloy, D. McGloin (Hrsg.), Optical Tweezers: Methods and Applications, CRC Press/Taylor & Francis 2010. A. D. Cronin, J. Schmiedmayer, D. E. Pritchard, ‚Optics and Interferometry with Atoms and Molecules‘, Reviews of Modern Physics 81, 1129–1051, 2009. V. Letokhov, Laser Control of Atoms and Molecules, Oxford University Press 2007. A. Ashkin, Optical Trapping and Manipulation of Neutral Particles Using Lasers: A Reprint Volume with Commentaries, World Scientific 2006. F. Bardou, J.-P. Bouchaud, A. Aspect, C. Cohen-Tannoudji, Lévy Statistics and Laser Cooling: How Rare Events Bring Atoms to Rest, Cambridge University Press 2002. W. Ketterle, ‚Nobel Lecture: When Atoms Behave as Waves: Bose-Einstein Condensation and the Atom Laser‘, Reviews of Modern Physics 74, 1151–1131, 2002. E. A. Cornell, C. E. Wieman, ‚Nobel Lecture: Bose-Einstein Condensation in a Dilute Gas, the First 70 Years and Some Recent Experiments‘, Reviews of Modern Physics 74, 893–875, 2002. P. Meystre, Atom Optics, Springer 2001.
Aufgaben
H. J. Metcalf, P. van der Straten, Laser Cooling and Trapping, Springer 1999. W. D. Phillips, ‚Laser Cooling and Trapping of Neutral Atoms‘, Reviews of Modern Physics 70, 741–721, 1998. C. N. Cohen-Tannoudji, ‚Manipulating Atoms with Photons‘, Reviews of Modern Physics 70, 719–707, 1998. S. Chu, ‚The Manipulation of Neutral Particles‘, Reviews of Modern Physics 70, 706–685, 1998. A. Einstein, ‚Quantentheorie des einatomigen idealen Gases‘, Sitzungberichte der Preussischen Akademie der Wissenschaften, 22, 267–261, 1924; 25, 14–3, 1925. Thermische Physik, Thermographie und Statistische Physik
J. P. Casquilho, P. I. C. Teixera, Introduction to Statistical Physics, Cambridge University Press 2015. H. J. W. Müller-Kirsten, Basics of Statistical Physics, World Scientific, 2. Aufl. 2013. M. J. R. Hoch, Statistical and Thermal Physics: An Introduction, CRC Press/Taylor & Francis 2011. A. L. Wasserman, Thermal Physics: Concepts and Practice, Cambridge University Press 2011. M. Vollmer, K.-P. Möllmann, Infrared Thermal Imaging: Fundamentals, Research and Applications, Wiley-VCH 2010. L. E. Reichl, A Modern Course in Statistical Physics, WileyVCH, 3. Aufl. 2009. C. Kittel, Elementary Statistical Physics, Wiley 1958; Dover, Nachdruck 2004. Lumineszenz, Mehrphotonenfluoreszenz und Streuung
K. Yasui, Acoustic Cavitation and Bubble Dynamics, Springer 2018. S. Martini, S. H. D. Haddock, ‚Quantification of Bioluminescence from the Surface to the Deep Sea Demonstrates Its Predominance as an Ecological Trait‘, Scientific Reports 7, 45750, 2017. U. Kubitscheck (Hrsg.), Fluorescence Microscopy, WileyVCH, 2. Aufl. 2017. D. G. Ouzounov, T. Wang, M. Wang, D. D. Feng, N. G. Horton, J. C. Cruz-Hernández, Y.-T. Cheng, J. Reimer, A. S. Tolias, N. Nishimura, C. Xu, ‚In Vivo Three-Photon Imaging of Activity of GCaMP6-Labeled Neurons Deep in Intact Mouse Brain‘, Nature Methods 14, 390–388, 2017. P. Lecoq, A. Gektin, M. Korzhik, Inorganic Scintillators for Detector Systems: Physical Principles and Crystal Engineering, Springer, 2. Aufl. 2016.
M. Gaft, R. Reisfeld, G. Panczer, Modern Luminescence Spectroscopy of Minerals and Materials, Springer, 2. Aufl. 2015. X. Chen, Y. Liu, D. Tu, Lanthanide-Doped Luminescent Nanomaterials: From Fundamentals to Bioapplications, Springer 2014. D. M. Jameson, Introduction to Fluorescence, CRC Press/ Taylor & Francis, 2014. K. Wang, N. G. Horton, C. Xu, ‚Going Deep: Brain Imaging with Multiphoton Microscopy‘, Optics & Photonics News 24(11), 39–32, 2013. N. G. Horton, K. Wang, D. Kobat, C. G. Clark, F. W. Wise, C. B. Schaffer, C. Xu, ‚In Vivo Three-Photon Microscopy of Subcortical Structures within an Intact Mouse Brain‘, Nature Photonics 7, 209–205, 2013. O. Shimomura, Bioluminescence, World Scientific 2012. J. R. Lakowicz, Principles of Fluorescence Spectroscopy, Springer, 3. Aufl. 2006. B. R. Masters, Confocal Microscopy and Multiphoton Excitation Microscopy: The Genesis of Live Cell Imaging, SPD3 Optical Engineering Press 2006. B. R. Masters (Hrsg.), Selected Papers on Multiphoton Excitation Microscopy, SPIE Optical Engineering Press, 2003 (Milestone Series Bd. 175). D. A. Long, The Raman Effect: A Unified Treatment of the Theory of Raman Scattering by Molecules, Wiley 2002. M. J. Damzen, V. I. Vlad, V. Babin, A. Mocofanescu, Stimulated Brillouin Scattering: Fundamentals and Applications, IOP Publishing 2002. B. H. Cumpston, S. P. Ananthavel, S. Barlow, D. L. Dyer, J. E. Ehrlich, L. L. Erskine, A. A. Heikal, S. M. Kuebler, I.-Y. S. Lee, D. McCord-Maughon, J. Qin, H. Röckel, M. Rumi, X.-L. Wu, S. R. Marder, J. W. Perry, ‚Two-Photon Polymerization Initiators for Three-Dimensional Optical Data Storage and Microfabrication‘, Nature 398, 54–51, 1999. M. J. Weber (Hrsg.), Selected Papers on Phosphors, Light Emitting Diodes, and Scintillators: Applications of Photoluminescence, Cathodoluminescence, Electroluminescence, and Radioluminescence, SPIE Optical Engineering Press 1998 (Milestone Series Bd. 151). W. Denk, J. H. Strickler, W. W. Webb, ‚Two-Photon Laser Scanning Fluorescence Microscopy‘, Science 248, 76–73, 1990. B. J. Berne, R. Pecora, Dynamic Light Scattering: With Applications to Chemistry, Biology, and Physics, Wiley 1976; Dover, Nachdruck 2000.
455
457
15 Laserverstärker Ein kohärenter optischer Verstärker ist ein Bauelement, das die Amplitude eines optischen Feldes vergrößert, während es seine Phase erhält. Wenn das optische Feld am Eingang eines solchen Verstärkers monochromatisch ist, ist auch der Ausgang mit derselben Frequenz monochromatisch. Die Ausgangsamplitude ist gegenüber dem Eingang vergrößert, während die Phase unverändert bleibt oder um einen festen Betrag verschoben wird. Im Gegensatz dazu vergrößert ein inkohärenter optischer Verstärker die Intensität einer optischen Welle, ohne ihre Phase zu erhalten. Kohärente optische Verstärker sind für zahlreiche Anwendungen wichtig; Beispiele sind die Verstärkung von schwachen optischen Pulsen wie z. B. solchen, die sich durch eine lange optische Faser ausgebreitet haben, oder die Erzeugung von sehr intensiven optischen Pulsen, wie sie beispielsweise für das Laserschmelzen erforderlich sind. Außerdem ist ein Verständnis der Grundprinzipien optischer Verstärker wichtig für die Analyse von optischen Oszillatoren (Lasern) in Kapitel 16. Das der kohärenten Verstärkung von Licht zugrunde liegende Prinzip ist die Lichtverstärkung durch induzierte Emission von Strahlung (engl. light amplification by stimulated emission of radiation), auch im Deutschen durch das Akronym Laser vertraut. Bei der induzierten Emission (siehe Abschnitt 14.3) veranlasst ein Photon in einer gegebenen Mode ein angeregtes Atom dazu, einen Übergang in ein niedrigeres Energieniveau zu vollziehen und dabei ein weiteres Photon in dieselbe Mode zu emittieren. Dieses emittierte Photon hat dieselbe Frequenz, Richtung und Polarisation wie das anfängliche Photon. Diese beiden Photonen können wiederum die Emission weiterer Photonen induzieren und so weiter. Das Ergebnis ist Laserverstärkung. Weil induzierte Emission nur auftritt, wenn die Photonenenergie nahezu gleich der Energiedifferenz des atomaren Übergangs ist, ist der Prozess auf ein Band von Frequenzen beschränkt, die durch die atomare Linienbreite bestimmt sind. Obwohl wir in diesem Kapitel fast durchgehend von „Atomen“ und „atomaren Energieniveaus“
Pumpstrahl
Atome Eingang Photonen
Ausgang Photonen
Abb. 15.1 Ein Laserverstärker. Eine äußere Energiequelle (ein Pumpstrahl) regt das aktive Medium (hier eine Ansammlung von Atomen) an und erzeugt eine Besetzungsinversion. Photonen wechselwirken mit den Atomen. Wenn die induzierte Emission über die Absorption überwiegt, wirkt das Medium als kohärenter Verstärker.
sprechen werden, sind diese Bezeichnungen allgemeiner als „aktive Medien“ und „Laserniveaus“ zu verstehen. Licht, das durch Materie im thermischen Gleichgewicht hindurchtritt, wird abgeschwächt. Der Grund dafür ist, dass die Absorption durch die große Zahl von Atomen im niedrigeren Energieniveau über die induzierte Emission aus der kleineren Zahl von Atomen im oberen Niveau überwiegt. Eine notwendige Bedingung für die Laserverstärkung ist daher die Anwesenheit einer größeren Zahl von Atomen im oberen Energieniveau als im unteren Niveau. Das ist eine Nichtgleichgewichtssituation, wie in Abschnitt 14.2 diskutiert wurde. Um eine solche Besetzungsinversion zu erreichen, muss eine Energiequelle die Atome in das höhere Energieniveau anregen (pumpen), wie Abb. 15.1 zeigt. Laserverstärkung unterscheidet sich in verschiedener Hinsicht von der elektronischen Verstärkung. Elektronische Verstärker vertrauen auf Bauelemente, in denen kleine Änderungen eines injizierten elektrischen Stroms oder einer angewandten Spannung zu großen Änderungen im Fluss von Ladungsträgern führen, wie beispielsweise Elektronen und Löchern in einem Feldeffekttransistor oder einem bipolaren Kontakttransistor. Abgestimmte elektronische Verstärker verwenden re-
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
Eingang
idealer Verstärker
Gewinn
Ausgang
Phase
(a) t
Eingang
t
realer Verstärker
ν
ν0
Gewinn
Ausgang
Phase
(b) t
t
ν0
ν
Amplitude aus
15 Laserverstärker
Amplitude ein
Amplitude aus
458
Amplitude ein
Abb. 15.2 (a) Ein idealer Verstärker ist linear. Er vergrößert die Amplitude eines Signals (dessen Frequenz innerhalb seiner Bandbreite liegt) um einen konstanten Gewinnfaktor und führt dabei eventuell eine lineare Phasenverschiebung ein.
(b) Ein realer Verstärker hat normalerweise einen Gewinn und eine Phasenverschiebung, die Funktionen der Frequenz sind. Für große Werte des Eingangs wird das Ausgangssignal gesättigt; der Verstärker ist nichtlinear.
sonante Schaltungen (z. B. einen Kondensator und eine Induktivität) oder Resonatoren (Metallhohlräume), um den Gewinn des Verstärkers auf das interessierende Frequenzband zu beschränken. Im Gegensatz dazu beruhen Atom-, Molekül- und Festkörper-Laserverstärker auf Differenzen ihrer erlaubten Energieniveaus, die die entscheidende Auswahl der Frequenzen bestimmen. Diese Bausteine wirken als natürliche Resonatoren, die die Betriebsfrequenz und die Bandbreite des Bauelements vorgeben. Optische Hohlräume (Resonatoren) werden häufig verwendet, um eine zusätzliche Abstimmung zu ermöglichen. Die Eigenschaften eines idealen kohärenten optischen oder elektronischen Verstärkers sind schematisch in Abb. 15.2(a) dargestellt. Er ist ein lineares System, das die Amplitude des Eingangssignals um einen festen Faktor vergrößert, den Gewinnfaktor des Verstärkers. Sinusförmige Eingangssignale führen zu sinusförmigen Ausgangssignalen mit derselben Frequenz, aber mit einer größeren Amplitude. Der Gewinn eines idealen Verstärkers ist für alle Frequenzen innerhalb der spektralen Bandbreite des Verstärkers konstant. Der Verstärker kann dem Eingangssignal eine Phasenverschiebung geben, die sich linear mit der Frequenz ändert, entsprechend einer Zeitverzögerung am Ausgang relativ zur Eingabe (siehe Abschnitt B.1). Reale kohärente Verstärker bewirken einen Gewinn und eine Phasenverschiebung, die frequenzabhängig sind, typischerweise in der in Abb. 15.2(b) illustrierten Art. Der Gewinn und die Phasenverschiebung bestimmen die Übertragungsfunktion des Verstärkers. Für eine hinreichend große Eingangsamplitude zeigen reale Verstärker im Allgemeinen Sättigung, d. h. eine Form des nichtlinearen Verhaltens, bei dem die Ausgangsamplitude im Verhältnis zur Eingangsamplitude nicht mehr zunimmt. Die Sättigung führt harmonische Komponenten in das Ausgangssignal ein, sofern die Bandbreite des
Verstärkers groß genug ist, diese weiterzugeben. Reale Verstärker führen auch Rauschen ein, sodass das Ausgangssignal unabhängig von der Eingabe eine zufällig fluktuierende Komponente enthält. Ein Verstärker kann daher durch die folgenden Eigenschaften charakterisiert werden: • • • • • •
Gewinn Bandbreite Phasenverschiebung Energiequelle Nichtlinearität und Gewinnsättigung Rauschen
In diesem Kapitel . . . In diesem Kapitel besprechen wir die nacheinander die soeben beschriebenen Eigenschaften. In Abschnitt 15.1 entwickeln wir die Theorie der Laserverstärkung und geben Ausdrücke für den Verstärkergewinn, die spektrale Bandbreite und die Phasenverschiebung an. Die Mechanismen, mittels deren eine Energiequelle das aktive Medium pumpt und eine Besetzungsinversion erzeugt, werden in Abschnitt 15.2 untersucht. Beispiele von wichtigen Laserverstärkern werden in Abschnitt 15.3 betrachtet. Die Abschnitte 15.4 und 15.5 widmen sich der Nichtlinearität bzw. dem Rauschen im Verstärkungsprozess. Dieses Kapitel verwendet den in Kapitel 14 (besonders Abschnitt 14.3) vorgestellten Stoff.
15.1 Theorie der Laserverstärkung
15.1 Theorie der Laserverstärkung
Gewinnkoeffizient
Eine monochromatische optische ebene Welle, die sich mit der Frequenz 𝜈, dem elektrischen Feld ℰ(𝑧) = Re{𝐸(𝑧) exp(i2π 𝜈𝑡)}, der komplexen Amplitude 𝐸(𝑧), der Intensität 𝐼(𝑧) = |𝐸(𝑧)|2 ∕2𝜂 und der Flussdichte 𝜙(𝑧) = 𝐼(𝑧)∕ℎ𝜈 der Photonen (Photonen pro Sekunde pro Flächeneinheit) in 𝑧-Richtung ausbreitet, kann mit einem atomaren Medium wechselwirken, wenn die Atome des Mediums zwei Energieniveaus besitzen, deren Energieunterschied nahezu der Photonenenergie ℎ𝜈 entspricht. Die Zahlen der Atome pro Volumeneinheit im niedrigeren und höheren Energieniveau bezeichnen wir mit N1 bzw. N2 . Die Welle wird mit einem Gewinnkoeffizienten 𝛾(𝜈) (pro Längeneinheit) verstärkt und erfährt eine Phasenverschiebung 𝜑(𝜈) (ebenfalls pro Längeneinheit). Als Nächstes wollen wir Ausdrücke für 𝛾(𝜈) und 𝜑(𝜈) bestimmen. Ein positives 𝛾(𝜈) entspricht einer Verstärkung; negatives 𝛾(𝜈) entspricht einer Dämpfung.
15.1.1 Gewinn und Bandbreite Es gibt drei Varianten der Wechselwirkung zwischen Photonen und Atomen (siehe Abschnitt 14.3). Wenn das Atom sich im tieferen Energieniveau befindet, kann das Photon absorbiert werden; wenn es sich im oberen Energieniveau befindet, kann es durch induzierte Emission eine Kopie des Photons ausstrahlen. Diese beiden Prozesse führen zu einer Dämpfung bzw. Verstärkung des Lichts. Die dritte Form der Wechselwirkung, die spontane Emission, bei der ein Atom im oberen Energieniveau unabhängig von der Anwesenheit anderer Photonen ein Photon emittiert, ist die Ursache des Verstärkerrauschens (siehe Abschnitt 15.5). Der Wahrscheinlichkeitsdichte (in s−1 ), dass ein nicht angeregtes Atom ein einzelnes Photon absorbiert, ist gemäß Gl. (14.30) und (14.26) W ind = 𝜙𝜎(𝜈) ,
(15.1)
wobei 𝜎(𝜈) = (𝜆 2 ∕8π 𝑡sp ) 𝑔(𝜈) der Übergangsquerschnitt bei der Frequenz 𝜈 ist, 𝑔(𝜈) die normierte Linienformfunktion, 𝑡sp die spontane Lebensdauer und 𝜆 die Wellenlänge des Lichts in dem Medium. Die Wahrscheinlichkeitsdichte für die induzierte Emission ist identisch mit der der Absorption.
ϕ
Eingang
0
ϕ + dϕ
z z + dz
Die mittlere Dichte von absorbierten Photonen (Zahl der Photonen pro Zeit- und Volumeneinheit) ist N1 W ind . Ähnlich ist die mittlere Dichte von Kopien des Photons aus der induzierten Emission N 2 W ind . Effektiv werden damit pro Sekunde und Volumeneinheit NW ind Photonen erzeugt, wobei N = N2 − N1 die Differenz der Besetzungsdichten ist. Der Bequemlichkeit halber wird N einfach der Besetzungsunterschied genannt. Wenn N positiv ist, liegt eine Besetzungsinversion vor; in diesem Fall wirkt das Medium als Verstärker und die Flussdichte der Photonen kann zunehmen. Wenn N negativ ist, schwächt das Medium die Strahlung ab und die Flussdichte der Photonen wird kleiner. Für N = 0 ist das Medium transparent. Da die einfallenden Photonen sich in 𝑧-Richtung ausbreiten, gilt das auch für die Photonen der induzieren Emission, wie Abb. 15.3 illustriert. Ein Pumpstrahl, der eine Besetzungsinversion (N > 0) hervorruft, bewirkt dann eine in 𝑧-Richtung zunehmende Flussdichte 𝜙(𝑧) der Photonen. Weil emittierte Photonen weitere Emissionen induzieren, ist das Wachstum der Flussdichte an jedem Ort 𝑧 proportional zur Besetzungszahl an diesem Ort; 𝜙(𝑧) nimmt folglich exponentiell zu. Um diesen Prozess explizit vorzuführen, betrachten wir einen infinitesimalen Zylinder der Länge d𝑧 wie in Abb. 15.3. Wenn 𝜙(𝑧) und 𝜙(𝑧) + d𝜙(𝑧) die in den Zylinder ein- bzw. aus ihm austretenden Flussdichten der Photonen sind, dann muss d𝜙(𝑧) die in dem Zylinder emittierte Flussdichte sein. Diese infinitesimale Zahl d𝜙(𝑧) von Photonen pro Flächen- und Zeiteinheit ist gleich der Zahl NW ind der pro Zeit- und Volumeneinheit erzeugten Photonen multipliziert mit der Dicke d𝑧 des Zylinders: d𝜙 = NW ind d𝑧 .
(15.2)
Mithilfe von Gl. (15.1) kann Gl. (15.2) in Form einer Differentialgleichung geschrieben werden, d𝜙(𝑧) = 𝛾(𝜈) 𝜙(𝑧) d𝑧
(15.3)
mit 𝛾(𝜈) = N 𝜎(𝜈) = N
Ausgang
𝜆2 𝑔(𝜈) . 8π 𝑡sp
(15.4)
Abb. 15.3 In einem infinitesimalen Zylinder der Länge dz, der angeregte Atome enthält, steigt die Flussdichte der Photonen (Photonen pro cm2 und s) von 𝜙 auf 𝜙 + d 𝜙.
459
460
15 Laserverstärker
Der Koeffizient 𝛾(𝜈) bezeichnet den Nettogewinn der Photonenflussdichte pro Längeneinheit des Mediums. Die Lösung von Gl. (15.3) ist die exponentiell ansteigende Funktion
(ν) (ν0)
Δν
𝜙(𝑧) = 𝜙(0) exp[𝛾(𝜈) 𝑧] .
(15.5)
Da die optische Intensität 𝐼(𝑧) = ℎ𝜈𝜙(𝑧) ist, kann Gl. (15.5) auch durch 𝐼 ausgedrückt werden, 𝐼(𝑧) = 𝐼(0) exp[𝛾(𝜈) 𝑧] .
(15.6)
Also bezeichnet 𝛾(𝜈) auch den Gewinn der Intensität pro Längeneinheit des Mediums. Wie man sieht, ist der Gewinnkoeffizient 𝛾(𝜈) des Verstärkers proportional zu dem Besetzungsunterschied N = N2 − N1 . Obwohl wir N im obigen Beispiel als positiv angenommen hatten, gilt die Herleitung unabhängig von dem Vorzeichen von N. Ohne Besetzungsinversion ist N negativ (N2 < N1 ), und demzufolge ist auch der Gewinnkoeffizient negativ. Das Medium schwächt das Licht dann gemäß der exponentiell abnehmenden Funktion 𝜙(𝑧) = 𝜙(0) exp[−𝛼(𝜈) 𝑧] ab (anstatt es zu verstärken), wobei der Dämpfungskoeffizient 𝛼(𝜈) = −𝛾(𝜈) = −N 𝜎(𝜈) ist. Ein Medium im thermischen Gleichgewicht kann daher keine Laserverstärkung liefern. Gewinn
Für eine Wechselwirkungszone der Gesamtlänge d (siehe Abb. 15.3) ist der Gesamtgewinn 𝐺(𝜈) eines Laserverstärkers als das Verhältnis der Photonenflussdichte am Ausgang zur Photonenflussdichte am Eingang definiert, 𝐺(𝜈) = 𝜙(d )∕𝜙(0); daraus folgt 𝐺(𝜈) = exp[𝛾(𝜈)d ] .
(15.7)
Bandbreite
Die Abhängigkeit des Gewinnkoeffizienten 𝛾(𝜈) von der Frequenz 𝜈 des einfallenden Lichts ist durch seine Proportionalität zur Linienformfunktion 𝑔(𝜈) gemäß Gl. (15.4) gegeben. Diese ist eine Funktion der Breite Δ𝜈 bei der atomaren Resonanzfrequenz 𝜈0 = (E 2 − E 1 )∕ℎ, wobei E 2 und E 1 die atomaren Energieniveaus sind. Der Laserverstärker ist daher ein resonantes Bauelement mit einer Resonanzfrequenz und einer Bandbreite, die durch die Linienformfunktion des atomaren Übergangs bestimmt sind. Der Grund dafür ist natürlich, dass die induzierte Emission und Absorption auf diesem atomaren Übergang beruhen. Die Linienbreite Δ𝜈 wird entweder in Frequenzeinheiten (Hz) oder in Wellenlängeneinheiten (nm) gemessen. Beide Linienbreiten sind durch Δ𝜆 = |Δ(𝑐0 ∕𝜈)| = +(𝑐0 ∕𝜈2 )Δ𝜈 = (𝜆02 ∕𝑐0 )Δ𝜈 verknüpft. So
0 0
ν0
ν
Abb. 15.4 Gewinnkoeffizient 𝛾(𝜈) eines resonanten Laserverstärkers mit Lorentzlinienform.
entspricht eine Linienbreite von Δ𝜈 = 1 THz bei 𝜆0 = 0.6 μm Δ𝜆 = 1.2 nm. Wenn die Linienform zum Beispiel durch eine Lorentzfunktion gegeben ist, ergibt Gl. (14.45) 𝑔(𝜈) =
Δ𝜈∕2π . (𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2
(15.8)
Der Gewinnkoeffizient ist dann ebenfalls lorentzförmig mit derselben Breite, d. h. 𝛾(𝜈) = 𝛾(𝜈0 )
(Δ𝜈∕2)2 , (𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2
(15.9)
wie in Abb. 15.4 dargestellt, wobei 𝛾(𝜈0 ) = N (𝜆 2 ∕4π2 𝑡sp Δ𝜈) der Gewinnkoeffizient bei der Mittenfrequenz 𝜈0 ist. Übung 15-1: Dämpfung und Gewinn in einem RubinLaserverstärker
(a) Betrachten Sie einen Rubinkristall mit zwei Energieniveaus in einem Abstand entsprechend einer Vakuumwellenlänge 𝜆0 = 694.3 nm mit einer Lorentzlinienform der Breite Δ𝜈 = 330 GHz. Seine spontane Lebensdauer sei 𝑡sp = 3 ms und sein Brechungsindex 𝑛 = 1.76 (Tabelle 15.1). Bestimmen Sie den Besetzungsunterschied N = N2 − N1 und den Dämpfungskoeffizienten 𝛼(𝜈0 ) im Zentrum der Linie im thermischen Gleichgewicht bei 𝑇 = 300 K (sodass die in Abschnitt 14.2 besprochene Boltzmannverteilung gilt) für N1 + N2 = NAt = 1022 cm−3 . (b) Welchen Wert muss der Besetzungsunterschied N annehmen, damit der Gewinnkoeffizient bei der Mittenfrequenz 𝛾(𝜈0 ) = 0.5 cm−1 wird? (c) Wie lang muss der Kristall sein, damit der Gesamtgewinn bei der Mittenfrequenz für 𝛾(𝜈0 ) = 0.5 cm−1 gleich 4 wird?
15.1.2
Phasenverschiebung
Weil der Gewinn des resonanten Mediums frequenzabhängig ist, ist das Medium dispersiv (siehe Abschnitt 5.5), und mit dem Gewinn ist eine frequenzabhängige Phasenverschiebung verbunden. Die durch den
15.2 Pumpen des Verstärkers
Laserverstärker bewirkte Phasenverschiebung kann bestimmt werden, indem man die Wechselwirkung des Lichts mit der Materie auf der Ebene des elektrischen Feldes anstelle der Photonenflussdichte oder der Intensität betrachtet, wie wir das zuvor getan hatten. Wir verwenden im Folgenden einen alternativen Ansatz und benutzen die mathematischen Eigenschaften eines kausalen Systems, um die Phasenverschiebung zu bestimmen. Für homogen verbreiterte Medien ist der Koeffizient 𝜑(𝜈) der Phasenverschiebung (Phasenverschiebung pro Längeneinheit des Verstärkermediums) durch eine Hilberttransformation (siehe Abschnitt B.1) mit dem Gewinnkoeffizienten 𝛾(𝜈) verknüpft, sodass die Kenntnis von 𝛾(𝜈) bei allen Frequenzen 𝜑(𝜈) eindeutig festlegt. Die optische Intensität und die komplexe Amplitude des Feldes sind durch 𝐼(𝑧) = |𝐸(𝑧)|2 ∕2𝜂 verknüpft. Da nach Gl. (15.6) 𝐼(𝑧) = 𝐼(0) exp[𝛾(𝜈) 𝑧] ist, gehorcht die komplexe Feldamplitude der Beziehung [1 ] 𝐸(𝑧) = 𝐸(0) exp 𝛾(𝜈) 𝑧 exp [−i𝜑(𝜈) 𝑧] , (15.10) 2
wobei 𝜑(𝜈) der Koeffizient der Phasenverschiebung ist. Die komplexe Amplitude des Feldes bei 𝑧 + Δ𝑧 ist daher 𝐸(𝑧 + Δ𝑧) = 𝐸(0) exp
[1 2
] 𝛾(𝜈) (𝑧 + Δ𝑧)
2
(15.11) wobei wir die Exponentialfunktion in eine Taylorreihe entwickelt haben. Die infinitesimale Änderung des elektrischen Feldes, Δ𝐸(𝑧) = 𝐸(𝑧 + Δ𝑧) − 𝐸(𝑧), erfüllt daher die Gleichung (15.12)
Dieser infinitesimale Verstärker kann als ein lineares System aufgefasst werden, dessen Eingabe und Ausgabe 𝐸(𝑧) bzw. Δ𝐸(𝑧)∕Δ𝑧 sind und dessen Übertragungsfunktion 1
H(𝜈) = 𝛾(𝜈) − i𝜑(𝜈) 2
Δν
φ(ν)
(15.13)
ist. Weil dieser infinitesimale Verstärker ein physikalisches System beschreibt, muss er kausal sein. Der Realund der Imaginärteil der Übertragungsfunktion eines linearen kausalen Systems sind jedoch durch eine Hilberttransformation verbunden (siehe Abschnitt B.1). Folg1 lich muss −𝜑(𝜈) die Hilberttransformierte von 𝛾(𝜈) 2
ν0
ν0
ν
ν
Abb. 15.5 Gewinnkoeffizient 𝛾(𝜈) und Koeffizient 𝜑(𝜈) der Phasenverschiebung für einen Laserverstärker mit einer Lorentzlinienform.
sein, sodass die Phasenverschiebung des Verstärkers durch seinen Gewinnkoeffizienten bestimmt wird. Ein einfaches Beispiel ist eine Lorentz-Linienformfunktion mit der geringen Breite Δ𝜈 ≪ 𝜈0 , deren Gewinnkoeffizient 𝛾(𝜈) durch Gl. (15.9) gegeben ist. Der entsprechende Koeffizient 𝜑(𝜈) der Phasenverschiebung ist in Gl. (B.13) in Abschnitt B.1 angegeben, 𝜑(𝜈) =
× exp [−i𝜑(𝜈) (𝑧 + Δ𝑧)] ] [1 = 𝐸(𝑧) exp 𝛾(𝜈) Δ𝑧 exp[−i𝜑(𝜈) Δ𝑧] 2 [ ] 1 ≈ 𝐸(𝑧) 1 + 𝛾(𝜈) Δ𝑧 − i𝜑(𝜈) Δ𝑧 ,
] [1 Δ𝐸(𝑧) = 𝐸(𝑧) 𝛾(𝜈) − i𝜑(𝜈) . 2 Δ𝑧
(ν)
𝜈 − 𝜈0 𝛾(𝜈) . Δ𝜈
(15.14)
Der Gewinn und die Phasenverschiebung einer Lorentzlinie sind in Abb. 15.5 als Funktionen der Frequenz aufgetragen. Bei Resonanz ist der Gewinnkoeffizient maximal und die Phasenverschiebung ist null. Für Frequenzen unterhalb der Resonanz ist der Koeffizient der Phasenverschiebung negativ, für Frequenzen oberhalb der Resonanz ist er positiv.
15.2 Pumpen des Verstärkers Wie andere Verstärker erfordern auch Laserverstärker eine externe Energiequelle, mit deren Hilfe das Eingangssignal verstärkt wird. Die Pumpanregung liefert diese Energie, indem sie die Elektronen in den Atomen von tiefere in höhere atomare Energieniveaus anregt. Um Verstärkung zu erzielen, muss die Pumpanregung eine Besetzungsinversion (N = N2 − N1 > 0) für den interessierenden Übergang erreichen. An dem Pumpvorgang sind jedoch häufig auch intermediäre Energieniveaus beteiligt. Zum Beispiel ist das Pumpen von Atomen von einem Niveau 1 in ein Niveau 2 zur Verstärkung des 2 → 1-Übergangs oft am einfachsten zu erreichen, indem man die Atome aus Niveau 1 in ein Niveau 3 anregt, von dem aus sie durch natürliche Prozesse in Niveau 2 übergehen.
461
462
15 Laserverstärker
Das Pumpen kann optisch (z. B. mit einer Blitzlampe oder einem Laser), elektrisch (z. B. durch eine Gasentladung, einen Elektronen- oder Ionenstrahl oder mittels injizierter Ladungsträger) oder chemisch (z. B. mit einer Flamme oder über eine chemische Reaktion, die die Produkte in einem aufgeregten Zustand liefert) erreicht werden (siehe Abschnitt 15.2.2). Für kontinuierlichen oder Dauerstrichbetrieb (CW, von engl. continuous wave) müssen die Anregungs- und Abbaugeschwindigkeiten der verschiedenen Energieniveaus, die an dem Prozess beteiligt sind, so abgestimmt sein, dass die Besetzungsinversion des 2 → 1-Übergangs einen stationären Zustand erreicht.
15.2.1
Geschwindigkeitsgleichungen
Die Gleichungen für die Änderung der Besetzungszahlen N1 und N2 durch das Pumpen sowie die strahlenden und nichtstrahlenden Übergänge werden Geschwindigkeitsgleichungen genannt. Sie ähneln den Gleichungen in Abschnitt 14.4, nur dass jetzt das selektive Pumpen Teil des Prozesses ist, sodass kein thermisches Gleichgewicht mehr vorliegt. Wir betrachten das schematische Energieniveaudiagramm in Abb. 15.6; dabei konzentrieren wir uns auf die Niveaus 1 und 2 mit den Gesamtlebensdauern 𝜏1 bzw. 𝜏2 , von denen aus Übergänge in niedrigere Niveaus möglich sind. Die Lebensdauer des Niveaus 2 besteht aus zwei Beiträgen – einem aufgrund des Übergangs von 2 nach 1 (𝜏21 ) und einem zweiten (𝜏20 ) aufgrund der Übergänge von 2 in alle anderen tieferen Niveaus. Wenn mehrere Zerfallswege möglich sind, ist die gesamte Übergangsgeschwindigkeit die Summe der einzelnen Übergangsgeschwindigkeiten. Da die Geschwindigkeiten umgekehrt proportional zu den Zerfallszeiten sind, müssen die Kehrwerte der Zerfallszeiten addiert werden: −1 −1 𝜏2−1 = 𝜏21 + 𝜏20 .
kann auch ein nichtstrahlender Beitrag 𝜏ns in 𝜏21 enthalten sein (der z. B. durch Atomstöße mit der Wand des Behälters entsteht, die ebenfalls zu einem Abbau der Besetzungszahl führen); daher ist −1 −1 −1 𝜏21 = 𝑡sp + 𝜏ns .
Wenn ein ungepumptes System wie das in Abb. 15.6 gezeigte einen stationären Zustand erreicht, verschwinden die Besetzungszahlen N 1 und N2 , da alle Elektronen in tiefere Energieniveaus übergegangen sind. Auch im stationären Zustand können die Besetzungszahlen der Niveaus 1 und 2 jedoch erhalten bleiben, wenn die Energieniveaus über Niveau 2 durch Pumpen kontinuierlich angeregt werden und schließlich wie in dem realistischeren Energieniveaudiagramm in Abb. 15.7 gezeigt Niveau 2 bevölkern. Insgesamt dient das Pumpen dazu, Elektronen mit den Geschwindigkeiten R1 bzw. R2 (pro Volumeneinheit pro Sekunde) aus dem Niveau 1 heraus und in Niveau 2 hinein zu bringen, wie Abb. 15.8 vereinfacht zeigt. Infolgedessen können die Niveaus 1 und 2 im stationären Zustand endliche Besetzungszahlen erreichen. Als Nächstes wollen wir die Geschwindigkeitsgleichungen für dieses System mit und ohne Verstärkerstrahlung (die mit dem 2 → 1-Übergang resonante Strahlung) aufstellen.
2
2 1
1
(15.15)
Vielfache Zerfallswege verkürzen daher die Gesamtlebensdauer (d. h. sie sorgen für einen schnelleren Abbau der Anregung). Zusätzlich zu dem Beitrag der strahlenden spontanen Emission (mit der Zeitkonstante 𝑡sp )
Abb. 15.7 Die Energieniveaus 1 und 2 mit den umgebenden höheren und tieferen Energieniveaus in Anwesenheit einer Pumpanregung. 2
τ21
2
2
τ21 τ2
tsp 1 τ1
(15.16)
1
τ1
τns τ20
Abb. 15.6 Die Energieniveaus 1 und 2 und ihre Zerfallszeiten.
τ2
1
τ20
Abb. 15.8 Die Energieniveaus 1 und 2 und ihre Zerfallszeiten. Durch Pumpen wird die Besetzungszahl des Niveaus 2 mit der Geschwindigkeit R2 erhöht, während die des Niveaus 1 mit der Geschwindigkeit R1 verringert wird.
15.2 Pumpen des Verstärkers
Geschwindigkeitsgleichungen ohne Verstärkerstrahlung
Die Geschwindigkeiten der Veränderung der Besetzungsdichten der Niveaus 2 und 1 durch Pumpen und Zerfall sind d N2 N = R2 − 2 , 𝜏2 d𝑡 d N1 N1 N2 + . = −R1 − 𝜏1 𝜏21 d𝑡
(15.17) Geschwindigkeitsgleichungen mit Verstärkerstrahlung
(15.18)
Im stationären Zustand (d N1 ∕ d𝑡 = d N2 ∕ d𝑡 = 0) können die Gln. (15.17) und (15.18) nach N1 und N2 aufgelöst werden, und der Besetzungsunterschied N = N 2 − N 1 kann bestimmt werden. Das Ergebnis ist N 0 = R2 𝜏2 (1 −
𝜏1 ) + R1 𝜏1 , 𝜏21
(15.19)
wobei das Symbol N0 den Besetzungsunterschied N im stationären Zustand ohne Verstärkerstrahlung bezeichnet. Nach Gl. (15.4) erfordert ein großer Gewinnkoeffizient einen großen Besetzungsunterschied, d. h. einen großen positiven Wert von N0 . Gleichung (15.19) zeigt, dass dafür eine der folgenden Bedingungen erfüllt sein muss: • Große Werte von R1 und R2 , • ein großer Wert von 𝜏2 (wobei 𝑡sp , das über 𝜏21 ebenfalls zu 𝜏2 beiträgt, trotzdem hinreichend klein sein muss, sodass die Geschwindigkeit des strahlenden Übergangs groß wird, wie wir später sehen werden), • ein kleiner Wert von 𝜏1 für R1 < (𝜏2 ∕𝜏21 )R2 . Diese Bedingungen sind physikalisch wohlbegründet. Das obere Niveau sollte kräftig gepumpt werden und langsam zerfallen, damit sich eine Besetzung aufbauen kann. Die tiefere Niveau sollte sich zügig entleeren. Idealerweise ist 𝜏21 ≈ 𝑡sp ≪ 𝜏20 , sodass 𝜏2 ≈ 𝑡sp und 𝜏1 ≪ 𝑡sp ist. Unter diesen Bedingungen vereinfacht sich Gl. (15.19) zu N 0 ≈ R2 𝑡sp + R1 𝜏1 .
im stationären Zustand N 1 ≈ 0 und N0 ≈ R2 𝑡sp gilt. Zeigen Sie, dass R2 ≈ (N At − 2N0 )W gilt, sodass der Besetzungsunterschied N 0 ≈ NAt 𝑡sp W ∕(1 + 2𝑡sp W ) ist, wenn N At die Gesamtbesetzungszahl der Niveaus 0, 1 und 2 ist.
Das Vorhandensein von Strahlung in der Nähe der Resonanzfrequenz 𝜈0 ermöglicht Übergänge durch induzierte Emission und Absorption zwischen den Niveaus 2 und 1. Diese Prozesse sind nach Gl. (15.1) durch die Wahrscheinlichkeitsdichte W ind = 𝜙 𝜎(𝜈) charakterisiert und in Abb. 15.9 illustriert. Die Geschwindigkeitsgleichungen (15.17) und (15.18) müssen dann erweitert werden, um diese Ursache für Änderungen der Besetzungszahlen beider Niveaus zu berücksichtigen: d N2 N2 − N2 W ind + N 1 W ind , = R2 − 𝜏2 d𝑡
d N1 N N = −R1 − 1 + 2 + N2 W ind − N1 W ind . (15.23) 𝜏 𝜏 d𝑡 1 21 Die Besetzungsdichte von Niveau 2 wird durch die induzierte Emission aus Niveau 2 in Niveau 1 reduziert und durch die Absorption aus Niveau 1 in Niveau 2 erhöht. Der Beitrag der spontanen Emission ist in 𝜏21 enthalten. Im stationären Zustand (d N 1 ∕ d𝑡 = d N2 ∕ d𝑡 = 0) können die Gln. (15.22) und (15.23) leicht nach N1 und N 2 aufgelöst und der Besetzungsunterschied N = N 2 − N 1 berechnet werden. Das Ergebnis ist N=
(15.21)
Übung 15-2: Optisches Pumpen Nehmen Sie an, dass R1 = 0 ist und R2 durch Anregung von Atomen aus dem Grundzustand E = 0 in das Niveau 2 entsteht, wozu Photonen der Frequenz E 2 ∕ℎ mit einer Übergangswahrscheinlichkeit W absorbiert wer-
den. Nehmen Sie weiter 𝜏2 ≈ 𝑡sp und 𝜏1 ≪ 𝑡sp an, sodass
,
(15.24)
wobei N0 der Besetzungsunterschied im stationären Zustand ohne Verstärkerstrahlung ist, der durch Gl. (15.19) gegeben ist. Die charakteristische Zeit 𝜏S , die wegen 𝜏2 ≤ 𝜏21 immer positiv ist, ist 𝜏S = 𝜏2 + 𝜏1 (1 − 2 2
−1 ind
𝜏2 ). 𝜏21
(15.25)
τ21 τ2
1 1
N 0 ≈ R2 𝑡sp .
N0
1 + 𝜏S W ind
(15.20)
Wenn Niveau 1 sich nicht leert (R1 = 0) oder R1 ≪ (𝑡sp ∕𝜏1 )R2 ist, vereinfacht sich dieses Ergebnis noch weiter zu
(15.22)
τ1
τ20
Abb. 15.9 Die Besetzungsdichten N 1 und N2 (cm−3 s−1 ) von Atomen in den Energieniveaus 1 und 2 werden durch drei Prozesse bestimmt: Zerfall (mit den Geschwindigkeiten 1∕𝜏1 bzw. 1∕𝜏2 , die die Wirkung der spontanen Emission einschließt), Pumpen (mit den Geschwindigkeiten R1 bzw. R2 ) sowie Absorption und induzierte Emission (mit der Geschwindigkeit W ind bzw. der entsprechenden Zeitkonstante −1 W ind ).
463
464
15 Laserverstärker
3 kurzlebiges Niveau
schneller τ 32 Zerfall
0
Laser 0
−1 ind
τ 21
2
Pumpen 0
0.1
τs
1
τs
10
τs
ind
Abb. 15.10 Reduktion des Besetzungsunterschieds N = N 2 − N 1 im stationären Zustand bei steigender Geschwindigkeit W ind der Absorption und induzierten Emission. Für W ind = 1∕𝜏S ist N um einen Faktor 2 gegenüber seinem Wert bei W ind = 0 reduziert.
Ohne Verstärkerstrahlung ist W ind = 0, sodass Gl. (15.24) wie erwartet N = N0 gibt. Weil 𝜏S positiv ist, ist der Besetzungsunterschied im stationären Zustand mit Verstärkerstrahlung immer kleiner als ohne Verstärkerstrahlung, d. h. |N| ≤ |N0 |. Wenn die Strahlung so schwach ist, dass 𝜏S W ind ≪ 1 gilt (Näherung kleiner Signale), können wir N ≈ N0 setzen. Wenn die Verstärkerstrahlung stärker wird, nimmt W ind zu und schließlich gilt N → 0, unabhängig vom anfänglichen Vorzeichen von N0 , wie Abb. 15.10 zeigt. Der Grund dafür ist, dass für große W ind die induzierte Emission und Absorption die Wechselwirkung beherrschen und sie gleiche Wahrscheinlichkeitsdichten haben. Offensichtlich kann selbst sehr starke Strahlung einen negativen Besetzungsunterschied nicht in einen positiven verwandeln oder umgekehrt. Die Größe 𝜏S spielt die Rolle einer Sättigungs-Zeitkonstante, wie aus Abb. 15.10 deutlich wird. Übung 15-3: Die Sättigungs-Zeitkonstante
Zeigen Sie, dass 𝜏S ≈ 𝑡sp ist, sofern 𝑡sp ≪ 𝜏ns (der nichtstrahlende Anteil der Lebensdauer 𝜏21 des 2 → 1Übergangs), 𝑡sp ≪ 𝜏20 und 𝑡sp ≫ 𝜏1 gilt.
15.2.2
schneller τ 1 Zerfall
Pumpschemata
Als Nächstes wollen wir einige Pumpschemata genauer betrachten, die verwendet werden, um eine Besetzungsinversion für den Übergang 2 → 1 zu erreichen. Wir diskutieren nacheinander vier Varianten: (1) Vierniveaupumpen, (2) Dreiniveaupumpen, (3) Quasi-Dreiniveaupumpen und (4) Intrabandpumpen. Mit Ausnahme des Dreiniveaupumpens kommen diese Varianten alle regelmäßig zum Einsatz.
2
langlebiges Niveau
1
kurzlebiges Niveau
τ2
τ 20 0 Grundzustand
Abb. 15.11 Die Energieniveaus und Abklingraten für ein Vierniveausystem. Die vier Niveaus sind aus einer Vielzahl von Niveaus (nicht gezeigt) ausgewählt. Die Geschwindigkeiten des Pumpens in Niveau 3 und aus dem Niveau 0 sind gleich angenommen. In einem Vierniveausystem nimmt man an, dass Niveau 1 im thermischen Gleichgewicht unbesetzt ist. Ein Quasi-Dreiniveausystem hat im Prinzip dieselbe Anordnung der Energieniveaus, nur dass Niveau 1 so nahe beim Grundzustand 0 liegt, dass es in thermischen Gleichgewicht noch besetzt wird. Die überwiegende Mehrheit aller praktisch verwendeten Laser und Laserverstärker sind Vierniveau- oder Quasi-Dreiniveausysteme.
Vierniveaupumpen
In dieser in Abb. 15.11 gezeigten Anordnung liegt Niveau 1 über dem Grundzustand (der als das niedrigste Energieniveau 0 bezeichnet wird). Im thermischen Gleichgewicht wird Niveau 1 kaum besetzt sein, sofern E 1 ≫ k 𝑇 ist; diese Situation ist natürlich wünschenswert, da sie die Besetzungsinversion verstärkt. Zum Pumpen wird hier ein Energieniveau (oder eine Gruppe von Energieniveaus) verwendet, das über Niveau 2 liegt; wir bezeichnen es als Niveau 3. Der 3 → 2-Übergang hat eine kurze Lebensdauer (der Übergang erfolgt schnell), sodass sich im Niveau 3 nur eine geringe Besetzung aufbaut. Niveau 2 ist langlebig, sodass sich hier eine Besetzung aufbaut, Niveau 1 dagegen kurzlebig, sodass es praktisch unbesetzt bleibt; auf diese Weise bildet sich eine Besetzungsinversion zwischen den Niveaus 2 und 1 aus. Insgesamt sind vier Energieniveaus an dem Prozess beteiligt, aber die interessierende optische Wechselwirkung findet zwischen den Niveaus 2 und 1 statt. Eine externe Energiequelle (z. B. Photonen mit der Frequenz E 3 ∕ℎ) pumpt Atome mit einer Geschwindigkeit R von Niveau 0 in Niveau 3. Wenn der Zerfall von Niveau 3 nach Niveau 2 schnell genug ist, kann er als instantan angenommen werden, sodass das Pumpen von Niveau 3 einem Pumpen von Niveau 2 mit der Geschwindigkeit R2 = R entspricht. Die Situation ist dann dieselbe wie die in Abb. 15.9, und die Ausdrücke in den Gln. (15.24) und (15.25) bleiben gültig. In dieser Anordnung werden Atome jedoch weder in Niveau 1 hinein noch aus ihm heraus gepumpt, sodass R1 = 0 ist. Ohne Verstärkerstrahlung (W ind = 𝜙 = 0) ist der Besetzungsun-
15.2 Pumpen des Verstärkers
terschied im stationären Zustand somit durch Gl. (15.19) mit R1 = 0 gegeben, d. h. N 0 = R 𝜏2 (1 −
𝜏1 ). 𝜏21
(15.26)
In den meisten Vierniveausystemen sind die nichtstrahlenden Anteile des 2 → 1-Übergangs vernachlässigbar (𝑡sp ≪ 𝜏ns ) und es gilt 𝜏20 ≫ 𝑡sp ≫ 𝜏1 (siehe Übung 15-3); folglich gilt N 0 ≈ R𝑡sp ,
(15.27)
𝜏S ≈ 𝑡sp
(15.28)
und daher N≈
R𝑡sp
1 + 𝑡sp W ind
.
(15.29)
In der vorhergehenden Herleitung haben wir implizit angenommen, dass die Pumpgeschwindigkeit R nicht vom Besetzungsunterschied N = N 2 − N1 abhängt. Das ist jedoch nicht immer der Fall, weil die Besetzungsdichten NG und N3 des Grundzustands bzw. von Niveau 3 durch N G + N1 + N2 + N3 = NAt
(15.30)
mit N1 und N2 zusammenhängen, wobei die gesamte Atomdichte NAt des Systems eine Konstante ist. Wenn das Pumpen einen Übergang zwischen dem Grundzustand und Niveau 3 mit der Übergangswahrscheinlichkeit W bewirkt, dann ist R = (NG − N3 )W . Wenn die Niveaus 1 und 3 kurzlebig sind, dann ist N 1 ≈ N3 ≈ 0 und somit NG + N 2 ≈ NAt , sodass NG ≈ NAt − N2 ≈ N At − N gilt. Unter diesen Bedingungen kann die Pumpgeschwindigkeit näherungsweise als R ≈ (N At − N)W
(15.31)
geschrieben werden, was zeigt, dass sie eine linear abnehmende Funktion des Besetzungsunterschieds N ist, also offensichtlich von diesem abhängt. Der Grund dafür ist, dass die Besetzungsinversion zwischen den Niveaus 2 und 1 die Zahl von Atomen reduziert, die für das Pumpen zur Verfügung stehen. Wenn wir Gl. (15.31) in Gl. (15.29) einsetzen und die Terme reorganisieren, erhalten wir N≈
𝑡sp NAt W 1 + 𝑡sp W + 𝑡sp W ind
.
N0
1 + 𝜏S W ind
,
N0 ≈
𝑡sp NAt W
(15.33)
(15.34)
1 + 𝑡sp W
und 𝜏S ≈
𝑡sp
(15.35)
1 + 𝑡sp W
gegeben sind. Für schwaches Pumpen (W ≪ 1∕𝑡sp ) ist N0 ≈ 𝑡sp NAt W proportional zur Übergangs-Wahrscheinlichkeitsdichte W des Pumpens, und es gilt 𝜏S ≈ 𝑡sp , sodass wieder die Gln. (15.27) und (15.28) herauskommen. Mit zunehmender Stärke des Pumpprozesses nimmt N 0 jedoch ab und erreicht schließlich die Sättigung, während 𝜏S abnimmt. Dreiniveaupumpen
Beim Dreiniveaupumpen wird im Gegensatz dazu der Grundzustand (E 1 = 0) als das tiefere Laserniveau 1 verwendet, wie Abb. 15.12 zeigt. Wieder ist ein drittes Hilfsniveau (mit 3 bezeichnet) beteiligt und der Zerfall 3 → 2 ist schnell, sodass keine Population in Niveau 3 aufgebaut wird. Der Zerfall 3 → 1 ist langsam (𝜏32 ≪ 𝜏31 ), sodass das Pumpen bewirkt, dass das obere Laserniveau 2 besetzt wird, das langlebig ist und daher eine Population aufbaut. Atome werden aus Niveau 1 mit einer Geschwindigkeit R in Niveau 3 gepumpt (z. B. durch Absorption von Licht der Frequenz E 3 ∕ℎ); der schnelle (nichtstrahlende) Zerfall besetzt Niveau 2 mit der Geschwindigkeit R2 = R. Die thermische Anregung von Niveau 2 wird als vernachlässigbar angenommen. Es ist leicht zu erkennen, dass das in Abb. 15.12 gezeigte Dreiniveausystem für einen schnellen Zerfall 3 → 2 ein Spezialfall des Systems aus Abb. 15.9 ist (vorausgesetzt, dass R nicht von N abhängt); dabei gilt R1 = R2 = R ,
𝜏1 = ∞ ,
𝜏2 = 𝜏21 .
(15.36)
Um algebraische Schwierigkeiten im Zusammenhang mit dem Wert 𝜏1 = ∞ zu vermeiden, setzen wir diese
Pumpen
3 kurzlebiges Niveau
schneller τ32 Zerfall Laser
(15.32)
Zuletzt können wir den Besetzungsunterschied in der allgemeinen Form von Gl. (15.24) schreiben, N=
wobei N 0 und 𝜏S anstatt durch die Gln. (15.27) und (15.28) jetzt durch
−1 ind
τ 21
2 langlebiges Niveau 1 Grundzustand
Abb. 15.12 Energieniveaus und Abklingraten eines Dreiniveausystems. Es existieren noch zahlreiche weitere Energieniveaus, die jedoch nichts mit den betrachteten Vorgängen zu tun haben. Die Geschwindigkeiten des Pumpens in Niveau 3 und aus dem Niveau 0 sind gleich angenommen.
465
466
15 Laserverstärker
Werte nicht in die Gln. (15.24) und (15.25) ein, sondern kehren zu den ursprünglichen Geschwindigkeitsgleichungen (15.22) und (15.23) zurück. Im stationären Zustand liefern beide dieser Gleichungen dasselbe Ergebnis: 0=R−
N2
𝜏21
− N2 W ind + N1 W ind .
(15.37)
Es ist nicht möglich, sowohl N1 als auch N2 aus einer einzigen Gleichung zu bestimmen. Wenn wir aber die gesamte Atomdichte N At des Systems (in den Niveaus 1, 2 und 3) kennen, haben wir eine Nebenbedingung, die uns erlaubt, N1 und N2 zu bestimmen. Da 𝜏32 sehr kurz ist, ist die Besetzung von Niveau 3 im stationären Zustand vernachlässigbar; alle Atome, die Niveau 3 erreichen, gehen sofort in Niveau 2 über. Also ist N1 + N2 = NAt ,
Vergleich von Drei- und Vierniveausystemen
Es ist aufschlussreich, die Gln. (15.41) und (15.42) mit den analogen Beziehungen Gl. (15.27) und (15.28) für ein Vierniveauschema zu vergleichen. Um in einem Dreiniveauschema eine Besetzungsinversion zu erreichen (N > 0 und daher N 0 > 0), ist eine Pumpgeschwindigkeit R > NAt ∕2𝑡sp erforderlich. Schon um die Besetzungsdichte N2 gleich N1 zu machen (d. h. N0 = 0), ist eine wesentliche Pumpleistung E 3 N At ∕2𝑡sp nötig. Die große Besetzungszahl im Grundzustand (der das tiefste Laserniveau ist) ist ein grundsätzliches Hindernis auf dem Weg zu einer Besetzungsinversion in einem Dreiniveausystem, das in einem Vierniveausystem nicht auftritt (hier ist Niveau 1 normalerweise leer, da 𝜏1 kurz ist). Die Sättigungszeitkonstante 𝜏S ≈ 𝑡sp für das Vierniveauschema ist halb so groß wie die des Dreiniveausystems.
(15.38)
wodurch wir Gl. (15.37) nach N1 und N2 auflösen und so den Besetzungsunterschied N = N2 − N1 und die Sättigungszeit 𝜏S bestimmen können. Das Ergebnis kann in der üblichen Form von Gl. (15.24) angegeben werden, N = N0 ∕(1 + 𝜏S W ind ), wobei jetzt N0 = 2R 𝜏21 − NAt ,
(15.39)
𝜏S = 2𝜏21
(15.40)
ist. Wenn der nichtstrahlende Zerfall von Niveau 2 in Niveau 1 vernachlässigbar ist, (𝑡sp ≪ 𝜏ns ), kann 𝜏21 durch 𝑡sp ersetzt werden; daraus folgt
Übung 15-4: Pumpleistung in Drei- und Vierniveausystemen
(a) Bestimmen Sie die Übergangswahrscheinlichkeit W des Pumpprozesses, die erforderlich ist, um eine Gleichbesetzung der Niveaus in einem Drei- und einem Vierniveau-Laserverstärker zu erreichen. (b) Zeigen Sie, dass N0 = NAt ∕3 ist, wenn die Übergangswahrscheinlichkeit im Dreiniveausystem W = 2∕𝑡sp und im Vierniveausystem W = 1∕2𝑡sp ist. Vergleichen Sie die Pumpleistungen, die für diesen Besetzungsunterschied erforderlich sind.
N0 ≈ 2R 𝑡sp − NAt
(15.41)
Quasi-Dreiniveaupumpen
𝜏S ≈ 2𝑡sp .
(15.42)
Das Quasi-Dreiniveaupumpen ist gewissermaßen eine Zwischenform zwischen Vierniveau- und Dreiniveaupumpen. Wie Abb. 15.11 zeigt, ist das Energieniveauschema prinzipiell identisch mit dem eines Vierniveausystems. Der einzige Unterschied besteht darin, dass das untere Laserniveau 1 so nahe am Grundzustand 0 liegt, dass es im thermischen Gleichgewicht zu einem gewissen Grad besetzt ist. Das Pumpen erfolgt wie beim Vierniveausystem über das Hilfsniveau 3, der Übergang 3 → 2 ist schnell, das obere Laserniveau 2 ist langlebig, es wird eine Besetzungsinversion zwischen den Niveaus 2 und 3 aufgebaut und das untere Laserniveau 1 ist kurzlebig. Wegen der Besetzung von Niveau 1, die bei der Frequenz des Übergangs zu Reabsorption führt, ist es jedoch deutlich schwieriger als bei einem Vierniveausystem, eine Besetzungsinversion zu erreichen. Trotzdem beruhen viele Laser auf einem Quasi-Dreiniveausystem.
Wir können die Abhängigkeit der Pumpgeschwindigkeit R vom Besetzungsunterschied N in unserer Analyse des Dreiniveausystems berücksichtigen, indem wir 1 R = (N1 − N3 )W , N 3 ≈ 0 und N1 = (N At − N ) schrei2 1 ben, woraus R ≈ (NAt − N)W folgt. Wenn wir das in die 2 Hauptgleichung N = (2R𝑡sp − N At )∕(1 + 2𝑡sp W ind ) einsetzen und Terme reorganisieren, erhalten wir den Besetzungsunterschied in der üblichen Form N=
N0 , 1 + 𝜏S W ind
nun aber mit N At (𝑡sp W − 1) N0 = 1 + 𝑡sp W
(15.43)
(15.44)
und 𝜏S =
2𝑡sp 1 + 𝑡sp W
.
(15.45)
Genau wie in einem Vierniveausystem erreichen N0 und 𝜏S eine Sättigung, wenn die Übergangswahrscheinlichkeit W des Pumpprozesses zunimmt.
Intrabandpumpen
In einem idealisierten Zweiniveausystem ist es nicht möglich, durch direktes optisches Pumpen eine Besetzungsinversion im stationären Zustand zu erzeugen,
15.2 Pumpen des Verstärkers
weil die Pumpe immer genauso viel induzierte Emission wie Absorption hervorruft, sodass die Besetzungszahlen sich höchstens angleichen können, wie auch aus der Diskussion der Geschwindigkeitsgleichungen in Aufgabe 15-4 deutlich wird. Um diese Einschränkung zu umgehen, verwenden die Pumpschemata normalerweise ein Hilfsniveau 3, über das sie die Besetzung in das obere Laserniveau 2 leiten, wie wir zuvor im Zusammenhang mit Vierniveausystemen, Dreiniveausystemen und Quasi-Dreiniveausystemen gesehen hatten. Schmale, isolierte Energieniveaus, wie sie in Abb. 15.11 und 15.12 gezeigt sind, sind jedoch Idealisierungen. Obwohl wir mit ihrer Hilfe Geschwindigkeitsgleichungen aufstellen und das Funktionsprinzip eines Pumpschemas mit drei oder vier Niveaus verstehen können, bestehen die Energieniveaus in realen Substanzen in der Regel aus einer Ansammlung von eng beieinander liegenden Unterniveaus. Ein Beispiel ist der in Abb. 14.5 dargestellte bekannte Nd3+:YAGLaserübergang bei 1.064 μm. Wie Abb. 14.6 ausführlicher zeigt, entsprechen die mit den Symbolen 4 I9∕2 , 4 I11∕2 und 4 F3∕2 bezeichneten Laserniveaus 0, 1 und 2 jeweils ganzen Gruppen von Unterniveaus. Diese Struktur der Energieniveaus ermöglicht es, das Pumpniveau 3 und das obere Laserniveau 2 in ein einziges Energieband zu kombinieren und ebenso das untere Laserniveau 1 und den Grundzustand 0. Dieses Schema, das in Abb. 15.13 dargestellt ist, bezeichnet man als Intrabandpumpen oder Quasi-Zweiniveaupumpen, da das Paar von Energiebändern auf den ersten Blick einem Zweiniveausystem ähnelt. Die Pump- und die Laserfrequenz unterscheiden sich in diesem Pumpschema nur geringfügig. Da die Frequenz 𝜈P der Pumpe größer ist als die Frequenz 𝜈L des Lasers, wie Abb. 15.13 zeigt, erfolgt die Anregung beim Pumpen vorzugsweise in die höheren Unterniveaus des oberen Energiebands. Dort relaxieren die Atome thermisch (innerhalb von einigen ps) und fallen in die unteren Unterniveaus, wo sie für die laserinduzierte induzierte Emission zur Verfügung stehen. Durch den Pumpstrahl induzierte Emission ist hier ebensowenig ein Problem wie laserinduzierte Reabsorption, da die höheren Unterniveaus des unteren Energiebands bei normalen Temperaturen nur schwach besetzt sind. Da die Absorptions- und Emissionsprozesse auf verschiedenen Unterniveaus innerhalb der Energiebänder beruhen, unterscheiden sich die Übergangsquerschnitte für die beiden Prozesse und damit auch die Wahrscheinlichkeitsdichten 𝑊ind für Absorption und induzierte Emission im Allgemeinen. Der effektive Absorptionsquerschnitt und der effektive Emissionsquerschnitt werden im Allgemeinen mit 𝜎Ab (𝜈) bzw. 𝜎E (𝜈) bezeichnet.
3 2
Pumpen
Laser
1 0
Abb. 15.13 Intrabandpumpen. Das Pumpniveau 3 und das obere Laserniveau 2 gehören dem oberen Energieband an, das untere Laserniveau 1 und der Grundzustand 0 dem unteren. Die Pump- und Laserphotonen haben die Energien h𝜈P bzw. h𝜈L . Das Absorptionsspektrum liegt auf der hochfrequenten Seite des Emissionsspektrums, sodass eine Besetzungsinversion durch starkes Pumpen bei einer größeren Frequenz als der des Emissionspeaks erreicht werden kann. Die effektiven Absorptions- und Emissionsquerschnitte sind im Allgemeinen unterschiedlich.
Intrabandpumpen wird in der Praxis häufig verwendet. Es kann in Vierniveausystemen wie Nd3+:YAG oder Nd3+:Glas, in denen sich das untere Laserniveau weit oberhalb des Grundzustands befindet, ebenso eingesetzt werden wie in Dreiniveausystemen wie Yb3+:YAG, in denen das untere Laserniveau sich nahe am Grundzustand befindet. Im letzteren Fall liegen die Energien der Pump- und Laserphotonen ziemlich nahe beieinander, sodass der Anteil der Energie der Pumpphotonen, der aufgrund der Erzeugung eines Laserphotons mit kleinerer Frequenz verloren geht, sehr gering ist. Dieser Anteil wird als Quantendefekt bezeichnet; er ist durch q = 1 − 𝜈L ∕𝜈P
(15.46)
gegeben. Je kleiner der Quantendefekt 𝑞 ist, desto höher ist der Wirkungsgrad des Pumpprozesses. Obwohl das Intrabandpumpen den Vorteil eines kleinen Quantendefekts aufweist, kann der Gewinn solcher Systeme wie oben erwähnt durch pumpeninduzierte Emission oder signalinduzierte Reabsorption nachteilig beeinflusst werden. Pumpverfahren
Wie bereits erwähnt können viele Methoden zum Pumpen eingesetzt werden, wobei in der Praxis meist elektrische oder optische Verfahren zum Einsatz kommen. Elektrisches Pumpen wird meist realisiert, indem ein Strom oder ein Elektronen- oder Ionenstrahl durch ein Medium geleitet wird. Bei Laserdioden erfolgt das elektrische Pumpen durch Injektion von Ladungsträgern in Form von Elektronen oder Löchern (Abschnitt 18.3). Lasermedien aus festen Isolatoren wie Kristallen, dotierten
467
468
15 Laserverstärker
Kathode
(a)
Anode
(d)
Gas
(b)
Laserdiode
Er3+:Quarz-Faser Linse
(e)
Gas
Laserdioden- Linse array Stab
Nd3+:YVO4-Stab
Blitzlampe
(c)
Abb. 15.14 Beispiele für elektrisches und optisches Pumpen. (a) Zum Pumpen von Gaslasern wird häufig Gleichstrom verwendet. Der Strom kann entweder entlang der Laserachse (was zu einer longitudinalen Entladung führt) oder senkrecht dazu fließen. (b) Auch Radiofrequenz-Entladungen können zum Pumpen von Gaslasern eingesetzt werden. (c) Xenon-Blitzlampen oder Krypton-Bogenlampen
dienen zum optischen Pumpen von Rubin- und seltenerddotierten Festkörperlasern. (d) Halbleiterlaserdioden (die selbst elektrisch gepumpt sind) werden verwendet, um Er3+:Quarz-Faserlaser zu pumpen. (e) Zum optischen Pumpen von Nd3+:YVO4 - und anderen Festkörperlasern werden meist Laserdiodenarrays verwendet.
Gläsern und dotierten Keramiken werden meist optisch gepumpt; sehr häufig werden Laser zum Pumpen von Laserverstärkern und anderen Lasern eingesetzt. Die Effizienz des Pumpens variiert erheblich, abhängig von der verwendeten Methode und dem betrachteten System. Elektrisches Pumpen ist im Allgemeinen sehr effizient, insbesondere für Laserdioden, wohingegen optisches Pumpen oft recht ineffizient ist, weil ein beträchtlicher Teil der Pumpphotonen verloren geht und/oder ihre Energie nicht vollständig genutzt wird (z. B. wenn der Quantendefekt 𝑞 groß ist). Einige übliche Verfahren zum elektrischen und optischen Pumpen sind in Abb. 15.14 schematisch illustriert. Pumpschemata, die verschiedene Formen von Lumineszenzstrahlung anregen, werden in Abschnitt 14.5.1 diskutiert. Wie in Abschnitt 16.4 deutlich werden wird, kommen in Laserverstärkern und Lasern neben dem elektrischen und optischen Pumpen auch zahlreiche andere Methoden zum Einsatz. Chemische Laser nutzen beispielsweise chemische Reaktionen, die zu Reaktionsprodukten in angeregten Zuständen führen. Atom-Röntgenlaser und -laserverstärker verwenden fokussierte Laserstrahlen, um durch Aufheizen ein Plasma aus ionisierten Atomen in angeregten Zuständen zu erzeugen. Relativistische Elektronenstrahlen dienen als Pumpen für Freie-Elektronen-Laserverstärker und -Laser. Beim nuklearen Pumpen wird ein Strom energiereicher Röntgenstrahlen oder anderer Teilchen aus Kernreaktionen, dem Zerfall von Radioisotopen oder einer Kernexplosion zum Pumpen verwendet.
15.3 Verbreitete Laserverstärker Laserverstärkung kann in zahlreichen Materialien stattfinden. Die Energieniveaudiagramme für einige typischerweise in Lasern verwendete Atome, Ionen, Moleküle und Festkörper sind in Abschnitt 14.1 gezeigt. In realen Lasersystemen sind in der Regel viele wechselwirkende Energieniveaus beteiligt, die die an dem interessierenden Übergang beteiligten Besetzungsdichten N 1 und N2 beeinflussen, wie Abb. 15.7 zeigt. Trotzdem können die entscheidenden Prinzipien des Betriebs eines Laserverstärkers anhand der Eigenschaften der im vorherigen Abschnitt diskutierten Pumpschemata diskutiert werden. Als Beispiele wollen wir nacheinander drei typische Laserverstärker betrachten: einen Dreiniveau-Rubinlaser, einen neodymdotierten Vierniveau-Glaslaserverstärker und einen erbiumdotierten Quasi-DreiniveauQuarzfaserlaserverstärker. Die meisten Laser arbeiten auf der Grundlage eines Vierniveau-, Quasi-Dreiniveauoder Intraband-Pumpschemas; der Dreiniveau-Rubinlaser ist eine historisch und didaktisch interessante Ausnahme. Wir betrachten auch einen optisch gepumpten Verstärker auf der Grundlage induzierter Ramanstreuung. Alle im Folgenden beschriebenen Laserverstärker arbeiten auch als Laseroszillatoren (siehe Abschnitt 16.3.1). Der optische Halbleiterverstärker, der praktisch immer elektrisch gepumpt wird, wird in Abschnitt 18.2 beschrieben. Die meisten Laserverstärker werden als Leistungsverstärker (auch Nachverstärker bzw. engl. mas-
15.3 Verbreitete Laserverstärker
15.3.1 Rubin Rubin ist ein dielektrisches Medium mit einem Brechungsindex 𝑛 ≈ 1.76. Er besteht aus Saphir (Al2 O3 ), in dem ein kleiner Prozentsatz der Aluminiumionen durch Chromionen (Cr3+ ) ersetzt ist (siehe Abschnitt 14.1.4). Rubin war das erste Material, in dem eine Laserwirkung beobachtet wurde. Er dient uns hauptsächlich als didaktisches Beispiel, da dieses System heute selten verwendet wird. Wie bei den meisten Materialien kann die Laserwirkung auf zahlreichen Übergängen beruhen. Die Energieniveaus des wohl bekanntesten roten Laserübergangs sind in Abb. 15.15 (einer vollständigeren Version von Abb. 14.4) mit ihren gruppentheoretischen Symbolen gezeigt. Der Rubinlaser ist ein Dreiniveausystem. Niveau 1 ist der Grund- und untere Laserzustand, Niveau 2 besteht aus einem Paar von eng benachbarten diskreten Niveaus, die in Abb. 15.15 nicht aufgelöst sind; das tiefere der beiden Niveaus, als 𝑅1 bezeichnet, entspricht dem berühmten roten Laserübergang bei 𝜆0 = 694.3 nm. Niveau 3 besteht aus zwei breiten Bändern um 550 nm (grün) und 400 nm (violett), aus denen das obere La-
Cr3+: Al2O3 (Rubin)
4
4F 1
Energie / eV
ter oscillator genannt) eingesetzt; das heißt, sie sollen die Leistung eines hochwertigen Laseroszillators niedriger Leistung vergrößern, der in diesem Kontext als Seedlaser (auf deutsch manchmal auch Impflaser) bezeichnet wird. Ein solches MasteroszillatorLeistungsverstärker- oder MOPA-System (engl. master oscillator power amplifier) bietet eine Reihe von Vorteilen, die wir in Abschnitt 16.3.2 kennenlernen werden. Sie werden beispielsweise in Kabelfernsehnetzen eingesetzt, wo vor der Einspeisung in die Kabelnetze starke, saubere Signale benötigt werden. MOPA können vielfältige Kombinationen von Laser und Laserverstärkern enthalten, beispielsweise diodengepumpte Festkörperlaser, Halbleiterlaser oder Faserlaser. Wenn ein Faserverstärker als Leistungsverstärker in einem MOPA eingesetzt wird, spricht man auch von einem MOFA (engl. master oscillator fiber amplifier). Manche Laserverstärker werden als Zwischenverstärker oder In-Line-Verstärker eingesetzt, beispielsweise erbiumdotierte Quarzglas-Faserverstärker, die ein Signal auf langen faseroptischen Kommunikationsstrecken verstärken sollen (siehe Abschnitt 25.1.3). Eine andere Anwendung ist der optische Vorverstärker, der ein Signal vor der Übermittlung in einen weiteren Verstärker oder vor der Photodetektion erhöhen soll (siehe Abschnitt 25.1.5). Laserverstärker werden häufig in Sättigung (Abschnitt 15.4) betrieben, um das Rauschen zu verringern.
3 4F 2
3
τ 32 2 2E
2
Laserübergang 694 nm
Pumpen
A2 1
1
4
0
Abb. 15.15 Die Energieniveaus des Rubins für den roten Laserübergang. Die Niveaus sind mit gruppentheoretischen Symbolen anstelle von Termsymbolen bezeichnet. Die drei wechselwirkenden Niveaus sind durch eingekreiste Ziffern gekennzeichnet. Niveau 3 besteht aus zwei breiten Pumpbanden im grünen und violetten Bereich. Aus ihnen wird das obere Laserniveau 2 befüllt, das wiederum aus zwei Unterniveaus R1 und R2 besteht (die in der Abbildung nicht aufgelöst sind). Niveau 1 ist das untere Laserniveau und gleichzeitig der Grundzustand des Systems. Induzierte Emission aus dem R1 -Unterniveau des Niveaus 2 nach Niveau 1 sorgt für das bekannte rote Laserlicht bei 𝜆0 = 694.3 nm.
serniveau befüllt wird. Diese beiden Absorptionsbanden sind für die rote Farbe des Rubins im Durchlicht verantwortlich. Wie in Abb. 15.16 dargestellt, kann ein Rubinstab optisch aus Niveau 1 nach Niveau 3 gepumpt werden, indem er mit einer schraubenförmigen Blitzlampe umgeben wird oder zusammen mit einer linearen Blitzlampe in einen reflektierenden Zylinder mit elliptischem Querschnitt eingeschlossen wird (siehe Abb. 1.8). Die Blitzlampe strahlt weißes Licht aus, das teilweise von dem recht breiten Niveau 3 absorbiert wird und eine Anregung der Cr3+ -Ionen in Niveau 3 bewirkt. Die angeregten Cr3+ -Ionen gehen schnell von Niveau 3 in Niveau 2 über (𝜏32 liegt in der Größenordnung einiger ps). Sie verbleiben einige Zeit in Niveau 2, da die spontane Lebensdauer für den Übergang 2 → 1 Übergang relativ lang ist (𝑡21 ≈ 3 ms; strahlungslose Übergänge sind vernachlässigbar, sodass 𝑡21 ≈ 𝜏sp ist); das entspricht dem Dreiniveauschema aus Abb. 15.12. Nichtstrahlende Übergänge sind vernachlässigbar (𝜏21 ≈ 𝑡sp ). Der Übergang besitzt eine homogen verbreiterte Linienbreite Δ𝜈 ≈ 330 GHz, die hauptsächlich aus elastischer Streuung an den Gitterschwingungen (Phononen) resultiert. Die Eigenschaften des Laserübergangs und des Laseroszillators von Rubin sind in den Tabellen 15.1 bzw. 16.1 angegeben.
469
15 Laserverstärker
Blitzlampe
Rubinstab
Photonen Ausgang
Photonen Eingang
Blitzlampe
elliptischer Spiegel
Kondensator
Rubinstab
Spannungsquelle (a)
(b)
Neodymdotiertes Glas
Neodymdotiertes Phosphatglas ist ein Dielektrikum mit einem Brechungsindex 𝑛 ≈ 1.50, das in sehr großen Abmessungen mit hoher optischer Qualität und Oberflächenbeschaffenheit hergestellt werden kann. Außerdem hat Glas den Vorteil, dass es isotrop ist und leicht homogen dotiert werden kann. Aus diesen Gründen können außergewöhnlich große Nd3+:Glas-Verstärker hergestellt werden, mit denen sehr starke optische Pulse erzeugt werden können. Da Glas allerdings nur eine begrenzte Wärmeleitfähigkeit besitzt, kann ein solcher Verstärker nur mit einem relativen geringen Tastgrad betrieben werden, damit das Glas immer wieder Zeit hat, sich abzukühlen. Die Energieniveaus eines neodymdotierten Phosphatglas-Laserverstärkers sind in Abb. 15.17 dargestellt (die eine erweiterte Version von Abb. 14.5 ist). Die Niveaus 0, 1 und 2 dieses Vierniveausystems entsprechen dem Grundzustand sowie dem unteren bzw. oberen Laserniveau. Die induzierte Emission findet auf dem Übergang 2 → 1 bei 𝜆0 = 1.053 μm im Infrarot statt. Die Energieniveaus für das Nd3+ -Ion sind wie in Abschnitt 14.1.2 erläutert mit Termsymbolen bezeichnet (Tabelle 14.1). Niveau 3 besteht aus vier Pumpbanden bei 805 nm (nahes Infrarot), 745 nm (Rot), 585 nm (Gelb) und 520 nm (Grün), jeweils mit einer Breite von etwa 30 nm. Außer-
3.0
3.0
Nd3+:Glas
Blitzlampe
2.5
2.5 2.0
3
1.5
2.0
4
1.5
2 1.0 0.5
(a)
τ32 F3/2
0
Laserübergang 1.0 1.053 µm
Pumpen 1.0 0.5 relative spektrale Intensität
0 (b)
4I
9/2
τ1
4I
1
Abb. 15.16 Geometrische Anordnungen in Rubinlasern. (a) Die Anordnung des ersten Rubin-Laseroszillators, der 1960 von Maiman gebaut wurde. (b) Eine Anordnung mit verbesserter Pumpeffizienz, in der eine lineare Blitzlampe in einem reflektierenden elliptischen Zylinder eingesetzt wird.
dem ist in der Abbildung das Spektrum der Xenon-Blitzlampe dargestellt, mit dem dieser Verstärker gepumpt wird. Der Nd3+:Glas-Laserverstärker arbeitet wie folgt. Das Pumplicht wird durch die vier Pumpbänder absorbiert, wodurch Ionen aus Niveau 0 in Niveau 3 angeregt werden. Diese angeregten Ionen zerfallen relativ schnell mit der Zeitkonstante 𝜏32 und besetzen das metastabile obere Laserniveau 2, das eine relativ große Lebensdauer besitzt (𝜏𝑠𝑝 = 370 μm). Die induzierte Emission auf dem Übergang 2 → 1 bewirkt eine Laserverstärkung bei 𝜆0 = 1.053 μm. Niveau 1 hat eine kurze Lebensdauer (𝜏1 ≈ 300 ps) und liegt 0.24 eV über dem Grundzustand; da diese Energiedifferenz wesentlich größer ist als die thermische Energie bei Zimmertemperatur (𝑘𝑇 ≈ 0.026 eV), ist die thermische Besetzung des unteren Laserniveaus zu vernachlässigen. Diese Eigenschaften stehen mit den in Abb. 15.11 angegebenen Anforderungen für ein Vierniveausystem im Einklang. Der Laserübergang 2 → 1 wird aufgrund der amorphen Natur des Glases, das an allen Positionen der Ionen eine andere Umgebung darbietet, inhomogen verbreitert. Die Unterniveaus werden daher zu Bändern verschmiert, wie im Zusammenhang mit Abb. 14.4 erläutert wurde. Die Folge ist bei Zimmertemperatur eine große Linienbreite von Δ𝜈 ≈ 7 THz (siehe Tabellen 15.1 und 16.2).
0.5
11/2
0
Energie / eV
15.3.2
Energie / eV
470
Abb. 15.17 (a) Das spektrale Profil der breitbandigen Emission der Xenon-Blitzlampe zum Pumpen des neodymdotierten Glaslaserverstärkers. (b) Die Energieniveaus des Laserübergangs 4 F3∕2 → 4 I11∕2 bei 1.053 μ m in dem neodymdotierten Phosphatglas. Niveau 3 besteht aus vier Pumpbanden (im nahen Infrarot sowie im roten, gelben und grünen Bereich des sichtbaren Spektrums), aus denen das obere Laserniveau 2 befüllt wird. Niveau 1 ist das untere Laserniveau, Niveau 0 der Grundzustand des Systems. Alle Niveaus sind mit den Termsymbolen des Nd3+ -Ions gekennzeichnet.
15.3 Verbreitete Laserverstärker
Beispiel 15-1: Der neodymdotierte HochleistungsLaserverstärker am NIF
Ein neodymdotierter Vierniveau-Glaslaserverstärker spielt eine zentrale Rolle an der National Ignition Facility (NIF) am Lawrence Livermore National Laboratory (LLNL) in Livermore, Kalifornien. Derartige Verstärker werden häufig in Experimenten zur Zündung einer kontrollierten thermonuklearen Fusion in einem gekapselten Brennstofftarget eingesetzt, da sie optische Pulse mit gewaltigen Energien und Spitzenleistungen erzeugen können. Am NIF kommen Tausende dieser Verstärker zum Einsatz; die Anlage füllt ein zehnstöckiges Gebäude mit den Dimensionen eines Fußballstadions. Das Lasersystem am NIF beruht auf einem Masteroszillator-Leistungsverstärker-System (MOPA, siehe Abschnitt 16.4.2). Den anfänglichen optischen Puls liefert ein hochstabiler diodengepumpter Yb3+ -dotierter Faser-Masteroszillator (Seedlaser) in Form eines 1-nJPulses mit einer Dauer von ≈ 5 ns. Vereinfacht dargestellt wird dieser Puls aufgeteilt und über Lichtwellenleiter an 48 Laser-Vorverstärker geschickt, die die Gesamtenergie des Pulses auf 10 J erhöhen. Gleichzeitig werden die Querschnitte der Strahlen zu Quadraten mit einer Kantenlänge von 18 mm geformt, wodurch die einzelnen Verstärker in sehr kompakten Anordnungen dicht gepackt werden können. Jeder dieser 48 Strahlen wird dann in vier Strahlen aufgeteilt, was 192 Hauptstrahllinien ergibt. Jede dieser Strahllinien ist mit einem Leistungsverstärker und einem Hauptverstärker ausgestattet, durch die der Puls insgesamt vier mal reist. Für die in den 192 Hauptstrahllinien verwendeten Nd3+ -dotierten Phosphatglas-Laserverstärker gilt das Energieniveaudiagramm und das spektrale Profil der Blitzlampe wie in Abb. 15.24 gezeigt. Es gibt vier Cluster solcher Laserverstärker, die jeweils aus 6 Verstärkerbündeln bestehen. Jedes Bündel enthält wiederum 8 verstärkende Laserglasplatten, die in einen von einer Blitzlampe gepumpten Hohlraum gepackt werden, wie in Abb. 15.18 gezeigt. Jede der 192 Strahllinien enthält 16 separate Verstärkungsstufen, sodass das Gesamtsystem 3072 Phosphatglas-Laserverstärkerplatten enthält. Die Platten sind nicht quadratisch, sondern rechteckig, da sie im Brewsterwinkel zur Ausbreitungsrichtung des Strahls angebracht sind, um die Fresnelreflexion zu minimieren und die Einkopplung des Blitzlichts zu maximieren. Die Laserverstärker erhöhen die Pulsenergie in jedem der 192 Strahlen auf 20 kJ, sodass die Pulsenergie für den kombinierten Strahl 4 MJ beträgt. Bei einem Puls von 4 ns Dauer entspricht dies einer Spitzenleistung von 1 PW. Die von diesem außerge-
wöhnlichen MOPA bereitgestellte Gesamtverstärkung beträgt somit 𝐺 ≈ 4 × 1015 . Das System ist so angeordnet, dass jeder optische Puls vom Seedlaser bis zum Target eine Entfernung von 1.5 km zurücklegt, was einer Laufzeit von 5 μs entspricht. Ein solcher Puls kann mehrmals am Tag abgefeuert werden, ohne dass eine übermäßige Erwärmung eintritt. Blitzlampen
2m
(a)
Nd3+:Glas-Stab (b)
Abb. 15.18 (a) Am NIF besteht ein Verstärkerbündel aus acht Laserglasplatten innerhalb eines durch Blitzlicht gepumpten Hohlraums. Die Platten bestehen aus einem speziellen Phosphat-Laserglas mit einer Neodymdotierung von ≈ 2 mol-% (Schott LG-7670 oder Hoya LHG-8), haben Abmessungen von 46 cm × 81 cm × 3.4 cm und wiegen pro Stück 42 kg. Die Höhe eines Stapels aus acht Verstärkern beträgt etwa 2 m. Sechs solcher Bündel bilden eine Gruppe, und die vier Gruppen umfassen insgesamt 192 einzelne Strahllinien. Jede Strahllinie besteht wiederum aus 16 separaten Verstärkerstufen, sodass das gesamte System 3072 LaserverstärkerPlatten umfasst. (b) Draufsicht auf die linearen Blitzlampen und die verstärkenden Nd3+:Glas-Laserplatten in einem Bündel. Das System enthält 7680 Blitzlampen.
Intrabandpumpen von Laserdioden
Die in Beispiel 15-1 betrachteten Nd3+ -dotierten GlasLaserverstärker können mit sehr viel größerer Effizienz gepumpt werden, wenn man die Blitzlampen durch Laserdiodenarrays ersetzt, die die elektrische Leistung sehr effizient in optische Leistung umwandeln. Kombiniert mit dem wesentlich kleineren Quantendefekt beim Pumpen mit Laserdioden führt dies zu einer Verbesserung der Gesamteffizienz des Verstärkerbetriebs um einen Faktor 20. Das führt zu einer erheblichen Reduktion der Erwärmung, was wiederum einen Betrieb mit einer höheren Wiederholungsrate ermöglicht. Ein Beispiel für das Intrabandpumpen von Laserdioden liefert das in Beispiel 23-3 beschriebene HAPLSPetawatt-Lasersystem. Der Leistungsverstärkerteil des Pumplasers für HAPLS enthält eine Anordnung von neodymdotierten Laserverstärkerplatten aus Phosphatglas ähnlich den am NIF verwendeten. Die Platten werden mit AlGaAs-Laserdiodenarrays gepumpt, die opti-
471
472
15 Laserverstärker
sche Hochleistungspulse mit einer Wiederholungsrate von 10 Pulsen pro Sekunde liefern. Intrabandpumpen bei 888 nm auf dem Übergang 4 I9∕2 →4 F3∕2 von Nd3+ ermöglicht es, die Ionen aus dem unteren Niveau direkt in das obere Niveau zu pumpen. Das Intrabandpumpen ist hier anwendbar, obwohl die diskreten Unterniveaus der Minibänder in dem inhomogen verbreiterten Medium zu Bändern verschmiert sind.
15.3.3
Erbiumdotierte Quarzglasfasern
Seltenerddotierte Faserverstärker
Optische Faserverstärker sind nützliche Verstärkersysteme, deren großer Vorteil ist, dass sie als Einmodenwellenleiter betrieben werden können (siehe Kapitel 10). In seltenerddotierten Faserverstärkern werden das Signal und die Pumpwelle in die dotierte Faser eingekoppelt. Die Pumpwelle regt die Ionen in ein höheres Energieniveau an, üblicherweise nach einem QuasiDreiniveauschema oder durch Intrabandpumpen, wodurch eine Signalverstärkung durch induzierte Emissionen möglich wird. Seltenerddotierte Faserverstärker verwenden meist Er3+ , Yb3+ , Tm3+ , Nd3+ , Pr3+ oder Ho3+ als Dotiersubstanzen. Da die Faser im interessierenden Wellenlängenbereich transparent sein muss, wird eine Vielzahl von Gläsern verwendet, beispielsweise Silicate, Phosphate, Fluoride, Germanate, Tellurite oder Chalkogenide (siehe Abschnitt 10.5). Neben dem aktiven Ion spielt auch die Zusammensetzung des Glases für die Übergangsquerschnitte der Absorption und Emission, die Übergangsbandbreite, die Lebensdauer im metastabilen Zustand, die maximal erreichbare Dotierkonzentration, die Nichtlinearität der Fasern und den Brechungsindex des Lasermediums eine wichtige Rolle. Seltenerddotierte Faserverstärker werden normalerweise im nahen Infrarot betrieben und nutzen aufgrund ihrer überlegenen optischen und mechanischen Eigenschaften Fasern auf Silikatbasis. Insbesondere dotierte Quarzgläser wie Phosphosilicate, Germanosilicate und Aluminosilicate verbessern die Energieübertragung und erlauben höhere Dotierkonzentrationen als in reinem Quarzglas. Auch der starke optische Einschluss und die großen realisierbaren Faserlängen gehören zu ihren zahlreichen vorteilhaften Eigenschaften. Pumpen von seltenerddotierten Faserverstärkern
Seltenerddotierte Faserverstärker können gepumpt werden, indem man Licht longitudinal in die Verstärkerfaser einkoppelt, üblicherweise mithilfe von dichroitischen Kopplern. Wie Abb. 15.19 zeigt, kann das Pumplicht in derselben Richtung wie das Signal (Vorwärtsrichtung), in der entgegengesetzten Richtung (Rück-
wärtsrichtung) oder in beiden (bidirektional) Richtungen injiziert werden. Die verstärkte spontane Emission (ASE, von engl. amplified spontaneous emission) ist eine grundlegende Rauschquelle in optischen Verstärkern (Abschnitt 15.5). Sie spielt eine entscheidende Rolle für der Festlegung der optimalen Pumpanordnung. Solange die ASE vernachlässigbar ist, spielt die Richtung des Pumpens keine Rolle. Wenn aber in Quasi-Dreiniveausystemen merkliche Verluste durch ASE auftreten, dann zeigt die Analyse, dass die Verluste durch Pumpen in Rückwärtsrichtung reduziert und die Effizienz des Verstärkers so erhöht werden kann. Eine andere Möglichkeit der ASEReduktion bietet die Verwendung von Verstärkerkaskaden mit Filtern zwischen aufeinander folgenden Stufen, die die ASE verringern. Der Vorteil des Pumpens in Rückwärtsrichtung verringert sich jedoch, wenn die Signalleistung in die Nähe der Sättigung des Verstärkers kommt. Wenn es eher auf einen rauscharmen Betrieb als auf einen hohen Wirkungsgrad ankommt, ist das Pumpen in Vorwärtsrichtung häufig die beste Wahl. Erbiumdotierte Faserverstärker
Obwohl seltenerddotierte Faserverstärker in vielen Kontexten zum Einsatz kommen, liegt ihr Schwerpunkt doch in Kommunikationssystemen auf der Grundlage von optischen Fasern. Das Er3+ -Ion zeigt einen breiten Laserübergang in der Umgebung von 𝜆0 = 1550 nm, der praktischerweise in den Bereich des minimalen Verlusts optischer Quarzglasfasern fällt (siehe Abb. 10.25). Da diese Fasern die Grundlage der optischen Kommunikationssysteme bilden, finden erbiumdotierte Faserverstärker (EDFA, von engl. erbium-doped fiber amplifier) dort umfangreiche Verwendung (Abschnitt 25.1.3). EDFA besitzen viele nützliche Eigenschaften wie z. B. eine hohe Verstärkung, eine hohe Ausgangsleistung, eine hohe Effizienz, eine große Bandbreite, eine geringe Dämpfung, geringes Rauschen und Polarisationsunempfindlichkeit. Wie Abb. 15.20 zeigt, wird das bei 980 nm gepumpte Er3+:Quarzfaser-System bei einer Wellenlänge nahe 𝜆 = 1550 nm auf der Fluoreszenzlinie 4 I13∕2 → 4 I15∕2 betrieben. Es verhält sich bei 𝑇 = 300 K wie ein QuasiDreiniveausystem und nach Abkühlung auf 𝑇 = 77 K wie ein Vierniveausystem, da in diesem Fall die Besetzung des unteren Niveaus reduziert ist. Einige Charakteristika dieses Übergangs sowie des darauf beruhenden Laseroszillators sind in den Tabellen 15.1 und 16.2 zusammengefasst. Zu den attraktiven Eigenschaften dieses Laserübergangs gehören eine lange spontane Lebensdauer des angeregten Zustands (𝑡sp ≈ 10 ms), das Fehlen von Energieniveaus zwischen den angeregten Zu-
15.3 Verbreitete Laserverstärker
Gewinnfaser
Gewinnfaser
Gewinnfaser
(b)
(c)
(a)
Abb. 15.19 Longitudinales Pumpen eines Faserverstärkers. Das Pumpen kann (a) in Vorwärtsrichtung, (b) in Rückwärtsrichtung oder (c) bidirektional erfolgen. Er3+:Quarz-Fasern werden häufig durch gespannte InGaAs-Laserdioden bei 𝜆0 = 980 nm gepumpt. Ähnliche Pumpmethoden werden auch für Raman-Faserverstärker eingesetzt (Abschnitt 15.3.5).
2.0
Er3+: Quarz-Faser
Energie / eV
1.5 4I
11/2
3
τ32 4I
1.0
13/2
2 Pumpen
Laserübergang 1.55 µm 4I
0.5
1 15/2
0
Abb. 15.20 Schematische Darstellung der Energieniveaus für den Laserübergang 4 I15∕2 → 4 I15∕2 in Er3+:Quarz-Fasern in der Umgebung von 1550 nm. Bei T = 300 K verhält sich das erbiumdotierte Quarzfasersystem wie ein Dreiniveausystem; die drei wechselwirkenden Niveaus sind durch eingekreiste Ziffern bezeichnet. Um 2.9 μ m kann sich das System auf dem Übergang 4 I11∕2 → 4 I15∕2 auch wie ein Vierniveausystem verhalten.
ständen und dem Grundzustand und das Fehlen von Absorption aus dem angeregten Zustand. Da Er3+ ein Lanthanoidmetallion ist, spielt das Material, in dem die Ionen eingebettet sind, kaum eine Rolle für die Energieniveaus (Abschnitt 14.1.2). Die Linienverbreiterung ist teilweise homogen (phononenvermittelt) und teilweise inhomogen (aus lokalen Feldvariationen im Glas resultierend). Meist werden dem Erbium noch Yb3+ -Ionen als Ko-Dotiermittel zugesetzt, da der größere Absorptionsquerschnitt von Yb3+ eine effizientere Absorption der Pumpphotonen bei 980 nm ermöglicht; die Energie wird anschließend von den Yb3+ - auf die Er3+ -Ionen übertragen, wodurch diese in das 4 I11∕2 -Niveau angeregt werden, genau als ob sie die Pumpphotonen selbst absorbiert hätten. Das Ytterbium spielt hier genau dieselbe Rolle wie das Helium im He-Ne-Laser (Abb. 14.2). Diese Eigenschaften ermöglichen es, in erbiumdotierten Faserverstärkern mit einigen zehn mW Pumpleistung einen Gewinn von mehr als 50 dB zu erreichen. Beispielsweise erhält man mit ≈ 5 mW Pumpleistung bei 980 nm in einer etwa 50 m langen Faser mit
≈ 300 ppm Er2 O3 einen Gewinn von ≈ 30 dB. Die besten Gewinnwirkungsgrade betragen ≈ 10 dB∕mW. Außerdem können Ausgangsleistungen von mehr als 100 W erzeugt werden, da die Ausgangsleistung proportional zur Pumpleistung zunimmt. Die verfügbare Bandbreite ist Δ𝜆 ≈ 40 nm entsprechend Δ𝜈 ≈ 5.3 THz, was dem CBand entspricht, das sich von 1530 bis 1565 nm erstreckt (siehe Abschnitt 25.1.1). Das L-Band, das von 1565 bis 1625 nm reicht, kann auch leicht abgedeckt werden, wobei die optimalen Parameter der erbiumdotierten Faserverstärker für die beiden Bänder nicht identisch sind. Das große Produkt aus Gewinn und Bandbreite dieser Verstärker macht sie optimal geeignet für den Einsatz in Wellenlängenmultiplexsystemen (siehe Abschnitt 25.3). Der Quantendefekt des Quasi-Dreiniveausystems aus Abb. 15.20 von 37 % kann durch Umstellung auf Intrabandpumpen auf den Übergang 4 I13∕2 → 4 I15∕2 bei 1480 nm reduziert werden. Hierzu können AlGaAsP-Laserdioden oder ein Raman-Faserlaser (Abschnitt 16.4.3) eingesetzt werden. Hochleistungs-Faserverstärker können auch gleichzeitig bei 980 und bei 1480 nm gepumpt werden. Die Einführung von Rückkopplung macht aus der Verstärkung schnell eine Oszillation, wie in Abschnitt 16.4.1 diskutiert wird. Bei hohen Pumpleistungen, die bei Faser-Laseroszillatoren häufig auftreten, werden meist Doppelmantelfasern eingesetzt, um schädliche nichtlineare Effekte im Faserkern zu vermeiden (Abb. 16.34). Thulium- und praseodymdotierte Faserverstärker
Von den anderen seltenerddotierten Faserverstärkern, die für faseroptische Kommunikationssysteme von Interesse sind, sind vor allem Tm3+ -dotiertes Mehrkomponenten-Quarzglas im S-Band zwischen 1460 und 1530 nm sowie Pr3+ -dotierte Fasern im O-Band um 1300 nm zu erwähnen. Keiner dieser seltenerddotierten Faserverstärker erreicht jedoch den außergewöhnlichen Gewinn und die Effizienz von erbiumdotierten Systemen. Andere häufig eingesetzte optische Verstärker sind Raman-Faserverstärker (Abschnitt 15.3.4) und optische Halbleiterverstärker (Abschnitt 18.2).
473
15 Laserverstärker
Zusammenfassung
Er3+:Quarzglas-Faserverstärker besitzen zahlreiche nützliche Eigenschaften: • • • • • • •
hoher Gewinn hohe Ausgangsleistung hoher Wirkungsgrad große Bandbreite geringe Einfügungsdämpfung geringes Rauschen Unabhängigkeit von der Polarisation
15.3.4
Raman-Faserverstärker
Erbiumdotierte bzw. allgemein seltenerddotierte Faserverstärker sind nicht die einzige Form von optischen Faserverstärkern. Optische Faserverstärker sind auch auf der Grundlage anderer Mechanismen als der induzierten Emission realisierbar. Eine wichtige Variante von optischen Faserverstärkern sind Raman-Faserverstärker, die auf der Basis von induzierter Ramanstreuung arbeiten. Wie in Abschnitt 14.5.3 besprochen wurde, tritt induzierte Ramanstreuung (SRS, nach engl. stimulated Raman scattering) auf, wenn ein Pumpphoton der Energie ℎ𝜈P zusammen mit einem Signalphoton der niedrigeren Energie ℎ𝜈S in ein nichtlineares optisches Medium wie z. B. eine optische Faser eintritt. Die nichtresonante Version des Prozesses ist in dem Ausschnitt in Abb. 15.21 illustriert; die gestrichelte horizontale Linie bezeichnet einen virtuellen Zustand. Das Signalphoton induziert die Emission einer Kopie seiner selbst, die durch Stokesverschiebung des Pumpphotons um ℎ𝜈R erhalten wird, sodass ihre Energie genau der des einfallenden Signalphotons entspricht. Die überschüssige Energie des Pumpphotons wird auf die Schwingungsmoden der Glasfaser übertragen. Die Stärke des Effekts, ausgedrückt durch den Raman-Gewinnkoeffizienten 𝛾R, hängt von den nichtlinearen Eigenschaften der Glasfaser ab und ist proportional zur Pumpintensität 𝐼P = P ∕A, wobei P die Pumpleistung ist und A die Wechselwirkungsfläche [siehe Gl. (22.56)]. Die Polarisation der induzierten Streustrahlung ist dieselbe wie die des anregenden Feldes. Raman-Faserverstärker können entweder verteilt oder lokalisiert sein. In einem verteilten Raman-Faserverstärker werden das Signal und der Pumpstrahl beide durch die Faser geschickt, die als Gewinnmedium dient. Ein lokalisierter Raman-Faserverstärker verwendet im Gegensatz dazu eine kurze, stark nichtlineare Faser, die den Gewinn liefert. Der Kern wird im
relativer Raman-Gewinnkoeffizient
474
1.0 0.8
hνS hνP
0.6
hνR
0.4
hνS hΔν
Δν
0.2 0 0
10 20 30 Stokes-Verschiebung νR /THz
40
Abb. 15.21 Der Ausschnitt zeigt schematisch den Mechanismus der induzierten Ramanstreuung. Ein Ramangewinn entsteht über einen Bereich von Stokesfrequenzen, der durch die Schwingungseigenschaften des Materials bestimmt wird. Quarz, Germanium, Phosphor und Borgläser haben alle sehr unterschiedliche spektrale Verteilungen und Beträge der induzierten Ramanstreuung. In germaniumdotierten Quarzfasern liegt der maximale Raman-Gewinnkoeffizient um ≈ 13 THz unterhalb der Frequenz der Pumpe, und die Bandbreite ist Δ𝜈 ≈ 12.5 THz. (Gewinnkurve modifiziert nach R. H. Stolen, C. Lee, R. K. Jain, ‚Development of the Stimulated Raman Spectrum in Single-Mode Silica Fibers‘, J. Opt. Soc. Am. B 1, 652–657, 1984; Abb. 5.)
Allgemeinen möglichst klein gemacht, um die Pumpintensität 𝐼P zu erhöhen und dadurch die erforderliche Länge der Faser zu reduzieren. Raman-Faserverstärker ermöglichen wesentlich größere Bandbreiten als erbiumdotierte Faserverstärker. Die Bandbreite, über die Ramanverstärkung eintritt, ist hier durch das Schwingungsspektrum des Wirtsglases und nicht durch die Übergangslinienbreite eines Dotierions bestimmt. Silicat-, Germanat-, Phosphat- und Boratgläser zeigen sehr unterschiedliche SRS-Spektren und -Gewinne. Wie aus Abb. 15.21 zu sehen ist, ist der Hauptpeak des Raman-Gewinnkoeffizienten für gewöhnliche germaniumdotierte Quarzfasern gegenüber der Pumpfrequenz um etwa 𝜈R = 13 THz stokesverschoben, entsprechend ungefähr 100 nm bei 𝜆0 = 1550 nm. Die Bandbreite, über die ein deutlicher Ramangewinn erreicht wird, entspricht ungefähr der Verschiebung, also Δ𝜈 ≈ 12.5 THz bzw. Δ𝜆 ≈ 100 nm bei 1550 nm. Phosphosilikatglasfasern bieten jedoch wesentlich größere Stokesverschiebungen (siehe Beispiel 16-3). Raman-Faserverstärker können durch polarisationsselektive Laserdioden, Faserlaser oder Raman-Faserlaser gepumpt werden, die bei einer Wellenlänge etwa 100 nm unter der zu verstärkenden betrieben werden (wenn das Medium eine germaniumdotierte Quarzfaser ist). Wie bei den seltenerddotierten Faserverstärkern kann die Pumpwelle in Vorwärtsrichtung, in Rückwärtsrichtung oder bidirektional eingespeist werden
15.3 Verbreitete Laserverstärker
(Abb. 15.26); in der Regel pumpt man in Rückwärtsrichtung, weil so das Rauschen reduziert wird, das von der Quelle auf das Signal übertragen wird. Die Kombination mehrerer Pumpen mit unterschiedlichen Frequenzen kann zu einer wesentlich größeren Bandbreite führen, da die Stokesverschiebung mit der Pumpwellenlänge zusammenhängt. Im Prinzip ist Ramanverstärkung für den gesamten Bereich möglich, in dem die Faser transparent ist. Raman-Faserverstärker ermöglichen Gewinne bis zu 20 dB. Die Gewinneffizienz eines Raman-Faserverstärkers aus einer germaniumdotierten Quarzfaser ist ≈ 0.02 dB∕mW im Gegensatz zu ≈ 10 dB∕mW für einen erbiumdotierten Faserverstärker. Daher beträgt die Pumpleistung, die benötigt wird, um nutzbare Ramangewinne in einem solchen verteilten Verstärker zu erreichen, normalerweise einige hundert Milliwatt, ist also weitaus größer als für einen erbiumdotierten Faserverstärker. In lokalisierten Ramanverstärkern können Pumpleistungen von mehr als 1 W verwendet werden. Im Gegensatz zu erbiumdotierten Faserverstärkern muss das Pumpen hierbei polarisationsselektiv erfolgen, da der Ramangewinn maximiert wird, wenn das Signal und der Pumpstrahl dieselbe Polarisation haben. Obwohl die Wirkungsgrade von Raman-Faserverstärkern wesentlich geringer sind als die von erbiumdotierten Faserverstärkern, können sie deutlich verbessert werden, indem man die unterschiedlichen Frequenzen der Signal- und Pumpphotonen in einer einzelnen Faser durch kombinierte Gewinn- und Dispersionskompensation anpasst. Oft werden Raman- und seltenerddotierte Faserverstärker auch kombiniert; derartige Hybridverstärker kombinieren die rauscharme Ramanverstärkung mit der leistungsstarken Verstärkung durch die erbiumdotierten Fasern, die größere Abstände der Repeater und insgesamt eine größere Kapazität des Systeme ermöglichen. Allerdings geht diese Kombination mit einem erhöhten Verbrauch von elektrischer Leistung einher. Raman-Faserverstärker sind vor allem in den spektralen Fenstern nützlich, in denen seltenerddotierte (d. h. vor allem erbiumdotierte) Faserverstärker nicht verfügbar oder ineffizient sind. Brillouin-Faserverstärker
Diese Systeme beruhen auf der induzierten Brillouinstreuung [Abb. 14.37(d)] und verhalten sich ansonsten analog zu Raman-Faserverstärkern; die charakteristische Wechselwirkung erfolgt in ihnen mit akustischen anstelle von optischen Phononen. Aus diesem Grund sind die Brillouin-Frequenzverschiebung und -Bandbreite für dasselbe Material um Größenordnungen kleiner als die Raman-Frequenzverschiebung und -Band-
breite. In Quarzglasfasern liegen die Brillouin-Verschiebung und die zugehörige Bandbreite beispielsweise bei etwa 10 GHz bzw. 100 MHz, wohingegen die RamanVerschiebung und die Raman-Bandbreite beide in der Größenordnung von 13 THz liegen. Zusammenfassung
Raman-Faserverstärker haben im Vergleich zu erbiumdotierten Faserverstärkern sowohl Vorteile als auch Nachteile. Ihre Vorteile sind: • größere Bandbreite • Bandbreite durch Einsatz mehrerer Pumpen erweiterbar • Betrieb über einen großen Bereich von Wellenlängen • beliebiges Fasermaterial • mit vorhandenen Verbindungen kompatibel • geringeres Rauschen • höhere Sättigungsleistung Dem stehen die folgenden Nachteile gegenüber: • • • • • •
kleinerer Gewinn größere Pumpleistung geringerer Wirkungsgrad größere Faserlängen erforderlich Abhängigkeit von der Signalpolarisation strengere Anforderungen an die Instandhaltung von Fasern und Verbindungen
15.3.5 Die Eigenschaften ausgewählter Laserübergänge Die in der Praxis am häufigsten eingesetzten Laserverstärker sind die in den Abschnitten 15.3.3 und 15.3.4 besprochenen Festkörperverstärker, seltenerddotierten Faserverstärker und Raman-Faserverstärker. Laserverstärkung ist jedoch auch in Gasen, Farbstoffen, Exciplexen, Ionen, Systemen aus freien Elektronen und Halbleitern möglich. Tabelle 15.1 gibt die Wellenlängen, Querschnitte, spontanen Lebensdauern, Linienbreiten und Brechungsindizes für einige typische Laserübergänge vom infraroten bis in den Röntgenbereich an. Man sieht, dass die Werte von 𝜆0 , 𝜎0 , 𝑡sp und Δ𝜈 einen großen Bereich abdecken.
475
476
15 Laserverstärker
Tab. 15.1 Eigenschaften von häufigen Laserübergängen. Linienbreite 𝚫𝝂 d. Übergangsc)
Wellenlänge d. Übergangsa) 𝝀0 ∕nm
ÜbergangsQuerschnittb) 𝝈0 ∕cm2
Cu+ (Kα )
0.154
7 × 10−18
2 fs
500 THz
H
≈1
(Kα )
1.46
1 × 10−16
130 fs
65 THz
H
≈1
C5+
18.2
5 × 10−16
12 ps
1 THz
I
≈1
ArF-Exciplex
193
3 × 10−16
10 ns
10 THz
I
≈1
Ar+
515
3 × 10−12
10 ns
3.5 GHz
I
≈1
560–640
2 × 10−16
5 ns
40 THz
H/I
Ne (He-Ne)
633
3 × 10−13
150 ns
1.5 GHz
I
Cr3+:Al2 O3 (Rubin)
694
2 × 10−20
3 ms
330 GHz
H
1.76
700–820
1 × 10−20
260 μs
25 THz
H
1.74
700–1 050
3 × 10−19
3.9 μs
100 THz
H
1.76
Yb3+:YAG
1 030
2 × 10−20
1 ms
1 THz
H
1.82
Nd3+:Phosphatglas
1 053
4 × 10−20
370 μs
7 THz
I
1.50
Nd3+:YAG
1 064
3 × 10−19
230 μs
150 GHz
H
1.82
Nd3+:YVO4 Cr4+:Mg2 SiO4 InGaAsPd)
1 064
8 × 10−19
100 μs
210 GHz
H
2.0
1 100–1 400
1 × 10−19
3 μs
50 THz
H
1.65
1 300–1 600
2 × 10−16
2.5 ns
10 THz
H
3.54
1 550
6 × 10−21
10 ms
5 THz
H/I
1.46
1 900–2 000
1 × 10−18
5 μs
40 THz
H
10 600
3 × 10−18
3s
60 MHz
I
Lasermedium
Ne+
Rhodamin-6G
Cr3+:BeAl
2 O4
(Alexandrit)
Ti3+:Al2 O3
(Forsterit)
Er3+:Quarzglas Cr2+:ZnS CO2
Spontane Lebensdauer
Brechungsindex n
1.40 ≈1
2.27 ≈1
a) Die in der Tabelle gezeigte Vakuumwellenlänge bezeichnet den am häufigsten verwendeten Übergang in dem jeweiligen Lasermedium. Im System He-Ne wird beispielsweise meist die rotorange Linie bei 0.633 μm verwendet, aber die Wellenlängen 0.543, 1.15 und 3.39 μm sind ebenfalls häufig (es besitzt außerdem noch Hunderte weiterer Laserübergänge). b) Der angegebene Wert entspricht dem Peak des effektiven Querschnitts 𝜎E (𝜈) der Emission. c) Werte für Gase wie CO2 gelten für Betrieb bei kleinen Drücken (die atomare Linienbreite in einem Gas hängt wegen der homogenen Stoßverbreiterung von seinem Druck ab). H und I bezeichnen homogene bzw. inhomogene Linienverbreiterung. d) Die Werte gelten für In0.72 Ga0.28 As0.6 P0.4 unter der Annahme einer injizierten Ladungsträgerkonzentration Δn = 1.8 × 1018 cm−3 (siehe Beispiele 18-3 bis 18-5).
15.4 Die Nichtlinearität von Verstärkern 15.4.1 Der Gewinn bei Sättigung in homogen verbreiterten Medien Der Gewinnkoeffizient
Wir haben festgestellt, dass der Gewinnkoeffizient 𝛾(𝜈) eines Lasermediums vom Besetzungsunterschied N abhängt [siehe Gl. (15.4)], der wiederum durch das Pumpniveau bestimmt wird [siehe Gl. (15.29)], dass N außerdem von der Übergangsgeschwindigkeit W ind abhängt [siehe Gl. (15.24)] und dass W ind wiederum von der Flussdichte 𝜙 der Photonen in der Strahlung abhängt [siehe Gl. (15.1)]. Daraus folgt, dass der Gewinnkoeffizient eines Lasermediums von der Photonenflussdichte abhängt, die verstärkt werden soll. Das ist die Ursache der Gewinnsättigung und der Nichtlinearität eines Laserverstärkers, wie wir nun zeigen wollen.
Wenn wir Gl. (15.1) in Gl. (15.24) einsetzen, erhalten wir N=
N0
(15.47)
1 + 𝜙∕𝜙S (𝜈)
mit 1 𝜆 2 𝜏S 𝑔(𝜈) . = 𝜏S 𝜎(𝜈) = 8π 𝑡sp 𝜙S (𝜈)
(15.48)
Diese Gleichung beschreibt die Abhängigkeit des Besetzungsunterschieds N von der Flussdichte 𝜙 der Photonen. Einsetzen von Gl. (15.47) in den Ausdruck Gl. (15.4) für den Gewinnkoeffizient führt direkt zu dem Gewinnkoeffizienten bei Sättigung für homogen verbreiterte Medien: 𝛾0 (𝜈) (15.49) 𝛾(𝜈) = 1 + 𝜙∕𝜙S (𝜈) mit 𝛾0 (𝜈) = N0 𝜎(𝜈) = N0
𝜆2 𝑔(𝜈) . 8π 𝑡sp
(15.50)
15.4 Die Nichtlinearität von Verstärkern
(ν) 0(ν)
1
Gewinn-
Δν
0.5
0 10 −2
10 −1
1
10
bei Sättigung
ϕ ϕ s(ν)
Δν s
Abb. 15.22 Die Abhängigkeit des normierten Gewinnkoeffizienten 𝛾(𝜈)∕𝛾0 (𝜈) bei Sättigung von der normierten Photonenflussdichte 𝜙∕𝜙S (𝜈). Wenn 𝜙 gleich seinem Sättigungswert 𝜙S (𝜈) ist, ist der Gewinnkoeffizient auf die Hälfte seines ungesättigten Werts reduziert.
ν0
ν
Abb. 15.23 Reduktion des Gewinnkoeffizienten und Zunahme der Bandbreite aufgrund von Sättigung für 𝜙 = 2𝜙S (𝜈0 ).
Der Gewinn
Der Gewinnkoeffizient ist eine abnehmende Funktion der Photonenflussdichte 𝜙, wie in Abb. 15.22 dargestellt ist. Die Größe 𝜙S (𝜈) = 1∕𝜏S 𝜎(𝜈) bezeichnet die Photonenflussdichte, bei der der Gewinnkoeffizient auf die Hälfte seines Maximalwerts abgenommen hat; sie wird daher Sättigungs-Photonenflussdichte genannt. Für 𝜏S ≈ 𝑡sp ist die Interpretation von 𝜙S (𝜈) einfach: Während der Zeit einer einzelnen spontanen Emission kann ungefähr ein Photon in jede Übergangsquerschnittsfläche ausgestrahlt werden [𝜎(𝜈) 𝜙S (𝜈) 𝑡sp = 1]. Übung 15-5: Sättigungs-Photonenflussdichte für Rubin
Bestimmen Sie die Sättigungs-Photonenflussdichte und die entsprechende Sättigungsintensität für den Übergang 𝜆0 = 694.3 nm eines Rubinlasers bei 𝜈 = 𝜈0 . Verwenden Sie die Parameter aus Tabelle 15.1. Nehmen Sie an, dass gemäß Gl. (15.42) 𝜏S ≈ 2𝑡sp ist.
Nachdem wir nun den Einfluss der Sättigung auf den Gewinnkoeffizienten (Gewinn pro Längeneinheit) bestimmt haben, untersuchen wir das Verhalten des Gewinns bei Sättigung für einen homogen verbreiterten Laserverstärker der Länge d [Abb. 15.24(a)]. Der Einfachheit halber unterdrücken wir die Frequenzabhängigkeit von 𝛾(𝜈) und 𝜙S (𝜈) und verwenden stattdessen die Symbole 𝛾 und 𝜙S . Wenn die Photonenflussdichte am Ort 𝑧 gleich 𝜙(𝑧) ist, dann ist der Gewinnkoeffizient an diesem Ort nach Gl. (15.49) ebenfalls eine Funktion von 𝑧. Wir wissen aus Gl. (15.3), dass die infinitesimale Zunahme der Photonenflussdichte am Ort 𝑧 gleich d𝜙 = 𝛾𝜙 d𝑧 ist; daraus erhalten wie die Differentialgleichung d𝜙 𝛾0 𝜙 . = d𝑧 1 + 𝜙∕𝜙S
(15.52)
Wenn wir diese Gleichung als (1∕𝜙 + 1∕𝜙S ) d𝜙 = 𝛾0 d𝑧 schreiben und integrieren, erhalten wir Übung 15-6: Spektrale Verbreiterung eines gesättigten Verstärkers
Betrachten Sie ein homogen verbreitertes Verstärkermedium mit einer Lorentzlinie der Breite Δ𝜈 [Gl. (15.8)]. Zeigen Sie, dass der Gewinnkoeffizient 𝛾(𝜈) des Verstärkers eine Lorentzlinie der Breite √ Δ𝜈S = Δ𝜈
1+
𝜙 𝜙S (𝜈0 )
ln
𝜙(𝑧) 𝜙(𝑧) − 𝜙(0) = 𝛾0 𝑧 . + 𝜙S 𝜙(0)
(15.53)
Die Beziehung zwischen den Photonenflussdichten 𝜙(0) und 𝜙(d ) am Eingang bzw. Ausgang ist daher [ln(𝑌) + 𝑌] = [ln(𝑋) + 𝑋] + 𝛾0 d ,
(15.54)
(15.51)
besitzt, wobei 𝜙 die Photonenflussdichte ist. Das zeigt, dass Gewinnsättigung von einer Zunahme der Bandbreite begleitet wird, entsprechend einer reduzierten Frequenzselektivität, wie Abb. 15.23 illustriert.
wobei 𝑋 = 𝜙(0)∕𝜙S und 𝑌 = 𝜙(d )∕𝜙S die auf die Sättigungs-Photonenflussdichte normierten Photonenflussdichten am Eingang bzw. Ausgang sind. Es ist nützlich, die Lösung für den Gewinn 𝐺 = 𝜙(d )∕𝜙(0) = 𝑌∕𝑋 für zwei Grenzfälle zu untersuchen: 1) Wenn sowohl 𝑋 als auch 𝑌 viel kleiner sind als eins (d. h. die Photonenflussdichten viel kleiner sind als die Sättigungs-Photonenflussdichte), dann sind 𝑋 und 𝑌 gegen ln(𝑋) und ln(𝑌) vernachlässigbar, wo-
477
15 Laserverstärker
exp(
Eingang
Verstärker
Ausgang
Y = X exp(
0
)
8 0
4 Y =X
Gewinn ϕ( )/ϕ(0)
12 Ausgang Y = ϕ( )/ϕ s
478
0
)
6
4
2 1
0
0
2 4 Eingang X = ϕ(0)/ϕ s
0 0.01
0.1 1 Eingang X = ϕ(0)/ϕ s
(b)
(a)
Abb. 15.24 (a) Ein nichtlinearer (gesättigter) Verstärker. (b) Die Beziehung zwischen der normierten Photonenflussdichte Y = 𝜙(d )∕𝜙S am Ausgang und der normierten Photonenflussdichte x = 𝜙(0)∕𝜙S am Eingang. Für x ≪ 1 ist der Gewinn gleich Y ∕X ≈ exp(𝛾0 d ). Für X ≫ 1 erhalten wir
raufhin wir die Näherung ln(𝑌) ≈ ln(𝑋) + 𝛾0 d erhalten; daraus folgt 𝑌 ≈ 𝑋 exp(𝛾0 d ) .
(15.55)
In diesem Fall ist die Beziehung zwischen 𝑌 und 𝑋 linear und der Gewinn ist 𝐺 = 𝑌∕𝑋 ≈ exp(𝛾0 d ) [die linke gestrichelte Kurve in Abb. 15.24(b)]. Das stimmt mit Gl. (15.7) überein, die in der Näherung kleiner Signale gilt, wenn der Gewinnkoeffizient nicht von der Photonenflussdichte abhängt, d. h. 𝛾 ≈ 𝛾0 . 2) Für 𝑋 ≫ 1 können wir ln(𝑋) gegen 𝑋 und ln(𝑌) gegen 𝑌 vernachlässigen; dann folgt 𝑌 ≈ 𝑋 + 𝛾0 d
(15.56)
oder 𝜙(d ) ≈ 𝜙(0) + 𝛾0 𝜙S d ≈ 𝜙(0) +
6
N0d
𝜏S
.
(15.57)
Im Bereich der Sättigung sind die Atome des Mediums damit „beschäftigt“, eine konstante Photonenflussdichte N 0 d ∕𝜏S zu emittieren. Am Eingang eintreffende Photonen gehen daher unverändert zum Ausgang durch, verstärkt nur um eine konstante Photonenflussdichte, die von dem am Verstärker anliegenden Eingangssignal unabhängig ist [kurze gestrichelte Kurve rechts in Abb. 15.24(b)]. Für Zwischenwerte von 𝑋 und 𝑌 muss Gl. (15.54) numerisch gelöst werden. Eine Auftragung der Lösung ist als durchgezogene Kurve in Abb. 15.24(b) gezeigt. Die lineare Beziehung zwischen Eingang und Ausgang, die
10
(c)
Y ≈ X + 𝛾0 d. Eine numerische Lösung von Gl. (15.54) ist als durchgezogene Kurve gezeigt. (c) Gewinn als Funktion der normierten Photonenflussdichte X am Eingang in einem Verstärker der Länge d mit 𝛾0 d = 2.
wir für 𝑋 ≪ 1 erhalten hatten, sowie die Sättigung für 𝑋 ≫ 1 sind als Grenzfälle der numerischen Lösung offensichtlich. Der Gewinn 𝐺 = 𝑌∕𝑋 ist für 𝛾0 d = 2 in Abb. 15.24(c) aufgetragen. Er erreicht seinen maximalen Wert exp(𝛾0 d ) für kleine Werte der Photonenflussdichte am Eingang (𝑋 ≪ 1), und nimmt für 𝑋 → ∞ auf eins ab. Sättigbare Absorber
Wenn der Gewinnkoeffizient 𝛾0 negativ ist, d. h. die Besetzung normal und nicht invertiert ist (N 0 < 0), bewirkt das Medium eine Dämpfung anstelle einer Verstärkung. Der Dämpfungskoeffizient 𝛼(𝜈) = −𝛾(𝜈) erfährt gemäß der Beziehung 𝛼(𝜈) = 𝛼0 (𝜈)∕[1 + 𝜙∕𝜙S (𝜈)] ebenfalls Sättigung. Das zeigt, dass die Absorption für große Werte der Photonenflussdichte abnimmt. Ein Material mit dieser Eigenschaft wird sättigbarer Absorber genannt. Die Beziehung zwischen den Photonenflussdichten 𝜙(0) und 𝜙(d ) am Ein- bzw. Ausgang eines Absorbers der Länge d ist durch Gl. (15.54) mit negativem 𝛾0 gegeben. Der Gesamt-Transmissionsgrad 𝑌∕𝑋 = 𝜙(d )∕𝜙(0) des Absorbers ist in Abb. 15.25 als Funktion von 𝑋 = 𝜙(0)∕𝜙S dargestellt (durchgezogene Kurve). Der Transmissionsgrad nimmt mit zunehmenden 𝜙(0) zu und erreicht schließlich den Grenzwert eins. Dieser Effekt tritt auf, weil für den Besetzungsunterschied N → 0 gilt, sodass es keine Nettoabsorption gibt.
15.4.2 Gewinn bei Sättigung in inhomogen verbreiterten Medien Der Gewinnkoeffizient
Ein inhomogen verbreitertes Medium besteht aus einer Ansammlung von Atomen mit verschiedenen Eigenschaften. Wie in Abschnitt 14.3.4 diskutiert hat die
Eingang sättigbarer Absorber Ausgang
Transmission Y/X = ϕ( )/ϕ(0)
15.4 Die Nichtlinearität von Verstärkern
Abb. 15.25 Der Transmissionsgrad eines sättigbaren Absorbers Y ∕X = 𝜙(d )∕𝜙(0) als Funktion der normierten Photonenflussdichte X = 𝜙(0)∕𝜙S für 𝛾0 d = −2. Der Transmissionsgrad nimmt mit steigender Photonenflussdichte am Eingang zu.
0.8
0.6
0.4 0.2
exp(
0 0.1
(15.59)
𝛾0𝛽 (𝜈) 1 + 𝜙∕𝜙𝑠𝛽 (𝜈)
=𝑏
𝑔𝛽 (𝜈) 1 + 𝜙 𝑎2 𝑔𝛽 (𝜈)
𝛾𝛽 (𝜈) =
𝑏(Δ𝜈∕2π) (𝜈 − 𝜈𝛽 − 𝜈0 )2 + (Δ𝜈S ∕2)2
(15.61)
mit √ Δ𝜈S = Δ𝜈
1+
𝜙 𝜙S (𝜈0 )
(15.62)
und
wobei 𝛾𝛽 (𝜈) =
10
schwindigkeit v 𝛽 der Teilmenge proportionalen Betrag 𝜈𝛽 verschoben. Wenn 𝑔(𝜈) Lorentzform mit der Breite Δ𝜈 besitzt, liefert Gl. (15.8) 𝑔(𝜈) = (Δ𝜈∕2π)∕[(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ] und 𝑔𝛽 (𝜈) = 𝑔(𝜈 − 𝜈𝛽 ). Wenn wir 𝑔𝛽 (𝜈) in Gl. (15.60) einsetzen, erhalten wir
(15.58)
Die Lösung für den Gewinnkoeffizienten bei Sättigung ist jedoch schwieriger, weil die Sättigungs-Photonenflussdichte 𝜙S (𝜈) nach Gl. (15.48) umgekehrt proportional zu 𝑔(𝜈) ist und daher selbst von der Teilmenge 𝛽 der Atome abhängt. Mithilfe der Gln. (15.49) und (15.48) können wir einen mittleren Gewinnkoeffizienten definieren, 𝛾(𝜈) = ⟨𝛾𝛽 (𝜈)⟩ ,
)
1 Eingang X = ϕ(0)/ϕ s
mit 𝛽 bezeichnete Teilmenge der Atome eine homogen verbreiterte Linienformfunktion 𝑔𝛽 (𝜈). Die gesamte inhomogene mittlere Linienformfunktion des Mediums wird durch 𝑔(𝜈) = ⟨𝑔𝛽 (𝜈)⟩ beschrieben, wobei ⟨⋅⟩ einen Mittelwert über 𝛽 bezeichnet. Weil der Gewinnkoeffizient 𝛾0 (𝜈) in der Näherung kleiner Signale gemäß Gl. (15.50) proportional zu 𝑔(𝜈) ist, besitzen unterschiedliche Teilmengen 𝛽 von Atomen unterschiedliche Gewinnkoeffizienten 𝛾0𝛽 (𝜈). Der mittlere Gewinnkoeffizient in der Näherung kleiner Signale ist daher 𝜆2 𝛾 0 (𝜈) = N0 𝑔(𝜈) . 8π 𝑡sp
0
(15.60)
ist mit 𝑏 = N0 (𝜆 2 ∕8π 𝑡sp ) und 𝑎2 = (𝜆 2 ∕8π)(𝜏S ∕𝑡sp ). Die Berechnung des Mittelwerts von Gl. (15.60) erfordert Sorgfalt, weil der Mittelwert eines Verhältnisses nicht gleich dem Verhältnis der Mittelwerte ist. Dopplerverbreitertes Medium
Obwohl alle Atome in einem dopplerverbreiterten Medium dieselbe Linienformfunktion 𝑔(𝜈) besitzen, ist die Mittenfrequenz der Teilmenge 𝛽 um einen zur Ge-
𝜙S−1 (𝜈0 ) = =
2𝑎2 𝜆 2 𝜏S 2 = πΔ𝜈 8π 𝑡sp πΔ𝜈 𝜆 2 𝜏S 𝑔(𝜈0 ) . 8π 𝑡sp
(15.63)
Gleichung (15.62) wurde für den homogen verbreiterten gesättigten Verstärker erhalten, der in Übung 15-6 untersucht wurde [siehe Gl. (15.51)]. Es ist offensichtlich, dass die Teilmenge von Atomen mit der Geschwindigkeit v 𝛽 einen gesättigten Gewinnkoeffizienten 𝛾𝛽 (𝜈) mit einer Lorentzform der Breite Δ𝜈S besitzt, der mit steigender Photonenflussdichte zunimmt. Der Mittelwert von 𝛾𝛽 (𝜈) in Gl. (15.59) kann leicht berechnet werden, da die Verschiebungen 𝜈𝛽 einer gaußförmigen Wahrscheinlichkeitsdichte 𝑝(𝜈𝛽 ) = (2π 𝜎D2 )−1∕2 exp(−𝜈𝛽2 ∕2𝜎D2 ) mit einem Mittelwert von null und einer Standardabweichung 𝜎D folgen (siehe Übung 14-2). Also ist 𝛾(𝜈) = ⟨𝛾𝛽 (𝜈)⟩ gleich ∞
𝛾(𝜈) = ∫ 𝛾𝛽 (𝜈)𝑝(𝜈𝛽 ) d𝜈𝛽 .
(15.64)
−∞
Wenn 𝑝(𝜈𝛽 ) viel breiter ist als 𝛾𝛽 (𝜈) (d. h. die Dopplerverbreiterung viel größer ist als Δ𝜈S ), können wir die breite
479
480
15 Laserverstärker
1
(v0)
inhomogen
(ν)
0
homogen
0.5
Δν s ν0
0 10 −2
10 −1
1
10
10 2
ϕ ϕs
ν1
Abb. 15.26 Vergleich der Gewinnsättigung in homogen und inhomogen verbreiterten Medien.
Funktion 𝑝(𝜈𝛽 ) als konstant betrachten und vor das Integral ziehen, wenn wir 𝛾(𝜈0 ) berechnen. Wenn wir in der Exponentialfunktion 𝜈 = 𝜈0 und 𝜈𝛽 = 0 setzen, erhalten wir 𝛾(𝜈0 ) = √
𝑏𝑝(0) 1 + 2𝜙𝑎2 ∕πΔ𝜈
= √
𝛾0 1 + 𝜙∕𝜙S (𝜈0 )
𝜆 1 √ 8π 𝑡sp 2π𝜎D2
ν
Abb. 15.27 Der Gewinnkoeffizient eines inhomogen verbreiterten Mediums wird durch eine große Flussdichte monochromatischer Photonen der Frequenz 𝜈1 lokal gesättigt.
Gl. (15.62) gegebenen Breite Δ𝜈S besitzt, folgt daraus, dass die Breite des Lochs Δ𝜈S ist. Mit steigender Flussdichte der sättigenden Photonen bei 𝜈1 nehmen Tiefe und Breite des Lochs zu.
, (15.65)
wobei der mittlere Gewinnkoeffizient 𝛾 0 in der Näherung kleiner Signale gleich 𝛾0 = N0
ν
2
(15.66)
ist. Gleichung (15.65) liefert einen Ausdruck für den Mittelwert des Sättigungs-Gewinnkoeffizienten eines dopplerverbreiterten Mediums bei der Mittenfrequenz 𝜈0 als Funktion der Photonenflussdichte 𝜙 bei 𝜈 = 𝜈0 . Der Gewinnkoeffizient wird mit steigendem 𝜙 nach einem Quadratwurzelgesetz gesättigt. Der Gewinnkoeffizient in einem inhomogen verbreiterten Medium wird daher langsamer gesättigt als der eines homogen verbreiterten Mediums [siehe Gl. (15.49)], wie in Abb. 15.26 gezeigt ist. Lochbrennen
Wenn eine große Flussdichte monochromatischer Photonen der Frequenz 𝜈1 auf ein inhomogen verbreitertes Medium fällt, wird der Gewinn nur für jene Atome gesättigt, deren Linienformfunktion mit 𝜈1 überlappt. Andere Atome wechselwirken nicht mit den Photonen und bleiben ungesättigt. Wenn das gesättigte Medium nun mit einer schwachen monochromatischen Lichtquelle einer unterschiedlichen Frequenz 𝜈 untersucht wird, zeigt das Profil des Gewinnkoeffizienten daher ein Loch bei 𝜈1 , wie in Abb. 15.27 dargestellt. Dieses Phänomen wird als Lochbrennen bezeichnet. Da der Gewinnkoeffizient 𝛾𝛽 (𝜈) der Teilmenge von Atomen mit der Geschwindigkeit v 𝛽 eine Lorentzform mit der durch
15.5 Verstärkerrauschen Das resonante Medium, das durch induzierte Emission die Verstärkung bewirkt, erzeugt auch spontane Emission. Das Licht aus diesem Prozess hängt nicht von dem Signal am Eingang des Verstärkers ab und ist somit eine grundsätzliche Quelle von Verstärkerrauschen. Während das verstärkte Signal eine spezifische Frequenz, Richtung und Polarisation besitzt, ist das Rauschen aufgrund von verstärkter spontaner Emission (ASE) breitbandig, multidirektional und unpolarisiert. Demzufolge ist es möglich, einen Teil des Rauschens herauszufiltern, indem man hinter den Verstärker ein schmalbandiges optisches Filter, eine Blende und einen Polarisator platziert. Die Wahrscheinlichkeitsdichte (pro Sekunde), dass ein Atom im oberen Laserniveau spontan ein Photon einer Frequenz zwischen 𝜈 und 𝜈 + d𝜈 ausstrahlt, ist (siehe Übung 14-1) 𝑃sp (𝜈) d𝜈 =
1 𝑔(𝜈) d𝜈 . 𝑡sp
(15.67)
Die Wahrscheinlichkeitsdichte für die spontane Emission eines Photon beliebiger Frequenz ist natürlich 𝑃sp = 1∕𝑡sp . Wenn N2 die Atomdichte im oberen Energieniveau ist, ist die mittlere spontan emittierte Photonendichte N 2 𝑃sp (𝜈). Die mittlere spontan emittierte Leistung pro Volumen- und Frequenzeinheit ist daher ℎ𝜈N2 𝑃sp (𝜈). Diese Leistungsdichte wird gleichförmig in alle Richtungen ausgestrahlt und gleichmäßig auf die beiden Polarisationen verteilt. Wenn das Ausgangssignal des Verstärkers wie in Abb. 15.28 gezeigt aus einem Raumwin-
15.5 Verstärkerrauschen
spontaner Photonenfluss dΩ
Photonenfluss Eingang
Filter und Polarisator Photonenfluss Ausgang Photonenfluss Rauschen
Abb. 15.28 Spontane Emission ist eine Quelle für Verstärkerrauschen. Es ist breitbandig, omnidirektional und unpolarisiert. Am Ausgang des Verstärkers können optische Bauelemente eingesetzt werden, um das Rauschen aufgrund von spontaner Emission auf ein schmales optisches Band, einen Raumwinkel d 𝛺 und eine einzige Polarisation zu beschränken.
kel d𝛺 und nur von einer der Polarisationen gesam1 melt wird, enthält es einen Bruchteil d𝛺∕4π der spon2 tan ausgestrahlten Leistung. Wenn außerdem ein Filter verwendet wird, um die gesammelten Photonen auf ein schmales Frequenzband der Breite 𝐵 um die verstärkte Signalfrequenz zu beschränken, ist die Zahl von Photonen, die dem Ausgangssignal durch spontane Emission aus einem infinitesimalen Volumen der Flächeneinheit und der Länge d𝑧 hinzugefügt wird, gleich 𝜉sp (𝜈) d𝑧, wobei 𝜉sp (𝜈) = N2
d𝛺 1 𝑔(𝜈)𝐵 𝑡sp 8π
(15.68)
die Photonenflussdichte des Rauschens pro Längeneinheit ist. Bei der Bestimmung der durch den Verstärker hervorgerufenen Rausch-Photonenflussdichte darf die Photonenflussdichte pro Längeneinheit nicht einfach mit der Länge des Verstärkers multipliziert werden. Der Grund dafür ist, dass auch das Rauschen aufgrund von spontaner Emission durch das Medium verstärkt wird; Rauschen durch spontane Emission in der Nähe des Verstärkereingangs liefert einen größeren Beitrag als Rauschen, das erst in der Nähe des Verstärkerausgangs entsteht. Um das ASE-Rauschen zu berücksichtigen, kann man beispielsweise Gl. (15.3) für das Wachstum der Photonenflussdichte durch die Gleichung d𝜙 = 𝛾(𝜈)𝜙 + 𝜉sp (𝜈) d𝑧
(15.69)
ersetzen, die die Photonenflussdichte aus dem verstärkten Signal sowie aus dem Rauschen durch verstärke spontane Emission beschreibt. Übung 15-7: Verstärkte spontane Emission (ASE)
(a) Verwenden Sie Gl. (15.69), um zu zeigen, dass die spontane Emission in Abwesenheit eines Eingangssignals am Ausgang eines ungesättigten Verstärkers [𝛾(𝜈) ≈ 𝛾0 (𝜈)] der Länge d eine Photonenflussdichte erzeugt, die als 𝜙(d ) = 𝜙sp {exp[𝛾0 (𝜈)d ] − 1} ausgedrückt
werden kann, wobei 𝜙sp = 𝜉sp (𝜈)∕𝛾0 (𝜈) ist. (b) Da sowohl 𝜉sp (𝜈) als auch 𝛾0 (𝜈) proportional zu 𝑔(𝜈) sind, hängt 𝜙sp nicht von 𝑔(𝜈) ab, sodass die Frequenzabhängigkeit von 𝜙(d ) durch den Faktor {exp[𝛾0 (𝜈)d ] − 1} bestimmt wird. Zeigen Sie, dass die Breite des Faktors {exp[𝛾0 (𝜈)d ] − 1} kleiner als Δ𝜈 ist, d. h. dass die Verstärkung der spontanen Emission von einer spektralen Einengung begleitet ist, wenn 𝛾0 (𝜈) eine Lorentzform der Breite Δ𝜈 besitzt, d. h. 𝛾0 (𝜈) = 𝛾0 (𝜈0 )(Δ𝜈∕2)2 ∕[(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ].
15.5.1 Photonenstatistik nach Verstärkung Im Laufe der Verstärkung wird die Photonenstatistik (siehe Abschnitt 13.2.3) des eingehenden Lichts verändert. Ein kohärentes Signal am Eingang des Verstärkers besitzt eine Poissonstatistik mit einer Varianz 𝜎S2 , die gleich der mittleren Zahl der Photonen nS im Eingangssignal ist. Die ASE-Photonen folgen dagegen einer Bose2 2 Einstein-Statistik mit 𝜎ASE = nASE + nASE und enthalten daher ein deutlich höheres Rauschen als nach der Poissonstatistik. Die Photonenstatistik des Lichts nach der Verstärkung, die sowohl das Signal als auch Beiträge der spontanen Emission umfasst, gehorcht einem zwischen diesem beiden Grenzfällen liegenden Wahrscheinlichkeitsgesetz. Wenn die Zählzeit kurz und das austretende Licht linear polarisiert ist, entspricht die Photonenstatistik am Ausgang einem Spezialfall der nichtzentralnegativ-binomialen Photonenzahlverteilung (siehe Aufgabe 15-12), deren Varianz gleich ( ) 𝜎n2 = nS + nASE + n2ASE + 2nS nASE
(15.70)
ist. Diese Fluktuationen der Photonenzahl enthalten individuelle Beiträge des Signals und der spontanen Emission sowie einen Kreuzterm, der beide miteinander verknüpft.
481
482
15 Laserverstärker
Aufgaben Aufgabe 15-1: Verstärkergewinn und Stablänge
Ein handelsüblicher Rubinlaserverstärker aus einem 15 cm langen Stab hat in der Näherung kleiner Signale einen Gewinn von 12. Wie ist der entsprechende Gewinn eines 20 cm langen Stabs? Vernachlässigen Sie Effekte aufgrund von Gewinnsättigung. Aufgabe 15-2: Gewinn eines Laserverstärkers und der Besetzungsunterschied
Ein 15 cm langer Stab aus Nd3+:Glas hat als Laserverstärker in der Näherung kleiner Signale einen Gesamtgewinn von 10 bei 𝜆0 = 1.06 μm. Verwenden Sie die Daten in Tabelle 15.1, um den Besetzungsunterschied N (Ionen pro cm3 ) zu bestimmen, der erforderlich ist, um diesen Gewinn zu erreichen. Aufgabe 15-3: Die Verstärkung eines breitbandigen Signals
Der Übergang zwischen zwei Energieniveaus zeigt eine Lorentzlinie der Mittenfrequenz 𝜈0 = 5 × 1014 mit einer Linienbreite Δ𝜈 = 1 THz. Die Besetzung ist invertiert, sodass der maximale Gewinnkoeffizient 𝛾(𝜈0 ) = 0.1 cm−1 ist. Das Medium hat einen zusätzlichen Dämpfungskoeffizienten 𝛼S = 0.05 cm−1 , der nicht von 𝜈 abhängt. Schätzen Sie den Verlust oder Gewinn für eine Lichtwelle auf einem Weg von 1 cm, wenn sie eine gleichförmige spektrale Leistungsdichte mit einer Bandbreite 2Δ𝜈 um 𝜈0 besitzt.
die Besetzungszahlen N 1 , N 2 und N3 im stationären Zustand und untersuchen Sie, ob eine gleichzeitige Besetzungsinversion zwischen den Niveaus 3 und 1 sowie den Niveaus 2 und 1 möglich ist. Zeigen Sie, dass das Vorhandensein der Strahlung des Übergangs 2 → 1 den Besetzungsunterschied für den Übergang 3 → 1 reduziert. Aufgabe 15-6: Die Bedeutung der Sättigungs-Photonenflussdichte
In dem allgemeinen atomaren Zweiniveausystem aus Abb. 15.8 bezeichnet 𝜏2 die Lebensdauer des Niveaus 2 ohne induzierte Emission. In Gegenwart von induzierter Emission nimmt die Geschwindigkeit des Zerfalls aus Niveau 2 zu und die effektive Lebensdauer ab. Bestimmen Sie die Photonenflussdichte 𝜙, bei der die Lebensdauer auf die Hälfte ihres Werts abgenommen hat. Wie hängt diese Photonenflussdichte mit der SättigungsPhotonenflussdichte 𝜙S zusammen? Aufgabe 15-7: Die optische Intensität bei Sättigung
Bestimmen Sie die Sättigungs-Photonenflussdichte 𝜙S (𝜈0 ) und die zugehörige optische Intensität 𝐼S (𝜈0 ) für die homogen verbreiterten Laserübergänge in Rubin und Nd3+:YAG aus Tabelle 15.1. Aufgabe 15-8: Anstieg der Photonenflussdichte in einem gesättigten Verstärker
Der Anstieg der Photonenflussdichte 𝜙(𝑧) in einem Laserverstärker wird durch Gl. (15.53) beschrieben. Tragen Sie 𝜙(𝑧)∕𝜙S gegen 𝛾0 𝑧 für 𝜙(0)∕𝜙S = 0.05 auf. Identifizieren Sie den Beginn der Sättigung in diesem Verstärker.
Aufgabe 15-4: Zweiniveausystem
Geben Sie die Geschwindigkeitsgleichungen für ein Zweiniveausystem an und zeigen Sie, dass im stationären Zustand durch direktes optisches Pumpen zwischen den Niveaus 1 und 2 keine Besetzungsinversion erreicht werden kann. Aufgabe 15-5: Zwei Laserlinien
Betrachten Sie ein atomares System mit vier Niveaus: 0 (Grundzustand), 1, 2, und 3. Zwei Pumpsysteme werden verwendet: zwischen dem Grundzustand und Niveau 3 mit einer Geschwindigkeit R3 und zwischen dem Grundzustand und Niveau 2 mit einer Geschwindigkeit R2 zu pumpen. Eine Besetzungsinversion kann zwischen den Niveaus 3 und 1 und/oder den Niveaus 2 und 1 (wie in einem Vierniveaulaser) auftreten. Nehmen Sie an, dass kein Zerfall von Niveau 3 nach Niveau 2 möglich und der Zerfall aus den Niveaus 3 und 2 in den Grundzustand vernachlässigbar ist und geben Sie die Geschwindigkeitsgleichungen für die Niveaus 1, 2 und 3 als Funktion der Lebensdauern 𝜏1 , 𝜏31 und 𝜏21 an. Bestimmen Sie
Aufgabe 15-9: Resonante Absorption eines Mediums im thermischen Gleichgewicht
Ein Medium mit einem Brechungsindex von eins und einem Volumen von 1 cm3 enthält NAt = 1023 Atome im thermischen Gleichgewicht. Der Grundzustand ist Energieniveau 1; das Niveau 2 liegt 2.48 eV über dem Grundzustand (𝜆0 = 0.5 μm). Der Übergang zwischen diesen beiden Niveaus ist durch eine spontane Lebensdauer 𝑡sp = 1 ms und eine Lorentzlinie der Breite Δ𝜈 = 1 GHz charakterisiert. Betrachten Sie zwei Temperaturen 𝑇1 und 𝑇2 mit k𝑇1 = 0.026 eV und k𝑇2 = 0.26 eV. (a) Bestimmen Sie die Besetzungszahlen N1 und N 2 . (b) Bestimmen Sie die Zahl der pro Sekunde spontan emittierten Photonen. (c) Bestimmen Sie den Dämpfungskoeffizienten des Mediums bei 𝜆0 = 0.5 μm unter der Annahme, dass der einfallende Photonenfluss klein ist. (d) Skizzieren Sie die Abhängigkeit der Dämpfungskonstante von der Frequenz und geben Sie auf der Skizze alle wichtigen Parameter an. (e) Bestimmen Sie den Wert der Photonenflussdichte, bei der die Dämpfungs-
Aufgaben
konstante um einen Faktor zwei abgenommen hat (d. h. die Sättigungs-Photonenflussdichte). (f) Skizzieren Sie die Abhängigkeit der transmittierten Photonenflussdichte 𝜙(d ) von der einfallenden Photonenflussdichte 𝜙(0) für 𝜈 = 𝜈0 und 𝜈 = 𝜈0 + Δ𝜈, wenn 𝜙(0)∕𝜙S ≪ 1 gilt. Aufgabe 15-10: Gewinn in einem gesättigten verstärkenden Medium
Betrachten Sie ein homogen verbreitertes verstärkendes Lasermedium der Länge d = 10 cm mit einer Sättigungs-Photonenflussdichte 𝜙S = 4 × 1018 Photonen pro cm2 und s. Eine Eingangs-Photonenflussdichte von 𝜙(0) = 4 × 1015 Photonen pro cm2 und s erzeugt eine Ausgangs-Photonenflussdichte von 𝜙(d ) = 4 × 1016 Photonen pro cm2 und s. (a) Bestimmen Sie den Gewinn 𝐺0 des Systems in der Näherung kleiner Signale. (b) Bestimmen Sie den Gewinnkoeffizienten 𝛾0 in der Näherung kleiner Signale. (c) Wie groß ist die Photonenflussdichte, bei der der Gewinnkoeffizient um einen Faktor fünf abgenommen hat? (d) Bestimmen Sie den Gewinnkoeffizienten, wenn die Eingangs-Photonenflussdichte 𝜙(0) = 4 × 1019 Photonen pro cm2 und s ist. Ist der Gewinn des Systems in der Näherung kleiner Signale unter diesen Bedingungen größer als, kleiner als oder gleich groß wie in (a)? Aufgabe 15-11: Verhältnis der Signalleistung zur ASELeistung Ein ungesättigter Laserverstärker der Länge d mit dem
Gewinnkoeffizienten 𝛾0 (𝜈) verstärkt ein Eingangssignal 𝜙𝑆 (0) der Frequenz 𝜈 und führt dabei mit einer Rate 𝜉sp (pro Längeneinheit) eine verstärkte spontane Emission ein. Die Photonenflussdichte des verstärkten Signals am Ausgang ist 𝜙S (d ) und die der verstärkten spontanen Emission ist 𝜙ASE . Skizzieren Sie die Abhängigkeit des Verhältnisses 𝜙S (d )∕𝜙ASE von dem Produkt 𝛾0 (𝜈)d des Gewinnkoeffizienten und der Länge des Verstärkers. Aufgabe 15-12: Photonenzahlverteilung für verstärktes kohärentes Licht
Eine linear polarisierte Superposition von interferierendem thermischen und kohärentem Licht ergibt ein gutes Modell für das aus einem Laserverstärker austretende Licht. Eine solche Superposition zeigt zufällige Fluktuationen w der Energie, die der nichtzentrischen 𝜒 2 -Wahrscheinlichkeitsverteilung gehorchen, 𝑝(w) =
1 wASE
√ 2 wS w w + wS exp (− ) 𝐼0 [ ], wASE wASE
sofern die Messdauer hinreichend kurz ist. 1). Dabei bezeichnet 𝐼0 die modifizierte Besselfunktion nullter Ordnung, wASE ist die mittlere Energie der verstärkten spontanen Emission und wS ist die (konstante) Energie des verstärkten kohärenten Signals. (a) Berechnen Sie den Mittelwert und die Varianz von w. (b) Verwenden Sie die Gln. (13.50) und (13.51), um die mittlere Photonenzahl n und die Varianz 𝜎n2 zu bestimmen, und bestätigen Sie dabei, dass Gl. (15.70) gilt. (c) Verwenden Sie Gl. (13.49), um zu zeigen, dass die Photonenzahlverteilung durch n
𝑝(n) =
nASE
(1 + nASE
)n+1
exp (−
nS
1 + nASE
) 𝐿n (−
nS ∕nASE
1 + nASE
)
gegeben ist, wobei 𝐿n das Laguerrepolynom 𝐿n (−𝑥) =
n ( ) 𝑘 ∑ n 𝑥
𝑘=0
𝑘 𝑘!
ist und nS und nASE die mittleren Photonenzahlen des Signals bzw. der verstärkten spontanen Emission sind. Es handelt sich hier um einen Spezialfall der nichtzentrisch-negativ-binomialen (NNB-) Verteilung.(d) Tragen Sie 𝑝(n) für nS ∕n = 0, 0.5, 0.8 und 1 für den Fall n = 5 auf und zeigen Sie, dass die Verteilung sich für nS ∕n = 0 auf die Bose-Einstein-Verteilung und für nS ∕n = 1 auf die Poissonverteilung reduziert.
Weiterführende Literatur Seltenerdmetalldotierte, Raman- und Brillouin-Faserverstärker
E. Garmire, ‚Perspectives on Stimulated Brillouin Scattering‘, New Journal of Physics 19, 011003, 2017. N. K. Dutta, Fiber Amplifiers and Fiber Lasers, World Scientific 2015. V. V. Ter-Mikirtychev, Fundamentals of Fiber Lasers and Fiber Amplifiers, Springer 2014. M. Premaratne, G. P. Agrawal, Light Propagation in Gain Media: Optical Amplifiers, Cambridge University Press 2011. A. Kobyakov, M. Sauer, D. Chowdhury, ‚Stimulated Brillouin Scattering in Optical Fibers‘, Advances in Optics and Photonics 2, 1–59, 2010. C. Headley, G. P. Agrawal (Hrsg.), Raman Amplification in Fiber Optical Communication Systems, Elsevier 2005. C. Headley, G. P. Agrawal (Hrsg.), Raman Amplification in Fiber Optical Communication Systems, Elsevier 2005. M. N. Islam (Hrsg.), Raman Amplifiers for Telecommunications, Bd. 1: Physical Principles, Springer 2004. 1) Siehe beispielsweise T. Li, M. C. Teich, ‚Photon Point Process for Traveling-Wave Laser Amplifiers‘, IEEE Journal of Quantum Electronics 29, 2568–2578, 1993.
483
484
15 Laserverstärker
M. N. Islam (Hrsg.), Raman Amplifiers for Telecommunications, Bd. 2: Sub-Systems and Systems, Springer 2004. E. Desurvire, D. Bayart, B. Desthieux, S. Bigo, ErbiumDoped Fiber Amplifiers: Device and System Developments, Wiley 2002. M. J. F. Digonnet (Hrsg.), Rare-Earth-Doped Fiber Lasers and Amplifiers, CRC Press, 2. Aufl. 2001. P. C. Becker, N. A. Olsson, J. R. Simpson, Erbium-Doped Fiber Amplifiers: Fundamentals and Technology, Academic Press 1999. E. Desurvire, Erbium-Doped Fiber Amplifiers: Principles and Applications, Wiley 1994. R. J. Mears, L. Reekie, I. M. Jauncey, D. N. Payne, ‚LowNoise Erbium-Doped Fibre Amplifier Operating at 1.54 μm‘, Electronics Letters 23, 1026, 1987. S. B. Poole, D. N. Payne, M. E. Fermann, ‚Fabrication of Low Loss Optical Fibers Containing Rare Earth Ions‘, Electronics Letters 21, 737, 1985. E. P. Ippen, R. H. Stolen, ‚Stimulated Brillouin Scattering in Optical Fibers‘, Applied Physics Letters 21, 539, 1972. R. H. Stolen, E. P. Ippen, A. R. Tynes, ‚Raman Oscillation in Glass Optical Waveguide‘, Applied Physics Letters 20, 62, 1972. C. J. Koester, E. Snitzer, ‚Amplification in a Fiber Laser‘, Applied Optics 3, 1182, 1964. H. W. Etzel, H. W Gandy, R. J. Ginther, ‚Stimulated Emission of Infrared Radiation from Ytterbium-Activated Silicate Glass‘, Applied Optics 1, 534, 1962. C. V. Raman, K. S. Krishnan, ‚A New Type of Secondary Radiation‘, Nature 121, 501, 1928. L. Brillouin, ‚Diffusion de la lumiere et des rayons X par un corps transparent homogene: Influence de Fagitation thermique‘, Annales de Physique (Paris) 9(17), 88, 1922. Gepulste Hochleistungs-Laserverstärker
L. Hu, D. He, H. Chen, X. Wang, T. Meng, L. Wen, J. Hu, Y. Xu, S. Li, Y. Chen, W. Chen, S. Chen, J. Tang, B. Wang, ‚Research and Development of Neodymium Phosphate Laser Glass for High Power Laser Application‘, Optical Materials 63, 213, 2017.
M. L. Spaeth et al., ‚Description of the NIF Laser‘, Fusion Science and Technology 69, 25, 2016. R. Betti, O. A. Hurricane, ‚Inertial-Confinement Fusion with Lasers‘, Nature Physics 12, 435, 2016. M. Rose, ‚Laser Fusion‘, Optics & Photonics News 25(9), 34, 2014. R. Courtland, ‚Star Power‘, IEEE Spectrum 50, 26 & 57, 2013. J. H. Campbell, T. I. Suratwala, ‚Nd-Doped Phosphate Glasses for High-Energy/High-Peak-Power Lasers‘, Journal of Non-Crystalline Solids 263/264, 318, 2000. Optical Amplifier Noise and Photon Statistics
A. R. Karthikeyan, H. S. Ramachandran, ‚Convergence of Quantum and Semiclassical Models of Erbium-Doped Fiber Amplifiers‘, Journal of the Optical Society of America B 28, 533, 2011. G. Kahraman, B. E. A. Saleh, ‚Quantum-Statistical Properties of Pulse Amplification in Optical Fibers with Gain Saturation‘, Journal of Lightwave Technology 13, 1127, 1995. T. Li, M. C. Teich, ‚Photon Point Process for Traveling-Wave Laser Amplifiers‘, IEEE Journal of Quantum Electronics 29, 2568, 1993. P. Diament, M. C. Teich, ‚Evolution of the Statistical Properties of Photons Passed Through a Traveling-Wave Laser Amplifier‘, IEEE Journal of Quantum Electronics 28, 1324, 1992. E. Desurvire, ‚Analysis of Noise Figure Spectral Distribution in Erbium Doped Fiber Amplifiers Pumped Near 980 and 1480 nm‘, Applied Optics 29, 3118, 1990. K. Shimoda, H. Takahasi, C. H. Townes, ‚Fluctuations in Amplification of Quanta with Application to Maser Amplifiers‘, Journal of the Physical Society of Japan 12, 686, 1957.
485
16 Laser Ein Laser ist ein optischer Oszillator. Es besteht aus einem resonanten optischen Verstärker, dessen Ausgang phasengleich in den Eingang zurückgeführt wird (Abb. 16.1). Die Oszillation kann durch die Anwesenheit selbst eines geringen Rauschens am Verstärkereingang initiiert werden, sofern es Frequenzkomponenten enthält, die innerhalb der Bandbreite des Verstärkers liegen. Dieses Eingangssignal wird verstärkt und das Ausgangssignal wird wieder in den Eingang geführt, wodurch es weitere Verstärkung erfährt. Dieser Prozess geht immer weiter, bis ein großes Ausgangssignal entsteht. Die Zunahme des Signals ist durch die Sättigung des Verstärkergewinns beschränkt, und das System erreicht einen schließlich stationären Zustand, in dem ein Ausgangssignal mit der Frequenz des resonanten Verstärkers erzeugt wird. Zwei Bedingungen müssen erfüllt sein, damit eine Oszillation eintritt: • Der Verstärkergewinn muss größer sein als der Verlust im Rückkopplungssystem, sodass ein Umlauf durch die Rückkopplungsschleife mit einem Nettogewinn verbunden ist. • Die gesamte Phasenverschiebung in einem Umlauf muss ein Vielfaches von 2π sein, sodass die durch die Rückkopplung in den Eingang gegebene Phase gleich der Phase des ursprünglichen Eingangs ist.
im Oszillator ansteigt, wird der Verstärkergewinn gesättigt und sinkt unter seinen Anfangswert. Stabilität wird erreicht, wenn der reduzierte Gewinn gleich dem Verlust ist (Abb. 16.2). Der Gewinn kompensiert dann gerade den Verlust pro Umlauf, sodass der Kreislauf der Verstärkung und Rückkopplung ohne Änderung wiederholt wird und die Oszillation einen stationären Zustand erreicht. Da der Gewinn und die Phasenverschiebung Funktionen der Frequenz sind, sind die beiden Bedingungen für Oszillationen nur bei einer Frequenz (oder einigen Frequenzen) erfüllt, den Resonanzfrequenzen des Oszillators. Das nutzbare Ausgangssignal wird entnommen, indem ein Teil der Leistung aus dem Oszillator ausgekoppelt wird. Ein Oszillator besteht also aus 1) einem Verstärker mit einem Mechanismus der Gewinnsättigung, 2) einem Rückkopplungsmechanismus, 3) einem Mechanismus für die Selektion einer Frequenz und 4) einem Mechanismus für die Auskopplung des Signals. Der Laser ist ein optischer Oszillator (Abb. 16.3), in dem der Verstärker das in den Abschnitten 15.1 und
Wenn diese Bedingungen erfüllt sind, wird das System instabil und die Oszillation beginnt. Wenn die Leistung
Gewinn
Rückkopplung
Verlust
Verstärker 0
Leistung im stationären Zustand
Leistung
Ausgang Spannungsversorgung
Abb. 16.1 Ein Oszillator ist ein Verstärker mit einer positiven Rückkopplung.
Abb. 16.2 Wenn der anfängliche Verstärkergewinn größer ist als der Verlust, kann die Oszillation starten. Wenn die Oszillatorleistung zunimmt, wird der Verstärker gesättigt, wodurch sein Gewinn abnimmt. Der stationäre Zustand wird erreicht, wenn der Gewinn gerade gleich dem Verlust ist.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
486
16 Laser
Spiegel
aktives Medium
teildurchlässiger Spiegel
15.2 betrachtete gepumpte aktive Medium ist. Gewinnsättigung ist eine grundlegende Eigenschaft von Laserverstärkern, wie in Abschnitt 15.4 diskutiert. Die Rückkopplung wird erzeugt, indem das aktive Medium in einen optischen Resonator eingebracht wird, der das Licht wie in Kapitel 11 besprochen zwischen seinen Spiegeln hin und her reflektiert. Die Frequenzauswahl wird durch den resonanten Verstärker und den Resonator gemeinsam erreicht, die nur bestimmte Moden erlauben. Die Auskopplung wird dadurch erreicht, dass einer der Resonatorspiegel teildurchlässig ist. Laser gibt es in enorm vielen Bauformen, die in unzähligen wissenschaftlichen und technischen Anwendungen wie Interferometrie, Spektroskopie, Bildgebung, Lithographie, Metrologie, Kommunikationstechnik, Lidar (engl. light detection and ranging, analog zu Radar), Atomkühlung, Materialbearbeitung, Biologie oder sogar den Neurowissenschaften eingesetzt werden. Es muss kaum erwähnt werden, dass sie für die Grundlagenforschung in der Photonik sowie allen Zweigen der Wissenschaft, des Ingenieurwesens und der Medizin unersetzlich sind. Der Vorgänger des Lasers war der Maser (engl. microwave amplification by stimulated emission of radiation). Das Maser-/Laserprinzip weckt auch Hoffnungen für andere Arten von Wellen als nur elektromagnetische. Der Saser (engl. sound amplification by stimulated emission of radiation) ist zum Beispiel eine akustische Version des Lasers, der einen Strahl von Phononen ausstrahlt.
In diesem Kapitel . . . Dieses Kapitel gibt eine Einführung in den Betrieb von Lasern. Im Abschnitt 16.1 wird das Verhalten des Laserverstärkers und des Laserresonators zusammengefasst und es werden Bedingungen für die Oszillation hergeleitet. Die Eigenschaften des von Lasern ausgestrahlten Lichts, wie seine Leistung, spektrale und räumliche Verteilung und seine Polarisation, werden in Abschnitt 16.2 betrachtet. Häufige Laser werden in Abschnitt 16.3 besprochen, und Abschnitt 16.4 ist dem Betrieb von gepulsten Lasern gewidmet. Laserdioden sowie Mikro- und Nanolaser werden in Kapitel 18 kurz besprochen, Hochleistungslaser im Petawattbereich in Kapitel 23.
Laserausgang
Abb. 16.3 Ein Laser besteht aus einem optischen Verstärker (der ein aktives Medium enthält) in einem optischen Resonator. Das Ausgangssignal wird durch einen teildurchlässigen Spiegel entnommen.
16.1 Theorie der Laseroszillation Wir beginnen diesen Abschnitt mit einer Zusammenfassung der Eigenschaften der beiden grundlegenden Bestandteile eines Lasers – des Verstärkers und des Resonators. Obwohl diese Themen schon in den Kapiteln 15 bzw. 11 im Detail besprochen wurden, werden sie aus praktischen Gründen hier kurz wiederholt.
16.1.1
Optische Verstärkung und Rückkopplung
Laserverstärkung
Ein Laserverstärker ist ein schmalbandiger kohärenter Verstärker für Licht. Die Verstärkung wird durch die induzierte Emission aus einem atomaren oder molekularen System erreicht, in dem die Besetzungszahlen für den entscheidenden Übergang invertiert sind (d. h. das obere Energieniveau ist stärker besetzt als das untere). Die Bandbreite des Verstärkers wird durch die Linienbreite des atomaren Übergangs oder durch einen Mechanismus der inhomogenen Verbreiterung wie z. B. den Dopplereffekt in Gaslasern bestimmt. Ein Laserverstärker ist ein durch seinen Gewinnkoeffizienten charakterisiertes Bauelement mit einem verteiltem Gewinn (Gewinn pro Längeneinheit) 𝛾(𝜈), der die Rate bestimmt, mit der die Photonenflussdichte 𝜙 (oder die optische Intensität 𝐼 = ℎ𝜈 𝜙) zunimmt. Wenn die Photonenflussdichte 𝜙 klein ist, ist der Gewinnkoeffizient 𝛾0 (𝜈) = N0 𝜎(𝜈) = N0
𝜆2 𝑔(𝜈) , 8π 𝑡sp
(16.1)
wobei N0 der Unterschied der Besetzungsdichten im stationären Zustand (Atomdichte im oberen Zustand minus der im tieferen Zustand) ist, der mit steigender Pumpgeschwindigkeit zunimmt, 𝜎(𝜈) = (𝜆 2 ∕8π 𝑡sp )𝑔(𝜈) der Übergangsquerschnitt, 𝑡sp die effektive spontane Lebensdauer für die induzierte Emission, 𝑔(𝜈) die Linienform des Übergangs und 𝜆 = 𝜆0 ∕𝑛 die Wellenlänge in einem Medium mit dem Brechungsindex 𝑛. Wenn die Photonenflussdichte zunimmt, erreicht der Verstärker den nichtlinearen Bereich – er wird gesättigt und sein Gewinn nimmt ab. Der Verstärkungsprozess reduziert dann für ein homogen verbreitertes Medium den anfänglichen Unterschied N0 der Besetzungsdich-
16.1 Theorie der Laseroszillation
ten auf N = N0 ∕[1 + 𝜙∕𝜙S (𝜈)]; dabei sind 𝜙S (𝜈)𝜏S 𝜎(𝜈)]−1 die Sättigungs-Photonenflussdichte und 𝜏S die Sättigungs-Zeitkonstante, die von den Zerfallszeiten der beteiligten Energieniveaus abhängt; in einem idealen Vierniveauschema ist 𝜏S ≈ 𝑡sp , während in einem idealen Dreiniveauschema 𝜏S = 2𝑡sp gilt. Der Gewinnkoeffizient eines gesättigten Verstärkers ist daher auf 𝛾(𝜈) = N 𝜎(𝜈) reduziert, sodass für homogene Verbreiterung 𝛾0 (𝜈) 𝛾(𝜈) = 1 + 𝜙∕𝜙S (𝜈)
𝜈 − 𝜈0 𝛾(𝜈) . Δ𝜈
(16.3)
Diese Phasenverschiebung kommt zu derjenigen hinzu, die das Lasermedium hervorruft. Der Gewinn und die Phasenverschiebungskoeffizienten für einen Verstärker mit einer Lorentzlinie sind in Abb. 16.4 illustriert. Rückkopplung und Verlust: Der optische Resonator
Eine optische Rückkopplung wird erreicht, wenn man das aktive Medium in einen optischen Resonator einbringt. Beispielsweise kann sich das Medium (mit dem Brechungsindex 𝑛) mit den aktiven Atomen des Verstärkers in einem Fabry-Pérot-Resonator aus zwei Spiegeln in einer Entfernung d befinden. Die Ausbreitung durch das Medium führt pro Längeneinheit eine Phasenverschiebung entsprechend der Wellenzahl 𝑘=
2π 𝜈 𝑐
(16.4)
ein. Der Resonator trägt ebenfalls zu den Verlusten im System bei. Absorption und Lichtstreuung im Medium führen einen verteilten Verlust (einen Verlust pro Längeneinheit) ein, der durch die Dämpfungskonstante 𝛼M charakterisiert ist. Auf einem Umlauf durch einen Resonator der Länge d wird die Photonenflussdichte um den Faktor ℛ1 ℛ2 exp(−2𝛼M d ) reduziert, wobei ℛ1 und ℛ2 die Reflexionsgrade der zwei Spiegel sind. Der gesamte Verlust in einem Umlauf kann daher durch einen effektiven Gesamtkoeffizienten 𝜶R des verteilten Verlusts beschrieben werden, exp(−2𝛼R d ) = ℛ1 ℛ2 exp(−2𝛼M d ) ,
γ (ν) Δν
ν0 Phasenverschiebungs(ν)
ν0
ν
ν
(16.2)
gilt. Der Verstärkungsprozess in einem Laser führt auch eine Phasenverschiebung ein. Für eine Lorentzlinie mit der Linienbreite Δ𝜈 ist 𝑔(𝜈) = (Δ𝜈∕2π)∕[(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ], und die Phasenverschiebung des Verstärkers pro Längeneinheit ist 𝜑(𝜈) =
Gewinn-
(16.5)
Abb. 16.4 Die spektrale Abhängigkeit des Gewinns und des Phasenverschiebungskoeffizienten für einen optischen Verstärker mit einer Lorentzlinie.
sodass 𝛼R = 𝛼M + 𝛼Sp1 + 𝛼Sp2 1 1 𝛼Sp1 = ln 2d ℛ1 1 1 𝛼Sp2 = ln 2d ℛ2
(16.6)
ist, wobei 𝛼Sp1 und 𝛼Sp2 die Beiträge von Spiegel 1 bzw. 2 bezeichnen. Der Beitrag von beiden Spiegeln ist 𝛼Sp = 𝛼Sp1 + 𝛼Sp2 =
1 1 ln . 2d ℛ1 ℛ2
(16.7)
Da 𝛼R den Gesamtverlust der Energie (oder Zahl von Photonen) pro Längeneinheit beschreibt, ist 𝛼R𝑐 der Verlust von Photonen pro Sekunde. Also ist 𝜏P =
1 𝛼R 𝑐
(16.8)
die Photonenlebensdauer, die mit steigendem Verlust abnimmt. Der Resonator erlaubt nur Frequenzen, die Phasenverschiebung von einem Vielfachen von 2π für einen Umlauf entsprechen. Für einen Resonator ohne aktive Atome (einen „kalten“ Resonator) ist die Phasenverschiebung für einen Umlauf einfach 𝑘2d = 2π 𝜈d ∕𝑐 = 𝑞2π entsprechend Moden der Frequenzen 𝜈𝑞 = 𝑞𝜈F ,
𝑞 = 1, 2, … ,
(16.9)
wobei 𝜈F = 𝑐∕2d der Modenabstand im Resonator und 𝑐 = 𝑐0 ∕𝑛 die Lichtgeschwindigkeit im Resonatormedium sind (Abb. 16.5). Die spektrale Halbwertsbreite dieser Resonatormoden ist δ𝜈 ≈
𝜈F , ℱ
(16.10)
wobei ℱ die Finesse des Resonators ist (siehe Abschnitt 11.1.1). Wenn die Resonatorverluste klein sind und die
487
488
16 Laser
νF = c 2
Abb. 16.5 Die Resonatormoden liegen in Abständen von 𝜈F = c∕2d und haben Linienbreiten von δ𝜈 = 𝜈F ∕ℱ = 1∕2π 𝜏P .
δν νq – 1
νq
Finesse groß ist, gilt ℱ≈
π = 2π 𝜏P 𝜈F . 𝛼R d
ν
νq + 1
(16.11)
Mithilfe von Gl. (16.8) können wir 𝛼R durch die Photonenlebensdauer 𝛼R = 1∕𝑐𝜏P ausdrücken, woraufhin Gl. (16.14) die Form NSch =
16.1.2
Bedingungen für die Laseroszillation
Zwei Bedingungen müssen erfüllt sein, damit der Laser oszillieren („lasern“) kann. Die Gewinnbedingung bestimmt den minimalen Besetzungsunterschied und daher die Pumpschwelle, die für einen Laserbetrieb erforderlich ist. Die Phasenbedingung bestimmt die Frequenz (oder die Frequenzen), bei der die Oszillation stattfindet. Die Gewinnbedingung: Laserschwelle
Für den Beginn der Laseroszillation muss der Gewinnkoeffizient für kleine Signale größer als der Verlustkoeffizient sein, 𝛾0 (𝜈) > 𝛼R
(16.12)
bzw. der Gewinn muss größer sein als der Verlust. Nach Gl. (16.1) ist der Gewinnkoeffizient 𝛾0 (𝜈) für kleine Signale proportional zur Differenz N0 der Besetzungsdichten im stationären Zustand, die wiederum – wie wir aus Kapitel 15 wissen – mit steigender Pumpgeschwindigkeit R zunimmt. Tatsächlich können wir Gl. (16.1) verwenden, um Gl. (16.12) in eine Bedingung für den Besetzungsunterschied umzuformen, d. h. N0 = 𝛾0 (𝜈)∕𝜎(𝜈) > 𝛼R ∕𝜎(𝜈). Also ist N0 > NSch ,
(16.13)
wobei die Größe NSch =
𝛼R 𝜎(𝜈)
(16.14)
1 𝑐𝜏P 𝜎(𝜈)
(16.15)
annimmt. Die Schwellen-Besetzungsdifferenz ist daher direkt proportional zu 𝛼R und umgekehrt proportional zu 𝜏P . Ein größerer Verlust (eine kürzere Photonenlebensdauer) erfordert stärkeres Pumpen, um die Laserschwelle zu erreichen. Mithilfe der Standardgleichung für den Übergangsquerschnitt, 𝜎(𝜈) = (𝜆 2 ∕8π 𝑡sp )𝑔(𝜈), erhalten wir schließlich noch einen weiteren Ausdruck für die SchwellenBesetzungsdifferenz, NSch =
8π 𝑡sp 1 , 𝜆 2 𝑐 𝜏P 𝑔(𝜈)
(16.16)
der deutlich macht, dass N Sch eine Funktion der Frequenz 𝜈 ist. Am Maximum der Linienformfunktion, d. h. bei der Mittenfrequenz 𝜈 = 𝜈0 , ist die Schwelle am niedrigsten und der Laserbetrieb kann am leichtesten erreicht werden. Für eine Lorentzlinie ist 𝑔(𝜈0 ) = 2∕πΔ𝜈, sodass der minimale Besetzungsunterschied für die Oszillation bei der Mittenfrequenz 𝜈0 gleich NSch =
2π 2π Δ𝜈 𝑡sp 𝜏P 𝜆2 𝑐
(16.17)
ist. Sie ist direkt proportional zur Linienbreite Δ𝜈. Wenn der Übergang außerdem durch die Lebensdauerverbreiterung mit einer Zerfallszeit 𝑡sp beschränkt wird, nimmt Δ𝜈 den Wert 1∕2π 𝑡sp an (siehe Abschnitt 14.3.4), woraufhin Gl. (16.17) sich zu NSch =
2π 𝛼R 2π = 𝜆 2 𝑐𝜏P 𝜆2
(16.18)
die Schwellen-Besetzungsdifferenz ist. Sie ist proportional zu 𝛼R und bestimmt die minimale Pumpgeschwindigkeit RSch , die für das Einsetzen der Laserwirkung erforderlich ist. 1)
vereinfacht. Diese Gleichung zeigt, dass die minimale Schwellen-Besetzungsdifferenz, die nötig ist, um Oszillation zu erreichen, eine einfache Funktion der Wellenlänge 𝜆 und der Photonenlebensdauer 𝜏P ist. Offensichtlich ist der Laserbetrieb schwieriger zu erreichen, wenn
1) Unter speziellen Bedingungen ist allerdings auch ein Laserbetrieb ohne Inversion (LWI, engl. lasing without inversion) innerhalb der Energieniveaustruktur eines konventionellen Lasermediums möglich. Dazu verwendet man ein äußeres optisches Feld, das über ein Hilfsni-
veau einen zusätzliches Pfad von unteren ins obere Laserniveau eröffnet. Unter geeigneten Bedingungen kann die Existenz dieses zweiten Weges zu einer destruktiven Quanteninterferenz führen, die die Absorption reduziert oder sogar völlig eliminiert.
16.1 Theorie der Laseroszillation
die Wellenlänge abnimmt. Für 𝜆0 = 1 μm, 𝜏P = 1 ns und einen Brechungsindex 𝑛 = 1 ist beispielsweise NSch ≈ 2.1 × 107 cm−3 .
Frequenz-Pulling
Mit der Beziehung 𝑘 = 2π 𝜈∕𝑐 und dem Phasenverschiebungskoeffizienten für die Lorentzlinie aus Gl. (16.3) erhalten wir aus der Phasenbedingung (16.19)
Übung 16-1: Die Laserschwelle eines Rubinlasers
(a) Im Zentrum des Übergangs 𝜆0 = 694.3 nm ist der Absorptionskoeffizient von Rubin im thermischen Gleichgewicht (d. h. ohne pumpen) bei 𝑇 = 300 K 𝛼(𝜈0 ) ≡ −𝛾(𝜈0 ) ≈ 0.2 cm−1 . Bestimmen Sie den Übergangsquerschnitt 𝜎0 = 𝜎(𝜈0 ), wenn die Konzentration der für den Übergang verantwortlichen Cr3+ -Ionen NAt = 1.58 × 1019 cm−3 beträgt. (b) Ein Rubinlaser besteht aus einem 10 cm langen Rubinstab (mit dem Brechungsindex 𝑛 = 1.76) mit einer Querschnittsfläche von 1 cm2 und wird bei 𝜆0 = 694.3 nm betrieben. Seine beiden Enden sind poliert und beschichtet, sodass sie beide einen Reflexionsgrad von 80 % haben. Nehmen Sie an, dass keine Streuung und keine sonstigen Verluste auftreten und bestimmen Sie den Verlustkoeffizienten 𝛼R und die Photonenlebensdauer 𝜏P des Resonators. (c) Wenn der Laser gepumpt wird, steigt 𝛾(𝜈0 ) von seinem anfänglichen Wert im thermischen Gleichgewicht von −0.2 cm−1 und ändert sein Vorzeichen, wodurch ein Gewinn resultiert. Bestimmen Sie die Schwellen-Besetzungsdifferenz NSch für die Laseroszillation. Die Phasenbedingung: Laserfrequenzen
Die zweite Bedingung für Oszillation verlangt, dass die Phasenverschiebung, die eine Lichtwelle bei einem Umlauf durch den Resonator erfährt, ein Vielfaches von 2π sein muss, d. h. 2𝑘d + 2𝜑(𝜈)d = 2π 𝑞 ,
𝑞 = 1, 2, … .
(16.19)
Wenn der Beitrag 2𝜑(𝜈)d der aktiven Laseratome klein ist, können wir Gl. (16.19) durch 2d teilen und erhalten das bereits zuvor erwähnte Resultat für den kalten Resonator, 𝜈 = 𝜈𝑞 = 𝑞(𝑐∕2d ). In Anwesenheit des aktiven Mediums, wenn 2𝜑(𝜈)d also einen Beitrag liefert, gibt die Lösung von Gl. (16.19) eine Reihe von Schwingungsfrequenzen 𝜈𝑞′ , die geringfügig gegenüber der Frequenz 𝜈𝑞 des kalten Resonators verschoben sind. Es zeigt sich, dass die Modenfrequenzen des kalten Resonator alle etwas in Richtung der Mittenfrequenz des atomaren Übergangs gezogen werden, wie im Folgenden erläutert wird.
489
𝜈+
𝑐 𝜈 − 𝜈0 𝛾(𝜈) = 𝜈𝑞 . 2π Δ𝜈
(16.20)
Diese Gleichung kann nach der Schwingungsfrequenz 𝜈 = 𝜈𝑞′ entsprechend den Moden 𝜈𝑞 des kalten Resonators aufgelöst werden. Weil die Gleichung nichtlinear ist, ist eine graphische Lösung hilfreich. Wir bezeichnen die linke Seite von Gl. (16.20) mit 𝜓(𝜈) und tragen sie in Abb. 16.6 auf (sie ist die Summe einer Gerade für 𝜈 und des Phasenverschiebungskoeffizienten für eine Lorentzlinie, der in Abb. 16.4 schematisch dargestellt ist). Der Wert von 𝜈 = 𝜈𝑞′ , für den 𝜓(𝜈) = 𝜈𝑞 gilt, wird graphisch bestimmt. Aus der Abbildung wird deutlich, dass die Moden 𝜈𝑞 des kalten Resonators immer zur Mittenfrequenz 𝜈0 des resonanten Mediums gezogen wird. Wir können auch eine analytische Näherungslösung von Gl. (16.20) erhalten. Dazu schreiben wir Gl. (16.20) in der Form 𝜈 = 𝜈𝑞 −
𝑐 𝜈 − 𝜈0 𝛾(𝜈) . 2π Δ𝜈
(16.21)
Für 𝜈 = 𝜈𝑞′ ≈ 𝜈𝑞 ist der zweite Term von Gl. (16.21) klein, woraufhin 𝜈 ohne wesentlichen Verlust an Genauigkeit durch 𝜈𝑞 ersetzt werden kann. Damit erhalten wir mit 𝜈𝑞′ = 𝜈𝑞 −
𝑐 𝜈𝑞 − 𝜈0 𝛾(𝜈𝑞 ) 2π Δ𝜈
(16.22)
einen expliziten Ausdruck für die Schwingungsfrequenz 𝜈𝑞′ als Funktion der Frequenz 𝜈𝑞 des kalten Resonators. Im stationären Zustand ist außerdem der Gewinn gleich dem Verlust, sodass 𝛾(𝜈𝑞 ) = 𝛼R ≈ π∕ℱ d = (2π∕𝑐) δ𝜈 ist, ψ(ν) νq Mittenfrequenz des atomaren Übergangs
νq–1
Schwingungsfrequenz Mode des kalten Resonators
νq–1 ν′q–1 ν0 ν′q νq
Abb. 16.6 Die linke Seite von Gl. (16.20), 𝜓(𝜈), als Funktion von 𝜈. Die Frequenz 𝜈, für die 𝜓(𝜈) = 𝜈q gilt, ist die Lösung von Gl. (16.20). Jede Frequenz 𝜈q des „kalten“ Resonators entspricht einer Frequenz 𝜈q′ des „heißen“ Resonators, die in Richtung der Mittenfrequenz 𝜈0 der atomaren Resonanz verschoben ist.
ν
490
16 Laser
γ (ν) Gewinnkoeffizient des Verstärkers
Δν
ν0
ν
c 2
Moden des kalten Resonators
δν νq–1
Abb. 16.7 Die Schwingungsfrequenzen des Lasers liegen in der Nähe der Moden des kalten Resonators; sie werden geringfügig zur Mittenfrequenz 𝜈0 der atomaren Resonanz gezogen. Das Diagramm dient nur der Veranschaulichung und ist nicht maßstabsgetreu.
ν
νq
Laser-Schwingungsmoden ν′q–1
ν
ν′q
wobei δ𝜈 die spektrale Breite der Moden des kalten Resonators ist. Wenn wir diese Beziehung in Gl. (16.22) einsetzen, erhalten wir 𝜈𝑞′ ≈ 𝜈𝑞 − (𝜈𝑞 − 𝜈0 )
δ𝜈 . Δ𝜈
γ0(ν)
(16.23)
Der Frequenz 𝜈𝑞 des kalten Resonators wird daher um einen Bruchteil δ𝜈∕Δ𝜈 ihrer ursprünglichen Entfernung (𝜈𝑞 − 𝜈0 ) von der Mittenfrequenz in Richtung der atomaren Resonanzfrequenz 𝜈0 gezogen, wie Abb. 16.7 zeigt. Je schärfer die Resonatormode ist (je kleiner der Wert von δ𝜈), desto geringer fällt diese Verschiebung aus. Im Gegensatz dazu ist die Verschiebung um so größer, je schmaler die atomare Resonanzlinie (je kleiner der Wert von Δ𝜈) ist.
16.2 Die Eigenschaften der Laserstrahlung 16.2.1
Einschalten des Lasers Zeit stationärer Zustand αR Verlustkoeffizient
Leistung
Innere Photonenflussdichte
Ein über der Schwelle gepumpter Laser (N0 > NSch ) besitzt für kleine Signale einen Gewinnkoeffizienten 𝛾0 (𝜈), der größer ist als der Verlustkoeffizient 𝛼R , wie Gl. (16.12) zeigt. Die Laseroszillation kann dann beginnen, wenn die Phasenbedingung Gl. (16.19) erfüllt ist. Wenn die Photonenflussdichte 𝜙 innerhalb der Resonators zunimmt (Abb. 16.8), nimmt der Gewinnkoeffizient 𝛾(𝜈) gemäß Gl. (16.2) für homogen verbreiterte Medien ab. So lange der Gewinnkoeffizient größer bleibt als der Verlustkoeffizient, wächst der Photonenfluss weiter. Wenn der gesättigte Gewinnkoeffizient schließlich gleich dem Verlustkoeffizienten wird (oder äquivalent N = NSch ), endet das Wachstum des Photonenflusses, und die Oszillationen erreichen einen stationären Zustand. Das Ergebnis ist eine Gewinnarretierung auf den Wert des Verlusts. Die innere Photonenflussdich-
γ (ν)
0
0.1
s (ν)
s(ν)
10
Gewinnkoeffizient
s (ν)
Photonenflussdichte
Abb. 16.8 Bestimmung der Photonenflussdichte eines Lasers 𝜙 im stationären Zustand. Beim Einschalten des Lasers ist 𝜙 = 0, sodass 𝛾(𝜈) = 𝛾0 (𝜈) ist. Während sich die Schwingung aufschaukelt, bewirkt der Anstieg von 𝜙 eine Abnahme von 𝛾(𝜈) bis zur Gewinnsättigung. Wenn 𝛾 gleich 𝛼R ist, endet das Wachstum der Photonenflussdichte, und ein stationärer Zustand stellt sich ein. Je kleiner der Verlust ist, desto größer der Wert von 𝜙.
te des Lasers im stationären Zustand wird daher bestimmt, indem der Gewinnkoeffizient für große Signale (bei Sättigung) gleich dem Verlustkoeffizienten gesetzt wird, 𝛾0 (𝜈)∕[1 + 𝜙∕𝜙S (𝜈)] = 𝛼R ; daraus folgt
𝜙=
⎧
𝜙S (𝜈) (
⎨ ⎩0
𝛾0 (𝜈) − 1) 𝛼R
für 𝛾0 (𝜈) > 𝛼R ,
(16.24)
für 𝛾0 (𝜈) ≤ 𝛼R .
Gleichung (16.24) beschreibt die Photonenflussdichte aus dem Laserprozess im stationären Zustand. Das entspricht der mittleren Zahl von Photonen, die eine Flächeneinheit pro Sekunde in beiden Richtungen durchqueren, da zur Sättigung Photonen beitragen, die sich in beiden Richtungen ausbreiten. Die Photonenflussdichte für Photonen, die sich in nur einer Richtung ausbreiten, ist daher 𝜙∕2. Die spontane Emission haben wir in dieser vereinfachten Behandlung vernachlässigt. Natürlich bezeichnet Gl. (16.24) die mittlere Photonenflussdichte;
Photonenflussdichte
Besetzungsdifferenz
16.2 Die Eigenschaften der Laserstrahlung
Sch
0
s
0 Sch
0
0
Pumpgeschwindigkeit
Sch
2
Sch
0
Pumpgeschwindigkeit
Abb. 16.9 Besetzungsunterschied N und innere Flussdichte 𝜙 der Laserphotonen im stationären Zustand als Funktionen von N0 (des Besetzungsunterschieds ohne Strahlung; N0 nimmt mit steigender Pumpgeschwindigkeit R zu).
Die Laserschwingung beginnt, wenn N0 größer wird als N Sch ; der Wert von N im stationären Zustand ist dann gesättigt und verharrt bei NSch [wie 𝛾0 (𝜈) bei 𝛼R verharrt]. Über der Schwelle ist 𝜙 proportional zu N 0 − N Sch .
wie in Abschnitt 13.2 diskutiert gibt es zufällige Fluktuationen um diesen Mittelwert. Da 𝛾0 (𝜈) = N0 𝜎(𝜈) und 𝛼R = NSch 𝜎(𝜈) ist, können wir Gl. (16.24) in der Form
Die entsprechende optische Intensität 𝐼A des Laserstrahls ist dann
⎧ 𝜙 (𝜈) ( N0 − 1) für N > N , S 0 Sch NSch 𝜙= ⎨ 0 für N 0 ≤ NSch ⎩
(16.25)
schreiben. Unterhalb der Schwelle ist die Flussdichte der Laserphotonen null; eine Steigerung der Pumpgeschwindigkeit resultiert in einer Zunahme des Photonenflusses aufgrund von spontaner Emission, sie bewirkt aber keine anhaltende Oszillation. Oberhalb der Schwelle ist die innere Flussdichte der Laserphotonen im stationären Zustand direkt proportional zum anfänglichen Besetzungsunterschied N0 und nimmt daher mit steigender Pumpgeschwindigkeit R zu [siehe Gl. (15.27) und Gl. (15.41)]. Wenn N0 doppelt so groß wie der Schwellenwert NSch ist, ist die Photonenflussdichte gleich dem Sättigungswert 𝜙S (𝜈), also gleich der Photonenflussdichte, bei der der Gewinnkoeffizient auf die Hälfte seines maximalen Wert reduziert ist. Sowohl der Besetzungsunterschied N als auch die Photonenflussdichte 𝜙 sind in Abb. 16.9 als Funktionen von N0 dargestellt. Photonenflussdichte am Ausgang
Nur ein Teil der inneren Photonenflussdichte im stationären Zustand nach Gl. (16.25) verlässt den Resonator in Form von nutzbarem Licht. Die Photonenflussdichte 𝜙A am Ausgang ist der Anteil der inneren Photonenflussdichte, der sich in Richtung auf Spiegel 1 ausbreitet (𝜙∕2) und durch ihn durchgelassen wird. Wenn 𝒯 der Transmissionsgrad von Spiegel 1 ist, ist die Photonenflussdichte am Ausgang 𝜙A =
𝒯𝜙 . 2
(16.26)
𝐼A =
ℎ𝜈 𝒯𝜙 , 2
(16.27)
und die Ausgangsleistung des Lasers beträgt P A = 𝐼A A, wenn A die Querschnittsfläche des Laserstrahls ist. Diese Gleichungen erlauben uns zusammen mit Gl. (16.25), die Ausgangsleistung des Lasers aus 𝜙S (𝜈), N0 , N Sch , 𝒯 und A explizit zu berechnen. Die Optimierung der Photonenflussdichte am Ausgang
Die nutzbare Photonenflussdichte am Laserausgang verringert die innere Photonenflussdichte und trägt daher zu den Verlusten des Laseroszillators bei. Jeder Versuch, den Anteil der Photonen zu erhöhen, die aus dem Resonator entweichen dürfen (um die nutzbare Lichtleistung zu vergrößern) bewirkt größere Verluste, sodass die Photonenflussdichte innerhalb des Resonators im stationären Zustand abnimmt. Das Resultat kann daher durchaus eine Abnahme anstelle einer Steigerung der nutzbaren Lichtleistung sein. Im Folgenden wollen wir zeigen, dass es einen optischen Transmissionsgrad 𝒯 (mit 0 < 𝒯 < 1) gibt, der die Ausgangsintensität des Lasers maximiert. Die Photonenflussdichte 𝜙A = 𝒯𝜙∕2 am Ausgang ist das Produkt der Transmission 𝒯 des Spiegels und der inneren Photonenflussdichte 𝜙∕2. Wenn 𝒯 vergrößert wird, nimmt 𝜙 infolge der größeren Verluste ab. Im Grenzfall 𝒯 = 0 besitzt der Oszillator den kleinsten Verlust (und 𝜙 ist maximal), aber der Laser liefert keinen nutzbaren Strahl (𝜙A = 0). In dem zweiten Grenzfall, dass der Spiegel ganz entfernt wird, sodass 𝒯 = 1 ist, bewirken die vergrößerten Verluste 𝛼R > 𝛾A (𝜈) (NSch > N0 ) und verhindern so die Laseroszillation vollständig. In diesem Fall ist 𝜙 = 0, sodass wieder 𝜙A = 0 wird. Der optimale Wert von 𝒯 liegt offensichtlich zwischen diesen beiden Extremen. Um dieses Optimum zu bestimmen, müssen wir eine explizite Beziehung zwischen 𝜙A und 𝒯 aufstellen. Wir nehmen an, dass Spiegel 1 das nutzbare Licht mit einem
491
16 Laser
Reflexionsgrad ℛ1 reflektiert und mit einem Transmissionsgrad 𝒯 = 1 − ℛ1 transmittiert. Den Verlustkoeffizienten 𝛼R schreiben wir als Funktion von 𝒯, indem wir in Gl. (16.6) den Verlustkoeffizienten aufgrund von Spiegel 1 einsetzen, 𝛼Sp1 =
1 1 1 ln =− ln(1 − 𝒯) . 2d 2d ℛ1
(16.28)
1 ln(1 − 𝒯) , (16.29) 2d und der Verlustkoeffizient aufgrund von Spiegel 2 ist 𝛼R = 𝛼S + 𝛼Sp2 −
𝛼Sp2 =
1 1 ln . 2d ℛ2
(16.30)
Wir verwenden jetzt die Gln. (16.24), (16.26) und (16.29), um eine Gleichung für die transmittierte Photonenflussdichte 𝜙A als Funktion der Spiegeltransmission zu erhalten, 𝑔0 1 𝜙A = 𝜙S 𝒯 [ − 1] , 𝑔0 = 2𝛾A (𝜈)d , 2 𝐿 − ln(1 − 𝒯) 𝐿 = 2(𝛼S + 𝛼Sp2 )d ;
(16.31)
diese Funktion ist in Abb. 16.10 aufgetragen. Die durchgelassene Photonenflussdichte ist direkt mit dem Gewinnkoeffizienten für kleine Signale verknüpft. Die optimale Transmission 𝒯opt erhalten wir, indem wir die Ableitung von 𝜙A nach 𝒯 gleich null setzen. Für 𝒯 ≪ 1 können wir die Näherung ln(1 − 𝒯) ≈ −𝒯 verwenden und erhalten √ 𝒯opt ≈ 𝑔0 𝐿 − 𝐿 . (16.32)
Die Zahl n der Photonen pro Volumeneinheit innerhalb des Resonators im stationären Zustand hängt mit der inneren Photonenflussdichte 𝜙 im stationären Zustand (für Photonen, die sich in beiden Richtungen ausbreiten) über die einfache Beziehung 𝜙 𝑐
(16.33)
zusammen. Das wird klar, wenn wir einen Zylinder der Fläche A, der Länge 𝑐 und dem Volumen 𝑐A (𝑐 ist die Geschwindigkeit des Lichts im Medium) betrachten, dessen Achse parallel zur Achse des Resonators liegt. Wenn der Resonator n Photonen pro Volumeneinheit enthält, enthält der Zylinder 𝑐An Photonen. Diese Photonen breiten sich in beiden Richtungen parallel zur Achse des Resonators aus, und die Hälfte von ihnen durchquert pro Sekunde die Grundfläche des Zylinders. Da die Grundfläche des Zylinders pro Sekunde jedoch auch eine gleiche Zahl von Photonen von der anderen Seite empfängt, ist die Photonenflussdichte (Photonen pro Sekunde pro Flächeneinheit in beiden Richtungen) 1 𝜙 = 2( 𝑐An)∕A = 𝑐n, woraus Gl. (16.33) folgt. 2 Die Photonenzahldichte entsprechend der inneren Photonenflussdichte im stationären Zustand aus Gl. (16.25) ist n = nS (
N0 − 1) , NSch
N0 > NSch ,
(16.34)
wobei nS = 𝜙S (𝜈)∕𝑐 der Sättigungswert der Photonenzahldichte ist. Wenn wir die Beziehungen 𝜙S (𝜈) = [𝜏S 𝜎(𝜈)]−1 , 𝛼R = 𝛾(𝜈), 𝛼R = 1∕𝑐𝜏P und 𝛾(𝜈) = N 𝜎(𝜈) = N Sch 𝜎(𝜈) verwenden, können wir Gl. (16.34) in der Form
s
0.2 o
Die innere Photonenzahldichte
n=
So erhalten wir
normierter Laserausgang
492
n = (N 0 − NSch ) 0.1
0
0
0.1 0.2 0.3 Spiegeltransmission
Abb. 16.10 Die Abhängigkeit der transmittierten Photonenflussdichte 𝜙A im stationären Zustand von der Spiegeltransmission 𝒯 . Für diese Abbildung wurde der Gewinnfaktor g0 = 2𝛾A d gleich 0.5 und der Verlustfaktor L = 2(𝛼S + 𝛼Sp2 )d gleich 0.02 (2 %) gesetzt. Die optimale Transmission 𝒯opt ist dann 0.08.
𝜏P , 𝜏S
N0 > NSch
(16.35)
schreiben. Diese Beziehung erlaubt eine einfache Interpretation: (N0 − N Sch ) ist der Besetzungsunterschied (pro Volumeneinheit) über der Schwelle, und (N0 − NSch )∕𝜏S bezeichnet die Geschwindigkeit, mit der Photonen erzeugt werden, die wegen des stationären Zustands gleich der Geschwindigkeit n∕𝜏P ist, mit der Photonen verloren gehen. Der Quotient 𝜏P ∕𝜏S ist folglich das Verhältnis der Geschwindigkeiten von Emission und Verlust der Photonen. Unter idealen Pumpbedingungen in einem Vierniveausystem liefern die Gln. (15.27) und (15.28) 𝜏S ≈ 𝑡sp und N0 ≈ R𝑡sp , wobei R die Geschwindigkeit (s−1 cm−3 ) ist, mit der die Atome gepumpt werden. Gleichung (16.35) kann damit als n = R − RSch , 𝜏P
R > RSch
(16.36)
16.2 Die Eigenschaften der Laserstrahlung
geschrieben werden, wobei RSch = NSch ∕𝑡sp der Schwellenwert der Pumpgeschwindigkeit ist. Im stationären Zustand ist daher die Gesamtgeschwindigkeit n∕𝜏P des Verlusts von Photonendichte genau gleich der überschüssigen Pumpgeschwindigkeit R − RSch . Photonenfluss am Ausgang und der Laserwirkungsgrad
Wenn die Transmission durch den Ausgangsspiegel des Lasers die einzige Quelle von Resonatorverlusten (die in 𝜏P berücksichtigt ist) und 𝑉 das Volumen des aktiven Mediums ist, zeigt Gl. (16.36), dass der Gesamtphotonenfluss 𝛷A am Ausgang (Photonen pro Sekunde) gleich 𝛷A = (R − RSch )𝑉 ,
R > RSch
(16.37)
ist. Wenn noch weitere Verlustmechanismen existieren, können wir die Photonenflussdichte am Ausgang als 𝛷A = 𝜂ex (R − RSch )𝑉
(16.38)
schreiben, wobei der Auskopplungswirkungsgrad 𝜂ex das Verhältnis des Verlusts aufgrund der Auskopplung des nutzbaren Lichts zum Gesamtverlust 𝛼R im Resonator ist. Wenn das nutzbare Licht nur durch Spiegel 1 ausgekoppelt wird, kann 𝜂ex mithilfe der Gln. (16.8) und (16.28) für 𝛼R und 𝛼Sp1 als 𝜂ex =
𝛼Sp1 𝛼R
=
𝑐 1 𝜏 ln 2d P ℛ1
(16.39)
geschrieben werden. Wenn außerdem 𝒯 = 1 − ℛ1 ≪ 1 ist, liefert Gl. (16.39) 𝜏 (16.40) 𝜂ex ≈ P 𝒯 , TF
(16.41)
Mittels einiger algebraischer Umformungen können wir bestätigen, dass dieser Ausdruck mit dem aus Gl. (16.27) erhaltenen im Einklang steht. Ex existieren noch mehr Ursachen für Verluste; beispielsweise ein schlechter Wirkungsgrad des Pumpprozesses. Auch zusätzliche Aufgaben wie Kühlung und Prozesskontrolle verbrauchen Leistung. Der Leistungsumwandlungswirkungsgrad 𝜂U (auch Gesamtwirkungsgrad genannt), ist als das Verhältnis der optischen Ausgangsleistung P A zur eingesetzten elektrischen Leistung Pel definiert, 𝜂U =
PA . Pel
𝜂St =
d PA . d P el
(16.43)
Der Steigungswirkungsgrad 𝜂St ist im Allgemeinen größer als der Leistungsumwandlungswirkungsgrad 𝜂U . Für optisch gepumpte Laser verwendet man häufig auch analog definierte Wirkungsgrade, die die Ausgangsleistung jedoch nicht auf die eingesetzte elektrische Leistung beziehen, sondern auf die eingesetzte optische Pumpleistung P P . Man erhält so den optisch-optischen Wirkungsgrad 𝜂A =
PA PP
(16.44)
oder den optisch-optischen Steigungswirkungsgrad 𝜂St =
d PA . d PP
(16.45)
Der optisch-optische Steigungswirkungsgrad 𝜂St ist im Allgemeinen größer als der optisch-optische Wirkungsgrad 𝜂A , der entsprechend 𝜂A ≤ 1 − q begrenzt ist, wenn q der in Gl. (15.46) definierte Quantendefekt ist.
16.2.2 Die spektrale Verteilung
wobei wir 1∕T F = 𝑐∕2d definiert haben. In Worten heißt das: der Auskopplungswirkungsgrad 𝜂ex ist gleich dem Verhältnis der Lebensdauer der Photonen zu ihrer Umlaufzeit multipliziert mit der Spiegeltransmission. Die Ausgangsleistung des Lasers ist dann P A = ℎ𝜈 𝛷A = 𝜂ex ℎ𝜈(R − RSch )𝑉 .
Typische Werte von 𝜂U für verschiedene Arten von Lasern sind in Tabelle 16.1 aufgeführt. Weil die Ausgangsleistung des Lasers nach Gl. (16.41) linear mit der Pumpleistung über der Schwelle zunimmt, wird auch der differentielle Leistungsumwandlungswirkungsgrad (oder Steigungswirkungsgrad häufig als Maß für die Effizient eines Lasers verwendet:
(16.42)
Die spektrale Verteilung des erzeugten Laserlichts wird sowohl durch die atomare Linienform des aktiven Mediums (z. B. ob es homogen oder inhomogen verbreitert ist) als auch durch die Resonatormoden bestimmt. Dies wird durch die beiden Bedingungen für Laseroszillationen illustriert: 1) Die Gewinnbedingung, die verlangt, dass der anfängliche Gewinnkoeffizient des Verstärkers größer sein muss als der Verlustkoeffizient [𝛾0 (𝜈) > 𝛼R ], ist für alle Schwingungsfrequenzen innerhalb eines kontinuierlichen spektralen Bands der Breite 𝐵 um die atomare Resonanzfrequenz 𝜈0 erfüllt, wie Abb. 16.11(a) zeigt. Die Bandbreite 𝐵 nimmt mit steigender atomarer Linienbreite Δ𝜈 und zunehmendem Verhältnis 𝛾0 (𝜈0 )∕𝛼R zu; die genaue Beziehung hängt von der Form der Funktion 𝛾0 (𝜈) ab. 2) Die Phasenbedingung verlangt, dass die Schwingungsfrequenz gleich der Frequenz 𝜈𝑞 einer der Moden des Resonators ist (wobei wir der Einfachheit
493
494
16 Laser
halber angenommen haben, dass Frequenz-Pulling vernachlässigbar ist). Die Halbwertsbreite jeder Mode ist δ𝜈 ≈ 𝜈F ∕ℱ [Abb. 16.11(b)].
Gewinn γ0(ν) (a)
Medium alle 𝑀 Moden oszillieren können (wenn auch mit unterschiedlichen Leistungen), während die Moden in einem homogen verbreiterten Medium in einer Art Konkurrenz stehen, die die Zahl der gleichzeitig oszillierenden Moden einschränkt. In Vielmodenlasern kommt es zu Fluktuationen der Rauschintensität aufgrund von Schwebungen und dem Wettbewerb zwischen den Moden.
Δν Verlust αR
Übung 16-2: Die Zahl der Moden in einem Gaslaser B
ν0
νF
ν
ν
(b)
ν1 ν2 ... νM
ν
Resonatormoden erlaubte Moden
Abb. 16.11 (a) Laseroszillation kann nur bei Frequenzen eintreten, für die der Gewinnkoeffizient größer ist als der Verlustkoeffizient (schattiertes Gebiet). (b) Oszillation kann nur in einer Umgebung δ𝜈 der Modenfrequenzen des Resonators auftreten (die hier der Einfachheit halber als Linien gezeigt sind).
Daraus folgt, dass nur eine endliche Zahl von Schwingungsfrequenzen (𝜈1 , 𝜈2 , … , 𝜈𝑀 ) möglich ist. Die Zahl der erlaubten Schwingungsmoden des Lasers ist 𝑀≈
𝐵 , 𝜈F
(16.46)
wobei 𝜈F = 𝑐∕2d der ungefähre Abstand zwischen benachbarten Moden ist. Die Zahl der Moden, die tatsächlich optische Leistung tragen, hängt von der Art der Linienverbreiterung in den Atomen ab. Im Folgenden werden wir zeigen, das in einem inhomogen verbreiterten γ0(ν)
γ0(ν)
Ein dopplerverbreiterter Gaslaser hat einen Gewinnkoeffizienten mit einem gaußförmigen spektralen Profil (siehe Abschnitt 14.3.4 und Übung 14-2) 𝛾0 (𝜈) = 𝛾0 (𝜈0 ) exp[−(𝜈 − 𝜈0 )2 ∕2𝜎D2 ], wobei Δ𝜈D = (8 ln 2)1∕2 𝜎D die Halbwertsbreite der Linie ist. (a) Leiten Sie einen Ausdruck für das erlaubte Schwingungsband 𝐵 als Funktion von Δ𝜈D und des Verhältnisses 𝛾0 (𝜈0 )∕𝛼R her, wobei 𝛼R der Verlustkoeffizient des Resonators ist. (b) Ein He-Ne-Laser hat eine Dopplerlinienbreite Δ𝜈D = 1.5 GHz und einen Gewinnkoeffizienten 𝛾0 (𝜈0 ) = 2 × 10−3 cm−1 in der Mitte des Bandes. Die Länge des Laserresonators ist d = 100 cm, und die Reflexionsgrade der Spiegel sind 100 % und 97 % (sonstige Resonatorverluste sind vernachlässigbar). Nehmen Sie an, dass der Brechungsindex 𝑛 = 1 ist und bestimmen Sie die Zahl 𝑀 der Lasermoden. Homogen verbreitertes Medium
Nach dem Einschalten wachsen alle Lasermoden, deren anfänglicher Gewinn größer ist als ihr Verlust [Abb. 16.12(a)]; die Photonenflussdichten 𝜙1 , 𝜙2 , . . . , 𝜙𝑀 werden aufgebaut. Die Moden, deren Frequenzen am nächsten bei der Mittenfrequenz 𝜈0 des Übergangs liegen, wachsen am schnellsten und enthalten die höchsten Photonenflussdichten. Die Photonen wechselwirken
γ0(ν)
αR
γ (ν) ν0
ν0
ν1 ν2 ... νM (a)
(b)
γ (ν) ν0
ν
ν
Abb. 16.12 Das Wachstum der Oszillation in einem idealen homogen verbreiterten Medium. (a) Nach dem Einschalten des Lasers wachsen alle Modenfrequenzen 𝜈1 , 𝜈2 , . . . , 𝜈M , deren Gewinnkoeffizienten größer sind als ihre Verlustkoeffizienten; am schnellsten wachsen die zentralen Moden. (b) Nach kurzer Zeit ist der Gewinn gesättigt; die zentralen
(c)
Moden wachsen weiter, während für die entfernteren Moden der Verlust größer geworden ist als der Gewinn und sie daher gedämpft werden und schließlich verschwinden. (c) Ohne räumliches Lochbrennen überlebt nur eine einzige Mode.
16.2 Die Eigenschaften der Laserstrahlung
mit dem Medium und reduzieren den Gewinn, indem sie den Besetzungsunterschied verringern. Der Gewinn bei Sättigung ist 𝛾(𝜈) =
𝛾0 (𝜈) , ∑𝑀 1 + 𝑗 = 1 𝜙𝑗 ∕𝜙S (𝜈𝑗 )
γ0(ν)
Δν
(16.47)
wobei 𝜙S (𝜈𝑗 ) die Sättigungs-Photonenflussdichte der Mode 𝑗 ist. Durch eine ähnliche Analyse wie der, die zu Gl. (15.49) führte, kann leicht verifiziert werden, dass Gl. (16.47) korrekt ist. Der Gewinn bei Sättigung ist in Abb. 16.12(b) gezeigt. Da der Gewinnkoeffizient gleichmäßig reduziert wird, wird der Verlust für Moden in großer Entfernung vom Linienzentrum bald größer als der Gewinn; diese Moden verlieren Leistung, während die zentraleren Moden weiterhin anwachsen, wenn auch langsamer. Schließlich ist der Gewinn nur noch für eine einzige überlebende Mode (oder zwei Moden im symmetrischen Fall) gleich groß wie der Verlust, während für alle anderen Moden der Verlust den Gewinn überschreitet. In einem idealen stationären Zustand bleibt die Leistung in dieser bevorzugten Mode stabil, während die Laserschwingung in allen anderen Moden [Abb. 16.12(c)] verschwindet. Die Frequenz der überlebenden Mode liegt am nächsten bei 𝜈0 ; für alle anderen Moden ist der Gewinns kleiner als der Verlust. Wenn die Frequenz der überlebenden Mode bekannt ist, kann ihre Photonenflussdichte aus Gl. (16.25) bestimmt werden. In der Praxis oszillieren homogen verbreiterte Laser jedoch in mehreren Moden, weil die unterschiedlichen Moden unterschiedliche räumliche Bereiche des aktiven Mediums einnehmen. Wenn die Oszillation der zentralen Mode in Abb. 16.12 stabil ist, kann der Gewinnkoeffizient an den Orten, an denen das elektrische Feld der stehenden Welle der zentralen Mode verschwindet, immer noch größer sein als der Verlustkoeffizient. Dieses Phänomen wird räumliches Lochbrennen genannt. Hierdurch können auch andere Moden aktiv sein, deren Feldmaxima in der Nähe der Knoten der zentralen Mode liegen. Inhomogen verbreitertes Medium
In einem inhomogen verbreiterten Medium ist der Gewinn 𝛾0 (𝜈) die komplexe Einhüllende der Gewinne von unterschiedlichen Arten von Atomen (siehe Abschnitt 14.3.4), wie Abb. 16.13 zeigt. Die Situation nach dem Einschalten des Lasers ist dieselbe wie im homogen verbreiterten Medium. Moden, deren Gewinn größer ist als ihr Verlust, beginnen zu wachsen, woraufhin der Gewinn abnimmt. Wenn der Abstand zwischen den Moden größer ist als die Breite
495
ν0
Abb. 16.13 Die Linienform eines inhomogen verbreiterten Mediums ist aus zahlreichen konstituierenden atomaren Linienformen mit unterschiedlichen Eigenschaften oder unterschiedlichen Umgebungen zusammengesetzt.
Δ𝜈 der konstituierenden atomaren Linienformfunktionen, wechselwirken unterschiedliche Moden mit unterschiedlichen Atomen. Atome, deren Linienformen nicht mit einiger der Moden überlappen, spüren nichts von der Anwesenheit von Photonen im Resonator. Ihr Besetzungsunterschied wird daher nicht beeinflusst, und der von ihnen beigesteuerte Gewinn bleibt der (ungesättigte) Gewinn für kleine Signale. Für Atome, deren Frequenz mit der einer Mode zusammenfällt, wird die Besetzungsinversion reduziert, und ihr Gewinn wird gesättigt, wodurch „Löcher“ im spektralen Profil des Gewinns entstehen [Abb. 16.14(a)]. Dieses Phänomen ist als spektrales Lochbrennen bekannt. Die Breite eines spektralen Lochs nimmt nach dem Quadratwurzelgesetz Δ𝜈S = Δ𝜈(1 + 𝜙∕𝜙S )1∕2 aus Gl. (15.62) mit der Photonenflussdichte zu. Dieser Prozess der Sättigung durch Lochbrennen schreitet für die verschiedenen Moden unabhängig voran, bis im stationären Zustand für alle Moden der Gewinn gleich dem Verlust ist. Hier existiert kein Wettbewerb zwischen den Moden, weil sie ihre Leistung von unterschiedlichen Atome erhalten. Viele Moden oszillieren gleichzeitig, wobei die zentralen Moden tiefere Löcher brennen und intensiver werden, wie Abb. 16.14(a) zeigt. Das Spektrum eines typischen inhomogen verbreiterten Vielmoden-Gaslasers ist in Abb. 16.14(b) dargestellt. Die Zahl der Moden ist normalerweise größer als bei homogen verbreiterten Medien, da räumliches Lochbrennen im Allgemeinen weniger Moden ermöglicht als spektrales Lochbrennen. Spektrales Lochbrennen in einem dopplerverbreiterten Medium
Die Linienform eines Gases bei der Temperatur 𝑇 entsteht aus der Überlagerung von dopplerverschobenen Emissionen der individuellen Atome, die sich mit unterschiedlichen Geschwindigkeiten bewegen (siehe Abschnitt 14.3.4 und Übung 14-2). Ein ruhendes Atom
ν
496
16 Laser
γ0(ν)
γ(ν)
Δνs αR
c 2 ν
νq–1
νq
νq+1
ν
ν
(a)
Abb. 16.14 (a) In einem inhomogen verbreiterten Medium brennt jede aktive Mode unabhängig ein Loch in das gesamte spektrale Gewinnprofil. Der Gewinn, den das Medium für eine Mode liefert, beeinflusst den Gewinn für andere
wechselwirkt mit Strahlung der Frequenz 𝜈0 . Ein Atom, das sich mit der Geschwindigkeit v in Ausbreitungsrichtung der Strahlung bewegt, wechselwirkt mit Strahlung der Frequenz 𝜈0 (1 + v ∕𝑐), während ein Atom, das sich entgegen der Ausbreitungsrichtung der Strahlung bewegt, mit Strahlung der Frequenz 𝜈0 (1 − v ∕𝑐) wechselwirkt. Da eine Strahlungsmode der Frequenz 𝜈𝑞 sich zwischen den beiden Spiegeln eines Resonators in beiden Richtungen ausbreitet, kann sie mit Atomen aus zwei Gruppen von Geschwindigkeiten wechselwirken: Solchen mit der Geschwindigkeit +v und solchen mit der Geschwindigkeit −v , wobei 𝜈𝑞 − 𝜈0 = ±𝜈0 v ∕𝑐 gelten muss. Folglich sättigt die Mode 𝜈𝑞 die Besetzungszahlen von Atomen zu beiden Seiten der Mittenfrequenz und brennt zwei Löcher in das Gewinnprofil, wie Abb. 16.15 zeigt. Für 𝜈𝑞 = 𝜈0 wird natürlich nur ein einziges Loch im Zentrum des Profils gebrannt. Die Leistung einer Mode im stationären Zustand nimmt mit der Tiefe des Lochs bzw. der Löcher im Gewinnprofil zu. Wenn sich die Frequenz 𝜈𝑞 von beiden Seiten in Richtung von 𝜈0 verschiebt, nehmen die Lochtiefe und die Leistung in der Mode zu. Wenn die Modenfrequenz 𝜈𝑞 jedoch nahe bei 𝜈0 liegt, wechselwirkt die Mode nur noch mit einer einzigen Gruppe von Atomen statt mit zweien, sodass die beiden Löcher zu einem einzigen verschmelzen. Diese Abnahme der Zahl verfügbarer aktiver Atome für 𝜈𝑞 = 𝜈0 bewirkt, dass die Leistung der Mode geringfügig abnimmt. Wenn man die Leistung in einer Mode als Funktion ihrer Frequenz 𝜈𝑞 aufträgt, erhält man daher eine Glockenkurve mit einer zentralen Vertiefung im Zentrum, die als Lamb-Dip bekannt ist (Abb. 16.16).
(b)
Moden nicht. Die zentralen Moden erhalten Beiträge von mehr Atomen und enthalten daher mehr Photonen als die äußeren Moden. (b) Das Spektrum eines typischen inhomogen verbreiterten Vielmoden-Gaslasers.
γ0(ν)
γ (ν) Δνs
αR ν0
ν νq
ν
Abb. 16.15 Lochbrennen in einem dopplerverbreiterten Medium. Eine Welle der Frequenz 𝜈q sättigt die Besetzungszahlen von Atomen mit den Geschwindigkeiten v = ±c(𝜈q ∕𝜈0 − 1) beiderseitig der Mittenfrequenz und brennt so zwei Löcher in das Gewinnprofil.
Gewinn γ0(ν) Verlust αR
Resonatormoden Leistung der Mode q
c 2
ν0 νq
ν ν
ν0
Abb. 16.16 Die Leistung in einer einzelnen Lasermode der Frequenz 𝜈q in einem dopplerverbreiterten Medium, dessen Gewinnkoeffizient bei 𝜈0 maximal ist. Anstatt maximaler Leistung bei 𝜈q = 𝜈0 ist an dieser Stelle der Lamb-Dip zu sehen.
νq
16.2 Die Eigenschaften der Laserstrahlung
16.2.3 Räumliche Verteilung und Polarisation Räumliche Verteilung
Die räumliche Verteilung des ausgestrahlten Laserlichts hängt von der Geometrie des Resonators und der Form des aktiven Mediums ab. In der unserer bisherigen Lasertheorie haben wir transversale räumliche Effekte ignoriert, da wir angenommen haben, dass der Resonator von zwei unendlich ausgedehnten parallelen ebenen Spiegeln begrenzt und der Raum zwischen ihnen mit dem aktiven Medium gefüllt ist. In dieser idealisierten Anordnung ist der Laserausgang eine ebene Welle, die sich entlang der Achse des Resonators ausbreitet. Aus Kapitel 11 ist jedoch offensichtlich, dass ein solcher Resonator aus ebenen Spiegeln sehr empfindlich gegenüber Ausrichtungsfehlern ist. Reale Laserresonatoren verwenden aus diesem Grund gewöhnlich Kugelspiegel. Wie in Abschnitt 11.2 diskutiert, erzeugt ein Kugelspiegelresonator einen Gaußstrahl (der im Detail in Abschnitt 3.1 betrachtet wurde). Ein Laser mit einem Kugelspiegelresonator liefert daher ein Ausgangssignal in Form eines Gaußstrahls. Wir hatten auch gesehen (in Abschnitt 11.2.4), dass der Kugelspiegelresonator eine Hierarchie von transversalen elektrischen und magnetischen Moden TEM𝑙,𝑚,𝑞 erlaubt. Jedes Paar von Indizes (𝑙, 𝑚) definiert eine transversale Mode mit einer zugehörigen räumlichen Verteilung. Die transversale Mode (0, 0) ist ein Gaußstrahl (Abb. 16.17). Moden mit höherem 𝑙 und 𝑚 sind Hermite-Gauß-Strahlen (siehe Abschnitt 3.3 und Abb. 3.23). Für ein gegebenes Paar (𝑙, 𝑚) definiert der
Index 𝑞 mehrere longitudinale (axiale) Moden derselben räumlichen Verteilung aber unterschiedlichen Frequenzen 𝜈𝑞 (im Abstand 𝜈F = 𝑐∕2d unabhängig von 𝑙 und 𝑚). Die Resonanzfrequenzen zweier Sätze von longitudinalen Moden, die zu zwei unterschiedlichen transversalen Moden gehören, sind im Allgemeinen um einen Bruchteil des Modenabstands 𝜈F gegeneinander versetzt [siehe Gl. (11.71).] Wegen ihrer unterschiedlichen räumlichen Verteilungen erfahren unterschiedliche transversale Moden unterschiedliche Gewinne und Verluste. Die (0, 0)-Gaußmode ist beispielsweise am stärksten um die optische Achse eingegrenzt und erleidet daher den kleinsten Beugungsverlust an den Grenzflächen der Spiegel. Die (1, 1)-Mode verschwindet an Punkten auf der optischen Achse (siehe Abb. 3.23); wenn der Laserspiegel daher durch ein kleines zentrales Hindernis blockiert würde, wäre die (1, 1)-Mode nicht betroffen, während die (0, 0)Mode einen großen Verlust erfahren würde. Moden höherer Ordnung nehmen ein größeres Volumen ein und können daher einen größeren Gewinn besitzen. Diese Unterschiede zwischen den Verlusten und/oder Gewinnen der unterschiedlichen transversalen Moden in verschiedenen Anordnungen bestimmen ihre relativen Beiträge zur Laserschwingung, wie Abb. 16.18 illustriert. In einem homogen verbreiterten Laser neigt die stärkste Mode dazu, den Gewinn der anderen Moden zu unterdrücken, das räumliche Lochbrennen kann jedoch Oszillationen einiger Longitudinalmoden ermöglichen. Transversale Moden können völlig unterschiedliche räumliche Verteilungen haben, sodass sie ohne x, y
Abb. 16.17 Die transversale (0,0)Mode eines Kugelspiegelresonators hat die Form eines Gaußstrahls.
Laserintensität Kugelspiegel
Kugelspiegel
γ0,0 γ1,1 TEM 0,0
α1,1 B1,1 B 0,0
Laserausgang
(1,1)Mode
α0,0
(0,0)-Mode
ν TEM 1,1
ν
Abb. 16.18 Die Gewinne und Verluste für zwei transversale Moden, (0, 0) und (1, 1), unterscheiden sich normalerweise wegen ihrer unterschiedlichen räumlichen Verteilungen. Eine Mode kann zum Ausgangssignal beitragen, wenn sie innerhalb des spektralen Bands (der Breite B) liegt, innerhalb dessen der Gewinnkoeffizient größer ist als der Verlustkoeffizient. Die erlaubten Longitudinalmoden zu jeder transversalen Mode sind gezeigt.
497
498
16 Laser
weiteres gleichzeitig oszillieren können. Eine Mode, deren Energie in einem gegebenen transversalen Raumbereich konzentriert ist, sättigt den Gewinn in diesem Bereich und brennt so ein räumliches Loch. Zwei transversale Moden, die sich nicht räumlich überlappen, können ohne Konkurrenz koexistieren, weil sie ihre Energie von unterschiedlichen Atomen beziehen. Erst eine teilweise räumliche Überlappung zwischen unterschiedlichen transversalen Moden und Bewegungen der Atome (wie in Gasen) ermöglichen Konkurrenz zwischen den Moden. Laser werden häufig gezielt für den Betrieb auf einer einzigen transversalen Mode entworfen; in der Regel die (0, 0)-Gaußmode, weil sie den kleinsten Strahldurchmesser besitzt und auf den kleinsten Brennfleck fokussiert werden kann (siehe Abschnitt 3.2). Oszillationen auf Moden höherer Ordnung kann andererseits wünschenswert sein, um beispielsweise eine hohe optische Leistung zu erzeugen. Polarisation
Jede (𝑙, 𝑚, 𝑞)-Mode hat zwei Freiheitsgrade entsprechend zwei unabhängigen orthogonalen Polarisationen. Diese beiden Polarisationen werden als zwei unabhängige Moden betrachtet. Wegen der Rotationssymmetrie des Kugelspiegelresonators haben die zwei Polarisationsmoden mit gleichem 𝑙 und 𝑚 dieselbe räumliche Verteilung. Wenn der Resonator und das aktive Medium für beide Polarisationen dieselben Gewinne und Verluste liefern, oszilliert der Laser auf beiden Moden gleichzeitig, unabhängig und mit derselben Intensität. Der Ausgangsstrahl des Lasers ist dann unpolarisiert (siehe Abschnitt 12.4). Instabile Resonatoren
Obwohl sich unsere Diskussion auf Laserbauformen mit stabilen Resonatoren konzentriert hat (siehe Abb. 11.13), bieten instabile Resonatoren beim Betrieb von Hochleistungslasern mehrere Vorteile. Dazu gehören (1) ein größerer Anteil des zum Gewinn beitragenden Mediums aufgrund des größeren Modenvolumens, (2) größere erreichbare Ausgangsleistungen beim Betrieb auf der transversalen Mode niedrigster Ordnung im Gegensatz zu transversalen Moden höherer Ordnung wie bei stabilen Resonatoren und (3) eine hohe Ausgangsleistung bei minimalen optischen Schäden an den
hochreflektierender Spiegel
Resonatorspiegeln durch Verwendung von ausschließlich reflektierenden Bauelementen, die dem Laserlicht ermöglichen, an den Spiegelrändern vorbei aus dem Resonator zu entkommen (ein solcher Aufbau ermöglicht auch eine Wasserkühlung der Optik, die hohe optische Leistungen ohne Schäden erlaubt).
16.2.4
Ein Vielmodenlaser kann auf einer einzigen Mode betrieben werden, wenn man ein Element in den Resonator einführt, das einen ausreichenden Verlust bewirkt, um die Oszillation der unerwünschten Moden zu verhindern. Selektion der Laserlinie
Ein aktives Medium mit vielen Übergängen (atomaren Linien), deren Besetzungen durch das Pumpen invertiert sind, wird einen Laserstrahl mit zahlreichen Linien liefern. Eine spezielle Linie kann für die Oszillation selektiert werden, indem man ein Prisma in den Resonator einbringt, wie Abb. 16.19 schematisch zeigt. Das Prisma wird so eingestellt, dass nur das Licht der gewünschten Wellenlänge senkrecht auf den hochreflektierenden Spiegel trifft und daher zurück reflektiert werden kann, um eine Rückkopplung zu erzeugen. Durch Rotation des Prismas kann immer eine einzige Wellenlänge ausgewählt werden. Argonionenlaser enthalten beispielsweise häufig ein drehbares Prisma im Resonator, um die Selektion einer der sechs Laserlinien von 488 nm im Blauen bis 514.5 nm im Blaugrünen zu ermöglichen. Ein Prisma kann aber nur dann zur Selektion einer Linie verwendet werden, wenn die anderen Linien deutlich von dieser getrennt sind. Zum Beispiel kann so keine Longitudinalmode ausgewählt werden; benachbarte Moden liegen hier so dicht beisammen, dass die dispersive Brechung durch das Prisma sie nicht unterscheiden kann. Selektion einer transversalen Mode
Unterschiedliche transversale Moden haben unterschiedliche räumliche Verteilungen, sodass eine Blende mit kontrollierbarer Form innerhalb des Resonators dazu verwendet werden kann, unerwünschte Moden selektiv abzuschwächen (Abb. 16.19). Auch die Laserspiegel können so konstruiert werden, dass sie eine spezielle transversale Mode bevorzugen. Auslassspiegel
Prisma aktives Medium unerwünschte Linie
Modenselektion
Blende
Laserausgang
Abb. 16.19 Eine spezielle atomare Linie kann mithilfe eines Prismas im Resonator ausgewählt werden. Eine transversale Mode kann durch eine Blende mit sorgfältig gewählter Form und Größe selektiert werden.
16.2 Die Eigenschaften der Laserstrahlung
Selektion einer Polarisation
Mithilfe eines Polarisator kann unpolarisiertes Licht in polarisiertes Licht umgewandelt werden. Dazu ist es jedoch vorteilhaft, den Polarisator innerhalb des Resonators zu platzieren, da ein externer Polarisator die Hälfte der Ausgangsleistung des Lasers vergeudet. Außerdem kann das durch einen externen Polarisator durchgelassene Licht zusätzliches Rauschen enthalten, das aus der Fluktuation der Leistung zwischen den beiden Polarisationsmoden entsteht (sogenannte Modensprünge, engl. mode hopping). Ein interner Polarisator erzeugt hohe Verluste für eine Polarisation, sodass die Oszillation in einer solchen Mode gar nicht erst beginnt. Der vom Lasermedium erzeugte Gewinn steht daher vollständig für die überlebende Polarisation zur Verfügung. Ein interner Polarisator wird meist mithilfe von Brewsterfenstern realisiert (siehe Abschnitt 6.2 und Übung 6-5), wie Abb. 16.20 zeigt. Die Selektion einer Longitudinalmode
Auch die Selektion einer einzelnen Longitudinalmode ist möglich. Die Zahl von Longitudinalmoden in einem inhomogen verbreiterten Laser (z. B. einem dopplerverbreiterten Gaslaser) ist gleich der Zahl von Resonatormoden in einem Frequenzband 𝐵, innerhalb dessen der Gewinn größer ist als der Verlust (siehe Abb. 16.11). Es gibt zwei Möglichkeiten, einen Laser auf einer einzelnen Longitudinalmode zu betreiben: 1) Man kann den Verlust so weit vergrößern, dass nur die Mode mit dem größten Gewinn oszilliert. Das bedeutet jedoch, dass die überlebende Mode selbst schwach sein wird. 2) Man kann den Abstand 𝜈F = 𝑐∕2d der Longitudinalmoden vergrößern, indem man die Resonatorlänge reduziert. Das bedeutet jedoch, dass die Länge des aktiven Mediums reduziert wird, sodass das Volumen des aktiven Mediums und daher die verfügbare Laserleistung verringert werden.
Brewsterfenster
aktives Medium
Brewsterfenster
Es gibt eine Reihe von Methoden auf der Grundlage von frequenzselektiven Elementen im Laserresonator, um den Frequenzabstand der Resonatormoden zu verändern, Zwei beliebte Verfahren sind ein verkipptes Etalon innerhalb des Resonators und der Einsatz von Vielfach-Spiegelresonatoren. Beide sollen im Folgenden kurz vorgestellt werden. Verkipptes Etalon im Resonator
Zur Modenselektion kann beispielsweise ein FabryPérot-Resonator verwendet werden, dessen Spiegelabstand d 1 viel kürzer ist als der Laserresonator (Abb. 16.21). Die Moden des dünnen Etalons haben einen großen Abstand 𝑐∕2d 1 > 𝐵, sodass nur eine Etalonmode in die Bandbreite des Laserverstärkers passen kann. Das Etalon ist so konstruiert, dass eine seiner Moden mit der Longitudinalmode des Resonators mit dem größten Gewinn (oder einer beliebigen anderen Mode) zusammenfällt. Das Etalon kann durch eine kleine Rotation, eine Temperaturänderung oder einer geringe Variation seiner Dicke d 1 mithilfe eines piezoelektrischen (oder sonstigen) Wandlers fein abgestimmt werden. Das Etalon wird etwas gegen die Resonatorachse gekippt, damit Reflexionen an seinen Oberflächen nicht auf die Resonatorspiegel fallen und dadurch unerwünschte zusätzliche Resonanzen erzeugen. Das Etalon ist gewöhnlich temperaturstabilisiert, um Frequenzstabilität zu erreichen. Vielfach-Spiegelresonatoren
Auch mithilfe von Vielfach-Spiegelresonatoren ist eine Modenselektion möglich. Abbildung 16.22 zeigt verschiedene Anordnungen dafür. Die Modenselektion kann mittels zweier gekoppelter Resonatoren mit unterschiedlichen Längen [Abb. 16.22(a)] erreicht werden. Der Resonator in Abb. 16.22(b) besteht aus zwei gekoppelten Hohlräumen, die jeweils ihren eigenen Gewinn besitzen – im Prinzip zwei gekoppelte Laser. Eine andere Technik nutzt einen mit einem Interferometer gekoppelten Resonator [Abb. 16.22(c)].
polarisierter Laserstrahl
θB hochreflektierender Spiegel
Auslassspiegel
Abb. 16.20 Brewsterfenster in einem Gaslaser liefern einen linear polarisierten Laserstrahl. In der Einfallsebene polarisiertes Licht (die TM-Welle) wird ohne Reflexionsverlust durch ein im Brewsterwinkel aufgestelltes Fenster transmittiert; die orthogonal polarisierte (TE-) Mode erfährt Reflexionsverluste und oszilliert daher nicht.
499
500
16 Laser
Etalon hochreflektierender Spiegel
Auslassspiegel
aktives Medium
1
Gewinn Resonatorverlust
ν0
Resonator- c 2 moden Etalonmoden
Abb. 16.21 Die Selektion einer Longitudinalmode mithilfe eines Etalons im Laserresonator. Oszillation tritt bei den Frequenzen auf, bei denen eine Mode des Resonators mit einer Etalonmode zusammenfällt; beide müssen natürlich innerhalb des spektralen Fensters liegen, in dem der Gewinn des Mediums den Verlust überschreitet.
ν ν
c 2
ν 1
Laserstrahl
(a)
(b)
(c)
Abb. 16.22 Die Selektion einer Longitudinalmode durch (a) zwei gekoppelte Resonatoren (einen passiven und einen aktiven), (b) zwei gekoppelte aktive Resonatoren, (c) einen mit einem Interferometer gekoppelten Resonator.
Die Linienbreite von Lasern
Die spektrale Halbwertsbreite Δ𝜈L eines Einmodenlasers kann durchaus viel kleiner sein als die spektrale Breite δ𝜈 ≈ 𝜈F ∕ℱ einer Resonatormode. Die Breite Δ𝜈L wird durch die sogenannte Schawlow-Townes-Linienbreite begrenzt, die Beiträge der spontanen Emission mit zufälliger Phase berücksichtigt, die die schwingende Lasermode überlagern. Die Schawlow-Townes-Halbwertsbreite für ein Vierniveausystem ist Δ𝜈ST = π ℎ𝑣(δ𝜈)2 ∕P0 . Sie kann folgendermaßen minimiert werden: (1) Durch Erhöhen der Resonatorlänge d , wodurch der freie Spektralbereich 𝜈F = 𝑐0 ∕2𝑛d und damit δ𝜈 verringert wird, (2) durch Reduzieren des Resonatorverlusts, wodurch ℱ größer und somit δ𝜈 kleiner wird, sowie (3) durch Erhöhung der Ausgangsleistung PA des Lasers. In sorg-
ν
sam kontrollierten Experimenten ist es möglich, sich dem Schawlow-Townes-Limit der Linienbreite zu nähern. Die Linienbreiten der meisten Laser sind jedoch infolge von äußeren Einflüsse wie mechanischen Resonatorschwingungen, Temperaturschwankungen des aktiven Mediums oder Fluktuationen der Pumpleistung wesentlich größer als dieses Limit. In der Praxis sind Linienbreiten im Bereich von kHz bis GHz üblich. Die Linienbreiten von Einmodenlasern können durch verschiedene Methoden der Stabilisierung bis in den mHzBereich reduziert werden, wobei alle Werte unterhalb von 1 Hz eine echte Herausforderung darstellen.
16.3 Bauarten von Lasern Laserverstärkung und Laseroszillation sind allgegenwärtig; sie treten in einer enormen Vielfalt von Medien wie Festkörpern (Kristallen, Gläsern, Fasern, Pulver), Gasen (atomaren, ionischen, molekularen, Excimer-) und Flüssigkeiten (Lösungen von organischen Farbstoffen) auf. Eine einzelne biologische Zelle kann als Laser agieren, wenn sie genetisch darauf programmiert wurde, grün fluoreszierendes Protein herzustellen. Plasmen ermöglichen Laserwirkung im extremen UV und Röntgenbereich. In einem Freie-Elektronen-Laser wirken Elektronen in einem undulierenden Magnetfeld als aktives Medium. Wir präsentieren im Folgenden einige Beispiele von Lasern aus diesen verschiedenen Kategorien. Die Parameter praktisch umgesetzter Laser erstrecken sich über viele Größenordnungen:
16.3 Bauarten von Lasern
• Die Abmessungen von Lasern reichen von einigen Nanometern bis zu Kilometern; interstellare Molekülwolken wirken als Maser mit Abmessungen von Terametern • Die emittierten elektromagnetischen Frequenzen decken einen Bereich von fast 10 Größenordnungen ab – von GHz in der Mikrowelle bis EHz in harten Röntgenstrahlen. • Die spektralen Linienbreiten von Lasern reichen über mehr als 15 Größenordnungen – von mHz bis THz. • Die maximalen Ausgangsleistungen erstrecken sich über 24 Größenordnungen von Nanowatt bis Petawatt. • Die Pulsdauern von Lasern und Lasersystemen können einige 10 Attosekunden betragen oder unendlich sein (CW- oder Dauerstrichbetrieb).
16.3.1 Festkörperlaser Allgemeines
Die Energieniveaudiagramme von mehreren Festkörper-Lasersubstanzen (Rubin, Alexandrit, Nd3+:YAG und Nd3+:Glas) wurden bereits in Abschnitt 14.1.4 gezeigt (siehe Abb. 14.4 und 14.5), und der Betrieb von mehreren Festkörper-Laserverstärkern (Rubin, Nd3+:Glas und Er3+:Quarzglas) wurde in Abschnitt 15.3 besprochen (siehe Abb. 15.15, 15.17 und 15.20). Die Eigenschaften der Haupt-Laserübergänge in diesen und anderen aktiven Medien wurden in Tabelle 15.1 zusammengefasst. Wenn man einen passenden Pumpmechanismus hinzufügt und sie in einen optischen Resonator stellt, sind all diese Festkörper in der Lage, als Laser zu arbeiten. Manche von ihnen können auch als chaotische Laser arbeiten, wenn man sie zu einem Pulver zermahlt. Kristalline, keramische und glasartige Wirtsmedien
Es gibt viele Varianten von Festkörperlasern, da Dutzende von transparenten dielektrischen Medien als Wirtsmaterialien für viele unterschiedliche Arten von aktiven Dotierionen geeignet sind. Kristalline Wirte sind z. B. Oxide, Granate, Fluoride, Vanadate oder Doppelwolframate; häufige Beispiele sind Al2 O3 (Saphir), Y3 Al5 O12 (Yttriumaluminiumgranat, YAG), Lu3 Al5 O12 (Lutetiumaluminiumgranat, LuAG), YLiF4 (Yttriumlithiumfluorid, YLF), YVO4 (Yttriumvanadat, auch als Yttriumorthovanadat bezeichnet), KY(WO4 )2 (Kaliumyttriumwolframat, KYW) oder KGd(WO4 )2 (Kaliumgadoliniumwolframat, KGW). Auch Halbleiterkristalle wie ZnS oder ZnSe sind geeignete Wirtsmedien für Festkörperlaser. Auch polykristalline transparente keramische Wirtsmedien mit hoher optischer Qualität und den-
selben Zusammensetzungen wie ihre einkristallinen Gegenstücke werden immer häufiger eingesetzt, da sie eine Reihe von vorteilhaften Eigenschaften bieten, beispielsweise höhere Leistung und Effizienz, geringere Kosten und die Möglichkeit, flexible Verbundmaterialien herzustellen. Auch viele unterschiedliche Gläser sind als Wirtsmedien im Gebrauch; dazu gehören Verbindungen auf Silikat- (wie z. B. nichtkristallines SiO2 , also Quarzglas) oder Phosphatbasis (die für Hochleistungs- und gepulste Laser bevorzugt werden, siehe Abschnitt 15.3.2 für ein Beispiel). Aufgrund ihrer schlechten Wärmeleitfähigkeit werden Glaslaser jedoch hauptsächlich in Systemen eingesetzt, die mit sehr hohen Leistungen und geringen Tastgraden arbeiten. Erwähnenswerte Ausnahmen sind die in Faserlasern verwendeten Gläser mit großen Verhältnissen von Fläche zu Volumen, die das Abkühlen erleichtern. Beim Vergleich der Eigenschaften von Lasern mit kristallinen und glasförmigen Wirtsmaterialien zeigt sich, dass Erstere normalerweise homogen verbreitert sind und daher schmalere Linienbreiten (und entsprechend tiefere Laserschwellen), eine größere Beständigkeit gegen Solarisation (Abdunklung durch die ultravioletten Komponenten des Lichts der Blitzlampe) und höhere Wärmeleitfähigkeiten bieten. Andererseits haben auch inhomogen verbreiterte Glas-Wirtsgitter einige klare Vorteile: Sie sind isotrop, leicht in hoher optischer Qualität und mit homogener Dotierung herzustellen, sie behalten ihre optischen Eigenschaften bei und sind auch in großen Abmessungen leicht zu produzieren (siehe Abschnitt 15.3.2). Dotierionen
Die meisten als aktive Lasermedien in Wirtskristallen verwendeten Dotierionen sind Übergangsmetall- und Lanthanoidionen (Seltenerdionen), aber gelegentlich finden auch Actinoidionen Verwendung (siehe Tabelle 14.1). Die Dotierionen sind in der Regel im Wirtsmedium dispergiert und verhalten sich wie unabhängige Strahler, ganz ähnlich wie Ionen von organischen Farbstoffen in einem Lösungsmittel. Die Dotierkonzentration liegt meist im Bereich im 1 %, kann aber je nach Dotiersubstanz, Wirtsmaterial und Anwendung auch nur 0.01 % oder bis zu 50 % betragen. Um mechanische Spannungen zu minimieren, wird das Wirtsmaterial meist so gewählt, dass das aktive Dotierion eine ähnliche Atomgröße wie das substituierte Atom besitzt. Das erste System, mit dem ein funktionierender Laser realisiert werden konnte, bestand aus dreiwertigen Chromionen in Saphir (Cr3+:Al2 O2 ), d. h. Rubin. Rubin besitzt jedoch einen sehr geringen Wirkungsgrad,
501
16 Laser
da es sich um ein Dreiniveausystem handelt. Alexandrit (Cr3+:BeAl2 O4 ), ein anderer früher Cr3+ -dotierter Festkörperlaser, wird gelegentlich in der Dermatologie eingesetzt. Wenn Cr3+ als aktives Laserion verwendet wird, wird es heutzutage meist in Colquiriit-Materialien wie LiCaAlF6 (LiCAF), LiSrAlF6 (LiSAF) oder LiSrGaF6 (LiSGaF) eindotiert. Alexandrit und die Cr3+ -dotierten Colquiriite können mit roten AlInGaP-Laserdioden effizient gepumpt werden. Die häufigsten Festkörperlaser aus dieser großen Zahl von möglichen Kombinationen aus Dotiersubstanz und Wirtsmedium beruhen auf Nd3+:YVO4 , Nd3+:YAG, Yb3+:YAG, Ti3+:Saphir und Cr2+:ZnS, die wir im Folgenden nacheinander betrachten wollen. Auch viele weitere Festkörperlaser gehören zu der Familie der seltenerddotierten Dielektrika, beispielsweise z. B. Er3+:YAG, Ho3+:YAG oder Tm3+:YAG. Wie in Abschnitt 14.1.4 diskutiert sind die Energieniveaus der Seltenerdionen (nicht aber ihre Feinstruktur!) weitgehend unabhängig vom Wirtsmaterial, weil die 4f-Elektronen durch die gefüllten 5s- und 5p-Unterschalen gut vor dem Einfluss des Gitters abgeschirmt werden (siehe Tabelle 14.1). Diodengepumpte Festkörperlaser
Festkörperlaser, die durch Laserdioden (oder Arrays von Laserdioden) optisch gepumpt werden, werden als diodengepumpte Festkörperlaser (DPSS-Laser, von engl. diode-pumped solid-state) bezeichnet. Sie verwandeln die relativ breitbandige Vielmodenstrahlung von Laserdioden in schmalbandige Einmodenstrahlung von Festkörperlasern. Es sind kompakte und hocheffiziente Bauelemente mit einer ausgezeichneten Strahlqualität. Sie bieten je nach den beteiligten elektronischen und elektronischen Übergängen eine breite Vielfalt von möglichen Wellenlängen, die durch Frequenzverdopplung oder andere Formen der Frequenzumwandlung 2.0
Nd3+:YVO4 τ 32
4F 5/2
3 Energie / eV
502
4
I13/2
4I
0
2
Laserübergang 1.064 µm
Pumpen
4I
1.5
4F 3/2
τ1
1.0
noch gesteigert werden kann (siehe Kapitel 22). Diodengepumpte Festkörperlaser finden in Industrie, Medizin und Forschung vielfältige Anwendungen. Neodymdotiertes Yttriumvanadat
Nd3+:YVO4 ist ein dielektrisches Material mit dem Brechungsindex 𝑛 ≈ 2.0. Das Wirtsmaterial ist über einen breiten Wellenlängenbereich von 0.3 bis 2.5 μm transparent. Die für den Laserbetrieb wichtigen Energieniveaus dieses Vierniveausystems sind in Abb. 16.23 illustriert; die Laserschwelle liegt wesentlich niedriger als die des Rubins. Der Laser wird durch eine Halbleiterlaserdiode bei 𝜆0 = 808 nm gepumpt, wobei das 4 F5∕2 -Niveau (3) bei 1.53 eV besetzt wird. Für die Laserwirkung bei der berühmten Wellenlänge von 1.064 μm ist der Übergang 4 F3∕2 → 4 I11∕2 verantwortlich. Alternativ kann der Laser auf diesem Übergang auch durch direktes Intrabandpumpen (Abb. 15.13) von Niveau 0 nach Niveau 2 bei 880 nm (mithilfe von AlGaAs-Laserdioden) oder bei bis zu 914 nm (mithilfe von InGaAs-Laserdioden) betrieben werden. In diesem letzten Fall bewirkt der kleine Quantendefekt (q ≈ 14 %) eine Ausgangsleistung von mehr als 10 W bei 1.064 μm mit einem optisch-optischen Wirkungsgrad 𝜂A ≈ 80 %. Strahlung aus einem frequenzverdoppelten Nd3+:YVO4 -Laser dient oft als 532 nmPumplaser für einen Ti:Saphir-Laser (Abb. 16.33). Die Übergänge 4 F3∕2 → 4 I13∕2 und 4 F3∕2 → 4 I9∕2 ermöglichen auch einen Betrieb bei Wellenlängen von 1.34 μm bzw. 914 nm, im letzteren Fall als Quasi-Dreiniveausystem. Eine Frequenzverdopplung der induzierten Emission bei 914 nm liefert blaues Licht bei 457 nm. Neodymdotiertes Yttriumvanadat unterscheidet sich von neodymdotiertem Glas (siehe Abb. 14.5) durch seinen höheren Brechungsindex, die homogene Verbreiterung und kleinere Übergangslinienbreiten (siehe Tabelle 15.1).
Abb. 16.23 (a) Ausgewählte Energieniveaus von Nd3+:YVO4 . Der rechte Pfeil zeigt den Haupt-Laserübergang bei einer Wellenlänge von 1.064 μ m im nahen Infrarot. Die vier wechselwirkenden Energieniveaus sind durch eingekreiste Ziffern gekennzeichnet. (b) Der Aufbau eines Nd3+:YVO4 -Lasers mit einem frequenzverdoppelnden Lithiumtriboratkristall (LBO) im Inneren des Resonators, der Licht bei 𝜆0 ∕2 = 532 nm erzeugt (siehe Abschnitt 22.2.1). Pu m 808 pen nm
en mp Pu nm 808
Nd3+:YVO4
0.5
LBO 11/2
1 0
9/2
(a)
1.064 µm (b)
53 2
nm
16.3 Bauarten von Lasern
Neodymdotierter Yttriumaluminiumgranat
Der 1964 entwickelte Nd3+:YAG-Laser, dessen Energieniveaus in Abb. 14.5 gezeigt sind, ist einer der am häufigsten eingesetzten diodengepumpten Festkörperlaser. Er ermöglicht kompakte Geräte mit hoher Ausgangsleistung. Weil die spektroskopisch aktiven 4f-Elektronen vor dem Wirtsmedium abgeschirmt sind, ähneln ihre Energieniveaus denjenigen von neodymdotiertem Yttriumvanadat (siehe 16.23). Nd3+:YAG-Laser verwenden häufig frequenzverdoppelnde Kristalle im Inneren des Resonators, wie Abb. 16.23 für Nd3+:YVO4 zeigt. Nd3+:YAG kann mit einer Blitzlampe gepumpt werden, meist wird jedoch ein AlGaAs-Laserdiodenarray bei 808 nm eingesetzt, um das System als Vierniveausystem zu betreiben (genau wie bei Nd3+:YVO4 ). Kristalle mit Abmessungen von einigen hundert μm können als effiziente Einfrequenz-Scheibenlaser dienen. Die üblichste der Laserlinien von Nd3+:YAG ist die bei 𝜆0 = 1.06415 μm im nahen Infrarot. Die Feinstrukturniveaus der drei Zustände dieses Laserübergangs, die aus (2𝒥 + 1)∕2 = 5, 6 und 2 Unterniveaus bestehen, sind in Abb. 14.6 gezeigt. Die Laserlinie entsteht aus einem Übergang zwischen dem oberen Feinstrukturniveau des 4 F3∕2 -Zustands bei 1.4269 eV und dem dritttiefsten Feinstrukturniveau des 4 I11∕2 -Zustands bei 0.2616 eV. Durch Frequenzverdopplung liefert dieser Übergang die vertraute grüne Emissionslinie bei 532 nm. Durch Übergänge zwischen den unterschiedlichen Feinstrukturniveaus innerhalb der oberen und unteren Laserzustände sind zahlreiche Laserwellenlängen möglich, die von 1.052 bis 1.122 μm reichen. Der Laser kann insbesondere bei 𝜆0 = 1.12238 μm auf einem Übergang zwischen dem tieferen der beiden Niveaus des 4 F3∕2 -Zustands bei 1.4165 eV und dem höchsten der Niveaus des 4 I11∕2 -Zustands bei 0.3117 eV betrieben werden. Das ist die größte Wellenlänge, die durch einen Übergang zwischen diesen Zuständen erreicht werden kann. Durch Frequenzverdopplung ergibt sich daraus gelbgrünes Licht bei 𝜆0 = 561 nm. Nd3+:YAG kann auch als Quasi-Dreiniveaulaser auf dem Übergang 4 F3∕2 → 4 I9∕2 betrieben werden, wo er Laserlicht bei 946 nm erzeugt; Frequenzverdopplung innerhalb des Resonators liefert dann blaues Licht bei 473 nm. Die Zahl der Möglichkeiten ist fast unüberschaubar, da beispielsweise maßgeschneiderte photonische Kristalle als Filter verwendet werden können, um die Oszillation auf dem dominierenden Übergang zu unterdrücken. Genau wie bei Nd3+:YVO4 können die Neo-
dymionen durch Intrabandpumpen bei 880 nm auch direkt aus dem Grundzustand in das obere Laserniveau angeregt werden; diese Variante hat den Vorteil eines besonders kleinen Quantendefekts. Die Hauptnachteile von Nd3+:YAG gegenüber Nd3+:YVO4 sind seine schmalere 4 F5∕2 -Absorptionsbande (die das Material empfindlicher gegenüber Variationen der Wellenlänge der Pump-Laserdiode macht), seine höhere Schwelle, sein geringerer Steigungswirkungsgrad und sein unpolarisiertes Licht. Ein großer Vorteil ist jedoch seine wesentlich größere thermische Belastbarkeit: bei geeigneter Auslegung können Nd3+:YAG-Laser Ausgangsleistungen von vielen Kilowatt erreichen. Nd3+:YAG bleibt daher trotz seiner Einschränkungen das Arbeitspferd unter den diodengepumpten Festkörperlasern. Beispiel 16-1: Leistungsumwandlungswirkungsgrad eines diodengepumpten Nd3+:YAG-Lasers
Ein stabförmiger Nd3+:YAG-Laser, der bei 1064 nm als Vierniveausystem betrieben wird, wird mit einem 1 cm langen wassergekühlten Laserdiodenarray aus 25 AlGaAs-Flächendioden gepumpt, die bei einer Wellenlänge von 808 nm emittieren. Jede Laserdiode emittiert eine Leistung von 4 W und ist in der eindimensionalen Anordnung 0.4 mm von ihrem Nachbarn entfernt. Das Array verbraucht eine elektrische Leistung von 200 W und liefert eine optische Leistung von 100 W, sodass sein Leistungsumwandlungswirkungsgrad 50 % beträgt. Gemäß dem in Gl. (15.46) angegebenen Ausdruck für den Quantendefekt q beträgt der Pumpwirkungsgrad 1 − q = 808∕1064 ≈ 76 %. Die Übertragung der Pumpstrahlung auf den Laserstab hat einschließlich der Absorption durch die Nd3+ -Ionen einen Wirkungsgrad von etwa 65 %. Die Modenanpassung und die Eingrenzung der optischen Energie im Resonator haben einen Wirkungsgrad von 60 %. Der Gesamt-Leistungsumwandlungswirkungsgrad 𝜂U des elektrisch betriebenen Nd3+:YAG-Lasers beträgt daher gerade einmal 15 %. Das Pumpen dieses Lasers mit einem Stab aus Laserdioden mit einer elektrischen Leistung von 200 W liefert eine optische Ausgangsleistung von 30 W bei 1064 nm. Die Ausgangsleistung kann durch Pumpen mit mehreren Laserdiodenstäben erhöht werden. Sowohl CW- als auch gepulste Nd3+:YAGLaser sind in Produktion, Materialbearbeitung und Medizin weit verbreitet und haben unzählige weitere Anwendungen, z. B. in der Entfernungsmessung.
503
16 Laser
Ytterbiumdotierter Yttriumaluminiumgranat
Yb3+:YAG-Scheibenlaser werden nach einem QuasiDreiniveauschema von einer Laserdiode bei 940 nm gepumpt (Abb. 16.24). Um eine effiziente Absorption des Pumplichts zu erreichen, wird es mithilfe eines optischen Systems mehrmals durch das aktive Medium geleitet. Für einen großen Gewinn werden hohe Yb3+ -Dotierkonzentrationen verwendet. Da die (meist von einem Array von InGaAs-Laserdioden stammende) Pumpwellenlänge 𝜆0 = 940 nm nahe bei der Laserwellenlänge 𝜆0 = 1030 nm liegt, ist der Quantendefekt klein, sodass im Kristall nur wenig Wärme erzeugt wird. Außerdem erlaubt der Aufbau aus einer dünnen Scheibe eine wirksame Kühlung, indem die ganze Anordnung auf Kühlelemente montiert wird; dadurch kann die TEM00 -Mode aktiv betrieben werden. Scheibenlaser können im Einmodenbetrieb einige hundert Watt kontinuierlicher optischer Leistung bei 1.030 μm erzeugen; im Vielmodenbetrieb sogar viele Kilowatt. Nach Frequenzverdopplung erhält man eine starke Quelle von grünem Licht bei 515 nm, die inzwischen in vielen Anwendungen die schwieriger zu handhabenden Argonionenlaser ersetzt hat. Ytterbiumionen werden auch in Wirtsmedien wie Yttriumvanadat sowie in verschiedenen Doppelwolframaten, Boraten, Sesquioxiden und Gläsern häufig als Dotierung verwendet. Insbesondere ytterbiumdotierte Doppelwolframate wie Yb3+:KYW und Yb3+:KGW werden sehr effizient durch Intrabandpumpen bei 981 nm (anstatt bei 940 nm) betrieben, wodurch der Quantende-
fekt q und damit die Wärmeabgabe verringert werden. Darüber hinaus sind diese Wirtsmedien aufgrund ihrer großen Übergangslinienbreiten und guten thermischen Eigenschaften ideal für die Verwendung in modengekoppelten Scheibenlasern geeignet, die mittlere Leistungen von mehr als 100 W und Pulsdauern unterhalb von 100 fs erzeugen können. Scheibenlaser können aber auch auf der Grundlage von Nd3+:YVO4 und Nd3+:YAG hergestellt werden. Titandotierter Saphir
Der Ti3+:Saphir-Laser wird oft verwendet, weil er über einen weiten Bereich von Wellenlängen abstimmbar ist. Ein weiterer Vorteil ist, dass er modengekoppelt werden kann, um ultrakurze Pulse zu liefern (siehe Abschnitt 16.4.4). Die relevanten Energieniveaus dieses Vierniveausystems sind in Abb. 16.25(a) dargestellt. Während des Kristallwachstums wird ein kleiner Bruchteil (≈ 1 %) der Al3+ -Ionen in Saphir durch Ti3+ Ionen ersetzt. Ähnlich wie beim Rubin besteht das Material hauptsächlich aus Saphir und hat daher einen Brechungsindex 𝑛 ≈ 1.76. Gepumpt wird dieser Laser gewöhnlich optisch durch einen frequenzverdoppelten Nd3+:YVO4 - oder Nd3+:YAG-Laser bei 532 nm (siehe Abb. 16.23) oder durch einen frequenzverdoppelten Yb3+:YAG-Laser bei 515 nm (siehe Abb. 16.24). Alternativ kann er auch direkt mit einer grünen Laserdiode gepumpt werden. Die Titanionen, die ein einzelnes aktives 3d-Elektron besitzen (siehe Tabelle 14.1), sind von sechs Sauerstoff-
2.0
Yb3+:YAG
1.5
τ 32 Energie / eV
504
3
2F 5/2
Pumpen
2
Laserübergang 1.030 µm
Pump-Laserdiode
1.0
Spiegel Wärmesenke
0.5
Reflektor 2F 7/2
1
Yb3+:YAGScheibe
0
(a)
Abb. 16.24 (a) Die Energieniveaus des Laserübergangs eines ytterbiumdotierten YAG-Lasers bei 𝜆0 = 1.030 μ m. Yb3+:YAG verhält sich bei T = 300 K wie ein Quasi-Dreiniveausystem, nach Abkühlung auf T = 77 K dagegen wie ein Vierniveausystem. (b) Schema eines Yb3+:YAG-Einfrequenz-EinmodenScheibenlasers. Das aktive Medium hat typischerweise eine
(b)
Dicke von einigen 100 μ m. Das Pumplicht wird durch ein optisches System aus einem Parabolspiegel und einem Reflektor etwa 20 mal durch das aktive Medium geführt. Zur Erreichung eines großen Gewinns werden Yb3+ -Dotierkonzentrationen von ≈ 25 % verwendet.
16.3 Bauarten von Lasern
atomen in einer oktaedrischen Anordnung umgeben. Die Ionen spüren daher deutliche Kristallfeld- und Orbitalwechselwirkungen. Wie bei anderen Übergangsmetallionen in dielektrischen Wirtsgitter werden die in Abb. 16.25 gezeigten Energieniveaus des titandotierten Saphirs durch gruppentheoretische anstelle von Termsymbolen bezeichnet (siehe Abschnitt 14.1.4). Außerdem koppeln die elektronischen Energieniveaus stark mit den Gitterschwingungen, was zu breiten Bändern von vibronischen Zuständen führt. Die induzierte Emission wird daher von der gleichzeitigen Emission eines oder mehrerer Phononen begleitet. Die Besetzung des 2 T2 -Bands folgt einer Boltzmannverteilung, sodass seine oberen Bereiche mehr oder weniger unbesetzt sind und sich das System wie in Abb. 16.25(a) gezeigt wie ein Vierniveaulaser verhält. Der in Abb. 16.25(a) durch einen senkrechten Pfeil gekennzeichnete Laserübergang kann mithilfe eines drehbaren doppelbrechenden Filters, das innerhalb des Resonators im Brewsterwinkel angebracht ist und als Bandfilter für den polarisierten Strahl wirkt, über einige zehn Nanometer abgestimmt werden [Abb. 16.25(b)]. Größere Änderungen der Wellenlänge können durch Anpassung der internen Optik erreicht werden, da die Gruppengeschwindigkeitsdispersion im Resonator von der Wellenlänge abhängt. Insgesamt ist ein breiter Bereich von Wellenlängen von 700 nm im Roten bis 1050 nm im nahen Infrarot zugänglich. Der Ti3+:Al2 O3 Laser kann im Dauerstrichbetrieb eine optische Leis-
Ti3+: Al2O3 (Ti : Saphir)
tung von ≈ 5 W und im modengekoppelten Betrieb Pulse von 10 fs Dauer und einer Energie von 50 nJ mit einer Wiederholungsgeschwindigkeit von ≈ 80 MHz und Leistungsspitzen von ≈ 5 MW erzeugen. Seine Anwendungen reichen von der Multiphotonen-Bildgebung bis zur nichtlinearen Optik und der Petawattphysik. Wegen der Bedeutung von Gitterschwingungen für die Abstimmbarkeit dieses Lasers wird titandotierter Saphir als phononenbegrenzter oder vibronischer Laser bezeichnet. Allgemeinen bezeichnet ein vibronischer Übergang eine gleichzeitige Änderung der elektronischen und Schwingungszustände eines Systems. Zu dieser Klasse gehören auch der chromdotierte Forsteritund der Alexandritlaser (siehe Abb. 14.4) sowie die Farbstofflaser (siehe Abschnitt 16.3.4), in denen Molekülschwingungen die Rolle der Gitterschwingungen übernehmen. Übergangsmetallionendotierte Zinkchalkogenide
Eine Familie vibronischer Laser mit kontinuierlicher Abstimmbarkeit, ähnlich dem Ti:Saphir-Laser, aber im mittleren Infrarot, beruht auf mit Übergangsmetallionen dotierten keramischen Zinkchalkogenidmaterialien. Zu den am häufigsten anzutreffenden Mitgliedern dieser Familie gehören Cr2+:ZnS und Cr2+:ZnSe. Sowohl ZnS als auch ZnSe sind II-VI-Halbleiter mit großer Bandlücke (Abb. 17.16), die leicht mit Cr2+ -Ionen dotiert werden können, die einen Teil der Zn2+-Ionen im Kristallgitter ersetzen. (Diese substituierende Dotierung ist zu un-
3.0 2.5
Energie / eV
2E
τ32
3
2
2.0
abstimmbarer 1.5 Laserübergang Pumpen 1 τ1
0
Pumpe
Ti:Saphir p
1.0 Pulskompressor 0.5 BRF
2T 2
0 (a)
Abb. 16.25 (a) Ausgewählte Energiebänder von Ti3+:Al2 O3 . Der senkrechte Pfeil bezeichnet den Haupt-Laserübergang dieses vibronischen Systems, das zwischen 700 und 1050 nm abstimmbar ist. Die Schattierung in den Bändern zeigt von dunkel nach hell eine Abnahme der Besetzungsdichte an. (b) Schema eines modengekoppelten Ti3+:Al2 O3 Lasers. Die beiden Prismen innerhalb des gestrichelten Kastens bewirken eine Dispersionskompensation innerhalb des
Ausgang
(b)
Resonators. Eine Abstimmung der Wellenlänge über einige zehn Nanometer wird durch ein drehbares doppelbrechendes Filter (BRF) erreicht, das als Bandfilter für den polarisierten Strahl im Resonator wirkt; eine Abstimmung über einen größeren Bereich ist durch Justierung eines der Prismen möglich. Das grüne Pumplicht wird häufig durch einen frequenzverdoppelten Nd3+:YVO4 -Laser wie den in Abb. 16.23 gezeigten erzeugt.
505
506
16 Laser
terscheiden von der Dotierung mit Ionen andere Wertigkeit, um p- oder n-Halbleiter zu erzeugen.) Die so entstehenden Vierniveau-Festkörperlaser ermöglichen einen linear polarisierten Einmoden-CW-Betrieb auf dem Übergang 5 E → 2 T2 mit P A ≈ 100 W, 𝕄2 ≤ 1.1, einer Linienbreite < 1∕2 nm und 𝜂𝑈 ≈ 25 %. Mit einem externen Resonator können sie über einen Wellenlängenbereich von 1.9 bis 3.0 μm abgestimmt werden. Sie können wie üblich mit einem Laserdiodenarray gepumpt werden, allerdings bieten Er3+:Quarzglasfasern in diesem Wellenlängenbereich eine höhere optische Leistung. Ähnlich wie der Ti3+:Saphir-Laser kann ein modengekoppelter Cr2+:ZnS-Laser eine Folge von 50-nJ-Pulsen mit einer Pulsdauer von 30 fs und einer Wiederholungsrate zwischen 80 MHz und 1 GHz mit P max ≈ 1.7 MW und P A ≈ 5 W liefern. Zu dieser Familie von Materialien gehören auch Fe2+:ZnS und Fe2+:ZnSe, die über einen Wellenlängenbereich von 3.8 bis 4.8 μm abgestimmt werden können. Diese längerwelligen Laser bieten einen linear polarisierten Einmoden-CW-Betrieb mit P A ≈ 100 mW, 𝕄 ≤ 1.2 und Linienbreiten < 1 nm. Beim gegenwärtigen Stand ihrer Entwicklung erfordern die eisendotierten Bauelemente im CW-Betrieb jedoch eine Kühlung. Für effizientes Pumpen sorgt ein Tm3+:Quarzglas-Faserlaser. Obwohl mit Übergangsmetallionen dotierte Zinkchalkogenidlaser im mittleren IR nur einen begrenzten Bereich abdecken, haben sie den Vorteil, dass sie kontinuierlich abstimmbar sind. Andere häufig verwendete Strahlungsquellen für das mittlere Infrarot werden in Abschnitt 18.4.4 besprochen.
16.3.2
Faserlaser
Mit einer geeigneten Rückkopplung können seltenerddotierte Fasern vom Sichtbaren bis ins mittlere Infrarot als hocheffiziente Faserlaser betrieben werden. Die am häufigsten verwendeten Dotierionen für Faserlaser sind Neodym (Nd3+ ), Ytterbium (Yb3+ ), Erbium (Er3+ ) und Thulium (Tm3+ ). Sie bieten zahlreiche Laserübergänge bei Wellenlängen um 1.06, 1.07, 1.55 und 2.00 μm im nahen Infrarot (sowie vielen weiteren Wellenlängen). Als Wirtsmedien werden im Allgemeinen Quarzglasfasern bevorzugt, weil ihre optischen und mechanischen Eigenschaften denen der meisten anderen Glasfasern überlegen sind. Allerdings nimmt die Transparenz von Quarzglas bei Wellenlängen jenseits von etwa 2.2 μm merklich ab, sodass auch Fasern aus Fluoriden und anderen Gläsern verwendet werden (Abschnitt 10.5). Die Energieniveaus der Laserübergänge von Seltenerdionen werden in erster Näherung nur wenig durch das Wirtsmaterial beeinflusst, wie Abschnitt 14.1.2 erläu-
tert. Daher sind die Energieniveaudiagramme für Nd3+ -, Yb3+ - und Er3+ -Ionen in Quarzfasern kaum von den in Abb. 14.5, 16.24 und 15.20 dargestellten zu unterscheiden. Faserlaser werden genau wie diodengepumpte Festkörperlaser normalerweise mit Laserdiodenarrays gepumpt, obwohl gelegentlich auch andere Faserlaser verwendet werden. Der erste Faserlaser, den Elias Snitzer 1961 vorstellte (ein Jahr nachdem Maiman den Rubinlaser präsentiert hatte), verwendete einen Kern aus neodymdotiertem Glas. Faserlaser bieten zahlreiche nützliche Eigenschaften, beispielsweise • eine hohe optische Leistung (das große Verhältnis von Fläche zu Volumen erleichtert die Kühlung), • ein hoher Leistungsumwandlungswirkungsgrad, • beugungsbegrenzte Strahlen, • Stabilität gegen Temperaturschwankungen und Vibrationen, • eine kompakte, robuste und wartungsfreie Konstruktion, • die Möglichkeit, auf Übergängen mit geringer Verstärkung betrieben zu werden (da der Bereich der Verstärkung nahezu beliebig lang gemacht werden kann). Ein vereinfachtes Schema, das die Verwendung von Dioden-Pumplasern und Faser-Braggreflektoren illustriert, ist in Abb. 16.26(a) gezeigt. FBG haben den Vorteil, dass sie robust sind und keine Neuausrichtung erfordern. Eine doppelwandige Ausführung der Faser ermöglicht die Ausbreitung der Lasermode im inneren Kern, während gleichzeitig der Vielmoden-Pumpstrahl im inneren Mantel bzw. äußeren Kern zirkuliert. Diese Anordnung wird häufig genutzt, um die zerstörerischen nichtlinearen Effekte zu vermeiden, die mit der Konzentration einer großen Pumpleistung in einem kleinen Faserkern einhergehen. Faserlaser werden in vielen Ausführungen betrieben und können auf unterschiedliche Arten sowohl axial als auch radial gepumpt werden. Plattenwellenleiter-Faserlaser, auch als BandFaserlaser bekannt, haben einen rechteckigen Querschnitt und können wesentlich größere Ausgangsleistungen liefern als herkömmliche Fasern. Faserlaser mit photonischer Bandlücke können so eingestellt werden, dass das Licht nicht axial, sondern radial aus der gesamten Umfangsfläche der Faser austritt. Masteroszillator-Leistungsverstärker (MOPA)
Ein Masteroszillator-Leistungsverstärker (MOPA) ist eine Anordnung aus einem Masteroszillator (Seedlaser) und einem optischen Verstärker zur Leistungs-
16.3 Bauarten von Lasern
Gewinnfaser
(a) Faser-Bragggitter
äußerer Mantel (b)
innerer Mantel/ äußerer Kern
Faser-Bragggitter
n3 n2 n1
innerer Kern
Abb. 16.26 (a) Vereinfachtes Schema eines mit einer Laserdiode gepumpten Faserlasers mit Bragggittern als Reflektoren. Zum Pumpen kommen häufig zahlreiche großflächige Vielmoden-Laserdioden zum Einsatz, deren Licht über Vielmodenkoppler in Vorwärts- und Rückwärtsrichtung in den Außenkern der Faser eingekoppelt wird. Ein innerer Einmodenkern erlaubt die Oszillation einer einzigen transversalen Mode. Der Betrieb von Faserlasern ist in vielen Anordnungen
möglich. (b) Konzentrischer doppelwandiger Aufbau einer Faser. Andere doppelwandige Anordnungen sind so konstruiert, dass sie eine vergrößerte Überlappung zwischen dem inneren Kern und schiefen Strahlen im Außenkern ergeben (siehe Abb. 10.4). Zum Beispiel kann der innere Kern aus der Faserachse verschoben sein (zum Rand des Außenkerns) oder der Außenkern kann rechteckig, sechs- oder achteckig oder sogar D-förmig sein.
steigerung. MOPA können aus verschiedenen Kombinationen von Faser-, diodengepumpten Festkörper- und Halbleiterlasern bzw. -verstärkern bestehen. Wenn als Leistungsverstärker ein Faserverstärker verwendet wird, wird ein MOPA auch als Masteroszillator-Faserverstärker (MOFA) bezeichnet. Die Realisierung eines MOPA ist zwar komplexer als die direkte Erzeugung einer bestimmten Ausgangsleistung mit einem einzelnen Hochleistungslaser, der MOPA-Ansatz bietet jedoch eine Reihe von Vorteilen. Diese resultieren aus der relativ einfachen Steuerung eines Seedlasers mit geringer Leistung, in den wegen der relativ geringen Leistung im Resonator problemlos Elemente wie Filter und Modulatoren eingesetzt werden können. Alternativ können solche Bauelemente auch zwischen Oszillator und Verstärker platziert werden. Dies erleichtert wiederum die Optimierung der Ausgangsparameter wie Abstimmbereich der Wellenlänge, Laserlinienbreite, Strahlqualität und Pulsdauer. Darüber hinaus muss der Leistungsverstärker des MOPA nur die begrenzte Ausgangsleistung des Seedlasers verarbeiten und nicht der große optische Leistung im Resonator. Ein weiterer Vorteil der MOPA-Anordnung ist ihre Modularität, die eine Art Schablone für den Aufbau kaskadierter Verstärkerstufen mit immer größeren Kapazitäten wie z. B. Modenfläche und optische Leistung bietet. Ein gutes Beispiel hierfür ist der MOPA der National Ignition Facility (NIF), das in Abschnitt 15.3.2 beschrieben wurde. Dort dient aufgrund seiner Stabilität und der hohen Strahlqualität ein diodengepumpter Yb3+ -dotierter Faserlaser als Masteroszillator. Der von ihm erzeugte 1-nJ-, 5-ns-Puls wird auf 192 Hauptstrahllinien aufgeteilt, in denen Kaskaden aus Nd3+ -dotierten Leistungs-
verstärkern die Pulsenergie in jeder Strahllinie auf 20 kJ erhöhen. Neben der erhöhten Komplexität haben MOPA jedoch noch einige weitere Nachteile. Dazu gehören die Möglichkeit einer Rückkopplung aus dem Verstärker in den Oszillator sowie ein erhöhtes Rauschen aufgrund von verstärkter spontaner Emission (ASE). Diese Effekte können jedoch häufig durch die Verwendung optischer Isolatoren bzw. durch den Betrieb bei Sättigung reduziert werden. Ytterbiumdotierte Quarzglas-Faserlaser
Ytterbiumdotierte Quarzglas-Faserlaser bieten hervorragende Leistungen. Sie werden als Quasi-Dreiniveausysteme auf dem Übergang 2 F5∕2 → 2 F7∕2 betrieben (Abb. 16.24). Doppelt ummantelte Yb3+:Quarzglas-Faserlaser, die von InGaAs-Laserdiodenarrays bei 𝜆0 = 940 nm gepumpt werden, erzeugen Licht im Bereich 1020–1200 nm. Bei sehr geringen Leistungen (P 𝐴 < 1 W) ermöglicht die Verwendung von kurzen (wenige cm langen) Fasern einen linear polarisierten Einzelmodenbetrieb auf der longitudinalen oder der transversalen Mode mit Linienbreiten im kHz-Bereich. Die Breite der Laserlinien nimmt mit zunehmender Ausgangsleistung zu und erreicht bei 100 W Werte um 100 kHz. Nicht zu lange Einzelfasern können Ausgangsleistungen von mehreren kW in Form von nahezu beugungsbegrenzten Einmodenstrahlen liefern (𝕄2 ≈ 1.1). Der Quantendefekt von 9 % führt zu großen Leistungsumwandlungswirkungsgraden von 40 %. Die Laser können auch gütemoduliert oder modengekoppelt mit hohen mittleren Leistungen betrieben werden (siehe Abschnitt 16.4.4, Beispiel 16-14).
507
508
16 Laser
Tandempumpen
Eine effektive Methode, um die Leistung eines Faserlasers über den Kilowattbereich hinaus zu erhöhen, ist das Tandempumpen. Bei dieser Methode wird das Ausgangssignal eines oder mehrerer Doppelmantel-Faserlaser als Pumpsignal in einen weiteren Faserlaser oder Faserverstärker geführt. Beim Intrabandpumpen kann die Wellenlänge des Pumplasers sehr nahe bei der der gepumpten Faser liegen, was zu einem kleinen Quantendefekt führt. Zusammen mit der geringen Divergenz (großen Helligkeit) des Faser-Pumplasers verringert dies die Erwärmung und erhöht den Gesamtwirkungsgrad. Unter dem Strich wird so ein Hochleistungsbetrieb bei verkürzter Länge der gepumpter Faser möglich, was gleichzeitig mit einer Verringerung der Nichtlinearität der Faser einhergeht. Beispiel 16-2: Tandemgepumpter CW-HochleistungsYb3+:Quarzglas-MOFA
Als Beispiel für das Tandempumpen soll ein einstufiger MOFA in Form eines 15 m langen Yb3+:Quarzglas-Faserleistungsverstärkers hinter einem Yb3+:QuarzglasFaser-Masteroszillator mit einer Leistung von 1 kW dienen. Durch Intrabandpumpen in Vorwärts- und Rückwärtsrichtung mit einer Leistung von 13 kW aus Yb3+:Quarzglas-Faserlasern bei 1018 nm erzeugt dieses System eine optische Leistung von 10 kW bei 1070 nm in Form eines nahezu beugungsbegrenzten Einmodenstrahls. Die Leistung kann problemlos auf bis zu 20 kW im Dauerstrichbetrieb skaliert werden und eine kohärente Strahlkombination kann die Leistung in einer einzelnen Mode weiter auf über 30 kW CW steigern. Inkohärente Strahlkombination liefert im Vielmodenbetrieb mehr als 100 kW Dauerleistung mit 𝕄2 ≈ 50. Anwendungen
Aufgrund ihrer vielen nützlichen Eigenschaften sind ytterbiumdotierte Faserlaser und MOFA mit ganz unterschiedlichen Ausgangsleistungen im Handel erhältlich und werden in einer Vielzahl von wissenschaftlichen und industriellen Einrichtungen angewendet. Bei kleinen Leistungen (P 𝐴 ≈ 1−100 W) werden sie in der Holographie, Interferometrie, Metrologie, Spektroskopie, Sensorik, für 3D-Lidar und zur optischen Speicherung verwendet. Mittlere Leistungen (P𝐴 ≈ 0.1−1 kW) finden beim Präzisionsschneiden, Mikrobohren, in der Materialbearbeitung im Mikro-/Nanomaßstab und in der additiven Fertigung (3D-Druck) Verwendung. Bei hohen Leistungen schließlich (P 𝐴 ≈ 1−20 kW) zeichnen sich ytterbiumdotierte Faserlaser durch hervorragende Eigenschaften bei der Materialbearbeitung und beim
Schneiden von hochreflektierenden Metallen aus, während sie bei extrem hohen Leistungen (PA > 20 kW) beim Schweißen, Bohren, Präzisionsschneiden, Tempern und Hartlöten von unschätzbarem Wert sind. Hochleistungsfaserlaser und MOFA werden auch als Energiewaffen (DEW, von engl. directed-energy weapon) eingesetzt. In diesem Kontext sind sie anderen Lasertypen (z. B. chemischen Lasern, Festkörperlasern und Freie-Elektronen-Lasern) aufgrund ihrer hohen Leistung, hohen Effizienz, guten Strahlqualität, Kompaktheit und Unempfindlichkeit gegen Vibrationen und Temperaturschwankungen überlegen. Die Wirksamkeit von Yb3+:Quarzglas-Faserlasern für solche Anwendungen wird durch das Laser Weapon System (LaWS) der US-Marine demonstriert. Es besteht aus sechs 5.5-kWFaserlasern, deren Leistungen inkohärent zu einem einzigen 33-kW-Strahl kombiniert und über einen Strahlrichter übertragen werden; eine verbesserte Version liefert sogar einen 150-kW-Strahl. Erbiumdotierte Quarzglas-Faserlaser
Erbiumdotierte Quarzglas-Faserlaser verdanken ihre Bedeutung ihren Vorläufern, den erbiumdotierten Quarzglas-Faserverstärkern, die in faseroptischen Kommunikationssystemen weit verbreitet sind (vgl. Abschnitt 15.3.3 und 25.1.3). Die Laserfrequenzen von Er3+:Quarzglas-Faserlasern, die mit InGaAs-Laserdiodenarrays mit gespannter Schicht bei 𝜆0 = 980 nm gepumpt werden, liegen im Bereich der C- und L-Telekommunikationsbänder. Die Fasern werden häufig mit Ytterbium codotiert, um ihre Effizienz zu erhöhen und die Faserlänge zu verringern. Aufgrund seines großen Querschnitts und seiner hohen Dotierungsdichte absorbiert Yb3+ die Pumpstrahlung der Laserdioden sehr effizient und überträgt die Anregungsenergie anschließend auf die Er3+ -Ionen. Die Codotierung hilft außerdem, den Wellenlängenbereich zu erweitern und eine Clusterbildung der Erbiumionen zu verhindern. Besonders enge Linienbreiten (≈ 1 kHz) werden erreicht, wenn erbiumdotierte Quarzglas-Faserlaser bei niedrigen Leistungspegeln (P 𝐴 ≈ 10−1000 mW) betrieben werden. Bei mäßigen Leistungen (PA < 10 W) ist ein linear polarisierter, beugungsbegrenzter (𝕄2 < 1.1) Betrieb auf einer einzigen Frequenz (Halbwertsbreite der Laserlinien ≈ 50 kHz) mit Leistungsumwandlungswirkungsgraden 𝜂U ≈ 10 % im Wellenlängenbereich von 1530 bis 1625 nm möglich. Vielmodenbetrieb (𝕄2 ≈ 10) eines erbiumdotierten MOFA bei etwa 1567 nm (Halbwertsbreite der Linien ≈ 400 GHz) ermöglicht wesentlich höhere Ausgangsleistungen (P 𝐴 ≈ 2−5 kW) bei höheren Wirkungsgraden (𝜂U ≈ 20 %). Modengekoppelter Betrieb bei 1550 nm liefert Pulse mit einer Energie
16.3 Bauarten von Lasern
von 5 μJ und einer Dauer von 500 fs bei Wiederholungsraten von bis zu 2 MHz mit Peakleistungen von ≈ 10 MW, einer mittleren Leistung von ≈ 10 W und 𝕄2 ≈ 1.4. Diese Geräte finden Anwendung in den Bereichen Telekommunikation, Messtechnik, Sensorik, Polymerschweißen, Schneiden von Nichtmetallen und verlustarme Energieübertragung. Die Ausgangsleistung von Er3+:Quarzglas-Faserlasern ist im Vergleich zu der der Yb3+:Quarzglas-Faserlaser begrenzt, was teilweise auf den Unterschied im Quantendefekt q zurückzuführen ist [siehe Gl. (15.46)]. Er ist bei Erbium mit 37 % sehr viel größer als bei Ytterbium mit 9 %. Zwar kann der Quantendefekt für Erbium durch Intrabandpumpen bei 1480 nm (anstelle von Quasi-Dreiniveaupumpen bei 980 nm) auf 5 % reduziert werden, damit gehen jedoch auch Nachteile einher. Thuliumdotierte Quarzglas-Faserlaser
Thuliumdotierte Quarzglas-Faserlaser arbeiten bei noch größeren Wellenlängen, im Bereich von 1.8 bis 2.1 μm, als Quasi-Dreiniveausysteme auf dem Übergang 3 F4 → 3 H6 . Doppelt ummantelte Tm3+:Quarzglas-Faserlaser und von AlGaAs-Laserdiodenarrays bei 𝜆0 = 793 nm gepumpte MOFA können im Dauerstrichbetrieb Ausgangsleistungen von mehr als 500 W in Form von nahezu beugungsbegrenzten (𝕄2 ≈ 1.1) Einmodenstrahlen (Halbwertsbreite der Laserlinien ≈ 75 GHz) erzeugen; bei Leistungen < 200 W sind auch linear polarisierte Strahlen möglich. Die Ausgangsleistung kann durch kohärente Strahlkombination vergrößert werden. Vielmodenbetrieb erlaubt optische Leistungen von > 1 kW im Dauerstrichbetrieb. Ein abstimmbarer gepulster Betrieb im Wellenlängenbereich von 1900–2050 nm kann 1-mJ-Pulse mit einer Dauer von 1 ns bei Wiederholungsraten von bis zu 50 kHz mit Peakleistungen von 1 MW sowie mittleren Leistungen von 20 W mit 𝕄2 ≈ 1.1 liefern. Kreuzrelaxation, die in diesem Fall ein willkommener Effekt ist, führt zur Erzeugung von zwei Tm3+ -Ionen im oberen Laserniveau für jedes absorbierte Pumpphoton. Dies führt wiederum zu einem hohen Leistungsumwandlungswirkungsgrad 𝜂U ≈ 35 %, ungeachtet des großen Quantendefekts von 96 %. Da Licht mit einer Wellenlänge von ≈ 2 μm von Wasser und biologischem Weichgewebe stark absorbiert wird, eignen sich thuliumdotierte Faserlaser für Operationen und die Lithotripsie sowie zur Fernerkundung und zur Verarbeitung von im sichtbaren Bereich transparenten Kunststoffen.
Vergleich von Faserlasern und diodengepumpten Festkörperlasern
Der deutlichste Unterschied zwischen Faserlasern und diodengepumpten Festkörperlasern (Abschnitt 16.3.1) ist, dass Faserresonatoren einen starken lateralen Einschluss erzwingen und große Längen besitzen (Kapitel 10). Aufgrund dieses letzten Merkmals können sie selbst für Übergänge mit kleinen Gewinnkoeffizienten eine hohe optische Verstärkung liefern. Ein weiterer Unterschied besteht darin, dass die inhomogene Verbreiterung bei Glasfaser-Wirtsmedien im Allgemeinen zu größeren Linienbreiten führt als die homogene Verbreiterung bei kristallinen oder keramischen Medien. Beide Lasertypen bieten hohe Leistungen und für beide sind in der Zukunft noch erhebliche Fortschritte zu erwarten. Trotzdem ist es hilfreich, einige spezifische Unterschiede zwischen den beiden Arten von Lasern zum gegenwärtigen Zeitpunkt ihrer Entwicklung hervorzuheben. Im Allgemeinen sind Faserlaser den diodengepumpten Festkörperlasern überlegen, weil sie • eine höhere Ausgangsleistung bieten (sowohl CW als auch gepulst), • einen höheren Leistungsumwandlungswirkungsgrad haben, • eine hervorragende Strahlqualität bieten, die auch bei höchsten Leistungen erhalten bleibt, • unempfindlich gegenüber Wärme und Vibrationen sind und • bei Übergängen mit geringem Gewinn eine überragende Leistung bieten. Auf der anderen Seite haben auch diodengepumpte Festkörperlaser eine Reihe von Pluspunkten gegenüber Faserlasern zu bieten, weil sie • kleinere Nichtlinearitäten besitzen (wegen ihrer geringeren Länge und größeren räumlichen Ausdehnung der aktiven Region), • weniger induzierte Raman- und Brillouinstreuung mit sich bringen, • in Verbindung mit vibronischen Lasern (z. B. Ti3+ : Saphir) breit abstimmbare Wellenlängen besitzen und • die Möglichkeit bieten, Pumpquellen mit schlechter Strahlqualität zu verwenden.
509
510
16 Laser
16.3.3
Raman-Faserlaser
Raman-Faserlaser arbeiten auf der Grundlage der induzierten Ramanstreuung, eines Prozesses, den wir zuerst in Abschnitt 14.5.3 betrachtet und im Zusammenhang mit Raman-Faserverstärkern in Abschnitt 15.3.4 genauer untersucht hatten. Die induzierte Ramanstreuung ist in Abb. 15.21 illustriert: Ein Signalphoton der Energie ℎ𝜈S induziert die Emission einer Kopie seiner selbst, die durch Stokesverschiebung des Pumpphotons um die Raman-Schwingungsenergie ℎ𝜈R erhalten wird, sodass die Energie der Kopie genau der Energie des anfänglichen Signalphotons entspricht. Der optische Gewinn eines Raman-Faserlasers wird durch den Raman-Gewinnkoeffizienten 𝛾R bestimmt [siehe Gl. (22.56)] und seine Bandbreite ist durch das Schwingungsspektrum des Wirtsmediums bestimmt (siehe Abschnitt 15.3.4 und Abb. 15.21). Genau wie ein seltenerddotierter Faserverstärker durch Einführung einer optischen Rückkopplung zu einem Faserlaser wird, wie Abb. 16.26 zeigt, wird auch ein Raman-Faserverstärker durch Rückkopplung zu einem Raman-Faserlaser. Dabei dienen Faser-Bragggitter als Reflektoren und definieren den Resonator, wobei sie Oszillationen bei den Frequenzen erlauben, bei denen ihr Reflexionsgrad groß ist (siehe Abschnitt 7.1.3). Auch Resonatoren mit verteilter Rückkopplung (DFB, engl. distributed-feedback Bragg grating) können eingesetzt werden (Abschnitt 18.3.3). Die Schwingungsfrequenz 𝜈 ist um die Stokesfrequenz 𝜈R gegenüber der Pumpfrequenz 𝜈P verschoben, die jeden Wert innerhalb des Schwingungsspektrums des Glaswirts annehmen kann, wie Abb. 15.21 zeigt. Obwohl Ramanlaser schon früh entwickelt wurden, brachte ihnen aus meh-
(a)
hνp1
hνp hνR
hνR
hνp2
reren Gründen erst die Umsetzung als Faserlaser den Durchbruch: (1) Fasern ermöglichen große Längen und daher große Verstärkungen, (2) Fasern erlauben große Intensitäten in einem Einmodenkern, (3) Fasern lassen sich durch diodengepumpte Festkörperlaser effizient pumpen und (4) Fasern können ohne Schwierigkeiten mehrere Faser-Bragggitter aufnehmen. Wichtig ist, dass die Ramanlaser auf der Ramanverstärkung beruhen und nicht auf einer Besetzungsinversion und einer induzierten Emission und sich daher in wesentlichen Punkten von normalen Lasern unterscheiden. Kaskadierte Raman-Faserlaser
Eine charakteristische Eigenschaft der Raman-Wechselwirkung ist, dass die Stokesverschiebung nicht von der Pumpfrequenz abhängt. Aus diesem Grund kann die stokesverschobene Oszillationsfrequenz des Raman-Faserlasers, die von einem Resonator aus einem speziellen Paar FBG1 von Faser-Bragggittern erzeugt wird, selbst wieder dazu dienen, dieselbe Faser zu pumpen. Wie Abb. 16.27(a) zeigt, kann diese zweite Pumpe mit der reduzierten Frequenz 𝜈P1 = 𝜈P − 𝜈R dann eine stokesverschobene Schwingung zweiter Ordnung hervorrufen, die bei der Frequenz des maximalen Reflexionsgrads 𝜈P2 eines zweiten Paars FBG2 von Faser-Bragggittern liegt. Diese Kaskade kann durch Verwendung verschachtelter Paare von Bragggittern fortgesetzt werden, bis schließlich Licht der gewünschten Frequenz aus der Faser ausgekoppelt wird. Raman-Faserlaser, die auf vielfachen Stokesverschiebungen beruhen, werden als kaskadierte Raman-Faserlaser bezeichnet. Sie können einen sehr breiten Bereich von Wellenlängen liefern.
hν
hνR DoppelmantelYb3+:Quarz-Faser
Phosphosilikatfaser
(b) FBG
FBG
1064 100%
1064 20%
Pumplaser
νp
FBG1 FBG 2
FBG2 FBG1
1239 1484 100% 100%
1484 1239 50% 100%
ν
Raman-Wellenlängenschieber
Abb. 16.27 (a) Eine Kaskade von Stokesverschiebungen. (b) Schematische Darstellung eines Phosphosilikat-RamanFaserlasers. Der doppelwandige Yb3+:Quarzfaser-Pumplaser wird von einem Laserdiodenarray gepumpt. Die Zahlen unter den Bragggittern bezeichnen die Leistungsreflexionsgrade bei den angegebenen Wellenlängen (im nm).
16.3 Bauarten von Lasern
Beispiel 16-3: Phosphosilikat-Raman-Faserlaser
Ein Raman-Faserlaser kann konstruiert werden, indem man einen Faserlaser aus einer doppelwandigen ytterbiumdotierten Faser, der im Bereich 1050– 1120 nm emittiert, als Pumpe für einen 1 km langen Wellenlängenschieber aus einer Phosphosilikatfaser verwendet, wie Abb. 16.27(b) zeigt. Der Yb3+:Quarzfaser-Pumplaser, der selbst von einem Laserdiodenarray in der Umgebung von 960 nm gepumpt wird, emittiert Einmodenlicht, das mit einem weitaus größeren Wirkungsgrad in den Einmoden-Raman-Wellenlängenschieber eingekoppelt werden kann als dies für das Vielmodenlicht eines Laserdiodenarrays möglich wäre. Nehmen sie zum Beispiel an, dass wir das Pumplicht eines Ytterbiumlasers bei 1064 nm in eine größere Wellenlänge umwandeln wollen, z. B. 1484 nm, damit der Raman-Faserlaser geeignet ist, um einen RamanFaserverstärker zu pumpen (siehe Abschnitt 15.3.4). Da wir die Wellenlänge über einen ziemlich großen Bereich von 80 THz verschieben möchten, verwenden wir eine Phosphosilikatfaser mit einer großen Stokesverschiebung 𝜈R ≈ 40 THz, die die Konversion mit nur zwei Stokesordnungen ermöglicht. Alternativ könnten wir auch eine germaniumdotierte Quarzfaser benutzen, aber das würde sechs Stokesordnungen erfordern, da die Stokesverschiebung für dieses Material viel kleiner ist, 𝜈R ≈ 13 THz, wie in Abb. 15.21 dargestellt. Wie Abb. 16.27(b) zeigt, wird ein erstes Paar FBG1 von Faser-Bragggittern verwendet, um das Pumplicht von 1064 nm um 40 THz zu einer niedrigeren Frequenz von 1239 nm zu verschieben, woraufhin ein zweites Paar FBG2 das Licht um weitere 40 THz auf die gewünschte Wellenlänge von 1484 nm verschiebt. Das Paar FBG1 hat Reflexionsgrade von 100 %, wohingegen der Reflexionsgrad eines Gitters des FGB2-Paars auf 50 % reduziert ist, damit das Licht bei 1484 nm aus dem RamanFaserlaser ausgekoppelt werden kann. Ein kompakter Raman-Faserlaser wie der in Abb. 16.27(b) gezeigte kann bei jeder gewünschten Wellenlänge im Bereich 1200–1700 nm einige zehn Watt kontinuierlicher optischer Leistung mit einer Bandbreite von ≈2 nm liefern. Die Leistungsumwandlungswirkungsgrade des ytterbiumdotierten Pump-Faserlasers und der Kombination Pumplaser/Raman-Wellenlängenschieber betragen etwa 40 % bzw. 10 %. Die von Ramanlasern erreichbaren optischen Leistungen können durch Verwendung neuartiger Anordnungen wie z. B. Seedlasern kombiniert mit Raman-Faserverstärkern auf Hunderte von Watt gesteigert werden. Optische Leistungen von mehreren kW werden möglich, wenn man eine gemischte Seltenerdmetall/Ra-
manverstärkung in Verbindung mit Yb3+ -dotierten Fasern verwendet. Raman-Faserlaser eignen sich für viele Anwendungen wie beispielsweise das Pumpen von Lasern, die faseroptische Kommunikation, die Erzeugung von Superkontinua, die Materialbearbeitung oder die klinische Medizin. Sie eignen sich besonders zum Pumpen von Raman-Faserverstärkern in Wellenlängenmultiplexsystemen und zum Fernpumpen von erbiumdotierten Faserverstärkern. Durch Verwendung von toroidalen Mikrokavitäten aus Quarzglas mit ultrahohen Gütefaktoren konnten hocheffiziente Einmoden-Dauerstrich-Ramanlaser mit extrem niedriger Laserschwelle hergestellt werden. Das hervorstechendste Merkmal von Raman-Faserlasern ist, dass durch geeignete Wahl der Pumpwellenlänge, des Fasermaterials und der FaserBragggitter Oszillation in einem breiten Wellenlängenbereich möglich sind. Analog kann auch induzierte Brillouinstreuung [Abb. 14.37(d)] zum Aufbau von Brillouin-Faserlasern verwendet werden. Die Brillouin-Frequenzverschiebung und -Bandbreite für Quarzglasfasern liegen im Bereich von 10 GHz bzw. 100 MHz – sie sind also um Größenordnungen kleiner als die für die Raman-Frequenzverschiebung und -Bandbreite in demselben Material. Beispiel 16-4: Silicium-Ramanlaser
Unter Verwendung von integrierten optischen Ringresonatoren auf Siliciumchips konnten niedrigschwellige CW-Silicium-Ramanlaser hergestellt werden, die bei Raumtemperatur arbeiten. Obwohl Si einen hohen Raman-Gewinnkoeffizienten besitzt, müssen die gravierenden Verluste, die mit der durch die Zweiphotonenabsorption induzierten Absorption freier Träger einhergehen, begrenzt werden, um eine hohe Verstärkung zu erzielen. Ein Si-Ramanlaser dieser Art wurde unter Verwendung eines 3 cm langen, rennbahnförmigen Ringresonators realisiert, der aus einem Siliciumauf-Isolator- (SOI-) Rippenwellenleiter [Abb. 9.25(d)] mit einer Rippenbreite von 1.5 μm bestand. 2) An der Außen- und Innenseite des Rippenwellenleiter-Resonators aus einem intrinsischen Halbleiter schmiegen sich rennbahnförmige Bereiche aus einem bn- bzw. p-Halbleiter an, die etwa 6 μm voneinander entfernt sind. Ein zwischen den dotierten Bereichen angelegtes Sperrfeld dient dazu, die durch Zweiphotonenabsorption gebildeten Elektronen-Loch-Paare, die Verluste bewirken, zu entfernen. Ein Buswellenleiter,
2) Siehe H. Rong, S. Xu, Y.-H. Kuo, V. Sin, O. Cohen, O. Raday, M. Paniccia, ‚Low-Threshold Continuous-Wave Raman Silicon Laser‘, Nature Photonics 1, 232–237, 2007.
511
512
16 Laser
der über einen integrierten photonischen Richtkoppler mit dem Resonator verbunden ist, koppelt Pumplicht bei 1550 nm in den Resonator ein und RamanLaserstrahlung bei 1686 nm aus ihm heraus. Bei einer Sperr-Vorspannung von 25 V wird eine Ausgangsleistung P A = 50 mW mit einem optisch-optischen Steigungswirkungsgrad 𝜂St = 28 % und einer optischen Schwellen-Pumpleistung P Sch = 20 mW erreicht. Selbst ohne Vorspannung ist die Ausgangsleistung größer als 10 mW und die Schwellen-Pumpleistung beträgt 26 mW. Derartige Silicium-Ramanlaser können Wellenlängen liefern, die wesentlich größer sind als die Wellenlänge der Bandlücke von Si (𝜆𝑔 = 1.11 μm), benötigen jedoch zusätzliche Pumplaser, was für Silicium nicht ganz einfach ist (siehe Abschnitt 17.1.2). Auch kaskadierte Silicium-Ramanlaser wurden bereits demonstriert. Beispielsweise produzierte in einem Fall eine Pumpe bei 1550 nm eine Ramanstrahlung bei 1686 nm aufgrund einer Stokesverschiebung 𝜈R = 15.6 THz sowie eine zweite Strahlung bei 1848 nm, die aus einer Stokesverschiebung zweiter Ordnung resultierte. 3) Diese zweite Strahlung bei 1848 nm hatte eine optische Leistung PA = 5 mW im Dauerstrichbetrieb, eine spektrale Breite Δ𝜈 < 2.5 MHz, einen optisch-optischen Steigungswirkungsgrad von 𝜂St ≈ 3 % und einen optisch-optischen Wirkungsgrad von 𝜂opt ≈ 1 %. Die optische Schwellen-Pumpleistung betrug P Sch = 120 mW.
16.3.4
Chaotische Laser
Wie in den Abschnitten 16.1 und 16.2 besprochen, sind die Schwingungsfrequenzen von konventionellen Lasern durch die Fabry-Pérot-Resonatormoden und das Gewinnprofil des resonanten Übergangs des aktiven Mediums bestimmt. Das Ausgangslicht, das durch einen teilreflektierenden Spiegel aus dem Resonator entnommen wird, ist normalerweise schmalbandig, stark gerichtet und besitzt einen hohen Grad an zeitlicher und räumlicher Kohärenz. Streuung am Lasermedium bewirkt Verluste und wird sorgfältig vermieden. Wenn die Streuung im aktiven Medium jedoch sehr stark ist, kann sie selbst eine Rückkopplung bewirken. Chaotische Laser arbeiten auf der Grundlage von Rückkopplung, die durch Mehrfachstreuung in einem ungeordneten Gewinnmedium entsteht, das als geschlossener dreidimensionaler Hohlraum dient. Photonen, die sich innerhalb des Mediums ausbreiten, können als Realisierung einer dreidimensionalen Zufallsbewegung 3) Siehe H. Rong, S. Xu, O. Cohen, O. Raday, M. Lee, V. Sih, M. Paniccia, ‚A Cascaded Silicon Raman Laser‘, Nature Photonics 2, 170–174, 2008.
[Abb. 16.28(a)] angesehen werden. Weil starke Streuung ein Kennzeichen ungeordneter (chaotischer) Medien ist, werden Laser, die nach diesem Prinzip funktionieren, als chaotische Laser (engl. random lasers) bezeichnet, manchmal auch als Pulverlaser oder Plaser. Im Unterschied zu konventionellen Lasern besitzt die zu einem beliebigen Ort im aktiven Medium zurückgestreute Strahlung eine zufällige Phase. Die Rückkopplung ist folglich inkohärent und intensitätsbasiert, nicht kohärent und feldbasiert. Da die resonante Rückkopplung in solchen chaotischen Lasern fehlt, ist die zentrale Schwingungsfrequenz durch das Gewinnprofil des aktiven Mediums bestimmt. Wenn das streuende Medium in Form von Platten oder Fasern vorliegt, können chaotische Laser auch in ein- oder zweidimensionalen Geometrien realisiert werden. In chaotischen Lasern können herkömmliche Lasermaterialien wie Rubin, Nd3+:YAG, Nd3+:Glas, Ti3+:Saphir, Cr2+:ZnSe oder GaAs verwendet werden, wenn sie zu Pulver zermahlen werden; man spricht in diesen Fällen von Pulverlasern oder Plasern. In vielen Pulvern ist das Gewinnmedium mit dem streuenden Medium identisch, das muss aber nicht so sein. Beispielsweise sind die Farbstoffmoleküle von Rhodamin6G ein gutes aktives Medium, während Mikroteilchen aus Al2 O3 als Streumedium fungieren, wenn beide in einer Methanollösung vorliegen. Die aktiven Medien von chaotischen Lasern umfassen anorganische Dielektrika, Polymere, Flüssigkeiten, Farbstofflösungen, farbstoffdotierte Flüssigkristalle, ungeordnete HalbleiterNanostrukturen und sogar biologische Gewebe. Der Gewinn kann in chaotischen Lasern sehr groß werden, da durch die Mehrfachstreuung eine große Weglänge im aktiven Medium erreicht wird. Das Einsetzen des Laserprozesses ist durch zwei Entfernungen gekennzeichnet: die mittlere Entfernung d ind , die ein Photon bis zur induzierten Emission eines Klonphotons zurücklegt, und die mittlere Entfernung d A , die es bis zum Verlassen des Mediums zurücklegt. Mit zunehmender Stärke der Streuung nimmt auch d A zu. Wenn die Streuung so stark wird, dass d A gleich d ind ist, induziert jedes Photon im Mittel gerade ein Klonphoton, bevor es aus dem Medium entkommt, sodass die Erzeugung von induzierten Photonen zu einer sich selbst erhaltenden Kettenreaktion wird. Je stärker also die Streuung ist, desto geringer ist die Schwellen-Pumpleistung. Das charakteristische Kennzeichen von chaotischen Lasern ist die fehlende Gerichtetheit und räumliche Kohärenz des ausgestrahlten Lichts. Das räumliche Emissionsmuster aus einer Küvette, die das pulverförmige aktive Medium enthält, ähnelt häufig dem einer flächenemittierenden LED [siehe Abb. 18.12(a)]. Viele Eigen-
16.3 Bauarten von Lasern
100 nm
(a)
(b)
Abb. 16.28 (a) Ein chaotischer Laser beruht auf inkohärenter und nichtresonanter Rückkopplung durch Mehrfachstreuung und eine große Weglänge im Gewinnmedium. Bei wiederholter Streuung (schematisch durch Schleifen dargestellt) kann das Feld einen oder mehr lokale Wege wiederholt
schaften haben chaotische Laser aber mit konventionellen Lasern gemein, z. B. ihre Vielfalt. Sie können optisch, elektrisch oder durch Elektronenstrahlen gepumpt werden. Die Laserstrahlung kann einen breiten Bereich von Wellenlängen vom Infraroten bis ins Ultraviolette umfassen. Die Abmessungen der aktiven Regionen können von Mikrohohlräumen mit Volumina in der Größenordnung einiger μm3 bis zu makroskopischen Bauelementen mit Volumina von einigen cm3 reichen. So scheint die Rückkopplung durch Streuung eine wichtige Rolle bei der astronomischen Maserwirkung zu spielen, die in Molekülwolken aus H2 O, OH und SiO beobachtet wird. Wenn die Teilchen des aktiven Mediums hinreichend groß und regelmäßig geformt sind, sodass in ihnen Resonatormoden existieren können, können sie sich auch wie zufällige Ansammlungen von einzelnen Mikrolasern verhalten, von denen jeder seine eigene Emissionsrichtung besitzt. Alternativ kann auch eine lokale Anordnung von Streuzentren Resonanzen ermöglichen. Wenn die Streuung sich wiederholt [siehe Abb. 16.28(a)] und die optische Verstärkung die Verluste entlang eines solchen Umlaufs übersteigt, können diese als Hohlraum wirken. Die resultierende Laseremission besitzt dann scharfe Maxima bei diesen zufälligen Frequenzen der Hohlraummoden. Da unterschiedliche Gebiete des ungeordneten Mediums unterschiedliche Umlaufwege bewirken, hängen die Schwingungsfrequenzen von dem jeweiligen Gebiet in dem Material ab, das gepumpt wird. Solche Laser werden wegen ihrer kohärenten Rückkopplung und ihrer räumlich zufälligen Anordnung von Hohlräumen kohärente chaotische Laser genannt; sie ähneln Ansammlungen von Mikrolasern mit zufälligen Emissionsrichtungen. Gruppen von Streuzentren können verwendet werden, um chaotische Mikrolaser herzustellen, in denen Licht durch starke Streuung anstelle von Reflexion auf ein Volumen der Größenordnung einer kubischen Wellenlänge eingegrenzt wird. Andere Formen von Mikroresonatorlasern werden in Abschnitt 18.4.2 betrachtet.
durchlaufen, die zusammen als ein lokaler Hohlraum dienen und so eine kohärente und resonante Rückkopplung bewirken. (b) Dicht gepackte ZnO-Nanokristallite dienen sowohl als aktives Medium als auch als streuende Rückkopplungselemente in einem chaotischen Mikrolaser.
Beispiel 16-5: Chaotischer ZnO-Mikrolaser
Eine dicht gepackte Ansammlung von mehreren tausend ZnO-Nanokristalliten [siehe Abb. 16.28(b)] mit Durchmessern in der Größenordnung von einigen zehn Nanometern kann zu einem Mikrocluster mit einem Durchmesser von ≈ 1 μm verschmelzen. Die Nanokristallite dienen sowohl als Gewinnmedium als auch als die streuenden Rückkopplungselemente eines chaotischen Mikrolasers. Die Emissionswellenlänge 𝜆0 ≈ 380 nm liegt in der Nähe der Wellenlänge der Bandlücke von ZnO. Weil die optische Eingrenzung aus Streuung und nicht aus Reflexion an der Oberfläche des Mikroclusters resultiert, müssen solche Mikrolaser keine regelmäßigen Formen oder glatten Oberflächen haben.
16.3.5 Gas- und Farbstofflaser Atom- und Ionenlaser
Atom- und Ionen-Gaslaser wie He-Ne-, Ar+ - und Kr+ Laser produzieren die schönen mehrfarbigen Strahlen, die seit Jahrzehnten das Markenzeichen optischer Laboratorien sind (siehe Tabelle 16.1). Vor allem Kr+ Ionenlaser erzeugen optische Leistungen von einigen hundert Milliwatt bei Wellenlängen von 𝜆0 = 350 nm im nahen Ultraviolett bis 676 nm im Roten. Sie können gleichzeitig auf mehreren Linien betrieben werden, um „weißes Laserlicht“ zu erzeugen. Auch viele andere einatomige Spezies und ihre Ionen dienen als aktive Lasermedien und funktionieren bei unzähligen Wellenlängen im nahen Infrarot und im Sichtbaren. Trotzdem werden Atom- und Ionen-Gaslaser heute hauptsächlich für Spezialanwendungen eingesetzt; diodengepumpte Festkörperlaser und Laserdioden haben höhere Leistungen, können leichter abgestimmt werden und sind robuster. Moleküllaser
Molekül-Gaslaser wie der CO2 -Laser (siehe Tabelle 16.1 und Abb. 14.7), der Strahlung bei 𝜆0 = 9.6 und 10.6 μm im mittleren Infrarot liefert, können mehrere tausen-
513
514
16 Laser
de Watt kontinuierlicher Leistung mit hohem Wirkungsgrad erzeugen und werden für Anwendungen wie Schneiden, Schweißen, Ritzen, Gravieren und Markieren eingesetzt. Im fernen Infrarot war der Methanollaser lange Zeit sehr beliebt, der bei 𝜆0 = 119 und 124 μm sowie zahlreichen weiteren Wellenlängen strahlt. Die meisten molekularen Übergänge im Infrarotgebiet können als Laserübergänge benutzt werden; selbst gewöhnlicher Wasserdampf (H2 O) kann bei vielen Wellenlängen im fernen Infrarot Laserstrahlung liefern, wie Tabelle 16.1 zeigt. In den letzten Jahren haben jedoch Quantenkaskadenlaser die Bühne betreten (Abschnitt 18.4.4). Sie arbeiten bei Zimmertemperatur und liefern einige Watt kontinuierlicher Ausgangsleistung im Infrarotbereich bei hohen Leistungsumwandlungswirkungsgraden. Quantenkaskadenlaser haben Moleküllaser in praktisch allen Anwendungsbereichen abgelöst (außer vielleicht denen, die optischen Leistungen jenseits von 10 W erfordern). Excimer- und Exciplexlaser
Excimerlaser sind im ultravioletten Gebiet des Spektrums wichtig. Der Ausdruck Excimer (engl. excited dimer) bezeichnet ein kurzlebiges zweiatomiges Molekül in einem elektronisch angeregten Zustand; der Begriff Exciplex (engl. excited complex) wird häufig anstelle von Excimer verwendet, wenn die Atome nicht identisch sind. Edelgashalogenide wie XeCl bilden Exciplexe, weil das chemische Verhalten eines angeregten Edelgasatoms dem eines Alkaliatoms ähnelt, das leicht mit einem Halogen reagiert (siehe Abb. 14.3). Beispiele für Excimer- und Exciplexlaser sind (in Klammern ihre Haupt-Laserwellenlängen) F2 (157 nm), ArF (193 nm), KrF (248 nm), XeCl (308 nm) und XeF (351 nm) [siehe Tabelle 16.1]. ArF-Exciplexe können zum Beispiel erzeugt werden, indem man einen Strompuls von 20 ns Dauer durch eine Gasmischung aus Ar und F2 leitet, um eine Gasentladung zu bewirken. Wenn die Exciplex in den Grundzustand zurückkehren, dissoziieren seine Bestandteile (die beiden Atome stoßen einander häufig ab) und emittieren dabei einen 150 mJ-Puls induzierter Strahlung. Da ein unteres Laserniveau in diesem Fall nicht existiert, haben Exciplexlaser sozusagen eine eingebaute Besetzungsinversion. Da kurzwelliges Licht in die meisten Materialien nicht tief eindringt, eignen sich Excimerlaser sehr gut für die Bearbeitung empfindlicher Materialien. Die UV-Strahlung zerstört die chemischen Bindungen an der Oberfläche des Materials und verdampft es durch Ablation anstelle von Erhitzen, Verbrennen oder Schneiden. Diese Eigenschaft und ihre große Energie pro Puls machen Exciplexlaser zu idealen Werkzeugen für die
präzise Mikrobearbeitung von Polymeren und für kritische dermatologische und opthalmologische Eingriffe. Die wichtigste Anwendung von ArF-Lasern ist heutzutage die Herstellung von mikroelektronischen und photonischen integrierten Schaltkreisen mit Strukturgrößen unterhalb von 10 nm. Hierzu kommen Methoden der optischen Lithographie ebenso zum Einsatz wie Mehrfachstrukturierung (engl. multiple patterning) und Flüssigimmersion zur Vergrößerung der numerischen Apertur. Die Fortentwicklung der Mikrolithographie in Richtung des extremen UV und des Röntgenbereichs macht immer kleinere Strukturgrößen möglich. Andere Anwendungen in der Nanofabrikation sind beispielsweise die Lithographie mit Elektronenstrahlen oder fokussierten Ionenstrahlen. Chemische Laser
Chemilumineszenz, die Emission von Licht durch eine chemische Reaktion, tritt auf, wenn die Reaktion zwischen zwei oder mehr Substanzen so viel Energie freisetzt, dass der angeregte Zustand eines Reaktionsprodukts entsteht (siehe Abschnitt 14.5.1). Chemische Laser bestehen aus Mischungen von Gasen, die sich selbst pumpen, d. h. die Pumpenergie wird durch eine chemische Reaktion im aktiven Medium selbst geliefert. Der HF-Laser, der hauptsächlich im Wellenlängenbereich 2.7−3.1 μm strahlt, ist vielleicht der bekannteste dieser Laser; er kann optische Ausgangsleistungen von einigen Megawatt liefern. Sein Aufbau ähnelt dem eines Raketentriebwerks: er besteht aus einer Brennkammer, Düsen, Vorrichtung zum Einspritzen der Gase und einem Resonator. Vereinfacht gesagt wird in ihm eine elektrische Entladung durch eine Mischung von H2 und F2 geleitet, wobei HF-Moleküle in angeregten Schwingungszuständen entstehen, die meist mit HF∗ bezeichnet werden. Diese Moleküle strahlen Infrarotphotonen aus und dissoziieren. Ihre Bestandteile reagieren wiederum mit H2 und F2 und erzeugen neue schwingungsangeregte Moleküle, sodass eine Art Kettenreaktion entsteht. Andere chemische Laser sind beispielsweise der chemische Sauerstoff-Iod-Laser oder der Gasphasen-Iodlaser. In früheren Jahrzehnten waren chemische Laser aufgrund ihrer hohen Leistung und guten Strahlqualität die heißesten Kandidaten für den Einsatz als Energiewaffen. Letztendlich erwiesen sie sich jedoch als zu sperrig, zu schwer, zu ineffizient und zu gefährlich für den Einsatz an Bord von Schiffen. In den letzten Jahren hat sich die Aufmerksamkeit in dieser Hinsicht auf Festkörper-, diodengepumpte, Freie-Elektronen- und Faserlaser verlagert. Insbesondere Faserlaser sind derzeit für die Entwicklung von Energiewaffen von erheblichem Interesse, da sie eine hohe Leistung und einen hohen Wirkungs-
16.3 Bauarten von Lasern
grad mit guter Strahlqualität, Kompaktheit und Vibrationsfestigkeit kombinieren (Abschnitt 16.3.2). Beispiel 16-6: Ein Deuteriumfluoridlaser
Der wohl berüchtigtste chemische Laser ist vielleicht der MIRACL (engl. mid-infrared advanced chemical laser) der US Army in White Sands/New Mexiko. In dieser beeindruckenden Energiewaffe wird Ethylen (C2 H4 ) mit Stickstofftrifluorid (NF3 ) verbrannt. Die entstehenden freien Fluoratome verbinden sich mit eingespritztem Deuteriumgas und bilden schwingungsangeregte Deuteriumfluoridmoleküle DF∗ . Die Emission der Photonen, die Dissoziation der Moleküle und die Entstehung neuer schwingungsangeregter Moleküle verlaufen analog zum HF-Laser. Der DFLaser strahlt jedoch bei zahlreichen Wellenlängen im Bereich 3.5–4.0 μm, der in der Atmosphäre viel weniger absorbiert wird als das Licht des HF-Lasers. Der Laser erzeugt für etwa eine Minute einige Megawatt kontinuierlicher optischer Leistung in Form eines quadratischen Strahls mit einer Seitenlänge von ≈ 14 cm. Farbstofflaser
Der Vollständigkeit halber wollen wir auch eine kurze Beschreibung von Farbstofflasern geben. Organische Farbstofflaser spielten in der Vergangenheit eine wichtige Rolle in Optik und Photonik, weil sie über einen großen Bereich von Wellenlängen abgestimmt werden konnten. Das aktive Medium eines Farbstofflasers ist in der Regel eine Lösung eines organischen Farbstoffs in Alkohol oder Wasser mit einer Konzentration von ≈ 10−4 m. Normalerweise wird die Farbstofflösung umgewälzt, weil sich die Farbstoffe im Licht zersetzen. Die Farbstoffe besitzen meist große Übergangsbandbreiten, die sowohl eine Abstimmbarkeit über einen großen Bereich als auch die Erzeugung ultrakurzer Pulse durch passive Modenkopplung ermöglichen. Polymethinfarbstoffe liefern Strahlung im Roten und nahen Infrarot (0.7−1.5 μm), Xanthenfarbstoffe strahlen im Sichtbaren (500–700 nm), Cumarinfarbstoffe im Violetten, Blauen und Grünen (400–500 nm) und Szintillatorfarbstoffe im
0.01
0.1 EUV-Strahlen
100 nm
10 nm
1 weiche Röntgenstrahlen
1 nm
10
100
harte Röntgenstrahlen
1Å
0.1 Å
Abb. 16.29 Wellenlängen und Photonenenergien für das extreme Ultraviolett (EUV), weiche und harte Röntgenstrahlung sowie γ-Strahlung. Die Grenzen zwischen den verschiedenen Bändern sind nicht exakt definiert und enthalten eine Portion Willkür. Wir legen hier die Grenze zwischen dem EUV- und dem Röntgenbereich auf 𝜆0 = 10 nm fest und
Ultravioletten (< 390 nm). Rhodamin-6G, das prominenteste Beispiel, kann im Bereich 560–640 nm abgestimmt werden. Alternativ können die Farbstoffmoleküle auch in einem Polymer, Glas oder kristallinen Festkörper eingebettet sein, sodass ein Festkörper-Farbstofflaser entsteht. Farbstofflaser werden in der Regel mit einem Pumplaser wie beispielsweise einem frequenzverdoppelten Nd3+ -Laser oder einer Laserdiode intrabandgepumpt (Abb. 14.8). Meist werden Fabry-Pérot- oder Ringresonatoren eingesetzt, wobei ein Prisma oder Beugungsgitter im Strahlengang für die Abstimmbarkeit der Wellenlänge sorgt. Leider erfordern Farbstofflaser eine aufwendige Pflege, vor allem weil die chemische Lebensdauer des Farbstoffs im Lösungsmittel relativ kurz ist. Aus diesem Grund haben diodengepumpte Festkörperlaser (Abschnitt 16.3.1) und Laserdioden (Abschnitt 18.3) die Farbstofflaser abgesehen von speziellen Anwendungen 3+ weitgehend ersetzt. Der diodengepumpte Ti :Al2 O3 Laser bietet zum Beispiel im Bereich um 𝜆A = 800 nm eine breitere Abstimmbarkeit an als ein typischer Farbstofflaser und erfordert kaum Wartung. Frequenzverdopplung des Ti:Saphir-Lasers führt zu einem nützlichen Band abstimmbarer Strahlung im Bereich um 400 nm. Abstimmbarkeit um 600 nm, in der Lücke zwischen 400 und 800 nm, kann durch Frequenzverdopplung des Ausgangssignals eines optischen parametrischen Oszillators erreicht werden, der im Bereich von 1−2 μm betrieben wird (Abschnitt 22.2.3).
16.3.6 Röntgen- und Freie-Elektronen-Laser Es gibt eine Reihe von Ansätzen, um kohärentes Licht im extremen UV (EUV) sowie im Bereich der weichen und harten Röntgenstrahlung zu erzeugen, die noch kurzwelliger ist als das EUV. Der Bereich der γ-Strahlung umfasst Wellenlängen, die noch kürzer sind als die der harten Röntgenstrahlung. Die Wellenlängen und Photonenenergien dieser Bänder sind in Abb. 16.29 dargestellt.
1000
Photonenenergie / eV
Gammastrahlen
0.01 Å
Wellenlänge
die zwischen der weichen und der harten Röntgenstrahlung auf 𝜆0 = 0.2 nm. Im Bereich der Röntgentechnik ist das Ångström als Längeneinheit immer noch weit verbreitet (1 Å ≡ 10−10 m = 0.1 nm). Die Photonenenergie hängt gemäß Gl. (13.6) über E ∕keV ≈ 1.24∕(𝜆0 ∕nm) mit der Wellenlänge 𝜆 zusammen.
515
516
16 Laser
Wir beginnen mit einer Diskussion der kohärenten Erzeugung von Röntgenstrahlen mithilfe von atomaren EUV- und Röntgenlasern. Zwei andere Verfahren werden ebenfalls häufig zur Erzeugung kohärenter Röntgenstrahlen verwendet: Freie-Elektronen-Röntgenlaser (XFEL), die mithilfe von Teilchenbeschleunigern Pulsenergien im mJ-Bereich bereitstellen, wie nachfolgend erläutert wird, und die Erzeugung hoher Harmonischer (HHG, engl. high-harmonic generation), die Pulsenergien im μJ-Bereich liefert und in Abschnitt 23.5.4 näher besprochen wird. HHG-Systeme sind kompakt und vielseitig; einzelne spektrale und/oder zeitliche Komponenten können unter Verwendung von Gate-Techniken extrahiert werden. Laser für den extremen UV- und den Röntgenbereich
Einen Laser auf der Grundlage von atomaren Übergängen im extremen UV (EUV) oder Röntgenbereich des elektromagnetischen Spektrums zu betreiben, ist kein einfaches Unterfangen, weil es schwierig ist, bei solch kleinen Wellenlängen eine Besetzungsinversion zu erreichen. Nach Gl. (16.16) ist für einen festen Wert von 𝑡sp die Schwellen-Besetzungsdifferenz NSch ∝ 1∕𝜏P 𝜆 2 𝑔(𝜈), sodass die Schwellen-Pumpleistung ∝ 1∕𝜏P 𝜆 3 𝑔(𝜈) wird. Wenn die Dopplerverbreiterung dominiert, was bei aktiven Lasermedien im EUV meist der Fall ist, zeigt Gl. (14.53), dass 𝑔(𝜈) ∝ 𝜆 und somit die SchwellenPumpleistung proportional zu 1∕𝜏P 𝜆 4 ist. Es wird daher immer schwieriger, die Schwelle zu erreichen, wenn 𝜆 in Richtung EUV oder Röntgenbereich abnimmt. Ein anderer Aspekt der Herausforderung in diesem Wellenlängenbereich hängt mit den optischen Komponenten zusammen, die nicht einfach zu konstruieren sind. Einerseits ist der Absorptionskoeffizient groß (wodurch 𝜏P klein und NSch noch größer wird), andererseits liegt der Brechungsindex in den meisten Materialien nahe eins. Trotzdem haben sich zwei Ansätze als erfolgreich erwiesen: • Streifender Einfall. Da die Frequenzen im EUV deutlich über der Plasmafrequenz liegen, zeigen Metalle einen Brechungsindex, der knapp unterhalb von eins liegt (siehe Abschnitt 8.2.1 und Abb. 8.14). Folglich ist Totalreflexion möglich, und Metalle können als Spiegel dienen. Das ist jedoch nur bei streifendem Einfall möglich, weil der kleine Brechungsindex-Kontrast einen großen Einfallswinkel erfordert (die Situation ist analog zu der an der Grenzfläche zwischen Kern und Mantel einer optischen Faser). Trotzdem lassen sich Röntgenstrahlen beispielsweise mithilfe von deformierbaren Spiegeln für streifenden Einfall, die eine Korrektur der Wellenfront ermöglichen, auf nanometergroße Brennflecke fokussieren.
• Mehrschichtsysteme. Die Konstruktion von optischen Mehrschichtsystemen ist nicht so einfach wie im sichtbaren Bereich, da der Brechungsindex im EUV in der Nähe von eins liegt und sich von einem Material zum anderen nicht merklich ändert. Nach Gl. (6.41) ist das Fresnel-Reflexionsvermögen an einer Grenzfläche zwischen Material und Vakuum bei senkrechtem Einfall ℛ = [(1 − 𝑛)∕(1 + 𝑛)]2 ; typische Werte sind kleiner als 10−4 . Trotzdem können Mehrschichtspiegel mit hohem Reflexionsgrad hergestellt werden, indem man eine große Zahl von Schichten verwendet (siehe Abschnitt 7.1); deren Zahl ist allerdings letztlich durch die begrenzte Eindringtiefe der Strahlung in den Stapel begrenzt. Beispielsweise können Mehrschichtspiegel aus einigen zehn alternierenden Schichten aus Si und Mo bei senkrechtem Einfall für 𝜆0 = 13.5 nm Reflexionsgrade um 70 % erreichen. Die Optimierung des Reflexionsvermögens bei bestimmten Wellenlängen kann durch einen Aufbau der Stapel aus drei statt zwei Materialien und durch die Verwendung von biperiodischen und aperiodischen Strukturen unterstützt werden. Bauelemente, die Röntgenpulse im Femto- und Attosekundenbereich verarbeiten sollen, müssen zusätzliche spezielle Anforderungen erfüllen. Mehrschichtoptiken können auch in Konstruktionen für streifendem Einfall und Zonenplattenstrukturen integriert werden. • Gitter. Gitter können zur Selektion schmalbandiger Ausschnitte aus Röntgenquellen mit kontinuierlicher Wellenlängenverteilung (z. B. Synchrotronstrahlung) dienen. Sie können auch einzelne harmonische Komponenten aus Linienspektren-Röntgenquellen wie sie z. B. bei der High-Harmonic Generation eingesetzt werden extrahieren. Auch für die Pulsformung und -komprimierung (Abschnitt 23.2) sind sie hilfreich. Flache und konkave Gitter werden häufig mit dreieckigen Rillenprofilen versehen. Laserbetrieb im Röntgenbereich wurde erstmals 1980 in einem dramatischen Experiment am Lawrence Livermore National Laboratory (LLNL) demonstriert. Dabei wurde eine unterirdische Kernexplosion verwendet, um einen Strom inkohärenter Röntgenstrahlen zu erzeugen, der intensiv genug war, um durch Pumpen eine Besetzungsinversion in den Atomen einer Reihe von Metallstäben zu erzeugen. Ein Röntgen-Laserpuls wurde erzeugt und gerade noch rechtzeitig nachgewiesen, bevor die Detonation den Apparat vernichtete. Da die zur Erzeugung hoher Harmonischer (HHG) verwendeten Strahlungsquellen keine Laser sind, ist die Erzeugung von kohärenter Röntgenstrahlen durch HHG von den diskutierten Einschränkungen nicht betroffen.
16.3 Bauarten von Lasern
Wir wollen im Folgenden nun zwei praktische Ansätze zur Realisierung von Atomlasern im EUV- und Röntgenbereich diskutieren: (1) Die Ionisation von Atom mithilfe von fokussierten Laserstrahlen und (2) das optische Pumpen von inneren Schalen des Atoms. Anschließend werden wir eine Reihe von Anwendungen von atomaren Röntgenlasern vorstellen. Ionisation von Atomen durch einen fokussierten Laserstrahl
Durch Fokussierung von kurzen Laserpulsen mit hoher Intensität im infraroten, sichtbaren oder ultravioletten Sprektralbereich auf ein festes Target können hochionisierte Atome erzeugt werden, die ein heißes Plasma aus ionisierten Atomen bilden. Durch Rekombination oder Stoßanregung entsteht daraus kohärente Röntgenstrahlung. Ein nach unten gerichteter Elektronenübergang in einem hochionisierten Atom erzeugt ein hochenergetisches Photon, das wiederum die Emission eines Klonphotons aus einem benachbarten Ion induzieren kann. Da es schwierig ist, für diese kurzen Wellenlängen Resonatoren mit Rückkopplung zu konstruieren, arbeiten viele Röntgenlaser auf der Grundlage einer verstärkten spontanen Emission (ASE, siehe Abschnitt 15.5). Ein EUV-Laser dieser Art, der bei einer Wellenlänge von 18.2 nm auf der Grundlage der Plasmarekombination arbeitet, wurde erstmals Mitte der 1980er Jahre für wasserstoffähnlichen Kohlenstoff (C5+ ) beschrieben (siehe Beispiel 16-7). Beispiel 16-7: Ein EUV-Laser auf der Basis von wasserstoffähnlichem Kohlenstoff
Ein anschauliches Beispiel eines EUV-Lasers, der auf der Grundlage einer Ionisation der Atome durch einen fokussierten Laserstrahl und anschließende Rekombination arbeitet, ist ein Kohlenstoff-Plasmalaser. In einem 1985 in Princeton durchgeführten Experiment wurde ein Puls aus einem CO2 -Laser mit einer Wellenlänge von 10.6 μm, einer Dauer von 50 ns und einer Energie von 300 J auf eine massive Kohlenstoffplatte fokussiert. 4) Der Pumppuls des Infrarotlasers erzeugte genügend Hitze, um einige Kohlenstoffatome all ihrer Elektronen zu berauben und so ein Plasma aus ionisiertem Kohlenstoff zu schaffen, das mithilfe eines Magnetfelds radial eingeschlossen wurde. Die Abkühlung des Plasmas nach dem Ende des Pumppulses führte zum Einfangen von Elektronen in den Schalen mit n = 3 und gleichzeitig zu einem Mangel an Elektronen in den Schalen n = 2 aufgrund des schnellen strahlenden 4) Siehe S. Suckewer, C. H. Skinner, H. Milchberg, C. Keane, D. Voorhees, ‚Amplification of Stimulated Soft X-Ray Emission in a Confined Plasma Column‘, Physical Review Letters 55, 1753–1756, 1985.
Übergangs in den Grundzustand. Das Resultat war eine Ansammlung von wasserstoffähnlichen C5+ -Ionen mit einer Besetzungsinversion (siehe Abb. 14.1). Wie aus Gl. (14.4) zu erwarten, ist der Übergang eines Elektrons von der Schale n = 3 in die Schale n = 2 (der Übergang 3d → 2p hat den größten Querschnitt) von der Emission eines Photons der Energie E=
MR 𝑍 2 𝑒 4
1 1 ( − ) (4π 𝜀0 )2 2ℏ2 22 32
(16.48)
begleitet. Mit 𝑍 = 6 entspricht das einem EUV-Photon der Energie 68 eV und der Wellenlänge 𝜆A = 18.2 nm. In dem Experiment mit ionisiertem Kohlenstoff initiierte ein spontan ausgestrahltes Photon (𝑡sp ≈ 12 ps) die induzierte Emission von EUV-Photonen durch anderen Ionen und somit die verstärkte spontane Emission (andere Parameter des Übergangs sind in Tabelle 15.1 angegeben). Das Produkt 𝛾 d des Gewinnkoeffizienten pro Umlauf und der Weglänge war ≈ 6, sodass gemäß Gl. (15.7) der Gewinn 𝐺 ≈ e6 war. Das Ausgangssignal war ein Puls von 20 ns Dauer im EUV mit einer Leistung von 100 kW, einer Energie von 2 mJ und einer Divergenz von ≈ 5 mrad. Ähnliche Ergebnisse wurden auch mit einem Nd3+:Glas-Pumplaser bei 1.06 μm erhalten. Die aktiven Medien in aktuellen EUV-Plasmalasern sind größtenteils hoch ionisierte neon- oder nickelähnliche Atome, die die stabilsten Elektronenkonfigurationen besitzen. Bereits 1985 wurden EUV-Laser mit Stoßanregung in neonähnlichem Selen (Se24+ ) und Yttrium (Y29+ ) bei Wellenlängen um 21 bzw. 16 nm beschrieben. Nicht viel später, in den späten 1980er Jahren, wurde das nova-Nd3+:Glas-Lasersystem im Lawrence Livermore National Laboratory dazu verwendet, dünne Folien aus metallischem Tantal und Wolfram zu verdampfen, wobei nickelähnliche Ta45+ - bzw. W46+ -Ionen entstanden und Laserpulse mit einer Dauer von 250 ps bei Wellenlängen um 𝜆A = 4.3 nm im Bereich der weichen Röntgenstrahlung erzeugt werden konnten. Eine übliche Pumpanordnung besteht aus einer Zylinderlinse, die das Pumplicht in Form einer dünnen Linie auf das Ziel fokussiert und eine Plasmasäule erzeugt, die als aktive Region wirkt. Gepumpt wird gewöhnlich mit einem Ti3+:Saphir-Laser bei etwa 800 nm oder mit der Grundmode oder der zweiten oder dritten Harmonischen eines Nd3+:Glas-Lasers bei 1053, 526 oder 351 nm. Aufeinander folgende Pumppulse verstärken die Besetzungsinversion, verbessern den Wirkungsgrad und ermöglichen den Betrieb des Lasers im Bereich der Sättigung. Das Einstrahlen des Haupt-Pumppulses unter
517
518
16 Laser
streifendem Einfall vergrößert die Absorption und reduziert die erforderliche Pumpenergie, da es letztlich letztlich ein Pumpen durch Wanderwellen bewirkt, wodurch die Weglänge des Lichts im Verstärkungsmedium erhöht wird. Wenn Licht aus einem rauscharmen, kohärenten Seedlaser eingekoppelt wird, verhält sich das Plasma außerdem wie ein Verstärker und erzeugt eine verstärkte kohärente Emission anstelle einer verstärkten spontanen Emission. Die willkommenen Eigenschaften des Seedlasers wie z. B. eine hohe Kohärenz können so auf den Röntgenlaser übertragen werden, was zu Ausgangspulsen mit einer hohen räumlichen und zeitlichen Kohärenz, einer geringen Divergenz und einer definierten Polarisation führt. All diese positiven Eigenschaften sind auch in dem in Beispiel 16-8 analysierten Ag19+ EUV-Laser zu beobachten.
und fiel im streifenden Einfall auf die Probe, wo er ein 4.1 mm langes und 30 μm breites Silberplasma erzeugte. Der HHG-Seed wurde durch Fokussierung von 20mJ-Laserpulsen aus dem Ti3+:Saphir-Laser, die auf eine Dauer von 50 fs komprimiert waren, in gasförmiges Neon bei 20 Torr erzeugt (siehe Beispiel 23-12). Der Seedpuls bei 13.9 nm, der aus der 59. Harmonischen des HHG bestand, wurde 1 ps nach dem Heizpuls in den Verstärker eingekoppelt. Die Sättigung des Gewinns wurde nach einer Ausbreitungsstrecke von 3 mm beobachtet. Der EUV-Laser verstärkte den Seedpuls um einen Faktor 200 und erzeugte Ausgangspulse mit einer Dauer im Pikosekundenbereich mit einer Energie von ≈ 50 nJ und einer Divergenz von ≈ 1 mrad bei einer Wiederholungsrate von 5 Hz. Durch Verwendung eines Stoßionisierungsgatters kann die Pulsdauer sogar unter 1 ps reduziert werden.
Beispiel 16-8: Der Silberionen-EUV-Laser
Ein Ag19+ -Ionenlaser wurde auf der Basis eines Plasmas und einer Stoßanregung bei 13.9 nm auf dem Übergang 4d 1 S0 → 4p 1 P1 betrieben. In der Variante ohne Seedlaser wurde er durch einen modengekoppelten, verstärkten Ti3+:Saphir-Laser bei 800 nm gepumpt, dessen Hauptpulse im Pikosekundenbereich lagen und eine Energie von ≈ 1 Joule trugen. Diese Pulse wurden im streifendem Einfall auf ein Silbertarget gerichtet und erzeugten ein 4 mm langes und 30 μm breites Silberplasma. 5) Der Gewinnkoeffizient für kleine Signale betrug 67.5 cm−1 und das Produkt aus Länge und Gewinnkoeffizient betrug 𝛾 d ≈ 16.8. Die resultierenden ASE-Pulse bei 13.9 nm hatten bei gesättigtem Gewinn eine Dauer von 5 ps, eine Energie von 85 μJ, eine mittlere Leistung von ≈ 2 μW, eine Divergenz von 8 mrad und eine Wiederholungsrate von 5 Hz. In der Variante mit Seed wurden Pulse aus einer HHG-Quelle (Abschnitt 23.5.4) verwendet. Das Ergebnis war eine verstärkte kohärente Emission, deren Eigenschaften denen der Variante ohne Seedlaser überlegen waren. Das dichte Ag19+ -Plasma wurde durch Bestrahlen einer polierten Silberplatte mit einem Hauptheizpuls mit einer Dauer von 6.7 ps und einer Energie von 1 J erzeugt. 6) Der Puls wurde von einem verstärkten TI3+:Saphir-Laser bei 815 nm geliefert 5) Siehe Y. Wang, M. A. Larotonda, B. M. Luther, D. Alessi, M. Berrill, V. N. Shlyaptsev, J. J. Rocca, ‚Demonstration of High-Repetition-Rate Tabletop Soft-X-Ray Lasers with Saturated Output at Wavelengths Down to 13.9 nm and Gain Down to 10.9 nm‘, Physical Review A 72, 053807, 2005. 6) Siehe Y. Wang, E. Granados, F. Pedaci, D. Alessi, B. Luther, M. Berrill, J. J. Rocca, ‚Phase-Coherent, Injection-Seeded, Table-Top Soft-XRay Lasers at 18.9 nm and 13.9 nm‘, Nature Photonics 2, 94–98, 2008.
Es gibt noch weitere Ansätze zur Erzeugung einer Laserwirkung in einem Plasma aus ionisierten Atomen, beispielsweise die Ionisation durch einen Strompuls oder die Feldionisation. Im ersten Fall wird das Medium durch einen starken elektrischen Puls angeregt und bildet ein heißes Plasma. Mithilfe von in Kapillaren eingeschlossenen Plasmen kann eine Laserwirkung im gesättigten Bereich in einer kompakten Anordnung erreicht werden. Alternativ kann das aktive Medium durch lasergesteuerte optische Feldeffekte und Multiphotonenprozesse direkt ionisiert werden, wodurch eine kalte, dichte Ansammlung ionisierter Atome entsteht, die von einer Verteilung heißer Elektronen umgeben sind. In diesem Fall wird die Stoßanregung durch die emittierten Elektronen ausgelöst und nicht durch die thermischen Ionen. Optisches Pumpen von inneren Schalen
Die bisher beschriebenen Methoden zur Erreichung der Laserwirkung im EUV- und Röntgenbereich basieren alle auf einer Rekombination hochionisierter Atome in einem Plasma oder deren Stoßanregung in angeregte Zustände. Ein alternativer Ansatz, der durch das Aufkommen des Freie-Elektronen-Röntgenlasers (XFEL, nach engl. x-ray free electron laser, siehe Abb. 16.38) möglich wurde, beruht auf dem direkten optischen Pumpen neutraler Atome, die zur Photoionisation von Elektronen aus inneren Schalen des Atoms führt. Das optische Pumpen lässt das untere Laserniveau unbesetzt und führt demzufolge auf direktem Wege zu einer Besetzungsinversion. Da die Besetzungsinversion nach Ablauf der Lebensdauer des angeregten Innenschalenzustands wieder verschwindet, bricht der Laserprozess von selbst ab. Obwohl diese Lebensdauer aufgrund von schnellen
16.3 Bauarten von Lasern
strahlenden Übergängen aus höheren Energieniveaus sowie der nichtstrahlenden Auger-Rekombination sehr kurz ist (siehe Abb. 17.26), kann durch Einsatz eines XFEL trotzdem eine Besetzungsinversion erreicht werden. Ein XFEL ist eine ultraschnelle, kohärente RöngenLaserpumpe mit ausreichender Leistung, um eine Photoionisation der inneren Schalen auf einer Zeitskale zu erreichen, die mit der Lebensdauer des angeregten Innenschalenzustands vergleichbar ist; dieses Pumpschema weist eine gewisse Ähnlichkeit mit dem Intrabandpumpen auf. Obwohl hierzu eine XFEL-Pumpe erforderlich ist, die nicht gerade in jedem Labor zu finden ist, bietet das optische Pumpen von inneren Schalen eine Reihe von Vorteilen: (1) Die Pumpenergie geht ausschließlich in den interessierenden Übergang, wodurch Verluste aufgrund der Anregung von irrelevanten Zuständen vermieden werden, (2) die Laserstrahlung ist räumlich gut auf die Pumpe abgestimmt und (3) der Pumplaser kann, sofern er einen gleichzeitigen Betrieb bei zwei Frequenzen erlaubt, gleich noch eine Seedstrahlung liefern. Beispiel 16-9: Ein XFEL-gepumpter Neon-Innenschalenlaser für weiche Röntgenstrahlung
Ein optisch gepumpter Neon-Innenschalen-Röntgenlaser, der von einem XFEL (siehe Beispiel 16-11) bei einer Wellenlänge von 1.29 nm (E P = 960 eV) gepumpt wird, kann eine Laseremission bei 1.46 nm (E P = 849 eV) erzeugen. 7) Neon ist ein Edelgas mit einer abgeschlossenen Elektronenschale mit zehn Elektronen (𝑍 = 10) und der Elektronenkonfiguration 1s2 2s2 2p6 im Grundzustand. Ein XFEL-Pumpphoton ionisiert ein Elektron aus der inneren (n = 1) Schale, die auch als K-Schale bezeichnet wird; das Ergebnis ist ein einfach ionisiertes Neonion Ne+ (1s1 2s2 2p6 ), das als oberes Laserniveau dient. Der Laserübergang Ne+ : 1s1 2s2 2p6 → Ne+ : 1s2 2s2 2p5 beruht auf der strahlenden Rekombination eines Elektrons aus der äußeren (n = 2) Schale, auch L-Schale genannt, mit dem Loch in der K-Schale. Röntgenstrahlung aus Übergängen n = 2 → n = 1 wird als Kα -Strahlung bezeichnet. Obwohl auch ein konkurrierender Augerübergang Ne+ : 1s1 2s2 2p6 → Ne2+ : 1s2 2s2 2p4 (der eine kurze Lebensdauer von 2.4 fs hat und daher außergewöhnlich stark ist) aus dem oberen Laserniveau verfügbar ist, reicht eine Restwahrscheinlichkeit von 1.8 % für die spontane Emission bei 1.46 nm auf dem Laserübergang aus, um den Laserprozess sicher7) Siehe N. Rohringer, D. Ryan, R. A. London, M. Purvis, F. Albert, J. Dunn, J. D. Bozek, C. Bostedt, A. Graf, R. Hill, S. P. Hau-Riege, J. J. Rocca, ‚Atomic Inner-Shell X-Ray Laser at 1.46 Nanometres Pumped by an X-Ray Free-Electron Laser‘, Nature 481, 488–491, 2012.
zustellen. Die normalen atomaren Laserlinien des Neons im sichtbaren und infraroten Bereich des Spektrums (Abb. 14.2) entstehen durch Übergänge der Valenzelektronen, die ausschließlich in der Schale n = 2 liegen. In einem Experiment, das 2012 im Stanford National Accelerator (SLAC) Laboratory durchgeführt wurde, wurden Pumppulse aus einem XFEL (mit einer Energie von ≈ 0.02 bis 0.27 mJ, einer Dauer von ≈ 50 fs und einer maximalen Intensität von ≈ 2 × 1017 W∕cm2 ) in eine Gaszelle mit Neonatomen (Druck ≈ 500 Torr) fokussiert (Größe des Brennflecks ≈ 1 μm), wo sie eine lange, schmale Säule von vorübergehend innerschalen-angeregten Ionen erzeugten. Spontan emittierte Photonen (𝜏sp ≈ 130 fs) in der Umgebung des vorderen Endes der Säule initiierten eine ASE, die entlang des Weges des Laserpulses exponentiell anstieg, der rechtzeitig zu dem Zeitpunkt Atome im angeregten Zustand präparierte, in dem die ASE der Ne Kα von bereits zuvor angeregten Atomen dort ankam. Einige charakteristische Parameter dieses Übergangs sind in Tabelle 15.1 aufgeführt. Die emittierten Pulse der ASE hatten eine Energie von ≈ 1 μJ, eine Dauer von ≈ 5 fs, eine Divergenz von ≈ 1 mrad und einen Energieumwandlungswirkungsgrad von ≈ 4 × 10−3 . Der Gewinnkoeffizient für einen einzelnen Durchgang betrug ≈ 65 cm−1 und das Produkt aus Länge und Gewinnkoeffizient betrug 𝛾 d ≈ 18. Eine Verdoppelung der XFEL-Pulsenergie von 0.12 auf 0.24 mJ erhöhte die Energie der emittierten Pulse um den Faktor 104 . Die Laserlinie hatte Lorentzform mit einer Breite von 0.27 eV, im Wesentlichen aufgrund von Lebensdauerverbreiterung infolge der Augerübergänge. Die niedrige Betriebstemperatur und die geringe Dichte des Neongases machten Dopplerund Stoßverbreiterung vernachlässigbar; die beobachtete Linienbreite war tatsächlich wesentlich schmaler als die mit Röntgenlasern auf der Basis von Plasmen erreichbare. Vereinfacht gesagt diente der optisch innerschalengepumpte Röntgenlaser in diesem Experiment dazu, die fluktuierende selbstverstärkte Strahlung der spontanen Emission (SASE, von engl. self-amplified spontaneous emission) des Freie-Elektronen-Pumplasers in eine hochstabile, schmalbandige, kohärente Röntgenquelle umzuwandeln; eine Transformation, die an den Betrieb von diodengepumpten Festkörperlasern erinnert (Abschnitt 16.3.1).
519
520
16 Laser
Beispiel 16-10: Ein XFEL-innenschalengepumpter Kupferlaser für harte Röntgenstrahlung
Der XFEL-innenschalengepumpte Kupferlaser ähnelt dem XFEL-innenschalengepumpten Neonlaser aus Beispiel 16-9, bietet jedoch zwei zusätzliche wichtige Merkmale: (1) Er arbeitet im Bereich der harten Röntgenstrahlung und (2) er kann mit einem Zweifrequenz-XFEL als Seedlaser betrieben werden. Durch optisches Pumpen der inneren Schalen mit einem Freie-Elektronen-Röntgenlaser bei 1.4 Å (E P = 8.9 keV) kann aus einer 20 μm dicken Kupferfolie eine Laseremission auf der Cu-Kα -Linie bei 1.54 Å (E P = 8.0 keV) erhalten werden. 8) Eine Reihe von Parametern dieses Übergangs sind in Tabelle 15.1 aufgeführt. Wenn eine spektrale Nebenlinie des XFEL als Seedstrahlung verwendet wurde, steigerte sich die Verstärkung um einen Faktor von etwa 100 und die zeitliche Kohärenz der erhaltenen Strahlung verbesserte sich erheblich. Anwendungen von EUV- und Röntgenlasern
Zu den Anwendungen von EUV- und Röntgenlasern gehören die Nanolithographie für integrierte Halbleiterschaltungen, die Nanostrukturierung von Oberflächen, die Nanobildgebung, die Plasmadiagnostik, die medizinische Bildgebung, die hochauflösende Spektroskopie, die nichtlineare Röntgenoptik und die dynamische Bildgebung und Holographie von biologischen und anderen Strukturen. Freie-Elektronen-Laser
Ein Freie-Elektronen-Laser (FEL) nutzt einen durch Beschleuniger erzeugten relativistischen Elektronenstrahl, der durch einen Kanal zwischen zwei gegenüberliegenden Reihen von stationären Magneten mit wechselnder Polarität (den Undulator oder Wiggler) geleitet wird (Abb. 16.30). Der Elektronenstrahl dient als Pumpe für den FEL und seine Wechselwirkung mit dem elektromagnetischen Feld dient als aktives Medium. Die Bezeichnung „Freie-Elektronen-Laser“ deutet an, dass die Elektronen im Gegensatz zu denen in den meisten anderen Lasern nicht in Atomen oder Molekülen gebunden sind. Da die Bewegung der Elektronen sowohl vom Wiggler als auch von dem erzeugten Feld beeinflusst wird, ist die Beschreibung „frei“ allerdings nicht ganz zutreffend. 8) Siehe H. Yoneda, Y. Inubushi, K. Nagamine, Y. Midline, H. Ohashi, H. Yumoto, K. Yamauchi, H. Mimura, H. Kitamura, T. Katayama, T. Ishikawa, M. Yabashi, ‚Atomic Inner-Shell Laser at 1.5-Ångstrom Wavelength Pumped by an X-Ray Free-Electron Laser‘, Nature 524, 446–449, 2015.
Der Undulator erzeugt ein periodisches transversales statisches magnetisches Wigglerfeld, das bei korrekter Auslegung der Polschuhe in der Umgebung der Achse des Undulators nahezu sinusförmig gemacht werden kann. Das Wigglerfeld bewirkt wiederum, dass die Elektronen nahezu sinusförmige Transversalschwingungen erfahren. Relativistische Elektronen, die unter der Wirkung eines Magnetfeldes beschleunigt oder abgebremst werden, emittieren in einem engen Kegel tangential zur Elektronenbahn in Vorwärtsrichtung Synchrotronstrahlung. Diese Strahlung ist aufgrund der Struktur des Undulators schmalbandig, aufgrund der konstruktiven und destruktiven Interferenz zwischen den von den zufällig verteilten Elektronen emittierten Wellen jedoch inkohärent. Der Laservorgang kann durch spontane Emissionen am Eingang des Undulators ausgelöst werden, die mit den inhärenten Fluktuationen der Positionen der Elektronen (Elektronenschrotrauschen) verknüpft sind. Da die Elektronen stark relativistisch sind und sich im Wesentlichen mit Lichtgeschwindigkeit bewegen, breiten sie sich synchron mit der von ihnen erzeugten Strahlung aus und bleiben über große Entfernungen mit dieser gekoppelt, wodurch die spontane Synchrotronstrahlung anwachsen kann. Wenn die Strahlung ausreichend stark wird, entsteht eine Wechselwirkung zwischen ihrem transversalen Feld und der transversalen Komponente des Elektronenstroms. Das führt dazu, dass einige Elektronen Energie an das Feld verlieren, während andere durch die mit dem elektrischen Feld verknüpfte ponderomotorische Kraft ℱp = −(𝑒 2 (4𝑚0 𝜔2 )∇(ℰ)2 Energie gewinnen, wobei 𝜔 und ℰ die Kreisfrequenz bzw. Amplitude des oszillierenden Feldes sind. Dies führt wiederum dazu, dass sich die Elektronen in aufeinander folgenden Pulks in Abständen von einer optischen Wellenlänge entlang der Achse des Undulators aufreihen, und damit zu Emissionen führen, die mit der Phase des Feldes kohärent sind. Das Ergebnis ist eine Sättigungsleistung, die die Leistung der Synchrotronstrahlung um viele Größenordnungen übertrifft. Dieser Weg zur Laserwirkung wird als selbstverstärkte spontane Emission (SASE, von engl. self-amplified spontaneous emission) bezeichnet. Alternativ kann der Laserprozess auch durch ein mit dem FEL in Resonanz stehendes Strahlungsfeld gestartet werden, sodass der FEL einfach als Verstärker wirkt. Die Seedstrahlung kann durch den FEL selbst („Self-Seeding“) oder durch eine äußere Quelle erzeugt werden, z. B. durch Erzeugung hoher Harmonischer.
16.3 Bauarten von Lasern
Undulator
Spiegel
Elektronenstrahl
N
S
Spiegel
N
N
S
Elektronenstrahl S
N
S
N
S
Abb. 16.30 Schematische Darstellung des Oszillators eines typischen FEL. Der Undulator erzeugt eine periodische magnetische Flussdichte im Bereich von 1 T. Die Undulatorperiode beträgt einige Zentimeter; der gesamte Undulator besteht aus einigen zehn bis hin zu einigen tausend Perioden; seine Gesamtlänge beträgt einige Meter bis über zehn Meter. Der Elektronenstrahl mit einem Durchmesser von einigen Millimetern wird durch Ablenkmagnete in den Undulator geführt. Der Strom des Elektronenstrahls reicht von einigen Ampere bis zu einigen Kiloampere, die Elektronenenergie von einigen MeV bis zu mehreren GeV. Die Pulsdauer der emittierten Strahlung folgt der des Elektronenpulses
und reicht vom Femtosekunden- bis in den Mikrosekundenbereich. Sowohl spontane als auch induzierte Emission treten auf; in Wellenlängenbereichen, in denen Resonatoren hergestellt werden können, kann die Oszillation durch Spiegel gefördert werden. Ein FEL-Oszillator hat typischerweise einen Spiegelabstand d , der etwa der doppelten Undulatorlänge entspricht, und kann einen Strahl mit einer Taille von einigen Millimetern führen. FEL können aber auch auf der Grundlage eines einzigen Durchgangs durch den Undulator betrieben werden, was besonders im Röntgenbereich nützlich ist, wo die Herstellung von Spiegeln Probleme bereitet.
Die Wellenlänge des von einem Freie-Elektronen-Laser auf der Achse emittierten Lichts ist
und der Lorentzfaktor 𝛾, die ebenfalls eine Verringerung der emittierten Wellenlänge bewirken. Ein FEL kann somit durch Anpassung der Energie E Strahl des Elektronenstrahls, der Undulatorperiode 𝛬U und des Undulatorparameters 𝐾 einen breiten Bereich von Betriebswellenlängen abdecken. Da ein FEL im Vakuum arbeitet, sind hohe Peakleistungen möglich, ohne dass Materialschäden entstehen oder thermische Linseneffekte auftreten. Außerdem ist das Verstärkungsmedium bei allen Wellenlängen transparent. Obwohl FEL einerseits hochkomplex sind und große und teure Anlagen erfordern, bieten sie andererseits doch eine unübertroffene Leistung, insbesondere in Wellenlängenbereichen, die mit anderen Lasern schwer abzudecken sind. Freie-Elektronen-Laser können in einem großen Teil des elektromagnetischen Spektrums betrieben werden, darunter der Mikrowellenbereich, das Infrarot, der sichtbare Bereich sowie der Ultraviolett- und Röntgenbereich. Viele Einrichtungen betreiben mehrere FEL und Strahllinien. Einige typische Beispiele sind:
𝜆FEL ≈
𝛬U 𝐾2 ), (1 + 2 2 2𝛾
(16.49)
wobei 𝛬U die √ räumliche Periode des Undulators ist und 𝛾 = 1∕ 1 − v 2 ∕𝑐02 ≈ E Strahl ∕𝑚0 𝑐02 der relativistische Lorentzfaktor; die Ruheenergie der Elektronen ist 𝑚0 𝑐02 ≈ 0.511 MeV. Der Undulatorparameter (Parameter der magnetischen Ablenkung) ist 𝐾 = 𝑒ℬ𝛬U ∕2π 𝑚0 𝑐0 , wobei ℬ die magnetische Flussdichte ist. Die Emissionswellenlänge des FEL in Gl. (16.49) hat die Form 𝜆FEL ∝ 𝛬U ∕𝛾 2 . Physikalisch bedeutet diese Beziehung, dass 𝜆FEL an eine skalierte Version der Undulatorperiode 𝛬U angepasst ist, wobei der Skalierungsfaktor 1∕𝛾 2 aus den Anforderungen der Relativitätstheorie resultiert. Ein Faktor von 1∕𝛾 ergibt sich aus der Längenkontraktion der räumlichen Undulatorperiode im Ruhesystem des relativistischen Elektrons, ein weiterer Faktor von 1∕𝛾 aus der Zeitdilatation der emittierten Strahlung im Laborsystem, die der relativistischen Dopplerverschiebung entspricht. Nach Gl. (16.49) führt eine Verkleinerung der räumlichen Periode 𝛬U des Undulators zu einer Verkleinerung der Wellenlänge 𝜆FEL des emittierten Lichts; dasselbe bewirkt eine Reduktion der magnetischen Flussdichte ℬ, die in dem Undulatorparameter 𝐾 enthalten ist. Wenn die Energie E Strahl des Elektronenstrahls zunimmt, steigen auch die Elektronengeschwindigkeit v
Der elektrostatische FEL an der University of California in Santa Barbara arbeitet bei Wellenlängen von 2.5 mm bis 63 μm. IR/sichtbarer Bereich/UV: Der iFEL 1–5 LINAC FEL an der Universität Osaka arbeitet bei Wellenlängen von 100 μm bis 230 nm. Mikrowellenbereich/Fernes Infrarot:
521
522
16 Laser
Der OK4-Speicherring-FEL an der Duke University arbeitet bei Wellenlängen von 400 nm bis 193 nm. EUV: Der FERMI-LINAC-FEL von Elettra Sincrotrone Trieste arbeitet bei Wellenlängen zwischen 100 nm und 4 nm. Weiche/harte Röntgenstrahlung: Die Linac Coherent Light Source (LCLS) im SLAC der Stanford University arbeitet bei Wellenlängen zwischen 44 Å und 1.1 Å. Nahes und mittleres UV:
Freie-Elektronen-Laser im Röntgenbereich (XFEL)
Wie bereits erwähnt können Freie-Elektronen-Laser im Röntgenbereich betrieben werden, indem man hohe Energien des Elektronenstrahls und kleine Undulatorperioden nutzt. Aufgrund der Schwierigkeit, Laserresonatoren für den Röntgenbereich zu bauen, arbeiten XFEL häufig mit einem einzigen Durchgang durch einen langen Undulator und nutzen selbstverstärkte spontane Emission (SASE) oder einen Seedlaser. Dieser letzte Ansatz bietet in der Regel eine überlegene Leistung in Bezug auf die erreichbare Ausgangsleistung und ihre zeitliche Kohärenz. Heutige XFEL werden in der Regel von kilometerlangen Linearbeschleunigern (LINAC) angetrieben, die energiereichere und intensivere Röntgenstrahlung liefern als Geräte, in denen die Elektronen zirkulieren, wie z. B. Synchrotrons oder Elektronenspeicherringe. Es werden Anstrengungen unternommen, um die Ausmaße von XFEL von Kilometern auf Meter zu verringern, indem Miniaturbeschleuniger auf der Grundlage der Plasma-Kielfeldbeschleunigung (PWFA, von engl. plasma wakefield acceleration) oder LaserKielfeldbeschleunigung (LWFA, von engl. laser wakefield acceleration) 9) mit Undulatoren und kompakten Elektronenkanonen gekoppelt werden. Zwar stehen wie bereits erwähnt ultraschnelle Pulse weicher Röntgenstrahlung auf dem Weg der Erzeugung hoher Harmonischer (HHG) zur Verfügung, allerdings können XFEL härtere und sehr viel energiereichere Röntgenpulse liefern. Beispiel 16-11: Linac Coherent Light Source (LCLS) XFEL
Die Linac Coherent Light Source (LCLS) des SLAC ist ein 1 km langer SASE-Freie-Elektronen-Laser, der ultraschnelle Pulse harter Röngtenstrahlung mit einer Wiederholungsrate von 120 Hz erzeugt. 10) Sein Undulator aus Nd-Fe-B-Permanentmagneten besteht aus 33 je 3.4 m langen Abschnitten und hat eine 9) Siehe z. B. F. Albert, ‚Laser Wakefield Accelerators: Next Generation Light Sources‘, Optics & Photonics News 29(1), 42–49, 2018.
aktive Gesamtlänge von 112 m. Die Undulatorperiode beträgt 𝛬U = 3 cm und der magnetische Ablenkungsparameter ist 𝐾 = 3.5, was einem magnetischen Peak-Wigglerfeld von 1.25 T entspricht. Der LCLS verwendet einen Elektronenstrahl, dessen Energie von 2.5 bis 15.9 GeV einstellbar ist, entsprechend einem Lorentzfaktor 𝛾 ≈ E Strahl ∕(0.511 MeV) im Bereich von 4892 bis 31 115. Nach Gl. (16.52) entspricht dies einem Laserbetrieb über den Wellenlängenbereich 4.4 ≥ 𝜆FEL ≥ 0.11 nm. Der LCLS erzeugt kohärente Röntgenpulse mit einer Energie von ≈ 2 mJ, einer Dauer zwischen 2 und 500 fs (Halbwertsbreite), einer Peakleistung von ≈ 20 GW, einer Intensität von ≈ 1021 W∕cm2 und einer mittleren Leistung von ≈ 200 mW. Die maximale Intensität liegt etwa 10 Größenordnung über der, die bei Verwendung einer herkömmlichen inkohärenten Synchrotronquelle erreichbar wäre. Multipuls- und MehrfarbenLaserbetrieb mit fester oder variabler Zeit- und/oder Wellenlängenseparation sind ebenso möglich wie Polarisationssteuerung. Die Option, einen externen oder internen Seed zu verwenden, ermöglicht eine höhere Leistung und eine verbesserte zeitliche Kohärenz. Die Pulswiederholrate des LCLS ist auf 120 Hz begrenzt, um Schäden an den Kupferkavitäten des LINAC zu vermeiden. Eine hohe Wiederholungsrate erleichtert die Bildgebung erheblich, da innerhalb eines gegebenen Zeitraums mehr Bilder registriert werden können. Der im Jahr 2017 in Betrieb genommene European XFEL am Deutschen Elektronen-Synchrotron (DESY) in Hamburg arbeitet aufgrund seines supraleitenden Linearbeschleunigers mit einer mittleren Wiederholrate von 27 kHz. Dieser FEL erzeugt harte Röntgenstrahlung in Form von Clustern aus 2700 Pulsen in Abständen von 220 ns, die sich mit einer Rate von 10 Hz periodisch wiederholen. Aufgrund seiner hohen Wiederholungsrate ist die mittlere Leistung und Intensität dieses 3.4 km langen SASE-FEL mit 17.5 GeV fast 1000-mal höher ist als die des LCLS. Im Jahr 2021 soll ein neuer supraleitender LINAC-FEL mit dem Namen LCLS-II im SLAC National Accelerator Laboratory in Betrieb gehen, der unter anderem eine Wiederholrate von 1 MHz ermöglicht.
10) Siehe P. Emma, R. Akre, J. Arthur, R. Bionta, C. Bostedt, J. Bozek, A. Brachmann, P. Bucksbaum, R. Coffee, F.-J. Decker, Y. Ding, D. Dowell, S. Edstrom, A. Fisher, J. Frisch, S. Gilevich, J. Hastings, G. Hays, Ph. Hering, Z. Huang, R. Iverson, H. Loos, M. Messerschmidt, A. Miahnahri, S. Moeller, H.-D. Nuhn, G. Pile, D. Ratner, J. Rzepiela, D. Schultz, T. Smith, P. Stefan, H. Tompkins, J. Turner, J. Welch, W. White, J. Wu, G. Yocky, J. Galayda, ‚First Lasing and Operation of an Angstrom-Wavelength Free-Electron Laser‘, Nature Photonics 4, 641–647, 2010.
16.4 Gepulste Laser
Anwendungen von Röntgen-FEL
Röntgen-FEL (XFEL) dienen als Quelle für energiereiche, ultraschnelle und kohärente Röntgenstrahlung. Mit den von ihnen emittierten kurzen und intensiven kurzwelligen Pulse haben XFEL die Aufnahme von Bildern und Filmen von physikalischen, chemischen und biologischen Strukturen und Prozessen auf zuvor unvorstellbaren räumlichen und zeitlichen Maßstäben revolutioniert. Röntgen-FEL haben auch die Untersuchung von nichtperiodischen Systemen, nichtkristallinen Zuständen, dynamischen Nichtgleichgewichtsprozessen und nichtlinearen Röntgenphänomenen beschleunigt. Mit einer räumlichen Auflösung im Bereich von Ångström und einer zeitlichen Auflösung im Bereich von Femtosekunden hat die XFEL-Bildgebung geholfen, die Funktionsweise von Prozessen in der Photonik, den Materialwissenschaften und der Medizin aufzuklären. Um für die räumlich und zeitlich hochaufgelöste Bildgebung infrage zu kommen, muss eine gepulste Strahlungsquelle eine Reihe von Anforderungen erfüllen; XFEL sind hierfür gut gerüstet: Für die kohärente Bildgebung zeitliche und räumliche Kohärenz Räumliche Kohärenz wird für den SASE-
Betrieb, zeitliche Kohärenz für den Seedbetrieb erreicht. Zeitliche Auflösung auf atomarer Zeitskala (bohrsche Periode T 0 ≈ 150 as) Pulsdauern von ≈ 1 fs sind aktuell
möglich; die Erzeugung von Attosekundenpulsen ist in Vorbereitung. Hohe Energie und hohe Peakleistung Derzeit werden Pulse mit mJ-Energien und Peakleistungen von zehn GW erreicht; Strahlen mit Photonenenergien > 50 keV sind in Planung. Hohe mittlere Leistung für schnelle Bildfolge Momentan sind Pulswiederholungsraten von einigen zehn kHz möglich; Raten bis 1 MHz sind in Entwicklung. Räumliche Auflösung auf atomarer Längenskala (bohrscher Radius 𝒂0 ≈ 53 nm) Eine Fokussierung auf
Punkte im Nanometerbereich ist derzeit möglich. Hohe Intensität zur Erleichterung extremer nichtlinearer Röntgenwechselwirkungen Pulsintensitäten von bis
zu ≈ 1021 W∕cm2 sind derzeit möglich. Mehrfarben- und Multipulsbetrieb Pulse mit fester oder variabler Wellenlänge und/oder Zeitseparation sind möglich. XFEL bieten in einer ganzen Reihe von Anordnungen zur Bildgebung eine unvergleichliche räumlich-zeitliche Auflösung und haben neue Methoden der Bildgebung wie die serielle kohärente Femtosekunden-Röntgenbeugungsbildgebung etabliert. Dabei erzeugt ein einzelner ultraschneller hochenergeti-
scher XFEL-Puls ein Beugungsbild eines Ziels, bevor dieses photoionisiert wird und über eine „Coulombexplosion“ verdampft; man spricht hier von Beugung vor Zerstörung. Solche individuellen Beugungsmuster werden nacheinander von vielen einzelnen Teilchen aufgezeichnet, die in einem Teilchenstrahl in den XFELStrahl injiziert werden. Anschließend werden Beugungsmuster mit derselben Orientierung kombiniert, um einen vollständigen Satz von 3D-Beugungsdaten zu erzeugen, aus denen durch Phasenwiederherstellung ein Bild der Teilchen extrahiert wird. Diese Methode eignet sich für eine Vielzahl von Objekten wie beispielsweise Nanokristalle, Proteine oder Viren. Durch optische/Röntgen-Anregungs-/Aufzeichnungs-Experimente lassen sich wertvolle Informationen über das Innenleben von Molekülen erhalten. Dabei werden ultraschnelle optische Laserpulse verwendet, um ein Ziel elektronisch anzuregen, bevor es nach einer einstellbaren Verzögerungszeit mithilfe von XFEL-Pulsen abgetastet wird. Die gesammelten Daten werden zu einem Film verarbeitet, der die Änderungen der elektronischen Zustände und der Molekülstruktur im Femtosekundenbereich nachvollzieht. Auf diese Weise wurde die Reorganisation von Elektronenwolken bei der Bildung oder Trennung von Molekülbindungen visualisiert.
16.3.7 Tabelle ausgewählter Eigenschaften Tabelle 16.1 gibt eine Auflistung typischer Eigenschaften einiger häufiger Laser, nach steigender Wellenlänge sortiert. Der große Bereich von Übergangswellenlängen, Gesamtwirkungsgraden und Ausgangsleistungen der unterschiedlichen Laser sind beachtenswert. Die Übergangsquerschnitte, spontanen Lebensdauern und atomaren Linienbreiten für einige dieser Laserübergänge sind in Tabelle 15.1 aufgeführt. Die Linienbreiten der Laserstrahlen liegen im Allgemeinen viele Größenordnungen unter den atomaren Linienbreiten aus Tabelle 15.1; der Grund hierfür ist die zusätzliche Frequenzselektivität des Resonators.
16.4 Gepulste Laser Manchmal ist es wünschenswert, Laser gepulst zu betreiben, da die optische Leistung außerordentlich vergrößert werden kann, wenn der Ausgangspuls eine kurze Dauer hat. Laserpulse bis in den Femtosekundenbereich sind heute problemlos erzeugbar; durch Methoden aus der nichtlinearen Optik können sie weiter bis in den Bereich von Attosekunden verkürzt werden (Ab-
523
524
16 Laser
Tab. 16.1 Typische Eigenschaften und Parameter einiger häufiger Lasermedien, nach steigender Wellenlänge sortiert. Wellenlänge 𝝀0 d. Übergangs
Modenzahlb)
Betriebsweisec)
𝜼U (ca., %)d)
PA bzw. EA e)
1.1–44 Å
V
P
10−6
2 mJ
14.6 Å
E
P
10−9
1 μJ
Ag19+ (p)
13.9 nm
V
P
10−4
85 μJ
C5+ (p)
18.2 nm
V
P
10−3
2 mJ Abb. 14.1
ArF Exciplex (g)
193 nm
V
P
0.2
1J
KrF Exciplex (g)
248 nm
V
P
0.4
1.5 J
Ar+ (g)
515 nm
E/V
D
0.05
15 W
Aktives Mediuma)
XFEL (LCLS) Ne+
Kα (g)
Rhodamin-6G (l)
Energieniveauschema
560–640 nm
E/V
D
10
100 mW Abb. 14.8
Ne (He-Ne, g)
633 nm
E/V
D
0.1
50 mW Abb. 14.2
Kr+ (g)
647 nm
E/V
D
0.01
Cr3+:Al2 O3 (Rubin, s)
694 nm
V
D
4
700–820 nm
V
D
40
Cr3+:BeAl2 O4 (Alexandrit, s) Ti3+:Al2 O3 (s)
1W 1 W Abb. 15.15 25 W Abb. 14.4
700–1 050 nm
E/V
D
0.1
5 W Abb. 16.25
Yb3+:YAG (Scheibe, s)
1 030 nm
E/V
D
30
1 kW Abb. 16.24
Nd3+:Phosphatglas (s)
1 053 nm
E/V
P
1
50 J Abb. 15.17
Nd3+:YAG
1 064 nm
E/V
D
15
Nd3+:YVO4 (s)
(s)
1 064 nm
E/V
D
30
Yb3+:Quarzglasfaser (s)
1 070 nm
E/V
D
40
Cr4+:Mg2 SiO4 (Forsterit, s) Er3+:Quarzglasfaser (s)
1 100–1 400 nm
V
D
0.5
1 550 nm
E/V
D
20
200 W Abb. 14.5 30 W Abb. 16.23 10 kW 1W 2 kW Abb. 15.20
Tm3+:Quarzglasfaser (s)
1 800–2 100 nm
E/V
D
35
500 W
Cr2+:ZnS (s)
1 900–3 000 nm
E/V
D
25
100 W
Ne (He-Ne, g)
3.39 μm
E/V
D
0.1
CO2 (g)
10.6 μm
E/V
D
15
H2 O (g)
28 μm
E/V
D
0.05
250 mW
CH3 OH (g)
118.8 μm
E/V
D
0.03
150 mW
HCN (g)
336.8 μm
E/V
D
0.05
120 mW
20 mW Abb. 14.2 500 W Abb. 14.7
a) g: Gas, s: Festkörper, l: Flüssigkeit, p: Plasma. b) E: Einmodenbetrieb, V: Vielmodenbetrieb. c) D: Dauerstrichbetrieb, P: Pulsbetrieb; mit „D“ bezeichnete Laser können natürlich auch gepulst betrieben werden; mit „P“ bezeichnete Laser werden meist gepulst betrieben. d) Der Leistungsumwandlungswirkungsgrad 𝜂U (auch Gesamtwirkungsgrad genannt) ist das Verhältnis der optischen Ausgangsleistung zur aufgewendeten elektrischen Leistung (für gepulste Laser das Verhältnis der optischen Ausgangsenergie zur aufgewendeten elektrischen Energie). Die angegebenen Werte enthalten eine signifikante Unsicherheit, da sie teilweise die für Zusatzaufgaben wie Abkühlen oder Prozesssteuerung aufgewendete elektrische Leistung mit einschließen. Laserdioden besitzen die höchsten Wirkungsgrade, die teilweise über 70 % liegen, wie in Abschnitt 19.4 diskutiert wird. e) Die Ausgangsleistung 𝑃A (für kontinuierlich betriebene Systeme) bzw. Ausgangsenergie 𝐸A variieren über einen großen Bereich, teilweise aufgrund der großen Variation der Pulsdauern; angegeben sind typische Werte. Wo möglich, sind Werte für den Einmodenbetrieb ohne Verstärkung angegeben; die Werte für den Vielmodenbetrieb sind in der Regel deutlich höher. Die Ausgangsleistungen von Lasersystemen für die industrielle Anwendung können um Größenordnungen höher sein.
schnitt 23.2). Die maximalem Pulswiederholungsraten erreichen Werte im THz-Bereich; die maximalen Energien und Intensitäten der Pulse können außerordentlich groß sein. Ein Puls mit einer Dauer von 10 fs und einer Energie von 10 mJ entspricht beispielsweise einer
Peakleistung von 1 TW! Wenn ein solcher Puls auf einen Fleck mit einem Radius von 3 μm fokussiert wird, beträgt die Peakintensität 7 EW∕cm2 . Derartige Laser müssen gepulst betrieben werden, da ein kontinuierlicher Betrieb nicht möglich ist (siehe Tabelle 16.1).
16.4 Gepulste Laser
16.4.1 Methoden zur Erzeugung von Laserpulsen Die direkteste Methode, um gepulstes Licht aus einem Laser zu erhalten, besteht darin, einfach einen Dauerstrichlaser mit einem externen Schalter oder Modulator zu koppeln, der das Licht nur während ausgewählter kurzer Zeitintervalle durchlässt. Diese einfache Methode hat jedoch zwei gravierende Nachteile. Erstens ist sie ineffizient, da sie das Licht während der Dunkelphasen blockiert (und daher seine Energie vergeudet). Zweitens kann die maximale Leistung der Pulse nicht größer sein als die kontinuierliche Leistung des Lasers, wie in Abb. 16.31(a) zeigt. Effizientere Methoden zur Erzeugung gepulster Strahlung beruhen darauf, dass der Laser mithilfe eines internen Modulationsprozesses selbst an- und abgeschaltet wird, sodass die Energie während der Dunkelphase gespeichert und während der Hellphase abgegeben wird. Die Speicherung kann entweder in Form von Licht im Resonator oder in den Energieniveaus des aktiven Mediums erfolgen. Diese Methoden erlauben die Erzeugung kurzer Laserpulse mit Leistungsspitzen weit über der konstanten Leistung eines entsprechenden Dauerstrichlasers, wie Abb. 16.31(b) illustriert. Vier übliche Verfahren für die interne Modulation des Laserlichts sind die Gewinnmodulation, die Gütemodulation, die Auskopplungsmodulation und die Modenkopplung. Diese wollen wir im Folgenden nacheinander betrachten.
Die Gewinnmodulation
Die Gewinnmodulation ist ein sehr direkter Ansatz zur Kontrolle des Gewinns durch Ein- und Ausschalten des Pumpsystems (Abb. 16.32). Bei einem gepulsten Rubinlaser, der mit einer Blitzlampe gepumpt wird, wird die Pumpe (Blitzlampe) beispielsweise durch eine Folge von elektrischen Pulsen regelmäßig für kurze Zeitspannen eingeschaltet. Während der Hellphasen ist der Gewinnkoeffizient größer als der Verlustkoeffizient und der Laser strahlt. Die meisten gepulsten Halbleiterlaser sind gewinnmoduliert, weil es einfach ist, den für das Pumpen verwendeten elektrischen Strom zu modulieren (Abschnitt 18.3). Die durch Gewinnmodulation erreichbaren Anstiegs- und Abklingzeiten der Laserpulse werden in Abschnitt 16.4.2 untersucht. Die Gütemodulation
Bei der Gütemodulation wird der Laserausgang abgeschaltet, indem der Resonatorverlust mithilfe eines modulierten Absorbers innerhalb des Resonators regelmäßig vergrößert wird (der Gütefaktor 𝑄 des Resonators verringert wird) (Abb. 16.33). Die Gütemodulation ist somit eine Verlustmodulation. Weil die Pumpe kontinuierlich eine konstante Leistung liefert, wird während der Dunkelphase (der Zeit hohen Verlusts) Energie in den Energieniveaus des aktiven Mediums gespeichert. Wenn die Verluste während der Hellphase reduziert werden, wird diese gespeicherte Energie freigegeben, wobei intensive (gewöhnlich kurze) Lichtpulse entstehen. Eine Analyse dieser Methode folgt in Abschnitt 16.4.3.
Modulator
Abb. 16.31 Vergleich von Laserpulsen, die (a) durch einen externen Modulator und (b) einen internen Modulator erzeugt werden.
Modulator
Maximalleistung Maximalleistung
(a)
Pumpen
Dauerleistung t
mittlere Leistung t
(b)
Abb. 16.32 Gewinnmodulation.
Pumpen t
Gewinn Verlust t
Laserstrahl t
525
526
16 Laser
Abb. 16.33 Gütemodulation. Während der Dunkelphasen wird Energie in der Besetzungsinversion des aktiven Mediums gespeichert. Der Verlust des Resonators wird durch einen Absorber gesteuert.
Verlust Gewinn modulierter Absorber
t Laserstrahl t
Spiegeldurchlässigkeit t Gewinn Verlust t Laserstrahl
Abb. 16.34 Auskopplungsmodulation. Während der Dunkelphasen wird Energie in Form einer steigenden Photonenzahldichte im Resonator gespeichert. Einer der Spiegel wird periodisch vollständig entfernt (z. B. indem er gedreht wird), um die gespeicherten Photonen als nutzbares Licht auszukoppeln.
t
Die Auskopplungsmodulation
Die Auskopplungsmodulation beruht auf der Speicherung von Photonen (im Gegensatz zur Speicherung von Energie in den Energieniveaus des aktiven Mediums) im Resonator während der Dunkelphasen und ihrer Auskopplung in den Hellphasen. Sie unterscheidet sich von der Gütemodulation dadurch, dass der Resonatorverlust durch Veränderung der Spiegeltransmission moduliert wird (siehe Abb. 16.34). Das System funktioniert wie ein Wassereimer, in den aus einem Schlauch mit konstanter Geschwindigkeit Wasser gegossen wird. Der Eimer entspricht dem Resonator, der Wasserschlauch ist die konstante Pumpe und der Eimerboden ist der Ausgangsspiegel des Resonators. Nachdem eine Zeitlang Wasser gesammelt wurde, wird der Boden des Eimers plötzlich entfernt, sodass das Wasser „ausgekoppelt“ wird. Der Eimerboden wird anschließend wieder angebracht und der Prozess wiederholt. Ein konstanter Wasserstrom wird so in einen gepulsten Strom umgewandelt. Während der Dunkelphase wird das Licht (auch das nutzbare Licht) daran gehindert, aus dem Resonator zu entkommen. Das bedeutet vernachlässigbare Resonatorverluste, wodurch die optische Leistung innerhalb des Laserresonators vergrößert wird. Die Photonen werden im Resonator gespeichert und können nicht entkommen. Der Spiegel wird plötzlich vollständig entfernt (z. B. indem er aus der Achse gedreht wird), sodass seine Transmission während der Hellphase aus 100 % vergrößert wird. Wenn die gespeicherten Photonen den Resonator verlassen, stoppt die plötzliche Zunahme des Verlusts die Oszillation. Das Ergebnis ist ein starker Lichtpuls. Eine genaue Analyse der Auskopplungsmodulation werden wir nicht durchführen, weil
sie eng mit der der Gütemodulation verwandt ist. Der Grund dafür ist, dass die zeitliche Variation des Gewinns bzw. Verlusts bei beiden Methoden ähnlich ist, wie aus einem Vergleich von Abb. 16.34 und Abb. 16.33 deutlich wird. Die Modenkopplung
Die drei zuvor besprochenen Methoden zur Erzeugung von Pulsen nutzen dynamische Einschwingvorgänge des Lasermediums aus. Die Modenkopplung unterscheidet sich von diesen Ansätzen insofern, als es sich bei ihr um einen dynamischen Prozess im stationären Zustand handelt. Sie ist die wichtigste Technik, um Folgen von ultrakurzen Laserpulsen zu erzeugen. Die gepulste Laserwirkung wird erreicht, indem die Moden eines Lasers und ihre Phasen gekoppelt werden. Ein Beispiel sind die Longitudinalmoden eines Vielmodenlasers, deren Frequenzen einen konstanten Abstand 𝑐∕2d voneinander haben. Wenn die Phasen dieser Komponenten gekoppelt werden, verhalten sie sich wie die Fourierkomponenten einer periodischen Funktion und bilden daher eine periodische Pulsfolge. Die Kopplung der Moden kann erreicht werden, indem man die Verluste innerhalb des Resonators periodisch moduliert. Die Modenkopplung wird in Abschnitt 16.4.4 ausführlicher untersucht.
16.4.2
Die Analyse von Einschwingvorgängen
Eine analytische Beschreibung des Betriebs von gepulsten Lasern erfordert ein Verständnis der Dynamik der Laseroszillation, d. h. des zeitlichen Verlaufs des Anfangs und des Endes der Laseroszillation. Die früher in
16.4 Gepulste Laser
diesem Kapitel vorgestellten Lösungen für den stationären Zustand reichen für diesen Zweck nicht aus. Der Laserprozess wird durch zwei Variablen bestimmt: die Zahl der Photonen im Resonator pro Volumeneinheit, n(𝑡), und die atomare Besetzungsunterschied pro Volumeneinheit, N(𝑡) = N2 (𝑡) − N 1 (𝑡); beide sind Funktionen der Zeit 𝑡.
Für die Photonenzahldichte ngilt die Geschwindigkeitsgleichung (16.50)
Der erste Term bezeichnet den Verlust an Photonen aus dem Resonator, dessen Geschwindigkeit durch den Kehrwert der Photonenlebensdauer 1∕𝜏P gegebenen ist. Der zweite Term bezeichnet den Nettogewinn an Photonen durch induzierte Emission und Absorption mit einer Geschwindigkeit NW ind . W ind = 𝜙 𝜎(𝜈) = 𝑐n 𝜎(𝜈) ist die Wahrscheinlichkeitsdichte für die induzierte Absorption/Emission. Wir nehmen an, dass die spontane Emission gering ist. Mithilfe der Beziehung NSch = 𝛼R ∕𝜎(𝜈) = 1∕𝑐𝜏P 𝜎(𝜈), wobei N Sch die SchwellenBesetzungsdifferenz ist [siehe Gl. (16.15)], können wir 𝜎(𝜈) = 1∕𝑐𝜏P NSch schreiben; daraus folgt W ind =
n NSch 𝜏P
.
(16.51)
Wenn wir das in Gl. (16.50) einsetzen, erhalten wir eine einfache Differentialgleichung für die Photonenzahldichte n, dn N n n . =− + 𝜏P NSch 𝜏P d𝑡
(16.52)
So lange N > NSch ist, ist dn∕ d𝑡 positiv, und n nimmt zu. Im stationären Zustand (dn∕ d𝑡 = 0) ist N = N Sch .
(16.54)
wobei der Besetzungsunterschied für kleine Signale
einsetzen, erhalten wir N0 dN N N n − −2 . = 𝑡sp 𝑡sp NSch 𝜏P d𝑡
(16.55)
Der dritte Term auf der rechten Seite von Gl. (16.55) ist das Doppelte des zweiten Terms auf der rechten Seite von Gl. (16.52) mit entgegengesetztem Vorzeichen. Das spiegelt die Tatsache wider, dass die Erzeugung eines Photons durch einen induzierten Übergang die Besetzung von Niveau 2 um ein Atom reduziert und die von Niveau 1 um ein Atom vergrößert, sodass der Besetzungsunterschied um zwei Atome vermindert wird. Die Gleichungen (16.52) und (16.55) sind nichtlineare gekoppelte Differentialgleichungen, deren Lösung das Einschwingverhalten der Photonenzahldichte n(𝑡) und des Besetzungsunterschieds N (𝑡) bestimmt. Wenn wir d N∕ d𝑡 = 0 und dn∕ d𝑡 = 0 setzen, erhalten wir N = NSch und n = (N0 − NSch )(𝜏P ∕2𝑡sp ). Das sind in der Tat die früher erhaltenen Werte von N und n im stationären Zustand, wie aus Gl. (16.35) mit 𝜏S = 2𝑡sp gemäß Gl. (15.42) für ein dreistufiges Pumpschema deutlich wird. Übung 16-3: Die Geschwindigkeitsgleichung für den Besetzungsunterschied eines Vierniveausystems
Bestimmen Sie die Geschwindigkeitsgleichung für den Besetzungsunterschied eines Vierniveausystems für 𝜏1 ≪ 𝑡sp . Erklären Sie die Abwesenheit des Faktors 2, der in Gl. (16.55) erscheint. Die Gewinnmodulation
Die Geschwindigkeitsgleichung für den Besetzungsunterschied
Die Dynamik des Besetzungsunterschieds N (𝑡) hängt von der Pumpanordnung ab. Im Folgenden analysieren wir ein Dreiniveauschema (siehe Abschnitt 15.2.2). Die Geschwindigkeitsgleichung für die Besetzung des oberen Energieniveaus des Übergangs ist gemäß Gl. (15.22), N2 d N2 − W ind (N 2 − N1 ) , =R− 𝑡sp d𝑡
N0 dN N − − 2W ind N , = 𝑡sp 𝑡sp d𝑡
N0 = 2R𝑡sp − Na ist [siehe Gl. (15.41)]. Wenn wir die zuvor erhaltene Beziehung W ind = n∕N Sch 𝜏P in Gl. (16.54)
Die Geschwindigkeitsgleichung für die Photonenzahldichte
dn n = − + NW ind . 𝜏P d𝑡
N2 + N1 mit N a , sodass N1 = (Na − N )∕2 und N2 = (Na + N)∕2 ist, und erhalten so eine Differentialgleichung für den Besetzungsunterschied N = N2 − N1 ,
(16.53)
wobei wir 𝜏2 = 𝑡sp angenommen haben. Die Pumpgeschwindigkeit R soll nicht von der Besetzungsdifferenz N abhängen. Wir bezeichnen die Gesamt-Atomzahldichte
Gewinnmodulation wird erreicht, indem die Pumpgeschwindigkeit R ein- und ausgeschaltet wird; dies ist äquivalent zu einer Modulation des Besetzungsunterschieds N0 = 2R𝑡sp − Na für kleine Signale. Abbildung 16.35 zeigt eine schematische Darstellung des typischen zeitlichen Verlaufs des Besetzungsunterschieds N(𝑡) und der Photonenzahldichte n(𝑡) für einen Laser, der durch Variation von N 0 gepulst wird. Dabei sind die folgenden Bereiche zu erkennen: • Für 𝑡 < 0 liegt der Besetzungsunterschied N(𝑡) = N0a unter dem Schwellenwert NSch , und es findet keine Oszillation statt.
527
528
16 Laser
• Die Pumpe wird bei 𝑡 = 0 eingeschaltet, woraufhin N0 entsprechend einer Stufenfunktion von einem Wert N0a unter der Schwelle auf einen Wert N0b über der Schwelle zunimmt. Der Besetzungsunterschied N(𝑡) beginnt dadurch zu steigen. So lange N (𝑡) < NSch ist, gilt für die Photonenzahldichte jedoch n = 0. In diesem Gebiet wird Gl. (16.55) daher zu d N∕ d𝑡 = (N 0 − N)∕𝑡sp , was zeigt, dass N(𝑡) mit der Zeitkonstante 𝑡sp exponentiell auf seinen Gleichgewichtswert N0b steigt. • Wenn N (𝑡) bei 𝑡 = 𝑡1 die Schwelle NSch übersteigt, beginnt die Laseroszillation und n(𝑡) steigt. Die Besetzungsinversion wird dann reduziert, sodass sich die Zunahme von N(𝑡) verlangsamt. Wenn n(𝑡) größer wird, wird die Besetzungsinversion immer kleiner, sodass N(𝑡) schließlich auf NSch abnimmt. Wenn N (𝑡) den Wert N Sch erreicht hat, erreicht n(𝑡) seinen Wert im stationären Zustand. • Zur Zeit 𝑡 = 𝑡2 wird die Pumpe abgeschaltet, woraufhin N0 zu seinem Anfangswert N 0a zurückkehrt. N(𝑡) und n(𝑡) fallen auf die Werte N0a bzw. 0. Das tatsächliche Profil des Aufbaus und Abklingens von n(𝑡) erhalten wir durch numerische Lösung der Gln. (16.52) Gl. (16.55). Die genaue Form der Lösung hängt von 𝑡sp , 𝜏P , NSch sowie N0a und N0b ab (siehe Aufgabe 16-11).
0(t)
0b
16.4.3
Die Gütemodulation
Der gepulste Laserbetrieb durch Gütemodulation wird erreicht, indem der Verlustkoeffizient 𝛼R des Resonators von einem großen Wert während der Dunkelphase zu einem kleinen Wert während der Hellphase umgeschaltet wird. Das kann auf verschiedene Arten erreicht werden, beispielsweise durch Einbringen eines Modulator in den Resonators, der periodisch große Verluste bewirkt. Da der Schwellen-Besetzungsunterschied N Sch des Lasers proportional zum Verlustkoeffizient 𝛼R des Resonator ist [siehe die Gln. (16.14) und (16.6)], ist die Folge des Umschaltens von 𝛼R , dass NSch sich von einem hohen Wert NSch,a auf einen kleinen Wert NSch,b verringert, wie Abb. 16.36 zeigt. Bei der Gütemodulation wird daher NSch moduliert, während N0 konstant bleibt, wohingegen bei der Gewinnmodulation N0 moduliert wird und NSch konstant bleibt (siehe Abb. 16.35). Die Auswirkungen auf die Besetzungs- und Photonenzahldichten sind: • Bei 𝑡 = 0 wird die Pumpe eingeschaltet; N0 folgt einer Stufenfunktion. Der Verlust bleibt so groß (NSch = NSch,a > N0 ), dass keine Oszillation auftritt. Der Besetzungsunterschied N(𝑡) nimmt daher zu (mit der Zeitkonstante 𝑡sp ). Obwohl das Medium jetzt ein Verstär-
Abb. 16.35 Zeitliche Variation des Besetzungsunterschieds N(t ) und der Photonenzahldichte n(t ), während N0 durch einen quadratischen Pumppuls plötzlich von einem niedrigen Wert N0a auf einen hohen Wert N 0b zunimmt und dann zu einem niedrigen Wert N 0a zurückkehrt.
Pumpen
(t) Besetzungszahl Verlust Sch
(t)
0a
t2
0 t1 τp ( 0b – Sch) 2tsp
t
(t) Photonenzahldichte
t
Sch,a
tsp
Sch
Verlust
0
Pumpen
(t) Besetzungsdifferenz
i
Sch,b f
0
t1
ti
t2
tf (t)
p
t (t) Photonenzahldichte t
Abb. 16.36 Betrieb eines gütemodulierten Lasers. Gezeigt sind die Variation der SchwellenBesetzungsdifferenz N Sch (die proportional zum Resonatorverlust ist), der Pumpparameter N 0 , die Besetzungsdifferenz N(t ) und die Photonenzahl n(t ).
16.4 Gepulste Laser
ker mit großem Gewinn ist, ist der Verlust so groß, dass die Oszillation verhindert wird. • Bei 𝑡 = 𝑡1 wird der Verlust plötzlich reduziert, sodass NSch auf einen Wert NSch,b < N 0 abnimmt. Die Oszillation beginnt daher und die Photonenzahldichte steigt schnell an. Die Anwesenheit der Strahlung verursacht eine Reduktion der Besetzungsinversion (Gewinnsättigung), sodass N(𝑡) wieder abnimmt. Wenn N(𝑡) unter NSch,b fällt, überschreitet der Verlust wieder den Gewinn, was zu einer schnellen Abnahme der Photonenzahldichte (mit einer Zeitkonstante in der Größenordnung der Photonenlebensdauer 𝜏P ) führt. • Bei 𝑡 = 𝑡2 wird der Verlust wieder hergestellt und es folgt ein langer Zeitraum des Aufbaus einer Besetzungsinversion als Vorbereitung auf den folgenden Puls. Der Prozess wird regelmäßig wiederholt, sodass eine periodische optische Pulsfolge erzeugt wird. Im Folgenden wollen wir die Peakleistung, Energie, Dauer und Form eines optischen Pulses bestimmen, der von einem gütemodulierten Laser im gepulsten Zustand produziert wird. Wir benutzen dabei die beiden grundlegenden Geschwindigkeitsgleichungen (16.52) und (16.55) für n(𝑡) bzw. N(𝑡), die wir für die Hellphase zwischen 𝑡i bis 𝑡f lösen, wie in Abb. 16.36 gezeigt. Diese Aufgabe kann natürlich numerisch gelöst werden. Wenn wir annehmen, dass die ersten beiden Terme von Gl. (16.55) vernachlässigbar sind, vereinfacht sie sich jedoch so weit, dass auch eine analytische Lösung möglich wird. Diese Annahme ist erlaubt, wenn sowohl das Pumpen als auch die spontane Emission im Vergleich zu den Effekten der induzierten Übergänge während des kurzen Zeitintervalls von 𝑡i bis 𝑡f vernachlässigbar sind. Es zeigt sich, dass diese Näherung dann gilt, wenn die Dauer des erzeugten optischen Pulses viel kürzer ist als 𝑡sp . In diesem Fall wird aus den Gln. (16.52) und Gl. (16.55)
durch Integration erhalten wir daraus 1
1
2
2
n ≈ NSch ln(N) − N + Konstante .
Mit der Anfangsbedingung n = 0 für N = Ni bekommen wir dann 1
n ≈ NSch ln 2
(16.56) (16.57)
Das sind zwei gekoppelte Differentialgleichungen für n(𝑡) und N(𝑡) mit den Anfangsbedingungen n = 0 und N = Ni bei 𝑡 = 𝑡i . NSch ist im gesamten Intervall von 𝑡i bis 𝑡f konstant gleich seinem niedrigen Wert NSch,b . Wenn wir Gl. (16.56) durch Gl. (16.57) teilen, erhalten wir eine einzige Differentialgleichung, die n und N verknüpft, dn 1 NSch ≈ ( − 1) ; 2 N dN
(16.58)
N 1 − (N − Ni ) . 2 Ni
(16.60)
Die Pulsleistung
Nach den Gln. (16.33) und (16.26) ist die Photonenflussdichte im Resonator (für beide Ausbreitungsrichtungen) durch 𝜙 = n𝑐 gegeben, wohingegen die Photonenflussdichte, die aus Spiegel 1 (mit der Transmission 𝒯) aus1 tritt, gleich 𝜙A = 𝒯n𝑐 ist. Wenn wir annehmen, dass 2 die Photonenflussdichte über der Querschnittsfläche A des austretenden Strahls homogen ist, ist die entsprechende optische Ausgangsleistung 𝑐 1 P A = ℎ𝜈 A 𝜙A = ℎ𝜈 𝑐 𝒯 An = ℎ𝜈 𝒯 𝑉n , (16.61) 2 2d wobei 𝑉 = Ad das Volumen des Resonators ist. Nach Gl. (16.40) ist der Anteil des Resonatorverlusts, der zu nutzbarem Licht am Ausgang beiträgt, für 𝒯 ≪ 1 gleich 𝜂ex ≈ 𝒯(𝑐∕2d )𝜏P , sodass P A = 𝜂ex ℎ𝜈
n𝑉 . 𝜏P
(16.62)
Gleichung (16.62) ist einfach zu interpretieren, da der Faktor n𝑉∕𝜏P die Zahl der pro Zeiteinheit aus dem Resonator entkommenen Photonen ist. Die Peakleistung eines Pulses
Wie zuvor besprochen und in Abb. 16.36 illustriert erreicht n seinen Maximalwert nmax für N = N Sch = NSch,b . Das können wir bestätigen, indem wir in Gl. (16.56) dn∕ d𝑡 = 0 setzen, was sofort N = NSch ergibt. Das setzen wir in Gl. (16.60) ein und erhalten 1
nmax = N i (1 + 2
dn N n − 1) =( 𝜏P NSch d𝑡 dN N n . = −2 NSch 𝜏P d𝑡
(16.59)
N Sch NSch NSch ln − ). Ni Ni Ni
(16.63)
Zusammen mit Gl. (16.61) erhalten wir daraus für die Maximalleistung 𝑐 P max = ℎ𝜈 𝒯 𝑉nmax . (16.64) 2d Für Ni ≫ NSch , was für Pulse mit großer Leistungsspitze erfüllt sein muss, ist NSch ∕N i ≪ 1 und daher wegen Gl. (16.63) 1
nmax ≈ Ni . 2
(16.65)
Die maximale Photonenzahldichte ist dann gleich der Hälfte der anfänglichen Differenz der Besetzungsdichten. In diesem Fall hat die Maximalleistung die besonders einfache Form 𝑐 1 P max ≈ ℎ𝜈 𝒯 𝑉 Ni . (16.66) 2 2d
529
530
16 Laser
Xe –X
Die Pulsenergie
Die Pulsenergie ist durch 𝑡f
E = ∫ PA d𝑡
(16.67)
𝑡i
X1 X2
gegeben, was nach Gl. (16.61) auch als
E = ℎ𝜈 𝒯
𝑡f
Nf
𝑡i
Ni
d𝑡 𝑐 𝑐 𝑉 ∫ n(𝑡) d𝑡 = ℎ𝜈 𝒯 𝑉 ∫ n(𝑡) dN 2d 2d dN (16.68)
geschrieben werden kann. Wir setzen Gl. (16.57) in Gl. (16.68) ein und erhalten 1 2
Y1
X
Abb. 16.37 Graphische Konstruktion zur Bestimmung von N f aus Ni mit X = N i ∕NSch und Y = N f ∕NSch . Für X = X1 bezeichnet die Ordinate den Wert X1 exp(−X1 ). Da die entsprechende Lösung Y1 die Beziehung Y1 exp(−Y1 ) = X1 exp(−X1 ) erfüllt, muss sie denselben Wert der Ordinate haben. (t) Sch i
3
= 10
Sch
8
Ni
E = ℎ𝜈 𝒯
Y2
dN 𝑐 𝑉 NSch 𝜏max ∫ , 2d N
(16.69)
2
Nf
6
bzw. nach Integration 1
E = ℎ𝜈 𝒯 2
Ni 𝑐 𝑉 NSch 𝜏max ln . 2d Nf
1
Der Besetzungsunterschied Nf am Ende können wir bestimmen, indem wir in Gl. (16.60) n = 0 und N = Nf setzen; das ergibt ln
Ni Ni − Nf = . Nf N Sch
(16.71)
Durch Einsetzen dieser Beziehung in Gl. (16.70) erhalten wir 1
E = ℎ𝜈 𝒯 2
𝑐 𝑉𝜏max (Ni − Nf ) . 2d 1
4
(16.70)
(16.72)
Für Ni ≫ Nf ist wie erwartet E ≈ ℎ𝜈 𝒯(𝑐∕2d )𝑉𝜏max Ni . 2 Wir müssen nun noch Gl. (16.71) lösen, um Nf zu bestimmen. Dazu setzen wir 𝑋 = N i ∕NSch und 𝑌 = Nf ∕N Sch , wodurch Gl. (16.71) zu ln(𝑋∕𝑌) = 𝑋 − 𝑌 oder ln 𝑌 − 𝑌 = ln 𝑋 − 𝑋 wird. Wenn wir nun beide Seiten dieser Beziehung in den Exponenten erheben, erhalten wir 𝑌 exp(−𝑌) = 𝑋 exp(−𝑋). Für ein gegebenes 𝑋 = Ni ∕N Sch können wir dann 𝑌 leicht numerisch oder mithilfe der Kurve aus Abb. 16.37 bestimmen.
2 0
2
4
t τP
6
Abb. 16.38 Typische Pulsformen gütemodulierter Laser, die durch numerische Integration der genäherten Geschwindigkeitsgleichungen bestimmt wurden. Die Photonenzahldichte n(t ) ist auf die Schwellen-Besetzungsdifferenz N Sch = N Sch,b und die Zeit t auf die Photonenlebensdauer 𝜏max normiert. Mit steigendem Verhältnis Ni ∕NSch wird der Puls schmaler und erreicht einen höheren Maximalwert. Im Grenzfall 1 N i ∕NSch ≫ 1 geht der Maximalwert von n(t ) gegen Ni . 2
Die Pulsdauer
Eine grobe Näherung für die Pulsdauer ist das Verhältnis der Pulsenergie zur maximalen Pulsleistung. Aus den Gln. (16.63), (16.64) und (16.72) erhalten wir 𝜏Puls = 𝜏max
Ni ∕NSch − Nf ∕N Sch N i ∕NSch − ln(N i ∕N Sch ) − 1
.
(16.73)
Für Ni ≫ NSch und Ni ≫ N f ist 𝜏Puls ≈ 𝜏max . Die Pulsform
Die Form des optischen Pulses kann ebenso wie alle zuvor beschriebenen Eigenschaften bestimmt werden, indem die Gln. (16.56) und (16.57) numerisch integriert werden. Beispiele für so bestimmte Pulsformen sind in Abb. 16.38 gezeigt.
16.4 Gepulste Laser
Beispiel 16-12: Ein gütemodulierter frequenzverdoppelter Nd3+:YAG-Mikrochiplaser
Eine Scheibe Nd3+:YAG wird mit einem sättigbaren Absorber und einem frequenzverdoppelnden Kristall innerhalb des Resonators (siehe Abschnitt 22.2.1) zu einem 1 mm langen Resonator kombiniert. Wenn er mit Licht aus einer fasergekoppelten Laserdiode mit einer Wellenlänge von 808 nm und einer Leistung von 1 W gepumpt wird, erzeugt dieser Mikrochiplaser gütemodulierte optische Pulse bei 532 nm. Jeder Puls hat eine Energie von 30 μJ und eine Dauer von 250 ps. Die Wiederholrate ist ≈ 10 kHz und die mittlere Leistung beträgt 300 mW. Übung 16-4: Ein gepulster Rubinlaser
Betrachten Sie den in Übung 16-1 besprochenen Rubinlaser. Verwenden Sie Abb. 16.38, um die Form des Laserpulses, seine Dauer, seine Leistungsspitze und seine Gesamtenergie abzuschätzen, wenn der Laser gütemoduliert ist und der Besetzungsunterschied am Ende des Pumpzyklus (bei 𝑡 = 𝑡i in Abb. 16.36) gleich Ni = 6N Sch ist.
wobei 𝜈𝑞 = 𝜈0 + 𝑞𝜈F ,
𝑞 = 0, ±1, ±2, …
(16.75)
die Frequenz der Mode 𝑞 ist und 𝐴𝑞 ihre komplexe Einhüllende. Der Bequemlichkeit halber nehmen wir an, dass die Mode 𝑞 = 0 mit der Mittenfrequenz 𝜈0 der atomaren Linienform zusammenfällt. Der Betrag |𝐴𝑞 | kann aus den spektralen Gewinn- und Verlustprofilen des Resonators bestimmt werden (siehe Abschnitt 16.2.2). Da die Moden in einem inhomogen verbreiterten Medium mit unterschiedlichen Gruppen von Atomen wechselwirken, sind ihre Phasen arg{𝐴𝑞 } zufällig und statistisch unabhängig. Wenn wir Gl. (16.75) in Gl. (16.74) einsetzen, erhalten wir [ ( ( 𝑧 )] 𝑧) exp i2π 𝜈0 𝑡 − , (16.76) 𝑈(𝑧, 𝑡) = 𝒜 𝑡 − 𝑐 𝑐 wobei die komplexe Einhüllende 𝒜(𝑡) =
∑ 𝑞
𝐴𝑞 exp (
i𝑞2π 𝑡 TF
)
(16.77)
ist und
16.4.4 Modenkopplung Ein Laser kann gleichzeitig auf vielen Longitudinalmoden oszillieren, deren Frequenzen im Fabry-Pérot-Abstand 𝜈F = 𝑐∕2d liegen. Obwohl diese Moden normalerweise unabhängig oszillieren (sie werden dann frei oszillierende Moden genannt), können sie durch besondere Maßnahmen gekoppelt und ihre Phasen fixiert werden. Die Moden können dann als die Komponenten einer Fourierentwicklung einer periodischen Funktion der Zeit mit der Periode T F = 1∕𝜈F = 2d ∕𝑐 betrachtet werden, die eine periodische Pulsfolge bilden. Das ist der in Abschnitt 2.6.2 verwendete Ansatz, wo wir die Interferenz von 𝑀 monochromatischen Wellen mit gleichen Intensitäten in gleichen Frequenzabständen betrachtet hatten. Wir besprechen nun nacheinander die Eigenschaften einer modengekoppelten Pulsfolge und Methoden, die Modenkopplung zu erreichen, und geben abschließend einige Beispiele von modengekoppelten Lasern. Die Eigenschaften einer modengekoppelten Pulsfolge
Wenn jeder der Lasermoden näherungsweise durch eine gleichförmige ebene Welle beschrieben wird, die sich in 𝑧-Richtung mit einer Geschwindigkeit 𝑐 = 𝑐0 ∕𝑛 ausbreitet, können wir die komplexe Gesamtwellenfunktion des Feldes als Summe schreiben: ( [ ∑ 𝑧 )] 𝑈(𝑧, 𝑡) = , (16.74) 𝐴𝑞 exp i2π 𝜈𝑞 𝑡 − 𝑐 𝑞
TF =
1 2d . = 𝜈F 𝑐
(16.78)
Die komplexe Einhüllende 𝒜(𝑡) in Gl. (16.77) ist eine periodische Funktion mit der Periode T F , und 𝒜(𝑡 − 𝑧∕𝑐) ist eine periodische Funktion von 𝑧 mit der Periode 𝑐T F = 2d . Wenn die Beträge und Phasen der komplexen Koeffizienten 𝐴𝑞 geeignet gewählt werden, nimmt 𝒜(𝑡) die Form von periodischen schmalen Pulsen an. Als Beispiel betrachten wir 𝑀 Moden (𝑞 = 0, ±1, … , ±𝑆, sodass 𝑀 = 2𝑆 + 1 ist) mit identischen komplexen Koeffizienten 𝐴𝑞 = 𝐴, 𝑞 = 0, ±1, … , ±𝑆. Dann ist 𝒜(𝑡) = 𝐴
𝑆 ∑
exp (
𝑞 = −𝑆
i𝑞2π 𝑡 TF
)=𝐴
𝑥𝑆+1 − 𝑥−𝑆 𝑥 =𝐴 =𝐴 𝑥−1
𝑆 ∑
𝑥𝑞
𝑞 = −𝑆 𝑆+
1 2
−𝑥
1
𝑥2 − 𝑥
−𝑆− −
1
1 2
(16.79)
2
mit 𝑥 = exp(i2π 𝑡∕T F ) (für Einzelheiten siehe Abschnitt 2.6.2). Nach einigen Umformungen erhalten wir 𝒜(𝑡) in der Form 𝒜(𝑡) = 𝐴
sin(𝑀π 𝑡∕T F ) . sin(π 𝑡∕T F )
(16.80)
Die optische Intensität ist dann durch 𝐼(𝑡, 𝑧) = |𝒜(𝑡 − 𝑧∕𝑐)|2 gegeben oder 2
𝐼(𝑡, 𝑧) = |𝐴|2
sin [𝑀π(𝑡 − 𝑧∕𝑐)∕T F ] 2
sin [π(𝑡 − 𝑧∕𝑐)∕T F ]
.
(16.81)
531
532
16 Laser
Abb. 16.39 Die Intensität der periodischen Pulsfolge, die aus der Summe von M Lasermoden mit gleichen Beträgen und Phasen resultiert. Jeder Puls hat eine Dauer, die M mal kleiner ist als die Periode T F und eine Maximalintensität, die M mal so groß ist wie die mittlere Intensität.
F
MI
Intensität
F
M F
I
M
t
optischer Schalter z
Puls
2
Abb. 16.40 Der modengekoppelte Laserpuls wird zwischen den Spiegeln des Resonators hin und her reflektiert. Immer wenn er den Ausgangsspiegel erreicht, wird ein kurzer optischer Puls durchgelassen. Die austretenden Pulse haben einen Abstand 2d und breiten sich mit der Geschwindigkeit c
aus. Der Schalter öffnet sich nur, wenn der Puls ihn erreicht und dann nur für die Dauer des Pulses. Die periodische Pulsfolge wird daher durch die Anwesenheit des Schalters nicht beeinflusst. Andere Wellenmuster erfahren durch ihn jedoch Verluste und können daher nicht bestehen.
Wie Abb. 16.39 zeigt, ist das eine periodische Funktion der Zeit. Die Form der modengekoppelten Pulsfolge hängt somit von der Zahl 𝑀 der Moden ab, die proportional zur atomaren Linienbreite Δ𝜈 ist. Für 𝑀 ≈ Δ𝜈∕𝜈F ist 𝜏Puls = T F ∕𝑀 ≈ 1∕Δ𝜈. Die Pulsdauer 𝜏Puls ist daher umgekehrt proportional zur atomaren Linienbreite Δ𝜈. Weil Δ𝜈 ziemlich groß werden kann, können durch Modenkopplung sehr kurze Laserpulse erzeugt werden. Das Verhältnis zwischen der maximalen und den mittleren Intensität ist gleich der Zahl 𝑀 der Moden, die ebenfalls sehr groß sein kann. Die Periode der Pulsfolge ist T F = 2d ∕𝑐. Das ist gerade die Zeit für einen einzelnen Umlauf der Reflexion im Resonator. Tatsächlich kann das Licht in einem modengekoppelten Laser als ein einzelnes kurzes Bündel von Photonen betrachtet werden, die zwischen den Spiegeln des Resonators hin und her reflektiert werden (siehe Abb. 16.40). Bei jeder Reflexion am Ausgangsspiegel wird ein Bruchteil der Photonen in Form eines Lichtpulses aus dem Resonator entlassen. Die austretenden Pulse folgen einander in einer Entfernung 𝑐(2d ∕𝑐) = 2d und haben eine räumliche Breite d Puls = 𝑐𝜏Puls = 2d ∕𝑀.
Eine Zusammenfassung der Eigenschaften von modengekoppelten Pulsfolgen gibt Tabelle 16.2. Obwohl die dort angegebenen Beziehungen für den Spezialfall hergeleitet wurden, dass alle Moden dieselbe Phase und Amplitude besitzen, führen genauere Berechnungen unter realistischeren Annahmen zu ganz ähnlichen Ergebnissen.
Tab. 16.2 Charakteristische Eigenschaften von modengekoppelten Pulsfolgen. Zeitliche Periode Frequenzabstand
2d 𝑐 𝑐 𝜈F = 2d
TF =
Pulsdauer
𝜏Puls =
Mittlere Intensität
𝐼̄
TF
𝑀
=
1 Δ𝜈
Räumliche Periode
2d
Pulswiederholrate
𝜈F =
Pulsausdehnung
d Puls =
Maximale Intensität
𝐼max
𝑐 2d 2d 𝑀 = 𝑀 𝐼̄
Übung 16-5: Pulserzeugung durch Modenkopplung
Tragen Sie die Intensität 𝐼(𝑡) = |𝒜(𝑡)|2 einer Welle auf, deren Einhüllende 𝒜(𝑡) durch die Summe in Gl. (16.77) gegeben ist. Nehmen Sie an, dass die Zahl der Moden 𝑀 = 11 ist und wählen Sie die komplexen Koeffizienten 𝐴𝑞 wie folgt: (a) Gleiche Beträge und Phasen (dieser Fall sollte die zuvor beschriebenen Ergebnisse reproduzieren). (b) Beträge, die dem spektra1 len Gaußprofil |𝐴𝑞 | = exp[− (𝑞∕5)2 ] folgen und glei2 che Phasen. (c) Gleiche Beträge, aber zufällige Phasen (bestimmen Sie die Phasen mit einem Zufallszahlgenerator, der eine im Intervall von 0 bis 2π gleichverteilte Variable liefert). Methoden der Modenkopplung
Wir haben bis jetzt festgestellt, dass durch Phasenkopplung einer großen Zahl 𝑀 von Moden ein starker, schmaler Puls von Photonen entsteht, der zwischen den Spiegeln des Resonators hin und her reflektiert wird. Die räumliche Ausdehnung des Pulses ist um einen Faktor 𝑀 kleiner als die doppelte Resonatorlänge. Die große Frage ist nun, wie die Moden gekoppelt werden können, sodass sie dieselbe Phase haben. Das kann mithilfe eines aktiven oder passiven Modulators (Schalters) innerhalb
16.4 Gepulste Laser
des Resonators erreicht werden. Wir untersuchen in den nächsten Abschnitten nacheinander die aktive Modenkopplung und die passive Modenkopplung. Wir nehmen an, dass ein optischer, durch ein von außen angewandtes Signal gesteuerter Schalter (z. B. ein akustooptischer oder elektrooptischer Schalter, wie in den Abschnitten 20.2.1 und 21.1.2 besprochen) in den Resonator eingebracht wird, der das Licht zu jedem Zeitpunkt blockiert, außer in dem Moment, wenn der Puls gerade an dem Schalter ankommt. In diesem Moment öffnet er sich für die Dauer des Pulses (Abb. 16.40). Da der Puls selbst nur auf den offenen Schalter trifft, wird er durch die Anwesenheit des Schalters nicht beeinflusst, und die Pulsfolge breitet sich weiter aus. Ohne Phasenkopplung haben die einzelnen Moden unterschiedliche Phasen, die durch die zufälligen Bedingungen zu Beginn ihrer Schwingung bestimmt sind. Wenn die Phasen zufällig gleiche Werte annähmen, ergäbe die Summe der Moden einen riesigen Puls, der durch die Anwesenheit des Schalters nicht beeinflusst würde. Jede andere Kombination von Phasen ergäbe eine Feldverteilung, die durch den Schalter teilweise oder vollständig blockiert würde. In Gegenwart des Schalters kann die Laserwirkung daher nur eintreten, wenn die Moden gleiche Phasen haben. Der Laser wartet auf den „glücklichen Zufall“, dass diese Situation eintritt; wenn die Oszillation aber einmal begonnen hat, bleiben die Moden gekoppelt. Die Situation kann auch mathematisch untersucht werden. Ein optisches Feld muss die Wellengleichung mit den durch die Anwesenheit des Schalters auferlegten Randbedingungen erfüllen. Das optische Vielmodenfeld von Gl. (16.74) erfüllt die Wellengleichung tatsächlich für jede Kombination von Phasen. Nur der Fall gleicher Phasen erfüllt auch die durch den Schalter auferlegten Randbedingungen; daher muss er eine eindeutige Lösung sein. Auch ein passiver Schalter wie z. B. ein sättigbarer Absorber kann verwendet werden, um Modenkopplung zu erreichen. Ein sättigbarer Absorber (siehe Abschnitt 15.3.1) ist ein Medium, dessen Absorptionskoeffizient mit zunehmender Intensität des hindurchtretenden Lichts abnimmt; es lässt daher intensive Pulse mit relativ wenig Absorption durch, während es schwache Pulse absorbiert. Oszillation kann daher nur auftreten, wenn die Phasen der unterschiedlichen Moden so miteinander gekoppelt sind, dass sie einen intensiven Puls bilden, der dann durch den Schalter transmittiert wird. Sättigbare Halbleiterspiegel (SESAM, engl. semiconductor saturable-absorber mirror) sind reflektierende sättigbare Absorber, die weithin verwendet werden; je intensiver das auf sie auftreffende Licht ist, desto größer ist
ihr Reflexionsgrad. SESAM können für Wellenlängen im Bereich von 800 bis 1600 nm, Pulsdauern von Femto- bis Nanosekunden und Leistungen von Milliwatt bis Hunderten von Watt eingesetzt werden. Sättigbare Absorber aus Graphen können Modenkopplung über einen breiten Bereich von Wellenlängen bewirken, da das Absorptionsvermögen von Graphen im Bereich 𝜆0 = 0.7−25 μm nahezu konstant ist und es eine starke Sättigung der Absorption sowie eine schnelle Erholungszeit (im Bereich von Pikosekunden) besitzt. Sättigbare Absorber können auch gütemodulierte Modenkopplung erzeugen, bei der der Laser Gruppen von modengekoppelten Pulsen innerhalb der Einhüllenden einer Gütemodulation ausstrahlt. Eine andere Variante der passiven Modenkopplung ist die Kerrlinsen-Modenkopplung, die einen nichtlinearen optischen Effekt ausnutzt (den Kerreffekt). Hierbei ändert sich der Brechungsindex eines Materials mit der optischen Intensität (siehe Abschnitt 22.3). Ein Kerrmedium, entweder das Gewinnmedium selbst oder ein anderes Material innerhalb des Laserresonators, wirkt wie eine Linse mit einer zur Intensität umgekehrt proportionalen Brennweite (siehe Übung 22-4). Mithilfe einer Blende an einem geeigneten Ort innerhalb des Resonators reduziert die Kerrlinse die Fläche der Lasermode bei hohen Intensitäten, sodass das Licht durch die Blende hindurchtritt. Alternativ kann die reduzierte Modenfläche im Gewinnmedium auch dazu verwendet werden, ihre Überlappung mit dem stark fokussierten Pumpstrahl zu vergrößern und dadurch den effektiven Gewinn zu vergrößern. Die Kerrlinsenmethode ist wegen der parametrischen Natur des Verfahrens von Natur aus breitbandig. Die kurze Erholungszeit, die für die passive Modenkopplung typisch ist, führt zu kürzeren optischen Pulsen als bei aktiver Modenkopplung. Passive und aktive Schalter werden für die Modenkopplung inhomogen und homogen verbreiterter Medien gleichermaßen verwendet. Beispiele für modengekoppelte Laser
Tabelle 16.3 gibt eine Übersicht über die mit verschiedenen modengekoppelten Lasermedien erreichbaren Pulsdauern, geordnet nach zunehmender Pulsdauer. Ein großer Bereich von Pulsdauern ist realisierbar. Die beobachteten Pulsdauern, die auch für ein gegebenes Medium außerordentlich variieren können, hängen von der Methode ab, durch die die Modenkopplung erreicht wird, und kann durch Nichtlinearitäten und Dispersion im Medium beschränkt sein.
533
534
16 Laser
Tab. 16.3 Typische Pulsdauern für einige modengekoppelte Laser mit homogener (H) und inhomogener (I) Verbreiterung. Lasermedium
Linienbreite 𝚫𝝂 d. Übergangsa)
Berechnete Pulsdauer 𝝉Puls = 1∕𝚫𝝂
Beobachtete Pulsdauer
10 fs
Ti3+:Al2 O3 (Saphir)
H
100 THz
10 fs
Cr4+:Mg2 SiO4 (Forsterit)
H
50 THz
20 fs
20 fs
Rhodamin-6G Nd3+:Phosphatglas
H/I
40 THz
25 fs
27 fs
I
7 THz
140 fs
150 fs
Er3+:Quarzglas
H/I
5 THz
200 fs
200 fs
Yb3+:Quarzglas
H/I
5 THz
200 fs
5 ps
H
150 GHz
7 ps
7 ps
Nd3+:YAG Ar+
I
3.5 GHz
286 ps
150 ps
He-Ne CO2
I
1.5 GHz
667 ps
600 ps
I
60 MHz
16 ns
20 ns
a) Die Linienbreite Δ𝜈 des Übergangs ist aus Tabelle 15.1 entnommen.
Beispiel 16-13: Modenkopplung in einem neodymdotierten Faserlaser
Wir betrachten einen Nd3+:Glas-Laser, der bei 𝜆0 = 1.05 μm betrieben wird (siehe Tabelle 15.1 und 16.3). Sein Brechungsindex ist 𝑛 = 1.5 und seine Linienbreite Δ𝜈 = 7 THz. Damit ist die Pulsdauer 𝜏Puls = 1∕Δ𝜈 ≈ 140 fs. Wenn der Resonator eine Länge von d = 15 cm hat, beträgt die zeitliche Periode T F = 2𝑛d ∕𝑐0 = 1.5 ns und der Modenabstand (sowie die Wiederholrate) ist 𝜈F = 𝑐0 ∕2𝑛d = 0.67 GHz, was bedeutet, dass 𝑀 = Δ𝜈∕𝜈F ≈ 10 500 Moden mit einer Länge von d 𝑃 𝑢𝑙𝑠 = 2d ∕𝑀 ≈ 28.6 μm existieren. Die maximale Intensität ist daher 10 500 mal so groß wie die mittlere Intensität. In Medien mit breiten Linien ist die Modenkopplung in der Regel der Gütemodulation vorzuziehen, wenn kurze Pulse erzeugt werden sollen. Gaslaser haben andererseits im Allgemeinen schmale atomare Linienbreiten, sodass durch Modenkopplung keine ultrakurzen Pulse erzeugt werden können. Beispiel 16-14: Modenkopplung in einem ytterbiumdotierten Faserlaser
Ein bei 𝜆0 = 1070 nm betriebener passiv modengekoppelter ytterbiumdotierter Quarzfaserlaser liefert eine mittlere Leistung von 10 W in Form von Pulsen mit einer Energie von 200 nJ und einer Spitzenleistung von 40 Kilowatt. Er erzeugt modengekoppelte Pulse mit einer Dauer von 5 ps bei einer Wiederholrate von 50 MHz. Wegen Δ𝜈 = 5 THz (siehe Tabelle 16.3) ist die Pulsdauer wesentlich größer als der erwartete Wert 𝜏Puls = 1∕Δ𝜈 = 200 fs. Die Diskrepanz entsteht aufgrund der Gruppengeschwindigkeitsdispersion, die eine Verbreiterung und ein Chirpen der Pulse bewirkt, die sich durch ein optisches Medium ausbreiten (siehe Abb. 5.30). Die normale Dispersion in einer Quarzfaser nahe 𝜆0 = 1 μm (Abb. 5.32) kann durch
anomale Dispersion eines Faser-Bragggitters oder eine photonische Faser ausgeglichen werden, wodurch die beobachtete Pulsdauer auf 200 fs reduziert wird. Eine weitere Verkürzung der Pulsdauer ist durch Pulskompression (Abschnitt 23.2) möglich. Es lassen sich Pulse mit weitaus höheren Energien und Peakleistungen erzeugen. Modengekoppelte Laser werden in vielen Anwendungen eingesetzt, beispielsweise zeitlich hochaufgelöste Messungen, Bildgebung, Messtechnik, Kommunikation, Materialverarbeitung oder klinische Medizin. Der modengekoppelte Laser der Wahl ist häufig der Ti:Saphir-Laser, dessen Mittenwellenlänge im Bereich von 700–1050 nm eingestellt werden kann und dessen Pulse eine Dauer von nur 10 fs haben. Eine handelsübliche Version dieses Lasers nutzt Kerrlinsen-Modenkopplung und liefert 50-nJ-Pulse mit einer Dauer von 10 fs und einer Peakleistung von 1 MW bei einer Wiederholungsrate von 80 MHz; Wiederholungsraten von mehr als 10 GHz sind aber auch möglich. Die spektrale Bandbreite Δ𝜈 dieses Lasers kann verringert werden, um modengekoppelte Pulse mit einer Dauer im Pikosekundenbereich zu erzeugen. Die Intensität eines modengekoppelten Ti:Saphir-Lasers (oder einer verstärkten Version) reicht auch für die Erzeugung von höheren Harmonischen und andere Verfahren der nichtlinearen Wellenlängenverschiebung (Kapitel 22 und 23) aus, die wiederum modengekoppelte Pulse mit kürzeren Wellenlängen bereitstellen können. Erzeugung der zweiten Harmonischen liefert beispielsweise Pulse im Bereich von 350 bis 525 nm und Erzeugung der dritten Harmonischen erreicht 230 bis 350 nm. In Richtung größerer Wellenlängen kann der modengekoppelte Betrieb über 𝜆0 = 1 μm hinaus ausgedehnt werden, indem man einen modengekoppelten
16.4 Gepulste Laser
Ti:Saphir-Laseroszillator als Quelle für einen synchron gepumpten optischen parametrischen Oszillator verwendet, der einen Kristall wie LBO oder einen periodisch gepolten Kristall (Abschnitt 22.4.4) verwendet. Dieser Ansatz liefert modengekoppelte Signal- und Idlerstrahlen, die den infraroten Wellenlängenbereich von 1.0−3.3 μm abdecken. Modengekoppelte ytterbiumdotierte und erbiumdotierte Faserlaser arbeiten um 1.07 bzw. 1.55 μm. Obwohl diese Laser typischerweise große Linienbreiten besitzen, sind die erreichbaren Pulsdauern und andere Leistungsmerkmale oft durch die Dispersion der Faser und/oder Nichtlinearitäten begrenzt, die aus der Faserlänge bzw. kleinen Modenvolumina resultieren. Kleine Wiederholungsraten aufgrund von großen Resonatorlängen können durch Modenkopplung der Harmonischen verbessert werden. Dabei breiten sich mehrere Pulse in einigem Abstand voneinander durch den Faserresonator aus. In ultraschnellen Faserlasern werden hohe Ausgangsleistungen normalerweise durch Verstärkung gechirpter Pulse erreicht. Im Bereich der Halbleiterlaser können Oberflächenemitter mit externem Resonator (VECSEL, engl. vertical external-cavity surface-emitting lasers), auch Halbleiter-Scheibenlaser (SDL, von engl. semiconductor disk lasers) genannt, modengekoppelt mit Pulsdauern < 100 fs und Pulswiederholraten im Bereich von 1– 50 GHz betrieben werden (Abschnitt 18.5.1). Monolithische modengekoppelte Laserdioden können aufgrund ihrer sehr kleinen Resonatorlängen Pulswiederholungsraten von einigen hundert GHz oder sogar 1 THz erreichen (Beispiel 18-10). Im mittleren Infrarot können Quantenkaskadenlaser (QCL) im Wellenlängenbereich 3 ≤ 𝜆0 ≤ 12 μm modengekoppelte optische Pulse mit einer Dauer von wenigen ps erzeugen (Abschnitt 18.4.4).
16.4.5 Optische Frequenzkämme Da das Licht eines modengekoppelten Lasers ein diskretes optisches Spektrum mit gleichmäßig über ein breites Band verteilten Frequenzen besitzt, wird es auch als optischer Frequenzkamm (OFC, von engl. optical frequency comb) bezeichnet. Die 𝑞-teFrequenzkomponente eines OFC ist 𝜈𝑞 = 𝑞𝜈F + 𝜈V , wobei 𝜈F der Frequenzabstand zwischen den benachbarten „Zähnen“ des Kamms ist und 𝜈V < 𝜈F ein Frequenzversatz. Die Zahl 𝑀 der in dem Kamm enthaltenen Frequenzkomponenten ist typischerweise groß, sodass die spektrale Bandbreite viel größer als der Frequenzabstand 𝜈F ist. Ein OFC wird demnach durch die beiden Frequenzen 𝜈F und 𝜈V , die beide einfach messbar sind, vollständig beschrieben. Während die 𝜈𝑞 optische Fre-
quenzen sind, liegt der Frequenzabstand 𝜈F = 𝑐∕2d für modengekoppelte Laser je nach der Länge des FabryPérot-Resonators zwischen 10 MHz und 100 GHz. Da OFC die hochpräzise Messung von optischen und ultravioletten Frequenzen ermöglichen, haben sie eine Vielzahl von Anwendungen in Physik und Astronomie gefunden. Sie haben sich sehr schnell als wertvolle Präzisionswerkzeuge für die Spektroskopie von Molekülen, Atomen und Kernen sowie für die optische Bildgebung und Messtechnik etabliert. Frequenzkämme mit Paaren von verschränkten Photonen, die durch On-Chip-Quantenschaltungen erzeugt werden können (Abschnitt 13.3.6), bieten sogar eine noch höhere Präzision. Vermessung eines oktavüberspannenden Frequenzkamms
Wenn die höchste Frequenz eines optischen Frequenzkamms doppelt so groß ist wie die niedrigste Frequenz, dann spannt der OFC eine Oktave von Frequenzen auf. Da der Frequenzabstand durch den gegebenen Laserresonator festgelegt wird, ist der Kamm sehr gleichmäßig und 𝜈F sehr stabil. Der Frequenzkamm kann daher als Frequenzmaß dienen, an dem unbekannte Frequenzen gemessen werden können. Solche Messungen beruhen normalerweise auf der Lichtschwebung (Abschnitt 2.6.2), die Differenzfrequenzen erzeugt, welche mit elektronischen Instrumenten leicht messbar sind. Die Frequenzen 𝜈𝑞 eines OFC können bestimmt werden, indem man die Frequenzen 𝜈F und 𝜈V misst, die sehr viel kleiner als 𝜈𝑞 sind. Die Messung von 𝜈F ist unkompliziert, da es sich um die Pulswiederholungsrate der modengekoppelten Pulsfolge handelt, die mit einem schnellen Detektor bestimmt werden kann. Alternativ kann 𝜈F auch mithilfe eines elektronischen Spektrumanalysators ermittelt werden, der die Schwebungsfrequenz zwischen benachbarten Frequenzen im Kamm anzeigt. Die Bestimmung von 𝜈V ist schwieriger, wenn auch nicht grundsätzlich kompliziert. Wenn der Kamm eine Oktave von Frequenzen aufspannt, kann 𝜈V bestimmt werden, indem man den Kamm mit einer frequenzverdoppelten Version seiner selbst überlagert und die Schwebung beobachtet. Die Frequenzverdopplung kann erreicht werden, indem man wie in Abschnitt 22.2.1 beschrieben in einem nichtlinearen optischen Medium die zweite Harmonische erzeugt. Wie Abb. 16.41 zeigt, hat die Komponente der Ordnung 𝑞 auf der niederfrequenten Seite des frequenzverdoppelten Kamms nach der Frequenzverdopplung ungefähr dieselbe Frequenz wie die Komponente 2𝑞 auf der hochfrequenten Seite des ursprünglichen Kamms, d. h. 2𝜈𝑞 ≈ 𝜈2𝑞 . Durch Messen der Schwebungsfrequenz zwischen diesen Kämmen er-
535
536
16 Laser
νF
νq
νv
Frequenzkamm (c)
ν2q
(a)
+ ×2
νv
ν
νv 2νq
2νv
Abb. 16.41 (a) Spektrum eines oktavüberspannenden optischen Frequenzkamms. (b) Spektrum des frequenzverdoppelten Kamms aus (a). (c) Die Schwebung zwischen diesen beiden Spektren verrät die Versatzfrequenz 𝜈V .
ν
(b)
Frequenzkamm
Frequenzkamm νv
CW-Laser
νF νq νL
CW-Laser ν2q
νa
+
νb
Abb. 16.42 Präzisionsmessung der Frequenz eines CW-Lasers durch Messung der Schwebung eines oktavüberspannenden OFC zuerst mit dem CW-Laser und anschließend mit dessen zweiter Harmonischer.
ν
2νL νa
×2
+
νb ν
hält man somit die Versatzfrequenz 𝜈V , da 2𝜈𝑞 − 𝜈2𝑞 = 2(𝑞𝜈F + 𝜈V ) − (2𝑞𝜈F + 𝜈V ) = 𝜈V ist. Das Ergebnis einer solchen Messung kann verwendet werden, um die Quelle des Frequenzkamms zu steuern oder sogar die Versatzfrequenz zu eliminieren, wodurch ein perfektes Frequenzmaß entsteht, für das 𝜈𝑞 = 𝑞𝜈F ist. Präzisionsmessung von optischen Frequenzen
Ein OFC kann verwendet werden, um die Präzision einer optischen Frequenzmessung zu erhöhen, die mit einem herkömmlichen wellenlängensensitiven Spektrumanalysator durchgeführt wird. Wenn die Grobmessung der Frequenz 𝜈L einer monochromatischen Lichtquelle wie beispielsweise eines CW-Lasers ungefähr gleich einem Vielfachen des Frequenzabstands eines OFC ist, d. h. wenn 𝜈L ≈ 𝑞𝜈F ist, kann die Präzision der Frequenzmessung durch Messung der Schwebung der beiden optischen Felder erhöht werden. Aus der kleinsten Schwebungsfrequenz 𝜈L − (𝑞𝜈F + 𝜈V ) kann dann ein genauerer Wert von 𝜈L berechnet werden. Das Verfahren ist vergleichbar mit der Verwendung einer Noniusskala, wie sie zum Ablesen von gebrochenen Messwerten von einem gleichmäßig unterteilten Lineal (Messschieber) verwendet wird. Wenn die Versatzfrequenz 𝜈V nicht bekannt ist, können sowohl 𝜈V als auch die Korrektur 𝜈L − 𝑞𝜈F bestimmt werden, wenn man zuerst die Schwebung des Frequenzkamms mit dem CW-Laser und anschließend seine Schwebung mit einer frequenzverdoppelten Version des Lasers misst, wie Abb. 16.42 zeigt. Da
𝜈L ≈ 𝜈𝑞 und 2𝜈L ≈ 𝜈2𝑞 ist, gilt für die Schwebungsfrequenzen 𝜈a = 𝜈L − (𝑞𝜈F + 𝜈V ) = (𝜈L − 𝑞𝜈F ) − 𝜈V ,
(16.82)
𝜈b = 2𝜈L − (2𝑞𝜈F + 𝜈V ) = 2(𝜈L − 𝑞𝜈F ) − 𝜈V . (16.83) Lösen von Gl. (16.82) und (16.82) liefert sowohl die Versatzfrequenz 𝜈V = 𝜈b − 2𝜈a als auch die Korrektur 𝜈L − 𝑞𝜈F = 𝜈b − 𝜈a . Dabei haben wir angenommen, dass der Frequenzkamm eine Oktave überspannt und dass 𝑞𝜈F auf der niederfrequenten Seite des Kamms liegt. Frequenzkämme im EUV- und Röntgenbereich
Wie bereits erwähnt, liegen die Frequenzen 𝜈𝑞 von OFC auf der Basis von modengekoppelten Lasern normalerweise im sichtbaren Bereich des Spektrums, während die Pulswiederholungsraten 𝜈F = 𝑐∕2d je nach der Länge d des Fabry-Pérot-Laserresonators typischerweise zwischen 10 MHz und 100 GHz liegen (Abschnitt 11.1.1). In den letzten Jahren hat sich die Erzeugung von höheren Harmonischen (HHG, Abschnitt 23.5.4) als alternative Technik zur Erzeugung von optischen Frequenzkämmen herauskristallisiert. Der HHG-Ansatz unterscheidet sich von der Modenkopplung und hat es ermöglicht, die Frequenzabstände und den Frequenzbereich von OFC wesentlich zu erhöhen. Ein durch HHG erzeugter optischer Frequenzkamm weist Abstände zwischen benachbarten Frequenzkomponenten auf, die doppelt so groß sind wie die Frequenz des Anregungslasers, der typischerweise im
Aufgaben
nahen oder mittleren Infrarot arbeitet. Die Differenzfrequenzen (und Pulswiederholungsraten) der so generierten Frequenzkämme liegen somit im Bereich von mehreren hundert THz – Größenordnungen über denen, die durch Modenkopplung erreichbar sind. Bei hohen Gasdrücken können sich die höchstfrequenten Komponenten von OFC aus der HHG sogar bis in den Bereich der weichen Röntgenstrahlung erstrecken (Abb. 16.29). Die Pulsfolgen von durch HHG erzeugten Frequenzkämme besitzen eine Struktur im Attosekundenbereich.
Aufgaben Aufgabe 16-1: Die Zahl der Longitudinalmoden
Ein Ar+ -Ionenlaser hat einen Resonator der Länge 100 cm. Sein Brechungsindex ist 𝑛 = 1. (a) Bestimmen Sie den Frequenzabstand 𝜈F zwischen den Resonatormoden. (b) Bestimmen Sie die Zahl der Longitudinalmoden des Lasers, wenn die dopplerverbreiterte Halbwertsbreite der Linien Δ𝜈D = 3.5 GHz und der Verlustkoeffizient gleich der Hälfte des maximalen Gewinnkoeffizienten für kleine Signale ist. (c) Wie groß müsste die Resonatorlänge d sein, um einen Betrieb auf einer einzigen Longitudinalmode zu erreichen? Wie groß wäre diese Länge für einen CO2 -Laser mit der viel kleineren Dopplerlinienbreite Δ𝜈D = 60 MHz unter denselben Bedingungen? Aufgabe 16-2: Frequenzdrift der Lasermoden
Ein He-Ne-Laser besitzt die folgenden Eigenschaften: (i) Einen Resonator mit Reflexionsgraden der Spiegel von 97 % und 100 %; (ii) einen dopplerverbreiterten atomaren Übergang mit der Dopplerlinienbreite Δ𝜈D = 1.5 GHz; (iii) einen maximalen Gewinnkoeffizienten für kleine Signale 𝛾0(𝜈0 ) = 2.5 × 10−3 cm−1 . Während des Betriebs driften die Frequenzen seiner longitudinalen Moden mit der Zeit infolge kleiner thermisch induzierter Änderungen der Resonatorlänge. Finden Sie den zulässige Bereich von Resonatorlängen, für die der Laser immer in ein oder zwei (aber nicht mehr) longitudinalen Moden oszilliert. Der Brechungsindex ist 𝑛 = 1. Aufgabe 16-3: Kontrolle der Moden mithilfe eines Etalons
Ein dopplerverbreiterter Gaslaser wird bei 515 nm in einem Resonator betrieben, dessen zwei Spiegeln einen Abstand von 50 cm voneinander haben. Die Photonenlebensdauer ist 0.33 ns. Das spektrale Fenster, innerhalb dessen Schwingung vorkommen kann, hat eine Breite von 𝐵 = 1.5 GHz. Der Brechungsindex ist 𝑛 = 1. Um eine einzelne Mode auszuwählen, wird das Licht in ein
Etalon (einen passiven Fabry-Pérot-Resonator) mit der Finesse ℱ geführt, dessen Spiegel einen Abstand d voneinander haben. Das Etalon wirkt als ein Filter. Schlagen Sie passende Werte von d und ℱ vor. Ist es besser, das Etalon innerhalb oder außerhalb des Laserresonators aufzustellen? Aufgabe 16-4: Modenleistung in einem Vielmodenlaser
Ein He-Ne-Laser, der bei 𝜆0 = 632.8 nm betrieben wird, erzeugt am Ausgang eine Vielmodenleistung von 50 mW. Er hat ein inhomogen verbreitertes Gewinnprofil mit einer Dopplerlinienbreite Δ𝜈D = 1.5 GHz und dem Brechungsindex 𝑛 = 1. Der Resonator ist 30 cm lang. (a) Bestimmen Sie die Zahl der Longitudinalmoden des Lasers, wenn der maximale Gewinnkoeffizient für kleine Signale doppelt so groß wie der Verlustkoeffizient ist. (b) Schätzen Sie die Leistung der stärksten Mode ab, wenn die Spiegel so justiert werden, dass die Intensität dieser Mode maximiert wird. Aufgabe 16-5: Der Strahl eines Einmoden-Gaslasers
Betrachten Sie einen 10 cm langen Gaslaser, der am Zentrum der Linie bei 600 nm in einer einzigen Longitudinal- und einer einzigen Transversalmode betrieben wird. Die Reflexionsgrade der Spiegel sind ℛ1 = 99 % und ℛ2 = 100 %. Der Brechungsindex ist 𝑛 = 1, und die effektive Fläche des Strahls am Ausgang beträgt 1 mm2 . Der Gewinnkoeffizient für kleine Signale ist 𝛾0 (𝜈0 ) = 0.1 cm−1 , und die Sättigungs-Photonenflussdichte beträgt 𝜙𝑆 = 1.43 × 1019 Photonen∕(cm2 s). (a) Bestimmen Sie die verteilten Verlustkoeffizienten 𝛼Sp1 und 𝛼Sp2 jedes der beiden Spiegel. Nehmen Sie 𝛼S = 0 an und bestimmen Sie den Verlustkoeffizienten 𝛼R des Resonators. (b) Geben Sie die Photonenlebensdauer 𝜏P an. (c) Bestimmen Sie die Photonenflussdichte 𝜙0 und die Leistung P0 am Ausgang. Aufgabe 16-6: Die Transmission eines Laserresonators
Monochromatisches Licht aus einer abstimmbaren optischen Quelle tritt durch den optischen Resonator eines ungepumpten Gaslasers hindurch. Die beobachtete Transmission ist in Abb. 16.43 als Funktion der Frequenz gezeigt. (a) Bestimmen Sie die Resonatorlänge, die Photonenlebensdauer, und den Schwellen-Gewinnkoeffizienten des Lasers. Nehmen Sie an, dass der Brechungsindex 𝑛 = 1 ist. (b) Nehmen Sie an, dass die Mittenfrequenz des Laserübergangs 5 × 1014 Hz ist, und skizzieren Sie die Transmission als Funktion der Frequenz, wenn der Laser gepumpt wird, das Pumpen aber nicht ausreicht, um die Laseroszillation in Gang zu setzen.
537
538
16 Laser
Abb. 16.43 Die Transmission eines Laserresonators.
200 MHz
2 MHz
5 × 10 14 Hz
Aufgabe 16-7: Geschwindigkeitsgleichungen in einem Vierniveaulaser
Betrachten Sie einen Vierniveaulaser mit einem aktiven Volumen 𝑉 = 1 cm3 . Die Besetzungsdichten des oberen und unteren Laserniveaus sind N2 bzw. N1 , und es gilt N = N2 − N1 . Die Pumpgeschwindigkeit ist so groß, dass der Besetzungsunterschied N im stationären Zustand ohne induzierte Emission und Absorption gleich N 0 ist. Die Photonenzahldichte ist n, und die Photonenlebensdauer ist 𝜏P . Geben Sie die Geschwindigkeitsgleichungen für N2 , N1 , N und n als Funktion von N0 , des Übergangsquerschnitts 𝜎(𝜈) und der Zeiten 𝑡sp , 𝜏1 , 𝜏2 , 𝜏21 und 𝜏P an. Bestimmen Sie die Werte von N und n im stationären Zustand. Aufgabe 16-8: Betrieb eines ytterbiumdotierten YAG-Lasers
Yb3+:YAG ist ein seltenerddotiertes dielektrisches Material, das bei 𝜆0 = 1.030 μm auf dem Übergang 2 F5∕2 → 2 F7∕2 strahlt (siehe die Tabellen 14.1, 15.1, 16.1 und Abb. 16.24). Dieser Dreiniveaulaser wird üblicherweise mit einer InGaAs-Laserdiode optisch gepumpt. (a) Das Pumpband (Niveau 3) besitzt eine mittlere Energie von 1.31915 eV und eine Breite von 0.02475 eV. Bestimmen Sie die Wellenlänge der geeigneten Pump-Laserdiode und die Breite der Absorptionsbande in nm. (b) Bei der Mittenfrequenz 𝜈0 des Laserübergangs ist der maximale Übergangsquerschnitt 𝜎0 ≡ 𝜎(𝜈0 ) = 2 × 10−20 cm2 ; die Dotierungsdichte der Yb3+ -Ionen ist N𝑎 = 1.4 × 1020 cm−3 . Bestimmen Sie die Absorptions- und Gewinnkoeffizienten des Materials im Zentrum der Linie, 𝛼(𝜈0 ) ≡ −𝛾(𝜈0 ). Nehmen Sie an, dass das Material bei 𝑇 = 300 K im thermischen Gleichgewicht ist (d. h. es wird nicht gepumpt). (c) Betrachten Sie einen Laserstab mit einer Länge von 6 cm und einem Durchmesser von 2 mm aus diesem Material. Eines seiner Enden hat einen Reflexionsgrad von 80 %, (ℛ1 = 0.8), das andere von 100 % (ℛ2 = 1.0). Nehmen Sie an, dass es keine Streuung und keine sonstigen Verluste gibt, und bestimmen Sie den Verlustkoeffizienten 𝛼R und die Photonenlebensdauer 𝜏P des Resonators. (d) Wenn der Laser gepumpt wird, nimmt der Gewinnkoeffizient 𝛾(𝜈0 ) von seinem anfänglichen negativen Wert im thermischen Gleichgewicht aus zu und ändert
ν
sein Vorzeichen, sodass nun ein Gewinn entsteht. Bestimmen Sie die Schwellen-Besetzungsdifferenz N Sch für die Oszillation. (e) Warum ist es vorteilhaft, wenn Niveau 3 energetisch dicht bei Niveau 2 liegt? (f) Wie würde sich der Betrieb des Lasers ändern, wenn das Wirtsmaterial YAG (Y3 Al5 O12 ) gegen Yttriumvanadat (YVO4 ) ausgewechselt würde? Aufgabe 16-9: Schwellen-Besetzungsdifferenz eines Ar+ -Ionenlasers
Ein Ar+ -Ionenlaser besitzt einen 1 m langen Resonator mit Reflexionsgraden der Spiegel von 98 % und 100 %; andere Verlustmechanismen sind vernachlässigbar. Der atomare Übergang besitzt eine zentrale Wellenlänge 𝜆0 = 515 nm, eine spontane Lebensdauer 𝑡sp = 10 ns und eine Linienbreite Δ𝜆 = 0.003 nm. Das untere Energieniveau hat eine sehr kurze Lebensdauer und ist folglich nicht besetzt. Der Durchmesser der schwingenden Mode ist 1 mm. Bestimmen Sie (a) die Photonenlebensdauer, (b) die Schwellen-Besetzungsdifferenz für den Laserbetrieb. Aufgabe 16-10: Spontane Lebensdauer eines EUV-Übergangs
Ein Laserübergang im Sichtbaren bei 𝜆0 = 500 nm hat eine spontane Lebensdauer 𝑡sp = 10 ns. Geben Sie eine Abschätzung für die spontane Lebensdauer eines EUVLaserübergangs bei 𝜆0 = 18.2 nm unter der Annahme, dass die Oszillatorstärke 𝑆 in beiden Fällen gleich ist. Vergleichen Sie Ihr Ergebnis mit den Angaben in Tabelle 15.1. Aufgabe 16-11: Einschwingvorgänge in einem gewinnmodulierten Laser
(a) Führen Sie die neuen Variablen 𝑋 = n∕𝜏P , 𝑌 = N ∕NSch und die normierte Zeit 𝑠 = 𝑡∕𝜏P ein und zeigen Sie, dass die Geschwindigkeitsgleichungen (16.52) und (16.55) die Form d𝑋 = −𝑋 + 𝑋𝑌 d𝑠 d𝑌 = (𝑌0 − 𝑌) − 2𝑋𝑌 d𝑠 annehmen, wobei 𝑎 = 𝜏P ∕𝑡sp und 𝑌0 = N0 ∕N Sch ist. (b) Schreiben Sie ein Computerprogramm, um diese
Aufgaben
Gleichungen sowohl für das Ein- als auch das Ausschalten zu lösen. Nehmen Sie an, dass 𝑌0 beim Einschalten des Lasers von 0 auf 2 geschaltet wird und beim Ausschalten wieder von 2 auf 0. Nehmen Sie weiter an, dass ein zunächst sehr kleiner Photonenfluss entsprechend 𝑋 = 10−5 die Oszillation bei 𝑡 = 0 startet. Geben Sie mögliche Ursachen für diesen Fluss an. Bestimmen Sie die Einschwingzeiten für 𝑎 = 10−3 , 1 und 103 . Kommentieren Sie die Bedeutung Ihrer Ergebnisse. Aufgabe 16-12: Leistung eines gütemodulierten Rubinlasers
Ein gütemodulierter Rubinlaser besteht aus einem 15 cm langen Stab mit einer Querschnittsfläche von 1 cm2 in einem Resonator der Länge 20 cm. Die Spiegel haben die Reflexionsgrade ℛ1 = 0.95 und ℛ = 0.7. Die Cr3+ -Dichte beträgt 1.58 × 1019 Atome∕cm3 , und der Übergangsquerschnitt ist 𝜎(𝜈0 ) = 2 × 10−20 cm2 . Der Laser wird so gepumpt, dass eine anfängliche Besetzung von 1019 Atomen∕cm3 im oberen Zustand vorliegt und der untere Zustand leer ist. Das Pumpband (Niveau 3) liegt bei ≈ 450 nm; der Übergang von Niveau 3 nach Niveau 2 ist schnell. Die Lebensdauer von Niveau 2 beträgt ≈ 3 ms. (a) Welche Pumpleistung ist erforderlich, um die Besetzung von Niveau 2 bei 1019 cm−3 zu halten? (b) Welche Leistung wird spontan abgestrahlt, bevor die Gütemodulation beginnt? (c) Bestimmen Sie die maximale Leistung, die Energie und die Dauer der gütemodulierten Pulse. Aufgabe 16-13: Betrieb eines auskoppelmodulierten Lasers
Skizzieren die Abhängigkeit der Schwellen-Besetzungsdifferenz NSch (die proportional zum Verlust ist), der Besetzungsdifferenz N(𝑡), der Photonenzahldichte n(𝑡) im Resonator und der Photonenflussdichte 𝜙0 (𝑡) außerhalb des Resonators während zweier Betriebszyklen eines auskoppelmodulierten gepulsten Lasers. Aufgabe 16-14: Modenkopplung mit Lorentzamplituden
Nehmen Sie an, dass die Einhüllenden der Moden eines modengekoppelten Lasers durch 𝐴𝑞 =
√
P
(Δ𝜈∕2)2 , (𝑞𝜈F )2 + (Δ𝜈∕2)2
𝑞 = −∞, … , ∞
gegeben sind und dass ihre Phasen gleich sind. Geben Sie Ausdrücke für die folgenden Parameter der erzeugten Pulsfolge an: (a) die mittlere Leistung, (b) die maximale Leistung und (c) die Pulsdauer (Halbwertsbreite).
Aufgabe 16-15: Frequenzverdopplung
Kristalle mit nichtlinearen optischen Eigenschaften werden häufig für die Frequenzverdopplung eingesetzt, wie in Kapitel 22 ausführlich erklärt wird. In diesem Prozess werden zwei Photonen der Frequenz 𝜈 in ein einzelnes Photon der Frequenz 2𝜈 umgewandelt. Nehmen Sie an, dass sich ein solcher Kristall innerhalb eines Laserresonators mit einem aktiven Medium befindet, das bei der Frequenz 𝜈 einen Gewinn liefert. Die Frequenzen 𝜈 und 2𝜈 entsprechen zwei Moden des Resonators. Geben Sie Ausdrücke für die Geschwindigkeitsgleichungen für die Photonenzahldichten n und n2 bei den Frequenzen 𝜈 und 2𝜈 an, wenn die Geschwindigkeit der Frequenzverdopplung 𝜁n (s−1 m−3 ) und die Geschwindigkeit der Photonenproduktion durch den Laserprozess (Bilanz der induzierten Emission und Absorption) 𝜉n (s−1 m−3 ) sind, wobei 𝜁 und 𝜉 Konstanten sind. Nehmen Sie an, dass die Photonenlebensdauern bei 𝜈 und 2𝜈 𝜏P bzw. 𝜏P2 sind. Bestimmen Sie die Werte von n und n2 im stationären Zustand.
Weiterführende Literatur Laser
Siehe auch die Weiterführende Literatur in Kapitel 15 D. Meschede, Optics, Light and Lasers: The Practical Approach to Modern Aspects of Photonics and Laser Physics, Wiley-VCH, 3. Aufl. 2017. K. F. Renk, Basics of Laser Physics: For Students of Science and Engineering, Springer, 2. Aufl. 2017. M. Prelas, Nuclear-Pumped Lasers, Springer 2016. V. V. Apollonov, High Energy Molecular Lasers: Self-Controlled Volume-Discharge Lasers and Applications, Springer 2016. B. Zohuri, Directed Energy Weapons: Physics of High Energy Lasers (HEL), Springer 2016. C. C. Davis, Lasers and Electro-Optics: Fundamentals and Engineering, Cambridge University Press, 2. Aufl. 2014. F. Trager (Hrsg.), Springer Handbook of Lasers and Optics, Springer, 2. Aufl. 2012. P. W. Milonni, J. H. Eberly, Laser Physics, Wiley, 2. Aufl. 2010. O. Svelto, Principles of Lasers, Springer, 5. Aufl. 2010. W. T. Silfvast, Laser Fundamentals, Cambridge University Press, 2. Aufl. 2008. R. Paschotta, Field Guide to Lasers, SPIE Optical Engineering Press 2008. A. Yariv, P. Yeh, Photonics: Optical Electronics in Modern Communications, Oxford University Press, 6. Aufl. 2006. J.-M. Liu, Photonic Devices, Cambridge University Press 2005, Paperback 2009.
539
540
16 Laser
N. G. Basov, A. S. Bashkin, V. I. Igoshin, A. N. Oraevsky, V. A. Shcheglov, Chemical Lasers, Springer 1990, Paperback 2011. A. E. Siegman, Lasers, University Science 1986. Festkörperlaser
S. B. Mirov, V. V. Fedorov, D. Martyshkin, I. S. Moskalev, M. Mirov, S. Vasilyev, ‚Progress in Mid-IR Lasers Based on Cr and Fe-Doped II-VI Chalcogenides‘, IEEE Journal of Selected Topics in Quantum Electronics 21, 1601719, 2015. A. Ecesue, Y. L. Aung, V. Lupei, Ceramic Lasers, Cambridge University Press 2013. W. Koechner, Solid-State Laser Engineering, Springer, 6. Aufl. 2006. V. V. Ter-Mikirtychev (Hrsg.), Selected Papers on Tunable Solid-State Lasers, SPIE Optical Engineering Press 2002 (Milestone Series 173). L. D. DeLoach, R. H. Page, G. D. Wilke, S. A. Payne, W. F. Krupke, ‚Transition Metal-Doped Zinc Chalcogenides: Spectroscopy and Laser Demonstration of a New Class of Gain Media‘, IEEE Journal of Quantum Electronics 32, 885–895, 1996. P. F. Moulton, ‚Spectroscopic and Laser Characteristics of Ti:Al2 O3 ‘, Journal of the Optical Society of America B 3, 125–133, 1986. J. E. Geusic, H. M. Marcos, L. G. Van Uitert, ‚Laser Oscillations in Nd-Doped Yttrium Aluminum, Yttrium Gallium and Gadolinium Garnets‘, Applied Physics Letters 4, 182– 184, 1964. P. P. Sorokin, M. J. Stevenson, ‚Stimulated Infrared Emission from Trivalent Uranium‘, Physical Review Letters 5, 557–559, 1960. T. H. Maiman, ‚Stimulated Optical Radiation in Ruby‘, Nature, 187, 493–194, 1960. Faser-, induzierte Raman- und induzierte Brillouinlaser
J. Hecht, ‚High-Power Fiber Lasers‘, Optics & Photonics News 29(10), 30–37, 2018. L. Dong, B. Samson, Fiber Lasers: Basics, Technology, and Applications, CRC Press 2017. S. Fu, W. Shi, Y. Feng, L. Zhang, Z. Yang, S. Xu, X. Zhu, R. A. Norwood, N. Peyghambarian, ‚Review of Recent Progress on Single-Frequency Fiber Lasers‘, Journal of the Optical Society of America B 34, A49–A62, 2017. P. Zhou, H. Xiao, J. Leng, J. Xu, Z. Chen, H. Zhang, Z. Liu, ‚High-Power Fiber Lasers Based on Tandem Pumping‘, Journal of the Optical Society of America B 34, A29–A36, 2017. V R. Supradeepa, Y. Feng, J. W. Nicholson, ‚Raman Fiber Lasers‘, Journal of Optics 19, 023001, 2017. N. K. Dutta, Fiber Amplifiers and Fiber Lasers, World Scientific 2015.
M. N. Zervas, C. A. Codemard, ‚High Power Fiber Lasers: A Review‘, IEEE Journal of Selected Topics in Quantum Electronics 20, 0904123, 2014. H. Rong, A. Liu, R. Jones, O. Cohen, D. Hak, R. Nicolaescu, A. Fang, M. Paniccia, ‚An All-Silicon Raman Laser‘, Nature, 433, 292–294, 2005. O. Boyraz, B. Jalali, ‚Demonstration of a Silicon Raman Laser‘, Optics Express, 12, 5269–5273, 2004. T. J. Kippenberg, S. M. Spillane, B. Min, K. J. Vahala, ‚Theoretical and Experimental Study of Stimulated and Cascaded Raman Scattering in Ultrahigh-Q Optical Microcavities‘, IEEE Journal of Selected Topics in Quantum Electronics 10, 1219–1228, 2004. M. J. F. Digonnet (Hrsg.), Rare-Earth-Doped Fiber Lasers and Amplifiers, CRC Press, 2. Aufl. 2001. P. Schmüser, M. Dohlus, J. Rossbach, C. Behrens, Free-Electron Lasers in the Ultraviolet and X-Ray Regime, Springer, 2. Aufl. 2014. C. Pellegrini, ‚The History of X-ray Free-Electron Lasers‘, The European Physical Journal H, 37, 659–708, 2012. J. N. Galayda, J. Arthur, D. F. Ratner, W. E. White, ‚X-ray Free-Electron Lasers – Present and Future Capabilities‘, Journal of the Optical Society of America B 27, B106–B118, 2010. S. Suckewer, P. Jaeglé, ‚X-Ray Laser: Past, Present, and Future‘, Laser Physics Letters 6, 411–436, 2009. J. Hecht, ‚The History of the X-ray Laser‘, Optics & Photonics News 19(5), 26–33, 2008. P. Jaeglé, Coherent Sources of EUV Radiation: Soft X-Ray Lasers and High-Order Harmonic Generation, Springer 2006, Paperback 2010. D. M. Paganin, Coherent X-Ray Optics, Oxford University Press 2006, Paperback 2013. E. L. Saldin, E. A. Schneidmiller, M. V. Yurkov, The Physics of Free Electron Lasers, Springer 2000. R. W. Waynant, M. N. Ediger (Hrsg.), Selected Papers on UV, VUV, and X-Ray Lasers, SPIE Optical Engineering Press 1993 (Milestone Series Bd. 71). P. Luchini, H. Motz, Undulators and Free-Electron Lasers, Oxford University Press 1990. R. C. Elton, X-Ray Lasers, Academic Press 1990. T. C. Marshall, Free-Electron Lasers, Macmillan 1985. D. L. Matthews, P. L. Hagelstem, M. D. Rosen, M. J. Eckart, N. M. Ceglio, A. U. Hazi, H. Medecki, B. J. MacGowan, J. E. Trebes, B. L. Whitten, E. M. Campbell, C. W. Hatcher, A. M. Hawryluk, R. L. Kauffman, L. D. Pleasance, G. Rambach, J. H. Scofield, G. Stone, T. A. Weaver, ‚Demonstration of a Soft X-Ray Amplifier‘, Physical Review Letters 54, 110–113, 1985. P. Jaeglé, G. Jamelot, A. Carillon, A. Sureau, P. Dhez, ‚Superradiant Line in the Soft-X-Ray Range‘, Physical Review Letters 33, 1070–1073, 1974.
Aufgaben
J. M. J. Madey, ‚Stimulated Emission of Bremsstrahlung in a Periodic Magnetic Field‘, Journal of Applied Physics 42, 1906–1913, 1971. M. A. Duguay, P. M. Rentzepis, ‚Some Approaches to Vacuum UV and X-Ray Lasers‘, Applied Physics Letters 10, 350–352, 1967. Gepulste Laser und optische Frequenzkämme
I. Coddington, N. Newbury, W. Swann, ‚Dual-Comb Spectroscopy‘, Optica 3, 414–426, 2016. P. H. Bucksbaum, ‚Sources and Science of Attosecond Light‘, Optics & Photonics News 26(5), 28–35, 2015. W H. Renninger, F. W. Wise, ‚Fundamental Limits to ModeLocked Lasers: Toward Terawatt Peak Powers‘, IEEE Journal of Selected Topics in Quantum Electronics 21, 1100208, 2015. M. E. Fermann, I. Hartl, ‚Ultrafast Fibre Lasers‘, Nature Photonics 7, 868–874, 2013. P. G. Kryukov, ‚Continuous-Wave Femtosecond Lasers‘, Physics-Uspekhi 56, 849–867, 2013. L. N. Binh, N. Q. Ngo, Ultra-Fast Fiber Lasers, CRC Press/ Taylor & Francis 2011. S. A. Diddams, ‚The Evolving Optical Frequency Comb‘, Journal of the Optical Society of America B 27, B51–B62, 2010. R. Paschotta, Field Guide to Laser Pulse Generation, SPIE Optical Engineering Press 2008. T. W Hänsch, ‚Nobel Lecture: Passion for Precision‘, Reviews of Modern Physics 78, 1297–1309, 2006. J. L. Hall, ‚Nobel Lecture: Denning and Measuring Optical Frequencies‘, Reviews of Modern Physics 78, 1279–1295, 2006. J. Ye, S. T. Cundiff (Hrsg.), Femtosecond Optical Frequency Comb Technology: Principle, Operation and Application, Springer 2005, Paperback 2010. L. E. Hargrove, R. L. Fork, M. A. Pollack, ‚Locking of HeNe Laser Modes Induced by Synchronous Intracavity Modulation‘, Applied Physics Letters 5, 4–5, 1964. Populärwissenschaftliche und Übersichtsartikel
T. H. Maiman, The Laser Inventor: Memoirs of Theodore H. Maiman, Springer 2018. M. Bertolotti, Masers and Lasers: An Historical Approach, CRC Press, 2. Aufl. 2015. Sonderheft ‚The Laser at 50‘, Physics World 23(5), Mai 2010. J. Hecht, Understanding Lasers: An Entry Level Guide, Wiley-IEEE, 3. Aufl. 2008. J. Hecht, Beam: The Race to Make the Laser, Oxford University Press 2005. R. L. Walsworth, ‚The Maser at 50‘, Science 306, 236–237, 2004. Sonderheft, IEEE Journal of Selected Topics in Quantum Electronics 6(6), 2000.
C. H. Townes, How the Laser Happened: Adventures of a Scientist, Oxford University Press 1999. J. L. Bromberg, ‚The Birth of the Laser‘, Physics Today, 41(10), 26–33, 1988. J. Hecht (Hrsg.), Laser Pioneer Interviews, High Tech Publications 1985. A. Kastler, ‚Birth of the Maser and Laser‘, Nature 316, 307– 309, 1985. Sonderheft ‚Twenty-Five Years of the Laser‘, Optica Acta (Journal of Modern Optics) 32(9/10), 1985. C. H. Townes, ‚Science, Technology, and Invention: Their Progress and Interactions‘, Proceedings of the National Academy of Sciences (USA) 80, 7679–7683, 1983. A. L. Schawlow, ‚Maser and Laser‘, IEEE Transactions on Electron Devices ED-23, 773–779, 1976. W. E. Lamb, Jr., ‚Physical Concepts in the Development of the Maser and Laser‘. In: B. Kursunoglu, A. Perlmutter (Hrsg.), Impact of Basic Research on Technology, Plenum Press 1973. C. Cohen-Tannoudji, A. Kastler, ‚Optical Pumping‘. In: E. Wolf (Hrsg.), Progress in Optics, North-Holland 1966, Bd. 5, S. 1–81. A. Yariv, J. P. Gordon, ‚The Laser‘, Proceedings of the IEEE, 51, 4–29, 1963. Historische Darstellungen und Sammlungen von Nachdrucken
Siehe auch die historischen Artikel in der Weiterführenden Literatur in Kapitel 18 W T. Silfvast (Hrsg.), Selected Papers on Fundamentals of Lasers, SPIE Optical Engineering Press 1993 (Milestone Series Bd. 70). D. O’Shea, D. C. Peckham (Hrsg.), Lasers: Selected Reprints, American Association of Physics Teachers 1982. A. L. Schawlow, ‚Spectroscopy in a New Light (Nobel Lecture in Physics, 1981)‘, Reviews of Modern Physics 54, 697–707, 1982. D. C. O’Shea, D. C. Peckham (Hrsg.), ‚Resource Letter L-1: Lasers‘, American Journal of Physics 49, 915–925, 1981. F. S. Barnes (Hrsg.), Laser Theory, IEEE Press Reprint Series, IEEE Press 1972. J. Weber (Hrsg.), Lasers: Selected Reprints with Editorial Comment, CRC Press 1967. A. Kastler, ‚Optical Methods for Studying Hertzian Resonances (Nobel Lecture in Physics, 1966)‘. In Nobel Lectures in Physics, 1963–1970, World Scientific 1998, S. 186–204. C. H. Townes, ‚Production of Coherent Radiation by Atoms and Molecules (Nobel Lecture in Physics, 1964)‘. In Nobel Lectures in Physics, 1963–1970, World Scientific 1998, S. 58–86. N. G. Basov, ‚Semiconductor Lasers (Nobel Lecture in Physics, 1964)‘. In Nobel Lectures in Physics, 1963–1970, World Scientific 1998, S. 89–105.
541
542
16 Laser
A. M. Prokhorov, ‚Quantum Electronics (Nobel Lecture in Physics, 1964)‘. In Nobel Lectures in Physics, 1963–1970, World Scientific 1998, S. 110–116. W E. Lamb, Jr., ‚Theory of an Optical Maser‘, Physical Review 134, A1429–A1450, 1964. A. Javan, W R. Bennett, Jr., D. R. Herriott, ‚Population Inversion and Continuous Optical Maser Oscillation in a Gas Discharge Containing a He-Ne Mixture‘, Physical Review Letters 6, 106–110, 1961. T. H. Maiman, ‚Stimulated Optical Radiation in Ruby‘, Nature 187, 493–194, 1960. R. H. Dicke, ‚Molecular Amplification and Generation Systems and Methods‘, U.S. Patent 2 851 652, 9. September 1958. A. L. Schawlow, C. H. Townes, ‚Infrared and Optical Masers‘, Physical Review 112, 1940–1949, 1958. J. P. Gordon, H. J. Zeiger, C. H. Townes, ‚The Maser – New Type of Microwave Amplifier, Frequency Standard, and Spectrometer‘, Physical Review 99, 1264–1274, 1955.
N. G. Basov, A. M. Prokhorov, ‚Possible Methods of Obtaining Active Molecules for a Molecular Oscillator‘, Soviet Physics – JETP, 1, 184–185, 1955 [Zhurnal Eksperimental’noi i Teoreticheskoi Fiziki, 28, 249–250, 1955]. J. P. Gordon, H. J. Zeiger, C. H. Townes, ‚Molecular Microwave Oscillator and New Hyperfine Structure in the Microwave Spectrum of NH3 ‘, Physical Review 95, 282– 284, 1954. V. A. Fabrikant, ‚The Emission Mechanism of Gas Discharges‘, Trudi Vsyesoyuznogo Elektrotekhnicheskogo Instituta (Reports of the All-Union Electrotechnical Institute, Moscow), 41, 236–296, 1940. R. Ladenburg, ‚Dispersion in Electrically Excited Gases‘, Reviews of Modern Physics 5, 243–256, 1933. H. Kopfermann, R. Ladenburg, ‚Experimental Proof of ‚Negative Dispersion“, Nature 122, 438–439, 1928. A. Einstein, ‚Zur Quantentheorie der Strahlung‘, Physikalische Zeitschrift 18, 121–128, 1917.
543
17 Halbleiteroptik Photonik ist eine Technologie, die den Strom der Photonen zu kontrollieren sucht, ganz ähnlich wie die Elektronik den Strom von Ladungsträgern (Elektronen und Löchern). Beide Technologien treffen sich in der Halbleiteroptik: Photonen erzeugen bewegliche Ladungsträger, und Ladungsträger erzeugen und kontrollieren den Strom von Photonen. Halbleiterbauelemente dienen als Photonenquellen (lichtemittierende Dioden und Laserdioden), Verstärker, Detektoren, Wellenleiter, Modulatoren, Sensoren und nichtlineare optische Elemente. Das Zusammenspiel von Halbleiter- und elektronischen Bauelementen hat die Entwicklung beider Felder gefördert. Halbleiter absorbieren und emittieren Photonen, wobei sie Übergänge zwischen erlaubten Energieniveaus vollziehen. Obwohl die Regeln, die diese Wechselwirkungen bestimmen, dieselben wie die in Abschnitt 14.3 besprochenen sind, besitzen Halbleiter einige besondere Eigenschaften (siehe Abschnitt 14.1.4): • Ein Halbleitermaterial kann nicht als Ansammlung von nicht wechselwirkenden Atomen angesehen werden, von denen jedes seine eigenen individuellen Energieniveaus besitzt. Wegen der gegenseitigen Nähe der Atome im Kristallgitter sind die Energieniveaus eine Eigenschaft des Systems als Ganzem. • Gruppen dicht beisammen liegender Energieniveaus bilden Energiebänder. Ohne externe Anregung, bei 𝑇 = 0 K, sind diese Bänder entweder vollständig mit Elektronen besetzt oder vollständig leer. Das am niedrigsten liegende freie Energieband wird das Leitungsband genannt, während das höchste besetzte Energieband das Valenzband ist. Diese beiden Bänder werden durch ein verbotenes Band mit der energetischen Breite E g getrennt (die sogenannte Bandlücke). • Eine (thermische, optische oder elektronische) äußere Energiequelle kann Energie auf ein Elektron im Valenzband übertragen und es veranlassen, das verbotene Band zu überqueren und sich ins Leitungsband zu begeben. Dieser Übergang lässt eine freie Stel-
le (ein Loch) im Valenzband zurück. Bei dem umgekehrten Prozess, der Rekombination von Elektron und Loch, geht ein Elektron aus dem Leitungsband in einen leeren Zustand im Valenzband über (vorausgesetzt, dass ein solcher verfügbar ist) und erzeugt dabei ein Photon und/oder Phononen. Photonen wechselwirken demzufolge mit beiden Arten von Ladungsträgern, sowohl Elektronen als auch Löchern. Zwei Prozesse sind für den Betrieb fast aller optischen Halbleiterbauelemente von grundlegender Bedeutung: 1) Die Absorption eines Photons kann ein Elektron-LochPaar erzeugen. Bewegliche Ladungsträger, die bei der Absorption eines Photons entstehen, verändern die elektrischen Eigenschaften des Halbleiters. Dieser Prozess ist die Grundlage des Betriebs von photoleitenden Photodetektoren. 2) Die Rekombination eines Elektrons und eines Lochs kann die Emission eines Photons bewirken. Dieser Prozess ist für den Betrieb von HalbleiterPhotonenquellen verantwortlich. Spontane strahlende Elektron-Loch-Rekombination erzeugt in einer lichtemittierenden Diode Photonen. Induzierte Elektron-Loch-Rekombination ist für die Erzeugung von Photonen in einer Laserdiode verantwortlich.
In diesem Kapitel . . . Die grundlegenden Prinzipien der Halbleiterphysik werden in diesem Kapitel bereits als vertraut vorausgesetzt. In Abschnitt 17.1 wiederholen wir kurz die wesentlichen Eigenschaften von Halbleitern, insbesondere diejenigen, die für die Halbleiter-Optoelektronik von Bedeutung sind. Abschnitt 17.2 präsentiert eine Einführung in die optischen Eigenschaften von Volumen- und quantenbegrenzten Halbleitern. Wir geben eine vereinfachte Theorie der Absorption und der spontanen und induzierten Emission analog der in Abschnitt 14.3 entwickelten Theorie der Wechselwirkung von Photonen mit Atomen.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
544
17 Halbleiteroptik
Dieses und die folgenden beiden Kapitel sollten als eine Einheit betrachtet werden. Kapitel 18 befasst sich mit dem Betrieb von Halbleiter-Lichtquellen wie lichtemittierenden Dioden und Laserdioden. Kapitel 19 ist Halbleiterdetektoren gewidmet.
17.1 Halbleiter Wie in Abschnitt 14.1.4 diskutiert, ist ein Halbleiter ein kristalliner oder amorpher Festkörper, dessen elektrische Leitfähigkeit normalerweise zwischen der eines Metalls und der eines Isolators liegt. Seine Leitfähigkeit kann wesentlich verändert werden, indem die Temperatur oder Dotierkonzentration des Materials modifiziert wird oder es mit Licht bestrahlt wird. Die Bandstruktur von Halbleitern und ihre Fähigkeit, Übergänge und Heterostrukturen zu bilden, ermöglichen einzigartige Eigenschaften. Quantenbeschränkte Halbleiterstrukturen erweitern den Bereich möglicher Eigenschaften noch mehr. Wie wir in Abschnitt 17.1.2 sehen werden, bestehen optische Halbleiterbauelemente häufig aus ternären oder quaternären Halbleiterverbindungen der Gruppen III-V wie z. B. InGaAsP, AlInGaP oder AlInGaN oder organischen Halbleitern, immer häufiger aber auch aus Elementen der Gruppe IV (Kohlenstoff, Silicium, Germanium, Zinn). Elektronische Halbleiterbauelemente werden hauptsächlich aus Silicium hergestellt.
17.1.1
Energiebänder und Ladungsträger
Energiebänder in Halbleitern
Die Wechselwirkungen zwischen den Atomen in Festkörpern sind so stark, dass sie nicht als individuelle Einheiten behandelt werden können (siehe Abschnitt 14.1.4). Ihre Leitungselektronen sind nicht an einzelne Atome gebunden, sondern gehören dem Ensemble von Atomen als Ganzem an. Die Lösung der Schrödingergleichung für die Energie der Elektronen im periodischen Potential der Atome im Kristallgitter zeigt eine Aufspaltung der atomaren Energieniveaus und die Entstehung von Energiebändern. Jedes Band enthält eine große Zahl dicht gepackter diskreter Energieniveaus, die in guter Näherung als ein Kontinuum beschrieben werden können. Wie Abb. 17.1 illustriert, sind die Valenz- und Leitungsbänder durch die Bandlücke E g getrennt, die bei der Bestimmung der elektrischen und optischen Eigenschaften des Materials eine wichtige Rolle spielt.
Der Ursprung der Bandlücke kann mithilfe des Kronig-Penney-Modells veranschaulicht werden. In dieser einfachen Theorie wird das Potential des Kristallgitters, dessen eindimensionale Version in Abb. 17.2(a) dargestellt ist, näherungsweise durch ein eindimensionales periodisches Rechteckpotential beschrieben, wie in Abb. 17.2(b) gezeigt. Die Lösung der zugehörigen Schrödingergleichung (14.3) für dieses Potential ergibt erlaubte Energiebänder mit Lösungen in Form von sich ausbreitenden Wellen, die durch verbotene Bänder mit exponentiell abklingenden Lösungen getrennt sind. Man kann zeigen, dass die Ergebnisse aus diesem Modell allgemein sind und auch in drei Dimensionen gelten. Dieser Ansatz ähnelt dem, den wir in Abschnitt 7.2 verwendet hatten, um die Optik von eindimensionalen periodischen Medien zu analysieren. Die Eigenfunktionen in Form von sich ausbreitenden Wellen sind Blochmoden mit der Periodizität des Kristallgitters [siehe Gl. (7.66)]. Elektronen und Löcher
Wie in Abschnitt 14.1 diskutiert, überlappen die Wellenfunktionen der Elektronen in einem Halbleiter, sodass das paulische Ausschlussprinzip gilt. Es besagt, dass keine zwei Elektronen denselben Quantenzustand einnehmen können und dass die tiefsten verfügbaren Energieniveaus zuerst gefüllt werden. Elementhalbleiter wie Si oder Ge haben vier Valenzelektronen pro Atom, die kovalente Bindungen bilden. Bei 𝑇 = 0 K ist die Zahl von Quantenzuständen, die das Valenzband aufnehmen kann, gerade so groß, dass es vollständig gefüllt wird, während das Leitungsband vollständig leer bleibt. Das Material kann unter diesen Bedingungen keine Elektrizität leiten. Wenn die Temperatur zunimmt, können jedoch einige Elektronen thermisch vom Valenzband ins leere Leitungsband angeregt werden, wo reichlich freie Zustände vorhanden sind (siehe Abb. 17.3). Diese Elektronen können dann als bewegliche Träger wirken, unter dem Einfluss eines äußeren elektrischen Feldes durch das Kristallgitter fließen und dadurch zu einem elektrischen Strom beitragen. Außerdem hinterlässt ein Elektron, das das Valenzband verlässt, dort einen freien Quantenzustand, der wiederum den restlichen Elektronen im Valenzband erlaubt, ihre Plätze unter dem Einfluss eines externen Feldes zu tauschen. Die Elektronen im Valenzband können sich somit bewegen. Alternativ – und äquivalent – kann diese Bewegung auch als Bewegung des durch das angeregte Elektron zurückgelassenen Lochs in der entgegengesetzten Richtung betrachtet werden. Das Loch verhält sich daher wie ein Teilchen mit der positiven Ladung +𝑒.
17.1 Halbleiter
Si
GaAs 5
5 Leitungsband
g
g
1.12 eV
1.42 eV
Energie / eV
Energie / eV
Leitungsband 0
Valenzband –5
–10
–15
–15
ist, 𝑘 der Betrag des Wellenvektors k = p∕ℏ und 𝑚0 die Elektronenmasse (9.1 × 10−31 kg). Die Beziehung zwischen E und 𝑘 für ein freies Elektron ist daher eine einfache Parabel.
a
Abb. 17.2 (a) Das Potential einer unendlichen eindimensionalen Ansammlung von Atomen mit der Gitterkonstante a. (b) Das idealisierte Rechteckpotential (mit der Höhe V 0 ), das im Kronig-Penney-Modell verwendet wird.
Leitungsband Elektronenenergie
–5
–10
0
Übung 17-1: Energie-Impuls-Beziehung für ein freies Elektron
(a) Betrachten Sie eine eindimensionale Version der zeitunabhängigen Schrödingergleichung aus Gl. (14.3) für ein freies Elektron (V = 0) der Masse 𝑚0 . Verwenden Sie eine Probefunktion der Form 𝜓(𝑥) ∝ exp(−i𝑘𝑥) und zeigen Sie, dass die Energie-Impuls-Beziehung die quadratische Form
Bandlücke
Elektron Loch
0
Valenzband
(a) (b)
Abb. 17.1 Energiebänder in Si und GaAs. Die Energie E g der Bandlücke zwischen Valenz- und Leitungsband beträgt bei Zimmertemperatur 1.12 eV für Si und 1.42 eV für GaAs.
g
Valenzband
Abb. 17.3 Elektronen im Leitungs- und Löcher im Valenzband bei T > 0 K.
Unter dem Strich ist das Resultat, dass jede Anregung eines Elektron ein freies Elektron im Leitungsband und ein freies Loch im Valenzband hervorbringt. Die beiden Ladungsträger können sich unter dem Einfluss eines angelegten elektrischen Feldes durch den Kristall bewegen und dabei einen elektrischen Strom erzeugen. Das Material verhält sich wie ein Halbleiter, dessen Leitfähigkeit mit steigender Temperatur rasch zunimmt, weil immer mehr bewegliche Träger thermisch erzeugt werden. Energie-Impuls-Beziehungen
Nach der Wellenmechanik sind die Energie E und der Impuls p eines Elektrons in einem Gebiet mit konstantem Potential wie z. B. im Vakuum durch E = 𝑝2 ∕2𝑚0 = ℏ2 𝑘2 ∕2𝑚0 verknüpft, wobei 𝑝 der Betrag des Impulses
E=
ℏ2 𝑘2 2𝑚0
(17.1)
annimmt, sodass die Energie in diesem idealen Fall nicht gequantelt ist. (b) Für ein freies Photon gilt im Gegensatz dazu gemäß Gl. (13.11) eine lineare Beziehung zwischen Energie und Impuls: E = 𝑝𝑐 = 𝑐ℏ𝑘 ,
(17.2)
wobei 𝑐 die Lichtgeschwindigkeit im Medium ist. Was ist die Ursache dieses Unterschieds und welche Bedeutung hat er? Entsprechend wird auch die Bewegung eines Elektrons in einem Halbleitermaterial durch die Schrödingergleichung beschrieben, nun aber mit einem Potential, das durch die Ladungen in dem periodischen Kristallgitter des Materials bestimmt wird. Wie früher besprochen ergibt diese Konstruktion erlaubte Energiebänder, die durch verbotene Bänder getrennt sind, wie durch das Kronig-Penney-Modell vorhergesagt. Die daraus folgenden Beziehungen zwischen E und 𝑘 für Elektronen und Löcher in den Leitungs- bzw. Valenzbändern sind in Abb. 17.4 für Si und GaAs dargestellt. Die Ener-
545
546
17 Halbleiteroptik
L L g=
g=
1.12 eV •
•
k
[111]
Si
1.42 eV k
[100]
GaAs
[111]
[100]
Abb. 17.4 Schnitt durch die E −k-Funktion für Si und GaAs entlang zweier Kristallrichtungen: [111] (links) und [100] (rechts).
gie E ist eine periodische Funktion der Komponenten (𝑘1 , 𝑘2 , 𝑘3 ) des Wellenvektors k mit der Periodizität (π∕𝑎1 , π∕𝑎2 , π∕𝑎3 ), wobei 𝑎1 , 𝑎2 , 𝑎3 die Konstanten des Kristallgitters sind. Abbildung 17.4 zeigt Schnitte durch diese Beziehung entlang zweier besonderer Richtungen des Wellenvektors k. Die möglichen Werte von 𝑘 im Intervall [−π∕𝑎, π∕𝑎] definieren die erste Brillouinzone. Die Energie eines Elektrons im Leitungsband hängt somit nicht nur vom Betrag seines Impulses ab, sondern auch von der Richtung, in der es sich im Kristall ausbreitet. Das E −𝑘-Diagramm eines Halbleiters hat eine gewisse Ähnlichkeit mit dem 𝜔−K -Diagramm eines photonischen Kristalls (siehe Abb. 7.29).
wobei E L die Energie am Minimum des Leitungsbands ist und 𝑘 von dem Wellenvektor am Ort des Minimums aus gemessen ist. Diese Beziehung sagt aus, dass sich ein Elektron im Leitungsband ähnlich wie ein freies Elektron verhält, nur mit einer Masse 𝑚L , die als die effektive Masse des Elektrons (im Leitungsband) bezeichnet wird und sich von der Masse 𝑚0 des freien Elektrons unterscheidet. Der Einfluss der Ionen des Gitters auf die Bewegung eines Elektrons im Leitungsband ist dann in der effektiven Masse 𝑚L enthalten. Dieses Verhalten ist in Abb. 17.5 dargestellt. Ähnlich gilt in der Nähe des Maximums des Valenzbands
Die effektive Masse
wobei E V = E L − E g die Energie an der Oberseite des Valenzbands ist und 𝑚V die effektive Masse des Lochs (im Valenzband), wie in Abb. 17.5 gezeigt. Der Einfluss der Gitterionen auf die Bewegung eines Lochs im Valenzband wird durch die effektive Masse 𝑚V ausgedrückt. Sie hängt außerdem von dem jeweils betrachteten Band ab. Häufig existieren mehrere Parabeln mit un-
Aus Abb. 17.4 ist ersichtlich, dass die E −𝑘-Beziehung in der Nähe des Minimums des Leitungsbands näherungsweise durch eine Parabel beschrieben werden kann, E = EL +
g=
ℏ2 𝑘2 , 2𝑚L
(17.3)
E = EV −
g=
1.12 eV
ℏ2 𝑘2 , 2𝑚V
1.42 eV
k
Si
(17.4)
k
GaAs
Abb. 17.5 Die E −k-Diagramme für Si und GaAs werden in der Nähe des Minimums des Leitungsbands und des Maximums des Valenzbands in guter Näherung durch Parabeln beschrieben.
17.1 Halbleiter
Tab. 17.1 Typische Werte der effektiven Massen von Elektronen und Löchern in ausgewählten Halbleitermaterialien. mL ∕m0
mV ∕m0
Si
0.98
0.49
GaAs GaN
0.07 0.20
0.50 0.80
Material
terschiedlicher Krümmung in der Nähe des Maximums des Valenzbands; sie entsprechen sogenannten schweren Löchern, leichten Löchern, und Löchern des split-offBands. Die effektive Masse hängt von der Kristallstruktur des Materials und der Ausbreitungsrichtung in Bezug auf das Gitter ab, da sich der Abstand der Atome mit der kristallographischen Richtung ändert. Typische Verhältnisse der gemittelten effektiven Massen zur Masse 𝑚0 des freien Elektrons sind in Tabelle 17.1 für Si, GaAs GaN angegeben. Halbleiter mit direkter und indirekter Bandlücke
Halbleiter, für die die minimale Energie des Leitungsbands und die maximale Energie des Valenzbands demselben Wert der Wellenzahl 𝑘 entsprechen (demselben Impuls), werden Materialien mit direkter Bandlücke genannt. Halbleiter, für die das nicht der Fall ist, heißen Materialien mit indirekter Bandlücke. Wie aus Abb. 17.5 offensichtlich ist, ist GaAs ein Halbleiter mit direkter Bandlücke, wohingegen Si ein Halbleiter mit indirekter Bandlücke ist. Die Unterscheidung ist wichtig, weil ein Übergang zwischen dem Minimum des Leitungsbands und dem Maximum des Valenzbands in eihvnem Halbleiter mit indirekter Bandlücke mit einer Änderung des Elektronenimpulses einhergeht, der die Beteiligung eines dritten Teilchens erforderlich macht, beispielsweise eines Phonons. Im Folgenden werden wir sehen, dass Halbleiter mit direkter Bandlücke (wie GaAs) effiziente Photonenemitter sind, Halbleiter mit indirekter Bandlücke (wie Si) dagegen normalerweise nicht.
17.1.2
Halbleitermaterialien
Abbildung 17.6 zeigt einen Ausschnitt aus dem Periodensystem, der die meisten für die Halbleiterelektronik und -photonik wichtigen Elemente enthält. Sowohl Element- als auch Verbindungshalbleiter spielen dort entscheidende Rollen. Im Folgenden wollen wir nacheinander verschiedene Klassen dieser Materialien untersuchen, bevor wir uns den dotierten Halbleitern zuwenden.
II
III 5
B
C
N
O
12
13
14
15
16
2 3 4 5 6
IV 6
Mg Al Si 30
31
32
V 7
VI 8
P
S
33
34
Zn Ga Ge As Se 48
49
50
51
52
Cd In Sn Sb Te 80
82
Hg
Pb
Gas flüssig fest
Abb. 17.6 Ein Ausschnitt aus dem Periodensystem, der die wichtigsten Elemente in Halbleitern zeigt. Die Schattierung der Elemente gibt den Aggregatzustand bei Zimmertemperatur an. Das vollständige Periodensystem ist in Abb. 14.3 gezeigt.
Elementhalbleiter
Silicium (Si) und Germanium (Ge) sind wichtige Elementhalbleiter aus Gruppe IV des Periodensystems. Beide finden breite Anwendung in der Photonik, obwohl sie wegen ihrer indirekten Bandlücken traditionell nicht als Lichtemitter verwendet wurden; ihre grundlegenden Eigenschaften sind in Tabelle 17.2 aufgeführt. Germanium verhält sich dagegen wie ein Material mit direkter Bandlücke und kann (unter bestimmten Umständen) Licht emittieren. Silicium ist der Standard bei der Herstellung praktisch aller kommerziellen elektronischen integrierten Schaltkreise und erfüllt auch in der Photonik (unter der Bezeichnung Siliciumphotonik) eine Vielzahl von Funktionen. Elemente der Gruppe IV können miteinander legiert werden, wodurch Verbindungshalbleiter mit einem breiten Anwendungsspektrum entstehen. Beispielsweise ist die binäre Legierung Siliciumcarbid (SiC) ein Material mit indirekter Bandlücke (auch unter den Handelsnamen Karborund oder Karborundum bekannt), das sich zur Herstellung von UV-Photodetektoren und als Template für Gruppe-III-Nitrid-Photoemitter eignet. Silicium-Germanium-Legierungen (Si𝑥 Ge1−𝑥 ) finden sowohl in der Photonik als auch in der Elektronik Anwendung, beispielsweise als Material für Photodetektoren im Infraroten. Germanium-Zinn (Ge1−𝑦 Sn𝑦 ) eignet sich zur Herstellung von Photodetektoren sowie Laserdioden und LED. Nützliche ternäre und quaternäre Halbleiterverbindungen der Gruppe IV sind zum Beispiel Si𝑥 Ge1−𝑥−𝑦 Sn𝑦 und Si𝑥 Ge1−𝑥−𝑦−𝑧 Sn𝑦 C𝑧 . Die Verwendung von Legierungen und Kombinationen von Elementen der 4. Hauptgruppe ist ein aufstrebendes eigenes Gebiet der Photonik, das als Photonik der Gruppe IV bezeichnet wird.
547
548
17 Halbleiteroptik
Tab. 17.2 Ausgewählte Element- und binäre III-V-Halbleiter und ihre Kristallstrukturen und Bandlücken. Material
Struktura)
N Al
P
Abb. 17.8 Kombinationen für die Bildung von binären III-V-Halbleitern.
Bandlücke
Artb)
Energiec) E g ∕eV
Wellenlänged) 𝝀g ∕𝛍 m
Ga
As
In
Sb
Si
D
i
1.12
1.11
Ge AlN
D W
i d
0.66 6.02
1.88 0.206
AlP
Z
i
2.45
0.506
Binäre III-V-Halbleiter
AlAs AlSb
Z Z
i i
2.16 1.58
0.574 0.785
GaN
W
d
3.39
0.366
GaP GaAs
Z Z
i d
2.26 1.42
0.549 0.873
GaSb
Z
d
0.73
1.70
InN InP
W Z
d d
0.65 1.35
1.91 0.919
InAs
Z
d
0.36
3.44
InSb
Z
d
0.17
7.29
Verbindungen aus einem Element aus Gruppe III, wie Aluminium (Al), Gallium (Ga) oder Indium (In), mit einem Element aus Gruppe V wie Stickstoff (N), Phosphor (P), Arsen (As) oder Antimon (Sb) sind wichtige Halbleiter für die Photonik. Diese 12 III-V-Verbindungen (siehe Abb. 17.8) sind in Tabelle 17.2 zusammen mit ihrer Kristallstruktur (Zinkblende oder Wurtzit), der Art ihrer Bandlücke (direkt oder indirekt) sowie der Energie E g und Wellenlänge 𝜆g = ℎ𝑐0 ∕E g ihrer Bandlücke aufgeführt. Die Bandlücken und Gitterkonstanten dieser Verbindungen sind in Abb. 17.11 gezeigt. Aus vielen dieser Verbindungen können leicht Photonenquellen (lichtemittierende Dioden und Laser) und Detektoren hergestellt werden. Der erste dieser binären Halbleiter, der in der Photonik Verwendung fand, war Galliumarsenid (GaAs), das manchmal auch als Alternative zu Si für schnelle elektronische Bauelemente und Schaltungen verwendet wird. Galliumnitrid (GaN) spielt in der Photonik aufgrund seiner Bandlücke im nahen Ultraviolett eine zentrale Rolle; in der Elektronik wird es wegen seiner Temperaturbeständigkeit geschätzt. AlN ist ein Isolator; es hat die größte Bandlücke aller III-VVerbindungen und emittiert Photonen mit der kürzesten Wellenlänge, bei 𝜆0 = 210 nm im mittleren Ultraviolett.
a) Die angegebene Kristallstruktur ist die häufigste Struktur des Materials: D = Diamant, Z = Zinkblende, W = Wurtzit (siehe Abb. 17.7). Die Zinkblendestruktur besteht aus zwei ineinander verschachtelten kubisch-flächenzentrierten Gittern, eines für jedes Element, die um 1/4 der Raumdiagonale gegeneinander versetzt sind. Das Diamantgitter ist im Prinzip dasselbe Gitter wie das Zinkblendegitter, nur dass hier beide Elemente identisch sind. Die Wurtzitstruktur besteht aus zwei hexagonal dichten Packungen für die beiden Elemente, die um 3/8 der Länge der trigonalen Achse gegeneinander versetzt sind. Alle Atome sind tetraedrisch von ihren nächsten Nachbarn umgeben. b) i: indirekte Bandlücke, d: direkte Bandlücke. c) Bei 300 K. d) Die Wellenlänge 𝜆g hängt mit der Energie Eg der Bandlücke durch 𝜆g = ℎ𝑐0 ∕E g zusammen; wenn die Energie in eV und die Wellenlänge in μm ausgedrückt wird, ist 𝜆g ≈ 1.24∕E g .
Ga N Ga As
Abb. 17.7 Die Zinkblendestruktur (links) besteht aus zwei einander durchdringenden kubisch flächenzentrierten Gittern, einem für jedes Element, die gegeneinander um 1∕4 der Raumdiagonale versetzt sind. Das Diamantgitter ist mit dem Zinkblendegitter identisch, nur dass alle Atome identisch sind. Die Brillouinzone für diese Strukturen ist in Abb. 7.28 dargestellt. Die Wurtzitstruktur (rechts) besteht aus zwei hexagonal dicht gepackten Gittern, einem für jedes Element, die gegeneinander um (3∕8)c entlang der dreizähligen c-Achse versetzt sind. Alle Atome sind tetraedrisch mit ihren Nachbarn verbunden.
Ternäre III-V-Halbleiter
Verbindungen aus zwei Elementen der Gruppe III mit einem Element der Gruppe V (oder einem Element der Gruppe III mit zwei der Gruppe V) sind wichtige ternäre Halbleiter (siehe Abb. 17.9). Beispielsweise ist (Al𝑥 Ga1−𝑥 )As eine Verbindung mit Eigenschaften, die zwischen denjenigen von AlAs und GaAs liegen, je nach dem Zusammensetzungsverhältnis 𝑥 (dem Bruchteil der Ga-Atome in GaAs, die durch Al-Atome ersetzt sind). Die Bandlücke E g dieses Materials variiert zwischen 1.42 eV für GaAs und 2.16 eV für AlAs, wenn 𝑥 sich entlang der Verbindungslinie von GaAs und AlAs in Abb. 17.11(a) von 0 auf 1 verändert. Weil diese Linie im Wesentlichen vertikal verläuft, sind die Gitter von Al𝑥 Ga1−𝑥 As und GaAs nahezu identisch; eine Schicht des Materials mit beliebiger Zusammensetzung kann daher auf einer Schicht mit unterschiedlicher Zusammensetzung aufgebracht werden, ohne Gitterspan-
17.1 Halbleiter
Al
In
x
x
1–x
1–x
Ga
As
Ga
N
Abb. 17.9 Ternäre III-V-Halbleiter.
nungen zu erzeugen. In der in Abb. 17.11(a) gezeigten Darstellung von Bandlücken und Gitterkonstanten sind noch weitere nützliche ternäre III-V-Verbindungen wie z. B. Ga(As1−𝑥 P𝑥 ) enthalten. (In𝑥 Ga1−𝑥 )As wird häufig für Photonenquellen und Detektoren im nahen Infrarot verwendet. Ähnlich sind (Al𝑥 Ga1−𝑥 )N und (In𝑥 Ga1−𝑥 )N wichtige ternäre Halbleiter für photonische Bauelemente, die im ultravioletten, violetten, blauen oder grünen Bereich des Spektrums arbeiten, wie aus Abb. 17.11(b) zu entnehmen ist. In der Elektronik können bipolare Transistoren aus (In𝑥 Ga1−𝑥 )As/InP-Heterokontakten sowohl Licht emittieren als auch mit sehr hohem Geschwindigkeiten geschaltet werden. Quaternäre III-V-Halbleiter
Diese Verbindungen werden aus zwei Elementen der Gruppe III und zwei Elementen der Gruppe V (oder drei aus Gruppe III und einem aus Gruppe V) gebildet. Quaternäre Halbleiter bieten aufgrund eines zusätzlichen Freiheitsgrads bei ihrer Zusammensetzung (siehe Abb. 17.10) bei der Herstellung von Materialien mit bestimmten Eigenschaften mehr Flexibilität als ternäre Halbleiter. Ein Beispiel ist In1−𝑥 Ga𝑥 As1−𝑦 P𝑦 , dessen Bandlücke zwischen 0.36 eV (InAs) und 2.26 eV (GaP) variiert, während sich die Zusammensetzungsverhältnisse 𝑥 und 𝑦 zwischen 0 und 1 ändern. Die Gitterkonstante ändert sich gewöhnlich linear mit dem Mischungsverhältnis (Gesetz von Vegard). Die gepunktete Fläche in Abb. 17.11(a) zeigt den von dieser Verbindung abgedeckten Bereich von Bandlücken und Gitterkonstanten. Für Mischungsverhältnisse 𝑥 und 𝑦, die die Bedingung 𝑦 = 2.16(1 − 𝑥) erfüllen, ist die Gitterkonstante von In1−𝑥 Ga𝑥 As1−𝑦 P𝑦 identisch mit der von InP, das daher als geeignete Schablone (Substrat) verwendet werden kann. Diese quaternäre Verbindung wird zur Herstellung von lichtemittierenden Dioden, LaserP y 1–y Ga x 1–x In
As
Abb. 17.10 Quaternäre III-VHalbleiter.
dioden und Photodetektoren besonders in der Umgebung der in optischen Nachrichtensystemen genutzten Wellenlänge von 1550 nm verwendet (siehe Kapitel 18, 19 und 25). Ein anderes Beispiel ist Al𝑥 In𝑦 Ga1−𝑥−𝑦 P, für das GaAs als Schablone dient; diese Verbindung bietet eine sehr intensive Emission im roten, orange und gelben Spektralbereich [siehe schattiertes Gebiet in Abb. 17.11(a)]. Ein anderes wichtiges quaternäres Material ist das III-Nitrid Al𝑥 In𝑦 Ga1−𝑥−𝑦 N, das auf dieselbe Weise den grünen, blauen, violetten und ultravioletten Spektralbereich abdeckt [Abb. 17.11(b)]. Geeignete Schablonen für die III-Nitride sind Saphir und SiC. Binäre und ternäre II-VI-Halbleiter
Binäre II-VI-Verbindungen, d. h. Verbindungen aus Elementen der Gruppe II (z. B. Zn, Cd, Hg) und der Gruppe VI (z. B. S, Se, Te) des Periodensystems sind ebenfalls nützliche Halbleiter. Hierzu gehören ZnS, ZnSe, ZnTe, CdS, CdSe, CdTe, HgS, HgSe und HgTe (siehe Abb. 17.12). Im Gegensatz zu den II-V-Halbleitern kommen die II-VI-Verbindungen auch in der Natur vor. Sie haben alle eine Zinkblendestruktur und direkte Bandlücken; Ausnahmen sind HgSe und HgTe, die Halbmetalle mit kleinen negativen Bandlücken sind. Eine besondere Eigenschaft von ZnSe ist, dass es mit einer relativ niedrigen Defektdichte auf einem GaAs-Substrat abgeschieden werden kann, da die Gitterkonstanten der beiden Materialien ähnlich sind. Außerdem sind die Gitter von HgTe und CdTe fast identisch, sodass der ternäre Halbleiter Hg𝑥 Cd1−𝑥 Te ohne Gitterspannung auf einem CdTe-Substrat abgeschieden werden kann. Dieses Material wird ebenso wie andere II-VI-Verbindungen häufig für Photodetektoren verwendet (siehe Kapitel 19). Im Gegensatz zu III-V-Legierungen kommen die II-VIVerbindungen häufig in der Natur vor, Photonenquellen aus diesen Materialien leiden aber derzeit noch unter beschränkten Lebensdauern. Dennoch ergeben binäre IIVI-Halbleitermaterialien Quantenpunkte mit einer abstimmbaren Emissionswellenlänge. Ternäre IV-VI-Halbleiter
Ternäre IV-VI-Halbleiter wie beispielsweise Pb𝑥 Sn1−𝑥 Te und Pb𝑥 Sn1−𝑥 Se wurden auch als Infrarot-Photodetektoren und Laserdioden verwendet. Diese Legierungen zeigen jedoch wegen ihrer großen Dielektrizitätskonstanten langsame 𝑅𝐶-Antwortzeiten. Sie haben auch große thermische Ausdehnungskoeffizienten, sodass der Wechsel zwischen Zimmer- und Kryotemperaturen problematisch sein kann.
549
17 Halbleiteroptik
2.5
0.5
AlP GaP
6 AlAs
InP
1.0
Si
1.2
1.0 GaSb
2.0
Ge
3.0
0.3
4 3
SiC
GaN
0.4 0.5 0.6
2
1.0
1
InSb
InAs
InN
10 0 5.4
5.6
5.8 6.0 6.2 Gitterkonstante/Å (a)
6.4
6.6
0 3.0
3.1
3.2 3.3 3.4 Gitterkonstante/Å (b)
3.5
Bandlückenwellenlänge λg /µm
GaAs
g /eV
0.8
1.5
Bandlückenenergie
0.7
Bandlückenwellenlänge λg /µm
g /eV
5 AlSb
0.5
0.2
AlN
0.6
2.0
Bandlückenenergie
550
2.0 10 3.6
Abb. 17.11 Bandlücken in Energie- und Wellenlängeneinheiten sowie Gitterkonstanten für Si, Ge, SiC und die 12 binären III-V-Verbindungen. Durchgezogene und gestrichelte Kurven bezeichnen Verbindungen mit direkter bzw. indirekter Bandlücke. Ein Material kann für eine bestimmte Zusammensetzung eine direkte Bandlücke und für eine andere Zusammensetzung eine indirekte Bandlücke besitzen. Ternäre Materialien liegen entlang der Verbindungslinie zweier binärer Verbindungen. Eine quaternäre Verbindung entspricht der Fläche, die durch ihre beiden binären Komponenten aufgespannt wird. (a) In1−x Gax As1−y Py entspricht der gepunkteten Fläche mit Scheitelpunkten bei InP, InAs, GaAs und GaP, während (Alx Ga1−x )y In1−y P der schattierten Fläche mit Scheitelpunkten bei AlP, InP und GaP entspricht. Beide sind wichtige quaternäre Verbindungen; die erste emittiert
im nahen Infrarot, die zweite im Sichtbaren. Alx Ga1−x As wird durch Punkte entlang der Linie zwischen GaAs und AlAs dargestellt. Wenn x sich von 0 auf 1 verändert, bewegt sich der Punkt im Diagramm entlang der Linie von GaAs zu AlAs. Da diese Linie fast vertikal verläuft, ist das Gitter von Alx Ga1−x As mit dem von GaAs identisch. (b) Obwohl das IIINitrid Inx Ga1−x N im Prinzip über seine Zusammensetzung so abgestimmt werden kann, dass es das komplette sichtbare Spektrum abdeckt, wird die Züchtung der Kristalle doch immer schwieriger, je größer der Anteil von In wird. Inx Ga1−x N wird hauptsächlich im Grünen, Blauen und Violetten eingesetzt, während Alx Ga1−x N und Alx Iny Ga1−x−y N vor allem im UV zum Einsatz kommen. Alle Zusammensetzungen dieser III-Nitride sind Halbleiter mit direkter Bandlücke.
Dotierte Halbleiter
Wenn Atome aus Gruppe IV in einem Elementhalbleiter durch Atome aus Gruppe III (z. B. B oder In) oder Atome aus Gruppe III in einem binären III-V-Halbleiter durch Atome aus Gruppe II (z. B. Zn oder Cd) ersetzt werden, entsteht ein p-Halbleiter. Atome aus Gruppe IV wirken für die Gruppe III als Donor und für für Gruppe V als Akzeptoren und können daher verwendet werden, um in III-V-Halbleitern einen Überschuss sowohl von Elektronen als auch von Löchern zu erzeugen. Natürlich wird die Ladungsneutralität des Materials durch die Einführung von Dotiersubstanzen nicht verändert. Halbleiter können auch mit Verunreinigungen dotiert werden, die dieselbe Wertigkeit haben wie ein Bestandteil des Kristallgitters. Anstatt überschüssige Ladungsträger einzuführen, kann eine solche substituierende Dotierung ein Material erzeugen, das als aktives Medium eines Festkörperlasers wirkt. Beispielsweise entsteht durch Einführen von Cr2+ -Ionen in ZnS ein übergangsmetalldotierter Zinkchalkogenidlaser, in dessen Gitter ein Teil der Zn2+ -Ionen durch Cr2+ ersetzt ist (Abschnitt 16.3.1).
Die elektrischen und optischen Eigenschaften von Halbleitern können durch die kontrollierte Einführung von kleinen Mengen gezielt gewählter Verunreinigungen, sogenannter Dotiersubstanzen, in das Material modifiziert werden. Die Einführung dieser Verunreinigungen kann die Konzentration von beweglichen Ladungsträgern um viele Größenordnungen verändern. Dotiersubstanzen mit überschüssigen Valenzelektronen, sogenannte Donoren, die einen kleinen Teil der normalen Atome im Kristallgitter ersetzen, erzeugen einen Überschuss an beweglichen Elektronen. Man bezeichnet das Material dann als n-Halbleiter. Sie entstehen beispielsweise, wenn Atome aus Gruppe V (z. B. P oder As) in einem Elementhalbleiter Atome aus Gruppe IV (z. B. Si oder Ge) ersetzen oder wenn Atome aus Gruppe VI (z. B. Se oder Te) in einem binären III-V-Halbleiter Atome aus Gruppe V (z. B. As oder Sb) ersetzen. Entsprechend entsteht ein p-Halbleiter durch Verwendung von Dotiersubstanzen mit einem Mangel an Valenzelektronen, sogenannten Akzeptoren. Das Ergebnis ist dann ein Überschuss an beweglichen Löchern.
17.1 Halbleiter
0.4
Bandlückenenergie
g /eV
3.0 2.5
ZnSe
CdS
ZnTe
0.5
2.0 CdTe CdSe
1.5
0.6 0.7 1.0 1.2
1.0
2.0
0.5
10
0.0 HgSe
5.4
kommen frei von Verunreinigungen sind, wodurch es möglich wird, einzelne Dotieratome an präzise definierten Positionen einzufügen.
ZnS
5.6
5.8 6.0 6.2 Gitterkonstante/Å
Bandlückenwellenlänge λg /µm
3.5
HgTe
6.4
6.6
Abb. 17.12 Bandlücken in Energie- und Wellenlängeneinheiten sowie Gitterkonstanten für verschiedene II-VI-Halbleiter (HgSe und HgTe sind Halbmetalle mit kleinen negativen Bandlücken). HgTe und CdTe haben fast identische Gitterkonstanten, wie die vertikale Verbindungslinie zwischen ihnen zeigt. Der ternäre Halbleiter Hgx Cd1−x Te kann daher ohne Gitterspannungen auf einer CdTe-Schablone abgeschieden werden. Er ist ein wichtiges Material für Photodetektoren im mittleren Infrarot.
Undotierte Halbleiter (d. h. Halbleiter ohne absichtliche Dotierung) werden intrinsische Halbleiter genannt, wohingegen dotierte Halbleiter extrinsische Halbleiter heißen. In einem intrinsischen Halbleiter sind die Konzentrationen der beweglichen Elektronen und Löchern gleich, n = p = ni , wobei die intrinsische Konzentration ni mit steigender Temperatur exponentiell wächst. In einem n-Halbleiter ist die Konzentration von beweglichen Elektronen (den Majoritätsladungsträgern) dagegen viel größer als die Konzentration von Löchern (den Minoritätsladungsträgern), d. h. n ≫ p. In einem p-Halbleiter ist die Situation umgekehrt, hier sind die Löcher die Majoritätsladungsträger und es gilt p ≫ n. Bei Zimmertemperatur ist die Konzentration der Majoritätsladungsträger normalerweise etwa gleich der Dotierkonzentration. Da Halbleiterbauelemente immer kleiner werden, werden ihre Eigenschaften von einer immer kleineren Zahl von räumlich zufällig verteilten Dotieratomen bestimmt. Im Nanomaßstab kann es sich dabei durchaus um einige wenige Atome handeln. Zum Glück können mithilfe von Einzelionen-ImplantationstechnikenHalbleitermaterialien hergestellt werden, bei denen die Zahl der Dotieratome und ihre Positionen sehr genau gesteuert werden können. Halbleitermateralien wie Si oder Ge können heutzutage mit einer solch hohen Reinheit hergestellt werden, dass Nanobauelemente praktisch voll-
Beispiel 17-1: Die Ionisierungsenergie von Donorelektronen
Wir betrachten einen Germaniumkristall mit der Dielektrizitätskonstante 𝜀∕𝜀0 = 16 (siehe Tabelle 17.5), der mit Arsen-Donoratomen dotiert ist. Die effektive Masse des Elektrons ist 𝑚L = 0.2𝑚0 , wobei 𝑚0 die Masse des freien Elektrons ist. Das Donorelektron bewegt sich im Feld des einfach geladenen Arsenions (As+ ), und seine Energieniveaus ähneln denen eines Elektrons im Wasserstoffatom. Wenn wir in Gl. (14.4) n = 1 und 𝑍 = 1 wählen und 𝜀0 durch 𝜀 sowie Mr durch 𝑚L ersetzen, um die Polarisation und das Kristallgitter des Halbleitermaterials zu berücksichtigen, ist die Energie des Donorelektrons gleich ED = − (
2 𝑚L 𝑒 4 1 . ) 4π𝜀 2ℏ2
(17.5)
Da die Energie des Elektrons im Grundzustand des Wasserstoffs −13.6 eV ist (was bedeutet, dass es 13.6 eV unter der Ionisationsschwelle liegt), ist die Energie des Arsen-Donorelektrons E D = −(𝑚L ∕𝑚0 )(𝜀0 ∕𝜀)2 × 13.6 eV ≈ −0.01 eV. Das Donorelektron hält sich somit in dem verbotenen Band in einem Niveau ≈ 0.01 eV unter dem Leitungsband auf. Da die thermische Energie bei 𝑇 = 300 K aber k𝑇 ≈ 0.026 eV ist, sind bei Zimmertemperatur praktisch alle Donorniveaus ionisiert, und die Donorelektronen sind in das Leitungsband angeregt. Das Material besitzt daher eine Donorkonzentration im Leitungsband, die etwa gleich der Konzentration der Verunreinigung ist. Organische Halbleiter
Organische Halbleiter werden auf vielen Gebieten zunehmend eingesetzt. Hierzu gehört auch die Photonik, wo sie zur Herstellung von photovoltaischen Bauelementen, lichtemittierende Dioden und Anzeigen verwendet werden. Obwohl sie im Allgemeinen weder die Geschwindigkeit noch die Kompaktheit von herkömmlichen Halbleiterstrukturen bieten können, lassen sie sich in Form dünner Platten billig herstellen, wodurch preisgünstige, biegsame optoelektronische Komponenten Wirklichkeit werden. Von diesen Materialien gibt es eine praktisch unbegrenzte Vielfalt, die gezielt an spezifische Anforderungen angepasst werden können, und manche können sogar in gewöhnlicher Tintenstrahltechnologie auf ein passendes Substrat gedruckt werden.
551
552
17 Halbleiteroptik
Elektron (a)
(b)
(c) Natriumion
Abb. 17.13 Die beiden Varianten von organischen Halbleitern: (a) kleine organische Moleküle wie Pentacen und (b) konjugierte Polymerketten wie Polyacetylen. (c) Dotierung von Polyacetylen mit Natrium als Donor ergibt einen n-Halbleiter, während Dotierung mit Iod als Akzeptor einen
Organische Halbleiter existieren in zwei Hauptvarianten, die in Abb. 17.13(a) und (b) schematisch dargestellt sind: 1) Kleine organische Moleküle wie Pentacen, das aus fünf linear verknüpften Benzolringen besteht [Abb. 17.13(a)]. 2) Konjugierte Polymerketten wie Polyacetylen, das aus Hunderten oder Tausenden von Kohlenstoffatomen besteht [Abb. 17.13(b)]. Ein Kennzeichen dieser amorphen Materialien, die sogenannte Konjugation, sind ihre alternierenden Einzel- und Doppelbindungen zwischen Kohlenstoffatomen. Obwohl die Elektronen in Doppelbindungen in Abb. 17.13 so dargestellt sind, als ob sie zu bestimmten Atomen gehörten, sind sie in Wirklichkeit delokalisiert und gehören gleichermaßen zu vielen Atomen bzw. einem Abschnitt der Kohlenstoffkette aus etwa 10 Wiederholungseinheiten. Das Molekül oder Polymersegment verhält sich wie ein einziges System, in dem die erlaubten Zustände der Elektronen Bänder bilden. Im undotierten Zustand ist das Valenzband einer konjugierten Polymerkette normalerweise vollständig besetzt und ihr Leitungsband ist leer, sodass sie sich wie ein Isolator verhält. Wie in Abb. 17.13(c) dargestellt, können Dotiersubstanzen wie Natrium oder Iod aber als Donoren bzw. Akzeptoren wirken, wodurch n- bzw. p-Halbleiter entstehen. Kleine organische Moleküle sind im reinen Zustand häufig leitend. Organische Halbleiter unterscheiden sich durch eine Reihe von grundlegenden Merkmalen von ihren anorganischen Verwandten: • Die Moleküle sind durch schwache Van-der-WaalsKräfte (Bindungsenergie ≈ 0.01 eV) miteinander verbunden, während die Atome in anorganischen Halbleitern durch starke kovalente Bindungen (Bindungsenergie ≈ 3 eV) gebunden sind. • Die schwachen zwischenmolekularen Bindungen erlauben eine gewisse mechanische Flexibilität, während anorganische Halbleiter starr sind. • Die Energiebänder entstehen aus dem lokalisierten Verhalten auf der Ebene der Moleküle, während sie
p-Halbleiter liefert. Jede Ecke bedeutet ein Kohlenstoffatom und jede Linie eine Bindung zwischen zwei Kohlenstoffatomen; doppelte Linien bezeichnen Doppelbindungen. Bindungen zu Wasserstoffatomen sind der Einfachheit halber weggelassen.
•
•
•
•
in anorganischen Halbleitern aus der Periodizität der Anordnung der Atome resultieren. Die beiden entscheidenden Energieniveaus sind das höchste besetzte Molekülorbital (HOMO, von engl. highest occupied molecular orbital) und das tiefste unbesetzte Molekülorbital (LUMO, von engl. lowest unoccupied molecular orbital), während bei anorganischen Halbleitern die Leitungs- und Valenzbänder entscheidend sind. In organischen Halbleitern haben die Ladungsträger haben eine hohe effektive Masse (𝑚L ∕𝑚0 ≈ 500) und eine geringe Mobilität (𝜇 ≈ 10−3 cm2 ∕V s), wohingegen Ladungsträger in anorganischen Halbleitern eine kleine effektive Masse (𝑚L ∕𝑚0 ≈ 1) und eine große Mobilität (𝜇 ≈ 103 cm2 ∕V s) besitzen. Der zwischenmolekulare Elektronentransfer erfolgt in organischen Halbleitern durch phononengestütztes Tunneln (Hopping), während der Elektronentransport in anorganischen Halbleitern durch Drift und Diffusion gekennzeichnet ist. Organische Halbleiter haben im Allgemeinen eine geringe elektrische Leitfähigkeit und sind feuchtigkeitsempfindlich, wohingegen bei anorganischen Halbleitern das Gegenteil der Fall ist.
Graphen und zweidimensionale Materialien
Wie zu Beginn dieses Abschnitts erwähnt, sind die Halbleiterelemente der Gruppe IV des Periodensystems für die Photonik von erheblichem Interesse. Die wichtigsten sind dabei Kohlenstoff (C), Silicium (Si), Germanium (Ge) und Zinn (Sn). Die Elemente dieser Gruppe existieren in verschiedenen strukturellen Formen, die als Allotrope bezeichnet werden und unterschiedliche Eigenschaften und Anwendungen haben. Zu den Allotropen von Kohlenstoff zählen beispielsweise Diamant, Graphit, Kohlenstoffnanoröhren, Fullerene und Graphen (es gibt aber noch weitere). Graphen ist ein Material aus einem Kohlenstoff-Wabengitter mit einer Dicke von einer Atomlage. Es ist aufgrund seiner einzigartigen Eigenschaften in den letzten Jahren verstärkt in den Vordergrund getreten; unter anderem kann es zu verschiedenen photonischen Bauelementen verarbeitet werden. Analoga von Graphen aus der Gruppe IV sind
17.1 Halbleiter
Silicen, Germanen und Stanen. Diese zweidimensionalen Atomlagen mit hexagonalem Gitter werden oft als h-C, h-Si, h-Ge bzw. h-Sn bezeichnet, wobei die Bezeichnung „h“ für „hexagonal“ steht. Die noch im Entstehen begriffenen Gebiete der Graphenphotonik bzw. der Photonik zweidimensionaler Materialien gehören in die übergeordnete Rubrik der Photonik der Gruppe IV.
F
k Graphen
Graphen
Graphen ist ein zweidimensionales Material, das aus einer 0.33 nm dicken Graphitschicht besteht, in der Atome in einer hexagonalen Wabenstruktur angeordnet sind (Abb. 17.14). Graphen besitzt eine Reihe außergewöhnlicher Eigenschaften, die es für viele Anwendungen in der Photonik interessant machen: • Es ist ein ausgezeichneter elektrischer Leiter und hat eine optische Transmission nahe eins, sodass es als transparente Elektrode verwendet werden kann. Sein optisches Absorptionsvermögen ist über ein breites Wellenlängenband von 0.7 bis 25 μm nahezu konstant gleich 𝒜 = π 𝑒 2 ∕ℏ2 𝑐 ≈ 2.3 %; sein Reflexionsvermögen ist mit ℛ ≈ 1.3 × 10−4 vernachlässigbar und sein Transmissionsgrad bei senkrechtem Einfall beträgt 𝒯 ≈ 97.7 %. Darüber hinaus ist seine Strombelastbarkeit beträchtlich (108 A∕cm2 auf SiO2 ). • Es handelt sich um ein Halbmetall ohne Bandlücke, das über einen breiten Spektralbereich von THz bis UV mit Strahlung wechselwirken kann. Sein Absorptionskoeffizient 𝛼 ≈ 7 × 105 cm−1 liegt um eine Größenordnung über dem von Si oder GaAs. Es ist leicht dotierbar, sodass seine elektronischen Eigenschaften verändert werden können. • Es besitzt eine ungewöhnlich hohe Elektronenbeweglichkeit. Wenn es auf einem SiO2 -Substrat abgeschieden wird, beträgt die Beweglichkeit ≈ 1.5 × 104 cm2 ∕Vs, sodass die Driftgeschwindigkeit der Ladungsträger gemäß Gl. (19.9) eine Größenordnung über der in Si liegt. Es reagiert daher außerordentlich schnell und ist aus diesem Grund für den Einsatz in ultraschnellen Photodetektoren geeignet. Durch sein hohes Verhältnis von Fläche zu Volumen ist es besonders für Anwendungen in der Sensorik geeignet. • Es ist chemisch stabil, hitzebeständig und widerstandsfähig gegen hohe Luftfeuchtigkeit. Es hat eine hohe Wärmeleitfähigkeit und eine hervorragende mechanische Festigkeit, ist jedoch elastisch und daher biegsam. • Seine Absorption wird schnell und stark gesättigt; es eignet sich daher als sättigbarer Absorber für modengekoppelte Laser oder als Breitbandmodulator.
553
Abb. 17.14 Graphen, auch als h-C bezeichnet, besteht aus einer einzelnen Schicht von Kohlenstoffatomen in einem hexagonalen Wabengitter. Sein E −k-Diagramm ist eher konisch als parabolisch (vgl. Abb. 17.5). Graphen verhält sich wie ein Halbmetall mit einer Bandlücke von null, da sich seine Leitungs- und Valenzbandkegel an Punkten treffen, die das Ferminiveau E F definieren.
Aufgrund seiner besonderen zweidimensionalen Symmetrie hat die Bandstruktur der Ladungsträger in Graphen die Form von Kegeln (Abb. 17.14) und nicht der für herkömmliche Halbleiter typischen Parabeln (Abb. 17.5). Das E −𝑘-Diagramm ist daher eher linear als parabolisch; es ähnelt dem von Photonen und wird eher durch Gl. (17.2) als durch Gl. (17.1) beschrieben. Wie bei Photonen verhalten sich die elektronischen Anregungen (Dirac-Fermionen genannt) so, als wären sie masselos; dies führt zu einer ungewöhnlich großen Fermigeschwindigkeit v ≈ 𝑐∕300, die ein Grund für die schnelle Reaktionsfähigkeit von Graphen ist. Darüber hinaus treffen sich die Leitungs- und Valenzbandkegel an einzelnen Punkten (Diracpunkte genannt), die das Ferminiveau definieren, sodass sich Graphen wie ein Halbmetall mit einer Bandlücke von null verhält. Auch andere zweidimensionale Materialien enthalten masselose Dirac-Fermionen und verhalten sich wie Halbmetalle (z. B. Silicen, Germanen, Stanen und β12 -Borophen), aber die meisten zweidimensionalen Materialien haben eher parabolische als konische Bandstrukturen. Obwohl Dirac-Fermionen am häufigsten in zweidimensionalen Materialien untersucht wurden, kommen sie auch in dreidimensionalen Materialien wie z. B. gespanntem α-Sn (grauem Zinn) und Na3 Bi vor. Die Wechselwirkung von Licht mit Graphen pro Entfernungseinheit ist zwar stark (𝛼 ≈ 7 × 105 cm−1 ), aber in Geräten, die auf Single-Pass-Betrieb angewiesen sind, erfolgt diese Wechselwirkung nur über eine vernachlässigbare Strecke von 0.33 nm (der Materialdicke). Der Aufbau von nutzbaren Geräten auf der Grundlage solcher Materialien erfordert daher im Allgemeinen eine Optimierung der Wechselwirkung, was durch eine spezielle Dotierung oder Platzierung, Kopplung an einen photonischen Wellenleiter oder Hohlraum oder
554
17 Halbleiteroptik
Kopplung an Plasmonen, Phononen oder Excitonen erreicht werden kann. Eine signifikante Verbesserung der Wechselwirkung zwischen Licht und Materie kann auch durch die Verwendung von Oberflächenplasmonpolaritonen erreicht werden. Andere zweidimensionale Materialien
Graphen ist aufgrund seiner halbmetallischen Natur ein schlechter Lichtemitter. Eine Reihe anderer zweidimensionaler Materialien wie z. B. verschiedene Übergangsmetall-Dichalkogenide wie Molybdändisulfid verhalten sich jedoch wie Halbleiter mit direkter Bandlücke mit Bandlücken zwischen 0.5 und 3 eV. Wie bei dreidimensionalen Halbleitern kann die Bandlücke über die Chemie, die Zusammensetzung und/oder eine Quantenbeschränkung eingestellt werden. Diese Materialien können als Lichtemitter oder Reflektoren dienen, die von excitonischen Übergängen dominiert werden. Einschichtige Übergangsmetall-Dichalkogenide wie MoS2 oder WSe2 bestehen aus einer Zwischenschicht aus dem Übergangsmetall zwischen zwei Schichten des Chalkogens. Beispielsweise hat MoS2 eine GesamtSchichtdicke von 0.65 nm und eine Bandlücke von 1.8 eV. In ihrer dreidimensionalen Variante dienen einige dieser Materialien (z. B. Graphit, MoS2 ) als Schmiermittel in der Industrie. Dies liegt daran, dass aufeinander folgende atomare Schichten nur durch schwache Van-der-Waals-Kräfte gebunden sind und leicht übereinander hinweg gleiten. Diese Eigenschaft macht es relativ einfach, einzelne zweidimensionale Schichten abzuschälen. Derartige zweidimensionale Materialien werden daher oft als Van-der-Waals-Materialien bezeichnet. Andere dreidimensionale Ausgangssubstanzen (z. B. Silicium, Germanium) bilden in allen drei Dimensionen feste Bindungen, sodass ihre zweidimensionalen Versionen bei der Herstellung zum Knittern neigen. Die Anzahl der möglichen ÜbergangsmetallDichalkogenide ist beträchtlich, da es Dutzende von Übergangsmetallen und, wie Spalte 16 des Periodensystems (Abb. 14.3) zeigt, mindestens drei Chalkogene gibt (S, Se und Te; oft werden auch noch die Elemente O, Po und Lv in diese Kategorie eingeschlossen). Einige einschichtige Materialien verhalten sich wie Isolatoren (z. B. hexagonales BN mit E g ≈ 6 eV), andere wie Metalle (z. B. TiS2 ). Zweidimensionale Materialien können einzeln oder als Kombination von Schichten verschiedener Zusammensetzung verwendet werden, um atomar dünne Heterostrukturen herzustellen, die als ebene photonische Bauelemente dienen können.
17.1.3 Die Konzentrationen von Elektronen und Löchern Um die Konzentrationen der Ladungsträger (Elektronen und Löcher) als Funktion der Energie bestimmen zu können, müssen wir zwei Informationen besitzen, die wir nacheinander untersuchen: • Die Dichte der erlaubten Energieniveaus (Zustandsdichte); • die Wahrscheinlichkeit mit der jedes dieser Niveaus besetzt wird. Die Zustandsdichte
Der Quantenzustand eines Elektrons in einem Halbleitermaterial wird durch seine Energie E , seinen Vektor k [dessen Betrag näherungsweise durch Gl. (17.3) oder Gl. (17.4) mit E verknüpft ist] und seinen Spin charakterisiert. Der Zustand wird durch eine Wellenfunktion beschrieben, die bestimmte Randbedingungen erfüllt. Ein Elektron in der Nähe der Leitungsbandkante kann näherungsweise als ein Teilchen der Masse 𝑚L aufgefasst werden, das in einem dreidimensionalen kubischen Volumen (der Dimension d ) mit ideal reflektierenden Wänden eingeschlossen ist, d. h. in einem dreidimensionalen unendlich hohen Rechteckpotential. Damit die Lösungen stehende Wellen sind, müssen die Komponenten des Vektors k = (𝑘𝑥 , 𝑘𝑦 , 𝑘𝑧 ) die diskreten Werte k = (𝑞1 π∕d , 𝑞2 π∕d , 𝑞3 π∕d ) annehmen, wobei die Modenindizes (𝑞1 , 𝑞2 , 𝑞3 ) positive ganze Zahlen sind. Dieses Ergebnis ist eine dreidimensionale Verallgemeinerung des eindimensionalen unendlich hohen Rechteckpotentials (siehe Übung 17-5). Die Spitze des Vektors k muss auf den Punkten eines Gitters liegen, dessen kubische Elementarzelle die Kantenlänge π∕d hat. Es gibt daher (d ∕π)3 Punkte pro Volumeneinheit im kRaum. Die Zahl von Zuständen, deren Vektor k Beträge zwischen 0 und 𝑘 besitzt, kann aus der Zahl der Punkte bestimmt werden, die innerhalb des positiven Oktanten einer Kugel mit dem Radius 𝑘 [mit dem Volumen 1 ≈ ( )4π 𝑘3 ∕3 = π𝑘3 ∕6] liegen. Wegen der beiden mög8 lichen Werte des Elektronspins entspricht jeder Punkt im k-Raum zwei Zuständen. Es gibt daher näherungsweise 2(π 𝑘3 ∕6)∕(π∕d )3 = (𝑘3 ∕3π2 )d 3 solche Punkte im Volumen d 3 und (𝑘3 ∕3π2 ) Punkte pro Volumeneinheit. Hieraus folgt, dass die Zahl von Zuständen mit Wellenzahlen des Elektrons zwischen 𝑘 und 𝑘 + Δ𝑘 pro Volumeneinheit 𝜚(𝑘)Δ𝑘 = [(d∕ d𝑘)(𝑘3 ∕3π2 )]Δ𝑘 = (𝑘2 ∕π2 )Δ𝑘 ist; damit ist die Zustandsdichte 𝑘2 . (17.6) π2 Diese Herleitung ist identisch mit derjenigen, mit deren Hilfe wir die Zahl der Moden bestimmt hatten, die in 𝜚(𝑘) =
17.1 Halbleiter
einem dreidimensionalen elektromagnetischen Resonator erlaubt sind (siehe Abschnitt 11.3). Im Fall der elektromagnetischen Moden gibt es zwei Freiheitsgrade aufgrund der Polarisation des Feldes (d. h. zwei Werte des Photonenspins), wohingegen es im Fall des Halbleiters zu jedem elektronischen Zustand zwei mögliche Werte des Spins gibt. In der Resonatoroptik wurden die erlaubten elektromagnetischen Lösungen für k über die lineare Beziehung 𝜈 = 𝑐𝑘∕2π zwischen Frequenz und Wellenzahl in erlaubte Frequenzen umgewandelt. In der Halbleiterphysik werden die erlaubten Lösungen für k über die in den Gln. (17.3) und (17.4) angegebenen quadratischen Beziehungen zwischen Energie und Wellenzahl in erlaubte Energien umgewandelt. Wenn 𝜚L (E ) ΔE die Zahl der Energieniveaus im Leitungsband (pro Volumeneinheit) bezeichnet, die zwischen E und E + ΔE liegen, dann müssen die Dichten 𝜚L (E ) und 𝜚(𝑘) wegen der durch Gl. (17.3) gegebenen 1:1-Entsprechung zwischen E und 𝑘 gemäß 𝜚L (E ) d E = 𝜚(𝑘) d𝑘 verknüpft sein. Also ist die Dichte der erlaubten Energien im Leitungsband 𝜚L (E ) = 𝜚(𝑘)∕(d E ∕ d𝑘). Ähnlich ist die Dichte der erlaubten Energien im Valenzband 𝜚V (E ) = 𝜚(𝑘)∕(d E ∕ d𝑘), wobei E durch Gl. (17.4) gegeben ist. Mithilfe der genäherten quadratischen Beziehungen zwischen E und 𝑘 aus den Gln. (17.3) und (17.4), die in der Nähe der Leitungs- bzw. Valenzbandkante gelten, kann die Ableitung d E ∕ d𝑘 für jedes Band berechnet werden. Das Ergebnis ist (2𝑚L )3∕2 √ E − EL , 2π2 ℏ3 (2𝑚V )3∕2 √ EV − E , 𝜚V (E ) = 2π2 ℏ3 𝜚L (E ) =
E ≥ EL ,
(17.7)
E ≤ EV .
(17.8)
Die Quadratwurzelbeziehung ist eine Folge der quadratischen Beziehung zwischen Energie und Wellenzahl für Elektronen und Löcher in der Nähe der Bandkanten. Die Abhängigkeit der Zustandsdichte von der Energie ist in Abb. 17.15 dargestellt. An der Bandkante ist die
Zustandsdichte null; mit steigender Entfernung davon nimmt sie mit einer Geschwindigkeit zu, die von den effektiven Massen der Elektronen und Löcher abhängt. Die in Tabelle 17.1 angegebenen Werte von 𝑚L und 𝑚V sind Mittelwerte, die zur Berechnung der Zustandsdichte geeignet sind. Die Besetzungswahrscheinlichkeit
Ohne thermische Anregung (bei 𝑇 = 0 K) nehmen alle Elektronen im Rahmen des paulischen Ausschlussprinzips die tiefstmöglichen Energieniveaus ein. Das Valenzband ist dann vollständig gefüllt (es gibt keine Löcher) und das Leitungsband ist vollständig leer (es enthält keine Elektronen). Wenn die Temperatur erhöht wird, gehen einige Elektronen durch thermische Anregung vom Valenz- in das Leitungsband über und lassen leere Zustände im Valenzband (Löcher) zurück. Nach der statistischen Mechanik ist die Wahrscheinlichkeit, dass ein Elektron im thermischen Gleichgewicht bei einer Temperatur 𝑇 einen Zustand der Energie E besetzt, durch die Fermifunktion gegeben, 𝑓(E ) =
1 , exp [(E − E F )∕k 𝑇] + 1
wobei k die Boltzmannkonstante (k𝑇 = 0.0259 eV bei 300 K) und E F die Fermienergie oder das Ferminiveau bezeichnet. Diese in Abb. 17.16 dargestellte Funktion ist auch unter dem Namen Fermi-Dirac-Verteilung bekannt. Jedes Energieniveau E ist entweder besetzt [mit der Wahrscheinlichkeit 𝑓(E )] oder leer [mit der Wahrscheinlichkeit 1 − 𝑓(E )]. Die Wahrscheinlichkeiten 𝑓(E ) und 1 − 𝑓(E ) hängen nach Gl. (17.9) von der Energie E ab. Die Funktion 𝑓(E) ist keine Wahrscheinlichkeitsverteilung, und ihr Integral ist nicht eins; vielmehr beschreibt sie eine Folge von Besetzungswahrscheinlichkeiten für sukzessive Energieniveaus. 1 Wegen 𝑓(E F ) = ist das Ferminiveau unabhängig von 2 der Temperatur die Energie, für die die Wahrscheinlich-
ϱ L (E) L
L
L
V
V
g V
ϱ V (E)
π k (a)
(b)
(17.9)
Zustandsdichte (c)
Abb. 17.15 (a) Schnitt durch das E −k-Diagramm (z. B. in Richtung der Komponente k1 mit konstantem k2 und k3 ). (b) Erlaubte Energieniveaus (für alle k). (c) Zustandsdichte in der Nähe der Leitungs- und Valenzbandkante. Die Größe 𝜚L (E ) dE ist die Zahl der Quantenzustände im Leitungsband mit einer Energie zwischen E und E + dE pro Volumeneinheit. Die Größe 𝜚V (E ) ist für das Valenzband analog zu interpretieren.
555
556
17 Halbleiteroptik
T>0K
T=0K
f( ) L
L F
g
V
L
F
F
V
V
1−f ( )
0
0.5
1 f( )
keit der Besetzung (sofern es dort einen erlaubten Zu1 stand gibt) gleich ist. Die Fermifunktion ist eine mo2 noton abnehmende Funktion von E (Abb. 17.16). Bei 𝑇 = 0 K ist 𝑓(E ) für E > E F gleich null und für E ≤ E F gleich eins. Das zeigt die Bedeutung von E F ; bei 0 K ist das Ferminiveau die Grenze zwischen den besetzten und den freien Energieniveaus. Da 𝑓(E ) die Wahrscheinlichkeit ist, dass das Energieniveau E besetzt ist, ist 1 − 𝑓(E) die Wahrscheinlichkeit, dass das Niveau leer ist, d. h. dass es durch ein Loch besetzt ist, wenn E im Valenzband liegt. Also gilt für das Energieniveau E : 𝑓(E ) = Wahrscheinlichkeit der Besetzung durch ein Elektron 1 − 𝑓(E ) = Wahrscheinlichkeit der Besetzung durch ein Loch (im Valenzband). Für E − E F ≫ k𝑇 ist 𝑓(E ) ≈ exp[−(E − E F )∕k 𝑇], sodass der Ausläufer der Fermifunktion für hohe Energien im Leitungsband mit steigender Energie exponentiell abnimmt. Die Fermifunktion ist dann proportional zur Boltzmannverteilung, die die exponentielle Abhängigkeit der relativen Besetzung von angeregten Atomen beschreibt (siehe Abschnitt 14.2). Aus Symmetriegründen ist 1 − 𝑓(E) ≈ exp[−(E F − E )∕k 𝑇] für E < E F und E F − E ≫ k𝑇; die Wahrscheinlichkeit der Besetzung durch Löcher im Valenzband nimmt dann für Energien deutlich unter dem Ferminiveau exponentiell ab. Ladungsträgerkonzentrationen im thermischen Gleichgewicht
Wir bezeichnen die Zahl von Elektronen und Löchern pro Volumeneinheit mit einer Energie zwischen E und E + ΔE mit n(E ) ΔE und p(E ) ΔE . Wir können die Dichten n(E ) und p(E ) bestimmen, indem wir die Zustandsdichten für das Energieniveau E mit den Besetzungswahrscheinlichkeiten des Niveaus durch Elektronen bzw. Löcher multiplizieren, n(E ) = 𝜚L (E )𝑓(E ) ,
p(E ) = 𝜚V (E )[1 − 𝑓(E )] . (17.10)
0
0.5
1 f( )
Abb. 17.16 Die Fermifunktion f (E ) ist die Wahrscheinlichkeit, dass ein Energieniveau E mit einem Elektron gefüllt wird; 1 − f (E) ist die Wahrscheinlichkeit, dass es leer bleibt. Im Valenzband ist 1 − f (E) die Wahrscheinlichkeit, dass das Energieniveau E von einem Loch besetzt wird. Bei T = 0 K ist f (E) = 1 für E ≤ E F , und f (E ) = 0 für E > E F ; es gibt dann keine Elektronen im Leitungsband und keine Löcher im Valenzband.
( )
L
L
F
F
V
V
( )
Ladungsträgerkonzentration
Abb. 17.17 Die Konzentrationen n(E ) und p(E ) von Elektronen und Löchern als Funktionen der Energie E für einen intrinsischen Halbleiter. Die Gesamtkonzentrationen von Elektronen und Löchern sind n bzw. p.
Die Konzentrationen (Besetzungszahlen pro Volumeneinheit) der Elektronen und Löcher, n und p, ergeben sich dann aus den Integralen ∞
n = ∫ n(E ) d E , EL
EV
p = ∫ p(E ) d E .
(17.11)
−∞
In einem intrinsischen (reinen) Halbleiter gilt bei jeder Temperatur n = p, da thermische Anregungen Elektronen und Löcher immer paarweise erzeugen. Das Ferminiveau muss bei einer Energie liegen, für die n = p gilt. In Materialien, für die 𝑚V = 𝑚L ist, sind auch die Funktionen n(E ) und p(E ) symmetrisch, sodass E F genau in der Mitte der Bandlücke (Abb. 17.17) liegen muss. In den meisten intrinsischen Halbleitern liegt das Ferminiveau tatsächlich in der Nähe der Mitte der Bandlücke. Die Bandschemata, Fermifunktionen und Gleichgewichtskonzentrationen von Elektronen und Löchern für dotierte n- bzw. p-Halbleiter sind in den Abb. 17.18 und 17.19 gezeigt. Donorelektronen nehmen einen Zustand mit einer Energie E D geringfügig unterhalb der Leitungsbandkante ein, sodass sie leicht in das Leitungsband angeregt werden können. Für E D = 0.01 eV sind
17.1 Halbleiter
Abb. 17.18 Bandschema, Fermifunktion f (E) und Konzentrationen n(E ) und p(E ) der beweglichen Elektronen und Löcher in einem n-Halbleiter. D
L
Donorniveau
( )
F V
( )
0
1 f( )
L
Akzeptorniveau
Ladungsträgerkonzentration Abb. 17.19 Bandschema, Fermifunktion f (E ) und Konzentrationen n(E) und p(E ) der beweglichen Elektronen und Löcher in einem p-Halbleiter.
( )
F
A
V
( )
0
1
f( )
beispielsweise bei Zimmertemperatur (k 𝑇 = 0.026 eV) die meisten Donorelektronen thermisch ins Leitungsband angeregt (siehe Beispiel 17-1). Folglich liegt das 1 Ferminiveau [die Energie, für die 𝑓(E F ) = ist] etwas 2 oberhalb der Mitte der Bandlücke. Für einen p-Halbleiter liegt das Akzeptor-Energieniveau bei einer Energie E A gerade oberhalb der Valenzbandkante, sodass das Ferminiveau unterhalb der Mitte der Bandlücke liegen wird. Unsere Aufmerksamkeit gilt den beweglichen Ladungsträgern in dotierten Halbleitern. Diese Materialien sind natürlich elektrisch neutral, sodass n + NA = p + ND sein muss, wobei NA bzw. ND die Zahlen von ionisierten Akzeptoren bzw. Donoren pro Volumeneinheit sind. Übung 17-2: Exponentielle Näherung für die Fermifunktion Für E − E F ≫ k 𝑇 kann die Fermifunktion 𝑓(E ) nähe-
rungsweise durch eine Exponentialfunktion beschrieben werden. Ähnlich kann 1 − 𝑓(E ) für E F − E ≫ k𝑇 durch eine Exponentialfunktion angenähert werden. Diese Bedingungen gelten, wenn das Ferminiveau innerhalb der Bandlücke liegt, aber mindestens einige k 𝑇 (bei Zimmertemperatur ist k 𝑇 ≈ 0.026 eV, wohingegen E g = 1.12 eV für Si bzw. 1.42 eV für GaAs ist) von ihren Rändern entfernt ist. Zeigen Sie, dass mit
LadungsträgerKonzentration
diesen Näherungen, die sowohl für intrinsische als auch für dotierte Halbleiter gelten, aus Gl. (17.11) n = NL exp (−
EL − EF ), k𝑇
(17.12)
p = NV exp (−
EF − E V ), k𝑇
(17.13)
np = NL NV exp (−
Eg k𝑇
),
(17.14)
folgt, wobei NL = 2(2π 𝑚L k𝑇∕ℎ2 )3∕2 und NV = 2(2π 𝑚V k𝑇∕ℎ2 )3∕2 ist. Verifizieren Sie, dass n > p gilt, wenn E F näher am Leitungsband liegt und 𝑚V = 𝑚L ist, wohingegen p > n gilt, wenn E F näher am Valenzband liegt. Das Massenwirkungsgesetz
Gleichung (17.14) zeigt, dass das Produkt 3
np = 4 (
Eg 2π k 𝑇 ) (𝑚L 𝑚V )3∕2 exp (− ) 2 k 𝑇 ℎ
(17.15)
im thermischen Gleichgewicht nicht von der Lage des Ferminiveaus E F innerhalb der Bandlücke und dem Dotierniveau des Halbleiters abhängt, sofern die exponentielle Näherung für die Fermifunktion gilt. Die Konstanz des Produkts der Konzentrationen wird als Massenwir-
557
558
17 Halbleiteroptik
Tab. 17.3 Intrinsische Ladungsträgerkonzentrationen bei T = 300 K.a) Material
ni ∕cm−3
Si
1.5 × 1010
GaAs
1.8 ×
106
1.9 ×
10−10
GaN
Ladungsträgerkonzentrationen im Quasigleichgewicht
a) Einsetzen der in Tabelle 17.1 angegebenen Werte von 𝑚L und 𝑚V und der in Tabelle 17.2 angegebenen Werte für E g in Gl. (17.16) ergibt nicht die hier aufgeführten Werte von ni , da die Gleichung empfindlich von den genauen Werten der Parameter abhängt.
kungsgesetz bezeichnet. Für einen intrinsischen Halbleiter ist n = p ≡ ni . Durch Kombination dieser letzten Beziehung mit Gl. (17.14) erhalten wir ni ≈
√
N L N V exp (−
Eg
2k 𝑇
).
(17.16)
Diese Beziehung zeigt, dass die intrinsische Konzentration von Elektronen und Löchern exponentiell mit der Temperatur 𝑇 ansteigt. Das Massenwirkungsgesetz kann daher in der Form np = n2i
Donor- bzw. Akzeptorband mit dem Leitung- bzw. Valenzband; das Resultat wird als band tail bezeichnet. Dies bewirkt eine effektive Abnahme der Bandlücke.
(17.17)
geschrieben werden. Die Werte von ni für unterschiedliche Materialien unterscheiden sich wegen der unterschiedlichen Bandlücken und effektiven Massen. Die intrinsischen Ladungsträgerkonzentrationen für Si, GaAs und GaN bei Zimmertemperatur sind in Tabelle 17.3 angegeben. Das Massenwirkungsgesetz ist nützlich, um die Konzentrationen von Elektronen und Löchern in dotierten Halbleitern zu bestimmen. Ein mäßig dotierter n-Halbleiter hat zum Beispiel eine Konzentration n von Elektronen, die im Wesentlichen gleich der Donorkonzentration ND ist. Aus dem Massenwirkungsgesetz erhalten wir für die Lochkonzentration dann p = n2i ∕ND . Wenn wir n und p kennen, können wir aus Gl. (17.11) das Ferminiveau bestimmen. Wenn das Ferminiveau innerhalb der Bandlücke und mehr als einige k 𝑇 von ihren Rändern entfernt liegt, können wir die Näherungen aus den Gln. (17.12) und (17.13) verwenden, um seinen Wert direkt zu bestimmen. Wenn das Ferminiveau innerhalb des Leitungs- oder Valenzbands liegt, wird das Material als entarteter Halbleiter bezeichnet. In diesem Fall kann die exponentielle Näherung für die Fermifunktion nicht verwendet werden, sodass np ≠ n2i ist. Die Konzentrationen der Ladungsträger müssen dann durch numerische Lösung erhalten werden. Bei starker Dotierung verschmilzt das
Die zuvor betrachteten Besetzungswahrscheinlichkeiten und Ladungsträgerkonzentrationen gelten nur für Halbleiter im thermischen Gleichgewicht. Sie sind nicht mehr anwendbar, wenn das thermische Gleichgewicht gestört wird. Trotzdem gibt es Situationen, in denen die Elektronen im Leitungsband untereinander im thermischen Gleichgewicht sind und ebenso die Löcher im Valenzband, aber die Elektronen und Löcher nicht im gegenseitigen thermischen Gleichgewicht sind. Das kann beispielsweise vorkommen, wenn ein äußerer elektrischer Strom oder Photonenfluss Übergänge von Band zu Band induziert, die zu schnell erfolgen, als dass sich ein thermisches Gleichgewicht zwischen den Bändern einstellen könnte. Diese Situation ist als Quasigleichgewicht bekannt. Sie entsteht, wenn die Relaxationszeiten für Übergänge innerhalb der Bänder viel kürzer sind als die Relaxationszeit zwischen den beiden Bändern. Gewöhnlich beträgt die Intraband-Relaxationszeit < 10−12 s, wohingegen die Relaxationszeit für die strahlende Elektron-Loch-Rekombination um ≈ 10−9 s liegt. Unter diesen Umständen ist es zweckmäßig, eine separate Fermifunktion für jedes Band zu verwenden; die beiden zugehörigen Ferminiveaus, die wir mit E FL und E FV bezeichnen, sind als Quasiferminiveaus bekannt (Abb. 17.20). Wenn E FL und E FV ausreichend innerhalb des Leitungs- bzw. Valenzbands liegen, können die Konzentrationen von Elektronen und Löchern sehr groß werden. Übung 17-3: Bestimmung der Quasiferminiveaus aus den Elektronen- und Lochkonzentrationen
(a) Verwenden Sie die Gln. (17.10) und (17.11), um zu zeigen, dass die Quasiferminiveaus durch ℏ2 2∕3 n 2𝑚L ℏ2 2∕3 = E V − (3π2 )2∕3 p 2𝑚V
E FV = E L + (3π2 )2∕3
(17.18a)
E FV
(17.18b)
gegeben sind, wenn die Konzentrationen der Elektronen und Löcher in einem Halbleiter bei 0 K n bzw. p sind. (b) Zeigen Sie, dass diese Gleichungen näherungsweise für beliebige Temperaturen gelten, wenn n und p so groß sind, dass E FL − E L ≫ k 𝑇 bzw. E V − E FV ≫ k𝑇 gilt, d. h. wenn die Quasiferminiveaus tief innerhalb des Leitungs- bzw. Valenzbands liegen.
17.1 Halbleiter
( )
FL L
L g V
V FV
( )
FV
0
1 f ( ) L
0
1 f ( ) V
Ladungsträgerkonzentration
Abb. 17.20 Ein Halbleiter im Quasigleichgewicht. Die Wahrscheinlichkeit, dass ein spezielles Energieniveau E im Leitungsband von einem Elektron besetzt wird, ist fL (E ), eine Fermifunktion mit dem Ferminiveau E FL . Die Wahrscheinlichkeit, dass ein Energieniveau E im Valenzband von einem Loch besetzt wird, ist 1 − fV (E ), wobei fV (E ) eine Fermifunktion mit dem Ferminiveau E FV ist. Die Konzentrationen von Elektronen und Löchern sind n(E ) bzw. p(E ). Beide können sehr groß werden.
Abb. 17.21 ElektronLoch-Erzeugung und -Rekombination. L
Abb. 17.22 ElektronLoch-Rekombination an einer Haftstelle. L
Erzeugung
Rekombination
Falle
Auger
V V
17.1.4
Erzeugung, Rekombination und Injektion
Erzeugung und Rekombination im thermischen Gleichgewicht
Die thermische Anregung eines Elektrons aus dem Valenz- ins Leitungsband bedeutet eine ElektronLoch-Erzeugung (Abb. 17.21). Damit ein thermisches Gleichgewicht möglich ist, muss zu dieser Erzeugung ein gleichzeitiger Umkehrprozess existieren. Bei der Elektron-Loch-Rekombination geht ein Elektron vom Leitungs- in das Valenzband über und füllt dort ein Loch (Abb. 17.21). Die von dem Elektron abgegebene Energie kann als Photon emittiert werden; in diesem Fall spricht man von einer strahlenden Rekombination. Strahlungslose Rekombination kann durch mehrere konkurrierende Prozesse erfolgen, z. B. die Übertragung der Energie auf Gitterschwingungen (unter Erzeugung eines oder mehrerer Phononen) oder auf ein anderes freies Elektron (Augerprozess). Rekombination kann auch an Oberflächen oder indirekt über Haftstellen oder Defektzentren stattfinden, also über Energieniveaus, die zu Verunreinigungen oder Defekten wie Korngrenzen, Versetzungen oder anderen Gitterstörungen gehören und innerhalb des verbotenen Bands liegen. Ein Zustand einer Verunreinigung oder eines Defekts kann als Rekombinationszentrum wirken, wenn er sowohl ein Elektron als auch ein Loch einfangen und
damit die Wahrscheinlichkeit einer Rekombination vergrößern kann (Abb. 17.22). Auch die durch Verunreinigungen ausgelöste Rekombination kann strahlend oder nichtstrahlend erfolgen. Da für eine Rekombination sowohl ein Elektron als auch ein Loch benötigt wird, ist die Geschwindigkeit der Rekombination proportional zum Produkt der Konzentrationen von Elektronen und Löchern, Rekombinationsgeschwindigkeit = rnp ,
(17.19)
wobei der Rekombinationskoeffizient r (in cm3 ∕s) von den Eigenschaften des Materials wie z. B. seiner Zusammensetzung und Defektdichte sowie von der Temperatur abhängt; außerdem hängt er etwas vom Dotierniveau ab. Die Gleichgewichtskonzentrationen n0 und p0 von Elektronen und Löchern ergeben sich aus der Bedingung, dass die Geschwindigkeiten von Erzeugung und Rekombination gleich sind. Im stationären Zustand muss die Geschwindigkeit der Rekombination gleich der Geschwindigkeit der Erzeugung sein. Wenn G0 die Geschwindigkeit der thermischen Elektron-Loch-Erzeugung bei einer gegebenen Temperatur ist, dann gilt im thermischen Gleichgewicht G0 = rn0 p0 .
(17.20)
Das Produkt der Konzentrationen von Elektronen und Löchern, n0 p0 = G 0 ∕r, ist näherungsweise dasselbe,
559
560
17 Halbleiteroptik
egal ob das Material ein n-, p- oder intrinsischer Halbleiter ist. Also ist n2i = G0 ∕r, was direkt zum Massenwirkungsgesetz n0 p0 = n2i führt. Man sieht daher, dass dieses Gesetz eine Folge des Gleichgewichts zwischen Erzeugung und Rekombination im thermischen Gleichgewicht ist. Elektron-Loch-Injektion
In einem Halbleiter im thermischen Gleichgewicht mit den Ladungsträgerkonzentrationen n0 und p0 sind die Geschwindigkeiten der Erzeugung und der Rekombination gleich groß, G0 = rn0 p0 . Wir nehmen nun an, dass durch einen äußeren (nichtthermischen) Injektionsmechanismus wie z. B. Lichteinstrahlung zusätzliche Elektron-Loch-Paare mit einer konstanten Geschwindigkeit R (Paare pro Volumeneinheit pro Zeiteinheit) erzeugt werden. Ein neuer stationärer Zustand wird erreicht, in dem die Konzentrationen n = n0 + Δn und p = p0 + Δp sind. Offensichtlich ist Δn = Δp, da Elektronen und Löcher paarweise erzeugt werden. Indem wir die neuen Geschwindigkeiten der Erzeugung und Rekombination gleichsetzen, erhalten wir G0 + R = rnp .
(17.21)
Wenn wir G0 = rn0 p0 in Gl. (17.21) einsetzen, wird daraus ( ) R = r(np − n0 p0 ) = r n0 Δn + p0 Δn + Δn2 = rΔn(n0 + p0 + Δn) ,
(17.22)
was wir in der Form R=
Δn 𝜏
(17.23)
1 [ ] r (n0 + p0 ) + Δn
(17.24)
mit 𝜏=
schreiben können. Wenn für die Injektionsgeschwindigkeit Δn ≪ n0 + p0 gilt, folgt 𝜏≈
1 . r(n0 + p0 )
(17.25)
In einem n-Halbleiter ist n0 ≫ p0 , und daher ist die Rekombinationslebensdauer 𝜏 ≈ 1∕rn0 umgekehrt proportional zur Konzentration der Elektronen. Entsprechend ist für einen p-Halbleiter p0 ≫ n0 , und wir erhalten 𝜏 ≈ 1∕rp0 . Diese einfache Formulierung ist nicht anwendbar, wenn Haftstellen eine Rolle spielen. Der Parameter 𝜏 kann als Rekombinationslebensdauer der injizierten überschüssigen Elektron-LochPaare aufgefasst werden. Das wird klar, wenn wir beach-
ten, dass die Konzentration der injizierten Ladungsträger durch die Geschwindigkeitsgleichung d(Δn) Δn =R− 𝜏 d𝑡
(17.26)
bestimmt wird, die Gl. (15.17) ähnelt. Im stationären Zustand ist d(Δn)∕ d𝑡 = 0, woraufhin wir wieder Gl. (17.23) erhalten, die Gl. (15.27) entspricht. Wenn die Quelle der Injektion zur Zeit 𝑡0 plötzlich entfernt wird (R wird dann null), dann klingt Δn mit einer Zeitkonstante 𝜏 exponentiell ab, d. h. Δn(𝑡) = Δn(𝑡0 ) exp[−(𝑡 − 𝑡0 )∕𝜏]. Bei starker Injektion ist andererseits 𝜏 selbst eine Funktion von Δn, wie aus Gl. (17.24) deutlich wird, sodass die Geschwindigkeitsgleichung nichtlinear ist und das Abklingen nicht mehr exponentiell erfolgt. Wenn die Injektionsgeschwindigkeit R bekannt ist, können die injizierten Konzentrationen im stationären Zustand aus der Beziehung Δn = R𝜏
(17.27)
bestimmt werden, woraufhin sich die Gesamtkonzentrationen gemäß n = n0 + Δn bzw. p = p0 + Δn ergeben. Wenn wir außerdem Quasigleichgewicht annehmen, können wir Gl. (17.11) verwenden, um die Quasiferminiveaus zu bestimmen. Die Annahme eines Quasigleichgewicht widerspricht der bei der zuvor durchgeführten Analyse angenommenen Balance von Erzeugung und Rekombination nicht; sie erfordert nur, dass die Zeit für die Einstellung des Gleichgewichts zwischen den Bändern kurz gegen die Rekombinationszeit 𝜏 ist. Diese Art der Analyse wird sich als nützlich erweisen, um Theorien für Halbleiter-LED und Halbleiterlaserdioden zu entwickeln, die auf der Verstärkung der Lichtemission durch Trägerinjektion beruhen, wie in Kapitel 18 klar werden wird. Übung 17-4: Injektion von Elektron-Loch-Paaren in GaAs
Nehmen Sie an, dass Elektron-Loch-Paare mit einer Geschwindigkeit R = 1023 ∕(cm3 s) in n-halbleitendes GaAs (E g = 1.42 eV, 𝑚L ≈ 0.07𝑚0 , 𝑚V ≈ 0.50𝑚0 ) injiziert werden. Die Konzentration von Elektronen im thermischen Gleichgewicht ist n0 = 1016 ∕cm3 . Bestimmen Sie für den Rekombinationskoeffizienten r = 10−11 cm3 ∕s und 𝑇 = 300 K (a) die Konzentration p0 der Löcher im Gleichgewicht, (b) die Rekombinationslebensdauer 𝜏, (c) die Überschusskonzentration Δn im stationären Zustand und (d) den Abstand der Quasiferminiveaus E FL − E FV für 𝑇 = 0 K.
17.1 Halbleiter
Die innere Quantenausbeute
Die innere Quantenausbeute 𝜂i eines Halbleitermaterials ist als das Verhältnis des Koeffizienten für die strahlende Elektron-Loch-Rekombination zum Gesamtkoeffizienten der (strahlenden und nichtstrahlenden) Rekombination definiert. Dieser Parameter ist wichtig, weil er den Wirkungsgrad der Lichterzeugung in einem Halbleitermaterial bestimmt. Die Gesamtgeschwindigkeit der Rekombination ist durch Gl. (17.19) gegeben. Wenn der Rekombinationskoeffizient r in eine Summe von strahlenden und nichtstrahlenden Anteilen zerlegt wird, r = rs + rns , ist die innere Quantenausbeute 𝜂i =
rs rs = . r rs + rns
(17.28)
Die innere Quantenausbeute kann auch durch die Rekombinationslebensdauer ausgedrückt werden, da 𝜏 umgekehrt proportional zu r ist [siehe Gl. (17.25)]. Wenn wir die strahlende und nichtstrahlende Lebensdauer 𝜏s bzw. 𝜏ns definieren, erhalten wir 1 1 1 + . = 𝜏 𝜏s 𝜏ns Die innere Quantenausbeute (1∕𝜏s )∕(1∕𝜏) oder 𝜂i =
𝜏ns 𝜏 = . 𝜏s 𝜏s + 𝜏ns
(17.29) ist
dann
rs ∕r =
(17.30)
Die Lebensdauer 𝜏s für die strahlende Rekombination bestimmt die Geschwindigkeit der Photonenabsorption und -emission, wie in Abschnitt 17.2.3 erläutert wird. Ihr Wert hängt von den Konzentrationen der Ladungsträger und dem Materialparameter rs ab. Für niedrige bis mäßige Injektionsgeschwindigkeiten ist nach Gl. (17.25) 𝜏s ≈
1 . rs (n0 + p0 )
(17.31)
Der Lebensdauer 𝜏ns für die nichtstrahlende Rekombination wird durch eine ähnliche Gleichung bestimmt. Wenn die nichtstrahlende Rekombination jedoch über Defektzentren im verbotenen Band stattfindet, hängt 𝜏ns empfindlicher von den Konzentrationen dieser Zentren ab als von den Konzentrationen der Elektronen und Löcher. Typische Werte für Rekombinationskoeffizienten und Lebensdauern sind in Tabelle 17.4 aufgeführt. Die Größenordnungen des Koeffizienten rs für die strahlende Rekombination, die Lebensdauern für die strahlende, nichtstrahlende und gesamte Rekombination 𝜏s , 𝜏ns und 𝜏 sowie die innere Quantenausbeute 𝜂i sind angegeben. Die strahlende Lebensdauer für makroskopische Mengen von Si ist wegen seiner indirekten Bandlücke
Tab. 17.4 Typische Werte der Koeffizienten rs der strahlenden Rekombination, der Rekombinationslebensdauer und der inneren Quantenausbeute 𝜂i für ausgewählte Halbleiter.a) rs ∕(cm3 ∕s)
𝝉s
𝝉ns
𝝉
𝜼i
Si
10−15
10 ms
100 ns
100 ns
10−5
GaAs
10−10
100 ns
100 ns
50 ns
0.5
GaNb)
10−8
20 ns
0.1 ns
0.1 ns
0.005
Material
a) ür n-Halbleiter mit einer Ladungsträgerkonzentration n0 = 1017 ∕cm3 und einer Konzentration der Defektzentren von 1015 ∕cm3 bei 300 K. b) Aus praktischen Gründen wurde InGaN verwendet; das vergrößert die innere Quantenausbeute auf 𝜂i ≈ 0.3.
um Größenordnungen länger als seine Gesamtlebensdauer. Das bedeutet eine kleine innere Quantenausbeute. Für GaAs und GaN erfolgt der Zerfall andererseits überwiegend durch strahlende Übergänge (diese Materialien haben eine direkte Bandlücke), deshalb ist ihre innere Quantenausbeute groß. Materialien mit direkter Bandlücke sind daher nützlich, um lichtemittierende Strukturen herzustellen, wohingegen Materialien mit indirekter Bandlücke hierfür im Allgemeinen nicht geeignet sind. Auf Umwegen lässt sich aber trotzdem eine Lichtemission aus Materialien mit indirekter Bandlücke erreichen, indem man beispielsweise Wechselwirkungen wie die induzierte Ramanstreuung und IntersubbandÜbergänge (Abschnitt 18.1.4) ausnutzt, die nicht von den in Abschnitt 17.2.2 diskutierten Intrabandübergängen abhängen.
17.1.5
Halbleiterübergänge
Wenn sich zwei unterschiedlich dotierte Regionen eines Halbleitermaterials in direktem Kontakt befinden, spricht man von einem Homoübergang. Ein wichtiges Beispiel ist der pn-Übergang, der in diesem Abschnitt besprochen wird. Wenn sich zwei unterschiedliche Halbleitermaterialien miteinander im Kontakt befinden, handelt es sich um einen Heteroübergang; dieser Fall wird anschließend besprochen. Der pn-Übergang
Der pn-Übergang ist ein Homoübergang zwischen einem p- und einem n-Halbleiter. Er verhält sich wie eine Diode, die in der Elektronik als Gleichrichter, Logikgatter, Spannungsregler (Zenerdiode) oder Abstimmvorrichtung (Kapazitätsdiode) und in der Optoelektronik als lichtemittierende Diode (LED), Laserdiode (LD), Photodetektor oder Solarzelle eingesetzt werden kann.
561
17 Halbleiteroptik
Wenn die beiden Regionen in Kontakt gebracht werden (Abb. 17.24), treten folgende Änderungen ein:
n-Halbleiter
F F
Ladungsträgerkonzentration
Elektronenenergie
p-Halbleiter
Ort
Abb. 17.23 Energieniveaus und Konzentrationen der Ladungsträger für einen p- und einen n-Halbleiter vor dem Kontakt.
In einem pn-Übergang stehen ein p- und ein n-dotierter Bereich desselben Halbleitermaterials in metallurgischem Kontakt. Die p-dotierte Region enthält einen Überschuss an Löchern (die Majoritätsladungsträger) und nur wenige bewegliche Elektronen (die Minoritätsladungsträger); die n-dotierte Region enthält umgekehrt einen Überschuss an beweglichen Elektronen und wenige Löcher (Abb. 17.23). Beide Arten von Ladungsträgern befinden sich in einer kontinuierlichen zufälligen Wärmebewegung in allen Richtungen. Sperrschicht p
+ ++ ++ ++++ + + ++ ++
n
Elektronenenergie
elektrisches Feld
Ladungsträgerkonzentration
562
F
F
eV0
(x)
(x)
x
Abb. 17.24 Ein pn-Übergang im thermischen Gleichgewicht bei T > 0 K. Die Sperrschicht, das Bandschema und die Konzentrationen (auf einer logarithmischen Skala) der beweglichen Elektron n(x) und Löcher p(x) sind als Funktionen des Ortes x dargestellt. Die intrinsische Potentialdifferenz V0 entspricht einer Energie eV0 , wobei e der Betrag der Elektronenladung ist.
• Elektronen und Löcher diffundieren aus Bereichen hoher Konzentration in Bereiche niedrigerer Konzentration. Also diffundieren Elektronen aus dem n-dotieren Gebiet in das p-dotierte Gebiet und lassen positiv geladene ionisierte Donoratome zurück. In der p-dotieren Region rekombinieren die Elektronen mit den reichlich vorhandenen Löchern. Entsprechend diffundieren Löcher aus der p-dotierten Region in die n-dotierte Region und lassen negativ geladene ionisierte Akzeptoratome zurück. In der n-dotierten Region rekombinieren die Löcher mit den reichlich vorhandenen beweglichen Elektronen. Dieser Diffusionsprozess geht jedoch nicht beliebig lange weiter, weil er das Ladungsgleichgewicht in den zwei Gebieten stört. • Dieser Prozess erzeugt ein schmales Gebiet zu beiden Seiten des Kontakts, das kaum noch bewegliche Ladungsträger enthält. Dieses Gebiet wird Sperrschicht genannt. Sie enthält nur unbewegliche Ladungen (positive Ionen auf der n-dotierten und negative Ionen auf der p-dotierten Seite). Die Dicke der Sperrschicht ist in jeder Region umgekehrt proportional zur Konzentration der Dotiersubstanz in dieser Region. • Die unbeweglichen Ladungen erzeugen ein elektrisches Feld in der Sperrschicht, das von der n- zur p-dotierten Seite des Übergangs zeigt. Dieses intrinsische Feld verhindert die Diffusion von weiteren beweglichen Ladungsträgern durch den Bereich des Übergangs. • Es besteht eine Gleichgewichtsbedingung, die eine intrinsische Netto-Potentialdifferenz 𝑉0 zwischen den beiden Seiten der Sperrschicht bewirkt, wobei die n-dotierte Seite auf einem höheren Potential als die pSeite liegt. • Das intrinsische Potential bewirkt für ein Elektron auf der n-dotierten Seite eine tiefere potentielle Energie als auf der p-dotierten Seite. Infolgedessen verbiegen sich die Energiebänder wie in Abb. 17.24 dargestellt. Im thermischen Gleichgewicht gibt es nur eine einzige Fermifunktion für die ganze Struktur, sodass sich die Ferminiveaus in den p- und n-dotierten Gebieten ausrichten müssen. • Durch den Übergang fließt kein Nettostrom. Die Ströme aufgrund der Diffusion und des intrinsischen Feldes (Driftstrom) gleichen einander sowohl für die Elektronen als auch für die Löcher aus.
17.1 Halbleiter
+V
0
Elektronenenergie
p
LadungsträgerKonzentration
FV
n
eV
FL
e(V0–V)
(x) Überschusselektronen Δ
(x) Δ
Überschusslöcher x
Abb. 17.25 Bandschema und Ladungsträgerkonzentrationen für einen in Durchlassrichtung gepolten pn-Übergang.
Der pn-Übergang mit einem angelegten Potential
Ein von außen angelegtes Potential ändert die Potentialdifferenz zwischen den p- und n-dotierten Regionen. Das verändert wiederum den Fluss von Majoritätsladungsträgern, sodass der Übergang als „Gatter“ verwendet werden kann. Wenn die Spannung an dem Übergang in Durchlassrichtung anliegt, d. h. eine positive Spannung 𝑉 an der p-dotierten Region anliegt (Abb. 17.25), wird ihr Potential gegenüber der n-dotierten Region erhöht, sodass ein dem intrinsischen Feld entgegengerichtetes elektrisches Feld produziert wird. Die externe Spannung bewirkt eine Störung des Gleichgewichts und eine Fehlausrichtung der Ferminiveaus in den pund n-dotierten Regionen sowie in der Sperrschicht. Die Existenz zweier Ferminiveaus E FL und E FV in der Sperrschicht bedeutet ein Quasigleichgewicht. Unter dem Strich bewirkt die Spannung in Durchlassrichtung eine Verringerung der Potentialbarriere um einen Betrag 𝑒𝑉. Es zeigt sich, dass der Strom der Majoritätsladungsträger um einen exponentiellen Faktor exp(𝑒𝑉∕k𝑇) zunimmt, sodass der Nettostrom 𝑖 = 𝑖S exp(𝑒𝑉∕k 𝑇) − 𝑖S wird, wobei 𝑖S eine Konstante ist. Die überschüssigen Löcher und Elektronen, die als Majoritätsladungsträger in die n- bzw. p-dotierten Regionen kommen, werden dort Minoritätsladungsträger und re-
kombinieren mit den lokalen Majoritätsladungsträgern. Ihre Konzentration vermindert sich daher mit steigender Entfernung vom Übergang, wie in Abb. 17.25 zu sehen ist. Dieser Prozess wird als Injektion von Minoritätsladungsträgern bezeichnet. Wenn der Übergang in Sperrrichtung gepolt ist, also eine negative Spannung 𝑉 an das p-dotierte Gebiet angelegt ist, wird die Potentialbarriere um 𝑒𝑉 vergrößert. Das behindert den Fluss von Majoritätsladungsträgern. Der entsprechende Strom wird mit dem exponentiellen Faktor exp(𝑒𝑉∕k𝑇) mit negativem 𝑉 multipliziert; d. h. er wird reduziert. Das Resultat für den Strom ist 𝑖 = 𝑖S exp(𝑒𝑉∕k𝑇) − 𝑖S , sodass für |𝑉| ≫ k 𝑇∕𝑒 ein kleiner Strom mit einem Betrag ≈ 𝑖S in Sperrrichtung fließt. Ein pn-Übergang wirkt daher als Diode mit einer Strom-Spannungs-Kennlinie 𝑖 = 𝑖S [exp (
i
V
p
i
n
−
V
i
Abb. 17.26 (a) Spannung und Strom in einem pn-Übergang. (b) Schaltungsdarstellung der pn-Flächendiode. (c) StromSpannungs-Kennlinie einer idealen pnFlächendiode.
(a)
is 0
−
0 (b)
(17.32)
die in Abb. 17.26 dargestellt ist. Die ideale Diodenkennlinie gemäß Gl. (17.32) ist als Shockleygleichung bekannt. Die Reaktion eines pn-Übergangs auf eine dynamische angelegte (Wechsel-) Spannung kann berechnet werden, wenn man den Satz von Differentialgleichungen löst, die die Diffusion von Elektronen und Löchern, die Drift (unter dem Einfluss der intrinsischen und äußeren elektrischen Felder) und die Rekombination bestimmen. Diese Effekte sind wichtig, um herauszufinden, mit welcher Geschwindigkeit die Diode betrieben werden kann. Sie können am einfachsten durch zwei Kapazitäten – einer Übergangskapazität und einer Diffusionskapazität – parallel zu einer idealen Diode beschrieben werden. Die Übergangskapazität berücksichtigt die Zeit, die notwendig ist, um die in der Sperrschicht gespeicherten unbeweglichen positiven und negativen Ladungen zu ändern, wenn sich die angelegte Spannung ändert. Es zeigt√sich, dass die Dicke 𝑙 der Sperrschicht proportional zu 𝑉0 − 𝑉 ist; sie nimmt daher bei einer Spannung in Sperrrichtung (negatives 𝑉) zu und bei einer Spannung in Durchlassrichtung (positives 𝑉) ab. Die Übergangskapazität 𝐶 = 𝜀A∕𝑙 (wobei A die Fläche des √ Übergangs ist) ist daher umgekehrt proportional zu 𝑉0 − 𝑉. Die Übergangskapazität einer in
+
+
𝑒𝑉 ) − 1] , k𝑇
(c)
V
563
564
17 Halbleiteroptik
Sperrrichtung gepolten Diode ist kleiner (und die 𝑅𝐶Antwortzeit ist daher kürzer) als die einer in Durchlassrichtung gepolten Diode. Die Abhängigkeit von 𝐶 von 𝑉 wird verwendet, um Kapazitätsdioden (auch Abstimmdioden oder Varaktoren genannt) herzustellen. Die Injektion von Minoritätsladungsträgern in eine in Durchlassrichtung gepolte Diode wird durch die Diffusionskapazität beschrieben, die von der Lebensdauer der Minoritätsladungsträger und dem Betriebsstrom abhängt. Die pin-Flächendiode
Eine pin-Flächendiode entsteht, wenn eine Schicht eines intrinsischen (oder gering dotierten) Halbleitermaterials zwischen einen p- und einen n-Halbleiter eingefügt wird (Abb. 17.27). Weil die Sperrschicht um eine zur Dotierkonzentration umgekehrt proportionale Entfernung in jede Seite eines Übergangs hineinragt, dringt die Sperrschicht des pi-Übergangs tief in die i-Region ein. Entsprechend dehnt sich auch die Sperrschicht des inÜbergangs tief in das i-Gebiet aus. Infolgedessen kann sich die pin-Diode wie ein pn-Übergang mit einer Sperrschicht verhalten, die die gesamte intrinsische Region umfasst. Die Elektronenenergie, die Dichte der unbeweglichen Ladungen und das elektrische Feld in einer pin-Flächendiode im thermischen Gleichgewicht sind in Abb. 17.27 dargestellt. Einer der Vorteile einer Diode mit einer großen Sperrschicht ist ihre kleine Übergangskapazität und ihre daraus folgende schnelle Reaktion. Deshalb werden pin-Dioden für den Einsatz als Halbleiter-Photodetektoren häufig gegenüber pn-Dioden bevorzugt. Die große Sperrschicht ermöglicht auch, einen Sperrschicht
p
i
+ + + +
n
elektrisches Feld Elektronenenergie
L
V
Dichte unbeweglicher Ladungen
elektrische Feldstärke
+
x
x
Abb. 17.27 Elektronenenergie, Dichte der unbeweglichen Ladungen und Betrag des elektrischen Feldes für eine pinFlächendiode im thermischen Gleichgewicht.
größeren Teil des einfallenden Lichts auszunutzen und dadurch den Wirkungsgrad der Photodetektion zu vergrößern (siehe Abschnitt 19.3.2).
17.1.6
Heteroübergänge
Übergänge zwischen unterschiedlichen Halbleitermaterialien werden als Heteroübergänge bezeichnet. Sie werden häufig in Lichtquellen und Detektoren eingesetzt, nicht nur als aktive Regionen, sondern auch als Kontaktschichten und wellenleitende Gebiete. Die Elektronenaffinitäten der Materialien bestimmen die Ausrichtung der Leitungs- und Valenzbandkanten. Es ist häufig sinnvoll, Halbleitermaterialien mit identischen Gittern und abgestufte Übergänge anstelle von plötzlichen zu verwenden. Die Anordnung von unterschiedlichen Halbleitern im direkten Kontakt kann in der Photonik eine Reihe von Vorteilen bieten: • Übergänge zwischen Materialien mit unterschiedlichen Bandlücken erzeugen lokalisierte Sprünge im Bandschema. Eine Diskontinuität der potentiellen Energie bewirkt eine Barriere, die ausgewählte Ladungsträger daran hindern kann, in Regionen zu diffundieren, in denen sie unerwünscht sind. Diese Eigenschaft kann beispielsweise in einem pn-Übergang verwendet werden, um den Anteil des von den Minoritätsladungsträgern getragenen Stroms zu reduzieren und so den Wirkungsgrad der Injektion zu vergrößern (siehe Abb. 17.28). • Die von zwei Heteroübergängen geschaffenen Diskontinuitäten im Bandschema können nützlich sein, um Ladungsträger auf ein gewünschtes räumliches Gebiet einzugrenzen. Zum Beispiel kann wie in der in Abb. 17.28 gezeigten ppn-Struktur (die aus einem ppund einem pn-Heteroübergang besteht) eine Schicht eines Materials mit kleiner Bandlücke zwischen zwei Schichten eines Materials mit einer größeren Bandlücke eingefügt werden. Diese Doppelheterostruktur wird mit großem Erfolg in LED, optischen Halbleiterverstärkern und Laserdioden eingesetzt, wie in Kapitel 18 erläutert wird. • Heteroübergänge sind nützlich, um Diskontinuitäten in den Energiebändern zu schaffen, die Ladungsträger an spezifischen Orten beschleunigen. Die zusätzliche kinetische Energie, die ein Ladungsträger dabei plötzlich bekommt, kann ausgenutzt werden, um die Wahrscheinlichkeit einer Stoßionisation in einer Mehrschicht-Lawinenphotodiode selektiv zu erhöhen (siehe Abschnitt 19.4.1). • Halbleiter mit unterschiedlichen Arten von Bandlücken (direkte und indirekte) können in demselben
17.1 Halbleiter
17.1.7
Elektronenenergie
Elektronenenergie
p
g1
p
g2
n
g3
F
Abb. 17.28 Der ppn-Doppelheteroübergang. Die mittlere Schicht hat eine kleinere Bandlücke als die beiden äußeren. Im Gleichgewicht richten sich die Ferminiveaus so aus, dass die Leitungsbandkante am pp-Übergang und die Valenzbandkante am pn-Übergang scharf abfallen. Die Diskontinuitäten des Leitungs- und Valenzbands werden als Bandoffsets bezeichnet. Wenn das Bauelement in Durchlassrichtung gepolt ist, wirken diese Sprünge als Barrieren, die die injizierten Minoritätsladungsträger auf das Gebiet der kleineren Bandlücke eingrenzen. Aus der n-Region injizierte Elektronen werden z. B. daran gehindert, durch die Barriere am pp-Übergang zu diffundieren. Ähnlich können aus der p-Region injizierte Löcher nicht durch die Barriere am pn-Übergang diffundieren. Diese Doppelheterostruktur zwingt daher Elektronen und Löcher in ein begrenztes gemeinsames Gebiet. Dies erhöht die Wirkungsgrade von LED, optischen Halbleiterverstärkern und Laserdioden beträchtlich, wie in Kapitel 18 deutlich werden wird.
Bauelement verwendet werden, um die Regionen der Struktur auszuwählen, in denen Licht emittiert wird. Nur Halbleiter mit direkter Bandlücke können effizient Licht emittieren (siehe Abschnitt 17.2). • Halbleiter mit unterschiedlichen Bandlücken können in demselben Bauelement verwendet werden, um die Regionen der Struktur auszuwählen, in denen Licht absorbiert wird. Halbleitermaterialien, deren Bandlücke größer ist als die Energie der auf sie treffenden Photonen, sind transparent und dienen als Fensterschicht. • Heteroübergänge von Materialien mit unterschiedlichen Brechungsindizes können verwendet werden, um photonische Strukturen und optische Wellenleiter zu schaffen, die Photonen eingrenzen und führen, wie in den Kapiteln 7 und 9 besprochen.
Quantenbeschränkte Strukturen
Heterostrukturen aus dünnen Schichten von Halbleitermaterialien können durch Epitaxie hergestellt werden, d. h. in Form von Schichten eines Halbleitermaterials über einem anderen; hierzu stehen Techniken wie die Molekularstrahlepitaxie (MBE, engl. molecular-beam epitaxy), die Flüssigphasenepitaxie (LPE, engl. liquidphase epitaxy) oder die Gasphasenepitaxie (VPE, engl. vapor-phase epitaxy) mit ihren Varianten metallorganische chemische Gasphasenabscheidung (MOCVD, engl. metal-organic chemical vapor deposition) und HydridGasphasenepitaxie (HVPE, engl. hybrid vapor-phase epitaxy) zur Verfügung. Als Homoepitaxie wird das Wachstum von Materialien auf einem Substrat mit derselben Zusammensetzung bezeichnet, wohingegen die Heteroepitaxie das Wachstum von Materialien auf einem Substrat mit einer anderen Zusammensetzung bezeichnet, egal ob mit identischer oder unterschiedlicher Gitterkonstante. Bei der MBE werden Molekularstrahlen aus den betreffenden Elementen verwendet, die in einem Hochvakuum auf ein geeignet vorbereitetes Substrat treffen. Bei der LPE wird eine gesättigte Lösung, die die Bestandteile enthält, im Kontakt mit dem Substrat abgekühlt. Die VPE verwendet Gase in einem Reaktor. Die Zusammensetzungen und Dotierungen der einzelnen Schichten, deren Dicke bis auf Monoschichten reduziert werden kann, werden durch sorgfältige Kontrolle der Auftreffhäufigkeiten der Moleküle und der Temperatur der Substratoberfläche eingestellt. Wenn die Schichtdicke in der Größenordnung der DeBroglie-Wellenlänge eines thermischen Elektrons liegt, muss die gequantelte Energie eines Elektrons in der Schicht berücksichtigt werden; in diesem Fall ist die Beziehung zwischen Energie und Impuls für Volumenhalbleiter nicht mehr anwendbar. Die De-Broglie-Wellenlänge ist λDB = ℎ∕𝑝, wobei ℎ die plancksche Konstante und 𝑝 der Impuls des Elektrons ist (für GaAs ist λDB ≈ 50 nm). Drei Quantenstrukturen werden in der Photonik besonders häufig eingesetzt: Quantenschichten, Quantendrähte und Quantenpunkte (siehe Abschnitt 14.1.4). Die passenden Beziehungen zwischen Energie und Impuls für diese Strukturen werden im Folgenden hergeleitet. Anwendungen dieser Strukturen werden in den Kapiteln 18 und 19 besprochen. Quantenschichten
Eine Quantenschichtstruktur ist eine Doppelheterostruktur aus einer ultradünnen (≲50 nm) Schicht eines Halbleitermaterials mit einer kleineren Bandlücke als das Umgebungsmaterial (Abb. 17.29). Ein Beispiel ist eine dünne Schicht von GaAs zwischen zwei
565
17 Halbleiteroptik 1
Vollmaterial
566
q1 = 2
1
q1 = 1 2
2
3 1
z y
1
L g
2
g
Vollmaterial
V
x
q1 = 1 q1 = 2 x (a)
(b)
(c)
k
Abb. 17.29 (a) Quantenschichtstruktur. (b) Energieniveaudiagramm für Elektronen und Löcher in einer Quantenschicht. (c) Schnitt durch die E −k-Beziehung in Richtung von k2 oder k3 . Die Energie-Unterbänder sind mit ihren Quantenzahlen q1 = 1, 2, … bezeichnet. Die E −k-Beziehung für Volumenhalbleiter ist durch die gestrichelten Kurven angedeutet.
AlGaAs-Schichten (siehe Abb. 14.12). Dieses Sandwich bildet eindimensionale rechteckige Potentialtöpfe im Leitungs- und Valenzband, in denen Elektronen und Löcher eingeschlossen werden – Elektronen im Leitungsund Löcher im Valenzband. Ein hinreichend tiefer Potentialtopf kann näherungsweise als unendlich hohes Rechteckpotential beschrieben werden (siehe Abb. 17.30). Die Energieniveaus E 𝑞 eines Teilchens der Masse 𝑚 (𝑚L für Elektronen bzw. 𝑚V für Löcher), das in einem eindimensionalen unendlich hohen Rechteckpotential der vollen Breite d eingeschlossen ist, ergeben sich aus der Lösung der zeitunabhängigen Schrödingergleichung (14.3). Wie in der
4=
Übung 17-5 gezeigt, sind die Energieniveaus E𝑞 =
ℏ2 (𝑞π∕d )2 , 2𝑚
(17.33)
Die ersten drei erlaubten Energieniveaus eines Elektrons in einem unendlich tiefen Potentialtopf der Breite d = 10 nm in GaAs (𝑚L = 0.07 𝑚0 ) sind beispielsweise E 𝑞 = 54, 216 und 486 meV, (zur Erinnerung: k𝑇 = 26 meV bei 𝑇 = 300 K). Je kleiner die Breite des Potentialtopfs, desto größer der Abstand zwischen sukzessiven Energieniveaus.
Abb. 17.30 Energieniveaus (a) eines eindimensionalen unendlichen Rechteckpotentials und (b) eines endlichen quadratischen Quantentopfs mit einer Tiefe V 0 = 32ℏ2 ∕md 2 .
2 78.9 ħ 2 m
Kontinuum
3=
𝑞 = 1, 2, 3, … .
2 44.4 ħ 2 m
2 32.0 ħ 2 m 0
2 25.9 ħ 2 m
ħ2 2 = 19.7 m 2 ħ2 1 = 4.9 m 2 − /2
/2 (a)
2 11.9 ħ 2 m 2 3.2 ħ 2 m − /2
/2 (b)
3=
0.81
0
2=
0.37
0
1=
0.10
0
17.1 Halbleiter
Übung 17-5: Energieniveaus einer Quantenschicht
Lösen Sie die Schrödingergleichung (14.3) und bestimmen Sie die erlaubten Energien eines Elektrons der Masse 𝑚 in einem unendlich tiefen eindimensionalen rechteckigen Potentialtopf [V (𝑥) = 0 für 0 < 𝑥 < d und V (𝑥) = ∞ ansonsten]. Bestätigen Sie, dass E 𝑞 = ℏ2 (𝑞π∕d )2 ∕2𝑚, 𝑞 = 1, 2, 3, … ist, wie in Abb. 17.30(a) gezeigt. Vergleichen Sie diese Energien mit denen des in Abb. 17.30(b) gezeigten endlichen rechteckigen Quantentopfs. Halbleiter-Quantenschichten sind jedoch in Wirklichkeit dreidimensionale Gebilde. In der in Abb. 17.29 gezeigten Quantenschichtstruktur sind die Elektronen (und Löcher) in 𝑥-Richtung auf eine Länge d 1 (die Dicke der Quantenschicht) eingegrenzt, können sich aber in der Ebene der Schicht über viel größere Dimensionen ausdehnen (d 2 , d 3 ≫ d 1 ). In der 𝑦𝑧-Ebene verhalten sie sich daher wie Volumenhalbleiter. Die Beziehung zwischen Energie und Impuls des Elektrons ist E = EL +
ℏ2 𝑘12 ℏ2 𝑘22 ℏ2 𝑘32 + + 2𝑚L 2𝑚L 2𝑚L
(17.34)
mit 𝑘1 = 𝑞1 π∕d 1 , 𝑘2 = 𝑞2 π∕d 2 , 𝑘3 = 𝑞3 π∕d 3 und 𝑞1 , 𝑞2 , 𝑞3 = 1, 2, 3, …. Da d 1 ≪ d 2 , d 3 ist, nimmt der Parameter 𝑘1 deutlich getrennte diskrete Werte an, wohingegen 𝑘2 und 𝑘3 dicht beisammen liegende Werte besitzen, die durch ein Kontinuum angenähert werden können. Daraus folgt, dass die Beziehung zwischen Energie und Impuls für Elektronen im Leitungsband einer Quantenschicht durch E = E L + E 𝑞1 +
ℏ2 𝑘2 , 2𝑚L
𝑞1 = 1, 2, 3, …
(17.35)
gegeben ist, wobei 𝑘 der Betrag eines zweidimensionalen Vektors k = (𝑘2 , 𝑘3 ) in der 𝑦𝑧-Ebene ist. Jede Quantenzahl 𝑞1 entspricht einem Unterband, dessen tiefste Energie E L + E 𝑞1 ist. Ähnliche Beziehungen gelten für das Valenzband.
Die Energie-Impuls-Beziehung für einen Volumenhalbleiter ist durch Gl. (17.3) gegeben, wobei 𝑘 der Betrag eines dreidimensionalen Vektors k = (𝑘1 , 𝑘2 , 𝑘3 ) ist. Der entscheidende Unterschied ist, dass 𝑘1 in der Quantenschicht deutlich getrennte diskrete Werte annimmt. Infolgedessen unterscheidet sich die Zustandsdichte einer Quantenschichtstruktur von der des Vollmaterials, dessen Zustandsdichte von dem Betrag des dreidimensionalen Vektors mit den Komponenten 𝑘1 = 𝑞1 π∕d , 𝑘2 = 𝑞2 π∕d und 𝑘3 = 𝑞3 π∕d für d 1 = d 2 = d 3 = d abhängt. Das Ergebnis ist 𝜚(𝑘) = 𝑘2 ∕π2 pro Volumeneinheit [siehe Gl. (17.6)], woraus sich die Dichte der Zustände im Leitungsband ergibt [siehe Gl. (17.7) und Abb. 17.15]: √ 𝜚L (E ) =
2
q1 = 2
x
E − EL ,
E >0.
(17.36)
𝑞1 = 1, 2, 3, … . (17.37)
Für jede Quantenzahl 𝑞1 ist die Zustandsdichte pro Volumeneinheit also konstant, wenn E > E L + E 𝑞1 ist. Die gesamte Zustandsdichte ist die Summe der Dichten für alle Werte von 𝑞1 , sodass wir die in Abb. 17.31 gezeigte Treppenverteilung erhalten. Jede Stufe der Treppe entspricht einer anderen Quantenzahl 𝑞1 und kann als ein Unterband innerhalb des Leitungsbands (Abb. 17.29) betrachtet werden. Die Minima dieser Unterbänder ver-
Vollmaterial
1
g2
√
𝑚L , E > E L + E 𝑞1 , π ℏ2 d 1 𝜚L (E ) = ⎨0, E < E L + E 𝑞1 , ⎩ ⎧
L
g1
π2 ℏ3
Für eine Quantenschichtstruktur ergibt sich die Zustandsdichte aus dem Betrag des zweidimensionalen Vektors (𝑘2 , 𝑘3 ). Für jede Quantenzahl 𝑞1 ist die Zustandsdichte daher 𝜚(𝑘) = 𝑘∕π Zustände pro Flächeneinheit in der 𝑦𝑧-Ebene und daher 𝑘∕πd 1 pro Volumeneinheit. Die Dichten 𝜚L (E ) und 𝜚(𝑘) sind über 𝜚L (E ) d E = 𝜚(𝑘) d𝑘 = (𝑘∕πd 1 ) d𝑘 verknüpft. Mithilfe der Beziehung (17.35) zwischen E und 𝑘 erhalten wir d E ∕ d𝑘 = ℏ2 𝑘∕𝑚L und daraus
1
q1 = 1
3∕2
2𝑚L
Zustandsdichte ϱ( )
Abb. 17.31 Zustandsdichte einer Quantenschichtstruktur (durchgezogene Kurve) und eines Volumenhalbleiters (gestrichelte Kurve).
567
568
17 Halbleiteroptik
schieben sich für höhere Quantenzahlen zu immer höheren Energien. Durch Einsetzen von E = E L + E 𝑞1 in Gl. (17.36) und Verwenden von Gl. (17.33) kann gezeigt werden, dass für E = E L + E 𝑞1 die Zustandsdichte der Quantenschicht mit der des Vollmaterials identisch ist. Die Zustandsdichte im Valenzband besitzt eine ähnliche Treppenverteilung. Im Gegensatz zu Volumenhalbleitern besitzt die Quantenschichtstruktur eine signifikante Zustandsdichte am tiefsten erlaubten Energieniveau im Leitungsband und am höchsten erlaubten Energieniveau im Valenzband. Diese Eigenschaft hat bedeutende Auswirkungen auf die optischen Eigenschaften des Materials, wie in Abschnitt 18.2.4 diskutiert wird. Mehrfachquantenschichten und Übergitter
Mehrschichtstrukturen aus alternierenden Halbleitermaterialien werden als Mehrfachquantenschichten (MQW, von engl. multiple quantum well) bezeichnet (siehe Abb. 17.32). Sie können so hergestellt werden, dass
sich die Bandlücke wie gewünscht mit dem Ort ändert (siehe z. B. Abb. 14.12). Eine MQW-Struktur kann aus einer beliebigen Zahl von Schichten bestehen, von einigen wenigen bis zu mehreren Hundert. Zum Beispiel hat eine MQW-Struktur aus 100 Schichten einer Dicke von ≈ 10 nm (die etwa 40 Atomebenen enthalten) eine Gesamtdicke ≈ 1 μm. Wenn die Energiebarrieren zwischen angrenzenden Schichten so dünn sind, dass Elektronen leicht durch sie hindurch tunneln können, verbreitern sich die diskreten Energieniveaus zu Minibändern (siehe Abschnitt 14.1.4) und die MQW-Struktur wird als Übergitterstruktur bezeichnet. Der Übergang von Unterbändern in einer MQW-Struktur zu Minibändern in einem Übergitter entspricht dem Übergang von diskreten Energieniveaus in einem Atom zu Energiebändern in einem Festkörper, wenn die Atome enger zusammenrücken und wechselwirken können (siehe Abb. 14.9 und 14.10). Quantenschichten und Übergitter können auch durch räumliche Variation der Dotierung eines Materials erzeugt werden; hierbei entstehen Raumladungsfelder, die Potentialbarrieren hervorrufen. Mehrfachquantenschichten mit angelegter Spannung
GaAs AlGaAs
Abb. 17.32 Eine MQW-Struktur aus alternierenden Schichten von Materialien mit unterschiedlichen Bandlücken wie AlGaAs und GaAs. Diese Materialien werden häufig als Beispiele für Mehrfachquantenschichten verwendet, weil sie über einen breiten Bereich von Zusammensetzungen gleiche Gitterkonstanten haben [Abb. 17.11(a)], was mechanische Spannungen zwischen den beiden Gittern minimiert, und weil ihre Bandlücken sehr unterschiedlich sind (siehe Tabelle 17.2), was einen starken Einschluss der Ladungsträger bewirkt. Andere Kombinationen von Materialien, die in der Photonik üblicherweise für MQW-Strukturen verwendet werden, sind z. B. AlInAs/InGaAs, AlInGaP/InGaP, GaN/InGaN und Alx Ga1−x N∕Aly Ga1−y N.
Die Bandschemata von MQW- und Übergitterstrukturen mit und ohne angelegte Spannung sind in Abb. 17.33 schematisch dargestellt. Das elektrische Feld bewirkt eine Neigung der Potentialtöpfe und verändert die Energieniveaus. In Übergitterstrukturen sind die diskreten Energieniveaus zu Minibändern verbreitert. MQWStrukturen werden in vielen photonischen Bauelementen wie den aktiven Regionen in LED, optischen Halbleiterverstärkern und Laserdioden verwendet (siehe die Abschnitte 18.1.3, 18.2.4 und 18.4). Sie dienen auch als Photodetektoren (siehe Abschnitt 19.2.3) und Modulatoren (siehe Abschnitt 21.5). Quantendrähte
Ein Halbleitermaterial in Form eines dünnen Drahts, der von einem Material mit einer größeren Bandlücke umgebenen ist, wird Quantendraht genannt (Abb. 17.34). Ein solcher Draht wirkt als Potentialtopf,
Miniband Minibandlücke
(a)
(b)
(c)
Abb. 17.33 Bandschemata von MQW- und Übergitterstrukturen aus alternierenden Schichten von Materialien mit unterschiedlichen Bandlücken wie AlGaAs und GaAs. (a) MQW-Struktur ohne angelegte Spannung. (b) MQW-Struktur mit angelegter Spannung. (c) Übergitterstruktur mit angelegter Spannung mit Minibändern und Minibandlücke.
17.2 Wechselwirkungen von Photonen mit Ladungsträgern
Abb. 17.34 Die Zustandsdichte in unterschiedlichen quantenbeschränkten Systemen. Die Leitungs- und Valenzbänder spalten sich in überlappende Unterbänder auf, die immer schmaler werden, wenn die Bewegung der Elektronen in mehr Dimensionen eingeschränkt wird.
y
z
x
ϱL( ) L
ϱV( )
V
Vollmaterial
L
L
L
V
V
V
Quantenschicht
Quantendraht
der Elektronen (und Löcher) in zwei Dimensionen 𝑥 und 𝑦 eingrenzt. Wenn wir annehmen, dass der Draht einen rechteckigen Schnitt der Fläche d 1 d 2 besitzt, ist die Beziehung zwischen Energie und Impuls im Leitungsband E = E L + E 𝑞1 + E 𝑞2 +
ℏ2 (𝑞1 π∕d 1 )2 , 2𝑚L
E 𝑞2 =
wir als Kasten mit dem Volumen d 1 d 2 d 3 annehmen. Die Energie ist daher gequantelt und auf die Werte E = E L + E 𝑞1 + E 𝑞2 + E 𝑞3
(17.41)
mit
ℏ2 𝑘2 , 2𝑚L
(17.38)
ℏ2 (𝑞1 π∕d 1 )2 , 2𝑚L ℏ2 (𝑞3 π∕d 3 )2 = 2𝑚L
E 𝑞1 =
mit E 𝑞1 =
Quantenpunkt
ℏ2 (𝑞2 π∕d 2 )2 , 2𝑚L
E 𝑞3
(17.39)
𝑞1 , 𝑞2 = 1, 2, 3, … , wobei 𝑘 die Vektorkomponente in 𝑧-Richtung ist (entlang der Achse des Drahts). Jedes Paar von Quantenzahlen (𝑞1 , 𝑞2 ) gehört zu einem Energie-Unterband mit der Zustandsdichte 𝜚(𝑘) = 1∕π pro Längeneinheit des Drahts und daher 1∕πd 1 d 2 pro Volumeneinheit. Die entsprechende Zustandsdichte des Quantendrahts (pro Volumeneinheit) als Funktion der Energie ist (√ / √ ) 𝑚L 2 πℏ ⎧ (1∕d 1 d 2 ) ⎪ √ ⎪ E − E L − E 𝑞1 − E 𝑞2 (17.40) 𝜚L (E ) = ⎨ für E > E L + E 𝑞1 + E 𝑞2 , ⎪ ⎪ 0 ansonsten, ⎩ mit 𝑞1 , 𝑞2 = 1, 2, 3, … Das ist eine abnehmende Funktion der Energie, wie Abb. 17.34 zeigt. Quantenpunkte
In einem Quantenpunkt sind die Elektronen in allen drei Richtungen auf ein kleines Gebiet eingegrenzt, das
E 𝑞2 =
ℏ2 (𝑞2 π∕d 2 )2 , 2𝑚L
(17.42)
mit 𝑞1 , 𝑞2 , 𝑞3 = 1, 2, 3, … beschränkt. Die erlaubten Energieniveaus sind diskret und deutlich voneinander getrennt, sodass die Zustandsdichte einer Folge von Deltafunktionen bei den erlaubten Energien entspricht, wie in Abb. 17.34 gezeigt. Quantenpunkte werden oft auch künstliche Atome genannt (siehe Abschnitt 14.1.4). Obgleich sie eine große Zahl von stark wechselwirkenden natürlichen Atomen enthalten, können die diskreten Energieniveaus des Quantenpunkts durch geeignetes Design im Prinzip nach Wunsch gewählt werden. Bauelemente auf der Basis von Quantenpunkten werden in den Kapiteln 18 und 19 diskutiert.
17.2 Wechselwirkungen von Photonen mit Ladungsträgern Als Nächstes wollen wir einige der grundlegenden optischen Eigenschaften von Halbleitern betrachten, wobei wir die für den Betrieb von photonischen Bauelementen wichtigen Prozesse der Absorption und Emission betonen. Dieses Gebiet wird als Halbleiteroptik bezeichnet.
569
570
17 Halbleiteroptik
17.2.1 Photonenwechselwirkungen in Volumenhalbleitern
Übergänge freier Ladungsträger (Intrabandübergänge).
Verschiedene Mechanismen können zur Absorption und Emission von Photonen in Volumenhalbleitern führen. Die wichtigsten sind: Ein absorbiertes Photon kann bewirken, dass ein Elektron im Valenzband einen Übergang in das Leitungsband vollzieht; dabei wird ein Elektron-Loch-Paar erzeugt [Abb. 17.35(a)]. Elektron-Loch-Rekombination kann zur Emission eines Photons führen. Interbandübergänge können von einem oder mehreren Phononen unterstützt werden. Ein Phonon ist ein Quant der Gitterschwingungen, die mit molekularen oder akustischen Schwingungen der Atome in einem Material verbunden sind. Übergänge von einem Dotierniveau in ein Band. Ein absorbiertes Photon kann einen Übergang zwischen einem Donor- (oder Akzeptor-) Niveau und einem Band in einem dotierten Halbleiter bewirken. In einem p-Halbleiter kann beispielsweise ein Photon mit niedriger Energie ein Elektron vom Valenzband in ein Akzeptorniveau anregen, wobei es von einem Akzeptoratom eingefangen wird [Abb. 17.35(b)]. Dabei wird ein Loch im Valenzband geschaffen, und das Akzeptoratom wird ionisiert. Ein Loch kann auch durch ein ionisiertes Akzeptoratom eingefangen werden; die Folge ist, dass das Elektron aus seinem Akzeptorniveau zurückfällt und mit dem Loch rekombiniert. Die Energie kann strahlend (in Form eines ausgestrahlten Photons) oder nichtstrahlend (in Form von Phononen) abgegeben werden. Ein solcher Übergang kann auch durch Haftstellen in Defektzuständen unterstützt werden, wie Abb. 17.22 illustriert. Übergänge von Band zu Band (Interbandübergänge).
g=
A=
1.42 eV
(a)
0.088 eV
(b)
Abb. 17.35 Beispiele für Absorption und Emission von Photonen in Volumenhalbleitern. (a) Übergänge von Band zu Band in GaAs können zur Absorption oder Emission von Photonen der Wellenlänge 𝜆0 < 𝜆g = hc0 ∕E g = 0.87 μ m führen. (b) Die Absorption eines Photons der Wellenlänge
Ein absorbiertes Photon kann seine Energie auf ein Elektron in einem Band übertragen und seine Anregung in ein höheres Niveau innerhalb dieses Bands veranlassen. Ein Elektron im Leitungsband kann beispielsweise ein Photon absorbieren und zu einem höheren Energieniveau innerhalb des Leitungsbands [Abb. 17.35(c)] wechseln. Daran schließt sich eine Thermalisierung an, während der das Elektron bis zum Grund des Leitungsbands relaxiert und seine Energie in Form von Phononen abgibt. Die Stärke der Absorption durch freie Träger ist proportional zur Dichte der Ladungsträger; sie nimmt mit steigender Photonenenergie nach einem Potenzgesetz ab. Phononenübergänge. Photonen mit großer Wellenlänge können ihre Energie durch direkte Anregung von Gitterschwingungen abgeben, d. h. durch Erzeugung von Phononen. Excitonische Übergänge. Die Absorption eines Photons kann auch zur Bildung eines freien Elektrons im Leitungsband und einem zugehörigen Loch im Valenzband führen, das dort in die höchsten Niveaus aufsteigt, wo seine Energie minimal wird. Dieses Elektron und das zugehörigen Loch können durch die gegenseitige Coulombanziehung aneinander gekoppelt sein, sodass sie ein Exciton bilden; die anziehende Wechselwirkung zwischen ihnen führt zu einer Verringerung ihrer Energie. Dieses „Teilchen“ ähnelt einem Wasserstoffatom, in dem ein Loch die Rolle des Protons übernimmt. Die Lebensdauern von Excitonen liegen typischerweise in der Größenordnung von einigen hundert Pikosekunden bis zu Nanosekunden. Als Folge einer Rekombination von Elektron und Loch kann ein Photon emittiert werden; dabei wird das Exciton vernichtet.
g=
0.66 eV
(c)
𝜆A = hc0 ∕E A = 14 μ m bewirkt einen Übergang aus dem Valenzband in ein Akzeptorniveau in Hg-dotiertem Ge (Ge:Hg). (c) Übergänge freier Ladungsträger innerhalb des Leitungsbands von Ge.
17.2 Wechselwirkungen von Photonen mit Ladungsträgern
Wellenlänge λ 0 /µm 10 1.0
100 10 7
Absorptionskoeffizient α/cm−1
10 6
0.2
GaAs Si freie Excitonen
10 5 10 4
Spektralbereich, in dem das Material von einigermaßen transparent (ℎ𝜈 < E g ) zu starker Absorption (ℎ𝜈 > E g ) wechselt, wird als Absorptionskante bezeichnet. Halbleiter mit direkter Bandlücke besitzen eine schärfere Absorptionskante als Materialien mit indirekter Bandlücke, wie aus den Abb. 17.36 und 17.37 deutlich wird.
17.2.2 Interband
10 3 freie Ladungsträger
10 2 10
Interbandübergänge in Volumenhalbleitern
Als Nächstes wollen wir eine einfache Theorie der direkten Photonenabsorption und -emission bei Interbandübergängen in Volumenhalbleitern entwickeln, wobei wir die anderen Arten von Übergängen ignorieren. Die Bandlückenwellenlänge
Phononen 1 0.01
0.1 1.0 Photonenenergie hν/eV
10.0
Abb. 17.36 Beobachteter optischer Absorptionskoeffizient 𝛼 als Funktion der Photonenenergie und -wellenlänge für Si und GaAs im thermischen Gleichgewicht bei T = 300 K. Die Bandlücke E g ist 1.12 eV für Si und 1.42 eV für GaAs. Silicium ist im Bereich 𝜆0 ≈ 1.1 bis 12 μ m, intrinsisches GaAs im Bereich 𝜆0 ≈ 0.87 bis 12 μ m relativ transparent (siehe Abb. 5.15).
Diese Übergänge tragen alle zum Gesamt-Absorptionskoeffizienten bei, der in Abb. 17.36 für Si und GaAs und stärker vergrößert in Abb. 17.37 für verschiedene Halbleitermaterialien gezeigt ist. Für Photonenenergien größer als die Bandlücke E g wird die Absorption durch Übergänge von Band zu Band dominiert, die die Grundlage vieler photonischer Bauelemente bilden. Der
10 5 4 3
2
1.5
1.0 0.9 0.8
0.7
Direkte Absorption und Emission von Band zu Band können nur bei Frequenzen stattfinden, für die ℎ𝜈 > E g gilt. Der minimale dafür erforderliche Frequenz ist 𝜈g = E g ∕ℎ, sodass die entsprechende maximale Wellenlänge 𝜆g = 𝑐0 ∕𝜈g = ℎ𝑐0 ∕E g ist. In gebräuchlichen Einheiten gilt 1.24
𝜆g ∕μm ≈
E g ∕eV
.
(17.43)
Der Größe 𝜆g ist die Bandlückenwellenlänge (oder Grenzwellenlänge). Der Bandlückenwellenlänge 𝜆g und die zugehörige Bandlückenenergie E g sind in Tabelle 17.2 und den Abb. 17.11 und 17.12 für mehrere in der Photonik gebräuchliche Halbleitermaterialien angegeben. Ternäre III-V- und quaternäre Halbleiter unterschiedlicher Zusammensetzungen ermöglichen einen breiten Bereich von Bandlückenwellenlängen vom mittleren Infrarot bis ins mittlere Ultraviolett.
Wellenlänge λ 0 /µm 0.6 0.5
0.4
0.3
Absorptionskoeffizient α/cm−1
10 5
10 4
InSb
InP
10 3
10 2 InAs
10
0
0.5
Ge
Si
1.0
GaAs
1.5
GaP
2.0 2.5 Photonenenergie hν/eV
GaN
3.0
3.5
4.0
4.5
Abb. 17.37 Absorptionskoeffizient als Funktion der Photonenenergie und -wellenlänge für Ge, Si, GaAs, GaN und einige andere binäre III-V-Halbleiter bei T = 300 K (vergrößerte Skala). Materialien mit direkter bzw. indirekter Bandlücke zeigen im Bereich der Bandkanten unterschiedliches Verhalten.
571
572
17 Halbleiteroptik
hν hν
i
hν
i
i
2 L
hν
hν
hν
g
hν
V 1
(a)
k
(b)
Abb. 17.38 (a) Die Absorption eines Photons führt zur Erzeugung eines Elektron-Loch-Paars. Dieser Prozess wird bei der Photodetektion von Licht verwendet. (b) Die Rekombination eines Elektron-Loch-Paars führt zur spontanen Emission eines Photons. Auf dieser Grundlage arbeiten LED.
Bedingungen für die Absorption und Emission
Die Anregung von Elektronen aus dem Valenz- in das Leitungsband kann durch Absorption eines Photons passender Energie (ℎ𝜈 > E g oder 𝜆 < 𝜆g ) stattfinden. Dabei wird ein Elektron-Loch-Paar erzeugt [Abb. 17.38(a)]. Das erhöht die Konzentration von beweglichen Ladungsträgern und vergrößert die Leitfähigkeit des Materials. Das Material verhält sich als ein Photoleiter mit einer zum Photonenfluss proportionalen Leitfähigkeit. Dieser Effekt wird zur Detektion von Licht verwendet, wie in Kapitel 19 besprochen. Die Rückkehr eines Elektrons aus dem Leitungs- in das Valenzband (Elektron-Loch-Rekombination) kann zur spontanen Emission eines Photons der Energie ℎ𝜈 > E g [Abb. 17.38(b)] oder auch – sofern zu Beginn ein Photon der Energie ℎ𝜈 > E g anwesend ist – zur induzierten Emission eines Photons führen (Abb. 17.38(c), siehe Abschnitt 14.3). Auf dem Prinzip der spontanen Emission beruht die lichtemittierende Diode, wie wir in Abschnitt 18.1 sehen werden. Die induzierte Emission ist für den Betrieb von optischen Halbleiterverstärkern und Laserdioden verantwortlich, wie die Abschnitte 18.2– 18.6 zeigen. Die Bedingungen, unter denen Absorption und Emission stattfinden, können wie folgt zusammengefasst werden: Die Absorption oder Emission eines Photons der Energie ℎ𝜈 erfordert, dass die Energien der beiden an der Wechselwirkung beteiligten Zustände (z. B. E 1 und E 2 im Valenz- bzw. Leitungsband wie in Abb. 17.38) sich um ℎ𝜈 unterscheiden. Damit beispielsweise bei der Elektron-Loch-Rekombinati-
Energieerhaltung.
hν
k
(c)
k
(c) Elektron-Loch-Rekombination kann durch ein Photon induziert werden. Das Ergebnis ist die induzierte Emission eines identischen Photons; nach diesem Prinzip arbeiten Halbleiterlaserdioden.
on ein Photon emittiert werden kann, muss ein Elektron in einem Energieniveau E 2 mit einem Loch in einem Energieniveau E 1 wechselwirken, sodass die Energie erhalten bleibt, d. h. E 2 − E 1 = ℎ𝜈 .
(17.44)
Auch der Impuls muss bei der Photonenemission/-absorption erhalten bleiben, es muss also 𝑝2 − 𝑝1 = ℎ𝜈∕𝑐 = ℎ∕𝜆 oder 𝑘2 − 𝑘1 = 2π∕𝜆 gelten. Der Betrag des Photonenimpulses ℎ∕𝜆 ist jedoch sehr klein im Vergleich mit dem Bereich von Impulsen, den Elektronen und Löcher annehmen können. Das E −𝑘-Diagramm von Halbleitern erstreckt sich bis zu Werten von 𝑘 der Größenordnung 2π∕𝑎, wobei die Gitterkonstante 𝑎 viel kleiner ist als die Wellenlänge 𝜆, sodass 2π∕𝜆 ≪ 2π∕𝑎 gilt. Die Impulse des Elektrons und des Lochs, die an der Wechselwirkung teilnehmen, müssen daher näherungsweise gleich sein. Diese Bedingung, 𝑘2 ≈ 𝑘1 , wird k-Auswahlregel genannt. Übergänge, die diese Regel befolgen, werden im E −𝑘-Diagramm (Abb. 17.38) durch vertikale Linien bezeichnet, um anzuzeigen, dass die Änderung von 𝑘 auf dem Maßstab des Diagramms vernachlässigbar ist.
Impulserhaltung.
Energien und Impulse der Elektronen und Löcher, mit denen ein Photon wechselwirkt. Wie aus Abb. 17.38
deutlich wird, erfordern die Erhaltung der Energie und des Impulses, dass ein Photon der Frequenz 𝜈 mit Elektronen und Löchern mit spezifischen Energien und entsprechenden durch die E −𝑘-Beziehung für Halbleiter gegebenen Impulsen wechselwirkt. Wenn wir die Gln. (17.3) und (17.4) verwenden, um
17.2 Wechselwirkungen von Photonen mit Ladungsträgern
diese Beziehung für einen Halbleiter mit direkter Bandlücke durch zwei Parabeln zu approximieren, und E L − E V = E g schreiben, können wir Gl. (17.44) in der Form E2 − E1 =
ℏ2 𝑘2 ℏ2 𝑘2 + Eg + = ℎ𝜈 2𝑚V 2𝑚L
2𝑚r (ℎ𝜈 − E g ) ℏ2
(17.46) In einem Halbleiter mit indirekter Bandlücke ist Photonenabsorption nicht unwahrscheinlich. Obwohl die Ab-
1 1 1 = + 𝑚r 𝑚V 𝑚L
(17.47)
folgt. Wenn wir Gl. (17.46) in Gl. (17.3) einsetzen, erhalten wir für die Energieniveaus E 1 und E 2 , mit denen das Photon wechselwirkt, 𝑚r (ℎ𝜈 − E g ) 𝑚L 𝑚r E1 = EV − (ℎ𝜈 − E g ) = E 2 − ℎ𝜈 . 𝑚V E2 = EL +
(17.48) (17.49)
In dem Spezialfall 𝑚L = 𝑚V erhalten wir E 2 = E L + 1 (ℎ𝜈 − E g ), was aus Symmetriegründen zu erwarten 2 war. Gemeinsame Zustandsdichte. Wir bestimmen nun die Dichte 𝜚(𝜈) der Zustände in einem Halbleiter mit direkter Bandlücke, mit denen ein Photon der Energie ℎ𝜈 unter Energie- und Impulserhaltung wechselwirken kann. Diese Größe kombiniert die Zustandsdichten des Leitungs- und Valenzbands und wird als gemeinsame Zustandsdichte bezeichnet. Die in Gl. (17.48) angelegte 1:1-Entsprechung zwischen E 2 und 𝜈 erlaubt uns, eine Beziehung zwischen 𝜚(𝜈) und der Zustandsdichte 𝜚L (E 2 ) im Leitungsband aufzustellen. Aus der infinitesimalen Beziehung 𝜚L (E 2 ) d E 2 = 𝜚(𝜈) d𝜈 folgt 𝜚(𝜈) = (d E 2 ∕ d𝜈)𝜚L (E 2 ) und damit ℎ𝑚r 𝜚 (E ) . 𝜚(𝜈) = 𝑚L L 2
(17.50)
Mithilfe der Gln. (17.7) und (17.48) erhalten wir schließlich die Zahl von Zuständen pro Volumenund Frequenzeinheit: (2𝑚r )3∕2 √ ℎ𝜈 − E g , π ℏ2
hν
Abb. 17.39 Die Dichte von Zuständen, mit denen ein Photon der Energie h𝜈 wechselwirkt, nimmt nach einem Quadratwurzelgesetz mit h𝜈 − E g zu.
mit
𝜚(𝜈) =
g
(17.45)
schreiben, woraus 𝑘2 =
ϱ(ν)
ℎ𝜈 ≥ E g ,
sorption von Photonen auch in einem Halbleiter mit indirekter Bandlücke die Erhaltung von Energie und Impuls erfordert, ist diese Bedingung in einem zweistufigen Prozess leicht zu erfüllen (Abb. 17.40). Das Elektron wird zuerst durch einen 𝑘-erhaltenden vertikalen Übergang in ein hohes Energieniveau innerhalb des Leitungsbands angeregt. Es relaxiert dann durch Thermalisierung, bei der seine Energie auf Phononen übertragen wird, schnell zum Grund des Leitungsbands. Das entstandene Loch verhält sich ebenso. Da der Prozess sequentiell abläuft, ist keine gleichzeitige Anwesenheit von drei Teilchen erforderlich; er ist deshalb nicht unwahrscheinlich. Tatsächlich werden Silicium und Germanium häufig in Photodetektoren eingesetzt (Kapitel 19), genau wie AlGaAs oder InGaAs mit indirekten Bandlücken.
Photonenabsorption
Thermalisierung
hν
k
Abb. 17.40 Photonenabsorption in einem Halbleiter mit indirekter Bandlücke über einen vertikalen (k-erhaltenden) Übergang. Das Photon erzeugt ein angeregtes Elektron im Leitungsband, wobei ein Loch im Valenzband zurückbleibt. Elektron und Loch vollziehen dann schnelle Übergänge in die tiefsten bzw. höchsten Niveaus des Leitungs- bzw. Valenzbands und geben ihre Energie dabei an Phononen ab. Da der Prozess sequentiell ist, ist er nicht unwahrscheinlich.
(17.51)
die in Abb. 17.39 dargestellt ist. Die 1:1-Entsprechung zwischen E 1 und 𝜈 in Gl. (17.49) liefert zusammen mit 𝜚V (E 1 ) aus Gl. (17.8) einen Ausdruck für 𝜚(𝜈), der mit Gl. (17.51) identisch ist.
In einem Halbleiter mit indirekter Bandlücke ist die Emission von Photonen unwahrscheinlich. In einem
Halbleiter mit direkter Bandlücke ist eine strahlende Elektron-Loch-Rekombination unwahrscheinlich. Der Grund dafür ist, dass Übergänge von Zuständen
573
574
17 Halbleiteroptik
Photon Phonon
k
Abb. 17.41 Photonenemission in einem Halbleiter mit indirekter Bandlücke. Die Rekombination eines Elektrons in der Nähe des Minimums des Leitungsbands mit einem Loch in der Nähe des Maximums des Valenzbands erfordert den Austausch von Energie und Impuls. Die Energie kann durch ein Photon abgeführt werden, aber für die Impulserhaltung sind ein oder mehrere Phononen erforderlich. Diese Art von Mehrteilchenwechselwirkung ist daher unwahrscheinlich.
in der Nähe des Minimums des Leitungsbands in Zustände in der Nähe des Maximums des Valenzbands (wo die Elektronen bzw. Löcher mit der größten Wahrscheinlichkeit anzutreffen sind) eine Impulsänderung erfordern, die das emittierte Photon nicht vermitteln kann. Der Impuls kann jedoch erhalten werden, wenn Phononen an der Wechselwirkung teilnehmen. Phononen können relativ große Impulse tragen, besitzen aber in der Regel kleine Energien (≈ 0.01−0.1 eV, siehe Abb. 17.36). Ihre Übergänge erscheinen daher im E −𝑘-Diagramm horizontal (siehe Abb. 17.41). Das Resultat ist Impulserhaltung unter Verletzung der 𝑘-Auswahlregel. Weil die phononenunterstützte Emission die Beteiligung von drei Teilchen erfordert (Elektron, Photon und Phonon), ist die Wahrscheinlichkeit ihres Eintretens recht gering. Daher besitzt Si als Halbleiter mit indirekter Bandlücke einen wesentlich kleineren Koeffizienten der strahlenden Rekombination als GaAs, das ein Halbleiter mit direkter Bandlücke ist (siehe Tabelle 17.4). Silicium ist daher kein effizienter Lichtemitter, GaAs dagegen schon. Unter besonderen Bedingungen ist es aber durchaus möglich, auch einen Halbleiter mit indirekter Bandlücke zur Emission anzuregen; ein solcher Fall wird in Beispiel 17-2 untersucht.
Betrieb der Germanium-Laserdiode zeigt. In ihr nutzt eine elektrisch gepumpte Fabry-Pérot-GermaniumHeterostruktur eine Kombination aus mechanischer Spannung und n-Dotierung, um eine Laserwirkung zu erreichen. 1) Die Zugspannung in der Ebene der Schicht dient dazu, die indirekte Bandlücke von Ge in eine direkte Bandlücke umzuwandeln, indem die Energien des Minimums im Fall der direkten Bandlücke und des energetisch tiefsten Minimums im Fall der indirekten Bandlücke in seiner Bandstruktur angeglichen werden. Eine zweiachsige Zugspannung von 0.2 % wird durch Bildung eines Heteroübergangs von Ge und Si bei hoher Temperatur eingeführt; beim Abkühlen wird das Ge aufgrund der unterschiedlichen Wärmeausdehnungskoeffizienten der beiden Materialien gespannt. Das Germanium wird mit Phosphor in einer Konzentration von 4 × 1019 cm−3 dotiert, was einen ausreichenden Gewinn liefert, um die mit dem elektrischen Pumpen verbundenen Verluste auszugleichen. Die Pulse des Pumpstroms liegen zwischen 20 μs und 100 ms und der Tastgrad beträgt 4 %, um eine übermäßige Erwärmung zu vermeiden. Bei Zimmertemperatur wird so eine optische Vielmoden-Ausgangsleistung von 1 mW bei einer zwischen 1.5 und 1.7 μm abstimmbaren Wellenlänge erreicht. Der Betrieb des Germanium-Heterostrukturlasers zeigt, dass BandlückenEngineering zumindest im Prinzip verwendet werden kann, um aus einem Material mit inhärenter indirekter Bandlücke eine Rekombinationsstrahlung zu erhalten.
17.2.3 Absorption, Emission und Gewinn in Volumenhalbleitern Als Nächstes wollen wir die Wahrscheinlichkeitsdichte bestimmen, dass ein Photon der Energie ℎ𝜈 in einem Volumenhalbleiter in einem direkten Interbandübergang emittiert oder absorbiert wird. Die Erhaltung von Energie und Impuls in Form der Gln. (17.46), (17.48) und (17.49) bestimmt die Energien E 1 und E 2 und den Impuls ℏ𝑘 der Elektronen und Löcher, mit denen das Photon wechselwirken kann. Drei Faktoren, die wir im Folgenden besprechen werden, bestimmen diese Wahrscheinlichkeitsdichten:
Beispiel 17-2: Photonenemission aus Germanium mit indirekter Bandlücke
1) Besetzungswahrscheinlichkeiten 2) Übergangswahrscheinlichkeiten 3) Die gemeinsame Zustandsdichte
Unter bestimmten Umständen kann eine mechanische Beanspruchung eines Materials zu einer mechanischen Dehnung führen, die einen Wechsel von einer indirekten zu einer direkten Bandlücke bewirkt. Germanium ist ein solches Material, wie der
1) R. E. Camacho-Aguilera, Y. Cai, N. Patel, J. T. Bessette, M. Romagnoli, L. C. Kimerling, J. Michel, ‚An Electrically Pumped Germanium Laser‘, Optics Express 20, 11316–11320, 2012.
17.2 Wechselwirkungen von Photonen mit Ladungsträgern
Besetzungswahrscheinlichkeiten
Übergangswahrscheinlichkeiten
Die Besetzungsbedingungen für die Emission und Absorption von Photonen durch Übergänge zwischen den diskreten Energieniveaus E 2 und E 1 lauten:
Wenn die Besetzungsbedingungen der Emission bzw. Absorption erfüllt sind, heißt das noch nicht, dass die Emission oder Absorption auch tatsächlich stattfindet. Diese Prozesse werden durch die probabilistischen Gesetze der Wechselwirkung zwischen Photonen und atomaren Systemen bestimmt, die wir in den Abschnitten 14.3.1–14.3.3 ausführlich besprochen hatten (siehe auch Übung 14-1). Wenn sie auf Halbleiter angewendet werden, werden diese Gesetze in der Regel für Emission in ein schmales Band von Frequenzen zwischen 𝜈 und 𝜈 + d𝜈 (bzw. Absorption aus einem solchen) formuliert.
Ein Zustand der Energie E 2 im Leitungsband ist (mit einem Elektron) besetzt und ein Zustand der Energie E 1 im Valenzband ist frei (d. h. mit einem Loch besetzt). Absorptionsbedingung: Ein Zustand der Energie E 2 im Leitungsband ist frei und ein Zustand der Energie E 1 im Leitungsband ist besetzt. Emissionsbedingung:
Die Wahrscheinlichkeiten, dass diese Besetzungsbedingungen für verschiedene Werte von E 2 und E 1 erfüllt sind, werden durch die jeweiligen Fermifunktionen 𝑓L (E ) und 𝑓V (E ) des Leitungs- und Valenzbands eines Halbleiters im Quasigleichgewicht bestimmt. So ist die Wahrscheinlichkeit 𝑓E (𝜈), dass die Emissionsbedingung für ein Photon der Energie ℎ𝜈 erfüllt ist, das Produkt der Wahrscheinlichkeiten, dass der obere Zustand besetzt und der tiefere Zustand leer ist (beides sind unabhängige Ereignisse), d. h. 𝑓E (𝜈) = 𝑓L (E 2 ) [1 − 𝑓V (E 1 )] .
(17.52)
Der Energien E 1 und E 2 sind durch die Gln. (17.48) und (17.49) mit 𝜈 verknüpft. Entsprechend ist die Wahrscheinlichkeit 𝑓Ab (𝜈), dass die Absorptionsbedingung erfüllt ist, gleich 𝑓Ab (𝜈) = [1 − 𝑓L (E 2 )] 𝑓V (E 1 ) .
(17.53)
Übung 17-6: Absorption und Emission von Photonen im Vergleich
(a) Zeigen Sie, dass für einen Volumenhalbleiter im thermischen Gleichgewicht 𝑓E (𝜈) immer kleiner als 𝑓Ab (𝜈) sein muss, sodass die Geschwindigkeit der Photonenemission die Geschwindigkeit der Photonenabsorption nicht überschreiten kann. (b) Zeigen Sie, dass für einen Halbleiter im Quasigleichgewicht (E FL ≠ E FV ) mit strahlenden Übergängen zwischen einem Zustand der Energie E 2 im Leitungsband und einem Zustand der Energie E 1 im Valenzband mit demselben Wert von 𝑘 die Emission wahrscheinlicher ist als Absorption, wenn der Abstand zwischen den Quasiferminiveaus größer ist als die Photonenenergie, d. h. für E FL − E FV > ℎ𝜈 .
(17.54)
Was bedeutet diese Bedingung für die relativen Lagen von E FL und E L bzw. E FV und E V ?
Zusammenfassung
Ein strahlender Übergang zwischen zwei diskreten Energieniveaus E 1 und E 2 wird durch einen Übergangsquerschnitt 𝜎(𝜈) = (𝜆 2 ∕8π 𝑡sp )𝑔(𝜈) charakterisiert, wobei 𝜈 die Frequenz ist, 𝑡sp die spontane Lebensdauer und 𝑔(𝜈) die Linienformfunktion [mit der Linienbreite Δ𝜈 bei der Übergangsfrequenz 𝜈0 = (E 2 − E 1 )∕ℎ und einer Fläche von eins]. In Halbleitern übernimmt die Lebensdauer 𝜏s der strahlenden Elektron-Loch-Rekombination, die in Abschnitt 17.1.4 eingeführt wurde, die Rolle von 𝑡sp ; damit wird 𝜎(𝜈) =
𝜆2 𝑔(𝜈) . 8π 𝜏s
(17.55)
• Wenn die Besetzungsbedingung für die Emission erfüllt ist, ist die Wahrscheinlichkeitsdichte (pro Zeiteinheit) für die spontane Emission eines Photons in eine beliebige der verfügbaren Strahlungsmoden in dem schmalen Frequenzband zwischen 𝜈 und 𝜈 + d𝜈 𝑃sp (𝜈) d𝜈 =
1 𝑔(𝜈) d𝜈 . 𝜏s
(17.56)
• Wenn die Besetzungsbedingung für die Emission erfüllt und eine mittlere spektrale Photonenflussdichte 𝜙𝜈 (Photonen pro Zeiteinheit pro Flächeneinheit pro Einheitsfrequenz) bei der Frequenz 𝜈 vorhanden ist, ist die Wahrscheinlichkeitsdichte (pro Zeiteinheit) für die induzierte Emission eines Photons in das schmale Frequenzband zwischen 𝜈 und 𝜈 + d𝜈 W ind (𝜈) d𝜈 = 𝜙𝜈 𝜎(𝜈) d𝜈 = 𝜙𝜈
𝜆2 𝑔(𝜈) d𝜈 . (17.57) 8π 𝜏s
• Wenn die Besetzungsbedingung für die Absorption erfüllt und eine mittlere spektrale Photonenflussdichte 𝜙𝜈 bei der Frequenz 𝜈 vorhanden ist, ist die Wahrscheinlichkeitsdichte für die Absorption eines Photons aus dem schmalen Frequenzband zwischen 𝜈 und 𝜈 + d𝜈 ebenfalls durch Gl. (17.57) gegeben.
575
576
17 Halbleiteroptik
Da jeder Übergang eine unterschiedliche Mittenfrequenz 𝜈0 hat und wir eine Überlagerung solcher Übergänge betrachten, bezeichnen wir die Mittenfrequenz des Übergangs explizit, indem wir 𝑔(𝜈) als 𝑔𝜈0 (𝜈) schreiben. In Halbleitern ist die Ursache der homogen verbreiterten Linienformfunktion 𝑔𝜈0 (𝜈) eines Paars von Energieniveaus im Allgemeinen die Stoßverbreiterung durch Elektron-Phonon-Stöße. Sie hat daher normalerweise eine Lorentzform [siehe die Gln. (14.45) und (14.48)] mit der Breite Δ𝜈 ≈ 1∕πT 2 , wobei die Elektron-PhononStoßdauer T 2 in der Größenordnung einiger Pikosekunden liegt. Für T 2 = 1 ps ist beispielsweise Δ𝜈 = 318 GHz entsprechend einer Energiebreite ℎΔ𝜈 ≈ 1.3 meV. Die Verbreiterung der Niveaus aufgrund strahlender Übergänge ist gegenüber der Stoßverbreiterung vernachlässigbar. Gesamt-Übergangsgeschwindigkeiten der Emission und Absorption Für ein Paar von Energieniveaus im Abstand E 2 − E 1 =
ℎ𝜈0 können die Geschwindigkeiten der spontanen Emission, der induzierten Emission und der Absorption von Photonen der Energie ℎ𝜈 [in Photonen/(s Hz cm3 )] und der Frequenz 𝜈 wie folgt bestimmt werden: Die Übergangs-Wahrscheinlichkeitsdichte 𝑃sp (𝜈) oder W ind (𝜈) [gemäß Gl. (17.56) oder (17.57)] wird mit der jeweiligen Besetzungswahrscheinlichkeit 𝑓E (𝜈0 ) oder 𝑓Ab (𝜈0 ) [aus Gl. (17.52) oder (17.53)] und der Dichte 𝜚(𝜈0 ) der Zustände multipliziert, mit denen die Photonen wechselwirken können [siehe Gl. (17.51)]. Die gesamte Übergangsgeschwindigkeit für alle erlaubten Frequenzen wird dann durch Integration über 𝜈0 berechnet. Die Geschwindigkeit der spontanen Emission bei der Frequenz 𝜈 ist zum Beispiel r sp (𝜈) = ∫ [
𝑔𝜈0 (𝜈) 𝜏s
] 𝑓E (𝜈0 ) 𝜚(𝜈0 ) d𝜈0 .
(17.58)
Wenn die stoßverbreiterte spektrale Breite Δ𝜈 wesentlich kleiner ist als die Breite des Produkts 𝑓E (𝜈0 )𝜚(𝜈0 ) – was üblicherweise der Fall ist –, ist 𝑔𝜈0 (𝜈) näherungsweise durch 𝛿(𝜈 − 𝜈0 ) gegeben, woraufhin sich die Übergangsgeschwindigkeit zu r sp (𝜈) = (1∕𝜏s )𝜚(𝜈)𝑓E (𝜈) vereinfacht. Die Geschwindigkeiten der induzierten Emission und Absorption können auf ähnliche Weise erhalten werden; man findet 1 r sp (𝜈) = 𝜚(𝜈)𝑓E (𝜈) , 𝜏s 𝜆2 r ind (𝜈) = 𝜙𝜈 𝜚(𝜈)𝑓E (𝜈) , 8π 𝜏s 𝜆2 r Ab (𝜈) = 𝜙𝜈 𝜚(𝜈)𝑓Ab (𝜈) . 8π 𝜏s
Zusammen mit den Gl. (17.51)–(17.53) ermöglichen uns diese Beziehungen, die Geschwindigkeiten der spontanen und induzierten Emission und der Absorption von direkten Interbandübergängen [in Photonen/(s Hz cm3 )] bei Vorhandensein einer mittleren spektralen Photonenflussdichte 𝜙𝜈 [Photonen/ (s Hz cm2 )] zu berechnen. Die Produkte 𝜚(𝜈)𝑓E (𝜈) und 𝜚(𝜈)𝑓Ab (𝜈) entsprechen den Produkten 𝑔(𝜈)N2 und 𝑔(𝜈)N 1 der Linienformfunktion und Atomzahldichten der oberen und unteren Niveaus, die wir in den Kapiteln 14–16 verwendet hatten, um die Emission und Absorption in atomaren Systemen zu beschreiben. Die Bestimmung der Besetzungswahrscheinlichkeiten 𝑓E (𝜈) und 𝑓Ab (𝜈) erfordert die Kenntnis der Quasiferminiveaus E FL und E FV . Durch Kontrolle dieser beiden Parameter (z. B. durch die Anlegen einer Spannung an einen pn-Übergang) können die Geschwindigkeiten der Emission und Absorption modifiziert werden, um photonische Halbleiterbauelemente herzustellen, die bestimmte Funktionen erfüllen. Gleichung (17.59) ist die Grundlage des Betriebs von LED, die auf spontaner Emission beruhen (siehe Abschnitt 18.1). Gleichung (17.60) gilt für optische Halbleiterverstärker und Laserdioden, deren Grundlage die induzierte Emission ist (siehe Abschnitte 18.2–18.6). Gleichung (17.61) ist für Halbleiterdetektoren geeignet, die durch Photonenabsorption funktionieren (siehe Abschnitt 19.1.2). Die spektrale Intensität der spontanen Emission im thermischen Gleichgewicht
Im thermischen Gleichgewicht besitzt ein Halbleiter nur eine einzige Fermifunktion, sodass Gl. (17.52) zu 𝑓E (𝜈) = 𝑓(E 2 )[1 − 𝑓(E 1 )] wird. Wenn das Ferminiveau innerhalb der Bandlücke liegt, in einer Entfernung von wenigstens einigen k𝑇 von den Bandkanten, können wir die exponentiellen Näherungen für die Fermifunktionen verwenden, 𝑓(E 2 ) ≈ exp[−(E 2 − E F )∕k 𝑇] und 1 − 𝑓(E 1 ) ≈ exp[−(E F − E 1 )∕k 𝑇], woraus 𝑓E (𝜈) ≈ exp[−(E 2 − E 1 )∕k 𝑇] folgt und damit 𝑓E (𝜈) ≈ exp (−
ℎ𝜈 ). k𝑇
Wenn wir nun Gl. (17.51) für 𝜚(𝜈) und Gl. (17.62) für 𝑓E (𝜈) in Gl. (17.59) einsetzen, erhalten wir r sp (𝜈) ≈ 𝐷0
√
ℎ𝜈 − E g exp (−
(17.59) (17.60) (17.61)
(17.62)
ℎ𝜈 − E g k𝑇
),
ℎ𝜈 ≥ E g , (17.63)
wobei 𝐷0 =
Eg (2𝑚r )3∕2 exp (− ) 2 k𝑇 π ℏ 𝜏s
(17.64)
17.2 Wechselwirkungen von Photonen mit Ladungsträgern sp (ν)
aus den Gln. (17.60) und (17.61) einsetzen, erhalten wir d𝜙𝜈 (𝑧) 𝜆2 𝜚(𝜈) [𝑓E (𝜈) − 𝑓Ab (𝜈)] 𝜙𝜈 (𝑧) = 𝛾0 (𝜈) 𝜙𝜈 (𝑧) . = 8π 𝜏s d𝑧 (17.65) T
Der Netto-Gewinnkoeffizient ist daher g
hν
Abb. 17.42 Spektrale Intensität der Geschwindigkeit r sp (𝜈) der spontanen Emission von direkten Übergängen von Band zu Band [Photonen/(s Hz cm3 )] in einem Halbleiter im thermischen Gleichgewicht als Funktion von h𝜈. Das Spektrum hat eine Grenzfrequenz 𝜈 = E g ∕h und erstreckt sich über einen Frequenzbereich der ungefähren Breite 2kT ∕h.
ein Parameter ist, der exponentiell mit der Temperatur zunimmt. Die Geschwindigkeit Gl. (17.63) der spontanen Emission, die in Abb. 17.42 gegen ℎ𝜈 aufgetragen ist, besteht aus zwei Faktoren: einer mit der Zustandsdichte zusammenhängenden Funktion, die wie die Wurzel aus ℎ𝜈 − E g zunimmt, und einer exponentiell abnehmenden Funktion von ℎ𝜈 − E g , die aus der Fermifunktion stammt. Die Geschwindigkeit der spontanen Emission kann durch Vergrößerung von 𝑓E (𝜈) gesteigert werden. Nach Gl. (17.52) kann das erreicht werden, indem man das Material absichtlich so aus dem thermischen Gleichgewicht auslenkt, dass 𝑓L (E 2 ) groß und 𝑓V (E 1 ) klein wird. Das sichert einen Überschuss an Elektronen und Löchern, was genau die in Abschnitt 18.1 erläuterte Bedingung für den Betrieb einer LED ist. Gewinnkoeffizient im Quasigleichgewicht
Den Netto-Gewinnkoeffizienten 𝛾0 (𝜈) entsprechend den Geschwindigkeiten der induzierten Emission und der Absorption in den Gln. (17.60) und (17.61) können wir bestimmen, indem wir einen Zylinder mit Einheitsfläche und der infinitesimalen Länge d𝑧 nehmen und annehmen, dass eine mittlere spektrale Photonenflussdichte entlang seiner Achse durch ihn hindurchtritt (siehe Abb. 15.3). Wenn 𝜙𝜈 (𝑧) und 𝜙𝜈 (𝑧) + d𝜙𝜈 (𝑧) die in den Zylinder ein- bzw. aus ihm austretenden mittleren spektralen Photonenflussdichten sind, muss d𝜙𝜈 (𝑧) die von dem Zylinder emittierte mittlere spektrale Photonenflussdichte sein. Die infinitesimale Zahl von Photonen pro Zeit-, Frequenz- und Flächeneinheit ist einfach die pro Zeit-, Frequenz- und Volumeneinheit gewonnene Zahl von Photonen [r ind (𝜈) − r Ab (𝜈)] multipliziert mit der Dicke d𝑧 des Zylinders. Folglich ist d𝜙𝜈 (𝑧) = [r ind (𝜈) − r Ab (𝜈)] d𝑧. Wenn wir die Geschwindigkeiten
𝛾0 (𝜈) =
𝜆2 𝜚(𝜈) 𝑓g (𝜈) , 8π 𝜏s
(17.66)
wobei der Fermi-Inversionsfaktor 𝑓g (𝜈) durch 𝑓g (𝜈) ≡ 𝑓E (𝜈) − 𝑓Ab (𝜈) = 𝑓L (E 2 ) − 𝑓V (E 1 )
(17.67)
gegeben ist, wie man aus den Gln. (17.52) und (17.53) sieht, da E 1 und E 2 durch die Gln. (17.48) und (17.49) mit 𝜈 verknüpft sind. Der Vergleich von Gl. (17.66) mit Gl. (15.4) offenbart, dass 𝜚(𝜈) 𝑓g (𝜈) im Halbleiter die Rolle von N 𝑔(𝜈) aus dem atomaren System übernimmt. Mithilfe von Gl. (17.51) können wir den Gewinnkoeffizienten in der Form √ 𝛾0 (𝜈) = 𝐷1 ℎ𝜈 − E g 𝑓g (𝜈) , ℎ𝜈 > E g (17.68a) schreiben; dabei ist √ 𝐷1 =
3∕2
2 𝑚r 𝜆 2 . ℎ 2 𝜏s
(17.68b)
Das Vorzeichen und die spektrale Form des Fermi-Inversionsfaktors 𝑓g (𝜈) werden durch die Quasiferminiveaus E FL und E FV bestimmt, die wiederum vom Anregungszustand der Ladungsträger im Halbleiter abhängen. Wie in Übung 17-6 gezeigt wird, ist dieser Faktor nur dann positiv (entsprechend einer Besetzungsinversion und einem Nettogewinn), wenn E FL − E FV > ℎ𝜈 ist. Wenn der Halbleiter mithilfe einer externen Pumpe hinreichend stark gepumpt wird, kann diese Bedingung erfüllt und ein Nettogewinn erreicht werden, wie wir in Abschnitt 18.2 sehen werden. Das ist die Physik hinter optischen Halbleiterverstärkern und Laserdioden. Der Absorptionskoeffizient im thermischen Gleichgewicht
Ein Halbleiter im thermischen Gleichgewicht besitzt nur ein einziges Ferminiveau E F = E FL = E FV , und daher ist 𝑓L (E ) = 𝑓V (E ) = 𝑓(E ) =
1 . (17.69) exp[(E − E F )∕k 𝑇] + 1
Es gilt 𝑓g (𝜈) = 𝑓L (E 2 ) − 𝑓V (E 1 ) = 𝑓(E 2 ) − 𝑓(E 1 ) < 0, und daher ist der Gewinnkoeffizient 𝛾0 (𝜈) immer negativ [da E 2 > E 1 ist und 𝑓(E ) monoton mit E abnimmt], egal wo
577
17 Halbleiteroptik
Wellenlänge λ 0 /µm 1 0.5
2
10 4
α (ν)/cm−1
578
0.4
0.5 × 10 4
0 –1
0
(hν –
1 g)
2
/eV
als Urbachausläufer bekannt. Er hängt mit der thermischen und statischen Unordnung im Kristall zusammen, die verschiedene Ursachen hat, etwa die phononenunterstützte Absorption, die statistische Verteilung der Dotierung oder Variationen der Materialzusammensetzung. In Halbleitern mit indirekter Bandlücke (z. B. Ge, Si und GaP in Abb. 17.37) folgt die Absorption in der Nähe der Bandkante im Allgemein der funktionalen Form (ℎ𝜈 − E g )2 anstelle der Quadratwurzelbeziehung der Halbleiter mit direkter Bandlücke.
Abb. 17.43 Berechneter Absorptionskoeffizient 𝛼(𝜈) (cm−1 ) aufgrund von direkten Interbandübergängen als Funktion der Photonenenergie h𝜈 (eV) und der Wellenlänge 𝜆0 (μ m) für GaAs. Diese Kurve sollte mit der in Abb. 17.37 gezeigten experimentellen Kurve verglichen werden, die alle Absorptionsmechanismen berücksichtigt.
das Ferminiveau E F liegt. Folglich schwächt ein Halbleiter – gleich ob intrinsisch oder dotiert – im thermischen Gleichgewicht Licht stets ab. Der Dämpfungs(Absorptions-) Koeffizient 𝛼(𝜈) = −𝛾0 (𝜈) ist daher √ (17.70) 𝛼(𝜈) = 𝐷1 ℎ𝜈 − E g [𝑓(E1 ) − 𝑓(E2 )] , wobei E 2 und E 1 durch die Gln. (17.48) bzw. (17.49) und 𝐷1 durch Gl. (17.68b) gegeben sind. Wenn E F innerhalb der Bandlücke in einem Abstand von wenigstens einigen k𝑇 von den Bandkanten liegt, ist 𝑓(E 1 ) ≈ 1 und 𝑓(E2 ) ≈ 0, sodass [𝑓(E 1 ) − 𝑓(E 2 )] ≈ 1 gilt. In diesem Fall ist der Beitrag der direkten Interbandübergänge zum Absorptionskoeffizienten √ 𝛼(𝜈) ≈
3∕2 𝑚r
2𝑐 𝜏s 2
1 (ℎ𝜈)2
√
ℎ𝜈 − E g .
(17.71)
Gleichung (17.71) ist in Abb. 17.43 für GaAs mit den folgenden Parametern aufgetragen: 𝑛 = 3.6, 𝑚L = 0.07𝑚0 , 𝑚V = 0.50𝑚0 , 𝑚0 = 9.1 × 10−31 kg, Dotierung entsprechend 𝜏s = 0.4 ns (diese Zeit unterscheidet sich wegen der unterschiedlichen Dotierung von der in Tabelle 17.4 angegebenen), E g = 1.42 eV und eine Temperatur, für die [𝑓(E 1 ) − 𝑓(E 2 )] ≈ 1 gilt. Mit steigender Temperatur fällt 𝑓(E 1 ) − 𝑓(E 2 ) unter eins und der Absorptionskoeffizient gemäß Gl. (17.70) wird reduziert. Nach Gl. (17.71) sollte die Absorption in der Nähe der Bandkante in√einem Halbleiter mit direkter Bandlücke der Form ℎ𝜈 − E g folgen. Der scharfe Beginn der Absorption bei ℎ𝜈 = E g ist jedoch eine Idealisierung. Wie in Abb. 17.37 zu erkennen ist, zeigen Halbleiter mit direkter Bandlücke im Allgemeinen einen exponentiellen Verlauf der Absorption mit einer charakteristischen Breite von ≈ k𝑇, die sich geringfügig ins verbotene Band ausdehnt. Dieser Verlauf der Absorption ist
Übung 17-7: Wellenlänge der maximalen Interbandabsorption
Verwenden Sie Gl. (17.71), um die (Vakuum-) Wellenlänge 𝜆max zu bestimmen, bei der der Absorptionskoeffizient eines Halbleiters im thermischen Gleichgewicht maximal ist. Berechnen Sie den Wert von 𝜆max für GaAs. Beachten Sie, dass dieses Ergebnis nur für die Absorption durch direkte Interbandübergänge gilt.
17.2.4 Photonenwechselwirkungen in quantenbeschränkten Strukturen Mehrfachquantenschichten und Übergitterstrukturen wurden in Abschnitt 17.1.7 betrachtet. Die Photonenwechselwirkungen in diesen Strukturen haben große Ähnlichkeit mit denen in Volumenhalbleitern (siehe Abschnitt 17.2.1). Bei der Absorption und Emission in quantenbeschränkten Strukturen spielen mehrere Mechanismen wichtige Rollen: • • • •
Interbandübergänge (Übergänge von Band zu Band) Excitonische Übergänge Übergänge zwischen Unterbändern Minibandübergänge
Sie sind in Abb. 17.44 illustriert und werden im Folgenden besprochen. Interbandemission und -absorption finden zwischen Zuständen in den Valenzund Leitungsbändern statt [Abb. 17.44(a)], ähnlich wie in Volumenhalbleitern. Wegen des Quanteneinschlusses muss Gl. (17.51) für die gemeinsame Zustandsdichte jedoch durch Gl. (18.42) ersetzt werden. Interbandübergänge sind die Grundlage für den Betrieb von LED aus Mehrfachquantenschichten, superlumineszenten Dioden und Laserdioden (siehe Abb. 18.22, 18.40 und 18.55) sowie von MQWElektroabsorptionsmodulatoren (siehe Abb. 21.38). Excitonische Übergänge. Die eindimensionale Eingrenzung der Ladungsträger in MQW-Strukturen führt zu einer erhöhten Bindungsenergie der Excitonen. Dadurch entstehen starke excitoniInterbandübergänge.
17.2 Wechselwirkungen von Photonen mit Ladungsträgern
(a)
(b)
(c)
(d)
Abb. 17.44 Absorption und Emission von Photonen in Mehrfachquantenschichten. (a) Interbandübergänge. (b) Excitonische Übergänge. (c) Übergänge zwischen Unterbändern. (d) Minibandübergänge in einer Übergitterstruktur.
sche Übergänge sogar bei 𝑇 = 300 K, wie Abb. 17.44(b) schematisch zeigt. Excitonische Übergänge spielen eine wichtige Rolle in vielen quantenbeschränkten Bauelementen wie z. B. MQWElektroabsorptionsmodulatoren (siehe Abb. 21.38). Übergänge zwischen Unterbändern. Übergänge, die sich zwischen Energieniveaus innerhalb eines einzigen Bands einer MQW-Struktur abspielen [Abb. 17.44(c)], werden als Übergänge zwischen Unterbändern oder Intersubband-Übergänge bezeichnet. Bauelemente auf der Grundlage solcher Übergänge sind beispielsweise der QuantenschichtQuantenkaskadenlaser [siehe Abb. 18.59(a)] und der Quantenschicht-Infrarotphotodetektor (siehe Abb. 19.10). In Letzterem verursacht die Absorption eines Photons einen Übergang von einem gebundenen Energieniveau in das Kontinuum. Die Pikosekundendynamik der Ladungsträger in solchen Systemen ermöglicht sehr große Bandbreiten. Minibandübergänge. In Übergitterstrukturen verbreitern sich die diskreten MQW-Energieniveaus zu Minibändern, die durch Minibandlücken getrennt sind. Solche Minibandübergänge [Abb. 17.44(d)] spielen beim Betrieb von Übergitter-Quantenkaskadenlasern [siehe Abb. 18.59(b)] eine entscheidende Rolle. Solche Übergänge zeigen ebenso wie Übergänge zwischen Unterbändern schnelle Relaxation und große Nichtlinearitäten und sind daher für Anwendungen wie volloptische Schaltungen und Demultiplexing vielversprechend.
17.2.5
Quantenpunkt-Einzelphotonenemitter
Quantenpunkte, die optisch oder elektrisch angeregt werden können, emittieren immer nur ein einzelnes Photon. Die emittierten Photonen sind somit zeitlich voneinander getrennt (Antibunching) und das Licht folgt im Allgemeinen einer Sub-Poisson-Verteilung (Abschnitt 13.3.5). Wenn sie in photonische Strukturen wie Mikrokavitäten, zweidimensionale Materialien oder Halbleiter-Heterostrukturen eingebettet werden, eignen sich Quantenpunkte daher zur Herstellung von Ein-
zelphotonenemittern (SPE, engl. single-photon emitters). Effiziente, nach Bedarf abrufbare Quellen für ununterscheidbare Einzelphotonen sind für die Realisierung der Quanteninformationsverarbeitung, Quantenkommunikationstechnik, Quantencomputer und Quantenkryptographie in Form von skalierbaren Systemen unabdingbar. Einige Beispiele von Quantenpunkt-Einzelphotonenemittern sind im Folgenden angegeben. Es sind auch andere Ansätze zur Herstellung von Einzelphotonenemittern möglich, beispielsweise Defektzentren in Diamant, einwandige Kohlenstoffnanoröhren oder Defekten in zweidimensionalen Materialien. Beispiel 17-3: Siliciumphotonische Quantenpunktemitter
Die Eingrenzung von Ladungsträgern in einem Quantenpunkt führt zu einer Verringerung ihrer Orts1 unschärfe Δ𝑥. Da nach Gl. (A.13) Δ𝑥Δ𝑦 ≥ ist, geht 2 dies mit einer Zunahme der Wellenzahlunschärfe Δ𝑘 einher. Durch diese Zunahme ist eine Beteiligung von Phononen an der strahlenden Rekombination nicht mehr erforderlich. Die Nutzung von Quantenpunktstrukturen ist in dieser Hinsicht analog zum Einbau von Stickstoffverunreinigungen an exakt lokalisierten Positionen in GaP mit indirekter Bandlücke, um LED aus GaP:N herzustellen (Abschnitt 18.1.3). Die geringe Größe des Quantenpunkts verbessert daher die strahlende Rekombination durch Interbandübergänge in einem Halbleiter mit indirekter Bandlücke wie Si messbar. Darüber hinaus erhöht die Passivierung der Oberfläche durch induzierte oberflächenlokalisierte Excitonen ebenfalls die Strahlungsrate. Dadurch wird eine Lichtemission aus Silicium-Nanopartikeln und porösem Silicium möglich. Beispiel 17-4: Quantenpunkt/Mikrosäulen-Einzelphotonenemitter
Ein einzelner selbstorganisierter InAs/GaAs-Quantenpunkt in einem kryogen gekühlten Mikrosäulenresonator (Abschnitt 11.4.2) mit einem Durchmesser von 2.5 μm kann durch resonante Fluoreszenz sehr effizient ununterscheidbare Photonen von hoher
579
17 Halbleiteroptik
Reinheit (es wird immer nur ein Photon gleichzeitig emittiert) produzieren (Abb. 17.45). Aufgrund des geringen Volumens der Kavität und des hohen Gütefaktors (𝑄 = 6124) der Mikrosäule beträgt der PurcellVerstärkungsfaktor der spontanen Emission gemäß Gl. (14.58) 𝐹P ≈ 6. Ein Einmoden-Lichtwellenleiter, der effizient an die Mikrosäule gekoppelt ist, koppelt ≈ 3.7 × 106 einzelne Photonen pro Sekunde aus diesem Bauelement aus. Die Anregung erfolgt in Resonanz mit der Kavität durch optische Pulse mit einer Leistung von 25 nW und einer Dauer von 3 ps im nahen Infrarot bei 𝜆0 = 897 nm mit einer Wiederholungsrate von 81 MHz. Der Photonen-Auskopplungswirkungsgrad beläuft sich auf 66 %, während der Gesamtwirkungsgrad 4.5 % beträgt. Die Quelle ist etwa zehnmal heller als die eines Bauelements auf der Grundlage von Zweiphotonenlicht und einer spontanen parametrischen Abwärtskonvertierung (Abschnitt 13.3.6).
2.5 µm
Abb. 17.45 Ein InAs/GaAs-Quantenpunkt in einer Mikrosäulen-Kavität kann als Einzelphotonenemitter wirken.
Beispiel 17-5: Einzelphotonenemission aus zweidimensionalen Materialien Die große Bandlücke (E g ≈ 6 eV) von hexagonalem
Bornitrid (h-BN), einem isolierenden zweidimensionalen Material, erleichtert seine Verwendung als Wirtsmedium für Quantenpunkt-Einzelphotonenemitter. Die Verwendung dieses zweidimensionalen Wirtsmediums bietet einige Vorteile: (1) Betrieb bei Raumtemperatur, (2) die Möglichkeit, den Emitter genau zu lokalisieren und (3) die Eliminierung von Dekohärenz und Hintergrundlumineszenz aus einer dritten räumlichen Dimension. Zweidimensionale halbleitende Materialien können auch als Einzelphotonenemitter wirken. Man kann deterministische Anordnungen von Hunderten von photolumineszierenden Einzelphotonenemittern herstellen, indem man Monoschichten von Übergangsmetall-Dichalkogeniden wie WSe2 und WS2 auf mit Anordnungen
von Nanosäulen (Durchmesser 150 nm, Höhe 100 nm Höhe) strukturierten Siliciumdioxid-Substraten abscheidet. Die Nanosäulen erzeugen lokalisierte Materialdeformationen, die eine Quanteneingrenzung von Excitonen bewirken und als Orte für photolumineszierende Einzelphotonenemissionen dienen. Bei Anregung durch grünes Licht emittieren diese kryogenen Bauelemente bei Wellenlängen von Rot bis in nahe Infrarot.
17.2.6
Der Brechungsindex
Die Möglichkeit, den Brechungsindex eines Halbleiters genau kontrollieren zu können, ist für die Herstellung vieler photonischer Bauelemente wichtig, insbesondere von optischen Wellenleitern, integriert-optischen Bauelementen oder Laserdioden. Halbleitermaterialien sind dispersiv, ihr Brechungsindex hängt also von der Wellenlänge ab. Tatsächlich ist der Brechungsindex mit dem Absorptionskoeffizienten 𝛼(𝜈) verknüpft, da der Real- und Imaginärteil der Suszeptibilität die KramersKronig-Beziehungen erfüllen müssen (siehe die Abschnitte 5.5.2 und B.1). Der Gruppen- und Brechungsindex für GaAs gemäß der Sellmeiergleichung aus Abschnitt 5.5.3 sind in Abb. 17.46 aufgetragen. Der Brechungsindex hängt auch von der Temperatur und dem Dotierniveau ab. Die Brechungsindizes von ausgewählten Element- und binären Volumenhalbleitern in der Nähe der Bandlücke sind in Tabelle 17.5 zusammengestellt. Die Brechungsindizes ternärer und quaternärer Halbleiter können näherungsweise durch lineare Interpolation zwischen den Brechungsindizes ihrer Komponenten berechnet werden. 3.8 Brechungsindex
580
3.7 3.6
N
3.5
n
3.4
1
2 3 Wellenlänge λ 0 / µm
4
Abb. 17.46 Brechungsindex n und Gruppenindex N für GaAs als Funktion der Wellenlänge 𝜆0 . Die Zahlenwerte wurden mithilfe der Sellmeiergleichung aus Tabelle 5.1 berechnet.
Aufgaben
Tab. 17.5 Brechungsindizes von ausgewählten Halbleitermaterialien.a) Material
Brechungsindex
Elementhalbleiter Ge Si
4.0 3.5
Binäre III-V-Halbleiter
Aufgabe 17-2: Ferminiveau eines intrinsischen Halbleiters
Bestimmen Sie auf der Grundlage der Gln. (17.12) und (17.13) für die Konzentrationen der Ladungsträger in den Leitungs- und Valenzbändern im thermischen Gleichgewicht (a) einen Ausdruck für das Ferminiveau E F eines intrinsischen Halbleiters und zeigen Sie, dass es nur dann genau in der Mitte der Bandlücke liegt, wenn die effektive Masse 𝑚L des Elektrons gleich der effektiven Masse 𝑚V des Lochs ist, und (b) einen Ausdruck für das Ferminiveau eines dotierten Halbleiters als Funktion des Dotierniveaus und des in (a) bestimmten Ferminiveaus.
AlN AlP
2.2 3.0
AlAs
3.2
AlSb GaN
3.8 2.5
GaP
3.3
GaAs GaSb
3.6 4.0
Aufgabe 17-3: Elektron-Loch-Rekombination bei starker Injektion
InN
3.0
InP InAs InSb
3.5 3.8 4.2
Betrachten Sie die Elektron-Loch Rekombination bei starker Injektion von Ladungsträgerpaaren, sodass die Rekombinationslebensdauer näherungsweise 𝜏 = 1∕rΔn ist, wobei r der Rekombinationskoeffizient des Materials und Δn die durch die Injektion erzeugte Überschusskonzentration der Ladungsträger sind. Nehmen Sie an, dass die Injektionsquelle R zur Zeit 𝑡 = 𝑡0 ausgeschaltet wird, und geben Sie einen analytischen Ausdruck für Δn(𝑡) an. Zeigen Sie, dass Δn(𝑡) einem Potenzgesetz und keiner Exponentialfunktion folgt.
a) Daten für Photonenenergien in der Nähe der Bandlücke (ℎ𝜈 ≈ E g ) bei 300 K.
Aufgaben Aufgabe 17-1: Ionisierungsenergien und Radien von Donorelektronen Schätzen Sie die Ionisierungsenergie E D und die bohr-
schen Radien 𝑟1 der Donorelektronen für die nachfolgend aufgeführten Halbleitermaterialien ab (siehe Abschnitt 14.1.1 und Beispiel 17-1). Sagen Sie auch jeweils etwas zur Rolle der thermischen Anregung und der Verwendung von Dielektrizitätskonstanten des Vollmaterials in den Berechnungen. (a) Ein Siliciumkristall mit der effektiven Elektronenmasse 𝑚L = 0.98𝑚0 (siehe Tabelle 17.1) und der Dielektrizitätskonstante 𝜀∕𝜀0 = 12.3 (siehe Tabelle 17.5). (b) Ein Galliumarsenidkristall mit der effektiven Elektronenmasse 𝑚L = 0.07𝑚0 (siehe Tabelle 17.1) und der Dielektrizitätskonstante 𝜀∕𝜀0 = 13 (siehe Tabelle 17.5). (c) Ein Galliumnitridkristall mit der effektiven Elektronenmasse 𝑚L = 0.20𝑚0 (siehe Tabelle 17.1) und der Dielektrizitätskonstante 𝜀∕𝜀0 = 6.25 (siehe Tabelle 17.5). (d) Eine Probe aus Na+ -dotiertem Polyacetylen, einem n-Halbleiter aus einem konjugierten Polymer mit der effektiven Elektronenmasse 𝑚L = 𝑚0 und der Dielektrizitätskonstante 𝜀∕𝜀0 = 3. Organische lichtemittierende Dioden (OLED) arbeiten mit Strahlung aus der Rekombination von gebundenen Excitonen.
Aufgabe 17-4: Bowingparameter für ternäre Halbleiter
Die Gitterkonstanten einer ternären Halbleiterverbindung A𝑥 B1−𝑥 C ändern sich normalerweise linear mit der Zusammensetzung 𝑥 (Regel von Vegard). Die Bandlücke E g verändert sich jedoch meist nichtlinear mit 𝑥, sodass eine Auftragung der Bandlücke gegen die Gitterkonstante einen gekrümmten Verlauf ergibt. Dieser Zusammenhang wird üblicherweise durch die quadratische Gleichung ABC
Eg
AC
BC
(𝑥) = E g 𝑥 + E g (1 − 𝑥) − b𝑥(1 − 𝑥) ,
wiedergegeben, in der b der Bowingparameter ist. Verwenden Sie die in den Abb. 17.11 und 17.12 gezeigten Kurven, um die Bowingparameter für Al𝑥 Ga1−𝑥 As, GaAs1−𝑥 P𝑥 , Al𝑥 Ga1−𝑥 N, In𝑥 Ga1−𝑥 N, Al𝑥 In1−𝑥 N und Hg𝑥 Cd1−𝑥 Te zu bestimmen. Welche Bedeutung hat der Bowingparameter für die Übereinstimmung der Gitterparameter einer ternären Verbindung und eines Substrats?
581
582
17 Halbleiteroptik
Aufgabe 17-5: Energieniveaus in einer GaAs/AlGaAsQuantenschicht
(a) Skizzieren Sie das Bandschema einer einkristallinen Mehrfachquantenschicht aus GaAs/AlGaAs mit einer maßstabsgetreuen Energieachse für die Zusammensetzung Al0.3 Ga0.7 As der AlGaAs-Schichten. Die Bandlücke E g (GaAs) von GaAs beträgt 1.42 eV, die von AlGaAs übersteigt diesen Wert um ≈ 12.47 meV pro Prozent Al in der Mischung. Wegen der intrinsischen Eigenschaften dieser beiden Materialien beträgt die Tiefe des GaAs-Quantentopfs im Leitungsband ungefähr 60 % der Gesamttiefe der Quantentöpfe von Leitungsund Valenzband. (b) Nehmen Sie an, dass ein Quantentopf der Leitungsbands von GaAs die in (a) bestimmte Tiefe hat und genau dieselben Energieniveaus wie der endliche quadratische Potentialtopf aus Abb. 17.30(b) besitzt, für den (𝑚𝑉0 d 2 ∕2ℏ2 )1∕2 = 4 ist, wobei 𝑉0 die Tiefe des Potentialtopfs ist. Geben Sie die Gesamtbreite d des GaAs-Potentialtopf im Leitungsband an. Die effektive Masse eines Elektrons im Leitungsband von GaAs ist 𝑚L ≈ 0.07𝑚0 = 0.64 × 10−31 kg. Aufgabe 17-6: Gültigkeit der Näherung für die Absorption/ Emissionsraten
Bei der Herleitung der Geschwindigkeit der spontanen Emission haben wir die Näherung 𝑔𝜈0 (𝜈) ≈ 𝛿(𝜈 − 𝜈0 ) verwendet, um das Integral r sp (𝜈) = ∫ [
1 𝑔 (𝜈)] 𝑓E (𝜈0 )𝜚(𝜈0 ) d𝜈0 𝜏s 𝜈 0
zu berechnen. (a) Zeigen Sie, dass diese Näherung für GaAs zufriedenstellend ist, indem Sie die Funktionen 𝑔𝜈0 (𝜈), 𝑓E (𝜈0 ) und 𝜚(𝜈0 ) bei 𝑇 = 300 K auftragen und ihre Breiten vergleichen. GaAs ist stoßverbreitert mit T 2 ≈ 1 ps. (b) Wiederholen Sie Teil (a) für die Geschwindigkeit der Absorption im thermischen Gleichgewicht. Aufgabe 17-7: Maximale Rate der spontanen Emission im thermischen Gleichgewicht
(a) Bestimmen Sie die Photonenenergie ℎ𝜈P , bei der die direkte Geschwindigkeit der spontanen Emission von Band zu Band in einem Halbleitermaterial im thermischen Gleichgewicht ihren maximalen Wert erreicht, wenn das Ferminiveau innerhalb der Bandlücke in einem Abstand von wenigstens einigen k 𝑇 von den Bandkanten liegt. (b) Zeigen Sie, dass diese maximale Geschwindigkeit (Photonen pro Sekunde pro Hertz pro Kubikzentimeter) gleich 𝐷0 √
r sp (𝜈P ) = √
2𝑒
2(𝑚r )3∕2 √
k𝑇 = √
𝑒π ℏ2 𝜏s
k 𝑇 exp (−
Eg k𝑇
)
ist. (c) Welchen Einfluss hat die Dotierung auf dieses Ergebnis? (d) Nehmen Sie 𝜏s = 0.4 ns, 𝑚L = 0.07𝑚0 , 𝑚V = 0.50𝑚0 und E g = 1.42 eV an, und bestimmen Sie die Maximalgeschwindigkeit in GaAs bei 𝑇 = 300 K. Aufgabe 17-8: Geschwindigkeit der strahlenden Rekombination im thermischen Gleichgewicht
(a) Zeigen Sie, dass die über alle Emissionsfrequenzen integrierte Geschwindigkeit der spontanen Interbandemission (Photonen pro Sekunde pro Kubikzentimeter) gleich √
∞
∫ r sp (𝜈) d𝜈 = 𝐷0
π (k 𝑇)3∕2 2ℎ
0
Eg (𝑚r )3∕2 = √ (k 𝑇)3∕2 exp (− ) k 𝑇 3∕2 2 π ℏ3 𝜏s
ist, sofern das Ferminiveau innerhalb der Bandlücke des Halbleiters und in ausreichendem Abstand ∞ von den Bandkanten liegt. Hinweis: ∫0 𝑥1∕2 e−𝜇𝑥 d𝑥 = √ −3∕2 . (b) Vergleichen Sie dieses Ergebnis mit ( π∕2)𝜇 der genäherten integrierten Geschwindigkeit, die Sie durch Multiplikation der in Aufgabe 17-7 bestimmten Maximalgeschwindigkeit mit der genäherten Bandbreite 2k 𝑇∕ℎ aus Abb. 17.42 erhalten. (c) Benutzen Sie Gl. (17.15) und setzen Sie die phänomenologische Geschwindigkeit der strahlenden Rekombination im Gleichgewicht rs np = rs n2i (Photonen pro Sekunde pro cm3 ) aus Abschnitt 17.1.4 gleich dem direkten Ergebnis aus (a), um den Ausdruck für den Koeffizienten der strahlenden Rekombination zu erhalten, √ 2 π3∕2 ℏ3 1 rs = . (𝑚L + 𝑚V )3∕2 (k𝑇)3∕2 𝜏s (d) Verwenden Sie das Ergebnis aus (c), um den Wert von rs für GaAs bei 𝑇 = 300 K mit 𝑚L = 0.07𝑚0 , 𝑚V = 0.5𝑚0 und 𝜏s = 0.4 ns zu berechnen. Vergleichen Sie Ihr Ergebnis mit dem in Tabelle 17.4 angegebenen Wert (rs ≈ 10−10 cm3 ∕s).
Weiterführende Literatur Halbleitermaterialien
J. E. Ayers, T. Kujofsa, P. Rago, J. Raphael, Heteroepitaxy of Semiconductors: Theory, Growth, and Characterization, CRC Press/Taylor & Francis, 2. Aufl. 2017. J. Orton, T. Foxon, Molecular Beam Epitaxy: A Short History, Oxford University Press 2015. D. K. Schroder, Semiconductor Material and Device Characterization, Wiley-IEEE, 3. Aufl. 2015.
Aufgaben
E. Prati, T. Shinada (Hrsg.), Single-Atom Nanoelectronics, CRC Press/Taylor & Francis 2013. O. Oda, Compound Semiconductor Bulk Materials and Characterizations, Bd. 2, World Scientific 2012. P. M. Koenraad, M. E. Flatté, ‚Single Dopants in Semiconductors‘, Nature Materials 10, 91–100, 2011. M. Razeghi, The MOCVD Challenge: A Survey of GalnAsPInP and GalnAsP-GaAs for Photonic and Electronic Device Applications, CRC Press/Taylor & Francis 2010. Graphen und andere zweidimensionale Materialien
S. Cahangirov, H. Sahin, G. Le Lay, A. Rubio, Introduction to the Physics of Silicene and Other 2D Materials, Springer 2017. P. Avouris, T. F. Heinz, T. Low (Hrsg.), 2D Materials: Properties and Devices, Cambridge University Press 2017. P. Ajayan, P. Kim, K. Banerjee, ‚Two-dimensional van der Waals Materials‘, Physics Today 69(9), 38–44, 2016. F. Iacopi, J. J. Boeckl, C. Jagadish (Hrsg.), 2D Materials. Bd. 95 in C. Jagadish, E. R. Weber (Hrsg.), Semiconductors and Semimetals, Academic Press/Elsevier 2016. E. L. Wolf, Graphene: A New Paradigm in Condensed Matter and Device Physics, Oxford University Press 2016. P. A. D. Gonçalves, N. M. R. Peres, An Introduction to Graphene Plasmonics, World Scientific 2016. Z. Sun, A. Martinez, F. Wang, ‚Optical Modulators with 2D Layered Materials‘, Nature Photonics 10, 227–238, 2016. A. C. Ferrari et al., ‚Science and Technology Roadmap for Graphene, Related Two-Dimensional Crystals, and Hybrid Systems‘, Nanoscale 7, 4598–4810, 2015. F. Xia, H. Wang, D. Xiao, M. Dubey, A. Ramasubramaniam, ‚Two-Dimensional Material Nanophotonics‘, Nature Photonics 8, 899–907, 2014. A. K. Geim, ‚Nobel Lecture: Random Walk to Graphene‘, Reviews of Modern Physics 83, 851–862, 2011. K. S. Novoselov, ‚Nobel Lecture: Graphene: Materials in the Flatland‘, Reviews of Modern Physics 83, 837–849, 2011. Halbleiterphysik, -optik und -bauelemente
Siehe auch die Weiterführende Literatur in den Kapiteln 18 und 19 Z. Mi, C. Jagadish (Hrsg.), III-Nitride Semiconductor Optoelectronics. Bd. 96 in C. Jagadish, E. R. Weber (Hrsg.), Semiconductors and Semimetals, Academic Press/Elsevier, 2017. M. Grundmann, The Physics of Semiconductors: An Introduction Including Nanophysics and Applications, Springer, 3. Aufl. 2016. M. Rudan, Physics of Semiconductor Devices, Springer 2015. B. G. Streetman, S. Banerjee, Solid State Electronic Devices, Pearson, 7. Aufl. 2014. G. Grosso, G. V Parravicini, Solid State Physics, Academic Press/Elsevier, 2. Aufl. 2014.
S. H. Simon, The Oxford Solid State Basics, Oxford University Press 2013. B. K. Ridley, Quantum Processes in Semiconductors, Oxford University Press. 5. Aufl. 2013. W. Barford, Electronic and Optical Properties of Conjugated Polymers, Oxford University Press, 2. Aufl. 2013. S. M. Sze, M. K. Lee, Semiconductor Devices: Physics and Technology, Wiley, 3. Aufl. 2012. C. F. Klingshirn, Semiconductor Optics, Springer-Verlag, 4. Aufl. 2012. M. Kira, S. W. Koch, Semiconductor Quantum Optics, Cambridge University Press 2012. S. O. Kasap, Optoelectronics and Photonics: Principles and Practices, Pearson, 2. Aufl. 2012. S. Adachi, The Handbook on Optical Constants of Semiconductors: In Tables and Figures, World Scientific 2012. W. Brütting, C. Adachi (Hrsg.), Physics of Organic Semiconductors, Wiley-VCH, 2. Aufl. 2012. D. A. Neamen, Semiconductor Physics and Devices: Basic Principles, McGraw-Hill, 4. Aufl. 2011. T. Yoshimura, Thin-Film Organic Photonics: Molecular Layer Deposition and Applications, CRC Press/Taylor & Francis 2011. J. Chu, A. Sher, Device Physics of Narrow Gap Semiconductors, Springer 2010. M. Fox, Optical Properties of Solids, Oxford University Press, 2. Aufl. 2010. P. Yu, M. Cardona, Fundamentals of Semiconductors: Physics and Materials Properties, Springer, 4. Aufl. 2010. S. L. Chuang, Physics of Photonic Devices, Wiley, 2. Aufl. 2009. H. Haug, S. W. Koch, Quantum Theory of the Optical and Electronic Properties of Semiconductors, World Scientific, 5. Aufl. 2009. H. Morkoç, Handbook of Nitride Semiconductors and Devices, Bd. I: Materials Properties, Physics and Growth; Bd. II: Electronic and Optical Processes in Nitrides; Bd. III: GaN- Based Optical and Electronic Devices, Wiley-VCH 2008. T. Meier, P. Thomas, S. W. Koch, Coherent Semiconductor Optics: From Basic Concepts to Nanostructure Applications, Springer 2007. S. M. Sze, K. K. Ng, Physics of Semiconductor Devices, Wiley, 3. Aufl. 2006. A. Moliton, Optoelectronics of Molecules and Polymers, Springer 2006, Paperback 2011. C. Kittel, Introduction to Solid State Physics, Wiley, 8. Aufl. 2004, Paperback 2012. K. K. Ng, Complete Guide to Semiconductor Devices, WileyIEEE, 2. Aufl. 2002. W. W. Chow, S. W. Koch, Semiconductor-Laser Fundamentals: Physics of the Gain Materials, Springer 1999; Paperback 2010.
583
584
17 Halbleiteroptik
M. Riordan, L. Hoddeson, ‚The Origins of the pn Junction‘, IEEE Spectrum 34(6), 46–51, 1997. P. T. Landsberg, Recombination in Semiconductors, Cambridge University Press 1991, Paperback 2003. L. Esaki, ‚Long Journey into Tunneling (Nobel Lecture in Physics, 1973)‘. In: S. Lundqvist (Hrsg.), Nobel Lectures in Physics 1971–1980, World Scientific 1992. J. I. Pankove, Optical Processes in Semiconductors, Prentice Hall 1971; Dover, Paperback 2010. W. B. Shockley, ‚Transistor Technology Evokes New Physics (Nobel Lecture in Physics, 1956)‘. In: Nobel Lectures in Physics, 1942–1962, World Scientific 1998. J. Bardeen, ‚Semiconductor Research Leading to the Point Contact Transistor (Nobel Lecture in Physics, 1956)‘. In: Nobel Lectures in Physics, 1942–1962, World Scientific 1998. W. H. Brattain, ‚Surface Properties of Semiconductors (Nobel Lecture in Physics, 1956)‘. In: Nobel Lectures in Physics, 1942–1962, World Scientific 1998. Quantenbegrenzte Materialien und Nanostrukturen
Siehe auch die Weiterführende Literatur zu quantenbegrenzten und Mikrohohlraum-Bauelementen in Kapitel 18 S. Y. Ren, Electronic States in Crystals of Finite Size: Quantum Confinement of Block Waves, Springer, 2. Aufl. 2017. M. V. Fischetti, W. G. Vandenberghe, Advanced Physics of Electron Transport in Semiconductors and Nanostructures, Springer 2016. P. Harrison, A. Valavanis, Quantum Wells, Wires and Dots: Theoretical and Computational Physics of Semiconductor Nanostructures, Wiley, 4. Aufl. 2016. A. Zhang, G. Zheng, C. M. Lieber, Nanowires: Building Blocks for Nanoscience andNanotechnology, Springer 2016. A. Dayeh, A. Fontcuberta i Morral, C. Jagadish (Hrsg.), Semiconductor Nanowires II: Properties and Applications. Bd. 94 in C. Jagadish, E. R. Weber (Hrsg.), Semiconductors and Semimetals, Academic Press/Elsevier 2016. C. R. Kagan, ‚E. Lifshitz, E. H. Sargent, D. V. Talapin, Building Devices from Colloidal Quantum Dots‘, Science 353, 5523, 2016. Y. S. Zhao (Hrsg.), Organic Nanophotonics: Fundamentals and Applications, Springer 2015. H. Ünlü, N. J. M. Horing (Hrsg.), Low Dimensional Semiconductor Structures: Characterization, Modeling and Applications, Springer 2013. D. Vollath, Nanomaterials: An Introduction to Synthesis, Properties and Applications, Wiley-VCH, 2. Aufl. 2013.
G. Cao, Y. Wang, Nanostructures and Nanomaterials: Synthesis, Properties, and Applications, World Scientific, 2. Aufl. 2011. F. W. Wise (Hrsg.), Selected Papers on Semiconductor Quantum Dots, SPIE Optical Engineering Press 2005 (Milestone Series Bd. 180). L. Esaki, ‚A Bird’s-Eye View on the Evolution of Semiconductor Superlattices and Quantum Wells‘, IEEE Journal of Quantum Electronics, QE-22, 1611–1624, 1986. Einzelphotonenemitter
X. He, N. F. Hartmann, X. Ma, Y. Kim, R. Inly, J. L. Blackburn, W. Gao, J. Kono, Y. Yomogida, A. Hirano, T. Tanaka, H. Kataura, H. Htoon, S. K. Doom, ‚Tunable Room-Temperature Single-Photon Emission at Telecom Wavelengths from sp3 Defects in Carbon Nanotubes‘, Nature Photonics 11, 577–582, 2017. C. Palacios-Berraquero, D. M. Kara, A. R.-P. Montblanch, M. Barbone, P. Latawiec, D. Yoon, A. K. Ott, M. Loncar, A. C. Ferrari, M. Atatüre, ‚Large-Scale QuantumEmitter Arrays in Atomically Thin Semiconductors‘, Nature Communications 8, 15093, 2017; doi: 10.1038/ ncomms15093. I. Aharonovich, M. Toth, ‚Quantum Emitters in Two Dimensions‘, Science 358, 170–171, 2017. I. Aharonovich, D. Englund, M. Toth, ‚Solid-State SinglePhoton Emitters‘, Nature Photonics 10, 631–641, 2016. X. Ding, Y He, Z.-C. Duan, N. Gregersen, M.-C. Chen, S. Unsleber, S. Maier, C. Schneider, M. Kamp, S. Hofling, C.-Y Lu, J.-W. Pan, ‚On-Demand Single Photons with High Extraction Efficiency and Near-Unity Indistinguishability from a Resonantly Driven Quantum Dot in a Micropillar‘, Physical Review Letters 116, 020401, 2016. N. Somaschi, V. Giesz, L. De Santis, J. C. Loredo, M. P. Almeida, G. Hornecker, S. L. Portalupi, T. Grange, C. Antón, J. Demory, C. Gómez, I. Sagnes, N. D. LanzillottiKimura, A. Lemaítre, A. Auffeves, A. G. White, L. Lanco, P. Senellart, ‚Near-Optimal Single-Photon Sources in the Solid State‘, Nature Photonics 10, 340–345, 2016. P. Lodahl, S. Mahmoodian, S. Stobbe, ‚Interfacing Single Photons and Single Quantum Dots with Photonic Nanostructures‘, Reviews of Modern Physics 87, 347–400, 2015. M. G. Raymer, K. Srinivasan, ‚Manipulating the Color and Shape of Single Photons‘, Physics Today 65(11), 32–37, 2012.
585
18 LED und Laserdioden Ein Halbleitermaterial kann als Folge der ElektronLoch-Rekombination Licht emittieren. Allerdings leuchten auch Materialien, die dazu in der Lage sind, bei Zimmertemperatur nicht, weil die Konzentrationen thermisch angeregter Elektronen und Löcher zu klein sind, um eine wahrnehmbare Strahlung zu liefern. Mithilfe einer externen Energiequelle können Elektron-LochPaare in ausreichender Menge produziert werden, sodass die Strahlung aufgrund spontaner Rekombination so stark wird, dass das Material glimmt oder leuchtet. Am einfachsten lässt sich das erreichen, indem man an einen pn-Übergang eine Spannung in Durchlassrichtung anlegt, die Elektronen und Löcher in dieselbe räumliche Region in der Nähe des Übergangs injiziert; die resultierende Rekombinationsstrahlung wird dann Injektionselektrolumineszenz genannt. Eine lichtemittierende Diode (LED) ist ein in Durchlassrichtung gepolter pn-Übergang aus einem Halbleitermaterial mit direkter Bandlücke, der durch Injektionselektrolumineszenz Licht emittiert [Abb. 18.1(a)]. Wenn die angelegte Spannung über einen bestimmten Wert hinaus vergrößert wird, kann die Zahl von Elektronen und Löchern in der Übergangsregion so groß werden, dass eine Besetzungsinversion erreicht wird, woraufhin die induzierte (d. h. durch die Anwesenheit von Photonen veranlasste) Emission über die Absorption überwiegt. Der Bereich des Halbleiterübergangs kann dann als optischer Halbleiterverstärker (OHV) [Abb. 18.1(b)] oder mit einem geeigneten Rückkopplungsmechanismus auch als Laserdiode (LD) [Abb. 18.1(c)] dienen. Halbleiter-Photonenquellen in Form von LED und LD dienen als hocheffiziente Wandler von elektronischen in photonische Signale. In vielen Anwendungen sind sie aufgrund ihrer Kleinheit, ihrer Helligkeit, ihres hohen Wirkungsgrads, ihrer hohen Zuverlässigkeit und ihrer Robustheit und Beständigkeit unentbehrlich. LED im sichtbaren Spektralbereich werden schon lange als Anzeigeelemente genutzt (d. h. in Anwendungen, in denen der Beobachter die LED direkt betrachtet),
+
(a)
p
n
-
+
(b)
p
n
-
+
p
(c)
Abb. 18.1 Eine in Durchlassrichtung gepolte pn-Flächendiode als (a) lichtemittierende Diode (LED), (b) optischer Halbleiterverstärker (OHV) und (c) Laserdiode (LD).
beispielsweise als Warnlampen, Displays von Computern oder Mobiltelefonen, Anzeigetafeln, Ampeln oder vielen anderen Anwendungen. Hochleistungs-LED im sichtbaren Spektralbereich werden auch zu Beleuchtungszwecken genutzt (bei denen der Beobachter nur das von Gegenständen gestreute Licht der LED bewusst wahrnimmt), beispielsweise zu architektonischen Zwecken, für die Straßenbeleuchtung, in Taschenlampen oder Projektoren. Infrarot-LED dienen häufig als Fernbedienungen für Gebrauchsgüter wie optische Mäuse, Kopfhörer oder Tastaturen. Ultraviolette LED kommen in der Wasserreinigung, in der medizinischen Sterilisation, bei der Härtung von Harzen und Klebern und im Druckwesen zur Anwendung. Sie helfen auch beim Nachweis von chemischen und biologischen Substanzen, von denen viele fluoreszieren, wenn sie bei bestimmten Wellenlängen mit UV-Licht bestrahlt werden. Laserdioden werden sehr häufig in der optischen Nachrichtentechnik eingesetzt, wo es von Vorteil ist, dass sie durch Steuerung des injizierten Stroms bequem modulierbar sind. Sie werden auch bei der optischen Datenspeicherung wie z. B. in DVD-Laufwerken sowie in hochauflösenden Scannern oder Farbdruckern ein-
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
n
-
586
18 LED und Laserdioden
gesetzt. Außerdem dienen sie als effiziente optische Pumpen für optische Faserverstärker und Festkörperlaser, wobei in dieser Anwendung das relativ breitbandige Vielmodenlicht der Laserdioden in das schmalbandige Einmodenlicht der diodengepumpten Festkörperlaser umgewandelt wird. Das Aufkommen der quantenbegrenzten Halbleiterlaser wie Mehrfachquantenschicht-, Mehrfachquantenpunkt-, oder Quantenkaskadenlaser sowie von kompakten Lasern wie den Oberflächenemitter-, Mikrodisk- und Nanolasern hat die Integration von Lasern und anderen optischen Bauelementen in kompakte Gruppen enorm vereinfacht. Diese Integration hat wiederum die Tür zu völlig neuen Anwendungen geöffnet.
In diesem Kapitel . . . Dieses Kapitel ist der Untersuchung von lichtemittierenden Dioden (Abschnitt 18.1), optischen Halbleiterverstärkern (Abschnitt 18.2), Laserdioden (Abschnitt 18.3), quantenbeschränkten Lasern (Abschnitt 18.4), Mikroresonatorlasern (Abschnitt 18.5) und Nanokavitätslasern (Abschnitt 18.6) gewidmet. Dabei wird der in Kapitel 17 vorgestellte Stoff überwiegend als bekannt vorausgesetzt. Die theoretischen Behandlungen von optischen Halbleiterverstärkern und Laserdiodenoszillatoren lehnen sich eng an die Analysen von Laserverstärkern und Laseroszillatoren aus den Kapiteln 15 bzw. 16 an.
18.1 Lichtemittierende Dioden (LED) Elektrolumineszenz beschreibt die Erscheinung, dass ein Material Licht emittiert, wenn es einem elektrischen Feld ausgesetzt wird (siehe Abschnitt 14.5). Die 1907 entdeckte Injektionselektrolumineszenz ist die Grundlage von lichtemittierenden Dioden, hocheffizienten Lichtquellen, die Licht praktisch jeder Farbe emittieren können. LED sind in vielen Bereichen der Photonik von großer Bedeutung. Wir besprechen die Theorie der Injektionselektrolumineszenz in Abschnitt 18.1.1, die Eigenschaften von lichtemittierenden Dioden in Abschnitt 18.1.2 und typische Materialien und Strukturen von Bauelementen in Abschnitt 18.1.3. In Abschnitt 18.1.4 beschäftigen wir uns mit der Verwendung von Silicium (mit einer indirekten Bandlücke) zur Lichterzeugung, in Abschnitt 18.1.5 mit organischen LED und in Abschnitt 18.1.6 mit der Verwendung von LED zu Beleuchtungszwecken.
18.1.1
Injektionselektrolumineszenz
Elektrolumineszenz im thermischen Gleichgewicht
Strahlende Elektron-Loch-Rekombinationen bewirken die Emission von Licht aus einem Halbleitermaterial. Bei Zimmertemperatur ist die Konzentration thermisch angeregter Elektronen und Löcher jedoch so klein, dass der Photonenfluss unmerklich ist. Beispiel 18-1: Photonenemission von GaAs im thermischen Gleichgewicht
Bei Zimmertemperatur ist die intrinsische Konzentration von Elektronen und Löchern in GaAs ni ≈ 1.8 × 106 cm−3 (siehe Tabelle 17.3). Da der Koeffizient der strahlenden Elektron-Loch-Rekombination nach Tabelle 17.4 rs ≈ 10−10 cm3 ∕s ist (für die dort angegebenen Bedingungen), folgt für die Geschwindigkeit der Elektrolumineszenz rs np = rs n2i ≈ 324 Photonen/(cm3 s), wie in Abschnitt 17.1.4 diskutiert. Mit der Bandlücke von GaAs, E g = 1.42 eV = 1.42 × 1.6 × 10−19 J entspricht diese Emissionsrate einer optischen Leistungsdichte von 324 × 1.42 × 1.6 × 10−19 ≈ 7.4 × 10−17 W∕cm3 . Für eine 2 μm dicke Schicht GaAs erhalten wir daher eine emittierte Intensität 𝐼 ≈ 1.5 × 10−20 W∕cm2 . Im thermischen Gleichgewicht kann diese Intensität durch Dotierung des Materials nicht merklich vergrößert (oder verringert) werden. Nach dem in Gl. (17.17) angegebenen Massenwirkungsgesetz bleibt das Produkt np konstant gleich n2i , sofern das Material nicht zu stark dotiert ist, sodass die Rekombinationsrate rs np = rs n2i nur über rs vom Dotierniveau abhängt. Für eine hohe Rekombinationsrate ist ein Überschuss von Elektronen und Löchern erforderlich; in einem n-Halbleiter ist n groß, aber p klein, wohingegen in einem p-Halbleiter das Gegenteil zutrifft. Elektrolumineszenz bei Injektion von Ladungsträgern
Die Photonenemission kann merklich erhöht werden, wenn man die Konzentration von Elektron-Loch-Paaren in dem Material durch äußere Maßnahmen erhöht. Das kann z. B. erreicht werden, indem man das Material mit Licht bestrahlt, meist legt man aber an eine pnFlächendiode eine Spannung in Durchlassrichtung an, die dazu dient, Ladungsträgerpaare in das Übergangsgebiet zu injizieren. Dieser Prozess ist in Abb. 17.25 illustriert und wird in Abschnitt 18.1.2 ausführlicher erklärt. Die Rate der Photonenemission kann aus der Injektionsgeschwindigkeit R der Elektron-Loch-Paare [Paare/(cm3 s)] berechnet werden, wobei R die Rolle der Pumpgeschwindigkeit des Lasers übernimmt (siehe Ab-
18.1 Lichtemittierende Dioden (LED)
injizierte Ladungsträger
emittierte Photonen (Geschwindigkeit Φ)
(Geschwindigkeit )
Abb. 18.2 Spontane Photonenemission durch strahlende Elektron-Loch-Rekombination, z. B. in einem in Durchlassrichtung gepolten pn-Übergang.
schnitt 15.2). Der Photonenfluss 𝛷 (Photonen pro Sekunde), der in einem Volumen 𝑉 des Halbleitermaterials erzeugt wird, ist direkt proportional zur Injektionsgeschwindigkeit der Ladungsträgerpaare (siehe Abb. 18.2). Wir bezeichnen die Gleichgewichtskonzentrationen von Elektronen und Löchern ohne Pumpen mit n0 bzw. p0 und ihre Konzentrationen im stationären Zustand mit Pumpen mit n = n0 + Δn bzw. p = p0 + Δp (siehe Abschnitt 17.1.4). Die Überschusskonzentration Δn der Elektronen ist gleich der Überschusskonzentration Δp der Löcher, weil Elektronen und Löcher immer paarweise erzeugt werden. Wir nehmen an, dass die überschüssigen Elektron-Loch-Paare mit einer Geschwindigkeit 1∕𝜏 rekombinieren, wobei 𝜏 die Gesamtzeit der (strahlenden und nichtstrahlenden) Rekombination ist. Im stationären Zustand muss die Bildungs- (Pump-) Geschwindigkeit die Rekombinations- (Zerfall-) Geschwindigkeit genau ausgleichen, es muss also R = Δn∕𝜏 gelten. Somit ist die Überschusskonzentration der Ladungsträger im stationären Zustand proportional zur Pumpgeschwindigkeit, d. h. Δn = R𝜏 .
(18.1)
Für hinreichend kleine Geschwindigkeiten der Ladungsträgerinjektion (siehe Abschnitt 17.1.4) gilt 𝜏 ≈ 1∕r(n0 + p0 ), wobei r der Koeffizient der (strahlenden und nichtstrahlenden) Rekombination ist, sodass R ≈ rΔn (n0 + p0 ) ist. Nur strahlende Rekombinationen erzeugen jedoch Photonen. Die in den Gln. (17.28) und (17.30) definierte innere Quantenausbeute 𝜂i = rs ∕r = 𝜏∕𝜏s berücksichtigt die Tatsache, dass nur ein Teil der Rekombinationen strahlend abläuft. Die Injektion von R𝑉 Ladungsträgerpaaren pro Sekunde führt daher zu einem Photonenfluss 𝛷 = 𝜂i R𝑉 Photonen pro Sekunde, d. h. 𝛷 = 𝜂i R𝑉 = 𝜂i
𝑉Δn 𝑉Δn . = 𝜏 𝜏s
(18.2)
Der innere Photonenfluss 𝛷 ist proportional zur Injektionsgeschwindigkeit R der Ladungsträgerpaare und
daher zur Überschusskonzentration Δn der ElektronLoch-Paare im stationären Zustand. Die innere Quantenausbeute 𝜂i spielt eine entscheidende Rolle für die Leistungsfähigkeit eines solchen Elektron-Photon-Wandlers. Zur Herstellung von LED (und von Laserdioden) werden meist Halbleiter mit direkter Bandlücke verwendet, weil 𝜂i für sie wesentlich größer ist als für Halbleiter mit indirekter Bandlücke (bei Zimmertemperatur ist z. B. 𝜂i ≈ 0.5 für GaAs und ≈ 10−5 für Si, wie aus Tabelle 17.4 zu sehen ist). Der innere Wirkungsgrad 𝜂i hängt von der Dotierung, der Temperatur und der Defektkonzentration des Materials ab. Beispiel 18-2: Injektionselektrolumineszenz in GaAs
Unter geeigneten Bedingungen ist für GaAs 𝜏 = 50 ns und 𝜂i = 0.5 (siehe Tabelle 17.4), sodass eine Überschusskonzentration von Δn = 1017 cm−3 injizierten Elektron-Loch-Paaren im stationären Zustand einen Photonenfluss von 𝜂i Δn∕𝜏 ≈ 1024 Photonen/(cm3 s) hervorbringt. Das entspricht einer optischen Leistungsdichte von ≈ 2.3 × 105 W∕cm3 für Photonen der Energie E g = 1.42 eV. Eine GaAs-Platte der Dicke 2 μm produziert daher eine optische Intensität von ≈ 46 W∕cm2 , also um einen Faktor 1021 mehr als der Wert im thermischen Gleichgewicht, den wir in Beispiel 181 berechnet hatten. Unter diesen Bedingungen beträgt die von einem Bauelement der Fläche 200 μm × 10 μm abgestrahlte Leistung ≈ 0.9 mW. Die spektrale Intensität von Elektrolumineszenzphotonen
Die spektrale Intensität der Injektionselektrolumineszenz kann mithilfe in Abschnitt 17.2 entwickelten Theorie der direkten Interbandemission bestimmt werden. Die Geschwindigkeit r sp (𝜈) der spontanen Emission (Zahl von Photonen pro Sekunde pro Hertz pro Volumeneinheit) ist nach Gl. (17.59) r sp (𝜈) =
1 𝜚(𝜈)𝑓E (𝜈) , 𝜏s
(18.3)
wobei 𝜏s die Lebensdauer aufgrund der strahlenden Elektron-Loch-Rekombination ist. Die gemeinsame Zustandsdichte für die Wechselwirkung mit Photonen der Frequenz 𝜈 ist nach Gl. (17.51) 𝜚(𝜈) =
(2𝑚r )3∕2 √ ℎ𝜈 − E g , πℏ2
(18.4)
wobei 𝑚r gemäß 1∕𝑚r = 1∕𝑚V + 1∕𝑚L [siehe Gl. (17.47)] mit den effektiven Massen der Löcher und Elektronen verknüpft ist und E g die Energie der Bandlücke ist. Die Emissionsbedingung [siehe Gl. (17.52)] liefert 𝑓E (𝜈) = 𝑓L (E 2 )[1 − 𝑓V (E 1 )] ;
(18.5)
587
588
18 LED und Laserdioden
wobei n0 und p0 die Konzentrationen von Elektronen und Löchern im thermischen Gleichgewicht (ohne Injektion) sind und Δn = R𝜏 die Konzentration der injizierten Ladungsträger im stationären Zustand ist. Wenn die Injektion so schwach ist, dass die Ferminiveaus innerhalb der Bandlücke in Abständen von wenigstens einigen k 𝑇 von den Bandkanten liegen, können die Fermifunktionen durch ihre exponentiellen Ausläufer angenähert werden. Der spontane Photonenfluss (integriert über alle Frequenzen) ergibt sich dann aus der Geschwindigkeit r sp (𝜈) der spontanen Emission als
2
L
hν g
V 1
k
Abb. 18.3 Die spontane Emission eines Photons durch Rekombination eines Elektrons der Energie E 2 mit einem Loch der Energie E 1 = E 2 − h𝜈. Der Übergang ist durch einen vertikalen Pfeil bezeichnet, weil der von dem Photon abgeführte Impuls h𝜈∕c auf dem Maßstab der Abbildung vernachlässigbar ist.
das ist die Wahrscheinlichkeit, dass ein Zustand der Energie E2 = EL +
𝑚r (ℎ𝜈 − E g ) 𝑚L
(18.6)
im Leitungsband besetzt und ein Zustand der Energie E 1 = E 2 − ℎ𝜈
(18.7)
im Valenzband frei ist [siehe die Gln. (17.48) und (17.49) sowie Abb. 18.3]. Die Gln. (18.6) und (18.7) stellen sicher, dass Energie und Impuls erhalten bleiben. Die Fermifunktionen 𝑓L (E ) = 1∕{exp[(E − E FL )∕k 𝑇] + 1} und 𝑓V (E ) = 1∕{exp[(E − E FV )∕k 𝑇] + 1} mit den Quasiferminiveaus E FL und E FV , die in Gl. (18.5) erscheinen, gelten im Quasigleichgewicht für das Leitungs- bzw. Valenzband. Die Materialparameter E g , 𝜏s , 𝑚V und 𝑚L sowie die Temperatur 𝑇 bestimmen bei gegebenen Quasiferminiveaus E FL und E FV die spektrale Verteilung r sp (𝜈). Diese sind wiederum durch die Konzentrationen der Elektronen und Löcher entsprechend den Gln. (17.10) und (17.11) bestimmt, ∞
∫ 𝜚L (E )𝑓L (E ) d E = n = n0 + Δn , EL
(18.8)
EV
∫ 𝜚V (E )[1 − 𝑓V (E )] d E = p = p0 + Δn . −∞
Die Zustandsdichten in der Nähe der Leitungs- und Valenzbandkante sind nach den Gln. (17.7) und (17.8) 𝜚L (E ) =
(2𝑚L ) 2π2 ℏ3
3∕2
√
E − EL ,
𝜚V (E ) =
(2𝑚V ) 2π2 ℏ3
3∕2
√
EV − E ,
(18.9)
∞
𝛷 = 𝑉 ∫ r sp (𝜈) d𝜈 0
E FL − E FV − E g 𝑉(𝑚r )3∕2 = √ (k 𝑇)3∕2 exp ( ), k𝑇 2π3∕2 ℏ3 𝜏s (18.10)
wie aus Aufgabe 17-8 einfach zu erkennen ist. Eine Erhöhung der Pumpleistung R vergrößert Δn, wodurch sich E FL auf das Leitungsband zu (oder weiter in es hinein) und E FV sich auf das Valenzband zu (oder weiter in es hinein) verschiebt. Das führt zu einer Zunahme der Wahrscheinlichkeit 𝑓L (E 2 ), dass ein Zustand der Energie E 2 im Leitungsband mit einem Elektron besetzt ist sowie der Wahrscheinlichkeit 1 − 𝑓V (E 1 ), das ein Zustand der Energie E 1 im Valenzband leer (mit einem Loch gefüllt) ist. Insgesamt ist das Ergebnis, dass die Emissionswahrscheinlichkeit 𝑓E (𝜈) = 𝑓L (E 2 )[1 − 𝑓V (E 1 )] mit R zunimmt und sich somit die Geschwindigkeit der spontanen Emission nach Gl. (18.3) und der spontane Photonenfluss 𝛷 erhöhen. Übung 18-1: Quasiferminiveaus eines gepumpten Halbleiters
(a) Zeigen Sie, dass unter idealen Bedingungen bei 𝑇 = 0 K, wenn es keine thermische Anregung von Elektron-Loch-Paaren gibt [siehe Abb. 18.4(a)], die Quasiferminiveaus mit den Konzentrationen Δn der injizierten Elektron-Loch-Paare durch ℏ2 (Δn)2∕3 2𝑚L ℏ2 = E V − (3π2 )2∕3 (Δn)2∕3 2𝑚V
E FL = E L + (3π2 )2∕3
(18.11a)
E FV
(18.11b)
verknüpft sind, sodass E FL − E FV = E g + (3π2 )2∕3
ℏ2 (Δn)2∕3 2𝑚r
(18.11c)
mit Δn ≫ n0 , p0 gilt. Unter diesen Bedingungen besetzen alle Δn Elektronen die tiefsten erlaubten Ener-
18.1 Lichtemittierende Dioden (LED)
Abb. 18.4 Energiebänder und Fermifunktionen für einen Halbleiter im Quasigleichgewicht (a) bei T = 0 K und (b) bei T > 0 K. FL
f L( )
FV
FL
E
fL ( )
FV
fV ( )
fV ( )
k
k
gieniveaus im Leitungsband, und alle Δp Löcher besetzen die höchsten erlaubten Niveaus im Valenzband. Vergleichen Sie mit den Ergebnissen aus Übung 173. (b) Skizzieren Sie die Funktion 𝑓E (𝜈) und r sp (𝜈) für zwei Werte von Δn. Beachten Sie den in Abb. 18.4(b) dargestellten Einfluss der Temperatur auf die Fermifunktionen und geben Sie die Wirkung einer Temperaturerhöhung auf r sp (𝜈) an.
Übung 18-2: Spektrale Intensität der Injektionselektrolumineszenz bei schwacher Injektion Wenn die Injektion so schwach ist, dass E L − E FL ≫ k𝑇 und E FV − E V ≫ k𝑇 gilt, können die Fermifunktionen
durch ihre exponentiellen Ausläufer angenähert werden. Zeigen Sie, dass die Geschwindigkeit der Lumineszenz dann als r sp (𝜈) = 𝐷
√
ℎ𝜈 − E g exp (−
ℎ𝜈 − E g k𝑇
),
ℎ𝜈 ≥ E g ,
ausgedrückt werden kann, wobei E FL − E FV − E g (2𝑚r )3∕2 exp ( ) 2 k𝑇 πℏ 𝜏s
T
g
Übung 18-3: Spektrale Linienbreite der Elektrolumineszenz
(a) Zeigen Sie, dass die durch Gl. (18.12) beschriebene spektrale Intensität des ausgestrahlten Lichts ihren Maximalwert bei einer Frequenz 1
ℎ𝜈max = E g + k 𝑇
eine exponentiell ansteigende Funktion des Abstands E FL − E FV zwischen den Quasiferminiveaus ist. Die
spektrale Intensität der spontanen Emission ist in Abb. 18.5 gezeigt; sie hat genau dieselbe Form wie die spektrale Intensität im thermischen Gleichgewicht aus Abb. 17.42, nur dass ihr Betrag um einen Faktor 𝐷∕𝐷0 = exp[(E FL − E FV )∕k 𝑇] größer ist, der bei Injektion sehr groß werden kann. Im thermischen Gleichgewicht ist E FL = E FV , sodass wir wieder die Gln. (17.63) und (17.64) erhalten.
(18.13)
erreicht. (b) Zeigen Sie, dass die Halbwertsbreite der spektralen Intensität Δ𝜈 ≈ 1.8k 𝑇∕ℎ
(18.12b)
hν
Abb. 18.5 Spektrale Intensität der Geschwindigkeit der direkten Interband-Injektionselektrolumineszenz r sp (𝜈) (Photonen pro Sekunde pro Hertz pro Kubikzentimeter) als Funktion von h𝜈 nach Gl. (18.12) bei schwacher Injektion.
2
(18.12a)
𝐷=
sp (ν)
(18.14)
ist. Der Wert von Δ𝜈 für aktive Medien aus Verbindungshalbleitern kann aufgrund von statistischen Variationen der chemischen Zusammensetzung größer sein als der nach Gl. (18.14) berechnete; dieses Phänomen wird als Legierungsverbreiterung bezeichnet. (c) Zeigen Sie, dass diese Breite einer Verbreitung 2 Δ𝜆 ≈ 1.8𝜆max k 𝑇∕ℎ𝑐 mit 𝜆P = 𝑐∕𝜈P entspricht. In gebräuchlichen Einheiten ist Δ𝜆∕μm ≈ 1.45 (𝜆max ∕μm)2 (k 𝑇)∕eV .
(18.15)
Verifizieren Sie diese Beziehung. (d) Berechnen Sie Δ𝜈 und Δ𝜆 bei 𝑇 = 300 K für 𝜆max = 0.8 μm und 𝜆max = 1.6 μm.
589
18 LED und Laserdioden
+V
0 p
Elektronenenergie
590
n
FL
Abb. 18.6 Bandschema eines stark dotierten pn-Übergangs, an dem eine hohe Spannung V in Durchlassrichtung anliegt (zu vergleichen mit dem Bandschema für eine kleinere angelegte Spannung aus Abb. 17.25). Die gestrichelten Linien bezeichnen die Quasiferminiveaus, die infolge der angelegten Spannung verschieden sind. Der gleichzeitige Überschuss an Elektronen und Löchern im Bereich des Übergangs führt zu einer starken strahlenden Elektron-Loch-Rekombination (Injektionselektrolumineszenz).
eV
hν FV
Ort
18.1.2
Die Eigenschaften von LED
Wie aus der vorhergehenden Diskussion klar sein dürfte, erhöht die gleichzeitige Verfügbarkeit von Elektronen und Löchern den Fluss der von einem Halbleiter spontan emittierten Photonen wesentlich. Elektronen sind in n-Halbleitern ausreichend vorhanden, Löcher in p-Halbleitern – die Erzeugung relevanter Lichtmengen erfordert aber das gleichzeitige ausreichende Vorhandensein von Elektronen und Löchern in demselben räumlichen Gebiet. Diese Bedingung kann im Bereich des Übergangs einer in Durchlassrichtung gepolten pn-Diode erfüllt werden (siehe Abschnitt 17.1.5). Wie Abb. 18.6 zeigt, verschiebt die angelegte Spannung Löcher von der p-Seite und Elektronen von der n-Seite in den Bereich des Übergangs (die sogenannte Injektion von Minoritätsladungsträgern), wo sie rekombinieren und Photonen emittieren. Eine lichtemittierende Diode (LED) ist ein in Durchlassrichtung gepolter pn-Übergang mit einer hohen Geschwindigkeit der strahlenden Rekombination aufgrund von injizierten Minoritätsladungsträgern. Das Halbleitermaterial besitzt gewöhnlich eine direkte Bandlücke, um eine hohe Quantenausbeute zu gewährleisten. In diesem Abschnitt bestimmen wir die Ausgangsleistung sowie die spektrale und räumliche Verteilung des Lichts aus einer LED und leiten Ausdrücke für den Wirkungsgrad, die Ansprechempfindlichkeit und die Antwortzeit her.
p
+
i
Eine schematische Darstellung einer einfachen pnHomoflächendiode ist in Abb. 18.7 gezeigt. Ein injizierter Gleichstrom 𝑖 führt zu einer Zunahme der Ladungsträgerkonzentrationen Δn im stationären Zustand, die
–
l
Abb. 18.7 Ein einfache in Durchlassrichtung gepolte LED. Die Photonen werden spontan aus der Region des Übergangs emittiert.
wiederum eine strahlende Rekombination im Volumen 𝑉 der aktiven Region bewirkt. Da die Gesamtzahl von Ladungsträgern, die die Region des Übergangs pro Sekunde durchqueren, gleich 𝑖∕𝑒 ist (wenn 𝑒 der Betrag der Elektronenladung ist), ist die Geschwindigkeit der Ladungsträgerinjektion (Ladungsträger pro Sekunde pro Kubikzentimeter) einfach R=
𝑖∕𝑒 . 𝑉
(18.16)
Gleichung (18.1) liefert Δn = R𝜏 entsprechend einer Ladungsträgerkonzentration im stationären Zustand Δn =
Innerer Photonenfluss und innerer Wirkungsgrad
n
(𝑖∕𝑒)𝜏 . 𝑉
(18.17)
In Übereinstimmung mit Gl. (18.2) ist der innere Photonenfluss 𝛷 dann 𝜂i R𝑉, woraus mit Gl. (18.3) folgt 𝑖 𝛷 = 𝜂i . 𝑒
(18.18)
18.1 Lichtemittierende Dioden (LED)
Diese einfache und intuitiv ansprechende Gleichung bestimmt die Produktion von Photonen durch Elektronen in einer LED: Ein Teil 𝜂i des injizierten Elektronenflusses 𝑖∕𝑒 (Elektronen pro Sekunde) wird in einen Photonenfluss umgewandelt. Die innere Quantenausbeute 𝜂i ist daher einfach das Verhältnis des erzeugten Photonenflusses zum injizierten Elektronenfluss. Der innere Photonenfluss kann durch Verwendung von LED aus Doppelheterostrukturen (Abschnitt 17.1.6) oder mit aktiven Regionen aus Mehrfachquantenschichten (Abschnitt 17.1.7) erhöht werden. Ihr Vorteil ist, dass Doppelheterostrukturen höhere Ladungsträgerkonzentrationen erzeugen, was die strahlende Rekombination verstärkt (die Strahlungslebensdauer 𝜏s wird reduziert) und dadurch die innere Quantenausbeute 𝜂i erhöht [siehe die Gln. (17.30), (17.31) und (18.18)]. Um 𝜂i zu maximieren, sollten die Schichten der Heterostruktur dieselbe Gitterkonstante wie die aktive Region besitzen. Sehr dünne Quantenschichten grenzen Ladungsträger noch enger ein und erhöhen 𝜂i noch mehr. Die Zahl der in einem Bauelement verwendeten Quantenschichten wird oft durch die Tatsache begrenzt, dass es schwierig ist, sie alle zu besetzen. Um eine gute Leistung zu erreichen, ist es wichtig, Materialien mit höchster Kristallqualität zu verwenden, um die Defektkonzentrationen möglichst klein zu halten und alle Oberflächen zu vermeiden, in die beide Ladungsträger eintreten können, um die nichtstrahlende Rekombination zu minimieren. Auskopplungswirkungsgrad
Der in dem Übergang erzeugte Photonenfluss wird isotrop in alle Richtungen ausgestrahlt; der Fluss, der aus dem Bauelement austritt, hängt jedoch von der Richtung der Emission ab. Das ist leicht zu erklären, wenn man den Photonenfluss betrachtet, der durch ein planares Material entlang dreier möglicher Richtungen durchgelassen wird, die in der Anordnung der Abb. 18.8 mit 𝐴, 𝐵 und 𝐶 bezeichnet sind. p
n l1
θk
A
B C
Abb. 18.8 Nicht das gesamte in einer LED mit einer ebenen Oberfläche erzeugte Licht kann aus der Diode austreten. Strahl A wird teilweise reflektiert, Strahl B erfährt eine stärkere Reflexion, und Strahl C liegt außerhalb des kritischen Winkels und erfährt daher Totalreflexion, sodass er in der Struktur gefangen ist.
• Der Photonenfluss in Richtung von Strahl 𝐴 wird um einen Faktor 𝜂1 = exp(−𝛼𝑙1 )
(18.19)
abgeschwächt, wobei 𝛼 der Absorptionskoeffizient des n-Halbleiters ist und 𝑙1 die Entfernung vom Übergang bis zur Oberfläche des Bauelements bezeichnet. Für senkrechten Einfall kann außerdem wegen der Reflexion an der Grenzfläche Halbleiter/Luft nur ein Bruchteil 𝜂2 = 1 −
(𝑛 − 1)2 4𝑛 = (𝑛 + 1)2 (𝑛 + 1)2
(18.20)
des Lichts transmittiert werden, wobei 𝑛 der Brechungsindex des Halbleiters ist [siehe die Fresnelgleichung (6.41)]. Für GaAs ist 𝑛 = 3.6, sodass 𝜂2 = 0.68 wird. Die gesamte Transmission für den Photonenfluss in Richtung von Strahl 𝐴 ist daher 𝜂𝐴 = 𝜂1 𝜂2 . • Der Photonenfluss in Richtung von Strahl 𝐵 hat einen weiteren Weg und wird daher stärker absorbiert; es erfährt auch größere Reflexionsverluste. Daher ist 𝜂𝐵 < 𝜂𝐴 . • Der Photonenfluss in Richtungen außerhalb eines Kegels mit dem (kritischen) Öffnungswinkel 𝜃k = −1 sin (1∕𝑛) (wie z. B. Strahl 𝐶) erfährt in einem idealen Material Totalreflexion und wird nicht durchgelassen [siehe Gl. (1.8)]. Die Fläche der Kugelkappe 𝜃 auf diesem Kegel ist A = ∫0 k 2π 𝑟 sin 𝜃 𝑟 d𝜃 = 2π 𝑟 2 (1 − cos 𝜃k ), während die Fläche der vollständigen Kugel 4π 𝑟 2 ist. Somit ist der Bruchteil des ausgestrahlten Lichts, das innerhalb des durch diesen Kegel aufgespannten Raumwinkels liegt, gleich A∕4π 𝑟 2 ; folglich ist 1
1
2
2
𝜂3 = (1 − cos 𝜃k ) =
(1 −
√
1 − 1∕𝑛2 ) ≈ 1∕4𝑛2 . (18.21)
Für ein Material mit dem Brechungsindex 𝑛 = 3.6 werden beispielsweise nur 1.9 % des erzeugten Photonenflusses durchgelassen. Für √ ein Parallelepiped mit dem Brechungsindex 𝑛 > 2 ist das Verhältnis der isotrop ausgestrahlten Lichtenergie zur insgesamt erzeugten Lichtenergie gleich 3[1 − (1 − 1∕𝑛2 )1∕2 ], wie in Übung 1-7 gezeigt wird. Ein Teil der außerhalb des kritischen Winkels ausgestrahlten Photonen kann jedoch absorbiert und innerhalb dieses Winkels reemittiert werden, sodass 𝜂3 in der Praxis einen größeren Wert annehmen kann als aus Gl. (18.21) berechnet. Auch für diese Strahlen müssen Verluste und Fresnelreflexion berücksichtigt werden.
591
592
18 LED und Laserdioden
Der Wirkungsgrad, mit dem die inneren Photonen aus der LED-Struktur ausgekoppelt werden können, wird als Auskopplungswirkungsgrad 𝜂A bezeichnet. Zur Reduktion der Fresnelreflexion und Vergrößerung von 𝜂A können Antireflexbeläge verwendet werden (siehe Übung 7-1).
Abb. 18.9 LED-Bauformen mit erhöhtem Auskopplungswirkungsgrad im Vergleich zu einem Parallelepiped. p
Übung 18-4: Auskopplung von Licht aus einer LED mit ebenen Oberflächen
(a) Leiten Sie Gl. (18.21) her. (b) Bestimmen Sie die kritischen Winkel für Licht, das aus GaAs (𝑛 = 3.6), GaN (𝑛 = 2.5) und einem durchsichtigen Polymer (𝑛 = 1.5) in Luft austritt. Berechnen Sie den Teil des Lichts, das in diesen drei Fällen ausgekoppelt werden kann, wenn Absorption und Fresnelreflexion ignoriert werden. (c) Wie ändert sich der Anteil des ausgekoppelten Lichts, wenn eine ebene LED aus GaAs mit einem transparenten Polymer mit dem Brechungsindex 𝑛 = 1.5 beschichtet wird? Nehmen Sie an, dass Absorption und Fresnelreflexion an der Grenzfläche des polymeren Halbleiters vernachlässigt werden können. (d) Bestimmen Sie den Brechungsindex des Polymers, für den der Bruchteil des von der LED in die Luft emittierten Lichts maximal wird, sofern Absorption ignoriert, aber die Fresnelreflexion an den Grenzflächen Halbleiter/Polymer und Polymer/Luft berücksichtigt wird. Der Auskopplungswirkungsgrad kann auf vielerlei Weise erhöht werden. Eine Möglichkeit ist, eine Anordnung des LED-Chips zu wählen, die die Auskopplung eines größeren Teils des Lichts erlaubt. Beispielsweise können aus einer kugelförmigen Hülle um eine punktförmige Quelle im Zentrum trotz Fresnelreflexion alle Strahlen entkommen. Auch andere Anordnungen bietet erhöhte Auskopplungswirkungsgrade als ein Parallelepiped, wie Abb. 18.9 zeigt: Halbkugeln, zylindrische Strukturen (die außer an den Enden auch entlang ihres Umfangs abstrahlen), umgekehrte Kegel, und abgeschnittene umgekehrte Pyramiden. Anordnungen, deren Herstellung zu komplex ist, werden in der Praxis jedoch auf Kostengründen vermieden. Einfache LED, die aus einer ebenen Oberfläche emittieren, reichen dann aus, wenn der gewünschte Betrachtungswinkel nur wenig von der Normalen abweicht oder das Licht in eine optische Faser eingekoppelt wird, z. B. für nachrichtentechnische Anwendungen. Alternativ kann man die ebene Oberfläche der LED auch aufrauen oder ihr eine sonstige Textur verleihen. Das erhöht den Auskopplungswirkungsgrad, da nun auch Strahlen oberhalb des kritischen Winkels durch Streuung aus dem Medium austreten können,
n l1 θk
Abb. 18.10 Eine LED mit einer aufgerauten ebenen Oberfläche erlaubt Strahlen außerhalb des kritischen Winkels, aus dem Medium zu entkommen, und vergrößert so den Auskopplungswirkungsgrad 𝜂A .
wie Abb. 18.10 darstellt. Unter geeigneten Bedingungen bildet sich eine solche strukturierte Oberfläche bei der Herstellung automatisch. Andernfalls kann die emittierende Fläche strukturiert werden, beispielsweise mit einer Anordnung von mikroskopischen Kegeln oder Pyramiden oder mit Nanopartikeln. Die Morphologie der lichtemittierender Organe mancher Organismen (z. B. Glühwürmchen) verbessert durch Totalreflexion oder Fehlanpassung von Brechungsindizes den Wirkungsgrad der Auskopplung von Licht. Die hiervon abgeleitete biologisch inspirierte Oberflächenstrukturierung konnte eingesetzt werden, um den Auskopplungswirkungsgrad von LED zu optimieren. Oberflächenemittierende LED verwenden häufig Streuschichten (auch als Fensterschichten bezeichnet). Dabei handelt es sich um transparente leitende Halbleiterschichten, die das Gebiet der Lichtemission über die unmittelbare Umgebung des elektrischen Kontakts hinaus ausdehnen. Auch Blockierschichten, die verhindern, dass ein Strom in die aktive Region unterhalb der oberen Kontaktschicht eintritt, können verwendet werden, um die Lichtemission zu kontrollieren. Die Anordnung des Übergangs selbst kann ebenfalls für maximale Lichttransmission optimiert werden. Eine ganze Reihe weiterer Methoden wird ebenfalls verwendet, um den Auskopplungswirkungsgrad zu erhöhen. Dazu gehören beispielsweise verteilte Braggreflektoren (DBR, siehe Kapitel 7) zwischen der aktiven Schicht und einem absorbierenden Substrat, die das Licht in die gewünschte Richtung der Emission zurück reflektieren, oder auch reflektierende oder transparente Kontakte. Bei transparenten Substraten wird gerne auch die Flip-Chip-Technik (oder Wendemontage) verwendet, bei der das Licht nicht durch die Oberseite
18.1 Lichtemittierende Dioden (LED)
des Bauelements, sondern durch das Substrat ausgekoppelt wird. Der Auskopplungswirkungsgrad einer LED kann außerdem erhöht werden, indem man das Licht durch einen zweidimensionalen photonischen Kristall, der aus einer regelmäßigen Reihe von Löchern mit Durchmessern von 100–250 nm in der Streuschicht besteht, zur Oberfläche des Bauelements führt (siehe Abschnitt 7.3.1). Die räumliche Verteilung des emittierten Lichts
Im Fernbereich ähnelt die Verteilung des von einer LED aus einer ebenen Oberfläche emittierten Lichts der eines Lambertstrahlers. Die Intensität ändert sich wie cos 𝜃, wobei 𝜃 der Winkel zur Senkrechte aus der Emissionsfläche ist; bei 𝜃 = 60◦ beträgt die Intensität noch die Hälfte ihres Maximalwerts. Diese Verteilung entsteht infolge des snelliusschen Gesetzes: Lichtstrahlen werden beim Durchgang durch die Grenzfläche Halbleiter/Luft von der Normalen weg gebrochen. LED werden aus mehreren Gründen oft in durchsichtige Polymerlinsen (meist aus Epoxid oder Silikon) eingeschlossen (Abb. 18.11). Linsen mit unterschiedlichen Formen verändern die Emissionsverteilung, wie Abb. 18.12 für halbkugelförmige und parabolische Linsen zeigt. Epoxidharzlinsen können auch den Auskopplungswirkungsgrad 𝜂A erhöhen. Eine Linse mit einem Brechungsindex ähnlich dem des Halbleiters verbessert die Auskopplung des Lichts vom Halbleiter ins Epoxidharz. Die Form der Linse kann dann so maßgeschneidert werden, dass sie die Auskopplung des Lichts an der Grenzfläche Polymer/Luft maximiert. Polymere haben meist Brechungsindizes zwischen denen von Halbleitern und Luft und können die Lichtausbeute in der Praxis um einen Faktor 2–3 verbessern. Kollimatoren
LEDChip
Abb. 18.11 Polymergekapselte LED in einem 5-mm-DualInline-Gehäuse (DIP). Die Ummantelung schützt den Halbleiterchip, verbessert die Lichtauskopplung durch Verringerung der Brechungsindexsprünge und dient als Linse, die den austretenden Strahl formt.
aus Acrylaten oder Polycarbonaten nutzen eine Kombination aus Totalreflexion und Brechung, um für Beleuchtungszwecke parallele Strahlen zu erzeugen (siehe Abb. 1.19). Die Strahlungsverteilungen von kantenemittierenden LED und Laserdioden sind in der Regel sehr schmal und können empirisch häufig durch die Funktion cos𝑠 𝜃 mit 𝑠 > 1 beschrieben werden. Für 𝑠 = 10 nimmt die Intensität bei 𝜃 ≈ 21◦ beispielsweise auf die Hälfte ihres Maximalwerts ab. Photonenfluss am Ausgang und äußerer Wirkungsgrad
Der Photonenfluss 𝛷A am Ausgang einer LED (auch äußerer Photonenfluss genannt) ist mit dem inneren Photonenfluss durch 𝛷A = 𝜂A 𝛷 = 𝜂A 𝜂i
𝜂ex ≡ 𝜂A 𝜂i .
(a)
– +
θ
(b)
– +
(c)
(18.23)
Der Photonenfluss am Ausgang in Gl. (18.22) kann daher als 𝛷A = 𝜂ex
𝑖 𝑒
(18.24)
geschrieben werden, sodass der äußere Wirkungsgrad 𝜂ex einfach das Verhältnis des äußeren Photonenflusses 𝛷A zum injizierten Elektronenfluss 𝑖∕𝑒 ist. Weil sich die Pumpgeschwindigkeit im Allgemeinen lokal innerhalb der Übergangsregion ändert, gilt dasselbe für den erzeugten Photonenfluss. Die optische Ausgangsleistung P A der LED ist direkt mit dem Photonenfluss am Ausgang verknüpft, da jedes Photon eine Energie ℎ𝜈 trägt: P A = ℎ𝜈𝛷A = 𝜂ex ℎ𝜈
𝑖 . 𝑒
(18.25)
Der innere Wirkungsgrad 𝜂i von LED liegt zwischen 50 % und annähernd 100 %, während der Auskopplungswirkungsgrad 𝜂A für effizient konstruierte Bauelemente
Übergang
– +
(18.22)
verknüpft, wobei der innere Wirkungsgrad 𝜂i den inneren Photonenfluss mit dem Fluss der injizierten Elektronen verknüpft und der Auskopplungswirkungsgrad 𝜂A angibt, welcher Teil des inneren Photonenflusses aus der Struktur ausgekoppelt wird. Beide Prozesse können in einer einzigen Quantenausbeute zusammengefasst werden, dem äußeren Wirkungsgrad 𝜂ex :
Übergang
Übergang
𝑖 𝑒
Abb. 18.12 Strahlungsverteilungen von flächenemittierenden LED: (a) Lambertverteilung ohne Linse; (b) Verteilung mit einer halbkugelförmigen Linse; (c) Verteilung mit einer parabolischen Linse.
593
594
18 LED und Laserdioden
bis zu 50 % betragen kann. Der äußere Wirkungsgrad 𝜂ex von LED liegt folglich normalerweise unter 50 %. Wie in Abschnitt 16.2.1 diskutiert ist der Leistungsumwandlungswirkungsgrad ein anderes Maß für die Leistung. Er ist als das Verhältnis der emittierten optischen Leistung PA zur aufgewandten elektrischen Leistung definiert, 𝜂L ≡
PA
𝑖𝑉
= 𝜂ex
ℎ𝜈 , 𝑒𝑉
Auskopplungskegel
modifizierte Emission
(18.26)
wobei 𝑉 der Spannungsabfall über das Bauelement ist. Für ℎ𝜈 ≈ 𝑒𝑉, was für viele übliche LED gilt, erhalten wir 𝜂L ≈ 𝜂ex . LED mit resonanter Kavität
Ein weiterer Ansatz zur Erhöhung der Wirkungsgrade 𝜂A und 𝜂U einer LED ist die Verwendung einer lichtemittierenden Diode mit resonanter Kavität (RCLED, engl. resonant-cavity light-emitting diode) oder Mikroresonator-LED. In ihnen grenzt ein Paar von Spiegeln (z. B. verteilte Braggreflektoren) das Licht in einer Dimension auf eine wellenlängengroße resonante Kavität ein (siehe die Abschnitte 11.1.2 und 11.4). Diese Vorgehensweise bringt eine Reihe von Vorteilen mit sich: (1) Die Rate der spontanen Emission wird aufgrund des Purcelleffekts (Abschnitt 14.3.5) vergrößert, wodurch sich der innere Wirkungsgrad 𝜂i erhöht; (2) wenn die Resonanz des Hohlraums schmalbandiger ist als das spektrale Intensitätsprofil, wird die spektrale Breite des emittierten Lichts auf Werte unterhalb von k 𝑇 reduziert; (3) die Temperaturbeständigkeit verbessert sich, weil die Kavität weniger empfindlich auf Temperaturschwankungen reagiert als die Bandlücke des Halbleiters, und (4) die Emission erfolgt in einen kleineren Raumwinkel, was sich in einer Erhöhung des Auskopplungswirkungsgrads 𝜂A niederschlägt. Wie in Abb. 18.13 dargestellt, wird ein großer Teil des Lichts in eine resonante Mode emittiert, deren Winkelausdehnung überwiegend innerhalb des Auskopplungskegels liegt (siehe Abschnitt 11.1). In eine solche Mikroresonator-LED kann noch ein photonischer Kristall integriert werden, der einen Großteil des Restlichts zur Oberfläche des Bauelements führt und so 𝜂A noch weiter vergrößert. Die erhöhten Werte von 𝜂i und 𝜂A für RCLED führen direkt zu erhöhten Werte für den äußeren Wirkungsgrad 𝜂ex = 𝜂A 𝜂i und den Gesamtwirkungsgrad 𝜂U = (ℎ𝜈∕𝑒𝑣). Allerdings liefern RCLED grundsätzlich eher geringe Leistungen, weil ihre aktiven Regionen so klein sind. Die Verwendung von Mikroresonatoren zur Verbesserung der Eigenschaften von Photonenquellen wird in Abschnitt 18.5 ausführlicher besprochen.
Quelle
Abb. 18.13 Eine LED mit einem Mikroresonator aus ebenen parallelen Spiegeln. Zwei eng beieinander liegende Reflektoren (links mit einem Reflexionsgrad von 100 % und rechts mit einem Reflexionsgrad von z. B. 50 %) bilden eine Kavität mit einer Länge in der Größenordnung einer Wellenlänge, in der das Licht eingeschlossen ist. Ein großer Teil des Lichts wird so auf ein Gebiet innerhalb des Auskopplungskegels konzentriert.
Die Ansprechempfindlichkeit
Die Ansprechempfindlichkeit ℛ einer LED ist als das Verhältnis der emittierten optischen Leistung P A zum injizierten Strom 𝑖 definiert, d. h. ℛ = PA ∕𝑖. Mit Gl. (18.25) erhalten wir ℛ=
PA
𝑖
=
ℎ𝜈 𝛷A ℎ𝜈 = 𝜂ex . 𝑖 𝑒
(18.27)
In gebräuchlichen Einheiten gilt 1.24 ℛ = 𝜂ex . W/A 𝜆0 ∕μm
(18.28)
Für 𝜆0 = 1.24 μm ist beispielsweise ℛ = 𝜂ex W∕A; wenn 𝜂ex eins wäre, wäre die maximale optische Leistung, die ein Injektionsstrom von 1 mA erzeugen könnte, gleich 1 1 1 mW. Für 𝜂ex = bei 𝜆0 = 1.24 μm folgt ℛ = mW∕mA. 2 2 Nach Gl. (18.25) ist die Ausgangsleistung P A der LED proportional zum injizierten Strom 𝑖. In der Praxis gilt diese Beziehung jedoch nur für einen begrenzten Bereich. Für das Bauelement, dessen Licht/StromCharakteristik in Abb. 18.14 gezeigt ist, ist die ausgestrahlte optische Leistung nur für Ströme unterhalb von etwa 20 mA proportional zum Injektionsstrom. In diesem Bereich hat die Ansprechempfindlichkeit einen konstanten Wert von ungefähr 0.3 mW/mA. Für größere Ströme bricht die Proportionalität aufgrund von Sättigung zusammen; die Ansprechempfindlichkeit nimmt dann mit zunehmendem Injektionsstrom ab. Da für diese LED 𝜆0 = 0.420 μm ist, liefert Gl. (18.28) für den äußeren Wirkungsgrad 𝜂ex = 0.10.
optische Ausgangsleistung
0
/ mW
18.1 Lichtemittierende Dioden (LED)
12 10 8 6 4
0.2
0.3
2 0
0
20
40 60 80 Strom i (mA)
0.6
0.7
Abb. 18.15 Spektrale Intensitäten als Funktion der Wellenlänge für LED im ultravioletten und sichtbaren Bereich. Die Maximalintensitäten sind alle auf denselben Wert normiert. Ergebnisse für LED im IR werden in Abb. 18.67 präsentiert.
100
Abb. 18.14 Optische Leistung am Ausgang einer LED als Funktion des Injektionsstroms. Diese Mehrfachquantenschicht-InGaN/GaN-LED strahlt im violetten Bereich des Spektrums bei 𝜆0 = 420 nm; die Struktur des Bauelements ist in Abb. 18.22 gezeigt.
Die spektrale Verteilung
Die spektrale Intensität r sp (𝜈) des von einem Halbleiter im Quasigleichgewicht spontan emittierten Lichts hatten wir in den Übungen 18-2 und 18-3 als Funktion der Konzentration Δn der injizierten Ladungsträger bestimmt. Diese Theorie ist auch auf die Elektrolumineszenz einer LED anwendbar, in der das Quasigleichgewicht durch Injektion eines Stroms in einen pnÜbergang erreicht wird. Bei schwachem Pumpen, wenn die Quasiferminiveaus innerhalb der Bandlücke und in einem Abstand von wenigstens einigen k 𝑇 von den Bandkanten liegen, erreicht die spektrale Intensität ihr Maximum bei der Frequenz 𝜈P = (E g + k𝑇∕2)∕ℎ (siehe Übung 18-3). Nach Gl. (18.14) und (18.15) ist die Halbwertsbreite der spektralen Intensität Δ𝜈 ≈ 1.8k 𝑇∕ℎ (bei 300 K ist Δ𝜈 = 10 THz) unabhängig von 𝜈. Wenn die Halbwertsbreite durch die Wellenlänge ausgedrückt wird, hängt sie jedoch tatsächlich von 𝜆 ab, 2
𝜆 k𝑇 Δ𝜆 ≈ 1.45 ( P ) ( ) . μm μm eV
0.4 0.5 Wellenlänge λ0 /µm
(18.29)
Die Abhängigkeit von Δ𝜆 von 𝜆P2 wird aus Abb. 18.15 deutlich, die die beobachteten spektrale Intensitäten als Funktion der Wellenlänge für eine Reihe von LED im ultravioletten und sichtbaren Bereich des Spektrums illustriert. AlN hat die größte Bandlücke aller III-Nitride und emittiert bei 210 nm, AlGaN wird meist im mittleren und nahen UV verwendet, InGaN ist das Material der Wahl im Violetten, Blauen und Grünen und AlInGaP liefert gelbes, orange oder rotes Licht. Typische spektrale Intensitäten für LED im nahen Infrarot (meist aus InGaAsP) sind in Abb. 18.67 gezeigt. Die spektrale Breite nimmt gemäß Gl. (18.29) im Wesentlichen wie 𝜆P2
zu. Für 𝜆𝑃 = 1 μm bei 𝑇 = 300 K liefert Gl. (18.29) z. B. Δ𝜆 ≈ 36 nm. Legierungsverbreiterung kann jedoch eine weitere Zunahme der spektralen Breite hervorrufen, wie z. B. in Abb. 18.15 an der Linie mit dem Maximum bei 𝜆0 = 0.52 μm offensichtlich ist. Die Antwortzeit
Die Antwortzeit von LED, die in der Beleuchtungstechnik eingesetzt werden, sind in der Regel durch die 𝑅𝐶Zeitkonstante des Bauelements beschränkt, weil die Fläche des Übergangs und daher seine Kapazität groß ist. Die Antwortzeit von LED in der optischen Nachrichtentechnik wird dagegen meist durch die Lebensdauer 𝜏 der injizierten Minoritätsladungsträger begrenzt, die für die strahlende Rekombination verantwortlich sind. Für eine hinreichend kleine Injektionsgeschwindigkeit R kann der Prozess der Injektion/Rekombination durch eine lineare Differentialgleichung erster Ordnung beschrieben werden (siehe Abschnitt 17.1.4), also durch die Antwort auf sinusförmige Signale. Experimentell kann die maximale Frequenz, mit der eine LED moduliert werden kann, durch Messung der optischen Ausgangsleistung als Reaktion auf sinusförmige elektrische Ströme unterschiedlicher Frequenzen bestimmt werden. Wenn der injizierte Strom die Form 𝑖 = 𝑖0 + 𝑖1 cos(𝛺𝑡) hat (wobei 𝑖1 so klein sein soll, dass sich die emittierte optische Leistung P linear mit dem injizierten Strom ändert), verhält sich die ausgestrahlte optische Leistung wie P = P0 + P 1 cos(𝛺𝑡 + 𝜑). Die zugehörige Übertragungsfunktion, die als H(𝛺) = (P 1 ∕𝑖1 ) exp(i𝜑) definiert ist, nimmt dann die Form H(𝛺) =
ℛ 1 + i𝛺𝜏
(18.30)
an, die für einen RC-Kreis typisch ist. Die Anstiegszeit der LED ist 𝜏, und ihre 3-dB-Bandbreite beträgt 𝐵 = 1∕2π𝜏. Eine größere Bandbreite 𝐵 lässt sich daher erreichen, indem man die Anstiegszeit 𝜏 reduziert, die gemäß der Beziehung 1∕𝜏 = 1∕𝜏s + 1∕𝜏ns Beiträge so-
595
596
18 LED und Laserdioden
+
+
Daten Steuerung
+ Eingangssignal
(a)
–
(b)
(c)
(d)
Abb. 18.16 Schaltkreise zur Ansteuerung von LED. (a) Ideale Gleichstromquelle, (b) Gleichstromquelle aus einer Spannungsquelle in Reihe mit einem Widerstand, (c) analoge Modulation des emittierten Lichts durch Transistorsteuerung
des in die LED injizierten Stroms und (d) digitale Modulation des emittierten Lichts durch Transistorschaltung des in die LED injizierten Stroms.
wohl der strahlenden Lebensdauer 𝜏s als auch der nichtstrahlenden Lebensdauer 𝜏ns enthält. Die Verkürzung von 𝜏ns geht jedoch mit einer unerwünschten Reduktion der inneren Quantenausbeute 𝜂i = 𝜏∕𝜏s einher. Es kann daher zweckmäßig sein, anstelle der Bandbreite alleine das Produkt aus der inneren Quantenausbeute und der Bandbreite zu maximieren, 𝜂i 𝐵 = 1∕2π𝜏s . Dazu muss die strahlende Lebensdauer 𝜏s reduziert werden, ohne gleichzeitig auch 𝜏ns zu verkürzen, was durch eine sorgfältige Wahl des Halbleitermaterials und des Dotierniveaus erreicht werden kann. Typische Anstiegszeiten von LED liegen im Bereich von 1 bis 50 ns entsprechend Bandbreiten von bis zu einigen hundert MHz.
nenquellen aus III-V-Materialien haben im Gegensatz zu denen aus II-VI-Legierungen auch lange Lebensdauern. Im Jahr 1962 war GaAs das erste derartige Material, aus dem LED und Laserdioden hergestellt wurden. Die heutige LED-Industrie beruht fast ausschließlich auf ternären und quaternären III-V-Systemen, insbesondere InGaAsP, AlInGaP und AlInGaN (Abb. 18.17). Diese III-V-Systeme erzeugen sehr helles Licht über einen Spektralbereich von Infrarot bis ins Ultraviolett (siehe Abb. 18.15, 18.18 und 18.67). LED können in oberflächen- oder kantenemittierenden Konstruktionen realisiert werden (Abb. 18.19). Eine oberflächenemittierende LED emittiert Licht aus einer Fläche des Bauelements, die parallel zur Ebene der aktiven Region ist. Kantenemittierende LED emittieren aus der Kante der aktiven Region. Als Nächstens wollen wir eine kurze Beschreibung der wichtigsten III-V-Materialien geben und schematische Abbildungen einiger typischer LED-Strukturen zeigen. Dieselben Verbindungen werden auch in optischen Halbleiterverstärkern, Laserdioden, quantenbegrenzten Lasern, Mikro- und Nanoresonatorlasern eingesetzt (siehe Abschnitt 18.2–18.6). Gleichzeitig werden wir eine Reihe von interessanten Anwendungen für LED im sichtbarem infraroten und ultravioletten Spektralbereich vorstellen.
Elektronische Schaltkreise
Ein LED wird gewöhnlich von einer Stromquelle angesteuert, wie Abb. 18.16(a) schematisch zeigt, die wie in Abb. 18.16(b) oft mithilfe einer Spannungsquelle in Reihe mit einem Widerstand realisiert wird. Das emittierte Licht kann durch Modulation des injizierten Stroms einfach moduliert werden. Abbildung 18.16(c) bzw. (c) zeigen die analoge und digitale Modulation. Die Leistung des Systems kann durch elektrische Schaltkreise verbessert werden, die die Spannung regulieren, die Impedanzen anpassen und den Maximalstrom mithilfe einer nichtlinearen Kompensation begrenzen. Fluktuationen der Intensität des emittierten Lichts können durch Überwachung mit einem Photodetektor stabilisiert werden, dessen Ausgang als Rückkopplungssignal zur Kontrolle des Injektionsstroms verwendet wird.
18.1.3
Materialien und Aufbau von Bauelementen
In den 1950er Jahren wurde die Photonik durch die Herstellung von binären einkristallinen III-V-Halbleitern revolutioniert, die in der Natur nicht vorkommen. Viele dieser Legierungen haben direkte Bandlücken und besitzen daher große innere Quantenausbeuten. Photo-
GaAs
GaAs war das erste III-V-Material, das eine wichtige Rolle in der Photonik spielte. Dieser binäre Halbleiter mit direkter Bandlücke wurde 1961 zur Herstellung der ersten Laserdiode mit einer Emissionswellenlänge 𝜆0 = 0.890 μm nahe der Wellenlänge seiner Bandlücke (𝜆g = 0.873 μm) verwendet. Bald darauf wurden durch Gasund Flüssigphasenepitaxie mehrere andere binäre III-VHalbleiter mit direkter Bandlücke hergestellt, die nahe der Wellenlänge ihrer Bandlücken (siehe Tabelle 17.2) Elektrolumineszenz zeigen: GaSb (𝜆g = 1.70 μm), InP
18.1 Lichtemittierende Dioden (LED)
10 5
2
3
1.5
1.0 0.9 0.8 0.7
0.6
0.5
0.4
597
0.2 λ g (µm)
0.3
Al x In y Ga 1-x-yN InN
AlN GaN
AlN
InN In1-x Ga x As1-yPy GaP
InAs
AlP
InP InP
GaP
GaAs
GaP AlAs
GaAs InAs
GaAs GaSb
GaAs
Ge 0
0.5
Si 1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
g (eV)
Abb. 18.17 Energien und Wellenlängen der Bandlücke für ausgewählte Element- und binäre, ternäre und quaternäre III-VHalbleiter. Von oben nach unten sind AlInGaN, AlGaN, InGaN, InGaAsP, AlInGaP, InGaP, GaAsP, AlGaAs, InGaAs und GaAsSb dargestellt. Die schattierten Bereiche zeigen Zusammensetzungen mit direkter Bandlücke an. Abb. 18.18 Verkehrsampel auf der Basis von III-V-Materialien.
(a)
(b)
Abb. 18.19 (a) Oberflächenemittierende LED. (b) Kantenemittierende LED.
(𝜆g = 0.919 μm), InAs (𝜆g = 3.44 μm) und InSb (𝜆g = 7.29 μm). GaAsP
Die Bandlückenwellenlänge des ternären Halbleiters GaAs1−𝑥 P𝑥 verschiebt sich mit steigendem Anteil von Phosphor ins Sichtbare und bewirkt eine Emission im
roten Gebiet des Spektrums [siehe Abb. 18.17(a)]. Obwohl die zunächst direkte Bandlücke mit abnehmender Wellenlänge schließlich indirekt wird, kann durch Verwendung von stickstoffdotierten Varianten (GaAsP:N und GaP:N) auch eine Emission im Orange, Gelben und Grünen erreicht werden. Der Stickstoff (oft werden auch Zink und Sauerstoff als Dotiersubstanzen verwendet) wird an scharf lokalisierten Orten in das Material eingebaut, sodass er in der Lage ist, die Impulsänderungen im Verlauf indirekter Übergänge aufzunehmen. Die äußeren Wirkungsgrade von GaAsP-LED sind jedoch in der Regel klein (< 1 %); zum Teil wegen der unterschiedlichen Gitterkonstanten des GaAs-Substrats. LED aus GaAs, GaAsP, GaAsP:N und GaP:N sind jedoch billig herzustellen und werden daher für Anwendungen mit geringen Anforderungen an die Helligkeit wie z. B. Fernbedienungen oder Signallämpchen weiterhin zum Einsatz kommen.
598
18 LED und Laserdioden
InGaAs
Hinzufügen von Indium zu GaAs hat den gegenteiligen Effekt wie das Hinzufügen von Phosphor – es erhöht die Wellenlänge der Bandlücke, bis sie schließlich den Wert von InAs erreicht. Der ternäre Halbleiter InGaAs ist ein Material mit direkter Bandlücke, das an das Gitter eines InP-Substrats angepasst werden kann. Seine Bandlücke ist über die Zusammensetzung vom nahen bis ins mittlere Infrarot abstimmbar: von 0.873 μm für GaAs bis 3.44 μm für InAs (Abb. 18.17). Aus InGaAs gefertigte LED werden häufig in Alltagsprodukten eingesetzt. InGaAs-Laserdiodenarrays mit verspannten Schichten werden verwendet, um Yb3+ -dotierte Festkörperlaser oder Quarzglas-Faserlaser bei 𝜆0 = 940 nm sowie Er3+:Quarzglas-Faserlaser und -Verstärker bei 𝜆0 = 980 nm zu pumpen (Abschnitt 16.3.1 und 16.3.2). InGaAs-Laserdiodenarrays werden auch zum Intrabandpumpen von Nd3+:YVO4 -Festkörperlasern bei 914 nm verwendet (Abschnitt 16.3.1). Im Bereich der Photodetektoren wird InGaAs häufig zur Herstellung von pin-Detektoren und Lawinenphotodioden zur Verwendung in optischen Faserkommunikationssystemen verwendet, die im Telekommunikationsband von 1.3 bis 1.6 μm arbeiten (Beispiel 19-5 und Abschnitt 25.1.4). InGaAsP
Der quaternäre Halbleiter InGaAs1−𝑦 P𝑦 ist eine vielseitige Legierung, die im nahen Infrarot verwendet wird. Ihre Bandlücke ist über einen großen Bereich von Wellenlängen [0.549 μm (GaP) ≤ 𝜆g ≤ 3.44 μm (InAs)] abstimmbar und seine Gitterkonstante stimmt mit der eines InP-Substrats überein, sofern die Parameter 𝑥 und 𝑦 geeignet gewählt werden [siehe die gepunktete Fläche in Abb. 17.11(a)]. Eine direkte Bandlücke liegt jedoch nur in einem Teil dieses Bereichs vor. Arrays aus InGaAsP-Laserdioden werden häufig zum Intrabandpumpen von Er3+:Quarzglas-Faserverstärkern und -lasern bei 1480 nm verwendet (Abschnitt 15.3.3 und 16.3.2). Anwendungen von LED und Laserdioden im Infraroten
InGaAsP wird in LED für Kurzstrecken-Kommunikationssysteme mit moderaten Übertragungsgeschwindigkeiten im Bereich um 𝜆0 = 1330 nm eingesetzt (siehe Abb. 18.20). Langstrecken-Nachrichtensysteme mit hohen Übertragungsraten werden in der Regel um 𝜆0 = 1550 nm betrieben und verwenden Laserdioden anstelle von LED, da das gebündelte Licht einer Laserdiode leicht in eine Einmodenfaser eingekoppelt werden kann (siehe Abschnitt 25.1.2).
aktive Region InGaAsP
InPSubstrat
+ dielektrische Schicht InGaAsPKontaktschicht
−
InPEingrenzungsschichten
Abb. 18.20 Oberflächenemittierende Saul-Lee-Burrus-LED aus InGaAsP für den Einsatz in optischen Nachrichtensystemen bei 1.3 μ m. Die aktive Region besitzt dieselbe Gitterkonstante wie das InP-Substrat; das Bauelement wird umgekehrt montiert (Flip-Chip-Montage), das Licht tritt durch das Substrat aus. Eine integrierte Linse bündelt das Licht für die Einkopplung in eine Faser.
InGaAsSb
Die Wellenlänge der Bandlücke kann weiter erhöht werden, indem der Phosphor in InGaAsP durch Antimon ersetzt wird, wodurch der quaternäre Halbleiter InGaAsSb entsteht. Auf GaSb-Substraten aufgebracht kann diese über die Zusammensetzung abstimmbare Legierung zur Herstellung von Bauelementen wie Quantenschichtlasern für das mittlere Infrarot (2 ≤ 𝜆0 ≤ 4 μm) verwendet werden. Inzwischen wurden III-Sb-Emitter jedoch weitgehend durch Quantenkaskadenlaser für das mittlere Infrarot (Abschnitt 18.4.4) verdrängt, die ihnen im Allgemeinen überlegen sind. AlGaAs
Ebenso wie die Beimischung von Phosphor zu GaAs dessen Bandlücke vergrößert, ist dies auch durch eine Beimischung von Aluminium möglich. Wie GaAs1−𝑥 P𝑥 kann auch die ternäre Legierung AlGaAs über die Zusammensetzung im Roten und nahen Infrarot abgestimmt werden (AlGaAs hat eine direkte Bandlücke im Bereich 630 nm ≤ 𝜆g ≤ 900 nm, wie Abb. 18.7 zeigt). Im Gegensatz zu GaAsP hat sie jedoch den Vorteil, dass ihre Gitterkonstante für alle Molenbrüche von Aluminium mit der von GaAs übereinstimmt [siehe Abb. 17.11(a)], sodass die Substanz als intensive Photonenquelle im Roten eingesetzt werden kann. Da Mehrfachquantenschichtstrukturen aus AlGaAs∕GaAs häufig ungleichförmige Ladungsträgerverteilungen in der aktiven Region besitzen, werden die entsprechenden LED oft als Doppelheterostruktur der Form AlGaAs∕AlGaAs ausgeführt, in der sich die Zusammensetzungen verschie-
18.1 Lichtemittierende Dioden (LED)
denen Schichten unterscheiden. Zum Intrabandpumpen der außerordentlich starken Nd3+:Quarzglas-Laserverstärker in dem HAPLS-Lasersystem werden Stapel aus AlGaAs-Laserdioden mit einer Emission bei 888 nm zu Arrays kombiniert (Beispiel 23-3). Bei 793 nm emittierende AlGaAs-Laserdiodenarrays werden auch eingesetzt, um Tm3+:Quarzglas-Faserlaser zu pumpen (Abschnitt 16.3.2).
aktive Region AlInGaP/InGaP-MQW
GaAsKontaktschicht
+
−
AlInGaP
Der quaternäre Halbleiter (AlGa)𝑦 InP ist über einen großen Bereich des nahen Infrarot und der langwelligen Ausläufer des Sichtbaren ein Material mit direkter Bandlücke (Abb. 17.11). Für Zusammensetzungen im Bereich (AlGa)0.5 In0.5 P besitzt das Gitter dieselbe Gitterkonstante wie GaAs. Die Quantenausbeute kann durch Verwendung von wafermontierten transparenten GaP-Substraten anstelle von GaAs, aktiven Regionen aus Mehrfachquantenschichten oder Resonatoren erhöht werden, die geringere Bandbreiten und gerichtete Emission ermöglichen.
GaAsSubstrat
AlAs/AlGaAsBraggreflektoren
AlInGaP Eingrenzungsschichten
Abb. 18.21 Oberflächenemittierende Mehrfachquantenschicht-Resonator-LED aus AlInGaP/InGaP (650 nm) zum Einsatz in optischen Kurzstrecken-Nachrichtensystemen. Die gewählte Anordnung emittiert nach oben, da das verwendete GaAs-Substrat opak ist. Die verteilten Braggreflektoren bestehen aus AlAs/AlGaAs-Schichten, deren Aluminiumgehalt so groß ist, dass sie bei 650 nm transparent sind. Eine Linse verbessert die Einkopplung des Lichts in eine Faser.
Anwendungen von LED im Sichtbaren
Das menschliche Auge besitzt ein Maximum der Empfindlichkeit der 555 nm im gelbgrünen Bereich des Spektrums (Abschnitt 18.1.6). Aus diesem Grund ist AlInGaP das ideale Material für Anwendungen wie z. B. Verkehrsampeln, bei denen es auf hohe Helligkeit im Roten, Orange, Gelborange und Gelben ankommt. AlInGaP/ InGaP-LED werden gelegentlich in optischen Nachrichtensystemen auf der Basis von Polymerfasern verwendet, die im Bereich von 600 bis 650 nm betrieben werden (siehe Abb. 18.21). In0.5 Ga0.5 P hat eine Bandlücke von 650 nm, die für Anwendungen wie rote Laserpointer verwendet wird. GaN
GaN ist ein binärer Halbleiter mit einer direkten Bandlücke entsprechend 𝜆g = 0.366 μm im nahen UV. Es kann durch MBE, MOCVD oder HVPE abgeschieden werden. Galliumnitrid ist der Stammvater der wichtigen ternären und quaternären Verbindungen InGaN, AlGaN und AlInGaN, genau wie Galliumarsenid als Stammvater der Familie InGaAs, AlGaAs und InGaAsP anzusehen ist. Diese Materialien werden meist auf Saphir- oder Siliciumsubstraten abgeschieden, die jedoch andere Gitterkonstanten haben. Im Gegensatz zu den Arseniden und Phosphiden tolerieren die Nitride der Gruppe III jedoch eine große Konzentration von Versetzungen, sodass die falsche Gitterkonstante keine große Bedeutung besitzt.
InGaN
Der ternäre Halbleiter InGaN ist ein Material mit einer direkten Bandlücke entsprechend 366 nm (GaN) ≤ 𝜆g ≤ 1.61 μm (InN). InGaN ist das Material der Wahl für LED mit hoher Helligkeit im Wellenlängenbereich von 366 bis 580 nm, also im nahen UV und den violetten, blauen und grünen Regionen des Spektrums (Abb. 18.7). Es ergänzt somit AlInGaP, das die roten, orange und gelben Bereiche abdeckt. Wie bei AlInGaP kann die Quantenausbeute durch Verwendung von MQW-Strukturen aus GaN/InGaN erhöht werden, wie Abb. 18.22 illustriert. Das Substrat ist gewöhnlich GaN auf Saphir. Die Zahl der Quantenschichten ist in der Regel begrenzt, weil es wegen der Diffusionslänge der Löcher schwierig ist, sie angemessen zu besetzen; niedrige und/oder dünne Barrieren sind daher zu bevorzugen. Die Leistung des Systems kann auch durch Resonatoren erhöht werden. Andere interessante Varianten sind Anordnungen von selbstorganisierenden Quantenpunkten oder Quantenstäbe. AlGaN
Al𝑥 GaN ist ebenfalls ein ternärer III-Nitrid-Halbleiter mit direkter Bandlücke, die jedoch zwischen 206 nm (AlN) und 366 nm (GaN) liegt (Abb. 18.7), also das mittlere und nahe UV abdeckt (200 nm ≤ 𝜆0 ≤ 390 nm). LED aus AlGaN/AlGaN-Heterostrukturen konnten über den gesamten Bereich dieser Wellenlängen hergestellt werden, obwohl es bei kleineren Wellenlängen immer
599
GaN
AlGaN
GaN
InGaN GaN InGaN GaN InGaN GaN InGaN
–
GaN
GaN/InGaN MQW aktive Region
AlGaN
18 LED und Laserdioden
GaN
600
A1GaNEingrenzungsschichten
+
GaNKontaktschichten
Saphirsubstrat
Abb. 18.22 Oberflächenemittierende MQW-LED aus GaN/InGaN in Flip-Chip-Anordnung, die bei 𝜆0 = 420 nm im violetten Spektralbereich betrieben wird. Das Licht wird durch das bei dieser Wellenlänge transparente GaN-SaphirSubstrat ausgekoppelt, dessen Oberfläche mit einer An-
ordnung von winzigen Pyramiden strukturiert ist, um den Auskopplungswirkungsgrad zu erhöhen. Die aktive Region besteht aus GaN-Barrieren von 5 nm Dicke und vier InGaNSchichten von 2.5 nm Dicke.
schwieriger wird, einen hohen Wirkungsgrad zu erzielen. Wie bei InGaN kann die Quantenausbeute der LED durch Verwendung von Doppelheterostrukturen, Quantenschicht- oder Mehrfachquantenschichtstrukturen der Form AlGaN∕AlGaN gesteigert werden. AlN oder Schablonen aus AlGaN/AlN/Saphir dienen als transparente Substrate mit passender Gitterkonstante für UV-Emitter auf AlGaN-Basis. Auch LED aus AlN mit einer Emission bei 210 nm wurden hergestellt. Wegen ihrer großen Bandlücken und guten Wärmeleitfähigkeiten werden Gruppe-III-Nitride auch in spezialisierten elektronischen Bauelementen wie Hochtemperaturund Leistungstransistoren eingesetzt.
ultravioletten Teil des Spektrums geeignet sind. Der quaternäre Halbleiter (AlInGaN) bietet noch den Vorteil, dass seine Gitterkonstante durch geeignete Wahl von 𝑥 und 𝑦 an die von GaN angepasst werden kann [Abb. 17.11(b)], wodurch die Quantenausbeute vergrößert wird. Diese Anpassung des Gitters entspricht der von AlInGaP an GaAs oder von InGaAsP an InP. AlInGaN-LED mit einem an ein GaN-Substrat angepassten Gitter werden von 366 nm (der Wellenlänge von GaN) bis ungefähr 250 nm (der Wellenlänge von AlInN mit einem an GaN angepassten Gitter) eingesetzt. Als aktive Regionen dienen Quantenschichten aus AlInGaN/InGaN/AlInGaN; AlInGaN kann als transparente Kontaktschicht verwendet werden.
Anwendungen von LED im Ultravioletten
Im UV-A-Band (315 nm ≤ 𝜆0 ≤ 400 nm) betriebene UVLED werden in Anwendungen im Druckwesen, zum Härten von Kunststoffen und dem Nachweis von Fälschungen eingesetzt. Im UV-C-Band (100 nm ≤ 𝜆0 ≤ 280 nm) emittierende LED sind zum Sterilisieren, zur Wasserbehandlung und zur Abtötung von Keimen geeignet. Sie helfen auch beim Nachweis von chemischen und biologischen Substanzen, von denen viele fluoreszieren, wenn sie bei bestimmten Wellenlängen mit UVLicht bestrahlt werden, und werden für verdeckte Kommunikationsstrecken ohne Sichtverbindung eingesetzt. AlInGaN
Aus dem Vorstehenden ist offensichtlich, dass die ternären Gruppe-III-Nitride InGaN und AlGaN zur Herstellung von Lichtquellen im gesamten sichtbaren und
18.1.4
Siliciumphotonik
Silicium ist aus einer ganzen Reihe von Gründen seit langem das führende Material für die integrierte Elektronik: Es ist (1) billig und in großen Mengen verfügbar, (2) einfach in reiner Form und großen Einheiten herstellbar, (3) einfach dotierbar, oxidierbar und manipulierbar, (4) bis zu hohen Temperaturen stabil und (5) mit der CMOS-Technologie kompatibel. Seine Allgegenwart, Verfügbarkeit und Eigenschaften machen es auch zu einer interessanten Grundlage für die integrierte Photonik. Der große Unterschied der Brechungsindizes von Silicium und seiner Oxide ermöglicht eine starke optische Eingrenzung in einem kompakten Volumen. Dies kombiniert mit seiner Transparenz im Telekommunikationsband zwischen 1.3 und
18.1 Lichtemittierende Dioden (LED)
1.6 μm und seiner CMOS-Kompatibilität macht es zu einem attraktiven Material für Anwendungen wie optische Wellenleiter, Filter, Splitter, Multiplexer, Demultiplexer, Wellenlängenwandler und weitere Bauelemente (Abschnitt 25.1.5). Eine bemerkenswerte Ausnahme von diesen positiven Perspektiven betrifft die Verwendung von Silicium als aktives Medium in LED und Laserdioden. Die Entwicklung von Lichtquellen auf der Grundlage von Si wird durch die indirekte Bandlücke von Si behindert, die seine Fähigkeit einschränkt, durch Interbandübergänge effizient Licht zu erzeugen (Abb. 17.41). Im Laufe der Jahre wurden umfangreiche Anstrengungen unternommen, diese Hürde zu überwinden, indem man versuchte, die indirekte Bandlücke von Si entweder zu reduzieren oder ganz zu eliminieren. Anfangs versuchte man, Alternativen zu kristallinem Silicium zu verwenden, beispielsweise poröses Silicium (in dem Nanoporen die Diamantstruktur durchdringen), Silicium-Nanokristalle, -Übergitter und -Quantenpunkte (Beispiel 173) oder Er3+ -dotierte Silicium-Wirtsgitter und -Übergitter. Keiner dieser Ansätze war jedoch sonderlich erfolgreich. Fortschritte wurden hingegen erzielt, indem man auf andere Mechanismen als Interbandübergänge zur Erzeugung von Strahlung auswich. So beruht der Silicium-Ramanlaser auf induzierter Ramanstreuung und ist daher von der Art der Bandlücke unabhängig (Beispiel 16-4). Allerdings müssen Ramanlaser optisch gepumpt werden (nicht elektrisch), was ihre Attraktivität für viele Anwendungen reduziert. Trotzdem wurden Silicium-Ramanlaser erfolgreich mit Emittern mit direkter Bandlücke wie z. B. InP als optische Pumpe kombiniert. In den letzten Jahren wurden erhebliche Fortschritte bei der Realisierung von On-Chip-Lichtquellen auf Siliciumbasis zur Verwendung in integrierten photonischen Schaltkreisen erzielt. Hierzu werden derzeit drei Ansätze mit jeweils eigenen Vor- und Nachteilen verwendet: 1) Die Flip-Chip-Integration oder direkte Integration von III-V-Laserdioden in eine separat gefertigte Siliciumbasis, häufig mit optischer Stoßkopplung. Dieser Ansatz, bei dem Lötbumps verwendet werden, ist im Prinzip einfach, erfordert aber eine präzise Ausrichtung im Submikrometerbereich und ist daher nicht auf große Waferserien oder komplexe Laserdesigns anwendbar. 2) Die heterogene Integration von III-V-Lasern in vorstrukturierte Siliciumschaltkreise, typischerweise durch Waferbonden und mit evaneszent-optischer Kopplung, um Einschränkungen aufgrund unter-
schiedlicher Gitterkonstanten zu umgehen. Dieser Ansatz ist nicht mit der hochreinen CMOS-Technologie kompatibel. Er ist jedoch für eine ganze Reihe von Materialien geeignet und kann die Photonenspeicherung über Hybridmoden auf die undotierte Siliciumbasis (mit ihrem geringen Verlust und hohem Gütefaktor) verlagern, was die Herstellung von modengekoppelten Laser mit schmalen Linien und dichten Frequenzkämmen erleichtert. 3) Die direkte heteroepitaktische Abscheidung von IIIV-Lasern auf Si-Substraten unter Verwendung von Zwischenschichten, um die Zahl der Versetzungen im Bereich der Lichtemission zu minimieren. Dieser Ansatz hat mit den großen Unterschieden der Gitterkonstanten und Wärmeausdehungen zwischen Si und den III-V-Materialien zu kämpfen, die Versetzungen erzeugen und den Wirkungsgrad verringern, weil sie als Zentren für die nichtstrahlende Rekombination wirken. Man kann dies durch Verwendung von Quantenpunktemittern anstelle von Quantenschichtemittern weitgehend ausgleichen, da Quantenpunkte weniger empfindlich gegenüber den von den Differenzen der Gitterkonstanten und thermischen Ausdehnungen hervorgerufenen Fadenversetzungen und generell auch wesentlich unempfindlicher gegenüber Temperaturänderungen sind. Unter dem Strich scheint gegenwärtig die direkte Heteroepitaxie die attraktivste Alternative für die kostengünstige Herstellung von On-Chip-Lichtquellen auf Siliciumbasis in großem Maßstab zu sein. Es sollte noch erwähnt werden, dass die Photonik der Gruppe IV auch über Kombinationen und Legierungen von Halbleitern mit indirekter Bandlücke wie Si, Ge, Sn und C einen Weg zur Entwicklung von On-Chip-Lichtquellen bietet. Hier sind vor allem Strukturen auf der Basis von Germanium wegweisend, obwohl noch erhebliche Herausforderungen zu überwinden sind (siehe z. B. Beispiel 17-2 und Abschnitt 18.5.2). Interessanterweise ist die Verwendung solcher Materialien nicht neu: Die erste LED aus dem Jahr 1907 war eine in Durchlassrichtung gepolte SiC-Schottkydiode.
18.1.5 Organische LED Organische LED können aus kleinen organischen Molekülen oder konjugierten Polymerketten hergestellt werden (siehe Abschnitt 17.1.2). Organische LED aus kleinen Molekülen, die sogenannten OLED, sind effiziente elektrolumineszente Bauelemente im roten, grünen und blauen Spektralbereich. In ihnen befinden sich zwei dünne (≈ 100 nm) organische Halbleiterschichten im
601
602
18 LED und Laserdioden
n-dotierte Transportschicht
Kathode Anode
n-dotierte Transportschicht
Kathode
Anode
Glassubstrat
p-dotierte Transportschicht
Glassubstrat
(a)
p-dotierte Transportschicht (b)
Abb. 18.23 OLED-Strukturen. (a) Eine horizontale Anordnung von blauen, grünen und roten Emittern erfordert eine Strukturierung der Oberfläche, kann aber abstimmbare Farben liefern. (b) Ein vertikaler Stapel. Meist werden Calciumund Indium-/Zinnoxid als Kathoden- bzw. Anodenmaterialien verwendet. Die an dem organischen Heteroübergang emittierte Excitonen-Rekombinationsstrahlung tritt durch die transparente Anode und das Glassubstrat aus. Als orga-
nische Halbleiter in OLED werden z. B. Triphenyldiaminverbindungen und Aluminiumtris(8-hydroxychinon) eingesetzt. In die aktiven Regionen können lumineszierende Dotiersubstanzen eingebracht werden, um die innere Quantenausbeute zu erhöhen und weißes Licht zu liefern. Manchmal wird der horizontalen Anordnung auch noch ein weißes Element hinzugefügt, um die Farbwiedergabe zu verbessern.
Kontakt und bilden eine organische Heterostruktur. Wie Abb. 18.23 zeigt, befindet sich diese Struktur zwischen zwei anorganischen Elektroden – einer Anode, die Löcher, und einer oder mehrerer Kathoden, die Elektronen injizieren. Der Prozess der Ladungsträgerinjektion unterscheidet sich somit von dem in anorganischen LED, der auf stark dotierten kristallinen Materialien und einer in Vorwärtsrichtung angelegten Spannung beruht. Die injizierten Ladungsträger werden zum Heteroübergang (der aktiven Region) transportiert und bilden gebundene Excitonen, die durch Rekombination spontane Emission erzeugen. Unterschiedliche Materialien in dem Heteroübergang erzeugen unterschiedliche Wellenlängen der Rekombinationsstrahlung, sodass durch Kombination mehrerer Heterostrukturen auf einem Substrat auch vielfarbige OLED hergestellt werden können. Derartige Heterostrukturen können in einer horizontalen Streifenanordnung hergestellt werden, die auch als horizontaler Stapel bezeichnet wird deren Emission farblich abgestimmt werden kann [Abb. 18.23(a)]. Alternativ können die Schichten auch übereinander angelegt werden, mit einem blauen Emitter ganz unten, einem grünen in der Mitte und einem roten oben, wie Abb. 18.23(b) zeigt. Diese Anordnung wird als vertikaler Stapel bezeichnet. Die weißen OLED (WOLED) in weißen Flächenstrahlern werden in der Regel als vertikale Stapel realisiert. Die Energieniveaus gebundener Excitonen in organischen Materialien ähneln denen von Elektronen in Farbstoffmolekülen; es kann sich wie in Abb. 14.8 dargestellt sowohl um Singulett- (S) als auch um Triplettzustände handeln. In einem Singulettzustand ist der Elektronenspin antiparallel zu dem des restlichen Moleküls, was zu einer Gesamt-Spindrehimpulsquantenzahl 𝒮 = 0
und einer Spinmultiplizität von 2𝒮 + 1 = 1 führt, wie in den Abschnitten 14.1.1 und 14.1.3 erläutert. In einem Triplettzustand ist der Elektronenspin dagegen parallel zu dem des restlichen Moleküls, was zu 𝒮 = 1 und 2𝒮 + 1 = 3 führt. Die Spinmultiplizität des Triplettzustands beträgt somit das dreifache der Multiplizität des Singulettzustands, daher die Bezeichnung. Wie in Abschnitt 14.5.1 erläutert wurde, sind strahlende Übergänge spinerlaubt, wenn sie zwischen zwei Zuständen derselben Multiplizität stattfinden (S → S oder T → T). In diesem Fall wird die Lumineszenz als Fluoreszenz bezeichnet. Die Lumineszenz von spinverbotenen Übergängen (z. B. T → S) wird im Gegensatz dazu Phosphoreszenz genannt. Die Lebensdauern von phosphoreszierenden Übergängen sind gewöhnlich weitaus länger als die von fluoreszierenden Übergängen (ms im Vergleich zu ns), da erstere verboten sind. Die Grundzustände der meisten organischen Verbindungen sind Singulettzustände, sodass der strahlende Zerfall von Singulettexcitonen stark begünstigt ist. Die strahlende Rekombination von Triplettexcitonen kann jedoch unterstützt werden, indem man Fluorophore in die aktive Region eines Bauelements einbringt, die an die organischen Moleküle oder konjugierten Polymerketten in der Heterostruktur binden. Triplettexcitonen können ihre Energie dann effizient auf das Fluorophor und gleichzeitig ihren Spindrehimpuls auf das organische Molekül oder Polymer übertragen, an das sie gebunden sind. Aufgrund der Multiplizität des Triplettzustands erhöht sich die interne Quanteneffizienz des Bauelements dadurch um den Faktor vier. Dieser Ansatz bietet außerdem die Möglichkeit, die Farbe des emittierten Lichts durch die Wahl der Fluorophore und nicht durch die anregenden Excitonen festzulegen.
18.1 Lichtemittierende Dioden (LED)
Polymer-LED, sogenannte PLED, ähneln im Aufbau den OLED, nur dass sie in der Regel eine n-dotierte aktive Region enthalten, in die aus einer p-dotierten organischen Schicht Löcher injiziert werden. Häufig bestehen PLED aus Poly(p-phenylen vinylen) (PPV) und Polyfluoren. Die Farbe des von ihnen emittierten Lichts kann durch Substitution der Polymerkette mit geeigneten Seitenketten modifiziert werden. Sie sind im Allgemeinen billiger herzustellen als OLED, haben aber kleinere Wirkungsgrade und eine kürzere Lebensdauer. Die positiven Eigenschaften von OLED auf der Basis kleiner Moleküle und PLED aus polymeren Molekülen sind in den sogenannten phosphoreszierenden Dendrimeren vereint. Das sind große mehr oder weniger kugelförmige Moleküle mit einem Schwermetallion im Kern, beispielsweise Ir(2-Phenylpyridin)3 , das die strahlende Rekombination der Triplettexcitonen durch Spin-BahnKopplung erleichtert. Um das Metallion sind Schichten von verzweigten Ringstrukturen angeordnet. Alternativ können hohe Wirkungsgrade auch durch Einsatz von Emittern auf der Basis thermisch aktivierter verzögerter Fluoreszenz (TADF, von engl. thermally activated delayed fluorescence) erreicht werden. In ihnen ist die Energiedifferenz zwischen angeregten Singulettund Triplettzuständen (S1 bzw. T1 ) so klein, dass Übergänge in den Singulettzustand thermisch angeregt werden können.
18.1.6 LED-Beleuchtungen Nur etwa 5 % der von einer normalen Glühlampe abgestrahlten optischen Leistung wird in Form von sichtbarem Licht abgestrahlt; die restlichen 95 % werden im Infrarot als Wärme abgegeben. Leuchtdioden sind im Gegensatz zu Glühlampen sehr effizient und vielseitig und haben eine lange Lebensdauer. Die in den Abschnitten 18.1.3 und 18.1.4 beschriebenen LED und OLED werden inzwischen in großem Umfang als Wohn-, Außen-, Auto- oder Straßenbeleuchtung eingesetzt. Das von LED abgestrahlte Licht kann dynamisch gesteuert werden und bei ausgezeichneter Farbqualität ganz unterschiedliche Farben annehmen (einschließlich Weiß). LED-Beleuchtung wird auch als solid-state lighting oder Festkörperbeleuchtung bezeichnet. Das menschliche Sehen ist so aufgebaut, dass die Kombination von Licht aus einer kleinen Zahl von geschickt ausgewählten LED trotz ihrer jeweiligen engen spektralen Profile dem Betrachter dennoch weiß erscheinen kann. Derartiges Licht wird als metameres Weißlicht bezeichnet und kann sogar von einer einzelnen LED erzeugt werden, wenn sie mit einem photolumineszierenden Leuchtstoff ausgestattet ist. Bevor
wir die Merkmale der LED-Beleuchtung im einzelnen betrachten, ist es jedoch zweckmäßig, einige der dabei verwendeten Maße und Einheiten darzulegen. Anschließend folgen kurze Erläuterungen zu Single-Die(diskreten) LED, weißen LED, LED-Arrays, Chip-onBoard-LED, nachrüstbaren LED-Lampen und weißen OLED-Flächenleuchten. Maße und Einheiten
In den bisherigen Kapiteln haben wir uns ausschließlich auf radiometrische Maßeinheiten konzentriert, die die Stärke einer Lichtquelle im Hinblick auf ihre physikalischen Eigenschaften charakterisieren. Photometrische Einheiten hingegen charakterisieren eine Lichtquelle hinsichtlich ihrer Fähigkeit, eine bestimmte Wirkung im visuellen System des Menschen hervorzurufen. Für die LED-Beleuchtung sind sowohl radiometrische als auch photometrische Einheiten wichtig. Beispiele für radiometrische Einheiten sind der Strahlungsfluss P oder die optische Leistung (W = Watt) und die Bestrahlungsstärke 𝐼, auch als Intensität bezeichnet (W∕m2 ). Die entsprechenden photometrischen Einheiten sind der Lichtstrom P v (lm = Lumen) und die Beleuchtungsstärke 𝑀v (lm∕m2 oder lx = Lux). Photometrische Größen werden oft mit einem Index „v“ (für „visuell“) gekennzeichnet, um ihre Verbindung mit dem Sehen anzuzeigen. Der Lichtstrom P v ist ein Maß für die vom Auge wahrgenommene Helligkeit einer Lichtquelle. Aus historischen Gründen ist das Lumen so definiert, dass 683 lm einer optischen Leistung von 1 W bei 555 nm entsprechen, der Wellenlänge der maximalen Empfindlichkeit des menschlichen Auges für das Tagsehen (photoptische Sehen). Die (relative) Hellempfindlichkeitskurve 𝑉(𝜆0 ) (auch als V-Lambda-Kurve oder spektraler Hellempfindlichkeitsgrad bezeichnet), die bei 𝜆0 = 555 nm einen Wert von eins hat, gibt die relative Empfindlichkeit des Auges über den Bereich der sichtbaren Wellenlängen (von 380 bis 780 nm) an. Die Lichtausbeute 𝜂v , auch als Gesamtlichtausbeute bezeichnet, ist das am häufigsten verwendete Effizienzmaß für LED-Leuchtmittel. Sie ist definiert als das Verhältnis des erzeugten Lichtstroms (lm) zu der von dem Gerät aufgenommenen elektrischen Leistung (W) und hat daher die Einheit lm/W: 𝜂v =
Pv
. (18.31) 𝑖𝑉 Die elektrische Leistung 𝑖𝑉 ist das Produkt aus dem angelegten Strom und der angelegten Spannung. Bei idealer Umwandlung der aufgenommenen elektrischen in sichtbares Licht hätte eine LED eine Lichtausbeute von 683 lm∕W aufweisen; diesen Wert kann sie nur errei-
603
604
18 LED und Laserdioden
chen, wenn sie einen Leistungsumwandlungswirkungsgrad von 𝜂U = 1 besitzt [siehe Gl. (18.30)] und monochromatisches gelbgrünes Licht bei einer Wellenlänge von 555 nm emittiert. Da metameres weißes Licht aus einem breiteren Spektrum als nur einer einzelnen Komponente bei 555 nm besteht und die relative Empfindlichkeit des Auges für andere Wellenlängen gemäß der Hellempfindlichkeitskurve abnimmt, ist offensichtlich, dass für eine weiße LED zwingend 𝜂𝑣 < 683 lm∕W gelten muss. Zur besseren Einordnung seien drei typische Werte der Lichtausbeute für drei unterschiedliche Leuchtmittel angegeben: (1) Eine klassische Glühlampe mit Wolframwendel und einer Leistung von 100 W hat eine Lichtausbeute 𝜂v ≈ 15 lm∕W, (2) eine Energiesparlampe (Kompakt-Leuchtstofflampe) mit entsprechender Helligkeit erreicht 𝜂𝑣 ≈ 70 lm∕W und (3) eine handelsübliche weiße LED-Lampe schließlich liefert 𝜂𝑣 ≈ 120 lm∕W (wobei auch schon von weißen LED mit 𝜂𝑣 > 300 lm∕W berichtet wurde). Die korrelierte Farbtemperatur (CCT, von engl. correlated color temperature) einer Lichtquelle, meist einfach als Farbtemperatur bezeichnet, ist die Temperatur eines schwarzen Strahlers (Abschnitt 14.4.2), dessen Farbe der der Lichtquelle am nächsten kommt. Wenn die Temperatur eines schwarzen Strahlers allmählich ansteigt, wechselt seine Farbe bei ausreichend hohen Temperaturen von dunkelrot über orange zu gelb zu gelblich-weiß zu weiß und schließlich zu bläulichweiß. Lichtquellen im Bereich von 2700 ≲ CCT ≲ 3500 K (gelblich) werden als „warmweiß“ bezeichnet, während Lichtquellen im Bereich 5000 ≲ CCT ≲ 7500 K (bläulichweiß) als „kaltweiß“ bezeichnet werden. Die Farbtemperatur einer Lichtquelle hat nichts mit ihrer thermodynamischen Temperatur zu tun. Eine weitere wichtige Kennzahl ist der Farbwiedergabeindex (CRI, von engl. color rendering index), der angibt, wie realistisch eine Lichtquelle Farben wiedergeben kann. Diese Maßzahl, die nur für einigermaßen weiße Lichtquellen definiert ist, wird berechnet, indem das von einem standardisierten Satz von Proben reflektierte Licht für verschiedene Farben gemessen wird. Der CRI kann Werte zwischen 0 und 100 annehmen, wobei 100 als ideal betrachtet werden. Vorteile von LED-Beleuchtungen
LED-Leuchtmittel haben eine Reihe von interessanten Vorteilen gegenüber zu ihren glühenden und fluoreszierenden Verwandten: • Lange Lebensdauer, allmählicher Ausfall und geringe Kosten. LED haben eine typische Lebensdauer von mehr als 100 000 Stunden, also wesentlich mehr als die 1500 Stunden von Glühlampen oder 10 000 Stun-
den von Kompakt-Leuchtstofflampen. Außerdem fallen sie meist nicht plötzlich aus, sondern ihre Leistung lässt allmählich nach. Beides führt zu geringeren langfristigen Ersatz- und Wartungskosten. • Geringer Energieverbrauch. Die hohe Lichtausbeute bedeutet, dass LED viel weniger elektrische Energie verbrauchen als klassische Leuchtmittel, um einen bestimmten Lichtstrom zu erzeugen. Aus diesem Grund können LED z. B. von Solarzellen versorgt werden. • Große Farbauswahl und hochwertige Farbwiedergabe. LED können Licht mit Farben im gesamten sichtbaren Bereich liefern, auch ein Kontinuum von Weißtönen. Sie haben inzwischen hohe CRI-Werte, was zeigt, dass farbige Objekte bei Beleuchtung natürlich erscheinen. • Dynamische Funktionalität und Vernetzbarkeit. Die Farbe sowie die zeitliche und räumliche Verteilung des von einer LED erzeugten Lichts können dynamisch gesteuert werden. Die LED-Treiber können drahtlos miteinander und mit verteilten Sensoren kommunizieren, um eine intelligente Vernetzung herzustellen. Diskrete LED
Eine einzelne LED emittiert schmalbandiges, farbiges Licht, dessen Farbe durch die Bandlücke des Materials bestimmt wird, aus dem die LED besteht, wie Abb. 18.15 zeigt. Die optischen und elektrischen Eigenschaften einiger typischer einzelner Single-Die-LED mit unterschiedlichen Farben sind in Tabelle 18.1 aufgeführt. Solche Bauelemente werden üblicherweise als diskrete LED bezeichnet. Tab. 18.1 Typische Parameter für diskrete LED mit 3 mm Durchmesser (blau, grün und rot): Wellenlänge 𝜆max des Emissionsmaximums (nm), Durchlassspannung V (V), Durchlassstrom i (A), aufgenommene elektrische Leistung iV (W), äußerer Wirkungsgrad 𝜂ex , Leistungsumwandlungswirkungsgrad 𝜂U , ausgehender Strahlungsfluss (optische Leistung) PA (W), Lichtstrom P v (lm) und Gesamt-Lichtausbeute 𝜂v (lm∕W). Die Größen 𝜂ex , 𝜂U und PA hängen über die Gln. (18.23), (18.25) und (18.26) zusammen. Farbe
𝝀max
V
i a)
iV
𝜼ex
𝜼U
PA
Pv
𝜼v
Blau Grün Rot
465 528 625
3.1 3.2 2.2
0.35 0.35 0.35
1.1 1.1 0.8
0.4 0.3 0.4
0.35 0.22 0.36
0.38 0.25 0.28
50 125 75
45 115 95
a) Eine Verdreifachung des Stroms auf ≈ 1 A verdoppelt den Strahlungsfluss P A und den Lichtstrom Pv in etwa, allerdings auf Kosten einer geringeren Lichtausbeute 𝜂v .
18.1 Lichtemittierende Dioden (LED)
Weiße LED
Weiß ist bei weitem die wichtigste Farbe für Beleuchtungszwecke. Es gibt verschiedene Methoden, durch die das farbige Licht einer LED in metameres weißes Licht umgewandelt werden kann. Die erste Methode, die aufgrund ihrer Einfachheit und geringen Kosten weit verbreitet ist, kombiniert eine LED mit einer Schicht eines lumineszierenden Farbstoffs (Leuchtstoffs), der eine Photolumineszenz erzeugt (Abschnitt 14.5.2). In der einfachsten Variante erzeugen eine violette LED und ein gelber Leuchtstoff zusammen ein metameres weißes Licht (zwei beliebige Farben, deren Kombination zu weißem Licht führt, werden als Komplementärfarben bezeichnet). Wenn man einen roten Leuchtstoff zu dieser Kombination hinzufügt, erhält man ein wärmeres metameres weißes Licht. Die Verwendung von Quantenpunkten anstelle von Leuchtstoffen erhöht die Effizienz. Die zweite Methode beruht auf der additiven Farbmischung. Hier wird das von mehreren LED emittiert Licht mit unterschiedlichen Farben überlagert (addiert). Dieser Ansatz bietet den Vorteil, dass die LEDBeleuchtung farblich abstimmbar ist. Das dritte Verfahren, oft als Hybridansatz bezeichnet, verwendet zwei oder mehr LED unterschiedlicher Farben (z. B. blau und rot) in Verbindung mit einem oder mehreren Leuchtstoffen. Dieses Verfahren ermöglicht eine hohe Farbqualität, allerdings auf Kosten einer erhöhten Komplexität und höheren Kosten. Wir wollen die ersten beiden Methoden im Folgenden kurz genauer beschreiben. Methode 1: Leuchtstoff-LED.
Die Entwicklung der Leuchtstoff-LED seit dem Jahr 2000 wird in Abb. 18.24 an zwei Beispielen illustriert. Die ersten weißen LED, wie z. B. die in Abb. 18.24(a) dargestellte, verwendeten InGaN-LED-Chips mit einer zentralen Wellenlänge der Emission von 465 nm und einer spektralen Halbwertsbreite von 35 nm. Ein Teil des blauen LED-Lichts, das auf den Leuchtstoff auf der Basis von Ce3+:YAG auftraf, erzeugte eine gelbe Photolumineszenz, deren spektralen Bandbreite von 500– 700 nm reichte, also relativ breit war. Das Ergebnis war kaltweißes metameres Licht. Eine moderne LeuchtstoffLED wie die in Abb. 18.24(b) gezeigte arbeitet nach dem gleichen Prinzip, ist jedoch als SMD-Bauelement (engl. surface-mounted device) ausgeführt, dessen elektrische Kontakte seitlich am Gehäuse angeordnet sind. Diese Bauweise verbessert die Wärmeableitung und den Wirkungsgrad deutlich und ermöglicht eine verringerte Größe. Der LED-Chip sitzt auf einem Keramiksockel und ist von einer dünnen gelben Leuchtstoffschicht bedeckt. Das gesamte Bauelement ist in eine halbkugelförmige Silikonlinse eingekapselt. Auch diese LED be-
(a)
(b)
Abb. 18.24 Die Evolution der Leuchtstoff-LED zur Erzeugung von weißem Licht. (a) Eine frühe LED (um 2000) aus einem InGaN-LED-Chip und einem gelblichen Leuchtstoff in einem Dual-In-Line-Gehäuse (DIP) mit 5 mm Durchmesser. Diese LED erzeugte ein kaltweißes metameres Licht mit einer Lichtausbeute von 𝜂v ≈ 20 lm∕W. (b) Eine moderne LED mit einem InGaN-LED-Chip, der mit einer dünnen gelblichen Leuchtschicht überzogen und mit einer halbkugelförmigen Linse mit 3 mm Durchmesser als SMD-Bauelement ausgeführt ist. Elemente wie dieses liefern kaltweißes metameres Licht mit P v > 500 lm und 𝜂v > 300 lm∕W, um einen Faktor 15 höher als bei früheren LED wie der in (a) dargestellten.
ruht auf einem InGaN-Chip, jedoch mit einer kleineren Mittenwellenlänge (≈ 445 nm im Violetten) und einer schmaleren spektralen Halbwertsbreite (≈ 10 nm). Die gelbe Photolumineszenz hat eine zentrale Wellenlänge von ≈ 570 nm und deckt ein Spektralband von 510–630 nm ab, entsprechend einer Halbwertsbreite von ≈ 120 nm, also etwas schmaler als die LED der ersten Generation. Violett und Gelb sind Komplementärfarben, sodass sich ein kaltweißes metameres Licht ergibt. Methode 2: Additive Farbmischung.
Die zweite Methode zur Erzeugung von metamerem weißen Licht verwendet mehrere LED-Chips, die unterschiedliche Farben emittieren. Geeignete Kombinationen aus rotem, grünem und blauem Licht nimmt das menschliche Auge als weiß wahr, ein Phänomen, das in Abb. 18.25 dargestellt ist. Additive Farbmischung wird in Leuchten verwendet, um Licht mit steuerbarer Farbe zu liefern. Im Kontext der LED-Beleuchtung bezeichnet eine Leuchte ein Leuchtmittel, das eine oder mehrere LED sowie eine Optik enthält, die das emittierte Licht formt und nach außen leitet. RGB-LED
Moderne LED für weißes oder abstimmbares farbiges Licht enthalten mehrere LED-Chips für rotes, grünes und blaues Licht in einem einzigen Gehäuse. Sie können bei geeigneter Ansteuerung praktisch jede Farbe emit-
605
606
18 LED und Laserdioden
R
M B
W Y C G
Abb. 18.25 Additive Farbmischung. Bauelemente, die Licht mit einstellbarer Farbe liefern, enthalten häufig LED, die wie hier gezeigt Rot (R), Blau (B) und Grün (G) emittieren. Bei Betrachtung ergeben die überlappenden Lichtstrahlen die folgenden Farben, wie in der Abbildung dargestellt: B + G → C (Cyan), R + B → M (Magenta), R + G → Y (Gelb), R + B + G → W (Weiß)
Abb. 18.26 Eine farblich abstimmbare RGB-LED, die separat ansteuerbare rote, grüne und blaue LED-Chips sowie einen weißen Leuchtstoff in einem SMD-Gehäuse umfasst, das von einer halbkugelförmigen Linse mit 5 mm Durchmesser abgedeckt ist. Solche RGB-LED können elektrisch so angesteuert werden, dass sie praktisch jede Farbe im Bereich des menschlichen Sehens emittieren können, auch metameres weißes Licht.
tieren, die das menschliche Auge wahrnehmen kann. Ein Beispiel ist die in Abb. 18.26 dargestellte RGB-LED, die je einen roten, grünen und blauen Chip sowie einen weißen Leuchtstoff in unmittelbarer Nachbarschaft enthält, die alle einzeln ansteuerbar sind. Die gesamte Anordnung wird von einer halbkugelförmigen Silikonlinse mit 5 mm Durchmesser umschlossen. Chip-on-Board-LED
Eine Chip-on-Board-LED (COB-LED), manchmal auch als integriertes LED-Array bezeichnet, stellt eine modulare Alternative zu einer Gruppe diskreter LED dar. Wie Abb. 18.27 zeigt, wird durch die Verwendung einer großen Anzahl von Dies auf einem Chip (meist einige zehn, manchmal aber auch hunderte) mit hoher Packungsdichte ein hoher Lichtstrom erzielt. Der gesamte Chip ist als einzelner Schaltkreis konfiguriert und wird auf einer Leiterplatte oder einem anderen Substrat montiert. Die COB-LED wirkt als gleichmäßige diffuse Lichtquelle und eignet sich für viele Beleuchtungsanwendungen, die gerichtetes oder ungerichtetes
Abb. 18.27 Eine beleuchtete Chip-on-Board-LED aus 120 InGaN-Dies in einer 1.5 mm dicken gelbe Leuchtstoffschicht mit 3 cm Durchmesser. Bei einer elektrischen Leistung von 125 W liefert ein solches Bauelement metameres kaltweißes Licht mit einem Lichtstrom von 18 000 lm und einer Lichtausbeute von 145 lm/W.
einfarbiges Licht benötigen. COB-LED sind in einer Vielzahl von Varianten hinsichtlich Größe, Die-Dichte, Betriebsspannung, Farbe, Lichtleistung und Effizienz verfügbar. Retrofit-LED
Ein LED-Leuchtmittel, das als 1:1-Ersatz für eine traditionelle Glühlampe gedacht ist, wird als RetrofitLED (oder Nachrüstsatz) bezeichnet. Sie bestehen in der Regel aus LED mit einem oder mehreren Chips in einem Kunststoffgehäuse. Die Betriebsparameter der Lampe sind normalerweise auf der Verpackung angegeben, beispielsweise der Lichtstrom (lm), die Lichtausbeute (lm∕W), die Farbtemperatur (K), der Farbwiedergabeindex CRI und die elektrische Leistung (W). Oft wird zu Vergleichszwecken auch die elektrische Leistung einer Glühlampe mit demselben Lichtstrom aufgeführt. Eine weiße Retrofit-LED-Lampe, deren oberer Teil in Abb. 18.28 schematisch dargestellt ist, ähnelt zumindest äußerlich ihrem traditionellen Gegenstück und ist auch in etwa gleich schwer. Sie enthält eine Reihe von SMDoder COB-LED wie die in Abb. 18.24(b) bzw. 18.27 gezeigten. Eine solche Lampe enthält oft einen Kühlkörper oder eine Plastikabdeckung, die oben und unten belüftet ist, damit die Lampe durch Konvektion gekühlt werden kann. Moderne Retrofit-Lampen haben eine GesamtLichtausbeute von mehr als 200 lm∕W und sind mit verschiedenen Lichtströmen und Farbtemperaturen erhältlich. Die Optimierung des Wirkungsgrads und der räumlichen Verteilung des emittierten Lichts hat zur Entwicklung von Lampen mit einer Vielzahl von Formen geführt. Retrofitlampen haben die normalen Schraubsockel klassischer Glühlampen und werden mit Netzspannung betrieben. 1) Der LED-Treiber ist in die Glühlampe in-
1) Daneben gibt es natürlich auch Retrofitlampen mit anderen Sockeln und anderen Betriebsspannungen je nach dem Typ des Leuchtmittels, das zu ersetzen ist, z. B. GU10-Sockel für 240 V als Ersatz für Hochvoltoder GU5-Sockel für 12 V als Ersatz für Niedervolt-Halogenlampen.
18.2 Optische Halbleiterverstärker
halbkugelförmiger Diffusor
LED-Array oder COB-LED
Abb. 18.28 Eine weiße Retrofit-LED-Lampe enthält eine Reihe von SMD- oder COB-LED hinter einem (oft kugeloder birnenförmigen) Streuschirm. Die Kühlelemente, die Ansteuerungs- und Dimmerelektronik sowie die Fassung sind nicht dargestellt. Eine Lampe wie die hier abgebildete verbraucht typischerweise 10 W elektrische Leistung und erzeugt Licht, das nicht von dem einer Glühlampe mit einer Leistung von 100 W zu unterscheiden ist. Eine omnidirektionale und dimmbare Lampe mit 10 LED, die jeweils einen Lichtstrom von 150 lm liefern, erzeugt warmweißes metameres Licht mit einem Gesamtlichtstrom von Pv = 1500 lm und einer Lichtausbeute von 𝜂v = 150 lm∕W. Das emittierte Licht hat häufig eine Farbtemperatur von etwa 2700 K und einen Farbwiedergabeindex von etwa 90. Solche Lampen haben eine Lebensdauer von mehr als 25 000 Stunden.
tegriert. Eine Anordnung von in Reihe geschalteten LED kann mit einem Gleichstrom betrieben werden, der durch Gleichrichten der Netz-Wechselspannung mit Dioden und Kondensatoren erhalten wird. Die LED können aber auch direkt mit Wechselstrom angesteuert werden und geben dann in jedem zweiten Halbzyklus Licht ab. Alternativ kann man auch zwei antiparallele Stränge von in Reihe geschalteten LED zusammenschalten, sodass jeweils die Hälfte von ihnen in jedem Halbzyklus Licht emittiert. LED-Lampen können entweder durch Verringern der angelegten Spannung oder durch Verwendung eines pulsbreitenmodulierten Stromtreibers gedimmt werden. OLED-Flächenleuchten
OLED-Flächenleuchten sind großflächige Lichtquellen aus organischen Leuchtdioden (OLED), die Elektrolumineszenz in Blau, Grün und Rot erzeugen. Weiße organische Leuchtdioden (WOLED) der in Abb 18.23 gezeigten Bauart erzeugen weißes Licht durch additive Farbmischung, wie in Abb. 18.25 dargestellt. Sie haben eine innere Quantenausbeute von nahezu eins und eine hervorragende Farbwiedergabe. Eine weiße OLED-Flächenleuchte besteht aus einer einzigen, ausgedehnten, vertikal gestapelten OLED, wie in Abb. 18.23(b) gezeigt. OLED-Paneele sind zwar in der Regel für die Emission von weißem Licht konzipiert, können aber alternativ auch so angesteuert werden, dass sie Licht einer beliebigen Farbe erzeugen und eine dynamische Farbabstim-
Abb. 18.29 Eine weiße OLED-Flächenleuchte auf einem 0.25 mm dicken Polymerträger. Sie liefert metameres weißes Licht mit einem Lichtstrom von Pv = 75 lm, einer Lichtausbeute von 𝜂v = 60 lm∕W, einer Farbtemperatur von 3000 K und einem CRI von 90. Es hat eine Lebensdauer von rund 40 000 Stunden. Derartige Paneele bieten eine großflächige homogene Ausleuchtung.
mung ermöglichen. Solche Paneele haben eine nahezu lambertsche räumliche Verteilung der Emission, sodass sie großflächig homogenes Licht ohne Blendung liefern. Obwohl ihr Lichtstrom begrenzt ist, sind OLEDFlächenleuchten in einer Vielzahl von Größen, Formen und Farbtemperaturen erhältlich. Wenn sie auf transparenten Kunststoffsubstraten aufgebracht werden, sind sie leicht, dünn und flexibel, sodass sie in fast beliebigen Formen gebracht werden können. Eine weiße OLEDFlächenleuchte ist in Abb. 18.29 gezeigt.
18.2 Optische Halbleiterverstärker Optische Halbleiterverstärker (OHV; auch SOA von engl. semiconductor optical amplifier), auch HalbleiterLaserverstärker genannt, werden häufig als photonische Schalter verwendet. Wie in Abschnitt 24.4.2 erläutert kann ein OHV durch Ein- und Ausschalten eines elektrischen Injektionsstroms schnell ein- und ausgeschaltet werden. Bei vorhandener Verstärkung (wenn das Bauelement eingeschaltet ist) wirkt es als Verstärker, während es bei fehlender Verstärkung (wenn das Bauelement ausgeschaltet ist) als Absorber fungiert. Der OHV verhält sich somit wie ein schneller photonischer Schalter mit einem großen Extinktionsverhältnis. Wenn man mehrere OHV über optische Fasern miteinander vernetzt, können sie komplexe photonische Schalter bilden. Optische Halbleiterverstärker eignen sich auch zur Wellenlängenkonversion (Abschnitt 24.4.3) sowie für optisches Demultiplexing und optische Taktrückgewinnung. Sie werden auch als photonische Logikgatter in der optischen Informationsverarbeitung (Abschnitt 24.1). Obwohl Laserdioden als Quellen für die faseroptische Kommunikation weit verbreitet sind, wird die Verstärkung in solchen Systemen besser von faseroptischen Verstärkern (OFA, engl. optical fiber amplifiers) wie EDFA, REFA und REA vorgenommen, wie Abschnitt 25.1.3 erläutert.
607
608
18 LED und Laserdioden
Das Prinzip eines optischen Halbleiterverstärkers ist dasselbe wie das anderer Laserverstärker: Eine Besetzungsinversion wird erzeugt, die dafür sorgt, dass die induzierte Emission über die Absorption überwiegt. Die Besetzungsinversion wird gewöhnlich durch die Injektion eines elektrischen Stroms in eine pn-Flächendiode erzeugt; das Anlegen einer Spannung in Durchlassrichtung bewirkt, dass Ladungsträgerpaare in die Übergangsregion injiziert werden, wo sie unter induzierter Emission rekombinieren. Die Theorie eines OHV ist jedoch komplexer als in Kapitel 15 für andere Laserverstärker vorgestellt, weil die Übergänge zwischen Bändern eng beieinander liegender Energieniveaus stattfinden und nicht zwischen sauber getrennten diskreten Niveaus. Zu Vergleichszwecken kann ein OHV trotzdem als System angesehen werden, das durch eine Form von Intrabandpumpen betrieben wird. Die Theorie der Laserverstärker aus Kapitel 15 hatten wir in Kapitel 17 auf Halbleiterstrukturen erweitert. In dem folgenden Abschnitt benutzen wir die in Abschnitt 17.2 hergeleiteten Resultate, um Ausdrücke für den Gewinn und die Bandbreite von optischen Halbleiterverstärkern zu erhalten. Wir betrachten dann Methoden, mit deren Hilfe eine Besetzungsinversion erreicht werden kann, und zeigen die Vorteile von Heterostruktur-, Quantenschicht- und Quantenpunktsystemen für diesen Zweck. Schließlich geben wir einen kurzen Überblick über die Leistung von optischen Halbleiterverstärkern und vergleichen sie mit faseroptischen Verstärkern, bevor wir schließlich noch superlumineszente Dioden besprechen. Die theoretischen Grundlagen von OHV sind mit denen von Laserdioden identisch, die wir in Abschnitt 18.3 untersuchen werden.
18.2.1
Gewinn und Bandbreite
Licht der Frequenz 𝜈 kann mit den Ladungsträgern eines Halbleitermaterials der Bandlücke E g durch Interbandübergänge wechselwirken, sofern 𝜈 > E g ∕ℎ ist. Die einfallenden Photonen können absorbiert werden und dabei Elektron-Loch-Paare erzeugen oder sie können unter Elektron-Loch-Rekombination die Emission zusätzlicher Photonen induzieren (siehe Abb. 18.30). Wenn die Emission wahrscheinlicher ist als die Absorption, resultiert ein optischer Gewinn und das Material kann als kohärenter optischer Verstärker dienen. Ausdrücke für die Geschwindigkeiten der induzierten Emission r ind (𝜈) und der Absorption r Ab (𝜈) von Photonen sind in den Gln. (17.60) bzw. (17.61) angegeben. Sie hängen von der spektralen Intensität 𝜙𝜈 des Photonenflusses, der quantenmechanischen Oszillatorstärke des Übergangs in dem jeweiligen Material (die in
der Lebensdauer 𝜏s der strahlenden Elektron-Loch-Rekombination berücksichtigt ist), der gemeinsamen Zustandsdichte 𝜚(𝜈) und den Besetzungswahrscheinlichkeiten der Emission 𝑓E (𝜈) bzw. der Absorption 𝑓Ab (𝜈) ab. Die gemeinsame Zustandsdichte 𝜚(𝜈) wird durch die E −𝑘-Beziehungen für Elektronen und Löcher sowie die Erhaltung von Energie und Impuls bestimmt. Mithilfe der parabolischen Näherung für die E −𝑘-Beziehungen in der Nähe der Leitungs- und Valenzbandkanten hatten wir in den Gln. (17.48) und (17.49) gezeigt, dass für die Energien eines Elektrons und eines Lochs, die mit einem Photon der Energie ℎ𝜈 wechselwirken, E2 = EL +
𝑚r (ℎ𝜈 − E g ) 𝑚L
E 1 = 𝐸2 − ℎ𝜈
(18.32)
gilt, wobei 𝑚L und 𝑚V die effektiven Massen sind und 1∕𝑚r = 1∕𝑚L + 1∕𝑚V gilt. Die resultierende gemeinsame Zustandsdichte für die Wechselwirkung mit einem Photon der Energie ℎ𝜈 ist dann [siehe Gl. (17.51)] 𝜚(𝜈) =
(2𝑚r )3∕2 √ ℎ𝜈 − E g , πℏ2
ℎ𝜈 ≥ E g .
(18.33)
𝜚(𝜈) nimmt mit der Wurzel der Differenz zwischen Photonenenergie und Energie der Bandlücke zu. Die Besetzungswahrscheinlichkeiten 𝑓E (𝜈) und 𝑓Ab (𝜈) werden über die Quasiferminiveaus E FL und E 𝑓𝜈 durch die Pumpgeschwindigkeit bestimmt. Die Größe 𝑓E (𝜈) ist die Wahrscheinlichkeit, dass ein Zustand der Energie E 2 im Leitungsband von einem Elektron und ein Zustand der Energie E 1 im Valenzband von einem Loch besetzt ist. 𝑓Ab (𝜈) ist andererseits die Wahrscheinlichkeit, dass ein Zustand der Energie E 2 im Leitungsband frei und ein Zustand der Energie E 1 im Valenzband mit einem Elektron gefüllt ist. Der Fermi-Inversionsfaktor [siehe Gl. (17.67)] 𝑓g (𝜈) = 𝑓E (𝜈) − 𝑓Ab (𝜈) = 𝑓L (E 2 ) − 𝑓V (E 1 )
(18.34)
ist ein Maß für den Grad der Besetzungsinversion. Die Größe 𝑓g (𝜈) hängt sowohl von der Fermifunktion 𝑓L (E ) = 1∕{exp[(E − E FL )∕k 𝑇] + 1} des Leitungsbands als auch von der Fermifunktion 𝑓V (E ) = 1∕{exp[(E − E FV )∕k 𝑇] + 1} des Valenzbands ab. Sie ist eine Funktion der Temperatur und der Quasiferminiveaus E FL und E FV , die wiederum durch die Pumpgeschwindigkeit gegeben sind. Weil in einem optischen Halbleiterverstärker im Prinzip eine vollständige Besetzungsinversion [𝑓g (𝜈) = 1] erreicht werden kann, verhält er sich in dieser Hinsicht wie ein Vierniveausystem. Diese Ergebnisse sind in Gl. (17.66) kombiniert und liefern einen Ausdruck für den Netto-Gewinnkoeffizien-
18.2 Optische Halbleiterverstärker
Abb. 18.30 (a) Die Absorption eines Photons bewirkt die Bildung eines Elektron-Loch-Paars. (b) Die Elektron-Loch-Rekombination kann durch ein Photon induziert werden; die Folge ist die Emission eines identischen Photons.
2 L
hν
hν
g
hν hν
V 1
k
(a)
k
(b)
ten 𝛾0 (𝜈) = [r ind (𝜈) − r Ab (𝜈)]∕𝜙𝜈 , 𝛾0 (𝜈) =
𝜆2 𝜚(𝜈) 𝑓g (𝜈) . 8π 𝜏s
(18.35)
Durch Vergleich von Gl. (18.35) mit Gl. (15.4) wird deutlich, dass 𝜚(𝜈)𝑓g (𝜈) in einem optischen Halbleiterverstärker die Rolle übernimmt, die N𝑔(𝜈) in anderen Laserverstärkern spielt, und dass 𝜎(𝜈) ≈ 𝛾0 (𝜈)∕Δn ist. Die Bandbreite des Verstärkers
Nach den Gln. (18.34) und (18.35) liefert ein Halbleitermedium bei der Frequenz 𝜈 einen optischen Nettogewinn, wenn 𝑓L (E 2 ) > 𝑓V (E 1 ) ist. Umgekehrt ist für 𝑓L (E 2 ) < 𝑓V (E 1 ) eine Nettodämpfung die Folge. Ein (dotiertes oder undotiertes) Halbleitermaterial im thermischen Gleichgewicht kann daher unabhängig von seiner Temperatur nie einen Gewinn liefern, da die Ferminiveaus seines Valenz- und Leitungsbands zusammenfallen, (E FL = E FV = E F ). Das Material muss extern gepumpt werden, damit die Ferminiveaus der beiden Bänder getrennt werden und eine Verstärkung entstehen kann. Die Bedingung 𝑓L (E 2 ) > 𝑓V (E 1 ) entspricht der Bedingung, dass die Photonenenergie kleiner sein muss als der Abstand der Quasiferminiveaus, d. h. ℎ𝜈 < E FL − E FV , wie in Übung 17-6 gezeigt wird. Natürlich muss die Photonenenergie größer sein als die Bandlücke (ℎ𝜈 > E g ), damit Laserverstärkung durch Interbandübergänge auftreten kann. Wenn die Pumpgeschwindigkeit also so groß ist, dass der Abstand zwischen den beiden Quasiferminiveaus größer wird als die Bandlücke E g , kann das Medium als ein Verstärker für optische Frequenzen in dem Band Eg
ℎ
E FL − E FV das Licht dämpft, anstatt es zu verstärken. Gleichung (18.36) zeigt, dass die Bandbreite des Verstärkers mit E FL − E FV zunimmt, also mit steigender Pumpleistung. In dieser Hinsicht unterscheidet er sich von einem atomaren Laserverstärker, dessen
ungesättigte Bandbreite Δ𝜈 nicht von der Pumpleistung abhängt (siehe Abb. 15.4). Die Berechnung der Eigenschaften des Gewinns wird erheblich vereinfacht, wenn thermische Anregungen ignoriert werden können (d. h. für 𝑇 = 0 K). Die Fermifunktionen sind dann einfach 𝑓L (E 2 ) = 1 für E 2 < E FL und ansonsten 0 bzw. 𝑓V (E 1 ) = 1 für E 1 < E FV und ansonsten 0. In diesem Fall ist der Fermi-Inversionsfaktor 𝑓g (𝜈) = {
+1 für ℎ𝜈 < E FL − E FV , −1 ansonsten .
(18.37)
Schematische Auftragungen der Funktionen 𝜚(𝜈) und 𝑓g (𝜈) und des Gewinnkoeffizienten 𝛾0 (𝜈) sind in Abb. 18.31 gezeigt. Man sieht, wie 𝛾0 (𝜈) das Vorzeichen wechselt und zu einem Verlustkoeffizienten wird, wenn ℎ𝜈 > E FL − E FV wird. Die 𝜈−2 -Abhängigkeit von 𝛾0 (𝜈), die aus dem Faktor 𝜆 2 im Zähler von Gl. (18.35) resultiert, ist so langsam, dass sie vernachlässigt werden kann. Bei endlichen Temperaturen werden die Funktionen 𝑓g (𝜈) und 𝛾0 (𝜈) geglättet, wie die gestrichelten Kurven in Abb. 18.31 illustrieren. Die Abhängigkeit des Gewinnkoeffizienten von der Pumpleistung
Der Gewinnkoeffizient 𝛾0 (𝜈) wird mit steigender Pumpgeschwindigkeit R sowohl breiter als auch größer. Gemäß Gl. (18.1) führt eine konstante Pumpgeschwindigkeit R (Zahl der injizierten Elektron-Loch-Paare pro Kubikzentimeter und Sekunde) im stationären Zustand zu einer Konzentration von injizierten Elektron-LochPaaren von Δn = Δp = R𝜏, wobei 𝜏 die Lebensdauer der Elektron-Loch-Rekombination ist (die sowohl strahlende als auch nichtstrahlende Beiträge umfasst). Wenn wir die Gesamtkonzentrationen n = n0 + Δn und p = p0 + Δn von Elektronen bzw. Löchern im stationären Zustand kennen, können wir die Ferminiveaus E FL und E FV aus Gl. (18.8) bestimmen. Sobald die Ferminiveaus bekannt sind, können wir aus Gl. (18.35) den Gewinnkoeffizienten berechnen. Beispiel 18-3 illustriert die Abhängigkeit von 𝛾0 (𝜈) von Δn und somit von R.
609
18 LED und Laserdioden
ϱ(ν)
g
FL – FV
hν
fg (ν) +1
hν –1
Gewinn
γ0(ν)
0 Verlust
610
g
hν
Abb. 18.31 Temperaturabhängigkeit der gemeinsamen Zustandsdichte 𝜚(𝜈), des Fermi-Inversionsfaktors fg (𝜈) und des Gewinnkoeffizienten 𝛾0 (𝜈) bei T = 0 K (durchgezogene Kurven) und bei Zimmertemperatur (gestrichelte Kurven). Photonen mit einer Energie zwischen E g und E FL − E FV erfahren Laserverstärkung.
Beispiel 18-3: Gewinnkoeffizient eines OHV auf Basis von InGaAsP
Eine Probe des quaternären Materials In0.72 Ga0.28 As0.6 P0.4 mit der Bandlücke E g = 0.95 eV dient bei 𝜆0 = 1300 nm und 𝑇 = 300 K als optischer Halbleiterverstärker. Die Probe ist undotiert, enthält aber Restkonzentrationen an Donoren und Akzeptoren von ≈ 2 × 1017 cm−3 . Seine Lebensdauer der strahlenden Elektron-Loch-Rekombination ist 𝜏s ≈ 2.5 ns. Die effektiven Massen der Elektronen und Löcher sind 𝑚L ≈ 0.06 𝑚0 bzw. 𝑚V ≈ 0.4 𝑚0 und sein Brechungsindex ist 𝑛 ≈ 3.5. Wenn die Konzentration Δn der injizierten Ladungsträger im stationären Zustand (die von der Injektionsgeschwindigkeit R und der gesamten Rekombinationszeit 𝜏 abhängt) bekannt ist, kann der Gewinnkoeffizient 𝛾0 (𝜈) aus den Gln. (18.35) und (18.8) berechnet werden. Wie Abb. 18.32 zeigt, nehmen sowohl die Bandbreite des Verstärkers als auch
der Maximalwert des Gewinnkoeffizienten 𝛾max mit Δn zu. Auch die Energie, bei der das Maximum auftritt, nimmt mit Δn zu, wie aus dem in Abb. 18.31 gezeigten Verhalten zu erwarten ist. Die minimale Energie, bei der Verstärkung eintritt, nimmt mit zunehmendem Δn geringfügig ab, weil Bandausläufer die Bandlücke verringern. Bei dem größten gezeigten Wert von Δn (Δn = 1.8 × 1018 cm−3 ) werden Photonen mit Energien zwischen 0.91 und 0.97 eV verstärkt. Das entspricht einer vollen Bandbreite des Verstärkers von 14.5 THz und einem Wellenlängenbereich von 80 nm. Ein geeigneteres Maß ist die Halbwertsbreite des Gewinnprofils, auch als 3-dB-Gewinnbandbreite bezeichnet, die bei 𝜆0 = 1300 nm 10 THz oder ungefähr 50 nm beträgt (siehe Tabelle 15.1 für einen Vergleich mit anderen Laserübergängen). Der berechnete maximale Gewinnkoeffizient 𝛾max = 270 cm−1 bei diesem Wert von Δn ist im Vergleich mit den meisten atomaren Laserverstärkern groß. Das Einsetzen der Gewinnsättigung in optischen Halbleiterverstärkern unterscheidet sich nicht von anderen homogen verbreiterten Laserverstärkern wie den in Abschnitt 15.4 betrachteten. Der relativ große Übergangsquerschnitt von Halbleitern (siehe Tabelle 15.1) führt zu einer kleinen Sättigungs-Photonenflussdichte [𝜙S ≈ 1∕𝜏s 𝜎(𝜈)] und daher einem reduzierten Gewinnkoeffizienten [siehe Gl. (15.48) und (15.49)]. Das beschränkt wiederum den Gewinn, den ein OHV liefern kann. Genau wie andere optische Verstärker leiden auch optische Halbleiterverstärker unter Rauschen durch verstärkte spontane Emission (siehe Abschnitt 15.5); außerdem tritt auch Rauschen aufgrund von Fluktuationen der Temperatur und der Ladungsträgerkonzentrationen auf. Der maximale Gewinnkoeffizient
Die komplexe Abhängigkeit des Gewinnkoeffizienten von der Konzentration der injizierten Ladungsträger erschwert die Analyse des Halbleiterverstärkers (und -lasers). Deshalb ist es üblich, einen empirischen Ansatz zu verwenden und für Werte von Δn in der Nähe des Betriebspunkts einen linearen Zusammenhang zwischen dem maximalen Gewinnkoeffizienten 𝛾max und Δn anzunehmen. Wie das Beispiel in Abb. 18.32(b) zeigt, ist diese Näherung anwendbar, wenn 𝛾max groß ist. Die Abhängigkeit des maximalen Gewinnkoeffizienten 𝛾max von Δn kann dann durch die lineare Beziehung 𝛾max ≈ 𝛼 (
Δn − 1) ΔnT
(18.38)
18.2 Optische Halbleiterverstärker
1.8 × 1018 1.6 × 1018 50 nm 1.4 × 1018
100
γp / cm–1
1.2 × 1018
300
200 80 nm
0
100
–100 cm–3
–200
(a)
0.90
0 0.92
0.94
0.96
hν / eV
1.0
1.5 Δ / (1018 cm–3)
2.0
(b)
Abb. 18.32 (a) Berechneter Gewinnkoeffizient 𝛾0 (𝜈) für einen InGaAsP-OHV als Funktion der Photonenenergie h𝜈; die Konzentration Δn der injizierten Ladungsträger dient als Parameter (T = 300 K). Das Frequenzband, in dem Verstärkung eintritt (um 1300 nm) nimmt mit steigendem Δn zu. Am größten gezeigten Wert von Δn ist die Halbwertsbandbreite des Verstärkers 10 THz entsprechend einer Energie von 0.04 eV oder einer Wellenlänge von 50 nm. (Modifiziert
beschrieben werden, die in Abb. 18.33 illustriert ist. Die Parameter 𝛼 und ΔnT werden so gewählt, dass sie die folgenden Grenzfälle korrekt wiedergeben: • Für Δn = 0 ist 𝛾max = −𝛼, wobei 𝛼 den Absorptionskoeffizienten des Halbleiters ohne Injektion eines Stroms bezeichnet. • Für Δn = ΔnT ist 𝛾max = 0. ΔnT ist somit die Konzentration der injizierten Ladungsträger, für die Emission und Absorption gerade ausgeglichen sind, sodass das Medium transparent ist. Beispiel 18-4: Der genäherte maximale Gewinnkoeffizient für einen InGaAsP-OHV
Der in Abb. 18.32(b) als Funktion von Δn gezeigte maximale Gewinnkoeffizient 𝛾max von InGaAsP kann näherungsweise durch eine lineare Beziehung der Form von Gl. (18.38) mit ΔnT ≈ 1.25 × 1018 cm−3 und 𝛼 = 600 cm−1 beschrieben werden. Für Δn = 1.4 ΔnT = 1.75 × 1018 cm−3 liefert das lineare Modell einen maximalen Gewinnkoeffizienten 𝛾max = 240 cm−1 . Für einen InGaAsP-Kristall der Länge d = 350 μm entspricht das einem Gesamtgewinn von exp(𝛾max d ) ≈ 4447 oder 36.5 dB. In der Praxis wird dieser Wert wie zuvor diskutiert durch die Gewinnsättigung sowie Verluste bei der Kopplung reduziert, die normalerweise 3 bis 5 dB pro Seite betragen.
nach N. K. Dutta, ‚Calculated Absorption, Emission, and Gain in In0.72 Ga0.28 As0.6 P0.4 ‘, Journal of Applied Physics 51, 6095– 6100, 1980; Abb. 8.) (b) Berechneter maximaler Gewinnkoeffizient 𝛾max als Funktion von Δn. Am größten Wert von Δn beträgt der maximale Gewinnkoeffizient ≈ 270 cm−1 . (Modifiziert nach N. K Dutta, R. J. Nelson, ‚The Case for Auger Recombination in InGaAsP‘, Journal of Applied Physics 53, 74–92, 1982; Abb. 17.)
Verlust Gewinn
Δ =
1 × 1018
max. Gewinnkoeffizient γp
γ0 (ν) / cm–1
200
0
Δ
T
Δ
–α
Abb. 18.33 Maximaler Gewinnkoeffizient 𝛾max als Funktion der Konzentration Δn der injizierten Ladungsträger in der linearen Näherung. Die Größe 𝛼 bezeichnet die Dämpfungskonstante ohne Injektion, und ΔnT ist die Konzentration der injizierten Ladungsträger, bei der sich Emission und Absorption gerade die Waage halten. Der durchgezogene Teil der Gerade beschreibt die realistischere Berechnung aus dem vorherigen Abschnitt.
Eine Erhöhung der Konzentration der injizierten Ladungsträger von einem Wert unterhalb auf einen Wert oberhalb der Transparenzschwelle ΔnT bewirkt, dass der Halbleiter sich von einem starken Lichtabsorber [𝑓g (𝜈) < 0] in einen Lichtverstärker mit hohem Gewinn [𝑓g (𝜈) > 0] verwandelt. Die große Übergangswahrscheinlichkeit, die den Halbleiter zu einem guten Absorber macht, macht ihn auch zu einem ein guten Verstärker, wie durch Vergleich der Gln. (17.60) und (17.61) deutlich wird.
611
612
18 LED und Laserdioden
18.2.2
Der Pumpvorgang
Photonen Ausgang
Optisches Pumpen
Das Pumpen kann wie in Abb. 18.34 dargestellt durch eine externe Lichtquelle realisiert werden, sofern ihre Photonenenergie genug groß ist (> E g ). Die Pumpphotonen werden von dem Halbleiter absorbiert, wobei Ladungsträgerpaare gebildet werden. Die erzeugten Elektronen und Löcher relaxieren zum Boden des Leitungsbands bzw. zur Spitze des Valenzbands. Wenn die Intraband-Relaxationszeit viel kürzer ist als die Interband-Relaxationszeit – was gewöhnlich der Fall ist –, kann wie in Abschnitt 15.2 besprochen eine stationäre Besetzungsinversion zwischen den Bändern erhalten werden.
+
i
– p
n
Fläche Photonen Eingang
Abb. 18.35 Geometrie eines einfachen optischen Halbleiterverstärkers. Die Ladungsträger breiten sich senkrecht zum pn-Übergang aus, wohingegen sich die Photonen in der Ebene des Übergangs ausbreiten.
Pumpphoton
EingangsSignalphoton
l
AusgangsSignalphotonen
k
Abb. 18.34 Optisches Pumpen eines optischen Halbleiterverstärkers.
Wenn ein elektrischer Strom 𝑖 durch eine Fläche A = wd in ein Volumen 𝑙A injiziert wird, wobei w und d die Breite bzw. Höhe des Bauelements sind (wie in Abb. 18.35 dargestellt), dann ist die Injektionsgeschwindigkeit der Ladungsträger im stationären Zustand R = 𝑖∕𝑒𝑙A = 𝐽∕𝑒𝑙 pro Sekunde pro Volumeneinheit, wobei 𝐽 = 𝑖∕A die injizierte Stromdichte ist. Die resultierende Konzentration der injizierten Ladungsträger ist dann Δn = 𝜏R =
Elektrisches Pumpen
Ein praktikablere Methode, einen optischer Halbleiterverstärker zu pumpen, ist die Injektion von Elektronen und Löchern in einen stark dotierten pn-Übergang – eine Diode. Wie bei der LED (siehe Abschnitt 18.1) liegt an dem Übergang eine Spannung in Durchlassrichtung an, sodass Minoritätsladungsträger in die Übergangsregion injiziert werden (Elektronen in die p-dotierte Region und Löcher in die n-dotierte Region). Abbildung 18.6 zeigt das Bandschema eines in Durchlassrichtung gepolten stark dotierten pn-Übergangs. Die Quasiferminiveaus E FL und E FV des Leitungs- und Valenzbands liegen innerhalb des Leitungs- bzw. Valenzbands, und in der Übergangsregion liegt ein Quasigleichgewicht vor. Die Quasiferminiveaus sind so weit voneinander getrennt, dass eine Besetzungsinversion erreicht wird und über die Bandbreite E g ≤ ℎ𝜈 ≤ E FL − E FV in der aktiven Region ein Nettogewinn erhalten werden kann. Die Dicke 𝑙 der aktiven Region ist ein wichtiger Parameter der Diode, der vor allem durch die Diffusionslängen der Minoritätsladungsträger zu beiden Seiten des Übergangs bestimmt wird. Typische Werte von 𝑙 für InGaAsP liegen im Bereich 1−3 μm.
𝜏 𝜏 𝑖= 𝐽. 𝑒𝑙A 𝑒𝑙
(18.39)
Die Konzentration der injizierten Ladungsträger ist daher direkt proportional zur injizierten Stromdichte, sodass die in den Abb. 18.32 und 18.33 für den Parameter Δn gezeigten Ergebnisse ebenso gut durch den Parameter 𝐽 ausgedrückt werden könnten. Insbesondere folgt aus den Gln. (18.38) und (18.39), dass im Rahmen der in Gl. (18.38) implizit enthaltenen linearen Näherung der maximale Gewinnkoeffizient linear mit der injizierten Stromdichte 𝐽 verknüpft ist, d. h. 𝛾max ≈ 𝛼 (
𝐽 − 1) . 𝐽T
(18.40)
Die Transparenzstromdichte 𝐽T ist 𝐽T =
𝑒𝑙 ΔnT , 𝜂i 𝜏s
(18.41)
wobei 𝜂i = 𝜏∕𝜏s wieder die innere Quantenausbeute bezeichnet. Für 𝐽 = 0 ist der maximale Gewinnkoeffizient 𝛾max = −𝛼 gleich der Dämpfungskonstante, wie Abb. 18.36 zeigt. Für 𝐽 = 𝐽T ist 𝛾max = 0, und das Material ist transparent, d. h. es treten weder Verstärkung noch Dämpfung auf. Ein Nettogewinn ist nur möglich, wenn die
Verlust Gewinn
maximaler Gewinnkoeffizient γp
18.2 Optische Halbleiterverstärker
0
Jt
Stromdichte J
ist jedoch möglich, Ladungsträger auf eine aktive Region einzugrenzen, deren Dicke kleiner ist als ihre Diffusionslängen, wenn man Heterostrukturbauelemente wie die in Abschnitt 18.2.3 diskutierten verwendet. Gleichzeitig kann sogar auch Licht in solch einer Struktur eingeschlossen werden, was einen zusätzlichen Vorteil bedeutet.
–α
Abb. 18.36 Der maximale optische Gewinnkoeffizient 𝛾max als Funktion der Stromdichte J in der linearen Näherung. Für J = JT ist das Material transparent, und es treten weder Gewinn noch Verlust auf.
injizierte Stromdichte 𝐽 größer ist als die Transparenzstromdichte 𝐽T . 𝐽T ist direkt proportional zur Dicke 𝑙 des Übergangs, sodass die Transparenzstromdichte 𝐽T kleiner wird, wenn die aktive Region dünner wird. Das ist ein wichtiger Faktor beim Design von optischen Halbleiterverstärkern (und -lasern). Beispiel 18-5: Der Gewinn eines optischen Halbleiterverstärkers aus InGaAsP
Ein optischer Halbleiterverstärker auf InGaAsP-Basis wird bei 300 K betrieben. Seine Parameter sind 𝜏s = 2.5 ns, 𝜂i = 0.5, ΔnT = 1.25 × 1018 cm−3 , und 𝛼 = 600 cm−1 . Der Übergang hat die Dicke 𝑙 = 2 μm, die Länge d = 200 μm und die Breite w = 10 μm. Nach Gl. (18.41) ist die Stromdichte, die den Halbleiter gerade transparent macht, 𝐽T = 3.2 × 104 A∕cm2 . Eine geringfügig größere Stromdichte 𝐽 = 3.5 × 104 A∕cm2 führt zu einem maximalen Gewinnkoeffizienten 𝛾max ≈ 56 cm−1 , wie Gl. (18.40) zeigt. Das bewirkt einen Verstärkergewinn 𝐺 = exp(𝛾max d ) = exp(1.12) ≈ 3. Da die Fläche des Übergangs jedoch A = wd = 2 × 10−5 cm2 ist, ist ein ziemlich großer Injektionsstrom 𝑖 = 𝐽 A = 700 mA erforderlich, um diese Stromdichte zu produzieren. Warum Heterostrukturen?
Wenn wir die Dicke 𝑙 der aktiven Region in Beispiel 18-5 von 2 μm auf beispielsweise 0.1 μm reduzieren könnten, würde sich die Stromdichte 𝐽T um einen Faktor 20 auf einen realistischeren Wert von 1600 A∕cm2 verringern. Da in diesem Fall ein entsprechend kleineres Volumen gepumpt werden müsste, könnte der Verstärker dann mit einer geringeren injizierten Stromdichte denselben Gewinn liefern. Eine solche Reduktion der Dicke der aktiven Region führt jedoch zu einem Problem, weil die Diffusionslängen der Elektronen und Löcher in InGaAsP mehrere μm betragen und die Ladungsträger daher aus dieser kleineren Region heraus diffundieren würden. Es
18.2.3 Heterostrukturen Wie die Gln. (18.40) und (18.41) zeigen, variiert der maximale Gewinnkoeffizient 𝛾max eines Diodenlasers invers mit der Dicke 𝑙 der aktiven Region. Es ist daher vorteilhaft, die Dicke so klein wie möglich zu machen. Die aktive Region wird durch die Diffusionslängen der Minoritätsladungsträger beiderseitig des Übergangs definiert. Der Grundgedanke einer Doppelheterostruktur ist, Heterokontakt-Potentialbarrieren zu beiden Seiten des pn-Übergangs aufzubauen, die die Entfernung begrenzen sollen, über die die Minoritätsladungsträger diffundieren können. Die Barrieren definieren ein Gebiet, innerhalb dessen Minoritätsladungsträger eingegrenzt werden, sodass aktive Regionen mit Dicken 𝑙 bis hinunter zu 0.1 μm möglich werden. Eine noch stärkere Eingrenzung, bis zu ≈ 0.01 μm, kann durch Verwendung von Quantenschicht-Bauelementen erreicht werden, die in Abschnitt 18.2.4 besprochen werden. Gleichzeitig kann ein elektromagnetischer Einschluss des verstärkten optischen Strahls erreicht werden, wenn das Material der aktiven Schicht so gewählt wird, dass sein Brechungsindex geringfügig größer ist als der der beiden umgebenden Schichten; in diesem Fall wirkt die Struktur als optischer Wellenleiter (siehe Abschnitt 9.2). Eine Doppelheterostruktur erfordert daher wie in Abb. 18.37 dargestellt drei Schichten aus unterschiedlichen Materialien mit identischen Gitterkonstanten: • Schicht 1: p-dotiert, Bandlücke E g1 , Brechungsindex 𝑛1 • Schicht 2: p-dotiert, Bandlücke E g2 , Brechungsindex 𝑛2 • Schicht 3: n-dotiert, Bandlücke E g3 , Brechungsindex 𝑛3 Die Halbleitermaterialien werden so ausgewählt, dass E g1 und E g3 größer sind als E g2 ; dadurch wird der Einschluss der Ladungsträger erreicht. Da gleichzeitig 𝑛2 größer ist als 𝑛1 und 𝑛3 , wird auch das Licht eingegrenzt. Die aktive Schicht (Schicht 2) ist recht dünn (0.1– 0.2 μm), um die Transparenzstromdichte 𝐽T möglichst klein und dadurch den maximalen Gewinnkoeffizienten 𝛾max möglichst groß zu machen. Die induzierte Emission
613
614
18 LED und Laserdioden
und 𝑦 sind dadurch auf Werte beschränkt, für die E g2 dem Band 1.1−1.7 μm entspricht. • Doppelheterostruktur-Laserdiodenverstärker aus GaAs/AlGaAs. Die aktive Schicht (Schicht 2) besteht aus GaAs (E g2 = 1.42 eV, 𝑛2 = 3.6). Die umgebenden Schichten 1 und 3 bestehen aus AlGaAs mit E g > 1.43 eV und 𝑛 < 3.6 (um etwa 5–10 %). Dieser Verstärker arbeitet in der Regel im Band 0.82–0.88 μm, wenn die Zusammensetzung von AlGaAs im Bereich 𝑥 = 0.35−0.5 liegt.
Photonen Ausgang
+
V
1
2
3
p
p
n
–
Photonen Eingang Barriere
18.2.4
g1
eV
n
g2
g3
n2 n1
n3
Abb. 18.37 Bandschema und Brechungsindex als Funktionen des Ortes für einen optischen DoppelheterostrukturHalbleiterverstärker.
findet im pn-Übergang zwischen den Schichten 2 und 3 statt. Zusammenfassend bieten Doppelheterostrukturen folgende Vorteile: • Vergrößerter Verstärkergewinn für eine gegebene injizierte Stromdichte infolge der kleineren Dicke der aktiven Schicht gemäß den Gln. (18.40) und (18.41). Die injizierten Minoritätsladungsträger werden innerhalb der dünnen aktiven Schicht zwischen den beiden Heterokontaktbarrieren eingegrenzt und können nicht in die umgebenden Schichten diffundieren. • Vergrößerter Verstärkergewinn als Resultat der Eingrenzung der Photonen innerhalb der aktiven Schicht aufgrund ihrer größeren Brechkraft. Das aktive Medium wirkt als optischer Wellenleiter. • Reduzierter Verlust aufgrund der Unfähigkeit der Schichten 1 und 3, die geführten Photonen zu absorbieren, weil die Bandlücken E g1 und E g3 dieser Schichten größer sind als die Photonenenergie (ℎ𝜈 = E g2 < E g1 , E g2 ). Zwei Beispiele von optischen DoppelheterostrukturHalbleiterverstärkern sind: • Doppelheterostruktur-Laserdiodenverstärker aus InGaAsP/InP. Die aktive Schicht besteht aus InGaAs1−𝑦 P𝑦 ; sie ist von Schichten aus InP umgeben. Die Parameter 𝑥 und 𝑦 werden so gewählt, dass die Materialien identische Gitterkonstanten haben. 𝑥
Quantenschichtstrukturen
Wie bereits in Abschnitt 18.2.3 diskutiert ermöglichen Heterostrukturen eine reduzierte Dicke der aktiven Schicht, in der Ladungsträger und Photonen eingegrenzt werden. Das führt zu einem vergrößerten Gewinn und einem reduzierten Verlust des Verstärkers. Wenn die Dicke der aktiven Schicht noch weiter reduziert wird, in die Größenordnung von 5–10 nm (kleiner als die De-Broglie-Wellenlänge eines thermischen Elektrons), spielen Quanteneffekte eine entscheidende Rolle. Da die aktive Schicht in einer Doppelheterostruktur eine kleinere Bandlücke besitzt als die umgebenden Schichten, wirkt die Struktur dann als Quantenschicht (siehe Abschnitt 17.1.7) und wird daher auch Quantenschichtstruktur genannt. Die Bandstruktur und die Energie-Impuls-Beziehungen (E −𝑘-Beziehungen) einer Quantenschicht unterscheiden sich von denen eines Vollmaterials. Das Leitungsband wird in mehrere Unterbänder aufgespalten, die durch die Quantenzahl 𝑞 = 1, 2, … unterschieden werden, jedes mit seiner eigenen Energie-Impuls-Beziehung und Zustandsdichte. Die Minima dieser Unterbänder haben die Energien E L + E 𝑞 , wobei E 𝑞 = ℏ2 (𝑞π∕𝑙)2 ∕2𝑚L , 𝑞 = 1, 2, …, die Energien eines Elektrons der effektiven Masse 𝑚L in einem eindimensionalen Quantentopf der Länge 𝑙 sind (siehe Abb. 17.29 und 17.31; 𝑞1 und d 1 aus Kapitel 17 entsprechen hier 𝑞 und 𝑙). Jedes Unterband hat eine parabolische E −𝑘-Beziehung und eine konstante Zustandsdichte, die nicht von der Energie abhängt. Die gesamte Zustandsdichte 𝜚L (E ) im Leitungsband folgt daher einer Stufenverteilung [siehe Gl. (17.37)] mit Niveaus bei den Energien E L + E 𝑞 , 𝑞 = 1, 2, …. Ähnliche Unterbänder liegen im Valenzband bei ′ ′ den Energien E V − E 𝑞 , wobei E 𝑞 = ℏ2 (𝑞π∕𝑙)2 ∕2𝑚V die Energien eines Loches der effektiven Masse 𝑚V in einem Quantentopf der Länge 𝑙 sind. Die Wechselwirkungen von Photonen mit Elektronen und Löchern in einer Quantenschicht erscheinen in Form von energie- und impulserhaltenden Übergängen zwischen den Leitungs- und den Valenzbändern. Die
18.2 Optische Halbleiterverstärker
q=2 q=1 2 1
L g2
g1
ϱ(ν)
g
1′ V 2′
q=1 q=2 k
(a)
(b)
g
g1
g2
hν
Abb. 18.38 (a) E −k-Beziehungen von verschiedenen Unterbändern. (b) Gemeinsame Zustandsdichte für eine Quantenschichtstruktur (Stufenkurve) und einen Volumenhalbleiter (gestrichelte Kurve). Die erste Stufe erscheint bei der Energie ′ ′ E g1 = E g + E 1 + E 1 (wobei E 1 bzw. E 1 die tiefsten Energien eines Elektrons und eines Lochs in der Quantenschicht sind).
Übergänge müssen auch die Quantenzahl 𝑞 erhalten, wie aus Abb. 18.38 ersichtlich ist; sie gehorchen ähnlichen Regeln wie denen, die die Übergänge zwischen dem Leitungs- und dem Valenzband in Volumenhalbleitern bestimmen. Die Ausdrücke für die Übergangswahrscheinlichkeiten und den Gewinnkoeffizienten im Vollmaterial (siehe Abschnitt 17.2) gelten auch für die Quantenschichtstruktur, wenn einfach die Energie E g der Bandlücke durch die Energielücke E g𝑞 = E g + E 𝑞 + ′ E 𝑞 zwischen den Unterbändern ersetzen und eine konstante Zustandsdichte anstelle einer energieabhängigen verwendet wird. Der Gesamt-Gewinnkoeffizient ist die Summe der Gewinnkoeffizienten aller Unterbänder (𝑞 = 1, 2, …). Zustandsdichte
Wir betrachten Übergänge zwischen den beiden Unterbändern mit der Quantenzahl 𝑞. Damit Energie und Impuls erhalten bleiben, muss ein Photon der Energie ℎ𝜈 mit Zuständen der Energien E = E L + E 𝑞 + (𝑚r ∕𝑚L )(ℎ𝜈 − E 𝑔𝑞 ) im oberen Unterband und E − ℎ𝜈 im unteren Unterband wechselwirken. Die gemeinsame Zustandsdichte 𝜚(𝜈) ist mit 𝜚L (E ) gemäß 𝜚(𝜈) = (d E ∕ d𝜈)𝜚L (E ) = (ℎ𝑚r ∕𝑚L ) 𝜚L (E ) verknüpft. Aus Gl. (17.37) folgt dann 2𝑚r ⎧ ℎ𝑚r 𝑚L = 2 𝑚 π ℏ 𝑙 ℏ𝑙 𝜚(𝜈) = L ⎨ 0 ⎩
′
für ℎ𝜈 > E g + E 𝑞 + E 𝑞
gielücken zwischen Unterbändern derselben Quantenzahl (Abb. 18.38). Gewinnkoeffizient
Der Gewinnkoeffizient eines Bauelements ist durch den üblichen Ausdruck 𝛾0 (𝜈) =
Wenn wir Übergänge zwischen allen Unterbändern 𝑞 = 1, 2, … berücksichtigen, erhalten wir ein 𝜚(𝜈) entsprechend einer Stufenverteilung mit Niveaus bei den Ener-
(18.43)
gegeben [siehe Gl. (17.66)], wobei der Fermi-Inversionsfaktor 𝑓g (𝜈) von den Quasiferminiveaus und der Temperatur abhängt und für Vollmaterial- und Quantenschichtlaser identisch ist. Die Zustandsdichte 𝜚(𝜈) unterscheidet sich jedoch in diesen Fällen, wie wir gezeigt hatten. Die Frequenzabhängigkeiten von 𝜚(𝜈), 𝑓g (𝜈) und ihres Produkts sind in Abb. 18.39 für Quantenschicht- und Vollmaterial-Doppelheterostrukturen illustriert. Die Quantenschichtstruktur hat einen kleineren maximalen Gewinnkoeffizienten und ein schmaleres Gewinnprofil. Bei der Konstruktion von Abb. 18.39 wurde angenommen, dass nur eine Stufe der Stufenfunktion 𝜚(𝜈) bei einer Energie kleiner als E FL − E FV liegt. Das ist unter normalen Injektionsbedingungen der Fall. Der maximale Gewinn 𝛾max kann dann bestimmt werden, indem man 𝑓g (𝜈) = 1 und 𝜚(𝜈) = 2𝑚r ∕ℏ𝑙 in Gl. (18.43) einsetzt; das ergibt
ansonsten . (18.42)
𝜆2 𝜚(𝜈) 𝑓g (𝜈) 8π 𝜏s
𝛾max =
𝜆 2 𝑚r . 2𝜏s ℎ𝑙
(18.44)
615
18 LED und Laserdioden
ϱ (ν) Vollmaterial Quantenschicht
fg (ν) +1
g
g1
FL – FV
hν
hν
–1
γ0 (ν) Verlust Gewinn
616
γm 0
Vollmaterial Quantenschicht hν
Abb. 18.39 Zustandsdichte 𝜚(𝜈), Fermi-Inversionsfaktor fg (𝜈) und Gewinnkoeffizient 𝛾0 (𝜈) in Quantenschicht(durchgezogen) und Vollmaterialstrukturen (gestrichelt).
Die Beziehung zwischen Gewinnkoeffizient und Stromdichte
Durch Erhöhung der injizierten Stromdichte 𝐽 wird die Konzentration Δn von Überschusselektronen und -löchern vergrößert und damit auch der Abstand E FL − E FV zwischen den Quasiferminiveaus. Die Wirkung dieser Zunahme auf den Gewinnkoeffizienten 𝛾0 (𝜈) kann aus den Diagrammen in Abb. 18.39 erschlossen werden. Für hinreichend kleine 𝐽 gibt es keinen Gewinn. Wenn 𝐽 so groß ist, dass E FL − E FV etwas größer wird als die Bandlücke E g1 zwischen den Unterbändern 𝑞 = 1, liefert das Medium einen Gewinn. Der maximale Gewinnkoeffizient nimmt schnell zu und wird bei 𝛾Sp gesättigt. Eine weitere Zunahme von 𝐽 vergrößert die spektrale Breite des Gewinns, aber nicht mehr seinen Maximalwert. Wenn 𝐽 noch weiter vergrößert wird, bis EFL − E FV größer wird als die Bandlücke E g2 zwischen den Unterbändern 𝑞 = 2, springt der maximale Gewinnkoeffizient erneut, und so weiter. Das Gewinnprofil kann daher ziemlich breit werden, was große Bereiche der Abstimmbarkeit für solche Bauelemente ergibt. Materialien und Bauelementstrukturen
Die Struktur eines optischen Halbleiterverstärkers ähnelt dem einer Laserdiode, die oberhalb der Transparenzschwelle, aber unterhalb der Laserschwelle betrieben wird (siehe Abschnitt 18.3). Optische Halbleiterverstärker können in jeder Region des optischen Spek-
trums betrieben werden, wenn die Halbleitermaterialien entsprechend gewählt werden. Ihre Wellenlänge, ihre Bandbreite und ihr Gewinn hängen sowohl vom Material als auch von der Struktur des Bauelements ab. Für den Betrieb im nahen IR ausgelegte OHV werden meist aus InGaAsP, InGaAs oder InP hergestellt. Im Kommunikationsband zwischen 1300 und 1600 nm ist die erreichbare Bandbreite Δ𝜆 ≈ 50 nm entsprechend Δ𝜈 ≈ 10 THz bei 𝜆0 = 1300 nm (siehe Beispiel 18-3). Das ist mehr als bei erbiumdotierten Faserverstärkern und ungefähr gleich der von Raman-Faserverstärkern (siehe Abschnitte 15.3.3 und 15.3.4). Quantenschicht-OHV benötigen wesentlich weniger Strom, um transparent zu werden, verhalten sich ansonsten aber ähnlich wie Vollmaterial-Bauelemente. Der Gewinn eines OHV ist aufgrund der Gewinnsättigung und wegen Kopplungsdämpfungen von 3–5 dB pro Seite gewöhnlich auf ≈ 15 dB beschränkt (siehe Beispiel 18-4). Die Sättigung führt zu Interkanal- und Intersymbolinterferenzen, weshalb OHV für die Anwendung in digitalen Wellenlängenmultiplexsystemen unbrauchbar sind (siehe Abschnitt 25.3.3). Außerdem macht die kurze Halbleiter-Rekombinationszeit (siehe Tabelle 15.1) OHV empfindlich gegenüber hochfrequentem Rauschen im Pumpstrom oder im optischen Signal, was zu Rauschfaktoren von ≈ 8−10 dB führt, im Vergleich zu 3 dB für erbiumdotierte Faserverstärker. Wenn ein OHV als breitbandiges Bauelement für einen einzelnen Durchgang dienen soll (d. h. als Wanderwellenverstärker), müssen die Reflexionsgrade der Fenster auf ein Minimum reduziert werden. Wenn dies unterlassen wird, kann es zu vielfachen Reflexionen und einem durch die Resonatormoden modulierten Gewinnprofil führen; das Resultat kann eine Oszillation sein, die eine kontrollierte Verstärkung unmöglich macht. Um die Reflexionsgrade zu reduzieren, können beispielsweise Antireflexbeläge aufgebracht oder die Wellenleiter etwas verkippt werden. Aufgrund der beschriebenen Probleme sind Anwendungen von OHV in optischen Nachrichtensystemen bisher überwiegend auf städtische Netze beschränkt, wo ein geringer Gewinn ausreicht, um die Verluste an vielfachen optischen Add/Drop-Knoten auszugleichen. Interessanter sind OHV für Anwendungen wie nichtlineare optische Elemente und optische Schalter (siehe Abschnitt 24.2), Wellenlängenkonversion (Abschnitt 24.4.3) oder Logikgatter für die optische Datenverarbeitung. Auch für das optische Demultiplexing und die optische Taktwiederherstellung sind sie von Interesse.
18.2 Optische Halbleiterverstärker
Beispiel 18-6: Wellenleiterverstärker
Mehrfachquantenschicht-OHV können in Form von optischen Wellenleitern konstruiert werden, die mit vergrößerten Sättigungs-Ausgangsleistungen auf der optischen Grundmode betrieben werden können und direkte Stoßkopplung in Einmodenfasern ermöglichen. Solche Bauelemente haben relativ geringe Verluste und einen kleinen optischen Einschlussfaktor. Beispielsweise liefert ein InGaAsP/InP-Quantenschichtverstärker mit einer Länge von 1 cm bei 1550 nm einen Gewinn von 13 dB von Faser zu Faser. Vergleich von Quantenpunkt- und Quantenschicht-OHV
Quantenpunkt-OHV bieten ebenfalls viele der Vorteile von Quantenschicht-OHV; im Dauerstrichbetrieb sind ihre Eigenschaften vergleichbar. Aufgrund der inhomogenen Verbreiterung kann die Bandbreite von Quantenpunkt-OHV bis zu 200 nm betragen, entsprechend Δ𝜈 ≈ 25 THz bei 𝜆0 = 1550 nm, allerdings mit einer gleichzeitigen Verringerung des Gewinns pro Bandbreite und der Sättigungsleistung. Die Vorteile von Quantenpunkt-OHV liegen in ihrem größeren ungesättigten Gewinn und ihrer schnelleren Gewinndynamik, die eine effiziente Verstärkung von kurzen optischen Pulsen und Pulsfolgen ermöglichen. Die Erholungszeiten des Gewinns können bis hinunter zu 100 fs reichen, was einen Betrieb bei > 200 Gbit∕s ermöglicht. Vergleich von Halbleiter- und Faserverstärkern
Optische Halbleiterverstärker haben im Vergleich zu optischen Faserverstärkern wie z. B. erbiumdotierten oder Raman-Faserverstärkern sowohl Vor- als auch Nachteile.
• Empfindlichkeit gegenüber Reflexionen an den Fenstern • Empfindlichkeit gegenüber der Polarisation des Signals • Kontrolle der Eigenschaften der transversalen Moden • hohe Einfügungsdämpfung • inkompatibel mit Fasersystemen Insgesamt ist die Leistung von OHV im Allgemeinen der von erbiumdotierten oder Raman-Faserverstärkern unterlegen und ihr Einsatz ist auf spezielle Anwendungen beschränkt (siehe Abschnitt 25.1.4). Die relativen Vorund Nachteile von erbiumdotierten und Raman-Faserverstärkern wurden in Abschnitt 15.3.4 gewürdigt.
18.2.5 Superlumineszenzdioden Superlumineszenzdioden (SLED) sind optische Halbleiterverstärker, die ohne optisches Signal am Eingang betrieben werden. Die Emission einer SLED beruht stattdessen auf verstärkter spontaner Emission (ASE) aus dem Bauelement selbst (siehe Abschnitt 15.5). Die ASE hat dabei dieselbe Form wie das optische Rauschen eines gewöhnlichen Laserverstärkers, das wir in Abschnitt 15.5 untersucht hatten. SLED unterscheiden sich von LED insofern, dass die Strominjektion in ihnen so groß ist, dass die induzierte Emission über die spontane Emission überwiegt. Ein Beispiel einer SLED ist die in Abb. 18.40 gezeigte Mehrfachquantenschichtstruktur aus InGaAsP/InP. Die optische Ausgangsleistung einer SLED ist im Allgemeinen größer als die einer LED, liegt aber unter der einer Laserdiode (siehe Abb. 18.45); das optische Spektrum ist
Vorteile: • Mittenwellenlänge durch geeignete Wahl des Materials frei wählbar • kompatibel mit integrierten optoelektronischen Schaltungen • elektrisches Pumpen möglich • einfache Modulierbarkeit über den Injektionsstrom • kleine Abmessungen • preisgünstig Nachteile: • • • • •
geringer Gewinn niedrige Sättigungsleistung hohes Rauschen Interkanal- und Intersymbolinterferenzen Empfindlichkeit gegenüber thermischen Effekten durch Wärmedissipation
InGaAsKontaktschicht
+
InGaAsPWellenleiter InPMantelschichten InGaAsP/InGaAsP Mehrfachquantenschicht InPaktive Region substrat
−
Abb. 18.40 Mehrfachquantenschicht-Superlumineszenzdiode aus InGaAsP/InP. SLED erzeugen Licht mit erheblicher optischer Leistung und einer Bandbreite zwischen der einer LED und einer Laserdiode. Es ist wichtig, die Rückkopplung zu minimieren, sodass keine Laseroszillation auftritt. Das kann z. B. durch einen Streifenkontakt erreicht werden, der nur in einen Teil des Bauelements einen Strom injiziert.
617
618
18 LED und Laserdioden
normalerweise schmaler als das einer LED, aber breiter als das einer Laserdiode (siehe Abb. 18.47). Eine SLED kann eine beugungsbegrenzte und räumlich kohärente Emission ähnlich der einer kantenemittierenden Laserdiode liefern, was die Einkopplung des Lichts in Einmodenfasern erleichtert. Wie bei optischen Halbleiterverstärkern ist es wichtig, die optische Rückkopplung zu minimieren, um den Laserprozess zu vermeiden. Das kann auf unterschiedliche Weise erreicht werden, z. B. durch Verwendung eines Streifenkontakts, der nur in einen Teil des Bauelements einen Strom injiziert, eines spitz zulaufenden Streifens, eines Antireflexbelags oder durch verkippen der Seitenflächen des Bauelements. Superlumineszenzdioden werden in Anwendungen eingesetzt, in denen die lange Kohärenzzeit des Laserlichts unerwünscht ist, entweder aufgrund des zu schmalen Spektrums oder wegen stochastischer Interferenzen (Speckles). Darunter fallen z. B. interferometrische Instrumente wie optische Kohärenztomographen (siehe Abschnitt 12.2.2), faseroptische Gyroskope und bestimmte faseroptische Sensoren. Auch optische Faserverstärker werden manchmal als Quellen von Superlumineszenzlicht verwendet.
18.3 Laserdioden In dem folgenden Abschnitt untersuchen wir die allgemeinen Eigenschaften von Laserdioden. Die frühesten derartigen Bauelemente aus der Zeit um 1962 bestanden aus einfachen pn-Übergängen zwischen GaAs und GaAsP und emittierten im nahen Infrarot und Rot. Heutzutage existiert eine verwirrende Vielfalt von Halbleiterlasern, die Wellenlängen vom mittleren UV bis ins ferne Infrarot liefern und Ausgangsleistungen von einigen Nanowatt (für Nanolaser) über Watt (für einzelne Laserdioden) bis in den Kilowattbereich (für größere Anordnungen von Laserdioden) besitzen. Laserdioden sind heute ein Thema mit vielen Facetten. Quantenbegrenzte Laser werden in Abschnitt 18.4, Mikro- und Nanoresonatorlaser in Abschnitt 18.5 ausführlich besprochen.
18.3.1 Verstärkung, Rückkopplung und Schwingung Eine Laserdiode ist ein optischer Halbleiterverstärker mit einem eingebauten Mechanismus für eine optische Rückkopplung. Wie im vorhergehenden Abschnitt besprochen ist ein optischer Halbleiterverstärker ein in Durchlassrichtung gepolter, stark dotierter pn-Übergang aus einem Halbleitermaterial mit direkter
gespaltene Oberfläche
l +
p
Fläche
n
i
–
gespaltene Oberfläche
Abb. 18.41 Eine Laserdiode ist ein in Durchlassrichtung gepolter pn-Übergang mit zwei parallelen Oberflächen, die als Reflektoren wirken.
Bandlücke. Der injizierte Strom ist groß genug, um einen optischen Gewinn zu erzeugen. Die optische Rückkopplung wird im einfachsten Fall durch Spiegel bewirkt, die gewöhnlich durch Spalten des Halbleitermaterials entlang seiner Kristallebenen hergestellt werden. Der scharfe Brechungsindexsprung zwischen dem Kristall und der umgebenden Luft führt dazu, dass die gespaltenen Oberflächen als Reflektoren wirken. Somit ist der Halbleiterkristall sowohl ein Gewinnmedium als auch als ein optischer Fabry-Pérot-Resonator, wie Abb. 18.41 zeigt. Wenn der Gewinnkoeffizient hinreichend groß ist, verwandelt die Rückkopplung den optischen Verstärker in einen optischen Oszillator, d. h. in einen Laser. Ein solches Bauelement heißt Laserdiode oder Diodenlaser (manchmal auch Halbleiter-Injektionslaser). Die Laserdiode (LD) ähnelt der in Abschnitt 18.1 besprochenen lichtemittierenden Diode (LED). In beiden Bauelementen ist die Energiequelle ein in einen pnÜbergang injizierter elektrischer Strom. Das von einer LED emittierte Licht entsteht jedoch durch spontane Emission, wohingegen das Licht einer LD auf induzierter Emission beruht. Laserdioden haben im Vergleich zu anderen Lasern mehrere Vorteile: kleine Abmessungen, Kompatibilität mit elektronischen Komponenten, hohe Leistung, hoher Wirkungsgrad und einfache Methoden für das Pumpen und die Modulation durch Injektion eines elektrischen Stroms. Wie wir sehen werden, haben Laserdioden eine Vielzahl von Anwendungen. Wir beginnen unsere Analyse der für die Laseroszillation erforderlichen Bedingungen und der Eigenschaften des emittierten Lichts mit einer kurzen Zusammenfassung der grundlegenden Ergebnisse für den optischen
18.3 Laserdioden
Halbleiterverstärker und den optischen Fabry-Pérot-Resonator.
samte Verlustkoeffizient ist dann
Laserverstärkung
wobei 𝛼S andere Quellen von Verlusten wie z. B. Absorption der freien Ladungsträger im Halbleitermaterial (siehe Abb. 17.36) oder Streuung an optischen Inhomogenitäten bezeichnet. Die Größe 𝛼𝑠 nimmt mit steigender Konzentration von Verunreinigungen und Grenzflächenfehlern in der Heterostruktur zu. Sie kann Werte im Bereich von 10 bis 100 cm−1 annehmen. Natürlich trägt der Term −𝛼 im Ausdruck Gl. (18.45) für den Gewinnkoeffizienten, der die Absorption im Material beschreibt, ebenfalls wesentlich zu den Verlusten bei. Dieser Beitrag ist jedoch bereits in dem durch Gl. (18.45) gegebenen maximalen Netto-Gewinnkoeffizienten 𝛾max berücksichtigt. Das wird aus dem in Gl. (17.66) angegebenen Ausdruck für 𝛾0 (𝜈) deutlich, der proportional zu 𝑓g (𝜈) = 𝑓E (𝜈) − 𝑓Ab (𝜈) (also zur induzierten Emission abzüglich der Absorption) ist. Ein anderer wichtiger Beitrag zu den Verlusten entsteht durch die Ausbreitung der optischen Energie außerhalb der aktiven Schicht des Verstärkers (in der Richtung senkrecht zur Ebene des Übergangs). Dieser Effekt ist besonders ausgeprägt, wenn die Dicke 𝑙 der aktiven Schicht klein ist. Das Licht breitet sich dann durch eine dünne verstärkende Schicht (die aktive Region) aus, die von einem verlustbehafteten Medium umgeben ist, sodass große Verluste wahrscheinlich sind. Dieses Problem kann durch Verwendung einer Doppelheterostruktur reduziert werden (siehe Abschnitt 18.2.3 und Abb. 18.37), in der die mittlere Schicht aus einem Material mit hohem Brechungsindex besteht, das als Wellenleiter wirkt und die optische Energie eingrenzt. Durch die optische Ausbreitung verursachte Verluste können phänomenologisch berücksichtigt werden, indem man einen Einschlussfaktor 𝛤 definiert, der den Bruchteil der optischen Energie innerhalb der aktiven Region angibt (Abb. 18.42). Wenn wir annehmen, dass die Energie außerhalb der aktiven Region vollständig verloren ist, wird der Gewinnkoeffizient um einen Faktor 𝛤 reduziert bzw. der Verlustkoeffizient entsprechend vergrößert. Um diesen Effekt zu berücksichtigen, wird Gl (18.48) wie folgt modifiziert:
Der Gewinnkoeffizient 𝛾0 (𝜈) eines optischen Halbleiterverstärkers hat einen Maximalwert 𝛾max , der näherungsweise proportional zur Konzentration der injizierten Ladungsträger ist, die wiederum proportional zur injizierten Stromdichte 𝐽 ist. Also ist nach den Gln. (18.40) und (18.41) und wie in Abb. 18.36 gezeigt 𝛾max ≈ 𝛼 (
𝐽 − 1) , 𝐽T
𝐽T =
𝑒𝑙 ΔnT , 𝜂i 𝜏s
(18.45)
wobei 𝜏s die Lebensdauer der strahlenden ElektronLoch-Rekombination ist, 𝜂i = 𝜏∕𝜏s die innere Quantenausbeute, 𝑙 die Dicke der aktiven Region, 𝛼 der Absorptionskoeffizient im thermischen Gleichgewicht, ΔnT die Konzentration der injizierten Ladungsträger und 𝐽T die Stromdichte, die erforderlich ist, um den Halbleiter gerade transparent zu machen. Rückkopplung
Die Rückkopplung wird häufig bewerkstelligt, indem man die Kristallebenen senkrecht zur Ebene des Übergangs spaltet oder zwei parallele Oberflächen des Kristalls poliert. Die in Abb. 18.41 dargestellte aktive Region des pn-Übergangs dient dann auch als optischer Resonator der Länge d und der Querschnittsfläche 𝑙w aus ebenen Spiegeln. Halbleitermaterialien haben normalerweise große Brechungsindizes, sodass der Leistungsreflexionsgrad ℛ=(
𝑛−1 ) 𝑛+1
2
(18.46)
an der Grenzfläche Halbleiter/Luft erheblich ist [siehe Gl. (6.41) und Tabelle 17.5]. Wenn der Gewinn des Mediums groß genug ist, kann die Brechungsindexdiskontinuität selbst als reflektierende Fläche dienen, sodass keine externen Spiegel erforderlich sind. Für GaAs ist beispielsweise 𝑛 = 3.6, womit Gl. (18.46) ℛ = 0.32 ergibt. Resonatorverluste
Die Hauptquelle von Resonatorverlusten ist die teilweise Reflexion an der Oberfläche des Kristalls. Dieser Verlust ist nichts anderes als das durchgelassene nutzbare Laserlicht. Für einen Resonator der Länge d ist der Reflexions-Dämpfungskoeffizient [siehe Gl. (11.22)] 𝛼Sp = 𝛼Sp1 + 𝛼Sp2 =
1 1 ln ( ); 2d ℛ1 ℛ2
(18.47)
wenn die beiden Oberflächen denselben Reflexionsgrad ℛ1 = ℛ2 = ℛ besitzen, ist 𝛼Sp = (1∕d ) ln(1∕ℛ). Der ge-
𝛼R = 𝛼S + 𝛼Sp ,
(18.48)
1 (18.49) (𝛼 + 𝛼Sp ) . 𝛤 S Es gibt drei Arten von einfachen Laserdiodenstrukturen, die sich durch den Mechanismus unterscheiden, der zur lateralen Eingrenzung der Ladungsträger bzw. des Lichts genutzt wird: ungeführte Strukturen (in denen es keinen Mechanismus für die laterale Eingrenzung gibt), gewinngeführte Strukturen (in denen laterale Variationen des Gewinns für die Eingrenzung 𝛼R =
619
18 LED und Laserdioden
l
Homostruktur
l p
n
Brechungsindex
p
x
x
x
x
x
(a)
n
x
(b)
Abb. 18.42 Ausbreitung des Laserlichts in der Richtung senkrecht zur Ebene des Übergangs für (a) Homostrukturund (b) Heterostrukturlaser.
genutzt werden) und indexgeführte Strukturen (in denen laterale Brechungsindexvariationen für die Eingrenzung genutzt werden). Die Laserschwelle
Bedingung für die Laseroszillation ist, dass der Gewinn größer sein muss als der Verlust, 𝛾max > 𝛼R , wie Gl. (16.12) zeigt. Der Schwellen-Gewinnkoeffizient ist daher 𝛼R . Wenn wir in Gl. (18.45) 𝛾max = 𝛼R und 𝐽 = 𝐽Sch setzen, erhalten wir für die injizierte Stromdichte 𝐽Sch an der Schwelle 𝐽Sch =
𝛼R + 𝛼 𝐽T , 𝛼
(18.50)
wobei die Transparenzstromdichte 𝐽T =
𝑒𝑙 ΔnT 𝜂i 𝜏s
(18.51)
die Stromdichte ist, bei der das Medium gerade transparent wird. Die Schwellenstromdichte ist um den Faktor (𝛼R + 𝛼)∕𝛼 größer als die Transparenzstromdichte, der für 𝛼 ≫ 𝛼R ungefähr eins wird. Da der Strom 𝑖 = 𝐽 A ist, wobei A = wd die Querschnittsfläche der aktiven Region ist, können wir 𝑖T = 𝐽T A und 𝑖Sch = 𝐽Sch A als die Ströme definieren, die erforderlich sind, um das Medium transparent zu machen bzw. die Laserschwelle zu erreichen. Die Schwellenstromdichte 𝐽Sch ist ein entscheidender Parameter zur Charakterisierung der Leistung von Laserdioden; kleinere Werte von 𝐽Sch bedeuten eine höhere Leistung. Nach den Gln. (18.50) und (18.51) wird 𝐽Sch minimiert, wenn die innere Quantenausbeute 𝜂i maximal und der Verlustkoeffizient 𝛼R des Resonators, die Transparenzkonzentration ΔnT der injizierten Ladungsträger und die Dicke 𝑙 der aktiven Region minimal sind. Wenn 𝑙 jedoch über einen bestimmten Punkt hinaus reduziert wird, nimmt der Verlustkoeffizient 𝛼R zu,
Schwellenstromdichte JSch
620
Doppelheterostruktur
Dicke der aktiven Schicht l
Abb. 18.43 Abhängigkeit der Schwellenstromdichte JSch von der Dicke l der aktiven Schicht. Doppelheterostrukturlaser besitzen einen niedrigeren Wert von JSch als Homostrukturlaser und daher eine höhere Leistung. Die Steigerung von JSch bei kleinen Werten von l ist ein Resultat der schwächeren Eingrenzung in dünnen aktiven Schichten.
weil der Einschlussfaktor 𝛤 abnimmt [siehe Gl. (18.49)]. Folglich nimmt 𝐽Sch mit abnehmenden 𝑙 bis auf einen minimalen Wert ab, bei einer weiteren Verminderung von 𝐽Sch jedoch wieder zu (siehe Abb. 18.43). In Doppelheterostrukturlasern bleibt der Einschlussfaktor aber auch für niedrigere Werte von 𝑙 annähernd eins, weil sich die aktive Schicht wie ein optischer Wellenleiter verhält (siehe Abb. 18.42). Das Ergebnis ist wie in Abb. 18.43 gezeigt ein tieferer minimaler Wert von 𝐽Sch und daher eine höhere Leistung. Die Reduktion von 𝐽Sch wird in den folgenden Beispielen illustriert. Weil die Parameter ΔnT und 𝛼 in Gl. (18.45) temperaturabhängig sind, gilt dasselbe auch für die Schwellenstromdichte 𝐽Sch und die Frequenz des Gewinnmaximums. Durch Kontrolle der Temperatur kann der Laserausgang stabilisiert und die Ausgangsfrequenz modifiziert werden. Beispiel 18-7: Schwellenstrom einer InGaAsP-Homostruktur-Laserdiode
Wir betrachten eine InGaAsP-Homostruktur-Laserdiode mit denselben Materialparametern wie in den Beispielen 18-3 und 18-4: ΔnT = 1.25 × 1018 cm−3 , 𝛼 = 600 cm−1 , 𝜏s = 2.5 ns, 𝑛 = 3.5 und 𝜂i = 0.5 bei 𝑇 = 300 K. Die Dimensionen des Übergangs sind d = 200 μm, w = 10 μm und 𝑙 = 2 μm. Die Transparenzstromdichte ergibt sich daraus zu 𝐽T = 3.2 × 104 A∕cm2 . Wir bestimmen jetzt die Schwellenstromdichte für die Laseroszillation. Aus Gl. (18.46) erhalten wir für den Oberflächenreflexionsgrad ℛ = 0.31. Der entsprechende Verlustkoeffizient des Spiegels ist 𝛼Sp = (1∕d ) ln(1∕ℛ) = 59 cm−1 . Wenn wir annehmen, dass der Verlustkoeffizient aufgrund anderer Effekte ebenfalls
18.3 Laserdioden
𝛼S = 59 cm−1 und der Einschlussfaktor 𝛤 ≈ 1 ist, erhalten wir für den Gesamt-Verlustkoeffizienten 𝛼R = 118 cm−1 . Die Schwellenstromdichte ist daher 𝐽Sch = [(𝛼R + 𝛼)∕𝛼] 𝐽T = [(118 + 600)∕600][3.2 × 104 ] = 3.8 × 104 A∕cm2 . Der entsprechende Schwellenstrom ist 𝑖Sch = 𝐽Sch wd ≈ 760 mA, was ein verhältnismäßig hoher Wert ist. Homostrukturlaser werden wegen der Schwierigkeiten, ohne Kühlung einen Dauerstrichbetrieb zu erreichen, selten verwendet. Beispiel 18-8: Schwellenstrom einer InGaAsP-Heterostruktur-Laserdiode
Nun wenden wir uns einer DoppelheterostrukturInGaAsP/InP-Laserdiode (siehe Abb. 18.37) mit denselben Parametern und Dimensionen wie in Beispiel 18-7 zu, nur dass wir für die Dicke der aktiven Schicht jetzt 𝑙 = 0.1 μm (anstelle von 2 μm) setzen. Wir nehmen die Eingrenzung des Lichts als ideal an (𝛤 = 1); damit können wir dieselben Werte für den Verlustkoeffizienten 𝛼R des Resonators verwenden. Die Transparenzstromdichte wird dann um einen Faktor 20 auf 𝐽T = 1600 A∕cm2 reduziert, und die Schwellenstromdichte sinkt auf einen praxisnäheren Wert von 𝐽Sch = 1915 A∕cm2 . Der entsprechende Schwellenstrom ist 𝑖Sch = 38 mA. Diese wichtige Reduktion des Schwellenstroms macht Dauerstrichbetrieb von Doppelheterostruktur-Laserdioden bei Zimmertemperatur möglich.
18.3.2 Leistung und Wirkungsgrad Der innere Photonenfluss
Wenn die Stromdichte über den Schwellenwert hinaus vergrößert wird (d. h. 𝐽 > 𝐽Sch ), überschreitet der maximale Gewinnkoeffizient 𝛾max des Verstärkers den Verlustkoeffizienten 𝛼R . Die induzierte Emission überwiegt dann über die Absorption und andere Resonatorverluste, sodass die Oszillation beginnt und der Photonenfluss 𝛷 im Resonator zunimmt. Wie bei anderen homogen verbreiterten Lasern setzt Sättigung ein, weil der Photonenfluss größer wird und der Besetzungsunterschied reduziert wird [siehe Gl. (16.2)]. Wie Abb. 16.8 zeigt, nimmt der Gewinnkoeffizient dann ab, bis er gleich dem Verlustkoeffizienten ist, woraufhin ein stationärer Zustand erreicht ist. Wie bei der inneren Photonenflussdichte und der inneren Photonenzahldichte anderer Lasertypen [siehe Gl. (16.25) und (16.36)] ist auch der innere Photonenfluss 𝛷 einer Laserdiode im stationären Zustand proportional zur Differenz zwischen der Pumpgeschwindigkeit R und der Schwellen-Pumpgeschwindigkeit RSch .
Da R ∝ 𝑖 und RSch ∝ 𝑖Sch ist, gilt nach Gl. (18.39)
𝛷=
⎧
𝜂i 𝑖Sch
⎨ 0 ⎩
(
𝑒
𝑖 𝑖Sch
− 1) = 𝜂i
𝑖 − 𝑖Sch 𝑒
für 𝑖 > 𝑖Sch für 𝑖 ≤ 𝑖Sch . (18.52)
Der innere Photonenfluss im stationären Zustand (pro Sekunde in der aktiven Region erzeugte Photonen) ist also gleich dem Anteil des Elektronenflusses über der Schwelle (injizierte Elektronen pro Sekunde) multipliziert mit der inneren Quantenausbeute 𝜂i . Die innere Laserleistung oberhalb der Schwelle ist mit dem inneren Photonenfluss 𝛷 einfach durch P = ℎ𝜈𝛷 verknüpft; es gilt daher P ∕W = 𝜂i
𝑖 − 𝑖Sch 1.24 . A 𝜆0 ∕μm
(18.53)
Photonenfluss am Ausgang und Wirkungsgrad
Der Photonenfluss 𝛷A am Ausgang des Lasers ist das Produkt des inneren Photonenfluss 𝛷 und des Auskopplungswirkungsgrads 𝜂A [siehe Gl. (16.39)], der als das Verhältnis des Verlusts aufgrund der Auskopplung des nutzbaren Lichts durch die Spiegel und des Gesamtverlusts 𝛼R des Resonators definiert ist. Wenn nur das durch Spiegel 1 durchgelassene Licht genutzt wird, ist 𝜂A = 𝛼Sp1 ∕𝛼R ; wenn dagegen das durch beide Spiegel transmittierte Licht verwendet wird, ist 𝜂A = 𝛼Sp ∕𝛼R . Wenn beide Spiegel denselben Reflexionsgrad ℛ haben, erhalten wir im zweiten Fall 𝜂A = [(1∕d ) ln(1∕ℛ)]∕𝛼R . Der Photonenfluss am Laserausgang ist daher 𝛷A = 𝜂A 𝜂i
𝑖 − 𝑖Sch . 𝑒
(18.54)
Die in Gl. (18.54) beschriebene Proportionalität zwischen dem Photonenfluss am Laserausgang und dem injizierten Elektronenfluss oberhalb der Schwelle wird durch die sogenannte differentielle äußere Quantenausbeute bestimmt, 𝜂d = 𝜂A 𝜂i .
(18.55)
Die Größe 𝜂d bezeichnet damit die Änderung des Photonenflusses am Laserausgang als Funktion des injizierten Elektronenflusses oberhalb der Schwelle: 𝜂d =
d𝛷A . d(𝑖∕𝑒)
(18.56)
Sie hängt mit dem differentiellen Leistungsumwandlungswirkungsgrad (Steigungswirkungsgrad) aus Gl. (16.43) gemäß 𝜂d =
𝑒𝑉 𝜂 ℎ𝜈 St
(18.57)
621
20 InGaAsP/InGaAsP
16 12 8 4 0
0
40
80 120 160 Strom i (mA)
200
mW ideal
A/
24
56 48
optische Ausgangsleistung
mW
28
A/
18 LED und Laserdioden
optische Ausgangsleistung
622
ideal
40
GaN/InGaN
32 24 16 8 0
0
(a)
20
40 60 Strom i (mA)
80
100
(b)
Abb. 18.44 Gemessene (durchgezogene Linien) und ideale (gestrichelte Linien) Leistungs-Strom-Kurven für (a) eine gewinngeführte MQW-InGaAsP/InGaAsP-Laserdiode bei 1550 nm im nahen Infrarot (die Struktur des Bauelements
ist in Abb. 18.55 gezeigt) und (b) eine MQW-GaN/InGaN-Laserdiode bei 405 nm im Violetten. Nichtlinearitäten, die in der einfachen Theorie nicht berücksichtigt sind, sind für die Sättigung der optischen Ausgangsleistung verantwortlich.
zusammen. Wenn wie meist ℎ𝜈 ≈ k 𝑇 gilt, folgt daraus 𝜂d ≈ 𝜂St . Die Ausgangsleistung des Lasers oberhalb der Schwelle ist P A = ℎ𝜈𝛷A = 𝜂d (𝑖 − 𝑖Sch )(ℎ𝜈∕𝑒), was wir in gebräuchlichen Einheiten als 𝑖 − 𝑖Sch 1.24 PA ∕W = 𝜂d (18.58) A 𝜆0 ∕μm
Tab. 18.2 Betriebsparameter von Laserdioden auf der Grundlage der Leistungs-Strom-Kurven in den Abb. 18.44(a) bzw. (b).
schreiben können. Diese Beziehung wird LeistungsStrom-Kurve genannt. Die Steigung dieser Kurve oberhalb der Schwelle ist die differentielle Ansprechempfindlichkeit des Lasers, die gewöhnlich in Einheiten von W/A angegeben wird, d PA 1.24 ℛd = ≈ 𝜂d . d𝑖 𝜆0 ∕nm
(18.59)
Leistungs-Strom-Kurven für zwei Laserdioden sind in Abb. 18.44 als durchgezogene Kurven gezeigt; in (a) für ein gewinngeführtes MQW-Bauelement aus InGaAsP/ InGaAsP bei 1550 nm und in (b) für ein MQWGaN/InGaN-Bauelement bei 405 nm. Die von Gl. (18.58) gelieferten theoretischen Vorhersagen sind gestrichelt eingezeichnet. Die Parameter dieser Laserdioden sind aus den Gln. (18.58) und (18.59) leicht zu berechnen; einige Werte sind in Tabelle 18.2 angegeben. Obwohl die differentielle äußere Quantenausbeute 𝜂d für beide Bauelemente nahezu identisch ist, ist die differentielle Ansprechempfindlichkeit ℛd für das GaN/InGaN-Bauelement etwa einen Faktor vier größer, weil seine Betriebswellenlänge kleiner ist, wie anhand von Gl. (18.59) verständlich wird. Der Leistungsumwandlungswirkungsgrad 𝜂L ist als Verhältnis der emittierten Lichtleistung und der
Material
InGaAsP/InGaAsP GaN/InGaN
𝝀0 ∕nm
iSch ∕mA
𝜼d
ℛd ∕(W∕A)
1550 405
15 35
0.33 0.33
0.26 1.0
elektrischen Eingangsleistung 𝑖𝑉 definiert, wobei 𝑉 die Spannung ist, die in Durchlassrichtung an der Diode anliegt. Da PA = 𝜂d (𝑖 − 𝑖Sch )(ℎ𝜈∕𝑒) ist, erhalten wir 𝜂L = 𝜂d (1 −
𝑖Sch ℎ𝜈 ) . 𝑖 𝑒𝑉
(18.60)
Bei Betrieb deutlich oberhalb der Schwelle, für 𝑖 ≫ 𝑖Sch , und für 𝑒𝑉 ≈ ℎ𝜈 ist 𝜂L ≈ 𝜂d . Laserdioden können Leistungsumwandlungswirkungsgrade von mehr als 50 % zeigen, deutlich über den Werten von LED (Tabelle 18.1) oder anderen Laserarten (Tabelle 16.2). Die elektrische Leistung, die nicht in Licht umgewandelt wird, wird in Form von Wärme angegeben. Weil Laserdioden aus diesem Grund merklich Wärme erzeugen, werden sie gewöhnlich auf Kühlkörpern montiert, die dazu dienen sollen, die Hitze zu verteilen und die Temperatur zu stabilisieren. Beispiel 18-9: Vergleich von Wirkungsgraden für Mehrfachquantenschicht- und DoppelheterostrukturInGaAsP-Laserdioden
Wir betrachten wieder Beispiel 18-8 für die Doppelheterostruktur-InGaAsP/InP-Laserdiode mit 𝜂i = 0.5, 𝛼Sp = 59 cm−1 , 𝛼R = 118 cm−1 und 𝑖Sch = 38 mA. Wenn
18.3 Laserdioden
das Licht von beiden Ausgängen genutzt wird, ist der Auskopplungswirkungsgrad 𝜂A = 𝛼Sp ∕𝛼R = 0.5, während die differentielle äußere Quantenausbeute 𝜂d = 𝜂A 𝜂i = 0.25 beträgt. Bei 𝜆0 = 1300 nm ist die differentielle Ansprechempfindlichkeit des Lasers ℛd = d P A ∕ d𝑖 = 0.24 W∕A. Für 𝑖 = 50 mA ist beispielsweise 𝑖 − 𝑖Sch = 12 mA und P A = 12 × 0.24 = 2.9 mW. Der Vergleich dieser Zahlen mit den in Abb. 18.44(a) und Tabelle 18.2 für eine bei 1500 nm betriebene MQWInGaAsP/InGaAsP-Laserdiode angegebenen offenbart wie erwartet, dass der MQW-Laser einen niedrigeren Schwellenstrom und eine höhere differentielle äußere Quantenausbeute als der Doppelheterostrukturlaser besitzt.
Zusammenfassung
Man unterscheidet bei Laserdioden vier unterschiedliche Wirkungsgrade: • Die innere Quantenausbeute 𝜂i = rs ∕r = 𝜏∕𝜏s berücksichtigt die Tatsache, dass nur ein Teil der ElektronLoch-Rekombinationen strahlend erfolgt. • Der Auskopplungswirkungsgrad 𝜂A berücksichtigt die Tatsache, dass nur ein Teil des aus dem Resonator austretenden Lichts nutzbar ist. • Die differentielle äußere Quantenausbeute 𝜂d = 𝜂A 𝜂i berücksichtigt beide genannten Effekte. • Der Leistungsumwandlungswirkungsgrad 𝜂L ist das Verhältnis der emittierten optischen Leistung zu der in das Bauelement eingespeisten elektrischen Leistung.
Tatsache beschreibt, dass nur ein kleiner Teil des in der Übergangsregion erzeugten Lichts aus dem Medium entweichen kann, der äußere Wirkungsgrad 𝜂ex = 𝜂i 𝜂A , der diese beiden Effekte gemeinsam berücksichtigt, und der Leistungsumwandlungswirkungsgrad 𝜂U . Auch die Ansprechempfindlichkeit ℛ wird als Maß für die Leistung einer LED verwendet. Zwischen den Größen 𝜂i , 𝜂A und 𝜂L für LED und LD besteht eine 1:1-Entsprechung. Außerdem besteht auch eine Korrespondenz zwischen 𝜂ex und 𝜂d , ℛ und ℛd sowie 𝑖 und (𝑖 − 𝑖Sch ). Die höhere Leistung des Lasers beruht auf der Tatsache, dass 𝜂A für die Laserdiode größer ist als für die LED. Das liegt wiederum darin begründet, dass der Laser auf der Grundlage der induzierten Emission funktioniert, sodass das Laserlicht in speziellen Moden konzentriert wird und daher leichter ausgekoppelt werden kann. Letztlich ist das Ergebnis, dass eine über der Schwelle betriebene Laserdiode einen Wert von 𝜂d besitzt, der größer ist als der entsprechende Wert von 𝜂ex einer LED. Wenn die Injektion in Superlumineszenzdioden so stark ist, dass die induzierte Emission über die spontane Emission überwiegt, zeigen die Dioden ein Verhalten zwischen dem von LED und Laserdioden. Wie in Abschnitt 18.2.5 diskutiert, versucht man in diesem Bauelementen Rückkopplung zu vermeiden, um das Einsetzen des Laserprozesses zu verhindern. Zum Vergleich der Leistungen dieser drei Klassen von Bauelementen sind in Abb. 18.45 Leistungs-StromKurven für eine lichtemittierende Diode, eine Superlumineszenzdiode und eine Laserdiode bei moderaten
Außerdem ist auch die differentielle Ansprechempfindlichkeit ℛd ein nützliches Maß für die Leistung.
Es ist interessant, die Wirkungsgrade und optischen Leistungen von LED, SLED und LD zu vergleichen. Unterhalb der Schwelle produzieren Laserdioden spontane Emission und verhalten sich wie lichtemittierende Dioden (siehe Abschnitt 18.1). Das Vorhandensein der spontanen Emission ist bei niedrigen Strömen in Leistungs-Strom-Kurven von Laserdioden zu erkennen. Der vier Wirkungsgrade, die den Betrieb von Laserdioden charakterisieren, wurden in der vorhergehenden Zusammenfassung beschrieben. Ebenso gibt es auch vier Wirkungsgrade für LED, die in Abschnitt 18.1 diskutiert wurden. Dabei handelt es sich um die innere Quantenausbeute 𝜂i , die die Tatsache beschreibt, dass nur ein Teil der Elektron-Loch-Rekombinationen strahlend erfolgt, der Auskopplungswirkungsgrad 𝜂A , der die
0 /mW
optische Ausgangsleistung
Vergleich der Wirkungsgrade und Leistungen von LED, SLED und LD
28 24 20 LD
16
LD 2
SLD
12 1
LED
8 0
0
80
160
240
4 0
SLD
LED 0
40
80
120 160 Strom i /mA
200
Abb. 18.45 Leistungs-Strom-Kurven für eine lichtemittierende Diode (LED), eine Superlumineszenzdiode (SLED) und eine Laserdiode (LD). Alle drei Bauelemente sind Mehrfachquantenschicht-InGaAsP/InP-Strukturen, die bei einer Wellenlänge von 1600 nm betrieben werden. Der Ausschnitt gibt eine vergrößerte Darstellung.
623
624
18 LED und Laserdioden
Stromstärken dargestellt. Alle Kurven beziehen sich auf InGaAsP/InP-Mehrfachquantenschichtstrukturen, die bei einer Wellenlänge von 1600 nm betrieben werden. Die Ansprechempfindlichkeiten und Wirkungsgrade der Laserdiode sind wesentlich größer als die der beiden anderen Bauelemente. Wie in dem kleinen Teilbild zu erkennen ist, weicht die Leistungs-Strom-Kurve der SLED charakteristisch nach oben ab, wohingegen die Kurve der LED infolge der Sättigung nach unten abweicht.
18.3.3 Spektrale und räumliche Eigenschaften von Laserdioden Spektrale Eigenschaften
Wie in Abschnitt 16.2.2 beschrieben, wird die spektrale Intensität des Laserlichts durch drei Faktoren bestimmt: 1) Die Bandbreite 𝐵, über die der aktive Gewinnkoeffizient 𝛾0 (𝜈) des Mediums für kleine Signale größer ist als der Verlustkoeffizient 𝛼R . 2) Die Natur der Linienverbreiterung (homogen oder inhomogen, siehe Abschnitt 14.3.4). 3) Die Resonatormoden, insbesondere den ungefähren Frequenzabstand 𝜈F = 𝑐∕2d zwischen den Longitudinalmoden, wobei d die Resonatorlänge ist. Halbleiterlaserdioden werden insbesondere durch die folgenden drei Eigenschaften charakterisiert: 1) Die spektrale Breite des Gewinnkoeffizienten ist relativ groß, weil die Übergänge zwischen zwei Energiebändern ablaufen und nicht zwischen zwei diskreten Energieniveaus. 2) Intrabandprozesse laufen sehr schnell ab, sodass Halbleiter meist homogen verbreitert sind. Durch räumliches Lochbrennen können trotzdem viele Longitudinalmoden gleichzeitig oszillieren (siehe Abschnitt 16.2.2). Räumliches Lochbrennen ist vor allem in kurzen Kavitäten häufig, in denen nur we-
nige Perioden der stehenden Welle vorliegen. Dadurch überlappen die Felder von unterschiedlichen entlang der Resonatorachse verteilten Longitudinalmoden weniger, was ein partielles räumliches Lochbrennen ermöglicht. 3) Die Resonatorlänge d von Halbleitern ist deutlich kleiner als bei den meisten anderen Laserarten. Der Frequenzabstand 𝜈F = 𝑐∕2d von benachbarten Resonatormoden ist daher relativ groß. Trotzdem passen im Allgemeinen viele Moden in die große Bandbreite 𝐵, über die der Gewinn für kleine Signale den Verlust übersteigt [die Zahl möglicher Lasermoden ist nach Gl. (16.46) 𝑀 = 𝐵∕𝜈F ]. Beispiel 18-10: Die Zahl von Longitudinalmoden in einer InGaAsP-Laserdiode
Ein InGaAsP-Kristall (𝑛 = 3.5) der Länge d = 400 μm besitzt Resonatormoden im Abstand 𝜈F = 𝑐∕2d = 𝑐0 ∕2𝑛d ≈ 107 GHz. In der Nähe der Mittenwellenlänge 𝜆0 = 1300 nm entspricht dieser Frequenzabstand einem Abstand 𝜆F der Vakuumwellenlänge, wobei 𝜆F ∕𝜆0 = 𝜈F ∕𝜈 ist, sodass sich 𝜆F = 𝜆0 𝜈F ∕𝜈 = 𝜆02 ∕2𝑛d ≈ 0.6 nm ergibt. Wenn die spektrale Breite 𝐵 = 1.2 THz ist (entsprechend einem Wellenlängenbereich Δ𝜆 = 7 nm), dann können näherungsweise 11 Longitudinalmoden oszillieren. Ein typisches Muster der spektralen Intensität aus einer einzelnen transversalen und ungefähr elf Longitudinalmoden ist in Abb. 18.46 gezeigt. Die Linienbreite der individuellen Longitudinalmoden liegt normalerweise in der Größenordnung von einigen zehn MHz für indexgeführte Laser und einigen GHz für gewinngeführte Laser. Die gesamte spektrale Breite des von Laserdioden emittierten Lichts ist größer als die der meisten anderen Laser (siehe Tabelle 15.1). Um die Zahl der Moden auf eins zu reduzieren, müsste die Resonatorlänge d so gewählt werden, dass 𝐵 = 𝑐∕2d erfüllt ist, was einen Resonator der Länge d ≈ 36 μm erfordern würde.
λ F = 0.6 nm
129 0
1300
1310
Abb. 18.46 Die spektrale Intensität eines indexgeführten InGaAsP-Heterostrukturlasers bei 1300 nm. Die Verteilung ist wesentlich schmaler und besitzt eine andere Form als die einer InGaAsP-LED bei 𝜆0 ≈ 1300 nm (siehe Abb. 18.67). Die Zahl der Moden nimmt mit steigendem Injektionsstrom ab; die Leistung der dem Gewinnmaximum nächstgelegenen
Wellenlänge λ 0 /nm
Mode nimmt zu, während die Seitenpeaks gesättigt werden. (Modifiziert nach R. J. Nelson, R. B. Wilson, P. D. Wright, P. A. Barnes, N. K. Dutta, ‚CW Electrooptical Properties of InGaAsP (𝜆 = 1.3 μ m) Buried-Heterostructure Lasers‘, IEEE Journal of Quantum Electronics QE-17, 202–207, 1981; Abb. 6. ©1981 IEEE.)
18.3 Laserdioden
LD
SLED
LED 1.4
1.5
1.6
1.7
1.8
λ 0/µm
Abb. 18.47 Normierte spektrale Intensitäten für eine LED, SLED und LD. Alle drei Bauelemente sind bei 1600 nm betriebene InGaAsP/InP-Strukturen. Die LED hat ein breites Spektrum, die LD hat ein schmales Spektrum und die SLED liegt zwischen beiden.
Vergleich der spektralen Intensitäten von LED, SLED und LD
Die spektralen Intensitäten von InGaAsP/InP-LED, -SLED und -LD sind in Abb. 18.47 dargestellt. In der SLED-Kurve und noch deutlicher in der LD-Kurve ist die spektrale Einengung aufgrund der induzierten Emission zu erkennen. Räumliche Eigenschaften
Wie bei anderen Fabry-Pérot-Lasern treten auch in Laserdioden transversale und longitudinale Moden auf. In Abschnitt 16.2.3 hatten wir die Indizes (𝑙, 𝑚) verwendet, um die räumlichen Verteilungen in transversaler Richtung zu charakterisieren, und den Index 𝑞, um die Variation entlang der Richtung der Wellenausbreitung zu bezeichnen, also das zeitliche Verhalten. In den meisten anderen Laserarten bleibt der Laserstrahl vollständig innerhalb des aktiven Mediums, sodass die räumlichen Verteilungen der Moden durch die Formen der Spiegel und ihre Abstände bestimmt sind. Für rotationssymmetrische Systeme können die transversalen Moden durch Hermite-Gauß- oder Laguerre-Gauß-Strahlen beschrieben werden (siehe Abschnitt 11.2.4). In Halbleiterlasern
liegt eine andere Situation vor, da sich der Laserstrahl außerhalb der aktiven Schicht ausbreitet. Die transversalen Moden (auch räumliche Moden genannt) sind daher Moden des dielektrischen Wellenleiters, der durch die unterschiedlichen Schichten der Laserdiode gebildet wird. Die transversalen Moden können mithilfe der in Abschnitt 9.3 für einen optischen Wellenleiter mit rechteckigem Querschnitt und den Abmessungen 𝑙 und w beschriebenen Theorie bestimmt werden. Wenn 𝑙∕𝜆0 hinreichend klein ist, erlaubt der Wellenleiter nur eine einzige Mode in der transversalen Richtung senkrecht zur Ebene des Übergangs. Allerdings ist w in der Regel größer als 𝜆0 , sodass parallel zur Ebene des Übergangs mehrere Moden möglich sind, wie Abb. 18.48 illustriert. Moden parallel zur Ebene des Übergangs werden laterale Moden genannt. Je größer das Verhältnis w ∕𝜆0 ist, desto mehr laterale Moden sind möglich. Die Strahlungsverteilung im Fernfeld
Eine kantenemittierende Laserdiode mit einer aktiven Schicht der Abmessungen 𝑙 und w emittiert Licht mit einer Winkeldivergenz im Fernfeld von ≈ 𝜆0 ∕𝑙 (Radian) in der Ebene senkrecht zum Übergang und ≈ 𝜆0 ∕w in der Ebene parallel zum Übergang, wie Abb. 18.49 zeigt. Das ähnelt der Situation für einen Gaußstrahl mit dem Durchmesser 2𝑊0 [siehe Gl. (3.21)], dessen Divergenz für 𝜃 ≪ 1 gleich 𝜃 ≈ (2∕π)(𝜆0 ∕2𝑊0 ) = 𝜆0 ∕π 𝑊0 ist. Die Divergenz bestimmt die Strahlungsverteilung im Fernbereich, wie in Abschnitt 4.3 besprochen wurde. Wegen der kleinen Abmessungen der aktiven Schicht ist die Divergenz von Laserdioden größer als die der meisten anderen Laser. Für 𝑙 = 2 μm, w = 10 μm und 𝜆0 = 800 nm sind die beiden Divergenzen beispielsweise ≈ 23◦ und 5◦ . Licht aus einer Laserdiode mit nur einer einzigen transversalen Mode, für die w kleiner ist, hat eine noch größere Winkeldivergenz. Die räumliche Verteilung des Lichts im Fernbereich innerhalb des Strahlungskegels hängt von der Zahl transversaler Moden und ihren op-
Abb. 18.48 Schematische Darstellung der räumlichen Verteilung der optischen Intensität für die Wellenleitermoden (l, m) = (1, 1), (1, 2) und (1, 3).
625
626
18 LED und Laserdioden
•λ0 l λ0
l
Abb. 18.49 Winkelverteilung des von einer kantenemittierenden Laserdiode emittierten optischen Strahls. Die Richtungen senkrecht und parallel zur Ebene des Übergangs werden als schnelle bzw. langsame Achse bezeichnet (nicht mit den gleichlautenden Bezeichnungen im Zusammenhang mit der Polarisation von Lichtstrahlen zu verwechseln!).
tischen Leistungen ab. Die stark asymmetrische elliptische Verteilung des Lichts einer Laserdiode macht eine Kollimation oft schwierig. Einmodenbetrieb: DBR- und DFB-Laser
Weil laterale Moden höherer Ordnung räumlich stärker ausgedehnt sind, sind sie schwächer eingegrenzt; ihr Verlustkoeffizient 𝛼R ist daher größer als der von Moden niedrigerer Ordnung. Deshalb erfüllen die Moden der höchsten Ordnungen oft die Oszillationsbedingungen nicht; andere oszillieren mit einer geringeren Leistung als die entsprechende Grundmode (niedrigster Ordnung). Um Einmodenbetrieb mit hoher Leistung zu erreichen, muss die Zahl der Wellenleitermoden reduziert werden, indem man die Dimensionen des Querschnitts der aktiven Schicht (𝑙 und w ) verringert, sodass sie als ein Einmodenwellenleiter wirkt. Die damit einhergehende Verminderung der Fläche des Übergangs hat gleichzeitig den Effekt, den Schwellenstrom zu reduzieren. Laterale Moden höherer Ordnung können beseitigt werden, indem man gewinngeführte oder indexgeführte Konstruktionen einsetzt. Betrieb auf einer einzigen Longitudinalmode, der ein monochromatisches Ausgangssignal produziert, kann durch Reduktion der Länge d des Resonators erreicht werden, sodass der Frequenzabstand zwischen angrenzenden Longitudinalmoden, d. h. der freie Spektralbereich 𝜈F = 𝑐∕2d des Fabry-Pérot-Resonators die spektrale Breite des Verstärkermediums überschreitet. Einmodenbetrieb kann auchdurch Verwendung von Vielfach-Spiegelresonatoren erreicht werden, wie in Abschnitt 16.2.4 diskutiert wurde und in Abb. 16.22 illustriert ist. Ein anderer Ansatz, um einen Betrieb auf einer einzigen Frequenz zu erreichen, ist der Einsatz von verteilten Reflektoren anstelle der gespalteten Kristalloberflächen, die in der Fabry-Pérot-Anordnung als lokalisierte Spiegel dienen. Wenn die Rückkopplung auf die Weise erfolgt, werden die Oberflächen des Kristalls antire-
flexbeschichtet, um Reflexionen zu minimieren. Zum Beispiel können frequenzselektive Reflektoren wie z. B. Bragggitter in die Ebene des Übergangs eingebracht werden [Abb. 18.50(a)]. Wie in den Abschnitten 2.4.2 und 7.1.3 besprochen, reflektiert ein Bragggitter das Licht, wenn die Gitterperiode 𝛬 die Beziehung 𝛬 = 𝑞𝜆∕2 mit einer ganzen Zahl 𝑞 erfüllt. Das in Abb. 18.50(a) dargestellte Bauelement wird verteilter Braggreflektorlaser oder einfacher DBR-Laser (engl. distributed Bragg reflector laser) genannt. Alternativ kann auch ein Bragggitter oberhalb oder unterhalb der aktiven Region als verteilter Reflektor wirken, wie Abb. 18.50(b) zeigt. Eine weitere Methode zur Erzeugung der Rückkopplung verwendet eine wellenförmige Struktur zwischen der aktiven und den führenden Schichten, wie in Abb. 18.50(c) gezeigt; diese Struktur bewirkt einen periodisch variierenden Brechungsindex und wirkt daher als Gitter. Strukturen dieser Art sind als Laser mit verteilter Rückkopplung oder kurz DFB-Laser (engl. distributed-feedback laser) bekannt. Sie erlauben einen monochromatischen Betrieb, der sehr robust gegenüber Fluktuationen des Stroms, der Temperatur und modulierenden Faktoren ist. Außerdem besitzen DFBLaser enge spektrale Breiten, große Modulationsbandbreiten und einen geringen Rauschpegel (die DFBAnordnung vermeidet die in Fabry-Pérot-Lasern vorhandenen Beiträge zum Rauschen aufgrund des Wettbewerbs zwischen verschiedenen Longitudinalmoden). Sie werden häufig als Lichtquellen für faseroptische Nachrichtensysteme im Wellenlängenbereich von 1300 bis 1600 nm verwendet (siehe Abschnitt 18.4.1). Der Linienverbreiterungsfaktor
Die Linienbreite Δ𝜈L des von einem Einmoden-Halbleiterlaser emittierten Lichts übersteigt die SchawlowTownes-Linienbreite Δ𝜈ST , die die Beiträge der spontanen Emission mit stochastischer Phase berücksichtigt, die sich der Lasermode mischen (Abschnitt 16.2.4). Die erhöhte Linienbreite resultiert aus der Kopplung der Fluktuationen von Phase und Intensität, die sich aus dem Einfluss der Ladungsträgerdichte in dem Halbleiter auf dessen Brechungsindex ergibt. Diese Kopplung wird durch einen Linienverbreiterungsfaktor 𝛼 (auch als 𝛼-Faktor bezeichnet) beschrieben, der als Proportionalitätskonstante die Änderungen der Phase mit der Feldverstärkung verknüpft. Ein typischer MQW-DFBLaser hat einen Linienverbreiterungsfaktor 𝛼 ≈ 4.5 bei einer Ausgangsleistung von 10 mW; Quantenpunktlaser besitzen kleinere Werte von 𝛼. Die Linienbreite einer Laserdiode ist um einen Faktor (1 + 𝛼)2 größer als die Linienbreite eines herkömmlichen Lasers, sodass das
18.4 Quanteneinschlusslaser
DBRGitter
Mehrfachquantenschicht aktive Region
Mehrfachquantenschicht aktive Region
DBRGitter (a)
(b)
Abb. 18.50 (a) Schematische Darstellung einer DBRMehrfachquantenschicht-Laserdiode mit DBR-Spiegeln außerhalb der aktiven Region. (b) Darstellung einer DFBMehrfachquantenschicht-Laserdiode, in der DBR unterhalb
Schawlow-Townes-Limit für eine Einmoden-Laserdiode durch Δ𝜈ST = π(1 + 𝛼)2 ℎ𝜈(δ𝜈)2 ∕P A gegeben ist.
(c)
der aktiven Region angeordnet sind. (c) Struktur einer DFBMehrfachquantenschicht-Laserdiode, bei der eine wellenförmige Struktur zwischen der aktiven und den führenden Schichten als verteilter Reflektor wirkt.
reflektierende AntireflexBeschichtung beschichtung
Spiegel
Beugungsgitter
Laserdioden mit externem Resonator und abstimmbarer Wellenlänge
Es gibt viele Situationen, in denen es vorteilhaft ist, die Wellenlänge einer Einmoden-Laserdiode einstellen zu können. Ein Beispiel hierfür ist ein kohärentes optisches Kommunikationssystem, für dessen Betrieb ein abstimmbarer lokaler Oszillator erforderlich ist (Abschnitt 25.4); andere Beispiele sind Wellenlängenmultiplexsysteme (Abschnitt 25.3.3), Systeme zur Wellenlängenkonversion und spektroskopische Anwendungen. Eine Änderung der Wellenlänge einer Laserdiode ist beispielsweise möglich, indem man den Brechungsindex des aktiven Mediums modifiziert, was über verschiedene physikalische Mechanismen wie die Injektion von Ladungsträgern, Anlegen eines elektrischen Feldes oder eine Veränderung der Temperatur erreicht werden kann. Weitaus bequemer kann eine solche Abstimmung aber erfolgen, wenn man den LED-Chip in eine externe Kavität als Resonator einbringt, die ein wellenlängenselektives Element enthält (siehe Abschnitt 16.2.4). Abgesehen davon, dass so die Wellenlänge eingestellt werden kann, führt dieser Ansatz auch noch zu einer willkommenen Verringerung der spektralen Breite. In der in Abb. 18.51 dargestellten Littman-Metcalf-Anordnung ist der LED-Chip am einen Ende hochreflektierend beschichtet, am anderen dagegen antireflexbeschichtet. Eine Sammellinse und ein externer Spiegel vervollständigen den Resonator, in den ein wellenlängenselektives Element (üblicherweise ein stationäres Beugungsgitter) eingefügt wird. Die Wellenlänge kann dann über die spektrale Breite 𝐵, über die ein Nettogewinn möglich ist, abgestimmt werden, indem der Spiegel so gedreht wird, dass er den gebeugten Strahl erster Ordnung zurück zur Laserdiode reflektiert. Ein besonderer Vorteil dieser Anordnung ist, dass die Richtung des Strahls am Ausgang bei der Abstimmung der Wellenlänge unverändert bleibt. Eine analoge faseroptische Anordnung verwendet ein Faser-Bragggitter (FBG).
Ausgangssignal
Laserdiode
Linse
Abb. 18.51 Littman-Metcalf-Anordnung für eine abstimmbare Laserdiode mit externem Resonator. Die Ausgangswellenlänge wird durch Drehen des Spiegels eingestellt.
Laserdioden mit externem Resonator lassen sich leicht modenkoppeln, da ein sättigbarer Absorber (Abschnitt 15.4.1) einfach in den Resonator eingesetzt werden kann, um eine passive Modenkopplung zu erzielen. Modengekoppelte Laserdioden mit externem Resonator bieten in bestimmten Anwendungen (z. B. faseroptische Kommunikation) Vorteile gegenüber modengekoppelten Faserlasern.
18.4 Quanteneinschlusslaser Quanteneinschlusslaser (auch quantenbeschränkte oder quantenbegrenzte Laser genannt, engl. quantumconfined lasers), in denen die Ladungsträger auf Abmessungen unterhalb der De-Broglie-Wellenlänge eines thermischen Elektrons (≈ 50 nm in GaAs) eingegrenzt werden, bieten ausgezeichnete Leistungen und sind die gebräuchlichsten Halbleiterlaserdioden. Die Eingrenzung in null, einer, zwei und drei Dimensionen entspricht normalen Halbleiterlasern sowie Quantenschicht-, Quantendraht- und Quantenpunktanordnungen, die in Abb. 18.52 dargestellt sind. Ihre geometrische Dimensionalität beträgt drei, zwei, eins und null. Quantenpunktstrukturen sind in drei Dimensionen eingegrenzt und besitzen daher eine geometrische Dimensionalität von null; Volumenhalbleiter sind in keiner Dimension eingegrenzt und haben folglich eine geometrische Dimensionalität von drei. Es ist üblich, Quanteneinschlussstrukturen nach ihrer geometrischen Dimensionalität einzuordnen. Einige grundlegende Ei-
627
18 LED und Laserdioden
+
Braggreflektoren
Eingrenzungsschichten
Substrat
Quantenschicht − aktive Region (a)
dielektrische Schicht
Quantendraht aktive Region (b)
Quantenpunkt aktive Region (c)
Abb. 18.52 Schematische Darstellung von Quanteneinschlusslasern. (a) Quantenschichtlaser (zweidimensional), (b) Quantendrahtlaser (eindimensional) und (c) Quantenpunktlaser (nulldimensional). Die Begrenzungsschichten grenzen die Ladungsträger auf die aktive Region ein und Braggreflektoren dienen als Spiegel.
genschaften von quantenbegrenzten Strukturen hatten wir bereits in Abschnitt 14.1.4 und 17.1.7 angesprochen. Die Dimensionalität einer Halbleiterstruktur bestimmt das Verhalten ihres Gewinnkoeffizienten, des Schwellenstroms, der differentiellen äußeren Quantenausbeute und ihrer Linienbreite. Wenn die Dimensionalität einer Halbleiterstruktur abnimmt, nimmt in der Regel auch das Volumen der aktiven Region ab, was zu einer Verringerung der Ausgangsleistung führt, insbesondere bei Quantendraht- und Quantenpunktlasern. In diesem Abschnitt besprechen wir nacheinander Quantenschicht-, Quantendraht- und QuantenpunktHalbleiterlaser. Danach wenden wir uns Quantenkaskadenlasern auf der Grundlage von Mehrfachquantenschicht-Bauelementen zu, die im Infrarotbereich erhebliche optische Leistungen erzeugen.
18.4.1
Einfach- und Mehrfachquantenschichtlaser
Im Zusammenhang mit LED, OHV, SLED und Laserdioden sind wir in den vergangenen Kapitel schon wiederholt Einfach- und Mehrfachquantenschichtsystemen begegnet. Wir in den Abschnitten 18.2 und 18.3 erläutert, bietet das in Abb. 18.52(a) dargestellte Quantenschichtbauelement eine deutlich höhere Leistung als die in den Abschnitten 18.2 und 18.3 besprochenen Doppelheterostrukturen. Der Grund dafür ist, dass die ein-
max. Gewinnkoeffizient γp
628
zelne Quantenschicht so dünn ist, normalerweise unter 10 nm; die Dicke einer Doppelheterostruktur-Laserdiode ist dagegen ≈ 100 nm und die einer traditionellen Homostruktur-Laserdiode ≈ 2 μm. Die Abhängigkeit des maximalen Gewinnkoeffizienten 𝛾max von der Stromdichte 𝐽 ist in Abb. 18.53 für (Einfach-) Quantenschicht- und DoppelheterostrukturVolumenhalbleiterlaser gegenübergestellt. Der Quantenschichtlaser hat eine viel kleinere Transparenzstromdichte 𝐽T . Sein Peak-Gewinnkoeffizient steigt zwar zunächst schnell an, läuft dann aber bei Vielfachen des maximalen Gewinnkoeffizienten 𝛾max wiederholt in die Sättigung [siehe Gl. (18.44)]. Der Quantenschichtlaser bietet gegenüber Doppelheterostrukturlasern die folgenden Vorteile: • • • • • • •
kleinere Schwellenstromdichte größere differentielle äußere Quantenausbeute größerer Leistungsumwandlungswirkungsgrad schmalbandigerer Gewinnkoeffizient kleinere Linienbreiten der Lasermoden geringere Temperaturabhängigkeit schnellere Reaktion und daher höhere Modulationsfrequenzen
Mehrfachquantenschichtlaser (MQW-Laser, Abb. 18.54) haben größere Gewinnkoeffizienten als Einfachquantenschichtlaser (SQW-Laser). Der Gewinnkoeffizi-
2 γmax Einfachquantenschicht
γmax
Jt1
Volumendoppelheterostruktur
Jt2
Stromdichte J
Abb. 18.53 Peak-Gewinnkoeffizient 𝛾p als Funktion der Stromdichte J für Einfachquantenschicht- und Doppelheterostruktur-Volumenhalbleiterlaser. Der Peak-Gewinnkoeffizient des Einfachquantenschichtlasers steigt steil an und wird dann bei einem Vielfachen des maximalen Gewinns 𝛾max gesättigt [siehe (18.44)].
18.4 Quanteneinschlusslaser
Eingrenzungsschichten Mehrfachquantenschicht aktive Region
Abb. 18.54 Schematische Darstellung der aktiven Region eines Mehrfachquantenschichtlasers. Die Begrenzungsschichten grenzen Ladungsträger auf den Bereich der Quantenschicht ein.
ent eines MQW-Lasers aus 𝑁 Schichten ist 𝑁 mal der einer einzelnen Schicht. Mehrfachquantenschichtlaser sind die verbreitetsten aller Laserdioden. Sie werden in einer unglaublichen Vielzahl von Anwendungen eingesetzt und umfassen den größten Teil aller in diesem Abschnitt und in Abschnitt 18.5 betrachteten Strukturen. Um einen fairen Vergleich der Leistungen von Einfach- (SQW-) und Mehrfachquantenschichtlasern zu ermöglichen, muss die Pumpleistung in beiden gleich groß sein. Wir betrachten eine einzelne Quantenschicht mit einer injizierten Überschuss-Ladungsträgerdichte Δn und einem maximalen Gewinnkoeffizienten 𝛾max . In einer vergleichbaren MQW-Struktur würden dann in jede der 𝑁 Schichten nur Δn∕𝑁 Ladungsträger injiziert. Wegen der nichtlinearen Abhängigkeit des Gewinns von Δn ist der Gewinnkoeffizient jeder Schicht dann 𝜉𝛾max ∕𝑁, wobei 𝜉 je nach den Betriebsbedingungen kleiner oder größer als eins sein kann. Der Gesamtgewinn des MQW-Lasers ist dann 𝑁(𝜉𝛾max ∕𝑁) = 𝜉𝛾max . Es zeigt sich, dass der SQW-Laser bei niedrigen Stromdichten in der Regel überlegen ist, wohingegen der MQW-Laser den Wettstreit bei hohen Stromdichten gewinnt, allerdings um einen Faktor kleiner als 𝑁. Laser mit verspannten Schichten
Die Einführung einer mechanischen Spannung kann die Leistung von Laserdioden verbessern, obwohl dies zunächst intuitiv nicht plausibel erscheinen mag. Laser mit verspannten Schichten können nützliche Eigenschaften haben und bei Wellenlängen außerhalb des Bereichs arbeiten, der durch Veränderung der Zusammensetzung zugänglich ist. Quanteneinschlusslaser mit verspannten Schichten aus III-V-Halbleitern wurden in verschiedenen Strukturen hergestellt. Anstatt die Gitterkonstante der aktiven Region an die der Begrenzungsschichten anzupassen, wird sie absichtlich davon verschieden gewählt. Wenn die Schicht dünn genug ist, kann sie ihren Atomabstand an den der umgebenden Schichten anpassen und erfährt dabei eine mechani-
sche Spannung (wenn die aktive Region zu dick ist, kann sich ihre Gitterkonstante nicht korrekt einstellen, und das Material enthält Versetzungen, die seine Verwendbarkeit einschränken). Die aktive InGaAs-Schicht in einem AlGaAs/InGaAs-Quantenschichtlaser mit einer verspannten Schicht hat zum Beispiel eine deutlich größere Gitterkonstante als die umgebenden AlGaAsSchichten. Die dünne InGaAs-Schicht erfährt daher eine biaxiale Kompression in der Ebene der Schicht, während die Atomabstände in der Richtung senkrecht zur Schicht über ihren Normalwert hinaus vergrößert werden. Umgekehrt würde eine aktive Schicht mit einer kleineren Gitterkonstante als die umgebenden Schichten eine biaxiale Dehnung in der Schichtebene erfahren, während die Abstände der Atome in der dazu senkrechten Richtung komprimiert würden. Die mechanische Spannung verändert die Bandstruktur auf drei Arten: Erstens vergrößert sie die Bandlücke E g , zweitens entfernt sie die Entartung zwischen den Bändern der schweren und leichten Löcher bei 𝑘 = 0, und drittens macht sie die Valenzbänder anisotrop, sodass das höchste Band in der Richtung parallel zur Schichtebene eine kleine effektive Masse hat, während es in der dazu senkrechten Richtung eine große effektive Masse hat. Diese Unterschiede können die Leistung von Lasern wesentlich verbessern. Erstens wird die Laserwellenlänge verändert, da E g von der mechanischen Beanspruchung abhängt. Zweitens kann die Schwellenstromdichte des Lasers durch die Beanspruchung reduziert werden. Damit eine Besetzungsinversion erzielt werden kann, muss der Abstand der Quasiferminiveaus größer sein als die Bandlücke, d. h. E FL − E FV > E g [siehe Gl. (17.54)]. Wegen der kleineren Masse der Löcher kann E FV leichter ins Valenzband fallen, sodass diese Bedingung bei geringeren Injektionsströmen erfüllt werden kann. Wir hatten bereits früher gesehen, dass eine mechanische Spannung einen entscheidenden Einfluss auf die Leistungsfähigkeit eines photonischen Bauelements haben kann – ohne sie gäbe es keinen Germaniumlaser (Beispiel 17-2). Materialien und Aufbau von Bauelementen
Die meisten heute verwendeten Halbleiterlaser verwenden aktive Regionen aus quantenbeschränkten Strukturen. Zunächst betrachten wir verschiedene Arten herkömmlicher Mehrfachquantenschicht-Laserdioden. Sie werden in einer Vielzahl von Anwendungen eingesetzt, die von Alltagsprodukten wie Laserdruckern und optischen Datenspeichern bis hin zu faseroptischen Langstrecken-Kommunikationssystemen reichen. Sie dienen auch als hocheffiziente optische Pumpen für optische Faserverstärker, Faserlaser und Festkörperlaser.
629
630
18 LED und Laserdioden
Die Materialien und Strukturen der meisten herkömmlichen Laserdioden ähneln denen von Leuchtdioden (Abschnitt 18.1.3). Vom nahen Infrarot bis ins mittlere Ultraviolett werden ternäre und quaternäre Materialien mit direkter Bandlücke verwendet, weil ihre Wellenlängen über die Zusammensetzung abgestimmt werden können. Wie bei LED sind AlInGaN, AlInGaP, InGaAs und InGaAsP die wichtigsten quaternären Materialien. Typische Wellenlängen von Laserdioden sind 635, 650, 680 und 780 nm für die Verwendung in Laserpointern, optischen Speicher- und Anzeigesystemen und Kurzstrecken-Kommunikationssystemen auf der Grundlage von Kunststofffasern, 850 nm für Kurzstrecken-Kommunikationssysteme auf der Basis von Glasfasern und 1300–1600 nm für Langstrecken-Kommunikationssysteme (ebenfalls auf der Basis von Glasfasern). Typische Wellenlängen zum Pumpen von Festkörper und Faserlasern sind 793 nm (AlGaAs) für thuliumdotierte Quarzglasfasern, 808 und 880 nm (AlGaAs) für neodymdotiertes Yttriumvanadat und YAG, 940 nm (InGaAs) für ytterbiumdotierte YAG- und Quarzglasfasern und 980 nm (InGaAs) für erbiumdotierte Quarzglasfasern. Andere Wellenlängen handelsüblicher Laserdioden sind beispielsweise 375, 405, 440, 670, 785, 830 und 920 nm. Laserdioden auf der Grundlage von Bleisalzen können Wellenlängen bis 30 μm liefern, wurden jedoch inzwischen weitgehend durch Quantenkaskadenlaser im mittleren Infrarot verdrängt. Kantenemittierende Laserdioden können optische Leistungen im Bereich von einigen Milliwatt bis zu zehn Watt mit Leistungsumwandlungswirkungsgraden von mehr als 70 % liefern und erlauben Geschwindigkeiten um 10 GHz; ihre Lebensdauer beträgt mehrere Jahre. Einmoden-MQW-Laser
In Lasern, die einen schmalen Wellenleiter in Form eines Stegs oder einer versenkten Brechungsindexstufe mit einer Breite zwischen 2 und 5 μm enthalten, ist nur eine einzige räumliche Mode möglich (Abschnitt 9.3). Derartige Laser werden immer dann eingesetzt, wenn es wichtig ist, den Laserstrahl auf einen beugungsbegrenzten Punkt fokussieren zu können, beispielsweise bei der optischen Datenspeicherung, in der Druck- oder Messtechnik oder der faseroptischen Kommunikation. Die geringe Größe des Wellenleiters in solchen Bauelementen begrenzt die optische Leistung auf ein Maximum von etwa 1 W. In Einmoden-MQW-Lasern mit Fabry-PérotResonator wie dem nachstehend beschriebenen Stegwellenleiterlaser, erfolgt die Laseroszillationen im Allgemeinen auf mehreren Longitudinalmoden.
Ein Betrieb auf einer einzelnen Longitudinalmode ist durch Verwendung einer verteilten Rückkopplung (DFB, von engl. distributed feedback) anstelle der FabryPérot-Rückkopplung möglich, die nur für eine einzige Frequenz eine Rückkopplung liefert. DFB-Laser haben daneben noch eine ganze Reihe weiterer vorteilhafter Eigenschaften (Abschnitt 18.3.3). Signal- und Pumpquellen für faseroptische Kommunikationssysteme müssen ein sehr enges Spektrum und geringes Rauschen aufweisen und erfordern daher Laser, die sowohl räumlich als auch longitudinal auf einer einzigen Mode betrieben werden. Geeignete Laser liefern im Allgemeinen einige Milliwatt bis Watt an optischer Leistung und sind fasergekoppelt. Die im Folgenden beschriebene DFB-Laserdiode mit einer versenkten Heterostruktur ist ein äußerst zuverlässiges Bauelement mit genau diesen Eigenschaften. Fabry-Pérot-Laser mit versenktem Stegwellenleiter
Die Stegwellenleiter-Laserdiode arbeitet auf einer einzigen räumlichen Mode und kann über einen weiten Wellenlängenbereich abstrahlen. Der Stegwellenleiter bewirkt eine schwache Wellenführung sowie eine Gewinnführung, weil er die Strominjektion in die aktive Region unterhalb des Stegs behindert. Solche Laserdioden haben häufig eine Fabry-Pérot-Struktur mit gespaltenen Kristallflächen. Das in Abb. 18.55 gezeigte 500 μm lange Bauelement enthält eine aktive Region aus sechs 7 nm dicken, auf Kompression verspannten InGaAsPQuantenschichten zwischen 10 nm dicken, auf Dehnung verspannten InGaAsP-Barrieren. Die hier abge-
+ InGaAsP/InGaAsP-MQW aktive Region
InGaAsKontaktschicht dielektrische Schicht InPMantelschichten
InGaAsPWellenleiter InPSubstrat
−
Abb. 18.55 Schematische Darstellung einer verspannten MQW-InGaAsP/InGaAsP-Laserdiode mit versenktem Stegwellenleiter, die bei 1550 nm arbeitet. Die aktive Region unter dem Steg ist ringsum von Material mit niedrigerem Brechungsindex umgeben, sodass der Steg einen optischen Wellenleiter bildet. Dieser Laser arbeitet auf einer einzigen räumlichen, aber auf mehreren longitudinalen Moden. Die Leistungs-Strom-Kurve für dieses Bauelement ist in Abb. 18.44(a) gezeigt.
18.4 Quanteneinschlusslaser
bildete Laserdiode besitzt einen Schwellenstrom von 15 mA, eine differentielle äußere Quantenausbeute von 0.33 % und eine differentielle Ansprechempfindlichkeit ℛd = 0.26 W∕A und emittiert eine optische Leistung von 20 mW.
auf einen beugungsbegrenzten Punkt fokussiert noch effizient in Einmodenfasern eingekoppelt werden, eignet sich jedoch für Anwendungen wie das Pumpen von optischen Faserverstärkern, Mehrmantel-Faserlasern und diodengepumpten Festkörperlasern.
Laser auf Basis einer eingebetteten Heterostruktur mit verteilter Rückkopplung
Laserdiodenbarren und -stapel
Wie in Abb. 18.56 dargestellt, ermöglichen in diesem Bauelement mit einer eingebetteten Heterostruktur alternierende p- und n-dotierte Schichten nur in der Nähe der aktiven Region einen Stromfluss; auf diese Weise entsteht eine laterale Eingrenzung. Die dielektrische Schicht liefert eine Gewinnführung. Die verteilte Rückkopplung wird durch ein Gitter in Form einer gewellten Schicht neben der aktiven Region bewirkt, die als verteilter Reflektor wirkt (siehe Abschnitt 18.3.3). Derartige Laser zeigen schon bei moderaten Strömen einen großen Gewinn und liefern Ausgangsleistungen von mehr als 1 W in einer einzigen räumlichen und longitudinalen Mode. Solche Bauelemente bieten schmale Bandbreiten, was für den effizienten Betrieb von Wellenlängenmultiplex-Nachrichtensystemen bei 1300–1600 nm entscheidend ist (siehe Abschnitt 25.1.2). Typische Werte des Schwellenstroms und der differentiellen Ansprechempfindlichkeit sind 𝑖Sch < 10 mA und ℛd ≈ 0.4 W∕A; Δ𝜈 beträgt einige MHz. +
dielektrische Schicht p-InP
n-InP InPSubstrat DFBGitter aktive Region InGaAsP/InGaAsP-MQW
Noch höhere Laserleistungen können erreicht werden, indem man Vielmoden-Laserdioden zu Barren und Stapeln kombiniert, die als Pumpen für diodengepumpte Festkörperlaser (Abschnitt 16.3.1) oder direkt zur Materialbearbeitung eingesetzt werden können. Ein üblicher Barren besteht aus 10 bis 50 Breitstreifen-Laserdioden, die zusammenhängend in einem eindimensionalen Array angeordnet und in einen einzelnen Chip integriert sind. Ein Barren zum Pumpen eines DPSSLasers hat typischerweise eine Länge von 1 cm, emittiert 100 W partiell kohärente optische Leistung und hat einen Leistungsumwandlungswirkungsgrad in der Gegend von 50 % (Beispiel 16-1). Barren werden häufig zu Stapeln kombiniert, wodurch die optische Leistung auf Werte im Kilowattbereich gesteigert wird. Am Lawrence Livermore National Laboratory (LLNL) wurden leistungsstarke Stapel entwickelt, die als Pumpen für die Nd3+:Quarzglas-Laserverstärker des HAPLS-Petawattlasersystems dienen. Wie in Beispiel 23-3 beschrieben, liefert ein einzelner Stapel aus mehr als 125 000 AlGaAsLaserdioden Pulse bei einer Wellenlänge von 888 nm mit einer Energie von 250 J und einer Dauer von 0.3 ms, einer Peakleistung von 800 kW und einer mittleren Leistung 2.5 kW bei einer Wiederholrate von 10 Pulsen pro Sekunde. Ein solcher Stapel besteht aus einer Anordnung von 1600 Barren mit einer Leistung von je 500 W in einem Abstand von 350 μm voneinander. Der Leistungsumwandlungswirkungsgrad des Stapels beträgt 𝜂U ≈ 60 %.
18.4.2 Quantendrahtund Mehrfachquantendrahtlaser −
Abb. 18.56 MQW-DFB-Laser auf Basis einer eingebetteten Heterostruktur, der für optische Nachrichtensysteme im Wellenlängenbereich 1300–1600 nm eingesetzt wird. Dieser Laser arbeitet sowohl auf einer einzigen räumlichen als auch auf einer einzigen longitudinalen Mode.
Vielmoden-MQW-Laser
Wenn die Breite der aktiven Region einer Laserdiode von einigen μm auf beispielsweise 200 μm erhöht wird, kann sie auf mehreren räumlichen Moden betrieben werden und optische Leistungen von bis zu 10 W liefern. Bauelemente dieser Art werden als Breitstreifen-Laserdioden bezeichnet. Das Licht derartiger Laser kann weder
Auch Quantendrähte (siehe Abschnitt 17.1.7) können als aktive Region eines Halbleiterlasers dienen, wie Abb. 18.52(b) zeigt. Mehrfachquantendrahtlaser bestehen aus Anordnungen von Quantendrähten, siehe Abb. 18.57. Im Prinzip ermöglichen Mehrfachquantendrahtlaser kleinere Linienbreiten als Quantenschichtlaser, weil die Ladungsträger in ihnen stärker eingegrenzt sind. Allerdings ist die Herstellung von III-VQuantendrahtstrukturen lange nicht so fortgeschritten wie die von Quantenschichtstrukturen – unter anderem wegen der Schwierigkeit, eine ausreichend dichte Anordnung von Drähten zu erzeugen –, und dasselbe gilt folglich auch für ihre Leistung.
631
632
18 LED und Laserdioden
Mehrfachquantenpunkt aktive Region
Mantel
Mehrfachquantendraht aktive Region
Abb. 18.57 Schematische Darstellung der aktiven Region eines Mehrfachquantendrahtlasers. Das Licht wird gewöhnlich in alle Richtungen ausgestrahlt, obwohl die Laseremission mithilfe eines passenden Resonators auf die Auslassfenster beschränkt werden kann.
Beispiel 18-11: Leistung von Quantenschicht- und Mehrfachquantendrahtlasern
Fünf 1 mm lange und 23 nm breite InGaAsP-Quantendrähte, die in Abständen von 80 nm in InP eingebettet sind, bilden die aktive Schicht eines bei Zimmertemperatur bei einer Wellenlänge 𝜆0 ≈ 1550 nm kontinuierlich betriebenen Mehrfachquantendrahtlasers. Der Schwellenstrom, die Schwellenstromdichte, die differentielle äußere Quantenausbeute und der Leistungsumwandlungswirkungsgrad sind 𝑖Sch = 140 mA, 𝐽Sch = 800 A∕cm2 , 𝜂d = 40 % und 𝜂U = 2 %. 2) Infolge des kleinen Volumens der aktiven Region und der bedeutenden optischen Verluste zeigt sich jedoch, dass die Leistung dieses Mehrfachquantendrahtlasers der eines aus demselben Chip hergestellten Quantenschichtlasers unterlegen ist, der die Parameter 𝑖Sch = 100 mA, 𝐽Sch = 500 A∕cm2 , 𝜂d = 50 % und 𝜂U = 6 % erreicht.
18.4.3 Quantenpunkt- und Mehrfachquantenpunktlaser Quantenpunkte, die oft auch als Nanokristalle bezeichnet werden, sind kleine Halbleiterstrukturen in der Form von Würfeln, Kugeln oder Pyramiden. Ihre Abmessungen liegen normalerweise im Bereich 1–10 nm (ein Würfel aus GaAs mit einer Kantenlänge von 10 nm enthält ungefähr 40 000 Atome). Die Ladungsträger können eingegrenzt werden, indem die Quantenpunkte mit einem Halbleiter mit größerer Bandlücke ummantelt oder in Glas oder Polymere eingebettet werden. Abbildung 18.52(c) zeigt einen solchen Quantenpunkt. Die Herstellung und die grundsätzlichen Eigenschaften von Quantenpunkten wurden in Abschnitt 14.1.4 2) Siehe H. Yagi, T. Sano, K. Ohira, D. Plumwongrot, T. Maruyama, A. Haque, S. Tamura, S. Arai, ‚GaInAsP/InP Partially Strain-Compensated Multiple-Quantum-Wire Lasers Fabricated by Dry Etching and Regrowth Processes‘, Japanese Journal of Applied Physics 43, 3401–3409, 2004.
Mantel
Abb. 18.58 Schematische Darstellung der aktiven Region eines Mehrfachquantenpunktlasers, der oft auch aus vielen Schichten besteht. Jede Schicht enthält zahlreiche selbstorganisierte Quantenpunkte. Typische Abmessungen selbstorganisierter Quantenpunkte liegen im Bereich 10–50 nm.
diskutiert und ihre Energieniveaus wurden in Abschnitt 17.1.7 untersucht. Die Energieniveaus eines Quantenpunkts sind die seiner Excitonen. Obwohl die Niveaus aufgrund der engen Eingrenzung der Ladungsträger scharf sind, hängen ihre Energien stark von der Größe des Punkts ab. Die Energie der Photolumineszenzphotonen nimmt mit abnehmender Größe des Quantenpunkts zu, da mehr Energie erforderlich ist, um die Anregung des Halbleiters auf ein kleineres Volumen einzugrenzen (siehe Abschnitt 14.1.4). Da sich Quantenpunkte durch Selbstorganisation zu geordneten Strukturen anordnen können, ist es nicht so schwierig wie man erwarten könnte, einen Mehrfachquantenpunktlaser mit einer aus vielen Quantenpunkten bestehenden aktiven Region zu konstruieren, wie Abb. 18.58 zeigt. Die erste derartige Struktur wurde bereits im Jahr 1994 realisiert. GaA- und InP-basierte Mehrfachquantenpunktlaser, die im Wellenlängenbereich zwischen 1.3 und 1.55 μm arbeiten, bieten eine Reihe von Vorteilen gegenüber Quantenschichtlasern: • Sehr niedrige CW-Schwellenstromdichten bei Zimmertemperatur, 𝐽Sch ≈ 10 A∕cm2 pro Schicht von Quantenpunkten – um einen Faktor 5 kleiner als diejenigen von MQW-Lasern. • Sehr gute Werte für Gewinn und differentielle Quantenausbeute. • Geringere Abhängigkeit der Schwellenstromdichte von der Temperatur; ein ungekühlter Laserbetrieb ist für Übergänge aus dem Grundzustand bei Temperaturen von bis zu 200 ̊C möglich, sodass keine externe Kühlung erforderlich ist. • Eine geringere Empfindlichkeit gegenüber Defekten erleichtert die Kombination von III-V-Lasern mit Materialien der Gruppe IV wie Si oder Ge. • Kleinerer Linienverbreiterungsfaktor und geringere Linienbreite; das Produkt aus Linienbreite und Leistung eines Quantenpunkt-DFB-Lasers beträgt ≈
18.4 Quanteneinschlusslaser
•
• •
•
1 MHz mW bei einer Ausgangsleistung von 2 mW – eine Größenordnung kleiner als das eines handelsüblichen Quantenschicht-DFB-Lasers mit derselben Leistung. Größere Betriebsbandbreite von bis zu 200 nm; Betrieb mit abstimmbarer Wellenlänge ist durch Verwendung eines externen Resonators möglich (siehe Abschnitt 18.3.3). Erhöhte Modulationsbandbreite für direkte Modulation (derzeit ≈ 20 GHz bei Zimmertemperatur). Unempfindlichkeit gegenüber optischer Rückkopplung für Störlicht, das in den Resonator eindringt, wodurch beim Einsatz in einem faseroptischen Kommunikationssystem keine Isolatoren erforderlich sind. Modengekoppelter Betrieb mit kurzen Pulsen und hohen Wiederholungsraten ist aufgrund der großen Bandbreite, schnellen Gewinndynamik, leicht sättigbarer Verstärkung und Absorption sowie des kleinen Linienverbreiterungsfaktors möglich.
Die geringe Größe und der geringe Stromverbrauch von Quantenpunktlasern sowie die Möglichkeit, sie auch bei hohen Temperaturen ungekühlt zu betreiben, machen Quantenpunktlaser für den Einsatz in speziellen Anwendungen interessant. Dazu gehören beispielsweise Sensorikanwendungen in heißen Umgebungen sowie der Einsatz für die optische Taktrückgewinnung oder in optischen Zeitmultiplexsystemen mit hoher Datenrate (siehe Kapitel 24).
18.4.4 Quantenkaskadenlaser Alle bis jetzt besprochenen Halbleiterlaser basieren auf der strahlenden Elektron-Loch-Rekombination. Die Lichterzeugung in solchen Interbandlasern ist ein Zweiladungsträger-Einphotonenprozess: Die Kombination eines Elektrons im Leitungsband mit einem Loch im Valenzband erzeugt ein Photon. Der Quantenkaskadenlaser (QCL) erzeugt im Gegensatz dazu aus einem einzigen Ladungsträger, einem Elektron, mehrere Photonen. Der QCL ist daher nicht bipolar, sondern unipolar. Quantenkaskadenlaser bestehen aus einer Verkettung von Quantenschichten, die so entworfen und verschaltet sind, dass ein ins Leitungsband injiziertes Elektron eine Kaskade von lichtemittierenden Übergängen zwischen Unterbändern vollzieht, während es das Bauelement durchquert (Abb. 18.59). Die Betriebswellenlänge eines QCL hängt folglich nicht von den Bandlücken der beteiligten Materialien ab, sondern wird von den Dicken der Quantenschichten und Barrieren bestimmt, die wiederum die energetischen Abstände der Bänder und Minibänder in dem System festlegen (Abb. 17.5). Mit seinen hunderten oder sogar tausenden von einzelnen Schichten ist der Quantenkaskadenlaser ein Musterbeispiel für das sogenannte BandstrukturEngineering. Die aktive Region eines Quantenkaskadenlasers besteht entweder aus Quantenschichten oder aus Übergittern. Wie in Abb. 18.59(a) gezeigt besteht die Quantenschichtvariante aus einer Folge von Stufen, die jeweils einen n-dotierten Elektroneninjektor und eine intrinsische Quantenschicht als aktive Region enthalten. Der
Injektor
Injektor aktive Region
aktive Region Injektor
Injektor aktive Region
aktive Region Miniband 2
Miniband
Miniband
3 2
Miniband 2
1 0
Miniband 1
Miniband
Miniband
3 2
Stufe
Stufe
1
Miniband 1
0
(a)
(b)
Abb. 18.59 Schematische Darstellung (a) zweier Stufen eines QCL mit einer Quantenschicht als aktiver Region und (b) zweier Stufen eines QCL mit einem Übergitter als aktiver Region. QCL enthalten gewöhnlich etwa 20 bis 100 Stufen entsprechend einigen hundert bis mehreren tausend einzelnen Halbleiterschichten.
633
634
18 LED und Laserdioden
Injektor enthält eine Anordnung von Schichten unterschiedlicher Dicke und dünnen Barrieren, die ein Übergitter mit einem Energieniveaudiagramm von Minibändern bilden, die durch Minibandlücken voneinander getrennt sind (siehe Abschnitt 14.1.4). In Gegenwart einer äußeren Spannung werden die Elektronen durch resonantes Tunneln vom tiefsten Niveau (Grundzustand) eines Minibands (als Niveau 3 bezeichnet) ins obere Laserniveau in der aktiven Region (als Niveau 2 bezeichnet) injiziert. Durch induzierte Emission auf dem Übergang zwischen den Unterbändern 2 → 1 wird ein Photon der Frequenz 𝜈 = E 21 ∕ℎ emittiert, wie durch den wellenförmigen senkrechten Pfeil angedeutet (siehe Abschnitt 17.2.4). Das Elektron geht dann durch Phononenstreuung in das Niveau 0 über, woraufhin es durch resonantes Tunneln in das Miniband der nächsten Stufe übergeht. In dieser Stufe wiederholt sich der Prozess, und ein neues Photon wird emittiert. Ein typischer QCL enthält 20–100 Stufen, sodass für jedes Elektron, das das Bauelement durchquert, eine große Zahl von Photonen erzeugt wird. Weil er auf Übergängen zwischen Unterbändern beruht, ähnelt der Quantenschicht-QCL einem elektrisch gepumpten Gaslaser. Wie Abb. 18.59(a) zeigt, entspricht Niveau 2 keinem Miniband der folgenden Stufe, sodass es eine relativ lange Lebensdauer (𝜏2 ≈ 1 ps) hat und daher eine Besetzung aufbaut. Niveau 1 wird im Gegensatz dazu nicht besetzt, da Niveau 0 durch einen schnellen nichtstrahlenden Übergang und anschließendes Tunneln in die folgende Stufe erreicht wird (𝜏1 ≈ 0.1 ps). Die Quantenschicht der aktiven Region verhält sich daher wie ein Vierniveausystem mit einer Besetzungsinversion auf dem Übergang 2 → 1 (siehe Abschnitt 15.2.2). Der Gewinnkoeffizient 𝛾0 (𝜈) eines QCL ist daher wie bei einem Atomlaser [siehe Gl. (16.1)] proportional zu einer schmalen Linienformfunktion 𝑔(𝜈) und nicht zu einer breiten Zustandsdichte 𝜌(𝜈) wie in einem InterbandHalbleiterlaser [siehe Gl. (18.35)]. Die Linienbreite von QCL resultiert aus der Lebensdauerverbreiterung, Intersubband-Streuung und Abweichungen der Subbänder von der Parabelform. Der in Abb. 18.59(b) dargestellte Übergitter-QCL unterscheidet sich von einem Quantenschicht-QCL insofern, als die induzierte Emission zwischen dem Boden und der Spitze zweier Minibänder in der aktiven Region stattfindet, die in diesem Fall aus einem Übergitter besteht (siehe Abschnitt 17.2.4). Die Laserfrequenz ergibt sich daher aus der Größe der Minibandlücke zwischen den beiden Minibändern. Diese Struktur ist im Allgemeinen besser geeignet, um kohärentes Licht größerer Wellenlängen (𝜆0 ≥ 10 μm) zu erzeugen, da die gegenseitige Ausrichtung des Injektors und der aktiven Region
weniger kritisch ist. Außerdem können höhere Injektionsströme verwendet werden und die Besetzungsinversion wird wegen der schnellen Relaxation in das tiefere Miniband einfacher erreicht. Ein ganz anderes Konstruktionsprinzip für die aktive Region eines QCL nutzt Übergänge von einem diskreten oberen Zustand in ein Übergitterminiband, ein sogenanntes bound-to-unbound-Schema. Diese Variante kombiniert die effiziente Injektion von Elektronen in das obere Laserniveau wie in Quantenschicht-QCL mit der schnellen Relaxation des unteren Laserniveaus wie in Übergitter-QCL und bietet dadurch eine reduzierte Schwelle und eine höhere Leistung. Es gibt noch zahllose weitere QCL-Konstruktionen wie beispielsweise Übergitterstrukturen ohne Injektorbereich, heterogene QCL, die durch Verwendung mehrerer Kaskaden bei unterschiedlichen Wellenlängen breitbandige Strahlung oder Superkontinuumsemission erzeugen, Anordnungen, die das Licht in Oberflächenplasmonmoden führen, sodass ein Betrieb bei großen Wellenlängen ohne dicke dielektrische Wellenleiter möglich wird, oder Ramanlaser, die durch einen integrierten Quantenkaskadenlaser gepumpt werden. Auch oberflächenemittierende und Ringresonatoranordnungen wurden entwickelt. QCL-Arrays sind ebenfalls einfach aufzubauen. QCL können bei Wellenlängen vom nahen bis zum fernen Infrarot und darüber hinaus im THz-Bereich betrieben werden, und das alles mit derselben Anordnung der Heterostruktur. Die kürzeste Wellenlänge, die für einen QCL möglich ist, wird durch den Offset des Leitungsbands der Heterostruktur festgelegt, der die größtmögliche Photonenenergie für Intersubbandübergänge bestimmt – große Offsets machen einen Laserbetrieb bei kleineren Wellenlängen möglich. Einmodenbetrieb kann durch Integration einer verteilten Rückkopplung erreicht werden. Rückkopplung durch einen äußeren Resonator in Verbindung mit einem drehbaren Gitter (siehe Abschnitt 16.2.4) ermöglicht eine feinere Abstimmung der Wellenlänge in einem Bereich von etwa 10 % der Mittenwellenlänge (≈ 1 μm bei einer Mittenwellenlänge von 10 μm). Eine Feinabstimmung der Wellenlänge in einem Bereich um 1 % der Mittenwellenlänge ist möglich, indem der Injektionsstrom und/oder die Temperatur verändert werden, die den effektiven Brechungsindex beeinflussen und dadurch wiederum die optische Weglänge des Resonators und damit die Emissionswellenlänge. Sogenannte sampled-grating-DFB-QCL (und Arrays davon) davon erweitern diese Abstimmbarkeit noch erheblich, indem sie ein Paar von Reflexionsgittern mit geringfügig unterschiedlicher periodischer räumlicher Modulation verwenden. Dies führt im Wel-
18.4 Quanteneinschlusslaser
lenlängenbereich zu zwei Folgen periodischer Reflexionsmaxima mit geringfügig unterschiedlichen Abständen. Dadurch wird ein Einfrequenzbetrieb möglich, da eine Oszillation nur auftreten kann, wenn zwei Reflexionsmaxima exakt ausgerichtet sind, wie die Abb. 16.21 und 16.22 für Spiegelresonatoren zeigen. Ein Betrieb als Frequenzkamm im mittleren Infrarot ist ebenfalls problemlos möglich (Abschnitt 16.4.5). Die Liste der Möglichkeiten ist wahrhaft endlos. Quantenkaskadenlaser im mittleren Infrarot
Das Interesse am mittleren Infrarotbereich des elektromagnetischen Spektrums entstand ursprünglich aufgrund der beiden Bereiche der atmosphärischen Transparenz bei 3−5 μm und bei 8−14 μm. Die Wellenlängen von Quantenkaskadenlasern decken sowohl das mittlere Infrarot (2 ≤ 𝜆0 ≤ 20 μm) sowie Teile des fernen Infrarot (20 ≤ 𝜆0 ≤ 300 μm) und des THz-Bereichs (100 ≤ 𝜆0 ≤ 1000 μm) ab (siehe Abb. 2.1). Dieser breite Wellenlängenbereich bietet umfangreiche Möglichkeiten für wissenschaftliche, industrielle und militärische Anwendungen, beispielsweise Infrarotspektroskopie, Bildgebung im Infraroten und Gegenmaßnahmen, Verbrennungsanalytik, Entfernungsmessung und optische Kommunikation im Vakuum. Da diese Bänder den molekularen Fingerprint-Bereich einschließen, in dem die Wellenlängen der Rotationsschwingungsübergänge vieler Moleküle liegen (Abschnitt 14.1.3), haben QCL außerdem zahlreiche Anwendungen im Bereich Fernsensorik hervorgebracht, beispielsweise Spurengasanalyse und -sensorik, chemische Sensorik und Diagnostik sowie Isotopenanalyse. In Verbindung mit Zimmertemperatur-Infrarotdetektoren wie z. B. HgCdTe-Photovoltaik-Arrays und VOxMikrobolometern (Abschnitt 19.5) ermöglichen QCL einen zuvor unerreichten Zugang zum mittleren Infrarot. Wie bereits erwähnt wird die Betriebswellenlänge eines QCL durch die Dicken ihrer Quantenschichten und Barrieren bestimmt, die wiederum die energetischen Abstände der Sub- und Minibänder definieren. Grundsätzlich können QCL daher aus einer Vielzahl von Halbleitermaterialien aufgebaut werden, obwohl der Intersubband-Gewinnkoeffizient von den effektiven Massen der Ladungsträger in den Schichten und Barrieren abhängt, die wiederum von den verwendeten Materialien abhängen. Gute Leistungen wurde durch Verwendung von MBE oder MOCVD auf der Basis der folgenden Materialsysteme erzielt: • InGaAs/InAlAs-Quantenschichten auf einem InPSubstrat • GaAs/AlGaAs-Quantenschichten auf einem GaAsSubstrat
• InAs/AlSb-Quantenschichten auf einem InAs-Substrat • InGaAs/AlInAsSb, InGaAs/GaAsSb oder InGaAs/ AlInGaAs auf InP • GaN/AlGaN-Quantenschichten auf einem GaN-Substrat Ähnlich wie bei Interbandlasern bieten auch QCL mit verspannten Schichten (z. B. druckverspanntes InGaAs oder zugverspanntes InAlAs) eine verbesserte Leistung. QCL werden häufig mit einer versenkten Heterostruktur hergestellt, die zwischen 10 und 100 Stufen mit Gesamtlängen zwischen 0.5 und 10 mm und Breiten zwischen 5 und 20 mm enthält. Bei Zimmertemperatur zeigen QCL im Bereich 3 ≤ 𝜆0 ≤ 25 μm im Dauerbetrieb hervorragende Leistungen. Insbesondere im Bereich 3 ≤ 𝜆0 ≤ 12 μm liefern QCL im Dauerbetrieb bei Zimmertemperatur Ausgangsleistungen von mehr als 5 W und Leistungsumwandlungswirkungsgrade von mehr als 25 %. Darüber hinaus können solche QCL mit hohen Raten moduliert und modengekoppelt werden, um optische Pulse mit einer Dauer von wenigen Pikosekunden zu erzeugen. QCL mit mehreren Wellenlängen können auch integrierte Bereich zur nichtlinearen Wellenmischung enthalten, um parametrische Wechselwirkungen wie Differenzfrequenz- und Summenfrequenzerzeugung zu ermöglichen. Ein aktueller Trend in der QCL-Forschung geht dahin, die im Dauerbetrieb bei Zimmertemperatur verfügbaren Wellenlängen in beiden Richtungen über das mittlere Infrarot hinaus zu erweitern, d. h. auf das nahe Infrarot- bzw. den THz-Bereich. Direkte Ansätze hierzu wären z. B. Heterostrukturen mit größeren Bandoffsets bzw. eine Unterdrückung der thermischen Relaxation zwischen dem oberen und unteren strahlenden Zustand. Bis jetzt wurden QCL bei Frequenzen im Bereich 1.2 ≤ 𝜈 ≤ 4.9 THz entsprechend Wellenlängen im Bereich 60 ≤ 𝜆0 ≤ 250 μm betrieben (wofür allerdings eine Tieftemperaturkühlung erforderlich ist). Vergleich von QCL mit anderen Quellen im mittleren Infrarot
Zum Abschluss ist es interessant, Quantenkaskadenlaser mit anderen häufig verwendeten Strahlungsquellen im mittleren Infrarot zu vergleichen. Wie aus der nachfolgenden Liste hervorgeht, gehen QCL aus diesem Vergleich oft als Sieger hervor, weil sie eine Reihe von vorteilhaften Eigenschaften kombinieren: (1) Ihre Fähigkeit bei Zimmertemperatur im Dauerbetrieb zu arbeiten, (2) ihren breiten Wellenlängenbereich, (3) ihre optische Leistung von mehreren Watt im Dauerbetrieb, (4) ihre großen Leistungsumwandlungswirkungsgrade und (5) ihre kompakte Bauweise.
635
18 LED und Laserdioden
ordnung der De-Broglie-Wellenlänge eines Elektrons (für ein thermisches Elektron in GaAs, λDB ≈ 50 nm). Die im Folgenden untersuchten Mikroresonator-, Mikrohohlraum- oder Mikrokavitätslaser beruhen im Gegensatz dazu auf dem Einschluss von Photonen in ein Raumgebiet mit Abmessungen in der Größenordnung der optischen Wellenlänge (𝜆0 ≈ 1 μm ≫ λDB ). Mikroresonatoren sind Resonatoren, in denen eine oder mehrere der Abmessungen die Größe von einigen Wellenlängen des Lichts oder kleiner erreichen, d ≈ 𝜆. Mikrohohlräume oder Mikrokavitäten haben eigentlich in allen Raumrichtungen derart kleine Abmessungen; diese beiden Begriffe werden heutzutage aber synonym verwendet. Mikroresonatorlaser werden als kurz als Mikrolaser bezeichnet. Die Eingrenzung von Photonen und von Ladungsträgern sind unabhängige Charakteristika eines photonischen Bauelements. Es ist daher möglich, einen Mikroresonatorlaser zu bauen, dessen aktive Region keinen Quanteneinschluss aufweist (z. B. eine Mikrokavität mit einer aktiven Region aus einem einfachen pnHomokontakt), oder einen Laser mit großem Resonator, dessen aktive Region Quanteneinschluss zeigt (z. B. ein Quantenkaskadenlaser). In der Praxis verwenden die meisten Mikroresonatorlaser jedoch quantenbeschränkte Strukturen als aktive Regionen. Zu den Mikroresonatorlasern, in denen das Licht in verschiedenen Dimensionen auf wellenlängengroße Gebiete eingegrenzt wird, gehören beispielsweise die Mikrosäulen-, Mikroscheiben- oder Mikrodisk- und Mikrokugelstrukturen, die in Abb. 18.60 dargestellt sind. Diese und andere Mikroresonatoren wurden in den Abschnitten 11.4.2 und 11.4.3 beschrieben. In Laserdioden mit großen Resonatoren (d ≫ 𝜆) haben die Moden in allen Richtungen des 𝑘-Raums kleine Abstände, und die Dichte M(𝜈) der erlaubten Resonanz-
DBR
• Übergangsmetallionendotierte Zinkchalkogenide wie Cr2+:ZnS und Cr2+:ZnSe (Abschnitt 16.3.1) bieten eine große optische Leistung und sind kontinuierlich abstimmbar, allerdings nur über einen begrenzten Wellenlängenbereich 1.9 ≤ 𝜆0 ≤ 3.0 μm. • CO- und CO2 -Gaslaser (Abschnitt 16.3.5) bieten Ausgangsleistungen, die um viele Größenordnungen höher sind als die mit QCL erreichbaren, sind jedoch sperrig und empfindlich und können nur sehr wenige Wellenlängen liefern. • Die Erzeugung von Differenzfrequenzen (Abschnitt 22.2.3) ermöglicht einen breiten Bereich zugänglicher Wellenlängen, ist jedoch komplex und im Dauerbetrieb schwierig zu realisieren. • Bleisalz- (IV-VI) Interband-Laserdioden z. B. aus PbSnTe oder PbSnSe (Abschnitt 17.1.2) können über ihre Zusammensetzung über einen weiten Wellenlängenbereich (4−30 μm) im mittleren Infrarot abgestimmt werden. Sie kämpfen aber mit dem Problem der strahlungslosen Rekombination, ihrer geringen Wärmeleitfähigkeit und kleinen Bandoffsets, die im Dauerbetrieb eine Kühlung erfordern. Außerdem sind ihre optischen Leistungen auf den Milliwattbereich beschränkt und ihre Leistungsumwandlungswirkungsgrade sind gering. • Interband-Laserdioden auf der Basis von Gruppe-IllAntimonidmaterialien (meist InGaAsSb/AlGaAsSbQuantenschichten auf GaSb-Substraten) ermöglichen einen Dauerbetrieb bei Zimmertemperatur mit optischen Leistungen von mehr als 1.5 W und Leistungsumwandlungswirkungsgraden von mehr als 15 %, aber nur für Wellenlängen unterhalb von ≈ 2.2 μm. Durch Verwendung von quinternären AlInGaAsSbBarrieren kann der Betrieb auf etwa 4 μm erweitert werden. Die Abscheidung und Verwendung von quinternären Materialien ist jedoch ein komplexes Unterfangen und die erreichbaren Ausgangsleistungen sind in jedem Fall auf einige zehn Milliwatt begrenzt. • GaSb-basierte Interband-Kaskadenlaser (ICL) können bei Zimmertemperatur im Dauerbetrieb arbeiten und liefern optischen Leistungen von einigen hundert Milliwatt mit Leistungsumwandlungswirkungsgraden von etwa 15 %. Sie arbeiten jedoch nur am kurzwelligen Ende des mittleren Infrarot bei 3 ≤ 𝜆0 ≤ 6 μm.
Mikrosäule
18.5 Mikroresonatorlaser Der in Abschnitt 18.4.1 betrachtete Quanteneinschluss beruht auf der Eingrenzung von Ladungsträgern auf ein Raumgebiet mit Abmessungen in der Größen-
Mikroscheibe
zweidimensionaler photonischer Kristall
Mikrotorus
Mikrokugel
DBR
636
Abb. 18.60 Mikroresonatorlaser grenzen Licht in verschiedenen Dimensionen auf wellenlängengroße Gebiete ein. Der Defekt im zweidimensionalen photonischen Kristall schafft einen Hohlraum, der das Licht einschließt. Die analogen quantenbeschränkten Strukturen sind die Quantenschicht, der Quantendraht und der Quantenpunkt.
18.5 Mikroresonatorlaser
frequenzen kann durch eine kontinuierliche Näherung bestimmt werden (siehe Abschnitt 11.3). Die gesamte Wahrscheinlichkeitsdichte der spontanen Emission (in s−1 ) hängt von der Modendichte M(𝜈) des Frequenzbereichs ab, in den das Atom gemäß Gl. (14.22) ausstrahlen kann. In Lasern mit großen Resonatoren nimmt die Modendichte wie im Vakuum gemäß Gl. (11.83) die quadratische Form M(𝜈) = 8π 𝜈2 ∕𝑐3 an. Dieser Ausdruck stellt eine große Zahl von Moden für die spontane Emission zur Verfügung; allerdings ist die spontane Emission in andere Moden als die Lasermode vergeudete Energie, sobald die induzierte Emission in einer Mode begonnen hat. Tatsächlich ist der Bruchteil der spontanen Emission, die zu einer gegebenen Lasermode beiträgt, für eine herkömmliche Laserdiode im Allgemeinen allgemein sehr klein. Der in einen Laser mit großem Resonator an der Schwelle injizierte Strom ersetzt daher vor allem die vergeudete spontane Emission, anstatt zur induzierten Emission beizutragen. Die Modendichte M(𝜈) kann jedoch wesentlich reduziert werden, indem man eine Mikrokavität verwendet, wie in Abschnitt 11.4 diskutiert. Die erlaubten Moden von Mikroresonatoren können in einer oder mehrere Richtungen des 𝑘-Raums große Abstände haben, sodass ausgedehnte spektrale Bänder frei von Moden sein können. Diese Reduktion ist in Mikrohohlräumen am ausgeprägtesten, die in allen Richtungen des 𝑘-Raums große Modenabstände haben, also einen diskreten Satz von Moden (siehe Abb. 11.27). Die Möglichkeit, die Modenstruktur zu verändern, ist im Zusammenhang mit der spontanen Emission von großer Bedeutung. Wenn eine Quelle in eine solchen Modenstruktur eingebracht wird, wird die spontane Emission in nichtexistierende Moden verhindert und die entsprechende Energie in verfügbare Moden umgelenkt. Die Emission von Licht in spezielle Moden einer schmalbandigen Mikrokavität hoher Güte kann durch den Purcelleffekt gegenüber der Emission in normale optische Moden erhöht werden, wie in Abschnitt 14.3.5 beschrieben wurde. Mikroresonatorlaser werden so entworfen, dass sie die Möglichkeiten zur Hemmung und Verstärkung optimal ausnutzen. Zusammenfassung
Mikroresonatorlaser haben im Vergleich zu ihren konventionellen Gegenstücken mehrere interessante Eigenschaften: • • • • •
geringere Größe niedrigere Laserschwelle kleinere spektrale Breite kleinere räumliche Breite größerer Wirkungsgrad
Wir werden im Folgenden drei Klassen von Mikroresonatorlasern genauer besprechen. In Abschnitt 18.5.1 diskutieren wir zunächst Oberflächenemitter, in Abschnitt 18.5.2 Mikrodisk- und Mikroringlaser und zum Schluss in Abschnitt 18.5.3 Laser auf der Grundlage von photonischen Kristallen. Halbleiter-Mikroresonatorlaser sind von diesen mit Abstand die häufigste Variante, es existieren aber auch Mikroresonatorlaser aus organischen Farbstoffen, seltenerddotierten Silikaten und organischen Polymeren.
18.5.1 Oberflächenemitter Die häufigsten Mikroresonatorlaser sind Oberflächenemitter oder oberflächenemittierende Vertikalresonatorlaser (VCSEL, von engl. vertical-cavity surfaceemitting laser). Das Licht wird hier aus der Oberfläche eines ebenen Fabry-Pérot-Mikroresonators ausgekoppelt, ähnlich wie bei der in Abb. 18.19 gezeigten oberflächenemittierenden LED. VCSEL lassen sich sowohl auf der Grundlage von herkömmlichen als auch auf der Basis von organischen Halbleitern herstellen. Sie arbeiten normalerweise im Sichtbaren und nahen IR und können in unterschiedlichen Durchmessern von ≈ 1 μm (wo sie dann Mikrosäulenlasern ähneln) bis ≈ 1 mm hergestellt werden. Die Schwellen von kleinflächigen VCSELBauelementen liegen im μA-Bereich, ihre Ausgangsleistungen betragen einige Milliwatt und ihre Leistungsumwandlungswirkungsgrade erreichen 𝜂L ≈ 70 %. Ihre Strahlen sind kreisrund und lassen sich daher einfach in optische Fasern einkoppeln, VCSEL werden in zahlreichen Anwendungen von optischen Computermäusen bis hin zu faseroptischen Kurzstrecken-Kommunikationssystemen eingesetzt (Abschnitt 25.1.2). Großflächige VCSEL
Ein Beispiel eines großflächigen VCSEL ist in Abb. 18.61 gezeigt. Seine aktive Region besteht aus einer GaAs/ InGaAs-Mehrfachquantenschicht und er emittiert bei 995 nm. Weil die Dicke der aktiven Region nur einige zehn nm beträgt, ist der Gewinn bei einem einzelnen Durchgang normalerweise gering (weniger als 1 %), weshalb das Licht wiederholt durch die aktive Region reflektiert werden muss. Die hierfür verwendeten verteilten Braggreflektoren bestehen normalerweise aus Dutzenden von Schichten, um ihren Reflexionsgrad bei der Betriebswellenlänge möglichst groß zu machen. Ein Schlüssel für den Betrieb eines VCSEL mit hohem Wirkungsgrad ist die dielektrische Schicht, die die Ladungsträgerinjektion lokal begrenzt und die optische Mode lateral eingrenzt. Die spektrale Intensität, die optische Leistung und die Winkelverteilung des Lasers aus Abb. 18.61 sind in Abb. 18.62 gezeigt.
637
18 LED und Laserdioden
+ dielektrische Schicht AlAsEingrenzungsschichten
AlGaAs/GaAsaktive Region GaAs/InGaAs-MQW
AlGaAs/GaAsGaAsSubstrat – (a)
(b)
Abb. 18.61 (a) Schematische Darstellung eines großflächigen (Durchmesser 320 μ m) Mehrfachquantenschicht-GaAs/ InGaAs-VCSEL, der bei 995 nm emittiert. (b) Geätzter Hügel, der den p-Kontakt, den p-dotierten verteilten Braggreflektor und die aktive Region zeigt. (Modifiziert nach M. Miller,
0.8 0.6 0.4 0.2 0 991
993
995
997
999
1.0
1.0
0.8 0.6 0.4 0.2 0
0
0.5
1.0
1.5
Abb. 18.62 Spektrale Intensität, optische Leistung und Winkelverteilung des MQW-GaAs/InGaAs-VCSEL aus Abb. 18.61. Der Schwellenstrom dieses Bauelements ist iSch = 1.1 A. (Modifiziert nach M. Miller, M. Grabherr, R. King, R. Jäger,
+
AlGaAsMantelschichten
− dielektrische Schichten GaAsSubstrat
GaAsEingrenzung
2.0
2.5
3.0
3.5
0.8 0.6 0.4 0.2 0 −20
Strom i/A
Wellenlänge λ 0/ µm
GaAs /AlO-
M. Grabherr, R. King, R. Jäger, R. Michalzik, K. J. Ebeling, ‚Improved Output Performance of High-Power VCSELs‘, IEEE Journal of Selected Topics in Quantum Electronics 7, 210–216, 2001; Abb. 2. ©2001 IEEE.)
relative Intensität
0/W
1.0
opt. Ausgangsleitung
relative spektrale Dichte
638
aktive Region InGaAs /GaAsMehrfachquantenpunkt
Abb. 18.63 VCSEL mit einem Quantenpunkt als aktiver Region.
−10
0
10
20
Winkel im Fernfeld/°
R. Michalzik, K. J. Ebeling, ‚Improved Output Performance of High-Power VCSELs‘, IEEE Journal of Selected Topics in Quantum Electronics 7, 210–216, 2001; Abb. 2. ©2001 IEEE.)
ren Strukturen auf der Grundlage von Quantenpunkten sind auch hier die Verheißungen eines reduzierten Schwellenstroms und einer geringeren Temperaturempfindlichkeit in Kombination mit einer größeren Modulationsbandbreite verführerisch. Varianten von VCSEL
VCSEL existieren in vielfältigen Ausführungen und können zusätzliche Elemente wie z. B. photonische Kristalle für die laterale Modenkontrolle, gekoppelte Hohlräume oder integrierte Modulatoren beinhalten, die die Geschwindigkeit der direkten Modulation erweitern, wie Abb. 18.64 illustriert. VCSEL-Arrays
Mehrfachquantenpunkt-VCSEL
Obwohl die aktiven Regionen gewöhnlich Mehrfachquantenschichten sind, können VCSEL auch mit Mehrfachquantenpunkten als aktiven Regionen realisiert werden, wie Abb. 18.63 zeigt. Wie auch bei ande-
Ein großer Vorteil von VCSEL ist, dass sie hohe Packungsdichten auf einem Wafer ermöglichen und leicht in Form dichter Anordnungen hergestellt werden können. Als eines der ersten Beispiele wurden ungefähr eine Million elektrisch gepumpter winziger zylindrischer
18.5 Mikroresonatorlaser
AlGaAs/GaAsBraggreflektoren
−
aktive Region GaAs/InGaAs-MQW Modulator
photonischer Kristall in DBR
+
AlGaAs / GaAsBraggreflektoren VCSEL GaAsSubstrat AlAsEingrenzungsschichten (a)
dielektrische Schicht +
GaAs/InGaAs-MQW
−/+
AlAsEingrenzungsschichten (b)
aktive Region GaAs/InGaAsMQW dielektrische Schicht GaAsSubstrat
Abb. 18.64 Varianten von VCSEL. (a) VCSEL mit einem photonischen Kristall für die laterale Modenkontrolle. (b) VCSEL mit monolithisch integriertem Elektroabsorptionsmodulator.
(a)
(b)
Abb. 18.65 Rasterelektronenmikroskopische Aufnahme einer Anordnung von elektrisch gepumpten QuantenschichtVCSEL aus In0.2 Ga0.8 As mit Durchmessern zwischen 1 und 5 μ m auf einem GaAs-Chip. Die Mikroresonatoren bestehen aus AlAs/GaAs-Braggreflektoren. (a) Von den Braggreflektoren wurde AlAs bevorzugt weggeätzt, wodurch die GaAsScheiben hervorgehoben werden, die von dem verbleibenden AlAs im Inneren der Säulen gehalten werden. (b) Draufsicht auf einen kleinen Ausschnitt der Anordnung. Runde Strahlbündel am Ausgang ermöglichen einfache Einkopplung in optische Fasern (Mit freundlicher Genehmigung von Jack L. Jewell, Picolight Inc.)
InGaAs-Quantenschicht-VCSEL (Durchmesser ≈ 2 μm, Höhe ≈ 5.5 μm) mit Laserwellenlängen um 970 nm auf einem einzigen GaAs-Chip mit einer Fläche von 1 cm2 integriert. Diese speziellen Bauelemente hatten Schwellenströme von 𝑖𝑆𝑐ℎ ≈ 100 μA für kontinuierlichen Betrieb bei Zimmertemperatur. Eine rasterelektronenmikroskopische Aufnahme eines kleinen Teils dieser Anordnung ist in Abb. 18.65 gezeigt. Zweidimensionale Anordnungen inkohärenter Emitter ermöglichen wie beschrieben eine großflächige Ska-
lierung der Leistung. Eine kohärente Überlagerung des von einer Anordnung einzelner VCSEL emittierten Lichts kann jedoch aufgrund der Interferenzen zwischen den einzelnen Emissionen eine Divergenz unterhalb der eines einzelnen Emitters sowie eine erhöhte Intensität auf der Strahlachse erreichen. Derartige Eigenschaften sind für Anwendungen wie Bildgebung, Targeting, Sensorik und optische Kommunikation von Bedeutung. Um eine solche kohärente Strahlkombination zu erhalten, werden Injektionskopplung und eine laterale Kopplung zwischen benachbarten inkohärenten Emittern eingesetzt. Bei der Injektionskopplung wird ein Teil der Ausgangsstrahlung eines Masterlasers, der Teil des Arrays oder davon unabhängig sein kann, verteilt und zurückreflektiert, um alle abhängigen Laser in dem Array zu impfen, wodurch diese kohärent oszillieren. Laterale Kopplung kann über beugende oder oder anti-führende (Leaky-Mode-) Wechselwirkungen realisiert werden. Evaneszente Wechselwirkungen zu steuern, hat sich als schwierig erwiesen. Typische kohärente Leistungen von Arrays aus einigen hundert VCSEL liegen im Bereich von einigen hunderten Milliwatt. Oberflächenemittierende Laser mit externem Resonator (VECSEL)
Wie Laserdioden (Abschnitt 18.3.3) kann auch eine VCSEL-Struktur mit einem externen Resonator versehen werden, um einen abstimmbaren Einmoden-Oberflächenemissionslaser mit externem Resonator (VECSEL, engl. vertical external-cavity surface-emitting laser) herzustellen, der manchmal auch als Halbleiter-Scheibenlaser (SDL, engl. semiconductor disk laser) bezeichnet wird. In einer in der optischen Kohärenztomographie häufig verwendeten Anordnung wird die Abstimmung durch ein bewegliches mikroelektromechanisches System (MEMS) bereitgestellt, das als oberer
639
640
18 LED und Laserdioden
Spiegel dient. Wie bei diodengepumpten Festkörperlasern (DPSS, Abschnitt 16.4.4) erlaubt die Verwendung eines sättigbaren Halbleiterspiegels (SESAM, engl. semiconductor saturable-absorber mirror) innerhalb des Resonators eine passive Modenkopplung. VECSEL können Pulsdauern 𝜏Puls < 100 fs und Pulswiederholraten um 50 GHz erreichen. Ähnlich wie VCSEL können auch VECSEL (zusammen mit QCL und DFB-Lasern) in Arrays angeordnet werden.
18.5.2
Mikrodisk- und Mikroringlaser
Die Miniaturisierung von Bauelementen hat die Integration von Lasern und anderen optischen Komponenten in kompakten Anordnungen und photonischen integrierten Schaltkreisen (PIC) erleichtert. Mikrodisklaser besitzen aktive Regionen aus organischen oder herkömmlichen Halbleitern und beruhen meist auf Quantenschicht- oder Quantenpunktstrukturen. Bauelemente auf der Basis von III-V-Kombinationen oder Gruppe-III-Nitriden decken weite Spektralbereiche vom Infraroten bis zum Ultravioletten ab. Aufgrund ihrer geringen Größe, des geringen Stromverbrauchs, des geringen Schwellenstroms, der einfachen Auskopplung und der Möglichkeit eines Dauerbetriebs bei Zimmertemperatur haben dielektrische Mikrodisklaser seit ihrer Erfindung in den frühen neunziger Jahren eine stürmische Entwicklung genommen. Sie werden oft auf ihren natürlichen Substraten abgeschieden, können aber auch epitaktisch auf Silicium gezüchtet werden – teilweise mit gleicher Leistung. Für elektrische Anschlüsse und mechanische Stabilisierung sorgen Strukturen vom n- und p-Typ unterhalb und oberhalb der Mikroscheibe. Während VCSEL auf Fabry-Pérot-Moden beruhen und ihr Licht vertikal emittieren, basieren Mikrodisklaser auf Whispering-Gallery-Moden mit hohem Gütefaktor (Abschnitt 11.4.2) und emittieren in der Ebene des Halbleitersubstrats. Das Licht wird über Wellenleiterkoppler in der Diskebene extrahiert. Die Modenstruktur von Mikroringlasern, die manchmal auch Mikrotoruslaser genannt werden, ähnelt der von Mikrodisklasern mit demselben Radius. Ein Mikroringlaser kann sogar als Grenzfall eines Mikrodisklasers angesehen werden, in dem eine innere Barriere die Zahl der Moden in radialer Richtung begrenzt. Die Gesamtabmessungen dieser Bauelemente liegen typischerweise im Bereich von einigen zehn Mikrometern – was größer ist als die Wellenlänge des von ihnen emittierten Lichts, da sie das Licht mithilfe von Flüstergaleriemoden eingrenzen. Die Anwendungen von Mikrodisk- und Mikroringlasern reichen von kurzreichweitigen Verbindungen wie z. B. für die On-Chip-Datenkommunikation bis zum Nachweis von Viren und Nanopartikeln.
Bauelemente aus Silicium und anderen Elementen der Gruppe IV
Im Bereich der Silicium- und Gruppe-IV-Photonik können Mikroresonatorlaser durch direktes heteroepitaktisches Wachstum von III-V-Quantenpunkten auf Si und durch Wachstum von GeSn auf Si hergestellt werden. Mikroringlaser aus III-V-Quantenpunkten auf Si
Mikroringlaser mit aktiven Regionen aus sieben InAs/ InGaAs-Quantenpunkt-in-Quantenschicht-Strukturen (DWELL) wurden epitaktisch auf ebenen oder mit V-Rillen strukturierten Si-Substraten gezüchtet. 3) Die äußeren Ringradien lagen zwischen 5 und 50 μm und die Ringbreiten zwischen 2 und 7 μm. Die Bauelemente wurden elektrisch gepumpt und im Dauerbetrieb bei Zimmertemperatur betrieben. Ein Mikroring mit einem Außenradius von 5 μm und einer Breite von 3 μm besitzt eine Laserschwelle von 0.6 mA und emittiert eine Leistung von 8 μW bei 𝜆0 ≈ 1.3 μm bei einem Injektionsstrom von 2 mA. Wie in Abschnitt 18.4.3 diskutiert, haben Quantenpunktlaser wesentlich niedrigere Schwellenströme und eine geringere Temperaturempfindlichkeit als Quantenschichtlaser und bieten daneben noch andere willkommene Merkmale. Mikrodisklaser aus GeSn auf Si
Laser mit direkter Bandlücke können durch Abscheidung einer Legierung aus Ge und α-Sn auf einem Gegepufferten Siliciumsubstrat hergestellt werden. Eine Legierung der Zusammensetzung Ge0.915Sn0.085 enthält gerade genügend Sn, um die Energieminima der direkten Bandlücke (𝛤) und des energetisch niedrigsten Minimums der indirekten Bandlücke (L) in der Bandstruktur von Ge aneinander anzugleichen, wodurch ein Material der Gruppe IV mit direkter Bandlücke entsteht. Ein Ge0.875Sn0.125 -Mikrodisklaser mit einem Durchmesser von 8 μm Durchmesser, der von einem gepulsten Nd:YAG-Laser bei 𝜆0 = 1.064 μm gepumpt wird, emittiert bei 𝜆0 ≈ 2.5 μm. 4) Dieser optisch gepumpte, gepulste Mikrodisklaser erfordert eine Kühlung, aber Bauelemente auf der Grundlage von SiGeSn∕GeSn mit Doppelheterostruktur sowie Mehrfachquantenschichtstrukturen versprechen einen elektrisch gepumpten Dauerbetrieb bei Zimmertemperatur.
3) Siehe Y. Wan, J. Norman, Q. Li, M. J. Kennedy, D. Liang, C. Zhang, D. Huang, Z. Zhang, A. Y. Liu, A. Torres, D. Jung, A. C. Gossard, E. L. Hu, K. M. Lau, J. E. Bowers, ‚1.3 μm Submilliamp Threshold Quantum Dot Micro-Lasers on Si‘, Optica 4, 940–944, 2018. 4) Siehe D. Stange, S. Wirths, R. Geiger, C. Schulte-Braucks, B. Marzban, N. von den Driesch, G. Mussler, T. Zabel, T. Stoica, J.-M. Hartmann, S. Mantl, Z. Ikonic, D. Grützmacher, H. Sigg, J. Witzens, D. Buca, ‚Optically Pumped GeSn Microdisk Lasers on Si‘, ACS Photonics 3, 1279– 1285, 2016.
18.5 Mikroresonatorlaser
Optische Vortexlaser
Lichtstrahlen, die einen Bahndrehimpuls tragen, besitzen helikale Wellenfronten, die sich aufgrund dieses zusätzlichen Freiheitsgrads für spezielle Anwendungen eignen. Ein Beispiel für einen solchen optischen Wirbel ist der Laguerre-Gauß-Strahl (Abschnitt 3.4). Mithilfe holographischer optischer Elemente können Strahlen mit spiralförmigen Wellenfronten erzeugt werden (Beispiel 4-11). Ein optischer Wirbelstrahl kann auch erzeugt werden, indem man Licht in eine Flüstergaleriemode in einem Mikrohohlraum injiziert, in den in azimutaler Richtung eine Brechungsindex-Gitterstruktur eingebettet ist. Vor kurzem wurde ein Mikroresonatorlaser entwickelt, der einen Einmoden-Bahndrehimpulswirbelstrahl mit einer beliebig wählbaren topologischen Ladung erzeugt. 5) Ein unidirektionaler Laserprozess kann in einem Mikroresonator, in dem Flüstergaleriemoden mit hohen Werten des Bahndrehimpulses möglich sind, durch selektive Modulation des Brechungsindex und des Gewinns/Verlusts induziert werden, wodurch die Rotationssymmetrie des Laserprozesses gebrochen wird. Die Seitenwände des Mikrorings sind so konstruiert, dass der Wirbelstrahl aufgrund von Streuung vertikal aus der Ebene des Bauelements austritt und so die Emission eines VCSEL nachahmt.
18.5.3 Mikroresonatorlaser aus photonischen Kristallen Mikrokavitäten aufgrund von Defekten in zweidimensionalen photonischen Kristallen ermöglichen zusammen mit quantenbeschränkten Miniatur-Emissionsquellen wie Quantenschichten oder Quantenpunkten die Konstruktion von wellenlängengroßen Lasern und Laserarrays. Laser aus photonischen Kristallen besitzen kleinere aktive Regionen als VCSEL oder Mikrodisklaser, extrem geringe Schwellenströme, extrem geringe Leistungsaufnahmen und eine sehr schnelle direkte Modulation. Sie sind geeignet, um Informationen über Entfernungen von einigen Millimetern oder Zentimetern zu übertragen und versprechen eine signifikante Verringerung des Energieverbrauchs beispielsweise von Rechenzentren, in denen die On-Chip- und Rackto-Rack-Kommunikation bislang elektrisch abgewickelt wird (Abschnitt 24.3.4).
ordnungen solcher Bauelemente sind in Abb. 18.66(a) bzw. (b) dargestellt. Das in Abb. 18.66(a) gezeigte Bauelement ist ein Einmodenlaser mit photonischer Bandlücke, der bei Zimmertemperatur arbeitet. Es wird durch eine Säule mit sub-μm-Abmessungen elektrisch gepumpt und hat einen Schwellenstrom von 260 μA. 6) Die aktive Region besteht aus sechs gespannten InGaAsPQuantenschichten, und die Emission erfolgt bei 𝜆0 = 1520 nm. Die Struktur produziert eine Leistung von 1 2 nW bei einem Strom von mA, und ihre differen2 tielle Ansprechempfindlichkeit beträgt etwa ℛ ≈ 10−5 . Der Gütefaktor und das Modenvolumen sind 𝑄 ≈ 2500 bzw. 𝑉 ≈ 6 × 10−2 μm3 . Wenn die Linienbreite Δ𝜈 der Emission kleiner ist als die Breite δ𝜈 einer elektromagnetischen Mode, kann die spontane Emission in Mikrohohlräumen mit hohem 𝑄 durch den Purcelleffekt erhöht werden (siehe Abschnitt 14.3.5 und Abb. 14.26). Der Purcellfaktor für dieses Bauelement ist 𝐹P = (3∕4π2 )(𝜆 3 ∕𝑉)𝑄 ≈ 400. Die Ausgangsleistungen der einzelnen Bauelemente können wesentlich vergrößert werden, wenn man sie zu einem kohärent gekoppelten Mikroresonatorarraylaser wie in Abb. 18.66(b) kombiniert. Das gezeigte Array besteht aus 81 einzelnen Resonatoren und vier InGaAsP/InP-Quantenschichten mit einer Gesamtfläche von ≈ 15 μm2 und einer Ausgangsleistung von ≈ 12 μW. Eine Variante eines Lasers aus zweidimensionalen photonischen Kristallen mit verteilter Rückkopplung, bei dem die Rückkopplung über die gesamte zweidimensionale Ebene erfolgt, ermöglicht einen Laserprozess an der Bandkante. Für die Eingrenzung in der Richtung senkrecht zu der Ebene verwenden Laser aus photonischen Kristallen herkömmliche Reflexion. Laser aus dreidimensionalen photonischen Kristallen
Auch in einem dreidimensionalen Mikroresonator aus einem photonischen Kristall mit einer vollständigen photonischen Bandlücke ist Laserbetrieb möglich (Abschnitt 7.3.2). Solche Laser können bei Zimmertemperatur betrieben werden; ihre aktiven Regionen sind häufig elektrisch gepumpte Stapel von Quantenpunktschichten und sie können Gütefaktoren 𝑄 ≈ 40 000 und Modulationsraten von bis zu 10 Gbit/s erreichen. In derartigen Strukturen sind sowohl die Elektronen als auch die Photonen in drei Dimensionen eingegrenzt. 7)
Laser aus zweidimensionalen photonischen Kristallen
Beispiele von Lasern auf Basis zweidimensionaler photonischer Kristalle sowie von kohärent gekoppelten An-
5) Siehe P. Miao, Z. Zhang, J. Sun, W. Walasik, S. Longhi, L. M. Lichinitser, L. Feng, ‚Orbital Angular Momentum Microlaser‘, Science 353, 464, 2016.
6) H.-G. Park, S.-H. Kim, S.-H. Kwon, Y.-G. Ju, J.-K. Yang, J.-H. Baek, S.-B. Kim, Y.-H. Lee, ‚Electrically Driven Single-Cell Photonic Crystal Laser‘, Science 305, 1444–1447, 2004. 7) Siehe z. B. K. Takeda, T. Sato, A. Shinya, K. Nozaki, W. Kobayashi, H. Taniyama, M. Notomi, K. Hasebe, T. Kakitsuka, S. Matsuo, ‚Few-fJ/Bit Data Transmissions Using Directly Modulated Lambda-Scale Embedded Active Region Photonic-Crystal Lasers‘, Nature Photonics 7, 569– 575, 2013.
641
642
18 LED und Laserdioden
−
InPEingrenzungsschichten
aktive Region InGaAsP/InGaAsP- InPMQW Säule
−
InPEingrenzungsschichten
InGaAsKontakt- aktive Region InGaAsKontaktschichten InGaAsP/InGaAsP-MQW schichten InPInP+ dielektrische + dielektrische Substrat Schicht Substrat Schicht
(a)
(b)
Abb. 18.66 (a) Mehrfachquantenschicht-InGaAsP/InGaAsP-Laser mit einem photonischen Kristall. Die InP-Säule hat eine Höhe von 1 μ m und dient als elektrischer Kontakt. (b) Anordnung kohärent gekoppelter Quantenschichtlaser aus photonischen Kristallen.
Beispiel 18-12: Schwellenloser Quantenpunktlaser aus einem photonischen Kristall
In einem Resonator mit Abmessungen in der Größenordnung der Wellenlänge, in dem eine einzige optische Mode existieren kann, muss die Photonenemission in diese Mode erfolgen, unabhängig davon, ob es such um eine spontane oder eine induzierte Emission handelt. Da es in diesem Fall keinen Unterschied zwischen diesen beiden Prozessen gibt, verschwindet der Knick in der Leistungs-Strom-Kurve, der bei einem herkömmlichen Laser den Übergang von spontaner zu induzierter Emission kennzeichnet und damit die „Laserschwelle“ definiert (bzw. dieser Knick erscheint bei einem Strom von null). Die Konstruktion eines schwellenlosen Lasers erfordert daher eine genaue Kontrolle der Modenstruktur des Resonators. Der Beitrag der spontanen Emission zu einer bestimmten Lasermode wird durch den Kopplungskoeffizienten 𝛽 der spontanen Emission angegeben. Er ist für herkömmliche Laserdioden normalerweise sehr klein; für eine kantenemittierende Struktur findet man beispielsweise 𝛽 ≈ 10−5 . Wie bereits erwähnt war ein Ziel bei der Entwicklung der Mikroresonatorlaser die Optimierung der Hemmung bzw. Verstärkung der spontanen Emission. Tatsächlich kann die durch Mikro- und Nanoresonatoren ermöglichte Modifikation der Modendichte 𝛽 um viele Größenordnungen steigern. Eine solche Modifikation hat außerdem den zusätzlichen Vorteil, dass der Schwellenstrom der Laserdiode gleichzeitig um einen entsprechenden Betrag verkleinert wird. Ein optisch gepumpter Laser wird durch eine Leistungs-Licht-Kurve charakterisiert, die der LeistungsStrom-Kurve einer Laserdiode entspricht. Ein nahezu schwellenwertloser optisch gepumpter Laser (𝛽 = 0.85) mit einer Schwellenintensität 𝐼Sch < 1 μW wurde durch Einbetten von InAsSb-Quantenpunkten in einen Resonator aus einem photonischen Kristall hergestellt. Er
wird von einer kontinuierlich betriebenen Laserdiode bei 785 nm gepumpt und emittiert bei Zimmertemperatur Licht bei 𝜆0 ≈ 1.3 μm. 8)
18.6 Nanoresonatorlaser Die in den Abschnitten 18.4 und 18.5 besprochenen Laser grenzen Licht mithilfe von Unterschieden der Brechungsindizes verschiedener Dielektrika in ihren Resonatoren ein. Die physischen und Modenabmessungen solcher Laser sind daher in jeder Richtung stets größer als die Wellenlänge des emittierten Lichts. In diesem Abschnitt betrachten wir Laser, die auf nichtplasmonischen und plasmonischen Resonatoren auf der Grundlage von Metallen beruhen, die das Licht auf Subwellenlängendimensionen eingrenzen, aber trotzdem bei optischen Frequenzen arbeiten. Die aktiven Medien in solchen Nanoresonatorlasern oder kurz Nanolasern sind häufig Halbleiter in Form von Volumen-, Quantenschicht- oder Quantenpunktstrukturen, aber auch organische Halbleiter und Farbstofflösungen werden verwendet. Infolge von Dissipation haben Laser mit Resonatoren auf Metallbasis wesentlich kleinere Gütefaktoren 𝑄, die sie durch einen größeren Gewinn ausgleichen müssen. Bei der Herstellung werden sowohl Bottom-Up- als auch Top-Down-Ansätze verwendet. Sowohl nicht-plasmonische als auch plasmonische Nanolaser existieren. Nicht-plasmonische Strukturen bestehen aus Metallkavitäten mit Subwellenlängenabmessungen, die Materialien mit hohem Gewinn einschließen; in ihnen sind nichtevaneszente elektromagnetische Moden möglich. Die Metallhülle begrenzt die 8) Siehe I. Prieto, J. M. Llorens, L. E. Muñoz-Camùñez, A. G. Taboada, J. Canet-Ferrer, J. M. Ripalda, C. Robles, G. Muñoz-Matutano, J. P. Martínez-Pastor, and P. A. Postigo, ‚Near Thresholdless Laser Operation at Room Temperature‘, Optica 2, 66–69, 2015.
18.6 Nanoresonatorlaser
transversale Größe der Struktur, was die Eingrenzung der Moden verbessert und das Volumen der aktiven Region verringert. Derartige Geräte können elektrisch gepumpt und bei Zimmertemperatur auf Zeitskalen von Femtosekunden bis hin zum Dauerbetrieb betrieben werden. Plasmonische Nanolaser können mit physischen bzw. Modendimensionen in der Größenordnung von zehn bis hundert Nanometern realisiert werden – weit unterhalb der Mikrometerabmessungen, die für Mikroresonatorlaser gelten. Plasmonische Strukturen arbeiten auf der Grundlage von sich ausbreitenden Oberflächenplasmonpolaritonen (OPP) oder lokalisierten Oberflächenplasmonen (LOP). Beide Versionen verwenden Grenzflächen zwischen Metall und Dielektrikum bzw. Metall und Halbleiter, um das Licht auf Subwellenlängendimensionen einzugrenzen. OPP-Nanolaser verwenden Resonatoren wie Nanodisks aus Metall/Dielektrikum (Abschnitt 11.4.5) oder plasmonische Wellenleiter wie Metall/Isolator/Metall(MIM), Metall/Isolator/Halbleiter- (MIH) oder Metallplattenstrukturen (Abschnitt 9.6). Um eine Verstärkung einzuführen, wird das isolierende Dielektrikum in diesen Resonatoren durch ein aktives Verstärkungsmedium wie etwa einen Halbleiter mit direkter Bandlücke oder einen Farbstoff ersetzt. Die Rückkopplung erfolgt wie bei herkömmlichen Lasern über einen Fabry-PérotResonator, ein DFB-Gitter oder eine Scheiben- oder Ringstruktur, die Flüstergaleriemoden ermöglicht. Sich ausbreitende OPP sind nicht auf Resonanzen angewiesen, sodass diese Strukturen einen Breitbandbetrieb erlauben. In LOP-Nanolasern werden plasmonische Resonatoren wie z. B. metallische Nanokugeln verwendet (Abb. 8.17 und Abschnitt 11.4.5). Die Verstärkung wird realisiert, indem das umgebende dielektrische Material durch ein aktives Verstärkungsmedium wie etwa eine mit Farbstoff durchsetzte Hülle ersetzt wird. Die Verkleinerung eines Lasers auf Nanometerabmessungen hat für bestimmte Anwendungen eine Reihe von Vorteilen, beispielsweise • eine niedrigere Laserschwelle, • einen größeren differentiellen Leistungsumwandlungswirkungsgrad (Steigungswirkungsgrad), • eine größere Modulationsbandbreite. Nanometergroße Bauelemente können z. B. in der optischen On-Chip-Kommunikation und -Datenverarbeitung, in Displays und der Nahfeld-Fotolithographie eingesetzt werden. Auch in drahtlosen Sensornetzwerken sind sie von Nutzen. Darüber hinaus können Nanolaser in biologisches Gewebe implantiert oder injiziert werden, um dort Aufgaben wie Bildgebung, Messen, Spek-
troskopie oder Therapie wahrzunehmen. Einige typische Beispiele dieser drei Arten von Nanolasern werden wir im Folgenden kurz besprechen: (1) Einen MetallNanoresonatorlaser, (2) einen OPP-Nanoringlaser und (3) einen LOP-Nanokugellaser. Nichtplasmonische Nanoresonatorlaser
Nichtplasmonische Nanolaser verwenden externe Metallresonatoren mit Subwellenlängenabmessungen, in denen nichtevaneszente elektromagnetische Moden möglich sind und die Verstärkungsmedien wie z. B. Halbleiter einschließen. Silberverkleideter InGaAs/Metall-Nanoresonatorlaser
Wir betrachten einen Metallresonator-Nanolaser mit Subwellenlängenabmessungen in Form einer rechteckigen Säule aus InP/InGaAs/InP mit einer isolierenden SiN-Schicht, die in einer rechteckigen Umhüllung aus Silber eingeschlossen ist, die als metallischer FabryPérot-Resonator dient. 9) Das Licht ist überwiegend in die rechteckige aktive Region aus InGaAs (Brechungsindex 𝑛 = 3.4) eingegrenzt, die zwischen zwei rechteckigen Bereichen aus InP mit kleinerem Brechungsindex (𝑛 = 3.1) eingeschlossen ist. Die Struktur arbeitet im Dauerbetrieb bei Zimmertemperatur und wird elektrisch gepumpt (Schwellenstrom 𝑖Sch = 1.1 mA). Der Laser emittiert bei 𝜆0 = 1.59 μm mit einer Linienbreite von 0.5 nm. Das Resonatorvolumen beträgt 0.67𝜆03 und der Gütefaktor entsprechend der beobachteten Linienbreite ist 𝑄 = 3182. Die Struktur ist in einer Flip-Chip-Anordnung aufgebaut, das emittierte Licht tritt in vertikaler Richtung durch das Substrat aus. Trotz des verlustbehafteten Metalls um den Resonator sind die Eigenschaften und die Leistung dieses Halbleiter-Nanoresonatorlasers mit denen eines herkömmlichen Halbleiter-Mikroresonatorlasers vergleichbar, was zeigt, dass die Dissipation des Metalls durch die Verstärkung des Halbleiters ausgeglichen werden kann. Ersetzen des Halbleiters in der aktiven Region durch Quantenschichten oder Quantenpunkte sollte die Leistung ebenso wie die Wärmeableitung weiter verbessern. Plasmonische Nanoresonatorlaser
Plasmonische Nanolaser verwenden Metalle in Strukturen mit Subwellenlängenabmessungen, in denen evaneszente Moden möglich sind und die mit Gewinnmedien wie Halbleitern oder Farbstoffen kombiniert
9) Siehe K. Ding, M. T. Hill, Z. C. Liu, L. J. Tin, P. J. van Veldhoven, C. Z. Ning, ‚Record Performance of Electrical Injection Sub-Wavelength Metallic-Cavity Semiconductor Lasers at Room Temperature‘, Optics Express 21, 4728–4733, 2013.
643
644
18 LED und Laserdioden
werden. Plasmonische Bauelemente beruhen entweder auf OPP-Wanderwellen (Abschnitt 8.2.2) oder auf LOP-Oszillationen (Abschnitt 8.2.3) an den Grenzflächen Metall/Dielektrikum. Wir betrachten zunächst ein Beispiel für einen plasmonischen OPP-Nanolaser und anschließend einen plasmonischen LOP-Nanolaser („Spaser“). MIS-auf-Si-OPP-Nanoringlaser
Nanoresonatorlaser mit Subwellenlängenabmessungen, die auf der Verstärkung von Oberflächenplasmonpolaritonen (OPP) basieren, existieren in einer Reihe von Varianten. Eine aus didaktischen Gründen interessante Version verwendet eine Metall/Isolator/Halbleiter(MIH-) Struktur aus Ag∕Al2 O3 ∕AlInGaP, die OPP-Flüstergaleriemoden in einem Nanoringresonator ermöglicht. 10) Der lithographisch aufgebaute Ring hat einen Innendurchmesser von 0.79 und einen Außendurchmesser 1.09 μm, sodass die Ringbreite 150 nm beträgt. Der Nanolaser sitzt auf einem Si-Substrat und arbeitet bei Zimmertemperatur. Das Verstärkungsmedium aus einer AlInGaP-Heterostruktur hat eine Gesamtdicke von 110 nm und liefert bei Zimmertemperatur eine breitbandige Verstärkung. Der 570-nm-Pumplaser liefert 4-ps-Pulse mit einer Wiederholungsrate von 1 kHz. Der Laserprozess auf einem Paar von zweidimensionalen Flüstergaleriemoden bei 610 und 634 nm setzt bei einer Pump-Energiedichte von 2 mJ∕cm2 pro Puls ein. Ähnliche Bauelemente wurden mit anderen Resonatorgeometrien realisiert, darunter auch Wellenleiter, dreidimensionale Scheiben und Quadrate sowie Arrays.
grünem Farbstoff durchsetzten Hüllen aus Siliciumdioxid umgeben waren, um eine Verstärkung zu erreichen und Verluste aufgrund der Dissipation des Metalls auszugleichen. Die Pumppulse lieferte ein bei 488 nm betriebener optischer parametrischer Oszillator. Eine Anordnung dieser Kern/Schale-Nanopartikel mit Durchmessern von 44 nm ermöglichte Oberflächen-Plasmonoszillationen, die bei einer Wellenlänge von 531 nm an photonische Moden ausgekoppelt wurden. 11) Darauf aufbauend wurde ein Spaser mit abstimmbarer Ausgangswellenlänge realisiert, indem die Gold-Nanokugeln durch Gold-Nanostäbe ersetzt und verschiedene organische Farbstoffe in unterschiedlichen Konzentrationen als Verstärkungsmedien verwendet werden.
Aufgaben Aufgabe 18-1: Spektrale Breiten von LED
Betrachten Sie sieben der in den Abb. 18.15 und 18.67 gezeigten LED-Spektren, und zwar die mit den Mittenfrequenzen 𝜆0 = 0.37, 0.53, 0.64, 0.91, 1.30, 1.93 und 2.25 μm. Schätzen Sie die spektralen Halbwertsbreiten in Einheiten von nm, Hz und eV graphisch ab. Vergleichen Sie Ihre Schätzungen mit den aus den Gleichungen in der Übung 18-3 berechneten Werten. Schätzen Sie die Legierungsverbreiterung im LED-Spektrum mit der Mittenfrequenz 𝜆0 = 0.53 μm in Einheiten von nm, Hz und eV ab.
Farbstoffverkleideter Gold-Nanokugel-LOP-Spaser
Ein Subwellenlängen-Nanoresonatorlaser, der auf der Verstärkung von lokalisierten Oberflächenplasmonen (LOP) basiert, wird oft als Spaser bezeichnet, ein Akronym für Oberflächenplasmonverstärkung durch induzierte Emission von Strahlung (engl. surface plasmon amplification by stimulated emission of radiation), ein Begriff, der 2003 von Bergman und Stockman geprägt wurde. Analog zu einem Laser erzeugt ein Spaser eine induzierte Emission von lokalisierten Oberflächenplasmonen in resonanten metallischen Nanostrukturen, die mit einem Verstärkungsmedium kombiniert sind. Der erste Nanolaser auf Spaserbasis aus dem Jahr 2009 bestand aus einer Anordnung von Gold-Nanokugelresonatoren mit Durchmessern von 15 nm, die von mit 10) Siehe N. Liu, A. Gocalinska, J. Justice, F. Gity, I. Povey, N. McCarthy, M. Pemble, E- Pelucci, H. Wei, C. Silien, X. Xu, B. Corbett, ‚Lithographically Defined Room Temperature Low Threshold Subwavelength Red-Emitting Hybrid Plasmonic Lasers‘, Nano Letters 16, 7822–7828, 2016.
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
Wellenlänge λ0 / µm
Abb. 18.67 Spektrale Intensitäten als Funktion der Wellenlänge für InGaAsP-LED im nahen Infrarot. Die maximalen Intensitäten sind alle auf denselben Wert normiert. Die spektrale Breite nimmt gemäß Gl. (18.29) wie 𝜆P2 zu.
Aufgabe 18-2: Äußerer Wirkungsgrad einer LED
Leiten Sie einen Ausdruck für den Wirkungsgrad 𝜂E für die Auskopplung des inneren unpolarisierten Lichts aus einer LED her, der die Winkelabhängigkeit der Fresnelreflexion an der Grenzfläche Halbleiter/Luft berücksichtigt (siehe Abschnitt 6.2). 11) Siehe M. A. Noginov, G. Zhu, A. M. Belgrave, R. Bakker, V. M. Shalaev, E. E, Narimanov, S. Stout, E. Herz, T. Suteewong, U. Wiesner, ‚Demonstration of a Spaser-Based Nanolaser‘, Nature 460, 1110–1113, 2009.
Aufgaben
Aufgabe 18-3: Einkopplung von Licht aus einer LED in eine optische Faser
Berechnen Sie den Anteil der von einer LED emittierten optischen Leistung, die durch eine optische Stufenindexfaser mit der numerischen Apertur NA = 0.1 in Luft und dem Kernbrechungsindex 1.46 akzeptiert wird (siehe Abschnitt 10.1). Nehmen Sie an, dass die LED eine planare Oberfläche, einen Brechungsindex 𝑛 = 3.6, und eine zu cos4 (𝜃) proportionale Winkelabhängigkeit der optischen Leistung besitzt. Nehmen Sie weiter an, dass die LED mit dem Kern der Faser verbunden ist und dass die Emissionsfläche kleiner ist als der Faserkern. Aufgabe 18-4: Bandbreite eines optischen Halbleiterverstärkers
Verwenden Sie die Daten aus Abb. 18.32(a), um die volle Bandbreite des InGaAsP-Verstärkers gegen die Konzentration Δn der injizierten Ladungsträger aufzutragen. Finden Sie eine lineare Näherung für die Bandbreite als Funktion von Δn und tragen Sie den Gewinnkoeffizienten des Verstärkers gegen die Bandbreite auf. Aufgabe 18-5: Maximaler Gewinnkoeffizient eines optischen Halbleiterverstärkers bei T = 0 K
(a) Zeigen Sie, dass der Maximalwert 𝛾max des Gewinnkoeffizienten 𝛾0 (𝜈) bei 𝑇 = 0 K bei 𝜈 = (E FL − E FV )∕ℎ liegt. (b) Geben Sie einen analytischen Ausdruck für den maximalen Gewinnkoeffizienten 𝛾max als Funktion der Konzentration Δn der injizierten Ladungsträger bei 𝑇 = 0 K an. (c) Tragen Sie für einen InGaAsP-Verstärker (𝜆0 = 1300 nm, 𝑛 = 3.5, 𝜏s = 2.5 ns, 𝑚L = 0.06 𝑚0 , 𝑚V = 0.4 𝑚0 ) 𝛾max gegen Δn für Werte von Δn von 1 × 1018 bis 2 × 1018 cm−3 auf. (d) Vergleichen Sie die Ergebnisse mit den Daten in Abb. 18.32(b). Aufgabe 18-6: Gewinnkoeffizient eines optischen GaAsHalbleiterverstärkers
Ein p-dotierter optischer Halbleiterverstärker aus GaAs (𝑇 = 300 K) (E g ≈ 1.40 eV, 𝑚L = 0.07 𝑚0 , 𝑚V = 0.50 𝑚0 ) mit dem Brechungsindex 𝑛 = 3.6 wird so dotiert (p0 = 1.2 × 1018 ), dass die Lebensdauer der strahlenden Rekombination bei 𝑇 = 300 K 𝜏s ≈ 2 ns ist. (a) Verwenden Sie die Gln. (18.33)–(18.35), um aus der gegebenen Konzentration Δn der injizierten Ladungsträger im stationären Zustand (die durch die Injektionsgeschwindigkeit R und die Gesamt-Rekombinationszeit 𝜏 bestimmt ist) den Gewinnkoeffizienten 𝛾0 (𝜈) als Funktion der Photonenenergie ℎ𝜈 zu berechnen (nehmen Sie 𝑇 = 0 K an). (b) Führen Sie dieselbe Berechnung mithilfe eines Computers für 𝑇 = 300 K durch. (c) Tragen Sie für beide Fälle den maximalen Gewinnkoeffizienten als Funktion von Δn auf. (d) Bestimmen Sie den Verlustkoeffizienten 𝛼
und die Transparenzkonzentration ΔnT mithilfe der linearen Näherung. (e) Tragen Sie für beide Fälle die volle Verstärkerbandbreite (in Hz, nm und eV) als Funktion von Δn auf. (f) Vergleichen Sie Ihre Ergebnisse mit dem Gewinnkoeffizienten und den Kurven des maximalen Gewinnkoeffizienten aus Abb. 18.68. Aufgabe 18-7: Verkleinerung der Bandlücke durch BandTail-Zustände Die Verkleinerung ΔE g der Bandlücke durch Band-Tail-
Zustände in InGaAsP und GaAs kann empirisch als ( ) ΔE g ∕(eV) ≈ (−1.6 × 10−8 ) p1∕3 + n1∕3 beschrieben werden, wobei n und p die Ladungsträgerkonzentrationen (in cm−3 ) aufgrund der Dotierung oder der Ladungsträgerinjektion oder von beiden ist. (a) Bestimmen Sie für p-dotiertes InGaAsP und GaAs die Konzentration p, die die Bandlücke um ungefähr 0.02 eV reduziert. (b) Bestimmen Sie für undotiertes InGaAsP und GaAs die Dichte Δn der injizierten Ladungsträger, die die Bandlücke um ungefähr 0.02 eV reduziert. Nehmen Sie dazu an, dass ni vernachlässigbar ist. (c) Berechnen Sie E g + ΔE g und vergleichen Sie das Ergebnis mit der Energie, bei der der Gewinnkoeffizient in Abb. 18.68(a) auf der niederfrequenten Seite null ist. Aufgabe 18-8: Verstärkergewinn und -bandbreite
GaAs besitzt eine intrinsische Ladungsträgerkonzentration ni = 1.8 × 106 cm−3 , eine Rekombinationslebensdauer 𝜏 = 50 ns, eine Bandlücke E g = 1.42 eV, eine effektive Elektronenmasse 𝑚L = 0.07 𝑚0 und eine effektive Lochmasse 𝑚V = 0.50 𝑚0 . Nehmen Sie 𝑇 = 0 K an. (a) Bestimmen Sie die Mittenfrequenz, die Bandbreite, und den maximalen Nettogewinn innerhalb der Bandbreite für einen GaAs-Verstärker der Länge d = 200 μm, Breite w = 10 μm und Dicke 𝑙 = 2 μm, wenn ein Strom von 1 mA durch das Bauelement geleitet wird. (b) Bestimmen Sie die Zahl von Textnachrichten, die durch die zuvor bestimmte Bandbreite ermöglicht werden, wenn jede Nachricht eine Bandbreite von 4 kHz einnimmt. (c) Bestimmen Sie die Bitrate, die durch den Verstärker weitergegeben werden kann, wenn jeder Kanal 64 kbits/s erfordert. Aufgabe 18-9: Übergangsquerschnitt
Bestimmen Sie den Übergangsquerschnitt 𝜎(𝜈) für GaAs als Funktion von Δn bei 𝑇 = 0 K. Die Wahrscheinlichkeitsdichte für die induzierte Emission oder Absorption ist 𝜙𝜎(𝜈), wobei 𝜙 die Photonenflussdichte ist. Warum ist der Übergangsquerschnitt für optische Halbleiterverstärker weniger nützlich als für andere Laserverstärker?
645
300 2 × 1018 cm–3 1.8
200 1.6 100
1.4 1.2
0 1.38
1.40
1.42
max. Gewinnkoeffizient γp / cm–1
18 LED und Laserdioden
Gewinnkoeffizient γ0 (ν) / cm–1)
646
1.44 hν /eV
300
200
100
0
0
0.5
1.0 Δ /
(a)
(10 18
1.5
2.0
cm–3)
(b)
Abb. 18.68 Gewinnkoeffizient und maximaler Gewinnkoeffizient eines GaAs-OHV. (Modifiziert nach M. B. Panish, ‚Heterostructure Injection Lasers‘, Proceedings of the IEEE 64, 1512–1540, 1976; Abb. 4. ©1976 IEEE.)
Aufgabe 18-10: Gewinnprofil
Betrachten Sie einen 1550 nm InGaAsP-Verstärker (𝑛 = 3.5) der in Abb. 18.35 gezeigten Art mit einem identischen Antireflexbelag auf seinem Eingangs- und Ausgangsfenster. Berechnen Sie das maximale Reflexionsvermögen jeder Seite, das toleriert werden kann, wenn die Variationen im Gewinnprofil aufgrund der Frequenzabhängigkeit der Fabry-Pérot-Transmission auf weniger als 10 % beschränkt werden sollen [siehe Gl. (7.32)]. Aufgabe 18-11: Abhängigkeit der Ausgangsleistung vom Brechungsindex
Identifizieren Sie die Terme in dem durch Gl. (18.54) gegebenen Photonenfluss 𝛷A am Ausgang, die vom Brechungsindex des Kristalls abhängen.
Aufgabe 18-14: Modenabstand bei wellenlängenabhängigem Brechungsindex
Der Frequenzabstand der Moden einer Laserdiode wird durch die Tatsache kompliziert, dass der Brechungsindex wellenlängenabhängig ist [d. h. 𝑛 = 𝑛(𝜆0 )]. Eine Laserdiode der Länge 430 μm oszilliert bei einer Mittenwellenlänge 𝜆L = 650 nm. Innerhalb der Bandbreite der Emission kann angenommen werden, dass 𝑛(𝜆0 ) linear von 𝜆0 abhängt [d. h. 𝑛(𝜆0 ) = 𝑛0 − 𝑎(𝜆0 − 𝜆L ), wobei 𝑛0 = 𝑛(𝜆L ) = 3.4 und 𝑎 = d𝑛∕ d𝜆0 ist]. (a) In der Nähe der Wellenlänge 𝜆L ist der Abstand zwischen den Lasermoden Δ𝜆 ≈ 0.12 nm. Erklären Sie, warum dieser Wert nicht gleich dem üblichen Modenabstand 𝜈F = 𝑐∕2d ist. (b) Geben Sie eine Abschätzung für 𝑎 an. (c) Erklären Sie das Phänomen des „Mode Pulling“ in einem Gaslaser und vergleichen Sie es mit dem zuvor beschriebenen Effekt in Halbleiterlasern.
Aufgabe 18-12: Zahl der Longitudinalmoden
Ein Strom wird in eine InGaAsP-Diode mit der Bandlücke E g = 0.91 eV und dem Brechungsindex 𝑛 = 3.5 injiziert, sodass der Unterschied der Ferminiveaus E FL − E FV = 0.96 eV ist. Bestimmen Sie für einen verlustfreien Resonator der Länge d = 250 μm die maximale Zahl von Longitudinalmoden, die oszillieren können. Aufgabe 18-13: Minimaler Gewinn für Laserbetrieb
Ein InGaAsP-Kristall der Länge 500 μm emittiert bei einer Wellenlänge, bei der sein Brechungsindex 𝑛 = 3.5 ist. Vernachlässigen Sie Streuung und andere Verluste und bestimmen Sie den Gewinnkoeffizienten, der erforderlich ist, um die Dämpfung durch Reflexion an den Grenzflächen des Kristalls gerade auszugleichen.
Weiterführende Literatur LED und OLED
Siehe auch die Weiterführende Literatur in Kapitel 17. T.-Y. Seong, J. Han, H. Amano, H. Morkoc (Hrsg.), IIINitride Based Light Emitting Diodes and Applications, Springer, 2. Aufl. 2017. D. J. Gaspar, E. Polikarpov (Hrsg.), OLED Fundamentals: Materials, Devices, and Processing of Organic LightEmitting Diodes, CRC Press/Taylor & Francis 2015. M. H. Crawford, J. J. Wierer, A. J. Fischer, G. T. Wang, D. D. Koleske, G. S. Subramania, M. E. Coltrin, J. Y. Tsao, R. F. Karlicek, Jr., ‚Solid-State Lighting: Toward Smart and Ultra-Efficient Materials, Devices, Lamps and Systems‘.
Aufgaben
In: D. L. Andrews (Hrsg.), Photonics: Scientific Foundations, Technology and Applications, Bd. III: Photonics Technology and Instrumentation, Wiley-Science Wise 2015. V. K. Khanna, Fundamentals of Solid-State Lighting: LEDs, OLEDs, and Their Applications in Illumination and Displays, CRC Press/Taylor & Francis 2014. J.-J. Huang, H.-C. Kuo, S.-C. Shen (Hrsg.), Nitride Semiconductor Light-Emitting Diodes (LEDs): Materials, Technologies and Applications, Woodhead 2014. A. Buckley (Hrsg.), Organic Light-Emitting Diodes (OLEDs): Materials, Devices and Applications, Woodhead 2013. S. Nakamura, M. R. Krames, ‚History of Gallium-NitrideBased Light-Emitting Diodes for Illumination‘, Proceedings of the IEEE 101, 2211–2220, 2013. E. F. Schubert, Light-Emitting Diodes, Cambridge University Press, 2. Aufl. 2006. J. H. Burroughes, D. D. C. Bradley, A. R. Brown, R. N. Marks, K. Mackay, R. H. Friend, P. L. Burn, A. B. Holmes, ‚LightEmitting Diodes Based on Conjugated Polymers‘, Nature 347, 539–541, 1990. C. W. Tang, S. A. VanSlyke, ‚Organic Electroluminescent Diodes‘, Applied Physics Letters 51, 913–915, 1987. H. J. Round, ‚A Note on Carborundum‘, Electrical World 49, 309, 1907. Siliciumphotonik
Siehe auch die Weiterführende Literatur zu integrierten photonischen Schaltkreisen in Kapitel 25. D. Van Thourhout, Z. Wang, G. Roelkens, ‚Ill-V-on-Silicon Integration‘, Optics & Photonics News 28(3), 32–39, 2017. D. Thomson, A. Zilkie, J. E. Bowers, T Komljenovic, G. T. Reed, L. Vivien, D. Marris-Morini, E. Cassan, L. Virot, J.-M. Fedeli, J.-M. Hartmann, J. H. Schmid, D.-X. Xu, F. Boeuf, P. O’Brien, G. Z. Mashanovich, M. Nedeljkovic, ‚Roadmap on Silicon Photonics‘, Journal of Optics 18, 073003, 2016. J. W. Silverstone, D. Bonneau, J. L. O’Brien, M. G. Thompson, ‚Silicon Quantum Photonics‘, IEEE Journal of Selected Topics in Quantum Electronics 22, 6700113, 2016. L. Chrostowski, M. Hochberg, Silicon Photonics Design: From Devices to Systems, Cambridge University Press 2015. A. Y. Liu, S. Srinivasan, J. Norman, A. C. Gossard, J. E. Bowers, ‚Quantum Dot Lasers for Silicon Photonics‘, Photonics Research 3(5), B1–B9, 2015. Z. Zhou, B. Yin, J. Michel, ‚On-Chip Light Sources for Silicon Photonics‘, Light: Science & Applications 4, e358, 2015; doi:10.1038/lsa.2015.131. W. Bogaerts, ‚Silicon Photonics‘. In: D. L. Andrews (Hrsg.), Photonics: Scientific Foundations, Technology and Applications, Bd. II: Nanophotonic Structures and Materials, Wiley-Science Wise 2015.
B. R. Koch, S. Srinivasan, J. E. Bowers, ‚Hybrid Silicon Lasers‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. L. Vivien, L. Pavesi (Hrsg.), Handbook of Silicon Photonics, CRC Press/Taylor & Francis 2013. M. J. Deen, P. K. Basu, Silicon Photonics: Fundamentals and Devices, Wiley 2012. D. J. Lockwood, L. Pavesi (Hrsg.), ‚Silicon Photonics II: Components and Integration‘, Springer 2011. H. Rong, S. Xu, Y.-H. Kuo, V Sih, O. Cohen, O. Raday, M. Paniccia, ‚Low-Threshold Continuous-Wave Raman Silicon Laser‘, Nature Photonics 1, 232–237, 2007. H. Rong, R. Jones, A. Liu, O. Cohen, D. Hak, A. Fang, M. Paniccia, ‚A Continuous-Wave Raman Silicon Laser‘, Nature 433, 725–728, 2005. Optische Halbleiterverstärker und Laserdioden
Siehe auch die Weiterführende Literatur in den Kapiteln 15– 17. J. Ohtsubo, Semiconductor Lasers: Stability, Instability and Chaos, Springer, 4. Aufl. 2017. P. K. Basu, B. Mukhopadhyay, R. Basu, ‚Semiconductor Laser Theory‘, CRC Press/Taylor & Francis 2016. T. Numai, ‚Fundamentals of Semiconductor Lasers‘, Springer, 2. Aufl. 2015. N. K. Dutta, Q. Wang, ‚Semiconductor Optical Amplifiers‘, World Scientific, 2. Aufl. 2013. L. A. Coldren, S. W. Corzine, M. L. Masanovic, Diode Lasers and Photonic Integrated Circuits, Wiley, 2. Aufl. 2012. S. Nakamura, S. Pearton, G. Fasol, ‚The Blue Laser Diode: The Complete Story‘, Springer, 2. Aufl. 2000. J. J. Coleman (Hrsg.), ‚Selected Papers on Semiconductor Diode Lasers‘, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 50). H. Amano, T. Asahi, I. Akasaki, ‚Stimulated Emission Near Ultraviolet at Room Temperature from a GaN Film Grown on Sapphire by MOVPE Using an AlN Buffer Layer‘, Japanese Journal of Applied Physics 29, L205– L206, 1990. Zh. I. Alferov, V. M. Andreev, E. L. Portnoi, M. K. Trukan, ‚AlAs-GaAs Heterojunction Injection Lasers with a Low Room-Temperature Threshold‘, Soviet Physics – Semiconductors 3, 1107–1110, 1970 [Fizika i Tekhnika Poluprovodnikov 3, 1328–1332,1969]. Quanteneinschluss- und Mikroresonatorlaser
Siehe auch die Weiterführende Literatur zu quantenbeschränkten Materialien und Nanostrukturen in Kapitel 17. A. Rahimi-Iman, ‚Recent Advances in VECSELs‘, Journal of Optics 18, 093003, 2016. P. Blood, Quantum Confined Laser Devices: Optical Gain and Recombination in Semiconductors, Oxford University Press 2015.
647
648
18 LED und Laserdioden
J. Wu, S. Chen, A. Seeds, H. Liu, ‚Quantum Dot Optoelectronic Devices: Lasers, Photodetectors and Solar Cells‘, Journal of Physics D: Applied Physics 48, 363001, 2015. Y. Zhang, X. Zhang, K. H. Li, Y. F. Cheung, C. Feng, H. W. Choi, ‚Advances in Ill-Nitride Semiconductor Microdisk Lasers‘, Physica Status Solidi A 212, 960–973, 2015. R. De La Rue, S. Yu, J.-M. Lourtioz (Hrsg.), ‚Compact Semiconductor Lasers‘, Wiley-VCH 2014. M. T. Hill, M. C. Gather, ‚Advances in Small Lasers‘, Nature Photonics 8, 908–918, 2014. R. Michalzik (Hrsg.), VCSELs: Fundamentals, Technology and Applications of Vertical-Cavity Surface-Emitting Lasers, Springer 2013. K. Takeda, T. Sato, A. Shinya, K. Nozaki, W. Kobayashi, H. Taniyama, M. Notomi, K. Hasebe, T. Kakitsuka, S. Matsuo, ‚Few-fJ/Bit Data Transmissions Using Directly Modulated Lambda-Scale Embedded Active Region Photonic-Crystal Lasers‘, Nature Photonics 7, 569–575, 2013. C. Jagadish, E. R. Weber (Hrsg.), Semiconductors and Semimetals. Bd. 86 in J. J. Coleman, A. C. Bryce, C. Jagadish (Hrsg.), Advances in Semiconductor Lasers, Academic Press/Elsevier 2012. X. Cai, J. Wang, M. J. Strain, B. Johnson-Morris, J. Zhu, M. Sorel, J. L. O’Brien, M. G. Thompson, S. Yu, ‚Integrated Compact Optical Vortex Beam Emitters‘, Science 338, 363–366, 2012. O. G. Okhotnikov (Hrsg.), Semiconductor Disk Lasers: Physics and Technology, Wiley-VCH 2010. O. Painter, R. K. Lee, A. Scherer, A. Yariv, J. D. O’Brien, P. D. Dapkus, I. Kim, ‚Two-Dimensional Photonic Band-Gap Defect Mode Laser‘, Science 284, 1819–1821, 1999. N. Kirstaedter, N. N. Ledentsov, M. Grundmann, D. Bimberg, V. M. Ustinov, S. S. Ruvimov, M. V Maximov, P. S. Kop’ev, Zh. I. Alferov, U. Richter, P. Werner, U. Gösele, J. Heydenreich, ‚Low Threshold, Large 𝑇0 Injection Laser Emission from (InGa)As Quantum Dots‘, Electronics Letters 30, 1416–1417, 1994. P. S. Zory, Jr. (Hrsg.), Quantum Well Lasers, Academic Press 1993. A. F. J. Levi, R. E. Slusher, S. L. McCall, T, Tanbun-Ek, D. L. Coblentz, S. J. Pearton, ‚Room Temperature Operation of Microdisc Lasers with Submilliamp Threshold Current‘, Electronics Letters 28, 1010–1012, 1992. J. L. Jewell, A. Scherer, S. L. McCall, Y. H. Lee, S. Walker, J. P. Harbison, L. T. Florez, ‚Low-Threshold Electrically Pumped Vertical-Cavity Surface-Emitting Microlasers‘, Electronics Letters 25, 1123–1124, 1989. R. D. Dupuis, P. D. Dapkus, R. Chin, N. Holonyak, Jr., S. W. Kirchoefer, ‚Continuous 300 K Laser Operation of SingleQuantum-Well AlGaAs−GaAs‘, ‚Heterostructure Diodes Grown by Metalorganic Chemical Vapor Deposition‘, Applied Physics Letters 34, 265–267, 1979.
Interband- und Quantenkaskadenlaser im Infrarot
W. Zhou, N. Bandyopadhyay, D. Wu, R. McClintock, M. Razeghi, ‚Monolithically, Widely Tunable Quantum Cascade Lasers Based on a Heterogeneous Active Region Design‘, Scientific Reports 6, 25213, 2016. M. S. Vitiello, G. Scalari, B. Williams, P. De Natale, ‚Quantum Cascade Lasers: 20 Years of Challenges‘, Optics Express 23, 5167–5182, 2015. J. Faist, Quantum Cascade Lasers, Oxford University Press 2013. M. Troccoli, A. Lyakh, J. Fan, X. Wang, R. Maulini, A. G. Tsekoun, R. Go, C. K. N. Patel, ‚Long-Wave IR Quantum Cascade Lasers for Emission in the 𝜆 = 8−12 μm Spectral Region‘, Optical Materials Express 3, 1546–1560, 2013. Y. Yao, A. J. Hoffman, C. F. Gmachl, ‚Mid-Infrared Quantum Cascade Lasers‘, Nature Photonics 6, 432–439, 2012. E. Tournie, A. N. Baranov, ‚Mid-Infrared Semiconductor Lasers: A Review‘. In: C. Jagadish, E. R. Weber (Hrsg.), Semiconductors and Semimetals, Bd. 86 in Advances in Semiconductor Lasers, Academic Press/Elsevier 2012, S. 183–226. A. Hugi, R. Maulini, J. Faist, ‚External Cavity Quantum Cascade Laser‘, Semiconductor Science and Technology 25, 083001, 2010. B. S. Williams, ‚Terahertz Quantum-Cascade Lasers‘, Nature Photonics 1, 517–525, 2007. R. Paiella (Hrsg.), Intersubband Transitions in Quantum Structures, McGraw-Hill 2006. J. Faist, F. Capasso, D. L. Sivco, C. Sirtori, A. L. Hutchinson, A. Y. Cho, ‚Quantum Cascade Laser‘, Science 264, 553– 556, 1994. R. F. Kazariiiov, R. A. Suris, ‚Amplification of Electromagnetic Waves in a Semiconductor Super-lattice‘, Soviet Physics – Semiconductors 5, 707–709, 1971 [Fizika i Tekhnika Poluprovodnikov 5, 797–800, 1971]. L. Esaki, R. Tsu, ‚Superlattice and Negative Differential Conductivity in Semiconductors‘, IBM Journal of Research and Development 14, 61–65, 1970. Nanolaser
Q. Gu, Y. Fainman, Semiconductor Nanolasers, Cambridge University Press 2017. M. Karl, C. P. Dietrich, M. Schubert, I. D. W Samuel, G. A. Turnbull, M. C. Gather, ‚Single Cell Induced Optical Confinement in Biological Lasers‘, Journal of Physics D: Applied Physics 50, 084005, 2017. S. Gwo, C.-K. Shih, ‚Semiconductor Plasmonic Nanolasers: Current Status and Perspectives‘, Reports on Progress in Physics 79, 086501, 2016. M. I. Stockman, ‚Quantum Nanoplasmonics‘. In: D. L. Andrews (Hrsg.), Photonics: Scientific Foundations, Technology and Applications, Bd. II: Nanophotonic Structures and Materials, Wiley-Science Wise 2015.
Aufgaben
M. T. Hill, M. C. Gather, ‚Advances in Small Lasers‘, Nature Photonics 8, 908–918, 2014. S. Noda, ‚Fundamentals of Photonic Crystals for Telecom Applications – Photonic Crystal Lasers‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. R.-M. Ma, R. F. Oulton, V. J. Sorger, X. Zhang, ‚Plasmon Lasers: Coherent Light Source at Molecular Scales‘, Laser & Photonics Review 7, 1–21, 2013. Y. Ma, X. Guo, X. Wu, L. Dai, L. Tong, ‚Semiconductor Nanowire Lasers‘, Advances in Optics and Photonics 5, 216–273, 2013. R. F. Oulton, V. J. Sorger, T. Zentgraf, R.-M. Ma, C. Gladden, L. Dai, G. Bartal, X. Zhang, ‚Plasmon Lasers at Deep Subwavelength Scale‘, Nature 461, 629–632, 2009. M. A. Noginov, G. Zhu, A. M. Belgrave, R. Bakker, V. M. Shalaev, E. E, Narimanov, S. Stout, E. Herz, T. Suteewong, U. Wiesner, ‚Demonstration of a Spaser-Based Nanolaser‘, Nature 460, 1110–1113, 2009. M. T. Hill, Y.-S. Oei, B. Smalbrugge, Y. Zhu, T. de Vries, P. J. van Veldhoven, F. W. M. van Otten, T. J. Eijkemans, J. P. Turkiewicz, H. de Waardt, E. J. Geluk, S.-H. Kwon, Y-H. Lee, R. Notzel, M. K. Smit, ‚Lasing in Metallic-Coated Nanocavities‘, Nature Photonics 1, 589–594, 2007. D. J. Bergman, M. I. Stockman, ‚Surface Plasmon Amplification by Stimulated Emission of Radiation: Quantum Generation of Coherent Surface Plasmons in Nanosystems‘, Physical Review Letters 90, 027402, 2003. Historische Darstellungen
Siehe auch die Weiterführende Literatur zu historischen Artikeln und Sammlungen von Nachrdrucken in Kapitel 16. I. Akasaki, ‚Fascinated Journeys into Blue Light‘; H. Amano, ‚Growth of GaN on Sapphire by Low Temperature Deposited Buffer Layer and Realization of P-Type GaN by Mg-Doping Followed by LEEBI Treatment‘; S. Nakamura, ‚Background Story of the Invention of Efficient Blue InGaN Light Emitting Diodes‘. Nobel Lectures in Physics, 2014. ‚Scientific Background on the Nobel Prize in Physics 2014: Efficient Blue Light-Emitting Diodes Leading to Bright and Energy-Saving White Light Sources‘, Kungliga Vetenskapsakademien 1–9, 2014. R. D. Dupuis, M. R. Krames, ‚History, Development, and Applications of High-Brightness Visible Light-Emitting Diodes‘, Journal of Lightwave Technology 26, 1154–1171, 2008. Zh. I. Alferov, ‚Double Heterostructure Concept and its Applications in Physics, Electronics and Technology‘. In: G. Ekspong (Hrsg.), Nobel Lectures, Physics 1996–2000, World Scientific 2002.
H. Kroemer, ‚Quasi-Electric Fields and Band Offsets: Teaching Electrons New Tricks‘. In: G. Ekspong (Hrsg.), Nobel Lectures, Physics 1996–2000, World Scientific 2003. Sonderheft, IEEE Journal of Selected Topics in Quantum Electronics 6(6), 2000. E. E. Loebner, ‚Subhistories of the Light Emitting Diode‘, IEEE Transactions on Electron Devices ED-23, 675–699, 1976. N. G. Basov, ‚Semiconductor Lasers‘, in: Nobel Lectures in Physics, 1963–1970, Elsevier 1972. T. M. Quist, R. H. Rediker, R. J. Keyes, W. E. Krag, B. Lax, A. L. McWhorter, H. J. Zeiger, ‚Semiconductor Maser of GaAs‘, Applied Physics Letters 1, 91–92, 1962. N. Holonyak, Jr., S. F. Bevacqua, ‚Coherent (Visible) Light Emission from Ga(As1−𝑥 P𝑥 ) Junctions‘, Applied Physics Letters 1, 82–83, 1962. M. I. Nathan, W. P. Dumke, G. Burns, F. H. Dill, Jr., G. Lasher, ‚Stimulated Emission of Radiation from GaAs p-n Junctions‘, Applied Physics Letters 1, 62–64, 1962. R. N. Hall, G. E. Fenner, J. D. Kingsley, T. J. Soltys, R. O. Carlson, ‚Coherent Light Emission from GaAs Junctions‘, Physical Review Letters 9, 366–368, 1962. J. I. Pankove, J. E. Berkeyheiser, ‚A Light Source Modulated at Microwave Frequencies‘, Proceedings of the IRE 50, 1976–1977, 1962. J. I. Pankove, ‚Tunneling-Assisted Photon Emission in Gallium Arsenide pn Junctions‘, Physical Review Letters 9, 283–285, 1962. R. J. Keyes, T. M. Quist, ‚Recombination Radiation Emitted by Gallium Arsenide‘, Proceedings of the IRE 50, 1822– 1823, 1962. J. R. Biard, G. E. Pittman, ‚Semiconductor Radiant Diode‘, US-Patent 3 293 513, 20. Dezember 1966 (registriert am 8. August 1962). N. G. Basov, O. N. Krokhin, Yu. M. Popov, ‚Production of Negative-Temperature States in p-n Junctions of Degenerate Semiconductors‘, Soviet Physics-JETP 13, 1320–1321, 1961 [Zhurnal Eksperimental’noi i Teoreticheskoi Fiziki 40, 1879–1880, 1961]. M. G. A. Bernard, G. Duraffourg, ‚Laser Conditions in Semiconductors‘, Physica Status Solidi 1, 699–703, 1961. John von Neumann zeigte in unveröffentlichten Nachrichten an Edward Teller aus dem September 1953, dass es im Prinzip möglich ist, die Gleichgewichtskonzentrationen von Ladungsträgern in einem Halbleiter zu stören und dadurch eine Lichtverstärkung durch induzierte Emission zu erreichen, z. B. durch Rekombination von Elektronen und Löchern, die in einen pn-Übergang injiziert wurden [siehe J. von Neumann, ‚Notes on the Photon-Disequilibrium-Amplification Scheme (JvN)‘, Sept. 16, 1953, IEEE Journal of Quantum Electronics QE-23, 658–673, 1987].
649
651
19 Photodetektoren Ein Photodetektor ist ein Bauelement, dessen elektrische Eigenschaften (z. B. Strom, Spannung, Widerstand . . . ) sich bei Bestrahlung mit Licht verändern. Es wandelt die Energie der absorbierten Photonen in eine messbare Form um und ermöglicht so die Bestimmung des Photonenflusses oder der optischen Leistung eines Lichtstrahls. Es kann ebenfalls benutzt werden, um die zeitliche und/oder räumliche Interferenz zwischen einfallenden Lichtstrahlen zu messen. Zwei Arten von Photodetektoren sind gebräuchlich: • Photoelektrische Detektoren beruhen auf dem photoelektrischen Effekt oder Photoeffekt. Dabei regt die Absorption von Photonen durch ein Material Elektronen in höhere Energieniveaus an und erzeugt so bewegliche Ladungsträger. Unter der Wirkung eines elektrischen Feldes bewegen sich diese Ladungsträger und produzieren einen messbaren elektrischen Strom. Der Photoeffekt tritt in zwei Varianten auf: als äußerer und innerer Photoeffekt. Der äußere Photoeffekt resultiert in einer photoelektrischen Emission, bei der die angeregten Elektronen als freie Elektronen aus dem Material entweichen. Der innere Photoeffekt führt zu Photoleitung; hier bleiben die angeregten Ladungsträger innerhalb des Materials und vergrößern seine Leitfähigkeit. • Thermische Detektoren wandeln die Photonenenergie durch verschiedene Effekte in Wärme um. Bolometer und Mikrobolometer beruhen auf Änderungen des Widerstands eines Materials aufgrund von Temperaturänderungen, während Thermoelemente und Thermosäulen auf dem thermoelektrischen Effekt beruhen, der die direkte Umwandlung einer Temperaturdifferenz in eine Spannungsdifferenz an der Grenzfläche zweier miteinander verbundener ungleicher Materialien beschreibt. Pyroelektrische Detektoren sprechen auf die Änderungsrate der Temperatur an und entwickeln beim Erhitzen eine elektrische Spannungsdifferenz an ihrer Oberfläche. Die Ursache hierfür ist eine Änderung der Atompositio-
nen im Kristall, die dessen Polarisationsdichte verändert. Golayzellen schließlich sind Bauelemente, die ein im Infraroten absorbierendes Gas in einem Behälter mit einer flexiblen Membran enthalten. Einfallende Infrarotstrahlung erwärmt das Gas, wodurch sich sein Druck erhöht und die Membran verformt wird. Diese Deformation wird durch Reflexion eines Lichtstrahls registriert und erlaubt einen Rückschluss über die auf die Zelle einfallende Leistung der infraroten Strahlung. Thermische Detektoren galten lange Zeit als ineffizient und langsam im Vergleich zu photoelektrischen Detektoren, da jede Temperaturänderung eine gewisse Zeit erfordert. Die jüngsten Fortschritte bei der Herstellung und Miniaturisierung haben die Leistung von Thermoarraydetektoren jedoch dramatisch verbessert, sodass sie jetzt ernstzunehmende Konkurrenten für Anwendungen im Bereich der Bildgebung im mittleren Infrarot sind.
In diesem Kapitel . . . Dieses Kapitel ist der Untersuchung von verschiedenen photoelektrischen Detektoren gewidmet, die in der Photonik zum Einsatz kommen. Wir beginnen in Abschnitt 19.1 mit einer Diskussion des äußeren und inneren Photoeffekts, und wir untersuchen mehrere wichtige allgemeine Eigenschaften von Photodetektoren wie z. B. ihre Quantenausbeute, Ansprechempfindlichkeit und Antwortzeit. In den Abschnitten 19.2, 19.3 und 19.4 wenden wir unsere Aufmerksamkeit drei Arten von Halbleiter-Photodetektoren zu, die auf dem inneren Photoeffekt beruhen: Photoleitern, Photodioden und Lawinenphotodioden. Detektorarrays, die elektronische Versionen von optischen Bildern erzeugen, werden in Abschnitt 19.5 betrachtet. Um die Leistung von Halbleiter-Photodetektoren in verschiedenen Anwendungen bewerten zu können, ist es wichtig, ihre Rauscheigenschaften zu verstehen, die in Abschnitt 19.6 entwickelt werden.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
652
19 Photodetektoren
dem Ferminiveau des Metalls ist. Gleichung (19.1) ist als Einsteingleichung der Photoemission bekannt. Nur wenn das Elektron am Anfang am Ferminiveau liegt, kann es die maximale in Gl. (19.1) angegebene kinetische Energie besitzen; die Emission eines tiefer liegenden Elektrons erfordert zusätzliche Energie, um es bis auf das Ferminiveau anzuheben, wodurch die kinetische Energie des emittierten Elektrons reduziert wird. Die niedrigste Austrittsarbeit eines Metalls (Cs) beträgt ungefähr 2 eV, sodass optische Detektoren auf der Grundlage des äußeren Photoeffekts reiner Metalle in den sichtbaren und ultravioletten Regionen des Spektrums eingesetzt werden können.
Das Rauschen im Ausgangssignal eines photoelektrischen Detektors resultiert aus mehreren Quellen: Dem Photonencharakter des Lichts selbst (Photonenrauschen), der Konversion von Photonen in Ladungsträger (Photoelektronenrauschen), der Erzeugung von sekundären Ladungsträgern durch innere Verstärkung (Gewinnrauschen) sowie dem Rauschen der Empfängerelektronik. Eine kurze Diskussion der Leistung analoger und digitaler optischer Empfänger schließt das Kapitel ab.
19.1 Photodetektoren 19.1.1
Die Emission von Photoelektronen aus einem Halbleiter
Äußerer und innerer Photoeffekt
Die Emission von Photoelektronen
Wenn die Energie eines Photons, das im Vakuum auf ein Material auftrifft, groß genug ist, kann das angeregte Elektron die Potentialbarriere an der Oberfläche des Materials überwinden und als freies Elektron ins Vakuum austreten. Dieser Prozess, die Emission von Photoelektronen, ist in Abb. 19.1(a) für ein Metall illustriert. Ein einfallendes Photon der Energie ℎ𝜈 setzt ein Elektron aus dem teilweise gefüllten Leitungsband frei. Die Wechselwirkung des austretenden Elektrons mit dem zurückbleibenden Ion bewirkt ebenso wie verschiedene Transport-, Streu- und Abschirmeffekte eine geringfügige Verzögerung der Emission. Sie hängt von dem verwendeten Metall sowie der Energie des auftreffenden Elektrons ab, liegt aber normalerweise in der Größenordnung von 100 Attosekunden. Die Emission von Photoelektronen aus einem Metall
Die Energieerhaltung verlangt, dass Elektronen aus Zuständen unterhalb des Ferminiveaus eine maximale kinetische Energie von E max = ℎ𝜈 − W
(19.1)
haben, wobei die photoelektrische Austrittsarbeit W die Energiedifferenz zwischen dem Vakuumniveau und freies Elektron nächsthöheres Band Vakuum
hν
hν
E max = ℎ𝜈 − W = ℎ𝜈 − (E g + 𝜒) ,
Substanzen mit negativer Elektronenaffinität
Es wurden auch Halbleiter mit negativer Elektronenaffinität (NEA) entwickelt, in denen die Leitungsbandkante über dem Vakuumniveau des Vollmaterials liegt, sodass ℎ𝜈 nur E g überschreiten muss, damit Photoemission eintritt (eine dünne n-dotierte oder metallische Schicht auf einem p-dotierten Material kann ein Verbiegen der Bänder an der Oberfläche des Materials bewirken, sodass der Grund des Leitungsbands tatsächlich unter dem Vakuumniveau liegt). NEA-Detektoren
Vakuum Leitungsband Ferminiveau
Ferminiveau Leitungsband (a) Metall
(19.2)
wobei E g die Energie der Bandlücke und 𝜒 die Elektronenaffinität des Materials (der Energieunterschied zwischen dem Vakuumniveau und dem Grund des Leitungsbands) sind. Die Energie E g + 𝜒 kann bis hinunter zu etwa 1.4 eV reichen (z. B. für NaKCsSb, auf dem die sogenannte S-20-Photokathode beruht), sodass photoemittierende Halbleiterdetektoren im nahen Infrarot sowie im Sichtbaren und UV betrieben werden können.
freies Elektron Photon
Photon
Die Photoemission aus einem intrinsischen Halbleiter ist schematisch in Abb. 19.1(b) dargestellt. Photoelektronen werden gewöhnlich aus dem Valenzband herausgeschlagen, wo sie in großer Zahl vorliegen. Die zu Gl. (19.1) analoge Gleichung lautet
Valenzband
(b) Halbleiter
χ
g
Abb. 19.1 Photoelektrische Emission (a) aus einem Metall und (b) aus einem intrinsischen Halbleiter. Die Bandlücke und die Elektronenaffinität des Materials sind mit E g bzw. 𝜒 bezeichnet, und W ist die photoelektrische Austrittsarbeit. Diese Größen werden gewöhnlich alle in eV angegeben.
19.1 Photodetektoren
Sekundärelektronenvervielfacher (SEV) oder Photomultiplier (PM) bezeichnet. Es kann den anfänglich erzeugten Photostrom rauscharm um einen Faktor von bis zu 108 verstärken (siehe Beispiel 19-10).
wie z. B. Cs-beschichtetes GaAs reagieren daher auf etwas größere Wellenlängen im nahen Infrarot und zeigen auch eine verbesserte Quantenausbeute und einen reduzierten Dunkelstrom. Photokathoden aus inhomogenen Materialien oder Oxiden wie z. B. die S-1-Photokathode können auch im nahen Infrarot verwendet werden, aber nur bis zu Wellenlängen von 𝜆0 ≃ 1 μm.
Anwendungen von Sekundärelektronenvervielfachern
Obwohl SEV normalerweise eher mäßige Quantenausbeuten besitzen und hohe Betriebsspannungen erfordern, werden sie in zahlreichen Anwendungen eingesetzt. Aufgrund ihrer hohen Verstärkung, ihres geringen Dunkelstroms, ihres geringen Rauschens und ihrer schnellen Reaktionszeit können sie einzelne optische Photonen nachweisen (Abschnitt 19.4.3). Sie kommen auf so unterschiedlichen Gebieten wie der Vermessung von Ölbohrlöchern (da sie hohen Temperaturen widerstehen können) oder in γ-Kameras zum Einsatz. γund β-Strahlen können mit SEV nachgewiesen werden, wenn man Szintillatormaterialien verwendet, die diese energiereichen Teilchen durch Radio- bzw. Betalumineszenz in sichtbare Photonen umwandeln (Abschnitt 14.5.1). Der Super-Kamiokande-Neutrinodetektor in Japan verwendet mehr als 11 000 SEV mit einem Durchmesser von jeweils 0.5 m, die die Innenwände eines unterirdischen Tanks mit 50 000 Tonnen Wasser bedecken. In diesem Tank sollen Neutrinos mit den Atomen des Wassers wechselwirken und dabei geladene Teilchen erzeugen, die sich schneller als das Licht in Wasser fortbewegen. Dabei entstehen blaue Blitze von
Vakuum-Photodioden und Sekundärelektronenvervielfacher
In ihrer einfachsten Form sind photoelektrische Photodetektoren Vakuumröhren, sogenannte Vakuum-Photodioden oder Röhrendioden. In ihnen werden Elektronen aus der Oberfläche eines photoemittierenden Materials, der Photokathode, emittiert und gelangen zu einer Elektrode (Anode), die auf einem höheren elektrischen Potential liegt. Die Photokathode kann undurchlässig [dann spricht man von Reflexionsbetrieb, Abb. 19.2(a)] oder halbdurchlässig sein [Transmissionsbetrieb, Abb. 19.2(b)]. Durch den Elektronentransport zwischen Kathode und Anode wird ein zum Photonenfluss proportionaler Strom erzeugt, der Photostrom. Die photoemittierten Elektronen können durch Sekundäremission auch eine Kaskade von Elektronen produzieren. Das passiert dann, wenn die Photoelektronen auf besondere Halbleiter oder cäsiumbeschichtete Oxidoberflächen in der Röhre treffen, sogenannte Dynoden, die auf sukzessive höheren Potentialen gehalten werden.Dieses nützliche Bauelement [Abb. 19.2(b)] wird als
Photokathode
hν
hν
Photokathode Elektronenkaskade
Anode
Anode Dynoden
Elektron
RL
RL (a) –V
(b) –V abbildende Photokathode
hν
Elektronenkaskade
Kapillaren (c)
(d)
–V
Abb. 19.2 (a) Vakuumdiode mit einer Photokathode im Reflexionsbetrieb. (b) Sekundärelektronenvervielfacher mit einer halbdurchlässigen Photokathode im Transmissionsbetrieb. (c) Schnitt durch eine Mikrokanalplatte. (d) Elektronenvervielfachung in einer einzelnen Kapillare einer Mikrokanalplatte.
653
654
19 Photodetektoren
Tscherenkowstrahlung, die von den SEV registriert werden. Am anderen Ende der Größenskala von SEV stehen Mikro-SEV mit einer Fläche von etwa 1 cm2 bei einer Höhe von 2 mm und einem Gewicht von nur etwa 0.5 g, die immer noch Verstärkungen von ungefähr 107 ermöglichen. Sie werden beispielsweise in tragbaren Photosensoren für Anwendungen wie z. B. biomedizinische Schnelltests, biochemische Mikroanalysen oder Umweltüberwachung verwendet. Mikrokanalplatten
Ein bildgebendes Bauelement auf dieser Grundlage ist die Mikrokanalplatte. Sie besteht aus einer Anordnung von Millionen von Kapillaren (mit inneren Durchmessern von ≈ 10 μm) in einer Glasplatte mit einer Dicke von ≈ 1 mm. Beide Flächen der Platte sind mit dünnen Metallschichten beschichtet, die als Elektroden dienen und an die eine Spannung [Abb. 19.2(c)] angelegt wird. Die Innenwände jeder Kapillare werden mit einem Material beschichtet, das Sekundärelektronen emittiert; sie verhält damit sich wie eine kontinuierliche Dynode, die den Photostrom am Ort dieser Kapillare vervielfacht [Abb. 19.2(d)]. Der lokale Photonenfluss in einem schwachen Bild wird so in einen starken Elektronenfluss umgewandelt, der direkt gemessen werden kann. Anschließend kann der Elektronenfluss in ein (verstärktes) optisches Bild zurückverwandelt werden, indem die hintere Elektrode mit einer Leuchtschicht beschichtet wird, die durch Kathodolumineszenz Licht erzeugt (siehe Abschnitt 14.5.1); diese Kombination wird als Bildverstärker bezeichnet. Photoleitfähigkeit
Die meisten modernen Photodetektoren beruhen auf dem inneren Photoeffekt, bei dem die angeregten Ladungsträger (Elektronen und Löcher) innerhalb der Probe verbleiben. Detektoren auf der Grundlage der Photoleitfähigkeit nutzen die lichtinduzierte Zunahme der elektrischen Leitfähigkeit eines Materials aus. Die Absorption eines Photons durch einen intrinsischen Halbleiter bewirkt beispielsweise die Erzeugung eines freien Elektrons, das dabei aus dem Valenzband ins Leitungsband angeregt wird (Abb. 19.3); gleichzeitig entsteht ein Loch im Valenzband. Anlegen eines elektrischen Feldes an das Material führt zu einem Transport von Elektronen und Löchern durch das Material und somit zu einem elektrischen Strom in der Schaltung. Halbleiterphotodioden bestehen aus einem pnÜbergang, der ebenfalls auf dem inneren Photoeffekt beruht. In der Sperrschicht absorbierte Photonen erzeugen Elektronen und Löcher, auf die das lokale elektrische Feld innerhalb dieser Schicht wirkt. Die Ladungsträger
Elektron Photon hν
hν
g
Abb. 19.3 Photoelektrische ElektronLoch-Erzeugung in einem Halbleiter.
Loch
bewegen sich in entgegengesetzte Richtungen; dieser Transportprozess führt zu einem elektrischen Strom im äußeren Stromkreis. Einige Photodetektoren enthalten innere Gewinnmechanismen, die den Photostrom durch Ladungsträgervervielfachung innerhalb des Detektors verstärken und so das Signal leichter registrierbar machen. Wenn das elektrische Feld in der Sperrschicht einer Photodiode ausreichend vergrößert wird, indem z. B. eine große Spannung in Sperrrichtung angelegt wird, können die Elektronen und Löcher so viel Energie erhalten, dass sie innerhalb dieser Schicht durch Stoßionisation (die Umkehrung der Auger-Rekombination, Abb. 17.22) zusätzliche Elektronen und Löcher freisetzen können. Bauelemente, die diesen inneren Verstärkungsprozess ausnutzen, werden als Lawinenphotodioden bezeichnet. Sie können als Alternative zu (oder in Verbindung mit) Laser-Vorverstärkern eingesetzt werden [siehe Abb. 25.6(c)], die das optische Signal vor der Detektion verstärken. Jeder dieser Verstärkungsmechanismen führt jedoch einen eigenen Anteil an Rauschen ein. In photoelektrischen Halbleiterdetektoren mit Gewinn laufen daher die folgenden drei elementaren Prozesse ab: Absorbierte Photonen erzeugen freie Ladungsträger. Transport: Ein angelegtes elektrisches Feld veranlasst diese Ladungsträger, sich zu bewegen und erzeugt so einen Strom im Schaltkreis. Verstärkung/Gewinn: In Lawinenphotodioden geben große elektrische Felder den Ladungsträgern eine so große Energie, dass sie durch Stoßionisation zusätzliche Ladungsträger freisetzen können. Dieser innere Verstärkungsprozess erhöht die Ansprechempfindlichkeit des Detektors auf Kosten eines zusätzlichen Rauschens. Erzeugung:
Organische Photodetektoren
Organische Halbleiter sind meist entweder kleine organische Moleküle oder ausgedehnte konjugierte Polymerketten. Das tiefste unbesetzte Molekülorbital (LUMO) und das höchste besetzte Molekülorbital (HOMO) können in ihnen als Analoga der Leitungs- bzw. Valenzbandkanten anorganischer Halbleiter angesehen wer-
19.1 Photodetektoren
den (Abschnitt 17.1.2). Die Absorption von Photonen führt zur Erzeugung von Ladungsträgern. Organische Photodetektoren (OPD) können als Photoleiter, Photodioden oder Phototransistoren eingesetzt und über einen breiten Wellenlängenbereich vom nahen Infrarot bis ins Ultraviolette betrieben werden. Sie werden häufig als Heteroübergänge ausgeführt, die konjugierte organische Halbleiter mit unterschiedlichen Elektronenaffinitäten kombinieren. Ähnlich wie OLED (Abschnitt 18.1.5) vereinen OPD eine Reihe von nützlichen Merkmalen: Sie sind dünn, leicht, mechanisch flexibel, semitransparent, für große Teile des optischen Spektrums empfindlich und in großen Stückzahlen günstig herzustellen. Gedruckte OPD können flexible Substrate wie z. B. Papier, Kunststoff oder Glas in intelligente Oberflächen verwandeln und zu tragbaren biomedizinischen Geräten machen. Im gegenwärtigen Entwicklungsstadium sind Parameter wie Dunkelstrom, Empfindlichkeit und Lebensdauer für OPD denen von Photodetektoren auf Siliciumbasis in der Regel noch unterlegen, wenn auch nicht wesentlich.
Für Detektoren auf der Grundlage des äußeren Photoeffekts wie beispielsweise Vakuum-Photodioden oder Sekundärelektronenvervielfacher ist die Quantenausbeute 𝜂 einfach die Wahrscheinlichkeit, dass ein einzelnes einfallendes Photon ein freies Photoelektron erzeugt. Nicht alle einfallenden Photonen erzeugen ElektronLoch-Paare, weil sie nicht alle die photoempfindliche Region erreichen und absorbiert werden. Wie Abb. 19.4 zeigt, werden einige der Photonen durch Fresnelreflexion an der Oberfläche des Detektors reflektiert, während andere nicht absorbiert werden, weil das Material nicht dick genug ist (die Geschwindigkeit der Photonenabsorption in einem Halbleitermaterial wurde in Abschnitt 17.2.3 untersucht). Außerdem können ElektronLoch-Paare, die nahe der Oberfläche des Detektors erzeugt wurden, schnell rekombinieren, da hier die Konzentration von Rekombinationszentren besonders groß ist; sie können daher auch nicht zum Detektorstrom beitragen. Für Halbleiter-Photodetektoren kann die Quantenausbeute daher als 𝜂 = (1 − ℛ) 𝜁 [1 − exp(−𝛼d )]
19.1.2 Allgemeine Eigenschaften Bestimmte allgemeine Eigenschaften sind allen Photodetektoren gemein. Vor der Untersuchung der Details von spezifischen Photodetektoren betrachten wir daher die Quantenausbeute, Ansprechempfindlichkeit und Antwortzeit photoelektrischer Detektoren unter allgemeinen Gesichtspunkten. Photodetektoren und Halbleiter-Photonenquellen sind spiegelbildliche Bauelemente, daher haben diese drei Eigenschaften jeweils ihre Entsprechung im Bereich der Halbleiter-Photonenquellen (Abschnitt 18.1.2 und 18.3.2). Bei der Herstellung beider Arten von Bauelementen kommen oft dieselben Materialien zum Einsatz (siehe z. B. Abb. 17.11, 17.12 und 18.17). Quantenausbeute
Die Quantenausbeute 𝜂 (0 ≤ 𝜂 ≤ 1) eines Photodetektors ist die Wahrscheinlichkeit, dass ein einziges auf das Bauelement auftreffendes Photon ein Ladungsträgerpaar erzeugt, das zum Detektorsignal beiträgt. Wenn viele Photonen einfallen, wie das gewöhnlich der Fall ist, ist 𝜂 gleich dem Fluss der erzeugten Elektron-LochPaare, die zum Detektorstrom beitragen, geteilt durch den Fluss der einfallenden Photonen. Für nicht-Halbleiter-Photodetektoren wird der Photonennachweiswirkungsgrad (PDE, von engl. photon-detection efficiency) 𝜂 als Wahrscheinlichkeit definiert, dass ein einzelnes auf den Detektor auftreffendes Photon einen nachweisbaren elektrischen Strom in dem Schaltkreis hervorruft.
(19.3)
geschrieben werden, wobei ℛ der optische Leistungsreflexionsgrad an der Oberfläche ist, 𝜁 der Anteil der Elektron-Loch-Paare, die erfolgreich zum Detektorstrom beitragen, 𝛼 der in Abschnitt 17.2.3 besprochene Absorptionskoeffizient des Materials (in cm−1) und d die Dicke des Photodetektors. Gleichung (19.3) ist ein Produkt von drei Faktoren: • Der erste Faktor, (1 − ℛ), bezeichnet die Auswirkung der Reflexion an der Oberfläche des Bauelements. Reflexionen können durch Antireflexbeläge reduziert werden. Einige Definitionen der Quantenausbeute 𝜂 enthalten die Reflexion an der Oberfläche nicht; sie muss dann separat betrachtet werden. • Der zweite Faktor 𝜁 ist der Anteil der Elektron-LochPaare, die der Rekombination an der Materialoberfläche entgehen und zum nutzbaren Photostrom beitragen. Oberflächenrekombination kann durch sorgfältige Herstellung der Materialien und intelligente Konstruktion des Bauelements reduziert werden. d ∞ • Der dritte Faktor, ∫0 e−𝛼𝑥 d𝑥∕ ∫0 e−𝛼𝑥 d𝑥 = [1 − exp(−𝛼d )], bezeichnet den Anteil des im Volumen des Materials absorbierten Photonenflusses. Das Bauelement sollte so dick sein, dass dieser Faktor maximiert wird (selbstverständlich unter Berücksichtigung sonstiger Randbedingungen). Natürlich treten zusätzliche Verluste auf, wenn das Licht nicht sauber auf die aktive Region des Detektors fokussiert wird.
655
656
19 Photodetektoren
Photonen
einfallender Photonenfluss Φ
hν
reflektierter Photonenfluss
1/α
photoempfindlicher Bereich x
x
Abb. 19.4 Einfluss der Reflexion an Oberflächen und der unvollständigen Absorption z. B. durch unzureichende Dicke des photoempfindlichen Materials auf die Quantenausbeute 𝜂 des Detektors.
transmittierter Photonenfluss
Abhängigkeit der Quantenausbeute von der Wellenlänge
Die Quantenausbeute 𝜂 ist eine Funktion der Wellenlänge, vor allem weil der Absorptionskoeffizient 𝛼 wellenlängenabhängig ist (siehe Abb. 17.37). Die Eigenschaften des Halbleitermaterials bestimmen das spektrale Fenster, innerhalb dessen 𝜂 groß ist. Für hinreichend große Werte der Vakuumwellenlänge 𝜆0 ist 𝜂 klein, weil keine Absorption auftreten kann, wenn 𝜆0 ≥ 𝜆g = ℎ𝑐0 ∕E g ist (die Photonenenergie ist dann kleiner als die Bandlücke, und das Material ist transparent). Die Wellenlänge 𝜆g der Bandlücke ist daher die obere Grenzwellenlänge des Halbleitermaterials. Typische Werte von E g und 𝜆g sind in Tabelle 17.2 aufgeführt und in den Abb. 17.11 und 17.12 für die meisten in der Photonik interessierenden Halbleitermaterialien dargestellt. Für kleine Werte von 𝜆0 nimmt 𝜂 ebenfalls ab, weil die meisten Photonen dann nahe der Oberfläche des Bauelements absorbiert werden (für 𝛼 = 104 cm−1 wird z. B. der größte Teil des Lichts innerhalb einer Entfernung 1∕𝛼 = 1 μm absorbiert). Die Rekombinationslebensdauer ist nahe der Oberfläche ziemlich kurz, sodass die gebildeten Ladungsträger rekombinieren, bevor sie registriert werden können. Photodetektoren mit optischem Resonator
Die Quantenausbeute 𝜂 kann erhöht werden, indem der Detektor so konstruiert wird, dass das Licht während mehrerer Durchgänge mit dem lichtempfindlichen Material wechselwirken kann. Das ist äquivalent zu einer Erhöhung der Dicke d des Photodetektors, die die Absorption vergrößert und den transmittierten Photonenfluss reduziert. In der Praxis kann das erreicht werden, indem man den Photodetektor in einen resonanten Hohlraum einbringt, der das Licht einfängt und so die Quantenausbeute vergrößert. Plasmonische Photodetektoren
Ein weiterer Ansatz zur Steigerung der Quantenausbeute 𝜂 eines Halbleiter-Photodetektors besteht darin, das lichtempfindliche Material mit metallischen Nanostruk-
turen auszustatten, die in der Lage sind, Licht im Nanobereich zu streuen, zu konzentrieren und zu führen, wie in Kapitel 8 erläutert: • Metallische Nanopartikel auf der Oberseite des Halbleitermaterials können durch Mehrfachstreuung unter großen Winkeln eine verbesserte Eingrenzung des einfallenden Lichts in der lichtempfindlichen Schicht bewirken. Eine Erhöhung der effektiven optischen Weglänge in dieser Weise ist besonders für Strukturen wie Dünnschicht-Photovoltaikzellen nützlich. Die Streuung von Licht durch metallische Nanopartikel wird in Abschnitt 8.2.3 beschrieben. • Metallische Nanopartikel im Inneren des Halbleitermaterials können als resonante optische Antennen dienen, die das Licht in Form von lokalisierten Oberflächenplasmonen einschließen und konzentrieren. Solche Moden erzeugen eine Nahfeldstrahlung wie z. B. optische Dipolwellen, die wiederum ElektronLoch-Paare erzeugen kann. Die Eigenschaften optischer Antennen werden in Abschnitt 8.2.4 behandelt. • Eine gewellte metallische Oberfläche auf der Unterseite des Halbleitermaterials kann Licht in Form von Oberflächenplasmonpolaritonen (OPP), die sich in der Ebene der lichtempfindlichen Schicht ausbreiten, eingrenzen. OPP an Grenzflächen zwischen Metallen und Dielektrika werden in Abschnitt 8.2.2 diskutiert. Ansprechempfindlichkeit
Die Ansprechempfindlichkeit eines Photodetektors verknüpft den elektrischen Strom 𝑖P im Stromkreis des Bauelements mit der darauf einfallenden optischen Leistung P . Wenn jedes Photon ein Ladungsträgerpaar im Bauelement erzeugt, erzeugt ein Photonenfluss 𝛷 (Photonen pro Sekunde) einen Elektronenfluss (Elektronen pro Sekunde) im Schaltkreis des Photodetektors entsprechend einem Kurzschlussstrom 𝑖P = 𝑒𝛷. Eine optische Leistung P = ℎ𝜈𝛷 (Watt) bei der Frequenz 𝜈 würde in diesem Fall einen elektrischen Strom 𝑖P = 𝑒 P∕ℎ𝜈 hervorrufen.
19.1 Photodetektoren
Der Bereich, in dem ℛ mit 𝜆0 zunimmt, ist jedoch beschränkt, weil die Wellenlängenabhängigkeit von 𝜂 sowohl bei großen als auch bei kleinen Wellenlängen ins Spiel kommt. Die Ansprechempfindlichkeit kann auch kleiner werden, wenn der Detektor einer übermäßig großen optischen Leistung ausgesetzt ist. Diese Situation, die als Detektorsättigung bezeichnet wird, beschränkt den linearen dynamischen Bereich des Detektors, also den Bereich, in dem er linear auf die einfallende optische Leistung reagiert.
1.0
0.8
0.8
0.6
0.6
0.4
Quantenausbeute
Ansprechempfindlichkeit / (A/W)
1.0 1.2
0.4 0.2
0.2 0 0.8
1.0 1.2 1.4 Wellenlänge λ 0 / µm
1.6
Bauelemente mit Gewinn
Abb. 19.5 Ansprechempfindlichkeit ℛ (in A/W) als Funktion der Wellenlänge 𝜆0 , mit der Quantenausbeute 𝜂 als Parameter. Für 𝜂 = 1 und 𝜆0 = 1.24 μ m ist ℛ = 1 A∕W.
Da der Anteil der Photonen, die nachweisbare Elektronen erzeugen, aber nicht eins ist, sondern 𝜂, ist der elektrische Strom 𝑖P = 𝜂𝑒𝛷 =
𝜂𝑒 P ≡ ℛP . ℎ𝜈
(19.4)
Der Proportionalitätsfaktor ℛ = 𝑖P ∕P zwischen dem elektrischen Strom und der optischen Leistung hat die Einheit A/W und wird die Ansprechempfindlichkeit des Photodetektors genannt: ℛ=
𝜂𝑒 . ℎ𝜈
(19.5)
Es ist wichtig, die Ansprechempfindlichkeit des Photodetektors (in A/W) von der in Gl. (18.28) definierten Ansprechempfindlichkeit einer LED (in W/A) zu unterscheiden. Die Ansprechempfindlichkeit ist sowohl zur Quantenausbeute 𝜂 als auch zur Vakuumwellenlänge 𝜆0 direkt proportional, wie aus Gl. (19.5) und Abb. 19.5 deutlich wird. Ein Gefühl für die Größenordnung der Ansprechempfindlichkeit erhalten wir, indem wir 𝜂 = 1 und 𝜆0 = 1.24 μm in Gl. (19.5) einsetzen; das liefert ℛ = 1 A∕W = 1 nA∕nW. Die Proportionalität von ℛ zu 𝜆0 entsteht, weil die Ansprechempfindlichkeit auf der Grundlage der optischen Leistung definiert ist, während die meisten Photodetektoren zum Photonenfluss 𝛷 proportionale Ströme liefern. Für einen gegebenen Photonenfluss 𝛷 = P∕ℎ𝜈 = P 𝜆0 ∕ℎ𝑐0 (entsprechend einem gegebenen Detektorstrom 𝑖P ) bleibt das Produkt P 𝜆0 konstant, sodass eine Zunahme von 𝜆0 eine entsprechende Abnahme von P bedingt und so zu einer Steigerung der Ansprechempfindlichkeit führt. Tatsächlich reagieren einige thermische Detektoren auf die optische Leistung anstelle des Photonenflusses, sodass ℛ nicht mehr von 𝜆0 abhängt.
Die zuvor präsentierten Gleichungen beruhen auf der Annahme, dass jedes Ladungsträgerpaar eine Ladung 𝑒 im Stromkreis des Photodetektors erzeugt. Viele Bauelemente produzieren jedoch eine Ladung 𝑞 ≠ 𝑒 im Stromkreis. Der Gewinn 𝐺 ist als die mittlere Zahl von Elektronen definiert, die im Stromkreis pro Ladungsträgerpaar erzeugt werden, 𝐺 ≡ 𝑞∕𝑒 .
(19.6)
Er kann größer oder kleiner als eins sein, wie wir im Folgenden sehen werden. In Anwesenheit von Gewinn müssen die in den Gln. (19.4) und (19.5) angegebenen Beziehungen für den Photostrom und die Ansprechempfindlichkeit modifiziert werden. Wenn wir 𝑒 in diesen Gleichung durch 𝑞 = 𝐺𝑒 ersetzen, erhalten wir 𝑖P = 𝜂𝑞𝛷 = 𝜂𝐺𝑒𝛷 =
𝜂𝐺𝑒 P ℎ𝜈
(19.7)
bzw. 𝜂𝐺𝑒 . (19.8) ℎ𝜈 Der Gewinn 𝐺 des Bauelements muss vom Wirkungsgrad 𝜂 des Photodetektors unterschieden werden, der die Wahrscheinlichkeit bezeichnet, dass ein einfallendes Photon ein detektierbares Ladungsträgerpaar produziert. Andere nützliche Maße für das Verhalten eines Photodetektors wie z. B. das Signal/Rausch-Verhältnis und die Empfindlichkeit des Empfängers, werden wir bei der Diskussion der Rauscheigenschaften von Detektoren in Abschnitt 19.6 vorstellen. ℛ=
Antwortzeit Durchgangsverbreiterung
Ein konstantes an einen Halbleiter (oder ein Metall) angelegtes elektrisches Feld 𝐸 beschleunigt dessen freie Ladungsträger. Dabei erfahren sie zahlreiche Stöße mit Gitterionen, die infolge der Wärmebewegung um ihre Gleichgewichtslagen schwingen, sowie mit Fehlstellen im Kristallgitter aufgrund von Verunreinigungen.
657
658
19 Photodetektoren
Diese Stöße bremsen die Ladungsträger auf unvorhersagbare Weise; das Ergebnis ist eine Bewegung mit einer mittleren Geschwindigkeit anstelle einer konstanten Beschleunigung. Die mittlere Geschwindigkeit eines Ladungsträgers ist durch v = a𝜏St gegeben, wobei a = 𝑒𝐸∕𝑚 die Beschleunigung aufgrund des elektrischen Feldes ist und 𝜏St die mittlere Zeit zwischen den Stößen, die die Rolle einer Relaxationszeit spielt. Das Ergebnis ist, dass sich die Ladungsträger mit einer mittleren Driftgeschwindigkeit v = 𝑒𝜏St 𝐸∕𝑚 in Richtung des elektrischen Feldes bewegen, was meist in der Form v = 𝜇𝐸
(19.9)
geschrieben wird, wobei 𝜇 = 𝑒𝜏St ∕𝑚 die Ladungsträgerbeweglichkeit ist.
In Halbleitern ist v E im Allgemeinen größer als v L , sodass die volle Ausdehnung der Antwort 𝑥∕v L ist. Die endliche Dauer des Stroms wird als Durchgangsverbreiterung bekannt; sie ist ein wichtiger begrenzender Faktor für die Betriebsgeschwindigkeit aller HalbleiterPhotodetektoren. Im äußeren Schaltkreis erzeugte Ladung
Man könnte vermuten, dass die in einem äußeren Stromkreis erzeugte Ladung 2𝑒 sein sollte, wenn ein Photon in einem Photodetektor ein Elektronen-LochPaar erzeugt, da es zwei Ladungsträger gibt. Die erzeugte Ladung ist aber trotzdem 𝑒, wie wir erkennen, wenn wir die gesamte im äußeren Stromkreis induzierte Ladung 𝑞 als Summe der Flächen unter 𝑖E und 𝑖L berechnen: 𝑞=𝑒
Das Theorem von Ramo
Die Bewegung der Ladungsträger im Photodetektor erzeugt einen Strom im äußeren Stromkreis. Um den Betrag 𝑖(𝑡) des Stroms zu bestimmen, betrachten wir ein Elektron-Loch-Paar, das an einem beliebigen Ort 𝑥 in einem Halbleitermaterial der Länge w erzeugt wurde (z. B. durch Absorption eines Photons), an das wie in Abb. 19.6(a) gezeigt eine Spannung 𝑉 angelegt wird. Wir beschränken uns auf Bewegungen in 𝑥-Richtung und verwenden ein energetisches Argument. Wenn ein Ladungsträger der Ladung 𝑄 (ein Loch der Ladung 𝑄 = 𝑒 oder ein Elektron der Ladung 𝑄 = −𝑒) unter dem Einfluss eines elektrischen Feldes mit dem Betrag 𝐸 = 𝑉∕w in der Zeit d𝑡 eine Entfernung d𝑥 zurücklegt, ist die geleistete Arbeit −𝑄𝐸 d𝑥 = −𝑄(𝑉∕w ) d𝑥. Diese Arbeit muss gleich der durch den äußeren Stromkreis gelieferten Energie 𝑖(𝑡)𝑉 d𝑡 sein. Also ist 𝑖(𝑡)𝑉 d𝑡 = −𝑄(𝑉∕w ) d𝑥 oder 𝑖(𝑡) = −(𝑄∕w )(d𝑥∕ d𝑡) = −(𝑄∕w )v (𝑡). Ein Ladungsträger, der sich mit einer Driftgeschwindigkeit v (𝑡) in 𝑥-Richtung bewegt, erzeugt im äußeren Stromkreis daher einen Strom, der durch das Theorem von Ramo gegeben ist, 𝑄 𝑖(𝑡) = − v (𝑡) . w
(19.10)
Wenn wir annehmen, dass die Löcher sich mit der Geschwindigkeit v L nach links und die Elektronen mit der Geschwindigkeit v E nach rechts bewegen, zeigt Gl. (19.10), dass der Lochstrom 𝑖L = −𝑒(−v L )∕w und der Elektronenstrom 𝑖E = −(−𝑒)v E ∕w ist, wie Abb. 19.6(b) illustriert. Jeder Ladungsträger trägt zum Strom bei, so lange er sich bewegt. Wenn die Ladungsträger ihre Bewegung fortsetzen, bis sie die Ränder des Materials erreichen, bewegen sich die Löcher für eine Zeit 𝑥∕v L und die Elektronen für eine Zeit (w − 𝑥)∕v E [siehe Abb. 19.6(a)].
(𝑥 vL 𝑥 v w−𝑥 w − 𝑥) = 𝑒 . (19.11) +𝑒 E =𝑒 + w vL w vE w w
Dieses Ergebnis hängt nicht von dem Ort 𝑥 ab, an dem das Elektron-Loch-Paar erzeugt wurde. Homogene Erzeugung von Ladungsträgerpaaren
Die Durchgangsverbreiterung wird wesentlich bedeutsamer, wenn die Elektron-Loch-Paare nicht an einer einzelnen Position 𝑥 erzeugt werden, sondern wie in Abb. 19.7 gleichförmig überall im Material (siehe Aufgabe 19-4). Für v L < v E ist die volle Breite der Durchgangsverbreiterung dann w ∕v L anstelle von 𝑥∕v L . Der Grund dafür ist, dass eine gleichförmige Beleuchtung überall Ladungsträgerpaare erzeugt, auch bei 𝑥 = w , von wo aus die Löcher den weitesten Weg haben, bevor sie bei 𝑥 = 0 rekombinieren können. Zusammenfassung
Das Theorem von Ramo zeigt, dass die durch die Bewegung der Ladungsträger im Material des Photodetektors im äußeren Stromkreis induzierte Ladung dort nicht sofort auftaucht, sondern dafür eine endliche Zeit benötigt. Es scheint, als ob die Bewegung der Ladungsträger in dem Material die Ladung langsam aus der Leitung in die eine Seite des Bauelements zieht und sie dann langsam in die Leitung auf der anderen Seite schiebt, sodass jede Ladung, die den äußeren Stromkreis durchläuft, zeitlich gedehnt wird.
Das ohmsche Gesetz
In Gegenwart einer gleichförmigen Ladungsdichte 𝜚 anstelle einer einzelnen Punktladung 𝑄 ist die Gesamtladung im Photodetektor 𝜚Aw , wenn A seine Querschnittsfläche ist [siehe Abb. 19.6(a)]. Gleichung (19.10) liefert dann 𝑖(𝑡) = −(𝜚Aw ∕w )v (𝑡) = −𝜚Av (𝑡), sodass die Strom-
19.1 Photodetektoren
Abb. 19.6 (a) Ein Elektron-Loch-Paar wird am Ort x erzeugt. Das Loch driftet mit der Geschwindigkeit v L nach links und das Elektron mit der Geschwindigkeit v E nach rechts. Der Prozess endet, wenn die Ladungsträger die Grenzen des Materials erreichen. (b) Lochstrom iL (t ), Elektronenstrom iE (t ) und gesamter im Stromkreis induzierter Strom i(t ). Die gesamte im Stromkreis induzierte Ladung pro Ladungsträgerpaar ist e.
i(t)
i(t)
e E
L
t e
x
0
e
L
E
x iE(t)
Elektron ( -x)
( -x)
E
E
Loch x
iL(t) x
L
L
t
t (a)
(b)
dichte in 𝑥-Richtung 𝐽(𝑡) = −𝑖(𝑡)∕A = 𝜚v (𝑡) wird. Die bekannte Vektorform dieser Gleichung ist 𝓙 = 𝜚v .
Fall nimmt das ohmsche Gesetz seine bekannte Form an, 𝑉 = 𝑖𝑅 .
(19.12)
Durch Kombination von Gl. (19.12) mit Gl. (19.9) erhalten wir 𝐽 = 𝜎𝐸, wobei 𝜎 die Leitfähigkeit des Mediums ist, 𝜎 = 𝜚 𝜇 = 𝑒𝜚 𝜏St ∕𝑚 = N 𝑒 2 𝜏St ∕𝑚 ,
(19.13)
und N die Zahl der Ladungsträger pro Volumeneinheit [siehe Gl. (8.29) und (8.43)]. Allgemeiner ist die Leitfähigkeit ein Tensor 𝛔, und die Vektorform dieser Gleichung ist das ohmsche Gesetz, 𝓙 = 𝛔𝓔 .
(19.14)
Für eine durch ein homogenes leitfähiges Material mit der Querschnittsfläche A und der Länge w geführte Ladung kann 𝐽 = 𝜎𝐸 als 𝑖 = (𝜎A∕w )𝐸 w = (𝜎A∕w )𝑉 = 𝐺𝑉 = 𝑉∕𝑅 geschrieben werden, wobei 𝐺 und 𝑅 die Leitfähigkeit bzw. der Widerstand des Materials sind. In diesem i E(t)
iL(t)
(19.15)
RC-Zeitkonstante
Der Widerstand 𝑅 und die Kapazität 𝐶 des Photodetektors verursachen zusammen mit denen der zugehörigen Schaltung eine andere Antwortzeit, die als RC-Zeitkonstante bezeichnet wird, 𝜏RC = 𝑅𝐶. Die Kombination des Widerstands und der Kapazität bewirkt die Integration des Stroms am Ausgang des Detektors und dadurch eine Verlängerung der Impulsantwortfunktion. Die Impulsantwortfunktion bei Durchgangszeitverbreiterung und einfacher 𝑅𝐶-Verbreiterung wird durch Faltung des in Abb. 19.7 gezeigten Stroms 𝑖(𝑡) mit der Exponentialfunktion (1∕𝑅𝐶) exp(−𝑡∕𝑅𝐶) erhalten (siehe Abschnitt B.1). Es ist zu beachten, dass verschiedene Arten von Photodetektoren unterschiedlichen spezifischen Beschränkungen ihrer Antwortgeschwindigkeiten unterliegen können, die wir für den jeweiligen Einzelfall betrachten werden. Als Schlussbemerkung soll noch erwähnt
i (t) Ne ( E + L ) /
Ne E /
=
+
Ne L /
Ne L / 0
/
L
t
0
/
E
t
Abb. 19.7 Lochstrom iL (t ), Elektronenstrom iE (t ) und im Stromkreis induzierter Gesamtstrom i(t ) für die ElektronLoch-Erzeugung durch N Photonen, die gleichförmig zwischen 0 und w verteilt sind (siehe Aufgabe 19-4). Der Ausläufer des Gesamtstroms ergibt sich aus der Bewegung der
0
/
E
/
L
t
langsamen Löcher. Der Gesamtstrom i(t ) kann als Impulsantwortfunktion (siehe Abschnitt B.1) für einen homogen beleuchteten Detektor mit Durchgangsverbreiterung angesehen werden.
659
660
19 Photodetektoren
werden, wenn das isolierende Substrat eine hinreichend große Bandlücke hat, sodass es nicht absorbiert. Die Zunahme der Leitfähigkeit infolge eines Photonenflusses 𝛷 (Photonen pro Sekunde), der auf ein Volumen wA eines Halbleiters fällt (siehe Abb. 19.8), wird wie folgt berechnet. Ein Bruchteil 𝜂 des einfallenden Photonenflusses wird absorbiert und verursacht überschüssige Elektron-Loch-Paare. Die Geschwindigkeit R der Paarerzeugung (pro Volumeneinheit) ist somit R = 𝜂𝛷∕wA. Wenn 𝜏 die Rekombinationslebensdauer der Überschuss-Ladungsträger ist, gehen gemäß Gl. (17.23) Elektronen mit der Geschwindigkeit Δn∕𝜏 verloren, wenn Δn die Elektronenkonzentration ist. Im stationären Zustand sind beide Geschwindigkeiten gleich groß, R = Δn∕𝜏, sodass Δn = 𝜂𝜏𝛷∕wA ist. Die Zunahme der Ladungsträgerkonzentration Δn wird von einer Zunahme der Ladungsdichte Δ𝜚 = 𝑒Δn begleitet und daher gemäß Gl. (19.13) von einer Zunahme der Leitfähigkeit Δ𝜎 = Δ𝜚 𝜇 = 𝑒Δn𝜇, sodass
sein, dass Photodetektoren aus einem gegebenen Material und mit einer gegebenen Struktur häufig ein konstantes Produkt aus Gewinn und Bandbreite zeigen. Eine Erhöhung des Gewinns bewirkt dann eine Abnahme der Bandbreite und umgekehrt. Diese Wechselbeziehung zwischen Empfindlichkeit und Frequenzantwort hängt mit der für den Gewinnprozess erforderlichen Zeit zusammen.
19.2 Photoleiter Wenn Photonen von einem Halbleiter absorbiert werden, werden bewegliche Ladungsträger erzeugt (im Idealfall ein Elektron-Loch-Paar für jedes absorbierte Photon). Die elektrische Leitfähigkeit des Material 𝜎 nimmt proportional zum Photonenfluss 𝛷 zu. Ein an das Material angelegtes elektrisches Feld aus einer äußeren Spannungsquelle bewirkt einen Transport der Elektronen und Löcher. Das wiederum bewirkt einen messbaren elektrischen Strom in dem Stromkreis, wie in Abb. 19.8(a) dargestellt ist. Photoleitende Detektoren registrieren entweder den Photostrom 𝑖P , der proportional zum Photonenfluss 𝛷 ist, oder den Spannungsabfall über einen Lastwiderstand 𝑅, der in Reihe mit dem Stromkreis geschaltet ist.
19.2.1
Δ𝜎 =
Wenn die Photonenenergie größer ist als die Bandlücke des Halbleiters, werden Photonen aufgrund von Interbandübergängen absorbiert. Ein photoleitendes Bauelement kann die Form einer Platte oder einer dünnen Schicht haben. Die Anoden- und Kathodenkontakte sind häufig ineinander verflochten auf derselben Oberfläche des Materials angebracht, um das Licht zu maximieren, das das Material erreicht, und so die Durchgangszeit zu minimieren [siehe Abb. 19.8(b)]. Licht kann auch durch den Boden des Bauelements zugeführt
𝑖P ≈ 𝜂(𝜏∕𝜏E )𝑒𝛷 .
hν
Elektroden
ip
Halbleiter Isolator hν
(a)
𝛷,
(19.16)
(19.17)
Der Vergleich mit Gl. (19.7) zeigt, dass das Verhältnis 𝜏∕𝜏E in Gl. (19.17) dem Detektorgewinn 𝐺 entspricht; die Gründe dafür werden wir im Folgenden klären.
V hν
wA
wobei 𝜇E und 𝜇L die Beweglichkeiten der Elektronen bzw. Löcher sind. Nach Gl. (19.16) ist die Zunahme der Leitfähigkeit proportional zum Photonenfluss. Das ohmsche Gesetz Gl. (19.14) verlangt, dass die erzeugte Stromdichte gleich 𝐽P = Δ𝜎 𝐸 ist. Wenn wir das mit den Gln. (19.16) und (19.9) kombinieren, erhalten wir v E = 𝜇E 𝐸 und v L = 𝜇L 𝐸 und daraus 𝐽P = [𝜂𝑒𝜏(v E + v L )∕wA]𝛷, was einem elektrischen Strom 𝑖P = A𝐽P = [𝜂𝑒𝜏(v E + v L )∕w ] 𝛷 entspricht. Wenn v L ≪ v E ist und die Beziehung durch die Durchgangszeit 𝜏E = w ∕v E der Elektronen durch die Probe ausgedrückt wird, erhalten wir
Intrinsische Materialien
Photonen
𝜂𝑒𝜏(𝜇E + 𝜇L )
(b)
Abb. 19.8 (a) Ein photoleitender Detektor. Erzeugte Ladungsträgerpaare bewegen sich als Reaktion auf eine angelegte Spannung V und erzeugen einen Photostrom iP , der proportional zum einfallenden Photonenfluss 𝛷 ist. (b) Die ineinandergreifende Elektrodenstruktur soll das Licht maximieren, das den Halbleiter erreicht, und so die Durchgangszeit der Ladungsträger minimieren (wodurch die Bandbreite des Bauelements maximiert wird).
19.2 Photoleiter
Gewinn
Die Ansprechempfindlichkeit eines Photoleiters mit Gewinn ist durch Gl. (19.8) gegeben. Auf den ersten Blick zeigt das Bauelement inneren Gewinn, weil sich die Rekombinationslebensdauer und die Durchgangszeit im Allgemeinen unterscheiden. Wir wollen annehmen, dass die Elektronen sich schneller als die Löcher bewegen (siehe Abb. 19.8) und dass die Rekombinationslebensdauer sehr lang ist. Wenn das Elektron und das Loch zu entgegengesetzten Seiten des Photoleiters transportiert werden, beendet das Elektron seine Reise eher als das Loch. Die Kontinuitätsbedingung für den Strom erfordert, dass der äußere Stromkreis sofort ein weiteres Elektron liefert, das aus der Leitung auf der linken Seite in das Bauelement eintritt. Auch dieses neue Elektron bewegt sich schnell nach rechts, wo es wieder seine Reise vollendet, bevor das Loch den linken Rand erreicht. Dieser Prozess geht weiter, bis das Elektron mit dem Loch rekombiniert. Eine einzige Photonenabsorption kann daher dazu führen, dass ein Elektron den äußeren Stromkreis oft durchläuft. Die zu erwartende Zahl von Durchläufen, die das Elektron vor der Rekombination vollendet, ist 𝐺 = 𝜏∕𝜏E ,
(19.18)
wobei 𝜏 die Rekombinationslebensdauer der Überschussladungsträger ist und 𝜏E = w ∕v E die Durchgangszeit der Elektronen durch die Probe. Die von einem einzigen Elektron-Loch-Paar an den Stromkreis gelieferte Ladung ist dann 𝑞 = 𝐺𝑒 > 𝑒, sodass das Bauelement einen Gewinn zeigt. Im anderen Grenzfall kann die Rekombinationslebensdauer so kurz sein, dass die Ladungsträger rekombinieren, bevor sie den Rand des Materials erreichen. Dieser Fall tritt dann ein, wenn ausreichend Ladungsträger der entgegengesetzten Art für die Rekombination zur Verfügung stehen. Dann ist 𝜏 < 𝜏E , und der Gewinn ist kleiner als eins, sodass im Mittel jedes Ladungsträgerpaar nur einen Bruchteil der elektronischen Ladung 𝑒 an den Stromkreis liefert. Die Ladung bleibt natürlich erhalten, und die vielen Ladungsträgerpaare liefern eine ganze Zahl von Elektronenladungen an den Stromkreis. Der Gewinn 𝐺 = 𝜏∕𝜏E des Photoleiters kann daher als der Bruchteil der Probenlänge interpretiert werden, den ein angeregter Ladungsträger im Mittel zurücklegt, bevor er rekombiniert. Die Durchgangszeit 𝜏E wird mithilfe von Gl. (19.9) und 𝜏E = w ∕v E aus der Länge des Bauelements und der angelegten Spannung bestimmt; typische Werte w = 1 mm und v E = 107 cm∕s liefern 𝜏E ≈ 10−8 s. Die Rekombinationslebensdauer 𝜏 kann von 10−13 s bis zu vielen Sekunden betragen, je nach Material und Dotierung des Photoleiters [siehe Gl. (17.24)].
Damit kann 𝐺 einen breiten Bereich von Werten annehmen, von unter eins bis weit über eins, abhängig von den Parametern des Materials, der Größe des Bauelements und der angelegten Spannung. Im Allgemeinen ist der Gewinn eines Photoleiters jedoch aufgrund verschiedener Randbedingungen wie dem raumladungsbeschränkten Stromfluss, Stoßionisation und dielektrischem Durchschlag auf Werte unter etwa 106 limitiert. In der Realität ist die Rekombination von Elektronen und Löchern ein stochastischer Prozess, sodass die in den obigen Ausführungen implizite Annahme eines deterministischen Gewinns des Photoleiters sich als zu vereinfachend erweisen kann. In solchen Fällen muss man zu einem realistischeren Modell greifen (siehe Aufgabe 19-14). Spektrale Antwort
Die spektrale Empfindlichkeit von Photoleitern wird hauptsächlich durch die Wellenlängenabhängigkeit von 𝜂 bestimmt, wie in Abschnitt 19.1.2 diskutiert. Unterschiedliche Halbleiter haben unterschiedliche obere Grenzwellenlängen (siehe z. B. Tabelle 17.2). Interbandübergänge erlauben den Einsatz von elementaren, binären und ternären Halbleitern bis ins mittlere Infrarot (im Gegensatz zu photoemittierenden Detektoren), aber jenseits von etwa 2 μm ist im Allgemeinen eine Kühlung der Bauelemente erforderlich, um die thermische Anregung von Elektronen ins Leitungsband zu minimieren. Antwortzeit
Die Antwortzeit eines photoleitenden Detektors wird wie in Abschnitt 19.1.2 besprochen durch die Durchgangszeit und die Überlegungen zur 𝑅𝐶-Zeitkonstante beschränkt. Die Antwortzeit aufgrund des Ladungsträgertransports ist näherungsweise gleich der Rekombinationszeit 𝜏, sodass die Bandbreite 𝐵 des Ladungsträgertransports umgekehrt proportional zu 𝜏 ist. Da der Gewinn 𝐺 nach Gl. (19.18) direkt proportional zu 𝜏 ist, führt eine Vergrößerung von 𝜏 zu einem steigenden Gewinn – was erwünscht ist –, aber gleichzeitig verringert sich die Bandbreite, was unerwünscht ist. Es zeigt sich, dass das Produkt 𝐺𝐵 aus Gewinn und Bandbreite annähernd unabhängig von 𝜏 ist; typische Werte von 𝐺𝐵 erreichen Werte bis ≈ 1012 .
19.2.2 Dotierte Materialien Durch Einsatz dotierter Halbleiter kann Photoleitfähigkeit bei größeren Wellenlängen erreicht werden. Bewegliche Ladungsträger werden durch Absorption von Photonen durch Dotiersubstanzen erzeugt, deren Energieniveaus innerhalb der Bandlücke liegen. Das kann auf
661
19 Photodetektoren
relative Ansprechempfindlichkeit
662
Ge:Hg
2
4
Ge:Cu
10
Ge:Zn
Ge:Ga
20 40 Wellenlänge λ 0 / µm
zwei Arten geschehen: (i) Ein einfallendes Photon wechselwirkt mit einem gebundenen Elektron an einer Donorposition, regt es ins Leitungsband an und lässt ein gebundenes Loch zurück, oder (ii) ein einfallendes Photon wechselwirkt mit einem gebundenen Loch an einer Akzeptorposition, regt es ins Valenzband an und lässt ein gebundenes Elektron zurück, wie in Abb. 17.35(b) dargestellt. Die Donor- und Akzeptorniveaus in der Bandlücke von dotierten Halbleitern können sehr niedrige Aktivierungsenergien E A und daher große obere Grenzwellenlängen 𝜆A = ℎ𝑐0 ∕E A besitzen. Solche Detektoren müssen gekühlt werden, um thermische Anregung zu vermeiden; häufig wird flüssiges He bei 4 K verwendet. Typische Werte von E A und 𝜆A für einige extrinsische Halbleiter sind in Tabelle 19.1 angegeben. Die spektralen Antworten von einigen extrinsischen Halbleitermaterialien sind in Abb. 19.9 dargestellt. Die Ansprechempfindlichkeit nimmt in Übereinstimmung mit Gl. (19.8) näherungsweise linear mit 𝜆0 zu, hat ein schwaches Maximum geringfügig unter der oberen Grenzwellenlänge 𝜆A und geht danach schnell zurück. Die Quantenausbeute dieser Detektoren kann ziemlich groß sein (z. B. 𝜂 ≈ 0.5 für Ge:Cu), obwohl der Gewinn unter normalen Betriebsbedingungen oft klein ist (z. B. 𝐺 ≈ 0.03 für Ge:Hg). Tab. 19.1 Aktivierungsenergien und obere Grenzwellenlängen für ausgewählte extrinsische Halbleitermaterialien (𝜆A = hc0 EA ). Halbleiter:Dotiersubstanz
Ge:Hg Ge:Cu Ge:Zn Ge:Ga Si:B
E A ∕eV
𝝀A ∕𝛍 m
0.088 0.041 0.033 0.010 0.044
14 30 38 115 23
Ge:Ga (gespannt)
100
19.2.3
Abb. 19.9 Relative Ansprechempfindlichkeit als Funktion der Wellenlänge 𝜆0 (in μ m) für fünf unterschiedlich dotierte extrinsische Materialien auf Grundlage von Germanium, die als photoleitende Infrarotdetektoren verwendet werden.
200
Heterostrukturen
Geeignet konzipierte Heterostrukturen können als nützliche photoleitende Detektoren eingesetzt werden. Ein Beispiel ist der Quantenschicht-Infrarotphotodetektor. Hier regt ein einfallendes Infrarotphoton ein Elektron aus einem gebundenen Energieniveau in einer Quantenschicht in ein Kontinuum an und erzeugt dabei einen beweglichen Ladungsträger, der die Leitfähigkeit des Materials vergrößert (siehe Abb. 19.10). In einer alternativen Anordnung liegen die Quantenschichten zwischen Übergitter-Barrieren und die Elektronen werden über einen unterhalb des Kontinuums liegenden Miniband-Transportkanal aus dem Material geführt [Abb. 17.44(d)]. Derartige Bauelemente haben aufgrund der diskreten Energien der Quantenzustände typischerweise sehr scharfe spektrale Empfindlichkeiten und arbeiten bei Kryotemperaturen.
AlGaAs
GaAs
Abb. 19.10 Erzeugung von beweglichen Ladungsträgern durch die Absorption von Photonen in einem Quantenschicht-Infrarotphotodetektor. Das Bauelement ist so konzipiert, dass in jeder Quantenschicht genau ein Energieniveau existiert, entsprechend einer Empfindlichkeit in einem speziellen spektralen Band. Der gezeigte Detektor besteht aus AlGaAs-Barrieren und n-dotierten GaAs-Quantenschichten, die die Elektronen für die Energieniveaus liefern. Quantenschicht-Infrarotphotodetektoren aus III-VVerbindungshalbleitern bieten hohe Ansprechempfindlichkeiten vom mittleren bis ins ferne Infrarot (𝜆0 ≈ 4−20 μ m) und hohe Geschwindigkeiten, erfordern jedoch Kühlung.
19.3 Photodioden
Auch ein entsprechend aufgebauter QuantenpunktInfrarotphotodetektor kann für die Infrarotdetektion über Übergänge zwischen Unterbändern benutzt werden. Eine weitere Verbesserung bieten Quantenpunktin-Quantenschicht-Strukturen, die die Positionen der Quantenpunkte zusätzlich einschränken.
19.3 Photodioden 19.3.1 Die pn-Photodiode Ebenso wie Photoleiter beruhen auch PhotodiodenDetektoren auf photoerzeugten Ladungsträgern. Eine Photodiode ist ein pn-Übergang (siehe Abschnitt 17.1.5), dessen Strom in Sperrrichtung zunimmt, wenn er Photonen absorbiert. Während pn- und pin-Photodioden im Allgemeinen schneller sind als Photoleiter, zeigen sie keinen Gewinn. Wir betrachten einen in Sperrrichtung gepolten beleuchteten pn-Übergang wie in Abb. 19.11. Photonen werden überall mit einem Absorptionskoeffizienten 𝛼 absorbiert. Immer wenn ein Photon absorbiert wird, wird ein Elektron-Loch-Paar erzeugt, aber nur wenn ein elektrisches Feld anliegt, werden die Ladungsträger in eine bestimmte Richtung transportiert. Da in einem pnÜbergang nur in der Sperrschicht ein elektrisches Feld existieren kann, müssen genau dort die Ladungsträger erzeugt werden. Grundsätzlich können Elektron-Loch-Paare in drei Bereichen entstehen: 1) In der Sperrschicht (Gebiet 1) erzeugte Elektronen und Löcher driften unter dem Einfluss des starken elektrischen Feldes schnell in entgegengesetzte Richtungen. Da das elektrische Feld immer in die Richtung n → p zeigt, bewegen sich die Elektronen zur n-Seite und die Löcher zur p-Seite. Folglich fließt der im äußeren Stromkreis hervorgerufene Photostrom immer in Sperrrichtung (von n nach p). Jedes Ladungsträgerpaar erzeugt im äußeren Strom-
kreis einen elektrischen Strompuls der Fläche 𝑒 (für 𝐺 = 1), da in dem verarmten Gebiet keine Rekombination stattfindet. 2) In einiger Entfernung von der Sperrschicht (Gebiet 3) erzeugte Elektronen und Löcher können wegen des Fehlens eines elektrischen Feldes nicht transportiert werden. Sie driften zufällig, bis sie durch Rekombination vernichtet werden. Sie tragen nichts zum äußeren elektrischen Strom bei. 3) Außerhalb der Sperrschicht, aber in ihrer Umgebung (Gebiet 2) erzeugte Elektron-Loch-Paare haben eine Chance, durch zufällige Diffusion in die Sperrschicht zu kommen. Ein Elektron, das von der pSeite kommt, wird schnell über den Übergang transportiert und trägt daher eine Ladung 𝑒 zum äußeren Strom bei. Ein Loch, das von der n-Seite kommt, hat eine ähnliche Wirkung. Photodioden wurden aus vielen der in Tabelle 17.2 aufgeführten Halbleitermaterialien sowie aus binären, ternären und quaternären Verbindungshalbleitern wie InGaAs, InGaAsP, SiC oder GeSn hergestellt. Bauelemente werden manchmal so konstruiert, dass das Licht senkrecht anstatt parallel auf den pn-Übergang trifft. Die Antwortzeit
Wie in Abschnitt 19.1.2 diskutiert, spielen die Durchgangszeit der Ladungsträger durch die Sperrschicht (w 𝑑 ∕v E für Elektronen und w 𝑑 ∕v L für Löcher) und die 𝑅𝐶-Zeitantwort eine Rolle für die Antwortzeit von Photodioden-Detektoren. Abbildung 19.6(b) zeigt den resultierenden Strom im äußeren Stromkreis für ein Elektron-Loch-Paar, das am Ort 𝑥 erzeugt wird, und Abb. 19.7 zeigt den Strom für homogene Erzeugung von Elektron-Loch-Paaren. In Photodioden existiert ein zusätzlicher Beitrag zur Antwortzeit aufgrund der Diffusion. Außerhalb der Sperrschicht, aber in ihrer unmittelbaren Nähe erzeugte Ladungsträger können in die Sperrschicht hinein diffundieren und zum äußeren Strom beitragen. Dieser Pro-
Photonen
3
2
1
2
3 ip V
0 n
p elektrisches Feld E
Abb. 19.11 Photonen, die auf einen idealisierten in Sperrrichtung gepolten pn-Photodioden-Detektor auftreffen. Die Drift- und Diffusionsgebiete sind mit 1 bzw. 2 bezeichnet. In Region 3 entstehende Ladungsträger tragen nicht zum Photostrom bei. Die Strahlung kann wie hier gezeigt in der Ebene des Übergangs einfallen (Kantenbeleuchtung) oder senkrecht zu ihr.
663
664
19 Photodetektoren
zess verläuft im Vergleich zur Drift jedoch relativ langsam. Die maximal dafür zur Verfügung stehende Zeit ist die Lebensdauer der Ladungsträger (𝜏p für Elektronen in der p-Region und 𝜏n für Löcher in der n-Region). Der Einfluss der Diffusionszeit kann durch Verwendung einer pin-Diode verringert werden, wie wir im Folgenden sehen werden. Trotzdem sind Photodioden im Allgemeinen schneller als Photoleiter, weil das starke Feld im Verarmungsgebiet den Ladungsträgern eine große Geschwindigkeit gibt. Außerdem sind Photodioden von vielen der in Photoleitern wichtigen Abfangeffekte nicht betroffen.
i
Φ
Vp
0 is Φ
Vp1 Vp2
V
Φ1 Φ2
Abb. 19.13 Photovoltaischer Betrieb einer Photodiode. Φ
Angelegte Spannung
Φ= 0
i
ip
Als elektronisches Bauelement betrachtet hat die Photodiode eine 𝑖𝑉-Beziehung der Form 𝑖 = 𝑖S [exp (
𝑒𝑉 ) − 1] − 𝑖P , k𝑇
die in Abb. 19.12 dargestellt ist. Das ist die übliche 𝑖𝑉Beziehung eines pn-Übergangs [siehe Gl. (17.32)] mit einem zusätzlichen zum Photonenfluss proportionalen Photostrom −𝑖P . Es gibt drei klassische Betriebsarten von Photodioden: als Photoelement (offener Stromkreis), kurzgeschlossen und als Photoleiter (in Sperrrichtung gepolt).
p n
Φ
is
V i
Φ=0
is Φ
Φ= 0 Φ1
–ip1
V
–ip2
Φ2
Abb. 19.14 Kurzschlussbetrieb einer Photodiode.
Kurzschlussbetrieb
Der Kurzschlussbetrieb (𝑉 = 0) ist in Abb. 19.14 illustriert. Der Kurzschlussstrom ist einfach der Photostrom −𝑖P .
i
ip
0
(19.19)
Betrieb als Photoleiter ip
Vp
V
Φ>0
Abb. 19.12 Eine Photodiode und ihre iV -Beziehung.
Betrieb als Photodiode
In einem offenen Stromkreis (Abb. 19.13) erzeugt das Licht Elektron-Loch-Paare im Verarmungsgebiet. Die zusätzlichen auf der n-Seite der Schicht freigesetzten Elektronen rekombinieren mit Löchern auf der p-Seite und umgekehrt. Das Ergebnis ist eine Zunahme des elektrischen Feldes und damit eine Photospannung 𝑉P an dem Bauelement, die mit zunehmendem Photonenfluss 𝛷 steigt. Weil sie bei offenem Stromkreis betrieben wird, wird die Ansprechempfindlichkeit einer photoelektrischen Photodiode in V/W anstelle von A/W gemessen. Diese Betriebsart kommt z. B. in Solarzellen zum Einsatz.
Schließlich kann eine in Sperrrichtung gepolte Photodiode als Photoleiter eingesetzt werden, wie Abb. 19.15(a) zeigt. Wenn ein Lastwiderstand in Reihe mit der Diode in den Stromkreis eingefügt wird, wird die in Abb. 19.15(b) gezeigte Situation erreicht. Photodioden werden aus verschiedenen Gründen meist mit einer großen Spannung in Sperrrichtung betrieben: • Eine hohe Spannung in Sperrrichtung erzeugt ein starkes elektrisches Feld im Übergang, das die Driftgeschwindigkeit der Ladungsträger vergrößert und so die Durchgangszeit reduziert. • Eine hohe Spannung in Sperrrichtung vergrößert die Dicke der Sperrschicht und reduziert so die Kapazität des Übergangs und verbessert die Antwortzeit. • Die vergrößerte Dicke der Sperrschicht führt zu einer größeren lichtempfindlichen Fläche und ermöglicht es, mehr Licht zu sammeln.
19.3 Photodioden
i
Φ
Φ
i VB
Abb. 19.15 Photodiode mit Spannung in Sperrrichtung (a) ohne und (b) mit einem Lastwiderstand. Der Betriebspunkt liegt auf der gestrichelten Linie.
i
RL i
VB
–VB
–VB
V
V
Φ
Φ
–VB / RL (b)
(a)
19.3.2 Die pin-Photodiode Als Detektor hat die pin-Photodiode mehrere Vorteile gegenüber einer pn-Photodiode. Eine pin-Diode ist ein pn-Übergang mit einer intrinsischen (bzw. gewöhnlich leicht oder auch unabsichtlich dotierten) Schicht zwischen den p und n-Schichten (siehe Abschnitt 17.1.5). Sie kann unter den verschiedenen im vorhergehenden Abschnitt besprochenen Bedingungen für die Spannung betrieben werden. Das Bandschema, die Ladungsverteilung und die Verteilung des elektrischen Feldes für eine in Sperrrichtung gepolte pin-Diode sind in Abb. 19.16 dargestellt. Diese Struktur vergrößert die Dicke des Gebiets, in dem ein elektrisches Feld möglich ist, und macht so die Sperrschicht dicker. Photodioden mit einer pin-Struktur bieten die folgenden Vorteile: • Eine Erhöhung der Dicke der Sperrschicht des Bauelements (wo die erzeugten Ladungsträger durch Drift transportiert werden können) vergrößert die Fläche, die zum Sammeln des Lichts zur Verfügung steht. • Eine Erhöhung der Dicke der Sperrschicht reduziert die Kapazität des Übergangs und dadurch die 𝑅𝐶Zeitkonstante. Andererseits nimmt die Durchgangszeit mit der Dicke der Sperrschicht zu.
i
p
• Eine Reduktion des Verhältnisses zwischen der Diffusionslänge und der Driftlänge des Bauelements bewirkt, dass ein größerer Teil des erzeugten Stroms durch den schnelleren Driftprozess geleitet wird. Senkrechter Einfall oder Kantenbeleuchtung?
Bei senkrecht beleuchteten Photodioden verläuft der Fluss der Ladungsträger parallel zu dem der Photonen, was einen Kompromiss zwischen Empfindlichkeit und Bandbreite erzwingt, da für eine hohe Empfindlichkeit eine ausreichend dicke Absorptionsschicht erforderlich ist (im Fall von In0.53 Ga0.47 As mit 𝛼 ≈ 10−4 cm−1 ist beispielsweise eine Dicke von ≈ 2 μm erforderlich, um 88 % des einfallenden Lichts zu absorbieren). Je dicker der Absorptionsbereich ist, desto größer wird jedoch die Laufzeit und damit die Bandbreite. Bei kantenbeleuchteten Photodioden wird das Licht hingegen in einer Richtung senkrecht zum Ladungstransport in das Bauelement eingekoppelt, wodurch die Absorptionsschicht viel dünner sein kann als bei Photodioden für senkrechten Einfall. Die Entkopplung der Lichtabsorption (Empfindlichkeit) und der Trägerlaufzeit (Bandbreite) ist daher eine willkommene Eigenschaft der kantenbeleuchteten Anordnung von Photodioden.
n
Elektronenenergie L V
Dichte unbeweglicher Ladungen elektrisches Feld
+ -
x x x
p i n
Abb. 19.16 Struktur, Bandschema, Ladungsverteilung und Verteilung des elektrischen Feldes einer pin-Photodiode. Das Bauelement kann entweder parallel zur Ebene des Übergangs bestrahlt werden, d. h. senkrecht in der Abbildung (die sogenannte Kantenbeleuchtung), oder senkrecht zur Ebene des Übergangs (horizontal in der Abbildung).
665
19 Photodetektoren
Evaneszente Kopplung
Eine verbreitete Realisierung von kantenbeleuchteten Photodioden verwendet eine Stoßkopplung zwischen einer optischen Faser oder einem passiven Wellenleiter und dem intrinsischen Bereich. In diesem Fall muss die Quantenausbeute gemäß Gl. (19.3) den Kopplungsverlust und den optischen Einschlussfaktor 𝛤 berücksichtigen. Um solche Verluste zu verringern, wurden evaneszent gekoppelte Wellenleiter-Photodioden entwickelt. Sie bestehen typischerweise aus einer Photodiode auf einem passiven Wellenleiter und eignen sich gut zur monolithischen Integration in integrierte photonische Schaltungen. Die evaneszente Kopplung verringert auch eine ggf. vorhandene Gitterfehlanpassung zwischen den Materialien der Photodiode und des Wellenleiters und ermöglicht in der Regel große Bandbreiten. Die Leistung kann durch Verwendung einer Wanderwellen-Anordnung weiter verbessert werden. Ansprechempfindlichkeiten von Silicium-pn-Photodioden
Abbildung 19.17 vergleicht die Ansprechempfindlichkeiten zweier handelsüblicher pin-Photodioden mit der eines idealen Bauelements (𝜂 = 1). Die maximale Ansprechempfindlichkeit liegt bei einer Wellenlänge, die kleiner ist als die Bandlücke, da Si eine indirekte Bandlücke besitzt. Die Übergänge bei Absorption von Photonen laufen daher normalerweise zwischen dem Valenzband und Leitungsbandzuständen ab, die weit von der Leitungsbandkante entfernt liegen (siehe Abb. 17.40). Ansprechempfindlichkeit / (A/W)
666
1.0 0.8
ideale Photodiode
0.6 0.4 0.2 0
typische SiPhotodioden 0.5 Wellenlänge λ 0 / µm
1.0
λg
Abb. 19.17 Ansprechempfindlichkeit als Funktion der Wellenlänge (in μ m) für ideale und handelsübliche Silicium-pinPhotodioden. Die Quantenausbeute eines sorgfältig konstruierten, antireflexbeschichteten Siliciumbauelements kann nahe bei eins liegen.
sorptionskoeffizient ab, wodurch dickere Absorptionsbereiche erforderlich werden, um die äußere Quantenausbeute konstant zu halten. Dies wiederum führt zu einer längeren Laufzeit und einer geringeren Bandbreite des Bauelements. Dieser unerwünschte Effekt kann verringert werden, indem man den intrinsischen Absorptionsbereich beispielsweise durch Löcher mikro- oder nanostrukturiert. Eine solche Struktur kann helfen, das Licht effizient einzugrenzen und so den effektiven Absorptionskoeffizienten erheblich zu erhöhen. 1) Dies ermöglicht die Konstruktion von Bauelementen mit dünneren Absorptionsbereichen und größeren Bandbreiten.
19.3.3
Heterostrukturen
Heterostruktur-Photodioden aus mindestens zwei Halbleitern mit unterschiedlichen Bandlücken können gegenüber pn-Übergängen aus einem einzigen Material Vorteile haben. Ein Heterokontakt aus einem Material mit großer Bandlücke (E g > ℎ𝜈) kann aufgrund seiner Transparenz beispielsweise optische Absorption außerhalb der Verarmungsregion minimieren und so die Oberflächenrekombination reduzieren und 𝜁 in Gl. (19.3) maximieren. Das Material mit großer Bandlücke wird dann Fensterschicht genannt. Durch Verwendung unterschiedlicher Materialien können Bauelemente mit sehr flexiblen Eigenschaften konstruiert werden. Beispielsweise können unterschiedliche Materialien so kombiniert werden, dass jedes seine vorteilhaftesten Eigenschaften zum Tragen bringen kann. So kann zum Beispiel eine aus Germanium auf Silicium bestehende Wellenleiterstruktur die ausgezeichneten Wellenleitereigenschaften von Si mit der starken Absorption von Ge im nahem Infrarot kombinieren (siehe Beispiel 19-2). Mehrere Materialsysteme sind dabei von besonderem Interesse (siehe Abb. 17.11, 17.12 und 18.17): • Al𝑥 Ga1−𝑥 As∕GaAs (AlGaAs-Gitter an GaAs-Substrat angepasst) ist im Wellenlängenbereich von 0.7 bis 0.87 μm nützlich. • In𝑥 Ga1−𝑥 As∕InP ist ein Material mit direkter Bandlücke, dessen Gitter an ein InP-Substrat angepasst werden kann. Seine Bandlücke kann über die Zusammensetzung über das nahe und einen Teil des mittleren IR abgestimmt werden: 0.873 μm(GaAs) ≤ 𝜆𝑔 ≤ 3.44 μm (InAs) (Abb. 18.17). Diese Wellenlängen schließen das
Optimierung von Si-Photodioden durch Mikrostrukturierung
Silicium-pin-Photodioden, die bei sichtbaren Wellenlängen arbeiten, haben den Vorteil eines großen Absorptionskoeffizienten 𝛼. Wenn sich die Wellenlänge jedoch in Richtung des nahen Infrarot verschiebt, nimmt der Ab-
1) Siehe z. B. Y. Gao, H. Cansizoglu, K. G. Polat, S. Ghandiparsi, A. Kaya, H. H. Mamtaz, A. S. Mayet, Y. Wang, X. Zhang, T. Yamada, E. P. Devine, A. F. Elrefaie, S.-Y. Wang, M. S. Islam, ‚Photon-Trapping Microstructures Enable High-Speed High-Efficiency Silicon Photodiodes‘, Nature Photonics 11, 301–308, 2017.
19.3 Photodioden
Telekommunikationsband zwischen 1.3 und 1.6 μm ein. Ein typischer InGaAs-pin-Photodetektor, der bei 1550 nm arbeitet, hat eine Quantenausbeute 𝜂 ≈ 0.80 und eine Ansprechempfindlichkeit ℛ ≈ 0.95 A∕W. • CMOS-kompatible Doppelheterostrukturen aus Ge∕ Ge0.93 Sn0.07 ∕Ge, die direkt auf Silicium abgeschieden werden, können bei Wellenlängen von bis zu 2.2 μm betrieben werden. Gegenwärtig erreichen derartige pin-Photodioden bei 1550 nm und Zimmertemperatur bei senkrechtem Einfall und einer Spannung in Sperrrichtung von 0.1 V Ansprechempfindlichkeiten ℛ ≈ 0.3 A∕W. • Hg𝑥 Cd1−𝑥 Te∕CdTe ist im mittleren IR sehr nützlich, weil HgTe und CdTe fast dieselben Gitterparameter haben und ihre Gitter daher bei fast allen Zusammensetzungen angepasst werden können (Abb. 17.12). Das Material bietet eine über die Zusammensetzung zwischen 0.85 und 16 μm abstimmbare Bandlücke. Zu seinen Anwendungen gehören Nachtsichtgeräte, Thermometrie und optische Kommunikation bei großen Wellenlängen. • Von besonderem Interesse sind quaternäre Verbindungen wie beispielsweise In1−𝑥 Ga𝑥 As1−𝑦 P𝑦 ∕InP, In1−𝑥 Ga𝑥 As1−𝑦 Sb𝑦 ∕GaSb, oder Al1−𝑥 Ga𝑥 As1−𝑦 Sb𝑦 ∕ GaSb, die im Bereich von 0.92 bis 5 μm eingesetzt werden können, weil das vierte Element einen zusätzlichen Freiheitsgrad einführt, der es erlaubt, die Gitter für unterschiedliche, durch die Zusammensetzung bestimmte Werte von E g anzupassen. Beispiel 19-1: Photovoltaikzelle aus einem III-VMehrfachheteroübergang
kleinsten Bandlücke am unteren Ende des Stapels, GaSb und InGaAsSb, absorbieren Licht im Wellenlängenbereich zwischen 1.7 und 2.5 μm im Infraroten (Abb. 18.17). Beispiel 19-2: Ge-auf-Si Wellenleiter-Photodiode
Silicium ist im Telekommunikationsband zwischen 1.3 und 1.6 μm transparent (𝜆g = 1.11 μm; siehe Tabelle 17.2) und daher nicht lichtempfindlich. Effiziente und schnelle Photodetektoren auf Basis der Siliciumphotonik wurden traditionell durch hybride Integration von lichtempfindlichen III-V-Materialien wie InGaAs auf Si hergestellt. Alternativ kann jedoch auch CMOS-kompatibles Ge verwendet werden, das in diesem Wellenlängenbereich empfindlich ist. Die deutlich unterschiedlichen Gitterkonstanten von Ge und Si (Differenz ≈ 4.2 %) machen jedoch entweder eine evaneszente oder eine Stoßkopplung erforderlich. In einem Design, das für Kantenbeleuchtung entwickelt wurde, wird das aus einem Si-Wellenleiter austretende Licht durch Stoßkopplung in den intrinsischen Bereich einer lateralen Ge-auf-Si-Photodiode eingekoppelt, die am Ende des Si-Wellenleiters integriert ist. 3) Bei 1550 nm bietet diese Photodiode eine Ansprechempfindlichkeit von ≈ 1 A∕W und eine Bandbreite von > 50 GHz. Ihre Leistung ist vergleichbar mit der, die durch hybride Integration von InGaAs auf Si erreicht werden kann, und sie erlaubt auch einen Betrieb im Photovoltaik-Modus.
Schottky-Photodioden
Mehrfachheteroübergang-Photovoltaikzellen beruhen auf Heterostrukturen aus mehreren dünnen Halbleiterschichten mit unterschiedlichen Bandlücken, die übereinander gestapelt sind. Wenn das Licht von oben eintritt, nehmen die Werte der Bandlücke von der oberen zur unteren Ebene sukzessive ab, sodass jede Ebene als Fensterebene für die darunterliegende Ebene wirkt. So kann die Absorption für die verschiedenen Spektralbereiche der Sonneneinstrahlung optimiert werden. Eine entsprechende Photodiode aus fünf Schichten von III-V-Materialien (InGaP/GaAs/InGaAsNSb/GaSb/InGaAsSb) kann im Photovoltaikmodus bis zu 99 % der einfallenden Sonnenenergie verwerten und erzielt dabei eine Quantenausbeute 𝜂 > 41 %. 2) Die beiden Schichten mit der
Metall/Halbleiter-Photodioden (oder SchottkyPhotodioden) bestehen aus Metall/Halbleiter-Heteroübergängen. Dabei wird eine dünne halbtransparente metallische Schicht anstelle der p- (oder n-) Schicht in dem pn-Übergang einer normalen Photodiode verwendet. Die dünne Schicht wird manchmal aus einer Metall-Halbleiter-Legierung hergestellt, die sich wie ein Metall verhält. Der Struktur einer Schottkydiode und ihr Bandschema sind in Abb. 19.18 schematisch für den Fall eines Metalls auf einem schwach dotierten n-Halbleiter dargestellt. Wenn die beiden Materialien sich berühren, fließen Elektronen vom Halbleiter zum Metall und gleichen die Ferminiveaus der beiden Materialien an. Dies führt zu einer Elektronenverarmung in der Halbleiterschicht in der Umgebung der Grenzfläche. Die damit verbundenen
2) Siehe M. P. Lumb, S. Mack, K. J. Schmieder, M. González, M. F. Bennett, D. Scheiman, M. Meitl, B. Fisher, S. Burroughs, K.-T. Lee, J. A. Rogers, R. J. Walters, ‚GaSb-Based Solar Cells for Full Solar Spectrum Energy Harvesting‘, Advanced Energy Materials 7, 1700345, 2017.
3) Siehe L. Vivien, A. Polzer, D. Marris-Morini, J. Osmond, J. M. Hartmann, P. Crozat, E. Cassan, C. Kopp, H. Zimmermann, J. M. Fédéli, ‚Zero-Bias 40 Gbit/s Germanium Waveguide Photodetector on Silicon‘, Optics Express 20, 1096–1101, 2012.
667
19 Photodetektoren
–χ
Halbleiter
L
F
Metall
V
Metall (a)
Halbleiter (b)
Abb. 19.18 (a) Struktur und (b) Bandschema einer Schottky-Photodiode aus einem Metall auf einem n-Halbleiter. Im Gleichgewicht richten sich die Ferminiveaus in den beiden Regionen aus. Solche Photodetektoren reagieren auf Photonenenergien größer als die Schottkybarriere, h𝜈 > W − 𝜒 . Schottky-Photodioden können aus vielen Materialien hergestellt werden, z. B. Au auf n-dotiertem Si (im Sichtbaren) oder PtSi auf p-dotiertem Si (vom UV bis ins IR).
ortsfesten positiven Ladungen im Halbleiter bewirken, dass sich sein Valenz- und Leitungsband in der Nähe der Grenzfläche nach oben verformen. Im Gleichgewicht führt die Diskontinuität der erlaubten Energiezustände der beiden Materialien zur Entstehung der Schottkybarriere, die den Elektronenfluss vom Metall zurück in den Halbleiter blockiert und für die gleichrichtende Wirkung des Bauelements verantwortlich ist. Die Absorption eines Photons führt zu einem Stromfluss. Schottky-Photodioden sind aus mehreren Gründen nützlich: • Nicht alle Halbleiter können sowohl p- als auch n-dotiert werden; auch in diesen Systemen können Schottky-Bauelemente verwendet werden. • Halbleiter zum Nachweis von sichtbarem und ultravioletten Licht mit einer Photonenenergie deutlich über der Bandlücke haben große Absorptionskoeffizienten. Das verursacht eine starke Rekombination an der Oberfläche und somit eine Reduktion der Quantenausbeute. Der Metall-Halbleiter-Übergang besitzt eine Sperrschicht direkt an der Oberfläche und verhindert so die Oberflächenrekombination. • Die Ansprechgeschwindigkeiten von pn- und pinPhotodioden wird teilweise durch den langsamen Diffusionsstrom beschränkt, der durch außerhalb der Sperrschicht, aber in ihrer unmittelbaren Nähe erzeugte Ladungsträger entsteht. Um diese unerwünschte Absorption zu reduzieren, kann die Dicke von einer der Schichten des Übergangs reduziert werden. Allerdings muss das geschehen, ohne den Reihenwiderstand des Bauelements wesentlich zu vergrößern, weil das den unerwünschten Effekt hätte, die Geschwindigkeit durch Erhöhung der 𝑅𝐶Zeitkonstante zu reduzieren. Der Schottkystruktur er-
Ansprechempfindlichkeit / (A/W)
668
InGaAs / InP Ge
1.0 Si
Au-InGaAs SiC GaAs Ag-ZnS 0.1 0.0
0.5
1.0 Wellenlänge λ 0 / µm
1.5
Abb. 19.19 Ansprechempfindlichkeit ℛ als Funktion der Wellenlänge 𝜆0 (in μ m) für mehrere pin- (durchgezogene Kurven) und Schottky-Photodioden (gestrichelte Kurven). Für ternäre und quaternäre Bauelemente hängt die Wellenlänge der maximalen Empfindlichkeit von der Zusammensetzung ab. Antwortzeiten von einigen zehn ps entsprechend einer Bandbreite von ≈ 50 GHz sind ohne weiteres möglich.
reicht dieselbe Wirkung aufgrund des geringen Widerstands des Metalls. Außerdem sind Schottkystrukturen Majoritätsladungsträger-Bauelemente und haben daher von Natur aus schnelle Antwortzeiten und große Bandbreiten. Antwortzeiten im Pikosekundenbereich entsprechend einer Bandbreite von ≈ 100 GHz sind ohne weiteres erreichbar. Typische Kurven der Ansprechempfindlichkeit sind in Abb. 19.19 für mehrere pin- und Schottky-Photodioden gezeigt. Beispiel 19-3: Schottky-Photodiode aus Graphen/Si
Graphen ist ein zweidimensionaler Kristall aus einer Graphitschicht mit einer Dicke von einer Atomlage, deren Atome in einem hexagonalen Wabengitter angeordnet sind (Abschnitt 17.1.2). Aufgrund der hohen Leitfähigkeit, des geringen Reflexionsvermögens, der hohen Ladungsträgermobilität und des breiten Spektrums der Wechselwirkung von Graphen mit Strahlung kann der Übergang zwischen Graphen und n-dotiertem Silicium als breitbandige HochgeschwindigkeitsSchottky-Photodiode dienen. Es ist interessant, dass ein Übergang zwischen einem zweidimensionalen Material ohne Bandlücke und einem dreidimensionalen Material mit endlicher Bandlücke überhaupt ein funktionierendes Bauelement ergibt. Berechnungen zeigen, dass die Absorption von Graphen für Photonenenergien unterhalb von 3 eV ungefähr 𝒜 ≈ π𝑒 2 ∕ℏ𝑐 ≈ 2.3 % beträgt. Da das Reflexionsvermögen einer einzelnen Graphenschicht sehr klein ist, ℛ ≈ 1.3 × 10−4 , beträgt der Transmissionsgrad 𝒯 ≈ 1 − 𝒜 ≈ 97.7 % (bei senkrechtem Einfall). Das Graphen wirkt somit als nicht reflektierende, transparente Elektrode, die zum Sammeln der Ladungsträger dient, während die mit
19.4 Lawinenphotodioden
dem eigentlichen Detektionsprozess verbundene optische Absorption im Silicium stattfindet. Photodioden auf der Basis von Schottkybarrieren wurden in einem CMOS-kompatiblen Prozess durch CVD-Abscheidung von Graphen auf schwach n-dotiertem Silicium hergestellt. 4) Diese Bauelemente sind im Sichtbaren und im nahen Infrarot empfindlich und zeigen eine Grenzwellenlänge bei der Wellenlänge der Bandlücke von Si, 𝜆g = 1.1 μm. Für senkrechten Einfall ähnelt die Empfindlichkeit eines typischen Bauelements der in Abb. 19.19 dargestellten Empfindlichkeitskurve von Si. Gleichung (19.7) liefert mit der beobachteten Empfindlichkeit von ℛ ≈ 0.3 A∕W bei 0.6 μm auf der Kurve für Graphen/Si eine Quantenausbeute 𝜂 ≈ 0.6. Solche Bauelemente können auch für eine innere Verstärkung konfiguriert werden, indem man Elektroden verwendet, die den Stromfluss lateral entlang der Seite des Elements und nicht durch es hindurch lenken, wodurch der Kontrast zwischen der schnellen Durchgangszeit 𝜏L von Graphen und der langsamen Rekombinationszeit 𝜏 im System Graphen/Silicium ausgenutzt wird. Eine solche Anordnung führt nach Gl. (19.18) zu einer Verstärkung 𝐺 = 𝜏∕𝜏L . Der beobachtete Wert der Verstärkung in derartigen Bauelementen beträgt 𝐺 ≈ 3 × 104 entsprechend einer Ansprechempfindlichkeit ℛ ≈ 104 gemäß Gl. (19.9). Das Ferminiveau von Graphen kann durch Dotierung oder das Anlegen einer Vorspannung eingestellt werden, was es ermöglicht, die Barrierenhöhe des Schottkyübergangs und damit die Strom-Spannungs-Beziehung eines solchen Bauelements zu modifizieren. Auch andere zweidimensionale Materialien wurden mit verschiedenen Halbleiterstrukturen zu Photodioden kombiniert, die sowohl mit Vorspannung als auch im Photovoltaikmodus betrieben werden können.
Feld in der Übergangsregion ist groß. Die Ladungsträger können daher genügend Energie aufnehmen, um durch Stoßionisation neue Ladungsträger erzeugen zu können. Diese Vervielfachung benötigt jedoch Zeit und führt ein zusätzliches Rauschen ein, was die Bandbreite und die Leistung des Bauelements einschränkt. Lawinenphotodioden werden in Empfängern für die faseroptische Kommunikation (Abschnitt 25.1) sowie im Zusammenhang mit Bildgebung, Scannern oder der Entfernungsmessung weithin verwendet.
19.4.1 Konventionelle Lawinenphotodioden Abbildung 19.20 illustriert den Lebenslauf eines typischen Elektron-Loch-Paars in der Verarmungsregion einer konventionellen Lawinenphotodiode. Ein Photon wird an Punkt 1 absorbiert und erzeugt ein ElektronLoch-Paar (ein Elektron im Leitungsband und ein Loch im Valenzband). Das Elektron wird unter dem Einfluss des starken elektrischen Feldes beschleunigt und erhöht dabei seine Energie relativ zum Grund des Leitungsbands. Die Beschleunigung wird durch zufällige Stöße mit dem Gitter andauernd unterbrochen, bei denen das Elektron etwas von seiner erworbenen Energie verliert. Diese konkurrierenden Prozesse bewirken, dass das Elektron eine stationäre mittlere Geschwindigkeit erreicht. Wenn das Elektron Glück hat und zu irgendeiner Zeit während dieses Prozesses eine Energie größer als E g erhält, hat es die Gelegenheit, durch Stoßionisation ein zweites Elektron-Loch-Paar zu erzeugen (z. B. an Punkt 2). Die beiden Elektronen werden dann durch das Feld beschleunigt, und jedes von ihnen kann Ausgangspunkt einer weiteren Stoßionisation sein. Die an den Punkten 1 und 2 erzeugten Löcher werden eben-
p
19.4 Lawinenphotodioden Elektronenenergie
In einer Lawinenphotodiode (LPD oder APD, von engl. avalanche photodiode) wird jedes nachgewiesene Photon in eine Kaskade von beweglichen Ladungsträgerpaaren umwandelt. Selbst schwaches Licht ist dadurch in der Lage, einen Strom hervorzurufen, der so groß ist, dass er in der nachgeschalteten Elektronik nachgewiesen werden kann. An der Diode liegt eine große Spannung in Sperrrichtung an und das elektrische
3 + +
Photon 1 +
2 L +
g
n V
4) Siehe F. Liu, S. Kar, ‚Quantum Carrier Reinvestment-Induced Ultrahigh and Broadband Photocurrent Responses in Graphene-Silicon Junctions‘, ACS Nano 8, 10270–10279, 2014.
x
Abb. 19.20 Schematische Darstellung der Vervielfachung in einer konventionellen Homoübergang-Lawinenphotodiode.
669
670
19 Photodetektoren
falls beschleunigt und bewegen sich nach links. Jedes von ihnen hat ebenfalls eine Chance, durch Stoßionisation ein weiteres Elektron-Loch-Paar zu erzeugen (z. B. an Punkt 3), sofern es genügend Energie erwirbt. Ionisationskoeffizienten und Ionisationsverhältnis Ionisationskoeffizienten
Die Fähigkeit von Elektronen und Löchern, eine Stoßionisation zu bewirken, werden durch die Ionisationskoeffizienten 𝛼E und 𝛼L charakterisiert. Diese Größen bezeichnen Ionisationswahrscheinlichkeiten pro Längeneinheit (in cm−1 ); die inversen Koeffizienten 1∕𝛼E und 1∕𝛼L bezeichnen mittlere Entfernungen zwischen aufeinander folgenden Ionisationen. Die Ionisationskoeffizienten nehmen mit dem elektrischen Feld in der Sperrschicht zu (da es die Beschleunigung liefert) und mit zunehmender Temperatur des Bauelements ab (da die größere Frequenz von Stößen die Wahrscheinlichkeit reduziert, dass ein Ladungsträger genügend Energie gewinnen kann, um eine Ionisation zu bewirken). Die im Folgenden vorgestellte vereinfachte Theorie geht davon aus, dass 𝛼E und 𝛼L Konstanten sind. Für Zwecke der Rauschminderung kann es jedoch zweckmäßig sein, Bauelemente so zu konstruieren, dass die Ionisationskoeffizienten auf definierte Weise vom Ort und der Vorgeschichte der Ladungsträger abhängen, wie in Abschnitt 19.4.2 diskutiert wird. Ionisationsverhältnis
Ein wichtiger Parameter zur Charakterisierung der Leistung einer Lawinenphotodiode ist das Ionisationsverhältnis, d. h. das Verhältnis der Ionisationskoeffizienten, 𝛼 k= L . (19.20) 𝛼E Wenn die Löcher keine merkliche Ionisation bewirken (d. h. wenn 𝛼L ≪ 𝛼E bzw. k ≪ 1 ist), wird der größte Teil der Ionisation durch Elektronen hervorgerufen. Die Lawine verläuft dann in Abb. 19.20 im Wesentlichen von links nach rechts (d. h. von der p- zur n-Seite des Bauelements). Sie endet nach einiger Zeit, wenn alle Elektronen die n-Seite der Sperrschicht erreicht haben. Wenn andererseits Elektronen und Löcher beide eine merkliche Ionisation hervorrufen (k ≈ 1), erzeugen die Löcher, die sich nach links bewegen, Elektronen, die sich wieder nach rechts bewegen, die wiederum weitere Löcher erzeugen, die sich nach links bewegen – ein theoretisch endloser Kreislauf. Obwohl diese Rückkopplung den Gewinn des Bauelements vergrößert (die pro Ladungsträgerpaar erzeugte Gesamtladung in dem Stromkreis ist 𝑞∕𝑒), ist sie dennoch aus mehreren Gründen unerwünscht:
• Sie ist zeitaufwendig und reduziert daher die Bandbreite des Bauelements. • Sie ist stochastisch und vergrößert daher das Rauschen. • Sie kann instabil sein und dadurch den Zusammenbruch der Lawine verursachen. Es ist daher wünschenswert, Lawinenphotodioden aus Materialien herzustellen, in denen nur eine Art von Ladungsträgern (entweder die Elektronen oder die Löcher) eine Stoßionisation bewirken können. Wenn z. B. die Elektronen den größeren Ionisationskoeffizienten haben, wird im optimalen Fall das Elektron eines Ladungsträgerpaars auf der p-dotierten Seite der Sperrschicht injiziert und ein Material mit einem möglichst kleinen k verwendet. Wenn Löcher injiziert werden, sollte das Loch eines Ladungsträgerpaars auf der n-Seite injiziert werden und k sollte so groß wie möglich sein. Eine ideale Vervielfachung eines einzigen Ladungsträgers wird für k = 0 bzw. ∞ erreicht. Gewinn und Ansprechempfindlichkeit Dioden mit Vervielfachung eines einzigen Ladungsträgers
Als Vorübung für die Bestimmung des Gewinns einer Lawinenphotodiode, in der beide Arten von Ladungsträgern die Verstärkung verursachen, betrachten wir zuerst die einfachere Aufgabenstellung der Verstärkung durch einen einzelnen Ladungsträger (das Elektron, d. h. 𝛼L = 0, k = 0). 𝐽E (𝑥) soll die durch Elektronen vermittelte elektrische Stromdichte am Ort 𝑥 sein, wie in Abb. 19.21 dargestellt. Innerhalb einer Entfernung d𝑥 erhöht sich der Strom im Mittel um den Faktor d𝐽E (𝑥) = 𝛼E 𝐽E (𝑥) d𝑥 ,
(19.21)
woraus wir die Differentialgleichung d𝐽E = 𝛼E 𝐽E (𝑥) d𝑥
(19.22)
erhalten, deren Lösung die Exponentialfunktion 𝐽E (𝑥) = 𝐽E (0) exp(𝛼E 𝑥) ist. Der Gewinn 𝐺 = 𝐽E (w )∕𝐽E (0) ist JE( )
JE (x)
JE (0) 0
x
Abb. 19.21 Exponentieller Anstieg der elektrischen Stromdichte in einer Lawinenphotodiode, deren Verstärkung auf nur einer Art von Ladungsträgern beruht.
19.4 Lawinenphotodioden
injiziertes Elektron
Abb. 19.22 Die Summe der Elektronen- und LochStromdichten über eine Ebene ist an jedem Ort x konstant. Zur Illustration sind hier vier Stoßionisationen und fünf Elektronen und Löcher in jeder Ebene gezeigt.
1 +
+
2 +
3
x
+
4 +
JE ( )
daher 𝐺 = exp(𝛼E w ) .
Die elektrische Stromdichte nimmt exponentiell mit dem Produkt des Ionisationskoeffizienten 𝛼E und der Breite w der Verstärkungsschicht zu. Das Ergebnis ähnelt dem für einen Laserverstärker [siehe Gl. (15.7)].
Um die Aufgabe für die Verstärkung zweier Ladungsträger zu lösen, müssen wir sowohl die Elektronen-Stromdichte 𝐽E (𝑥) als auch die Loch-Stromdichte 𝐽L (𝑥) kennen. Wir nehmen an, dass nur Elektronen in die Verstärkungsregion injiziert werden. Da lochinduzierte Ionisationen aber auch Elektronen produzieren, folgt das Wachstum von 𝐽E (𝑥) der Differentialgleichung (19.24)
Wegen der Ladungsneutralität gilt d𝐽E ∕ d𝑥 = − d𝐽L ∕ d𝑥, sodass die Summe 𝐽E (𝑥) + 𝐽L (𝑥) im stationären Zustand für alle 𝑥 konstant sein muss. Das ist aus Abb. 19.22 offensichtlich; die Gesamtzahl von Ladungsträgern, die jede Ebene durchqueren, hängt nicht vom Ort ab. Da wir angenommen hatten, dass keine Löcher bei 𝑥 = w injiziert werden, ist 𝐽L (w ) = 0 und daher 𝐽E (𝑥) + 𝐽L (𝑥) = 𝐽E (w ) ,
(19.25)
wie Abb. 19.23 zeigt. Die Loch-Stromdichte 𝐽L (𝑥) kann daher aus Gl. (19.24) eliminiert werden, woraus folgt d𝐽E = (𝛼E − 𝛼L )𝐽E (𝑥) + 𝛼L 𝐽E (w ) . d𝑥
(19.26)
Diese Differentialgleichung erster Ordnung kann leicht gelöst werden, um den Gewinn 𝐺 = 𝐽E (w )∕𝐽E (0) zu erhalten. Für 𝛼E ≠ 𝛼L ist das Ergebnis 𝐺 = (𝛼E − 𝛼L )∕ {𝛼E exp[−(𝛼E − 𝛼L )w ] − 𝛼L }; daraus ergibt sich 𝐺=
1−k . exp [−(1 − k)𝛼E w ] − k
JE (x)
JE (0)
x
0
Abb. 19.23 Anstieg der Elektronen- und Lochströme durch Lawinenverstärkung.
Dioden mit Vervielfachung beider Ladungsträger
d𝐽E = 𝛼E 𝐽E (𝑥) + 𝛼L 𝐽L (𝑥) . d𝑥
JL (x)
(19.23)
(19.27)
Das Ergebnis aus Gl. (19.23) für den Gewinn bei Verstärkung aufgrund nur eines Ladungsträgers mit seinem
G
=1
= 0.5
=0
1 0
1
2
αE
Abb. 19.24 Anstieg des Gewinns G als Funktion der Dicke der Verstärkungsschicht für mehrere Werte des Ionisationsverhältnisses k unter der Annahme reiner Elektroneninjektion.
exponentiellen Wachstum ergibt sich daraus für k = 0. Für k = ∞ bleibt der Gewinn gleich eins, da nur Elektronen injiziert und diese nicht verstärkt werden. Für k = 1 ist Gl. (19.27) unbestimmt, und der Gewinn muss direkt aus Gl. (19.26) berechnet werden; das Ergebnis ist dann 𝐺 = 1∕(1 − 𝛼E w ). Eine Instabilität tritt für 𝛼E w = 1 auf. Die Abhängigkeit des Gewinns von 𝛼E w ist in Abb. 19.24 für mehrere Werte des Ionisationsverhältnisses k dargestellt. Die Ansprechempfindlichkeit ℛ wird durch Einsetzen von Gl. (19.27) in die allgemeine Beziehung Gl. (19.8) erhalten. Der Aufbau von Bauelementen
Wie bei jeder Photodiode sollte die Konstruktion einer Lawinenphotodiode die Photonenabsorption maximieren (z. B. durch eine pin-Struktur) und den Dunkelstrom minimieren. Gleichzeitig sollte das Feld in der Verstärkungsregion stark genug sein, um eine Vervielfachung eines Ladungsträgers mit möglichst geringem Rauschen zu bewirken, und andererseits sollte die Verstärkungs-
671
19 Photodetektoren
region dünn genug sein, um die Wahrscheinlichkeit zu minimieren, dass durch das starke elektrische Feld lokalisierte unkontrollierte Lawinen (Instabilitäten oder Mikroplasmen) erzeugt werden. Lawinenphotodioden mit getrennter Absorption/Verstärkung
Diese widerstreitenden Anforderungen bedingen eine Anordnung, in der die Absorptions- und Verstärkungsregionen räumlich getrennt sind. Strukturen dieser Art werden als Lawinenphotodioden mit getrennter Absorption/Verstärkung bezeichnet. Ihr Betrieb ist am einfachsten zu verstehen, wenn man ein Bauelement aus einem Material wie Silicium mit k ≈ 0 betrachtet (Beispiel 19-11). In der in Abb. 19.25 dargestellten Durchgriff-Lawinenphotodiode werden die Photonen in der ausgedehnten intrinsischen oder schwach dotierten π-Region absorbiert. Die Elektronen driften unter dem Einfluss eines mäßigen elektrischen Feldes durch dieses Gebiet in einen dünnen pn+ -Übergang, wobei sie ein so starkes elektrisches Feld durchqueren, dass sie die Lawine auslösen können. Die in Sperrrichtung an das Bauelement anliegende Spannung ist so groß, dass die Sperrschicht sich durch die p- und die π-Regionen bis in die 𝑝+ Kontaktschicht erstreckt.
Ladungsdichte
p
elektrisches Feld
672
π
p n
+ -
x
-
x
Abb. 19.25 Durchgriff-Lawinenphotodiode mit p+ πpn+ Struktur. Die π-Region ist intrinsisch oder sehr schwach p-dotiert, die p+ - und n+ -Regionen sind stark dotiert. Die Lawine wird in der dünnen pn+ -Übergangsregion ausgelöst, in der das elektrische Feld stark ist.
Lawinenphotodioden mit getrennter Absorptions-, Ladungsund Verstärkungsschicht
Eine weitere Variante der Lawinenphotodioden mit getrennter Absorption und Verstärkung sind Dioden, in die zusätzlich zu den Absorptions- und Verstärkungsschichten noch eine Ladungsschicht integriert ist. Sie hat die Aufgabe, das elektrische Feld in der Absorptionsschicht klein zu halten, um den durch Tunnelprozesse in diesem Bereich mit kleiner Bandlücken entstehenden Dunkelstrom zu minimieren, und gleichzei-
tig in der Verstärkungsschicht mit ihrer großen Bandlücke ein großes Feld zu erzeugen, das die Stoßionisation erleichtert. Die Verwendung einer Verstärkungsschicht mit großer Bandlücke minimiert Tunnel- und thermische Effekte und damit den in diesem Bereich hervorgerufenen Dunkelstrom. Die relativen Feldstärken in beiden Regionen werden ebenso wie bei der in Abb. 19.25 gezeigten Durchgriffdiode durch die Dotierung bestimmt. Häufig werden Schichten mit variabler Zusammensetzung verwendet, um zu verhindern, das Ladungsträger an den Grenzflächen zwischen den Schichten eingefangen werden. Antwortzeiten Lawinenaufbauzeit
Neben den üblichen Größen Durchgangszeit, Diffusion und 𝑅𝐶-Effekte, die die Antwortzeit von Photodioden bestimmen, kommt in Lawinenphotodioden noch ein zusätzlicher Faktor zum Tragen, die sogenannte Lawinenaufbauzeit. Dabei handelt es sich um die Zeit, die die Stoßionisation benötigt, um einzusetzen und wieder abzuklingen; sie begrenzt die Geschwindigkeit, mit der eine Lawinenphotodiode betrieben werden kann. Systeme, die für höhere Bitraten konzipiert sind, müssen auf pin-Photodioden zurückgreifen. Die Antwortzeit einer Lawinenphotodiode mit getrennter Absorption und Verstärkung ist in Abb. 19.26 dargestellt, indem der Lebenslauf eines am Rand der Absorptionszone erzeugten Photoelektrons (Punkt 1) verfolgt wird. Das Elektron driftet mit einer stationären Geschwindigkeit v E und erreicht die Verstärkungsregion (Punkt 2) nach einer Durchgangszeit w D ∕v E . Innerhalb der Verstärkungsregion breitet sich das Elektron ebenfalls mit einer Geschwindigkeit v E aus. Durch Stoßionisation erzeugt es Elektron-Loch-Paare, z. B. an den Punkten 3 und 4, wobei zwei zusätzliche Elektron-LochPaare entstehen. Die Löcher breiten sich mit ihrer stationären Geschwindigkeit v L in der entgegengesetzten Richtung aus. Die Löcher können ebenfalls Stoßionisationen verursachen, die weitere Elektron-Loch-Paare erzeugen, wie z. B. an den Punkten 5 und 6 gezeigt ist. Die entstehenden Ladungsträger können selbst Stoßionisationen verursachen, wodurch die Rückkopplung weitergeführt wird. Der Prozess endet, wenn das letzte Loch die Verstärkungsregion (an Punkt 7) verlässt und das Driftgebiet nach Punkt 8 durchquert. Die für den ganzen Prozess erforderliche Gesamtzeit 𝜏 (zwischen den Punkten 1 und 8) ist die Summe der Durchgangszeiten (von 1 bis 2 und von 7 bis 8) und der Verstärkungszeit 𝜏V , 𝜏=
wD w + D + 𝜏V . vE vL
(19.28)
19.4 Lawinenphotodioden
hv
Absorptionszone
Verstärkungszone
D
Lochstrom i L (t)
V
x
1
D
1
2
E
3
4
5
τV
6
3 4 5
3 4 5
6 7
6 7
Elektronenstrom iE (t)
7 e
τ
E
D+
V
D L
8
e
8 t
t
Abb. 19.26 (a) Verfolgung des Verlaufs der Lawinenaufbauzeit in einer Lawinenphotodiode mithilfe eines Orts-ZeitDiagramms unter der Annahme, dass nur eine Ladungsträgerart injiziert, aber beide verstärkt werden. Linien mit negativer Steigung beschreiben Elektronen, Linien mit positiver Steigung Löcher. Elektronen bewegen sich mit der Geschwindigkeit v E nach rechts, und die Löcher bewegen sich mit der Geschwindigkeit v L nach links. Elektron-Loch-Paare
Wegen der Zufälligkeit des Verstärkungsprozesses ist die Verstärkungszeit 𝜏V stochastisch. In dem Spezialfall k = 0 (keine Lochverstärkung) ist der Maximalwert von 𝜏V , wie aus Abb. 19.26 zu sehen ist, wV w + V . vE vL
(19.29)
Für einen großen Gewinn 𝐺 und Elektroneninjektion mit 0 < k < 1 erhält man die Größenordnung des Mittelwerts von 𝜏V , indem man den ersten Term von Gl. (19.29) um den Faktor 𝐺k vergrößert, 𝜏V ≈
𝐺kw V vE
+
wV . vL
V
t (b)
(a)
𝜏V =
L
D+
werden in der Verstärkungsregion produziert. Die Bewegung der Ladungsträger endet am Rand des Materials. (b) Lochstrom iL (t ) und Elektronenstrom iE (t ) im äußeren Stromkreis. Jedes Ladungsträgerpaar induziert eine Ladung e in dem Stromkreis. Die induzierte Gesamtladung q, die der Fläche unter der Auftragung von iE (t ) + iL (t ) gegen t entspricht, ist gleich Ge. Diese Abbildung ist eine Verallgemeinerung von Abb. 19.6, die ein einzelnes Elektron-Loch-Paar zeigt.
Beispiel 19-4: Lawinenaufbauzeit einer SiliciumLawinenphotodiode
Wir betrachten eine Si-Lawinenphotodiode mit w D = 50 μm, w V = 0.5 μm, v E = 107 cm∕s, v L = 5 × 106 cm∕s, 𝐺 = 100 und k = 0.1. Gleichung (19.29) liefert 𝜏V = 5 + 10 = 15 ps, woraufhin Gl. (19.28) 𝜏 = 1020 ps = 1.02 ns ergibt. Andererseits liefert Gl. (19.30) 𝜏V = 60 ps, sodass Gl. (19.28) 𝜏 = 1065 ps = 1.07 ns gibt. Für eine pin-Photodiode mit denselben Werten von w D , v E und v L ist die Durchgangszeit w D ∕v E + w D ∕v L ≈ 1 ns. Die Ergebnisse unterscheiden sich nicht sehr, weil 𝜏V in einem Siliciumbauelement ziemlich klein ist.
(19.30)
Eine Verkleinerung von k verringert 𝜏V und 𝜏 und vergrößert so die Geschwindigkeit der Lawinenphotodiode. Die zugehörige Elektronen- und Lochströme 𝑖L (𝑡) bzw. 𝑖E (𝑡) sind ebenfalls in Abb. 19.26 dargestellt. Eine vollständigere Theorie des Prozesses ist ziemlich komplex.
Materialien
Die für Lawinenphotodioden interessanten Materialien entsprechen weitgehend denjenigen, die auch für pinPhotodioden verwendet werden (siehe Abb. 19.19); sie müssen nur die Zusatzbedingung erfüllen, dass sie einen möglichst kleinen (für Elektroneninjektion) bzw. großen (für Lochinjektion) Wert des Ionisationsverhältnisses k haben sollten; außerdem sind große Bandlücken vorteilhaft, um den Dunkelstrom zu minimieren.
673
19 Photodetektoren
Silicium- und AlInAsSb-Lawinenphotodioden, die in den Bereichen von 700 bin 900 nm bzw. von 1.3 bis 1.6 μm zum Einsatz kommen, haben Ionisationsverhältnisse k bis hinunter zu 0.01–0.02 und folglich vernachlässigbares Rauschen. Im UV verwendbare Materialien mit kleinen Werten von k sind beispielsweise GaN oder AlGaN; HgCdTe wird im mittleren Infrarot eingesetzt. Beispiel 19-5: InGaAs/InP-Lawinenphotodiode
InGaAs/InP-Lawinenphotodioden, in denen InGaAs in der Absorptions- und InP in der Verstärkungsschicht eingesetzt werden, werden häufig als Photodetektoren für faseroptische Nachrichtensysteme im Band von 1.3 bis 1.6 μm verwendet (siehe Abschnitt 25.1.4). Da sie leicht herzustellen sind und eine hohe Ansprechempfindlichkeit besitzen (Abb. 19.19), werden sie trotz des ungünstigen Ionisationsverhältnisses für InP (1∕k ≈ 0.3) weiterhin eingesetzt. Sie werden in der Regel bei Spannungen zwischen Durchgriff und Durchschlag betrieben (Abb. 19.27); mit zunehmender Sperrspannung steigen auch die Verstärkung und der Dunkelstrom. Einige 10 V Vorspannung führen zu einem elektrischen Feld von ≈ 105 V∕cm, das ausreicht, um den Lawinenprozess auszulösen. Typische Werte für die mittlere Verstärkung und Bandbreite sind 𝐺 ≈ 10 bzw. 𝐵 = 10 GHz. Wenn das Bauelement um eine zusätzliche Ladungsschicht ergänzt werden soll, kann hierfür InGaAsP verwendet werden. Manchmal wird AlInAs wegen seines günstigeren Ionisationsverhältnisses (1∕k ≈ 0.2) anstelle von InP für den Verstärkungsbereich verwendet; nach Gl. (19.30) resultiert dann auch eine höhere Geschwindigkeit. Beispiel 19-6: Ge-auf-Si-Lawinenphotodiode mit Absorptions-, Ladungs- und Verstärkungsschicht
Die Ge-auf-Si-Lawinenphotodiode mit Absorptions-, Ladungs- und Verstärkungsschicht ist ein monolithisches Bauelement der Gruppe-IV-Photonik, das über den größten Teil des Telekommunikationsbandes zwischen 1.3 und 1.6 μm betrieben werden kann. Zu seinen Hauptvorteilen zählen seine CMOS-Kompatibilität sowie die Möglichkeit der On-Chip-Integration. In der Ausführung für senkrechten Einfall wird das Bauelement so aufgebaut, dass die Photonen auf eine Absorptionsschicht aus Germanium auftreffen, die auf einer Siliciumschicht liegt, in der die Verstärkung stattfindet; so wird das Eigenrauschen der Verstärkung in Ge vermieden (siehe Aufgabe 19-10). Eine Si-Ladungsschicht sorgt im Absorptionsbereich für ein schwaches elektrisches Feld, um den Dunkelstrom zu minimieren. Wenn undotierte bzw. nicht absichtlich dotierte Ge- und Si-Schichten mit
Dicken von 1 bzw. 0.5 μm und eine 0.1 μm dicke p-dotierte Si-Ladungsschicht verwendet werden, erreicht die Diode die folgenden Parameter: mittlere Verstärkung 𝐺 ≈ 50; Produkt aus Gewinn und Bandbreite 𝐺𝐵 ≈ 350 GHz (deutlich über den Werten für InGaAs/InP-Dioden); Ansprechempfindlichkeit ℛ ≈ 5.9 A∕W bei 𝜆0 = 1.3 μm; Ionisationsverhältnis k ≈ 0.09 und ein Betrieb bei Bitraten von 25 Gbit/s. 5) Ihre wichtigsten Nachteile sind die steile Abnahme des Absorptionskoeffizienten von Ge für Wellenlängen größer als 1.55 μm und der relativ große Dunkelstrom aufgrund der Gitterfehlanpassung zwischen Ge und Si. Ähnlich wie Wellenleiter-Photodioden aus Germanium auf Silicium (Beispiel 19-2) entkoppeln auch derartige Lawinenphotodioden die Lichtabsorption und die Erzeugung der Ladungsträger, wodurch sie gleichzeitig eine hohe Quantenausbeute und eine hohe Geschwindigkeit bieten können.
10 –4
bereich
Gewinn 10 –6 Strom / A
674
10 –8
10 –10
Photostrom
Dunkelstrom Durchgriffsspannung Durchschlagsspannung
10
–12
10
20 Spannung in Sperrrichtung / V
30
Abb. 19.27 Strom-Spannungs-Charakteristik einer InGaAs/InP-Lawinenphotodiode mit getrennter Absorption/Verstärkung. Das Bauelement wird bei einer Spannung in Sperrrichtung betrieben, die zwischen der Durchgriffs(der Spannung, bei der die Verarmungsregion sich bis in die Absorptionsregion hinein erstreckt) und der Durchschlagsspannung (der Spannung, bei der die Lawine ungesteuert ansteigt) liegt.
Beispiel 19-7: AlInAsSb/GaSb-Lawinenphotodiode mit Absorptions-, Ladungs- und Verstärkungsschicht
Die AlInAsSb-Lawinenphotodiode mit Absorptions-, Ladungs- und Verstärkungsschicht ist ein Bauelement mit direkter Bandlücke für das Telekommunikationsband zwischen 1.3 und 1.6 μm. Die Schichtstruktur ist an das GaSb-Substrat gitterangepasst, bietet einen ho5) Siehe D. Dai, M. Piels, J. E. Bowers, ‚Monolithic Germanium/Silicon Photodetectors with Decoupled Structures: Resonant APDs and UTC Photodiodes‘, IEEE Journal of Selected Topics in Quantum Electronics 20, 3802214, 2014.
19.4 Lawinenphotodioden
hen Absorptionskoeffizienten und eignet sich für die Konstruktion komplexer Strukturen. Die in Abb. 19.28 dargestellte Al𝑥 In1−𝑥 As𝑦 Sb1−𝑦 -Lawinenphotodiode verwendet eine Absorptionsschicht mit geringem Al-Gehalt und eine Verstärkungsschicht mit hohem Al-Gehalt entsprechend kleinen bzw. großen Bandlücken. 6) Ihre Quantenausbeute beträgt 𝜂 ≈ 0.4 und ihr Dunkelstrom ist etwas größer als der von InGaAs/ AlInAs-Lawinenphotodioden, aber wesentlich kleiner als der von Ge-auf-Si-Bauelementen. Das Ionisationsverhältnis k ist vergleichbar mit dem von Si und beträgt bei einer mittleren Verstärkung 𝐺 = 10 ungefähr 0.01 (Beispiel 19-12). Auch Legierungen von AlInAs erweisen sich für die Herstellung von rauscharmen Lawinenphotodioden als nützlich. GaSb Substrat AlInAsSb Ladung
−
+
AlInAsSb Absorption AlInAsSb Verstärkung APD
Abb. 19.28 Struktur einer Alx In1−x Asy Sb1−y -Lawinenphotodiode mit separaten Absorptions-, Ladungs- und Verstärkungsschichten auf einem gitterangepassten GaSb-Substrat. Die n− -dotierte AlInAsSb-Absorptionsschicht (x = 0.4, y = 0.3) mit einer Dicke von 1 μ m ist von einem Paar von 100 nm dicken p+ -dotierten AlInAsSb-Schichten mit variabler Zusammensetzung (nicht gezeigt) umgeben. Eine 150 nm dicke p-dotierte AlInAsSb-Ladungsschicht (x = 0.7, y = 0.3) trennt die Absorptionsschicht von der 1 μ m dicken n− -dotierten AlInAsSb-Verstärkungsschicht (x = 0.7, y = 0.3). Das Substrat besteht aus n+ -dotiertem GaSb.
Beispiel 19-8: HgCdTe SAM APD
Hg𝑥 Cd1−𝑥 Te ist ein II-VI-Material mit einer direkten Bandlücke, die von 0.85 bis 16 μm eingestellt werden kann (Abb. 17.12). Es eignet sich zur Herstellung von Lawinenphotodioden mit separater Absorptions- und Verstärkungsschicht mit Grenzwellenlängen von 2 bis 11 μm im mittleren Infrarot. 7) Solche Dioden bieten Quantenausbeuten von bis zu 0.9, eine hohe Verstärkung (𝐺 > 1000) und große Produkte von Gewinn 6) Siehe S. R. Bank, J. C. Campbell, S. J. Maddox, M. Ren, A.-K. Rockwell, M. E. Woodson, S. D. March, ‚Avalanche Photodiodes Based on the AlInAsSb Materials System‘, IEEE Journal of Selected Topics in Quantum Electronics 24, 3800407, 2018.
und Bandbreite (𝐺𝐵 > 1 THz), erfordern jedoch eine Tieftemperaturkühlung. Es wird nur ein Ladungsträger verstärkt (für 0.2 < 𝑥 < 0.6 die Elektronen) und das Ionisationsverhältnis ist k ≈ 0; sie sind daher sehr rauscharm. HgCdTe-Lawinenphotodioden lassen sich problemlos in Brennebenenarrays integrieren, die für eine Vielzahl von Infrarotanwendungen mit niedrigem Photonenfluss und hoher Geschwindigkeit wie z. B. Bildgebung oder Lidar von Nutzen sind.
19.4.2 Dioden mit positionsund verlaufsabhängigen Parametern Die Theorie in Abschnitt 19.4.1 vorgestellte Theorie der konventionellen Lawinenphotodiode beruht auf der Annahme, dass die Wahrscheinlichkeit, dass ein Ladungsträger eine Stoßionisation bewirkt, weder von seiner Ionisationshistorie abhängt noch von dem Ort, an dem die Ionisation stattfinden soll – die Ionisationsrate wird zu allen Zeiten und an allen Orten innerhalb des Verstärkungsbereichs als gleich angenommen. Diese vereinfachenden Annahmen sind jedoch nicht immer anwendbar; es sind durchaus auch andere Bedingungen denkbar: • Möglicherweise muss ein neu erzeugter Ladungsträger eine gewisse Strecke im Verstärkungsbereich zurücklegen, um genügend Energie zu sammeln, damit er erfolgreich eine Stoßionisation auslösen kann. Das würde bedeuten, dass die Wahrscheinlichkeit einer Stoßionisation von der Ionisationshistorie des Ladungsträgers abhängt. • Der Verstärkungsbereich einer Lawinenphotodiode kann so konstruiert werden, dass er Quantenschichten oder -punkte, abgestufte Bandlücken und/oder andere Merkmale enthält, die die Wahrscheinlichkeit einer Stoßionisation von der Position des Ladungsträgers innerhalb der Verstärkungsschicht abhängig machen. Wir betrachten im Folgenden nacheinander Lawinenphotodioden mit verlaufsabhängigen Parametern oder positionsabhängigen Parametern. Auch Kombinationen dieser Eigenschaften können gezielt in Lawinenphotodioden integriert werden, um das Verstärkungsrauschen zu reduzieren und ihre Leistung zu verbessern.
7) Siehe J. Beck, C. Wan, M. Kinch, J. Robinson, P. Mitra, R. Scritchfield, F. Ma, J. Campbell, ‚The HgCdTe Electron Avalanche Photodiode‘, Journal of Electronic Materials 35, 1166–1173, 2006.
675
676
19 Photodetektoren
Lawinenphotodioden mit verlaufsabhängigen Parametern
In bestimmten Fällen kann ein neu erzeugter Ladungsträger im Verstärkungsbereich einer Lawinenphotodiode erst dann eine Stoßionisation bewirken, wenn er eine bestimmte im elektrischen Feld zurückgelegt und ausreichend Energie aus dem Feld entnommen hat. Die Ionisationswahrscheinlichkeit des Ladungsträgers ist in diesem Fall unmittelbar nach seiner Erzeugung null und bleibt dies auch über eine Entfernung, die man als Totraum bezeichnet. Bei einer genaueren Betrachtung muss man berücksichtigen, dass die Ionisationswahrscheinlichkeit nach der Erzeugung des Ladungsträgers allmählich zunimmt; man sollte deshalb anstelle von einem Totraum besser von einem Erholungsraum sprechen – in beiden Fällen hängt der Ionisationskoeffizient jedoch eindeutig vom Ionisationsverlauf des Ladungsträgers ab. Gezielt entwickelte Mehrschicht-Lawinenphotodioden kombinieren durch geschickte Anpassung der verlaufsabhängigen Parameter eine hohe Verstärkung mit geringem Rauschen und einem kleinen Dunkelstrom: Der Totraum ist ein inhärenter Bestandteil der Stoßionisation. Er steuert die Positionen, an denen Stoßionisiationen auftreten und erhöht dadurch den Ordnungsgrad des Prozesses der Trägererzeugung, wodurch sich das Verstärkungsrauschen verringert. Der Effekt des Totraums ist besonders ausgeprägt, wenn der Verstärkungsbereich dünn und die Zahl der einzelnen Verstärkungsschritte gering ist. Anfangsenergie. Ladungsträger, die einen geeignet ausgelegten Feldgradienten durchlaufen, bevor sie in den Verstärkungsbereich eintreten, können dabei eine erhebliche kinetische Energie gewinnen, wodurch der anfängliche Totraum im Verstärkungsbereich verringert und der Ordnungsgrad der Stoßionisationen weiter gesteigert und das Verstärkungsrauschen entsprechend verringert werden. Totraum.
Die Theorie des Verstärkungsrauschens für Lawinenphotodioden mit verlaufsabhängigen Parametern wird in Abschnitt 19.6.2 weiter ausgeführt. APD mit positionsabhängigen Parametern
Mehrschicht-Lawinenphotodioden können mit Bandlücken und Ionisationskoeffizienten mit beliebigen Ortsabhängigkeiten in jeder Schicht hergestellt werden. Spezialfälle derartiger Mehrschichtbauelemente sind herkömmliche Lawinenphotodioden, Lawinenphotodioden mit separater Absorptions- und Verstärkungsschicht, Mehrfachquantenschicht-Lawinenphotodioden oder Übergitter-Lawinenphotodioden.
Gezielt entwickelte Mehrschicht-Lawinenphotodioden kombinieren durch geschickte Anpassung der ortsabhängigen Parameter eine hohe Verstärkung mit geringem Rauschen und einem kleinen Dunkelstrom: Ein Mehrschicht-Bauelement kann so konstruiert werden, dass ein Ladungsträger beim Durchqueren an bestimmten Stellen innerhalb der Struktur durch Banddiskontinuitäten beschleunigt wird. Die zusätzliche kinetische Energie, die er auf diese Weise plötzlich erhält, kann dann die Wahrscheinlichkeit einer Stoßionisation an dieser Position gezielt erhöhen. Ortsabhängige Ionisationsschwellen. Ein MehrschichtBauelement kann so konstruiert werden, dass ein Ladungsträger beim Durchqueren auf eine plötzliche Abnahme der Ionisationsschwelle trifft, wenn er von einer Schicht in eine andere wechselt. Wenn er in der ersten Schicht eine zu geringe Energie für eine Ionisation hatte, steigt die Wahrscheinlichkeit einer Ionisation beim Eintritt in die zweite Schicht plötzlich an. Ortsabhängige Feldgradienten.
Die Theorie des Verstärkungsrauschens für ÜbergitterLawinenphotodioden mit den zugehörigen ortsabhängigen Parametern wird in Abschnitt 19.6.2 ausgeführt.
19.4.3 Einzelphotonenund photonenzahlauflösende Detektoren Einzelphotonendetektoren können einzelne Photonen nachweisen. Diese Möglichkeit ist in einer Vielzahl von Anwendungen von Bedeutung, darunter Bildgebung, Lidar, Fernerkundung, Kommunikation, Astronomie, Quantenoptik und Quanteninformationsverarbeitung. Zur Beurteilung der Leistung eines Einzelphotonendetektors stehen eine Reihe von Parametern zur Verfügung, beispielsweise seine spektrale Empfindlichkeit, sein Detektionswirkungsgrad, die Dunkelzählrate, der zeitliche Jitter, seine maximale Zählrate, seine aktive Fläche, die Betriebstemperatur und ggf. seine Fähigkeit, die Photonenzahl aufzulösen. Wir betrachten nacheinander drei Festkörperdetektoren, die zum Erfassen und Zählen einzelner Photonen geeignet sind: Einzelphotonen-Lawinendioden (SPAD, engl. single-photon avalanche diodes), Silicium-Sekundärelektronenvervielfacher (SiSEV, engl. silicon photomultipliers) und supraleitende Einzelphotonendetektoren (SSPD, engl. superconducting single-electron detectors). Es ist vielleicht erwähnenswert, dass mehrere neue Techniken an der Schwelle stehen, sich für die Detektion von Einzelphotonen und die photonenzahlaufgelöste Detektion als nützlich zu erweisen (oder auch
19.4 Lawinenphotodioden
nicht): (1) die nichtlineare optische Aufwärtskonvertierung von IR-Photonen in sichtbare Wellenlängen, für die der Nachweis einzelner Photonen effizienter möglich ist, (2) Lawinenphotodioden mit separater Absorption und Verstärkung auf der Basis von Si:As bei kryogenen Temperaturen, (3) supraleitende Nanodraht-Einzelphotonendetektoren bei kryogenen Temperaturen und (4) Einzelphotonendetektoren auf der Basis von Quantenpunkten und Defekten. Einzelphotonen-Lawinenphotodioden (SPAD)
Sekundärelektronenvervielfacher (SEV) sind seit viele Jahren das zentrale Bauelement in Einzelphotonendetektoren und Photonenzählern (Abschnitt 19.1.1). SEV für den sichtbaren und infraroten Spektralbereich sind von 150 bis 1000 nm einsetzbar, haben Nachweiswirkungsgrade von bis zu 40 %, Dunkelzählraten im Bereich von 100 Photonen/s, einen zeitlichen Jitter von 300 ps, maximale Zählraten von bis zu 10 MHz, Durchmesser im Bereich von Millimetern bis zu einem halben Meter, können bei Zimmertemperatur betrieben werden und sind (in Grenzen) in der Lage, auch Photonenzahlen aufzulösen. Als komfortable Alternative zu SEV bietet sich im Bereich der Festkörper-Bauelemente die Einzelphotonen-Lawinenphotodiode (SPAD) an, die auch als Geiger-Lawinenphotodiode bezeichnet wird, weil ihre Funktionsweise der eines Geigerzählers zum Nachweis ionisierender Strahlung entspricht. Dabei handelt es sich um eine Lawinenphotodiode, die etwas oberhalb ihrer Durchschlagspannung betrieben wird, sodass bereits die Absorption eines einzigen Photons die Lawine auslöst und dadurch einen großen Stromimpuls erzeugt, der die Ankunft des Photons anzeigt. Die Antwort des Detektors erfolgt in diesem Fall binär, wodurch Probleme durch Gewinn- und Schaltungsrauschen entschärft werden. Der Nachweiswirkungsgrad (PDE, engl. photon detection efficiency) 𝜂 gibt die Wahrscheinlichkeit an, dass ein eintreffendes Photon ein messbares elektrisches Signal im Schaltkreis hervorruft. Auch thermische, Tunnel- und Einschlussprozesse im Halbleitermaterial können Elektron-Loch-Paare erzeugen, die eine Lawine auslösen; sie sind die Ursache der endlichen Dunkelzählrate. Jede Elektronenlawine muss gelöscht werden, um die Diode auf die Ankunft des nächsten Photons vorzubereiten. Das kann entweder passiv oder aktiv erreicht werden: wird am einfachsten durch den Einbau eines hochohmigen Serienwiderstands in die Schaltung der Photodiode erreicht, der als Reaktion
Passives Löschen
auf den Lawinenstrompuls einen erheblichen Spannungsabfall bewirkt, der die Spannung über der Diode verringert und die Lawine löscht. Aktives Löschen ist komplexer zu realisieren, ermöglicht aber eine wesentlich größere maximale Photonenzählrate. Hierbei erfasst ein schneller Diskriminator den steilen Beginn des Lawinenstrompulses über einen Vorwiderstand und aktiviert eine Schaltung, die die Spannung über der Diode auf einen Wert unterhalb der Durchschlagspannung reduziert, wodurch die Lawine gelöscht wird. Anschließend wird die Spannung auf einen Wert oberhalb der Durchschlagspannung wiederhergestellt, woraufhin die Diode nach einer Erholungszeit von etwa 100 ns für das nächste Photon bereit ist. In der Praxis hängt die Erholungszeit sowohl von den Parametern des Bauelements als auch von seiner Elektronik ab. Die Erholung kann abrupt oder allmählich stattfinden; man spricht dann entsprechend von Totzeit oder Erholungszeit. Die Totzeit begrenzt die maximale Zählrate des Detektors und wird manchmal absichtlich verlängert, um Nachpulse zu unterdrücken. Zur Herstellung von Einzelphotonen-Lawinenphotodioden kommen verschiedene Materialsysteme in Betracht: Einzelphotonen-Lawinendioden aus Silicium arbeiten im
Sichtbaren und nahen Infrarot (350 ≤ 𝜆0 ≤ 900 nm) und bieten hohe Wirkungsgrade von bis zu 65 %, niedrige Dunkelzählraten bis hinunter zu 25 Photonen/s, einen zeitlichen Jitter von 400 ps, maximale Zählraten von 10 MHz, Durchmesser von 100– 200 μm und Betrieb bei Zimmertemperatur. Allerdings sind sie nicht in der Lage, Photonenzahlen aufzulösen. InGaAs/InP-Heterostrukturen arbeiten im nahen Infrarot (900 ≤ 𝜆0 ≤ 1700 nm) und sind die Bauelemente der Wahl für die faseroptische Kommunikation, aber ihre Leistung ist hier weit weniger eindrucksvoll als die von siliciumbasierten Strukturen. Da sie außerordentlich große Dunkelzählraten haben (typischerweise > 20 000 Photonen/s) werden sie oft bei kryogenen Temperaturen in einem GatedGeiger-Modus betrieben, sofern die Ankunftszeiten der Photonen bekannt sind. Sie ermöglichen dann Wirkungsgrade von 10 %, Dunkelzählraten von ≈ 100 Photonen/s, einen zeitlichen Jitter von 400 ps, maximale Zählraten von 10 kHz und Durchmesser von 40 μm. Auch Ge-auf-Si-Bauelemente werden in diesem Wellenlängenbereich gelegentlich verwendet; ihre Leistungen reichen aber nicht an die von InGaAs/InP-Strukturen heran.
677
678
19 Photodetektoren
kommen im mittleren Infrarot zum Einsatz, während GaN- oder SiC-SPAD im Ultravioletten verwendet wurden. SiC hat den besonderen Vorteil, dass es hohe Temperaturen und aggressive Umgebungen aushalten kann.
HgCdTe-SPAD
Für sich genommen können Einzelphotonen-Lawinenphotodioden nur zwischen den Ereignissen „null Photonen“ und „eines oder mehrere Photonen“ unterscheiden; zur Zählung von Photonen sind sie somit nutzlos. Der Grund dafür ist, das die von einem einzelnen Photon ausgelöste Elektronenlawine nicht von der zu unterscheiden ist, die durch eine Gruppe von Photonen hervorgerufen wird.
Ein typischer SiSEV ist ein Bauelement mit zwei Anschlüssen und einer Fläche zwischen 1 und 50 mm2 , das zwischen Hundert und Tausend Si-SPAD mit einer Fläche von jeweils 102 bis 104 μm2 enthält. Typische Bauelemente weisen Verstärkungen im Bereich 𝐺 ≈ 106 und Gesamtabklingzeiten 𝜏 ≈ 100 ns auf. SiSEV werden in der medizinischen Bildgebung, der Quantenoptik, der Astrophysik und der Hochenergiephysik eingesetzt. Vergleich von SiSEV und SEV
Da SiSEV und gewöhnliche (Röhren-) SEV ähnliche Funktionen erfüllen, erscheint es sinnvoll, ihre jeweiligen Vor- und Nachteile gegenüberzustellen: Vorteile von SiSEV gegenüber Röhren-SEV:
Silicium-Sekundärelektronenvervielfacher (SiSEV)
Obwohl eine einzelne SPAD nicht zwischen dem Nachweis eines einzelnen Photons und mehrerer Photonen unterscheiden kann, kann durch Verwendung mehrerer SPAD eine Auflösung der Photonenzahl ermöglicht werden. Eine Anordnung verwendet dazu eine Kaskade von Strahlteilern mit geeignet gewählten Verzögerungen, die einen Mehrphotonenpuls zeitlich so strecken, dass die einzelnen Photonen separat erfasst werden können. Eine andere Möglichkeit ist, den Mehrphotonenpuls räumlich aufzufächern, sodass er ein Array von SPAD so ausleuchtet, dass jedes Photon auf einer eigenen Diode registriert wird (ähnlich wie bei einer Mikrokanalplatte). Ein Silicium-Sekundärelektronenvervielfacher (SiSEV oder SiPM) ist ein räumlich ausgedehntes Array von Si-SPAD, in dem ein Löschwiderstand in Reihe mit jeder SPAD geschaltet ist und das summierte Ausgangssignal einem Verstärker zugeführt wird. Die Funktionsweise dieses Bauelements ahmt die des menschlichen skotopischen (Nacht-) Sehens nach. Die einzelnen SPAD entsprechen in diesem Bild den Stäbchen auf der Netzhaut und der Summenschaltkreis entspricht der zugehörigen Ganglienzelle der Netzhaut. Ein solches Schema zur Auflösung der Photonenzahl erfordert eine ausreichende Anzahl von einzelnen Dioden, um die Wahrscheinlichkeit zu reduzieren, dass zwei oder mehr Photonen in einer einzelnen Diode absorbiert werden. Systeme dieser Art besitzen eine Reihe von vorteilhaften Eigenschaften: • Unempfindlichkeit gegen Totzeiten der einzelnen Elemente • Vergrößerter lichtempfindlicher Bereich • Fähigkeit zur Auflösung von Photonenzahlen • Hohe Empfindlichkeit und Verstärkung
• Kleinere Betriebsspannung (einige 10 V) • Höhere räumliche Auflösung • Hervorragendes Auflösungsvermögen für Photonenzahlen • Kompaktere Abmessungen • Robustere Konstruktion • Geringere Kosten • Unempfindlichkeit gegen Magnetfelder (kann daher auch in MRT- und PET-Scannern verwendet werden) • Keine Hysterese • Kompatibilität mit der Halbleitertechnologie Nachteile von SiSEV gegenüber SEV:
• Betrieb ist auf den Spektralbereich von 300–900 nm beschränkt • Geringere Verstärkung • Größere Antwortzeit • Höhere Dunkelzählrate • Geringere Empfindlichkeit für kleine Photonenflüsse • Höherer Zusatzrauschfaktor (aufgrund von Übersprechen zwischen den einzelnen Elementen) • Kleinerer Dynamikbereich • Kleinere lichtempfindliche Bereiche (obwohl auch monolithische SiSEV-Arrays verfügbar sind) • Höhere Empfindlichkeit gegenüber Temperaturschwankungen • Höhere Anfälligkeit für Schäden durch ionisierende Strahlung SiSEV und klassische Röhren-SEV ergänzen sich somit im Hinblick auf die Einzelphotonen- bzw. photonenzahlaufgelöste Detektion. Die Auswahl des Bauelements hängt folglich von der beabsichtigten Verwendung und den geforderten Betriebsbedingungen ab.
19.5 Arraydetektoren
CMOS-integrierte SiSEV
Die Leistung von SiSEV kann erheblich gesteigert werden, wenn man die einzelnen Bestandteile mithilfe der CMOS-Technologie gemeinsam mit den zugehörigen Schaltkreisen auf demselben Siliciumsubstrat integriert. Die Kompaktheit der so entstehenden Strukturen verringert die Reaktionszeit und den Jitter und führt somit zu schnelleren Bauelementen. Es wurden auch digitale SiSEV entwickelt, die eine direkte Pulszählung auf der Basis einer digitalen Auslesung ermöglichen. Ähnlich wie ihre analogen Gegenstücke liefern diese Bauelemente, die manchmal als digitale Photonenzähler bezeichnet werden, eine Summenausgabe. Supraleitende Einzelphotonendetektoren
Einzelphotonendetektion und photonenzahlaufgelöste Detektion können auch unter Verwendung von supraleitenden Einzelphotonendetektoren (SSPD, von engl. superconducting single-photon detector) wie dem Transition-Edge-Sensor (TES) erreicht werden. Ein TES verhält sich bei seiner kritischen Temperatur der Supraleitung wie ein Mikrobolometer, in dem die Absorption eines Photons zu einer starken temperaturbedingten Widerstandsänderung führt. Dies ermöglicht eine genaue Messung der Energie einer beliebigen Anzahl absorbierter Photonen, wodurch eine hochaufgelöste Messung der Photonenzahl möglich wird. TESBauelemente können aus Systemen wie Wolfram auf Silicium oder NbN auf Saphir hergestellt werden und sind vom Infrarot bis in den Röntgenbereich einsetzbar. Sie weisen typischerweise einen Jitter von 100 ns, Bandbreiten von 100 kHz, vernachlässigbare Dunkelzählraten und Nachweiswirkungsgrade von mehr als 90 % auf, wenn sie in geeignete optische Kavitäten eingebettet sind. Ihr praktischer Einsatz wird durch den erforderlichen Betrieb bei Kryotemperaturen und ihre kleinen aktiven Regionen erschwert. In einem Setup werden photolithographisch strukturierte, 40 nm dicke Wolframschichten auf einem SiSubstrat abgeschieden, um einen TES mit Abmessungen von 25 μm × 25 μm herzustellen. Das Substrat wird auf ungefähr 60 mK gekühlt, etwa die Hälfte der Temperatur des Übergangs zwischen Supra- und Normalleitung von 100 mK. Die Übergangsbreite beträgt etwa 1 mK. Eine Vorspannung über der dünnen Schicht stabilisiert die Temperatur im Übergangsbereich durch joulesche Wärme. Ein einfallendes Photon, das von der Wolframschicht absorbiert wird, erhöht dessen elektronische Temperatur und damit seinen Widerstand. Das Integral der damit verbundenen Abnahme des Stroms über die Zeit multipliziert mit der Vorspannung ergibt die gesamte photoelektrische Energie, die die Schicht inner-
halb ihrer (langsamen) thermischen Relaxationszeit von 15 μs absorbiert hat. Für Licht einer gegebenen Wellenlänge wird die Anzahl der innerhalb der thermischen Relaxationszeit absorbierten Photonen bestimmt, indem die in dieser Zeit auf den Detektor übertragene Gesamtenergie ermittelt wird. Das Signal wird unter Verwendung eines SQUID-Arrays aus dem Detektor ausgelesen.
19.5 Arraydetektoren Ein einzelner Photodetektor registriert den auf ihn auftreffenden Photonenfluss als Funktion der Zeit. Im Gegensatz dazu kann eine Anordnung einer großen Zahl von Photodetektoren gleichzeitig die Photonenflüsse (als Funktionen der Zeit) an vielen Punkten im Raum registrieren. Arraydetektoren können daher elektronische Versionen von optischen Bildern erzeugen. Eine Art von Arraydetektor hatten wir bereits besprochen, die Mikrokanalplatte [siehe Abb. 19.2(c)]. Die moderne Mikroelektronik erlaubt die Herstellung von vielen Arten von Arrays. Sie enthalten zahlreiche Photodetektorelemente, die als Pixel bezeichnet werden und aus Photoleitern, Photodioden, Lawinenphotodioden oder thermischen Detektoren wie Bolometern bestehen. Eine zweidimensionale Anordnung von lichtempfindlichen Elementen, die zur Registrierung eines elektronischen Bildes in der Brennebene eines bildgebenden Systems dient, wird als Brennebenenarray (FPA, von engl. focal-plane array) bezeichnet.
19.5.1 Photodetektoren Die einzelnen Pixel in Arraydetektoren können in vielen Varianten realisiert werden, wie die folgenden Beispiele zeigen: • Mikrobolometerarrays werden häufig in Thermokameras verwendet. Einfallende Photonen bewirken eine Temperaturzunahme der beleuchteten Elemente; die begleitende Widerstandsänderung wird durch die Elektronik registriert. Diese Bauelemente arbeiten bei normalen Temperaturen und haben in den letzten Jahren große Fortschritte im Hinblick auf Auflösung und Empfindlichkeit erlebt. Mikrobolometerarrays aus Vanadiumoxid enthalten Hunderttausende von Pixeln mit einer Größe von jeweils ≈ 25 μm, die im mittleren IR empfindlich sind. Solche Bauelemente kommen in militärischen und kommerziellen Anwendungen zum Einsatz. • Photoleiterarrays werden normalerweise im mittleren IR verwendet. Ein Photon, dessen Energie größer
679
680
19 Photodetektoren
•
•
•
•
•
•
•
ist als die Bandlücke eines Halbleiters wie InSb oder HgCdTe, erzeugt ein Elektron-Loch-Paar, das zur Leitfähigkeit des Materials beiträgt. Arrays aus extrinsischen Halbleitern wie Ge:Ga sind zur Herstellung von photoleitenden Brennebenenarrays nützlich, die im fernen Infrarot empfindlich sind. Ein Photon regt ein Donorelektron ins Leitungsband (oder ein Akzeptorloch ins Valenzband) an, das anschließend zur Leitfähigkeit beitragen kann. Quantenschicht-Infrarotphotodetektoren werden in Brennebenenarrays mit einigen Millionen Pixeln verwendet. Ein Photon setzt ein Elektron aus einer Quantenschicht frei, sodass es zur Leitfähigkeit beitragen kann. Bauelemente aus GaAs/AlGaAs und GaAs/ InGaAs/AlGaAs ermöglichen Abbildungen im mittleren und fernen IR. pin-Photodiodenarrays aus Verbindungshalbleitern wie InGaAs und HgCdTe werden im Sichtbaren und IR verwendet. Ein Photon, dessen Energie größer ist als die Bandlücke, erzeugt ein Elektron-Loch-Paar, das zum Diodenstrom beiträgt. Schottky-Photodioden aus Metall/Halbleiter-Übergängen werden häufig in Brennebenenarrays verwendet. Ein Photon, dessen Energie größer ist als die Schottkybarriere, erzeugt ein Elektron-Loch-Paar, das zum Diodenstrom beiträgt. PtSi kann für bildgebende Anwendungen in vielen Spektralbereichen verwendet werden, da es für ein breites Band von Wellenlängen vom nahen UV bis ungefähr 6 μm im mittleren IR empfindlich ist. Zwar besitzt es im IR eine geringe Quantenausbeute, ist jedoch einfach herzustellen und sehr stabil. Lawinenphotodioden-Detektoren aus pn-Übergängen mit Verstärkungsregionen werden ebenfalls in Form von Arraydetektoren gefertigt. Ein Photon mit einer Energie größer als die Bandlücke erzeugt ein Elektron-Loch-Paar, das in einen Bereich des Halbleiters mit hoher Feldstärke eintritt und dort verstärkt wird. Der resultierende elektrische Subnanosekundenpuls hat eine Amplitude von mehreren Volt, die ausreicht, um die digitale CMOS-Schaltung direkt anzusteuern, sodass keine analog/digital-Wandlung nötig ist. Einzelphotonen-Lawinendetektoren (SPAD) aus pnÜbergängen, die in Sperrrichtung gepolt sind, verwenden Verstärkerregionen im Geigermodus. Ein Photon mit einer Energie größer als die Bandlücke erzeugt ein Elektron-Loch-Paar, das in das Halbleitergebiet mit hohem Feld eintritt und dabei die Lawine auslöst und einen großen Strompuls verursacht. Es wurden auch SPAD-Arrays entwickelt, in denen die einzelnen SPAD-Signale individuell ausgelesen wer-
den können, aber auch das gesamte Array mit einer Auflösung im Pikosekundenbereich. Derartige Bauelemente sind mit aktiver Löschung, pixelinterner Signalverarbeitung und AD-Wandlung erhältlich. Arrays mit Time-to-Digital-Konverter ermöglichen über die zeitaufgelöste Detektion eine dreidimensionale Einzelphotonen-Bildgebung. • Lichtempfindliche Arrays können auch als Heterodyndetektoren betrieben werden; der Konversionsgewinn wird durch einen lokalen Oszillator geliefert (siehe Abschnitt 25.5).
19.5.2
Ausleseelektronik
Zum Auslesen der Signale der Photodetektoren werden im Wesentlichen zwei Arten von Schaltungen verwendet: die CCD- (engl. charge-coupled device) und die CMOS-Technik (engl. complementary metal oxide semiconductor). CCD-Technologie
In einem CCD wird die von einem bestimmten Detektorelement aus absorbierten Photonen erzeugte Ladung zunächst in lokalen Potentialtöpfen gespeichert. Sie wird dann zu einem festgelegten Zeitpunkt über einen vergrabenen CCD-Kanal, der als Schieberegister fungiert, sequentiell von einer Detektorposition zur nächsten übertragen, bis sie an einer Kante des Chips ankommt, wo sie ausgelesen wird. Viele Elektrodenstrukturen und Zeitraster wurden entwickelt, um die von jedem Element aufgebaute Ladung periodisch auszulesen und den elektronischen Datenstrom zu erzeugen, der das Bild beschreibt. CCD-Systeme sind in der Regel komplexer als CMOS-Systeme, erfordern eine größere elektrische Leistung und sind langsamer auslesbar. Sie werden jedoch in wissenschaftlichen und medizinischen Anwendungen, bei denen eine qualitativ hochwertige Bildgebung erforderlich ist, sehr häufig eingesetzt. Eine Variation der CCD ist das ICCD (engl. intensified charge-coupled device), bei dem ein vor dem CCD angeordneter Mikrokanalplatten-Bildverstärker (Abschnitt 19.1.1) verwendet wird. Eine weitere Variante ist das Elektronenvervielfachungs-CCD (EMCCD), in dem kurz vor dem Auslesen ein zusätzliches serielles Hochspannungs-Elektronenvervielfachungsregister zum Einsatz kommt, das mehrere hundert Elektroden enthält und über Sekundäremission einen Gewinn von mehreren tausend liefern kann. ICCD und EMCCD besitzen eine vergleichbare Leistungsfähigkeit, obwohl jedes Verfahren sein eigenen Vorzüge hat. Vor kurzem konnte sogar eine Einzelphotonen- und Einzelelektronendetektion demonstriert werden, indem
19.6 Rauschen in Photodetektoren
ein Si-basiertes „Skipper-CCD“ verwendet wurde, welches das Ausleserauschen durch mehrfaches Abtasten der Ladung jedes Pixels verringert. 8) CMOS-Technologie
Der Begriff komplementäre Metalloxidhalbleiter (CMOS) bezeichnet eine weit verwendete Produktionstechnik zur Herstellung elektronischer Bauelemente und integrierter Schaltungen. Weil derartige Bauelemente wenig Leistung aufnehmen und relativ billig sind, hat diese Technik die Massenfertigung von Brennebenenarrays vorangetrieben; dabei können lichtempfindliche Gruppe-IV-Detektoren direkt in die Ausleseelektronik integriert werden. Jedes Detektorelement ist dabei direkt mit mehreren Metalloxidhalbleiter-Feldeffekttransistoren (MOSFET, engl. metal oxide semiconductor field-effect transistor) verbunden, die das Signal verstärken und auslesen. Im Gegensatz zu der sequentiellen Auslese in CCD werden die Detektorelemente in einem CMOS-Array parallel ausgelesen, was einen wesentlichen Geschwindigkeitsvorteil bedeutet. Eine neuere Variante der CMOS-Technologie ist das „scientific CMOS“ (sCMOS), bei dem ein moderneres Ausleseverfahren zum Einsatz kommt, das einen größeren Bildbereich, eine höhere Bildrate, einen größeren Dynamikbereich, eine höhere Quantenausbeute und ein geringeres Ausleserauschen bietet. sCMOS- und EMCCD-Geräte bieten vergleichbare Leistungen; die Wahl hängt letztlich von der jeweiligen Anwendung ab. Bei extrem schwachen Lichtverhältnissen (< 100 Photonen/Pixel) und ohne Hintergrundrauschen sind EMCCD-Sensoren in der Regel überlegen. Vor kurzem wurden auch MegapixelBildsensoren mit Photonenzahlauflösung entwickelt, die ohne Kühlung oder Lawinenverstärkung arbeiten. 9)
19.6 Rauschen in Photodetektoren Ein Photodetektor reagiert auf einen Photonenfluss (oder eine optische Leistung). Nach Gl. (19.4) verursacht ein Photonenfluss 𝛷 (der optischen Leistung P = ℎ𝜈𝛷) einen proportionalen elektrischen Strom 𝑖P = 𝜂𝑒𝛷 = ℛP . In Wirklichkeit ist der im Bauelement erzeugte elektrische Strom jedoch eine stochastische Größe 𝑖, deren Wert um ihren Mittelwert 𝚤̄ ≡ 𝑖P = 𝜂𝑒𝛷 = ℛP fluktuiert. Die 8) Siehe J. Tiffenberg, M. Sofo-Haro, A. Drlica-Wagner, R. Essig, Y. Guardincerri, S. Holland, T. Volansky, T.-T. Yu, ‚Single-Electron and Single-Photon Sensitivity with a Silicon Skipper CCD‘, Physical Review Letters 119, 131802, 2017. 9) Siehe J. Ma, S. Masoodian, D. A. Starkey, E. R. Fossum, ‚Photon-Number-Resolving Megapixel Image Sensor at Room Temperature Without Avalanche Gain‘, Optica 4, 1474–1481, 2017.
Fluktuationen von 𝑖, die meist als Rauschen angesehen werden, werden durch die Standardabweichung 𝜎𝑖 des Stroms charakterisiert, wobei 𝜎𝑖2 = ⟨(𝑖 − 𝚤̄)2 ⟩ ist. Für eine mittleren Strom von null (̄𝚤 = 0) reduziert sich die Standardabweichung auf den Effektivwert des Stroms, 1∕2
𝜎𝑖 = ⟨𝑖 2 ⟩ . Der Prozess der Photonendetektion enthält mehrere grundsätzliche Quellen von Rauschen: Die grundsätzlichste Quelle des Rauschens sind die zufälligen Ankunftszeiten der Photonen selbst, die gewöhnlich durch eine Poissonstatistik beschrieben werden, wie in Abschnitt 13.2.3 diskutiert. Photoelektronenrauschen. In einem Photodetektor mit der Quantenausbeute 𝜂 < 1 erzeugt ein einzelnes Photon mit einer Wahrscheinlichkeit 𝜂 ein Photoelektron-Loch-Paar, während mit einer Wahrscheinlichkeit 1 − 𝜂 nichts passiert. Weil der Prozess der Erzeugung von Ladungsträgerpaaren stochastisch ist, ist er eine Quelle von Rauschen, wie in Abschnitt 13.2.4 erläutert wurde. Gewinnrauschen. Der Verstärkungsprozess, der in bestimmten Photodetektoren wie z. B. Photoleitern und Lawinenphotodioden inneren Gewinn liefert, ist stochastisch. Jedes detektierte Photon erzeugt eine zufällige Zahl 𝐺 von Ladungsträgern mit einem Mittelwert 𝐺. Die Fluktuation des Gewinns hängen von der Natur des Verstärkungsprozesses ab, wie wir in Abschnitt 19.6.2 genauer untersuchen werden. Rauschen der Empfängerschaltung. Verschiedene Komponenten in der Elektronik eines optischen Empfängers, wie Widerstände und Transistoren, tragen zum Rauschen der Empfängerschaltung bei. Photonenrauschen.
Diese vier Quellen des Rauschens sind in Abb. 19.29 schematisch illustriert. Das mittlere Signal, das in den Detektor eintritt (optisches Eingangssignal), enthält ein zugehöriges intrinsisches Photonenrauschen. Der Photoeffekt wandelt die Photonen in Photoelektronen um. Dabei nimmt das mittlere Signal um den Faktor 𝜂 (die Quantenausbeute) ab. Das zugehörige Photoelektronenrauschen nimmt ebenfalls ab, aber um einen kleineren Betrag als das Signal; folglich ist das Signal/RauschVerhältnis des Photoelektronensignals kleiner als das des einfallenden Photonensignals. Das Schaltungsrauschen trägt zum registrierten Signal bei. Wenn im Photodetektor ein Gewinnmechanismus vorliegt, verstärkt er sowohl das Photoelektronensignal als auch das Rauschen. Außerdem führt er sein eigenes Gewinnrauschen ein. Schließlich kommt bei der Registrierung des Stroms noch das Schaltungsrauschen hinzu.
681
682
19 Photodetektoren
PhotoelektronenSchaltungsrauschen rauschen Photonenrauschen
optisches Eingangssignal
Photonenrauschen
registriertes Signal
optisches Eingangssignal
Gewinn
registriertes Signal
Abb. 19.29 Eingangssignal und registriertes Signal mit verschiedenen Quellen des Rauschens für einen Photodetektor (a) ohne Gewinn wie z. B. eine pinPhotodiode und (b) mit Gewinn wie eine Lawinenphotodiode.
Photoeffekt
Photoeffekt und Stromsammlung (a)
PhotoelektronenSchaltungsrauschen rauschen Gewinnrauschen
(b)
Als Komponente in einem Informationsübertragungssystem wird ein optischer Empfänger durch die folgenden Leistungsparameter charakterisiert: Das Signal/Rausch-Verhältnis (SRV) einer stochastischen
Variable ist als das Verhältnis ihres mittleren Quadrats zu ihrer Varianz definiert. Folglich ist das SRV des Stroms 𝑖 gleich 𝚤̄2 ∕𝜎𝑖2 , wohingegen das SRV der Photonenzahl n2 ∕𝜎n2 . Die Nachweisgrenze ist das mittlere Signal, das ein Signal/Rausch-Verhältnis von eins gibt. Insbesondere ist die äquivalente Rauschleistung (NEP, von engl. noise-equivalent power) die Signalleistung, die bei einer Bandbreite von 1 Hz ein Signal/RauschVerhältnis von eins liefert. Die spezifische Detektivität 𝐷 ∗ ist der Kehrwert der auf die Wurzel aus der Detektorfläche und der Bandbreite normierten äquivalenten Rauschleistung. Der Zusatzrauschfaktor F einer stochastischen Variable ist das Verhältnis ihres mittleren Quadrats zum Quadrat ihres Mittelwerts. Der Zusatzrauschfaktor des Gewinns 𝐺 eines Photodetektors ist somit 𝐹 = ⟨𝐺 2 ⟩∕⟨𝐺⟩2 . Die Empfängerempfindlichkeit ist für ein analoges System als das Signal definiert, für das ein vorgegebener Wert des Signal/Rausch-Verhältnisses erreicht wird, SRV = SRV0 . Während die Nachweisgrenze einer Empfängerempfindlichkeit entspricht, die SRV0 = 1 ergibt, wird häufig ein höherer Wert von SRV0 gefordert, um ein gegebenes Niveau der Genauigkeit sicherzustellen (z. B. SRV0 = 103 entsprechend 30 dB). Für ein digitales System ist die Empfängerempfindlichkeit als die minimale optische Energie (oder entsprechende mittlere Zahl von Photonen) pro Bit definiert, die erforderlich ist, um eine vorgeschriebene Bitfehlerrate zu erreichen, oft 10−9 . Die Bitfehlerrate ist die Wahrscheinlichkeit eines Fehlers pro Bit in einem digitalen optischen Empfänger.
Stromsammlung
Wir beginnen, indem wir Ausdrücke für das Signal/ Rausch-Verhältnis (und einige der anderen genannten Größen) für optische Detektoren mit diesen vier Rauschquellen herleiten. Andere Rauschquellen, die wir nicht explizit betrachten, sind z. B. Hintergrundrauschen und Dunkelstromrauschen. Hintergrundrauschen ist Photonenrauschen aufgrund von Licht aus irrelevanten optischen Quellen, das den Detektor erreicht (dazu gehören alle Quellen außer dem interessierenden Signal, z. B. Sonnenlicht und Sternenlicht). Hintergrundrauschen stört vor allem in Detektorsystemen im mittleren und fernen Infrarot, weil viele Gegenstände bei Zimmertemperatur in diesen Wellenlängenbereichen abstrahlen (siehe Abb. 14.31). Photodetektoren erzeugen auch Dunkelstromrauschen, das – wie der Name schon andeutet – sogar ohne Licht vorhanden ist. Dunkelstromrauschen entsteht durch thermisch oder durch Tunneln zufällig erzeugte Elektron-Loch-Paare. Des weiteren vernachlässigen wir Leckströme und 1∕𝑓Rauschen.
19.6.1
Photoelektronenrauschen
Photonenrauschen
Wie in Abschnitt 13.2 beschrieben ist der Photonenfluss einer konstanten optischen Leistung P inhärent unsicher. Der mittlere Photonenfluss ist 𝛷 = P ∕ℎ𝜈 (Photonen/s), aber diese Größe fluktuiert zufällig nach einem Wahrscheinlichkeitsgesetz, das von der Art der Lichtquelle abhängt. Die Zahl n der in einem Zeitintervall T registrierten Photonen ist daher stochastisch mit dem Mittelwert n = 𝛷 T . Für Licht aus einem idealen Laser oder einer thermischen Quelle mit einer spektralen Breite viel größer als 1∕T gehorcht die Photonenzahl einer Poissonverteilung, für die 𝜎n2 = n gilt. Folglich bedeuten die Fluktuationen bei einem Mittelwert von 100 Photonen eine tatsächliche Zahl von Photonen, die in etwa in dem Bereich 100 ± 10 liegt.
19.6 Rauschen in Photodetektoren
Das Signal/Rausch-Verhältnis SRV = n2 ∕𝜎n2 der Photonenzahl ist daher SRV = n
(19.31)
und die Nachweisgrenze der Photonenzahl ist n = 1 Photon. Für eine Beobachtungszeit T = 1 μs und eine Wellenlänge 𝜆0 = 1.24 μm entspricht das einer Nachweisgrenze der Leistung von 0.16 pW. Die Empfängerempfindlichkeit für SRV0 = 103 (30 dB) beträgt 1000 Photonen. Für ein Zeitintervall T = 10 ns entspricht das einer Empfindlichkeit von 1011 Photonen pro Sekunde oder einer Empfindlichkeit der optischen Leistung von 16 nW bei 𝜆0 = 1.24 μm. Photoelektronenrauschen
Ein auf einen Photodetektor mit der Quantenausbeute 𝜂 einfallendes Photon erzeugt mit der Wahrscheinlichkeit 𝜂 ein Ereignis (d. h. es erzeugt ein ElektronLoch-Paar oder setzt ein Photoelektron frei), oder es bewirkt mit der Wahrscheinlichkeit 1 − 𝜂 nichts. Wir nehmen an, dass Ereignisse für zufällige aus dem Photonenstrom ausgewählte Photonen stattfinden. Ein einfallender mittlerer Photonenfluss 𝛷 (Photonen/s) erzeugt daher einen mittleren Photoelektronenfluss 𝜂𝛷 (Photoelektronen/s). Die Zahl m der im Zeitintervall T entdeckten Photoelektronen ist eine stochastische Variable mit dem Mittelwert m = 𝜂n ,
(19.32)
wobei n = 𝛷 T die mittlere Zahl einfallender Photonen in demselben Zeitintervall T ist. Wenn die Photonenzahl poissonverteilt ist, gilt das auch für die Photoelektronenzahl, wie eine zu der in Abschnitt 13.2.4 verwendeten analoge Argumentation zeigt. Hieraus folgt für die Varianz m der Photoelektronenzahl 𝜎m2 = m = 𝜂n .
(19.33)
Offensichtlich sind Photoelektronenrauschen und Photonenrauschen nicht additiv. Photonen
elektrischer Strom i(t) (Schrotrauschen)
SRV = m = 𝜂n .
τp
(19.34)
Die Nachweisgrenze der Photoelektronenzahl ist m = 𝜂n = 1 Photoelektron entsprechend 1∕𝜂 Photonen. Die Empfängerempfindlichkeit für SRV0 = 103 beträgt 1000 Photoelektronen oder 1000∕𝜂 Photonen. Photostromrauschen
Wir untersuchen jetzt die Eigenschaften des elektrischen Stroms 𝑖(𝑡), der durch einen stochastischen Photoelektronenfluss mit dem Mittel 𝜂𝛷 in einem Stromkreis induziert wird. Dabei berücksichtigen wir den Einfluss des Photonenrauschens, des Photoelektronenrauschens und der charakteristischen Zeitantwort des Detektors und der Elektronik (Filterung). Jedes PhotoelektronenLoch-Paar erzeugt im äußeren Stromkreis des Photodetektors einen elektrischen Strompuls mit der Ladung (Fläche) 𝑒 und der Dauer 𝜏P (Abb. 19.30). Ein auf einen Photodetektor einfallender Photonenstrom erzeugt daher einen Strom von Strompulsen, die zusammen den Photostrom 𝑖(𝑡) bilden; die Zufälligkeit des Photonenstroms wird in einen fluktuierenden elektrischen Strom umgewandelt. Wenn die einfallenden Photonen poissonverteilt sind, werden diese Fluktuationen als Schrotrauschen bezeichnet. Allgemein ist die in jedem Puls erzeugte Ladung für Detektoren mit dem Gewinn 𝐺 gleich 𝑞 = 𝐺𝑒. Bevor wir eine analytische Herleitung der Eigenschaften des Photostroms 𝑖(𝑡) geben, betrachten wir die Aufgabenstellung zuerst aus einer vereinfachten Perspektive. Wir betrachten einen auf einen photoelektrischen Detektor mit der Quantenausbeute 𝜂 einfallenden Photonenfluss 𝛷. Die zufällige Zahl m der innerhalb eines charakteristischen Zeitintervalls T = 1∕2𝐵 (der zeitlichen Auflösung der Schaltung) registrierten Photot
Photoelektronen Strompulse
Die grundlegende der Photonenzahl innewohnende Zufälligkeit, die eine fundamentale Rauschquelle ist, mit der wir es immer zu tun haben, wenn wir ein Signal mithilfe von Licht übertragen wollen, verursacht daher ein Signal/Rausch-Verhältnis der Photoelektronenzahl von
t Fläche e t
i (t) t
Abb. 19.30 Der im Stromkreis eines Photodetektors induzierte Photostrom besteht aus einer Superposition von Strompulsen, von denen jeder einem nachgewiesenen Photon entspricht. Die einzelnen gezeigten Pulse sind exponentiell abklingende Stufenfunktionen, sie können jedoch eine beliebige Form annehmen [siehe z. B. Abb. 19.6(b) und 19.7]. Die Überlagerung der einzelnen Strompulse ergibt das Schrotrauschen.
683
684
19 Photodetektoren
elektronen erzeugen einen Photostrom 𝑖(𝑡), wobei 𝑡 der Zeitpunkt unmittelbar nach dem Intervall T ist. Für rechteckige Strompulse der Dauer T sind die stochastischen Variablen des Stroms und der Photoelektronenzahl durch 𝑖 = (𝑒∕T )m verknüpft. Mittelwert und Varianz des Photostroms sind daher 𝚤̄ =
𝑒 T
m,
(19.35)
2
𝑒 𝜎𝑖2 = ( ) 𝜎m2 , T
(19.36)
wobei m = 𝜂𝛷 T = 𝜂𝛷∕2𝐵 die mittlere Zahl der im Intervall T = 1∕2𝐵 nachgewiesenen Photoelektronen ist. Wenn wir 𝜎m2 = m in die Poissonverteilung einsetzen, erhalten wir für Mittelwert und Varianz des Photostroms 𝚤̄ = 𝑒𝜂𝛷 , 𝜎𝑖2
= 2𝑒̄𝚤𝐵 .
𝑙
wobei 𝑋𝑖 mit dem Wahrscheinlichkeit 𝑝 den Wert eins annimmt und mit der Wahrscheinlichkeit 1 − 𝑝 null ist. Die Variablen {𝑋𝑙 } sind unabhängig. Der Mittelwert von 𝑋𝑙 ist 0 × (1 − 𝑝) + 1 × 𝑝 = 𝑝. Sein mittleres Quadrat ist ⟨𝑋𝑙2 ⟩ = 02 × (1 − 𝑝) + 12 × 𝑝 = 𝑝. Der Mittelwert des Produkts 𝑋𝑙 𝑋𝑘 ist 𝑝2 für 𝑙 ≠ 𝑘 und 𝑝 für 𝑙 = 𝑘. Nun bestimmen wir die Mittelwerte und mittleren Quadrate von 𝑖(𝑡), ∑
𝚤̄ = ⟨𝑖⟩ = (19.37) (19.38)
Daraus folgt für das Signal/Rausch-Verhältnis 𝚤̄2 ∕𝜎𝑖2 des photoelektrischen Stroms 𝜂𝛷 𝚤̄ = =m. SRV = 2𝑒𝐵 2𝐵
valle Δ𝑡, dass die Wahrscheinlichkeit 𝑝, dass ein Ereignis in ein Intervall fällt, gleich 𝑝 = 𝜂𝛷Δ𝑡 ist. Den elektrischen Strom 𝑖 zur Zeit 𝑡 schreiben wir als ∑ 𝑖(𝑡) = 𝑋𝑙 ℎ(𝑡 − 𝑙Δ𝑡) , (19.40)
(19.39)
Das Signal/Rausch-Verhältnis des Stroms ist direkt proportional zum Photonenfluss 𝛷 und umgekehrt proportional zur elektrischen Bandbreite 𝐵 der Schaltung. Das Ergebnis ist wie erwartet identisch mit dem Signal/ Rausch-Verhältnis m der Photoelektronenzahl, da der Stromkreis keine zusätzliche Zufälligkeit einführt.
𝑝 ℎ(𝑡 − 𝑙Δ𝑡) ,
(19.41)
𝑙
⟨𝑖 2 ⟩ =
∑∑ ⟨𝑋𝑙 𝑋𝑘 ⟩ ℎ(𝑡 − 𝑙Δ𝑡) ℎ(𝑡 − 𝑘Δ𝑡) 𝑙
=
𝑘
∑∑
𝑝2 ℎ(𝑡 − 𝑙Δ𝑡) ℎ(𝑡 − 𝑘Δ𝑡)
𝑙≠𝑘
+
∑
𝑝 ℎ2 (𝑡 − 𝑙Δ𝑡) .
(19.42)
𝑙
Wenn wir 𝑝 = 𝜂𝛷Δ𝑡 einsetzen und den Grenzfall Δ𝑡 → 0 betrachten, sodass aus den Summen Integrale werden, ergeben die Gln. (19.41) bzw. (19.42) ∞
𝚤̄ = 𝜂𝛷 ∫ ℎ(𝑡) d𝑡 = 𝑒𝜂𝛷 ,
(19.43)
0 ∞
Beispiel 19-9: Signal/Rausch-Verhältnis und Empfängerempfindlichkeit
Für 𝚤̄ = 10 nA und 𝐵 = 100 MHz ist 𝜎𝑖 ≈ 0.57 nA entsprechend einem Signal/Rausch-Verhältnis von 310 oder 25 dB, d. h. in jedem Zeitintervall T = 1∕2𝐵 = 5 ns werden im Mittel 310 Photoelektronen nachgewiesen. Die Nachweisgrenze des Photonenflusses ist 𝛷 = 2𝐵∕𝜂, und die Empfängerempfindlichkeit für SRV0 = 103 ist 𝛷 = 1000 ⋅ (2𝐵∕𝜂) = 2 × 1011 ∕𝜂 Photonen/s.
⟨𝑖 2 ⟩ = (𝑒𝜂𝛷)2 + 𝜂𝛷 ∫ ℎ2 (𝑡) d𝑡 . 0
Daraus folgt ∞
𝜎𝑖2 = ⟨𝑖 2 ⟩ − ⟨𝑖⟩2 = 𝜂𝛷 ∫ ℎ2 (𝑡) d𝑡 .
Als Nächstes wollen wir die Gln. (19.37) und (19.38) für den allgemeinen Fall beweisen. Dazu nehmen wir an, dass ein Ereignis bei 𝑡 = 0 in dem äußeren Stromkreis einen elektrischen Puls ℎ(𝑡) der Fläche 𝑒 produziert. Ein Ereignis bei 𝑡1 erzeugt dann einen zeitlich versetzten Puls ℎ(𝑡 − 𝑡1 ). Wir teilen die Zeitachse so in Inter-
(19.45)
0
Mit der Definition ∞
Herleitung: Mittelwert und Varianz des Photostroms
(19.44)
∞
∫0 ℎ2 (𝑡) d𝑡 1 𝐵 = 2 ∫ ℎ2 (𝑡) d𝑡 = [ ]2 ∞ 2𝑒 2 ∫0 ℎ(𝑡) d𝑡 0
(19.46)
erhalten wir schließlich die Gln. (19.37) und (19.38). Der durch Gl. (19.46) definierte Parameter 𝐵 bezeichnet die Bandbreite des Bauelements bzw. der Schaltung. Das ist leicht einzusehen, wenn man berücksichtigt, dass die Fouriertransformierte von ℎ(𝑡) ihre Übertragungsfunk-
19.6 Rauschen in Photodetektoren
tion H(𝜈) ist. Die Fläche unter ℎ(𝑡) ist einfach H(0) = 𝑒. Nach dem Theorem von Parseval [siehe Gl. (A.7)] ist die Fläche unter ℎ2 (𝑡) gleich der Fläche unter der symmetrischen Funktion |H(𝜈)|2 ; daher gilt ∞
|| H(𝜈) ||2 || d𝜈 . 𝐵 = ∫ ||| || H(0) |||
Der Größe 𝐵 ist daher nach Gl. (A.17) die spektrale Leistungsbreite der Funktion |H(𝜈)| (d. h. die Bandbreite der Kombination aus Bauelement und Schaltung). Wenn z. B. H(𝜈) = 1 für −𝜈k < 𝜈 < 𝜈k und ansonsten 0 ist, ergibt Gl. (19.47) 𝐵 = 𝜈k . Diese Beziehungen sind für alle photoelektrischen Detektorbauelemente ohne Gewinn anwendbar (z. B. Photoröhren und Flächenphotodioden). Um die Gleichungen einsetzen zu können, müssen die Bandbreiten des Bauelements, der Schaltung und des Verstärkers bekannt sein; 𝐵 wird dann bestimmt, indem man die Übertragungsfunktion des Gesamtsystems in Gl. (19.47) einsetzt.
19.6.2 Gewinnrauschen Deterministischer Gewinn
Mittelwert und Varianz des Photostroms für ein Bauelement mit dem deterministischen (konstanten) Gewinn 𝐺 werden bestimmt, indem man 𝑒 in den Gln. (19.37) und (19.38) durch 𝑞 = 𝐺𝑒 ersetzt; das ergibt 𝑒𝐺𝜂P , ℎ𝜈 𝜎𝑖2 = 2𝑒𝐺̄𝚤𝐵 = 2𝑒 2 𝐺 2 𝜂𝐵𝛷 .
(19.48) (19.49)
Das Signal/Rausch-Verhältnis ist gemäß Gl. (19.39) SRV =
𝜂𝛷 𝚤̄ =m. = 2𝐵 2𝑒𝐺𝐵
(19.50)
Es hängt nicht von 𝐺 ab, weil der deterministische Gewinn keine zusätzliche Zufälligkeit einführt; der mittlere Strom 𝚤̄ und sein quadratisches Mittel 𝜎𝑖 werden beide mit demselben Faktor 𝐺 multipliziert. Stochastischer Gewinn
Dieses einfache Ergebnis gilt nicht mehr, wenn der Gewinn selbst stochastisch ist, wie z. B. in einem Sekundärelektronenvervielfacher, Photoleiter oder einer Lawinenphotodiode. Die Herleitung des Mittelwerts und der Varianz des Photostroms aus dem vorherigen Abschnitt muss dann modifiziert werden. Insbesondere Gl. (19.40) für den elektrischen Strom sollte dann in der Form ∑ 𝑖(𝑡) = 𝑋𝑙 𝐺𝑙 ℎ(𝑡 − 𝑙Δ𝑡) (19.51) 𝑙
zufällig verstärkte Photoelektronen
G1
G2
G5
G3
t
G4
(19.47)
0
𝚤̄ = 𝑒𝐺𝜂𝛷 =
Photoelektronen
t elektrischer Strom i(t)
i (t)
t
Abb. 19.31 Jedes Ereignis in einem Photodetektor mit Gewinn erzeugt eine zufällige Zahl Gl von Ladungsträgern, von denen jeder einen elektrischen Stromimpuls mit der Fläche eGl bewirkt. Der Gesamtstrom i(t ) im Detektorstromkreis ist die Superposition dieser Pulse.
geschrieben werden, wobei 𝑋𝑙 wie zuvor mit der Wahrscheinlichkeit 𝑝 = 𝜂𝛷Δ𝑡 den Wert eins und mit der Wahrscheinlichkeit 1 − 𝑝 den Wert null annimmt. Dabei sind die unabhängigen Zufallszahlen 𝐺𝑙 enthalten, die den Gewinn beschreiben, den ein Ladungsträger im 𝑙ten Zeitintervall erhält (siehe Abb. 19.31). Wenn die Zufallsvariable 𝐺𝑙 den Mittelwert ⟨𝐺⟩ = 𝐺 und ein mittleres Quadrat ⟨𝐺 2 ⟩ besitzt, ergibt eine Analyse ähnlich der aus den Gln. (19.40)–(19.47) für poissonverteilte Photoelektronen 𝚤̄ = 𝑒𝐺𝜂𝛷 ,
(19.52)
𝜎𝑖2 = 2𝑒𝐺̄𝚤𝐵𝐹 ,
(19.53)
wobei 𝐹=
⟨𝐺 2 ⟩ ⟨𝐺⟩2
(19.54)
der Zusatzrauschfaktor ist. Er hängt mit der Varianz 𝜎𝐺2 des Gewinns durch 𝐹 = 1 + 𝜎𝐺2 ∕⟨𝐺⟩2 zusammen. Für den Sonderfall eines deterministischen Gewinns ist 𝜎𝐺2 = 0 und 𝐹 = 1, woraufhin sich Gl. (19.53) auf Gl. (19.49) reduziert. Wenn der Gewinn stochastisch ist, ist 𝜎𝐺2 > 0 und 𝐹 > 1; beide Größen nehmen mit steigenden Fluktuationen des Gewinns zu. Der resultierende elektrische Strom 𝑖 zeigt dann größere Fluktuationen als die von Schrotrauschen. In Anwesenheit von stochastischem Gewinn wird das Signal/Rausch-Verhältnis 𝚤̄2 ∕𝜎𝑖2 des Stroms SRV =
𝚤̄ 2𝑒𝐺𝐵𝐹
=
𝜂𝛷∕2𝐵 m = , 𝐹 𝐹
(19.55)
wobei m die mittlere Zahl der im Intervall T = 1∕2𝐵 registrierten Photoelektronen ist. Dieses Resultat ist um einen Faktor 𝐹 kleiner als das Signal/Rausch-Verhältnis
685
19 Photodetektoren
1000
für deterministischen Gewinn; die Verringerung resultiert aus der Zufälligkeit des Gewinns. Beispiel 19-10: Zusatzrauschfaktor für einen Sekundärelektronenvervielfacher
Die Verstärkung in einem Sekundärelektronenvervielfacher beruht auf der Emission von sekundären Elektronen an seinen Dynoden [Abb. 19.2(b)]. Wir können den zugehörigen Zusatzrauschfaktor berechnen, indem wir annehmen, dass die Zufallsvariable 𝛿 der Verstärkung durch Emission von Sekundärelektronen gleichverteilt und die Photonenzahl poissonverteilt ist und der mittlere Gewinn 𝛿 ist mit Ausnahme der ersten Dynode, für die er 𝐴𝛿 betragen soll (in der Regel gilt 𝐴 ≫ 1). Mit diesen Annahmen erhalten wir für den Zusatzrauschfaktor 𝐹−1=
1
𝐺∕𝐴 − 1
[
𝐺 (𝐺∕𝐴)1∕𝑁 − 1
],
(19.56)
𝑁
wobei 𝐺 = 𝐴𝛿 der mittlere Gewinn ist und 𝑁 die Zahl der Dynoden bezeichnet. Der Sonderfall, das alle Dynoden identisch sind und der Gewinn groß, wird in Aufgabe 19-13 behandelt. Abbildung 19.35 zeigt die Auftragung von Gl. (19.56) für 𝑁 = 1, 4 und 10 unter der Annahme, dass für die erste (GaP-) Dynode 𝐴 = 10 gilt. Eine Abschätzung für den Betrag der Gewinnfluktuationen erhalten wir, indem wir ein typisches Bauelement betrachten, in dem die Zufälligkeit des Gewinns einen Zusatzrauschfaktor 𝐹 ≈ 1.2 ergibt. Da 𝐹 = 1 + 𝜎𝐺2 ∕⟨𝐺⟩2 ist, ist das Signal/Rausch-Verhältnis des Gewinns 1∕(𝐹 − 1) ≈ 5. Wenn der SEV einen mittleren Gewinn 𝐺 = 106 besitzt, ist die Standardab√ weichung der Gewinnfluktuationen 𝜎𝐺 = 106 ∕ 5. Zusatzrauschfaktor einer konventionellen Lawinenphotodiode
Konventionelle Lawinenphotodioden wurden in Abschnitt 19.4.1 diskutiert. Wenn Photoelektronen am Rand einer homogenen Verstärkungsregion in eine konventionelle Lawinenphotodiode injiziert werden, ist der Gewinn 𝐺 des Bauelements durch Gl. (19.27) gegeben. Er hängt vom Ionisationskoeffizienten 𝛼E der Elektronen und dem Ionisationsverhältnis k = 𝛼L ∕𝛼E sowie der Dicke w der Verstärkungsregion ab. Eine ähnliche (aber komplexere) Analyse unter Einschluss der durch den Gewinnprozess eingeführten Zufälligkeit führt zu einem Ausdruck für den mittleren quadratischen Gewinn ⟨𝐺 2 ⟩ und damit für den Zusatzrauschfaktor 𝐹 in Gl. (19.54). Diese allgemeinere Herleitung liefert einen Ausdruck für den mittleren Gewinn 𝐺, der mit dem in Gl. (19.27) gegebenen identisch ist.
k = 50
Zusatzrauschfaktor F
686
10
5
1 0.5
100
0.1
0.05 10 0.01 2 1
0 1
10
100
1000
mittlerer Gewinn G
Abb. 19.32 Zusatzrauschfaktor F für eine konventionelle Lawinenphotodiode mit einer homogenen Verstärkungsregion bei Elektroneninjektion als Funktion des mittleren Gewinns G für unterschiedliche Werte des Ionisationsverhältnisses k. Für Lochinjektion muss k durch 1∕k ersetzt werden.
Berechnungen zeigen, dass der Zusatzrauschfaktor 𝐹 dann mit dem mittleren Gewinn und dem Ionisationsverhältnis gemäß 𝐹 = k𝐺 + (1 − k) (2 −
1 𝐺
)
(19.57)
verknüpft ist. Eine Auftragung dieser Gleichung ist in Abb. 19.32 mit k als Parameter gezeigt. Gleichung (19.57) gilt, wenn Elektronen am Rand der Verstärkungsregion injiziert werden, aber sowohl Elektronen als auch Löcher Stoßionisationen auslösen können. Wenn nur Löcher injiziert werden, gilt derselbe Ausdruck, nur dass k durch 1∕k ersetzt werden muss. Das Gewinnrauschen wird durch Injektion des Ladungsträgers mit dem höheren Ionisationskoeffizienten und Verwendung einer Struktur mit dem kleinstmöglichen (für Elektronen) bzw. größtmöglichen (für Löcher) Wert von k minimiert. Daher sollten die Ionisationskoeffizienten für die beiden Ladungsträger so unterschiedlich wie möglich sein. Man sagt, dass Gleichung (19.57) unter Bedingungen der einzelladungsträgerinitiierten Doppelladungsträgerverstärkung (engl. single-carrier injection double-carrier multiplication, SCIDCM) gilt, da beide Arten von Ladungsträgern die Stoßionisation auslösen können, selbst wenn nur eine Art injiziert wird. Wenn Elektronen und Löcher gleichzeitig injiziert werden, ist das Gesamtergebnis die Summe der beiden Teilergebnisse. Das Gewinnrauschen in einer konventionellen Lawinenphotodiode resultiert aus zwei Quellen: der Zufäl-
19.6 Rauschen in Photodetektoren
ligkeit der Orte, an denen die Ionisationen stattfinden, und der Rückkopplung aufgrund der Tatsache, dass beide Arten von Ladungsträgern Stoßionisationen bewirken können. Die erste dieser beiden Rauschquellen ist sogar dann vorhanden, wenn wenn nur eine Art von Ladungsträgern vervielfacht wird; sie verursacht einen minimalen Zusatzrauschfaktor 𝐹 = 2 bei großen Werten des mittleren Gewinns 𝐺, wie deutlich wird, wenn man k = 0 setzt und 𝐺 in Gl. (19.57) groß werden lässt. Die zweite Rauschquelle, der Rückkopplungsprozess, ist potentiell schädlicher, da sie eine viel größere Steigerung von 𝐹 bewirken kann. Beispiel 19-11: Zusatzrauschfaktor für eine SiliciumLawinenphotodiode mit separater Absorption und Verstärkung
Eine Si-Durchgriff-Lawinenphotodiode mit separater Absorption und Verstärkung auf der Grundlage von Elektroneninjektion wie die in Abb. 19.25 gezeigte hat eine maximale Empfindlichkeit bei einer Wellenlänge von 800 nm, eine Quantenausbeute 𝜂 = 0.8 und ein Produkt aus Gewinn und Bandbreite von 𝐺𝐵 = 350 Hz. Der mittlere Gewinn ist 𝐺 = 50 und das Ionisationsverhältnis k = 0.02. Gleichung (19.57) ergibt 𝐹 ≈ 3, sodass das Signal/Rausch-Verhältnis um einen Faktor 3 abnimmt, während der Mittelwert des nachgewiesenen Stroms um einen Faktor 50 zunimmt. Silicium-Lawinenphotodioden sind in einem Wellenlängenbereich von 450 bis 1100 nm empfindlich und können Verstärkungen bis 1000 erreichen, je nach der verwendeten Struktur und der angelegten Spannung. In Anwesenheit von Schaltungsrauschen kann eine Lawinenphotodiode aber auch verwendet werden, um das SRV des Gesamtsystems zu vergrößern, wie in Abschnitt 19.6.4 gezeigt wird.
heit von Schaltungsrauschen kann eine Lawinenphotodiode aber auch verwendet werden, um das SRV des Gesamtsystems zu vergrößern, wie in Abschnitt 19.6.4 gezeigt wird. Zusatzrauschfaktor für Lawinenphotodioden mit verlaufsabhängigen Parametern
Lawinenphotodioden mit verlaufsabhängigen Parametern wurden in Abschnitt 19.4.2 untersucht. Eine Theorie des Rauschens von Lawinenphotodioden, das die Effekte des Totraums sowie der anfänglichen Energie der Ladungsträger und der Schwellenenergie der Stoßionisation berücksichtigt, kann in Form von Rekursionsbeziehungen für die ersten und zweiten Momente und die Wahrscheinlichkeitsverteilung der Zahlen von Elektronen und Löchern formuliert werden. Diese Zufallsvariablen sind deterministisch mit dem stochastischen Gewinn verknüpft. Numerische Lösungen liefern den mittleren Gewinn und den Zusatzrauschfaktor für beliebige Werte des Totraums und der Dicke der Verstärkungsregion. Die Theorie sagt die Leistungsdaten von Lawinenphotodioden, in denen verlaufsabhängige Effekte eine Rolle spielen, korrekt voraus. Ein Beispiel eines Bandschemas für solch ein Bauelement ist in Abb. 19.33 gezeigt. Zwei dünne Verstärkungsschichten mit relativ niedriger Schwellenenergie umgeben eine Schicht mit höherer Schwellenenergie. Die Stoßionisation wird an den Rändern der Zwillings-Verstärkungsschichten erhöht und im zentralen Gebiet reduziert, was den Ladungsträgern bei ihrem Durchgang Energie verleiht. Die Materialien werden so gewählt, dass lochinduzierte Ionisationen unterdrückt werden. Die Verbesserung der Leistung durch diese Maßnahmen veranschaulicht Beispiel 19-13. -
Beispiel 19-12: Zusatzrauschfaktor für eine AlInAsSbLawinenphotodiode mit separater Absorptions-, Ladungs- und Verstärkungsschicht
Die in Beispiel 19-7 betrachtete Al0.4 In0.6 As0.3 Sb0.7 ∕ Al0.7 In0.3 As0.3 Sb0.7 -Lawinenphotodiode mit separater Absorptions-, Ladungs- und Verstärkungsschicht beruht auf einer Absorptions- und Verstärkungsschicht mit kleinem bzw. großen Gehalt an Al entsprechend kleiner bzw. großer Bandlücke. Das Bauelement ist im Bereich des Telekommunikationsbands von 1.3 bis 1.6 μm empfindlich. Sein Ionisationsverhältnis k = 0.01 ist mit dem von Si vergleichbar. Für einen mittleren Gewinn 𝐺 = 10 liefert Gl. (19.57) 𝐹 ≈ 2, sodass das Signal/Rausch-Verhältnis um einen Faktor 2 abnimmt, während der Mittelwert des nachgewiesenen Stroms um einen Faktor 10 zunimmt. In Anwesen-
hν
-
Abb. 19.33 Bandschema einer in Sperrrichtung gepolten rauscharmen Heterostruktur-Lawinenphotodiode mit verlaufsabhängigen Parametern.
687
688
19 Photodetektoren
Beispiel 19-13: Zusatzrauschfaktor für eine sehr dünne GaAs/AlGaAs-Lawinenphotodiode, die durch den Totraum beeinflusst wird
Eine sehr dünne Heterostruktur-Lawinenphotodiode ähnlich der in Abb. 19.33 gezeigten besitzt eine Verstärkungsregion aus zwei 50 nm dicken GaAs-Schichten, die eine 85 nm dicke Schicht aus Al0.6 Ga0.4 As umgeben. Der gemessene Zusatzrauschfaktor ist 𝐹 ≈ 2.5 bei einem mittleren Gewinn von 𝐺 = 20. Der von Gl. (19.57) vorausgesagte theoretische Zusatzrauschfaktor für eine Vollmaterial-GaAs-Homokontakt-Lawinenphotodiode (k ≈ 0.75) ist 𝐹 ≈ 15.5 bei 𝐺 = 20 (siehe Abb. 19.32). Das gemessene Rauschen des Heterostrukturbauelements ist somit wesentlich geringer als das aus der Theorie für Vollmaterialien vorhergesagte, die den Totraum sowie Effekte der Anfangsenergie und der Schwellenenergie der Stoßionisation vernachlässigt. Diese Effekte sind offensichtlich wichtig, um das Gewinnrauschen zu reduzieren, und müssen berücksichtigt werden, wenn Lawinenphotodioden mit einer dünnen Verstärkungsregion beschrieben werden sollen. Andere Heterostruktur wie z. B. eine Zentralschichtanordnung können noch niedrigere Werte von 𝐹 bei kleinen Werten von 𝐺 zeigen. Zusatzrauschfaktor für Lawinenphotodioden mit ortsabhängigen Parametern
Mehrschicht-Lawinenphotodioden mit beliebiger Struktur und ortsabhängigen Parametern wurden in Abschnitt 19.4.2 besprochen. Das Bandschema einer speziellen Klasse derartiger Bauelemente ist in Abb. 19.34 sowohl ohne angelegte Spannung als auch in Sperrrichtung gepolt gezeigt. Die Bandlücke wird über die Zusammensetzung über sehr kurze Distanzen von einem kleinen Wert E g1 auf einen großen Wert E g2 veränhν
L
dert. Aufgrund der Materialeigenschaften sind lochinduzierte Ionisationen unterdrückt. Potentielle Vorteile dieser Bauelemente sind die vorgegeben Orte der Verstärkungsschritte (an den Stufen der Leitungsbandkanten), die kleine Betriebsspannung (die Tunneleffekte minimiert) und die schnelle Reaktionszeit (resultierend aus der verringerten Lawinenaufbauzeit). Bei Injektion und Verstärkung nur eines Ladungsträgers beträgt die mittlere Verstärkung 𝐺 der Stufen-Lawinenphotodiode (Aufgabe 19-12) 𝐺 = (1 + 𝑃)𝑁
(19.58)
und der Zusatzrauschfaktor ist 𝐹=
1 𝐺
+
2 𝐺
1∕𝑁
−
2 𝐺
1+1∕𝑁
,
(19.59)
wobei 𝑃 die Wahrscheinlichkeit der Stoßionisation in jeder Stufe ist und 𝑁 die Zahl der Stufen. Gleichung (19.59) ist in Abb. 19.35 für 𝑁 = 5 und 10 als modifizierter Zusatzrauschfaktor 𝐹 − 1 gegen 𝐺 aufgetragen (durchgezogene Linien). Wenn wir in Gl. (19.59) den Grenzfall 𝑁 → ∞ betrachten, so ergibt sich 𝐹 = 2 − 1∕𝐺, was wie erwartet mit dem Ergebnis für die konventionelle Lawinenphotodiode für Einzelladungsträgerinjektion und Einzelladungsträgerverstärkung übereinstimmt [Gl. (19.57) mit k = 0]. Obwohl wir hier aus Gründen der Einfachheit nur die Stufen-APD betrachten, gelten die Gln. (19.58) und (19.59) für alle Übergitter-Lawinenphotodioden, bei denen der Ladungsträgertransport senkrecht zu den Übergitterebenen verläuft. In derartigen Strukturen stoßen die Ladungsträger in jeder Periode der Mehrschichtstruktur an den Heteroübergängen auf eine Diskontinuität des Potentials.
p+
g2 g1
V
n+ (a)
(b)
Abb. 19.34 Bandschema einer Lawinenphotodiode mit stufenförmigem Verlauf der Bandlücke (a) ohne angelegte Spannung und (b) in Sperrrichtung gepolt. Die Stufen des Leitungsbands fördern die Stoßionisation an definierten Po-
sitionen. (Nach F. Capasso, W.-T. Tsang, G. F. Williams, ‚Staircase Solid-State Photomultipliers and Avalanche Photodiodes with Enhanced Ionization Rates Ratio‘, IEEE Transactions on Electron Devices ED-30, 381–390, Abb. 1. ©1983 IEEE.)
F – 1) modifizierter Zusatzrauschfaktor (F
19.6 Rauschen in Photodetektoren
10 Stufen-APD konventionelle APD Hochleistungs-PMT 1
10 –1
10
10 –2
10 –3
N=5
1
10
1
10
10 4 10 2 10 3 mittlere Verstärkung G
4
10 5
10 6
Abb. 19.35 Modifizierter Zusatzrauschfaktor F − 1 als Funktion der mittleren Verstärkung G für drei Photodetektoren. Die durchgezogenen Kurven (Stufen-Lawinenphotodiode) stellen Gl. (19.59) für N = 5 und 10 dar. Die gepunkteten Linien (konventionelle Lawinenphotodiode) stellen Gl. (19.57) für k = 0 dar. Die gestrichelten Kurven (hochverstärkter SEV) repräsentieren Gl. (19.56) für A = 10 und N = 1, 4 und 10. Der modifizierte Zusatzrauschfaktor F − 1 ist aufgetragen, weil er bequem auf einer doppeltlogarithmischen Skala darstellbar ist. Die dargestellten Ergebnisse beschreiben für alle drei Detektoren ein optimales Rauschverhalten. Obwohl der Zusatzrauschfaktor der idealen Stufen-APD immer unter dem der konventionellen Lawinenphotodiode liegt, ist der Unterschied nicht groß, da für beide Bauelemente F < 2 ist. Der SEV bietet eine hohe Verstärkung und ein ausgezeichnetes Rauschverhalten, da sich die Elektronen im Vakuum ausbreiten und nur ein Ladungsträger zu berücksichtigen ist; er ist jedoch typischerweise nur für Wellenlängen unterhalb von etwa 1 μ m empfindlich und seine Quantenausbeute und Ansprechempfindlichkeit sind begrenzt. (Nach M. C. Teich, K. Matsuo, B. E. A. Saleh, ‚Excess Noise Factors for Conventional and Superlattice Avalanche Photodiodes and Photomultiplier Tubes‘, IEEE Journal of Quantum Electronics QE-22, 1184– 1193, Abb. 3. ©1986, IEEE.)
Anfängliche Versuche, eine Stufen-APD auf der Basis von GaAs/AlGaAs herzustellen, wurden durch zu kleine Leitungsband-Offsets und zu geringe Energiedifferenzen zwischen den direkten und indirekten Bandübergängen zunichte gemacht, sodass die Vorzüge der Stufenstruktur nicht eindeutig nachgewiesen werden konnten. Jüngste Arbeiten mit dem System AlInAsSb/ GaSb haben jedoch gezeigt, dass das Stufenkonzept hier umsetzbar ist (Beispiel 19-14). Die Entwicklung rauscharmer Lawinenphotodioden auf der Basis von Halbleitermaterialien mit kleiner Bandlücke ist ein vielversprechendes Projekt, da solche Strukturen als „FestkörperPhotomultiplier“ im Infraroten dienen können, wo Anwendungen wie beispielsweise Nachtsichtgeräte oder Wärmebildkameras im Überfluss vorhanden sind.
Beispiel 19-14: Zusatzrauschfaktor einer AlInAsSb/ GaSb-Stufen-APD
Eine einstufige Stufen-APD besteht aus einem AlInAsSb-Injektorgebiet mit großer Bandlücke (E g = 1.16 eV) und einer dünnen InAsSb-Verstärkungsschicht mit kleiner Bandlücke (E g = 0.25 eV). 10) An der Grenzfläche der Materialien unterscheiden sich die Energien der beiden Leitungsbänder um 0.6 eV, was ausreicht, um eine Stoßionisation in InAsSb mit hoher Wahrscheinlichkeit zu ermöglichen, da seine Schwellenenergie der Ionisation ≈ 0.4 eV beträgt. Die Stoßionisation wird in Form einer Stromverstärkung von 𝐺 ≈ 1.8 ± 0.2 beobachtet, die über einen weiten Bereich von Anregungswellenlängen, Anregungsintensitäten, Sperrspannungen und Betriebstemperaturen anhält. Monte-Carlo-Simulationen bestätigen das Vorhandensein einer robusten Stoßionisation durch Elektronen in der dünnen InAsSb-Schicht und im Wesentlichen keiner Ionisation durch Löcher. Das Bauelement verhält sich somit wie eine Stufen-APD mit Einzelladungsträgerinjektion und Einzelladungsträgerverstärkung. In Übereinstimmung mit Gl. (19.58) und (19.59) für 𝑁 = 1 folgern wir, dass über den Bereich der beobachteten Werte von 𝐺 𝑃 = 𝐺 − 1 ≈ 0.8 ± 0.2 2 und 𝐹 = 3∕𝐺 − 2∕𝐺 ≈ 1 ist. Zusatzrauschfaktor für Dunkelstrom im Verstärkungsbereich
Der Ausgangsstrom einer Lawinenphotodiode fluktuiert sowohl bei Vorhandensein als auch bei Nichtvorhandensein von Licht. Das Dunkelstromrauschen entsteht durch Effekte, die sowohl außerhalb als auch innerhalb der Verarmungs- und Verstärkungsbereiche der Vorrichtung entstehen. Der Oberflächen-Leckagedunkelstrom kommt mit beiden Bereichen nicht in Berührung und unterliegt somit keinem Verstärkungsrauschen. Paare von Ladungsträgern, die aufgrund von Tunneloder thermischen Prozessen zufällig in konventionellen oder Mehrschicht-APD entstehen, werden jedoch genau wie photoerzeugte Trägerpaare verstärkt und erfahren somit auch Verstärkungsrauschen. Die im Verstärkungsbereich gebildeten dunklen Ladungsträger sind in diesem stochastisch verteilt, sodass sie eine geringere mittlere Verstärkung und einen größeren Zusatzrauschfaktor erhalten als die an dessen Kante injizierten Ladungsträger. Auch photoerzeugte Ladungsträgerpaare, die durch direkt auf den Verstärkungsbereich auftref10) Siehe M. Ren, S. Maddox, Y. Chen, M. Woodson, J. C. Campbell, S. Bank, ‚AlInAsSb/GaSb Staircase Avalanche Photodiode‘, Applied Physics Letters 108, 081101, 2016.
689
690
19 Photodetektoren
fendes Licht erzeugt werden, unterliegen diesem erhöhten Zusatzrauschen. Um diesen unerwünschten Effekt zu minimieren, werden Verstärkungsbereiche im Allgemeinen aus Halbleitermaterialien mit größerer Bandlücke hergestellt, damit Tunnel- und thermische Prozesse und der sich daraus ergebende Dunkelstrom begrenzt werden. Für Mehrschicht-APD mit beliebiger Struktur wurden Ausdrücke für die mittlere Verstärkung und den Zusatzrauschfaktor für im Verstärkungsbereich erzeugte dunkle Ladungsträger sowie für im Verarmungsbereich erzeugte dunkle und photogenerierte Ladungsträger und beliebige Überlagerungen davon angegeben. 11)
19.6.3
σi
R
Abb. 19.36 Ein Widerstand R bei der Temperatur T ist äquivalent zu einem rauschfreien Widerstand, der parallel zu einer Rauschstromquelle mit der Varianz 𝜎i2 = ⟨i2 ⟩ ≈ 4kTB∕R geschaltet ist, wobei B die Bandbreite der Schaltung ist.
Die Varianz des elektrischen Stroms ist das Integral der spektralen Leistungsdichte über alle Frequenzen innerhalb des Bandbreite 𝐵 der Schaltung, d. h.
Schaltungsrauschen
𝐵
Weiteres Rauschen wird durch die Elektronik eines optischen Empfängers eingeführt. Schaltungsrauschen entsteht durch die Wärmebewegung von Ladungsträgern in Widerständen und anderen dissipativen Elementen (thermisches Rauschen) sowie durch Fluktuationen von Ladungsträgern in den verwendeten Transistoren. Thermisches Rauschen
Thermisches Rauschen (auch Johnsonrauschen oder Nyquistrauschen genannt) entsteht durch die zufälligen Bewegungen von beweglichen Ladungsträgern in Materialien bei endlichen Temperaturen; diese Bewegungen verursachen sogar ohne externe Spannungsquelle einen zufälligen elektrischen Strom 𝑖(𝑡). Der thermische elektrische Strom in einem Widerstand 𝑅 ist eine stochastische Funktion 𝑖(𝑡) mit dem Mittelwert ⟨𝑖(𝑡)⟩ = 0. Die Varianz 𝜎𝑖2 des Stroms, die gleich dem mittleren Quadrat ist, da der Mittelwert verschwindet, nimmt mit steigender Temperatur 𝑇 zu. Mithilfe eines Arguments aus der statistischen Mechanik, das im folgenden Abschnitt vorgestellt wird, kann gezeigt werden, dass ein Widerstand 𝑅 bei der Temperatur 𝑇 einen zufälligen elektrischen Strom 𝑖(𝑡) mit der spektralen Leistungsdichte S 𝑖 (𝑓) =
ℎ𝑓 4 𝑅 exp(ℎ𝑓∕k𝑇) − 1
(19.60)
zeigt, wobei 𝑓 die Frequenz ist. In dem Bereich 𝑓 ≪ k 𝑇∕ℎ, der deshalb von Interesse ist, weil bei Zimmertemperatur k𝑇∕ℎ = 6.24 THz ist, gilt exp(ℎ𝑓∕k𝑇) ≈ 1 + ℎ𝑓∕k𝑇 und daher S 𝑖 (𝑓) ≈ 4k 𝑇∕𝑅 .
(19.61)
11) Siehe N. Z. Hakim, B. E. A. Saleh, M. C. Teich, ‚Generalized Excess Noise Factor for Avalanche Photodiodes of Arbitrary Structure‘, IEEE Transactions on Electron Devices 37, 599–610, 1990.
𝜎𝑖2
= ∫ S 𝑖 (𝑓) d𝑓 .
(19.62)
0
Für 𝐵 ≪ k𝑇∕ℎ erhalten wir 𝜎𝑖2 ≈ 4k𝑇𝐵∕𝑅 .
(19.63)
Wie Abb. 19.36 zeigt, verhält sich ein Widerstand 𝑅 bei der Temperatur 𝑇 in einer Schaltung mit der Bandbreite 𝐵 wie ein rauschfreier Widerstand, der parallel zu einer Quelle von Rauschstrom mit dem Mittelwert null und einer durch Gl. (19.63) gegebenen Varianz 𝜎𝑖 geschaltet ist. Beispiel 19-15: Thermisches Rauschen in einem Widerstand
Ein Widerstand von 1 k˙ bei 𝑇 = 300 K in einer Schaltung mit der Bandbreite 𝐵 = 100 MHz zeigt einen quadratisch gemittelten thermischen Rauschstrom 𝜎𝑖 ≈ 41 nA.
Herleitung: Die spektrale Leistungsdichte des thermischen Rauschens Wir wollen Gl. (19.60) herleiten, indem wir zeigen, dass die elektrische Leistung des thermischen Rauschens in einem Widerstand gleich der von einem eindimensionalen schwarzen Strahler emittierten elektromagnetischen Leistung ist. Dabei identifizieren wir den Faktor ℎ𝑓∕[exp(ℎ𝑓∕k𝑇) − 1] in Gl. (19.60) mit der mittleren Energie E einer elektromagnetischen Mode der Frequenz 𝑓 (das Symbol 𝜈 ist für optische Frequenzen reserviert) im thermischen Gleichgewicht bei der Temperatur 𝑇 [siehe Gl. (14.66)]. Gleichung (19.60) kann daher als S 𝑖 (𝑓)𝑅 = 4E geschrieben werden. Die durch einen Rauschstrom 𝑖 beim Durchgang durch einen Widerstand 𝑅 dissipierte elektrische Leistung ist
19.6 Rauschen in Photodetektoren
⟨𝑖 2 ⟩𝑅 = 𝜎𝑖2 𝑅, sodass S 𝑖 (𝑓)𝑅 die durch den Rauschstrom 𝑖(𝑡) beim Durchgang durch den Widerstand 𝑅 dissipierte elektrische Leistungsdichte (pro Hz) ist. Als Nächstes zeigen wir, dass 4E die von einem eindimensionalen schwarzen Strahler emittierte Leistungsdichte ist. Wie in Abschnitt 14.4.2 besprochen emittiert ein atomares System im thermischen Gleichgewicht mit den elektromagnetischen Moden einer Kavität eine spektrale Energiedichte 𝜚(𝜈) = M(𝜈)E , wobei M(𝜈) = 8π 𝜈2 ∕𝑐3 die dreidimensionale Modendichte und 𝑐𝜚(𝜈) die spektrale Intensitätsdichte ist. Obwohl sich die Ladungsträger in einem Widerstand in alle Richtungen bewegen, trägt nur die Bewegung in Richtung des Stromflusses in der Schaltung bei. Die Modendichte in einer Dimension ist M(𝑓) = 4∕𝑐 Moden/(m Hz) [siehe Gl. (11.10)], sodass die entsprechende Energiedichte 𝜚(𝑓) = M(𝑓)E = 4E ∕𝑐 und die ausgestrahlte Leistungsdichte 𝑐𝜚(𝑓) = 4E ist. 1∕f -Rauschen
Eine andere Form von Rauschen, die in manchen der Komponenten auftritt, aus denen die elektronische Schaltung eines optischen Empfängers besteht, besitzt eine spektrale Leistungsdichte in der Form eines Potenzgesetzes: 𝑆(𝑓) ≈ (𝑓∕𝑓0 )−𝛼 . Die multiplikative Konstante 𝑓0𝛼 bestimmt die absolute Stärke der Fluktuationen bei allen Frequenzen, während der Exponent −𝛼 die relative Stärke der Fluktuationen bei verschiedenen Frequenzen kennzeichnet. Rauschen dieser Form wird meist als 1∕𝑓 𝛼 -Rauschen oder einfach 1∕𝑓-artiges Rauschen bezeichnet. In dem Spezialfall 𝛼 = 1 spricht man von 1∕𝑓-Rauschen, Zusatzrauschen oder rosa Rauschen. Die letzte Bezeichnung ergibt sich aus einer Analogie mit sichtbarem Licht. In einem Spektrum der Form 𝑆(𝑓) ∝ 1∕𝑓 besitzt jede Oktave dieselbe Leistung, sodass kleinere Frequenzen („rot“) stärker gewichtet werden als größere („blau“), was zu einem Spektrum mit einer Rosatönung führt. Es existiert jedoch keine Norm für derartige Bezeichnungen, daher werden die genannten Begriffe allgemein verwendet, um 1∕𝑓 𝛼 -Rauschen mit 𝛼 ≈ 1 zu beschreiben.
Φ
+
Derartige Fluktuationen sind in Elektronik und Photonik allgegenwärtig. 1∕𝑓 𝛼 -Rauschen wurde zusammen mit thermischem Rauschen in frühen Untersuchungen von Niederfrequenzschaltungen entdeckt. Man beobachtet solche Fluktuationen auch häufig in Bauteilen, Materialien und Geräten, beispielsweise in Widerständen, Halbleitern, Metallschichten, Supraleitern, thermisch emittierenden Bauelementen und Verbindungsbauelementen. In der Elektronik kann sich der Frequenzbereich, über den sich ein solches Verhalten manifestiert, über 12 Größenordnungen oder mehr erstrecken, und 𝛼 liegt typischerweise zwischen 0.8 und 1.4. In der Praxis werden Geräte und Systeme, die 1∕𝑓Rauschen zeigen, häufig mit Frequenzen betrieben, die so hoch sind, dass dieses Rauschen vernachlässigbar wird. Für viele Komponenten, Materialien und Geräte bleibt die Ursache des beobachteten 1∕𝑓 𝛼 -Rauschens jedoch unklar. Häufig liegen die Gründe in Fluktuationen der Zahl oder der Mobilität der Ladungsträger, aber auch andere Ursachen werden diskutiert. Manche erkennen in 1∕𝑓-artigem Rauschen Oberflächeneffekte, andere Volumeneffekte. Darüber hinaus ist dieses Verhalten nicht auf einfache Systeme beschränkt; auch komplexe Systeme zeigen derartiges Rauschen Obwohl allgegenwärtig, ist diese Art von Rauschen doch auch nicht universell; in gewickelten Drahtwiderständen ist es beispielsweise nicht vorhanden. Der Schaltungsrauschparameter: Widerstandsund verstärkerbeschränkte optische Empfänger
Aus praktischen Gründen kombiniert man die verschiedenen Quellen des Schaltungsrauschens (thermisches Rauschen in Widerständen sowie Rauschen in Transistoren und anderen Schaltungsbauelementen) oft zu einer einzigen stochastischen Stromquelle 𝑖𝑟 am Eingang des Empfängers, die dasselbe Gesamtrauschen am Empfängerausgang (Abb. 19.37) produziert. Der Mittelwert von 𝑖𝑟 ist null, während seine Varianz 𝜎𝑟2 von der Temperatur, der Bandbreite des Empfängers, Schaltungsparametern und der Art des Bauelements abhängt.
+
Φ
verrauschte Schaltung
-
σr
-
rauschfreie Schaltung
Abb. 19.37 Eine verrauschte Empfängerschaltung kann durch eine rauschfreie Empfängerschaltung und eine einzelne stochastische Stromquelle mit der Varianz 𝜎r am Eingang (rechts) ersetzt werden.
691
692
19 Photodetektoren
+
Φ
RL
zum rauschfreien Verstärker
Abb. 19.38 Widerstandsbegrenzter optischer Empfänger.
Außerdem ist es zweckmäßig, einen dimensionslosen Schaltungsrauschparameter 𝜎𝑞 =
𝜎𝑟 𝜎𝑟 T = 𝑒 2𝐵𝑒
(19.64)
zu definieren, wobei 𝐵 die Bandbreite des Empfängers und T = 1∕2𝐵 seine zeitliche Auflösung sind. Da 𝜎𝑟 der quadratisch gemittelte Rauschstrom ist, ist 𝜎𝑟 ∕𝑒 der quadratisch gemittelte Elektronenfluss (Elektronen pro Sekunde), der aus dem Schaltungsrauschen entsteht, und 𝜎𝑞 = (𝜎𝑟 ∕𝑒)T bezeichnet die quadratisch gemittelte Zahl der in der Zeit T nachgewiesenen Elektronen des Schaltungsrauschens. Der Schaltungsrauschparameter 𝜎𝑞 ist ein Bewertungskriterium, das die Qualität der optischen Empfängerschaltung charakterisiert, wie in Abschnitt 19.6.4 deutlich werden wird. Ein optischer Empfänger aus einer Photodiode in Reihe mit einem Lastwiderstand 𝑅L , gefolgt von einem Verstärker, ist in Abb. 19.38 dargestellt. Man bezeichnet diesen einfachen Empfänger als widerstandsbegrenzt, wenn der Schaltungsrauschstrom aufgrund des thermischen Rauschens im Lastwiderstand die Beiträge von anderen Rauschquellen deutlich übersteigt. Der Verstärker kann dann als rauschfrei angesehen werden und der mittlere quadratische Strom aufgrund des Schaltungsrauschens ist einfach 𝜎𝑟2 = 4k 𝑇𝐵∕𝑅L . Der durch Gl. (19.64) definierte Schaltungsrauschparameter ist daher √ k𝑇 𝜎𝑞 = ; (19.65) 𝑒 2 𝑅L 𝐵 er ist also umgekehrt proportional zur Wurzel aus der Bandbreite 𝐵. Beispiel 19-16: Schaltungsrauschparameter
Bei Zimmertemperatur erzeugt ein Widerstand 𝑅L = 50 Ω in einer Schaltung mit der Bandbreite 𝐵 = 100 MHz einen stochastischen quadratisch gemittelten Strom 𝜎𝑟 = 0.18 μA. Das entspricht einem Schaltungsrauschparameter 𝜎𝑞 ≈ 5700. Ein Empfänger mit einem hochwertigen rauscharmen Verstärker kann einen kleineren Schaltungsrauschpa-
rameter als ein widerstandsbegrenzter Empfänger haben. Wir betrachten dazu einen Empfänger mit einem Feldeffekt-Transistorverstärker. Wenn das Rauschen aufgrund des hohen Eingangswiderstands des Verstärkers vernachlässigt werden kann, wird der Empfänger durch das thermische Rauschen im Kanal zwischen der FETQuelle und der Drainelektrode beschränkt. Bei Verwendung eines Equalizers zur Verstärkung der durch die kapazitiven Eingangsimpedanz der Schaltung gedämpften Hochfrequenzen ist der Schaltungsrauschparameter bei Zimmertemperatur für typische Parameter der Bauelemente √ 𝐵∕Hz 𝜎𝑞 ≈ . (19.66) 100 Für 𝐵 = 100 MHz ist beispielsweise 𝜎𝑞 = 100. Das ist deutlich kleiner als der Schaltungsrauschparameter für einen widerstandsbegrenzten 50-Ω-Verstärker derselben Bandbreite. Der Schaltungsrauschparameter 𝜎𝑞 nimmt wegen der Wirkung des Equalizers mit 𝐵 zu. 12) Ein Empfänger mit einem bipolaren Transistorverstärker hat einen Schaltungsrauschparameter 𝜎𝑞 , der über einen weiten Bereich von Frequenzen unabhängig von der Bandbreite 𝐵 ist. Für Bandbreiten zwischen 100 MHz und 2 GHz ist 𝜎𝑞 normalerweise ≈ 500, sofern geeignete Transistoren verwendet und diese optimal angesteuert werden.
19.6.4 Signal/Rausch-Verhältnis und Empfindlichkeit analoger Empfänger Das einfachste Maß für die Qualität eines empfangenen Signals ist sein Signal/Rausch-Verhältnis. Das Signal/Rausch-Verhältnis des Stroms am Eingang der in Abb. 19.37 dargestellten rauschfreien Schaltung ist das Verhältnis des Quadrats des mittleren Stroms zur Summe der Varianzen der beitragenden Rauschquellen: ( SRV =
𝚤̄2 2𝑒𝐺̄𝚤𝐵𝐹 + 𝜎𝑟2
=
𝑒𝐺𝜂𝛷
2
)2
2𝑒 2 𝐺 𝜂𝐵𝛷𝐹 + 𝜎𝑟2
.
(19.67)
Der erste Term in den Nennern bezeichnet das Photoelektronen- und Gewinnrauschen [siehe Gl. (19.53)], wohingegen der zweite Term das Schaltungsrauschen beschreibt. Für einen Detektor ohne Gewinn ist 𝐺 = 1 und 𝐹 = 1. Die rauschfreie Schaltung verändert das Signal/Rausch-Verhältnis nicht, selbst wenn sie eine Verstärkung liefert. 12) Für weitere Details siehe S. D. Personick, Optical Fiber Transmission Systems, Plenum 1981, Abschnitt 3.4; der Parameter 𝜎𝑞 entspricht dort 𝑍∕2.
19.6 Rauschen in Photodetektoren
Übung 19-1: Signal/Rausch-Verhältnis des widerstandsbegrenzten optischen Empfängers
Nehmen Sie an, dass der in Abb. 19.38 dargestellte optische Empfänger eine ideale pin-Photodiode (𝜂 = 1) enthält und bei 𝑇 = 300 K 𝑅L = 50 Ω ist; seine Bandbreite ist 𝐵 = 100 MHz. Bei welchem Wert des Photonenflusses 𝛷 ist die Varianz des Photoelektronen-Rauschstroms gleich der Varianz des thermischen Rauschstroms des Widerstands? Wie groß ist die entsprechende optische Leistung bei 𝜆0 = 1550 nm? Es ist nützlich, das Signal/Rausch-Verhältnis in Gl. (19.67) durch die mittlere Zahl m der in der Auflösungszeit T = 1∕2𝐵 des Empfängers nachgewiesenen Photonen, 𝜂𝛷 , 2𝐵
m = 𝜂𝛷 T =
(19.68)
und den Schaltungsrauschparameter 𝜎𝑞 = 𝜎𝑟 ∕2𝐵𝑒 auszudrücken. Der resultierende Ausdruck ist 2
SRV =
𝐺 m
2
2
𝐺 𝐹 m + 𝜎𝑞2
.
(19.69)
Gleichung (19.69) besitzt eine einfache Interpretation. Der Zähler ist das Quadrat der mittleren Zahl von vervielfachten Photoelektronen, die in der Auflösungszeit T = 1∕2𝐵 des Empfängers nachgewiesen wurden. Der Nenner ist die Summe der Varianzen der Zahl von Photoelektronen und der Zahl von Schaltungsrauschelektronen, die im Intervall T entdeckt werden. Für eine Photodiode ohne Gewinn ist 𝐺 = 𝐹 = 1; daraufhin reduziert sich Gl. (19.69) auf SRV =
m
2
m + 𝜎𝑞2
.
(19.70)
Die relativen Beträge von m und 𝜎𝑞2 bestimmen die relative Bedeutung des Photoelektronenrauschens und des Schaltungsrauschens. Damit wird jetzt offenbar, wie der Parameter 𝜎𝑞 die Leistung der Schaltung als optischer Empfänger charakterisiert. Für 𝜎𝑞 = 100 dominiert das Schaltungsrauschen über das Photoelektronenrauschen, sofern die mittlere Zahl der pro Auflösungszeit registrierten Photoelektronen unter 10 000 liegt. Als Nächstes wollen wir die Abhängigkeit des SRV vom Photonenfluss 𝛷, der Bandbreite 𝐵 der Schaltung, dem Schaltungsrauschparameter 𝜎𝑞 des Empfängers und dem Gewinn 𝐺 untersuchen. Erst dann können wir bestimmen, wann der Einsatz einer Lawinenphotodiode vorteilhaft und welcher optische Vorverstärker für einen gegebenen Photonenfluss geeignet ist. Bei
dieser Analyse verwenden wir die in den Gln. (19.67), (19.69) und (19.70) angegebenen Ausdrücke für das Signal/Rausch-Verhältnis. Abhängigkeit des Signal/Rausch-Verhältnisses vom Photonenfluss
Die Abhängigkeit des Signal/Rausch-Verhältnisses von m = 𝜂𝛷∕2𝐵 liefert einen Hinweis darauf, wie sich das Signal/Rausch-Verhältnis mit dem Photonenfluss 𝛷 ändert. Wir betrachten zuerst eine Photodiode ohne Gewinn, für die Gl. (19.70) gilt. Zwei Grenzfälle sind von Interesse: 1) Grenzfall des Schaltungsrauschens. Wenn 𝛷 so klein ist, dass m ≪ 𝜎𝑞2 (𝛷 ≪ 2𝐵𝜎𝑞2 ∕𝜂) gilt, ist das Photonenrauschen vernachlässigbar, und das Schaltungsrauschen dominiert; das ergibt SRV ≈
m2
𝜎𝑞2
.
(19.71)
2) Grenzfall des Photonenrauschens. Wenn der Photonenfluss 𝛷 so groß ist, dass m ≫ 𝜎𝑞2 (𝛷 ≫ 2𝐵𝜎𝑞2 ∕𝜂) gilt, ist das Schaltungsrauschen vernachlässigbar; folglich ist SRV ≈ m .
(19.72)
Für kleine m ist das Signal/Rausch-Verhältnis daher proportional zu m2 und damit zu 𝛷 2 , während es für große m proportional zu m und daher zu 𝛷 ist, wie Abb. 19.39 zeigt. Für alle Lichtmengen nimmt das Signal/Rausch-Verhältnis mit steigendem Photonenfluss 𝛷 zu – mehr Licht verbessert die Leistung des Empfängers. SRV 10 5
10 3
σq = 10 σq = 100
10 10
10 3
10 5
Abb. 19.39 Signal/Rausch-Verhältnis (SRV) als Funktion der mittleren Zahl von Photoelektronen pro Auflösungszeit des Empfängers, m = 𝜂𝛷∕2B, für eine Photodiode für zwei Werte des Schaltungsrauschparameters 𝜎q .
Wann Lawinenphotodioden im Vorteil sind
Wir vergleichen jetzt zwei Empfänger, die in jeder Hinsicht identisch sind, außer dass der eine keinen Gewinn zeigt, während der andere einen Gewinn 𝐺 und
693
694
19 Photodetektoren
SRV
SRV 10 3 =0
10 5 10 2
= σq2 10 3
0.1
Lawinenphotodiode
10 Photodiode
10 10
10 3
1.0
10 5
Abb. 19.40 Signal/Rausch-Verhältnis als Funktion von m = 𝜂𝛷∕2B für einen Photodioden- (durchgezogene Kurve) und einen Lawinenphotodiodenempfänger mit dem mittleren Gewinn G = 100 und dem Zusatzrauschfaktor F = 2 (gestrichelte Kurve) nach Gl. (19.69). In beiden Fällen ist der Schaltungsrauschparameter 𝜎q = 100. Für einen kleinen Photonenfluss (Grenzfall des Schaltungsrauschens) liefert die Lawinenphotodiode ein höheres Signal/Rausch-Verhältnis als die Photodiode. Für einen großen Photonenfluss (Grenzfall des Photonenrauschens) ist die Photodiode überlegen. Der Übergang zwischen den beiden Grenzfällen tritt bei m ≈ 𝜎q2 ∕(F − 1) = 104 ein.
einen Zusatzrauschfaktor 𝐹 besitzt (z. B. eine Lawinenphotodiode). Für hinreichend kleines m (oder Photonenfluss 𝛷) dominiert das Schaltungsrauschen. Eine Verstärkung des Photostroms über das Niveau des Schaltungsrauschens sollte dann das Signal/RauschVerhältnis verbessern. Der Lawinenphotodiodenempfänger wäre dann überlegen. Für hinreichend großes m (oder Photonenfluss 𝛷) ist das Schaltungsrauschen vernachlässigbar. Eine Verstärkung des Photostroms führt dann Gewinnrauschen ein und reduziert so das Signal/ Rausch-Verhältnis. In diesem Fall wäre der Photodiodenempfänger überlegen. Der Vergleich von Gl. (19.69) und Gl. (19.70) zeigt, dass das Signal/Rausch-Verhält2 nis der Lawinenphotodiode für m < 𝜎𝑞2 (1 − 1∕𝐺 )∕(𝐹 − 1) größer ist als das der Photodiode. Für 𝐺 ≫ 1 ist / die Lawinenphotodiode für m < 𝜎𝑞2 (𝐹 − 1) im Vorteil. Wenn diese Bedingung nicht erfüllt ist, verschlechtert die Verwendung einer Lawinenphotodiode die Empfängerleistung, anstatt sie zu verbessern. Wenn 𝜎𝑞 beispielsweise sehr klein ist, zeigt Gl. (19.69), dass das Signal/Rausch-Verhältnis der Lawinenphotodiode, SRV = m∕𝐹, schlechter ist als das einer Photodiode, SRV = m ist. In Abb. 19.40 ist das Signal/Rausch-Verhältnis als Funktion von m für diese beiden Empfänger aufgetragen. Abhängigkeit des SRV vom Gewinn der Lawinenphotodiode
Für einen hinreichend kleinen Photonenfluss, m < 𝜎𝑞2 ∕ (𝐹 − 1), ist die Verwendung einer Lawinenphotodiode von Vorteil. Der optimale Gewinn der Lawinenphotodi-
1 1
10 2
10
10 3 G
Abb. 19.41 Abhängigkeit des Signal/Rausch-Verhältnisses vom mittleren Gewinn G einer Lawinenphotodiode für unterschiedliche Ionisationsverhältnisse k für m = 1000 und 𝜎q = 500. Kleinere Werte von k erlauben einen größeren Gewinn, eine größere Empfängerempfindlichkeit und größere Werte des Produkts aus Bandbreite und Gewinn.
ode ergibt sich aus Gl. (19.69), 2
SRV =
𝐺 m 2
𝐺 𝐹 + 𝜎𝑞2 ∕m
.
(19.73)
Der Zusatzrauschfaktor 𝐹 ist jedoch selbst eine Funktion von 𝐺, wie Gl. (19.57) für eine konventionelle Lawinenphotodiode zeigt. Einsetzen ergibt 2
SRV =
𝐺 m 3
2
k𝐺 + (1 − k)(2𝐺 − 𝐺) + 𝜎𝑞2 ∕m
,
(19.74)
wobei k das Ionisationsverhältnis der Ladungsträger in der Lawinenphotodiode ist. Dieser Ausdruck ist in Abb. 19.41 für m = 1000 und 𝜎𝑞 = 500 aufgetragen. Für eine Lawinenphotodiode mit Verstärkung nur eines Ladungsträgers (k = 0) nimmt das Signal/Rausch-Verhältnis mit dem Gewinn zu und wird schließlich gesättigt. Für eine Lawinenphotodiode mit Verstärkung beider Ladungsträger (k > 0) nimmt das Signal/Rausch-Verhältnis ebenfalls mit steigendem Gewinn zu, erreicht dann aber ein Maximum bei einem optimalen Wert des Gewinns, oberhalb dessen es infolge der deutlichen Zunahme des Gewinnrauschens wieder abnimmt. Im Allgemeinen existiert daher eine optimale Wahl für den Gewinn einer Lawinenphotodiode. Abhängigkeit des SRV von der Empfängerbandbreite
Die Beziehung zwischen dem Signal/Rausch-Verhältnis und der Bandbreite 𝐵 ist implizit in Gl. (19.67) enthalten. Sie wird durch die Abhängigkeit der Varianz 𝜎𝑟2 des Schaltungsrauschstroms von 𝐵 bestimmt. Wir betrachten drei Empfänger: 1) Für einen widerstandsbegrenzten Empfänger ist 𝜎𝑟2 ∝ 𝐵 [siehe Gl. (19.63)] und daher SRV ∝ 1∕𝐵 .
(19.75)
19.6 Rauschen in Photodetektoren
SRV
Aus dieser Beziehung ergeben sich zwei Grenzfälle: ( ) 1 Photonenrauschen 𝜎𝑞2 ≪ SRV0 ∶ m0 = SRV0 ,
FET
4
1/B 3
arer
Wide
Tran
sisto
r
rstan
Schaltungsrauschen
1/B 2
SRV ∝ 1∕(𝐵 + 𝑠𝐵3 )
(19.76)
mit einer Konstante 𝑠 hat. 3) Für einen bipolaren Transistorverstärker ist der Schaltungsrauschparameter 𝜎𝑞 näherungsweise unabhängig von 𝐵. Daher ist 𝜎𝑟 ∝ 𝐵, sodass Gl. (19.67) die Form SRV ∝ 1∕(𝐵 + 𝑠′ 𝐵2 )
(19.77)
mit einer Konstante 𝑠′ annimmt.
Wir nehmen SRV0 = 104 an, entsprechend einem akzeptablen Signal/Rausch-Verhältnis von 40 dB. Für einen Schaltungsrauschparameter 𝜎𝑞 ≪ 50 ist der Verstärker photonenrauschbegrenzt, und seine Empfindlichkeit ist m0 = 10 000 Photoelektronen pro Auflösungszeit des Empfängers. Im wahrscheinlicheren Fall 𝜎𝑞 ≫ 50 ist die Empfängerempfindlichkeit ≈ 100 𝜎𝑞 . Für 𝜎𝑞 = 500 ist die Empfindlichkeit z. B. m0 = 50 000 entsprechend 2𝐵m0 = 105 𝐵 Photoelektronen/s. Die Empfindlichkeit in Bezug auf die optische Leistung, P 0 = 2𝐵m0 ℎ𝜈∕𝜂 = 105 𝐵ℎ𝜈∕𝜂, ist direkt proportional zur Bandbreite. Für 𝐵 = 100 MHz und 𝜂 = 0.8 ist die Empfängerempfindlichkeit bei 𝜆0 = 1550 nm gleich 1.6 μW. Bei der Verwendung von Gl. (19.78) zur Bestimmung der Empfängerempfindlichkeit muss bedacht werden, dass der Schaltungsrauschparameter 𝜎𝑞 im Allgemeinen eine Funktion der Bandbreite 𝐵 ist: √ • Widerstandsbegrenzter Empfänger: 𝜎𝑞 ∝ 1∕ 𝐵 √ • Feldeffekt-Transistorverstärker: 𝜎𝑞 ∝ 𝐵 • Bipolarer Transistorverstärker: 𝜎𝑞 unabhängig von 𝐵 Für diese Empfänger ist die Abhängigkeit der Empfindlichkeit m0 von der Bandbreite 𝐵 in Abb. 19.43 illustriert.
Die Empfindlichkeit eines analogen Empfängers
Die Empfindlichkeit eines Empfängers ist der minimale Photonenfluss 𝛷0 bzw. die entsprechende optische Leistung P0 = ℎ𝜈𝛷0 und mittlere Zahl m0 = 𝜂𝛷0 ∕2𝐵 von Photoelektronen, die erforderlich sind, um einen vorgegebenen Wert des Signal/Rausch-Verhältnisses zu erreichen. Die Größe m0 kann bestimmt werden, indem man Gl. (19.69) für SRV = SRV0 löst. Wir werden hier nur Verstärker mit einem Gewinn von eins betrachten und die allgemeinere Lösung als Übung 19-2 durchführen. Durch Lösung der quadratischen Gleichung (19.70) für m0 erhalten wir √ 2 SRV0 + 4𝜎𝑞2 SRV0 ] .
(19.78)
Empfindlichkeit
0
Diese Beziehungen sind in Abb. 19.42 schematisch dargestellt. Das SRV nimmt mit zunehmendem 𝐵 stets ab. Für kleine Bandbreiten zeigen alle drei Empfänger ein Signal/Rausch-Verhältnis, das sich wie 1∕𝐵 ändert. Für große Bandbreiten nimmt das Signal/Rausch-Verhältnis des FET- und des bipolaren Transistorempfängers schneller mit der Bandbreite ab.
2
4
(19.79) ) √ SRV0 ∶ m0 = SRV0 𝜎𝑞 .
Beispiel 19-17: Empfindlichkeit eines analogen Empfängers
2) Für einen Feldeffekt-Transistorverstärker (FET) gilt 𝜎𝑞 ∝ 𝐵1∕2 [siehe Gl. (19.66)] und daher 𝜎𝑟 = 2𝑒𝐵𝜎𝑞 ∝ 𝐵3∕2 . Das zeigt dass, die Abhängigkeit des Signal/ Rausch-Verhältnisses von 𝐵 in Gl. (19.67) die Form
[SRV0 +
≫
1
(19.80)
Abb. 19.42 Doppeltlogarithmische Auftragung der Abhängigkeit des Signal/Rausch-Verhältnisses von der Bandbreite B für drei Arten von Empfängern.
1
𝜎𝑞2
1/B
d
B
m0 =
(
W
bipolarer Transistor
id
er
sta
nd
FE T
bipol
Photonenrauschgrenze
B
Abb. 19.43 Doppeltlogarithmische Auftragung der Empfängerempfindlichkeit m0 (die minimale mittlere Zahl von Photoelektronen pro Auflösungszeit T = 1∕2B, die ein minimales Signal/Rausch-Verhältnis SRV0 liefert), als Funktion der Bandbreite B für drei Arten von Empfängern. Die Kurven nähern sich dem Grenzfall des Photonenrauschens bei Werten von B, für die 𝜎q2 ≪ SRV0 ∕4 gilt. In Grenzfall des Photonenrauschens (d. h. wenn das Schaltungsrauschen vernachlässigbar ist), ist in allen Fällen m0 = SRV0 .
695
19 Photodetektoren
Leistungsfähigkeit von Empfängern mit direkter bzw. kohärenter Detektion untersuchen wir im Detail in den Abschnitten 25.2 und 25.4.
Die optimale Wahl des Empfängers hängt unter anderem von der Bandbreite 𝐵 ab. Übung 19-2: Empfindlichkeit eines Lawinenphotodiodenempfängers
Empfindlichkeit eines idealen optischen Empfängers
Leiten Sie einen Ausdruck analog Gl. (19.78) für die Empfindlichkeit eines Empfängers aus einer Lawinenphotodiode mit dem Gewinn 𝐺 und dem Zusatzrauschfaktor 𝐹 her. Zeigen Sie, dass sich die Empfängerempfindlichkeit im Grenzfall vernachlässigbaren Schaltungsrauschens auf m0 = 𝐹 ⋅ SRV0
Wir nehmen an, dass die logischen Zustände „1“ und „0“ des Systems durch die An- bzw. Abwesenheit von optischer Energie bezeichnet werden. Während eines „1“-Bits werden im Mittel n Photonen empfangen. Während des Bits „0“ werden keine Photonen empfangen. Wenn beide Werte gleich wahrscheinlich sind, ist die ge1 samte mittlere Zahl von Photonen pro Bit n𝑎 = n. Da 2 die tatsächlich nachgewiesene Zahl von Photonen stochastisch ist, kommen bei der Identifizierung eines Bits Fehler vor, wie Abb. 19.44(a) illustriert. Für Licht aus den meisten Quellen einschließlich Laserdioden, Lasern und LED gehorcht die Wahrscheinlichkeit, n Photonen nachzuweisen, einer Poissonvertein lung 𝑝(n) = n exp(−n)∕n!, wenn im Durchschnitt n Photonen transmittiert wurden (siehe Abschnitt 13.2.3). Ein idealer Empfänger entscheidet, dass eine „1“ übermittelt wurde, wenn er ein oder mehrere Photonen nachweist. Die Wahrscheinlichkeit 𝑝1 , dass eine „1“ versehentlich für eine „0“ gehalten wird, ist daher gleich der Wahrscheinlichkeit, dass keine Photonen nachgewiesen werden, d. h. 𝑝1 = 𝑝(0) = exp(−n). Wenn „0“ übermittelt wird, gibt es keine Photonen; der Empfänger entscheidet richtig, dass „0“ gesendet wurde, sodass 𝑝0 = 0 ist. Die Bitfehlerrate ist der Mittelwert dieser beiden Fehlerhäu1 figkeiten, BFR = (𝑝1 + 𝑝0 ); daher folgt
(19.81)
reduziert.
19.6.5 Bitfehlerrate und Empfindlichkeit digitaler Empfänger Die Empfindlichkeit eines Analogempfängers wurde in Abschnitt 19.6.4 als die minimale Leistung des empfangenen Lichts (oder der entsprechenden Zahl von Photonen oder Photoelektronen) definiert, die nötig ist, um ein vorgegebenes Signal/Rausch-Verhältnis SRV0 zu erreichen. Wir wenden uns jetzt der Empfindlichkeit eines digitalen Empfängers zu. In diesem Fall ist die Empfindlichkeit als die minimale optische Energie (oder die entsprechende mittlere Zahl von Photonen) pro Bit definiert, die notwendig ist, um eine vorgegebene Bitfehlerrate (BFR) zu erreichen. Für unsere Diskussion gehen wir davon aus, dass das betrachtete System OnOff-Keying (OOK) verwendet, dass also die logischen Zustände „1“ und „0“ eines Bits durch die An- bzw. Abwesenheit eines optischen Pulses codiert werden. Wir bestimmen zuerst die Empfindlichkeit eines idealen Detektors, in dem der Photodetektor eines Quantenausbeute von eins besitzt und nur Photonenrauschen existiert. Anschließend untersuchen wir die Zunahme der Empfindlichkeit (Abnahme der Leistung) aufgrund von Photoelektronenrauschen, Hintergrundrauschen, Gewinnrauschen und Schaltungsrauschen. Die 1 0 1 1 0 1
0 1 0
2
BFR =
1 2
exp(−n) =
empfangene Photonen 1 0 1 0 0 1 0 0 1 dekodierte Bits (a)
10 –9 Fehler
(b)
2
exp(−2n𝑎 ) .
(19.82)
Abb. 19.44 (a) Schematische Illustration von Fehlern, die aus Fluktuationen der Photonenzahl resultieren. (b) Bitfehlerrate (BFR) als Funktion der mittleren Zahl na von Photonen pro Bit in einem digitalen Systems mit einem idealen Empfänger.
1
übertragene Bits
1
Abbildung 19.44 zeigt eine semilogarithmische Auftragung dieser Beziehung. Die Empfängerempfindlichkeit ist als die mittlere Zahl von Photonen pro Bit definiert, die erforderlich ist, damit ein vorgegebener Wert von BFR erreicht wird. Häufig wird BFR = 10−9 gewählt; damit ergibt Gl. (19.82) n𝑎 ≈ 10 Photonen pro Bit. Es gilt also
BFR
696
0
10
a
19.6 Rauschen in Photodetektoren
Die Empfängerempfindlichkeit (für BFR = 10−9 ) eines binären OOK-codierten optischen Nachrichtensystems mit direktem Nachweis, das sich bis auf die Poissonstatistik der nachgewiesenen Photonenzahl in jeder Hinsicht ideal verhält, ist 10 Photonen pro Bit. Die Empfindlichkeit kann im Prinzip durch Verwendung von photonenzahlgequetschtem (sub-Poisson-) Licht verbessert werden (siehe Abschnitt 13.3.3). Übung 19-3: Auswirkung der Quantenausbeute und des Hintergrundrauschens auf die Empfängerempfindlichkeit
(a) Zeigen Sie, dass für einen Empfänger, dessen Detektor eine Quantenausbeute 𝜂 besitzt und der 1 ansonsten ideal ist, BFR = exp(−2𝜂n𝑎 ) gilt, sodass 2 seine Empfindlichkeit n𝑎 = 10∕𝜂 Photonen pro Bit entsprechend m𝑎 = 𝜂n𝑎 = 10 Photoelektronen pro Bit ist. (b) Finden Sie einen Ausdruck für die BFR als Funktion von n und n𝐵 unter der Annahme, dass Bit „1“ und „0“ der mittleren Photonenzahlen n1 = n + n𝐵 bzw. n0 = n𝐵 entsprechen, wobei n die mittlere Zahl von Signalphotonen ist und n𝐵 der Mittelwert eines signalunabhängigen poissonverteilten Hintergrund-Photonenflusses. Tragen Sie die BFR für 1 mehrere Werte von n𝐵 gegen n𝑎 = n auf. Bestimmen 2 Sie die Empfängerempfindlichkeit n𝑎 als Funktion von n𝐵 aus dieser Auftragung. (Hinweis: Die Summe zweier poissonverteilter Zufallszahlen ist ebenfalls poissonverteilt.)
Empfindlichkeit eines Empfängers mit Schaltungsund Gewinnrauschen
Wie in Abschnitt 19.6.1 besprochen wandelt eine Photodiode im Mittel einen Anteil 𝜂 der empfangenen Photonen in Photoelektron-Loch-Paare um, von denen jedes eine Ladung 𝑒 zum elektrischen Strom im äußeren Stromkreis beiträgt. Die im Zeitabstand T der Bits gesammelte Gesamtladung ist m (Elektronen). Diese Zahl ist stochastisch und folgt einer Poissonverteilung mit dem Mittelwert m = 𝜂n und der Varianz m. Durch die Elektronik wird zusätzliches Rauschen in Form eines gaußverteilten stochastischen elektrischen Stroms 𝑖𝑟 mit dem Mittelwert null und der Varianz 𝜎𝑟2 eingeführt. Innerhalb des Zeitabstands T der Bits hat die gesammelte Ladung 𝑞 = 𝑖𝑟 T ∕𝑒 (Elektronen) ein quadratisches Mittel von 𝜎𝑞 = 𝜎𝑟 T ∕𝑒. Der Parameter 𝜎𝑞 , der Schaltungsrauschparameter, hängt wie in Abschnitt 19.6.3 beschrieben von der Bandbreite 𝐵 des Empfängers ab.
Die gesamte gesammelte Ladung 𝑠 = 𝑚 + 𝑞 (Einheiten von Elektronen) pro Bit ist die Summe einer poissonverteilten Zufallsvariable m und einer davon unabhängigen gaußverteilten Zufallsvariable 𝑞. Sein Mittelwert ist die Summe der beiden Mittelwerte, 𝜇 = m = 𝜂n ,
(19.83)
und ihre Varianz ist die Summe der Varianzen, 𝜎2 = m + 𝜎𝑞2 .
(19.84)
Für hinreichend große m kann die Poissonverteilung durch eine Gaußverteilung angenähert werden, sodass die gesamte Verteilung näherungsweise durch eine Gaußverteilung mit dem Mittel 𝜇 und der Varianz 𝜎2 beschrieben werden kann. Diese Näherung werden wir in unserer Analyse anwenden. Für eine Lawinenphotodiode mit dem Gewinn 𝐺 wird die mittlere Zahl von Photoelektronen um einen Faktor 𝐺 verstärkt, dabei wird aber aber zusätzliches Rauschen eingeführt. Im Mittel wird eine Gesamtladung 𝜇 = m𝐺
(19.85)
(in Einheiten von Elektronen) pro Bit gesammelt; die Varianz ist 2
𝜎2 = m 𝐺 𝐹 + 𝜎𝑞2 ,
(19.86)
wobei 𝐹 = ⟨𝐺 2 ⟩∕⟨𝐺⟩2 der Zusatzrauschfaktor der Lawinenphotodiode ist (siehe Abschnitt 19.6.2). Der direkt nachweisende OOK-Empfänger misst die in jedem Bit gesammelte Ladung 𝑠 (z. B. mithilfe eines Integrators) und vergleicht sie mit einem vorgegebenen Schwellenwert 𝜗. Wenn 𝑠 > 𝜗 ist, wird Bit „1“ gewählt, ansonsten Bit „0“. Die Fehlerwahrscheinlichkeiten 𝑝1 und 𝑝0 werden bestimmt, indem man zwei Gaußverteilungen von 𝑠 untersucht: Mittel 𝜇0 = 0 ,
Varianz 𝜎02 = 𝜎𝑞2
für Bit „0“, Mittel 𝜇1 = m 𝐺 ,
2
Varianz 𝜎12 = m 𝐺 𝐹 + 𝜎𝑞2
für Bit „1“. (19.87) Der Wahrscheinlichkeit 𝑝0 , eine „0“ für „1“ zu halten, ist das Integral einer Gaußverteilung 𝑝(𝑠) mit dem Mittel 𝜇0 und der Varianz 𝜎02 von 𝑠 = 𝜗 bis 𝑠 = ∞. Die Wahrscheinlichkeit 𝑝1 , eine „1“ für „0“ zu halten, ist das Integral einer Gaußverteilung mit dem Mittel 𝜇1 und der Varianz 𝜎12 von 𝑠 = −∞ bis 𝑠 = 𝜗. Die Schwelle 𝜗 wird so gewählt, dass die mittlere Fehlerwahrscheinlichkeit 1 BFR = (𝑝0 + 𝑝1 ) minimiert wird. 2
697
698
19 Photodetektoren
Diese Art von Analyse ist die Grundlage der konventionellen Theorie der binären Detektion in Gegenwart von Gaußrauschen, die sehr breit anwendbar ist (wir werden sie auch in Abschnitt 25.4 bei unserer Analyse von kohärenten Kommunikationssystemen einsetzen). Wenn 𝜇0 und 𝜎02 bzw. 𝜇1 und 𝜎12 die Mittelwerte und Varianzen der beiden Gaußvariablen sind, die Bit „0“ bzw. „1“ beschreiben, und wenn 𝜎0 und 𝜎1 viel kleiner sind als 𝜇1 − 𝜇0 , ist die Bitfehlerrate eines Empfängers mit optimaler Schwelle näherungsweise √ 1 BFR ≈ [1 − erf(𝑄∕ 2)] . 2
(19.88)
Dabei ist 𝑄=
𝜇1 − 𝜇0 , 𝜎0 + 𝜎1
(19.89)
und die Definition der Fehlerfunktion erf(𝑧) ist 𝑧
2 erf(𝑧) ≡ √ ∫ exp(−𝑥2 ) d𝑥 . π
(19.90)
0
Aus Gl. (19.88) wissen wir, dass eine BFR von 10−9 einem Wert 𝑄 ≈ 6 entspricht; damit ergibt Gl. (19.89) 𝜇1 − 𝜇0 ≈ 6(𝜎0 + 𝜎1 ) .
(19.92)
Gleichung (19.92) verknüpft die Empfängerempfindlichkeit bezogen auf die mittlere Zahl m𝑎 von Photoelektronen pro Bit, die für BFR = 10−9 erforderlich ist, mit den Parametern 𝐺, 𝐹 und 𝜎𝑞 des Empfängers. Die Näherung ist für die typischen Werte der Parameter in realen Systemen anwendbar. Wenn der Gewinn einer Lawinenphotodiode so groß ist, dass 3𝐺𝐹 ≫ 𝜎𝑞 ist, kann der zweite Term (Schaltungsrauschen) auf der rechten Seite von Gl. (19.92) vernachlässigt werden; man erhält dann m𝑎 ≈ 18𝐹 .
Empfänger
Empfindlichkeit (Photonen/Bit)
photonenbeschränkter idealer Detektor
10
Si-Lawinenphotodiode InGaAs-pin-Photodiode, Vorverstärker Er3+ -dotierte Quarzfaser
125
InGaAs-Lawinenphotodiode pin-Photodiode
215 500 6 000
pro Bit (siehe Übung 19-3). Der Grund für die Diskrepanz ist, dass die Verwendung einer Gauß- anstelle einer Poissonverteilung für diese kleinen Zählraten nicht zulässig ist. Typische Empfindlichkeiten einiger Empfänger sind in Tabelle 19.2 angegeben. Die tatsächlichen Werte hängen vom Schaltungsrauschparameter 𝜎𝑞 des Empfängers ab, der wiederum von der Bitrate 𝐵0 ≡ 1∕T abhängt.
(19.91)
Durch Einsetzen von Gl. (19.87) in Gl. (19.91) und De1 finition von m𝑎 = m als mittlerer Zahl von nachgewie2 senen Photoelektronen pro Bit erhalten wir nach etwas Rechnerei m 𝑎 ≈ 18𝐹 + 6𝜎𝑞 ∕𝐺 .
Tab. 19.2 Typische Empfindlichkeiten (Zahl von Photonen pro Bit) mehrerer optischer OOK-Empfänger mit direktem Nachweis in Anwesenheit von Verstärker- und Schaltungsrauschen für BFR = 10−9 unter der Annahme einer Quantenausbeute des Photodetektors von 𝜂 = 1. Die tatsächlichen Werte hängen auch noch von den Verstärkerparametern G und F sowie dem Schaltungsrauschparameter 𝜎q ab, der wiederum von der Bitrate B0 = 1∕T abhängt.
(19.93)
Nach diesen Berechnungen hat ein Empfänger mit vernachlässigbarem Schaltungsrauschen und einer Photodiode ohne Gewinn (𝐺 = 1 und 𝐹 = 1) eine Empfängerempfindlichkeit von m𝑎 = 18 Photoelektronen pro Bit. Dieses Ergebnis unterscheidet sich von den zuvor für einen idealen Empfänger erhaltenen 10 Photoelektronen
Aufgaben Aufgabe 19-1: Wirkung des Reflexionsgrads auf die Quantenausbeute
Bestimmen Sie den Faktor 1 − ℛ im Ausdruck für die Quantenausbeute bei senkrechtem bzw. 45◦ -Einfall für einen Strahl von unpolarisiertem Licht, das aus der Luft auf Si, GaAs und InSb fällt (siehe Abschnitt 6.2 und Tabelle 17.5). Aufgabe 19-2: Ansprechempfindlichkeit
Bestimmen Sie die maximale Ansprechempfindlichkeit eines idealen (Quantenausbeute eins, Gewinn eins) Halbleiter-Photodetektors aus (a) Si, (b) GaAs, (c) InSb. Aufgabe 19-3: Durchgangszeit
Verwenden Sie die Definitionen aus Abb. 19.6 und nehmen Sie an, dass ein Photon ein Elektronen-Loch-Paar am Ort 𝑥 = w ∕3 erzeugt, dass v E = 3v L ist (in Halbleitern ist v E in der Regel größer als v L ) und dass die Ladungsträger an den Kontakten rekombinieren. Bestimmen Sie für jede Art von Ladungsträger die Beträge 𝑖L und 𝑖E sowie die Dauer 𝜏L und 𝜏E der Ströme. Drücken Sie Ihr Resultat durch 𝑒, w und v E aus. Zeigen Sie, dass die gesamte im Stromkreis induzierte Ladung 𝑒 ist. Skizzieren Sie für
Aufgaben
v E = 6 × 107 cm∕s und w = 10 μm den zeitlichen Verlauf
Aufgabe 19-6: Schaltkreis eines Photoleiters
der Ströme.
Ein photoleitender Detektor wird häufig in Reihe mit einem Lastwiderstand 𝑅 und einer Gleichspannungsquelle 𝑉 verbunden, und die Spannung 𝑉P über den Lastwiderstand wird gemessen. Skizzieren Sie die Abhängigkeit von 𝑉P von P, wenn die Leitfähigkeit des Detektors proportional zur optischen Leistung P ist. Unter welchen Bedingungen ist diese Abhängigkeit linear?
Aufgabe 19-4: Stromantwort bei homogener Beleuchtung
Betrachten Sie ein Halbleitermaterial, das (wie in Abb. 19.6) zur Zeit 𝑡 = 0 von einem Lichtpuls getroffen wird, der 𝑁 Elektron-Loch-Paare gleichverteilt zwischen 0 und w erzeugt. Die Elektronen- bzw. Lochgeschwindigkeiten in dem Material seien v E bzw. v L . Zeigen Sie, dass der Lochstrom als 𝑖L (𝑡) =
2 ⎧ 𝑁𝑒 v L − 2 w
𝑡+
𝑁𝑒 v L w
für 0 ≤ 𝑡 ≤
w vL
für 0 ≤ 𝑡 ≤
w vE
⎨ 0 überall sonst ⎩ geschrieben werden kann, während der Elektronenstrom 𝑖E (𝑡) =
⎧
−
𝑁𝑒 v 2E w2
𝑡+
𝑁𝑒 v E w
⎨ 0 überall sonst ⎩ ist, und dass der Gesamtstrom daher gleich
] ⎧ 𝑁𝑒 [ w 1 2 2 ⎪ w (v L + v E ) − w (v L + v E )𝑡 für 0 ≤ 𝑡 ≤ v E 𝑖(𝑡) = ] ⎨ 𝑁𝑒 v L [ w w vL 1− 𝑡 für ≤𝑡≤ ⎪ w w vE vL ⎩ ist. Die verschiedenen Ströme sind in Abb. 19.7 dargestellt. Zeigen Sie, dass die Elektronen und Löcher jeweils eine Ladung 𝑁𝑒∕2 zu dem Strom im äußeren Stromkreis beitragen, sodass die erzeugte Gesamtladung 𝑁𝑒 ist. Aufgabe 19-5: Zweiphotonendetektoren
Betrachten Sie einen Strahl von Photonen der Energie ℎ𝜈 und der Photonenflussdichte 𝜙 [Photonen/(cm2 s)], der auf einen Halbleiterdetektor mit der Bandlücke ℎ𝜈 < E g < 2ℎ𝜈 trifft; die Energien sollen so gewählt sein, dass ein Photon nicht genügend Energie liefern kann, um ein Elektron vom Valenzband in das Leitungsband anzuregen. Dennoch können zwei Photonen gelegentlich kooperieren und ihre kombinierte Energie auf ein Elektron übertragen. Nehmen Sie an, dass die in einem solchen Detektor induzierte Stromdichte gleich 𝐽P = 𝜁𝜙2 mit einer Konstante 𝜁 ist. Zeigen Sie, dass die Ansprechempfindlichkeit des Zweiphotonendetektors (in A/W) durch ℛ = [𝜁∕(ℎ𝑐0 )2 ]𝜆02 P∕A gegeben ist, wobei P die optische Leistung und A die bestrahlte Fläche des Detektors sind. Deuten Sie die Proportionalität zwischen 𝜆02 und P ∕A physikalisch. Die Zweiphotonenemission verhält sich ähnlich. 13) 13) Siehe M. C. Teich, J. M. Schroer, G. J. Wolga, ‚Double-Quantum Photoelectric Emission from Sodium Metal‘, Physical Review Letters 13, 611–614, 1964.
Aufgabe 19-7: Photoleitfähigkeit
Die Konzentration von Ladungsträgern in einer Probe von intrinsischem Si ist ni = 1.5 × 1010 cm−3 , und die Rekombinationslebensdauer ist 𝜏 = 10 μs. Bestimmen Sie die prozentuale Zunahme der Leitfähigkeit, wenn das Material bei 𝜆0 = 1 μm bestrahlt und eine optische Leistungsdichte von 1 mW∕cm3 absorbiert wird. Die Quan1 tenausbeute ist 𝜂 = . 2
Aufgabe 19-8: Quantenausbeute eines Photodiodendetektors
In einer pin-Photodiode erzeugt ein Lichtpuls aus 6 × 1012 einfallenden Photonen der Wellenlänge 𝜆0 = 1550 nm an den Kontakten des Bauelements 2 × 1012 Elektronen. Bestimmen Sie die Quantenausbeute 𝜂 und die Ansprechempfindlichkeit ℛ der Photodiode bei dieser Wellenlänge. Aufgabe 19-9: Quantenausbeute einer Lawinenphotodiode
Eine konventionelle Lawinenphotodiode mit dem Gewinn 𝐺 = 20 arbeitet bei der Wellenlänge 𝜆0 = 1550 nm. Wie groß ist ihre Quantenausbeute 𝜂, wenn ihre Ansprechempfindlichkeit bei dieser Wellenlänge ℛ = 12 A∕W ist? Wie groß ist der Photostrom am Ausgang des Bauelements, wenn ein Photonenfluss 𝛷 = 1010 Photonen/s bei dieser Wellenlänge auf sie fällt? Aufgabe 19-10: Gewinn einer Lawinenphotodiode
Zeigen Sie, dass eine Lawinenphotodiode mit einem Ionisationsverhältnis k ≈ 1, wie z. B. Germanium, einen Gewinn 𝐺 = 1∕(1 − 𝛼E w ) besitzt, wobei 𝛼E der Ionisationskoeffizient der Elektronen und w die Breite der Verstärkungsschicht bezeichnen. [Achtung: Gleichung (19.27) gibt für k = 1 keine korrekte Antwort!] Aufgabe 19-11: Zusatzrauschfaktor für eine Einladungsträger-Lawinenphotodiode
Zeigen Sie, dass eine konventionelle Lawinenphotodiode mit reiner Elektroneninjektion und ohne Lochverstärkung (k = 0) für alle relevanten Werte des Gewinns einen Zusatzrauschfaktor 𝐹 ≈ 2 besitzt. Verwenden Sie Gl. (19.27), um zu zeigen, dass der mittlere Gewinn dann
699
700
19 Photodetektoren
𝐺 = exp(𝛼E w ) ist. Berechnen Sie die Ansprechempfindlichkeit einer Si-Lawinenphotodiode für Photonen mit der Energie E g der Bandlücke unter der Annahme, dass die Quantenausbeute 𝜂 = 0.8 und der Gewinn 𝐺 = 70 ist. Bestimmen Sie den Zusatzrauschfaktor für eine SiLawinenphotodiode mit Zweiladungsträgerverstärkung für k = 0.01. Vergleichen Sie ihr Ergebnis mit dem im Grenzfall der Einladungsträgerverstärkung erhaltenen Wert 𝐹 ≈ 2. Aufgabe 19-12: Mittlerer Gewinn einer Stufen-Lawinenphotodiode
Verwenden Sie die Bernoulliverteilung, um zu zeigen, dass der mittlere Gewinn einer Mehrschicht-Lawinenphotodiode mit Einladungsträgerverstärkung wie der in Abb. 19.33 gezeigten 𝐺 = (1 + 𝑃)𝑁 ist, wobei 𝑃 die Wahrscheinlichkeit der Stoßionisation auf jeder Stufe und 𝑁 die Zahl der Stufen sind. Zeigen Sie, dass sich das Ergebnis für 𝑃 → 0 und 𝑁 → ∞ auf das einer konventionellen Lawinenphotodiode reduziert. In diesem Grenzfall gibt es unendlich viele Stufen und die Wahrscheinlichkeit, dass ein Ladungsträger durch Stoßionisation auf einer gegebenen Stufe erzeugt wird, ist verschwindend gering. Aufgabe 19-13: Zusatzrauschfaktor für einen einstufigen Sekundärelektronenvervielfacher
führt. Das bestätigt, dass das Erzeugungs-Rekombinations-Rauschen in Photoleitern das Signal/RauschVerhältnis um einen Faktor 2 reduziert. Aufgabe 19-15: Bandbreite einer RC-Schaltung
Benutzen Sie die Definition der Bandbreite aus Gl. (19.46) und zeigen Sie, dass eine Schaltung mit der Impulsantwortfunktion ℎ(𝑡) = 𝑒∕𝜏) exp(−𝑡∕𝜏) eine Bandbreite 𝐵 = 1∕4𝜏 besitzt. Welche Bandbreite hat eine 𝑅𝐶-Schaltung? Bestimmen Sie den thermischen Rauschstrom für einen Widerstand 𝑅 = 1 k˙ bei 𝑇 = 300 K, der mit einer Kapazität 𝐶 = 5 pF verbunden ist. Aufgabe 19-16: Signal/Rausch-Verhältnis eines Lawinenphotodiodenempfängers
Um welchen Faktor ändert sich das Signal/Rausch-Verhältnis eines Empfängers mit einer Lawinenphotodiode mit dem mittleren Gewinn 𝐺 = 100, wenn das Ionisationsverhältnis k von k = 0.1 auf 0.2 vergrößert wird? Nehmen Sie an, dass Schaltungsrauschen vernachlässigbar ist. Zeigen Sie, dass das Signal/Rausch-Verhältnis näherungsweise umgekehrt proportional zu 𝐺 ist, wenn 𝐺 ≫ 1 und 𝐺 ≫ 2(1 − k)∕k gilt. Aufgabe 19-17: Rauschen in einem Lawinenphotodiodenempfänger
(a) Leiten Sie einen Ausdruck für den Zusatzrauschfaktor 𝐹 eines Einstufen-Sekundärelektronenvervielfachers her. Nehmen Sie dabei an, dass die Zahl der emittierten Sekundärelektronen pro einfallendem primären Elektron mit dem Mittelwert 𝛿 poissonverteilt ist. Zeigen Sie, dass das Ergebnis ein Spezialfall des in Gl. (19.56) angegebenen Ergebnisses für einen SEV mit 𝑁 Dynoden ist. (b) Zeigen Sie, dass Gl. (19.56) für 𝑁 identische Dynoden im Grenzfall eines hohen Gewinns (𝐺 ≫ 1) als 1∕𝑁 1∕𝑁 − 1) = 𝛿∕(𝛿 − 1) geschrieben werden 𝐹 ≈ 𝐺 ∕(𝐺 kann. Das bedeutet, dass der Gewinn eines SEV selbst ohne den hohen Gewinn der ersten Dynode nahezu rauschfrei ist.
Ein optischer Lawinenphotodiodenempfänger hat die folgenden Parameter: Quantenausbeute 𝜂 = 0.8, mittlerer Gewinn 𝐺 = 100, Ionisationsverhältnis k = 0.5, Lastwiderstand 𝑅L = 1 k˙, Bandbreite 𝐵 = 100 kHz, Dunkelund Leckstrom = 1 nA. Er empfängt ein optisches Signal der Leistung 10 nW bei 𝜆0 = 0.87 μm. Bestimmen Sie die quadratisch gemittelten unterschiedlichen Rauschströme und das Signal/Rausch-Verhältnis. Nehmen Sie an, dass das Dunkelstrom- und Leckstromrauschen eine Varianz haben, die demselben Gesetz wie das Photostromrauschen folgt, und dass der Empfänger widerstandsbegrenzt ist.
Aufgabe 19-14: Zusatzrauschfaktor eines photoleitenden Detektors
Aufgabe 19-18: Optimaler Gewinn in einer Lawinenphotodiode
Der Gewinn eines photoleitenden Detektors wurde in Abschnitt 19.2 als 𝐺 = 𝜏∕𝜏E berechnet, wobei 𝜏 die Lebensdauer der Elektron-Loch-Rekombination ist und 𝜏E die Durchgangszeit der Elektronen durch die Probe. In Wirklichkeit ist 𝐺 stochastisch, weil 𝜏 als stochastisch angenommen werden kann. Zeigen Sie, dass eine exponentielle Wahrscheinlichkeitsdichte 𝑃(𝜏) = (1∕𝜏) exp(−𝜏∕𝜏) der Lebensdauer der zufälligen Rekombination zu einem Zusatzrauschfaktor 𝐹 = 2
In einem Empfänger mit einer pin-Photodiode ist das Verhältnis der Varianz des Schaltungsrauschens zur Varianz des Photoelektronenrauschens gleich 100. Bestimmen Sie den optimalen mittleren Gewinn für die Maximierung des Signal/Rausch-Verhältnisses und die entsprechende Verbesserung des Signal/Rausch-Verhältnisses, wenn stattdessen eine Lawinenphotodiode mit dem Ionisationsverhältnis k = 0.2 verwendet wird.
Aufgaben
Aufgabe 19-19: Empfängerempfindlichkeit
Bestimmen Sie die Empfängerempfindlichkeit (d. h. die optische Leistung, die erforderlich ist, um SRV = 103 zu erreichen) für einen Photodetektor mit der Quantenausbeute 𝜂 = 0.8 bei 𝜆0 = 1300 nm in einer Schaltung der Bandbreite 𝐵 = 100 MHz, wenn es kein Schaltungsrauschen gibt. Der Empfänger misst den elektrischen Strom 𝑖. Aufgabe 19-20: Rauschvergleich dreier Photodetektoren
Betrachten Sie drei Photodetektoren in Reihe mit einem Lastwiderstand von 50 Ω bei 77 K (der Temperatur flüssigen Stickstoffs), die mit einem optischen System der Wellenlänge 1 μm mit einer Bandbreite von 1 GHz verwendet werden sollen: (i) Eine pin-Photodiode mit der Quantenausbeute 𝜂 = 0.9, (ii) eine Lawinenphotodiode mit der Quantenausbeute 𝜂 = 0.6, dem Gewinn 𝐺 = 100 und dem Ionisationsverhältnis k = 0, (iii) ein zehnstufiger Sekundärelektronenvervielfacher mit der Quantenausbeute 𝜂 = 0.3, dem mittleren Gesamtgewinn 2 𝐺 = 410 und der Varianz 𝜎𝐺2 = 𝐺 ∕4 des Gesamtgewinns. (a) Bestimmen Sie für jeden Detektor das Signal/ Rausch-Verhältnis des Photostroms bei Beleuchtung mit einem Photonenfluss von 1010 s−1 . (b) Welche Bauelemente können das Signal detektieren? Aufgabe 19-21: Empfindlichkeit eines amplitudenmodulierten Empfängers
Ein Empfänger mit vernachlässigbarem Schaltungsrauschen, der Bandbreite 𝐵 und einem Photodetektor mit der Ansprechempfindlichkeit ℛ (in A/W) registriert eine optische Leistung 𝑃(𝑡) = 𝑃0 + 𝑃S cos(2π 𝑓𝑡) mit 𝑓 < 𝐵. Nehmen Sie an, dass 𝑃0 ≫ 𝑃S ist und geben Sie einen Ausdruck für die minimale Modulationsleistung 𝑃S an, die mit einem Signal/Rausch-Verhältnis von 30 dB messbar ist. Welchen Einfluss hat die Hintergrundleistung 𝑃0 auf das minimal messbare Signal 𝑃S ? Aufgabe 19-22: Abhängigkeit der Empfängerempfindlichkeit von der Wellenlänge
Die Empfindlichkeit eines idealen Empfängers (mit einer Quantenausbeute von eins und ohne Schaltungsrauschen) bei einer Wellenlänge von 870 nm ist −76 dBm. Wie groß ist seine Empfindlichkeit bei 1300 nm, wenn er mit derselben Datenrate betrieben wird? Aufgabe 19-23: Bitfehlerraten
Eine quantenbeschränkte pin-Photodiode (kein Rauschen außer Poisson-Photonenrauschen) mit der Quantenausbeute 𝜂 = 1 hält ein vorhandenes optisches Signal der Wellenlänge 𝜆0 = 870 nm und der Leistung P (Bit 1) mit einer Wahrscheinlichkeit von 10−10 für ein fehlen-
des Signal (Bit 0). Wie groß ist die Fehlerwahrscheinlichkeit unter den folgenden Bedingungen: (a) Die Wellenlänge ist 𝜆0 = 1300 nm. (b) Die Leistung ist doppelt so groß wie zuvor. (c) Der Wirkungsgrad beträgt 𝜂 = 0.5. (d) Eine ideale Lawinenphotodiode mit 𝜂 = 1 und Gewinn 𝐺 = 100 (kein Gewinnrauschen). (e) Wie in (d), aber mit einem Zusatzrauschfaktor 𝐹 = 2. Aufgabe 19-24: Empfindlichkeit eines photonenzählenden Empfängers
Ein Photodetektor mit der Quantenausbeute 𝜂 = 0.5 zählt die Photoelektronen, die er in sukzessiven Zeitintervallen der Dauer T = 1 μs empfängt. Bestimmen Sie die Empfängerempfindlichkeit (mittlere Zahl von Photonen, die erforderlich sind, um SRV = 103 zu erreichen) unter der Annahme einer Poissonverteilung für die Photonenzahl. Wie groß ist die zugehörige optische Leistung für eine Wellenlänge 𝜆0 = 870 nm? Wie groß ist die Wahrscheinlichkeit, dass der Detektor null zählt, wenn er diese optische Leistung empfängt? Aufgabe 19-25: Eindynoden-Sekundärelektronenvervielfacher
Betrachten Sie einen Sekundärelektronenvervielfacher mit der Quantenausbeute 𝜂 = 1 und einer einzigen Dynode. Das auf die Kathode einfallende Licht stammt aus einer hypothetischen Photonenquelle, für die die Wahrscheinlichkeit, n Photonen in der Zeit T zu beobachten, durch 𝑝(n) =
⎧
1 2
⎨0 ⎩
für n = 0.1 , ansonsten
gegeben ist. Wenn ein Elektron auf die Dynode trifft, werden entweder zwei oder drei Sekundärelektronen emittiert, die zur Anode gelangen. Die Gewinnverteilung 𝑃(𝐺) ist
𝑃(𝐺) =
⎧ ⎪
1 3 2
⎨3 ⎪ 0 ⎩
für 𝐺 = 2 für 𝐺 = 3 ansonsten.
Es ist daher doppelt so wahrscheinlich, dass drei Elektronen erzeugt werden, als dass nur zwei erzeugt werden. (a) Berechnen Sie das Signal/Rausch-Verhältnis des Photonenzahl am Eingang und vergleichen sie das Ergebnis mit dem einer poissonverteilten Photonenzahl mit demselben Mittelwert. (b) Bestimmen Sie die Wahrscheinlichkeitsverteilung für die Photoelektronenzahl 𝑝(m), das Signal/Rausch-Verhältnis der Photoelektronenzahl und das Verhältnis von Varianz zu Mittelwert
701
702
19 Photodetektoren
(siehe Abschnitt 13.2.4). (c) Zeigen Sie, dass das Verhältnis 𝜎m2 ∕m der Varianz der Photoelektronenzahl zu ihrem Mittelwert von unten gegen eins geht, aber nie gleich eins oder größer wird, wenn die Quantenausbeute 𝜂 abnimmt und gegen null geht. 14) Die Photoelektronenstatistik behält folglich ihren sub-Poisson-Charakter, egal wie klein 𝜂 wird. (d) Bestimmen Sie den mittleren Gewinn ⟨𝐺⟩ und den mittleren quadratischen Gewinn ⟨𝐺 2 ⟩. (e) Bestimmen Sie den Zusatzrauschfaktor 𝐹. (f) Nehmen Sie an, dass die Quantenausbeute des SRV 𝜂 = 1∕4 und die Zähldauer T = 1.3 ns betragen, und bestimmen Sie den mittleren Anodenstrom 𝚤̄ sowie das Signal/Rausch-Verhältnis des Stroms in einer Schaltung mit der Bandbreite 𝐵 = 1∕2T . (g) Bestimmen Sie die Ansprechempfindlichkeit dieses Sekundärelektronenvervielfachers für eine Wellenlänge 𝜆0 = 1550 nm. (h) Erklären Sie, warum Gl. (19.53) für 𝜎𝑖2 hier nicht gilt.
Weiterführende Literatur Photodetektoren
Siehe auch die Weiterführende Literatur in den Kapiteln 17 und 18 B. Nabet (Hrsg.), Photodetectors: Materials, Devices and Applications, Elsevier-Woodhead 2016. S. N. Ahmed, Physics and Engineering of Radiation Detection, Elsevier, 2. Aufl. 2015. A. Beling, J. C. Campbell, ‚Advances in Photodetectors and Optical Receivers‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. D. N. Bose, ‚Photodetectors‘. In: S. S. Jha (Hrsg.), Perspectives in Optoelectronics, World Scientific 1995, Kapitel 6, S. 299–384. Photoemission, Sekundärelektronenvervielfacher und Mikrokanalplatten
A. G. Wright, The Photomultiplier Handbook, Oxford University Press 2017. C. Warner, ‚Photomultiplier Tubes Detect Neutrinos Changing Identities‘, SPIE Professional Magazine 11(2), 20–23, 2016. R. Locher, L. Castiglioni, M. Lucchini, M. Greif, L. Gallmann, J. Osterwalder, M. Hengsberger, U. Keller, ‚Energy-Dependent Photoemission Delays from Noble Metal Surfaces by Attosecond Interferometry‘, Optica 2, 405– 410, 2015. 14) Siehe M. C. Teich, B. E. A. Saleh, ‚Effects of Random Deletion and Additive Noise on Bunched and Antibunched Photon-Counting Statistics‘, Optics Letters 7, 365–367, 1982.
K. Watase, ‚Photomultiplier Tubes: μ PMT is Key to HighPerformance Portable Devices‘, Laser Focus World 49(5) 60–62, 2013. T. Hakamaka et al. (Hrsg.), Photomultiplier Tubes: Basics and Applications, Hamamatsu Photonics, 3. Aufl. 2007. M. Lampton, ‚The MicroChannel Image Intensifier‘, Scientific American 245(5), 62–71, 1981. R. W Engstrom, RCA Photomultiplier Handbook (PMT-62), RCA Electro Optics and Devices 1980. W. Shockley, J. R. Pierce, ‚A Theory of Noise for Electron Multipliers‘, Proceedings of the IRE 26, 321–332, 1938. V. K. Zworykin, G. A. Morton, L. Malter, ‚The Secondary Emission Multiplier – A New Electronic Device‘, Proceedings of the IRE 24, 351–375, 1936. H. Iams, B. Salzberg, ‚The Secondary Emission Phototube‘, Proceedings of the IRE 23, 55–64, 1935. A. Einstein, ‚Über einen die Erzeugung und Verwandlung des Lichtes betreffenden heuristischen Gesichtspunkt‘, Annalen der Physik 322, 132–148, 1905. H. Hertz, ‚Über einen Einfluss des ultravioletten Lichtes auf die elektrische Entladung‘, Annalen der Physik 267, 983–1000, 1887. Photoleitfähigkeit
N. V. Joshi (Hrsg.), Selected Papers on Photoconductivity, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 56). N. V. Joshi, Photoconductivity: Art, Science, and Technology, CRC Press 1990. A. Rose, Concepts in Photoconductivity and Allied Problems, Wiley 1963; Krieger, Nachdruck 1978. Gruppe-IV-, Graphen-, plasmonische und organische Photodetektoren
D. Thomson, A. Zilkie, J. E. Bowers, T. Komljenovic, G. T. Reed, L. Vivien, D. Marris-Morini, E. Cassan, L. Virot, J.-M. Fedeli, J.-M. Hartmann, J. H. Schmid, D.-X. Xu, F. Boeuf, P. O’Brien, G. Z. Mashanovich, M. Nedeljkovic, ‚Roadmap on Silicon Photonics‘, Journal of Optics 18, 073003, 2016. T. Pham, W Du, H. Tran, J. Margetis, J. Tolle, G. Sun, R. A. Soref, H. A. Naseem, B. Li, S.-Q. Yu, ‚Systematic Study of Si-Based GeSn Photodiodes with 2.6 μm Detector Cutoff for Short-Wave Infrared Detection‘, Optics Express 24, 1519–1531, 2016. A. Di Bartolomeo, ‚Graphene Schottky Diodes: An Experimental Review of the Rectifying Graphene/ Semiconductor Heterojunction‘, Physics Reports 606, 1–58, 2016. D. Natali, M. Caironi, ‚Organic Photodetectors‘. In: B. Nabet (Hrsg.), Photodetectors: Materials, Devices and Applications, Elsevier-Woodhead 2016. M. Kielar, O. Dhez, G. Pecastaings, A. Curutchet, L. Hirsch, ‚Long-Term Stable Organic Photodetectors with Ultra
Aufgaben
Low Dark Currents for High Detectivity Applications‘, Scientific Reports 6, 39201, 2016. K.-J. Baeg, M. Binda, D. Natali, M. Caironi, Y.-Y. Noh, ‚Organic Light Detectors: Photodiodes and Phototransistors‘, Advanced Materials 25, 4267–4295, 2013. X. An, F. Liu, Y. J. Jung, S. Kar, ‚Tunable Graphene-Silicon Heterojunctions for Ultrasensitive Photodetection‘, Nano Letters 13, 909–916, 2013. A. V. Zayats, S. A. Maier (Hrsg.), Active Plasmonics and Tuneable Plasmonic Metamaterials, Wiley-Science Wise 2013. L. Vivien, A. Polzer, D. Marris-Morini, J. Osmond, J. M. Hartmann, P. Crozat, E. Cassan, C. Kopp, H. Zimmermann, J. M. Fedeli, ‚Zero-Bias 40 Gbit/s Germanium Waveguide Photodetector on Silicon‘, Optics Express 20, 1096–1101, 2012. H. A. Atwater, A. Polman, ‚Plasmonics for Improved Photovoltaic Devices‘, Nature Materials 9, 205–213, 2010. H. R. Stuart, D. G. Hall, ‚Absorption Enhancement in Silicon-on-Insulator Waveguides Using Metal Island Films‘, Applied Physics Letters 69, 2327–2329, 1996. Photodetektoren im Infrarot
Z. Jaksic, Micro and Nanophotonics for Semiconductor Infrared Detectors: Towards an Ultimate Uncooled Device, Springer 2014. M. A. Kinch, State-of-the-Art Infrared Detector Technology, SPIE Optical Engineering Press 2014. A. Rogalski, Infrared Detectors, CRC Press/Taylor & Francis, 2. Aufl. 2011. C. Jagadish (Hrsg.), Semiconductors and Semimetals. Bd. 84 in S. Gunapala, D. Rhiger (Hrsg.), Advances in Infrared Photodetectors, Academic Press/Elsevier 2011. A. Daniels, Field Guide to Infrared Systems, Detectors, and FPAs, SPIE Optical Engineering Press, 2. Aufl. 2010. H. Schneider, H. C. Liu, Quantum Well Infrared Photodetectors: Physics and Applications, Springer 2007. A. Rogalski (Hrsg.), Selected Papers on Infrared Detectors: Developments, SPIE Optical Engineering Press 2004 (Milestone Series Bd. 179). E. L. Dereniak, G. D. Boreman, Infrared Detectors and Systems, Wiley 1996. A. Rogalski (Hrsg.), Selected Papers on Semiconductor Infrared Detectors, SPIE Optical Engineering Press 1992 (Milestone Series Bd. 66). N. Sclar, ‚Properties of Doped Silicon and Germanium Infrared Detectors‘, Progress in Quantum Electronics 9, 149–257, 1984. R. J. Keyes (Hrsg.), Optical and Infrared Detectors, Bd. 19 in Topics in Applied Physics, Springer, 2. Aufl. 1980. R. K. Willardson, A. C. Beer (Hrsg.), Infrared Detectors II, Bd. 12 in Semiconductors and Semimetals, Academic Press 1977.
R. D. Hudson, Jr., J. W Hudson (Hrsg.), Benchmark Papers in Optics 2: Infrared Detectors, Dowden, Hutchinson & Ross 1975. R. K. Willardson, A. C. Beer (Hrsg.), Infrared Detectors, Bd. 5 in Semiconductors and Semimetals, Academic Press 1970. Lawinenphotodioden und Gewinnrauschen
S. R. Bank, J. C. Campbell, S. J. Maddox, M. Ren, A.-K. Rockwell, M. E. Woodson, S. D. March, ‚Avalanche Photodiodes Based on the AlInAsSb Materials System‘, IEEE Journal of Selected Topics in Quantum Electronics 24, 3800407, 2018. J. C. Campbell, ‚Recent Advances in Avalanche Photodiodes‘, Journal of Lightwave Technology 34, 278–285, 2016. D. Dai, M. Piels, J. E. Bowers, ‚Monolithic Germanium/Silicon Photodetectors with Decoupled Structures: Resonant APDs and UTC Photodiodes‘, IEEE Journal of Selected Topics in Quantum Electronics 20, 3802214, 2014. A. Singh, V. Srivastav, R. Pal, ‚HgCdTe Avalanche Photodiodes: A Review‘, Optics & Laser Technology 43, 1358– 1370, 2011. J. Beck, C. Wan, M. Kinch, J. Robinson, P. Mitra, R. Scritchfield, F. Ma, J. Campbell, ‚The HgCdTe Electron Avalanche Photodiode‘, Journal of Electronic Materials 35, 1166– 1173, 2006. M. M. Hayat, O.-H. Kwon, S. Wang, J. C. Campbell, B. E. A. Saleh, M. C. Teich, ‚Boundary Effects on Multiplication Noise in Thin Heterostructure Avalanche Photodiodes: Theory and Experiment‘, IEEE Transactions on Electron Devices 49, 2114–2123, 2002. P. Yuan, S. Wang, X. Sun, X. G. Zheng, A. L. Holmes, Jr., J. C. Campbell, ‚Avalanche Photodiodes with an Impact-Ionization-Engineered Multiplication Region‘, IEEE Photonics Technology Letters 12, 1370–1372, 2000. M. M. Hayat, B. E. A. Saleh, M. C. Teich, ‚Effect of Dead Space on Gain and Noise of Double-Carrier-Multiplication Avalanche Photodiodes‘, IEEE Transactions on Electron Devices 39, 546–552, 1992. N. Z. Hakim, B. E. A. Saleh, M. C. Teich, ‚Generalized Excess Noise Factor for Avalanche Photodiodes of Arbitrary Structure‘, IEEE Transactions on Electron Devices 37, 599–610, 1990. M. C. Teich, K. Matsuo, B. E. A. Saleh, ‚Excess Noise Factors for Conventional and Superlattice Avalanche Photodiodes and Photomultiplier Tubes‘, IEEE Journal of Quantum Electronics QE-22, 1184, 1986. R. Chin, N. Holonyak, Jr., G. E. Stillman, J. Y. Tang, K. Hess, ‚Impact Ionization in Multilayered Heterojunction Structures‘, Electronics Letters 16, 467–469, 1980. K. Nishida, K. Taguchi, Y. Matsumoto, ‚InGaAsP Heterostructure Avalanche Photodiodes with High Avalanche Gain‘, Applied Physics Letters 35, 251–253, 1979.
703
704
19 Photodetektoren
H. W. Ruegg, ‚An Optimized Avalanche Photodiode‘, IEEE Transactions on Electron Devices ED-14, 239–251, 1967. R. J. Mclntyre, ‚Multiplication Noise in Uniform Avalanche Diodes‘, IEEE Transactions on Electron Devices ED-13, 164–168, 1966. K. M. Johnson, ‚High-Speed Photodiode Signal Enhancement at Avalanche Breakdown Voltage‘, IEEE Transactions on Electron Devices ED-12, 55–63, 1965. Einzelphotonen-Lawinenphotodioden, Si-Sekundärelektronenvervielfacher und supraleitende Einzelphotonendetektoren
S. Piatek, E. Hergert, ‚Detector Options for Low-Light Applications‘, Photonics Spectra 51(10), 54–58, 2017. D. Durini, U. Paschen, A. Schwinger, A. Spickermann, ‚Silicon Based Single-Photon Avalanche Diode (SPAD) Technology for Low-Light and High-Speed Applications‘. In: B. Nabet (Hrsg.), Photodetectors: Materials, Devices and Applications, Elsevier-Woodhead 2016. N. Dinu, ‚Silicon Photomultipliers (SiPM)‘. In: B. Nabet (Hrsg.), Photodetectors: Materials, Devices and Applications, Elsevier-Woodhead 2016. T. Gerrits, A. Lita, B. Calkins, S. W. Nam, ‚Superconducting Transition Edge Sensors for Quantum Optics‘. In: R. H. Hadfield, G. Johansson (Hrsg.), Superconducting Devices in Quantum Optics, Springer 2016. M. D. Eisaman, J. Fan, A. Migdall, S. V. Polyakov, ‚Single-Photon Sources and Detectors‘, Review of Scientific Instruments 82, 071101, 2011. R. H. Hadfield, ‚Single-Photon Detectors for Optical Quantum Information Applications‘, Nature Photonics 3, 696– 705, 2009. A. E. Lita, A. J. Miller, S. W. Nam, ‚Counting Near-Infrared Single-Photons with 95 % Efficiency‘, Optics Express 16, 3032–3040, 2008. D. A. Ramirez, M. M. Hayat, G. Karve, J. C. Campbell, S. N. Torres, B. E. A. Saleh, M. C. Teich, ‚Detection Efficiencies and Generalized Breakdown Probabilities for Nanosecond-Gated Near Infrared Single-Photon Avalanche Photodiodes‘, IEEE Journal of Quantum Electronics 42, 137–145, 2006. G. N. Gol’tsman, O. Okunev, G. Chulkova, A. Lipatov, A. Semenov, K. Smirnov, B. Voronov, A. Dzardanov, C. Williams, R. Sobolewski, ‚Picosecond Superconducting Single-Photon Optical Detector‘, Applied Physics Letters 79, 705–707, 2001. A. Smith (Hrsg.), Selected Papers on Photon-Counting Detectors, SPIE Optical Engineering Press 1998 (Milestone Series Bd. 143). D. H. Andrews, W. F. Brucksch, Jr., W. T. Ziegler, E. R. Blanchard, ‚Attenuated Superconductors I. For Measuring Infra-Red Radiation‘, Review of Scientific Instruments 13, 281–292, 1942.
Detektorarrays und Detektoren für die Bildgebung
X. Sun, J. B. Abshire, J. D. Beck, P. Mitra, K. Reiff, G. Yang, ‚HgCdTe Avalanche Photodiode Detectors for Airborne and Spaceborne Lidar at Infrared Wavelengths‘, Optics Express 25, 16589–16602, 2017. B. Aull, ‚Geiger-Mode Avalanche Photodiode Arrays Integrated to All-Digital CMOS Circuits‘, Sensors 16, 495, 2016. T. Kuroda, Essential Principles of Image Sensors, CRC Press/ Taylor & Francis, 2014. D. Durini (Hrsg.), High Performance Silicon Imaging: Fundamentals and Applications of CMOS and CCD Sensors, Elsevier-Woodhead 2014. G. C. Hoist, T. S. Lomheim, CMOS/CCD Sensors and Camera Systems, SPIE Optical Engineering Press, 2. Aufl. 2011. W. S. Boyle, ‚Nobel Lecture: CCD – An Extension of Man’s View‘, Reviews of Modern Physics 82, 2305–2306, 2010. G. E. Smith, ‚Nobel Lecture: The Invention and Early History of the CCD‘, Reviews of Modern Physics 82, 2307–2312, 2010. A. Rogalski, J. Antoszewski, L. Faraone, ‚Third-Generation Infrared Photodetector Arrays‘, Journal of Applied Physics 105, 091101, 2009. M. G. Kang (Hrsg.), Selected Papers on CCD and CMOS Imagers, SPIE Optical Engineering Press 2003 (Milestone Series Volume Bd. 177). Photonen-, Photoelektronen- und Schaltungsrauschen
E. Sackinger, Analysis and Design of Transimpedance Amplifiers for Optical Receivers, Wiley 2018. S. B. Lowen, M. C. Teich, Fractal-Based Point Processes, Wiley 2005. H. A. Haus, Electromagnetic Noise and Quantum Optical Measurements, Springer 2000. M. C. Teich, B. E. A. Saleh, ‚Branching Processes in Quantum Electronics‘, IEEE Journal of Selected Topics in Quantum Electronics 6, 1450–1457, 2000. A. Papoulis, Probability, Random Variables, and Stochastic Processes, McGraw-Hill, 3. Aufl. 1991. A. van der Ziel, Noise in Solid State Devices and Circuits, Wiley 1986. M. J. Buckingham, Noise in Electron Devices and Systems, Wiley 1983. D. R. Cox, V. Islam, Point Processes, Chapman & Hall 1980. B. E. A. Saleh, Photoelectron Statistics, Springer 1978. J. B. Johnson, ‚The Schottky Effect in Low Frequency Circuits‘, Physical Review 26, 71–85, 1925. W Schottky, ‚Über spontane Stromschwankungen in verschiedenen Elektrizitätsleitern‘, Annalen der Physik 57, 541–567, 1918. S. D. Poisson, Recherches sur la probability des jugements en matiere criminelle et en matiere civile, precedees des regies generates du calcul des probabilites, Bachelier 1837.
705
20 Akustooptik Der Brechungsindex eines optischen Mediums kann durch die Anwesenheit von Schall verändert werden. Die Akustooptik untersucht, wie der Schall die Wirkung des Mediums auf das Licht beeinflusst (Abb. 20.1). Viele nützliche Bauelemente beruhen auf der Fähigkeit des Schalls, Licht zu steuern; dazu gehören optische Modulatoren, Schalter, Ablenker, Filter, Isolatoren, Frequenzschieber und Spektralanalysatoren. Schall ist eine dynamische Deformation, an der wellenartige Schwingungen von Molekülen beteiligt sind, die sich mit einer für das Medium charakteristischen Geschwindigkeit (der Schallgeschwindigkeit) ausbreiten. Als Beispiel ist in Abb. 20.2 eine harmonische ebene Welle von Kompressionen und Entspannungen in einem Gas dargestellt. In den Gebieten, in denen das Schall
Licht
Medium Abb. 20.1 Schall kann die Wirkung eines optischen Mediums auf das Licht verändern. x Entspannung
x
Kompression
Λ
Λ
Brechungsindex
Abb. 20.2 Variation des Brechungsindex infolge einer harmonischen Schallwelle. Das Muster hat eine Periode 𝛬, die Wellenlänge des Schalls, und breitet sich mit Schallgeschwindigkeit aus.
Medium verdichtet wird, sind die Dichte und der Brechungsindex größer; wo das Medium entspannt ist, sind Dichte und Brechungsindex kleiner. In Festkörpern entsteht Schall durch Schwingungen der Moleküle um ihre Gleichgewichtslagen, die die optische Polarisierbarkeit und damit den Brechungsindex verändern. Eine akustische Welle erzeugt eine wellenförmige Störung des Brechungsindex. Das Medium wird zu einem dynamischen Gradientenindexmedium – ein inhomogenes Medium mit einem zeitlich variierenden geschichteten Brechungsindex. Die Theorie der Akustooptik befasst sich mit schallinduzierten Störungen des Brechungsindex und der Ausbreitung des Lichts durch dieses gestörte zeitlich variierende inhomogene Medium. Die Ausbreitung des Lichts in statischen (im Gegensatz zu zeitlich variierenden) inhomogenen (Gradientenindex-) Medien wurde an mehreren Stellen in den Abschnitten 1.3, 2.4.3 und 5.2.3) besprochen. Da optische Frequenzen viel größer sind als akustische, sind die Variationen des Brechungsindex in einem durch Schall gestörten Medium gewöhnlich sehr langsam im Vergleich zu einer optischen Periode. Es existieren daher zwei völlig unterschiedliche Zeitskalen für das Licht und den Schall. Aus diesem Grund ist es möglich, einen adiabatischen Ansatz zu verwenden, in dem die optische Ausbreitung zu jedem Zeitpunkt während des relativ langsamen Verlaufs der akustischen Periode separat gelöst wird, wobei das Material immer als statisches (eingefrorenes) inhomogenes Medium behandelt wird. In dieser quasistationären Näherung wird Akustooptik zur Optik eines inhomogenen (gewöhnlich periodischen) Mediums, das vom Schall kontrolliert wird. Die einfachste Form der Wechselwirkung zwischen Licht und Schall ist die teilweise Reflexion einer optischen ebenen Welle an den geschichteten parallelen Ebenen, die den durch eine akustische ebene Welle hervorgerufenen Variationen des Brechungsindex (Abb. 20.3) entsprechen. Ein Satz paralleler Reflektoren im Abstand der Schallwellenlänge 𝛬 reflektiert das Licht, wenn der Einfallswinkel 𝜃 die braggsche Bedin-
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
706
20 Akustooptik
x einfallendes Licht
θ
θ
20.1.1
gebeugtes Licht
Braggsche Beugung
Wir betrachten eine akustische ebene Welle, die sich in einem Medium mit der Geschwindigkeit 𝑣S , der Frequenz 𝑓 und der Wellenlänge 𝛬 = 𝑣S ∕𝑓 in 𝑥-Richtung ausbreitet. Die Deformation (relative Verschiebung) am Ort 𝑥 zur Zeit 𝑡 ist
z
Λ
𝑠(𝑥, 𝑡) = 𝑆0 cos(𝛺𝑡 − 𝑞𝑥) ,
Schall transmittiertes Licht
Abb. 20.3 Braggsche Beugung: Eine akustische ebene Welle wirkt als partieller Reflektor für Licht (ein Strahlteiler), wenn der Einfallswinkel 𝜃 die braggsche Bedingung erfüllt.
wobei 𝑆0 die Amplitude ist, 𝛺 = 2π 𝑓 die Kreisfrequenz und 𝑞 = 2π∕𝛬 die Wellenzahl. Die akustische Intensität (W∕m2 ) ist 1
gung Gl. (2.58) für konstruktive Interferenz erfüllt, sin 𝜃 =
𝜆 , 2𝛬
(20.1)
wobei 𝜆 die Lichtwellenlänge im Medium ist (siehe Übung 2-11 und Gl. (7.49)). Diese Form der Wechselwirkung zwischen Licht und Schall ist als braggsche Beugung, braggsche Reflexion oder braggsche Streuung bekannt. Das zugehörige Bauelement heißt Braggreflektor, Braggdeflektor, Braggzelle, akustooptische Zelle oder akustooptischer Modulator.
In diesem Kapitel . . . In Abschnitt 20.1 wird eine einfache Theorie der Optik von Braggreflektoren für lineare, nichtdispersive und isotrope Medien vorgestellt. Obwohl die Theorie auf der Wellenoptik beruht, geben wir auch eine einfache Quanteninterpretation der Ergebnisse. In Abschnitt 20.2 wird die Verwendung von Braggzellen für die Lichtmodulation und das Scannen besprochen. Abschnitt 20.3 gibt eine kurze Einführung in anisotrope und Polarisationseffekte in der Akustooptik.
20.1 Die Wechselwirkung von Licht und Schall In dem folgenden Abschnitt wird die Wirkung einer akustischen Skalarwelle auf eine optische Skalarwelle beschrieben. Wir betrachten zuerst optische und akustische ebene Wellen und untersuchen anschließend die Wechselwirkung von optischen und akustischen Strahlen.
(20.2)
𝐼S = 𝜚 𝑣S3 𝑆02 , 2
(20.3)
wobei 𝜚 die Massendichte des Mediums ist. Wir nehmen an, dass das Medium optisch transparent und der Brechungsindex ohne Schall 𝑛 ist. Die Deformation 𝑠(𝑥, 𝑡) bewirkt eine proportionale Störung des Brechungsindex, die wir mithilfe einer Taylorentwicklung ähnlich der für den Pockelseffekt in Gl. (21.4) verwendeten bestimmen können, 1
Δ𝑛(𝑥, 𝑡) = − p𝑛3 𝑠(𝑥, 𝑡) , 2
(20.4)
wobei p ein dimensionsloser phänomenologischer Koeffizient ist, der als photoelastische Konstante (oder spannungsoptischer Koeffizient) bezeichnet wird. Das negative Vorzeichen zeigt, dass eine positive Deformation (Expansion) zu einer Reduktion des Brechungsindex führt. Demzufolge hat das Medium einen zeitlich variierenden inhomogenen Brechungsindex in Form einer Welle 𝑛(𝑥, 𝑡) = 𝑛 − Δ𝑛0 cos(𝛺𝑡 − 𝑞𝑥)
(20.5)
mit der Amplitude 1
Δ𝑛0 = p𝑛3 𝑆0 . 2
(20.6)
Wenn wir Gl. (20.3) in Gl. (20.6) einsetzen, finden wir, dass die Änderung des Brechungsindex proportional zur Wurzel aus der akustischen Intensität ist, √ 1 ℳ𝐼S , (20.7) Δ𝑛0 = 2
wobei ℳ=
p2 𝑛6 𝜚 𝑣S3
(20.8)
ein Materialparameter ist, der beschreibt, wie wirksam der Schall den Brechungsindex ändert. Die Größe ℳ ist ein Bewertungskriterium für die Kraft des akustooptischen Effekts in dem betreffenden Material.
20.1 Die Wechselwirkung von Licht und Schall
x
Amplitudenreflexionsgrad für eine Gesamtlänge 𝐿 (siehe Abb. 20.4) die Summe aller infinitesimalen Reflexionsgrade,
q k
L 2
kr L
0 –L 2 L sin θ
z
𝐿∕2
r = ∫ ei2𝑘𝑥 sin 𝜃 −𝐿∕2
L sin θ
Abb. 20.4 Reflexionen an den Schichten eines inhomogenen Mediums.
Beispiel 20-1: Bewertungskriterium für den akustooptischen Effekt in Flintglas
Für hochdichtes Flintglas ist 𝜚 = 6.3 × 103 kg∕m3 , 𝑣𝑆 = 3.1 km∕s, 𝑛 = 1.92 und p = 0.25, sodass sich ℳ = 1.67 × 10−14 m2 ∕W ergibt. Eine akustische Welle der Intensität 10 W∕cm2 erzeugt eine Brechungsindexwelle der Amplitude Δ𝑛0 = 2.89 × 10−5 . Wir betrachten nun eine optische ebene Welle, die sich in diesem Medium mit der Frequenz 𝜈, der Kreisfrequenz 𝜔 = 2π 𝜈, der Vakuumwellenlänge 𝜆0 = 𝑐0 ∕𝜈 und der Wellenlänge 𝜆 = 𝜆0 ∕𝑛 im ungestörten Medium entsprechend einer Wellenzahl 𝑘 = 𝑛𝜔∕𝑐0 ausbreitet, wobei der Wellenvektor k in der 𝑥𝑧-Ebene liegt und einen Winkel 𝜃 mit der 𝑧-Achse einschließt, wie Abb. 20.4 zeigt. Weil die akustische Frequenz 𝑓 normalerweise viel kleiner ist als die optische Frequenz 𝜈 (um mindestens fünf Größenordnungen), kann ein adiabatischer Ansatz verwendet werden, um die Wechselwirkung zwischen Licht und Schall zu untersuchen: Wir betrachten den Brechungsindex als eine statische „eingefrorene“ sinusförmige Funktion 𝑛(𝑥) = 𝑛 − Δ𝑛0 cos(𝑞𝑥 − 𝜑)
dr d𝑥 . d𝑥
(20.10)
Der Phasenfaktor ei2𝑘𝑥 sin 𝜃 berücksichtigt, dass die reflektierte Welle an einem Ort 𝑥 um eine Entfernung 2𝑥 sin 𝜃 entsprechend einer Phasenverschiebung 2𝑘𝑥 sin 𝜃 gegenüber der reflektierten Welle bei 𝑥 = 0 fortgeschritten ist. Die Wellenzahlen der einfallenden und reflektierten Wellen werden als identisch angenommen. Wir verwenden Gl. (20.9) und schreiben dr dr d𝑛 dr = = 𝑞 Δ𝑛0 sin(𝑞𝑥 − 𝜑) , d𝑥 d𝑛 d𝑥 d𝑛
(20.11)
wobei die Ableitung dr∕ d𝑛, die aus den Fresnelgleichungen der Reflexion bestimmt werden kann, nicht von 𝑥 abhängt, wie wir später zeigen werden. Wir setzen nun Gl. (20.11) in Gl. (20.10) ein und verwenden die komplexe Notation sin(𝑞𝑥 − 𝜑) = [ei(𝑞𝑥−𝜑) − e−i(𝑞𝑥−𝜑)]∕2i; so erhalten wir 1 2
r=
1 ir0 ei𝜑 𝐿
𝐿
∫ ei(2𝑘 sin 𝜃−𝑞)𝑥 d𝑥 − ir0 e−i𝜑
1 𝐿
1
− 𝐿 2
1 2
𝐿
× ∫ ei(2𝑘 sin 𝜃+𝑞)𝑥 d𝑥
(20.12)
1
− 𝐿 2
(20.9)
mit einer festen Phase 𝜑; wir bestimmen das von diesem inhomogenen (Gradientenindex-) Medium reflektierte Licht und verfolgen seine langsame Variation mit der Zeit, indem wir 𝜑 = 𝛺𝑡 setzen. Um die Amplitude der reflektierten Welle (mit dem Wellenvektor kr ) zu bestimmen, unterteilen wir das Medium in infinitesimale ebene Schichten senkrecht zur 𝑥-Achse. Die einfallende optische ebene Welle wird wegen der Änderung des Brechungsindex an jeder Schicht teilweise reflektiert. Wir nehmen an, dass der Reflexionsgrad so klein ist, dass das von einer Schicht transmittierte Licht seinen ursprünglichen Betrag näherungsweise behält (d. h. nicht gedämpft wird), während es durch die folgenden Schichten des Mediums hindurchtritt. Wenn Δr = (dr∕ d𝑥) Δ𝑥 der infinitesimale komplexe Amplitudenreflexionsgrad einer Schicht der infinitesimalen Dicke Δ𝑥 am Ort 𝑥 ist, ist der gesamte komplexe
mit 1
r0 = Δ𝑛0 𝑞𝐿 2
dr . d𝑛
(20.13)
Durch Auswertung der Integrale in Gl. (20.12) und Einsetzen von 𝜑 = 𝛺𝑡 erhalten wir r = r+ + r−
(20.14)
mit r± = ±ir0 sinc [(2𝑘 sin 𝜃 ∓ 𝑞)
𝐿 ±i𝛺𝑡 ]e 2π
(20.15)
und sinc(𝑥) = sin(π𝑥)∕(π𝑥). Aus Gründen, die in Kürze verständlich werden, werden die Terme r+ und r− aufwärts- bzw. abwärtsverschobene Braggreflexionen genannt. Die aufwärtsverschobene Reflexion r+ wird für 2𝑘 sin 𝜃 = 𝑞 maximal, die abwärtsverschobene für 2𝑘 sin 𝜃 = −𝑞. Wenn 𝐿 hinreichend groß ist, sind diese Maxima deutlich ausgeprägt, sodass jede Abweichung von dem Winkel 𝜃 =
707
708
20 Akustooptik
einfallendes Licht
gebeugtes Licht
kr θ
θ
q
θ θ
2π Λ
k 2π λ
Λ
Abb. 20.5 Die braggsche Bedingung sin 𝜃ℬ = q∕2k ist äquivalent zu der Vektorbeziehung kr = k + q. Für eine nach oben wandernde Schallwelle schließen die Richtungen der einfallenden optischen Welle und der Schallwelle einen spitzen Winkel ein und die Frequenz der gebeugten Welle ist aufwärtsverschoben.
Schall
−1
± sin (𝑞∕2𝑘) den entsprechenden Term vernachlässigbar macht. Daher kann für jeden Winkel 𝜃 höchstens einer dieser beiden Terme signifikant sein. Wir betrachten zuerst die Bedingung für Aufwärtsverschiebung, 2𝑘 sin 𝜃 ≈ 𝑞, für die die abwärtsverschobene Reflexion vernachlässigbar ist, und diskutieren den abwärtsverschobenen Fall später.
0, 𝑘 cos 𝜃) die Komponenten der Wellenvektoren der Schallwelle, der einfallenden Lichtwelle und der reflektierten Lichtwelle sind, ist die Bedingung 𝑞 = 2𝑘 sin 𝜃ℬ äquivalent zu der Vektorbeziehung kr = k + q ,
(20.17)
die durch das Vektordiagramm in Abb. 20.5 illustriert wird.
Die braggsche Bedingung
Die Spaltfunktion in Gl. (20.15) nimmt ihren Maximalwert 1.0 an, wenn ihr Argument null ist, d. h. wenn für die aufwärtsverschobene Reflexion 𝑞 = 2𝑘 sin 𝜃 ist. Das ist dann der Fall, wenn 𝜃 gleich dem braggschen Win−1 kel 𝜃ℬ = sin (𝑞∕2𝑘) ist. Wegen 𝑞 = 2π∕𝛬 und 𝑘 = 2π∕𝜆 folgt 𝜆 . (20.16) 2𝛬 Der braggsche Winkel ist der Winkel, für den die infinitesimalen Reflexionen an Ebenen im Abstand der akustischen Wellenlänge 𝛬 eine Phasenverschiebung von 2π haben, sodass sie konstruktiv interferieren [siehe Übung 2-11 und Gl. (7.44)]. sin 𝜃ℬ =
Beispiel 20-2: Der braggsche Winkel für Flintglas
Eine akustooptische Zelle besteht aus Flintglas mit der Schallgeschwindigkeit 𝑣S = 3.1 km∕s und dem Brechungsindex 𝑛 = 1.92. Der braggsche Winkel für die Reflexion einer optischen Welle der Vakuumwellenlänge 𝜆0 = 633 nm (𝜆 = 𝜆0 ∕𝑛 ≈ 330 nm) durch eine Schallwelle der Frequenz 𝑓 = 100 MHz (𝛬 = 𝑣S ∕𝑓 = 31 μm) ist 𝜃ℬ = 5.3 mrad ≈ 0.30◦ . Dieser Winkel gilt innerhalb des Mediums. Wenn sich die Zelle in Luft ′ befindet, entspricht 𝜃ℬ einem externen Winkel 𝜃ℬ ≈ 𝑛𝜃ℬ = 0.59◦ . Eine Schallwelle mit einer zehnmal größeren Frequenz (𝑓 = 1 GHz) entspricht einem braggschen Winkel 𝜃ℬ = 3.0◦ . Die braggsche Bedingung kann auch als einfache Beziehung zwischen den Wellenvektoren der Schallwelle und der optischen Welle formuliert werden. Wenn q = (𝑞, 0, 0), k = (−𝑘 sin 𝜃, 0, 𝑘 cos 𝜃) und kr = (𝑘 sin 𝜃,
Toleranz in der braggschen Bedingung
Die Abhängigkeit des komplexen Amplitudenreflexionsgrads von dem Winkel 𝜃 wird durch die symmetrische Funktion sinc[(𝑞 − 2𝑘 sin 𝜃)𝐿∕2π] = sinc[(sin 𝜃 − sin 𝜃ℬ )2𝐿∕𝜆] in Gl. (20.15) bestimmt. Diese Funktion erreicht ihr Maximum für 𝜃 = 𝜃ℬ und fällt scharf ab, wenn 𝜃 sich von 𝜃ℬ unterscheidet. Für sin 𝜃 − sin 𝜃ℬ = 𝜆∕2𝐿 erreicht die Spaltfunktion ihre erste Nullstelle und die Reflexion verschwindet (Abb. 20.6). Da 𝜃ℬ normalerweise sehr klein ist, ist sin 𝜃 ≈ 𝜃 und die Reflexion verschwindet bei einer Abweichung des Winkels vom braggschen Winkel von ungefähr 𝜃 − 𝜃ℬ ≈ 𝜆∕2𝐿. Da 𝐿 normalerweise viel größer ist als 𝜆, ist das eine äußerst kleine Winkelabweichung. Diese scharfe Reduktion des Reflexionsgrads für geringe Abweichungen vom braggschen Winkel kommt durch die destruktive Interferenz zwischen den infinitesimalen Reflexionen an der Schallwelle zustande. Dopplerverschiebung
Nach Gl. (20.15) ist der komplexe Amplitudenreflexionsgrad r+ proportional zu exp(i𝛺𝑡). Da die Kreisfrequenz des einfallenden Lichts 𝜔 ist [d. h. 𝐸 ∝ exp(i𝜔𝑡)], besitzt die reflektierte Welle 𝐸r = r+ 𝐸 ∝ exp[i(𝜔 + 𝛺)𝑡] die Kreisfrequenz 𝜔r = 𝜔 + 𝛺 .
(20.18)
Die Reflexion wird daher von einer der Frequenzverschiebung begleitet, die gleich der Schallfrequenz ist. Dieser Effekt kann als Dopplerverschiebung aufgefasst werden (siehe Übung 2-12 und Abschnitt 14.3.4). Das einfallende Licht wird an Oberflächen reflektiert,
20.1 Die Wechselwirkung von Licht und Schall
gebeugtes Licht
θ
Abb. 20.6 Abhängigkeit des Reflexionsgrads |r|2 von dem Winkel 𝜃 . Maximale Reflexion tritt für den braggschen −1 Winkel 𝜃ℬ = sin (𝜆∕2𝛬) auf.
|2
einfallendes Licht
θ
λ
2L Λ Schall
die sich mit einer Geschwindigkeit 𝑣S bewegen. Seine dopplerverschobene Kreisfrequenz ist daher 𝜔r = 𝜔(1 + 2𝑣S sin 𝜃∕𝑐), wobei 𝑣S sin 𝜃 die Komponente der Geschwindigkeit dieser Oberflächen in der Richtung der einfallenden bzw. reflektierten Wellen ist. Wenn wir die Beziehungen sin 𝜃 = 𝜆∕2𝛬, 𝑣S = 𝛬𝛺∕2π und 𝑐 = 𝜆𝜔∕2π benutzen, erhalten wir wieder Gl. (20.18). Der Betrag der Dopplerverschiebung ist gleich der Schallfrequenz. Wegen 𝛺 ≪ 𝜔 sind die Frequenzen der einfallenden und reflektierten Wellen näherungsweise gleich (mit einem Fehler kleiner als 10−5 ). Die Wellenlängen der beiden Wellen sind daher ebenfalls näherungsweise gleich. In Gl. (20.10) hatten wir diese Annahme implizit verwendet, da wir dieselbe Wellenzahl 𝑘 für die beiden Wellen eingesetzt hatten. Außerdem hatten wir bei der Erstellung des Vektordiagramms in Abb. 20.5 angenommen, dass die Vektoren kr und k näherungsweise dieselbe Länge 𝑛𝜔∕𝑐0 haben. Der maximale Reflexionsgrad
Der Reflexionsgrad ℛ = |r+ |2 ist das Verhältnis der Intensität der reflektierten optischen Welle zu der der einfallenden optischen Welle. Am braggschen Winkel 𝜃 = 𝜃ℬ liefert Gl. (20.15) ℛ = |r0 |2 . Wenn wir aus Gl. (20.13) substituieren, erhalten wir ℛ=
|| dr ||2 Δ𝑛02 𝑞2 𝐿2 ||| ||| . || d𝑛 || 4 1
(20.19)
Einen Ausdruck für die Ableitung dr∕ d𝑛 können wir aus den Fresnelgleichungen erhalten (siehe Abschnitt 6.2), indem wir den inkrementellen komplexen Amplitudenreflexionsgrad Δr als Funktion der inkrementellen Änderung Δ𝑛 des Brechungsindex zwischen zwei angrenzenden Schichten bestimmen. Für TE- (orthogonale) Polarisation verwenden wir Gl. (6.34) mit 𝑛1 = 𝑛 + Δ𝑛, 𝑛2 = 𝑛 und 𝜃1 = 90◦ − 𝜃, und 𝜃2 bestimmen wir aus dem snelliusschen Gesetz 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 . Wenn Terme zweiter Ordnung in Δ𝑛 vernachlässigt wer2 den, ist das Ergebnis Δr = −Δ𝑛∕2𝑛 sin 𝜃 und somit dr −1 . = 2 d𝑛 2𝑛 sin 𝜃
θB
0
(20.20)
θ
Analog verwenden wir Gl. (6.35) für TM- (parallele) Polarisation; wir erhalten dr − cos 2𝜃 = . 2 d𝑛 2𝑛 sin 𝜃
(20.21)
In den meisten akustooptischen Bauelementen ist 𝜃 sehr klein, sodass cos 2𝜃 ≈ 1 ist und wir Gl. (20.20) näherungsweise für beide Polarisationen verwenden können. Wenn wir r0 aus Gl. (20.20) in Gl. (20.19) einsetzen und die braggsche Bedingung 𝑞 = 2𝑘 sin 𝜃 = (4π 𝑛 sin 𝜃∕𝜆0 ) verwenden, erhalten wir 2
ℛ=
𝐿 π2 ) Δ𝑛02 . ( 2 sin 𝜃 𝜆0
(20.22)
Aus Gl. (20.7) ergibt sich schließlich der Reflexionsgrad 2
ℛ=
𝐿 π2 ) ℳ𝐼S ; ( 2𝜆02 sin 𝜃
(20.23)
er ist proportional zur Intensität 𝐼S der akustischen Welle, zu dem in Gl. (20.8) definierten Materialparameter ℳ und zum Quadrat der schrägen Entfernung 𝐿∕ sin 𝜃, die das Licht in die akustische Welle eindringt. Wir setzen sin 𝜃 = 𝜆∕2𝛬 in Gl. (20.23) ein; das ergibt ℛ = 2π2 𝑛2
𝐿 2 𝛬2 ℳ𝐼S . 𝜆04
(20.24)
Der Reflexionsgrad ist also umgekehrt proportional zu 𝜆04 (oder direkt proportional zu 𝜔4 ). Die Abhängigkeit des Wirkungsgrads der Streuung von der vierten Potenz der optischen Frequenz ist für Lichtstreuung charakteristisch (siehe die Abschnitte 5.6.2, 10.3.1 und 14.5.3). Die Proportionalität zwischen dem Reflexionsgrad und der Schallintensität wirft ein Problem auf. Wenn die Schallintensität zunimmt, würde ℛ schließlich größer als eins werden, und das reflektierte Licht wäre intensiver als das einfallende! Dieses inakzeptable Ergebnis ist eine Folge der Tatsache, dass die Annahmen hinter dieser vereinfachten Theorie verletzt sind. Wir hatten angenommen, dass die infinitesimale Reflexion an
709
20 Akustooptik
Reflexionsgrad e
710
Abwärtsverschobene braggsche Beugung
1
0
0
Schallintensität Is
Abb. 20.7 Abhängigkeit des exakten Reflexionsgrads ℛe des Braggreflektors von der Schallintensität IS . Wenn IS klein ist, ist ℛe ≈ ℛ eine lineare Funktion von IS .
jeder Schicht zu klein ist, um die transmittierte Welle merklich zu dämpfen, bevor sie an den anschließenden Schichten reflektiert wird. Offensichtlich gilt diese Annahme nicht, wenn die Schallwelle sehr intensiv ist. In Wirklichkeit tritt dann Sättigung ein und stellt sicher, dass ℛ nie größer als eins wird (Abschnitt 7.1.3). Eine sorgfältigere Analyse (siehe Abschnitt 20.1.2), die die Dämpfung der einfallenden optischen Welle berücksichtigt, führt zu folgendem Ausdruck für den Reflexionsgrad: √ 2 ℛe = sin ℛ ,
(20.25)
in dem ℛ der ungefähre Ausdruck gemäß Gl. (20.23) ist und ℛe den exakten Ausdruck bezeichnet. Diese Beziehung ist√in Abb.√20.7 illustriert. Für ℛ ≪ 1 ist offensichtlich sin ℛ ≈ ℛ, sodass ℛe ≈ ℛ ist.
Eine andere mögliche Anordnung für die braggsche Beugung ist diejenige, für die 2𝑘 sin 𝜃 = −𝑞 ist. Das ist der Fall, wenn der Winkel 𝜃 negativ ist; d. h. die einfallende optische Welle schließt einen stumpfen Winkel mit der Schallwelle ein, wie Abb. 20.8 illustriert. In diesem Fall nimmt der Reflexionsgrad r− für Abwärtsverschiebung in Gl. (20.15) seinen maximalen Wert an, während der Reflexionsgrad r+ für Aufwärtsverschiebung vernachlässigbar ist. Der komplexe Amplitudenreflexionsgrad ist dann r− = −ir0 e−i𝛺𝑡 .
(20.26)
In dieser Anordnung ist die Frequenz der reflektierten Welle abwärtsverschoben, sodass 𝜔S = 𝜔 − 𝛺
(20.27)
ist und die Wellenvektoren des Lichts und der Schallwellen die Beziehung kS = k − q
(20.28)
erfüllen, wie in Abb. 20.8 gezeigt. Gleichung (20.28) ist eine Phasenbedingung, die sicherstellt, dass die Reflexionen des Lichts sich phasengleich addieren. Das Frequenzverschiebung in Gl. (20.27) steht mit der Interpretation als Dopplerverschiebung im Einklang, da das Licht und die Schallwelle sich in derselben Richtung ausbreiten.
Beispiel 20-3: Reflexionsgrad eines Braggreflektors aus Flintglas
Eine Quanteninterpretation
Eine Braggzelle besteht aus hochdichtem Flintglas mit dem Materialparameter ℳ = 1.67 × 10−14 m2 ∕W (siehe Beispiel 20-1). Für 𝜆0 = 633 nm (die Wellenlänge eines He-Ne-Lasers), eine Schallintensität 𝐼𝑆 = 10 W∕cm2 und eine Eindringtiefe 𝐿∕ sin 𝜃 = 1 mm des Lichts in den Schall ist ℛ = 0.0206 und ℛe = 0.0205; annähernd 2 % des einfallenden Lichts werden also reflektiert. Wenn die Schallintensität auf 100 W∕cm2 erhöht wird, wird ℛ = 0.206 und ℛe = 0.192, sodass der Reflexionsgrad auf ≈ 19 % zunimmt.
Nach der Quantentheorie des Lichts (siehe Kapitel 13) wird eine optische Welle der Kreisfrequenz 𝜔 mit dem Wellenvektor k als Strom von Photonen aufgefasst, von denen jedes eine Energie ℏ𝜔 und einen Impuls ℏk besitzt. Eine akustische Welle der Kreisfrequenz 𝛺 mit dem Wellenvektor q wird als Strom von akustischen Quanten, sogenannten Phononen, aufgefasst, von denen jedes eine Energie ℏ𝛺 und einen Impuls ℏq besitzt. Eine Wechselwirkung von Licht und Schall tritt ein, wenn sich ein Photon mit einem Phonon vereinigt und
x transmittiertes Licht k θ θ
θ
einfallendes Licht
–q
θ θ
kS 2π λ
Λ
Schall
gebeugtes Licht
2π Λ
Abb. 20.8 Geometrie der abwärtsverschobenen Reflexion des Lichts durch Schall. Die Frequenz der reflektierten Welle ist abwärtsverschoben.
20.1 Die Wechselwirkung von Licht und Schall
Photon hω
Photon hωr
Wenn wir annehmen, dass das einfallende Licht eine ebene Welle
Phonon hΩ
ℰ = Re{𝐴 exp[i(𝜔𝑡 − k ⋅ r)]}
Abb. 20.9 Braggsche Beugung aus dem Blickwinkel der Quantentheorie: Ein Photon vereinigt sich mit einem Phonon, um ein neues Photon mit einer neuen Frequenz und einem neuen Impuls zu erzeugen.
ein neues Photon mit der Summenenergie und dem Summenimpuls erzeugt. Ein einfallendes Photon der Frequenz 𝜔 mit dem Wellenvektor k wechselwirkt mit einem Phonon der Frequenz 𝛺 mit dem Wellenvektor q, um ein neues Photon der Frequenz 𝜔r mit dem Wellenvektor kr zu erzeugen, wie in Abb. 20.9 dargestellt. Die Erhaltung von Energie und Impuls erfordert, dass ℏ𝜔r = ℏ𝜔 + ℏ𝛺 und ℏkr = ℏk + ℏq sein muss; daraus ergeben sich wieder die Gleichung 𝜔r = 𝜔 + 𝛺 für die Dopplerverschiebung und die braggsche Bedingung kr = k + q. In dieser Form gilt die Argumentation für aufwärtsverschobene Braggbeugung; ein paralleles Argument existiert aber auch für den Fall der abwärtsverschobenen Beugung. Die beschriebene Quanteninterpretation ähnelt der in Abschnitt 14.5.3 für die Brillouin- und Ramanstreuung vorgestellten.
20.1.2 Die Theorie gekoppelter Wellen Braggsche Beugung als Streuprozess
Wie in Abschnitt 5.2.3 beschrieben wird die Lichtausbreitung durch ein homogenes Medium mit einer langsam variierenden inhomogenen Störung Δ𝑛 des Brechungsindex durch die Wellengleichung ∇2 ℰ −
1 𝜕2ℰ ≈ −𝒮 𝑐2 𝜕𝑡2
(20.29)
beschrieben, wobei 𝒮 = −𝜇0
𝜕2 𝜕 2 Δ𝒫 = −2𝜇 𝜀 𝑛 (Δ𝑛ℰ) 0 o 𝜕𝑡2 𝜕𝑡2
(20.30)
eine zur zweiten Ableitung des Produkts Δ𝑛ℰ proportionale Strahlungsquelle ist [siehe Gl. (5.35)]. Für die braggsche Beugung wird die Störung Δ𝑛 durch die Schallwelle erzeugt, sodass die Streuquelle 𝒮 sowohl vom akustischen als auch vom optischen Feld ℰ abhängt, zu dem wiederum sowohl die einfallenden als auch die gestreuten Felder gehören. Eine Näherung für die Lösung dieses Streuproblems ist die erste bornsche Näherung. Sie beruht auf der Annahme, dass die Streuquelle 𝒮 dem einfallenden (und nicht dem tatsächlichen) Feld entspricht. Sobald wir die Streuquelle kennen, können wir dann die Wellengleichung für das gestreute Feld lösen.
(20.31)
und die durch die akustische Welle verursachte Störung eine ebene Welle Δ𝑛 = −Δ𝑛0 cos(𝛺𝑡 − q ⋅ r)
(20.32)
ist, können wir diese Funktionen in Gl. (20.30) einsetzen und die Terme des Produkts Δ𝑛ℰ umordnen; so erhalten wir Δ𝑛0 ( 2 ) 𝑘r Re {𝐴 exp [i(𝜔r 𝑡 − kr ⋅ r)]} 𝑛 ) (20.33) +𝑘S2 Re {𝐴 exp [i(𝜔S 𝑡 − kS ⋅ r)]}
𝒮 = −(
mit 𝜔r = 𝜔 + 𝛺, kr = k + q, 𝑘r = 𝜔r ∕𝑐, 𝜔S = 𝜔 − 𝛺, kS = k − q und 𝑘S = 𝜔S ∕𝑐. Ex existieren also zwei Lichtquellen der Frequenzen 𝜔 ± 𝛺 und der Wellenvektoren k ± q, die eine aufwärts- bzw. abwärtsverschobene braggreflektierte Welle emittieren können. Aufwärtsverschobene Reflexion tritt ein, wenn der Betrag des Vektors k + q gleich 𝜔r ∕𝑐 ≈ 𝜔∕𝑐 ist, wie aus dem Vektordiagramm in Abb. 20.5 zu erkennen ist. Abwärtsverschobene Reflexion tritt ein, wenn der Vektor k − q den Betrag 𝜔S ∕𝑐 ≈ 𝜔∕𝑐 hat, wie Abb. 20.8 zeigt. Offensichtlich können diese beiden Bedingungen nicht gleichzeitig erfüllt sein. Damit haben wir mithilfe eines Streuansatzes die braggsche Bedingung und die Gleichung für die Dopplerverschiebung unabhängig voneinander bewiesen. Gleichung (20.33) bestätigt nochmals, dass die Intensität des ausgestrahlten Lichts proportional zu 𝜔r4 ≈ 𝜔4 ist, sodass der Wirkungsgrad der Streuung umgekehrt proportional zur vierten Potenz der Wellenlänge ist. Diese Analyse kann weitergeführt werden, um durch Bestimmung der Intensität der von der Streuquelle ausgestrahlten Welle einen Ausdruck für den Reflexionsgrad herzuleiten (siehe Aufgabe 20-2). Die Gleichungen gekoppelter Wellen
Um über die erste bornsche Näherung hinaus zu gehen, müssen wir den Beitrag des gestreute Feldes zur Streuquelle 𝒮 berücksichtigen. Für die aufwärtsverschobene braggsche Beugung setzt sich das Feld ℰ aus der einfallenden und der braggreflektierten Welle zusammen, ℰ = Re{𝐸 exp(i𝜔𝑡)} + Re{𝐸r exp(i𝜔r 𝑡)}. Mithilfe der Beziehung Δ𝑛 = −Δ𝑛0 cos(𝛺𝑡 − q ⋅ r) liefert Gl. (20.30) 𝒮 = Re {𝑆 exp(i𝜔𝑡) + 𝑆r exp(i𝜔r 𝑡)} + Terme anderer Frequenzen
(20.34)
711
712
20 Akustooptik
einfallendes Licht
mit 𝑆 = −𝑘2
Δ𝑛0 𝐸 , 𝑛 r
𝑆r = −𝑘r2
Δ𝑛0 𝐸. 𝑛
reflektiertes Licht z
(20.35)
Durch Vergleich der Terme gleicher Frequenzen auf beiden Seiten der Wellengleichung ∇2 ℰ − (1∕𝑐2 )𝜕 2 ℰ∕𝜕 2 𝑡 = −𝒮 erhalten wir zwei gekoppelte Helmholtzgleichungen für die einfallende und die braggreflektierte Welle, (∇2 + 𝑘2 )𝐸 = −𝑆 ,
(∇2 +
𝑘r2 )𝐸r
= −𝑆r .
d𝐴r 1 = i 𝛾𝐴 2 d𝑧
|Ar|2
(20.36)
Diese Gleichungen können gemeinsam mit Gl. (20.35) gelöst werden, um 𝐸 und 𝐸r zu bestimmen. Als Beispiel betrachten wir die Reflexion in einem kleinen Winkel (𝜃 ≪ 1), bei der sich die beiden Wellen näherungsweise in 𝑧-Richtung ausbreiten. Wenn wir 𝑘 ≈ 𝑘r annehmen, werden die Felder 𝐸 und 𝐸r durch 𝐸 = 𝐴 exp(−i𝑘𝑧) und 𝐸r = 𝐴r exp(−i𝑘𝑧) beschrieben, wobei 𝐴 und 𝐴r langsam variierende Funktionen von 𝑧 sind. Wir verwenden die Näherung der langsam variierenden Einhüllenden (siehe Abschnitt 2.2.3), (∇2 + 𝑘2 ) 𝐴 exp(−i𝑘𝑧) ≈ −i2𝑘(d𝐴∕ d𝑧) exp(−i𝑘𝑧), und erhalten so aus den Gln. (20.35) und (20.36) d𝐴 1 = i 𝛾𝐴r , 2 d𝑧
|A|2
(20.37a) (20.37b)
0
z
Abb. 20.10 Variation der Intensität der einfallenden optischen Welle (durchgezogene Kurve) und der braggreflektierten Welle (gestrichelte Kurve) als Funktionen der Eindringtiefe in die akustische Welle.
20.1.3
Braggsche Beugung von Strahlen
Bis jetzt haben wir gezeigt, dass ein optische ebene Welle mit dem Wellenvektor k mit einer akustischen ebenen Welle mit dem Wellenvektor q wechselwirkt und eine optische ebene Welle mit dem Wellenvektor kr = k + q produziert, wenn die braggsche Bedingung erfüllt ist (d. h. wenn der Winkel zwischen k und q so ist, dass 𝑘r = |k + q| ≈ 𝑘 = 2π∕𝜆 gilt). Daraus können wir die Wechselwirkung zwischen einem Lichtstrahl und einem Schallstrahl ableiten, wenn wir die Strahlen als Superpositionen ebener Wellen betrachten, die sich mit unterschiedlichen Wellenvektoren in unterschiedliche Richtungen ausbreiten (siehe die Einführung zu Kapitel 4).
mit 𝛾=𝑘
Δ𝑛0 . 𝑛
(20.38)
Wenn sich die Zelle von 𝑧 = 0 bis 𝑧 = d erstreckt, ist die Randbedingung 𝐴r (0) = 0 und die Gln. (20.37) haben die harmonische Lösung 𝛾𝑧 , 2 𝛾𝑧 𝐴r (𝑧) = i𝐴(0) sin . 2 𝐴(𝑧) = 𝐴(0) cos
(20.39a) (20.39b)
Diese Gleichungen beschreiben den Anstieg der reflektierten und das Abklingen der einfallenden Welle, wie in Abb. 20.10 gezeigt. Der Reflexionsgrad ℛe = 2 |𝐴r (d )|2 ∕|𝐴(0)|2 ist daher √ durch ℛe = sin (𝛾 d ∕2) ge2 geben, sodass ℛe = sin ℛ mit ℛ = (𝛾 d ∕2)2 ist. Aus Gl. (20.38) erhalten wir ℛ = (π2 ∕𝜆02 )Δ𝑛02 d 2 . Das ist genau der Ausdruck für den Reflexionsgrad für schwachen Schall in Gl. (20.22) mit d = 𝐿∕ sin 𝜃.
Beugung eines optischen Strahls an einer akustischen ebenen Welle
Wir betrachten einen optischen Strahl der Dicke 𝐷, der mit einer akustischen ebenen Welle wechselwirkt. Gemäß der Fourieroptik (siehe Abschnitt 4.3.1) kann der optische Strahl in ebene Wellen zerlegt werden, deren Richtungen auf einem Kegel mit dem Halbwinkel δ𝜃 =
𝜆 𝐷
(20.40)
liegen. In Gl. (20.40) haben wir einen multiplikativen Faktor implizit gleich eins gesetzt, der streng genommen vom Profil des Strahl abhängt: Wenn das Strahlprofil quadratisch mit der Kantenlänge 𝐷 ist, ist die Winkeldifferenz vom Maximum bis zur ersten Nullstelle der Fraunhoferbeugung gemäß Gl. (4.41) gleich δ𝜃 = 𝜆∕𝐷, für einen kreisförmigen Strahl mit dem Durchmesser 𝐷 ist gemäß Gl. (4.43) δ𝜃 = 1.22𝜆∕𝐷, für einen Gaußstrahl mit dem Taillendurchmesser 𝐷 = 2𝑊0 ist nach Gl. (3.21) δ𝜃 = 𝜆∕π 𝑊0 = (2∕π)𝜆∕𝐷 ≈ 0.64𝜆∕𝐷. Obwohl es nur einen Wellenvektor q gibt, gibt es viele Wellenvektoren k (alle mit derselben Länge 2π∕𝜆) innerhalb eines Kegels mit dem Winkel δ𝜃. Wie Abb. 20.11
20.1 Die Wechselwirkung von Licht und Schall
einfallendes Licht
gebeugtes Licht
θ
kr
q
θ θ
θ
δθ
Abb. 20.11 Beugung eines optischen Strahls an einer akustischen ebenen Welle. Nur eine der ebenen Wellen, in die der einfallende Lichtstrahl zerlegt wird, erfüllt die braggsche Bedingung. Das gebeugte Licht ist eine ebene Welle.
k δθ
zeigt, gibt es nur eine Richtung von k, für die die braggsche Bedingung erfüllt ist. Die reflektierte Welle ist dann eine ebene Welle mit nur einem Wellenvektor kr . Beugung eines optischen Strahls an einem akustischen Strahl
Nun stellen wir uns vor, dass die akustische Welle selbst ein Strahl der Dicke 𝐷S ist. Wenn die Schallfrequenz so groß ist, dass die Wellenlänge viel kleiner ist als die Abmessungen des Mediums, breitet sich Schall als ungeführte (Vakuum-) Welle aus und ihre Eigenschaften entsprechen denen von optischen Strahlen mit der Winkeldivergenz δ𝜃S =
𝛬 . 𝐷S
(20.41)
Das ist äquivalent zu vielen ebenen Wellen mit Richtungen innerhalb des Divergenzwinkels δ𝜃S . Um die Reflexion eines optischen Strahls an diesem akustischen Strahl zu bestimmen, müssen wir Paare von optischen und akustischen ebenen Wellen finden, die die braggsche Bedingung erfüllen. Die Summe aller reflektierten Wellen ergibt dann den reflektierten optischen Strahl. Es gibt viele Vektoren k (alle derselben Länge 2π∕𝜆) und viele Vektoren q (alle derselben Länge 2π∕𝛬), aber nur die Paare von Vektoren, die ein gleichschenkliges Dreieck bilden, tragen zur Reflexion bei, wie Abb. 20.12 illustriert.
Beugung einer optischen ebenen Welle an einem dünnen akustischen Strahl: Raman-Nath-Beugung
Da ein dünner akustischer Strahl aus ebenen Wellen besteht, die sich in vielen Richtungen ausbreiten, kann er Licht bei Winkeln beugen, die sich deutlich vom braggschen Winkel für die Hauptrichtung des Strahls unterscheiden. Als Beispiel betrachten wir die in Abb. 20.13 gezeigte Anordnung, in der die einfallende optische ebene Welle senkrecht auf der Hauptrichtung eines dünnen akustischen Strahls steht. Diese Anordnung für die akustooptische Beugung von Licht durch Schall wird als Raman-Nath-Beugung oder Debye-Sears-Beugung bezeichnet.
gebeugtes Licht
einfallendes Licht
δθ
Wenn die Divergenz des akustischen Strahls größer ist als die Divergenz des optischen Strahls (δ𝜃S ≫ δ𝜃) und die zentralen Richtungen der beiden Strahlen die braggsche Bedingung erfüllen, findet jede einfallende optische ebene Welle ein akustisches Gegenstück und der reflektierte Lichtstrahl hat dieselbe Winkeldivergenz δ𝜃 wie der einfallende optische Strahl. Die Verteilung der akustischen Energie im akustischen Strahl kann dann als Funktion der Richtung verfolgt werden, indem man einen Analysenlichtstrahl mit einer viel kleineren Divergenz benutzt und das reflektierte Licht bei einer Variation des Einfallswinkels misst.
θ
θ
δθs
Abb. 20.12 Beugung eines optischen Strahls an einem akustischen Strahl.
δθ
θ θ
δθs δθ
713
714
20 Akustooptik
gebeugtes Licht
einfallendes Licht
kr θ
q
θ θ
θ
k –q kS
Wie Abb. 20.13 zeigt, ist die braggsche Bedingung hier erfüllt, wenn der reflektierte Wellenvektor kr bei den Winkeln ±𝜃 zur einfallenden optischen Welle liegt; es gilt 𝜃 𝜆 = . 2 2𝛬
sin
(20.42)
Wenn 𝜃 klein ist, gilt sin(𝜃∕2) ≈ 𝜃∕2 und daher 𝜃≈
𝜆 . 𝛬
(20.43)
Der einfallende Strahl wird daher in eine der beiden Richtungen ±𝜃 abgelenkt, je nachdem, ob sich der akustische Strahl nach oben oder nach unten ausbreitet. Für einen akustischen Strahl aus stehenden Wellen wird die optische Welle in beide Richtungen abgelenkt. Der Winkel 𝜃 ≈ 𝜆∕𝛬 ist der Winkel, um den ein Beugungsgitter mit der Periode 𝛬 eine einfallende ebene Welle ablenkt (siehe Übung 2-7). Der dünne akustische Strahl moduliert den Brechungsindex so, dass in einer dünnen ebenen Schicht ein periodisches Muster mit der Periode 𝛬 entsteht. Das Medium wirkt daher als dünnes Beugungsgitter. Dieses akustooptische Phasengitter beugt das Licht auch in höhere Ordnungen, wie Abb. 20.14(a) zeigt. Die von dem Phasengitter erzeugten gebeugten Wellen höherer Ordnung bei den Winkeln ±2𝜃, ±3𝜃, … können auch im Rahmen eines verallgemeinerten Quantenmodells der Wechselwirkung zwischen Licht und Schall interpretiert werden (Abb. 20.9). Ein einfallendes Ds
einfallendes Licht
gebeugtes Licht
Photon vereinigt sich mit zwei Phononen (akustischen Quanten) und bildet ein Photon der reflektierten Welle zweiter Ordnung. Die Impulserhaltung fordert dann kr = k ± 2q. Diese Bedingung ist für die Anordnung in Abb. 20.14(b) erfüllt. Die Frequenz des reflektierten Lichts zweiter Ordnung ist zu 𝜔r = 𝜔 ± 2𝛺 verschoben. Ähnliche Interpretationen gelten für höhere Ordnungen der Beugung.
20.2 Akustooptische Bauelemente Die zur Herstellung akustooptischer Geräte verwendeten Materialien werden im Allgemeinen anhand ihres Gütefaktors ℳ = p2 𝑛6 ∕𝜌𝑣S3 ausgewählt, der die Stärke des akustooptischen Effekts kennzeichnet [Gl. (20.8)]. Wichtige Materialparameter sind neben dem transparenten Wellenlängenbereich der Brechungsindex, die Massendichte, die Schallgeschwindigkeit und der elastooptische Koeffizient. Üblicherweise verwendete Materialien im Sichtbaren und nahen Infrarot sind z. B. hochdichtes Flintglas (Beispiele 20-1, 20-2 und 20-3), Quarzglas, kristalliner Quarz und TeO2 ; im mittleren Infrarot werden häufig Germanium- und Chalkogenidgläser verwendet. Die meisten Bauelemente verwenden wegen ihrer hohen Beugungseffizienz akustische Longitudinalwellen, obwohl akustische Transversalwellen den Vorteil haben, dass sie in bestimmten Anordnungen einen polarisationsunabhängigen Betrieb ermöglichen. Integrierte optische Bauelemente basieren häu-
kr
θ θ
q
θ θ
q k
(a)
Abb. 20.13 Raman-Nath-Beugung von Licht an Schall. Eine senkrecht auf einen dünnen akustischen Strahl aus stehenden Wellen einfallende optische ebene Welle wird in zwei Richtungen unter den Winkeln ≈ ±𝜆∕𝛬 abgelenkt.
(b)
Abb. 20.14 (a) Ein dünner akustischer Strahl wirkt als Beugungsgitter. (b) Impulserhaltung bei der akustooptischen Beugung zweiter Ordnung.
fig auf LiNbO3 , das piezoelektrisch ist und mithilfe von oberflächenmontierten Metallelektroden die Erzeugung von Oberflächenwellen auf dem Chip ermöglicht. Wir werden im Folgenden eine kleine Auswahl der zahlreichen Anwendungen von akustooptischen Modulatoren in der Photonik untersuchen:
Die Bandbreite des Modulators ist die maximale Frequenz, bei der er effizient arbeitet. Wenn die Amplitude einer akustischen Welle der Frequenz 𝑓0 als Funktion der Zeit durch Amplitudenmodulation mit einem Signal der Bandbreite 𝐵 verändert wird, ist die akustische Welle keine harmonische Funktion mit einer einzigen Frequenz mehr; sie besitzt Frequenzkomponenten mit den Frequenzen 𝑓0 ± 𝐵 innerhalb eines Bands um die Frequenz 𝑓0 (Abb. 20.16). Wie wechselwirkt monochromatisches Licht mit einer solchen akustischen Welle, und welches ist der maximale Wert von 𝐵, den ein akustooptischer Modulator verarbeiten kann? Wenn sowohl die einfallende optische Welle als auch die akustische Welle ebene Wellen sind, entspricht die Komponente des Schalls mit der Frequenz 𝑓 einem braggschen Winkel 𝜃 = sin
t
(a)
−1
𝜆 𝜆 −1 𝑓𝜆 ≈ 𝑓 = sin 2𝑣S 2𝑣S 2𝛬
(20.44)
(den wir als klein annehmen). Für einen festen Einfallswinkel 𝜃 wechselwirkt eine monochromatische einfallende optische ebene Welle der Wellenlänge 𝜆 mit genau einer harmonischen Komponente der akustischen Welle – der Komponente mit der Frequenz 𝑓 –, die Gl. (20.44) erfüllt, wie Abb. 20.17 zeigt. Die reflektierte Welle ist dann monochromatisch mit der Frequenz 𝜈 + 𝑓. Obwohl die akustische Welle moduliert ist, gilt dies nicht für die reflektierte optische Welle. Offensicht-
t
Schallintensität
einfallende Lichtintensität
Lichtintensität
Schallintensität
einfallende Lichtintensität
So lange die Schallintensität gering ist, ist die Intensität des gebeugten Lichts in einer Braggzelle proportional zur Schallintensität [siehe Gl. (20.28)]. Mit einem elektrisch gesteuerten Akustikwandler [Abb. 20.15(a)] kann die Intensität des reflektierten Lichts daher kontinuierlich variiert werden. Ein solches Bauelement, ein akustooptischer Modulator, kann somit als linearer Analogmodulator für Licht verwendet werden. Mit steigender akustischer Leistung tritt jedoch Sättigung ein, und nahezu vollständige Reflexion ist möglich (siehe Abb. 20.7). Der Modulator dient dann als akustooptischer Schalter, der durch Ein- und Ausschalten des Schalls das reflektierte Licht ein- bzw. ausschaltet (wobei das durchgelassene Licht jeweils umgekehrt aus bzw. eingeschaltet wird), wie Abb. 20.15(b) illustriert. Akustooptische Schalter werden beispielsweise bei der Güteschaltung, dem cavity dumping oder der aktiven Modenkopplung in Lasern sowie der Selektion von Laserpulsen (Abschnitt 16.4) eingesetzt.
t
f
Modulationsbandbreite
20.2.1 Modulatoren
t
f0
Abb. 20.16 Die Wellenform eines amplitudenmodulierten akustischen Signals und sein Spektrum.
Analoge Modulation der optischen Intensität Digitale Umschaltung der optischen Intensität Scannen eines optischen Strahls Lenken eines optischen Strahls in ausgewählte Richtungen Spektralanalyse eines akustischen Strahls Spektrale Filterung eines optischen Strahls Frequenzverschiebung eines optischen Strahls Einsatz als optischer Isolator
(b)
Lichtintensität
• • • •
2B 0
t
transmittierte Lichtintensität
• • • •
t
Spektrum
20.2 Akustooptische Bauelemente
t
Abb. 20.15 (a) Ein akustooptischer Modulator auf der Grundlage eines elektrisch gesteuerten piezoelektrischen Akustikwandlers. Die Intensität des reflektierten Lichts ist proportional zur Schallintensität. (b) Ein akustooptischer Schalter. Die Schallwelle führt dazu, dass das Licht reflektiert wird; ohne Schallwelle wird der Lichtstrahl durchgelassen.
715
716
20 Akustooptik
2π B νs 2π B νs
2π
λ
θ
2π f νs
θ
2π f νs 0
2π
λ
Übung 20-1: Parameter akustooptischer Modulatoren
Abb. 20.17 Die Wechselwirkung einer optischen ebenen Welle mit einer modulierten (polychromatischen) akustischen ebenen Welle. Nur eine Frequenzkomponente des Schalls reflektiert die Lichtwelle. Die reflektierte Welle ist monochromatisch und nicht moduliert.
lich ist die Bandbreite des Modulators unter diesen idealisierten Bedingungen gleich null! Um Modulation mit einer Bandbreite 𝐵 zu erreichen, muss jede der akustischen Frequenzkomponenten innerhalb des Bands 𝑓0 ± 𝐵 mit der einfallenden Lichtwelle wechselwirken. Dafür ist eine tolerantere Anordnung notwendig. Wir nehmen an, dass das einfallende Licht ein Strahl mit der Dicke 𝐷 und der Winkeldivergenz δ𝜃 = 𝜆∕𝐷 ist und dass die modulierte Schallwelle eben ist. Jede Frequenzkomponente des Schalls wechselwirkt mit der optischen ebenen Welle mit passendem Braggwinkel (Abb. 20.18). Das Frequenzband 𝑓0 ± 𝐵 benötigt dafür einen optischen Strahl der Winkeldivergenz (2π∕𝑣S )𝐵 𝜆 = 𝐵. 𝑣 2π∕𝜆 S
δ𝜃 ≈
(20.45)
Die Bandbreite des Modulators ist daher 𝐵 = 𝑣S
𝑣S δ𝜃 = 𝐷 𝜆
(20.46)
oder 𝐵=
1 T
,
T=
𝐷 , 𝑣S
(20.47)
wobei T die Durchgangszeit des Schalls durch die Taille des Lichtstrahls ist. Dieses Ergebnis ist erwartet, da T gerade die Zeit ist, die erforderlich ist, um die Amplitueinfallendes Licht
θ δθ
de der Schallwelle an allen Punkten in der Wechselwirkungszone von Licht und Schall zu verändern, sodass die maximale Geschwindigkeit der Modulation 1∕T Hz ist. Um die Bandbreite des Modulators zu vergrößern, sollte der Lichtstrahl auf einen kleinen Durchmesser fokussiert werden.
gebeugtes Licht θ
Gegeben seien die folgenden akustooptischen Modulatoren: 1) Material: Quarzglas (𝑛 = 1.46, 𝑣S = 6 km∕s); Schall: 𝑓 = 50 MHz; Licht: He-Ne-Laser (𝜆0 = 633 nm, δ𝜃 = 1 mrad). 2) Material: Tellur (𝑛 = 4.8, 𝑣𝑆 = 2.2 km∕s); Schall: 𝑓 = 100 MHz; Licht: CO2 -Laser (𝜆0 = 10.6 μm, 𝐷 = 1 mm). Bestimmen Sie die braggschen Winkel und die maximalen Bandbreiten.
20.2.2
Scanner
Eine akustooptische Zelle kann als Lichtscanner verwendet werden. Das Grundprinzip beruht auf der linearen Beziehung zwischen dem Ablenkungswinkel 2𝜃 und der Schallfrequenz 𝑓 aus Gl. (20.44). Der Ablenkungswinkel 2𝜃 ist demzufolge 2𝜃 ≈
(20.48)
wobei 𝜃 so klein angenommen ist, dass sin 𝜃 ≈ 𝜃 gilt. Durch eine Variation der Schallfrequenz 𝑓 kann dann der Ablenkwinkel 2𝜃 verändert werden. Eine Schwierigkeit ist dabei, dass 𝜃 sowohl den Winkel der Reflexion als auch den Einfallswinkel bezeichnet. Um ausschließlich den Winkel der Reflexion zu ändern, müssen daher der Einfallswinkel und die Schallfrequenz gleichzeitig geändert werden. Das kann erreicht werden, indem man den Schallstrahl verkippt. Abbildung 20.19 illustriert das Prinzip. Zum Kippen des ν
f0 + B ν
δθ θ θ
𝜆 𝑓, 𝑣S
ν
f0 f0 – B 2π f – B νs 0
2π f + B 0 2π f ν s νs 0
δθ
Abb. 20.18 Wechselwirkung eines optischen Strahls der Winkeldivergenz δ𝜃 mit einer akustischen ebenen Welle mit einer Frequenz im Band f0 ± B. Ex gibt viele parallele Vektoren q mit unterschiedlichen Längen, von denen jeder einer Richtung des einfallenden Lichts entspricht.
20.2 Akustooptische Bauelemente
Abb. 20.19 Scannen durch gleichzeitige Variation der Schallfrequenz und -richtung. Die Schallwelle wird durch eine Anordnung von Wandlern gekippt, die durch synchrone phasenverschobene Signale gesteuert werden.
θ θ
φ
φ
φ
Schallstrahls benötigt man ein ausgeklügeltes System, beispielsweise auf der Grundlage einer synchronisierten Anordnung von Akustikwandlern (mehreren Akustikwandlern, die mit einer definierten Phasenverschiebung angesteuert werden, um ein Kippen der gesamten erzeugten Schallwelle zu bewirken). Zur Änderung der Schallfrequenz ist ein Frequenzmodulator erforderlich, der mit der Steuerung des Frequenzmodulators synchronisiert werden muss. Die Probleme beim Kippen des Schallstrahls können reduziert werden, wenn man einen Schallstrahl verwendet, dessen Winkeldivergenz gleich groß oder größer als der komplette zu scannende Bereich ist. Bei einer Änderung der Schallfrequenz ändert sich dann auch der braggsche Winkel, und die einfallende Lichtwelle wählt nur die akustische Komponente der ebenen Welle aus, die zu ihrer Richtung passt. Wie zu erwarten, besitzt ein solches System einen niedrigen Wirkungsgrad. Im folgenden wollen wir einige der Eigenschaften eines solchen Bauelements untersuchen. Der Scanwinkel
Wenn die Schallfrequenz 𝑓 ist, wechselwirkt die einfallende Lichtwelle mit der Schallkomponente mit dem Winkel 𝜃 = (𝜆∕2𝑣S )𝑓 und wird um einen Winkel 2𝜃 = (𝜆∕𝑣S )𝑓 abgelenkt, wie Abb. 20.20 zeigt. Durch Änderung der Schallfrequenz von 𝑓0 auf 𝑓0 + 𝐵 verändert sich der Ablenkwinkel 2𝜃 über einen Scanwinkel 𝜆 Δ𝜃 = 𝐵 . (20.49) 𝑣S
einfallendes Licht θ
Δθ f0 θ
δθs
Die Zahl auflösbarer Punkte
Wenn die optische Welle selbst eine Winkeldivergenz δ𝜃 = 𝜆∕𝐷 hat, dann besitzt – sofern δ𝜃 ≪ δ𝜃S ist – auch der abgelenkte Strahl die Breite δ𝜃. Die Zahl der durch den Scanner auflösbaren Punkte (die Zahl nichtüberlappender Winkeldivergenzen innerhalb des Scanbereichs) ist daher 𝑁=
(𝜆∕𝑣S )𝐵 Δ𝜃 𝐷 = = 𝐵 𝑣S δ𝜃 𝜆∕𝐷
Δθ θ θ
(20.50)
oder 𝑁 = T𝐵 ,
(20.51)
wobei 𝐵 die Bandbreite des Frequenzmodulators ist, der den Schall erzeugt, und T = 𝐷∕𝑣S die Durchgangszeit des Schalls durch den Lichtstrahl (Abb. 20.21). Die Zahl auflösbarer Punkte ist daher gleich dem Produkt aus Zeit und Bandbreite. Diese Zahl bezeichnet die Zahl der Freiheitsgrade des Bauelements und ist eine wichtige Kenngröße des Scanners. Um 𝑁 zu vergrößern, sollte die Durchgangszeit T möglichst groß sein. Das ist das Gegenteil der Anforderung an einem akustof0 + B f0
f0 + B
gebeugtes Licht
Dabei ist natürlich angenommen, dass der Schallstrahl eine Winkeldivergenz δ𝜃S = 𝛬∕𝐷S ≥ Δ𝜃 hat. Da der Scanwinkel umgekehrt proportional zur Schallgeschwindigkeit ist, kann man größere Scanwinkel erreichen, indem man Materialien mit kleiner Schallgeschwindigkeit 𝑣S verwendet.
Abb. 20.20 Scannen einer optischen Welle durch Variation der Frequenz eines Schallstrahls mit der Winkeldivergenz δ𝜃S über einen Frequenzbereich f0 ≤ f ≤ f0 + B.
717
20 Akustooptik
δθ Δθ
δθ
Abb. 20.21 Auflösung eines akustooptischen Scanners.
δθ
θ
δθs
optischen Modulator, für den die Modulationsbandbreite 𝐵 = 1∕T groß gemacht wird, indem man eine kurze Zeit T auswählt. Übung 20-2: Parameter eines akustooptischen Scanners
Ein akustooptischer Scanner aus Quarzglas (𝑣S = 6 km∕s, 𝑛 = 1.46) wird zum Scannen eines He-NeLaserstrahls (𝜆0 = 633 nm) verwendet. Die Schallfrequenz wird von 40 bis 60 MHz variiert. Auf welchen Durchmesser sollte der Laserstrahl fokussiert werden, damit die Zahl auflösbarer Punkte 𝑁 = 100 ist? Wie groß ist der Scanwinkel Δ𝜃? Was passiert, wenn ein Material mit einer kleineren Schallgeschwindigkeit verwendet wird, z. B. Flintglas (𝑣𝑆 = 3.1 km∕s)?
20.2.3
Räumliche Schalter
Eine akustooptische Zelle kann als räumlicher Schalter verwendet werden (siehe Abschnitt 24.3), der Information aus einem oder mehreren optischen Strahlen in eine oder mehrere ausgewählte Richtungen weiterleitet. Dabei sind mehrere Netzwerkstrukturen möglich: • Eine akustooptische Zelle, in der die Frequenz der akustischen Welle einen von 𝑁 möglichen Werten 𝑓1 , 𝑓2 , …, oder 𝑓𝑁 annimmt, lenkt einen einfallenden optischen Strahl in eine von 𝑁 Richtungen 𝜃1 , 𝜃2 , … , 𝜃𝑁 ab, wie Abb. 20.23 zeigt. Das Bauelement leitet einen gegebenen Strahl in eine von 𝑁 Richtungen.
Ein akustooptischer Scanner als Spektralanalysator
θ1 θ2 θ3
f3 f2 f1
1 2 θ3
...
Die Proportionalität zwischen dem Ablenkwinkel und der Schallfrequenz kann genutzt werden, um einen akustischen Spektralanalysator zu bauen. Eine Schallwelle, die ein Spektrum unterschiedlicher Frequenzen enthält, streut das Licht in unterschiedlichen Richtungen, wobei die Intensität des abgelenkten Lichts in einer gegebenen Richtung proportional zur Leistung der Schallkomponente mit der entsprechenden Frequenz ist (Abb. 20.22).
f3 t
Abb. 20.23 Weiterleitung eines optischen Strahls in eine von N Richtungen. Durch Auswahl der akustischen Welle mit der Frequenz f3 wird der optische Strahl um einen Winkel 𝜃3 abgelenkt und auf Punkt 3 umgeleitet. 1 2
f1 + f2 + f3
θ1 θ2
. ..
718
t
Abb. 20.22 Jede Frequenzkomponente der Schallwelle lenkt das Licht in einer anderen Richtung ab. Die akustooptische Zelle dient als akustischer Spektralanalysator.
f1 + f2 t
Abb. 20.24 Gleichzeitige Weiterleitung eines Lichtstrahls in mehrere Richtungen.
20.2 Akustooptische Bauelemente
θ1
W
...
1 2
θ2 f1
f2 t
/2
/2
Abb. 20.25 Gleichzeitige Weiterleitung von zwei Lichtstrahlen in eine Reihe von vorgegebenen Richtungen. Die akustische Welle wird durch ein frequenzmoduliertes elektrisches Signal erzeugt. 1 2
N /N
t
Abb. 20.26 Ein räumlicher Lichtmodulator moduliert N optische Strahlen. Die akustische Welle wird durch ein amplitudenmoduliertes elektrisches Signal generiert.
• Durch eine akustische Welle, die gleichzeitig zwei Frequenzen 𝑓1 und 𝑓2 enthält, wird der einfallende optische Strahl gleichzeitig in die beiden entsprechenden Richtungen 𝜃1 und 𝜃2 reflektiert. Ein Strahl wird auf diese Weise an ein beliebiges Paar aus vielen möglichen Richtungen geleitet, wie Abb. 20.24 zeigt. Entsprechend kann eine akustische Welle mit 𝑀 Frequenzen den ankommende Strahl gleichzeitig in 𝑀 Richtungen leiten. Ein Beispiel ist ein akustischer Spektralanalysator, in dem ein eingehender Lichtstrahl von einer Schallwelle reflektiert wird, die ein Spektrum von 𝑀 Frequenzen enthält. Der Lichtstrahl wird in 𝑀 Richtungen geleitet, wobei die Intensität in jeder Richtung proportional zur Leistung der entsprechenden Frequenzkomponente des Schalls ist.
1 M 1 M
L /L
t
Die Verbindungskapazität
Es gibt eine obere Grenze für die Zahl der Verbindungen, die durch ein akustooptisches Bauelement vermitAbb. 20.27 Ein allgemeiner Raumschalter kann L eingehende Lichtstrahlen gleichzeitig in M Richtungen weiterleiten.
1 2
• Die Länge der akustooptischen Zelle kann in zwei Segmente unterteilt werden. Zu einem bestimmten Zeitpunkt ist in dem einen Segment eine akustische Welle der Frequenz 𝑓1 vorhanden und in dem anderen Segment eine akustische Welle der Frequenz 𝑓2 . Das kann erreicht werden, indem man die akustische Welle aus einem frequenzmodulierten elektrischen Signal in Form zweier Pulse erzeugt: Ein Puls der Frequenz 𝑓1 gefolgt von einem zweiten der Frequenz 𝑓2 , die beide eine Dauer T ∕2 haben, wobei T = 𝑊∕𝑣S die Durchgangszeit des Schalls durch die Zelle der Länge 𝑊 ist (siehe Abb. 20.25). Wenn die akustische Welle das Ende der Zelle erreicht, verarbeitet die Zelle zwei ankommende optische Strahlen, indem sie den oberen Strahl in die Richtung 𝜃1 entsprechend der Frequenz 𝑓1 und den unteren Strahl in die Richtung 𝜃2 entsprechend 𝑓2 ablenkt. Dieses Bauelement ist ein Schalter, der jeden der beiden Strahlen in eine beliebige von vielen möglichen Richtungen weiterleitet. Wenn in den Segmenten mehr als eine Frequenzkomponente vorhanden ist, kann jeder der beiden Strahlen wiederum gleichzeitig in mehreren Richtungen geleitet werden. • Die Zelle kann auch in 𝑁 Segmente unterteilt werden, die alle eine harmonische akustische Welle desselben Frequenz 𝑓 enthalten, jedoch mit unterschiedlichen Amplituden. Das Ergebnis ist ein räumlicher Lichtmodulator, der die Intensitäten von 𝑁 Eingabestrahlen moduliert (Abb. 20.26). Räumliche Lichtmodulatoren sind in der optischen Signalverarbeitung nützlich (siehe Abschnitt 21.1.5). • In der allgemeinsten Netzarchitektur ist die Zelle in 𝐿 Segmente unterteilt, von denen jedes eine akustische Welle mit 𝑀 Frequenzen enthält. Das Bauelement wirkt dann als Wahlzugriffsschalter, der jeden der 𝐿 ankommenden Strahlengleichzeitig in 𝑀 Richtungen weiterleiten kann (Abb. 20.27).
719
720
20 Akustooptik
telt werden können. Wenn eine akustooptische Zelle zur Weiterleitung von 𝐿 ankommenden optischen Strahlen in maximal je 𝑀 Richtungen gleichzeitig verwendet wird, dann kann das Produkt 𝑀𝐿 nicht größer werden als das Produkt 𝑁 = T 𝐵 aus Zeit und Bandbreite, wobei T die Durchgangszeit durch die Zelle ist und 𝐵 die Bandbreite der akustischen Welle, 𝑀𝐿 ≤ 𝑁 .
Abstimmbare akustooptische Filter
Der Braggbedingung sin 𝜃 = 𝜆∕2𝛬 verknüpft den Winkel 𝜃, die akustische Wellenlänge 𝛬 und die optische Wellenlänge 𝜆. Wenn 𝜃 und 𝛬 gegeben sind, kann nur für eine einzige optische Wellenlänge 𝜆 = 2𝛬 sin 𝜃 Reflexion eintreten. Diese Eigenschaft der Wellenlängenauswahl kann genutzt werden, um eine aus einem breiten Spektrum von Wellenlängen zusammengesetzte optische Welle zu filtern. Das Filter wird abgestimmt, indem der Winkel 𝜃 oder die Schallfrequenz 𝑓 verändert wird.
(20.52)
Diese obere Grenze für die Zahl von Verbindungen wird die Verbindungskapazität des Bauelements genannt. Eine akustooptische Zelle mit 𝐿 Segmenten verwendet eine akustische Welle aus 𝐿 Segmenten der Dauer T ∕𝐿. Damit jedes Segment 𝑀 unabhängige Punkte adressieren kann, muss die akustische Welle 𝑀 unabhängige Frequenzkomponenten pro Segment enthalten. Für ein Signal der Dauer T ∕𝐿 existiert eine intrinsische Frequenzunschärfe 𝐿∕T . Die 𝑀 Frequenzkomponenten müssen daher durch mindestens diese Unschärfe getrennt sein. Damit die 𝑀 Komponenten in die verfügbare Bandbreite 𝐵 passen, muss 𝑀(𝐿∕T ) ≤ 𝐵 gelten, woraus 𝑀𝐿 ≤ T 𝐵 und schließlich Gl. (20.52) folgt. Ein einzelner optischer Strahl (𝐿 = 1) kann zum Beispiel Verbindungen mit 𝑁 = T 𝐵 Punkten aufbauen, aber von zwei Strahlen kann jeder mit höchstens 𝑁∕2 Punkten verbunden sein und so weiter. Die Aufgabe ist, ein verfügbares Produkt 𝑁 = T 𝐵 aus Zeit und Bandbreite auf 𝐿 Zeitsegmente zu verteilen, die jeweils 𝑀 unabhängige Frequenzen enthalten. Beispiele der Möglichkeiten sind in Abb. 20.28 im Zeit-Frequenz-Diagramm illustriert.
20.2.4
Übung 20-3: Auflösungsvermögen eines akustooptischen Filters
Zeigen Sie, dass das spektrale Auflösungsvermögen 𝜆∕Δ𝜆 eines akustooptischen Filters gleich 𝑓 T ist, wobei 𝑓 die Schallfrequenz, T die Durchgangszeit und Δ𝜆 der minimal auflösbare Wellenlängenunterschied ist. Frequenzschieber
Optische Frequenzschieber sind in vielen Anwendungen der Photonik unverzichtbar, z. B. beim optischen Heterodyning, der optischen Frequenzmodulation oder bei der Geschwindigkeitsmessung mit Lasermessgeräten. Eine akustooptische Zelle kann als abstimmbarer Frequenzschieber verwendet werden, da das braggreflektierte Licht um die Schallfrequenz (aufwärts oder abwärts) verschoben wird (Abschnitt 20.1.1). In einem optischen Heterodynempfänger wird ein empfangenes amplituden- oder phasenmoduliertes optisches Signal mit einer kohärenten optischen Welle aus einer lokalen Lichtquelle gemischt, das als ein lokaler Oszillator mit einer unterschiedlichen Frequenz wirkt. Die beiden optischen Wellen erzeugen eine Schwebung (siehe Abschnitt 2.6.2), und das detektierte Signal variiert mit der Frequenzdifferenz. Aus dem detektierten Signal
Filter, Frequenzschieber und Isolatoren
Akustooptische Zellen besitzen eine Reihe weiterer wichtiger Anwendungen, z. B. als Filter, Frequenzschieber und optische Isolatoren.
f
f
f
/N
/L
B /N B
B
(a)
t
B /M
B
(b)
Abb. 20.28 Beispiele für die Verteilung des Zeit-BandbreiteBereichs TB im Zeit-Frequenz-Diagramm auf N = TB Unterteilungen (in diesem Diagramm N = 20). (a) Ein Scanner: Ein einziges Zeitsegment mit N Frequenzsegmenten. (b) Ein
t
(c)
t
räumlicher Lichtmodulator: N Zeitsegmente mit je einer Frequenzkomponente. (c) Ein Vermittlungsschalter: L Zeitsegmente mit je M = N ∕L Frequenzsegmenten (für N = 20, M = 4, und L = 5).
20.3 Akustooptik von anisotropen Medien
20.3 Akustooptik von anisotropen Medien
kann Information über die Amplitude und Phase des empfangenen Signals entnommen werden (siehe Abschnitt 25.5.1). Die akustooptische Zelle bietet eine praktische Methode, um die für die Überlagerung erforderliche Frequenzverschiebung zu erzeugen.
Die skalare Theorie der Wechselwirkung von Licht und Schall wird in diesem Abschnitt verallgemeinert, um anisotrope Eigenschaften des Mediums und die Polarisation des Lichts und des Schalls zu berücksichtigen.
Optische Isolatoren
Ein optischer Isolator ist ein optisches Einwegeventil, das oft verwendet wird, um reflektiertes Licht daran zu hindern, auf seiner eigenen Spur wieder zurück zur ursprünglichen Lichtquelle zu gelangen (siehe Abschnitt 6.6.4 und Abschnitt 24.3.3). Optische Isolatoren werden manchmal in Halbleiterlasern verwendet, da das reflektierte Licht den Laserprozess stören und unerwünschte Effekte (Rauschen) hervorrufen kann. Die akustooptische Zelle kann als Isolator dienen. Wenn ein Teil des aufwärtsverschobenen braggreflektierten Lichts durch einen Spiegel auf sich selbst reflektiert wird und zurück in die Zelle läuft, wie in Abb. 20.29 illustriert, erfährt es dort eine zweite Braggreflexion und eine zweite Aufwärtsverschiebung. Da sich die Frequenz des zurückkehrenden Lichts von der des ursprünglichen Lichts um die doppelte Schallfrequenz unterscheidet, kann es durch ein Filter eliminiert werden. Aber auch ohne Filter ist der Laserprozess möglicherweise unempfindlich gegen das frequenzverschobene Licht.
20.3.1 Akustische Wellen in anisotropen Materialien Eine akustische Welle ist eine Welle von mechanischen Deformationen in einem Material. Die Deformation wird durch die Verschiebungen der Moleküle aus ihren Gleichgewichtslagen definiert. Wenn u = (𝑢1 , 𝑢2 , 𝑢3 ) der Vektor der Verschiebung eines Moleküls am Ort x = (𝑥1 , 𝑥2 , 𝑥3 ) ist, ist die Deformation ein symmetri1 scher Tensor mit den Komponenten 𝑠𝑖𝑗 = (𝜕𝑢𝑖 ∕𝜕𝑥𝑗 + 2 𝜕𝑢𝑗 ∕𝜕𝑥𝑖 ), wobei die Indizes 𝑖, 𝑗 = 1, 2, 3 die Koordinaten (𝑥, 𝑦, 𝑧) bezeichnen. Das Element 𝑠33 = 𝜕𝑢3 ∕𝜕𝑥3 beschreibt zum Beispiel eine Zugdeformation in 𝑧-Richtung [Abb. 20.30(a)], wohingegen 𝑠13 eine Scherdeformation beschreibt, da 𝜕𝑢1 ∕𝜕𝑥3 die relative Bewegung in 𝑥-Richtung zweier parallelen Ebenen senkrecht zur 𝑧-Achse in einem infinitesimalen Abstand voneinander ist, wie in Abb. 20.30(b) gezeigt. Eine akustische Welle kann longitudinal oder transversal sein, wie die folgenden Beispiele zeigen. Die Geschwindigkeiten der longitudinalen und transversalen akustischen Wellen sind Eigenschaften des Mediums und hängen im Allgemeinen von der Ausbreitungsrichtung ab.
Filter
Spiegel
f t
Beispiel 20-4: Longitudinale akustische Welle
Abb. 20.29 Ein akustooptischer Isolator.
Eine Welle mit der Verschiebung 𝑢1 = 0, 𝑢2 = 0 und 𝑢3 = 𝐴0 sin(𝛺𝑡 − 𝑞𝑧) mit einer Konstante 𝐴0 entspricht einem Deformationstensor, in dem alle Komponenten verschwinden außer 𝑠33 = 𝑆0 cos(𝛺𝑡 − 𝑞𝑧)
(20.53)
mit 𝑆0 = −𝑞𝐴0 . Das ist eine Welle, die in 𝑧-Richtung oszilliert und sich auch dieser Richtung ausbreitet. Da x
u3
u3 + Δ u3
z
z + Δz
(a)
x u1
z
u1 + Δ u1
z + Δz
(b)
Abb. 20.30 Verschiebungen bei (a) Zug- und (b) Scherdeformation.
721
722
20 Akustooptik
die Schwingungen in derselben Richtung wie die Wellenausbreitung erfolgen, ist die Welle longitudinal.
p𝐼𝐾 eines kubischen Kristalls hat zum Beispiel die Struktur
Beispiel 20-5: Transversale akustische Welle
Die Verschiebungswelle 𝑢1 = 𝐴0 sin(𝛺𝑡 − 𝑞𝑧), 𝑢2 = 0 und 𝑢3 = 0 entspricht einem Deformationstensor, in dem alle Komponenten verschwinden außer 𝑠13 = 𝑠31 = 𝑆0 cos(𝛺𝑡 − 𝑞𝑧)
(20.54)
1
mit 𝑆0 = − 𝑞𝐴0 . Diese Welle breitet sich in 𝑧-Rich2 tung aus, oszilliert aber in 𝑥-Richtung. Sie ist daher eine transversale (Scher-) Welle. Der photoelastische Effekt
Die optischen Eigenschaften eines anisotropen Mediums werden durch den elektrischen Impermeabilitätstensor 𝛈 = 𝜀0 𝛆−1 vollständig charakterisiert (siehe Abschnitt 6.3). Aus 𝛈 können wir das Indexellipsoid und daraus die Brechungsindizes für eine optische Welle bestimmen, die sich mit einer beliebigen Polarisation in einer beliebigen Richtung ausbreitet. Durch mechanische Deformationen wird der elektrische Impermeabilitätstensor modifiziert, sodass η𝑖𝑗 eine Funktion der Elemente η𝑖𝑗 = η𝑖𝑗 (𝑠𝑘𝑙 ) des Deformationstensors wird. Diese Abhängigkeit wird als photoelastischer Effekt bezeichnet. Jede der neun Funktionen η𝑖𝑗 (𝑠𝑘𝑙 ) kann in eine Taylorreihe in den neun Variablen 𝑠𝑘𝑙 entwickelt werden. Wenn nur nur die linearen Terme beibehalten werden, erhält man ∑ η𝑖𝑗 (𝑠𝑘𝑙 ) ≈ η𝑖𝑗 (0) + p𝑖𝑗𝑘𝑙 𝑠𝑘𝑙 , 𝑖, 𝑗, 𝑙, 𝑘 = 1, 2, 3 , (20.55) 𝑘𝑙
wobei die p𝑖𝑗𝑘𝑙 = 𝜕η𝑖𝑗 ∕𝜕𝑠𝑘𝑙 Konstanten sind, die einen Tensor vierter Stufe bilden, der als photoelastischer Tensor (manchmal auch als elastooptischer Tensor) bezeichnet wird. Da sowohl {η𝑖𝑗 } als auch {𝑠𝑘𝑙 } symmetrische Tensoren sind, ist der Koeffizient {p𝑖𝑗𝑘𝑙 } invariant unter Permutationen von 𝑖 und 𝑗 bzw. 𝑘 und 𝑙. Es gibt daher nur sechs statt neun unabhängiger Werte für (𝑖, 𝑗) und sechs unabhängige Werte für (𝑘, 𝑙). Das Paar von Indizes (𝑖, 𝑗) wird gewöhnlich zu einem einzigen Index 𝐼 = 1, 2, … , 6 zusammengefasst (siehe Tabelle 21.1). Die Indizes (𝑘, 𝑙) werden ähnlich zusammengefasst und durch den Index 𝐾 = 1, 2, … , 6 bezeichnet. Der Tensor p𝑖𝑗𝑘𝑙 vierter Stufe wird so zu einer 6 × 6-Matrix p𝐼𝐾 . Die Symmetrie des Kristalls erfordert, dass einige der Koeffizienten p𝐼𝐾 verschwinden und dass bestimmte Koeffizienten miteinander verknüpft sind. Die Matrix
p𝐼𝐾
⎡p11 ⎢ ⎢p12 ⎢ ⎢p = ⎢ 11 ⎢ 0 ⎢ ⎢ 0 ⎢ 0 ⎣
p12
p12
0
0
p11
p12
0
0
p12
p11
0
0
0
0
p44
0
0
0
0
p44
0
0
0
0
0 ⎤ ⎥ 0 ⎥ ⎥ 0 ⎥ ⎥ . 0 ⎥ ⎥ 0 ⎥ ⎥ p44 ⎦
(20.56)
1
Mit der zusätzlichen Einschränkung p44 = (p11 + p12 ) 2 gilt diese Matrix auch für isotrope Medien, in denen es nur zwei unabhängige Koeffizienten gibt. Sie ist das Analogon zur elektrooptischen Kerrmatrix s𝐼𝐾 für isotrope Medien (siehe Tabelle 21.3). Beispiel 20-6: Akustische Longitudinalwelle in einem kubischen Kristall
Die akustische Longitudinalwelle aus Beispiel 20-4 breitet sich entlang einer der Achsen eines kubischen Kristalls mit dem Brechungsindex 𝑛 aus. Durch Einsetzen der Gln. (20.53) und (20.56) in Gl. (20.55) finden wir, dass die zugehörige Deformation zu einem Impermeabilitätstensor mit den Elementen η11 = η22 =
1 + p12 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) 𝑛2
1 + p11 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) 𝑛2 η𝑖𝑗 = 0 , 𝑖 ≠ 𝑗
η33 =
(20.57) (20.58) (20.59)
führt. So wird der zunächst optisch isotrope kubische Kristall zu einem einachsigen Kristall mit der optischen Achse in Richtung der akustische Welle (𝑧-Richtung) und mit ordentlichen und außerordentlichen Brechungsindizes 𝑛o und 𝑛e gemäß 1 1 = 2 + p12 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) , 𝑛 𝑛o2 1 1 = 2 + p11 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) . 2 𝑛 𝑛e
(20.60) (20.61)
Die Form des Indexellipsoids ändert sich zeitlich und räumlich periodisch wellenförmig, die Hauptachsen bleiben jedoch unverändert (siehe Abb. 20.31). Da die Änderung der Brechungsindizes gewöhnlich klein ist, sind auch die zweiten Terme in den Gln. (20.60) und (20.61) klein, sodass die Näherung (1 + 𝛥)−1∕2 ≈ 1 − 𝛥∕2 für |𝛥| ≪ 1 verwendet werden kann, um die Gln. (20.60) und (20.61) in der genäherten Form 1
𝑛o ≈ 𝑛 − 𝑛3 p12 𝑆0 cos(𝛺𝑡 − 𝑞𝑧)
(20.62)
𝑛e ≈ 𝑛 − 𝑛3 p11 𝑆0 cos(𝛺𝑡 − 𝑞𝑧)
(20.63)
2 1 2
zu erhalten.
20.3 Akustooptik von anisotropen Medien
x
Ωt – qx = 0 Ωt – qx = π 2 Ωt – qx = π
y
Abb. 20.31 Eine akustische Longitudinalwelle, die sich in einem kubischen Kristall in z-Richtung ausbreitet, ändert die Form des Indexellipsoids von einer Kugel zu einem Rotationsellipsoid, dessen Abmessungen sich sinusförmig mit der Zeit und entlang einer Achse in z-Richtung ändern.
Übung 20-4: Transversale akustische Welle in einem kubischen Kristall
Die transversale akustische Welle aus Beispiel 20-5 breitet sich entlang einer der Achsen eines kubischen Kristalls aus. Zeigen Sie, dass der Kristall dadurch zweiachsig wird mit den Hauptbrechungsindizes 1
𝑛1 ≈ 𝑛 − 𝑛3 p44 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) ,
(20.64)
𝑛2 ≈ 𝑛 ,
(20.65)
2
1
𝑛3 ≈ 𝑛 + 𝑛 p44 𝑆0 cos(𝛺𝑡 − 𝑞𝑧) . 3
2
(20.66)
In Beispiel 20-6 und Übung 20-4 verändert die akustische Welle die Eigenwerte des Indexellipsoids, aber nicht seine Hauptachsen, d. h. das Ellipsoid behält seine Orientierung bei. Das muss jedoch nicht immer der Fall sein. Akustische Wellen in anderen Richtungen und mit anderen Polarisationen bezüglich der Kristallhauptachsen können zu einer Änderung der Hauptbrechungsindizes sowie der Hauptachsen des Kristalls führen.
2π 2π 𝑛r cos 𝜃r = 𝑛 cos 𝜃 , 𝜆0 𝜆0 2π 2π 2π 𝑛 sin 𝜃r + 𝑛 sin 𝜃 = , 𝛬 𝜆0 r 𝜆0
(20.68) (20.69)
und daher 𝑛r cos 𝜃r = 𝑛 cos 𝜃 ,
(20.70a)
𝜆0 . 𝑛r sin 𝜃r + 𝑛 sin 𝜃 = 𝛬
(20.70b)
Wenn die Wellenlängen 𝜆0 und 𝛬 bekannt sind, können die Winkel 𝜃 und 𝜃r durch Lösung von Gl. (20.70) bestimmt werden. 𝑛 und 𝑛r sind im Allgemeinen Funktionen von 𝜃 und 𝜃r , die aus dem Indexellipsoid des ungestörten Kristalls bestimmt werden können. 2π n
x
λ0
θr
z
r
kr
θ
q 2πn
2π
Λ
k
λ0
Abb. 20.32 Impulserhaltung (Bedingung gleicher Phase oder braggsche Bedingung) in einem anisotropen Medium.
Braggsche Beugung
Die Wechselwirkung einer linear polarisierten optischen Welle mit einer longitudinalen oder transversalen akustischen Welle in einem anisotropen Medium wird ebenfalls durch die in Abschnitt 20.1 besprochenen Prinzipien beschrieben. Die einfallende optische Welle wird an der akustischen Welle reflektiert, wenn die braggsche Bedingung der konstruktiven Interferenz erfüllt ist. Die Analyse ist im Vergleich zu der skalaren Theorie komplizierter, da die einfallenden und reflektierten Wellen sich mit unterschiedlichen Geschwindigkeiten ausbreiten und daher die Reflexions- und Einfallswinkel nicht gleich sein müssen. Die Bedingung für die braggsche Beugung ist die Impulserhaltung (Phasenbedingung) kr = k + q .
Die Beträge dieser Wellenvektoren sind 𝑘 = (2π∕𝜆0 )𝑛, 𝑘r = (2π∕𝜆0 )𝑛r und 𝑞 = (2π∕𝛬), wobei 𝜆0 und 𝛬 die optischen und akustischen Wellenlängen und 𝑛 und 𝑛r die Brechungsindizes der einfallenden bzw. reflektierten optischen Wellen sind. Wenn 𝜃 und 𝜃r die Einfalls- und Reflexionswinkel sind, kann die Vektorgleichung (20.67) durch zwei skalare Gleichungen ersetzt werden, die die 𝑧- und die 𝑥-Komponenten der Wellenvektoren in der Einfallsebene verknüpfen (siehe Abb. 20.32),
(20.67)
Die Gln. (20.70) können einfach gelöst werden, wenn die akustischen und optischen Wellen kollinear sind, sodass 𝜃 = ±π∕2 und 𝜃r = π∕2 ist. Die Vorzeichen + und − entsprechen Rückwärts- bzw. Vorwärtsreflexion wie in Abb. 20.33 dargestellt. Die Bedingungen (20.70) reduzieren sich dann auf eine einzige Bedingung 𝑛r ± 𝑛 =
𝜆0 . 𝛬
(20.71)
Für die Rückwärtsreflexion (positives Vorzeichen) muss 𝛬 kleiner sein als 𝜆0 , was abgesehen von sehr hochfrequenten akustischen Wellen unwahrscheinlich ist. Für Vorwärtsreflexion (negatives Vorzeichen) müssen die einfallenden und reflektierten Wellen unterschiedliche Polarisationen besitzen, sodass 𝑛r ≠ 𝑛 ist.
723
724
20 Akustooptik
q
k
kr
q
k
(a) Vorwärtsreflexion
kr
(b) Rückwärtsreflexion
Abb. 20.33 Wellenvektordiagramm für die Reflexion einer optischen Welle an einer akustischen Welle.
Aufgaben Aufgabe 20-1: Lichtbeugung an verschiedenen periodischen Strukturen
Diskutieren Sie die Beugung einer optischen ebenen Welle der Wellenlänge 𝜆 an den folgenden periodischen Strukturen und geben Sie in jedem Fall die geometrische Anordnung und die Frequenzverschiebung(en) an: (a) Eine sich ausbreitende akustische Welle der Wellenlänge 𝛬. (b) Eine stehende akustische Welle der Wellenlänge 𝛬. (c) Ein durchsichtiges Gradientenindexmedium mit einem Brechungsindex, der sich sinusförmig mit dem Ort ändert (Periode 𝛬). (d) Ein Schichtmedium aus parallelen alternierenden Schichten zweier Materialien mit unterschiedlichen Brechungsindizes, die eine periodische Struktur mit der Periode 𝛬 bilden (siehe Abschnitt 7.1.3). Aufgabe 20-2: Braggsche Beugung als Streuprozess
Eine einfallende optische Welle mit der Kreisfrequenz 𝜔, dem Wellenvektor k und der komplexen Einhüllenden 𝐴 wechselwirkt mit einem Medium, das durch eine akustische Welle mit der Kreisfrequenz 𝛺 und dem Wellenvektor q gestört wird, und erzeugt so eine durch Gl. (20.33) beschriebene Lichtquelle 𝒮. Der Winkel 𝜃 entspricht einer aufwärtsverschobenen braggschen Beugung, sodass die Streuquelle 𝒮 = Re{𝑆r (r) exp(i𝜔r 𝑡)} mit 𝑆r (r) = −(Δ𝑛0 ∕𝑛) 𝑘r2 𝐴 exp(−ikr ⋅ r), 𝜔r = 𝜔 + 𝛺 und kr = k + q ist. Diese Quelle emittiert ein gestreutes Feld 𝐸. Wenn wir annehmen, dass die einfallende Welle durch die akustooptische Wechselwirkung nicht gedämpft wird (die erste bornsche Näherung, d. h. 𝐴 bleibt näherungsweise konstant), erhalten wir das gestreute Licht durch Lösung der Helmholtzgleichung ∇2 𝐸 + 𝑘2 𝐸 = −𝑆. Diese Gleichung hat im Fernbereich die Lösung (siehe Aufgabe 22-5) 𝐸(r) ≈
wobei ˆ r der Einheitsvektor in der Richtung von r ist, 𝑘 = 2π∕𝜆 und 𝑉 das Volumen der Quelle. Verwenden Sie diese Gleichung, um einen Ausdruck für den Reflexionsgrad der akustooptischen Zelle zu bestimmen, wenn die braggsche Bedingung erfüllt ist. Vergleichen Sie Ihr Ergebnis mit Gl. (20.23).
exp(−i𝑘𝑟) ∫ 𝑆r (r′ ) exp(i𝑘ˆ r ⋅ r′ ) dr′ , 4π 𝑟 𝑉
Aufgabe 20-3: Bedingung für die Raman-Nath-Beugung
Leiten Sie einen Ausdruck für die maximale Dicke 𝐷S eines akustischen Strahls der Wellenlänge 𝛬 her, der Raman-Nath-Beugung von Licht der Wellenlänge 𝜆 erlaubt (siehe Abb. 20.13). Aufgabe 20-4: Kombinierte akustooptische und elektrooptische Modulation
Ein Ende eines Lithiumniobatkristalls (LiNbO3 ) befindet sich in einem Mikrowellenhohlraum mit einem elektromagnetischen Feld bei 3 GHz. Durch den piezoelektrischen Effekt (bei dem das elektrische Feld eine Deformation des Materials bewirkt) wird eine akustische Welle erzeugt. Licht aus einem He-Ne-Laser (𝜆0 = 633 nm) wird von der akustischen Welle reflektiert. Der Brechungsindex ist 𝑛 = 2.3, und die Schallgeschwindigkeit beträgt 𝑣S = 7.4 km∕s. Bestimmen Sie den Braggwinkel. Da Lithiumniobat auch ein elektrooptisches Material ist, moduliert das angelegte elektrische Feld den Brechungsindex, der wiederum die Phase des einfallenden Lichts moduliert. Skizzieren Sie das Spektrum des reflektierten Lichts. Nahmen Sie an, dass das elektrische Mikrowellenfeld ein Puls von kurzer Dauer ist, skizzieren Sie das Spektrum des reflektierten Lichts zu verschiedenen Zeitpunkten und geben Sie dabei die Beiträge der akustooptischen und elektrooptischen Effekte an. Aufgabe 20-5: Materialien für akustooptische Modulatoren
Untersuchen Sie die folgenden Materialien im Hinblick auf ihre mögliche Verwendung als Braggreflektoren: (1) CaF2 , (2) Quarzglas, (3) TiO2 , (4) LiNbO3 , (5) Si und (6) Ge. (a) Bestimmen Sie für jedes Material den Wellenlängenbereich der Transparenz (siehe Abb. 5.16), den akustooptischen Gütefaktor ℳ gemäß Gl. (20.8) und die Amplitude der Brechungsindexwelle Δ𝑛0 , die von einer Schallwelle mit einer Intensität von 10 W∕cm2 hervorgerufen wird. Vergleichen Sie Ihre Ergebnisse mit denen für hochdichtes Flintglas aus Beispiel 20-1. (b) Bestimmen Sie die inneren und äußeren Braggwinkel für die Beugung einer optischen Welle der Vakuumwellenlänge 𝜆0 = 2.5 μm an einer Schallwelle der Frequenz 𝑓 = 100 MHz, wenn sich die verschiedenen Braggzellen in Luft befinden. Vergleichen Sie Ihre Ergebnisse mit
Aufgaben
denen für hochdichtes Flintglas aus Beispiel 20-2. (c) Bestimmen Sie den Intensitätsreflexionsgrad ℛe für jedes Material für Licht der Wellenlänge 𝜆0 = 2.5 μm, eine Schallintensität von 𝐼𝑆 = 100 W∕cm und einer Eindringtiefe des Lichts in den Schall von 𝐿∕ sin 𝜃 = 1 mm. Vergleichen Sie Ihre Ergebnisse mit denen für hochdichtes Flintglas aus Beispiel 20-3. (d) Für welche Materialien erwarten Sie bei 𝜆0 = 0.532 μm die beste Leistung? Wie sieht es bei 1.06 μm aus? Aufgabe 20-6: Frequenzverschiebung mit einem Braggreflektor
Entwerfen Sie ein System zur Umwandlung einer monochromatischen optischen Welle mit der komplexen Wellenfunktion 𝑈(𝑡) = 𝐴 exp(i𝜔𝑡) in eine modulierte Welle mit der komplexen Wellenfunktion 𝐴 cos(𝛺𝑡) exp(i𝜔𝑡) unter Verwendung einer akustooptischen Zelle mit einer akustischen Welle 𝑠(𝑥, 𝑡) = 𝑆0 cos(𝛺𝑡 − 𝑞𝑥). Hinweis: Verwenden Sie aufwärts- und abwärtsverschobene Braggreflexionen. Aufgabe 20-7: Braggreflektor ohne Frequenzverschiebung
Entwerfen Sie ein akustooptisches System, das Licht ablenkt, ohne eine Frequenzverschiebung zu erzeugen. Hinweis: Verwenden Sie zwei Braggzellen. Aufgabe 20-8: Braggsche Vorwärtsbeugung
Eine transversale akustische Welle der Wellenlänge 𝛬 breitet sich in 𝑥-Richtung in einem einachsigen Kristall mit den Brechungsindizes 𝑛o und 𝑛e und der optischen Achse in 𝑧-Richtung aus. Leiten Sie einen Ausdruck für die Wellenlänge 𝜆0 einer einfallenden optischen Welle her, die in 𝑧-Richtung polarisiert ist und sich in 𝑥-Richtung ausbreitet und die braggsche Bedingung erfüllt. Wie ist die vorwärtsreflektierte Welle polarisiert? Bestimmen Sie 𝛬 für 𝜆0 = 633 nm, 𝑛e = 2.200 und 𝑛o = 2.286.
Weiterführende Literatur Bücher
T.-C. Poon, T. Kim, Engineering Optics with MATLAB, World Scientific 2006. N. A. Riza, Photonic Signals and Systems: An Introduction, Kapitel 5 und 7. McGraw-Hill 2013. P. A. Daymier (Hrsg.), Acoustic Metamaterials and Phononic Crystals, Springer 2013. J. C. Joshi, Acousto-Optic Devices and Their Defence Applications, Defence Scientific Information & Documentation Centre (Delhi) 2007. J. P. Wolfe, Imaging Phonons: Acoustic Wave Propagation in Solids, Cambridge University Press, Paperback 2005. A. Yariv, P. Yeh, Optical Waves in Crystals: Propagation and Control of Laser Radiation, Kapitel 9 und 10. Wiley 2003. M. Born, E. Wolf, Principles of Optics, Kapitel 12. Cambridge University Press, 7. erweiterte und korrigierte Aufl. 2002. D. Royer, E. Dieulesaint, Elastic Waves in Solids, Band 2, Generation, Acousto-Optic Interaction, Applications, Springer 2000. A. Korpel, Acousto-Optics, CRC Press, 2. Aufl. 1997. J. Xu, R. Stroud, Acousto-Optic Devices: Principles, Design and Applications, Wiley 1992. C. S. Tsai, Guided-Wave Acoustooptics: Interactions, Devices, and Applications, Springer 1990, Nachdruck 2011. A. Korpel (Hrsg.), Selected Papers on Acousto Optics, SPIE Optical Engineering Press 1990 (Milestone Series Bd. 16). M. Gottlieb, C. L. M. Ireland, J. M. Ley, Electro-Optic and Acousto-Optic Scanning and Deflection, CRC Press 1983. T. S. Narasimhamurty, Photoelastic and Electro-Optic Properties of Crystals, Springer/Plenum Press 1981. D. F. Nelson, Electric, Optic, and Acoustic Interactions in Dielectrics, Wiley 1979. M. V. Berry, The Diffraction of Light by Ultrasound, Academic Press 1966. L. Brillouin, ‚Diffusion de la lumière et des rayons X par un corps transparent homogène: Influence de l’agitation thermique‘, Annates de Physique (Paris) 9(17), 88–122, 1922. W. L. Bragg, ‚The Diffraction of X-Rays by Crystals (Nobel Lecture in Physics, 1915)‘. In: Nobel Lectures in Physics, 1901–1921, World Scientific 1998.
725
727
21 Elektrooptik Ähnlich wie die Akustooptik (Kapitel 20) ist auch die Elektrooptik ein Zweig der Optik, der sich damit beschäftigt, optische Strahlen zu modulieren, zu schalten, ab- und umzulenken oder abzutasten. In der Elektrooptik werden diese Maßnahmen jedoch mithilfe von Materialien realisiert, deren optische Eigenschaften sich unter der Einwirkung eines elektrischen Feldes (anstelle einer akustischen Welle) ändern. Dieses Feld verändert die Positionen, Orientierungen oder Formen der Moleküle, aus denen das Material besteht. Der elektrooptische Effekt beschreibt eine Änderung im Brechungsindex eines Materials durch die Anwendung eines statischen oder niederfrequenten elektrischen Feldes (Abb. 21.1). Ein an ein anisotropes optisches Material angelegtes elektrisches Feld verändert dessen Brechungsindizes und dadurch die Wirkung, die das Medium auf hindurchtretendes polarisiertes Licht hat. Die Veränderung des Brechungsindex aufgrund des angelegten elektrischen Feldes erfolgt gewöhnlich in einer von zwei Varianten: • Der Brechungsindex ändert sich proportional zum angelegten elektrischen Feld; man spricht dann von einem linearen elektrooptischen Effekt oder Pockelseffekt. • Der Brechungsindex ändert sich proportional zum Quadrat des angelegten elektrischen Feldes; in diesem Fall handelt es sich um einen quadratischen elektrooptischen Effekt oder Kerreffekt. elektrisches Feld Licht
elektrooptisches Material
Abb. 21.1 Ein statisches elektrisches Feld, das an ein elektrooptisches Material angelegt wird, verändert dessen Brechungsindex. Das verändert wiederum die Wirkung des Materials hindurchtretendes Licht. Auf diese Weise steuert das elektrische Feld das Licht.
Die Änderung im Brechungsindex ist normalerweise klein. Trotzdem kann die Phase einer optischen Welle, die sich durch ein elektrooptisches Medium ausbreitet, beträchtlich modifiziert werden, wenn die zurückgelegte Weglänge wesentlich größer ist als die Wellenlänge des Lichts. Wenn der Brechungsindex durch das elektrische Feld beispielsweise um 10−5 vergrößert wird, erfährt eine optische Welle, die sich über eine Entfernung von 105 Wellenlängen ausbreitet, eine zusätzliche Phasenverschiebung von 2π. Materialien, deren Brechungsindex durch ein angelegtes elektrisches Feld modifiziert werden kann, sind für die Herstellung elektrisch steuerbarer optischer Bauelemente von Nutzen, wie die folgenden Beispiele zeigen: • Eine Linse aus einem Material, dessen Brechungsindex geändert werden kann, besitzt eine anpassbare Brennweite. • Ein Prisma, dessen Beugungseigenschaften gesteuert werden können, kann als optischer Scanner verwendet werden. • Licht, das durch eine durchsichtige Platte mit steuerbarem Brechungsindex hindurchtritt, erfährt eine steuerbare Phasenverschiebung, wodurch die Platte als optischer Phasenmodulator eingesetzt werden kann. • Ein anisotroper Kristall, dessen Brechungsindizes verändert werden können, kann als variabler Retarder dienen; er kann verwendet werden, um die Polarisationseigenschaften von Licht zu ändern. • Ein Wellenretarder zwischen zwei gekreuzten Polarisatoren bewirkt eine Transmission, deren Intensität von der Phasenverschiebung abhängt (siehe Abschnitt 6.6.2). Die Transmission eines derartigen Bauelements ist daher elektrisch steuerbar, sodass es als optischer Intensitätsmodulator oder optischer Schalter verwendet werden kann. Regelbare Komponenten wie die genannten finden in der optischen Kommunikation und der optischen Signalverarbeitung zahlreiche Anwendungen.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
728
21 Elektrooptik
Ein elektrisches Feld kann die optischen Eigenschaften eines Materials auch durch Absorption modifizieren. Ein Halbleitermaterial ist normalerweise für Licht mit einer größeren Wellenlänge als die Bandlücke optisch transparent (siehe Abschnitt 17.2.2). Ein angelegtes elektrisches Feld kann die Bandlücke des Materials jedoch reduzieren, dadurch die Absorption erleichtern und das Material undurchsichtig machen. Dieser Effekt wird als Elektroabsorption bezeichnet und ist für die Herstellung von optischen Modulatoren und Schaltern nützlich.
In diesem Kapitel . . . Wir beginnen mit einer Beschreibung des elektrooptischen Effekts und der Grundlagen der elektrooptischen Modulation. Die Präsentation in Abschnitt 21.1 ist vereinfacht; die Berücksichtigung von anisotropen Effekten folgt in Abschnitt 21.2. Abschnitt 21.3 ist den elektrooptischen Eigenschaften von Flüssigkristallen gewidmet. Ein an die Moleküle eines Flüssigkristalls angelegtes elektrisches Feld bewirkt eine Änderung ihrer Orientierung. Das führt zu Änderungen in den optischen Eigenschaften des Mediums, d. h. es zeigt einen elektrooptischen Effekt. Die Moleküle eines verdrillten nematischen Flüssigkristalls sind schraubenförmig organisiert, sodass sie normalerweise als Polarisationsrotatoren wirken. Durch ein elektrisches Feld kann diese Orientierung gestört und so das Drehvermögen des Materials ausgeschaltet werden. Das Abschalten des elektrischen Feldes bewirkt, dass das Material seine ursprüngliche schraubenförmige Struktur und daher sein Drehvermögen wiedergewinnt. So wirkt das Bauelement als dynamischer Polarisationsrotator. Die Verwendung von zusätzlichen festen Polarisatoren macht aus einem solchen Polarisationsrotator einen Intensitätsmodulator oder einen Schalter. Dieses Verhalten ist die Grundlage der meisten Flüssigkristallanzeigen. Die elektrooptischen Eigenschaften von photobrechenden Medien werden in Abschnitt 21.4 betrachtet. Das sind Materialien, in denen die Absorption von Licht ein inneres elektrisches Feld erzeugt, das wiederum einen elektrooptischen Effekt auslöst, der die optischen Eigenschaften des Mediums verändert. So werden die optischen Eigenschaften des Mediums indirekt von dem darauf einfallenden Licht gesteuert – in photobrechenden Bauelementen steuert Licht Licht. Zuletzt geben wir in Abschnitt 21.5 eine kurze Einführung in die Elektroabsorption.
21.1 Grundlagen der Elektrooptik 21.1.1
Pockels- und Kerreffekt
Der Brechungsindex eines elektrooptischen Mediums ist eine Funktion 𝑛(𝐸) des angelegten statischen (oder langsam veränderlichen) elektrischen Feldes 𝐸. Die Funktion 𝑛(𝐸) ändert sich nur wenig mit 𝐸, sodass sie in eine Taylorreihe um 𝐸 = 0 entwickelt werden kann, 1
𝑛(𝐸) = 𝑛 + 𝑎1 𝐸 + 𝑎2 𝐸 2 + ⋯ , 2
(21.1)
wobei die Entwicklungskoeffizienten 𝑛 = 𝑛(0), 𝑎1 = 2 (d𝑛∕ d𝐸)|𝐸 = 0 , und 𝑎2 = (d 𝑛∕ d𝐸 2 )|𝐸 = 0 sind. Aus Gründen, die später klar werden, ist es sinnvoll, Gl. (21.1) durch zwei neue Koeffizienten r = −2𝑎1 ∕𝑛3 und s = −𝑎2 ∕𝑛3 auszudrücken, die als elektrooptische Koeffizienten bezeichnet werden, 1
1
2
2
𝑛(𝐸) = 𝑛 − r𝑛3 𝐸 − s𝑛3 𝐸 2 + ⋯ .
(21.2)
Die Terme zweiter und höherer Ordnung dieser Reihe sind normalerweise viele Größenordnungen kleiner als 𝑛; Terme höherer als der dritten Ordnung können problemlos vernachlässigt werden. Für spätere Anwendungen im Zusammenhang mit den optischen Eigenschaften anisotroper Medien (Abschnitt 6.3.1 ist es zweckmäßig, einen Ausdruck für die elektrische Impermeabilität η = 𝜀0 ∕𝜀 = 1∕𝑛2 des elektrooptischen Mediums als Funktion von 𝐸 herzuleiten. Der Parameter η ist für die Beschreibung der optischen Eigenschaften von anisotropen Medien nützlich (siehe Abschnitt 6.3.1). Es gilt Δη = (dη∕ d𝑛)Δ𝑛 = 1 1 (−2∕𝑛3 )(− r 𝑛3 𝐸 − s 𝑛3 𝐸 2 ) = r 𝐸 + s𝐸 2 , sodass 2
2
η(𝐸) ≈ η + r 𝐸 + s 𝐸 2
(21.3)
mit η = η(0) ist. Die elektrooptischen Koeffizienten r und s sind daher einfach die Koeffizienten des linearen bzw. quadratischen Terms in der Entwicklung von Δη. Das erklärt die seltsam anmutenden Definitionen von r und s in Gl. (21.2). Die Werte der Koeffizienten r und s hängen von der Richtung des angelegten elektrischen Feldes und der Polarisation des Lichts ab, wie in Abschnitt 21.2 besprochen wird. Pockelseffekt
In vielen Materialien ist der dritte Term in Gl. (21.2) gegen den zweiten vernachlässigbar, sodass wir 1
𝑛(𝐸) ≈ 𝑛 − r 𝑛3 𝐸 2
(21.4)
schreiben können, wie Abb. 21.2(a) illustriert. Das Medium wird dann als Pockelsmedium (oder die Anordnung als Pockelszelle) bezeichnet. Der Koeffizient r wird
21.1 Grundlagen der Elektrooptik
n(E)
n(E)
n
n
0
(a)
E
Kerreffekt
Wenn das Material zentrosymmetrisch ist, wie z. B. Gase, Flüssigkeiten und bestimmte Kristalle, muss 𝑛(𝐸) eine gerade Funktion sein [siehe Abb. 21.2(b)], da sie invariant bezüglich einer Umkehrung von 𝐸 sein muss. Ihre erste Ableitung bei 𝐸 = 0 verschwindet dann, sodass der Koeffizient r null sein muss; folglich ist 1
𝑛(𝐸) ≈ 𝑛 − s 𝑛3 𝐸 2 .
(21.5)
2
Das Material wird dann als Kerrmedium (oder die Anordnung als Kerrzelle) bezeichnet. Der Parameter s heißt Kerrkoeffizient oder quadratischer elektrooptischer Koeffizient. Typische Werte von s sind 10−18 bis 10−14 m2 ∕V2 in Kristallen und 10−22 bis 10−19 m2 ∕V2 in 1 Flüssigkeiten. Für 𝐸 = 106 V∕m liegt der Term s 𝑛3 𝐸 2 2
in Gl. (21.5) in der Größenordnung von 10−6 bis 10−2 in Kristallen und 10−10 bis 10−7 in Flüssigkeiten.
21.1.2 Elektrooptische Modulatoren und Schalter Phasenmodulatoren
Ein Lichtstrahl, der eine Pockelszelle der Länge 𝐿 durchquert, an der ein elektrisches Feld 𝐸 anliegt, erfährt eine Phasenverschiebung 𝜑 = 𝑛(𝐸)𝑘0 𝐿 = 2π𝑛(𝐸)𝐿∕𝜆0 , wenn 𝜆0 die Vakuumwellenlänge ist. Mithilfe von Gl. (21.4) erhalten wir r 𝑛3 𝐸𝐿 𝜆0
E
0
(b)
Pockelskoeffizient oder linearer elektrooptischer Koeffizient genannt. Typische Werte von r liegen im Bereich 10−12 bis 10−10 m∕V (1 bis 100 pm/V). Für 𝐸 = 106 V∕m (10 kV angelegt über eine Zelle der Dicke 1 cm) 1 liegt der Term r 𝑛3 𝐸 in Gl. (21.4) beispielsweise in 2 der Größenordnung von 10−6 bis 10−4 . Durch elektrische Felder veranlasste Änderungen des Brechungsindex sind tatsächlich sehr klein. Häufig als Pockelszellen verwendete Kristalle sind z. B. KTiOPO4 (KTP), β-BaB2 O4 (BBO), KH2 PO4 (KDP), NH4 H2 PO4 (ADP), LiNbO3 oder LiTaO3 ; auch bestimmte maßgeschneiderte Polymere werden gelegentlich verwendet.
𝜑 ≈ 𝜑0 − π
Abb. 21.2 Abhängigkeit des Brechungsindex vom elektrischen Feld: (a) Pockelsmedium, (b) Kerrmedium.
(21.6)
mit 𝜑0 = 2π𝑛𝐿∕𝜆0 . Wenn das elektrische Feld durch Anlegen einer Spannung 𝑉 an zwei Seiten der Zelle im Ab-
stand d erzeugt wird, ist 𝐸 = 𝑉∕d , und Gl. (21.6) gibt 𝜑 = 𝜑0 − π
𝑉 , 𝑉π
0
0
(21.7)
π
Vπ
0
V
mit 𝑉π =
d 𝜆0
𝐿 r 𝑛3
.
(21.8)
Der Parameter 𝑉π , die sogenannte Halbwellenspannung, ist die angelegte Spannung, bei der sich die Phasenverschiebung um π ändert. Gleichung (21.7) ist eine lineare Beziehung zwischen der optischen Phasenverschiebung und der Spannung. Man kann daher die Phase einer optischen Welle modulieren, indem man die Spannung 𝑉 verändert, die an das Material angelegt wird, durch das das Licht hindurchtritt. Der Parameter 𝑉π ist eine wichtige Eigenschaft des Modulators. Er hängt von den Materialeigenschaften (𝑛 und r), der Wellenlänge 𝜆0 und dem Seitenverhältnis d ∕𝐿 ab. Der Wert des elektrooptischen Koeffizienten r hängt von der Ausbreitungsrichtung des Lichts und der Richtung des elektrischen Feldes ab, da der Kristall im Allgemeinen anisotrop ist, wie Abschnitt 21.2 erläutert. Das elektrische Feld kann senkrecht zur Richtung der Lichtausbreitung (transversale Modulatoren) oder parallel dazu (longitudinale Modulatoren) angelegt werden; im zweiten Fall ist d = 𝐿 (Abb. 21.3). Die Betriebsgeschwindigkeit eines elektrooptischen Modulators wird durch elektrische kapazitive Effekte sowie die Durchgangszeit des Lichts durch das Material beschränkt. Wenn sich das elektrische Feld 𝐸(𝑡) während der Durchgangszeit T des Lichts wesentlich ändert, spürt die sich ausbreitende optische Welle auf ihrem Weg durch den Kristall unterschiedliche elektrische Felder. Die modulierte Phase zu einem Zeitpunkt 𝑡 ist dann proportional zum mittleren elektrischen Feld 𝐸(𝑡) im Intervall von 𝑡 − T bis 𝑡. Infolgedessen ist das Durchgangs-
729
730
21 Elektrooptik
V V
L
V
V
L
(a)
(b)
(c)
Abb. 21.3 (a) Longitudinaler Modulator. Die Elektroden können streifen- oder scheibenförmig sein oder aus transparenten Leitern bestehen. (b) Transversaler Modulator. (c) Transversaler Modulator für Wanderwellen. Typische Werte der Halbwellenspannung liegen bei einigen Kilovolt für longitudinale Modulatoren und einigen hundert Volt für transversale Modulatoren.
zeitlimit für die Modulationsbandbreite ≈ 1∕T . Um diese Zeit zu reduzieren, kann man z. B. die Spannung 𝑉 an ein Ende des Kristalls anlegen und die Elektroden als Übertragungsleitung einsetzen, wie Abb. 21.3(c) zeigt. Wenn die Geschwindigkeit der sich ausbreitenden elektrischen Welle gleich der der optischen Welle ist, können Durchgangszeiteffekte zumindest im Prinzip beseitigt werden. Handelsübliche Modulatoren der in Abb. 21.3 gezeigten Bauformen arbeiten im Allgemeinen im GHzBereich. Elektrooptische Modulatoren können auch als integriert-optische Bauelemente konstruiert werden, wie Abb. 21.4 zeigt. Diese Bauelemente arbeiten mit höheren Geschwindigkeiten und niedrigeren Spannungen als Vollmaterialbauelemente. Dabei wird in einem elektrooptischen Substrat (häufig LiNbO3 ) durch Eindiffusion eines Materials wie Titan, das den Brechungsindex vergrößert, ein optischer Wellenleiter hergestellt. Das elektrische Feld wird mithilfe von Elektroden an den Wellenleiter angelegt. Weil die Anordnung transversal und die Breite des Wellenleiters viel kleiner ist als seine Länge (d ≪ 𝐿), kann die Halbwellenspannung im Bereich
von wenigen Volt liegen. Solche Modulatoren können mit Geschwindigkeiten über 100 GHz betrieben werden. Das Licht kann mithilfe optischer Fasern in den Modulator ein- und wieder ausgekoppelt werden. Dynamische Wellenretarder
Ein anisotropes Medium besitzt zwei linear polarisierte Normalmoden, die sich mit unterschiedlichen Geschwindigkeiten ausbreiten, z. B. 𝑐0 ∕𝑛1 und 𝑐0 ∕𝑛2 (siehe Abschnitt 6.3.2). Wenn das Medium einen Pockelseffekt zeigt, dann werden die beiden Brechungsindizes durch ein statisches elektrisches Feld 𝐸 gemäß Gl. (21.4) modifiziert, d. h. 1
𝑛1 (𝐸) ≈ 𝑛1 − r1 𝑛13 𝐸 ,
(21.9)
𝑛2 (𝐸) ≈ 𝑛2 − r2 𝑛23 𝐸 ,
(21.10)
2 1 2
wobei r1 und r2 die zugehörigen Pockelskoeffizienten sind (anisotrope Effekte werden in Abschnitt 21.2 im Detail untersucht). Nach Ausbreitung über eine Entfernung 𝐿 haben die beiden Moden eine relative Phasen-
V ankommendes Licht
Wellenleiter Elektroden V
0
E Querschnitt
0
moduliertes Licht
Abb. 21.4 Ein integriert-optischer Phasenmodulator auf der Basis des elektrooptischen Effekts.
21.1 Grundlagen der Elektrooptik
verschiebung 𝛤 = 𝑘0 [𝑛1 (𝐸) − 𝑛2 (𝐸)]𝐿 = 𝑘0 (𝑛1 − 𝑛2 )𝐿 1
− 𝑘0 (r1 𝑛13 − r2 𝑛23 )𝐸𝐿 .
(21.11)
gleichmäßig aufteilen, hängt die durch einen Ausgang des Interferometers transmittierte Intensität 𝐼A mit der einfallenden Intensität 𝐼e gemäß
Wenn 𝐸 aus dem Anlegen einer Spannung 𝑉 zwischen zwei Oberflächen des Mediums in einem Abstand d resultiert, kann Gl. (21.11) kompakt als 𝛤 = 𝛤0 − π
𝑉 𝑉π
(21.12)
Γ Γ0 π
0
𝜆0 𝐿 r1 𝑛3 − r2 𝑛3 d
1
(21.13)
2
die angelegte Spannung, die notwendig ist, um eine Phasenverschiebung π zu erhalten. Gleichung (21.12) zeigt, dass die Phasenverschiebung linear mit der angelegten Spannung verknüpft ist, sodass das Medium als elektrisch regelbarer dynamischer Phasenschieber wirkt. Intensitätsmodulatoren: Der Einsatz eines Phasenmodulators in einem Interferometer
Eine Phasenverzögerung alleine beeinflusst die Intensität eines Lichtstrahls nicht. Ein in einen Arm eines Interferometers gestellter Phasenmodulator kann jedoch als Intensitätsmodulator wirken. Als Beispiel betrachten wir das in Abb. 21.5 dargestellte Mach-Zehnder-Interferometer. Wenn die Strahlteiler die optische Leistung Ie
IA
Zweig 2
2
𝒯(𝑉) = cos2 (
geschrieben werden, wobei 𝛤0 = 𝑘0 (𝑛1 − 𝑛2 )𝐿 die Phasenverschiebung ohne elektrisches Feld ist und 𝑉π =
1
2
V Zweig 1
𝜑0 π 𝑉 ). − 2 2 𝑉π
(21.15)
Diese Funktion ist in Abb. 21.5 für einen willkürlichen Wert von 𝜑0 aufgetragen. Das Bauelement kann als linearer Intensitätsmodulator betrieben werden, indem die Differenz der optischen Weglängen so geregelt wird, dass 𝜑0 = π∕2 ist und das Bauelement im nahezu linearen Bereich um 𝒯 = 0.5 betrieben wird. Alternativ kann die Differenz der optischen Weglängen so eingestellt werden, dass 𝜑0 ein Vielfaches von 2π ist. In diesem Fall ist 𝒯(0) = 1 und 𝒯(𝑉π ) = 0, sodass der Modulator das Licht ein- bzw. ausschaltet, wenn 𝑉 zwischen 0 und 𝑉π variiert wird. Ein Mach-Zehnder-Intensitätsmodulator kann auch integriert-optisch ausgeführt werden. Dazu werden Wellenleiter in der in Abb. 21.6 gezeigten Anordnung auf ein Substrat platziert. Die Strahlteiler werden durch Wellenleiterverzweigungen realisiert und die optischen Einund Ausgänge werden mit optischen Fasern verbunden. Handelsübliche integriert-optische Modulatoren arbeiten mit Geschwindigkeiten von einigen 10 GHz. (V)
C
1 B
0.5 0
Abb. 21.5 Ein Phasenmodulator in einem Zweig eines MachZehnder-Interferometers kann als Intensitätsmodulator dienen. Die Transmission 𝒯(V ) = IA ∕Ie des Interferometers ändert sich periodisch mit der angelegten Spannung V . In
(21.14)
zusammen, wobei 𝜑 = 𝜑1 − 𝜑2 die relative Phasenverschiebung der beiden Lichtwege durch die verschiedenen Arme ist (siehe Abschnitt 2.5.1). Die Transmission des Interferometers ist 𝒯 = 𝐼A ∕𝐼e = cos2 (𝜑∕2). Wegen des Phasenmodulators in Arm 1 folgt mit Gl. (21.7) 𝜑1 = 𝜑10 − π𝑉∕𝑉π , sodass 𝜑 gemäß der linearen Beziehung 𝜑 = 𝜑1 − 𝜑2 = 𝜑0 − π𝑉∕𝑉π durch die angelegte Spannung 𝑉 gesteuert wird, wobei die Konstante 𝜑0 = 𝜑10 − 𝜑2 von der Differenz der optischen Weglängen abhängt. Die Transmission des Bauelements ist daher eine Funktion der angelegten Spannung 𝑉,
V
Vπ
0
1
𝐼A = 𝐼e + 𝐼e cos 𝜑 = 𝐼e cos2 (𝜑∕2)
2
A Vπ
V
einem begrenzten Gebiet um den Punkt B wirkt das Bauelement als linearer Intensitätsmodulator. Wenn V zwischen den Punkten A und C umgeschaltet wird, wirkt das Bauelement als optischer Schalter.
731
732
21 Elektrooptik
ankommendes Licht Ie
schreibt. Die Phasenverschiebung 𝛤0 kann entweder optisch (durch Einbau eines zusätzlichen Phasenschiebers, eines Kompensators, in den Modulator) oder elektrisch (durch Anlegen einer konstanten Spannung zusätzlich zu 𝑉) gesteuert werden. In der Praxis ist die maximale Transmission des Modulators aufgrund von Verlusten durch Reflexion, Absorption und Streuung kleiner als eins. Außerdem ist die minimale Transmission aufgrund von Fehlausrichtungen der Ausbreitungs- und Polarisationsrichtungen bezüglich der Kristall- und Polarisatorachsen größer als null. Das Verhältnis zwischen der maximalen und der minimalen Transmission wird Extinktionsverhältnis genannt; Werte über 30 dB (1000 : 1) sind möglich.
V 0
moduliertes Licht IA
Abb. 21.6 Ein integriert-optischer Intensitätsmodulator (oder optischer Schalter). Ein Mach-Zehnder-Interferometer und ein elektrooptischer Phasenmodulator werden mithilfe von optischen Wellenleitern aus Materialien wie LiNbO3 hergestellt.
Intensitätsmodulatoren: Einsatz eines Phasenschiebers zwischen gekreuzten Polarisatoren
21.1.3
Wie in Abschnitt 6.6 beschrieben bewirkt ein Phasenschieber (mit der Verschiebung 𝛤) zwischen zwei gekreuzten Polarisatoren, die in Winkeln von 45◦ zur Achse des Verzögerers stehen (siehe Abb. 6.40), eine Intensi2 tätstransmission 𝒯 = sin (𝛤∕2). Wenn der Phasenschieber eine Pockelszelle ist, dann hängt 𝛤 gemäß Gl. (21.12) linear von der angelegten Spannung 𝑉 ab. Die Transmission des Bauelements ist dann eine periodische Funktion von 𝑉,
Ein optischer Strahl kann durch ein Prisma mit elektrisch geregeltem Brechungsindex dynamisch abgelenkt werden. Der durch ein Prisma mit dem kleinen Öffnungswinkel 𝛼 und dem Brechungsindex 𝑛 hervorgerufene Ablenkwinkel ist 𝜃 ≈ (𝑛 − 1)𝛼 [siehe Gl. (1.10)]. Eine durch ein angelegtes elektrisches Feld 𝐸 verursachte infinitesimale Änderung Δ𝑛 des Brechungsindex entspricht einer infinitesimalen Änderung des Ablenkwinkels
2
𝒯(𝑉) = sin (
𝛤0 π 𝑉 ), − 2 2 𝑉π
(21.16)
wie Abb. 21.7 zeigt. Durch Verändern von 𝑉 kann die Transmission zwischen 0 (geschlossener Verschluss) und 1 (offener Verschluss) variiert werden. Das Bauelement kann auch als linearer Modulator verwendet werden, wenn das System im Bereich um 𝒯(𝑉) = 0.5 betrieben wird. Für 𝛤0 = π∕2 und 𝑉 ≪ 𝑉π ist d𝒯 ||| π π 𝑉 | ) ≈ 𝒯(0) + 𝑉 − 4 2 𝑉π d𝑉 |||𝑉 = 0 1 π 𝑉 , (21.17) = − 2 2 𝑉π 2
𝒯(𝑉) = sin (
sodass 𝒯(𝑉) eine lineare Funktion mit der Steigung π∕2𝑉π ist, die die Empfindlichkeit des Modulators beIA
~
Scanner
1
1
2
2
Δ𝜃 = 𝛼Δ𝑛 = − 𝛼r 𝑛3 𝐸 = − 𝛼r 𝑛3 𝑉∕d ,
wobei 𝑉 die angelegte Spannung ist und d die Dicke des Prismas [Abb. 21.8(a)]. Durch Variation der angelegten Spannung 𝑉 ändert sich der Winkel Δ𝜃 proportional, sodass das einfallende Licht gescannt wird. Es ist häufig günstiger, dreieckige Elektroden an einem Kristall anzubringen, die die Rolle des Prismas übernehmen. Zwei oder mehrere solcher Prismen können hintereinander geschaltet werden, indem die Richtung des elektrischen Feldes wie in Abb. 21.8(b) dargestellt alternierend gewählt wird. Ein wichtiger Parameter zur Charakterisierung eines Scanners ist seine Auflösung, d. h. die Zahl unabhängiger Punkte, die er unterscheiden kann; es zeigt sich, dass elektrooptische Scanner in dieser Hinsicht nicht
(V)
1 Polarisator
Polarisator
0.5
B
(a)
t
1
0
Ie
(b)
Vπ
t
(21.18)
V
Abb. 21.7 (a) Ein optischer Intensitätsmodulator aus einer Pockelszelle zwischen zwei gekreuzten Polarisatoren. (b) Optische Transmission als Funktion der angelegten Spannung für einen beliebigen Wert von 𝛤0 ; linearer Betrieb ist in der Umgebung von B möglich.
21.1 Grundlagen der Elektrooptik
α
θ
D +V
(a)
θ
–V
Abb. 21.8 (a) Ein elektrooptisches Prisma. Der Ablenkwinkel 𝜃 wird durch die angelegte Spannung gesteuert. (b) Ein elektrooptisches Doppelprisma.
+V
L
(b)
sehr effizient sind. Ein optischer Strahl der Dicke 𝐷 und der Wellenlänge 𝜆0 hat eine Winkeldivergenz δ𝜃 ≈ 𝜆0 ∕𝐷 [siehe Gl. (4.40)]. Um diesen Winkel zu minimieren, sollte der Strahl so dick wie möglich sein und idealerweise die ganze Breite des Prismas selbst bedecken. Für eine gegebene maximale Spannung 𝑉 entsprechend einem Scanwinkel Δ𝜃 ist die Zahl unabhängiger Punkte 1
𝛼r 𝑛3 𝑉∕d |Δ𝜃| 2 𝑁≈ . = δ𝜃 (𝜆0 ∕𝐷)
(21.19)
Wenn wir 𝛼 ≈ 𝐿∕𝐷 und 𝑉π = (d ∕𝐿)(𝜆0 ∕r 𝑛3 ) einsetzen, erhalten wir 𝑉 𝑁≈ (21.20) 2𝑉π oder 𝑉 ≈ 2𝑁𝑉π . Das ist ein entmutigendes Ergebnis. Um 𝑁 unabhängige Punkte scannen zu können, brauchen wir eine Spannung von 2𝑁 mal der Halbwellenspannung. Da 𝑉π gewöhnlich groß ist, erfordert der Bau eines sinnvoll einsetzbaren Scanners mit 𝑁 ≫ 1 inakzeptable Hochspannungen. Übliche Scanner arbeiten daher meist mechanisch oder akustooptisch (siehe Abschnitte 20.2.2 und 24.3.2). Die Doppelbrechung in anisotropen Kristallen (siehe Abschnitt 6.3.5) führt für eine Polarisation eine parallele seitliche Verschiebung des einfallenden Strahls ein, während die andere Polarisation nicht verschoben wird. Dieser Effekt kann verwendet werden, um einen Strahl zwischen zwei Positionen zu verschieben, indem man seine Polarisation umschaltet. Dabei wird ein linear polarisierter optischer Strahl zuerst durch einen elektrooptischen Phasenschieber transmittiert, der als Polarisationsrotator wirkt, und danach durch den Kristall
geschickt. Der Rotator steuert die Polarisation, die bestimmt, ob der Strahl wie in Abb. 21.9 gezeigt seitwärts verschoben wird oder nicht.
21.1.4 Richtkoppler Eine wichtige Anwendung des elektrooptischen Effekts ist die Steuerung der Kopplung zwischen zwei parallelen Wellenleitern in integriert-optischen Bauelementen. Licht kann mithilfe eines elektrischen Feldes von einem Wellenleiter in einen anderen übertragen werden, sodass das Bauelement als elektrisch gesteuerter Richtkoppler dient. Die Kopplung des Lichts zwischen zwei parallelen planaren Einmodenwellenleitern [Abb. 21.10(a)] wurde in Abschnitt 9.4.2 untersucht. Dort wurde gezeigt, dass die von den beiden Wellenleitern geführten optischen Leistungen P 1 (𝑧) und P 2 (𝑧) entlang der Ausbreitungsrichtung 𝑧 periodisch ausgetauscht werden. Zwei Parameter bestimmen die Stärke dieses Kopplungsprozesses: Der Kopplungsfaktor 𝒞 (der von den Dimensionen der Wellenleiter, der Wellenlänge und den Brechungsindizes abhängt) und die Differenz der Ausbreitungskonstanten Δ𝛽 = 𝛽1 − 𝛽2 = 2πΔ𝑛∕𝜆0 , wobei Δ𝑛 die Differenz der Brechungsindizes der Wellenleiter ist. Wenn die Wellenleiter identisch sind, Δ𝛽 = 0 und P2 (0) = 0, dann wird die Leistung bei einer Entfernung 𝑧 = 𝐿0 = π∕2𝒞, der Kopplungslänge, vollständig von Wellenleiter 1 in Wellenleiter 2 übertragen, d. h. P 1 (𝐿0 ) = 0 und P2 (𝐿0 ) = P1 (0), wie Abb. 21.10(a) zeigt. Für einen Wellenleiter der Länge 𝐿0 mit Δ𝛽 ≠ 0 ist das Leistungstransferverhältnis 𝒯 = P 2 (𝐿0 )∕P 1 (0) eine Funktion der Phasenfehlanpassung [siehe Gl. (9.58a)], ⎡ π2 2 1 𝒯= sinc ⎢ ⎢2 4 ⎣
eletrooptischer Polarisationsrotator
doppelbrechender Kristall
Abb. 21.9 Ein Ortsumschalter auf Grundlage der elektrooptischen Phasenverschiebung und der Doppelbrechung.
√ 1+(
2 Δ𝛽 𝐿0 ⎤ ) ⎥ ⎥ π ⎦
(21.21)
mit sinc(𝑥) ≡ sin(π𝑥)∕(π𝑥). Abbildung 21.10(b) illustriert diese Abhängigkeit. Das Verhältnis hat seinen maximalen Wert eins bei Δ𝛽 𝐿0 = 0, nimmt mit zunehmen√ dem Δ𝛽 𝐿0 ab und verschwindet für Δ𝛽 𝐿0 = 3 π; an diesem Punkt wird keine optische Leistung in Wellenleiter 2 übertragen.
733
734
21 Elektrooptik
Wellenleiter 1
P1(0)
P1(0)
1
P2(L0 )
Wellenleiter 2
P1(z) P2(z)
(a)
0 0
0
L0
3π
ΔβL0
Abb. 21.10 (a) Austausch der Leistung zwischen zwei parallelen schwach gekoppelten Wellenleitern mit derselben Ausbreitungskonstante 𝛽 . Bei z = 0 steckt die ganze Leistung in Wellenleiter 1. Bei z = L0 ist die gesamte Leistung in Wellenleiter 2 übertragen. (b) Abhängigkeit des Leistungstransferverhältnisses 𝒯 = P 2 (L0 )∕P 1 (0) von der Phasenfehlanpassung Δ𝛽 L0 .
(b)
z
Die Abhängigkeit der übertragenen Leistung von der Phasenfehlanpassung ist der Schlüssel zu von elektrisch gesteuerten Richtkopplern. Wenn die Fehlanpassung √ Δ𝛽 𝐿0 von 0 auf 3π geschaltet wird, bleibt das Licht in Wellenleiter 1. Eine elektrische Steuerung von Δ𝛽 ist durch den elektrooptischen Pockelseffekt möglich. Ein an einen von zwei ansonsten identischen Wellenleitern angelegtes elektrisches Feld 𝐸 verändert dessen 1 Brechungsindex um Δ𝑛 = − 𝑛3 r 𝐸, wenn r sein Pockels2 koeffizient ist. Das entspricht einer Phasenverschiebung Δ𝛽 𝐿0 = Δ𝑛(2π𝐿0 ∕𝜆0 ) = −(π∕𝜆0 )𝑛3 r 𝐿0 𝐸. Ein typischer elektrooptischer Richtkoppler hat die in Abb. 21.11 gezeigte Form. Die Elektroden liegen über zwei Wellenleitern im Abstand d . Eine angelegte Spannung 𝑉 erzeugt ein elektrisches Feld 𝐸 ≈ 𝑉∕d in einem Wellenleiter und −𝑉∕d in dem anderen, wobei d eine effektive Entfernung ist, die durch Lösung des elektrostatischen Problems bestimmt wird (die elektrischen Feldlinien zeigen in einem Wellenleiter nach unten und im anderen nach oben). Der Brechungsindex wird in einem Wellenleiter vergrößert und im anderen verringert. Das Ergebnis ist eine Brechungsindexdifferenz 2Δ𝑛 = −𝑛3 r (𝑉∕d ) entsprechend einer Phasenfehlanpassung Δ𝛽 𝐿0 = −(2π∕𝜆0 )𝑛3 r (𝐿0 ∕d )𝑉, die proportional zur angelegten Spannung 𝑉 ist. Für die Spannung 𝑉0 , die notwendig ist, √ um die optische Leistung zu schalten, gilt |Δ𝛽 𝐿0 | = 3π, d. h. √ √ d 𝜆0 3 𝒞𝜆0 d 𝑉0 = 3 = , (21.22) 𝐿0 2𝑛3 r π 𝑛3 r
mit 𝐿0 = π∕2𝒞, wobei 𝒞 der Kopplungsfaktor ist. Diese Spannung heißt Umschaltspannung. √ Wegen |Δ𝛽 𝐿0 | = 3 π 𝑉∕𝑉0 gibt Gl. (21.21) π2 2 ⎡1 𝒯= sinc ⎢ 4 2 ⎣
√ 1 + 3(
2 𝑉 ⎤ )⎥. 𝑉0 ⎦
(21.23)
Diese Gleichung (die in Abb. 21.12 aufgetragen ist) bestimmt die Kopplung der Leistung als Funktion der angelegten Spannung 𝑉. Ein elektrooptischer Richtkoppler wird durch seine Kopplungslänge 𝐿0 charakterisiert, die umgekehrt proportional zum Kopplungsfaktor 𝒞 und zur Umschaltspannung 𝑉0 ist (die wiederum direkt proportional zu 𝒞 ist). Der Schlüsselparameter ist daher 𝒞, der durch den Aufbau und die Brechungsindizes bestimmt wird. Integriert-optische Richtkoppler können z. B. durch Eindiffusion von Titan in ein hochreine LiNbO3 Substrate hergestellt werden. Die Lichtstrahlen werden auf Durchmesser von einigen μm fokussiert. Die Enden der Wellenleiter können dauerhaft mit polarisationserhaltenden optischen Einmodenfasern verbunden werden (siehe Abschnitt 10.2.3). Die Umschaltspannung 𝑉0 liegt normalerweise unter 10 V, und die Betriebsgeschwindigkeiten können einige 10 GHz betragen. Größere Bandbreiten sind mit einer abgewandelten Version dieses Bauelements für Wanderwellen möglich.
1
P 1(0) V
0
L0
Faser
P 2(L0)
Abb. 21.11 Ein integriert-elektrooptischer Richtkoppler.
0
0
V0
V
Abb. 21.12 Abhängigkeit des Kopplungswirkungsgrads von der angelegten Spannung V . Für V = 0 wird die gesamte optische Leistung von Wellenleiter 1 in Wellenleiter 2 gekoppelt; für V = V0 bleibt die gesamte optische Leistung in Wellenleiter 1.
21.1 Grundlagen der Elektrooptik
Abb. 21.14 Elektrisch adressierbares Array von longitudinalen elektrooptischen Modulatoren.
Übung 21-1: Spektrale Antwort des Kopplungswirkungsgrads
Gleichung (21.22) zeigt, dass die Umschaltspannung 𝑉0 proportional zur Wellenlänge ist. Nehmen Sie an, dass die angelegte Spannung für einen gegebenen Wert 𝜆0 der Wellenlänge 𝑉 = 𝑉0 ist, sodass für den Kopplungswirkungsgrad bei 𝜆0 𝒯 = 0 gilt. Tragen Sie den Kopplungswirkungsgrad 𝒯 als Funktion von 𝜆0 − 𝜆0 auf, wenn die einfallende Welle stattdessen die Wellenlänge 𝜆0 besitzt. Nehmen Sie an, dass der Kopplungsfaktor 𝒞 und die Materialparameter 𝑛 und r nicht von der Wellenlänge abhängen.
21.1.5 Räumliche Lichtmodulatoren Ein räumlicher Lichtmodulator ist ein Bauelement, das die Intensität des Lichts an unterschiedlichen Orten um vorgegebene Faktoren moduliert (Abb. 21.13). Es handelt sich dabei um ein ebenes optisches Element mit regulierbarer Intensitätstransmission 𝒯(𝑥, 𝑦). Die transmittierte Lichtintensität 𝐼0 (𝑥, 𝑦) ist mit der einfallenden Lichtintensität 𝐼e (𝑥, 𝑦) über das Produkt 𝐼0 (𝑥, 𝑦) = 𝐼e (𝑥, 𝑦)𝒯(𝑥, 𝑦) verknüpft. Wenn das einfallende Licht gleichförmig ist, d. h. 𝐼e (𝑥, 𝑦)] konstant, ist die transmittierte Lichtintensität ist proportional zu 𝒯(𝑥, 𝑦). Das „Bild“ 𝒯(𝑥, 𝑦) wird dann auf das transmittierte Licht übertragen, etwa wie beim „Lesen“ des in einer Folie gespeicherten Bildes bei gleichförmiger Beleuchtung mit einem Diaprojektor. In einem räumlichen Lichtmodulator ist 𝒯(𝑥, 𝑦) jedoch steuerbar. In einem elektrooptischen Modulator erfolgt diese Steuerung elektrisch. Zur Konstruktion eines räumlichen Lichtmodulators auf der Grundlage des elektrooptischen Effekts ist ein Mechanismus erforderlich, der ein elektrische Feld 𝐸(𝑥, 𝑦) proportional zur gewünschten Transmission 𝒯(𝑥, 𝑦) an jedem Ort erzeugt. Das ist nicht leicht. Eine Methode ist, eine Reihe von transparenten Elektroden auf kleine Platten eines elektrooptischen Materials zwischen gekreuzten Polarisatoren anzubringen und an jede Elektrode eine geeignete Spannung anzuy
moduliertes Licht
legen (Abb. 21.14). Die an die Elektrode am Ort (𝑥e , 𝑦e ) (𝑖 = 1, 2, …) angelegte Spannung wird proportional zum gewünschten Wert von 𝒯(𝑥e , 𝑦e ) gewählt (siehe z. B. Abb. 21.7). Wenn die Zahl von Elektroden groß genug ist, entspricht die Transmission näherungsweise 𝒯(𝑥, 𝑦). Im Prinzip ist ein solches System nichts weiter als ein paralleles Array von longitudinalen elektrooptischen Modulatoren, die als Intensitätsmodulatoren betriebenen werden. Die unabhängige Adressierung einer großen Zahl solcher Elektroden ist aber im Normalfall nicht praktikabel; in räumlichen Lichtmodulatoren auf der Grundlage von Flüssigkristallen, die als Anzeigen verwendet werden, wird es jedoch mit Erfolg eingesetzt, da die erforderlichen Spannungen hier gering sind (siehe Abschnitt 21.3.2). Optisch adressierte elektrooptische räumliche Lichtmodulatoren
Eine Methode, einen elektrooptischen räumlichen Lichtmodulator optisch zu adressieren, beruht auf einer dünnen Schicht eines photoleitenden Materials, die das elektrische Feld erzeugt, das für den Betrieb des Modulators erforderlich ist (Abb. 21.15). Die Leitfähigkeit eines photoleitenden Materials ist proportional zur Intensität des darauf einfallenden Lichts (siehe Abschnitt 19.2). Wenn es von Licht mit der Intensitätsvery
photoleitendes moduliertes Material Licht elektrooptisches Material Leselicht
Schreiben IS (x,y)
Spiegel transparente Elektrode
Transmission (x,y)
einfallendes Licht
x
x Abb. 21.13 Räumlicher Lichtmodulator.
Abb. 21.15 Der elektrooptische räumliche Lichtmodulator verwendet ein photoleitendes Material, um eine räumliche Verteilung des elektrischen Feldes zu erzeugen, die zur Steuerung eines elektrooptischen Materials dient.
735
736
21 Elektrooptik
teilung 𝐼W (𝑥, 𝑦) bestrahlt wird, entsteht ein räumliches Muster 𝐺(𝑥, 𝑦) ∝ 𝐼W (𝑥, 𝑦) der Leitfähigkeit. Die photoleitende Schicht befindet sich zwischen zwei Elektroden, die als Kondensator wirken. Dieser Kondensator wird am Anfang geladen, und die Leckage der elektrischen Ladung am Ort (𝑥, 𝑦) ist proportional zur lokalen Leitfähigkeit 𝐺(𝑥, 𝑦). Infolgedessen wird die Ladung in dem Kondensator an den Stellen reduziert, wo die Leitfähigkeit hoch ist. Die lokale Spannung ist daher proportional zu 1∕𝐺(𝑥, 𝑦) und für das entsprechende elektrische Feld gilt 𝐸(𝑥, 𝑦) ∝ 1∕𝐺(𝑥, 𝑦) ∝ 1∕𝐼W (𝑥, 𝑦). Wenn die Transmission 𝒯(𝑥, 𝑦) [oder der Reflexionsgrad ℛ(𝑥, 𝑦)] des Modulators proportional zum angelegten Feld ist, muss sie umgekehrt proportional zur einfallenden Lichtintensität 𝐼W (𝑥, 𝑦) sein. Der optische Pockelsspeicher
Eine raffinierte Realisierung dieses Prinzips ist der optische Pockelsspeicher (OPS). Er besteht z. B. aus einem Kristall aus Bismutsiliciumoxid Bi12 SiO20 (BSO) mit einer ungewöhnlichen Kombination von optischen und elektrischen Eigenschaften: (i) zeigt es einen elektrooptischen (Pockels-) Effekt, (ii) ist es für blaues Licht photoleitend, nicht aber für rotes Licht, und (iii) ist es im Dunkeln ein guter Isolator. Ein OPS (Abb. 21.16) besteht aus einer dünnen BSO-Schicht zwischen zwei transparenten Elektroden. Das Licht, das moduliert werden soll (Leselicht), tritt durch einen Polarisator in die BSO-Schicht und wird an einem dichroitischen Reflektor reflektiert, woraufhin es einen zweiten Polarisator durchquert. Der Reflektor reflektiert rotes Licht, ist aber für blaues Licht transparent. Im Einzelnen laufen beim Betrieb eines OPS folgende Prozesse ab: Eine große Potentialdifferenz (≈ 4 kV) wird an die Elektroden angelegt und der Kondensator wird geladen (ohne Leckage, da der Kristall im Dunkeln ein guter Isolator ist).
Vorbereitung:
dichroitischer Reflektor für rotes Licht transparente Elektrode
transparente Elektrode
Der Kristall wird mit intensivem blauen Licht der Intensitätsverteilung 𝐼W (𝑥, 𝑦) bestrahlt. Dabei wird ein räumliches Muster 𝐺(𝑥, 𝑦) ∝ 𝐼W (𝑥, 𝑦) der Leitfähigkeit erzeugt, die Spannung über den Kristall wird lokal verringert, und das elektrische Feld an jedem Ort nimmt proportional ab, 𝐸(𝑥, 𝑦) ∝ 1∕𝐺(𝑥, 𝑦) ∝ 1∕𝐼W (𝑥, 𝑦). Infolge des elektrooptischen Effekts werden die Brechungsindizes von BSO verändert, und ein räumliches Muster Δ𝑛(𝑥, 𝑦) ∝ 1∕𝐼W (𝑥, 𝑦) der Brechungsindexänderung entsteht und wird im Kristall gespeichert. Lesen: Wie bei gewöhnlichen elektrooptischen Intensitätsmodulatoren [siehe Abb. 21.7(a)] wird Δ𝑛(𝑥, 𝑦) mit gleichförmigem roten Licht gelesen, wobei der polarisierende Strahlteiler die Rolle der gekreuzten Polarisatoren übernimmt. Löschen: Das Brechungsindexmuster wird durch einen gleichförmigen Blitz von blauem Licht gelöscht. Der Kristall kann durch Anlegen einer Spannung von 4 kV wieder vorbereitet werden, und ein neuer Kreislauf beginnt. Schreiben:
Optische inkohärent-kohärent-Wandler
In einem optisch adressierten räumlichen Lichtmodulator wie dem OPS muss das Schreiblicht, das ein räumliches Muster in dem Modulator speichert, nicht kohärent sein, da photoleitende Materialien nur für die optische Intensität empfindlich sind. Ein räumliches optisches Muster (ein Bild) kann daher mit inkohärentem Licht geschrieben und anschließend mit kohärentem Licht gelesen werden. Dieser Prozess der Echtzeit-Konversion einer räumlichen Verteilung von natürlichem inkohärenten Licht in eine proportionale räumliche Verteilung von kohärentem Licht ist in der optischen Daten- und Bildverarbeitung nützlich.
Abb. 21.16 Der optische Pockelsspeicher (OPS).
polarisierender Strahlteiler moduliertes Licht
Schreiblicht (blau)
BSO
einfallendes Leselicht (rot)
21.2 Elektrooptik anisotroper Medien
x3 n3
Indexellipse
21.2.2 Pockels- und Kerreffekt k
na n2
n1 nb x1
x2
Indexellipsoid
Abb. 21.17 Das Indexellipsoid. Der Koordinaten (x1 , x2 , x3 ) sind die Hauptachsen und n1 , der n2 , n3 sind die Hauptbrechungsindizes. Die Brechungsindizes der Normalschwingungen einer Welle, die sich in der Richtung k ausbreitet, sind na und nb .
21.2 Elektrooptik anisotroper Medien In Abschnitt 21.1 haben wir die elementaren Grundlagen und Anwendungen der Elektrooptik vereinfacht vorgestellt; Polarisation und anisotrope Effekte haben wir entweder ignoriert oder nur allgemein erwähnt. In diesem Abschnitt werden wir eine vollständigere Analyse der Elektrooptik von anisotropen Medien präsentieren. Wir beginnen mit einer kurzen Auffrischung einiger wichtiger Eigenschaften von anisotropen Medien (siehe Abschnitt 6.3).
21.2.1 Kristalloptik: Eine kurze Wiederholung Die optischen Eigenschaften eines anisotropen Mediums werden durch eine geometrische Konstruktion beschrieben, die als Indexellipsoid bezeichnet wird, ∑ 𝑖𝑗
η𝑖𝑗 𝑥e 𝑥𝑗 = 1 ,
+
𝑥22 ∕𝑛22
+
𝑘
𝑘𝑙
(21.24) 1 2 𝜕 η𝑖𝑗 ∕ 2
wobei η𝑖𝑗 = η𝑖𝑗 (0), r𝑖𝑗𝑘 = 𝜕η𝑖𝑗 ∕𝜕𝐸𝑘 und s𝑖𝑗𝑘𝑙 = 𝜕𝐸𝑘 𝜕𝐸𝑙 ist und die Ableitungen bei E = 0 berechnet werden. Gleichung (21.24) ist eine Verallgemeinerung von Gl. (21.3), in der r durch 33 = 27 Koeffizienten {r𝑖𝑗𝑘 } und s durch 34 = 81 Koeffizienten {s𝑖𝑗𝑘𝑙 } ersetzt ist. Die Koeffizienten {r𝑖𝑗𝑘 } werden als lineare elektrooptische (Pockels-) Koeffizienten bezeichnet; sie bilden einen Tensor dritter Stufe. Die Koeffizienten {s𝑖𝑗𝑘𝑙 } sind die quadratischen elektrooptischen (Kerr-) Koeffizienten; sie bilden einen Tensor vierter Stufe. Abb. 21.18 Das Indexellipsoid wird durch Anlegen eines statischen elektrischen Feldes modifiziert.
𝑖, 𝑗 = 1, 2, 3 ,
wobei η𝑖𝑗 = η𝑗𝑖 die Elemente des Impermeabilitätstensors sind, 𝛈 = 𝜀0 𝛆−1 . Wenn die Achsen des Ellipsoids mit den Hauptachsen des Mediums zusammenfallen, sind seine Abmessungen entlang dieser Achsen gerade die Hauptbrechungsindizes 𝑛1 , 𝑛2 und 𝑛3 (Abb. 21.17): 𝑥12 ∕𝑛12
Wenn ein statisches elektrisches Feld E mit den Komponenten (𝐸1 , 𝐸2 , 𝐸3 ) an einen elektrooptischen Kristall angelegt wird, verändern sich die Elemente des Tensors 𝛈. Jedes der neun Elemente η𝑖𝑗 wird dann eine Funktion von 𝐸1 , 𝐸2 und 𝐸3 , d. h. η𝑖𝑗 = η𝑖𝑗 (E), sodass das Indexellipsoid verändert wird (Abb. 21.18). Wenn wir die Funktionen η𝑖𝑗 (E) kennen, können wir das Indexellipsoid und die optischen Eigenschaften für ein beliebiges angelegtes elektrisches Feld E bestimmen. Das Aufgabe ist im Prinzip einfach, aber die praktische Durchführung ist oft mühsam. Jedes der Elemente η𝑖𝑗 (E) ist eine Funktion der drei Variablen E = (𝐸1 , 𝐸2 , 𝐸3 ), die in eine Taylorreihe um E = 0 entwickelt werden können, ∑ ∑ η𝑖𝑗 (E) = η𝑖𝑗 + r𝑖𝑗𝑘 𝐸𝑘 + s𝑖𝑗𝑘𝑙 𝐸𝑘 𝐸𝑙 , 𝑖, 𝑗, 𝑘, 𝑙 = 1, 2, 3 ,
𝑥32 ∕𝑛32
= 1.
Das Indexellipsoid kann verwendet werden, um die Polarisation und die Brechungsindizes 𝑛𝑎 und 𝑛𝑏 der beiden Normalmoden einer Welle zu bestimmen, die sich in einer beliebigen Richtung in dem anisotropen Medium ausbreitet. Dazu legt man eine Ebene senkrecht zur Ausbreitungsrichtung durch das Zentrum des Ellipsoids. Ihre Schnittlinie mit dem Ellipsoid ist eine Ellipse, deren große und kleine Halbachsen gleich 𝑛𝑎 bzw. 𝑛𝑏 sind, wie in Abschnitt 6.3.3 beschrieben.
Symmetrie
Weil 𝛈 symmetrisch ist (η𝑖𝑗 = η𝑗𝑖 ), sind r und s invariant bezüglich Vertauschungen der Indizes 𝑖 und 𝑗, d. h. r𝑖𝑗𝑘 = r𝑗𝑖𝑘 und s𝑖𝑗𝑘𝑙 = s𝑗𝑖𝑘𝑙 . Außerdem sind die Koeffi1
zienten s𝑖𝑗𝑘𝑙 = 𝜕 2 η𝑖𝑗 ∕𝜕𝐸𝑘 𝜕𝐸𝑙 invariant bezüglich einer 2 Vertauschung von 𝑘 und 𝑙 (weil die Reihenfolge der Differentiation gleichgültig ist), sodass auch s𝑖𝑗𝑘𝑙 = s𝑖𝑗𝑙𝑘 gilt. Wegen dieser Permutationssymmetrie ergeben sich aus den neun Kombinationen der Indizes 𝑖, 𝑗 nur sechs anstelle von neun unabhängigen Elementen. Dasselbe gilt für die Indizes 𝑘, 𝑙. Folglich hat r𝑖𝑗𝑘 nur 6 × 3 unabhängige Elemente, wohingegen s𝑖𝑗𝑘𝑙 immerhin 6 × 6 unabhängige Elemente besitzt.
737
738
21 Elektrooptik
Tab. 21.1 Korrespondenztabelle für den Index I und das Indexpaar (i, j ) [das Paar (i, j ) = (3,2) entspricht z. B. I = 4]. j
i=1
2
3
1
1
6
5
2 3
6 5
2 4
4 3
Üblicherweise werden die Indizes (𝑖, 𝑗), 𝑖, 𝑗 = 1, 2, 3, gemäß Tabelle 21.1 zu einem einzigen Index 𝐼 = 1, 2, … , 6 zusammengefasst. Entsprechend wird (𝑘, 𝑙) durch einen Index 𝐾 = 1, 2, … , 6 ersetzt. So werden die Elemente r𝑖𝑗𝑘 und s𝑖𝑗𝑘𝑙 zu r𝐼𝑘 bzw. s𝐼𝐾 . Zum Beispiel wird r12𝑘 als r6𝑘 bezeichnet, s1231 als s65 und so weiter. Folglich wird der Tensor dritter Stufe r durch eine 6 × 3-Matrix ersetzt, und der Tensor vierter Stufe s wird zu einer 6 × 6-Matrix. Kristallsymmetrie
Die Symmetrie des Kristalls erlegt den Elementen von r und s weitere Einschränkungen auf. Einige Einträge müssen null sein, andere müssen gleich sein, wieder andere denselben Betrag aber entgegengesetztes Vorzeichen besitzen oder durch eine andere Regel verknüpft sein. Für zentrosymmetrische Materialien verschwindet beispielsweise r; sie zeigen daher nur einen Kerreffekt. Listen der Koeffizienten von r und s und ihrer Symmetriebeziehungen für die 32 kristallographischen Punktgruppen sind in mehreren der in der Weiterführenden Literatur aufgeführten Bücher zu finden. Typische Beispiele sind in den Tabellen 21.2 und 21.3 angegeben. Pockelseffekt
Mit dem folgenden Verfahren können die optischen Eigenschaften eines anisotropen Materials bestimmt werden, das in Gegenwart eines elektrischen Feldes E einen Pockelseffekt zeigt:
Tab. 21.2 Pockelskoeffizienten rIk für einige kristallographische Punktgruppen. ⎡0 0 0⎤ ⎢0 0 0⎥ ⎢ ⎥ ⎢0 0 0⎥ ⎢ ⎥ ⎢r41 0 0 ⎥ ⎢ ⎥ ⎢ 0 r41 0 ⎥ ⎢ ⎥ ⎣ 0 0 r41 ⎦
0 0⎤ ⎡0 ⎢0 0 0⎥ ⎢ ⎥ ⎢0 0 0⎥ ⎢ ⎥ ⎢r41 0 0 ⎥ ⎢ ⎥ ⎢ 0 r41 0 ⎥ ⎢ ⎥ 0 r63 ⎦ ⎣0
⎡ 0 −r22 r13 ⎤ ⎢ 0 r22 r13 ⎥ ⎢ ⎥ ⎢ 0 0 r33 ⎥ ⎢ ⎥ ⎢ 0 r51 0⎥ ⎢ ⎥ ⎢ r51 0 0⎥ ⎢ ⎥ 0 0⎦ ⎣−r22
kubisch 43𝑚 (z. B. GaAs, CdTe, InAs)
tetragonal 42𝑚 (z. B. KDP, ADP)
trigonal 3𝑚 (z. B. BBO, LiNbO3 , LiTaO3 )
Tab. 21.3 Kerrkoeffizienten sIK für ein isotropes Medium. Die Form dieser Matrix ist identisch mit der des photoelastischen Tensors eines isotropen Mediums aus Gl. (20.56). ⎡s11 ⎢s ⎢ 12 ⎢s ⎢ 12 ⎢0 ⎢ ⎢0 ⎢ ⎣0
s12
s12
0
0
s11
s12
0
0
s12
s11
0
0
0
0
s44
0
0
0
0
s44
0
0
0
0
0⎤ 0⎥ ⎥ 0⎥ ⎥, 0⎥ ⎥ 0⎥ ⎥ s44 ⎦
s44 =
1 (s − s12 ) 2 11
1) Zuerst müssen die Hauptachsen und Hauptbrechungsindizes 𝑛1 , 𝑛2 und 𝑛3 ohne elektrisches Feld E bestimmt werden. 2) Dann werden z. B. aus Tabelle 21.2 unter Beachtung der Regeln für die Verknüpfung der 𝐼 mit den (𝑖, 𝑗) gemäß Tabelle 21.1 die Koeffizienten {r𝑖𝑗𝑘 } der passenden Matrix für r𝐼𝑘 aufgesucht. 3) Anschließend werden die Elemente des Impermeabilitätstensors ∑ η𝑖𝑗 (E) = η𝑖𝑗 (0) + r𝑖𝑗𝑘 𝐸𝑘 , (21.25) 𝑘
bestimmt, wobei η𝑖𝑗 (0) eine Diagonalmatrix mit den Elementen 1∕𝑛12 , 1∕𝑛22 und 1∕𝑛32 ist. 4) Nun wird die Gleichung für das modifizierte Indexellipsoid formuliert, ∑ η𝑖𝑗 (E) 𝑥e 𝑥𝑗 = 1 . (21.26) 𝑖𝑗
5) Dann werden die Hauptachsen des modifizierten Indexellipsoids durch Diagonalisierung bestimmt und die entsprechenden Hauptbrechungsindizes 𝑛1 (E), 𝑛2 (E) und 𝑛3 (E) berechnet. 6) Schließlich werden aus diesem Indexellipsoid für die gegebene Richtung der Lichtausbreitung die Normalschwingungen und ihre zugehörigen Brechungsindizes berechnet. Beispiel 21-1: Trigonale 3m-Kristalle (LiNbO3 und LiTaO3 )
Trigonale 3𝑚-Kristalle sind optisch einachsig (𝑛1 = 𝑛2 = 𝑛o , 𝑛3 = 𝑛e ); die zugehörige Matrix r ist in Tabelle 21.2 angegeben. Wenn wir E = (0, 0, 𝐸) annehmen, d. h. dass das elektrische Feld entlang der optischen Achse zeigt (siehe Abb. 21.19), dann gilt für das modifizierte Indexellipsoid (
( ) 1 1 + r13 𝐸) 𝑥12 + 𝑥22 + ( 2 + r33 𝐸) 𝑥32 = 1 . (21.27) 2 𝑛o 𝑛e
Das ist ein Rotationsellipsoid, dessen Hauptachsen sich nicht ändern, wenn das elektrische Feld angelegt
21.2 Elektrooptik anisotroper Medien
optische Achse
z
x3 ne
E
–12 ne3
no
no y
x
33 E
Abb. 21.19 Veränderung des Indexellipsoids von trigonalen 3m-Kristallen wie LiNbO3 durch Anlegen eines statischen elektrischen Feldes entlang der Richtung der optischen Achse.
x2
x1 1 3 n E 2 o 13
wird. Die ordentlichen und außerordentlichen Indizes 𝑛o (𝐸) und 𝑛e (𝐸) sind 1 1 = 2 + r13 𝐸 , 2 𝑛o (𝐸) 𝑛o 1 𝑛e2 (𝐸)
=
(21.28)
1 + r33 𝐸 . 𝑛e2
(21.29)
Weil die Terme r13 𝐸 und r33 𝐸 in den Gln. (21.28) und (21.29) klein sind, benutzen wir die Näherung (1 + 1 𝛥)−1∕2 ≈ 1 − 𝛥, die für |𝛥| ≪ 1 gilt, und erhalten 2
mit 1 1 1 1 = = + r63 𝐸 , − r63 𝐸 , 𝑛3 (𝐸) = 𝑛e . 𝑛12 (𝐸) 𝑛o2 𝑛22 (𝐸) 𝑛o2 (21.34) Ausmultiplizieren und Einsetzen der Taylorentwick1 lung (1 + 𝛥)−1∕2 ≈ 1 − 𝛥 liefert 2
1
𝑛1 (𝐸) ≈ 𝑛o − 𝑛o3 r63 𝐸 ,
(21.35)
𝑛2 (𝐸) ≈ 𝑛o + 𝑛o3 r63 𝐸 ,
(21.36)
𝑛3 (𝐸) = 𝑛e .
(21.37)
2 1 2
1
𝑛o (𝐸) ≈ 𝑛o − 𝑛o3 r13 𝐸 ,
(21.30)
2
1
𝑛e (𝐸) ≈ 𝑛e − 𝑛e3 r33 𝐸 .
(21.31)
2
Diese Gleichungen ähneln der allgemeinen Gl. (21.4) sehr. Wir schließen daraus, dass ein einachsiger Kristall bei Anlegen eines elektrischen Feldes entlang der optischen Achse einachsig mit denselben Hauptachsen bleibt, wie in Abb. 21.19 dargestellt, dass seine Brechungsindizes jedoch gemäß den Gln. (21.30) und (21.31) modifiziert werden.
Beispiel 21-2: Tetragonale 42m-Kristalle (KDP und ADP)
Wenn wir bei dieser Klasse von einachsigen Kristallen ebenso vorgehen wie in Beispiel 21-1 und annehmen, dass das elektrische Feld entlang der optischen Achse liegt (Abb. 21.20), erhalten wir die folgende Gleichung für das Indexellipsoid: 𝑥12 + 𝑥22 𝑛o2
+
𝑥32 𝑛e2
+ 2r63 𝐸𝑥1 𝑥2 = 1 .
(21.32)
+
𝑥22 𝑛22 (𝐸)
Beispiel 21-3: Kubische 43m-Kristalle (GaAs, CdTe und InAs)
Wir nehmen an, dass das angelegte elektrische Feld entlang einer kubischen Achse des Materials liegt (in Abb. 21.21 in 𝑧-Richtung). In diesem Fall das Indexellipsoid für den isotropen Kristall (𝑛1 = 𝑛2 = 𝑛3 = 𝑛) 𝑥12 + 𝑥22 + 𝑥32
+ 2r41 𝐸𝑥1 𝑥2 = 1 , (21.38) 𝑛2 wobei r63 den Wert r41 annimmt (siehe Tabelle 21.2). Wie in Beispiel 21-2 sind die neuen Hauptachsen um 45° um die 𝑧-Achse rotiert, und die Hauptbrechungsindizes sind 1
Wir erhalten die modifizierten Hauptachsen, indem ◦ wir das Koordinatensystem um 45 ro√ um die 𝑧-Achse √ tieren. Wenn wir 𝑥1′ = (𝑥1 + 𝑥2 )∕ 2, 𝑥2′ = (𝑥1 − 𝑥2 )∕ 2 und 𝑥3′ = 𝑥3 in Gl. (21.32) einsetzen und das Koordinatensystem mit (𝑥1 , 𝑥2 , 𝑥3 ) beschreiben, erhalten wir 𝑥12 𝑛12 (𝐸)
Offensichtlich verhält sich der ursprünglich einachsige Kristall wie ein zweiachsiger Kristall, wenn ein elektrisches Feld entlang seiner optischen Achse angelegt wird, wie in Abb. 21.20 dargestellt.
+
𝑥32 𝑛32 (𝐸)
=1
(21.33)
𝑛1 (𝐸) ≈ 𝑛 − 𝑛3 r41 𝐸 ,
(21.39)
𝑛2 (𝐸) ≈ 𝑛 + 𝑛3 r41 𝐸 ,
(21.40)
𝑛3 (𝐸) ≈ 𝑛 .
(21.41)
2 1 2
Unter dem Einfluss des angelegten Feldes verhält sich der isotrope Kristall folglich wie ein zweiachsiger Kristall (Abb. 21.21).
739
21 Elektrooptik
z
x3 ne
optische Achse
Abb. 21.20 Veränderung des Indexellipsoids bei Anlegen eines statischen elektrischen Feldes E entlang der optischen Achse eines einachsigen tetragonalen 42m-Kristalls wie KDP.
E
noo
noo
y
x2
x1 x
–12 no3 z
x3 n
63 E
Abb. 21.21 Veränderung des Indexellipsoids bei Anlegen eines statischen elektrischen Feldes E entlang einer kubischen Achse eines 43m-Kristalls wie GaAs.
optische Achse
740
E
n
n
y
x2
x1 1 3 n 41E 2
Kubische Kristalle haben zwar definierte Kristallachsen, aber isotrope lineare optische Eigenschaften. Zwei kubische Kristalle, die zu unterschiedlichen Punktgruppen gehören, können daher in Anwesenheit eines statischen elektrischen Feldes unterschiedliche optische Eigenschaften besitzen. Beispielsweise sind kubische Kristalle mit Diamantstruktur (Punktgruppe 𝑚3𝑚) wie Silicium oder Germanium zentrosysmmetrisch und zeigen daher keinen Pockelseffekt, während kubische Kristalle der Punktgruppe 43𝑚 wie GaAs oder InAs anisotrope optische Eigenschaften besitzen, wie aus Beispiel 21-3 deutlich wird. Für anfänglich anisotrope Materialien, in denen das angelegte elektrische Feld die Hauptachsen wie in Beispiel 21-1 nicht verändert, bleiben die Polarisationen der Normalschwingungen erhalten, aber die zugehörigen Brechungsindizes hängen von 𝐸 ab. Das Medium kann dann nach der allgemeinen Theorie aus Abschnitt 21.1.2 als Phasenmodulator, Phasenschieber oder Intensitätsmodulator verwendet werden. Dieses Prinzip wird in Abschnitt 21.2.3 ausführlicher beschrieben.
Für den Fall eines statischen elektrischen Feldes 𝐸, das entlang der 𝑧-Achse anliegt, verwenden wir die Kerrkoeffizienten s𝐼𝐾 aus Tabelle 21.3 für ein isotropes Medium; damit erhalten wir für das Indexellipsoid ( ) 1 1 ( 2 + s12 𝐸 2 ) 𝑥12 + 𝑥22 + ( 2 + s11 𝐸 2 ) 𝑥32 = 1 . (21.43) 𝑛 𝑛 Das ist die Gleichung eines Rotationsellipsoids, dessen Achse die 𝑧-Achse entlang der Richtung des angelegten elektrischen Feldes ist. Die Hauptbrechungsindizes 𝑛o (𝐸) und 𝑛e (𝐸) erhalten wir aus 1 1 = 2 + s12 𝐸 2 , 𝑛 𝑛o2 (𝐸) 1 1 = 2 + s11 𝐸 2 . 2 𝑛 𝑛e (𝐸)
Die optischen Eigenschaften eines Kerrmediums können ebenfalls mit dem für das Pockelsmedium verwendeten Verfahren bestimmt werden, nur mit den Koeffizienten η𝑖𝑗 (E) ∑ 𝑘𝑙
s𝑖𝑗𝑘𝑙 𝐸𝑘 𝐸𝑙 .
(21.42)
(21.44) (21.45)
Da die jeweils letzten Terme in den Gln. (21.44) und (21.45) klein sind, verwenden wir wieder die Näherung 1 (1 + 𝛥)−1∕2 ≈ 1 − 𝛥 und erhalten 2
1
𝑛o (𝐸) ≈ 𝑛 − 𝑛3 s12 𝐸 2 ,
(21.46)
𝑛e (𝐸) ≈ 𝑛 − 𝑛3 s11 𝐸 2 .
(21.47)
2 1 2
Kerreffekt
η𝑖𝑗 (E) = η𝑖𝑗 (0) +
Beispiel 21-4: Kerreffekt in einem isotropen Medium
Ein an ein anfänglich isotropes Medium angelegtes statisches elektrisches Feld 𝐸 bewirkt also, dass dieses sich wie ein optisch einachsiger Kristall mit der optischen Achse entlang der Richtung des elektrischen Feldes verhält. Die ordentlichen und außerordentlichen Indizes sind quadratisch abnehmende Funktionen von 𝐸.
21.2 Elektrooptik anisotroper Medien
21.2.3 Modulatoren Die Grundlagen der Phasen- und Intensitätsmodulation unter Ausnutzung des elektrooptischen Effekts wurden bereits in Abschnitt 21.1.2 vorgestellt. Anisotrope Effekte wurden dort nur allgemein eingeführt. Mit der in diesem Abschnitt präsentierten anisotropen Theorie können die allgemeinen Parameter r und s, die in Abschnitt 21.1 verwendet wurden, jetzt für alle Arten von Kristallen und beliebige Richtungen des angelegten elektrischen Feldes und der Lichtausbreitung bestimmt werden. Wir besprechen nur Pockelsmodulatoren, aber derselbe Ansatz kann auch auf Kerrmodulatoren angewendet werden. Der Einfachheit halber nehmen wir an, dass das elektrische Feld so orientiert ist, dass die Hauptachsen des Kristalls durch die Modulation nicht verändert werden. Wir werden auch annehmen, dass die Richtung der Welle bezüglich dieser Achsen so ist, dass die Polarisationsebenen der Normalschwingungen durch das elektrische Feld ebenfalls nicht verändert werden. Phasenmodulatoren
Eine Normalmode ist durch einen Brechungsindex 1 𝑛(𝐸) ≈ 𝑛 − r𝑛3 𝐸 charakterisiert, wobei 𝑛 und r den Bre2 chungsindex bzw. Pockelskoeffizienten bezeichnen und 𝐸 = 𝑉∕d das elektrische Feld ist, das sich durch Anlegen einer Spannung 𝑉 über eine Entfernung d ergibt. Eine Welle, die sich über eine Distanz 𝐿 ausbreitet, erfährt eine Phasenverschiebung 𝜑 = 𝜑0 − π
𝑉 𝑉π
(21.48)
mit 𝜑0 = 2π𝑛𝐿∕𝜆0 und der Halbwellenspannung 𝑉π =
d 𝜆0
𝐿 r𝑛3
.
ausbreitet, sind die Parameter für den Phasenmodulator 𝑛 = 𝑛o , r = r13 und d = 𝐿. Für LiNbO3 ist r13 = 9.6 pm∕V und 𝑛0 = 2.3 bei 𝜆0 = 633 nm. Gleichung (21.49) ergibt dann 𝑉π = 5.41 kV als die Spannung, die erforderlich ist, um die Phase um π zu ändern. • Transversaler Modulator: Wenn sich die Welle in 𝑥-Richtung ausbreitet und in 𝑧-Richtung polarisiert ist, sind die Parameter 𝑛 = 𝑛e und r = r33 . Der Breite d ist im Allgemeinen nicht gleich der Länge 𝐿. Für LiNbO3 bei 𝜆0 = 633 nm ist 𝑟33 = 30.9 pm∕V und 𝑛e = 2.2, was eine Halbwellenspannung 𝑉π = 1.9(d ∕𝐿) kV ergibt. Für d ∕𝐿 = 0.1 ergibt sich 𝑉π ≈ 190 V, also deutlich weniger als für einen longitudinalen Modulator. Intensitätsmodulatoren
Der Unterschied in der Abhängigkeit der Brechungsindizes der beiden Normalschwingungen einer Pockelszelle von dem angelegten Feld liefert eine von der Spannung abhängige Verzögerung 𝛤 = 𝛤0 − π
𝑉 𝑉π
(21.50)
mit 2π(𝑛1 − 𝑛2 )𝐿 , 𝜆0 (d ∕𝐿)𝜆0 𝑉π = . r1 𝑛13 − r2 𝑛23 𝛤0 =
(21.51) (21.52)
Wenn die Zelle zwischen gekreuzte Polarisatoren gestellt wird, wirkt das System als Intensitätsmodulator (siehe Abschnitt 21.1.2). Die geeigneten Indizes 𝑛1 und 𝑛2 und die Koeffizienten r1 und r2 sind einfach zu bestimmen, wie das folgende Beispiel zeigt.
(21.49)
Die allgemein mit 𝑛 und r bezeichneten Koeffizienten können wie im folgenden Beispiel demonstriert leicht bestimmt werden. Beispiel 21-5: Trigonale 3m-Kristalle (LiNbO3 und LiTaO3 )
Wenn ein elektrisches Feld entlang der optischen Achse dieses Typs von einachsigen Kristallen angelegt wird, bleibt der Kristall einachsig mit denselben Hauptachsen (siehe Beispiel 21-1). Die Hauptbrechungsindizes sind durch die Gln. (21.30) und (21.31) gegeben. Der Kristall kann in zwei möglichen Anordnungen als Phasenmodulator eingesetzt werden: • Longitudinaler Modulator: Wenn sich eine linear polarisierte optische Welle entlang der Richtung der optischen Achse (parallel zum elektrischen Feld)
Beispiel 21-6: Tetragonale 42m-Kristalle (KDP und ADP)
Wenn ein elektrisches Feld entlang der optischen Achse dieser einachsigen Kristalle angelegt wird, verhalten sie sich wie zweiachsige Kristalle (siehe Beispiel 212). Die neuen Hauptachsen sind die ursprünglichen Achsen, um 45° um die optische Achse rotiert. Nehmen Sie eine Anordnung als longitudinaler Modulator an (d ∕𝐿 = 1) an, in dem sich die Welle entlang der optischen Achse ausbreitet. Die Brechungsindizes der beiden Normalmoden sind durch die Gln. (21.35) und (21.36) gegeben. Die in Gl. (21.52) zu verwendenden Koeffizienten sind daher 𝑛1 = 𝑛2 = 𝑛o , r1 = r63 , r2 = −r63 und d = 𝐿; damit ergibt sich 𝛤0 = 0 und 𝑉π =
𝜆0 2r63 𝑛o3
.
Für KDP bei 𝜆0 = 633 nm ist 𝑉π = 8.4 kV.
(21.53)
741
742
21 Elektrooptik
z
Übung 21-2: Intensitätsmodulation mithilfe des Kerreffekts
Verwenden Sie die Gln. (21.46) und (21.47), um Ausdrücke für die Phasenverschiebung 𝜑 und die Phasenverzögerung 𝛤 in einem longitudinalen Kerrmodulator aus einem isotropen Material als Funktionen der angelegten Spannung 𝑉 zu bestimmen. Leiten Sie Ausdrücke für die Halbwellenspannung 𝑉π in beiden Fällen her.
21.3 Elektrooptik von Flüssigkristallen Wie in Abschnitt 6.5 erwähnt, neigen die gestreckten Moleküle von nematischen Flüssigkristallen dazu, geordnete Orientierungen einzunehmen, die sich verändern, wenn das Material mechanischen oder elektrischen Kräften unterworfen wird. Wegen ihrer anisotropen Natur können Flüssigkristalle so angeordnet werden, dass sie als Phasenschieber oder Polarisationsrotatoren dienen können. In Anwesenheit eines elektrischen Feldes wird ihre molekulare Orientierung modifiziert, sodass sich auch ihre Wirkung auf polarisiertes Licht verändert. Flüssigkristalle können daher als elektrisch gesteuerte optische Phasenschieber, Modulatoren und Schalter eingesetzt werden. Sie sind besonders für Anzeigeelemente nützlich.
21.3.1
Phasenschieber und Modulatoren
Elektrische Eigenschaften von nematischen Flüssigkristallen
Flüssigkristalle, die in elektrooptischen Bauelementen eingesetzt werden, haben meist eine so geringe Leitfähigkeit, dass sie als ideale dielektrische Materialien angesehen werden können. Wegen der gestreckten Form der Moleküle und ihrer geordneten Orientierung haben Flüssigkristalle anisotrope dielektrische Eigenschaften mit einachsiger Symmetrie. Ihre elektrische Permittivität ist 𝜀∥ für elektrische Felder parallel zur Molekülachse und 𝜀⟂ für dazu senkrechte Felder. Meist werden für elektrooptische Anwendungen Flüssigkristalle mit 𝜀∥ > 𝜀⟂ (positiv einachsige) ausgewählt. Wenn ein statisches (oder niederfrequentes) elektrisches Feld angelegt wird, werden elektrische Dipole induziert und die resultierenden elektrischen Kräfte üben Drehmomente auf die Moleküle aus. Die Moleküle rotie1 ren so, dass die freie elektrostatische Energie − E ⋅ D = 1
2
− [𝜀⟂ 𝐸12 + 𝜀⟂ 𝐸22 + 𝜀∥ 𝐸32 ] minimiert wird (dabei sind 𝐸1 , 2 𝐸2 und 𝐸3 die Komponenten von E in Richtungen der Hauptachsen). Da 𝜀∥ > 𝜀⟂ ist, wird die minimale Energie für eine gegebene Richtung des elektrischen Feldes
E
Abb. 21.22 Die Moleküle eines positiv einachsigen Flüssigkristalls rotieren und richten in der Richtung des angelegten elektrischen Feldes aus.
erreicht, wenn die Moleküle mit dem Feld ausgerichtet sind, sodass 𝐸1 = 𝐸2 = 0 und E = (0, 0, 𝐸) ist; die freie 1 Energie ist dann − 𝜀∥ 𝐸 2 . Wenn die Ausrichtung voll2 ständig ist, zeigt die Molekülachse in Richtung des elektrischen Feldes (Abb. 21.22). Offensichtlich bewirkt eine Umkehrung des elektrischen Feldes dieselbe Rotation der Moleküle. Auch ein von einer Wechselspannung hervorgerufenes Wechselfeld hat denselben Effekt. Phasenschieber und Modulatoren aus nematischen Flüssigkristallen
Eine Zelle aus einem nematischen Flüssigkristall enthält eine dünne Schicht des nematischen Flüssigkristalls zwischen zwei parallelen Glasplatten, dessen Moleküle durch Anschleifen der Platten parallel zueinander ausgerichtet werden. Das Material wirkt dann wie ein einachsiger Kristall mit einer zur Molekülachse parallelen optischen Achse. Für Wellen, die sich in 𝑧-Richtung (senkrecht zu den Glasplatten) ausbreiten, sind die Normalmoden in 𝑥- und 𝑦-Richtung linear polarisiert (parallel bzw. senkrecht zur Orientierung der Moleküle), wie Abb. 21.23(a) illustriert. Die Brechungsindizes sind der außerordentliche und ordentliche Index 𝑛e und 𝑛o . Eine Zelle der Dicke d ergibt eine Wellenverzögerung 𝛤 = 2π(𝑛e − 𝑛o )d ∕𝜆0 . Wenn nun ein elektrisches Feld in 𝑧-Richtung angelegt wird (durch Anlegen einer Spannung 𝑉 über transparente leitende Elektroden auf der Innenseite der Glasplatten), versuchen die resultierenden elektrischen Kräfte die Moleküle parallel zum Feld auszurichten; dieser Bewegung wirken aber die elastischen Kräfte an den Oberflächen der Glasplatten entgegen. Wenn das angelegte elektrische Feld stark genug ist, drehen sich die meisten Molekül in die 𝑧-Achse, außer denjenigen in unmittelbarer Nähe der Glasoberflächen. Der Gleichgewichts-Neigungswinkel 𝜃 der meisten Moleküle ist eine monoton zunehmende Funktion von 𝑉, die durch 𝜃=
⎧0 π
−1
𝑉 ≤ 𝑉k (21.54) 𝑉 − 𝑉k exp (− ) , 𝑉 > 𝑉k , 𝑉0
⎨ − 2 tan 2 ⎩ beschrieben werden kann 1), wobei 𝑉 die angelegte Effektivspannung ist, 𝑉k die kritische Spannung, bei der die 1) Siehe z. B. P.-G. de Gennes, The Physics of Liquid Crystals, Oxford University Press, 2. Aufl. 1993.
21.3 Elektrooptik von Flüssigkristallen
x
x
Abb. 21.23 Orientierung der Moleküle in einer Flüssigkristallzelle (a) ohne und (b) mit einem statischen elektrischen Feld. Die optische Achse liegt entlang der Richtung der Moleküle.
z
z y
y
(b)
(a) 90°
Γ Γmax
θ
0.5
Δn = 0.1 0.2 0.3
0
0
1
2
3
(a)
(V – Vk) V0
0
0
1
2
3
(V – Vk) V0
(b)
Abb. 21.24 (a) Abhängigkeit des Neigungswinkels 𝜃 der Moleküle bezüglich der Richtung des Feldes (z-Achse) von der normierten Effektivspannung. (b) Abhängigkeit der normierten Verzögerung 𝛤∕𝛤max = [n(𝜃) − no ]∕(ne − no ) von der
normierten Effektivspannung für no = 1.5 und die angegebenen Werte von Δn = ne − no . Diese Auftragung wird aus den Gln. (21.54) und (21.55) erhalten.
Rotation der Moleküle einsetzt, und 𝑉0 eine Konstante. Für 𝑉 − 𝑉k = 𝑉0 ist 𝜃 ≈ 50◦ ; wenn 𝑉 − 𝑉k über 𝑉0 hinaus zunimmt, nähert sich 𝜃 einem Wert von 90◦ , wie in Abb. 21.24(a) dargestellt. Wenn das elektrische Feld entfernt wird, kehren die Moleküle in ihre ursprüngliche Orientierung parallel zu den Platten zurück. Der Flüssigkristall kann gewissermaßen als Flüssigkeit mit Gedächtnis angesehen werden. Für einen Neigungswinkel 𝜃 sind die Normalschwingungen einer optischen Welle, die sich in 𝑧-Richtung ausbreitet, in 𝑥- und 𝑦-Richtung polarisiert und für die Brechungsindizes 𝑛(𝜃) und 𝑛o gilt
te Spannung gesteuert werden kann, kann die Zelle als elektrisch gesteuerter Phasenmodulator dienen. Als Phasenschieber. Auch die Phasenverzögerung 𝛤 = 2π[𝑛(𝜃) − 𝑛o ]d ∕𝜆0 hängt von dem Neigungswinkel 𝜃 ab. Sie erreicht ihren Maximalwert 𝛤max = 2π(𝑛e − 𝑛o )d ∕𝜆0 , wenn die Moleküle nicht verdreht sind (𝜃 = 0), und nimmt monoton auf null ab, wenn der Neigungswinkel 90◦ erreicht, wie Abb. 21.24(b) zeigt. Die Zelle wirkt somit als elektrisch gesteuerter Phasenschieber, dessen Hauptachsen entlang der 𝑥- bzw. 𝑦-Richtung liegen. Als Intensitätsmodulator. Wenn eine Flüssigkristallzelle in einem Winkel von ±45◦ zur 𝑥-Achse in der 𝑥𝑦-Ebene zwischen zwei gekreuzte Polarisatoren gebracht wird, ist ihre Transmission durch 𝒯 = 2 sin (𝛤∕2) gegeben, ist also eine Funktion der spannungsgesteuerten Verzögerung 𝛤 und erreicht ihr Maximum von eins, wenn die Verzögerung gleich π ist. Da die Verzögerung von der angelegten Spannung abhängt, gilt dasselbe auch für die Transmission, sodass die Zelle als spannungsgesteuerter Intensitätsmodulator wirkt. Auch in Reflexion kann Intensitätsmodulation erreicht werden, indem man die Zelle zwischen einen Spiegel und einen Polarisator unter 45◦ zur 𝑥-Achse bringt, wie Abb. 21.25(a) zeigt. In diesem Fall wird der Reflexionsgrad durch die angelegte Spannung gesteuert [Abb. 21.25(b)].
2
1 cos2 𝜃 sin 𝜃 + . = 2 𝑛 (𝜃) 𝑛e2 𝑛o2
(21.55)
Für einen Neigungswinkel 𝜃 ist die Richtung zwischen der optischen Achse und der Ausbreitungsrichtung gleich 90◦ − 𝜃, weshalb sich Gl. (21.55) und Gl. (6.58) unterscheiden. Flüssigkristallzellen kommen in zahlreichen Anwendungen zum Einsatz: Für eine optische Welle, die sich in 𝑧-Richtung ausbreitet und in 𝑥-Richtung linear polarisiert ist (parallel zur Orientierung der Moleküle ohne Feld) ist die Phasenverschiebung 𝜑 = 2π 𝑛(𝜃)d ∕𝜆0 , wobei 𝑛(𝜃) durch Gl. (21.55) gegeben ist. Da 𝜃 gemäß Gl. (21.54) durch die an die Zelle angeleg-
Als Phasenmodulatoren.
743
744
21 Elektrooptik
x Polarisator einfallendes Licht
V Spiegel
1 EIN
EIN
AUS
Flüssigkristall
reflektiertes Licht
AUS
y (a)
0
0
Vk
V0
V
(b)
Abb. 21.25 (a) Eine Zelle aus nematischen Flüssigkristallen zwischen einem Polarisator und einem Spiegel wirkt als Reflektor mit einem spannungsgesteuerten Reflexionsgrad. Die Phasenverzögerung variiert zwischen 𝛤 = π∕2 ohne angelegte Spannung („Aus“-Zustand) und 𝛤 = 0, wenn die angelegte Spannung gleich der Sättigungsspannung V0 der
Zelle ist („Ein“-Zustand). Nach Reflexion am Spiegel und einem Umlauf durch den Kristall rotiert die Polarisationsebene im „Aus“-Zustand um 90◦ , sodass das Licht geblockt wird. Im „Ein“-Zustand findet keine Rotation statt, und das reflektierte Licht wird nicht geblockt. (b) Intensitätsreflexionsgrad ℛ als Funktion der angelegten Spannung V .
Die Eigenschaften von Flüssigkristallzellen
geschliffen sind, dass die Orientierung der Moleküle schraubenförmig um eine Achse senkrecht zu den Platten (die Verdrillungsachse) rotiert. Wenn der Verdrillungswinkel z. B. 90◦ beträgt, zeigen die Moleküle an einer Platte in die 𝑥-Richtung und an der anderen Platte in 𝑦-Richtung [Abb. 21.26(a)]. Transversale Schichten des Materials verhalten sich wie einachsige Kristalle mit optischen Achsen, die schraubenförmig um die Verdrillungsachse rotieren. In Abschnitt 6.5 hatten wir gezeigt, dass die Polarisationsebene von linear polarisiertem Licht, das sich in Richtung der Verdrillungsachse ausbreitet, mit den Molekülen rotiert, sodass die Zelle als Polarisationsrotator wirkt. Wenn ein elektrisches Feld entlang der Verdrillungsachse (der 𝑧-Richtung) angelegt wird, richten sich die Moleküle nach dem Feld aus [Abb. 21.26(b)]. Wenn die Rotation 90◦ beträgt, geht die Verdrillung der Moleküle verloren (mit Ausnahme der Moleküle direkt an den Glasoberflächen), sodass das Drehvermögen der Polarisationsebene abgeschaltet wird. Wenn das elektrische Feld entfernt wird, dominieren die Orientierungen der Schichten in der Nähe der Glasoberflächen, sodass die Moleküle wieder in ihren verdrillten Zustand zurückkehren und das Drehvermögen wieder zurückkehrt. Da das Drehvermögen ein- und ausgeschaltet werden kann, indem das elektrische Feld aus- bzw. eingeschaltet wird, kann durch Einbau einer Zelle mit 90◦ -Verdrillung zwischen zwei gekreuzte Polarisatoren ein Verschluss konstruiert werden. Ein solches System lässt das Licht durch, wenn kein elektrisches Feld anliegt, und blockiert es, sobald das elektrische Feld eingeschaltet wird, wie Abb. 21.27 zeigt.
Flüssigkristallzellen sind normalerweise zwischen antireflexbeschichteten, optisch ebenen Glasfenstern eingekapselt. Die Flüssigkristallschicht ist typischerweise d ≈ 10 μm dick und Δ𝑛 = 𝑛e − 𝑛o beträgt etwa 0.1–0.3. Die Verzögerung 𝛤 = 2π𝜌∕𝜆0 wird normalerweise durch das Verzögerungsvermögen 𝜌 = (𝑛e − 𝑛o )d ausgedrückt, das üblicherweise einige hundert nm beträgt (ein Verzögerungsvermögen von 300 nm entspricht bei 𝜆0 = 600 nm einer Verzögerung von π). Die Antwortzeit einer Flüssigkristallschicht hängt von ihrer Dicke, ihrer Viskosität, ihrer Temperatur und der Wellenform der angelegten Spannung ab. Flüssigkristalle sind langsam; ihre Anstiegszeit liegt in der Größenordnung von einigen zehn Millisekunden, wenn die Betriebsspannung in der Nähe der kritischen Spannung 𝑉k liegt, nimmt aber bei höheren Spannungen auf einige Millisekunden ab. Die Abklingzeit hängt nicht sehr von der Betriebsspannung ab, kann aber durch Verwendung von dünneren Zellen reduziert werden. Die angelegte Spannung hat gewöhnlich eine Rechteck-Wellenform mit einer Frequenz im Bereich zwischen einigen zehn Hertz und wenigen Kilohertz. Betrieb bei tieferen Frequenzen bringt oft elektromechanische Effekte mit sich, die die Ausrichtung der Moleküle stören und die Lebensdauer des Bauelements reduzieren. Frequenzen über 100 Hz führen zu einer größeren Leistungsaufnahme, weil die Leitfähigkeit größer wird. Modulatoren aus verdrillten nematischen Flüssigkristallen
Ein verdrillte nematische Flüssigkristallzelle besteht aus einer dünnen Schicht eines nematischen Flüssigkristalls zwischen zwei parallelen Glasplatten, die so an-
21.3 Elektrooptik von Flüssigkristallen
x
AUS
~
x
EIN
~
z
z
y
y
AUS
Polarisator
z
(a)
Polarisator
~
EIN Polarisator
hell
~
(b) ausgerichteter Zustand
dunkel
(a) verdrillter Ruhezustand
Polarisator
Abb. 21.26 (a) Eine Zelle aus verdrillten nematischen Flüssigkristallen in ihrem verdrillten Ruhezustand. (b) In Anwesenheit eines ausreichend starken elektrischen Feldes richten sich die Moleküle in Feldrichtung aus und die Verdrillung geht verloren.
(b)
Abb. 21.27 Ein Modulator aus verdrillten nematischen Flüssigkristallen. (a) Ohne elektrisches Feld wirkt die Flüssigkristallzelle als Polarisationsrotator; das Licht wird durchgelassen. (b) Mit einem elektrischen Feld verschwindet das
Wenn eine verdrillte Flüssigkristallzelle zwischen gekreuzte Polarisatoren gestellt wird, kann sie auch als Analogmodulator betrieben werden. Bei mittleren Verdrillungswinkeln tritt eine Kombination von Polarisationsrotation und Wellenverzögerung auf. Die Analyse des Durchgangs von polarisiertem Licht durch geneigte und verdrillte Moleküle ist ziemlich komplex, aber die Nettowirkung ist eine partielle Transmission der Intensität. Es gibt einen annähernd linearen Übergangsbereich zwischen der vollständigen Transmission im vollständig verdrillten (nicht gedrehten) Zustand und gar keiner Transmission im völlig gedrehten (nicht verdrillten) Zustand; der dynamische Bereich ist jedoch recht beschränkt. Auch ein Betrieb in Reflexion ist möglich, wie Abb. 21.28 zeigt. In diesem Fall beträgt der Verdrillungswinkel 45◦ ; auf einer Seite der Zelle liegt ein Spiegel, auf der anderen Seite ein Polarisator. Ohne elektrisches Feld wird die Polarisationsebene bei einem Umlauf durch die Zelle um insgesamt 90◦ gedreht; das reflektierte Licht wird daher durch den Polarisator geblockt. Mit einem elektrischen Feld wird das Drehvermögen aufgehoben und das reflektierte Licht wird durch den Polarisator durchgelassen. Auch weitere Betriebsarten mit unterschiedlichen Verdrillungswinkeln sowohl in Reflexion als auch in Transmission sind möglich.
Drehvermögen der Zelle, und das Licht wird geblockt. Bei dazwischenliegenden Werten der angelegten Spannung resultiert eine Teildurchlässigkeit, sodass die Zelle als analoger Intensitätsmodulator wirkt.
AUS
Polarisator
EIN
Spiegel EIN
AUS
Flüssigkristall
Abb. 21.28 Eine Zelle aus verdrillten nematischen Flüssigkristallen mit einem Verdrillungswinkel von 45◦ ergibt ohne elektrisches Feld eine Drehung der Polarisationsebene von 90◦ bei einem Umlauf (geblockter Zustand) und keine Rotation, wenn das Feld angelegt wird (offener Zustand). Das Bauelement wirkt als reflektierender Schalter. Ähnlich wie die in Abb. 21.25 gezeigte Zelle aus nematischen Flüssigkristallen kann auch dieses Bauelement für mittlere Werte des Feldes als analoger Intensitätsmodulator verwendet werden.
Ferroelektrische Flüssigkristalle
Smektische Flüssigkristalle sind in Schichten angeordnet, wie Abb. 6.34(b) zeigt. In der smektischen C-Phase sind die Moleküle um einen Winkel 𝜃 gegen die Senkrechten auf den Schichten (der 𝑥-Achse) verkippt, wie in Abb. 21.29 dargestellt. Dieses Material ist ferroelektrisch. Wenn es als dünne Schicht zwischen zwei Glasplatten eingeschlossen wird, erlauben die Wechselwir-
745
746
21 Elektrooptik
Abb. 21.29 Die zwei erlaubten Zustände einer ferroelektrischen Flüssigkristallzelle.
x
x
90°
z
z
(a)
y
(b)
kungen mit der Oberfläche nur zwei stabile Zustände der molekularen Orientierung bei Winkeln von ±𝜃 wie in Abb. 21.29. Wenn ein elektrisches Feld +𝐸 in 𝑧-Richtung angelegt wird, wirkt ein Drehmoment auf die Moleküle, das sie in den Zustand +𝜃 schaltet [Abb. 21.29(a)]. Durch ein Feld in entgegengesetzter Richtung können die Moleküle in den Zustand −𝜃 geschaltet werden [Abb. 21.29(b)]. Die Zelle wirkt daher wie ein einachsiger Kristall, dessen optische Achse zwischen zwei Orientierungen umgeschaltet werden kann. In der Anordnung von Abb. 21.29 ist das einfallende Licht in einem Winkel 𝜃 zur 𝑥-Achse linear polarisiert. Im Zustand +𝜃 (links) liegt die Polarisation parallel zur optischen Achse, und die Welle breitet sich mit dem außerordentlichen Brechungsindex 𝑛e ohne Verzögerung aus. Im Zustand −𝜃 (rechts) schließt die Polarisationsebene einen Winkel 2𝜃 mit der optischen Achse ein. Für 2𝜃 = 45◦ erfährt die Welle eine Verzögerung 𝛤 = 2π(𝑛e − 𝑛o )d ∕𝜆0 , wobei d die Dicke der Zelle ist und 𝑛o der ordentliche Brechungsindex. Wenn d so gewählt wird, dass 𝛤 = π ist, rotiert die Polarisationsebene um 90◦ . Eine Umkehrung des angelegten Feldes bewirkt daher eine Rotation der Polarisationsebene um 90◦ . Wenn man die Zelle zwischen zwei gekreuzte Polarisatoren stellt, entsteht ein Schalter. Die Antwortzeit von ferroelektrischen Flüssigkristallschaltern ist bei Zimmertemperatur normalerweise < 20 μs, also viel schneller als die von nematischen Flüssigkristallen. Die Umschaltspannung liegt in der Größenordnung ±10 V.
21.3.2
Räumliche Lichtmodulatoren und Displays
Räumliche Lichtmodulatoren (SLM, von engl. spatial light modulators), verändern die räumliche Verteilung der Wellenfront (Phase), Intensität oder Polarisation einer optischen Welle mithilfe eines Arrays von optischen Modulatoren in einer definierten räumlichen Anordnung. Die Modulation der Wellenfront wird zur Strahllenkung und -fokussierung sowie in der adaptiven Optik verwendet. Die Hauptanwendung der Intensitätsmodulation ist die Anzeige von räumlichen Mustern wie Zahlen, Buchstaben, Grafiken und Bildern. Flüssigkristallzellen werden in SLM häufig eingesetzt; insbeson-
y
dere dominieren Flüssigkristallanzeigen (LCD) in Anwendungen wie Mobiltelefonen und Digitaluhren sowie Bildschirmen für Laptops, Desktop-Computer oder TVGeräte. LCD können entweder wie in Abb. 21.27 in Transmission oder wie in Abb. 21.28 in Reflexion betrieben werden. Transmissions-LCD arbeiten mit einer Hintergrundbeleuchtung an der Rückseite des Bauelements. Das emittierte Licht tritt durch die Flüssigkristallzelle hindurch und wird von der Vorderseite des Bauelements aus betrachtet. Die Hintergrundbeleuchtung besteht im Allgemeinen aus einem Panel von weißen LED oder WOLED (Abschnitt 18.1.6) oder einer Kaltkathoden-Leuchtstofflampe; das emittierte Licht wird mithilfe eines Diffusors räumlich homogenisiert. ReflexionsLCD reflektieren normalerweise das ohnehin vorhandene Umgebungslicht. Sie haben den doppelten Vorteil eines geringen Stromverbrauchs und einer hervorragenden Lesbarkeit in hellen Umgebungen (z. B. bei Sonne im Freien), können aber dafür nicht im Dunkeln abgelesen werden. Auch transreflektive Anzeigeelemente, die in beiden Modi betrieben werden können, sind verfügbar. LCD beruhen auf nematischen, verdrillt-nematischen oder ferroelektrischen Flüssigkristallen (Abschnitt 21.3.1). In Computer- und TV-Bildschirmen wird meist eine um 90° verdrillt-nematische Anordnung in Transmission eingesetzt (Abb. 21.27), hauptsächlich wegen ihres hohen Kontrastes. Der Kontrast von LCD nimmt in der Regel mit zunehmendem Blickwinkel erheblich ab, was teilweise darauf zurückzuführen ist, dass schräge Strahlen bei unterschiedlichen Einfalls-/ Reflexionswinkeln unterschiedliche Verzögerungen erfahren. Für die Betrachtung unter variierenden Winkeln wurden daher spezielle Kompensationsfilter entwickelt. Segment-LCD
Eine Segment-LCD besteht aus transparenten Elektroden, die in einem bestimmten Muster auf den Glasplatten einer reflektierenden (nematischen, verdrillt-nematischen oder ferroelektrischen) Flüssigkristallzelle aufgebracht werden. Wenn Spannungen an ausgewählte Elektroden angelegt werden, werden Muster der Refle-
21.3 Elektrooptik von Flüssigkristallen
gemeinsame Elektrode
Segmentelektrode
Abb. 21.30 Elektroden eines Segment-LCD.
xion und Nichtreflexion erzeugt. Abbildung 21.30 zeigt ein solches Muster für eine 7-Segment-Balkenanzeige für die Ziffern von 0 bis 9. Größere Zahlen von Elektroden können sequentiell adressiert werden; hierzu sind z. B. CCD geeignet (Abschnitt 19.5). Matrix-LCD
Ein Matrix-LCD [Abb. 21.31(a)] verwendet transparente Elektroden, die in Zeilen und Spalten angeordnet sind, wobei die Pixel durch die Positionen ihrer Schnittpunkte definiert werden. Jedes Pixel funktioniert ähnlich wie der in Abb. 21.27 gezeigte Flüssigkristall-Modulator. Die Bildinformation wird über an die transparenten Elektroden jedes Pixels angelegten Spannungen übertragen, die wiederum die Neigungswinkel ihrer jeweiligen Schichten von Flüssigkristallen und damit die Intensität des von ihnen durchgelassenen Lichts bestimmen. Die Auflösung eines solchen Displays ist durch seine Pixeldichte gegeben. Daten
/ Spalt en D2
Abtastung / Zeilen
D3
Bei einem LCD mit einer passiven Matrix aus 𝑁 Zeilen und 𝑀 Spalten ist (zumindest im Prinzip) eine äußere Spannungszufuhr für jedes der 𝑁𝑀 Pixel erforderlich. Da dies für große Arrays nicht umsetzbar ist, werden in der Praxis nur die Zeilen und Spalten angesteuert, sodass 𝑁 + 𝑀 Zuleitungen ausreichen. Ein Übersprechen zwischen den Pixeln wird vermieden, indem man das Bild sequentiell über einen Zeitraum 𝑇 aufbaut, der kürzer ist als die Reaktionszeit des visuellen Systems des Betrachters. Diese Periode wird in 𝑁 Intervalle unterteilt. Die 𝑁 Zeilen werden nacheinander mit einer angelegten Spannung abgetastet, während die Bilddaten durch Anlegen einer positiven oder negativen Spannung an jede der 𝑀 Spalten je nach dem gewünschten Bild eingegeben werden. Ein Schema des Systems und seiner Funktionsweise ist in Abb. 21.31 dargestellt. Ein einfaches Bild wie das in Abb. 21.31(b) gezeigte mit dunklen und hellen Pixeln kann wie folgt mit einem Matrix-LCD dargestellt werden: Während des 𝑛-ten Zeitintervalls wird eine Spannung (1 − 𝑟)𝑉 an die 𝑛-te Zeile angelegt (dabei ist 𝑉 eine konstante Spannung und 𝑟 < 1), während alle anderen Zeilen auf 0 V gehalten werden. Gleichzeitig wird eine Spannung −𝑟𝑉 an die 𝑚-te Spalte angelegt, wenn das Pixel (𝑚, 𝑛) hell sein soll bzw. +𝑟𝑉, wenn es dunkel sein soll. Die während des 𝑛-ten Zeitintervalls an dem Pixel (𝑚, 𝑛) anliegende Spannung ist daher (1 − 𝑟)𝑉 − (−𝑟𝑉) = 𝑉, wenn das Pixel hell sein soll, und (1 − 𝑟)𝑉 − (𝑟𝑉) = (1 − 2𝑟)𝑉, wenn es dunkel bleiben soll. Während der anderen 𝑁 − 1 Zeitintervalle ist die an dem Pixel (𝑚, 𝑛) anliegende Spannung entweder 0 − (−𝑟𝑉) = 𝑟𝑉 oder 0 − (𝑟𝑉) = −𝑟𝑉. Das LCD reagiert auf die über 𝑁 Intervalle gemittel2 te Effektivspannung 𝑉eff . Für das Pixel (𝑚, 𝑛) ist 𝑉eff = (1∕𝑁)[𝑉 2 + (𝑁 − 1)𝑟 2 𝑉 2 ], wenn das Pixel hell ist, und
D3 D1
rV –rV
D2 S1
D1
S2
S1 (1–r)V S2
S3
S3 (a)
(b)
Zeit (c)
Abb. 21.31 (a) Ein Matrix-LCD wird angesteuert, indem sequentielle Spannungspulse zur Abtastung (S) an die Zeilen und Datenpulse (D) an die Spalten angelegt werden. (b) Das durch Anwendung der in (c) gezeigten Abfolge von Spannungspulsen auf die Zeilen und Spalten entsteht.
747
21 Elektrooptik 2 𝑉eff = (1∕𝑁)[(1 − 2𝑟)2𝑉 2 + (𝑁 − 1)𝑟 2 𝑉 2 ], wenn es dunkel √ ist. Für 𝑟 = 1∕( 𝑁 + 1) ist das Verhältnis dieser beiden Spannungen maximal;√dann ist 𝑉√eff für den hellen Zustand um den Faktor [( 𝑁 + 1)∕( 𝑁 − 1)]1∕2 größer als für den dunklen Zustand. Obwohl dieses Verhältnis nur wenig größer als eins ist, schalten aufgrund der nichtlinearen Beziehung zwischen der Durchlässigkeit und der angelegten Spannung schon kleine Änderungen der angelegten Spannung das Pixel von dunkel auf hell. Trotzdem ist diese Art der passiven Adressierung für große 𝑁 offensichtlich nicht ausreichend.
LCD mit aktiver Matrix (AMLCD)
LCD mit aktiver Matrix (AMLCD) eliminieren das Übersprechen von Pixel zu Pixel mithilfe von Dünnschichttransistor- (TFT-) Schaltungen. Wie Abb. 21.32 zeigt, ist hier jedes Pixel mit einem eigenen TFT verbunden, der durch ein Signal aus seiner Zeilenleitung geschaltet wird, während die Daten über die Spaltenleitung ankommen. Wenn das Schaltsignal auf der Zeilenleitung vorhanden ist, legt der TFT für eine Dauer 𝑇∕𝑁 eine Spannung 𝑉 zwischen der Indiumzinnoxid- (ITO-) Pixelelektrode und einer gemeinsamen ITO-Elektrode an, wobei 𝑇 die Frameperiode und 𝑁 die Zahl der Spalten ist. Da die Daten zeilenweise eingegeben werden, wird ein Übersprechen verhindert. Obwohl an jedem Pixel nur während der kurzen Frameperiode eine Spannung anliegt, nimmt der Betrachter das Bild in seiner Gesamtheit wahr, da die Integrationszeit des menschlichen visuellen Systems im Vergleich zur Framedauer lang ist (in der Größenordnung von Millisekunden).
Abbildung 21.32 zeigt den Aufbau und die Funktionsweise einer AMLCD für den Betrieb in Transmission. Die Flüssigkristalle (LC) sind zwischen zwei dünnen Glasplatten mit einer gemeinsamen ITO-Elektrode auf der einen Seite und dem Array der ITO-Pixelelektroden auf der anderen Seite eingeschlossen. Der Stapel liegt zwischen einem Paar gekreuzter Polarisationsfolien, die die äußeren Oberflächen des Displays bilden. Eine Farbanzeige wird realisiert, indem jedes Pixel in drei unabhängig ansteuerbare benachbarte Segmente (Subpixel) aufgeteilt wird, die mit roten, grünen bzw. blauen Farbfiltern vor dem Pixel versehen sind [siehe Abb. 21.32(b)]. Wenn das Array von weißem Hintergrundlicht beleuchtet wird, ist die von jedem Pixel angezeigte Farbe durch die Überlagerung des von seinen drei Subpixeln übertragenen Lichts gegeben. Metameres weißes Licht wird wie in Abschnitt 18.1.6 beschrieben durch additive Farbmischung erzeugt. Optische räumliche Phasenmodulatoren, die häufig für Anwendungen wie die Modifikation von Wellenfronten oder die Umformung optischer Strahlen eingesetzt werden, nutzen häufig Flüssigkristall-auf-SiliciumTechniken und werden meist in Reflexion betrieben. Eine konkurrierende Displaytechnologie verwendet TFT, um Arrays von organischen Leuchtdioden anzusteuern. Die farbigen Subpixel in einem Display aus organischen LED mit aktiver Matrix (AMOLED) werden entweder von OLED erzeugt, die direkt rotes, grünes und blaues Licht emittieren (Abschnitt 18.1.5), oder von WOLED, die weißes Licht emittieren, das anschließend
G1 D3 Schaltsignale
748
TFT Polar is
ITO Pixelelektr od
G2
ator
e
G3 D1 D2 nsign ale
Date
(a)
D3
Subst rat ITO gem Elekteinsame rode Flüssig krista ll TFTSubst rat Subst rat Polar isator
Abb. 21.32 Eine Flüssigkristallanzeige mit aktiver Matrix (AMLCD). (a) Aufbau von hinten gesehen. Die Pixel werden über TFT angesteuert, die ihre Schaltsignale (G) zeilenweise erhalten, während die Daten (D) spaltenweise eingegeben werden. Die weiße Hintergrundbeleuchtung ist nicht dar-
D2 (b) D1
G1 G2 G3 (c)
Zeit (d)
gestellt. (b) Farbfilter zwischen der gemeinsamen Elektrode und dem Substrat liefern farbige Subpixel. (c) Schwarzweißbild, das durch Anwenden der in (d) dargestellten Schaltund Datensignale entsteht. Die Elektroden bestehen aus Indiumzinnoxid (ITO), einem transparenten Leiter.
21.4 Photorefraktivität
Farbfilter durchläuft. AMOLED bieten eine Reihe von Vorteilen gegenüber AMLCD: 1) 2) 3) 4) 5)
Sie sind dünner Sie sind biegsam Sie haben eine bessere Farbwiedergabe Sie haben einen besseren Kontrast Sie sind unempfindlich gegenüber dem Betrachtungswinkel 6) Sie sind schneller. Dem steht im Wesentlichen ein Nachteil gegenüber: Sie sind zum gegenwärtigen Stand der Entwicklung teurer als AMLCD. Optisch adressierte räumliche Lichtmodulatoren
Die meisten LCD werden elektrisch adressiert. Optisch adressierte räumliche Lichtmodulatoren sind jedoch für Anwendungen von Interesse, an denen Bild- und optische Datenverarbeitung beteiligt sind. Licht mit einer Intensitätsverteilung 𝐼W (𝑥, 𝑦), das „zu schreibende“ Bild, wird durch einen optoelektronischen Sensor in eine elektrische Feldverteilung 𝐸(𝑥, 𝑦) umgewandelt, die den Reflexionsgrad ℛ(𝑥, 𝑦) einer in Reflexion betriebenen Flüssigkristallzelle steuert. Eine andere optische Welle mit homogener Intensität wird von dem Bauelement reflektiert und erzeugt das „gelesene“ Bild 𝐼(𝑥, 𝑦) ∝ ℛ(𝑥, 𝑦). Auf diese Weise wird das „gelesene“ Bild von dem „zu schreibenden“ Bild kontrolliert (siehe Abb. 21.15). Wenn das zu schreibende Bild aus inkohärentem Licht besteht und das gelesene Bild aus kohärentem Licht, wirkt das Bauelement als räumlicher inkohärent-kohärent-Wandler, ganz ähnlich wie der in Abschnitt 21.1.5 besprochene optische Pockelsspeicher. Die zum Schreiben bzw. Lesen verwendeten Wellenlängen müssen nicht gleich sein. Das Leselicht kann auch stärker sein als das Schreiblicht, sodass das Bauelement auch als Bildverstärker dienen kann. Es gibt mehrere Wege, um das zu schreibende Bild 𝐼W (𝑥, 𝑦) in eine elektrische Feldverteilung 𝐸(𝑥, 𝑦) umzuwandeln, die dann an die Flüssigkristallzelle angelegt werden kann. Beispielsweise kann eine Schicht eines photoleitenden Materials wie z. B. Cadmiumsulfid (CdS) zwischen die Elektroden eines Kondensators eingebracht werden. Bei Beleuchtung mit der Verteilung 𝐼W (𝑥, 𝑦) wird die Leitfähigkeit 𝐺(𝑥, 𝑦) proportional verändert. Der Kondensator wird dann an jedem Ort entsprechend der lokalen Leitfähigkeit entladen, sodass die resultierende elektrische Feldverteilung 𝐸(𝑥, 𝑦) ∝ 1∕𝐼W (𝑥, 𝑦) ein Negativ des ursprünglichen Bildes ist. Eine Alternative ist die Verwendung einer Plattenphotodiode [z. B. einer pin-Photodiode aus hydriertem amor-
α-Si:H transparente Elektrode
Schreiblicht
Flüssigkristall transparente Elektrode moduliertes Licht einfallendes Leselicht
Lichtsperrschicht dielektrischer Spiegel
Abb. 21.33 Schema des PAL-SLM von Hamamatsu. Er besteht aus zwei Hauptschichten – einer amorphen Siliciumschicht, die die Intensität des Schreiblichts registriert, und einer Flüssigkristallschicht, die als reflektierender Phasenmodulator für das Leselichts dient. Die Schichten sind durch ein lichtundurchlässiges dielektrisches Material getrennt. In der Praxis ist das Bauelement in ein Glassubstrat (nicht gezeigt) eingeschlossen.
phem Silicium (α-Si:H)]. Die in Sperrrichtung gepolte Photodiode leitet im Hellen und erzeugt so eine zur lokalen Lichtintensität proportionale Potentialdifferenz. Ein Beispiel eines handelsüblichen räumlichen Lichtmodulators auf Flüssigkristallbasis ist der parallel ausgerichtete räumliche Lichtmodulator (PAL-SLM) von Hamamatsu, der in Abb. 21.33 gezeigt ist. Er verwendet α-Si:H als Schreibmedium und einen nematischen Flüssigkristall mit parallel ausgerichteten Molekülen als Phasenmodulator. Die Impedanz der amorphen Siliciumschicht wird durch das Schreiblicht lokal verändert, und an den entsprechenden Punkt in der Flüssigkristallschicht wird eine zur optischen Intensität proportionale Spannung angelegt. Das bewirkt eine Rotation der anisotropen Moleküle, die sich mit dem angelegten elektrischen Feld ausrichten. Folglich erfährt der Lesestrahl eine proportionale Phasenverschiebung, während er sich durch den Flüssigkristall ausbreitet. Der Modulator arbeitet kontinuierlich (d. h. er ist nicht gerastert). Es hat eine hohe räumliche Auflösung entsprechend 480 × 480 Punkten auf seiner aktiven Fläche von 2 × 2 cm2 , und seine Anstiegszeit (Abklingzeit) beträgt 30 (40) ms.
21.4 Photorefraktivität Photorefraktive Materialien zeigen photoleitendes und elektrooptisches Verhalten und sind in der Lage, räumliche Verteilungen optischer Intensität in Form eines räumlichen Brechungsindexmusters nachzuweisen und zu speichern. Photoinduzierte Ladungen erzeugen eine räumliche Ladungsverteilung, die ein internes elektri-
749
750
21 Elektrooptik
sches Feld zur Folge hat, das wiederum über den elektrooptischen Effekt den Brechungsindex verändert. Gewöhnliche photoleitende Materialien sind häufig im Dunkeln gute Isolatoren. Wenn Sie beleuchtet werden, absorbieren sie Photonen, wobei freie Ladungsträger (Elektron-Loch-Paare) erzeugt werden und die Leitfähigkeit des Materials zunimmt. Wenn das Licht entfernt wird, endet die Erzeugung von Ladungsträgern, und die Leitfähigkeit kehrt nach der Rekombination der Überschusselektronen und -löcher auf ihren Wert bei Dunkelheit zurück. Photoleiter werden als Photonendetektoren verwendet (siehe Abschnitt 19.2). Wenn ein photorefraktives Material mit Licht bestrahlt wird, werden durch Anregung aus Verunreinigungsniveaus in ein Energieband mit einer zur optischen Leistung proportionalen Geschwindigkeit freie Ladungsträger (Elektronen oder Löcher) erzeugt. Dieser Prozess ähnelt dem in einem extrinsischen Halbleiter-Photoleiter (siehe Abschnitt 19.2.2). Diese Ladungsträger diffundieren dann weg von den Orten hoher Lichtintensität, an denen sie erzeugt wurden, und lassen gebundene entgegengesetzte Ladungen zurück (an den Verunreinigungsionen). Die freien Ladungsträger können durch ionisierte Verunreinigungen an anderen Orten einfangen werden, wobei sie ihre Ladung bei der Rekombination dort abladen. Das Resultat ist die Entstehung einer inhomogenen Raumladungsverteilung, die für einige Zeit nach Abschalten des Lichts bestehen bleiben kann. Diese Ladungsverteilung erzeugt eine interne elektrische Feldverteilung, die durch den elektrooptischen (Pockels-) Effekt den lokalen Brechungsindex des Materials moduliert. Auf das Bild kann optisch zugegriffen werden, indem man das räumliche Muster des Brechungsindex optisch abtastet. Durch Beleuchtung mit homogenem Licht oder Erhitzen kann das Material wieder in seinen ursprünglichen Zustand versetzt werden.
Leitungsband (3) Rekombination
(1) Photoionisation Fe2+
Fe3+
Valenzband
+++++ +++++ +++++
(5) Erzeugung des elektrischen Felds
Daher kann das Material verwendet werden, um Bilder aufzuzeichnen und zu speichern, ganz ähnlich wie eine lichtempfindliche Schicht ein Bild speichert. Abbildung 21.34 illustriert den Prozess für dotiertes Lithiumniobat (LiNbO3 ). Häufig eingesetzte photorefraktive Materialien sind z. B. Lithiumniobat (LiNbO3 ), Kaliumniobat (KNbO3 ), Bariumtitanat (BaTiO3 ), Bismutsiliciumoxid (Bi12 SiO20 , BSO), Strontiumbariumniobat (Sr𝑥 Ba1−𝑥 Nb2 O6 ) und Galliumarsenid (GaAs).
21.4.1
Vereinfachte Theorie der Photorefraktion
Wenn ein photorefraktives Material mit Licht der Intensität 𝐼(𝑥) beleuchtet wird, das in 𝑥-Richtung variiert, ändert sich der Brechungsindex um Δ𝑛(𝑥). Im Folgenden beschreiben wir Schritt für Schritt, welche Prozesse an diesem Effekt beteiligt sind (siehe Abb. 21.34), und geben einen vereinfachten Satz von Gleichungen dafür an. Die Absorption eines Photons am Ort 𝑥 regt ein Elektron vom Donorniveau in das Leitungsband an. Die Geschwindigkeit G(𝑥) der Photoionisation ist sowohl zur optischen Intensität als auch zur Zahldichte der nichtionisierten Donoren proportional. Also gilt
Ladungsträgererzeugung.
+
G(𝑥) = s (ND − ND ) 𝐼(𝑥) ,
(21.56) +
wobei ND die Zahldichte der Donorzentren ist, ND die Zahldichte der ionisierten Donorzentren, und s eine zum Querschnitt der Photoionisation proportionale Konstante. Diffusion. Da 𝐼(𝑥) inhomogen ist, ist die Zahldichte n(𝑥) der angeregten Elektronen ebenfalls inhomogen. Infolgedessen diffundieren Elektronen von Orten hoher Konzentration zu Orten kleiner Konzentration. Rekombination. Die Elektronen rekombinieren mit einer Geschwindigkeit R(𝑥) proportional zu ihrer Zahldichte n(𝑥) und zur Zahldichte der ionisierten Do+ norzentren (Fallen) ND ; damit gilt wieder +
(4) Bildung von Raumladungen
x
Abb. 21.34 Energieniveaudiagramm von LiNbO3 zur Illustration der Photoionisation, Diffusion, Rekombination, Entstehung der räumlichen Ladungsverteilung und der Erzeugung des elektrischen Feldes. Verunreinigungen von Fe2+ wirken als Donor und werden durch Ionisation zu Fe3+ , während Fe3+ -Zentren als Fallen wirken und nach Rekombination zu Fe2+ werden.
R(𝑥) = 𝛾R n(𝑥) N D
(21.57)
mit einer Konstante 𝛾R . Im Gleichgewicht ist die Geschwindigkeit der Rekombination gleich der Geschwindigkeit der Photoionisation, R(𝑥) = G(𝑥), folglich ist +
+
s 𝐼(𝑥) (N D − ND ) = 𝛾R n(𝑥) N D
(21.58)
oder +
n(𝑥) =
s N D − ND
𝛾R
+
ND
𝐼(𝑥) .
(21.59)
21.4 Photorefraktivität
Jedes erzeugte Elektron lässt eine positive Ionenladung zurück. Wenn das Elektron eingefangen wird (rekombiniert), wird seine negative Ladung an einem unterschiedlichen Ort deponiert. Infolgedessen entsteht eine ungleichförmige Raumladungsverteilung. Elektrisches Feld. Diese ungleichförmige Raumladung erzeugt ein ortsabhängiges elektrisches Feld 𝐸(𝑥), das wir aus der Bedingung bestimmen können, dass die Stromdichten aufgrund von Drift und Diffusion im stationären Zustand denselben Betrag, aber entgegengesetztes Vorzeichen haben müssen, sodass die Gesamtstromdichte verschwindet. Das ergibt Raumladung.
𝐽 = 𝑒𝜇E n(𝑥) 𝐸(𝑥) − k 𝑇 𝜇E
dn = 0, d𝑥
(21.60)
wobei 𝜇E die Elektronenbeweglichkeit ist, k die Boltzmannkonstante und 𝑇 die Temperatur. Also ist 𝐸(𝑥) =
k𝑇
1 dn . 𝑒 n(𝑥) d𝑥
(21.61)
Da das Material elektrooptisch ist, modifiziert das interne elektrische Feld 𝐸(𝑥) den Brechungsindex lokal gemäß
Brechungsindex.
1
Δ𝑛(𝑥) = − 𝑛3 r 𝐸(𝑥) , 2
(21.62)
wobei 𝑛 und r der Brechungsindex bzw. die elektrooptischen Koeffizienten des Materials sind [Gl. (21.4)]. Photorefraktive Bildspeicherung. Die Beziehung zwischen der einfallenden Lichtintensität 𝐼(𝑥) und der resultierenden Änderung Δ𝑛(𝑥) des Brechungsindex können wir leicht erhalten, wenn wir annehmen, + dass das Verhältnis (ND ∕N D − 1) in Gl. (21.59) näherungsweise konstant ist und nicht von 𝑥 abhängt. In diesem Fall ist n(𝑥) proportional zu 𝐼(𝑥), und Gl. (21.61) liefert
Um die vorgestellte Theorie einfach zu halten, haben wir viele Annahmen gemacht: Bei der Herleitung von Gl. (21.63) aus Gl. (21.61) haben wir angenommen, dass das Verhältnis der Zahldichten von nicht ionisierten zu ionisierten Donorzentren trotz der räumlichen Variation der Photoionisation näherungsweise konstant ist. Diese Annahme ist erlaubt, wenn die Ionisation durch andere, effektivere Prozesse bewirkt wird, die zusätzlich zur Lichtintensität 𝐼(𝑥) wirken und ortsunabhängig sind. Dunkelleitfähigkeit und photovoltaische Volumeneffekte wurden vernachlässigt. Löcher wurden ignoriert. Wir haben angenommen, dass kein äußeres elektrisches Feld anliegt, obwohl dies in bestimmten Anwendungen nützlich sein kann. Die Theorie gilt nur im stationären Zustand, obwohl die zeitliche Dynamik des photorefraktiven Prozesses offensichtlich wichtig ist, da sie die Geschwindigkeit bestimmt, mit der ein photorefraktives Material auf das angelegte Licht anspricht. Trotz all dieser Annahmen vermittelt diese einfache Theorie die Grundzüge des Verhaltens von photorefraktiven Materialien. Beispiel 21-7: Detektion eines sinusförmigen räumlichen Intensitätsmusters
Wir betrachten eine Intensitätsverteilung in Form einer sinusförmigen Funktion mit der Periode 𝛬, dem Kontrast 𝑚 und der mittleren Intensität 𝐼0 , 𝐼(𝑥) = 𝐼0 (1 + 𝑚 cos
2π𝑥 ), 𝛬
(21.65)
wie in Abb. 21.35 dargestellt. Wenn wir das in die Gln. (21.63) und (21.64) einsetzen, erhalten wir die Verteilungen des internen elektrischen Feldes und des Brechungsindex, − sin(2π 𝑥∕𝛬) , 1 + 𝑚 cos(2π𝑥∕𝛬) sin(2π 𝑥∕𝛬) Δ𝑛(𝑥) = Δ𝑛max , 1 + 𝑚 cos(2π 𝑥∕𝛬) 𝐸(𝑥) = 𝐸max
(21.66)
1
k𝑇
1 d𝐼 𝐸(𝑥) = . 𝑒 𝐼(𝑥) d𝑥
(21.63)
Wenn wir das in Gl. (21.62) einsetzen, erhalten wir einen Ausdruck für die ortsabhängige Änderung des Brechungsindex als Funktion der Intensität, 1
Δ𝑛(𝑥) = − 𝑛3 r 2
k𝑇
1 d𝐼 . 𝑒 𝐼(𝑥) d𝑥
(21.64)
Diese Gleichung lässt sich leicht auf zwei Dimensionen verallgemeinern; in dieser Form ist sie die Grundlage der Verwendung von photorefraktiven Materialien als Bildspeicher.
wobei 𝐸max = 2π (k 𝑇∕𝑒𝛬)𝑚 und Δ𝑛max = 𝑛3 r 𝐸max die 2 maximalen Werte von 𝐸(𝑥) bzw. Δ𝑛(𝑥) sind. Für 𝛬 = 1 μm, 𝑚 = 1 und 𝑇 = 300 K ist beispielsweise 𝐸max = 1.6 × 105 V∕m. Dieses innere Feld entspricht einer Spannung von 1.6 kV, die über einen Kristall von 1 cm Breite angelegt wird. Die maximale Änderung Δ𝑛max des Brechungsindex ist direkt proportional zum Kontrast 𝑚 und dem elektrooptischen Koeffizienten r und umgekehrt proportional zur Raumperiode 𝛬. Das Gittermuster Δ𝑛(𝑥) hängt nicht von dem homogenen Niveau 𝐼0 der Beleuchtung ab. Wenn der Bildkontrast 𝑚 klein ist, kann der zweite Term der Nenner in Gl. (21.66) vernachlässigt werden.
751
752
21 Elektrooptik
inhomogenes Licht
optische Intensität I(x)
Photoionisation
freie Ladungsträger
Diffusion
starre Ladungsträger
x
elektrisches Feld
elektr. Feld E(x)
x
Indexgitter
Indexänderung Δn(x)
x
Das interne elektrische Feld und die Änderung des Brechungsindex sind dann sinusförmige Muster, die um 90◦ gegen das Muster des einfallenden Lichts verschoben sind, Δ𝑛(𝑥) ≈ Δ𝑛max sin
2π 𝑥 . 𝛬
(21.67)
Diese Muster sind in Abb. 21.35 dargestellt. Anwendungen des photorefraktiven Effekts
In einem photorefraktiven Kristall kann ein Bild 𝐼(𝑥, 𝑦) in Form einer Brechungsindexverteilung Δ𝑛(𝑥, 𝑦) gespeichert werden. Das Bild kann ausgelesen werden, indem man den Kristall als Raumphasenmodulator verwendet, um die Information in eine gleichförmige optische ebene Welle zu übertragen. Die Phasenmodulation kann in eine Intensitätsmodulation umgewandelt werden, indem man die Zelle beispielsweise in ein Interferometer bringt (Abb. 21.5). Wegen ihrer Fähigkeit, Bilder aufzuzeichnen, sind photorefraktive Materialien für den Einsatz in der Echtzeitholographie von Interesse (siehe Abschnitt 4.5 für eine Diskussion der Holographie). Eine Gegenstandswelle wird holographisch aufgenommen, indem sie mit einer Referenzwelle überlagert wird, wie Abb. 21.36 für zwei ebene Wellen illustriert. Die Intensität der Summe zweier solcher Wellen ist ein sinusförmiges Interferenzmuster, das im photorefraktiven Kristall in Form einer Brechungsindexvariation registriert wird. Der Kristall dient dann als Volumen-Phasenhologramm (siehe
x
Abb. 21.35 Reaktion eines photorefraktiven Materials auf eine sinusförmige räumliche Lichtverteilung.
x
Abschnitt 4.5, Abb. 4.55). Um die gespeicherte Gegenstandswelle zu rekonstruieren, wird der Kristall mit der Referenzwelle bestrahlt. Der Kristall wirkt dann wie ein Volumen-Beugungsgitter, reflektiert die Referenzwelle und reproduziert dabei die Gegenstandswelle. Da die Aufnahme relativ schnell abläuft, können die Prozesse der Aufnahme und der Rekonstruktion gleichzeitig ablaufen. Die Gegenstands- und Referenzwellen breiten sich zusammen in dem Medium aus und tauschen durch Reflexion am erzeugten Gitter Energie aus. Dieser Prozess wird als Zweiwellenmischung bezeichnet. Wie Abb. 21.36 zeigt (siehe auch Abb. 4.53), interferieren die Wellen 1 und 2 und bilden ein Volumengitter. Welle 1 wird an dem Gitter reflektiert trägt zu Welle 2 bei; Welle 2 wird an dem Gitter reflektiert und trägt zu Welle 1 bei. Auf diese Weise werden die beiden Wellen durch das Gitter miteinander gekoppelt, das sie selbst im Medium erzeugen. Deshalb wird der Durchgang von Welle 1 durch das Medium von der Anwesenheit von Welle 2 gesteuert und umgekehrt. Beispielsweise kann Welle 1 auf Kosten von Welle 2 verstärkt werden. Die Mischung von zwei (oder mehr) Wellen kommt auch in anderen nichtlinearen optischen Materialien mit lichtabhängigen optischen Eigenschaften vor, wie in Kapitel 22 besprochen wird. Das Mischen von Wellen besitzt zahlreiche Anwendungen in der optischen Datenverarbeitung (siehe Kapitel 22 und 24), z. B. bei der Bildverstärkung, der Entfernung von Aberrationen, der Kreuzkorrelation von Bildern oder optischen Verbindungen. Elektrochromie
Welle 1 (Referenz) 2 lle ) We bjekt (O
Gitter
Abb. 21.36 Die Zweiwellenmischung ist eine Form der dynamischen Holographie.
Ein anderer elektrooptischer Effekt, der mit einem Ladungstransport verbunden ist, ist die Elektrochromie. Hier bewirkt ein elektrisches Feld eine Änderung des Absorptionsspektrums (der Farbe) eines Materials. Anwendungen findet dieser Effekt beispielsweise in Anzeigeelementen oder elektrisch steuerbaren (abdunkelbaren) Fenstern. Sowohl anorganische als auch organische Materialien zeigen Elektrochromie.
21.5 Elektroabsorption
hν1
hν2
Wellenlänge Betriebswellenlänge
Ein
Absorptionskoeffizient
Aus
Aus
+
modulierter Strahl
einfallender Strahl
Ein
Halbleiter
Photonenenergie (a)
(b)
(c)
Abb. 21.37 Der Franz-Keldysh-Effekt. (a) Die natürliche Bandlücke wird durch Anlegen eines elektrischen Feldes reduziert. (b) Die Änderung im Absorptionsspektrum durch die Anwesenheit des äußeren Feldes. Der Absorptionspeak bewegt sich zu größeren Wellenlängen. (c) Elektroabsorptionsmodulator in einer Wellenleiterausführung.
21.5 Elektroabsorption Elektroabsorption bezeichnet eine Änderung der Absorptionseigenschaften eines Mediums als Antwort auf ein äußeres elektrisches Feld. In einem Volumenhalbleiter bewirkt das Anlegen eines äußeren elektrischen Feldes das Tunneln von Elektronen, wodurch die Absorptionskante in die Bandlücke hinein ausgedehnt wird. Die Bandlücke des Materials wird so noch unter den durch die Bandausläufer und die Urbachausläufer gegebenen Werte reduziert, sodass ℎ𝜈2 < ℎ𝜈1 gilt, wenn das Feld eingeschaltet ist wie in Abb. 21.37(a). Dieses Phänomen ist als Franz-Keldysh-Effekt bekannt; er verschiebt das Absorptionsspektrum zu größeren Wellenlängen [Abb. 21.37(b)]. Das angelegte elektrische Feld bewirkt auch eine Verbreiterung und schließlich das Verschwinden der Excitonen-Absorptionspeaks (siehe Abschnitt 17.2.3). Dieser Effekt wird in optischen Elektroabsorptionsmodulatoren und Elektroabsorptionsschaltern ausgenutzt, die technisch sehr einfach zu realisieren sind. Ohne das elektrische Feld wird ein einfallender Strahl an der Betriebswellenlänge, die länger ist als die normale Wellenlänge der Bandlücke, ohne Absorption transmittiert [Abb. 21.37(b)]. Nach Anlegen des elektrischen Feldes wird das Licht jedoch absorbiert. Solche Modulatoren werden häufig in Form von Wellenleitern ausgeführt, in denen das elektrische Feld in einer Richtung senkrecht zur Ausbreitungsrichtung des Lichtstrahls angelegt wird, wie Abb. 21.37(c) zeigt. Im Vergleich zu elektrooptischen Modulatoren, die auf der Grundlage einer Änderung des Brechungsindex als Reaktion auf ein angelegtes elektrisches Feld arbeiten (siehe die Abschnitte 21.1.2 und 21.2.3), arbeiten Elektroabsorptionsmodulatoren normalerweise mit größeren Geschwindigkeiten und mit kleineren Spannungen. Da sie mit Halbleiterlichtquellen auf einem einzigen Chip inte-
griert werden können, sind sie für den Gebrauch in faseroptischen Kommunikationssystemen sehr praktisch. Sie zeigen auch einen geringeren Chirp als direkt modulierte Laserdioden (siehe Abschnitt 25.1.2). In Halbleiter-Mehrfachquantenschichtstrukturen ist der Elektroabsorptionseffekt ausgeprägter (siehe die Abschnitte 17.1.7 und 18.2.4). Ein in der Ebene einer Quantenschicht angelegtes elektrisches Feld verursacht ein dem Franz-Keldysh-Effekt ähnliches Verhalten einschließlich einer Verschiebung der Absorptionskante zu einer größeren Wellenlänge und Excitonendissoziation. Allerdings verursacht ein in Richtung auf die Eingrenzung angelegtes elektrisches Feld zusätzliche Phänomene, die gemeinsam als quantenbeschränkter Starkeffekt bezeichnet werden (siehe Abb. 21.38): • Der Energieunterschied zwischen den Energieniveaus des Leitungs- und des Valenzbands nimmt mit steigendem elektrischen Feld (ℎ𝜈2 < ℎ𝜈1 ) ab. • Die Bandneigung bewirkt eine Verschiebung der Positionen der Wellenfunktionen zu den Rändern der Schicht. • Excitonenionisation wird gehemmt, und Excitonenniveaus bleiben sogar bei hohen Feldstärken unverbreitert, da Elektronen und Löcher aufgrund der Eingrenzung in enger Nachbarschaft bleiben. Infolge dieser Eigenschaften der Mehrfachquantenschichten ist die Wellenlängenverschiebung der Absorptionspeaks größer und die Absorptionskante ist schärfer als in Volumenhalbleitern. Elektroabsorptionsmodulatoren auf der Grundlage des quantenbeschränkten Starkeffekts haben sehr interessante Eigenschaften, z. B. • • • •
hohe Geschwindigkeit großes Extinktionsverhältnis niedrige Betriebsspannung geringer Chirp
753
21 Elektrooptik
Aus
Wellenlänge / nm 860 850
Ein
4V
2V
Mehrfachquantenschicht
754
8V hν1
hν2
(a)
12V
1.43 (b)
einfallender Strahl modulierter Strahl +
1.44 1.45 1.46 1.47 Photonenenergie / eV
(c)
Abb. 21.38 (a) Energiediagramm und Bandschema einer Quantenschicht ohne (Aus) und mit (Ein) äußeres elektrisches Feld. Das Feld bewirkt eine Reduktion der Energiedifferenz zwischen den Bändern und eine Verschiebung der Wellenfunktionen von den Zentren der Schichten zu entgegengesetzten Rändern. (b) Die Änderung im Absorptionsspektrum einer AlGaAs/GaAs-Mehrfachquantenschichtstruktur bei steigender angelegter Spannung (Feld). Die Excitonenpeak verschiebt sich zu größeren Wellenlängen.
(Modifiziert nach D. A. B. Miller, D. S. Chemla, T. C. Damen, T. H. Wood, C. A. Burrus, Jr., A. C. Gossard W. Wiegmann, ‚The Quantum Well Self-Electrooptic Effect Device: Optoelectronic Bistability and Oscillation, and Self-Linearized Modulation‘, IEEE Journal of Quantum Electronics 21, 1462–1476, 1985; Abb. 1. ©1985 IEEE.) (c) Schematische Darstellung eines Mehrfachquantenschicht-Elektroabsorptionsmodulators in vertikaler Bauweise.
In der einfachsten Variante in Transmission wird Licht durch eine intrinsische Mehrfachquantenschichtstruktur zwischen p- und n-dotierten Regionen geleitet, über die eine Spannung angelegt wird. Das Schalten wird einfach durch Ein- und Ausschalten der Spannung erreicht. Ein Bauelement dieser Art kann auch in einer Wellenleiterausführung hergestellt und mit einem DFBLaser auf einem einzigen Chip integriert werden. Modulatoren und Schalter auf der Grundlage des quantenbeschränkten Starkeffekts können auch in Form von Arrays aus vertikalen Zweipassstrukturen hergestellt werden, wie in Abb. 21.38(c) dargestellt.
Aufgaben
Beispiel 21-8: Elektroabsorptions-Modulator aus GeSi
Optische Modulatoren sind in der integrierten Photonik wichtige Bauelemente. Silicium besitzt zwar nur einen kleinen elektrooptischen Koeffizienten, aber SiGe eignet sich zur Herstellung von Elektroabsorptions-Modulatoren. Ein solcher Modulator mit einer aktiven Region von 1 μm × 50 μm, der auf einem 3 μm hohen Silicium-auf-Isolator-Wellenleiter integriert ist, kann auf einem Wellenlängenintervall von 35 nm um 1550 nm betrieben werden. Seine 3-dB-Bandbreite beträgt 35 GHz und seine Umschaltspannung 2.5 V.
Aufgabe 21-1: Antwortzeit eines Phasenmodulators
Ein GaAs-Kristall mit dem Brechungsindex 𝑛 = 3.6 und dem elektrooptischen Koeffizienten r = 1.6 pm∕V wird als elektrooptischer Phasenmodulator verwendet, der bei 𝜆0 = 1.3 μm in einer longitudinalen Anordnung arbeitet. Der Kristall ist 3 cm lang und hat eine Querschnittsfläche von 1 cm2 . Bestimmen Sie die Halbwellenspannung 𝑉π , die Durchgangszeit des Lichts durch den Kristall und die elektrische Kapazität des Bauelements (die niederfrequente Dielektrizitätskonstante von GaAs ist 𝜀∕𝜀0 = 13.5). Die Spannung stammt aus einer Quelle mit einem Widerstand von 50 Ω. Welcher Faktor begrenzt die Geschwindigkeit des Bauelements, die Durchgangszeit des Lichts durch den Kristall oder die Antwortzeit des Stromkreises? Aufgabe 21-2: Empfindlichkeit eines interferometrischen elektrooptischen Intensitätsmodulators
Ein integriert-optischer Intensitätsmodulator in MachZehnder-Ausführung, Abb. 21.6, wird als linearer Analogmodulator verwendet. Welche Empfindlichkeit (infinitesimale Änderung der Intensitätstransmission pro infinitesimaler Änderung der angelegten Spannung) besitzt das Bauelement, wenn die Halbwellenspannung 𝑉π = 10 V ist?
Aufgaben
Aufgabe 21-3: Ein elastooptischer Deformationssensor
Ein elastooptisches Material ändert seinen Brechungsindex proportional zu einer mechanischen Deformation. Entwerfen Sie einen auf diesem Effekt beruhenden Deformationssensor. Schlagen Sie eine integriert-optische Ausführung vor. Nehmen Sie an, dass das Material auch elektrooptisch ist, und schlagen Sie eine Konstruktion vor, bei der die elastooptischen und elektrooptischen Indexänderungen kompensiert werden und das dafür erforderliche Feld in einem Mach-Zehnder-Interferometer gemessen wird.
Aufgabe 21-6: Hintereinander geschaltete Phasenmodulatoren
Beschreiben Sie, wie ein Faradayrotator (siehe Abschnitt 6.4.2) als optischer Intensitätsmodulator verwendet werden kann.
(a) Ein KDP-Kristall (r41 = 8 pm∕V, r63 = 11 pm∕V, 𝑛o = 1.507, 𝑛e = 1.467 bei 𝜆0 = 633 nm) wird als longitudinaler Phasenmodulator eingesetzt. Die Orientierung der Kristallachsen und des angelegten elektrischen Feldes ist wie in den Beispielen 21-2 und 21-6 gezeigt. Bestimmen Sie die Halbwellenspannung 𝑉π bei 𝜆0 = 633 nm. (b) Ein elektrooptischer Phasenmodulator besteht aus neun durch Elektroden getrennten KDP-Kristallen, an die wie in Abb. 21.39 gezeigt Spannungen angelegt werden. Wie müssen die Platten zueinander orientiert sein, damit die Gesamt-Phasenmodulation maximiert wird? Berechnen Sie 𝑉π für den zusammengesetzten Modulator.
Aufgabe 21-5: Integriert-optischer SiliciumdioxidPhasenmodulator
einfallendes Licht
Aufgabe 21-4: Magnetooptische Modulatoren
Da Quarzglas ein zentrosymmetrischer Kristall ist, zeigt es normalerweise keinen linearen elektrooptischen (Pockels-) Effekt. Thermisch gepoltes Siliciumdioxid besitzt jedoch Pockelskoeffizienten, die für den Einsatz als optische Modulatoren groß genug sind. Bestimmen Sie die Phasenverschiebung durch einen integriert-optischen Phasenmodulator aus gepoltem Siliciumdioxid in einer Anordnung wie der in Abb. 21.4 gezeigten. Nehmen Sie an, dass die Elektrodenlänge 𝐿 = 25 mm ist, der Elektrodenabstand d = 30 μm und die Wellenlänge 𝜆 = 1.55 μm. Nehmen Sie auch an, dass die optische Welle in 𝑦-Richtung polarisiert ist, dass das elektrische Feld durch eine angelegte Spannung 𝑉 = 400 V erzeugt wird und in 𝑦-Richtung zeigt und dass die Welle sich entlang der Elektroden in 𝑧-Richtung ausbreitet. Das Material ist so gepolt, dass seine Hauptachsen (𝑥1 , 𝑥2 , 𝑥3 ) in die 𝑧-, 𝑥- und 𝑦-Richtung zeigen. Der Brechungsindex des gepolten Materials ist 𝑛 = 1.445, und die Pockelskoeffizienten werden durch die Matrix ⎛0 ⎜ ⎜0 ⎜0 ⎜ ⎜0 ⎜r13 ⎜ 0 ⎝
0 0 0 r13 0 0
r13 ⎞ ⎟ r13 ⎟ r33 ⎟ ⎟ 0⎟ 0⎟ ⎟ 0 ⎠
mit r13 = 0.15 pm∕V beschrieben.
+V
Kristallplatten
moduliertes Licht 0
Abb. 21.39 Ein elektrooptischer Phasenmodulator aus KDPKristallen (zu Aufgabe 21-6).
Aufgabe 21-7: Der „Push-Pull“-Intensitätsmodulator
Ein optischer Intensitätsmodulator besteht aus zwei integrierten elektrooptischen Phasenmodulatoren und einem 3-dB-Richtkoppler wie in Abb. 21.40. Die Eingabewelle wird in zwei Wellen mit gleichen Amplituden geteilt, die beide phasenmoduliert, an einem Spiegel reflektiert und ein zweites Mal phasenmoduliert werden, bevor sie in dem Richtkoppler addiert werden, um das Ausgangssignal zu bilden. Leiten Sie einen Ausdruck für die Intensitätstransmission des Bauelements als Funktion der angelegten Spannung, der Wellenlänge, der Abmessungen und der physikalischen Parameter des Phasenmodulators her. Ausgang Eingang +V
–V
Spiegel
Abb. 21.40 Ein optischer Intensitätsmodulator (zu Aufgabe 21-7).
755
756
21 Elektrooptik
Aufgabe 21-8: Ein integriert-optischer Intensitätsmodulator aus LiNbO3
Entwerfen Sie einen integriert-optischen Intensitätsmodulator aus LiNbO3 auf der Grundlage des in Abb. 21.6 gezeigten Mach-Zehnder-Interferometers. Wählen Sie die Orientierung des Kristalls und die Polarisation der geführten Welle so, dass die kleinstmögliche Halbwellenspannung 𝑉π resultiert. Nehmen Sie an, dass die aktive Region die Länge 𝐿 = 1 mm und Dicke d = 5 μm besitzt. Die Wellenlänge ist 𝜆0 = 0.85 μm, die Brechungsindizes sind 𝑛o = 2.29 und 𝑛e = 2.17, und die elektrooptischen Koeffizienten sind r33 = 30.9, r13 = 8.6, r22 = 3.4 und r42 = 28 pm∕V. Aufgabe 21-9: Doppelbrechung in einem elektrooptischen Kristall
(a) Ein unpolarisierter Strahl aus einem He-Ne-Laser (𝜆0 = 633 nm) wird durch eine 1 cm dicke LiNbO3 Platte (𝑛e = 2.17, 𝑛o = 2.29, r33 = 30.9 pm∕V, r13 = 8.6 pm∕V) transmittiert. Der Strahl ist zur Platte orthogonal, und die optische Achse liegt in der Einfallsebene des Lichts in einem Winkel von 45◦ zu dem Strahl. Der Strahl wird doppelt gebrochen (siehe Abschnitt 6.3.5). Bestimmen Sie die seitliche Versetzung und die Verzögerung zwischen den ordentlichen und außerordentlichen Strahlen. (b) Welchen Einfluss hat ein elektrisches Feld 𝐸 = 30 V∕m in einer zur optischen Achse parallelen Richtung auf die transmittierten Strahlen? Wo sehen Sie mögliche Anwendungen eines solchen Bauelements?
Weiterführende Literatur Elektrooptik
Siehe auch die Weiterführende Literatur zu Kristallen und Tensoranalysis in Kapitel 6 und die Weiterführende Literatur in 22. T.-C. Poon, T. Kim, Engineering Optics with MATLAB, Kapitel 5, World Scientific, 2. Aufl. 2018. L. R. Dalton, P. Günter, M. Jazbinsek, O.-P Kwon, P. A. Sullivan, Organic Electro-Optics and Photonics: Molecules, Polymers, and Crystals, Cambridge University Press 2015. R. Dinu, E. Miller, G. Yu, B. Chen, A. Scarpaci, H. Chen, C. Pilgrim, ‚High-Speed Polymer Optical Modulators‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. F. Agulló-López, J. M. Cabrera, F. Agulló-Rueda, Electrooptics: Phenomena, Materials and Applications, Academic Press 1994. I. P. Kaminow, An Introduction to Electrooptic Devices, Academic Press 1974.
Flüssigkristallzellen und -Displays
V. C. Coffey, ‚The Age of OLED Displays‘, Optics & Photonics News 28(11), 34–41, 2017. D.-K. Yang, S.-T. Wu, Fundamentals of Liquid Crystal Devices, Wiley, 2. Aufl. 2015. S. R. Restaino, S. W. Teare, Introduction to Liquid Crystals for Optical Design and Engineering, SPIE Optical Engineering Press 2015. R. H. Chen, Liquid Crystal Displays: Fundamental Physics and Technology, Wiley 2011. P. Yeh, C. Gu, Optics of Liquid Crystal Displays, Wiley, 2. Aufl. 2010. W. den Boer, Active Matrix Liquid Crystal Displays: Fundamentals and Applications, Elsevier 2010. L. Vicari, Optical Applications of Liquid Crystals, Institute of Physics 2003. V. G. Chigrinov, Liquid Crystal Devices: Physics and Applications, Artech 1999. U. Efron (Hrsg.), Spatial Light Modulator Technology: Materials, Devices, and Applications, CRC Press 1995. P. G. de Gennes, J. Prost, The Physics of Liquid Crystals, Oxford University Press, 2. Aufl. 1993. M. A. Karim (Hrsg.), Electro-Optical Displays, CRC Press 1992. Photorefraktive Materialien
J. Frejlich, Photorefractive Materials: Fundamental Concepts, Holographic Recording and Materials Characterization, Wiley 2007. P. Günter, J.-P. Huignard (Hrsg.), Photorefractive Materials and Their Applications. 3: Applications, Springer 2007. P. Günter, J.-P. Huignard (Hrsg.), Photorefractive Materials and Their Applications. 2: Materials, Springer 2007, Paperback 2011. P. Günter, J.-P. Huignard (Hrsg.), Photorefractive Materials and Their Applications. 1: Basic Effects, Springer 2006, Paperback 2010. F. T. S. Yu, S. Yin (Hrsg.), Photorefractive Optics: Materials, Properties, and Applications, Academic Press 2000. L. Solymar, D. J. Webb, A. Grunnet-Jepsen, The Physics and Applications of Photorefractive Materials, Oxford University Press 1996. P. Yeh, C. Gu (Hrsg.), Landmark Papers on Photorefractive Nonlinear Optics, World Scientific 1995. F. M. Davidson (Hrsg.), Selected Papers on Photorefractive Materials, SPIE Optical Engineering Press 1994 (Milestone Series Bd. 86). P. Yeh, Introduction to Photorefractive Nonlinear Optics, Wiley 1993. D. M. Pepper, J. Feinberg, N. K. Kukhtarev, ‚The Photorefractive Effect‘, Scientific American 263(4), 62–74, 1990.
Aufgaben
Elektroabsorption
D. Feng, W. Qian, H. Liang, C.-C. Kung, Z. Zhou, Z. Li, J. S. Levy, R. Shafiiha, J. Fong, B. J. Luff, M. Asghari, ‚High-Speed GeSi Electroabsorption Modulator on the SOI Waveguide Platform‘, IEEE Journal of Selected Topics in Quantum Electronics 19, 3401710, 2013. Y.-H. Kuo, Y. K. Lee, Y. Ge, S. Ren, J. E. Roth, T. I. Kamins, D. A. B. Miller, J. S. Harris, ‚Strong Quantum-Confined Stark Effect in Germanium Quantum-Well Structures on Silicon‘, Nature 437, 1334–1336, 2005.
757
759
22 Nichtlineare Optik Bis vor kurzem galt in der langen Geschichte der Optik stets die Annahme, dass alle optischen Medien linear seien. Die Folgen dieser Annahme sind weitreichend: • Die optischen Eigenschaften der Materialien wie z. B. Brechungsindex und Absorptionskoeffizient hängen nicht von der Lichtintensität ab. • Das Superpositionsprinzip, eine grundlegende Doktrin der klassischen Optik, ist anwendbar. • Die Frequenz von Licht wird beim Durchgang durch ein Medium nicht verändert. • Zwei Lichtstrahlen in derselben Region eines Mediums beeinflussen sich nicht, sodass Licht nicht mithilfe von Licht kontrolliert werden kann. Mit dem Erscheinen des ersten Lasers im Jahr 1960 konnte man das Verhalten von Licht in optischen Materialien bei viel höheren Intensitäten als zuvor untersuchen. Zahlreiche Experimente aus dem Laserzeitalter zeigen eindeutig, dass optische Medien doch nichtlineares Verhalten zeigen, wie die folgenden Beobachtungen belegen: • Der Brechungsindex – und folglich die Lichtgeschwindigkeit – hängt in einem nichtlinearen optischen Medium von der Lichtintensität ab. • Das Superpositionsprinzip ist in einem nichtlinearen optischen Medium verletzt. • Die Frequenz des Lichts wird beim Durchgang durch ein nichtlineares optisches Medium verändert; die Farbe des Lichts kann sich z. B. von rot nach blau ändern. • In einem nichtlinearen Medium wechselwirken Photonen miteinander, sodass Licht doch verwendet werden kann, um Licht zu kontrollieren. Das Feld der nichtlinearen Optik bietet eine Vielzahl von faszinierenden Phänomenen, von denen viele auch wichtige Anwendungen besitzen. Nichtlineares optisches Verhalten wird nicht beobachtet, wenn Licht sich im Vakuum ausbreitet. Die „Nichtlinearität“ ist eine Eigenschaft des Mediums, durch das
sich das Licht ausbreitet, nicht des Lichts selbst. Die Wechselwirkung von Licht mit Licht wird daher durch das nichtlineare Medium vermittelt: Die Anwesenheit eines optischen Feldes modifiziert die Eigenschaften des Mediums, wodurch wiederum ein anderes optisches Feld – oder sogar das ursprüngliche Feld selbst – modifiziert wird. Wie in Kapitel 5 besprochen, werden die Eigenschaften eines dielektrischen Mediums, in dem sich eine optische elektromagnetische Welle ausbreitet, durch die Beziehung zwischen dem Polarisationsvektor 𝓟(r, 𝑡) und dem elektrischen Feldvektor 𝓔(r, 𝑡) beschrieben. Es ist oft hilfreich, 𝓟(r, 𝑡) als den Ausgang eines Systems anzusehen, dessen Eingang 𝓔(r, 𝑡) ist. Die mathematische Beziehung zwischen den Vektorfunktionen 𝓟(r, 𝑡) und 𝓔(r, 𝑡), die durch die Eigenschaften des Mediums bestimmt ist, definiert das System. Man bezeichnet das Medium als nichtlinear, wenn diese Beziehung nichtlinear ist (siehe Abschnitt 5.2).
In diesem Kapitel . . . In Kapitel 5 hatten wir dielektrische Medien nach ihrer Dispersivität, Homogenität und Isotropie klassifiziert (siehe Abschnitt 5.2). Um uns auf den Hauptaspekt von Interesse – die Nichtlinearität – zu konzentrieren, beschränken wir uns im ersten Teil unserer Behandlung auf nichtdispersive, homogene und isotrope Medien. Die Vektoren 𝓟 und 𝓔 sind daher an jedem Ort und zu jeder Zeit parallel und können Komponente für Komponente untersucht werden. Die Theorie der nichtlinearen Optik und ihrer Anwendungen wird in zwei Stufen präsentiert. Einen vereinfachten Ansatz stellen wir in den Abschnitten 22.1–22.3 vor. Anschließend folgt in den Abschnitten 22.4 und 22.5 eine ausführlichere Analyse derselben Phänomene. Die Ausbreitung des Lichts in Medien, die durch eine quadratische Beziehung zwischen 𝒫 und ℰ charakterisiert sind, wird in den Abschnitten 22.2
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
760
22 Nichtlineare Optik
und 22.4 beschrieben. Zu ihren Anwendungen gehören die Frequenzverdopplung einer monochromatischen Welle (Erzeugung der zweiten Harmonischen), das Mischen von zwei monochromatischen Wellen, um eine dritte Welle mit der Summen- oder Differenzfrequenz zu erhalten (Frequenzkonversion), die Verwendung von zwei monochromatischen Wellen zur Verstärkung einer dritten (parametrische Verstärkung) und das Hinzufügen von Rückkopplung zu einem Bauelement mit parametrischer Verstärkung zur Erzeugung eines Oszillators (parametrische Oszillation). Die Wellenausbreitung in einem Medium mit einer kubischen Beziehung zwischen 𝒫 und ℰ wird in den Abschnitten 22.3 und 22.5 besprochen. Zu ihren Anwendungen gehören die Erzeugung der dritten Harmonischen, die Selbstphasenmodulation, die Selbstfokussierung, die Vierwellenmischung und die Phasenkonjugation. Das Verhalten von anisotropen und dispersiven nichtlinearen optischen Medien wird in den Abschnitten 22.6 und 22.7 kurz umrissen. Nichtlineare Optik in anderen Kapiteln
Eine wesentliche Annahme für die Diskussion in diesem Kapitel ist, dass das Medium passiv ist, d. h. keine Energie mit der Lichtwelle austauscht. Wellen unterschiedlicher Frequenzen können über die nichtlinearen Eigenschaften des Mediums Energie untereinander austauschen, aber ihre Gesamtenergie bleibt erhalten. Derartige nichtlineare Phänomene werden als parametrische Wechselwirkungen bezeichnet, weil dabei ein Parameter des Systems zeitlich periodisch verändert wird; beispielsweise kann ein starkes elektrisches Feld bewirken, dass die Suszeptibilität des Mediums zeitlich oszilliert. In anderen Kapiteln dieses Buches kommen auch nichtlineare Phänomene zur Sprache, die nichtparametrische Wechselwirkungen einschließen: • Laserwechselwirkungen. An der Wechselwirkung von Licht mit einem Medium bei Frequenzen in der Nähe der Resonanzen atomarer oder molekularer Übergänge sind Phänomene wie Absorption sowie induzierte und spontane Emission beteiligt, wie in Abschnitt 14.3 beschrieben. Diese Wechselwirkungen werden nichtlinear, wenn das Licht so stark ist, dass die Besetzungen der verschiedenen Energieniveaus wesentlich verändert werden. Nichtlineare optische Effekte äußern sich z. B. in der Sättigung von Laserverstärkern und sättigbaren Absorbern (Abschnitt 15.4). • Mehrphotonenabsorption. Intensives Licht kann die Absorption einer Gruppe von Photonen bewirken, de-
ren Gesamtenergie gleich der eines atomaren Übergangs ist. Für die 𝑘-Photonen-Absorption ist die Geschwindigkeit der Absorption proportional zu 𝐼 𝑘 , wenn 𝐼 die optische Intensität ist. Dieses nichtlinearoptische Phänomen wird in Abschnitt 14.5.2 kurz beschrieben. • Nichtlineare Streuung. Nichtlineare inelastische Streuung beruht auf einer Wechselwirkung des Lichts mit den akustischen oder Schwingungsmoden eines Mediums. Beispiele sind die induzierte Raman- oder Brillouinstreuung, die in den Abschnitten 14.5.3 und 15.3.4 beschrieben werden. Außerdem wird überall in diesem Kapitel angenommen, dass das Licht durch stationäre kontinuierliche Wellen beschrieben wird. Nichtstationäre nichtlineare optische Phänomene sind z. B. • Nichtlineare Optik von gepulstem Licht. Die parametrische Wechselwirkung von optischen Pulsen mit einem nichtlinearen Medium wird in Abschnitt 23.5 beschrieben. • Optische Solitonen sind Lichtpulse, die sich über außergewöhnlich große Entfernungen durch nichtlineare dispersive Medien ausbreiten, ohne ihre Breite oder Form zu ändern. Dieses nichtlineare Phänomen ist das Ergebnis eines Gleichgewichts zwischen Dispersion und nichtlinearer Selbstphasenmodulation wie in Abschnitt 23.5.2 beschrieben. Der Einsatz von Solitonen in faseroptischen Nachrichtensystemen wird in Abschnitt 25.2.5 beschrieben. Ein weiterer nichtlinearer optischer Effekt ist die optische Bistabilität. Dazu gehören nichtlineare optische Effekte, die zusammen mit einer Rückkopplung auftreten. Anwendungen in photonischen Schaltern werden in Abschnitt 24.1 beschrieben.
22.1 Nichtlineare optische Medien Ein lineares dielektrisches Medium ist durch eine lineare Beziehung 𝒫 = 𝜀0 𝜒ℰ zwischen der Polarisation und dem elektrischen Feld charakterisiert, wobei 𝜀0 die Vakuumpermittivität ist und 𝜒 die elektrische Suszeptibilität des Mediums (siehe Abschnitt 5.2.2). Ein nichtlineares dielektrisches Medium ist dagegen durch eine nichtlineare Beziehung zwischen 𝒫 und ℰ charakterisiert (siehe Abschnitt 5.2.3), wie Abb. 22.1 illustriert. Die Nichtlinearität kann mikroskopischen oder makroskopischen Ursprungs sein. Die Polarisation 𝒫 = Np ist ein Produkt der einzelnen durch das angelegte elektrische Feld ℰ induzierten Dipolmomente p und deren
22.1 Nichtlineare optische Medien
𝒫
𝒫
ℰ
ℰ (b) Nichtlinear
(a) Linear
Abb. 22.1 Die 𝒫−ℰ -Beziehung für (a) ein lineares dielektrisches Medium und (b) ein nichtlineares Medium.
Zahldichte N. Das nichtlineare Verhalten kann entweder aus p oder aus N resultieren. Die Beziehung zwischen p und ℰ ist linear, wenn ℰ klein ist, wird aber nichtlinear, wenn ℰ Werte annimmt, die mit interatomaren elektrischen Feldern vergleichbar sind, die normalerweise im Bereich 105 –108 V∕m liegen. Das kann anhand eines einfachen Lorentzmodells verstanden werden, in dem das Dipolmoment p = −𝑒𝑥 ist, wobei 𝑥 die Auslenkung einer Masse mit der Ladung −𝑒 ist, auf die eine elektrische Kraft −𝑒ℰ wirkt (siehe Abschnitt 5.5.3). Wenn die rücktreibende elastische Kraft zur Verschiebung proportional ist (d. h. wenn das hookesche Gesetz erfüllt ist), ist die Auslenkung 𝑥 im Gleichgewicht proportional zu ℰ. In diesem Fall ist 𝒫 proportional zu ℰ und das Medium ist linear. Wenn die rücktreibende Kraft jedoch eine nichtlineare Funktion der Auslenkung ist, sind auch die Auslenkung 𝑥 im Gleichgewicht und die Polarisation 𝒫 nichtlineare Funktionen von ℰ, und folglich ist das Medium nichtlinear. Die zeitliche Dynamik eines anharmonischen Oszillatormodells zur Beschreibung eines dielektrischen Mediums mit diesen Eigenschaften wird in Abschnitt 22.7 besprochen. Ein andere mögliche Ursache einer nichtlinearen Antwort eines optischen Materials auf Licht ist die Abhängigkeit der Zahldichte N vom optischen Feld. Ein Beispiel dafür ist ein Lasermedium, in dem die Zahl der Atome in den an der Absorption und Emission des Lichts beteiligten Energieniveaus von der Intensität des Lichts selbst abhängt (siehe Abschnitt 15.4). Da von außen angelegte optische elektrische Felder im Vergleich zu charakteristischen interatomaren oder kristallinen Feldern normalerweise klein sind, selbst wenn fokussiertes Laserlicht eingesetzt wird, ist die Nichtlinearität gewöhnlich schwach. Die Beziehung zwischen 𝒫 und ℰ ist dann für kleine ℰ näherungsweise linear und weicht mit steigendem ℰ nur wenig von der Linearität ab (siehe Abb. 22.1). Unter diesen Umständen kann die Funktion, die 𝒫 mit ℰ verknüpft, in einer Taylorreihe um ℰ = 0 entwickelt werden, 1
1
2
6
𝒫 = 𝑎1 ℰ + 𝑎2 ℰ 2 + 𝑎3 ℰ 3 + … ,
(22.1)
und es genügt, nur einige Terme dieser Entwicklung zu berücksichtigen. Die Koeffizienten 𝑎1 , 𝑎2 und 𝑎3 sind die ersten, zweiten bzw. dritten Ableitungen von 𝒫 nach ℰ, berechnet bei ℰ = 0. Diese Koeffizienten sind charakteristische Konstanten des Mediums. Der erste, lineare, Term dominiert bei kleinen ℰ. Offensichtlich ist 𝑎1 = 𝜀0 𝜒, wobei 𝜒 die lineare Suszeptibilität ist, die mit der Dielektrizitätskonstante und dem Brechungsindex des Materials durch 𝑛2 = 𝜀∕𝜀0 = 1 + 𝜒 verknüpft ist [siehe Gl. (5.26)]. Der zweite Term bezeichnet eine quadratische Nichtlinearität (oder Nichtlinearität zweiter Ordnung), der dritte Term bezeichnet eine Nichtlinearität dritter Ordnung und so weiter. Es üblich, Gl. (22.1) in der Form 1) 𝒫 = 𝜀0 𝜒ℰ + 2dℰ 2 + 4𝜒 (3) ℰ 3 + ⋯ 1
(22.2) 1
zu schreiben, wobei d = 𝑎2 und 𝜒 (3) = 𝑎3 nichtli4 24 neare optische Koeffizienten sind, die die Stärke der nichtlinearen Effekte zweiter bzw. dritter Ordnung beschreiben. Gleichung (22.2) liefert die wesentliche mathematische Charakterisierung eines nichtlinearen optischen Mediums. Materialdispersion, Inhomogenität und Anisotropie sind hier einerseits aus Gründen der Einfachheit vernachlässigt, andererseits auch, um es uns zu erlauben, uns auf die wesentlichen Eigenschaften des nichtlinearen optischen Verhaltens zu konzentrieren. Die Abschnitte 22.6 und 22.7 sind anisotropen und dispersiven nichtlinearen Medien gewidmet. In zentrosymmetrischen Medien, die eine Inversionssymmetrie besitzen, deren Eigenschaften also durch die Transformation r → −r nicht verändert werden, muss die Beziehung zwischen 𝒫 und ℰ ungerade Symmetrie haben, sodass die Umkehrung von ℰ eine Umkehrung von 𝒫 ohne sonstige Veränderung nach sich zieht. Der nichtlineare Koeffizient d zweiter Ordnung muss dann verschwinden, und die Nichtlinearität niedrigster Ordnung ist folglich dritter Ordnung. Typische Werte des nichtlinearen Koeffizienten d zweiter Ordnung für dielektrische Kristalle, Halbleiter und organische Materialien in der Photonik liegen im Bereich d = 10−24 –10−21 C∕V2 . Typische Werte des nichtlinearen Koeffizienten 𝜒 (3) dritter Ordnung für Gläser, Kristalle, Halbleiter, halbleiterdotierte Gläser und organische Materialien in der Photonik liegen im Bereich 𝜒 (3) = 10−34 −10−29 C m∕V3 . Asymmetrische Quantenschichten oder Quantenschichten mit einer angelegten Spannung besitzen große Nichtlinearitäten im mittleren und fernen Infrarot. 1) Auch die alternative Beziehung 𝒫 = 𝜀0 (𝜒ℰ + 𝜒 (2) ℰ 2 + 𝜒 (3) ℰ 3 ) wird häufig verwendet.
761
762
22 Nichtlineare Optik
Übung 22-1: Die zur Erzeugung nichtlinearer Effekte erforderliche Lichtintensität
(a) Bestimmen Sie die Lichtintensität (in W∕cm2 ), bei der das Verhältnis des zweiten zum ersten Term in Gl. (22.2) in einem ADP-Kristall (NH4 H2 PO4 ) 1 % beträgt. Es gilt 𝑛 = 1.5 und d = 6.8 × 10−24 C∕V2 bei 𝜆0 = 1.06 μm. (b) Bestimmen Sie die Lichtintensität, bei der der dritte Term in Gl. (22.2) für Kohlenstoffdisulfid (CS2 ) 1 % des ersten Terms beträgt. Es gilt 𝑛 = 1.6, d = 0 und 𝜒 (3) = 4.4 × 10−32 C m∕V3 bei 𝜆0 = 694 nm. Hinweis: Nach Gl. (5.70) ist die Lichtintensität 𝐼 = |ℰ0 |2 ∕2𝜂 = ⟨ℰ 2 ⟩∕𝜂, wobei 𝜂 = 𝜂0 ∕𝑛 die Impedanz des Mediums ist und 𝜂0 = (𝜇0 ∕𝜀0 )1∕2 ≈ 377 Ω die Impedanz des Vakuums (siehe Abschnitt 5.4).
22.1.1
Die nichtlineare Wellengleichung
Die Ausbreitung des Lichts in einem nichtlinearen Medium wird durch die Wellengleichung (5.40) bestimmt, die wir für ein beliebiges homogenes, isotropes dielektrisches Medium aus den maxwellschen Gleichungen abgeleitet hatten. Die Isotropie des Mediums stellt sicher, dass die Vektoren 𝓟 und 𝓔 immer parallel sind, sodass sie Komponente für Komponente untersucht werden können; das liefert ∇2 ℰ −
𝜕2 𝒫 1 𝜕2 ℰ = 𝜇 . 0 𝜕𝑡2 𝑐02 𝜕𝑡2
(22.3)
Es ist zweckmäßig, die Polarisation in Gl. (22.2) als eine Summe linearer (𝜀0 𝜒ℰ) und nichtlinearer (𝒫nl ) Anteile zu schreiben, 𝒫 = 𝜀0 𝜒ℰ + 𝒫nl , (3)
(22.4)
𝒫nl = 2dℰ + 4𝜒 ℰ + … . 2
3
(22.5)
Mithilfe von Gl. (22.4) und den Beziehungen 𝑐 = 𝑐0 ∕𝑛, 𝑛2 = 1 + 𝜒 und 𝑐0 = 1∕(𝜀0 𝜇0 )1∕2 aus den Gln. (5.26) und (5.27) können wir Gl. (22.3) in der Form 1 𝜕2 ℰ = −𝒮 , 𝑐2 𝜕𝑡2 2 𝜕 𝒫nl 𝒮 = −𝜇0 𝜕𝑡2 ∇2 ℰ −
(22.6) (22.7)
schreiben. Es ist zweckmäßig, Gl. (22.6) als Wellengleichung aufzufassen, in der der Term 𝒮 eine Quelle beschreibt, die in einem linearen Medium mit dem Brechungsindex 𝑛 emittiert. Weil 𝒫nl (und daher 𝒮) eine nichtlineare Funktion von ℰ ist, ist Gl. (22.6) eine nichtlineare partielle Differentialgleichung in ℰ. Dies ist die grundlegende Gleichung hinter der Theorie der nichtlinearen Optik.
Zur Lösung dieser nichtlinearen Wellengleichung können wir zwei Näherungsansätze verwenden. Der erste ist ein iterativer Ansatz, der als bornsche Näherung bekannt ist. Er ist die Grundlage der vereinfachten Einführung in die nichtlineare Optik in den Abschnitten 22.2 und 22.3. Der zweite Ansatz ist eine Theorie gekoppelter Wellen, in der die nichtlineare Wellengleichung verwendet wird, um lineare gekoppelte partielle Differentialgleichungen für die wechselwirkenden Wellen herzuleiten. Auf dieser Grundlage erfolgt die fortgeschrittenere Untersuchung von Wellenwechselwirkungen in nichtlinearen Medien, die wir in den Abschnitten 22.4 und 22.5 vorstellen. Streutheorie der nichtlinearen Optik: Die bornsche Näherung
Die Strahlungsquelle 𝒮 in Gl. (22.6) ist eine Funktion des Feldes ℰ, das sie selbst emittiert. Um diesen Punkt zu betonen, schreiben wir 𝒮 = 𝒮(ℰ) und veranschaulichen den Prozess durch das einfache Blockdiagramm in Abb. 22.2. Wir nehmen an, dass ein optisches Feld ℰ0 auf ein nichtlineares Medium trifft, das wie in der Abbildung auf ein Volumen eingegrenzt ist. Dieses Feld erzeugt eine Strahlungsquelle 𝒮(ℰ0 ), die ein optisches Feld ℰ1 emittiert. Die entsprechende Strahlungsquelle 𝒮(ℰ1 ) emittiert ein Feld ℰ2 und so weiter. Dieser Prozess legt sofort eine iterative Lösung nahe, deren erster Schritt als die erste bornsche Näherung bekannt ist. Die zweite bornsche Näherung führt den Prozess eine Stufe weiter usw. Die erste bornsche Näherung ist angemessen, wenn die Lichtintensität so gering ist, dass die Nichtlinearität klein ist. In dieser Näherung wird die Lichtausbreitung durch das nichtlineare Medium als Streuprozess betrachtet, in dem das einfallende Feld durch das Medium gestreut wird. Das gestreute Licht wird in zwei Schritten aus dem einfallenden Licht bestimmt: 1) Das einfallende Feld ℰ0 wird verwendet, um die nichtlineare Polarisation 𝒫nl zu bestimmen, aus der sich die Strahlungsquelle 𝒮(ℰ0 ) ergibt. 2) Das emittierte (gestreute) Feld ℰ1 wird aus der Strahlungsquelle bestimmt, indem man die Kugelwellen von den unterschiedlichen Quellpunkten aufsummiert (wie in der Theorie der Beugung in Abschnitt 4.3 besprochen). Die Ausführungen in den Abschnitten 22.2 und 22.3 beruhen auf der ersten bornschen Näherung. Es wird angenommen, dass das anfängliche Feld ℰ0 eine oder mehrere monochromatische Wellen unterschiedlicher Frequenzen enthält. Die entsprechende nichtlineare Polarisation 𝒫nl wird dann aus Gl. (22.5) bestimmt, und die Quellfunktion 𝒮(ℰ0 ) wird aus Gl. (22.7) berech-
22.2 Nichtlineare Optik zweiter Ordnung
einfallendes Licht ℰ0
abgestrahltes Licht ℰ1 𝒮
Strahlungsquelle 𝒮(ℰ0)
ℰ
Strahlung
Abb. 22.2 Die erste bornsche Näherung. Ein einfallendes optisches Feld ℰ0 erzeugt eine Quelle 𝒮(ℰ0 ), die ein optisches Feld ℰ1 ausstrahlt.
𝒮(ℰ)
nichtlineares Medium
net. Da 𝒮(ℰ0 ) eine nichtlineare Funktion ist, werden neue Frequenzen erzeugt. Die Quelle emittiert daher ein optisches Feld ℰ1 mit Frequenzen, die nicht in der ursprünglichen Welle ℰ0 enthalten waren. Das führt zu zahlreichen interessanten Phänomenen, die ausgenutzt werden können, um nützliche nichtlineare optische Bauelemente herzustellen.
Amplitude 𝐸(𝜔), ℰ(𝑡) = Re{𝐸(𝜔) exp(i𝜔𝑡)} 1
= [𝐸(𝜔) exp(i𝜔𝑡) + 𝐸 ∗ (𝜔) exp(−i𝜔𝑡)] . 2
Die entsprechende nichtlineare Polarisation 𝒫nl erhalten wir, indem wir Gl. (22.9) in Gl. (22.8) einsetzen, 𝒫nl (𝑡) = 𝑃nl (0) + Re{𝑃nl (2𝜔) exp(i2𝜔𝑡)}
22.2 Nichtlineare Optik zweiter Ordnung
(22.8)
Ein Material, für das Gl. (22.8) gilt, wird nichtlineares Medium zweiter Ordnung genannt. Wir betrachten im Folgenden ein elektrisches Feld ℰ, das aus einer oder zwei harmonischen Komponenten besteht, und bestimmen die spektralen Komponenten von 𝒫nl . Nach der ersten bornschen Näherung enthält die Strahlungsquelle 𝒮 dieselben spektralen Komponenten wie 𝒫nl , und folglich gilt dasselbe auch für das emittierte (gestreute) Feld.
22.2.1 Frequenzverdopplung und Gleichrichtung Wir betrachten die Reaktion dieses nichtlinearen Mediums auf ein harmonisches elektrisches Feld der Kreisfrequenz 𝜔 (Wellenlänge 𝜆0 = 2π 𝑐0 ∕𝜔) und komplexen 𝒫
t
𝑃nl (0) = d 𝐸(𝜔)𝐸 ∗ (𝜔) , 𝑃nl (2𝜔) = d 𝐸 2 (𝜔) .
(22.11) (22.12)
Dieser Prozess ist in Abb. 22.3 graphisch dargestellt. Frequenzverdopplung
𝒫nl = 2dℰ 2 .
Die Quelle 𝒮(𝑡) = −𝜇0 𝜕 2 𝒫nl ∕𝜕𝑡2 gemäß Gl. (22.10) besitzt offensichtlich eine Komponente bei der Frequenz 2𝜔 mit der komplexen Amplitude 𝑆(2𝜔) = 4𝜇0 𝜔2 d𝐸(𝜔)𝐸(𝜔), die ein optisches Feld der Frequenz 2𝜔 (Wellenlänge 𝜆0 ∕2) emittiert. Folglich besitzt das gestreute optische Feld eine Komponente bei der doppelten Frequenz (der „zweiten Harmonischen“) des einfallenden optischen Feldes. Da die Amplitude der emittierten doppelten Frequenz proportional zu 𝑆(2𝜔) ist, ist ihre Intensität 𝐼(2𝜔) proportional zu |𝑆(2𝜔)|2 , also zum Quadrat der Intensität 𝐼(𝜔) = |𝐸(𝜔)|2 ∕2𝜂 der einfallenden Welle und zum Quadrat des nichtlinearen Koeffizienten d. Da sich die Emissionen kohärent addieren, ist die Intensität der frequenzverdoppelten Welle proportional zum Quadrat der Länge 𝐿 des Wechselwirkungsbereichs.
𝒫nl(t)
ℰ(t)
(22.10)
mit
In diesem Abschnitt untersuchen wir die optischen Eigenschaften eines nichtlinearen Mediums, in dem Nichtlinearitäten höherer Ordnung als der zweiten vernachlässigbar sind; in diesem Fall gilt
0
(22.9)
ℰ
t
=
t Gleichstrom
+
t zweite Harmonische
Abb. 22.3 Ein sinusförmiges elektrisches Feld der Kreisfrequenz 𝜔 in einem nichtlinearen optischen Medium zweiter Ordnung erzeugt eine Polarisation mit einer Komponente bei 2𝜔 (die „zweite Harmonische“) und einer statischen (Gleichstrom-) Komponente.
763
764
22 Nichtlineare Optik
L
(a)
L
L
(b)
(c)
Der Wirkungsgrad 𝜂FV = 𝐼(2𝜔)∕𝐼(𝜔) der Frequenzverdopplung ist daher proportional zu 𝐿2 𝐼(𝜔). Da 𝐼(𝜔) = P ∕A ist, wobei P die einfallende Leistung ist und A die Querschnittsfläche des Wechselwirkungsvolumens, wird der Wirkungsgrad der Frequenzverdopplung häufig in der Form 𝜂FV = 𝐶 2
𝐿2 A
(22.13)
P
ausgedrückt, wobei 𝐶 2 eine Konstante (mit der Einheit 2 W−1 ) ist, die proportional zu d und 𝜔2 ist. Ein Ausdruck für 𝐶 2 wird in Gl. (22.109) angegeben. Um den Wirkungsgrad der Frequenzverdopplung zu maximieren, ist es nach Gl. (22.13) notwendig, dass die einfallende Welle eine möglichst große Leistung P hat. Das wird durch Verwendung gepulster Laser erreicht, deren Energie zeitlich konzentriert ist, sodass sie große Leistungsspitzen liefern. Um das Verhältnis 𝐿2 ∕A zu maximieren, muss die Welle außerdem auf die kleinstmögliche Fläche A fokussiert werden und die größtmögliche Wechselwirkungslänge 𝐿 erlauben. Für einen dünnen Kristall wird 𝐿 durch die Länge des Kristalls bestimmt, und der Strahl sollte auf den kleinsten möglichen Brennfleck A eingestellt werden [siehe Abb. 22.4(a)]. Wenn die Dimensionen des nichtlinearen Kristalls keine limitierenden Faktoren sind, wird der maximale Wert von 𝐿 für eine gegebene Fläche A durch die Strahlbeugung begrenzt. Beispielsweise behält ein auf einen Strahlradius 𝑊0 fokussierter Gaußstrahl eine Querschnittsfläche A = π𝑊02 des Strahls über eine Schärfentiefe 𝐿 = 2𝑧0 = 2π 𝑊02 ∕𝜆 [siehe Gl. (3.22)], sodass das Verhältnis
(a)
Rubinlaser
Abb. 22.4 Wechselwirkungsvolumen für die Frequenzverdopplung in einem (a) dünnen Kristall, (b) dicken Kristall und (c) Wellenleiter.
𝐿2 ∕A = 2𝐿∕𝜆 = 4A∕𝜆 2 wird. Der Strahl sollte dann auf den größtmöglichen Brennfleck entsprechend der größten Schärfentiefe fokussiert werden; in diesem Fall ist der Wirkungsgrad proportional zu 𝐿. Für einen dicken Kristall sollte der Strahl auf den größten Brennfleck fokussiert werden, der gerade noch in die Querschnittsfläche des Kristalls passt [siehe Abb. 22.4(b)]. Strukturen mit Wellenleitung bieten den Vorteil der Lichteingrenzung in einer kleinen Querschnittsfläche über große Entfernungen [siehe Abb. 22.4(c)]. Da A durch die Ausdehnung der geführten Mode bestimmt ist, ist der Wirkungsgrad proportional zu 𝐿2 . Optische Wellenleiter gibt es als ebene oder Kanalwellenleiter (Kapitel 9) oder als Fasern (Kapitel 10). Obwohl Quarzglasfasern zunächst als ungeeignet für die Frequenzverdopplung angesehen wurden, weil Glas zentrosymmetrisch ist (und daher vermutlich d = 0 ist), ist Frequenzverdopplung trotzdem auch in Quarzglasfasern möglich; elektrische Quadrupol- und magnetische Dipolwechselwirkungen sowie Farbzentren im Faserkern machen es möglich. Abbildung 22.5 zeigt mehrere Anordnungen für die optische Frequenzverdopplung in Vollmaterialien und Wellenleitern; dabei wird Infrarot- in sichtbares Licht oder sichtbares in UV-Licht umgewandelt. Optische Gleichrichtung
Der Anteil 𝑃nl (0) in Gl. (22.10) entspricht einer statischen (zeitlich nicht variierenden) Polarisation, die eine konstante Potentialdifferenz (Gleichspannung) über die Platten eines Kondensators erzeugt, innerhalb des-
ω
2ω 347 nm (UV)
694 nm (rot) KDP-Kristall
(b)
Nd3+:YAG-Laser
ω
1.06 µm (IR)
2ω Ge- und P-dotierte Quarzglasfaser
530 nm (grün)
ω (c)
790 nm (IR)
2ω 395 nm (violett) AlGaAs-Laser
Abb. 22.5 Optische Frequenzverdopplung (a) in einem Volumenkristall, (b) in einer dotierten Quarzglasfaser und (c) im Resonator einer Laserdiode.
22.2 Nichtlineare Optik zweiter Ordnung
mit
Licht
𝑃nl (0) = d[2𝐸 2 (0) + |𝐸(𝜔)|2 ] ,
(22.16a)
𝑃nl (𝜔) = 4d 𝐸(0)𝐸(𝜔) ,
(22.16b)
𝑃nl (2𝜔) = d 𝐸 (𝜔) , 2
Abb. 22.6 Der Durchgang eines intensiven Lichtstrahls durch einen nichtlinearen Kristall erzeugt eine Gleichspannung.
sen sich das nichtlineare Material befindet (Abb. 22.6). Die Erzeugung einer Gleichspannung infolge eines intensiven optischen Feldes wird als optische Gleichrichtung bezeichnet (analog zur Konversion einer sinusförmigen Wechselspannung in eine Gleichspannung in einem gewöhnlichen elektronischen Gleichrichter). Ein optischer Puls mit einer Leistungsspitze von einigen Megawatt kann z. B. eine Spannung von mehreren hundert μV erzeugen.
22.2.2 Der elektrooptische Effekt Wir betrachten jetzt ein elektrisches Feld ℰ(𝑡), das aus einer harmonischen Komponente bei einer optischen Frequenz 𝜔 und einer statischen Komponente (bei 𝜔 = 0) besteht, ℰ(𝑡) = 𝐸(0) + Re{𝐸(𝜔) exp(i𝜔𝑡)} .
(22.14)
Wir unterscheiden diese beiden Komponenten, indem wir das elektrische Feld mit 𝐸(0) und das optische Feld mit 𝐸(𝜔) bezeichnen. (Natürlich handelt es sich bei beiden um elektrische Felder.) Wenn wir Gl. (22.14) in Gl. (22.8) einsetzen, erhalten wir 𝒫nl (𝑡) = 𝑃nl (0) + Re{𝑃nl (𝜔) exp(i𝜔𝑡)}
(22.15)
+ Re{𝑃nl (2𝜔) exp(i2𝜔𝑡)}
d. h. die Polarisation enthält Komponenten bei den Kreisfrequenzen 0, 𝜔 und 2𝜔. Wenn die optische Feldstärke wesentlich kleiner als die elektrische ist, d. h. |𝐸(𝜔)|2 ≪ |𝐸(0)|2 gilt, kann die Komponente 𝑃nl (2𝜔) der Polarisation gegen die Komponenten 𝑃nl (0) und 𝑃nl (𝜔) vernachlässigt werden. Das ist äquivalent zu einer Linearisierung von 𝒫nl als Funktion von ℰ, d. h. wir verwenden eine Gerade mit einer Steigung gleich der Ableitung bei ℰ = 𝐸(0) als Näherung, wie in Abb. 22.7 dargestellt. Gleichung (22.16b) liefert eine lineare Beziehung zwischen 𝑃nl (𝜔) und 𝐸(𝜔), die wir in der Form 𝑃nl (𝜔) = 𝜀0 Δ𝜒𝐸(𝜔) schreiben, wobei Δ𝜒 = (4d∕𝜀0 )𝐸(0) eine Zunahme der Suszeptibilität proportional zum elektrischen Feld 𝐸(0) bezeichnet. Die infinitesimale Änderung des Brechungsindex erhalten wir durch Ableitung der Beziehung 𝑛2 = 1 + 𝜒; aus dem Resultat 2𝑛 Δ𝑛 = Δ𝜒 folgt Δ𝑛 =
2d 𝐸(0) . 𝑛𝜀0
+
t ℰ(0) ℰ
E(ω) E (0)
– t
(22.17)
Das Medium ist dann effektiv linear mit einem Brechungsindex 𝑛 + Δ𝑛, der linear von dem elektrischen Feld 𝐸(0) kontrolliert wird. Die nichtlineare Natur des Mediums bewirkt eine Kopplung zwischen dem elektrischen Feld 𝐸(0) und dem optischen Feld 𝐸(𝜔), sodass das eine das andere kontrolliert und das nichtlineare Medium einen linearen elektrooptischen Effekt (Pockelseffekt) zeigt wie in Kapitel 21 besprochen. Dieser Effekt wird durch die Be1 ziehung Δ𝑛 = − 𝑛3 r𝐸(0) charakterisiert, wobei r der 2 Pockelskoeffizient ist. Durch Vergleich dieser Gleichung mit Gl. (22.17) erkennen wir, dass der Pockelskoeffizient r mit dem nichtlinearen Koeffizienten dzweiter Ord-
𝒫nl 𝒫nl (0)
(22.16c)
Abb. 22.7 Linearisierung der nichtlinearen Beziehung 𝒫nl = 2dℰ 2 zweiter Ordnung in Gegenwart eines starken elektrischen Feldes E (0) und eines schwachen optischen Feldes E (𝜔).
765
766
22 Nichtlineare Optik
nung gemäß r≈−
4 d 𝜀0 𝑛4
(22.18)
verknüpft ist. Obwohl dieser Ausdruck den gemeinsamen Ursprung des Pockelseffekts und der Nichtlinearität des Mediums offenbart, steht er nicht mit experimentell beobachteten Werten von r und d im Einklang. Der Grund dafür ist, dass wir implizit angenommen haben, dass das Medium nichtdispersiv ist (d. h. dass seine Reaktion nicht von der Frequenz abhängt). Diese Annahme ist offensichtlich nicht erfüllt, wenn eine der Komponenten des Feldes die optische Frequenz 𝜔 hat und die andere ein statisches Feld mit einer Frequenz von null ist. Die Rolle der Dispersion wird in Abschnitt 22.7 besprochen.
1.06 μm und 𝜆02 = 10.6 μm tritt in einen Proustitkristall ein und erzeugt eine dritte Welle mit der Wellenlänge −1 −1 −1 𝜆03 = 0.96 μm (mit 𝜆03 = 𝜆01 + 𝜆02 ). Obwohl das einfallende Paar von Wellen der Frequenzen 𝜔1 und 𝜔2 grundsätzlich Polarisationen bei Frequenzen 0, 2𝜔1 , 2𝜔2 , 𝜔1 + 𝜔2 und 𝜔1 − 𝜔2 erzeugen kann, entstehen nicht unbedingt alle diese Wellen tatsächlich, da bestimmte zusätzliche Bedingungen (Phasenanpassung) erfüllt sein müssen, wie im Folgenden erklärt wird. Frequenz- und Phasenabgleich
Wenn die Wellen 1 und 2 ebene Wellen mit den Wellenvektoren k1 und k2 sind, also 𝐸(𝜔1 ) = 𝐴1 exp(−ik1 ⋅ r) und 𝐸(𝜔2 ) = 𝐴2 exp(−ik2 ⋅ r), dann ist nach Gl. (22.20d) 𝑃nl (𝜔3 ) = 2d𝐸(𝜔1 )𝐸(𝜔2 ) = 2d𝐴1 𝐴2 exp(−ik3 ⋅ r) mit 𝜔1 + 𝜔2 = 𝜔3
22.2.3
Dreiwellenmischung
und
Wir betrachten jetzt den Fall eines Feldes ℰ(𝑡) aus zwei harmonischen Komponenten mit den optischen Frequenzen 𝜔1 und 𝜔2 , ℰ(𝑡) = Re{𝐸(𝜔1 ) exp(i𝜔1 𝑡) + 𝐸(𝜔2 ) exp(i𝜔2 𝑡)} . (22.19) Die nichtlineare Komponente der Polarisation, 𝒫nl = 2dℰ 2 , enthält dann Komponenten bei den fünf Frequenzen 0, 2𝜔1 , 2𝜔2 , 𝜔+ = 𝜔1 + 𝜔2 und 𝜔− = 𝜔1 − 𝜔2 mit den Amplituden [ ] 𝑃nl (0) = d |𝐸(𝜔1 )|2 + |𝐸(𝜔2 )|2 ,
(22.20a)
𝑃nl (2𝜔1 ) = d𝐸(𝜔1 )𝐸(𝜔1 ) ,
(22.20b)
𝑃nl (2𝜔2 ) = d𝐸(𝜔2 )𝐸(𝜔2 ) ,
(22.20c)
𝑃nl (𝜔+ ) = 2d𝐸(𝜔1 )𝐸(𝜔2 ) , ∗
𝑃nl (𝜔− ) = 2d𝐸(𝜔1 )𝐸 (𝜔2 ) .
(22.20d)
ω1
ω2
10.6 µm
k2 k3
k3 k1
k2
k1
Abb. 22.9 Die Phasenbedingung.
0.96 µm Proustitkristall
(22.22)
Das Medium wirkt daher wie eine Lichtquelle der Frequenz 𝜔3 = 𝜔1 + 𝜔2 mit einer komplexen Amplitude proportional zu exp(−ik3 ⋅ r), die eine Welle mit dem Wellenvektor k3 = k1 + k2 emittiert, wie in Abb. 22.9 dargestellt. Gleichung (22.22) kann als Phasenbedingung für die Wellenfronten der drei Wellen angesehen werden, analog der Frequenzbedingung 𝜔1 + 𝜔2 = 𝜔3 . Da das Argument der komplexen Wellenfunktion 𝜔𝑡 − k ⋅ r ist, sichern diese beiden Bedingungen sowohl den zeitlichen als auch den räumlichen Phasenabgleich der drei Wellen, der für ihre anhaltende gegenseitige Wechselwirkung über ausgedehnte Bereiche in Raum und Zeit notwendig ist.
ω3 = ω1 + ω2
1.06 µm
CO2-Laser
k1 + k2 = k3 .
(22.20e)
(Die räumlichen Eigenschaften dieser Wellen werden wir in Kürze untersuchen.) Ein nichtlineares Medium zweiter Ordnung kann daher verwendet werden, um zwei optische Wellen unterschiedlicher Frequenzen zu mischen und (unter anderem) eine dritte Welle mit der Differenz- oder der Summenfrequenz zu erzeugen. Ein Beispiel für die Erzeugung der Summenfrequenz ist in Abb. 22.8 gezeigt: Licht aus zwei Lasern mit den Vakuumwellenlängen 𝜆01 =
Nd3+:YAG-Laser
(22.21)
Abb. 22.8 Ein Beispiel für die Erzeugung der Summenfrequenz in einem nichtlinearen Kristall.
22.2 Nichtlineare Optik zweiter Ordnung
auftreten, je nachdem welche der drei Wellen als Eingabe geliefert und welche als Ausgang entnommen wird, wie die folgenden Beispiele zeigen sollen (siehe Abb. 22.10).
Realisierungen der Dreiwellenmischung
Wenn sich zwei optische Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 durch ein nichtlineares optisches Medium zweiter Ordnung ausbreiten, mischen sie und produzieren eine Polarisation mit Komponenten bei mehreren Frequenzen. Wir nehmen an, dass nur die Komponente bei der Summenfrequenz 𝜔3 = 𝜔1 + 𝜔2 die Phasenbedingung erfüllt. Andere Frequenzen sind in dem Medium nicht erlaubt, da sie nach der Annahme die Phasenbedingung nicht erfüllen. Sobald Welle 3 entstanden ist, wechselwirkt sie mit Welle 1 und erzeugt eine Welle bei der Differenzfrequenz 𝜔2 = 𝜔3 − 𝜔1 . Offensichtlich ist die Phasenbedingung für diese Wechselwirkung ebenfalls erfüllt. Die Wellen 3 und 2 wechselwirken ähnlich und emittieren bei 𝜔1 . Die drei Wellen werden daher miteinander gekoppelt, indem jedes Paar von Wellen wechselwirkt und zur dritten Welle beiträgt. Dieser Prozess wird als Dreiwellenmischung bezeichnet. Zweiwellenmischung ist im Allgemeinen nicht möglich. Zwei Wellen mit beliebigen Frequenzen 𝜔1 und 𝜔2 können nicht ohne die Hilfe einer dritten Welle durch das Medium gekoppelt werden. Zweiwellenmischung kann daher nur im entarteten Fall 𝜔2 = 2𝜔1 auftreten, wobei die zweite Harmonische von Welle 1 zu Welle 2 beiträgt und die Subharmonische 𝜔2 ∕2 von Welle 2, die bei der Differenzfrequenz 𝜔2 − 𝜔1 liegt, zu Welle 1. Die Dreiwellenmischung ist eine parametrische Wechselwirkung. Sie kann in zahlreichen Varianten
Die Wellen 1 und 2 werden in einem Summenwandler gemischt, der eine Welle bei der Summenfrequenz 𝜔3 = 𝜔1 + 𝜔2 erzeugt. Dieser Prozess, der auch Erzeugung der Summenfrequenz oder Aufwärtskonvertierung genannt wird, wurde bereits in Abb. 22.8 illustriert. Die Frequenzverdopplung ist nur ein entarteter Sonderfall der optischen Frequenzkonversion. Der entgegengesetzte Prozess, die Erzeugung der Differenzfrequenz (oder Abwärtskonvertierung) kann durch Wechselwirkung der Wellen 3 und 1 realisiert werden, wobei Welle 2 bei der Differenzfrequenz 𝜔2 = 𝜔3 − 𝜔1 entsteht. Summen- und Differenzwandler werden verwendet, um kohärentes Licht bei Wellenlängen zu erzeugen, für die keine entsprechenden Laser verfügbar sind, sowie als optische Mischer in optischen Nachrichtensystemen. Optischer parametrischer Verstärker (OPA). Hier wechselwirken die Wellen 1 und 3 und verstärken Welle 1, wobei als Nebenprodukt eine Hilfswelle 2 entsteht. Das Bauelement arbeitet als kohärenter Verstärker bei der Frequenz 𝜔1 . Welle 3, die Pumpwelle, liefert die erforderliche Energie, während Welle 2 als Idlerwelle bezeichnet wird. Die verstärkte Welle wird SiOptische Frequenzkonversion (OFC).
Filter
OFC
OPA
Summenfrequenzsignal ω3 = ω1 + ω2
Signal ω1
Pumpe ω2 Idler ω2
Signal ω1
verstärktes Signal ω1
Pumpe ω3 ω 1, ω 2
Pumpe ω3
ω1
OPO Spiegel
Spiegel
ω1
SPDC
Pumpe ω3 Kristall
Abb. 22.10 Optische parametrische Bauelemente: optischer Frequenzwandler (OFC, von engl. optical frequency converter); optischer parametrischer Verstärker (OPA, von engl. optical parametric amplifier); optischer parametrischer Oszillator (OPO, von engl. optical parametric oscillator); spontaner para-
ω2
metrischer Differenzfrequenzerzeuger (SPDC, von engl. spontaneous parametric downconverter). Häufig dienen Faserlaser, Laserdioden, Quantenkaskadenlaser oder diodengepumpte Festkörperlaser als Pumpen für optische parametrische Bauelemente.
767
768
22 Nichtlineare Optik
gnal genannt. Offensichtlich hängt der Gewinn des Verstärkers von der Leistung der Pumpe ab. Parametrische Verstärker werden für die Detektion von schwachem Licht bei Wellenlängen verwendet, für die keine empfindlichen Detektoren verfügbar sind. Optischer parametrischer Oszillator (OPO). Mit der richtigen Rückkopplung kann ein parametrischer Verstärker als parametrischer Oszillator arbeiten, in den nur eine Pumpwelle eingespeist wird. Parametrische Oszillatoren werden für die Erzeugung von kohärentem Licht und modengekoppelten Pulsfolgen über einen kontinuierlichen Bereich von Frequenzen in Frequenzbändern verwendet, in denen es nur wenige abstimmbare Laserquellen gibt. Spontane parametrische Differenzfrequenzerzeugung (SPDC). Hier ist die einzige Eingabe in den nichtli-
nearen Kristall die Pumpwelle 3; und die Erzeugung der niederfrequenteren Wellen 1 und 2 erfolgt spontan. Die Frequenz- und Phasenbedingungen (22.21) und (22.22) führen zu mehreren Lösungen, jeweils für ein Paar von Wellen 1 und 2 mit spezifischen Frequenzen und Richtungen. Das umgewandelte Licht wird als Kegel aus multichromatischem Licht emittiert, wie Abb. 22.10 illustriert. Weitere Details zu diesen parametrischen Bauelementen werden in Abschnitt 22.4 besprochen. Wellenmischung als Photonenwechselwirkung
Die Dreiwellenmischung kann aus einem photonischen Blickwinkel auch als Dreiphotonenwechselwirkung angesehen werden, bei der zwei Photonen mit den kleineren Frequenzen 𝜔1 und 𝜔2 vernichtet werden und ein Photon der größeren Frequenz 𝜔3 erzeugt wird, wie Abb. 22.11(a) illustriert. Bei der Differenzfrequenzerzeugung wird die Vernichtung eines Photons der großen Frequenz 𝜔3 von der Erzeugung von zwei Photonen der kleineren Frequenzen 𝜔1 und 𝜔2 begleitet, wie Abb. 22.11(b) zeigt. Da ℏ𝜔 und ℏk die Energie und der Impuls eines Photons mit der Frequenz 𝜔 und dem Wel-
ℏω1 ℏω3
(a)
ℏ𝜔1 + ℏ𝜔2 = ℏ𝜔3 ,
(22.23)
ℏk1 + ℏk2 = ℏk3 ,
(22.24)
wobei k1 , k2 und k3 die Wellenvektoren der drei Photonen sind. Somit haben wir wieder die Frequenz- und Phasenbedingungen aus den Gln. (22.21) und (22.22) erhalten. Das Energiediagramm der Dreiphotonenwechselwirkung in Abb. 22.11(b) ähnelt dem des optisch gepumpten Dreiniveaulasers aus Abb. 22.11(c) (siehe Abschnitt 15.2.2). Es gibt jedoch einige wichtige Unterschiede zwischen den beiden Prozessen: • Einer der drei an dem Laserprozess beteiligten Übergänge ist nichtstrahlend. • Im Laserprozess findet ein Austausch von Energie zwischen dem Feld und dem Medium statt. • Die an dem Laserprozess beteiligten Energieniveaus sind relativ scharf und hängen mit den Atomen oder Molekülen des Systems zusammen, wohingegen die Energieniveaus des parametrischen Prozesses durch die Energie- und Phasenbedingungen der Photonen diktiert werden und über große Spektralbereiche abstimmbar sind. Bei der Wellenmischung wird Energie zwischen den wechselwirkenden Wellen ausgetauscht. Natürlich muss die Energie erhalten bleiben, was durch die Frequenzbedingung 𝜔1 + 𝜔2 = 𝜔3 sichergestellt wird. Auch die Photonenzahlen müssen entsprechend der zugrunde liegenden Photonenwechselwirkung erhalten bleiben. Wir betrachten dazu den Prozess der Photonenaufspaltung aus Abb. 22.11(b). Wenn Δ𝛷1 , Δ𝛷2 und Δ𝛷3 die Nettoänderungen der Photonenflüsse während der Wechselwirkung (jeweils Fluss der eintretenden minus Fluss der austretenden Photonen) bei den Frequenzen 𝜔1 , 𝜔2 und 𝜔3 sind, dann ist Δ𝛷1 = Δ𝛷2 = −Δ𝛷3 , sodass
ℏω2
ℏω3 ℏω 3
ℏω3 ℏω 1
ℏω 2
ℏω 1
ℏω 2
lenvektor k sind (siehe Abschnitt 13.1), erfordern die Erhaltung der Energie und des Impulses dabei
ℏω2
(b)
Abb. 22.11 Vergleich von parametrischen Prozessen in einem nichtlinearen Medium zweiter Ordnung mit dem Laserprozess. (a) Vernichtung zweier niederfrequenter Photonen und Erzeugung eines höherfrequenten Photons. Die gestrichelte Linie für das obere Niveau zeigt an, dass es sich um
ℏω1
nichtstrahl. Übergang
Pumpe
ℏω3
ℏω1
Laserübergang
(c)
ein virtuelles Niveau handelt. (b) Vernichtung eines hochfrequenten Photons und Erzeugung zweier niederfrequenter Photonen. (c) Optisch gepumpter Dreiniveaulaser, ein nichtparametrischer Prozess, in dem Energie mit dem Medium ausgetauscht wird.
22.2 Nichtlineare Optik zweiter Ordnung
für jedes vernichtete Photon der Frequenz 𝜔3 je ein Photon der Frequenzen 𝜔1 und 𝜔2 erzeugt wird. Wenn sich die drei Wellen in derselben Richtung ausbreiten, beispielsweise in 𝑧-Richtung, dann finden wir, wenn wir einen Zylinder mit Einheitsfläche und der infinitesimalen Länge Δ𝑧 → 0 als Wechselwirkungsvolumen betrachten, dass die Photonenflussdichten 𝜙1 , 𝜙2 und 𝜙3 [Photonen/(s m2 )] der drei Wellen die Beziehungen d𝜙1 d𝜙2 d𝜙3 = =− d𝑧 d𝑧 d𝑧
(22.25)
erfüllen müssen. Da die Intensitäten der Wellen (in W∕m2 ) 𝐼1 = ℏ𝜔1 𝜙1 , 𝐼2 = ℏ𝜔2 𝜙2 und 𝐼3 = ℏ𝜔3 𝜙3 sind, liefert Gl. (22.25) d 𝐼1 d 𝐼2 d 𝐼3 ( )= ( )=− ( ). d𝑧 𝜔1 d𝑧 𝜔2 d𝑧 𝜔3
(22.26)
Diese Beziehung ist als Manley-Rowe-Beziehung bekannt. Wir haben sie im Zusammenhang mit Wechselwirkungen von Wellen in nichtlinearen optischen Systemen hergeleitet, sie kann aber auch rein wellenoptisch ohne Bezug auf das Konzept des Photons hergeleitet werden (siehe Übung 22-7).
22.2.4 Phasenbedingung und Abstimmungskurven Phasenbedingung bei kollinearer Dreiwellenmischung
Wenn die drei Wellen kollinear sind, d. h. sich in derselben Richtung ausbreiten, und das Medium nichtdispersiv ist, dann liefert die Phasenbedingung Gl. (22.22) die skalare Gleichung 𝑛𝜔1 ∕𝑐0 + 𝑛𝜔2 ∕𝑐0 = 𝑛𝜔3 ∕𝑐0 , die automatisch erfüllt ist, wenn die Frequenzbedingung 𝜔1 + 𝜔2 = 𝜔3 erfüllt ist. Da aber in Wirklichkeit alle Materialien dispersiv sind, breiten sich die drei Wellen mit unterschiedlichen Geschwindigkeiten entsprechend unterschiedlichen Brechungsindizes 𝑛1 , 𝑛2 und 𝑛3 aus und die Frequenz – und Phasenbedingungen sind unabhängig, 𝜔1 + 𝜔2 = 𝜔3 ,
𝜔1 𝑛1 + 𝜔2 𝑛2 = 𝜔3 𝑛3 ,
(22.27)
müssen aber gleichzeitig erfüllt sein. Da das gewöhnlich nicht möglich ist, wird häufig die in anisotropen Medien vorhandene Doppelbrechung genutzt, um die Dispersion zu kompensieren. In einem anisotropen Medium hängen die drei Brechungsindizes 𝑛1 , 𝑛2 und 𝑛3 im Allgemeinen von der Polarisation der Wellen und ihren Richtungen bezüglich der Hauptachsen ab (siehe Abschnitt 6.3.3). Daraus entstehen zusätzliche Freiheitsgrade, um die Frequenzund Phasenbedingungen zu erfüllen. Eine präzise Kontrolle der Brechungsindizes bei den drei Frequenzen
wird häufig durch passende Auswahl der Polarisation, der Orientierung des Kristalls und in einigen Fällen durch Kontrolle der Temperatur erreicht. Für einen Wellenleiter sollte die Phasenbedingung Gl. (22.22) durch die Beziehung 𝛽1 + 𝛽2 = 𝛽3 ersetzt werden, die die Ausbreitungskonstanten der Wellenleitermoden bei den Wellenlängen der drei gemischten Wellen verknüpft. Diese Ausbreitungskonstanten hängen von den Brechungsindizes des Materials ab, aus dem der Wellenleiter besteht, sowie von der Polarisation (TE oder TM) der Wellen und der Geometrie und den Abmessungen des Wellenleiters (siehe Abschnitt 9.2.1). Diese zusätzlichen Freiheitsgrade eröffnen zusätzliche Wege, die Phasenbedingung zu erfüllen. In der Praxis ist das Medium häufig ein einachsiger Kristall, der durch seine optische Achse und die frequenzabhängigen ordentlichen und außerordentlichen Brechungsindizes 𝑛o (𝜔) und 𝑛e (𝜔) charakterisiert ist. Jede der drei Wellen kann ordentlich (o) oder außerordentlich (e) sein, und der Prozess wird entsprechend bezeichnet. Zum Beispiel zeigt die Bezeichnung e-o-e, dass die Wellen 1, 2 und 3 e-, o- bzw. e-Wellen sind. Für eine o-Welle ist 𝑛(𝜔) = 𝑛o (𝜔); für eine e-Welle hängt 𝑛(𝜔) = 𝑛(𝜃, 𝜔) vom Winkel 𝜃 zwischen der Richtung der Welle und der optischen Achse des Kristalls ab; es gilt 2
1 cos2 𝜃 sin 𝜃 + , = 𝑛2 (𝜃, 𝜔) 𝑛o2 (𝜔) 𝑛e2 (𝜔)
(22.28)
was graphisch durch eine Ellipse dargestellt wird [siehe Gl. (6.58) und Abb. 6.23]. Wenn die Polarisationen der Signal- und der Idlerwelle identisch sind, spricht man von Typ-I-Wellenmischung; wenn sie orthogonal sind, von Typ-II-Wellenmischung. Beispiel 22-1: Kollineare Typ-I-Frequenzverdopplung
Bei der Frequenzverdopplung haben die Wellen 1 und 2 dieselbe Frequenz (𝜔1 = 𝜔2 = 𝜔) und es gilt 𝜔3 = 2𝜔. Für die Typ-I-Mischung sind die Wellen 1 und 2 identisch polarisiert, es gilt also 𝑛1 = 𝑛2 . Nach Gl. (22.27) ist die Phasenbedingung folglich 𝑛3 = 𝑛1 , d. h. die Grundwelle hat denselben Brechungsindex wie die frequenzverdoppelte Welle. Wegen der Dispersion kann diese Bedingung gewöhnlich nicht erfüllt werden, es sei denn, dass die Polarisation der beiden Wellen unterschiedlich ist. Für einen einachsigen Kristall ist der Prozess dann entweder o-o-e oder e-e-o. In beiden Fällen wird die Richtung, aus der die Welle in den Kristall eintritt, so gewählt, dass 𝑛3 = 𝑛1 ist, d. h. dass die Doppelbrechung die Dispersion genau kompensiert. Für einen e-e-o-Prozess wie in Abb. 22.12 ist die Grundwelle außerordentlich und die frequenzverdoppelte Welle ordentlich, und es gilt 𝑛1 = 𝑛(𝜃, 𝜔) und
769
770
22 Nichtlineare Optik
optische Achse
no(2ω) ne no
2ω
θ
no(ω) ne(2ω)
θ ne(ω)
ω
o
e ω
2ω
(a)
(b)
(c)
Abb. 22.12 Phasenabgleich bei der e-e-o-Frequenzverdopplung. (a) Abgleich der Indizes der e-Welle bei 𝜔 und der o-Welle bei 2𝜔. (b) Indexflächen bei 𝜔 (durchgezogene Kurve) und 2𝜔 (gestrichelte Kurve) für einen einachsigen
𝑛3 = 𝑛o (2𝜔), sodass die Bedingung 𝑛(𝜃, 𝜔) = 𝑛o (2𝜔) ist. Damit diese Bedingung erfüllt ist, muss für den Winkel 𝜃 𝑛(𝜃, 𝜔) = 𝑛o (2𝜔)
(22.29)
gelten, wobei 𝑛(𝜃, 𝜔) durch Gl. (22.28) gegeben ist. Das ist in Abb. 22.12 graphisch illustriert, die die ordentlichen und außerordentlichen Brechungsindizes (ein Kreis und eine Ellipse) bei 𝜔 (durchgezogene Kurven) und 2𝜔 (gestrichelte Kurven) zeigt. Der Winkel, bei dem die Phasenbedingung erfüllt ist, ist der Schnittpunkt des Kreises für 2𝜔 mit der Ellipse für 𝜔. Für KDP ist bei einer Grundwellenlänge 𝜆 = 694 nm 𝑛o (𝜔) = 1.506, 𝑛e (𝜔) = 1.466, und bei 𝜆∕2 = 347 nm 𝑛o (2𝜔) = 1.534, 𝑛e (2𝜔) = 1.490. In diesem Fall liefern die Gln. (22.29) und (22.28) 𝜃 = 52◦ . Dieser Winkel wird als Schnittwinkel des Kristalls bezeichnet. Ähnliche Gleichungen können für die Frequenzverdopplung in der o-o-e-Variante formuliert werden. In diesem Fall gilt für KDP bei einer Grundwellenlänge 𝜆 = 1.06 μm, 𝜃 = 41◦ .
Beispiel 22-2: Kollinearer optischer parametrischer Oszillator
Die Schwingungsfrequenzen eines optischen parametrischen Oszillators werden aus den Frequenz- und Phasenbedingungen bestimmt. Für eine Typ-I-o-oe-Anordnung ist 𝜔1 + 𝜔2 = 𝜔3 ,
𝜔1 𝑛o (𝜔1 ) + 𝜔2 𝑛o (𝜔2 ) = 𝜔3 𝑛(𝜃, 𝜔3 ) . (22.30)
Für Typ-II-e-o-e-Mischung ist 𝜔1 + 𝜔2 = 𝜔3 ,
𝜔1 𝑛(𝜃, 𝜔1 ) + 𝜔2 𝑛o (𝜔2 ) = 𝜔3 𝑛(𝜃, 𝜔3 ) . (22.31)
Kristall. (c) Die Welle breitet sich in einem Winkel 𝜃 zur optischen Achse des Kristalls aus, sodass der außerordentliche Brechungsindex ne (𝜃, 𝜔) der 𝜔-Welle gleich dem ordentlichen Brechungsindex no (2𝜔) der 2𝜔-Welle ist.
Die Funktionen 𝑛o (𝜔) und 𝑛e (𝜔) werden aus der Sellmeiergleichung (5.115) bestimmt, und der außerordentliche Index 𝑛(𝜃, 𝜔) wird mithilfe von Gl. (22.28) als Funktion des Winkels 𝜃 zwischen der optischen Achse des Kristalls und der Richtung der Wellen bestimmt. Für eine gegebene Pumpfrequenz 𝜔3 werden die Lösungen der Gln. (22.30) und (22.31), 𝜔1 und 𝜔2 , häufig gegen den Winkel 𝜃 aufgetragen; das Ergebnis wird als Abstimmungskurve bezeichnet. Beispiele sind in Abb. 22.13 gezeigt.
Phasenbedingung bei nicht kollinearer Dreiwellenmischung
Im nicht kollinearen Fall ist die Phasenbedingung k1 + k2 = k3 äquivalent zu 𝜔1 𝑛1 𝑢̂ 1 + 𝜔2 𝑛2 𝑢̂ 2 = 𝜔3 𝑛3 𝑢̂ 3 , wobei 𝑢̂ 1 , 𝑢̂ 2 und 𝑢̂ 3 Einheitsvektoren in Ausbreitungsrichtung der Wellen sind. Die Brechungsindizes 𝑛1 , 𝑛2 und 𝑛3 hängen von den Richtungen der Wellen bezüglich der Kristallachsen sowie von der Polarisation und der Frequenz ab. Diese Vektorgleichung ist äquivalent zu zwei skalaren Gleichungen; die Bedingungen lauten somit 𝜔1 + 𝜔2 = 𝜔3 ,
𝜔1 𝑛1 sin 𝜃1 = 𝜔2 𝑛2 sin 𝜃2 ,
𝜔1 𝑛1 cos 𝜃1 + 𝜔2 𝑛2 cos 𝜃2 = 𝜔3 𝑛3 ,
(22.32)
wobei 𝜃1 und 𝜃2 die Winkel der Wellen 1 und 2 mit Welle 3 sind. Das Kernproblem beim Design von Bauelement für die Dreiwellenmischung ist die Auswahl von Richtungen und Polarisationen, die diese Gleichungen erfüllen, wie die folgende Übung und das folgende Beispiel zeigen.
Signal Idler Pumpe
1.6
1.6
1.4
1.4
Wellenlänge / µm
se
h he Ac optisc θ
Wellenlänge / µm
22.2 Nichtlineare Optik zweiter Ordnung
Signal (o)
1.2 1.0 0.8
Idler (o)
0.6 22
22.5
23
Schnittwinkel θ des Kristalls /° (a)
Idler (o) 1.2 1.0 0.8
Signal (e)
0.6 20 30 40 50 Schnittwinkel θ des Kristalls /° (b)
Abb. 22.13 Abstimmungskurven für einen kollinearen optischen parametrischen Oszillator aus einem BBO-Kristall und einer Pumpwelle bei 532 nm aus einem frequenzverdoppelten Nd:YAG Laser. (a) Typ I, (b) Typ II.
Übung 22-2: Nicht kollineare Typ-II-Frequenzverdopplung
Beispiel 22-3: Spontane parametrische Differenzfrequenzerzeugung
Abbildung 22.14 illustriert die nicht kollineare Typ-IIo-e-e-Frequenzverdopplung. Eine ordentliche Welle und eine außerordentliche Welle mit derselben Grundfrequenz 𝜔 erzeugen eine frequenzverdoppelte außerordentliche Welle mit der Frequenz 2𝜔. Wir nehmen an, dass die Ausbreitungsrichtungen der drei Wellen und der optischen Achse koplanar sind und dass die beiden Grundwellen und die optische Achse die Winkel 𝜃1 , 𝜃2 und 𝜃 mit der frequenzverdoppelten Welle einschließen. Die Brechungsindizes in der Phasenbedingung Gl. (22.32) sind 𝑛1 = 𝑛o (𝜔), 𝑛2 = 𝑛(𝜃 + 𝜃2 , 𝜔) und 𝑛3 = 𝑛(𝜃, 2𝜔), d. h.
Bei der spontanen parametrischen Differenzfrequenzerzeugung erzeugt eine Pumpwelle mit der Frequenz 𝜔3 Paare von Wellen 1 und 2 mit den Frequenzen 𝜔1 und 𝜔2 bei den Winkeln 𝜃1 und 𝜃2 , die zusammen die Frequenz- und Phasenbedingungen Gl. (22.32) erfüllen. Für den Fall Typ-I/o-o-e ist z. B. 𝑛1 = 𝑛o (𝜔1 ), 𝑛2 = 𝑛o (𝜔2 ) und 𝑛3 = 𝑛(𝜃, 𝜔3 ). Diese Beziehungen liefern zusammen mit den Sellmeiergleichungen für 𝑛o (𝜔) und 𝑛e (𝜔) ein Kontinuum von Lösungen (𝜔1 , 𝜃1 ), (𝜔2 , 𝜃2 ) für die Signal- und die Idlerwellen, wie das Beispiel in Abb. 22.15 zeigt.
𝑛o (𝜔) sin 𝜃1 = 𝑛(𝜃 + 𝜃2 , 𝜔) sin 𝜃2 , 𝑛o (𝜔) cos 𝜃1 + 𝑛(𝜃 + 𝜃2 , 𝜔) cos 𝜃2 = 2𝑛(𝜃, 2𝜔) .
(22.33)
Bestimmen Sie eine geeignete Orientierung des Kristalls und die Winkel 𝜃1 und 𝜃2 für eine effiziente Frequenzverdopplung für einen KDP-Kristall und eine Grundwelle mit der Wellenlänge 1.06 μm (Nd:YagLaser). ω e
θ1 θ2
ω
o
2ω e
hse
he Ac θ
optisc
Abb. 22.14 Nicht kollineare Typ-II-Frequenzverdopplung
Akzeptable Phasenfehlanpassung und Kohärenzlänge
Bereits eine geringe Phasenfehlanpassung Δk = k3 − k1 − k2 ≠ 0 kann den Wirkungsgrad der Wellenmischung wesentlich reduzieren. Wenn die Wellen 1 und 2 ebene Wellen mit den Wellenvektoren k1 und k2 sind, also 𝐸(𝜔1 ) = 𝐴1 exp(−ik1 ⋅ r) und 𝐸(𝜔2 ) = 𝐴2 exp(−ik2 ⋅ r) ist, dann ist nach Gl. (22.20d) 𝑃nl (𝜔3 ) = 2d𝐸(𝜔1 )𝐸(𝜔2 ) = 2d𝐴1 𝐴2 exp[−i(k1 + k2 ) ⋅ r] = 2d𝐴1 𝐴2 exp(iΔk ⋅ r) exp(−ik3 ⋅ r). Wegen Gl. (22.7) entspricht das einer Quelle mit der Kreisfrequenz 𝜔3 , dem Wellenvektor k3 und der komplexen Amplitude 2𝜔32 𝜇0 d𝐴1 𝐴2 exp(iΔk ⋅ r). Es kann gezeigt werden (siehe Aufgabe 22-5), dass die Intensität der erzeugten Welle proportional zum Quadrat des Integrals der Quellamplitude über das Wechselwirkungsvolumen 𝑉 ist, || ||2 || || | | 𝐼3 ∝ |||∫ d𝐴1 𝐴2 exp(iΔk ⋅ r)dr||| . || ||| || |𝑉
(22.34)
Weil die Beiträge von unterschiedlichen Punkten innerhalb des Wechselwirkungsvolumens als Zeiger ad-
771
22 Nichtlineare Optik
θ1
hse he Ac θ optisc
θ1 θ2 ω 2
6 4
ω1
ω3
(ω1, θ1)
2 Winkel /°
772
θ2
0 –2 (ω2, θ2)
–4 –6 1.0 1.1 0.9 normierte Frequenz
Abb. 22.15 Abstimmungskurven für die nicht kollineare spontane parametrische Typ-I-o-o-e-Differenzfrequenzerzeugung in einem BBO-Kristall in einem Winkel 𝜃 = 33.53◦ für eine Pumpwelle bei 351.5 nm (aus einem Ar+ -Ionenlaser). Jeder Punkt auf der hellen Fläche des mittleren Bildes bezeichnet die Frequenz 𝜔1 und den Winkel 𝜃1 einer möglichen erzeugten Welle und besitzt einen entsprechenden Punkt bei einer komplementären Frequenz 𝜔2 = 𝜔3 − 𝜔1
diert werden, führt die ortsabhängige Phase Δk ⋅ r im Fall einer Phasenfehlanpassung zu einer Verringerung der Gesamtintensität unter den Wert für ideale Phasenanpassung. Wir betrachten den Spezialfall eines eindimensionalen Wechselwirkungsvolumens der Brei𝐿 te 𝐿 in 𝑧-Richtung. Es gilt 𝐼3 ∝ | ∫0 exp(iΔ𝑘 𝑧) d𝑧|2 = 2 𝐿2 sinc (Δ𝑘 𝐿∕2π), wobei Δ𝑘 die 𝑧-Komponente von Δk und sinc(𝑥) = sin(π𝑥)∕(π𝑥) ist. Daraus folgt, dass 𝐼3 in Anwesenheit einer Wellenvektor-Fehlanpassung Δ𝑘 um 2 den Faktor sinc (Δ𝑘𝐿∕2π) reduziert wird, der für Δ𝑘 = 0 gleich eins ist und mit steigendem Δ𝑘 fällt, für |Δ𝑘| = π∕𝐿 einen Wert von (2∕π)2 ≈ 0.4 erreicht und für |Δ𝑘| = 2π∕𝐿 verschwindet (siehe Abb. 22.16). Für eine gegebene Länge 𝐿 ist die Fehlanpassung Δ𝑘, die einem vorgegebenen Reduktionsfaktor des Wirkungsgrads entspricht, umgekehrt proportional zu 𝐿, d. h. die Forderung nach Phasengleichheit wird mit steigendem 𝐿 strenger. Für eine gegebene Fehlanpassung Δ𝑘 ist die Länge 𝐿K = 2π∕|Δ𝑘|
(22.35)
ein Maß für die maximale Länge, innerhalb der die parametrische Wechselwirkungsprozess effizient erfolgt; 𝐿K wird häufig die Kohärenzlänge der Wellenmischung genannt. Für die Frequenzverdopplung ist beispielsweise |Δ𝑘| = 2(2π∕𝜆0 )|𝑛3 − 𝑛1 |, wobei 𝜆0 die Vakuumwellenlänge der Grundwelle ist und 𝑛1 und 𝑛3 die Brechungsindizes der Grund- und frequenzverdoppelten Welle. In diesem Fall ist 𝐿K = 𝜆0 ∕2|𝑛3 − 𝑛1 | umgekehrt proportional zu |𝑛3 − 𝑛1 |, was durch die Materialdispersion bestimmt ist. Für |𝑛3 − 𝑛1 | = 10−2 ist z. B. 𝐿K = 50𝜆. Die Toleranz des Wechselwirkungsprozesses gegenüber einer Phasenfehlanpassung kann als Resultat der
bei dem Winkel 𝜃2 . Alle Frequenzen sind auf die entartete Frequenz 𝜔0 = 𝜔3 ∕2 normiert. Zum Beispiel bezeichnen die zwei gezeigten Punkte ein Paar von erzeugten Wellen bei den Frequenzen 0.9𝜔0 und 1.1𝜔0 . Wegen der Rotationssymmetrie ist jeder Punkt in Wirklichkeit ein Ring von Punkten mit derselben Frequenz, aber jeder Punkt auf diesem Ring passt nur zu dem diametral entgegengesetzten Punkt auf dem Ring, wie die rechte Graphik illustriert. sinc 2(Δ kL/2π) 1
–4π
–2π
0
2π
4π
Δ kL
Abb. 22.16 Der Faktor, um den der Wirkungsgrad der Dreiwellenmischung bei einer Phasenfehlanpassung ΔkL zwischen den Wellen reduziert wird, die über eine Entfernung L wechselwirken.
Unschärfe Δ𝑘 ∝ 1∕𝐿 des Wellenvektors aufgefasst werden, die mit der Eingrenzung der Wellen auf eine Entfernung 𝐿 einhergeht [siehe Gl. (A.13)]. Die entsprechende Impulsunschärfe Δ𝑝 = ℏΔ𝑘 ∝ 1∕𝐿 erklärt die scheinbare Verletzung der Impulserhaltung bei der Wellenmischung. Die Bandbreite der Phasenanpassung
Wie zuvor angemerkt wird für eine endliche Wechselwirkungslänge 𝐿 eine Phasenfehlanpassung |Δ𝑘| ≤ 2π∕𝐿 toleriert. Wenn für eine Reihe von Sollfrequenzen der zu mischenden Wellen exakte Phasenanpassung erreicht wird, dann sind kleine Frequenzabweichungen von diesen Werten akzeptabel, so lange die Bedingung 𝜔1 + 𝜔2 = 𝜔3 exakt erfüllt ist. Die Spektralbänder einer solchen Toleranz sind durch die Bedingung |Δ𝑘| ≤ 2π∕𝐿 gegeben.
22.2 Nichtlineare Optik zweiter Ordnung
Bei der Frequenzverdopplung haben wir es beispielsweise mit zwei Wellen der Frequenzen 𝜔1 = 𝜔 und 𝜔3 = 2𝜔 zu tun. Die Fehlanpassung Δ𝑘 ist eine Funktion Δ𝑘(𝜔) der Grundfrequenz 𝜔. Das Bauelement wird für eine genaue Phasenanpassung bei einer nominellen Grundfrequenz 𝜔0 entworfen, d. h. Δ𝑘(𝜔0 ) = 0. Die Bandbreite Δ𝜔 ergibt sich dann aus der Bedingung |Δ𝑘(𝜔0 + Δ𝜔)| = 2π∕𝐿. Wenn Δ𝜔 klein genug ist, kön′ nen wir Δ𝑘(𝜔0 + Δ𝜔) = Δ𝑘′ Δ𝜔 schreiben, wobei Δ𝑘 = (d∕ d𝜔)Δ𝑘 bei 𝜔0 ist. Folglich ist Δ𝜔 = 2π∕|Δ𝑘′ |𝐿, woraus für die spektrale Breite (in Hz) folgt Δ𝜈 = 1∕|Δ𝑘′ |𝐿 .
(22.36)
Wegen Δ𝑘(𝜔) = 𝑘3 (2𝜔) − 2𝑘1 (𝜔) ist Δ𝑘′ = d𝑘3 (2𝜔)∕ d𝜔 − 2 d𝑘1 (𝜔)∕ d𝜔 = 2[d𝑘3 (2𝜔)∕ d(2𝜔) − d𝑘1 (𝜔)∕ d𝜔] = 2[1∕𝑣3 − 1∕𝑣1 ], wobei 𝑣1 und 𝑣3 die Gruppengeschwindigkeiten der Wellen 1 und 3 bei den Frequenzen 𝜔 bzw. 2𝜔 sind (siehe Abschnitt 5.7). Die spektrale Breite hängt daher mit der Länge 𝐿 und der Fehlanpassung der Gruppengeschwindigkeit gemäß Δ𝜈 =
−1 𝑐 1 ||| 𝐿 𝐿 || 1 || − ||| = 0 2 || 𝑣3 𝑣1 || 2𝐿 |𝑁3 − 𝑁1 |
(22.37)
zusammen, wobei 𝑁1 und 𝑁3 die Gruppenindizes des Materials bei der Grund- bzw. der verdoppelten Frequenz sind. Die Frequenzverdopplung einer breitbandigen Welle oder eines ultrakurzen Pulses (siehe Abschnitt 23.5.1) kann durch Verwendung eines dünnen Kristalls (auf Kosten eines geringeren Wirkungsgrads) in Verbindung mit einer zusätzlichen Bedingung für die Konstruktion, einer Anpassung der Gruppengeschwindigkeiten, 𝑣3 ≈ 𝑣1 bzw. 𝑁3 ≈ 𝑁1 , erreicht werden. Die Toleranz bei der Phasenanpassung in der spontanen parametrischen Differenzfrequenzerzeugung ist in Abb. 22.15 durch die Dicke der Linien angedeutet.
22.2.5 Quasi-Phasenanpassung Bei Vorhandensein einer Fehlanpassung Δk der Wellenvektoren emittieren Punkte innerhalb des Wechselwirkungsvolumens mit ortsabhängigen Phasen Δk ⋅ r, sodass der Betrag der erzeugten parametrischen Welle wesentlich reduziert wird. Da Phasenanpassung oft schwierig zu erreichen ist oder zumindest die Wahl des nichtlinearen Koeffizienten bzw. der Anordnung des Kristalls im Sinn einer Optimierung des Wirkungsgrads der Konversion gravierend einschränkt, wird häufig ein anderer Ansatz gewählt. Dabei lässt man eine Phasenfehlanpassung zu, kompensiert sie aber durch Verwendung eines Mediums mit einer ortsabhängigen periodischen Nichtlinearität. Diese führt eine entgegengesetzte
Phase ein, die zu einer besseren Anpassung der Phasen der verteilten strahlenden Volumenelemente führt. Diese Technik wird Quasi-Phasenanpassung genannt. Wenn das Medium einen ortsabhängigen nichtlinearen Koeffizienten d(r) besitzt, wird Gl. (22.34) || ||2 || || | | 𝐼3 ∝ |||∫ d(r) exp(iΔk ⋅ r)dr||| . || || || 𝑉 ||
(22.38)
Wenn d(r) eine harmonische Funktion d(r) = d0 exp(−iG ⋅ r) mit G = Δk ist, wird die Phasenfehlanpassung vollständig beseitigt. Entsprechend wird die Phasenbedingung (22.22) durch k1 + k2 + G = k3
(22.39)
ersetzt. Das nichtlineare Medium dient hier effektiv als Phasengitter (oder longitudinales Bragggitter) mit einem Wellenvektor G. Es ist im Allgemeinen schwierig, ein Medium mit einem stetig variierenden harmonischen nichtlinearen Koeffizienten d(r) = d0 exp(−iG ⋅ r) herzustellen, es ist aber möglich, einfachere periodische Strukturen herzustellen wie z. B. Medien mit nichtlinearen Koeffizienten mit konstantem Betrag, aber periodisch wechselndem Vorzeichen. Da jede periodische Funktion durch eine Fourierentwicklung in eine Superposition von harmonischen Funktionen zerlegt werden kann, kann eine einzige derartige Funktion die Phasenfehlanpassung korrigieren, während die anderen Funktionen keine Rolle für die Wellenmischung spielen, weil sie eine größere Phasenfehlanpassung bewirken. Quasi-Phasenanpassung bei kollinearer Wellenmischung
Für kollineare Wellen, die sich in 𝑧-Richtung ausbreiten und eine Phasenfehlanpassung Δ𝑘 haben, besitzt das erforderliche Phasengitter die Form exp(−i𝐺𝑧) mit 𝐺 = Δ𝑘. Ein solches Gitter kann durch einen periodischen nichtlinearen Koeffizienten d(𝑧) realisiert wer∑∞ den, der durch die Fourierreihe d(𝑧) = 𝑚 = −∞ d𝑚 exp(−i2π𝑚𝑧∕𝛬) beschrieben wird, wobei 𝛬 die Periode ist und die {d𝑚 } die Fourierkoeffizienten. Eine beliebige dieser Komponenten kann für die Phasenanpassung verwendet werden. Für die 𝑚te Harmonische ist z. B. 𝐺 = 𝑚2π∕𝛬 = Δ𝑘 und daher 𝛬 = 𝑚2π∕Δ𝑘 = 𝑚𝐿K ,
(22.40)
d. h. die Gitterperiode 𝛬 ist ein ganzzahliges Vielfaches der Kohärenzlänge 𝐿K = 2π∕Δ𝑘. Gleichung (22.39) ergibt zusammen mit der Frequenzbedingung 𝜔1 + 𝜔2 = 𝜔3 ,
𝜔1 𝑛1 + 𝜔2 𝑛2 + 𝑚2π 𝑐∕𝛬 = 𝜔3 𝑛3 . (22.41)
773
774
22 Nichtlineare Optik
Diese Gleichungen werden anstelle von Gl. (22.27) verwendet, um die Abstimmungskurven und die Winkel des Kristalls beim Entwurf von parametrischen Bauelementen zu bestimmen. Quasi-Phasenanpassung in einem Medium mit einem periodisch alternierenden nichtlinearen Koeffizienten
Das einfachste periodische Muster für den nichtlinearen Koeffizienten d(𝑧) wechselt auf einer Entfernung 𝛬∕2 zwischen zwei konstanten Werten +d0 und −d0 , wie in Abb. 22.17 dargestellt. Abbildung 22.18 illustriert den physikalischen Mechanismus, durch den die periodische Umkehrung des Vorzeichens des nichtlinearen Koeffizienten die ortsabhängige Phase der Strahlung kompensiert, für den Fall 𝑚 = 1; die Gitterperiode 𝛬 ist hier gleich der Kohärenzlänge 𝐿K = 2π∕Δ𝑘. Quantitativ kann die Verbesserung des Wirkungsgrads der Konversion durch Quasi-Phasenanpassung wie folgt bestimmt werden. Nach der Theorie der Fourierreihen ist d𝑚 = (2∕𝑚π)d0 für ungerade 𝑚 und ansonsten null. Wenn die Phasenanpassung durch die 𝑚te Harmonische erreicht wird, d. h. 𝛬 = 𝑚𝐿K , dann ist der Wirkungsgrad der parametrischen Konversion proporΛ
L 0
(z)
z –
0
Abb. 22.17 Ein nichtlinearer Kristall mit einem nichtlinearen Koeffizienten d(z), der mit der Periode 𝛬 variiert. z=0
2
2
tional zu d𝑚 = (2∕π 𝑚)2 d0 . Im Gegensatz dazu ist der Wirkungsgrad der Konversion für ein homogenes Medium mit dem nichtlinearen Koeffizienten d0 und derselben Länge 𝐿, aber der Fehlanpassung Δ𝑘 der Wellen2 2 2 2 vektoren gleich d0 sinc (Δ𝑘𝐿∕2π) = d0 sinc (𝐿∕𝐿K ) und 2 2 2 fällt für 𝐿 ≫ 𝐿K wie (d0 ∕π )(𝐿K ∕𝐿) ab. Wegen 𝐿K = 𝛬∕𝑚 wird der Wirkungsgrad der Konversion um einen Faktor 4(𝐿∕𝛬)2 verbessert, d. h. er ist proportional zum Quadrat der Zahl der Perioden der periodischen Struktur. Offensichtlich kann ein periodisches Medium den Wirkungsgrad der Konversion massiv erhöhen. Der schwierigste Aspekt bei der Quasi-Phasenanpassung ist die Herstellung der periodischen nichtlinearen Struktur. Ein homogener nichtlinearer Kristall kann periodisch verändert werden, indem die Richtung der Hauptachse in alternierenden Schichten umgekehrt wird, wodurch das Vorzeichen des Koeffizienten d alterniert. Dazu kann der Kristall z. B. lithographisch einem periodischen elektrischen Feld ausgesetzt werden, das die Richtung der permanenten elektrischen Polarisierung des Kristalls umkehrt; diese Technik wird als Polung bezeichnet. Dieser Ansatz wurde für ferroelektrische Kristalle wie LiTaO3 , KTP und LiNbO3 eingesetzt; im Fall von LiNbO3 spricht man speziell von periodisch gepoltem Lithiumniobat. Auch Halbleiterkristalle wie GaAs wurden zu demselben Zweck verwendet. Eine periodische Polung wurde auch in integrierten nichtlinearen optischen Wellenleitern realisiert. Beispielsweise können durch Eindiffusion von Ti oder Protonenaustausch bei hohen Temperaturen Wellenleiter aus periodisch gepoltem Lithiumniobat hergestellt werden. Durch reaktives Ionenätzen können Stegwellenleiter in periodisch gepoltem Lithiumniobat geätzt werden. Meist werden Einmodenwellenleiter verwendet,
z = 2π/Δk = Λ
z = π/Δk = Λ/ 2
(a) Phasenangepasst
z = 0 2π/Δk
π/Δk
z =0
(b) Nicht phasenangepasst
π/Δk
2π/Δk
(c) Quasi-phasenangepasst
Abb. 22.18 Zeiger der Wellen, die von infinitesimalen Volumenelementen an unterschiedlichen Orten z im nichtlinearen Medium emittiert werden. (a) Im phasenangepassten Fall (Δk = 0) sind die Zeiger alle ausgerichtet und der Wirkungsgrad der Konversion ist maximal. (b) Bei einer Phasenfehlanpassung Δk sind die Zeiger sind falsch ausgerichtet und
der Wirkungsgrad wird wesentlich reduziert. (c) Bei QuasiPhasenanpassung werden die falsch ausgerichteten Zeiger periodisch umgedreht, indem das Vorzeichen des nichtlinearen Koeffizienten in Intervallen von 𝛬∕2 umgekehrt wird. Der Wirkungsgrad der Konversion wird dadurch vergrößert.
22.3 Nichtlineare Optik dritter Ordnung
775 nm
1550 nm
Abb. 22.19 Schema der Frequenzverdopplung in einem periodisch gepolten, integrierten nichtlinearen Wellenleiter.
um die Effizienz des Wellenmischens zu verbessern. Abbildung 22.19 zeigt die optische Frequenzverdopplung in einem periodisch gepolten, nichtlinearen Wellenleiter schematisch. Ein LiNbO3 -Stegwellenleiter mit einer Höhe von 1 μm und einer Breite von 5 μm kann beispielsweise bei Wellenlängen von 1550 nm oder weniger auf einer einzelnen Mode betrieben werden. Polungsperioden in der Größenordnung von 10−15 μm ergeben für die Frequenzverdopplung bei dieser Wellenlänge eine Quasi-Phasenanpassung.
22.3 Nichtlineare Optik dritter Ordnung In zentrosymmetrischen Medien fehlt der nichtlineare Term zweiter Ordnung, da sich die Polarisation in ihnen aus Symmetriegründen exakt umkehren muss, wenn das elektrische Feld umgekehrt wird. Die dominierende Nichtlinearität ist dann dritter Ordnung, 𝒫nl = 4𝜒 (3) ℰ 3
(22.42)
(siehe Abb. 22.20), und das Material wird als Kerrmedium bezeichnet. Kerrmedien reagieren auf optische Felder durch Erzeugung von dritten Harmonischen sowie Summen und Differenzen von jeweils drei Frequenzen. 𝒫nl
ℰ
Übung 22-3: Kerreffekt in nichtlinearen optischen Medien dritter Ordnung
Ein monochromatisches optisches Feld 𝐸(𝜔) fällt in Anwesenheit eines statischen elektrischen Feldes 𝐸(0) auf ein nichtlineares Medium dritter Ordnung. Das optische Feld ist viel kleiner als das elektrische Feld, sodass |𝐸(𝜔)|2 ≪ |𝐸(0)|2 gilt. Verwenden Sie Gl. (22.42), um zu zeigen, dass die Komponente von 𝒫nl mit der Frequenz 𝜔 näherungsweise durch 𝑃nl (𝜔) ≈ 12𝜒 (3) 𝐸 2 (0)𝐸(𝜔) gegeben ist. Zeigen Sie, dass diese Komponente der Polarisation äquivalent zu einer 1 Änderung Δ𝑛 = − s𝑛3 𝐸 2 (0) des Brechungsindex ist, 2 mit s=−
12 (3) 𝜒 . 𝜀0 𝑛4
(22.43)
Die Proportionalität zwischen der Änderung des Brechungsindex und dem quadrierten elektrischen Feld ist der (quadratische) elektrooptische Kerreffekt, der in Abschnitt 21.1.1 beschrieben wurde, wobei s der Kerrkoeffizient ist [Gl. (21.5)].
22.3.1 Die Erzeugung der dritten Harmonischen und der optische Kerreffekt Erzeugung der dritten Harmonischen
Nach Gl. (22.42) ist die Antwort eines nichtlinearen Mediums dritter Ordnung auf ein monochromatisches optisches Feld ℰ(𝑡) = Re{𝐸(𝜔) exp(i𝜔𝑡)} eine nichtlineare Polarisation 𝒫nl (𝑡), die eine Komponente bei der Frequenz 𝜔 und eine weitere bei der Frequenz 3𝜔 enthält, 𝑃nl (𝜔) = 3𝜒 (3) |𝐸(𝜔)|2 𝐸(𝜔) , (3)
𝑃nl (3𝜔) = 𝜒 𝐸 (𝜔) . 3
(22.44a) (22.44b)
Die Existenz einer Komponente der Polarisation bei der Frequenz 3𝜔 zeigt, dass die dritte Harmonische der einfallenden Welle erzeugt wird; allerdings ist der Wirkungsgrad der Konversion meist gering. In der Praxis wird die dritte Harmonische meist über Frequenzverdopplung gefolgt von der Bildung der Summenfrequenz der Grund- und der frequenzverdoppelten Welle erzeugt (siehe Abschnitt 15.3.2). Der optische Kerreffekt
Abb. 22.20 Nichtlinearität dritter Ordnung in einem Kerrmedium.
Die Komponente der Polarisation bei der Frequenz 𝜔 in Gl. (22.44a) entspricht einer Änderung der Suszeptibilität Δ𝜒 bei der Frequenz 𝜔 gemäß 𝜀0 Δ𝜒 =
𝑃nl (𝜔) = 3𝜒 (3) |𝐸(𝜔)|2 = 6𝜒 (3) 𝜂𝐼 , 𝐸(𝜔)
(22.45)
wobei 𝐼 = |𝐸(𝜔)|2 ∕2𝜂 die optische Intensität der ursprünglichen Welle ist. Wegen 𝑛2 = 1 + 𝜒 ist 2𝑛Δ𝑛 = Δ𝜒,
775
776
22 Nichtlineare Optik
daher ist Δ𝑛 = Δ𝜒∕2𝑛 oder Δ𝑛 =
3𝜂 (3) 𝜒 𝐼 ≡ 𝑛2 𝐼 , 𝜀0 𝑛
(22.46)
3𝜂0 (3) 𝜒 . 𝑛2 𝜀0
(22.47)
mit 𝑛2 =
Die Änderung des Brechungsindex ist somit proportional zur optischen Intensität. Der gesamte Brechungsindex ist daher eine lineare Funktion 2) der optischen Intensität 𝐼, 𝑛(𝐼) = 𝑛 + 𝑛2 𝐼 .
(22.48)
Dieser Effekt wird wegen seiner Ähnlichkeit mit dem in Abschnitt 21.1.1 besprochenen elektrooptischen Kerreffekt – bei dem Δ𝑛 zum Quadrat des statischen elektrischen Feldes proportional ist – als optischer Kerreffekt bezeichnet. Der optische Kerreffekt ist ein selbstinduzierter Effekt, in dem die Phasengeschwindigkeit der Welle von ihrer eigenen Intensität abhängt. Er ist ein Beispiel für nichtlineare Brechung. Der Koeffizient 𝑛2 liegt in der Größenordnung von 10−16 −10−14 cm2 ∕W in Gläsern, 10−14 −10−7 cm2 ∕W in dotierten Gläsern, 10−10 −10−8 cm2 ∕W in organischen Materialien und 10−10 −10−2 cm2 ∕W in Halbleitern. Er hängt von der Betriebswellenlänge (siehe Abschnitt 22.7) und der Polarisation ab.
22.3.2 Selbstphasenmodulation, Selbstfokussierung und räumliche Solitonen Selbstphasenmodulation
Infolge des optischen Kerreffekts erfährt eine optische Welle, die sich in einem nichtlinearen Medium dritter Ordnung ausbreitet, Selbstphasenmodulation (engl. self-phase modulation). Die Phasenverschiebung eines optischen Strahls der Leistung P und der Querschnittsfläche A nach Ausbreitung über eine Entfernung 𝐿 in dem Medium ist 𝜑 = −𝑛(𝐼)𝑘0 𝐿 = 2π 𝑛(𝐼)𝐿∕𝜆0 = −2π (𝑛 + 𝑛2 P∕A)𝐿∕𝜆0 ; die Änderung ist daher Δ𝜑 = −2π 𝑛2
𝐿 P 𝜆0 A
Um den Effekt zu maximieren, sollte 𝐿 groß und A klein sein. Diese Voraussetzungen erfüllen optische Wellenleiter ideal. Die optische Leistung, für die Δ𝜑 = −π erreicht wird, ist Pπ = 𝜆0 A∕2𝐿𝑛2 . Eine dotierte Glasfaser der Länge 𝐿 = 1 m und der Querschnittsfläche A = 10−2 mm2 mit 𝑛2 = 10−10 cm2 ∕W bei 𝜆0 = 1 μm ändert die Phase beispielsweise bei einer optischen Leistung von P π = 0.5 W um π. Materialien mit größeren Werten von 𝑛2 können in Kanalwellenleitern von einigen cm Länge verwendet werden, um eine Phasenverschiebung von π bei Leistungen von einigen mW zu erreichen. Phasenmodulation kann durch eine der im Zusammenhang mit elektrooptischen Modulatoren diskutierten Methoden in Intensitätsmodulation umgewandelt werden (siehe Abschnitt 21.1.2): (i) Verwenden eines Interferometers (z. B. Mach-Zehnder), (ii) Verwenden der Differenz der modulierten Phasen der beiden Polarisationskomponenten (Doppelbrechung) als Phasenschieber zwischen gekreuzten Polarisatoren oder (iii) Verwenden eines integriert-optischen Richtkopplers (Abschnitt 9.4.2). Das Ergebnis ist ein volloptischer Modulator, in dem ein schwacher optischer Strahl durch einen starken optischen Strahl kontrolliert werden kann. Volloptische Schalter werden in Abschnitt 24.2 besprochen. Selbstfokussierung
Ein anderer interessanter Effekt, der mit der Selbstphasenmodulation zusammenhängt, ist die Selbstfokussierung. Wenn ein intensiver optischer Strahl durch eine dünne Platte eines nichtlinearen Materials transmittiert wird, das wie in Abb. 22.21 dargestellt einen optischen Kerreffekt zeigt, folgt die Änderung des Brechungsindex dem Intensitätsmuster in der transversalen Ebene. Wenn der Strahl beispielsweise seine höchste Intensität im Zentrum hat, ist die Änderung des Brechungsindex ebenfalls im Zentrum maximal. Die Platte wirkt dann als Gradientenindexmedium, das der Welle eine ungleichförmige Phasenverschiebung gibt und dadurch eine Krümmung der Wellenfront verursacht. Unter bestimmten Bedingungen kann das Medium als Linx
f
(22.49)
und damit proportional zur optischen Leistung P . Selbstphasenmodulation ist in Anwendungen nützlich, in denen Licht durch Licht gesteuert wird. 2) Gleichung (22.48) kann alternativ auch in der Form 𝑛(𝐼) = 𝑛 + 𝑛2 |𝐸|2 ∕2 geschrieben werden, wobei sich dieses 𝑛2 von dem in Gl. (22.47) um den Faktor 𝜂 unterscheidet.
z
I nichtlineares Medium
Abb. 22.21 Ein nichtlineares Medium dritter Ordnung wirkt als Linse, deren Brennweite von der Intensität des einfallenden Strahls abhängt.
22.3 Nichtlineare Optik dritter Ordnung
se mit einer leistungsabhängigen Brennweite wirken, wie in Übung 22-4 gezeigt wird. Fokussierung durch Kerrlinsen ist für die Modenkopplung von Lasern hilfreich, wie in Abschnitt 16.4.4 diskutiert wurde. Übung 22-4: Optische Kerrlinse
Ein optischer Strahl, der sich in 𝑧-Richtung ausbreitet, wird durch eine dünne Platte eines nichtlinearen optischen Materials transmittiert, das einen optischen Kerreffekt 𝑛(𝐼) = 𝑛 + 𝑛2 𝐼 zeigt. Die Platte liegt in der 𝑥𝑦-Ebene und hat eine kleine Dicke d , sodass ihre komplexe Amplitudentransmission exp(−i𝑛𝑘0 d ) ist. Der Strahl hat eine näherungsweise ebene Wellenfront und an Punkten in der Nähe der Strahlachse (𝑥, 𝑦 ≪ 𝑊) eine Intensitätsverteilung 𝐼 ≈ 𝐼0 [1 − (𝑥2 + 𝑦 2 )∕𝑊 2 ], wobei 𝐼0 die Maximalintensität ist und 𝑊 der Strahlradius. Zeigen Sie, dass das Medium als dünne Linse mit einer zu 𝐼0 umgekehrt proportionalen Brennweite wirkt. Hinweis: Eine Linse der Brennweite 𝑓 hat eine komplexe Amplitudentransmission proportional zu exp[i𝑘0 (𝑥2 + 𝑦 2 )∕2𝑓], siehe Gl. (2.40) und Übung 2-8. Räumliche Solitonen
Wenn sich ein intensiver optischer Strahl nicht nur durch eine dünne Platte, sondern durch ein dickes nichtlineares homogenes Medium ausbreitet, wird der Brechungsindex ungleichförmig verändert, sodass das Medium als ein Gradientenindex-Wellenleiter wirken kann. Auf diese Weise schafft sich der Strahl seinen eigenen Wellenleiter. Wenn die Intensität des Strahls dieselbe räumliche Verteilung in der transversalen Ebene wie eine der Moden des von dem Strahl selbst erzeugten Wellenleiters hat, breitet sich der Strahl selbstkonsistent aus, ohne seine räumliche Verteilung zu ändern. Unter diesen Bedingungen wird die Beugung durch Selbstphasenmodulation kompensiert, und der Strahl wird auf seinen selbstgeschaffenen Wellenleiter eingegrenzt. Solche selbstgeführten Strahlen werden räumliche Solitonen genannt. Analoges Verhalten existiert auch im Zeitbereich, wenn die Gruppengeschwindigkeitsdispersion durch die Selbstphasenmodulation kompensiert wird. Wie in Abschnitt 23.5.2 diskutiert, führt das zur Entstehung von zeitlichen Solitonen, die sich ausbreiten, ohne ihre Form zu ändern. Die Selbstführung des Lichts in einem optischen Kerrmedium wird mathematisch durch die Helmholtzgleichung ∇2 𝐸 + 𝑛2 (𝐼)𝑘02 𝐸 = 0 beschrieben, wobei 𝑛(𝐼) = 𝑛 + 𝑛2 𝐼, 𝑘0 = 𝜔∕𝑐0 und 𝐼 = |𝐸|2 ∕2𝜂 ist. Das ist eine nichtlineare Differentialgleichung in 𝐸, die wir vereinfachen können, indem wir 𝐸 = 𝐴 exp(−i𝑘𝑧) mit 𝑘 = 𝑛𝑘0 schreiben und annehmen, dass sich die Einhüllende 𝐴 = 𝐴(𝑥, 𝑧) in 𝑧-Richtung langsam ändert (im Ver-
gleich mit der Wellenlänge 𝜆 = 2π∕𝑘) und in 𝑦-Richtung konstant ist (siehe Abschnitt 2.2.3). Wenn wir die Näherung (𝜕 2 ∕𝜕𝑧2 )[𝐴 exp(−i𝑘𝑧)] ≈ (−2i𝑘 𝜕𝐴∕𝜕𝑧 − 𝑘2 𝐴) exp(−i𝑘𝑧) benutzen, wird die Helmholtzgleichung 𝜕𝐴 𝜕2 𝐴 − 2i𝑘 + 𝑘02 [𝑛2 (𝐼) − 𝑛2 ]𝐴 = 0 . 𝜕𝑧 𝜕𝑥2
(22.50)
Da der nichtlineare Effekt klein ist (𝑛2 𝐼 ≪ 𝑛), schreiben wir [𝑛2 (𝐼) − 𝑛2 ] = [𝑛(𝐼) − 𝑛][𝑛(𝐼) + 𝑛] ≈ [𝑛2 𝐼][2𝑛] =
𝑛 2 𝑛2 2𝑛2 𝑛|𝐴|2 |𝐴|2 ; = 2𝜂 𝜂0
(22.51)
damit wird Gl. (22.50) zu 𝜕 2 𝐴 𝑛2 2 2 𝜕𝐴 + 𝑘 |𝐴| 𝐴 = 2i𝑘 . 2 𝜂 𝜕𝑥 𝜕𝑧 0
(22.52)
Gleichung (22.52) ist die nichtlineare Schrödingergleichung. Eine ihrer Lösungen ist 𝐴(𝑥, 𝑧) = 𝐴0 sech (
𝑥 𝑧 ) exp (−i ). 𝑊0 4𝑧0
(22.53)
wobei 𝑊0 eine Konstante ist, sech(⋅) der Sekans hyperbolicus, 𝐴0 die Beziehung 𝑛2 (𝐴02 ∕2𝜂0 ) = 1∕𝑘2 𝑊02 erfüllt 1
und 𝑧0 = 𝑘𝑊02 = π 𝑊02 ∕𝜆 die Rayleighlänge ist [siehe 2 Gl. (3.22)]. Die Intensitätsverteilung 𝐼(𝑥, 𝑧) =
𝐴02 |𝐴(𝑥, 𝑧)|2 𝑥 2 ) = sech ( 2𝜂 2𝜂 𝑊0
(22.54)
hängt nicht von 𝑧 ab und hat eine Breite 𝑊0 , wie in Abb. 22.22 dargestellt. Die Verteilung in Gl. (22.53) ist die Mode eines Gradientenindex-Wellenleiters mit einem Brechungsindex 𝑛 + 𝑛2 𝐼 = 𝑛[1 + (1∕𝑘2 ∕𝑊02 ) 2 sech (𝑥∕𝑊0 )], sodass Selbstkonsistenz sichergestellt ist. Wegen 𝐸 = 𝐴 exp(−i𝑘𝑧) breitet sich die Welle mit einer Ausbreitungskonstante 𝑘 + 1∕4𝑧0 = 𝑘(1 + 𝜆 2 ∕8π2 𝑊02 ) und einer Phasengeschwindigkeit 𝑐∕(1 + 𝜆 2 ∕8π2 𝑊02 ) aus. Die Geschwindigkeit ist für lokalisierte Strahlen (kleine 𝑊0 ) kleiner als 𝑐, geht aber für große 𝑊0 gegen 𝑐. Ramangewinn
Ebenso wie wir die komplexe Suszeptibilität 𝜒 = 𝜒 ′ + i𝜒 ′′ konstruiert hatten, um Gewinn und Verlust im Rahmen der linearen Optik zu berücksichtigen (Abschnitt 5.5), können wir dies nun auch für die nichtlineare Suszeptibilität dritter Ordnung 𝜒 (3) tun, die wir als (3) (3) 𝜒 (3) = 𝜒r + i𝜒i schreiben. Die Selbstphasenmodulation in Gl. (22.49), die nun ebenfalls komplex ist, wird dann zu Δ𝜑 = 2π 𝑛2
6π 𝜂0 𝜒 (3) 𝐿 𝐿 P= P. 𝜀0 𝑛2 𝜆0 A 𝜆0 A
(22.55)
777
778
22 Nichtlineare Optik
W(z)
W0
z
z
(b)
(a)
Daher ist der Phasenfaktor exp(−i𝜑) der Ausbreitung eine Kombination der Phasenverschiebung Δ𝜑 = (3) (6π 𝜂0 ∕𝜀0 )(𝜒r ∕𝑛2 ) × (𝐿∕𝜆0 A)P und des Gewinns 1 exp( 𝛾R 𝐿), wobei der Gewinnkoeffizient 2
(3)
12π 𝜂0 𝜒i 1 P 𝛾R = 𝜀0 𝑛 2 𝜆0 A
(22.56)
proportional zur optischen Leistung P ist. Dieser Effekt, als Ramangewinn bezeichnet, entsteht aus dem kohärenten Pumpen der nichtlinearen Polarisation des Ramanmediums. Sie ermöglicht den Energietransfer von dem Pump- auf den Signalstrahl durch eine Wechselwirkung des Lichts mit den Schwingungsmoden des Mediums. Dieser Mechanismus steht im Gegensatz zu dem durch die Besetzungsinversion bewirkten Gewinn in einem Bauelement auf der Basis der induzierten Emission (Abschnitt 15.1). Der Ramangewinn ist die Grundlage von verteilten Raman-Faserverstärkern, in denen Pump- und Signalstrahl durch dieselbe Faser geleitet werden (Abschnitt 15.3.4). Wenn der Gewinn den Verlust überschreitet und eine geeignete Rückkopplung eingeführt wird, wird der Ramanverstärker zum Ramanlaser (siehe Abschnitt 16.3.1).
22.3.3
Kreuzphasenmodulation
Wir betrachten jetzt die Reaktion eines nichtlinearen Mediums dritter Ordnung auf ein optisches Feld aus zwei monochromatischen Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 , ℰ(𝑡) = Re{𝐸(𝜔1 ) exp(i𝜔1 𝑡)} + Re{𝐸(𝜔2 ) exp(i𝜔2 𝑡)}. Nach Einsetzen in Gl. (22.42) ergibt sich die Komponente 𝑃nl (𝜔1 ) der Polarisation bei der Frequenz 𝜔1 zu [ ] 𝑃nl (𝜔1 ) = 𝜒 (3) 3|𝐸(𝜔1 )|2 + 6|𝐸(𝜔2 )|2 𝐸(𝜔1 ) . (22.57) Wenn wir annehmen, dass die zwei Wellen denselben Brechungsindex 𝑛 haben, kann diese Beziehung in der Form 𝑃nl (𝜔1 ) = 2𝜀0 𝑛Δ𝑛𝐸(𝜔1) geschrieben werden, wobei Δ𝑛 = 𝑛2 (𝐼1 + 2𝐼2 )
Abb. 22.22 Vergleich zwischen (a) einem Gaußstrahl in einem linearen Medium und (b) einem räumlichen Soliton (selbstgführten optischen Strahl) in einem nichtlinearen Medium.
(22.58)
und 𝑛2 = 3𝜂0 𝜒 (3) ∕𝜀0 𝑛2 ist. Die Größen 𝐼1 = |𝐸(𝜔1 )|2 ∕2𝜂 und 𝐼2 = |𝐸(𝜔2 )|2 ∕2𝜂 sind die Intensitäten der Wellen 1 bzw. 2. Welle 1 breitet sich daher mit einem effektiven Brechungsindex 𝑛 + Δ𝑛 aus, der von ihrer eigenen Intensität sowie der von Welle 2 kontrolliert wird. Entsprechendes gilt für Welle 2, sodass die Wellen gekoppelt sind. Da die Phasenverschiebung von Welle 1 durch die Intensität von Welle 2 moduliert wird, wird diese Erscheinung als Kreuzphasenmodulation (engl. crossphase modulation) bezeichnet. Sie kann zum Austausch von Information zwischen optischen Nachrichtenkanälen bei benachbarten Frequenzen führen, z. B. in Wellenlängenmultiplexsystemen (siehe Abschnitt 25.3.3). Wie wir in Abschnitt 22.2.3 gesehen haben, ist Zweiwellenmischung in einem nichtlinearen Medium zweiter Ordnung (außer im entarteten Fall) nicht möglich. In photorefraktiven Medien kann Zweiwellenmischung jedoch auftreten, wie in Abb. 21.36 dargestellt. Übung 22-5: Optischer Kerreffekt in Anwesenheit von drei Wellen.
Drei monochromatische Wellen mit den Frequenzen 𝜔1 , 𝜔2 und 𝜔3 breiten sich in einem nichtlinearen Medium dritter Ordnung aus. Bestimmen Sie die komplexe Amplitude der Komponente von 𝒫nl (𝑡) in Gl. (22.42) bei der Frequenz 𝜔1 . Zeigen Sie, dass sich diese Welle mit einer Geschwindigkeit 𝑐0 ∕(𝑛 + Δ𝑛) ausbreitet, wobei Δ𝑛 = 𝑛2 (𝐼1 + 2𝐼2 + 2𝐼3 )
(22.59)
und 𝑛2 = 3𝜂0 𝜒 (3)∕𝜀0 𝑛2 mit 𝐼𝑞 = |𝐸(𝜔𝑞 )|2 ∕2𝜂 ist (𝑞 = 1, 2, 3).
22.3.4
Vierwellenmischung
Wir untersuchen jetzt den Fall der Vierwellenmischung in einem nichtlinearen Medium dritter Ordnung. Wir beginnen, indem wir die Antwort des Mediums auf eine Superposition dreier Wellen der Kreisfre-
22.3 Nichtlineare Optik dritter Ordnung
quenzen 𝜔1 , 𝜔2 und 𝜔3 mit dem Feld
k1
k2
ℏω2
ℏω4
ℏω1
ℏω3
ℰ(𝑡) = Re{𝐸(𝜔1 ) exp(i𝜔1 𝑡)} + Re{𝐸(𝜔2 ) exp(i𝜔2 𝑡)} k3
+ Re{𝐸(𝜔3 ) exp(i𝜔3 𝑡)} (22.60) bestimmen. Es ist zweckmäßig, ℰ(𝑡) als Summe von sechs Termen zu schreiben, ∑ 1 𝐸(𝜔𝑞 ) exp(i𝜔𝑞 𝑡) , (22.61) ℰ(𝑡) = 𝑞 = ±1,±2,±3
2
wobei 𝜔−𝑞 = −𝜔𝑞 und 𝐸(−𝜔𝑞 ) = 𝐸 ∗ (𝜔𝑞 ) gilt. Wenn wir Gl. (22.61) in Gl. (22.42) einsetzen, erhalten wir 𝒫nl als Summe von 63 = 216 Termen, ∑ 1 𝒫nl (𝑡) = 𝜒 (3) 𝐸(𝜔𝑞 )𝐸(𝜔𝑟 )𝐸(𝜔𝑙 ) 8
𝑞,𝑟,𝑙 = ±1,±2,±3
× exp[i(𝜔𝑞 + 𝜔𝑟 + 𝜔𝑙 )𝑡] .
(22.62)
Folglich ist 𝒫nl die Summe von harmonischen Komponenten der Frequenzen 𝜔1 , … , 3𝜔1 , … , 2𝜔1 ± 𝜔2 , … , ± 𝜔1 ± 𝜔2 ± 𝜔3 . Die Amplitude 𝑃nl (𝜔𝑞 + 𝜔𝑟 + 𝜔𝑙 ) der Komponente mit der Frequenz 𝜔𝑞 + 𝜔𝑟 + 𝜔𝑙 kann bestimmt werden, indem man passende Permutationen von 𝑞, 𝑟 und 𝑙 in Gl. (22.62) addiert. Zum Beispiel gehören zu 𝑃nl (𝜔1 + 𝜔2 − 𝜔3 ) sechs Permutationen 𝑃nl (𝜔1 + 𝜔2 − 𝜔3 ) = 6𝜒 (3)𝐸(𝜔1 )𝐸(𝜔2 )𝐸 ∗ (𝜔3 ) . (22.63) Gleichung (22.63) zeigt, dass das Medium vier Wellen der Frequenzen 𝜔1 , 𝜔2 , 𝜔3 und 𝜔4 mischt, sofern 𝜔4 = 𝜔1 + 𝜔2 − 𝜔3 ist oder 𝜔1 + 𝜔2 = 𝜔3 + 𝜔4 .
(22.64)
Diese Gleichung ist die Frequenzbedingung für die Vierwellenmischung. Wenn wir annehmen, dass die Wellen 1, 2 und 3 ebene Wellen mit den Wellenvektoren k1 , k2 und k3 sind, sodass 𝐸(𝜔𝑞 ) ∝ exp(−ik𝑞 ⋅ r) ist (𝑞 = 1, 2, 3), dann liefert Gl. (22.63) 𝑃nl (𝜔4 ) ∝ exp(−ik1 ⋅ r) exp(−ik2 ⋅ r) exp(ik3 ⋅ r) = exp[−i(k1 + k2 − k3 ) ⋅ r] , (22.65) sodass auch Welle 4 eine ebene Welle mit dem Wellenvektor k4 = k1 + k2 − k3 ist. Daraus folgt k1 + k2 = k3 + k4 .
(22.66)
Gleichung (22.66) ist die Phasenbedingung für die Vierwellenmischung.
k4
(a)
(b)
Abb. 22.23 Die Vierwellenmischung: (a) Phasenbedingung, (b) die Wechselwirkung von vier Photonen.
Mehrere Prozesse der Vierwellenmischung laufen gleichzeitig ab, die jeweils die Frequenz- und Phasenbedingung erfüllen. Wie zuvor gezeigt wechselwirken die Wellen 1, 2 und 3 und erzeugen Welle 4 gemäß Gl. (22.63). Entsprechend wechselwirken die Wellen 3, 4 und 1 und erzeugen Welle 2 gemäß 𝑃nl (𝜔2 ) = 6𝜒 (3) 𝐸(𝜔3 )𝐸(𝜔4 )𝐸 ∗ (𝜔1 ) .
(22.67)
Der Prozess der Vierwellenmischung kann auch als eine Wechselwirkung zwischen vier Photonen interpretiert werden. Ein Photon der Frequenz 𝜔3 und eines der Frequenz 𝜔4 werden vernichtet, um ein Photon der Frequenz 𝜔1 und eines der Frequenz 𝑤2 zu erschaffen, wie in Abb. 22.23 dargestellt. Die Gln. (22.64) und (22.66) beschreiben die Energie- bzw. Impulserhaltung. Dreiwellenmischung
In dem teilweise entarteten Fall, dass zwei der vier Wellen dieselbe Frequenz 𝜔3 = 𝜔4 ≡ 𝜔0 haben, haben wir drei Wellen, deren Frequenzen durch 𝜔1 + 𝜔2 = 2𝜔0
(22.68)
verknüpft sind, sodass die Frequenzen 𝜔1 und 𝜔2 symmetrisch zu der Mittenfrequenz 𝜔0 liegen, ähnlich wie die Seitenbanden einer amplitudenmodulierten Sinuswelle oder die Stokes- und Antistokesfrequenzen in der Ramanstreuung. Die Komponenten der nichtlinearen Polarisation bei 𝜔1 , 𝜔2 und 𝜔3 enthalten Terme der Form 𝑃nl (𝜔1 ) = 3𝜒 (3) 𝐸 2 (𝜔3 )𝐸 ∗ (𝜔2 ) , (3)
∗
𝑃nl (𝜔2 ) = 3𝜒 𝐸 (𝜔3 )𝐸 (𝜔1 ) , (3)
2
∗
𝑃nl (𝜔3 ) = 6𝜒 𝐸(𝜔1 )𝐸(𝜔2 )𝐸 (𝜔3 ) .
(22.69a) (22.69b) (22.69c)
Diese Terme sind für die Dreiwellenmischung verantwortlich, d. h. die Strahlung bei der Frequenz jeder Welle, die durch Mischung mit den anderen Wellen entsteht. Diese Mischprozesse können ähnlich wie die Dreiwellenmischung in nichtlinearen Medien zweiter Ordnung für die optische Frequenzkonversion, optische parametrische Verstärkung und Schwingung und die spontane parametrische Differenzfrequenzerzeugung genutzt werden; die Wellen bei 𝜔1 , 𝜔2 und 𝜔3 können als Signal-,
779
780
22 Nichtlineare Optik
Pumpe Signal ω1
ω0
Signal ω1
Signal
Pumpe ω0
ω1
Idler Quarzglasfaser
ω0
ω2
Beispiel 22-4: Die Konjugierte einer ebenen Welle
Idler- und Pumpwelle des parametrischen Prozesses aufgefasst werden. An dieser Dreiwellenmischung sind jedoch vier Photonen beteiligt, z. B. die Vernichtung von zwei Photonen bei 𝜔0 und die Erschaffung von zwei Photonen bei 𝜔1 und 𝜔2 . Ein Beispiel der optischen parametrischen Verstärkung in einem 𝜒 (3) -Medium wie z. B. einer optischen Quarzglasfaser ist in Abb. 22.24 illustriert.
22.3.5
Abb. 22.24 Optischer parametrischer Dreiwellen-Vierphotonen-Faserverstärker.
Pumpe
Wenn Welle 1 eine gleichförmige ebene Welle 𝐸1 (r) = 𝐴1 exp(−ik1 ⋅ r) ist, die sich in der Richtung k1 ausbreitet, dann ist 𝐸2 (r) = 𝐴1∗ exp(ik1 ⋅ r) eine gleichförmige ebene Welle, die sich in der entgegengesetzten Richtung k2 = −k1 ausbreitet, wie Abb. 22.25(b) zeigt. Die Phasenbedingung Gl. (22.66) ist damit erfüllt. Das Medium wirkt als ein spezieller „Spiegel“, der die einfallende ebene Welle auf sich selbst zurück reflektiert, egal unter welchem Winkel sie einfällt.
Optische Phasenkonjugation
Die Frequenzbedingung Gl. (22.64) ist erfüllt, wenn alle vier Wellen dieselbe Frequenz besitzen, 𝜔1 = 𝜔2 = 𝜔3 = 𝜔4 = 𝜔 .
(22.70)
Der Prozess wird dann als entartete Vierwellenmischung bezeichnet. Wenn wir weiter annehmen, dass zwei der Wellen (Welle 3 und 4) gleichförmige ebene Wellen sind, die sich in entgegengesetzten Richtungen ausbreiten, 𝐸3 (r) = 𝐴3 exp(−ik3 ⋅ r) ,
1 2
(a)
Abb. 22.25 Reflexion einer ebenen Welle an (a) einem gewöhnlichen Spiegel und (b) einem Phasenkonjugator.
𝐸4 (r) = 𝐴4 exp(−ik4 ⋅ r) ,
Beispiel 22-5: Die Konjugierte einer Kugelwelle
Wenn Welle 1 eine Kugelwelle um den Ursprung r = 0 ist, 𝐸1 (r) ∝ (1∕𝑟) exp(−i𝑘𝑟), besitzt Welle 2 die komplexe Amplitude 𝐸2 (r) ∝ (1∕𝑟) exp(+i𝑘𝑟). Das ist eine Kugelwelle, die sich rückwärts ausbreitet und auf den Ursprung konvergiert, wie Abb. 22.26(b) zeigt.
(22.71) mit k4 = −k3 ,
(22.72)
und die Gln. (22.71) und (22.72) in Gl. (22.67) einsetzen, sehen wir, dass die Polarisation der Welle 2 gleich 6𝜒 (3) 𝐴3 𝐴4 𝐸1∗ (r) ist. Dieser Term entspricht einer Quelle, die eine optische Welle (Welle 2) mit der komplexen Amplitude 𝐸2 (r) ∝ 𝐴3 𝐴4 𝐸1∗ (r)
(22.73)
emittiert. Da 𝐴3 und 𝐴4 Konstanten sind, ist Welle 2 proportional zu einer konjugierten Version von Welle 1. Das Bauelement ist ein Phasenkonjugator. Die Wellen 3 und 4 werden Pumpwellen genannt, und die Wellen 1 und 2 heißen Analysen- bzw. konjugierte Welle. Wie wir in Kürze zeigen werden, ist die konjugierte Welle mit der Analysenwelle identisch, nur dass sie sich in der entgegengesetzten Richtung ausbreitet. Der Phasenkonjugator ist ein spezieller Spiegel, der die Welle auf sich selbst zurück reflektiert, ohne ihre Wellenfront zu verändern. Um den Prozess der Phasenkonjugation zu verstehen, betrachten wir zwei einfache Beispiele.
(b)
0
0 (a)
(b)
Abb. 22.26 Reflexion einer Kugelwelle an (a) einem gewöhnlichen Spiegel und (b) einem Phasenkonjugator.
Da eine beliebige Analysenwelle als Superposition von ebenen Wellen betrachtet werden kann (siehe Kapitel 4), von denen jede durch den Konjugator auf sich selbst reflektiert wird, ist die konjugierte Welle mit der einfallenden Welle überall identisch, nur dass ihre Ausbreitungsrichtung umgekehrt ist. Die konjugierte Welle verfolgt die Spur der Originalwelle zurück und breitet sich rückwärts aus, wobei sie dieselbe Wellenfront beibehält. Phasenkonjugation ist analog zu einer Zeitumkehr. Um diese Aussage zu verstehen, untersuchen wir das
22.3 Nichtlineare Optik dritter Ordnung
Pumpe 3 Kristall Analyse 1 Laser Pumpe 4
Konjugierte 2
Feld der konjugierten Welle ℰ2 (r, 𝑡) = Re{𝐸2 (r) exp(i𝜔𝑡)} ∝ Re{𝐸1∗ (r) exp(i𝜔𝑡)}. Da der Realteil einer komplexen Zahl gleich dem Realteil ihrer komplex Konjugierten ist, gilt ℰ2 (r, 𝑡) ∝ Re{𝐸1 (r) exp(−i𝜔𝑡)}. Wenn wir das mit dem Feld der Analysenwelle vergleichen, ℰ1 (r, 𝑡) = Re{𝐸1 (r) exp(i𝜔𝑡)}, sehen wir leicht, dass das eine durch die Transformation 𝑡 → −𝑡 aus dem anderen erhalten wird, sodass die konjugierte Welle als eine zeitlich umgekehrte Version der Analysenwelle erscheint. Die konjugierte Welle kann mehr Leistung tragen als die Analysenwelle. Das hängt damit zusammen, dass die Intensität der konjugierten Welle (Welle 2) proportional zum Produkt der Intensitäten der Pumpwellen 3 und 4 ist [siehe Gl. (22.73)]. Wenn die Leistungen der Pumpwellen vergrößert werden, sodass die konjugierte Welle (Welle 2) mehr Leistung trägt als die Analysenwelle (Welle 1), wirkt das Medium als „Verstärkerspiegel“. Ein Beispiel für eine Anordnung zur Demonstration der optischen Phasenkonjugation ist in Abb. 22.27 gezeigt. Entartete Vierwellenmischung als Form der Echtzeitholographie
Die entartete Vierwellenmischung ist analog zur Volumenholographie (siehe Abschnitt 4.5). Holographie ist ein zweistufiger Prozess, in dem das Interferenzmuster durch die Superposition einer Gegenstandswelle 𝐸1 und einer Referenzwelle 𝐸3 in einer lichtempfindlichen Schicht registriert wird. Anschließend wird eine ande-
Welle 3 (Referenz)
1 lle We jekt) b 2 (O lle rte) We jugie on (K
Welle 4 (Referenz)
(a)
Abb. 22.27 Ein optisches System für die entartete Vierwellenmischung mit einem nichtlinearen Kristall. Die Pumpwellen 3 und 4 und die Analysenwelle 1 werden mithilfe eines Strahlteilers und zweier Spiegel aus einem einzigen Laser entnommen. Die konjugierte Welle 2 wird in dem Kristall erzeugt.
re Referenzwelle 𝐸4 durch die Schicht transmittiert oder von ihr reflektiert, wobei je nach der verwendeten Anordnung die Konjugierte der Gegenstandswelle 𝐸2 ∝ 𝐸4 𝐸3 𝐸1∗ oder ihre Kopie 𝐸2 ∝ 𝐸4 𝐸1 𝐸3∗ erzeugt wird [siehe Abb. 4.55(a) und (b)]. Das nichtlineare Medium erlaubt die gleichzeitige holographische Aufnahme und Rekonstruktion in Echtzeit. Dieser Prozess ist sowohl in Kerrmedien als auch in photorefraktiven Medien möglich (siehe Abschnitt 21.4). Wenn vier Wellen in einem nichtlinearen Medium gemischt werden, interferiert jedes Paar von Wellen und erzeugt ein Gitter, an dem eine dritte Welle reflektiert wird und die vierte Welle erzeugt. Die Rollen der Referenz und des Gegenstands werden unter den vier Wellen ausgetauscht; es gibt daher zwei Arten von Gittern, wie in Abb. 22.28 dargestellt. Wir betrachten zuerst den in Abb. 22.28(a) illustrierten Prozess [siehe auch Abb. 4.55(a)]. Wie nehmen an, dass die beiden Referenzwellen (als Wellen 3 und 4 bezeichnet) ebene Wellen sind, die sich entgegengesetzt ausbreiten. Die beiden Schritte der Holographie sind: 1) Die Gegenstandswelle 1 wird zur Referenzwelle 3 addiert, und die Intensität der Summe wird im Medium in Form eines Volumengitters (des Hologramms) registriert. 2) Bei der Rekonstruktion wird die Referenzwelle 4 am Gitter braggreflektiert und erzeugt die konjugierte Welle (Welle 2).
Welle 3 (Referenz)
2 lle te) We ugier j 1 on lle ) (K We bjekt (O
Welle 4 (Referenz)
(b)
Abb. 22.28 Vierwellenmischung in einem nichtlinearen Medium. Eine Referenz- und eine Gegenstandswelle interferieren und erzeugen ein Gitter, an dem die zweite Referenzwelle reflektiert wird und eine konjugierte Welle erzeugt. Es gibt zwei Möglichkeiten entsprechend einem (a) Transmissions- und (b) Reflexionsgitter.
781
782
22 Nichtlineare Optik
Abb. 22.29 Optische Reziprozität.
Dieses Gitter wird als Transmissionsgitter bezeichnet. Die zweite Möglichkeit, in Abb. 22.28(b) dargestellt, ist dass die Referenzwelle 4 mit der Gegenstandswelle 1 interferiert und ein Gitter, das sogenannte Reflexionsgitter, erzeugt, an dem die zweite Referenzwelle 3 reflektiert wird und die konjugierte Welle 2 erzeugt. Diese beiden Gitter können gemeinsam existieren, aber sie haben gewöhnlich unterschiedliche Wirkungsgrade. Zusammengefasst halten wir fest, dass die Vierwellenmischung ein Werkzeug zur Realisierung der Echtzeitholographie oder einer Phasenkonjugation sein kann, die beide eine Reihe von Anwendungen in der optischen Signalverarbeitung haben.
verzerrendes Medium
Spiegel
phasenkonjugierter Spiegel
Abb. 22.31 Ein optischer Resonator mit einem normalen und einem phasenkonjugierenden Spiegel.
gel durch einen phasenkonjugierenden Spiegel sicher, dass die Verzerrung bei jedem Umlauf sofort wieder entfernt wird, sodass die Resonatormoden unverzerrte Wellenfronten besitzen, wie in Abb. 22.31 dargestellt.
Phasenkonjugatoren bei der Wellenwiederherstellung
Die Fähigkeit, eine Welle auf sich selbst zu reflektieren, sodass sie ihren Weg in entgegengesetzter Richtung zurückverfolgt, macht eine Reihe von nützlichen Anwendungen möglich, z. B. die Entfernung von Wellenfrontfehlern. Die Idee beruht auf dem Prinzip der Reziprozität, das in Abb. 22.29 illustriert ist. Strahlen, die sich von links nach rechts durch ein lineares optisches Medium ausbreiten, folgen demselben Pfad, wenn sie umkehren und in der entgegengesetzten Richtung zurücklaufen. Dasselbe Prinzip gilt für Wellen. Wenn die Wellenfront eines optischen Strahls beim Durchgang durch ein Medium verzerrt wird, kann die ursprüngliche Welle mithilfe eines Konjugators wiederhergestellt werden. Er reflektiert den Strahl auf sich selbst und lässt ihn noch einmal durch dasselbe Medium laufen, wie in Abb. 22.30 dargestellt. Anwendung findet dieses Prinzip z. B. in optischen Resonatoren (siehe Kapitel 11). Wenn der Resonator die Wellenfront verzerrt, stellt der Austausch eines der Spie-
22.4 Nichtlineare Optik zweiter Ordnung: Die Theorie gekoppelter Wellen In diesem Abschnitt stellen wir eine quantitative Analyse der Dreiwellenmischung in einem nichtlinearen optischen Medium zweiter Ordnung unter Verwendung einer Theorie gekoppelter Wellen vor. Im Unterschied zu der Behandlung in Abschnitt 22.2 werden dabei alle drei Wellen gleichberechtigt behandelt. Um die Analyse zu vereinfachen, verschieben wir anisotrope und dispersive Effekte dabei auf die Abschnitte 22.6 bzw. 22.7.
22.4.1
Die Gleichungen gekoppelter Wellen
Nach den Gln. (22.6) und (22.7) wird die Wellenausbreitung in einem nichtlinearen Medium zweiter Ordnung durch die elementare Wellengleichung ∇2 ℰ −
1 𝜕2 ℰ = −𝒮 𝑐2 𝜕𝑡2
(22.74)
bestimmt, wobei 𝒮 = −𝜇0
𝜕 2 𝒫nl 𝜕𝑡2
(22.75)
als Strahlungsquelle betrachtet wird und verzerrendes Medium
phasenkonjugierter Spiegel
Abb. 22.30 Ein Phasenkonjugator-Spiegel reflektiert eine verzerrte Welle auf sich selbst, sodass die Verzerrung kompensiert wird, wenn sie zurückläuft.
𝒫nl = 2dℰ 2
(22.76)
die nichtlineare Komponente der Polarisation ist. Bei der Dreiwellenmischung wird das Feld ℰ(𝑡) als Superposition von drei Wellen der Kreisfrequenzen 𝜔1 , 𝜔2
22.4 Nichtlineare Optik zweiter Ordnung: Die Theorie gekoppelter Wellen
und 𝜔3 mit den komplexen Amplituden 𝐸1 , 𝐸2 und 𝐸3 aufgefasst, ∑ Re{𝐸𝑞 exp(i𝜔𝑞 𝑡)} ℰ(𝑡) = 𝑞 = 1,2,3
∑
=
1
𝑞 = 1,2,3
2
] [ 𝐸𝑞 exp(i𝜔𝑞 𝑡) + 𝐸𝑞∗ exp(−i𝜔𝑞 𝑡) (22.77)
[vgl. Gl. (22.19) im Kontext der ersten bornschen Näherung]. Es ist zweckmäßig, Gl. (22.77) in der kompakten Form ∑
ℰ(𝑡) =
1
𝑞 = ±1,±2,±3
2
𝐸𝑞 exp(i𝜔𝑞 𝑡)
(22.78)
zu schreiben, wobei 𝜔−𝑞 = −𝜔𝑞 und 𝐸−𝑞 = 𝐸𝑞∗ ist. Die entsprechende Polarisation erhalten wir durch Einsetzen in Gl. (22.76) als Summe von 6 × 6 = 36 Termen, 𝒫nl (𝑡) = 2d ⋅
∑
1 4
𝑞,𝑟 = ±1,±2,±3
𝐸𝑞 𝐸𝑟 exp[i(𝜔𝑞 + 𝜔𝑟 )𝑡] . (22.79)
Folglich ist die entsprechende Strahlungsquelle ∑
1
𝒮 = 𝜇0 d 2
(∇ + (∇ + 2
𝑆1 = 2𝜇0 𝜔12 d 𝐸3 𝐸2∗ ,
(22.83)
2𝜇0 𝜔22 d 𝐸3 𝐸1∗ , 2𝜇0 𝜔32 d 𝐸1 𝐸2 .
(22.84)
(22.80)
𝑆3 =
(∇2 + 𝑘12 )𝐸1 = −𝑆1 ,
(22.81a)
= −𝑆2 ,
(22.81b)
= −𝑆3 ,
(22.81c)
wobei 𝑆𝑞 die Amplitude der Komponente von 𝒮 mit der Frequenz 𝜔𝑞 ist und 𝑘𝑞 = 𝑛𝜔𝑞 ∕𝑐0 (𝑞 = 1, 2, 3). Jede der komplexen Amplituden der drei Wellen erfüllt die Helmholtzgleichung mit einer Quelle gleich der Komponente von 𝒮 bei der jeweiligen Frequenz. Unter bestimmten Bedingungen hängt die Quelle für eine Welle von den elektrischen Feldern der anderen beiden Wellen ab, sodass die drei Wellen gekoppelt sind.
(22.82)
Die Quelle 𝒮 enthält dann Komponenten bei den Frequenzen 𝜔1 , 𝜔2 und 𝜔3 . Auswertung der 36 Terme aus Gl. (22.80) liefert
𝑆2 =
𝑞,𝑟 = ±1,±2,±3
𝑘22 )𝐸2 𝑘32 )𝐸3
𝜔1 + 𝜔2 = 𝜔3 .
(𝜔𝑞 + 𝜔𝑟 ) 𝐸𝑞 𝐸𝑟 exp[i(𝜔𝑞 + 𝜔𝑟 )𝑡] , 2
was eine Summe von harmonischen Komponenten liefert, deren Frequenzen Summen und Differenzen der ursprünglichen Frequenzen 𝜔1 , 𝜔2 und 𝜔3 sind. Wenn wir die Gln. (22.78) und (22.80) in die Wellengleichung (22.74) einsetzen, erhalten wir eine einzige Differentialgleichung mit vielen Termen, von denen jeder eine harmonische Funktion einer Frequenz ist. Wenn die Frequenzen 𝜔1 , 𝜔2 und 𝜔3 verschieden sind, können wir diese Gleichung in drei zeitunabhängige Differentialgleichungen separieren, indem wir Terme mit den Frequenzen 𝜔1 , 𝜔2 und 𝜔3 auf beiden Seiten von Gl. (22.74) separat gleichsetzen. Das Ergebnis liefert drei Helmholtzgleichungen mit zugehörigen Quellen,
2
Ohne Nichtlinearität ist d = 0, sodass der Quellterm 𝒮 verschwindet und jede der drei Wellen die Helmholtzgleichung unabhängig von den anderen beiden erfüllt, wie in der linearen Optik zu erwarten ist. Wenn die Frequenzen 𝜔1 , 𝜔2 und 𝜔3 nicht kommensurabel sind (die eine Frequenz also nicht die Summe oder die Differenz der beiden anderen ist, und keine Frequenz das Doppelte einer anderen ist), dann enthält der Quellterm 𝒮 keine Komponenten der Frequenzen 𝜔1 , 𝜔2 oder 𝜔3 . Die Komponenten 𝑆1 , 𝑆2 und 𝑆3 verschwinden dann, und die drei Wellen wechselwirken nicht. Damit die drei Wellen durch das Medium gekoppelt werden, müssen ihre Frequenzen kommensurabel sein. Zum Beispiel können wir annehmen, dass eine Frequenz die Summe der anderen beiden ist,
(22.85)
Die Quelle von Welle 1 ist proportional zu 𝐸3 𝐸2∗ (da 𝜔1 = 𝜔3 − 𝜔2 ist), sodass die Wellen 2 und 3 gemeinsam zum Wachstum von Welle 1 beitragen. Ähnlich ist die Quelle von Welle 3 proportional zu 𝐸1 𝐸2 (da 𝜔3 = 𝜔1 + 𝜔2 ist), sodass die Wellen 1 und 2 gemeinsam Welle 3 verstärken und so weiter. Die drei Wellen werden so durch das Medium gekoppelt oder „gemischt“; der Prozess wird durch drei gekoppelte Differentialgleichungen in 𝐸1 , 𝐸2 und 𝐸3 beschrieben: (∇2 + 𝑘12 )𝐸1 = −2𝜇0 𝜔12 d 𝐸3 𝐸2∗ ,
(22.86a)
−2𝜇0 𝜔22 d 𝐸3 𝐸1∗ , −2𝜇0 𝜔32 d 𝐸1 𝐸2 .
(22.86b)
(∇ + 2
(∇ + 2
𝑘22 )𝐸2 𝑘32 )𝐸3
= =
(22.86c)
Übung 22-6: Frequenzverdopplung als entartete Dreiwellenmischung
Die Gln. (22.86) gelten nur, wenn die Frequenzen 𝜔1 , 𝜔2 und 𝜔3 unterschiedlich sind. Wir betrachten nun den entarteten Fall mit 𝜔1 = 𝜔2 = 𝜔 und 𝜔3 = 2𝜔, sodass es nur zwei anstatt drei Wellen mit dem Amplituden 𝐸1 und 𝐸3 gibt; diese Situation entspricht der Frequenzverdopplung. Zeigen Sie, dass diese Wellen die Helmholtzgleichung mit den Quellen 𝑆1 = 2𝜇0 𝜔12 d 𝐸3 𝐸1∗ , 𝑆3 =
𝜇0 𝜔32 d 𝐸1 𝐸1
(22.87) (22.88)
783
784
22 Nichtlineare Optik
erfüllen, sodass die gekoppelten Wellengleichungen (∇ + 2
(∇ + 2
𝑘12 )𝐸1 𝑘32 )𝐸3
= =
−2𝜇0 𝜔12 d 𝐸3 𝐸1∗ −𝜇0 𝜔32 d 𝐸1 𝐸1
,
(22.89a) (22.89b)
sind. Diese Gleichungen lassen sich nicht durch eine einfache Gleichsetzung 𝐸1 = 𝐸2 aus den Gln. (22.86) für die Dreiwellenmischung erhalten [es fehlt der Faktor 2 in Gl. (22.89b)].
da2 = −iga3 a∗1 exp(−iΔ𝑘 𝑧) , d𝑧 da3 = −iga1 a2 exp(iΔ𝑘 𝑧) , d𝑧
Wir betrachten drei ebene Wellen, die sich mit den komplexen Amplituden 𝐸𝑞 = 𝐴𝑞 exp(−i𝑘𝑞 𝑧), den komplexen Einhüllenden 𝐴𝑞 und den Wellenzahlen 𝑘𝑞 = 𝜔𝑞 ∕𝑐 (𝑞 = 1, 2, 3) in 𝑧-Richtung ausbreiten. Es ist zweckmäßig, die komplexen Einhüllenden durch Definition der Variablen 𝑎𝑞 = 𝐴𝑞 ∕(2𝜂ℏ𝜔𝑞 )1∕2 zu normieren, wobei 𝜂 = 𝜂0 ∕𝑛 die Impedanz des Mediums ist, 𝜂0 = (𝜇0 ∕𝜀0 )1∕2 die Impedanz des Vakuums, und ℏ𝜔𝑞 die Energie eines Photons der Kreisfrequenz 𝜔𝑞 . Es gilt also √ 𝐸𝑞 = 2𝜂ℏ𝜔𝑞 a𝑞 exp(−i𝑘𝑞 𝑧) , 𝑞 = 1, 2, 3 , (22.90) und die Intensitäten der drei Wellen sind 𝐼𝑞 = |𝐸𝑞 |2 ∕2𝜂 = ℏ𝜔𝑞 |a𝑞 |2 . Die Photonenflussdichten dieser Wellen sind 𝜙𝑞 =
𝐼𝑞 ℏ𝜔𝑞
= |a𝑞 |2 .
(22.91)
Die Variable a𝑞 bezeichnet daher die komplexe Einhüllende der Welle 𝑞, die so skaliert ist, dass |a𝑞 |2 die Photonenflussdichte ergibt. Diese Skalierung ist zweckmäßig, da der Prozess der Wellenmischung die Photonenzahl erhalten muss (siehe Abschnitt 22.2.3). Infolge der Wechselwirkung zwischen den drei Wellen ändern sich die komplexen Einhüllenden a𝑞 mit 𝑧, sodass a𝑞 = a𝑞 (𝑧) ist. Wenn die Wechselwirkung schwach ist, variieren die a𝑞 (𝑧) langsam mit 𝑧, sodass sie auf Entfernungen von ungefähr einer Wellenlänge näherungsweise konstant angenommen werden können. Dadurch können wir die Näherung der langsam variie2 renden Einhüllenden verwenden, in der d a𝑞 ∕ d𝑧2 gegen 𝑘𝑞 da𝑞 ∕ d𝑧 = (2π∕𝜆𝑞 ) d𝑎𝑞 ∕ d𝑧 vernachlässigt wird und daher (∇2 + 𝑘𝑞2 )[a𝑞 exp(−i𝑘𝑞 𝑧)] ≈ −i2𝑘𝑞
da𝑞 d𝑧
exp(−i𝑘𝑞 𝑧) (22.92)
gilt (siehe Abschnitt 2.2.3). Mit dieser Näherung reduziert sich Gl. (22.86) auf einfachere Gleichungen, die mit den paraxialen Helmholtzgleichungen verwandt sind, in denen die Phasenfehlanpassung berücksichtigt ist: da1 = −iga3 a∗2 exp(−iΔ𝑘 𝑧) , d𝑧
(22.93a)
(22.93c)
wobei g2 = 2ℏ𝜔1 𝜔2 𝜔3 𝜂3 d
2
(22.94)
ist und Δ𝑘 = 𝑘3 − 𝑘2 − 𝑘1
Mischung dreier kollinearer gleichförmiger ebener Wellen
(22.93b)
(22.95)
die Phasenfehlanpassung bezeichnet. Die Variationen von a1 , a2 und a3 mit 𝑧 werden daher durch drei gekoppelte Differentialgleichungen (22.93) erster Ordnung bestimmt, die wir im Folgenden für unterschiedlichen Randbedingungen entsprechend verschiedener Anwendungen lösen wollen. Zuerst wollen wir jedoch einige Invarianten der Wellenmischung herleiten. Sie sind Funktionen von a1 , a2 und a3 , die nicht von 𝑧 abhängen. Invarianten sind nützlich, da sie dazu verwendet werden können, die Zahl unabhängiger Variablen zu reduzieren. Die Übungen 22-8 und 22-7 entwickeln Invarianten aus der Erhaltung der Energie und der Photonenzahl. Übung 22-7: Erhaltung der Photonenzahl: Die ManleyRowe-Beziehung
Zeigen Sie unter Verwendung von Gl. (22.93), dass d d d |a1 |2 = |a2 |2 = − |a3 |2 d𝑧 d𝑧 d𝑧
(22.96)
gilt, woraus die Manley-Rowe-Beziehung Gl. (22.26) folgt, die wir aus der Erhaltung der Photonenzahl hergeleitet hatten. Gleichung (22.96) impliziert, dass auch |a1 |2 + |a3 |2 und |a2 |2 + |a3 |2 Invarianten der Wellenmischung sind. Übung 22-8: Energieerhaltung
Zeigen Sie, dass die Summe der Intensitäten 𝐼𝑞 = ℏ𝜔𝑞 |a𝑞 |2 (𝑞 = 1, 2, 3) der drei durch Gl. (22.93) gegebenen Wellen invariant bezüglich 𝑧 sind, dass also d (𝐼1 + 𝐼2 + 𝐼3 ) = 0 d𝑧
(22.97)
gilt.
22.4.2
Frequenzverdopplung
Die Frequenzverdopplung ist ein entarteter Fall der Dreiwellenmischung, bei dem 𝜔1 = 𝜔2 = 𝜔
und 𝜔3 = 2𝜔
(22.98)
ist. Dabei treten zwei Wechselwirkungen auf: Zwei Photonen der Frequenz 𝜔 vereinigen sich, um ein Photon
22.4 Nichtlineare Optik zweiter Ordnung: Die Theorie gekoppelter Wellen
soll dort reell sein. Wir suchen eine Lösung, für die a1 (𝑧) überall reell ist. Wenn wir die Beziehung a21 (𝑧) + 2|a3 (𝑧)|2 = a21 (0) aus der Energieerhaltung verwenden, liefert Gl. (22.102b) eine Differentialgleichung in a3 (𝑧),
der Frequenz 2𝜔 zu erzeugen (Frequenzverdopplung), oder ein Photon der Frequenz 2𝜔 spaltet sich in zwei Photonen der Frequenz 𝜔 auf (entartete parametrische Differenzfrequenzerzeugung). Die Wechselwirkung der beiden Wellen wird durch die paraxialen Helmholtzgleichungen mit Quellen beschrieben. Die Impulserhaltung erfordert 2k1 = k3 .
] 𝑔 [ da3 = −i ( ) a21 (0) − 2|a3 (𝑧)|2 , 2 d𝑧
deren Lösung in Gl. (22.102a) eingesetzt werden kann, um die gesamte Lösung zu liefern,
(22.99)
1
Übung 22-9: Die Gleichungen gekoppelter Wellen für die Frequenzverdopplung
a1 (𝑧) = a1 (0) sech ( √ ga1 (0)𝑧) ,
(22.104a)
i 1 a3 (𝑧) = − √ a1 (0) tanh ( √ ga1 (0)𝑧) . 2 2
(22.104b)
2
Wenden Sie die Näherung der langsam variierenden Einhüllenden, Gl. (22.92), auf die Helmholtzgleichungen (22.89) für zwei kollineare Wellen im entarteten Fall an, und zeigen Sie, dass da1 = −iga3 a∗1 exp(−iΔ𝑘𝑧) , d𝑧
Die Photonenflussdichten 𝜙1 (𝑧) = |a1 (𝑧)|2 und 𝜙3 (𝑧) = |a3 (𝑧)|2 entwickeln sich folglich gemäß 𝜙1 (𝑧) = 𝜙1 (0) sech
(22.100a)
2 𝛾𝑧
1
2 2
𝜙3 (𝑧) = 𝜙1 (0) tanh 2
da3 g = −i a1 a1 exp(iΔ𝑘𝑧) , 2 d𝑧
(22.103)
,
(22.105a)
𝛾𝑧 , 2
(22.105b)
√ mit 𝛾∕2 = ga1 (0)∕ 2, d. h.
(22.100b)
mit Δ𝑘 = 𝑘3 − 2𝑘1 und
2
𝛾 2 = 2g2 a21 (0) = 2g2 𝜙1 (0) = 8d 𝜂3 ℏ𝜔3 𝜙1 (0)
2
g2 = 4ℏ𝜔3 𝜂3 d .
2
= 8d 𝜂3 𝜔2 𝐼1 (0) .
(22.101)
2
2
Da sech (⋅) + tanh (⋅) = 1 ist, ist 𝜙1 (𝑧) + 2𝜙3 (𝑧) = 𝜙1 (0) konstant, was zeigt, dass an jedem Ort 𝑧 Photonen der Welle 1 in halb so viele Photonen der Welle 3 umgewandelt werden. Das Abklingen von 𝜙1 (𝑧) und der Anstieg von 𝜙3 (𝑧) mit 𝑧 sind in Abb. 22.32(b) gezeigt. Da die durch Gl. (22.102) beschriebene Wechselwirkung für die Anfangsbedingungen a1 (0) = 0 und a3 (0) > 0 nicht einsetzt, ist der Umkehrprozess – die spontane parametrische Abwärtskonvertierung, siehe Abb. 22.10 – im Gültigkeitsbereich dieser klassischen Gleichungen nicht erlaubt.
Für zwei kollineare Wellen mit idealer Phasenanpassung (Δ𝑘 = 0) reduzieren sich die Gln. (22.100) auf da1 = −iga3 a∗1 , d𝑧 da3 g = −i a1 a1 . 2 d𝑧
(22.106)
(22.102a) (22.102b)
Wir nehmen die Amplitude der frequenzverdoppelten Welle am Eingang des Bauelements (bei 𝑧 = 0) als null an, a3 (0) = 0, und die der Grundwelle a1 (0) Grundwelle ω
ϕ 1 (z) +2 ϕ 3 (z)
ϕ 1 (0)
ℏω ϕ 1(z)
2ω
1 2
ϕ1 (0)
zweite Harmonische (a)
ℏ2ω
0
ϕ 3 (z)
0
2
4 (b)
Abb. 22.32 Frequenzverdopplung. (a) Eine Welle der Frequenz 𝜔 erzeugt beim Auftreffen auf einen nichtlinearen Kristall eine Welle der Frequenz 2𝜔. (b) Wenn die Photonenflussdichte 𝜙1 (z) der Grundwelle abnimmt, steigt die Photonenflussdichte 𝜙3 (z) der frequenzverdoppelten Wel-
ℏω
γz (c)
le. Da die Photonenzahl erhalten bleibt, ist die Summe
𝜙1 (z) + 2𝜙3 (z) = 𝜙1 (0) eine Konstante. (c) Zwei Photonen der Frequenz 𝜔 vereinigen sich und erzeugen ein Photon der Frequenz 2𝜔.
785
786
22 Nichtlineare Optik
Der Wirkungsgrad der Frequenzverdopplung
Phasenfehlanpassung bei der Frequenzverdopplung
Der Wirkungsgrad der Frequenzverdopplung ist für ein Wechselwirkungsgebiet der Länge 𝐿
Um die Wirkung einer Phasen- (oder Impuls-) Fehlanpassung zu untersuchen, verwenden wir die allgemeinen Gleichungen (22.100) mit Δ𝑘 ≠ 0. Der Einfachheit halber beschränken wir uns auf schwache Koppelung, für die 𝛾𝐿 ≪ 1 gilt. In diesem Fall ändert sich die Amplitude des Grundwelle a1 (𝑧) nur geringfügig mit 𝑧 [siehe Abb. 22.32(a)] und kann näherungsweise als konstant angenommen werden. Wenn wir a1 (𝑧) ≈ a1 (0) in Gl. (22.100b) einsetzen und integrieren, erhalten wir
𝜂FV =
𝐼3 (𝐿) ℏ𝜔3 𝜙3 (𝐿) 2𝜙3 (𝐿) 2 𝛾𝐿 = = = tanh . (22.107) 2 𝐼1 (0) ℏ𝜔1 𝜙1 (0) 𝜙1 (0)
Für große 𝛾𝐿 (lange Zelle, große Eingangsintensität oder großer nichtlinearer Parameter) geht der Wirkungsgrad gegen eins. Das bedeutet, dass die gesamte Eingangsleistung (bei der Frequenz 𝜔) in Leistung bei der Frequenz 2𝜔 umgewandelt wird; alle Eingangsphotonen der Frequenz 𝜔 werden in halb so viele Photonen der Frequenz 2𝜔 verwandelt. Für kleine 𝛾𝐿 [kleine Länge 𝐿 des Bauelements, kleiner nichtlinearer Parameter d oder kleine Photonenflussdichte 𝜙1 (0) am Eingang] wird das Argument der Funktion tanh klein, und daher kann die Näherung tanh 𝑥 ≈ 𝑥 verwendet werden. Der Wirkungsgrad der Frequenzverdopplung ist dann 𝜂FV =
2 3
= 2d 𝜂 ℏ𝜔 𝐿 𝜙1 (0) = 2d 𝜂 𝜔 𝐿 𝐼1 (0) , (22.108) 3 2
2 2
sodass 𝜂FV = 𝐶 2
𝐿2 A
2
P,
𝐶 2 = 2𝜔2 𝜂03
d 𝑛3
(22.109)
ist, wobei P = 𝐼1 (0)A die einfallende optische Leistung bei der Grundfrequenz ist und A die Querschnittsfläche. Damit haben wir wieder Gl. (22.13) erhalten und gezeigt, dass die Konstante 𝐶 2 proportional zu dem Ma2 terialparameter d ∕𝑛3 ist, der ein Bewertungskriterium für den Vergleich unterschiedlicher nichtlinearer Materialien ist. Beispiel 22-6: Wirkungsgrad der Frequenzverdopplung
Für ein Material mit d ∕𝑛3 = 10−46 C∕V2 (siehe Tabelle 22.3 für typische Werte von d) und eine Grundwelle der Wellenlänge 1 μm ist 𝐶 2 = 38 × 10−9 W−1 = 0.038 (MW)−1 . In diesem Fall ist der Wirkungsgrad der Frequenzverdopplung für P 𝐿2 ∕A = 2.63 MW gleich 10 %. Wenn das Seitenverhältnis des Wechselwirkungsvolumens 1000 ist, d. h. 𝐿2 ∕A = 106 , ist die erforderliche Leistung 2.63 W. Das kann z. B. durch 𝐿 = 1 cm und A = 100 μm2 entsprechend einer Leistungsdichte P∕A = 2.63 × 106 W∕cm2 realisiert werden. Der Wirkungsgrad der Frequenzverdopplung kann verbessert werden, indem man höhere Leistungsdichten, größere Wechselwirkungslängen oder Materialien mit einem größeren Koeffizienten d2 ∕𝑛3 verwendet. 2
0
g ) a2 (0)[exp(iΔ𝑘𝐿) − 1] , = −( 2 Δ𝑘 1
(22.110) 2
woraus 𝜙3 (𝐿) = |a3 (𝐿)|2 = (g∕Δ𝑘)2 𝜙12 (0) sin (Δ𝑘𝐿∕2) folgt, wobei wir angenommen haben, dass a1 (0) reell ist. Der Wirkungsgrad der Frequenzverdopplung ist daher 𝜂FV =
𝐼3 (𝐿) 1 1 ≈ 𝛾 2 𝐿2 = g2 𝐿2 𝜙1 (0) 4 2 𝐼1 (0) 2 3
𝐿
g a3 (𝐿) = −i a21 (0) ∫ exp(iΔ𝑘𝑧) d𝑧 2
𝐼3 (𝐿) 2𝜙3 (𝐿) 𝐿2 2 = = 𝐶 2 P sinc (Δ𝑘𝐿∕2π) (22.111) A 𝐼1 (0) 𝜙1 (0)
mit sinc(𝑥) = sin(π𝑥)∕(π𝑥). Die Phasenfehlanpassung reduziert daher den Wirkungsgrad der Frequenzverdopplung um den Faktor 2 sinc (Δ𝑘𝐿∕2π). Das bestätigt die zuvor erhaltenen Ergebnisse, die in Abb. 22.16 dargestellt sind. Für eine gegebene Fehlanpassung Δ𝑘 ist die Frequenzverdopplung effizient für Längen kleiner als die Kohärenzlänge 𝐿K = 2π∕|Δ𝑘|.
22.4.3
Optische Frequenzkonversion
Ein Summenfrequenzerzeuger (Abb. 22.33) wandelt eine Welle der Frequenz 𝜔1 in eine Welle der höheren Frequenz 𝜔3 um, wofür er eine Hilfswelle mit der Frequenz 𝜔2 verwendet, die sogenannte Pumpwelle. Ein Photon ℏ𝜔2 von der Pumpe wird zu einem Photon ℏ𝜔1 des Signals addiert und liefert ein Photon ℏ𝜔3 der Summenwelle mit der Summenfrequenz 𝜔3 = 𝜔1 + 𝜔2 . Der Umwandlungsprozess wird durch die drei gekoppelten Gln. (22.93) beschrieben. Wir nehmen der Einfachheit halber an, dass die drei Wellen phasenangepasst sind (Δ𝑘 = 0) und dass die Pumpe so stark ist, dass sich ihre Amplitude innerhalb der interessierenden Wechselwirkungslänge nicht merklich verändert; d. h. a2 (𝑧) ≈ a2 (0) für alle 𝑧 zwischen 0 und 𝐿. Die drei Gln. (22.93) reduzieren sich dann auf zwei, da1 𝛾 = −i a3 , 2 d𝑧 da3 𝛾 = −i a1 , 2 d𝑧
(22.112a) (22.112b)
22.4 Nichtlineare Optik zweiter Ordnung: Die Theorie gekoppelter Wellen
Signal
ω1
Summenfrequenzsignal ϕ 3 (z)
Summenfrequenzsignal
ω3 Pumpe
ϕ 1(0)
Signal ϕ 1(z)
π
2π
(a)
(b)
wobei 𝛾 = 2ga2 (0) ist und wir a2 (0) als reell angenommen haben. Das sind einfache Differentialgleichungen mit den harmonischen Lösungen 𝛾𝑧 , 2 𝛾𝑧 a3 (𝑧) = −ia1 (0) sin . 2
a1 (𝑧) = a1 (0) cos
(22.113a) (22.113b)
Die entsprechenden Photonenflussdichten sind 𝛾𝑧 , 2 2 𝛾𝑧 𝜙3 (𝑧) = 𝜙1 (0) sin . 2
𝜙1 (𝑧) = 𝜙1 (0) cos2
(22.114a) (22.114b)
Die Abhängigkeit der Photonenflussdichten 𝜙1 und 𝜙3 von 𝑧 ist in Abb. 22.33(b) skizziert. Zwischen den beiden Wellen werden periodisch Photonen ausgetauscht. Im Gebiet zwischen 𝑧 = 0 und 𝑧 = π∕𝛾 vereinigen sich die Eingabephotonen 𝜔1 mit den Pumpphotonen 𝜔2 und erzeugen die umgewandelten Photonen 𝜔3 . Welle 1 wird daher gedämpft, wohingegen Welle 3 verstärkt wird. Im Gebiet 𝑧 = π∕𝛾 bis 𝑧 = 2π∕𝛾 sind die 𝜔3 -Photonen zahlreicher; sie verwandeln sich in 𝜔1 - und 𝜔2 -Photonen, sodass Welle 3 gedämpft und Welle 1 verstärkt wird. Dieser Prozess wiederholt sich periodisch, während sich die Welle durch das Medium ausbreitet. Der Wirkungsgrad der Konversion beträgt 𝜂=
𝐼3 (𝐿) 𝜔3 2 𝛾𝐿 . sin = 𝜔1 2 𝐼1 (0)
(22.115)
Für 𝛾𝐿 ≪ 1 lässt sich dieser Ausdruck mithilfe von Gl. (22.94) näherungsweise als 𝐼3 (𝐿)∕𝐼1 (0) ≈ (𝜔3 ∕𝜔1 ) 2 (𝛾𝐿∕2)2 = (𝜔3 ∕𝜔1 )g2 𝐿2 𝜙2 (0) = 2𝜔32 𝐿2 d 𝜂3 𝐼2 (0) schreiben, woraus 𝜂 = 𝐶2
𝐿
2
A
2
P2 ,
𝐶 2 = 2𝜔32 𝜂03
d 𝑛3
ℏω3
ℏω2
ω2 0 0
ℏω1
(22.116)
folgt, wobei A die Querschnittsfläche ist und P 2 = 𝐼2 (0)A die Pumpleistung. Dieser Ausdruck ähnelt Gl. (22.109) für den Wirkungsgrad der Frequenzverdopplung.
3π
γz
ℏω3
ℏω 2
ℏω1
Abb. 22.33 Summenfrequenzerzeugung. (a) Wellenmischung. (b) Entwicklung der Photonenflussdichten der Eingabewelle 𝜔1 und der konvertierten Welle 𝜔3 . Die Pumpwelle 𝜔2 wird als konstant angenommen. (c) Photonenwechselwirkungen.
(c)
Übung 22-10: Summenfrequenzerzeugung im Infraroten
Ein Summenfrequenzerzeuger verwendet einen 2 Proustitkristall (d = 1.5 × 10−22 C∕V2 , 𝑛 = 2.6, d ∕𝑛3 = 1.3 × 10−45 C2 ∕V4 ). Die Eingabewelle stammt aus einem CO2 -Laser der Wellenlänge 10.6 μm und die Pumpwelle aus einem Nd3+:YAG-Laser mit einer Leistung von 1 W und einer Wellenlänge von 1.06 μm, der auf eine Querschnittsfläche von 10−2 mm2 fokussiert ist (siehe Abb. 22.8). Bestimmen Sie die Wellenlänge der konvertierten Welle und den Wirkungsgrad der Konversion, wenn die Wellen kollinear sind und die Wechselwirkungslänge 1 cm beträgt.
22.4.4 Optische parametrische Verstärkung und Oszillation Der optische parametrische Verstärker
Ein optischer parametrischer Verstärker verwendet Dreiwellenmischung in einem nichtlinearen Kristall, um einen optischen Gewinn [Abb. 22.34(a)] zu liefern. Der Prozess wird wieder durch die drei gekoppelten Gln. (22.93) beschrieben. Welle 1 ist das Signal, das verstärkt werden soll; sie fällt mit einer kleinen Intensität 𝐼1 (0) auf den Kristall. Welle 3, die Pumpwelle, ist eine intensive Welle, die dem Verstärker Leistung liefert. Welle 2, die sogenannte Idlerwelle, wird durch die Wechselwirkung im Kristall erzeugt. Wenn wir ideale Phasenanpassung (Δ𝑘 = 0) und eine konstante Pumpleistung annehmen, a3 (𝑧) ≈ a3 (0), liefern die Gln. (22.93) der gekoppelten Wellen da1 𝛾 = −i a∗2 , 2 d𝑧 𝛾 ∗ da2 = −i a1 , 2 d𝑧
(22.117a) (22.117b)
mit 𝛾 = 2ga3 (0). Wenn a3 (0) reell ist, ist auch 𝛾 reell, und die Differentialgleichungen haben die Lösungen 𝛾𝑧 𝛾𝑧 − ia∗2 (0) sinh , (22.118a) 2 2 𝛾𝑧 𝛾𝑧 a2 (𝑧) = −ia∗1 (0) sinh + a2 (0) cosh . (22.118b) 2 2 a1 (𝑧) = a1 (0) cosh
787
788
22 Nichtlineare Optik
Signal
ω1 Signal ϕ 1(z)
ω2 Pumpe
ℏω1
Idler
ℏω 3 ϕ 1(0)
ω3
0
Idler
1
0
(a)
(b)
ϕ 2(z)
2
ℏω2
γz
(c)
Abb. 22.34 Der optische parametrische Verstärker: (a) Wellenmischung. (b) Photonenflussdichten der Signal- und der Idlerwelle (die Photonenflussdichte der Pumpwelle ist als konstant angenommen). (c) Photonenmischung.
Wenn a2 (0) = 0 ist, d. h. wenn das anfängliche Idlerfeld null ist, dann sind die zugehörigen Photonenflussdichten 2 𝛾𝑧 , (22.119a) 𝜙1 (𝑧) = 𝜙1 (0) cosh 2 2 𝛾𝑧 𝜙2 (𝑧) = 𝜙1 (0) sinh . (22.119b) 2 Sowohl 𝜙1 (𝑧) als auch 𝜙2 (𝑧) wachsen monoton mit 𝑧, wie Abb. 22.34(b) zeigt. Dieses Wachstum wird gesättigt, wenn so viel Energie aus der Pumpe entnommen wird, dass die Annahme einer konstanten Pumpleistung nicht mehr gilt. Der gesamte Gewinn eines Verstärkers der Länge 𝐿 ist 2 𝐺 = 𝜙1 (𝐿)∕𝜙1 (0) = cosh (𝛾𝐿∕2). Im Grenzfall 𝛾𝐿 ≫ 1 ist 𝐺 = (e𝛾𝐿∕2 + e−𝛾𝐿∕2 )2 ∕4 ≈ e𝛾𝐿 ∕4, sodass der Gewinn exponentiell mit 𝛾𝐿 zunimmt. √ Für den Gewinnkoeffizienten gilt 𝛾 = 2ga3 (0) = 2d 2ℏ𝜔1 𝜔2 𝜔3 𝜂3 a3 (0) und daher 𝛾 = 2𝐶
√ √ 𝐼3 (0) = 2𝐶 P3 ∕A ,
2
d , 𝑛3 (22.120)
𝐶 2 = 2𝜔1 𝜔2 𝜂03
wobei P 3 = 𝐼3 (0)A die Pumpleistung ist, A die Querschnittsfläche und 𝐶 2 ein Parameter ähnlich dem bei der Frequenzverdopplung und der optischen Frequenzkonversion beschriebenen. Die Wechselwirkung kann auch so beschrieben werden, dass sich ein Pumpphoton ℏ𝜔3 in ein Photon ℏ𝜔1 aufspaltet, das die Signalwelle verstärkt, und ein Photon ℏ𝜔2 , das zur Idlerwelle beiträgt [Abb. 22.34(c)].
Übung 22-11: Gewinn eines optischen parametrischen Verstärkers
Ein optischer parametrischer Verstärker verstärkt Licht bei 2.5 μm mithilfe eines einen 2 cm langen KTP-Kristalls, der durch einen Nd:YAG Laser mit der Wellenlänge 1.064 μm gepumpt wird. Bestimmen Sie die Wellenlänge der Idlerwelle und den Koeffizienten 𝐶 in Gl. (22.120). Bestimmen Sie die passende Laserleistung und die Querschnittsfläche des Strahls, sodass der Gesamtgewinn des Verstärkers 3 dB beträgt. Nehmen Sie 𝑛 = 1.75 und d = 2.3 × 10−23 C∕V2 an. Der optische parametrische Oszillator
Ein parametrischer Oszillator wird konstruiert, indem man für die Signal- oder die Idlerfrequenz eines parametrischen Verstärkers oder für beide eine Rückkopplung hinzufügt, wie in Abb. 22.35 dargestellt. Wenn nur eine der Wellen rückgekoppelt wird, wird der Oszillator als einfach resonanter Oszillator bezeichnet; wenn beide Rückkopplung erfahren, handelt es sich um einen doppelt resonanten Oszillator. Der Schwingungsfrequenzen 𝜔1 und 𝜔2 des parametrischen Oszillators sind im kollinearen Fall durch die Frequenz- und Phasenbedingungen 𝜔1 + 𝜔2 = 𝜔3 und 𝑛1 𝜔1 + 𝑛2 𝜔2 = 𝑛3 𝜔3 bestimmt. Die Lösung dieser beiden Gleichungen liefert 𝜔1 und 𝜔2 , wie in Abschnitt 22.2.4 beschrieben. Außerdem müssen diese Frequenzen auch mit den Resonanzfrequenzen der Resonatormoden übereinstimmen, ähnlich wie bei herkömm-
Signal ω1
Signal ω1 Idler ω 2 Pumpe ω3
Idler ω2
Pumpe ω3 (a)
(b)
Abb. 22.35 Der parametrische Oszillator erzeugt Licht bei den Frequenzen 𝜔1 und 𝜔2 . Eine Pumpe mit der Frequenz 𝜔3 = 𝜔1 + 𝜔2 dient als Energiequelle. (a) Einfach resonanter Oszillator. (b) Doppelt resonanter Oszillator.
22.5 Nichtlineare Optik dritter Ordnung: Die Theorie gekoppelter Wellen
lichen Lasern (siehe Abschnitt 16.1.2). Ein solches System ist daher häufig überbestimmt, vor allem bei doppelt resonanten Oszillatoren, bei denen sowohl die Signalals auch die Idlerfrequenz mit Resonatormoden zusammenfallen müssen. Eine weitere Bedingung für die Oszillation ist, dass der Gewinn des Verstärkers bei einem Umlauf durch den Resonator größer sein muss als der durch die Spiegel verursachte Verlust. Indem wir den Gewinn und den Verlust gleichsetzen, können wir Ausdrücke für den Schwellengewinn und die entsprechende Schwellen-Pumpintensität des Verstärkers herleiten, wie im Folgenden für einfach und doppelt resonante Verstärker gezeigt wird. Einfach resonanter Oszillator
An der Schwelle der Oszillation ist die verstärkte und doppelt reflektierte Amplitude a1 (𝐿) r21 des Signals gleich der anfänglichen Amplitude a1 (0), wobei 𝐿 die Länge des nichtlinearen Mediums ist und r1 der Betrag des Amplitudenreflexionsgrads eines Spiegels (die zwei Spiegel werden identisch angenommen, und die mit einem Umlauf verbundene Phase wird nicht berücksichtigt, da sie nur ein Vielfaches von 2π ist). Wenn wir Gl. (22.118a) und die Randbedingung a2 (0) = 0 benutzen, erhalten wir r21 cosh(𝛾𝐿∕2) = 1 und daraus 2
ℛ12 cosh (𝛾𝐿∕2) = 1 .
(22.121)
Hier ist ℛ1 = r21 der Intensitätsreflexionsgrad des Spiegels bei der Signalfrequenz. Da ℛ1 normalerweise etwas 2 kleiner ist als eins, ist cosh (𝛾𝐿∕2) geringfügig größer 2 als eins, d. h. 𝛾𝐿∕2 ≪ 1, und die Näherung cosh (𝑥) ≈ 2 1 + 𝑥 kann verwendet werden. Daraus folgt, dass an der Schwelle (𝛾𝐿∕2)2 ≈ (1 − ℛ12 )∕ℛ12 ist. Mit Gl. (22.120) erhalten wir daraus die Schwellenintensität und daraus wiederum die Schwellenleistung der Pumpe, P 3 |Sch (0) ≈
2 1 A 1 − ℛ1 , 𝐶 2 𝐿2 ℛ12
(22.122)
und die Konjugierte bilden, erhalten wir 𝛾𝐿 𝛾𝐿 ∗ ) a1 (0) + (iℛ1 sinh ) a2 (0) = 0 , 2 2 (22.123a) 𝛾𝐿 𝛾𝐿 ∗ (−iℛ2 sinh ) a1 (0) + (1 − ℛ2 cosh ) a2 (0) = 0 , 2 2 (22.123b) (1 − ℛ1 cosh
wobei ℛ1 = r21 und ℛ2 = r22 die Intensitätsreflexionsgrade der Spiegel bei der Signal- bzw. der Idlerfrequenz sind. Gleichsetzen der Werte des Verhältnisses a1 (0)∕a∗2 (0) nach den Gln. (22.123a) und (22.123b) liefert cosh (
𝛾𝐿 1 + ℛ1 ℛ2 )= . 2 ℛ1 + ℛ2
(22.124)
Für den Fall 𝛾𝐿∕2 ≪ 1 können wir wieder die Näherung 2 cosh 𝑥 ≈ 1 + 𝑥2 benutzen und (𝛾𝐿∕2)2 ≈ (1 − ℛ12 )(1 − ℛ22 )∕(ℛ1 + ℛ2 )2 schreiben, woraus wir die SchwellenPumpleistung erhalten: P 3 |Sch (0) ≈
2 2 1 A (1 − ℛ1 )(1 − ℛ2 ) . 𝐶 2 𝐿2 (ℛ1 + ℛ2 )2
(22.125)
Das Verhältnis der Schwellen-Pumpleistung für den doppelt resonanten Oszillators zu der des einfach resonanten Oszillators nach den Gln. (22.122) bzw. (22.125) ist ℛ12 ∕(1 − ℛ22 )(ℛ1 + ℛ2 )2 . Wegen ℛ1 ≈ 1 und ℛ2 ≈ 1 ist das näherungsweise gleich (1 − ℛ2 )∕2, also eine kleine Zahl. Die Schwellenleistung für den doppelt resonanten Oszillator ist also wesentlich kleiner als die für den einfach resonanten Oszillator. Leider reagieren doppelt resonante Oszillatoren viel empfindlicher auf Fluktuationen der Resonatorlänge, weil in ihnen die Frequenzen sowohl der Signal- als auch der Idlerwelle mit Resonatormoden übereinstimmen müssen. Doppelt resonante Oszillatoren haben daher häufig eine schlechte Stabilität und Spektren mit unregelmäßigen Spitzen.
2
wobei 𝐶 2 = 2𝜔1 𝜔2 𝜂03 d ∕𝑛3 ist und A die Querschnittsfläche bezeichnet. Für 𝐿2 ∕A = 106 , 𝐶 2 = 10−7 W−1 und ℛ1 = 0.9 ist beispielsweise P 3 |Sch (0) ≈ 2.3 W. Doppelt resonanter Oszillator
An der Schwelle müssen zwei Bedingungen erfüllt sein: a1 (𝐿) r21 = a1 (0) und a2 (𝐿) r22 = a2 (0), wobei r1 und r2 die Beträge der Amplitudenreflexionsgrade der Spiegel bei der Signal- bzw. der Idlerfrequenz sind. Wenn wir a1 (𝐿) aus Gl. (22.118a) und a2 (𝐿) aus Gl. (22.118b) einsetzen
22.5 Nichtlineare Optik dritter Ordnung: Die Theorie gekoppelter Wellen 22.5.1 Vierwellenmischung Wir leiten nun die gekoppelten Differentialgleichungen her, die die Vierwellenmischung in einem nichtlinearen Medium dritter Ordnung beschreiben. Dabei greifen wir auf einen Ansatz ähnlich dem für die Dreiwellenmischung in Abschnitt 22.4 verwendeten zurück.
789
790
22 Nichtlineare Optik
Die Gleichungen gekoppelter Wellen
Vier Wellen, die ein Gesamtfeld ∑ Re[𝐸𝑞 exp(i𝜔𝑞 𝑡)] ℰ(𝑡) = 𝑞 = 1,2,3,4
=
∑
𝑞 = ±1,±2,±3,±4
1 2
𝐸𝑞 exp(i𝜔𝑞 𝑡)
(22.126)
bilden, breiten sich in einem Medium aus, das durch eine nichtlineare Polarisation 𝒫nl = 4𝜒 (3) ℰ 3
(22.127)
charakterisiert wird. Die entsprechende Strahlungsquelle 𝒮 = −𝜇0 𝜕 2 𝒫nl ∕𝜕𝑡2 ist daher eine Summe von 83 = 512 Termen, ∑ 1 (𝜔𝑞 + 𝜔𝑝 + 𝜔𝑟 )2 𝐸𝑞 𝐸𝑝 𝐸𝑟 𝒮 = 𝜇0 𝜒 (3) 2
𝑞,𝑝,𝑟 = ±1,±2,±3,±4
× exp[i(𝜔𝑞 + 𝜔𝑝 + 𝜔𝑟 )𝑡] .
(22.128)
Wenn wir die Gln. (22.126) und (22.128) in die Wellengleichung (22.74) einsetzen und die Terme zu jeder der vier Frequenzen 𝜔1 , 𝜔2 , 𝜔3 und 𝜔4 gleichsetzen, erhalten wir vier Helmholtzgleichungen mit zugehörigen Quellen, (∇2 + 𝑘𝑞2 )𝐸𝑞 = −𝑆𝑞 ,
𝑞 = 1, 2, 3, 4 ,
(22.129)
wobei 𝑆𝑞 die Amplitude der Komponente von 𝒮 bei der Frequenz 𝜔𝑞 ist. Damit die vier Wellen gekoppelt werden, müssen ihre Frequenzen kommensurabel sein. Als Beispiel betrachten wir den Fall, dass die die Summe zweier Frequenzen gleich der Summe der beiden anderen Frequenzen ist, 𝜔1 + 𝜔2 = 𝜔3 + 𝜔4 ,
(22.130)
und nehmen an, dass diese Frequenzen unterschiedlich sind. Drei Wellen können sich dann vereinigen und eine Quelle bei der vierten Frequenz erzeugen. Nach Gl. (22.130) sind die Terme in Gl. (22.128) zu jeder der vier Frequenzen 𝑆1 =
𝜇0 𝜔12 𝜒 (3) {6𝐸3 𝐸4 𝐸2∗ + + 2|𝐸3 |2 + 2|𝐸4 |2 ]} ,
3𝐸1 [|𝐸1 | + 2|𝐸2 | 2
𝑆𝑞 = 𝑆 𝑞 + (𝜔𝑞 ∕𝑐0 )2 Δ𝜒𝑞 𝐸𝑞 ,
𝑞 = 1, 2, 3, 4
(22.132)
mit 𝑆1 = 6𝜇0 𝜔12 𝜒 (3) 𝐸3 𝐸4 𝐸2∗ , 𝑆2 =
6𝜇0 𝜔22 𝜒 (3) 𝐸3 𝐸4 𝐸1∗
(22.133a)
,
(22.133b)
𝑆3 = 6𝜇0 𝜔32 𝜒 (3) 𝐸1 𝐸2 𝐸4∗ ,
(22.133c)
𝑆4 = 6𝜇0 𝜔42 𝜒 (3) 𝐸1 𝐸2 𝐸3∗
(22.133d)
und Δ𝜒𝑞 = 6
𝜂 (3) 𝜒 (2𝐼 − 𝐼𝑞 ) , 𝜀0
𝑞 = 1, 2, 3, 4 .
(22.134)
Hier bezeichnet 𝐼𝑞 = |𝐸𝑞 |2 ∕2𝜂 die Intensitäten der Wellen, 𝐼 = 𝐼1 + 𝐼2 + 𝐼3 + 𝐼4 ist die Gesamtintensität, die wegen der Energieerhaltung konstant ist, und 𝜂 ist die Impedanz des Mediums. Damit können wir die Helmholtzgleichung (22.129) in der Form 2
(∇2 + 𝑘 𝑞 )𝐸𝑞 = −𝑆 𝑞 ,
𝑞 = 1, 2, 3, 4
(22.135)
schreiben; dabei ist 𝑘𝑞 = 𝑛̄ 𝑞
𝜔𝑞
,
(22.136)
𝑛̄ 𝑞2 = 𝑛2 + 2𝑛𝑛2 (2𝐼 − 𝐼𝑞 )
(22.137)
𝑐0
2
𝑆2 = 𝜇0 𝜔22 𝜒 (3) {6𝐸3 𝐸4 𝐸1∗ + 3𝐸2 [|𝐸2 |2 + 2|𝐸1 |2 + 2|𝐸3 |2 + 2|𝐸4 |2 ]} , 𝑆3 = 𝜇0 𝜔32 𝜒 (3) {6𝐸1 𝐸2 𝐸4∗ + 3𝐸3 [|𝐸3 |2 + 2|𝐸2 |2 + 2|𝐸1 |2 + 2|𝐸4 |2 ]} , 𝑆4 = 𝜇0 𝜔42 𝜒 (3) {6𝐸1 𝐸2 𝐸3∗ + 3𝐸4 [|𝐸4 |2 + 2|𝐸1 |2 + 2|𝐸2 |2 + 2|𝐸3 |2 ]} .
Jede Welle wird daher von einer Quelle mit zwei Komponenten gespeist. Die erste Komponente ist ein Ergebnis der Mischung der anderen drei Wellen. Der erste Term in 𝑆1 ist zum Beispiel proportional zu 𝐸3 𝐸4 𝐸2∗ und bezeichnet daher die Mischung der Wellen 2, 3 und 4, die gemeinsam eine Quelle für Welle 1 schaffen. Die zweite Komponente ist proportional zur komplexen Amplitude der Welle selbst. Der zweite Term von 𝑆1 ist beispielsweise proportional zu 𝐸1 ; er spielt die Rolle der Brechungsindexmodulation und beschreibt demzufolge den optischen Kerreffekt (siehe Übung 22-5). Es ist zweckmäßig, die beiden Beiträge zu diesen Quellen zu separieren. Dazu definieren wir
(22.131a)
und 𝑛2 =
(22.131b)
3𝜂0 (3) 𝜒 , 𝜀0 𝑛2
(22.138)
was mit Gl. (22.47) identisch ist. Wenn der zweite Term von Gl. (22.137) viel kleiner ist als der erste, gilt (22.131c)
(22.131d)
𝑛̄ 𝑞 ≈ 𝑛 + 𝑛2 (2𝐼 − 𝐼𝑞 ) .
(22.139)
Die Helmholtzgleichung für jede Welle wird daher auf zwei Arten verändert:
22.5 Nichtlineare Optik dritter Ordnung: Die Theorie gekoppelter Wellen
1) Es existiert eine Quelle, die die kombinierten Effekte der anderen drei Wellen beschreibt. Das kann zur Verstärkung einer vorhandenen Welle führen oder zur Erzeugung einer neuen Welle bei dieser Frequenz. 2) Der Brechungsindex für jede Welle wird verändert und wird eine Funktion der Intensitäten aller vier Wellen. Diese Gleichungen werden verwendet, um vier gekoppelte nichtlineare Differentialgleichungen zu formulieren, aus deren Lösungen unter geeigneten Randbedingungen die Felder oder ihre komplexen Einhüllenden bestimmt werden können. Diesem Ansatz waren wir für nichtlineare Prozesse zweiter Ordnung gefolgt und nun werden wir ihn auf mehrere Spezialfälle von nichtlinearen Prozessen dritter Ordnung anwenden.
Analyse wird vereinfacht, wenn wir bei der Berechnung der Kopplungsfaktoren 𝜔1 ≈ 𝜔2 ≈ 𝜔0 annehmen. Das Ergebnis ist der folgende Satz gekoppelter Gleichungen: [ da1 = −ig a20 a∗2 exp(−iΔ𝑘𝑧) + a1 d𝑧 ( )] × |a1 |2 + 2|a2 |2 + 2|a0 |2 ,
(22.141a)
[ da2 = −ig a20 a∗1 exp(−iΔ𝑘𝑧) + a2 d𝑧 ( )] × |a2 |2 + 2|a1 |2 + 2|a0 |2 ,
(22.141b)
[ da0 = −ig 2a1 a2 a∗0 exp(iΔ𝑘𝑧) + a0 d𝑧 ( )] × |a0 |2 + 2|a1 |2 + 2|a2 |2 ,
(22.141c)
wobei g = ℏ𝜔0 (𝜔0 ∕𝑐0 )𝑛2
22.5.2 Dreiwellenmischung und Erzeugung der dritten Harmonischen Wir betrachten jetzt entartete Fälle, in denen zwei, drei der vier Wellen dieselbe Frequenz haben. Dreiwellenmischung
In dem entarteten Fall, dass zwei der vier Wellen dieselbe Frequenz 𝜔3 = 𝜔4 ≡ 𝜔0 besitzen, gibt es drei Wellen mit Frequenzen, die durch 𝜔1 + 𝜔2 = 2𝜔0 verknüpft sind. Eine Theorie gekoppelter Wellen dieser Dreiwellenmischung kann formuliert werden, indem man die bei den drei Frequenzen erzeugten Strahlungsquellen identifiziert: { [ ]} 𝑆1 = 𝜇0 𝜔12 𝜒 (3) 3𝐸02 𝐸2∗ + 3𝐸1 |𝐸1 |2 + 2|𝐸2 |2 + 2|𝐸0 |2 , (22.140a) { 2 ∗ [ ]} 2 (3) 2 2 𝑆2 = 𝜇0 𝜔2 𝜒 3𝐸0 𝐸1 + 3𝐸2 |𝐸2 | + 2|𝐸1 | + 2|𝐸0 |2 , (22.140b) { [ ]} 2 (3) ∗ 2 2 𝑆0 = 𝜇0 𝜔0 𝜒 6𝐸1 𝐸2 𝐸0 + 3𝐸0 |𝐸0 | + 2|𝐸1 | + 2|𝐸2 |2 . (22.140c) = Einsetzen in die Helmholtzgleichungen (∇ + −𝑆𝑞 (𝑞 = 0, 1, 2) liefert einen Satz gekoppelter Gleichungen, die zumindest im Prinzip für passende Anfangsbedingungen gelöst werden können. Für kollineare Wellen, die sich in 𝑧-Richtung ausbreiten, ist 𝐸𝑞 (r) = 𝐴𝑞 exp(−i𝑘𝑞 𝑧). Wie vorher für nichtlineare Prozesse zweiter Ordnung verwenden wir die Näherung der langsam variierenden Einhüllenden, (∇2 + 𝑘𝑞2 )[𝐴𝑞 exp(−i𝑘𝑞 𝑧)] ≈ −i2𝑘𝑞 (d𝐴𝑞 ∕ d𝑧) exp(−i𝑘𝑞 𝑧), und √ schreiben die komplexen Amplituden 𝐴𝑞 = 2𝜂ℏ𝜔𝑞 a𝑞 2
𝑘𝑞2 )𝐸𝑞
als Funktionen der Variablen a𝑞 , die so normiert werden, dass 𝜙𝑞 = |a𝑞 |2 die Photonenflussdichten sind. Die
(22.142)
ist und Δ𝑘 = 2𝑘0 − 𝑘1 − 𝑘2
(22.143)
die Phasenfehlanpassung bezeichnet. Dieser Satz von nichtlinearen Gleichungen kann in der Näherung konstanter Pumpleistung (|a1 |, |a2 | ≪ |a0 |) leicht gelöst werden, da in diesem Fall a0 (𝑧) näherungsweise konstant ist. Bei optimaler Phasenanpassung (Δ𝑘 = 0) ist Gl. (22.141) näherungsweise durch zwei lineare Differentialgleichungen gegeben, da1 = −i𝛾(a∗2 + 2a1 ) , d𝑧 da2 = −i𝛾(a∗1 + 2a2 ) , d𝑧
(22.144a) (22.144b)
wobei 𝛾 = ga20 eine zur konstanten Pumpintensität proportionale Konstante ist. Die Lösung dieser Gleichungen wird durch die Anfangswerte der beiden Wellen ausgedrückt: [ ] a1 (𝑧) = (1 − i𝛾𝑧)a1 (0) − i𝛾𝑧a∗2 (0) exp(−i𝛾𝑧) , (22.145a) [ ] ∗ a2 (𝑧) = −i𝛾𝑧a1 (0) + (1 − i𝛾𝑧)a2 (0) exp(−i𝛾𝑧) . (22.145b) Wenn die anfängliche Idleramplitude a2 (0) = 0 ist, dann wächst die Photonenflussdichte 𝜙1 (𝑧) = |𝑎1 (𝑧)|2 des Signals wie 𝜙1 (𝑧) = (1 + 𝛾 2 𝑧2 )𝜙1 (0). Der Anstieg hängt vom Betrag und der Phase der anfänglichen Idlerwelle ab. Wenn z. B. a2 (0) = rei𝜑 a1 (0) ist, dann gilt 𝜙1 (𝑧) = [1 + (2r sin 𝜑)𝛾𝑧 + (1 + r2 + 2r cos 𝜑)𝛾 2 𝑧2 ]𝜙1 (0) ; (22.146)
791
792
22 Nichtlineare Optik
sie ist eine Funktion des Phasendifferenz 𝜑, die ihren maximalen Wert für tan 𝜑 = 2∕𝛾𝑧 erreicht. Bei kleinen 𝑧 ist das Wachstum für 𝜑 = π∕2 maximal. Offensichtlich ist ein solcher Verstärker ein phasensensitiver Verstärker. Um die Wirkungen einer Erschöpfung der Pumpe und einer Phasenfehlanpassung zu untersuchen, müssen wir den vollen Satz der Gln. (22.141) lösen. Ein Schritt in dieser Richtung ist, die komplexen Amplituden a𝑞 = b𝑞 exp(i𝜑𝑞 ) durch ihre Beträge b𝑞 und Phasen 𝜑𝑞 zu schreiben. Einsetzen in Gl. (22.141) und Gleichsetzen der Real- und Imaginärteile jeder Gleichung führt zu dem folgenden Satz von nichtlinearen Gleichungen in reellen Variablen: db1 d𝑧 db2 d𝑧 db0 d𝑧 d𝜑 d𝑧
2
(22.147a)
= gb0 b1 sin 𝜑 ,
2
(22.147b)
= −gb0 b1 b2 sin 𝜑 ,
(22.147c)
= gb0 b2 sin 𝜑 ,
] [ 2 2 2 = Δ𝑘 + g 2b0 − b1 − b2 2
+ g[
2
b0 b1 b0 b2 + − 4b1 b2 ] cos 𝜑 (22.147d) b2 b1
mit 𝜑 = Δ𝑘 𝑧 + 𝜑1 + 𝜑2 − 2𝜑0 . Zwei Invarianten können wir leicht identifizieren. Wegen der Erhaltung der opti2 2 2 schen Intensität muss die Summe b1 + b2 + b0 konstant sein. Wegen der Erhaltung der Photonenzahl muss au2 2 ßerdem die Differenz b1 − b2 konstant sein (das ist eine Variante der Manley-Rowe-Beziehung). Andere Invarianten unter Beteiligung der Phase 𝜑 können ebenfalls identifiziert 3) und verwendet werden, um die Rolle der Phasenfehlanpassung, der Anfangsamplituden und der Phasendifferenz zwischen der Signal- und Idlerwelle zu untersuchen. Zum Beispiel ist aus Gl. (22.147a) leicht zu erkennen, dass die anfängliche Steigungsrate des Signals für sin 𝜑 = 0 eintritt, d. h. für 𝜑 = π∕2. Erzeugung der dritten Harmonischen
Ein anderer entarteter Sonderfall der Vierwellenmischung ist die Erzeugung der dritten Harmonischen. Hier haben drei der vier Wellen identische Frequenzen, 𝜔1 = 𝜔2 = 𝜔4 = 𝜔, und die vierte hat die Summenfrequenz 𝜔3 = 𝜔1 + 𝜔2 + 𝜔4 = 3𝜔. Effektiv liegen hier zwei Wellen 1 und 3 vor, deren Amplituden durch das nichtlineare Medium dritter Ordnung gekoppelt werden. Eine Theorie gekoppelter Wellen kann nach demselben An3) Siehe G. Cappellini, S. Trillo, ‚Third-Order Three-Wave Mixing in Single-Mode Fibers: Exact Solution and Spatial Instability Effects‘, Journal of the Optical Society of America B 8, 824–838, 1991.
satz wie bei der Vier- und Dreiwellenmischung formuliert werden. Das führt zu zwei Helmholtzgleichungen (∇2 + 𝑘𝑞2 )𝐸𝑞 = −𝑆𝑞 mit { [ ]} 𝑆1 = 𝜇0 𝜔12 𝜒 (3) 3𝐸3 𝐸1∗ 𝐸1∗ + 3𝐸1 |𝐸1 |2 + 2|𝐸3 |2 , (22.148a) { [ ]} 𝑆3 = 𝜇0 𝜔32 𝜒 (3) 𝐸13 + 3𝐸3 |𝐸3 |2 + 2|𝐸1 |2 . (22.148b) Diese Gleichungen können verwendet werden, um gekoppelte Gleichungen für 𝐸1 und 𝐸3 herzuleiten, wie wir es auch in den vorherigen Fällen getan hatten. Übung 22-12: Erzeugung der dritten Harmonischen in der Näherung konstanter Pumpleistung
Nehmen Sie an, dass die Grundwelle und ihre dritte Harmonische ebene Wellen sind, die sich in 𝑧-Richtung mit der komplexen Einhüllenden 𝐴𝑞 (𝑞 = 1, 3) ausbreiten. Verwenden Sie die Näherung der langsam variierenden Einhüllenden, um gekoppelte Differentialgleichungen für 𝐴1 und 𝐴3 zu formulieren. Zeigen Sie, dass in der Näherung konstanter Pumpleistung [𝐴3 ≪ 𝐴1 und 𝐴1 (𝑧) ≈ 𝐴1 (0)] gilt da3 (22.149) = −iga31 exp(−iΔ𝑘𝑧) , d𝑧 √ wobei 𝐴𝑞 = 2𝜂ℏ𝜔𝑞 a𝑞 und Δ𝑘 = 3𝑘1 − 𝑘3 ist. Leiten Sie einen Ausdruck für g her.
22.5.3
Optische Phasenkonjugation
Wir leiten nun die Gleichungen gekoppelter Wellen bei vollständiger Entartung her, wenn alle vier Wellen dieselbe Frequenz 𝜔1 = 𝜔2 = 𝜔3 = 𝜔4 = 𝜔 besitzen. Wie wir in Abschnitt 22.3.5 angenommen hatten, sollen zwei der Wellen (Welle 3 und 4), die Pumpwellen, ebene Wellen sein, die sich mit den komplexen Amplituden 𝐸3 (r) = 𝐴3 exp(−ik3 ⋅ r) und 𝐸4 (r) = 𝐴4 exp(−ik4 ⋅ r) und den durch k4 = −k3 verknüpften Wellenvektoren in entgegengesetzten Richtungen ausbreiten. Ihre Intensitäten sollen viel größer sein als die der Wellen 1 und 2, sodass sich ihre Intensitäten durch die Wechselwirkung näherungsweise nicht ändern. Daher dürfen wir anzunehmen, dass ihre komplexen Einhüllenden 𝐴3 und 𝐴4 konstant sind. Die Gesamtintensität 𝐼 der vier Wellen ist dann ebenfalls näherungsweise konstant, 𝐼 ≈ [|𝐴3 |2 + |𝐴4 |2 ]∕2𝜂. Die Terme 2𝐼 − 𝐼1 und 2𝐼 − 𝐼2 , die den effektiven Brechungsindex 𝑛̄ für die Wellen 1 und 2 in Gl. (22.139) bestimmen, sind näherungsweise gleich 2𝐼 und daher auch konstant, sodass der optische Kerreffekt nur eine konstante Änderung des Brechungsindex bewirkt. Seine Wirkung kann daher ignoriert werden.
22.5 Nichtlineare Optik dritter Ordnung: Die Theorie gekoppelter Wellen
Mit diesen Annahmen reduziert sich die Aufgabe auf zwei gekoppelte Wellen 1 und 2. Die Gln. (22.135) und (22.133) liefern (∇2 + 𝑘2 )𝐸1 = −𝜉𝐸2∗ , (∇ + 𝑘 )𝐸2 = 2
2
−𝜉𝐸1∗
(22.150a)
,
(22.150b)
zwei Differentialgleichungen erster Ordnung, d𝐴1 = −i𝛾𝐴2∗ , d𝑧 d𝐴2 = i𝛾𝐴1∗ , d𝑧
(22.153a) (22.153b)
wobei
mit 𝜉 = 6𝜇0 𝜔2 𝜒 (3) 𝐸3 𝐸4 = 6𝜇0 𝜔2 𝜒 (3) 𝐴3 𝐴4
(22.151)
und 𝑘 = 𝑛𝜔∕𝑐 ̄ 0 , wobei 𝑛̄ ≈ 𝑛 + 2𝑛2 𝐼 eine Konstante ist. Damit haben sich die vier nichtlinearen gekoppelten Differentialgleichungen auf zwei lineare gekoppelte Gleichungen reduziert, von denen jede die Form einer Helmholtzgleichung mit einem Quellterm hat. Die Quelle für Welle 1 ist proportional zur Konjugierten der komplexen Amplitude von Welle 2 und entsprechend für Welle 2. Phasenkonjugation
Wir nehmen an, dass die Wellen 1 und 2 ebenfalls ebene Wellen sind, die sich in entgegengesetzten Richtungen entlang der 𝑧-Achse ausbreiten, wie in Abb. 22.36 dargestellt, 𝐸1 = 𝐴1 exp(−i𝑘𝑧) ,
𝐸2 = 𝐴2 exp(i𝑘𝑧) .
(22.152)
Diese Annahme erfüllt die Phasenbedingung, da 𝑘1 + 𝑘2 = 𝑘3 + 𝑘4 ist. Wenn wir Gl. (22.152) in Gl. (22.150) einsetzen und die Näherung der langsam variierenden Einhüllenden verwenden, Gl. (22.92), reduzieren wir die Gln. (22.150) auf pe m Analyse
(22.154)
ein Kopplungsfaktor ist, dessen Betrag in der Form √ |𝛾| = 2𝐶 𝐼3 𝐼4 ,
𝐶 = 3𝜔𝜂02
𝜒 (3) 𝑛̄ 2
(22.155)
geschrieben werden kann. Hier sind 𝐼3 = |𝐴3 |2 ∕2𝜂 und 𝐼4 = |𝐴4 |2 ∕2𝜂 die Intensitäten der beiden Wellen und es ̄ gilt 𝜂 = 𝜂0 ∕𝑛. Der Einfachheit halber nehmen wir an, dass 𝐴3 𝐴4 reell ist, sodass auch 𝛾 reell ist. Die Lösung von Gl. (22.153) besteht dann aus zwei harmonischen Funktionen 𝐴1 (𝑧) und 𝐴2 (𝑧), die um 90° gegeneinander phasenverschoben sind. Wenn sich das nichtlineare Medium zwischen den Ebenen 𝑧 = −𝐿 und 𝑧 = 0 erstreckt wie in Abb. 22.36, besitzt Welle 1 die Amplitude 𝐴1 (−𝐿) = 𝐴e in der Eingangsebene und Welle 2 eine Amplitude von null in der Ausgangsebene, 𝐴2 (0) = 0. Unter diesen Randbedingungen ist die Lösung von Gl. (22.153) 𝐴e cos 𝛾𝑧 , cos 𝛾𝐿 𝐴e∗ 𝐴2 (𝑧) = i sin 𝛾𝑧 . cos 𝛾𝐿
𝐴1 (𝑧) =
𝐴r = −i𝐴e∗ tan 𝛾𝐿 ,
2
(22.156) (22.157)
(22.158)
wohingegen die Amplitude der transmittierten Welle, 𝐴t = 𝐴1 (0), gleich Pu m pe
Konjugierte 4
𝜉 𝜒 (3) = 3𝜔𝜂0 𝐴𝐴 𝑛̄ 3 4 2𝑘
Die Amplitude der reflektierten Welle in der Eingangsebene, 𝐴r = 𝐴2 (−𝐿), ist
3
Pu 1
𝛾=
Ar Ae
–L
𝐴t = At
A1(z)
(22.159)
ist. Die Gln. (22.158) und Gl. (22.159) legen mehrere Anwendungen nahe:
A2(z)
0
𝐴e cos 𝛾𝐿
z
Abb. 22.36 Entartete Vierwellenmischung. Die Wellen 3 und 4 sind intensive Pumpwellen, die sich in entgegengesetzten Richtungen ausbreiten. Welle 1, die Analysenwelle, und Welle 2, die konjugierte Welle, breiten sich mit zunehmenden Amplituden ebenfalls in entgegengesetzten Richtungen aus.
• Die reflektierte Welle ist eine konjugierte Version der einfallenden Welle. Das Bauelement wirkt als Phasenkonjugator (siehe Abschnitt 22.3.5). • Der Intensitätsreflexionsgrad |𝐴r |2 ∕|𝐴e |2 = tan2 𝛾𝐿 kann kleiner oder größer sein als 1, entsprechend Dämpfung oder Verstärkung. Das Medium kann somit als Reflexionsverstärker (ein „Verstärkungsspiegel“) wirken.
793
794
22 Nichtlineare Optik
• Die Transmission |𝐴t |2 ∕|𝐴e |2 = 1∕ cos2 𝛾𝐿 ist immer größer als 1, sodass das Medium immer als Transmissionsverstärker wirkt. • Für 𝛾𝐿 = π∕2 oder ungerade Vielfache davon sind der Reflexionsgrad und die Transmission unendlich, was eine Instabilität anzeigt. Das Bauelement ist dann ein Oszillator.
22.6 Anisotrope nichtlineare Medien In einem anisotropen Medium ist jede der drei Komponenten des Polarisationsvektors 𝓟 = (𝒫1 , 𝒫2 , 𝒫3 ) allgemein eine Funktion der drei Komponenten des Vektors 𝓔 = (ℰ1 , ℰ2 , ℰ3 ) des elektrischen Feldes. Diese Funktionen sind für kleine Beträge von ℰ linear (siehe Abschnitt 6.3), aber sie weichen von der Linearität ab, wenn ℰ zunimmt. Sie können daher in eine Taylorreihe in den drei Komponenten von ℰ entwickelt werden, genau wie in der in Abschnitt 22.1 präsentierten skalaren Analyse: ∑ ∑ (3) ∑ 𝒫𝑖 = 𝜀0 𝜒𝑖𝑗 ℰ𝑗 + 2 d𝑖𝑗𝑘 ℰ𝑗 ℰ𝑘 + 4 𝜒𝑖𝑗𝑘𝑙 ℰ𝑗 ℰ𝑘 ℰ𝑙 𝑗
𝑗𝑘
𝑗𝑘𝑙
𝑖, 𝑗, 𝑘, 𝑙 = 1, 2, 3 .
(22.160) (3)
Die Koeffizienten 𝜒𝑖𝑗 , d𝑖𝑗𝑘 und 𝜒𝑖𝑗𝑘𝑙 sind Elemente von
Tensoren, die den skalaren Koeffizienten 𝜒, d bzw. 𝜒 (3) entsprechen, und Gl. (22.160) ist eine tensorielle Verallgemeinerung von Gl. (22.2). Weil d𝑖𝑗𝑘 proportional zu 𝜕 2 𝒫𝑖 ∕𝜕ℰ𝑗 𝜕ℰ𝑘 ist, ist er invariant bezüglich einer Vertau(3)
schung von 𝑗 und 𝑘. Ähnlich ist 𝜒𝑖𝑗𝑘𝑙 invariant bezüglich Permutationen von 𝑗, 𝑘 und 𝑙. Für verlustfreie nichtdispersive Medien gibt es zusätzliche intrinsische Symmetrien: Es gilt 𝜒𝑖𝑗 = 𝜒𝑗𝑖 , wie in Abschnitt 6.3.1 gezeigt wur(3)
de, und auch d𝑖𝑗𝑘 und 𝜒𝑖𝑗𝑘𝑙 sind invariant bezüglich Permutationen ihrer Indizes. Diese volle Permutationssymmetrie gilt im Allgemeinen nicht für dispersive nichtlineare Medien. Durch Ausnutzen der Symmetriebedingung d𝑖𝑗𝑘 = d𝑖𝑘𝑗 können die Elemente des Tensor d𝑖𝑗𝑘 als 3 × 6-Matrix d𝑖𝐽 geschrieben werden, wobei die sechs unabhängigen Kombinationen (𝑗, 𝑘) = 11, 22, 33, 23, 31, 12 in dieser
(3)
Tab. 22.2 Nichtlineare Koeffizienten 𝜒IK dritter Ordnung für ein isotropes Medium. (3)
⎡𝜒11 ⎢ (3) ⎢𝜒12 ⎢ ⎢𝜒 (3) ⎢ 12 ⎢ ⎢ 0 ⎢ ⎢ 0 ⎢ ⎣ 0
𝜒12
(3)
𝜒12
(3)
(3) 𝜒11 (3) 𝜒12
(3) 𝜒12 (3) 𝜒11
0
0
0
0
0
0
0
0
(3) 𝜒44
0
0
0
𝜒44
0
0
0
0
0 (3)
0 ⎤ ⎥ 0 ⎥ ⎥ 0 ⎥ ⎥, ⎥ 0 ⎥ ⎥ 0 ⎥ (3) ⎥ 𝜒44 ⎦
(z. B. GaAs, CdTe, InAs)
⎡0 0 0 d14 0 0 ⎤ ⎢ ⎥ ⎢0 0 0 0 d14 0 ⎥ ⎢ ⎥ 0 0 0 0 0 d36 ⎣ ⎦ Tetragonal 42𝑚 (z. B. KDP, ADP)
1 2
(
) (3) (3) 𝜒11 − 𝜒12 .
Reihenfolge durch einen einzigen Index 𝐽 = 1, 2, 3, 4, 5, 6 bezeichnet werden (siehe Tabelle 21.1). Zum Beispiel bezeichnet d25 den Koeffizienten d231 = d213 . (3) Die Koeffizienten 𝜒𝑖𝑗𝑘𝑙 dritter Ordnung werden ent(3)
sprechend durch eine 6 × 6-Matrix 𝜒𝐼𝐾 bezeichnet, wobei das Paar (𝑖, 𝑗) zu einem einzigen Index 𝐼 = 1, 2, … , 6 zusammengefasst wird, und das Paar (𝑘, 𝑙) zu 𝐾 = 1, 2, … , 6 kontrahiert wird. Die Struktursymmetrie des Kristalls erlegt den Ten(3) sorelementen d𝑖𝑗𝑘 und 𝜒𝑖𝑗𝑘𝑙 zusätzliche Einschränkungen auf. Wenn das Koordinatensystem (1, 2, 3) mit den Hauptachsen des Kristalls zusammenfällt, die von dem Tensor 𝜒𝑖𝑗 bestimmt werden, sind einige Einträge in den (3) Matrizen d𝑖𝐽 und 𝜒𝐼𝐾 null, während andere gleich oder durch eine einfache Regel verknüpft sind. Typische Beispiele sind in den Tabellen 22.1 und 22.2 angegeben. Werte für die Koeffizienten d𝑖𝐽 für einige typische nichtlineare Kristalle sind in Tabelle 22.3 aufgeführt. Obwohl kubische Kristalle isotrope lineare optische Eigenschaften haben, verleihen ihre wohldefinierten Kristallachsen (die durch ihre Struktursymmetrie bestimmt sind) ihnen anisotrope nichtlineare optische Eigenschaften. (3) Die Tensoren d𝑖𝑗𝑘 und 𝜒𝑖𝑗𝑘𝑙 hängen eng mit den Pockels- und Kerrtensoren r𝑖𝑗𝑘 bzw. s𝑖𝑗𝑘𝑙 zusammen, wie in Aufgabe 22-17 gezeigt wird, und sie haben dieselben Symmetrien, wie durch Vergleich der Tabellen 22.1 und (3) 22.2 mit Werten von d𝑖𝐽 und 𝜒𝐼𝐾 mit den Tabellen 21.2 und 21.3 mit Werten von r𝐼𝑘 und s𝐼𝐾 für mehrere Kristallgruppen zu erkennen ist. d𝑖𝐽 ist analog zu der Transponierten von r𝐼𝑘 .
Tab. 22.1 Nichtlineare Koeffizienten diJ zweiter Ordnung für einige typische Kristallgruppen. ⎡0 0 0 d14 0 0 ⎤ ⎢ ⎥ ⎢0 0 0 0 d14 0 ⎥ ⎢ ⎥ 0 0 0 0 0 d14 ⎣ ⎦ Kubisch 43𝑚
(3)
𝜒44 =
⎡ 0 0 0 0 d15 −d22 ⎤ ⎢ ⎥ 0 ⎥ ⎢−d22 d22 0 d15 0 ⎢ ⎥ d d31 d33 0 0 0 ⎣ 31 ⎦ Trigonal 3𝑚 (z. B. BBO, LiNbO3 , LiTaO3 )
22.6 Anisotrope nichtlineare Medien
Tab. 22.3 Typische Beträge von nichtlinearen optischen Koeffizienten zweiter Ordnung für ausgewählte Materialien.a) diJ ∕(C∕V2 )
Kristall
𝛽-BaB2 O4 (BBO) LiB3 O5 (LBO)
LiIO3 LiNbO3
KNbO3 KTiOPO4 (KTP)
d22 = 2.0 ×
(diJ ∕𝜺0 )∕(pm∕V)b) 10−23
2.2
d31 = 3.5 × 10−25
0.04
d31 = 5.9 × 10−24
0.67
d32 = 7.5 × 10−24
0.85
d33 = 3.5 × 10−25
0.04
d31 = 3.9 × 10−23
4.4
d33 = 4.1 × 10−23
4.6
d22 = 1.9 × 10−23
2.1
d31 = 4.1 × 10−23
4.6
d33 = 2.2 × 10−22
25.2
d31 = 1.1 × 10−22
11.9
d32 = 1.2 × 10−22
13.7
d31 = 2.0 × 10−23 d32 = 3.3 × 10−23 d33 = 1.3 × 10−22
2.2
0.38
NH4 H2 PO4 (ADP) 𝛼-SiO2 (Quarz)
d36 = 4.2 × 10−24
0.47
d11 = 2.7 × 10−24
0.30
KBe2 BO3 F2 (KBBF) GaAs
d11 = 4.3 × 10−24 d14 = 1.5 × 10−21 d11 = 5.8 × 10−21
Te
d12
⋯
d22
⋯
d32
⋯
d16 ⎤ ⎥ d26 ⎥ ⎥ d36 ⎦
Effektivwert von d Wenn 𝐸𝑗 (𝜔1 ) = 𝐸(𝜔1 ) cos 𝜃1𝑗 und 𝐸𝑘 (𝜔2 ) = 𝐸(𝜔2 ) cos 𝜃2𝑘 ist, wobei 𝜃1𝑗 und 𝜃2𝑘 die Winkel sind, die die Vektoren E(𝜔1 ) und E(𝜔2 ) mit den Hauptachsen einschließen, kann Gl. (22.161) in der Form
14.6
d36 = 3.1 × 10−24
⎡𝑃1 (𝜔3 )⎤ ⎡d11 ⎢ ⎥ ⎢ ⎢𝑃2 (𝜔3 )⎥ = 2 ⎢d21 ⎢ ⎥ ⎢ d 𝑃 (𝜔 ) ⎣ 3 3 ⎦ ⎣ 31
⎡ ⎤ 𝐸1 (𝜔1 )𝐸1 (𝜔2 ) ⎢ ⎥ 𝐸2 (𝜔1 )𝐸2 (𝜔2 ) ⎢ ⎥ ⎢ ⎥ 𝐸3 (𝜔1 )𝐸3 (𝜔2 ) ⎢ ⎥ ×⎢ ⎥ . ⎢𝐸2 (𝜔1 )𝐸3 (𝜔2 ) + 𝐸3 (𝜔1 )𝐸2 (𝜔2 )⎥ ⎢ ⎥ ⎢𝐸3 (𝜔1 )𝐸1 (𝜔2 ) + 𝐸1 (𝜔1 )𝐸3 (𝜔2 )⎥ ⎢ ⎥ 𝐸 (𝜔 )𝐸 (𝜔 ) + 𝐸2 (𝜔1 )𝐸1 (𝜔2 ) ⎣ 1 1 2 2 ⎦ (22.162)
3.7
KH2 PO4 (KDP)
In der kontrahierten Notation (𝑗, 𝑘) = 𝐽 kann Gl. (22.161) in Matrixform geschrieben werden:
0.49
⎤ ⎡∑ 𝑃𝑖 (𝜔3 ) = 2 ⎢ d𝑖𝑗𝑘 cos 𝜃1𝑗 cos 𝜃2𝑘 ⎥ 𝐸(𝜔1 )𝐸(𝜔2 ) (22.163) ⎦ ⎣ 𝑗𝑘
170 650
a) Die meisten Koeffizienten stammen aus D. N. Nikogosyan, Nonlinear Optical Crystals: A Complete Survey, Springer 2005. Die Werte sind für eine Wellenlänge 𝜆0 = 1.06 μm angegeben außer denen für Te, die für 𝜆0 = 10.6 μm gelten. b) In der Praxis werden häufig die Koeffizienten d∕𝜀0 in pm/V verwendet. Die nichtlinearen optischen Koeffizienten in C∕V2 können leicht umgerechnet werden, indem man d durch 10−12 𝜀0 ≈ 8.85 × 10−24 teilt.
geschrieben werden. Da der Polarisationsvektor P(𝜔3 ) die Quelle der Welle 3 ist, trägt nur die Komponente P⊥ (𝜔3 ) in der zum Wellenvektor k3 orthogonalen Ebene bei; die Komponente parallel zu k3 kann keine TEMWelle abstrahlen. Wenn P⊥ (𝜔3 ) die Winkel 𝜃3𝑖 mit den Hauptachsen einschließt, dann ist sein Betrag 𝑃⊥ (𝜔3 ) =
22.6.1 Dreiwellenmischung in anisotropen nichtlinearen Medien zweiter Ordnung Wenn ein optisches Feld, das aus zwei monochromatischen linear polarisierten Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 und der komplexen Amplituden E(𝜔1 ) und E(𝜔2 ) besteht, sich durch einen nichtlinearen Kristall zweiter Ordnung ausbreiten, hat der induzierte nichtlineare Polarisationsvektor P(𝜔3 ) bei der Frequenz 𝜔3 = 𝜔1 + 𝜔2 die Komponenten ∑ 𝑃𝑖 (𝜔3 ) = 2 d𝑖𝑗𝑘 𝐸𝑗 (𝜔1 )𝐸𝑘 (𝜔2 ) , 𝑖, 𝑗, 𝑘 = 1, 2, 3 , 𝑗𝑘
(22.161) wobei 𝐸𝑗 (𝜔1 ), 𝐸𝑘 (𝜔2 ) und 𝑃𝑖 (𝜔3 ) die Komponenten dieser Vektoren entlang der Hauptachsen des Kristalls sind. Diese Gleichung ist eine Verallgemeinerung von Gl. (22.20d).
∑ 𝑖
𝑃𝑖 (𝜔3 ) cos 𝜃3𝑖 .
(22.164)
Aus den Gln. (22.163) und (22.164) folgt dann 𝑃⊥ (𝜔3 ) = 2deff 𝐸(𝜔1 )𝐸(𝜔2 )
(22.165)
mit einem effektiven nichtlinearen Koeffizienten zweiter Ordnung ∑ deff = d𝑖𝑗𝑘 cos 𝜃3𝑖 cos 𝜃1𝑗 cos 𝜃2𝑘 . (22.166) 𝑖𝑗𝑘
Gleichung (22.165) hat dieselbe Form wie in der in den Abschnitten 22.2.3 und 22.4 vorgestellten skalaren Formulierung; deff spielt die Rolle des Koeffizienten d. Beispiel 22-7 illustriert eine direkte Berechnung von deff für die Dreiwellenmischung in einem anisotropen Kristall.
795
796
22 Nichtlineare Optik
In diesem Beispiel bestimmen wir den effektiven nichtlinearen Koeffizienten deff für drei kollineare Wellen, die sich in einem KDP-Kristall in einer beliebigen in einem Kugelkoordinatensystem definierten Richtung (𝜃, 𝜙) ausbreiten, dessen 𝑧-Achse die optische Achse des Kristalls ist, wie in Abb. 22.37 dargestellt. Die Wellen 1 und 2 sind ordentliche Wellen bei den Frequenzen 𝜔1 und 𝜔2 , und Welle 3 ist außerordentlich mit der Frequenz 𝜔3 = 𝜔1 + 𝜔2 . Aus Gl. (22.161) und Tabelle 22.1 für Kristalle mit 42𝑚-Symmetrie wie z. B. KDP erhalten wir die nichtlinearen Komponenten des Polarisationsvektors, 𝑃1 (𝜔3 ) = 2d14 [𝐸2 (𝜔1 )𝐸3 (𝜔2 ) + 𝐸3 (𝜔1 )𝐸2 (𝜔2 )] , 𝑃2 (𝜔3 ) = 2d14 [𝐸3 (𝜔1 )𝐸1 (𝜔2 ) + 𝐸1 (𝜔1 )𝐸3 (𝜔2 )] , (22.167) 𝑃3 (𝜔3 ) = 2d36 [𝐸1 (𝜔1 )𝐸2 (𝜔2 ) + 𝐸2 (𝜔1 )𝐸1 (𝜔2 )] . In dieser Anordnung sind die Komponenten des elektrischen Feldes der Wellen 1 und 2 𝐸1 (𝜔1 ) = 𝐸(𝜔1 ) sin 𝜙 ,
𝐸2 (𝜔1 ) = −𝐸(𝜔1 ) cos 𝜙 ,
𝐸3 (𝜔1 ) = 0 , 𝐸1 (𝜔2 ) = 𝐸(𝜔2 ) sin 𝜙 ,
𝐸2 (𝜔2 ) = −𝐸(𝜔2 ) cos 𝜙 ,
𝐸3 (𝜔2 ) = 0 . Nach Gl. (22.167) sind die Komponenten des Polarisationsvektors für Welle 3 daher 𝑃1 (𝜔3 ) = 0 ,
𝑃2 (𝜔3 ) = 0 ,
𝑃3 (𝜔3 ) = −4d36 sin 𝜙 cos 𝜙 𝐸(𝜔1 )𝐸(𝜔2 ) .
(22.168)
In diesem Fall ist die Komponente 𝑃⊥ (𝜔3 ) = −𝑃3 (𝜔3 ) sin 𝜃; also gilt deff = −d36 sin 𝜃 sin 2𝜙 .
(22.169)
Dieses Ergebnis kann auch direkt aus Gl. (22.166) mit den passenden Winkeln und Koeffizienten erhalten werden. Der effektive nichtlineare Koeffizient in Gl. (22.169) nimmt seinen maximalen Betrag d36 bei den Winkeln 𝜃 = 90◦ und 𝜙 = 45◦ an, wie Abb. 22.37 zeigt.
z
z
Beispiel 22-7: Kollineare Typ-I-Dreiwellenmischung in einem KDP-Kristall
k oo
e
θ y
y
ϕ
o o
x
x (a)
e
k
(b)
Abb. 22.37 (a) Anordnung für die kollineare Typ-I-o-o-eDreiwellenmischung in einem einachsigen Kristall, dessen optische Achse in z-Richtung liegt. (b) Ausbreitungsrichtung für den maximalen Koeffizienten deff .
Abschnitt 5.2); die Polarisation 𝒫(𝑡) aufgrund eines angelegten elektrischen Feldes ℰ(𝑡) erscheint nicht sofort. Stattdessen ist die Antwort 𝒫(𝑡) zur Zeit 𝑡 eine Funktion des angelegten elektrischen Feldes ℰ(𝑡′ ) bei Zeiten 𝑡′ ≤ 𝑡. Wenn das Medium außerdem nichtlinear ist, ist auch die funktionelle Beziehung zwischen 𝒫(𝑡) und {ℰ(𝑡), 𝑡′ ≤ 𝑡} nichtlinear. Es gibt zwei Methoden, um solche nichtlinearen dynamischen Systeme zu beschreiben: 1) Eine phänomenologische Integralbeziehung zwischen 𝒫(𝑡) und ℰ(𝑡) auf der Grundlage einer Volterraentwicklung, die einer Taylorentwicklung ähnelt. Die Koeffizienten der Entwicklung charakterisieren das Medium phänomenologisch. 2) Eine nichtlineare Differentialgleichung für 𝒫(𝑡) mit ℰ(𝑡) als treibender Kraft, die aus einem physikalischen Modell des Polarisationsprozesses entwickelt wird, ähnlich wie das Lorentzmodell für lineare Medien.
22.7.1 Beschreibung dispersiver nichtlinearer Medien durch eine Integraltransformation Wenn die Abweichung von der Linearität klein ist, kann zur Beschreibung der Beziehung zwischen 𝒫(𝑡) und ℰ(𝑡) eine Volterraentwicklung verwendet werden. Der erste Term der Entwicklung ist eine Linearkombination von ℰ(𝑡′ ) für alle 𝑡′ ≤ 𝑡, ∞
22.7 Dispersive nichtlineare Medien Dieser Abschnitt gibt eine kurze Diskussion des Ursprungs der Dispersion und ihrer Wirkung auf nichtlineare optische Prozesse. Der Einfachheit halber werden anisotrope Effekte nicht berücksichtigt. Ein dispersives Medium ist ein Medium mit einem Gedächtnis (siehe
𝒫(𝑡) = 𝜀0 ∫ x(𝑡 − 𝑡′ )ℰ(𝑡′ ) d𝑡′ .
(22.170)
−∞
Das beschreibt ein lineares System mit der Impulsantwortfunktion 𝜀0 x(𝑡) [siehe Abschnitt 5.2, insbesondere Gl. (5.38), und Anhang B]. Der zweite Term in der Entwicklung ist eine Superposition der Produkte ℰ(𝑡′ )ℰ(𝑡′′ ) bei Paaren von Zeiten
22.7 Dispersive nichtlineare Medien
𝑡′ ≤ 𝑡 und 𝑡′′ ≤ 𝑡, ∞
𝒫(𝑡) = 𝜀0 ∬ x(2) (𝑡 − 𝑡′ , 𝑡 − 𝑡′′ )ℰ(𝑡′ )ℰ(𝑡′′ ) d𝑡′ d𝑡′′ , −∞
(22.171) (2)
′
′′
wobei x (𝑡 , 𝑡 ) eine Funktion von zwei Variablen ist, die die dispersive Nichtlinearität zweiter Ordnung charakterisiert. Der dritte Term beschreibt eine Nichtlinearität dritter Ordnung, die durch eine Funktion x(3) (𝑡′ , 𝑡′′ , 𝑡′′′ ) und eine entsprechende Beziehung mit einem Dreifachintegral charakterisiert werden kann. Der lineare dispersive Beitrag, der durch Gl. (22.170) beschrieben wird, kann auch durch die Antwort auf monochromatische Felder vollständig charakterisiert werden. Wenn ℰ(𝑡) = Re{𝐸(𝜔) exp(i𝜔𝑡)} ist, dann ist 𝒫(𝑡) = Re{𝑃(𝜔) exp(i𝜔𝑡)}, wobei 𝑃(𝜔) = 𝜀0 𝜒(𝜔)𝐸(𝜔) und 𝜒(𝜔) die Fouriertransformierten von x(𝑡) bei 𝜈 = 𝜔∕2π sind. Das Medium wird dann durch die frequenzabhängige Suszeptibilität 𝜒(𝜔) vollständig charakterisiert. Der durch Gl. (22.171) beschriebene nichtlineare Beitrag zweiter Ordnung wird durch die Antwort auf eine Superposition von zwei monochromatischen Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 charakterisiert. Wenn wir ℰ(𝑡) = Re{𝐸(𝜔1 ) exp(i𝜔1 𝑡) + 𝐸(𝜔2 ) exp(i𝜔2 𝑡)} (22.172) in Gl. (22.171) einsetzen, kann gezeigt werden, dass die Polarisationskomponente mit der Kreisfrequenz 𝜔3 = 𝜔1 + 𝜔2 die Amplitude 𝑃(𝜔3 ) = 2d(𝜔3 ; 𝜔1 , 𝜔2 ) 𝐸(𝜔1 )𝐸(𝜔2 )
(22.173)
besitzt. Der Koeffizient d(𝜔3 ; 𝜔1 , 𝜔2 ) ist eine frequenzabhängige Version des Koeffizienten d aus Gl. (22.20d). Die Beziehung zwischen diesem Koeffizienten und der Antwortfunktion x(2) (𝑡′ , 𝑡′′ ) erhalten wir, indem wir zunächst die Größe ∞
Der entartete Fall der Frequenzverdopplung in einem nichtlinearen Medium zweiter Ordnung ist auch einfach zu beschreiben, indem wir ℰ(𝑡) = Re{𝐸(𝜔) exp(i𝜔𝑡)} in Gl. (22.171) einsetzen und Gl. (22.174) benutzen. Die resultierende Polarisation hat eine Komponente bei der Frequenz 2𝜔 mit der Amplitude 𝑃(2𝜔) = d(2𝜔; 𝜔, 𝜔) 𝐸(𝜔)𝐸(𝜔) mit d(2𝜔; 𝜔, 𝜔) =
1 𝜀 𝒳 (2) (𝜔, 𝜔) . 2 0
(22.175b)
Andere d-Koeffizienten für verschiedene Prozesse der Wellenmischung können auf ähnliche Weise mit der zweidimensionalen Funktion 𝒳 (2) (𝜔1 , 𝜔2 ) verknüpft werden. Der elektrooptische Effekt ist zum Beispiel ein Ergebnis der Wechselwirkung zwischen einem statischen elektrischen Feld (𝜔1 = 0) und einer optischen Welle (𝜔2 = 𝜔), die eine Polarisation bei 𝜔3 = 𝜔 erzeugt. Der zugehörige Koeffizient ist d(𝜔; 0, 𝜔) = 2𝜀0 𝒳 (2) (𝜔, 0); er bestimmt gemäß Gl. (22.18) den Pockelskoeffizienten r. In einem nichtlinearen Medium dritter Ordnung erzeugt ein elektrisches Feld aus drei harmonischen Funktionen der Kreisfrequenzen 𝜔1 , 𝜔2 und 𝜔3 eine Polarisation der Summenfrequenz mit einer Komponente bei der Kreisfrequenz 𝜔4 = 𝜔1 + 𝜔2 + 𝜔3 mit der Amplitude 𝑃(𝜔4 ) = 6𝜒 (3) (𝜔4 ; 𝜔1 , 𝜔2 , 𝜔3 ) 𝐸(𝜔1 )𝐸(𝜔2 )𝐸(𝜔3 ) , (22.176) in der die Funktion 𝜒 (3)(𝜔4 ; 𝜔1 , 𝜔2 , 𝜔3 ) den Koeffizienten 𝜒 (3) ersetzt, der den nichtdispersiven Fall beschreibt. Die Funktion 𝜒 (3) (𝜔4 ; 𝜔1 , 𝜔2 , 𝜔3 ) kann über Beziehungen ähnlich Gl. (22.175a) aus x(3) (𝑡′ , 𝑡′′ , 𝑡′′′ ) bestimmt werden. Kurzgefasst hängen die nichtlinearen Koeffizienten d und 𝜒 (3) zweiter und dritter Ordnung infolge der Dispersion von den Frequenzen der an der Wellenmischung beteiligten Wellen ab.
(2)
𝒳 (𝜔1 , 𝜔2 ) = ∬ x(2) (𝑡′ , 𝑡′′ ) exp[−i(𝜔1 𝑡′ + 𝜔2 𝑡′′ )] d𝑡′ d𝑡′′ −∞
(22.174) definieren, die nichts anderes als die zweidimensionale Fouriertransformierte von x(2) (𝑡′ , 𝑡′′ ) ist, berechnet bei 𝜈1 = −𝜔1 ∕2π und 𝜈2 = −𝜔2 ∕2π [siehe Gl. (A.27)]. Wenn wir Gl. (22.172) in Gl. (22.171) einsetzen und Gl. (22.174) benutzen, erhalten wir d(𝜔3 ; 𝜔1 , 𝜔2 ) = 𝜀0 𝒳 (2)(𝜔1 , 𝜔2 ) .
(22.175a)
Das nichtlineare dispersive Medium zweiter Ordnung wird demzufolge durch eine beliebige der frequenzabhängigen Funktionen 𝒳 (2)(𝜔1 , 𝜔2 ) oder d(𝜔3 ; 𝜔1 , 𝜔2 ) vollständig charakterisiert.
22.7.2 Beschreibung dispersiver nichtlinearer Medien durch eine Differentialgleichung Ein Beispiel für eine nichtlineare dynamische Beziehung zwischen 𝒫(𝑡) und ℰ(𝑡) ist die Differentialgleichung 2
d𝒫 d𝒫 +ζ + 𝜔02 𝒫 + 𝜔02 𝜀0 𝜒0 b 𝒫 2 = 𝜔02 𝜀0 𝜒0 ℰ , (22.177) d𝑡2 d𝑡 mit Konstanten ζ, 𝜔0 , 𝜒0 und b. Ohne den nichtlinearen Term 𝜔02 𝜀0 𝜒0 b 𝒫 2 reduziert sich Gl. (22.177) auf Gl. (5.102), die für ein lineares resonantes dielektrisches Medium gilt, das durch das Lorentz-Oszillatormodell beschrieben wird (siehe Abschnitt 5.5.3). Jedes
797
798
22 Nichtlineare Optik
Atom wird dann durch einen harmonischer Oszillator charakterisiert, in dem ein Elektron der Masse 𝑚 einer Kraft −𝑒ℰ aufgrund des elektrischen Feldes, einer elastischen rücktreibenden Kraft −𝜅𝑥 und einer Reibungskraft 𝑚ζ d𝑥∕ d𝑡 unterworfen ist, wobei 𝑥 die Verschiebung des √ Elektrons aus seiner Gleichgewichtslage ist und 𝜔0 = 𝜅∕𝑚 die Resonanzkreisfrequenz. Das Medium ist dann linear und dispersiv mit einer Suszeptibilität [siehe Gl. (5.105)] 𝜒(𝜔) = 𝜒0
𝜔02 𝜔02 − 𝜔2 + i𝜔ζ
.
tierenden linearen Gleichung ist 𝒫2 , ℒ{𝒫2 } = ℰ − b 𝒫12 .
(22.181)
4) Wiederholen Sie diesen Prozess, um eine Näherung dritter Ordnung zu erhalten, wie das Flussdiagramm in Abb. 22.38 illustriert. ℰ
–
lineares System ε0 χ (ω)
𝒫
(22.178)
Wenn die rücktreibende Kraft eine nichtlineare Funktion −𝜅𝑥 − 𝜅2 𝑥2 der Verschiebung ist, wobei 𝜅 und 𝜅2 Konstanten sind, ist das Ergebnis ein anharmonischer Oszillator, der durch Gl. (22.177) beschrieben wird, wobei b proportional zu 𝜅2 ist. Das Medium ist dann nichtlinear. Übung 22-13: Polarisation für ein Medium aus anharmonischen Oszillatoren Zeigen Sie, dass für ein Medium, das N Atome pro Volu-
meneinheit enthält, die durch anharmonische (nichtlineare) Oszillatoren mit der rücktreibenden Kraft −𝜅𝑥 − 𝜅2 𝑥2 beschrieben werden können, die Beziehung zwischen 𝒫(𝑡) und ℰ(𝑡) durch die nichtlineare Differentialgleichung (22.177) gegeben ist, wobei 2 𝜒0 = N𝑒 2 ∕𝜀0 𝑚𝜔02 ist und b = 𝜅2 ∕𝑒 3 N . Gleichung (22.177) kann nicht exakt gelöst werden. Wenn der nichtlineare Term aber klein ist, liefert ein iterativer Ansatz eine Näherungslösung. Dazu wird Gl. (22.177) in der Form ℒ{𝒫} = ℰ − b 𝒫 2
(22.179) 2
geschrieben, wobei ℒ = (𝜔02 𝜀0 𝜒0 )−1 (d ∕ d𝑡2 + ζ d∕ d𝑡 + 𝜔02 ) ein linearer Differentialoperator ist. Die iterative Lösung von Gl. (22.179) ergibt sich aus den folgenden Schritten: 1) Bestimmen Sie eine Näherung 𝒫1 erster Ordnung, indem Sie den nichtlinearen Term b 𝒫 2 in Gl. (22.179) vernachlässigen, und lösen Sie die lineare Gleichung ℒ{𝒫1 } ≈ ℰ .
b𝒫 2 durch b 𝒫12 ersetzt haben. Die Lösung der resul-
(22.180)
2) Verwenden Sie diese Näherungslösung, um den kleinen nichtlinearen Term b 𝒫12 zu bestimmen. 3) Bestimmen Sie eine Näherung zweiter Ordnung, indem Sie Gl. (22.179) lösen, nachdem Sie den Term
Abb. 22.38 Flussdiagramm für die Lösung der nichtlinearen Differentialgleichung (22.179). Das durch die Operatorgleichung ℒ{𝒫} = ℰ beschriebene lineare System hat die Übertragungsfunktion 𝜀0 𝜒(𝜔).
Wir untersuchen zuerst den Spezialfall monochromatischen Lichts, ℰ = Re{𝐸(𝜔) exp(i𝜔𝑡)}. In der ersten Iteration ist 𝒫1 = Re{𝑃1 (𝜔) exp(i𝜔𝑡)}, wobei 𝑃1 (𝜔) = 𝜀0 𝜒(𝜔)𝐸(𝜔) und 𝜒(𝜔) durch Gl. (22.178) gegeben sind. In der zweiten Iteration erfährt das lineare System eine Kraft ]2 [ ℰ − b𝒫12 = Re{𝐸(𝜔)ei𝜔𝑡 } − b Re{𝜀0 𝜒(𝜔)ei𝜔𝑡 } 1 = Re{𝐸(𝜔)ei𝜔𝑡 } − b Re{[𝜀0 𝜒(𝜔)𝐸(𝜔)]2 2 1 × ei2𝜔𝑡 } − b|𝜀0 𝜒(𝜔)𝐸(𝜔)|2 . 2 Da diese drei Terme die Frequenzen 𝜔, 2𝜔 und 0 haben, reagiert das lineare System mit den Suszeptibilitäten 𝜒(𝜔), 𝜒(2𝜔) bzw. 𝜒(0). Dabei besitzt die Komponente von 𝒫2 mit der Frequenz 2𝜔 eine Amplitude 1 𝑃2 (2𝜔) = 𝜀0 𝜒(2𝜔){− b [𝜀0 𝜒(𝜔)𝐸(𝜔)]2 }. Wegen 𝑃(2𝜔) = 2 d(2𝜔; 𝜔, 𝜔)𝐸(𝜔)𝐸(𝜔) schließen wir 1
d(2𝜔; 𝜔, 𝜔) = − b 𝜀03 [𝜒(𝜔)]2 𝜒(2𝜔) . 2
(22.182)
Übung 22-14: Die millersche Regel
Betrachten Sie ein durch Gl. (22.177) beschriebenes nichtlineares resonantes Medium, das von Licht bestrahlt wird, das aus einer Superposition zweier monochromatischer Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 besteht. Zeigen Sie, dass die durch die Gln. (22.180) und (22.181) beschriebene Näherung zweiter Ordnung eine Komponente der Polarisation bei der Frequenz 𝜔3 = 𝜔1 + 𝜔2 mit der Amplitude 𝑃2 (𝜔3 ) = 2d(𝜔3 ; 𝜔1 , 𝜔2 )𝐸(𝜔1 )𝐸(𝜔2 ) ergibt, mit 1
d(𝜔3 ; 𝜔1 , 𝜔2 ) = − b 𝜀03 𝜒(𝜔1 )𝜒(𝜔2 )𝜒(𝜔3 ) . 2
(22.183)
Gleichung (22.183) ist als millersche Regel bekannt.
Aufgaben
Die millersche Regel besagt, dass der Koeffizient der Nichtlinearität zweiter Ordnung für die Erzeugung einer Welle der Frequenz 𝜔3 = 𝜔1 + 𝜔2 aus zwei Wellen der Frequenzen 𝜔1 und 𝜔2 proportional zum Produkt 𝜒(𝜔1 )𝜒(𝜔2 )𝜒(𝜔3 ) der linearen Suszeptibilitäten bei den drei Frequenzen ist. Die drei Frequenzen müssen daher innerhalb des optischen Transmissionsfensters des Mediums liegen (entfernt von der Resonanz). Wenn diese Frequenzen viel kleiner sind als die Resonanzfrequenz 𝜔0 , dann gibt Gl. (22.178) 𝜒(𝜔) = 𝜒0 und Gl. (22.183) 1 liefert d(𝜔3 ; 𝜔1 , 𝜔2 ) = − b 𝜀02 𝜒03 unabhängig von der Fre2 quenz. Das Medium ist dann näherungsweise nichtdispersiv, und die Ergebnisse der vorherigen Abschnitte, in denen Dispersion vernachlässigt wurde, sind anwendbar. Die millersche Regel zeigt auch, dass Materialien mit großen Brechungsindizes (große 𝜒0 ) häufig große Werte von d besitzen. Anisotrope dispersive Medien
Wenn sowohl anisotrope als auch dispersive Eigenschaften berücksichtigt werden, wird die Dreiwellenmischung in einem Medium zweiter Ordnung durch die allgemeinere Beziehung ∑ 𝑃𝑖 (𝜔3 ) = 2 d𝑖𝑗𝑘 (𝜔3 ; 𝜔1 , 𝜔2 ) 𝐸𝑗 (𝜔1 )𝐸𝑘 (𝜔2 ) (22.184) 𝑗𝑘
beschrieben, wobei 𝜔3 = 𝜔1 + 𝜔2 ist. Die Koeffizienten d𝑖𝑗𝑘 hängen jetzt von den Frequenzen der gemischten Wellen ab. Diese Beziehung ähnelt der Beziehung ∑ 𝑃𝑖 (𝜔) = 𝑗 𝜒𝑖𝑗 (𝜔)𝐸𝑗 (𝜔) für lineare Medien. Ähnlich wird die Vierwellenmischung in einem Medium dritter Ordnung durch ∑ (3) 𝑃𝑖 (𝜔4 ) = 6 𝜒𝑖𝑗𝑘𝑙 (𝜔4 ; 𝜔1 , 𝜔2 , 𝜔3 )𝐸𝑗 (𝜔1 )𝐸𝑘 (𝜔2 )𝐸𝑙 (𝜔3 ) 𝑗𝑘𝑙
(22.185) beschrieben, wobei 𝜔4 = 𝜔1 + 𝜔2 + 𝜔3 ist. Die frequenzabhängigen Tensorelemente d𝑖𝑗𝑘 und (3) 𝜒𝑖𝑗𝑘𝑙 gehorchen einer Reihe von intrinsischen Symmetriebeziehungen, die der Beziehung 𝜒𝑖𝑗∗ (𝜔) = 𝜒𝑖𝑗 (−𝜔) in der linearen Optik ähneln: ∗
d𝑖𝑗𝑘 (𝜔3 ; 𝜔1 , 𝜔2 ) = d𝑗𝑘𝑖 (𝜔1 ; −𝜔2 , 𝜔3 ) = d𝑘𝑖𝑗 (𝜔2 ; 𝜔3 , −𝜔1 ) (3)∗ (𝜔 ;𝜔 ,𝜔 ,𝜔 ) 𝜒𝑖𝑗𝑘𝑙 4 1 2 3
=
(22.186)
(3) 𝜒𝑗𝑘𝑙𝑖 (𝜔1 ; −𝜔2 , −𝜔3 , 𝜔4 )
=⋯ (3)
= 𝜒𝑗𝑖𝑘𝑙 (𝜔3 ; 𝜔4 , −𝜔1 , −𝜔2 ) .
(22.187)
In diesen Beziehungen beschreibt der Koeffizient d𝑗𝑘𝑖 (𝜔1 ; −𝜔2 , 𝜔3 ) zum Beispiel eine Differenzfrequenzerzeugung, in der eine Welle der Frequenz 𝜔2 und der Polarisation 𝑘 mit einer Welle der Frequenz 𝜔3 und der
Polarisation 𝑖 gemischt wird und eine Welle der Frequenz 𝜔1 = 𝜔3 − 𝜔2 und der Polarisation 𝑗 erzeugt. Andere Koeffizienten können ähnlich interpretiert werden. Diese Art der intrinsischen Symmetrie wird natürlich durch andere Struktursymmetrie-Beziehungen ergänzt, die für verschiedene Klassen von Kristallen gelten.
Aufgaben Aufgabe 22-1: Leistungsaustausch bei der Summenfrequenzerzeugung
Ein LiNbO3 -Kristall mit dem Brechungsindex 𝑛 = 2.2 wird verwendet, um Licht der Vakuumwellenlänge 1.3 μm durch Dreiwellenmischung in Licht der Vakuumwellenlänge 0.5 μm umzuwandeln. Die drei Wellen sind kollineare ebene Wellen, die sich in 𝑧-Richtung ausbreiten. Bestimmen Sie die Wellenlänge der dritten Welle (der Pumpwelle). Um wie viel nimmt die Leistung der umgewandelten Welle zu, wenn die Leistung der 1.3-μm-Welle innerhalb einer Entfernung Δ𝑧 um 1 mW fällt? Um welchen Betrag steigt oder fällt die Leistung der Pumpwelle innerhalb derselben Entfernung? Aufgabe 22-2: Anpassungsbedingungen für die kollineare Typ-II-Frequenzverdopplung
Bestimmen Sie die Winkel 𝜃 für einen KDP-Kristall, der zur Typ-II-Frequenzverdopplung bei 𝜆 = 1.06 μm verwendet wird, für die o-e-o- und o-e-e-Anordnung. Verwenden Sie die Sellmeiergleichungen in Tabelle 5.1, um die Wellenlängenabhängigkeit der Brechungsindizes zu bestimmen. Aufgabe 22-3: Phasenbedingung in einem entarteten parametrischen Differenzfrequenzerzeuger
Ein entarteter parametrischer Differenzfrequenzerzeuger verwendet einen KDP-Kristall, um Licht von 0.6 μm nach 1.2 μm zu wandeln. Wie sollten die Ausbreitungsrichtungen der Wellen (bezüglich der optischen Achse des Kristalls) und ihre Polarisationen liegen, damit die Phasenbedingung erfüllt ist, wenn die beiden Wellen kollinear sind? KDP ist ein optisch einachsiger Kristall mit den folgenden Brechungsindizes: bei 𝜆0 = 0.6 μm, 𝑛o = 1.509 und 𝑛e = 1.468; bei 𝜆0 = 1.2 μm, 𝑛o = 1.490 und 𝑛e = 1.459. Aufgabe 22-4: Bedingungen für die Dreiwellenmischung in einem dispersiven Medium
Der Brechungsindex eines nichtlinearen Mediums ist eine Funktion der Wellenlänge, die näherungsweise durch 𝑛(𝜆0 ) ≈ 𝑛0 − 𝜉𝜆0 beschrieben werden kann, wobei 𝜆0 die Vakuumwellenlänge ist und 𝑛0 und 𝜉 Konstan-
799
800
22 Nichtlineare Optik
ten sind. Zeigen Sie, dass drei Wellen der Wellenlängen 𝜆01 , 𝜆02 und 𝜆03 , die sich in derselben Richtung ausbreiten, durch einen nichtlinearen Effekt zweiter Ordnung nicht effizient gekoppelt werden können. Ist effiziente Kopplung möglich, wenn sich eine der Wellen in der entgegengesetzten Richtung ausbreitet? Aufgabe 22-5: Toleranz gegenüber einer Phasenfehlanpassung
(a) Die Helmholtzgleichung mit einer Quelle, ∇2 𝐸 + 𝑘2 𝐸 = −𝑆, hat die Lösung 𝐸(r) = ∫ 𝑆(r′ ) 𝑉
exp(−i𝑘0 |r − r′ |) ′ dr , 4π|r − r′ |
wobei 𝑉 das Volumenx der Quelle ist und 𝑘0 = 2π∕𝜆0 . Mit dieser Gleichung kann das an einem Punkt r emittierte Feld bestimmt werden, wenn die Quelle an allen Punkten r′ innerhalb des Quellenvolumens bekannt ist. Wenn die Quelle auf einen kleinen Bereich um den Ursprung r = 0 beschränkt und r ein Punkt in einer so großen Entfernung von der Quelle ist, dass für alle r′ innerhalb der Quelle 𝑟 ′ ≪ 𝑟 gilt, ist |r − r′ | = (𝑟 2 + 𝑟 ′ 2 − 2r ⋅ r′ )1∕2 ≈ 𝑟(1 − r ⋅ r′ ∕𝑟 2 ) und 𝐸(r) ≈
exp(−i𝑘0 𝑟) ∫ 𝑆(r′ ) exp(i𝑘0ˆ r ⋅ r′ ) dr′ , 4π 𝑟 𝑉
wobei ˆ r ein Einheitsvektor in der Richtung von r ist. Nehmen Sie an, dass das Volumen 𝑉 ein Würfel der Kantenlänge 𝐿 und die Quelle eine harmonische Funktion 𝑆(r) = exp(−ikS ⋅ r) ist, und zeigen Sie, r = k𝑠 madass für 𝐿 ≫ 𝜆0 das emittierte Licht für 𝑘0ˆ ximal wird und schnell fällt, wenn diese Bedingung nicht erfüllt ist. Eine harmonische Quelle mit Abmessungen, die viel größer sind als eine Wellenlänge, emittiert daher eine ebene Welle mit näherungsweise demselben Wellenvektor. (b) Verwenden Sie die Beziehung aus (a) und die erste bornsche Näherung, um das gestreute Feld zu bestimmen, wenn das auf ein nichtlineares Medium zweiter Ordnung einfallende Feld die Summe zweier Wellen mit den Wellenvektoren k1 und k2 ist. Leiten Sie die Phasenbedingung k3 = k1 + k2 her und bestimmen Sie den kleinsten Betrag von Δk = k3 − k1 − k2 , bei dem das gestreute Feld 𝐸 verschwindet.
Aufgabe 22-6: Rückwärts-Frequenzverdopplung durch Quasi-Phasenanpassung
Zeigen Sie, dass mit einem periodisch gepolten Kristall eine frequenzverdoppelte Welle erzeugt werden kann, die sich entgegen der Grundwelle ausbreitet. Geben Sie die Phasenbedingung für diese Quasi-Phasenanpassung an. Bestimmen Sie das Verhältnis der Polungsperiode zur Wellenlänge der Grundwelle in dem Medium, wenn die Gleichung für die siebte Harmonische der periodischen Funktion erfüllt ist. Aufgabe 22-7: Invarianten bei der Vierwellenmischung
Leiten Sie die Gleichungen für die Erhaltung der Energie und der Photonenzahl (die Manley-Rowe-Beziehung) für die Vierwellenmischung her. Aufgabe 22-8: Leistung eines räumlichen Solitons
Geben Sie einen Ausdruck für die integrierte Intensität des durch Gl. (22.53) beschriebenen räumlichen Solitons an und zeigen Sie, dass sie umgekehrt proportional zum Strahlradius 𝑊0 ist. Aufgabe 22-9: Ein opto-optischer Phasenmodulator
Entwerfen Sie ein System, um die Phase eines optischen Strahls der Wellenlänge 546 nm und der Dicke 𝑊 = 0.1 mm mithilfe einer CS2-Kerrzelle der Länge 𝐿 = 10 cm zu modulieren. Der Modulator wird durch Licht aus einem gepulsten Laser der Wellenlänge 694 nm gesteuert. CS2 hat einen Brechungsindex 𝑛 = 1.6 und einen Koeffizienten der Nichtlinearität dritter Ordnung 𝜒 (3) = 4.4 × 10−32 C m∕V3 . Geben Sie eine Abschätzung für die optische Leistung Pπ des Steuerlichts, die notwendig ist, um die Phase des kontrollierten Lichts um π zu modulieren. Aufgabe 22-10: Frequenzverdopplung durch ein statisches elektrisches Feld in einem nichtlinearen Medium dritter Ordnung
Zeigen Sie, dass in einem nichtlinearen Medium dritter Ordnung mit einem angelegten statischen elektrischen Feld Frequenzverdopplung auftreten kann. Welche physikalischen Parameter bestimmen den Wirkungsgrad dieses Prozesses? Aufgabe 22-11: Gewinn eines parametrischen Verstärkers
Ein parametrischer Verstärker nutzt einen 4 cm langen KDP-Kristall (𝑛 ≈ 1.49, d = 8.3 × 10−24 C∕V2 ), um Licht der Wellenlänge 550 nm zu verstärken. Die Pumpwellenlänge ist 335 nm und ihre Intensität ist 106 W∕cm2 . Bestimmen Sie den Gewinnkoeffizienten des Verstärkers und den Gesamtgewinn unter der Annahme, dass die Signal-, Idler- und Pumpwellen kollinear sind.
Aufgaben
Aufgabe 22-12: Entarteter parametrischer Differenzfrequenzerzeuger
Aufgabe 22-16: Kollineare Typ-II-Dreiwellenmischung in einem BBO-Kristall
Formulieren und lösen Sie die gekoppelten Gleichungen, die die Wellenmischung in einem parametrischen Differenzfrequenzerzeuger mit einer Pumpe der Frequenz 𝜔3 = 2𝜔 und Signalen bei 𝜔1 = 𝜔2 = 𝜔 beschreiben. Alle Wellen breiten sich in 𝑧-Richtung aus. Leiten Sie einen Ausdruck für die Photonenflussdichten bei 2𝜔 und 𝜔 und den Wirkungsgrad der Konversion für eine Wechselwirkungslänge 𝐿 her. Verifizieren Sie die Energie- und Photonenerhaltung.
Wiederholen die Analyse aus Beispiel 22-7, um zu zeigen, dass der effektive nichtlineare Koeffizient deff für die Typ-II-o-e-e-Dreiwellenmischung für einen Kristall der Gruppe 3𝑚 wie z. B. BBO durch deff = d22 cos2 𝜃 cos 3𝜙 gegeben ist.
Aufgabe 22-13: Schwellen-Pumpintensität für die parametrische Schwingung
Ein parametrischer Oszillator nutzt einen 5 cm langen LiNbO3 -Kristall mit dem nichtlinearen Koeffizienten zweiter Ordnung d = 4 × 10−23 C∕V2 und dem Brechungsindex 𝑛 = 2.2 (die wir bei allen interessierenden Frequenzen als konstant annehmen). Die Pumpe ist ein frequenzverdoppelter Nd:YAG-Laser bei 1.06 μm. Der Kristall befindet sich in einem Resonator mit identischen Spiegeln mit Reflexionsgraden von 0.98. Die Phasenbedingung ist erfüllt, wenn die Signal- und die Idlerwelle des parametrischen Verstärkers dieselbe Frequenz besitzen. Bestimmen Sie die minimale Pumpintensität für parametrische Oszillation. Aufgabe 22-14: Kombinierte Frequenzverdopplung und Summenfrequenzerzeugung
Zwei Wellen der Kreisfrequenzen 𝜔1 und 𝜔2 , ihre zweiten Harmonischen mit den Kreisfrequenzen 2𝜔1 und 2𝜔2 und ihre Summenfrequenzwelle mit der Kreisfrequenz 𝜔1 + 𝜔2 wechselwirken gleichzeitig in einem nichtlinearen Medium zweiter Ordnung. Geben Sie gekoppelte Gleichungen für diese Fünfwellenmischung an, wenn die Phasenbedingungen für die beiden Frequenzverdopplungen und die Summenfrequenzerzeugung erfüllt sind. Lösen Sie diese Gleichungen numerisch und zeigen Sie, dass die Anwesenheit der zweiten Welle die Frequenzverdopplung für die erste unterdrücken kann. Aufgabe 22-15: Gleichungen gekoppelter Wellen für die entartete Vierwellenmischung
Betrachten Sie die kollineare Vierwellenmischung in einem nichtlinearen Medium dritter Ordnung für den entarteten Fall 𝜔4 = 𝜔3 und 𝜔1 + 𝜔2 = 2𝜔3 . Leiten Sie gekoppelte Wellengleichungen für die Amplituden 𝐴1 , 𝐴2 und 𝐴3 unter der Annahme her, dass die Phasenbedingung vollständig erfüllt ist.
Aufgabe 22-17: Beziehung zwischen nichtlinearen optischen Koeffizienten und elektrooptischen Koeffizienten
Zeigen Sie, dass die elektrooptischen Koeffizienten mit den Koeffizienten der optischen Nichtlinearität gemäß (3) r𝑖𝑗𝑘 = −4𝜀0 d𝑖𝑗𝑘 ∕𝜀𝑖𝑖 𝜀𝑗𝑗 und s𝑖𝑗𝑘𝑙 = −12𝜀0 𝜒𝑖𝑗𝑘𝑙 ∕𝜀𝑖𝑖 𝜀𝑗𝑗 verknüpft sind. Diese Beziehungen sind Verallgemeinerungen der Gln. (22.18) bzw. (22.43). Hinweis: Wenn zwei Matrizen A und B durch B = A−1 verknüpft sind, hängen die Differenzmatrizen ΔA und ΔB gemäß ΔB = −A−1 ΔAA−1 zusammen.
Weiterführende Literatur Nichtlineare Optik
Siehe auch die Weiterführende Literatur in den Kapiteln 5, 6, 8, 21 und 23. G. S. He, S. H. Liu, Advanced Nonlinear Optics, World Scientific, 2. Aufl. 2018. Y. Zhu, Z. Wang, Y. Chen, Y. Lu, S. Zhu, Superlattices and Microstructures of Dielectric Materials: Quasi-PhaseMatching in Nonlinear Optics and Quantum Optics, de Gruyter 2018. A. Morita, Theory of Sum Frequency Generation Spectroscopy, Springer 2018. G. S. He, Nonlinear Optics and Photonics, Oxford University Press 2015. L. Lugiato, F. Prati, M. Brambilla, Nonlinear Optical Systems, Cambridge University Press 2015. P. D. Drummond, M. Hillery, The Quantum Theory of Nonlinear Optics, Cambridge University Press 2014. S. Guha, L. P. Gonzalez, Laser Beam Propagation in Nonlinear Optical Media, CRC Press/Taylor & Francis 2014. G. P. Agrawal, Nonlinear Fiber Optics, Academic Press/ Elsevier, 5. Aufl. 2013. P. E. Powers, Field Guide to Nonlinear Optics, SPIE Optical Engineering Press 2013. G. I. Stegeman, R. A. Stegeman, Nonlinear Optics: Phenomena, Materials and Devices, Wiley 2012. P. E. Powers, Fundamentals of Nonlinear Optics, CRC Press/ Taylor & Francis 2011. G. New, Introduction to Nonlinear Optics, Cambridge University Press 2011. P. Mandel, Nonlinear Optics, Wiley-VCH 2010.
801
802
22 Nichtlineare Optik
M. E. Marhic, Fiber Optical Parametric Amplifiers, Oscillators and Related Devices, Cambridge University Press 2008. R. W. Boyd, Nonlinear Optics, Academic Press/Elsevier, 3. Aufl. 2008. R. Menzel, Photonics: Linear and Nonlinear Interactions of Laser Light and Matter, Springer, 2. Aufl. 2007. M. Wegener, Extreme Nonlinear Optics: An Introduction, Springer 2005. D. N. Nikogosyan, Nonlinear Optical Crystals: A Complete Survey, Springer 2005. P. P. Banerjee, Nonlinear Optics: Theory, Numerical Modeling, and Applications, Marcel Dekker 2004. A. Brignon, J.-P. Huignard (Hrsg.), Phase Conjugate Laser Optics, Wiley 2004. T. Suhara, M. Fujimura, Waveguide Nonlinear-Optic Devices, Springer 2003. F. Kajzar, R. Reinisch (Hrsg.), Beam Shaping and Control with Nonlinear Optics, Plenum Press 1998. N. Bloembergen, Nonlinear Optics, World Scientific 1965, 4. Aufl. 1996. C. L. Tang, L. K. Cheng, Fundamentals of Optical Parametric Processes and Oscillators, Harwood 1995. J.-Y. Zhang, J. Y. Huang, Y. R. Shen, Optical Parametric Generation and Amplification, Harwood 1995. J. Zyss (Hrsg.), Molecular Nonlinear Optics: Materials, Physics, and Devices, Academic Press 1994. J.-I. Sakai, Phase-Conjugate Optics, McGraw-Hill 1992. P. N. Butcher, D. Cotter, The Elements of Nonlinear Optics, Cambridge University Press 1990. V. S. Butylkin, A. E. Kaplan, Yu. G. Khronopulo, E. I. Yakubovich, Resonant Nonlinear Interactions of Light with Matter, Springer 1989. M. Schubert, B. Wilhelmi, Nonlinear Optics and Quantum Electronics, Wiley 1986. B. Ya. Zel’dovich, N. F. Pilipetsky, V. V. Shkunov, Principles of Phase Conjugation, Springer 1985. Y. R. Shen, The Principles of Nonlinear Optics, Wiley 1984.
Artikel in Zeitschriften und Büchern
T. R. Gosnell (Hrsg.), Selected Papers on Upconversion Lasers, SPIE Optical Engineering Press 2000 (Milestone Series Bd. 161). J. H. Hunt (Hrsg.), Selected Papers on Optical Parametric Oscillators and Amplifiers and Their Applications, SPIE Optical Engineering Press 1997 (Milestone Series Bd. 140). J. Peřina (Hrsg.), Selected Papers on Photon Statistics and Coherence in Nonlinear Optics, SPIE Optical Engineering Press 1991 (Milestone Series Bd. 39). H. E. Brandt (Hrsg.), Selected Papers on Nonlinear Optics, SPIE Optical Engineering Press (Milestone Series Band 32) 1991. N. Bloembergen, ‚Nonlinear Optics and Spectroscopy‘ (Nobelvortrag), Reviews of Modern Physics 54, 685–695, 1982. G. H. C. New, J. F. Ward, ‚Optical Third-Harmonic Generation in Gases‘, Physical Review Letters 19, 556–559, 1967. J. A. Armstrong, N. Bloembergen, J. Ducuing, P. S. Pershan, ‚Interactions Between Light Waves in a Nonlinear Dielectric‘, Physical Review 127, 1918–1939, 1962. W H. Louisell, A. Yariv, A. E. Siegman, ‚Quantum Fluctuations and Noise in Parametric Processes‘, Physical Review 124, 1646–1654, 1961. P. A. Franken, A. E. Hill, C. W Peters, G. Weinreich, ‚Generation of Optical Harmonics‘, Physical Review Letters 7, 118–119, 1961.
803
23 Ultraschnelle Optik Die Erforschung von optischen Pulsen begann mit der Erfindung des Lasers, da die frühen Laser Licht nur in Form von kurzen Pulsen emittieren konnten; die Entwicklung von CW-Lasern erforderte bedeutende zusätzliche Anstrengungen. Das Interesse an den Eigenschaften und dem Verhalten von ultrakurzen optischen Pulsen stieg jedoch mit jedem Schritt in Richtung immer kürzerer Zeitskalen (und gleichzeitig immer höherer Peakleistung) stetig an. Die Entwicklung von Nanosekundenpulsen wurde von Pikosekundenpulsen gefolgt, diese von Femtosekundenpulsen, und der vorläufige Endpunkt der Entwicklung sind Attosekundenpulse. Die Realisierung kürzerer Pulse wurde jedoch immer herausfordernder. Diese Fortschritte wurden durch das Aufkommen vieler wichtiger Anwendungen vorangetrieben, die erst durch das Vorhandensein dieser kurzen Pulse möglich wurden. Dazu gehören beispielsweise die nichtlineare Frequenzumwandlung, die Untersuchung ultraschneller physikalischer, chemischer oder biologischer Prozesse, die Erzeugung räumlich kohärenter Röntgenstrahlung, die Multiphotonen-Bildgebung, die Materialbearbeitung oder die faseroptische Kommunikation mit ultrahohen Datengeschwindigkeiten. In der Optik bezeichnen die Ausdrücke ultraschnell bzw. ultrakurz im Allgemeinen Pulse im Bereich von einigen hundert Femtosekunden bis hin zu Attosekunden. In der Elektronik beschreiben dieselben Ausdrücke jedoch Pulse von einer Nanosekunde bis zu einigen zehn Pikosekunden Dauer, da die Betriebsgeschwindigkeiten von elektronischen Bauteilen deutlich unter der der Optik liegt. Ein elektrischer Nanosekundenpuls hat eine spektrale Breite im GHz-Bereich und muss durch eine Breitband-Mikrowellenschaltung geführt werden. Ein elektrischer Puls von einer Pikosekunde Dauer hat eine spektrale Breite im THz-Bereich, die durch keine herkömmliche elektrische oder Mikrowellenschaltung geleitet werden kann. Wenn man einen elektrischen Femtosekundenpuls erzeugen würde, würde er ein spektrales Band von einigen hundert THz bedecken, was dem ganzen Frequenzbereich von 0 Hz bis in den Pikohertz-
bereich jenseits der UV-Kante des sichtbaren Bandes entspräche. Außerdem hätte ein solcher Puls wegen des Unbestimmtheitsprinzips Δ𝐸Δ𝑡 ≥ ℎ∕2 eine Energieunschärfe größer als die Bandlücke typischer Halbleiter (E g ≈ 1.5 eV), was den Betrieb herkömmlicher elektronischer Bauelemente empfindlich stören würde.
In diesem Kapitel . . . Ultrakurze optische Pulse können auf direktem Weg durch spezielle Laser auf der Basis verschiedener Modulations- oder Modenkopplungstechniken erzeugt werden (siehe Abschnitt 16.4); diese auf diese Weise erzeugten Pulse reichen jedoch nicht für alle Anwendungen aus. In diesem Kapitel wollen wir zeigen, wie man solche ultrakurzen Pulse weiter komprimieren und mithilfe von nichtlinearen dispersiven optischen Komponenten und Systemen umformen kann. Das Kapitel beginnt mit einer Beschreibung der grundlegenden zeitlichen und spektralen Eigenschaften von optischen Pulsen (Abschnitt 23.1) und ihrer Filterung durch (i) lineare dispersive optische Komponenten wie Prismen und Gitter (Abschnitt 23.2) und (ii) Transmission durch lineare dispersive Medien wie z. B. optische Fasern (Abschnitt 23.3). Danach besprechen wir räumliche Effekte und die Optik von gepulsten Wellen mit großen spektralen Breiten (Abschnitt 23.4). Anschließend wenden wir uns der nichtlinearen Optik von gepulsten Wellen zu (Abschnitt 23.5) und verallgemeinern einige der nichtlinearen optischen Phänomene, die wir in Kapitel 22 für kontinuierliche Wellen eingeführt hatten, auf gepulste Wellen, beispielsweise die parametrische Wellenmischung, die Selbstphasenmodulation und die optischen Solitonen. Schließlich werden in Abschnitt 23.6 mehrere Methoden zur Detektion ultrakurzer optischer Pulse mit „langsamen“ Detektoren besprochen.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
804
23 Ultraschnelle Optik
23.1 Eigenschaften von Pulsen 23.1.1
Zeitliche und spektrale Eigenschaften
Ein Lichtpuls wird durch ein optisches Feld mit endlicher zeitlicher Dauer beschrieben. In diesem Kapitel verwenden wir die skalare Wellentheorie auf Kapitel 2 und beschreiben die Feldkomponenten durch eine allgemeine komplexe Wellenfunktion 𝑈(r, 𝑡), die so normiert ist, dass für die optische Intensität 𝐼(r, 𝑡) = |𝑈(r, 𝑡)|2 (in W∕m2 ) gilt. Wenn wir uns nur für die zeitlichen oder spektralen Eigenschaften eines Pulses an einem festen Ort r interessieren, verwenden wir nur die Funktionen 𝑈(𝑡) und 𝐼(𝑡). Zeitliche und spektrale Darstellungen
Die komplexe Wellenfunktion eines optischen Pulses der Mittenfrequenz 𝜈0 hat die Form 𝑈(𝑡) = 𝒜(𝑡) exp(i𝜔0 𝑡), wobei 𝒜(𝑡) die komplexe Einhüllende ist und 𝜔0 = 2π 𝜈0 die zentrale Kreisfrequenz. Die komplexe Einhüllende selbst wird durch ihren Betrag |𝒜(𝑡)| und ihre Phase 𝜑(𝑡) = arg{𝒜(𝑡)} charakterisiert, sodass 𝑈(𝑡) = |𝒜(𝑡)| exp(i[𝜔0 𝑡 + 𝜑(𝑡)]) ist. Die optische Intensität ist 𝐼(𝑡) = |𝑈(𝑡)|2 = |𝒜(𝑡)|2 (in W∕m2 ) und die Fläche unter der Intensitätsfunktion ∫ 𝐼(𝑡) d𝑡 ist die Energiedichte (in J∕m2 ). Typische Pulse haben Intensitätsprofile entsprechend einer Gaußfunktion 𝐼(𝑡) ∝ exp(−2𝑡2 ∕𝜏2 ) (die in Abschnitt 23.1.2 im Detail untersucht wird), einer Lorentzfunktion 𝐼(𝑡) ∝ 1∕(1 + 𝑡2 ∕𝜏2 ) oder eines Sekans Hyper2 bolicus 𝐼(𝑡) ∝ sech (𝑡∕𝜏) (der in Abschnitt 23.5.2 im Zusammenhang mit optischen Solitonen auftaucht). Die Breite all dieser Pulse ist proportional zu der Zeitkonstante 𝜏. In Frequenzbereich wird der Puls durch die Fouriertransformierte 𝑉(𝜈) = ∫ 𝑈(𝑡) exp(−i2π𝜈𝑡) d𝑡 beschrieben, die eine komplexe Funktion 𝑉(𝜈) = |𝑉(𝜈)| exp[i𝜓(𝜈)] ist. Ihr Betragsquadrat S (𝜈) = |𝑉(𝜈)|2 wird spektrale Intensität genannt, und 𝜓(𝜈) ist die spektrale Phase. Die Funktion 𝑉(𝜈) ist um die Mittenfre-
Wellenfunktion Re{U(t)}
Einhüllende | (t)|
t
(a)
Intensität I(t)
quenz 𝜈0 verteilt und verschwindet für negative 𝜈, da 𝑈(𝑡) ein komplexes analytisches Signal ist (siehe Abschnitt 2.6.1). Die Fouriertransformierte der komplexen Einhüllenden 𝐴(𝜈) = ∫ 𝒜(𝑡) exp(−i2π𝜈𝑡) d𝑡 = 𝑉(𝜈 − 𝜈0 ) ist um 𝜈 = 0 verteilt. Wenn der Puls eine schmale spektrale Breite hat, ist die komplexe Einhüllende eine langsam variierende Funktion der Zeit (d. h. sie ändert sich innerhalb einer optischen Periode 1∕𝜈0 nur wenig), das gilt jedoch nicht für ultraschmale Pulse mit ultrabreiten spektralen Verteilungen. Abbildung 23.1 illustriert die verschiedenen zeitlichen und spektralen Funktionen, die einen optischen Puls charakterisieren. Zeitliche und spektrale Breiten
Die zeitlichen und spektralen Breiten eines Pulses sind die Breiten der Intensität 𝐼(𝑡) = |𝑈(𝑡)|2 bzw. der spektralen Intensität S (𝜈) = |𝑉(𝜈)|2 gemäß irgendeiner der in Anhang A.2 entwickelten Definitionen von „Breite“. Soweit nicht anders angegeben, werden wir immer die Halbwertsbreite als Breite verwenden und die zeitlichen und spektralen Breiten als 𝜏HWB bzw. Δ𝜈 bezeichnen. Wegen der FT-Beziehung zwischen 𝑈(𝑡) und 𝑉(𝜈) ist die spektrale Breite umgekehrt proportional zur zeitlichen Breite. Die Proportionalitätskonstante hängt von der Pulsform und der genauen Definition der Breite ab. Diese inverse Beziehung wird in Abb. 23.2(a) für einen Gaußpuls mit 𝜏HWB Δ𝜈 = 0.44 dargestellt. Die spektrale Intensität S (𝜈) wird häufig als Funktion der Wellenlänge aufgetragen, S 𝜆 (𝜆). Die Umrechnung erfolgt mit der Beziehung S 𝜆 (𝜆) = S (𝜈)| d𝜈∕ d𝜆| = (𝑐∕𝜆 2 )S (𝑐∕𝜆). Auch die spektrale Breite Δ𝜈 kann in Wellenlängeneinheiten umgewandelt werden. Für Δ𝜈 ≪ 𝜈0 ist die spektrale Breite in Wellenlängeneinheiten näherungsweise Δ𝜆 ≈ | d𝜆∕ d𝜈|Δ𝜈 oder 𝜆02 Δ𝜈 , 𝑐 wobei 𝜆0 = 𝑐∕𝜈0 die zentrale Wellenlänge ist. Δ𝜆 ≈
spektrale Intensität (ν)
Phase φ(t)
t
spektrale Phase ψ(ν) ν0
0
(23.1)
ν
(b)
Abb. 23.1 Zeitliche und spektrale Darstellungen eines optischen Pulses. (a) Der Realteil der Wellenfunktion Re{U(t )} = |𝒜(t )| cos[𝜔0 t + 𝜑(t )], der Betrag der Einhüllenden |𝒜(t )|, die Intensität I(t ) und die Phase 𝜑(t ). (b) Die spektrale Intensität S (𝜈) und die spektrale Phase 𝜓(𝜈).
23.1 Eigenschaften von Pulsen Δν
Δν
100 THz Fe m
10 THz 1 THz
ek
de
100 GHz
100 GHz
no
pti
k
10 GHz
Na
10 GHz
no
1 GHz 100 MHz
1 ns
100 ps
10 ps
1 ps
100 fs
0
=
λ
µm
100 MHz
-
10 fs
1 fs (a)
=
λ0
1.5
1 GHz
se op kun tik den
10 MHz
λ0
m .5 µ
= 0
τHWB
10 MHz
(b)
1µm
un
m 1µ
100 nm
os
10 nm
-
Pik
1 nm
1 THz
tos e op kun tik de n
0.1 nm
10 THz
100 THz
Δλ
Abb. 23.2 (a) Die Beziehung Δ𝜈 = 0.44∕𝜏HWB zwischen der spektralen Breite Δ𝜈 und der zeitlichen Breite 𝜏HWB eines Gaußpulses. (b) Die entsprechende Breite Δ𝜆 für einen Puls der Mittenfrequenz 𝜈0 entsprechend der zentralen Wellenlänge 𝜆0 = c∕𝜈0 = 0.5 μ m, 1 μ m und 1.5 μ m. Bei-
spielsweise ist für einen Puls von 10 fs Dauer die spektrale Breite Δ𝜈 = 44 THz entsprechend Δ𝜆 = 37 nm, 147 nm bzw. 331 nm für die zentralen Wellenlängen 𝜆0 = 0.5 μ m, 1 μ m und 1.5 μ m, wie die offenen Kreise in der Graphik zeigen. Für Δ𝜈 ≪ 𝜈0 ist diese Beziehung linear [siehe Gl. (23.1)].
Für ultraschmale Pulse mit großem Δ𝜈 ist der genaue Ausdruck für Δ𝜆
d𝑡2 > 0, dann bezeichnet man den Puls als positiv gechirpt. Wenn 𝜈i im Pulszentrum eine abnehmende Funktion der Zeit ist, d. h. 𝜑′′ < 0, bezeichnet man den Puls als negativ gechirpt. Wenn die Phase eines optischen Pulses der Breite 𝜏 eine quadratische Funktion der Zeit ist, 𝜑(𝑡) = 𝑎𝑡2 ∕𝜏2 mit einer Konstante 𝑎, dann ist 𝜑′′ = 2𝑎∕𝜏2 , sodass die instantane Frequenz 𝜈i = 𝜈0 + (𝑎∕π 𝜏2 )𝑡 eine lineare Funktion der Zeit ist. Man bezeichnet den Puls in diesem Fall als linear gechirpt und den Parameter
Δ𝜆 =
𝜆02 Δ𝜈 𝑐 𝑐 . − = 𝑐 1 − (Δ𝜈∕2𝜈0 )2 𝜈0 − Δ𝜈∕2 𝜈0 + Δ𝜈∕2 (23.2)
Unter diesen Bedingungen verliert das Konzept der spektralen Breite jedoch seine Relevanz. Ein Puls von 2 fs Dauer hat z. B. eine spektrale Breite Δ𝜈 = 220 THz entsprechend Δ𝜆 = 847 nm bei 𝜆0 = 1 μm, d. h. das Spektrum ist sehr breit und dehnt sich vom Sichtbaren bis ins Infrarot aus. Instantane Frequenz
Eine andere charakteristische Eigenschaft eines optischen Pulses ist die Zeitabhängigkeit seiner instantanen Frequenz. Die instantane Kreisfrequenz 𝜔i ist die Ableitung der Phase von 𝑈(𝑡), und die instantane Frequenz ist 𝜈i = 𝜔i ∕2π; es gilt also d𝜑 1 d𝜑 , 𝜈i = 𝜈0 + . (23.3) 𝜔i = 𝜔0 + 2π d𝑡 d𝑡 Wenn die Phase eine lineare Funktion der Zeit ist, 𝜑(𝑡) = 2π 𝑓𝑡, dann ist die instantane Frequenz 𝜈i = 𝜈0 + 𝑓; d. h. eine linear variierende Phase entspricht einer festen Frequenzverschiebung. Eine nichtlineare Zeitabhängigkeit der Phase entspricht einer zeitabhängigen instantanen Frequenz.
𝑎=
1 ′′ 2 𝜑 𝜏 2
(23.4)
als Chirpparameter. Für 𝑎 > 0 ist der Puls negativ gechirpt, für 𝑎 < 0 positiv gechirpt. Bei 𝑡 = 𝜏∕2 nimmt die instantane Frequenz um 𝑎∕2π𝜏 zu, das in der Größenordnung von 𝑎Δ𝜈 liegt. Der Chirpparameter gibt daher das Verhältnis zwischen der Änderung der instantanen Frequenz im Zentrum des Pulses und der spektralen Breite Δ𝜈 an. Beispiele linear gechirpter Pulse und ihrer instantanen Frequenzen sind in Abb. 23.3 gezeigt. Wenn die Phase 𝜑 wie in Abb. 23.1 eine beliebige nichtlineare Funktion der Zeit ist, kann sie näherungsweise durch eine Taylorentwicklung in der Umgebung des Pulszentrums beschrieben werden, und der durch Gl. (23.4) definierte Chirpparameter 𝑎 beschreibt dann den Chirpeffekt niedrigster Ordnung, der sich aus dem quadratischen Term der Entwicklung ergibt.
Gechirpte Pulse
Man bezeichnet einen Puls als gechirpt oder frequenzmoduliert (FM), wenn seine instantane Frequenz sich zeitlich ändert. Wenn 𝜈i im Zentrum des Pulses (𝑡 = 0) 2 eine zunehmende Funktion der Zeit ist, d. h. 𝜑′′ = d 𝜑∕
Zeitlich variierendes Spektrum
Es ist häufig nützlich, die spektralen Änderungen eines zeitlich variierenden Pulses über seinen gesamten zeitlichen Verlauf zu verfolgen. Solche Änderungen sind
805
23 Ultraschnelle Optik
Re{U(t)}
Re{U(t)}
R 400
B ν0
300 200
–20
0
t
instantane Frequenz / THz
t
instantane Frequenz / THz
806
20
B 400
R ν0
300 200
t / fs
–20
0
20
t / fs
(b)
(a) Abb. 23.3 Linear positiv und negativ gechirpte optische Pulse. (a) Ein positiv gechirpter Puls hat eine zunehmende instantane Frequenz. (b) Ein negativ gechirpter Puls hat eine abnehmende instantane Frequenz. In dieser Abbildung ist
die Impulsdauer 20 fs und die Mittenfrequenz 𝜈0 = 300 THz. Die Buchstaben R (rot) und B (blau) stehen allgemein für kleine bzw. große Wellenlängen.
in der Fouriertransformierten nicht mehr zu sehen, da sie nur eine mittlere spektrale Darstellung des ganzen Signals gibt, ohne festzuhalten, welche Frequenzen zu welchen Zeiten auftreten. Das wird besonders dann deutlich, wenn das Signal aus einer Folge von Segmenten besteht, von denen jedes eine unterschiedliche spektrale Zusammensetzung besitzt. Ein gutes Beispiel ist ein Musiksignal, bei dem die spektralen Änderungen den zeitlichen Verlauf der Musik widerspiegeln. Obwohl die instantane Frequenz ein Maß für die Zeitabhängigkeit des Spektrums sein kann, ist es nicht immer geeignet, da sie nur von der Phase abhängt und die Amplitude ignoriert. Ein häufig verwendetes Maß beruht auf einem beweglichen Fenster, das nur ein kurzes Zeitsegment selektiert und die Fouriertransformierte des selektierten Pulsabschnitts liefert. Dieser Prozess wird für unterschiedliche Positionen des Fensters wiederholt, wie in Abb. 23.4 dargestellt. Das Ergebnis wird als Funktion sowohl der Frequenz als auch der Zeitverzögerung aufgetragen. Die resultierende zweidimensionale Funktion wird Kurzzeit-Fouriertransformierte genannt. Ihr Betragsquadrat wird Spektrogramm genannt und häufig als Darstellung mit der Zeit bzw. der Frequenz als horizontale und vertikale Achsen aufgetragen, wie in Abb. 23.4 gezeigt ist. Wenn 𝑊(𝑡) eine Fensterfunktion mit einer kurzen Dauer 𝑇 ist, die bei 𝑡 = 0 beginnt, und 𝑈(𝑡) die Wellenfunktion des Pulses, dann ist das Produkt 𝑈(𝑡)𝑊(𝑡 − 𝜏) ein Segment des Pulses mit der Dauer 𝑇, das zur Zeit 𝜏 beginnt. Die Fouriertransformierte des Segments ist
Die Funktion 𝛷(𝜈, 𝑡) ist die Kurzzeit-Fouriertransformierte, und ihr Betragsquadrat S (𝜈, 𝑡) = |𝛷(𝜈, 𝑡)|2 ist das Spektrogramm.
𝛷(𝜈, 𝜏) = ∫ 𝑈(𝑡)𝑊(𝑡 − 𝜏) exp(−i2π𝜈𝑡) d𝑡 .
(23.5)
U(t)
t τ1
W(t–τ1) U(t)W(t–τ1)
τ2
W(t–τ2) U(t)W(t–τ2) ν/THz
(ν, τ)
150 100 50 0
100
200
300
τ /fs
Abb. 23.4 Die Kurzzeit-Fouriertransformierte von U(t ) wird aus einer Folge von Fouriertransformierten von U(t ) multipliziert mit einem bewegten Fenster W (t − 𝜏) konstruiert. Das Spektrogramm S (𝜈, t ) ist das Betragsquadrat dieser Fouriertransformierten. In diesem Beispiel besteht U(t ) aus zwei Gaußpulsen mit der Zeitkonstante 𝜏 = 60 fs und der Mittenfrequenz 100 THz. Der erste Puls ist positiv gechirpt (a = 5), der zweite ist negativ gechirpt (a = −5) und hat eine kleinere Amplitude. Die Fensterfunktion W (t ) ist eine Gaußfunktion mit der Zeitkonstante 𝜏 = 20 fs.
23.1 Eigenschaften von Pulsen
23.1.2 Gaußpulse und gechirpte Gaußpulse Der transformationsbeschränkte Gaußpuls
Ein transformationsbeschränkter Gaußpuls hat eine komplexe Einhüllende mit konstanter Phase und gaußschem Betrag, 𝒜(𝑡) = 𝐴0 exp(−𝑡2 ∕𝜏2 ) ,
(23.6)
wobei 𝜏 eine reelle Zeitkonstante ist. Die Intensität 𝐼(𝑡)= 𝐼0 exp(−2𝑡2 ∕𝜏2 ) ist ebenfalls eine Gaußfunktion√mit dem Maximalwert 𝐼0 = |𝐴0 |2 , einer 1/e-Breite von 2𝜏 und einer Halbwertsbreite √ 𝜏HWB = 2 ln 2𝜏 = 1.18𝜏 . (23.7) Auch die Fouriertransformierte seiner komplexen Einhüllenden 𝐴(𝜈) ∝ exp(−π2 𝜏2 𝜈2 ) ist eine Gaußfunktion; dasselbe gilt für die spektrale Intensität [ ] S (𝜈) ∝ exp −2π2 𝜏 2 (𝜈 − 𝜈0 )2 .
(23.8)
Die Halbwertsbreite der spektralen Intensität ist Δ𝜈 = 0.375∕𝜏 = 0.44∕𝜏HWB ,
(23.9)
sodass für das Produkt der zeitlichen und spektralen Halbwertsbreiten 𝜏HWB Δ𝜈 = 0.44 gilt. Abbildung 23.5(a) illustriert die zeitlichen und spektralen Eigenschaften eines transformationsbeschränkten Gaußpulses.
Ein transformationsbeschränkter Gaußpuls besitzt wie in Anhang A.2 diskutiert ein minimales Produkt der zeitlichen und spektralen Breite, was der Grund ist, weshalb er transformationsbeschränkt (manchmal auch FT-beschränkt oder bandbreitenbeschränkt) genannt wird. Obwohl der Gaußpuls eine Idealisierung ist, die in der Praxis nicht vorkommt, ist er eine nützliche Näherung für analytische Untersuchungen. Der gechirpte Gaußpuls
Eine allgemeinere Form des Gaußpulses hat die komplexe Einhüllende 𝒜(𝑡) = 𝐴0 exp(−𝛼𝑡2 ), wobei 𝛼 = (1 − i𝑎)∕𝜏2 ein komplexer Parameter und 𝜏 und 𝑎 reelle Parameter sind, sodass 𝒜(𝑡) = 𝐴0 exp(−𝑡2 ∕𝜏2 ) exp(i𝑎𝑡2 ∕𝜏2 ) .
Der Betrag dieser komplexen Einhüllenden ist wieder eine Gaußfunktion |𝐴0 | exp(−𝑡2 ∕𝜏2 ), und auch die Intensität ist eine Gaußfunktion. Die Phase ist eine quadratische Funktion 𝜑 = 𝑎𝑡2 ∕𝜏2 , sodass die instantane Frequenz 𝜈i = 𝜈0 + 𝑎𝑡∕π 𝜏2 eine lineare Funktion der Zeit ist; d. h. der Puls ist linear gechirpt mit dem Chirpparameter 𝑎. Für positive 𝑎 ist der Puls negativ gechirpt, für negative 𝑎 negativ gechirpt und für 𝑎 = 0 transformationsbeschränkt (ungechirpt). Die Fouriertransformierte 𝒜(𝑡) = 𝐴0 exp(−𝛼𝑡2 ) der komplexen Einhüllenden ist proportional zu exp(−π2 𝜏2 𝜈2 ∕𝛼), was ebenfalls eine 3
Re{U(t)} (a) transformationsbegrenzter Puls
I (t)
(c) negativ gechirpter Puls
1.5
(ν)
φ(t)
1
0.75 0.6
λ/µm
ψ (ν)
t
I (t) (b) positiv gechirpter Puls
(23.10)
(ν)
φ(t)
ψ (ν)
t
I (t)
(ν) ψ (ν)
φ(t)
t –10
0
10 t /fs
Abb. 23.5 Zeitliche und spektrale Profile von drei Gaußpulsen mit der Mittenfrequenz 𝜈0 = 300 THz (entsprechend einer Wellenlänge von 1 μ m und einer optischen Periode von 3.3 fs) und der Breite 𝜏HWB = 5 fs (𝜏 = 4.23 fs). (a) Transformationsbeschränkter Puls mit der spektralen Breite Δ𝜈 = 88 THz (Δ𝜆 = 73 nm). (b) Gechirpter Puls mit dem Chirpparameter a√= 2; die spektrale Breite ist um einen Faktor √ 1 + a2 = 5 größer als in (a), sodass Δ𝜈 = 197 THz ist. Die
0
100 200 300 400 500 ν/THz
instantane Frequenz ist eine linear zunehmende Funktion der Zeit mit dem Wert 𝜈0 = 300 THz bei t = 0 (im Zentrum des Pulses) und 𝜈i = 𝜈0 (1 ± ∕π𝜈0 𝜏) = 300(1 ± 0.497) THz bei t = ±𝜏 . Die Frequenz verändert sich zwischen 151 und 449 THz, wenn t von −𝜏 bis +𝜏 variiert. Das entspricht einer Änderung der Wellenlänge zwischen 0.67 und 1.99 μ m. (c) Wie in (b), aber der Puls ist negativ gechirpt mit einem Chirpparameter a = −2.
807
808
23 Ultraschnelle Optik
Gaußfunktion der Frequenz ist. Die spektrale Intensität [ ] S (𝜈) ist proportional zu exp −2π2 𝜏 2 (𝜈 − 𝜈0 )2 ∕(1 + 𝑎2 ) , was wieder eine √Gaußfunktion mit der√Halbwertsbreite Δ𝜈 = (0.375∕𝜏) 1√+ 𝑎2 = (0.44∕𝜏HWB ) 1 + 𝑎2 ist. Sie ist um einen Faktor 1 + 𝑎2 größer als die eines ungechirpten Pulses (𝑎 = 0) mit derselben Zeitkonstante 𝜏. Das Produkt der zeitlichen√und spektralen Halbwertsbreiten ist 𝜏HWB Δ𝜈 = 0.44 1 + 𝑎2 , sodass der ungechirpte Gaußpuls (𝑎 = 0) das kleinste Produkt aus zeitlicher und spektraler Breite besitzt. Die spektrale Phase 𝜓(𝜈) ∝ 𝜈2 ist eine quadratische Funktion der Frequenz. Abbildung 23.5 illustriert die zeitlichen und spektralen Eigenschaften von transformationsbeschränkten und gechirpten Gaußpulsen. Die wichtigsten Gleichungen zur Charakterisierung gechirpter Gaußpulse sind in Tabelle 23.1 zusammengefasst.
23.1.3
Räumliche Eigenschaften
In diesem Abschnitt untersuchen wir einige einfache Beispiele von gepulsten optischen Wellen, die sich im Vakuum oder in einem linearen, homogenen und nichtdispersiven Medium ausbreiten. In solchen Medien gehorcht die Wellenfunktion 𝑈(r, 𝑡) der Wellengleichung ∇2 𝑈 − (1∕𝑐2 )𝜕 2 𝑈∕𝜕𝑡2 = 0. Die einfachsten exakten Lösungen dieser Gleichung sind die gepulste ebene Welle und die gepulste Kugelwelle. Wir werden diese Lösungen besprechen und auch den gepulsten Gaußstrahl einführen. Eine ausführlichere Untersuchung der räumlichen Eigenschaften von gepulstem Licht verschieben wir auf Abschnitt 23.4. Gepulste ebene Wellen
Eine gepulste ebene Welle, die sich in 𝑧-Richtung ausbreitet, hat eine komplexe Wellenfunktion der Form 𝑈(𝑟, 𝑡) = 𝒜(𝑡 − 𝑧∕𝑐) exp[i𝜔0 (𝑡 − 𝑧∕𝑐)] mit einer beliebigen Funktion 𝒜(𝑡). Die entsprechende Intensität ist
Tab. 23.1 Zeitliche und spektrale Eigenschaften eines gechirpten Gaußpulses mit der maximalen Amplitude A0 , der maximalen Intensität I0 = |A0 |2 , der Mittenfrequenz 𝜈0 , der Zeitkonstante 𝜏 und dem Chirpparameter a. Beziehung
Gleichung
Eigenschaft
𝒜(𝑡) = 𝐴0 exp[−(1 − i𝑎)𝑡 2 ∕𝜏 2 ]
(23.11)
komplexe Einhüllende
𝐼(𝑡) = 𝐼0 exp(−2𝑡 2 ∕𝜏 2 )
(23.12)
Intensität
(23.13)
Energiedichte
(23.14)
halbe spektrale 1∕e-Breite
𝜏HWB = 1.18𝜏
(23.15)
Halbwertsbreite
𝜑(𝑡) = 𝑎𝑡 2 ∕𝜏 2
(23.16)
Phase
𝐴0 𝜏 π2 𝜏 2 𝜈2 𝐴(𝜈) = √ exp [− ] 1 − i𝑎 2 π(1 − i𝑎)
(23.17)
Fouriertransformierte
S (𝜈) =
(23.18)
spektrale Intensität
Δ𝜈1∕e
(23.19)
halbe 1∕e-Breite
(23.20)
spektrale Halbwertsbreite
𝜓(𝜈) = −2π2 𝜏 2 [𝑎∕(1 + 𝑎 2 )]𝜈2
(23.21)
spektrale Phase
𝜈i = 𝜈0 + (𝑎∕π 𝜏 2 )𝑡
(23.22)
instantane Frequenz
∫ 𝐼(𝑡) d𝑡 = 𝜏1∕e =
Δ𝜈 =
√
√ π∕2𝐼0 𝜏
2𝜏
𝐼0 𝜏 2 2π2 𝜏 2 (𝜈 − 𝜈0 )2 exp [− ] √ 1 + 𝑎2 4π 1 + 𝑎 2 2√ = 1 + 𝑎2 𝜏
0.375 √ 0.44 √ 1 + 𝑎2 = 1 + 𝑎2 𝜏 𝜏HWB
23.1 Eigenschaften von Pulsen
it t
gemessen werden, indem man das räumliche Profil einer Momentaufnahme des Pulses beobachtet. Das kann für die Detektion von Pulsen ausgenutzt werden, wie wir in Abschnitt 23.5.2 sehen werden.
cτ
Ze
Δt
z
cΔt
Gepulste Kugelwellen
Eine andere einfache Lösung der Wellengleichung ist die gepulste Kugelwelle 𝑈(𝑟, 𝑡) = (1∕𝑟)𝑔(𝑡 − 𝑟∕𝑐) exp[i𝜔0 (𝑡 − 𝑟∕𝑐)] mit einer beliebigen Funktion 𝑔(𝑡). Dieser Puls breitet sich radial aus, und seine Wellenfronten sind konzentrische Kugeln, wie in Abb. 23.7(b) dargestellt. Zu einem beliebigen Zeitpunkt nimmt der Puls eine Kugelschale der radialen Breite 𝑐𝜏 ein, wobei 𝜏 die Breite von 𝑔(𝑡) ist.
Abb. 23.6 Die Einhüllende eines Pulses aus einer ebenen Welle der Breite 𝜏 , die sich mit der Geschwindigkeit c in z-Richtung ausbreitet. Der Puls besitzt zu jedem Zeitpunkt eine Breite c𝜏 .
𝐼(𝑡 − 𝑧∕𝑐) mit 𝐼(𝑡) = |𝒜(𝑡)|2 . Wenn die Breite von 𝐼(𝑡) gleich 𝜏 ist, dann besitzt der sich ausbreitende Puls zu jeder Zeit eine Ausdehnung Δ𝑧 = 𝑐𝜏 und breitet sich ohne Veränderung mit einer Geschwindigkeit 𝑐 aus, wie Abb. 23.6 zeigt. Einige Zahlenwerte der zeitlichen und räumlichen Ausdehnung des Pulses im Vakuum sind: zeitliche Breite 𝜏 räumliche Breite 𝑐𝜏
1 ns 30 cm
1 ps 0.3 mm
1 fs 0.3 μm
Durch einen langsam variierenden Puls modulierte paraxiale Wellen
Wenn sich die Einhüllende einer gepulsten Welle langsam mit der Zeit ändert, sodass sie innerhalb einer optischen Periode näherungsweise konstant ist, spricht man von einer langsam variierenden Einhüllenden. Wegen der zugehörigen schmalen spektralen Breite Δ𝜈 ≪ 𝜈0 ist das räumliche Verhalten einer solchen Welle näherungsweise gleich dem einer monochromatischen (kontinuierlichen) Welle bei der Mittenfrequenz 𝜈0 oder der Wellenlänge 𝜆0 = 𝑐∕𝜈0 . Die Welle kann daher als quasikontinuierliche gepulste Welle betrachtet werden. Wenn die Welle außerdem paraxial ist (siehe Abschnitt 2.2.3), kann sie in der allgemeinen Form 𝑈(𝑟, 𝑡) = 𝒜(r, 𝑡) exp(−i𝑘0 𝑧) exp(i𝜔0 𝑡) durch ihre Einhüllende ausgedrückt werden, wobei sich die Einhüllende langsam mit 𝑧 ändert, sodass sie auf Entfernungen von ungefähr einer Wellenlänge 𝜆0 = 2π∕𝑘0 näherungsweise konstant ist; d. h. sie erfüllt die Bedingung 𝜕 2 𝒜∕𝜕𝑧2 ≪ 𝑘02 𝒜. Da sich die Einhüllende auch zeitlich langsam ändert, ist auch die Näherung 𝜕 2 𝒜∕𝜕𝑡2 ≪ 𝜔02 𝒜 anwendbar. Unter diesen Bedingungen führt die Wellengleichung ∇2 𝑈 − (1∕𝑐2 )𝜕 2 𝑈∕𝜕𝑡2 = 0 zu einer Näherungsgleichung
1 as 0.3 nm
Eine gepulste ebene Welle, die sich in einem Winkel 𝜃 zur 𝑧-Achse ausbreitet, hat eine komplexe Wellenfunktion 𝑈(𝑟, 𝑡) = 𝒜[𝑡 − (𝑥 sin 𝜃 + 𝑧 cos 𝜃)∕𝑐] exp[−i𝑘0 (𝑥 sin 𝜃 + 𝑧 cos 𝜃)] exp(i𝜔0 𝑡) und eine zugehörige Intensität 𝐼[𝑡 − (𝑥 sin 𝜃 + 𝑧 cos 𝜃)∕𝑐], wobei 𝐼(𝑡) = |𝒜(𝑡)|2 ist. Wenn diese Intensität in einer Folge von Momentaufnahmen als Funktion von 𝑥 und 𝑧 registriert wird (jede zu einem festen Zeitpunkt), dann sieht das Ergebnis aus wie in Abb. 23.7(a). Der helle Streifen in jeder Momentaufnahme bezeichnet den sich ausbreitenden Puls zum jeweiligen Zeitpunkt. Beispielsweise erscheint ein 100-fs-Puls im Vakuum als Streifen der Breite 30 μm. Eine einzelne vertikale Linie (𝑧 konstant), die den Streifens in einer Momentaufnahme (𝑡 konstant) schneidet, enthält eine vollständige Aufzeichnung des zeitlichen Profil des Pulses, da sie die Funktion 𝐼(−𝑥 sin 𝜃∕𝑐 + Konstante) registriert. Das zeitliche Profil kann daher x
x
Zeit
(a) Ebene Welle
z
x
Zeit
(b) Kugelwelle
Abb. 23.7 (a) Vier Momentaufnahmen (in gleichen Zeitabständen) einer gepulsten ebenen Welle. Jede Momentaufnahme enthält eine einzelne Linie der Breite c𝜏 (in z-Richtung), wobei 𝜏 die Breite des Impulses ist. Die Linien be-
z
Zeit
(c) Gaußstrahl
z
wegen sich während der Ausbreitung der gepulsten Welle von links nach rechts. (b) Wie (a), aber für eine Kugelwelle. (c) Wie (a), aber für einen Gaußstrahl.
809
810
23 Ultraschnelle Optik
für die Einhüllende, 4π 𝜕𝒜 1 𝜕𝒜 ∇2t 𝒜 − i ( + ) = 0, 𝑐 𝜕𝑡 𝜆0 𝜕𝑧
23.2 Pulsformung und Kompression (23.23)
wobei ∇2t = 𝜕 2 ∕𝜕𝑥2 + 𝜕 2 ∕𝜕𝑦 2 der transversale Laplaceoperator ist. Gleichung (23.23) ist als Gleichung der paraxialen langsam variierenden Einhüllenden bekannt. Für eine kontinuierliche Welle ist 𝜕𝒜∕𝜕𝑡 = 0 und Gl. (23.23) reduziert sich auf die paraxiale Helmholtzgleichung (2.27). Wie durch direktes Einsetzen geprüft werden kann, erfüllt der Ansatz 𝒜(𝜌, 𝑧, 𝑡) = 𝑔(𝑡 − 𝑧∕𝑐)𝒜0 (r) Gl. (23.23), wenn 𝑔 eine beliebige Funktion der Zeitverzögerung 𝑡 − 𝑧∕𝑐 ist und 𝒜0 (r) die paraxiale Helmholtzgleichung ∇2t 𝒜0 − i(4π∕𝜆0 )𝜕𝒜0 ∕𝜕𝑧 = 0 erfüllt, die im kontinuierlichen Fall gilt. Daraus folgt, dass eine paraxiale Welle mit der Wellenlänge 𝜆0 in dieser Näherung mit einem langsam variierenden Puls beliebiger Form moduliert werden kann, ohne ihr räumliches Verhalten zu ändern.
Beim Durchgang durch ein dispersives optisches System verändert sich das zeitliche Profil eines kurzen optischen Pulses zwangsläufig. Der Grund dafür ist, dass die spektralen Komponenten, aus denen sich der Puls zusammensetzt, unterschiedlich gedämpft werden bzw. unterschiedliche Phasenverschiebungen erfahren. Die Wirkung der Dispersion ist für ultrakurze Pulse ausgeprägter, da sie größere spektrale Breiten haben. Dispersive optische Elemente können auch gezielt so entworfen werden, dass sie bestimmte Änderungen der Pulsform hervorrufen, z. B. eine Kompression oder Dehnung. In diesem Abschnitt betrachten wir nur zeitliche Effekte in linearen dispersiven Medien, d. h. wir untersuchen nur gepulste ebene Wellen; Abschnitt 23.4 befasst sich mit räumlichen Effekten in linearen optischen Medien wie z. B. Beugung und Ausbreitung in dispersiven Medien. Die Dispersion in nichtlinearen Systemen wird in Abschnitt 23.5 untersucht.
Gepulste Gaußstrahlen
Eine der Lösungen der paraxialen Helmholtzgleichung ist der durch Gl. (3.5) beschriebene Gaußstrahl. Im gepulsten quasikontinuierlichen Fall ist der Gaußstrahl durch 𝒜(𝜌, 𝑧, 𝑡) = 𝑔(𝑡 − 𝑧∕𝑐)
i𝑧0 π 𝜌2 exp (−i ) 𝑧 + i𝑧0 𝜆0 𝑧 + i𝑧0 (23.24)
gegeben, wobei 𝑔(𝑡) eine beliebige langsam variierende Funktion der Zeitverzögerung 𝑡 − 𝑧∕𝑐 ist und 𝑧0 die Rayleighlänge (auch Beugungslänge genannt). In dieser Näherung gibt es außer der Verzögerung keine Kopplung zwischen Raum und Zeit, d. h. der Strahl behält zu allen Zeiten sein gaußsches räumliches Profil, und der Puls behält an allen Orten sein anfängliches zeitliches Profil. Momentaufnahmen eines solchen Strahls sind in Abb. 23.7(c) gezeigt. In Abschnitt 23.4 werden wir sehen, dass für ultraschmale Pulse, für die die Näherung der langsam variierenden Einhüllenden nicht gilt, die Kopplung zwischen Raum und Zeit wichtig werden kann und dass eine Welle, die in einer transversalen Ebene ein zeitliches und räumliches Gaußprofil besitzt, bei der Ausbreitung im Vakuum zeitlich und räumlich nichtgaußsch werden kann.
23.2.1
Chirpfilter
Lineare Filterung eines optischen Pulses
Der Durchgang eines optischen Pulses durch ein beliebiges lineares optisches System wird allgemein durch die Theorie linearer Systeme beschrieben (siehe Anhang B). Ein lineares zeitinvariantes System wird durch eine Übertragungsfunktion H(𝜈) charakterisiert, die der Faktor ist, mit dem die Fourierkomponente des Eingangspulses bei der Frequenz 𝜈 multipliziert wird, um die Ausgangskomponente bei derselben Frequenz zu erzeugen. Wenn 𝑈1 (𝑡) und 𝑈2 (𝑡) die komplexen Wellenfunktionen des Originals bzw. des gefilterten Pulses sind, dann ist der Zusammenhang zwischen ihren Fouriertransformierten 𝑉1 (𝜈) und 𝑉2 (𝜈) 𝑉2 (𝜈) = H(𝜈) 𝑉1 (𝜈) .
(23.25)
Um Gl. (23.25) verwenden zu können, müssen wir nur H(𝜈) bei Frequenzen innerhalb des spektralen Bands des Pulses kennen, das ein Gebiet der Breite Δ𝜈 um die Mittenfrequenz 𝜈0 ist, wie in Abb. 23.8 dargestellt. Für Δ𝜈 ≪ 𝜈0 es zweckmäßig, mit der komplexen Einhüllende anstatt der Wellenfunktion zu arbeiten. Mit der Beziehung 𝑈(𝑡) = 𝒜(𝑡) exp(i2π𝜈0 𝑡) und der Verschiebungseigenschaft der Fouriertransformation, 𝑉(𝜈) = 𝐴(𝜈 − 𝜈0 ), wobei 𝐴(𝜈) die Fouriertransformierte von 𝒜(𝑡) ist, folgt aus Gl. (23.25) 𝐴2 (𝜈 − 𝜈0 ) = 𝐻(𝜈)𝐴1 (𝜈 − 𝜈0 ), wobei die Indizes 1 und 2 den Ein- bzw. Ausgangspuls bezeichnen. Mit der Definition 𝑓 = 𝜈 − 𝜈0 für die Frequenzdifferenz erhalten wir 𝐴2 (𝑓) = H(𝜈0 + 𝑓)𝐴1 (𝑓) oder 𝐴2 (𝑓) = HE (𝑓)𝐴1 (𝑓) ,
(23.26)
23.2 Pulsformung und Kompression
Ψ (ν) | (ν)|
t 0
Eingang: komplexe Wellenfunktion U1(t)
Eingang: komplexe Einhüllende 1(t)
ν0
t
ν
Filter (ν)
Ausgang: komplexe Wellenfunktion U2(t)
Abb. 23.8 Eine Filterung der Wellenfunktion mit einem Filter H (𝜈) (obere Abbildung) ist äquivalent zur Filterung der Einhüllenden mit einem Filter H E (f ) = H(𝜈0 + f ) (untere Abbildung). Die schattierte Fläche bezeichnet das interessierende spektrale Band.
ΨE(f )
t
|
E(f ) |
f
0 Einhüllendenfilter
Ausgang: komplexe Einhüllende 2 (t)
E(f ) = (ν0 + f )
wobei HE (𝑓) = H(𝜈0 + 𝑓)
(23.27)
die Übertragungsfunktion der Einhüllenden ist. Es ist praktischer, mit Gl. (23.26) zu arbeiten als mit Gl. (23.25), da die Frequenz 𝑓 normalerweise viel kleiner ist als 𝜈. Diese Beziehungen sind in Abb. 23.8 illustriert. Die Übertragungsfunktionen H(𝜈) und HE (𝑓) sind komplexe Funktionen, H(𝜈) = |H(𝜈)| − exp[−i𝛹(𝜈)] und HE (𝑓) = |HE (𝑓)| exp[−i𝛹E (𝑓)], wobei 𝛹E (𝑓) = 𝛹(𝜈0 + 𝑓) reelle Funktionen sind, die die Phasenübertragung beschreiben. Die durch das Filter eingeführte Phase spielt bei der Umformung von Pulsen häufig eine wichtigere Rolle als der Betrag. Überall in diesem Kapitel werden wir uns mit Phasenfiltern befassen, d. h. Filtern, für die der Betrag |H(𝜈)| innerhalb des interessierenden Frequenzbereichs näherungsweise konstant ist. Im Zeitbereich wird aus Gl. (23.26) die Faltungsbeziehung ∞
𝒜2 (𝑡) = ∫ ℎE (𝑡 − 𝑡′ ) 𝒜1 (𝑡′ ) d𝑡′ ,
(23.28)
−∞
Frequenz, 𝛹E (𝑓) = 𝛹0 + 2π𝜏V 𝑓 mit einer konstanten Phase 𝛹0 = arg{H0 } [siehe Abb. 23.9(a)]. Nach einer fundamentalen Eigenschaft der Fouriertransformation (siehe Anhang A) ist die Phase 2π 𝜏V 𝑓 äquivalent zu einer Zeitverzögerung 𝜏V . Die Einhüllenden des Ein- und Ausgangs hängen gemäß 𝒜2 (𝑡) = H0 𝒜1 (𝑡 − 𝜏V ) zusammen und die Intensitäten durch 𝐼2 (𝑡) = 𝐺𝐼1 (𝑡 − 𝜏V ). Für einen verteilten Abschwächer/Verstärker mit dem Dämpfungs-/Gewinnkoeffizienten 𝛼, der Geschwindigkeit 𝑐 und der Länge d ist die Übertragungsfunktion HE (𝑓) = exp(−𝛼d ∕2) exp(−i2π𝑓 d ∕𝑐), sodass 𝐺 = exp(−𝛼d ) und 𝜏d = d ∕𝑐 ist. Ein Beispiel für ein solches Filter ist eine Platte aus einem idealen nichtdispersiven Material mit dem Dämpfungskoeffizienten 𝛼 und dem Brechungsindex 𝑛, wobei 𝑐 = 𝑐0 ∕𝑛 ist. Seine Übertragungsfunktion ist h(𝜈) = exp(−𝛼d ∕2) exp(−i𝛽 d ), wobei 𝛽 = 2π𝜈∕𝑐 die Ausbreitungskonstante ist (siehe Abschnitt 5.5.1) und hE (𝑓) = exp(−𝛼d ∕2) exp(−i2π𝑓 d ∕𝑐). Wenn 𝛼 und 𝑛 frequenzabhängig sind, d. h. das Medium dispersiv ist, ist das Filter nicht ideal, und die Pulsform kann beim Durchgang signifikant verändert werden, wie wir in Abschnitt 23.3 sehen werden. Das Chirpfilter
wobei ℎE (𝑡) die inverse Fouriertransformierte von HE (𝑓) ist. Das ideale Filter
Ein ideales Filter bewahrt die Form der Einhüllenden des Eingabepulses; es multipliziert ihn nur mit einer Konstanten (mit einem Betrag < 1 für einen Abschwächer und > 1 für einen Verstärker) und verzögert ihn eventuell um eine feste Zeit. Die Übertragungsfunktion hat die Form HE (𝑓) = H0 exp(−i2π𝑓𝜏V ) ,
t
(23.29)
wobei H0 eine Konstante ist, 𝐺 = |H0 |2 die Intensitätsabnahme bzw. der Gewinnfaktor und 𝜏V die Zeitverzögerung. Die Phase ist eine lineare Funktion der
Vielleicht das wichtigste Filter in der ultraschnellen Optik ist das gaußsche Chirpfilter, das häufig auch einfach als Chirpfilter bezeichnet wird. Es ist ein Phasenfilter, dessen Phase eine quadratische Funktion der Frequenz ist, 𝛹E (𝑓) = 𝑏π2 𝑓 2 [siehe Abb. 23.9(b)], sodass die Übertragungsfunktion der Einhüllenden eine Gaußfunktion ist, HE (𝑓) = exp(−i𝑏π2 𝑓 2 ) ,
(23.30)
wobei der Chirpkoeffizient 𝑏 des Filters (mit der Einheit s2 ) ein reeller Parameter ist. Für 𝑏 > 0 nennt man das Filter ein positiv chirpendes Filter und für 𝑏 < 0 ein negativ chirpendes Filter. Die zugehörige Impulsantwortfunktion ist die inverse Fouriertransformierte von Gl. (23.30) (siehe Tabel-
811
812
23 Ultraschnelle Optik
ΨE (f )
ΨE (f ) | E (f )|
f
0
0
(a)
f
(b)
le A.1), die eine weitere Gaußfunktion ist, ℎE (𝑡) = √
Abb. 23.9 Betrag und Phase der Übertragungsfunktionen der Einhüllenden (a) eines idealen Filters und (b) eines Chirpfilters (mit b > 0).
| E (f )|
1 iπ 𝑏
exp(i𝑡2 ∕𝑏) .
(23.31)
Auch ihre Phase ist eine quadratische Funktion der Zeit, d. h. sie ist eine linear gechirpte Funktion, die für 𝑏 > 0 positiv für 𝑏 < 0 negativ gechirpt ist. Eine Kaskade aus zwei Chirpfiltern mit den Koeffizienten 𝑏1 und 𝑏2 ist äquivalent zu einem einzigen Chirpfilter mit dem Koeffizienten 𝑏 = 𝑏1 + 𝑏2 , da die Übertragungsfunktionen multipliziert werden. So kann ein negativ chirpendes Filter die Wirkung eines positiv chirpenden Filters kompensieren; die Wirkung eines Chirpfilters ist demzufolge reversibel. Durch Einsetzen von Gl. (23.31) in Gl. (23.28) erhalten wir für den Zusammenhang der Einhüllenden am Ausbzw. Eingang eines Chirpfilters ∞
1
∫ 𝒜1 (𝑡′ ) exp [i 𝒜2 (𝑡) = √ iπ𝑏 −∞
(𝑡 − 𝑡′ )2 ] d𝑡′ . (23.32) 𝑏
Diese Transformation ähnelt mathematisch der Fresnelbeugung [siehe Gl. (4.45) in Abschnitt 4.3.2] und für einen hinreichend großen Chirpkoeffizienten 𝑏 der Fraunhoferbeugung, d. h. sie ist äquivalent zu einer Fouriertransformation (siehe Abschnitt 4.3.1). Die Analogie zwischen der räumlichen Beugung und der zeitlichen Dispersion, die durch ein Chirpfilter beschrieben wird, wird in Abschnitt 23.3.4 formell begründet. Chirpfilter als Approximation eines beliebigen Phasenfilters
Wenn Betrag und Phase des Filters innerhalb der schmalen spektralen Breite eines Pulses langsam variieren, können wir annehmen, dass der Betrag näherungsweise ΨE (f ) | E (f )| 0 beliebiges Filter
≈
konstant und gleich seinem Wert |H(𝜈0 + 𝑓)| ≈ |H(𝜈0 )| ≡ |H0 | bei der Mittenfrequenz ist, und können die Phasenfunktion 𝛹(𝜈) in eine Taylorreihe um die Frequenz 𝜈0 entwickeln. Wenn wir nur die ersten drei Terme mitneh1 men, 𝛹(𝜈0 + 𝑓) ≈ 𝛹0 + 𝛹 ′ 𝑓 + 𝛹 ′′ 𝑓 2 [mit 𝛹0 = 𝛹(𝜈0 ), 2
2
𝛹 ′ = d𝛹∕ d𝜈|𝜈0 und 𝛹 ′′ = d 𝛹∕ d𝜈2 |𝜈0 ], erhalten wir 1
H(𝜈0 + 𝑓) ≈ |H0 | exp[−i(𝛹0 + 𝛹 ′ 𝑓 + 𝛹 ′′ 𝑓 2 )]. 2
Damit folgt aus Gl. (23.27), dass die Übertragungsfunktion der Einhüllenden näherungsweise als [ ] 1 HE (𝑓) ≈ |H0 | exp −i(𝛹0 + 𝛹 ′ 𝑓 + 𝛹 ′′ 𝑓 2 ) (23.33) 2
geschrieben werden kann. Dieses Filter ist äquivalent zu einer Kaskade eines idealen Filters und eines Chirpfilters (siehe Abb. 23.10). Das ideale Filter besteht aus einem konstanten Multiplikator H0 = |H0 | exp(−i𝛹0 ), der die Form des Pulses nicht verändert und ignoriert werden kann, und einer Phasenverschiebung exp(−i2π 𝜏V 𝑓) entsprechend einer Zeitverzögerung 𝜏V = 𝛹 ′ ∕2π .
Das Chirpfilter besitzt eine Übertragungsfunktion exp(−i𝑏π2 𝑓 2 ) mit dem Chirpkoeffizienten 𝛹 ′′ . 2π2
𝑏=
(23.35)
Demzufolge wird die Hauptquelle der Verzerrung in einem dispersiven System mit langsam variierender Phase durch ein Chirpfilter beschrieben. Beispiele solcher Systeme auf der Grundlage von Winkeldispersion und Bragggittern werden später vorgestellt. Dispersive Medien werden ebenfalls durch Chirpfilter beschrieben, wie wir in Abschnitt 23.3 sehen werden. Eine genauere Näherung für ein Phasenfilter würde die Berücksichtigung zusätzlicher Terme in der Taylorentwicklung der
1 0
f
0
f
f ideales Filter
(23.34)
Chirpfilter
Abb. 23.10 Approximation eines beliebigen Filters mit einer langsam variierenden Übertragungsfunktion durch eine Kaskade aus einem idealen Filter (einschließlich einer Zeitverzögerung) und einem Chirpfilter.
23.2 Pulsformung und Kompression
Phase erfordern. Der Term dritter Ordnung entspricht 1 einem Phasenfilter exp(−i 𝛹 ′′′ 𝑓 3 ); Terme höherer Ord6 nung können entsprechend definiert werden. Chirpfilterung eines transformationsbeschränkten Gaußpulses
Wir betrachten jetzt die Wirkung eines Chirpfilters mit einer Übertragungsfunktion HE (𝑓) = − exp(−i𝑏π2 𝑓 2 ) und dem Chirpkoeffizienten 𝑏 auf einen ungechirpten (transformationsbeschränkten) Gaußpuls mit der komplexen Einhüllenden 𝒜1 (𝑡) = 𝐴10 exp(−𝑡2 ∕𝜏12 ). Da die Fouriertransformierte von 𝒜1 (𝑡) durch 𝐴1 (𝑓) = √ (𝐴10 𝜏1 ∕2 π) exp(−π2 𝜏12 𝑓 2 ) gegeben ist, besitzt der gefilterte Puls wegen Gl. (23.26) eine komplexe Einhüllende mit der Fouriertransformierten 𝜏 𝐴2 (𝑓) = 𝐴10 √1 exp[−π2 (𝜏12 + i𝑏)𝑓 2 ] . 2 π
(23.36)
Dieser Ausdruck kann als Fouriertransformierte eines gechirpten Gaußpulses mit der Breite 𝜏2 und dem Chirpparameter 𝑎2 geschrieben werden, dessen Fouriertransformierte gemäß Gl. (23.18) die Form π2 𝜏22 𝑓 2 𝜏 𝐴2 (𝑓) = 𝐴20 √ 2 exp (− ) 1 − i𝑎2 2 π(1 − i𝑎2 )
(23.37)
hat. Gleichsetzen der Exponenten in den Gln. (23.36) und (23.37) liefert 𝜏12 + i𝑏 =
𝜏22 1 − i𝑎2
,
(23.38)
und√ Gleichsetzen der Amplituden ergibt 𝐴20 = 𝐴10 1 − i𝑎2 𝜏1 ∕𝜏2 . Gleichsetzen der Real- und Imaginärteile von Gl. (23.38) führt zu folgenden Beziehungen zwischen den Parametern des Ausgangs- und denen des Eingangspulses: √ Breite 𝜏2 = 𝜏1 1 + 𝑏2 ∕𝜏14 , (23.39) Chirpparameter 𝑎2 = 𝑏∕𝜏12 , 𝐴10 . Amplitude 𝐴20 = √ 1 + i𝑏∕𝜏12
(23.40) (23.41)
Ein ungechirpter Gaußpuls bleibt beim Durchgang durch ein Chirpfilter demnach gaußsch und seine Eigenschaften ändern sich wie folgt: • Die √ vergrößert sich um einen Faktor √ Pulsdauer 2 1 + 𝑎√2 = 1 + 𝑏2 ∕𝜏14 . Für |𝑏| = 𝜏12 ist dieser Faktor gleich 2. Das Filter hat demzufolge eine merkliche Wirkung, wenn sein Chirpkoeffizient in der Größenordnung der quadrierten Breite des Originalpulses
liegt. Für |𝑏| ≫ 𝜏12 , d. h. für große Chirpkoeffizienten oder schmale Originalpulse, ist 𝜏2 ≈ |𝑏|∕𝜏1 , sodass die Breite des gefilterten Pulses direkt proportional zu |𝑏| und umgekehrt proportional zu 𝜏1 ist; schmalere Pulse erfahren folglich eine größere Verbreiterung. • Der zu Beginn transformationsbeschränkte Puls wird gechirpt mit einem Chirpparameter 𝑎2 , der direkt proportional zu dem Chirpkoeffizienten 𝑏 des Filters und umgekehrt proportional zum Quadrat der Dauer des Originalpulses ist. Für 𝑏 > 0 wird der gefilterte Puls positiv gechirpt, und für 𝑏 < 0 wird er negativ gechirpt. Für 𝑏 = 𝜏12 ist der Chirpparameter 𝑎2 = 1. • Die spektrale Breite des Pulses bleibt unverändert. Der Originalpuls besitzt eine spektrale Breite Δ𝜈 = 0.375∕𝜏1 , und der gefilterte √ Puls eine identische spektrale Breite (0.375∕𝜏2 ) 1 + 𝑎22 = 0.375∕𝜏1 = Δ𝜈. Das ist nicht überraschend, da das Chirpfilter ein Phasenfilter ist, das die spektrale Intensität des Originalpulses nicht verändert. Die Invarianz der spektralen Breite kann auch wie folgt erklärt werden: √ Die zeitliche
Breite des Pulses wird um einen Faktor 1 + 𝑎22 vergrößert, sodass die zugehörige spektrale Breite um denselben Faktor reduziert werden muss. Weil der gefilterte Puls gechirpt wird, erfährt er jedoch gleichzeitig eine spektrale Verbreiterung um denselben Faktor, wodurch die spektrale Breite unverändert bleibt. Die Abhängigkeit des Verhältnisses 𝜏2 ∕𝜏1 und des Chirpparameters 𝑎2 von dem Verhältnis 𝑏∕𝜏12 ist in Abb. 23.11 illustriert. Chirpfilterung eines gechirpten Gaußpulses
Wenn ein gechirpter Gaußpuls durch ein Chirpfilter transmittiert wird, ist das Resultat wieder ein gechirpter Gaußpuls, aber mit veränderten Parametern. Der Puls wird entweder gedehnt oder komprimiert, und sein Chirpparameter wird verändert und unter Umständen bis auf null reduziert, sodass der neue Puls ungechirpt (transformationsbeschränkt) sein kann. Diese Kompression eröffnet einen Weg zur Erzeugung von optischen Piko- und Femtosekundenpulsen, wie wir in den anschließenden Abschnitten zeigen werden. Wenn der Originalpuls die Breite 𝜏1 , den Chirpparameter 𝑎1 und die komplexe Einhüllende 𝒜1 (𝑡) = 𝐴10 exp[−(1 − i𝑎1 )𝑡2 ∕𝜏12 ] besitzt, erzeugt die Filterung mit einem Chirpfilter HE (𝑓) = exp(−i𝑏π2 𝑓 2 ) einen gechirpten Gaußpuls 𝒜2 (𝑡) = 𝐴20 exp[−(1 − i𝑎2 )𝑡2 ∕𝜏22 ] mit 𝜏22 1 − i𝑎2
=
𝜏12 1 − i𝑎1
+ i𝑏 .
(23.42)
Gleichsetzen der Real- und Imaginärteile von Gl. (23.42) führt zu den folgenden Ausdrücken für die Breite
813
23 Ultraschnelle Optik
τ2/τ1 τ2
τ1
a2
Abb. 23.11 Ein Chirpfilter mit dem Koeffizienten b wandelt einen ungechirpten Gaußpuls der Breite 𝜏1 (offener Kreis) in einen gechirpten Gaußpuls mit der Breite 𝜏2 und dem Chirpparameter a2 um. Die Impulsbreite nimmt mit steigendem |b| zu und ist für kleinere 𝜏1 größer. Der Chirpparameter ist direkt proportional zu b und ist für kleinere 𝜏1 größer.
2
t
t
τ2=b/τ1
1 0 a2
negativ positiv gechirpt gechirpt
814
Chirpfilter b
2 0 –2 –2
–1
0
1
𝜏2 und den Chirpparameter 𝑎2 : √ 𝜏2 = 𝜏1
1 + 2𝑎1
Chirpkoeffizient 𝑏min = −𝑎1 𝜏02 = −
2 𝑏 2 𝑏 + (1 + 𝑎 ) , 1 𝜏12 𝜏14
𝑎2 = 𝑎1 + (1 + 𝑎12 )
(23.44)
Die Abhängigkeit des Verhältnisses 𝜏2 ∕𝜏1 und des Chirpparameters 𝑎2 von dem Verhältnis 𝑏∕𝜏12 ist in Abb 23.12 gezeigt. Um den Wert 𝑏min des Chirpkoeffizienten des Filters zu bestimmen, bei dem der gefilterte Puls seine minimale Breite 𝜏0 besitzt, setzen wir die Ableitung von 𝜏2 in Gl. (23.43) nach 𝑏 null. Das Ergebnis ist 𝜏1
,
(23.45)
1 + 𝑎12
τ2 /τ0
a2
𝑎1 1 + 𝑎12
𝜏12 . (23.46)
(23.43)
𝑏 . 𝜏12
minimale Breite 𝜏0 = √
b/τ12
2
Mithilfe der Gln. (23.45) und (23.46) können wir die Gln. (23.43) und (23.44) wie folgt durch 𝑏min und 𝜏0 ausdrücken: √ 2 minimale Breite 𝜏2 = 𝜏0 1 + (𝑏 − 𝑏min )∕𝜏04 , (23.47) Chirpparameter 𝑎2 = (𝑏 −
𝑏min )∕𝜏02
.
(23.48)
Für 𝑏 = 𝑏min liefern die Gln. (23.47) und (23.48) 𝜏2 = 𝜏0 und 𝑎2 = 0, sodass der Puls sowohl maximal komprimiert als auch entchirpt wird. Wenn der Originalpuls positiv gechirpt ist (𝑎1 > 0), ist nach Gl. (23.46) 𝑏min < 0, sodass für maximale Kompression ein negativ chirpendes Filter erforderlich ist. Wenn der Originalpuls unge-
τ2 /τ0
2
2
1
1
0
0
2
a2
2 0
0
–2
–2 –2
–1
0 (a)
1
2
b/ τ02
–2
Abb. 23.12 Filterung eines Gaußpulses mit der Breite 𝜏1 und dem Chirpparameter a1 durch ein Chirpfilter mit dem Koeffizienten b, der in den schattierten (nicht schattierten) Flächen negativ (positiv) ist. Zwei Werte des Chirpparameters des Originalpulses sind gezeigt: (a) a1 = −1 und (b) a1 = 1. Der gefilterte Puls hat die Breite 𝜏2 und den Chirpparameter a2 . Die Parameter des Originalpulses (b = 0)
–1
0 (b)
1
2
b/ τ02
sind durch offene Kreise gekennzeichnet. √ Alle Pulsdauern
sind auf die minimale Pulsdauer 𝜏0 = 𝜏1 ∕ 1 + a21 normiert. Die oberen Darstellungen zeigen die Abhängigkeit der normierten Pulsdauer von dem Verhältnis b∕𝜏02 . Die unteren Darstellungen zeigen die Abhängigkeit des Chirpparameters a2 von b∕𝜏02 .
23.2 Pulsformung und Kompression
chirpt ist (𝑎1 = 0), kann er durch ein Chirpfilter nicht weiter komprimiert werden, da er bereits seine minimale Breite (𝑏min = 0 und 𝜏0 = 𝜏1 ) besitzt. Die Gln. (23.47) und (23.48) sind identisch mit den Gln. (23.39) und (23.40) für anfänglich ungechirpte Pulse, nur dass 𝑏 durch 𝑏 − 𝑏min ersetzt ist. Daher gelten die Kurven in Abb. 23.11 auch für gechirpte Originalpulse, nur dass der aus Gl. (23.46) berechnete Wert für 𝑏min horizontal verschoben ist. Beispiel 23-1: Kompression und Dehnung eines gechirpten Pulses durch ein Chirpfilter
(a) Ein Gaußpuls mit der Breite 𝜏1 und einem negativen Chirpparameter 𝑎1 = −1 wird durch ein Chirpfilter mit dem Koeffizienten 𝑏 gefiltert. Der gefilterte Puls ist wieder eine Gaußfunktion mit der Breite 𝜏2 und dem Chirpparameter 𝑎2 . In diesem Fall wird der gefilterte Puls maximal komprimiert und 1 entchirpt, wenn 𝑏 = 𝑏min = 𝜏12 ist und der Kompri2√ √ mierungsfaktor 1 + 𝑎12 = 2 beträgt, sodass die √ komprimierte Pulsdauer 𝜏0 = 𝜏1 ∕ 2 ist. Die normierte Pulsdauer 𝜏2 ∕𝜏0 ist in Abb. 23.12(a) gegen das Verhältnis 𝑏∕𝜏02 aufgetragen. Für kleine positive Werte von 𝑏 wird der Puls komprimiert und positiv gechirpt. Für 𝑏∕𝜏02 = 1 (d. h. 𝑏∕𝜏12 = 0.5) ist er maximal komprimiert (und entchirpt). Wenn 𝑏 weiter zunimmt, wird der Puls gedehnt. Für negative 𝑏 wird der Puls gedehnt und zusätzlich negativ gechirpt. (b) Ein zu Beginn positiv gechirpter Puls mit dem Chirpparameter 𝑎1 = 1 wird durch ein Chirpfilter (𝑏 > 0) gedehnt; sein Chirpparameter ist 𝑎2 > 1. Ein negativ chirpendes Filter (𝑏 < 0) bewirkt eine Kompression. Maximale Kompression wird für 𝑏∕𝜏02 = −1 (oder 𝑏∕𝜏12 = −0.5) erreicht, wie Abb. 23.12(b) zeigt.
Beispiel 23-2: Anwendung: Chirp-Pulsverstärker
Die Verstärkung eines ultrakurzen optischen Pulses mit hoher Spitzenleistung wird häufig durch nichtlineare Effekte wie Sättigung oder Selbstfokussierung im optischen Verstärker begrenzt. Solche Beschränkungen können umgangen werden, wenn der Puls vor der Verstärkung durch ein Chirpfilter gedehnt nach der Verstärkung durch ein zweites Chirpfilter wieder komprimiert wird, wie Abb. 23.13 illustriert. Das erste Filter senkt die Spitzenleistung, indem es den Puls bei Erhaltung seiner Gesamtenergie streckt. Das zweite Chirpfilter, das einen Chirpkoeffizienten mit demselben Betrag und entgegengesetztem Vorzeichens besitzt, komprimiert den Puls auf seine ursprüngliche Breite. Dadurch wird der Verstärkungsprozess über eine längere Zeitdauer verteilt, wodurch die Spitzenleistung die Grenzen des Verstärkers nicht überschreitet. Beispiel 23-3: Ein ultraschneller Petawattlaser mit hoher Wiederholungsrate und Chirp-Pulsverstärkung
Das HAPLS-Lasersystem 1) nutzt Chirp-Pulsverstärkung, um ultraschnelle Hochleistungspulse bei einer zentralen Wellenlänge von 800 nm mit einer Wiederholungsrate von 10 Pulsen pro Sekunde zu erzeugen. Jeder Puls liefert eine Energie von 30 J bei einer Dauer von 30 fs, was einer Peakleistung von 1 PW entspricht. Das 17 m lange System besteht aus einem frequenzverdoppelten, diodengepumpten Nd3+:GlasLaser, der einen Ti3+:Saphir-Femtosekundenlaser (Abschnitt 16.3) mit Chirp-Pulsverstärker pumpt (Beispiel 23-2). Der Leistungsverstärkerteil des Pumplasers enthält eine Anordnung von Nd3+:Glas-Laserverstärkerplatten ähnlich denen der National Ignition Facility (Abschnitt 15.3.2). Die Platten werden von vier Stacks von AlGaAs-Laserdioden (Abschnitt 18.4.1) mit mehr als 500 000 Laserdioden gepumpt, die zusammen Pulse mit einer Energie von 1000 J und einer Dauer 1) Das am LLNL entwickelte High-Repetition-Rate Advanced Petawatt Laser System (HAPLS) gehört zu den Strahllinien des European Extreme Light Infrastructure (ELI) Projekts in Dolní Břežany in der Tschechischen Republik.
Abb. 23.13 ChirpPulsverstärker.
Chirpfilter b > 0
Verstärker
Chirpfilter b < 0
815
816
23 Ultraschnelle Optik
von 0.3 ms bei einer Wellenlänge von 888 nm mit einer Wiederholungsrate von 10 Pulsen pro Sekunde liefern, was einer Peakleistung von 3.2 MW und einer mittleren Leistung von 10 kW entspricht. Die hohe Wiederholungsrate wird durch das Pumpen mit Laserdioden ermöglicht, das um einen Faktor 20 effizienter ist als das Pumpen mit Blitzlampen und dadurch die Erholungszeit erheblich verringert. Der Nd3+:Glas-Pumplaser erzeugt Pulse mit einer Energie von 200 J bei einer Wiederholungsrate von 10 Pulsen pro Sekunde und einer mittleren Leistung von 2 kW bei einer Wellenlänge von 1.053 μm. Nach Durchlaufen eines Moduls zur Erzeugung der zweiten Harmonischen (SHG, Abschnitt 22.2.1), das die Wellenlänge auf 526.5 nm halbiert, pumpt die Pulsfolge den Ti3+:Saphir-Femtosekundenlaser, der eine Chirp-Pulsverstärkung auf der Grundlage eines Beugungsgitter-Chirpfilters zur Pulskompression enthält (Beispiel 23-5). Im Ergebnis werden die von den Laserdiodenstacks gelieferten Pulse mit einer Energie von 1000 J, einer Peakleistung von 3.2 MW und einer Dauer von 0.3 ms in Pulse mit einer Energie von 30 J, einer Peakleistung von 1 PW und einer Dauer von 30 fs bei gleichbleibender Wiederholungsrate von 10 Pulsen pro Sekunde umgewandelt. Die mittlere optische Leistung von 10 kW der Laserdiodenstapel wird am Ausgang des HAPLS auf 300 W reduziert, woraus sich ein optisch-optischer Wirkungsgrad von 𝜂opt ≈ 3 % ergibt. Da der HAPLS eine elektrische Leistung von 150 kW verbraucht, beträgt sein Gesamtwirkungsgrad 𝜂U ≈ 0.2 %. Systeme im MultiPetawatt-Bereich lassen sich allgemein in zwei Klassen einteilen: (1) diejenigen mit Pulsdauern < 50 fs, zu denen hauptsächlich Ti3+-dotierte Saphirlaser gehören und (2) diejenigen mit Pulsdauern > 100 fs, die über3+ 3+ wiegend auf Nd - oder Yb -dotiertem Glas oder Kristallen basieren (siehe z. B. Beispiel 15-1).
23.2.2
Ausführungen von Chirpfiltern
In der Praxis bestehen Chirpfilter aus dispersiven optischen Systemen. Einige der häufigsten Ursachen der Dispersion in optischen Komponenten sind im Folgenden aufgeführt (siehe auch Abschnitt 10.3.2). ergibt sich aus der Abhängigkeit der Frequenz bzw. Wellenlänge von den Brechungsindizes und/oder Absorptionskoeffizienten optischer Materialien. Räumliche Dispersion existiert in vielerlei Formen: • Die Ursache der Winkeldispersion ist die Abhängigkeit der Frequenz bzw. Wellenlänge vom Ablenkwinkel bestimmter optischer KomponenMaterialdispersion
ten. Am Deutlichsten wird das in beugenden optischen Elementen wie Beugungsgittern und holographischen optischen Elementen. Bei brechenden Elementen wie Prismen tritt Winkeldispersion als Folge ihrer Materialdispersion auf. • Die Mehrpfaddispersion hängt mit der Existenz vielfacher Wege mit unterschiedlichen optischen Weglängen zusammen. Ein Beispiel ist Modendispersion in optischen Wellenleitern, die aus den unterschiedlichen Ausbreitungskonstanten der Wellenleitermoden resultiert (Abschnitt 9.2). • Durch interferometrische Effekte dominierte optische Systeme sind wellenlängenabhängig und zeigen daher interferometrische Dispersion. Beispielsweise sind der Reflexionsgrad und die Transmission von Schichtmedien und periodischen Strukturen wie Bragggittern frequenzabhängig. Optische Resonatoren sind sehr frequenzselektiv und sind daher hochgradig dispersiv. • Auch die Beugung an kleinen Öffnungen ist wellenlängenabhängig und kann daher zu wesentlichen Änderungen in den Profilen kurzer optischer Pulse führen; das ist eine Form der Beugungsdispersion. Meist ist für diese Art der Dispersion Ausbreitung durch bzw. Streuung an räumlichen Strukturen oder Inhomogenitäten verantwortlich, deren Abmessungen in der Größenordnung der Wellenlänge der Strahlung liegt. Sogar Einmodenwellenleiter zeigen Wellenleiterdispersion, die mit der Eingrenzung des Lichts auf kleine Strukturen zusammenhängt (siehe Abschnitt 9.2). Polarisationsdispersion ist ein Ergebnis der Wellenlängenabhängigkeit der anisotropen Eigenschaften von optischen Materialien, Komponenten und Systemen. Nichtlineare Dispersion spielt wegen der Wellenlängenabhängigkeit von nichtlinearen optischen Effekten wie Selbstphasenmodulation und parametrischen Wechselwirkungen, die durch die frequenzabhängige Energieerhaltung oder Phasenbedingungen bestimmt sind, ebenfalls eine wichtige Rolle bei der Umformung von intensiven optischen Pulsen. All diese dispersiven Effekte können zu Herstellung von Chirpfiltern ausgenutzt werden, wie die folgenden Beispiele zeigen. Winkeldispersions-Chirpfilter
Optische Elemente mit Winkeldispersion wie Prismen oder Beugungsgitter können als Chirpfilter wirken. Ein solches Element, das schematisch in Abb. 23.14(a) dargestellt ist, streut die monochromatischen Komponen-
23.2 Pulsformung und Kompression
P
θ
ℓ0 cos θ
P1
ℓ0 P0
ν
gefilterter Puls
OriginalPuls
ν ν0
ν0 (b)
(a)
Abb. 23.14 (a) Ein optisches Element mit Winkeldispersion. Die Komponente bei der Frequenz 𝜈 wird von der bei der Mittenfrequenz 𝜈0 durch einen Winkel 𝜃(𝜈) getrennt. Am Beobachtungspunkt P0 ist die Weglänge der Komponente bei der Mittenfrequenz 𝓁0 (Distanz PP0 ). Die Weglänge der Kom-
ponente bei der Frequenz 𝜈 ist die Entfernung PP1 , wobei P1 so bestimmt wird, dass die Wellenfront durch den Beobachtungspunkt P0 verläuft. Daher ist die Entfernung PP1 in dem Dreieck PP1 P0 gleich 𝓁0 cos 𝜃(𝜈). (b) Ein Chirpfilter aus einer Kombination von vier der Elemente in (a).
ten einer gepulsten ebenen Welle in unterschiedliche Richtungen. Wir nehmen an, dass die Komponente mit der Frequenz 𝜈 in einem Winkel 𝜃(𝜈) zur Richtung der Komponente bei der Mittenfrequenz 𝜈0 abgelenkt wird, d. h. 𝜃(𝜈0 ) = 0. Wenn 𝓁0 die optische Weglänge der Komponente mit der Mittenfrequenz ist, dann ist die optische Weglänge der Komponente bei der Frequenz 𝜈 gleich 𝓁0 cos 𝜃(𝜈), wie aus Abb. 23.14(a) zu entnehmen ist. Die Phasenverschiebung der spektralen Komponente 𝜈 ist dann
𝜈 = 𝜈0 (wobei 𝜃(𝜈0 ) = 0 ist) sind:
𝛹(𝜈) =
2π 𝜈 𝓁 cos 𝜃(𝜈) , 𝑐 0
(23.49)
und das entsprechende Phasenfilter hat eine Übertragungsfunktion 𝐻(𝜈) = exp[−i𝛹(𝜈)]. Ein gepulster Strahl wird normalerweise durch vier identische dispersive Elemente gefiltert, wie Abb. 23.14(b) zeigt. Ein Element teilt die spektralen Komponenten des optischen Pulses in getrennte Richtungen auf. Ein zweites, umgekehrtes Element richtet die Strahlen wieder parallel aus, wie der linke Teil von Abb. 23.14(b) zeigt. Dieser Prozess wird durch zwei identische Elemente in umgekehrter Reihenfolge wieder umgekehrt, wie der rechte Block der Abbildung illustriert. Das gesamte System ist ein Phasenfilter mit 𝛹(𝜈) = (2π𝜈∕𝑐)𝓁0 cos 𝜃(𝜈), wobei 𝓁0 die gesamte optische Weglänge der Komponente bei der Mittenfrequenz ist. Die Funktion 𝜃(𝜈) hängt von dem verwendeten dispersiven Element ab, wie in den folgenden Beispielen gezeigt wird. Gewöhnlich ist 𝜃(𝜈) so klein, dass cos 𝜃(𝜈) ≈ 1 1 − 𝜃2 (𝜈) gesetzt werden kann; dann folgt 2
𝛹(𝜈) ≈
2π 𝜈 1 𝓁 [1 − 𝜃2 (𝜈)] . 2 𝑐 0
(23.50)
Wenn 𝜃(𝜈) innerhalb der spektralen Breite des Pulses langsam variiert, dann kann die Funktion durch einige Terme einer Taylorentwicklung um die Mittenfrequenz 𝜈0 angenähert werden. Die Ableitungen von 𝛹(𝜈) bei
𝛹′ ≈
2π 𝓁 𝑐 0
2
und 𝛹 ′′ ≈ −
d𝜃 2π 𝜈 𝓁 ( ) . (23.51) 𝑐 0 d𝜈
Nach den Gln. (23.34) und (23.35) ist dieses Filter äquivalent zu einer Zeitverzögerung 𝜏V = 𝓁0 ∕𝑐 und einem Chirpfilter mit dem Chirpkoeffizienten 𝑏≈−
𝓁0 2 𝛼 , π 𝜆0 𝜈
(23.52)
wobei 𝛼𝜈 = d𝜃∕ d𝜈 der Koeffizient der Winkeldispersion ist. Da 𝑏 in dieser Näherung unabhängig vom Vorzeichen von 𝛼𝜈 immer negativ ist, sind solche Filter negativ chirpend. Natürlich führen Terme höherer Ordnung in der Reihenentwicklung der Phase zusätzliche Effekte bei der Formung des Pulses ein. Beispiel 23-4: Prismen-Chirpfilter
Der Ablenkwinkel 𝜃A(𝜈) eines auf ein Prisma einfallenden Strahls ist eine Funktion der genauen Anordnung und des Brechungsindex 𝑛(𝜈) (siehe Abb. 23.15). Wegen 𝜃(𝜈) = 𝜃A (𝜈) − 𝜃A (𝜈0 ) ist der Koeffizient der Winkeldispersion 𝛼𝜈 = d𝜃∕ d𝜈 = (d𝜃A ∕ d𝑛)(d𝑛∕ d𝜈). Mit den Beziehungen d𝑛∕ d𝜈 = −(𝜆0 ∕𝜈0 ) d𝑛∕ d𝜆0 = (𝑛 − 𝑁)∕𝜈0 mit dem Gruppenindex 𝑁 = 𝑛 − 𝜆0 d𝑛∕ d𝜆0 des Materials (siehe Abschnitt 5.7) erhalten wir 𝛼𝜈 =
𝑛 − 𝑁 d𝜃A . 𝜈0 d𝑛
(23.53)
Für ein dünnes Prisma mit dem Öffnungswinkel 𝛼 ist der Ablenkwinkel 𝜃A = (𝑛 − 1)𝛼 [siehe Gl. (1.10)], sodass d𝜃A ∕ d𝑛 = 𝛼 ist und 𝛼𝜈 =
𝑛−𝑁 𝛼. 𝜈0
(23.54)
Für BK7-Glas bei 𝜆0 = 800 nm gilt beispielsweise 𝑛 = 1.51 und 𝑁 = 3.11. Für ein Prisma mit 𝛼 = 15◦ ist dann 𝛼𝜈 = 1.11 × 10−15 s = 1.11 fs. Für 𝓁0 = 1 cm
817
818
23 Ultraschnelle Optik
ist der durch Gl. (23.52) gegebene Chirpkoeffizient 𝑏 = −5 × 10−27 s2 ≈ −(71 fs)2 . Nach den Gln. (23.39) und (23.40) wird ein ungechirpter Puls der Breite 𝜏1 = 50 fs beim Durchgang durch dieses Bauelement um einen Faktor (1 + 𝑏2 ∕𝜏14 )1∕2 ≈ 2.23 verbreitert und mit dem Chirpparameter 𝑎2 = 𝑏∕𝜏12 = 2 gechirpt. Ein Chirpfilter aus einem dicken Prisma wird in Aufgabe 23-3 untersucht.
OriginalPuls
gefilterter Puls ν ν0
Abb. 23.15 Prismen-Chirpfilter.
Beispiel 23-5: Beugungsgitter-Chirpfilter
Für ein Beugungsgitter (Abb. 23.16) sind die Einfallsund Beugungswinkel 𝜃1 und 𝜃2 an einem Gitter mit der Periode 𝛬 durch die Beugungsbedingung Gl. (2.44) verknüpft. Für 𝜃2 = 𝜃20 + 𝜃(𝜈), wobei 𝜃20 der Winkel der Komponente der Mittenfrequenz ist, gilt für die Beugung erster Ordnung sin 𝜃1 + sin[𝜃20 + 𝜃(𝜈)] =
𝜆 𝑐 = . 𝛬 𝜈𝛬
(23.55)
Wenn wir beide Seiten bei 𝜈 = 𝜈0 ableiten, erhalten wir −𝜆0 d𝜃 −𝑐 = . = 2 𝑐𝛬 cos 𝜃20 d𝜈 𝜈0 𝛬 cos 𝜃20 2
𝛼𝜈 =
(23.56)
In dem symmetrischen Fall 𝜃1 = 𝜃20 ist sin 𝜃20 = 𝜆0 ∕2𝛬 und daher 𝛼𝜈 = −
𝜆0 1 ; √ 𝜈0 𝛬2 − (𝜆 ∕2)2 0
(23.57)
daraus folgt 𝑏=−
gefilterter Puls
Originalpuls
Abb. 23.16 Beugungsgitter als negativ chirpendes Filter.
𝛬 = 𝑚𝜆∕2 mit einer ganzen Zahl 𝑚 erfüllen; Wellen anderer Wellenlänge werden ohne Änderung transmittiert. Das Gitter kann daher als ein schmalbandiges Filter dienen. Wenn sich die Periode des Gitters mit dem Ort ändert, dann reflektiert jedes Segment des Gitters Wellen mit einer Wellenlänge, die zur der lokalen Periode passt. Die reflektierten Wellen breiten sich je nach dem Ort, an dem sie reflektiert wurden, über unterschiedliche Entfernungen aus, sodass das System als frequenzempfindliches Phasenfilter wirkt. Wenn sich die Frequenz der periodischen Struktur linear mit der Entfernung ändert, bezeichnet man das Gitter als linear gechirpt, und es wirkt als lineares Chirpfilter. Wir nehmen an, dass die Periode eines Bragggitters eine Funktion 𝛬(𝑧) des Ortes 𝑧 ist, sodass sich die Frequenz linear mit 𝑧 ändert, d. h. 𝛬−1 (𝑧) = 𝛬0−1 + 𝜉𝑧, wobei 𝛬0 die Periode bei 𝑧 = 0 ist und 𝜉 eine Konstante. Um die Wirkung des Gitters auf einen optischen Puls zu bestimmen, zerlegen wir den Puls in seine spektralen Komponenten und untersuchen die Wirkung des Gitters auf jede Komponente. Die Komponente der Frequenz 𝜈 wird vom Gitter an dem Ort 𝑧 reflektiert, für den 𝛬 = 𝑚𝜆∕2 gilt, d. h. 𝛬(𝑧) = 𝑚𝜆∕2 = 𝑚𝑐∕2𝜈 oder 𝑧 = 2𝜈∕𝑚𝑐𝜉 − 1∕𝜉𝛬0 ist. Diese Komponente breitet sich über eine Entfernung 2𝑧 aus und erfährt dabei eine Phasenverschiebung 𝛹 = (2π 𝜈∕𝑐)(2𝑧) entsprechend 𝛹 = (8π∕𝑚𝑐2 𝜉)𝜈2 + (4π∕𝑐𝜉𝛬0 ) 𝜈 .
𝜆02
𝜆 0 𝓁0 . π𝑐2 𝛬2 − (𝜆0 ∕2)2
(23.58)
Für 𝜆0 = 800 nm und 𝛬 = 1.6 μm ergibt sich 𝛼𝜈 = −2.72 × 10−15 s = −2.72 fs. Für 𝓁0 = 10 cm ist 𝑏 = −2.94 × 10−25 s2 = −(542 fs)2 .
(23.59)
Nach den Gln. (23.34) und (23.35) ist das gechirpte Bragggitter somit äquivalent zu einer Zeitverzögerung
Λ(z)
Bragg-Chirpfilter
Bragggitter mit variabler Periode (gechirpte Gitter, Abb. 23.17) werden häufig als Chirpfilter eingesetzt. Wie in Abschnitt 7.1.3 beschrieben ist ein Bragggitter eine periodische Struktur, die optische Wellen selektiv reflektiert. Ein Gitter mit der Periode 𝛬 reflektiert nur Wellen mit Wellenlängen 𝜆, die die braggsche Bedingung
0
z
Abb. 23.17 Ein Bragggitter mit abnehmender Periode wirkt als positives Chirpfilter.
23.2 Pulsformung und Kompression
𝜏V = 2∕𝑐𝜉𝛬0 und einem Chirpfilter mit dem Chirpkoeffizienten 𝑏=
8 . 𝑚π 𝜉𝑐2
(23.60)
Für 𝜉 > 0, d. h. eine zunehmende Frequenz des Gitters wie in Abb. 23.17, ist der Chirpkoeffizient 𝑏 > 0, d. h. das Filter ist positiv chirpend. Entsprechend ist ein gechirptes Bragggitter mit einer abnehmenden Frequenz ein negativ chirpendes Filter.
23.2.3 Pulskompression Ein transformationsbeschränkter Puls kann nicht durch ein Chirpfilter alleine komprimiert werden. Ein solches Filter dehnt und chirpt den Puls, verändert jedoch seine spektrale Breite nicht. Eine Kompression kann jedoch durch eine Kombination aus einem Phasenmodulator und einem Chirpfilter erreicht werden. Der Phasenmodulator multipliziert den Puls mit einem zeitabhängigen Phasenfaktor, der einen von einer spektralen Verbreiterung begleiteten Chirp einführt, aber die zeitliche Breite nicht verändert. Der gechirpte Puls kann anschließend durch ein Chirpfilter komprimiert werden, das die neue spektrale Breite unverändert lässt, aber die zeitliche Breite verringert und so einen neuen transformationsbeschränkten komprimierten Puls erzeugt. Um einen ungechirpten Puls 𝒜(𝑡) = 𝐴0 exp(−𝑡2 ∕𝜏12 ) zu komprimieren, wandeln wir ihn zuerst in einem quadratischen Phasenmodulator (QPM) durch Multiplikation mit einem quadratischen Phasenfaktor exp(i𝜁𝑡2 ) in einen gechirpten Puls um, wobei 𝜁 eine Konstante ist. Das Ergebnis ist ein gechirpter Puls 𝐴1 (𝑡) = 𝐴10 exp[−(1 − i𝑎1 )𝑡2 ∕𝜏12 ] mit dem Chirpparameter 𝑎1 = 𝜁𝜏12 .
(23.61)
Für 𝜁 > 0 ist der Puls positiv gechirpt und eine anschließende Filterung mit einem negativ chirpenden Filter bewirkt eine Komprimierung. Für 𝜁 < 0 ist der Puls dagegen negativ gechirpt und die Komprimierung wird durch anschließende Filterung mit einem positiv chirpenden Filter erreicht. In beiden Fällen wird der Puls um quadratischer Phasenmodulator
√ √ einen Faktor 1 + 𝑎12 = 1 + 𝜁 2 𝜏14 komprimiert. Das gesamte System ist in Abb. 23.18 dargestellt. Wenn der Originalpuls ein gechirpter Puls 𝐴1 (𝑡) = 𝐴10 exp[−(1 − i𝑎1 )𝑡2 ∕𝜏12 ] ist, dann verwandelt die Modulation mit einer quadratischen Phase exp(i𝜁𝑡2 ) ihn in einen anderen gechirpten Puls 𝐴2 (𝑡) = 𝐴10 exp[−(1 − i𝑎2 )𝑡2 ∕𝜏12 ] mit derselben Breite, aber dem veränderten Chirpparameter 𝑎2 = 𝑎1 + 𝜁𝜏12 .
Ein quadratischer Phasenmodulator, dessen Vorzeichen von 𝜁 dem von 𝑎1 entgegengesetzt ist, kann den Originalpuls daher entchirpen oder sogar das Vorzeichen des Chirps umkehren. Zusammenfassung
Ein quadratischer Phasenmodulator (QPM) und ein Chirpfilter erfüllen Doppelfunktionen. Die eine Operation ist dabei die Fouriertransformierte der anderen: QPM
Multiplikation mit quadratischer Phasenfunktion Chirp- Faltung mit quadratifilter scher Phasenfunktion
Chirpfilter
Chirpparameter: spektrale Breite:
b =bmin = –a1 τ12 τ1
0
a1 = ζτ 12
Δν
Δν
komprimierter transformations(1+a21) begrenzter Puls τ0 = τ1
1+a12
bewahrt spektrale Breite
verändert zeitliche Breite
Die bis jetzt besprochenen Methoden zur Pulsformung beruhten auf Chirpfiltern auf der Grundlage von dispersiven optischen Komponenten. Obwohl Chirpfilter für
gechirpter Puls
τ1
bewahrt zeitliche Breite
23.2.4 Pulsformung
e –ib π f
Pulsbreite:
ändert spektrale Breite
Ein quadratischer Phasenmodulator kann durch elektrooptische Modulatoren realisiert werden (siehe Abschnitt 21.1.2), obwohl die Erzeugung des geeigneten Signals exp(i𝜁𝑡2 ) nicht einfach ist. Passive Phasenmodulation tritt auf, wenn intensive Pulse durch nichtlineare Medien transmittiert werden, die einen optischen Kerreffekt zeigen, wie in Abschnitt 23.5.3 im Zusammenhang mit der Selbstphasenmodulation beschrieben wird; dieser Effekt kann ausgenutzt werden, um eine quadratische Phasenmodulation zu erreichen.
2 2
transformationsbegrenzter 2 Puls e iζ t
(23.62)
1+a12
0 Δν
1 +a12
Abb. 23.18 Komprimierung eines transformationsbeschränkten Pulses durch einen quadratischen Phasenmodulator gefolgt von einem Chirpfilter.
819
820
23 Ultraschnelle Optik
die Dehnung und die Komprimierung von Pulsen verwendet werden können, sind sie nicht geeignet, um die Pulsform in beliebiger Weise zu verändern oder Pulse mit einer vorgegebenen Form zu erzeugen, was in der optischen Nachrichtentechnik und Signalverarbeitung häufig notwendig ist. Eine beliebige Umformung von ultraschnellen Pulsen kann durch optisches FrequenzRaum- oder Zeit-Raum-Mapping gemeinsam mit einer räumlichen Modulation erreicht werden, wie im Folgenden beschrieben wird. Frequenz-Raum-Mapping
Frequenz-Raum-Mapping eines optischen Pulses kann mithilfe eines Beugungsgitters und einer Linse erreicht werden, die jede konstituierende spektrale Komponente auf einen eindeutigen Punkt in der Brennebene der Linse abbilden, wie auf der linken Seite der Abb. 23.19 dargestellt ist. Dieses System projiziert die Fouriertransformierte des zeitlichen Pulsprofils als räumliches Muster in die Brennebene. Ein Modulator modifiziert den Betrag und die Phase gemäß der Übertragungsfunktion des gewünschten linearen pulsformenden Filters. Das kann durch eine mikrolithographische oder holographische Maske oder einen programmierbaren räumlichen Lichtmodulator erreicht werden (siehe Abschnitt 21.3.2). Der Umkehrprozess, das räumliche-spektrale Mapping, wird anschließend durch eine zweite Linse und ein zweites Gitter bewerkstelligt, die die modifizierten spektralen Komponenten wieder kombinieren, um den neu geformten Puls zu bilden. Das entspricht einer inversen Fouriertransformation, und der gesamte Vorgang ähnelt der räumlichen Filterung in der Fourieroptik (siehe Abschnitt 4.4.2). Diese Technik ist heute eine Standardmethode für die beliebige Formung von ultraschnellen Pulsen. Das in Abb. 23.19 dargestellte System können wir quantitativ wie folgt beschreiben. Wenn 𝜃(𝜈) der Abf
f
f Raumlichtmodulator
Linse
Gitter θ(ν)
Originalpuls
x
Brennebene
Abb. 23.19 Ein System für die Pulsformung besteht aus (i) Frequenz-Raum-Mapping durch ein Gitter und eine Linse, die die Fouriertransformierte des Pulses als räumliches Muster in der Fourierebene abbilden, (ii) Modulation durch
lenkwinkel ist, der durch das Gitter bei der Frequenz 𝜈 eingeführt wird, wird die Fourierkomponente bei dieser Frequenz auf einen Ort 𝑥 = 𝜃(𝜈)𝑓 in der Brennebene der Linse (der Fourierebene) fokussiert, wobei 𝑓 die Brennweite der Linse ist und wir den Winkel als klein angenommen haben. Eine Maske mit der Amplitudentransmission 𝑝(𝑥) ist daher äquivalent zu einem Filter mit der Übertragungsfunktion 𝐻(𝜈) = 𝑝[𝜃(𝜈)𝑓]. Wenn 𝜃(𝜈) näherungsweise durch eine lineare Funktion 𝜃(𝜈) ≈ 𝛼𝜈 𝜈 der Frequenz beschrieben wird, wobei 𝛼𝜈 = d𝜃∕ d𝜈 der [durch Gl. (23.56) gegebene] Koeffizient der Winkeldispersion des Gitters ist, dann ist die Übertragungsfunktion 𝐻(𝜈) des Filters eine skalierte Version des Profils der Maskenfunktion 𝑝(𝑥), d. h. 𝐻(𝜈) = 𝑝(𝛼𝜈 𝑓𝜈) .
(23.63)
Bei diesem Frequenz-Raum-Mapping entspricht der Ort 𝑥 in der Fourierebene der Frequenz 𝜈 = 𝑥∕𝛼𝜈 𝑓 und die spektrale Breite Δ𝜈 wird auf die räumliche Breite 𝑋 = 𝛼𝜈 𝑓Δ𝜈 abgebildet. Diese vereinfachte Analyse beruht auf der Annahme, dass der Originalpuls eine ebene Welle ist, sodass Beugung keine Rolle spielt. Für einen Originalstrahl der endlichen Dicke 𝑊 in der Gitterebene wird die spektrale Komponente bei der Frequenz 𝜈 um einen Winkel 𝜃(𝜈) ≈ 𝛼𝜈 𝜈 abgelenkt, erfährt dabei aber eine zu 𝜆∕𝑊 = 𝑐∕𝜈𝑊 proportionale Winkelverbreiterung, die einer räumlichen Ausdehnung δ𝑥 = 𝑓𝜆0 ∕𝑊 = 𝑐𝑓∕𝜈𝑊 entspricht. Diese frequenzabhängige Ausdehnung beschränkt die räumliche Auflösung des Systems. Eine Maske mit der Gesamtbreite 𝑋 besteht aus ungefähr 𝑀 = 𝑋∕δ𝑥 = 𝑋∕(𝜆0 𝑓∕𝑊) unabhängigen Punkten, wobei 𝜆0 die zentrale Wellenlänge ist. Die räumliche Verbreiterung δ𝑥 entspricht einer spektralen Verbreiterung δ𝜈 = (𝜆0 𝑓∕𝑊)∕(𝛼𝜈 𝑓) = 𝜆0 ∕(𝛼𝜈 𝑊). Das beschränkt die spektrale Auflösung des Systems auf 𝑀 = 𝑋𝑊∕𝜆0 𝑓 unabhängige Punkte. f Linse
Gitter
gefilterter Puls
einen räumlichen Lichtmodulator, und (iii) Raum-FrequenzMapping durch eine Linse und ein Gitter, die die inverse Fouriertransformierte erzeugen.
23.3 Pulsausbreitung in optischen Fasern
Die Umformung von Piko- und Femtosekundenpulsen wurde mit unterschiedlichen Typen von räumlichen Lichtmodulatoren erfolgreich durchgeführt, beispielsweise mit deformierbaren Spiegeln, Flüssigkristall-Modulatorarrays (mit Antwortzeiten im Bereich von Millisekunden oder kürzer und einem großen Tastgrad), akustooptischen Deflektoren (im Bereich von Mikrosekunden umprogrammierbar, kleiner Tastgrad) oder optoelektronischen Halbleiter-Modulatorarrays (im Bereich von Nanosekunden umprogrammierbar). Zeit-Raum-Mapping
Eine andere Methode zur Erzeugung beliebiger Pulsformen verwendet einen räumlichen Lichtmodulator in Kombination mit einem Beugungsgitter gefolgt von einem 2𝑓-Linsensystem mit einer kleinen Öffnung auf der Achse in der Fourierebene, wie in Abb. 23.20 dargestellt. Das Gitter multipliziert die spektrale Komponente der Frequenz 𝜈, die die komplexe Einhüllende 𝐴1 (𝜈) besitzt, mit dem frequenz- und ortsabhängigen Phasenfaktor exp(i2π𝛾𝜈𝑥), wobei 𝛾 eine Konstante ist. Der räumliche Lichtmodulator moduliert sie mit einem steuerbarem räumlichen Muster 𝑝(𝑥), und das Linsensystem wirkt als räumlicher Integrator, der eine Amplitude 𝐴2 (𝜈) ∝ 𝐴1 (𝜈) ∫ 𝑝(𝑥) exp(i2π𝛾𝜈𝑥) d𝑥 ∝ 𝐴1 (𝜈)𝑃(−𝛾𝜈) (23.64) erzeugt, wobei 𝑃(𝜈𝑥 ) die räumliche Fouriertransformierte von 𝑝(𝑥) ist. Das gesamte System verhält sich daher wie ein lineares System mit der Übertragungsfunktion 𝐻(𝜈) ∝ 𝑃(−𝛾𝜈) entsprechend einer Impulsantwortfunktion ℎ(𝑡) ∝ 𝑝 (−𝑡∕𝛾) .
(23.65)
Daraus folgt, dass die Transmission des räumlichen Lichtmodulators am Ort 𝑥 den Wert der Impulsantwortfunktion zu genau einer Zeit 𝑡 = −𝛾𝑥 kontrolliert. So liefert das System ein direktes Zeit-Raum-Mapping, das ausgenutzt werden kann, um einen Femtosekundenpuls mit einem beliebigen zeitlichen Profil umzuformen oder neu zu erzeugen.
Originalpuls
p(x)
f
f
23.3 Pulsausbreitung in optischen Fasern Dieser Abschnitt untersucht die Ausbreitung eines optischen Pulses in einem ausgedehnten linearen dispersiven Medium wie z. B. einer optischen Faser, indem die Ausbreitung als lineares Filter mit einer durch die frequenzabhängige Ausbreitungskonstante bestimmten Übertragungsfunktion betrachtet wird. Für Pulse mit einer langsam variierenden Einhüllenden (z. B. optische Pikosekundenpulse) kann das Filter durch eine Kombination einer Zeitverzögerung und eines Chirpfilters approximiert werden; in diesem Fall ist die Mathematik der Pulsausbreitung mit der in Abschnitt 23.2.1 vorgestellten Analyse abgedeckt. Wir werden eine Differentialgleichung herleiten, die die Evolution der Einhüllenden des Pulses bei seiner Ausbreitung durch das Medium beschreibt, und eine Analogie zwischen diesem Dispersionsphänomen und gewöhnlicher optischer Beugung vorstellen.
23.3.1 Die optische Faser als Chirpfilter Das dispersive Medium als Filter
Bei der Ausbreitung in einem linearen verlustfreien dispersiven Medium erfährt eine monochromatische ebene Welle der Frequenz 𝜈, die sich über eine Entfernung 𝑧 in 𝑧-Richtung ausbreitet (Abb. 23.21), eine Phasenverschiebung 𝛽(𝜈)𝑧, wobei 𝛽(𝜈) = 2π 𝜈𝑛(𝜈)∕𝑐0 die Ausbreitungskonstante ist und 𝑛(𝜈) der Brechungsindex. Die Ausbreitung ist daher mathematisch äquivalent zu einer Multiplikation mit dem Phasenfaktor exp[−i𝛽(𝜈)𝑧]. Da eine gepulste Welle mit der Wellenfunktion 𝑈(𝑧, 𝑡) eine Superposition aus vielen monochromatischen Wellen ist, ist der Phasenfaktor 𝐻(𝜈) = exp[−i𝛽(𝜈)𝑧] die Übertragungsfunktion des linearen Systems, das die Ausbreitung beschreibt, d. h. 𝑉(𝑧, 𝜈) = 𝐻(𝜈)𝑉(0, 𝜈) = exp[−i𝛽(𝜈)𝑧]𝑉(0, 𝜈), wobei 𝑉(𝑧, 𝜈) die Fouriertransformierte von 𝑈(𝑧, 𝑡) ist. Für Pulse mit einer schmalen spektralen Verteilung kann die komplexe Wellenfunktion in der Form 𝑈(𝑧, 𝑡) = 𝒜(𝑧, 𝑡) exp(−i𝛽0 𝑧) exp(i2π𝜈0 𝑡) durch die komplexe Einhüllende ausgedrückt werden, wobei 𝜈0 die
gefilterter Puls t
t x Raumlichtmodulator Gitter
Linse
Abb. 23.20 Pulsformung auf der Grundlage eines Zeit-RaumMappings. Das System besitzt eine Impulsantwortfunktion h(t ), die eine skalierte Version der Transmissionsfunktion p(x) des räumlichen Lichtmodulators ist.
821
822
23 Ultraschnelle Optik
dispersives Medium
0
z
(0, t)
(z, t)
(0, t)
E (f )
(z, t)
Abb. 23.21 Die Transmission eines optischen Pulses durch ein dispersives Medium ist äquivalent zu einem Phasenfilter.
t
0
Mittenfrequenz ist und 𝛽0 = 𝛽(𝜈0 ). Im Fourierbereich wird daraus 𝑉(𝑧, 𝜈) = 𝐴(𝑧, 𝜈 − 𝜈0 ) exp(−i𝛽0 𝑧), und folglich wird aus 𝑉(𝑧, 𝜈) = exp[−i𝛽(𝜈)]𝑉(0, 𝜈) die Beziehung 𝐴(𝑧, 𝜈 − 𝜈0 ) = 𝐴(0, 𝜈 − 𝜈0 ) exp(−i[𝛽(𝜈) − 𝛽(𝜈0 )]𝑧). Als Funktion der Frequenzdifferenz 𝑓 = 𝜈 − 𝜈0 ist 𝐴(𝑧, 𝑓) = HE (𝑓)𝐴(0, 𝑓) ,
(23.66)
wobei
Der Faktor exp(−i𝑏π2 𝑓 2 ) beschreibt ein Chirpfilter mit dem Chirpkoeffizienten 𝑏 = 𝛹 ′′ ∕2π2 = 2 2 (1∕2π2 )(d 𝛽∕ d𝜈2 )𝑧 = 2𝛽 ′′ 𝑧, wobei 𝛽 ′′ = d 𝛽∕ d𝜔2 ist. Der Chirpkoeffizient ist proportional zur Entfernung 𝑧 und wird gewöhnlich in der Form 𝑏 = 2𝛽 ′′ 𝑧 =
𝐷𝜈 𝑧 π
(23.70)
geschrieben, wobei
HE (𝑓) = exp{−i[𝛽(𝜈0 + 𝑓) − 𝛽(𝜈0 )]𝑧}
(23.67)
die Übertragungsfunktion der Einhüllenden ist. Die Wirkung des dispersiven Mediums auf die Einhüllende des Pulses entspricht daher einem Phasenfilter HE (𝑓) = exp[−i𝛹(𝑓)] mit der Phase 𝛹(𝑓) = [𝛽(𝜈0 + 𝑓) − 𝛽(𝜈0 )]𝑧. Approximation eines dispersiven Mediums durch Zeitverzögerung und Chirpfilter
Wenn die Ausbreitungskonstante 𝛽(𝜈) innerhalb der spektralen Breite des Pulses langsam variiert, können wir die Ergebnisse der Taylorentwicklung 𝛹(𝑓) ≈ 𝛹 ′ 𝑓 + 1 ′′ 2 𝛹 𝑓 aus Abschnitt 23.2.1 benutzen, wobei 𝛹 ′ und 𝛹 ′′ 2 die ersten und zweiten Ableitungen von 𝛹(𝜈) nach 𝜈 am Ort 𝜈0 sind und 𝛹(0) = 0 gilt. Die Übertragungsfunktion der Einhüllenden kann dann näherungsweise als 1
HE (𝑓) ≈ exp[−i(𝛹 ′ 𝑓 + 𝛹 ′′ 𝑓 2 )] 2
= exp(−i2π 𝜏V 𝑓) exp(−i𝑏π2 𝑓 2 )
(23.68)
geschrieben werden, wobei 𝜏V = 𝛹 ′ ∕2π und 𝑏 = 𝛹 ′′ ∕2π2 gilt. Daraus folgt, dass der Prozess der Pulsausbreitung äquivalent zu einer Kombination aus einer Zeitverzögerung und einem Chirpfilter ist. Der Faktor exp(−i2π 𝜏V 𝑓) beschreibt eine Zeitverzögerung 𝜏V = 𝛹 ′ ∕2π = (1∕2π)(d𝛽∕ d𝜈)𝑧 = (d𝛽∕ d𝜔)𝑧 = 𝑧∕𝑣, die Gruppenlaufzeit, wobei 𝑣 = 1∕𝛽 ′ =
𝑐0 𝑁
(23.69)
die Gruppengeschwindigkeit ist und 𝑁 = 𝑛 − 𝜆0 d𝑛∕ d𝜆0 der Gruppenindex. Diese Parameter wurden bereits zuvor in der vereinfachten Analyse in Abschnitt 5.7 definiert.
𝐷𝜈 = 2π𝛽 ′′ =
𝜆03 d2 𝑛 d 1 ( )= 2 d𝜈 𝑣 𝑐0 d𝜆02
(23.71)
der Koeffizient der Gruppengeschwindigkeitsdispersion ist. Er ist die Ableitung der Gruppenlaufzeit pro Längeneinheit nach der Frequenz 𝜈, wie zuvor in Abschnitt 5.7 beschrieben. Bei einem Medium mit 𝛽 ′′ > 0 (oder 𝐷𝜈 > 0) spricht man von normaler Dispersion bzw. positiver Gruppengeschwindigkeitsdispersion; ein solches Medium wirkt als positiv chirpendes Chirpfilter (𝑏 > 0). Umgekehrt spricht man bei einem Medium mit 𝛽 ′′ < 0 (oder 𝐷𝜈 < 0) von anomaler Dispersion oder negativer Gruppengeschwindigkeitsdispersion; ein solches Medium ergibt ein negativ chirpendes Filter (𝑏 < 0). Beispiel 23-6: Regelbares Chirpfilter durch kombinierte Winkel- und Materialdispersion in einem Prisma
In Beispiel 23-4 wurde gezeigt, dass bei der Brechung eines gepulsten Strahls in einem Prisma infolge der Winkeldispersion ein Chirp eingeführt wird. In diesem Beispiel betrachten wir die Wirkung der Materialdispersion, die vorher vernachlässigt wurde. Wenn der Zentralstrahl, der das Prisma wie in Abb. 23.16 durchquert, eine Entfernung 𝐿 in dem Prisma zurücklegt, dann entspricht die Materialdispersion einem Chirpfilter mit dem Chirpkoeffizienten 𝑏 = 2𝛽 ′′ 𝐿 = 𝐷𝜈 𝐿∕π [siehe Gl. (23.70)]. Für ein Prisma aus BK7-Glas bei 𝜆 = 800 nm ist der Dispersionskoeffizient 𝐷𝜈 = 0.284 × 10−24 s2 ∕m, sodass für 𝐿 = 1 cm der Chirpkoeffizient 𝑏 = 𝐷𝜈 𝐿∕π = +9 × 10−28 s2 = +(30 fs)2 ist. In Beispiel 23-1 hatten wir gezeigt, dass der Chirpkoeffizient aufgrund der Winkeldispersion für ein dünnes Prisma mit einem Öffnungswinkel von 15◦ gleich 𝑏 ≈ −(71 fs)2 ist. Der Gesamt-Chirpkoeffizient ist die
23.3 Pulsausbreitung in optischen Fasern
Summe der Beiträge der Material- und der Winkeldispersion. In diesem Fall ist der Nettowert von 𝑏 negativ. Die Entfernung 𝐿 kann angepasst werden, indem das Prisma in einer Richtung senkrecht zu seiner Basis bewegt wird, wie in Abb. 23.22 angedeutet wird.
23.3.2 Ausbreitung eines Gaußpulses in einer optischen Faser Da ein lineares dispersives Medium durch eine Kombination aus Zeitverzögerung und Chirpfilter approximiert werden kann, können wir die Ausbreitung eines Gaußpulses in einem solchen Medium einfach auf der Grundlage der allgemeinen Ergebnisse aus Abschnitt 23.2.1 beschreiben. Transformationsbeschränkter Gaußpuls als Eingang
Abb. 23.22 Prismen-Chirpfilter mit einstellbarem Chirpkoeffizienten.
Zusammenfassung
Der Ausbreitung eines Pulses in einem dispersiven Medium kann durch zwei Effekte approximiert werden: Eine mit der Gruppengeschwindigkeit 𝑣 = 1∕𝛽 ′ = 𝑐0 ∕𝑁 verknüpfte Zeitverzögerung und ein Chirpfilter mit einem zur Entfernung der Ausbreitung 𝑧 proportionalen Chirpkoeffizienten 𝑏 = 2𝛽 ′′ 𝑧 = 𝐷𝜈 𝑧∕π. Die Parameter 𝛽 ′ und 𝛽 ′′ sind die Ableitungen der Ausbreitungskonstante 𝛽 nach der Kreisfrequenz 𝜔, und 𝐷𝜈 = 2π 𝛽 ′′ ist der Koeffizient der Gruppengeschwindigkeitsdispersion.
Wir betrachten zuerst einen transformationsbeschränkten (ungechirpten) Gaußpuls der Breite 𝜏0 bei 𝑧 = 0. In einer Entfernung 𝑧 ist der Puls um eine Zeit 𝜏V = 𝑧∕𝑣 verzögert und wird durch ein Chirpfilter mit dem Chirpkoeffizienten 𝑏 = 𝐷𝜈 𝑧∕π gefiltert. Nach den Gln. (23.39)– (23.41) bleibt der Puls gaußsch, aber seine Breite nimmt auf 𝜏(𝑧) = 𝜏0 [1 + (𝐷𝜈2 ∕π2 𝜏04 )𝑧2 ]1∕2 zu, und er wird mit dem Chirpparameter 𝑎(𝑧) = (𝐷𝜈 ∕π𝜏02 )𝑧 und der Amplitude 𝐴0 (𝑧) = 𝐴0 [1 − i(𝐷𝜈 ∕π𝜏02 )𝑧]−1∕2 gechirpt. Wenn wir den Parameter 𝑧0 so festlegend, dass 𝐷𝜈 ∕π 𝜏02 = 1∕𝑧0 ist, können diese Gleichungen in den einfacheren Formen ausgedrückt werden, die in Tabelle 23.2 angegeben sind, die auch einen auf Gl. (23.11) beruhenden Ausdruck für die komplexe Einhüllende enthält. Der Betrag von 𝑧0 wird Dispersionslänge genannt und ist eine Eigenschaft des Mediums und der anfänglichen Impulsbreite. Das System besitzt die folgenden Eigenschaften:
Tab. 23.2 Eigenschaften eines Gaußpulses, der sich mit der Gruppengeschwindigkeit v, dem Dispersionskoeffizienten D𝜈 und dem Dispersionsparameter z0 durch ein dispersives Medium ausbreitet. Bei z = 0 ist der Puls transformationsbeschränkt mit der Breite 𝜏0 , der Amplitude A0 und der Intensität I0 = |A0 |2 . Beziehung
Gleichung
√ 𝒜(𝑧, 𝑡) = 𝐴0
𝐼(𝑧, 𝑡) = 𝐼0 ∫ 𝐼(𝑡) d𝑡 = 𝜏(𝑧) = 𝜏0
−i𝑧0 π (𝑡 − 𝑧∕𝑣)2 exp [i ] 𝐷𝜈 𝑧 − i𝑧0 𝑧 − i𝑧
𝜏0 (𝑡 − 𝑧∕𝑣)2 exp [−2 ] 𝜏(𝑧) 𝜏 2 (𝑧) √ π∕2 𝐼0 𝜏0
√
1 + (𝑧∕𝑧0 )2
𝑎(𝑧) = 𝑧∕𝑧0
𝑧0 = π Δ𝜈 =
𝜏02 𝐷𝜈
=
0.375 𝜏0
𝜏02 2𝛽 ′′
Eigenschaft
(23.72)
komplexe Einhüllende
(23.73)
Intensität
(23.74)
Energiedichte
(23.75)
Pulsbreite
(23.76)
Chirpparameter
(23.77)
Dispersionslänge
(23.78)
spektrale Breite
823
23 Ultraschnelle Optik
ungechirpte Pulsbreite τ0
positiv gechirpte Pulsbreite τ(z) R
B
Medium mit positiver Gruppengeschwindigkeitsdispersion
Abb. 23.23 Ausbreitung eines am Anfang ungechirpten Gaußpulses durch ein dispersives Medium. Der Puls bleibt gaußsch, aber seine Breite 𝜏(z) nimmt zu und er wird mit einem zunehmenden Chirpparameter a(z) gechirpt.
τ(z)/τ0
3 2 1 0 3 a (z)
824
2 1 0
0
1
z/z0
2
3
• Das Pulszentrum wird um eine Zeit 𝑧∕𝑣 verzögert, d. h. der Puls breitet sich mit der Gruppengeschwindigkeit 𝑣 = 1∕𝛽 ′ aus. • Die Breite 𝜏(𝑧) des Pulses nimmt ihren minimalen Wert 𝜏0 bei 𝑧 = 0 an und nimmt mit zunehmendem |𝑧| zu, wie in Abb. 23.23 dargestellt. √ Bei 𝑧 = |𝑧0 | wird der √Puls um einen Faktor 2 gedehnt, und bei 𝑧 = 3 |𝑧0 | hat sich seine Breite verdoppelt. Für 𝑧 ≫ |𝑧0 | ist 𝜏(𝑧) ≈ 𝜏0 𝑧∕|𝑧0 | = (|𝐷𝜈 |∕π 𝜏0 )𝑧, d. h. der Puls dehnt sich mit einer zu seiner anfänglichen Impulsbreite 𝜏0 umgekehrt proportionalen Geschwindigkeit linear aus. Als Funktion der spektralen Breite Δ𝜈 = 0.375∕𝜏0 ist die Impulsbreite 𝜏(𝑧) ≈ (1∕0.375π) |𝐷𝜈 | Δ𝜈 𝑧 = 0.85 |𝐷𝜈 | Δ𝜈 𝑧 im Einklang mit der Tatsache, dass 𝐷𝜈 die Geschwindigkeit der Pulsverbreiterung pro Einheitsentfernung und pro Einheit der spektralen Breite [in (s/(m Hz)] ist. Diese Beziehung kann auch durch den Dispersionskoeffizienten 𝐷𝜆 [in ps/(km nm)] als 𝜏(𝑧) ≈ 0.85 |𝐷𝜆 | Δ𝜆 𝑧 geschrieben werden; das ist eine genäherte Version von Gl. (5.145). • Der Chirpparameter 𝑎(𝑧) ist bei 𝑧 = 0 definitionsgemäß null und nimmt linear mit der Entfernung 𝑧 zu; bei 𝑧 = |𝑧0 | erreicht er den Betrag eins, wie Abb. 23.23 zeigt. Das Vorzeichen des Chirps ist dasselbe wie das von 𝐷𝜈 . Für normale Dispersion ist 𝐷𝜈 > 0 und 𝑎(𝑧) > 0 für 𝑧 > 0, d. h. der Puls wird positiv gechirpt. Im sichtbaren Gebiet bedeutet normale Dispersion, dass „blau“ langsamer ist als „rot“, passend zu einem positiv gechirpten Puls. Das Gegenteil ist für die anomale Dispersion der Fall. • Die Dispersionslänge |𝑧0 | hängt vom Betrag des Dispersionskoeffizienten 𝐷𝜈 des Mediums und von der anfänglichen Pulslänge 𝜏0 ab. Sie ist die Entfernung,
√ bei der die Pulslänge um einen Faktor 2 zunimmt und der Chirpparameter den Betrag eins erreicht. • Die spektrale Breite Δ𝜈 = 0.375∕𝜏0 bleibt während der Ausbreitung des Pulses unverändert. Die spektrale Kompression, die mit der zeitlichen Dehnung des Pulses einhergeht, wird durch eine entsprechende spektrale Verbreiterung vollständig kompensiert. Das war zu erwarten, da wir die Ausbreitung in dem dispersiven Medium als Phasenfilter beschrieben haben, das die spektrale Intensität nicht verändert. • Die Energiedichte des Pulses hängt, wie in einem verlustfreien Medium zu erwarten, nicht von 𝑧 ab. Beispiel 23-7: Pulsverbreiterung in BK7-Glas
Der Dispersionskoeffizient von BK7-Glas bei 𝜆 = 620 nm ist 𝛽 ′′ = 1.02 × 10−25 s2 ∕m. Für eine Platte der Dicke 1 cm entspricht das einem Chirpkoeffizienten 𝑏 = 2𝛽 ′′ 𝑧 = 2.04 × 10−23 s2 ∕m = (4.5 ps)2 . Das bedeutet, dass wenn ein Gaußpuls der Breite 4.5 ps die √ Platte durchquert, seine Breite um einen Faktor 2 gedehnt wird. Für einen kürzeren Gaußpuls mit der Zeitkonstante 𝜏0 = 100 fs und der zentralen Wellenlänge 𝜆0 = 620 nm ist die Dispersionslänge |𝑧0 | = 𝜏02 ∕2|𝛽 ′′ | = 0.5 mm. Der Puls verdoppelt seine√Breite beim Durchgang durch eine Platte der Dicke 3 𝑧0 = 0.87 mm. Gechirpter Gaußpuls als Eingang
Nach Gl. (23.45) erreicht ein gechirpter Gaußpuls mit der Breite 𝜏1 und dem Chirpparameter 𝑎1 bei 𝑧 = 0 bei der Ausbreitung durch ein dispersives Medium eine minimale Breite 𝜏1 𝜏0 = √ 1 + 𝑎12
(23.79)
23.3 Pulsausbreitung in optischen Fasern
bei einer Entfernung 𝑧min , für die (𝐷𝜈 ∕π)𝑧min = 𝑏min gilt. Aus Gl. (23.46) folgt damit 𝑧min = −𝑎1
π 2 𝜏 , 𝐷𝜈 0
Gln. (23.75) und (23.76) für positive und negative Werte von 𝑧 zeigt. Für ein Medium mit positivem 𝑧0 (positive Gruppengeschwindigkeitsdispersion oder normale Dispersion) und einen anfänglichen Chirpparameter 𝑎1 = −1 ist beispielsweise 𝑧min = 𝑧0 , sodass das Medium am Ort 𝑧 = −𝑧0 beginnt. Der Prozess der Pulskompression und anschließenden Verbreiterung wird jetzt √ deutlich. Der Puls wird maximal um einen Faktor 2 komprimiert und wird bei einer Entfernung 𝑧min = 𝑧0 entchirpt. Bei weiterer Ausbreitung durch das Medium wird der Puls verbreitert und positiv gechirpt. Da der anfängliche Chirpparameter 𝑎1 und der Dispersionskoeffizient 𝐷𝜈 jeweils positiv oder negativ sein können, gibt es mehrere Kombinationsmöglichkeiten:
(23.80)
was als Funktion des Dispersionsparameters 𝑧0 = π 𝜏02 ∕ 𝐷𝜈 auch in der Form 𝑧min = −𝑎1 𝑧0
(23.81)
geschrieben werden kann. Die Gln. (23.47) und (23.48) liefern dann die folgenden Ausdrücke für die Pulslänge und den Chirpparameter als Funktionen der Entfernung 𝑧: √ 𝜏(𝑧) = 𝜏0 1 + (𝑧 − 𝑧min )2 ∕𝑧02 , (23.82) 𝑎(𝑧) = (𝑧 − 𝑧min )∕𝑧0 .
(23.83)
Die Gln. (23.82) und (23.83) sind identisch mit den Gln. (23.75) und (23.76) für den anfänglich ungechirpten Strahl, nur dass die Entfernung um den Ort 𝑧min der minimalen Breite verschoben ist. Die Ausdrücke in Tabelle 23.2 gelten daher sowohl für positive als auch für negative 𝑧 und können auch für anfänglich gechirpte Pulse verwendet werden, wenn der Anfang des Mediums an den Ort 𝑧 gelegt wird, der dem Wert des anfänglichen Chirpparameters entspricht. Das ist in Abb. 23.24 illustriert, die eine andere Auftragung von 𝜏(𝑧) und 𝑎(𝑧) auf der Grundlage der ungechirpte Pulsbreite τ0
negativ gechirpte Pulsbreite τ1
B
• Für ein Medium mit normaler Dispersion (𝐷𝜈 > 0) ist das Filter positiv chirpend und der Parameter 𝑧0 ist positiv. Für einen zu Beginn negativ gechirpten Puls (𝑎1 < 0) ist 𝑧min positiv, sodass der Puls komprimiert wird, während er sich in die positive 𝑧-Richtung ausbreitet. Für einen zu Beginn positiv gechirpten Puls (𝑎1 > 0) ist 𝑧min negativ, und der Puls wird nicht komprimiert. • Für ein Medium mit anomaler Dispersion (𝐷𝜈 < 0) ist das Filter negativ chirpend und der Parameter 𝑧0 ist negativ. Für einen anfänglich positiv gechirpten Puls (𝑎1 > 0) ist 𝑧min positiv, sodass der Puls komprimiert wird, während er sich in die positive 𝑧-Richtung aus-
positiv gechirpte Pulsbreite τ (z)
R
R
B
pos. Gruppengeschwindigkeitsdispersion
0
zmin
z
τ (z)/τ0
2 τ2 = b τ1
1
0 a(z) 2
0
‒2 ‒3
‒2
‒1
0
1
2
z/z0
Abb. 23.24 Die Ausbreitung eines zu Beginn negativ gechirpten Gaußpulses (a1 = −1) durch ein Medium mit normaler Dispersion. Die Impulslänge 𝜏(z) nimmt von einem Anfangswert √ 𝜏1 auf einen minimalen Wert 𝜏0 = 𝜏1 ∕ 2 ab und danach wieder zu. Der zu Beginn negative Chirpparameter nimmt linear zu und wechselt für z > zmin das Vorzeichen. In diesem Beispiel ist zmin = z0 .
825
23 Ultraschnelle Optik
breitet. Für einen anfänglich negativ gechirpten Puls (𝑎1 < 0) ist 𝑧min negativ, und der Puls wird nicht verdichtet. Kurz gesagt: Kompression tritt ein, wenn sich ein positiv gechirpter Puls durch ein negativ chirpendes (anomales) Medium ausbreitet oder wenn sich ein negativ gechirpter Puls durch ein positiv chirpendes (normales) Medium ausbreitet. Pulskompression durch einen quadratischen Phasenmodulator und ein dispersives Medium
Wie in Abschnitt 23.2.1 beschrieben kann ein transformationsbeschränkter Puls durch eine Kombination aus einem quadratischen Phasenmodulator und einem Chirpfilter komprimiert werden. Das Chirpfilter kann z. B. ein dispersives Medium sein, wie in Abb. 23.25 gezeigt. Wenn die Breite des anfänglichen Pulses 𝜏1 ist, ist die Modulation mit dem Phasenfaktor exp(i𝜁𝑡2 ) äquivalent zu einem Chirpparameter 𝑎1 = 𝜁𝜏12 . Die spektrale √ Breite des gechirpten Pulses wird um den Faktor
1 + 𝑎12 gedehnt. Wenn 𝜁 negativ ist, wird der Puls negativ gechirpt, und die anschließende Ausbreitung durch ein Medium mit positiver Gruppengeschwindigkeitsdispersion (normaler Dispersion) bewirkt eine Pulskompression auf die minimale Breite 𝜏 𝜏 𝜏0 = √ 1 = √ 1 . 1 + 𝑎12 1 + 𝜁 2 𝜏14
(23.84)
Der Puls wird auch komprimiert, wenn 𝜁 positiv ist und das Medium eine negative Gruppengeschwindigkeitsdispersion besitzt. Mithilfe der Gln. (23.81) und (23.84)
B
R
t pos. Gruppengeschwindigkeitsdispersion
Pulsbreite
QPM (neg.) τ (z) τ1
Chirpparameter
826
τ0
0 a(z) 0
f
z z
a1
Abb. 23.25 Pulskompression durch einen quadratischen Phasenmodulator und ein Medium mit Gruppengeschwindigkeitsdispersion.
erhalten wir für die Entfernung, bei der die minimale Breite erreicht wird, 𝑧min = −𝑎1 𝑧0 = − =−
2 π 𝜏02 π 𝜏 1 𝑎1 𝑎1 = − 𝐷𝜈 𝐷𝜈 1 + 𝑎2 1
𝜏14 π𝜁 , 𝐷𝜈 1 + 𝜁 2 𝜏4 1
(23.85)
die positiv ist, wenn 𝜁 und 𝐷𝜈 entgegengesetzte Vorzeichen haben. Im Grenzfall 𝑎1 = 𝜁𝜏12 ≫ 1 ist 𝜏0 ≈
𝜏1 1 = 𝑎1 𝜁𝜏1
(23.86)
und 𝑧min ≈ 𝑓 mit 𝑓=
π . −𝜁𝐷𝜈
(23.87)
Diese Entfernung kann als die Brennweite des fokussierenden Systems betrachtet werden. Beispiel 23-8: Pulskompression in einer Quarzglasfaser
(a) Ein Gaußpuls mit der Zeitkonstante 𝜏 = 100 fs und der zentralen Wellenlänge 𝜆0 = 850 nm (z. B. aus einem Ti-Saphir-Laser) breitet sich durch eine Quarzglasfaser aus. Bei dieser Wellenlänge hat Quarzglas normale Dispersion (positive Gruppengeschwindigkeitsdispersion) mit 𝐷𝜆 = −200 ps∕(km nm) (siehe Abb. 5.32) entsprechend 𝐷𝜈 = −(𝜆02 ∕𝑐0 )𝐷𝜆 = +4.82 × 10−25 s2 ∕m. Wenn der Puls zu Beginn ungechirpt ist, ist 𝜏0 = 100 fs und die Dispersionslänge beträgt 𝑧0 = π 𝜏02 ∕𝐷𝜈 = 6.52 cm. In √ dieser Entfernung ist der Puls um einen Faktor 2 gedehnt und hat einen Chirpparameter 𝑎 = 1. Bei einer Entfernung 𝑧 = 6.52 m ist die Pulsbreite um einen Faktor von ungefähr 𝑧∕𝑧0 = 100 auf 10 ps gedehnt, und der Chirpparameter ist 𝑎 = 100. (b) Wenn der Originalpuls mit einem Faktor exp(i𝜁𝑡2 ) phasenmoduliert ist, ist 𝑎1 = 𝜁𝜏2 . Für 𝜁 = −10−2 (fs)2 wird der Puls mit dem Parameter 𝑎 = −1 negativ gechirpt. Bei der anschließenden Ausbreitung durch die Faser wird der anfängliche 100 fs Puls bei einer Entfernung √ 𝑧min = −𝑎1 𝑧0 = π 𝜏02 ∕𝐷𝜈 = 3.26 cm auf 𝜏0 = 100∕ 2 = 77 fs komprimiert. Da der Puls jetzt schmaler ist, wird er bei seiner weiteren Ausbreitung durch die Faser schneller gedehnt. Bei der Entfernung 𝑧 = 6.52 m ist seine Breite um einen Faktor von etwa 𝑧∕𝑧0 ≈ 200 auf 14.1 ps gedehnt.
23.3 Pulsausbreitung in optischen Fasern
Übung 23-1: Dispersionskompensation in optischen Fasern
Die Pulsverbreiterung in einer optischen Faser kann beseitigt werden, indem normale und anomale Dispersion kombiniert werden. (a) Ein ungechirpter Puls der zentralen Wellenlänge 𝜆0 = 1.55 μm und der Breite 𝜏1 = 10 ps wird durch eine optische Quarzglasfaser geschickt. Bei dieser Wellenlänge zeigt Quarzglas anomale Dispersion mit 𝐷𝜆 = +20 ps∕(km nm). Bestimmen Sie die Impulslänge 𝜏 und den Chirpparameter 𝑎 bei einer Entfernung d 1 = 100 km. (b) Bestimmen Sie d 2 , wenn der Puls durch eine zweite Faser der Länge d 2 aus einem Material mit normaler Dispersion und 𝐷𝜆 = −100 ps∕(km nm) wieder auf seine ursprüngliche Breite von 10 ps komprimiert werden soll (siehe Abb. 23.26).
B
t
R
t
GGD (+)
t
τ
τ1
τ1
0 a(z)
1+ 2
1
0
z z
Abb. 23.26 Dispersionskompensation in optischen Fasern.
Übung 23-2: Dispersionskompensation durch eine periodische Reihe von Phasenmodulatoren
Die Pulsverbreiterung in einer optischen Faser kann durch eine periodische Anordnung von quadratischen Phasenmodulatoren in Abständen von 2d reduziert werden. Jeder der Modulatoren führt eine quadratische Phase exp(i𝜁𝑡2 ) ein. Wenn der Dispersionskoeffizient 𝜁 positiv ist und das Fasermaterial eine negative Gruppengeschwindigkeitsdispersion besitzt, nehmen die Impulsbreite und der Chirpparameter periodisch zu und ab, wie Abb. 23.27 illustriert. Zeigen Sie, dass die Bedingung für dieses periodische Muster durch
=−
2d ∕𝑧0 2𝑎 =− 2 𝜏2 𝜏0 [1 + (d ∕𝑧0 )2 ] π 𝜏04
[
2𝐷𝜈 d 1 + (𝐷𝜈 d ∕π 𝜏02 )2
]
4π 𝜕𝒜 1 𝜕𝒜 𝜕2 𝒜 +i ( + )=0 2 𝐷 𝑣 𝜕𝑡 𝜕𝑡 𝜕𝑧 𝜈
(23.89)
erfüllt. Wenn die Zeitverzögerung 𝑧∕𝑣 ignoriert wird (oder ein Koordinatensystem verwendet wird, das sich mit der Geschwindigkeit 𝑣 des Pulses bewegt), vereinfacht sich Gl. (23.89) zu (23.90)
die als Diffusionsgleichung bezeichnet wird.
–a
𝜁=−
In Abschnitt 23.3.1 haben wir gesehen, dass ein dispersives Medium, dessen Ausbreitungskonstante durch eine Taylorentwicklung bis zum quadratischen Term approximiert wird, einem Filter für die Einhüllende des Pulses mit der Übertragungsfunktion HE (𝑓) = exp(−i2π 𝑧𝑓∕𝑣) exp(−iπ 𝐷𝜈 𝑧𝑓 2 ) entspricht, wobei 𝑣 die Gruppengeschwindigkeit ist und 𝐷𝜈 der Dispersionskoeffizient. Wir zeigen nun, dass unter solchen Bedingungen die Einhüllende 𝒜(𝑧, 𝑡) die partielle Differentialgleichung
4π 𝜕𝒜 𝜕2 𝒜 +i = 0, 𝐷𝜈 𝜕𝑧 𝜕𝑡2
GGD (–)
τ(z)
23.3.3 Diffusionsgleichung für langsam variierende Einhüllende
(23.88)
gegeben ist, wobei 𝜏0 und 𝜏 die minimalen und maximalen Pulsbreiten sind, 𝑎 der Chirpparameter und 𝑧0 = π 𝜏02 ∕𝐷𝜈 .
Beweis: Diffusionsgleichung für langsam variierende Einhüllende in einem dispersiven Medium. Der Beweis beginnt mit der Filtergleichung 𝐴(𝑧, 𝑓) = 𝐴(0, 𝑓)H E (𝑧, 𝑓), woraus 𝐴(𝑧, 𝑓) ≈ 𝐴(0, 𝑓) exp[−i2π (𝑧∕𝑣)𝑓 − iπ 𝐷𝜈 𝑧𝑓 2 ] folgt, wobei 𝐴(𝑧, 𝑓) die Fouriertransformierte von 𝒜(𝑧, 𝑡) ist. Wir bilden die Ableitung nach 𝑧 und erhalten so die Differentialgleichung (d∕ d𝑧)𝐴(𝑧, 𝑓) ≈ [−i2π 𝑓∕𝑣 − iπ 𝐷𝜈 𝑓 2 ]𝐴(𝑧, 𝑓). Wir bilden die inverse Fouriertransformierte beider Seiten bezüglich 𝑓 und beachten, dass die inversen Fouriertransformierten von 𝐴(𝑧, 𝑓), i2π 𝑓𝐴(𝑧, 𝑓) und (i2π 𝑓)2 𝐴(𝑧, 𝑓) gleich 𝒜(𝑧, 𝑡), 𝜕𝒜(𝑧, 𝑡)𝜕𝑡 und 𝜕 2 𝒜(𝑧, 𝑡)𝜕𝑡2 sind; damit erhalten wir Gl. (23.89). Die zu der Diffusionsgleichung gehörende Impulsantwortfunktion ist ℎE (𝑡) = √
1 i𝐷𝜈 𝑧
exp (i
π𝑡2 ), 𝐷𝜈 𝑧
(23.91)
die mit Gl. (23.31) für ein Chirpfilter mit 𝑏 = 𝐷𝜈 𝑧∕π identisch ist. Für eine zu Beginn gaußsche Verteilung 𝒜(0, 𝑡) = 𝐴0 exp(−𝑡2 ∕𝜏02 ) besitzt die Diffusionsgleichung ei√ ne gaußsche Lösung 𝒜(𝑧, 𝑡) = 𝐴0 −i𝑧0 ∕(𝑧 − i𝑧0 ) × [ ] exp i(π∕𝐷𝜈 )𝑡2 ∕(𝑧 − i𝑧0 ) mit 𝑧0 = π 𝜏02 ∕𝐷𝜈 . Um die Zeitverzögerung zu berücksichtigen, ersetzen wir 𝑡 durch 𝑡 − 𝑧∕𝑣 und erhalten wieder Gl. (23.72).
827
828
23 Ultraschnelle Optik
Abb. 23.27 Dispersionskompensation durch einen periodischem positiven quadratischen Phasenmodulator und eine negative Gruppengeschwindigkeitsdispersion.
2 τ (z) τ1
QPM (+)
GGD(–)
QPM (+)
GGD(–)
QPM (+)
GGD(–)
QPM (+)
τ0
0
a(z) a 0 –a
Herleitung: Diffusionsgleichung für langsam variierende Einhüllende aus der Helmholtzgleichung Gleichung (23.89) kann auch direkt aus der Helm2 holtzgleichung [d ∕ d𝑧2 + 𝛽 2 (𝜈)]𝑉(𝑧, 𝜈) = 0 abgeleitet werden. Wegen 𝑈(𝑧, 𝑡) = 𝒜(𝑧, 𝑡) exp(−i𝛽0 𝑧) exp(i2π 𝜈0 𝑡) ist ihre Fouriertransformierte 𝑉(𝑧, 𝜈) = 𝐴(𝑧, 𝜈 − 𝜈0 ) exp(−i𝛽0 𝑧), wobei 𝐴(𝑧, 𝜈) die Fouriertransformierte von 𝒜(𝑧, 𝑡) ist. Wenn wir 𝜈 = 𝜈0 + 𝑓 einsetzen, ergibt die Helmholtzgleichung 2 [d ∕ d𝑧2 + 𝛽 2 (𝜈0 + 𝑓)][𝐴(𝑧, 𝑓) exp(−i𝛽0 𝑧)] = 0. Die Näherung der langsam variierenden Einhül2 lenden, d ∕ d𝑧2 [𝐴 exp(−i𝛽0 𝑧𝑡)] ≈ [−i2𝛽0 d𝐴∕ d𝑧 − 𝛽02 𝐴] exp(−i𝛽0 𝑧), macht aus der Helmholtzgleichung −i2𝛽0 d𝐴∕ d𝑧 + [𝛽 2 (𝜈0 + 𝑓) − 𝛽02 ]𝐴 = 0. Für schwache Dispersion gilt 𝛽 2 (𝜈0 + 𝑓) − 𝛽02 ≈ 2𝛽0 [𝛽(𝜈0 + 𝑓) − 𝛽0 ]. Wie zuvor approximieren wir die Ausbreitungskonstante 𝛽(𝜈) durch eine Taylorentwicklung mit drei Termen, 𝛽(𝜈0 + 𝑓) ≈ 𝛽0 + 2π 𝑓𝛽 ′ + 2π2 𝑓 2 𝛽 ′′ , wobei 2 𝛽0 = 𝛽(𝜔0 ), 𝛽 ′ = d𝛽∕ d𝜔|𝜔0 und 𝛽 ′′ = d 𝛽∕ d𝜔2 |𝜔0 ist. Damit wird die Helmholtzgleichung jetzt −i d𝐴∕ d𝑧 + [2π 𝑓𝛽 ′ + 2π2 𝑓 2 𝛽 ′′ ]𝐴 = 0. Nun führen wir eine inverse Fouriertransformation durch und beachten, dass die Multiplikatoren i2π 𝑓 und −4π2 𝑓 2 äquivalent zu den Ableitungen 𝜕∕𝜕𝑡 bzw. 𝜕 2 ∕𝜕𝑡2 sind; damit 1 erhalten wir −i𝜕𝐴∕𝜕𝑧 − i𝛽 ′ 𝜕𝐴∕𝜕𝑡 − 𝛽 ′′ 𝜕 2 𝐴∕𝜕𝑡2 = 0. 2 Schließlich setzen wir 𝛽 ′ = 1∕𝑣 und 𝛽 ′′ = 𝐷𝜈 ∕2π ein und gelangen so zu Gl. (23.89).
23.3.4 Analogie zwischen Dispersion und Beugung Zwischen der Diffusionsgleichung der langsam variierenden Einhüllenden, 𝜕 2 𝒜∕𝜕𝑡2 + i(4π∕𝐷𝜈 ) 𝜕𝒜∕𝜕𝑧 = 0, die die Ausbreitung eines Pulses 𝒜(𝑧, 𝑡) in einem dispersiven Medium beschreibt (in einem mit der Geschwindigkeit 𝑣 bewegten Koordinatensystem und unter Vernachlässigung von höheren Dispersionstermen als dem quadratischen), und der paraxialen Helmholtzgleichung ∇2t 𝐴 − i(4π∕𝜆) 𝜕∕𝜕𝑧 = 0, die die Beugung eines optischen Strahls 𝐴(𝑥, 𝑦, 𝑧) im Vakuum in der par-
z
z
axialen Näherung beschreibt, besteht eine bemerkenswerte mathematische Ähnlichkeit. Beide sind Diffusionsgleichungen (die eine eindimensional und die andere zweidimensional). Diese Ähnlichkeit ist ein Hinweis darauf, dass die zeitliche Verbreiterung (Dispersion) eines Pulses bei seiner Ausbreitung durch das dispersive Medium denselben mathematischen Gesetzen gehorcht wir die räumliche Verbreiterung (Beugung) eines Strahls in transversaler Richtung während seiner Ausbreitung durch ein Vakuum, wobei die Zeit 𝑡 die Rolle der transversalen Koordinate 𝜌 = (𝑥, 𝑦) übernimmt und der Dispersionskoeffizient −𝑑𝜈 die Rolle der Wellenlänge 𝜆. Diese Analogie ist in Tabelle 23.3 übersichtlich zusammengefasst. Die Analogie zwischen dem Dispersionskoeffizienten −𝐷𝜈 und der Wellenlänge 𝜆 wird noch deutlicher, wenn die Zeit 𝑡 in Einheiten der mit Lichtgeschwindigkeit zurückgelegten Entfernung 𝑐𝑡 gemessen wird. In diesem Fall hat 𝑐2 𝐷𝜈 die Einheit einer Entfernung und seine Rolle bei der Festlegung der Skala der Pulsdispersion ist der Rolle der Wellenlänge bei der Bestimmung der Skala der Beugung nun auch quantitativ ähnlich. Für 𝐷𝜈 = 10−23 s2 ∕m ist beispielsweise 𝑐2 𝐷𝜈 ≈ 0.9 μm entsprechend 3 fs. Eine andere interessante Analogie verknüpft die Rolle einer Linse bei der Änderung der Krümmung einer Wellenfront und die eines quadratischen Phasenmodulators beim Chirpen eines Pulses. Eine dünne Linse führt einen Phasenfaktor exp(iπ𝜌2 ∕𝜆𝑓) ein [siehe Gl. (2.40)], während ein quadratischer Phasenmodulator einen Phasenfaktor exp(i𝜁𝑡2 ) einführt (siehe Abschnitt 23.2.3). Wenn wir exp(i𝜁𝑡2 ) = exp[iπ 𝑡2 ∕(−𝐷𝜈 𝑓)] mit 𝜁 = −π𝐷𝜈 𝑓 schreiben, sehen wir, dass der quadratische Phasenmodulator äquivalent zu einer zeitlichen Linse ist, die den Puls bei 𝑧 = 𝑓 auf seine minimale Breite komprimiert, wobei 𝑓 = π∕(−𝐷𝜈 𝜁) eine Brennweite ist; dies bestätigt Gl. (23.87). Die mathematische Analogie zwischen der zeitlichen Verbreiterung eines Gaußpulses in einem dispersiven Medium (Abschnitt 23.3.2) und der räumlichen Verbreiterung eines Gaußstrahls im Vakuum (Kapitel 3) ist in
23.3 Pulsausbreitung in optischen Fasern
Tab. 23.3 Vergleich zwischen Beugung im Raum (in paraxialer Näherung) und Dispersion in einem dispersiven Medium (Näherung zweiter Ordnung). Der Dispersionskoeffizient −D𝜈 in der Pulsdispersion spielt die Rolle des Wellenlänge 𝜆 in der Beugung. Der quadratische Phasenmodulator ist das Analogon einer zeitlichen Linse. Beugung
Dispersion
𝐴(𝜌, 𝑧) √ 𝜌 = 𝑥2 + 𝑦2
komplexe Einhüllende
𝒜(𝑧, 𝑡)
transversale Koordinate
Zeit
𝑡
axiale Koordinate
𝑧
axiale Koordinate
𝑧
paraxiale Helmholtzgleichung
∇2t 𝐴 − i
Diffusionsgleichung (bewegtes Koordinatensystem)
4π 𝜕𝒜 𝜕2 𝒜 +i =0 𝐷𝜈 𝜕𝑧 𝜕𝑡 2
Wellenlänge
𝜆
Dispersionskoeffizient
−𝐷𝜈
Impulsantwortfunktion ℎE (𝜌)
π𝜌2 i exp (−i ) 𝜆𝑧 𝜆𝑧
Impulsantwortfunktion ℎE (𝑡)
√
Linse
exp(iπ𝜌2 ∕𝜆𝑓)
quadratischer Phasenmudulator
exp(i𝜁𝑡 2 )
Brennweite
𝑓
Brennweite
𝑓 = π∕(−𝐷𝜈 𝜁)
komplexe Einhüllende
4π 𝜕 =0 𝜆 𝜕𝑧
1 i𝐷𝜈 𝑧
exp (i
π𝑡 2 ) 𝐷𝜈 𝑧
Tab. 23.4 Vergleich zwischen der Beugung eines Gaußstrahls im Vakuum und der Dispersion eines Gaußpulses in einem dispersiven Medium. Gaußstrahl
Gaußpuls
Breite
𝑊(𝑧) = 𝑊0 1 + (𝑧∕𝑧0 )2
Breite
√ 𝜏(𝑧) = 𝜏0 1 + (𝑧∕𝑧0 )2
Beugungslänge
𝑧0 = π 𝑊02 ∕𝜆
Dispersionslänge
|𝑧0 | = π 𝜏02 ∕|𝐷𝜈 |
Divergenzwinkel
𝜃0 = 𝜆∕π𝑊0
Verbreiterungsgeschwindigkeit
|𝐷𝜈 |∕π 𝜏0
Wellenfrontkrümmung räumlicher Chirp
√
1 𝑧 2π = 𝜆 𝑧2 + 𝑧2 𝑅(𝑧) 0 𝑊 2 (𝑧) 𝑧 (𝑧) = = 𝑧0 2𝑅(𝑧)
Tabelle 23.4 zusammengefasst. Die Dispersionslänge 𝑧0 ist analog zur Beugungslänge (Rayleighlänge) 𝑧0 . Während die zweite immer positiv ist, ist die erste so definiert, dass sie für normale Dispersion positiv und für anomale Dispersion negativ ist. Das erklärt das negative Vorzeichen in dem Parameter 𝑧0 , der in dem Ausdruck für die komplexe Einhüllende des Gaußpulses erscheint. Wegen der mathematischen Analogie zwischen räumlicher Beugung und zeitlicher Dispersion bzw. zwischen der Linse und dem quadratischen Phasenmodulator existiert zu jedem konventionellen optischen System aus Kombinationen von Vakuum und Linsen ein analoges zeitliches System aus Kombinationen von dispersiven Medien und quadratischen Phasenmodulatoren. Einige Beispiele sind in Abb. 23.28 aufgeführt. Es gilt: • Die zeitliche Verbreiterung eines Pulses in einem dispersiven Medium ist analog zur räumlichen Beugung eines Strahls oder einer durch eine Öffnung transmittierten Welle.
Chirprate Chirpparameter
𝑧 2π 𝐷𝜈 𝑧 2 + 𝑧 2 0 1 𝑧 (𝑧) = 𝜑′′ 𝜏 2 (𝑧) = 2 𝑧0 𝜑′′ =
• Die zeitliche Kompression eines Pulses durch einen quadratischen Phasenmodulator ist analog zur räumlichen Fokussierung eines Strahls durch eine Linse. Da ein Gaußstrahl durch eine Linse der Brennweite 𝑓 auf einen Durchmesser 𝑊1 = (𝜆∕π𝑊0 )𝑓 fokussiert wird, folgt aus dieser Analogie beispielsweise, dass ein Gaußpuls durch einen quadratischen Phasenmodulator auf eine zeitliche Breite 𝜏1 = 1∕𝜁𝜏0 = (−𝐷𝜈 ∕π𝜏0 )𝑓 komprimiert wird, wobei 𝑓 = π∕(−𝐷𝜈 𝜁) die Brennweite des Phasenmodulators ist. Ein anderes Beispiel für die zeitliche Fokussierung durch einen Phasenmodulator ist die Fokussierung zweier getrennter schmaler Pulse bei 𝑧 = 0 in einen einzigen Puls bei 𝑧 = 𝑓. • Das Gegenstück zur Bildgebung mit einer einzelnen Linse in der herkömmlichen Optik ist ein System, das einen quadratischen Phasenmodulator als zeitliche Linse benutzt, die eine vergrößerte oder verkleinerte Kopie des zeitlichen Pulsprofils erzeugt, d. h. ein zeitliches Bild (siehe Aufgabe 23-6).
829
23 Ultraschnelle Optik
räumliche Optik (a) Verbreiterung
x
zeitliche Optik t
W
W0
τ
τ0
z
z GGD
t
(b) Fokussierung
x W
τ
W0
x
τ0
z
z GGD (–)
QPM (+)
Linse
(c) Abbildung (d) Weiterleitung (e) Fouriertransformation
830
t
W
W2
W1
τ
τ1
τ2
z
z GGD (–) QPM (+)
Linse
x
GGD (–)
t z
z Linse
x
Linse
QPM (+) QPM (+) QPM (+) GGD (–) GGD (–)
Linse
t
f
f
f
f
z Linse
z e i cos Ωt
QPM (+) GGD (–) GGD (–)
Abb. 23.28 Die Analogie zwischen der räumlichen Optik (linke Spalte) und der zeitlichen Optik (rechte Spalte). Der quadratische Phasenmodulator spielt die Rolle der Linse. Die schattierten Flächen bezeichnen die räumliche Breite einer Welle (links) bzw. die zeitliche Breite eines Pulses (rechts) als Funktionen von z. In der rechten Spalte werden Zeitverzögerungen ignoriert, nur die zeitliche Verbreiterung ist gezeigt.
Es ist angenommen, dass sich der optische Puls (rechts) in einem Medium mit negativer Gruppengeschwindigkeitsdispersion ausbreitet. Die Abbildungen sind auch für ein Medium mit positiver Gruppengeschwindigkeitsdispersion anwendbar, aber dann muss der quadratische Phasenmodulator negativ sein.
• Eine periodische Abfolge von quadratischen Phasenmodulatoren, die die Breite eines Pulses erhalten, entspricht einer periodischen Anordnung von Linsen. • Das Gegenstück zu einem 2𝑓-FT-System (siehe Abschnitt 4.2) ist ein zeitliches 2𝑓-FT-System mit einem quadratischen Phasenmodulator. Das System wandelt z. B. einen phasenmodulierten optischen Puls in einen amplitudenmodulierten Puls um, dessen zeitliches Profil die Fouriertransformierte des ursprünglichen Pulses ist.
Ein wesentlicher Unterschied zwischen der räumlichen Beugung und der zeitlichen Dispersion ist, dass die Wellenlänge 𝜆 immer positiv ist, während ihr Gegenstück −𝐷𝜈 positiv oder negativ sein kann. Die Implikationen dieses Unterschieds werden deutlich, wenn man die Impulsantwortfunktionen in Tabelle 23.3 näher untersucht. Die Tatsache, dass die Wellenlänge 𝜆 immer positiv ist, bedeutet, dass sich ein Lichtpunkt immer zu einer divergierenden Phasenfront (einer Kugelwelle) verbreitern muss. Analog verbreitert sich ein Licht-
23.4 Ultraschnelle lineare Optik
puls in einem Medium mit negativem 𝐷𝜈 (d. h. positivem −𝐷𝜈 ) zu einem negativ gechirpten Puls. Dagegen verbreitert sich ein Lichtpuls in einem Medium mit positivem 𝐷𝜈 (d. h. normaler Dispersion) zu einem positiv gechirpten Puls. Beide Vorzeichen des Chirps sind erlaubt, wohingegen die räumliche Beugung nur divergierende Wellen erlaubt.
die Gruppengeschwindigkeit 𝑣 = 𝑐0 ∕𝑁 anstatt die Phasengeschwindigkeit 𝑐 = 𝑐0 ∕𝑛 beziehen, wobei 𝑁 = 𝑛 − 𝜆 d𝑛∕ d𝜆 der Gruppenindex ist [Gl. (5.139)]. Eine Abschätzung der Verbreiterung eines optischen Pulses beim Durchgang durch ein optisches System erfordert daher die Bestimmung der Differenz zwischen der längsten und der kürzesten Gruppenlaufzeit für alle möglichen optischen Pfade.
23.4 Ultraschnelle lineare Optik
Pulsverbreiterung in einem einlinsigen abbildenden System
Die räumlichen und zeitlichen Eigenschaften von gepulsten Wellen sind inhärent gekoppelt. Eine räumliche Verbreiterung oder Fokussierung hängt von dem anfänglichen zeitlichen Profil ab, und die zeitliche Pulsform wird von der anfänglichen räumlichen Verteilung beeinflusst. Diese Effekte sind für ultraschmale Pulse und für optische Systeme mit Winkeldispersion besonders ausgeprägt. Nur in besonderen Fällen behält eine gepulste Welle während der Ausbreitung exakt dasselbe zeitliche Profil bei (z. B. eine ebene Welle oder eine Kugelwelle; siehe Abschnitt 23.1.3). Für Pulse mit einer langsam variierenden Einhüllenden ist die quasikontinuierliche Näherung anwendbar, woraufhin die zeitlichen und räumlichen Änderungen näherungsweise entkoppelt werden; diese Näherung ist jedoch für ultraschmale Pulse nicht anwendbar. Im folgenden Abschnitt betrachten wir Ausbreitung von ultraschmalen gepulsten Strahlen in einfachen bildgebenden Systemen. Wir beginnen mit einer vereinfachten Analyse auf der Grundlage der Strahlenoptik und fahren anschließend mit einer wellenoptischen Theorie fort, die einen fourieroptischen Ansatz verwendet.
In dem in Abb. 23.29 illustrierten einlinsigen abbildenden System wird ein optischer Puls am Punkt P1 in mehreren Strahlen emittiert, die sich im konjugierten Punkt P2 treffen. Jeder Strahl breitet sich durch die Luft und das Glas aus und wird entsprechend verzögert. Wenn das Glas nichtdispersiv ist, kommen gemäß dem fermatschen Prinzip (Abschnitt 1.1) alle Strahlen zur gleichen Zeit an, und der Puls wird nicht verbreitert. Um die Wirkung der Dispersion zu berücksichtigen, ist es zweckmäßig, die differentielle Verzögerung als Differenz zwischen der Gruppenlaufzeit (Gruppengeschwindigkeit 𝑣) und der Phasenverzögerung (Phasengeschwindigkeit 𝑐) zu definieren. Die Differenz zwischen den längsten und kürzesten differentielle Verzögerungen gibt dann die Pulsverbreiterung an. Die differentielle Verzögerung ist für die nichtdispersiven Teile des optischen Pfads natürlich null, sodass wir uns nur mit der differentiellen Verzögerung in den Linsen beschäftigen müssen. Wir beschreiben jeden Strahl durch seinen Ort (𝑥, 𝑦) in der Linsenebene und bezeichnen die Dicke der Linse am Ort (𝑥, 𝑦) mit d (𝑥, 𝑦); damit erhalten wir für die differentielle Verzögerung
23.4.1 Strahlenoptik In der Strahlenoptik wird Licht durch Strahlen beschrieben, die an optischen Grenzflächen reflektiert und gemäß dem snelliusschen Gesetz (Abschnitt 1.1) gebrochen werden. Zeitliche Effekte kommen in dieser Theorie insofern vor, als die Strahlen sich mit einer vom Medium abhängigen Geschwindigkeit 𝑐 = 𝑐0 ∕𝑛 ausbreiten. Wir hatten diese Theorie in Abschnitt 10.3.2 verwendet, um die Verbreiterung der Ankunftszeit von optischen Strahlen beim Durchgang durch eine optische Faser abzuschätzen, indem wir die Ausbreitungszeit für jeden der optischen Pfade bestimmt und die Differenz zwischen den längsten und kürzesten Verzögerungen berechneten. Wenn einige der Komponenten des optischen Systems aus dispersiven Materialien bestehen, muss die durch diese Komponenten eingeführte Verzögerung sich auf
|| 1 1 || |𝑛 − 𝑁| d (𝑥, 𝑦) . (23.92) Δ𝜏(𝑥, 𝑦) = ||| − ||| d (𝑥, 𝑦) = 𝑐0 |𝑐 𝑣| Die Pulsbreite ist die Differenz zwischen dem maximalen und minimalen Wert von 𝜏(𝑥, 𝑦), also Δ𝜏(𝑥, 𝑦) = |𝑛 − 𝑁|
Δd , 𝑐0
(23.93)
wobei Δd die Differenz zwischen der maximalen und minimalen Dicke der Linse ist. Für eine dünne Linse mit
(x,y)
Δτ
t P1
t P2
Abb. 23.29 Die Pulsverbreiterung in einem einlinsigen abbildenden System aufgrund der (chromatischen) Materialdispersion.
831
832
23 Ultraschnelle Optik
der Brennweite 𝑓 und der maximalen Dicke d 0 verwenden wir die Gln. (2.37) und (2.41) und erhalten d (𝑥, 𝑦) = d 0 − (𝑥2 + 𝑦 2 )∕2𝑅 = d 0 − (𝑥2 + 𝑦 2 )∕2(𝑛 − 1)𝑓, sodass Δd = (𝐷∕2)2 ∕2(𝑛 − 1)𝑓 ist, wenn 𝐷 der Durchmesser der Linse ist. Folglich ist Δ𝜏 = [|𝑛 − 𝑁|∕(𝑛 − 1)](𝐷∕2)2 ∕2𝑐0 𝑓 und daher Δ𝜏 =
|𝑛 − 𝑁| 1 𝑓 , 𝑛 − 1 8𝐹 2 𝑐0
(23.94)
#
wobei 𝐹# = 𝑓∕𝐷 die Blendenzahl der Linse ist. Für eine Linse aus BK7-Glas bei 𝜆 = 400 nm ist 𝑛 = 1.53 und 𝑛 − 𝑁 = 𝜆 d𝑛∕ d𝜆 = −0.052. Für 𝑓 = 30 mm und 𝐹# = 2 wird der Puls auf eine Breite Δ𝜏 ≈ 307 fs verbreitert. In diesem System ist die Pulsverbreiterung ein Ergebnis der differentiellen Materialdispersion auf den zahlreichen räumlichen Pfaden der Strahlen. Ohne Materialdispersion verursacht die Existenz unterschiedlicher Pfade dank des fermatschen Prinzips keine Pulsverbreiterung.
23.4.2
Wellen- und Fourieroptik
Die Wellennatur des Lichts bedingt, dass sich ein monochromatischer schmaler optischer Strahl zu einem Kegel erweitert, dessen Öffnungswinkel direkt proportional zur Wellenlänge und umgekehrt proportional zum ursprünglichen Strahlradius ist. Wenn der Strahl mit einem ultrakurzen Puls mit einem breiten Spektrum moduliert ist, erweitert sich jede seiner Komponenten in ihren eigenen Kegel, wobei die Kegel der Komponenten mit kleinen Wellenlängen kleinere Öffnungswinkel besitzen. Folglich verändert sich die spektrale Zusammensetzung des Lichts im Raum, wobei Punkte in größerer Entfernung von der Achse weniger Energie bei kleinen Wellenlängen erhalten, wie in Abb. 23.30 dargestellt ist. Abseits der Achse wird das Spektrum daher zu einer kleineren Mittenfrequenz verschoben (Rotverschiebung) und die spektrale Breite wird bei gleichzeiti-
ger Pulsverbreiterung komprimiert. Dieses Beispiel demonstriert, dass die räumlichen und zeitlichen Eigenschaften des Lichts durch die Wellenausbreitung an sich miteinander verflochten sind, vor allem wenn der Strahl sehr schmal ist und der Puls sehr kurz ist. Obwohl die Ausbreitung von ultrakurzen Lichtpulsen durch beliebige optische Systeme durch die intrinsische Kopplung von Raum und Zeit kompliziert wird, ist die Analyse für lineare Systeme begrifflich einfach, da die Aufgabe durch einen Fourieransatz stets auf eine Superposition von Lösungen für jede der konstituierenden monochromatischen Komponenten reduziert werden kann. Dabei wird eine beliebige gepulste Welle 𝑈(r, 𝑡) in eine Summe von monochromatischen Komponenten mit Amplituden zerlegt, die durch die Fouriertransformation 𝑉(r, 𝜈) = ∫ 𝑈(r, 𝑡) exp(i2π 𝜈𝑡) d𝑡 gegeben sind. Die Ausbreitung jeder monochromatischen Komponente durch das System wird mithilfe der Werkzeuge aus den Kapiteln 3 und 4 bestimmt und die gesamte Lösung wird anschließend durch Superposition berechnet, d. h. durch die inverse Fouriertransformation 𝑈(r, 𝑡) = ∫ 𝑉(r, 𝜈) exp(−i2π 𝜈𝑡) d𝜈. Fourieroptik von gepulsten Wellen
Die Ausbreitung von monochromatischem Licht zwischen zwei parallelen Ebenen 1 und 2, zwischen denen sich ein beliebiges lineares optisches System befindet, wird allgemein durch die lineare Transformation 𝑉2 (𝑥, 𝑦, 𝜈) = ∬ ℎ(𝑥, 𝑥′ , 𝑦, 𝑦 ′ , 𝜈) 𝑉1 (𝑥′ , 𝑦 ′ , 𝜈) d𝑥′ d𝑦 ′ (23.95) beschrieben, wobei ℎ die Impulsantwortfunktion des Systems bei der Frequenz 𝜈 ist (siehe Kapitel 4). Für eine gepulste Eingangswellenfunktion 𝑈1 (𝑥, 𝑦, 𝑡) kann die Wellenfunktion 𝑈2 (𝑥, 𝑦, 𝑡) am Ausgang leicht bestimmt werden, indem man die Fouriertransformierte 𝑉2 (𝑥, 𝑦, 𝜈) berechnet, Gl. (23.95) benutzt und anschließend eine inverse Fouriertransformation durchführt. (ν)
x (ν) R
R
R
B
B
ν
B ν
z
(ν) R
B ν
Abb. 23.30 Verbreiterung eines gepulsten Strahls. Die Komponenten bei großen Wellenlängen (R) breiten sich in Kegeln mit größeren Öffnungswinkeln aus als die Komponenten bei kleinen Wellenlängen (B). Das bewirkt eine Abschwä-
chung der kurzwelligen Komponenten an Punkten abseits der Achse und daher eine Rotverschiebung und eine von einer Pulsverbreiterung begleitete Kompression der spektralen Breite.
23.4 Ultraschnelle lineare Optik
Die Impulsantwortfunktion ℎ hatten wir in Kapitel 4 für verschiedene optische Komponenten bestimmt. Wir geben hier nur die Ergebnisse an, wobei wir die Abhängigkeit von der Frequenz 𝜈 explizit ausschreiben: Nach Gl. (4.18) entspricht eine Ausbreitung über eine Entfernung 𝑧 im Vakuum in der Fresnelnäherung einem System mit der Impulsantwortfunktion
Vakuum
′
Optische Fouriertransformation
Als Beispiel betrachten wir ein optisches System, in dem sich eine monochromatische Welle zwischen der vorderen und hinteren Brennebene einer Linse ausbreitet. Wenn wir die 𝑦-Abhängigkeit der Einfachheit halber vernachlässigen, ist die Impulsantwortfunktion dieses Systems ℎ(𝑥, 𝑥′ , 𝜈) ≈ ℎ𝑙 exp (−i
′
ℎ(𝑥, 𝑥 , 𝑦, 𝑦 , 𝜈) ≈ i𝜈 2π𝜈 (𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 exp [−i ] . (23.96) 𝑐𝑧 𝑐 2𝑧 Dabei haben wir den Faktor exp(−i2π 𝜈𝑧∕𝑐) ignoriert, der in Gl. (4.21) zu ℎ0 gehört, da er nur eine irrelevante konstante Zeitverzögerung 𝑧∕𝑐 beschreibt. Blende Der Durchgang durch eine ebene Blende entspricht einer Multiplikation mit der Blendenfunktion [die gemäß Gl. (4.35) gleich eins innerhalb der Blende und null außerhalb ist]. Linse Der Durchgang durch eine Linse der Brennweite 𝑓 entspricht nach den Gln. (2.43) und (2.45) einer Multiplikation mit dem quadratischen Phasenfaktor 𝑡(𝑥, 𝑦, 𝜈) ≈ exp (−i𝑛
2π 𝜈 𝜌2 2π 𝜈 d 0 ) exp (i ), 𝑐0 𝑐0 2𝑓 (23.97)
√
wobei 𝜌 = 𝑥2 + 𝑦 2 die radiale Entfernung von der Achse ist und die Brennweite 𝑓 durch 1 1 1 = (𝑛 − 1) ( − ) 𝑅1 𝑅2 𝑓
(23.98)
gegeben ist, wenn 𝑅1 und 𝑅2 die Radien der sphärischen Linse sind. Wenn der Brechungsindex 𝑛 des Linsenmaterials wellenlängenabhängig ist, hängt auch 𝑓 von der Frequenz 𝜈 ab. Materialdispersion bewirkt eine chromatische Aberration, die bei der Verzerrung von ultrakurzen optischen Pulsen eine wichtige Rolle spielt. Mithilfe dieser Gleichungen kann man im Prinzip die Abhängigkeit der Ausgangswelle von Raum und Zeit für jede gepulste Eingangswelle und für jedes System aus Vakuum, Linsen und Blenden bestimmen. f
Eingangspuls (t)
𝑉2 (𝑥, 𝜈) ∝ i𝜈𝐺(𝜈)𝑃(𝜈𝑥∕𝑐𝑓) ,
Raumlichtmodulator
f
Ausgangspuls
x Linse
Fourierebene
(23.100)
wobei 𝑃(𝜈𝑥 ) = ∫ 𝑝(𝑥) exp(i2π 𝜈𝑥 𝑥)d𝑥 die räumliche Fouriertransformierte von 𝑝(𝑥) ist. Aus Gl. (23.100) ist ersichtlich, dass das Ausgangsfeld nicht mehr räumlich-zeitlich separierbar ist. Die zeitliche Wellenform des Feldes an einem festen Ort 𝑥0 in der Ausgangsebene ist durch Gl. (23.100) gegeben, sodass die Übertragungsfunktion des linearen Systems,
t p(x)
(23.99)
mit einer Konstanten ℎ𝑙 = i𝜈𝑐𝑓 exp(−i4π 𝜈𝑓∕𝑐) [siehe Gl. (4.29)]; für monochromatisches Licht entspricht dies einer räumlichen Fouriertransformation (siehe Abschnitt 4.2). Dieses System zeigt eine starke räumlichzeitliche Kopplung; d. h. die zeitliche Wellenform an einem festen Punkt in der Ausgangsebene wird durch die räumliche Verteilung der Welle in der Eingangsebene beeinflusst. Umgekehrt hängt die räumliche Verteilung in der Ausgangsebene von der zeitlichen Wellenform des Eingabefelds ab. Um diesen Punkt deutlich zu machen, betrachten wir einen Spezialfall, für den die Wellenfunktion am Eingang räumlich und zeitlich separierbar ist, 𝑈1 (𝑥, 𝑡) = 𝑔(𝑡)𝑝(𝑥). Zum Beispiel kann dazu eine gepulste ebene Welle der Amplitude 𝑔(𝑡) durch einen räumlichen Lichtmodulator mit der frequenzunabhängigen Transmission 𝑝(𝑥) geschickt werden, wie Abb. 23.31 illustriert. Die Fouriertransformierte von 𝑈1 (𝑥, 𝑡) ist 𝑉1 (𝑥, 𝜈) = 𝐺(𝜈)𝑝(𝑥), wobei 𝐺(𝜈) die Fouriertransformierte von 𝑔(𝑡) ist. Wenn wir 𝑉1 (𝑥, 𝜈) = 𝐺(𝜈)𝑝(𝑥) und die Impulsantwortfunktion des optischen Systems aus Gl. (23.99) in Gl. (23.95) einsetzen, erhalten wir für das Feld in der Ausgangsebene
x0 t
2π 𝜈 ′ 𝑥𝑥 ) 𝑐𝑓
Abb. 23.31 Eine räumliche Fouriertransformation verknüpft die zeitlichen und räumlichen Verteilungen des gepulsten Lichts am Eingang. Die Form des Ausgangspulses an einem festen Ort wird von der räumlichen Verteilung am Eingang bestimmt, die durch den räumlichen Lichtmodulator gesteuert wird (siehe Abschnitt 21.1.5).
833
834
23 Ultraschnelle Optik
das 𝑈2 (𝑥0 , 𝑡) mit dem Eingabepuls 𝑔(𝑡) verknüpft, gleich 𝐻(𝜈) ∝ i𝜈𝑃(𝜈𝑥0 ∕𝑐𝑓)
(23.101)
ist. Diese zeitliche Übertragungsfunktion ist eine skalierte Version der räumlichen Fouriertransformierten der räumlichen Verteilung 𝑝(𝑥) am Eingang. Die entsprechende zeitliche Impulsantwortfunktion erhalten wir durch eine zeitliche inverse Fouriertransformation auf beiden Seiten von Gl. (23.101), ℎ(𝑡) ∝ 𝑝(𝑡𝑐𝑓∕𝑥0 ) ,
(23.102)
sodass der Wert der Funktion ℎ(𝑡) zur Zeit 𝑡 von der Transmission des räumlichen Lichtmodulators an genau einem Ort 𝑥 = (𝑐𝑓∕𝑥0 )𝑡 kontrolliert wird. Entsprechend kontrolliert die Transmission der Maske an einem Punkt 𝑥 den Wert der Impulsantwortfunktion des Systems zu genau einer Zeit 𝑡 = (𝑥0 ∕𝑐𝑓)𝑥. Das System bewirkt somit eine direkte Raum-Zeit-Abbildung, die für die Pulsformung verwendet werden kann. Ein ähnliches pulsformendes System aus einer Kombination eines Beugungsgitters und eines räumlichen Lichtmodulators hatten wir in Abschnitt 23.2.4 besprochen.
23.4.3
Gaußgepulster Gaußstrahl
Wenn die Originalwelle mit einem Gaußpuls 𝑔(𝑡) = exp(−𝑡2 ∕𝜏02 ) exp(i2π 𝜈0 𝑡) moduliert wird, ist 𝐺(𝜈) ∝ exp[−π2 𝜏02 (𝜈 − 𝜈0 )2 ] ebenfalls eine Gaußfunktion. Einen genäherten analytischen Ausdruck für 𝑉2 (𝑥, 𝑦, 𝜈) im Fernbereich [𝑧 ≫ 𝑧0 (𝜈) für alle 𝜈] kann wie folgt erhalten werden: Der Faktor [𝑧 + i𝑧0 (𝜈)]−1 = 𝑧−1 [1 + i𝑧0 (𝜈)∕𝑧]−1 im Exponenten von Gl. (23.103) wird durch 𝑧−1 [1 − i𝑧0 (𝜈)∕𝑧] approximiert, und denselben Faktor in der Amplitude schreiben wir näherungsweise als 𝑧−1 . Mithilfe von (23.104) erhalten wir für den Fernbereich [ ] 𝑉2 (𝑥, 𝑦, 𝜈) ∝ i𝜈 exp −π2 𝜏02 (𝜈 − 𝜈0 )2
Optik von Strahlbündeln
Der in Abschnitt (23.4.2) beschriebene Fourieransatz kann auch auf die Untersuchung von gepulsten Gaußstrahlen angewandt werden. Wir betrachten dazu zuerst einen Gaußstrahl, der in der Ebene seiner Taille mit einem Puls 𝑔(𝑡) moduliert ist, d. h. 𝑈1 (𝑥, 𝑦, 𝑡) = 𝑔(𝑡) exp(−𝜌2 ∕𝑊02 ) oder 𝑉1 (𝑥, 𝑦, 𝑡) ∝ 𝐺(𝜈) exp(−𝜌2 ∕𝑊02 ), wobei 𝑊0 der Strahlradius ist und 𝐺(𝜈) die Fouriertransformierte von 𝑔(𝑡). Die räumlich-zeitliche Wellenfunktion in einer beliebigen Entfernung 𝑧 bestimmen wir aus den Gln. (23.95) und (23.96), 𝑉2 (𝑥, 𝑦, 𝜈) ∝ 𝜈 𝐺(𝜈)
Wenn die spektrale Breite hinreichend klein ist, können wir die räumliche Verteilung des Gaußstrahls in der quasikontinuierlichen Näherung durch ihren Wert bei der Mittenfrequenz 𝜈 ≈ 𝜈0 approximieren, wodurch die Raum-Zeit-Abhängigkeit separierbar wird, wie in Gl. (23.24) beschrieben. Für ultraschmale (d. h. breitbandige) Pulse ist diese Näherung nicht anwendbar. Das zeitliche Profil des Pulses kann an einem beliebigen Punkt (𝜌, 𝑧) bestimmt werden, indem die inverse Fouriertransformierte von Gl. (23.103) berechnet wird. Im allgemeinen Fall muss dies numerisch durchgeführt werden.
i𝑧0 (𝜈) 𝜌2 π𝜈 exp (−i ), 𝑐 𝑧 + i𝑧0 (𝜈) 𝑧 + i𝑧0 (𝜈)
× exp (−π2
𝑧0 (𝜈) =
exp [−
π𝑁𝜌2
(
𝜌2 +𝜌02
)
1 + 𝜌2 ∕𝜌02
𝑡2
]
exp [− 𝜌2 ] 𝜏𝜌
1 + i𝑡𝜌 ∕π𝑁𝜏0
× exp(−i2π 𝜈𝜌 𝑡𝜌 )
(23.104)
die Beugungslänge (Rayleighlänge) bei der Frequenz 𝜈 ist. Gleichung (23.103) ist der übliche Ausdruck für die Wellenfunktion eines Gaußstrahls [siehe Gl. (3.5)] mit explizit ausgeschriebener Frequenzabhängigkeit der Beugungslänge. Der Strahl- und der Krümmungsradius sind nach den Gln. (3.8) und (3.9) ebenfalls frequenzabhängig.
𝜌2 ). 2𝑐𝑧
Nun können wir die inverse Fouriertransformierte von Gl. (23.105) bestimmen. Der Phasenfaktor im Exponenten entspricht einer Zeitverzögerung 𝜌2 ∕2𝑐𝑧. Der Faktor i𝜈 in der Amplitude ist äquivalent zu der Ableitung 𝜕∕𝜕𝑡. Die beiden mittleren Gaußfunktionen können zu einer einzigen Gaußfunktion von 𝜈 zusammengefasst werden, deren inverse Fouriertransformierte eine weitere Gaußfunktion ist. Das Ergebnis kann in der normierten Form
𝑈2 (𝑥, 𝑦, 𝑡) ∝ π 𝑊02 𝜈 𝑐
𝑐2 𝑧2
𝜈2 ) exp (−i2π 𝜈
(23.105)
(23.103) wobei
𝑊02 𝜌2
(23.106)
geschrieben werden; dabei ist 𝑡𝜌 = 𝑡 −
𝜌2 𝑧 𝜌2 = 𝑡 − π𝑁𝜏0 2𝑐𝑧 𝑧0 2𝜌2
(23.107)
0
eine ortsabhängige Laufzeitdifferenz, √ 𝜏𝜌 = 𝜏0 1 + 𝜌2 ∕𝜌02
(23.108)
23.4 Ultraschnelle lineare Optik
wird. Die spektrale Intensität S 2 (𝑥, 𝑦, 𝜈) = |𝑉2 (𝑥, 𝑦, 𝜈)|2 ist
eine ortsabhängige Zeitkonstante, 𝜈𝜌 =
𝜈0 1+
𝜌2 ∕𝜌02
=
𝑁∕𝜏0
(23.109)
1 + 𝜌2 ∕𝜌02
𝜌2 𝜈2 exp [−2π2 𝑁 2 ] 2 𝜈0 𝜌2 + 𝜌02
S 2 (𝑥, 𝑦, 𝜈) ∝
eine ortsabhängige Mittenfrequenz, 𝑁 = 𝜈0 𝜏0
× exp [−2π2 𝑁 2
(23.110)
die Zahl der optischen Perioden innerhalb der Breite 𝜏0 des anfänglichen Pulses, 𝜌0 = π 𝑁𝑊(𝑧) = π 𝑁𝑊0 𝑧∕𝑧0
(23.111)
mit 𝑊(𝑧) = 𝑊0 𝑧∕𝑧0 der Strahlradius im Fernbereich für eine kontinuierliche Welle bei der Mittenfrequenz 𝜈0 und 𝑧0 = π 𝑊02 ∕𝜆0 die zugehörige Beugungslänge. Als Funktion der normierten transversalen Entfernung 𝜌∕𝜌0 und der normierten Zeit 𝑡∕𝜏0 wird die Wellenfunktion im Fernbereich vollständig durch zwei freie Parameter, 𝑁 und das Verhältnis 𝑧∕𝑧0 , beschrieben. Die Intensität 𝐼2 (𝑥, 𝑦, 𝑡) = |𝑈2 (𝑥, 𝑦, 𝑡)|2 ist exp [−
2π 𝑁𝜌2
2𝑡 2
] exp [− 2𝜌 ] 𝜏𝜌 (𝜌2 +𝜌02 ) . (23.112) 2 2 2 2 1 + 𝜌 ∕𝜌0 1 + 𝑡𝜌 ∕π 𝑁 2 𝜏02
𝐼2 (𝑥, 𝑦, 𝑡) ∝
Das ist eine allgemeine Funktion von 𝑡∕𝜏0 und 𝜌∕𝜌0 , die durch einen einzigen freien Parameter 𝑁 charakterisiert
(𝜈 − 𝜈𝜌 )2 𝜈𝜌2
],
(23.113)
der ebenfalls eine allgemeine Funktion von 𝜈∕𝜈0 und 𝜌∕𝜌0 ist und durch den freien Parameter 𝑁 charakterisiert wird. Aus den Gln. (23.106)–(23.113) können wir die folgenden Eigenschaften des Pulses an einem Punkt (𝜌, 𝑧) im Fernbereich erkennen (siehe Abb. 23.32): • Der Puls ist um die Zeit 𝜌2 ∕2𝑐𝑧 verzögert, die gleich der Dauer der Ausbreitung zwischen dem Strahlzentrum (0, 0) und dem Punkt (𝜌, 𝑧) ist. • Das zeitliche Profil des Pulses ist das Produkt einer Gaußfunktion der Breite 𝜏𝜌 = 𝜏0 [1 + 𝜌2 ∕𝜌02 ]1∕2 und einer Lorentzfunktion der Breite π 𝑁𝜏0 . Die Breite der Gaußfunktion ist 𝜏0 bei 𝜌 = 0 und nimmt mit der transversalen Entfernung 𝜌 zu, bis sie bei 𝜌 = 𝜌0 den Wert √ 2 𝜏0 erreicht. Die durch die Lorentzfunktion eingeführte Phasenverschiebung arctan(𝑡P ∕π 𝑁𝜏0 ) ist eine Manifestation des Gouyeffekts (siehe Abschnitt 3.1.2) für gepulste Gaußstrahlen. 2(ρ,ν)
B
I1(ρ,t) ρ
0.8
A
0.9
1
1.1
ν/ν0
I2(ρ,t) W0
τ0
t A
B
ρ/ρ0
z
0.25
0.5 0
–2
Abb. 23.32 Zeitliche und räumliche Verbreiterung eines mit einem Gaußpuls modulierten Gaußstrahls. Am Anfang hat der Strahl den Radius W0 und die zeitliche Breite 𝜏0 (linke 3D-Fläche). Die Intensität I2 (𝜌, t ) im Fernbereich ist in der rechten 3D-Fläche gezeigt. Die Zeit ist auf die anfängliche Pulsdauer 𝜏0 normiert, die transversale Entfernung auf 𝜌0 und die Intensität ist in willkürlichen Einheiten aufgetragen. Zu einer festen Zeit t gibt I2 (𝜌, t ) eine Momentaufnahme der Intensität als Funktion des Ortes. Sie hat zunächst bei t = 0 ein einzelnes Maximum, das bei t = 𝜏0 zu einem Doppelmaximum und bei t = 2𝜏0 und darüber schließlich zu zwei getrennten schwachen Peaks wird. Die Fläche zeigt auch das
0
2
4
t/τ0
zeitliche Profil an einem festen Ort. Im Strahlzentrum hat der Puls seine kleinste Breite. An Punkten abseits der Achse ist der Puls schwächer, verzögert und länger. Die spektrale Intensität S 2 (𝜌, 𝜈) ist für zwei Orte A und B als Funktion der normierten Frequenz 𝜈∕𝜈0 gezeigt (oben rechts) und so normiert, dass der Maximalwert an beiden Orten eins ist. In dieser Auftragung ist N = 𝜈0 𝜏0 = 5, d. h. der Puls enthält fünf optische Perioden. Für einen Puls der Mittenfrequenz 𝜈0 = 750 THz (𝜆0 = 400 nm) und der Breite 𝜏0 = 6.67 fs ist z. B. N = 5. Für W0 = 1 mm ist z0 = 7.85 m, W0 z∕z0 = 5 mm und 𝜌0 ≈ 8 cm.
835
836
23 Ultraschnelle Optik
• Die Mittenfrequenz 𝜈𝜌 des Pulses hängt von der transversalen Entfernung 𝜌 ab. Auf der Achse (𝜌 = 0) hat sie den Wert 𝜈0 und nimmt dann monoton mit steigendem 𝜌 ab, bis sie bei 𝜌 = 𝜌0 den Wert 𝜈0 ∕2 erreicht. Das ist eine Folge der Tatsache, dass langwellige (niederfrequente) Komponenten sich zu breiteren Kegeln erweitern, wie in Abb. 23.30 gezeigt ist. Aus demselben Grund ist die spektrale Breite umso kleiner und die zeitliche Breite umso größer, je weiter der Punkt von der Strahlachse entfernt ist. • Die anfängliche räumliche Gaußverteilung ändert sich mit steigendem 𝑡 drastisch. Es bildet sich eine Verteilung mit zunächst einem Maximum, die dann abflacht und schließlich während ihres Abklingen ein Doppelmaximum ausbildet (siehe Abb. 23.32). Fokussierung eines gepulsten Strahlbündels
Wenn ein Strahlbündel mit einer beliebigen räumlichen Verteilung 𝑝(𝑥, 𝑦), die mit einem Puls einer beliebigen zeitlichen Form 𝑔(𝑡) moduliert ist, durch eine Linse der Brennweite 𝑓 hindurchtritt und sich anschließend über eine Entfernung 𝑧 im Vakuum ausbreitet, dann erhalten wir durch Einsetzen von 𝑈1 (𝑥, 𝑦, 𝑡) = 𝑔(𝑡)𝑝(𝑥, 𝑦) in die Gln. (23.95) und (23.96) 2π 𝜈 𝑉2 (𝑥, 𝑦, 𝜈) ∝ 𝐺(𝜈) ∬ 𝑝(𝑥 , 𝑦 ) exp (−i 𝑑) 𝑐 0 ′
× exp (i
′
2π 𝜈 𝑥′ 2 + 𝑦 ′ 2 ) 𝑐 2𝑓
× exp (−i
2π 𝜈 (𝑥 − 𝑥′ )2 + (𝑦 − 𝑦 ′ )2 ) d𝑥′ d𝑦 ′ , 𝑐 2𝑧 (23.114)
wobei 𝐺(𝜈) die Fouriertransformierte von 𝑔(𝑡) ist. Wir haben hier angenommen, dass die Öffnung der Linse größer ist als der Strahlradius. Wenn das Linsenmaterial nichtdispersiv ist, sodass 𝑛 und 𝑓 nicht von 𝜈 abhängen, vereinfacht sich Gl. (23.114) für Punkte in der Brennebene 𝑧 = 𝑓 zu
𝑉2 (𝑥, 𝑦, 𝜈) ∝ 𝜈 𝐺(𝜈)𝑃 (
𝜈𝑥 𝜈𝑦 2π 𝜈 𝜌2 , ) exp (−i ), 𝑐 2𝑓 𝑐𝑓 𝑐𝑓 (23.115)
wobei 𝑃(𝜈𝑥 , 𝜈𝑦 ) = ∬ 𝑝(𝑥, 𝑦) exp[i2π (𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] d𝑥 d𝑦 die räumliche Fouriertransformierte von 𝑝(𝑥, 𝑦) ist. Den Faktor exp(−i2π 𝜈𝑑0 ∕𝑐) haben wir ignoriert, da er eine einfache Zeitverzögerung beschreibt. Die Wellenfunktion in der Brennebene ist die inverse zeitliche Fourier-
transformierte von 𝑉2 (𝑥, 𝑦, 𝜈); daher ist 𝑈2 (𝑥, 𝑦, 𝑡) ∝ ∫ 𝜈𝐺(𝜈)𝑃 (
𝜈𝑥 𝜈𝑦 , ) 𝑐𝑓 𝑐𝑓
× exp [i2π 𝜈 (𝑡 −
𝜌2 )] d𝜈 . 2𝑐𝑓
(23.116)
Die Kopplung der zeitlichen und räumlichen Eigenschaften des gepulsten Strahlbündels ist in Gl. (23.116) offensichtlich. Zusätzlich zu der ortsabhängigen Zeitverzögerung 𝑡 − 𝜌2 ∕2𝑐𝑓 wird die Fouriertransformierte des ursprünglichen räumlichen Profils mit dem frequenzabhängigen Faktor 𝑐𝑓∕𝜈 skaliert, bevor über die spektrale Verteilung des Pulses gemittelt wird. ( ) Für einen Gaußstrahl 𝑝(𝑥, 𝑦) = exp −𝜌2 ∕𝑊02 , der mit einem Gaußpuls 𝑔(𝑡) = exp(−𝑡2 ∕𝜏02 ) exp(i2π 𝜈0 𝑡) moduliert ist, d. h. 𝐺(𝜈) ∝ exp[−π2 𝜏02 (𝜈 − 𝜈0 )2 ] und [ ( )] 𝑃(𝜈𝑥 , 𝜈𝑦 ) = exp −π2 𝑊02 𝜈𝑥2 + 𝜈𝑦2 , ergibt Gl. (23.115) [ ] 𝑉2 (𝑥, 𝑦, 𝜈) ∝ 𝜈 exp −π2 𝜏02 (𝜈 − 𝜈0 )2 × exp [− (
π 𝑊0 2 2 2 𝜌2 ) 𝜈 𝜌 ] exp (−i2π 𝜈 ). 𝑐𝑓 2𝑐𝑓 (23.117)
Dieser Ausdruck ist identisch mit dem für einen Gaußstrahl im Fernbereich, Gl. (23.105), mit 𝑧 = 𝑓. Folglich ist die entsprechende Wellenfunktion 𝑈2 (𝑥, 𝑦, 𝑡) durch die Gln. (23.106)–(23.113) mit 𝑧 = 𝑓 gegeben. Die Kurven in Abb. 23.32 sind hier mit 𝑧 = 𝑓 anwendbar, wobei 𝑧0 die Beugungslänge des ursprünglichen (nicht des fokussierten) Strahlbündels ist und 𝜌0 = π
𝑁𝑊0 𝑓 𝑁𝜆0 𝑓 = = π 𝑁𝑊0′ , 𝑧0 𝑊0
(23.118)
wenn 𝑊0′ = 𝜆0 𝑓∕π𝑊0 der Strahlradius in der Brennebene für ein kontinuierliches Strahlbündel mit der Wellenlänge 𝜆0 ist [siehe die Gln. (3.45) und (3.47)]. Wie zuvor ist 𝑁 = 𝜈0 𝜏0 die Zahl der optischen Perioden in dem anfänglichen Puls. Der charakteristische transversale Radius 𝜌0 ist daher π 𝑁-mal größer als 𝑊0′ . Abbildung 23.33 zeigt eine Darstellung der räumlich-zeitlichen Verteilung des Pulses in der Brennebene. Gepulste Strahlen in dispersiven Medien
Die Beugung von gepulstem Licht in einem dispersiven Medium kann komplex sein. Wenn das Medium linear und homogen ist, beschreibt die Helmholtzgleichung [∇2 + 𝛽 2 (𝜈)]𝑉(r, 𝜈) = 0 diesen Prozess für beliebige Dispersionseigenschaften, die durch die Ausbreitungskonstante 𝛽(𝜈) charakterisiert sind, und für einen Puls mit einem beliebigen räumlich-spektralen Profil
23.4 Ultraschnelle lineare Optik
I(ρ,t) ρ
ρ/ρ0 0.5
z f
0 ‒2 0
2
Abb. 23.33 Räumlich-zeitliches Profil der Intensität in der Brennebene eines gaußschen Strahlbündels, das mit einem Gaußpuls moduliert ist und durch eine Linse der Brennweite f fokussiert wird. In dieser Darstellung enthält der anfängliche Puls N = 5 optische Perioden, und die Beugungslänge des anfänglichen Strahlbündels ist z0 ≫ f . Der Unter-
𝑉(r, 𝜈). Wenn 𝑉(r, 𝜈) durch Lösung dieser Gleichung bestimmt wird, kann die entsprechende Wellenfunktion 𝑈(r, 𝑡) ohne weiteres durch eine inverse Fouriertransformation bestimmt werden. Dieser Ansatz gilt zumindest im Prinzip unabhängig davon, wie dispersiv das Medium oder wie schmal der Puls ist. Näherungen ähnlich denen, die unabhängig voneinander zur paraxialen Helmholtzgleichung (die die Strahlbeugung beschreibt) und zur Gleichung für die langsam variierende Einhüllende (die die Pulsdispersion beschreibt) führten (siehe Tabelle 23.3), können kombiniert werden, um eine partielle Differentialgleichung für die Einhüllende 𝒜(r, 𝑡) eines Pulses mit einer schmalen spektralen Verteilung herzuleiten. Ein Ansatz entlang derselben Schritte wie in Abschnitt 23.2.3 beschrieben ergibt die verallgemeinerte paraxiale Wellengleichung −𝜆0 ∇2t 𝒜 + 𝐷𝜈
𝜕 𝒜 𝜕𝒜 1 𝜕𝒜 +i( + ) = 0 . (23.119) 𝑣 𝜕𝑡 𝜕𝑡2 𝜕𝑧 2
Diese Gleichung ist eine Verallgemeinerung von Gl. (23.23), die für nichtdispersive Medien (𝐷𝜈 = 0) gilt, sowie von Gl. (2.27), die für den kontinuierlichen Fall gilt, in dem 𝜕 2 𝑎∕𝜕𝑡2 = 𝜕𝐴∕𝜕𝑡 = 0 ist.
Herleitung: Die verallgemeinerte paraxiale Wellengleichung Die Wellenfunktion und ihre Fouriertransformierte hängen mit der Einhüllenden und ihrer Fouriertransformierten gemäß 𝑈(r, 𝑡) = 𝒜(r, 𝑡) exp(−i𝛽0 𝑧) exp(i2π 𝜈0 𝑡) bzw. 𝑉(r, 𝜈) = (r, 𝜈 − 𝜈0 ) exp(−i𝛽0 𝑧) 2 zusammen. Die paraxiale Näherung, (d ∕ d𝑧2 ) 2 [𝐴 exp(−i𝛽0 𝑧)] ≈ [−i2𝛽0 d𝐴∕ d𝑧 − 𝛽0 ] exp(−i𝛽0 𝑧), kann verwendet werden, um die Helmholtzgleichung
t/τ0
schied zwischen diesem und dem räumlich-zeitlichen Profil in Abb. 23.32 hängt mit der Tatsache zusammen, dass hier die Zeitverzögerung 𝜌2 ∕2cf = 𝜏0 (π N ∕2)(f ∕z0 )(𝜌2 ∕𝜌02 ) für f ≪ z0 an Punkten abseits der Achse mit 𝜌 < 𝜌0 vernachlässigbar ist.
in die Form [∇2t − i2𝛽0
] [ d ] 𝐴 + 𝛽 2 (𝜈0 + 𝑓) − 𝛽02 𝐴 = 0 (23.120) d𝑧
zu bringen. Für schwache Dispersion benutzen wir die Näherung 𝛽 2 (𝜈0 + 𝑓) − 𝛽02 ≈ 2𝛽0 [𝛽(𝜈0 + 𝑓) − 𝛽0 ] zusammen mit einer Taylorentwicklung mit drei Termen, 𝛽(𝜈0 + 𝑓) = 𝛽0 + 2π 𝛽 ′ 𝑓 + 2π2 𝛽 ′′ 𝑓 2 . Die Helmholtzgleichung wird dann zu ∇2t 𝐴 − i2𝛽0
𝜕𝐴 +2𝛽0 [2π 𝑓𝛽 ′ + 2π2 𝑓 2 𝛽 ′′ ]𝐴 = 0. (23.121) 𝜕𝑧
Wir führen eine inverse Fouriertransformation durch und beachten, dass die Multiplikatoren i2π𝑓 und −4π2 𝑓 2 äquivalent zu den Ableitungen 𝜕∕𝜕𝑡 bzw. 𝜕 2 ∕𝜕𝑡2 sind; damit erhalten wir ∇2t 𝐴 − 2𝛽0 [
𝜕𝐴 1 ′′ 𝜕 2 𝐴 i𝜕𝐴 + i𝛽 ′ + 𝛽 ] = 0 . (23.122) 2 𝜕𝑧 𝜕𝑡 𝜕𝑡2
Schließlich setzen wir 𝛽 ′ = 1∕𝑣, 𝛽 ′′ = 𝐷𝜈 ∕2π und 𝛽0 = 2π∕𝜆0 ein und gelangen so zu Gl. (23.119). Die paraxiale Gleichung der langsam variierenden Einhüllenden ermöglicht eine räumlich-zeitlich gaußsche Lösung √ 𝐴(𝑥, 𝑦, 𝑧, 𝑡) = 𝐴0 ×
−i𝑧0 ′ π 𝑡 − 𝑧∕𝑣 exp [−i ] 𝐷𝜈 𝑧 − i𝑧0 ′ 𝑧 − i𝑧0 ′
i𝑧0 π 𝜌2 exp (−i ), 𝑧 + i𝑧0 𝜆 𝑧 + i𝑧0 (23.123)
die eine räumlich-zeitlich gaußsche anfängliche Einhüllende 𝒜(𝑥, 𝑦, 0, 𝑡) = 𝐴0 exp(−𝑡2 ∕𝜏02 ) exp(−𝜌2 ∕𝑊02 ) besitzt, wobei 𝑧0′ = π 𝜏02 ∕𝐷𝜈 bzw. 𝑧0 = π𝑊02 ∕𝜆 die zu der
837
23 Ultraschnelle Optik
x
cτ (z) cτ0
W(z)
W0
z
Beugung
838
Dispersion
Abb. 23.34 Drei Momentaufnahmen der räumlichen Verteilung eines Pulses bei seiner Ausbreitung durch ein lineares dispersives Medium. Wegen der Beugung verbreitert sich der Puls in transversaler Richtung. Wegen der Dispersion verbreitert er sich zeitlich (was hier als räumliche Verbreiterung in Ausbreitungsrichtung gezeigt ist).
anfänglichen Pulslänge 𝜏0 gehörende Dispersionslänge und die zu dem anfänglichen Strahlradius 𝑊0 gehörende Beugungslänge sind. Diese Lösung kombiniert die Beugung eines Gaußstrahls (Kapitel 3) und die Dispersion eines Gaußpulses (Abschnitt 23.3) in einer räumlichzeitlich separierbaren Weise, wie Abb. 23.34 illustriert. Da die Gln. (23.119) und (23.123) in Zeit und Raum separierbar sind, können wir folgern, dass die Näherungen, denen diese Gleichungen unterworfen sind, tatsächlich gleichbedeutend mit der in Abschnitt 23.1.3 beschriebenen quasikontinuierlichen Näherung sind. Gleichung der Einhüllenden für ultraschmale gepulste Strahlbündel
Wenn die Bedingungen für die Näherung der langsam variierenden Einhüllenden nicht erfüllt sind (d. h. wenn der Puls sehr schmal ist oder das Strahlbündel sehr dünn), ist die Raum-Zeit-Abhängigkeit nicht mehr separierbar. Die Differentialgleichung für die Einhüllende des Pulses nimmt dann eine komplexere Form an, obwohl das Konzept der Einhüllenden an sich in diesem Fall dann an Bedeutung verliert. Wir beginnen mit der Helmholtzgleichung [∇2 + 𝛽 2 (𝜈)]𝑉(r, 𝜈) = 0 und setzen 𝑉(r, 𝜈) = 𝐴(r, 𝜈 − 𝜈0 ) exp(−i𝛽0 𝑧) und [ ] 𝜈 = 𝜈 + 𝑓; das ergibt ∇2t + 𝜕 2 ∕𝜕𝑧2 − i2𝛽0 𝜕∕𝜕𝑧 𝐴 + [ 2 0 ] 𝛽 (𝜈0 + 𝑓) − 𝛽02 𝐴 = 0. Wir entwickeln die Funktion [𝛽 2 (𝜈0 + 𝑓) − 𝛽02 ] in eine Taylorreihe bis zur zweiter 1
Ordnung, [𝛽 2 (𝜈0 + 𝑓) − 𝛽02 ] ≈ (2𝛽0 𝛽 ′ )2π 𝑓 + (2𝛽 ′ 2 + 2
2𝛽0 𝛽 ′′ )(2π 𝑓)2 . Dann transformieren wir zurück in den Zeitbereich und ordnen die Terme um; das ergibt − 𝜆0 ∇2t 𝒜 + 𝐷𝜈
𝜕2 𝒜 𝜕𝒜 + i4π ′ − 𝜆0 𝜕𝑡′ 2 𝜕𝑧 2 2 𝜕 𝒜 2 𝜕 𝒜 × ( ′2 − )=0, 𝑣 𝜕𝑡′ 𝜕𝑧′ 𝜕𝑧
− 𝜆0 ∇2t 𝒜 + 𝐷𝜈
(23.124)
mit 𝑣 = 1∕𝛽 ′ und 𝐷𝜈 = 2π𝛽 ′′ . Gleichung (23.124) ist allgemeiner als Gl. (23.119), da wir die paraxiale Nä-
(23.125)
die offensichtlich räumlich-zeitliche Kopplung zeigt.
23.5 Ultraschnelle nichtlineare Optik Die bisherigen Abschnitte dieses Kapitels befassten sich mit der Ausbreitung von optischen Pulsen in linearen Medien, wobei wir die Rolle der Gruppengeschwindigkeitsdispersion für die Umformung von kurzen Pulsen besonders herausgestellt haben. In diesem Abschnitt betrachten wir die Ausbreitung von optischen Pulsen in nichtlinearen Medien. Nichtlineare Effekte kommen im Zusammenhang mit ultrakurzen Pulsen wegen ihrer hohen Intensität häufiger vor. Nichtlineare optische Phänomene wurden in Kapitel 22 eingeführt; insbesondere hatten wir die Dreiwellenmischung in Medien mit einer Nichtlinearität zweiter Ordnung und die Zwei- und Vierwellenmischung in Medien mit einer Nichtlinearität dritter Ordnung betrachtet. In diesem Abschnitt werden wir einigen dieser Phänomene im Zusammenhang mit gepulsten Wellen wieder begegnen. Abschnitt 23.5.1 befasst sich mit gepulsten parametrischen Prozessen wie z. B. der Dreiwellenmischung, der optischen Gleichrichtung und der Selbstphasenmodulation, Abschnitt 23.5.2 betrachtet optische Solitonen, Abschnitt 23.5.3 ist der Erzeugung eines Superkontinuums gewidmet und Abschnitt 23.5.4 beschreibt die Erzeugung höherer Harmonischer sowie die Attosekundenoptik.
23.5.1
𝜕2 𝒜 𝜕 1 𝜕 + i4π ( + )𝒜 𝜕𝑧 𝑣 𝜕𝑡 𝜕𝑡2
𝜕2 1 𝜕2 − 𝜆0 ( 2 − )𝒜 = 0 𝑣 𝜕𝑡2 𝜕𝑧
herung und die Näherung schwacher Dispersion nicht verwendet haben. Für 𝛽 ′ 2 ≪ 𝛽0 𝛽 ′′ (oder 𝜆0 ∕𝑣2 ≪ 𝐷𝜈 ) und 𝜕 2 𝒜∕𝜕𝑧2 ≪ (4π∕𝜆0 )𝜕𝒜∕𝜕𝑧 ist der vierte Term in Gl. (23.124) vernachlässigbar, und wir erhalten wieder Gl. (23.119). Gleichung (23.124) kann in einem Koordinatensystem ausgedrückt werden, das sich mit der Pulsgeschwindigkeit 𝑣 bewegt, indem wir die Transformation 𝑡′ = 𝑡 − 𝑧∕𝑣 und 𝑧′ = 𝑧 benutzen. Das Ergebnis ist die Differentialgleichung
Gepulste parametrische Prozesse
Die Dreiwellenmischung in einem Medium mit einer Nichtlinearität zweiter Ordnung wurde in Abschnitt 22.2.3 für kontinuierliche Wellen diskutiert, und eine Theorie gekoppelter Wellen wurde in Abschnitt 22.4 entwickelt. Die wesentlichen Bedingungen für die Wellenmischung werden durch die Erhaltung von Energie und
23.5 Ultraschnelle nichtlineare Optik
Impuls diktiert. Für gepulste Wellen mit den zentralen Kreisfrequenzen 𝜔1 , 𝜔2 und 𝜔3 und den zentralen Wellenvektoren k1 , k2 und k3 lauten diese Bedingungen 𝜔1 + 𝜔2 = 𝜔3 und k1 + k2 = k3 . Wenn Dispersionseffekte vernachlässigt werden, ist die Theorie kontinuierlicher Wellen auf den gepulsten Fall anwendbar; d. h. der Puls wird zu jedem Zeitpunkt als quasikontinuierlich betrachtet, und die Einhüllenden der drei Wellen folgen denselben Gleichungen (22.93) gekoppelter Wellen.
für eine Phasenfehlanpassung Δ𝑘 bei einer Entfernung 𝐿K = 2π∕|Δ𝑘|, der Kohärenzlänge, deutlich abnimmt ′ [siehe Gl. (22.35)]. Für eine Fehlanpassung Δ𝛽 = 1∕𝑣3 − 1∕𝑣1 der Gruppengeschwindigkeit sind die Pulse nach Ausbreitung über eine Entfernung 𝑧 durch eine Zeitver′ zögerung Δ𝛽 𝑧 = 𝑧∕𝑣3 − 𝑧∕𝑣1 getrennt. Wenn diese Verzögerung gleich der Pulsdauer 𝜏 ist, überlappen die Pulse nicht mehr, und die nichtlineare Kopplung hört auf. Das tritt bei einer Entfernung
Der Walk-Off-Effekt
ein, die als Walk-Off-Länge bezeichnet wird. Die kürzere der beiden Entfernungen 𝐿K und 𝐿WO bestimmt, ob die Fehlanpassung der Phasen- oder der Gruppengeschwindigkeit dominiert. Als Beispiel betrachten wir einen KDP-Kristall mit einer ordentlichen Grundwelle bei 𝜆1 = 1.06 μm und einer außerordentlichen frequenzverdoppelten Welle bei 𝜆3 = 0.53 μm in einer Typ-II-o-e-o-Anordnung. Die Fehlanpassung der Gruppengeschwindigkeit ist hier ′ Δ𝛽 = 2(1∕𝑣3 − 1∕𝑣1 ) ≈ 5.2 × 10−10 s∕m. Für einen Puls von 100 fs Dauer ist die Walk-Off-Länge damit 𝐿WO = 𝜏∕|Δ𝛽 ′ | ≈ 0.2 mm.
Wenn das Medium Dispersion erster Ordnung zeigt, aber keine Dispersion zweiter (Gruppengeschwindigkeitsdispersion) oder höherer Ordnungen, dann breiten sich die drei gepulsten Wellen mit ihren Gruppengeschwindigkeiten aus, ohne ihre Formen zu verändern (nur ihre Amplituden werden durch die Mischung verändert). Da diese Geschwindigkeiten im Allgemeinen unterschiedlich sind, trennen sich die Pulse schließlich, und der parametrische Prozess, der für die Wellenmischung verantwortlich ist, hört auf. Diese Erscheinung wird als Walk-Off-Effekt bezeichnet. Für eine effiziente Mischung gepulster Wellen kommt daher als zusätzliche Bedingung die Gleichheit der Gruppengeschwindigkeiten hinzu, 𝑣1 = 𝑣2 = 𝑣3 . Der Walk-Off-Effekt ist in Abb. 23.35 für den entarteten Fall der kollinearen Frequenzverdopplung (𝜔1 = 𝜔2 = 𝜔 und 𝜔3 = 2𝜔) illustriert. Es ist schwierig, gleichzeitig sowohl die Phasenbedingung zu erfüllen als auch gleiche Gruppengeschwindigkeiten zu erreichen. In den Abschnitten 22.2.4 und 22.4.2 hatten wir gezeigt, dass die Frequenzverdopplung t
G
ZH
t3
t2 t1
τ
G
ZH
υ1
υ3
z z
Abb. 23.35 Eine gepulste Welle bei der Grundfrequenz (G) und die zugehörige zweite Harmonische (ZH) trennen sich, weil sie sich mit unterschiedlichen Geschwindigkeiten ausbreiten (in diesem Beispiel ist die ZH-Welle schneller). Die obere Darstellung ist ein Raum-Zeit-Diagramm für Pulse der Dauer 𝜏 . Die untere Darstellung zeigt drei Momentaufnahmen der sich ausbreitenden Pulse zu den Zeitpunkten t1 < t2 < t3 .
𝐿WO = 𝜏∕|Δ𝛽 ′ |
(23.126)
Die Gleichungen gekoppelter Wellen für die gepulste Dreiwellenmischung
Die Gleichungen gekoppelter Wellen, die wir in Abschnitt 22.4 für kontinuierliche Wellen hergeleitet hatten, können leicht auf gepulste Wellen verallgemeinert werden. Für kollineare ebene Wellen, die sich in 𝑧-Richtung ausbreiten, sind die elektrischen Felder als Funktionen der komplexen Einhüllenden ℰ𝑞 = √ Re{ 2𝜂ℏ𝜔𝑞 𝑎𝑞 (𝑧, 𝑡) exp[i(𝜔𝑞 𝑡 − 𝛽𝑞 𝑧)]} (𝑞 = 1, 2, 3), wobei 𝑎1 , 𝑎2 und 𝑎3 die normierten komplexen Einhüllenden der drei Pulse sind und 𝛽1 , 𝛽2 und 𝛽3 die Ausbreitungskonstanten bei den Mittenfrequenzen 𝜔1 , 𝜔2 und 𝜔3 . Mithilfe der Näherung der langsam variierenden Einhüllenden und einer Taylorentwicklung erster Ordnung der Ausbreitungskonstante 𝛽(𝜔) um die jeweiligen Mittenfrequenzen, 𝛽(𝜔𝑞 + 𝛺) ≈ 𝛽𝑞 + 𝛺𝛽𝑞′ , wobei 𝛽𝑞′ die Ableitung 𝜕𝛽∕𝜕𝜔 bei 𝜔𝑞 ist, erhalten wir die gekoppelten Gleichungen: (
𝜕 1 𝜕 + ) 𝑎 = −ig𝑎3 𝑎2∗ , 𝜕𝑧 𝑣1 𝜕𝑡 1
(
1 𝜕 𝜕 + ) 𝑎 = −ig𝑎3 𝑎1∗ , 𝜕𝑧 𝑣2 𝜕𝑡 2
(
𝜕 1 𝜕 + ) 𝑎 = −ig𝑎1 𝑎2 , 𝜕𝑧 𝑣3 𝜕𝑡 3
(23.127)
wobei 𝑣𝑞 = 1∕𝛽𝑞′ die Gruppengeschwindigkeit der Welle 𝜔𝑞 ist, und g eine durch Gl. (22.94) gegebene Konstante.
839
840
23 Ultraschnelle Optik
Diese Gleichungen ähneln den gekoppelten Gln. (22.93) für den Fall kontinuierlicher Wellen. Wenn die Gruppengeschwindigkeiten gleich sind, d. h. 𝑣1 = 𝑣2 = 𝑣3 = 𝑣, können wir ein Koordinatensystem verwenden, das sich mit der Geschwindigkeit 𝑣 bewegt; dadurch werden die Gln. (23.127) für die gepulsten gekoppelten Wellen identisch mit den Gleichungen (22.93) für den gepulsten Fall und die in Abschnitt 22.4 präsentierten Lösungen gelten, nur dass die Variable 𝑧 durch 𝑧 − 𝑣𝑡 zu ersetzen ist. Wenn die Gruppengeschwindigkeiten nicht gleich sind, wird die Lösung von Gl. (23.127) komplexer. Wenn das Medium auch eine Gruppengeschwindigkeitsdispersion zeigt (siehe Aufgabe 23-8), führt eine Taylorentwicklung mit drei Termen, 𝛽(𝜔𝑞 + 𝛺) ≈ 𝛽𝑞 + 1
𝛺𝛽𝑞′ + 𝛺2 𝛽𝑞′′ , zu den gekoppelten Wellengleichungen 2
(
𝛽 ′′ 𝜕 2 𝜕 1 𝜕 + − i 1 2 ) 𝑎1 = −ig𝑎3 𝑎2∗ , 2 𝜕𝑡 𝜕𝑧 𝑣1 𝜕𝑡
(
𝛽 ′′ 𝜕 2 1 𝜕 𝜕 + − i 2 2 ) 𝑎2 = −ig𝑎3 𝑎1∗ , 2 𝜕𝑡 𝜕𝑧 𝑣2 𝜕𝑡
(23.128)
Gepulste optische Gleichrichtung: Erzeugung von Terahertzpulsen
Eine gepulste Welle mit einer Mittenfrequenz im optischen Band und einer spektralen Breite im THz-Bereich kann durch Differenzfrequenzerzeugung in einen Puls von THz-Strahlung umgewandelt werden. Im Prinzip wird der Puls dabei wie bei einer Gleichrichtung vom optischen Band in das THz-Band frequenzverschoben. Abbildung 23.36 stellt den Prozess schematisch dar. Wenn sich ein optischer Puls ℰ(𝑡) = Re{𝒜(𝑡) exp(i𝜔0 𝑡)} mit der langsam variierenden Einhüllenden 𝒜(𝑡) durch ein Medium mit dem nichtlinearen Koeffizienten zweiter Ordnung d ausbreitet, induziert er eine Polarisation 2dℰ 2 (𝑡), die einen Term bei 2𝜔0 enthält, der für die Frequenzverdopplung verantwortlich ist, und einen weite-
2 ps
Terahertzpuls
nichtlinearer Kristall
𝒫THz = d|𝒜(𝑡)|2 ,
2 ps
Abb. 23.36 Erzeugung eines THz-Pulses durch Differenzfrequenzerzeugung.
(23.129)
der für die optische Gleichrichtung steht (siehe die Abschnitte 22.2.1, 22.2.3 und 22.4.3). Um die passenden Phasenbedingungen für diesen parametrischen Prozess zu bestimmen, verwenden wir einen Fourieransatz. Die gepulste optische Welle kann als eine Summe von monochromatischen Wellen mit Frequenzen betrachtet werden, die in einem spektralen Band um die Mittenfrequenz 𝜔0 liegen. Beim Durchgang durch das nichtlineare Medium werden diese monochromatischen Komponenten paarweise gemischt, wobei jeweils eine Welle mit der Differenzfrequenz entsteht. Gemäß Gl. (22.20e) erzeugt ein Paar von Wellen mit den Kreisfrequenzen 𝜔1 = 𝜔 und 𝜔2 = 𝜔 + 𝛺 eine nichtlineare Polarisation 𝑃THz (𝛺) = 2d𝐸 ∗ (𝜔)𝐸(𝜔 + 𝛺) bei der THz-Frequenz 𝛺; die Summe für alle Paare ist daher 𝑃THz (𝛺) = ∫ 2d𝐸 ∗ (𝜔)𝐸(𝜔 + 𝛺) d𝜔 .
𝛽3′′ 𝜕 2 1 𝜕 𝜕 + −i ) 𝑎 = −ig𝑎1 𝑎2 . ( 2 𝜕𝑡2 3 𝜕𝑧 𝑣3 𝜕𝑡
optischer Puls
ren bei
(23.130)
Im Zeitbereich ist diese Beziehung äquivalent zu Gl. (23.129). Um nichtlineare Dispersionseffekte zu berücksichtigen, muss der nichtlineare Koeffizient d in Gl. (23.130) durch einen frequenzabhängigen Koeffizienten d(𝛺, 𝜔, 𝜔 + 𝛺) ersetzt werden (siehe Abschnitt 22.7). Diese Differenzfrequenzerzeugung muss die Phasenbedingung für alle Frequenzen 𝜔 und 𝛺 erfüllen. Diese Bedingung kann nicht exakt erfüllt werden; es entsteht daher ein Fehler Δ𝑘 = 𝑘(𝜔 + 𝛺) − 𝑘(𝜔) − 𝑘(𝛺) .
(23.131)
Für 𝛺 ≪ 𝜔 kann diese Gleichung näherungsweise als Δ𝑘 ≈ 𝛺
d𝑘 1 1 − 𝑘(𝛺) = 𝛺 [ − ] d𝜔 𝑣(𝜔) 𝑐(𝛺) 𝛺 = [𝑁(𝜔) − 𝑛(𝛺)] 𝑐0
(23.132)
geschrieben werden, wobei 𝑣(𝜔) = (d𝑘∕ d𝜔)−1 die Gruppengeschwindigkeit ist und 𝑁(𝜔) der Gruppenindex bei der optischen Frequenz 𝜔. 𝑐(𝛺) und 𝑛(𝛺) sind die Phasengeschwindigkeit und der Brechungsindex bei der THz-Frequenz 𝛺. Das Bauelement muss daher so entworfen werden, dass der Gruppenindex bei optischen Frequenzen gleich dem Phasenindex bei THzFrequenzen ist. Wie in Abschnitt 22.2.4 für einen Kristall der Länge 𝐿 gezeigt wurde, ist diese Phasenfehlanpassung für 𝐿 < 𝐿K klein, wobei 𝐿K = 2π∕|Δ𝑘| die Kohärenzlänge
23.5 Ultraschnelle nichtlineare Optik
ist [siehe Gl. (22.35)]. Um diesen Effekt zu berücksichtigen, muss in dem Integral in Gl. (23.130) ein Faktor 𝐿 ∫0 exp(iΔ𝑘𝑧) d𝑧 = [exp(iΔ𝑘𝐿) − 1]∕iΔ𝑘 eingeführt werden. Selbstphasenmodulation von Pulsen
Selbstphasenmodulation tritt in nichtlinearen Medien mit einem optischen Kerreffekt auf (siehe Abschnitt 22.3.1). Dieser Effekt führt in eine Welle, die sich über eine Entfernung 𝑧 in einem Medium mit dem optischen Kerrkoeffizient 𝑛2 ausbreitet, eine Phase Δ𝜑 = −𝑛2 𝐼𝑘0 𝑧 ein, wenn 𝐼 die optische Intensität ist und 𝑘0 die Wellenzahl. Für einen optischen Puls ist die Intensität 𝐼(𝑡) eine Funktion der Zeit und daher ändert sich die Phase zeitlich, Δ𝜑(𝑡) = −𝑛2 𝐼(𝑡)𝑘0 𝑧 .
(23.133)
Das entspricht einer Änderung der instantanen Frequenz [siehe Gl. (23.3)] von Δ𝜔i = −𝑛2
d𝐼 𝑘0 𝑧 . d𝑡
(23.134)
Für einen Puls mit einer einfachen Form wie z. B. den in Abb. 23.37 gezeigten wird die Frequenz der zweiten Hälfte des Pulses (der rechten Hälfte) für positives 𝑛2 vergrößert (blauverschoben), da d𝐼∕ d𝑡 < 0 ist, wohingegen die Frequenz der ersten (linken) Hälfte verringert (rotverschoben) wird, da d𝐼∕ d𝑡 > 0 ist. Der Puls wird daher in der Umgebung seines Zentrums gechirpt (d. h. seine instantane Frequenz nimmt zu). Die Selbstphasenmodulation kann folglich verwendet werden, um Chirp einzuführen, und ist daher für die Pulsformung geeignet (siehe Abschnitt 23.2.3). Beispielsweise kann ein Gaußpuls in der Nähe seines Zentrums durch eine parabolische Funktion 𝐼(𝑡) = 𝐼0 exp(−2𝑡2 ∕𝜏2 ) ≈ 𝐼0 [1 − 2𝑡2 ∕𝜏2 ] angenähert werden, sodass die zeitlich variierende Komponente der Phase näherungsweise eine quadratische Funktion der Zeit ist, Δ𝜑 = 2𝑛2 𝐼0 𝑘0 𝑧𝑡2 ∕𝜏2 , entsprechend einem linearen Chirp mit dem Chirpparameter 𝑎 = 2𝑛2 𝐼0 𝑘0 𝑧, der dasselbe Vorzeichen wie der Kerrkoeffizient 𝑛2 besitzt. Die Selbstphasenmodulation führt daher einen quadratischen I (t)
optisches Kerrmedium (n2 > 0)
Phasenmodulationsfaktor exp(i𝑎𝑡2 ∕𝜏2 ) = exp(i𝜁𝑡2 ) ein; dabei gilt 𝜁 = 2𝑛2 𝐼0 𝑘0 𝑧∕𝜏2 .
Es ist zweckmäßig, den durch Selbstphasenmodulation eingeführten Chirpparameter in der Form 𝑎 = 𝑧∕𝑧nl ,
𝑧nl = (2𝑛2 𝐼0 𝑘0 )−1
Beispiel 23-9: Pulskompression durch Selbstphasenmodulation und Gruppengeschwindigkeitsdispersion
Ein 65 fs-Puls mit einer Spitzenleistung 𝑃0 = 300 kW bei der zentralen Wellenlänge 𝜆0 = 620 nm wird durch eine 9 mm lange optische Quarzglasfaser mit einem Querschnitt A = 100 μm2 gechirpt, wie in Abb. 23.38 dargestellt. Bei dieser Wellenlänge ist 𝑛2 ≈ 3.2 × 10−20 m2 ∕W, sodass die nichtlineare charakteristische Länge |𝑧nl | = |2𝑛2 𝐼0 𝑘0 |−1 = 𝜆0 A∕4π |𝑛2 |𝑃0 ≈
B
t
ωi
ωi
ω0
ω0 t
(23.136)
zu schreiben, wobei |𝑧nl | als nichtlineare charakteristische Länge des Kerrmediums bezeichnet wird. Die durch Ausbreitung über eine Entfernung 2|𝑧nl | durch das nichtlineare Material bei maximaler Intensität eingeführte Phase ist eins, d. h. es gilt 𝑛2 𝐼0 𝑘0 2|𝑧nl | = 1. Bei dieser Analyse haben wir implizit angenommen, dass das Medium schwach dispersiv ist, sodass die Pulsverbreiterung vernachlässigt werden kann; d. h. dass die Gruppengeschwindigkeitsdispersion im Vergleich zur Selbstphasenmodulation vernachlässigbar ist. Diese Bedingung ist erfüllt, wenn |𝑧0 | ≫ |𝑧nl | gilt. Die Analyse der Pulsausbreitung in Materialien, in denen sowohl Selbstphasenmodulation als auch Gruppengeschwindigkeitsdispersion auftreten, ist sehr komplex, wie wir im folgenden Abschnitt sehen werden. Die quadratische Phasenmodulation, die durch nichtlineare Selbstphasenmodulation eingeführt wird, kann in Verbindung mit einem linearen dispersiven Bauelement wie z. B. einem Beugungsgitter oder Prisma für die Pulskompression verwendet werden, wie in Abschnitt 23.2.3 beschrieben wurde und in Beispiel 23-9 illustriert wird. Die Kombination bewirkt √ √ eine Pulskompression um einen Faktor 1 + 𝑎2 = 1 + (𝑧∕𝑧nl )2 .
R
t
(23.135)
t
Abb. 23.37 Chirpen eines optischen Pulses bei der Ausbreitung durch ein nichtlineares optisches Kerrmedium.
841
842
23 Ultraschnelle Optik
ν νo
ungechirpter gechirpter Puls Puls nichtlineare optische Faser (positive Selbstphasenmodulation)
Abb. 23.38 Pulskompression durch eine Kombination von quadratischer Phasenmodulation (aufgrund von Selbstphasenmodulation) und Chirpfilter. Der Phasenmodulator besteht aus einer optischen Faser, die aufgrund eines opti-
schen Kerreffekts Selbstphasenmodulation zeigt. Das Chirpfilter beruht auf der durch ein Beugungsgitter eingeführten Gruppengeschwindigkeitsdispersion.
0.5 mm ist. Für eine Faserlänge 𝑧 = 9 mm ist der durch Selbstphasenmodulation eingeführte Chirpparameter einem maximalen 𝑎 = 𝑧∕𝑧nl = 18. Das entspricht √ Pulskompressionsfaktor 1 + 𝑎2 ≈ 18 oder einem komprimierten Puls der Breite 3.6 fs. Zusätzlich führt die Faser auch eine Gruppengeschwindigkeitsdispersion ein. Bei 620 nm ist 𝛽 ′′ = 6 × 10−26 s2 ∕m, sodass die Dispersionslänge für einen Puls der Breite 𝜏0 = 65 fs 𝑧0 = 𝜏02 ∕2𝛽 ′′ = 3.5 cm ist. Wegen 𝑧0 ≫ 𝑧nl dominiert die Selbstphasenmodulation über die Gruppengeschwindigkeitsdispersion. Für maximale Kompression muss das Gitter einen Chirpkoeffizienten 𝑏 = [𝑎∕(1 + 𝑎2 )]𝜏02 ≈ 2.35 × 10−28 s2 = (3.6 fs)2 einführen.
B
R
komprimierter Puls
Beugungsgitter (negative GGD)
23.5.2
Optische Solitonen
Das Wechselspiel zwischen Selbstphasenmodulation und Gruppengeschwindigkeitsdispersion in einem Medium, das sowohl einen nichtlinearen optische Kerreffekt als auch eine lineare Dispersion zeigt, bewirkt unter dem Strich je den Beträgen und Vorzeichen dieser beiden Effekte eine Pulsverbreiterung oder Pulskompression. Unter bestimmten Bedingungen kann sich ein optischer Puls mit einer vorgegebenen Form und Intensität in solch einem Medium ausbreiten, ohne je seine Form zu verändern, als ob er sich in einem idealen linearen nichtdispersiven Medium ausbreitete. Das passiert dann, wenn die Gruppengeschwindigkeitsdispersion den Effekt der Selbstphasenmodulation exakt ausgleicht, wie in Abb. 23.39(c) dargestellt. Solche pulsartigen stationä-
B
R
t
(a) lineares dispersives Medium (negative GGD)
R (b)
B
t nichtlineares nichtdispersives Medium (positive SPM)
t
(c)
nichtlineares dispersives Medium (negative GGD + positive SPM)
Abb. 23.39 (a) In einem linearen Medium mit negativer Gruppengeschwindigkeitsdispersion (anomaler Dispersion) hat die kurzwellige Komponente B eine größere Gruppengeschwindigkeit und breitet sich daher schneller aus als die langwellige Komponente R; so entsteht eine Pulsverbreiterung. (b) In einem nichtlinearen Medium mit einem positiven optischen Kerreffekt (n2 > 0) bewirkt Selbstphasenmodulation eine negative Frequenzverschiebung in der ersten Hälfte des Pulses (mit R bezeichnet) und eine positive Frequenzverschiebung in der zweiten Hälfte (mit B bezeichnet). Der Puls wird gechirpt, verändert aber seine Form nicht. Wenn
die gechirpte Welle aus (b) sich in dem linearen dispersiven Medium aus (a) ausbreitet, wird der Puls komprimiert, da die blauverschobene Hälfte die rotverschobene Hälfte einholt. (c) Wenn das Medium nichtlinear und dispersiv ist, kann der Puls komprimiert oder gedehnt werden oder unverändert bleiben (unter Bildung einer solitären Welle), je nach den Beträgen und Vorzeichen der Gruppengeschwindigkeitsdispersion und der Selbstphasenmodulation. Die Abbildung zeigt eine solitäre Welle, die durch ein Gleichgewicht zwischen der negativen Gruppengeschwindigkeitsdispersion und der positiven Selbstphasenmodulation entsteht.
23.5 Ultraschnelle nichtlineare Optik
Abb. 23.40 Mechanisches Analogon eines Solitons.
ren Wellen werden solitäre Wellen genannt. Optische Solitonen sind besondere solitäre Wellen, die orthogonal sind; d. h. wenn zwei dieser Wellen sich in dem Medium begegnen, verändern sich ihre Intensitätsprofile nicht (sie erfahren nur Phasenverschiebungen), sodass sich beide Wellen weiterhin unabhängig ausbreiten. Die Entstehung eines Solitons kann durch das mechanische Analogon in Abb. 23.40 veranschaulicht werden. Das schwere Auto steht für den zentralen Teil des optischen Pulses. Es verändert die Oberfläche des elastischen Bodens, ganz ähnlich wie der intensive Puls den Brechungsindex des Mediums verändert. Der schnelle Sportwagen, der der zweiten Hälfte des Pulses entspricht, wird durch die in der Oberfläche erzeugte Steigung gebremst. Das langsame Fahrrad, das der ersten Hälfte des Pulses entspricht, wird durch die abwärts geneigte Oberfläche beschleunigt. Das Ergebnis ist, dass die drei Fahrzeuge sich mit derselben Geschwindigkeit bewegen und die Entfernungen zwischen ihnen gleich bleiben. Solitonen haben ein charakteristisches Pulsprofil und eine Intensität, für die die Effekte von Selbstphasenmodulation und Gruppengeschwindigkeitsdispersion sich gerade ausgleichen. Für diese Pulse kompensiert der Chirpeffekt der Selbstphasenmodulation die natürliche Pulsdehnung aufgrund der Gruppengeschwindigkeitsdispersion. Jede geringe Verbreiterung des Pulses erhöht die Kompression, und jede Verengung des Pulses reduziert die Kompression, sodass Pulsform und -breite gleich bleiben. Solitonen können als Moden (Eigenfunktionen) des nichtlinearen dispersiven Systems betrachtet werden. Eine mathematische Analyse dieses Phänomens beruht auf den Lösungen der nichtlinearen Wellengleichung für die Ausbreitung der Pulseinhüllenden, wie im Folgenden beschrieben wird. Zuerst wollen wir jedoch eine einfache Herleitung der Solitonbedingung präsentieren. Die Solitonbedingung
Um einen Ausdruck für die Solitonbedingung zu erhalten, setzen wir die Summe der durch Selbstphasenmodulation und Gruppengeschwindigkeitsdispersion innerhalb einer Entfernung Δ𝑧 eingeführten Phasen gleich null. Wie zuvor beschrieben erfährt ein Puls
bei der Ausbreitung durch ein nichtlineares Medium mit einem optischen Kerreffekt Selbstphasenmodulation, durch die eine quadratische Phasenmodulation exp(i𝜁𝑡2 ) mit 𝜁 = 2𝑛2 𝐼0 𝑘0 Δ𝑧∕𝜏02 eingeführt wird, wobei 𝐼0 und 𝜏0 die Maximalintensität bzw. Breite des Pulses sind und 𝑛2 der optische Kerrkoeffizient ist. Wie in Abschnitt 23.3 beschrieben, führt die Gruppengeschwindigkeitsdispersion in einem linearen dispersiven Medium eine Phasenverschiebung 𝑎𝑡2 ∕𝜏02 ein, wobei für den Chirpparameter 𝑎 = Δ𝑧∕𝑧0 = 2𝛽 ′′ Δ𝑧∕𝜏02 gilt, 𝛽 ′′ der Materialdispersionskoeffizient ist und |𝑧0 | die Dispersionslänge (siehe Tabelle 23.2). Damit der Puls sich als Soliton ausbreiten kann, müssen die beiden Phasenfaktoren denselben Betrag und entgegengesetztes Vorzeichen besitzen, d. h. 𝑎 (23.137) 𝜁=− 2 𝜏0 oder äquivalent 𝑘0 𝑛2 𝐼0 = −
𝛽 ′′ 𝜏02
(23.138)
oder 𝑧nl = −𝑧0 ;
(23.139)
d. h. die Dispersionslänge der Gruppengeschwindigkeitsdispersion muss gleich der nichtlinearen charakteristischen Länge sein. Mit anderen Worten: die durch Selbstphasenmodulation bei einer Ausbreitung über das Doppelte der Dispersionslänge |𝑧0 | der Gruppengeschwindigkeitsdispersion eingeführte Phasenverschiebung ist eins (−𝑘0 𝑛2 𝐼0 2𝑧0 = 1). Dieselbe Bedingung können wir auch herleiten, indem wir das Medium als eine periodische Folge von lokalisierten Selbstphasenmodulations-Elementen auffassen, die durch pulsverbreiternde (Gruppengeschwindigkeitsdispersions-) Elemente der Breite Δ𝑧 getrennt sind, wie in Abb. 23.41 dargestellt. Diese Anordnung ist mit der in Übung 23-2 beschriebenen periodischen Anordnung von Phasenmodulatoren identisch. Tatsächlich kann Gl. (23.137) im Grenzfall Δ𝑧 → 0 aus Gl. (23.88) abgeleitet werden. Ein anderer Ausdruck für die Solitonbedingung kann als Funktion der Pulsamplitude 𝐴0 angegeben werden,
843
Pulsbreite
23 Ultraschnelle Optik
τ(z) τ1 τ0
+
–
+
Δ Æz –
+
SPM
GGD
SPM
GGD
SPM
– GGD
τHWB
0 a(z) a
z
0 –a
z
Chirpparameter
844
0
Abb. 23.41 Einfaches Modell für ein Medium mit negativer Gruppengeschwindigkeitsdispersion und positiver Selbstphasenmodulation.
wobei 𝐼0 = |𝐴0 |2 ∕2𝜂 gilt und 𝜂 die elektromagnetische Impedanz des Mediums ist. Das Ergebnis wird durch das Produkt der Maximalamplitude 𝐴0 und der zeitlichen Breite 𝜏0 des Pulses geschrieben, √ (23.140) 𝐴0 𝜏0 = −𝛽 ′′ ∕𝛾 , wobei 𝛾 = 𝑘0 𝑛2 ∕2𝜂 = π 𝑛2 ∕𝜆0 𝜂
(23.141)
ein weiterer Materialparameter ist. Dabei haben wir angenommen, dass 𝛾 und 𝛽 ′′ entgegengesetzte Vorzeichen haben. Folglich ist das Produkt 𝐴0 𝜏0 aus Maximalamplitude und Breite eine Konstante, die durch das Verhältnis des Parameters 𝛽 ′′ , der die Gruppengeschwindigkeitsdispersion beschreibt, und des Parameters 𝛾, der die Selbstphasenmodulation beschreibt, gegeben ist. Für ein gegebenes Material ist das Produkt 𝐴0 𝜏0 konstant, woraus sich einige Implikationen ergeben: • Die Maximalamplitude 𝐴0 des Pulses ist umgekehrt proportional zur Impulslänge 𝜏0 . • Die Maximalleistung des Pulses ist umgekehrt proportional zu 𝜏02 . • Die Energiedichte ∫ 𝐼(𝑡) d𝑡 ist umgekehrt proportional zu 𝜏0 , sodass ein Soliton mit kürzerer Dauer eine größere Energie tragen muss. Durch Lösung der nichtlinearen Wellengleichung für die Pulsausbreitung in einem Medium, das sowohl Selbstphasenmodulation als auch Gruppengeschwindigkeitsdispersion zeigt, wird im Folgenden gezeigt, dass eine der Lösungen das Soliton |𝒜(𝑡)| = |𝐴0 |sech(𝑡∕𝜏0 )
sech Gauß
(23.142)
ist, wobei sech(⋅) = 1∕ cosh(⋅) der in Abb. 23.42 dargestellte Sekans hyperbolicus ist. Er ist eine symmetrische glockenförmige Funktion mit den folgenden Eigenschaften: • Maximalamplitude = 𝐴0 • Halbwertsbreite des Amplitudenprofils = 2.63𝜏0
Abb. 23.42 Der Sekans hyperbolicus im Vergleich zu einer Gaußfunktion derselben Höhe und Halbwertsbreite.
• Fläche unter dem Amplitudenprofil = 2π 𝐴0 𝜏0 2 • Intensität 𝐼(𝑡) ∝ |𝐴0 |2 sech (𝑡∕𝜏0 ); Halbwertsbreite 𝜏HWB = 1.76 𝜏0 Die nichtlineare Wellengleichung für langsam variierende Einhüllende
Um die Ausbreitung eines optischen Pulses in einem nichtlinearen dispersiven Medium zu beschreiben, das sowohl Gruppengeschwindigkeitsdispersion als auch Selbstphasenmodulation zeigt, beginnen wir mit der Wellengleichung (5.40) bzw. (22.3), [∇2 −
1 𝜕2 𝜕2 ℰ = 𝜇 (𝒫 + 𝒫nl ) , ] 0 𝜕𝑡2 𝐿 𝑐02 𝜕𝑡2
(23.143)
wobei ℰ(r, 𝑡) das elektrische Feld ist, 𝒫𝐿 (r, 𝑡) die lineare Komponente der Polarisation, die durch die Dispersion des Mediums bestimmt wird, und 𝒫nl = 4𝜒 (3) ℰ 3 die nichtlineare Komponente der Polarisation, die wir als nichtdispersiv annehmen. Wir bringen den linearen Term von der rechten auf die linke Seite von Gl. (23.143) und transformieren die Gleichung in den Fourierbereich und erhalten so [∇2 + 𝛽 2 (𝜔)]ℰ = −𝜇0 𝜔2 𝒫nl ,
(23.144)
wobei 𝛽(𝜔) die Ausbreitungskonstante im linearen Medium ist und 𝐸 = 𝐸(r, 𝜔) und 𝑃nl = 𝑃nl (r, 𝜔) die Fouriertransformierten von ℰ(r, 𝑡) bzw. 𝒫nl (r, 𝑡) sind. Ohne die Nichtlinearität entspricht Gl. (23.144) der Helmholtzgleichung (5.31). Wir betrachten einen optischen Puls aus einer ebenen Welle, der sich in 𝑧-Richtung mit der zentralen Kreisfrequenz 𝜔0 und der zentralen Wellenzahl 𝛽0 = 𝛽(𝜔0 ) = 𝜔0 ∕𝑐 ausbreitet, ℰ = Re{𝒜(𝑧, 𝑡) exp[i(𝜔0 𝑡 − 𝛽0 𝑧]} ,
(23.145)
und nehmen an, dass die komplexe Einhüllende 𝒜 eine langsam variierende Funktion von 𝑡 und 𝑧 (im Vergleich zur Periode 2π∕𝜔0 bzw. zur Wellenlänge 2π∕𝛽0 ) ist. Wir machen nun drei Annahmen: (i) langsam variierende Einhüllende, (ii) schwache Dispersion und
23.5 Ultraschnelle nichtlineare Optik
(iii) kleine Nichtlinearität. Damit können wir zeigen, dass die Einhüllende 𝒜(𝑧, 𝑡) die Differentialgleichung 𝐷𝜈 𝜕 2 𝒜 𝜕 1 𝜕 + 𝛾|𝒜|2 𝒜 + i ( + ) 𝒜 = 0 (23.146) 4π 𝜕𝑡2 𝜕𝑧 𝑣 𝜕𝑡 erfüllt, wobei 𝑣 = 1∕𝛽 ′ die Gruppengeschwindigkeit ist, 𝐷𝜈 = 2π 𝛽 ′′ der Dispersionskoeffizient, 𝛽 ′ und 𝛽 ′′ die ersten bzw. zweiten Ableitungen von 𝛽(𝜔) nach 𝜔 am Punkt 𝜔 = 𝜔0 und 𝛾 durch Gl. (23.141) gegeben ist. Für ein lineares Medium ist 𝛾 = 0, und wir erhalten wieder die lineare Wellengleichung (23.85) für langsam variierende Einhüllende.
Herleitung: Die nichtlineare Wellengleichung für langsam variierende Einhüllende Wir beginnen mit der nichtlinearen Helmholtzgleichung (23.144) und leiten die nichtlineare Gleichung (23.146) für langsam variierende Einhüllenden mithilfe bestimmter Näherungen her. Wenn wir 𝐸 = 𝐴(𝑧, 𝜔 − 𝜔0 ) exp(−i𝛽0 𝑧) und 𝑃nl = 𝐴nl (𝑧, 𝜔 − 𝜔0 ) exp(−i𝛽0 𝑧) in Gl. (23.144) einsetzen und 𝛺 = 𝜔 − 𝜔0 definieren, erhalten wir [
𝜕2 + 𝛽 2 (𝜔)] [𝐴(𝑧, 𝜔) exp(−i𝛽0 𝑧)] 𝜕𝑧2 = −𝜇0 𝜔2 𝐴nl (𝑧, 𝛺) exp(−i𝛽0 𝑧) .
(23.147)
Wir vereinfachen jetzt Gl. (23.147) durch mehrere Näherungen: • Wegen 𝜔 ≈ 𝜔0 können wir den Faktor 𝜔2 auf der rechten Seite von Gl. (23.147) näherungsweise gleich 𝜔02 setzen. • Mit der Näherung der langsam variierenden Einhül2 lenden, (d ∕ d𝑧2 )[𝐴 exp(−i𝛽0 𝑧)] ≈ [−i2𝛽0 d𝐴∕ d𝑧 − 𝛽02 𝐴] exp(−i𝛽0 𝑧) wird aus Gl. (23.147) [−i2𝛽0
] [ d ] 𝐴 + 𝛽 2 (𝜔0 + 𝛺) − 𝛽02 𝐴 = −𝜇0 𝜔02 𝐴nl . d𝑧 (23.148)
• Wenn wir schwache Dispersion annehmen, gilt 𝛽 2 (𝜔0 + 𝛺) − 𝛽02 ≈ 2𝛽0 [𝛽(𝜔0 + 𝛺) − 𝛽0 ]. Wenn wir dafür weiterhin eine Taylorentwicklung mit drei Ter1 men ansetzen, 𝛽(𝜔0 + 𝛺) = 𝛽0 + 𝛽 ′ 𝛺 + 𝛽 ′′ 𝛺2 , erhal2 ten wir aus Gl. (23.148)
nur den Term bei 𝜔0 mitnehmen, können wir 𝒫nl = Re{𝒜nl (𝑧, 𝑡) exp[i(𝜔0 𝑡 − 𝛽0 𝑧)]} schreiben, wobei 𝒜nl (𝑧, 𝑡) eine langsam variierende Einhüllende ist. Mithilfe von Gl. (23.145) folgt dann [siehe Gl. (22.44a)] 𝐴nl = 3𝜒 (3) |𝐴|2 𝐴 .
(23.150)
Schließlich transformieren wir Gl. (23.149) zurück in den Zeitbereich, wobei wir die Tatsache benutzen, dass i𝛺𝐴(𝑧, 𝛺) und −𝛺2 𝐴(𝑧, 𝛺) äquivalent zu 𝜕𝐴∕𝜕𝑡 bzw. 𝜕 2 𝐴∕𝜕𝑡2 sind. Mithilfe von Gl. (23.150) erhalten wir dann die nichtlineare Gleichung (23.146) für langsam variierende Einhüllende. Wir können Gl. (23.134) auch erhalten, indem wir annehmen, dass das nichtlineare Medium näherungsweise linear ist mit einer Ausbreitungskonstante 𝛽(𝜔) + Δ𝛽 mit Δ𝛽 = (𝜔0 ∕𝑐0 )𝑛2 𝐼. Wir nehmen an, dass sich die Intensität 𝐼 = |𝐴|2 ∕2𝜂 so langsam ändert, dass sie als zeitunabhängig betrachtet werden kann. Die Fourieranalyse, die zu der Differentialgleichung (23.89) für das lineare Medium führte, enthält dann einfach einen zusätzlichen Term proportional zu Δ𝛽. Dieser Term produziert den zusätzlichen Term 𝛾|𝐴|2 𝐴, sodass wir wieder zu Gl. (23.146) gelangen. Die nichtlineare Schrödingergleichung
Die komplexe Einhüllende 𝒜(𝑧, 𝑡) eines optischen Pulses aus einer ebenen Welle, der sich in einem ausgedehnten nichtlinearen dispersiven Medium mit der Gruppengeschwindigkeit 𝑣, dem Dispersionsparameter 𝛽 ′′ und dem nichtlinearen Koeffizienten 𝛾 in 𝑧-Richtung ausbreitet, muss Gl. (23.146) erfüllen. Wie zuvor erwähnt ist eine Lösung in Form einer solitären Welle möglich, wenn 𝛽 ′′ < 0 (d. h. die Gruppengeschwindigkeitsdispersion negativ) und 𝛾 > 0 (d. h. der optische Kerrkoeffizient 𝑛2 > 0) ist. Es ist zweckmäßig, Gl. (23.146) durch dimensionslose Variablen auszudrücken, indem die Zeit, die Entfernung und die Amplitude auf 𝜏0 , 2𝑧0 bzw. 𝐴0 normiert werden: • 𝜏0 ist die Pulslänge • 𝑧0 = 𝜏02 ∕2𝛽 ′′ ist die Dispersionslänge des linearen dispersiven Mediums für diese Impulslänge • 𝐴0 = (−𝛽 ′′ ∕𝛾)1∕2 ∕𝜏0 ist die Maximalamplitude des Pulses, die die Solitonbedingung Gl. (23.140) erfüllt.
d𝐴 1 + 2𝛽0 (𝛺𝛽 ′ + 𝛺2 𝛽 ′′ ) 𝐴 = −𝜇0 𝜔02 𝐴nl . 2 d𝑧 (23.149)
Wenn wir ein retardiertes Koordinatensystem verwenden und die dimensionslosen Variablen 𝑡 − 𝑧∕𝑣 𝑧 𝐴 t= , z= , 𝜓= (23.151) 𝜏0 2𝑧0 𝐴0
• Wegen 𝒫nl = 4𝜒 (3) ℰ 3 enthält 𝒫nl Komponenten in der Nähe der Frequenzen 𝜔0 und 3𝜔0 . Wenn wir
definieren, erhalten wir aus der nichtlinearen Wellengleichung für langsam variierende Einhüllende in
−i2𝛽0
845
846
23 Ultraschnelle Optik
Gl. (23.146)
Solitonen höherer Ordnung
𝜕𝜓 1 𝜕2𝜓 + |𝜓|2 𝜓 + i =0, 2 𝜕t2 𝜕z
(23.152)
worin wir unschwer die nichtlineare Schrödingergleichung erkennen. Das fundamentale Soliton
Die einfachste Lösung von Gl. (23.152) in Form einer solitären Welle erhalten wir, wenn wir eine räumlich-zeitlich separierbare Funktion der Form 𝜓(z, t) = 𝒯(t) exp[i𝒵(z)] annehmen, wobei 𝒯(t) und 𝒵(z) reelle Funktionen sind. Durch direktes Einsetzen in Gl. (23.152) und Separation der Variablen erhalten wir daraus zwei Differentialgleichungen: 𝒵 ′ (z) = 𝜗 und 𝒯 ′′ (t) = 2(𝜗 − 𝒯 2 )𝒯 mit einer Konstante 𝜗. Wenn wir annehmen, dass für |t| → ∞𝒯 = 𝒯 ′ = 0 gilt und für t = 0 entsprechend 𝒯 = 1 und 𝒯 ′ = 0, können wir diese gewöhnlichen Differentialgleichungen durch direkte Integration lösen und erhalten 𝒯(t) = sech(t) und 1 𝒵(z) = z. Die normierte Amplitude ist daher
Das fundamentale Soliton ist nur eine aus einer ganzen Familie von Lösungen der nichtlinearen Schrödingergleichung mit Eigenschaften einer solitären Welle. Für einen einfallenden Puls 𝜓(0, 𝑡) = 𝑁 sech(𝑡) mit einer ganze Zahl 𝑁 wird die Lösung als N-Solitonen-Welle bezeichnet. Eine solche Welle breitet sich als periodische Funktion von z mit der Periode zP = π∕2 aus, der Solitonperiode. Sie entspricht einer physischen Entfernung 𝑧P = π|𝑧0 | = (π∕2)𝜏02 ∕|𝛽 ′′ |. Bei 𝑧 = 0 ist die Einhüllende 𝒜(0, 𝑡) ein Sekans hyperbolicus mit der Maximalamplitude 𝑁𝐴0 , d. h. 𝑁-mal größer als das fundamentale Soliton. Während der Ausbreitung zieht sich der Puls am Anfang zusammen, spaltet sich dann in getrennte Pulse auf, die anschließend verschmelzen und schließlich bei 𝑧 = 𝑧P wieder den anfänglichen Puls ergeben. Dieses Muster wiederholt sich periodisch. Beispielsweise hat das Soliton für 𝑁 = 2 eine normierte Amplitude 𝜓(z, t) = 4
2
𝜓(z, t) = sech(t) exp(iz∕2) .
(23.153)
Diese Lösung wird fundamentales Soliton genannt. Es entspricht einer Einhüllenden 𝒜(𝑧, 𝑡) = 𝐴0 sech (
𝑡 − 𝑧∕𝑣 ) exp(i𝑧∕4𝑧0 ) , 𝜏0
(23.154)
die sich mit der Geschwindigkeit 𝑣 ausbreitet, ohne ihre Form zu verändern. Diese Lösung ergibt sich für einen bei 𝑧 = 0 einfallenden Puls 𝒜(0, 𝑡) = 𝐴0 sech(𝑡∕𝜏0 ) .
(23.155)
N=1
cosh 3𝑡 + 3e4iz cosh 𝑡 eiz∕2 , (23.156) cosh 4𝑡 + 4 cosh 2𝑡 + 3 cos 4z
deren Betrag in Abb. 23.43 illustriert ist. Die periodische Kompression und Dehnung der Mehrsolitonenwelle entsteht durch ein periodisches Ungleichgewicht der Pulskompression, die aus dem Chirp aufgrund der Selbstphasenmodulation einerseits und der Pulsverbreiterung aufgrund der Gruppengeschwindigkeitsdispersion andererseits resultiert. Die anfängliche Kompression konnte zur Erzeugung von Subpikosekundenpulsen verwendet werden. Soliton-Soliton-Wechselwirkung
Wenn zwei durch einen zeitlichen Abstand getrennte Solitonen in ein nichtlineares Medium eintreten, ändern sich ihre Form und ihr Zeitabstand, als ob sie anziehen-
N=2
z zp
z zp 1.5
1.5 1
1
0.5
2
0
2
t / τ0
0
0.5
2
0
2
t / τ0
0
Abb. 23.43 Ausbreitung des fundamentalen Solitons (N = 1) und das Solitons für N = 2.
23.5 Ultraschnelle nichtlineare Optik
de oder abstoßende Kräfte spürten, die sie zueinander ziehen oder sie voneinander wegstoßen. Beispielsweise ziehen sich zwei identische fundamentale Solitonen während ihrer Ausbreitung durch das Medium zu Beginn an und ihr Zeitabstand reduziert sich, bis sie zu einem einzigen Puls verschmelzen. Daraufhin erfahren sie Abstoßungskräfte, die sie wieder in zwei Pulse trennen. Dieser Prozess wiederholt sich periodisch mit einer Periode 𝐿P = π exp(T ∕2𝜏0 ) 𝑧0 ,
(23.157)
wobei T der anfängliche Abstand von Zentrum zu Zentrum ist, 𝜏0 die Breite der einzelnen Solitonen und 𝑧0 die Dispersionslänge der Gruppengeschwindigkeitsdispersion. Dies kann durch Lösung der nichtlinearen Schrödingergleichung mit den passenden Randbedingungen gezeigt werden. Für T = 10𝜏0 , sodass die Pulse deutlich getrennt sind und nur ihre Ausläufer wechselwirken, ist 𝐿P ≈ 466𝑧0 ziemlich groß. Trotzdem kann dieser Effekt z. B. in langen optischen Fasern wichtig sein, da er faseroptische Nachrichtensysteme limitieren kann, die Solitonen zur Darstellung von Bits verwenden, wie in Abschnitt 25.2.5 beschrieben wird. Beispiel 23-10: Solitonen in optischen Fasern
Ultrakurze Solitonen konnten in Glasfasern bei Wellenlängen im Gebiet der anomalen Dispersion erzeugt werden (𝜆0 > 1.3 μm), wo die Gruppengeschwindigkeitsdispersion negativ ist. Erstmals wurden sie in einer 700 m langen Einmoden-Quarzglasfaser mithilfe von Pulsen aus einem modengekoppelten Laser bei einer Wellenlänge von 𝜆0 = 1.55 μm beobachtet. Die Pulsform entsprach ziemlich genau einem Sekans hyperbolicus mit 𝜏0 = 4 ps (entsprechend 𝜏HWB = 1.76 𝜏0 = 7 ps). Bei dieser Wellenlänge ist der Dispersionskoeffizient 𝐷𝜆 = 16 ps∕(nm km) (siehe Abb. 10.28) entsprechend 𝛽 ′′ = 𝐷𝜈 ∕2π = (−𝜆02 ∕𝑐0 )𝐷𝜆 ∕ 2π ≈ −20 ps2 ∕km. Der Brechungsindex ist 𝑛 = 1.45 und der nichtlineare Koeffizient 𝑛2 = 3.19 × 10−20 m2 ∕W entsprechend 𝛾 = (π∕𝜆0 )𝑛2 ∕𝜂 = 2.48 × 10−16 m∕V2 (wobei 𝜂 = 𝜂0 ∕𝑛 = 260 Ω ist). Die Amplitude ist 𝐴0 = (|𝛽 ′′ |∕𝛾)1∕2 ∕𝜏0 ≈ 2.25 × 106 V∕m entsprechend einer Intensität 𝐼0 = 𝐴02 ∕2𝜂 ≈ 106 W∕cm2 . Wenn die Querschnittsfläche der Faser 10 μm2 beträgt, entspricht das einer Leistung von ungefähr 100 mW. Die Solitonperiode beträgt 𝑧P = π 𝑧0 = π 𝜏02 ∕2|𝛽 ′′ | = 1.26 km. Erzeugung und Erhaltung von Solitonen
Um das fundamentale Soliton anregen zu können, muss der Eingabepuls das Sekans-hyperbolicus-Profil mit dem exakten Produkt 𝐴0 𝜏0 aus Amplitude und Breite gemäß Gl. (23.140) besitzen. Ein zu kleiner Wert die-
ses Produkts führt zur Anregung eines gewöhnlichen optischen Pulses, wohingegen ein größerer Wert das fundamentale Soliton oder eventuell ein Soliton höherer Ordnung anregt, die restliche Energie aber in einen unerwünschten normalen Puls lenkt. Wenn der anfängliche Puls ein anderes Profil hat oder gechirpt ist, kann sich der entstehende Puls unter bestimmten Bedingungen nach einer Entfernung von einigen Solitonperioden zu einem fundamentalen Soliton oder einem Soliton höherer Ordnung entwickeln. Wenn das Medium verlustbehaftet ist, wird die Pulsleistung allmählich dissipiert, sodass der nichtlineare Effekt schwächer wird und dispersive Effekte überwiegen, was zu einer Pulsverbreiterung und dem Verlust der Solitonnatur des Pulses führt. In optischen Fasern kann dieses Problem durch Ausgleich der Absorptionsund Streuverluste durch verteilte Ramanverstärkung behoben werden (siehe Abschnitt 15.3.4 und 22.3.1). Auch eine lokalisierte Verstärkung ist möglich, wenn der Abstand der einzelnen Verstärker deutlich kleiner als die Solitonperiode 𝑧P ist. Wegen ihrer einzigartigen Fähigkeit, ihre Form und Breite über große Entfernungen der Ausbreitung beizubehalten, sind optische Solitonen von großem Interesse für die Übertragung von digitalen Daten durch optische Fasern mit höheren Geschwindigkeiten und über längere Entfernungen als heute mit linearer Optik möglich (siehe Abschnitt 25.1.5). Optische Solitonen mit Dauern von einigen zehn Pikosekunden wurden in optischen Fasern erfolgreich über viele tausend Kilometer übertragen. Solitonlaser
Mithilfe von optischen Faserlasern können Pikosekunden-Solitonen erzeugt werden. Der Laser ist dabei eine Einmodenfaser in einer Ringresonator-Anordnung (Abb. 23.44). Die Faser ist eine Kombination aus einem erbiumdotierten Faserverstärker (siehe Abschnitt 15.3.3) und einer undotierten Faser, die für die Pulsformung verantwortlich ist und das Soliton erzeugt. Die Pulse werden mithilfe eines Phasenmodulators erzeugt, der die Modenkopplung bewirkt. Auf der GrundPumpe
Ausgang Koppler
Phasenmodulator undotierte Faser erbiumdotierter (Pulsformung) Faserverstärker
Abb. 23.44 Ein Solitonlaser aus einer optischen Faser.
847
848
23 Ultraschnelle Optik
lage einer InGaAsP-Laserdiode als Pumpe und eines integriert-optischen Phasenmodulators kann ein vollständig integriertes System konstruiert werden. Dunkle Solitonen
Ein dunkles Soliton ist ein kurzer Einbruch der Intensität einer ansonsten kontinuierlichen Lichtwelle. Dunkle Solitonen haben ähnliche Eigenschaften wie die zuvor beschriebenen „hellen“ Solitonen, können aber im Bereich der normalen Dispersion (𝜆0 < 1.3 μm in Quarzfasern) erzeugt werden. Sie zeigen robuste Eigenschaften, die für optische Schalter von Nutzen sein können. Die Analogie zwischen zeitlichen und räumlichen Solitonen
Die in Abschnitt 23.5.3 beschriebenen optischen Solitonen sind Analoga der räumlichen Solitonen (selbstgeführten Strahlen), die wir in Abschnitt 22.3.2 diskutiert hatten. Räumliche Solitonen sind monochromatische Wellen, die räumlich in der transversalen Ebene lokalisiert sind. Sie breiten sich als Folge eines Gleichgewichts zwischen Beugung und räumlicher Selbstphasenmodulation in einem nichtlinearen Medium aus, ohne ihre räumliche Verteilung zu verändern. Ihre Ausbreitung wird durch die nichtlineare Schrödingergleichung −
𝜕𝒜 𝜆 𝜕2 𝒜 + 𝛾|𝒜|2 𝒜 + i =0 4π 𝜕𝑥2 𝜕𝑧
(23.158)
beschrieben, wobei 𝛾 = π 𝑛2 ∕𝜆𝜂0 ist und 𝑛2 den optischen Kerrkoeffizienten bezeichnet. Gleichung (23.158) ist äquivalent zu Gl. (22.52). Die nichtlineare Schrödingergleichung (23.150), die zeitliche Solitonen in nichtlinearen dispersiven Medien beschreibt, kann im bewegten Koordinatensystem (𝑡′ = 𝑡 − 𝑧∕v, 𝑧′ = 𝑧) als 𝐷𝜈 𝜕 2 𝒜 𝜕𝒜 + 𝛾|𝒜|2 𝒜 + i =0 4π 𝜕𝑡2 𝜕𝑧
(23.159)
mit 𝛾 = π 𝑛2 ∕𝜆𝜂0 geschrieben werden. Dieses Resultat ist mit Gl. (23.158) identisch, wobei die Zeit 𝑡 die Rolle der transversalen Koordinate 𝑥 übernimmt und der Dispersionskoeffizient −𝐷𝜈 (der die Pulsdispersion bestimmt) die Rolle der Wellenlänge 𝜆 spielt (die die Strahlbeugung bestimmt). Zeitliche Solitonen sind daher offensichtlich formale Analoga von räumlichen Solitonen. Der Ausdruck Soliton beschreibt in der Tat allgemeine Lösungen der nichtlinearen Schrödingergleichung für Pulse, die sich ohne Änderung ausbreiten; sie können zeitlich oder räumlich sein.
Räumlich-zeitliche Solitonen und Lichtkugeln
Ein räumlich-zeitliches Soliton ist ein kombiniertes zeitliches und räumliches Soliton, d. h. ein gepulster Strahl, dessen räumliches und zeitliches Profil bei der Ausbreitung durch ein nichtlineares Medium mit einem optischen Kerreffekt unverändert bleiben (siehe Abb. 23.45). In diesem Fall werden die zeitliche Verbreiterung durch die negative (anomale) Dispersion und die räumliche Verbreiterung durch Beugung gleichzeitig durch die Selbstphasenmodulation und die Selbstfokussierung aufgrund des positiven nichtlinearen optischen Kerreffekts ausgeglichen. Die partielle Differentialgleichung, die diese drei Phänomene beschreibt, ist eine Kombination der Gln. (23.158) und (23.159), −
𝐷𝜈 𝜕 2 𝒜 𝜆 2 𝜕𝒜 + 𝛾|𝒜|2 𝒜 + i = 0 . (23.160) ∇t 𝒜 + 4π 4π 𝜕𝑥2 𝜕𝑧
Eine notwendige Bedingung für räumlich-zeitliche Solitonen ist die Gleichheit der Dispersionslänge |𝑧0 | = π𝜏02 und der Beugungslänge 𝑧0 = π𝑊02 ∕𝜆; es muss folglich 𝜏0 ∕𝑊0 = (𝜆∕|𝐷𝜈 |)1∕2 gelten.
23.5.3
Superkontinuumslicht
Superkontinuumslicht ist sehr helles Licht mit einem ultrabreiten kontinuierlichen Spektrum. Zur Erzeugung eines Superkontinuums wird ein ultrakurzer optischer Puls mit einer hohen Spitzenleistung (eine Pumpe) durch ein nichtlineares Medium mit besonderen dispersiven Eigenschaften geführt; hierfür werden z. B. dispersionsverschobene und dispersionsflache Mikrostrukturen und mikrostrukturierte Fasern verwendet. Superkontinuums-Lichtquellen mit Spektren von 400 bis 3000 nm wurden demonstriert. Zur Erzeugung eines Superkontinuums können verschiedene nichtlineare Mechanismen einzeln oder gemeinsam beitragen, z. B. Selbstphasenmodulation (SPM, engl. self-phase modulation), induzierte Ramanstreuung (SRS, engl. stimulated Raman scattering), Vierwellenmischung (FWM, engl. four-wave mixing) oder die Solitonen-Eigenfrequenzverschiebung (SSFS, engl. soliton self-frequency shift). Diese nichtlinearen Effekte hängen von dem Vorzeichen der Dispersion des Mediums bei der zentralen Wellenlänge 𝜆0 des Pumppulses und der relativen Lage der dispersionsfreien Wellenlänge 𝜆df des Mediums ab. Die breitesten Spektren von Superkontinua entstehen, wenn 𝜆0 nahe bei 𝜆df liegt. Die Verfügbarkeit von nichtlinearen photonischen Kristallfasern mit 𝜆df in der Nähe der Wellenlänge von Ti:Saphir-Lasern machte die Erzeugung von Superkontinua erstmals möglich.
23.5 Ultraschnelle nichtlineare Optik
x
cτ(z)
x
W (z) W0
z
W0
W0
cτ0
z
cτ0
cτ0 (a)
(b)
Abb. 23.45 (a) Räumliche und zeitliche Verbreiterung eines gepulsten Strahls infolge der Ausbreitung in einem linearen dispersiven Medium. (b) Ein räumlich-zeitliches Soliton ist ein gepulster Strahl, der seine räumlichen und zeitlichen Profile bei der Ausbreitung in einem nichtlinearen Medium aufrechterhält.
bei 𝜆df liegt, verbreitert die Kombination aus Selbstphasenmodulation und induzierter Ramanstreuung das Spektrum in die anomale Region und schafft Bedingungen, unter denen Solitonen entstehen können. Optische Solitonen erfahren im Allgemeinen eine Abwärtsverschiebung ihrer Trägerfrequenz entsprechend einer Verschiebungen zu größeren Wellenlängen, wodurch die Pumpleistung zunimmt. Vierwellenmischung kann ebenfalls zur Erzeugung eines Superkontinuums beitragen. In einer mikrostrukturierten Faser mit zwei weit auseinander liegenden dispersionsfreien Wellenlängen, zwischen denen 𝜆0 liegt, sind die dominanten nichtlinearen Mechanismen für die spektrale Verbreiterung Selbstphasenmodulation und Vierwellenmischung. Die Selbstphasenmodulation verbreitert den Pumppuls und sorgt so dafür, dass die Phasenbedingungen für die Vierwellenmischung erfüllt sind. Dabei entsteht neues Licht sowohl bei kleineren als auch bei größeren Frequenzen entsprechend der Erzeugung eines Superkontinuums mit einem Doppelmaximum-Spektrum. Bei ausreichender Verbreiterung können die beiden Peaks zu einer einzelnen flachen Verteilung verschmelzen.
Im Folgenden geben wir eine kurze Beschreibung der wesentlichen nichtlinearen Mechanismen, die zur Erzeugung von Superkontinua beitragen; Abb. 23.46 illustriert diese Prozesse schematisch. ist der Hauptmechanismus für die Erzeugung von Superkontinua in nichtlinearen Fasern mit normaler Dispersion (𝐷𝜆 < 0) bei der zentralen Wellenlänge 𝜆0 der Pumpe, da in diesem Fall keine Solitonen gebildet werden können. Wie in Abschnitt 23.5.1 diskutiert, bewirkt Selbstphasenmodulation ein Chirpen des Pulses, das eine spektrale Verbreiterung verursacht. Ein Chirpparameter 𝑎 entspricht √ einer spektralen Verbreiterung um einen Faktor 1 + 𝑎2 . Für ein Medium der Länge 𝐿 mit einem optischen Kerrkoeffizienten 𝑛2 ist der Chirpparameter 𝑎 = 𝐿∕𝑧nl , wobei 𝑧nl = (2𝑛2 𝐼0 𝑘0 )−1 die nichtlineare charakteristische Länge und 𝐼0 die maximale Pulsintensität sind. Induzierte Ramanstreuung verbreitert die spektrale Verteilung weiter in Richtung größerer Wellenlängen, da sie eine Differenzfrequenzerzeugung bewirkt. Solitonen-Eigenfrequenzverschiebung entsteht durch intrapuls-induzierte Ramanstreuung. Wenn 𝜆0 nahe
spektral verbreitertes Licht
λ0
DispersionsDλ
nichtlineare Faser
spektrale Intensität
Eingangspuls
spektrale Intensität
Selbstphasenmodulation
λ0
λdf
λ0
λdf Soliton
SPM 500
SRS 1000
(a)
SPM/ SRS 1500
λ / nm
500
FWM
SSFS
1000
1500
λ / nm (b)
500
FWM
1000
1500
λ / nm (c)
Abb. 23.46 Die wesentlichen nichtlinearen Mechanismen für die Erzeugung von Superkontinua durch spektrale Verbreiterung eines durch eine nichtlineare dispersive Faser transmittierten ultrakurzen Pulses. (a) Selbstphasenmodulation in Kombination mit induzierter Ramanstreuung. (b) Solitonen-Eigenfrequenzverschiebung. (c) Vierwellenmischung.
849
850
23 Ultraschnelle Optik
Beispiel 23-11: Erzeugung von energiereichen Solitonen in einem photonischen Kristall Die Energie E = Aeff ∫ 𝐼(𝑡) d𝑡 eines Solitonpulses
kann durch Verwendung eines Stabs aus einem photonischen Kristall mit großer effektiver Modenfläche Aeff maximiert werden. Aufgrund der in den Gln. (23.140) und (23.141) angegebenen Bedingungen ist die Intensität des Solitons 𝐼(𝑡) = (|A0 |2 ∕2𝜂) 2 sech (𝑡∕𝜏0 ) mit |A0 |2 ∕2𝜂 = |𝛽 ′′ |𝜆0 ∕2π 𝑛2 𝜏02 . Wegen ∞ 2 ∫−∞ sech (𝑡∕𝜏0 ) d𝑡 = 2𝜏0 beträgt die Energie des Solitons E=
Aeff |𝛽 ′′ |𝜆0
π 𝑛2 𝜏0
.
(23.161)
Ein 36 cm langer Stab aus einem photonischen Kristall mit einer effektiven Modenfläche Aeff = 2300 μm2 wird von einem modengekoppelten Er3+ -dotierten Faserlaser gepumpt, der eine Folge von 360-fs-Pulsen mit einer Energie von 500 nJ bei einer Wellenlänge von 𝜆0 = 1550 nm und einer Wiederholrate von 1 MHz liefert. Der Stab erzeugt daraus durch SSFS optische Solitonen mit einer Dauer von 65 fs, einer Energie von 67 nJ, einer zentralen Wellenlänge von 𝜆0 = 1675 nm, einer Wiederholungsrate von 1 MHz und einer mittleren Leistung von 10 mW. Diese Quelle eignet sich für die Dreiphotonen-Fluoreszenzmikroskopie (Abschnitt 14.5.2).
23.5.4 Die Erzeugung höherer Harmonischer und Attosekundenoptik In den vorangegangenen Abschnitten dieses Kapitels haben wir ultraschnelle nichtlineare Phänomene im Kontext eines dielektrischen Mediums betrachtet, in dem die Bewegung der gebundenen Elektronen durch eine schwach nichtlineare Beziehung zwischen 𝒫 und ℰ charakterisiert war (Abb. 22.1). Gleichung (22.1) zeigt die Entwicklung der Polarisation 𝒫 in eine Taylorreihe in Potenzen des elektrischen Feldes ℰ, die für die Erzeugung der zweiten und dritten Harmonischen verantwortlich sind (sowie für eine Vielzahl anderer parametrischer Prozesse). Wenn die optische Feldstärke einen gewissen Betrag überschreitet, ist diese Entwicklung jedoch nicht mehr möglich, weil die Wechselwirkung zwischen Licht und Materie ganz neue physikalische Phänomene hervorbringt wie z. B. die Ionisation von Atomen (siehe Abschnitt 14.1.1). Dieser Bereich wird als extrem nichtlineare Optik bezeichnet. Bei der Erzeugung hoher Harmonischer (HHG, von engl. high-harmonic generation) ionisiert ein ultraschneller Infrarotpuls aus einem fokussierten Laserstrahl ein Gasatom und erzeugt dabei ein freies Elektron.
Das Elektron wird durch das anregende Laserfeld beschleunigt und gewinnt so kinetische Energie, bevor es wieder von seinem Stammatom eingefangen wird. Die anschließende Atom-Elektron-Rekombination erzeugt ein energiereiches Photon in Form eines Strahlungspulses mit Sub-Femtosekunden-Struktur. Dieser Vorgang findet gleichzeitig in vielen Atomen statt, die kohärent emittieren, da sie von der Wellenform des anregenden Lasers synchronisiert werden. Das diskrete Spektrum des emittierten Lichts besteht aus einem Frequenzkamm (Abschnitt 16.4.5), der Hunderte von Harmonischen der anregenden Laserfrequenz enthalten kann, die bis in den extremen UV-Bereich (EUV) reichen. Das Ergebnis ist ein eng kollimierter Lichtstrahl, der Wellenlängen enthält, die weitaus kürzer sind als die des anregenden Lasers. Die Erzeugung hoher Harmonischer dient dazu, infrarotes Licht in ultraviolette (EUV) Strahlung umzuwandeln und Attosekundenpulse zu erzeugen, wie dies in Abb. 23.47 schematisch dargestellt ist. Bei hohen Gasdrücken kann das HHG-Spektrum tausende von Harmonischen der anregenden Laserfrequenz enthalten und sich bis weit in den Bereich der weichen Röntgenstrahlung erstrecken. Emissionen aus einem einzelnen Atom
Ein vereinfachtes semiklassisches Modell der HHG wird als Rekollisionsmodell bezeichnet (Abb. 23.48). Dabei wird ein Gasatom als einzelnes Elektron in einem Potentialtopf modelliert [Abb. 23.48(a)]. Das anregende Laserfeld am Ort des Atoms wird als monochromatisch mit der Winkelfrequenz 𝜔0 und der Periode T = 2π∕𝜔0 sowie als in 𝑥-Richtung linear polarisiert angenommen. Die Photonenenergie ℏ𝜔0 des Lasers ist viel kleiner als die Ionisierungsenergie W des Atoms W, sodass keine normale Absorption von Photonen stattfinden kann. Der HHG-Prozess umfasst drei Schritte: 1) Während des ersten Viertels des optischen Zyklus [Abb. 23.48(b)] verzerrt das optische Feld den atomaren Potentialtopf und verwandelt ihn in eine endliche Potentialbarriere, durch die das Elektron zur Zeit 𝑡I tunnelt. Elektronen aus verschiedenen Atome tunneln zu unterschiedlichen Zeitpunkten. 2) Das freigesetzte Elektron wird im Vakuum durch das anregende Feld in +𝑥-Richtung von dem ionisierten Atom weg beschleunigt [Abb. 23.48(c)]. Wenn das Feld während des zweiten und dritten Viertels des optischen Zyklus seine Richtung umkehrt, kehrt auch das Elektron seine Flugrichtung um und wird in −𝑥-Richtung beschleunigt, zurück zu dem ionisierten Atom. Wenn es dort ankommt, wird das Potential in die entgegengesetzte Richtung verzerrt und
23.5 Ultraschnelle nichtlineare Optik
t
t
IR
ω
2ω0
0
t
Gas
IR
sichtbares Licht
Kristall 0 ω0
t
ω
EUV
0 ω0
(a) SHG
ω
0
2ω0
ω
(b) HHG
Abb. 23.47 Vergleich zwischen (a) Erzeugung der zweiten Harmonischen (SHG, entspricht einer Frequenzverdopplung) und (b) Erzeugung der höheren Harmonischen (HHG), bei der EUV-Lichtpulse im Attosekundenbereich erzeugt. t = ti
0
t = ti → tr
t = tr
ℰ
ℰ
x
ti
ti tr
tr
(a)
(b)
t
(c)
t
(d)
t
Abb. 23.48 Vereinfachtes dreistufiges Rekollisionsmodell der HHG. (a) Ein Gasatom wird als einzelnes Elektron im Grundzustand eines Potentialtopfs mit der Ionisierungsenergie W beschrieben. (b) Das optische Feld ℰ(t ) eines Lasers verändert den Potentialtopf und ermöglicht dem Elektron, zu einem Zeitpunkt tI in das Vakuum zu tunneln. (c) Das freie Elektron wird durch das negative optische Feld in +xRichtung beschleunigt, kehrt jedoch seine Richtung um, so-
bald das optische Feld positiv wird, und kehrt zum Zeitpunkt tR mit einer erhöhten kinetischen Energie E kin zu dem ionisierten Atom zurück. (d) Das Elektron rekombiniert mit dem Ion und emittiert ein EUV-Photon der Energie W + E kin , das wie dargestellt die Form eines gechirpten Strahlungspulses mit Sub-Femtosekunden-Struktur hat. Die Emissionen aller Atome, die von dem anregenden Laserpuls bestrahlt werden, addieren sich kohärent.
das Elektron erhält als Folge seiner Beschleunigung durch die ponderomotorische Kraft eine erhöhte kinetische Energie E kin . 3) Zum Zeitpunkt 𝑡R trifft das Elektron auf das ionisierte Atom, rekombiniert und fällt wieder in den Potentialtopf [Abb. 23.48(d)]. Dabei wird ein Photon mit der Energie ℏ𝜔 = W + E kin ≫ ℏ𝜔0 in Form eines Strahlungspulses mit Sub-Femtosekunden-Struktur emittiert. Das emittierte EUV-Licht hat eine Frequenz weit oberhalb der des anregenden IR-Lichts.
ven dieselbe Wahrscheinlichkeit des Auftretens, sodass pro optischem Zyklus zwei Strahlungspulse mit Attosekundenstruktur erzeugt werden, d. h. mit einer Periode T ∕2 = π∕𝜔0 . Eine solche periodische Folge von Ereignissen zeigt ein diskretes Spektrum mit Frequenzen in Abständen von 2π∕(T ∕2) = 2𝜔0 und Amplituden, die durch eine Fourierentwicklung gegeben sind (siehe Anhang A). Aus der Symmetrie von Atom und elektrischem Feld resultieren Komponenten bei ungeraden Harmonischen der anregenden Laserfrequenz in Abständen von 2𝜔0 , wie Abb. 23.47(b) schematisch zeigt.
Diese drei Schritte wiederholen sich in jedem Zyklus des anregenden Laserfeldes, was in einem periodischen Strom von Strahlungspulsen resultiert. Der Prozess kann jedoch auch in dem optischen Halbzyklus starten, der dem oben beschriebenen entgegengesetzt ist. In diesem Fall beschleunigt das freigesetzte Elektron zunächst in −𝑥-Richtung, bevor es die Richtung umkehrt und mit dem ionisierten Atom rekombiniert. Aus Symmetriegründen haben beide Alternati-
Energieübertragung vom Feld auf das Elektron
Die Eigenschaften der HHG werden durch die Energie bestimmt, die das anregende optische Feld dem Elektron auf seinem Ausflug verleiht. Die kinetische Energie, die ein Elektron während eines Ionisations-Rekombinations-Zyklus aufnimmt, können wir aus seiner Bahn im Vakuum berechnen. Das optische Feld des anregenden Lasers, ℰ(𝑡) = ℰ0 cos 𝜔0 𝑡 bei 𝑥 = 0, übt auf das Elektron
851
23 Ultraschnelle Optik
eine Kraft 𝑒ℰ = 𝑚0 a aus, was zu einer Beschleunigung a(𝑡) = (𝑒ℰ0 ∕𝑚0 ) cos 𝜔0 𝑡 in +𝑥-Richtung führt, wobei −𝑒 und 𝑚0 die Ladung bzw. Masse des Elektrons sind. Wenn die Ionisation zum Zeitpunkt 𝑡I eintritt und das Elektron mit einer Geschwindigkeit von null [𝑣(𝑡I ) = 0] an der Position 𝑥 = 0 emittiert wird, sind die Geschwindigkeit 𝑣(𝑡) = ∫ 𝑎(𝑡) d𝑡 des Elektrons, seine kinetische Energie E kin (𝑡) und seine Position 𝑥(𝑡) = ∫ 𝑣(𝑡) d𝑡 zum Zeitpunkt 𝑡 1
𝑣(𝑡) = 𝑣0 [sin 𝜔0 𝑡 − sin 𝜔0 𝑡I ] ,
E kin (𝑡) = 𝑚0 𝑣2 (𝑡) , 2
(23.162) 1
𝑥(𝑡) = 𝑥0 [cos 𝜔0 𝑡I − cos 𝜔0 𝑡 − 𝜔0 (𝑡 − 𝑡I ) sin 𝜔0 𝑡I ] , 2
(23.163) wobei 𝑣0 = 𝑒ℰ0 ∕𝑚0 𝜔0 und 𝑥0 = 2𝑒ℰ0 ∕𝑚0 𝜔02 ist. Diese Gleichungen beschreiben die Flugbahn des Elektrons und die Abhängigkeit seiner kinetischen Energie E kin = E kin (𝑡R ) als Funktion der Ionisationszeit 𝑡I und der Rekombinationszeit 𝑡R . Aus den numerischen Lösungen dieser Gleichungen, die in Abb. 23.49 dargestellt sind, ergeben sich eine Reihe von Schlussfolgerungen: • Aus Abb. 23.49(a) geht hervor, dass Elektronen, die zu Zeitpunkten 𝑡I im ersten Viertel des Laserzyklus (0 < 𝑡I < T ∕4) freigesetzt werden, im Laufe der letzten drei Viertel des Zyklus (T ∕4 < 𝑡R < T ) wieder an ihrem Stammatom ankommen. Je früher ein Elektron im ersten Viertel freigesetzt wird, desto später kommt es während der letzten drei Viertel zurück. Elektronen, die gleich zu Beginn des Zyklus freigesetzt werden (𝑡I = 0), kommen erst ganz am Ende des Zyklus wieder zurück (𝑡R = T ) und entfernen sich dazwischen am weitesten von ihrem Atom (maximaler Ab-
(a)
kinetische Energie
0.075 0.1
0 0
0.25
0.5 Zeit t /
0.75
𝜏0 = 1.588
𝜂0 𝑒 2 4π2 𝑚0 𝑐02
≈ 4.739 × 10−24 s (23.164)
ℰ02 ∕2𝜂0
von der Laserintensität 𝐼 = und der Laserwellenlänge 𝜆0 ab. Dabei ist 𝜂0 die Impedanz des Vakuums. Die maximale kinetische Energie ist proportional zur Intensität des Lasers und zum Quadrat seiner Wellenlänge. • Abbildung 23.49(c) zeigt, dass die kinetische Energie E kin des Elektrons als Funktion des Rekombinationszeitpunkts 𝑡R (der auch der Zeitpunkt der Photonenemission ist) in den letzten drei Vierteln des optischen Zyklus des anregenden Lasers größer als null ist und einen Maximalwert bei 𝑡R ≈ 0.7T besitzt. Die Brei3 te dieser Kurve beträgt daher ≈ T entsprechend et4 wa 2 fs bei einer Anregungswellenlänge von 800 nm.
1
1
tI / T = 0
0.05 0.5
E max = 𝜏0 𝜆02 𝐼 ,
kin / max
kinetische Energie
0.025
stand 𝑥0 ). Elektronen, die zu Zeitpunkten 𝑡I im zweiten Viertel des optischen Zyklus freigesetzt werden (T ∕4 < 𝑡I < 𝑇∕2), entkommen und kehren nie zu ihrem Atom zurück. • Aus Abb. 23.49(b) wird deutlich, dass ein bei 𝑡I = 0 freigesetztes Elektron mit einer kinetischen Energie von null (E kin = 0) zurückkehrt. Wenn 𝑡I zunimmt (immer innerhalb des ersten Zyklusviertels, also 0 < 𝑡I < 𝑇∕4), steigt die kinetische Energie des zurückkehrenden Elektrons monoton an, erreicht bei 𝑡I = 0.05T einen Spitzenwert E max = 0.794𝑚0 𝑣02 (entsprechend einer Geschwindigkeit von 1.26𝑣0 ) und fällt dann bei 𝑡I = T ∕4 wieder auf null ab. Die maximale kinetische Energie E max hängt gemäß
kin / max
1
Position x / x0
852
0.5
1
0
0
0.05 0.1 0.15 0.2 Ionisationszeit tI /
(b)
Abb. 23.49 (a) Normierte Bahnen x(t )∕x0 der freigesetzten Elektronen für verschiedene normierte Ionisationszeiten tI ∕T im ersten Viertel des Laserzyklus. Jede Bahn beginnt zum Zeitpunkt tI ∕T und endet zum zugehörigen Zeitpunkt
0.25
0.5
0 0.25
0.5 0.75 Rekombinationszeit tR/
1
(c)
tR ∕T der Rekombination. (b) Abhängigkeit der normierten kinetischen Energie von der normierten Ionisationszeit tI ∕T. (c) Abhängigkeit der normierten kinetischen Energie von der normierten Rekombinationszeit tR ∕T.
23.5 Ultraschnelle nichtlineare Optik
Emissionen aus einem Ensemble von Atomen
Die Eigenschaften eines erzeugten HHG-Strahls werden durch die kollektive Rekombination vieler Elektronen mit ihren zugehörigen ionisierten Atomen über einen gewissen Zeitraum innerhalb desselben Laserzyklus bestimmt. Abbildung 23.49(c) zeigt, dass die kinetische Energie E kin eines ankommenden Elektrons zwischen 0 und E max liegt, was bedeutet, dass die Energie des bei der Rekombination emittierten Photons im Bereich zwischen W und W + E max max liegt. Wenn die Ionisationswahrscheinlichkeit konstant und innerhalb des ersten Viertelzyklus unabhängig vom Ionisationszeitpunkt 𝑡I wäre, würde jeder erzeugte Puls als kohärente Überlagerung von Rekombinationsemissionen unterschiedlicher Atome entstehen. Jeder dieser Pulse hätte eine Gesamtdauer < T ∕2 und würde aufgrund der Abhängigkeit der kinetischen Energie 𝐸kin (𝑡R ) vom Zeitpunkt 𝑡R der Rekombination gechirpt, wie Abb. 23.49(c) zeigt. Die Frequenz 𝜔(𝑡R ) = [W + E kin (𝑡R )]∕ℏ des ausgesendeten Pulses wird für 𝑡R < 0.7T positiv und für 𝑡R > 0.7T negativ gechirpt. Die entsprechende spektrale Breite ist Δ𝜈 = E max ∕ℎ = 𝑀∕T , wobei 𝑀 = E max ∕ℎ𝜈0 die Anzahl der Harmonischen innerhalb des Spektralbands ist. Mithilfe von Pulskompressionstechniken könnte man den Chirp beseitigen und einen transformationsbegrenzten Puls erzeugen (Abschnitt 23.2). Dessen zeitliche Breite würde dabei auf einen Wert in der Größenordnung von T ∕𝑀 komprimiert werden. Wie Gl. (23.9) zeigt, besitzt ein transformationsbegrenzter Gaußpuls der spektralen Breite Δ𝜈HWB eine zeitliche Breite 𝜏HWB = 0.44∕Δ𝜈 = 0.44T ∕𝑀 hat, was nur ein kleiner Bruchteil der Laserperiode T ist Die Attosekundenoptik bietet Methoden, um HHG-Pulse zu entchirpen und einzelne Attosekundenpulse aus einer solchen Pulsfolge durch geeignete optische Verfahren zu isolieren. Beispiel 23-12: HHG-Attosekundenpulse in gasförmigem Argon
Ein ultraschneller Ti:Saphir-Laser, der bei einer Wellenlänge von 𝜆0 = 800 nm emittiert, sendet Femtosekundenpulse aus, die verstärkt und auf eine Intensität von 5 × 1014 W∕cm2 fokussiert werden. Die Infrarotpulse treffen zur Erzeugung höherer Harmonischer auf ein Gas aus Argonatomen (Ionisierungsenergie W = 15.78 eV). Das vereinfachte dreistufige HHG-Modell liefert hierfür eine maximale Entfernung der freigesetzten Elektronen von 𝑥0 = 2𝑒ℰ0 ∕ 𝑚0 𝜔02 = 1.94 nm und eine maximale kinetische Energie E max = 𝜏0 𝜆02 𝐼 ≈ 94.8 eV der Elektronen [siehe Gl. (23.164)]. Die maximale Energie eines emittierten Photons beträgt somit W + E max = 110.6 eV entsprechend einer Wellenlänge ≈ 11.2 nm im EUV. Da die
Energie der anregenden Photonen ℏ𝜔0 = 1.55 eV beträgt, ist die Anzahl der erzeugten Harmonischen 𝑀 = E max ∕ℏ𝜔0 ≈ 61. Die Periode des Laserzyklus beträgt T = 2.67 fs, sodass eine optimale Pulskompression eine Folge von Pulsen mit einer Dauer von T ∕61 ≈ 43.8 as liefern kann. Für sehr große Werte der Laserintensität ist die Ionisationswahrscheinlichkeit weder konstant noch unabhängig vom Ionisationszeitpukt 𝑡I innerhalb des ersten Zyklusviertels. Vielmehr dominiert eine Teilmenge der Ionisationszeitpunkte deutlich vor dem Ende des ersten Zyklusviertels, die größeren Werten des Feldes entspricht. Dies führt wiederum dazu, dass die Dauer der Emissionen unter T ∕2 fällt, wodurch SubFemtosekunden-Pulse ohne Kompression erreichbar werden. Kompressionstechniken können jedoch helfen, die zeitliche Breite der Pulse weiter auf ihren transformationsbegrenzten Wert zu verkleinern, der durch die gesamte spektrale Breite bestimmt wird. Um das Anwachsen des HHG-Lichts auf dem Weg durch das Gas zu unterstützen, muss die Phasenbedingung erfüllt sein, d. h. die Phasengeschwindigkeiten des anregenden Laserlichts und des HHG-Lichts müssen übereinstimmen (Abschnitt 22.2.4). Während die Phasengeschwindigkeit des hochfrequenten HHG-Lichts im Wesentlichen gleich der Vakuumlichtgeschwindigkeit 𝑐0 ist, ist die Phasengeschwindigkeit des Laserlichts kleiner und hängt vom Gasdruck ab. Eine Anordnung zur Erfüllung der Phasenbedingung leitet das Laserlicht durch einen Hohlkernwellenleiter, der mit dem Gas gefüllt ist. Während sich das geführte Laserlicht mit der Geschwindigkeit der geführten Mode ausbreitet, ist das hochfrequente HHG-Licht ungeführt und bewegt sich mit der Phasengeschwindigkeit 𝑐0 . In Abwesenheit des Gases ist die Geschwindigkeit der geführten Lasermode größer als 𝑐0 (da die Ausbreitungskonstante kleiner ist), sie kann jedoch durch Erhöhen des Gasdrucks auf 𝑐0 verringert werden, wodurch die Phasenbedingung erfüllt ist. Neben Ti3+:Saphir-Lasern werden für die HHG häufig ultraschnelle Yb3+:Quarzglas-Faserlaser mit hohen Wiederholraten verwendet. Auf diese Weise können kohärente Attosekundenpulse mit einigen hundert μW Leistung in einzelnen harmonischen Komponenten und Pulsdauern im Attosekundenbereich erzeugt werden. Die Attosekundenoptik hat eine Vielzahl von Anwendungen, insbesondere in Spektroskopie und Bildgebung. Sie ist auch für die Untersuchung von chemischen Reaktionen hilfreich, da sich die an solchen Reaktionen beteiligten Elektronen auf dieser Zeitskala bewegen. Licht bewegt sich mit einer Geschwindigkeit von 0.3 nm/as,
853
854
23 Ultraschnelle Optik
durchquert folglich der Durchmesser eines Wassermoleküls (0.3 nm) in einer Attosekunde. HHG unter Verwendung von Lasern im mittleren Infrarot kann im Prinzip mehrere Rekombinationen eines Elektrons mit seinem Stammion beinhalten, wodurch die Erzeugung von optischen Pulsen im Subattosekundenbereich (Zeptosekundenbereich) möglich sein könnte. HHG ist auch auf der Basis von Feststoffen möglich. Die Eigenschaften derartiger Emissionen aus kristallinen Festkörpern unterscheidet sich aufgrund der periodischen Kristallstruktur des Materials etwas von den Emissionen aus Gasen. Insbesondere hängt die erhaltene HHG-Strahlung von der Polarisation der einfallenden Strahlung ab und die erzeugten Frequenzkämme enthalten für Bandstrukturen ohne Inversionssymmetrie sowohl gerade als auch ungerade Harmonische. Die Überlagerung einer Anzahl von Frequenzkämmen im EUV oder weichen Röntgenbereich mit geringfügig unterschiedlichen spektralen Abständen, die durch Abtasten der Anregungslaserwellenlänge und Mittelung erzeugt werden können, kann in diesen als quasi-superkontinuierliche Quelle in diesen Spektralbereichen dienen. Attosekundenstrahlung kann auch von Freie-Elektronen-Lasern erzeugt werden (Abschnitt 16.3.6); allerdings sind FEL derzeit nur in großen Institutionen verfügbar. Einschränkungen des Modells
Obwohl die vorgestellte semiklassische Analyse stark vereinfacht ist, erfasst sie viele der wesentlichen Merkmale der HHG und der Erzeugung von Attosekundenpulsen. Wir haben viele Vereinfachungen und Näherungen vorgenommen: (1) unser Atommodell enthält nur ein einziges aktives Elektron, (2) obwohl wir angenommen haben, dass das Elektron durch die Potentialbarriere tunnelt, haben wir es eher als klassisches Teilchen denn als quantenmechanisches Wellenpaket behandelt, (3) wir haben die Ionisation als instantan angenommen und die Wirkung des Coulombfeldes, das mit dem resultierenden ionisierten Atom verknüpft ist, ignoriert, (4) unsere Analyse ist eindimensional und (5) wir haben angenommen, dass das Feld linear polarisiert sein soll. Fortschritte auf dem Gebiet der Attosekundenoptik haben die Entwicklung anspruchsvollerer Modelle ermöglicht, die eine deutlich wirklichkeitsgetreuere Beschreibung der HHG bieten.
23.6 Pulsdetektion Die Detektion eines ultraschmalen optischen Pulses ist ein schwieriges Unterfangen, da selbst die schnellsten verfügbaren Photodetektoren gewöhnlich zu langsam
sind. Die Verfahren zur Lösung dieses Problems beruhen in erster Linie auf der Verwendung eines ultraschnellen optischen Verschlusses, der durch einen weiteren kürzeren Referenzpuls gesteuert wird, sowie einem Mechanismus zur Einführung einer kontrollierten Zeitverzögerung zwischen den beiden Pulsen. Das durch den Verschluss durchgelassene Licht wird für unterschiedliche Verzögerungen gemessen, woraus das Profil der Pulsintensität 𝐼(𝑡) bestimmt werden kann. Zur Messung der Pulsphase 𝜙(𝑡) können interferometrische Techniken in Kombination mit nichtlinearen optischen Prozessen eingesetzt werden. Im Spektralbereich ist der Puls durch seine spektrale Intensität S (𝜈) und seine spektrale Phase 𝜓(𝜈) vollständig charakterisiert. Diese Funktionen können mithilfe von optischen Spektralanalysatoren und interferometrischen Techniken gemessen werden, wie im Folgenden beschrieben wird. Eine andere Herausforderung bei der Detektion von ultraschnellen Pulsen ist die Tatsache, dass die im Messsystem verwendeten optischen Komponenten zwangsläufig den Puls verändern, bevor er gemessen wird. Solche Effekte müssen durch sorgfältiges Systemdesign minimiert oder durch geeignete Signalverarbeitung nach der Detektion ausgeglichen werden.
23.6.1
Die Messung der Intensität
Direkte Photodetektion
Im Idealfall kann das Intensitätsprofil eines kurzen optischen Pulses direkt durch einen Photodetektor gemessen werden, dessen Antwortzeit viel kürzer ist als die Pulsdauer. Der gemessene Photostrom 𝑖P (𝑡) = ℛA𝐼(𝑡)
(23.165)
ist proportional zur Pulsintensität 𝐼(𝑡), wobei A die aktive Fläche des Detektors ist und ℛ seine Ansprechempfindlichkeit (in A/W, siehe Abschnitt 19.1.2). Wir nehmen dabei an, dass A so klein ist, dass die optische Intensität am Ort des Detektors registriert wird. Wenn die Antwortzeit des Detektors im Vergleich zur Pulsdauer nicht kurz ist – was im Kontext ultraschneller optischer Pulse der Normalfall ist –, ist der Puls des Photostroms ein verbreitertes und verzerrtes Abbild des optischen Pulses. Wenn ℎD (𝑡) die Impulsantwortfunktion des Detektors ist, wobei ∫ ℎD (𝑡) d𝑡 = ℛ gilt, dann ist der Photostrom die Faltung 𝑖P (𝑡) = A ∫ 𝐼(𝜏)ℎD (𝑡 − 𝜏) d𝜏 ,
(23.166)
die eine größere Breite als der optische Puls hat. In diesem Fall müssen andere Methoden verwendet werden,
23.6 Pulsdetektion
hD (t)
I(t)
(a)
(b)
i(t)
(c)
(a)
(b)
Abb. 23.50 Antwort eines Photodetektors mit der Impulsantwortfunktion hD (t ) auf drei Pulse von (a) langer, (b) mittlerer und (c) kurzer Dauer.
(c)
t t
t
um die wahre Pulsform zu bestimmen. Wenn die Antwortzeit des Detektors [die Breite von ℎD (𝑡)] viel kürzer ist als die Pulsdauer [die Breite von 𝐼(𝑡)], dann reduziert sich Gl. (23.166) offensichtlich auf die ideale Beziehung Gl. (23.165). Im anderen Grenzfall, wenn der optische Puls viel kürzer ist als die Antwortzeit des Detektors, ist 𝑖P (𝑡) ≈ ℎD (𝑡)A ∫ 𝐼(𝜏) d𝜏 ,
(23.167)
sodass der Photostrom das zeitliche Profil der Impulsantwortfunktion des Detektors wiedergibt, nicht die des optischen Pulses. Die drei Fälle sind in Abb. 23.50 schematisch dargestellt. Wenn die Zeitkonstante 𝜏S der Empfängerschaltung größer ist als die Antwortzeit des Detektors, ist die Antwort 𝑖P (𝑡) ≈ 𝜏S−1 ∫ ℎD (𝑡) d𝑡 ⋅ A ∫ 𝐼(𝜏) d𝜏. Das ist eine Rechteckfunktion der Dauer 𝜏S , die in der Form 𝑖P (𝑡) ≈ 𝜏S−1 ℛA ∫ 𝐼(𝜏) d𝜏
(23.168)
geschrieben werden kann. Unter solchen Bedingungen misst der Empfänger die Fläche unter dem optischen Puls multipliziert mit der Intensität, d. h. die optische Energie des Pulses. Der Detektor hat nun keine zeitliche Auflösung mehr und wirkt nur noch als Integrator. Es stellt sich somit die Frage, wie man das zeitliche Profil eines ultrakurzen Pulses im Piko- oder Femtosekundenbereich unter Verwendung eines „langsamen“ Detektors mit einer Antwortzeit von einigen Zehntel Nanosekunden am besten messen kann. Messung eines kurzen Pulses mit einem langsamen Detektor und einem schnellen Verschluss
Das zeitliche Profil eines kurzen optischen Pulses kann auch mit einem langsamen Detektor gemessen werden, wenn ein schneller Verschluss verwendet wird. Wie in Abb. 23.51 dargestellt öffnet sich der Verschluss für ein kurzes Zeitfenster während des Pulses und ermöglicht I(t) t
0
I(t)
variable W(t– τ) Verzögerung
W(t)
τ
0
τ
t
Gatter
einem Ausschnitt des Pulses, den langsamen Detektor zu erreichen und detektiert zu werden. Die Messung wird wiederholt, wobei der Verschluss zu verschiedenen Zeiten geöffnet wird, und aus den gemessenen Momentaufnahmen wird das Pulsprofil rekonstruiert. Da es keine elektronisch betriebenen Verschlüsse mit Geschwindigkeiten im Piko- oder Femtosekundenbereich gibt, werden optische Schalter verwendet, die von einem optischen Referenzpuls gesteuert werden, dessen Dauer viel kürzer sein muss als die des zu messenden Pulses (für eine Diskussion von volloptischen Schaltern siehe Abschnitt 24.3.3). Abbildung 23.52 zeigt zwei Beispiele von optischen Schaltern, die für die Messung von ultraschmalen Pulsen verwendet werden. Wir untersuchen nun die Wirkung der endlichen Schaltdauer auf die Auflösung der Messung. Wenn 𝑊(𝑡) die Transmission des Schalters ist, der durch einen Schaltpuls zur Zeit 𝑡 = 0 ausgelöst wird, dann ist der durchgelassene optische Puls 𝐼(𝑡)𝑊(𝑡 − 𝜏), wenn der Schalter um eine Zeit 𝜏 verzögert reagiert. Die Verzögerung 𝜏 kann entweder der Schaltfunktion 𝑊(𝑡) oder dem optischen Puls 𝐼(𝑡) selbst verliehen werden. Der Photostrom aus dem langsamen Detektor ist proportional zur Fläche unter dem transmittierten Puls, 𝑖P (𝑡) ∝ ∫ 𝐼(𝜏)𝑊(𝑡 − 𝜏) d𝜏 .
Der gemessene Photostrom ist proportional zur Faltung zwischen dem optischen Puls und der Fensterfunktion. Die zeitliche Auflösung der Messung ist daher gleich der Breite der Fensterfunktion 𝑊(𝑡), die durch die Geschwindigkeit des Verschlusses bestimmt wird. Wenn die Fensterfunktion 𝑊(𝑡) eine Deltafunktion 𝛿(𝑡) ist, ist der Photostrom proportional zu 𝐼(𝜏), d. h. er ist ein Abbild des optischen Pulses zur Zeit 𝑡 = 𝜏 ohne Verlust an Auflösung.
langsamer i(τ) Detektor
I(t)W(t– τ)
(23.169)
0
τ
Abb. 23.51 Messung eines optischen Pulses I(t ) mithilfe eines optischen Schalters, der von einem viel kürzeren optischen Schaltpuls W (t ) gesteuert wird.
855
23 Ultraschnelle Optik
polarisierender FrequenzStrahlteiler verdoppler
Kerrzelle
U(t)
U(t) |UR(t)|2
U(t)UR(t)
U(t) Filter
UR(t) UR(t)
(a)
Abb. 23.52 (a) Ein anisotroper nichtlinearer Kerrschalter. Die Intensität IR (t ) = |UR (t )|2 des Referenzpulses verändert die Verzögerung des Kerrmediums wie in Abschnitt 22.3.1 erläutert. Da der zu messende Puls durch zwei gekreuzte Polarisatoren hindurchtritt, zwischen denen sich das Kerrmedium befindet, wird er mit der Schaltfunktion W (t ) ∝ IR (t ) = |UR (t )|2 moduliert. (b) Ein Frequenzver-
(b)
doppler als Schalter. Der zu messende Puls U(t ) und der Schaltpuls UR (t ), die orthogonal polarisiert sind, werden in einer kollinearen Typ-II-Anordnung vereinigt (siehe Aufgabe 22-5) und erzeugen einen Puls mit doppelter Frequenz und der Amplitude ∝ U(t )UR (t ), sodass die Schaltfunktion W (t ) ∝ UR (t ) ist. Abb. 23.53 Messung eines Pulsprofils durch Abtastung einzelner Pulse aus einer Pulsfolge mit den Zeitverzögerungen 𝜏 = mΔ𝜏, m = 0, 1, 2, …
I(t) Δτ
2Δτ
t
3Δτ
W(t) t
Einzelpulse und Pulsfolgen
Die beschriebene Methode zur Messung der Form eines kurzen Pulses mit einem langsamen Detektor lässt sich leicht durchführen, wenn eine periodische Pulsfolge zur Verfügung steht. Der Verschluss wird dann für jeden Puls aus der Folge mit einer unterschiedlichen Zeitverzögerung 𝜏 geöffnet, wie Abb. 23.53 illustriert, und die Messungen des Detektors werden registriert. Die Wiederholungsgeschwindigkeit der Pulse muss natürlich so klein sein, dass der langsame Detektor vor der Ankunft des nächsten Pulses wieder bereit ist. Aber was ist, wenn ein einzelner Puls gemessen werden soll? Das ist mit mehreren Detektoren ebenfalls kein Problem. Durch einen optischen Verzweiger („FanOut“-Element) werden Kopien des Pulses erzeugt, und jede Kopie wird mit einer unterschiedlichen Zeitverzögerung durch den Schalter geschickt, wie Abb. 23.54 Verzögerer Schalter
Detektorarray
zeigt. Mithilfe eines Detektorarrays kann anschließend das Intensitätsprofil 𝐼(𝑡) des Einzelpulses rekonstruiert werden. Zeit-Raum-Transformation: Die Streakkamera
Das in Abb. 23.54 dargestellte Konzept der Strahlverzweigung mit anschließender variabler Verzögerung kann auch rein optisch realisiert werden, indem man einen ausgedehnten Strahl verwendet, der in einem Winkel auf einen ebenen räumlichen Detektor (ein Detektorarray oder eine CCD-Kamera) fällt, wie in Abb. 23.55 gezeigt. Eine gepulste ebene Welle, die sich in 𝑧-Richtung ausbreitet, hat eine Intensität 𝐼(𝑡 − 𝑧∕𝑐). Eine Welle, die sich unter einem Winkel 𝜃 zur 𝑧-Achse ausbreitet, hat eine Intensität 𝐼(𝑡 − [𝑥 sin 𝜃 + 𝑧 cos 𝜃]∕𝑐). Wenn der Strahl in der Ebene 𝑧 = 0 auf einen räumlichen Detektor trifft, registriert dieser die Intensität 𝐼(𝑡 − 𝑥 sin 𝜃∕𝑐), sodass der Puls am Ort 𝑥 um die Zeit 𝜏𝑥 = 𝑥 sin 𝜃∕𝑐) verzögert ist. Jedes Element des Detektors sieht daher seine eigene Verzögerung gemäß dem in Abb. 23.54 ge-
Einzelpuls I(t)
Schaltpuls W(t)
τ2
cτ 0
räumlicher Verschluss Detektor
c
x
τ1 cτ 0/ sin θ
856
τ3
Abb. 23.54 Messung der Intensität I(t ) eines kurzen Einzelpulses mithilfe eines optischen Verzweigungselements, einer Reihe von optischen Verzögerern, eines optischen Schalters und eines Arrays aus (langsamen) Detektoren.
θ z
Abb. 23.55 Zeit-Raum-Transformation eines optischen Pulses durch schiefen Einfall einer Welle.
23.6 Pulsdetektion
x
nichtlinearer Kristall
U(t)
θ
z zweite Harmonische
räumlicher Detektor
Abb. 23.56 Messung eines Einzelpulses durch nicht-kollineare Typ-II-Frequenzverdopplung (Übung 22-2) und Zeit-Raum-Transformation (Prinzip der Streakkamera). Das registrierte Signal ist proportional zur Autokorrelationsfunktion GI (𝜏x ) der Intensität.
U(t)UR(t)
UR(t)
zeigten Schema. Wenn ein Verschluss eine Momentaufnahme zur Zeit 𝑡 = 0 aufnimmt, ist das Signal des Detektors bei 𝑥 proportional zu 𝐼(−[𝑥 sin 𝜃]∕𝑐). Auf diese Weise wird die Pulsform räumlich mit einem invertierten Profil registriert, das so skaliert ist, dass ein Puls der Dauer 𝜏0 (der räumlichen Breite 𝑐𝜏0 ) in der Ebene des räumlichen Detektors ein Bild mit der transversalen Breite 𝑐𝜏0 ∕ sin 𝜃 erzeugt (Abb. 23.55). Ein Puls der Breite 𝜏0 = 10 ps erstreckt sich z. B. über eine Distanz von 𝑐𝜏0 = 3 mm in der Ausbreitungsrichtung. Bei einem Winkel 𝜃 = 30◦ entspricht das einer Breite von 6 mm in der Detektorebene. Das ist die Grundidee der Streakkamera (auch Schmierbildkamera genannt). Das gepulste Licht wird in einer Weise „verschmiert“, dass Strahlen, die an unterschiedlichen Punkten auf dem Detektor auftreffen, unterschiedliche Entfernungen zurücklegen und daher unterschiedliche Verzögerungen erfahren. Alternativ können solche ortsabhängigen Zeitverzögerungen auch eingeführt werden, indem man den Strahl durch einen Glaskeil schickt. Der in dem in Abb. 23.55 gezeigten System verwendete Verschluss kann ein optischer Kerrschalter oder ein durch den Schaltpuls gesteuerter Frequenzverdoppler sein (Abb. 23.52). Eine besonders nützliche Variante eines Frequenzverdopplers in einer solchen Anordnung ist der in Abb. 23.56 dargestellte nicht-kollineare Typ-II-Frequenzverdoppler. Der zu messende Puls und der Schaltpuls sind hier orthogonal polarisierte schiefe Wellen in den Winkeln 𝜃 bzw. −𝜃 zur 𝑧-Achse. Ihre Wellenfunktionen sind 𝑈(𝑡 − [𝑥 sin 𝜃 + 𝑧 cos 𝜃]∕𝑐) und 𝑈R (𝑡 − [−𝑥 sin 𝜃 + 𝑧 cos 𝜃]∕𝑐), sodass die relative Zeitverzögerung am Ort 𝑥 gleich 𝜏𝑥 (2 sin 𝜃∕𝑐)𝑥 ist. Die erzeugte
I(t) I(t)
langsamer Detektor Schalter t I(t) I(t – τ)
0
variable Verzögerung
τ
I/(t – τ) 0
τ
t
frequenzverdoppelte Welle hat eine Wellenfunktion proportional zum Produkt 𝑈𝑈R , sodass die gemessene Intensität proportional zu 𝐼𝐼R ist. Infolgedessen ist das registrierte Signal proportional zur Autokorrelationsfunktion 𝐺𝐼 (𝜏𝑥 ) der Intensität. Die Messung der Intensitätsautokorrelation
Wie zuvor erwähnt beruht das Grundprinzip der Messung eines ultrakurzen optischen Pulses 𝐼(𝑡) mit einem langsamen Detektor auf der Verwendung eines kürzeren Schaltpulses 𝑊(𝑡), der einen optischen Schalter öffnet und schließt. Wenn kein solcher Puls zur Verfügung steht, kann der zu messende Puls komprimiert und selbst zu diesem Zweck verwendet werden. Eine andere Möglichkeit ist, eine quadrierte Version des Pulses zu verwenden, die z. B. durch Frequenzverdopplung erhalten wird, da die quadrierte Funktion 𝐼 2 (𝑡) schmaler ist als 𝐼(𝑡). Auch nichtlineare Prozesse höherer Ordnung können verwendet werden, um noch schmalere Pulse zu erzeugen, wenn auch mit geringerer Intensität. Wenn eine derartige Pulskompression bzw. die Erzeugung der Harmonischen nicht durchführbar oder unerwünscht ist, kann der zu messende Puls auch direkt als Schaltfunktion verwendet werden, wie Abb. 23.57 schematisch illustriert. Der Photostrom ist dann proportional zur Autokorrelationsfunktion der Intensität, 𝐺𝐼 (𝜏) = ∫ 𝐼(𝑡)𝐼(𝑡 − 𝜏) d𝑡 = ∫ 𝐼(𝑡)𝐼(𝑡 + 𝜏) d𝑡 . (23.170) Da 𝐼(𝑡) eine reelle Funktion mit endlicher Dauer ist, ist 𝐺𝐼 (𝜏) eine symmetrische Funktion, die von einem Maximalwert 𝐺𝐼 (0) bei 𝜏 = 0 auf null bei 𝜏 = ∞ abklingt.
Abb. 23.57 Messung der Intensitätsautokorrelation GI (𝜏x ).
GI (τ) 0
τ
857
858
23 Ultraschnelle Optik
Die Autokorrelationsfunktion eines Pulses mit beliebiger Form ist allgemein ein breiterer symmetrischer Puls. Zum Beispiel hat ein Gaußpuls mit der Intensität 𝐼(𝑡) = exp(−2𝜏2 ∕𝜏02 ) und der Breite 𝜏0 eine gaußsche Autokorrelationsfunktion 𝐺𝐼 (𝜏) ∝ exp(−𝜏2 ∕𝜏02 ), die als √ 2 𝜏0 )2 ] geschrieben werden kann; ihre Breiexp[−2(𝜏∕ √ te ist 2 𝜏0 . Die Kenntnis der Autokorrelationsfunktion reicht im Allgemeinen nicht aus, um die Funktion selbst zu bestimmen. Das leuchtet ein, wenn man bedenkt, dass die Fouriertransformierte von 𝐺𝐼 (𝜏) gleich |ℐ(𝜈)|2 ist, wobei ℐ(𝜈) die Fouriertransformierte von 𝐼(𝑡) ist (siehe Anhang A). Die Messung von 𝐺𝐼 (𝜏) erlaubt uns, den Betrag |ℐ(𝜈)| zu bestimmen, gibt aber keine Auskunft über die Phase und kann folglich nicht verwendet werden, um die komplexe Einhüllende vollständig zu rekonstruieren. Eine Ausnahme ist der Fall, dass der Puls symmetrisch ist, d. h. 𝐼(−𝑡) = 𝐼(𝑡), da in diesem Fall ℐ(𝜈) reell ist, d. h. keine Phase besitzt. Wenn das mathematische Profil einer unsymmetrischen Funktion bekannt ist, dann genügt die Messung ihrer Autokorrelationsfunktion, um ihre Parameter zu bestimmen.
Der interferometrische Spektralanalysator Die spektrale Intensität S(𝜈) eines optischen Pulses kann
mithilfe eines Interferometers (Abb. 23.59) gemessen werden. Wir erinnern uns aus Abschnitt 12.2, dass ein Michelsoninterferometer als FT-Spektrometer verwendet werden kann. Wenn ein gepulster optischer Strahl mit der komplexen Wellenfunktion 𝑈(𝑡) durch einen Strahlteiler in zwei Strahlen aufgespalten und ein Strahl um eine Zeit 𝜏 gegen den anderen verzögert wird, ist das 1 Ergebnis ein optisches Feld √ [𝑈(𝑡) + 𝑈(𝑡 − 𝜏)] mit der 2
1
Intensität |𝑈(𝑡) + 𝑈(𝑡 − 𝜏)|2 . Wenn dieses Feld mit ei2 nem „langsamen“ Detektor registriert wird, ist das Ergebnis eine Funktion der optischen Verzögerung, 𝑅𝑈 (𝜏) =
1
=
1
2
2
2
∫ |𝑈(𝑡) + 𝑈(𝑡 − 𝜏)| d𝑡 2
1
∫ |𝑈(𝑡)| d𝑡 + ∫ |𝑈(𝑡 − 𝜏)|2 d𝑡 2
+ Re ∫ 𝑈 ∗ (𝑡)𝑈(𝑡 − 𝜏) d𝑡
(23.171)
Wenn wir 𝑈(𝑡) = 𝒜(𝑡) exp(i2π 𝜈0 𝑡) einsetzen, erhalten wir 𝑅𝑈 (𝜏) = 𝐺𝒜 (0) + Re{𝐺𝒜 (𝜏) exp(−i2π𝜈0 𝜏)}
23.6.2
= 𝐺𝒜 (0) + |𝐺𝒜 (𝜏)| cos [2π 𝜈0 𝜏 − arg{𝐺𝐴 (𝜏)}] ,
Die Messung der spektralen Intensität
Der optische Spektralanalysator Die spektrale Intensität S (𝜈) = |𝐴(𝜈)|2 eines optischen
Pulses mit der komplexen Einhüllenden 𝒜(𝑡) kann mithilfe eines optischen Spektralanalysators gemessen werden. Der Analysator ist einfach eine Anordnung von spektralen Filtern, die auf eine Reihe von Frequenzen/ Wellenlängen abgestimmt sind. Wenn eine Anordnung von „langsamen“ Detektoren verwendet wird, um die Energie in jeder der spektralen Komponenten zu registrieren, ist das Ergebnis der Messung die spektrale Intensität S (𝜈). Eine optische Realisierung dieses Prinzips ist in Abb. 23.58 gezeigt. Es ist im Allgemeinen nicht möglich, eine Funktion 𝒜(𝑡) ohne Phaseninformation aus dem Betrag ihrer Fouriertransformierten 𝐴(𝜈) zu rekonstruieren. Eine Ausnahme ist der Fall eines symmetrischen Pulses, dessen Fouriertransformierte reell ist.
U(t)
(a)
Fouriertransformation
V(ν)
| 2
(23.172) wobei 𝐺𝒜 (𝜏) = ∫ 𝐴∗ (𝑡)𝐴(𝑡 − 𝜏) d𝑡
die Autokorrelationsfunktion der komplexen Einhüllenden ist. Die Funktion 𝐺𝒜 (𝜏) ist gleich der inversen Fouriertransformierten der spektralen Intensität S (𝜈) = |𝐴(𝜈)|2 . Die Messung 𝑅𝑈 (𝜏) ergibt ein Streifenmuster mit der Sichtbarkeit |𝐺𝒜 (𝜏)|∕𝐺𝒜 (0). Diese Anordnung erlaubt uns daher, 𝐺𝒜 (𝜏) durch die sorgfältige Analyse der Sichtbarkeit und des Ortes der Streifen zu bestimmen. Das Interferometer gibt daher dieselbe Auskunft wie ein konventioneller Spektralanalysator.
(ν)
ν
(b)
(23.173)
optischer Spektralanalysator
räumlicher Detektor
Abb. 23.58 Messung der spektralen Intensität mit einem optischen Spektralanalysator. (a) System. (b) Optische Realisierung mit Prismen.
23.6 Pulsdetektion
langsamer Detektor
U(t)
U(t) + U(t – ) RU ( )
U(t) variable Verzögerung
t
U(t)
U(t – )
0
c
(a)
(b)
Abb. 23.59 Interferometrische Messung der spektralen Intensität eines Pulses. (a) Blockdiagramm. (b) Schematische Darstellung der Interferometeranordnung. Das Interferogramm wird verwendet, um die Autokorrelationsfunktion der Einhüllenden GA (𝜏) zu bestimmen, deren Fouriertransformierte die spektrale Intensität ist.
23.6.3 Die Messung der Phase
Summe ist dann
Eine vollständige Charakterisierung eines optischen Pulses erfordert die Messung der komplexen Einhüllenden, d. h. des√Betrags und der Phase der Wellenfunktion 𝑈(𝑡) = 𝐼(𝑡) exp[i2π 𝜈0 𝑡 + 𝜑(𝑡)] oder äquivalent des Betrags √ und der Phase ihrer Fouriertransformierten 𝑉(𝜈) = S (𝜈) exp[i𝜓(𝜈)]. Die in Abschnitt 23.6.1 vorgestellten Methoden erlauben die Messung der Intensität 𝐼(𝑡), nicht aber der Phase 𝜑(𝑡). Die Methoden aus Abschnitt 23.6.2 ermöglichen die Messung der spektralen Intensität 𝑆(𝜈), ohne Information über die spektrale Phase 𝜓(𝜈) zu liefern. Unter bestimmten Bedingungen kann eine komplexe Funktion vollständig aus der Kenntnis ihres Betrags und des Betrags ihrer Fouriertransformierten rekonstruiert werden, d. h. aus 𝐼(𝑡) und 𝑆(𝜈). Der folgende Abschnitt stellt Methoden vor, die die Phase 𝜑(𝑡) oder die spektrale Phase 𝜓(𝜈) direkt messen können. Die Messung der Phase beruht häufig auf interferometrischen Verfahren, da die Intensität am Ausgang eines Interferometers sehr empfindlich auf die Phasendifferenz der interferierenden Wellen reagiert. Eine konventionelle Methode zur Messung der Phase ist das sogenannte optische Heterodyning, eine Form der Interferometrie im Zeitbereich (siehe √ Abschnitt 2.6.2). Der Puls 𝑈(𝑡) = 𝐼(𝑡) exp[i2π 𝜈0 𝑡 + 𝜑(𝑡)] wird mit einem bekannten Referenzpuls 𝑈R (𝑡) = √ 𝐼R (𝑡) exp[i2π 𝜈R 𝑡 + 𝜑R (𝑡)] mit einer unterschiedlichen Mittenfrequenz 𝜈R = 𝜈0 + 𝑓 gemischt. Die Intensität der
|𝑈(𝑡) + 𝑈R (𝑡)|2 = 𝐼(𝑡) + 𝐼R (𝑡) √ + 2 𝐼(𝑡)𝐼R (𝑡) cos[2π 𝑓𝑡 + 𝜑R (𝑡) − 𝜑(𝑡)] . (23.174) Diese Beziehung ist eine Verallgemeinerung von Gl. (2.83), in der die Phasen 𝜑(𝑡) und 𝜑R (𝑡) gleich null gesetzt wurden. Gleichung (23.174) beschreibt ein Interferogramm mit einer Schwebungsfrequenz 𝑓 (Streifen pro Sekunde) gleich der Differenz der Mittenfrequenzen und einer zeitlich variierenden Phase 𝜑R (𝑡) − 𝜑(𝑡), die leicht aus dem Interferogramm ermittelt werden kann. Für ultraschnelle Pulse ist der Detektor jedoch stets langsam und alle zeitlichen Charakteristika des Interferogramms werden herausgemittelt, sodass das Heterodyning, die zeitliche Interferometrie, nicht anwendbar ist. Spektrale Interferometrie
Im Fourierbereich ist die Interferometrie jedoch anwendbar; sie wird dann als spektrale Interferometrie bezeichnet. Dabei wird der Puls 𝑈(𝑡) um eine feste Zeit 𝜏 verzögert und zu einem bekannten Referenzpuls 𝑈R (𝑡) derselben Frequenz addiert. Anschließend wird die Fouriertransformierte der Summe 𝑈(𝑡 − 𝜏) + 𝑈R (𝑡) mit einem langsamen Detektor gemessen, was ein Interferogramm wie in Abb. 23.60 erzeugt. Wenn die Fouriertransformierten von 𝑈(𝑡) und √ √ 𝑈R (𝑡) gleich 𝑉(𝜈) = S (𝜈) exp[i𝜓(𝜈)] bzw. 𝑉R (𝜈) = S R (𝜈) exp[i𝜓R (𝜈)] sind,
Abb. 23.60 Ein spektrales Interferometer erzeugt ein Interferogramm im Fourierbereich.
feste Verzögerung
U(t)
UR (t)
U(t – )
+
Fouriertransformation
Detektor
0
ν
859
860
23 Ultraschnelle Optik
Abb. 23.61 Selbstreferentielles spektrales Interferometer.
feste Verzögerung
U(t)
U(t – )
Fouriertransformation
0
Detektor
+f
ν
U(t) e i2πft
Frequenzverschiebung
dann misst das spektrale Interferometer das Interferogramm √ || |2 ||𝑉(𝜈)e−i2π 𝜏𝜈 + 𝑉R (𝜈)||| = S (𝜈) + S R (𝜈) + 2 S (𝜈)S R (𝜈) × cos[2π 𝜏𝜈 + 𝜓R (𝜈) − 𝜓(𝜈)] . (23.175) Es ist ein Streifenmuster, dessen Sichtbarkeit durch die spektrale Intensität S (𝜈) und dessen Streifenpositionen durch die Phasendifferenz 𝜓(𝜈) − 𝜓R (𝜈) bestimmt sind. Die Messung liefert daher die vollständige Information über 𝑉(𝜈) und folglich über 𝑈(𝑡). Die Dualität zwischen der zeitlichen und spektralen Interferometrie drückt sich darin aus, dass die Gln. (23.174) und (23.175) eine identische Form besitzen, wobei sich 𝑡 und 𝜈 entsprechen und die Verzögerung 𝜏 die Rolle des Frequenzunterschieds 𝑓 spielt. Die Hauptschwierigkeit bei der spektralen Interferometrie ist die Forderung nach einem bekannten Referenzpuls. Selbstreferentielle spektrale Interferometrie
Der zu messende Puls kann nicht als seine eigene Referenz verwendet werden, da der Phasenterm in Gl. (23.175) für 𝜓R (𝜈) = 𝜓(𝜈) verschwindet. Dieses Problem kann jedoch umgangen werden, indem man eine frequenzverschobene Kopie des zu messenden Pulses als Referenz verwendet, d. h. 𝑉R (𝜈) = 𝑉(𝜈 + 𝑓). Ein derartiges System ist schematisch in Abb. 23.61 dargestellt. Das Ergebnis ist ein Interferogramm |𝑉(𝜈)e−i2π 𝜈𝜏 + 𝑉(𝜈 + 𝑓)|2 = S (𝜈) + S (𝜈 + 𝑓) √ + 2 S (𝜈)S (𝜈 + 𝑓) cos[2π 𝜈𝜏 + 𝜓(𝜈) − 𝜓(𝜈 + 𝑓)] , (23.176) aus dem die Phasendifferenz 𝜓(𝜈 + 𝑓) − 𝜓(𝜈) abgelesen werden kann. Wenn die Frequenzverschiebung 𝑓 klein
ist, kann die Phasendifferenz als Näherung für die Ableitung d𝜓∕d𝜈 verwendet und integriert werden, um die Phase 𝜓(𝜈) zu erhalten. Nichtlineare Interferometrie
Wie zuvor erwähnt liefert ein konventioneller Spektralanalysator Auskunft über die spektrale Intensität, nicht aber über die spektrale Phase. Wie das Schema in Abb. 23.59 zeigt, erreicht die konventionelle Interferometrie im Zeitbereich dies durch Bestimmung der Fläche unter der Kurve |𝑈(𝑡) + 𝑈(𝑡 − 𝜏)|2 . Ein Ansatz, um auf interferometrische Weise an Phaseninformationen zu gelangen, bildet aus der Summe 𝑈(𝑡) + 𝑈(𝑡 − 𝜏) vor der Detektion das Quadrat [𝑈(𝑡) + 𝑈(𝑡 − 𝜏)]2 und bestimmt die Fläche unter der Funktion |[𝑈(𝑡) + 𝑈(𝑡 − 𝜏)]2 |2 , wie das Blockdiagramm in Abb. 23.62 illustriert. Diese Quadrierung kann beispielsweise mithilfe eines frequenzverdoppelnden Kristalls erreicht werden. Die zu der Funktion 𝑅𝑈 (𝜏) aus Gl. (23.56) analoge (2) Funktion, die wir als 𝑅𝑈 (𝜏) bezeichnen, ist dann | | (2) 𝑅𝑈 (𝜏) = ∫ |||[𝑈(𝑡) + 𝑈(𝑡 − 𝜏)]2 ||| d𝑡 . 2
(2)
Um zu zeigen, dass die neue Funktion 𝑅𝑈 (𝜏) Phaseninformationen enthält, substituieren wir 𝑈(𝑡) = 𝒜(𝑡) exp(i2π 𝜈0 𝑡) in Gl. (23.177) und separieren Terme mit den Frequenzen 0, 𝜈0 und 2𝜈0 ; so erhalten wir { } { } (2) 𝑅𝑈 (𝜏) ∝ 𝐶0 (𝜏) + 4 Re 𝐶1 (𝜏)𝑒 i2π𝜈0 𝜏 + 2 Re 𝐶2 (𝜏)ei4π𝜈0 𝜏 (23.178) mit 𝐶0 (𝜏) = ∫ 𝐼 2 (𝑡) d𝑡 + ∫ 𝐼 2 (𝑡 − 𝜏) d𝑡 + 4 ∫ 𝐼(𝑡)𝐼(𝑡 − 𝜏) d𝑡 , = 2𝐺𝐼 (0) + 4𝐺𝐼 (𝜏) ,
t
2
(.)
variable Verzögerung
Frequenz- langsamer verdoppler Detektor U(t – )
(23.179) Abb. 23.62 Nichtlineares Interferometer.
(2)
U(t)
U(t)
(23.177)
RU ( )
0
23.6 Pulsdetektion
𝐶1 (𝜏) = ∫ 𝒜 ∗ (𝑡)𝒜(𝑡 − 𝜏)[𝐼(𝑡) + 𝐼(𝑡 − 𝜏)] d𝑡 , 2
𝐶2 (𝜏) = ∫ [𝒜 ∗ (𝑡)𝒜(𝑡 − 𝜏)] d𝑡 ;
(23.180) (23.181)
dabei ist 𝐺𝐼 (𝜏) die durch Gl. (23.170) gegebene Autokor(2) relationsfunktion der Intensität. Die Funktion 𝑅𝑈 (𝜏) ist daher die Summe von drei Termen: einem nicht oszillierenden Term 𝐶0 (𝜏) und zwei oszillierenden Termen mit den Frequenzen 𝜈0 und 2𝜈0 , die durch Fourieranaly(2) se von 𝑅𝑈 (𝜏) separiert werden können. Der erste Term hängt von der Autokorrelationsfunktion 𝐺𝐼 (𝜏) der Intensität ab und enthält keine Phaseninformation. Die beiden anderen Terme hängen sowohl von der Intensität des Pulses als auch von seiner Phase ab. Die gesamte Funktion wird durch eine obere Einhül(2) lende mit dem maximalen Wert 𝑅𝑈 (0) = 16 ∫ 𝐼 2 (𝑡) d𝑡 = 16𝐺𝐼 (0) und eine untere Einhüllende mit dem minima(2) len Wert 𝑅𝑈 (0) = 0 begrenzt. Ihr asymptotischer Wert (2) ist 𝑅𝑈 (∞) = 𝐶0 (∞) = 2 ∫ 𝐼 2 (𝑡) d𝑡 = 2𝐺𝐼 (0). Das Verhält(2) (2) nis 𝑅𝑈 (∞)∕𝑅𝑈 (0) ändert sich daher von einem Maximalwert 8 bei 𝜏 = 0 auf einen asymptotischen Wert 1 für 𝜏 → ∞. Beispielsweise ist für einen linear gechirpten Gaußpuls mit der Zeitkonstante 𝜏0 und dem Chirpparameter 𝑎 [ ] (23.182) 𝐶0 (𝜏) = 2𝐺𝐼 (0) 1 + 2 exp(−𝜏2 ∕𝜏02 ) , [ ] ( 2 ) 2 2 2 𝐶1 (𝜏) = 2𝐺𝐼 (0) exp −(3 + 𝑎 )𝜏 ∕4𝜏0 cos 𝑎𝜏 ∕2𝜏02 , (23.183) [ ] 2 2 2 (23.184) 𝐶2 (𝜏) = 𝐺𝐼 (0) exp −(1 + 𝑎 )𝜏 ∕𝜏0 . (2)
(2)
In Abb. 23.63 ist die normierte Funktion 𝑅𝑈 (𝜏)∕𝑅𝑈 (∞) für drei Werte des Chirpparameters 𝑎 aufgetragen. Offensichtlich hängt das Profil des Interferogramms, vor allem der Punkt, an dem die oszillierenden Terme verschwinden, empfindlich von 𝑎 ab und kann daher verwendet werden, um 𝑎 aus experimentellen Daten zu ermitteln.
Es gibt kein allgemeines Verfahren, um die Phase des (2) Pulses aus der Messung von 𝑅𝑈 (𝜏) zu ermitteln. Eine solche Messung kann aber verwendet werden, um bekannte Modelle für die Amplitude und Phase des Pulses zu verifizieren oder unbekannte Parameter zu bestimmen. Nichtlineare Interferometrie mit nichtlinearen Detektoren
In einer alternativen Variante des in Abb. 23.62 gezeigten nichtlinearen Interferometers wird die Quadrierung durch den Detektor selbst durchgeführt. Dazu wird ein Detektor auf der Grundlage der Zweiphotonenabsorption eingesetzt, z. B. eine Photodiode mit einer Bandlücke, die größer ist als die Photonenenergie, aber kleiner als das Doppelte der Photonenenergie (siehe Aufgabe 19-5). In einem solchen Detektor ist der Photostrom proportional zum Quadrat der Intensität (da er immer Paare von Photonen absorbiert). Infolgedessen misst das nichtlineare Interferometer die Funktion ′(2)
𝑅𝑈 (𝜏) = ∫ |𝑈(𝑡) + 𝑈(𝑡 − 𝜏)|4 d𝑡 ,
die ebenso wie Gl. (23.177) Informationen über die Verteilung und die Breite des Pulses enthält.
23.6.4 Messung des Spektrogramms Wie in Abschnitt 23.1.1 erwähnt ist das Spektrogramm S (𝜈, 𝜏) eines optischen Pulses 𝑈(𝑡) eine Zeit-FrequenzDarstellung, die gleich dem Betragsquadrat der Fouriertransformierten des Pulses ist, betrachtet durch eine bewegte Fenster- oder Schaltfunktion 𝑊(𝑡), S (𝜈, 𝜏) = |𝛷(𝜈, 𝜏)|2 ;
𝛷(𝜈, 𝜏) = ∫ 𝑈(𝑡)𝑊(𝑡 − 𝜏) exp(−i2π 𝜈𝑡) d𝑡 . (23.186) Der Spektrogramm kann gemessen werden, indem der Puls 𝑈(𝑡) durch einen optischen Schalter geschickt wird,
8
8
8
a=0
a=4
a=8
6
6
6
4
4
4
2
2
2
0
–2
–1
0
1
2 τ τ0
0
–2
–1
0
1
(23.185)
2 τ τ0
0
–2
–1
0
1
2 τ τ0
Abb. 23.63 Normierte Autokorrelationsfunktion RFV (∞) = C0 (∞) = 2 ∫ I2 (t ) dt der Intensität als Funktion U der normierten Zeitverzögerung 𝜏∕𝜏0 für einen gechirpten Gaußpuls für drei Werte des Chirpparameters a.
861
862
23 Ultraschnelle Optik
Schalter
U(t) variable Verzögerung
W(t)
ν U(t)W(t– )
Abb. 23.64 Messung des Spektrogramms S (𝜈, 𝜏) durch frequenzaufgelöste optische Ausblendung (FROG).
( , ν)
Fouriertransformation
Detektor
W(t– )
der von einer zeitverzögerten Schaltfunktion 𝑊(𝑡 − 𝜏) gesteuert wird, und das Spektrum des Produkts 𝑈(𝑡) 𝑊(𝑡 − 𝜏) mit einem Spektralanalysator bei jeder Zeitverzögerung 𝜏 gemessen wird, wie Abb. 23.64 schematisch zeigt. Diese Methode ist als frequenzaufgelöste optische Ausblendung (FROG, engl. frequency-resolved optical gating) bekannt. Wenn keine ausreichend kurze Schaltfunktion 𝑊(𝑡) zur Verfügung steht, kann der Puls 𝑈(𝑡) selbst oder ein verwandter Puls für diesen Zweck verwendet werden. Die Beziehung zwischen 𝑊(𝑡) und 𝑈(𝑡) hängt von der Natur des verwendeten optischen Schalters ab, wie die folgenden Beispiele zeigen: • Für einen Frequenzverdoppler-Schalter (siehe Abb. 23.56) mit den Eingabewellen 𝑈(𝑡) und 𝑈(𝑡 − 𝜏) bei der Grundfrequenz ist die frequenzverdoppelte Welle proportional zu dem Produkt 𝑈(𝑡)𝑈(𝑡 − 𝜏), sodass 𝑊(𝑡) ∝ 𝑈(𝑡) ist und 𝛷(𝜈, 𝜏) = ∫ 𝑈(𝑡)𝑈(𝑡 − 𝜏) exp(−i2π 𝜈𝑡) d𝑡 . (23.187) Die Zeit-Frequenz-Funktion in Gl. (23.187) ist als Wignerverteilung bekannt. Eine praktische Realisierung des Blockdiagramms in Abb. 23.64 ist in Abb. 23.65(a) gezeigt. Ein solches System ist für die
U(t)
U(t)
Frequenzverdoppler
Messung von Einzelpulsen geeignet, wie schon früher erwähnt. • Für einen optischen Kerrschalter auf Polarisationsbasis [Abb. 23.52(a)] ist 𝑊(𝑡) proportional zur Pulsintensität 𝐼(𝑡), sodass 𝑊(𝑡) ∝ 𝐼(𝑡) = |𝑈(𝑡)|2 ist und 𝛷(𝜈, 𝜏) = ∫ 𝑈(𝑡)|𝑈(𝑡 − 𝜏)|2 exp(−i2π𝜈𝑡) d𝑡 . (23.188) Wenn das Blockdiagramm aus Abb. 23.64 auf der Grundlage eines solchen Schalters realisiert wird, erhält man das in Abb. 23.65(b) gezeigte System. Auch weitere nichtlineare optische Anordnungen wurden erprobt, z. B. mit Schaltern auf der Grundlage der Erzeugung der dritten Harmonischen entsprechend einer Schaltfunktion 𝑊(𝑡) ∝ 𝑈 2 (𝑡) oder mit Schaltern auf der Grundlage der Selbstbeugung entsprechend 𝑊(𝑡) ∝ [𝑈 ∗ (𝑡)]2 . Bestimmung der Wellenfunktion eines Pulses aus dem Spektrogramm
In allen seinen vielen Variationen ist das Spektrogramm S (𝜈, 𝜏) stets ein zweidimensionales „Bild“, mit dessen Hilfe ein optischer Puls charakterisiert oder seine wesentlichen Eigenschaften dargestellt werden können. Es kann auch verwendet werden, um den Betrag und die
Spektralanalysator U(t)U(t– )
(a)
U(t– )
c
Frequenzverdopplerschalter
Kerrzelle
U(t)
U(t) |U(t– )|2 (b)
Spektralanalysator
U(t– )
c
optischer Kerrschalter
Abb. 23.65 Zwei Realisierungen der frequenzaufgelösten optischen Ausblendung. (a) Frequenzverdopplung. (b) Polarisationsschaltung.
23.6 Pulsdetektion
Phase der komplexen Wellenfunktion 𝑈(𝑡) des Pulses zu bestimmen. Die Bestimmung von 𝑈(𝑡) aus dem gemessenen Spektrogramm S (𝜈, 𝜏) ist nicht trivial. Ein allgemeiner Ausdruck für die Funktion S (𝜈, 𝜏), wie sie durch ein beliebiges der zuvor erwähnten Systeme gemessen werden kann, hat die Form 𝛷(𝜈, 𝜏) = ∫ 𝑔(𝑡, 𝜏) exp(−i2π 𝜈𝑡) d𝑡 , (23.189) wobei 𝑔(𝑡, 𝜏) = 𝑈(𝑡)𝑊(𝑡 − 𝜏) ist und 𝑊(𝑡) mit 𝑈(𝑡) zusammenhängt; z. B. ist für die Frequenzverdopplung 𝑊(𝑡) = 𝑈(𝑡) und für die Polarisationsschaltung 𝑊(𝑡) = |𝑈(𝑡)|2 . Wenn die komplexe Funktion 𝛷(𝜈, 𝜏) bekannt wäre, könnte 𝑈(𝑡) ohne weiteres wie folgt bestimmt werden: Durch inverse Fouriertransformation von 𝛷(𝜈, 𝜏) bezüglich 𝜈 für alle 𝜏 erhalten wir (23.190)
Wenn wir 𝑔(𝑡, 𝜏) = 𝑈(𝑡)𝑊(𝑡 − 𝜏) kennen, können wir die Wellenfunktion 𝑈(𝑡) durch Integration über 𝜏 berech-
U
Φ Φ
Abb. 23.66 Iterative Bestimmung der Funktion 𝛷(𝜈, 𝜏). 0.5
1
1
φ(t)
Intensität
0 0.5
λ / µm
spektrale Intensität
0.4
–40
–20
0
(a)
20
40
• 40
20 S (λ)
ψ (λ)
0.6
0
π
I(t)
• 20
1
0
1) Man beginnt mit dem gemessenen Spektrogramm S (𝜈, 𝜏) und bestimmt den Betrag |𝛷(𝜈, 𝜏)| = [S (𝜈, 𝜏)]1∕2 . Das beschriebene Verfahren (inverse Fouriertransformation von 𝛷(𝜈, 𝜏) bezüglich 𝜈 und Integration über 𝜏) wird mit einer angenommenen Phase arg{𝛷(𝜈, 𝜏)} durchgeführt, um 𝑈(𝑡) bis auf eine unbekannte Proportionalitätskonstante zu bestimmen. 2) Mit dem so berechneten 𝑈(𝑡) wird 𝛷(𝜈, 𝜏) bestimmt und eine neue Näherung für die unbekannte Phase arg{𝛷(𝜈, 𝜏)} berechnet, die zusammen mit dem gemessenen Betrag |𝛷(𝜈, 𝜏)| verwendet wird, um eine neue und bessere Näherung für 𝑈(𝑡) zu erhalten. 3) Dieser Prozess wird wiederholt, bis er zu einer Wellenfunktion 𝑈(𝑡) des Pulses konvergiert, die mit dem gemessenen Spektrogramm übereinstimmt.
0
0.5
0.3
Die Proportionalitätskonstante ist gleich der (unbekannten) Fläche der Fensterfunktion. Trotz dieses Mangels erweist sich diese Analyse als hilfreich. Die Aufgabe, 𝛷(𝜈, 𝜏) aus der gemessenen Funktion S (𝜈, 𝜏) = |𝛷(𝜈, 𝜏)|2 zu bestimmen, ist eine Aufgabe von Typ „fehlende Phaseninformation“. Zur Lösung dieser und ähnlicher Aufgabenstellungen wurden viele Algorithmen entwickelt. Ein typischer iterativer Ansatz beschreitet den folgenden Weg (siehe Abb. 23.66):
Ein Beispiel ist in Abb. 23.67 gezeigt.
0.5 0
(23.191)
(b)
Abb. 23.67 (a) Gemessenes Spektrogramm S 𝜆 (𝜆, 𝜏) eines Pulses von 4.5 fs Dauer mit 2.5 optischen Zyklen bei einer Mittenwellenlänge von ≈ 0.85 μ m, gemessen durch Frequenzverdopplung. (b) Genäherte zeitliche und spektrale Eigenschaften des Pulses. (c) Das aus dem Puls (b) berechnete Spektrogramm ist näherungsweise identisch mit dem ge-
1 0.5
–π 40 t / fs π
0
0.8
0.5
λ / µm
|Φ| arg{Φ}
= 𝑈(𝑡) ∫ 𝑊(𝑡 − 𝜏) d𝜏 ∝ 𝑈(𝑡) .
Phase
𝑔(𝑡, 𝜏) = ∫ 𝛷(𝜈, 𝜏) exp(i2π𝜈𝑡) d𝜈 .
∫ 𝑔(𝑡, 𝜏) d𝜏 = ∫ 𝑈(𝑡)𝑊(𝑡 − 𝜏) d𝜏
0.4
spektrale Phase
S (𝜈, 𝜏) = |𝛷(𝜈, 𝜏)|2 ,
nen,
–π 1 λ / µm
0.3 –40
–20
0
(c)
20
40
t / fs
messenen. (Modifiziert nach A. Baltuška, M. S. Pshenichnikov, D. A. Wiersma, IEEE Journal of Quantum Electronics 35, 459– 478, 1999, Abb. 17(a), 17(b) und 18. ©1999 IEEE; R. Trebino (Hrsg.), Frequency-Resolved Optical Gating: The Measurement of Ultrashort Laser Pulses, Kluwer 2000, Abbildung auf der Begleit-CD.)
863
864
23 Ultraschnelle Optik
Aufgaben
ändert. Leiten Sie einen Ausdruck für die neue Pulsdauer her.
Aufgabe 23-1: Superposition zweier Gaußpulse
Ein transformationsbeschränkter Gaußpuls wird zu einem gechirpten Gaußpuls mit dem Chirpparameter 𝑎 und ansonsten identischen Parametern addiert. Leiten Sie Ausdrücke für die Intensität, die Phase, die spektrale Intensität, die spektrale Phase und den Chirpparameter der Überlagerung her. Aufgabe 23-2: Der Sekans-hyperbolicus-Puls
Ein Puls besitzt die komplexe Einhüllende sech(𝑡∕𝜏) mit sech(⋅) = 1∕ cosh(⋅) und einer Zeitkonstante 𝜏. Zeigen Sie, dass die Breite der Intensitätsfunktion 𝜏HWB = 1.76𝜏 2 ist, die der spektralen Intensität S (𝜈) = sech (π2 𝜏𝜈) und die der spektralen Breite Δ𝜈 = 0.993∕𝜏. Vergleichen Sie die Ergebnisse mit einem Gaußpuls. (Siehe die Tabelle zur Fouriertransformation in Anhang A). Aufgabe 23-3: Chirpfilter aus einem dicken Prisma
Ein dickes Prisma wird als Chirpfilter eingesetzt. Der Einfallswinkel wird so gewählt, dass die Brewsterbedingung erfüllt ist, um Dämpfung durch Reflexion zu minimieren. Der Öffnungswinkel 𝛼 wird so gewählt, dass der einfallende Strahl und der zentrale abgelenkte Strahl in Bezug auf das Prisma symmetrisch liegen. Zeigen Sie, dass der Ablenkwinkel 𝜃A unter diesen Bedingungen die Bedingung d𝜃A ∕ d𝑛 = −2 erfüllt und der Chirpkoeffizient durch 𝑏 ≈ −4(𝑛 − 𝑁)2 𝓁0 𝜆0 ∕π 𝑐2 gegeben ist. Zeigen Sie, dass wenn alle Parameter identisch sind, der Chirpkoeffizient um einen Faktor 4∕𝛼2 größer ist als im Fall des dünnen Prismas (siehe Beispiel 23-4). Aufgabe 23-4: Bragggitter als Chirpfilter
Entwerfen einen Sie ein Chirpfilter auf der Grundlage eines Bragggitters für Pulse der Mittenfrequenz 𝜈0 = 300 Hz (Wellenlänge 1 μm) und der Halbwertsbreite 𝜏HWB = 0.44 ps. Das Filter soll einen Chirpkoeffizienten 𝑏 = (2 ps)2 haben. Geben Sie die Dimensionen des Gitters und seiner maximalen und minimalen Gitterperiode an, sodass alle spektralen Komponenten des Pulses durch das Gitter reflektiert werden. Aufgabe 23-5: Ausbreitung eines Rechteckpulses durch eine optische Faser
Ein Rechteckpuls der Breite 𝜏 breitet sich durch eine optische Faser aus, die als Chirpfilter mit dem Chirpkoeffizienten 𝑏 = 𝐷𝜈 𝑧∕π [siehe Gl. (23.70)] beschrieben werden kann. Zeigen Sie, dass sich die Form des Pulses nach einer hinreichend großen Entfernung 𝑧 von einer Rechteckfunktion in eine Spaltfunktion (Kardinalsinus)
Aufgabe 23-6: Zeitliche Abbildung mit einer „Zeitlinse“
Ein optischer Puls mit der Breite 𝜏1 und beliebiger Form breitet sich über eine Entfernung d 1 durch eine Faser mit positiver Gruppengeschwindigkeitsdispersion aus, wobei er mit einem Phasenfaktor exp(i𝜁𝑡2 ) moduliert wird und sich anschließend über eine Entfernung d 2 durch eine Faser aus demselben Material ausbreitet. Am Ende ist die Breite des Pulses 𝜏2 . Nehmen Sie an, dass d 1 und d 2 viel länger sind als die Dispersionslänge 𝑧0 der Faser, und zeigen Sie, dass der neue Puls eine verzögerte Kopie des Originalpulses mit dem zeitlichen Vergrößerungsfaktor 𝜏2 ∕𝜏1 = d 2 ∕d 1 ist, sofern die Bedingung 1∕d 1 + 1∕d 2 = 1∕𝑓 erfüllt ist, wobei 𝑓 = −π∕𝜁𝐷𝜈 die Brennweite des Phasenmodulators für dieses Medium ist (𝜁 ist negativ, 𝑓 ist positiv). Das bedeutet, dass dieses System ein zeitliches abbildendes System ist. Aufgabe 23-7: Mischung von gechirpten Wellen und Chirpverstärkung
(a) Drei gepulste kollineare ebene Wellen mit den Mittenkreisfrequenzen 𝜔1 , 𝜔2 und 𝜔3 = 𝜔1 + 𝜔2 werden in einem nichtlinearen Medium zweiter Ordnung mit dem nichtlinearen Koeffizienten dgemischt. Das Medium ist dispersiv und hat die Brechungsindizes 𝑛1 , 𝑛2 und 𝑛3 und die Gruppengeschwindigkeiten 𝑣1 , 𝑣2 und 𝑣3 bei den drei Mittenfrequenzen. Die drei Pulse sind mit den Chirpparametern 𝑎1 , 𝑎2 und 𝑎3 gechirpt. Welche Beziehung müssen 𝑎1 , 𝑎2 und 𝑎3 erfüllen, damit die Dreiwellenmischung effizient verläuft? Hinweis: Nehmen Sie an, dass Energie und Impuls (Phasenbedingung) zu jedem Zeitpunkt erhalten sind. (b) Zeigen Sie, dass die Chirpparameter der Signalund/oder der Idlerwelle größer als der der Pumpe sein können. Diskutieren Sie mögliche Anwendungen dieser „Chirpverstärkung“. Aufgabe 23-8: Gepulste Dreiwellenmischung in einem Medium mit Gruppengeschwindigkeitsdispersion
Leiten Sie die Gleichungen gekoppelter Wellen (23.128) für die Dreiwellenmischung in einem Medium mit Gruppengeschwindigkeitsdispersion her. Verwenden Sie dazu das folgende Verfahren. Beginnen Sie mit der Helmholtzgleichung mit einer Quelle gleich der Fouriertransformierten von 𝒮 = 𝜇0 𝜕 2 𝒫nl ∕𝜕𝑡2 mit 𝒫nl = 2dℰ 2 . Drücken Sie das Feld ℰ als Superposition von drei Wellen mit unterschiedlichen Mittenfrequenzen und langsam variierenden Einhüllenden aus und wandeln Sie die Helmholtzgleichung in drei getrennte Gleichun-
Aufgaben
gen für die drei Frequenzen um. Vereinfachen Sie diese Gleichungen, indem Sie die Näherung der langsam variierenden Einhüllenden und die Näherung schwacher Dispersion einführen und den Ausbreitungskoeffizienten in eine Taylorreihe mit drei Termen entwickeln. Verwenden Sie eine inverse Fouriertransformation, um die Gleichungen in den Zeitbereich zurück zu transformieren. Aufgabe 23-9: Abhängigkeit der Solitoneigenschaften von der Gruppengeschwindigkeitsdispersion
Vergleichen Sie die Eigenschaften zweier fundamentaler Solitonen derselben Energie, die sich in zwei ausgedehnten Medien (z. B. optischen Fasern) mit den Koeffizienten der Gruppengeschwindigkeitsdispersion 𝐷𝜆 = 20 ps∕(km nm) bzw. 𝐷𝜆 = 10 ps∕(km nm), aber ansonsten identischen optischen Eigenschaften (gleiche Brechungsindizes und Kerrkoeffizienten 𝑛2 ) ausbreiten. Vergleichen Sie die Breiten der Solitonen, ihre maximalen Amplituden, die Flächen unter dem Amplitudenprofil und die Entfernungen. Aufgabe 23-10: Solitonen in einer optischen Faser
Zeigen, dass das Produkt aus Maximalintensität und Dispersionslänge für das fundamentale Soliton eine Konstante ist, 𝐼0 |𝑧0 | = 𝜆0 ∕4π 𝑛2 . Bestimmen Sie die Maximalintensität 𝐼0 für eine Quarzglasfaser mit dem Kerrkoeffizienten 𝑛2 = 3.19 × 10−20 m2 ∕W für eine Dispersionslänge |𝑧0 | = 30 km. Aufgabe 23-11: Messung eines Gaußpulses
Eine transformationsbeschränkter optischer Gaußpuls mit einer Halbwertsbreite von 50 fs und einer zentralen Wellenlänge von 800 nm wird mit dem in Abb. 23.57 illustrierten Intensitätskorrelator gemessen. (a) Bestimmen Sie die Form und Halbwertsbreite der gemessenen Autokorrelationsfunktion. (b) Es wurde vorgeschlagen, dass man die Messung verbessern könnte, wenn man einen der Pulse, z. B. den im oberen Zweig, durch Transmission durch eine Quarzglasfaser absichtlich dehnen würde. Wie lang müsste diese Faser sein, damit der Puls um einen Faktor 5 gedehnt würde [der Dispersionskoeffizient von Quarzglas bei 800 nm ist 𝐷𝜆 = −110 ps∕(km nm)]? Wie breit wäre die neue Korrelationsfunktion nach der Einfügung der Faser? (c) Diskutieren Sie mögliche Vorteile und Nachteile für die Pulsmessung, wenn diese Idee auf das in Abb. 23.62 gezeigte nichtlineare Interferometer übertragen und die Faser ebenfalls in den oberen Zweig eingeführt wird.
Aufgabe 23-12: Interferometer mit absorbierendem Zweiphotonendetektor
Ein Interferometer, das einen Zweiphotonenabsorber als Detektor verwendet, misst die Funktion aus Gl. (23.185). Vergleichen Sie dieses Interferometer mit einem nichtlinearen Interferometer, das einen Frequenzverdoppler gefolgt von einem konventionellen Detektor enthält und das Gl. (23.177) misst. Hinweis: Entwickeln Sie Gl. (23.185) in eine Form analog zu Gl. (23.178) und vergleichen Sie die verschiedenen Terme.
Weiterführende Literatur Ultraschnelle Optik
Siehe auch die Weiterführende Literatur in den Kapiteln 5, 6 und 22 D. T. Reid, C. M. Heyl, R. R. Thomson, R. Trebino, G. Steinmeyer, H. H. Fielding, R. Holzwarth, Z. Zhang, P. Del’Have, T. Südmeyer, G. Mourou, T. Tajima, D. Faccio, F. J. M. Harren, G. Cerullo, ‚Roadmap on Ultrafast Optics‘, Journal of Optics 18, 093006, 2016. A. M. Weiner, Ultrafast Optics, Wiley 2009. K. E. Oughstun, Electromagnetic and Optical Pulse Propagation. 2: Temporal Pulse Dynamics in Dispersive, Attenuative Media, Springer 2009. K. E. Oughstun, Electromagnetic and Optical Pulse Propagation. 1: Spectral Representations in Temporally Dispersive Media, Springer 2007. J.-C. Diels, W. Rudolph, Ultrashort Laser Pulse Phenomena, Elsevier, 2. Aufl. 2006. C. Rulliere (Hrsg.), Femtosecond Laser Pulses: Principles and Experiments, Springer, 2. Aufl. 2005. F. X. Kartner (Hrsg.), Few-Cycle Laser Pulse Generation and Its Applications, Springer 2004. R. Trebino (Hrsg.), Frequency-Resolved Optical Gating: The Measurement of Ultrashort Laser Pulses, Springer 2000. S. A. Akhmanov, V. A. Vysloukh, A. S. Chirkin, Optics of Femtosecond Laser Pulses, American Institute of Physics 1992. T. R. Gosnell, A. J. Taylor (Hrsg.), Selected Papers on Ultrafast Laser Technology, SPIE Optical Engineering Press 1991 (Milestone Series Bd. 44). W. Rudolph, B. Wilhelmi, Light Pulse Compression, Harwood 1989. D. Strickland, G. Mourou, ‚Compression of Amplified Chirped Optical Pulses‘, Optics Communications 56, 219–221, 1985.
865
866
23 Ultraschnelle Optik
Optische Solitonen
S. Boscolo, C. Finot (Hrsg.), Shaping Light in Nonlinear Optical Fibers, Wiley 2017. L. N. Binh, Optical Multi-Bound Solitons, CRC Press/Taylor & Francis 2016. G. Fibich, The Nonlinear Schrödinger Equation: Singular Solutions and Optical Collapse, Springer 2015. G. Agrawal, Nonlinear Fiber Optics, Academic Press/Elsevier, 5. Aufl. 2013. M. F. S. Ferreira, Nonlinear Effects in Optical Fibers, Wiley 2011. L. Mollenauer, J. Gordon, Solitons in Optical Fibers: Fundamentals and Applications, Academic Press 2006. T. Dauxois, M. Peyrard, Physics of Solitons, Cambridge University Press 2006. A. Hasegawa, M. Matsumoto, Optical Solitons in Fibers, Springer, 3. Aufl. 2003. Y. S. Kivshar, G. P. Agrawal, Optical Solitons: From Fibers to Photonic Crystals, Academic Press 2003. N. N. Akhmediev, A. Ankiewicz, Solitons, Nonlinear Pulses and Beams, Chapman & Hall 1997. L. F. Mollenauer, R. H. Stolen, ‚The Soliton Laser‘, Optics Letters 9, 13–15, 1984. L. F. Mollenauer, R. H. Stolen, J. P. Gordon, ‚Experimental Observation of Picosecond Pulse Narrowing and Solitons in Optical Fibers‘, Physical Review Letters 45, 1095–1098, 1980. Erzeugung von Superkontinuumlicht
R. R. Alfano (Hrsg.), Supercontinuum Laser Source: The Ultimate White Light, Springer, 3. Aufl. 2016. G. Genty, A. T. Friberg, J. Turunen, Coherence of Supercontinuum Light. In: T. D. Visser (Hrsg.), Bd. 61 in Progress in Optics, S. 71–112, Elsevier 2016. J. M. Dudley, J. R. Taylor (Hrsg.), Supercontinuum Generation in Optical Fibers, Cambridge University Press 2010. J. M. Dudley, G. Genty, S. Coen, ‚Supercontinuum Generation in Photonic Crystal Fiber‘, Reviews of Modern Physics 78, 1135–1184, 2006. Erzeugung von höheren Harmonischen und Attosekundenoptik
C. D. Lin, A.-T. Le, C. Jin, H. Wei, Attosecond and StrongField Physics: Principles and Applications, Cambridge University Press 2018. M. Sivis, M. Taucer, G. Vampa, K. Johnston, A. Staudte, A. Yu. Naumov, D. M. Villeneuve, C. Ropers, P. B. Corkum, ‚Tailored Semiconductors for High-Harmonic Optoelectronics‘, Science 357, 303–306, 2017. F. Calegari, G. Sansone, S. Stagira, C. Vozzi, M. Nisoli, ‚Advances in Attosecond Science‘, Journal of Physics B: Atomic, Molecular and Optical Physics 49, 062001, 2016. U. Huttner, K. Schuh, J. V. Moloney, S. W. Koch, ‚Similarities and Differences Between High-Harmonic Generation
in Atoms and Solids‘, Journal of the Optical Society of America B 33, C22–C29, 2016. P. H. Bucksbaum, ‚Sources and Science of Attosecond Light‘, Optics & Photonics News 26(5), 28–35, 2015. S. Hadrich, A. Klenke, J. Rothhardt, M. Krebs, A. Hoffmann, O. Pronin, V. Pervak, J. Limpert, A. Tunnermann, ‚High Photon Flux Table-Top Coherent Extreme-Ultraviolet Source‘, Nature Photonics 8, 779–783, 2014. T. Popmintchev, M.-C. Chen, D. Popmintchev, P. Arpin, S. Brown, S. Alisauskas, G. Andriukaitis, T. Balciunas, O. D. Miicke, A. Pugzlys, A. Baltuska, B. Shim, S. E. Schrauth, A. Gaeta, C. Hernandez-Garcia, L. Plaja, A. Becker, A. Jaron-Becker, M. M. Murnane, H. C. Kapteyn, ‚Bright Coherent Ultrahigh Harmonics in the keV X-Ray Regime from Mid-Infrared Femtosecond Lasers‘, Science 336, 1287–1291, 2012. A. Cingoz, D. C. Yost, T. K. Allison, A. Ruehl, M. E. Fermann, I. Hartl, J. Ye, ‚Direct Frequency Comb Spectroscopy in the Extreme Ultraviolet‘, Nature 482, 68–71, 2012. Z. Chang, Fundamentals of Attosecond Optics, CRC Press/ Taylor & Francis 2011. G. Sansone, L. Poletto, M. Nisoli, ‚High-Energy Attosecond Light Sources‘, Nature Photonics 5, 655–663, 2011. T. Popmintchev, M.-C. Chen, P. Arpin, M. M. Murnane, H. C. Kapteyn, ‚The Attosecond Nonlinear Optics of Bright Coherent X-Ray Generation‘, Nature Photonics 4, 822–832, 2010. F. Krausz, M. Ivanov, ‚Attosecond Physics‘, Reviews of Modern Physics 81, 163–234, 2009. P. B. Corkum, Z. Chang, ‚The Attosecond Revolution‘, Optics & Photonics News 19(10), 24–29, 2008. P. B. Corkum, F. Krausz, ‚Attosecond Science‘, Nature Physics 3, 381–387, 2007. P. Jaegle, Coherent Sources of EUV Radiation: Soft X-Ray Lasers and High-Order Harmonic Generation, Springer 2006. H. C. Kapteyn, M. M. Murnane, I. P. Christov, ‚Extreme Nonlinear Optics: Coherent X Rays from Lasers‘, Physics Today 58(3), 39–44, 2005. M. Wegener, Extreme Nonlinear Optics: An Introduction, Springer 2005. P. B. Corkum, ‚Plasma Perspective on Strong-Field Multiphoton Ionization‘, Physical Review Letters 71, 1994– 1997, 1993. A. McPherson, G. Gibson, H. Jara, U. Johann, T. S. Luk, I. A. Mclntyre, K. Boyer, C. K. Rhodes, ‚Studies of Multiphoton Production of Vacuum-Ultraviolet Radiation in the Rare Gases‘, Journal of the Optical Society of America B 4, 595–601, 1987. N. H. Burnett, H. A. Baldis, M. C. Richardson, G. D. Enright, ‚Harmonic Generation in CO2 Laser Target Interaction‘, Applied Physics Letters 31, 172–174, 1977.
Aufgaben
Erzeugung von ultrakurzen Petawattpulsen
E. Cartlidge, ‚The Light Fantastic‘, Science 359, 382–385, 2018. B. Le Garrec, D. N. Papadopoulos, C. Le Blanc, J. P. Zou, G. Cheriaux, P. Georges, F. Druon, L. Martin, L. Freneaux, A. Beluze, N. Lebas, F. Mathieu, P. Audebert, ‚Design Update and Recent Results of The Apollon 10 PW Facility‘, SPIE Proceedings 10238 (High-Power, HighEnergy, High-Intensity Laser Technology III), 2017. X. Zeng, K. Zhou, Y. Zuo, Q. Zhu, J. Su, X. Wang, X. Wang, X. Huang, X. Jiang, D. Jiang, Y. Guo, N. Xie, S. Zhou, Z. Wu, J. Mu, H. Peng, F. Jing, ‚Multi-Petawatt Laser Facility Fully Based on Optical Parametric Chirped-Pulse Amplification‘, Optics Letters 42, 2014–2017, 2017. A. Heller, ‚Lighting a New Era of Scientific Discovery‘, Science & Technology Review, 4–11, January/February 2014.
867
869
24 Optische Verbindungen und Schalter
Telekommunikation WAN
100 km
Datennetze
MAN
10 km
LAN
1 km
1 2 3
1 2 3
M
N
...
. ..
Verbindungen und Schalter sind entscheidende Komponenten von verteilten Systemen, gleich ob es sich um weltumspannende Telekommunikations- oder Datennetze, um lokale Netzwerke innerhalb einer Firma oder eines Hauses oder um die Verbindungen zwischen Computern in demselben Raum, zwischen Komponenten innerhalb eines Computers oder sogar zwischen unterschiedlichen Bereichen auf einem einzelnen Chip handelt. Wie Abb. 24.3 zeigt, erstrecken sich die physischen Dimensionen solcher Vernetzungen über viele Größenordnungen: Etwa 1–100 km für die großen Nachrichtensysteme, 10–1000 m für die lokale Datenkommunikation und 1–1000 cm für Verbindungen in und zwischen Computern. Die Knoten in diesen Netzwerken können passiv (starr) oder aber aktiv (programmierbar) und schaltbar sein. Optische Fasern haben sich als bevorzugte Infrastruktur für Nachrichtensysteme und -netze durchgesetzt, was zur Entwicklung einer Vielzahl von photonischen Schaltern geführt hat, die aktive Knoten ermöglichen. Für Kurzstreckenanwendungen hat sich die Dominanz der Faseroptik langsamer entwickelt, aber selbst für Verbindungen zwischen einzelnen Servern in einem Rack, zwischen Komponenten eines Computers, zwischen zwei Chips auf einem Board oder sogar zwischen Bereichen auf ein und demselben Chip setzen sich optische Verbindungen und Schalter allmählich durch. Die grundsätzlichen Schwierigkeiten liegen dabei in der höheren Dichte der Verbindungen und der damit verbundenen Wärmedissipation. Zwar haben mehrere Jahrzehnte der Forschung an digitalen optischen Computern keine im Handel erhältlichen Produkte hervorge-
Steuersignal
Abb. 24.2 Ein allgemeines N × M-Vermittlungssystem kann als passive Verbindung, als Router oder als Schalter ausgeführt sein.
bracht, die mit traditionellen elektronischen Computern mithalten könnten, aber dabei sind eine ganze Reihe von Technologien für optische Verbindungen und Schalter entstanden. Ein allgemeines Vermittlungssystem ist in Abb. 24.2 schematisch dargestellt. Licht, das an einem von 𝑀 Eingängen in das System eintritt, wird zu einem oder mehreren von 𝑁 Ausgängen geleitet. Wenn die Verbindungen starr sind und nicht von der Natur der ankommenden Strahlen abhängen, spricht man von einer Verbindung. Wenn eine Eigenschaft der Strahlen am Eingang bestimmt, zu welchem Ausgang sie geleitet werden, wird das System als Router bezeichnet. Wenn die Verbindungen schließlich mithilfe eines externen Steuersignals konfiguriert werden können, handelt es sich um einen Schalter. Wie Abb. 24.3 schematisch zeigt, ist Licht durch eine Reihe von Attributen charakterisiert – Ort (Raum), Zeit (für optische Pulse oder Pulsfolgen, die einen Code repräsentieren), Wellenlänge (oder Frequenz), Polarisation, Richtung, Intensität oder Phase (für kohärenComputer-intern
Rechenzentren AOC Rack-Rack Board-Board Chip-Chip On-Chip
100 m
10 m
1m
10 cm
1 cm
Abb. 24.1 Typische Verbindungsdistanzen verschiedener Arten von Telekommunikationsnetzen [wide-area networks (WAN) und metropolitan-area networks (MAN)], Datennetzen [local-area networks (LAN), Rechenzentren und aktive optische Kabel] und Verbindungen innerhalb von Computern (Verbindungen von Rack zu Rack, Board zu Board, Chip zu Chip sowie On-Chip). Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
870
24 Optische Verbindungen und Schalter
Zeit
Ort
Code Wellenlänge (Frequenz)
Richtung
Intensität
Phase
Polarisation
Abb. 24.3 Attribute eines optischen Strahls, die zur Modulation, zum Multiplexing, zum Routen oder Schalten verwendet werden können.
te Wellen). Diese Attribute bieten die Möglichkeit, das Netz der Verknüpfungen und Knoten in einem optischen Netzwerk flexibel zu gestalten. Wenn sich die verschiedenen Knoten, die in Abb. 24.2 schematisch dargestellt sind, durch die Position eines Lichtstrahls steuern lassen, spricht man von einem Raumbereichsschalter oder einfach Raumschalter, wenn sie über die Zeit gesteuert werden, von einem Zeitbereichsschalter. Wenn die Wellenlänge des eintreffenden Strahls die zur Steuerung genutzte Größe ist, handelt es sich um einen Wellenlängenbereichsschalter, wenn die Polarisation das entscheidende Kriterium ist, handelt es sich um einen Polarisationsschalter. Ein Zeitschalter kann beispielsweise eingesetzt werden, um ein Signal von einem Zeitintervall (Slot) in ein anderes umzuschalten, wohingegen ein Wellenlängenbereichsschalter ein Signal von einem Wellenlängenbereich in einen anderen transformiert. Schalter, die durch eine in jedes Paket von eingehenden Daten integrierte Adresse gesteuert werden, werden Codeschalter oder Paketschalter genannt. Ein Vermittlungsschalter, bei dem ein Attribut (z. B. die Wellenlänge) des ankommenden Lichts bestimmt, zu welchem Ausgang es geleitet wird, wird als passiver optischer Router bezeichnet. Derartige Router erlauben Multiplexing: Hierbei werden mehrere Datenströme über derselbe Verbindung übertragen, wobei ein Attribut zur Unterscheidung der Datenströme dient und ein weiteres verwendet wird, um die gewünschte Information zu codieren. Beispielsweise könnte man die optischen Intensitäten unterschiedlicher Wellenlängen in einem Lichtstrahl mit unterschiedlichen Datenströmen modulieren und diese Datenströme am Ziel mithilfe eines wellenlängenempfindlichen optischen Routers trennen. Die Einführung des Wellenlängenmultiplexing (WDM, engl. wavelength-division multiplexing) hat faser-
optische Kommunikationssysteme auf ein neues Niveau gehoben, wie wir in Abschnitt 25.4.3 sehen werden, und den Anstoß zur Entwicklung wellenlängenspezifischer photonischer Schalter gegeben.
In diesem Kapitel . . . Dieses Kapitel führt die grundlegenden Prinzipien von optischen Verbindungen, passiven optischen Routern, photonischen Schaltern und photonischen Logikgattern ein. Viele der grundlegenden Prinzipien der Photonik, die wir in früheren Kapiteln eingeführt hatten (Fourieroptik und Holographie, Wellenleiter- und Faseroptik, Elektrooptik, Halbleiteroptik, Akustooptik, nichtlineare Optik und ultraschnelle Optik) kommen hier zur Anwendung. Abschnitt 24.1 beschreibt optische Verbindungen auf der Grundlage von ebenen Lichtwellenschaltungen im Vakuum oder von optischen Fasern. In diesen Verbindungen werden die Strahlen am Eingang unabhängig von ihren Attributen oder der Information, die sie enthalten, zu vorgegebenen Ausgängen geleitet. Passive optische Router werden in Abschnitt 24.2 beschrieben. Hier wird jeder optische Strahl am Eingang zu einem oder mehreren Ausgängen geleitet, die durch Strahlattribute wie die Wellenlänge, Polarisation, oder Intensität bestimmt werden. Zum Beispiel können Komponenten eines Strahls mit unterschiedlichen Wellenlängen getrennt und zu verschiedenen Ausgängen geleitet werden. Das Bauelement dient dann als Wellenlängendemultiplexer. Die Umkehrung dieses Prinzips, bei der Strahlen mit unterschiedlichen Wellenlängen zu einem einzigen Strahl vereinigt werden, wird Wellenlängenmultiplexing genannt. Photonische Raumschalter werden in Abschnitt 24.3 beschrieben. Das einfachste Beispiel eines solchen Schalters ist ein simpler ein-aus-Schalter, der zwei Kanäle verbindet oder eben nicht (d. h. er lässt den Strahl durch oder nicht). Eine weitere Möglichkeit ist ein Schalter, der einen Strahl unabhängig von seinem Inhalt oder seinen Attributen zu einem von zwei möglichen Ausgängen leitet. Einer Einführung in die allgemeinen Arten solcher Schalter und ihrer Eigenschaften folgt eine kurze Übersicht über die unterschiedlichen Realisierungsmöglichkeiten wie z. B. mechanooptische, elektrooptische, halbleiterphotonische, thermooptische oder volloptische Bauelemente. Schließlich werden auch Zeitbereichsschalter und Codeschalter (Paketschalter) kurz beschrieben.
24.1 Optische Verbindungen
Abschnitt 24.4 ist optischen Logikgattern auf der Basis bistabiler optischer Bauelemente gewidmet. Dabei handelt es sich um Schalter mit einem „Gedächtnis“, d. h. Systeme, in denen der gewählte Ausgang sowohl von der aktuellen Eingabe als von der Vorgeschichte des Systems abhängt.
24.1 Optische Verbindungen Digitale signalverarbeitende und Computersysteme enthalten eine große Anzahl von miteinander verbundenen Logikgattern, Schaltern und Speicherelementen. In elektronischen Systemen bestehen die Verbindungen aus metallischen Drähten, Koaxialkabeln oder leitenden Kanälen in integrierten Halbleiterschaltungen. Photonische Verbindungen können analog durch optische Wellenleiter mit integriert-optischen oder faseroptischen Kopplern realisiert werden. Auch Lichtstrahlen im freien Raum können für Verbindungen genutzt werden, wobei die Strahlen durch Mikrolinsen oder Beugungselemente geführt werden. Diese Möglichkeit steht in elektronischen Systemen nicht zur Verfügung, da Elektronenstrahlen im Vakuum verlaufen müssen und sich nicht ohne gegenseitige Abstoßung kreuzen können. Abbildung 24.4 stellt einige Anordnungen von Verbindungen (auch Koppler genannt) dar. In ihnen ist jeder Eingang mit einem oder mehreren Ausgängen verbunden und umgekehrt. In Verzweigungen oder T-Kopplern ist der Eingang mit beiden Ausgängen verbunden. In Sternkopplern oder Richtkopplern ist jeder Eingang mit allen Ausgängen verbunden.
24.1.1 Die Verbindungsmatrix Abbildung 24.4 zeigt nur schematische Konnektivitätsdiagramme, die nichts über die quantitativen Beziehungen zwischen den optischen Feldern oder Intensitäten an den verbundenen Kanälen aussagen. Für lineare ko(0) härente optische Verbindungen ist das optische Feld 𝑈𝓁 am Ausgang 𝓁 (𝓁 = 1, 2, … , 𝑁) mit den optischen Feldern (𝑖) 𝑈𝑚 an den Eingängen 𝑚 = 1, 2, … , 𝑀 durch eine Superposition verknüpft: (0)
𝑈𝓁 =
𝑀 ∑ 𝑚=1
(𝑖)
T 𝓁𝑚 𝑈𝑚 ,
(24.1)
wobei die Gewichte {T 𝓁𝑚 } komplexe Zahlen sind, die eine Verbindungsmatrix T definieren. Zum Beispiel wird der 2 × 2-3-dB-Koppler in Abb. 24.4(c) durch die Verbindungsmatrix 1 ⎡1 2 ⎣i
T= √ ⎢
i⎤ ⎥ 1 ⎦
(24.2)
beschrieben, die mit der eines idealen Strahlteilers [Gl. (7.20)] oder der Transfermatrix von phasenangepassten geführten Wellen in der Theorie gekoppelter Wellen [Gl. (9.54)] identisch ist. Für dieses Bauelement wird die optische Leistung eines Eingangsstrahls (in Abwesenheit des zweiten) gleichmäßig auf die beiden abgehenden Strahlen verteilt. Andere Verbindungen können ähnlich beschrieben werden. Die Verbindungsmatrix einer Kaskade von Verbindungen kann durch Matrixmultiplikation bestimmt werden, wie in Abschnitt 7.1.1 beschrieben. Da wir annehmen, dass das Licht kohärent ist, spielen die Phasenbeziehungen zwischen den ankommenden Strahlen und die durch die Verbindungselemente eingeführten Phasen eine wichtige Rolle. Häufig wer-
(a) Banyanschalter
Inversion/ Kreuzung
Kreuzung
T-Koppler
Verzweigung („Fan-out“/multicast)
Kombination („Fan-in“)
3-dB-Koppler
Projektion
Sternkoppler
ideale Mischung
(b)
(c) Buskoppler
Abb. 24.4 Typische Beispiele von Verbindungen. (a) „Einszu-Eins“. (b) „Eins-zu-Vielen“ oder „Viele-zu-Eins“. (c) „Vielezu-Vielen“.
871
872
24 Optische Verbindungen und Schalter
den interferometrische Effekte ausgenutzt, um die eingehende Leistung auf vorgegebene Weise zwischen den Ausgängen zu verteilen. Wenn das Licht inkohärent ist, ist die Intensität (und folglich die Leistung) an jedem Ausgang eine gewichtete Superposition der Intensitäten (Leistungen) an den Eingängen (siehe Abschnitt 12.3.2), (0)
𝑃𝓁 =
𝑀 ∑ 𝑚=1
(𝑖)
|T 𝓁𝑚 |2 𝑃𝑚 .
(24.3)
Beispielsweise sind die Leistungen am Ausgang und den Eingängen eines 3-dB-Kopplers durch eine Matrix ver1 bunden, deren Elemente alle gleich sind. 2 Zu den entscheidenden Spezifikationen realer Koppler gehören die folgenden Leistungsverhältnisse, die gewöhnlich in dB [= −10 log(1∕Verhältnis)] ausgedrückt werden: • Die Einfügungsdämpfung beschreibt die Leistungstransmission von Kanal zu Kanal, die für ein verlustfreies Bauelement idealerweise 0 dB betragen sollte. • Für einen Koppler, der die Leistung auf mehrere Ausgänge verteilt, ist das Verteilungsverhältnis gleich dem Verhältnis der Leistung an einem Ausgang zur Leistung an allen Ausgängen. Für einen idealen 3-dBKoppler ist das Verteilungsverhältnis −3 dB. • Das Übersprechen ist das Verhältnis der unerwünschten Leistung an einem Ausgang zu der Eingangsleistung, die zu anderen Ausgängen geleitet wird. • Der Verlustfaktor ist das Verhältnis der Gesamtausgangs- zur Gesamteingangsleistung.
bindungen sind jedoch reziprok, d. h. die Verbindungsmatrix bleibt gleich, wenn die Transmission stattdessen von den Ausgängen zu den Eingängen erfolgt. Wenn das nicht zutrifft, ist die Verbindung nichtreziprok. Isolatoren
Das einfachste Beispiel für eine nichtreziproke Verbindung ist eine unidirektionale 1 × 1-Verbindung, die den Strahl nur in einer Richtung durchlässt, wie in Abb. 24.5(a). Eine solche Verbindung wird häufig durch einen optischen Isolator realisiert, ähnlich einer Diode oder einem Einwegeventil (siehe Abschnitt 6.4.2). Die Leistung eines Isolators wird durch seine Einfügungsdämpfung (Leistungstransmission in Vorwärtsrichtung in dB) und seine Umkehrisolierung (Leistungstransmission in Rückwärtsrichtung in dB) angegeben. Nichtreziproke Mehrkanalverbindungen
Die Bezeichnungen Ein- und Ausgang sind nicht mehr anwendbar, wenn ein Kanal eine Doppelrolle als Sender und Empfänger spielt. Die Verbindung wird dann einfach durch die Zahl ihrer Kanäle bezeichnet. Abbildung 24.5(b) und (c) zeigen Beispiele von Dreikanalverbindungen aus unidirektionalen Elementen. Diese Verbindungen werden in Duplex-Nachrichtensystemen wie z. B. der Vierkanalverbindung in Abb. 24.5(e) verwendet. In dem in Abb. 24.5(d) dargestellten Vierkanalsystem sind die Verbindungen für Signale in Vorwärtsrichtung (von links nach rechts) parallel durchgeschaltet und für Signale in Rückwärtsrichtung (von rechts nach links) über Kreuz geführt. Zirkulatoren
24.1.2 Nichtreziproke Verbindungen: Isolatoren und Zirkulatoren Die Bezeichnung der Kanäle einer Verbindung als Einund Ausgang impliziert eine bestimmte Richtung des Durchgangs – vom Eingang zum Ausgang (von links nach rechts in den Beispielen in Abb. 24.4). Manche Ver-
Ein anderes Beispiel für eine nichtreziproke Verbindung ist der optische Zirkulator, eine Verbindung mit drei oder mehr Kanälen, die durch unidirektionale Verbindungen verknüpft sind, die in dieselbe Richtung zeigen. Wie in Abb. 24.6 dargestellt, ist ein Vierkanalzirkulator äquivalent zu der Verbindung in Abb. 24.5(d). Zirkulatoren haben viele Anwendungen in Nachrichtensystemen
1 2
1 (a)
2
1
3
3
2
1
3 2 (b)
(c)
4 (d)
(e)
Abb. 24.5 (a) Unidirektionale Zweikanalverbindung (Isolator). (b) und (c) Dreikanalverbindung aus zwei unidirektionalen Verbindungen. (d) Nichtreziproke Vierkanalverbindung. (e) Vierkanalverbindung für bidirektionale (Duplex-) Kommunikation.
24.1 Optische Verbindungen
1
2
1
2
4
3
ler und Projektoren können mithilfe optischer Standardkomponenten realisiert werden, wie Abb. 24.7 zeigt (siehe auch Abb. 24.4). Sie können durch Verwendung von mikrooptischen Komponenten wie Miniaturstrahlteilern, -linsen, -gradientenindexstäben, -prismen, -filtern und -gittern miniaturisiert werden. Solche Komponenten sind auch mit optischen Fasern kombinierbar, die häufig für die Übertragung von Licht verwendet werden.
= 3
4
Abb. 24.6 Vierkanalzirkulator. Die beiden Anordnungen sind äquivalent.
und Netzen. Ein Beispiel für den Einsatz von Zirkulatoren in optischen Add/Drop-Multiplexern wird in Abschnitt 24.2.1 beschrieben (siehe Abb. 24.22).
24.1.3 Brechende und beugende Verbindungen im freien Raum Brechende Verbindungen
Konventionelle optische Komponenten (Spiegel, Linsen, Prismen usw.) werden routinemäßig als Verbindungen in optischen Systemen eingesetzt. Ein Beispiel ist ein bildgebendes System, in dem eine Linse verwendet wird, um Punkte der Gegenstandsebene mit Punkten der Bildebene zu verbinden. Um ein Gefühl für die außerordentlich hohe Dichte solcher Verbindungen zu bekommen, überlegen wir uns, dass in einem hochwertigen bildgebenden System durch eine Linse nicht weniger als 1000 × 1000 unabhängige Punkte pro mm2 in der Gegenstandsebene optisch mit entsprechenden 1000 × 1000 Punkten pro mm2 in der Bildebene verbunden werden. Um ein solches System elektronisch zu realisieren, wären eine Million nicht überkreuzter und korrekt isolierter Leiterkanäle pro mm2 erforderlich! Spezielle Verbindungen wie Schieber, Inverter, Kreuzungen, Mischer, Verzweiger, Kombinierer, Sternkopp-
Inversion
Richtkoppler
Beugende Verbindungen
Die Herstellung beliebiger optischer Verbindungskarten erfordert speziell entworfene optische Komponenten, die ziemlich komplex und unhandlich sein können. Allerdings können computererzeugte Hologramme aus einer großen Zahl von Segmenten von Phasengittern unterschiedlicher Ortsfrequenzen und Orientierungen verwendet werden, um hochdichte optische Verbindungen zu erzeugen. Ein Phasengitter ist ein dünnes optisches Element, dessen komplexe Amplitudentransmission eine zweidimensionale periodische Funktion mit Einheitsamplitude ist. Das einfachste Phasengitter hat die komplexe Amplitudentransmission t(𝑥, 𝑦) = exp[−i2π (𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)], wobei 𝜈𝑥 und 𝜈𝑦 die Ortsfrequenzen in 𝑥- bzw. 𝑦-Richtung sind; sie bestimmen die Periode und Orientierung des Gitters. In den Abschnitten 2.4.2 und 4.1.1 wurde gezeigt, dass ein kohärenter optischer Strahl der Wellenlänge 𝜆 beim Durchgang durch dieses Gitter eine Phasenverschiebung erfährt, so−1 −1 dass er um die Winkel sin 𝜆𝜈𝑥 ≈ 𝜆𝜈𝑥 bzw. sin 𝜆𝜈𝑦 ≈ 𝜆𝜈𝑦 abgelenkt wird, wobei 𝜆𝜈𝑥 ≪ 1 und 𝜆𝜈𝑦 ≪ 1 ist, wie Abb. 24.8 illustriert. Durch Veränderung der Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 (d. h. der Periodizität und Orientierung des Gitters) werden die Ablenkwinkel verändert.
Inversion
Kreuzung
ideale Mischung
Verzweigung Kombination („Fan-Out”) („Fan-In”)
Sternkoppler
Projektion
Abb. 24.7 Beispiele von einfachen optischen Verbindungen aus konventionellen optischen Komponenten: Ein Prisma beugt parallele optische Strahlen und erzeugt eine geordnete Verbindungskarte entsprechend einer Inversion oder Kreuzung. Zwei geeignet orientierte Prismen führen eine ideale Mischung durch – eine Operation, die in Sortieralgorithmen und der schnellen Fouriertransformation benötigt
wird. Eine Linse bewirkt eine Verzweigung, Kombination oder Inversion. Ein Strahlteiler wirkt gemeinsam mit zwei Linsen als Richtkoppler. Ein Glasstab dient als Sternkoppler. Ein astigmatisches optisches System wie eine Zylinderlinse führt eine Projektion durch und verbindet Punkte einer Zeile in der Eingangsebene mit einem Punkt in der Ausgangsebene.
873
24 Optische Verbindungen und Schalter
y
y
λνx
λνy
x
1/νy
x
y x
1/νx 1/νy
1/νx
Abb. 24.8 Ablenkung einer optischen Welle bei Durchgang durch ein Phasengitter. Die Ablenkwinkel, die hier klein angenommen sind, hängen von der Ortsfrequenz und der Orientierung des Gitters ab.
tete Verbindungen können realisiert werden, indem man den unterschiedlichen Gittern unterschiedliche Gewichte zuweist. Durch geeignete Auswahl der GitterOrtsfrequenzen an jedem Punkt des Hologramms können daher beliebige Verbindungskarte erzeugt werden. (xʹ, yʹ)
(x, y)
Übung 24-1: Verbindungskapazität d
Abb. 24.9 Holographische Verbindungskarte aus einer Reihe von Phasengittern mit unterschiedlichen Periodizitäten und Orientierungen.
Wie in Abschnitt 4.1.1 beschrieben kann dieses Prinzip ausgenutzt werden, um mit einem Phasengitter aus Gittersegmenten mit unterschiedlichen Ortsfrequenzen eine beliebige Verbindungskarte aufzubauen. Optische Strahlen, die durch die unterschiedlichen Segmente transmittiert werden, erfahren unterschiedliche Ablenkungen gemäß der gewünschten Verbindungskarte (Abb. 24.9). Wenn das Gittersegment am Ort (𝑥, 𝑦) die Frequenzen 𝜈𝑥 = 𝜈𝑥 (𝑥, 𝑦) und 𝜈𝑦 = 𝜈𝑦 (𝑥, 𝑦) besitzt, sind die Ablenkwinkel näherungsweise 𝜆𝜈𝑥 und 𝜆𝜈𝑦 und der Strahl trifft die Ausgangsebene an dem Punkt (𝑥′ , 𝑦 ′ ), für den gilt 𝑥′ − 𝑥 d
≈ 𝜆𝜈𝑥 ,
𝑦′ − 𝑦 d
Der Raum-Bandbreite-Produkt eines quadratischen Hologramms der Größe 𝑎 × 𝑎 ist gleich (𝐵𝑎)2 , wobei 𝐵 die größte Ortsfrequenz (Linien/mm) ist, die das Hologramm wiedergeben kann. Zeigen Sie, dass das Produkt 𝑀𝐿 den Wert (𝐵𝑎)2 nicht überschreiten kann, wenn das Hologramm benutzt wird, um 𝐿 ankommende Strahlen in 𝑀 Richtungen zu lenken (Abb. 24.10). Hinweis: Verwenden Sie eine Analyse analog der in Abschnitt 20.2.3 im Zusammenhang mit akustooptischen Verbindungen vorgestellten [siehe Gl. (20.52)]. Wie groß ist die maximale Zahl von Verbindungen pro mm2 , wenn die höchste Ortsfrequenz 1000 Linien/mm beträgt und jeder Punkt in der Eingangsebene mit jedem Punkt in der Ausgangsebene verbunden ist? Abb. 24.10 Zur Illustration der Beziehung ML ≤ (Bd )2 .
1 2
...
874
≈ 𝜆𝜈𝑦 ,
(24.4)
wobei d die Entfernung zwischen dem Hologramm und der Ausgangsebene ist und wir angenommen haben, dass alle Winkel klein sind. Wenn die gewünschte Beziehung zwischen (𝑥′ , 𝑦 ′ ) und (𝑥, 𝑦) gegeben ist, d. h. die Verbindungskarte, können die notwendigen Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 an jedem Ort mithilfe von Gl. (24.4) bestimmt werden. Holographische Bauelemente sind in der Lage, „einszu-eins“ oder „viele-zu-eins“-Verbindungen aufzubauen (d. h. einen Punkt mit vielen Punkten oder umgekehrt zu verbinden). In Abb. 24.9 ist das zentrale Gitter beispielsweise eine Superposition zweier harmonischer Funktionen, seine komplexe Amplitudentransmission ist daher t(𝑥, 𝑦) = exp[−i2π(𝜈𝑥1 𝑥 + 𝜈𝑦1 𝑦)] + exp[−i2π(𝜈𝑥2 𝑥 + 𝜈𝑦2 𝑦)]; der einfallende Strahl wird in zwei gleiche Komponenten unter den (kleinen) Winkeln (𝜆𝜈𝑥1 , 𝜆𝜈𝑦1 ) bzw. (𝜆𝜈𝑥2 , 𝜆𝜈𝑦2 ) aufgespalten. Gewich-
L
M
Im Grenzfall infinitesimaler Flächen der Gitterelemente wird die Verbindungskarte kontinuierlich (anstatt diskret): Sie wird zu einer Vorschrift für eine geometrische Koordinatentransformation, die jedem Punkt (𝑥, 𝑦) in der Eingangsebene einen entsprechenden Punkt (𝑥′ , 𝑦 ′ ) der Ausgangsebene zuweist. Wenn die gewünschte Transformation durch die beiden kontinuierlichen Funktionen 𝑥′ = 𝜓𝑥 (𝑥, 𝑦) ,
𝑦 ′ = 𝜓𝑦 (𝑥, 𝑦)
(24.5)
definiert ist, müssen sich die Gitterfrequenzen wie in einem frequenzmodulierten Signal kontinuierlich mit 𝑥 und 𝑦 ändern (siehe Abb. 24.11). Wenn wir annehmen, dass das Gitter eine Transmission t(𝑥, 𝑦) = exp[−i𝜑(𝑥, 𝑦)] besitzt, sind die zugehörigen lokalen
24.1 Optische Verbindungen
e –iφ(x,y)
(x,y)
(xʹ,yʹ)
Abb. 24.11 Beugung an einem Phasenhologramm als kontinuierliche Verbindungskarte.
(oder instantanen) Frequenzen 2π 𝜈𝑥 =
𝜕𝜑 , 𝜕𝑥
2π 𝜈𝑦 =
𝜕𝜑 𝜕𝑦
(24.6)
(siehe Abschnitt 4.1.1). Durch Einsetzen in Gl. (24.4) erhalten wir 𝜓𝑥 (𝑥, 𝑦) − 𝑥 d
=
𝜆 𝜕𝜑 , 2π 𝜕𝑥
𝜓𝑦 (𝑥, 𝑦) − 𝑦 d
=
𝜆 𝜕𝜑 . (24.7) 2π 𝜕𝑦
Diese partiellen Differentialgleichungen können gelöst werden, um die Phasenfunktion 𝜑(𝑥, 𝑦) des Gitters zu bestimmen. Beispiel 24-1: Kombinationskarte
Nehmen Sie an, dass alle Punkte (𝑥, 𝑦) in der Eingangsebene auf den Punkt (𝑥′ , 𝑦 ′ ) = (0, 0) in der Ausgangsebene abgebildet werden sollen, sodass eine Kombinationskarte erzeugt wird. Wir setzen 𝜓𝑥 (𝑥, 𝑦) = 𝜓𝑦 (𝑥, 𝑦) = 0 in Gl. (24.7) ein und lösen die beiden partiellen Differentialgleichungen; das ergibt 𝜑(𝑥, 𝑦) = −π(𝑥2 + 𝑦 2 )∕𝜆 d . Nicht ganz überraschend ist das genau die durch eine Linse der Brennweite d eingeführte Phasenverschiebung (siehe Abschnitt 2.4.2). Übung 24-2: Die logarithmische Karte
Zeigen Sie, dass die logarithmische Koordinatentransformation 𝑥′ = 𝜓𝑥 (𝑥, 𝑦) = ln 𝑥 ,
(24.8)
′
𝑦 = 𝜓𝑦 (𝑥, 𝑦) = ln 𝑦
(24.9)
durch ein Hologramm mit der Phasenfunktion ( 1 𝜑(𝑥, 𝑦) = (2π∕𝜆 d ) 𝑥 ln 𝑥 − 𝑥 − 𝑥2 2 ) 1 2 (24.10) +𝑦 ln 𝑦 − 𝑦 − 𝑦 2
realisiert wird. Sobald die geeignete Phase 𝜑(𝑥, 𝑦) feststeht, kann das optische Element durch computererzeugte Holographie hergestellt werden. Dabei wird eine komplexe Funktion exp[−i𝜑(𝑥, 𝑦)] mithilfe einer binären Funktion verschlüsselt, die nur zwei Werte annimmt, etwa 1
und 0 oder 1 und −1. Das entspricht der Codierung eines Bildes durch schwarze Punkte, deren Größe oder Dichte sich proportional zum lokalen Grauwert des Bildes ändert (z. B. bei der Rasterung von Bildern in Zeitungen). Das binäre Bild wird mithilfe eines Computers auf eine Maske (eine Folie) gedruckt, die als Hologramm dient. Alternativ kann es auch durch Ätzen von Rillen in ein Substrat festgehalten werden, die die Phase einer einfallenden kohärenten Welle modulieren; dieses Verfahren ist als Oberflächenholographie bekannt. Dynamische (konfigurierbare) Verbindungskarten können durch akustooptische oder magnetooptische Bauelemente realisiert werden. Die Zahl der möglichen Verknüpfungspunkte ist hierbei jedoch viel kleiner als bei Verwendung von holographischen Gittern. Dynamische holographische Verbindungen können durch nichtlineare optische Prozesse wie die Vierwellenmischung in photorefraktiven Materialien erreicht werden. Dabei interferieren zwei Wellen und erzeugen ein Gitter, an dem eine dritte Welle reflektiert wird. Der Winkel zwischen den zwei Wellen bestimmt die Ortsfrequenz des Gitters, das wiederum die Neigung der reflektierten Welle bestimmt (siehe die Abschnitte 21.4 und 22.3.5).
24.1.4 Wellenleiterverbindungen In optischen Lichtwellenschaltungen werden optische Verbindungen realisiert, indem in LiNbO3 - oder Siliciumsubstraten optische Wellenleiter angelegt werden (siehe Abschnitt 9.4.2), ganz ähnlich wie metallische Leiterbahnen in elektronischen gedruckten oder integrierten Schaltungen. Beispiele sind in Abb. 24.12 gezeigt. Aus Kombinationen und Kaskaden dieser elementaren Verbindungen können komplexere Verbindungen aufgebaut werden. Wellenleiterkoppler werden eingesetzt, um optische Leistung auf eine vorgegebene Weise zu verteilen. Der in Abb. 24.12(b) gezeigte Koppler wird z. B. durch die Verbindungsmatrix ⎡ cos 𝒞𝐿
T=⎢
−i sin 𝒞𝐿 ⎣
−i sin 𝒞𝐿⎤ ⎥ cos 𝒞𝐿 ⎦
(24.11)
beschrieben (siehe Abschnitt 9.4.2), wobei 𝒞 der Kopplungskoeffizient ist und 𝐿 die Wechselwirkungslänge. Die eingehende Leistung in Eingang 1 wird daher ent2 sprechend den Faktoren cos2 𝒞𝐿 und sin 𝒞𝐿 auf die Ausgänge 1 und 2 verteilt. Für 𝒞𝐿 = π∕4 wird die Leistung gleichmäßig geteilt; der Koppler ist dann ein 3-dBKoppler. Der Einsatz von optischen Fasern vor allem in der Nachrichtentechnik hat zur Entwicklung zahlreicher fa-
875
876
24 Optische Verbindungen und Schalter 1ʹ
1ʹ2ʹ 3ʹ4ʹ
2ʹ
1
1ʹ 2ʹ
2
1
(a) T-Koppler
1ʹ
12
3
34
3ʹ
2ʹ
4ʹ
4
Abb. 24.12 Integriertoptische Bauelemente für einige der Verbindungen aus Abb. 24.4. Der Netzkoppler ist eine alternative Realisierung eines Sternkopplers.
(c) Sternkoppler
1
(d) 4×4-Netzkoppler
2
(b) 3-dB-Koppler
verschmolzene Verengung (c) Verzweigung, Kombination
Doppelmantelfaser
verschmolzene Fasern
Splitter oder T-Koppler Doppelmantelfaser
Strahlteilerschicht
Gradientenindexstäbe
Mischstab
Kombinierer (a) T-Koppler
(b) 3-dB-Koppler
(d) Sternkoppler
Abb. 24.13 Faseroptische Koppler für einige der in Abb. 24.4 dargestellten Verbindungen. (a) Doppelkernfaser als T-Koppler, Splitter oder Kombinierer. (b) 3-dB-Koppler aus zwei verschmolzenen Fasern oder aus zwei Linsen aus Gradientenindexstäben, die durch einen Strahlteiler getrennt sind.
(c) Verzweigung oder Kombinierer. (d) Sternkoppler aus verschmolzenen Fasern oder aus einem Mischstab, einer Glasplatte, in der Licht aus einer Faser so gestreut wird, dass es alle anderen Fasern erreichen kann.
seroptischer Verbindungen geführt. Die in Abb. 24.13 gezeigten Beispiele entsprechen denen aus Abb. 24.12 für die integrierte Optik; die in Abb. 24.13(b) dargestellten Koppler werden z. B. durch dieselbe Verbindungsmatrix Gl. (24.11) beschrieben.
ne der Rückwärtswelle wird dagegen um 90◦ rotiert. Das Bauelement kann daher zusammen mit polarisierenden Strahlteilern genutzt werden, um nichtreziproke Verbindungen wie Drei- und Vierkanalzirkulatoren herzustellen, wie Abb. 24.14 zeigt.
24.1.5
24.1.6 Optische Verbindungen in Mikroelektronik und Computertechnik
Nichtreziproke optische Verbindungen
Optische Realisierungen von nichtreziproken Verbindungen beruhen in erster Linie auf nichtreziproken Polarisationsbauelementen. Wie in Abschnitt 6.4.2 gezeigt wurde, kann ein optischer Isolator aus einem 45◦ Faradayrotator zwischen zwei Polarisatoren in einem Winkel von 45◦ zueinander hergestellt werden. Diese Anordnung transmittiert linear polarisiertes Licht in Vorwärtsrichtung, nicht aber in Rückwärtsrichtung. Ebenfalls in Abschnitt 6.4.2 wurde gezeigt, dass eine Kombination aus einem 45◦ -Faradayrotator gefolgt von einem Halbwellenretarder ein nützliches nichtreziprokes Bauelement ist (Abb. 24.14). Der Polarisationszustand einer sich in Vorwärtsrichtung ausbreitenden linear polarisierten Welle, deren Polarisationsebene in einem Winkel von 22.5◦ zur schnellen Achse des Verzögerers liegt, wird nicht verändert. Die Polarisationsebe-
Die Hoffnung, in der Mikroelektronik und in Computersystemen optische Verbindungen anstelle konventioneller elektrischer Verbindungen verwenden zu können, hat seit mehreren Jahrzehnten zu intensiven Bemühungen in Forschung und Entwicklung geführt. Zu den erfolgreich realisierten Anwendungen gehören Verbindungen von Platine zu Platine, von Board zu Board, von Chip zu Chip sowie innerhalb eines Chips, wie Abb. 24.4 zeigt. Die integrierte Photonik hat den Übergang von elektronischen zu optischen Verbindungen beispielsweise in Rechenzentren oder Supercomputern beschleunigt. Manche der Einschränkungen, die für Komponenten in faseroptischen Kommunikationssystemen gelten, sind im Kontext optischer Kurzstreckenverbindungen wegen ihrer geringen Länge nicht kritisch.
24.1 Optische Verbindungen
(a)
1
2 Strahlteiler
Retarder
3
(b)
4
Faradayrotator π
1
2 Strahlteiler
B
Abb. 24.14 (a) Realisierung der nichtreziproken Dreikanalverbindung aus Abb. 24.5(b) mithilfe eines polarisierenden Strahlteilers und einer Kombination aus Faradayrotator und Halbwellenretarder. Das Licht wird von Kanal 1 nach Kanal 2 und von dort nach Kanal 3 geleitet. (b) Optischer Zirkulator auf der Grundlage der 1-2-3-4-1-Vierkanalverbindung aus Abb. 24.6 unter Verwendung zweier polarisierender Strahlteiler und einer Kombination aus einem Faradayrotator und einem Halbwellenretarder.
Faradayrotator π
3
l usp
ati
Retarder
Strahlteiler
ne
Chip Optochip
Platine Speicher Chip
Optochip
Chip Platine
Abb. 24.15 Schematische Darstellung von optischen Verbindungen in mikroelektronischen und Computersystemen: Von Platine zu Platine, von Bord zu Board, von Chip zu Chip sowie innerhalb eines Chips. Optochips sind miniaturisierte optische Sender/Empfänger.
Verbindungen von Board zu Board und von Chip zu Chip
Nach dem erfolgreichen Einsatz der Faseroptik für die Kommunikation zwischen Computern in LAN oder Rechenzentren (Abschnitt 25.5) wurden auch Systeme für die direkte faseroptische Kommunikation zwischen Prozessoren oder Platinen in Hochleistungsrechnern entwickelt. Solche kurzen faseroptischen Verbindungen können mit Datengeschwindigkeiten jenseits von 100 Gbit/s betrieben werden, also weitaus schneller als dies mit elektrischen Verbindungen möglich ist, und ihre Technik ist wohletabliert (Kapitel 25). Verbindungen zwischen verschiedenen Boards oder Karten können auch mithilfe von integriert-photonischen Wellenleitern auf den Platinen realisiert werden. Das in Abb. 24.16(a) dargestellten Beispiel verbindet mehrere Karten in einer Buskonfiguration, die als Sternkoppler dient und jede Karte mit allen anderen verbindet. Auch direkte optische Richtstrahlverbindungen unter Verwendung von reflektierenden Spiegeln oder holografischen optischen Elementen wurden in Betracht
gezogen, haben sich jedoch bis jetzt als zu umständlich und ineffizient erwiesen. Stattdessen wurden integrierte optische Verbindungen von Chip zu Chip mit integrierten Spiegeln und ebenen Wellenleitern entwickelt, die in Abb. 24.16(b) dargestellt sind. Optochips
Ein grundlegendes Bauelement optischer Verbindungen in der Mikroelektronik und Hochleistungscomputern ist der Optochip, ein optischer Transceiver (Sender/ Empfänger) im Chipmaßstab. Optochips enthalten eine Reihe von Lichtquellen (z. B. VCSEL) und ein Detektorarray (PD) sowie die zugehörigen elektronischen Schaltkreise für Sender (Tx) und Empfänger (Rx). Eine schematische Darstellung eines Optochips, der über Spiegel an einen ebenen Wellenleiter auf der Platine gekoppelt ist, zeigt Abb. 24.17(a). Hier sind vier Chips (VCSEL, PD, Tx und Rx) auf einem Siliciumsubstrat kombiniert. Das Licht wird über Löcher im Substrat zwischen den VCSEL/PD-Arrays
877
878
24 Optische Verbindungen und Schalter
Karte 2
Karte 1
(a) Board-zu-Board
Optochip
Busplatine
Optochip
elektronische Chips
(b) Chip-zu-Chip
Platine Optochip
Optochip Wellenleiter
Spiegel
Spiegel
Abb. 24.16 (a) Mehrere Karten, die über ebene Wellenleiter auf der Hauptplatine in einer Buskonfiguration miteinander verbunden sind. (b) Optische Verbindung von Chip zu Chip mithilfe von ebenen Wellenleitern und Spiegeln auf der Platine. Optochips sind optische Transceiver (Sender/Empfänger) in Chipgröße.
SiTräger
Tx
organ. Träger Wellenleiter PCB
VCSEL
PD
Rx
Fasern Linsen
Linsen Linsen
IC organischer VCSEL Träger PCB
(a)
PD
(b)
Abb. 24.17 Schematische Darstellungen von Optochips auf üblichen Leiterplatten (PCB). Das Licht wird von einem VCSEL-Array erzeugt, das von einer Senderschaltung (Tx) angesteuert wird, und von einem Photodetektor-Array (PDArray) erfasst, das mit einer Empfängerschaltung (Rx) verbunden ist. (a) Vier Chips auf einem Si-Träger; Licht gelangt durch Löcher im Träger von/zu dem VCSEL/PD-Array, wird
von integrierten Linsen fokussiert und über Spiegel in den ebenen Wellenleiter auf der Platine eingekoppelt. (b) Die VCSEL- und PD-Arrays sind an einen konventionellen elektronischen IC angeschlossen, der die Tx-/Rx-Schaltung enthält; sie sind über Löcher im IC und integrierte Linsen an ein Faserarray gekoppelt.
und dem Wellenleiter ausgetauscht und durch integrierte Linsen fokussiert. Abbildung 24.17(b) zeigt ein anderes Beispiel, in dem ein Optochip an eine Anordnung von optischen Vielmodenfasern gekoppelt ist. In diesem Fall liegen die VCSEL- und PD-Arrays auf einem organischen Substrat und sind an eine elektronische integrierte Schaltung (IC) angeschlossen, die die Schaltkreise für Sender und Empfänger enthält. Licht gelangt durch Löcher im IC von und zu den Fasern und integrierte Linsen sorgen für die Fokussierung. VCSEL können Vielmodenemissionen mit einer numerischen Apertur erzeugen, die zur Einkopplung in die Vielmodenfaser geeignet ist. Ein Optochip mit einem Array aus 24 VCSEL und 24 PD, die jeweils mit einer Datenrate von 15 Gbit/s arbei-
ten, ermöglicht eine Kommunikation mit einer GesamtBitrate von 360 Gbit/s. Für Hochgeschwindigkeitsverbindungen in Rechenzentren oder Hochleistungsrechner stehen Transceiver zur Verfügung, die mit Datenraten von 100 Gbit/s betrieben werden können. Diese kompakten Module enthalten Laser, Modulatoren, Splitter, Wellenlängenmultiplexer, Wellenlängendemultiplexer und Photodetektoren. Optische Intrachipverbindungen
Der Einsatz von optischen Verbindungen für die extrem kurzen Distanzen innerhalb eines elektronischen Chips ist offensichtlich schwieriger. Die Entwicklung von optischen Intrachipverbindungen ist durch Fortschritte bei schnellen hochintegrierten mikroelektro-
24.1 Optische Verbindungen
nischen Schaltungen und die parallelen Architekturen moderner Hochleistungscomputer motiviert, da diese zu Engpässen bei der Kommunikation führen, die leistungsfähige Verbindungen zu einer Schlüsselaufgabe machen. In hochintegrierten Schaltungen nehmen die Verbindungen einen großen Teil der verfügbaren Chipfläche ein. Um die Auswirkungen von Zeitverzögerungen aufgrund der Verbindungen zu minimieren, die in der Größenordnung der Gatterverzögerungen oder sogar darüber liegen können, werden beträchtliche Anstrengungen unternommen, die Verbindungslängen gleich zu machen. Inzwischen sind optische Intrachipverbindungen mit speziell entworfenen Optochips kommerziell verfügbar. Eine optische Intrachipverbindung enthält drei Schlüsselkomponenten: (1) Einen optoelektronischen (E/O-) Wandler (Sender), der durch ein elektrisches Signal innerhalb des Chips angesteuert wird, (2) eine optische Verbindung, die das Signal zu einem anderen Punkt auf dem Chip überträgt und (3) einen optoelektronischen (O/E-) Wandler (Empfänger), der das optische Signal am Ziel registriert und daraus wieder ein elektronisches Signal macht. Idealerweise sollte das gesamte Bauelement eine photonische integrierte Schaltung (PIC) sein, in der alle drei Komponenten monolithisch auf dem Siliciumsubstrat des Chips integriert sind und mit der CMOS-Technologie kompatibel sind, auf der die gesamte integrierte Elektronik beruht. Tatsächlich können Silicium-Photodioden (Abb. 19.17) leicht auf Siliciumchips integriert werden und optische Wellenleiter in SOI-Technik (Silicon-On-Insulator, Abschnitt 9.3) können als hocheffiziente Wellenleiter dienen (obwohl der Platz dafür auf dem Chip eher knapp ist). On-Chip-Lichtquellen auf Siliciumbasis
Die Hauptschwierigkeit bei der Herstellung eines monolithischen PIC als Intrachipverbindung liegt in der Herstellung der Laserdiode, da Si ein Material mit indirek-
Alternative On-Chip-Lichtquellen
Auch andere Materialien aus Gruppe IV als Si können zur Herstellung von Lichtquellen verwendet werden (Abschnitt 17.1.2 und Abb. 17.6). So sind beispielsweise GeSn-Legierungen mit Siliciumsubstraten und der CMOS-Technologie kompatibel. Verschiedene Arten von kompakten Lasern mit niedriger Laserschwelle sind ebenfalls geeignete Kandidaten für die Verwendung in optischen Verbindungen; dazu gehören VCSEL (Abschnitt 18.5.1), Mikrodisk- und Mikroringlaser (Abschnitt 18.5.2), Laser aus photonischen Kristallen (Abschnitt 18.5.3) und Nanoresonatorlaser (Abschnitt 18.6). Gegebenenfalls können direkt modulierte optische Lichtquellen auch durch extern beleuchtete elektrooptische (Abschnitt 21.1.2) oder elektroabsorbierende (Abschnitt 21.5) Modulatoren ersetzt werden, die ihre Modulation direkt von den lokalen elektrischen Signalen innerhalb des Chips erhalten. Dieser Ansatz ist zwar ineffizient und umständlich, hat jedoch den Vor-
InP-Lichtquelle
AlGaAs-Quelle Licht oder -Modulator n MQW i p SiO2 Silicium-CMOS-Chip (a)
ter Bandlücke ist, aus dem nicht ohne Weiteres effiziente Lichtquellen hergestellt werden können (Abb. 17.41). Wie in Abschnitt 18.1.4 im Zusammenhang mit der Siliciumphotonik diskutiert gibt es aber drei Ansätze zur Herstellung On-Chip-Lichtquellen auf Siliciumbasis: (1) Die Flip-Chip-Integration von III-V-Laserdioden auf einem separaten Siliciumsubstrat mithilfe von Lötbumps, (2) die heterogene Integration von III-V-Lasern in vorstrukturierte Siliciumschaltungen (Hybridansatz) und (3) die direkte heteroepitaktische Abscheidung von III-V-Lasern auf Si-Substraten unter Verwendung von Zwischenschichten, um das Auftreten von Versetzungen im lichtemittierenden Bereich weitestgehend zu vermeiden. Jeder dieser Ansätze hat seine eigenen Vor- und Nachteile. Die hybride Integration ist aktuell weit verbreitet (Abb. 24.18), obwohl die direkte Heteroepitaxie vielleicht die vielversprechendste Variante für die Zukunft ist.
SOI-Wellenleiter
Si
Silicium-CMOS-Chip (b)
Abb. 24.18 Durch heterogene Integration (Hybridansatz) auf Si-CMOS-Chips integrierte Lichtquellen. Die III-V-LEDChips werden separat hergestellt und anschließend in die Si-Struktur integriert. (a) Eine AlGaAs-LED wird als Oberflä-
chenemitter auf einen Siliciumchip gebondet. (b) Das Licht einer InP-LED auf einem Siliciumchip wird in einen Siliciumauf-Isolator (SOI-) -Stegwellenleiter auf dem Chip eingekoppelt.
879
880
24 Optische Verbindungen und Schalter
Hologramm
Hologramm
PD
Laser
P
PD Laser
Siliciumchip
Siliciumchip
(a)
(b)
Abb. 24.19 (a) Verbindungen zwischen On-Chip-Lichtquellen und -Detektoren über ein externes Reflexionshologramm, das als Verbindung dient. (b) Einwegeverbindungen leiten Taktimpulse von einer externen Lichtquelle zu Photodetektoren auf einem Siliciumchip.
teil, dass er die Mechanismen der Modulation und der Lichterzeugung entkoppelt und so eine unabhängige Optimierung ermöglicht. Holographische Verbindungen auf dem Chip
In bestimmten Fällen wurden für Intrachipverbindungen auch direkte optische Richtstrahlverbindungen unter Verwendung von externen Bauelementen wie z. B. Hologrammen in Betracht gezogen, wie Abb. 24.19(a) illustriert. Wenn nur eine Einwegeverbindung zwischen einem oder mehreren äußeren Signalgebern und dem Chip benötigt wird, sind keine Sender auf dem Chip erforderlich, wie Abb. 24.19(b) zeigt. Eine nützliche Anwendung für eine solche Konfiguration ist die optische Verteilung eines Taktsignals von einem externen Taktgeber mithilfe eines Reflexionshologramms an mehrere Photodetektoren auf dem Chip. Auf diese Weise kann man eine genaue Synchronisation von Hochgeschwindigkeitsschaltkreisen sicherstellen und Probleme aufgrund von Taktabweichungen minimieren, die aus unterschiedlichen Signalverzögerungen entstehen. Natürlich kann man das Hologramm auch weglassen und das Licht direkt zu allen Punkten auf dem Chip ausstrahlen. Man erhält so ein robustes System, das unempfindlich gegenüber Fehlausrichtungen ist, bezahlt dafür aber mit einer geringen Energieeffizienz, da ein großer Teil der optischen Energie verlorengeht. Gute Gründe für optische Chipverbindungen
Optische Verbindungen bieten mehrere Vorteile für Inter- und Intrachipverbindungen, die hauptsächlich aus der kleinen Wellenlänge des Lichts und den damit verbundenen hohen Frequenzen (20–50 THz) resultieren, die wesentlich größer sind als die Bandbreite der übertragenen Daten. Elektronische Verbindungen benutzen Signale im Basisband bei viel kleineren Frequenzen (z. B. im GHz-Regime).
Die Bandbreite einer elektronischen Leiterbahn mit der Länge 𝓁 und der Querschnittsfläche A über einer Grundfläche ist proportional zu dem Verhältnis A∕𝓁2 . Das ergibt sich daraus, das in einer durch 𝑅𝐶-Effekte beschränkten Leiterbahn der Widerstand 𝑅 ∝ 𝓁∕A und die Kapazität 𝐶 ∝ 𝓁 ist, sodass die Zeitkonstante 𝑅𝐶 ∝ 𝓁2 ∕A wird. Ein analoges Argument gilt auch für durch 𝐿𝐶-Effekte beschränkte Leiterbahnen. Die Bandbreite wird daher durch √ das Seitenverhältnis 𝓁∕ A bestimmt und kann nicht durch Miniaturisierung oder Vergrößerung des Bauelements verändert werden. Optische Verbindungen sind von dieser Beschränkung nicht betroffen, da ihre Bandbreite durch andere physikalische Effekte bestimmt wird und im Allgemeinen größer ist. Außerdem wird in optischen Verbindungen die maximale Bandbreite der von einer Verbindung übertragenen Daten nicht durch die Entfernung benachbarter Verbindungen beeinflusst. Anders ausgedrückt wird das Übersprechen zwischen benachbarten Kanälen nicht durch eine Steigerung der Datenrate beeinflusst. Der Grund hierfür ist das kleine Verhältnis der Bandbreite zur Trägerfrequenz des modulierten Lichts. Das gilt nicht für elektronische Verbindungen, bei denen die Dichte der elektronischen Verbindungen bei hohen Modulationsfrequenzen schnell reduziert werden muss, um kapazitive und induktive Kopplung zwischen benachbarten Verbindungen zu vermeiden. Optische Verbindungen haben daher ein größeres Dichte-Bandbreite-Produkt als elektronische Verbindungen. Verzögerung. Photonen breiten sich im Vakuum mit einer Geschwindigkeit von 𝑐0 = 0.3 mm∕ps und in Silicium (𝑛 = 3.5) mit 𝑐0 ∕𝑛 ≈ 0.086 mm∕ps aus; die entsprechende Zeitverzögerung ist ≈ 3.3 ps∕mm bzw. ≈ 11.7 ps∕mm. Die Ausbreitungsverzögerungen von elektrischen Signalen in Leiterbahnen auf Keramik und Polyimiden betragen ungefähr 10.2 Bandbreite.
24.2 Passive optische Router
bzw. 6.8 ps/mm. Die Verzögerung ist daher an sich kein Problem. Während die Lichtgeschwindigkeit jedoch nicht von der Zahl der Verbindungen abhängt, die von einer optischen Verbindung abgehen, ist die Geschwindigkeit in elektronischen Systemen umgekehrt proportional zur Kapazität pro Längeneinheit, sodass sie von der kapazitiven Gesamt„last“ abhängt; die Laufzeitdifferenz bei der Ausbreitung nimmt daher mit der Zahl der abgehenden Kanäle zu. Optische Systeme bieten eine größere Flexibilität für Verzweigungen und sind nur durch die verfügbare optische Leistung beschränkt. Dichte. Die dichteste Realisierung von interferenzfreien Verbindungen beruht auf ungeführten Strahlen mit kleinen Durchmessern und kleiner Divergenz, die nur durch die Beugung beschränkt sind (das Produkt des Durchmessers und des Divergenzwinkels eines dünnen Strahls ist von der Größenordnung einer Wellenlänge, die bei optischen Frequenzen klein ist). Da sich solche Strahlen ohne gegenseitige Interferenz schneiden können (unter der Annahme eines linearen Mediums), können sie in einer dreidimensionalen Anordnung verwendet werden, um Verbindungen mit Dichten zu erzeugen, an die elektrische Leitungen nicht heranreichen können. Licht kann auch in verlustarmem planaren oder quasiplanaren dielektrischen Wellenleitern mit Breiten bis hinunter zu einer Wellenlänge geführt werden. Diese können mit minimalem Übersprechen dicht gepackt werden. Elektrische Verbindungen sind dagegen auf metallische Leiter wie z. B. Leiterbahnen angewiesen, die als Übertragungsleitung oder Wellenleiter für die mit den oszillierenden elektrischen Ladungen verbundenen elektromagnetischen Wellen dienen. Metallische Leiter führen Verluste ein und können nicht dicht gepackt werden, da bei zu großer Dichte elektromagnetische Interferenzen auftreten. Leistung. Um Reflexionen zu vermeiden, müssen elektrische Verbindungen mit einer passenden Impedanz abgeschlossen werden. Das bedeutet normalerweise eine Verschwendung von Leistung. In optischen Verbindungen kann Reflexion durch Antireflexbeläge wesentlich reduziert werden, und die erforderliche Leistung wird durch die Empfindlichkeit der Photodetektoren und die Wirkungsgrade der Konversionen elektrisch-optisch und optisch-elektrisch sowie den Leistungsübertragungswirkungsgrad der Router beschränkt.
24.2 Passive optische Router Ein passiver optischer Router lenkt Lichtstrahlen auf der Grundlage ihrer physikalischen Attribute wie Wellenlänge, Intensität, Phase, Polarisation oder Ankunftszeit zu einem oder mehreren seiner Ausgänge um. Dabei kann ein einzelner eingehender oder ausgehender Strahl mehrere Komponenten mit unterschiedlichen Werten des zur Selektion verwendeten Attributs enthalten. Drei häufig vorkommende Typen von Routern sind Demultiplexer, Multiplexer und Add/Drop-Multiplexer (Abb. 24.20). • Ein Demultiplexer (DMUX oder DEMUX) ist ein attributbasierter 1 × 𝑁-Router, der die Komponenten 𝑋1 , 𝑋2 , … , 𝑋𝑁 in einem Strahl sortiert und zu getrennten Ausgängen leitet, wie Abb. 24.20(a) zeigt. Ein Demultiplexer kann als 1 × 𝑁-Verzweigung realisiert werden, die Kopien des ankommenden Strahls zu allen Ausgängen leitet, gefolgt von einer Reihe von Filtern, die Komponenten mit ausgewählten Werten des Attributs durchlassen und alle anderen blockieren. • Ein Multiplexer (MUX) ist die Umkehrung eines Demultiplexers. Wie Abb. 24.20(b) illustriert, vereinigt er Strahlen mit unterschiedlichen Werten 𝑋1 , 𝑋2 , … , 𝑋𝑁 des optischen Attributs zu einem einzigen Strahl, der später durch einen Demultiplexer wieder aufgetrennt werden kann. Multiplexing und Demultiplexing auf der Grundlage von Wellenlänge, Frequenz und Zeit sind in optischen Nachrichtensystemen allgegenwärtig. • Der in Abb. 24.20(c) gezeigte Add/Drop-Multiplexer (ADM) ist ein weiteres wichtiges Bauelement in Nachrichtennetzen. In ihm trennt ein Demultiplexer Komponenten mit unterschiedlichen Werten des Attributs, selektiert eine Komponente mit einem definierten Wert dieses Attributs (z. B. 𝑋2 ), verwirft ihren Inhalt und fügt an ihrer Stelle neue Daten hinzu. Anschließend werden alle Komponenten durch einen Multiplexer wieder zu einem einzigen Strahl kombiniert. Optische Add/Drop-Multiplexer werden in optischen Netzen häufig eingesetzt.
24.2.1 Wellenlängenbasierte Router Wellenlängenbasierte Router werden üblicherweise in faseroptischen Wellenlängenmultiplexnetzen verwendet. Wie in Abschnitt 25.3.3 beschrieben, benutzen diese Systeme mehrere Wellenlängenkanäle in einer einzigen optischen Faser. Wellenlängenmultiplexer vereinigen die Kanäle am Eingang der Faser, und Wellenlängendemultiplexer trennen sie am Ausgang wieder auf.
881
24 Optische Verbindungen und Schalter
X2 X3
XN
XN
(a) DMUX
XN XN–1 X1, X2, . . . XN
X2
Add
X1
Gitter
λ 1+λ 2+λ 3
(b) Beugungsgitter
Gradientenindexstab
λ 1+λ 2+λ 3
λ1 λ2
λ2
Drop
Gitter
λ1 λ2 λ3
λ1 λ2 λ3
(a) Prisma
λ3
X2
Abb. 24.20 Attributbasierte Router. (a) Demultiplexer. (b) Multiplexer. (c) Add/DropMultiplexer.
(c) ADM
λ 1+λ 2+λ 3
λ1 λ2 λ3
X1, X2, . . . XN X2
X2
(b) MUX
λ 1+λ 2+λ 3
λ 1+λ 2+λ 3
X1, X2, . . . XN
...
X1
X2 X3
...
X1, X2, . . . XN
X1
...
882
λ1
λ 1+λ 3 FBG
Gradientenindexstab
λ2
λ3
λ 1+λ 2+λ 3
TFF
(c) Dünnschichtfilter (TFF)
(d) Faser-Bragggitter (FBG)
(e) Mikroringresonatoren
Abb. 24.21 Wellenlängendemultiplexer. (a) Prisma. (b) Beugungsgitter mit einer Linse oder einem Gradientenindexstab. (c) Dielektrische Interferenz-Dünnschichtfilter. (d) Faser-Bragggitter. (e) Mikroringresonator-Filter.
Realisierungen von Wellenlängenmultiplexern/ -demultiplexern
Für das Wellenlängendemultiplexing stehen verschiedene Techniken zur Verfügung: • Eine winkeldispersive optische Komponente separiert die Komponenten mit unterschiedlichen Wellenlängen in einem einzelnen optischen Strahl in getrennte optische Strahlen. Die einfachsten optischen Komponenten mit Winkeldispersion sind das Prisma [Abb. 24.21(a)] und das Beugungsgitter [Abb. 24.21(b)]. Die Winkeldispersion eines Prismas ist durch die Rate der Änderung des Brechungsindex mit der Wellenlänge beschränkt, d𝑛∕ d𝜆, die gewöhnlich zu klein ist, um Komponenten mit geringfügig unterschiedlichen Wellenlängen ausreichend zu trennen. Prismen aus photonischen Kristallen (siehe Kapitel 7), die sogenannten Superprismen, besitzen eine um zwei bis drei Größenordnungen größere Winkeldispersion. Die Winkeldispersion von Beugungsgittern (Abschnitt 2.4.2) ist ebenfalls größer als die von normalen Prismen. Sie sind in der Lage, Wellenlängenunterschiede entsprechend einiger GHz aufzulösen. • Die Trennung der Wellenlängen kann auch durch eine Anordnung von unterschiedlichen Filtern erreicht werden. Dabei wird das eingehende Licht auf die Fil-
ter gelenkt, von denen jedes eine einzelne Wellenlänge passieren lässt und die anderen blockiert. Alternativ kann der Strahl auch durch eine Folge von schmalbandigen Filtern geführt werden, z. B. dielektrischen Interferenz-Dünnschichtfiltern, die jeweils eine Wellenlänge transmittieren und alle anderen auf das folgende Filter reflektieren, wie Abb. 24.21(c) illustriert. Zur Führung der Strahlen zwischen den Filtern wird ein Gradientenindexstab eingesetzt. • In einer ähnlichen Variante wird die Wellenlängenabhängigkeit des Reflexionsgrads eines Faser-Bragggitters (Abschnitt 7.1.3) für die Trennung der Wellenlängen ausgenutzt; es reflektiert die Komponente mit der braggschen Wellenlänge (𝜆ℬ = 𝛬∕2, wobei 𝛬 die Gitterperiode ist) und lässt alle anderen Komponenten durch. Um mehrere Wellenlängen abzutrennen, werden entsprechend mehrere Bragggitter verwendet [Abb. 24.21(d)]. • In einer anderen Ausführung wird eine Folge von Mikroringresonator-Filtern verwendet, die jeweils auf eine Wellenlänge abgestimmt sind [siehe Abb. 24.21(e)]. • Andere Varianten benutzen Mach-Zehnder-Interferometer und Wellenleiter-Gitterrouter, wie im Folgenden beschrieben.
24.2 Passive optische Router
λ 1, λ 2, λ 3
Zirkulator
λ 1, λ 2, λ 3
λ 1, λ 3 FBG
λ1
Add
Abb. 24.22 Ein optischer Add/Drop-Multiplexer, in dem ein faseroptisches Bragggitter die verworfene Wellenlängenkomponente 𝜆1 reflektiert und ein Zirkulator sie zu einem Detektor leitet. Andere Komponenten (𝜆2 und 𝜆3 ) werden
Eingang
λ 2, λ 3
λ 2, λ 3
λ1
λ1
λ 1, λ 2, λ 3
λ1
λ1
Drop
Zirkulator
λ1
transmittiert. Ein weiter Zirkulator wird verwendet, um mit neuen Daten moduliertes Licht bei 𝜆1 hinzuzufügen. Das faseroptische Bragggitter reflektiert alles Licht bei 𝜆1 in Rückwärtsrichtung.
nes Faser-Bragggitters und mehrerer Mikroringresonatoren sind in den Abb. 24.22 und 24.23 gezeigt.
Ausgang
Das Mach-Zehnder-Interferometer als Demultiplexer
Add
λ1
λ1
Drop
Abb. 24.23 Ein optischer Add/Drop-Multiplexer, in dem mehrere Mikroringresonatoren den Kanal 𝜆1 aus einem Mehrkanalstrahl extrahieren und ihn zu einem Detektor leiten. Andere Komponenten (𝜆2 und 𝜆3 ) werden transmittiert. Neue Daten bei 𝜆1 werden durch das Filter ausgewählt und zum Ausgangsstrahl hinzugefügt. Mehrere Mikroringresonatoren ermöglichen eine größere Wellenlängenselektivität (d. h. eine schmalere spektrale Breite) als ein einzelner Mikroringresonator.
Optische Add/Drop-Multiplexer
Ein Add/Drop-Multiplexer extrahiert Daten aus einem Strahl und fügt Daten zu ausgewählten Wellenlängenkanälen hinzu. Auf individuelle Kanäle kann mithilfe eines Demultiplexers gefolgt von einem Multiplexer zugegriffen werden, wie in Abb. 24.20(c) dargestellt ist. Die Daten werden mithilfe eines wellenlängensensitiven optischen Elements aus ausgewählten Kanälen entnommen (und verworfen), und neue Daten werden durch modulierte optische Quellen zu ausgewählten Kanälen hinzugefügt. In einer anderen Variante wird der ausgewählte Wellenlängenkanal durch eine wellenlängenempfindliche optische Komponente von den anderen Kanälen getrennt. Beispiele von Add/Drop-Multiplexern mit diesem Design sowie unter Verwendung ei-
Da Interferometer wellenlängenempfindlich sind, sind sie für das Wellenlängenmultiplexing geeignet. Das integriert-photonische Mach-Zehnder-Interferometer (MZI) in Abb. 24.24 kann beispielsweise als Zweiwellenlängendemultiplexer eingesetzt werden. Um die Komponenten der Wellenlängen 𝜆1 und 𝜆2 zu unterschiedlichen Ausgängen zu leiten, wird die Differenz Δd der Weglängen so gewählt, dass die Phasendifferenz 𝜙 = 2πd ∕𝜆 bei 𝜆1 ein geradzahliges Vielfaches von π und bei 𝜆2 ein ungeradzahliges Vielfaches von π ist; d. h. Δd = 𝑞1 𝜆1 ∕2 bzw. Δd = 𝑞2 𝜆2 ∕2, wobei 𝑞1 eine gerade ganze Zahl ist und 𝑞2 eine ungerade ganze Zahl. Die Auflösung eines Routers, d. h. die nächstgelegenen Wellenlängen, die gerade noch getrennt werden können, kann bestimmt werden, indem man 1∕𝜆1 − 1∕𝜆2 = (𝑞1 − 𝑞2 )∕2Δd schreibt und |𝑞1 − 𝑞2 | = 1 setzt, sodass |1∕𝜆1 − 1∕𝜆2 | = 1∕2Δd ist. Der entsprechende Frequenzunterschied Δ𝜈 = |𝜈1 − 𝜈2 | ist daher Δ𝜈 =
𝑐 . 2Δd
(24.12)
Für Δd = 1 mm und 𝑛 = 1.5 erhält man beispielsweise Δ𝜈 = 100 GHz. Ein kleinerer Abstand Δ𝜈 erfordert eine entsprechend größere Differenz Δd der Weglängen.
1
λ 1, λ 2
0+ Δ
λ1 λ2
λ
2
0
0
Δ 4
Δ 2
Δ
λ
Abb. 24.24 Wellenlängenrouting (Demultiplexing) mit einem integriertphotonischen Mach-Zehnder-Interferometer.
883
884
24 Optische Verbindungen und Schalter
λ1 λ 1, λ 3
λ3
λ 1, λ 2 , λ 3, λ 4
λ2
λ 2, λ 4
λ4
Abb. 24.25 Wellenlängenrouting (Demultiplexing) mit einem integriert-photonischen Mach-Zehnder-Interferometer.
Die spektrale Empfindlichkeit eines MZI-Routers kann aus seiner Verbindungsmatrix bestimmt werden, ⎡1
⎤ i ⎤ ⎡exp[−i2π(d 0 + Δd )∕𝜆] 0 ⎥⎢ ⎥ i 1 0 exp(−i2πd 0 ∕𝜆) ⎣ ⎦⎣ ⎦ ⎡1 i ⎤ ×⎢ (24.13) ⎥, i 1 ⎣ ⎦ wobei d 0 und d 0 + Δd die Weglängen der Interferometerzweige sind und die ersten und dritten Matrizen in diesem Matrixprodukt 3-dB-Kopplungen beschreiben. Wenn ein Feld mit einer Leistung von eins an Eingang 2 anliegt, sind die in den Kanälen 1 und 2 ankommenden Leistungen P1 = |T 21 |2 bzw. P2 = |T 22 |2 ; daher gilt T=⎢
P1 = cos2 (π Δd ∕𝜆) ,
dann einem Gitterspektrometer ähnelt, wird es auch als Wellenleiter-Gitterrouter (WGR) bezeichnet.
2
P 2 = sin (π Δd ∕𝜆) .
Das Mehrpfadinterferometer
Bevor wir den Betrieb des Wellenlängen-Gitterrouters betrachten, rufen wir uns zuerst noch einmal die Eigenschaften des Mehrpfadinterferometers in Erinnerung (siehe Abschnitt 2.5.2). Ein 𝐿-Pfad-Interferometer ist eine Verbindung mit 𝐿 optischen Wegen, deren Länge linear zunimmt, sodass benachbarte Pfade immer dieselbe Weglängendifferenz Δd haben. Die Welle am Ausgang ist die Summe von 𝐿 Wellen mit gleichen Amplituden und gleicher Phasendifferenz 𝜙 = 2πΔd ∕𝜆 bei der Wellenlänge 𝜆. Die Leistungstransmission [Gl. (2.59)] 2
T=
sin (𝐿𝜑∕2) 2
sin (𝜑∕2)
2
=
sin (𝐿π Δd ∕𝜆) 2
sin (π Δd ∕𝜆)
(24.15)
ist eine periodische Funktion von 𝜙 mit scharfen Peaks, die auftreten, wenn 𝜙 ein ganzzahliges Vielfaches von 2π ist (siehe Abb. 2.28). Die Abhängigkeit von T von 𝜆 ist nicht periodisch, besitzt aber ebenfalls scharfe Peaks bei 𝜆 = Δd und ganzzahligen Teilen davon, wie Abb. 24.26 zeigt. Je größer die Zahl 𝐿 der Pfade ist, desto schärfer werden die Peaks.
(24.14)
Diese Leistungen sind in Abb. 24.24 als Funktionen von 𝜆 aufgetragen. Je kleiner das Verhältnis 𝜆∕Δd ist, desto schneller alternieren diese Funktionen zwischen 0 und 1, d. h. um so besser können sie eng benachbarte Wellenlängen trennen. Mehrere MZI können hintereinander eingesetzt werden, um mehr als zwei Wellenlängen zu trennen. Vier Wellenlängen können beispielsweise in einem zweistufigen Prozess separiert werden, wie Abb. 24.25 demonstriert. Das erste MZI trennt die ungeraden von den geraden Wellenlängen und die folgenden MZI verfeinern die Auftrennung der Wellenlängen weiter. Wellenleiter-Gitterrouter
Auch andere interferometrische Bauelemente können verwendet werden, um die Wellenlängenselektivität zu erhöhen. Zum Beispiel sind Mehrpfadinterferometer besonders wellenlängenselektiv, da sie eine scharfe Resonanz zeigen. Derartige Interferometer werden häufig für eine spezielle Aufgabe maßgeschneidert. Durch eine geeignete Anordnung vieler Interferometer können zahlreiche Wellenlängen in Bauelementen mit einer großen Zahl von Ein- und Ausgängen gezielt geroutet werden. Das Prinzip ist dabei, jede Verbindung zwischen einem Ein- und einem Ausgang als unabhängiges Mehrpfadinterferometer zu konfigurieren, das nur spezifische Wellenlängen durchlässt. Da ein solches Gerät
Wellenleiter-Gitterrouter als Wellenlängendemultiplexer
Ein Wellenleiter-Gitterrouter (WGR) kann als wellenlängenbasierter 1 × 𝑁-Router eingesetzt werden, der 𝑁 Wellenlängenkomponenten 𝜆1 , 𝜆2 , … , 𝜆𝑁 am Eingang zu einem der 𝑁 Ausgänge leitet, wie Abb. 24.27 zeigt. Er enthält 𝑁 Mehrpfadinterferometer, eines für jeden Ausgang. Jedes Interferometer besitzt eine eindeutige Weglängendifferenz Δd , die so gewählt wird, dass nur eine spezifische Wellenlänge durchgelassen wird. Dazu muss die Verbindung zum 𝑚-ten Ausgang eine Weglängendifferenz Δd 𝑚 haben, die ein ganzzahliges Vielfaches von 𝜆𝑚 ist, nicht aber der anderen Wellenlängen. Die Konstruktion wird vereinfacht, wenn die Wellenlängen 𝜆1 , 𝜆2 , … , 𝜆𝑁 als abnehmende Folge 𝜆𝑚 = 𝜆0 − 𝑚Δ𝜆 gleichverteilt sind, wobei Δ𝜆 der Abstand der Wellenlängenkanäle ist und 𝜆0 = 𝜆1 − Δ𝜆 gilt. Eine notwendige Bedingung für den Betrieb des Demultiplexers ist Δd 𝑚 = 𝜆𝑚 = 𝜆0 − 𝑚Δ𝜆 ,
𝑚 = 1, 2, … , 𝑁 ,
(24.16)
d. h. die Weglängendifferenz für die Verbindungen zum 𝑚-ten Ausgang muss linear mit 𝑚 abnehmen. Eine weitere Bedingung ist, dass Δd 𝑚 für alle 𝓁 ≠ 𝑚 nicht gleich einem ganzzahligen Vielfachen von 𝜆𝓁 sein darf. Diese Bedingung ist automatisch erfüllt, wenn die kleinste Wellenlänge 𝜆𝑁 größer ist als die Hälfte der größten Wellenlänge 𝜆1 , wie in Abb. 24.27 dargestellt.
24.2 Passive optische Router 0 + LΔ
Transmission
. ..
. .. 0 + 2Δ d0 + Δ
...
0
Δ /3 Δ /2
Δ
λ
Abb. 24.26 Wellenlängenabhängigkeit der Transmission eines Mehrpfadinterferometers. Δ Δ
1
Δ
N
2
..
λ m N λm 2 1
λ1 + λ2 + λ3 . . . λN
Sternkoppler
λ2 λ1
Sternkoppler
λN
λ2 λ1
2λ N
λ
Abb. 24.27 Wellenlängendemultiplexing durch einen Wellenlängen-Gitterrouter.
In der in Abb. 24.27 gezeigten Ausführung ist jede Weglänge zwischen dem Eingang und einem Ausgang die Summe der Länge des Wellenleiters und der in den Sternkopplern zurückgelegten Entfernungen. Die Längen der Wellenleiter können so gewählt werden, dass sie progressiv um eine feste Länge Δ𝑑W zunehmen. Für einen kreisförmigen Sternkoppler kann die Weglängendifferenz näherungsweise durch eine linear abnehmende Funktion von 𝑚 beschrieben werden, Δd 𝑚 = Δd 𝑤 + (Δd 𝑎 − 𝑚 Δd 𝑏 ) ,
24.2.2 Polarisations-, phasenund intensitätsbasierte Router Polarisationsbasierte Router
(24.17)
wobei Δd 𝑎 und Δd 𝑏 Konstanten sind, die von den genauen Abmessungen des Kopplers abhängen. Die Bedingung in Gl. (24.16) ist daher erfüllt, wenn Δd W + Δd 𝑎 = 𝜆0 und Δd 𝑏 = Δ𝜆 gilt. Die Auflösung des Wellenlängendemultiplexers, d. h. der minimale Wellenlängenabstand Δ𝜆, wird daher durch den minimalen Wert des geometrischen Faktors Δd 𝑏 begrenzt. Wellenleiter-Gitterrouter als N × N-Wellenlängenrouter
Ein WGR kann auch als allgemeinerer 𝑁 × 𝑁-Wellenlängenrouter verwendet werden. Dabei bilden die Verbindungen zwischen dem 𝓁-ten Eingang und dem 𝑚-ten Ausgang ein Mehrpfadinterferometer mit der Weglängendifferenz Δd 𝓁𝑚 = 𝜆00 − (𝓁 + 𝑚)Δ𝜆, die linear sowohl mit 𝓁 als auch mit 𝑚 abnimmt (𝜆00 und Δ𝜆 sind Konstanten, die von der Geometrie des WGR abhängen). Licht wird zwischen diesen Ein- und Ausgängen durchgelassen, wenn die Wellenlänge 𝜆𝓁𝑚 gleich Δd 𝓁𝑚 ist, d. h. für 𝜆𝓁𝑚 = 𝜆00 − (𝓁 + 𝑚)Δ𝜆 ,
Gleichung (24.18) ist eine Verallgemeinerung von Gl. (24.17). Obwohl ein WGR keine beliebiges Wellenlängenrouting ermöglicht, kann er für bestimmte Aufgabenstellungen wie z. B. simultanes Wellenlängendemultiplexing interessant sein.
𝓁, 𝑚 = 1, 2, … , 𝑁 . (24.18)
Das einfachste Beispiel für passives optisches Routing beruht auf der Polarisation. Beim Polarisationsmultiplexing werden die parallelen und orthogonalen Polarisationskomponenten eines optischen Strahls durch einen polarisierenden Strahlteiler demultiplext, wie Abb. 24.28 illustriert. Polarisationsbasiertes Multiplexing wird durch einen polarisierenden Strahlteiler erreicht, der als Strahlkombinierer betrieben wird (sodass sich das Licht von rechts nach links anstatt von links nach rechts ausbreitet). P1, P2
P1 P2
Abb. 24.28 Polarisationsbasiertes Routing mit einem polarisierenden Strahlteiler. Für Strahlen, die sich von links nach rechts ausbreiten, ist das Prisma ein Demultiplexer. Für Strahlen, die sich von rechts nach links ausbreiten, ist es ein Multiplexer.
885
886
24 Optische Verbindungen und Schalter
Ausgang 1 t
Ausgang 2 θ=0 π 0 π π 0
t
Eingang t
Nichtlineares asymmetrisches Sagnacinterferometer
Referenz
t
Abb. 24.29 Phasenbasiertes Routing mithilfe eines MachZehnder-Interferometers.
Phasenbasiertes Routing
Ein anderes einfaches Beispiel für passives optisches Routing beruht auf der Phase der Komponenten. Dabei wird eine Folge von optischen Pulsen mit den Phasen 0 bzw. π nach ihrer Phase sortiert und zu zwei Ausgängen geleitet. Das kann z. B. mit einem einfachen Interferometer erreicht werden, wie Abb. 24.29 zeigt. Intensitätsbasiertes Routing
Ein Lichtstrahl mit einer zeitlich variierenden Intensität kann nach seiner jeweiligen Intensität aufgetrennt werden. Zum Beispiel wird ein Lichtstrahl aus einer Folge von Pulsen mit zwei unterschiedlichen Intensitäten wie in Abb. 24.30 gezeigt, in einen Strahl mit Pulsen hoher Intensität und einen zweiten mit Pulsen niedriger zerlegt. Dieses Demultiplexing erfordert nichtlineare optische Elemente. Es wird häufig realisiert, indem die Intensitätsvariation mithilfe einer Kerrzelle in eine Phasenänderung umgewandelt wird (siehe Abschnitt 22.3.1), wie im Folgenden beschrieben wird. Nichtlineares Mach-Zehnder-Interferometer
Ein nichtlineares MZI ist ein gewöhnliches MZI mit einem nichtlinearen optischen Element wie z. B. einer Kerrzelle in einem der Interferometerzweige. Die Zelle führt eine zur Lichtintensität proportionale Phasenverschiebung ein. Das System wird so abgestimmt, dass die Phasendifferenz zwischen den InterferometerzweiI 1, I 2
Abbildung 24.31 zeigt einen intensitätsbasierten 1 × 2Router aus einem nichtlinearen faseroptischen Sagnacinterferometer. In diesem Interferometer tritt Licht aus Faser 1 ein und wird in eine rechts- und eine linkszirkular polarisierte Welle aufgespalten. Wenn die optischen Weglängen dieser Wellen identisch sind, kommt es zu konstruktiver Interferenz, und das Licht läuft zurück in Faser 1, sodass das Bauelement als Spiegel wirkt. Das gilt, wenn die Faser entweder linear ist oder wenn sie nichtlinear ist, aber die Intensitäten der beiden Teilwellen gleich sind. Wenn der Koppler am Eingang der Interferometerschleife aber unsymmetrisch ist, sind die Intensitäten in den beiden Pfaden nicht gleich, sodass die durch den optischen Kerreffekt eingeführten Phasenverschiebungen im Allgemeinen unterschiedlich sind. Wenn die Phasendifferenz π ist, kommt es zu destruktiver Interferenz, und das Licht wird in die Faser 2 geleitet. Da die Phasendifferenz proportional zur Intensität der einfallenden Welle ist, wirkt das System als selbstregulierender 1 × 2-Intensitätsrouter (Demultiplexer). Eine Asymmetrie zwischen rechts- und linkszirkular polarisierten Wellen in einem Sagnacinterferometer kann auch eingeführt werden, indem ein erbiumdotierter Faserverstärker an eine asymmetrische Position innerhalb der Schleife eingebracht wird. Dadurch wird eine der interferierenden Wellen während der ersten Hälfte ihres Schleifenumlaufs verstärkt, sodass sie mehr als eine Hälfte eines Umlaufs mit einer hohen Intensität zurücklegt. Die andere Welle wird in der zweiten Hälfte des Umlaufs verstärkt und breitet sich daher über eine kürzere Entfernung mit hoher Intensität aus; ihre nichtlineare Phasenverschiebung ist daher geringer. Ein solI 1, I 2
Eingang I1
t
φ∝I
Ausgang 1 Ausgang 2
I1 t
t t
(a)
gen für die eine Intensität ein ungeradzahliges Vielfaches von π ist und für die andere ein geradzahliges Vielfaches von π. So werden die Pulse nach ihrer Intensität sortiert zu zwei Ausgängen geleitet, wie Abb. 24.30(a) illustriert. Das Interferometer kann auch mithilfe von optischen Fasern realisiert werden, wie Abb. 24.30(b) zeigt.
I2
Ausgang 1
Eingang
Ausgang 2 t
I2 (b)
t
Abb. 24.30 Intensitätsbasierter 1 × 2-Router aus einem Mach-Zehnder-Interferometer mit einem nichtlinearen Kerrmedium. (a) Normale Ausführung. (b) Faseroptische Variante.
24.3 Photonische Schalter
Ausgang 1
t t
Eingang
Abb. 24.31 Intensitätsbasierter 1 × 2-Router aus einem nichtlinearen Sagnacinterferometer, das als nichtlinearer optischer Schleifenspiegel dient.
asymmetrischer Koppler nichtlineares Element Faser 1
Ausgang 2
t
Faserschleife
Faser 2
ches System wird als nichtlinearer optischer Schleifenspiegel bezeichnet. Nichtlinearer Richtkoppler
Ein Wellenleiter oder ein faseroptischer Richtkoppler aus einem Kerrmaterial kann ebenfalls als intensitätsbasierter Router wirken, wie Abb. 24.32 zeigt. Wenn die Intensität eines Eingabepulses gering ist, verhält sich das Medium linear und das Licht wird bei seiner Ausbreitung periodisch von einem Leiter in den anderen eingekoppelt (siehe Abb. 9.31). Wenn die Länge der Kopplung gleich der Übertragungsentfernung 𝐿0 ist, wird das Licht vollständig aus dem Eingangs- in den anderen Wellenleiter übertragen. Für Pulse mit großer Intensität werden die Ausbreitungskonstanten durch den Kerreffekt verändert, was eine intensitätsabhängige Phasenfehlanpassung erzeugt, die sich mit der Entfernung ändert. Die Ausbreitung gehorcht dann den nichtlinearen gekoppelten Gleichungen da1 = −i𝒞 exp(iΔ𝛽𝑧)a2 (𝑧) − i𝛾|a1 |2 a1 , d𝑧 da2 = −i𝒞 exp(−iΔ𝛽𝑧)a1 (𝑧) − i𝛾|a2 |2 a2 , d𝑧
Soliton-Richtkoppler
In einem Router auf der Grundlage eines nichtlinearen Richtkopplers können die Pulse unterbrochen werden. Da sich die Intensität eines optischen Pulses während seines zeitlichen Verlaufes ändert, gilt dies auch für den Brechungsindex und die zugehörige Ausbreitungskonstante in dem nichtlinearen Medium. Teile der Pulsleistung wechseln daher zwischen den Fasern, was zu einer Umformung und ggf. Unterbrechung der Pulse führt. Das ist in einem faseroptischen nichtlinearen Richtkoppler [Abb. 24.32(b)] ausgeschlossen, wenn der Puls ein optisches Soliton ist (siehe Abschnitt 23.5.2). Weil die nichtlineare Phasenverschiebung eines optischen Solitons über die Einhüllende des Pulses konstant ist, bleibt der Solitonpuls beim Wechsel zwischen den gekoppelten Fasern intakt. Ein anderer Vorteil des Richtkopplerbetriebs mit Solitonen ist, dass der Übergang zwischen den Ausgängen eine schärfere Funktion der Eingangsleistung des Pulses ist.
(24.19)
24.3 Photonische Schalter (24.20)
24.3.1 Ausführungen von räumlichen Schaltern
die Verallgemeinerungen der linearen gekoppelten Gleichungen (9.50) für den linearen Richtkoppler sind. Hier ist 𝒞 = π∕2𝐿0 der Kopplungsfaktor und 𝛾 ist proportional zu dem optischen Kerrkoeffizienten 𝑛2 [siehe Abschnitt 22.3.1 und Gl. (23.141)]. Das System kann so konstruiert werden, dass die Pulse mit hoher Intensität wie in Abb. 24.32 gezeigt den Koppler durch denselben Wellenleiter verlassen, d. h. von den Pulsen mit niedriger Intensität getrennt werden.
Ein Schalter ist ein Bauelement, das Verbindungen zwischen Übertragungswegen in einem Nachrichten- oder signalverarbeitenden System herstellt oder unterbricht. Ein externes Steuergerät wertet eingehende Kommandos aus und sendet ein Steuersignal an den Schalter, der den gewünschten Zustand herstellt. Während Verbindungen auf ein gegebenes Eingangssignal immer auf dieselbe Weise reagieren, sind Schalter steuerbare, aktive oder konfigurierbare Verbindungen, die durch ein äußeres Kommando modifiziert werden können. Räum-
I
I
t
(a) I2
I (b)
I1
I1 I1 I2
t I2
t
Abb. 24.32 Intensitätsbasierter 1 × 2Router auf der Grundlage eines Richtkopplers aus einem nichtlinearen optischen Material. Das Bauelement kann (a) integriert-optisch oder (b) faseroptisch ausgeführt werden.
887
888
24 Optische Verbindungen und Schalter
1 1
1
1
1
1
2
2
2
1
1
l
2
N
1 2
2 1 1
1
1
1
3
2
2
2
4
1
Steuersignal (a)
1
Steuersignal
Steuersignal
(c)
(b)
Abb. 24.33 (a) Beispiele von räumlichen Schaltern. Ein 1 × 1-Schalter verbindet oder trennt zwei Kanäle. Er ist ein ein-aus-Schalter. (b) Ein 1 × 2-Schalter verbindet einen Kanal mit einem von zwei anderen Kanälen. (c) Ein 2 × 2-Koordinatenschalter verbindet zwei Kanäle mit zwei anderen Kanälen. Es hat zwei Zustände und kann als steuerbarer Richt-
Steuersignal (d)
m N Steuer- signal (e)
koppler aufgefasst werden. (d) Ein 1 × N-Schalter verbindet einen Kanal mit einem von N anderen Kanälen. (e) Ein N × NKoordinatenschalter verbindet N Kanäle mit N anderen Kanälen. Ein Eingangskanal kann stets ohne Blockierung (d. h. ohne Konflikt) mit einem freien (unverbundenen) Ausgangskanal verbunden werden. 1
1
2
2 3
(a)
3 (b)
Abb. 24.34 (a) Ein aus drei 1 × 1-Schaltern bestehender 1 × 3-Schalter. (b) Ein aus neun 1 × 1-Schaltern bestehender 3 × 3-Schalter.
1 1
2 3
liche Schalter sind insbesondere Bauelemente, die optische Strahlen zwischen definierten Übertragungswegen (den Ein- und Ausgängen des Schalters) umschalten können. Einige Beispiele von Schaltern sind in Abb. 24.33 gezeigt. Ein 1 × 1-Schalter kann als Grundeinheit verwendet werden, aus der komplexere Schalter aufgebaut werden können. Ein 𝑁 × 𝑁-Koordinatenschalter kann beispielsweise aus 𝑁 2 1 × 1-Schaltern konstruiert werden, die wie die Punkte einer 𝑁 × 𝑁-Matrix organisiert sind, um jeden der 𝑁-Eingabekanäle mit einem freien Ausgangskanal zu verbinden [siehe Abb. 24.33(e)]. Der 𝑚-te Eingabekanal verläuft durch alle elementaren Schalter der 𝑚-ten Zeile, während der 𝑙-te Ausgang mit den Ausgängen aller elementaren Schalter der 𝑙-ten Spalte verbunden ist. Eine Verbindung zwischen dem 𝑚-ten Eingabekanal und dem 𝑙-ten Ausgabekanal wird hergestellt, indem der 1 × 1-Schalter (𝑚, 𝑙) aktiviert wird. Einige Beispiele für aus 1 × 1-Schaltern aufgebaute komplexere Schaltungen sind in Abb. 24.34 gezeigt. Ein 𝑁 × 𝑁-Schalter kann auch aus 2 × 2-Schaltern aufgebaut werden; einige Beispiele hierfür sind in Abb. 24.35 dargestellt.
Eigenschaften von photonischen Schaltern
Ein photonischer Schalter wird durch die folgenden Parameter charakterisiert: • Seine Größe: die Zahl seiner Ein- und Ausgänge. • Seine Richtung: die Angabe, ob Daten in einer oder zwei Richtungen übertragen werden können. • Seine Schaltzeit: die zum Umschalten benötigte Zeit. • Seine Ausbreitungsverzögerung: die Zeit, die das Signal braucht, um den Schalter zu durchqueren. • Seinen Durchsatz: die maximale Datengeschwindigkeit. • Seine Schaltenergie: die zum Umschalten erforderliche Energie. • Seine Leistungsdissipation: die dissipierte Energie pro Zeiteinheit während des Umschaltens. • Seine Einfügungsdämpfung: der Verlust an Signalleistung beim Herstellen einer Verbindung. • Sein Übersprechen: die unerwünschte Leistungsleckage zu anderen Kanälen. • Seine Blockierwahrscheinlichkeit: die Wahrscheinlichkeit, dass eine Verbindung wegen eines Konflikts mit einer anderen Verbindung nicht hergestellt werden kann. • Seine physischen Abmessungen sind wichtig, wenn große Schalterarrays aufgebaut werden sollen.
24.3 Photonische Schalter
1 2 3 4
A
D C
B
E
1
1
1
2
2
3
3
2
4
4
3
5
5
4
6
6
(a)
7
7
8
8 (b)
Abb. 24.35 (a) Ein aus fünf 2 × 2-Schaltern bestehender 4 × 4-Schalter. Eingangskanal 1 ist beispielsweise mit Ausgangskanal 3 verbunden, wenn die Schalter A und C über Kreuz geschaltet und Schalter E linear durchgeschaltet ist. (b) Ein aus 28 2 × 2-Schaltern bestehender 8 × 8-Schalter.
24.3.2 Realisierungen von photonischen räumlichen Schaltern Optoelektronische Schalter
Elektronische Schalter haben sich seit den frühen Jahren der Telefonie kontinuierlich entwickelt und die allgemeinen Fortschritte in der Mikroelektronik nachvollzogen. Elektronische CMOS-Gatter mit Nanometerabmessungen erlauben heute Schaltzeiten von weniger als 0.1 ns bei Schaltenergien kleiner als 1 fJ; leistungsfähige MOSFET-Gatter erreichen Schaltzeiten im Subpikosekundenbereich. Elektronische Chips dienen als Koordinatenschalter mit einer großen Zahl von Kanälen (z. B. 128 × 128); es liegt daher nahe, diese Bauelemente für optische Schalter zu benutzen. Das erfordert jedoch eine optisch/elektrische Konversion am Eingang des Schalters und eine elektrisch/optische Konversion an seinem Ausgang, wie Abb. 24.36 schematisch illustriert. Da die Konversionen optisch/elektrisch/optisch, die für den Betrieb von optoelektronischen Schaltern notwendig sind, unnötige Zeitverzögerungen und Leistungsverluste einführen, ist es wünschenswert, „volloptische“ photonische Schalter zu entwickeln, die durch mechanische, elektrische, akustische, magnetische oder thermische Effekte direkt die optischen Signale beeinflussen, wie in diesem Abschnitt beschrieben.
optoelektronischer Empfängerchip
eingehende Fasern
elektronischer Koordinatenschalter
Grundlegende Konfigurationen optischer Schalter
Die einfachsten optischen Schalter sind der optische Scanner und der Modulator. Ein Scanner, der einen optischen Strahl in eine von 𝑁 möglichen Richtungen ablenkt, wirkt als 1 × 𝑁-Schalter [Abb. 24.37(a)]. Ein im ein-aus-Modus betriebener optischer Modulator wirkt als 1 × 1-Schalter. Die Modulation kann direkt erfolgen, d. h. auf einem physikalischen Effekt beruhen, der das Licht durchlässt oder blockiert, oder interferometrisch, wie z. B. bei einem optischen Phasenmodulator in einem Zweig eines Interferometers, das die Phasenmodulation in Intensitätsmodulation umwandelt [Abb. 24.37(b)]. Ein anderer einfacher optischer Schalter ist ein als 2 × 2Schalter betriebener Richtkoppler. Das lässt sich z. B. durch ein Interferometer mit einem Phasenmodulator in einem oder beiden Zweigen erreichen [Abb. 24.37(c)]. Die beiden Zweige des Interferometers können auch zwei orthogonalen Polarisationskomponenten entsprechen; der Phasenmodulator wird dann zu einem Phasenschieber, der eine relative Phasenverschiebung zwischen den beiden Polarisationen einführt. Elementare optische Schalter können mithilfe einer Ausbreitung durch den freien Raum oder über Wellenleiter kombiniert oder kaskadiert werden, um Schalter höherer Dimensionen aufzubauen. Wie in Abb. 24.38
optoelektronischer Sendechip
ausgehende Fasern elektronische Steuerung
Abb. 24.36 Ein optoelektronischer Koordinatenschalter. Aus optischen Fasern eingehende Signale werden durch ein Photodetektorarray auf einem optoelektronischen Chip registriert, durch einen elektronischen Koordinatenschalter geschaltet und durch eine Reihe von Lichtquellen neu erzeugt und in ausgehende optische Fasern eingekoppelt.
889
890
24 Optische Verbindungen und Schalter
Ausgang 1 N
Ausgang
Steuersignal
Ausgang 2
Eingang 1
Eingang 2 1
Steuersignal
(a)
Eingang 2
(b)
Steuersignal
(c)
Abb. 24.37 (a) Ein optischer Scanner als 1 × N-Schalter. (b) Ein Interferometer mit einem Phasenmodulator als 1 × 1-Schalter. (c) Ein Interferometer mit einem Phasenmodulator als 2 × 2-Schalter.
Folgenden kurz beschreiben. Volloptische oder „optooptische“ Schalter werden in Abschnitt 24.3.3 beschrieben. Die Schaltzeiten dieser Bauelemente sind in Abb. 24.39 gegenübergestellt.
1 2 3 4
Optomechanische Schalter
1
2
4×4 Modulatoren 3
Steuersignal
4
Abb. 24.38 Ein 4 × 4-Koordinatenschalter. Jedes der 16 Elemente ist ein 1 × 1-Schalter, der Licht abhängig von einem Steuersignal transmittiert oder blockt. Licht aus dem m-ten Eingangskanal (m = 1, 2, 3, 4) wird zu allen Schaltern in der m-ten Spalte geleitet. Licht von allen Schaltern der l-ten Zeile wird zum l-ten Ausgangskanal (l = 1, 2, 3, 4) geleitet. Dieses System ist eine Realisierung des in Abb. 24.33(e) schematisch dargestellten 4 × 4-Schalters.
dargestellt kann eine ebene Anordnung von 16 optischen Modulatoren, von denen jeder als 1 × 1-Schalter wirkt, in einem optischen System zu einem 4 × 4-Koordinatenschalter kombiniert werden. Modulation und Ablenkung von Licht können durch mechanische, elektromechanische, elektrische, akustische, magnetische, thermische oder optische Steuerung erreicht werden; die Schalter werden dann entsprechend optomechanisch (oder mechanooptisch), mikroelektromechanisch, elektrooptisch, halbleitend, flüssigkristallin, akustooptisch, magnetooptisch oder thermooptisch genannt; diese Techniken werden wir im
thermoMEMS mechanomagnetoLC akustoOHV elektro-
volloptisch
elektronisch 1 fs
1 ps
Ein optomechanischer 1 × 𝑁-Schalter (ein Scanner) kann durch bewegliche (rotierende oder alternierende) Spiegel, Prismen oder holographische Gitter realisiert werden, die einen Lichtstrahl in eine Reihe von Richtungen (Abb. 24.40) ablenken können. Eine optische Faser kann mit einer beliebigen Zahl von anderen optischen Fasern verbunden werden, indem die Eingangsfaser mechanisch bewegt und auf die entsprechende Ausgangsfaser ausgerichtet wird; dazu kann ein Mechanismus wie der in Abb. 24.40(c) illustrierte verwendet werden. Für schnelle Bewegungen können piezoelektrische Elemente eingesetzt werden. Mikroelektromechanische Systeme (MEMS) sind miniaturisierte mechanische Systeme, die durch elektrostatische Stellglieder betrieben werden und durch ähnliche Prozesse wie in der Mikroelektronik in großen Arrays hergestellt werden. Ihre Schaltgeschwindigkeiten liegen zwischen 10 μs und 10 ms. Ein Koordinatenschalter kann beispielsweise aus einer Reihe von mikroelektromechanischen Klappspiegeln wie in Abb. 24.41(a) oder einer Reihe von beweglichen Spiegeln wie in Abb. 24.41(b) realisiert werden. Ein anderes Beispiel eines MEMS ist das in Abb. 24.42 gezeigte digitale Mikrospiegel-Bauelement, das bei Texas Instruments entwickelt wurde. Wie der Ausschnitt
1 ns
1 µs
1 ms
Abb. 24.39 Vergleich der Schaltzeiten verschiedener optischer Schaltsysteme.
24.3 Photonische Schalter
1 2
starre 3 Fasern
1
4
Prisma indexanpassende Flüssigkeit (a)
(c)
(b)
Abb. 24.40 Methoden der Lichtablenkung. (a) Rotierender Spiegel/rotierendes Prisma. (b) Rotierende holographische Scheibe. Jeder Sektor der holographischen Scheibe enthält ein Gitter, dessen Orientierung und Periode eine Scanebene und einen Scanwinkel des abgelenkten Lichts bestimmen.
(c) Eine optische Faser an einem rotierenden Rad wird auf eine von vielen optischen Fasern an einem feststehenden Rad ausgerichtet. Zur Indexanpassung (bessere optische Kopplung) wird eine Flüssigkeit eingesetzt.
Eingang
Klappspiegel
Ausgang
Linsenarray
bewegliche Spiegel
Spiegel
4 3 2 1
2
Steuerleitungen
1 3
4
Steuerleitungen
Abb. 24.41 (a) Schalter aus MEMS-Klappspiegeln. (b) Schalter aus beweglichen MEMS-Spiegeln.
Lichtfalle
DMD Bild DMD
Beleuchtung
Abb. 24.42 Das digitale Mikrospiegel-Bauelement (DMD) besteht aus einem Array von Mikrospiegeln, die zwischen zwei Orientierungen umgeschaltet werden und so ein binäres Bild erzeugen.
891
892
24 Optische Verbindungen und Schalter
zeigt, handelt es sich dabei um ein Array von Mikrospiegeln, die jeweils eine von zwei möglichen Orientierungen (+12◦ oder −12◦ ) annehmen können. In der einen Orientierung reflektiert ein Spiegel das einfallende Licht durch eine fokussierende Linse auf die Bildebene, sodass dort ein heller Punkt erscheint; in der anderen Orientierung lenkt er den Lichtstrahl in eine Lichtfalle, sodass in der Bildebene ein dunkler Punkt erscheint. Das Mikrospiegel-Bauelement wirkt somit als binärer (hell/ dunkel) räumlicher Lichtmodulator und wird zu diesem Zweck in handelsüblichen Projektionssystemen eingesetzt. Auch Grauwerte können damit erzeugt werden, indem man die relativen Dauer der hellen bzw. dunklen Punkte variiert. Der Hauptnachteil von optomechanischen Schaltern ist ihre relativ langsame Reaktion (ihre Schaltzeiten liegen im Bereich einiger Millisekunden); ihre wesentlichen Vorteile sind ihre geringe Einfügungsdämpfung und ihr niedriges Übersprechen. Elektrooptische Schalter
Wie in Abschnitt 21.1 besprochen verändern elektrooptische Materialien in Anwesenheit eines elektrischen Feldes ihre Brechungsindizes. Sie können dadurch als elektrisch gesteuerte Phasenmodulatoren oder Phasenschieber verwendet werden. Wenn sie in einen Arm eines Interferometers oder zwischen zwei gekreuzte Polarisatoren gestellt werden, wirken elektrooptische Zellen als elektrisch gesteuerte Lichtmodulatoren oder 1 × 1Schalter (siehe Abschnitt 21.1.2). Da es schwierig ist, aus Volumenkristallen große Schalterarrays herzustellen, ist die vielversprechendste Technik für elektrooptische Schalter die integrierte Photonik (siehe Abschnitt 9.3). Integriert-photonische Wellenleiter werden aus elektrooptischen dielektrischen Substraten wie Lithiumniobat LiNbO3 hergestellt, wobei die Wellenleiter aus Streifen mit einem geringfügig höheren Brechungsindex bestehen, die durch Diffusion von Titan in das Substrat erzeugt werden. Ein Beispiel für einen 1 × 1-Schalter auf der Basis eines integriert-photonischen Mach-Zehnder-Interferometers (MZI) ist in Abb. 24.43(a) dargestellt (die Abb. 21.6 ent-
Eingang
(a)
Steuerleitung
Ausgang
spricht). Aus einem MZI lässt sich auch ein integriertphotonischer 2 × 2-Schalter aufbauen, wie Abb. 24.43(b) zeigt. Auch der in Abschnitt 21.1.4 besprochene Richtkoppler lässt sich zu einem 2 × 2-Schalter umfunktionieren, wie Abb. 24.43(c) zeigt (die Abb. 21.11 entspricht). Hierbei werden zwei Wellenleiter optisch gekoppelt, indem man sie dicht nebeneinander führt. Ihr Brechungsindex wird durch ein elektrisches Feld verändert, das so eingestellt wird, dass die optische Leistung entweder in demselben Wellenleiter bleibt oder in den anderen Wellenleiter übertragen wird. Solche Schalter arbeiten bei Spannungen von einigen Volt mit Geschwindigkeiten von einigen zehn GHz. Ein integriert-photonischer 𝑁 × 𝑁 Schalter kann aus einer Kombination von 2 × 2-Schaltern aufgebaut werden. Ein 4 × 4-Schalter besteht z. B. aus fünf 2 × 2-Schaltern, die wie in Abb. 24.35(a) verbunden sind. Diese Schaltung kann in der in Abb. 24.44 gezeigten Anordnung auf einem einzigen Substrat hergestellt werden. Elektrooptische Schalter aus Lithiumniobat wurden bis zu einer Größe von 32 × 32 hergestellt. Die Zahl von Schaltern pro Flächeneinheit wird durch die relativ großen Abmessungen der einzelnen Richtkoppler und die planare Natur der Verbindungen innerhalb des Chips begrenzt. Um die Abmessungen zu reduzieren und die Packungsdichte der Schalter zu erhöhen, werden sich kreuzende (anstatt parallele) Wellenleiter verwendet. Da die integrierte Photonik auf rechteckigen Strukturen aufgebaut ist, ist es schwierig, eine effiziente Kopplung zu zylindrischen Wellenleitern (z. B. optischen Fasern) zu erhalten. Dabei treten relativ große Einfügungsdämpfungen auf, vor allem für Einmodenfasern. Weil der Kopplungsfaktor polarisationsabhängig ist, muss die Polarisation des geführten Lichts richtig ausgewählt werden. Daraus resultiert die Einschränkung, dass die Fasern am Ein- und Ausgang polarisationserhaltend sein müssen (siehe Abschnitt 10.2.3). Zur Herstellung von polarisationsunabhängigen Schaltern sind ausgefeilte Konstruktionen erforderlich.
Steuerleitung
Eingänge
(b)
Ausgänge
Eingang
Steuerleitung
(c)
Ausgänge
Abb. 24.43 (a) Ein 1 × 1-Schalter aus einem integriert-photonischen Mach-Zehnder-Interferometer. (b) Ein 2 × 2-Schalter aus einem integriert-photonischen MZI. (c) Ein 2 × 2-Schalter aus einem integriert-photonischen Richtkoppler.
24.3 Photonische Schalter
3 1
4
2
A B
C
D
E
3
4
2
Abb. 24.44 Ein integriert-photonischer 4 × 4-Schalter aus fünf Richtkopplern A, B, C, D, und E auf einem einzigen Substrat.
Photonische Halbleiterschalter
Halbleiterbauelemente haben verschiedene elektronische und optische Eigenschaften, die für schnelle optische Schalter nützlich sind. Wie in Abschnitt 21.5 beschrieben, können Elektroabsorption auf der Basis des Franz-Keldysh-Effekts oder der quantenbeschränkte Starkeffekt in Mehrfachquantenschichtstrukturen verwendet werden, um die Absorption von Licht bei Wellenlängen in der Nähe der Bandlücke durch Anwendung eines elektrischen Feldes zu kontrollieren. Solche elektrisch gesteuerten optischen Modulatoren können als 1 × 1-Schalter mit hohen Geschwindigkeiten eingesetzt werden; ihre Schaltzeiten können unterhalb von 20 ps liegen. Sie können zu großen Arrays kombiniert und auf Siliciumsubstraten aufgebracht werden, wie Abb. 24.45 schematisch illustriert.
Abb. 24.45 Ein Array aus Mehrfachquantenschichtschaltern auf der Grundlage des quantenbeschränkten Starkeffekts in einer oberflächenemittierenden Anordnung.
Ein anderes wichtiges in optischen Schaltern verwendetes Bauelement sind optische Halbleiterverstärker (OHV). Da ein OHV durch Ein- und Ausschalten des injizierten Stroms schnell geschaltet werden kann (siehe Abschnitt 18.2), kann er als 1 × 1-Schalter mit Schaltzeiten im Bereich von Nanosekunden verwendet
werden. Ohne Gewinn (d. h. ausgeschaltet) verhält sich das Bauelement wie ein starker Absorber, während es mit Gewinn (d. h. eingeschaltet) zu einem Verstärker wird, sodass sehr große Extinktionsverhältnisse (mehr als 40 dB) resultieren. OHV-Schalter wurden für Wellenlängen von 1.55 und 1.3 μm auf der Grundlage von InGaAsP/InP-Doppelheterostrukturen oder Mehrfachquantenschichtstrukturen (siehe Abschnitt 18.2.4) demonstriert. OHV-Arrays können hergestellt und über optische Fasern verbunden werden, wie das Beispiel in Abb. 24.46 zeigt. Da OHV Gewinn liefern, können sie in Schaltungen verwendet werden, um die großen Aufteilungsverluste auszugleichen. Da OHV auch als Wellenlängenwandler wirken können, können sie in Wellenlängenschaltern verwendet werden, um optische Daten von einer Wellenlänge auf eine andere zu kopieren. Wegen ihrer nichtlinearen optischen Eigenschaften werden OHV auch als ultraschnelle volloptische Schalter eingesetzt, wie in Abschnitt 24.3.3 beschrieben wird. Flüssigkristallschalter
Flüssigkristalle bieten eine anderen Weg zur Herstellung von elektrisch gesteuerten photonischen Schaltern. Wie in Abschnitt 21.3 beschrieben, kann eine Flüssigkristallzelle als ein elektrisch gesteuerter Phasenschieber oder Polarisationsrotator eingesetzt werden. Mithilfe von gekreuzten Polarisatoren kann dies in eine Intensitätsmodulation umgewandelt werden. Eine kompakte Realisierung eines 2 × 2-Flüssigkristall-Koordinatenschalters ist in Abb. 24.47 gezeigt. Dabei handelt es sich um eine Polarisationsversion des MachZehnder-Interferometers aus Abb. 24.37(c), in der die Flüssigkristallzelle die Polarisation der Strahlen in den Interferometerarmen um 90◦ dreht, wenn das Steuersignal eingeschaltet ist, wodurch die Verbindungen umgeschaltet werden. Dieser Schalter ist polarisationsunabhängig, d. h. die Strahlen werden unabhängig von ihrem Polarisationszustand zu den gewünschten Ausgängen geleitet. Ein anderer Weg ist, die Änderung des Brechungsindex eines Flüssigkristalls durch das angelegte elektrische Feld für die Schaltung zu verwenden. Das Licht
Eingang 1 Eingang 2 Vorverstärker
Ausgang 1 OHV-Schalter
Abb. 24.46 Ein 2 × 2-Schalter aus vier 1 × 1-OHV.
Ausgang 2 Nachverstärker
893
894
24 Optische Verbindungen und Schalter
FlüssigkristallPolarisationsrotator
Ausgang 1 polarisierender Strahlteiler
Prisma Ausgang 2 Eingang 1
polarisierender Strahlteiler Eingang 2
Prisma Steuersignal
Abb. 24.47 Ein 2 × 2-Flüssigkristall-Koordinatenschalter. Die beiden Polarisationskomponenten eines Eingangsstrahls werden durch den linken polarisierenden Strahlteiler aufgeteilt und durch den rechten nach dem Durchgang durch die Flüssigkristallzelle wieder vereinigt. Die Flüssigkristallzelle dreht die Polarisation um π∕2, wenn das Steuersignal eingeschaltet ist. Ohne Rotation der Polarisation werden die Strahlen von den Eingängen 1 und 2 zu den Ausgängen 1 und 2 geleitet, d. h. der Schalter leitet die Kanäle linear durch. Durch die Rotation der Polarisation werden die Strahlen entsprechend einer Überkreuzschaltung zum jeweils entgegengesetzten Ausgang geleitet.
tritt dabei in einem Winkel in den Flüssigkristall ein, der so gewählt wird, dass nur dann Totalreflexion auftritt, wenn das elektrische Feld angelegt ist. Ein großes Array von Elektroden kann als Anordnung von 1 × 1-Schaltern dienen (als digitaler räumlicher Lichtmodulator), der in der in Abb. 24.38 gezeigten Anordnung zum Aufbau eines 𝑁 × 𝑁-Koordinatenschalters verwendet werden kann. Wegen ihrer relativ geringen Schaltgeschwindigkeit werden Flüssigkristallschalter in Anwendungen verwendet, in denen die Geschwindigkeit kein entscheidender Faktor ist, wie z. B. in Schutzschaltern und programmierbaren optischen Add/Drop-Multiplexern in faseroptischen Netzen (siehe 25.5.2). Akustooptische Schalter
Akustooptische Schalter beruhen auf der braggschen Beugung von Licht durch Schall (Abschnitt 20.1.1). Der Reflexionsgrad des abgelenkten Lichts wird durch die Schallintensität kontrolliert, während der Ablenkwin-
kel durch die Frequenz des Schalls bestimmt wird. Ein akustooptischer Modulator wie der in Abb. 24.48(a) (die Abb. 20.5 entspricht) gezeigte ist ein 1 × 2-Schalter, wohingegen ein akustooptischer Scanner wie der in Abb. 24.48 dargestellte ein 1 × 𝑁-Schalter ist. Abbildung 24.48(b) zeigt einen 2 × 2-Schalter. Wenn unterschiedliche Bereiche der akustooptischen Zelle Schallwellen mit unterschiedlichen Frequenzen enthalten, entsteht ein 𝑁 × 𝑀-Schalter, wie Abb. 24.48(c) zeigt (die Abb. 20.27 entspricht). Beschränkungen des in akustooptischen Zellen maximal erreichbaren Produkts 𝑁𝑀 wurden in Abschnitt 20.2.3 besprochen [Gl. (20.52)]. Akustooptische Schalter sind allgemein langsam, da ihre Antwortzeit von der Durchgangszeit des Schalls durch das Bauelement abhängt. Auch Arrays aus akustooptischen Zellen sind verfügbar. Magnetooptische Schalter
Magnetooptische Materialien verändern ihre optischen Eigenschaften unter dem Einfluss eines magnetischen Feldes. Materialien mit einem Faradayeffekt wirken in Gegenwart einer statischen magnetischen Flussdichte 𝐵 beispielsweise als Polarisationsrotatoren (siehe Abschnitt 6.4.2); ihr Drehvermögen 𝜌 (Winkel pro Längeneinheit) ist proportional zur Komponente von 𝐵 in der Ausbreitungsrichtung. Wenn das Material sich zwischen zwei gekreuzten Polarisatoren befindet, hängt die 2 optische Leistungsübertragung 𝒯 = sin 𝜃 vom Drehwinkel 𝜃 = 𝜌d der Polarisation ab, wobei d die Dicke der Zelle ist. Das Bauelement kann somit als ein durch ein Magnetfeld gesteuerter 1 × 1-Schalter dienen. Das magnetooptische Material wird gewöhnlich in Form einer Schicht (z. B. aus bismutsubstituiertem Eisengranat) auf einem nichtmagnetischen Substrat eingesetzt. Das magnetische Feld wird durch zwei sich kreuzende stromdurchflossene Leiter erzeugt. Das System arbeitet binär, indem die Richtung der Magnetisierung umgeschaltet wird. Arrays von magnetooptischen Schaltern können durch Ätzen von isolierten Zellen (mit Abmessungen bis hinunter zu 10 × 10 μm2 ) in eine Schicht hergestellt
1 2 1
1
1
1
2
2
2
M
T/L t (a)
t
(b)
1 2
L t
(c)
Abb. 24.48 Akustooptische Schalter. (a) 1 × 2-Schalter, (b) 2 × 2-Schalter, (c) L × M-Schalter.
24.3 Photonische Schalter
werden. Leiterbahnen für die elektrischen Ströme werden anschließend mikrolithographisch erzeugt. Heute sind große Arrays von magnetooptischen Schaltern (bis 1024 × 1024) verfügbar geworden, die mit Schaltgeschwindigkeiten im Bereich von 100 ns betrieben werden können. Auch Bauelemente auf der Grundlage von plasmonischen Effekten wurden hergestellt. Magnetooptische Materialien werden auch im Bereich der optischen Datenspeicherung eingesetzt. Sie beruhen jedoch auf einem thermomagnetischen Effekt, bei dem sich die Magnetisierung durch Aufheizen mit einem starken fokussierten Laser verändert; zum Auslesen wird schwach linear polarisiertes Licht aus einem Laser verwendet.
2
Dünnschichtheizung
1
2 1
Abb. 24.49 Thermooptischer Schalter auf Grundlage eines Mach-Zehnder-Interferometers. Flüssigkeit, Brechungsindex n
Mikroheizelement
Wellenleiter, Brechungsindex n
Blasen
Thermooptische Schalter
Thermooptische Schalter beruhen auf dem thermooptischen Effekt, also auf der Änderung des Brechungsindex eines Materials durch eine Temperaturänderung. Die Temperaturänderung bewirkt eine Änderung der Dichte des Materials, die wiederum die Änderung des Brechungsindex hervorruft. Da diese Änderung fast immer sehr klein ist, werden thermooptische Schalter häufig in interferometrischen Anordnungen verwendet. Der thermooptische Koeffizient von Quarzglas beträgt beispielsweise d𝑛∕ d𝑇 ≈ 10−5 K−1 ; Polymere haben häufig größere Koeffizienten. Integriert-photonische thermooptische Schalter werden aus Wellenleitern in Silikat-auf-Silicium-Technologie hergestellt. Ein Beispiel ist der Schalter auf Basis eines Mach-Zehnder-Interferometers in Abb. 24.49. Eine dünne metallische Heizschicht direkt auf dem Wellenleiter dient zur Kontrolle der Temperatur des Materials in einem der Interferometerzweige. Eine Temperaturänderung Δ𝑇 bewirkt eine Phasenverschiebung (2π𝐿∕𝜆0 )Δ𝑛 = (2π 𝐿∕𝜆0 ) × (d𝑛∕ d𝑇)Δ𝑇, wobei 𝐿 die Länge des erhitzten Gebiets ist. In einem Schalter auf Silikatbasis mit 𝐿∕𝜆0 = 2 × 103 ist die Temperaturänderung, die für eine Phasenverschiebung von π erforderlich ist, beispielsweise Δ𝑇 = 25 K. Interferometrische Schaltanordnungen wurden auch auf der Grundlage von Wellenleiter-Gitterarrays in Silikat- und polymeren Wellenleitern erprobt. Der Hauptnachteil dieser Schalter sind jedoch ihre langen Schaltzeiten, die im Millisekundenbereich liegen. Sie sind daher eher geeignet, um Lichtwege in optischen Netzen zu konfigurieren. Eine andere thermooptische Schalttechnik ändert den Brechungsindex durch Erzeugung eines Blasenstroms in einer Flüssigkeit mithilfe einer Mikroheizung. Wie in Abb. 24.50 dargestellt, verändern die Blasen den effektiven Brechungsindex der Flüssigkeit so, dass sie den Lichtstrahl nicht mehr durchlässt, sondern totalreflektiert.
Abb. 24.50 Blasenjetschalter.
24.3.3 Volloptische räumliche Schalter In einem volloptischen (oder optooptischen) räumlichen Schalter wird Licht mithilfe eines nichtlinearen optischen Materials durch Licht gesteuert. Das Steuerlicht verändert eine optische Eigenschaft des nichtlinearen Materials, wodurch ein Attribut des kontrollierten Lichts (seine Phase, Frequenz oder Polarisation) verändert wird. Dieses veränderte Attribut wird anschließend genutzt, um den Durchgang des Signallichts auf seinem Weg zu blockieren oder es in eine andere Richtung zu lenken. Das Signal- und das Steuerlicht müssen sich in mindestens einer Hinsicht unterscheiden, z. B. durch ihre Wellenlänge, Polarisation oder Richtung. Der verwendete nichtlineare Prozess kann parametrisch oder nichtparametrisch sein (Kapitel 22), und die Anordnung kann interferometrisch oder nichtinterferometrisch sein. Ergänzend zu den in Abschnitt 24.3.1 genannten Charakteristika von photonischen Schaltern sind die wesentlichen Parameter zur Beschreibung eines volloptischen Schalters (1) die von dem Steuerlicht beleuchtete Fläche, (2) die Intensität des Steuerlichts, (3) die Schaltenergie, (4) die Schaltzeit und (5) das erreichbare Extinktionsverhältnis. Der ideale volloptische Schalter ist ein äußerst kompaktes Bauelement, das mit einer sehr geringen Intensität des Steuerlichts und einer sehr geringen Schaltleistung mit sehr kurzen Schaltzeiten und einem sehr hohem Extinktionsverhältnis arbeitet.
895
896
24 Optische Verbindungen und Schalter
Zurzeit werden verschiedene Bauelemente als volloptische Schalter eingesetzt, beispielsweise optische Halbleiterverstärker (OHV) oder nichtlineare optische Wellenleiter und Fasern. Mikro- und Nanostrukturen auf der Grundlage von Solitonen, photonischen Kristallen, plasmonischen Strukturen, Metamaterialien und ringförmigen Nanohohlräumen versprechen größere Nichtlinearitäten, geringere Leistungsaufnahme und kürzere Schaltzeiten. Volloptische Schalter auf der Grundlage von optischen Halbleiterverstärkern
Elektrisch gesteuerte photonische Halbleiterschalter haben wir bereits in Abschnitt 24.3.2 besprochen. In diesem Abschnitt befassen wir uns mit volloptischen Halbleiterverstärkern (OHV), die auf der Grundlage von nichtparametrischen nichtlinearen Prozesse arbeiten: Kreuzgewinnmodulation (XGM, engl. cross-gain modulation) und Kreuzphasenmodulation (XPM, engl. cross-phase modulation). In einem XGM-OHV-Schalter [Abb. 24.51(a)] hat das Steuerlicht eine höhere Leistung als das Signallicht und beide unterscheiden sich durch ihre Frequenzen oder Polarisationen. In Abwesenheit des Steuerlichts wird das Signallicht verstärkt; wenn das Steuerlicht eingeschaltet wird, wird der Verstärker gesättigt und seine Verstärkung wird aufgrund der sinkenden Trägerdichte wesentlich verringert, sodass schließlich keine Verstärkung mehr erfolgt. Der ein- bzw. aus-Zustand des Schalters wird entsprechend durch große bzw. kleine Intensitäten des Ausgangssignals dargestellt. Das Kontrastverhältnis zwischen diesen Zuständen liegt typischerweise im Bereich von 10–20 dB. In einem XPM-OHV-Schalter [Abb. 24.51(b)] ist der Verstärker ungesättigt und das Steuerlicht verändert, sofern vorhanden, den Brechungsindex des Halbleiterstärkers, der von der Trägerdichte abhängt. Das Signallicht erfährt dann eine Phasenverschiebung, die von einem Interferometer erfasst wird. Wenn das Vorhandensein des Steuerlichts die Phasendifferenz zwischen den Interferometerzweigen von 0 auf π schaltet, wird das Signallicht von dem einen Ausgang zum anderen geleitet und das Gerät wirkt als 1 × 2-Schalter. OHV sind sehr
Ausgang
Eingang ω1
Steuerung ω2
OHV (a)
Filter
ω1
kompakt und können in Arrays integriert werden, ihre Schaltzeit ist jedoch auf den Bereich von 10–100 ps begrenzt. Parametrische Schalter
Wie in Kapitel 22 beschrieben treten in nichtlinearen Materialien zweiter und dritter Ordnung zahlreiche nichtlineare parametrische Wellenmischungseffekte auf, unter anderem Summenfrequenzerzeugung (SFG), der optische Kerreffekt, Selbstphasenmodulation (SPM) und Kreuzphasenmodulation (XPM), Kreuzgewinnmodulation (XGM), Vierwellenmischung (FWM), optische Frequenzumwandlung sowie optische Solitonen. Eine Reihe von volloptischen Schaltern und Gattern beruht auf diesen Effekten. Schalter auf der Grundlage der Summenfrequenzerzeugung
Abbildung 24.52 zeigt ein Beispiel eines Schalters, der auf der Summenfrequenzerzeugung (SFG) in einem nichtlinearen Wellenleiter zweiter Ordnung basiert, beispielsweise einem periodisch gepolten Lithiumniobatkristall (Abschnitt 22.2.5). Wenn die Bedingung für die Quasi-Phasenanpassung erfüllt ist, erzeugen die Signalund Steuerwellen der Frequenzen 𝜔1 bzw. 𝜔2 eine neue Welle mit der Summenfrequenz 𝜔3 = 𝜔1 + 𝜔2 . Die beiden ursprünglichen Wellen werden dabei vernichtet. Dies geschieht jedoch nur, wenn sowohl die Signalals auch die Steuerwelle vorhanden sind. In Gegenwart der Steuerwelle wird die Signalwelle daher ausgelöscht, während sie in Abwesenheit der Steuerwelle ohne nennenswerte Dämpfung durch den Wellenleiter übertragen wird. Die Erzeugung der Summenfrequenz wirkt daher als 1 × 1-Schalter, der von der Steuerwelle kontrolliert wird. ω1 ω2
Eingang ω1
ω3
Steuerung ω2
Filter
Ausgang ω1
Abb. 24.52 Ein volloptischer 1 × 1-Schalter, der die Signalwelle mithilfe einer parametrischen Summenfrequenzerzeugung in einem nichtlinearen Wellenleiter zweiter Ordnung auslöschen kann.
MZI
Eingang ω1
Steuerung ω2
(b)
OHV
Ausgang ω1
Abb. 24.51 Volloptische OHV-Schalter. (a) Ein 1 × 1-Schalter auf Grundlage der Kreuzgewinnmodulation (XGM). (b) Ein 1 × 2-Schalter auf der Grundlage der Kreuzphasenmodulation (XPM) und eines Mach-Zehnder-Interferometers (MZI).
24.3 Photonische Schalter
Eingang
Faser
Ausgang 1 ω1
ω1 ω2
HNLF
Filter
Steuerung
ω1
Ausgang 2
ω1 ω2
Abb. 24.53 Ein volloptischer 1 × 2-Schalter auf der Grundlage der Kreuzphasenmodulation (XPM) in einer stark nichtlinearen Faser in einem Mach-Zehnder-Interferometer (MZI).
XPM-MZI-Schalter
Wie Abb. 24.53 zeigt, wird der Brechungsindex eines nichtlinearen Mediums dritter Ordnung, in dem Kreuzphasenmodulation (XPM) auftritt, beispielsweise einer stark nichtlinearen Faser, durch die Steuerwelle verändert. Damit ändert sich die Phase der Signalwelle, was durch ein Mach-Zehnder-Interferometer (MZI) registiert wird, das die Signalwelle abhängig von der An- oder Abwesenheit der Steuerwelle zu einem der beiden Ausgänge leitet. Die Steuerwelle unterscheidet sich von der Signalwelle durch ihre Frequenz, sodass ein Filter eingesetzt werden kann, um ausschließlich der Signalwelle den Durchgang durch das Interferometer zu ermöglichen. Das Ergebnis ist ein 1 × 2-Schalter, der durch die An- oder Abwesenheit der Steuerwelle geschaltet wird. XPM-Mikroringschalter
Ein integriert-optischer dielektrischer Mikroresonator wie der aus Abb. 11.1(b), dessen Resonanzfrequenz optisch steuerbar ist, kann als ultrakompakter volloptischer Schalter verwendet werden. Wie in Abb. 24.54 dargestellt werden die Eingangs- (Signal-) und Steuerwellen durch gerade Wellenleitersegmente geführt, die an dem Mikroring anliegen. Ohne Steuerwelle wird die Eingangswelle in den Resonator eingekoppelt, der so ausgelegt ist, dass er eine passende Resonanzfrequenz aufweist, und wird verworfen (Drop-Ausgang). Wenn die Steuerwelle vorhanden ist, bewirkt sie durch den optischen Kerreffekt (Abschnitt 22.3.1) eine Brechungsindexänderung Δ𝑛 = 𝑛2 𝐼, die zu einer proportionalen Än-
XPM-Verzögerungsschalter
Dieser Schalter beruht auf dem optischen Kerreffekt in einem anisotropen nichtlinearen Medium. Die Ausbreitung der Steuerwelle durch ein solches Medium erzeugt unterschiedliche Änderungen der Hauptbrechungsindizes, sodass das Medium als Retarder für die Signalwelle (Eingangswelle) wirkt und dadurch deren Polarisationszustand ändert. Ein doppelbrechender Kristall oder eine stark nichtlineare Faser zwischen gekreuzten Polarisatoren kann somit als volloptischer ein-aus-Schalter fungieren. Ohne Verzögerung wird die Eingangswelle blockiert und der Schalter befindet sich im ausgeschalteten Zustand; wenn die Steuerwelle eine Verzögerung von π hervorruft, wird die Signalwelle durchgelassen und der Schalter ist eingeschaltet. Alternativ kann ein polarisierender Strahlteiler (PBS) verwendet werden, um das Signal von einem Ausgang auf einen anderen umzuleiten, wenn die Steuerwelle ein- oder ausgeschaltet wird. Dieser 1 × 2-Schalter ist in Abb. 24.55 dargestellt. Eingang
Polarisator doppelbrechende HNLF
Eingang
Ausgang Mikroring
Drop
derung der Resonanzfrequenz des Resonators führt. Da die Signalwelle nun nicht mehr in Resonanz ist, wird sie nicht mehr in den Resonator eingekoppelt und vollständig zum den Ausgang geleitet. Das Ergebnis ist ein 1 × 1-Schalter, der durch die An- oder Abwesenheit der Steuerwelle geschaltet wird. Mikroringschalter wurden sowohl auf Grundlage von III-V-Halbleitern als auch in Silicium-auf-Isolator- (SOI) Technologie erfolgreich realisiert. Obwohl der Kerreffekt in kristallinem Silicium nicht sehr ausgeprägt ist, können andere nichtlineare Mechanismen an seiner Stelle zu einem beträchtlichen intensitätsabhängigen Brechungsindex in Si führen, z. B. Effekte freier Ladungsträger, Zweiphotonenabsorption (Beispiel 164) oder der thermooptische Effekt (Abschnitt 24.3.2). Mikroringschalter können Schaltzeiten von 25 ps bei 1.55 μm erreichen.
Steuerung
Abb. 24.54 Ein volloptischer 1 × 1-Schalter auf der Grundlage der Änderung der Resonanzfrequenz eines Mikroresonators durch eine von der Steuerwelle bewirkte Änderung des Brechungsindex. Bei Resonanz wird die Signalwelle zum Drop-Ausgang geleitet und verworfen; ohne Resonanz gelangt sie ohne Verluste zum eigentlichen Ausgang.
Ausgang 1 Filter PBS Ausgang 2
Steuerung
Abb. 24.55 Ein volloptischer 1 × 2-Schalter auf der Grundlage der Kreuzphasenmodulation (XPM), der die Verzögerung in einer doppelbrechenden stark nichtlinearen Faser ändert.
897
898
24 Optische Verbindungen und Schalter
Eingang ω1
Ausgang ω 1 Filter HNLF ω 1ω 1ʹ
Steuerung ω 2
Abb. 24.56 Ein volloptischer 1 × 1-Schalter auf der Grundlage der Frequenzverschiebung, die durch Kreuzphasenmodulation (XPM) nahe der Flanke des Steuerpulses in einer stark nichtlinearen Faser in das Signal eingeführt wird.
XPM-Frequenzumschalter
Die in Abb. 24.56 dargestellte nichtinterferometrische Anordnung kann zum Schalten von ultrakurzen Lichtpulsen verwendet werden. Wie in Abschnitt 23.1.1 diskutiert wurde, entspricht eine linear mit der Zeit variierende Phasenverschiebung einer Frequenzverschiebung, die proportional zur Steigung des Leistungsprofils des Steuerpulses ist. Dementsprechend verleiht die zeitlich variierende Intensität an der Flanke des optischen Steuerpulses dem Signal durch Kreuzphasenmodulation eine zeitlich veränderliche Phase und eine damit verbundene Frequenzverschiebung. Die so entstandene frequenzverschobene Welle kann mithilfe eines geeigneten Bandpassfilters blockiert werden. In Abwesenheit des Steuersignals tritt keine Frequenzverschiebung auf und das Signal wird durchgelassen. Schalter auf der Grundlage der Vierwellenmischung
Ein Schalter, der auf der Vierwellenmischung (Abschnitt 22.3.4) in einer nichtlinearen optischen Faser basiert, ist in Abb. 24.57 dargestellt. Signal- (Eingangs-) und Steuerwellen mit den Frequenzen 𝜔1 bzw. 𝜔2 werden in die Faser eingespeist. Während ihrer gemeinsamen Ausbreitung erzeugen sie zwei neue Wellen mit den Frequenzen 𝜔3 und 𝜔4 , die die Bedingung 𝜔1 + 𝜔2 = 𝜔3 + 𝜔4 der Vierwellenmischung erfüllen, wobei sowohl die Signal- als auch die Steuerwelle entleert werden. Das System ähnelt einem optischen parametrischen Verstärker mit entleerter Pumpe, bei dem die beiden ankommenden Wellen als Pumpen wirken. Dieser Effekt Eingang ω 1
Ausgang ω1 Filter HNLF
Steuerung ω 2
ω 1ω 3ω 4ω 2
Abb. 24.57 Ein volloptischer 1 × 1-Schalter auf der Grundlage der Entleerung der Signalwelle, die durch Vierwellenmischung in Gegenwart der Steuerwelle in einer stark nichtlinearen Faser verursacht wird.
kann auch als Beispiel für Kreuzgewinnmodulation aufgefasst werden. Das Ausmaß der Entleerung kann durch Variation der Leistung der ankommenden Wellen eingestellt werden. In Abwesenheit der Steuerwelle tritt die Signalwelle ohne nennenswerten Verlust aus, da der parametrische Wechselwirkungsprozess nicht stattfinden kann. Solitonschalter
Optische Solitonen sind ultrakurze Pulse, die sich in nichtlinearen dispersiven optischen Fasern ausbreiten, ohne sich zu verbreitern (siehe Abschnitt 23.5.2). Ein volloptischer Solitonschalter kann realisiert werden, indem man ein optisches Soliton verwendet, um den Weg eines zweiten zu steuern. Die Wechselwirkung zwischen den beiden Solitonen kann in einer Kollision oder einer Rekombination zu einem Vektorsoliton bestehen. In jedem Fall wird eine optische Eigenschaft des Eingangssolitons durch die Wechselwirkung verändert, und diese geänderte Eigenschaft bewirkt das Routing. Solitonenstoß-Schalter
Wenn zwei Solitonen mit geringfügig unterschiedlichen Frequenzen und folglich geringfügig unterschiedlichen Gruppengeschwindigkeiten kollidieren, d. h. einander kreuzen, werden die Ankunftszeit und die Phase beider Solitonen verändert. Einer der Pulse dient als Steuerpuls und der andere als Signalpuls. Für das Routing des Signalpulses wird entweder die Zeitverzögerung oder die Phasenverschiebung aufgrund des Stoßes mit dem Steuerpuls verwendet. Zeitbasiertes Routing wird mithilfe eines optischen Gatters erreicht, das sich während eines vorgegebenen Zeitfensters öffnet; phasenbasiertes Routing ist mithilfe eines Interferometers möglich. Vektorsoliton-Schalter
Ein Vektorsoliton besteht aus zwei orthogonal polarisierten optischen Pulsen, die sich gemeinsam durch eine nichtlineare doppelbrechende Faser ausbreiten. Da beide Pulse vorhanden sein müssen, damit sich das Vektorsoliton bildet, kann das System als optischer Schalter verwendet werden, in dem der eine Puls dazu dient, den anderen zu steuern. Zwei Pulse mit orthogonalen Polarisationen breiten sich in einer doppelbrechenden Faser mit geringfügig unterschiedlichen Gruppengeschwindigkeiten aus und laufen daher zeitlich auseinander; man bezeichnet dieses Phänomen als Walk-Off-Effekt (siehe Abschnitt 23.5.1). Wenn die Faser auch nichtlinear ist, bewirkt Kreuzphasenmodulation (siehe Abschnitt 22.3.3) eine Summenfrequenzerzeugung in einem Puls und eine Differenzfrequenzerzeugung im anderen. Wegen
24.3 Photonische Schalter
Vektorsoliton Eingang λ
λ + δλ
schnell λ
Steuersignal
I2
λ − δλ
langsam
Filter
λ − δλ
Abb. 24.58 Ein faseroptischer volloptischer Vektorsoliton-Schalter.
doppelbrechende nichtlineare Faser
der Gruppengeschwindigkeitsdispersion geht damit eine Änderung der Gruppengeschwindigkeiten einher. Wenn die Differenz der Gruppengeschwindigkeiten aufgrund von Doppelbrechung genau durch die Gruppengeschwindigkeitsdispersion (über die Kreuzphasenmodulation) kompensiert wird, breiten sich die beiden Pulse wie ein einziges Vektorsoliton gemeinsam aus; man bezeichnet diesen Effekt als Soliton Trapping. Wie in Abb. 24.58 dargestellt wird in einem 1 × 1Solitonschalter einer der beiden orthogonal polarisierten Pulse als Steuerpuls und der andere als Signal benutzt, das transmittiert oder geblockt wird. Wenn die beiden Pulse dieselbe Wellenlänge 𝜆 haben, dann bilden sie bei ihrer Ausbreitung durch die nichtlineare doppelbrechende Faser ein Vektorsoliton mit verschobenen Wellenlängen 𝜆 ± δ𝜆 der beiden Komponenten. Eine dieser Komponenten wird durch ein Filter selektiert und bildet den Ausgang des Schalters. Ohne den Steuerpuls bildet sich das Vektorsoliton nicht und die Wellenlänge wird nicht verschoben, sodass das Licht durch das Filter geblockt wird. Schalter auf der Basis von photonischen Kristallen und plasmonische Schalter
Der optische Kerreffekt kann auch in verschiedenen volloptischen Schaltern auf der Grundlage von photonischen Kristallen und plasmonischen Nano- und Mikrostrukturen ausgenutzt werden. In diesen Bauelementen ändert das Steuerlicht den Brechungsindex des dielektrischen Materials, wodurch eine Eigenschaft der Struktur verändert wird, durch die sich das Signallicht ausbreitet. Als Ergebnis wird das Licht entweder durchgelassen (ein-Zustand) oder blockiert (aus-Zustand). Schalter auf der Grundlage von photonischen Kristallen
Wie in Abschnitt 7.2 diskutiert sind photonische Kristalle periodische Strukturen, die durch photonische Bandlücken gekennzeichnet sind, d. h. Frequenzbänder, in denen sich Licht nicht ausbreiten kann. Die Bandlücken können durch eine Änderung des Brechungsindex des Materials verschoben werden. Für die Anwendung in Schaltern wird die Struktur so gewählt, dass die Frequenz des Signallichts in Abwesenheit des Steuerlichts innerhalb der Bandlücke liegt, aber in der Nähe ihrer Kante, sodass das Licht sich nicht ausbreiten kann (der
Schalter sich folglich im aus-Zustand befindet). Wenn nun das Steuerlicht angelegt wird, wird die Bandlücke verschoben, sodass die Frequenz des Signallichts nicht mehr innerhalb der Bandlücke liegt und das Licht sich ausbreiten kann – der Schalter befindet sich nun im ein-Zustand. Alternativ kann ein volloptischer Schalter auch unter Verwendung eines photonischen Kristalls realisiert werden, der aus einem durch einen Gitterdefekt entstandenen Nanohohlraum besteht. Da die Resonanzfrequenz der Moden des Nanohohlraums vom Brechungsindex des Materials abhängt, kann sie durch das Steuersignal verändert werden. Ob das optische Signal dann in den Hohlraum eingekoppelt wird oder nicht, hängt davon ab, ob seine Frequenz mit der Resonanzfrequenz des Hohlraums übereinstimmt oder nicht. Experimentell wurden volloptische Schalter auf der Grundlage von photonischen Kristallen mit Reaktionszeiten im Subpikosekundenbereich und Pumpleistungen von einigen kW∕cm2 realisiert. Plasmonische Schalter
Die Resonanzfrequenz eines Oberflächenplasmonpolaritons hängt empfindlich von der Permittivität des angrenzenden dielektrischen Materials (Abschnitt 8.2.2) ab, die über den optischen Kerreffekt durch ein Steuersignal verändert werden kann. Der Schalter befindet sich im aus-Zustand, wenn das Signallicht an die OPPMode gekoppelt ist und seine Frequenz mit der der OPP-Mode übereinstimmt. Im anderen Fall breitet sich das Signal ungehindert aus (ein-Zustand). Volloptische plasmonische Schalter eignen sich für integriert-photonische Realisierungen und bieten Reaktionszeiten im Subpikosekundenbereich, die nur durch die Relaxationszeit der plasmonischen Resonanz begrenzt sind. Typische Ausbreitungsentfernungen in OPP-Wellenleitern sind jedoch aufgrund von metallischen Verlusten eher kurz. Schaltzeit
Die Schaltzeit eines volloptischen Schalters ist durch die Dauer des optischen Steuerpulses und die Reaktionszeit des nichtlinearen Prozesses, der für den Schaltvorgang verantwortlich ist, begrenzt. Da ultrakurze optische Impulse mit einer Dauer von wenigen Femtosekunden (einige optische Zyklen) problemlos verfügbar
899
900
24 Optische Verbindungen und Schalter
sind, setzt der viel langsamere nichtlineare Wechselwirkungsprozess die endgültige Grenze für die Schaltzeit, die stark von dem für den Schalter verwendeten Material abhängt. Halbleiter wie GaAs, InSb, InAs und CdS zeigen als Folge von excitonischen Effekten bei Wellenlängen in der Nähe der Bandkanten starke optische Nichtlinearitäten. Ihre Einschaltzeiten liegen typischerweise in der Größenordnung von einigen Pikosekunden, während ihre Ausschaltzeiten, die von der relativ langsamen Trägerrekombination dominiert werden, typischerweise bis zu hundert Pikosekunden betragen. OHV-Schalter auf der Grundlage der Kreuzgewinnmodulation oder der Kreuzphasenmodulation sind in ähnlicher Weise durch die grundsätzlich langsame Erholungszeit des Verstärkergewinns begrenzt und zeigen Ausschaltzeiten im Bereich von 10–100 ps. Im Gegensatz dazu haben Schalter auf der Grundlage der Kreuzphasenmodulation oder der Vierwellenmischung in stark nichtlinearen optischen Fasern weitaus kürzere Antwortzeiten, typischerweise unter 100 fs. Auch Schalter auf der Basis von Solitonen arbeiten mit Schaltzeiten von weniger als einer Pikosekunde. Die Asymmetrie des zeitlichen Verhaltens der nichtlinearen Effekte in Halbleitern (kurze Anstiegszeit beim Einsetzen des optischen Steuerpulses, aber viel längere Abklingzeit nach dem Entfernen des Pulses) kann bei der Konstruktion von Schaltern ausgenutzt werden, deren Schaltzeiten durch die kurze Anstiegszeit und nicht durch die lange Abklingzeit begrenzt sind, wie Beispiel 24-2 erläutert. Beispiel 24-2: Nichtlineares asymmetrisches Sagnacinterferometer als ultraschneller Schalter
Die Antwortzeit der Kreuzphasenmodulation in einem nichtlinearen optischen Material dritter Ordnung ist durch eine kurze Anstiegszeit und eine längere Abklingzeit charakterisiert. Größere Schaltgeschwindigkeiten können durch eine interferometrische Anordnung erreicht werden, in der beide Zweige des Interferometers dasselbe nichtlineare Element enthalten, das der zu schaltende Lichtpuls zu verschiedenen Zeiten durchläuft. Diese Anordnung kann durch ein faseroptisches Sagnacinterferometer mit einem nichtlinearen optischen Element an einer asymmetrischen Position innerhalb der Faserschleife realisiert werden, wie in Abb. 24.59 illustriert ist. Wenn ein optischer Puls durch Eingang 1 in die Schleife eintritt, wird er durch einen symmetrischen Koppler in einen Puls im Uhrzeiger- und einen im Gegenuhrzeigersinn mit gleichen Amplituden aufgespalten. Wenn die beiden Pulse auf ihrem Umlauf durch die Schleife
dieselbe Phasenverschiebung erfahren, werden sie wieder vereint, kehren in dieselbe Faser zurück und treten aus dem Ausgang 1 aus. Wenn sie jedoch eine relative Phasenverschiebung von π erfahren, treten sie nach ihrer Vereinigung in die andere Faser ein und verlassen das System durch Ausgang 2. Das sind die beiden Zustände eines 1 × 2-Schalters. Das nichtlineare Element wird durch einen kurzen optischen Steuerpuls kontrolliert, der dessen Brechungsindex um Δ𝑛 ändert. Diese Änderung baut sich in einer kurzen Anstiegszeit 𝜏i auf und klingt mit einer viel längeren Relaxationszeit 𝜏r ab. Da das nichtlineare Element an einer unsymmetrischen Position innerhalb der Faserschleife liegt, durchqueren die beiden Pulse es zu verschiedenen Zeiten 𝜏1 und 𝜏2 . Wenn beide Pulse das nichtlineare Element durchqueren, wenn es aktiv ist, d. h. während die volle Änderung Δ𝑛 gilt, erfahren sie dieselbe Phasenverschiebung, und der wiedervereinigte Puls wird in Faser 1 geleitet. Dasselbe gilt, wenn beide Pulse das nichtlineare Element durchqueren, während es inaktiv ist. Wenn jedoch ein Puls auf das Element trifft, während es aktiv ist, und der andere, wenn es inaktiv ist, so erfahren sie unterschiedliche Phasenverschiebungen. Wenn ihre Phasendifferenz nach der Schleife gleich π ist, wird der Puls in Faser 2 geleitet und tritt durch Ausgang 2 aus dem System aus. Die Schaltung wird daher durch die Zeitdifferenz 𝜏1 − 𝜏2 bestimmt, die proportional zur Entfernung des nichtlinearen Elements vom Mittelpunkt der Faserschleife ist. Wenn 𝜏1 − 𝜏2 etwas größer ist als die Anstiegszeit 𝜏i , wird die Schaltung durch die Anstiegszeit anstelle der vollen Antwortzeit 𝜏r beschränkt. Auf diese Weise wurden Schaltzeiten im Femtosekundenbereich erreicht, sodass der Schalter mit Terahertzgeschwindigkeiten betrieben werden kann. Ein solcher Schalter wurde für das Zeitmultiplexing verwendet; er ist als optischer asymmetrischer Terahertz-Demultiplexer bekannt. 1)
Schaltenergie
Die Schalteenergie E = TA𝐼S ist das Produkt aus der Schaltzeit T , der von dem Steuerlicht beleuchteten Schalterfläche A und der Intensität 𝐼S des Steuerlichts. Wie bereits erwähnt, ist die minimale Schaltzeit durch die Reaktionszeit des nichtlinearen Prozesses begrenzt, der dem Schaltvorgang zugrunde liegt. Die beleuchtete Schalterfläche ist letztlich durch Beugungseffekte
1) Siehe J. P. Sokoloff, P. R. Prucnal, I. Glesk, M. Kane, ‚A Terahertz Optical Asymmetric Demultiplexer (TOAD)‘, IEEE Photonics Technology Letters 5, 787–790, 1993.
24.3 Photonische Schalter
nichtlineares Element
symmetrischer Koppler Eingang
∆n
ti
Ausgang 1
Faser 1
τ1 τ2
Faser 2
1
t ∆n
τ1
τ1 τ2
τ2
Ausgang 2
1
Faserschleife
Steuersignal
t
1
∆n τ1 τ2
t
1
2
1
Abb. 24.59 Ein volloptisches nichtlineares asymmetrisches Faser-Sagnacinterferometer als 1 × 2-Schalter. Der Schalter wird von einem optischen Puls gesteuert, der eine Brechungsindexänderung Δn in einem nichtlinearen Element hervorruft, das sich an einer asymmetrischen Position innerhalb der Interferometerschleife befindet. Der Eingangspuls aus Faser 1 wird in einen Puls im Uhrzeigersinn und
einen Puls im Gegenuhrzeigersinn aufgespalten, die das nichtlineare Element zu verschiedenen Zeiten durchlaufen. Der Schalter ändert die Verbindung von Ausgang 1 zu Ausgang 2, wenn einer dieser Pulse kurz vor und andere gerade nach dem Beginn von Δn ankommt. Das ruft eine Phasendifferenz von π hervor, in deren Folge der Puls zu Ausgang 2 umgeleitet wird.
bestimmt, die es schwierig machen, optische Leistung in Bauelemente ein- und auszukoppeln, deren Abmessungen kleiner als eine Lichtwellenlänge sind. Wenn T und A in diesem Sinn minimiert werden, kann eine weitere Verringerung der Schalteenergie E erreicht werden, indem ein Material mit einer stärkeren Nichtlinearität verwendet wird, d. h. ein Material, das für den Betrieb mit einem hohen Wirkungsgrad eine geringere Intensität 𝐼S benötigt. Bestimmte Anordnungen wie beispielsweise jene, die auf Hohlraumresonator-verstärkten nichtlinearen Wechselwirkungen beruhen, können die effektive Nichtlinearität verbessern, haben jedoch den Nachteil, dass sie gleichzeitig die Reaktionszeit verlängern. Im Extremfall T = 10 fs und A = 1 μm2 erfordert der Betrieb mit einer kleinen Schalteenergie E = 1 fJ eine Intensität 𝐼S = 1 kW∕cm2 des Steuerstrahls, was für konventionelle nichtlineare Materialien ein moderater Wert ist. Die Schaltenergie von GaAs-Bauelementen liegt typischerweise im Bereich von 1–10 pJ, kann aber zumindest im Prinzip bis in den fJ-Bereich reduziert werden. Optische Verstärker auf InGaAsP-Basis können mit Schaltenergien von weniger als 1 fJ betrieben werden, allerdings auf Kosten von Schaltzeiten von einigen hundert ps. Auch Schalter auf der Grundlage von Solitonen in Wellenleitern wurden auch mit Schaltenergien im Bereich von einigen zehn pJ realisiert.
tonenzahl n jedoch stochastisch ist. Wenn das Licht von einem Laser oder einer LED stammt, ist die Photonenzahl n poissonverteilt mit dem Mittelwert n = 100 und √ der Breite n = 10, wie in Abschnitt 13.2.3 diskutiert. Wenn der Schalter so ausgelegt ist, dass er aktiviert wird, sobald ein fester Schwellenwert von Photonen empfangen wird, besteht immer eine endliche Wahrscheinlichkeit, dass die tatsächliche Anzahl von nachgewiesenen Photonen unter dieser Schwelle bleibt und der Schalter versagt. Diese Art von Schaltfehler kann durch Verwendung größerer Schaltenergien reduziert werden. Eine Schalteenergie E = 1 fJ entspricht beispielsweise einer größeren mittleren Photonenzahl n = 5000 und einer (relativ betrachtet) kleineren Unsicherheit von ≈ 70 Photonen. In diesem Fall ist die Wahrscheinlichkeit eines Schaltfehlers sehr gering, der Schalter wird praktisch immer wie gewünscht aktiviert.
Das Quantenlimit
Letztlich wird die minimale Schaltenergie durch die Photonennatur des Lichts und dessen inhärente Unbestimmtheit begrenzt, die sich insbesondere bei kleinen Energien manifestiert. Eine Schaltenergie E = 20 aJ entspricht beispielsweise bei 𝜆0 = 1 μm einer mittleren Photonenzahl n = E ∕ℎ𝑣 = 100, wobei die tatsächliche Pho-
Wärmeabfuhr
Eine wichtige praktische Einschränkung aller volloptischen Schalter hängt mit der Schwierigkeit zusammen, die durch den Schaltvorgang erzeugte Wärme abzuführen. Diese Beschränkung wird besonders dann relevant, wenn der Schaltvorgang mit der maximal möglichen Schaltgeschwindigkeit wiederholt wird. Für eine Schaltenergie E , eine Schaltzeit T und eine maximale Geschwindigkeit von T ∕2 Schaltvorgängen pro Sekunde wird pro Sekunde eine Gesamtenergie E ∕2T umgesetzt. Für sehr kurze Schaltzeiten und große Schaltenergien kann diese Leistung sehr groß werden. Die Abführung der Wärme setzt daher eine Grenze, die Kombinationen aus sehr kurzen Schaltzeiten und sehr großen Schaltenergien praktisch unmöglich macht. Allerdings werden thermische Effekte weniger einschränkend, wenn das Bauelement mit einer kleineren als der maximalen
901
902
24 Optische Verbindungen und Schalter
Wiederholungsgeschwindigkeit betrieben wird, weil die Energie eines Schaltvorgangs dann mehr Zeit für die Dissipation hat. Ein kritischer Punkt im Hinblick auf die praktische Anwendung von photonischen Schaltern ist die Frage, ob sie einfach in großen Arrays auf einem einzelnen Chip herstellbar sind. Auch hier kann die Wärmeabgabe ein begrenzender Faktor sein. Für ein Array aus N Schaltern pro Flächeneinheit beträgt die gesamte Leistungsdichte, die abgeführt werden muss, NE ∕2T . Wenn wir beispielsweise eine Anordnung von 100 × 100 Schaltelementen auf einem GaAs-Chip mit einer Fläche von 1 cm2 betrachten, so ist N = 104 cm−2 . Für eine Schalteenergie E = 1 pJ und eine Schaltzeit T = 50 ps beträgt die abzuführende Leistung NE ∕2T = 100 W∕cm2 , was wärmetechnisch beherrschbar ist. Ein solcher Chip kann N ∕2T = 1014 Schaltvorgänge pro Sekunde ausführen, was im Vergleich zu elektronischen Supercomputern ein großer Wert ist.
24.3.4
Wellenlängenempfindliche Schalter
Alle bis jetzt beschriebenen Schalter waren räumliche Schalter, d. h. sie stellen Übertragungswege her, auf denen optische Strahlen sich zwischen spezifischen Orten (den Ein- und Ausgängen des Schalters) ausbreiten. Ihre logischen Gegenstücke im Wellenlängenbereich sind wellenlängenempfindliche Schalter, die durch die folgenden Beispiele illustriert werden. Beispiel 24-3: Konfigurierbare Wellenlängenselektion
Ein Beispiel eines optischen Bauelements aus einer Kombination von passiven Wellenlängenroutern und räumlichen Schaltern ist der in Abb. 24.60 dargestellte Wellenlängenselektor. Dieser Schalter selektiert eine oder mehrere Wellenlängen aus einem ankommenden Strahl aus 𝑁 Wellenlängen. Er benutzt einen Demultiplexer (DEMUX), um die 𝑁 Wellenlängenkomponenten aufzuteilen, eine Anordnung von 𝑁1 × 1-Schaltern, um die gewünschten Wellenlängen zu selektieren, und einen Multiplexer (MUX), um den Ausgangsstrahl zusammenzusetzen, wie Abb. 24.60 zeigt.
λ1 λ2
λ1 , λ2 . . . λN
λ1 , λ2 . . . λN
λN DEMUX
1x1-Schalter
MUX
Abb. 24.60 Ein konfigurierbarer Wellenlängenselektor.
Beispiel 24-4: Konfigurierbarer optischer Add/DropMultiplexer
Ein konfigurierbarer optischer Add/Drop-Multiplexer ist ein Bauelement, das Komponenten mit bestimmten Wellenlängen zu einem Strahl hinzufügen, aus ihm entfernen oder sie einfach durchleiten kann, wie Abb. 24.61 illustriert. Es verwendet einen Demultiplexer (DEMUX), einen Multiplexer (MUX) sowie pro Add/Drop-Kanal einen 1 × 2- und einen 2 × 1-Schalter. Ein solches Bauelement ist der zentrale Baustein von Wellenlängenmultiplexsystemen (Abschnitt 25.3.3). Es entscheidet für jede Wellenlänge in einer eingehenden optischen Faser, ob sie durchgelassen oder zu einer Dropfaser gelenkt wird, die sie an ein besonderes Ziel oder einen anderen Knoten im Netzwerk führt. Die Daten in der so verworfenen Wellenlänge können durch neue Daten aus einer anderen Faser ersetzt werden. Die in frühen Glasfasernetzen eingesetzten Add/Drop-Multiplexer verwendeten Beugungsgitter als Demultiplexer und Multiplexer sowie Arrays von durchlässigen Flüssigkristall-Verschlüssen als Schalter. Diese Anordnungen sind bidirektional und verarbeiten Datenverkehr in beiden Richtungen. Die in moderneren und größeren Netzwerken eingesetzten Add/Drop-Multiplexer beruhen auf wellenlängenbasierten Verbindungen zwischen drei oder mehr sich kreuzenden Glasfaserwegen. Die Vermittlung der Verbindungen erfordert dann einen wellenlängenselektiven 𝑁 × 𝑁-Schalter, der häufig durch ein Array von 𝑁1 × 𝑁-Schaltern auf der Basis von metallischen Mikrospiegeln oder beugenden Arrays von Flüssigkristallzellen realisiert wird.
Beispiel 24-5: Wellenlängenkanalwechsel
Ein Wellenlängenkanalwechsler, auch 𝝀-Schalter genannt, tauscht Daten zwischen verschiedenen Wellenlängenkanälen in demselben optischen Strahl aus. Ein 𝑁 × 𝑁-Wellenlängenkanalwechsler kann realisiert werden, indem die Wellenlängenkanäle durch einen Demultiplexer in den Raumbereich abgebildet werden, die Wellenlängen durch eine Anordnung von 𝑁 Wellenlängenwandlern konvertiert werden, und die Kanäle anschließend durch einen 𝑁 × 1-Koppler zu einem einzigen Strahl vereinigt werden, wie Abb. 24.62 illustriert. Ein Wellenlängenwandler ändert die Wellenlänge eines Strahls, ohne die darin enthaltenen Daten zu verändern, d. h. er „kopiert“ die Daten von einem Wellenlängenkanal in einen anderen.
24.3 Photonische Schalter
λ1 λ2 λ3
λ1 λ2 λ3
λ1, λ2, . . . λN
Durchleitung
λi
DEMUX
Drop
λ3
...
λN
MUX
Add λN λ3 λ1 . . . λ2
λ1 λ2 λ3 . . . λN
. . . λ1 λ2
λ1, λ2 , . . . λN
λi Schalter λi
Schalter λi
Abb. 24.61 Konfigurierbarer optischer Add/Drop-Multiplexer.
DEMUX
. . .
WC
MUX
λ1
λ2 λ3
...
λN
Abb. 24.62 Ausführung eines Wellenlängenkanalwechslers. In diesem Beispiel werden die Daten aus dem Wellenlängenkanal 2 im Eingang in den Wellenlängenkanal 3 am Ausgang kopiert. Die kleinen grauen und weißen Quadrate stellen hier die Datenbits dar. Dieser Schalter verwendet einen Wel-
lenlängendemultiplexer zur Auftrennung der Wellenlängen und leitet die Wellenlängenkanäle anschließend zu einer Anordnung von Wellenlängenwandlern. Ein N × 1-Koppler vereinigt die Kanäle dann wieder zu einem einzigen Strahl.
Mehrdimensionale räumliche und wellenlängenselektive Schalter
Die zweite Ausführung verwendet zwei Sätze von Wellenlängenwandlern mit einem zwischengeschalteten Wellenlängen-Gitterrouter, wie Abb. 24.63(b) zeigt. Der erste Wellenlängenwandler wandelt die Wellenlängen so um, dass sie die Beugungsbedingung Gl. (24.18) für die gewünschten Bestimmungsorte erfüllen. Die zweite Variante mit dem Wellenlängen-Gitterrouter ist effizienter als die erste, da diese an der Filterbank einen beträchtlichen Teil der Leistung verschwendet. Die erste Variante hat dafür den Vorteil, dass sie konfiguriert werden kann.
Die vorherigen Beispiele von Wellenlängenbereichsschaltern betrafen alle einen einzelnen optischen Strahl mit mehreren Wellenlängenkanälen. Optische Schalter sind aber auch für mehrere Strahlen mit jeweils mehreren Wellenlängenkanälen möglich. Wir betrachten als Beispiel das Schalten von 𝑁 Strahlen mit je einem von 𝑁 Wellenlängenkanälen. Der Schalter verteilt die Wellenlängenkanäle unter den Strahlen um. Zwei mögliche Realisierungen sind in Abb. 24.63 gezeigt. Die erste Variante verwendet einen Router, um die Wellenlängenkanäle zu unterschiedlichen Ausgängen zu leiten. Dazu wird ein Sternkoppler verwendet, der den Inhalt aller 𝑁 Strahlen auf eine Reihe von Wellenlängenfiltern lenkt, von denen jedes auf einen einzigen Wellenlängenkanal abgestimmt ist [Abb. 24.63(a)]. Für die weitere Verarbeitung werden die Wellenlängen der vertauschten Kanäle anschließend durch eine Anordnung von Wellenlängenwandlern (WC) wieder in die ursprünglichen Wellenlängen umgewandelt (ohne Änderung ihres Dateninhalts).
λ1 λ2 λ3 . . . λN (a)
λN λ3 λ1 . . . λ2 Sternkoppler abstimm- WC bare Filter
λ1 λ2 λ3 . . . λN
Realisierungen von Wellenlängenwandlern
Ein Wellenlängenwandler wandelt Daten, die ein optischer Strahl bei einer bestimmten Wellenlänge überträgt, in eine andere Wellenlänge um. Die Wellenlängen sind oft Kanäle eines faseroptischen Wellenlängenmultiplex-Nachrichtensystems (siehe Abschnitt 25.3.3), und ihr Abstand ist gering, da sie in demselben Band liegen. Wellenlängenwandler werden auf der Grundlage von parametrischen oder nichtparametrischen nichtlinearen optischen Bauelementen (ähnlich den in Abschnitt 24.3.3 für volloptische Schalter besprochenen) realisiert. λN λ3 λ1 . . . λ2
λ1 λ2 λ3 . . . λN
WC
λ1 λ2 λ3 . . . λN
WGR
(b)
WC
Abb. 24.63 (a) Raumwellenlängenschalter mit Filterbank. (b) Raumwellenlängenschalter mit Wellenlängen-Gitterrouter.
903
24 Optische Verbindungen und Schalter
Gewinn
904
Intensität I1
ω2 ω1
ω2
Mach-Zehnder-Interferometer
ω2
OHV
ω2 ω1
(a)
ω0 ω1
(c)
(b)
Abb. 24.64 Wellenlängenwandlung. Die Daten werden von einem Strahl der Frequenz 𝜔1 auf einen Strahl der Frequenz 𝜔2 übertragen. (a) Kreuzgewinnmodulation in einem optischen Halbleiterverstärker. (b) Kreuzphasenmodulation in einem Halbleiter. Die Phasenmodulation des umgewandel-
nichtlineare Faser ω 2
ten Strahls wird in einem Mach-Zehnder-Interferometer eine Intensitätsmodulation umgewandelt. (c) Teilweise entartete Vierwellenmischung in einem nichtlinearen Medium dritter Ordnung unter Verwendung einer Hilfswelle der Frequenz 1 𝜔0 = (𝜔1 + 𝜔2 ). 2
Wellenlängenwandler auf der Grundlage von optischen Halbleiterverstärkern
In nichtparametrischen Wellenlängenwandlern verändert die Intensität des ersten Strahls, der die Daten trägt, eine optische Eigenschaft eines Mediums wie z. B. den Gewinnkoeffizienten, den Absorptionskoeffizienten oder den Brechungsindex eines Halbleiters proportional zu seiner Intensität, sodass die Daten in das Medium „geschrieben“ werden. Wenn ein zweiter Strahl mit einer unterschiedlichen Wellenlänge durch das Medium hindurchtritt, wird er durch diese veränderte Eigenschaft moduliert, sodass die Daten „gelesen“ und auf den zweiten Strahl übertragen werden. Ein Beispiel ist der Prozess der Kreuzgewinnmodulation in einem gesättigten optischen Halbleiterverstärker, dessen Gewinn eine abnehmende Funktion der Intensität ist, wie Abb. 24.64(a) zeigt. Wenn der ursprüngliche intensitätsmodulierte Strahl durch das Medium hindurchtritt, wird der Gewinn mit der zugehörigen inversen Funktion moduliert, und dasselbe gilt folglich für die Intensität des Lesestrahls. Ein anderes Beispiel ist die Kreuzphasenmodulation in einem ungesättigten optischen Halbleiterverstärker, dessen Brechungsindex durch den Schreibstrahl moduliert werden kann, da er von der Ladungsträgerdichte abhängt. Der Lesestrahl wird daher phasenmoduliert. Um die Phasenmodulation in eine Intensitätsmodulation umzuwandeln, ist ein Interferometer erforderlich, wie Abb. 24.64(b) zeigt. Parametrische Wellenlängenwandler
In einem Wellenlängenwandler auf der Grundlage einer parametrischen Wechselwirkung werden Strahlen mit unterschiedlichen Wellenlängen durch einen nichtlinearen Effekt gekoppelt. In einem nichtlinearen Medium zweiter Ordnung (Abschnitt 22.2) kann beispielsweise eine Welle der Frequenz 𝜔1 durch eine Hilfswelle der Frequenz 𝜔3 in eine Welle mit der Differenz-
frequenz 𝜔2 = 𝜔3 − 𝜔1 umgewandelt werden. Die Amplitude der Differenzwelle ist mit der der Originalwelle verknüpft, sodass die im Betrag oder der Phase der Originalwelle codierten Daten auf die Differenzwelle übertragen werden. Das Hauptproblem bei dieser Dreiwellenmischung ist, dass die Frequenz 𝜔3 der Hilfswelle für nahe beieinander liegende Frequenzen 𝜔1 und 𝜔2 ungefähr doppelt so groß wie diese sein muss. Wenn nur Wellen von etwa gleichen Frequenzen verwendet werden sollen, können kaskadierte parametrische nichtlineare Prozesse verwendet werden. Der erste Prozess ist dabei eine Frequenzverdopplung, bei der 𝜔1 in 2𝜔1 umgewandelt wird, und der zweite ist eine Dreiwellenmischung, die durch Differenzfrequenzerzeugung eine Welle der Frequenz 𝜔2 = 2𝜔3 − 𝜔1 erzeugt. Jetzt haben alle drei Wellen ungefähr dieselbe Frequenz. Alternativ kann auch eine Vierwellenmischung in einem nichtlinearen Medium dritter Ordnung wie z. B. einer optischen Faser genutzt werden [siehe Abb. 24.64(c)]. Wie in Abschnitt 22.3 beschrieben werden bei einem solchen Prozess vier Wellen gemischt, deren Frequenzen die Beziehung 𝜔1 + 𝜔2 = 𝜔3 + 𝜔4 erfüllen. Bei teilweiser Entartung ist 𝜔3 = 𝜔4 = 𝜔0 und daher 𝜔2 = 2𝜔0 − 𝜔1 .
24.3.5
Zeitbereichsschalter
Ein Zeitbereichsschalter dirigiert Signale zwischen Zeitfenstern (siehe Abb. 24.65). In digitalen Nachrichtensystemen wird ein Signal in eine Folge von Paketen gleicher Dauer geteilt, die aus jeweils 𝑁 Zeitfenstern bestehen, die die Daten enthalten. Ein Beispiel eines Zeitbereichsschalters ist der Zeitfensterwechsler, der die Daten aus dem 𝓁-ten Zeitfenster eines Pakets in das 𝑚-te Zeitfenster desselben Pakets überträgt; das entspricht dem Wellenlängenkanalwechsel aus Beispiel 24-5. Zweidimensionale Raum-Zeit-Schalter bestehen aus einer Kombination von Zeitbereichs- und Raumbe-
24.3 Photonische Schalter
1 2 3
N
2
1
...
...
1 2 3
3
...
N
N
(a)
1
t
2
3
...
N
t
(b)
Abb. 24.65 Die Entsprechung zwischen Zeit- und Raumbereichsschaltern. (a) Raumbereichsschalter. In diesem Beispiel werden die Daten aus Kanal 2 in Kanal 3 kopiert. (b) Zeitbereichsschalter für einen Zeitfensterwechsel. In dem Beispiel werden die Daten aus Zeitfenster 2 in das Zeitfenster 3 desselben Pakets kopiert. Abb. 24.66 Zeit-Raum-ZeitSchalter.
t
t
Zeitschalter
t
Raumschalter
t
Zeitschalter
zweiten Puls zum zweiten Ausgang und so weiter. Ein solcher Schalter kann aus einem räumlichen 1 × 𝑁Schalter konstruiert werden, der den Eingang nacheinander mit jedem seiner vier Ausgänge verbindet. Die Umkehrung des Zeitdemultiplexers, der Zeitmultiplexer, verschachtelt Pulse aus 𝑁 getrennten Eingängen zu einer einzigen Folge von Pulsen. Dieser inverse Betrieb wird ebenfalls durch Abb. 24.67 veranschaulicht, wenn man sich einfach die Ein- und Ausgänge vertauscht denkt; d. h. die Pulse breiten sich dann von rechts nach links anstatt von links nach rechts aus. Ein 1 × 𝑁-Zeitdemultiplexer kann aus 𝑁1 × 1-ein-ausSchaltern aufgebaut werden, die wie in Abb. 24.34(a) dargestellt durch ein Steuersignal von einer Uhr nacheinander ein- und ausgeschaltet werden.
reichsschaltern. Ein solcher Schalter verbindet eine Reihe von Eingangskanälen, von denen jeder ein digitales Signal aus einer Folge von Zeitfenstern trägt, mit einem entsprechenden Satz von Ausgangskanälen. Die Daten aus allen Zeitfenstern in allen Eingangskanälen werden nach einer bestimmten Vorschrift in ein oder mehrere Zeitfenster in einem oder mehreren Ausgangskanälen übertragen. Ein Beispiel ist der Zeit-Raum-ZeitSchalter aus einer Kaskade eines Zeitfensterwechslers, eines Raumschalters und eines weiteren Zeitfensterwechslers, der in Abb. 24.66 schematisch dargestellt ist. Zeitmultiplexing und -demultiplexing
Ein einfaches Beispiel für einen Raum-Zeit-Schalter ist der Zeitdemultiplexer. Er besitzt einen Eingang und 𝑁 Ausgänge, wobei 𝑁 die Zahl der Zeitfenster in jedem Paket ist. Der Schalter leitet Daten aus dem 𝓁-ten Zeitfenster des Eingangs in das 𝓁-te Zeitfenster des 𝓁-ten Ausgangs (𝓁 = 1, 2, … , 𝑁). Dieser Prozess wird periodisch in allen Paketen wiederholt. Dieser Schalter entspricht daher einer Zeit-Raum-Abbildung. In dem in Abb. 24.67 gezeigten Zeitdemultiplexer gibt es z. B. 𝑁 = 4 Zeitfenster pro Paket, die Daten in Form von unterschiedlich starken Pulsen enthalten. Der Schalter leitet den ersten Puls zum ersten Ausgang, den
Optisches Zeitmultiplexing
Eine optische Realisierung des Zeitmultiplexings ist in Abb. 24.68(a) illustriert. Kopien des Eingangsstrahls werden durch eine Reihe von 𝑁 optischen 1 × 1-Schaltern geleitet, die von einer Reihe optischer Pulse aus einer um Vielfache der Zeitverzögerung 𝑇∕𝑁 verzögerten Uhr gesteuert werden, wobei 𝑇 die Periode der Pakete ist.
1 1
1 1
2
3
4
1
2
3
4
t 2
2 2
T Paket 1
t
3
t 3
3
t
4
Paket 2
4
4 Paket 1
Paket 2
t
Abb. 24.67 Zeitdemultiplexing für N = 4.
905
906
24 Optische Verbindungen und Schalter
optische Verzögerungen 1x1-Schalter
1x1-Schalter
T /4 T/2
Sternkoppler Uhr
T /4 T /4 T/4 optische Verzögerungen
Uhr
(a)
Sternkoppler
(b)
In einer anderen Variante werden Kopien des Eingangsstrahls nacheinander um Vielfache von 𝑇∕𝑁 verzögert, sodass die 𝑁 Eingangspulse zeitlich synchronisiert, aber räumlich getrennt werden; die 1 × 1Schalter werden von demselben Taktsignal gesteuert [Abb. 24.68(b)]. Das System ähnelt dem, das in Abschnitt 23.6.1) zur Messung des zeitlichen Profil eines optischen Pulses verwendet wurde (siehe Abb. 23.54). Optische Verzögerungen können durch Verwendung von optischen Fasern (näherungsweise 5 ns∕m für Quarzglasfasern) eingeführt werden. Die 1 × 1-Schalter können durch volloptische nichtlineare interferometrische Schalter optisch realisiert werden. Ein Beispiel ist der in Beispiel 24-2 beschriebene optische asymmetrische Terahertz-Demultiplexer. Optischer Zeitfensterwechsel
Der Zeitfensterwechsler (Abb. 24.65) ist ein Zeitbereichsschalter, der die Daten in den Zeitfenstern jedes Pakets auswechselt. Er kann beispielsweise durch eine Kombination von Raumschaltern und Raum-Zeit-Schaltern realisiert werden. Die in Abb. 24.69 gezeigte Anordnung verwendet zum Beispiel einen Zeitdemultiplexer, der die Zeitfenster in unterschiedliche Kanäle leitet (Zeit-Raum-Mapping). Anschließend werden Zeitverzögerungen eingeführt, um die Pulse in Zeitfenster der Dauer T ∕𝑁 zu synchronisieren, bevor sie in einen 𝑁 × 𝑁Kreuzverbinder (einen räumlichen Schalter) eintreten.
1 2
3 T/4
Sternkoppler
3 4
t
Abb. 24.68 Zeitdemultiplexing durch Sternkoppler, optische Zeitverzögerungen und optische 1 × 1Schalter. In diesem Beispiel ist N = 4.
DEMUX
Danach wird ein weiterer Satz von Zeitverzögerungen eingeführt, um die Pulse wieder in ihre ursprünglichen Zeitfenster zu sortieren, und schließlich vereinigt ein Zeitmultiplexer diese Zeitfenster wieder zu einem einzigen Signal (Raum-Zeit-Mapping). Programmierbare optische Zeitverzögerungen und Puffer
Steuerbare Zeitverzögerungen sind ein wesentlicher Bestandteil von Zeitbereichsschaltern. Puffer sind Speicherelemente, die Daten zwischenspeichern oder unterschiedliche Datenraten ausgleichen können. Wie wir in den Abb. 24.68 und 24.69 gesehen hatten, können solche Verzögerungen durch optische Fasern passender Länge (≈ 5 ns∕m) eingeführt werden. Programmierbare Verzögerungen können realisiert werden, indem man die optischen Pulse eine programmierbare Zahl von Umläufen in einer Faserschleife zurücklegen lässt. Wie Abb. 24.70 zeigt, kann das durch einen Koordinatenschalter erreicht werden, der den Puls zu einer definierten Zeit in die Schleife eintreten lässt und ihn nach einer vorgegebenen Zahl von Umläufen wieder freigibt.
24.3.6
Code- oder Paketschalter
Alle bis jetzt in diesem Abschnitt vorgestellten Schalter waren relationale Schalter, die je nach dem Zustand des Schalters, der von externen, von den eingehenden Daten unabhängigen Signalen gesteuert wird, Zuordnun-
3T/4 1
1
T/2 2
2
T
T/4 3
3
2T
4
4
Zeit–Raum Verzögerungen
Raumschalter
Abb. 24.69 Volloptische Umsetzung eines Zeitfensterwechsels.
3 MUX
Verzögerungen Raum–Zeit
1 4 2
t
24.3 Photonische Schalter
Verzögerung T
Verzögerung T
t+m
t +2
t+
Abb. 24.70 Programmierbarer Verzögerer aus einer Faserschleife und einem Koordinatenschalter. Zur Zeit t = 0 ist der Schalter über Kreuz geschaltet, sodass der optische Puls in die Schleife läuft. Zur Zeit t = T kehrt der Puls zum Eingang des Schalters zurück, der dann linear durchgeschaltet
ist, sodass der Puls einen weiteren Umlauf absolviert und eine zusätzliche Verzögerung T erhält. Zur Zeit t = mT wird der Puls wieder freigegeben, indem der Schalter über Kreuz geschaltet wird.
1 2
1
3
. ..
. ..
3 N
2
N
Schalter
Nutzdaten ...
Header
t
Paket
Verzögerung T
. ..
t
Verzögerung T
Headererkennung
Abb. 24.71 Pakete und Paketschalter.
gen zwischen den Ein- und Ausgängen vermitteln. Diese Art von Schaltern wird Leitungsschalter genannt. Im Unterschied dazu werden die sogenannten Paketschalter (oder Codeschalter) durch die in den Datenpaketen selbst enthaltenen Informationen gesteuert. Die Daten sind in Paketen organisiert, von denen jedes einen Header mit Informationen über den Bestimmungsort des Pakets sowie die eigentlichen Nutzdaten enthält, wie Abb. 24.71 illustriert. Der Paketschalter enthält einen Header-Decoder, der die Adressen liest und den Schalter mithilfe eines Steuersignals entsprechend schaltet. Der Header-Decoder stellt eine Korrelation zwischen der Bitfolge für die gewünschte Adresse im Header eines eingehenden Pakets und den Bitfolgen für jede der möglichen Adressen in einer Nachschlagetabelle her und identifiziert die Adresse mit der höchsten Korrelation. Wenn die Adresse des eingehenden Pakets beispielsweise durch die Bitfolge (𝑎1 , 𝑎2 , … , 𝑎𝑁 ) gegeben ist und die Bitfolge einer der Adressen in der Tabelle (𝑏1 , 𝑏2 , … , 𝑏𝑁 ) ist, ist die Korrelation gleich der Summe 𝑎1 𝑏1 + 𝑎2 𝑏2 + ⋯ + 𝑎𝑁 𝑏𝑁 . Da die Bits des eingehenden Headers sequentiell ankommen, erfordert die Realisierung der Korrela-
a1
...
aN
FBG b1
FBG b2
tionsoperation den Einsatz von Verzögerern, Multiplikatoren und Addierern. Eine optische Realisierung beruht beispielsweise auf einer optischen Faser mit 𝑁 faseroptischen Braggreflektoren (FBG) in gleichen Entfernungen, wie Abb. 24.72 illustriert. Die Reflektoren haben die Reflexionsgrade (𝑏1 , 𝑏2 , … , 𝑏𝑁 ) und dienen als Multiplikatoren. Die durch die Fasersegmente bei einem Umlauf eingeführten Verzögerungen synchronisieren die Bits des eingehenden Headers, sodass sie sich summieren und die Korrelationssumme liefern. Ein Paketschalter kann auch sequentiell durch eine Anzahl von einfachen 2 × 2-Schaltern realisiert werden, von denen jeder das eingehende Paket abhängig von einem Bit in seinem Header zu seinem oberen oder unteren Ausgang leitet. Wenn dieses Bit beispielsweise 1 oder 0 ist, leitet der Schalter die Daten zum oberen bzw. unteren Ausgang. Eine andere Möglichkeit ist, dass der 2 × 2-Schalter seine beiden eingehenden Pakete ordnet und immer das Paket mit der größeren Adresse zum unteren Ausgang und das andere Paket zum oberen Ausgang leitet.
FBG
Abb. 24.72 Optischer Korrelator für die Decodierung der Headeradresse.
FBG bN
907
908
24 Optische Verbindungen und Schalter
Stufe 1
0 1
6 = (110)
Stufe 2
Stufe 3
0 = (000) 1 = (001)
110
2
2 = (010)
3
3 = (011)
4
110
4 = (100)
5 6
5 = (101) 110
7
6 = (110) 7 = (111)
Abb. 24.73 Ein dreistufiger 8 × 8-Banyanschalter. Ein an Eingang 2 eingehendes Paket mit der Headeradresse 6 wird zu seinem Bestimmungsort (Ausgang 6) geleitet, nachdem es drei selbstroutende 2 × 2-Schalter durchlaufen hat. Da die Adresse durch die Dualzahl 6 = (110) beschrieben wird, wird
das Paket zu dem unteren, unteren und oberen Ausgang dieser Schalter geleitet und folgt dem durch die gestrichelte Linie bezeichneten Weg, bevor es schließlich wie gewünscht Ausgang 6 = (110) erreicht.
Zum Beispiel verwendet der in Abb. 24.73 gezeigte dreistufige 8 × 8-Schalter, der als Banyanschalter bekannt ist, zwölf selbstroutende 2 × 2-Schalter. Die Adresse jedes Pakets wird als Binärzahl (𝑥1 , 𝑥2 , 𝑥3 ) ausgedrückt. Das Routing erfolgt in der ersten Stufe entsprechend dem höchstwertigen Bit 𝑥1 , und das Routing in den Stufen 2 und 3 verwendet die Bits 𝑥2 bzw. 𝑥3 . Wenn das jeweilige Bit gleich 1 ist, wird das Paket zum unteren Ausgang geleitet; ansonsten gelangt es zum oberen Ausgang. Der Schalter wird so konfiguriert, dass das Paket nach drei Stufen seinen gewünschten Bestimmungsort erreicht. Man kann jedoch leicht zeigen, dass ein Konflikt entstehen kann, wenn zwei Pakete zu demselben Ausgang eines 2 × 2-Schalters geleitet werden sollen. Um solche internen Blockaden zu vermeiden, wurden komplexere Anordnungen erdacht. Beispielsweise können Netze aus Kombinationen von Sortier- und Routingelementen solche internen Blockaden vollständig vermeiden. Ein Konflikt tritt ein, wenn Pakete von unterschiedlichen Eingängen gleichzeitig zu demselben Ausgang geleitet werden sollen. Um diesen Konflikt zu lösen, kann das eine Paket auf einem unterschiedlichen Weg geführt oder durch einen Puffer zeitlich verzögert werden. Im optischen Bereich kann das Paket auch zu einer unterschiedlichen Wellenlänge gewandelt und über einen anderen Wellenlängenkanal transportiert werden. Optische Puffer und Wellenlängenwandler wurden in Abschnitt 24.3.4 bzw. 24.3.5 beschrieben.
cherelemente. Wie Abb. 24.74 zeigt, können volloptische Logikgatter mithilfe der in Abschnitt 24.3.3 beschriebenen volloptischen Schalter realisiert werden. Beispielsweise kann eine und-Verknüpfung durch einen 1 × 1Schalter realisiert werden, bei dem die Eingangs- und Steuersignale (A bzw. B) die zwei Eingangsbits des Gatters darstellen, während das Ausgangssignal (C) das Ausgangsbit repräsentiert [Abb. 24.74(a)]. Alternativ kann ein und-Gatter auch unter Verwendung von zwei in Reihe geschalteten 1 × 1-Schaltern realisiert werden, wobei die Steuersignale der beiden Schalter als Eingangsbits des Gatters dienen [Fig. 24.74(b)]. In ähnlicher Weise ergeben zwei parallel geschaltete 1 × 1-Schalter ein oder-Gatter [Abb. 24.74(c)], während eine Kaskade aus einem 1 × 2-Schalter und einem 2 × 1-Schalter ein xor-Gatter (exklusives oder) liefert [Abb. 24.74(d)]. Während digitale Systeme mit binären (ein-aus) Signalen (Bits) arbeiten, müssen sich die nichtlinearen optischen Wechselwirkungen, die dem Betrieb von rein optischen Schaltern zu Grunde liegen, nicht unbedingt an dieses Format halten. Die binäre Signalisierung ermöglicht die Verzweigung (Fan-Out), Trennung von Ein- und Ausgabe und die Kaskadierbarkeit von logischen Operationen. Was wir eigentlich brauchen, ist ein „optischer Transistor“. In diesem Abschnitt wollen wir die grundlegenden Funktionsprinzipien bistabiler (FlipFlop) optischer Systeme und Bauelemente vorstellen, die in bestimmten digitalen optischen Systemen Verwendung finden.
24.4 Photonische Logikgatter
24.4.1
Moderne elektronische Digitalsysteme (z. B. Computer) enthalten eine große Zahl von miteinander verbundenen Grundeinheiten wie Schalter, Logikgatter und Spei-
Bistabile Systeme
Das Ausgangssignal eines bistabilen (Zweizustands-) Systems kann nur einen von zwei verschiedenen stabilen Werten annehmen, egal welches Signal am Eingang anliegt. Das Schalten zwischen diesen Werten kann
24.4 Photonische Logikgatter
Q A
C A B
B
Q
Q
C
(a) UND
(b)UND
C
C
A B
A B
(c) ODER
909
(d) XOR
Ausgang
2
Ausgang
Ausgang
Abb. 24.74 Implementierung verschiedener Logikgatter mithilfe von Schaltern. Die Eingangsbits sind mit A und B bezeichnet, das Ausgangsbit mit C. Das mit Q bezeichnete Quellenbit befindet sich im Zustand „1“.
1,3 Eingang
1
1
Eingang
3
t
2 3 t
Abb. 24.76 Ein bistabiles System als Flip-Flop. Zur Zeit 1 ist das Ausgangssignal klein. Ein positiver Puls am Eingang schaltet das System zur Zeit 2 von „klein“ auf „groß“. Es bleibt in diesem Zustand, bis ein negativer Puls zur Zeit 3 wieder in auf „klein“ schaltet. Das System verhält sich wie einrastender Schalter oder ein Speicherelement.
Ausgang t
ϑ
(a)
t
Ausgang
ϑ
Eingang
Eingang Eingang
durch eine temporäre Änderung der Signalstärke am Eingang erreicht werden. In dem in Abb. 24.75 illustrierten System nimmt der Ausgang beispielsweise seinen kleinen Wert für kleine Eingangssignale an und seinen großen Wert für große Eingänge. Wenn das Signal am Eingang einen bestimmten kritischen (Schwellen-) Wert 𝜗2 überschreitet, springt das Ausgangssignal von seinem niedrigen auf seinen hohen Wert. Wenn das Eingangssignal anschließend abnimmt, springt das Ausgangssignal wieder auf seinen niedrigen Wert zurück, wenn ein anderer kritischer Wert 𝜗1 < 𝜗2 unterschritten wird, sodass die Beziehung zwischen Eingangs- und Ausgangssignal eine Hystereseschleife bildet. Es gibt einen Zwischenbereich von Eingangswerten (zwischen 𝜗1 und 𝜗2 ), für den niedrige oder hohe Ausgangssignale möglich sind, je nach der Vorgeschichte des Systems. Innerhalb dieses Bereichs verhält sich das System wie eine Wippe. Wenn das Ausgangssignal klein ist, schaltet ein großes positives Eingangssignal es auf groß. Eine großes negatives Eingangssignal schaltet es zurück auf klein. Das System verhält sich wie ein „FlipFlop“; sein Zustand hängt davon ab, ob die letzte Spitze positiv oder negativ war – d. h. von seiner Vorgeschichte (Abb. 24.76). Bistabile Systeme können als Schalter, Logikgatter und Speicherelemente dienen. Die Parameter eines solchen Bauelements können so angepasst werden, dass die beiden kritischen Werte (die Schwellen 𝜗1 und 𝜗2 ) zu einem einzigen Wert 𝜗 verschmelzen. Das Ergebnis ist eine steile S-förmige Beziehung zwischen Eingangs- und Ausgangssignal mit nur einer Schwelle (Abb. 24.77). Bei geeigneter Einstellung kann ein solches Bauelement einen großen diffe-
2
Ausgang
Abb. 24.75 Die Hysteresebeziehung zwischen Eingangsund Ausgangssignal für ein bistabiles System.
Eingang
ϑ2
Ausgang
ϑ1
(b) t
Abb. 24.77 Ein bistabiles Bauelement als (a) Verstärker und (b) Schwellenelement, Pulsformer oder -begrenzer.
rentiellen Gewinn liefern und daher wie ein Transistor als Verstärker verwendet werden. Es kann auch als ein Schwellenelement eingesetzt werden, in dem der Ausgang zwischen zwei Werten umschaltet, wenn der Eingang eine Schwelle überschreitet, oder als Pulsformer oder -begrenzer [Abb. 24.77(b)]. Für eine derartige Verwendung sind eine stabile Schwelle und eine stabile Vorspannung erforderlich. Bistabile Bauelemente werden auch als Logikelemente verwendet. Dabei werden die binären Daten durch Pulse dargestellt, die addiert werden und deren Summe als Eingang des bistabilen Bauelements verwendet wird. Bei passender Wahl der Pulshöhen relativ zu der Schwelle (siehe Abb. 24.78) kann das
t
24 Optische Verbindungen und Schalter
Ausgang 0 0 0
Ausgang I0
910
0
t
Eingang Ii = I1 + I2
0+0 0+1 0+0
I1 I2
1+1
I0 UND
1+0 t
1
I1
I2
Abb. 24.78 Ein bistabiles Bauelement als logisches und-Gatter. Die Eingabe ist IE = I1 + I2 , wobei I1 und I2 Pulse sind, die die binären Daten beschreiben. Der Ausgang IA ist genau dann hoch, wenn am Eingang beide Pulse vorhanden sind.
Bauelement so abgestimmt werden, dass es nur dann auf „hoch“ umschaltet, wenn beide Pulse vorhanden sind, sodass es als und-Gatter wirkt.
24.4.2
Das Prinzip der optischen Bistabilität
Ein Bauelement muss zwei Eigenschaften besitzen, damit es bistabil sein kann: Nichtlinearität und Rückkopplung. Eine elektronische bistabile Schaltung (Flip-Flop) wird aufgebaut, indem man die Ausgänge zweier Transistoren mit dem Eingang des jeweils anderen verbindet (siehe jedes Lehrbuch der Digitalelektronik). Ein optisches bistabiles System besteht aus einem nichtlinearen optischen Element, dessen Ausgangssignal in einem Rückkopplungssystem verwendet wird, um die Transmission von Licht durch das Element selbst zu kontrollieren. Wir betrachten das in Abb. 24.79 dargestellte allgemeine optische System. Die Rückkopplung sorgt dafür, dass die Ausgangsintensität 𝐼A die Transmission 𝒯 des Systems steuert, sodass 𝒯 eine nichtlineare Funktion 𝒯 = 𝒯(𝐼A ) ist. Wegen 𝐼A = 𝒯𝐼E gilt 𝐼E =
𝐼A . 𝒯(𝐼A )
(24.21)
Wenn 𝒯(𝐼A ) eine nichtmonotone Funktion wie die glockenförmige Funktion in Abb. 24.80(a) ist, wird auch 𝐼E eine nichtmonotone Funktion von 𝐼A sein, wie Abb.
IE
𝒯(IA)
IA
Abb. 24.79 Ein optisches System, dessen Transmission 𝒯 eine Funktion seines Ausgangs IA ist.
24.80(b) zeigt. Folglich muss 𝐼A eine mehrdeutige Funktion von 𝐼E sein, d. h. es gibt Werte von 𝐼E mit mehr als einem zugehörigen Wert von 𝐼A , wie Abb. 24.80(c) zeigt. Das System zeigt daher bistabiles Verhalten wie zuvor in Abb. 24.76 dargestellt. Die Auftragung von 𝐼A als Funktion von 𝐼E aus Abb. 24.80(c) ist in Abb. 24.81 nochmals genauer gezeigt. Für kleine Eingaben (𝐼E < 𝜗1 ) oder große Eingaben (𝐼E > 𝜗2 ) entspricht jeder Eingabewert einem einzigen Ausgangswert 𝐼A . Wenn man bei kleinen Eingabewerten beginnt und die Eingabe vergrößert, springt das Ausgangssignal bei Überschreiten der Schwelle 𝜗2 zum oberen Zustand. Wenn das Eingangssignal anschließend wieder reduziert wird, folgt das System dem oberen Ast der Kurve, bis die Schwelle 𝜗1 erreicht wird, woraufhin es in seinen untern Zustand springt. Im Bereich dazwischen, für 𝜗1 < 𝐼E < 𝜗2 , entspricht jeder Eingabewert jedoch drei möglichen Ausgangswerten. Die oberen und unteren Werte sind stabil, aber der mittlere Wert (die gepunktete Linie in Abb. 24.81) ist nicht stabil, da jede noch so kleine Störung der Eingabe den Ausgang entweder auf den oberen oder auf den unteren Zweig zwingt. Um dieses Verhalten zu verstehen, sehen wir uns Punkt 𝑃 in Abb. 24.81 näher an. Eine kleine Zunahme des Ausgangssignals 𝐼A verursacht eine scharfe Steigerung der Transmission 𝒯(𝐼A ), da die Steigung von 𝒯(𝐼A ) positiv und groß ist [siehe Abb. 24.80(a); 𝑃 liegt auf der Linie von Punkt 1 zu Punkt 2]. Das bewirkt wiederum eine weitere Zunahme von 𝒯(𝐼A ), wodurch 𝐼A noch mehr ansteigt. Das Ergebnis ist ein Übergang zum oberen stabilen Zustand bei Punkt 2. Ähnlich verursacht eine kleine Abnahme von 𝐼A an Punkt P einen sofortigen Übergang zum tieferen stabilen Zustand bei Punkt 1. Die in Abb. 24.80(a) gezeigte glockenförmige nichtlineare Kurve für 𝒯(𝐼A ) wurde nur als Beispiel gewählt. Es gibt viele nichtlineare Transmissionsfunktionen, die zusammen mit Systemen der in Abb. 24.79 gezeigten Art zu Bistabilität und manchmal sogar zu Multistabilität (bei der für ein gegebenes Eingangssignal mehr als zwei stabile Werte für das Ausgangssignal existieren) führen. Übung 24-3: Nichtlineare Funktionen mit Bistabilität
Tragen Sie die Beziehung zwischen 𝐼A und 𝐼E = 𝐼A ∕𝒯(𝐼A ) für jede der folgenden Funktionen auf: (a) 𝒯(𝑥) = 1∕[(𝑥 − 1)2 + 𝑎2 ], (b) 𝒯(𝑥) = 1∕[1 + 1 1 2 𝑎2 sin (𝑥 + 𝜃)], (c) 𝒯(𝑥) = + cos(𝑥 + 𝜃), (d) 𝒯(𝑥) = 2 2 √ 2 sinc 𝑎2 + 𝑥2 , (e) 𝒯(𝑥) = (𝑥 + 1)2 ∕(𝑥 + 𝑎)2 . Wählen Sie passende Werte für die Konstanten 𝑎 und 𝜃 aus, um eine bistabile Beziehung zu erzeugen. Einige dieser Funktionen gehören zu bistabilen Systemen, die wir im Folgenden besprechen werden.
24.4 Photonische Logikgatter
IA
IE
2
𝒯2
IA /𝒯1
𝒯(IA)
3
I2
IA /𝒯2
I1
3 2
𝒯1
1
3
I1
I2
(a)
1
IA
I1
2
(b)
I2
IA
1
1
2
(c)
IE
Abb. 24.80 (a) Transmission 𝒯(IA ) als Funktion des Ausgangssignals IA . Diese nichtmonotone Funktion wurde zur Illustration des Prinzips gewählt. (b) Eingabe IE = IA ∕𝒯(IA ) als Funktion des Ausgangssignals IA . Für IA < I1 oder IA > I2 ist 𝒯(IA ) = 𝒯1 , und IE = IA ∕𝒯1 ist eine lineare Beziehung mit der Steigung 1∕𝒯1 . Bei dem mittleren Wert von IA , für den 𝒯 sein Maximum 𝒯2 annimmt (Punkt 2), taucht IE kurz
unter die Linie IE = IA ∕𝒯1 und berührt die untere Linie IE = IA ∕𝒯2 in Punkt 2. (c) Das Ausgangssignal IA als Funktion des Eingangssignals IE ergibt sich aus der Kurve in (b) durch Vertauschen der Achsen. (Das Diagramm ist um 90◦ gegen den Uhrzeigersinn gedreht und an der vertikalen Achse gespiegelt.)
IA
Übertragungsfunktion stellt die Beziehung zwischen der transmittierten Intensität 𝑇t und der Eingangsintensität 𝐼E her, 𝐼t = 𝒯(𝐼)𝐼E . Die Ausgangsintensität des Systems beträgt 𝐼A = 𝒯A 𝐼t , wobei 𝒯A ein Transmissionsfaktor ist. Durch Zusammenführen dieser Beziehungen erhalten wir
2 P
1
1
𝐼E =
IE
2
Abb. 24.81 Ausgangssignal des in Abb. 24.79 gezeigten bistabilen Bauelements als Funktion seines Eingangssignals. Die gestrichelte Linie bezeichnet einen instabilen Zustand.
Eingebettete bistabile Systeme
Die vorstehende Analyse befasste sich mit einem System, dessen Übertragungsfunktion 𝒯(𝐼A ) eine Funktion seines eigenen Ausgangssignals ist. In der Praxis wird ein nichtlineares Element in einem optischen System jedoch nicht nur von einem Teil der Ausgabe, sondern auch von einem Teil der Eingabe beleuchtet, wie in Abb. 24.82 dargestellt. In dieser Anordnung wird das System mit offenem Regelkreis durch eine Übertragungsfunktion 𝒯(𝐼) beschrieben, die von der Lichtintensität 𝐼 abhängt, die auf das nichtlineare Element auftrifft und die die Summe einer zu 𝐼t und einer zu 𝐼E proportionalen Komponente ist, 𝐼 = 𝒯𝐼E + ℛA 𝐼t . Die
AIt
IE
EIE
NL
It
AIt
𝐼 𝒯E + ℛA 𝒯(𝐼)
und 𝐼A =
𝒯A (𝐼 − 𝒯E 𝐼E ) . ℛA (24.22)
Die erste Gleichung ist eine nichtlineare Beziehung analog zu Gl. (24.21). Sie kann auf ähnliche Weise invertiert werden, um 𝐼 als Funktion von 𝐼E zu erhalten und zeigt Bistabilität, wenn 𝒯(𝐼) eine nichtmonotone Funktion ist. Die zweite Gleichung ist eine lineare Beziehung, die das Ausgangssignal 𝐼A als Funktion von 𝐼 und 𝐼E liefert. Die Details der Funktion 𝒯(𝐼) werden zusammen mit den Konstanten 𝒯E , 𝒯A und ℛA durch das betrachtete bistabile System bestimmt, wie aus den Betrachtungen in Abschnitt 24.4.3 deutlich werden wird. Intrinsisch bistabile Systeme
Die für die Bistabilität erforderliche Rückkopplung kann auch vollständig intern erfolgen. Das in Abb. 24.83 gezeigte System besteht zum Beispiel aus einem Resonator, der ein nichtlineares optisches Medium enthält, dessen Transmission 𝒯(𝐼) nur durch die Lichtintensität 𝐼 innerhalb des Resonators und nicht durch die Lichtintensität 𝒯
IA
Abb. 24.82 Ein optisches System mit einem eingebetteten nichtlinearen Element NL und einer Rückkopplungsschleife, die einen Teil der Ausgangsleistung an NL zurückgibt. Auch ein Teil der Eingangsleistung fällt auf NL.
IE
NL
I
IA
Abb. 24.83 Ein intrinsisch bistabiles System. Die interne Lichtintensität I steuert das nichtlineare Medium und daher auch die Gesamt-Transmission 𝒯(I) des Systems.
911
912
24 Optische Verbindungen und Schalter
𝐼A am Ausgang gesteuert wird. Da 𝐼A = 𝒯A 𝐼 ist, wobei 𝒯A der Transmissionsgrad des Ausgangsspiegels des Resonators ist, ist die Wirkung der inneren Intensität 𝐼 bis auf einen konstanten Faktor dieselbe wie die der äußeren Intensität 𝐼A . Beispiele für intrinsisch bistabile optische Systeme werden in Abschnitt 24.4.3 beschrieben.
𝜑0 = 𝑘0 d 𝑛2 𝐼 + 𝜑1 , wobei d die Länge des nichtlinearen Mediums ist, 𝑘0 = 2π∕𝜆0 mit der Vakuumwellenlänge 𝜆0 und 𝜑0 und 𝜑1 Konstanten sind. Die Transmission des Systems ist dann
24.4.3
Wie Abb. 24.84 zeigt, ist das eine nichtlineare Funktion, die sich aus einer periodischen Wiederholung der allgemeinen glockenförmigen Funktion ergibt, die wir zuvor für die Einführung der Bistabilität verwendet hatten [siehe Abb. 24.80(a)].
Bistabile optische Bauelemente
Für die optische Realisierung des beschriebenen grundlegenden Prinzips können zahlreiche Anordnungen verwendet werden. Dabei kommen verschiedene Arten von nichtlinearen optischen Elementen zum Einsatz: deren Brechungsindex 𝑛 eine Funktion der optischen Intensität ist. Beispielsweise ist der Brechungsindex eines Mediums mit einem optischen Kerreffekt 𝑛(𝐼) = 𝑛0 + 𝑛2 𝐼, wobei 𝐼 die Intensität ist und 𝑛0 und 𝑛2 Konstanten sind, wie in Abschnitt 22.3.1 erläutert. Dissipative nichtlineare Elemente, deren Absorptionskoeffizient 𝛼 eine Funktion der optischen Intensität ist. Der sättigbare Absorber aus Abschnitt 15.3.1 ist ein Beispiel, bei dem der Absorptionskoeffizient 𝛼(𝐼) = 𝛼0 ∕(1 + 𝐼∕𝐼S ) eine nichtlineare Funktion von 𝐼 ist, wobei 𝛼0 der Absorptionskoeffizient für kleine Signale und 𝐼S die Sättigungsintensität ist. Verstärkende nichtlineare Elemente, bei denen der Gewinnkoeffizient 𝛾 eine Funktion der optischen Intensität ist. Ein Beispiel ist ein Medium mit sättigbarer Verstärkung 𝛾(𝐼) = 𝛾0 ∕(1 + 𝐼∕𝐼S ), wie in Abschnitt 15.3.1 diskutiert. Dispersive nichtlineare Elemente,
Nichtlineare Elemente mit Dispersion und Dissipation/ Verstärkung. Häufig tritt eine intensitätsabhängige
Dämpfung oder Verstärkung in Kombination mit einem intensitätsabhängigen Brechungsindex auf. In einem optischen Halbleiterverstärker verringert eine Erhöhung der optischen Intensität beispielsweise die Trägerdichte, was den Gewinnkoeffizienten verringert und den Brechungsindex verändert. Im Folgenden werden einige Beispiele von Systemen besprochen, die ein nichtlineares Element und eine Rückkopplung enthalten. Optisches Kerrmedium in einem Mach-Zehnder-Interferometer
Wie in Abschnitt 2.5.1 besprochen ist die Transmission eines Mach-Zehnder-Interferometers (MZI) eine Funktion der Phasendifferenz 𝜑 zwischen seinen Armen, 𝒯 = 1 1 + cos 𝜑. Wenn in einen der Arme wie in Abb. 24.84 2 2 gezeigt ein optisches Kerrmedium mit dem Brechungsindex 𝑛(𝐼) = 𝑛0 + 𝑛2 𝐼 eingebracht wird, gilt 𝜑 = 𝑘0 d 𝑛 +
𝒯=
1 2
1
+ cos (𝑘0 d 𝑛2 𝐼 + 𝜑1 ) .
(24.23)
2
Optisches Kerrmedium in einem Fabry-Pérot-Resonator
Die Transmission eines Fabry-Pérot-Resonators kann in 2 der Form 𝒯 = 𝒯max [1 + (2ℱ∕π)2 sin (𝜑∕2)]−1 geschrieben werden, wobei 𝜑 die Phasenverschiebung für einen kompletten Umlauf im Resonator ist und 𝒯max und ℱ Konstanten sind. Wenn ein optisches Kerrmedium der Länge d zwischen die Spiegel gebracht wird, gilt wieder 𝜑 = 𝑘0 d 𝑛 + 𝜑0 = 𝑘0 d 𝑛2 𝐼 + 𝜑1 mit Konstanten 𝜑1 und 𝜑2 . Die Transmission des Systems hängt dann wie folgt von der inneren Intensität 𝐼 ab: 𝒯(𝐼) =
𝒯max 1+
(2ℱ∕π)2
2
sin (𝑘0 d 𝑛2 𝐼 + 𝜑1 )
.
(24.24)
Wie Abb. 24.85 illustriert, ist diese Funktion eine periodische Folge von glockenförmigen Funktionen mit scharfen Maxima; das System ist folglich bistabil. Auf der Basis einer derartigen Anordnung konnte optische Bistabilität in verschiedenen Materialien beobachtet werden (z. B. Natriumdampf, Kohlenstoffdisulfid oder Nitrobenzol). Der Koeffizient 𝑛2 der Nichtlinearität dieser Materialien ist jedoch sehr klein, sodass der Effekt nicht einfach zu beobachten ist. Halbleiter wie GaAs sind hier besser geeignet, weil sie eine viel stärkere optische Nichtlinearität aufweisen. Ein bistabiles Bauelement kann einfach aus einer dünnen Schicht eines solchen Halbleitermaterials mit zwei parallelen reflektierenden Grenzflächen hergestellt werden, die als Spiegel eines Fabry-Pérot-Etalons wirken [Abb. 24.85(c)]. Auch Mehrfachquantenschicht-Halbleiterstrukturen (Abschnitte 17.1.7 und 18.2.4) zeigen Bistabilität, ebenso verschiedene organische Materialien, Graphen, nichtlineare photonische Kristalle oder Oberflächenplasmonpolaritonen. Sättigbarer Absorber in einem Fabry-Pérot-Resonator
Wenn ein sättigbarer Absorber in einen Fabry-Pérot-Resonator der Länge d gestellt wird, der auf maximale Transmission abgestimmt ist (Abb. 24.86), dann gilt für
24.4 Photonische Logikgatter
Abb. 24.84 Ein Mach-Zehnder-Interferometer, dessen einer Arm ein nichtlineares Medium mit dem Brechungsindex n(I) enthält, der über einen optischen Kerreffekt von der reflektierten Intensität I abhängt.
𝒯(I) IA
n I IE
λ0 n2
geschnittene Oberfläche
𝒯(I) n
IE
I
I
geschnittene Oberfläche
IA IE
(a)
λ0 2n2
(b)
IA
halbleitendes Material
I
(c)
Abb. 24.85 (a) Ein Fabry-Pérot-Resonator mit einem Medium mit dem Brechungsindex n(I), der von der internen Intensität I gesteuert wird. (b) Die Transmission 𝒯(I) als Funktion der Intensität I. (c) Ein bistabiles Fabry-Pérot-Etalon aus einer dünnen Schicht eines Halbleiters mit parallelen, reflektierenden Oberflächen.
IE
IA
I
Spiegel
sättigbarer Absorber
Spiegel
𝒯
Abb. 24.86 Ein bistabiles Bauelement aus einem sättigbaren Absorber in einem Resonator.
seine Transmission 𝒯1 , (24.25) (1 − ℛe−𝛼 d )2 √ wobei ℛ = ℛ1 ℛ2 gilt, ℛ1 und ℛ2 die Spiegelreflexionsgrade sind und 𝒯1 eine Konstante (siehe Abschnitte 2.5.2 und 11.1.1). Für 𝛼d ≪ 1, d. h. ein optisch dünnes Medium, ergibt eine Taylorentwicklung e−𝛼 d ≈ 1 − 𝛼d und damit
als ein optischer Verstärker mit Rückkopplung, d. h. ein Laser. Für ℛ exp(𝛾0 d ) < 1 ist der Laser unter der Schwelle; aber für ℛ exp(𝛾0 d ) > 1 wird das System instabil und die Laseroszillation beginnt. Obwohl wir das Thema der Bistabilität in den Kapiteln 16 und 18 ausgespart hatten, zeigen Laser unter bestimmten Bedingungen in der Tat bistabiles Verhalten. In einem gewissen Sinn ist ein dispersives bistabiles optisches System das Analogon des Lasers mit nichtlinearem Brechungsindex anstatt nichtlinearem Gewinn.
𝒯=
𝒯≈
𝒯1 . [1 − (1 − 𝛼d )ℛ]2
(24.26)
Weil 𝛼 eine nichtlineare Funktion von 𝐼 ist, gilt dasselbe auch für 𝒯. Mit 𝐼 = 𝐼A ∕𝒯A bekommen wir dann 2
𝒯(𝐼A ) = 𝒯2 [
𝐼A + 𝐼S1 ] , 𝐼A + (1 + 𝑎)𝐼S1
(24.27)
wobei 𝒯2 = 𝒯1 ∕(1 − ℛ)2 ist, 𝑎 = 𝛼0 d ℛ∕(1 − ℛ) und 𝐼S1 = 𝐼S 𝒯0 . Für bestimmte Werte von 𝑎 ist das System bistabil [wir erinnern uns an Übung 24-3(e)]. Nichtlinearer Verstärker in einem Fabry-Pérot-Resonator
Wir nehmen nun an, dass der sättigbare Absorber durch ein verstärkendes Medium mit einem sättigbaren Gewinn ersetzt wird. Ein solches System ist nichts weiter
Optische Halbleiterverstärker in einem Mach-Zehnder-Interferometer
Ein bistabiles System aus einem Paar identischer optischer Halbleiterverstärker (OHV 1 und OHV 2) in einem Mach-Zehnder-Interferometer (MZI) ist in Abb. 24.87 dargestellt. Die OHV werden in die beiden Arme des MZI eingebracht und das Ausgangssignal des Interferometers wird über eine Rückkopplungsschleife aus optischen Fasern und Kopplern in OHV 1 zurückgeführt. Der Gewinn des Halbleiterverstärkers bei Sättigung ist eine abnehmende Funktion der optischen Leistung und auch die Phase hängt von der Leistung ab, sodass sowohl Verstärkungs- als auch Dispersionseffekte ins Spiel kommen. Wenn am Eingang Licht mit einer konstanten Leistung 𝐼E auftrifft, ist das Interferometer im Gleichgewicht und die optische Leistung 𝐼t an seinem Ausgang ist ebenso null wie das Ausgangssignal 𝐼A des Gesamtsystems; dieser stabile Zustand ist der untere Zustand des bistabilen Systems. Der andere stabile Zustand tritt auf, wenn die optische Leistung in OHV 1 hoch ist, sodass dessen Verstärkung gesättigt ist und seine Phase sich von der in
913
914
24 Optische Verbindungen und Schalter
ISet
IA
OHV 1
IE
It MZI
IA IE
IReset
OHV 2
Abb. 24.87 Ein bistabiles Bauelement aus zwei optischen Halbleiterverstärkern (OHV 1 und OHV 2) in den beiden Zweigen eines Mach-Zehnder-Interferometers (MZI). Das Ausgangssignal des MZI wird in OHV 1 rückgekoppelt. Die kurzen „Set“- und „Reset“Pulse lösen den Übergang in den Zustand mit großer bzw. kleiner Ausgangsleistung IA aus. Die Eingangsleistung IE ist konstant und dient als Vorspannung.
ISet
t
IReset
OHV 2 unterscheidet. Das Interferometer ist dann unsymmetrisch und die Ausgangsleistung 𝐼A ist hoch. Das Umschalten zwischen den beiden Zuständen dieses Systems erfolgt durch äußere Trigger. Wenn sich das System im unteren Zustand befindet, kann es in den oberen Zustand versetzt werden, indem ein kurzer Triggerpuls 𝐼Set durch die Rückkopplungsschleife in OHV 1 gegeben wird. Dies reduziert die Verstärkung von OHV 1 und verändert die von ihm eingeführte Phasenverschiebung, wodurch das Interferometer aus dem Gleichgewicht gerät und seine Transmission sich erhöht. Ein Teil der optischen Eingangsleistung 𝐼E gelangt nun die Rückkopplungsschleife und wird in OHV 1 rückgekoppelt, wodurch er auch nach dem Ende des Triggerpulses gesättigt bleibt. Das Resultat ist ein unsymmetrisches Interferometer und ein stabiler Zustand mit hoher Ausgangsleistung. Durch Einspeisen eines „Reset“-Pulses in OHV 2 kann das System in seinen unteren Zustand zurückgeschaltet werden, wodurch die Verstärkung von OHV 2 verringert wird. Diese Leistung erreicht über die Rückkopplungsschleife auch OHV 1. Das Ergebnis ist ein neuer symmetrischer Zustand des Interferometers mit der Ausgangsleistung 𝐼A = 0; das System ist in seinem unteren Zustand angekommen.
steht, wenn mehr Licht aus der UZ-Mode von Laser A in den Ring von Laser B eingekoppelt wird. Nach resonanter Verstärkung blockiert dieses Licht die UZ-Mode von Laser B durch Injection Locking, woraufhin die eigene Oszillation in Laser B einschließlich seiner GUZMode gelöscht werden. Die UZ-Mode erhält dann mehr Leistung, da die Pumpenenergie nur noch in eine Mode fließt [Abb. 24.88(a)]. Der zweite Zustand entsteht, wenn die beiden Laser die Rollen tauschen – hier ist die GUZ-Mode von Laser A blockiert und erhält eine größere Leistung, während seine UZ-Mode unterdrückt wird [Abb. 24.88(b)]. Durch einen optischen „Set“-Puls wird das System in den ersten stabilen Zustand versetzt (höhere Leistung in der UZ-Mode von Laser B), der die UZ-Mode von Laser B begünstigt [Abb. 24.88(a)]. Durch einen optischen „Reset“-Puls kann das System in den zweiten stabilen Zustand (höhere Leistung in der GUZ-Mode von Laser A) gebracht werden, in dem die GUZ-Mode von Laser A verstärkt wird [Abb. 24.88(b)]. Für ein Flip-Flop aus solchen gekoppelten Mikroringlasern in Form einer integriert-photonischen Schaltung auf der Basis von InP/InGaAsP wurde eine Schaltzeit von 20 ps und eine Schaltenergie von 5.5 fJ gemessen. 2)
Gekoppelte Mikroringlaser
Hybride bistabile optische Bauelemente
Ein Mikroringlaser (Abschnitt 18.5.2) besitzt zwei unabhängige (ungekoppelte) Lasermoden, von denen sich eine im Uhrzeigersinn (UZ) und die zweite gegen den Uhrzeigersinn (GUZ) ausbreitet. Zwei derartige Laser mit ähnlichen Resonanzfrequenzen können über einen Wellenleiter so verbunden werden, dass Licht aus der UZ-Mode von Laser A mit der UZ-Mode von Laser B oder Licht aus der GUZ-Mode von Laser B mit der GUZMode von Laser A gekoppelt wird (Abb. 24.88). Diese Art der gegenseitigen Rückkopplung führt zu einem bistabilen System mit zwei stabilen „Master/Slave“-Zuständen, in denen entweder Laser A der Master und Laser B der Slave ist oder umgekehrt. Der erste Zustand ent-
Die bis jetzt besprochenen bistabilen optischen Systeme waren alle volloptisch. Daneben wurden auch hybride elektrisch/optische bistabile Systeme entwickelt, bei denen auch elektrische Felder beteiligt sind. Beispielsweise kann man eine Pockelszelle in einen Fabry-PérotResonator einbringen; das Licht am Ausgang wird mit einem Photodetektor gemessen und eine zur gemessenen optischen Intensität proportionale Spannung wird
2) Siehe M. T. Hill, H. J. S. Dorren, T. de Vries, X. J. M. Leijtens, J. H. den Besten, B. Smalbrugge, Y.-S. Oei, H. Binsma, G.-D. Khoe, M. K. Smit, ‚A Fast Low-Power Optical Memory Based on Coupled Micro-Ring Lasers‘, Nature 432, 206–209, 2004.
Aufgaben
Set
Reset GUZ
UZ (a)
GUZ
UZ
Laser A
Laser B Injection Locking
(b)
GUZ
UZ
Laser A Injection Locking
Laser B
Abb. 24.88 Zwei Mikroringlaser, die über einen Wellenleiter verbunden sind, ergeben ein bistabiles System. Die UZ-Moden der beiden Laser (Ausbreitung im Uhrzeigersinn) sind gekoppelt, ebenso die GUZ-Moden (Ausbreitung gegen den Uhrzeigersinn). (a) Der optische „Set“-Puls versetzt das System in einen Zustand, in dem Laser A als Master
fungiert, der Laser B durch Injection Locking blockiert und dessen GUZ-Mode unterdrückt. (b) Der optische „Reset“-Puls versetzt das System in einen Zustand, in dem Laser B der Master ist, der Laser A durch Injection Locking blockiert und dessen UZ-Mode unterdrückt.
an die Zelle angelegt, sodass die Änderung ihres Brechungsindex proportional zur Intensität am Ausgang ist. Die optische Transmission des Resonators ist demzufolge eine nichtlineare Funktion der optischen Intensität am Ausgang und da der Resonator für Rückkopplung sorgt, sind alle Voraussetzungen für Bistabilität gegeben. In einer verwandten Anordnung wird ein elektrooptischer Modulator mit einem Phasenschieber aus einer Pockelszelle zwischen zwei gekreuzte Polarisatoren platziert. Wieder wird die Lichtintensität am Ausgang gemessen und eine proportionale Spannung an die Zelle angelegt. Die Transmission des Modulators ist dann eine nichtmonotone Funktion der durchgelassenen Intensität und das System zeigt Bistabilität. Beide Systeme lassen sich problemlos als integriert-photonische Bauelemente realisieren. Auch räumliche Lichtmodulatoren können verwendet werden, um Arrays von bistabilen Elementen zu konstruieren. In einem optisch adressierten räumlichen Lichtmodulator auf Basis von Flüssigkristallen (siehe Abschnitt 21.3.2) ist der Reflexionsgrad jedes Elements beispielsweise eine nichtlineare Funktion der Intensität des Lichts, das auf seine Schreibseite fällt. Durch Einführung einer Rückkopplung wird die Schreibintensität proportional zur Intensität des von dem Bauelement reflektierten Strahls, sodass bistabiles Verhalten die Folge ist. Unterschiedliche Punkte auf der Oberfläche des Bauelements können getrennt adressiert werden, sodass der Modulator als Array von bistabilen optischen Elementen dienen kann. Ein weiteres bistabiles elektrooptisches Halbleiterbauelement ist das Bauelement mit selbstelektrooptischem Effekt (BSEE). Das BSEE ist eine pinPhotodiode mit einer MQW-Halbleiterheterostruktur im intrinsischen Gebiet. Die Diode ist in Sperrrichtung gepolt, sodass in der Quantenschicht ein großes elektrisches Feld existiert. Aufgrund des quantenbeschränkten Starkeffekts (siehe Abschnitt 21.5) ist der optische
Absorptionskoeffizient eine nichtlineare Funktion der Spannung über die Quantenschicht. Folglich ist die optische Transmission ebenfalls eine nichtlineare Funktion der Spannung. Bistabiles Verhalten entsteht im BSEE durch den Rückkopplungsmechanismus aufgrund der elektrischen Schaltung der Photodiode, die die Spannung zu einer Funktion der einfallenden optischen Leistung macht. Der Grund dafür ist, dass das absorbierte Licht einen proportionalen Photostrom hervorruft, der in den äußeren Stromkreis fließt und ein Abfallen der Spannung bewirkt. BSEE können in Form von Arrays hergestellt werden, die mit mäßigen Geschwindigkeiten und sehr geringer Leistungsaufnahme arbeiten.
Aufgaben Aufgabe 24-1: Verbindungshologramm für eine konforme Abbildung
Entwerfen Sie ein Hologramm, um die durch √ 𝑥′ = 𝜓𝑥 (𝑥, 𝑦) = ln 𝑥2 + 𝑦 2 , 𝑦 𝑦 ′ = 𝜓𝑦 (𝑥, 𝑦) = tan−1 𝑥 definierte geometrische Transformation zu realisieren. Sie entspricht einer Transformation von kartesischen zu Polarkoordinaten gefolgt von einer logarithmischen Transformation der Polarkoordinate 𝑟 = (𝑥2 + 𝑦 2 )1∕2 . Geben Sie einen Ausdruck für die Phasenfunktion 𝜑(𝑥, 𝑦) des erforderlichen Hologramms an. Aufgabe 24-2: Multiplexer/Demultiplexerkaskade aus Mach-Zehnder-Interferometern
Drei Mach-Zehnder-Interferometer werden wie in Abb. 24.25 gezeigt hintereinander geschaltet, um vier Wellenlängenkanäle im Abstand Δ𝜆 = 0.2 nm und der zentralen Wellenlänge 1550 nm zu multiplexen oder demultiplexen. Bestimmen Sie die notwendige Weglängendiffe-
915
916
24 Optische Verbindungen und Schalter
renz Δd in jedem Interferometer, wenn der Brechungsindex 𝑛 = 2.3 ist. Aufgabe 24-3: Wellenlängen-Gitterrouter als Demultiplexer
Ein Wellenlängen-Gitterrouter (siehe Abb. 24.27) wird als Demultiplexer für vier Wellenlängenkanäle mit einem Wellenlängenabstand Δ𝜆 = 0.2 nm und einer zentralen Wellenlänge von 1550 nm eingesetzt. Bestimmen Sie die Weglängendifferenz Δd 𝑏 , die der Sternkoppler einführen muss, wenn sein Brechungsindex 𝑛 = 2.3 beträgt. Aufgabe 24-4: Wellenlängen-Gitterrouter als 2 × 2 Wellenlängenrouter
Ein WGR wird als 2 × 2-Wellenlängenrouter betrieben. Zu Eingang 1 gehören die Wellenlängenkanäle 𝜆1 und 𝜆2 , zu Eingang 2 die Wellenlängenkanäle 𝜆3 und 𝜆4 . Entwerfen Sie einen Router, der die Wellenlängen der Eingänge transponiert, d. h. 𝜆1 und 𝜆3 zu Ausgang 1 und 𝜆2 und 𝜆4 zu Ausgang 2 leitet. Geben Sie Bedingungen für die vier optischen Weglängendifferenzen Δd 11 , Δd 12 , Δd 21 und Δd 22 in den Mehrpfadinterferometern an, die die Eingänge mit den Ausgängen verbinden. Aufgabe 24-5: Leistungsverlust und Übersprechen
Ein 4 × 4-Schalter kann aus fünf 2 × 2-Schaltern aufgebaut werden. Bestimmen Sie den Leistungsverlust im ungünstigsten Fall und das Übersprechen für den 4 × 4Schalter, wenn jeder der fünf Schalter einen Leistungsverlust von 0.5 dB und ein Übersprechen von −30 dB einführt. Aufgabe 24-6: Mach-Zehnder-Interferometer als Koordinatenschalter
Ein elektrooptisches Mach-Zehnder-Interferometer wird als Koordinatenschalter eingesetzt. Anlegen einer Spannung 𝑉 = 𝑉π an das elektrooptische Material in einem Arm des Interferometers führt eine Phasenverschiebung von π ein. Welche Spannung muss angelegt werden, um den Schalter über Kreuz zu schalten, wenn der Schalter für 𝑉 = 0 linear durchgeschaltet ist? Geben Sie das Übersprechen (in dB) an, das durch einen Fehler von 1 % in der angelegten Spannung verursacht wird. Aufgabe 24-7: Zeitfensterwechsler
Wie Abb. 24.69 zeigt, kann ein Zeitfensterwechsler als fünfstufiger Prozess realisiert werden: Zeit-RaumMapping, Zeitverzögerung, Raumschaltung, Zeitverzögerung und Raum-Zeit-Mapping. Entwerfen Sie eine andere Variante unter Verwendung der programmierbaren Verzögerer aus Abb. 24.70.
Aufgabe 24-8: Photonische Logikgatter
Abbildung 24.78 zeigt, wie ein nichtlineares optisches Schwellenelement verwendet werden kann, um ein und- (and-) Gatter herzustellen. Zeigen Sie, wie auf ähnliche Weise ein nand-, oder- (or-) und nor-Gatter hergestellt werden kann. Ist es möglich, auf diese Weise ein xor- (exklusives oder/or) Gatter zu realisieren? Kann auf diese Weise auch ein oder für 𝑁 binäre Eingänge erhalten werden?
Aufgabe 24-9: Bistabiles Interferometer
Ein Kristall mit einem optischen Kerreffekt wird in einen der Arme eines Mach-Zehnder-Interferometers gestellt. Die transmittierte Intensität 𝐼A wird zurückgeführt und bestrahlt den Kristall. Zeigen Sie, dass die In1 tensitätstransmission des Systems 𝐼A ∕𝐼E = 𝒯(𝐼A ) = + 2 1 cos(π 𝐼A ∕𝐼π + 𝜑) ist, wobei 𝐼π und 𝜑 Konstanten sind. 2 Nehmen Sie 𝜑 = 0 an und skizzieren Sie 𝐼A als Funktion von 𝐼E . Leiten Sie einen Ausdruck für den maximalen differentiellen Gewinn d𝐼A ∕ d𝐼E her.
Weiterführende Literatur Optische Verbindungen
F. Chang (Hrsg.), Datacenter Connectivity Technologies: Principles and Practice, River Publishers 2018. T. Tekin, R. Pitwon, A. Håkansson, N. Pleros (Hrsg.), Optical Interconnects for Data Centers, Elsevier-Woodhead 2017. Sonderheft über optische Verbindungen, Journal of Lightwave Technology 34(12), 2016. A. Siokis, K. Christodoulopoulos, E. Varvarigos, ‚Multipoint Architectures for On-Board Optical Interconnects‘, Journal of Optical Communications and Networking 8, 863–877, 2016. N. Bamiedakis, K. A. Williams, R. V. Penty, I. H. White, ‚Integrated and Hybrid Photonics for High-Performance Interconnects‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. J. Orcutt, R. Ram, V. Stojanović, ‚CMOS Photonics for High Performance Interconnects‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/ Elsevier, 6. Aufl. 2013. C. Kachris, K. Bergman, I. Tomkos (Hrsg.), Optical Interconnects for Future Data Center Networks, Springer 2013. M. A. Taubenblatt, ‚Optical Interconnects for High-Performance Computing‘, Journal of Lightwave Technology 30, 448–458, 2012.
Aufgaben
C. Kachris, I. Tomkos, ‚A Survey on Optical Interconnects for Data Centers‘, IEEE Communications Surveys & Tutorials 14, 1021–1036, 2012. M. J. R. Heck, H.-W. Chen, A. W. Fang, B. R. Koch, D. Liang, H. Park, M. N. Sysak, J. E. Bowers, ‚Hybrid Silicon Photonics for Optical Interconnects‘, IEEE Journal of Selected Topics in Quantum Electronics 17, 333–346, 2011. D. A. B. Miller, ‚Device Requirements for Optical Interconnects to Silicon Chips‘, Proceedings of the IEEE 97, 1166–1185, 2009. M. Haurylau, G. Chen, H. Chen, J. Zhang, N. A. Nelson, D. H. Albonesi, E. G. Friedman, P. M. Fauchet, ‚On-Chip Optical Interconnect Roadmap: Challenges and Critical Directions‘, IEEE Journal of Selected Topics in Quantum Electronics 12, 1699–1705, 2006. L. Pavesi, G. Guillot (Hrsg.), Optical Interconnects: The Silicon Approach, Springer 2006. S. Kawai (Hrsg.), Handbook of Optical Interconnects, CRC Press/Taylor & Francis 2005. G. A. Keeler, B. E. Nelson, D. Agarwal, C. Debaes, N. C. Helman, A. Bhatnagar, D. A. B. Miller, ‚The Benefits of Ultrashort Optical Pulses in Optically Interconnected Systems‘, IEEE Journal of Selected Topics in Quantum Electronics 9, 477–485, 2003. D. A. B. Miller, ‚Rationale and Challenges for Optical Interconnects to Electronic Chips‘, Proceedings of the IEEE 88, 728–749, 2000. S. H. Lee (Hrsg.), Selected Papers on Optical Interconnects and Packaging, Optical Engineering Press 1998 (Milestone Series Bd. 142). J. W. Goodman, F. I. Leonberger, S. Y. Kung, R. A. Athale, ‚Optical Interconnections for VLSI Systems‘, Proceedings of the IEEE 72, 850–866, 1984. Photonische Router, Schalter und Gatter
Siehe auch die Weiterführende Literatur in den Kapiteln 9, 10, 20, 21 und 22 F. Testa, L. Pavesi (Hrsg.), Optical Switching in Next Generation Data Centers, Springer 2018. Z. Chai, X. Hu, F. Wang, X. Niu, J. Xie, Q. Gong, ‚Ultrafast All-Optical Switching‘, Advanced Optical Materials 5, 1600665, 2017. H. Venghaus, N. Grote (Hrsg.), Fibre Optic Communication: Key Devices, Springer, 2. Aufl. 2017. P. R. Prucnal, B. J. Shastri, Neuromorphic Photonics, CRC Press/Taylor & Francis 2017. E. Cohen, S. Dolev, M. Rosenblit, ‚All-Optical Design for Inherently Energy-Conserving Reversible Gates and Circuits‘, Nature Communications 7, 11424 doi: 10.1038/ ncommsll424, 2016. P. J. Winzer, C. J. Chang-Hasnain, A. E. Willner, R. C. Alferness, R. W. Tkach, T. G. Giallorenzi (Hrsg.), A Third of a Century of Lightwave Technology: January 1983–April 2016, D3EE-OSA 2016.
S. Wabnitz, B. J. Eggleton (Hrsg.), All-Optical Signal Processing: Data Communication and Storage Applications, Springer 2015. M. D. Feuer, S. L. Woodward, ‚ROADMs: Reconfigurable Optics for Agile Networks‘, Optics & Photonics News 26(3), 36–43, 2015. K. Bergman, L. P. Carloni, A. Biberman, J. Chan, G. Hendry, Photonic Network-on-Chip Design, Springer 2014. L. Thylen, P. Holmström, L. Wosinski, B. Jaskorzynska, M. Naruse, T. Kawazoe, M. Ohtsu, M. Yan, M. Fiorentino, U. Westergren, ‚Nanophotonics for Low-Power Switches‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. S. L. Woodward, M. D. Feuer, P. Palacharla, ‚ROADM-Node Architectures for Reconfigurable Photonic Networks‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. S. L. Woodward, M. D. Feuer, ‚Benefits and Requirements of Flexible-Grid ROADMs and Networks‘, Journal of Optical Communications and Networking 5, A19–A27, 2013. L. K. Oxenløwe, A. Clausen, M. Galili, H. C. H. Mulvad, H. Ji, H. Hu, E. Palushani, ‚Ultra-High-Speed Optical Time Division Multiplexing‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/ Elsevier, 6. Aufl. 2013. S. Frisken, I. Clarke, S. Poole, ‚Technology and Applications of Liquid Crystal on Silicon (LCoS) in Telecommunications‘. In: I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. K. Ishii, S. Mitsui, H. Hasegawa, K. Sato, S. Kamei, M. Okuno, H. Takahashi, ‚Development of Hierarchical Optical Path Cross-Connect Systems Employing Wavelength/ Waveband Selective Switches‘, Journal of Optical Communications and Networking 3, 559–567, 2011. B. Li, S. J. Chua (Hrsg.), Optical Switches: Materials and Design, Elsevier-Woodhead 2010. T. S. El-Bawab, Optical Switching, Springer 2006. I. Glesk, B. C. Wang, L. Xu, V. Baby, P. R. Prucnal, ‚Ultra-Fast All-Optical Switching in Optical Networks‘, in Progress in Optics, E. Wolf (Hrsg.), Bd. 45, S. 53–117, Elsevier 2003. A. Marrakchi (Hrsg.), Selected Papers on Photonic Switching, SPIE Optical Engineering Press 1996 (Milestone Series Bd. 121). C. S. Tsai, ‚Integrated Acoustooptic and Magnetooptic Devices for Optical Information Processing‘, Proceedings of the IEEE 84, 853–869, 1996. J. E. Midwinter (Hrsg.), Photonics in Switching. I: Background and Components, Academic Press/Elsevier 1993.
917
918
24 Optische Verbindungen und Schalter
J. E. Midwinter (Hrsg.), Photonics in Switching. II: Systems, Academic Press/Elsevier 1993. Bistabile optische Bauelemente
A. Joshi, M. Xiao, Controlling Steady-State and Dynamical Properties of Atomic Optical instability, World Scientific 2012. L. N. Binh, D. Van Liet (Hrsg.), Nonlinear Optical Systems: Principles, Phenomena, and Advanced Signal Processing, CRC Press/Taylor & Francis 2012. H. Kawaguchi, Instabilities and Nonlinearities in Laser Diodes, Artech 1994. D. A. B. Miller, D. S. Chemla, T. C. Damen, T. H. Wood, C. A. Burrus, Jr., A. C. Gossard, W. Wiegmann, ‚The Quantum Well Self-Electrooptic Effect Device: Optoelectronic Bistability and Oscillation, and Self-Linearized Modulation‘, IEEE Journal of Quantum Electronics 21, 1462–1476, 1985. H. M. Gibbs, Optical Bistability: Controlling Light with Light, Academic Press 1985. L. A. Lugiato, ‚Theory of Optical Bistability‘. In: Progress in Optics, E. Wolf (Hrsg.), Bd. 21, S. 69–216, North-Holland 1984.
919
25 Faseroptische Kommunikation Bis zur Mitte der 1970er Jahre beruhten praktisch alle Nachrichtensysteme auf der Übertragung von Information durch elektrische Leitungen oder durch elektromagnetische Strahlung im Radiofrequenz- oder Mikrowellenbereich. Man könnte meinen, dass Licht die offensichtliche Wahl als Kommunikationsmedium gewesen wäre, da es im Gegensatz zu Elektrizität und Radiowellen nicht erst entdeckt werden musste. Es gab jedoch keine verlustarme Möglichkeit, Licht über große Entfernungen zu übertragen – die direkte Übertragung durch die Luft wurde durch Wolken, Nebel und Dunst behindert. Die Erfindung des Lasers in den frühen 1960er Jahren weckte das Interesse an Licht als Kommunikationsmedium, allerdings waren die ersten Laser groß, ineffizient und schwer zu modulieren. Positiv ist zu vermerken, dass geeignete Detektoren für Licht vorhanden waren. Dem Aufkommen der optischen Nachrichtentechnik liegen zwei entscheidende Erfindungen zu Grunde: die Entwicklung von kompakten und effizienten Halbleiter-Lichtquellen wie der lichtemittierenden Diode (LED) oder der Laserdiode (LD) und die Entwicklung verlustarmer optischer Fasern als Lichtleiter. Die Lichtwellentechnik bietet riesige Übertragungskapazitäten, große Abstände der Zwischenverstärker, Unempfindlichkeit gegenüber elektromagnetischen Interferenzen, Abhörsicherheit und eine verhältnismäßig einfache Installation. Mittlerweile wurden Milliarden von Kilometern optischer Fasern rund um den Globus ver-
legt (der Umfang der Erde selbst beträgt dagegen nur 40 Mm!). Das stetig ansteigende Übertragungsvolumen in Form von Daten, mündlicher Kommunikation, Video oder Telemetrie wird von dem unersättlichen Hunger der Menschheit nach Medienkonsum, sozialer Interaktion, Internetanwendungen und Clouddiensten getrieben. Die optische Kommunikationstechnik ist als einzige Methode in der Lage, den gewaltigen und exponentiell steigenden Bedarf an globaler Kommunikation zu befriedigen, und erreicht heute auch Privatwohnungen in Form von faseroptischen Breitbandanschlüssen. Lokale, städtische, regionale, nationale und sogar interkontinentale Netzwerke verbinden heute Organisationen, Städte, Länder, Staaten und ganze Kontinente. Diese Erfolgsgeschichte ist bemerkenswert – und sie ist noch nicht zu Ende.
In diesem Kapitel . . . Dieses Kapitel ist eine Einführung in faseroptische Nachrichtensysteme und Netze. Eine Kommunikationsstrecke zwischen zwei Punkten besteht aus drei Grundelementen, die in Abb. 25.1 dargestellt sind: Einer kompakten Lichtquelle, die durch ein elektrisches Signal moduliert wird, einer verlust- und dispersionsarmen optischen Faser und einem Photodetektor, der das optische Signal wieder in ein elektrisches Signal umwandelt. Diese optischen Kompo-
Sender Signal
/
Empfänger
Faser
Faser
/
Signal
Quelle
Abb. 25.1 Ein faseroptisches Nachrichtensystem. Ein elektrisches Signal wird durch Modulation einer Lichtquelle in ein optisches Signal umgewandelt (E/O). Das optische Signal wird durch die Faser zum Empfänger übertragen, wo
es durch einen Detektor und einen Demodulator wieder in ein elektrisches Signal umgewandelt wird (O/E). Für lange Fasern können optische Zwischenverstärker (ZV) verwendet werden, um das gedämpfte optische Signal zu verstärken.
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
920
25 Faseroptische Kommunikation
nenten wurden in den Kapiteln 18, 10 und 19 im Detail besprochen. Auch optische Verstärker sind in Fasersystemen wertvoll; sie wurden in Kapitel 15 besprochen. Um dieses Kapitel in sich abgeschlossen zu machen, gibt Abschnitt 25.1 eine kurze Zusammenfassung der wesentlichen Eigenschaften von Fasern, Quellen, Detektoren und Verstärkern im Hinblick auf ihre Rolle im Gesamtzusammenhang des Designs, des Betriebs und der Leistungsfähigkeit einer optischen Kommunikationsstrecke. Auch optisches Zubehör wie Verbindungen, Stecker, Kopplungen, Schalter und Multiplexer sind für einen erfolgreichen Betrieb von faseroptischen Verbindungen und Netzen notwendig; einige dieser Bauelemente wurden in Kapitel 24 und anderen Teilen dieses Buchs beschrieben. Abschnitt 25.2 beschreibt die grundlegenden Konstruktionsprinzipien digitaler und analoger faseroptischer Kurz- und Langstrecken-Nachrichtensysteme auf der Grundlage der Intensitätsmodulation. Die maximale Faserlänge für die Übertragung von Daten mit einer vorgegebenen Geschwindigkeit und Leistung wird bestimmt. Die Leistung verschlechtert sich, wenn die Datengeschwindigkeit die Bandbreite der Faser überschreitet oder wenn die empfangene Leistung kleiner ist als die Empfindlichkeit des Empfängers (sodass das Signal nicht vom Rauschen unterschieden werden kann). Anschließend folgt in Abschnitt 25.3 eine Einführung in Modulations- und Multiplexsysteme für die optische Nachrichtentechnik, darunter beispielsweise die Feld-, Intensitäts- und digitale Modulation. Multiplexing dient dazu, mehrere Signale gleichzeitig über einen einzigen Kommunikationskanal zu übertragen; wir werden verschiedene Varianten davon wie beispielsweise das Zeitmultiplexing, das Codemultiplexing, das Wellenlängenmultiplexing und das räumliche Multiplexing kennenlernen. Kohärente optische Nachrichtensysteme, die in Abschnitt 25.4 eingeführt werden, verwenden Licht nicht einfach als Quelle mit einer kontrollierbaren Leistung, sondern vielmehr als elektromagnetische Welle mit einer kontrollierbaren Amplitude, Frequenz und/oder Phase. Sie sind die natürliche Erweiterung von herkömmlichen Radio- und Mikrowellen-Kommunikationssystemen in Richtung größerer Frequenzen. Die moderne HochgeschwindigkeitsElektronik, effiziente spektrale Codierung und digitale Signalverarbeitung haben kohärenten Kommunikationssystemen zu einer unübertroffenen Leis-
tungsfähigkeit im Hinblick auf Empfängerempfindlichkeit und Übertragungskapazität verholfen. Faseroptische Netze sind Kommunikationssysteme, die viele Benutzer mit einer bestimmen geografischen Verteilung verbinden und die von unzähligen Routern und Schaltern kontrolliert werden. Abschnitt 25.5 gibt eine Einführung in solche Netze unter besonderer Berücksichtigung von Wellenlängenmultiplexnetzen.
25.1 Faseroptische Komponenten 25.1.1
Optische Fasern
Eine optische Faser ist ein zylindrischer dielektrischer Wellenleiter aus verlustarmen Materialien, gewöhnlich hochreinem synthetischem Quarzglas (SiO2 ). In der einfachsten optischen Faser, der Stufenindexfaser, hat der Kern des Wellenleiters einen konstanten Brechungsindex, der etwas größer als der des Mantels (des Außenmediums) ist, sodass Licht durch Totalreflexion entlang der Faserachse geführt wird. Wie in Kapitel 10 beschrieben kann die Ausbreitung von Licht durch die Faser untersucht werden, indem man die Trajektorien von geführten Strahlen innerhalb des Kerns untersucht. Nach einer vollständigeren Analyse auf der Grundlage der elektromagnetischen Theorie breitet sich Licht in der Faser in Form von geführten Wellen aus; jede Welle ist eine Mode mit einer spezifischen räumlichen Verteilung, Polarisation, Ausbreitungskonstante, Gruppengeschwindigkeit und Dämpfungskonstante. Es existiert jedoch eine Korrespondenz zwischen jeder Mode und einem zugehörigen Strahl, der innerhalb des Kerns auf einer spezifischen Trajektorie verläuft. Eine Stufenindexfaser wird durch ihren Kernradius 𝑎, die Brechungsindizes 𝑛1 und 𝑛2 von Kern und Mantel und die relative Brechungsindexänderung 𝛥 = (𝑛1 − 𝑛2 )∕𝑛1 charakterisiert, die gewöhnlich sehr klein ist (0.001 ≤ 𝛥 ≤ 0.02). Lichtstrahlen mit Winkeln zur Faserachse kleiner als das Komplement des kritischen Winkels 𝜃 k = cos−1 (𝑛2 ∕𝑛1 ) werden durch vielfache Totalreflexionen an der Grenzfläche Kern/Mantel im Kern geführt. Der Winkel 𝜃k in der Faser entspricht einem Ak−1 zeptanzwinkel 𝜃A = sin (NA) für Strahlen, die aus der Luft in die Faser einfallen, wobei √ √ NA = sin 𝜃A = 𝑛12 − 𝑛22 ≈ 𝑛1 2𝛥 (25.1) die numerische Apertur ist.
25.1 Faseroptische Komponenten
Vielmodenfasern
Gradientenindexfasern
Stufenindexfasern
Die Zahl 𝑀 der geführten Moden wird für eine Vielmoden-Stufenindexfaser durch den Parameter V = 2π(𝑎∕𝜆0 ) NA bestimmt, wobei 𝑎∕𝜆0 das Verhältnis des Kernradius 𝑎 zur Vakuumwellenlänge 𝜆0 ist. In einer Faser mit V ≫ 1 gibt es eine große Zahl von Moden, 2 𝑀 ≈ V ∕2. Da sich die Moden mit unterschiedlichen Gruppengeschwindigkeiten ausbreiten, ist eine Pulsverbreiterung die Folge, die linear mit der Faserlänge zunimmt, die sogenannte Modendispersion. Wenn sich ein Lichtpuls in der Faser über eine Entfernung 𝐿 ausbreitet, erscheint er als eine Folge von Pulsen bei den Laufzeitdifferenzen der Moden, wie in Abb. 25.2(a) dargestellt. Der zusammengesetzte Puls hat eine ungefähre quadratisch gemittelte Breite 𝜎𝜏 ≈
𝛥 𝐿 2𝑐1
(25.2)
mit 𝑐1 = 𝑐0 ∕𝑛1 . Für 𝑛1 = 1.46 und 𝛥 = 0.01 ist die zeitliche Verbreiterung pro km beispielsweise etwa 𝛥∕2𝑐1 ≈ 24 ns∕km. Für eine Faserlänge von 100 km breitet sich ein Puls auf eine Breite von 2.4 μs aus. Um 𝜎𝜏 zu minimieren, ist es daher offensichtlich sinnvoll, Fasern mit kleinen Werten von 𝛥 zu verwenden.
Vielmodenfaser: Stufenindex
Die Modendispersion kann auch durch Verwendung von Gradientenindexfasern reduziert werden [Abb. 25.2(b)]. In diesen Fasern ändert sich der Brechungsindex des Kerns allmählich von einem maximalen Wert 𝑛1 auf der Faserachse auf einen minimalen Wert 𝑛2 an der Grenzfläche Kern/Mantel. Die Strahlen folgen gekrümmten Trajektorien mit kürzeren Weglängen als in einer Stufenindexfaser. Der axiale Strahl hat die kürzeste Weglänge, aber die kleinste Phasengeschwindigkeit (den größten Brechungsindex), wohingegen sich schiefe Strahlen über größere Entfernungen ausbreiten, aber mit größeren Phasengeschwindigkeiten (kleinere Brechungsindizes), sodass die Laufzeitdifferenzen ungefähr gleich sind. Wenn die Faser optimal abgestimmt ist (d. h. ein ungefähr parabolisches Profil besitzt), dann ist die Geschwindigkeit der Pulsverbreiterung gleich der der entsprechenden Stufenindexfaser multipliziert mit 𝛥∕2. Für 𝛥 = 0.01 wird die Pulsverbreiterung beispielsweise um einen Faktor 500 reduziert. Dieser Faktor wird in realen Gradientenindexfasern wegen der Schwierigkeit, ideale Indexprofile zu erzeugen, normalerweise nicht ganz erreicht.
n2
Impulsantwort h(t)
(a)
στ
n1 0
Vielmodenfaser: GRIN
n2
(b)
στ
n1 0
Einmodenfaser
t
t
n2 στ
(c)
n1 Mehrkernfaser
0
n2 στ
(d) n1
Abb. 25.2 (a) Stufenindex-Vielmodenfaser: relativ großer Kerndurchmesser, homogene Brechungsindizes in Kern und Mantel, große Pulsverbreiterung aufgrund von Modendispersion. (b) Gradientenindex-Vielmodenfaser: Variierender Brechungsindex des Kerns, weniger Moden, Pulsverbreiterung aufgrund von Modendispersion reduziert. (c) Einmo-
t
0
t
denfaser: kleiner Kerndurchmesser, keine Modendispersion, Pulsverbreiterung nur aufgrund von Material- und Wellenleiterdispersion. (d) Mehrkernfaser: Getrennte Kerne dienen als unabhängige Einmoden- oder Vielmoden-Wellenleiter; eng benachbarte Kerne ermöglichen die gekoppelte Ausbreitung von Moden in Form von Supermoden.
921
922
25 Faseroptische Kommunikation
Faseroptische Vielmodenverbindungen für kurze Strecken
Vielmodenfasern aus Quarzglas sind effiziente und kostengünstige Verbindungen für kurze Strecken. Sie werden oft bei einer Wellenlänge von 850 nm betrieben und in lokalen Netzwerken (LAN) oder Rechenzentren eingesetzt. Die Qualitäten von Vielmodenfasern für diese Wellenlänge werden anhand ihrer Optical Mode Designators (OM) unterschieden: OM1 und OM2 erlauben Bitraten von bis zu 1 Gbit/s über Entfernungen von 300 bzw. 600 m, OM3 und OM4 ermöglichen entsprechend Bitraten von 10 Gbit/s über Entfernungen von 300 bzw. 550 m. Einmodenfasern
Wenn der Kernradius 𝑎 und die numerische Apertur NA einer Stufenindexfaser so klein sind, dass V < 2.405 gilt, ist nur eine einzige Mode erlaubt, und die Faser wird Einmodenfaser genannt [Abb. 25.2(c)]. Ein Vorteil von Einmodenfasern ist das Wegfallen der durch die Modendispersion verursachten Pulsverbreiterung (Abschnitt 10.2.3). Trotzdem gibt es auch in ihnen eine Pulsverbreiterung, da der anfängliche Puls eine endliche spektrale Linienbreite hat und die Gruppengeschwindigkeiten (und daher die Laufzeitdifferenzen) wellenlängenabhängig sind. Dieser Effekt wird chromatische Dispersion genannt. Es gibt zwei Ursachen der chromatischen Dispersion: Materialdispersion, die aus der Abhängigkeit des Brechungsindex von der Wellenlänge resultiert, und Wellenleiterdispersion, die eine Folge der Abhängigkeit der Gruppengeschwindigkeit einer Mode vom Verhältnis zwischen dem Kernradius und der Wellenlänge ist. Die Materialdispersion ist normalerweise größer als die Wellenleiterdispersion. Ein kurzer optischer Puls mit der spektralen Breite 𝜎𝜆 verbreitert sich auf eine zeitliche Breite 𝜎𝜏 = |𝐷|𝜎𝜆 𝐿
(25.3)
proportional zur Entfernung 𝐿 der Ausbreitung und zur Linienbreite 𝜎𝜆 der Quelle, wobei 𝐷 der Dispersionskoeffizient ist. Der Parameter 𝐷 enthält Beiträge der Material- und der Wellenleiterdispersion. Für eine schwach führende Faser (𝛥 ≪ 1) kann 𝐷 in eine Summe 𝐷𝜆 + 𝐷W von Beiträgen des Materials und des Wellenleiters zerlegt werden. Für eine Einmodenfaser mit einer Lichtquelle der spektralen Linienbreite 𝜎𝜆 = 1 nm (aus einem typischen Einmodenlaser) und einem Dispersionskoeffizienten 𝐷 = 1 ps∕(km nm) der Faser (für Betrieb nahe 𝜆0 = 1300 nm mit minimaler Wellenleiterdispersion) ist die durch Gl. (25.3) gegebene Antwortzeit 𝜎𝜏 ∕𝐿 = 1 ps∕km. In einer Faser mir einer Länge von 100 km verbreitert
sich der Puls demnach auf eine zeitliche Breite von 100 ps. Die Geometrien, Brechungsindexprofile und Pulsverbreiterungen in Stufen- und Gradientenindex-Vielmodenfasern sowie in Einmodenfasern werden in Abb. 25.2 schematisch verglichen; dabei sind auch Mehrkernfasern (Abschnitt 10.2.5) eingeschlossen, in denen mehrere Kerne von einem gemeinsamen Mantel umgeben sind. Materialdämpfung und -dispersion
Die Wellenlängenabhängigkeit der Dämpfungskoeffizienten von Quarzglasfasern ist in Abb. 25.3 gezeigt. Wenn die Wellenlängen über das sichtbaren Band hinaus ansteigt, fällt die Dämpfung auf ein Minimum von etwa 0.3 dB/km bei 𝜆0 = 1300 nm, steigt danach bei 1380 nm aufgrund von Absorption durch OH− -Ionen (Abschnitt 10.3.1) wieder etwas an und fällt schließlich auf ihr absolutes Minimum von ≈ 0.16 dB∕km bei 𝜆0 = 1550 nm. Jenseits von 1700 nm steigt die Dämpfung schnell an. Die Abhängigkeit des Dispersionskoeffizienten 𝐷𝜆 von Quarzglas von der Wellenlänge ist ebenfalls in Abb. 25.3 gezeigt. Er ändert sich von negativen Werten bei kleinen Wellenlängen zu positiven Werten bei großen Wellenlängen und geht bei 𝜆0 ≈ 1312 nm durch null. In einem Medium mit negativer Dispersion sind die kurzwelligen Komponenten eines Pulses langsamer als die langwelligen Komponenten. Man spricht dann von normaler Dispersion. Das Gegenteil (anomale Dispersion) findet man in Medien mit positiven Dispersionskoeffizienten (siehe Abschnitt 5.7). Obwohl das Vorzeichen des Dispersionskoeffizienten die Geschwindigkeit der Pulsverbreiterung nicht beeinflusst, kann es eine wichtige Rolle bei der Ausbreitung von Pulsen durch Medien spielen, die aus verschiedenen Materialien mit unterschiedlichen Vorzeichen der Dispersion bestehen, wie in Abschnitt 25.2.4 beschrieben wird (siehe auch Abschnitt 23.3). Dispersionsmodifizierte Fasern
Wie in Abschnitt 10.3.2 beschrieben, beruhen moderne Designs von Einmodenfasern auf Gradientenindexkernen mit speziellen Indexprofilen, die so gewählt sind, dass der Koeffizient 𝐷 der chromatischen Dispersion bei bestimmten Wellenlängen vorgegebene Werte annimmt oder die Wellenlängenabhängigkeit für faseroptische Nachrichtensysteme besonders vorteilhaft ist, wie die folgenden Beispiele zeigen:
25.1 Faseroptische Komponenten
Frequenz (THz)
240 230 220 210
200
190
180
α (dB/km)
Dämpfungskoeffizient
3 1
O
E
S
C
L U
O
E
S
C
L U
0.3
0 –40
700
800
900
1000
1100
1200
1300
1675
1565 1625
1530
–160
1460
–120
1360
–80 1260
Dispersionskoeffizient Dλ (ps/km nm)
0.1 40
1400 1500 1600 1700 Wellenlänge λ 0 (nm)
𝛼 ≈ 0.3 dB∕km und die Dispersion ist minimal; für das C-Band bei 1550 nm ist die Dämpfung minimal (𝛼 ≈ 0.16 dB∕km) und D𝜆 ≈ +17 ps∕(km nm). In Wellenlängenmultiplexsystemen werden zusätzlich die Bänder E („extended“), S („short“), L („long“)und U („ultra-long“) verwendet.
• In dispersionsverschobenen Fasern (DVF) verschwindet 𝐷 nicht bei 1312 nm, sondern bei 𝜆0 = 1550 nm, wo die Dämpfung minimal ist. Manchmal werden dispersionsverschobene Fasern so entworfen, dass 𝐷 in dem Fenster 1500–1600 nm deutlich reduziert, aber nicht null ist (NZ-DVF), da eine gewisse Dispersion zur Vermeidung nichtlinearer Pulsverzerrungen in schmalen intensiven Pulsen nützlich sein kann. Die Wellenlängenabhängigkeit von 𝐷 in dispersionsverschobenen Fasern ist in Abb. 25.4 illustriert [siehe auch Abb. 10.29(a)].
• In dispersionsflachen Fasern verschwindet 𝐷 bei zwei Wellenlängen und ist bei Wellenlängen dazwischen reduziert [siehe Abb. 10.29(b)]. • In dispersionskompensierenden Fasern ist 𝐷 über ein ausgedehntes Band von Wellenlängen proportional zu dem Koeffizienten einer herkömmlichen Stufenindexfaser, hat aber ein entgegengesetztes Vorzeichen. Eine kurze Faser mit einem großen umgekehrten Dispersionskoeffizienten kann verwendet werden, um die von einer langen konventionellen Faser eingeführte Pulsverbreiterung zu kompensieren, siehe Abb. 10.29(c).
Dispersionskoeffizient D/[ps/(km nm)]
Abb. 25.3 Wellenlängenabhängigkeit der Dämpfung 𝛼 und des Koeffizienten D𝜆 der Materialdispersion von Quarzglasfasern mit unterdrückter OH-Absorption. Drei spektrale Bänder sind schattiert dargestellt: Für das früher verwendete Band bei 870 nm ist 𝛼 ≈ 1.5 dB∕km und D𝜆 ≈ −80 ps∕(km nm); für das O-Band bei 1310 nm ist
20
230
220
Frequenz/THz 210 200 190
180
konventionell
10
G.655
0
NZ-DVF
–10 –20
DVF
O 1300
E
G.653
S
C L
1400 1600 1500 Wellenlänge λ 0 /nm
U 1700
Abb. 25.4 Wellenlängenabhängigkeit des chromatischen Dispersionskoeffizienten D einer konventionellen Faser und Beispiele zweier dispersionsverschobener Fasern.
Andere dispersionsmodifizierte Fasern sind z. B. Hohlkernfasern oder Fasern auf Grundlage photonischer Kristalle, die in Abschnitt 10.4 beschrieben wurden. In diesen Fasern wird die chromatische Dispersion durch die Wellenleiterdispersion dominiert, die stark von der geometrischen Anordnung der Löcher abhängt. So kann eine Abflachung der Dispersion über breite Wellenlangenbereiche erreicht werden oder ebenso eine Dispersionsverschiebung zu Wellenlängen unterhalb der Wellenlänge, für die die Materialdispersion null ist. Fasern auf Basis photonischer Kristalle können so konstruiert werden, dass sie über einen breiten Bereich von Wellenlängen als Einmodenwellenleiter arbeiten. In Fasern mit einem hohlen Kern und einem Mantel mit
923
924
25 Faseroptische Kommunikation
periodisch angeordneten Löchern wird Licht im Kern durch Reflexion am umgebenden Mantel geführt. Da sich das Licht in dem hohlen Kern ausbreitet, sind die Verluste gering und nichtlineare Effekte sind reduziert. Polarisationsmodendispersion
Eine andere Form der Pulsverbreiterung, die Polarisationsmodendispersion (PMD), wird durch zufällige anisotrope Änderungen in der Faser hervorgerufen, die durch äußere Einwirkungen entlang ihrer Länge verursacht werden. Zufällige Variationen im Betrag und der Orientierung der Doppelbrechung führen differentielle Verzögerungen zwischen den beiden Polarisationsmoden ein; wie in Abschnitt 10.3.2 beschrieben ist der quadratische gemittelte Wert der Pulsverbreiterung aufgrund der PMD proportional zur Wurzel aus der Faserlänge, √ 𝜎PMD = 𝐷PMD 𝐿 ,
(25.4)
ist, der normawobei 𝐷PMD ein Dispersionsparameter √ lerweise zwischen 0.1 und 1 ps∕ km liegt. Polarisationsmodendispersion ist vor allem bei hohen Datengeschwindigkeiten von Bedeutung, wenn andere Formen der Dispersion kompensiert sind. Nichtlineare optische Effekte
Quarzglasfasern zeigen zwei Arten von nichtlinearen optischen Effekten – Nichtlinearität dritter Ordnung, die dem optischen Kerreffekt zugrunde liegt, und nichtlineare inelastische Streuung, die für die induzierte Raman- und Brillouinstreuung verantwortlich ist. Wenn optische Pulse mit hoher Leistung durch Einmodenfasern mit kleinen Querschnitten übertragen werden, kann die optische Intensität so groß sein, dass diese nichtlinearen Wechselwirkungen auftreten, was mehrere unerwünschte Effekte zur Folge hat, die die Integrität von Signalen in Nachrichtensystemen beeinträchtigen: ist eine Form der nichtlinearen Dispersion, die durch den optischen Kerreffekt (die Abhängigkeit des Brechungsindex und folglich der Phasengeschwindigkeit von der optischen Intensität, wie in Abschnitt 22.3.1 beschrieben) verursacht wird. Da verschiedene Segmente des optischen Pulses sich mit unterschiedlichen Geschwindigkeiten ausbreiten, ist eine Pulsverbreiterung die Folge (siehe Abschnitt 23.3.2). Der optische Kerreffekt kann auch ein Übersprechen zwischen gegenläufigen Wellen in bidirektionalen Nachrichtensystemen zur Folge haben.
Selbstphasenmodulation
resultiert aus der nichtlinearen Wellenmischung, bei der die Phasengeschwindigkeit einer Welle mit einer Wellenlänge von den Intensitäten von Wellen mit anderen Wellenlängen abhängt, die sich gleichzeitig in derselben Faser ausbreiten (siehe Abschnitt 22.3.3). In Wellenlängenmultiplexsystemen kann die Kreuzphasenmodulation ein bedeutendes Übersprechen zwischen den unterschiedlichen Kanälen verursachen. Vierwellenmischung hängt ebenfalls mit nichtlinearen Effekten dritter Ordnung zusammen (siehe Abschnitt 22.3.4). Sie verursacht Übersprechen zwischen vier Wellen mit unterschiedlichen Wellenlängen, die sich gleichzeitig in derselben Faser ausbreiten, wobei die Wellen Energie austauschen können. Das führt einen intensitätsabhängigen Gewinn/Verlust in die Kanäle eines Wellenlängenmultiplexsystems ein. Induzierte Raman- und Brillouinstreuung sind inelastische Streuprozesse, die auf Wechselwirkungen zwischen Licht und molekularen oder akustischen Schwingungen des Mediums beruhen. In diesen Prozessen wechselwirken zwei optische Wellen mit unterschiedlichen Wellenlängen über eine Molekülschwingung (Raman) bzw. eine akustische Welle (Brillouin) des Mediums miteinander (siehe die Abschnitte 14.5.3, 15.3.4 und 16.3.1). Solche Wechselwirkungen führen ebenfalls zu unerwünschtem Übersprechen zwischen Kanälen eines Wellenlängenmultiplexsystems. Kreuzphasenmodulation
Die nachteiligen Auswirkungen nichtlinearer Effekte in der faseroptischen Kommunikation können gemindert werden, indem man den Kerndurchmesser erhöht und dadurch die Energiedichte verringert. Manchmal lässt sich das durch Verwendung von Fasern auf der Grundlage von photonischen Kristallen mit großer Modenfläche (Abschnitt 10.4) erreichen, obwohl dazu oft die Neuentwicklung von Fasern notwendig ist. Die nichtlinearen Eigenschaften von Fasern können jedoch auch für nützliche Anwendungen in Nachrichtensystemen ausgenutzt werden. Die nichtlineare Dispersion durch Selbstphasenmodulation kann genutzt werden, um chromatische Dispersion in der Faser auszugleichen, wobei optische Solitonen entstehen (siehe Abschnitt 23.5.2). Nichtlineare Wechselwirkungen können auch genutzt werden, um durch Vierwellenmischung oder induzierte Ramanstreuung Gewinn zu erzeugen. Optische Raman- und Brillouinverstärker werden in den Abschnitten 15.3.4 und 25.1.3 beschrieben.
25.1 Faseroptische Komponenten
25.1.2 Quellen für optische Sender Die Anforderungen an die in optischen Nachrichtensystemen verwendeten Lichtquellen hängen von der genauen Art der beabsichtigten Anwendung (Langstrecken-Kommunikation, lokale Netze usw.) ab. Die wichtigsten Eigenschaften sind in diesem Zusammenhang: Die Wellenlänge der Quelle muss mit dem Material der Faser kompatibel sein, d. h. in der Regel in der Nähe der Wellenlänge ihres minimalen Verlustes oder ihrer minimalen Dispersion liegen. Leistung. Die Leistung einer Lichtquelle muss so groß sein, dass das empfangene Signal nach der Übertragung durch die Faser mit der erforderlichen Genauigkeit nachweisbar ist. Geschwindigkeit. Die Leistung der Lichtquelle muss mit der nötigen Geschwindigkeit modulierbar sein, damit die Information codiert werden kann. Linienbreite. Die Lichtquelle muss eine so kleine spektrale Linienbreite besitzen, dass das Phasenrauschen und die Wirkung der chromatischen Dispersion in der Faser minimiert werden. Rauschen. Stochastische Fluktuationen in der Leistung der Lichtquelle müssen vermieden werden, besonders in kohärenten Nachrichtensystemen. Sonstige Eigenschaften. Andere wichtige Eigenschaften sind z. B. Robustheit, Kompaktheit, Zuverlässigkeit, Kosten, Lebensdauer sowie Unempfindlichkeit gegenüber äußeren Einflüssen wie z. B. der Temperatur.
n-InP InPSubstrat
p-InP DFBGitter
Wellenlänge.
Laserdioden und Oberflächenemitter
Sowohl quantenbeschränkte Laserdioden (LD) als auch Oberflächenemitter (VCSEL) werden in faseroptischen Nachrichtensystemen häufig als Quellen verwendet; sie wurden in den Abschnitten 18.4 und 18.5.1 detailliert besprochen. Laserdioden kommen in der Regel eher in Langstrecken-Kommunikationssystemen zum Einsatz; VCSEL eher in Kurzstreckensystemen. Wir wollen beide nacheinander kurz besprechen. Langstrecken-Kommunikationssysteme
Langstrecken-Kommunikationssysteme mit hohen Bitraten basieren in der Regel auf Einmoden-Quarzglasfasern, von denen Milliarden von Kilometern den Globus umspannen. Sie werden mithilfe von Laserdioden aus InGaAsP, einem quaternären III-V-Halbleiter mit direkter Bandlücke (Abschnitt 18.1.3), bei Wellenlängen im Telekommunikationsband zwischen 1.3 und 1.6 μm betrieben, dem Bereich minimaler Streuung und Dämpfung (Abb. 25.3). Wie in Abschnitt 18.4.1 erläutert wurde, werden in solchen Systemen aufgrund ihrer überle-
Faser
aktive Region InGaAsP/InGaAsPMehrfachquantenschicht
Abb. 25.5 Ein für faseroptische Kommunikation verwendeter Mehrfachquantenschichtlaser mit eingebetteter Heterostruktur und verteilter Rückkopplung. Die dielektrische Schicht liefert Gewinnführung, während die alternierenden p- und n-Schichten einen Stromfluss nur in der Umgebung der aktiven Region erlauben. Solche Laser bieten großen Gewinn bei moderaten Strömen und liefern Ausgangsleistungen von 1 W oder mehr in einer einzelnen räumlichen Mode. Typische Werte des Schwellenstroms und der differentiellen Ansprechempfindlichkeit sind iSch < 10 mA bzw. ℛd ≈ 0.4 W∕A.
genen Eigenschaften häufig Mehrfachquantenschichtlaser und ihre Varianten mit verspannten Schichten eingesetzt. Besonders gut eignen sich kantenemittierende Laserdioden mit verteilter Rückkopplung (DFB). Wie in Abb. 25.5 gezeigt, verwenden diese Geräte ein Gitter aus einer gewellten Schicht neben der aktiven Region, das als verteilter Reflektor fungiert und einen Einfrequenzbetrieb sicherstellt. Diese Bauelemente können auf einer einzelnen räumlichen und longitudinalen Mode betrieben werden und liefern optische Leistungen zwischen einem und etwa zehn Watt, Leistungsumwandlungswirkungsgrade um 70 %, Modulationsraten von 10 Gbit/s, spektrale Breiten von einigen MHz und Lebensdauern von Jahren. Ein Vorteil dieser rauscharmen Laser ist ihre Unempfindlichkeit gegenüber Temperaturschwankungen sowie einer Modulation der Intensität. Der Grund hierfür ist, dass sie nicht zum Chirpen neigen, der Änderung der Laserfrequenz bei Modulation der optischen Leistung aufgrund von Veränderungen des Brechungsindex im Zusammenhang mit Änderungen der Ladungsträgerkonzentrationen bei Modulation des injizierten Stroms. Typische Werte für den Schwellenstrom und die differentielle Ansprechempfindlichkeit sind 𝑖Sch < 10 mA bzw. ℛd ≈ 0.4 W∕A. Kurzstrecken-Kommunikationssysteme
Auch in Kurzstrecken-Kommunikationssystemen werden häufig Quarzglasfasern eingesetzt, meist jedoch mit Einmoden-VCSEL als Lichtquellen, die im Telekommunikationsband zwischen 1.3 und 1.6 μm betrieben wer-
925
926
25 Faseroptische Kommunikation
den. Sie haben eine geringe Leistungsaufnahme, verbrauchen wenig Strom und können mit Bitraten von mehr als 10 Gbit/s moduliert werden. Ihre geringe optische Leistung kann durch den Einsatz von Verstärkern ausgeglichen werden. Einige Kurzstreckensysteme auf der Basis von Quarzglasfasern verwenden auch AlGaAs bei 850 nm. Kostengünstigere Systeme auf der Grundlage von Kunststofffasern arbeiten bei 650 nm und verwenden AlInGaP-Dioden. Fasern mit Durchmessern von 1 mm und Polymerkernen können Datenraten von 1 Gbit/s liefern. Für die Kommunikation mit hoher Bandbreite stehen Module aus VCSEL mit Wellenlängenmultiplexing zur Verfügung (Abschnitt 25.1.5). Andere Lichtquellen
Außer Laserdioden und VCSEL werden auch eine Reihe von anderen Lichtquellen in Kommunikationssystemen eingesetzt (oder besitzen zumindest das Potential dazu).
der Lichtquelle, die Linienbreite, das Phasenrauschen und die Abstimmbarkeit des lokalen Oszillators. Für derartige Systeme werden derzeit häufig abstimmbare Laserdioden mit externem Resonator (Abschnitt 18.3.3) eingesetzt, robustere und kostengünstigere Alternativen wie Laser mit verteilter Rückkopplung sind jedoch in Entwicklung. Vielmodenlaser
Obwohl sie eine größere Leistung liefern, sind Vielmoden-Laserdioden nicht sehr populär, da sie unter Aufteilungsrauschen leiden. In Anwesenheit von chromatischer Dispersion in der Faser führt die stochastische Aufteilung der Laserleistung auf die Moden zu stochastischen Intensitätsschwankungen und einer Umformung der gesendeten Pulse. Dennoch werden VielmodenVCSEL im Wellenlängenbereich von 750 bis 850 nm gelegentlich in Kurzstrecken-Kommunikationssystemen eingesetzt.
LED
LED sind Laserdioden und VCSEL im Hinblick auf den Einsatz in faseroptischen Systemen im Allgemeinen unterlegen, egal ob sie kanten- oder oberflächenemittierend sind (Abschnitt 18.1). Die Gründe sind ihre geringere Leistung, ihr geringerer Leistungsumwandlungswirkungsgrad, ihre geringere Modulationsgeschwindigkeit sowie ihre größere spektrale Breite und ihr größerer Abstrahlwinkel, die es schwierig machen, das Licht in einen Wellenleiter einzukoppeln. Der Hauptvorteil von LED sind die geringen Kosten. Tatsächlich wurden AlInGaP/InGaP-LED mit resonantem Hohlraum bei einer Wellenlänge von 650 nm (Abb. 18.21) und InGaAsPLED bei einer Wellenlänge von 1.3 μm (Abb. 18.20) als Lichtquellen für Kurzstreckensysteme mit moderaten Bitraten eingesetzt. Im Großen und Ganzen wurden LED jedoch mittlerweile durch VCSEL verdrängt, deren Leistung einfach überlegen ist. Mehrfachquantenpunktlaser
Mehrfachquantenpunktlaser (Abschnitt 18.4.3) zeichnen sich durch geringe Größe, geringe Leistungsaufnahme, niedrige Schwelle, reduzierte Linienbreite, hohe Modulationsbandbreite und Beständigkeit gegen Schwankungen der Betriebstemperatur aus; ihre Ausgangsleistung ist jedoch beschränkt. Faserlaser mit verteilter Rückkopplung
Einige faseroptische Systeme, z. B. diejenigen auf der Grundlage von Wellenlängenmultiplexing oder kohärenter Kommunikation, erfordern Lichtquellen mit einer abstimmbaren Wellenlänge. Insbesondere kohärente Kommunikationssysteme mit modernen Modulationsformen stellen hohe Anforderungen an die Stabilität
Quantenkaskadenlaser im mittleren Infrarot
Das Interesse an faseroptischer Kommunikation im mittleren Infrarotbereich beruht auf einigen relativ neuen Entwicklungen in der Infrarotphotonik: (1) Fortschritten bei der Entwicklung von Fluorid- und anderen Weichglasfasern (Abschnitt 10.5), die im Vergleich zu Quarzglas eine wesentlich geringere Rayleighstreuung und -absorption aufweisen, (2) der Verfügbarkeit von Quantenkaskadenlasern im mittleren Infrarot (Abschnitt 18.4.4) und (3) der Entwicklung von Photodetektoren für den mittleren Infrarotbereich auf der Basis von Materialien wie HgCdTe oder VOx (siehe Abschnitt 19.4 und 19.5).
25.1.3
Optische Verstärker
Optische Verstärker sind unentbehrliche Komponenten in modernen faseroptischen Langstrecken-Nachrichtensystemen. Sie kommen als Nachverstärker (Leistungsverstärker), Zwischenverstärker und Vorverstärker zum Einsatz. Wie Abb. 25.6 zeigt, erhöhen Leistungsverstärker die optische Leistung vor der Einkopplung des Lichts in eine optische Faser, Zwischenverstärker dienen dazu, das Signal während der Übertragung gelegentlich aufzufrischen (siehe Abb. 25.1), und Vorverstärker heben das Signalniveau vor der Photodetektion an. Wir betrachten drei Arten von faseroptischen Verstärkern, die in faseroptischen Kommunikationssystemen zum Einsatz kommen: • Erbiumdotierte Faserverstärker (Abschnitt 15.3.3) • Seltenerddotierte Faserverstärker (Abschnitt 15.3.3) • Raman-Faserverstärker (Abschnitt 15.3.4).
25.1 Faseroptische Komponenten
(a)
(b)
(c)
Sender
Sender
Sender
Empfänger
Faser
Faser
Faser
Faser
Empfänger
Empfänger
Abb. 25.6 Faseroptische Verstärker (OV) übernehmen in einem faseroptischen Nachrichtensystem drei Funktionen: (a) Nach- oder Leistungsverstärker, (b) Zwischenverstärker und (c) Vorverstärker.
Obwohl optische Halbleiterverstärker (OHV, siehe Abschnitt 18.3) kompakt und kompatibel mit integriertphotonischen Schaltungen sind, überwiegen ihre Nachteile im Kontext der faseroptischen Kommunikation doch deutlich. Insbesondere sind sie optischen Faserverstärkern im Hinblick auf die Fasergeometrie, den Gewinn, ihre Interkanal- und Intersymbolinterferenz, ihr Rauschen und ihre Temperaturempfindlichkeit unterlegen. Ähnlich bieten optische parametrische Verstärker zwar einen hohen Gewinn und eine Abstimmbarkeit über ein ausgedehntes spektrales Gebiet, sind den Faserverstärkern jedoch insofern unterlegen, als sie eine Phasenanpassung erfordern und empfindlich gegenüber Nichtlinearitäten und der Polarisation sind. Erbiumdotierte Faserverstärker
Erbiumdotierte Faserverstärker waren die ersten faseroptischen Verstärker; sie werden häufig in faseroptischen Nachrichtensystemen eingesetzt. Wie in Abschnitt 15.3.3 diskutiert bieten sie einen hohen, polarisationsunabhängigen Gewinn, eine große Ausgangsleistung, geringe Einfügungsdämpfung, geringes Rauschen und einen breiten Übergang nahe 𝜆 = 1550 nm (entsprechend der Wellenlänge des minimalen Verlusts in optischen Quarzfasern, wie Abb. 25.3) zeigt. Quasi-Dreiniveaupumpen ist durch longitudinale Einkopplung von Licht in die optische Faser in Vorwärts- oder Rückwärtsrichtung oder auch bidirektional möglich (Abb. 15.19). Als Pumpen kommen in der Regel gespannten Quantenschicht-InGaAs-Laserdioden bei 𝜆0 = 980 nm zum Einsatz, wobei auch Intrabandpumpen bei 1480 nm verwendet wird. Meist wird den Fasern Yb zur Codotierung zugesetzt, um ihren Wirkungsgrad zu erhöhen. In erbiumdotierten Faserverstärkern können Gewinne von mehr als 50 dB mit einigen zehn mW Pump-
leistung erreicht werden, und Ausgangsleistungen von mehr als 100 W sind ohne Weiteres möglich. Die verfügbare Bandbreite ist Δ𝜆 ≈ 40 nm entsprechend Δ𝜈 ≈ 5.3 THz im C-Band. Auch das L-Band kann abgedeckt werden, wenn die Parameter des Faserverstärkers entsprechend angepasst werden. Wegen des großen Gewinns und der Bandbreite dieser Verstärker sind sie sehr geeignet für den Einsatz in Wellenlängenmultiplexsystemen (siehe Abschnitt 25.3.3). Die gemischt homogene/inhomogene Verbreiterung führt zu einem wellenlängenabhängigen Gewinnprofil, das eine Gewinnkompensation notwendig machen kann. Andererseits werden erbiumdotierte Faserverstärker häufig in Sättigung betrieben und weisen ein minimales Übersprechen zwischen verschiedenen gleichzeitig durch sie übertragenen Signalen auf. Seltenerddotierte Faserverstärker
Auch andere Ionen als Er3+ sind zur Herstellung von seltenerddotierten Faserverstärkern geeignet; zu nennen wären hier vor allem Tm3+ und Pr3+ . Tm3+ -dotierte Faserverstärker liefern im S- und U-Band ausgezeichnete Leistungen, Ähnliches gilt für Pr3+ -dotierte Verstärker im O-Band (Abb. 25.3). Obwohl keiner dieser seltenerddotieren Verstärker an den Gewinn und den Wirkungsgrad von erbiumdotierten Faserverstärkern heranreicht, können durch geeignete Kombinationen von Er3+ - und Tm3+ -Faserverstärkern Bandbreiten Δ𝜆 ≈ 150 nm entsprechend Δ𝜈 ≈ 18.8 THz bei 1550 nm erreicht werden. Raman-Faserverstärker
Raman-Faserverstärker arbeiten auf der Grundlage der induzierten Ramanstreuung (siehe die Abschnitte 14.5.3, 15.3.4 und 16.3.3). Wie in Abschnitt 15.3.4 diskutiert gibt es zwei übliche Formen von Raman-Faser-
927
928
25 Faseroptische Kommunikation
verstärkern: Verteilte Raman-Faserverstärker, in denen das Signal und die Pumpe beide durch die Faser geschickt werden, die selbst als Gewinnmedium dient, und lokalisierte Raman-Faserverstärker, in denen ein kurzes Stück einer stark nichtlinearen Faser als Verstärker dient und den Gewinn liefert. Wie bei erbiumdotierten Faserverstärkern kann das Pumpen in Vorwärts- oder Rückwärtsrichtung oder bidirektional erfolgen. Raman-Faserverstärker bieten in der Regel größere Bandbreiten als erbiumdotierte Faserverstärker. Die Bandbreite, über die ein Ramangewinn in Quarzfasern verfügbar ist, beträgt ungefähr 100 nm (entsprechend 12.5 THz bei 1550 nm). Außerdem können mehrere Pumpen mit unterschiedlichen Frequenzen kombiniert werden, um noch größere Bandbreiten zu liefern; im Prinzip kann Ramanverstärkung über den kompletten Transparenzbereich der Faser verwendet werden. Der Gewinn eines Raman-Faserverstärkers, der bei etwa 20 dB liegt, ist wesentlich niedriger als der eines erbiumdotierten Faserverstärkers (genau wie der Wirkungsgrad); beide können jedoch durch Verwendung einer dispersionskompensierenden Faser vergrößert werden. Die relativen Vor- und Nachteile von erbiumdotierten und Raman-Faserverstärkern wurden in Abschnitt 15.3.4 betrachtet. Trotz der Schwächen von Raman-Faserverstärkern im Vergleich zu erbiumdotierten Faserverstärkern machen ihre größere Bandbreite, ihre beliebige Betriebswellenlänge und ihre Kompatibilität mit existierenden Systemen sie für viele Anwendungen interessant. Insbesondere gilt dies für die Verwendung in denjenigen Kommunikationsbändern, in denen erbium- und andere seltenerddotierte Faserverstärker entweder nicht verfügbar sind oder einen zu geringen Wirkungsgrad haben.
25.1.4
Detektoren für optische Empfänger
Eine umfassende Diskussion von Halbleiter-Photodetektoren hatten wir in Kapitel 19 präsentiert. In optischen Nachrichtensystemen werden üblicherweise zwei Arten von Detektoren verwendet: pin-Photodioden und Lawinenphotodioden. Aufgrund ihrer größeren Bandbreite werden pin-Photodioden häufig für Systeme für die kohärente Kommunikation verwendet, die hocheffiziente Modulationstechniken nutzen. Auch SchottkyPhotodioden, die Bandbreiten von bis zu 100 GHz aufweisen können, kommen hier zum Einsatz. Systeme auf der Basis einer direkten Detektion haben aufgrund ihrer Einfachheit und geringen Kosten Vorteile; sie sind außerdem wenig empfindlich gegenüber chromatischer Dispersion, Intersymbolinterferenz und Polarisationsmodendispersion. Sie nutzen häufig
Lawinenphotodioden, weil diese bereits vor der ersten elektronischen Verstärkungsstufe im Empfänger einen Gewinn liefern und dadurch das unerwünschte Schaltungsrauschen reduzieren. Allerdings führt der Gewinnmechanismus der Lawinenphotodiode selbst auch ein Rauschen ein und führt zu einer endlichen Antwortzeit, die die Bandbreite des Empfängers reduzieren kann. Außerdem erfordern Lawinenphotodioden größere Spannungen und komplexere Schaltungen, häufig auch eine Temperaturstabilisierung. Das Signal/Rausch-Verhältnis und die Empfindlichkeit von Empfängern auf der Basis von pin-Photodioden bzw. Lawinenphotodioden wurden in Abschnitt 19.6 besprochen. Detektoren im Wellenlängenbereich 1300–1600 nm
Wie Abb. 25.3 zeigt, sprechen die Dämpfungs- und Dispersionseigenschaften von Quarzglasfasern sehr für einen Betrieb im Wellenlängenbereich 1300–1600 nm, der das O-, E-, S-, C- L- und U-Band umfasst. Silicium ist in diesem Bereich nicht photoempfindlich, weil es transparent ist (𝜆g = 1.11 μm, siehe Tabelle 17.2). pin- oder Lawinenphotodioden aus InGaAs als Photodetektoren
Am häufigsten wird in diesem Wellenlängenbereich In0.53 Ga0.47 As verwendet, das an das InP-Gitter angepasst wurde; seine Bandlücke beträgt 𝐸g = 0.75 eV (𝜆g = 1.65 μm). Sowohl pin-Photodioden als auch Lawinenphotodioden mit getrennten Absorptions-, Ladungsund Verstärkungsschichten (SACM-APD) aus InGaAs/ InGaAsP/InP (für Absorption/Ladung/Verstärkung) werden für Langstrecken-Kommunikationssysteme in diesem Wellenlängenbereich ausgiebig eingesetzt. Wellenleiterstrukturen ermöglichen größere Bandbreiten. Eine typische InGaAs-pin-Photodioden bei 1550 nm besitzt eine Quantenausbeute 𝜂 ≈ 0.80, eine Ansprechempfindlichkeit ℛ ≈ 0.95 A∕W (siehe Abb. 19.19) und eine Bandbreite 𝐵 ≈ 10 GHz. Eine typische SACM-APD aus InGaAs/InGaAsP/InP, die mit einer Vorspannung von einigen 10 V in Sperrrichtung betrieben wird, liefert eine mittlere Verstärkung 𝐺 ≈ 10 und besitzt eine Bandbreite 𝐵 ≈ 10 GHz (Beispiel 19-5). InGaAs-APD erreichen bei senkrechtem Einfall eine hervorragende Empfängerempfindlichkeit für Bitraten von bis zu 10 Gbit/s, bei höheren Bitraten begrenzen jedoch drei Faktoren ihre Leistung: (1) Da für InGaAs in diesem Wellenlängenbereich 𝛼 ≈ 104 cm−1 ist, muss der Absorptionsbereich ≈ 2.5 μm dick sein, um 𝜂 > 90 % zu erreichen. (2) Wenn diese Bedingung erfüllt ist, begrenzt die zugehörige Laufzeit die Bandbreite bei geringer Verstärkung auf 𝐵 ≈ 10 GHz; bei größeren Verstärkungen kommt die Lawinenaufbauzeit ins Spiel
25.1 Faseroptische Komponenten
und das relativ kleine Produkt aus Verstärkung und Bandbreite (𝐺𝐵 < 100 GHz) schränkt den Frequenzgang ein. (3) Das Ionisationsverhältnis 1∕k ≈ 0.3 für InP bewirkt ein signifikant höheres Zusatzrauschen als für Si. Andererseits kann das Verstärkungsrauschen der Lawinenphotodiode verringert und ihre Geschwindigkeit erhöht werden, indem man Multiplikationsschichten aus Al0.48 In0.52 As verwendet, die eine Verringerung des Ionisationsverhältnisses auf 1∕k ≈ 0.2 und noch weniger bewirken können, wenn man die Schichten so dünn macht, dass Totraumeffekte (verlaufsabhängige Ionisation) eine unterstützende Rolle spielen (Abschnitt 19.6.2). Das Produkt aus Verstärkung und Bandbreite kann so auf 𝐺𝐵 ≈ 235 GHz erhöht werden. pin- oder Lawinenphotodioden in Ge-auf-Si-Technik als Photodetektoren
Auch Germanium kann im Wellenlängenbereich von 1300–1600 nm als lichtempfindliches Material für pinund APD-Detektoren dienen. Obwohl die Verwendung von Ge zunächst verschiedene Nachteile besitzt, bieten monolithische Bauelemente aus dem Bereich der Gruppe-IV-Photonik auf der Grundlage von Germanium auf Silicium den großen Vorteil, dass sie CMOSkompatibel und daher für eine On-Chip-Integration geeignet sind. Bauelemente auf der Basis von Wellenleitern bieten sowohl eine hohe Quantenausbeute als auch eine hohe Geschwindigkeit, da sie die Lichtabsorption und die Ladungsträgererzeugung entkoppeln. Mit dem Einsatz von Ge-auf-Si-Bauelementen sind jedoch zwei wesentliche Einschränkungen verbunden: (1) Die Lichtempfindlichkeit von Ge fällt für 𝜆0 > 1550 nm schnell ab und (2) der Dunkelstrom ist aufgrund der Gitterfehlanpassung zwischen Ge und Si relativ groß. Das in Beispiel 19-2 beschriebene spezielle Design einer pin-Photodiode für 1550 nm mit Ge-auf-SiWellenleiter beruht auf der Stoßkopplung des Lichts aus einem Siliciumwellenleiter an den intrinsischen Bereich einer lateral an dessen Ende integrierten Ge-aufSi-Photodiode. Dieses Bauelement bietet eine Ansprechempfindlichkeit ℛ ≈ 1 A∕W und eine Bandbreite 𝐵 > 50 GHz. Die Leistung ist vergleichbar mit der, die durch hybride Integration von InGaAs auf Si erreichbar ist. Bei der in Beispiel 19-6 betrachteten Ge-auf-Si-SACMAPD mit senkrechtem Einfall treffen Photonen auf eine Absorberschicht aus Germanium, die auf einer Siliciumschicht aufgebracht ist, in der die Trägermultiplikation stattfindet. Zur Begrenzung des Dunkelstroms wird durch eine Ladungsschicht aus Silicium ein schwaches elektrisches Feld im Absorptionsbereich aufrechterhalten. Mit nicht gezielt dotierten Ge- und Si-Schichten mit Dicken von 1 bzw. 0.5 μm und einer p-dotierten
Si-Ladungsschicht mit einer Dicke von 0.1 μm erreicht eine solche Lawinenphotodiode eine mittlere Verstärkung 𝐺 ≈ 50, ein Produkt aus Bandbreite und Verstärkung 𝐺𝐵 ≈ 350 GHz (wesentlich größer als für eine InGaAs/InP-Lawinenphotodiode), eine Ansprechempfindlichkeit ℛ ≈ 5.9 A∕W bei 𝜆0 = 1.3 μm, ein Ionisationsverhältnis k ≈ 0.09 und ein Bitraten von 25 Gbit/s. Photodetektoren aus AlInAsSb-Lawinenphotodioden
Die jüngsten Bemühungen zur Verbesserung der Leistung von Lawinenphotodioden konzentrierten sich auf die Entwicklung neuer Strukturen und Materialien, die ein geringeres Rauschen und höhere Geschwindigkeiten bei ausreichender Verstärkung ermöglichen. Ein Beispiel ist die AlInAsSb-Lawinenphotodiode mit getrennter Absorptions-, Ladungs- und Verstärkungsschicht, ein III-V-Bauelement mit direkter Bandlücke für das Telekommunikationsband zwischen 1.3 und 1.6 μm. Strukturen wie die in Beispiel 19-7 beschriebene erreichen eine Quantenausbeute 𝜂 ≈ 0.4 und einen Dunkelstrom, der zwar etwas größer ist als der der zuvor diskutierten InGaAs/AlInAs-Lawinenphotodiode, aber immer noch wesentlich kleiner als der einer Ge-auf-SiLawinenphotodiode. Das Produkt aus Bandbreite und Verstärkung dürfte 𝐺𝐵 > 300 GHz erreichen. Das Ionisationsverhältnis k ≈ 0.01 bei einer mittleren Verstärkung 𝐺 = 10 ist mit dem von Silicium vergleichbar (siehe Beispiel 19-12). Detektoren im Wellenlängenbereich zwischen 800 und 900 nm
Wie in Abschnitt 25.2.1 erläutert wurden faseroptische Kommunikationssysteme der ersten Generation meist bei 𝜆0 ≈ 870 nm betrieben, weil das die Wellenlänge der GaAs-LED und -Laserdioden war, die in den frühen 1960er Jahren entwickelt worden waren (Abschnitt 18.1.3). Kurzstrecken-Kommunikationssysteme auf der Grundlage von Quarzglasfasern, die heute in diesem Wellenlängenbereich arbeiten, beruhen normalerweise auf Al𝑥 Ga1−𝑥 As-Bauelementen (Abschnitt 25.1.2). Photodetektoren aus Silicium-pin- und Lawinenphotodioden
pin- und Lawinenphotodioden aus Silicium sind in diesem Wellenlängenbereich sehr effektiv. Handelsübliche Si-pin-Photodioden für eine Wellenlänge von beispielsweise 850 nm erreichen Quantenausbeuten 𝜂 ≈ 0.9, Ansprechempfindlichkeiten ℛ ≈ 0.6 A∕W (Abb. 19.19) und Bandbreiten 𝐵 ≈ 15 GHz. Was Silicium-Lawinenphotodioden angeht, hat eine typische APD mit separater Absorptions- und Verstärkungsschicht ihre maximale Empfindlichkeit bei einer Wellenlänge von 800 nm (Beispiel 19-11). Unter geeig-
929
930
25 Faseroptische Kommunikation
neten Bedingungen sind hier Quantenausbeuten 𝜂 ≈ 0.8, mittlere Verstärkungen 𝐺 ≈ 50, Produkte aus Verstärkung und Bandbreite 𝐺𝐵 ≈ 350 GHz und Ionisationsverhältnisse k ≈ 0.02 möglich. Photodetektoren für das mittlere Infrarot
Wie in Abschnitt 25.1.2 erwähnt, wurde das Interesse an faseroptischer Kommunikation im mittleren Infrarotbereich durch neuere Fortschritte bei Fluorid- und anderen Weichglasfasern (Abschnitt 10.5), durch das Aufkommen von Quantenkaskadenlasern (Abschnitt 18.4.4) und durch Verbesserungen der Photodetektoren für das mittlere Infrarot gestärkt (Abschnitt 19.4). Photodetektoren aus HgCdTe-Lawinenphotodioden
Die Qualität von Hg𝑥 Cd1−𝑥 Te-Lawinenphotodioden mit separater Absorption und Verstärkung, deren Grenzwellenlängen zwischen 2 und 11 μm im mittleren IR liegen, hat sich erheblich verbessert. Ein Bauelement wie das in Beispiel 19-8 beschriebene besitzt eine hohe Quantenausbeute (𝜂 ≈ 0.9), eine hohe Verstärkung (𝐺 > 1000) und ein großes Produkt aus Verstärkung und Bandbreite (𝐺𝐵 > 1 THz); allerdings ist dafür eine Kryokühlung erforderlich. Das Ionisationsverhältnis k ≈ 0 ist dem von Si (Beispiel 19-12) überlegen, sodass der in Gl. (19.54 definierte Zusatzrauschfaktor 𝐹 = ⟨𝐺 2 ⟩∕⟨𝐺⟩2 auf 𝐹 ≤ 2 begrenzt und unabhängig von ⟨𝐺⟩ ist. Die Kennlinie Gewinn/Spannung verläuft exponentiell.
25.1.5
Integriert-photonische Schaltkreise
Moderne faseroptische Kommunikationssysteme verwenden komplexe Modulationsformate, um hohe Kapazitäten zu erreichen. Oft sind dafür hochkohärente Laser mit schmalen Linienbreiten erforderlich. Die Siliciumphotonik bietet eine nützliche Basis für die Herstellung hochwertiger On-Chip-Lichtquellen auf der Grundlage der Integration von III-V-Photoemittern mit direkter Bandlücke mit CMOS-kompatiblen Siliciumsubstraten (Abschnitt 18.1.4). Dabei ersetzen aktive Regionen aus Quantenpunkten häufig die bewährten Quantenschichten, da sie weniger empfindlich auf Temperaturschwankungen und Versetzungen reagieren, die aus dem Nebeneinander der verschiedenen Materialien resultieren (Abschnitt 18.4.3). Wie in Kapitel 9 erläutert, bezeichnet integrierte Photonik (oder integrierte Optik) die Kombination verschiedener optischer Bauelemente und Komponenten auf einem einzigen Chip mit dem Ziel, einen bestimmten Zweck zu erreichen oder eine bestimmte Funktion auszuführen. Das Design und die Herstellung von integrierten photonischen Schaltkreisen (PIC, engl.
photonic integrated circiuts) beruhen auf integrierter Photonik und Siliciumphotonik. PIC erlauben die Miniaturisierung und eine Erhöhung der Packungsdichte von photonischen Schaltkreisen, genau wie elektronische integrierte Schaltkreise (IC) die Miniaturisierung und eine Erhöhung der Packungsdichte von elektronischen Schaltkreisen ermöglichen. In einem monolithischen PIC werden die verschiedenen Bauelemente gleichzeitig auf demselben Chip hergestellt und viele Chips werden auf einem Wafer kombiniert. Passive PIC werden auch als ebene Lichtwellenschaltungen (PLC, engl. planar lightwave circuit) bezeichnet, und PIC, die sowohl photonische als auch elektronische Komponenten enthalten, werden optoelektronische integrierte Schaltungen (OEIC) genannt. Aus der Gruppe IV kommen für die Herstellung von PIC Siliciumwellenleiter und Laser, Modulatoren und Photodetektoren auf Siliciumbasis infrage. Die Telekommunikationsindustrie setzte lange Zeit auf PIC aus III-V-Materialien, da diese leicht Licht emittieren, sich durch den elektrooptischen Effekt einfach modulieren lassen und an viele verwandte Materialien gitterangepasst werden können. Zwar können in einen InP-PIC Tausende von Komponenten integriert werden, aber der Herstellungsprozess ist komplex und kostenintensiv. Im Gegensatz dazu führen die Kompatibilität von Si-basierten PIC mit etablierten CMOS-Produktionsprozessen und die sonstigen Vorteile von Materialien der Gruppe IV zu weitaus höheren Integrationsdichten bei gleichzeitig effizienterer und kostengünstigerer Integration. Darüber hinaus können PIC auf der Grundlage der Siliciumphotonik eine verbesserte Funktionalität bieten, indem sie die jeweiligen Vorteile von III-V-Materialien und Silicium geschickt kombinieren. Beispielsweise kann ein III-V-Material mit direkter Bandlücke eine hohe Verstärkung liefern, während die Speicherung der Photonen in einem Ringresonator in einer undotierten Siliciumschicht mit geringem Verlust und hohem Gütefaktor erfolgt. PIC enthalten häufig zahlreiche Standardbausteine wie z. B. Laser, Modulatoren, Koppler, Splitter, Verstärker und Photodioden auf dem Chip, die von optischen Wellenleitern verbunden sind. PIC werden für das Erzeugen, Fokussieren, Aufteilen, Kombinieren, Isolieren, Polarisieren, Koppeln, Modulieren, Transportieren, Multiplexen, Schalten und Nachweisen von Licht eingesetzt. PIC auf einem höheren Integrationsniveau kombinieren Sender- und Empfängerfunktionalität auf demselben Chip und dienen als optische Transceiver (Optochips) oder kohärente optische Transceiver. Sie kommen in einer Vielzahl von optischen Kommunikationssystemen und -netzen zum Einsatz, einschließ-
25.2 Faseroptische Nachrichtensysteme
lich der Telekommunikation (auf Lang- oder Kurzstrecken oder über Tiefseekabel), der Datenkommunikation (LAN und Rechenzentren) und der Kommunikation innerhalb von Computern (Chipverbindungen und Hochleistungsrechner), siehe hierzu Abschnitt 24.1.6). Transceiver-PIC, die Standard-On-Chip-Bausteine sowie Filter und Wellenlängenmultiplexer/-demultiplexer enthalten, sind im Handel mit Bitraten von mehr als 100 Gbit/s erhältlich. PIC werden auch als chipbasierte phasenempfindliche Sensoren sowie in Anwendungen wie Nachtsichtgeräten, integriert-optischer Gyroskopie oder Lidar eingesetzt.
25.2 Faseroptische Nachrichtensysteme Das einfachste Nachrichtensystem ist eine Verbindung von Punkt zu Punkt. Die Information wird durch ein Signal übertragen – eine physikalische (elektrische, elektromagnetische, optische usw.) Variable, die an einem Punkt ausgesendet und am anderen beobachtet wird. Um über dieselbe Verbindung gleichzeitig mehr als ein Signal zu übertragen, müssen die Signale durch ein unterschiedliches Attribut gekennzeichnet (z. B. Zeit, Frequenz oder Wellenlänge) oder durch eine Codierung identifiziert werden. Diese Verfahren werden als Multiplexing bezeichnet. In einem faseroptischen Nachrichtensystem ist die Verbindung eine optische Faser, durch die eine mit dem Signal modulierte Lichtwelle transmittiert wird. Die modulierte physikalische Variable, die die Information trägt, kann die optische Intensität, die Amplitude, Frequenz, Phase oder Polarisation sein. Das einfachste Beispiel ist das in Abb. 25.7 dargestellte System auf der Basis der Intensitätsmodulation. Das einfachste Beispiel für optisches Multiplexing ist das Wellenlängenmultiplexing, bei dem mehrere Signale mit unterschiedlichen optischen Wellenlängen gleichzeitig durch dieselbe Faser übertragen werden, wie Abb. 25.8 illustriert.
Sender
t
(a)
Faser
/
λ1 λ2 λ1 + λ2 + . . λN
λN
λN
/
Abb. 25.8 Wellenlängenmultiplexing.
Ein Maß für die Leistung eines analogen Nachrichtensystems ist die Bandbreite 𝐵 (Hz). Sie ist die maximale Frequenz, mit der die modulierte optische Leistung durch die Verbindung übertragen werden kann, sodass das empfangene Signal mit einem vorgegebenen Signal/Rausch-Verhältnis nachweisbar ist. Die Bandbreite wird durch die Antwortzeit des Nachrichtenkanals und die Dämpfung bzw. den Rauschpegel am Empfänger bestimmt. Entsprechend ist ein Maß für die Leistung eines digitalen Nachrichtensystems die maximale Bitrate 𝐵0 (Bits pro Sekunde oder bps), bei der die Bits des empfangenen Signals mit einer vorgegebenen maximalen Fehlerwahrscheinlichkeit nachweisbar sind. Diese Datengeschwindigkeit wird durch die Dämpfung und die durch das System eingeführte Pulsverbreiterung sowie durch den Rauschpegel am Empfänger bestimmt. Tabelle 25.1 zeigt eine Auswahl der im Synchronous Optical Network Tab. 25.1 Datenraten gemäß SONET-Standard. Ebene
Abkürzung
Optical Carrier Level 1 Optical Carrier Level 3
OC-1 OC-3
52 Mbit/s 156 Mbit/s
Optical Carrier Level 12 Optical Carrier Level 24 Optical Carrier Level 48 Optical Carrier Level 192 Optical Carrier Level 768 Optical Carrier Level 1920
OC-12 OC-24 OC-48 OC-192 OC-768 OC-1920
622 Mbit/s 1.25 Gbit/s 2.5 Gbit/s 10 Gbit/s 40 Gbit/s 100 Gbit/s
Empfänger
1 0 1 0 0 1 1 0 1
(b)
λ1 λ2
Übertragungsrate
t
1 0 1 0 0 1 1 0 1
t
Sender
Faser
Empfänger
t
Abb. 25.7 Faseroptisches Nachrichtensysteme auf der Grundlage der Intensitätsmodulation. (a) Analoges System: Die Leistung der Lichtquelle ist proportional zum Signal, das eine kontinuierliche Funktion der Zeit ist und z. B. ein Audio- oder Videosignal beschreibt. (b) Digitale Verschlüsselung: Die Bits „1“ bzw. „0“ werden durch die An- bzw. Abwesenheit eines optischen Pulses symbolisiert.
931
932
25 Faseroptische Kommunikation
(SONET) Standard für die optische Kommunikationstechnik festgelegten Datenraten. Wir beginnen mit einer Übersicht über die Entwicklungsgeschichte von faseroptischen Nachrichtensystemen, gefolgt von einer quantitativen Analyse der Leistungsgrenzen einfacher digitaler und analoger Systeme auf der Grundlage der Intensitätsmodulation.
25.2.1 Entwicklungsgeschichte faseroptischer Nachrichtensysteme Wie Abb. 25.3 zeigt, liegt die minimale Dämpfung in Quarzglas bei ≈ 1550 nm, wohingegen die Materialdispersion bei ≈ 1312 nm minimal ist. Die Wahl zwischen diesen beiden Wellenlängen hängt von der relativen Wichtigkeit von Leistungsverlusten und Pulsverbreiterung ab, wie in Abschnitt 25.2.2 erläutert wurde. Die Verfügbarkeit einer geeigneten Lichtquelle ist allerdings auch ein wichtiger Faktor. Faseroptische Nachrichtensysteme der ersten Generation wurden bei ≈ 870 nm betrieben (der Wellenlänge der ersten LED und LD aus GaAs), wo sowohl Dämpfung als auch Materialdispersion der verwendeten optischen Fasern relativ groß sind. Mit der Verfügbarkeit besserer Halbleitermaterialien wurden neuere Systeme bei größeren Wellenlängen entwickelt; die heutigen Systeme der 2. und 3. Generation arbeiten bei 1300 bzw. 1550 nm. Einige der zahlreichen Möglichkeiten für Kombinationen aus Betriebswellenlänge, Bauelementen, Materialien und Arten von Fasern, aus denen sich optische Verbindungen herstellen lassen, sind in Abb. 25.9 zusammengefasst sind. Die Fortschritte bei der Realisie-
Wellenlänge /nm λ 0 /nm 800
Quelle:
LED LASER
Detektor:
pin Lawinenphotodiode
900
1000
1100
rung von faseroptischen Systemen folgten historisch einer Tendenz zu immer größeren Wellenlängen, von Vielmoden- zu Einmodenfasern, von lichtemittierenden Dioden (LED) zu Laserdioden (LD), von pin-Photodioden zu Lawinenphotodioden, von optischen Halbleiterverstärkern zu faseroptischen Verstärkern und von direkter Detektion zu kohärenter Detektion. Voraussetzung für diese Fortschritte waren Fortschritte bei der gezielten Manipulation und Konstruktion von Bandstrukturen sowie von Gläsern, die zu hochinteressanten quaternären Halbleiterverbindungen mit Bandlücken bei größeren Wellenlängen sowie zu hocheffizienten modernen Quarzglasfasern führten. Die Entwicklung von faseroptischen Komponenten und Systemen war und ist getrieben durch den Wunsch nach immer größeren Bitraten 𝐵0 der Übertragung und immer größeren Distanzen 𝐿 der Verbindungen; das Produkt 𝐿𝐵0 [meist in (km Gbit)/s angegeben] wurde und wird als Maß für den Fortschritt verwendet. Die auf den folgenden Seiten beschriebenen neun Generationen von Systemen folgen dieser Entwicklung; Abb. 25.10 zeichnet die Steigerung von 𝐵0 und 𝐿𝐵0 im Laufe der Jahre nach. Die ersten drei Systeme, die häufig als faseroptische Systeme der ersten drei Generationen bezeichnet werden, erreichten zwischen 1974 und den 1990er Jahren eine Steigerung von 𝐿𝐵0 um einen Faktor 1000. Diese Technologien werden in der Diskussion der Systemleistung in Abschnitt 25.2.2 als Beispiele verwendet. Wie Abb. 25.10 zeigt, haben die darauf folgenden Fortschritte diese elementaren Systeme in mehrere Richtungen erweitert, was von 1990 bis 2005 zu einer Steigerung von 𝐿𝐵0 um weitere fünf Größenordnun-
1200
O
E
1300
1400
VielmodenEinmoden-
1500
1600
1700
InGaAsP
AlGaAs Si
Ge InGaAs EDFA seltenerddotierte Faserverstärker Raman-Faserverstärker
Verstärker: Faserverstärker
Faser:
S C L U
Quarzglas
DSF
Abb. 25.9 Arten und Materialien von optischen Quellen, Detektoren, Verstärkern und Fasern bei verschiedenen Wellenlängen. Die senkrechten grauen Schattierungen deuten die üblichen Telekommunikationsbänder der Faseroptik an. Die ersten Generationen von optischen Verbindungen wurden bei Wellenlängen nahe 870, 1310 und 1550 nm betrieben.
25.2 Faseroptische Nachrichtensysteme
gen führte. Diese Verzehnfachung alle vier Jahre wird manchmal als optisches mooresches Gesetz bezeichnet. Das war die frühe Technologie der 1970er Jahre. Die Fasern waren entweder Stufenindex- oder Gradientenindexfasern. Die Lichtquelle war entweder eine LED oder ein Laser (zu Beginn GaAs und später AlGaAs). Sowohl pin- als auch Lawinenphotodioden auf Siliciumbasis wurden als Photodetektoren verwendet. Die Leistung dieser Systeme wurde durch die hohe Dämpfung der Faser und Modendispersion beschränkt. Eine typische regionale Nachrichtenverbindung dieser Zeit arbeitete mit 𝐵0 = 100 Mbit∕s über eine Länge 𝐿 = 10 km, d. h. es galt 𝐿𝐵0 = 1 km Gbit∕s. Mehrere derartige optische Verbindungen konnten mithilfe von optisch-elektrisch-optischen Zwischenverstärkern verkettet werden, die als Repeater bezeichnet wurden. Jeder dieser Repeater erforderte eine Photodetektion, eine elektrische Verstärkung und die anschließende Erzeugung eines neuen optischen Signals. System 2: Einmodenfasern bei 1310 nm. Der Wechsel zu Einmodenfasern und einer Wellenlänge, bei der die Materialdispersion minimal ist, führte in den 1980er Jahren zu einer bedeutenden Verbesserung der Leistung, die hauptsächlich durch die Dämpfung der Faser beschränkt war. Zum Einsatz kamen System 1: Vielmodenfasern bei 870 nm.
InGaAsP-Laserdioden und Photodetektoren aus pinoder Lawinenphotodioden auf Basis von InGaAs (manchmal auch Ge-Lawinenphotodioden). Eine typische Langstreckenverbindung dieser Klasse wurde mit 622 Mbit/s entsprechend OC-12 und einem Repeaterabstand 𝐿 = 40 km betrieben, es galt also 𝐿𝐵0 ≈ 25 km Gbit∕s. System 3: Einmodenfasern bei 1550 nm. Bei dieser Wellenlänge wurden Quarzglasfasern eingesetzt, die hier ihre geringste Dämpfung besitzen. Die Leistung war durch die Materialdispersion beschränkt, die durch Monofrequenzlaser aus InGaAsP mit verteilter Rückkopplung und geringem Chirp reduziert wurde. Später wurden dispersionsverschobene Fasern eingesetzt, die das Dispersionsproblem reduzierten und die Leistung erhöhten. Als Beispiel für ein solches Systems möge eine terrestrische oder Unterwasser-Langstreckenverbindung mit 2.5 Gbit/s (OC-48) über eine Entfernung 𝐿 = 100 km entsprechend 𝐿𝐵0 ≈ 250 km Gbit∕s dienen. Fortschritte bei Sendern und Empfängern konnten diese Systeme bis auf 10 Gbit/s (OC-192) verbessern, entsprechend 𝐿𝐵0 = 1 km Tbit∕s. System 4: Kohärente Empfänger. Wie in Abschnitt 25.4 beschrieben, wird bei der kohärenten Detektion Licht aus einer lokalen Quelle (dem lokalen Oszillator) am Detektor mit dem Signallicht gemischt, anstatt wie bei der direkten Detektion die Intensität
1011 1010 Bitrate–Entfernung LB 0 (km-Gbit / s)
10
SDM
1 Pbit/s
Digital kohärent
9
10 8 10 7
1 Tbit/s
WDM OFA
10 6 10 5 10 4 10
1310 nm SMF
10 2 10
1 Gbit/s
1550 nm SMF (DSF)
3
870 nm MMF
⑤Soliton ④Kohärent
1 1970
1980
1990
2000
Abb. 25.10 Die Geschichte der faseroptischen Nachrichtensysteme zeigt eine kontinuierliche Verbesserung der Bitrate B0 (linke Ordinate) und des Produkts LB0 aus Bitrate und Entfernung (rechte Ordinate, i. d. R. für L = 10 000 km). Die gestrichelten Linien für die Systeme 4 und 5 beschreiben Systeme, die nach den bekannten ersten drei Generationen von Systemen (1–3) entwickelt wurden, sich aber nicht großflächig durchsetzen konnten. Die Systeme 6 und 7 werden sowohl über Land als auch untereseeisch in großem
2010
2020
Maßstab eingesetzt; die Systeme 8 und 9 sind neuere Entwicklungen. Die Systeme 7–9 beruhen auf optischen Faserverstärkern und Wellenlängenmultiplexing; ihre Leistung ist so überlegen, dass die Mehrzahl der auf den Systemen 1–6 basierenden Kommunikationssysteme inzwischen stillgelegt wurden. Die gestrichelte Gerade beschreibt das „optische mooresche Gesetz“, wonach sich die Bitrate optischer Systeme alle vier Jahre verzehnfacht.
933
934
25 Faseroptische Kommunikation
des Signals direkt in einem Photodetektor zu messen. Die kohärente Detektion erhöht die Empfindlichkeit des Empfängers und erlaubt dadurch größere Übertragungsentfernungen, allerdings auf Kosten einer erhöhten Komplexität. Infolgedessen hinkt die Verbreitung von kohärenten Systemen hinter der von Systemen mit direkten Detektion her, insbesondere seit dem Aufkommen von faseroptischen Verstärkern. System 5: Optische Solitonen. Solitonen sind kurze (≈ 1 bis 50 ps) optische Pulse, die sich durch lange optische Fasern ausbreiten können, ohne die Form ihrer Einhüllenden zu ändern. Wie in Abschnitt 23.5.2 besprochen, gleichen sich die Effekte der Faserdispersion und der nichtlinearen Selbstphasenmodulation (z. B. durch einen optischen Kerreffekt hervorgerufen) genau aus, sodass die Pulse sich verhalten, als ob sie sich durch ein lineares nichtdispersives Medium ausbreiteten. In Verbindung mit der Solitonenübertragung werden erbiumdotierte Faserverstärker oder Raman-Faserverstärker verwendet, um Absorptions- und Streuverluste zu kompensieren. Bereits im Jahr 2002 führte die Deutsche Telekom einen Feldversuch mit dem lambdaXtremeWellenlängenmultiplexsystem von Lucent Technologies durch. Dieses System bot 128 Kanäle mit einer Kapazität von jeweils 10 Gbit/s im Wellenlängenmultiplexing und erreichte insgesamt 𝐵0 = 1.28 Tbit∕s und 𝐿𝐵0 ≈ 5120 km Tbit∕s über eine Länge von 𝐿 = 4000 km. Allerdings sind die Dispersionseigenschaften existierender faseroptischer Verbindungen meist nicht optimal für solitonoptische Systeme, sodass diese Technologie sich bisher nicht auf breiter Front durchsetzen konnte. System 6: Optische Faserverstärker. Das Aufkommen von erbiumdotierten optischen Faserverstärkern (siehe Abschnitt 25.1.4) im Jahr 1987 hatte einen dramatischen Einfluss auf die Leistung von faseroptischen Nachrichtensystemen. Periodisch entlang der Faser angeordnet, kompensieren diese Verstärker die Dämpfung durch volloptische Verstärkung des Signals und vergrößern daher die Entfernung, über die Signale übertragen werden konnten. Die erste Transpazifikverbindung auf der Grundlage von optischen Faserverstärkern war das tpc-5-Kabelnetz, das aus vier in einem Ring angeordneten Einmodenfasern bestand, die mit einer Bitrate von 𝐵0 = 10 Gbit∕s über eine Entfernung von 𝐿 = 22 500 km betrieben wurde, was 𝐿𝐵0 = 225 km Tbit∕s ergibt. System 7: Wellenlängenmultiplexing. Beim Wellenlängenmultiplexing werden viele Wellenlängen (Kanäle) gleichzeitig durch dieselbe Faser übertragen, was
die Kapazität des Systems dramatisch erhöht. Optische Breitbandverstärker verstärken alle Kanäle gleichzeitig. Optische Verbindungen, die für den Betrieb auf einer einzigen Frequenz ausgelegt sind, können durch Austausch der Komponenten an den Enden der Verbindungsstrecke auf Wellenlängenmultiplexing umgerüstet werden, ohne die Faserverstärker dazwischen auszutauschen. Die Kapazität des Systems lässt sich durch Dispersionsmanagement und Vorwärtsfehlerkorrektur weiter verbessern. Ein Beispiel für ein Wellenlängenmultiplexsystem ist das transpazifische tpe-Kabelnetz zwischen den USA und China aus dem Jahr 2010. Jede Faser dieses aus acht Faserpaaren bestehenden Kabels erreicht eine Bitrate von 10 Gbit/s pro Kanal entsprechend 𝐵0 = 5.12 Tbit∕s. Mit 𝐿 = 18 000 km ergibt sich daraus 𝐿𝐵0 = 92 km Pbit∕s. System 8: Digitale kohärente Empfänger mit effizienter spektraler Codierung. Auf den Erfolg des Wellen-
längenmultiplexing in den 1990er und 2000er Jahren folgte der Versuch, den spektralen Wirkungsgrad des Systems [in (bit/s)/Hz gemessen] zu verbessern. Dies führte zu einer Wiederbelebung des Interesses an kohärenten Systemen in Verbindung mit Wellenlängenmultiplexing und einer optimierten digitalen Codierung und Signalverarbeitung. Die erste transpazifische Verbindung auf der Basis eines digitalen kohärenten Systems war das im Jahr 2016 in Betrieb genommene unterseeische fasterKabelnetz. Es verwendet sechs Paare von extrem verlustarmen Fasern ohne dispersionskompensierende Abschnitte (die kumulierte Dispersion wird am Kabelende durch digitale Signalverarbeitung kompensiert, wodurch das Verstärkungsrauschen eines optischen Verstärkers entfällt). Jede der zwölf Fasern arbeitet mit 100 Gbit/s pro Kanal, bei 100 Kanälen im Wellenlängenmultiplexing beträgt die gesamte Bitrate somit 𝐵0 = 60 Tbit∕s in jede Richtung. Die Übertragung über eine Distanz 𝐿 = 9000 km zwischen Oregon und Japan ergibt somit 𝐿𝐵0 ≈ 540 km Pbit∕s. Das im C- und L-Band betriebene Pacific Light Cable Network (plcn) aus dem Jahr 2018 erreicht eine Kapazität von 𝐵0 = 120 Tbit∕s, die doppelt so hoch ist wie die des faster-Systems. Das plcn-Netz erstreckt sich von Los Angeles nach Hongkong über eine Entfernung 𝐿 = 12 800 km, und erreicht damit 𝐿𝐵0 ≈ 1.5 km Ebit∕s. System 9: Raummultiplexing. Wenn die für das Wellenlängenmultiplexing verfügbare spektrale Bandbreite ausgeschöpft ist und der spektrale Wirkungsgrad und Phasenmodulation für die digitale kohärente Detektion optimiert sind, bleibt nur noch ein Frei-
25.2 Faseroptische Nachrichtensysteme
H(0) = exp[−𝛼𝐿], wobei 𝛼 ≈ 0.23α die Dämpfungskonstante ist. Auch lokalisierte Leistungsverluste an Kopplern können in α erfasst werden. Die Antwortzeit 𝜎𝜏 ist die Breite von ℎ(𝑡). Sie bestimmt die zeitliche Verbreiterung von optischen Pulsen und begrenzt daher die maximale Datengeschwindigkeit in digitalen Systemen. In einer Einmodenfaser ist beispielsweise 𝜎𝜏 = |𝐷|𝜎𝜆 𝐿, wobei 𝜎𝜆 die Linienbreite der Lichtquelle (nm) und 𝐷 der Dispersionskoeffizient (ps/km nm) sind. Die Antwortzeit ist proportional zur Länge der Faser. Die Bandbreite 𝜎F ist die Breite der Übertragungsfunktion |H(𝑓)|. In einem analogen System bestimmt die Bandbreite die maximale Frequenz, mit der die Eingangsleistung moduliert und erfolgreich vom Empfänger nachgewiesen werden kann. Da H(𝑓) und ℎ(𝑡) durch eine Fouriertransformation verknüpft sind, ist die Bandbreite 𝜎F umgekehrt proportional zur Antwortzeit 𝜎𝜏 . Die Proportionalitätskonstante hängt von dem tatsächlichen Profil von ℎ(𝑡) ab (siehe Abschnitt A.2). Zur Veranschaulichung verwenden wir die Beziehung 𝜎F = 1∕2π𝜎𝜏 .
heitsgrad für die Erhöhung der Systemkapazität übrig. Dies hat zu Überlegungen geführt, Vielmodenfasern zu verwenden, um in unterschiedlichen räumlichen Moden unabhängige Kanäle zu übermitteln. Für das Raummultiplexing wurden Mehrkernfasern entwickelt, in denen jeder Kern mehrere räumliche Moden führt. Die Entwicklung von Multiplexern und Demultiplexern sowie von Methoden der digitalen Signalverarbeitung zur Kompensation des inhärenten Übersprechens ist im Gange. Aus 50 räumlichen Kanälen und 100 Wellenlängenmultiplexkanälen könnten so insgesamt 5000 Kanäle resultieren. Bei 200 Gbit/s pro Kanal könnte eine einzelne Faser dann eine Bitrate von 1 Pbit/s ermöglichen.
25.2.2 Die Leistungsfähigkeit von faseroptischen Systemen Um die Leistungsfähigkeit eines faseroptischen Systems beurteilen zu können, benötigen wir zuerst ein mathematisches Modell, das die Wirkung der verschiedenen Systemkomponenten, vor allem der optischen Faser, auf das modulierte Signal beschreibt. Damit können wir die Form des empfangenen verzerrten Signals beschreiben und daraus das Signal/Rausch-Verhältnis in analogen bzw. zu erwartende Bitfehlerrate in digitalen Systemen zu bestimmen. Für den meisten Anwendungen kann die Faser als lineares System beschrieben werden, das durch eine Impulsantwortfunktion ℎ(𝑡) oder ihre Fouriertransformierte, die Übertragungsfunktion H(𝑓), charakterisiert ist, wobei 𝑓 die Modulationsfrequenz ist (siehe Anhang A). Diese Funktionen werden durch drei wichtige Parameter charakterisiert:
Die maximale Länge einer Faser, über die ein Signal mit einer gewünschten Qualität übertragen werden kann, ist durch die folgenden durch das System eingeführten Fehler begrenzt: bewirkt ein exponentielles Abklingen der optischen Leistung als Funktion der Entfernung [Abb. 25.11(a)]. In einer Entfernung, für die die empfangene Leistung kleiner wird als die Empfindlichkeit des Empfängers, wird die Leistung des Systems inakzeptabel. Dispersion bewirkt mit zunehmender Entfernung eine Verbreiterung der optischen Pulse, die in einem digitalen System die Datenbits darstellen [Abb. 25.11(b)]. Wenn die Breite den Bitabstand überschreitet, überlappen aufeinander folgende Pulse, was zu Intersymbolinterferenz (ISI) und damit zu unerwünschten Fehlern führt. In einem analogen System verwischt die Dispersion hochfrequente Dämpfung
ist der am Ausgang empfangene Anteil der Leistung eines eingegebenen konstanten (unmodulierten) optischen Signals. Sie ist gleich der Übertragungsfunktion H(𝑓) für 𝑓 = 0. Da H(𝑓) die Fouriertransformierte von ℎ(𝑡) ist, ist H(0) = ∫ ℎ(𝑡) d𝑡 die Fläche unter ℎ(𝑡). Für eine Faser der Länge 𝐿 mit der Dämpfungskonstante α (dB/km) ist
Leistung
Pulsbreite
Die Leistungsübertragung
Bitdauer
Empfängerempfindlichkeit
(a)
Entfernung
(b)
Entfernung
Abb. 25.11 (a) Abhängigkeit der optischen Leistung von der Entfernung. (b) Abhängigkeit der Pulsbreite von der Entfernung. Die maximale Länge einer optischen Verbindung wird entweder (a) durch Dämpfung, wenn die empfangene Leistung kleiner wird als die Empfindlichkeit des Empfängers, oder (b) durch Dispersion bestimmt, wenn die Pulsbreite den Bitabstand überschreitet.
935
(a)
Pu
lsb
re
ite
ISI Bi
Bitrate
(b)
td
au
er
Bitrate
Maximalleistung des Pulses
25 Faseroptische Kommunikation
Empfängerempfindlichkeit
936
nichtlineare Intersymbolinterferenz
Bitrate
(c)
Abb. 25.12 Wirkung der Bitrate auf (a) die Empfindlichkeit des Empfängers, (b) die Pulslänge am Empfänger und (c) die maximale Leistung. Bei höheren Bitraten ist das Nachrichtensystem empfindlicher gegenüber Dämpfung, Dispersion und nichtlinearen Effekten.
Komponenten des modulierten Signals und reduziert die Bandbreite des Systems. Rauschen, das durch optische Komponenten wie z. B. optische Verstärker sowie durch stochastische Effekte wie Polarisationsmodendispersion hervorgerufen wird, führt zusätzliche Fehler ein. Nichtlineare Verzerrung von intensiven optischen Pulsen bewirkt eine Vermischung von spektralen Komponenten und die Entstehung von Interferenz zwischen verschiedenen Kanälen Wellenlängenmultiplexsystemen. Bei hohen Bitraten (hohen Modulationsfrequenzen) ist ein Kommunikationssystem aus mehreren Gründen empfindlicher gegenüber Übertragungsfehlern: • Für eine konstante mittlere Leistung entspricht eine höhere Bitrate weniger Photonen pro Bit und daher einem stärkeren Photonenrauschen. Auch andere Rauschquellen im Empfänger werden bei hohen Datengeschwindigkeiten wichtiger. Die Empfindlichkeit des Empfänger ist daher eine zunehmende Funktion der Bitrate [Abb. 25.12(a)]. • Eine höhere Bitrate entspricht kürzeren Pulsen [Abb. 25.12(b)] mit breiteren Spektren und größerer Dispersion. Solche Pulse erfahren eine größere Verbreiterung, die wiederum zu einer stärkeren Intersymbolinterferenz (ISI) führt. • Für eine konstante optische Energie pro Bit erfordert eine höhere Bitrate (kürzere Bitdauer) eine größere optische Leistung [Abb. 25.12(c)], die nichtlineare Wechselwirkungen hervorruft und so zu nichtlinearer Intersymbolinterferenz führt. Bitfehlerraten
Die Leistungsfähigkeit eines digitalen Nachrichtensystems wird durch die Fehlerwahrscheinlichkeit pro Bit gemessen, die als Bitfehlerrate (BFR) bezeichnet wird. Für eine ein-aus-Verschlüsselung wie die in
Abb. 25.7 gezeigte werden die Bits „1“ bzw. „0“ durch die An- bzw. Abwesenheit eines optischen Pulses bezeichnet. Wenn 𝑝1 die Wahrscheinlichkeit ist, eine „1“ für eine „0“ zu halten, und 𝑝0 die Wahrscheinlichkeit, eine „0“ für eine „1“ zu halten, und wenn die beiden Bits mit gleicher Wahrscheinlichkeit übertragen werden, dann 1 1 gilt BFR = 𝑝1 + 𝑝0 . Eine typische akzeptable BFR ist 2
2
10−9 (d. h. im Mittel ein Fehler alle 109 Bit). Fehler treten aufgrund von Rauschen im empfangenen Signal oder einer Verbreiterung des Pulses in benachbarte Bits auf, was zu Intersymbolinterferenz führt. Abbildung 25.13 zeigt ein Beispiel für stochastische Realisierungen von Pulsen entsprechend dem Bit „1“, überlagert von stochastischen Realisierungen eines von benachbarten Pulsen stammenden Signals für Bit „0“. Dieses Diagramm wird als Augendiagramm bezeichnet. Je offener das „Auge“ ist, desto besser sind die Bits „1“ und „0“ unterscheidbar und desto geringer ist die Fehlerwahrscheinlichkeit. Empfängerempfindlichkeit
Die Empfindlichkeit eines digitalen optischen Empfängers ist als die minimale Zahl von Photonen (oder die entsprechende optische Energie) definiert, die pro Bit notwendig ist, um eine BFR unterhalb einer vorgegebenen Schranke (z. B. 10−9 ) zu gewährleisten. Fehler treten wegen der Fluktuationen der pro Bit nachgewiesenen Zahl von Photoelektronen sowie aufgrund des Rauschens in der Empfängerschaltung selbst auf. Die Empfindlichkeit von Empfängern auf Grundlage verschiedener Photodetektoren wurde in Abschnitt 19.6.5 diskutiert. Das einfachste Beispiel eines solchen Empfängers ist ein Empfänger in einem ein-aus-codierten optischen System, dessen Lichtquelle poissonverteilte Photonen emittiert, dessen Detektor eine Quantenausbeute von eins besitzt und dessen Empfängerschaltung rauschfrei ist. In diesem Fall sind im Mittel mindestens n0 = 10
25.2 Faseroptische Nachrichtensysteme
T
t
T
t
T
t
Abb. 25.13 Schließen des Augendiagramms (von links nach rechts) infolge von Rauschen und Pulsverbreiterung.
Photonen pro Bit nötig, um BFR ≤ 10−9 zu gewährleisten. Daher ist die Empfindlichkeit des idealen Empfängers 10 Photonen/Bit. Das bedeutet, dass ein Bit „1“ im Mittel mindestens 20 Photonen enthalten sollte, da das Bit „0“ keine Photonen enthält. In Anwesenheit weiterer Rauschquellen ist natürlich eine größere Zahl von Photonen erforderlich. Eine Empfindlichkeit von n0 Photonen entspricht einer optischen Energie ℎ𝜈n0 pro Bit und einer optischen Leistung 𝑃E =
ℎ𝜈n0 = ℎ𝜈n0 𝐵0 1∕𝐵0
(25.5)
proportional zur Bitrate 𝐵0 . Wenn die Bitrate zunimmt, ist eine höhere optische Leistung erforderlich, um die Zahl der Photonen pro Bit (und damit die BFR) konstant zu halten. In Anwesenheit von Schaltungsrauschen hängt die Empfängerempfindlichkeit n0 von der Bandbreite des Empfängers ab (d. h. von der Datenrate 𝐵0 ). Dieses Verhalten erschwert die Konstruktion eines Systems. Der Einfachheit halber werden wir in der folgenden Analyse annehmen, dass die Empfängerempfindlichkeit (Photonen pro Bit) nicht von 𝐵0 abhängt. Wie wir im Folgenden sehen werden, erfordert die Konstruktion einer faseroptischen Langstrecken-Nachrichtenverbindung mit hoher Bitrate die Auswahl einer Faser mit möglichst kleiner Dämpfung und/oder Dispersion und eine sorgfältige Planung der Leistung und der Pulslänge, um das System vor den Auswirkungen hochintensiver Pulse zu schützen.
25.2.3 Dämpfungs- und dispersionsbegrenzte Systeme In diesem Abschnitt untersuchen wir die Begrenzung der Leistung eines Systems durch Dämpfung und Dispersion in einem digitalen System mit Intensitätsmodulation. Wir vernachlässigen nichtlineare Effekte und nehmen an, dass die Faser selbst kein Rauschen einführt. Wir betrachten eine faseroptische Verbindung, die als digitales Nachrichtensystem mit einer Datengeschwindigkeit von 𝐵0 über eine Entfernung 𝐿 dient. Die Quelle hat die Leistung 𝑃Q , die Wellenlänge 𝜆 und die spektrale
Breite 𝜎𝜆 . Die Faser hat eine Dämpfungskonstante α und einen chromatischen Dispersionskoeffizienten 𝐷𝜆 . Der Empfänger besitzt eine Empfindlichkeit von n0 (Photonen pro Bit), entsprechend einer Leistungsempfindlichkeit 𝑃E = (ℎ𝑐∕𝜆)n0 𝐵0 , die empfangen werden muss, damit das System mit einer akzeptablen Fehlerrate arbeitet. Die Grenzen eines Systems ergeben sich aus der maximalen Entfernung 𝐿, über die die Verbindung Daten mit einer Geschwindigkeit 𝐵0 übertragen kann, ohne die vorgegebene Bitfehlerrate zu überschreiten. Offensichtlich nimmt 𝐿 mit steigendem 𝐵0 ab. Alternativ können wir die maximale Bitrate 𝐵0 bestimmen, die eine Verbindung der Länge 𝐿 mit maximal der vorgegebenen Fehlerrate übertragen kann. Das maximale Produkt 𝐿𝐵0 aus Bitrate und Entfernung dient als Kennzahl für die Leistungsfähigkeit einer Verbindung. Wir werden die typische Abhängigkeit von 𝐿 von 𝐵0 bestimmen und Ausdrücke für das maximale Produkt 𝐿𝐵0 aus Bitrate und Entfernung für verschiedene Arten von Fasern herleiten. Zwei Bedingungen müssen erfüllt sein, damit eine Verbindung zufriedenstellend arbeitet: 1) Die empfangene Leistung muss mindestens gleich der Leistungsempfindlichkeit 𝑃E des Empfängers sein. Diese Bedingung wird mithilfe einer Leistungsvorgabe erfüllt, aus der die maximale Länge der Faser bestimmt wird. Gewöhnlich wird ein Sicherheitszuschlag von 6 dB über 𝑃E gefordert. 2) Die Breite der empfangenen Pulse darf den Bitabstand 1∕𝐵0 nicht wesentlich überschreiten, da ansonsten benachbarte Pulse überlappen und Intersymbolinterferenz auftritt, die die Fehlerraten vergrößert. Diese Bedingung wird mithilfe einer Vorgabe für die Pulsverbreiterung aufgrund des Senders, des Empfängers und der verschiedenen Formen der Dispersion in der Faser erfüllt. Wenn die Bitrate 𝐵0 festgehalten und die Verbindungslänge 𝐿 vergrößert wird, können zwei Situationen eintreten, die die Leistungsfähigkeit beeinträchtigen: Entweder die empfangene Leistung wird kleiner als die Leistungsempfindlichkeit 𝑃E des Empfängers oder die empfangenen Pulse werden breiter als die Bitdauer
937
25 Faseroptische Kommunikation
Sender
Faser
Empfänger
Faser Verbinder
Verbinder optische Leistung / dBm
Verbinder
Quellleistung
Q
αL
} }
}
Empfängerempfindlichkeit
E
Sicherheitszuschlag
S
0
1∕𝐵0 . Im ersten Fall bezeichnet man die Verbindung als dämpfungsbegrenzt, im zweiten Falls als dispersionsbegrenzt. Dämpfungsbegrenzte Systeme: Leistungsvorgabe
Dämpfungsbegrenzte Systeme werden mithilfe einer Leistungsvorgabe bewertet. Da die Dämpfung der Faser in dB gemessen wird, ist es zweckmäßig, auch die Leistung in dB zu messen. Wenn wir eine Leistung von 1 mW als Referenz verwenden, können wir die Einheit dBm wie folgt definieren: (25.6)
Zum Beispiel entsprechen die Leistungen 𝑃 = 0.1 mW, 1 mW, und 10 mW P = −10 dBm, 0 dBm und 10 dBm. In diesen logarithmischen Einheiten sind Leistungsverluste additiv. Wenn PQ die Leistung der Quelle (in dBm) ist, α der Verlust der Faser (in dB/km), PK die Verluste durch Kopplung (in dB) und 𝐿 die maximale Faserlänge, für die die vom Empfänger empfangene Leistung gleich der Empfängerempfindlichkeit PE (in dBm) ist, dann gilt PQ − PK − PS − α𝐿 = PE ,
(25.7)
wobei PS ein Sicherheitszuschlag ist. In Abb. 25.14 ist die optische Leistung schematisch als Funktion der Entfernung vom Sender aufgetragen. Die Leistungsempfindlichkeit PE = 10 log10 PE des Empfängers ergibt sich aus Gl. (25.5), PE = 10 log (
n0 ℎ𝜈𝐵0
10−3
) dBm .
(25.8)
PE steigt also logarithmisch mit 𝐵0 , und die Leistungsvorgabe muss wie in Abb. 25.15 gezeigt für jedes 𝐵0 angepasst werden. Die maximale Länge der Verbindung ergibt sich durch Einsetzen von Gl (25.8) in Gl. (25.7), 𝐿=
n0 ℎ𝜈𝐵0 1 ), (PQ − PK − PS − 10 log α 10−3
(25.9)
C
}
} L
P∕dBm = 10 log10 [P ∕mW] .
Abb. 25.14 Leistungsvorgabe für eine dämpfungsbegrenzte optische Verbindung.
}
z
Quellleistung
0
optische Leistung / dBm
938
Q
–10
αL
–20 –30
ic ndl
ger
E
pfän
–50
Em
–60 –70 100 k
it
hke
K+ S
–40
1M
10 M
100 M
1G
Bitrate B 0 / (bit/s)
10 G
100 G
Abb. 25.15 Leistungsvorgabe als Funktion der Bitrate B0 . Wenn B0 zunimmt, steigt die am Empfänger benötigte Leistung PE (sodass die Energie pro Bit konstant bleibt), und die maximale Länge L nimmt ab.
woraus 10 (25.10) log 𝐵0 α mit 𝐿0 = [PQ − PK − PS − 30 − 10 log(n0 ℎ𝜈)]∕α folgt. Die Länge sinkt mit steigendem 𝐵0 logarithmisch mit der Steigung −10∕α. Abbildung 25.16 zeigt eine Auftragung dieser Beziehung für die Betriebswellenlängen 870, 1300, und 1550 nm. 𝐿 = 𝐿0 −
Dispersionsbegrenzte Systeme: Zeitvorgabe
Ein von einem Sender erzeugter Puls, der ein Datenbit bezeichnet, verliert bei seiner Ausbreitung durch die Faser und seinem Nachweis im Empfänger an Leistung und wird verbreitert. Die Pulsbreite 𝜎E am Ende hängt von der ursprünglichen Pulsbreite 𝜎Q , der Antwortzeit 𝜎Sx des Senders und der Antwortzeit 𝜎𝜏 der Faser, die sich aus verschiedenen Formen der Dispersion ergibt, und der Antwortzeit 𝜎Ex des Empfänger ab. Die tatsächliche Form des empfangenen Pulses kann durch Faltung des ursprünglichen Pulsprofils mit den Impulsantwortfunktionen des Senders, der Faser und des Empfängers bestimmt werden (unter der Annahme, dass alle Systeme linear sind). Wenn alle Funktionen Gaußfunktion
25.2 Faseroptische Nachrichtensysteme
1000
Entfernung L / km
0.16 dB/km 1550 nm 0.35 dB/km
100
1300 nm
2.5 dB/km
870 nm
Koaxialkabel 10 100 k
1M
10 M 100 M Bitrate B0 / (bit/s)
1G
Abb. 25.16 Maximale Faserlänge L als Funktion der Bitrate B0 für eine dämpfungsbegrenzte Quarzglasfaser bei den Wellenlängen 𝜆0 = 870, 1300 und 1550 nm mit Dämpfungskoeffizienten α = 2.5, 0.35 und 0.16 dB/km; Die Leistung der Quelle ist P Q = 1 mW (PQ = 0 dBm), die Empfängerempfindlichkeit ist n0 = 300 Photonen∕Bit bei 870 und 1300 nm und n0 = 1000 Photonen/Bit bei 1550 nm, und PK = PS = 0. Zum Vergleich ist die LB0 -Beziehung für ein typisches Koaxialkabel gezeigt.
10 G
Faser Sender
Empfänger
Abb. 25.17 Zeitvorgabe für die Pulsbreite in einer dispersionsbegrenzten optischen Verbindung.
Grenzwert 2 σEx
στ2
σQ2
2 σSx
0
L
sind, ist das Quadrat der Breite des Pulses am Ausgang gleich der Summe der Quadrate der Breiten aller konstituierenden Funktionen, 2 , 𝜎A2 = 𝜎Q2 + 𝜎Sys
(25.11)
2 2 2 = 𝜎Sx + 𝜎Ex + 𝜎𝜏2 𝜎Sys
mung der maximalen Faserlänge 𝐿. Da der einzige längenabhängige Beitrag zu 𝜎Sys aus der Antwortzeit 𝜎𝜏 der Faser resultiert, werden wir für die folgende Analyse fordern, dass 𝜎𝜏 maximal 25 % der Bitdauer T sein soll, d. h. 1
𝜎𝜏 = T = 4
wobei
z
1 . 4𝐵0
(25.13) 1
(25.12)
die Breite der Antwortfunktion des Systems (aus Sender, Faser und Empfänger) ist. Diese Beziehungen werden in der Praxis auch dann verwendet, wenn die Antwortfunktionen keine Gaußfunktion sind. Eine wesentliche Bedingung für die Verbindung ist, dass die Breite des empfangenen Pulses einen vorgegebenen Bruchteil der Bitperiode T = 1∕𝐵0 nicht überschreiten darf, um das Auftreten von Intersymbolinterferenz zu vermeiden. Die Einhaltung dieser Bedingung kann durch eine Zeitvorgabe (Abb. 25.17) sichergestellt werden. Die Wahl des Anteils der Bitperiode ist beliebig; in der Praxis werden unterschiedliche Festlegungen verwendet. Oft wird z. B. verlangt, dass die Antwortzeit 𝜎Sys des Systems für NRZ-Pulse 70 % der Bitperiode und für RZ-Pulse 35 % der Bitperiode nicht überschreitet (diese Modulationsformate sind in Abb. 25.26 erläutert). Wenn Sender und Empfänger gegeben sind, konzentriert sich das Design einer Verbindung auf die Bestim-
Die Wahl des Faktors ist offensichtlich willkürlich und 4 dient nur zum Vergleich unterschiedlicher Arten von Fasern. Wir betrachten jetzt die Beziehungen zwischen Entfernung und Bitrate, die aus dieser Bedingung für die verschiedenen in Abschnitt 25.1.1 erwähnten dispersionsbegrenzten Fälle resultieren. Die Ergebnisse sind in Abb. 25.18 dargestellt. Für eine Vielmodenfaser wird die Breite des empfangenen Pulses nach der Ausbreitung über eine Entfernung 𝐿 durch die Modendispersion dominiert. Für Stufenindexfasern liefern die Gln. (25.2) und (25.13) eine 𝐿𝐵0 -Beziehung
Vielmodenfaser.
𝐿𝐵0 =
𝑐1 , 2𝛥
(25.14)
wobei 𝑐1 = 𝑐0 ∕𝑛1 die Lichtgeschwindigkeit im Kernmaterial ist und 𝛥 = (𝑛1 − 𝑛2 )∕𝑛1 die relative Brechungsindexdifferenz der Faser. In einer Gradientenindexfaser mit optimalem (näherungsweise parabolischem) Indexprofil ist die Pulsbreite um einen
939
25 Faseroptische Kommunikation
1000 1.55 µm
1.3 µm
(c)
(d)
1.55 µm (e)
(f)
100 Entfernung L / km
940
Gradientenindex-
Vielmodenfasern 10
1 100 k
1M
Einmodenfasern
(b)
(a)
10 M
transformationsbegrenzt
σλ = 1 nm
Stufenindex-
100 M
NZ-DVF
1G
10 G
100 G
1T
Bitrate B0 / (bit/s)
Abb. 25.18 Dispersionsbegrenzte maximaler Faserlänge L als Funktion der Bitrate B0 für Vielmoden- und Einmodenfasern. (a) Stufenindex-Vielmodenfaser (n1 = 1.46, 𝛥 = 0.01), LB0 = 10 km Mbit∕s; (b) Gradientenindex-Vielmodenfaser mit parabolischem Profil (n1 = 1.46, 𝛥 = 0.01), LB0 = 2 km Gbit∕s; (c) Durch Materialdispersion begrenzte Einmodenfaser bei 1550 nm mit D𝜆 = 17 ps∕(km nm)
Faktor 2∕𝛥 kleiner und 𝐿𝐵0 ist um denselben Faktor größer. Für 𝑛1 = 1.46 und 𝛥 = 0.01 ist für Stufenindexfasern 𝐿𝐵0 ≈ 10 km Mbit∕s und für Gradientenindexfasern 𝐿𝐵0 ≈ 2 km Gbit∕s. Einmodenfaser (SMF). Wenn wir annehmen, dass die Pulsverbreiterung in einer Einmodenfaser nur aus Materialdispersion resultiert (d. h. wenn wir die Wellenleiterdispersion vernachlässigen), dann ist die Breite des empfangenen Pulses für eine Quelle der Linienbreite 𝜎𝜆 durch Gl. (25.3) gegeben, sodass 𝐿𝐵0 =
1 , 4|𝐷𝜆 |𝜎𝜆
(25.15)
wobei 𝐷𝜆 der Dispersionskoeffizient des Fasermaterials ist. Für den Betrieb nahe 𝜆0 = 1300 nm kann |𝐷𝜆 | um 1 ps/(km nm) liegen. Für 𝜎𝜆 = 1 nm (die Linienbreite eines Einmodenlasers) ergibt sich dann 𝐿𝐵0 ≈ 250 km Gbit∕s. Für den Betrieb nahe 𝜆0 = 1550 nm ist 𝐷𝜆 = 17 ps∕(km nm) und für eine Quelle mit derselben spektralen Breite 𝜎𝜆 = 1 nm ist 𝐿𝐵0 ≈ 15 km Gbit∕s. Einmodenfaser und transformationsbegrenzte Pulse.
Um chromatische Dispersion zu reduzieren, muss die spektrale Linienbreite 𝜎𝜆 der Quelle klein sein. Spektrale Breiten von Bruchteilen von 1 nm können mit Monofrequenzlasern und externen Modulatoren erhalten werden. Allerdings ist eine kleine spektrale Breite wegen der FT-Beziehung zwischen den spektralen und zeitlichen Verteilungen nicht mit einem
und 𝜎𝜆 = 1 nm, LB0 ≈ 15 km Gbit∕s; (d) Durch Materialdispersion begrenzte Einmodenfaser bei 1300 nm mit |D𝜆 | = 1 ps∕(km nm) und 𝜎𝜆 = 1 nm, LB0 = 250 km Gbit∕s; (e) Einmodenfaser mit transformationsbegrenzten Pulsen bei 1550 nm mit |D𝜆 | = 17 ps∕(km nm); (f) Wie (e), aber mit dispersionsverschobener Faser/NZ-DVF) mit dem chromatischen Dispersionskoeffizienten D𝜆 = 4 ps∕(km nm).
ultrakurzen Puls vereinbar. Wie in Abschnitt A.2 beschrieben haben Pulse mit dem minimalen Produkt aus zeitlicher und spektraler Breite ein Gaußprofil. Solche transformationsbegrenzten Pulse erfahren daher die minimale mögliche Dispersion. Ein transformationsbegrenzter Gaußpuls mit der Breite 𝜏0 und der komplexen Einhüllenden exp(−𝑡2 ∕ 𝜏02 ) hat eine gaußsche spektrale Intensität der Halbwertsbreite 𝜎𝜈 = 0.375∕𝜏0 [siehe Gl. (23.9)]. Das entspricht 𝜎𝜆 = |𝜕𝜆0 ∕𝜕𝜈|𝜎𝜈 = (𝜆02 ∕𝑐0 )𝜎𝜈 = 0.375𝜆02 ∕𝑐0 𝜏0 . Wenn der Puls eine Breite gleich einer halben Bitperiode besitzt, d. h. 𝜏0 = T ∕2 = 1∕2𝐵0 , dann ist 𝜎𝜆 = 0.75
𝜆02 𝐵 𝑐0 0
(25.16)
direkt proportional zur Bitrate 𝐵0 . Für 𝜆0 = 1550 nm und 𝐵0 = 10 Gbit∕s ist beispielsweise 𝜎𝜆 = 0.06 nm. Wenn sich ein transformationsbegrenzter Gaußpuls der Breite 𝜏0 durch ein dispersives Medium mit dem Dispersionskoeffizienten 𝐷𝜈 ausbreitet, wird er in der charakteristischen Entfernung 𝑧0 = π 𝜏02 ∕𝐷𝜈 wie in √ Abschnitt 23.3.2 beschrieben um einen Faktor 2 verbreitert. In dieser Entfernung ist ein Puls √ der anfänglichen Breite 𝜏0 = T ∕2 um eine Zeit ( 2 − 1)T ∕2 ≈ 0.21T gedehnt. Wir können daher 𝑧0 als die maximal akzeptable Länge 𝐿 der Nachrichtenverbindung nehmen. Mit 𝐿 = 𝑧0 = π 𝜏02 ∕𝐷𝜈 , 𝜏0 = T ∕2 =
25.2 Faseroptische Nachrichtensysteme
1∕2𝐵0 und 𝐷𝜈 = 𝐷𝜆 𝜆02 ∕𝑐0 erhalten wir 𝐿𝐵02 =
π 𝑐0 . 4 |𝐷𝜆 |𝜆 2
Gleichzeitig dämpfungs- und dispersionsbegrenzte Systeme
(25.17)
Dispersionsverschobene Einmodenfaser und transformationsbegrenzte Pulse. Die maximale Entfernung er-
In Abb. 25.19 sind die Beziehungen zwischen Entfernung und Bitrate für dämpfungs- und dispersionsbegrenzte Systeme durch Überlagerung der Abb. 25.16 und 25.18 und Auswahl der jeweils kleineren Entfernung kombiniert dargestellt. Die Darstellung ist das Ergebnis einer Analyse der Leistungsdaten der ersten drei Generationen von faseroptischen Kommunikationssystemen (siehe Abb. 25.10): System 1 bei 𝜆0 = 870 nm (Vielmodenfasern), System 2 bei 1300 nm (Einmodenfasern) und System 3 bei 1550 nm (Einmodenfasern). Bei der Erstellung dieser Darstellung sind eine Reihe von vereinfachenden Annahmen und willkürlichen Annahmen eingeflossen; die angegebenen Werte sollten daher nur Hinweise auf die Größenordnung der Leistungsfähigkeit der unterschiedlichen Fasern angesehen werden. Dennoch erlaubt sie einige wichtige Schlussfolgerungen:
reicht für eine gegebene Bitrate bei Verwendung von Einmodenfasern und transformationsbegrenzten optischen Pulsen ihren höchsten Wert; sie wird dann nur durch den Dispersionskoeffizienten beschränkt. Dieser kann durch Verwendung von dispersionsverschobenen Fasern reduziert werden. Wie Abb. 25.18 zeigt, vergrößert eine Reduktion von 𝐷 von 17 ps/(km nm) auf 4 ps/(km nm) mithilfe von dispersionsverschobenen Fasern die maximale Länge bei 10 Gbit/s von 64 km auf 272 km. Allerdings besitzen dispersionsverschobene Fasern etwas größere Dämpfungskonstanten.
• Bei geringen Bitraten ist die Verbindung im Allgemeinen dämpfungsbegrenzt; 𝐿 nimmt logarithmisch mit 𝐵0 ab. Bei hohen Bitraten ist die Verbindung dispersionsbegrenzt und 𝐿 ist umgekehrt proportional zu 𝐵0 für optische Pulse, die durch die Linienbreite der Quelle beschränkt sind, und umgekehrt proportional zu 𝐵02 für transformationsbegrenzte Pulse. • Für Langstrecken-Nachrichtenverbindungen mit hoher Datenrate sind Einmodenfasern erforderlich. Die Wahl zwischen den Wellenlängen 1300 nm und 1550 nm ist nicht eindeutig, da für konventionelle Fa-
0
Die maximale Entfernung 𝐿 ist daher umgekehrt proportional zu 𝐵02 , d. h. sie nimmt mit steigender Datengeschwindigkeit schneller ab als in den zuvor beschriebenen Fällen. Außerdem ist das Produkt 𝐿𝐵0 umgekehrt proportional zur Datengeschwindigkeit 𝐵0 . Abbildung 25.18 zeigt die Beziehung zwischen 𝐿 und 𝐵0 für 𝜆0 = 1550 nm und 𝐷𝜆 = 17 ps∕(km nm). Für 𝐵0 = 10 Gbit∕s ist 𝐿 = 64 km, aber für 𝐵0 = 40 Gbit∕s fällt 𝐿 auf 4 km. Die Verwendung von transformationsbegrenzten Pulsen erweitert daher die Grenzen eines dispersionsbegrenzten Systeme deutlich, wobei der Vorteil mit steigender Bitrate jedoch abnimmt.
1000
1.55 µm
Einmodenfasern
Entfernung L / km
1.3 µm 100
Vielmodenfasern
transformationsbegrenzt
σλ = 1 nm 10
NZ-DVF
Stufenindex-
1 100 k
1M
10 M
100 M 1G Bitrate B0 / (bit/s)
Abb. 25.19 Maximale Entfernung L als Funktion der Bitrate B0 für sechs Arten von Fasern. Diese Darstellung entspricht einer Überlagerung der Abb. 25.16 und 25.18 und der Auswahl der jeweils kleineren maximalen Entfernung. Jede Linie bezeichnet die maximale Entfernung L einer
10 G
OC-768
OC-192
OC-48
Gradientenindex-
100 G
1T
dämpfungs- und dispersionsbegrenzten Verbindung bei der jeweiligen Geschwindigkeit B0 , d. h. die Entfernung, die sowohl den Empfang der erforderlichen Leistung als auch die erforderliche Pulsbreite am Empfänger sicherstellt.
941
942
25 Faseroptische Kommunikation
sern die chromatische Dispersion bei 1300 nm minimal ist, während die Dämpfung bei 1550 nm minimal wird. Das erklärt die Überkreuzung der 𝐿𝐵0-Linien bei diesen Wellenlängen. • Durch Verwendung von dispersionsverschobenen Fasern ist es möglich, den chromatischen Dispersionskoeffizienten bei 1550 nm zu reduzieren, sodass der Betrieb bei 1550 nm im Allgemein dem bei 1300 nm überlegen ist. Leistung von analogen Nachrichtensystemen
Wie bei digitalen faseroptischen Verbindungen ist auch die Leistungsfähigkeit einer analogen Verbindung durch Dämpfung und/oder Dispersion begrenzt. Die Dämpfung schwächt das empfangene Signal, sodass es irgendwann nicht mehr vom Rauschen zu unterscheiden ist. Die Dispersion beschränkt die Bandbreite 𝜎F = 1∕2π 𝜎𝜏 der Übertragung, sodass hochfrequente Komponenten des Signals stärker gedämpft werden als niederfrequente Komponenten, was eine Verschlechterung des Signals bedeutet. Beide Effekte nehmen mit steigender Faserlänge 𝐿 zu. Die empfangene optische Leistung nimmt exponentiell mit 𝐿 ab, während die Bandbreite der Faser umgekehrt proportional zu 𝐿 ist. Nichtlineare Effekte spielen in analogen Systemen keine Rolle, da die Leistung verteilt und nicht in schmalen Pulsen konzentriert ist. Die maximale zulässige Länge einer analogen faseroptischen Verbindung ergibt sich aus den folgenden Bedingungen: • Die Dämpfung muss so klein sein, dass die empfangene Leistung größer ist als die Leistungsempfindlichkeit PE des Empfängers. • Die Bandbreite 𝜎F der Faser muss größer sein als die spektrale Breite 𝐵 des übertragenen Signals. Wie in Abschnitt 19.6 diskutiert ist die Empfindlichkeit eines analogen optischen Empfängers die kleinste optische Leistung des Photostroms, für die das Signal/Rausch-Verhältnis (SRV) einen vorgegebenen Wert SRV0 überschreitet. Für einen idealen Empfänger (mit einer Quantenausbeute von eins und ohne Schaltungsrauschen) ist SRV = n = (P ∕ℎ𝜈)∕2𝐵, wobei 𝐵 die Bandbreite des Empfängers ist, P die optische Leistung, und n die mittlere Zahl von Photonen, die in einem Zeitintervall 1∕2𝐵 empfangen wird, der Auflösungszeit des Systems. Wenn SRV0 das minimal erlaubte Signal/RauschVerhältnis ist, ist die Empfindlichkeit des Empfängers n0 = SRV0 Photonen pro Auflösungszeit und die entsprechende Leistung ist PE = ℎ𝜈n0 (2𝐵) .
(25.18)
Das ist identisch mit dem Ausdruck Gl. (25.5) für die Leistungsempfindlichkeit eines digitalen Empfängers, wenn die Auflösungszeit 1∕2𝐵 des analogen Systems gleich der Bitdauer 1∕𝐵0 des digitalen Systems gesetzt wird. Wegen der Äquivalenz zwischen Gl. (25.18) und Gl. (25.5) und weil die Leistungsvorgabe Gl. (25.7) auch auf analoge Systeme abwendbar ist, gelten die zuvor für digitale Systeme bestimmten Beziehungen zwischen 𝐿 und 𝐵0 auch für analoge Systeme, wenn 𝐵0 durch 2𝐵 ersetzt ist, sofern die akzeptable Leistung des analogen Systems SRV0 = 10 ist. Beispielsweise kann eine faseroptische Verbindung von 1 km Länge, die digitale Daten mit einer Geschwindigkeit von 2 Gbit/s mit einer BFR von maximal 10−9 übertragen kann, auch dazu verwendet werden, um analoge Daten mit einer Bandbreite von 1 GHz mit einem Signal/Rausch-Verhältnis von mindestens 10 zu übertragen. In analogen Systemen ist das erforderliche Signal/ Rausch-Verhältnis jedoch gewöhnlich viel größer als 10, sodass die Empfängerempfindlichkeit viel größer sein muss als 10 Photonen pro Auflösungszeit. Für hochwertige Audio- und Videosignale ist beispielsweise häufig ein Signal/Rausch-Verhältnis von 60 dB erforderlich. Das entspricht SRV0 = 106 oder n0 = 106 Photonen pro Auflösungszeit. Bei der Konstruktion von analogen Systemen sind zusätzliche Anforderungen zu berücksichtigen. Beispielsweise verursacht die nichtlineare Antwort der Lichtquelle und des Photodetektors eine zusätzliche Verschlechterung des Signals und dadurch Beschränkungen des dynamischen Bereichs der übertragenen Wellenformen.
25.2.4 Kompensation und Management von Dämpfung und Dispersion Dämpfungskompensation
Die Leistungsfähigkeit von dämpfungsbegrenzten faseroptischen Nachrichtensystemen kann durch Verwendung von faseroptischen Verstärkern in geeigneten Entfernungen innerhalb der Verbindung wesentlich erhöht werden, wie Abb. 25.20 illustriert. Verstärker erhöhen die verringerte optische Leistung wieder, sodass die empfangene Leistung für längere Verbindungen über der Empfängerempfindlichkeit bleibt. Optische Faserverstärker sind daher unentbehrliche Komponenten in faseroptischen Langstrecken-Kommunikationssystemen, wie auch die überlegene Leistung von System 6 in Abb. 25.10 illustriert. Die durch eine derartige Verstärkung erreichbaren Grenzen werden letztlich durch das von den Verstärkern selbst eingeführte Rauschen gesetzt. Bevor diese Grenze erreicht wird, dominiert aber
25.2 Faseroptische Nachrichtensysteme
Leistung
Faser
Verstärker
Faser
Verstärker
Faser
Abb. 25.20 Dämpfungskompensation durch faseroptische Verstärker.
Verstärker
z
in der Regel die Dispersion und das System wird dispersionsbegrenzt. Dispersionskompensation ist daher in faseroptischen Langstrecken-Nachrichtensystemen mit optischen Zwischenverstärkern unentbehrlich. Dispersionskompensation
Die durch die Ausbreitung eines Pulses durch eine optische Faser mit der Länge 𝐿 und dem Dispersionskoeffizienten 𝐷𝜆 hervorgerufene Pulsverbreiterung kann durch eine sogenannte dispersionskompensierende Faser ausgeglichen werden, einer Faser mit dem Dispersionskoeffizienten 𝐷𝜆′ mit entgegengesetztem Vorzeichen und einer Länge 𝐿′ , die so gewählt wird, dass die Beträge der durch die beiden Fasern eingeführten Dispersionen gleich sind, d. h. 𝐷𝜆′ 𝐿′ = −𝐷𝜆 𝐿 .
(25.19)
Dʹλ (−) Lʹ
Dλ (+) L
Dλ L
Dʹλ Lʹ
Dλ (+) L
Breitbandige Dispersionskompensation: Dispersionsmanagement
Für breitbandige Systeme wie z. B. Wellenlängenmultiplexsysteme muss die Bedingung Gl. (25.19) für die Dispersionskompensation für alle Wellenlängen innerhalb des spektralen Bands erfüllt sein; d. h. der Fehler 𝑒𝜆 = 𝐷𝜆′ 𝐿′ − 𝐷𝜆 𝐿 muss überall null sein. Da die Dispersionskoeffizienten wellenlängenabhängig sind, ist diese Bedingung schwierig zu erfüllen. Abbildung 25.22 illustriert eine Situation, in der für eine Wellenlänge 𝜆1 in der Mitte des Bands 𝑒𝜆 = 0, die Kompensation also optimal ist, während ein positiver Wert von 𝑒𝜆 bei einer WellenDʹλ (−) Lʹ
Abb. 25.21 Dispersionskompensation durch Verwendung von Fasersegmenten mit entgegengesetzter Dispersion.
Dλ (+)
z
Pulsbreite
Dispersion (ps/nm)
Die Pulsverbreiterung und -kompression, die eine alternierende Folge solcher Fasern bewirkt, ist in Abb. 25.21 illustriert. Die Kompensationsfaser ist oft relativ kurz, ihr Dispersionskoeffizient muss daher groß sein. Da die Dispersion in konventionellen Fasern für Wellenlängen über 1310 nm positiv ist, muss die dispersionskompensierende Faser in diesem Bereich eine negative Dispersion besitzen. Das kann z. B. durch Verwendung von dispersionsverschobenen Fasern erreicht werden. Anstelle von dispersionskompensierenden Fasern können auch andere optische Komponenten verwendet werden. Wie in Abschnitt 23.2 beschrieben ist die Ausbreitung eines optischen Pulses durch ein dispersives Medium äquivalent zu einem quadratischen Chirpfilter, einem Phasenfilter mit einer zum Quadrat der Frequenz proportionalen Phase. Eine Faser mit der Länge 𝐿 und dem Dispersionskoeffizienten 𝐷𝜆 ist ein quadratisches Chirpfilter mit dem Chirpkoeffizienten
𝑏 = 𝐷𝜆 𝐿. Die Wirkung eines solchen Filters kann durch ein umgekehrtes Kompensationsfilter – ein anderes quadratisches Chirpfilter mit einem Chirpkoeffizienten mit gleichem Betrag und entgegengesetztem Vorzeichen, 𝑏′ = −𝑏 – vollständig beseitigt werden. Die dispersionskompensierende Faser kann diese Rolle übernehmen, ebenso aber auch andere optische Komponenten wie Gitter oder Interferometer (siehe Abschnitt 23.2). Das Kompensationsfilter kann in der Verbindung auf der Seite des Senders eingeführt werden, sodass es die anschließend durch die Faser eingeführte Dispersion vorab kompensiert. Es kann aber auch auf der Empfängerseite liegen und die verbreiterten Pulse vor dem Detektor korrigieren. Im Allgemeinen werden mehrere Kompensationsfilter innerhalb der Verbindung in periodischen Abständen angebracht, was eine verteilte Kompensation bewirkt. Wenn die Ausbreitung linear erfolgt, sind die genauen Positionen der Filter nicht entscheidend. Um die negativen Folgen nichtlinearer Effekte zu vermeiden, werden Kompensationsfilter so positioniert, dass kurze Pulse über größere Entfernungen innerhalb der Faser vermieden werden.
z
943
25 Faseroptische Kommunikation Dλ
z λ2
0
λ3
λ1
λ2
λ
Dʹλ
0
z λ3
längen 𝜆2 eine positive Nettodispersion und ein negativer Wert von 𝑒𝜆 bei einer anderen Wellenlänge 𝜆3 eine negative Nettodispersion anzeigt. Wenn sowohl 𝐷𝜆 als auch 𝐷𝜆′ näherungsweise lineare Funktionen von 𝜆 mit derselben Steigung sind und bei der zentralen Wellenlänge 𝜆1 𝑒𝜆 = 0 ist, dann gilt überall 𝑒𝜆 ≈ 0. Das Design von dispersionskompensierenden Filtern mit geeigneten Werten des Dispersionskoeffizienten und passender Steigung seiner Wellenlängenabhängigkeit wird als Dispersionsmanagement bezeichnet. Diese Technik ermöglichte den dramatischen Anstieg der Systemkapazitäten im Rahmen des Wellenlängenmultiplexing, den System 7 in Abb. 25.10 exemplarisch illustriert. Elektronische Dispersionskompensation
Fortschritte auf den Gebieten digitale Signalverarbeitung und Fehlerkorrektur machen heute eine elektronische Dispersionskompensation möglich; beide Verfahren haben sich als zentrale Bestandteile von faseroptischen Kommunikationssystemen etabliert. Dies gilt insbesondere für digitale kohärente Systeme mit Wellenlängenmultiplexing, die auf optimierte digitale Codierung und elektronische Signalverarbeitung anstelle von dispersionskompensierenden Faserabschnitten bauen. Die digitale kohärente Kommunikation, die in Abb. 25.10 als System 8 dargestellt ist, wird in Abschnitt 25.4 näher besprochen.
25.2.5
Solitonoptische Kommunikation
Auf natürliche Weise tritt vollständige Dispersionskompensation in optischen Solitonen auf. Die Intensität dieser sich nicht verbreiternden Pulse ist so groß, dass die nichtlinearen optischen Eigenschaften der Faser eine entscheidende Rolle für ihre Entstehung spielen. Wie in Abschnitt 23.5.2 beschrieben sind optische Solitonen Pulse, für die die nichtlineare Dispersion (die Abhängigkeit der Phasengeschwindigkeit von der Intensität durch einen optischen Kerreffekt) die lineare chroma-
Dʹλ Lʹ
λ1
0
e λ = Dλ L
Dispersion / (ps/nm)
944
λ3
λ1
λ2
Abb. 25.22 Ideale Dispersionskompensation bei 𝜆1 und unvollständige Dispersionskompensation mit negativer und positiver Nettodispersion bei 𝜆2 bzw. 𝜆3 . Der Fehler e𝜆 verschwindet, wenn die Steigungen von D𝜆 und D′𝜆 gleich sind.
λ
tische Dispersion vollständig kompensiert; das Resultat ist ein Puls, der sich ausbreitet, ohne seine Breite oder Form zu verändern. Der Gewinn eines Faserverstärkers kann verwendet werden, um die Dämpfung auszugleichen, sodass der Puls auch seine maximale Intensität beibehält und sich immer weiter als Soliton ausbreitet. Wie Gl. (23.138) zeigt, ist die Solitonbedingung für einen Puls mit der Breite 𝜏0 , der maximalen Intensität 𝐼0 und der Vakuumwellenlänge 𝜆0 bei seiner Mittenfrequenz −𝛽 ′′ 2π 𝑛2 𝐼0 = 2 , 𝜆0 𝜏0
(25.20)
wobei 𝑛2 der Kerrkoeffizient ist und −𝛽 ′′ = (𝜆02 ∕2π𝑐0 )𝐷𝜆 proportional zum Dispersionskoeffizienten 𝐷𝜆 ist. Das Intensitätsprofil des Solitons wird durch 𝐼(𝑡) = 2 𝐼0 sech (𝑡∕𝜏0 ) beschrieben; sie ist eine glockenförmige Funktion mit der Halbwertsbreite 1.76𝜏0 . In einem digitalen optischen Nachrichtensystem stellt ein Soliton mit einer Breite 𝜏0 viel kleiner als die Bitlänge 𝑇 Bit „1“ dar, während Bit „0“ durch das Fehlen eines Solitons beschrieben wird. Hierbei handelt es sich offensichtlich um eine RZ-Modulation (siehe Abb. 25.26). Soliton-Nachrichtensysteme sind weder dämpfungs- noch dispersionsbegrenzt. Stattdessen werden sie durch die nichtlineare Intersymbolinterferenz begrenzt, die aufgrund der nichtlinearen Wechselwirkung zwischen den Ausläufern der Solitonen an den Bitgrenzen entsteht. Wenn sich beispielsweise zwei identische durch die Bitlänge 𝑇 getrennte Solitonen über eine hinreichend große Entfernung durch dieselbe Faser ausbreiten, verschmelzen sie irgendwann zu einem einzigen Puls, der sich anschließend wieder in die ursprünglichen zwei Pulse aufteilt. Wie in Abschnitt 23.5.2 erwähnt, wiederholt sich dieser Prozess mit einer Periode [siehe Gl. (23.157)] 𝐿P = πe𝑟∕2 𝑧0 ,
(25.21)
wobei 𝑟 = T ∕𝜏0 das Verhältnis des Abstands zur Solitonbreite ist und 2𝑧0 = −𝜏02 ∕𝛽 ′′ = 2π𝑐0 𝜏02 ∕𝜆02 𝐷𝜆 die Dispersionslänge der Faser.
25.3 Modulation und Multiplexing
Der Periode 𝐿P nimmt exponentiell mit dem Verhältnis 𝑟 zu. Für 𝑟 ≫ 1, d. h. wenn die Bitdauer T viel größer ist als die Solitonbreite 𝜏0 , kann 𝐿P viel länger als 𝑧0 gemacht werden. Wenn die Faserlänge 𝐿 viel kleiner ist als 𝐿P , ist die Wechselwirkung zwischen benachbarten Bits minimal. Für ein festes Verhältnis 𝑟 kann die Bedingung 𝐿 ≪ 𝐿𝑝 durch die Bitrate 𝐵0 = 1∕T ausgedrückt werden, 𝐿𝐵02 ≪
π 𝑐0 e . 𝜆02 𝐷𝜆 𝑟 2 2
𝑟∕2
AM
Signal
t t
Modulator
FM
optisches Feld
t t
Abb. 25.23 Amplituden- und Frequenzmodulation des optischen Feldes.
(25.22) Feldmodulation
Das ergibt eine ultimative Grenze für die Übertragungsentfernungen und -geschwindigkeiten. Die Dispersionseigenschaften von bereits vorhandenen faseroptischen Verbindungen sind meist nicht für solitonoptische Systeme geeignet, weshalb die Technologie seit Mitte der 1990er Jahre nicht sehr aktiv verfolgt wurde, wie die Daten für System 5 in Abb. 25.10 zeigen. Beispiel 25-1: Faseroptisches Soliton-Nachrichtensystem
Ein Soliton-Nachrichtensystem überträgt Daten mit 10 Gbit/s durch eine dispersionsverschobene Einmodenfaser bei 𝜆0 = 1550 nm, wobei Solitonpulse mit einer Halbwertsbreite von 10 ps verwendet werden. Bei dieser Wellenlänge ist der Dispersionskoeffizient 𝐷𝜆 = 1 ps∕(nm km) und der nichtlineare Koeffizient ist 𝑛2 = 2.6 × 10−20 m2 ∕W. Die effektive Querschnittsfläche der Faser beträgt Aeff = 60 μm2 . Wir bestimmen nun die optische Leistung der Quelle und die maximale Länge der Verbindung. Die Halbwertsbreite der Pulse von 10 ps entspricht einer Zeitkonstante 𝜏0 = 10∕1.76 = 5.7 ps. Um die Solitonbedingung Gl. (25.20) zu erfüllen, muss die maximale Intensität 𝐼0 = 3.75 × 108 W∕m2 sein entsprechend einer Spitzenleistung 𝐼0 Aeff = 22.5 mW, die von der Quelle geliefert werden muss. Der Dispersionslänge der Faser ist 2𝑧0 = (2π 𝑐0 ∕𝜆02 )𝜏02 ∕𝐷𝜆 ≈ 25 km. Da die Bitdauer T = 1∕𝐵0 = 100 ps ist, ist das Verhältnis 𝑟 = 𝑇∕𝜏0 = 17.6, und die in Gl. (25.21) gegebene Wechselwirkungsperiode ist 𝐿P ≈ 2.1 × 104 𝑧0 . Die Faserlänge muss viel kürzer sein als diese Länge. In diesem Beispiel liefert Gl. (25.22) 𝐿𝐵02 ≪ 26 (Tbit∕s)2 km.
25.3 Modulation und Multiplexing 25.3.1 Modulation Optische Nachrichtensysteme werden nach der optischen Variable klassifiziert, die von dem übertragenen Signal moduliert wird. Als Haupttypen können Feldund Intensitätsmodulation unterschieden werden.
Das Feld einer monochromatischen optischen Welle dient als sinusförmiges Trägersignal mit sehr hoher Frequenz (z. B. 200 THz bei 𝜆0 = 1500 nm). Bei der Amplituden-, Phasen- und Frequenzmodulation wird die Amplitude, Phase oder Frequenz der Trägerwelle proportional zum Signal (Abb. 25.23) verändert. Wegen der sehr hohen Frequenz des optischen Trägersignals ist ein sehr große spektrale Bandbreite verfügbar, sodass im Prinzip große Informationsmengen übertragen werden können. Obwohl die Feldmodulation eine offensichtliche Erweiterung der herkömmlichen Radio- und Mikrowellentechnik in das optische Band ist, ist sie in der Praxis aus mehreren Gründen schwierig umsetzbar: • Sie erfordert eine Quelle, deren Amplitude, Frequenz und Phase stabil und frei von Fluktuationen sind, d. h. einen hochkohärenten Laser. • Eine direkte Modulation der Phase oder Frequenz des Lasers ist gewöhnlich schwierig zu erreichen. Meist ist ein externer Modulator nötig, z. B. auf der Grundlage des elektrooptischen Effekts. • Wegen des erforderlichen hohen Kohärenzgrads der Quelle zeigen Vielmodenfasern großes Modenrauschen, daher ist eine Einmodenfaser notwendig. • Wenn keine polarisationserhaltende Faser verwendet wird, ist ein Mechanismus zur Überwachung und Steuerung der Polarisation erforderlich. • Der Empfänger muss in der Lage sein, den Betrag und die Phase des optischen Feldes zu messen. Dazu wird in der Regel ein Heterodynempfänger eingesetzt. Wegen der Bedingung der Kohärenz werden optische Nachrichtensysteme auf der Grundlage der Feldmodulation kohärente Nachrichtensysteme genannt. Diese Systeme werden in Abschnitt 25.5 besprochen. Intensitätsmodulation
Bei der Intensitätsmodulation wird die optische Intensität (oder Leistung) proportional zum Signal oder einer codierten Version davon verändert, wie Abb. 25.24 darstellt. Die Mehrzahl der kommerziellen erhältlich faseroptischen Nachrichtensystemen beruht heute auf
945
25 Faseroptische Kommunikation
IM
Signal t
Modulator t
optische Intensität t
Abb. 25.24 Intensitätsmodulation.
der Intensitätsmodulation. Die Leistung der Quelle wird moduliert, indem der in eine LED oder Laserdiode injizierte Strom verändert wird. Einmoden- oder Vielmodenfasern können verwendet werden und die empfangene optische Leistung wird mithilfe eines Empfängers mit direkter Detektion gemessen. Die hochfrequenten Oszillationen des optischen Feldes spielen bei der Modulation und Demodulation keine Rolle; nur die Leistung wird am Sender verändert und am Empfänger nachgewiesen. Allerdings kann die Wellenlänge des Lichts verwendet werden, um unterschiedliche Signale zu identifizieren, die sich durch dieselbe Verbindung ausbreiten – ein als Wellenlängenmultiplexing bezeichnetes Verfahren. Digitale Modulation
Ein analoges Signal kann in ein digitales Signal umgewandelt werden, indem man es periodisch mit einer geeigneten Geschwindigkeit abtastet, die Messwerte auf eine diskrete endliche Zahl von Werten rundet und binär codiert als Pulsfolge aus binären Bits „0“ und „1“ innerhalb des Zeitintervalls zwischen aufeinander folgenden Abtastungen überträgt (Abb. 25.25). Dieses Verfahren wird als Pulscodemodulation (PCM) bezeichnet. Bei einer binären Codierung wie der eben beschriebenen werden die beiden Zustände jedes Bits durch zwei Werte der Amplitude, Phase oder Frequenz dargestellt; man spricht entsprechend von Amplitudenumtastung (ASK, engl. amplitude shift keying), Frequenzumtastung (FSK, engl. frequency shift keying) oder Phasenumtastung (PSK, engl. phase shift keying). Wenn bei der ASK jedes Bit einfach durch die An- bzw. Abwesenheit eines Lichtpulses dargestellt wird, spricht man auch von ein-aus-Codierung (OOK, engl. on-off 256 Niveaus (8 Bits)
946
keying). Diese Modulationsarten werden in Abb. 25.26 illustriert. Systeme mit optischer Intensitätsmodulation verwenden in der Regel eine ein-aus-Codierung. Es ist aber auch möglich, die Intensität des Lichts mit einer harmonischen Funktion zu modulieren, die als ein sekundäres Trägersignal dient, dessen Frequenz oder Phase durch das Signal moduliert werden. Feldmodulation auf der Grundlage der Phasenumtastung wird häufig für die drahtlose Kommunikation über kurze Distanzen wie beispielsweise WiFi (WLAN), RFID oder Bluetooth eingesetzt. Fortschritte in der Elektronik und der digitalen Signalverarbeitung haben den Weg für mehrstufige Codierungen frei gemacht, die eine höhere spektrale Effizienz [in (bit/s)/Hz] bieten als die einfache binäre Codierung. In solchen Systemen stellt jeder Puls mehrere Bits dar. In der binären PSK (BPSK) kann die Phase beispielsweise nur zwei Werte (0 und π) annehmen, die ein Bit darstellen, während in der quaternären (oder Quadratur-) PSK (QPSK) vier Phasenwerte (0, π∕2, π, 3π∕2) verwendet werden, um zwei Bits zu codieren, wie das in Abb. 25.27 gezeigte Diagramm der komplexen Ebene zeigt, das auch Quadraturdiagramm genannt wird. Die QPSK kann dieselbe Information mit der halben Symbolrate der BPSK übertragen. Für PSK höherer Ordnung werden die Daten durch eine Konstellation von Punkten im Quadraturdiagramm codiert, die sich um gleiche Winkel voneinander unterscheiden. Andere Variationen der PSK sind beispielsweise die differentielle PSK (in der die Phase nicht durch die absoluten Daten, sondern deren Änderung festgelegt wird). Der differentielle Ansatz vermeidet alle Mehrdeutigkeiten, die durch eine unbeabsichtigte Drehung der in den Übertragungskanal eingeführten Konstellation hervorgerufen werden könnten. Die differentielle QPSK wird als DQPSK bezeichnet. Die kombinierte Amplituden- und Phasenumtastung ermöglicht die Darstellung einer größeren Zahl von Bits pro Symbol (Puls), wie aus den in Abb. 25.27 gezeigten Konstellationen in der komplexen Ebene hervorgeht. Die Bezeichnung Quadraturamplitudenmodulati-
Signal (Bandbreite 4 kHz) Signalabtastungen (8000/s) 15.625 µs
125 µs
t PCM-Signal 64 kbits/s
Abb. 25.25 Pulscodemodulation (PCM). Ein Audiosignal mit einer Bandbreite von 4 kHz wird mit einer Rate von 8 × 103 pro Sekunde abgetastet. Jeder Messwert wird auf einen von 28 = 256 diskreten Werten gerundet und in 8 Bit codiert, sodass das Signal aus einer Folge von Bits (Pulsen) besteht, die mit einer Geschwindigkeit von 64 kbit∕s übertragen werden.
25.3 Modulation und Multiplexing
1 1
1
0
1
0
Signal
0
1
1
0
Modulator
t
optische Intensität
(a)
t
t 0
1 (b)
1
1
Signal
0
t
Q
I
I
8-QAM
QPSK
Abb. 25.27 Konstellationen für die binäre PSK (1 Bit), QPSK (2 Bits, auch als 4-QAM bezeichnet) und 8-QAM (4 Bits). Die Symbole I und Q bezeichnen die In-Phase- bzw. Quadraturkomponenten der komplexen Amplitude, also ihre Real- bzw. Imaginärteile.
on (QAM) macht deutlich, dass jede der Quadraturkomponenten des optischen Feldes mehrere Amplituden annehmen kann. 4-QAM ist demzufolge identisch mit QPSK, da jede der beiden Quadraturen zwei Werte der Amplitude annehmen kann. Entsprechend handelt es sich bei 8-QAM-System um ein 4-Bit-System, das ebenfalls in Abb. 25.27 dargestellt ist. Auf dieselbe Weise lassen sich auch Konstellationen für 16-QAM usw. erstellen.
S1 +S2 + . . . SN
SN
. .. Daten
S1 S2
Daten . ..
S1 S2
SN
Abb. 25.28 Übertragung von N Signalen durch denselben Kanal durch Multiplexer (MUX) und Demultiplexer (DMUX). Signal 1
2
. . .
N
f1
f2
. . . (a)
fN
Signal 1
Frequenz
PSK
25.3.2 Multiplexing
I
BPSK
Abb. 25.26 Beispiele für binäre Modulation von Licht: (a) Intensitätsmodulation mit ein-aus-Codierung (OOK/IM), (b) Feldmodulation mit Frequenzumtastung (FSK) und (c) mit Phasenumtastung (PSK).
t
t
Q
OOK (RZ)
FSK
Modulator
optisches Feld
Q
OOK (NRZ)
2
...
Paket 1
Multiplexing ermöglicht die Übertragung und Entschlüsselung von mehr als einem Signal durch dieselbe Nachrichtenverbindung, wie Abb. 25.28 illustriert. Dazu wird jedes Signal mit einer unterschiedlichen physischen Kennzeichnung oder einem Code versehen, der vom Empfänger identifiziert werden kann. Wir beginnen diesen Abschnitt mit einer Diskussion von elektronischen Multiplexverfahren, von denen es im Wesentlichen drei Varianten gibt: Frequenzmultiplexing, Zeitmultiplexing und Codemultiplexing. Frequenzmultiplexing
Beim Frequenzmultiplexing werden Trägerwellen mit unterschiedlichen Frequenzen mit den verschiedenen Signalen moduliert. Am Empfänger werden die Signale mithilfe von Filtern identifiziert, die auf die Trägerfrequenzen abgestimmt sind, wie in Abb. 25.29(a) dargestellt. Zeitmultiplexing
Beim Zeitmultiplexing werden die Daten in einer Folge von Paketen übertragen, die jeweils aus einer Reihe von Zeitfenstern bestehen, die den Bits oder Bytes der unterschiedlichen Signale zugeordnet sind, wie Abb. 25.29(b) zeigt. Die Bits müssen mit demselben Taktsignal synchronisiert sein. Am Empfänger wird jedes Signal anhand seiner Position innerhalb des Pakets identifiziert. Ein Beispiel für ein hierarchisches Zeitmultiplexsystem ist das T-System aus Abb. 25.30.
N 1 2
...
Paket 2
N1 2
...
Paket 3
N
Zeit
(b)
Abb. 25.29 (a) Beim Frequenzmultiplexing wird jedem Signal ein spektrales Band um eine bestimmte Frequenz zugeordnet. (b) Beim Zeitmultiplexing wird jedem Signal eine Folge von Zeitfenstern zugeteilt. Die Zeitfenster von unterschiedlichen Signalen werden abwechselnd (verschachtelt) übertragen.
947
948
25 Faseroptische Kommunikation
4 kb/s T1
T2
1.544 Mb/s
6.312 Mb/s
×24
Adresscode Originalsignal
T3
×4
×6
1
0
274.176 Mb/s
×7
t 1
T4
44.736 Mb/s
Frequenz
Zeit
Code
FDM
TDM
CDM
1
codiertes Signal
Abb. 25.30 Das T-System, entwickelt von der Firma Bell zur Übertragung von Stimmsignalen mittels Zeitmultiplexing. Insgesamt 24 Signale mit 4 kbit/s werden durch Zeitmultiplexing als kombiniertes T1-Signal mit 1.544 Mbit/s übertragen. Vier solche Signale werden durch erneutes Zeitmultiplexing zu einem T2-Signal kombiniert usw.
Wellenlänge Raum WDM
(a)
t
SDM (b)
Abb. 25.32 (a) Elektronisches Multiplexing. (b) Optisches Multiplexing.
t
Abb. 25.31 Codemultiplexing.
Codemultiplexing
Beim Codemultiplexing wird jedem Signal ein Code (oder Schlüssel) in Form einer innerhalb der Bitperiode definierten eindeutigen Funktion der Zeit zugeteilt. Der Code kann eine Folge von Bits mit einer höheren Geschwindigkeit als der der Daten sein. Codes von unterschiedlichen Signalen müssen unkorreliert (orthogonal) sein, sodass sie am Empfänger durch einen Korrelator aufgetrennt werden können. In dem in Abb. 25.31 schematisch dargestellten System wird jedes „1“-Bit der ursprünglichen Daten durch die Codefolge ersetzt. Jeder Empfänger korreliert seinen eigenen Code mit dem empfangenen Signal. Dadurch entschlüsselt er nur die zu seinem eigenen Code gehörenden Bits und ignoriert alle anderen. Vergleich von elektronischem und optischem Multiplexing
Wie Abb. 25.32 illustriert, kann Multiplexing elektronisch oder optisch realisiert werden. Im Fall des elektronischen Multiplexings werden die Signale wie beschrieben durch Frequenz-, Zeit- oder Codemultiplexing zu einem zusammengesetzten elektronischen Signal kombiniert, das verwendet wird, um die Lichtquelle nach einem der in Abschnitt 25.3.1 besprochenen optischen Modulationsverfahren zu modulieren. Zum Beispiel kann ein elektronisches Frequenzmultiplexsignal aus einer Reihe von Trägerfrequenzen, den „Unterträgern“, erzeugt werden, die die Intensität der Lichtquelle modulieren. Am Empfänger wird das Licht nachgewiesen und das Demultiplexing wird durch elektronische Filter durchgeführt. Ein anderes Beispiel ist ein elektronisches Zeitmultiplexsignal wie das in Abb. 25.30
gezeigte T4-Signal, das zur Intensitätsmodulation der Lichtquelle verwendet wird; das Demultiplexing des registrierten Signals wird ebenfalls elektronisch durchgeführt. Beim optischen Multiplexing sind die Kennzeichnungen der verschiedenen Signal optischer Natur. Beim optischen Frequenzmultiplexing werden beispielsweise unterschiedliche optische Frequenzen als Träger der verschiedenen Signale verwendet. Diese Frequenzen werden am Empfänger durch optische Filter getrennt. Wenn die Trägerfrequenzen beim optischen Frequenzmultiplexing weit getrennt sind (z. B. mehr als 20 GHz), spricht man auch von Wellenlängenmultiplexing; diese Methode wird in Abschnitt 25.3.3 ausführlicher besprochen. Wellenlängenmultiplexsysteme sind populär, da sie die Kapazität eines vorhandenen Fasernetzes erhöhen können, ohne dass dafür neue Fasern verlegt werden müssen. Ein anderes optisches Multiplexverfahren ist das Raummultiplexing, das in Abschnitt 25.3.4 diskutiert wird. Hier werden die einzelnen Signale in verschiedenen räumlichen Moden (einschließlich Polarisationsmoden) der optischen Fasern übertragen.
25.3.3
Wellenlängenmultiplexing
Ein Wellenlängenmultiplexsystem verwendet Lichtquellen mit unterschiedlichen Wellenlängen, deren Intensitäten jeweils durch ein anderes elektrisches Signal moduliert werden. Die modulierten Lichtstrahlen werden durch einen optischen Multiplexer (OMUX) in der Faser gemischt. Das Demultiplexing erfolgt auf der Empfängerseite durch einen optischen Demultiplexer (ODMUX), der die unterschiedlichen Wellenlängen auftrennt und sie zu unterschiedlichen Detektoren leitet. Optische Multiplexer und Demultiplexer wurden in Abschnitt 24.2.1 beschrieben. Das elektronische Signal in
λ1 λ2
/
. . . λN
λ1 λ2 . . .
λ 1, λ 2, . . . , λ N
/
λN
Abb. 25.33 Wellenlängenmultiplexing (WDM). Ein Satz von elektronisch gemultiplexten (MUX) Signalen, die die Daten enthalten, wird durch Modulation einer Lichtquelle einer bestimmten Frequenz in ein optisches Signal umgewandelt (E/O). Mehrere optische Signale von derart modulierten Lichtquellen mit unterschiedlichen Wellenlängen werden optisch gemultiplext (OMUX) und in eine optische Faser ein-
Daten
Daten
25.3 Modulation und Multiplexing
gekoppelt. Auf der Seite des Empfängers werden die Signale zunächst optisch demultiplext (ODMUX). Alle optischen Signale mit einer bestimmten Wellenlänge werden durch einen Detektor/Demolulator in ein elektronisches Signal umgewandelt (E/O), das anschließend elektronisch demultiplext (DMUX) wird.
100 GHz
0.5
Frequenz / THz
230
210
220
40
. . .
200
190
180
4.4 THz
0.4
35 nm
0.3
1200
1300
1400
1500
L
U
1675
C
1625
S
1565
E
1530
O
1460
0.1
1360
0.2 1260
Dämpfungskoeffizient α / (dB/km)
40 Wellenlängen- 1 2 3 multiplexkanäle
1600 1700 Wellenlänge λ 0/nm
Abb. 25.34 Ein 40-Kanal-Wellenlängenmultiplexsystem mit einem Kanalabstand von 100 GHz im C-Band. Die Kurve zeigt den Dämpfungskoeffizienten (in dB/km) von Quarzglasfasern mit unterdrückter OH-Absorption. Im Bereich des C-Bandes
ist die Faserdämpfung minimal. Die in Wellenlängenmultiplexsystemen verwendeten spektralen Bänder werden mit O (original), E (extended), S (short), C (conventional), L (long) und U (ultra long) bezeichnet.
jeder Wellenlänge ist häufig eine elektronisch gemultiplexte Sammlung anderer Signale, sodass im Anschluss an das optische noch ein elektronisches Demultiplexing folgen muss. Das gesamte System ist in Abb. 25.33 illustriert. In Abb. 25.34 sind die in modernen faseroptischen Nachrichtensystemen verwendeten optischen Spektralbänder gezeigt. Wellenlängenmultiplexsysteme verwenden beliebige Kombinationen von Wellenlängen innerhalb dieser Bänder. Der Abstand zwischen den Wellenlängen der unterschiedlichen Kanäle muss deutlich größer sein als die spektralen Breiten des modulierten Lichts in jedem Kanal, die durch die Linienbreite der Lichtquellen und die Bandbreite der durch den Kanal übertragenen Daten bestimmt sind. Der Kanalabstand muss auch groß genug sein, um optisches Multiplexing und Demultiplexing mit minimalem Übersprechen zwischen den Kanälen zu erlauben.
Wellenlängenmultiplexsysteme werden nach der Zahl der Kanäle und dem Kanalabstand in zwei Kategorien eingeteilt: grobmaschige und engmaschige. verwenden einige Kanäle mit weit getrennten Wellenlängen (20 nm oder mehr). Sie werden in der Regel für die Kurzstreckenkommunikation verwendet und kommen ohne Verstärkung aus. Ein Beispiel ist ein System mit zwei Wellenlängen, 1310 nm und 1550 nm. Dieses Verfahren wird z. B. in Kabelfernsehnetzen verwendet, wobei unterschiedliche Wellenlängen für in unterschiedlichen Richtungen übertragene Signale verwendet werden. Der Ethernetstandard LX-4 ist ein anderes Beispiel, bei dem vier Wellenlängen nahe 1310 nm verwendet werden, von denen jede einen Datenstrom von 3.125 Gbit/s überträgt. Städtische Netze verwenden grobmaschige Wellenlängenmultiplexsysteme mit einem Wellenlängenabstand von 20 nm.
Grobmaschige Wellenlängenmultiplexsysteme
949
950
25 Faseroptische Kommunikation
verwenden eine große Zahl von Kanälen (im Allgemeinen mehr als 16) mit nahe beieinander liegenden Wellenlängen. Sie werden in der Regel in Langstreckensystemen eingesetzt und verwenden häufig eine zusätzliche Verstärkung. Sie werden meist auf einem höheren Niveau der Kommunikationshierarchie (und bei höheren Datenraten) verwendet, beispielsweise für den Internet-Backbone. Die praktische Umsetzung von engmaschigen Wellenlängenmultiplexsystemen erfordert hochstabile Laser, um eine Drift der Wellenlängen zu verhindern. Bei einer Wellenlänge von 1550 nm im C-Band entspricht ein Frequenzabstand Δ𝜈 = 200 GHz einem Wellenlängenabstand Δ𝜆 = (𝜆02 ∕𝑐0 )Δ𝜈 = 1.6 nm. Derartige Systeme verwenden Kanalabstände von gerade einmal 50 oder manchmal sogar nur 20 GHz entsprechend Wellenlängenabständen von 0.4 bzw. 0.16 nm. Wie Abb. 25.34 zeigt, beträgt die Breite des C-Bands 35 nm oder ungefähr 4.4 THz, was für 40 Kanäle mit einem Abstand von 100 GHz (0.8 nm) ausreicht. Mehr Kanäle werden möglich, wenn man die Grenzen des C-Bands überschreitet oder die Kanalabstände reduziert. Wenn man beispielsweise das C- und das L-Band kombiniert, die zusammen eine Breite von ≈ 9 THz aufweisen, und Kanalabstände von 20.3 GHz verwendet, kommt man auf 441 verwendbare Kanäle.
Engmaschige Wellenlängenmultiplexsysteme
Kurzstreckenanwendungen wie die Datenkommunikation bei Bitraten jenseits von 100 Gbit/s verwenden oft Wellenlängenmultiplexing in breitbandigen Vielmodenfasern bei 800–900 nm. Die Gradientenindexprofile der Fasern sind dabei darauf optimiert, die Moden- und die chromatische Dispersion zu minimieren, wodurch die Datenrate der OM4-Fasern von 10 Gbit/s verdoppelt werden kann. Für WDM-Systeme mit nicht zu vielen Kanälen werden häufig VCSEL mit mehreren Emissionen im Band zwischen 800 und 900 nm verwendet.
25.3.4
Raummultiplexing
Die von einem Glasfaserkabel übertragene Datenrate kann erhöht werden, indem ein Faserbündel innerhalb eines einzigen Kabels oder eine Mehrkernfaser verwendet wird, die mehrere separate Kerne innerhalb eines einzigen Fasermantels enthält, die jeweils einen unabhängigen Kommunikationskanal bereitstellen [Abb. 25.35(a)]. Kabel können dutzende bis hunderte von Fasern enthalten; derartige Anordnungen erfordern jedoch eine entsprechende Zahl von Bauelementen zum Senden, Verstärken und Empfangen der Signale sowie
FB
MCF
MMF
MCF (b)
(a)
Abb. 25.35 (a) Mehrere Kommunikationskanäle in einem Faserbündel (FB) oder einer Mehrkernfaser mit mehreren separaten Kernen. (b) Raummultiplexing unter Verwendung der räumlichen Moden einer Vielmodenfaser oder der Moden einer Mehrkernfaser mit gekoppelten Kernen.
zahlreiche Spleiße, die im Falle eines Kabelbruchs ein hohes Maß an mechanischer Präzision erfordern. Darüber hinaus müssen sie im Normalfall von Anfang an in der gewünschten Ausstattung verlegt werden. Es lohnt aus diesen Gründen, zu überlegen, ob nicht eine einfachere Anordnung gefunden werden kann, die die beschriebenen Nachteile reduziert. Dabei stellt sich heraus, dass die Datenraten durch Raummultiplexing (SDM, von engl. space-division multiplexing) entweder mit den räumlichen Moden einer Vielmodenfaser oder den Moden der gekoppelten Kerne einer Mehrkernfaser erhöht werden können [Abb. 25.35(b)]. Die räumlichen Moden einer Vielmodenfaser können als unabhängige Kommunikationskanäle dienen; die Realisierung eines solchen Systems erfordert jedoch die Verwendung von Multiplexern und Demultiplexern, da die Moden in einem gemeinsamen Volumen vorliegen. Ähnlich kann auch eine Mehrkernfaser mit eng benachbarten Kernen zur Datenübertragung verwendet werden; auch diese Variante erfordert jedoch Multiplexer/Demultiplexer, da in den gekoppelten Kernen Supermoden auftreten, die ebenfalls einen gemeinsamen Raumbereich belegen. Wir diskutieren im Folgenden die Umsetzung von Raummultiplexing in einer Vielmodenfaser. Raummultiplexing in Vielmodenfasern
Wie in Abschnitt 10.2.2 beschrieben besitzt eine Stufenindex-Vielmodenfaser mit dem Kernradius 𝑎 und 1 2 der numerischen Apertur NA 𝑀 ≈ V Moden, wobei 2 V = (2π𝑎∕𝜆0 )NA der V-Parameter der Faser ist. Wie aus Abb. 10.13 ersichtlich ist, besitzt eine Faser mit 𝑉 = 10 ungefähr 50 Moden. Das optische Feld wird im Allgemeinen als gewichtete Überlagerung dieser Moden ausgedrückt, 𝑈(𝑟, 𝜙, 𝑧) =
𝑀 ∑ 𝑞=1
𝑎𝑞 𝑢𝑞 (𝑟, 𝜙)e−i𝛽𝑞 𝑧 ,
(25.23)
wobei 𝑎𝑞 die komplexe Amplitude, 𝛽𝑞 die Ausbreitungskonstante und 𝑢𝑞 (𝑟, 𝜙) die transversale räumliche Verteilung der 𝑞-ten Mode sind. Der Einfachheit halber
25.3 Modulation und Multiplexing SMFs
1 2 3
MMF 1 +
+
SMFs
M
3
2
+
+
Multiplexer und Demultiplexer für Raummultiplexing
1 2 3 M
M
Abb. 25.36 Raummultiplexing (SDM) in einer Vielmodenfaser (MMF) unter Verwendung eines optischen Multiplexers (OMUX) und eines optischen Demultiplexers (ODMUX). Die Signale auf M optischen Einmodenfasern (SMF) werden in M Moden der Vielmodenfaser gemultiplext.
verwenden wir anstelle der zweifachen Modenindizes (𝑙, 𝑚) die ganze Zahl 𝑞 = 1, 2, … , 𝑀. Die Amplituden 𝑎𝑞 , die in einem Raummultiplexsystem die übertragenen Informationen enthalten, werden von einem Multiplexer am Sender (𝑧 = 0) in die Vielmodenfaser eingekoppelt und von einem Demultiplexer am Empfänger (𝑧 = 𝐿) aus dem empfangenen optischen Summenfeld extrahiert, wie in Abb. 25.36 gezeigt. Da die Moden orthonormal sind, d. h. ∬ 𝑢𝑞∗ (𝑟, 𝜙) ∗ 𝑢𝑞′ (𝑟, 𝜙) 𝑟 d𝑟 d𝜙 = 𝛿𝑞𝑞′ gilt, können die Amplituden der einzelnen Moden aus dem Gesamtfeld bei 𝑧 = 𝐿 unter Verwendung der Projektionen (siehe Anhang C) 𝑎𝑞 e−i𝛽𝑞 𝐿 = ∬ 𝑈 ∗ (𝑟, 𝜙, 𝐿) 𝑢𝑞 (𝑟, 𝜙) 𝑟 d𝑟 d𝜙
(25.24)
aus dem Gesamtfeld berechnet werden. Wenn am Empfänger folglich nach Betrag und Phase das Gesamtfeld 𝑈(𝑟, 𝜙, 𝐿) gemessen wird, lassen sich die komplexen Amplituden 𝑎𝑞 der Moden bestimmen. Für eine solche Messung ist ein schneller kohärenter Wellenfrontsensor erforderlich, der jedoch leider nicht verfügbar ist. Wir müssen daher auf weniger direkte Ansätze zurückgreifen.
Der optische Multiplexer (OMUX) und Demultiplexer (ODMUX) für das Raummultiplexing können durch selektive optische Koppler realisiert werden, die von einer elektronischen Signalverarbeitung unterstützt werden, wie die folgenden Beispiele zeigen: Ein optisches System zur Realisierung des in Abb. 25.36 dargestellten OMUX wandelt die ankommenden optischen Strahlen aus den Einmodenfasern, die alle das räumliche Profil der Grundmode und die Amplituden 𝑎𝑞 besitzen, in Strahlen um, deren räumliche Profile proportional zu denen der Moden 𝑢𝑞 (𝑟, 𝜙) der Vielmodenfaser sind. Wie Abb. 25.37(a) zeigt, werden die Strahlen auf optische Weise zu einem einzigen Strahl kombiniert, der der Überlagerung aus Gl. (25.23) entspricht, und unter Verwendung eines einzigen Kopplers in die Vielmodenfaser eingekoppelt. Da jedes räumliche Profil nur durch das passende Profil am Eingang angeregt wird, erhalten die Moden der Vielmodenfaser Amplituden, die proportional zu 𝑎𝑞 sind. Das entscheidende Element dieses Multiplexers ist der Modenwandler, der durch eine Phasenplatte, einen räumlichen Lichtmodulator oder ein Hologramm realisiert wird (siehe Abschnitt 4.5). Diese Art von Multiplexer ist aus didaktischen Gründen interessant, führt in der Praxis jedoch zu großen optischen Verlusten und Übersprechen zwischen den Kanälen.
Modenkonversion.
Mehrfach-Richtkoppler mit angepassten Ausbreitungskonstanten. Wenn die jeweiligen Ausbreitungskon-
stanten übereinstimmen, koppelt ein Richtkoppler eine Mode aus einer Einmodenfaser mit einer Mode der Vielmodenfaser (siehe Abschnitt 9.4.2), auch wenn sich die räumlichen Profile der Moden unter-
1 MMF SMF1 SMFM
3
SMF2 MMF
M
1 2 3
MMF
M
SMF3
MC (a)
SMFs
SMFs
2
( b)
Abb. 25.37 Beispiele für optische Multiplexer (OMUX) für das Raummultiplexing (SDM). (a) OMUX unter Verwendung von Modenwandlern (MC) und Strahlvereinigung mithilfe von Strahlteilern. (b) OMUX unter Verwendung von Mehr-
(c)
fach-Richtkopplern, deren Ausbreitungskonstanten an die Moden der Vielmodenfaser angepasst sind. (c) OMUX aus einer photonischen Laterne. Die Multiplexer in (b) und (c) können umgekehrt auch als Demultiplexer verwendet werden.
951
952
25 Faseroptische Kommunikation
scheiden. Ein auf diesem Prinzip basierender optischer Multiplexer/Demultiplexer kann mithilfe einer Anordnung von Richtkopplern mit verschiedenen Abmessungen realisiert werden, die selektiv jeweils eine bestimmte Mode der Vielmodenfaser mit einer der eingehenden/ausgehenden Einmodenfasern koppelt, wie Abb. 25.37(b) zeigt. Schmelzkoppler. Ein Faserkoppler mit 𝑀 identischen Einmodenfasern als Eingang und einer Vielmodenfaser, die 𝑀 Moden führen kann, als Ausgang kann als Multiplexer/Demultiplexer verwendet werden. Jede der Einmodenfasern führt Licht mit dem Profil ihrer jeweiligen Grundmode und ist in Bezug auf die ausgehende Vielmodenfaser so positioniert, dass sie eine kleine Gruppe von Moden der Vielmodenfaser gemäß der Kopplungsmatrix des Kopplers anregt. Ein Beispiel für einen Schmelzkoppler ist die in Abschnitt 10.2.5 besprochene und in Abb. 25.37(c) gezeigte photonische Laterne. Da der Schmelzkoppler reziprok ist, kann er umgekehrt auch als Demultiplexer verwendet werden. Jede der ausgehenden Einmodenfasern enthält dann das Licht aus einer kleinen Gruppe von Moden der Vielmodenfaser gemäß einer (anderen) Kopplungsmatrix. Übersprechen und MIMO-Systeme
Da Multiplexer und Demultiplexer nicht ideal sind, entsprechen die komplexen Amplituden der Moden an den Empfängern nicht 1:1 denen am Sender, sondern müssen auf beiden Seiten durch Kopplungsmatrizen beschrieben werden. Auch durch die Faser selbst wird aufgrund geringfügiger Inhomogenitäten entlang ihres Verlauf, die auf Herstellungsfehler oder Verbiegungen im Mikro- oder Makromaßstab zurückgehen, eine zusätzliche Modenkopplung eingeführt. Ebenso können minimale Verzerrungen der Kreissymmetrie des Faserquerschnitts zu einer Kopplung zwischen den entarteten Moden führen, die unter idealen Bedingungen identische Ausbreitungskonstanten aufweisen. Die Modenkopplung ist für die praktische Umsetzung von Raummultiplexing eine Herausforderung, die jedoch überwunden werden kann. In Abwesenheit nichtlinearer optischer Effekte hängen die Amplituden 𝑏𝑞 der Moden am Ausgang des Empfänger linear mit den Amplituden 𝑎𝑞 der Moden am Eingang des Senders zusammen, 𝑏𝑞 =
𝑀 ∑ 𝑝=1
𝒞𝑞𝑝 𝑎𝑝
𝑞 = 1, 2, … , 𝑀 ,
(25.25)
wobei die 𝒞𝑞𝑝 die Elemente einer 𝑀 × 𝑀-Kopplungsmatrix sind. Diese Matrix ist das Produkt dreier Ma-
trizen: der Kopplungsmatrix des Multiplexers, der Moden-Kopplungsmatrix der Faser und der Kopplungsmatrix des Demultiplexers. Während die Kopplungsmatrizen von Multiplexer und Demultiplexer gemessen werden können, enthält die Moden-Kopplungsmatrix der Faser eine intrinsische Zufälligkeit und kann nur statistisch beschrieben werden. Darüber hinaus sind die Elemente der Gesamt-Kopplungsmatrix aufgrund der Moden- und Materialdispersion frequenzabhängig, sodass sie ein dynamisches System bilden, das eine differentielle Modenverzögerung enthält. Trotzdem können diese Effekte mithilfe von geeigneten Werkzeugen zur Signalverarbeitung ähnlich denen, die in drahtlosen Systemen verwendet werden, in denen mehrere Pfaden zwischen Sendern und Empfängern möglich sind, kompensiert werden. Man bezeichnet derartige Systeme als MIMO-Systeme (engl. multiple input multiple output). Raummultiplexing in Mehrkernfasern
Raummultiplexing in Mehrkernfasern lässt sich mithilfe eines ähnlichen Ansatzes umsetzen. Wenn jeder der Kerne mehrere Moden führt, kann das System durch eine Matrix beschrieben werden, die eine Kombination aus der Kopplung innerhalb der einzelnen Kerne und der Kopplung zwischen den Kernen darstellt. Für eine starke Kopplung der Kerne kann das Gesamtsystem auch mithilfe von Supermoden beschrieben werden (siehe Abschnitt 10.2.5).
25.4 Kohärente optische Kommunikation Kohärente optische Nachrichtensysteme benutzen Feldmodulation (Amplitude, Phase oder Frequenz) anstelle von Intensitätsmodulation. Sie verwenden kohärente Lichtquellen, Einmoden- oder Vielmodenfasern und optische Homodyn-/Heterodynempfänger. Kohärente faseroptische Kommunikationssysteme wurden ursprünglich in den späten 1980er Jahren aufgrund ihrer überlegenen Empfindlichkeit entwickelt, in den frühen 1990er Jahren jedoch aufgrund der Erfindung der erbiumdotierten Faserverstärker wieder aufgegeben, die Systeme mit direkter Detektion ermöglichten, deren Empfindlichkeit bis auf wenige dB an die von kohärenten Systemen heranreichte. Das wiedererwachte Interesse an kohärenten faseroptischen Systemen, das unter anderem durch Fortschritte in der Elektronik und der digitalen Signalverarbeitung befeuert wurde, hat zu einem erhöhten spektralen Wirkungsgrad und einer verbesserten Übertragungskapazität geführt. Wir werden die Funktionsprinzipien
25.4 Kohärente optische Kommunikation
+
Signal
Signal – lokaler Oszillator (a)
– lokaler Oszillator
– (b)
Abb. 25.38 Kohärente optische Detektion. Eine Signalwelle der Frequenz 𝜔Q wird mithilfe (a) eines Strahlteilers und (b) eines optischen Kopplers mit einer lokalen Welle der Frequenz 𝜔O überlagert. Der Photostrom variiert mit der Differenzfrequenz 𝜔Z = 𝜔Q − 𝜔O .
kohärenter Systeme vorstellen und ihre Leistungsfähigkeit mit der von Systemen mit direkter Detektion vergleichen; dabei gehen wir auch auf die Anforderungen an die Komponenten in kohärenten Systemen ein. Kohärente Systeme werden auch in optischen Richtfunksystemen eingesetzt. Wie wir in Abschnitt 19.1.2 gesehen hatten, reagieren Photodetektoren auf den Photonenfluss und sind damit zunächst unempfindlich für die optische Phase. Es ist jedoch möglich, die komplexe Amplitude (sowohl den Betrag als auch die Phase) des optischen Feldes eines Signals zu messen, indem man es mit einem kohärenten optischen Referenzfeld mit stabiler Phase mischt, dem sogenannten lokalen Oszillator, und die Superposition mithilfe eines Photodetektors misst, wie Abb. 25.38 illustriert. Infolge der Interferenz zwischen den beiden Feldern (Schwebung) enthält der gemessene elektrische Strom Information sowohl über die Amplitude als auch über Phase des Signalfelds. Diese Nachweistechnik wird als kohärente Detektion bezeichnet, im Gegensatz zu der zuvor besprochenen direkten Detektion). Kohärente Detektion ist auch unter den Bezeichnungen optisches Mischen, Photomischung oder Lichtschwebung (siehe Abschnitt 2.6.2) bekannt. Der kohärente optische Empfänger ist das optische Äquivalent eines Superheterodyn-Funkempfängers. Wenn die Signalwelle und die Welle des lokalen Oszillators unterschiedliche Frequenzen (𝜔Q und 𝜔O ) haben, spricht man von heterodyner Detektion; für 𝜔Q = 𝜔O handelt es sich um eine homodyne Detektion.
25.4.1 Der Heterodyndetektor ℰQ = Re{𝐸Q exp(i𝜔Q 𝑡)} sei das optische Feld des Signals, 𝐸Q = |𝐸Q | exp(i𝜑Q ) seine komplexe Amplitude und 𝜔Q seine Kreisfrequenz. Der Betrag |𝐸Q | oder die Phase 𝜑Q werden mit einer Geschwindigkeit, die viel kleiner als 𝜔Q ist, mit dem Signal moduliert. Das Feld des Empfängeroszillators wird entsprechend durch ℰO , 𝐸O , 𝜔O und
𝜑O beschrieben. Die beiden Felder werden mithilfe eines Strahlteilers oder eines optischen Kopplers wie in Abb. 25.38 überlagert, sodass das Gesamtfeld die Summe der beiden konstituierenden Felder ist, ℰ = ℰQ + ℰO . Wenn die einfallenden Wellen ideale ebene Wellen sind und dieselbe Polarisation besitzen, müssen wir ihre räumliche Abhängigkeit in den Berechnungen nicht mitführen. Für das Betragsquadrat der Summe der komplexen Wellen erhalten wir dann || |2 ||𝐸Q exp(i𝜔Q 𝑡) + 𝐸O exp(i𝜔O 𝑡)||| 2 | |2 | | = |||𝐸Q ||| + |||𝐸O ||| + 2 |||𝐸Q ||| |||𝐸O ||| cos(𝜔Z 𝑡 + 𝜑Q − 𝜑O ) , (25.26) wobei 𝜔Z = 𝜔Q − 𝜔O die Differenzfrequenz ist (auch Zwischenfrequenz genannt). Da die Intensitäten 𝐼Q , 𝐼O und 𝐼 proportional zu den Betragsquadraten der komplexen Amplituden sind, gilt im Einklang mit Gl. (2.83) √ 𝐼 = 𝐼Q + 𝐼O + 2 𝐼Q 𝐼O cos(𝜔Z 𝑡 + 𝜑Q − 𝜑O ) . (25.27) Aus dem Blickwinkel der Photonenoptik kann dieser Prozess als Detektion von polychromatischen (Zweifrequenz-) Photonen aufgefasst werden (siehe Aufgabe 13-7). Die am Photodetektor registrierte optische Leistung P ist das Integral der Intensität über die Detektorfläche, also √ P = P Q + PO + 2 P Q PO cos(𝜔Z 𝑡 + 𝜑Q − 𝜑O ) , (25.28) wobei P Q und PO die Leistungen des Signals bzw. des lokalen Oszillators sind. Ausrichtungsfehler der beiden Wellen reduzieren oder verwischen den Interferenzterm [den dritten Term in Gl. (25.28)], da sich die Phase 𝜑Q − 𝜑O dann sinusförmig mit dem Ort innerhalb der Fläche des Detektors ändert. Wie aus Abb. 2.25 zu erkennen ist, kann das vermieden werden, indem man den Winkel 𝜃 zwischen den Wellenfronten so klein macht, dass 𝜃 ≪ 𝜆∕𝑎 gilt, wenn 𝑎 die Öffnung des Photodetektors ist. Wenn das Signal und der Empfängeroszillator sehr ähnliche Frequenzen haben, ist ihre Differenz 𝜔Z um viele Größenordnungen kleiner als die Frequenzen 𝜔Q bzw. 𝜔O selbst. Das überlagerte Licht ist dann quasimonochromatisch und der Gesamtphotonenfluss 𝛷 = P ∕ℎ𝜈 ist proportional zur optischen Leistung, wobei 𝜈 = 𝜔∕2π 1 und 𝜔 = (𝜔Q + 𝜔O ) ist. Der in einem Photodetektor 2 erzeugte Photostrom 𝑖 ist nach Gl. (19.4) proportional zu dem einfallenden Photonenfluss 𝛷, 𝑖 = 𝜂𝑒𝛷, wobei 𝑒 die Elektronenladung ist und 𝜂 die Quantenausbeute des Detektors. Der mittlere Photostrom ist daher 𝚤̄ = (𝜂𝑒∕ℎ𝜈)P , sodass √ (25.29) 𝚤̄ = 𝚤̄Q + 𝚤̄O + 2 𝚤̄Q 𝚤̄O cos(𝜔Z 𝑡 + 𝜑Q − 𝜑O ) ,
953
954
25 Faseroptische Kommunikation
wobei 𝚤̄Q = 𝜂𝑒 P Q ∕ℎ𝜈 und 𝚤̄O = 𝜂𝑒 P O ∕ℎ𝜈 die vom Signal und dem lokalen Oszillator erzeugten Photoströme sind. Der lokale Oszillator ist gewöhnlich viel stärker als das Signal, sodass der erste Term in Gl. (25.29) vernachlässigbar ist. Der zweite Term ist konstant. Der dritte Term, der mit der Differenzfrequenz 𝜔Z oszilliert, enthält die nützliche Information. Wenn wir 𝚤̄O und 𝜑O kennen, können wir die Amplitude und Phase dieses Terms bestimmen und 𝚤̄Q und 𝜑Q abschätzen, woraus wir die Intensität und die Phase (und folglich die komplexe Amplitude) des gemessenen optischen Signals ableiten können. Die Signalvariablen 𝚤̄Q und 𝜑Q , die die Information enthalten, variieren zeitlich gewöhnlich langsam im Vergleich zu der Differenzfrequenz 𝜔Z ; sie wirken daher als langsame Modulationen der Amplitude und Phase √ der harmonischen Funktion 2 𝚤̄O cos(𝜔Z 𝑡 − 𝜑O ). Dieser amplituden- und phasenmodulierte Strom kann mit den herkömmlichen Techniken aus amplituden- und frequenzmodulierten Funkempfängern demoduliert werden.
25.4.2
Der symmetrische Homodyndetektor
Das Homodynsystem ist ein Sonderfall des Heterodynsystems, für den 𝜔Q = 𝜔O und 𝜔Z = 0 gilt. Der Demodulationsprozess unterscheidet sich jedoch von dem in einem Heterodynsystem. In einem Homodyndetektor wird die Phase des Empfängeroszillators mithilfe eines Phasenregelkreises konstant gehalten, sodass 𝜑O = 0 ist; Gl. (25.29) liefert dann √ (25.30) 𝚤̄ = 𝚤̄Q + 𝚤̄O + 2 𝚤̄Q 𝚤̄O cos 𝜑Q . Ein symmetrischer Homodyndetektor, auch als symmetrischer Mischer bezeichnet, ist so aufgebaut, dass die ersten beiden Terme in Gl. (25.30) einander auslöschen. Wie Abb. 25.39 zeigt, werden die optischen Felder des Signals und des lokalen Oszillators dabei in einem Strahlteiler (oder Richtkoppler) gemischt. +
+
Signal
Signal – lokaler Oszillator
– (a)
– lokaler Oszillator
– (b)
Abb. 25.39 Ein symmetrische Homodyndetektor registriert in einem Arm die Intensität der Summe (+) und im anderen Arm die Intensität der Differenz (−) der Felder des Signals und des lokalen Oszillators. Die resultierenden Photoströme werden dann elektronisch subtrahiert, was einen Nettostrom liefert, der die Signalinformation enthält. (a) Realisierung über einen Strahlteiler. (b) Realisierung mit einem Optokoppler.
Da sich Phasen der Wellen an den beiden Ausgängen des Strahlteilers um π unterscheidet (siehe Abschnitt 2.5.1), enthält ein Ausgang die Summe der beiden einfallenden Felder, während der andere die Differenz enthält. Die registrierten Ströme 𝚤̄± = 𝚤̄Q + 𝚤̄O ± √ 2 𝚤̄Q 𝚤̄O cos 𝜑Q werden dann elektronisch subtrahiert; so ergibt sich √ 𝚤̄ = 4 𝚤̄Q 𝚤̄O cos 𝜑Q .
(25.31)
Der symmetrische Homodynmischer weist somit zwei Vorteile gegenüber dem Heterodynsystem auf: (1) Stochastische Fluktuationen der Intensität des lokalen Oszillators [der zweite Term in Gl. (25.30)] werden herausgemittelt und (2) das die Information tragende Signal (der dritte Term) wird verdoppelt. Ein symmetrischer Homodynempfänger mit Phasendiversität besteht aus einem Paar symmetrischer Homodynempfänger mit lokalen Oszillatoren mit den Phasen 𝜑O und 𝜑O − π∕2, die elektrische Ströme √ √ 𝚤̄ = 4 𝚤̄Q 𝚤̄O cos(𝜑Q − 𝜑O ) bzw. 𝚤̄ = 4 𝚤̄Q 𝚤̄O sin(𝜑Q − 𝜑O ) erzeugen. Dank der Unterdrückung von 𝜑O durch die Phasenkopplung liefern die Mischer somit die In-Phaseund Quadraturkomponenten des komplexen Feldes, √ √ I ∝ 𝚤̄Q cos 𝜑Q und Q ∝ 𝚤̄Q sin 𝜑Q . Vor- und Nachteile von kohärenten Empfängern
Im Vergleich zu Empfängern mit direkter Detektion haben kohärente Empfänger eine Reihe von Vorteilen: • Sie sind in der Lage, das komplexe elektrische Feld einschließlich seiner Phase und Frequenz zu messen und machen so Kommunikationssysteme auf der Grundlage der Feldmodulation mit ihrem verbesserten spektralen Wirkungsgrad erst möglich. • Aufgrund des starken Referenzfelds besitzen kohärente Detektoren einen inhärent rauschfreien Gewinn, der das Signal effektiv über das Schaltungsrauschen anhebt, wie wir im Folgenden sehen werden. • Ein kohärenter Empfänger hat selbst gegenüber einem rauschfreien Empfänger mit direkter Detektion einen Vorsprung von 3 dB im Signal/Rausch-Verhältnis, wie wir in Kürze zeigen werden. • Kohärente Empfänger sind unempfindlich gegen unerwünschtes Hintergrundlicht, mit dem der lokale Oszillator sich nicht mischt. • Kohärente Empfänger sind eine der wenigen Methoden, photonenrauschbegrenzte Detektion im Infraroten zu erreichen, wo Hintergrundrauschen allgegenwärtig ist. • Der Zugang zu dem komplexen elektrischen Feld ermöglicht die Option, während der Übertragung eingeführte Störungen des Signals wie beispielsweise
25.4 Kohärente optische Kommunikation
chromatische Aberration oder Polarisationsmodendispersion, die in optischen Fasern zu einer Pulsverbreiterung führen (Abschnitt 10.3.2), elektronisch zu kompensieren. Selbst nichtlineare Verzerrungen des Signals, die in der Faser entstanden sind, können durch digitale Signalverarbeitung korrigiert werden. • Der grundlegende Nachteil von kohärenten Empfängern liegt in den höheren Anforderungen an die verwendeten Komponenten. Kohärente Systeme erfordern eine hochstabile, rauscharme Lichtquelle mit einer geringen Bandbreite, einen stabilen lokalen Oszillator, einen optischen Mischer, in dem die überlagerten Felder präzise ausgerichtet sein müssen, sowie Schaltungen für die Phasenkopplung und Zusatzfunktionen.
25.4.3 Kohärente Systeme Ein Schema eines einfachen kohärenten faseroptischen Nachrichtensystems, das Phasenmodulation und einen symmetrischen Homodynempfänger verwendet, ist in Abb. 25.40 gezeigt. Eine wesentliche Bedingung für das richtige Mischen der Felder des lokalen Oszillators und des empfangenen optischen Feldes ist, dass sie phasengekoppelt und parallel sein sowie dieselbe Polarisation besitzen müssen, damit Interferenz möglich ist. Daraus ergeben sich strenge Anforderungen an die Komponenten des Systems. Die Laser müssen monofrequent sein und minimale Phasen- und Intensitätsfluktuationen haben. Der lokale Oszillator muss mithilfe eines Steuersystems, das seine Phase und Frequenz (über einen Phasenregelkreis) adaptiv regelt, mit dem empfangenen optischen Feld phasengekoppelt werden. Die Faser muss eine Einmodenfaser (um Modenrauschen zu vermeiden) und polarisationserhaltend sein, oder der Empfänger muss eine regelbare Polarisationskompensation ermöglichen. Ein komplexeres faseroptisches Kommunikationssystem ist in Abb. 25.41 dargestellt. Es verwendet Quadratur-Phasenumtastung (QPSK oder 4-QAM, siehe Ab-
symmetrischer Mischer Es+EL Es
MZM Laser
schnitt 25.3.1) und einen symmetrischen Homodynempfänger mit Phasendiversität. Am Sender (Tx) wird das Licht eines Lasers in zwei Arme aufgeteilt, die Mach-Zehnder-Phasenmodulatoren enthalten, welche Phasenverschiebungen von 0 oder π einführen können. Der obere Arm stellt die In-Phase-Komponente I dar, während der untere, der eine zusätzliche Phasenverschiebung von π∕2 erhält, die Quadraturkomponente Q darstellt. Die Phase des übertragenen Feldes kann somit einen von vier möglichen Werten annehmen (0, π∕2, π, 3π∕2) und so zwei Bits pro Symbol darstellen. Am Empfänger (Rx) wird der als lokaler Oszillator dienende Laser ebenfalls in zwei Arme aufgeteilt, die in zwei symmetrische Mischer geführt werden. Die Phase des Q-Zweigs ist um π∕2 verschoben. Die vom oberen und unteren Mischer erzeugten Signale sind daher proportional zu |𝐸Q + 𝐸O |2 − |𝐸Q − 𝐸O |2 und |𝐸Q + i𝐸O |2 − |𝐸Q − i𝐸O |2 , entsprechend registrierten Strömen proportional zu cos(𝜑Q und sin 𝜑Q , sodass die I- und Q-Komponenten (Kosinus und Sinus) des Signalfelds erhalten werden.Das System verwendet einen Phasenregelkreis (nicht gezeigt), der die Phase 𝜑O des lokalen Oszillators auf null hält. Ein in den 1980er Jahren realisiertes kohärentes faseroptisches Kommunikationssystem wurde typischerweise bei 𝜆0 = 1550 nm mit einer Bitrate von weniger als 1 Gbit/s betrieben. Die gewaltigen Fortschritte, die seither in den Bereichen der Elektronik und der digitalen Signalverarbeitung erzielt wurden, sowie die Verwendung einer spektral effizienten Codierung haben inzwischen zu erreichbaren Bitraten geführt, die um viele Größenordnungen über den damals möglichen liegen. Heutzutage eingesetzte Systeme verwenden eine 16-QAM- oder 64-QAM-Codierung, Bitraten von 100 Gbit/s pro Kanal und einige hundert Kanäle im C- und L-Band und erreichen so Gesamt-Bitraten von einigen 10 Tbit/s (siehe z. B. System 8 in Abb. 25.10). Experimentell wurden auch schon Systeme mit einer noch komplexeren Codierung wie z. B. 2048-QAM erprobt, die das Potential besitzen, noch weitaus größere Bitraten möglich zu machen.
Einmodenfaser Polarisationsregler
PhasenVerstärker detektor
EL
Signal Es–EL
Signal Laser
Frequenzsperre
Abb. 25.40 Kohärentes faseroptisches Nachrichtensystem. das Signal wird mithilfe eines Mach-Zehnder-Modulators (MZM) phasenmoduliert. Der symmetrische Mischer verwendet einen abstimmbaren DFB-Laser und einen Phasenregelkreis.
955
956
25 Faseroptische Kommunikation
I Q
Tx
Rx I
MZM Laser
EL Es
Es Q
MZM π/2
Q
EL Laser
I
+
Es
I
Koppler –
jEL
–
π/2
Es Koppler +
I
Q
Q
Abb. 25.41 QPSK-Kommunikationssystem für kohärente Lichtwellenleiter. Der Sender (Tx) verwendet zwei Mach-Zehnder-Modulatoren (MZM) zur Phasenmodulation der In-Phase- (I) und Quadratur- (Q) Komponenten des komplexen Feldes. Der Empfänger (Rx) verwendet zwei symmetrische Homodynmischer und einen Laser als lokalen Oszillator, um I und Q zu bestimmen.
Leistungsfähigkeit analoger kohärenter Nachrichtensysteme
Heterodyndetektion ist immer dann notwendig, wenn auch die Phase des optischen Feldes gemessen werden soll. Sie kann aber auch bei der Messung der optischen Intensität nützlich sein, da sie durch die Anwesenheit des starken lokalen Oszillators einen Gewinn liefert. Dieser Gewinn ist unter der Bezeichnung Wandlungsgewinn bekannt, da er einen Teil der Leistung des lokalen Oszillators in eine Verstärkung des Signals umwandelt, wie weiter unten deutlich werden wird. Die kohärente Detektion ist daher auch eine Alternative sowohl zur optischen Verstärkung (siehe die Abschnitte 15.3 und 18.2) als auch zur Verstärkung durch Lawinenphotodioden (siehe Abschnitt 19.4). Das kann im Hinblick auf das Signal/Rausch-Verhältnis einen Vorteil gegenüber der direkten Detektion bewirken, wie wir in diesem Abschnitt zeigen wollen. Der von einer Photodiode erzeugte mittlere Photostrom 𝚤̄ wird von Rauschen mit der Varianz 𝜎𝑖2 = 2𝑒̄𝚤𝐵 + 𝜎E2
(25.32)
begleitet, wobei 𝐵 die Bandbreite des Empfängers ist; der erste Term beschreibt das Schrotrauschen des Photostroms und der zweite das Schaltungsrauschen (siehe Abschnitt 19.6.3). Wenn Heterodyndetektion verwendet wird und der lokale Oszillator so stark ist, dass 𝚤̄O ≫ 𝚤̄Q und 2𝑒̄𝚤O 𝐵 ≫ 𝜎E2 gilt, erhalten wir für die Gln. (25.29) und (25.32) näherungsweise √ 𝚤̄ ≈ 𝚤̄O + 2 𝚤̄Q 𝚤̄O cos(𝜔Z 𝑡 + 𝜑Q − 𝜑O ) , 𝜎𝑖2
≈ 2𝑒̄𝚤O 𝐵 .
(25.33a) (25.33b)
Für Amplitudenmodulation wird das Signal durch den Effektivwert der sinusförmigen Wellenform aus Gl. (25.33a) dargestellt, wobei die Phase ignoriert
wird. Die Leistung des elektrische Signals ist daher 1 √ [2 𝚤̄Q 𝚤̄O ]2 = 2̄𝚤Q 𝚤̄O und die Rauschleistung ist 𝜎𝑖2 = 2 2𝑒̄𝚤O 𝐵; folglich ist das Signal/Rausch-Verhältnis der Leistung SRV =
𝚤̄Q 2̄𝚤Q 𝚤̄O = . 2𝑒̄𝚤O 𝐵 𝑒𝐵
(25.34)
Wenn m = 𝚤̄∕2𝐵𝑒 die mittlere Zahl von Photoelektronen ist, die in der Auflösungszeit T = 1∕2𝐵 des Empfängers registriert werden (siehe Abschnitt 19.6.1), dann wird Gl. (25.34) zu SRV = 2m .
(25.35)
Durch das Vorhandensein des lokalen Oszillators wird das Signal/Rausch-Verhältnis somit sowohl von der Stärke des lokalen Oszillators als auch von einem eventuellen Schaltungsrauschen unabhängig. Der Wandlungsgewinn hat effektiv das Signal über das Schaltungsrauschen hinaus verstärkt. Zum Vergleich ist das Signal/Rausch-Verhältnis eines Photodiodenempfängers mit direkter Detektion für denselben Signalstrom 𝚤̄Q im Einklang mit Gl. (19.70) SRV =
2 𝚤̄Q
2𝑒̄𝚤Q 𝐵 +
𝜎E2
=
m2 m + 𝜎𝑞2
,
(25.36)
wobei 𝜎𝑞2 = (𝜎E ∕2𝐵𝑒)2 der in Gl. (19.64) definierte Schaltungsrauschparameter ist. Jetzt wird der Hauptvorteil des Heterodynsystems deutlich. Für starkes Licht oder geringes Schaltungsrauschen (m ≫ 𝜎𝑞2 ) ist das Ergebnis für direkte Detektion SRV = m. Der Heterodyndetektor liefert demgegenüber SRV = 2m, also eine Verbesserung um einen Faktor 2 (3 dB). Für schwaches Licht (oder großes Schaltungsrauschen) kann der Vorteil noch viel größer werden, da für den Heterodyndetektor dann immer noch SRV = 2m gilt, wo-
25.4 Kohärente optische Kommunikation
hingegen das Signal/Rausch-Verhältnis eines Empfängers mit direkter Detektion durch das Schaltungsrauschen auf SRV = m∕(1 + 𝜎𝑞2 ∕m) reduziert wird. Auch die Integration einer Lawinenphotodiode in ein System mit direkter Detektion macht die Sache nicht besser. Wenn der Gewinn der Lawinenphotodiode groß genug ist, um das Schaltungsrauschen auszugleichen, ist das Signal/ Rausch-Verhältnis nach Gl. (19.69) SRV =
m
, (25.37) 𝐹 wobei 𝐹 der Zusatzrauschfaktor der Lawinenphotodiode ist (𝐹 > 1). Daher ist selbst ein rauschfreier Lawinenphotodiodenempfänger (𝐹 = 1) dem Heterodyndetektor um einen Faktor 2 unterlegen. Leistungsfähigkeit digitaler kohärenter Nachrichtensysteme
(a) OOK
μ1 –μ0
μ1 –μ0
(b)BPSK
(c) QPSK
Abb. 25.42 Konstellationsdiagramme für OOK-, BPSK- und QPSK-Homodynsysteme. Die schattierten Kreise symbolisieren das Rauschen.
wobei m = 𝚤̄Q ∕2𝑒𝐵 die mittlere Zahl von nachgewiesenen Photoelektronen für den Zustand „1“ ist. Für BFR = 10−9 ist 𝑄 ≈ 6 und daher m = 36 entsprechend einer 1 Empfängerempfindlichkeit m0 = m = 18 Photoelektro2 nen pro Bit (gemittelt über beide logischen Zustände). Binäres Homodynsystem mit Phasencodierung (PSK)
In diesem Abschnitt werden wir die Leistungsfähigkeit und Empfindlichkeit von digitalen kohärenten Nachrichtensystemen mit Amplituden- und Phasenmodulation bestimmen. Homodynsystem mit ein-aus-Codierung
Wir betrachten ein ein-aus-codiertes (OOK) System, das Daten mit einer Geschwindigkeit 𝐵0 überträgt und einen Homodyndetektor verwendet. Die logischen Zustände „1“ und „0“ werden durch die An- bzw. Abwesenheit des Signals ̄𝚤Q während der Bitdauer T = 1∕𝐵0 bezeichnet. Wenn der lokale Oszillator stark ist und 𝜑Q = 𝜑O = 0 sowie 𝜔Z = 𝜔Q − 𝜔O = 0 gilt, sind die Mittelwerte und Varianzen des gemessenen Stroms nach den Gln. (25.33a) und (25.33b): √ Mittel 𝜇1 ≈ 𝚤̄O + 2 𝚤̄O 𝚤̄Q , Varianz 𝜎12 ≈ 2̄𝚤O 𝑒𝐵
für Zustand „1“,
Mittel 𝜇0 ≈ 𝚤̄O ,
für Zustand „0“.
Varianz 𝜎02 ≈ 2̄𝚤O 𝑒𝐵
μ1 –μ0
(25.38) Die Bandbreite des Empfängers ist 𝐵 = 𝐵0 ∕2, da die Bitdauer T = 1∕𝐵0 die Abtastzeit 1∕2𝐵 für ein Signal der Bandbreite 𝐵 ist. Abbildung 25.42(a) zeigt die Differenz 𝜇1 − 𝜇0 im Verhältnis zu dem quadratisch gemittelten Rauschen 𝜎1 = 𝜎0 = 𝜎 für das OOK-Konstellationsdiagramm. Die Leistung eines binären Nachrichtensystems in gaußscher Näherung wurde in Abschnitt 25.4 besprochen. Die Bitfehlerrate ist gemäß Gl. (19.88) und (19.89) √ 1 (25.39) BFR ≈ [1 − erf(𝑄∕ 2)] 2
mit 𝑄 = (𝜇1 − 𝜇0 )∕(𝜎1 + 𝜎0 ). Gleichung (25.38) liefert daher √ √ 𝚤̄Q 𝜇1 − 𝜇0 𝑄= = (25.40) = m, 𝜎1 + 𝜎0 2𝑒𝐵
In diesem Fall werden die logischen Zustände „1“ und „0“ wie in Abb. 25.42(b) gezeigt durch eine Phasenverschiebung 𝜑Q = 0 bzw. π dargestellt. Wenn wir 𝜑O = 0 und 𝜔Z = 𝜔Q − 𝜔O = 0 annehmen, sind die Mittelwerte und Varianzen des Photostroms für die Bits „1“ bzw. „0“ √ Mittel 𝜇1 = 𝚤̄O + 2 𝚤̄O 𝚤̄Q , √ Mittel 𝜇0 = 𝚤̄O − 2 𝚤̄O 𝚤̄Q ,
Varianz 𝜎12 = 2𝑒̄𝚤O 𝐵
für Zustand „1“,
𝜎02
für Zustand „0“
Varianz
= 2𝑒̄𝚤O 𝐵
(25.41) und folglich √ √ 𝚤̄Q 𝜇1 − 𝜇0 =2 m. =2 𝑄= 𝜎1 + 𝜎0 2𝑒𝐵
(25.42)
Dieser Wert ist doppelt so hoch wie im Fall des OOKSystems, was auch durch Vergleich der Konstellationsdiagramme in Abb. 25.42(a) und (b) deutlich wird. Für BFR = 10−9 ist wieder 𝑄 ≈ 6, aber nun m = 9. Da in diesem Fall jedes der beiden Bits im Mittel neun Photoelektronen enthalten muss, ist die mittlere Zahl von Photoelektronen pro Bit m0 = m = 9. Daraus folgt, dass die Empfängerempfindlichkeit 9 Photoelektronen/Bit ist. Der PSK-Homodynempfänger ist damit doppelt so empfindlich wie der OOK-Homodynempfänger, weil er nur halb so viele Photoelektronen benötigt, um dieselbe BFR zu erreichen. Homodynsystem mit Quadratur-Phasenumtastung (QPSK)
Als letztes Beispiel betrachten wir die Empfindlichkeit eines Homodyn-Quadratur-PSK-Systems (QPSK) und zeigen, dass sie ebenfalls 9 Photoelektronen pro Bit beträgt. Dazu vergleichen wir die in den Abb. 25.42(b) und (c) dargestellten Konstellationsdiagramme. Der Abstand 𝜇1 𝜇0 zwischen den nächstgelegenen Punkten in
957
958
25 Faseroptische Kommunikation
√ der QPSK-Konstellation ist um einen Faktor 1∕ 2 kleiner als der entsprechende Abstand in der BPSK-Konstellation, während das Rauschen 𝜎 gleich groß ist. Die Vorgabe BFR = 10−9 führt daher √ wieder zu 𝑄 ≈ 6, wobei
in diesem Fall jedoch 𝑄 = 2m ist, sodass sich m = 18 ergibt. In einem QPSK-System entspricht jedes Symbol aber zwei Bits, sodass die Anzahl der Photoelektronen pro Bit m0 = m∕2 = 9 ist; wir erhalten also dasselbe Ergebnis wie für das BPSK-Homodynsystem.
Photonen pro Bit, wenn 𝐹 der Zusatzrauschfaktor der Lawinenphotodiode ist. Systeme mit direkter Detektion könnten im Prinzip dieselbe Leistungsfähigkeit wie Systeme mit kohärenter Detektion erreichen, wenn eine ideale rauschfreie Lawinenphotodiode (𝐹 = 1) verfügbar wäre. Es ist in diesem Zusammenhang interessant, die Werte in Tabelle 25.2 mit denen aus Tabelle 19.2 für OOK-Empfänger mit direkter Detektion in Anwesenheit von Schaltungs- und Gewinnrauschen zu vergleichen.
Vergleich von Heterodyn- und Homodynsystemen
Ein digitaler Heterodyndetektor benötigt doppelt so viele Photonen pro Bit wie ein Homodyndetektor. Um das zu verstehen, vergleichen wir die Signalströme für entsprechende OOK-Systeme. Für Homodyning erhalten √ wir 𝜇1 − 𝜇0 = 2 𝚤̄Q 𝚤̄O wie in Gl. (25.38) angegeben, wohingegen das Ergebnis für Heterodyning um einen Fak√ √ tor 2 kleiner ist, nämlich 𝜇1 − 𝜇0 = 𝚤̄Q 𝚤̄O . Der Grund hierfür ist der Kosinusterm in Gl. (25.33a), der im Fall von Homodyning konstant ist, für Heterodyning aber mit der Zwischenfrequenz 𝜔Z mit einem Effektivwert 1∕2 oszilliert. Da die Varianzen des Rauschens gleich sind (𝜎12 = 𝜎02 ) und für BFR = 10−9 𝑞 ≈ 6 ist, erhalten wir √ 6 = m∕2 oder m0 = m∕2 = 36. Dieser Nachteil um einen Faktor 2 für das Heterodyning überträgt sich auf die Phasenumtastung, wie Tabelle 25.2 zeigt. Tabelle 25.2 gibt die Empfängerempfindlichkeiten (in Photonen pro Bit) verschiedener digitaler Modulationsverfahren unter idealen Bedingungen an. Obwohl OOKSysteme mit direkter Detektion scheinbar nahezu dieselbe Leistung wie das beste kohärente System (PSKHomodyn) erreichen (9 Photonen pro Bit), trifft das in der Praxis nicht zu. In einem Homodynsystem wird das Schaltungsrauschen durch den starken lokalen Oszillator minimiert, während die direkte Detektion in der Praxis häufig durch Schaltungsrauschen begrenzt wird. Zwar kann eine Lawinenphotodiode in einem Empfänger mit direkter Detektion eingesetzt werden, um das Schaltungsrauschen ebenfalls zu minimieren, aber das Gewinnrauschen der Lawinenphotodiode erhöht die Empfängerempfindlichkeit von 10 auf mindestens 10𝐹 Tab. 25.2 Empfängerempfindlichkeiten (in Photonen pro Bit) für unterschiedliche Empfänger und Modulationsarten unter idealen Bedingungen. Homodyndetektoren sind Heterodetektoren und PSK ist OOK überlegen. Modulation
Direkte Detektion Homodyn Heterodyn
OOK 10 PSK (BPSK und QPSK) — FSK —
18 9 —
36 18 36
25.5 Faseroptische Netze Ein Nachrichtennetz besteht aus einer Reihe von Nachrichtenverbindungen, die eine Anzahl von Benutzern (Terminals) innerhalb eines geografischen Bereichs verbinden. Nachrichten oder Daten können durch Übertragung über eine oder mehrere Verbindungen von einem Terminal zu einem anderen geleitet werden, wobei der Weg der Daten durch Router und Schalter gesteuert wird. Ein lokales Netz (LAN, engl. local area network) kann beispielsweise Terminals wie Computer, Drucker, Videomonitore oder Fax- und Kopiergeräte in einem Gebäude, einem Campus oder einer Produktionsanlage verbinden. Größere Netze sind z. B. das Telefonnetz, das globale Telexnetz oder das Internet. Das Netz kann auf elektrischen Kabeln, optischen Fasern oder Satellitenverbindungen beruhen. Faseroptische Netze bestehen aus faseroptischen Verbindungen und elektronischen oder optischen Routern und Schaltern (siehe Kapitel 24).
25.5.1
Netztopologien und Vielfachzugriff
In seiner einfachsten Form besteht ein Netz aus 𝑁 Knoten aus expliziten Punkt-zu-Punkt-Verbindungen zwischen allen Paaren von Knoten. Dazu sind 𝑁(𝑁 − 1) bidirektionale Punkt-zu-Punkt-Verbindungen, 2𝑁(𝑁 − 1) Sender und 2𝑁(𝑁 − 1) Empfänger nötig. Topologien, die mit weniger Verbindungen, Sendern und Empfängern auskommen, sind z. B. die Bus-, Stern- oder Ringtopologien, die in Abb. 25.43 dargestellt sind. In solchen Netzen sind nur 𝑁 Sender und 𝑁 Empfänger nötig. In einem Sternnetz ist jeder Knoten über einen Sternkoppler im Zentrum des Netzes mit allen anderen Knoten verbunden; die von einem Knoten übertragene Leistung wird gleichmäßig unter den anderen Knoten geteilt. In Bus- und Ringnetzen führt die Faser durch die Knoten hindurch, und Daten können von jedem Knoten aus dem optischen Signal extrahiert oder zu ihm hinzugefügt werden. Ein vermaschtes Netz (engl. mesh network) beschreibt eine allgemeinere Konfiguration. Da
25.5 Faseroptische Netze
(c) Bus Sternkoppler
(b) Ring
(a) Stern
(d) Maschen
Abb. 25.43 Netztopologien: (a) Stern, (b) Ring, (c) Bus und (d) Maschen.
Verbindungszentrale BackboneRing
BackboneRing
Bu s
Ring
Ring
Abb. 25.44 Ein Netz aus Ring- und BusTeilnetzen, die durch zentrale digitale Schaltverteiler (XC) verknüpft sind. Backbone-Ringnetze tragen starken Datenverkehr und erschließen die Teilnetze.
Ring
das von den verschiedenen Knoten übertragene Licht unterschiedliche Entfernungen zu anderen Knoten zurücklegt, müssen die Empfänger in der Lage sein, sehr unterschiedliche empfangene Leistungen zu verarbeiten, d. h. sie müssen einen großen dynamischen Bereich haben. Häufig werden mehrere einzelne Netze mit gleichen oder unterschiedlichen Topologien zu einem größeren übergeordneten Netz verbunden, wie das Beispiel in Abb. 25.44 zeigt. Schnittstellen
Die Schnittstelle zwischen einem Terminal und dem Fasernetz an jedem Knoten umfasst einen Empfänger, einen Sender und einen elektronischen Add/Drop-Multiplexer (ADM), wie in Abb. 25.45(a) dargestellt. Der Empfänger registriert das optische Signal, und der ADM extrahiert Daten und fügt neue Daten hinzu, die eine Quelle modulieren und ein neues optisches Signal über eine andere Faser übertragen. Man bezeichnet eine solche Schnittstelle als intransparent, da das Licht an dem Knoten registriert und neu erzeugt wird. Eine transparente Schnittstelle wird wie in Abb. 25.45(b) optisch mit dem Fasernetz gekoppelt (optische Richtkoppler werden in den Abschnitten 24.1 und 24.3 beschrie-
ben). Eine optische Schnittstelle zu einer bidirektionalen Faser verwendet zwei Richtkoppler, um in beide Richtungen übertragen und empfangen zu können, wie Abb. 25.45(c) zeigt. Vielfachzugriff
Die durch die Netzknoten übertragenen Signale teilen dieselbe Faser (das Medium). Um Verwirrung zu vermeiden, ist ein Schema für den Vielfachzugriff oder Medienzugriff erforderlich. Vielfachzugriffsysteme mit Zeit-, Frequenz- und Codezuteilung sind im Gebrauch: ähnelt dem Zeitmultiplexing in konventionellen Punkt-zu-Punkt-Nachrichtensystemen (siehe Abschnitt 25.3.2). Die Knoten senden ihre Daten in verschachtelten Zeitfenstern durch das gemeinsame Medium. Puffer dienen zur Zwischenspeicherung der Daten bis zur passenden Zeit. Da es nicht möglich ist, die Taktgeber aller Knoten zu synchronisieren, sind Schutzzeiten zwischen aufeinander folgenden Zeitfenstern nötig. Vielfachzugriff mit Frequenzzuteilung ähnelt dem Frequenzmultiplexing (siehe Abschnitt 25.3.2). Hier Vielfachzugriff mit Zeitzuteilung
959
25 Faseroptische Kommunikation
/
/
/
/ /
/
(c) (a)
(b)
Abb. 25.45 Schnittstellen zwischen einem Knoten und dem Fasernetz. (a) Intransparente Schnittstelle. Das Signal wird von optisch nach elektronisch (O/E) gewandelt, und der ADM extrahiert Daten und fügt neue hinzu, woraufhin ein neues
optisches Signal (E/O) erzeugt wird. (b) Optisch gekoppelte (transparente) Schnittstelle mit einem Richtkoppler. (c) Optisch gekoppelte Schnittstelle zu einer (bidirektionalen) Duplexfaser mit zwei Richtkopplern.
senden die Knoten ihre Daten in vorgegebenen spektralen Bändern durch das gemeinsame Medium; es ist daher nicht nötig, die Taktgeber verschiedener Signale zu synchronisieren. In optischen Netzen wird der Vielfachzugriff mit Frequenzzuteilung als Vielfachzugriff mit Wellenlängenzuteilung bezeichnet; er ist das Gegenstück zum Wellenlängenmultiplexing. Vielfachzugriff mit Codezuteilung ähnelt dem Codemultiplexing (siehe Abschnitt 25.3.2). Jedem Knoten wird ein eindeutiger Adresscode zugeteilt. Die von einem Knoten übertragenen Daten werden mit dem Adresscode des Zielknotens verschlüsselt. Jeder Knoten korreliert seinen eigenen Adresscode mit dem des eingehenden Signals. Dadurch verarbeitet er nur die für ihn bestimmten Pakete und ignoriert alle anderen. Die Daten werden in einer Folge von Paketen übertragen, von denen jedes die Adresse seines Ziels trägt (siehe Abschnitt 24.3.6).
51.84 Mbit/s überträgt. Kombination von 𝑁 solcher Signale erzeugt ein OC-𝑁-Signal mit einer 𝑁-mal größeren Geschwindigkeit, wie Tabelle 25.3 zeigt. Beispielsweise arbeiten OC-192 und OC-768 mit etwa 10 Gbit/s bzw. 40 Gbit/s. Beispiel 25-2: Ringnetz
Abbildung 25.46 zeigt ein Beispiel für ein faseroptisches Ringnetz mit vier Knoten, das mit unterschiedlichen Datengeschwindigkeiten arbeitet. Jeder der vier Knoten überträgt Daten zu den anderen drei Knoten nach OC-12 (≈ 622 Mbit∕s) oder OC-24 (≈ 1.24 Gbit∕s). Das Fasersegment zwischen Knoten 1 und 2 trägt den stärksten Verkehr nach einem kombinierten Protokoll OC-12 + OC-12 + OC-24 = OC-48 (≈ 2.5 Gbit∕s). Die Segmente 2–3 und 3–4 führen schwächeren Verkehr nach OC-24. 1
12
12 C-
OC-24
C2
O
C-
C-
24
12
O
C12
4
O
SONET bzw. seine internationale Version Synchronous Digital Hierarchy (SDH) ist eine Norm für die Datenübertragung durch optische Fasern durch Wellenlängenmultiplexing. Sie löst das Problem des Wellenlängenmultiplexing von Signalen mit geringfügig unterschiedlichen Geschwindigkeiten der Taktgeber, indem diese Signale in Fenster mit einer längeren Dauer eingebettet werden. Die Nutzdaten (die Signalbits) dürfen sich innerhalb der Fenster verschieben, aber die Fenster sind stets vollkommen synchron. SONET stellt eine Hierarchie von gemultiplexten Signalen zu Verfügung, deren Grundeinheit, das STS-1-Signal (auch OC-1), Daten mit
O
Synchronous Optical Network (SONET)
O
960
3
Abb. 25.46 Ein Ringnetz mit vier Knoten.
Tab. 25.3 Übertragungsgeschwindigkeiten (in Mbit/s) in der im SONET verwendeten STS-Hierarchie. OC-1
OC-3
OC-12
OC-24
OC-48
OC-192
OC-768
OC-1920
51.84
155.52
622.08
1244.16
2488.32
9995.33
39 813.12
99 532.80
25.5 Faseroptische Netze
25.5.2 Wellenlängenmultiplexnetze
1
Ein faseroptisches Wellenlängenmultiplexnetz verwendet grob- oder engmaschiges Wellenlängenmultiplexing für die Kommunikation entlang seiner Verbindungen und Vielfachzugriff mit Wellenlängenzuteilung für den Medienzugriff. Die Knoten werden in einer bestimmten Topologie verbunden (z. B. als Stern, Ring, Bus oder Maschen), und jeder Knoten überträgt in einen oder mehrere Wellenlängenkanäle und empfängt aus einem oder mehreren Wellenlängenkanälen. Die Existenz von mehreren Wellenlängenkanälen für jede physische Verbindung fügt dem Netz eine weitere Dimension hinzu und bietet zusätzliche Flexibilität auf Kosten zusätzlicher Komplexität. Broadcast-and-Select-Wellenlängenmultiplexnetz
Das einfachste Wellenlängenmultiplexnetz ist das Broadcast-and-Select-Netz. Hier überträgt jeder Knoten bei einer eindeutigen festen Wellenlänge und sendet seine Daten über passive optische Koppler an alle anderen Knoten (Broadcast). Der Empfänger in jedem Knoten wählt die für ihn bestimmte Wellenlänge durch ein abstimmbares Filter aus (Select). In dem in Abb. 25.47(a) gezeigten 5-Knoten-Netz senden die Knoten 1, 2, . . . , 5 bei den Wellenlängen 𝜆1 , 𝜆2 , . . . , 𝜆5 . Ein optischer Sternkoppler überträgt jede Sendung an alle anderen Knoten. In dem gezeigten Zustand ist Knoten 1 beispielsweise auf Kanal 𝜆5 abgestimmt, die Knoten 2, 3, und 4 senden auf 𝜆1 , und Knoten 5 sendet auf 𝜆2. Wie das äquivalente Verbindungsdiagramm in Abb. 25.47(b) illustriert, überträgt Knoten 2 an Knoten 5, Knoten 5 an Knoten 1, und Knoten 1 an die Knoten 2, 3, und 4. In einem anderen Beispiel [Abb. 25.48(a)] ist der Empfänger jedes Knotens auf die von seinem nächsten Nachbarn übertragene Wellenlänge abgestimmt. Daher ist die logische Topologie dieses Netzes, dessen physische Topologie ein Stern ist, ein Ring, wie Abb. 25.48(b) verdeutlicht.
1 λ1
λ2
λ5
2
1
λ1
(a)
λ5
λ1
2
λ5
λ2 5
λ1
3
5
λ2
λ1 λ1
3
λ1 4
4 (b)
Abb. 25.47 (a) Ein Wellenlängenmultiplex-Broadcast-andSelect-Netz und (b) seine äquivalenten logischen Verbindungen.
λ2 2
λ2
λ1
λ3
λ1 4
λ4
λ4 (a)
1
λ2
2
λ1
λ3
λ3 3
4
λ4
3
(b)
Abb. 25.48 Ein Wellenlängenmultiplexnetz mit (a) einer physischen Sterntopologie ist (b) logisch äquivalent zu einer Ringtopologie.
Multi-Hop-Broadcast-and-Select-Wellenlängenmultiplexnetz
Die Forderung, dass jeder der Knoten eines Broadcastand-Select-Netzes in der Lage sein muss, eine oder mehrere der von den anderen Knoten übertragenen Wellenlängen auszuwählen und selektiv zu registrieren, kann eine Herausforderung sein. Diese Hürde wird in einem Multi-Hop-Netz reduziert, in dem jeder Knoten zwei unterschiedliche Wellenlängenkanäle für das Senden und nur zwei unterschiedliche Kanäle für den Empfang zugeteilt bekommt. Ein Knoten kann zu einem gegebenen Zeitpunkt auf einer seiner beiden Sendewellenlängen senden und auf einer seiner beiden Empfangswellenlängen empfangen. Die Kanäle werden den Knoten so zugeteilt, dass ein Knoten mit jedem anderen Knoten entweder über eine einzige Verbindung (d. h. direkt) oder über zwei Verbindungen kommunizieren kann. In dem in Abb. 25.49(a) gezeigten Netz kann Knoten 2 an Knoten 1 beispielsweise über Kanal 𝜆3 direkt senden. Obwohl Knoten 1 nicht direkt an Knoten 2 senden kann, da sie keine gemeinsame Wellenlänge besitzen, kann diese Übertragung in zwei Schritten stattfinden: Knoten 1 überträgt die Daten auf Kanal 𝜆1 , und Knoten 3 überträgt sie anschließend auf dem Kanal 𝜆6 an Knoten 2 [Abb. 25.49(b)]. Dieser Aufbau wird daher Multi-HopBroadcast-and-Select-Netz genannt. Die logische Topologie dieses Netzes ist in Abb. 25.49(c) gezeigt. Die Broadcast-and-Select-Anordnung, egal ob SingleHop oder Multi-Hop, ist für Netze mit einer großen Zahl von Knoten nicht geeignet. Da die von einem Knoten gesendete Leistung alle anderen Knoten erreichen muss, wird das System für eine große Zahl von Knoten ineffizient. Auch die Zahl der Kanäle, der gleich der Zahl von Knoten oder größer sein muss, wird für große Netze prohibitiv.
961
962
25 Faseroptische Kommunikation
1
λ 3, λ 4
λ 1, λ 2 λ 3, λ 5
1
2
2
λ1
λ3
1
λ1
λ6
λ 6, λ 7
λ2 λ 8, λ 1
λ 2, λ 4 λ 7, λ 8
4
λ 5, λ 6
λ4
λ7
λ1 λ6
4
3
(a)
2
λ6
λ5 3
4
3
λ8
(b)
(c)
Abb. 25.49 (a) Ein Multi-Hop-Broadcast-and-Select-Netz. (b) Eine Zweischritt-Verbindung von Knoten 1 über Knoten 3 zu Knoten 2. (c) Die logische Topologie des Netzes. λ 1, λ 2 λ 1, λ 3 1
2 λ2
λ1 λ1
λ1
λ1
5
(a)
λ3
λ1
λ 1, λ 3
λ1 4
λ3
λ 1, λ 2 3
λ2
λ1
1
λ1 λ2
λ3
λ 1, λ 2
λ1
λ 1, λ 2
5
λ1
2
λ1
λ2 λ2
λ1
λ 1, λ 3
λ3 λ1
3
λ3 λ2 λ1
λ 1 , λ 2, λ 3
λ1 4
λ1
(b)
(c)
Abb. 25.50 (a) Ein Ringnetz mit fünf Knoten und drei Kanälen mit Wellenlängenrouting. (b) Seine logische Topologie. (c) Der für Knoten 5 verwendete optische Add/Drop-Multiplexer.
Netze mit Wellenlängenrouting
In einem Netz mit Wellenlängenrouting kommuniziert ein Paar von Knoten auf einem gemeinsamen Wellenlängenkanal über einen bestimmten Verbindungsweg. Ein anderes Paar von Knoten kann denselben Wellenlängenkanal benutzen, wenn ihr Verbindungsweg kein Segment mit dem Weg des ersten Paars gemeinsam hat. In dem in Abb. 25.50(a) gezeigten Netz kommunizieren die Knoten 1 und 2 beispielsweise auf Kanal 𝜆1 , genau wie die Knoten 2 und 3. Die Knoten 1 und 3 müssen jedoch eine andere Wellenlänge 𝜆2 verwenden, wenn sie den Weg nutzen, der sie über Knoten 2 verbindet. Ähnlich kommunizieren die Knoten 4 und 1 über einen dritten Kanal 𝜆3 , da ihr Weg Verbindungen enthält, die auch die Kanäle 𝜆1 und 𝜆2 benutzen. In einem solchen Netz trägt jede Verbindung eine oder mehrere Wellenlängen (aber nicht unbedingt alle Wellenlängen wie im Broadcast-and-Select-Netz). Zum Beispiel führt die Verbindung zwischen Knoten 4 und 5 Verkehr auf drei Wellenlängenkanälen, aber jede der anderen vier Verbindungen führt nur zwei Kanäle. Außerdem sendet und empfängt jeder Knoten Daten bei einer oder mehreren Wellenlängen. Zum Beispiel empfängt
Knoten 5 Daten von Knoten 4 bei 𝜆1 und von Knoten 3 bei 𝜆2 ; er sendet bei 𝜆1 an Knoten 1 und gleichzeitig laufen Daten aus Kanal 𝜆3 durch ihn hindurch, ohne verändert zu werden. Die logischen Verbindungen in diesem Netz sind in Abb. 25.50(b) gezeigt. Die entscheidende Komponente in einem Wellenlängenmultiplexnetz mit Wellenlängenrouting ist ein optischer Add/Drop-Multiplexer (OADM, siehe Abschnitt 24.2.1). Jeder Knoten besitzt einen OADM, der Daten aus bestimmten Wellenlängenkanälen auf der eingehenden Faser extrahiert, Daten zu bestimmten Kanälen auf der ausgehenden Faser hinzufügt und Daten auf bestimmten Kanälen der eingehenden Faser ohne Änderung zur ausgehenden Faser durchleitet. Ein OADM besteht aus einem optischen Demultiplexer (ODMUX), einem Add/Drop-Multiplexer (ADM) und einem optischer Multiplexer (OMUX). Als Beispiel ist in Abb. 25.50(c) der in Knoten 5 des Netzes aus Abb. 25.50(a) verwendete OADM gezeigt. Flexible Netze verwenden konfigurierbare OADM (ROADM, engl. reconfigurable optical add/drop multiplexer), siehe Beispiel 24-4.
25.5 Faseroptische Netze
100 Gbit/s
λ1 …
…
…
O
M
λN
IPRouter
U
optisches Transportsystem 20 Tbit/s
X
λ1, λ2, . . , λN
ClientNetzwerkSchnittstelle Schnittstelle
Drop
λ1, λ2, . . , λN
O
X U M D …
λ1 …
…
Add Drop
IPRouter
Add
Abb. 25.51 Ein optisches Wellenlängenmultiplexsystem, das zwei Gruppen von IP-Routern miteinander verbindet und über ROADM, die Informationen hinzufügen und löschen, Daten mit anderen optischen Verbindungen im Netzwerk austauscht.
λ 1, λ 2, λ 3, λ 4
λ 1, λ 2, λ 3, λ 4
λ1 λ2 λ3 λ4 λ1 λ2 λ3 λ4
Add
Schalter &
λ1 λ2 λ3 λ4 λ1 λ2 λ3 λ4
Drop
Netze mit Wellenlängenrouting und anderen Topologien als einem Ring besitzen Knoten mit mehreren einund ausgehenden Fasern. An diesen Knoten sind komplexere Router erforderlich. Zum Beispiel verwendet ein Knoten mit zwei ein- und zwei ausgehenden Fasern, wie in Abb. 25.52 gezeigt, einen optischen Schaltverteiler, der Daten von ausgewählten eingehenden Fasern/Kanälen empfängt, zu ausgewählten ausgehenden Fasern/ Kanälen hinzufügt, und von ausgewählten eingehenden Kanälen zu ausgewählten ausgehenden Kanälen durchleitet. Der Schaltverteiler verwendet mehrdimensionale Raumbereichs-/Wellenlängenbereichsschalter und Add/Drop-Multiplexer (siehe Abschnitt 24.3.4). Netze mit Wellenlängenrouting verwenden auch Hub-Knoten, die mithilfe eines Servers Daten auf allen Wellenlängenkanälen verarbeiten.
λ 1, λ 2, λ 3, λ 4
Ein optisches Netzwerk mit einem ROADM ist in Abb. 25.51 schematisch dargestellt. Datenpakete von vielen Paketroutern, die das Internetprotokoll (IP) verwenden, werden über eine optische Client-Schnittstelle (z. B. mit einer Bitrate von 100 Gbit/s über optische Kurzstreckenverbindungen von bis zu etwa 40 km) zu kleinen Gruppen zusammengefasst und per Wellenlängenmultiplexing zu einem einzigen Signal vereinigt, das ohne zwischengeschaltete elektronische Verarbeitung über eine einfaserige optische Verbindung über tausende von Kilometern übertragen wird. Die Faser kann beispielsweise 100 Wellenlängenkanäle übertragen, die jeweils mit einer Datenrate von 200 Gbit/s in einem optischen Frequenzraster von 50 GHz arbeiten und so eine Gesamt-Bitrate von 20 Tbit/s erreichen. Am anderen Ende der Leitung wird das optische Signal in umgekehrter Weise demultiplext und speist schließlich andere IPPaketrouter. Unterwegs können bestimmte Kanäle mithilfe von ROADM dynamisch auf andere optische Verbindungen im Netzwerk geleitet werden.
λ 1, λ 2, λ 3, λ 4
Abb. 25.52 Ein optischer Schaltverteiler an einem Knoten mit zwei ein- und zwei ausgehenden Fasern mit je vier Wellenlängenkanälen.
963
25 Faseroptische Kommunikation
Beispiel 25-3: Wellenlängenmultiplex-Ringnetz
Ein Wellenlängenmultiplex-Ringnetz mit vier Knoten und drei Kanälen mit Wellenlängenrouting arbeitet auf drei Kanälen mit den Wellenlängen 𝜆1 , 𝜆2 und 𝜆3 mit den in Abb. 25.53 gezeigten Geschwindigkeiten. Dieses Netz ist eine fortgeschrittene Version des Netzes aus Abb. 25.46. Die Knoten 1 und 3 verwenden die Wellenlängen 𝜆1 und 𝜆2 , Knoten 4 verwendet die Wellenlängen 𝜆1 und 𝜆3 und Knoten 2 verwendet alle drei Wellenlängen. Im diesem verbesserten Netz kommunizieren die Knoten mit den doppelten Geschwindigkeiten des ursprünglichen Netzes, die maximale Geschwindigkeit ist aber nicht größer als die des ursprünglichen Netzes. Das Fasersegment zwischen Knoten 1 und 2 führt den stärksten Verkehr bei einer kombinierten OC-96-Geschwindigkeit (≈ 5 Gbit∕s), aber die höchste Geschwindigkeit bei einer gegebenen Wellenlänge ist OC-48 (≈ 2.5 Gbit∕s).
λ 1, λ 2
1
λ1
O
24
λ1
C-
24
C-
OC-48
O λ 1, λ 3
2 λ3
4
48
Cλ 1, λ 2
O
λ2 λ1
λ 1, λ 2, λ 3
4
O λ1
24
C-
O C2
964
3
Abb. 25.53 Schema eines WellenlängenmultiplexRingnetzes mit vier Knoten und drei Kanälen.
Aufgaben Aufgabe 25-1: Faseroptische Systeme
Diskutieren Sie die Gültigkeit jeder der folgenden Behauptungen und begründen Sie, unter welchen Bedingungen Ihre Schlussfolgerung gilt. (a) Die Wellenlänge 𝜆0 = 1300 nm ist gegenüber 𝜆0 = 870 nm für alle faseroptischen Nachrichtensysteme zu bevorzugen. (b) Die Wellenlänge 𝜆0 = 1550 nm ist gegenüber 𝜆0 = 1300 nm für alle faseroptischen Nachrichtensysteme zu bevorzugen. (c) Einmodenfasern sind Vielmodenfasern überlegen, weil sie kleinere Dämpfungskonstanten haben.
(d) Bei 𝜆0 ≈ 1312 nm findet in Quarzglasfasern keine Pulsverbreiterung statt. (e) Für faseroptische Nachrichtensysteme sind Bauelemente aus Verbindungshalbleitern erforderlich. (f) Lawinenphotodioden haben ein stärkeres Rauschen als pin-Photodioden und sind daher für faseroptische Systeme nicht geeignet. Aufgabe 25-2: Komponenten für faseroptische Systeme
Bei der Konstruktion eines faseroptischen Nachrichtensystems sind viele Entscheidungen in Bezug auf Quellen, Fasern, Verstärker und Detektoren zu fällen, von denen einige in Abb. 25.9 gezeigt sind. Treffen Sie für die nachfolgenden Anwendungen sinnvolle Entscheidungen. Es kann mehr als eine Antwort richtig sein; manche Auswahlen können jedoch unvereinbar sein. (a) Ein transozeanisches Kabel, das bei einem Repeaterabstand von 100 km Daten mit einer Geschwindigkeit von 2.5 Gbit/s überträgt. (b) Ein Kabel mit einer Länge von 1 m zur Übertragung von analogen Daten von einem Sensor bei 1 kHz. (c) Eine Verbindung für ein LAN, das bei 500 Mbit/s arbeitet. (d) Eine Verbindung mit einer Länge von 1 km, die Daten mit 100 Mbit/s bei Temperaturschwankungen von ±50 ̊C überträgt. Aufgabe 25-3: Leistung einer Plastikfaserverbindung
Ein Kurzstrecken-Nachrichtensystem für geringe Datengeschwindigkeiten verwendet eine Plastikfaser mit einer Dämpfungskonstante von 0.5 dB/m, eine LED mit einer Leistung von 1 mW bei einer Wellenlänge von 870 nm, und eine Photodiode mit einer Empfängerempfindlichkeit von −20 dBm. Nehmen Sie einen Leistungsverlust von je 3 dB an den Kopplungen am Ein- und Ausgang an und bestimmen Sie die maximale Länge der Verbindung. Nehmen Sie an, dass die Datengeschwindigkeit so klein ist, dass Dispersionseffekte keine Rolle spielen. Aufgabe 25-4: Maximale Länge eines dämpfungsbegrenzten Systems
Eine faseroptische Nachrichtenverbindung ist für einen Betrieb bei 10 Mbit/s ausgelegt. Die Quelle ist eine LED mit einer Leistung von 100 μW bei 870 nm, und die Faser hat eine Dämpfungskonstante von 3.5 dB/km. Die Faser besteht aus Segmenten von 1 km Länge, und die Verbinder zwischen den Segmenten haben einen Verlust von je 1 dB. Die Kopplungen an den Ein- bzw. Ausgängen führen jeweils einen Verlust von 2 dB ein. Die Sicherheitsspanne beträgt 6 dB. Zwei Empfänger stehen zur Verfügung, ein Si-pin-Photodiodenempfänger mit ei-
Aufgaben
ner Empfindlichkeit von 5000 Photonen pro Bit und ein Si-Lawinenphotodiodenempfänger mit einer Empfindlichkeit von 125 Photonen pro Bit. Bestimmen Sie die Empfängerempfindlichkeit pE (in dBm) und die maximale Länge der Verbindung für beide Empfänger. Aufgabe 25-5: Maximale Datengeschwindigkeit eines dämpfungsbegrenzten Systems
Eine faseroptische Verbindung mit einer Länge von 50 km wird bei einer Wellenlänge von 1550 nm betrieben. Die Quelle ist ein InGaAsP-Laser mit einer Leistung von 2 mW, und die Faser hat eine Dämpfungskonstante von 0.2 dB/km. Stecker und Kopplungen führen einen Gesamtverlust von 8 dB ein, und die Sicherheitsspanne beträgt 6 dB. Als Empfänger kommt eine InGaAs-Lawinenphotodiode mit einer Empfindlichkeit von 1000 Photonen pro Bit für eine Bitfehlerrate von 10−9 zum Einsatz. Nehmen Sie an, dass das System dämpfungsbegrenzt ist und bestimmen Sie die maximale Datengeschwindigkeit. Wie groß ist die maximale Datengeschwindigkeit für eine Bitfehlerrate von 10−11 ? Aufgabe 25-6: Maximale Länge einer analogen Verbindung
Eine faseroptische Nachrichtenverbindung verwendet Intensitätsmodulation, um Daten mit einer Bandbreite 𝐵 = 10 MHz mit einem Signal/Rausch-Verhältnis von 40 dB zu übertragen. Die Quelle ist eine LED bei 𝜆0 = 870 nm mit einer mittleren Leistung von 100 μW und einem maximalen Modulationsindex von 0.5. Die Faser ist eine Vielmoden-Stufenindexfaser mit einer Dämpfungskonstante von 2.5 dB/km. Der Detektor ist eine Lawinenphotodiode mit einem mittleren Gewinn 𝐺 = 100, einem Zusatzrauschfaktor 𝐹 = 5 und der Ansprechempfindlichkeit 0.5 A/W (ohne Gewinn). Nehmen Sie an, dass das Schaltungsrauschen vernachlässigbar ist und verwenden Sie die in Abschnitt 19.6.4 präsentierte Theorie, um die optische Leistungsempfindlichkeit des Empfängers und die dämpfungsbegrenzte maximale Länge 𝐿 der Faser zu berechnen. Aufgabe 25-7: Zeitvorgabe für ein dispersionsbegrenztes System
Eine Verbindung aus einer 100 km langen Einmodenfaser wird bei einer Wellenlänge von 1550 nm betrieben. Die Quelle ist eine InGaAsP-Laserdiode mit der spektralen Breite 0.2 nm und einer Antwortzeit von 20 ps. Die Faser hat einen Dispersionskoeffizienten von 17 ps/(km nm). Der Empfänger besteht aus einer InGaAs-Lawinenphotodiode mit einer Antwortzeit von 0.1 ns. Bestimmen Sie die maximale Datengeschwindigkeit auf der Grundlage der Vorgabe, dass die Antwortzeit
der Faser 25 % der Bitdauer nicht überschreiten soll. Bestimmen Sie außerdem die maximale Datengeschwindigkeit auf der Grundlage der Vorgabe, dass die Antwortzeit des gesamten Systems 70 % der Bitdauer nicht überschreiten soll. Wie groß sind die maximalen Datengeschwindigkeiten unter diesen beiden Bedingungen, wenn stattdessen eine dispersionsverschobene Faser mit einem Dispersionskoeffizienten von 1 ps/(km nm) verwendet wird? Aufgabe 25-8: Die Zahl von Wellenlängenmultiplexkanälen
Wie viele Wellenlängenmultiplexkanäle können das C(1530–1565 nm) bzw. das O-Band (1260–1360 nm) aufnehmen, wenn der Kanalabstand 75 GHz beträgt? Aufgabe 25-9: Zahl von Knoten in einem Broadcast-andSelect-Wellenlängenmultiplexnetz
Die maximale Zahl 𝑁 von Knoten, die in einem Broadcast-and-Select-Wellenlängenmultiplexsystem eingesetzt werden können, ist häufig durch die verfügbare optische Leistung beschränkt. Bestimmen Sie 𝑁 für ein LAN aus einem optischen Sternkoppler, der mit jedem der Knoten durch eine Faser von 2 km Länge mit einer Dämpfungskonstante von 0.3 dB/km und Steckerverlusten von 1 dB verbunden ist. Der Sternkoppler verteilt die Leistung gleichberechtigt unter seinen Ausgängen und führt einen zusätzlichen Verlust von 3 dB ein. Jeder Knoten benutzt eine optische Quelle mit 1 mW Leistung, die Empfängerempfindlichkeit beträgt −35 dBm, und die Sicherheitsspanne beträgt 5 dB. Aufgabe 25-10: Wellenlängenmultiplex-Ringnetz mit Wellenlängenrouting
Betrachten Sie ein Wellenlängenmultiplexnetz mit vier Knoten und sechs Kanälen. Jeder Knoten verwendet einen Add/Drop-Multiplexer, um Daten auf drei ihm zugeteilten Wellenlängen auszutauschen, während die anderen drei Wellenlängen durchgeleitet werden. Beispielsweise kann Knoten 1 Daten auf den Kanälen 𝜆1 , 𝜆2 und 𝜆3 hinzufügen oder aus ihnen extrahieren, leitet aber den Verkehr auf 𝜆4 , 𝜆5 und 𝜆6 durch. Teilen Sie den Knoten 2, 3 und 4 jeweils drei Add/Drop-Kanäle so zu, dass jeder Knoten auf dem Ring mit allen anderen Knoten kommunizieren kann. Das Prinzip ist dabei, dass jeder Knoten einen Kanal mit jedem der anderen drei Knoten gemein haben muss, der aber nicht mit den dazwischenliegenden Knoten geteilt werden darf.
965
966
25 Faseroptische Kommunikation
Weiterführende Literatur
Integriert-photonische Schaltungen
Faseroptische Kommunikation
Siehe auch die Weiterführende Literatur zur Silicumphotonik in Kapitel 18
Siehe auch die Weiterführende Literatur in den Kapiteln 9, 10, 15–19, 23 und 24 H. Venghaus, N. Grote (Hrsg.), Fibre Optic Communication: Key Devices, Springer, 2. Aufl. 2017. E. Agrell, M. Karlsson, A. R. Chraplyvy, D. J. Richardson, P. M. Krummrich, P. Winzer, K. Roberts, J. K. Fischer, S. J. Savory, B. J. Eggleton, M. Seconding E R. Kschischang, A. Lord, J. Prat, I. Tomkos, J. E. Bowers, S. Srinivasan, M. Brandt-Pearce, N. Gisin, ‚Roadmap of Optical Communications‘, Journal of Optics 18, 063002, 2016. R. Noé, Essentials of Modern Optical Fiber Communication, Springer, 2. Aufl. 2016. P. J. Winzer, C. J. Chang-Hasnain, A. E. Willner, R. C. Alferness, R. W. Tkach, T. G. Giallorenzi (Hrsg.), A Third of a Century of Lightwave Technology: January 1983–April 2016, IEEE-OSA 2016. F. Mitschke, Fiber Optics: Physics and Technology, Springer, 2. Aufl. 2016. J. Chesnoy (Hrsg.), Undersea Fiber Communication Systems, Academic Press/Elsevier, 2. Aufl. 2016. T. L. Singal, Optical Fiber Communications: Principles and Applications, Cambridge University Press 2016. L. N. Binh, Optical Fiber Communication Systems with MATLAB and SIMULINK Models, CRC Press/Taylor & Francis, 2. Aufl. 2015. S. Bottacchi, Theory and Design of Terabit Optical Fiber Transmission Systems, Cambridge University Press 2014. S. Kumar, M. J. Deen, Fiber Optic Communications: Fundamentals and Applications, Wiley 2014. I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. G. P. Agrawal, Nonlinear Fiber Optics, Academic Press/ Elsevier, 5. Aufl. 2013. G. P. Agrawal, Fiber-Optic Communication Systems, Wiley, 4. Aufl. 2010. G. Keiser, Optical Fiber Communications, McGraw-Hill, 4. Aufl. 2010. J. M. Senior, Optical Fiber Communications: Principles and Practice, Prentice Hall/Pearson, 3. Aufl. 2009. C. K. Kao, Optical Fiber Systems: Technology, Design, and Applications, McGraw-Hill 1982.
H. Radamson, E. Simoen, J. Luo, C. Zhao, CMOS Past, Present and Future, Elsevier-Woodhead 2018. R. A. Soref, D. Buca, S.-Q. Yu, ‚Group IV Photonics: Driving Integrated Optoelectronics‘, Optics & Photonics News 27(1), 32–39, 2016. D. Thomson, A. Zilkie, J. E. Bowers, T. Komljenovic, G. T. Reed, L. Vivien, D. Marris-Morini, E. Cassan, L. Virot, J.-M. Fédéli, J.-M. Hartmann, J. H. Schmid, D.-X. Xu, F. Boeuf, P. O’Brien, G. Z. Mashanovich, M. Nedeljkovic, ‚Roadmap on Silicon Photonics‘, Journal of Optics 18, 073003, 2016. L. Chrostowski, M. Hochberg, Silicon Photonics Design: From Devices to Systems, Cambridge University Press 2015. K. Bergman, L. P. Carloni, A. Biberman, J. Chan, G. Hendry, Photonic Network-on-Chip Design, Springer 2014. R. Nagarajan, C. Doerr, F. Kish, ‚Semiconductor Photonic Integrated Circuit Transmitters and Receivers‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. L. A. Coldren, S. W. Corzine, M. L. Mašanović, Diode Lasers and Photonic Integrated Circuits, Wiley, 2. Aufl. 2012. D. Dai, J. Bauters, J. E. Bowers, ‚Passive Technologies for Future Large-Scale Photonic Integrated Circuits on Silicon: Polarization Handling, Light Non-Reciprocity and Loss Reduction‘, Light: Science & Applications 1, e1, 2012; doi:10.1038/lsa.2012.1. B. Razavi, Design of Integrated Circuits for Optical Communications, Wiley, 2. Aufl. 2012. H. Zimmermann, Integrated Silicon Optoelectronics, Springer, 2. Aufl. 2010. R. G. Hunsperger, Integrated Optics: Theory and Technology, Springer 1982, 6. Aufl. 2010. R. A. Soref, J. P. Lorenzo, ‚Single-Crystal Silicon: A New Material for 1.3 and 1.6 μm Integrated-Optical Components‘, Electronics Letters 21, 953–954, 1985. S. E. Miller, ‚Integrated Optics: An Introduction‘, Bell System Technical Journal 48, 2059–2069, 1969. Modulation und Multiplexing
T. Hayashi, ‚Multi-Core Optical Fibers‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. Y. Awaji, K. Saitoh, S. Matsuo, ‚Transmission Systems Using Multicore Fibers‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013.
Aufgaben
D. W Peckham, Y Sun, A. McCurdy, R. Lingle, Jr., ‚FewMode Fiber Technology for Spatial Multiplexing‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/Elsevier, 6. Aufl. 2013. K.-P Ho, J. M. Kahn, ‚Mode Coupling and its Impact on Spatially Multiplexed Systems‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. P. J. Winzer, R. Ryf, S. Randel, ‚Spatial Multiplexing Using Multiple-Input Multiple-Output Signal Processing‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. L. K. Oxenløwe, A. Clausen, M. Galili, H. C. H. Mulvad, H. Ji, H. Hu, E. Palushani, ‚Ultra-High-Speed Optical Time Division Multiplexing‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-A: Components and Subsystems, Academic Press/ Elsevier, 6. Aufl. 2013. Kohärente optische Detektion und Kommunikation
K. Kikuchi, ‚Fundamentals of Coherent Optical Fiber Communications‘, Journal of Lightwave Technology 34, 157– 179, 2016. X. Zhou, C. Xie (Hrsg.), Enabling Technologies for High Spectral-Efficiency Coherent Optical Communication Networks, Wiley 2016. D. J. Geisler, C. M. Schieler, T. M. Yarnall, M. L. Stevens, B. S. Robinson, S. A. Hamilton, ‚Demonstration of a Variable Data-Rate Free-Space Optical Communication Architecture Using Efficient Coherent Techniques‘, Optical Engineering 55, 111605, 2016. M. Mazurczyk, ‚Spectral Shaping in Long Haul Optical Coherent Systems With High Spectral Efficiency‘, Journal of Lightwave Technology 32, 2915–2924, 2014. T. J. Xia, G. A. Wellbrock, ‚Commercial 100-Gbit/s Coherent Transmission Systems‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. P. Bayvel, C. Behrens, D. S. Millar, ‚Digital Signal Processing (DSP) and its Application in Optical Communication Systems‘, in I. P. Kaminow, T. Li, A. E. Willner (Hrsg.), Optical Fiber Telecommunications VI-B: Systems and Networks, Academic Press/Elsevier, 6. Aufl. 2013. V. V. Protopopov, Laser Heterodyning, Springer 2009. T. Okoshi, K. Kikuchi, Coherent Optical Fiber Communications, Kluwer 1988. M. C. Teich, ‚Laser Heterodyning‘, Journal of Modern Optics (Optica Acta) 32, 1015–1021, 1985.
M. C. Teich, ‚Coherent Detection in the Infrared‘, in R. K. Willardson, A. C. Beer (Hrsg.), Semiconductors and Semimetals, Bd. 5, Infrared Detectors, S. 361–407, Academic Press 1970. A. Javan, E. A. Ballik, W. L. Bond, ‚Frequency Characteristics of a Continuous-Wave He-Ne Optical Maser‘, Journal of the Optical Society of America 52, 96–98, 1962. B. J. McMurtry, A. E. Siegman, ‚Photomixing Experiments with a Ruby Optical Maser and a Traveling-Wave Microwave Phototube‘, Applied Optics 1, 51–53, 1962. Faseroptische Netze
M. Tornatore, G.-K. Chang, G. Ellinas (Hrsg.), FiberWireless Convergence in Next-Generation Communication Networks: Systems, Architectures, and Management, Springer 2017. X. Zhou, C. Xie (Hrsg.), Enabling Technologies for High Spectral-Efficiency Coherent Optical Communication Networks, Wiley 2016. V. Lopez, L. Velasco (Hrsg.), Elastic Optical Networks: Architectures, Technologies, and Control, Springer 2016. J. M. Simmons, Optical Network Design and Planning, Springer, 2. Aufl. 2014. C. Kachris, K. Bergman, I. Tomkos (Hrsg.), Optical Interconnects for Future Data Center Networks, Springer 2013. M. Cvijetic, I. B. Djordjevic, Advanced Optical Communication Systems and Networks, Artech 2013. D. Hood, E. Trojer, Gigabit-Capable Passive Optical Networks, Wiley 2012. M. Toy, Networks and Services: Carrier Ethernet, PBT, MPLSTP, and VPLS, Wiley 2012. N. Antoniades, G. Ellinas, I. Roudas (Hrsg.), WDM Systems and Networks: Modeling, Simulation, Design and Engineering, Springer 2012. T. E. Stern, G. Ellinas, K. Bala, Multiwavelength Optical Networks: Architectures, Design, and Control, Cambridge University Press, 2. Aufl. 2009. B. Mukherjee, Optical WDM Networks, Springer 2006. P. R. Prucnal (Hrsg.), Optical Code Division Multiple Access: Fundamentals and Applications, CRC Press/Taylor & Francis 2006. E. Desurvire, Global Telecommunications: Broadband Access, Optical Components and Networks, and Cryptography, Wiley 2004. E. Desurvire, Global Telecommunications: Signaling Principles, Protocols, and Wireless Systems, Wiley 2004. P. E. Green, Jr., Fiber Optic Networks, Prentice Hall 1992.
967
968
25 Faseroptische Kommunikation
Grundlegende Arbeiten und Historisches
I. P. Kaminow, ‚Optical Integrated Circuits: A Personal Perspective‘, Journal of Lightwave Technology 26, 994– 1004, 2008. A. Hasegawa (Hrsg.), Massive WDM and TDM Soliton Transmission Systems, Kluwer 2002. R. M. Gagliardi, S. Karp, Optical Communications, Wiley 1976, 2. Aufl. 1995. D. L. Begley (Hrsg.), Selected Papers on Free-Space Laser Communications II, SPIE Optical Engineering Press 1994 (Milestone Series Bd. 100). E. G. Rawson (Hrsg.), Selected Papers on Fiber Optic Local Area Networks, SPIE Optical Engineering Press 1994 (Milestone Series Bd. 91). L. D. Hutcheson, S. C. Mettler (Hrsg.), Selected Papers on Fiber Optic Communications, SPIE Optical Engineering Press 1993 (Milestone Series Volume Bd. 88). C. K. Kao, Optical Fibre, Institution of Electrical Engineers 1988. E. Desurvire, J. R. Simpson, P. C. Becker, ‚High-Gain Erbium-Doped Traveling-Wave Fiber Amplifier‘, Optics Letters 12, 888–890, 1987. R. J. Mears, L. Reekie, I. M. Jauncey, D. N. Payne, ‚LowNoise Erbium-Doped Fibre Amplifier Operating at 1.54 pm‘, Electronics Letters 23, 1026–1028, 1987. B. J. Ainslie, C. R. Day, ‚A Review of Single-Mode Fibers with Modified Dispersion Characteristics‘, Journal of Lightwave Technology LT-4, 967–979, 1986. S. D. Personick, Fiber Optics: Technology and Applications, Plenum Press 1985. S. B. Poole, D. N. Payne, M. E. Fermann, ‚Fabrication of Low Loss Optical Fibers Containing Rare Earth Ions‘, Electronics Letters 21, 737–738, 1985.
T. Li, ‚Advances in Optical Fiber Communications: An Historical Perspective‘, IEEE Journal on Selected Areas in Communications SAC-1, 356–372, 1983. J. E. Midwinter, Optical Fibers for Transmission, Wiley 1979; Krieger, Nachdruck 1992. D. B. Keck, R. D. Maurer, P. C. Schultz, ‚On the Ultimate Lower Limit of Attenuation in Glass Optical Waveguides‘, Applied Physics Letters 22, 307–309, 1973. O. E. DeLange, ‚Wide-Band Optical Communication Systems: Part II: Frequency-Division Multiplexing‘, Proceedings of the IEEE 58, 1683–1690, 1970. M. C. Teich, ‚Infrared Heterodyne Detection‘, Proceedings of the IEEE 56, 37–46, 1968. S. E. Miller, ‚Communication by Laser‘, Scientific American 214(1), 19–27, 1966. K. C. Kao, G. A. Hockham, ‚Dielectric-Fibre Surface Waveguides for Optical Frequencies‘, IEE Proceedings 113, 1151–1158, 1966. C. J. Koester, E. Snitzer, ‚Amplification in a Fiber Laser‘, Applied Optics 3, 1182–1186, 1964. Populäres
J. Hecht, ‚Great Leaps of Light‘, IEEE Spectrum 53(2), 28– 53, 2016. P. J. Winzer, ‚Scaling Optical Fiber Networks: Challenges and Solutions‘, Optics & Photonics News 26(3), 28–35, 2015. J. Hecht, Understanding Fiber Optics, Laser Light Press, 5. Aufl. 2015. J. Hecht, ‚Recycled Fiber Optics: How Old Ideas Drove New Technology‘, Optics & Photonics News 23(2), 22–29, 2012. J. Hecht, City of Light: The Story of Fiber Optics, Oxford University Press 1999, Paperback 2004.
969
Anhang A Die Fouriertransformation Dieser Anhang gibt eine kurze Wiederholung der Fouriertransformation (FT) und ihrer Eigenschaften für Funktionen von ein und zwei Variablen.
A.1 Die eindimensionale Fouriertransformation Die harmonische Funktion 𝐹 exp(i2π 𝜈𝑡) spielt in Wissenschaft und Technik eine wichtige Rolle. Sie hat die Frequenz 𝜈 und die komplexe Amplitude 𝐹. Ihr Realteil |𝐹| cos(2π 𝜈𝑡 + arg{𝐹}) ist eine Kosinusfunktion mit der Amplitude |𝐹| und der Phase arg{𝐹}. Die Variable 𝑡 bezeichnet gewöhnlich die Zeit; die Frequenz 𝜈 hat die Einheit s−1 oder Hz. Diese harmonische Funktion kann als Baustein dienen, aus dem andere Funktionen durch eine einfache Superposition erhalten werden können. Nach dem Fouriertheorem kann eine komplexe Funktion 𝑓(𝑡), die einige wenig einschränkende Bedingungen erfüllt, als Superpositionsintegral von harmonischen Funktionen unterschiedlicher Frequenzen und komplexer Amplituden geschrieben werden, (A.1)
−∞
Die Komponente mit der Frequenz 𝜈 hat eine komplexe Amplitude 𝐹(𝜈) gemäß ∞
𝐹(𝜈) = ∫ 𝑓(𝑡) exp(−i2π 𝜈𝑡) d𝑡 .
A.1.1 Eigenschaften der Fouriertransformation Einige wichtige Eigenschaften der Fouriertransformation sind im Folgenden aufgeführt. Diese Eigenschaften können durch direkte Anwendung der Definition Gl. (A.1) und Gl. (A.2) bewiesen werden (siehe Weiterführende Literatur). Die Fouriertransformation der Summe zweier Funktionen ist die Summe ihrer Fouriertransformierten. Skalierung. Wenn 𝑓(𝑡) eine Fouriertransformierte 𝐹(𝜈) hat und 𝜏 ein reeller Skalierungsfaktor ist, dann hat 𝑓(𝑡∕𝜏) die Fouriertransformierte |𝜏|𝐹(𝜏𝜈). Das bedeutet, dass die Fouriertransformierte um einen Faktor 1∕𝜏 skaliert wird, wenn 𝑓(𝑡) mit einem Faktor 𝜏 multipliziert wird. Wenn beispielsweise 𝜏 > 1 ist, dann ist 𝑓(𝑡∕𝜏) eine gestreckte Version von 𝑓(𝑡), wohingegen 𝐹(𝜏𝜈) eine komprimierte Version von 𝐹(𝜈) ist. Die Fouriertransformierte von 𝑓(−𝑡) ist 𝐹(−𝜈). Zeitverschiebung. Wenn 𝑓(𝑡) eine Fouriertransformierte 𝐹(𝜈) hat, ist die Fouriertransformierte von 𝑓(𝑡 − 𝜏) gleich exp(−i2π 𝜈𝜏)𝐹(𝜈). Eine Verschiebung um die Zeit 𝜏 ist somit äquivalent zu einer Multiplikation der Fouriertransformierten mit einem Phasenfaktor exp(−i2π 𝜈𝜏). Linearität.
∞
𝑓(𝑡) = ∫ 𝐹(𝜈) exp(i2π 𝜈𝑡) d𝜈 .
Frequenz bezeichnet. Von einigen Autoren wird auch die entgegengesetzte Konvention verwendet, die die Fouriertransformation in Gl. (A.2) mit einem positiven Vorzeichen im Exponenten definieren und ein negatives Vorzeichen im Exponenten der inversen Fouriertransformation Gl. (A.1) benutzen. In der Nachrichtentheorie bezeichnen die Funktionen 𝑓(𝑡) und 𝐹(𝜈) ein Signal, dessen Darstellung im Zeitbereich 𝑓(𝑡) und dessen Darstellung im Frequenzbereich 𝐹(𝜈) ist. Das Betragsquadrat |𝑓(𝑡)|2 wird Signalleistung genannt, und |𝐹(𝜈)|2 ist die spektrale Energiedichte. Wenn sich |𝐹(𝜈)|2 über einen breiten Frequenzbereich erstreckt, spricht man von einem Signal mit einer großen Bandbreite.
(A.2)
−∞
𝐹(𝜈) wird Fouriertransformierte von 𝑓(𝑡) genannt, und 𝑓(𝑡) ist die inverse Fouriertransformierte von 𝐹(𝜈). Die Funktionen 𝑓(𝑡) und 𝐹(𝜈) bilden ein Paar von Fouriertransformierten; wenn eine bekannt ist, kann die andere bestimmt werden. In diesem Buch verwenden wir die Konvention, dass exp(i2π 𝜈𝑡) eine harmonische Funktion mit positiver Frequenz ist, wohingegen exp(−i2π 𝜈𝑡) eine negative
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
970
A Die Fouriertransformation
Wenn 𝐹(𝜈) die Fouriertransformierte von 𝑓(𝑡) ist, ist die Fouriertransformierte von 𝑓(𝑡) exp(i2π 𝜈0 𝑡) gleich 𝐹(𝜈 − 𝜈0 ). Also ist die Multiplikation mit einer harmonischen Funktion der Frequenz 𝜈0 äquivalent zu einer Verschiebung der Fouriertransformierten um die Frequenz 𝜈0 . Symmetrie. Wenn 𝑓(𝑡) reell ist, dann besitzt 𝐹(𝜈) hermitesche Symmetrie [d. h. 𝐹(−𝜈) = 𝐹 ∗ (𝜈)]. Wenn 𝑓(𝑡) reell und symmetrisch ist, dann ist 𝐹(𝜈) ebenfalls reell und symmetrisch. Faltungstheorem. Wenn die Fouriertransformierten von 𝑓1 (𝑡) und 𝑓2 (𝑡) gleich 𝐹1 (𝜈) bzw. 𝐹2 (𝜈) sind, ist die inverse Fouriertransformierte des Produkts Frequenzverschiebung.
𝐹(𝜈) = 𝐹1 (𝜈)𝐹2 (𝜈)
(A.3)
gleich ∞
𝑓(𝑡) = ∫ 𝑓1 (𝜏)𝑓2 (𝑡 − 𝜏) d𝜏 .
(A.4)
−∞
Die in Gl. (A.4) definierte Operation wird als Faltung von 𝑓1 (𝑡) mit 𝑓2 (𝑡) bezeichnet. Die Faltung im Zeitbereich ist daher äquivalent zu einer Multiplikation im Fourierbereich. Korrelationstheorem. Die Korrelation zweier komplexer Funktionen ist als ∞
𝑓(𝑡) = ∫ 𝑓1∗ (𝜏)𝑓2 (𝑡 + 𝜏) d𝜏
(A.5)
−∞
definiert. Für die Fouriertransformierten von 𝑓1 (𝑡), 𝑓2 (𝑡) und 𝑓(𝑡) gilt dann 𝐹(𝜈) = 𝐹1∗ (𝜈)𝐹2 (𝜈) .
(A.6)
Die Signalenergie, das Integral der Signalleistung |𝑓(𝑡)|2 , ist gleich dem Integral der spektralen Energiedichte |𝐹(𝜈)|2 ,
Theorem von Parseval.
∞
∞
∫ |𝑓(𝑡)| d𝑡 = ∫ |𝐹(𝜈)|2 d𝜈 . 2
−∞
A.1.2
(A.7)
−∞
Beispiele
Die Fouriertransformierten einiger wichtiger Funktionen, die in diesem Buch verwendet werden, sind in Tabelle A.1 aufgeführt. Mithilfe der Eigenschaften Linearität, Skalierung, Zeitverzögerung und Frequenzverschiebung können daraus leicht die Fouriertransformierten anderer Funktionen erhalten werden. In der Tabelle gilt
1
• rect(𝑡) ≡ 1 für |𝑡| ≤ und ansonsten null, d. h. ein Puls 2 mit Höhe und Breite eins um 𝑡 = 0. • 𝛿(𝑡) ist die diracsche Deltafunktion, die durch 𝛿(𝑡) = lim𝛼→∞ 𝛼 rect(𝛼𝑡) definiert ist. Sie ist der Grenzfall eines Rechteckpulses mit Einheitsfläche, dessen Breite gegen null und dessen Höhe gegen unendlich geht. • sinc(𝑡) = sin(π𝑡)∕(π𝑡) ist eine symmetrische Funktion mit einem Maximalwert 1.0 bei 𝑡 = 0 und Nullstellen bei 𝑡 = ±1, ±2, ….
A.2
Zeitliche und spektrale Breite
Es ist häufig nützlich, ein Maß für die Breite einer Funktion zu haben. Die Breite einer Funktion der Zeit 𝑓(𝑡) ist ihre Dauer, und die Breite ihrer Fouriertransformierten 𝐹(𝜈) ist ihre spektrale Breite (oder Bandbreite). Da es keine eindeutige Definition der Breite gibt, sind einige Definitionen im Gebrauch. Allen Definitionen ist jedoch die Tatsache gemein, dass die spektrale Breite im Einklang mit der Skalierungseigenschaft der Fouriertransformation umgekehrt proportional zur zeitlichen Breite ist. Die folgenden Definitionen werden an unterschiedlichen Stellen in diesem Buch verwendet.
A.2.1
Die quadratisch gemittelte Breite
Die quadratisch gemittelte Breite 𝜎𝑡 einer nichtnegativen reellen Funktion 𝑓(𝑡) ist ∞
𝜎𝑡2
=
∫−∞ (𝑡 − 𝑡̄ )2 𝑓(𝑡) d𝑡 ∞
∫−∞ 𝑓(𝑡) d𝑡
∞
,
mit 𝑡̄ =
∫−∞ 𝑡𝑓(𝑡) d𝑡
. ∞ ∫−∞ 𝑓(𝑡) d𝑡 (A.8)
Wenn 𝑓(𝑡) eine Massenverteilung bezeichnet (und 𝑡 den Ort beschreibt), dann ist 𝑡̄ der Schwerpunkt und 𝜎𝑡 der Trägheitsradius. Wenn 𝑓(𝑡) eine Wahrscheinlichkeitsdichte ist, bezeichnen diese Größen den Mittelwert bzw. die Standardabweichung. Beispielsweise hat die Gaußfunktion 𝑓(𝑡) = exp(−𝑡2 ∕2𝜎𝑡2 ) eine quadratisch gemittelte√ Breite 𝜎𝑡 . Ihre Fouriertransformierte ist 𝐹(𝜈) = (1∕ 2π𝜎𝜈 ) exp(−𝜈2 ∕2𝜎𝜈2 ), wobei 𝜎𝜈 =
1 2π𝜎𝑡
(A.9)
die quadratisch gemittelte spektrale Breite ist. Diese Definition ist nicht für Funktionen mit negativen oder komplexen Werten geeignet. Für derartige Funktionen verwendet man die quadratisch gemittelte Breite des Betragsquadrats |𝑓(𝑡)|2 , ∞
𝜎𝑡2 =
∫−∞ (𝑡 − 𝑡̄ )2 |𝑓(𝑡)|2 d𝑡 ∞
∫−∞ |𝑓(𝑡)|2 d𝑡
∞
mit 𝑡̄ =
∫−∞ 𝑡|𝑓(𝑡)|2 d𝑡 ∞
∫−∞ |𝑓(𝑡)|2 d𝑡
.
A.2 Zeitliche und spektrale Breite
Tab. A.1 Ausgewählte Funktionen und ihre Fouriertransformierten.
Funktion
Konstante 0
t
0
t
–1 2 0 1 2
t
F (ν)
1
δ (ν)
δ (t)
Exponential a
exp (– t ) –1
0
1
t
–1
0
1
t
–1
0
1
t
–1
0
1
exp (–πt2)
Gauß
sech (πt)
Chirp b
exp (iπt2)
S
0
1
t
..
.. •1
0
1
sinc (ν)
2 1+(2πν)2
t
Σ δ (t •m)
m = –S
∞
Σ δ (t •m)
m = –∞
ν
–1
0
1
–1
0
1
–1
0
1
ν
–1
0
1
ν
–1
0
1
ν
0
1
ν
exp(–πν2)
sech (πν)
eiπ/4 exp(iπt2)
t
M = 2S+1 Pulse •1
1 0
rect (t)
Rechteck
Sekans hyperbolicus
ν
0
Puls
Kamm
f (t)
sin (Mπν) sin (πν)
∞
Σ δ (ν – m)
m = –∞
..
.. –1
0
1
ν
a) Hier ist die symmetrische Exponentialfunktion gezeigt. √ Die Fouriertransformierte der einseitigen Exponentialfunktion, 𝑓(𝑡) = exp(−𝑡) mit 𝑡 ≥ 0, ist 𝐹(𝜈) = 1∕[1 + i2π 𝜈]. Ihr Betrag ist 1∕ 1 + (2π 𝜈)2 . b) Gezeigt sind die Funktionen cos(π 𝑡 2 ) und cos(π 𝜈2 ). Die Funktion sin(π 𝑡 2 ) ist in Abb. 4.28 dargestellt.
971
972
A Die Fouriertransformation
Diese Version von 𝜎𝑡 wird als quadratisch leistungsgemittelte Breite bezeichnet. Mit der schwarzschen Ungleichung kann gezeigt werden, dass das Produkt der quadratisch leistungsgemittelten Breiten einer beliebigen Funktion 𝑓(𝑡) und ihrer Fouriertransformierten 𝐹(𝜈) größer als 1∕4π sein muss, 1 𝜎𝑡 𝜎𝜈 ≥ , 4π
(A.10)
∞
∫−∞ (𝜈 − 𝜈) ̄ 2 |𝐹(𝜈)|2 d𝜈 ∞
∫−∞ |𝐹(𝜈)|2 d𝜈
∞
mit 𝜈̄ =
∫−∞ 𝜈|𝐹(𝜈)|2 d𝜈 ∞
∫−∞ |𝐹(𝜈)|2 d𝜈
definiert ist. Die Dauer und die spektrale Breite können also nicht gleichzeitig beliebig klein gemacht werden. Die Gaußfunktion 𝑓(𝑡) = exp(−𝑡2 ∕4𝜎𝑡2 ) hat zum Beispiel eine quadratisch leistungsgemittelte Breite 𝜎𝑡 . Ihre Fouriertransformierte ist ebenfalls eine Gaußfunk√ tion, 𝐹(𝜈) = (1∕2 π 𝜎𝜈 ) exp(−𝜈2 ∕4𝜎𝜈2 ), mit der quadratisch leistungsgemittelten Breite 𝜎𝜈 =
1 . 4π𝜎𝑡
1 . 2
(A.12)
Wenn die Variablen 𝑡 und 𝜔, die normalerweise Zeit und Kreisfrequenz beschreiben, durch die Ortsvariable 𝑥 bzw. die räumliche Kreisfrequenz 𝑘 ersetzt werden, wird aus Gl. (A.12) 1 𝜎𝑥 𝜎𝑘 ≥ . 2
(A.13)
In der Quantenmechanik wird der Ort 𝑥 eines Teilchens durch die Wellenfunktion 𝜓(𝑥) beschrieben, und die Wellenzahl 𝑘 wird durch eine Funktion 𝜙(𝑘) beschrieben, die die Fouriertransformierte von 𝜓(𝑥) ist. Die Unschärfen von 𝑥 und 𝑘 sind die quadratisch gemittelten Breiten der Wahrscheinlichkeitsdichten |𝜓(𝑥)|2 bzw. |𝜙(𝑘)|2 , sodass 𝜎𝑥 und 𝜎𝑘 als die Unschärfen des Ortes und der Wellenzahl interpretiert werden können. Da der Impuls des Teilchens 𝑝 = ℏ𝑘 ist (wobei ℏ = ℎ∕2π gilt und ℎ die plancksche Konstante ist), erfüllt das Unbestimmtheitsprodukt von Ort und Impuls die Ungleichung 𝜎𝑥 𝜎𝑝 ≥
ℏ , 2
Die leistungsäquivalente Breite eines Signals 𝑓(𝑡) ist die durch die maximale Signalleistung geteilte Signalenergie. Wenn 𝑓(𝑡) z. B. bei 𝑡 = 0 maximal ist, dann ist die leistungsäquivalente Breite ∞
|𝑓(𝑡)|2 d𝑡 . |𝑓(0)|2
𝜏= ∫
(A.14)
die als heisenbergsche Unschärferelation zwischen Ort und Impuls bekannt ist.
(A.15)
Die zweiseitige Exponentialfunktion 𝑓(𝑡) = exp(−|𝑡|∕𝜏) besitzt z. B. genau wie die Gaußfunktion 𝑓(𝑡) = exp(−π 𝑡2 ∕2𝜏2 ) die leistungsäquivalente Breite 𝜏. Diese Definition wird in Abschnitt 12.1 verwendet, wo die Kohärenzzeit des Lichts als leistungsäquivalente Breite des komplexen zeitlichen Kohärenzgrads definiert wird. Die leistungsäquivalente spektrale Breite wird analog definiert, ∞
ℬ= ∫ −∞
(A.11)
Wegen 𝜎𝑡 𝜎𝜈 = 1∕4π hat die Gaußfunktion den minimal möglichen Wert des Produkts aus Dauer und Bandbreite. Als Funktion der Kreisfrequenz 𝜔 = 2π𝜈 ist 𝜎𝑡 𝜎𝜔 ≥
Die leistungsäquivalente Breite
−∞
wobei die spektrale Breite 𝜎𝜈 durch 𝜎𝜈2 =
A.2.2
|𝐹(𝜈)|2 d𝜈 . |𝐹(0)|2
(A.16)
Wenn 𝑓(𝑡) reell und daher |𝐹(𝜈)|2 symmetrisch ist und ein Maximum bei 𝜈 = 0 hat, wird die leistungsäquivalente spektrale Breite gewöhnlich als die Breite auf der Seite positiver Frequenzen definiert, ∞
𝐵=∫
|𝐹(𝜈)|2 d𝜈 . |𝐹(0)|2
(A.17)
0
Für 𝐹(𝜈) = 𝜏∕(1 + i2π 𝜈𝜏) ist beispielsweise 𝐵=
1 . 4𝜏
(A.18)
Diese Definition wird in Abschnitt 19.6.1 verwendet, um die Bandbreite der Schaltung eines Photodetektors in Anwesenheit von Photonen- und Schaltungsrauschen zu beschreiben (siehe auch Aufgabe 19-15). Mit dem Theorem von Parseval Gl. (A.7) und der Be∞ ziehung 𝐹(0) = ∫−∞ 𝑓(𝑡) d𝑡 können wir Gl. (A.17) in der Form 𝐵=
1 , 2T
(A.19)
schreiben, wobei T=
]2 [ ∞ ∫−∞ 𝑓(𝑡) d𝑡 ∞
∫−∞ 𝑓 2 (𝑡) d𝑡
(A.20)
eine weitere Definition der Dauer ist [das Quadrat der Fläche unter 𝑓(𝑡) geteilt durch die Fläche unter 𝑓 2 (𝑡)]. In diesem Fall ist das Produkt aus Dauer und Bandbreite 1 𝐵T = . 2
A.3 Die zweidimensionale Fouriertransformation
A.2.3 1/e-, Halbwerts- und 3-dB-Breite Ein anderes Maß für die Breite einer Funktion ist ihre Dauer bei √ einem vorgegebenen Teil ihres Maximalwerts (z. B. 1∕ 2, 1∕2, 1∕e oder 1∕e2 ). Dabei kann entweder die halbe Breite oder die volle Breite beiderseitig des Maximums verwendet werden. Zwei häufige Größen √ sind die Halbwertsbreite und die halbe Breite bei 1∕ 2 des Maximums, die als 3 dB-Breite bezeichnet wird. Einige wichtige Beispiele dafür sind: • Die Exponentialfunktion 𝑓(𝑡) = exp(−𝑡∕𝜏) für 𝑡 ≥ 0 und 𝑓(𝑡) = 0 für 𝑡 < 0, die die Antwort verschiedener elektrischer und optischer Systeme beschreibt, hat eine 1∕e-Breite von Δ𝑡1/e = 𝜏. Der Betrag ihrer Fouriertransformierten 𝐹(𝜈) = 𝜏∕(1 √ + i2π 𝜈𝜏) hat eine 3 dBBreite (halbe Breite bei 1∕ 2 des Maximums) von Δ𝜈3dB =
1 . 2π 𝜏
(A.21)
• Die zweiseitige Exponentialfunktion 𝑓(𝑡) = exp(−|𝑡|∕ 𝜏) hat eine 1∕e-Breite von Δ𝑡1∕e = 𝜏. Ihre Fouriertransformierte 𝐹(𝜈) = 2𝜏∕[1 + (2π 𝜈𝜏)2 ], die Lorentzverteilung, hat eine Halbwertsbreite von Δ𝜈HWB =
1 π𝜏
A.3 Die zweidimensionale Fouriertransformation Wir betrachten nun eine Funktion 𝑓(𝑥, 𝑦) von zwei Variablen. Wenn 𝑥 und 𝑦 die Koordinaten eines Punkts in einem zweidimensionalen Raum bezeichnen, dann beschreibt 𝑓(𝑥, 𝑦) ein räumliches Muster (z. B. das optische Feld in einer gegebenen Ebene). Hier ist die harmonische Funktion 𝐹 exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] der Baustein, aus dem andere Funktionen durch Superposition zusammengesetzt werden können. Die Variablen 𝜈𝑥 und 𝜈𝑦 bezeichnen Ortsfrequenzen in 𝑥- bzw. 𝑦-Richtung. Da 𝑥 und 𝑦 die Dimension einer Länge (mm) haben, haben 𝜈𝑥 und 𝜈𝑦 die Dimension mm−1 oder Linien/mm. Beispiele von zweidimensionalen harmonischen Funktionen sind in Abb. A.1 dargestellt. Das Fouriertheorem kann auf Funktionen von zwei Variablen verallgemeinert werden. Eine Funktion 𝑓(𝑥, 𝑦) kann als Superpositionsintegral von harmonischen Funktionen von 𝑥 und 𝑦 geschrieben werden, ∞
𝑓(𝑥, 𝑦) = ∬ 𝐹(𝜈𝑥 , 𝜈𝑦 ) exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] d𝜈𝑥 d𝜈𝑦 , −∞
(A.22)
(A.26)
und wird gewöhnlich in der Form 𝐹(𝜈) = (Δ𝜈∕2π)∕ [𝜈2 + (Δ𝜈∕2)2 ] mit Δ𝜈 = Δ𝜈HWB geschrieben. Die Lorentzverteilung beschreibt das Spektrum von bestimmten Lichtemissionen (siehe Abschnitt 14.3.4). • Die Gaußfunktion 𝑓(𝑡) = exp(−𝑡2 ∕2𝜏2 ) hat eine volle Breite √ bei 1∕e des Maximums (1∕e-Breite) von Δ𝑡1∕e = 2 2 𝜏. Ihre Fouriertransformierte 𝐹(𝜈) = √ 2π 𝜏 exp(−2π2 𝜏2 𝜈2 ) hat eine 1∕e-Breite
wobei der Koeffizient 𝐹(𝜈𝑥 , 𝜈𝑦 ) durch eine zweidimensionale Fouriertransformation bestimmt wird,
√
Δ𝜈1∕e
2 = π𝜏
(A.23)
und eine Halbwertsbreite von √ Δ𝜈HWB =
2 ln 2 ; π𝜏
(A.24)
ln 2 Δ𝜈1∕e = 0.833 Δ𝜈1∕e .
(A.25)
es gilt also Δ𝜈HWB =
√
Die Gaußfunktion wird ebenfalls verwendet, um das Spektrum von bestimmten Lichtemissionen (siehe Abschnitt 14.3.4) oder die räumliche Verteilung von Lichtstrahlen zu beschreiben (siehe Abschnitt 3.1).
∞
𝐹(𝜈𝑥 , 𝜈𝑦 ) = ∬ 𝑓(𝑥, 𝑦) exp[i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] d𝑥 d𝑦 . −∞
(A.27) Unsere Definitionen der ein- und zweidimensionalen Fouriertransformation, Gl. (A.27) bzw. Gl. (A.2), unterscheiden sich im Vorzeichen des Exponenten. Die Wahl dieses Vorzeichens ist natürlich beliebig, so lange in der Fouriertransformation und ihrer Inversen entgegengesetzte Vorzeichen verwendet werden. In diesem Buch verwenden wir die Konvention, dass exp(i2π 𝜈𝑡) eine positive zeitliche Frequenz 𝜈 besitzt, wohingegen exp[−i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)] positive Ortsfrequenzen 𝜈𝑥 und 𝜈𝑦 hat. Wir haben uns dafür entschieden, in den räumlichen (zweidimensionalen) und zeitlichen (eindimensionalen) Fällen unterschiedliche Vorzeichen zu verwenden, um die in Kapitel 4 (Fourieroptik) verwendete Notation zu vereinfachen, in der die sich ausbreitende Welle exp(+i2π 𝜈𝑡) exp[−i(𝑘𝑥 𝑥 + 𝑘𝑦 𝑦 + 𝑘𝑧 𝑧)] eine zeitliche und räumliche Abhängigkeit mit entgegengesetzten Vorzeichen hat.
973
974
A Die Fouriertransformation
y
y
y
x
x
(a)
A.3.1
x
(b)
(c)
Eigenschaften
Viele Eigenschaften der zweidimensionalen Fouriertransformation sind offensichtliche Verallgemeinerungen der Eigenschaften der eindimensionalen Fouriertransformation; andere treffen nur auf den zweidimensionalen Fall zu: Wenn 𝑓(𝑥, 𝑦) die zweidimensionale Faltung zweier Funktionen 𝑓1 (𝑥, 𝑦) und 𝑓2 (𝑥, 𝑦) mit den Fouriertransformierten 𝐹1 (𝜈𝑥 , 𝜈𝑦 ) und 𝐹2 (𝜈𝑥 , 𝜈𝑦 ) ist, sodass
Faltungstheorem.
∞
𝑓(𝑥, 𝑦) = ∬ 𝑓1 (𝑥′ , 𝑦 ′ )𝑓2 (𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ ) d𝑥′ d𝑦 ′ −∞
(A.28) gilt, ist die Fouriertransformierte von 𝑓(𝑥, 𝑦) 𝐹(𝜈𝑥 , 𝜈𝑦 ) = 𝐹1 (𝜈𝑥 , 𝜈𝑦 )𝐹2 (𝜈𝑥 , 𝜈𝑦 ) .
(A.29)
Wie im eindimensionalen Fall ist die Faltung im Raumbereich also äquivalent zu einer Multiplikation im Fourierbereich. Separierbare Funktionen. Wenn 𝑓(𝑥, 𝑦) = 𝑓𝑥 (𝑥)𝑓𝑦 (𝑦) das Produkt einer Funktion von 𝑥 und einer anderen von 𝑦 ist, dann ist ihre zweidimensionale Fouriertransformierte das Produkt einer Funktion von 𝜈𝑥 und einer anderen von 𝜈𝑦 . Die zweidimensionale Fouriertransformierte von 𝑓(𝑥, 𝑦) ist dann mit
dem Produkt der eindimensionalen Fouriertransformierten von 𝑓𝑥 (𝑥) und 𝑓𝑦 (𝑦) durch 𝐹(𝜈𝑥 , 𝜈𝑦 ) = 𝐹𝑥 (−𝜈𝑥 )𝐹𝑦 (−𝜈𝑦 ) verknüpft. Beispielsweise ist die Fouriertransformierte der Funktion 𝛿(𝑥 − 𝑥0 )𝛿(𝑦 − 𝑦0 ), die einen Puls bei (𝑥0 , 𝑦0 ) beschreibt, die harmonische Funktion exp[i2π (𝜈𝑥 𝑥0 + 𝜈𝑦 𝑦0 )], und die Fouriertransformierte der Gaußfunktion exp[−π(𝑥2 + 𝑦 2 )] ist die Gaußfunktion exp[−π(𝜈𝑥2 + 𝜈𝑦2 )]. Rotationssymmetrische Funktionen. Die Fouriertransformierte einer kreisförmig symmetrischen Funktion ist ebenfalls rotationssymmetrisch. Die Fouriertransformierte der Funktion √ 1 für 𝑥2 + 𝑦 2 ≤ 1 , 𝑓(𝑥, 𝑦) = { (A.30) 0 ansonsten , die mit dem Symbol circ(𝑥, 𝑦) bezeichnet wird und als circ-Funktion bekannt ist, ist beispielsweise 𝐹(𝜈𝑥 , 𝜈𝑦 ) =
0
1
x (a)
νx
𝜈𝜌
,
𝜈𝜌 =
√ 𝜈𝑥2 + 𝜈𝑦2 , (A.31)
Abb. A.2 (a) Die circ-Funktion und (b) ihre zweidimensionale Fouriertransformierte.
1
y
𝐽1 (2π𝜈𝜌 )
wobei 𝐽1 die Besselfunktion erster Ordnung ist. Diese Funktionen sind in Abb. A.2 dargestellt.
F(νx , ν y)
f (x, y)
1
Abb. A.1 Der Realteil |F | cos[2π 𝜈x x + 2π 𝜈y y + arg{F }] einer zweidimensionalen harmonischen Funktion: (a) 𝜈x = 0, (b) 𝜈y = 0, (c) allgemeiner Fall. Dabei haben wir arg{F } = 0 angenommen, sodass dunkle und helle Punkte positive bzw. negative Werte der Funktion bezeichnen.
(b)
0.61
νy
A.3 Die zweidimensionale Fouriertransformation
Weiterführende Literatur L. Chaparro, Signals and Systems using MATLAB, Academic Press, 2. Aufl. 2015. G. R. Cooper, C. D. McGillem, Probabilistic Methods of Signal and System Analysis, Oxford University Press, 3. Aufl. 2007. B. P. Lathi, Linear Systems and Signals, Oxford University Press, 2. Aufl. 2004. S. Haykin, B. Van Veen, Signals and Systems, Wiley, 2. Aufl. 2003. A. V. Oppenheim, A. S. Willsky, S. H. Nawab, Signals and Systems, Prentice Hall 1983; 2. Aufl. 1997. R. N. Bracewell, The Fourier Transform and Its Applications, McGraw-Hill, 3. Aufl. 2000. J. D. Gaskill, Linear Systems, Fourier Transforms, and Optics, Wiley 1978. L. E. Franks, Signal Theory, Prentice Hall 1969; überarbeitete Neuauflage 1981.
975
977
Anhang B Lineare Systeme Dieser Anhang gibt eine kurze Wiederholung der grundlegenden Eigenschaften von ein- und zweidimensionalen linearen Systemen.
sodass 𝑓1 (𝑡) = 𝛿(𝑡 − 𝜏) ist, dann ergibt Gl. (B.1) 𝑓2 (𝑡) = ℎ(𝑡; 𝜏). Also ist ℎ(𝑡; 𝜏) die Impulsantwortfunktion des Systems (auch als greensche Funktion bezeichnet). Verschiebungsinvariante lineare Systeme
B.1 Eindimensionale lineare Systeme Wir betrachten ein System, dessen Ein- und Ausgabe die Funktionen 𝑓1 (𝑡) bzw. 𝑓2 (𝑡) sind. Ein Beispiel ist ein durch eine zeitlich variierende Kraft 𝑓1 (𝑡) angetriebener harmonischer Oszillator, der auf diese Kraft mit einer Auslenkung 𝑓2 (𝑡) reagiert. Das System wird durch eine Regel charakterisiert, die die Ausgabe mit der Eingabe verknüpft. Im Allgemeinen kann die Regel eine Differentialgleichung, eine Integraltransformation oder eine einfache mathematische Operation wie 𝑓2 (𝑡) = log 𝑓1 (𝑡) sein.
B.1.1 Lineare Systeme Man bezeichnet ein System als linear, wenn es das Superpositionsprinzip erfüllt, d. h. wenn seine Antwort auf die Summe zweier beliebiger Eingaben die Summe seiner Antworten auf die einzelnen Eingaben ist. Die Ausgabe zur Zeit 𝑡 ist im Allgemeinen eine gewichtete Superposition von Beiträgen der Eingabe zu verschiedenen Zeiten 𝜏,
Man bezeichnet ein lineares System als zeitinvariant oder verschiebungsinvariant, wenn eine zeitliche Verschiebung seiner Eingabe eine zeitliche Verschiebung der Ausgabe um dieselbe Zeit bewirkt, ohne dass sich sonst etwas ändert. Die Impulsantwortfunktion ist dann eine Funktion des Zeitunterschieds ℎ(𝑡; 𝜏) = ℎ(𝑡 − 𝜏). Unter diesen Bedingungen wird Gl. (B.1) ∞
𝑓2 (𝑡) = ∫ ℎ(𝑡 − 𝜏)𝑓1 (𝜏) d𝜏 . −∞
Die Ausgabe 𝑓2 (𝑡) ist also die Faltung der Eingabe 𝑓1 (𝑡) mit der Impulsantwortfunktion ℎ(𝑡) [siehe Gl. (A.4)]. Für 𝑓1 (𝑡) = 𝛿(𝑡) ist 𝑓2 (𝑡) = ℎ(𝑡); für 𝑓1 (𝑡) = 𝛿(𝑡 − 𝜏) ist 𝑓2 (𝑡) = ℎ(𝑡 − 𝜏), wie Abb. B.1 zeigt. Die Übertragungsfunktion
Nach dem in Anhang A besprochenen Faltungstheorem ist die Beziehung zwischen den Fouriertransformierten 𝐹1 (𝜈), 𝐹2 (𝜈) und H(𝜈) von 𝑓1 (𝑡), 𝑓2 (𝑡) und ℎ(𝑡) 𝐹2 (𝜈) = H(𝜈)𝐹1 (𝜈) .
∞
𝑓2 (𝑡) = ∫ ℎ(𝑡; 𝜏)𝑓1 (𝜏) d𝜏 ,
(B.1)
−∞
wobei ℎ(𝑡; 𝜏) eine Gewichtungsfunktion ist, die den Beitrag der Eingabe zu einer Zeit 𝜏 zur Ausgabe zu einer Zeit 𝑡 beschreibt. Wenn die Eingabe ein Impuls bei 𝜏 ist,
Eingang τ
t
System h(t)
(B.3)
Wenn die Eingabe 𝑓1 (𝑡) eine harmonische Funktion 𝐹1 (𝜈) exp(i2π 𝜈𝑡) ist, ist die Ausgabe 𝑓2 (𝑡) = H(𝜈) 𝐹1 (𝜈) exp(i2π 𝜈𝑡) ebenfalls eine harmonische Funktion derselben Frequenz, aber mit einer modifizierten komplexen Amplitude 𝐹2 (𝜈) = 𝐹1 (𝜈)H (𝜈), wie Abb. B.2 zeigt. Der multiplikative Faktor H(𝜈) ist als Übertragungsh(t)
0
(B.2)
h(t – τ)
Abb. B.1 Antwort eines verschiebungsinvarianten linearen Systems auf Impulse.
Ausgang 0
τ
t
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
978
B Lineare Systeme
Eingang t
System 𝘏 (ν)
Ausgang t
e i2π νt
Abb. B.2 Antwort eines verschiebungsinvarianten linearen Systems auf eine harmonische Funktion.
𝘏 (ν) e i2π νt
funktion des Systems bekannt. Die Übertragungsfunktion ist die Fouriertransformierte der Impulsantwortfunktion. Gleichung (B.3) ist der Schlüssel zu den Vorteilen von Fouriermethoden in der Analyse von verschiebungsinvarianten linearen Systemen. Um die Ausgabe eines Systems für eine beliebige Eingabe zu bestimmen, zerlegen wir einfach die Eingabe in ihre harmonischen Komponenten, multiplizieren die komplexe Amplitude jeder harmonischen Funktion mit der Übertragungsfunktion bei der passenden Frequenz und überlagern die resultierenden harmonischen Funktionen.
her nicht symmetrisch, und ihre Fouriertransformierte, die Übertragungsfunktion H(𝜈), muss komplex sein. Es kann gezeigt werden, 1) dass wenn ℎ(𝑡) = 0 für 𝑡 < 0 gilt, ′ die Real- und Imaginärteile von H(𝜈), die wir mit H (𝜈) ′′ bzw. H (𝜈) bezeichnen, gemäß ∞
′′
H (𝑠) 1 ∫ H (𝜈) = d𝑠 , π 𝑠−𝜈 ′
−∞ ∞
′′
H (𝜈) =
(B.4)
′
H (𝑠) 1 ∫ d𝑠 π 𝜈−𝑠
(B.5)
−∞
Beispiele Ideales System
H(𝜈) = 1 und ℎ(𝑡) = 𝛿(𝑡); die Ausgabe
ist eine Kopie der Eingabe. H(𝜈) = exp(−i2π 𝜈𝜏) und ℎ(𝑡) = 𝛿(𝑡 − 𝜏); die Ausgabe ist eine um die Zeit 𝜏 verzögerte Kopie der Eingabe. System mit exponentieller Antwort H(𝜈) = 𝜏∕(1 + i2π 𝜈𝜏) und ℎ(𝑡) = e−𝑡∕𝜏 für 𝑡 ≥ 0, ansonsten ℎ(𝑡) = 0; das ist die Antwort eines durch eine lineare Differentialgleichung erster Ordnung beschriebenen Systems, z. B. eines 𝑅𝐶-Kreises mit der Zeitkonstante 𝜏. Eine Eingabe in Form eines Impulses bewirkt eine exponentiell abklingende Antwort. Gechirptes System H(𝜈) = exp(−iπ 𝜈2 ) und ℎ(𝑡) = e−iπ∕4 exp(iπ 𝑡2 ); das System verzerrt die Eingabe, indem es ihr eine zu 𝜈2 proportionale Phasenverschiebung mitteilt. Ein Impuls als Eingabe erzeugt ein gechirptes Signal als Ausgabe, d. h. eine harmonische Funktion, deren instantane Frequenz (die Ableitung der Phase) linear mit der Zeit zunimmt. Dieses System beschreibt die Ausbreitung von optischen Pulsen durch Medien mit einer frequenzabhängigen Phasengeschwindigkeit (siehe Abschnitt 5.7). Es beschreibt auch Änderungen in der räumlichen Verteilung von Lichtwellen bei der Ausbreitung durch das Vakuum (siehe Abschnitt 23.3.1 bzw. 4.1.3). Ideales System mit Verzögerung
verknüpft sind, wobei die cauchyschen Hauptwerte der Integrale zu berechnen sind, d. h. ⎛ 𝜈−𝛥 ∞ ⎞ ∫ ≡ lim ⎜ ∫ + ∫ ⎟ , 𝛥→0 ⎜ ⎟ −∞ ⎝ −∞ 𝜈+𝛥 ⎠ ∞
𝛥>0.
Funktionen, die die Gln. (B.4) und (B.5) erfüllen, bezeichnet man als Paar von Hilberttransformierten, wo′′ ′ bei H (𝜈) die Hilberttransformierte von H (𝜈) ist. Wenn auch die Impulsantwortfunktion ℎ(𝑡) reell ist, ∗ muss ihre Fouriertransformierte H(−𝜈) = H (𝜈) symme′ trisch sein (siehe Abschnitt A.1). Der Realteil H (𝜈) hat ′′ dann gerade Symmetrie, und der Imaginärteil H (𝜈) hat ungerade Symmetrie. Die Integrale in den Gln. (B.4) und (B.5) können dann als Integrale über das Intervall (0, ∞) umgeschrieben werden. Die resultierenden Gleichungen sind als Kramers-Kronig-Beziehungen bekannt, ∞
′′
2 𝑠H (𝑠) H (𝜈) = ∫ 2 d𝑠 , π 𝑠 − 𝜈2 ′
0 ∞
′′
H (𝜈) =
(B.6)
′
𝜈H (𝑠) 2 ∫ d𝑠 . π 𝜈2 − 𝑠2
(B.7)
0
Kausale verschiebungsinvariante lineare Systeme
Die Impulsantwortfunktion ℎ(𝑡) eines kausalen verschiebungsinvarianten linearen Systems muss für 𝑡 < 0 verschwinden, da die Antwort des Systems nicht vor der Eingabe beginnen kann. Die Funktion ℎ(𝑡) ist da-
Zusammengefasst verknüpfen die Hilberttransformations- oder Kramers-Kronig-Beziehungen die Real- und 1) Siehe z. B. L. E. Franks, Signal Theory, Prentice Hall 1969; überarbeitete Ausgabe 1981.
B.2 Zweidimensionale lineare Systeme
Imaginärteile der Übertragungsfunktion eines kausalen verschiebungsinvarianten linearen Systems. Wenn einer der Teile bei allen Frequenzen bekannt ist, kann somit der andere Teil berechnet werden. Beispiel: Der harmonische Oszillator
Das durch die Differentialgleichung 2
(
d d + 𝜁 + 𝜔02 ) 𝑓2 (𝑡) = 𝑓1 (𝑡) 2 d𝑡 d𝑡
(B.8)
beschriebene lineare System beschreibt einen harmonischen Oszillator mit der Auslenkung 𝑓2 (𝑡) unter einer angewandten Kraft 𝑓1 (𝑡), wobei 𝜔0 die Resonanzkreisfrequenz ist und 𝜁 ein Dämpfungskoeffizient. Die Übertragungsfunktion H(𝜈) dieses Systems können wir bestimmen, indem wir 𝑓1 (𝑡) = exp(i2π 𝜈𝑡) und 𝑓2 (𝑡) = H(𝜈) exp(i2π 𝜈𝑡) in Gl. (B.8) einsetzen; das ergibt H(𝜈) =
1 1 , 2 2 2 (2π) 𝜈0 − 𝜈 + i𝜈Δ𝜈
(B.9)
wobei 𝜈0 = 𝜔0 ∕2π die Resonanzfrequenz und Δ𝜈 = 𝜁∕2π ist. Die Real- und Imaginärteile von H(𝜈) sind daher 𝜈02 − 𝜈2 1 , (2π)2 (𝜈02 − 𝜈2 )2 + (𝜈Δ𝜈)2 𝜈Δ𝜈 1 ′′ H (𝜈) = − . (2π)2 (𝜈02 − 𝜈2 )2 + (𝜈Δ𝜈)2 ′
H (𝜈) =
′
(B.10) (B.11) ′′
Da das System kausal ist, erfüllen H (𝜈) und H (𝜈) die ′ Kramers-Kronig-Beziehungen. Für 𝜈0 ≫ Δ𝜈 sind H (𝜈) ′′ und H (𝜈) schmale Funktionen um 𝜈0 . Für 𝜈 ≈ 𝜈0 ist 2 (𝜈0 − 𝜈2 ) ≈ 2𝜈0 (𝜈0 − 𝜈), sodass die Gln. (B.10) und (B.11) näherungsweise als Δ𝜈∕4𝜈0 1 , (2π)2 (𝜈0 − 𝜈)2 + (Δ𝜈∕2)2 𝜈 − 𝜈0 ′′ ′ H (𝜈) = 2 H (𝜈) Δ𝜈 ′′
H (𝜈) = −
(B.12)
Ein zweidimensionales System verknüpft zwei zweidimensionale Funktionen 𝑓1 (𝑥, 𝑦) und 𝑓2 (𝑥, 𝑦), die als Eingabe- und Ausgabefunktionen bezeichnet werden. Diese Funktionen können zum Beispiel optische Felder in zwei parallelen Ebenen sein, wobei (𝑥, 𝑦) Ortsvariablen bezeichnen; das System besteht aus dem Vakuum und den optischen Komponenten zwischen den beiden Ebenen. Die im eindimensionalen Fall definierten Konzepte der Linearität und Verschiebungsinvarianz lassen sich leicht auf den zweidimensionalen Fall verallgemeinern. Die Ausgabe 𝑓2 (𝑥, 𝑦) eines linearen Systems ist mit seiner Eingabe 𝑓1 (𝑥, 𝑦) durch ein Superpositionsintegral verknüpft, ∞
𝑓2 (𝑥, 𝑦) = ∬ ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ )𝑓1 (𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ , (B.14) −∞
wobei ℎ(𝑥, 𝑦; 𝑥′ 𝑦 ′ ) eine Gewichtungsfunktion ist, die die Wirkung der Eingabe am Punkt (𝑥′ , 𝑦 ′ ) auf die Ausgabe am Punkt (𝑥, 𝑦) beschreibt. Die Funktion ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) ist die Impulsantwortfunktion des Systems (auch als Punktverbreiterungsfunktion bezeichnet). Man bezeichnet das System als verschiebungsinvariant (oder isoplanatisch), wenn eine Verschiebung seiner Eingabe in einer Richtung eine Verschiebung der Ausgabe um dieselbe Entfernung und in dieselbe Richtung zur Folge hat, ohne etwas anderes zu verändern (siehe Abb. B.3). Die Impulsantwortfunktion ist dann eine Funktion des Unterschieds ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) = ℎ(𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ ) der Position. Gleichung (B.14) ist in diesem Fall die zweidimensionale Faltung von ℎ(𝑥, 𝑦) mit 𝑓1 (𝑥, 𝑦), ∞
(B.13)
geschrieben werden können. Gleichung (B.12) besitzt Lorentzform. Die Übertragungsfunktion des harmonischen Oszillators wird in den Abschnitten 5.5 und 15.1 verwendet, um dielektrische und atomare Systeme zu beschreiben.
𝑓2 (𝑥, 𝑦) = ∬ ℎ(𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ )𝑓1 (𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ . (B.15) −∞
Anwendung des in Abschnitt A.3 besprochenen zweidimensionalen Faltungstheorems ergibt 𝐹2 (𝜈𝑥 , 𝜈𝑦 ) = H(𝜈𝑥 , 𝜈𝑦 )𝐹1 (𝜈𝑥 , 𝜈𝑦 ) , y
y
Eingang x
f1(x,y)
B.2 Zweidimensionale lineare Systeme
System
Abb. B.3 Antwort eines zweidimensionalen verschiebungsinvarianten linearen Systems auf pulsförmige Eingabefunktionen.
Ausgang
h(x,y)
x f2(x,y)
(B.16)
979
980
B Lineare Systeme
y
y Eingang
x e –i2π(νx x + νy y)
System
𝘏(νx , νy)
Ausgang
x 𝘏 (νx , νy) e –i2π(νx x + νy y)
Abb. B.4 Antwort eines zweidimensionalen verschiebungsinvarianten linearen Systems auf harmonische Eingabefunktionen.
wobei 𝐹2 (𝜈𝑥 , 𝜈𝑦 ), H(𝜈𝑥 , 𝜈𝑦 ) und 𝐹1 (𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierten von 𝑓2 (𝑥, 𝑦), ℎ(𝑥, 𝑦) und 𝑓1 (𝑥, 𝑦) sind. Eine harmonische Eingabe mit der komplexen Amplitude 𝐹1 (𝜈𝑥 , 𝜈𝑦 ) produziert daher eine harmonische Ausgabe derselben Ortsfrequenz, aber mit der komplexen Amplitude 𝐹2 (𝜈𝑥 , 𝜈𝑦 ) = H(𝜈𝑥 , 𝜈𝑦 )𝐹1 (𝜈𝑥 , 𝜈𝑦 ), wie in Abb. B.4 dargestellt. Der multiplikative Faktor H(𝜈𝑥 , 𝜈𝑦 ) ist die Übertragungsfunktion des Systems. Die Übertragungsfunktion ist die Fouriertransformierte der Impulsantwortfunktion. Jede dieser Funktionen charakterisiert das System vollständig und ermöglicht uns, die Ausgabe zu einer beliebigen Eingabe zu bestimmen.
Zusammengefasst wird ein zweidimensionales verschiebungsinvariantes lineares System durch seine Impulsantwortfunktion ℎ(𝑥, 𝑦) oder seine Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) charakterisiert. Beispielsweise verschmiert ein System mit ℎ(𝑥, 𝑦) = circ(𝑥∕𝜌Sys , 𝑦∕𝜌Sys ) jeden Punkt der Eingabe zu einem kreisförmigen Fleck mit dem Radius 𝜌Sys . Es hat eine Übertragungsfunktion H(𝜈𝑥 , 𝜈𝑦 ) = 𝜌Sys 𝐽1 (2π 𝜌Sys 𝜈𝜌 )∕𝜈𝜌 mit 𝜈𝜌 = (𝜈𝑥2 + 𝜈𝑦2 )1∕2 , deren Form in Abb. A.2 illustriert ist. Das System zeigt für Ortsfrequenzen größer als 0.61∕𝜌Sys Linien/mm starke Dämpfung.
Weiterführende Literatur Siehe die Weiterführende Literatur in Anhang A.
981
Anhang C Die Moden linearer Systeme Dieser Anhang gibt eine kurze Übersicht über die Moden eines linearen Systems, das explizit durch eine Beziehung zwischen Eingabe und Ausgabe in Form einer Matrix oder einer Integraltransformation oder implizit durch eine lineare partielle Differentialgleichung beschrieben wird. Als Erstes betrachten wir ein lineares System, dessen explizite Beziehung zwischen Eingabe und Ausgabe durch einen linearen Operator ℒ charakterisiert wird, der auf einen Eingabevektor X wirkt, um den entsprechenden Ausgabevektor zu erzeugen, Y = ℒX . X
(C.1)
Y
Der Vektor X kann eine Reihe von komplexen Zahlen sein, die als Spaltenmatrix geschrieben werden, oder eine komplexe Funktion einer oder mehrerer Variablen. Die Moden eines solchen Systems sind die besonderen Eingaben, die (bis auf eine multiplikative Konstante) beim Durchgang durch das System unverändert bleiben, d. h. ℒX𝑞 = 𝜆𝑞 X𝑞 , Xq
(C.2)
λ qX q
wobei 𝑞 ein Index ist, der die Mode charakterisiert. Der Vektor X𝑞 wird Eigenvektor genannt. Die multiplikative Konstante 𝜆𝑞 , der Eigenwert, ist im Allgemeinen eine komplexe Zahl. Die Bedingung in Gl. (C.2) wird als Eigenwertproblem bezeichnet. Als Zweites betrachten wir ein dynamisches lineares System, dessen Zustand durch 𝑁 kontinuierliche Variablen beschrieben wird, die einen Vektor X(𝑡) bilden. Die Evolution einer beliebigen der 𝑁 Variablen dieses 𝑁-dimensionalen Vektors hängt im Allgemeinen von allen 𝑁 Variablen ab. Dasselbe System kann jedoch in einem neuen Koordinatensystem beschrieben werden, in dem
die 𝑁 neuen Variablen unabhängig voneinander sind, sodass das System in 𝑁 unabhängige eindimensionale Systeme zerfällt. Diese entkoppelten Variablen sind die Moden des Systems. Als Drittes betrachten wir ein lineares System, das implizit durch eine lineare partielle Differentialgleichung beschrieben wird, die in der Form von Gl. (C.2) geschrieben werden kann, wobei ℒ ein Differentialoperator ist und X eine komplexe Funktion von einer oder mehreren Variablen. In diesem Fall sind die Moden einfach die Lösungen der Differentialgleichung, und die Eigenvektoren werden Eigenfunktionen genannt. Die Begriffe „Eingabe“ und „Ausgabe“ sind in diesem Fall bedeutungslos. In diesem Anhang beschreiben wir einige Anwendungen der Modenanalyse in der Photonik. Zuerst rufen wir jedoch kurz einige geometrische Konzepte der linearen Algebra in Erinnerung. Mit jedem Paar von Vektoren X und Y ist ein komplexer Skalar (X, Y) verknüpft, das Skalarprodukt. Die Wurzel des Skalarprodukts eines Vektors X mit sich selbst, (X, X), wird Norm von X genannt und ist ein Maß für seine „Länge“. Das Skalarprodukt zweier Einheitsvektoren kann als Kosinus des „Winkels“ zwischen ihnen aufgefasst werden. Man bezeichnet zwei Vektoren als orthogonal, wenn ihr Skalarprodukt null ist. Wenn die Vektoren Tupel von komplexen Zahlen {𝑋𝑖 } und {𝑌𝑖 } sind (𝑖 = 1, 2, … , 𝑁), dann ∑𝑁 ist (X, Y) = 𝑖 = 1 𝑋𝑖∗ 𝑌𝑖 . Wenn die Vektoren komplexe ∞ Funktionen 𝑋(𝑡) und 𝑌(𝑡) sind, dann ist (X, Y) = ∫−∞ = 𝑋(𝑡)∗ 𝑌(𝑡) d𝑡. Für die folgenden beiden Klassen von Operatoren ℒ haben die Lösungen des Eigenwertproblems besondere Eigenschaften: Für hermitesche Operatoren gilt (X, ℒY) = (ℒX, Y), d. h. das Skalarprodukt bleibt unverändert, egal auf welchen der beiden Vektoren der Operator wirkt. Die Eigenwerte eines hermiteschen Operators sind reell, und seine Eigenvektoren sind orthogonal. Außerdem gehor-
Hermitesche Operatoren
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
982
C Die Moden linearer Systeme
chen die Eigenvektoren eines hermiteschen Operators dem Variationsprinzip, das auf einem Skalar 1 E v = (X, ℒX)∕(X, X) beruht, der Variationsenergie. 2 Es besagt, dass der Eigenvektor X1 mit dem kleinsten Eigenwert E v minimiert; der Eigenvektor X2 mit dem nächsthöheren Eigenwert minimiert E v unter der Nebenbedingung, dass er orthogonal zu X1 ist usw. Unitäre Operatoren Passive, verlustfreie physikalische Systeme werden durch unitäre Operatoren beschrieben, die durch die normerhaltende Eigenschaft (ℒX, ℒX) = (X, X) charakterisiert sind. Ein Beispiel ist die Operation der „Rotation“. Die Eigenwerte von unitären Operatoren sind unimodular (|𝜆𝑞 | = 1), d. h. sie bezeichnen eine reine Phase.
C.1 Die Moden eines diskreten linearen Systems Ein diskretes lineares System wird durch eine Matrixbeziehung Y = MX beschrieben, wobei der Eingabevektor X eine Reihe von 𝑁 in einer Spaltenmatrix angeordneten komplexen Zahlen (𝑋1 , 𝑋2 , … , 𝑋𝑁 ) ist, M eine 𝑁 × 𝑁-Matrix, die das lineare System beschreibt, und Y der Ausgabevektor, der ebenfalls eine Spaltenmatrix mit 𝑁 Elementen ist. Die Moden sind jene Eingabevektoren, die beim Durchgang durch das System parallel zu sich selbst bleiben, sodass die Matrixgleichung MX𝑞 = 𝜆𝑞 X𝑞
(C.3)
erfüllt ist. Die Moden des Systems entsprechen also den Eigenvektoren X𝑞 der Matrix M, und die Skalare 𝜆𝑞 sind die entsprechenden Eigenwerte, die durch Lösung der algebraischen Gleichung det(M − 𝜆 I) = 0 bestimmt werden, wobei I die Einheitsmatrix ist. Es gibt 𝑁 solcher Moden, die durch den Index 𝑞 = 1, 2, … , 𝑁 gekennzeichnet werden. Der Sonderfall binärer Systeme (𝑁 = 2) ist in der Optik besonders wichtig. In einem binären System ist jeder Vektor ein Paar von komplexen Zahlen (𝑋1 , 𝑋2 ), die in einer Spaltenmatrix X angeordnet sind. Das System wird durch eine quadratische 2 × 2-Matrix M charakterisiert, deren Elemente wir mit A, B, C und D bezeichnen. Die Beziehung Y = MX lautet dann ausgeschrieben ⎡𝑌1 ⎤ ⎡A ⎢ ⎥=⎢ 𝑌 C ⎣ 2⎦ ⎣
B ⎤ ⎡𝑋1 ⎤ D
⎥⎢ ⎥ . 𝑋 ⎦ ⎣ 2⎦
Die Eigenwerte werden durch Lösung der algebraischen Gleichung (A − 𝜆)(D − 𝜆) − BC = 0 bestimmt, was gleichzeitig die beiden Eigenwerte 𝜆1 und 𝜆2 liefert.
Einige Beispiele für Anwendungen binärer linearer Systeme in der Optik sind: In der Matrixoptik der Polarisation (Abschnitt 6.1.2) bezeichnet der Vektor (𝑋1 , 𝑋2 ) (der Jonesvektor) die Komponenten des elektrischen Feldes der Eingabe in zwei orthogonalen Richtungen, und (𝑌1 , 𝑌2 ) bezeichnet entsprechend das elektrische Feld der Ausgabe. Die Matrix M ist die Jonesmatrix des Systems. In diesem Fall sind die Moden die Polarisationszustände, die beim Durchgang des Lichts durch das System erhalten bleiben. Matrixoptik von Strahlen In der paraxialen Strahlenoptik (Abschnitt 1.4) werden die Position und der Winkel eines optischen Strahls durch einen Vektor (𝑋1 , 𝑋2 ) beschrieben, und die Wirkung von optischen Komponenten wie Linsen und Spiegeln wird durch eine Matrix M beschrieben, die ABCD-Matrix. Für ein geschlossenes optisches System, z. B. einen Resonator, sind die Moden Strahlpositionen und -winkel, die sich nach einem Umlauf selbst reproduzieren, sodass sie innerhalb des Resonators einschlossen bleiben. Matrixoptik von Schichtmedien In der Matrixoptik von Schichtmedien (Abschnitt 7.1.1) wird Licht an zahlreichen Grenzflächen gebrochen und reflektiert, sodass es in jeder Ebene Wellen in Vorwärts- und Rückwärtsrichtung gibt, deren Amplituden durch einen Vektor X = (𝑋1 , 𝑋2 ) beschrieben werden. Ein System mit einer Reihe von Grenzflächen zwischen einer Eingabe- und einer Ausgabeebene wird durch eine Transmissionsmatrix M beschrieben. Die Moden eines solchen Systems sind die Vektoren, die sich beim Durchgang durch das System selbst reproduzieren. Wenn das System sich periodisch wiederholt, wie in eindimensionalen photonischen Kristallen (Abschnitt 7.2), sind die Ausbreitungsmoden die Moden des Systems M. Matrixoptik der Polarisation
C.2 Die Moden eines kontinuierlichen durch einen Integraloperator beschriebenen Systems Lineare Systeme, die durch Integraloperatoren beschrieben werden, werden in Anhang B besprochen. Wir betrachten als Beispiel eine Funktion 𝑓(𝑡) der Zeit, wie z. B. einen optischen Puls oder ein breitbandiges optisches Feld, das durch ein lineares zeitinvariantes System wie ein optisches Filter hindurchtritt. Das System wird
C.3 Die Moden eines durch gewöhnliche Differentialgleichungen beschriebenen Systems
durch die Faltung ∞
(𝑡) = ∫ ℎ(𝑡 − 𝜏)𝑓(𝜏) d𝜏
(C.4)
−∞
beschrieben. In diesem System sind die Vektoren X und Y die Funktionen 𝑓(𝑡) und 𝑔(𝑡), und der Operator ℒ ist ein Integraloperator. Die Moden dieses Systems sind die harmonischen Funktionen exp(i2π 𝜈𝑡). Das ist offensichtlich, da die Eingabefunktion exp(i2π 𝜈𝑡) eine andere harmonische Ausgabefunktion H(𝜈) exp(i2π 𝜈𝑡) erzeugt, wobei H(𝜈) die Fouriertransformierte von ℎ(𝑡) ist. In diesem Fall gibt es ein Kontinuum von Moden mit kontinuierlichen Eigenwerten H(𝜈). Hier entspricht der Index 𝑞 der Frequenz 𝜈, die kontinuierliche Werte annimmt. Ein anderes Beispiel ist ein verschiebungsinvariantes lineares System, das auf eine zweidimensionale Funktion 𝑓(𝑥, 𝑦) des Ortes (𝑥, 𝑦) wirkt, wie in Gl. (B.14) beschrieben,
beschrieben. In diesem Fall sind die Eigenfunktionen nicht zwangsläufig harmonische Funktionen. Sie können durch Lösung des Eigenwertproblems in Gl. (C.2) bestimmt werden, das jetzt die Form einer Integralgleichung annimmt, ∞
∬ ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ )𝑓𝑞 (𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ = 𝜆𝑞 𝑓𝑞 (𝑥, 𝑦) , −∞
𝑞 = 1, 2, … .
Die Funktionen 𝑓𝑞 (𝑥, 𝑦) und die Konstanten 𝜆𝑞 sind die Eigenfunktionen bzw. Eigenwerte des Systems, und der Index 𝑞 bezeichnet einen diskreten Satz von Moden. Ein Beispiel aus Abschnitt 11.2.5 ist Licht, das sich zwischen zwei parallelen Spiegeln eines Laserresonators ausbreitet. Die Verteilungen des optischen Feldes in der transversalen Ebene zu Beginn und am Ende eines einzelnen Umlaufs sind die Ein- und Ausgabe des Systems. Die Moden des Resonators sind die Feldverteilungen, die ihre Form bei einem Umlauf beibehalten. Der Kern ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ ) in Gl. (C.7) bezeichnet eine Ausbreitung im Vakuum und die Reflexion am ersten Spiegel, gefolgt von der erneuten Ausbreitung im Vakuum und der Reflexion am zweiten Spiegel. Offensichtlich macht die Anwesenheit gekrümmter Spiegel oder von Spiegeln mit endlichen Abmessungen dieses System verschiebungsinvariant. Wenn die Spiegel sphärisch sind und wir annehmen, dass sie das einfallende Licht mit einem Phasenfaktor modulieren, der eine quadratische Funktion der radialen Entfernung ist, dann sind die Resonatormoden Hermite-Gauß-Funktionen von 𝑥 und 𝑦. In Anwesenheit von Blenden kann Gl. (C.7) nur numerisch gelöst werden (siehe Abschnitt 11.2.5).
Moden eines optischen Resonators
∞
𝑔(𝑥, 𝑦) = ∬ ℎ(𝑥 − 𝑥′ , 𝑦 − 𝑦 ′ )𝑓(𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ . (C.5) −∞
Seine Eigenfunktionen sind die zweidimensionalen harmonischen Funktionen exp[i2π(𝜈𝑥 𝑥 + 𝜈𝑦 𝑦)], und seine Eigenwerte sind H(𝜈𝑥 , 𝜈𝑦 ), die zweidimensionalen Fouriertransformierten von ℎ(𝑥, 𝑦). Wieder gibt es ein Kontinuum von Eigenfunktionen, die durch die Ortsfrequenz (𝜈𝑥 , 𝜈𝑦 ) gekennzeichnet werden.
C.2.1 Translationssymmetrie und harmonische Moden Es nicht überraschend, dass die Moden eines verschiebungsinvarianten Systems harmonische Funktionen sind. Weil eine harmonische Funktion invariant bezüglich einer Zeitverschiebung ist, d. h. eine harmonische Funktion bleibt, wenn sie zeitlich verschoben wird, ist sie eine Eigenfunktion eines zeitinvarianten (stationären) linearen Systems. Analog gilt, dass zweidimensionale harmonische Funktionen die Eigenfunktionen eines räumlich invarianten (homogenen) linearen Systems sind, weil sie invariant unter einer Translation in der Ebene sind. Wenn das lineare System nicht räumlich invariant ist, d. h. keine Translationssymmetrie besitzt, dann wird es (im zweidimensionalen Fall) durch die allgemeinere lineare Operation
C.3 Die Moden eines durch gewöhnliche Differentialgleichungen beschriebenen Systems Die Dynamik von bestimmten physikalischen Systemen wird durch eine Reihe gekoppelter gewöhnlicher Differentialgleichungen beschrieben. Zum Beispiel werden die Triebkräfte von 𝑁 gekoppelten Oszillatoren durch 𝑁 Differentialgleichungen beschrieben; in Matrixschreibweise Ẍ = −MX ,
∞
𝑔(𝑥, 𝑦) = ∬ ℎ(𝑥, 𝑦; 𝑥′ , 𝑦 ′ )𝑓(𝑥′ , 𝑦 ′ ) d𝑥′ d𝑦 ′ −∞
(C.6)
(C.7)
X1
X2
X3
(C.8)
983
984
C Die Moden linearer Systeme
wobei X eine Spaltenmatrix mit den Komponenten 2 (𝑋1 , 𝑋2 , … , 𝑋𝑁 ) ist, Ẍ = d X∕ d𝑡2 und M eine 𝑁 × 𝑁Matrix mit zeitunabhängigen Koeffizienten, sodass das System zeitinvariant ist. Die Zeitinvarianz verlangt, dass die Moden harmonische Funktionen der Form exp(i𝜔𝑡) sind, d. h. es muss X(𝑡) = X(0) exp(i𝜔𝑡) gelten. Wir setzen in Gl. (C.8) ein und erhalten MX = 𝜔2 X .
(C.9)
Diese Gleichung hat die Form eines Eigenwertproblems für ein diskretes System. Ihre Eigenwerte liefern die Resonanzfrequenzen 𝜔1 , 𝜔2 , . . . , 𝜔𝑁 der Moden, und ihre Eigenvektoren werden Normalschwingungen genannt. Alle Komponenten des Eigenvektors X𝑞 der Mode 𝑞 oszillieren bei derselben Resonanzfrequenz 𝜔𝑞 ohne ihre relativen Amplituden oder Phasen zu verändern. In diesem Sinn sind die Moden stationäre Lösungen, die voneinander entkoppelt sind.
C.4 Die Moden eines durch eine partielle Differentialgleichung beschriebenen Systems Felder und Wellen werden durch partielle Differentialgleichungen beschrieben, wie z. B. die maxwellschen Gleichungen, die die Dynamik der elektrischen und magnetischen Felder in einem dielektrischen Medium beschreiben, oder der Schrödingergleichung, die die Dynamik der Wellenfunktion eines Teilchen in einem Potential beschreibt. Wenn diese physikalischen Systeme stationär sind, d. h. das dielektrische Medium und die Potentialverteilung zeitunabhängig sind, dann muss jede Mode eine harmonische Funktion exp(i𝜔𝑡) der Zeit mit einer Frequenz 𝜔 sein. Aus der Wellengleichung wird daher die verallgemeinerte Helmholtzgleichung ∇ × [η(r)∇ × H] =
𝜔2 H, 𝑐02
(C.10)
wobei η(r) = 𝜀0 ∕𝜀(r) die elektrische Impermeabilität des dielektrischen Mediums ist [siehe Gl. (7.2)]. Entsprechend wird aus der Schrödingergleichung die zeitunabhängige Schrödingergleichung, [−
ℏ2 2 ∇ + V (r)] 𝜓(r) = E 𝜓(r) , 2𝑚
(C.11)
wobei E = ℏ𝜔 ist und V (r) die Potentialverteilung bezeichnet [siehe Gl. (14.3)]. Jede dieser Gleichungen hat jetzt die Form des Eigenwertproblems Gl. (C.2), wobei ℒ ein hermitescher Differentialoperator ist, der durch die Funktion η(r) oder
V (r) charakterisiert ist. Die reellen Eigenwerte liefern die Frequenzen 𝜔𝑞 der Moden (und folglich im Fall der Schrödingergleichung die entsprechenden Energien E𝑞 ). Die Eigenfunktionen sind die räumlichen Verteilungen der elektromagnetischen Felder (oder die Wellenfunktionen) für jede Mode. Das Feld (oder die Wellenfunktion) der 𝑞-ten Mode ändert sich an allen Orten wie exp(i𝜔𝑞 𝑡) mit der Zeit, sodass die Moden wie verlangt stationär sind.
C.4.1 Die Moden des Feldes/der Welle in einem homogenen Medium mit Randbedingungen Wenn das dielektrische Medium homogen, d. h. η(r) konstant ist, ist das System verschiebungsinvariant. Um diese Translationssymmetrie zu berücksichtigen, müssen die Moden des elektromagnetischen Systems harmonische Funktionen des Ortes sein, d. h. ebene Wellen. Ähnlich gilt, wenn das Potential V (r) konstant ist, sind die Moden ebene Wellen, sodass das Teilchen mit gleicher Wahrscheinlichkeit an jedem beliebigen Ort gefunden wird. In anderen Situationen sind η(r) und V (r) innerhalb eines endlichen, durch eine Oberfläche begrenzten Gebiets konstant, das bestimmte Randbedingungen auferlegt. Zum Beispiel können elektromagnetische Moden eines Hohlraumresonators mit ideal leitenden Oberflächen bestimmt werden, indem man fordert, dass die parallelen Komponenten des elektrischen Feldes an der Oberfläche verschwinden. Für einen rechteckigen Resonator sind die Moden harmonische Funktionen des Ortsy – stehende Wellen, die im Gleichtakt oszillieren (siehe Abschnitt 11.3.3). Entsprechend kann man die Moden eines Teilchens in einem Quantentopf (-punkt) bestimmen, indem man fordert, dass die Wellenfunktion an den Grenzflächen verschwindet (siehe Abschnitt 17.1.7). In einer anderen Anordnung kann ein homogenes dielektrisches Medium in einer Richtung begrenzt sein, z. B. durch zwei parallele ebene Spiegel. Hier entsprechen die Randbedingungen einem diskreten Satz von stehenden Wellen in der zu den Spiegeln orthogonalen Richtung (der transversalen Richtung), mit sich ausbreitenden Wellen in der parallelen (axialen) Richtung, sodass die Moden sich in diesem optischen Wellenleiter als harmonische Funktionen in axialer Richtung ausbreiten, ohne ihre transversalen Verteilungen zu verändern (siehe Abschnitt 9.1). Wenn 𝛽𝑞 die Ausbreitungskonstante der Mode 𝑞 ist, dann ist der Eigenwert der Phasenfaktor exp(−i𝛽𝑞 𝑧).
C.4 Die Moden eines durch eine partielle Differentialgleichung beschriebenen Systems
C.4.2 Moden von Feldern/Wellen in einem periodischen Medium Wie aus den vorherigen Beispielen deutlich wird, werden die Moden eines Systems, das durch eine partielle Differentialgleichung beschrieben wird, durch die räumliche Verteilung des Mediums bestimmt, d. h. die Funktionen η(r) oder V (r). Wenn diese Funktion konstant ist, müssen die Moden invariant bezüglich einer beliebigen Translation sein. Wenn sie periodisch ist, müssen die Moden invariant bezüglich einer Translation um eine Periode sein. Diese Art von Translationssymmetrie verlangt, dass die Moden Blochwellen sind (siehe Abschnitt 7.2.1). Wenn das Medium beispielsweise in 𝑥- und 𝑦-Richtung homogen, aber in 𝑧-Richtung periodisch ist, hat eine Blochmode die Form einer harmonischen Funktion exp(−iK 𝑧), moduliert mit einer periodischen stehenden Welle 𝑝K (𝑧) mit derselben Periode wie das Medium; die Abhängigkeit von 𝑥 und 𝑦 ist natürlich harmonisch. Für einen gegebenen Wert von K hängen die Frequenzen der Moden und die Formen der entsprechenden stehenden Wellen 𝑝K (𝑧) von der Form der periodischen Funktion η(r) oder V (r) ab. Diese Art von Translationssymmetrie resultiert in einem Spektrum von Eigenwerten (und daraus folgend Frequenzen 𝜔 oder Energien E = ℏ𝜔) in Form von Bändern, die durch Bandlücken getrennt sind, innerhalb derer keine Moden erlaubt sind. So zeigt ein Elektron in einer periodischen Potentialverteilung die wohlbekannte Bandstruktur von Festkörpern (siehe Abschnitt 14.1.4). Entsprechend zeigt ein optisches Feld in einem periodischen dielektrischen Medium, d. h. einem photonischen Kristall, eine ähnliche Bandstruktur mit photonischen Bandlücken (siehe Abschnitt 7.2 und Abschnitt 7.3).
Weiterführende Literatur D. C. Lay, S. R. Lay, J. J. McDonald, Linear Algebra and its Applications, Pearson, 5. Aufl. 2015. S. Axler, Linear Algebra Done Right, Springer, 3. Aufl. 2015. S. J. Leon, Linear Algebra with Applications, Pearson, 9. Aufl. 2014. G. Strang, Introduction to Linear Algebra, Wellesley Cambridge Press, 4. Aufl. 2009.
985
987
Lösungen zu den Übungen 1 Strahlenoptik Übung 1-1: Das snelliussche Gesetz
Die Weglänge ist 𝑛1 d 1 sec 𝜃1 + 𝑛2 d 2 sec 𝜃2 ;
(1)
sie ist eine Funktion von 𝜃1 und 𝜃2 , die durch d 1 tan 𝜃1 + d 2 tan 𝜃2 = d
(2)
verknüpft sind. Die Weglänge wird minimal, wenn (𝜕∕𝜕𝜃1 )[𝑛1 d 1 sec 𝜃1 d 2 + 𝑛2 sec 𝜃2 ] = 0 ist, d. h. für 𝑛1 d 1 sec 𝜃1 tan 𝜃1 + 𝑛2 d 2 sec 𝜃2 tan 𝜃2 (
𝜕𝜃2 ) = 0 . (3) 𝜕𝜃1
Aus (2) folgt (𝜕∕𝜕𝜃1 )[d 1 tan 𝜃1 + d 2 tan 𝜃2 ] = 0 und daraus wiederum d 1 sec2 𝜃1 + d 2 sec2 𝜃2 (𝜕𝜃2 ∕𝜕𝜃1 ) = 0 und 𝜕𝜃2 ∕𝜕𝜃1 = −d 1 sec2 𝜃1 ∕d 2 sec2 𝜃2 . Einsetzen in (3) ergibt 𝑛1 d 1 sec 𝜃1 tan 𝜃1 − 𝑛2 d 1 d 2 sec2 𝜃1 d 2 tan 𝜃2 ∕d 2 sec 𝜃2 = 0, sodass 𝑛1 tan 𝜃1 = 𝑛2 sec 𝜃1 d 2 sin 𝜃2 folgt. Daraus erhalten wir direkt das snelliussche Gesetz, 𝑛1 sin 𝜃1 = 𝑛2 sin 𝜃2 . Übung 1-2: Bildentstehung an einem Kugelspiegel
Ein Strahl, der bei 𝑃1 = (𝑦1 , 𝑧1 ) unter einem Winkel 𝜃1 entsteht, trifft den Spiegel in der Höhe 𝑦 ≈ 𝑦1 + 𝜃1 𝑧1 .
(1)
Der Einfallswinkel am Spiegel ist 𝜙 = 𝜓 − 𝜃1 ≈ 𝑦∕(−𝑅) − 𝜃1 . ( y 1, z 1 )
1
Der reflektierte Strahl schließt einen Winkel 𝜃2 mit der 𝑧-Achse ein, 𝑦 2𝑦 𝜃2 = 2𝜙 + 𝜃1 = 2 [ − 𝜃1 ] + 𝜃1 = − 𝜃1 −𝑅 −𝑅 2(𝑦1 + 𝜃1 𝑧1 ) = − 𝜃1 . −𝑅 Wir setzen 𝑓 = (−𝑅)∕2 ein und erhalten 𝑦 + 𝜃1 𝑧1 𝜃2 = 1 (2) − 𝜃1 . 𝑓 Die Höhe 𝑦2 kann aus 𝑦 + (−𝑦2 ) ≈ 𝜃2 (3) 𝑧2 bestimmt werden. Wenn wir (1) und (2) in (3) einsetzen, erhalten wir 𝑦1 + 𝜃1 𝑧1 − 𝜃1 ] 𝑦1 + 𝜃1 𝑧1 − 𝑦2 = 𝑧2 [ 𝑓 und 𝑧 𝑦 𝑧 𝑧 𝑦2 = 𝑦1 − 2 1 + 𝜃1 [𝑧1 − 1 2 + 𝑧2 ] . 𝑓 𝑓 Wenn 𝑧 𝑧 [𝑧1 − 1 2 + 𝑧2 ] = 0 𝑓 oder 1 1 1 + = (4) 𝑧1 𝑧2 𝑓 gilt, folgt 𝑦2 = 𝑦1 (1 − 𝑧2 ∕𝑓), unabhängig von 𝜃1 . Aus (4) folgt 𝑧2 ∕𝑓 = 1 + 𝑧2 ∕𝑧1 und daher 𝑧2 = −(𝑧2 ∕𝑧1 )𝑦1 . Übung 1-3: Bildentstehung
1) Aus dem snelliusschen Gesetz folgt 𝑛1 sin (𝜃1 + 𝜙) = 𝑛2 sin [𝜙 − (−𝜃2 )]. Da alle Winkel klein sind, ist 𝑛1 (𝜃1 + 𝜙) ≈ 𝑛2 (𝜙 + 𝜃2 ) oder 𝜃2 ≈ (𝑛1 ∕𝑛2 )𝜃1 + [(𝑛1 − 𝑛2 )∕𝑛2 ]𝜙. Wegen 𝜙 ≈ 𝑦∕𝑅 ist 𝜃2 ≈ (𝑛1 ∕𝑛2 ) 𝜃1 − (𝑛2 − 𝑛1 )𝑦∕𝑛2 𝑅, was nichts anderes als Gl. (1.11) ist.
y 2
( y 2, z 2 )
2
1
y
z
P1
R n1 n2
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
P2
988
Lösungen zu den Übungen
2) Wenn wir 𝜃1 ≈ 𝑦∕𝑧1 und (−𝜃2 ) ≈ 𝑦∕𝑧2 in Gl. (1.11) einsetzen, erhalten wir −𝑦∕𝑧2 ≈ (𝑛1 ∕𝑛2 )𝑦∕𝑧2 − (𝑛2 − 𝑛1 )𝑦∕𝑛2 𝑅, woraus Gl. (1.12) folgt. 3) Wir beziehen uns auf Abb. 1.18(b) und nehmen an, dass der Strahl durch den Ursprung 0 verläuft; dann ist 𝑦1 ∕𝑧1 = −𝑦2 ∕𝑧2 , sodass Gl. (1.13) folgt. Strahlen unter anderen Winkeln verlaufen ebenfalls von 𝑃1 nach 𝑃2 , wie man mithilfe einer Herleitung ähnlich der in Übung 1-2 verwendeten zeigen kann. Übung 1-4: Aberrationsfreie abbildende Oberfläche
Nach dem fermatschen Prinzip gilt für die optische Weglänge 𝑛1 d 1 + 𝑛2 d 2 = konstant = 𝑛1 𝑧1 + 𝑛2 𝑧2 . Das ist eine Gleichung für die Oberfläche, die in kartesischen Koordinaten in der Form 𝑛1
√ √ (𝑧 + 𝑧1 )2 + 𝑦 2 + 𝑛2 (𝑧2 − 𝑧)2 + 𝑦 2 = 𝑛1 𝑧1 + 𝑛2 𝑧2 (1)
geschrieben werden kann. Wenn 𝑧1 und 𝑧2 gegeben sind, ist 𝑦 durch (1) mit 𝑧 verknüpft, und die Oberfläche ist damit festgelegt. y 1
P1 z1
P y n1 n2
2
P2
z2
z
Ein Strahl im Winkel 𝜃1 in der Höhe 𝑦 wird an der ersten Oberfläche gemäß Gl. (1.11) gebrochen, und sein Winkel wird auf den Wert 𝜃1 (𝑛 − 1)𝑦 − 𝑛 𝑛𝑅1
(1)
verändert, wobei 𝑅1 der Radius der ersten Oberfläche ist (𝑅1 < 0). An der zweiten Oberfläche wird der Winkel wieder zu 𝜃2 = 𝑛𝜃 −
1−𝑛 𝑦, 𝑅2
(2)
wobei 𝑅2 der Radius der zweiten Oberfläche ist (𝑅2 > 0). Wir haben hier angenommen, dass die Strahlhöhe sich nicht ändert, da die Linse dünn ist. Einsetzen von (1) in (2) liefert 𝜃1 𝑛 − 1 1−𝑛 − 𝑦] − 𝑦 𝑛 𝑛𝑅1 𝑅2 1 1 = 𝜃1 − (𝑛 − 1)𝑦 [ − ] . 𝑅1 𝑅2
𝜃2 = 𝑛 [
𝜃2 = 𝜃1 −
𝑦 . 𝑓
(3)
Wenn also 𝜃1 = 0 ist, folgt 𝜃2 = −𝑦∕𝑓 und 𝑧2 ≈ 𝑦∕(−𝜃2 ) = 𝑓, wobei 𝑓 die Brennweite ist. Im Allgemeinen ist 𝜃1 ≈ 𝑦∕𝑧1 und −𝜃2 = 𝑦∕𝑧2 . Aus (3) folgt daher −𝑦∕𝑧2 = 𝑦∕𝑧1 − 𝑦∕𝑓 und daraus Gl. (1.16). Gleichung (1.17) kann durch einen Ansatz ähnlich dem aus Übung 1-2 bewiesen werden. Übung 1-6: Numerische Apertur und Akzeptanzwinkel eines Lichtleiters
Anwendung des snelliusschen Gesetzes auf die Grenzfläche Luft/Kern liefert sin 𝜃A = 𝑛1 sin 𝜃k = 𝑛1 cos 𝜃k .
1
n1 n2 θk
θA
(1)
θk
z
Übung 1-5: Die Gleichungen für dünne Linsen
𝜃=
Aus Gl. (1.15) folgt damit
√ Wegen sin 𝜃k = 𝑛2 ∕𝑛1 ist cos 𝜃k = 1√− (𝑛2 ∕𝑛1 )2 . Damit folgt aus (1) NA = sin 𝜃A = 𝑛1 1 − (𝑛2 ∕𝑛1 )2 = √ 𝑛12 − 𝑛22 . Für Quarzglas mit 𝑛1 = 1.475 und 𝑛2 = 1.460 ist die numerische Apertur NA = 0.21 und der Akzeptanzwinkel ist 𝜃A = 12.1◦ . Übung 1-7: In einer Leuchtdiode eingegrenztes Licht
1) Strahlen innerhalb der sechs Kegel mit den Halbwin−1 keln 𝜃k = sin (1∕𝑛) = 16.1◦ werden wie in der Abbildung illustriert in allen Richtungen in die Luft gebrochen. Strahlen außerhalb dieser sechs Kegel erfahren innere Reflexion. Wegen 𝜃k < 45◦ überlappen die Kegel nicht, und die reflektierten Strahlen bleiben stets außerhalb der Kegel, sodass sie immer weiter ohne Brechung reflektiert werden. Dies sind daher die eingegrenzten Strahlen.
θk
Strahlenoptik
2) Der Raumwinkel eines Kegels mit dem Halbwinkel 𝜃k ist 2π(1 − cos 𝜃k ). Daher ist das Verhältnis des durchgelassenen zum gesamten Licht 6 × 2π(1 − cos 𝜃k )∕4π = 3[1 − cos 𝜃k ] = 0.118. 11.8 % der Lichtintensität werden also transmittiert. Diese Herleitung gilt jedoch nur für 𝜃k < 45◦ bzw. 𝑛 > √ 2. Übung 1-8: Platten mit variablem Brechungsindex als Linsen Mit 𝜃0 = 0 und 𝑧 = d erhalten wir aus den Gln. (1.29) und (1.30) 𝑦(d ) = 𝑦0 cos (𝛼d ) und 𝜃(d ) = −𝑦0 𝛼 sin (𝛼d ). Die Strahlen werden in einem Winkel 𝜃′ ≈ 𝑛0 |𝜃(d )| = 𝑛0 𝑦0 𝛼 sin (𝛼d ) in die Luft gebrochen. Daher ist
𝑦0 cos (𝛼d ) 𝑦(d ) 1 AF ≈ ′ = = , 𝜃 𝑛0 𝑦0 𝛼 sin (𝛼d ) 𝑛0 𝛼 tan (𝛼d ) 𝑓=
𝑦0 1 = 𝜃′ 𝑛0 𝛼 sin (𝛼d )
und
Mit 𝑦0 = 0 erhalten wir aus Gl. (1.29) 𝑦(𝑧) = (𝜃0 ∕𝛼) sin(𝛼𝑧). Der Strahl folgt einer sinusförmigen Trajektorie mit der Amplitude 𝜃0 ∕𝛼, die nicht größer werden kann als der Radius 𝑎. Folglich ist 𝜃0 ∕𝛼 = 𝑎. Für den Akzeptanzwinkel gilt 𝜃A ≈ 𝑛0 𝜃0 = 𝑛0 𝛼𝑎. a
θ0 θA
Für eine Stufenindexfaser ist √ √ 𝜃A = 𝑛12 − 𝑛22 = (𝑛1 + 𝑛2 )(𝑛1 − 𝑛2 ) .
(1)
√ Für 𝑛1 ≈ 𝑛2 ist 𝜃A ≈ 2𝑛1 (𝑛 √ 1 − 𝑛2 ). Für 𝑛1 = 𝑛0 und 𝑛2 = 𝑛0 (1 − 𝛼2 𝑎2 ∕2) ist 𝜃A ≈ 2𝑛0 (𝛼2 𝑎2 𝑛0 ∕2) = 𝛼𝑛0 . Das ist derselbe Akzeptanzwinkel wie im Fall der Gradientenindexfaser. Übung 1-10: Spezielle Fälle von Strahltransfermatrizen
1 1 1 AH = 𝑓 − AF = − ] [ 𝑛0 𝛼 sin (𝛼d ) tan (𝛼d ) 1 1 − cos (𝛼d ) = 𝑛0 𝛼 sin (𝛼d ) 2
=
2 sin (𝛼d ∕2) 1 1 = tan (𝛼d ∕2) . 𝑛0 𝛼 2 sin (𝛼d ∕2) cos (𝛼d ∕2) 𝑛0 𝛼
Die Trajektorien sind:
y0 θʹ H
Übung 1-9: Numerische Apertur eines Lichtleiters mit variablem Brechungsindex
A f
= π/α
= π /2 α
F
Wir verwenden die grundlegenden Gleichungen 𝑦2 = A𝑦1 + B𝜃1 𝜃2 = C 𝑦1 + D𝜃1 und unterscheiden die folgenden Fälle: • Für A = 0 ist 𝑦2 = B𝜃1 , d. h. für gleiche 𝜃1 ist 𝑦2 identisch, unabhängig von 𝑦1 ; hier handelt es sich um ein fokussierendes System.
y2 θ1
• Für B = 0 ist 𝑦2 = A𝑦1 , d. h. für gleiche 𝑦1 ist 𝑦2 identisch, unabhängig von 𝜃1 ; es handelt sich also um ein abbildendes System.
• Für C = 0 ist 𝜃2 = D𝜃1 , d. h. alle parallelen Strahlen bleiben parallel.
• Für D = 0 ist 𝜃2 = C 𝑦1 , d. h. alle Strahlen, die von einem Punkt ausgehen, werden parallel.
y1
θ1
y2
θ2
y1
θ2
989
990
Lösungen zu den Übungen
Übung 1-11: Parallele transparente Platten
Übung 1-14: Abbildung mit einer dicken Linse
Die erste Platte hat die Strahltransfermatrix
a) Dieses System wird aus fünf Teilsystemen zusammengesetzt: 1) der Entfernung d 1 in Luft, 2) der brechenden Grenzfläche Luft/Glas, 3) der Entfernung d in Glas, 4) dem brechenden System Glas/Luft und 5) der Entfernung d 2 in Luft. Die Strahltransfermatrix von Teilsystem 2) ist
⎡1 d 1 ⎤ ⎡1 0 ⎤ ⎡1 d 1 ∕𝑛1 ⎤ ⎥⎢ ⎢ ⎥=⎢ ⎥; 0 1 0 1∕𝑛1 0 1∕𝑛1 ⎦⎣ ⎣ ⎦ ⎣ ⎦ die Strahltransfermatrix der zweiten Platte ist ⎡1 d 2 ⎤ ⎡1 0 ⎤ ⎡1 d 2 𝑛1 ∕𝑛2 ⎤ ⎥⎢ ⎥=⎢ ⎥. ⎢ 0 1 0 𝑛1 ∕𝑛2 0 𝑛1 ∕𝑛2 ⎦⎣ ⎦ ⎣ ⎦ ⎣ Gemeinsam haben die beiden Platten die kombinierte Strahltransfermatrix ⎡1 d 2 𝑛1 ∕𝑛2 ⎤ ⎡1 d 1 ∕𝑛1 ⎤ ⎡1 d 1 ∕𝑛1 + d 2 ∕𝑛2 ⎤ ⎥⎢ ⎥=⎢ ⎥. ⎢ 0 𝑛1 ∕𝑛2 0 1∕𝑛1 0 1∕𝑛2 ⎦⎣ ⎦ ⎣ ⎦ ⎣ Entsprechend besitzen 𝑁 Platten die Strahltransfermatrix ∑ ⎡1 d ∕𝑛𝑖 ⎤ 𝑖 𝑖 ⎢ ⎥. 0 1∕𝑛𝑁 ⎣ ⎦ Unter Einschluss der Grenzfläche zwischen der 𝑁-ten Platte und der Luft ist die gesamte Transfermatrix des Systems ∑ ∑ ⎡1 0 ⎤ ⎡1 d ∕𝑛𝑖 ⎤ ⎡1 d ∕𝑛𝑖 ⎤ 𝑖 𝑖 𝑖 𝑖 ⎢ ⎥. ⎥⎢ ⎥=⎢ 0 𝑛𝑁 0 1∕𝑛𝑁 0 1 ⎣ ⎦ ⎦⎣ ⎦ ⎣ Die Transfermatrix einer inhomogenen Platte mit dem Brechungsindex 𝑛(𝑧) und der Dicke d ist ⎡ ⎢1 ⎢ 0 ⎣
d ⎤ ∫ 0 [1∕𝑛(𝑧)] d𝑧⎥ . ⎥ 1 ⎦
⎡ 1 −1∕𝑓 ⎣
0⎤ ⎡1 ⎥⎢ 1 0 ⎦⎣
d⎤ ⎡ 1
⎥⎢ 1 −1∕𝑓 ⎦⎣
⎤ ⎥. 1 − d ∕𝑓 ⎦ d
Übung 1-13: Abbildung mit einer dünnen Linse
⎡1
M=⎢
d 2⎤ ⎡ 1
⎥⎢ 1 −1∕𝑓 ⎦⎣
mit 𝑓1 =
0 ⎤ ⎡ 1 ⎥=⎢ 1∕𝑛 1∕𝑛𝑓1 ⎦ ⎣
𝑅 . 𝑛−1
0 ⎤ ⎥ 1∕𝑛 ⎦
Die Strahltransfermatrix der Teilsysteme 2) und 3) ist ⎡1 ⎢ 0 ⎣
d⎤ ⎡
1 ⎥⎢ 1 1∕𝑛𝑓1 ⎦⎣
0 ⎤ ⎡1 − d ∕𝑛𝑓1 ⎥=⎢ 1∕𝑛 1∕𝑛𝑓1 ⎦ ⎣
d ∕𝑛 ⎤
1∕𝑛
⎥. ⎦
Die Strahltransfermatrix der Teilsysteme 2), 3) und 4) (Linse) ist ⎡ 1 0 ⎤ ⎡1 − d ∕𝑛𝑓1 d ∕𝑛⎤ ⎥ ⎢ ⎥⎢ 1∕𝑛 −1∕𝑛𝑓1 −(𝑛 − 1)∕𝑅 𝑛 ⎦ ⎣ ⎦⎣ ⎤ ⎡ d ∕𝑛 1 − d ∕𝑛𝑓1 =⎢ ⎥. −(1 − d ∕𝑛𝑓1 )∕𝑓1 − 1∕𝑓1 −d ∕𝑛𝑓1 + 1 ⎦ ⎣ Die Strahltransfermatrix des vollständigen Systems ist
Übung 1-12: Luftspalt und dünne Linse M=⎢
⎡ 1 ⎢ −(𝑛 − 1)∕𝑛𝑅 ⎣
⎤ ⎥ 1 − d 1 ∕𝑓 ⎦ d1
0 ⎣ ⎡1 − d 2 ∕𝑓 d 1 + d 2 (1 − d 1 ∕𝑓)⎤ =⎢ ⎥. −1∕𝑓 1 − d 1 ∕𝑓 ⎦ ⎣ Damit eine Abbildung entsteht, muss das Matrixelement B verschwinden (siehe Übung 1-10), d. h. es muss gelten d 1 + d 2 (1 − d 1 ∕𝑓) = 0. Nach Division durch d 1 d 2 erhalten wir 1∕d 2 + 1∕d 1 − 1∕𝑓 = 0. Damit alle parallelen Strahlen auf denselben Punkt fokussiert werden, muss das Matrixelement A verschwinden (siehe Übung 1-10), es muss also 1 − d 2 ∕𝑓 = 0 oder d 2 = 𝑓 gelten.
⎡1 ⎢ 0 ⎣
d 2⎤ ⎡
1 − d ∕𝑛𝑓1 ⎥⎢ 1 −2∕𝑓1 + d ∕𝑛𝑓12 ⎦⎣
⎤ ⎡1 ⎥⎢ 1 − d ∕𝑛𝑓1 0 ⎦⎣ d ∕𝑛
d 1⎤
1
⎥. ⎦
Damit dieses System ein abbildendes System ist, muss das B-Element seiner Strahltransfermatrix verschwinden, B = d 1 (1 − d ∕𝑛𝑓1 ) + d ∕𝑛
] [ + d 2 d 1 (−2∕𝑓1 + d ∕𝑛𝑓12 ) + (1 − d ∕𝑛𝑓1 )
=0. Durch Gruppieren der zu d 1 , d 2 und d 1 d 2 proportionalen Terme erhalten wir (d 1 + d 2 )(1 − d ∕𝑛𝑓1 ) − d 1 d 2 (2∕𝑓0 − d ∕𝑛𝑓12 ) + d ∕𝑛 = 0 . (1) Mit den Definitionen d 2 1 − = 𝑓 𝑓1 𝑛𝑓12
(2)
Strahlenoptik
und ℎ=
Übung 1-15: Eine periodische Folge von Paaren unterschiedlicher Linsen
𝑓d 𝑛𝑓1
(3)
wird daraus (d 1 + d 2 ) (1 −
d d d ℎ )− 1 2 + =0. 𝑛 𝑓 𝑓
(4)
Wir drücken nun (4) durch 𝑧1 und 𝑧2 aus, indem wir d 1 = 𝑧1 − ℎ und d 2 = 𝑧2 − ℎ einsetzen. Das liefert 𝑧 𝑧 𝑧1 + 𝑧2 − 1 2 + 𝑏 = 0 𝑓
(5)
mit d ℎ ℎ2 ℎ2 − 2ℎ (1 − ) = + − 2ℎ 𝑏= − 𝑛 𝑛 𝑓 𝑓 𝑓 d ℎ = + ( ) (ℎ − 2𝑓) . 𝑛 𝑓
Hier ist das Grundelement aus zwei Teilsystemen aufgebaut, die jeweils aus einer Entfernung d im Vakuum gefolgt von einer Linse bestehen. Die Strahltransfermatrix des Grundelements ist daher das Produkt ⎡ 1 ⎢ −1∕𝑓2 ⎣
A=1−
d
𝑓1
,
D=−
d
+ (1 −
𝑓2
d
𝑓2
) (1 −
d
𝑓1
),
und daher ist 𝑏= (6)
Wir werden nun zeigen, dass 𝑏 = 0 gilt. In diesem Fall liefert (5) das gewünschte Ergebnis, 1∕𝑧1 + 1∕𝑧2 = 1∕𝑓. Um zu beweisen, dass 𝑏 = 0 gilt, verwenden wir (2) und (3) und schreiben 1∕𝑓 = (2𝑓 − ℎ)∕𝑓1 𝑓, woraus 2𝑓 − ℎ = 𝑓1 folgt. Wenn wir das in (6) einsetzen, erhalten wir 𝑏 = d ∕𝑛 − ℎ𝑓1 ∕𝑓. Nun verwenden wir (3) und schreiben d ∕𝑛 = ℎ𝑓1 ∕𝑓, wodurch wir wie gewünscht 𝑏 = ℎ𝑓1 ∕𝑓 − ℎ𝑓1 ∕𝑓 = 0 bekommen. b) Wir zeigen im Folgenden, dass ein Strahl, der in einer Höhe 𝑦1 parallel zur optischen Achse verläuft, unabhängig von 𝑦1 durch einen Punkt 𝐹2 in einer Entfernung 𝑓 − ℎ von der rechten Oberfläche der Linse verlaufen muss. Das kann leicht gezeigt werden, wenn man die Strahltransfermatrix des kombinierten Systems aus der dicken Linse [Teilsysteme 2, 3, 4 in a)] gefolgt von einer Entfernung 𝑓 − ℎ in Luft betrachtet. Dieses zusammengesetzte System hat die Strahltransfermatrix 𝑓 − ℎ⎤ ⎡ 1 − 𝑑∕𝑛𝑓1 ⎥⎢ 1 −2∕𝑓1 + d ∕𝑛𝑓12 ⎦⎣
⎤ ⎥. 1 − d ∕𝑓1 ⎦ d
Die Koeffizienten A und D dieses Produkts sind
d
⎡1 ⎢ 0 ⎣
⎤⎡ 1 ⎥⎢ 1 − d ∕𝑓2 −1∕𝑓1 ⎦⎣ d
⎤ ⎥ . (7) 1 − d ∕𝑛𝑓1 ⎦ 𝑑∕𝑛
Für A = 0 ist 𝑦2 = B𝜃1 , sodass für 𝜃1 = 0 (zur optischen Achse parallele Strahlen) 𝑦2 = 0 gilt, d. h. der Strahl verläuft durch den Punkt 𝐹2 . Wir bestimmen nun A = (1 − 𝑑∕𝑛𝑓1 ) + (𝑓 − ℎ)(−2∕𝑓1 + 𝑑∕𝑛𝑓12 ). Aus (2) folgt A = (1 − ℎ∕𝑓) + (𝑓 − ℎ)(−2 + ℎ∕𝑓)∕𝑓1 . Mithilfe der Beziehung 2𝑓 − ℎ = 𝑓1 wird daraus wie gewünscht A = (1 − ℎ∕𝑓) + (𝑓 − ℎ)∕(−𝑓) = 0.
(A + D) d d d2 =1− − + 2 𝑓1 𝑓2 2𝑓1 𝑓2 d
= 2 (1 −
2𝑓1
d
) (1 −
2𝑓2
)−1.
Die Bedingung |𝑏| ≤ 1 ist äquivalent zu −1 ≤ 𝑏 ≤ 1 oder 0 ≤ 𝑏 + 1 ≤ 2; das führt uns zu der gewünschten Bedingung 0 ≤ (1 −
d
2𝑓1
) (1 −
d
2𝑓2
)≤ 1.
Übung 1-16: Ein optischer Resonator
Der Resonator kann als eine periodische Kaskade von Spiegeln betrachtet werden. In einem Resonator der Länge d breitet sich ein Strahl über eine Entfernung d im Vakuum aus und wird vom ersten Spiegel reflektiert, dann breitet er sich wieder über dieselbe Entfernung im Vakuum aus und wird vom zweiten Spiegel reflektiert. Dieser Prozess wiederholt sich periodisch. Das Grundelement ist daher aus einer Kaskade zweier Subsysteme zusammengesetzt, die jeweils aus einer Ausbreitung im Vakuum gefolgt von der Reflexion an einem Spiegel bestehen. Die Bedingung für Stabilität kann bestimmt werden, indem man die Strahltransfermatrix des Grundelements wie in der vorherigen Übung angibt. Da ein Spiegel mit dem Krümmungsradius 𝑅 jedoch dieselbe Strahltransfermatrix wie eine Linse mit der Brennweite 𝑓 = −𝑅∕2 hat, können wir die in der vorherigen Übung für einen periodischen Satz von Paaren von Linsen bestimmte Stabilitätsbedingung direkt verwenden. Folglich erhalten wir 0 ≤ (1 +
d
𝑅1
) (1 +
d
𝑅2
)≤ 1.
991
992
Lösungen zu den Übungen
2
Bei 𝑧 = 0 ist 𝑞 = i𝑧0 , sodass aus (1) ) ( −𝑘 𝑥2 + 𝑦 2 𝐴0 exp [ 𝐴(r) = ] 2𝑧0 i𝑧0
Wellenoptik
Übung 2-1: Die Gültigkeit der Fresnelnäherung
Gegeben ist 𝜆 = 633 × 10−9 m und 𝑑 = 1 m. Die Fresnelnäherung gilt für 2 𝑁F 𝜃𝑚
4
folgt; entsprechend gilt für die Intensität ) ( 2 −𝑘 𝑥2 + 𝑦 2 𝐴0 2 |𝐴(r)| = ( ) exp [ ]. 𝑧0 𝑧0
≪1,
mit 𝑎2 𝑁F = 𝜆𝑑
𝑎 und 𝜃𝑚 = . 𝑑
Die Bedingung lautet daher 𝑎4 ∕4𝜆𝑑3 ≪ 1 oder 𝑎 ≪ (4𝜆𝑑3 )1∕4 = 0.04 m. Also muss der Radius 𝑎 viel kleiner sein als 4 cm. Für 𝑎 = 4 cm ist 𝑁F =
𝑎2 𝑎 = 2514 und 𝜃𝑚 = = 0.04 rad . 𝜆𝑑 𝑑
𝐴0 𝑘(𝑥2 + 𝑦 2 ) exp [−i ]. 𝑧 2𝑧
Übung 2-3: Durchgang durch ein Prisma Wir setzen d (𝑥, 𝑦) ≈ 𝛼𝑥 in Gl. (2.37) ein und erhalten
Übung 2-4: Bikonvexe Linse
(1)
𝜕𝐴 𝑘 = −i𝑥𝐴 . 𝑧 𝜕𝑥
t(𝑥, 𝑦) = t1 (𝑥, 𝑦) t2 (𝑥, 𝑦) ( ) ( ) i𝑘0 𝑥2 + 𝑦 2 i𝑘0 𝑥2 + 𝑦 2 = ℎ01 exp [ ] ℎ02 exp [ ] 2𝑓1 2𝑓2 mit 𝑓1 =
𝑘 𝑘 𝜕2𝐴 𝑘 𝜕𝐴 = −i (𝑥 + 𝐴) = −i (−i𝑥2 𝐴 + 𝐴) 𝑧 𝑧 𝑧 𝜕𝑥 𝜕𝑥2
𝑅1 𝑛−1
und 𝑓2 =
−𝑅2 ; 𝑛−1
ℎ01 und ℎ02 sind Konstanten. Daraus folgt ( ) i𝑘0 𝑥2 + 𝑦 2 t(𝑥, 𝑦) = ℎ0 exp [ ] 2𝑓
2
= −i𝐴
Das ist eine Gaußfunktion in 𝑥 und 𝑦, die ihr Maximum bei 𝑥 = 𝑦 √ = 0 hat und mit zunehmender radialer Koordinate 𝜌 = 𝑥2 + 𝑦 2 abnimmt. Sie erreicht 1∕e2 ihres Ma√ ximalwerts bei 𝜌 = 𝜆𝑧0 ∕π [siehe Gl. (3.11)].
direkt das gewünschte Ergebnis.
Übung 2-2: Die Parabolwelle und der Gaußstrahl
𝐴=
(4)
𝑘 𝑘 − ( ) 𝑥2 𝐴 . 𝑧 𝑧
Ähnlich gilt 2
𝑘 𝜕2𝐴 𝑘 = −i𝐴 − ( ) 𝑦 2 𝐴 , 𝑧 𝑧 𝜕𝑦 2
mit 1∕𝑓 = 1∕𝑓1 + 1∕𝑓2 = (𝑛 − 1)(1∕𝑅1 − 1∕𝑅2 ); ℎ0 = ℎ01 ℎ02 ist wieder eine Konstante. Dabei ist 𝑅2 negativ.
und daher ∇2t 𝐴 = −i2𝐴
2 ) 𝑘 𝑘 ( − ( ) 𝑥2 + 𝑦 2 𝐴 . 𝑧 𝑧
(2)
Nun schreiben wir ) ( −i𝑘 𝑥2 + 𝑦 2 ) 𝐴0 i𝑘 ( 2 𝐴0 𝜕𝐴 [ 𝑥 + 𝑦2 ] = − 2 exp [ ]+ 2𝑧 𝑧 2𝑧2 𝜕𝑧 𝑧 ( ) −i𝑘 𝑥2 + 𝑦 2 × exp [ ] 2𝑧 ) −𝐴 i𝑘 ( = (3) + 2 𝑥2 + 𝑦 2 𝐴 . 𝑧 2𝑧 Wenn wir nun aus (2) und (3) substituieren, erkennen wir, dass ∇2t 𝐴 − i2𝑘𝜕𝐴∕𝜕𝑧 = 0 ist, d. h. dass (1) die Helmholtzgleichung erfüllt. Substitution von 𝑞 = 𝑧 + i𝑧0 in (1) ändert nichts an der Gültigkeit der Helmholtzgleichung, da i𝑧0 eine Konstante ist: 𝜕∕𝜕𝑞 = 𝜕∕𝜕𝑧 .
Übung 2-5: Fokussierung einer ebenen Welle durch eine dünne Linse
Es gilt 𝑈1 (𝑥, 𝑦) = exp (−i𝑘𝑧) und t(𝑥, 𝑦) = ℎ0 exp [i𝑘
𝑥2 + 𝑦 2 ]. 2𝑓
Folglich ist 𝑈2 (𝑥, 𝑦) = 𝑈1 (𝑥, 𝑦)t(𝑥, 𝑦) = ℎ0 exp {−i𝑘 [𝑧 −
𝑥2 + 𝑦 2 ]} . 2𝑓
Die Wellenfronten dieser Welle sind Rotationsparaboloide mit dem Krümmungsradius −𝑓, die durch 𝑧 − (𝑥2 + 𝑦 2 )∕2𝑓 = konst. definiert sind, d. h. sie entsprechen näherungsweise einer Kugelwelle, die auf einen Punkt in einer Entfernung 𝑓 rechts von der Linse fokussiert ist.
Wellenoptik
Wenn die einfallende Welle eine ebene Welle unter einem kleinen Winkel 𝜃 ist, 𝑈1 (𝑥, 𝑦) ≈ exp [−i𝑘(𝑧 + 𝜃𝑥)], dann ist 𝑈2 (𝑥, 𝑦) = 𝑈1 (𝑥, 𝑦) t(𝑥, 𝑦) ≈ ℎ0 exp {−i𝑘 [𝑧 + 𝜃𝑥 −
𝑥2 + 𝑦 2 ]} 2𝑓
∑ werden: t(𝑥) = 𝑞 𝐶𝑞 exp(−i𝑞2π𝑥∕𝛬), wobei die 𝐶𝑞 die Fourierkoeffizienten sind. Wenn die einfallende Welle eine ebene Welle unter einem kleinen Winkel 𝜃𝑖 ist, d. h. 𝑈1 (𝑥) = exp[−i𝑘0 (𝑧 + 𝜃𝑖 𝑥)], hat die transmittierte Welle die Amplitude 𝑈2 (𝑥) = t(𝑥)𝑈(𝑥) = exp [−i (𝑘0 𝑧 + 𝑘0 𝜃𝑖 𝑥 + [ )] ( = exp −i𝑘0 𝑧 + 𝜃𝑞 𝑥
𝑥2 − 2𝑓𝜃𝑥 + 𝑦 2 = ℎ0 exp {−i𝑘 [𝑧 − ]} 2𝑓 2
= ℎ0 exp {−i𝑘 [𝑧 −
(𝑥 − 𝑓𝜃) + 𝑦 2 ]} . 2𝑓
Das ist eine Parabolwelle um den Punkt (𝑓𝜃, 0, 𝑓), wie die Abbildung illustriert.
θ
fθ
mit 𝜃𝑞 = 𝜃𝑖 + 𝑞 2π∕𝑘0 𝛬 = 𝜃𝑖 + 𝑞𝜆∕𝛬. Die transmittierte Welle ist also aus ebenen Wellen unter den Winkeln 𝜃𝑞 zusammengesetzt. Übung 2-8: Gradientenindexlinse
Wir setzen 𝑛 = 𝑛0 [1 − 𝛼2 (𝑥2 + 𝑦 2 )∕2] in Gl. (2.45) ein; das ergibt t = exp(−i𝑛𝑘0 d 0 ) = ℎ0 exp [i𝑛0 𝛼2 𝑘0 d 0
f
= ℎ0 exp [i𝑘0 Übung 2-6: Die Abbildungseigenschaften einer Linse
Wir wählen ein Koordinatensystem mit 𝑧 = 0 am Ort der Linse. Die einfallende Welle ist eine Kugelwelle um 𝑧 = −𝑧1 , d. h. 𝑈1 (𝑥, 𝑦) ≈ exp[−i𝑘(𝑥2 + 𝑦 2 )∕2𝑧1 ]. Folglich ist 𝑈2 (𝑥, 𝑦) ≈ exp [−i𝑘
𝑥2 + 𝑦 2 𝑥2 + 𝑦 2 ] ] exp [i𝑘 2𝑧1 2𝑓
𝑥2 + 𝑦 2 ≈ exp [i𝑘 ] 2𝑧2 mit 1 1 1 = − 𝑧2 𝑧 𝑓 1
oder
𝑞 2π 𝑥 )] 𝛬
1 1 1 + = . 𝑧1 𝑧2 𝑓
Die transmittierte Welle ist daher eine Kugelwelle um den Punkt 𝑧 = 𝑧2 .
𝑥2 + 𝑦 2 ] 2
𝑥2 + 𝑦 2 ] 2𝑓
mit ℎ0 = exp(−i𝑛0 𝑘0 d 0 ), wobei 𝑓∕2 = 𝑛0 𝛼2 d 0 ∕2 oder 𝑓 = 1∕𝑛0 𝛼2 d 0 ist. Das ist die Amplitudentransmission einer Linse der Brennweite 𝑓. Übung 2-9: Interferenz einer ebenen und einer Kugelwelle √
Es gilt 𝐼 = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos 𝜑 mit 𝐼1 = |𝐴1 |2 , 𝐼2 = |𝐴2 |2 2 2 und 𝜑 = 𝑘(𝑥2 + 𝑦 2 )∕2𝑧 √ = π(𝑥 + 𝑦2 )∕𝜆2d . Daher folgt 𝐼(𝑥, 𝑦, d ) = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos[π(𝑥 + 𝑦 )∕𝜆 d ]. Die Gebiete mit konstantem 𝐼 sind Kreise: 𝑥2 + 𝑦 2 = konstant. Die Funktion cos(π𝑥2 ) ist in Tabelle A.1 aufgetragen. Sie ist eine sinusförmige Funktion, die so genannte Chirpfunktion, deren Frequenz mit steigendem 𝑥 zunimmt. Das erklärt, warum die Ringe im Interferenzmuster mit steigendem 𝑥2 + 𝑦 2 immer dichter liegen.
Übung 2-7: Durchgang durch ein Beugungsgitter
a)
Übung 2-10: Interferenz zweier Kugelwellen d0
2π𝑥 ], [1 + cos 𝑑(𝑥) = 2 𝛬 t(𝑥) = exp (−i𝑘0 d 0 ) exp [−i (𝑛 − 1) 𝑘0 d (𝑥)] = ℎ0 exp [−i (𝑛 − 1) (
𝑘0 𝑑0 2π𝑥 ) cos ( )] 2 𝛬
mit ℎ0 = exp [−i(𝑛 + 1) (
𝑘0 𝑑0 )] . 2
b) Da t(𝑥) eine periodische Funktion von 𝑥 mit der Periode 𝛬 ist, kann sie in eine Fourierreihe entwickelt
𝑈1 =
(𝑥 − 𝑎)2 + 𝑦 2 𝐴 exp{−i𝑘𝑧} exp {−i𝑘 }, 𝑧 2𝑧
𝑈2 =
(𝑥 + 𝑎)2 + 𝑦 2 𝐴 exp{−i𝑘𝑧} exp {−i𝑘 }. 𝑧 2𝑧
Bei 𝑧 = d ist 𝐼 = 2𝐼0 + 2𝐼0 cos 𝜑 mit 𝐼0 = |𝐴∕d |2 und ] 𝑘 [ 𝜑= (𝑥 + 𝑎)2 + 𝑦 2 − (𝑥 − 𝑎)2 + 𝑦 2 2d 4π 𝑎𝑥 π 4𝑎𝑥 = . = 𝜆d 𝜆d Daher ist 𝐼 = 2𝐼0 [1 + cos(2π 𝑥𝜃∕𝜆)] mit 𝜃 = 2𝑎∕d .
993
994
Lösungen zu den Übungen
Übung 2-11: Braggreflexion
Die Phasendifferenz zwischen zwei Reflexionen ist 𝜑 = 𝑘(𝛬2 − 𝛬1 ). Außerdem gilt 𝛬2 = 𝛬∕ sin 𝜃 und 𝛬1 = 𝛬2 cos 2𝜃 = 𝛬 cos 2𝜃∕ sin 𝜃. Daher ist 𝛬 𝛬 2 (1 − cos 2𝜃) = 𝑘 2 sin 𝜃 = 𝑘(2𝛬 sin 𝜃) . sin 𝜃 sin 𝜃 Für 𝜑 = 2π ist 𝑘𝛬 sin 𝜃 = π oder 2𝛬 sin 𝜃∕𝜆 = 1, d. h. sin 𝜃 = 𝜆∕2𝛬. 𝜑=𝑘
Übung 3-2: Gültigkeit der paraxialen Näherung für einen Gaußstrahl
Die Bedingung Gl. (2.25) lautet 𝜕𝐴∕𝜕𝑧 ≪ 𝑘𝐴. Nach Gl. (3.4) ist ferner 𝐴 = (𝐴1 ∕𝑞) exp(−i𝑘𝜌2 ∕2𝑞) mit 𝑞 = 𝑧 + i𝑧0 . Folglich ist 𝐴 −i𝑘𝜌2 𝜕𝐴 = − ( 21 ) 𝑞′ exp [ ] 2𝑞 𝜕𝑧 𝑞 +( =−
Λ1 θ θ Λ
Λ2 θ
θ
Übung 2-12: Optisches Dopplerradar
a) Die beiden Wellen haben eine Phasenverschiebung 𝜑 = 2π 𝜈1 𝑡 − 2π 𝜈2 𝑡 = 2π (𝜈1 − 𝜈2 )𝑡 = 2π (2v ∕𝑐)𝜈𝑡. Die √ Intensität ihrer Superposition ist 𝐼 = 𝐼1 + 𝐼2 + 2 𝐼1 𝐼2 cos[2π(2v ∕𝑐)𝜈𝑡]. Das ist eine sinusförmige Funktion der Zeit mit der Frequenz 2(v ∕𝑐)𝜈. Die Geschwindigkeit v kann beobachtet werden, indem man 𝐼 als Funktion der Zeit beobachtet. b) 𝜑 = 𝑘(𝑧2 − 𝑧1 ) = 𝑘(2v 𝑡) = 2π(𝜈∕𝑐)2v 𝑡 = 4π(v ∕𝑐)𝜈𝑡.
3
Optik von Strahlbündeln
Übung 3-1: Parameter eines gaußschen Laserstrahls Gegeben: 𝜆 = 633 nm = 633 × 10−9 m; P = 10−3 W; 𝑊0 =
0.05 × 10−3 m.
1) 𝜃0 = 𝜆∕(π 𝑊0 ) = 4.03 × 10−3 rad = 4.03 mrad; 𝑧0 = 𝑊0 ∕𝜃0 = 0.012 m. Schärfentiefe = 2𝑧0 = 0.025 m = 2.5 cm. √ Bei 𝑧 = 3.5 × 105 km = 3.5 × 108 m ist 𝑊(𝑧) = 𝑊0 1 + (𝑧∕𝑧0 )2 = 1.41 × 106 m (Durchmesser = 2821 km). 2) Bei 𝑧 = 0 ist 𝑅 = ∞, bei 𝑧 = 𝑧0 ist 𝑅 = 2𝑧0 = 2.5 cm, bei 𝑧 = 2𝑧0 ist 𝑅 = 𝑧[1 + (𝑧0 ∕𝑧)2 ] = 0.031 m = 3.1 cm. 3) Im Strahlzentrum ist 𝐼 = 𝐼0 = 2P ∕π 𝑊02 = 2.546 × 105 W∕m2 = 25.46 W∕cm2 . Auf der Strahlachse bei 𝑧 = 𝑧0 ist 𝐼 = 𝐼0 [𝑊0 ∕ 𝑊(𝑧0 )]2 = 𝐼0 ∕2 = 12.73 W∕cm2 . Eine Kugelwelle der Leistung P = 100 W bei 𝑧 = 𝑧0 = 2.5 cm hat die Intensität 𝐼 = P ∕(4π 𝑧2 ) = 5.169 × 104 = 5.169 W∕cm2 .
−i𝑘𝜌2 𝐴1 i𝑘𝜌2 𝑞′ exp )[ ] ] [ 𝑞 2𝑞 2𝑞2
𝑞′ 𝐴 i𝑘𝜌2 𝑞′ + 𝐴[ ] 𝑞 2𝑞2
mit 𝑞′ = 𝜕𝑞∕𝜕𝑧 = 1. Die Bedingung 𝜕𝐴∕𝜕𝑧 ≪ 𝑘𝐴 ist daher äquivalent zu −𝐴∕𝑞 + [i𝑘𝜌2 ∕2𝑞2 ]𝐴 ≪ 𝑘𝐴 oder −1∕𝑘𝑞 + [i𝜌2 ∕2𝑞2 ] ≪ 1. Mit der Substitution 1∕𝑞 = 1∕𝑅 − i2∕𝑘𝑊 2 erhalten wir ( 2 ) 𝜌 ∕𝑊 2 2𝜌2 𝜌2 2 1 [1+ 2 ]+i[− ( 2 2 )(1+ 2 )+ ]≪ 1. 𝑘𝑅 𝑊 𝑘 𝑊 𝑊 (2𝑅2 ∕𝑊 2 ) Wenn wir annehmen, dass 𝜌 nicht viel größer ist als 𝑊, d. h. dass wir Punkte nicht weit außerhalb des Strahls betrachten, ist diese Bedingung erfüllt, sofern die folgenden Voraussetzungen zutreffen: a) 𝑘𝑅 ≫ 1, b) 𝑘𝑊 ≫ 1, und c) 𝑅 ≫ 𝑊. Bedingung a) bedeutet, dass der Krümmungsradius 𝑅 ≫ 𝜆 ist. Weil der minimale Krümmungsradius 𝑧0 ist, ist diese Bedingung erfüllt, sofern 𝑧0 ≫ 𝜆 gilt. Ähnlich ist Bedingung b) erfüllt, wenn 𝑊0 ≫ 𝜆 oder 𝜃0 = 𝜆∕(π 𝑊0 ) ≪ 1 ist. Wir zeigen nun noch, dass für 𝜃0 ≪ 1 auch Bedingung c) erfüllt ist. Für √ kleine 𝑧 ist 𝑅 ≫ 𝑊0 . Für 𝑧 = 𝑧0 ist 𝑅 = 𝑧0 ≫ 𝑊 = 2𝑊0 , weil 𝜃0 = 𝑊0 ∕𝑧0 ≪ 1 gilt. Für große 𝑧 ist 𝑅 ≈ 𝑧 und 𝑊 = 𝜃0 𝑧, sodass 𝑅∕𝑊 = 1∕𝜃0 ≫ 1 ist. Zusammengefasst heißt das, dass die Bedingungen 𝑧0 ≫ 𝜆, 𝑊0 ≫ 𝜆 und 𝜃0 ≪ 1 sicherstellen, dass 𝜕𝐴∕𝜕𝑧 ≪ 𝑘𝐴 erfüllt ist und daher die paraxiale Näherung gilt. Übung 3-3: Charakterisierung eines Strahls durch Strahlradius und Krümmung
Wir verwenden 2
𝑊 2 = 𝑊02 [1 + (
𝑧 )] 𝑧0
(1)
und 𝑅 = 𝑧 [1 + (
𝑧0 2 )] 𝑧
(2)
und erhalten so 𝑊 2 ∕𝑅 = (𝑧∕𝑧0 )𝑊02 ∕𝑧0 = (𝑧∕𝑧0 )(𝜆∕π) und daraus (𝑧∕𝑧0 ) = (π∕𝜆)𝑊 2 ∕𝑅 .
(3)
Wenn wir (3) in (1) und (2) einsetzen, erhalten wir die Gln. (3.26) und (3.25).
Optik von Strahlbündeln
Daraus folgt
Übung 3-4: Bestimmung von Radius und Krümmung aus Werten an einem anderen Punkt −6
Gegeben: 𝜆 = 10 m; am Ort 1 ist 𝑅1 = 1 m und 𝑊1 = 10−3 m. Zu bestimmen sind 𝑅2 und 𝑊2 am Ort 2, 𝑧2 = 𝑧1 + d , mit d = 0.1 m. Wir verwenden hierzu die Beziehungen 𝑞2 = 𝑞1 + d , 1 1 𝜆 = −i , 𝑞1 𝑅1 π 𝑊12 1 1 𝜆 = −i . 𝑞2 𝑅2 π 𝑊22 Daraus folgt 1∕𝑞1 = 1 − i0.32 und 𝑞1 = 0.91 + i0.29. Somit ist 𝑞2 = 1.01 + i0.29 und 1∕𝑞2 = 0.92 − i0.26 und daher 𝑅2 = 1∕0.92 = 1.09 m und 𝜆∕π 𝑊22 = 0.26, woraus 𝑊2 = 1.11 × 10−3 m = 1.11 mm folgt. Übung 3-5: Charakterisierung eines Strahls durch seine Krümmung an zwei Punkten Aus Gl. (3.9) und der Beziehung 𝑧2 = 𝑧1 + d erhalten wir
𝑅1 = 𝑧1 [1 + (𝑧0 ∕𝑧1 )2 ]; daraus folgt 𝑧12 − 𝑅1 𝑧1 + 𝑧02 = 0 .
(1)
Wir erhalten weiter 𝑅2 = (𝑧1 + d ){1 + [𝑧0 ∕(𝑧1 + d )]2 } und daraus (𝑧1 + d )2 − 𝑅2 (𝑧1 + d )2 + 𝑧02 = 0 .
(2)
Die Gleichungen (1) und (2) sind zwei Gleichungen in den beiden Unbekannten 𝑧0 und 𝑧1 . Sie können umgeformt werden, um die Gln. (3.27) und (3.28) zu erhalten. Übung 3-6: Führung von Strahlbündeln
Wir betrachten eine Linse und setzen 𝑧 = 𝑧′ = d ∕2 in Gl. (3.36) ein; das ergibt 𝑀 = 1. Aus Gl. (3.39a) folgt dann 𝑟 = 𝑧0 ∕(d ∕2 − 𝑓) und 𝑀𝑟 = |𝑓∕ (d ∕2 − 𝑓) |. Wir setzen 𝑀 = 1 in Gl. (3.39) ein und erhalten 𝑀𝑟2 = 1 + 𝑟 2 , sodass 𝑓 2 ∕(d ∕2 − 𝑓)2 = 1 + [𝑧0 ∕(d ∕2 − 𝑓)]2 ist; daraus folgt 𝑓 2 = (d ∕2 − 𝑓)2 + 𝑧02 oder 𝑧02 = 𝑓 2 − (d ∕2 − 𝑓)2 = 𝑓 d − (d ∕2)2 , d. h. 𝑧02 = d (𝑓 − d ∕4). Da 𝑧0 reell ist, kann diese Gleichung nur für 𝑓 ≥ d ∕4 oder d ≤ 4𝑓 erfüllt sein. Übung 3-7: Kollimation eines Strahlbündels
a) Wir setzen die Gln. (3.39) und (3.39a) in Gl. (3.36) ein, (𝑧′ − 𝑓) = =
(𝑧 − 𝑓)[𝑓∕(𝑧 − 𝑓)]2 1 + 𝑧02 ∕(𝑧 − 𝑓)2 (𝑧 − 𝑓)𝑓 2 (𝑧 − 𝑓)2 + 𝑧02
.
𝑧∕𝑓 − 1 𝑧′ . (1) −1= 𝑓 (𝑧∕𝑓 − 1)2 + (𝑧0 ∕𝑓)2 b) Wir setzen 𝑎 = 𝑧0 ∕𝑓, 𝑥 = 𝑧∕𝑓 − 1 und 𝑦 = 𝑧′ ∕𝑓 − 1. Dann wird (1) zu 𝑦 = 𝑥∕[𝑥2 + 𝑎2 ]. Für einen festen Wert von 𝑎 und unterschiedliche 𝑥 ist 𝑦 maximal, wenn d𝑦 1 2𝑥2 =0 = 2 − 2 d𝑥 [𝑥 + 𝑎 ] [𝑥2 + 𝑎2 ]2 gilt. Diese Bedingung ist für [𝑥2 + 𝑎2 ] = 2𝑥2 oder 𝑥 = 𝑎 erfüllt, d. h. für 𝑧∕𝑓 − 1 = 𝑧0 ∕𝑓 oder 𝑧 = 𝑓 + 𝑧0 . c) 𝑧0 = 1 cm, 𝑓 = 50 cm, 𝑎 = 𝑧0 ∕𝑓 = 0.02. Optimum: 𝑧 = 𝑓 + 𝑧0 = 51 cm Entfernung 𝑧′ : 𝑥 = 𝑧∕𝑓 − 1 = 51∕50 − 1 = 0.02 = 𝑎 𝑦 = 𝑥∕[𝑥2 + 𝑎2 ] = 1∕2𝑥 = 25 aber 𝑦 = 𝑧′ ∕𝑓 − 1 folglich ist 𝑧′ = 𝑓(1 + 𝑦) = 50 × 26 = 1300 cm. Vergrößerung: 𝑀𝑟 = 𝑓∕(𝑧 − 𝑓) = 1∕𝑥 = 50 𝑟 = 𝑧0 ∕(𝑧 −√𝑓) = 𝑎∕𝑥 = 1 √ 𝑀 √ = 𝑀𝑟 ∕ 1 + 𝑟 2 = 𝑀𝑟 ∕ 2 = 50∕ 2 = 35.4 Breite: 𝑊0′ = 𝑀𝑊0 = 35.4𝑊0 √ 𝑊0 = 𝜆𝑧0 ∕π ≈ 56 μm 𝑊0′ ≈ 2 mm Übung 3-8: Aufweitung eines Strahlbündels
Abbildung an der ersten Linse: Da 𝑧 ≫ 𝑓1 und 𝑧 − 𝑓1 ≫ 𝑧0 ist, erhalten wir mithilfe der Gln. (3.41) und (3.42) 𝑓1 𝑓 𝑀1 = ≈ 1, 𝑧 (𝑧 − 𝑓1 ) 𝑊0′′ = [
𝑓1 𝑓1 𝑊 , ] 𝑊0 ≈ 𝑧 0 (𝑧 − 𝑓1 ) 2
𝑧0′′ = 𝑀12 𝑧0 ≈ (
𝑓1 ) 𝑧0 , 𝑧
𝑧1 ≈ 𝑓1 . Abbildung an der zweiten Linse: Nach den Ergebnissen von Übung 3-7 ist die optimale Entfernung 𝑧2 = 𝑧0′′ + 𝑓2 und daher ist d = 𝑧1 + 𝑧2 = 𝑧1 + 𝑧0′′ + 𝑓2 ≈ 𝑓1 + (𝑓1 ∕𝑧)2 𝑧0 + 𝑓2 .
Die Vergrößerung in dieser optimalen Entfernung ist 𝑓2 𝑓2 𝑓2 1 𝑀2 = √ [ ]= √ = √ . ′′ 2 𝑧 − 𝑓 2 2 2 𝑧 2 𝑀 𝑧 2 0
1 0
Die gesamte Vergrößerung des Systems ist 𝑓2 𝑓2 𝑧 . 𝑀 = 𝑀2 𝑀1 = √ = √ 𝑓1 2𝑧 𝑀𝑧 2 1 0
0
Das ist eine starke Vergrößerung, da 𝑓2 ≫ 𝑓1 und 𝑧 ≫ 𝑧0 ist.
995
996
Lösungen zu den Übungen
An der Strahltaille gilt für die Hermite-Gauß-Strahlen (√ ) (√ ) 𝐼1,0 = |𝐴1,0 |2 𝔾21 2𝑥∕𝑊0 𝔾20 2𝑦∕𝑊0 , (√ ) (√ ) 𝐼0,1 = |𝐴0,1 |2 𝔾20 2𝑥∕𝑊0 𝔾21 2𝑦∕𝑊0 ,
Übung 3-9: Spiegel mit variablem Reflexionsgrad
Der komplexe Amplitudenreflexionsgrad des Spiegels ist 2 ). Bei der Reflexion nimmt exp(−i𝑘𝜌2 ∕𝑅) exp(−𝜌2 ∕𝑊𝑚 die Phase eines Gaußstrahls daher um −𝑘𝜌2 ∕𝑅 zu, sodass der Krümmungsradius 𝑅2 wird, wobei 1∕𝑅2 = 1∕𝑅1 + 2∕𝑅 ist. Außerdem wird die Amplitude des Strahls mit dem 2 Faktor exp(−𝜌2 ∕𝑊𝑚 ) multipliziert und wird damit 2 2 exp(−𝜌 ∕𝑊2 ) mit 1∕𝑊2 = 1∕𝑊1 + 1∕𝑊𝑚 . Der reflektierte Strahl bleibt gaußsch und hat die Breite 𝑊2 und den Krümmungsradius 𝑅2 , die durch die genannten Gleichungen gegeben sind. Übung 3-10: Durchgang eines Gaußstrahls durch eine transparente Platte Aus Gl. (1.50) folgt für die Elemente der ABCD-Matrix der Platte: A = 1, B = d ∕𝑛, C = 0 und D = 1. Daher ist 𝑞2 = (A𝑞1 + B)∕(C 𝑞1 + D) = 𝑞1 + d ∕𝑛, woraus 𝑧2 + i𝑧02 = 𝑧1 + i𝑧02 + d ∕𝑛 folgt, d. h. 𝑧02 = 𝑧01 und 𝑧2 = 𝑧1 + d ∕𝑛. Daraus
folgt, dass der transmittierte Strahl dieselbe Schärfentiefe besitzt und sein Zentrum um eine Entfernung d ∕𝑛 versetzt ist, wie die Abbildung illustriert.
wobei 𝔾20 (𝑢) = exp(−𝑢2 ) und 𝔾21 (𝑢) = 4𝑢2 exp(−𝑢2 ) ist. Ohne Interferenz und für |𝐴1,0 |2 = |𝐴0,1 |2 = 𝐼0 ist die Gesamtintensität die Summe der einzelnen Intensitäten, 𝐼 = 8𝐼0 [ = 8𝐼0 [
𝑥2 + 𝑦 2 𝜌
𝑊02 2
] exp [−2
] exp [− 2
𝑊0
2𝜌2 𝑊02
𝑥2 + 𝑦 2 𝑊02
]
]
mit 𝜌2 = 𝑥2 + 𝑦 2 . Die Maximalintensität tritt bei dem Wert √ von 𝜌 auf, für den d𝐼∕ d𝜌 = 0 ist, d. h. bei 𝜌 = 𝑊0 ∕ 2 oder 𝜌 𝑊0 ≈ 0.707. Bei 𝜌 = 0 ist die Intensität null, wie die Abbildung √ 2 zeigt, und die 1∕e √ -Stellen liegen bei 𝜌 ≈ (0.23∕ 2)𝑊0 und 𝜌 ≈ (2.12∕ 2)𝑊0 . Da der Strahl rotationssymmetrisch ist, nimmt er eine „Donut“- oder Torusform an und wird aus diesem Grund auch oft als Torusstrahl bezeichnet. 1.0
0.8
n
I / Imax 0.6
0.4
0.2
0.0
n
4
0
1
2
ρ /W0
3
Fourieroptik
Übung 4-1: Binäre Platte als Zylinderlinse Übung 3-11: Der Laguerre-Gauß-Strahl als Superposition von Hermite-Gauß-Strahlen
Der Laguerre-Gauß-Strahl LG10 ist identisch zu der Superposition 2−1∕2 (HG01 + iHG10 ) von Hermite-GaußStrahlen, wie das Absolutquadrat von Gl. (3.70) zeigt [siehe auch die Illustration in Abb. 3.24(a)].
In der Umgebung von 𝑥 ist die Funktion cos(π 𝑥2 ∕𝜆𝑓) näherungsweise eine harmonische Funktion mit der lokalen Frequenz 𝜈𝑥 = (1∕2π)(𝜕∕𝜕𝑥)(π 𝑥2 ∕𝜆𝑓) = 𝑥∕𝜆𝑓. Ihre gleichgerichtete Version 𝑓(𝑥) = 𝒰[cos(π 𝑥2 ∕𝜆𝑓)] ist in der Umgebung von 𝑥 näherungsweise eine periodische Funktion mit der lokalen Periode 𝜆𝑓∕𝑥. In der Umgebung von 𝑥 kann die periodische Funktion 𝑓(𝑥) als Summe von harmonischen Funktionen mit den Frequenzen 𝑞𝑥∕𝜆𝑓 mit 𝑞 = 0, ±1, ±2 geschrieben werden.
Fourieroptik
Eine solche Struktur wirkt als Beugungsgitter, das das Licht um die Winkel 𝜆(𝑞𝑥∕𝜆𝑓) = 𝑥∕(𝑓∕𝑞) ablenkt. Alle Strahlen, die um einen Winkel 𝑥∕(𝑓∕𝑞) abgelenkt werden, treffen sich in einem Punkt 𝑓∕𝑞. Die Folie wirkt somit als Zylinderlinse mit den Brennweiten ∞, ±𝑓, ±𝑓∕3, ±𝑓∕5 . . . Übung 4-2: Ein neuer Blick auf Gaußstrahlen
Gegeben ist: 𝑈(𝑥, 𝑦, 0) = 𝑓(𝑥, 𝑦) = 𝐴 exp[−(𝑥2 + 𝑦 2 )∕ 𝑊02 ] in der Eingangsebene (𝑧 = 0). Zu bestimmen ist 𝑈(𝑥, 𝑦, 𝑧) = 𝑔(𝑥, 𝑦) in einer Entfernung 𝑧. Wir arbeiten dazu im Fourierraum. Die Fouriertransformierte von 𝑓(𝑥, 𝑦) erhalten wir aus der Tatsache, dass die Fouriertransformierte von exp(−π 𝑡2 ) gleich exp(−π 𝜈2 ) ist (siehe Tabelle A.1), und indem wir die Skalierungseigenschaft der Fouriertransformation (siehe Anhang A) ausnutzen. Das ergibt [ ( )] 𝐹(𝜈𝑥 , 𝜈𝑦 ) = 𝐴π 𝑊02 exp −π2 𝑊02 𝜈𝑥2 + 𝜈𝑦2 ,
[ ( )] 𝐺(𝜈𝑥 , 𝜈𝑦 ) = 𝐴π 𝑊02 exp −π2 𝑊02 𝜈𝑥2 + 𝜈𝑦2 , ( )] [ = 𝐵 exp −π2 𝑄2 𝜈𝑥2 + 𝜈𝑦2 , mit 𝐵 = 𝐴π 𝑊02 exp (−i𝑘𝑧) , π2 𝑄2 = π2 𝑊02 − iπ 𝜆𝑧 . Die inverse Fouriertransformierte ist 𝑔(𝑥, 𝑦) = (𝐵∕π 𝑄 ) exp[−(𝑥2 + 𝑦 2 )∕𝑄2 ]. Wir definieren 1∕𝑄2 = i𝑘∕2𝑞 = iπ∕𝜆𝑞 und schreiben 2
𝑥2 + 𝑦 2 i ) exp [−𝑘 ] 2𝑞 𝜆𝑞
= 𝐴(
𝜆𝑞
) exp (−i𝑘𝑧) exp [−𝑘
𝑥2 + 𝑦 2 ]. 2𝑞
Dabei ist 𝑞 = (iπ∕𝜆)𝑄2 = (i∕π𝜆)(π2 𝑊02 − iπ 𝜆𝑧) = iπ𝑊02 ∕ 𝜆 + 𝑧 = 𝑧 + i𝑧0 mit 𝑧0 = π 𝑊02 ∕𝜆. Durch Einsetzen erhalten wir 𝑔(𝑥, 𝑦) = 𝐴 (
Durch Analyse der Gln. (A.26) und (A.27) aus Anhang A erkennen wir, dass wenn 𝐹(𝜈𝑥 , 𝜈𝑦 ) die Fouriertransformierte von 𝑓(𝑥, 𝑦) ist, 𝐹(−𝜈𝑥 , −𝜈𝑦 ) die inverse Fouriertransformierte von 𝑓(𝑥, 𝑦) ist. Eine Inversion des Koordinatensystems ersetzt also die Fouriertransformation durch die inverse Fouriertransformation.
Aus Tabelle A.1 erhalten wir unter Verwendung der Skalierungseigenschaft der Fouriertransformation die Fouriertransformierte der Blendenfunktion 𝑝(𝑥, 𝑦) = rect(𝑥∕𝐷𝑥 ) rect(𝑦∕𝐷𝑦 ) in der Form 𝑃(𝜈𝑥 , 𝜈𝑦 ) = 𝐷𝑥 𝐷𝑦 sinc(𝐷𝑥 𝜈𝑥 ) × sinc(𝐷𝑦 𝑦). Wenn wir das in Gl. (4.38) einsetzen, erhalten wir Gl. (4.39). Die erste Nullstelle der Funktion sinc(⋅) tritt auf, wenn das Argument gleich ±1 ist, d. h. für 𝑥 = ±𝜆 d ∕𝐷𝑥 und 𝑦 = ±𝜆 d ∕𝐷𝑦 .
H0 = exp (−i𝑘𝑧) ,
iπ 𝑊02
Übung 4-4: Die inverse Fouriertransformation
Übung 4-5: Fraunhoferbeugung an einer rechteckigen Öffnung
𝐺(𝜈𝑥 , 𝜈𝑦 ) = 𝐹(𝜈𝑥 , 𝜈𝑦 )H(𝜈𝑥 , 𝜈𝑦 ) , [ ( )] H(𝜈𝑥 , 𝜈𝑦 ) = H0 exp iπ 𝜆𝑧 𝜈𝑥2 + 𝜈𝑦2 ,
𝑔(𝑥, 𝑦) = 𝐵 (
Die Bedingung für die Fresnelnäherung ist nach 2 Gl. (4.18) 𝑁F 𝜃𝑚 ∕4 ≪ 1 mit 𝑁F = 𝑎2 ∕𝜆𝑑 und 𝜃𝑚 = 𝑎∕d , 4 3 sodass 𝑎 ∕4𝜆 d ≪ 1 oder d ≫ (𝑎4 ∕4𝜆)1∕3 = 0.43 m gilt. Die Bedingung für die Fraunhofernäherung ist nach Gl. (4.23) 𝑁F ≪ 1 bzw. 𝑎2 ∕𝜆 d ≪ 1 oder d ≫ 𝑎2 ∕𝜆 = 800 m sowie 𝑁F′ ≪ 1 bzw. 𝑏2 ∕𝜆 d ≪ 1 oder d ≫ 𝑏2 ∕𝜆 = 200 m. In diesem Fall ist die Fresnelnäherung also in Entfernungen viel größer als 43 cm anwendbar und die Fraunhofernäherung in Entfernungen viel größer als 800 m.
i𝑧0 𝑥2 + 𝑦 2 ) exp(−i𝑘𝑧) exp [−𝑘 ] 𝑞 2𝑞
mit 𝑞 = 𝑧 + i𝑧0 . Das ist die Gleichung eines Gaußstrahls. Übung 4-3: Die Gültigkeit von Fresnel- und Fraunhofernäherung: Ein Vergleich
Gegeben: 𝜆 = 0.5 μm = 0.5 × 10−6 m, 𝑎 = 2 × 10−2 m, 𝑏 = 10−2 m.
Übung 4-6: Fraunhoferbeugung an einer kreisförmigen Öffnung
Mithilfe von Gl. (A.30) erhalten wir für die Fouriertransformierte einer Blendenfunktion in Form eines Kreis mit Radius 1 𝑃(𝜈𝑥 , 𝜈𝑦 ) = 𝐽1 (2π 𝜈𝜌 )∕𝜈𝜌 . Für einen Radius 𝐷∕2 ist entsprechend 2 𝐷 𝐽1 (2π 𝜈𝜌 𝐷∕2) 𝐷 𝐽1 (π 𝜈𝜌 𝐷) 𝑃(𝜈𝑥 , 𝜈𝑦 ) = ( ) . =( ) 2 2 𝜈𝜌 𝜈𝜌 𝐷∕2
Durch Einsetzen in Gl (4.38) erhalten wir Gl. (4.41). Übung 4-7: Radius eines fokussierten Lichtbündels
Gleichung (4.43) kann durch Verwenden der Fouriertransformationseigenschaft der Linse, Gl. (4.28), erhalten werden. Weil Gl. (4.28) mit Gl. (4.38) mit d = 𝑓 identisch ist, ist die Intensität des fokussierten Strahls durch Gl. (4.41) mit d = 𝑓 gegeben. Nach Gl. (3.45) hat der fokussierte Gaußstrahl die Intensitätsverteilung 𝐼(𝑥, 𝑦) = 𝐼0 exp(−2𝜌2 ∕𝑊02 ) = 𝐼0 exp(−2π2 𝑊02 𝜌2 ∕𝜆 2 𝑓 2 ), wobei 𝑊0 der Taillenradius des einfallenden Strahls ist. Um diese Verteilung mit der durch Gl. (4.43) gegebenen zu vergleichen, nehmen wir 2𝑊0 = 𝐷 und π 𝐷∕𝜆𝑓 = 1 an und tragen die bei-
997
998
Lösungen zu den Übungen
den Funktionen exp(−𝜌2 ∕2) und [2𝐽1 (𝜌)∕𝜌]2 auf (siehe Abbildung).
Übung 6-2: Hintereinandergeschaltete Wellenretarder
a) Parallele schnelle Achsen:
1
⎡1 0 ⎤ ⎡1 0 ⎤ ⎡1 T=⎢ ⎥⎢ ⎥=⎢ −iπ∕2 −iπ∕2 0 e 0 0 e ⎦⎣ ⎦ ⎣ ⎣ = Halbwellenretarder .
exp(– ρ2/2)
[2J1(ρ)/ρ]2 0
0
5
b) Orthogonale schnelle Achsen ⎡1 0 ⎤ ⎡e−iπ∕2 T=⎢ ⎥⎢ −iπ∕2 0 0 e ⎦⎣ ⎣ = Phasenschieber .
10
ρ
Elektromagnetische Optik
Übung 5-1: Verdünntes absorbierendes Medium
Wir schreiben für die Suszeptibilität des Wirtsmediums 𝜒0 , d. h. 𝑛02 = 1 + 𝜒0 . In Anwesenheit von Verunreinigungen ist die Suszeptibilität 𝜒 = 𝜒0 + 𝜒 ′ + i𝜒 ′′ . Der Brechungsindex und Absorptionskoeffizient sind durch Gl. (5.92) gegeben, √ i𝛼 𝑛− = 1 + 𝜒0 + 𝜒 ′ + i𝜒 ′′ 2𝑘0 1∕2
= [(1 + 𝜒0 ) (1 + ′
0 ⎤ ⎥ e ⎦ −iπ
0⎤ ⎥ 1 ⎦
Übung 6-3: Jonesmatrix eines gedrehten Halbwellenretarders
Die Jonesmatrix eines Halbwellenretarders im Winkel 0 [ 0 ] ist T = 10 −1 . Wenn er um einen Winkel 𝜃 verdreht wird, gilt entsprechend ⎡cos 𝜃 T=⎢ sin 𝜃 ⎣
− sin 𝜃⎤ ⎡1 ⎥⎢ cos 𝜃 0 ⎦⎣
0 ⎤ ⎡ cos 𝜃 ⎥⎢ −1 − sin 𝜃 ⎦⎣
sin 𝜃 ⎤ ⎥ , (1) cos 𝜃 ⎦
also
𝜒 ′ + i𝜒 ′′ )] 1 + 𝜒0 ′′
⎡1 0⎤ −iπ∕2 ⎥=e ⎢ 1 0 ⎦ ⎣
′
′′
𝜒 + i𝜒 𝜒 + i𝜒 ≈ 𝑛0 [1 + ]; ] = 𝑛0 [1 + 2(1 + 𝜒0 ) 2𝑛02
⎡ cos 𝜃 T=⎢ − sin 𝜃 ⎣
sin 𝜃 ⎤ ⎥ ⎦
cos 𝜃
(2)
oder
folglich ist 𝑛 = 𝑛0 +
𝜒′ 2𝑛0
und 𝛼 =
−𝑘0 𝜒 ′′ . 𝑛0
⎡cos 2𝜃 T=⎢ sin 2𝜃 ⎣
sin 2𝜃 ⎤ ⎥. − cos 2𝜃 ⎦
(3)
Für 𝜃 = 22.5◦ lautet die Jonesmatrix folglich
6
Polarisationsoptik
Übung 6-1: Messung der Stokesparameter
Die Ausdrücke für S0 und S1 folgen direkt aus der Definition. Der Ausdruck für S2 kann verifiziert werden, indem man die Ausdrücke für 𝐴45 und 𝐴135 aus Gl. (6.12) einsetzt. Entsprechend kann der Ausdruck für S3 verifiziert werden, indem 𝐴𝑅 und 𝐴𝐿 aus Gl. (6.13) eingesetzt werden. Die Stokesparameter können gemessen werden, wenn die Absolutwerte (oder die Intensitäten) der Komponenten des Jonesvektors in drei Basissätzen gemessen werden: in der linear polarisierten Basis in (𝑥, 𝑦)-Richtung, in der linear polarisierten Basis in (45◦ , 135◦ )-Richtung und in der zirkular polarisierten Basis (𝑅, 𝐿). Alle sechs Messungen sind Intensitätsmessungen.
⎡1 T=⎢ 1 ⎣
1⎤ ⎥, −1 ⎦
(4)
d. h. die die ausgehenden Wellen sind proportional zur Summe bzw. Differenz der einfallenden Wellen. Übung 6-4: Normalmoden einiger polarisierender Systeme
[ ] [ ] [ ] a) T = 10 00 ; Eigenvektoren 10 und 01 ; Eigenwerte 1 und [0. ] [ ] [ ] 1 0 b) T = 0 e−i𝛤 ; Eigenvektoren 10 und 01 ; Eigenwerte −i𝛤 1 und ] [ e . [ ] [0] cos 𝜃 − sin 𝜃 c) T = sin 𝜃 cos 𝜃 ; Eigenvektoren 1i und −i ; Eigen-
werte e−i𝜃 und ei𝜃 .
Übung 6-5: Brewsterfenster
Wenn 𝜃1 der Brewsterwinkel ist, 𝜃1 = tan−1 𝑛, tritt an der ersten Grenzfläche keine Reflexion ein. Das snelliussche
Optik photonischer Kristalle
√ 2 Gesetz √ liefert sin 𝜃2 = (1∕𝑛) sin 𝜃1 = (1∕𝑛)[𝑛∕ 1 + 𝑛 ] = 2 1∕ 1 + 𝑛 , sodass tan 𝜃2 = 1∕𝑛 gilt, d. h. 𝜃2 ist auch für die zweite Grenzfläche ein Brewsterwinkel. Für 𝑛 = 1.5 ist 𝜃1 = tan−1 𝑛 = 56.3◦ .
θ2 θ1
θ1
θ2
Übung 6-6: Drehvermögen eines optisch aktiven Mediums √ √
Für 𝐺 ≪ 𝑛0 ist 𝑛± = 𝑛02 ± 𝐺 = 𝑛0 1 ± 𝐺∕𝑛02 ≈ 𝑛0 ± 𝐺∕2𝑛0 . Folglich ist 𝜌 = π(𝑛− − 𝑛+ )∕𝜆0 = −π 𝐺∕𝜆0 𝑛0 .
9 Wellenleiteroptik Übung 9-1: Optische Leistung
Der Leistungsfluss ist nach Gl. (5.52) durch den Poyntingvektor S = (1∕2)E × H∗ gegeben. Für die TE-Mode ist 𝐸𝑦 = 𝐸𝑧 = 𝐻𝑥 = 0. Die Komponente von S in 𝑧-Richtung ist daher 𝑆𝑧 = (1∕2)𝐸𝑥 𝐻𝑦∗ . Aus der maxwellschen Gleichung (5.54) ∇ × E = −i𝜔𝜇0 H folgt −i𝜔𝜇0 𝐻𝑦 = 𝜕𝐸𝑥 ∕𝜕𝑧 . Daher ist 𝑆𝑧 = (1∕2i𝜔𝜇0 )𝐸𝑥 𝜕𝐸𝑥∗ ∕𝜕𝑧. Durch die Substitution 𝐸𝑥 = a𝑚 𝑢𝑚 (𝑦) exp(−i𝛽𝑚 𝑧) erhalten wir 𝑆𝑧 = (𝛽𝑚 ∕2𝜔𝜇0 )|a𝑚 |2 |𝑢𝑚 (𝑦)|2 . Der gesamte Leistungsfluss in 𝑧-Richtung ist das Integral von 𝑆𝑧 über 𝑦. Da das Integral von |𝑢𝑚 (𝑦)|2 gleich eins ist, ist der Leistungsfluss (𝛽𝑚 ∕2𝜔𝜇0 )|a𝑚 |2 . Wegen 𝛽𝑚 = 𝑘 cos 𝜃𝑚 = (𝜔∕𝑐) cos 𝜃𝑚 erhalten wir für den Leistungsfluss (1∕2𝜇0 𝑐)|a𝑚 |2 cos 𝜃𝑚 = (1∕2𝜂)|a𝑚 |2 cos 𝜃𝑚 . Übung 9-2: Die optische Leistung in einem Vielmodenfeld
7 Optik photonischer Kristalle Übung 7-1: Viertelwellenschicht als Antireflexbelag Die M-Matrix ist ein Produkt der M-Matrix einer einzel-
nen dielektrischen Grenzfläche (Beispiel 7-2) und einer anderen für die Ausbreitung vor der Grenzfläche (Beispiel 7-3), 1 ⎡(𝑛3 + 𝑛2 )e−i𝜑 (𝑛3 − 𝑛2 )ei𝜑 ⎤ M= ⎢ ⎥ 2𝑛3 (𝑛3 − 𝑛2 )e−i𝜑 (𝑛3 + 𝑛2 )ei𝜑 ⎣ ⎦ 1 ⎡𝑛2 + 𝑛1 𝑛2 − 𝑛1 ⎤ × 2𝑛2 ⎢𝑛2 − 𝑛1 𝑛2 + 𝑛1 ⎥ ⎣ ⎦ mit 𝜑 = 𝑛2 𝑘0 d = 2π d ∕𝜆 und 𝜆 = 𝜆0 ∕𝑛2 . Das Element B dieser Matrix ist 1 B= 4𝑛2 𝑛3 [ ] × (𝑛3 + 𝑛2 )(𝑛2 − 𝑛1 )e−i𝜑 + (𝑛3 − 𝑛2 )(𝑛2 + 𝑛1 )ei𝜑 . Der Reflexionskoeffizient verschwindet, wenn B = 0 ist, d. h. für (𝑛3 + 𝑛2 )(𝑛2 − 𝑛1 ) + (𝑛3 − 𝑛2 )(𝑛2 + 𝑛1 )ei2𝜑 = 0 . Das ist dann der Fall, wenn ei2𝜑 reell ist, d. h. wenn 2𝜑 ein ganzzahliges Vielfaches von π ist. Der Wert 2𝜑 = π ergibt d = 𝜆∕4 und damit (𝑛3 + 𝑛2 )(𝑛2 − 𝑛1 ) − (𝑛3 − 𝑛2 )(𝑛2 + 𝑛1 ) = 0 , woraus die Bedingung 𝑛1 𝑛3 = 𝑛22 folgt. Die Wahl 2𝜑 = 2π oder ein anderes geradzahliges Vielfaches von π führt zu (𝑛3 + 𝑛2 )(𝑛2 − 𝑛1 ) + (𝑛3 − 𝑛2 )(𝑛2 + 𝑛1 ) = 0 , was die triviale Lösung 𝑛1 = 𝑛3 liefert.
Nach Übung 9-1 ist der Leistungsfluss in 𝑧-Richtung das Integral von 𝑆𝑧 = (1∕2i𝜔𝜇0 )𝐸𝑥 𝜕𝐸𝑥∗ ∕𝜕𝑧 über 𝑦. Wenn wir ∑ 𝐸𝑥 = 𝑚 a𝑚 𝑢𝑚 (𝑦) exp(−i𝛽𝑚 𝑧) einsetzen, erhalten wir 𝑆𝑧 =
𝛽𝑚 ∑ a 𝑢 (𝑦) exp(−i𝛽𝑚 𝑧) 2𝜔𝜇0 𝑚 𝑚 𝑚 ∑ ∗ ∗ a𝑛 𝑢𝑛 (𝑦) exp(i𝛽𝑛 𝑧) . × 𝑛
Da das Integral von 𝑢𝑚 (𝑦)𝑢𝑛∗ (𝑦) über 𝑦 für 𝑛 = 𝑚 gleich eins und ansonsten null ist, ist die Gesamtleistung ∑ 1 ∑ 𝛽𝑚 |a |2 cos 𝜃𝑚 . |a𝑚 |2 = 2𝜔𝜇0 2𝜂 𝑚 𝑚 𝑚 Übung 9-3: Einschlussfaktor
Da der Wellenleiter symmetrisch ist, betrachten wir die Eingrenzung nur für 𝑦 > 0. Für 𝑦 < d ∕2 ist 𝑢𝑚 (𝑦) = 𝐴𝑚 cos(𝑘 sin 𝜃𝑚 𝑦) , = 𝐴𝑚 sin(𝑘 sin 𝜃𝑚 𝑦) ,
𝑚 gerade, 𝑚 ungerade.
(1a)
Für 𝑦 > d ∕2 ist 𝑢𝑚 (𝑦) = 𝐵𝑚 exp(−𝛾𝑚 𝑦)
(1b)
mit 𝛾𝑚 = 𝑛2 𝑘0
√ (𝑛1 ∕𝑛2 )2 cos2 𝜃𝑚 − 1 .
(2)
Weil 𝑢𝑚 (𝑦) bei 𝑦 = d ∕2 stetig sein muss, folgt 𝐴𝑚 cos(𝑘 sin 𝜃𝑚 d ∕2) = 𝐵𝑚 exp(−𝛾𝑚 d ∕2) , 𝑚 gerade 𝐴𝑚 sin(𝑘 sin 𝜃𝑚 d ∕2) = 𝐵𝑚 exp(−𝛾𝑚 d ∕2) , 𝑚 ungerade. (3a)
999
1000
Lösungen zu den Übungen d ∕2
2 Die Leistung im Gebiet 𝑦 < d ∕2 ist 𝑃1 = ∫0 𝑢𝑚 (𝑦) d𝑦. Wir setzen aus (1a) ein und integrieren; so erhalten wir
𝑃1 =
2 d 𝐴𝑚 sin(𝑘d sin 𝜃𝑚 ) ]. [1 + (−1)𝑚 4 𝑘d sin 𝜃𝑚
(4)
Entsprechend ist die Leistung im Gebiet 𝑦 > d ∕2 𝑃2 =
2 𝐵𝑚 exp(−𝛾𝑚 d ) . 2𝛾𝑚
(5)
geschrieben werden kann. Lösungen dieser Gleichung sind in Abb. 9.12 für 𝑀 = 8 gezeigt. Der erste Schnittpunkt (für 𝑚 = 0) tritt bei sin 𝜃0 = 0.933(𝜆∕2d ) oder 𝑠0 ≈ 0.933∕𝑀 auf. Entsprechend ist 𝑠1 ≈ 1.86∕𝑀, 𝑠2 ≈ 2.778∕𝑀 usw. Wenn wir diese Werte in (12) und (6) einsetzen, erhalten wir die Einschlussfaktoren: 𝛤0 ≈ 0.999, 𝛤1 ≈ 0.996, 𝛤2 ≈ 0.990. Die Mode niedrigster Ordnung zeigt daher die stärkste Eingrenzung.
Den Einschlussfaktor 𝛤𝑚 =
𝑃1 1 = 𝑃1 + 𝑃2 1 + 𝑃2 ∕𝑃1
Übung 9-4: Der asymmetrische ebene Wellenleiter
(6)
erhalten wir, indem wir (4) und (5) einsetzen und (3) benutzen, um 𝐵𝑚 ∕𝐴𝑚 zu eliminieren: (1∕𝛾𝑚 d ) [1 + (−1)𝑚 cos(𝑘d sin 𝜃𝑚 )] 𝑃2 = . 𝑃1 1 + (−1)𝑚 sin(𝑘d sin 𝜃𝑚 )∕𝑘d sin 𝜃𝑚
(7)
Es ist zweckmäßig, dieses Ergebnis durch die Variable sin 𝜃k 𝑀= 𝜆∕2d
(8)
auszudrücken, indem man 𝑘d = 2π d ∕𝜆 = π 𝑀∕ sin 𝜃k setzt, √ 𝛾𝑚 d = 𝑘d (𝑛2 ∕𝑛1 ) (𝑛1 ∕𝑛2 )2 cos2 𝜃𝑚 + 1 √ √ 2 2 = 𝑘d cos2 𝜃𝑚 − cos2 𝜃k = 𝑘d sin 𝜃k − sin 𝜃𝑚 √ 2 2 = π 𝑀 1 − sin 𝜃𝑚 ∕ sin 𝜃k . (9) Es ist weiterhin zweckmäßig, das Verhältnis 𝑠𝑚 = sin 𝜃𝑚 ∕ sin 𝜃k zu definieren, sodass wir √ (10) 𝛾𝑚 d = π 𝑀 1 − 𝑠𝑚 schreiben können. Wenn wir (10) und (11) in (7) einsetzen, erhalten wir 𝑠 1 + (−1)𝑚 cos(π 𝑀𝑠𝑚 ) 𝑃2 = √ 𝑚 . 𝑚 𝑃1 2 π 𝑀𝑠𝑚 + (−1) sin(π 𝑀𝑠𝑚 ) 1 − 𝑠𝑚
(11)
Wir bezeichnen die Komplemente der kritischen Winkel für die Reflexion am Substrat und der Deckschicht mit 𝜃k2 = cos−1 (𝑛2 ∕𝑛1 ) bzw. 𝜃 k3 = cos−1 (𝑛3 ∕𝑛1 ). Da 𝑛2 > 𝑛3 ist, muss 𝜃k2 < 𝜃k3 gelten. Folglich muss ein geführter Strahl in einem Winkel 𝜃 kleiner als der kleinere der Winkel 𝜃k2 bzw. 𝜃k3 verlaufen, d. h. 𝜃 < 𝜃k2 . a) Da die numerische Apertur durch 𝜃k2 bestimmt ist, √
ist NA = 𝑛12 − 𝑛22 . b) Die Bedingung der Selbstkonsistenz im symmetrischen Wellenleiter, Gl. (9.19), wird hier wie folgt modifiziert: 2π 2d sin 𝜃 − 𝜑r2 − 𝜑r3 = 2π, 𝑚 , 𝜆
𝑚 = 0, 1, 2, … ,
wobei 𝜑r2 und 𝜑r3 die Phasenverschiebungen sind, die durch die Totalreflexion an den Grenzflächen des Substrats bzw. der Deckschicht eingeführt werden. Diese Phasen sind durch die allgemeine Beziehung in Gl. (9.21) mit den entsprechenden Grenzwinkeln 𝜃k2 bzw. 𝜃k3 gegeben. c) Die Zahl der Moden ist durch den Grenzwinkel der Reflexion an der Grenzfläche des Substrats be. stimmt. √Sie ist daher durch 𝑀 = (2d ∕𝜆0 ) NA mit NA =
10
𝑛12 − 𝑛22 gegeben.
Faseroptik
Übung 10-1: Der optimale Gradientenprofilparameter
Damit haben wir einen Ausdruck für den Einschlussfaktor 𝛤𝑚 = 1∕(1 + 𝑃2 ∕𝑃1 ) als Funktion des Parameters 𝑀, der die Zahl der Moden angibt, und der Parameter 𝑠𝑚 = sin 𝜃𝑚 ∕ sin 𝜃k , die durch die normierten Winkel der Moden bestimmt sind. Als Beispiel betrachten wir den Fall 𝑀 = 8. Die Parameter 𝑠𝑚 sind durch die charakteristische Gleichung (9.22) gegeben, die als Funktion von 𝑀 und 𝑠𝑚 in der Form √ 𝑀𝑠𝑚 π 𝑚π 1 − )= −1 (12) tan ( 2 2 2 𝑠𝑚
Die Gruppengeschwindigkeiten sind 𝑣𝑞 = (d𝛽𝑞 ∕ d𝜔)−1 mit 𝛽𝑞 = 𝑛1 𝑘0 [1 − (𝑞∕𝑀)𝑠 𝛥]; außerdem gilt 𝑀 = 𝑠𝑛12 𝑘02 𝑎2 𝛥, 𝑠 = 𝑝∕(𝑝 + 2) und 𝑘0 = 𝜔∕𝑐0 . Um die Berechnung der Ableitung zu vereinfachen, setzen wir 𝛽𝑞 = (
𝑞 𝑠 𝑛1 𝜔 ) [1 − 𝑥𝑞 ] mit 𝑥𝑞 = ( ) 𝛥 . 𝑐0 𝑀
Dann ist d𝛽𝑞 d𝜔
=
𝜔 d𝑥𝑞 1 d(𝑛1 𝜔) (1 − 𝑥𝑞 ) − 𝑛1 𝑐0 d𝜔 𝑐0 d𝜔
Faseroptik
𝑁1 𝜔 d𝑥𝑞 (1 − 𝑥𝑞 )𝑛1 𝑐0 𝑐0 d𝜔 𝑁 = 1 [1 + 𝑥𝑞 𝜙] , 𝑐0 =
wobei 𝑁1 = d(𝑛1 𝜔)∕ d𝜔 der Gruppenbrechungsindex ist und 𝜙 = −1 −
𝑛1 𝜔 d𝑥𝑞 . 𝑁1 𝑥𝑞 d𝜔
(1)
Wenn 𝜙𝑥𝑞 klein ist, ist die Gruppengeschwindigkeit 𝑣𝑞 = (
d𝛽𝑞 d𝜔
−1
)
=
𝑐0 𝑐0 [1 + 𝑥𝑞 𝜙]−1 ≈ [1 − 𝑥𝑞 𝜙] . (2) 𝑁1 𝑁1
Nun können wir 𝜙 bestimmen: 𝑞 𝑠−1 𝑞 𝑠 d𝛥 1 d𝑀 ) 𝑞 [(− 2 ) ]𝛥 + ( ) 𝑀 𝑀 d𝜔 𝑀 d𝜔 d𝜔 𝑠𝑥𝑞 d𝑀 𝑥𝑞 d𝛥 =− + , 𝑀 d𝜔 𝛥 d𝜔 (3)
d𝑥𝑞
= 𝑠(
d𝑛1 𝑘0 2 d𝛥 d𝑀 = 2𝑠𝑛1 𝑘0 𝑎 𝛥 + 𝑠(𝑛1 𝑘0 )2 𝑎2 d𝜔 d𝜔 d𝜔 d𝑛 𝑘 𝑀 d𝛥 2𝑀 1 0 + = 𝛥 d𝜔 𝑛1 𝑘0 d𝜔 1 d𝛥 2 𝑁1 + ]. = 𝑀[ 𝛥 d𝜔 𝑛1 𝑘0 𝑐0
𝑇𝑦′ . Die gesamte Gruppenlaufzeit kann daher vier Werte annehmen: 𝑇𝑥 + 𝑇𝑥′ , 𝑇𝑦 + 𝑇𝑦′ , 𝑇𝑥 + 𝑇𝑦′ und 𝑇𝑦 + 𝑇𝑥′ . Wegen 𝑇𝑥 = 𝑇𝑥′ und 𝑇𝑦 = 𝑇𝑦′ sind in Wirklichkeit nur drei Gruppenlaufzeiten möglich: 2𝑇𝑥 = 4.8733 μs, 2𝑇𝑦 = 4.8767 μs und 𝑇𝑥 + 𝑇𝑦 = 4.873 μs. Da sich der Puls mit der Gruppenlaufzeit 𝑇𝑥 + 𝑇𝑦 aus zwei Varianten ergibt, hängt seine Amplitude von den jeweiligen Phasenverschiebungen ab, die von den Phasengeschwindigkeiten und den genauen Längen der Fasersegmente abhängen und die darüber hinaus auch empfindlich auf kleinste Störungen des Systems reagieren. Dieser mittlere Puls besitzt daher eine zufällige Polarisation. Der Unterschied der Gruppenlaufzeiten des schnellsten und des langsamsten Pulses ist 2𝑇𝑦 − 2𝑇𝑥 = 3.4 ns. Um zu untersuchen, ob diese Laufzeitdifferenz sichtbar sein wird, betrachten wir die Pulsverbreiterung aufgrund der Gruppengeschwindigkeitsdispersion. Für ein einzelnes Segment ist die Verbreiterung 𝐷𝜎𝜆 𝐿 = 20 × 50 × 0.5 = 500 ps, sodass die Breite jedes Pulses von einem Anfangswert 100 ps auf eines Wert von 1 ns verbreitert wird. Die Form der empfangenen Pulse ist daher wie in der Abbildung gezeigt. 3.4 ns
(4)
1 ns
1 ns t
Das setzen wir in (3) ein, 1 d𝑥𝑞 1 d𝛥 2 𝑁1 1 d𝛥 + = −𝑠 [ ]+ 𝑥𝑞 d𝜔 𝛥 d𝜔 𝛥 d𝜔 𝑛1 𝑘0 𝑐0 2𝑠𝑁1 1 d𝛥 =− . + (1 − 𝑠) 𝑛1 𝜔 𝛥 d𝜔 Durch Einsetzen in (1) erhalten wir 𝜙 = −1 + 2𝑠 − (1 − 𝑠)𝑝𝑠 ∕2 mit 𝑝𝑠 = 2(𝑛1 ∕𝑁1 )(𝜔∕𝛥) d𝛥∕ d𝜔. Folglich ist 𝜙 = −1 + 2𝑝∕(𝑝 + 2) − 𝑝𝑠 ∕(𝑝 + 2) = (𝑝 − 2 − 𝑝𝑠 )∕(𝑝 + 2), woraus durch Einsetzen in (2) Gl. (10.57) folgt. Übung 10-2: Gruppenlaufzeitdifferenz in einer Zweisegmentfaser
a) Wenn 𝐿 = 500 m die Länge eines Segments ist, dann sind die Gruppenlaufzeiten der 𝑥- und 𝑦-Komponenten am Ende des ersten Segments 𝑇𝑥 = 𝐿𝑁𝑥 ∕𝑐 = 2.4367 μs und 𝑇𝑦 = 𝐿𝑁𝑦 ∕𝑐 = 2.4383 μs. Jede dieser Komponenten kann in zwei Komponenten mit gleichen Beträgen entlang der Hauptachsen 𝑥′ und 𝑦 ′ des zweiten Segments zerlegt werden werden. Diese Komponenten haben am Ende des zweiten Segments die Gruppenlaufzeiten 𝑇𝑥′ und
b) Die zwei Fasersegmente sind äquivalent zu zwei hintereinander geschalteten identischen Retardern, deren Hauptachsen um 45° gegeneinander verdreht sind. Die Jonesmatrix dieses Systems ist das Produkt dreier Matrizen ⎡cos 𝜃 − sin 𝜃⎤ ⎡1 0 ⎤ T=⎢ ⎥⎢ ⎥ −i𝜙 sin 𝜃 cos 𝜃 0 e ⎣ ⎦⎣ ⎦ ⎡ cos 𝜃 sin 𝜃 ⎤ ⎡1 0 ⎤ ⎥, ⎢ ⎥⎢ −i𝜙 − sin 𝜃 cos 𝜃 0 e ⎦ ⎣ ⎦⎣ wobei 𝜙 = (𝑁𝑥 − 𝑁𝑦 )2π𝐿∕𝜆 die von einem Segment eingeführte Verzögerung ist und 𝜃 der Winkel zwischen den Hauptachsen. Mit 𝜃 = 45◦ erhalten wir 1 ⎡1 T= √ ⎢ 2 ⎣1
−1⎤ ⎡1 ⎥⎢ 1 0 ⎦⎣
0 ⎤ 1 ⎡1 ⎥√ ⎢ e −1 ⎦ 2⎣ −i𝜙
und daher T=
1 ⎡1 + e−i𝜙 ⎢ 2 1 − e−i𝜙 ⎣
e−i𝜙 (1 − e−i𝜙 )⎤ ⎥ . e−i𝜙 (1 + e−i𝜙 ) ⎦
1⎤ ⎡1 ⎥⎢ 1 0 ⎦⎣
0 ⎤ ⎥ e ⎦ −i𝜙
1001
1002
Lösungen zu den Übungen
Die Eigenwerte und Eigenvektoren dieser Matrix können für jeden Wert von 𝜙 bestimmt werden. Da die Matrix unitär ist, sind die Eigenwerte stets Phasenfaktoren. Für 𝜙 = π sind die Eigenwerte z. B. ±i und die Eigenvektoren [1, ∓i], d. h. die Moden sind zirkular polarisiert. Ein Puls in einer der Polarisationsmoden breitet sich immer mit einer einzigen Gruppengeschwindigkeit aus, sodass er auch als ein einziger Puls ankommt.
11
Resonatoroptik
Übung 11-1: Resonanzfrequenzen eines Resonators für laufende Wellen
a) Dreispiegel-Ringresonator: Bei Resonanz muss die Phasenverschiebung 3𝑘d + 3π für einen vollständigen Umlauf ein Vielfaches von 2π sein, d. h. 3𝑘d + π = 𝑞 2π mit einer ganzen Zahl 𝑞. Also ist 3𝑘d = (2𝑞 − 1)π oder 3(2π𝜈∕𝑐)d = (2𝑞 − 1)π, woraus 𝜈 = (2𝑞 − 1)(𝑐∕6d ) folgt, d. h. die Frequenz ist ein ungerades Vielfaches von 𝑐∕6d . Die Frequenzen zweier aufeinander folgender Resonanzen haben einen Abstand 2(𝑐∕6d ) = 𝑐∕3d . b) Vierspiegel-Bow-Tie-Resonator: √ Bei Resonanz muss die Phasenverschiebung (4 + 2 5)𝑘d + 4π für einen vollständigen √ Umlauf ein Vielfaches von 2π sein, d. h. (4 + 2 5)𝑘d + 4π √ = 𝑞 2π mit einer gan5)𝑘d = 2𝑞π oder√(4 + zen Zahl 𝑞. Also ist (4 + 2 √ 2 5)(2π𝜈∕𝑐)d = 2𝑞π, woraus 𝜈 = 𝑞[𝑐∕(4 + 2 5)d ] folgt. Die Frequenzen zweier aufeinander folgender √ Resonanzen haben einen Abstand [𝑐∕(4 + 2 5)d ]. Übung 11-2: Resonatormoden und spektrale Breite Es gilt ℛ1 = 0.98, ℛ2 = 0.99, d = 1 m, 𝑛 = 1 und 𝑐 =
𝑐0 ∕𝑛 = 𝑐0 = 3 × 108 m∕s. Der Frequenzabstand zwischen den Moden ist 𝜈F = 𝑐∕2d = 1.5 × 108 Hz = 150 MHz. Der Dämpfungskoeffzient ist 𝛼R = (1∕2d ) ln(1∕ℛ1 ℛ2 ) = 0.015. Aus Gl. (11.28) erhalten wir für die Finesse ℱ ≈ π∕𝛼R d = 207.7. Die spektrale Linienbreite ist δ𝜈 = 𝜈F ∕ℱ = 7.22 × 105 Hz = 722 kHz. Die Näherung ist anwendbar, da 𝛼R d = 0.015 ≪ 1 gilt. Übung 11-3: Maximale Resonatorlänge für eingegrenzte Strahlen Die Eingrenzungsbedingung ist 0 ≤ (1 + d ∕𝑅1 )(1 + d ∕𝑅2 ) ≤ 1. Wenn wir 𝑅1 = −0.5 m und 𝑅2 = −1 m einsetzen, erhalten wir 0 ≤ (1 − 2d )(1 − d ) ≤ 1. Wir setzen 𝑥 = (1 − 2d )(1 − d ); damit wird die Eingrenzungsbedin-
gung 0 ≤ 𝑥 ≤ 1. Die Abbildung zeigt eine Auftragung von 𝑥 gegen d . Nach dieser Abbildung ist der maximale Wert von d , für den der Resonator stabil ist, d = 1.5 m.
1 x 0
0
0.5
1
1.5
Übung 11-4: Ein plankonkaver Resonator
Für einen plankonkaven Resonator ist 𝑅1 = ∞ und 𝑅2 = −|𝑅|. Wir setzen 𝑧1 = 0 und 𝑧2 = d in Gl. (11.50) ein und erhalten so |𝑅| = d + 𝑧02 ∕d , woraus 𝑧02 = d (|𝑅| − d ) folgt. Für Eingrenzung muss 𝑧02 > 0 gelten, d. h. |𝑅| > d . Aus Gl. (11.47) folgt 𝑊02 =
𝜆𝑧0 𝜆 1∕2 = [d (|𝑅| − d )] , π π 1∕2
𝑊1 = 𝑊0 = (
𝜆d ) π
𝑊22 = 𝑊02 (1 +
d2
𝑧02
(
|𝑅| d
1∕4
− 1)
) = 𝑊02 [
,
|𝑅| 1+d ] = 𝑊02 . |𝑅| − d |𝑅| − d
Damit wird 𝑊2 =
(𝜆 d ∕π)1∕2 (|𝑅|∕d − 1)1∕4 (|𝑅|∕d )1∕2 (|𝑅|∕d − 1)1∕2 1∕2
𝜆d =( ) π
1∕4
(|𝑅|∕d )2 [ ] (|𝑅|∕d − 1)
.
In der Abbildung sind 𝑊1 und 𝑊2 gegen d ∕|𝑅| aufgetragen.
2 λ π
W2
λ π
W1
0
1 |R|
Übung 11-5: Resonanzfrequenzen eines konfokalen Resonators d = 30 cm = 0.3 m, 𝑐 = 𝑐0 ∕𝑛 = 𝑐0 , 𝑧1 = −𝑧0 , 𝑧2 = 𝑧0 .
𝜈F = 𝑐∕2d = 5 × 108 Hz = 500 MHz . Δ𝜁 = tan−1 (𝑧2 ∕𝑧0 ) − tan−1 (𝑧1 ∕𝑧0 ) = tan−1 (1) − tan−1 (−1) = π∕4 − (−π∕4) = π∕2 .
Statistische Optik
Δ𝜁 Δ𝜈F 𝜈 = = 250 MHz . π F 2 𝜈F 1 = (𝑞 + ) 𝜈F . 𝜈𝑞 = 𝑞𝜈F + 2 2
12 Statistische Optik Übung 12-1: Kohärenzzeit
a) Die Kohärenzzeit ist
Bei der Mittenfrequenz ist 𝑞 ≈ 𝜈∕𝜈F = 5 × 1014 ∕5 × 108 = 106 . Wir erhalten so folgende Werte: 𝝂q ∕Hz
106
5 × 1014 + 2.5 × 108 +1
5×
1014
∫ |𝑔(𝜏)| d𝜏 = ∫ exp (
+ 7.5 ×
−∞ ∞
5 × 1014 + 12.5 × 108
106 + 3
5 × 1014 + 17.5 × 108
−1
5 × 1014 − 2.5 × 108
106 − 2
5 × 1014 − 7.5 × 108
106
−3
5 × 1014 − 12.5 × 108
106
−4
5 × 1014 − 17.5 × 108
Es liegen daher acht Moden innerhalb des Bands 5 × 1014 ± 2 × 109 Hz. Übung 11-6: Resonanzfrequenzen des symmetrischen konfokalen Resonators
Für konfokale symmetrische Resonatoren ist (Δ𝜁∕π)𝜈F = 𝜈F ∕2. Aus Gl. (11.70) folgt 𝜈𝑙,𝑚,𝑞 = [𝑞 + (𝑙 + 𝑚 + 1)∕2]𝜈F . Moden, für die 𝑙 + 𝑚 + 1 gerade ist, liegen in Abständen von 𝜈F . Moden, für die 𝑙 + 𝑚 + 1 ungerade ist, liegen ebenfalls in Abständen von 𝜈F , aber gegenüber den geraden Moden um die Frequenz 𝜈F ∕2 verschoben. Übung 11-7: Modendichte in einem zweidimensionalen Resonator
a) Die Zahl der Moden mit einer Frequenz zwischen 0 und 𝜈 ist gleich der Zahl der Moden mit einer Wellenzahl zwischen 0 und 𝑘 = 2π 𝜈∕𝑐. Nach Abb. 11.23 ist diese Zahl gleich der Fläche (π 𝑘2 ∕4) eines Quadranten im 𝑘-Raum geteilt durch die Fläche (π∕d )2 pro Mode und multipliziert mit zwei, um die zwei möglichen Polarisationen pro Mode zu berücksichtigen. Das ergibt 2(π 𝑘2 ∕4)∕(π∕d )2 = 𝑘2 d 2 ∕2π = (2π 𝜈∕𝑐)2 d 2 ∕2π = 2π 𝜈2 d 2 ∕𝑐2 . Daher ist die Zahl der Moden pro Flächeneinheit im Frequenzband 0 bis 𝜈 gleich 𝑁𝜈 = 2π 𝜈2 ∕𝑐2 . b) Die Modendichte pro Flächeneinheit pro Frequenzintervall ist M(𝜈) = d𝑁𝜈 ∕ d𝜈 = 4π 𝜈∕𝑐2 .
−2|𝜏| ) d𝜏 𝜏K
= 2 ∫ exp (
108
106 + 2 106
∞ 2
−∞
q
106
∞
−2𝜏 ) d𝜏 = 𝜏K . 𝜏K
0
Bei 𝜏 = 𝜏K nimmt |𝑔(𝜏)| auf 1∕e = 0.368 seines Anfangswerts ab. b) Die Kohärenzzeit ist ∞
∞
∫ |𝑔(𝜏)|2 d𝜏 = ∫ exp ( −∞
−∞
−π 𝜏2 ) d𝜏 = 𝜏K . 𝜏K2
Bei 𝜏 = 𝜏K nimmt |𝑔(𝜏)| auf exp (−π) = 0.043 seines Anfangswerts ab. Übung 12-2: Spektrale Breite und Kohärenzzeit Da S (𝜈) die Fouriertransformierte von 𝐺(𝜏) ist, gilt ∞
∫ S (𝜈) d𝜈 = 𝐺(0) .
(1)
0
Daraus folgt mithilfe von Parsevals Theorem ∞
∞ 2
∫ S (𝜈) d𝜈 = ∫ |𝐺(𝜏)|2 d𝜏 . 0
(2)
−∞
Durch Quadrieren beider Seiten von (1) und Division durch beide Seiten von (2) erhalten wir Δ𝜈K =
|𝐺(0)|2 1 1 . = = 𝜏K ∫ |𝐺(𝜏)|2 d𝜏 ∫ |𝑔(𝜏)|2 d𝜏
Übung 12-3: Differentialgleichungen für die wechselseitige Kohärenzfunktion
Es gilt 𝐺 = ⟨𝑈 ∗ (𝑟1 , 𝑡) 𝑈(𝑟2 , 𝑡 + 𝜏)⟩. Daher ist ∇21 𝐺 = ⟨[∇21 𝑈 ∗ (𝑟1 , 𝑡)]𝑈(𝑟2 , 𝑡 + 𝜏)⟩. Da 𝑈 die Wellengleichung erfüllt, ∇2 𝑈 = (1∕𝑐2 )𝜕 2 𝑈∕𝜕𝑡2 , gilt ∇21 𝐺 =
⟩ 1 ⟨ 𝜕2 ∗ 𝑈 (𝑟 , 𝑡)] 𝑈(𝑟 , 𝑡 + 𝜏) . [ 1 2 𝑐2 𝜕𝑡2
Wir werden nun zeigen, dass ⟨[(𝜕 2 ∕𝜕𝑡2 )𝑈 ∗ (𝑟1 , 𝑡)]𝑈(𝑟2 , 𝑡 + 𝜏)⟩ = (𝜕 2 ∕𝜕𝜏2 )𝐺 ist, sodass ∇21 𝐺 = (𝜕 2 ∕𝜕𝜏2 )𝐺 gilt: ⟨ 𝜕 ⟩ [ 𝑈 ∗ (𝑟1 , 𝑡)] 𝑈(𝑟2 , 𝑡 + 𝜏) 𝜕𝑡 ⟩ ⟨ 1 = lim [𝑈 ∗ (𝑟1 , 𝑡 + Δ𝑡) − 𝑈 ∗ (𝑟1 , 𝑡)] 𝑈(𝑟2 , 𝑡 + 𝜏) Δ𝑡→0 Δ𝑡
1003
1004
Lösungen zu den Übungen
= lim
Δ𝑡→0
=−
1 [𝐺(𝑟1 , 𝑟2 , 𝜏 − Δ𝑡) − 𝐺(𝑟1 , 𝑟2 , 𝜏)] Δ𝑡
Aus Gl. (12.100), der Definition von ℙ, folgt
𝜕 𝐺(𝑟1 , 𝑟2 , 𝜏) . 𝜕𝜏
1 − ℙ2 =
Entsprechend ist ⟨[(𝜕 2 ∕𝜕𝑡2 )𝑈 ∗ (𝑟1 , 𝑡)]𝑈(𝑟2 , 𝑡 + 𝜏)⟩ = (𝜕 2 ∕𝜕𝜏2 )𝐺.
Die Kohärenzmatrix für eine Superposition von unpolarisiertem Licht mit der Intensität (𝐼𝑥 + 𝐼𝑦 )(1 − ℙ) und polarisiertem Licht mit der Intensität (𝐼𝑥 + 𝐼𝑦 )ℙ im Winkel 𝜃 lautet 𝐼𝑥 + 𝐼𝑦 ⎡1 0⎤ 𝐺 = (1 − ℙ) [ ]⎢ ⎥ 2 0 1 ⎣ ⎦ ⎡ cos2 𝜃 cos 𝜃 sin 𝜃⎤ + ℙ(𝐼𝑥 + 𝐼𝑦 ) ⎢ ⎥. 2 cos 𝜃 sin 𝜃 sin 𝜃 ⎦ ⎣ Die vier Elemente dieser Matrix sind (1 − ℙ) 𝐺𝑥𝑥 = (𝐼𝑥 + 𝐼𝑦 ) + (𝐼𝑥 + 𝐼𝑦 )ℙ cos2 𝜃 , 2 (1 − ℙ) 2 𝐺𝑦𝑦 = (𝐼𝑥 + 𝐼𝑦 ) + (𝐼𝑥 + 𝐼𝑦 )ℙ sin 𝜃 , 2 𝐺𝑥𝑦 = 𝐺𝑦𝑥 = (𝐼𝑥 + 𝐼𝑦 )ℙ sin 𝜃 cos 𝜃 . 𝐺𝑥𝑥 = 𝐼𝑥 ,
Das bedeutet, dass auch (6) erfüllt ist.
13
Photonenoptik
Übung 13-1: Photonen in einem Gaußstrahl
a) Gemäß Gl. (3.12) ist die Intensität eines Gaußstrahls bei 𝑧 = 0 ist 𝐼(𝜌, 0) ∝ exp(−2𝜌2 𝑊02 ). Die Wahrscheinlichkeit 𝑝, das Photon innerhalb eines Kreises mit Radius 𝑊0 zu entdecken, ist daher 𝑊
(1) (2) (3)
𝑝=
und
(5)
𝐺𝑥𝑦 = 𝐺𝑦𝑥 = (𝐼𝑥 𝐼𝑦 )|𝑔𝑥𝑦 |2
(6)
gilt. Aus (4) und (1) folgt (𝐼𝑥 + 𝐼𝑦 )ℙ
.
(7)
Aus (5) und (2) folgt ähnlich 2
sin 𝜃 =
𝐼𝑦 − (𝐼𝑥 + 𝐼𝑦 )(1 − ℙ)∕2 (𝐼𝑥 + 𝐼𝑦 )ℙ
.
(8) 2
Addition von (7) und (8) ergibt cos2 𝜃 + sin 𝜃 = 1, sodass (8) automatisch erfüllt ist, wenn (7) erfüllt ist. Wir wollen nun (6) verifizieren. Aus (3) folgt 2
2 = (𝐼𝑥 + 𝐼𝑦 )2 ℙ2 sin 𝜃 cos2 𝜃 . 𝐺𝑥𝑦
∫0 0 𝐼(𝜌, 0)2π 𝜌 d𝜌 ∞
∫0 𝐼(𝜌, 0)2π 𝜌 d𝜌
.
Durch Transformation der Integrationsvariable gemäß 𝑥 = 𝜌2 ∕𝑊02 bzw. d𝑥 = 2𝜌 d𝜌∕𝑊02 wird daraus 1
(4)
𝐼𝑥 − (𝐼𝑥 + 𝐼𝑦 )(1 − ℙ)∕2
,
sodass wir aus (10) erhalten
Wir wollen zeigen, dass für ein bestimmtes 𝜃
cos2 𝜃 =
(𝐼𝑥 + 𝐼𝑦 )2
2 𝐺𝑥𝑦 = 𝐼𝑥 𝐼𝑦 − 𝐼𝑥 𝐼𝑦 (1 − |𝑔𝑥𝑦 |2 ) = 𝐼𝑥 𝐼𝑦 |𝑔𝑥𝑦 |2 .
Übung 12-4: Partiell polarisiertes Licht
𝐺𝑦𝑦 = 𝐼𝑦
4(1 − |𝑔𝑥𝑦 |2 )𝐼𝑥 𝐼𝑦
(9)
𝑝=
∫0 exp(−2𝑥) d𝑥
∞ ∫0
exp(−2𝑥) d𝑥
=
1 − e−2 = 0.86 . 1−0
Wir erinnern uns an die Diskussion im Anschluss an Gl. (3.17), wonach die Leistung innerhalb eines Kreises mit Radius 𝑊0 etwa 86 % der Gesamtleistung des Strahls ausmacht. b) Die mittlere Zahl von Photonen ist 𝑝n = 0.86n. Übung 13-2: Rückstoß aufgrund des Photonenimpulses Der Photonenimpuls ist ℏ𝑘 = ℏ𝜔∕𝑐 = E ∕𝑐; er ist gleich dem Rückstoßimpuls Mv ; folglich ist v = E ∕M𝑐. Wenn wir E = 4.88 eV = 4.88 × 1.6 × 10−19 J, M = 198 × 1.66 ×
10−27 kg und 𝑐 = 3 × 108 m∕s einsetzen, erhalten wir v = 7.9 × 10−3 m∕s. Die quadratisch gemittelte (rms) √thermische Geschwindigkeit des Atoms ist v therm = 3k𝑇∕M. Bei 𝑇 = 300 K ist k𝑇 = 1.38 × 10−23 × 300 J und v therm = 194 m∕s, also viel größer als die Rückstoßgeschwindigkeit.
Einsetzen von (7) und (8) in (9) liefert 1−ℙ 1−ℙ ] [𝐼𝑦 − (𝐼𝑥 + 𝐼𝑦 ) ] 2 2 1 1 = 𝐼𝑥 𝐼𝑦 + (𝐼𝑥 + 𝐼𝑦 )2 (1 − ℙ)2 − (𝐼𝑥 + 𝐼𝑦 )2 (1 − ℙ) 4 2 1 = 𝐼𝑥 𝐼𝑦 + (𝐼𝑥 + 𝐼𝑦 )2 (1 − ℙ)[(1 − ℙ) − 2] 4 1 (10) = 𝐼𝑥 𝐼𝑦 − (𝐼𝑥 + 𝐼𝑦 )2 (1 − ℙ2 ) 4
2 = [𝐼𝑥 − (𝐼𝑥 + 𝐼𝑦 ) 𝐺𝑥𝑦
Übung 13-3: Ein einzelnes Photon in einem Mach-Zehnder-Interferometer
Aus der Interferenzgleichung (2.51) für das MachZehnder-Interferometer erhalten wir für die Intensität im Detektorarm 𝐼 ∝ 𝐼0 [1 + cos (
2π d πd )] ∝ 𝐼0 cos2 ( ), 𝜆 𝜆
Licht und Materie
wobei 2𝐼0 die gesamte einfallende Intensität ist. Wenn die Welle ein einzelnes Photon enthält, dann ist die Wahrscheinlichkeit, dass es im Detektor nachgewiesen wird, gleich 1 + cos(2π d ∕𝜆) ∝ cos2 (π d ∕𝜆), wie die Abbildung zeigt. Die Wahrscheinlichkeit, das Photon im Ausgangsarm des Interferometers zu finden, ist 1 − 2 cos(2π d ∕𝜆) ∝ sin (π d ∕𝜆); auch diese Funktion ist in der Grafik gezeigt. Die Wahrscheinlichkeit, das Photon in einem beliebigen Arm anzutreffen, ist die Summe 2 cos2 (π d ∕𝜆) + sin (π d ∕𝜆) = 1, wie zu erwarten war. sin2(π
/λ)
cos2(π
0.5
1
/λ)
0.052 T = 0.052
0.026
T = 0.026
0 10–3
10–2
0
/λ
1
hν /eV
1
0
10–1
14 Licht und Materie Übung 14-1: Die Frequenz spontan emittierter Photonen
Übung 13-4: Ein einzelnes Photon in einem gaußschen Wellenpaket
a) Die quadratisch gemittelte Breite – wie durch Gl. (A.8) definiert – der Gaußfunktion 𝑓(𝑡) = |a(𝑡)|2 = exp(−𝑡2 ∕2𝜏2 ) ist 𝜎𝑡 = 𝜏. Wegen 𝑧 = 𝑐𝑡 ist die Zeitunschärfe der Funktion a(𝑡 − 𝑧∕𝑐) gleich 𝜎𝜏 ; ihre Ortsunschärfe ist daher 𝜎𝑧 = 𝑐𝜎𝑡 . b) Die Fouriertransformierte von √ a(𝑡) ist ebenfalls eine Gaußfunktion 𝐴(𝜈) = (1∕2 π 𝜎𝜈 ) exp(−𝜈2 ∕4𝜎𝜈2 ) mit 𝜎𝜈 = 1∕4π 𝜎𝑡 . Die quadratisch gemittelte Breite von |𝐴(𝜈)|2 ist 𝜎𝜈 . Da für die Energie E = ℎ𝜈 gilt, ist die Unschärfe in der Energie 𝜎E = ℎ𝜎𝜈 = ℎ∕4π 𝜎𝑡 , woraus Gl. (13.20) folgt. Weil für den Impuls 𝑝 = ℎ∕𝜆 = (ℎ∕𝑐)𝜈 gilt, ist die Impulsunschärfe 𝜎𝑝 = (ℎ∕𝑐)𝜎𝜈 = ℎ∕4𝑐π 𝜎𝜈 . Folglich ist 𝜎𝑧 𝜎𝑝 = (𝑐𝜎𝜏 )(ℎ∕4𝑐π 𝜎𝜈 ) = ℎ∕4π, woraus Gl. (13.21) folgt. Übung 13-5: Die mittlere Energie in einer Resonatormode Die mittlere Zahl n von Photonen in einer einzelnen
Mode thermischen Lichts ist durch Gl. (13.44) gegeben. Die mittlere Energie in der Mode ist E = ℎ𝜈n, sodass E = ℎ𝜈∕[exp(ℎ𝜈∕k 𝑇) − 1] wird. Eine Auftragung von E gegen ℎ𝜈 für zwei Werte von k𝑇 ist unten gezeigt. Im Grenzfall ℎ𝜈∕k 𝑇 ≪ 1, d. h. wenn die Photonenenergie viel kleiner ist als die thermische Energie, ist exp(ℎ𝜈∕k 𝑇) ≈ 1 + (ℎ𝜈∕k 𝑇), sodass E ≈ k 𝑇 gilt. In diesem Grenzfall ist die mittlere Energie gerade so groß, wie sie auch ohne Quantisierung des Lichts wäre.
Nach Gl. (14.12) ist die Wahrscheinlichkeitsdichte der spontanen Emission in eine bestimmte Mode 𝑝sp = (𝑐∕𝑉)𝜎(𝜈). Die Wahrscheinlichkeitsdichte der spontanen Emission in eine Reihe von Moden in dem Band von 𝜈 bis 𝜈 + d𝜈 ist daher 𝑃sp d𝜈 = (𝑐∕𝑉)𝜎(𝜈)𝑚(𝜈)𝑉 d𝜈, wobei 𝑚(𝜈) = 8π 𝜈2 ∕𝑐3 die Modendichte pro Volumeneinheit ist. Wenn wir 𝑚(𝜈) = 8π 𝜈2 ∕𝑐3 , 𝜎(𝜈) = 𝑆𝑔(𝜈) und 𝑆 = 2 𝜆 ∕8π 𝑡sp einsetzen, erhalten wir 𝑃sp d𝜈 = (1∕𝑡sp )𝑔(𝜈) d𝜈. Die Wahrscheinlichkeit, dass das emittierte Photon eine Frequenz zwischen 𝜈 und 𝜈 + d𝜈 hat, ist daher proportional zu 𝑔(𝜈) d𝜈. Wenn viele Photonen emittiert werden, ist ihre Frequenzverteilung daher proportional zu 𝑔(𝜈). Übung 14-2: Die dopplerverbreiterte Linienformfunktion ∞
a) Die mittlere Linienformfunktion ist 𝑔(𝜈) = ∫−∞ 𝑔(𝜈 − v 𝜈0 ∕𝑐)𝑝(v ) d v . Es ist zweckmäßig, die Integrationsvariable von v zu 𝑥 = (𝜈0 ∕𝑐)v zu transformieren. Das ergibt ∞
𝑔(𝜈) = ∫ 𝑔(𝜈 − 𝑥)𝑝𝑥 (𝑥) d𝑥
(1)
−∞
mit 𝑝𝑥 (𝑥) = (𝑐∕𝜈0 )𝑝(𝑐v ∕𝜈0 ). Der Grund hierfür ist, das die Transformation einer stochastischen Variable v in eine andere stochastische Variable 𝑎v mit einer Konstante 𝑎 die Wahrscheinlichkeitsdichte zu (1∕𝑎)𝑝(v ∕𝑎) modifiziert. Da 𝑝(v ) eine Gaußfunktion der Breite 𝜎v ist, ist 𝑝𝑥 (𝑥) eine Gaußfunktion der Breite 𝜎𝑥 = (𝜈0 ∕𝑐)𝜎v . Dabei besitzt 𝑥 die Einheit einer Frequenz. Gleichung (1) ist die Faltung einer Lorentzfunktion 𝑔(𝜈) der Breite Δ𝜈 mit einer Gaußfunktion der Breite 𝜎𝑥 .
1005
1006
Lösungen zu den Übungen
b) Für Δ𝜈 ≪ 𝜈0 𝜎v ∕𝑐 ist Δ𝜈 ≪ 𝜎𝑥 , d. h. die Lorentzfunktion 𝑔(𝜈) im Faltungsintegral (1) ist viel schmaler als die Gaußfunktion. Da 𝑔(𝜈) eine schmale Funktion mit der Fläche eins ist, kann sie für die Integration wie eine Deltafunktion 𝛿(𝜈) behandelt werden. Da∞ mit ergibt (1) 𝑔(𝜈) ≈ ∫−∞ 𝛿(𝜈 − 𝑥)𝑝𝑥 (𝑥) d𝑥 = 𝑝(𝜈), mit der Breite 𝜎D = d. h. 𝑔(𝜈) ist eine Gaußfunktion √ 𝜎𝑥 = (𝜈0 ∕𝑐)𝜎v = 𝜎v ∕𝜆 = k𝑇∕M∕𝜆. c) Bei 𝑇 = 300 K setzen wir für den Ne-Übergang die folgenden Daten in die Gln. (14.53) und (14.54) ein: 𝜆 ≈ 𝜆0 = 632.8 × 10−9 nm, M ≈ 20 𝑚P = 20(1.67 × 10−27 kg); damit ist Δ𝜈D = 2.35𝜎D = 1.3 × 109 Hz = 1.3 GHz. Für den CO2 -Übergang ist 𝜆 ≈ 𝜆0 = 10.6 × 10−6 μm, M ≈ 44 𝑚P = 44(1.67 × 10−27 kg); damit wird Δ𝜈D = 5.3 × 107 Hz = 53 MHz. d) Der maximale Wert von 𝜎(𝜈) ist 𝜎0 = 𝜎(𝜈0 ) = =
𝜆 8π 𝑡sp 2
𝜆2 𝜆2 1 𝑔(𝜈0 ) = [√ ] 8π 𝑡sp 8π 𝑡sp 2π 𝜎D
0.94(𝜆 2 ∕8π) 2.35 . [√ ]≈ 𝑡sp Δ𝜈D 2π Δ𝜈D
Für Lorentzlinien ist 𝜎0 = (2∕π)(𝜆 2 ∕8π)∕𝑡sp Δ𝜈 ≈ 0.64(𝜆 2 ∕8π)∕𝑡sp Δ𝜈; ähnlich dem Ergebnis für den gaußschen Fall. Δ𝜈D ist normalerweise viel größer als Δ𝜈, sodass 𝜎0 im Fall der dopplerverbreiterten Gaußfunktion viel kleiner ist. Übung 14-3: Die Frequenz maximaler Energiedichte eines schwarzen Strahlers Wir definieren 𝑥 = ℎ𝜈∕k 𝑇; damit liefert Gl. (14.67) für die Energiedichte 𝜚(𝜈) = [8π (k 𝑇)3 ∕𝑐3 ℎ2 ]𝑥3 ∕(e𝑥 − 1). Die
Frequenz, bei der 𝜚(𝜈) maximal wird, erhalten wir durch Nullsetzen der Ableitung d𝜚∕ d𝑥. Das gibt 3𝑥2 (e𝑥 − 1) − 𝑥3 e𝑥 = 0 oder 3(e𝑥 − 1) = 𝑥e𝑥 , woraus schließlich 𝑥 = 3(1 − e−𝑥 ) folgt. Diese nichtlineare Gleichung kann mithilfe eines Computers gelöst werden und liefert 𝑥 ≈ 2.821. Bei diesem Wert und bei 𝑇 = 300 K ist 𝜈 = 𝜈max = 𝑥k 𝑇∕ℎ = 1.76 × 1013 Hz = 17.6 THz, im Einklang mit der Auftragung in Abb. 14.31.
15
Laserverstärker
Übung 15-1: Dämpfung und Gewinn in einem Rubin-Laserverstärker
Die Parameter sind: 𝜆0 = 694.3 × 10−9 m, 𝑛 = 1.76, 𝜆 = 𝜆0 ∕𝑛, 𝑇 = 300 K, Δ𝜈 = 330 × 109 Hz, 𝑡sp = 3 × 10−3 s, N a = N1 + N2 = 1028 m−3 , ℎ = 6.62 × 10−34 J s, k = 1.38 × 10−23 J∕K.
a) Im thermischen Gleichgewicht ist N2 ∕N1 = exp[−(E 2 − E 1 )∕k 𝑇] = exp(−ℎ𝜈∕k 𝑇)
= exp(−ℎ𝑐0 ∕𝜆0 k 𝑇) ≈ 10−30 . Es gilt also N2 ≪ N1 , sodass N 1 ≈ Na ist, d. h. fast alle Atome befinden sich im tieferen Energieniveau. Die Abklingkonstante bei der Mittenfrequenz ist 𝛼(𝜈0 ) = −𝛾(𝜈0 ) = −N (𝜆 2 ∕8π 𝑡sp )𝑔(𝜈0 ) = −N (𝜆 2 ∕8π 𝑡sp )(2∕π Δ𝜈) mit N = N2 − N1 ≈ −N a . Daher folgt 𝛼(𝜈0 ) = N a (𝜆 2 ∕8π 𝑡sp )(2∕π Δ𝜈) = 3.98 × 104 m−1 = 398 cm−1 . b) Für 𝛾(𝜈0 ) = N(𝜆 2 ∕8π 𝑡sp )(2∕π Δ𝜈) = 50 m−1 wird die Besetzung invertiert, N = N2 − N1 = (50)(4)π2 𝑡sp Δ𝜈∕𝜆 2 = 1.254 × 1025 m−3 = 1.254 × 1019 cm−3 . c) Für einen Gewinn 𝐺 = exp[𝛾(𝜈0 )d ] = 4 ist d = ln(4)∕𝛾(𝜈0 ) = 2.77 cm erforderlich. Übung 15-2: Optisches Pumpen
Die Besetzungen der drei Energieniveaus (2, 1 und des Grundzustands) sind N 1 , N2 und NG . Die Gesamtbesetzung ist N 1 + N2 + NG = Na . Da Niveau 1 kurzlebig ist, gilt N1 ≈ 0, sodass N2 + NG ≈ Na ist und NG = Na − N 2 .
(1)
Das System wird durch Übergänge zwischen dem Grundzustand und Niveau 2 gepumpt, es ist also R2 = (N G − N2 )W . Aus (1) folgt dann R2 = (N a − 2N2 )W . Offensichtlich hängt die Geschwindigkeit R2 von N2 ab. Aus Gl. (15.21) erhalten wir für den Besetzungsunterschied N0 ≈ R2 𝑡sp = (N a − 2N2 )W 𝑡sp . Andererseits gilt N 0 = N2 − N1 ≈ N 2 . Folglich ist N 0 = (N a − 2N0 )W 𝑡sp , woraus N 0 = Na 𝑡sp W ∕(1 + 2𝑡sp W ) folgt. Für W ≪ 1∕2𝑡sp ist N 0 ≈ Na 𝑡sp W proportional zu W . Mit steigendem W wird N 0 aber schließlich gesättigt. Übung 15-3: Die Sättigungszeitkonstante
Für 𝑡sp ≪ 𝜏ns (d. h. wenn nichtstrahlende Übergänge langsam sind) und 𝑡sp ≪ 𝜏20 (d. h. wenn Zerfälle in Niveaus außer Niveau 1 langsam sind) und 𝑡sp ≫ 𝜏1 (d. h. wenn der Zerfall aus Niveau 1 schnell, das Niveau also kurzlebig ist), gilt 1∕𝜏2 = 1∕𝜏20 + 1∕𝑡sp + 1∕𝜏ns ≈ 1∕𝑡sp und daher 𝜏2 ≈ 𝑡sp und 1∕𝜏21 = 1∕𝑡sp + 1∕𝜏ns ≈ 1∕𝑡sp ; daher ist 𝜏21 ≈ 𝑡sp . Daraus folgt 𝜏S = 𝜏2 + 𝜏1 (1 − 𝜏2 ∕𝜏21 ) ≈ 𝑡sp + 𝜏1 (1 − 𝑡sp ∕𝑡sp ) ≈ 𝑡sp , d. h. die Sättigungszeit ist gleich 𝑡sp .
Laserverstärker
Übung 15-4: Pumpleistung in Drei- und Vierniveausystemen Dreiniveaulaser: Nach Gl. (15.44) ist der Wert von W , für den N0 = 0 ist, gleich 1∕𝑡sp . Für W = 2∕𝑡sp ist N0 = Na ∕3. Die Pumpleistung ist P = ℎ𝜈31 R mit R = (N 1 − N3 )W . Da N3 = 0 gilt, ist R = N1 W . Wegen N2 + N 1 = Na und N2 − N1 = N0 erhalten wir durch Subtraktion 2N1 = (2∕3)N a oder N1 = Na ∕3. Hieraus folgt R = (Na ∕3)W = (N a ∕3)(2∕𝑡sp ) = (2∕3)(N a ∕𝑡sp ). Folglich ist P = (2ℎ𝜈31 Na ∕3𝑡sp ). Vierniveaulaser: Für W = 0 ist nach Gl. (15.34) N0 = 0. Für W = 1∕2𝑡sp ist jedoch N0 = Na ∕3. Die Pumpleistung ist dann P = ℎ𝜈30 R mit R = (N G − N3 )W ≈ NG W . Wegen N G = Na − N0 = Na − Na ∕3 = 2Na ∕3 erhalten wir jedoch R = (2Na ∕3)(1∕2𝑡sp ) = Na ∕3𝑡sp und daraus P = ℎ𝜈30 Na ∕3𝑡sp . Vergleich: Unter den angegebenen Bedingungen und
unter der Annahme, dass die zwei Laser dieselben Werte von Na und 𝑡sp haben, ist das Verhältnis der Pumpleistungen des Vierniveau- und des Dreiniveaulasers gleich 𝜈30 ∕2𝜈31 .
mit (
2 Δ𝜈S 2 𝑏𝜙Δ𝜈 Δ𝜈 ) =( ) + 2 2 2π 2
=(
Δ𝜈 2 ) [1 + 𝑏𝜙 ( )] 2 π Δ𝜈
=(
Δ𝜈 ) [1 + 𝑏𝜙𝑔(𝜈0 )] 2
=(
𝜙 Δ𝜈 ) [1 + ]. 2 𝜙S (𝜈0 )
2
2
√ Daraus folgt Δ𝜈S = Δ𝜈 1 + 𝜙∕𝜙S (𝜈0 ). Übung 15-7: Verstärkte spontane Emission
a) Im ungesättigten Fall ist 𝛾(𝜈) = 𝛾0 (𝜈). Die Differentialgleichung (15.69) wird dann d𝜙∕ d𝑧 = 𝛾0 (𝜈)𝜙 + 𝜉sp (𝜈). Um diese Differentialgleichung zu lösen, versuchen wir einen Ansatz der Form 𝜙(𝑧) = 𝐴 exp[𝛾0 (𝜈)𝑧] + 𝐵. Wenn wir das in die Differentialgleichung einsetzen, bekommen wir 𝛾0 (𝜈)𝐴 exp[𝛾0 (𝜈)𝑧] = 𝛾0 (𝜈)𝐴 exp[𝛾0 (𝜈)𝑧] + 𝛾0 (𝜈)𝐵 + 𝜉sp (𝜈)
Übung 15-5: Sättigungs-Photonenflussdichte für Rubin
Die Parameter sind 𝜆0 = 694.3 × 10−9 m, 𝑛 = 1.76, 𝜏S = 2𝑡sp , Δ𝜈 = 6 × 1010 Hz, 𝑐0 = 3 × 108 m∕s, ℎ = 6.63 × 10−34 J s. Aus Gl. (15.47) folgt 𝜏S 𝜆2 1 = ( ) ( ) 𝑔(𝜈0 ) 8π 𝑡 𝜙S (𝜈0 ) sp =(
(𝜆0 ∕𝑛)2 2 𝜆2 )= ) (2) ( 8π π Δ𝜈 2π2 Δ𝜈
und daraus 𝜙S (𝜈0 ) = 4.186 × 1025 m−2 s−1 . Das entspricht einer Sättigungsintensität 𝐼S = ℎ𝜈0 𝜙S (𝜈0 ) = (𝑐0 ℎ∕𝜆0 )𝜙S (𝜈0 ) = 1.2 × 107 W∕m2 = 1200 W∕cm2 . Übung 15-6: Spektrale Verbreiterung eines gesättigten Verstärkers
Nach den Gln. (15.48), (15.49), (15.50) und (15.8) gilt 𝛾(𝜈) = 𝛾0 (𝜈)∕[1 + 𝜙∕𝜙S ] mit 𝛾0 (𝜈) = 𝑎𝑔(𝜈), 𝑎 = N0 𝜆 2 ∕ 8π 𝑡sp , 1∕𝜙S = 𝑏𝑔(𝜈), 𝑏 = (𝜆 2 ∕8π)(𝜏S ∕𝑡sp ) und 𝑔(𝜈) = (Δ𝜈∕2π)∕[(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ]. Daraus folgt 𝑎𝑔(𝜈) [1 + 𝜙𝑏𝑔(𝜈)] 𝑎(Δ𝜈∕2π) = 2 [(𝜈 − 𝜈0 ) + (Δ𝜈∕2)2 ] + 𝑏𝜙Δ𝜈∕2π 𝑎(Δ𝜈∕2π) = [(𝜈 − 𝜈0 )2 + (Δ𝜈S ∕2)2 ]
𝛾(𝜈) =
(1)
und daraus 𝐵 = −𝜉sp (𝜈)∕𝛾0 (𝜈). Um die Anfangsbedingung 𝜙(0) = 0 zu erfüllen, muss 𝐴 + 𝐵 = 0 oder 𝐴 = −𝐵 = 𝜉sp (𝜈)∕𝛾0 (𝜈) gelten. Daraus folgt die Lösung 𝜙(𝑧) = 𝜙sp {exp[𝛾0 (𝜈)𝑧] − 1} mit 𝜙sp (𝜈) = 𝜉sp (𝜈)∕𝛾0 (𝜈). Bei 𝑧 = d ist 𝜙(d ) = 𝜙sp {exp[𝛾0 (𝜈)d ] − 1}. b) Der Lorentz-Gewinnkoeffizient ist 𝛾0 (𝜈) =
𝛾0 (𝜈0 )(Δ𝜈∕2)2 . [(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ]
Die Frequenzabhängigkeit des (auf eine Höhe von 1) normierten Gewinnkoeffizienten 𝑔(𝜈) =
(Δ𝜈∕2)2 𝛾0 (𝜈) = 𝛾0 (𝜈0 ) [(𝜈 − 𝜈0 )2 + (Δ𝜈∕2)2 ]
ist für Δ𝜈 = 𝜈0 ∕100 in der Grafik gezeigt. Diese Funktion unterscheidet sich von der in Gl. (15.8) angegebenen Lorentz-Linienformfunktion, die auf eine Fläche von 1 normiert ist. Die Grafik zeigt außerdem die Frequenzabhängigkeit der (ebenfalls auf eine Höhe von 1 normierten) entsprechenden Funktion für die ASE, 𝐺(𝜈) =
exp[𝛾0 (𝜈)d ] − 1 exp[𝑎𝑔(𝜈)] − 1 = , exp[𝛾0 (𝜈0 )d ] − 1 exp(𝑎) − 1
für 𝑎 = 𝛾0 (𝜈0 )d = 5. Offensichtlich ist 𝐺(𝜈) schmaler als 𝑔(𝜈).
1007
1008
Lösungen zu den Übungen
1
(𝜈 − 𝜈0 )2 = 2𝜎D2 ln [
g (ν)
𝛾0 (𝜈0 ) ] 𝛼R
oder (𝜈 − 𝜈0 ) = ±𝜎D
G (ν) 0
ν
ν0
√ √ √
2 ln [
𝛾0 (𝜈0 ) ]. 𝛼R
√ Damit wird 𝐵 = 2𝜎D 2 ln[𝛾0 (𝜈0 )∕𝛼R ] und somit 1∕2
−1∕2
𝐵 = 2Δ𝜈D (8 ln 2)
16
Laser
Übung 16-1: Die Laserschwelle eines Rubinlasers
Die Parameter sind 𝜆0 = 694.3 × 10−9 m, 𝑛 = 1.76, 𝜆 = 𝜆0 ∕𝑛, Δ𝜈 = 330 × 109 Hz, Na = N1 + N2 = 1.58 × 1019 cm−3 , ℎ = 6.62 × 10−34 J s, k = 1.38 × 10−23 J∕K, 𝑐0 = 3 × 108 m∕s, 𝑐 = 𝑐0 ∕𝑛, 𝛼(𝜈0 ) = −𝛾0 (𝜈0 ) = 0.2 cm−1 , d = 10 cm, A = 1 cm2 . a) Es gilt 𝛾(𝜈) = N0 𝜎(𝜈) mit N 0 = N 2 − N 1 . Bei 𝑇 = 300 K ist im thermischen Gleichgewicht N 2 ∕N 1 = exp(−ℎ𝜈∕k 𝑇) = exp(−ℎ𝑐0 ∕𝜆0 k 𝑇) ≈ 10−30 (siehe Übung 15-1). Daher ist N2 ≪ N 1 und N 1 ≈ N a , d. h. fast alle Atome liegen im tieferen Zustand vor. In diesem Fall ist N0 ≈ −Na . Der Gewinnkoeffizient 𝛾(𝜈0 ) = N0 𝜎(𝜈0 ) = −N a 𝜎(𝜈0 ) ist dann negativ und entspricht einem Absorptionskoeffizienten 𝛼(𝜈0 ) = Na 𝜎(𝜈0 ). Wegen 𝛼(𝜈0 ) = 0.2 cm−1 ist dann 𝜎(𝜈0 ) = 𝛼(𝜈0 )∕Na = 1.27 × 10−20 cm2 . b) Der Resonator hat die Parameter d = 0.1 m, ℛ1 = ℛ2 = 0.8 und 𝛼S = 0. Sein Verlustkoeffizient ist 𝛼R = 𝛼S + (1∕2d ) ln(1∕ℛ1 ℛ2 ) = 2.231 m−1 = 0.0223 cm−1 . Die Photonenlebensdauer ist folglich 𝜏P = (𝛼R 𝑐)−1 = 1.49 × 10−9 s = 1.49 ns. c) Die Schwellen-Besetzungsdifferenz ist NSch = 𝛼R ∕ 𝜎(𝜈0 ) = (0.0223 cm−1 )∕(1.27 × 10−20 cm2 ) = 1.76 × 1018 cm−3 . Übung 16-2: Die Zahl der Moden in einem Gaslaser
a) Es gilt 𝛾0 (𝜈) = 𝛾0 (𝜈0 ) exp[−(𝜈 − 𝜈0 )2 ∕2𝜎D2 ] mit Δ𝜈D = √ 8 ln 2 𝜎D . Das erlaubte Schwingungsband erhalten wir, indem wir den Gewinnkoeffizienten 𝛾0 (𝜈) gleich dem Verlustkoeffizienten 𝛼R setzen: 𝛾0 (𝜈0 ) exp [−
(𝜈 − 𝜈0 )2 2𝜎D2
] = 𝛼R
oder (𝜈 − 𝜈0 )2 2𝜎D2
= ln [
𝛾0 (𝜈0 ) ], 𝛼R
𝛾0 (𝜈0 ) {2 ln [ ]} 𝛼R
.
(1)
b) Die Parameter sind Δ𝜈D = 1.5 × 109 Hz, 𝛾0 (𝜈0 ) = 2 × 10−3 cm−1 , d = 100 cm, ℛ1 = 1, ℛ2 = 0.97, 𝛼S = 0; daraus folgt 𝛼R = 𝛼S + (1∕2d ) ln (1∕ℛ1 ℛ2 ) = 1.52 × 10−4 cm−1 . Für die Bandbreite erhalten wir aus (1) 𝐵 = 2.89 × 109 Hz = 2.89 GHz. Für den Abstand der Moden gilt 𝜈F = 𝑐∕2d = (𝑐0 ∕𝑛)∕2d . Wenn wir 𝑛 = 1, d = 100 cm und 𝑐0 = 3 × 1010 cm∕s einsetzen, erhalten wir 𝜈F = 1.5 × 108 Hz = 0.15 GHz. Für die Zahl der Moden erhalten wir 𝑀 = 𝐵∕𝜈F = 19.3 entsprechend einem Maximum von 19 Moden. Übung 16-3: Die Geschwindigkeitsgleichung für den Besetzungsunterschied eines Vierniveausystems
Wegen 𝜏1 ≪ 𝜏sp ist Niveau 1 kurzlebig und wir können die Näherung N1 ≈ 0 verwenden. Daher gilt N = N 2 − N1 ≈ N2 . Wenn wir N 1 = 0 und N 2 = N in Gl. (15.22) einsetzen und 𝜏2 ≈ 𝑡sp annehmen, erhalten wir dN N − NW ind . = R2 − 𝑡sp d𝑡
(1)
Für W ind = 0 und im stationären Zustand ist R2 − N ∕𝑡sp = 0, sodass N 0 = R2 𝑡sp der Besetzungsunterschied im stationären Zustand ohne Strahlung ist. Wenn wir R2 = N0 ∕𝑡sp in (1) einsetzen, erhalten wir N0 dN N − − NW ind . = 𝑡sp 𝑡sp d𝑡
(2)
Diese Gleichung ist bis auf einen Faktor 2, der in dem W ind -Term fehlt, identisch mit Gl. (16.54). Das kann wie folgt erklärt werden: Im Dreiniveaulaser vermindert eine optische Emission N2 um eins und erhöht gleichzeitig N 1 um eins, sodass N = N2 − N1 um zwei kleiner wird. In einem Vierniveausystem ist Niveau 1 kurzlebig und kann keine Population aufbauen, sodass eine Emission eine Abnahme von N2 um eins, aber keine Änderung von N 1 (das immer null ist) bewirkt; das Resultat ist daher eine Abnahme von N um eins.
Laser
Übung 16-4: Ein gepulster Rubinlaser Gegeben: 𝜆0 = 694.3 × 10−9 m, 𝑛 = 1.76, 𝜎 = 1.27 ×
10−24 m2 , ℎ = 6.62 × 10−34 J s, 𝑐0 = 3 × 108 m∕s. Resonator: d = 10 cm, ℛ1 = ℛ2 = 0.8, 𝛼S = 0. Der Verlustkoeffizient ist 𝛼R = 𝛼S + (1∕2d ) ln(1∕ℛ1 ℛ2 ) = 2.231 m−1 . Die Photonenlebensdauer ist 𝜏P = 1∕𝑐𝛼R = 𝑛∕𝑐0 𝛼R = 1.49 × 10−9 s = 1.49 ns. Schwellen-Besetzungsdifferenz: NSch = 𝛼R ∕𝜎 = 1.76 × 1024 m−3 . Maximalleistung: Wegen Ni ∕NSch = 6 erhalten wir mithilfe von Gl. (16.63) nmax = (1∕2)N i [1 + (1∕6) ln(1∕6) − (1∕6)] = 2.82 × 1024 . Damit wird nmax ∕ NSch = 1.604. Das stimmt mit der Darstellung in Abb. 16.38 für N i ∕NSch = 6 überein. Aus Gl. (16.61) erhalten wir für die Maximalleistung P max = ℎ𝜈𝒯(𝑐∕2d )𝑉nmax . Wenn wir 𝑐 = 𝑐0 ∕𝑛, 𝜈 = 𝑐0 ∕𝜆0 und 𝒯 = 1 − ℛ1 einsetzen und annehmen, dass der Kristall einen Querschnitt von 1 cm2 und ein Volumen 𝑉 = 10−4 d = 10−5 m3 besitzt, erhalten wir Pmax = 1.38 × 109 W = 1.38 GW. Energie: Um die Energie zu bestimmen, müssen wir den Besetzungsunterschied Nf am Ende kennen. Wegen 𝑋 = N i ∕NSch = 6 erhalten wir für 𝑌 = Nf ∕NSch mithilfe von Gl. (16.71) 𝑌 exp (−𝑌) = 𝑋 exp (−𝑋) = 6 exp (−6) = 0.015. Also ist 𝑌 exp (−𝑌) = 0.015 und daher 𝑌 ≈ 0.015 oder Nf = 0.015N Sch . Die Energie ist dann durch Gl. (16.72) gegeben: E = (1∕2)ℎ𝜈𝒯(𝑐∕2d )𝑉𝜏P (Ni − Nf ) = 3.83 J. Pulsdauer: Die Pulsform ist die Kurve für N ind ∕NSch = 6 in Abb. 16.38. Nach dieser Abbildung ist die FWHM-Pulsdauer etwa 1.5𝜏P . Eine Näherung für die Pulsdauer erhalten wir, wenn wir die Pulsenergie [nach Gl. (16.72) etwa 3.83 J] durch die Peakleistung [1.38 GW laut Gl. (16.64)] dividieren, 𝜏P ≈ E ∕P max = 2.78 × 10−9 s = 2.78 ns. Diese Rechnung ergibt also 𝜏P ≈ 1.87𝜏P . Da wir dabei eine Rechteckform des Pulses angenommen haben, ist das natürlich nur eine grobe Näherung.
samtamplitude nach Gl. (16.77) gleich 𝒜(𝑡) =
=1+
2
sin [𝑀π(𝑡 − 𝑧∕𝑐)∕T F ] 2
sin [π(𝑡 − 𝑧∕𝑐)∕T F ]
.
Bei 𝑧 = 0 und für 𝐴 = 1 und 𝑀 = 11 ist die Intensität 𝐼(𝑡) = 121[sin(11π 𝑡∕T F )∕ sin(π 𝑡∕T F )]2 . Diese Funktion in Abbildung (a) aufgetragen. Sie beschreibt einen periodischen Satz von schmalen Pulsen der Höhe 121. b) Wenn die Beträge durch exp(−𝑞2 ∕50) gegeben und die Phasen gleich (z. B. 0) sind, ist die komplexe Ge-
5 ∑
𝑞2π 𝑡 𝑞2 ) ) exp (i 50 TF
2 exp (−
𝑞=1
𝑞2π 𝑡 𝑞2 ). ) cos ( 50 TF
Die Funktion 𝐼(𝑡) = |𝒜(𝑡)|2 ist in Abbildung (b) aufgetragen. Auch sie beschreibt einen periodischen Satz von schmalen Pulsen; die Nebenmaxima sind gegenüber (a) reduziert. c) In diesem Fall sind die Beträge gleich und die Phasen zufällig. Wir erhalten 𝒜(𝑡) =
5 ∑
exp (
i𝑞2π 𝑡
𝑞 = −5
TF
+ i𝜑𝑞 ) ,
wobei die 𝜑𝑞 unabhängige zufällige Zahlen sind, die zwischen 0 und 2π gleichverteilt sind. Mithilfe eines Computerprogramms wurde 𝐼(𝑡) = |𝒜(𝑡)|2 berechnet und gegen 𝑡 aufgetragen. Die zufälligen Phasen 𝜑𝑞 wurden mithilfe eines Zufallszahlgenerators erzeugt. Das Ergebnis ist in Abbildung (c) dargestellt; es ist eine zufällige Funktion, deren Werte in der Regel zwischen 0 und 50 liegen und die sich nach jedem Intervall T F periodisch wiederholt. 121
(a) I(t) 0
0
TF
2TF
3TF
0
TF
2TF
3TF
0
TF
2TF
3TF
100
(b) I(t) 0
𝐼(𝑡, 𝑧) = |𝐴|2
exp (−
𝑞 = −5
Übung 16-5: Pulserzeugung durch Modenkopplung
a) Wenn die Beträge und Phasen gleich sind, ist die Intensität durch Gl. (15.4-32) gegeben,
5 ∑
50
(c) I(t) 0
1009
1010
Lösungen zu den Übungen
17
Halbleiteroptik
Übung 17-2: Exponentielle Näherung für die Fermifunktion Für E − E F ≫ k 𝑇 wird Gl. (17.9) in guter Näherung zu
Übung 17-1: Energie-Impuls-Beziehung für ein freies Elektron
einer Exponentialfunktion,
a) Die eindimensionale zeitunabhängige Schrödingergleichung für ein Teilchen der Masse 𝑚0 in einem Potential V = 0 (entsprechend einem freien, d. h. ungebundenen Teilchen) lautet −ℏ2 𝜕 2 𝜓(𝑥) = E 𝜓(𝑥) . 2𝑚0 𝜕𝑥2
und daher E = ℏ2 𝑘2 ∕2𝑚0 . b) Die relativistische Beziehung zwischen Energie und Impuls ist
1∕2 √ 𝑝2 𝑐 2 E = 𝑝2 𝑐2 + 𝑚02 𝑐4 = [𝑚02 𝑐4 (1 + 2 )] 𝑚0 𝑐 4
≈ 𝑚0 𝑐2 (1 + = 𝑚0 𝑐 2 +
𝑝2 𝑐 2 2𝑚02 𝑐4
)
𝑝2 . 2𝑚0
Da 𝑚0 𝑐 die Ruheenergie des Teilchens ist, beträgt die kinetische Energie eines freien nichtrelativistischen Elektrons mit der Masse 𝑚0 gerade E = 𝑝2 ∕2𝑚0 . Mit 𝑝 = ℏ𝑘 wird daraus E = ℏ2 𝑘2 ∕2𝑚0 ; die Energie ist also [im Einklang mit Gl. (17.3)] eine quadratische Funktion von 𝑘. Ein freies Photon besitzt dagegen keine Ruhemasse; damit wird 𝑚0 = 0 und aus (1) folgt E = 𝑝𝑐. Mit 𝑝 = ℏ𝑘 ist nun E = 𝑐ℏ𝑘; die Energie variiert also linear mit 𝑘. Dieser Unterschied bewirkt Unterschiede in den Dispersionsdiagrammen von Elektronen in Halbleitern (siehe Abb. 17.5) bzw. Photonen in photonischen Kristallen (siehe Abb. 7.19). 2
E − EF ] dE , k𝑇
(2)
EL
wobei 𝐴 = (2𝑚L )3∕2 ∕2π2 ℏ3 eine Konstante ist. Um das Integral in (2) auszuwerten, benutzen wir die Transformation 𝑢 = (E − E L )∕k 𝑇. Damit folgt exp[−(E − E F )∕k𝑇] = exp(−𝑢) exp[−(E L − E F )∕k𝑇], und das Integral wird ∞
n = 𝐴(k 𝑇)
3∕2
(1)
Für ein freies Elektron mit der Masse 𝑚0 beträgt die Ruheenergie 𝑚0 𝑐2 = 0.511 MeV. Für ein nichtrelativistisches Elektron ist es daher zweckmäßig, die Energie in eine Taylorreihe zu entwickeln und nur den ersten Term zu berücksichtigen. √ Wir erinnern uns, dass für 𝑥 ≪ 1 näherungsweise 1 + 𝑥 ≈ 1 + 𝑥∕2 gilt und erhalten
(1)
Wenn wir nun (1) in Gl (17.11) einsetzen und Gl. (17.7) verwenden, erhalten wir: n = ∫ 𝐴(E − E L )1∕2 exp [−
−ℏ2 (−i𝑘)2 e−i𝑘𝑥 = E e−i𝑘𝑥 2𝑚0
E = 𝑝2 𝑐2 + 𝑚02 𝑐4 .
E − EF ]. k𝑇
∞
Wenn wir eine Probefunktion in Form einer ebenen Welle 𝜓(𝑥) = 𝐴e−i𝑘𝑥 mit einer Konstante 𝐴 einsetzen, erhalten wir
2
𝑓(E ) ≈ exp [−
=
E − EF exp [− L ] ∫ 𝑢1∕2 exp(−𝑢) d𝑢 k𝑇
4π(2𝑚L k𝑇) ℎ3
3∕2
√
0
EL − EF π exp [− ], 4 k𝑇
woraus Gl. (17.12) folgt. Eine entsprechende Analyse führt zu Gl. (17.13), und Gl. (17.14) folgt dann durch Multiplikation. Für 𝑚V = 𝑚L ist NL = NV und die Gln. (17.12) und (17.13) liefern E − EV E − EF n − L ]. = exp [+ F p k𝑇 k𝑇
(3)
Für (E L − E F ) < (E F − E V ) ist das Argument der Exponentialfunktion somit positiv und es gilt n > p, d. h. wenn E F näher am Leitungs- als am Valenzband liegt, dann ist n > p und umgekehrt. Übung 17-3: Bestimmung der Quasiferminiveaus aus den Elektronen- und Lochkonzentrationen a) Bei 𝑇 = 0 K ist die Fermifunktion 𝑓L (E ) für E < E FL
gleich 1 und ansonsten 0. Wenn wir diese Tatsache zusammen mit den Gln. (17.7) und (17.10) verwenden, um das Integral in Gl. (17.11) zu lösen, erhalten wir E FL
n = ∫ 𝐴(E − E L )1∕2 d E = (2∕3)𝐴(E FL − E L )3∕2 , EL
wobei 𝐴 = (2𝑚L )3∕2 ∕2π2 ℏ3 eine Konstante ist. Hieraus folgt E FL − E L = (3n∕2𝐴)2∕3 und daraus Gl. (17.18a). Gleichung (17.18b) kann entsprechend erhalten werden.
Halbleiteroptik
b) Die Konzentration n ist die Fläche unter der Funktion 𝜚L (E )𝑓L (E ). Für 𝑇 > 0 K ist 𝑓L (E ) nicht mehr auf die Werte 1 und 0 mit einem Übergang bei E FL beschränkt (siehe mittlerer Teil der Grafik). Wenn das Quasiferminiveau jedoch tief im Leitungsband liegt, ist das Produkt 𝜌L (E )𝑓L (E ) eine glatte Funktion, deren Fläche etwa der im Fall 𝑇 = 0 entspricht, wie der rechte Teil der Grafik zeigt. In diesem Fall ist der Ausdruck aus Gl. (17.18a) näherungsweise anwendbar. Eine entsprechende Argumentation für das Valenzband belegt auch die näherungsweise Gültigkeit von Gl. (17.18b).
T>0
T > 0 T= 0
T= 0
eV umzurechnen, und setzen die Werte ein: E FL − E FV = E g +
+
ϱL ( )
fL( )
ϱL ( ) fL ( )
Übung 17-4: Injektion von Elektron-Loch-Paaren in GaAs Für GaAs ist E g = 1.42 eV, 𝑚L = 0.07𝑚0 , 𝑚V = 0.5𝑚0 ,
𝑚0 = 9.11 × 10−31 kg, r = 10−11 cm3 ∕s und 𝑇 = 300 K.
a) Wenn wir ni = 1.8 × 106 cm−3 aus Tabelle 17.3 und n0 = 1016 cm−3 benutzen, ist p0 = n2i ∕n0 = 3.24 × 10−4 cm−3 . In diesem Fall gilt n0 ≫ p0 . b) Bei Injektion mit einer Geschwindigkeit R = 1023 cm−3 s−1 können die Konzentrationen im stationären Zustand aus Gl. (17.22) bestimmt werden; das ergibt R = r(np − n0 p0 ) = rΔn(n0 + p0 + Δn) ≈ rΔn(n0 + Δn), woraus Δn2 + n0 Δn − R∕r = 0 folgt. Wenn wir diese Gleichung nach Δn auflösen, erhalten wir 1∕2
1 4R Δn = ( ) [−n0 + (n20 + ) 2 r
] = 9.5 × 1016 cm−3 .
Folglich ist Δn in diesem Fall etwa 9.5mal so groß wie n0 . c) Da Δn = 9.5 × 1016 cm−3 ≫ n0 ist, benutzen wir Gl. (17.24), um 𝜏 ≈ 952 ns zu erhalten. d) Der Abstand zwischen den Quasiferminiveaus bei 𝑇 = 0 K kann aus Gl. (17.18) bestimmt werden: E FL − E FV = E g + (3π2 )2∕3 (
ℏ2 n2∕3 p2∕3 + ]. )[ 2 𝑚L 𝑚V
Nun konvertieren wir n = n0 + Δn und p = p0 + Δn ≈ Δn von cm−3 zu m−3 , indem wir mit 106 multiplizieren, dividieren durch die Elementarladung 𝑒, um J in
(3π2 )2∕3 ℏ2 (10 × 1021 + 95 × 1021 )2∕3 [ 2 𝑚0 𝑒 0.07
(95 × 1021 )2∕3 ] 0.5
= Eg +
(3π2 )2∕3 ℏ2 22.3 × 1014 20.8 × 1014 + [ ] 2 𝑚0 𝑒 0.07 0.5
= E g + 4.785 × +
L
(p × 106 )2∕3 ] 0.5
= Eg + +
(3π2 )2∕3 ℏ2 (n × 106 )2∕3 [ 2 𝑚0 𝑒 0.07
43.8 × 10−68 22.3 × 1014 [ 0.07 5.74 × 10−48
20.8 × 1014 ] 0.5
= E g + 0.013 eV . E FL − E FV ist also um 0.013 eV größer als E g , also ist E FL − E FV = 1.433 eV. Mithilfe der Gln. (17.18a) bzw. (17.18b) erhalten wir E FL − E L ≈ 0.011 eV bzw. E V − E FV ≈ 0.002 eV; die Quasiferminiveaus liegen somit
innerhalb des Leitungs- bzw. Valenzbands, aber nahe bei den jeweiligen Bandkanten. Weder E FL − E L noch E V − E FV ist jedoch ≫ 𝑘𝑇 = 0.026 eV für 300 K, sodass die Gln. (17.18a) und (17.18b) nicht für die Ladungsträgerkonzentrationen bei Zimmertemperatur verwendet werden können (siehe Übung 17-4); aus diesem Grund war für diesen Teil der Aufgabe explizit 𝑇 = 0 K angegeben. Übung 17-5: Energieniveaus einer Quantenschicht Innerhalb der Quantenschicht (0 < 𝑥 < d ) gilt V = 0, und
die eindimensionale zeitunabhängige Schrödingerglei2 2 chung lautet (−ℏ2 ∕2𝑚) d 𝜓∕ d𝑥2 = E 𝜓 oder d 𝜓∕ d𝑥2 + 𝑘2 𝜓 = 0 mit 𝑘2 = 2𝑚E∕ℏ2 . Diese Gleichung hat die allgemeine Lösung 𝜓(𝑥) = 𝐴 sin(𝑘𝑥) + 𝐵 cos(𝑘𝑥). An den Grenzen der Quantenschicht (𝑥 = 0 und 𝑥 = d ) muss 𝜓(𝑥) = 0 gelten. Daher muss 𝐵 = 0 und sin(𝑘d ) = 0 sein. Das ist nur dann möglich, wenn 𝑘d = 𝑞π mit 𝑞 = 1, 2, 3, … ist, wenn 𝑘 also wie für die stehenden Wellen in einem Fabry-Pérot-Resonator [siehe Gl. (11.2) und (11.3)] einen der Werte 𝑘𝑞 = 𝑞π∕d annimmt. Die entsprechende Energie E = (ℏ2 ∕2𝑚)𝑘2 wird somit auf die Werte E 𝑞 = (ℏ2 ∕2𝑚)(𝑞π∕d )2 gequantelt. Die ersten drei Energieniveaus (𝑞 = 1, 2, 3) sind daher E 1 = 4.9ℏ2 ∕𝑚d 2 , E 2 = 19.7ℏ2 ∕𝑚 d 2 und E 3 = 44ℏ2 ∕𝑚 d 2 . Zum Vergleich: Eine Quantenschicht mit der endlichen Potentialtiefe V 0 = 32ℏ2 ∕𝑚d 2 besitzt die Energien E 1 = 3.2ℏ2 ∕𝑚 d 2 , E 2 = 11.9ℏ2 ∕𝑚 d 2 und 𝐸3 = 25.9ℏ2 ∕𝑚 d 2 ,
1011
1012
Lösungen zu den Übungen
wie Abb. 17.30(b) zeigt. Die Endlichkeit der Potentialbarriere verringert den Abstand der Energieniveaus und bewirkt ein Kontinuum von Energieniveaus oberhalb von V 0 . Übung 17-6: Absorption und Emission von Photonen im Vergleich a) Im thermischen Gleichgewicht ist E FL = E FV = E F und gemäß Gl. (17.9) 𝑓(E ) = 1∕{1 + exp[(E − E F )∕k 𝑇]}. Die Differenz der Emissions- und der Ab-
sorptionsgeschwindigkeit ist durch die Gln. (17.52) bzw. (17.53) gegeben; er beträgt 𝑓E (𝜈) − 𝑓Ab (𝜈) = 𝑓L (E 2 ) − 𝑓V (E 1 ). Im thermischen Gleichgewicht gilt 𝑓L (E ) = 𝑓V (E ) = 𝑓(E ) und daher 𝑓E (𝜈) − 𝑓Ab (𝜈) = 𝑓(E 2 ) − 𝑓(E 1 ). Da 𝑓(E ) eine monotone abnehmende Funktion von E ist, ist 𝑓(E2 ) < 𝑓(E 1 ) und daher 𝑓E (𝜈) < 𝑓Ab (𝜈), d. h. die Geschwindigkeit der Emission ist geringer als die der Absorption. b) Im Quasigleichgewicht ist 𝑓E (𝜈) − 𝑓Ab (𝜈) = 𝑓L (E 2 ) − 𝑓V (E 1 ) 1 = 1 + exp[(E 2 − E FL )∕k𝑇] 1 . − 1 + exp[(E 1 − E FV )∕k 𝑇] Dieser Ausdruck ist positiv, wenn exp[(E 2 − E FL )∕k 𝑇] < exp[(E 1 − E FV )∕k 𝑇] bzw. (E 2 − E FL ) < (E 1 − E FV ) oder einfach E 2 − E 1 < E FL − E FV ist. Da E 2 − E 1 = ℎ𝜈 gilt, ist die Emissionsrate genau dann größer als die Absorptionsgeschwindigkeit, wenn ℎ𝜈 < E FL − E FV oder E FL − E FV > ℎ𝜈 gilt. Das bedeutet, dass der Abstand zwischen den zwei Ferminiveaus größer sein muss als die Bandlücke, d. h. dass E FL und E FV innerhalb des Leitungs- bzw. Valenzbands liegen müssen. Übung 17-7: Wellenlänge der maximalen Interbandabsorption
Aus (17.71) folgt, dass 𝛼(𝜈) proportional zu (ℎ𝜈 − E g )1∕2 ∕(ℎ𝜈)2 ist. Diese Funktion hat ein Maximum 𝜈max , wenn ihre Ableitung nach 𝜈 gleich 0 ist. Das ist für −2(ℎ𝜈 − E g )1∕2 + (1∕2)ℎ𝜈(ℎ𝜈 − E g )−1∕2 = 0 bzw. ℎ𝜈max ∕4 = (ℎ𝜈max − E g ) oder ℎ𝜈max = (4∕3)E g der Fall. Um das Maximum 𝜆max der Wellenlänge zu finden, müssen wir 𝛼(𝜈) als 𝛼(𝜆0 ) schreiben und die Ableitung nach 𝜆0 bilden. Wegen 𝜈 = 𝑐0 ∕𝜆0 gilt 𝛼(𝜆0 ) ∝ (ℎ𝑐0 ∕𝜆0 − ℎ𝑐0 ∕𝜆g )1∕2 (𝜆0 ∕ℎ𝑐0 )2 ∝ (1∕𝜆0 − 1∕𝜆g )1∕2 (𝜆0 )2 . Nullsetzen der Ableitung von 𝛼(𝜆0 ) liefert 1∕2
2(
1 𝜆max
−
1 ) 𝜆g
𝜆max −
1 1 1 − ) ( 2 𝜆max 𝜆g
−1∕2
(
2 𝜆max 2 𝜆max
)=0
3
oder 4(1∕𝜆max − 1∕𝜆g )𝜆max = 1, woraus 𝜆max = 𝜆g folgt. 4 Für GaAs ist E g = 1.42 eV und daher 𝜆max = (3∕4)1.24∕ E g = 0.65 μm (am Rand des roten Spektralbereichs). Aus Aufgabe 14-6 wissen wir, dass wir 𝜆max im Allgemeinen nicht einfach aus 𝑐0 ∕𝜈max berechnen dürfen. In diesem Fall zeigt sich jedoch, dass 𝑐0 ∕𝜈max ebenfalls gerade (3∕4)𝑐0 ℎ∕E g ergibt – beide Ansätze liefern hier also dasselbe Ergebnis.
18
LED und Laserdioden
Übung 18-1: Quasiferminiveaus eines gepumpten Halbleiters a) Bei 𝑇 = 0 K ist die Fermifunktion 𝑓L (E ) für E < E FL
gleich 1 und ansonsten 0. Wenn wir diese Tatsache zusammen mit den Gln. (17.7) und (17.10) verwenden, um das Integral in Gl. (17.11) zu berechnen, erhalten wir E FL
Δn = ∫ 𝐴(E − E L )1∕2 d E =
2 𝐴(E FL − E L )3∕2 , 3
EL
wobei 𝐴 = (2𝑚L )3∕2 ∕2π2 ℏ3 eine Konstante ist. Daraus folgt E FL − E L = (3Δn∕2𝐴)2∕3 und daraus wiederum Gl. (18.11a). Gleichung (18.11b) kann entsprechend erhalten werden, und Gl. (18.11c) folgt dann durch einfache Subtraktion. Die Rechnung ist dieselbe wie die in Übung 17-3. b) Es gilt 𝑓E (𝜈) = 𝑓L (E 2 )[1 − 𝑓V (E 1 )] mit E 2 = E L + (𝑚r ∕𝑚L )(ℎ𝜈 − E g ) und E 1 = E 2 − ℎ𝜈. Bei 𝑇 = 0 K ist die Fermifunktion 𝑓L (E 2 ) eins, wenn E 2 < E FL gilt, und sonst null. Entsprechend ist die Fermifunktion 𝑓V (E 1 ) gleich eins, wenn E 1 < E FV ist, und sonst null. Für ℎ𝜈 > E g nimmt E 2 mit steigendem ℎ𝜈 zu und E 1 ab. So lange beide Werte aber unterhalb von E FL bzw. oberhalb von E FV liegen, ist 𝑓L (E 2 ) = 1 und 𝑓V (E 1 ) = 1, sodass 𝑓E (𝜈) = 1 gilt. Wenn ℎ𝜈 den Wert E FL − E FV übersteigt, wird E 2 größer als E FL und E 1 wird kleiner als E FV , sodass 𝑓L (E 2 ) = 0 und 𝑓V (E 1 ) = 1 ist und daher 𝑓E (𝜈) = 0 wird. Die Funktion 𝑓E (𝜈) ist daher eine Rechteckfunktion mit dem Wert 1 im Intervall E g < ℎ𝜈 < E FL − E FV und 0 außerhalb dieses Bereichs. Die Geschwindigkeit r sp der spontanen Emission ist proportional zu 𝜚(𝜈)𝑓E (𝜈) mit 𝜚(𝜈) ∝ (ℎ𝜈 − E g )1∕2 . Ihre Abhängigkeit von 𝜈 ist daher wie in der Grafik in Teil (a) gezeigt. Eine Erhöhung der Temperatur (𝑇 > 0 K) bewirkt eine Glättung der Fermifunktion und daher der Funktionen 𝑓E (𝜈) und r sp (𝜈), wie Teil (b) der Grafik zeigt.
LED und Laserdioden
T= 0 K
T>0 K
bzw. 𝑢1∕2 exp(−𝑢) = (1∕2)3∕2 e−1∕2 .
fE( ν)
Quadrieren dieser Gleichung führt zu 𝑢 exp(−2𝑢) = (1∕2)3 e−1 = 0.046. Mithilfe eines Computers stellen wir fest, dass die Wurzeln dieser Gleichung etwa 𝑢1 = 0.051 und 𝑢2 = 1.84 sind. Die Entfernung zwischen diesen Punkten ist 𝑢2 − 𝑢1 = 1.789 ≈ 1.8. Das entspricht
ϱ (ν)
sp(ν ) FL- FV
g
hν
FL- FV
g
(a)
hν
(b)
Übung 18-2: Spektrale Intensität der Injektionselektrolumineszenz bei schwacher Injektion Aus den Gln. (18.3)–(18.6) folgt r sp (𝜈) = 𝜏s−1 𝜚(𝜈)𝑓E (𝜈) mit 𝜚(𝜈) = [(2𝑚r )3∕2 ∕πℏ2 ](ℎ𝜈 − E g )1∕2 und 𝑓E (𝜈) = 𝑓L (E 2 )[1 − 𝑓V (E 1 )].
Wenn die Fermiverteilungen näherungsweise durch ihre Ausläufer beschrieben werden, erhalten wir 𝑓L (E 2 ) ≈ exp [−
(E 2 − E FL ) ] k𝑇
und 1 − 𝑓V (E 1 ) ≈ exp [−
(E FV − E 1 ) ] k𝑇
und daher (E FL − E FV ) (E − E 1 ) ] exp [− 2 ] k𝑇 k𝑇 (E FL − E FV ) ℎ𝜈 ] exp (− ) . = exp [ k𝑇 k𝑇
𝑓E (𝜈) ≈ exp [
Wenn wir diese Näherung für 𝑓E (𝜈) in den obigen Ausdruck für r sp (𝜈) einsetzen, erhalten wir die Gln. (18.12a) und (18.12b). Übung 18-3: Spektrale Linienbreite der Elektrolumineszenz
a) Gleichung (18.12a) kann in der Form r sp (𝜈) = 𝐷(k 𝑇)1∕2 𝑢1∕2 exp(−𝑢) mit 𝑢 = (ℎ𝜈 − E g )∕k 𝑇 geschrieben werden. Die Funktion 𝑢1∕2 exp(−𝑢) nimmt ihren Maximalwert an, wenn ihre Ableitung nach 𝑢 verschwindet, d. h. wenn −𝑢1∕2 exp(−𝑢) + (1∕2)𝑢−1∕2 exp(−𝑢) = 0 ist. Daraus folgt 𝑢 = 1∕2, d. h. (ℎ𝜈 − E g )∕k 𝑇 = 1∕2 oder ℎ𝜈 = E g + k𝑇∕2. b) Das Maximum der Funktion 𝑢1∕2 exp(−𝑢) liegt bei 𝑢 = 1∕2; der Funktionswert an dieser Stelle ist (1∕2)1∕2 exp(−1∕2). Die Hälfte dieses Maximalwerts erreicht die Funktion bei 𝑢1∕2 exp(−𝑢) (1∕2)1∕2
exp(−1∕2) = 1∕2
[
(ℎ𝜈2 − E g ) k𝑇
−
(ℎ𝜈1 − E g ) k𝑇
] ≈ 1.8
oder ℎ(𝜈2 − 𝜈1 ) ≈ 1.8k 𝑇. Die spektrale Halbwertsbreite ist daher im Einklang mit Gl. (18.14) Δ𝜈 ≈ 1.8k 𝑇∕ℎ, unabhängig von 𝜈. c) Wegen 𝜈 = 𝑐∕𝜆 ist Δ𝜈 = −(𝑐∕𝜆 2 ) Δ𝜆, und daher entspricht die Breite Δ𝜈 ≈ 1.8k 𝑇∕ℎ einer Breite Δ𝜆 = 2 2 2 ∕𝑐)Δ𝜈 = (𝜆max ∕𝑐)(1.8k 𝑇∕ℎ) = 1.8(𝜆max ∕𝑐ℎ)k𝑇. (𝜆max Wenn k 𝑇 in eV ausgedrückt wird, können wir k𝑇 durch k 𝑇∕𝑒 ersetzen. Wenn 𝜆max in μm ausgedrückt wird, können wir 𝜆max durch 𝜆max × 10−6 ersetzen. 2 × 10−12 ∕𝑐0 ℎ)k𝑇∕𝑒. Daher gilt Δ𝜆 × 10−6 = 1.8(𝜆max Wenn wir die Konstanten einsetzen, erhalten wir 2 2 Δ𝜆 = 1.8𝜆max k 𝑇∕1.24 = 1.45𝜆max k 𝑇. d) Bei 𝑇 = 300 K ist k𝑇 = 0.026 eV. Für 𝜆max = 0.8 μm ist daher Δ𝜈 = 1.8k 𝑇∕ℎ = 1.126 × 1011 Hz = 11.26 THz und Δ𝜆 = 0.024 μm = 24 nm. Für 𝜆max = 1.6 μm ist Δ𝜈 = 1.8k 𝑇∕ℎ = 1.126 × 1011 Hz = 11.26 THz und Δ𝜆 = 0.096 μm = 96 nm. Die Frequenzbreite Δ𝜈 ist somit dieselbe (da sie nur von k𝑇 abhängt), wohingegen die Wellenlängenbreite Δ𝜆 proportional zu 𝜆 2 ist und bei größeren Wellenlängen zunimmt. Übung 18-4: Auskopplung von Licht aus einer LED mit ebenen Oberflächen
a) Es gilt 𝜂3√ = (1∕2)(1 − cos 𝜃k ) und sin 𝜃k = 1∕𝑛, sodass √ 2 cos 𝜃k = 1 − sin 𝜃k und 𝜂3 = (1∕2)(1 − 1 − 1∕𝑛2 ) ist. Da für 1∕𝑛2 ≪ 1 in guter Näherung 1∕2
(1 −
1 ) 𝑛2
≈1−
1 2𝑛2
gilt, erhalten wir 𝜂3 ≈
1 1 1 )= 2 . ( 2 2𝑛2 4𝑛 −1
b) Es gilt 𝜃k = sin (1∕𝑛) und daher für GaAs: (1) −1 = 16.1◦ und 𝜂3 = 0.019 , 𝜃k = sin 3.6 für GaN: (1) −1 = 23.6◦ und 𝜂3 = 0.040 , 𝜃k = sin 2.5
1013
1014
Lösungen zu den Übungen
für das Polymer: (1) −1 = 41.8◦ und 𝜂3 = 0.111 . 𝜃k = sin 1.5 c) Den kritischen Winkel 𝜃k1 für die Grenzfläche von GaAs (𝑛 = 3.6) zu dem Polymer (𝑛 = 1.5) erhalten wir −1 aus 𝑛1 sin 𝜃k1 = 𝑛2 bzw. 𝜃k1 = sin (1.5∕3.6) = 24.6◦ ; damit ist 𝜂3 = (1∕2)[1 − cos(24.6◦ )] = 0.045. In Teil (b) hatten wir für die Auskopplung von Licht aus GaAs in Luft 𝜂3 (GaAs) = 0.019 erhalten; der Verstärkungsfaktor beträgt somit 0.045∕0.019 =≈ 2.4. d) Für 𝑛1 = 3.6 auf 𝑛2 gilt √ (𝑛1 − 𝑛2 )2 𝑛2 2 ⎤ 1⎡ × 1 − ( )⎥ 𝜂2 𝜂3 = [1 − 1 − ] ⎢ 2 𝑛1 (𝑛1 + 𝑛2 )2 ⎦ ⎣ 2 3 𝑛 𝑛 4𝑛1 𝑛2 1 2 2 × = . ≈ (𝑛1 + 𝑛2 )2 4 𝑛12 𝑛1 (𝑛1 + 𝑛2 )2 Für 𝑛2 auf 𝑛1 = 1 gilt 𝜂2′
𝜂3′
(𝑛 − 1)2 1⎡ = [1 − 2 ] × ⎢1 − 2 2 (𝑛2 + 1) ⎣ 𝑛33 . ≈ 𝑛2 (𝑛2 + 𝑛3 )2
√ 1−(
2 1 ⎤ )⎥ 𝑛2 ⎦
Das Produkt 𝜂2 𝜂3 𝜂2′ 𝜂3′ wird für 𝜕(𝜂2 𝜂3 𝜂2′ 𝜂3′ )∕𝜕𝑛2 = 0 maximal. Das ergibt 𝑛33 𝑛23 𝜕 × ( ) 𝜕𝑛2 𝑛1 (𝑛1 + 𝑛2 )2 𝑛2 (𝑛2 + 𝑛3 )2 𝑛33 𝜕 𝑛22 = ( )=0. 𝑛1 𝜕𝑛2 (𝑛1 + 𝑛2 )2 (𝑛2 + 𝑛3 )2 Also muss
[ (𝑛1 + 𝑛2 )2 (𝑛2 + 𝑛3 )2 ⋅ 2𝑛2 − 𝑛22 (𝑛1 + 𝑛2 )2 ] ⋅2(𝑛2 + 𝑛3 ) + (𝑛2 + 𝑛3 )2 ⋅ (𝑛1 + 𝑛2 ) = 0
oder 𝑛2 = 𝑛1 gelten. Mit anderen Worten: Unter Berücksichtigung der Fresnelreflexion ist die Einführung einer Zwischenschicht beliebiger Dicke nicht hilfreich, um den aus einer LED in Luft ausgekoppelten Anteil des Lichts zu maximieren. Wie Übung 7-1 zeigt, kann die Verwendung einer Viertelwellenschicht aus einem Material mit einem intermediären Brechungsindex in diesem Zusammenhang jedoch nützlich sein.
19
Photodetektoren
Übung 19-1: Signal/Rausch-Verhältnis des widerstandsbegrenzten optischen Empfängers
Die Parameter sind 𝜂 = 1, 𝑅L = 50 Ω, 𝑇 = 300 K, 𝐵 = 100 MHz = 108 Hz, 𝑒 = 1.6 × 10−19 C, 𝜆 = 1.55 μm = 1.55 × 10−6 m, ℎ = 6.63 × 10−34 J s, k = 1.38 × 10−23 J∕K.
Die Varianz des thermischen Rauschstroms ist 𝜎𝑖2 = 4k 𝑇∕𝑅L . Die Varianz des Photoelektronen-Rauschstroms ist 2𝑒 𝑖𝐵 = 2𝑒 2 𝛷𝐵. Wenn die zwei Varianzen gleich sind, ist 4k𝑇∕𝑅L = 2𝑒 2 𝛷𝐵 und der Photonenfluss ist daher 𝛷 = 2k𝑇∕ 𝑒 2 𝑅L 𝐵 = 6.5 × 107 Photonen pro Sekunde. Die optische Leistung ist dann 𝑃 = 𝛷ℎ𝜈 = 𝛷ℎ𝑐∕𝜆 = 8.3 × 10−12 W = 8.3 pW. Übung 19-2: Empfindlichkeit eines Lawinenphotodiodenempfängers 2
2
Aus Gl. (19.69) erhalten wir SRV0 = 𝐺 m0 ∕(𝐺 𝐹 m0 + 𝜎𝑞2 ) und daraus 2
m0 − SRV0 𝐹 m0 −
SRV0 𝜎2
=0. 2 𝐺 Das ist eine quadratische Gleichung in m0 ; ihre positive Lösung ist 1∕2 ⎤ ⎡ 4𝜎𝑞2 SRV0 1 ⎢ 2 2 m0 = ( ) SRV0 𝐹 + (SRV0 𝐹 + ) ⎥ 2 ⎥ 2 ⎢ 𝐺 ⎣ ⎦ 1∕2 ⎫ ⎧ 𝜎𝑞2 1 1 +[ + = SRV0 𝐹 . ] ⎬ ⎨2 4 SRV 𝐺 2 𝐹 2 0 ⎭ ⎩ 2 Im Grenzfall 𝜎𝑞 → 0 wird m0 = SRV0 𝐹.
Übung 19-3: Auswirkung der Quantenausbeute und des Hintergrundrauschens auf die Empfängerempfindlichkeit a) Bit 0: Es sind keine Photonen vorhanden, daher
gibt es mit der Wahrscheinlichkeit 1 genau 0 Photoelektronen; es gibt folglich keine Möglichkeit für einen Fehler und daher ist 𝑝0 = 0. Bit 1: Es gibt im Mittel n Photonen entsprechend einem Mittel von m = 𝜂n Photoelektronen. Mit der Wahrscheinlichkeit 𝑝(m) = mm exp(−m)∕m! werden m Photoelektronen nachgewiesen. Ein Fehler tritt ein, wenn keine Photoelektronen beobachtet werden. Die Wahrscheinlichkeit dafür ist 𝑝1 = 𝑝(0) = exp(−m) = exp(−𝜂n). Es gilt BFR = (1∕2)(𝑝1 + 𝑝0 ) = (1∕2) exp(−𝜂n). Für BFR = 10−19 ist 𝜂n = 20 oder n = 20∕𝜂. Die mittlere Zahl von Photonen pro Bit ist na = (1∕2)n = 10∕𝜂. b) Bit 0: Die Zahl n der Photonen ist poissonverteilt mit dem Mittel n𝐵 . Bit 1: Die Zahl n der Photonen ist poissonverteilt mit dem Mittel n𝐵 + n. Um zwischen Bit 0 und Bit 1 zu unterscheiden, wählt man eine Nachweisschwelle nSch aus. Für n > nSch wird auf Bit 1 entschieden, ansonsten auf Bit 0.
Akustooptik
Die Fehlerwahrscheinlichkeiten sind 𝑝0 für die Wahrscheinlichkeit, dass n > nSch ist, wenn 𝑝(n) mit dem Mittelwert n𝐵 poissonverteilt ist, und 𝑝1 für die Wahrscheinlichkeit, dass n ≤ nSch ist, wenn 𝑝(n) mit dem Mittelwert n𝐵 + n poissonverteilt ist. Dann ist 1 1 𝑝 + 𝑝 2 0 2 1 ∞ 1 ∑ n exp(−n𝐵 ) = n 2 n=n 𝐵 n!
außerhalb des Mediums ist 𝑛𝑁𝜆∕𝐷 = 𝑁𝜆0 ∕𝐷 = 211 × 10−3 rad = 0.12◦ . 𝑁 = (𝐷∕𝑣S )𝐵 ist umgekehrt proportional zu 𝑣S . Wenn alle Parameter gleich bleiben, aber 𝑣S von 6 km/s auf 3.1 km/s verringert wird, nimmt 𝑁 daher von 100 auf 100 × 6∕3.1 = 193.5 zu.
BFR =
Sch
+
nSch exp(−n𝐵 − n) 1∑ . (n𝐵 + n)n 2 0 n!
Das ist ein Ausdruck für BFR als Funktion von n𝐵 , n und nSch . Für gegebene Werte von n𝐵 und n können wir den Wert von nSch bestimmen, der BFR minimiert. Die erforderlichen Auftragungen können wir mithilfe eines Computers erzeugen. In dem Buch Photoelectron Statistics (B. Saleh, Springer 1978) sind auf S. 315 derartige Auftragungen gezeigt, die unter der Annahme nSch = n∕ ln(1 + n∕n𝐵 ) erzeugt wurden; diese Wahl stellt sich als optimal heraus. In dem angegebenen Buch wird BFR als 𝑃𝑒 bezeichnet, n𝐵 als n𝑏 und n als n𝑠 .
20 Akustooptik Übung 20-1: Parameter akustooptischer Modulatoren Modulator 1: Die Parameter sind 𝑛 = 1.46, 𝑣S = 6 ×
103 m∕s, 𝑓 = 60 MHz = 6 × 107 Hz, 𝜆0 = 633 × 10−9 m und δ𝜃 = 10−3 rad. Daraus folgt 𝜆 = 𝜆0 ∕𝑛 = 4.33 × 10−6 m und 𝛬 = 𝑣S ∕𝑓 = 1.2 × 10−4 m. Der Bragg−1 winkel ist 𝜃ℬ = sin (𝜆∕2𝛬) = 1.8 mrad, die Bandbreite ist 𝐵 = 𝑣S ∕𝐷 = 𝑣S ∕(𝜆∕δ𝜃) = 1.39 × 107 Hz = 13.9 MHz. Modulator 2: Die Parameter sind 𝑛 = 4.8, 𝑣S = 2.2 × 103 m∕s, 𝑓 = 100 MHz = 108 Hz, 𝜆0 = 10.6 × 10−6 m, 𝐷 = 1 mm = 10−3 m. Daraus folgt 𝜆 = 𝜆0 ∕𝑛 = 2.21 × 10−6 m und 𝛬 = 𝑣S ∕𝑓 = 2.2 × 10−5 m. Der Braggwin−1 kel ist 𝜃ℬ = sin (𝜆∕2𝛬) = 50 mrad, die Bandbreite ist 𝐵 = 𝑣S ∕𝐷 = 2.2 × 106 = 2.2 MHz. Übung 20-2: Parameter eines akustooptischen Scanners
Die Parameter sind 𝑣S = 6 × 103 m∕s, 𝑛 = 1.46, 𝜆0 = 633 × 10−9 m, 𝑓min = 4 × 107 Hz, 𝑓max = 6 × 107 Hz und 𝑁 = 100. Für den Strahlradius 𝐷 erhalten wir aus Gl. (20.51) 𝑁 = T 𝐵 = (𝐷∕𝑣S )𝐵 mit 𝐵 = 𝑓max − 𝑓min = 2 × 107 Hz. Folglich ist 𝐷 = 𝑁𝑣S ∕𝐵 = 0.03 m = 3 cm. Für den Scanwinkel Δ𝜃 erhalten wir wegen 𝑁 = Δ𝜃∕δ𝜃 und δ𝜃 = 𝜆∕𝐷 einfach Δ𝜃 = 𝑁𝜆∕𝐷. Dieser Winkel gilt innerhalb des Mediums. Der entsprechende Winkel
Übung 20-3: Auflösungsvermögen eines akustooptischen Filters −1
𝜃ℬ = sin (𝜆∕2𝛬) sei der Braggwinkel bei der Wellenlänge 𝜆. Wir untersuchen nun, was geschieht, wenn der Winkel 𝜃 auf 𝜃ℬ festgehalten und die Wellenlänge 𝜆 verändert wird. Der Braggwinkel ändert sich dann, sodass 𝜃 nicht mehr der Braggwinkel ist und der Reflexionsgrad abnimmt. Wie Abb. 20.6 zeigt, wird der Reflexionsgrad null, wenn sich sin 𝜃 um 𝜆∕2𝐿 von sin 𝜃ℬ unterscheidet, wobei 𝐿 die Länge der Zelle ist. Für 𝜆∕2𝛬 − 𝜆∕2𝛬 = 𝜆∕2𝐿 ist der Reflexionsgrad daher null. Für Δ𝜆 = 𝜆 − 𝜆 ist Δ𝜆∕2𝛬 = 𝜆∕2𝐿 und folglich Δ𝜆∕𝜆 = 𝛬∕𝐿 = (1∕𝑓)(𝑣S ∕𝐿) = 1∕𝑓 T , wobei T die Durchgangszeit ist. Daraus folgt, dass die Auflösung des Filters gleich 𝜆∕Δ𝜆 = 𝑓 T ist. Übung 20-4: Transversale akustische Welle in einem kubischen Kristall
Hier ist die einzige Komponente der Deformation 𝑠13 = 𝑠31 = 𝑠0 cos(𝛺𝑡 − 𝑞𝑧). Gemäß Tabelle 21.1 bezeichnen wir diese Komponente mit 𝑠5 . Gleichung (20.56) gibt die elastooptische Matrix eines kubischen Kristalls an. Die Komponenten des Impermeabilitätstensors 𝛈 sind daher ⎡η11 ⎤ ⎡p11 ⎢ ⎥ ⎢ ⎢η22 ⎥ ⎢p11 ⎢ ⎥ ⎢ ⎢η33 ⎥ ⎢p Δ ⎢ ⎥ = ⎢ 11 ⎢η32 ⎥ ⎢ 0 ⎢ ⎥ ⎢ ⎢η31 ⎥ ⎢ 0 ⎢ ⎥ ⎢ η 0 ⎣ 12 ⎦ ⎣
p12
p12
0
0
p11
p12
0
0
p12
p11
0
0
0
0
p44
0
0
0
0
p44
0
0
0
0
0 ⎤⎡0⎤ ⎥⎢ ⎥ 0 ⎥⎢0⎥ ⎥⎢ ⎥ 0 ⎥⎢0⎥ ⎥⎢ ⎥ . 0 ⎥⎢0⎥ ⎥⎢ ⎥ 0 ⎥ ⎢ 𝑠5 ⎥ ⎥⎢ ⎥ 0 p44 ⎦⎣ ⎦
Die einzige von null verschiedene Komponente ist Δη31 = Δη13 = p44 𝑠5 . Da der Kristall kubisch ist, ist η11 = η = η33 = 1∕𝑛2 . Daher ist das Indexellipsoid (das durch ∑22 η 𝑥 𝑥 = 1 mit 𝑖, 𝑗 = 1, 2, 3 gegeben ist) 𝑖𝑗 𝑖𝑗 𝑖 𝑗 𝑥12 + 𝑥22 + 𝑥32 𝑛2
+ 2p44 𝑠5 𝑥1 𝑥3 = 0
oder 𝑥22 𝑛2
+
𝑥12 + 𝑥32 𝑛2
+ 2p44 𝑠5 𝑥1 𝑥3 = 0 .
√ Mit der √ Transformation 𝑢1 = (𝑥1 − 𝑥3 )∕ 2, 𝑢3 = (𝑥1 + 𝑥3 )∕ 2 und 𝑢2 = 𝑥2 erhalten wir das Ellipsoid in der
1015
1016
Lösungen zu den Übungen
Form 𝑢12 ∕𝑛12 + 𝑢22 ∕𝑛22 + 𝑢32 ∕𝑛32 = 1 mit
Übung 21-2: Intensitätsmodulation mithilfe des Kerreffekts
1 1 = 2 + p44 𝑠5 , 2 𝑛 𝑛1
(1)
𝑛2 = 𝑛 , 1 1 = 2 − p44 𝑠5 . 2 𝑛 𝑛3
(2) (3)
Für p44 𝑠5 ≪ 1 liefern (1)–(3) das gewünschte Ergebnis.
21
Elektrooptik
Übung 21-1: Spektrale Antwort des Kopplungswirkungsgrads
2
Nach Gl. (21.22) ist die angelegte Spannung 𝑉 = 𝑉0 = √ 3𝒞𝜆0 d ∕π 𝑛3 r. Der Kopplungswirkungsgrad bei dieser angelegten Spannung und der Wellenlänge 𝜆0 ist 0. Bei einer anderen Wellenlänge 𝜆0 ist der Kopplungswirkungsgrad gemäß Gl. (21.23) 𝒯=
( π )2 2
2
sinc
⎧
2 1∕2 ⎫
𝑉 1 )] ( ) [1 + 3 ( ⎨ 2 𝑉01 ⎩
⎬ ⎭
,
√ wobei 𝑉01 = 3 𝒞 𝜆0 d ∕π 𝑛3 r die passende Umschaltspannung bei der neuen Wellenlänge 𝜆0 ist. Wir setzen 𝑉 = 𝑉0 und 𝑉0 ∕𝑉01 = (𝜆0 ∕𝜆0 )2 ein und erhalten so 1∕2
2 ⎫ 𝜆0 ⎤ 1 ⎡ 𝒯= sinc ( ) ⎢1 + 3 ( ) ⎥ . ⎨ 2 ⎬ 2 𝜆0 ⎦ ⎣ ⎩ ⎭ Zweckmäßigerweise wird 𝒯 als Funktion von 𝑢 ≡ (𝜆0 − 𝜆0 )∕𝜆 0 aufgetragen. 2 Die Beziehung 𝒯 = (π∕2)2 sinc {(1∕2)[1 + 3∕(1 + 𝑢)2 ]1∕2 }, die wir durch Einsetzen von 𝜆0 ∕𝜆0 = 1∕(1 + 𝑢) erhalten, ist in der Grafik aufgetragen. Bei 𝑢 = 0 ist der Kopplungswirkungsgrad wie erwartet gleich 0, mit steigendem |𝑢| nimmt 𝒯 jedoch zu, sodass etwas Licht durch das Bauelement durchgelassen wird. Für 𝑢 = 0.1 ist beispielsweise 𝒯 = 0.127; eine Abweichung von 10 % von der zentralen Wellenlänge hat demnach einen Kopplungswirkungsgrad von 1.27 % zur Folge.
( π )2
2
Wenn ein elektrisches Feld 𝐸 an ein isotropes Material mit einem Kerreffekt angelegt wird, wird das Material optisch einachsig mit der Achse in Feldrichtung und den Brechungsindizes 𝑛o (𝐸) = 𝑛 − (1∕2) 𝑛3 s12 𝐸 2 und 𝑛e (𝐸) = 𝑛 − (1∕2) 𝑛3 s11 𝐸 2 entsprechend Gl. (21.46) bzw. (21.47). In einem longitudinalen Modulator breitet sich das Licht entlang der Richtung des elektrischen Felds aus, sodass der Brechungsindex 𝑛o (𝐸) ist. Für eine Zelle der Länge d mit einer angelegten Spannung 𝑉 ist 𝐸 = 𝑉∕d , und die Phasenverschiebung ist
⎧
0.2
𝜑=(
2π π 𝑉 2π ) 𝑛 (𝐸)d = ( ) 𝑛d − ( ) 𝑛3 s12 ( ) d d 𝜆0 o 𝜆0 𝜆0 2
= 𝜑0 − π (
𝑉 ) , 𝑉π
wobei 𝜑0 = (2π∕𝜆0 )𝑛d und 𝑉π = (𝜆0 d ∕𝑛3 s12 )1∕2 ist. Da sich das Licht entlang der optischen Achse ausbreitet, gibt es keine Phasenverzögerung (d. h. 𝑉π = ∞).
22
Nichtlineare Optik
Übung 22-1: Erforderliche Lichtintensität zur Erzeugung nichtlinearer Effekte
a) Das Verhältnis des zweiten Terms zum ersten in Gl. (22.2) ist 2dℰ 2 ∕𝜖0 𝜒ℰ = 0.01, d. h. ℰ = 𝜖0 𝜒∕200d = 𝜖0 (𝑛2 − 1)∕200d. Wenn wir 𝜖0 = 8.85 × 10−12 F∕m, 𝑛 = 1.25 und d = 6.8 × 10−24 C∕V2 für ADP einsetzen, erhalten wir ℰ = 8.13 × 109 V∕m. Das entspricht einer Intensität 𝐼 = ℰ 2 ∕𝜂 mit 𝜂 = 𝜂0 ∕𝑛 und 𝜂0 = (𝜇0 ∕𝜖0 ) = 377 Ω. Daraus folgt 𝐼 = 2.63 × 1017 W∕m2 = 2.63 × 1013 W∕cm2 , ein außerordentlich hoher Wert. b) Das Verhältnis des dritten Terms zum ersten in Gl. (22.2) ist 4𝜒 (3) ℰ 2 ∕𝜖0 𝜒ℰ = 0.01, d. h. ℰ 2 = 𝜖0 𝜒∕400𝜒 (3) = 𝜖0 (𝑛2 − 1)∕400𝜒 (3) . Wenn wir 𝑛 = 1.6, 𝜖0 = 8.85 × 10−12 F∕m und 𝜒 (3) = 4.4 × 10−32 C m∕V3 für CS2 einsetzen, erhalten wir ℰ = 8.86 × 108 V/m und für die entsprechende Intensität 𝐼 = ℰ 2 ∕𝜂 = 𝑛ℰ 2 ∕𝜂0 = 3.33 × 1015 W∕m2 = 3.33 × 1011 W∕cm2 . Übung 22-2: Nicht kollineare Typ-II-Frequenzverdopplung
Nach Gl. (22.33) ist (siehe Grafik)
0 ‒0.5
0
0.5 u =
λ0 ‒ λ λ0
𝑛o (𝜔) sin 𝜃1 = 𝑛(𝜃 + 𝜃2 , 𝜔) sin 𝜃2 ,
(1)
𝑛o (𝜔) cos 𝜃1 + 𝑛(𝜃 + 𝜃2 , 𝜔) cos 𝜃2 = 2𝑛(𝜃, 2𝜔) .
(2)
Nichtlineare Optik
Daher ist 2
2
𝑛o2 (𝜔) sin 𝜃1 = 𝑛2 (𝜃 + 𝜃2 , 𝜔) sin 𝜃2 , 𝑛o2 (𝜔) cos2
(3)
𝜃1 = [2𝑛(𝜃, 2𝜔) − 𝑛(𝜃 + 𝜃2 , 𝜔) cos 𝜃2 ] . (4) 2
Übung 22-3: Nichtlineare optische Medien dritter Ordnung zeigen einen elektrooptischen Effekt
ω
e
ω
o
Es gilt 𝒫nl = 4𝜒 (3) 𝐸 3
2ω
θ1
3
e
θ2
1 1 = 4𝜒 (3) [𝐸(0) + 𝐸(𝜔)ei𝜔𝑡 + 𝐸(𝜔)∗ e−i𝜔𝑡 ] . 2 2 Der zu ei𝜔𝑡 proportionale Term hat die Amplitude (1∕2)𝑃nl (𝜔) mit 𝑃nl (𝜔) = 4𝜒 (3) [3𝐸(0)2 𝐸(𝜔) + (1∕2) |𝐸(𝜔)|2 𝐸(𝜔)]. Für |𝐸(𝜔)| ≪ 𝐸(0) ist der zweite Term vernachlässigbar, und wir erhalten 𝑃nl (𝜔) ≈ 12𝜒 (3) 𝐸(0)2 𝐸(𝜔) = 𝜖0 Δ𝑛𝐸(𝜔) mit Δ𝑛 = 12𝜒 (3) 𝐸(0)2 ∕𝜖0 . Wegen 𝜒 = 𝑛2 − 1 ist Δ𝜒 = 2𝑛Δ𝑛 und Δ𝑛 = Δ𝜒∕2𝑛. Daher ist Δ𝑛 ≈ 6𝜒 (3) 𝐸(0)2 ∕𝜖0 𝑛, was einer durch den elektrooptischen Kerreffekt verursachten Änderung des Brechungsindex von Δ𝑛 = −(1∕2)s𝑛2 𝐸(0)2 mit s = −12𝜒 (3) ∕𝜖0 𝑛4 entspricht.
chse
che A
Optis
θ
Durch Addition von (3) und (4) erhalten wir 𝑛o2 (𝜔) = 𝑛2 (𝜃 + 𝜃2 , 𝜔) + 4𝑛2 (𝜃, 2𝜔) − 4𝑛(𝜃, 2𝜔)𝑛(𝜃 + 𝜃2 , 𝜔) cos 𝜃2 und daraus 𝑛o2 (𝜔)
=[
cos2 (𝜃 + 𝜃2 ) 2 𝑛o,1
+
2 𝑛e,1
]
−1
cos2 𝜃 sin 𝜃 + 2 ] 2 𝑛o,2 𝑛e,2
− 4 cos 𝜃2 [
×[
−1
2
sin (𝜃 + 𝜃2 ) 2
+ 4[
Übung 22-4: Optische Kerrlinse 2
−
cos 𝜃 sin 𝜃 + 2 ] 2 𝑛o,2 𝑛e,2 2
cos2 (𝜃 + 𝜃2 ) 2 𝑛o,1
1 2
−
2
+
sin (𝜃 + 𝜃2 ) 2 𝑛e,1
]
1 2
.
(5)
Für einen KDP-Kristall ist 𝜆1 = 1.06 μm und 𝜆2 = 𝜆1 ∕2; daraus folgt 𝑛o,1 = 1.494, 𝑛e,1 = 1.4599, 𝑛o,2 = 1.5123 und 𝑛e,2 = 1.4707. Um (5) zu lösen, gehen wir wie folgt vor: a) Wir setzen 𝑛o,1 , 𝑛o,2 , 𝑛e,1 und 𝑛e,2 in (5) ein. b) Wir setzen für 𝜃 Werte von 0 → 90◦ ein. c) Wir verwenden Matlab oder ein ähnliches Programm, um den Winkel 𝜃2 zu finden, der (5) erfüllt. d) Wir verwenden (1), um 𝜃1 zu berechnen, 6 θ2 θ1, θ2 / °
Die Grafik zeigt eine Auftragung der so erhaltenen 𝜃1 und 𝜃2 gegen den Winkel 𝜃 zwischen der optischen Achse und der Richtung der frequenzverdoppelten Welle.
θ1
4
Die Intensität 𝐼 ≈ 𝐼0 [1 − (𝑥2 + 𝑦 2 )∕𝑊 2 ] entspricht einem Brechungsindex 𝑛(𝐼) = 𝑛 + 𝑛2 𝐼 = 𝑛 + 𝑛2 𝐼0 [1 − (𝑥2 + 𝑦 2 )∕𝑊 2 ] und dieser einer komplexen Amplitudentransmission exp[−i𝑘0 𝑛(𝐼)d ] = exp[−i𝑘0 𝑛d ] × exp {i𝑘0 𝑛2 d = ℎ0 exp [i𝑘0
𝐼0 − 𝐼0 (𝑥2 + 𝑦 2 ) } 𝑤2
(𝑥2 + 𝑦 2 ) ] 2𝑓
mit ℎ0 = exp[−i𝑘0 (𝑛 + 𝑛2 𝐼0 )d ] und 1∕2𝑓 = 𝑛2 𝐼0 d ∕𝑊 2 bzw. 𝑓 = 𝑊 2 ∕2𝑛2 𝐼0 d . Das Medium wirkt daher als Linse mit einer Brennweite 𝑓 umgekehrt proportional zu 𝐼0 . Übung 22-5: Optischer Kerreffekt in Anwesenheit von drei Wellen
Es gilt 𝒫nl = 4𝜒 (3) 𝐸 3 1 = 𝜒 (3) [𝐸(𝜔1 ) exp(i𝜔1 𝑡) + 𝐸(𝜔1 )∗ exp(−i𝜔1 𝑡) 2 + 𝐸(𝜔2 ) exp(i𝜔2 𝑡) + 𝐸(𝜔2 )∗ exp(−i𝜔2 𝑡) 3
+𝐸(𝜔3 ) exp(i𝜔3 𝑡) + 𝐸(𝜔3 )∗ exp(−i𝜔3 𝑡)] . 2
0
60
70
θ/°
80
90
Der Term, der wie exp(i𝜔1 𝑡) variiert, hat die Amplitude (1∕2)𝑃nl (𝜔1 ) mit [ 𝑃nl (𝜔1 ) = 𝜒 (3) 3𝐸(𝜔1 )|𝐸(𝜔1 )|2 + 6|𝐸(𝜔2 )|2 𝐸(𝜔1 ) ] +6|𝐸(𝜔3 )|2 𝐸(𝜔1 ) .
1017
1018
Lösungen zu den Übungen
Wenn wir 𝐼1 = |𝐸(𝜔1 )|2 ∕2𝜂, 𝐼2 = |𝐸(𝜔2 )|2 ∕2𝜂 und 𝐼3 = |𝐸(𝜔3 )|2 ∕2𝜂 einsetzen, erhalten wir 𝑃nl (𝜔1 ) = 2𝜂𝜒 (3) [3𝐼1 + 6𝐼2 + 6𝐼3 ]𝐸(𝜔1 ) = 2𝜖0 𝑛Δ𝑛1 𝐸(𝜔1 ) mit Δ𝑛 = 𝑛2 𝐼, 𝑛2 = 3𝜂𝜒 (3) ∕𝜖0 𝑛 = 3𝜂0 𝜒 (3) ∕𝜖0 𝑛2 und 𝐼 = 𝐼1 + 2𝐼2 + 2𝐼3 . Die Welle breitet sich mit einer Geschwindigkeit 𝑐0 ∕(𝑛 + Δ𝑛) = 𝑐0 ∕(𝑛 + 𝑛2 𝐼) aus, die von den Intensitäten der drei Wellen gesteuert wird. Übung 22-6: Frequenzverdopplung als entartete Dreiwellenmischung
Wie im Fall der nicht entarteten Dreiwellenmischung verwenden wir die Gln. (22.74), (22.75) und (22.76); in diesem Fall gibt es jedoch nur zwei Wellen mit den Frequenzen 𝜔1 = 𝜔 und 𝜔3 = 2𝜔. Wir setzen 𝐸=
1{ 𝐸 exp(i𝜔𝑡) + 𝐸1∗ exp(−i𝜔𝑡) + 𝐸3 exp(i2𝜔𝑡) 2 1 } +𝐸3∗ exp(−i2𝜔𝑡)
mit 𝑃1 = 2d𝐸3 𝐸1∗ und 𝑃3 = d𝐸1 𝐸1 . Wenn wir das in Gl. (22.75) einsetzen, folgt 1{ 𝑆 exp(i𝜔𝑡) + 𝑆1∗ exp(−i𝜔𝑡) + 𝑆3 exp(i2𝜔𝑡) 2 1 } +𝑆3∗ exp(−i2𝜔𝑡)
mit 𝑆1 = 𝜇0 𝜔2 𝑃1 = 2𝜇0 𝜔2 d𝐸3 𝐸1∗ und 𝑆3 = 𝜇0 (2𝜔)2 𝑃3 = 𝜇0 𝜔32 d𝐸1 𝐸1∗ . Hieraus folgt Gl. (22.89). Übung 22-7: Erhaltung der Photonenzahl: Die Manley-Rowe-Beziehung
Das Ergebnis ist aus den Gleichungen (2a), (2b) und (2c) in der Lösung von Übung 22-8 direkt ersichtlich. Übung 22-8: Energieerhaltung
Multiplikation von Gl. (22.93a) mit a∗1 ergibt da a∗1 1 d𝑧
=
−iga∗1 a∗2 a3
exp(−iΔ𝑘𝑧) .
= iga∗1 a∗2 a3 exp(−iΔ𝑘𝑧) + kompl. Konj. (2c) Nun multiplizieren wir (2a) mit ℏ𝜔1 , (2b) mit ℏ𝜔2 und (2c) mit ℏ𝜔3 und addieren die drei Gleichungen, ] d [ ℏ𝜔1 |a1 |2 + ℏ𝜔2 |a2 |2 + ℏ𝜔3 |a3 |2 d𝑧 = −igℏ(𝜔1 + 𝜔2 − 𝜔3 )a∗1 a∗2 a3 exp(−iΔ𝑘𝑧) + kompl. Konj. Wegen 𝜔3 = 𝜔1 + 𝜔2 ist die rechte Seite dieser Gleichung null und daher ist ] d [ ℏ𝜔1 |a1 |2 + ℏ𝜔2 |a2 |2 + ℏ𝜔3 |a3 |2 d𝑧 d (𝐼1 + 𝐼2 + 𝐼3 ) = 0 . = d𝑧 Übung 22-9: Die Gleichungen gekoppelter Wellen für die Frequenzverdopplung
in Gl. (22.76) ein und erhalten so 1{ 𝑃 exp(i𝜔𝑡) + 𝑃1∗ exp(−i𝜔𝑡) + 𝑃3 exp(i2𝜔𝑡) 𝒫nl = 2 1 } +𝑃3∗ exp(−i2𝜔𝑡)
𝒮nl =
d |a3 |2 = −iga1 a2 a∗3 exp(iΔ𝑘𝑧) + kompl. Konj. d𝑧
Wir schreiben 𝐸1 = (2𝜂ℏ𝜔)1∕2 a1 exp(−i𝑘1 𝑧) und 𝐸3 = (2𝜂ℏ2𝜔)1∕2 a3 exp(−i𝑘3 𝑧) und wenden die Gln. (22.92)– (22.89a) an; das liefert da1 ) exp(−i𝑘1 𝑧) (2𝜂ℏ𝜔)1∕2 (−i2𝑘1 ) ( d𝑧 = −2𝜇0 𝜔2 d(2𝜂ℏ𝜔)1∕2 (4𝜂ℏ𝜔)1∕2 a3 × exp(−i𝑘3 𝑧)a∗1 exp(i𝑘1 𝑧) . Daraus folgt 𝜇0 𝜔 2 d da1 (4𝜂ℏ𝜔)1∕2 a3 a∗1 exp(−iΔ𝑘𝑧) = i𝑘1 d𝑧 = −iga3 a∗1 exp(−iΔ𝑘𝑧) mit Δ𝑘 = 𝑘3 − 2𝑘1 und 𝜇0 𝜔 2 d (4𝜂ℏ𝜔)1∕2 g= 𝑘1 oder 2
g2 = (𝜇0 𝑐 𝜔d)2 (4𝜂ℏ𝜔) = (𝜂𝜔d)2 (4𝜂ℏ𝜔) = 4ℏ𝜔3 𝜂3 d . Auf entsprechende Weise kann auch Gl. (22.100b) erhalten werden. Übung 22-10: Summenfrequenzerzeugung im Infraroten
(1)
Nun addieren wir (1) zu ihrem komplex Konjugierten und beachten, dass a∗1 da1 ∕ d𝑧 + a1 da∗1 ∕ d𝑧 = (d∕ d𝑧)|a1 |2 ist; damit folgt d |a1 |2 = −iga∗1 a∗2 a3 exp(−iΔ𝑘𝑧) + kompl. Konj. (2a) d𝑧 Entsprechend ist d |a2 |2 = −iga∗1 a∗2 a3 exp(−iΔ𝑘𝑧) + kompl. Konj. , (2b) d𝑧
Die Parameter sind d = 1.5 × 10−22 C∕V2 , 𝑛 = 2.6, 𝜆1 = 10.6 × 10−6 m, 𝜆2 = 1.06 × 10−6 m, P 2 = 1 W, A = 10−8 m2 und 𝐿 = 10−2 m. Für die Wellenlänge erhalten wir wegen 𝜔3 = 𝜔1 + 𝜔2 sofort 1∕𝜆3 = 1∕𝜆1 + 1∕𝜆2 oder 𝜆3 = 𝜆1 𝜆2 ∕(𝜆1 + 𝜆2 ) = 0.9636 × 10−6 m = 963.6 nm. Der Wirkungsgrad der Konversion ist laut Gl. (22.116) 2 2𝜂03 𝜔32 (d ∕𝑛3 )(𝐿2 ∕A)P 2 . Wir setzen 𝜂0 = 377 Ω, 𝜔3 = 2 2 2π 𝑐0 ∕𝜆3 = 1.96 × 1015 rad∕s, d ∕𝑛3 = 1.3 × 10−45 C ∕V4 , 𝐿2 ∕𝐴 = 104 und 𝑐0 = 3 × 108 m∕s ein und erhalten einen Wirkungsgrad von 5.4 × 10−3 = 0.54 %.
Nichtlineare Optik
Übung 22-11: Gewinn eines optischen parametrischen Verstärkers
Die Parameter sind 𝜆1 = 2.5 μm, 𝜆3 = 1.064 μm, 𝐿 = 2 cm, 𝐺 = 3 dB, 𝑛 = 1.75 und d = 2.3 × 10−23 C∕V2 (für KDP). a) Wegen 𝜔2 = 𝜔3 − 𝜔1 ist 1∕𝜆2 = 1∕𝜆3 − 1∕𝜆1 . Daher gilt 2π 𝑐 1 1 = 2π 𝑐 ( − ) 𝜆2 𝜆3 𝜆1 und folglich 𝜆2 = 1.85 μm. b) Für 𝐶 erhalten wir √ √ 2 2𝜔1 𝜔2 𝜂03 d 𝜂0 3 2 𝐶= = 2π𝑐 d ( ) 0 𝜆1 𝜆2 𝑛 𝑛3 = 9 × 10−5 W−1∕2 . 2
c) Ein Gewinn von√3 dB bedeutet 𝐺 = cosh (𝛾𝐿∕2) = 2 und √daher 2√ = cosh(𝛾𝐿∕2) sowie 𝛾𝐿∕2 = −1 2 = ln(1 + 2). Folglich ist cosh √ 𝛾 = (2∕𝐿) ln(1 + 2) = 88 m−1 . √ Aus Gl. (22.120) folgt 𝛾 = 2𝐶 P3 ∕A und daher P3 𝛾 2 = ( ) = 2.39 × 1011 W∕m2 . 2𝐶 A
d) Bei einer Laserleistung von 2.39 W erhalten wir daher für den Strahlquerschnitt A = 10 μm2 . Übung 22-12: Erzeugung der dritten Harmonischen in der Näherung konstanter Pumpleistung
Wir gehen von den Helmholtzgleichungen für die Frequenzen der Grundmode und der dritten Harmonischen aus, ( 2 ) ∇ + 𝑘𝑞2 𝐸𝑞 = −𝑆𝑞 , 𝑞 = 1, 3 mit [ ( )] 𝑆1 = 𝜇0 𝜔12 𝜒 (3) 3𝐸3 𝐸1∗2 + 3𝐸1 |𝐸1 |2 + 2|𝐸3 |2 , [ ( )] 𝑆3 = 𝜇0 𝜔32 𝜒 (3) 𝐸13 + 3𝐸3 |𝐸3 |2 + 2|𝐸1 |2 . Mithilfe der Beziehung 𝐸𝑞 = 𝐴𝑞 exp(−i𝑘𝑞 𝑧) (𝑞 = 1, 3) und der Näherung der langsam variierenden Einhüllenden [Gl. (22.92)], d𝐴𝑞 [ ] (∇2 + 𝑘𝑞2 ) 𝐴𝑞 exp(−i𝑘𝑞 𝑧) ≈ −i2𝑘𝑞 ( ) exp(−i𝑘𝑞 𝑧) , d𝑧 nehmen die Helmholtzgleichungen die Form d𝐴1 3i = − 𝜂𝜔1 𝜒 (3) 2 d𝑧 [ ( )] × 𝐴3 𝐴1∗2 exp(iΔ𝑘𝑧) + 𝐴1 |𝐴1 |2 + 2|𝐴3 |2 , d𝐴3 i = − 𝜂𝜔3 𝜒 (3) 2 d𝑧 [ ( )] × 𝐴13 exp(−i𝛿𝑘𝑧) + 3𝐴3 |𝐴3 |2 + 2|𝐴1 |2 , mit Δ𝑘 = 3𝑘1 − 𝑘3 an. In der Näherung konstanter Pumpleistung (|𝐴3 | ≪ |𝐴1 |) wird die Amplitude der Grundwelle 𝐴1 näherungs-
weise als konstant angenommen (d. h. sie soll sich nicht mit 𝑧 ändern); für 𝐴3 gilt dann d𝐴3 i = − 𝜂𝜔3 𝜒 (3) 2 d𝑧 [ ( )] × 𝐴13 exp(−iΔ𝑘𝑧) + 3𝐴3 |𝐴3 |2 + 2|𝐴1 |2 . Der erste Term auf der rechten Seite dieser Gleichung beschreibt die Erzeugung der dritten Harmonischen, während der letzte Term den optischen Kerreffekt beschreibt. Diese Gleichung kann weiter vereinfacht werden, da |𝐴3 | ≪ |𝐴1 | gilt. Der Term |𝐴3 |2 in der Summe |𝐴3 |2 + 2|𝐴1 |2 kann daher vernachlässigt werden. Dasselbe gilt für den Term 6𝐴3 |𝐴1 |2 , der viel kleiner ist als 𝐴13 . Da 𝐴1 konstant ist, beschreibt der Term 6𝐴3 |𝐴1 |2 ohnehin nur eine konstante Änderung des Brechungsindex aufgrund des optischen Kerreffekts und kann auch aus diesem Grund ignoriert werden. Das Resultat ist somit d𝐴3 i ≈ − 𝜂𝜔3 𝜒 (3) 𝐴13 exp(−iΔ𝑘𝑧) . 2 d𝑧 √ Wenn wir noch 𝐴𝑞 = 2𝜂ℏ𝜔𝑞 a𝑞 einsetzen, wird daraus √ da3 = −iga31 exp(−iΔ𝑘𝑧) mit g = ℏ 𝜔13 𝜔3 𝜂2 𝜒 (3) . d𝑧 Übung 22-13: Polarisation für ein Medium aus anharmonischen Oszillatoren
Nach dem newtonschen Gesetz (Kraft = Masse × Beschleunigung) ist 2
𝑒ℰ − (𝜅𝑥 + 𝜅2 𝑥2 ) − 𝑚𝜎
d𝑥 𝑚d 𝑥 . = d𝑡 d𝑡2
Wir dividieren durch 𝑚, stellen die Terme um und setzen 𝜅∕𝑚 = 𝜔02 ein; so erhalten wir 2 𝜅2 2 ( 𝑒 ) d 𝑥 d𝑥 2 ℰ. + 𝜎 𝑥 + ( )𝑥 = + 𝜔 0 𝑚 𝑚 d𝑡2 d𝑡
(1)
Für ein Medium mit 𝑁 Atomen pro Volumeneinheit ist die Polarisation 𝒫 = N𝑒𝑥. Wir setzen daher 𝑥 = 𝒫∕N 𝑒 in (1) ein und erhalten 2
𝜅2 𝒫 2 d 𝒫 d𝒫 N𝑒 2 2 ) + 𝜎 𝒫 + ( + 𝜔 = )ℰ . ( 0 𝑚 N𝑒 𝑚 d𝑡2 d𝑡
(2)
Nun definieren wir die Parameter 𝜒0 und b, sodass 𝜔02 𝜖0 𝜒0 =
N𝑒 2
und
𝑚
(3)
𝜅2 (4) 𝑚 N𝑒 gilt; so erhalten wir Gl. (22.177). Gleichung (3) liefert 𝜒0 = N𝑒 2 ∕𝑚𝜔02 𝜖0 , und (4) gibt b = 𝜅2 ∕(𝑚N𝑒𝜔02 𝜖0 𝜒0 ). Mit2 hilfe von (3) erhalten wir daraus b = 𝜅2 ∕(N 𝑒 3 ). 𝜔02 𝜖0 𝜒0 b =
1019
1020
Lösungen zu den Übungen
und seiner maximalen Breite wird durch die folgenden Gleichungen beschrieben (siehe Tabelle 23.2): √ Pulsbreite: 𝜏1 = 𝜏0 1 + 𝑎 2 , (1)
Übung 22-14: Die millersche Regel
Wir betrachten die überlagerten Wellen ℰ = Re {𝐸(𝜔1 ) exp(i𝜔1 𝑡) + 𝐸(𝜔2 ) exp(i𝜔2 𝑡)} . Der erste Schritt (Ignorieren nichtlinearer Effekte) liefert eine Polarisation 𝒫 = Re {𝑃(𝜔1 ) exp(i𝜔1 𝑡) + 𝑃(𝜔2 ) exp(i𝜔2 𝑡)} 𝑃1 (𝜔1 ) = 𝜖0 𝜒(𝜔1 )𝐸(𝜔1 ) ,
(1a)
𝑃1 (𝜔2 ) = 𝜖0 𝜒(𝜔2 )𝐸(𝜔2 ) .
(1b)
Im zweiten Schritt führen wir eine antreibende Kraft 𝐹 = ℰ − b 𝒫 2 oder 𝐹 = Re {𝐸(𝜔1 ) exp(i𝜔1 𝑡) + 𝐸(𝜔2 ) exp(i𝜔2 𝑡)} − b [Re {𝑃1 (𝜔1 ) exp(i𝜔1 𝑡) + 𝑃1 (𝜔2 ) exp(i𝜔2 𝑡)}]
2
ein. Diese Kraft enthält viele Komponenten, darunter eine Komponente Re{𝐹(𝜔3 ) exp(i𝜔3 )} mit der Frequenz 𝜔3 = 𝜔2 + 𝜔1 und der komplexen Amplitude 𝐹(𝜔3 ) = −(b∕2)𝑃1 (𝜔1 )𝑃1 (𝜔2 ). Sie erzeugt eine Polarisation bei der Frequenz 𝜔3 mit der komplexen Amplitude 𝑃2 (𝜔3 ) = 𝜖0 𝜒(𝜔3 )𝐹(𝜔3 ) = 𝜖0 𝜒(𝜔3 )𝐹(−b∕2)𝑃1 (𝜔1 )𝑃1 (𝜔2 ) . Einsetzen aus (1) liefert b𝜖02
𝜒(𝜔1 )𝜒(𝜔2 )𝜒(𝜔3 ) ; 2 daraus folgt Gl. (22.183).
23
𝑎=
Dispersionslänge: 𝑧0 =
mit
𝑃2 (𝜔3 ) = −
Chirpparameter:
Ultraschnelle Optik
Übung 23-1: Dispersionskompensation in optischen Fasern
a) Die Dispersionslänge ist 𝑧0 = π 𝜏02 ∕𝐷𝜈 mit 𝐷𝜈 = −(𝜆02 ∕𝑐0 )𝐷𝜆 . Für das erste Fasersegment gilt 𝐷𝜆 = 20 ps/km nm = 2 × 10−5 s∕m2 , 𝜏0 = 10 ps = 10−11 s und 𝜆0 = 1.55 μm = 1.55 × 10−6 m. Damit erhalten wir 𝑧0 = 1.96 km. In einer Entfernung d 1 = 100 km sind der Chirpparameter √ und die Pulsdauer 𝑎 = d 1 ∕𝑧0 = 51 bzw. 𝜏1 = 𝜏1 1 + (d 1 ∕𝑧0 )2 ≈ 510 ps. b) Wenn der Dispersionskoeffizient des zweiten Segments gleich 𝐷𝜆′ = −100 ps∕(km nm) und seine Länge d 2 ist, dann lautet die Bedingung für die Dispersionskompensation d 1 𝐷𝜆 + d 2 𝐷𝜆′ = 0. Also ist d 2 = −d 1 𝐷𝜆 ∕𝐷𝜆′ = 20 km. Übung 23-2: Dispersionskompensation durch eine periodische Reihe von Phasenmodulatoren
Die Wirkung der Gruppengeschwindigkeitsdispersion auf die Pulsausbreitung über eine Entfernung d zwischen seiner minimalen Breite (wo er ungechirpt ist)
𝑧 , 𝑧0 π𝜏02 𝐷𝜈
(2) .
(3)
Der quadratische Phasenmodulator verändert die Pulsbreite nicht, aber den Chirpparameter. Eine Änderung um einen Faktor −2𝑎 erhalten wir für −2𝑎 = 𝜁𝜏1 .
(4)
Diese Veränderung stellt sicher, dass der Puls wie in Abb. 23.27 gezeigt periodisch variiert wird. Durch Einsetzen von (1), (2) und (3) in (4) erhalten wir Gl. (23.88).
24
Optische Verbindungen und Schalter
Übung 24-1: Verbindungskapazität
Wir nehmen an, dass das Hologramm in 𝐿 Subhologramme unterteilt ist, von denen jedes 𝑀 räumlich harmonische Funktionen (𝑀 1∕2 in 𝑥-Richtung und 𝑀 1∕2 in 𝑦-Richtung) enthält. Der auf jedes Subhologramm auftreffende Strahl wird gleichzeitig in 𝑀 Richtungen geleitet, sodass jeder von 𝐿 Punkten mit 𝑀 Punkten verbunden wird. Wenn 𝑎 × 𝑎 die Fläche des Hologramms ist, dann ist 𝑎2 ∕𝐿 die Fläche eines Subhologramms. Eine Länge 𝑎∕𝐿1∕2 entspricht dann einer Raumfrequenzunschärfe Δ𝜈 = 𝐿1∕2 ∕𝑎 (oder einer Winkelunschärfe 𝜆𝐿1∕2 ∕𝑎). Die 𝑀 harmonischen Funktionen auf einem Subhologramm müssen in jeder Richtung mindestens durch eine Raumfrequenz gleich dieser Unschärfe (𝐿1∕2 ∕𝑎) voneinander separiert sein, sodass die räumliche Bandbreite 𝐵 in einer Richtung mindestens 𝑀 1∕2 𝐿1∕2 ∕𝑎 betragen muss. Daraus folgt, dass 𝐵 ≥ 𝑀 1∕2 𝐿1∕2 ∕𝑎 oder (𝐵𝑎)2 ≥ 𝑀𝐿 gelten muss. Für 𝐵 = 1000 Linien pro mm und 𝑎 = 1 mm ist (𝐵𝑎)2 = 1000. Wenn jeder Punkt der Eingangsebene mit jedem Punkt der Ausgangsebene verbunden √ ist, d. h. 𝐿 = 𝑀, dann muss 𝑀 2 ≤ (𝐵𝑎)2 oder 𝑀 ≤ (𝐵𝑎)2 = 31.6 gelten. Also können höchstens 31 Punkte der Eingangsebene mit 31 Punkten der Ausgangsebene verbunden werden. Übung 24-2: Die logarithmische Karte
Die lokalen Raumfrequenzen sind 1 𝜕𝜑 1 1 (ln 𝑥 + 1 − 1 − 𝑥) = (ln 𝑥 − 𝑥) , = 2π 𝜕𝑥 𝜆d 𝜆d 1 𝜕𝜑 1 (ln 𝑦 − 𝑦) . = 𝜈𝑦 = 2π 𝜕𝑦 𝜆d
𝜈𝑥 =
Optische Verbindungen und Schalter
Daher sind die Ablenkwinkel 1 𝜃𝑥 = 𝜆𝜈𝑥 = (ln 𝑥 − 𝑥) , d
𝜃𝑦 = 𝜆𝜈𝑦 =
1 d
(ln 𝑦 − 𝑦) .
Strahlen, die am Hologramm an dem Ort (𝑥, 𝑦) entstehen, erreichen daher in einer Ebene in der Entfernung d den Ort (𝑥′ , 𝑦 ′ ) mit 𝑥′ = 𝑥 + 𝜃𝑥 d = ln 𝑥 und 𝑦 ′ = 𝑦 + 𝜃𝑦 d = ln 𝑦. Auf diese Weise wird die Transformation 𝑥′ = ln 𝑥 und 𝑦 ′ = ln 𝑦 realisiert. Die in Gl. (24.10) angegebene Phasenfunktion 𝜑(𝑥, 𝑦) erhalten wir mithilfe des Integrals ∫ ln(𝑥) d𝑥 = 𝑥 ln(𝑥) − 𝑥. Übung 24-3: Nichtlineare Funktionen mit Bistabilität a) ( x )= 1/[(x – 1)2 + a2], a = 0.1 2
100
( x)
0
IA
0
x
0
2
0
IE = IA / (IA)
1
0
IE = IA / (IA)
40
0
IE = IA / (IA)
30
0
IE = IA / (IA)
1000
0
IE = IA / (IA)
5
b) ( x ) = 1/[1+ a2sin2( x +θ )], a = 5, θ = π/4 1
3
IA
( x)
0
0
x
0
3
c) ( x ) = (1/2)[1 + cos(x + θ )], θ = 3π/4 6
1
( x)
0
IA
0
x
0
6
d) ( x ) = sinc 2[(a2 + x2)1/2], a = 2 3
0.02
IA
( x)
0
0
x
0
3
e) ( x ) = ( x +1)2/( x +a)2, a = – 5 4
3
( x)
0
IA
0
x
3
0
1021
1023
Stichwortverzeichnis Symbole 2f -System 90 3 dB-Breite 973 3-dB-Koppler 279 4f -System 99, 100
A abbildendes System 20, 98–105 Abbildungsgleichung 366 Auflösung zweier Punkte 367 einlinsiges 98, 101, 102 Impulsantwortfunktion 366 Nahfeld 104 Punktverbreiterungsfunktion 366 Abbildung einzelne Linse 40 inkohärente Beleuchtung 366 partiell kohärentes Licht 370 Zylinderlinse 12 Abbildungsbedingung 21 dicke Linse 23 paraxiales System 22 Abbildungsgleichung dünne Linse 12 Kugelspiegel 8 Linse 40 ABCD-Gesetz 68, 69 Aberration 11 chromatische 132, 833 Absorption 130–132, 430, 431, 433– 435 Faser 306 Absorptionseffizienz 143 Absorptionskoeffizient 131, 142 Absorptionsquerschnitt 143 effektiver 467 metallische Nanokugel 243 Abstimmungskurven 769 Abwärtskonvertierung siehe Differenzfrequenzerzeugung Actinoide 417 als Dotierionen 422
Elektronenkonfigurationen 419 Termsymbole 419 Add/Drop-Multiplexer 881–883, 962 konfigurierbarer 902 Airyfunktion 75 Airygleichungen 189 Airymuster 93, 94 Airyscheibchen 93, 94 Airystrahl 75 Anwendung 75 Erzeugung 75, 113 komplexe Einhüllende 75 akustische Pinzette 441 Akustooptik 705–725 anisotroper Medien 721 braggsche Beugung 723 photoelastischer Tensor 722 Theorie gekoppelter Wellen 711 akustooptischer Effekt 706, 707 Akzeptanzwinkel Faser 14, 291, 292, 920 Gradientenindexfaser 18 3+ Alexandrit (Cr :BeAl2 O4 ) 419 Energieniveaus 419 vibronische Zustände 420 Alexandritlaser 419, 420, 502, 505 Allotrope 552 AMOLED 749 Amplitude, komplexe siehe komplexe Amplitude Amplitudenmodulation 83, 252, 715 Amplitudentransmission, komplexe 38, 365 Beugungsgitter 40 dünne Linse 39 optische Komponenten 37 Platte mit variablem Brechungsindex 41 Platte mit variabler Dicke 38 Prisma 39 transparente Platte 37
Amplitudenumtastung 946, 947 anisotrope Medien 122, 123 Akustooptik 721–723 als Strahlteiler 178 Brechung 133, 137, 151, 178 Dispersionsrelation 168 Doppelbrechung 171 Indexellipsoid 166 Normalmoden 165 optische Eigenschaften 163 Permittivität 123, 164 snelliussches Gesetz 171 Suszeptibilität 123 Ansprechempfindlichkeit Laserdiode 622, 623 LED 594, 657 Photodetektor 654, 656, 657 Photodiode 666 Antenne Mikrowellen- 244 nichtresonante optische 244 optische 129, 244, 656 plasmonische 244 Radiofrequenz- 244 resonante optische 244 Antibunching 579 Antireflexbelag 191 anti-Stokesstreuung 451 Antwortzeit 938 Faser 308, 309, 935 Flüssigkristalle 744, 821 Kreuzphasenmodulation 900 Lawinenphotodiode 672 Photodetektor 657, 854, 855 Photodiode 663 Photoleiter 661 Schalter 900 Schottkydiode 668 Argonionenlaser 498 Arraydetektoren 679 Ausleseelektronik 680
Optik und Photonik, Dritte Auflage. Bahaa E. A. Saleh und Malvin C. Teich. © 2020 WILEY-VCH Verlag GmbH & Co. KGaA. Published 2020 by WILEY-VCH Verlag GmbH & Co. KGaA.
1024
Stichwortverzeichnis
Brennebenenarray 679 CCD 680 CMOS 680 Halbleiter- 680 Heterodyn- 680 Lawinenphotodioden 680 Mikrobolometer 679 Photoleiter 680 Atomchips 443 Atome 413–453 Absorption 430, 431, 433–435 Alkalimetalle 416 in äußeren Feldern 418 bosonische 418 Elektronenkonfigurationen 415, 416, 419 Energieniveaus 413, 414, 417 fermionische 418 Halogene 416 induzierte Emission 431, 433–435 Ionisierungsenergie 418 isotopenreine 418 künstliche (Quantenpunkte) 427 Lasereinschluss 440 Laserkühlung 440 Linienformfunktion 432 Masse 418 Mehrelektronen- 415 paulisches Ausschlussprinzip 415 Periodensystem 417 Schalen 415 spontane Emission 430, 432, 433 Termsymbole 416, 419 thermisches Gleichgewicht mit Photonen 443 Unterschalen 415 Wasserstoff 414 wasserstoffähnliche 414, 517 Wechselwirkung mit elektromagnetischen Moden 430 Wechselwirkung mit Photonen 430–443 Atominterferometrie 440, 442, 443 Atomoptik 440, 442 Atomstrahlen 442 Atomuhren 442 Atomverstärker 443 Aufwärtskonvertierung 767 Augendiagramm 936, 937 Auger-Rekombination 654 Ausbreitungskonstante 131, 206, 224, 263, 265, 269, 823, 887 Faser 298, 303 OPP-Welle 240
Auskopplungsmodulation 526 Auskopplungswirkungsgrad 592 LED 592, 593, 600 Austrittsarbeit 652 Autokorrelationsfunktion 351 Axicon 10, 39, 98 Azimutquantenzahl 415
B Band Leitungs- 425 spektrales 949 Valenz- 425 verbotenes elektronisches 425 verbotenes optisches 205, 238, 265 band tail 558 Bandbreite 354, 931 Brillouinstreuung 475 Laser 493 Laserverstärker 460, 486 Lichtquellen 354, 355 Raman-Faserlaser 510 Raman-Faserverstärker 474 Ramanstreuung 475 Bandlücke 544 AlGaAs 597, 598 AlGaN 597, 599 AlInGaN 597 (AlGa)𝑦 InP 597, 599 Diamant 426 direkte 547 elektronische 425 Führung durch photonische 314 GaAs 426 GaAs1−𝑥 P𝑥 597 GaAsSb 597 GaN 599 III-V-Halbleiter 597 indirekte 547, 573, 574 InGa1𝑥 As 597, 598 InGaAs1−𝑦 P𝑦 597, 598 InGaAsSb 598 InGaN 597, 599 In0.5 Ga0.5 P 597, 599 Isolator 425 photonische 185, 205–207, 215, 283 photonischer Kristall 206, 215 Silicium 426, 601 Bandlückenwellenlänge 571 Bandstruktur 425 Halbleiter 425 Halbmetalle 425 Isolator 425
Metalle 425 photonischer Kristall 206, 215 Bandstruktur-Engineering 633 Banyanschalter 908 Bauelement holographisches optisches 112 nichtreziprokes 180, 181 nichtreziprokes polarisierendes 179 polarisierendes 158 reziporokes 179 Beleuchtungsstärke 603 Bernoullientscheidung 394 Besetzungseinschluss, geschwindigkeitsabhängiger kohärenter 441 Besetzungsinversion 429, 459 Bedingung 457 LED 585 Bessel-Gauß-Strahl 75, 130 Erzeugung 75 Besselstrahl 39, 74, 75, 98 Erzeugung 98 quadratisch gemittelter Radius 75 Vergleich mit Gaußstrahl 74 Bestrahlungsstärke 603 Betalumineszenz 447 Beugung 34, 91–97 Analogie zu Dispersion 828, 829 braggsche 706, 711, 712, 723 Debye-Sears- 713 Fraunhofer- 92, 97 Fresnel- 92, 94–97 Raman-Nath- 713 Beugungsdispersion 816 Beugungsgitter 40, 82 Beugungslimit 104 Beugungsmuster 91 Beugungsordnung 41 Bildentstehung 4, 98 abbildendes System 102 dünne Linse 12 Kugelspiegel 8 partiell kohärente Beleuchtung 365–370 Bildpunkt 6 Bindung ionische 422, 424 kovalente 422, 424, 552 metallische 424 Van-der-Waals- 422, 424, 552 Biolumineszenz 447, 448 Biphoton 401 Biprisma 9, 39
Stichwortverzeichnis
bistabile optische Bauelemente 908– 915 Bistabilität 760, 909, 910 Bitfehlerrate 682, 696, 936 Augendiagramm 936, 937 Bitrate 936 Blasenjetschalter 895 Blendenfunktion 92 Blendenzahl 66, 103, 104 Blendschutzschirm 181 Blochmoden 186, 201, 202, 204, 214, 544, 985 Eigenwertproblem 204 Wellenzahl 201 Blochphase 204 Blochwellenzahl 204 bohrsche Periode 415, 523 bohrscher Radius 415 bohrsches Atommodell 414 Bolometer 651 Boltzmannkonstante 428 Boltzmannverteilung 392, 428, 429 Bornitrid 580 bornsche Näherung 138, 711, 762, 763 bornsches Postulat 414 β12 -Borophen 553 Bose-Einstein-Kondensat 430, 440, 442 Bose-Einstein-Statistik 392, 393, 418 Bosonen 384, 418, 430 Bowingparameter 581 Bow-Tie-Resonator 325 Braggbedingung 195 Braggfrequenz 195 Bragggitter 194–200, 344, 516 Chirpfilter 818 dielektrisches 198 Faser- 195, 882 Reflexionsgrad 196 Reflexionsgrad eines dielektrischen 200 Strahlen 712 Totalreflexion 197 Wellenleiter 282 Braggreflektor 706 verteilter 195, 321 Braggreflexion 45 braggsche Bedingung 706, 708 braggsche Beugung 706, 723 an einer akustischen Welle 706 von Strahlen 712 als Streuprozess 711 braggscher Winkel 46, 195, 708
Brechung 36, 159–163, 230 dielektrische Grenzfläche 37 an einer ebenen dielektrischen Grenzfläche 159 Doppel- 170, 182 ebener Wellen 170 hyperbolisches Medium 233, 234 konische 182 negative 229, 230, 252 nichtlineare 776 ohne Reflexion 254 bei senkrechtem Einfall 255, 256 TE-Polarisation 160 TM-Polarisation 161 von Strahlen 171 Brechungsgesetz 5, 6 Brechungsindex 4, 122, 131, 759 außerordentlicher 165 effektiver 272, 314 inhomogenes Medium 4 negativer 222, 225, 229, 248, 249 nichtmagnetisches Medium 122 ordentlicher 165 Breite 970–973 1/e- 973 3 dB- 973 Halbwerts- 973 leistungsäquivalente 972 quadratisch gemittelte 970 Bremsstrahlung 413 Brennebenenarray 679, 680 Brennpunkt 6 Brennweite 6, 8 dünne Linse 12 Kugelspiegel 8 Brewsterfenster 162, 499 Brewsterwinkel 161 Brillouin-Faserverstärker 475 Brillouinstreuung 451, 452 induzierte 452, 475, 924 Brillouinzone 202, 205, 546 irreduzible 212, 215
C Casimireffekt 379 cavity dumping 715 CCD 680 charakteristische Gleichung Chemilumineszenz 448 Chirp 145 Chirpfilter 810–819 Bragg- 818 Gitter- 818 optische Faser 821
295
Prismen- 817 Pulskompression 815 Pulsverstärkung 815 Übertragungsfunktion 812, 813 Winkeldispersions- 816 Chirpfunktion 971 Chirpkoeffizient 811 Chirpparameter 805 Chirp-Pulsverstärker 815 chromatische Dispersion 310, 922 Faser 310, 313 Chrysoberyll (BeAl2 O4 ) 419 circ-Funktion 974 CMOS-Technologie 276, 681 Codeschalter 870, 907 Codierung Bild 875 binäre 946 Ein-Aus- 946, 947 holographische 106 mehrstufige 946 QAM 955 spektrale 920 Colquiriit 502
D Dämpfung Faser 306 ohne Ausbreitung 238 streuendes Medium 142 Dämpfungskoeffizient 131, 270 De-Broglie-Wellenlänge 442, 565 Debye-Sears-Beugung 713 Defekt Faser 314 photonischer Kristall 216, 283, 345, 636 Deltafunktion 80, 91, 970 Demultiplexer 305, 881, 882 Mach-Zehnder-Interferometer 883 optischer asymmetrischer Terahertz- 900 für Raummultiplexing 951 Prisma 885 Dendrimer 603 DESY 522 Detektion von Einzelphotonen 676 heterodyne 953 homodyne 953 kohärente 953 photonenzahlaufgelöste 676 Detektorsättigung 657
1025
1026
Stichwortverzeichnis
Diamant 424, 552 Bandlücke 426 Diamantgitter 548 Dichroismus 177 Zirkular- 183 Dielektrikum elektromagnetische Wellen 121– 130 Grenzfläche zu idealem Leiter 120 homogenes 121 inhomogenes 122 isotropes 121 lineares 121 nichtdispersives 121 räumlich nichtdispersives 121 dielektrische Verschiebung 119 Dielektrizitätskonstante 121, 761 komplexe 130 Differenzfrequenzerzeugung 767 entartete parametrische 785 spontane parametrische 768, 771, 772 Diffusionsgleichung 827, 828 Diffusionskapazität 564 Diode Abstimm- 564 Kapazitäts- 564 Lawinenphoto- siehe Lawinenphotodiode Photo- siehe Photodioden Strom-Spannungs-Kennlinie 563 Diodenkennlinie 563 Diodenlaser siehe Laserdioden Dipolwelle 127, 128, 656 magnetische 128 in nichtdispersiven Medien 126 Diracgleichung 415 Diracpunkt 553 Dispersion 132–134 Analogie zu Beugung 828, 829 anomale 922 Beugungs- 816 chromatische 310, 922 Faser 307–313 der Gruppengeschwindigkeit 144 interferometrische 816 Maße 132 Material- 309, 816, 922 Material- und Moden- 309 Medium mit mehreren Resonanzen 147 Mehrpfad- 816 Moden- 308, 816 nichtlineare 313, 816
normale 922 normale und anomale 145 Polarisations- 311, 816 Pulsausbreitung 143–146 Wellenleiter- 310, 816, 922 Winkel- 816 Dispersionsdiagramm photonischer Kristall 283 projiziertes 207 dispersionsflache Faser 311 Dispersionskoeffizient 144 Dispersionskompensation 827, 828 elektronische 944 durch Fasern 311 Dispersionslänge 823, 824, 829 Dispersionsmanagement 943, 944 Dispersionsrelation 168, 186, 202, 203, 205 anisotropes Material 168 Faser 295 photonischer Kristall 205, 206, 215 Wellenleiter 265, 271 dispersionsverschobene Fasern 310 Donoren 550 Donut-Strahl 77 Doppelbrechung 170, 182, 733 Doppelspaltexperiment 45 doppelt-stochastischer Poissonprozess 394 Dopplereffekt 52, 438 Dopplerkühlung 440 Dopplerlimit 440, 441 Dopplerradar 52 Dopplerverbreiterung 438, 439 Dopplerverschiebung 708 Dotiersubstanzen 419, 550 Akzeptoren 550 Donoren 550 Elektronenkonfigurationen 419 Lanthanoide 420 Termsymbole 419 Übergangsmetallionen 419 Drahtgitterpolarisator 177 Drehvermögen 172, 174 Dreiniveausystem 464–467 Rubin 469, 470 Dreiphotonenmikroskopie 450 Dreiphotonenwechselwirkung 768 Energiediagramm 768 Dreiwellenmischung 766, 767, 779, 784, 791, 795 gepulste 839
kollineare 769 nicht kollineare 770 Driftstrom 562 Drude-Lorentz-Modell siehe Drudemodell Drudemodell 222, 235 vereinfachtes 236, 237, 243 Dunkelstromrauschen 682 dünne Linse Abbildungsgleichung 12 Bildentstehung 12 Brennweite 12 komplexe Amplitudentransmission 39 Strahltransfermatrix 20 Durchgangsverbreiterung Photodetektor 657 Durchgriff-Lawinenphotodiode 672 Durchlassband 197 Durchlassrichtung 563 Dynoden 653
E ebene Welle 32, 126 Durchgang durch dünne Linse 40 gepulste 808 Effective-Circuit-Modell 246 Effective-Medium-Modell 246 effektive Masse 546 Eigenfunktion 981 Eigenvektor 981 Eigenwert 981 Eigenwertproblem 981 Eikonal 18, 35 Eikonalgleichung 18, 36, 300 und fermatsches Prinzip 18, 36 einachsiger Kristall 165 Ein-Aus-Codierung 947 Eindringtiefe 225 Einfügungsdämpfung 872 Einhüllende Diffusionsgleichung 827 langsam variierende 809 Übertragungsfunktion 811, 822 ultraschnelle Pulse 838 Einkopplung 276 Einmodenfaser 289, 298, 313, 922 Einmodenführung, endlose 315 Einmodenwellenleiter 265, 269 Einschlussfaktor 619 Photodiode 666 Wellenleiter 271 Einstein, Albert 49, 378, 434, 445
Stichwortverzeichnis
Einsteingleichung der Photoemission 652 Einsteinkoeffizienten 434 Einzelphotonendetektor 679 Einzelphotonenemitter 579, 580 Einzelphotonenlawinendiode 676 elektrische Flussdichte 119 elektrisches Feld 118 Elektroabsorption 728, 753, 754 Elektrochromie 752 Elektrolumineszenz 447, 448, 586 Geschwindigkeit 586 Injektions- 585, 586, 590 Legierungsverbreiterung 589 Linienbreite 589 spektrale Intensität 587, 589 elektromagnetische Optik 117–148 Beziehung zur skalaren Wellenoptik 129 Fundamentalbeziehung 121 Materialgleichung 125, 164 elektromagnetische Welle anisotropes Medium 123 Dielektrikum 121–130 dispersives Medium 123, 125, 132, 143–146 Drehimpuls 120 Energie 120 Impuls 120 inhomogenes Medium 122, 125 Intensität 120, 125 Leistung 120, 125 monochromatische 124–130 nichtlineares Medium 124 Quantisierung 446 resonantes Medium 134 transversale (TEM) 126 Vakuum 118–121 elektromagnetisches Spektrum 117, 118 Elektronenkonfiguration 415, 416 Elektron-Loch-Paar 543 Erzeugung 559, 609 Rekombination 559, 587, 588, 590, 609, 633 Elektron-Photon-Wandler 587 Elektronspin 415 Elektrooptik 727–756 anisotrope Medien 737–742 Bauelemente 727 Flüssigkristalle 742 elektrooptischer Effekt 727, 765, 775 linearer siehe Pockelseffekt quadratischer siehe Kerreffekt
elektroschwache Theorie 377 Elementarzelle 203 Ellipsoid 164 elliptische Polarisation 151 Emission Grundprinzip der induzierten 457 induzierte 431, 433–435, 486 Lichtverstärkung durch induzierte 457 durch polychromatisches Licht induzierte 435 selbstverstärkte spontane 520 spontane 430, 432, 433, 435 verstärkte kohärente 518 verstärkte spontane 439, 472, 480, 481, 517, 518, 610, 617 Emissionsquerschnitt, effektiver 467 Empfängerempfindlichkeit 682, 692, 695 Bitfehlerrate 696–698 endlose Einmodenführung 315 Energie elektromagnetische 120, 125 optische 31 Energiebänder Bezug zu diskreten Energieniveaus 425 Entstehung 425 Energieniveaus 419 Alexandrit 419, 420 Argon 417 Azimutquantenzahl 415 Besetzungswahrscheinlichkeit 428, 429 bohrsche 415 Boltzmannverteilung 428 C5+ 415 Cr3+:Al2 O3 (Rubin) 419 Cr3+:BeAl2 O4 (Alexandrit) 419 diskrete 424 Entartung 421, 429 Er3+:Quarzglas 473 Farbstoffmoleküle 424 Fermi-Dirac-Verteilung 429 GaAs 426 Halbleiter 426 Hauptquantenzahl 415 Helium 417 Kristall 424 Lanthanoidionen 419, 421 Lebensdauer 436 magnetische Quantenzahl 415 Mehrelektronenatome 415, 416 Minibänder 426
Nd3+:Glas 419 Nd3+:Phosphatglas 421 Nd3+:Y3 Al5 O12 (Nd3+:YAG) 419 Nd3+:YAG 421 Quantenpunkte 427 Quantenschichten 566, 567 Rhodamin-6G 424 rotierende zweiatomige Moleküle 422 Rubin 419, 420, 469 schwingende zweiatomige Moleküle 423 Schwingung in CO2 423 Schwingung in N2 423 Spinquantenzahl 415 Übergangsmetallionen 419, 420 Wasserstoff 414, 415 Zerfallszeiten 462 Energiewaffen 508, 514, 515 Ensemblemittelwert 350 Entartung 421 Erzeugung der dritten Harmonischen 775 Erzeugung hoher Harmonischer 516, 522, 534 Exciton 427, 570 Exponentialfunktion 1/e-Breite 973 Fouriertransformierte 973 zweiseitige 973 Extinktionskoeffizient 131, 270 Intensitäts- 142 Wellenleiter 270
F Fabry-Pérot-Etalon 192–194 Fabry-Pérot-Resonator 321, 323–325, 329 zur Modenselektion 499 spektrale Breite 327 Faltung 87, 95 Faltungstheorem 974 Fan-In 305 Fan-Out 305 Faradayeffekt 174, 175 Faradayrotator 174, 179, 180, 876 als Isolator 180, 876 Farbstofflaser 424 Laserübergang 424 Farbstoffmoleküle 424, 512 Farbtemperatur 604 Farbwiedergabeindex 604 Faser 289–319 Absorption 306
1027
1028
Stichwortverzeichnis
Akzeptanzwinkel 291 Antwortzeit 308, 309, 935 Anwendungen 316, 317 Ausbreitungskonstante 298, 303 Bandbreite 935 charakteristische Gleichung 295 chromatische Dispersion 310, 313 Dämpfung 306 Dispersion 307–313 dispersionsflache 311, 923 dispersionskompensierende 311, 923 Dispersionsrelation 295 dispersionsverschobene 310, 923 effektiver Brechungsindex 314 Einmoden- 289, 297, 298, 313 Er3+:Quarzglas 420 Gradientenindex- 290, 292, 293 Gradientenprofilparameter 293 Granulationsmuster 299 Grenzfrequenz 297 Gruppengeschwindigkeit 298, 303 Gruppenlaufzeitdifferenz 312 Hohlkern- 185, 314–316, 923 Kern 289 Leistungsübertragung 935 Mantel 289 Materialdispersion 313 Materialien 316 Mehrkern- 304, 305, 922 meridionale Strahlen 291 mikrostrukturierte 185, 213, 314– 316 Moden 295, 302 Modendispersion 289, 313 Modengrenzwerte 296 Modenrauschen 299 Modenzahl 297, 302, 303 multifunktionale 317 Nd3+:Glas 420 nichtlineare Dispersion 313 numerische Apertur 291 optimales Indexprofil 303 photonischer Kristall 315 Polarisationsdispersion 313 polarisationserhaltende 299 quasi-ebene Welle 300 schiefe Strahlen 291 Selbstphasenmodulation 313 Stufenindex- 290–292, 294–298 Totalreflexion 289 Vielmoden- 289, 290, 313 V -Parameter 295 Wellenleiterdispersion 310, 313
Faser-Bragggitter 195, 534, 882 Faserlaser 316, 317, 506, 926 siehe auch Laser Band- 506 Er3+:SiO2 508, 509 kaskadierte Raman- 510 mit photonischer Bandlücke 506 Plattenwellenleiter- 506 Raman- 510 Th3+:SiO2 509 Vergleich mit diodengepumpten Festkörperlasern 509 Yb3+:SiO2 507, 508 Fasern 290 Faseroptik 289–319, 869, 920 faseroptische Kommunikation 919– 958 analoge 942 Bandbreite 931 Bitfehlerrate 936 Bitrate 936 dämpfungsbegrenzte 938 Dämpfungskompensation 942 Detektoren 928 dispersionsbegrenzte 938 Dispersionskompensation 943 Dispersionsmanagement 943 Entwicklung 932 Intersymbolinterferenz 936 kohärente 952, 955 Komponenten 920–931 Leistungsfähigkeit 935 Leistungsvorgabe 938 Lichtquellen 925 Modulation 945–947 Multiplexing 947–950 Netze 958–964 Soliton 944 Spektralbänder 949 Systeme 931–945 Übertragungsfehler 936 Verstärker 926 Zeitvorgabe 938 Faserparameter 295 Fasertaper 244 Feinstruktur 415 Nd3+:YAG 421 Feinstrukturaufspaltung 416 Fensterschicht 565, 666 fermatsches Prinzip 4, 6 und Eikonalgleichung 18 für maximale Laufzeit 26 und Eikonalgleichung 36 Fermi-Dirac-Statistik 418, 429
Fermifunktion 429, 555 Fermi-Inversionsfaktor 577 Ferminiveau 429, 555, 556 Fermionen 384, 418 Festkörper 424–428 actinoiddotierte 422 ionische 424 kovalente 424 lanthanoiddotierte 420 metallische 424 molekulare 424 Nd3+:Glas 421 Nd3+:YAG 421 seltenerddotierte 420 Festkörperbeleuchtung 603 Festkörperlaser 418, 501 Dotierionen 501 optisches Pumpen 468 übergangsmetalldotierte 419 Wirtsmedien 501 Filter akustooptisches 720 ideales 811 Finesse 47, 193, 326, 328, 487 Flip-Chip-Technik 592, 600, 601 Flip-Flop 910 Fluoreszenz 448, 602 thermisch aktivierte verzögerte 603 Fluorophor 449 Flüssigkristalle 175–177 cholesterische 175 Elektrooptik 742–749 ferroelektrische 745 als Modulatoren 742–745 nematische 175, 742 optische Eigenschaften 176 als Phasenschieber 742, 743 smektische 175, 745 verdrillt nematische 175, 176, 744, 745 Flüssigphasenepitaxie 565 Flüstergaleriemode 321, 322, 339, 345 Fockzustand 399 Fokuslänge 60 Fokussierung, zylindrische 255 Forsteritlaser 505 Fourieranalyse 79, 82, 88 Fourieroptik 79–112 gepulste Wellen 832 periodische Medien 208–210
Stichwortverzeichnis
Fouriertransformation 49, 79, 969– 974 eindimensionale 969–973 im Fernfeld 88 inverse 91 und Lebensdauerverbreiterung 436 durch eine Linse 89 optische 88, 833 Tabelle ausgewählter Funktionen 971 zweidimensionale 973, 974 Fouriertransformations-Holographie 108 Franz-Keldysh-Effekt 753 Fraunhoferbeugung 92, 97 Fraunhofernäherung 88, 93 Gültigkeit 88 freier Spektralbereich 193, 324 Frequenz Beziehung zur Energie 380 instantane 805 Licht 29 monochromatische Welle 33 frequenzaufgelöste optische Ausblendung 862 Frequenzkamm 535, 536 Anwendungen 536 EUV- und Röntgen- 536 Frequenzkonversion, optische 760, 767, 786 Frequenzmodulation 83 Frequenz-Pulling 489, 490 Frequenzraum 88 Frequenz-Raum-Mapping 820 Frequenzschieber, akustooptischer 720 Frequenzumtastung 946, 947 Frequenzverdopplung 760, 763, 764, 775, 784, 785, 851 kollineare 769 nicht kollineare 771 Phasenabgleich 770 Phasenfehlanpassung 786 Theorie gekoppelter Wellen 785 Walk-Off-Effekt 839 Wirkungsgrad 764, 786 Fresnelbeugung 92, 94–97 Fresnel-Biprisma 9, 39 Fresnelgleichungen 160 Fresnelintegral 95 Fresnellinse 13
Fresnelnäherung 34, 86, 87 Gültigkeit 87 für Kugelwelle 34 Fresnelreflexion 592 fresnelsche Gleichungen 9 Fresnelzahl 34, 87 Fresnelzonenplatte 46, 84 frustrierte Totalreflexion 241 FT-Spektroskopie 360, 361 Füchtbauer-Ladenburg-Gleichung 433 Führung durch effektiven Index 314 durch photonische Bandlücke 314, 315 Fullerene 552 Fundamentalbeziehung 121
G GaAs 426 Bandlücke 426 Bandstruktur 426 Energieniveaus 426 Struktur 426 Gabelversetzung 72 Gaslaser inhomogen verbreiteter 495 Zahl der Moden 494 Gasphasenepitaxie 565 Hydrid- 565 metallorganische chemische 565 Gated-Geiger-Betrieb 677 Gatter optisches 871 photonische 908–915 Gaußbündel siehe Gaußstrahl Gaußfunktion 971 1/e-Breite 973 Fouriertransformierte 973 gechirpter Puls 807 Puls 807 Gaußpuls Ausbreitung in einer optischen Faser 823, 824 gechirpter 814 Gaußstrahl 35, 57–69, 88, 146 ABCD-Gesetz 68 Aufweitung 67 Beziehung zur Parabolwelle 58 Divergenz 60 Durchgang durch dünne Linse 64, 65 Durchgang durch dünne optische Komponente 69
Durchgang durch Vakuum 69 Durchmesser 59, 60 Eigenschaften 58–64 elliptischer 71, 76 Fokuslänge 60, 61 Fokussierung 66 Formung 66 Führung 67 gaußsch gepulster 834, 835 gepulster 810 Gouyeffekt 61 Informationsgeschwindigkeit 146 Intensität 58, 59 Kollimation 67 komplexe Amplitude 57, 58 komplexe Einhüllende 58 konfokaler Parameter 60, 61 Kugelspiegelresonator 332 Leistung 59 𝕄2 -Faktor 64 nichtdispersives Medium 126 Phase 60 𝑞-Parameter 58 quadratisch gemittelter Radius 75 Qualität 64 Rayleighlänge 58 Reflexion an Kugelspiegel 67 Spotgröße 60 Strahlparameter 58, 62–65 Taillenradius 60 vektorieller 129 Vergleich mit Besselstrahl 74 Wellenfront 61 geführte Wellen 261–287 Gegenstandswelle 106 Geiger-Lawinenphotodiode 677 Geigerzähler 677 geometrische Dimensionalität 627 geometrische Verteilung 392 gepolte Materialien 774 gepulstes Licht 49–53 Germanen 553 Gesamtspinquantenzahl 416 Gesamtwirkungsgrad 493 Geschwindigkeit Gruppen- 143, 146, 265, 266, 271 Informations- 146 monochromatische Welle 33 Phasen- 33, 143, 146 geschwindigkeitsabhängiger kohärenter Besetzungseinschluss 441
1029
1030
Stichwortverzeichnis
Geschwindigkeitsgleichung Besetzungsunterschied 527 Photonenzahl 527 Gesetz von Vegard 549 Gewinnarretierung 490 Gewinnkoeffizient 459, 460 bei Sättigung 476, 477, 487 kleines Signal 486 optische Halbleiterverstärker 609– 611, 615 Raman- 474 Gewinnmodulation 525, 527 Gewinnrauschen 681, 682 Gitter optisches 442 reziprokes 212, 214 Glan-Thompson-Prisma 178 Glasfaser 23 Glaswellenleiter 276 Gleichrichtung, optische 764, 765 gepulste 840 Gleichungen, maxwellsche siehe maxwellsche Gleichungen Gleichverteilungssatz 446 Glimmerschiefer 178 Glühlampe 604 Golayzelle 651 Goos-Hänchen-Effekt 182, 273 Gouyeffekt 61, 835 Gouyphase 72 Gradientenindexfaser 17, 290, 292, 293 Akzeptanzwinkel 18 Indexprofil 17 numerische Apertur 17 Gradientenindexlinse 42 Gradientenindexmedium, dynamisches 705 Gradientenindexoptik 14–18 Gradientenindexplatte 15 Gradientenprofilparameter 293 Granulationsmuster 299 Graphen 552, 553 Eigenschaften 553 Elektronenbeweglichkeit 553 Gruppe-IV-Analoga 552 Struktur 553 Graphenphotonik 553 Graphit 424, 552 Gravitationswellen 43, 399 Gravitationswellendetektor 49 greensche Funktion 977 Grenzfrequenz 367 Einmodenfaser 299
Faser 297 Filter 101 Mode 266, 269 Wellenleiter 265, 269 Grenzwellenlänge 265 Grenzwinkel der Totalreflexion 8, 160 GRIN-Kristall 217 Gruppengeschwindigkeit 143, 146, 169 Dispersion 144, 272 Faser 298, 303 photonischer Kristall 206 Wellenleiter 265, 266, 271 Gruppengeschwindigkeitsdispersion 272 Gruppenindex 144, 146 effektiver 206 Gruppenlaufzeit 822 Gruppenlaufzeitdifferenz 312 Gruppenverzögerung 143 Gütefaktor Mikrokugelresonator 344 Mikroresonator 341 Resonator 328 Gütemodulation 525, 526, 528, 534 Gyrationsvektor 173 gyromagnetisches Verhältnis 174 Gyroskop 43
H Halbleiter 426–428, 544 Absorption 572, 574, 577 AlAs 548, 550 Al𝑥 Ga1−𝑥 As 550, 598 (Al𝑥 Ga1−𝑥 )𝑦 In1−𝑦 P 550 Al𝑥 Ga1−𝑥 N 550, 599 Al𝑥 In𝑦 Ga1−𝑥−𝑦 N 550, 600 AlInGaP 599 AlN 548 AlP 548 AlSb 548 Bandlücke 425, 544, 597 Bandlückenwellenlänge 571 Bandstruktur 426, 543, 545, 557 Besetzungswahrscheinlichkeit 555 binäre III-V- 548 Brechungsindex 580, 581 Brillouinzone 546 CdS 549 CdSe 549 CdTe 549 Diffusionskapazität 564
direkte Bandlücke 547 Doppelheterostruktur 564 Dotiersubstanzen 550 dotierte 550 effektive Masse der Elektronen 546 effektive Masse der Ladungsträger 552 Eigenschaften 543–569 Elektrolumineszenz 586–589 Elektronen und Löcher 544, 545 Elektronentransport 552 Elektron-Loch-Erzeugung 559, 570, 572, 654 Elektron-Loch-Rekombination 559, 570, 572, 585 Element- 547 Emission 572, 574 Energiebänder 544 Energie-Impuls-Beziehungen 545 Energieniveaus 426 entartete 558 excitonische Übergänge 570, 578, 579 extrinsische 551 Fensterschicht 565 Fermifunktion 555, 557, 589 Fermi-Inversionsfaktor 577 GaAs 548, 550, 558, 596 GaAsP 597 GaN 548, 558, 599 GaP 548, 550 GaSb 548 Ge1−𝑦 Sn𝑦 547 gemeinsame Zustandsdichte 573 Germanium 547, 548, 550 Gewinn 574 Gewinn im Quasigleichgewicht 577 Heteroübergang 561, 564 Hg𝑥 Cd1−𝑥 Te 549 HgS 549 HgSe 549 HgTe 549 Homoübergang 561 II-VI- 549 III-V- 547–549, 597 IV-VI- 549 InAs 548, 550 indirekte Bandlücke 547, 573, 574 InGaAs 598 In1−𝑥 Ga𝑥 As1−𝑦 P𝑦 550, 598 InGaAsSb 598 In𝑥 Ga1−𝑥 N 550, 599
Stichwortverzeichnis
InGaP 599 InN 548 innere Quantenausbeute 561 InP 548, 550 InSb 548 Interbandübergänge 570, 578, 579 Intrabandübergänge 570 intrinsische 425, 550, 551, 556 Kronig-Penney-Modell 544, 545 Ladungsträgerbeweglichkeit 658 Ladungsträgerinjektion 560, 563 Ladungsträgerkonzentration 556, 558 Laserdiode 618–627 LED 590 Legierungsverbreiterung 589 Leitfähigkeit 544, 545 lichtemittierende Dioden 586–603 Massenwirkungsgesetz 557 Mehrfachquantenschichten 568 Mikroresonatorlaser 636–644 Minibänder 426, 568, 579, 634 Minibandübergänge 578, 579 mit negativer Elektronenaffinität 652 Mobilität der Ladungsträger 552 MoS2 554 Nanokristalle 427 n-dotierte 550, 556, 557 Optik von quantenbeschränkten Strukturen 578, 579 Optik von Volumen- 570–578 organische 551, 552 Pb𝑥 Sn1−𝑥 Se 549 Pb𝑥 Sn1−𝑥 Te 549 p-dotierte 550, 556, 557 Periodensystem 547 Phononenübergänge 570 Photodetektoren 651–702 Photonenquellen 585–646 pin-Übergang 564 pn-Übergang 561–563, 587, 590 Polymer- 552 ppn-Doppelheteroübergang 565 quantenbeschränkte 578, 579 quantenbeschränkte Strukturen 565–569 Quantendrähte 426, 568, 569 Quanteneinschlusslaser 627–644 Quantenkaskadenlaser 633, 634 Quantenpunkte 427, 569 Quantenschichten 426, 565 Quantenschichtstruktur 565–567 Quasiferminiveaus 558, 559, 590
Quasiferminiveaus eines gepumpten 588 Quasigleichgewicht 558, 559 quaternäre III-V- 549 Rekombinationskoeffizient 559 Rekombinationslebensdauer 560 Schrödingergleichung 545 Si𝑥 Ge1−𝑥−𝑦 Sn𝑦 547 Si𝑥 Ge1−𝑥−𝑦−𝑧 Sn𝑦 C𝑧 547 SiC 547, 550 Silicium 547, 548, 550, 558, 600 Siliciumcarbid 547, 550 spontane Emission 576 strahlende Rekombination 559 strahlungslose Rekombination 559 ternäre III-V- 548 Übergänge zwischen Unterbändern 578, 579 Übergangswahrscheinlichkeiten 575 Übergitter 426, 568, 579, 634 Verstärker 607–618 Vollmaterial- 426 WSe2 554 ZnS 549 ZnSe 549 ZnTe 549 Zustandsdichte 554, 567, 573 Halbleiterbauelemente 551 Halbleiteroptik 543, 569–582 Halbleiterspiegel 533 Halbleiterübergang 561 Doppelheteroübergang 564 Driftstrom 562 Durchlassrichtung 563 Heteroübergang 561, 564 Homoübergang 561 intrinsisches Feld 562 pin- 564 pn- 561–563, 585, 587, 590 ppn- 565 Quantenschichtstruktur 565–567 Sperrrichtung 563 Sperrschicht 562 Halbmetalle 425 Halbwellenretarder 157, 158 Jonesmatrix 158 Halbwellenspannung 729, 730 Halbwertsbreite 353, 973 HAPLS-Lasersystem 471, 815 Harmonische Erzeugung der dritten 760, 775, 791, 792
Erzeugung der zweiten siehe Frequenzverdopplung Erzeugung hoher siehe HHG zweite 763 harmonische Funktion 80 harmonischer Oszillator 979 Analogie zu optischen Moden 397 klassischer 134 quantenmechanischer 396, 423 Hartree-Fock-Verfahren 416 Hartree-Verfahren 416 Hauptachsen 164 Hauptbrechungsindizes 164 Hauptkoordinatensystem 164 Hauptquantenzahl 414, 415 Header 907 heisenbergsche Unschärferelation 386, 397, 972 Hellempfindlichkeitskurve 603 Helmholtzgleichung 32 Analogie zur Schrödingergleichung 35, 414 dispersives nichtmagnetisches Medium 126 Faser 293 paraxiale 35, 58 verallgemeinerte 186, 984 zweidimensionale 74 He-Ne-Laser 417 Hermite-Gauß-Funktion 71 Hermite-Gauß-Strahl 70, 71, 71, 335 elliptischer 71 Intensität 71 komplexe Amplitude 71 Hermitepolynome 70 hermitesche Operatoren 981 Hero, Prinzip von 5 Heterodyndetektor 953, 956, 958 Empfindlichkeit 958 Heterodyning 106 optisches 859 Heteroepitaxie 565 direkte 601 Heterostrukturen optische Halbleiterverstärker 613, 614 Photodiode 666 Photoleiter 662 Heteroübergang 561 HHG 850, 851 Rekollisionsmodell 851 Hilberttransformation 978 Himmelsblau 139, 451 Hintergrundrauschen 682
1031
1032
Stichwortverzeichnis
Hochpassfilter 101 Hohlkernfaser 185, 213, 314–316, 923 Hohlraumresonator 339–344 Hohlraumstrahlung siehe Schwarzkörperstrahlung Hologramm 105–107 computergeneriertes 112 ebene Welle 107 Kugelwelle 108 Regenbogen- 111 Volumen- 110, 111 Holographie 105–111 Apparatur 109, 110 computererzeugte 875 Echtzeit- 752, 781 Fouriertransformations- 108 Kugelwelle als Referenzwelle 114 Oberflächen- 875 Ortsfilter 109 Volumen- 110, 752 holographisches optisches Bauelement 112 HOMO siehe Molekülorbital, höchstes besetztes Homodyndetektor 957, 958 Empfindlichkeit 958 symmetrischer 954 Homoepitaxie 565 Homoübergang 561 Hong-Ou-Mandel-Interferenz 403 Hong-Ou-Mandel-Interferometer 402 Huygens-Fresnel-Prinzip 88 Hydrid-Gasphasenepitaxie 565 Hyperfeinstruktur 415, 416 Hysterese 909
I Idlerwelle 401, 767, 780, 787, 788 Impedanz 126 nichtmagnetische Medien 126 Impermeabilität, elektrische 728 Impermeabilitätstensor 165, 722 Impflaser siehe Seedlaser Impuls, elektromagnetischer 120 Impulsantwortfunktion 80, 88, 977, 979 dispersives Dielektrikum 124 einlinsiges abbildendes System 98, 101, 102 des Vakuums 87 Ince-Gauß-Strahl 73 Indexellipse 166
Indexellipsoid 165, 166, 737 einachsiger Kristall 167 Indikatrix 165 induzierte Emission 431, 433–435, 457, 486 Grundprinzip 457 Lichtverstärkung 457 durch polychromatisches Licht 435 Informationsgeschwindigkeit 146 Infrarot Frequenzen 29 Sensorkarte 450, 451 Wellenlängen 29 Injektionselektrolumineszenz 585, 586, 590 GaAs 587 Linienbreite 589 spektrale Intensität 587, 589 In-Line-Verstärker 469 innere Quantenausbeute 561 instantane Frequenz 805 integrierter Schaltkreis optoelektronischer 930 photonischer 879, 930 Intensität elektromagnetische 120, 125 instantane 350 mittlere 350 optische 31, 32, 50, 120 partiell kohärentes Licht 350 polychromatische Welle 50 quasimonochromatische Welle 50 stochastische 350 TEM-Welle 127 wechselseitige 356, 365 wechselseitige normierte 356 Intensitätsautokorrelation 857, 858 Intensitäts-Extinktionskoeffizient 142 Interbandübergänge 570 Interferenz 42–48 Doppelspaltexperiment 45 ebene und Kugelwelle 45 Hong-Ou-Mandel- 403 Licht aus ausgedehnter Quelle 363 partiell kohärentes Licht 359–364 Photon 384 und räumliche Kohärenz 362 Sichtbarkeit 54, 359, 360 und spektrale Breite 364 und zeitliche Kohärenz 360 Vielwellen- 45, 47, 52
youngsches Experiment 362 zweier Kugelwellen 45 zweier monochromatischer Wellen 51 zweier partiell kohärenter Wellen 359 zweier schiefer ebener Wellen 44 zweier Wellen 42 Interferenzgleichung 42 Interferogramm 360 Interferometer 43–48 Anwendungen 43 einzelnes Photon 385 Fabry-Pérot- 48 Hong-Ou-Mandel- 402 LIGO- 48, 398 Mach-Zehnder- 43, 274, 385, 883 Mehrpfad- 884, 885 Michelson- 43 Michelson-Stern- 370 Sagnac- 43, 886, 887, 900 selbstreferentielles spektrales 860 spektrales 859 Young- 362, 363, 385 Intersymbolinterferenz 935–937, 944 Intrabandpumpen 464, 466, 467 Laserdioden 471 Intrabandübergänge 570 Ionen/Gas-Laser 418 Ionisationskoeffizienten 670 verlaufsabhängige 687 Ionisationsverhältnis 670 Ionisierungsenergie 418 Mehrelektronenatome 418 Isolator akustooptischer 721 Bandlücke eines dielektrischen 425 optischer 180, 721, 872, 876 Isotope 418
J Johnsonrauschen 690 Jonesmatrix 156 Brechung 159 Halbwellenretarder 158 Reflexion 159 Jonesvektor 155 Transfomation 158
K Kammfunktion 971 Karborund 547 Kardinalpunkte 22
Stichwortverzeichnis
Kardinalsinus 93 katadioptrisches System 11 Kathodolumineszenz 447 Kernladungszahl 414 Kerreffekt 727, 729, 740, 775 optischer 775, 778 Kerrkoeffizient 729, 737 Symmetrie 738 Kerrlinse 533 optische 777 Kerrmedium 775 k-Fläche 168 Kielfeldbeschleunigung 522 kohärente anti-StokesRamanstreuung 452 kohärente optische Kommunikation 952–958 Kohärenz 349–375 Ausbreitung 364–370 Bildentstehung 365–370 Interferenz 359–364 Interferenzexperiment von Young 362 Kreuzleistungsspektrum 357 longitudinale 358 partielle 350 quasimonochromatisches Licht 363 räumliche 355, 362 Sichtbarkeit 362 spektrale Breite 353, 354 spektrale Leistungsdichte 352 Verstärkung durch Ausbreitung 367, 369, 370 wechselseitige Intensität 356, 365 zeitliche 351, 356, 360 Kohärenzabstand 363 Kohärenzfläche 356, 357 Kohärenzfunktion wechselseitige 355 zeitliche 351, 352 Kohärenzgrad komplexer 355 komplexer zeitlicher 352 Kohärenzlänge 352, 355, 771, 772 Lichtquellen 354, 355 Kohärenzmatrix 371 Kohärenztomographie im Zeitbereich 361 optische 361, 403 quantenoptische 403 Kohärenzzeit 352–356 Lichtquellen 354, 355
Kohlenstoffnanoröhren 427, 552, 579 Kollimator 6 LED 8, 11, 593 Kommunikationssysteme faseroptische 919, 920 kohärente optische 920 Kompakt-Leuchtstofflampe Lebensdauer 604 Lichtausbeute 604 Komplementärfarben 605 komplexe Amplitude 31 ebene Welle 32 Gaußstrahl 57, 58 monochromatische Welle 32 komplexe Amplitudentransmission 38 dünne Linse 39 Platte mit variablem Brechungsindex 41 Platte mit variabler Dicke 38 Prisma 39 komplexe Darstellung 31, 49 komplexe Einhüllende 32 ebene Welle 32 Gaußstrahl 58 komplexe Wellenfunktion 50 gepulste ebene Welle 51 monochromatische Welle 32 komplexer Kohärenzgrad 355 komplexer 𝑞-Parameter 58 komplexer zeitlicher Kohärenzgrad 352 komplexes analytisches Signal 50 komplexes Polarisationsverhältnis 154 konische Brechung 182 Konjugation 552 konjugierte Ebenen 10 konjugierte Welle 780 Konkavspiegel 7 Konstellation 946 Konvexspiegel 7 Koordinatentransformation Polarisation 158 Koppler 871 Fan-Out- 305 faseroptische 876 integriert-optische 876 Mehrkern- 304, 305 Prismen- 277 Kopplung Gitter- 277 Wellenleiter 276–281
Kopplungsfaktor 734 Kopplungslänge 279 Kopplungswirkungsgrad 734 Kramers-Kronig-Beziehungen 134, 978 Kreuzgewinnmodulation 896, 904 Kreuzintensität siehe wechselseitige Intensität Kreuzkohärenzfunktion siehe wechselseitige Kohärenzfunktion Kreuzkorrelationsfunktion 355 Kreuzleistungsspektrum 357 normiertes 357 Kreuzphasenmodulation 778, 896, 904, 924 Kreuzrelaxation 509 Kristall einachsiger 165, 167, 170 künstlicher 442 negativ einachsiger 165 photonischer siehe photonischer Kristall positiv einachsiger 165 Symmetrie 738 zweiachsiger 165 Kristallfeldtheorie 420 Kristallgitter 424 Kristallstruktur 213 kritischer Winkel der Totalreflexion siehe Grenzwinkel der Totalreflexion Kronig-Penney-Modell 544, 545 Krümmungsradius 7 Kugelspiegel 7, 67 Bildentstehung 8 Brennweite 8 Kugelspiegelresonator 330–337 Eingrenzung von Strahlen 330 Kugelwelle 33 Bezug zur ebenen Welle 34 Bezug zur Parabolwelle 34 Fresnelnäherung 34 gepulste 809 in nichtdispersiven Medien 126 Phasengeschwindigkeit 33 Wellenfront 33 Kurzzeit-Fouriertransformierte 806
L Ladung, topologische 73 Ladungsträger Majoritäts- 551 Minoritäts- 551 Laguerrefunktionen 415
1033
1034
Stichwortverzeichnis
Laguerre-Gauß-Strahl 72 Bahndrehimpuls 73 Erzeugung 72 Phase 72 Laguerrepolynome 72, 415, 483 𝜆∕2-Plättchen 157 𝜆∕4-Plättchen 157 Lamb-Dip 496 Lambertverteilung 593 langsame Achse der Polarisation 157 langsames Licht 146 Lanthanoide 417, 420 Elektronenkonfigurationen 419 Energieniveaus 419, 421 Feinstrukturen 421 Termsymbole 419 Laplaceoperator 30 transversaler 35, 58 Laser 457, 485–539 siehe auch Laserverstärker Ag19+ 518, 524 aktive Modenkopplung 533 Alexandrit- 419, 420, 502, 505, 524 Ar+ 524, 534 ArF-Excimer- 514, 524 Argonionen- 498 Atom- 513, 516, 517 Aufbau 485, 486 Ausgangsleistung 501 Auskopplungsmodulation 526 Auskopplungswirkungsgrad 493 Bedingung für Oszillation 485, 488 Beispiele 523 C5+ 517, 524 chaotischer 512, 513 chaotischer Mikro- 513 chaotischer ZnO 513 chemischer 514 CO2 513, 524, 534 Colquiriit 502 Cr2+:ZnS 502, 505, 524 Cr2+:ZnSe 505 Cumarin- 515 DBR- 626 DF 515 DFB- 626, 631 diodengepumpte Festkörper- 502, 509 Einschwingvorgänge 526–535 Er3+:Quarzglas 473, 524, 534 Er3+:SiO2 508, 509 Er3+:YAG 502 Etalon im Resonator 499
European XFEL 522 Excimer- 514 Exciplex- 514 extremes UV 515 F2 514 Farbstoff- 424, 515 Faser- 506, 507, 509 Festkörper- 418, 501–513 Festkörper-Farbstoff- 515 Forsterit- 505, 524, 534 Freie-Elektronen- 516, 520, 521, 524 Freie-Elektronen-Röntgen- 522, 523 Frequenzen 489, 490, 501 Frequenz-Pulling 489, 490 Gas- 513–515 gepulste 523–535 Germanium- 629 Gesamtwirkungsgrad 493 Geschwindigkeitsgleichungen 527 Gewinnarretierung 490 Gewinnbedingung 488 Gewinnmodulation 525, 527 Grundprinzip 457 Gütemodulation 525, 526, 528, 534 H2 O 524 Halbleiter-Scheiben- 535 HAPLS-Petawatt- 471, 599 HCN 524 He-Cd 524 He-Ne 417, 524, 534 HF 514 Ho3+:YAG 502 homogene Verbreiterung 494 I2 514 inhomogene Verbreiterung 495 innere Photonenflussdichte 490 innere Photonenzahldichte 492 instabile Resonatoren 498 Integration mit anderen Bauelementen 586 Ionen- 513 Ionen/Gas- 418 kaskadierte Raman-Faser- 510 Kennlinien 490–499 kohärenter chaotischer 513 Kohlenstoffplasma- 517 Kr+ 524 KrF-Excimer- 514, 524 Kupfer-Röntgen- 520 Lamb-Dip 496 LCLS 522, 524
Leistungsumwandlungswirkungsgrad 493 Linienbreite 500, 501 Linienselektion 498 Mehrfachquantenpunkt- 632 Methanol- 514, 524 Mikrodisk- 640 Mikroresonator- 636–644 Mikroring- 640 MIRACL 515 mit externem Resonator 535 Modenkopplung 526, 531–535 Modensprünge 499 Molekül- 513 Nanoresonator- 642, 643 3+ Nd :Glas 471, 524, 534 Nd3+:Phosphatglas 534 Nd3+:Quarzglas 470 Nd3+:YAG 420, 421, 502, 503, 524, 534 Nd3+:YAG-Mikrochip- 531 Nd3+:YVO4 420, 502, 524 Ne+ 524 Neon-Innenschalen-Röntgen- 519 Oberflächenemitter 535 ohne Inversion 488 optisch-optischer Steigungswirkungsgrad 493 optisch-optischer Wirkungsgrad 493 passive Modenkopplung 533 Phasenbedingung 488, 489 phononenbegrenzter 505 Phosphosilikat-Raman-Faser- 511 Photonenfluss am Ausgang 493 Photonenflussdichte 490 Photonenflussdichte am Ausgang 491, 493 Photonenflussdichte im stationären Zustand 490–492 Photonenzahldichte im stationären Zustand 492 Plaser 512 Plasma- 517 Polarisation 498 Polymethin- 515 Pulsdauer 501 Pulver- 512 Quantendraht- 628 Quanteneinschluss- 627–637 Quantenkaskaden- 514, 535, 633, 634 Quantenpunkt- 628, 632 Quantenschicht- 628
Stichwortverzeichnis
Raman- 511 Raman-Faser- 510 räumliche Verteilung 497 räumliches Lochbrennen 495 Rhodamin-6G 515, 524, 534 Röntgen- 515–518 Rubin- 419, 420, 470, 489, 501, 524, 525, 531 Rückkopplung 486 Sättigung 486 Sauerstoff-Iod 514 Scheiben- 503 Schwelle 488 Schwellen-Besetzungsdifferenz 488 Selektion einer Longitudinalmode 499 Selektion einer Polarisation 499 Selektion einer transversalen Mode 498 seltenerddotierte Faser- 506, 507 Silberplasma- 518 Silicium-Raman- 512 Spaser 644 spektrale Verteilung 493 spektrales Lochbrennen 495, 496 Stabilitätsbedingung 485 Steigungswirkungsgrad 493 Szintillator-Farbstoff- 515 Tabelle 523 Th3+:SiO2 509 Theorie der Oszillation 486–490 Ti3+:Saphir 502, 504, 505, 515, 524, 534 Tm+ -Fluoridglas 524 Tm3+:YAG 502 U3+:CaF2 422 VECSEL 535 vibronischer 505 Vielfach-Spiegelresonator 499 Vielmoden- 494 Wirkungsgrad 493 Xanthen- 515 XeCl-Excimer- 514 XeF-Excimer- 514 Yb3+:Quarzglas 507, 508, 511, 524, 534 Yb3+:YAG 420, 502, 504, 524, 538 Zahl der Moden 494 Laser Weapon System 508 Laserdioden 585, 618–627 abgegebene Leistung 621 abstimmbare 627 AlGaAs 471, 509
Anwendungen 585 Ausgangs-Photonenfluss 621 Barren 631 Bauelementstrukturen 629–644 Breitstreifen- 631 DBR- 626 DFB- 626 differentielle Ansprechempfindlichkeit 622 differentielle äußere Quantenausbeute 621 eingebettete Heterostruktur 631 Einmodenbetrieb 626 Einschlussfaktor 619 Gewinn 619 Gewinnbedingung 620 innerer Photonenfluss 621 Intrabandpumpen 471 kantenemittierende 593, 630 Laserschwelle 620 Leistungs-Strom-Kurve 622 Leistungsumwandlungswirkungsgrad 622 Littman-Metcalf-Anordnung 627 Materialien 629–644 Mehrfachquantendraht- 631, 632 Mehrfachquantenpunkt- 632 mit externem Resonator 627 mit verspannten Schichten 629 Oberflächenemitter 637 aus photonischen Kristallen 641 Pumpen 467 Quantendraht- 631, 632 Quantenpunkt- 632 Quantenschicht- 628 räumliche Eigenschaften 625 Rückkopplung 619 spektrale Eigenschaften 624 Stegwellenleiter- 630, 631 Strahlungsverteilung im Fernfeld 625 Vergleich mit LED 623, 625 Vergleich mit Superlumineszenzdioden 623, 625 Verluste 619 verteilte Rückkopplung 631 Wirkungsgrad 621, 623 Lasereinschluss 441 Laserkühlung 440, 441, 441 Laserpulse Dauer 523, 530 Energie 530 Erzeugung 525, 526, 532 Intensität 532
Leistung 529 modengekoppelte 531 Peakleistung 524, 529 Pulsform 530 ultrakurze 526 Wiederholungsraten 524 Laserschwelle 488, 489 Lasertrapping 440, 441 Laserübergang Alexandrit 476 Ar+ 476 ArF-Exciplex 476 C5+ 476 CO2 476 Cr2+:ZnS 476 Cu+ (Kα ) 476 Eigenschaften 475 Er3+:Quarzglas 473, 476 Forsterit 476 GaAs 426 He-Ne 476 InGaAsP 476 Nd3+:Phosphatglas 421 Nd3+:YAG 421, 422, 467 Nd3+:YVO4 476, 502 Ne+ (Kα ) 476 Rhodamin-6G 424, 476 Rubin 469, 476 Ti3+:Saphir 476, 505 U3+:CaF2 422 Yb3+:YAG 476, 504 Laserverstärker 457–483, 486 siehe auch Laser; optischer Verstärker; optische Faserverstärker Abhängigkeit vom Besetzungsunterschied 466 Bandbreite 459, 460, 486 Bedingung für Verstärkung 457 Beispiele 468–475 Besetzungsinversion 459, 461 Besetzungsunterschied 463–465 Brillouin-Faserverstärker 475 Dämpfungskonstante 460 Dauerstrichbetrieb 462 dopplerverbreitertes Medium 479 Dreiniveau- 465 Eigenschaften 476 Energieniveaudiagramm 462 Er3+:Quarzglas 472 Faser- 472, 474 Geschwindigkeitsgleichungen 462–464 Gewinn 459, 460, 486
1035
1036
Stichwortverzeichnis
Gewinn bei Sättigung 476–480, 487 Gewinn für kleine Signale 479, 480, 486 Gewinnkoeffizient 459–461 homogen verbreiterte Medien 476–478 idealer 458 inhomogen verbreiterte Medien 478–480 In-Line- 469 Leistungsverstärker 469 Lochbrennen 480 lokalisierte Raman- 474 MOFA 469, 507, 508 MOPA 469, 471, 506, 507 Näherung kleiner Signale 464 National Ignition Facility 471 3+ Nd :Glas 471 Nd3+:Quarzglas 470, 471 Nichtlinearität 476–480 optisches Pumpen 463, 468 Phasenverschiebung 460, 461 Photonenstatistik 481 Pumpen 461–468, 473 Pumpen von Raman- 474 Pumpverfahren 467 Quantendefekt 467 Raman-Faserverstärker 474, 475 Rauschen 480, 480, 481 realer 458 Rubin 469, 470 sättigbare Absorber 478 Sättigung 464 Sättigungs-Photonenflussdichte 477 stationärer Zustand 462 Theorie 459 Vergleich Drei-/Vierniveaupumpen 466 Vergleich mit elektronischen V. 457, 458 verstärkte spontane Emission 480, 481, 517, 610, 617 verteilte Raman- 474 Vierniveau- 464 Vorverstärker 469 Zerfallszeiten 462 Zwischen- 469 Lawinenaufbauzeit 672–674 Lawinenphotodiode 669–679 Ansprechempfindlichkeit 670 Antwortzeit 672 Aufbau 671
dünne 687 Durchgriff- 672 Einzelphotonen- 676, 677 Erholungszeit 677 Gated-Geiger-Betrieb 677 Geiger- 677 getrennte Absorption/ Ladung/Verstärkung 672 getrennte Absorption/Verstärkung 672 Gewinn 670 Gewinnrauschen 685 Grundlagen 669 Ionisationskoeffizienten 670 Ionisationsverhältnis 670 Kennlinie 674 konventionelle 669 Lawinenaufbauzeit 672, 673 Löschung 677 Materialien 673 Mehrschicht- 564 ortsabhängige Parameter 676, 688 Prinzip 654 rauscharme 687 Signal/Rausch-Verhältnis 694 Stoßionisation 669 Totraum 676 Totzeit 677 verlaufsabhängige Parameter 676, 687 Verstärkungsrauschen 676 Vervielfachung beider Ladungsträger 671 Vervielfachung eines Ladungsträgers 670 Vorteile 693 Zusatzrauschfaktor 685, 686 Lawrence Livermore National Laboratory 471, 507, 516, 517 LCD 176 mit aktiver Matrix 748 Matrix- 747 Segment- 746 LCLS 522 Lebensdauerverbreiterung 436 LED 14, 543, 585–603, 926 äußerer Photonenfluss 593 äußerer Wirkungsgrad 593 AlGaAs 598 AlGaN 599 AlInGaN 600 AlInGaP 599 Ansprechempfindlichkeit 594 Ansteuerung 596
Antwortzeit 595 Anwendungen 585 Aufbau 600–603 Auskopplungswirkungsgrad 591– 593, 600 Bauelementstrukturen 596–607 Bauformen 592 zu Beleuchtungszwecken 585, 603 Besetzungsinversion 585 Chip-on-Board- 606 diskrete 604 Doppelheterostrukturen 591 Eigenschaften 590–596 Energieverbrauch 604 Farbtemperatur 604 Farbwiedergabe 604 Farbwiedergabeindex 604 flächenemittierende 597 Flächenleuchten 607 Flip-Chip-Montage 592, 600 GaAs 596 GaAsP 597 GaN 599 Infrarot 598 InGaAs 598 InGaAsP 598 InGaAsSb 598 InGaN 599 InGaP 599 innere Quantenausbeute 587, 591 innerer Photonenfluss 590 innerer Wirkungsgrad 590 kantenemittierende 593, 597 Kollimatoren 8, 11, 593 Laserdioden 618–627 Lebensdauer 604 Leistung 593 Leistungsumwandlungswirkungsgrad 594 Leuchtmittel 606 Leuchtstoff- 605 Licht/Strom-Charakteristik 594, 595 Lichtausbeute 604 Materialien 596–603 Mehrfachquantenschichten 591 Mikroresonator- 594 organische 581, 601, 602 photonische Kristalle 593 polymere 603 Polymerlinsen 593 raue Oberfläche 592 räumliche Verteilung des Lichts 593
Stichwortverzeichnis
Retrofit 607 RGB- 605, 606 Saul-Lee-Burrus- 598 sichtbares Licht 599 spektrale Verteilung 595 UV 600 Vergleich mit Laserdioden 623, 625 Vergleich mit Superlumineszenzdioden 623, 625 weiße 605, 606 Legendrefunktionen 415 Leistung 31, 120, 125 ebene Welle 33 optische 31, 603 Leistungsreflexionsgrad 162 Leistungs-Strom-Kurve 622 Leistungstransmissionsgrad 162 Leistungsumwandlungswirkungsgrad Laser 493 Laserdiode 622 LED 594 Leistungsverstärker 468, 927 MOFA 469 MOPA 469 Leistungsvorgabe 938 Leitungsband 425 Licht amplitudengequetschtes 399 Attribute 869, 870 Beleuchtungsstärke 603 Bestrahlungsstärke 603 Eingrenzung 14 Farbtemperatur 604 Farbwiedergabeindex 604 Fockzustand 399 Frequenzen 29 gepulstes 49–53 Hellempfindlichkeitskurve 603 inkohärentes 350, 357 Intensität 603 intensitätsgequetschtes 399 kohärentes 350 Kohärenz 43 Kohärenzfläche 357 Komplementärfarben 605 kreuzleistungsfreies 357 Lichtausbeute 603 Lichtstrom 603 metameres 603, 605 monochromatisches 353 optische Leistung 603 partiell kohärentes 350 phasengequetschtes 399
photometrische Maßeinheiten 603 photonenzahlgequetschtes 399 polarisiertes 372 polychromatisches 49–53 quadraturgequetschtes 398, 399 Quantenzustand 396–403 quasimonochromatisches 356, 363 radiometrische Maßeinheiten 603 spektrale Breite 353, 354 stochastisches 349, 350 Strahlungsfluss 603 sub-Poisson- 399 thermisches 413, 443–446 unpolarisiertes 372 V-Lambda-Kurve 603 Wellenlängen 29 Zahlzustand 399 zeitliche Kohärenz 356 Lichtausbeute 603 lichtemittierende Diode siehe LED Lichtgeschwindigkeit 29 in einem Medium 30, 122 im Vakuum 30, 119 Lichtkugel 848 Lichtleiter 13, 17 siehe auch Wellenleiter Akzeptanzwinkel 14, 26 Kopplung 27 mit variablem Brechungsindex siehe Gradientenindexfaser numerische Apertur 14, 26 Lichtlinie 207, 272 Lichtschwebung 51, 52, 953 Lichtstrom 603 Lichtverschiebung 441 Ligandenfeldtheorie 420 LIGO 48, 49, 398 lineare Polarisation 151, 153 lineares System 80, 977–980 eindimensionales 977–979 Impulsantwortfunktion 979 isoplanatisches 979 kausales 978 Moden 981–985 Punktverbreiterungsfunktion 979 Übertragungsfunktion 977, 980 verschiebungsinvariantes 977, 979 zeitinvariantes 977 zweidimensionales 979, 980 Linienbreite 432, 500 siehe auch spektrale Breite Laser 500 Schawlow-Townes- 500, 626
Linienformfunktion 432, 435, 436, 439 Dopplerverbreiterung 479 Lorentzprofil 436, 437 Linienverbreiterung 436–439 Doppler- 438, 439 homogene 421, 436, 437 inhomogene 421, 437, 438 Lebensdauer- 436 Stoß- 437 Voigtprofil 438 Linienverbreiterungsfaktor 626 Linkshändigkeit 226 Linse 11 Abbildung 40 asphärische 12 bikonkave 13 bikonvexe 13, 40 Brennpunkte 22 Brennweite 22 dicke 22 dünne 39, 64, 65 Fresnel- 13 Gradientenindex- 42 Hauptpunkte 22 ideale 231 Kardinalpunkte 22 konkave 12 konvexe 12 Meniskus- 12 plankonkave 13 plankonvexe 13, 39 sphärische 11 Zylinder- 12 Loch effektive Masse 546 leichtes 547 schweres 547 split-off-Band 547 Lochbrennen 480 räumliches 495 spektrales 495, 496 Logikgatter siehe Gatter lokaler Oszillator 953, 956 lokalisierte Plasmonoszillationen 321 lokalisiertes Oberflächenplasmon 221 Lorentzfunktion 135 Lorentzmodell 134, 235, 237, 761 Lorentzprofil 436, 437 Lorentzverteilung Halbwertsbreite 973
1037
1038
Stichwortverzeichnis
Lumineszenz 413, 446–450 Beta- 447 Bio- 447, 448 Chemi- 448 Einteilung 447 Elektro- 448 Fluoreszenz 448 Kathodo- 447 Mehrphotonenfluoreszenz 449 Phosphoreszenz 448 Photo- 447–450 Radio- 448 Sono- 447 stoßinduzierte 447 Summenfrequenz-Fluoreszenz 450 Lumineszenzschicht 449 LUMO siehe Molekülorbital, tiefstes unbesetztes
M Mach-Zehnder-Interferometer 274, 385 magnetische Flussdichte 119 magnetische Induktion 119 magnetische Pinzette 441 magnetische Quantenzahl 415 magnetisches Feld 118 Magnetisierung 119 Magnetooptik 174, 175 magnetooptische Falle 441, 442 Mandelgleichung 394 Manley-Rowe-Beziehung 769, 784, 792, 800 Maser 486 astronomischer 513 Maßeinheiten photometrische 603 radiometrische 603 Masteroszillator-Faserverstärker 469, 507, 508 Masteroszillator-Leistungsverstärker 469, 471, 506, 507 Materialdispersion 816, 922 Faser 309, 313 Materialgleichung 125, 164, 173, 174 Matrix-LCD 747 Matrizenmultiplikation 21 Matrizenoptik 4, 19–26 Bragggitter 195 periodische Medien 203–207 Polarisation 982 Polarisationsoptik 155–159
Schichtmedien 187–200, 982 Strahltransfer 982 Maxwell-Garnett-Mischungsregel 142, 246 maxwellsche Gleichungen lineares, nichtdispersives, homogenes, isotropes, quellenfreies Medium 122 Medium 119, 125 quellenfreies Medium 119 Randbedingungen 120 Vakuum 118 Medium doppelt-negatives 222–225 doppelt-positives 222–224 dopplerverbreitertes 479 einfach-negatives 222–224, 248 hyperbolisches 232, 257 leitfähiges 234 linkshändiges 224, 226 resonantes 223 verlustfreies 189 Mehrdeutigkeitsterm 108 Mehrfachquantendrahtlaser 631, 632 Mehrfachquantenpunktlaser 632, 926 Mehrkernfaser 304, 305, 922 Mehrkernkoppler 304, 305 Mehrpfaddispersion 816 Mehrphotonenabsorption 760 Mehrphotonenfluoreszenz 449 Mehrphotonen-Mikrolithographie 450 Mehrphotonenmikroskopie 450 Zweiphotonenmikroskopie 449 Mehrphotonen-Mikrolithographie 450 Mehrphotonenmikroskopie 450 Meniskuslinse 12 Metalle Bandstruktur 425 Leitungsband 425 Plasmafrequenz 516 Metamaterial 221, 245–253 hyperbolisches 250 mit negativem Brechungsindex 248, 249 mit negativer Permittivität 247, 248 Metaoberfläche 222, 251 als Phasenmodulator 251 komplementäre 251 Michelson-Sterninterferometer 370
Miestreuung 141, 441, 451 Mikrobolometer 651 Mikrodisk 341 Mikrokanalplatte 653, 654 als Bildverstärker 654 Mikrokugel 341 Mikrokugelresonator 344 Mikrolaser chaotischer 513 chaotischer ZnO 513 Mikrooptik 223 Mikroresonator 340, 341 Kugel 343 Mikroring 342 Mikrosäule 342 Mikroscheibe 342 Moden 341 photonischer Kristall 344, 345 rechteckiger 341 Mikroresonatorlaser 636–644 Mikroringresonator 883 Mikrosäule 341, 345 Mikrosäulenresonator 322, 579, 580 mikrostrukturierte Faser 185 Mikrotorus 341 millersche Regel 798 Miniband 426, 568, 579, 634 Quantenkaskadenlaser 634 MIRACL 515 Mittelwert Autokorrelationsfunktion 351 Ensemble- 350 zeitlicher 351 Moden 263 diskrete lineare Systeme 982 elektromagnetische 70 Faser- 295, 302 Fockzustand 399 gekoppelte 278 gewöhnliche Differentialgleichungen 983 Grenzwerte 296 homogenes Medium 984 Integraloperator 982 kohärenter Zustand 397 lineare Systeme 981–985 partielle Differentialgleichungen 984 periodisches Medium 985 Quadraturkomponenten 397 Quantisierung 379 Resonator- 323–329, 983 Super- 281 Wechselwirkung mit Atomen 430
Stichwortverzeichnis
Wellenleiter- 262, 265, 268 Zahlzustand 399 Modendispersion 272, 816, 921 Faser 289, 313 Modenfläche 315 Modenindex 324 Modenkopplung 526, 531–535 aktive 533, 715 Beispiele 533 Eigenschaften 531 Kerrlinsen- 533, 534 Methoden 532 passive 533 sättigbare Halbleiterspiegel 533 sättigbarer Absorber 533 Modenmultiplexing 306 Modenrauschen 299 Modensprünge 499 Modenvolumen 322, 341 Modulation Amplitude 945 Amplitudenumtastung 946, 947 Ein-Aus-Codierung 946, 947, 957 Feld 945 Frequenz 945 Frequenzumtastung 946, 947 Intensität 179, 945, 946 Phasencodierung 957 Phasenumtastung 946, 947 Pulscode- 946 Modulator akustooptischer 706, 715 Bandbreite 715, 716 Elektroabsorptions- 753 elektrooptischer 179, 729 elektrooptischer Phasen- 729 elektrooptischer räumlicher 735 Flüssigkristall- 742, 744–746 Intensitäts- 731, 732, 741 interferometrischer 731, 732 Mach-Zehnder- 731, 732 optisch adressierter räumlicher 735 Phasen- 741 Pockelsspeicher 736 quadratischer Phasen- 819 räumlicher 736 als Schalter 889 Molekularstrahlepitaxie 565 Moleküle 422–424 CO2 423 Farbstoff- 424 N2 423 Rhodamin-6G 424, 476, 512
Rotation zweiatomiger 422 Schwingung dreiatomiger 423 Schwingung zweiatomiger 422 Molekülorbital höchstes besetztes 552 tiefstes unbesetztes 552 mooresches Gesetz, optisches 933 Multiplexer 881, 882 Add/Drop- 881–883 Prisma 885 Multiplexing 870, 931, 947 Code- 948 elektronisches 948 Frequenz- 947 lambdaXtreme-System 934 optisches 948 Ortsfrequenz- 83 Raum- 934, 948, 950 T-System 947, 948 Wellenlängen- 882, 931, 934, 948, 949 Zeit- 905, 947
N Nachverstärker siehe Leistungsverstärker Nachweisgrenze 682 Näherung der langsam variierenden Einhüllenden 35 Nahfeldmikroskopie 104 Nanoantenne 221 Nanodisk 322 metallische 345 Nanokristalle 427, 632 Übergitter 428 Nanokugel metallische 242, 243, 321, 322, 345, 346 Nanooptik siehe Nanophotonik Nanophotonik 105, 222 Nanoresonator 346 Nd3+:Quarzglas Energieniveaus 419 Nd3+:YVO4 -Laser 420 Nd3+:YAG (Nd3+:Y3 Al5 O12 ) 420 Energieniveaus 419 Laserübergang 421, 422, 467 Nebenquantenzahl 415 Neodym-Glas-Laser Pumpen 470, 471 Netz Bus- 959 faseroptisches 958–964 lokales 958
Maschen- 959 Ring- 959, 960 Schnittstellen 959 Stern- 959 Topologie 958 Netzmultiplexing 961 Neutrinodetektor 653 Neymanverteilung 453 nichtbeugende Strahlen 74 nichtlineare Optik 759–799 Abstimmungskurven 769 anisotrope dispersive Medien 799 anisotrope Medien 794 bornsche Näherung 762 dispersive Medien 796 doppelt resonanter Oszillator 789 Dreiwellenmischung 766, 779, 784, 791, 795 dritter Ordnung 775–782, 789–794 Echtzeitholographie 781 einfach resonanter Oszillator 789 elektrooptischer Effekt 765 entartete Vierwellenmischung 780 Erzeugung der dritten Harmonischen 775, 792 Frequenzverdopplung 763, 764, 784 Kerrmedium 775 Kohärenzlänge 771 Kreuzphasenmodulation 778 Manley-Rowe-Beziehung 769, 784 nichtlineare Schrödingergleichung 777 optische Frequenzkonversion 786 optische Gleichrichtung 764, 765 optische Kerrlinse 777 optische Phasenkonjugation 780, 792 optischer Kerreffekt 775 optischer parametrischer Oszillator 768, 788 optischer parametrischer Verstärker 767, 787 parametrische Wechselwirkungen 768 periodisch alternierende Materialien 774 Phasenabgleich 766 Phasenbedingung 769 Phasenfehlanpassung 786 phasensensitiver Verstärker 792 Polarisation 760–762 Quasi-Phasenanpassung 773 Ramangewinn 777
1039
1040
Stichwortverzeichnis
Selbstfokussierung 776 Selbstphasenmodulation 776 Solitonen, räumliche 777 spontane parametrische Differenzfrequenzerzeugung 768 Streutheorie 762 Theorie gekoppelter Wellen 782, 789, 790 Vierwellenmischung 778, 789 Wellengleichung 762 Wirkungsgrad der Frequenzverdopplung 764, 786 zweiter Ordnung 763–774, 782– 789 nichtlinearer optischer Schleifenspiegel 887 nichtreziproke polarisierende Bauelemente 179 nichtstrahlende Übergänge 436 Normalfläche 168 Normalmoden anisotroper Kristall 165, 166 optisch aktives Medium 173 polarisierendes System 158 Nullpunktsenergie 379 numerische Apertur 14, 269 Faser 291, 292 Nutzdaten 907 Nyquistrauschen 690
O Oberflächenemitter 535, 637 Oberflächenplasmon 228 Nanolaser 346 Oberflächenplasmonpolariton 221, 227, 228, 239 an Grenzfläche DP/EN 229 Erzeugung und Nachweis 240 lokalisiertes 241 Oberflächenplasmonresonanz 241, 243 ohmsches Gesetz 658 OLED 581, 601, 602 omnidirektionale Reflexion 210 On-Chip-Quantenschaltungen 403 Optik Akusto- 705–725 Elektro- 727–756 elektromagnetische 3, 117–148 erster Ordnung 7 Faser- 289–319 Fourier- 79–112 gaußsche 7 geometrische 4
Halbleiter- 543–582 integrierte 261 klassische 3 nichtlineare 759–801 paraxiale 4, 7 Photonen- 377–406 photonischer Kristalle 185–219 Polarisations- 151–183 Quanten- 3 Resonator- 321–347 statistische 349–375 Strahlen- 3 ultraschnelle 803–865 von Metallen 221–258 von Metamaterialien 221–258 von Strahlbündeln 57–76 Wellen- 3, 29–54 Wellenleiter- 261–287 Optik von Strahlbündeln 57–76 optische Achse 165 optische Aktivität 172–174 optische Faserverstärker 472, 472, 473 siehe auch Laserverstärker Brillouin- 475 Eigenschaften 472 erbiumdotierte 472, 473 erbiumdotierte Quarzglas 469 lokalisierte Raman- 474 praseodymdotierte 473 Pumpen 472–474 Raman- 474, 475 seltenerddotierte 472 thuliumdotierte 473 Vergleich mit Halbleiterverstärkern 617 verteilte Raman- 474 optische Gitter 442 optische Halbleiterverstärker 607– 618 Bandbreite 608, 609 Geometrie 612 Gewinn 608, 613 Gewinnkoeffizient 609–611, 615 Heterostrukturen 613, 614 Pumpen 612 Quantenpunkt 617 Quantenschicht 614–617 Rauschen 610 Superlumineszenzdioden 617, 618 Vergleich mit Faserverstärkern 617 verstärkte spontane Emission 617
Wellenleiter 617 Zustandsdichte 615 optische Indikatrix 165 optische Komponenten 36–42 Beugungsgitter 40 Linse 39, 40 mit variablem Brechungsindex 41 Prisma 39 Spiegel 36 Transmission 37 transparente Platte 37 optische Melasse 440, 443 optische Nahfeldmikroskopie 105 optische Phasenkonjugation 780 optische Pinzette 441 optische Überlagerung siehe Lichtschwebung optischer Halbleiterverstärker 585 optischer Verstärker 457, 486 siehe auch Laserverstärker als Laser 485 inkohärenter 457 kohärenter 457 Rauschen 472 optischer Wirbel 73 optisches Mischen siehe Lichtschwebung optisches System paraxiales 21 periodisches 23 Stabilitätsbedingung 24 optisch-optischer Steigungswirkungsgrad 493 optisch-optischer Wirkungsgrad 493 Optochip 877, 878 Optokoppler 190 Ordnungszahl 418 organische Halbleiter 551, 552 effektive Masse der Ladungsträger 552 Elektronentransport 552 Mobilität der Ladungsträger 552 Polymere 552 organische lichtemittierende Dioden 601 Ortsfilter 100, 101 holographische 109 Ortsfrequenz 79, 81 Ortsfrequenzmultiplexing 83 Oszillator doppelt resonanter 788, 789 einfach resonanter 788, 789 klassischer harmonischer 134 optischer 485
Stichwortverzeichnis
optischer parametrischer 768, 788 quantenmechanischer harmonischer 423 Oszillatorstärke 432, 433
P Paketschalter 870, 907 Parabolspiegel 6, 7, 244 Parabolwelle 34, 58 Durchgang durch dünne Linse 40 parametrischer Oszillator 760 kollinearer 770, 771 optischer 768, 788 parametrischer Verstärker 760 parametrischer Verstärker, optischer 767, 787 paraxiale Helmholtzgleichung 35 Analogie zur Schrödingergleichung 35 paraxiale Näherung 7 paraxiale Strahlen 7 paraxiale Welle 34 Wellenfront 34 Wellenfunktion 34 partielle Polarisation 370–373 Kohärenzmatrix 371 Poincarékugel 371–373 Polarisationsgrad 373 Stokesparameter 371, 373 unpolarisiertes Licht 372 Partikelplasmon 221 paulisches Ausschlussprinzip 415, 544 Pellicle-Strahlteiler 190 Periodensystem der Elemente 416, 417 Halbleiter 547 periodisch gepolte Materialien 774 periodische Medien 212, 213 periodische optische Systeme 23–26 Permeabilität 122 Permittivität 121 dispersives Medium 126 relative siehe Dielektrizitätskonstante Tensor der elektrischen 123, 163 Phasenabgleich 766 Phasenanpassung 208 Phasenbedingung 769, 770 Reflexion am Spiegel 37 Reflexion/Brechung an einer dielektrischen Grenzfläche 37 Phasenfilter 811
Phasengeschwindigkeit 33, 143, 146 Kugelwelle 33 photonischer Kristall 206 Phasengitter 81 Phasenkonjugation 760, 792, 793 Phasenkonjugator 780, 782, 793 Phasenmodulation 252 Phasenmodulator, quadratischer 819 Phasenschieber 742 phasensensitiver Verstärker 792 Phasensingularität 73 Phasenumtastung 946, 947 Phasenverschiebung TE-Reflexion 160 TM-Reflexion 162 Phasenverschiebungskoeffizient 487 Phononenübergänge 570 Phosphoreszenz 448, 602 Phosphosilikat-Raman-Faserlaser 511 Photodetektor 543 äußerer Photoeffekt 652 allgemeine Eigenschaften 655– 660 Ansprechempfindlichkeit 656, 657 Antwortzeit 657 Array- 679 Durchgangsverbreiterung 657 Empfängerempfindlichkeit 692 Gewinn 657 innerer Photoeffekt 652 Lawinenphotodioden 669–679 linearer dynamischer Bereich 657 optischer Resonator 656 organischer 655 Photodioden 663–668 photoelektrische Austrittsarbeit 652 photoelektrische Emission 652 photoelektrischer 651 Photoleiter 654, 660–663 plasmonischer 656 pyroelektrischer 651 Quantenausbeute 655 Quantenpunkt-Infrarotdetektoren 663 Quantenschicht-Infrarotdetektoren 662 Rauschen 681–698 RC-Zeitkonstante 659 Schaltungsrauschen 690 Signal/Rausch-Verhältnis 692 Theorem von Ramo 658 thermischer 651
Photodioden 653, 663–668 angelegte Spannung 664 Ansprechempfindlichkeit 666 Antwortzeit 663 Betriebsarten 664 Einschlussfaktor 666 evaneszente Kopplung 666 Fensterschicht 666 Ge auf Si 667 Halbleiter- 654 Heterostruktur 666 kantenbeleuchtete 665 Kennlinie 664 Kurzschlussbetrieb 664 Lawinen- siehe Lawinenphotodiode Materialien 663 als Photoelement 664 als Photoleiter 664 pin-Übergang 665 pn-Übergang 663 Prinzip 663 Schottky- 667, 668 Stoßionisation 654 Wanderwellen-Anordnung 666 Photoeffekt 651 äußerer 651 innerer 651 photoelastische Konstante 706 photoelastischer Effekt 722 photoelastischer Tensor 722 Photoelektronenrauschen 681–683 Photoemission 652 Einsteingleichung 652 Photokathode 653 Photoleiter 660–663 Antwortzeit 661 dotierte Materialien 661 Gewinn 661 intrinsische Materialien 660 spektrale Antwort 661 Photoleitfähigkeit 654 Photoleitung 651 Photolumineszenz 447–450 Anwendungen 448 Mehrphotonen- 449 Photomischen siehe Lichtschwebung Photomischung 953 Photomultiplier siehe Sekundärelektronenvervielfacher Photon 378–387 Bahndrehimpuls 384 Begriff 378
1041
1042
Stichwortverzeichnis
Bose-Einstein-Statistik 430 Durchgang durch Polarisator 381 Durchgang durch Strahlteiler 382 Eigenschaften 380 Energie 379 Flussdichte 388 Gaußstrahl 382 Impuls 383, 384 Interferenz 384 Konzept 446 Mach-Zehnder-Interferometer 385 Ort 382 Polarisation 380, 381 polarisationsverschränkte 402 Spin 384 Sub-Poisson-Verteilung 579 thermisches Gleichgewicht mit Atomen 443 verschränkte 400 Verzögerung 449 Younginterferometer 384, 385 Zeit 385 Photonen 378, 430–435, 443–446 Photonengas 444 Photonenlebensdauer 487 Photonennachweiswirkungsgrad 655 Photonenoptik 377–406 Photonenrauschen 681, 682 Photonenstatistik 387–403 Bernoullientscheidung 394 Boltzmannverteilung 392 Bose-Einstein-Statistik 392, 393 doppelt-stochastische Verteilung 393, 394 exponentielle Wahrscheinlichkeitsdichte 394 Flussdichte 388 geometrische Verteilung 392 homogene Verteilung 406 kohärentes Licht 390 Laserverstärker 481 Mandelgleichung 394 Mittelwert und Varianz 391 mittlere Flussdichte 388 mittlere Zahl von Photonen 388 nichtzentral-negativ-binomiale Verteilung 481 Photonenfluss 388 Poissonverteilung 391, 392 Signal/Rausch-Verhältnis 391 spektrale Dichten des Photonenflusses 388 sub-Poisson 399
thermisches Licht 392 Vakuumzustand 398 Varianz 393 zeitlich variierendes Licht 389 zufällige Aufteilung 394 zufällige Auswahl 394 Photonenstrom 387–403 Photonenzähler 679 Photonik 543, 586 integrierte 261, 586 photonische Bandlücke 205–207, 215, 283 photonische Laterne 305, 306 photonische Strukturen 185 photonischer Kristall 185, 186, 200– 219, 341 Bandlücke 205, 206, 215 Bandstruktur 205, 206, 215 Blochmoden 201 Dispersionsdiagramm 283 Dispersionsrelation 206 dreidimensionaler 213–217 eindimensionaler 200–211 Fasern 314–316 Gruppengeschwindigkeit 206 Herstellung 217 Holzhaufen-Struktur 216 Löcher auf einem Diamantgitter 215 Loch-und-Stab-Struktur 216 Mikroresonatorlaser 641 mit variablem Brechungsindex 217 omnidirektionale Reflexion 210 Phasengeschwindigkeit 206 projiziertes Dispersionsdiagramm 207 Punktdefekte 216 als Resonator 344, 345 Wellenleiter 282, 283 Yablonovit 216 zweidimensionaler 212, 213 Photorefraktion Anwendung 752 Theorie 750 Photorefraktivität 749–752 Photostrom 653 Photostromrauschen 683 Pilotsystem 253 Pinzette akustische 441 magnetische 441 optische 441 planare Polarisation 153
Planck, Max 378, 387, 388, 445 plancksche Konstante 379 plancksches Strahlungsgesetz 445 Plaser 512 Plasma 227 Plasmafrequenz 235, 236 Plasmawellenlänge 236 Plasmon 227, 238, 283–285 Wellenlänge 228 Plasmonband 238 Plasmonik 221, 234, 283–285 Plasmonpolariton Oberflächen- 239 Volumen- 238 Plasmonresonanzspektroskopie 241 Plasmonresonator 322 Pockelseffekt 727–729, 734, 738 Pockelskoeffizient 729, 737, 765 Symmetrie 738 Pockelsspeicher 736 Poincarékugel 153–155, 371–373 Poissonprozess 394 Poissonverteilung 391 Signal/Rausch-Verhältnis 392 Polarisation 152–159, 760, 761 dielektrische 119 elliptische 151 Kohärenzmatrix 371 langsame Achse 157 lineare 151, 153, 372 Matrixdarstellung 155–159 orthogonale 155 parallele 160 partielle 350, 370–373 planare 153 Poincarékugel 371–373 Rotator 158 schnelle Achse 157 durch selektive Absorption 177 durch selektive Brechung 178 durch selektive Reflexion 177 Stokesparameter 371, 373 TE- 159, 160 TM- 159, 161 unpolarisiertes Licht 372 Verhalten des elektrischen Feldvektors 152, 153 zirkulare 151, 153, 372 Polarisationsdispersion 311, 816 Faser 313 Polarisationsebene nichtreziproke Drehung 181 Polarisationsellipse 152, 154, 155 Polarisationsgrad 373
Stichwortverzeichnis
Polarisationsgradientenkühlung 441 Polarisationsmodendispersion 924 Polarisationsoptik 151–183 Zweiphotonenoptik 401 Polarisationsrotator 158, 176, 179 Polarisationsschalter 870 Polarisationsverhältnis, komplexes 154 Polarisator 157 Brewsterwinkel- 178 Drahtgitter- 177 linearer 157, 177 polarisierender Strahlteiler 178 Polariton 228 Polaroidfilter 177 Polung 774 polychromatisches Licht 49–53 Polymer-LED 603 Polymerwellenleiter 276 Positron 415 Poyntingtheorem 120, 122 Poyntingvektor 120 komplexer 125 TEM-Welle 126 Zusammenhang mit Bahndrehimpuls 121 Zusammenhang mit Impulsdichte 120 Zusammenhang mit optischer Intensität 120 Prinzip von Hero 5 Prisma 9, 39 Demultiplexer 885 elektrooptisches 732, 733 Multiplexer 885 Puffer 906 Puls Ausbreitung in dispersiven Medien 143–146 Ausbreitung in Fasern 821–831 Chirpfilter 810–818 Detektion 854–863 Dispersion 837 ebene Welle 808 Eigenschaften 804 Erzeugung von Terahertz- 840 Formung und Kompression 810– 821, 826 Fourieroptik 832 Gaußfunktion 807 Gaußstrahl 810 gechirpte Gaußfunktion 807 gechirpter 805, 813 in dispersivem Medium 836, 838
instantane Frequenz 805 Kompression 842 Kompression durch Chirpfilter 815 Kugelwelle 809 langsam variierender 809 lineare Filterung 810 Selbstphasenmodulation 841 spektrale Intensität 804 spektrale Phase 804 Spektrogramm 806 transformationbeschränkter 807 Verbreiterung 831, 832, 838 Verstärkung durch Chirpfilter 815 Pulscodemodulation 946 Pulsdispersion 837 Pulskompression 842 Pulsverbreiterung 831, 832, 838 Pumpen Effizienz von optischem 468 elektrisches 467, 612 optisches 468, 612 optisches Innerschalen- 518 Tandem- 508 Vergleich optisches und elektrisches 468 Pumpwelle 401, 767, 780 Punktdipolnäherung 246 Punktverbreiterungsfunktion 366, 979 Pupillenfunktion 99, 101 verallgemeinerte 102 Purcelleffekt 594, 637, 641 Purcellfaktor 439
Q Quadraturdiagramm 946 Quantenausbeute Abhängigkeit von der Wellenlänge 656 Photodetektor 655 quantenbeschränkte Strukturen 565–569 Quantendefekt 467 Quantendraht 426, 565, 568, 569 Quantendrahtlaser 631, 632 Quantenelektrodynamik 3, 377 Quantenkaskadenlaser 633, 634 bound-to-unbound-Schema 634 heterogene 634 Materialien 635 Quantenmaterie, synthetische 443 Quantenoptik 3, 355, 377, 396
Quantenpunkte 427, 565, 569, 632 Anwendungen 428 CdSe 427 Energieniveaus 427 Herstellung 427 Infrarotdetektoren 663 InP 428 Kern-Mantel- 428 künstliche Atome 427 Nanokristall-Übergitter 428 Quantenschicht- 428 selbstorganisierende 427 Si 428 Quantenpunkt-Festkörper 428 Quantenpunkt-in-QuantenschichtStruktur 663 Quantenpunktlaser 632 Quantenschichten 426, 565, 566 Bandstruktur 427 Energieniveaus 566, 567 Infrarotdetektoren 662 Minibänder 426 optische Halbleiterverstärker 614– 617 Übergitter 426 Zustandsdichte 567 Quantenschichtlaser 628 Quantentheorie alte 414 des Lichts 397, 710, 711 elektromagnetische 377 harmonischer Oszillator 396 Quantenzahlen 415 Azimut- 415 Gesamtbahndrehimpuls- 416 Gesamtdrehimpuls- 416 Gesamtspin- 416 Haupt- 415 magnetische 415 Neben- 415 Spin- 415 Quantenzustand 396–403 amplitudengequetschter 399 Fockzustand 399 intensitätsgequetschter 399 kohärenter 397 phasengequetschter 399 photonenzahlgequetschter 399 quadraturgequetschter 398, 399 sub-Poisson- 399 thermischer 392 Zahlzustand 399 Quantum Cutting 449
1043
1044
Stichwortverzeichnis
Quasi-Dreiniveausystem 467 Quasi-Phasenanpassung quasistatische Näherung Quasi-Zweiniveausystem
464, 466, 773 141 467
R Radiolumineszenz 448 Raman-Faserlaser 510 Bandbreite 510 kaskadierte 510 Oszillationsfrequenz 510 Raman-Faserverstärker 474, 475 Ramangewinn 777, 778 Raman-Gewinnkoeffizient 474 Ramanlaser 511 Silicium- 511, 512, 601 Raman-Nath-Beugung 713 Ramanstreuung 451 induzierte 452, 474, 510, 924 kohärente anti-Stokes- 452 lokalisierter Faserverstärker 474 Stokesverschiebung 474, 510 verteilter Faserverstärker 474 räumliche Lichtmodulatoren 746, 749 akustooptische 719 elektrooptische 735 PAL-SLM 749 räumliche Spektralanalyse 81 Raumschalter 870 photonische 870 Rauschen 1∕𝑓 691 Bitfehlerrate 682 Dunkelstrom- 682 Empfängerempfindlichkeit 682 Gewinn- 685, 687 Hintergrund- 682 Mechanismen 681, 682 Nachweisgrenze 682 Photodetektor 681–698 Photoelektronen- 683 Photonen- 682 Photostrom- 683 Schaltungs- 690 Signal/Rausch-Verhältnis 682 thermisches 690 Zusatzrauschfaktor 682 Rayleigh-Jeans-Gleichung 445, 446 Rayleighlänge 58, 60 Rayleighs inverses Potenzgesetz 139, 307, 316
Rayleighstreuung 138–140, 242, 306, 441, 451 Rechteckfunktion 971 Referenzwelle 106 Reflexion 36, 159–163 äußere 160, 161 an einem ebenen Spiegel 37 an einer ebenen dielektrischen Grenzfläche 159 an Grenzfläche DP/EN 226 dielektrische Grenzfläche 37 Fresnel- 592 innere 160, 161 negative 252 omnidirektionale 210 Phasenverschiebung 160, 162 TE-Polarisation 160 TM-Polarisation 161 Total- 160, 182 Reflexionsgesetz 5, 6 geometrischer Beweis 5 Reflexionsverstärker 793 Regenbogenhologramm 111 Rekollisionsmodell 850, 851 Rekombination 543 strahlende 559 strahlungslose 559 Repeater 933 resonante Medien 134 Resonanzfrequenzen 329, 334, 338 Resonator 322 Beugungsverluste 336 Bow-Tie- 325 dielektrischer 322 effizienter Verlustkoeffizient 487 Eingrenzungsbedingung 331, 333 Energie pro Mode 393 Fabry-Pérot- 321, 323–329 Fabry-Pérot-Wellenleiter- 321 Faser- 509 Finesse 47, 326, 328, 487 Frequenzabstand 327 Frequenz-Pulling 489, 490 g-Parameter 331 Gütefaktor 328 Hohlraum- 339–344 instabiler 498 kalter 489 konfokaler symmetrischer 332 konzentrischer symmetrischer 332 kreisförmiger 338 Kugelspiegel- 330–337 Mikro- 340
Mikrodisk 341 Mikrokugel 341 Mikroring- 882, 883 Mikrosäulen- 322, 341, 345, 579, 580 Mikrotorus 341 Moden 497, 983 Modendichte 326, 340 Modensprünge 499 Nanodisk 345 Nanokugel 345 optischer 26, 321 Photonenlebensdauer 328, 487 photonischer Kristall 341, 344, 345 Plasmon- 322, 345 Resonanzfrequenzen 329, 334, 338 Ring- 321, 325, 511 Selektion einer Longitudinalmode 499 Selektion einer Polarisation 499 Selektion einer transversalen Mode 498 spektrale Breite der Resonanz 326 Stabilität 331 symmetrischer 331 symmetrischer konfokaler 334 Verluste 326, 327 verlustfreier 378 Verlustkoeffizient 327 Vielfach-Spiegel- 499 Wanderfeld- 325 Wasserkühlung 498 zweidimensionaler 337–339 Resonatormoden Analogie zum harmonischen Oszillator 397 axiale 335 Dichte 326, 340, 342 Fabry-Pérot-Resonator 323–326 Flüstergalerie- 321, 322, 338, 339, 345 Fockzustand 399 Frequenzabstand 499 Hermite-Gauß- 335 kalter Resonator 489, 490 kohärenter Zustand 397 Kugelresonator 332 Kugelspiegel 497 Lamb-Dip 496 Laser 494 longitudinale 335 Photonenbild 379
Stichwortverzeichnis
plasmonische 345 schief einfallende 329 Selektion 498 Selektion durch Vielfachspiegel 499 Selektion einer longitudinalen 499 Selektion einer transversalen 498 spektrale Breite 487 transversale 335 als Wanderwelle 324, 325 Zahlzustand 399 Resonatoroptik 321–347, 487 Rückkopplung durch Mehrfachstreuung 512 Retarder 157, 178 dynamischer 730 Halbwellen- 157, 158 langsame Achse 157 Viertelwellen- 157 reziprokes Gitter 212–214 reziprokes System 190 Reziprozität 782 Rhodamin-6G 424 Richtkoppler 274 elektrooptischer 733 Kopplungsfaktor 734 Kopplungslänge 734 nichtlinearer 887 Soliton- 887 Umschaltspannung 734 Ringresonator 321, 325 Rippenwellenleiter 275, 511 Röntgenbeugungsbildgebung 523 Röntgenlaser 515 Röntgenstrahlung Frequenzen 29 Wellenlängen 29 Rotationsschwingungsspektrum 423 Router 869 Add/Drop-Multiplexer 883 intensitätsbasierte 886 Mach-Zehnder-Interferometer 883 passive optische 870, 881–887 polarisationsbasierte 885 wellenlängenbasierte 881 Wellenlängenmultiplexer 882 Wellenleiter-Gitter- 884 Rubin (Cr3+:Al2 O3 469 Rubin (Cr3+:Al2 O3 ) 419, 469 Energieniveaus 419 Rubinlaser 419, 468, 501, 525 Laserübergang 469
Pumpen 470 Schwelle 489 Rückstoßlimit 441
S S-1-Photokathode 653 S-20-Photokathode 652 Saccharimeter 173 Saser 486 sättigbare Absorber 478 Scanner akustooptischer 716, 717 elektrooptischer 732 holographischer 83 optischer 889, 890 Schalen 415 Schaltenergie 900 Schalter 869 akustooptische 715, 718, 894 Ausführungen 887 Banyan- 908 Blasenjet- 895 Eigenschaften 888 Elektroabsorptions- 753 elektrooptische 729, 892 Flüssigkristall- 893, 894 Halbleiter- 893 Koordinaten- 889 Leitungs- 907 magnetooptische 894 mehrdimensionale 903 nichtlineares Sagnacinterferometer 900 optoelektronische 889 optomechanische 890 Paket- 906, 907 parametrische 896 photonische 887–908 plasmonische 899 quantenbeschränkter Starkeffekt 753 räumliche 733, 887 Realisierungen 889 Soliton- 898 thermooptische 895 Typen 870 volloptische 895 Wärmeabfuhr 901 wellenlängenempflindliche 902 Wellenleiter 279 Zeitbereichs- 904 Zeitfensterwechsler 906 Zeitmultiplexing 905 Zeit-Raum-Zeit- 905
Schaltkreis elektronischer integrierter 261 Flip-Chip-Integration 601 optischer 221 photonischer integrierter 261, 262, 601 Schaltungsrauschen 681, 682, 690 Schaltverteiler, optischer 963 Schärfentiefe 60 Schawlow-Townes-Limit 500 Schawlow-Townes-Linienbreite 626 Schichtmedien 187–200 schief einfallende Wellen 191 Schleifenspiegel, nichtlinearer optischer 887 Schmelzkoppler 952 Schmierbildkamera 856, 857 schnelle Achse der Polarisation 157 schnelles Licht 146 Schottkydiode 667, 668 Graphen/Silicium 668 Schraubenversetzung, optische 73 Schrödingergleichung Analogie zur Helmholtzgleichung 414 Halbleiter 545 harmonischer Oszillator 396 Mehrelektronenatome 416 nichtlineare 777, 845 zeitabhängige 414 zeitunabhängige 414 schwarzer Strahler 413 Schwarzkörperstrahlung 443–445 Schwebung Elektronik 52 Licht 51 Schwebungsfrequenz 52 Seedlaser 469, 507, 518 Segment-LCD 746 Sehen Hellempfindlichkeitskurve 603 photoptisches 603 V-Lambda-Kurve 603 Sekans hyperbolicus 844, 971 Sekundärelektronenvervielfacher 653, 654, 677 Silicium- 678 Zusatzrauschfaktor 686 Sekundäremission 653 selbstelektrooptischer Effekt 915 Selbstfokussierung 776 Selbstheilung 76
1045
1046
Stichwortverzeichnis
Selbstphasenmodulation 313, 760, 776, 924 Faser 313 Pulse 841 Selfoc-Platte 16 Self-Seeding 520 Sellmeiergleichung 137, 580 Seltenerdmetalle 417 Separation der Variablen 70 Shockleygleichung 563 SiC 547 Sichtbarkeit 54, 362 Signal/Rausch-Verhältnis 391, 682, 683, 692 Abhängigkeit vom Gewinn einer Lawinenphotodiode 694 Abhängigkeit vom Photonenfluss 693 Abhängigkeit von der Empfängerbandbreite 694 Signalwelle 401 Silicen 553 Silicium Bandlücke 426 poröses 601 Silicium-auf-Isolator-Technik 275, 511 Siliciumcarbid 552 Siliciumphotonik 547, 600 Silicon-On-Insulator-Technik 879 Silicumphotonik 276 Singulettzustand 416 Sisyphuskühlung 441 Skalarprodukt 981 snelliussches Gesetz 5, 6, 8, 37, 159 SNOM 105 solitäre Welle 843 Soliton 313, 760, 842–848, 898, 934 dunkles 848 Erzeugung 847 faseroptische Kommunikation 944 fundamentales 846 höherer Ordnung 846 Periode 846 räumliches 777 räumlich-zeitliches 848 Richtkoppler 887 Vektor- 898 Wechselwirkung 846 zeitliche und räumliche 848 Soliton Trapping 899 Solitonbedingung 843 Solitonen-Faserlaser 316
Solitonenpuls 844 Solitonlaser 847 SONET 931, 960 Sonolumineszenz 447 Spaser 644 Spektralanalysator akustooptischer 718 interferometrischer 858, 859 optischer 858 Spektralanalyse räumliche 81, 82 spektrale Breite 354, 500 siehe auch Linienbreite Gaußpuls 824 spektrale Dichte 353 spektrale Intensität 804 spektrale Leistungsdichte 352, 353 spektrale Phase 804 Spektrogramm 805, 806 Messung 861, 862 spektroskopische Notation 415 Spektrum elektromagnetisches 117, 118 schwarzer Strahler 444–446 Sperrrichtung 563 Sperrschicht 562 Spiegel 6 ebene 6, 36 elliptische 6, 7 Konkav- 7 Konvex- 7 Krümmungsradius 7 Kugel- 6, 7, 67 Parabol- 6 Spin-Bahn-Wechselwirkung 415, 416 Spinmultiplizität 416 Spinquantenzahl 415 Spin-Spin-Kopplung 415 Spiralphase 112 Spiral-Phasenplatte 72 spontane Emission 430, 432, 433, 435 Purcellfaktor 439 verstärkte 439 spontane Lebensdauer 433, 435 effektive 434 spontane parametrische Abwärtskonvertierung 401 Spotgröße 60 Stanen 553 Stanford National Accelerator Laboratory 522 Starkeffekt 418 dynamischer 418
optischer 418, 441, 442 quantenbeschränkter 753 statistische Optik 349–375 Stefan-Boltzmann-Gesetz 446 Stegwellenleiter 275 versenkter 630, 631 Stokesparameter 153–155, 371, 373 Messung 156 Stokesstreuung 451 Stokesvektor 154, 155 Stoßanregung 517 Stöße elastische 437 inelastische 437 Stoßionisation 654, 669 Stoßverbreiterung 437 Strahlbündel 57–76, 834 Airy- 75 Bessel- 74, 98 Bessel-Gauß- 75, 130 Donut- 77 Gauß- 57–69, 146 Hermite-Gauß- 70, 71 Ince-Gauß- 73 Laguerre-Gauß 72 nichtbeugende 74 quadratisch gemittelter Radius 75 Qualität 64 Selbstheilung 76 vektorielles 130 Strahlen, paraxiale 4 Strahlengleichung 14, 15 paraxiale 15 Strahlenoptik 3–29 äußere Brechung 8 ebene Grenzflächen 8 Eikonalgleichung 18 Eingrenzung von Licht 14 Gradientenindexfaser 17 Gradientenindexoptik 14–18 Gradientenindexplatte 15 homogenes Medium 5 innere Brechung 8 Lichtleiter 13 Linsen 11 Matrizen von komplexen Systemen 21 Matrizen von Komponenten 20 Matrizenoptik 19–26 optische Komponenten 6–14 paraxiale Strahlen 7 periodische Systeme 23–26 Postulate 4–6 Prinzip von Hero 5
Stichwortverzeichnis
Prisma 9 Reflexion und Brechung 5 snelliussches Gesetz 6 sphärische Grenzflächen 10 Spiegel 6 Strahlengleichung 14 Strahlteiler 9 Strahltransfermatrix 19 Totalreflexion 8 und Wellenoptik 35, 36 Strahlformer 9 Strahlkombination 508 Strahlkombinierer 9 Strahltaille 57 Strahlteiler 9, 43 Pellicle- 190 polarisierender 178 Strahltransfermatrix 19 Ausbreitung im Vakuum 20 Brechung an ebener Grenzfläche 20 Brechung an sphärischer Grenzfläche 20 dicke Linse 22 dünne Linse 20 paraxiales System 22 Reflexion an ebenem Spiegel 20 Reflexion an Kugelspiegel 21 von komplexen Systemen 21 zusammengesetztes System 21 Strahlungsdichte 31 Strahlungsdruck 120, 383 Strahlungsfluss 603 Strahlverlauf Stabilitätsbedingung 25 Streakkamera 856, 857 Streifenwellenleiter 275 Streueffizienz 140 Streukoeffizient 142 Streumatrix 188 Beziehung zur Wellentransfermatrix 188 Streuquerschnitt 140 Streuung 451, 452 anti-Stokes- 451 Brillouin- 451, 452 elastische 138 induzierte Brillouin- 452, 475 induzierte Raman- 452, 510 kohärente anti-Stokes-Raman452 Mie- 141, 451 nichtlineare inelastische 760 Raman- 451
Rayleigh- 138–140, 451 Stokes- 451 Stufenfunktion 82 Stufenindexfaser 290–292, 294–298 Summenfrequenzerzeugung 767 Summenfrequenz-Fluoreszenz 450 Summenwandler 767 Super-Kamiokande 653 Superkontinuumslicht 848 Superlinse 231 Superlumineszenzdioden 617, 618 Vergleich mit Laserdioden 623, 625 Vergleich mit LED 623, 625 Supermode 281 Superposition 98 ebener Wellen 80 Superpositionsprinzip 30, 42, 759 Superprisma 882 Suszeptibilität 121, 761 Beiträge 136 dispersives Medium 126 eines inhomogenen Mediums 122 frequenzabhängige 124 resonantes Medium 135 Tensor der dielektrischen 123 symmetrisches System 190 Synchrotronstrahlung 516, 520 System abbildendes 20, 98–105 einlinsiges abbildendes 98, 101, 102 isoplanatisches 366 lineares siehe lineares System reziprokes 190 symmetrisches 190 verschiebungsinvariantes 366
T Taille 57 Taillenradius 60 Talboteffekt 97 Tandempumpen 508 Tarnumhang 222, 255 Taylorentwicklung 34 Telekonverter 13 Tensor 164 erster Stufe 164 nullter Stufe 164 zweiter Stufe 164 Terahertzpuls 840 Terbiumaluminiumgranat 174 Terbiumgalliumgranat 174, 180 Termsymbol 416
Theorem von Parseval 970 Theorem von Ramo 658 Theorie gekoppelter Wellen Akustooptik 711 Dreiwellenmischung 782 Frequenzverdopplung 785 gepulste Dreiwellenmischung 839 Vierwellenmischung 790 thermisches Licht 443–446 Spektrum des schwarzen Strahlers 444 Thermographie 446 thermoelektrischer Effekt 651 Thermoelement 651 Thermographie 446 Anwendungen 446 thermooptischer Effekt 895 Thermosäule 651 Tiefpassfilter 101 topologische Ladung 73 Totalreflexion 8, 9, 13, 162 Bragggitter 197 evaneszente Welle 160 Faser 289, 315 frustrierte 241 Grenzwinkel 8, 160 Totraum 676 Totzeit 677 Trägerwelle 34 Transceiver 877, 878 Transformationsoptik 253 Transition-Edge-Sensor 679 Translationssymmetrie 983 Transmissionsgrad 38 Transmissionskoeffizient 38 Transmissionsmatrix 187 Transmissionsverstärker 794 transversale elektromagnetische (TEM) Welle 126 Triplettzustand 416 Tscherenkowstrahlung 413, 654 Typ-II-Wellenmischung 769 Typ-I-Wellenmischung 769
U U3+:CaF2 -Laser 422 Laserübergang 422 Übergang Linienbreite 432 nichtstrahlender 436 spinerlaubter 448 spinverbotener 448 spontane Lebensdauer 433 Übergangskapazität 563
1047
1048
Stichwortverzeichnis
Übergangsmetalle Elektronenkonfigurationen 419 Energieniveaus 419 Termsymbole 419 Übergitter 426, 568, 579, 634 Quantenkaskadenlaser 634 Übersprechen 872 Übertragungsfunktion 80, 85, 977, 980 abbildendes System 101 dispersives Medium 126 einlinsiges abbildendes System 103 Vakuum 85, 86 Ultraviolett Frequenzen 29 Wellenlängen 29 Umkehrisolierung 872 Unbestimmtheit Feld-Quadraturkomponenten 397 Ort-Impuls 397 Zeit-Energie- 436 Undulator 520, 521 Undulatorparameter 521 unitäre Operatoren 982 unpolarisiertes Licht 372 Unschärfekreis 102 Unschärferelation für Quadraturkomponenten einer Mode 397, 398 Ort-Impuls- 386 Zeit-Energie- 386 Unterschalen 415 Auffüllung 416 spektroskopische Notation 415 Urbachausläufer 578
V Vakuumfluktuationen 379 Vakuumpermeabilität 118 Vakuumpermittivität 118 Vakuumzustand 398 Valenzband 425 Van-Cittert-Zernike-Theorem 368, 369 VanderLugt-Filter 109 Van-der-Waals-Kräfte 422, 424, 552 Varaktoren 564 Variationsprinzip 982 Vektorpotential 127 Vektorsoliton 898 Vektor-Strahlbündel 130 Vektorwelle 117
Verbindung, optische 869, 871–881 beugende 873 brechende 873 freier Raum 873 in der Mikroelektronik 876 nichtreziproke 872, 876 Wellenleiter 875 Verbindungskapazität 719, 720, 874 Verbindungskarte 874, 875 logarithmische 112 Verbindungsmatrix 871 verbotenes Band 205, 238 elektronisches 425 Verdetkonstante 174 Verdunstungskühlung 441 Verlustfaktor 872 Verlustkoeffizient, effektiver 487 verschiebungsinvariantes System 366 Verstärker Chirp- 815 Laser- 457–483 optischer Faser- 472, 473 phasensensitiver 792 verstärkte spontane Emission 472, 480, 481, 610, 617 Verteilungsverhältnis 872 Vertikalpassfilter 101 Verzögerungsplatte 157 𝜆∕2-Plättchen 157 𝜆∕4-Plättchen 157 Verzweiger 305 vibronische Zustände 420 Vielfachzugriff Codezuteilung 960 Frequenzzuteilung 959 Zeitzuteilung 959 Vielmodenfaser 289, 290, 313 Vielmodenlaser 926 Vielmodenwellenleiter 272 Vierniveausystem 464–467, 470 3+ Nd :Glas 471 Nd3+:Quarzglas 470 Viertelwellenretarder 157 kaskadierte 158 Viertelwellenschicht 191 Vierwellenmischung 760, 778, 789, 924 entartete 780, 781 V-Lambda-Kurve 603 Voigtprofil 438 Volumenhologramm 110, 111 Volumenholographie 110 Volumenplasmonpolariton 238
Vorverstärker 926 optischer 469
W Walk-Off-Effekt 839, 898 Wanderfeldresonator 325 Wandler inkohärent-kohärent 736 Wellenlänge 903 Wandlungsgewinn 956 Wasserstoff Energieniveaus 414, 415 Ionisierungsenergie 418 wechselseitige Intensität 356, 365 normierte 356 wechselseitige Kohärenzfunktion 355 Wechselwirkung nichtparametrische 760 parametrische 760, 767, 768 Weglänge, optische 4 weiche Gläser 316 Welle außerordentliche 167 Dipolwelle in nichtdispersiven Medien 126 Drehimpuls einer elektromagnetischen 120 ebene 32 ebene in nichtdispersiven Medien 126 elektromagnetische im Vakuum 118–121 elektromagnetische in Dielektrikum 121–130 elektromagnetische in dispersivem Medium 125 elektromagnetische in inhomogenem Medium 125 evaneszente 86, 104, 160, 227, 231, 270, 282 evaneszente in Wellenleiter 270 geführte 261–287, 293 gepulste ebene 51 Impuls einer elektromagnetischen 120 Impuls einer lokalisierten 383 Intensität einer elektromagnetischen 125 komplexe Amplitude 31 komplexe Darstellung 31, 49 komplexe Einhüllende 32 komplexe Wellenfunktion 31, 50 komplexes analytisches Signal 50
Stichwortverzeichnis
konjugierte 53, 107 Kugel- 33 Kugelwelle in nichtdispersiven Medien 126 Leistung einer elektromagnetischen 125 monochromatische 31–35, 124– 130 nichtbeugende 97 ordentliche 167 Parabol- 34, 58 paraxiale 34 partiell kohärente ebene 358 partiell kohärente Kugel- 358 polychromatische 50 quasimonochromatische 50 solitäre 843 stochastische 349 Superpositionsprinzip für monochromatische 42 Träger- 34 transversale elektromagnetische (TEM) 126 Vektor- 117 Zeitabhängigkeit der Intensität einer polychromatischen 52 Zylinder- 53 Wellenfläche siehe Wellenfront Wellenfront 32 Gaußstrahl 61 Kugelwelle 33 monochromatische Welle 32 paraxiale Welle 34 Wellenfunktion 30, 414 komplexe 31, 50 komplexe einer monochromatischen Welle 32 komplexe, einer gepulsten ebenen Welle 51 monochromatische Welle 32 paraxiale Welle 34 Wellengleichung 30, 31, 118 homogenes isotropes Medium 124 inhomogenes Medium 122 nichtlineare 762 verallgemeinerte paraxiale 837 Wellenlänge Beziehung zur Energie 380 ebene Welle 33 Infrarot 29 monochromatische Welle 33 Röntgenstrahlung 29 sichtbares Licht 29 ultraviolett 29
Wellenlängenbereichsschalter 870 Wellenlängenkanalwechsel 902 Wellenlängenmultiplexer 882 Wellenlängenmultiplexing 870, 931, 948, 949 Wellenlängenmultiplexnetz 961 Broadcast-and-Select 961 Multi-Hop 961 Wellenlängenrouting 962 Wellenlängenwandler 903, 904 Wellenleiter 186, 261 3-dB-Koppler 279 asymmetrisch ebener 273 Ausbreitungskonstante 263, 269 Bragggitter 282 Dämpfungskoeffizient 270 Dispersionsrelation 265, 271 ebene dielektrische 267–273 aus ebenen Spiegeln 262–267 Einkopplung 276 Einmoden- 265, 269 Einschlussfaktor 271 evaneszente Welle 270 Extinktionskoeffizient 270 Feldverteilung 264, 270 GaAs/AlGaAs 275 gekoppelte 277–279 Glas- 276 Goos-Hänchen-Effekt 273 Grenzfrequenz 269 Gruppengeschwindigkeit 265, 266, 271 Gruppengeschwindigkeitsdispersion 272 Kanal- 274 Kopplung 276–281 Kopplungslänge 279 Metall/Isolator/MetallSchichtstruktur 284 Metallschicht 285 Moden 262, 268 Modendispersion 272 numerische Apertur 269 periodische 281, 282 photonischer Kristall 282, 283 plasmonische 283–285 Polymer- 276 rechteckige Spiegel- 273 rechteckiger dielektrischer 274 Rippen- 511 Schalter 279 Schicht- 282 Selbstkonsistenzbedingung 268 Silicium-auf-Isolator 275
Theorie der gekoppelten Moden 278 Ti:LiNbO3 275 TM-Moden 266 Verstärker 617 Vielmoden- 272 Zahl der Moden 265, 269, 270 zweidimensionale 273 Wellenleiterarrays 281 Wellenleiterdispersion 816, 922 Faser 310, 313 Wellenleiter-Gitterrouter 884 Wellenleiteroptik 261–287 Wellenmischung Kohärenzlänge 772 Quasi-Phasenanpassung 773 Typ-I 769 Typ-II 769 Wellenoptik 3, 29–54, 117 Postulate 30, 31 und Strahlenoptik 35, 36 Wellentransfermatrix 187 Beziehung zur Streumatrix 188 periodisches Medium 203 Wellenvektor 32 ebene Welle 32 Wellenwiederherstellung 782 Wellenzahl 32 monochromatische Welle 33 Wendemontage siehe Flip-ChipTechnik Wiener-Khinchin-Theorem 353, 373 wiensches Gesetz 453 Wiggler 520, 521 Wigglerfeld 520 Wignerverteilung 862 Winkeldispersion 816 Koeffizient 817 Wirbel, optischer 73 Wirkungsquerschnitt 432, 433, 435, 436 spontane Emission 430 Wolfgleichungen 356 Wurtzitgitter 548
Y Yablonovit 216 Yb3+:YAG-Laser 420 Younginterferometer 362, 363, 385 youngsches Experiment 362, 384, 385 Yttriumeisengranat 174, 180
1049
1050
Stichwortverzeichnis
Z Zahlzustand 399 Zeemanaufspaltung 441 Zeemaneffekt 418 Zeiger 31 Zeigerdiagramm 47 Zeitbereichsschalter 870 Zeitfensterwechsler 904 zeitlich variierendes Spektrum 805 Zeitmultiplexing 905 Zeit-Raum-Mapping 821 Zeitvorgabe 938 Zinkblendestruktur 426, 548
Zirkulardichroismus 183 zirkulare Polarisation 151, 153 Zirkulator 180, 872, 873, 876 Zusatzrauschfaktor 682, 685, 686 Zustandsdichte optische Halbleiterverstärker 615 Quantenschichtstruktur 567 Volumenhalbleiter 567 zweiachsiger Kristall 165 Zweiphotonenabsorption 449, 450, 511 Zweiphotonenlicht 400 Erzeugung und Anwendung 401
Zweiphotonenmikroskopie 449 Zweiphotonenoptik 401, 402 Anwendung 403 Zweiwellenmischung 752, 767 Zwillingsstrahllicht 401 Zwischenfrequenz 953 Zwischenverstärker 469, 919, 926, 927 Zylinderlinse 12, 16, 84 Zylinderwelle 53 zylindrische Fokussierung 255
WILEY END USER LICENSE AGREEMENT Go to www.wiley.com/go/eula to access Wiley’s ebook EULA.