De l'Optique électromagnétique à l'Interférométrie: Concepts et illustrations 9782759810901

Ce livre, rédigé par des enseignants de Centrale Marseille, propose une approche unifiée des concepts qui fondent l'

180 4 14MB

French Pages 505 [494] Year 2013

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

De l'Optique électromagnétique à l'Interférométrie: Concepts et illustrations
 9782759810901

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

De l’Optique e´lectromagne´tique a` l’Interfe´rome´trie

De l’Optique e´lectromagne´tique a` l’Interfe´rome´trie Concepts et illustrations

Michel Lequime et Claude Amra

Ouvrage e´crit avec la participation de Carole Deumie´ Professeur et directrice de la formation a` Centrale Marseille

Illustration de couverture : a` gauche : composant multicouche conc¸u pour une exaltation optique ge´ante, visualisation des re´sonances en espace libre par couplage des modes et amplification de la diffusion ; au centre : front d’onde de´livre´ par un syste`me optique a` pupille circulaire pre´sentant une aberration sphe´rique du 3e ordre (mise au point re´alise´e au meilleur foyer) ; a` droite : interfe´rogramme du front d’onde pre´sente´ sur la figure centrale.

Imprime´ en France ISBN : 978-2-7598-1022-2 Tous droits de traduction, d’adaptation et de reproduction par tous proce´de´s, re´serve´s pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des aline´as 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement re´serve´es a` l’usage prive´ du copiste et non destine´es a` une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute repre´sentation inte´grale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (aline´a 1er de l’article 40). Cette repre´sentation ou reproduction, par quelque proce´de´ que ce soit, constituerait donc une contrefac¸on sanctionne´e par les articles 425 et suivants du code pe´nal. Ó EDP Sciences 2013

Quelques mots sur les auteurs

,

,

Michel Lequime est Professeur d Optique à l École Centrale Marseille et , , responsable de l équipe Couches Minces Optiques de l Institut Fresnel.

Michel LEQUIME est titulaire d’un diplôme d’Ingénieur de l’Institut d’Optique Graduate School (1974), d’un DEA de Physique atomique et moléculaire (1975) et d’un Doctorat de l’université Paris-Sud (Processus optiques du 3e ordre en régime picoseconde, 1977), ainsi que d’une Habilitation à Diriger des Recherches délivrée par l’université d’Aix-Marseille (Application de l’interférométrie en lumière blanche à la réalisation de capteurs à fibres optiques à usage industriel, 1996). Après avoir débuté sa carrière comme Attaché de recherche au CNRS (Laboratoire d’optique quantique de l’École Polytechnique), il a rejoint en 1979 la société de recherche sous contrat BERTIN & Cie, où il a participé à la création et au

iii

De l’Optique électromagnétique à l’Interférométrie

développement d’une activité centrée sur l’optique et l’optoélectronique. Les projets dans lesquels il s’est impliqué ont majoritairement concerné le domaine des capteurs à fibres optiques (centrale de mesure pour réseau de capteurs à codage de modulation spectrale, système dédié à la mesure de la pression et de la température en fond de puits de pétrole) et celui de l’optique spatiale (télescope de la caméra HMC équipant la sonde européenne Giotto, Balise à fibres optiques de l’expérience de télécommunications optiques intersatellites SILEX). En 1998, il a quitté BERTIN et participé à la création d’une start-up, Light Technologies, qui visait à développer les applications industrielles des diodes électroluminescentes de puissance qui commençaient alors à être commercialement disponibles (source bleue de polymérisation en bouche de composites dentaires, système de contrôle en ligne de la coloration de produits pétroliers). En 2000, il a été recruté par l’École Nationale Supérieure de Physique de Marseille (aujourd’hui devenue Centrale Marseille) comme Professeur en Optique et en Gestion de projet, et il a ensuite pris, en 2002, la responsabilité de l’équipe RCMO (Recherche en Couches Minces Optiques) de l’Institut Fresnel. Les travaux actuels de Michel LEQUIME portent principalement sur la modélisation des propriétés spectrales des cavités planaires multicouches, sur la réalisation de composants de filtrage à forte structuration spatiale, et sur le développement de montages permettant l’enregistrement des propriétés angulaires, spatiales, spectrales et polarimétriques de la lumière diffusée par des surfaces ou des milieux stratifiés. Il est auteur de plus de 40 publications dans des revues internationales à comité de lecture et de 140 communications dans des conférences nationales et internationales. Il a en outre occupé le poste de Président du Comité Stratégique du pôle OPTITEC de 2006 à 2008 et celui de Secrétaire de la Société Française d’Optique de 2009 à 2013.

Claude Amra est Directeur de Recherche au CNRS et responsable , , de l équipe CONCEPT de l Institut Fresnel.

Claude AMRA intègre le CNRS en 1986 après une thèse portant sur la diffusion de la lumière par les surfaces des filtres interférentiels multicouches (Laboratoire d’Optique des Surfaces et des Couches Minces, ESA CNRS, École Nationale Supérieure de Physique de Marseille). Ses travaux l’amènent à étendre la modélisation électromagnétique au cas des volumes hétérogènes puis aux microcavités luminescentes,

iv

Quelques mots sur les auteurs

pour l’optique en espace libre et pour l’optique modale. Parallèlement il se forme à la métrologie optique et adresse les problèmes inverses inhérents à la caractérisation des milieux désordonnés, avant de s’impliquer dans la technologie des couches minces optiques. Après une Habilitation à Diriger des Recherches soutenue en 1991 à l’université d’Aix-Marseille, il initie ou contribue activement à l’introduction de nouveaux thèmes au LOSCM : endommagement laser et thermique photo-induite, microscopie à force atomique et rugosité multi-échelle, lumière piégée, microcavités, ellipsométrie de speckle, absorbeurs de lumière achromatiques en couches minces, éclateurs spectraux pour le moyen infra-rouge, multiplexage dense en longueur d’onde, technologies de dépôt par pulvérisation de faisceau d’ions… En 1996, Claude AMRA se voit confier la direction du Laboratoire d’Optique des Surfaces et des Couches Minces, qu’il reconstruit thématiquement. En 2000, il est co-créateur de l’Institut Fresnel, une nouvelle unité mixte de recherche (CNRS, AixMarseille université, Centrale Marseille) qui rassemble sur le campus de MarseilleNord l’ensemble des Sciences et technologies de l’optique, l’électromagnétisme et l’image. Au cours de ses 2 mandats de direction (2000-2008), l’Institut Fresnel émergera et s’ancrera sur la scène européenne, avec un bâtiment dédié. En 2009, il est nommé Directeur adjoint scientifique de l’Institut des Sciences de l’Ingénierie et des Systèmes du CNRS, en appui sur la section 8 du Comité National de la Recherche Scientifique (microélectronique, photonique, électromagnétisme, antennes, énergie électrique et nanotechnologies…). Auparavant il aura présidé ou participé à de nombreux comités auprès de l’ANR, l’AERES, le MESR, le CoNRS, le CNU, la région PACA et les pôles de compétitivité…, en parallèle de l’élaboration de nombreux congrès sur la scène internationale. Les activités de recherche de Claude AMRA concernent aujourd’hui, dans le cadre de l’équipe CONCEPT qu’il anime à l’Institut Fresnel, l’imagerie en milieu complexe, la polarisation et la cohérence en milieu désordonné, le confinement et l’exaltation optique géante, l’analogie optique/thermique, le couplage optique électromagnétique/optique statistique…

v

Table des matie`res

Prologue .....................................................................................................

1

Partie 1 Optique e´lectromagne´tique ...............................................

7

Chapitre 1 d Concepts de base en optique e´lectromagne´tique ......................

9

Chapitre conçu par Claude Amra re´dige´ par Michel Lequime et Claude Amra

Chapitre 2 d Re´gime harmonique .................................................................

29

Chapitre conçu par Claude Amra re´dige´ par Michel Lequime et Claude Amra

Chapitre 3 d Paquet d’ondes fre´quentiel .......................................................

51

Chapitre conçu par Claude Amra et Michel Lequime re´dige´ par Michel Lequime et Claude Amra

Chapitre 4 d Paquet d’ondes spatial ..............................................................

71

Chapitre conçu par Claude Amra et Michel Lequime re´dige´ par Michel Lequime et Claude Amra

vii

Optique e´lectromagne´tique et Interfe´rome´trie

Chapitre 5 d Composants planaires...............................................................

87

Chapitre conçu par Claude Amra re´dige´ par Claude Amra et Michel Lequime

Chapitre 6 d E´nergie, causalite´ et coherence ................................................. 123 Chapitre conçu par Claude Amra et Michel Lequime re´dige´ par Claude Amra et Michel Lequime

Chapitre 7 d Approche microscopique .......................................................... 143 Chapitre conçu par Carole Deumie´ re´dige´ par Michel Lequime et Carole Deumie´

Chapitre 8 d Propagation en milieu anisotrope............................................. 153 Chapitre conçu par Michel Lequime et Carole Deumie´ re´dige´ par et Michel Lequime

Chapitre 9 d Polarisation de la lumie`re ......................................................... 163 Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Partie 2 Formation des images ......................................................... 187 Chapitre 10

d

Approximation de Fresnel...................................................... 189

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime et Claude Amra

Chapitre 11

d

Re´ponse percussionnelle d’un syste`me optique ..................... 205

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 12

d

Formation des images............................................................ 223

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 13

d

Influence des aberrations ....................................................... 243

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 14

d

Optique adaptative ................................................................ 263

Chapitre conçu par Carole Deumie´ et Michel Lequime re´dige´ par Michel Lequime

viii

Table des matie`res

Partie 3 Interfe´rome´trie ....................................................................... 275 Chapitre 15

d

Photo-de´tection et bruit ........................................................ 277

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 16

d

Interfe´rome´trie et mesure de phase ....................................... 301

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 17

d

Interfe´rome`tres a` 2 ondes...................................................... 337

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 18

d

Interfe´rome`tres a` ondes multiples ......................................... 369

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 19

d

Interfe´rome´trie en lumie`re blanche ....................................... 383

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 20

d

Gyroscope a` fibre optique ..................................................... 415

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Chapitre 21

d

E´pilogue ................................................................................ 441

Chapitre conçu par Michel Lequime re´dige´ par Michel Lequime

Partie 4 Annexe ...................................................................................... 453 Annexe A

d

Outils mathe´matiques ............................................................ 455

Annexe conçue par Michel Lequime re´dige´e par Michel Lequime et Claude Amra

483 Index.............................................................................................................. 485 Bibliographie .................................................................................................

ix

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Prologue La rédaction de ce livre trouve son origine dans une réforme du cursus de l’École Centrale Marseille, qui, en 2009, a conduit à regrouper Électromagnétisme et Optique dans une seule et même unité d’enseignement du tronc commun de première année. Cette fusion thématique nous a en effet posé deux questions majeures auxquelles nous avons alors cherché à apporter des réponses qui soient à la fois cohérentes et ambitieuses : • la première était relative à l’identification d’une démarche qui assurerait une transition aussi fluide que possible entre le formalisme de l’optique électromagnétique et celui de la formation des images. Cet élément de passage, à savoir la notion de paquet d’ondes spatial, a mis quelques mois à émerger avec clarté, mais une fois en place, elle a aussitôt induit la structuration recherchée et notamment permis de traiter la propagation en espace libre comme un filtrage dans l’espace des fréquences spatiales, et de mettre en évidence les similitudes d’approche qui existent entre composantes spatiales et fréquentielles du champ électromagnétique. Elle a aussi conduit à donner une place particulière à la transformation de Fourier, celle-ci apparaissant, à juste titre, comme l’outil mathématique qui fonde toute cette démarche ; • la seconde a concerné le choix du contenu, car l’insertion dans un volume horaire spécifié (celui d’une unité d’enseignement de tronc commun) impose évidemment des choix, et donc des renoncements. C’est là que le souci d’une certaine

1

De l’Optique électromagnétique à l’Interférométrie

ambition nous a guidés, en décorrélant dans cette stratégie de choix la nature des coupes et la complexité des notions. Le résultat pourra être jugé difficile d’approche par certains, mais il nous semble en adéquation avec la formation de base d’un ingénieur à profil généraliste, pour lequel la présentation des concepts et l’illustration de leur usage sont plus importantes que la description détaillée des applications qui en découlent. Il nous restait encore à définir comment obtenir, pour ce cours autant que pour l’ouvrage auquel nous souhaitions qu’il donne naissance, une unité d’écriture et de notations : ceci semblait délicat à atteindre puisque les intervenants étaient multiples et de formations initiales différentes. La solution que nous avons adoptée est somme toute assez simple : elle a consisté à ce que l’un d’entre nous (en l’occurrence, Michel Lequime) assiste, à l’instar d’un élève-ingénieur, aux cours dispensés par les deux autres enseignants et rédige, à partir de ses notes, une première version d’un texte qui, après relecture, correction, ajout et réorganisation, a servi de base à treize des quinze premiers chapitres de cet ouvrage, ainsi qu’à l’annexe consacrée aux outils mathématiques. Une fois la structure de ce cours de tronc commun en place et, dans une certaine mesure, validée par le retour des élèves et par la perception pratique de sa cohérence qui a résulté de sa répétition magistrale, nous avons décidé d’aborder, avec le même crible de choix, la structuration finale de l’unité d’enseignement qui en est le prolongement dans le parcours de troisième année consacré à l’Optique et à la Photonique. Ce dernier cours, initialement dénommé SIGNAUX OPTIQUES et dispensé par Michel Lequime, avait à l’origine pour objectifs de montrer comment il était possible de mesurer, puis d’utiliser les différentes grandeurs caractéristiques d’une onde optique que sont son amplitude, sa longueur d’onde, sa phase ou son état de polarisation. Un accent particulier a rapidement été mis sur ces deux dernières notions, compte tenu de leur importance conceptuelle et des nombreuses applications auxquelles elles donnent accès. Plus de trois années ont été nécessaires pour parvenir à la version de cet ouvrage que nous avons la faiblesse de considérer comme consistante et dans le droit fil de nos objectifs initiaux. Rédiger un tel ouvrage aura été également riche d’enseignements, à la fois sur notre capacité, en tant que professeurs, à nous atteler à une tâche collective de définition du contenu d’un cours et de rédaction des supports qui lui sont associés, mais aussi en tant que chercheurs, tant il est vrai que le souci d’identifier un mode de présentation d’un concept le plus limpide possible aide à en percevoir les fondements, la structure et les implications. La table des matières de cet ouvrage est restreinte à l’énoncé des seuls titres des chapitres qui le composent, de manière à ce que le lecteur en perçoive très rapidement la structure globale et puisse aussitôt basculer dans la lecture d’un chapitre particulier qu’il aura sélectionné en fonction de ses centres d’intérêt. Chaque chapitre débute à l’inverse par un sommaire qui permet d’appréhender dans le détail le périmètre scientifique qui est le sien.

2

Prologue

Ce livre débute (chapitre 1) par une présentation détaillée des notions de base en OPTIQUE ÉLECTROMAGNÉTIQUE et montre comment il est possible de retrouver, à partir des équations de Maxwell indépendantes du temps, l’ensemble des lois physiques qui régissent l’électrostatique et la magnétostatique, d’abord dans le vide, puis en présence de matière. Ceci permet d’introduire de manière consistante l’électromagnétisme en prenant en compte l’inertie de cette matière, c’est-à-dire le temps qu’elle met à percevoir les variations temporelles des sources. Le chapitre 2 est certainement l’un des plus importants de ce livre, d’abord parce qu’il illustre, pour la première fois dans le corps de cet ouvrage, l’impact de l’emploi de la transformation de Fourier sur la résolution du système d’équations différentielles couplées que constituent les équations de Maxwell, mais aussi parce qu’il explicite le fonctionnement pratique de la séquence duale de décomposition spectrale et de reconstruction, ici temporelle, d’un champ vectoriel. C’est également dans ce chapitre que se trouvent définis nombre des concepts qui seront ensuite utilisés tout au long de ce livre, et que nous décrivons en outre l’apport de la notion de distribution à la formulation de ces mêmes équations de Maxwell. Le chapitre 3 établit tout d’abord les conséquences pratiques du lien existant entre dépendances temporelle et fréquentielle d’un même champ et, notamment, l’existence d’une limite basse au produit largeur de raie × durée d’impulsion que l’on identifie souvent, de manière quelque peu abusive, avec les relations d’incertitude d’Heisenberg. Puis il introduit, en toute généralité, le concept de vitesse de groupe, avant d’illustrer de façon pratique les conséquences de la dispersion spectrale des propriétés d’un milieu matériel sur le profil temporel d’une impulsion qui s’y propage. Une fois défini ce premier cadre fréquentiel, il nous était alors possible de transposer cette approche spectrale à la résolution du problème posé par la dépendance spatiale des équations de Maxwell. C’est dans le chapitre 4 que vont apparaître les notions de pulsations spatiales et de paquet d’ondes spatial, puis celles de composantes propagatives et de composantes évanescentes du champ. Et c’est là aussi que le mécanisme de conjugaison au sens de Fourier va faire apparaître la limite intrinsèque qu’impose à la résolution optique le filtrage de ces ondes évanescentes. Enfin, le calcul, en configuration 3D, du flux transporté par un paquet d’ondes planes nous donnera les bases théoriques nécessaires à une définition raisonnée de grandeurs photométriques aussi fondamentales que l’éclairement ou l’intensité. Le chapitre 5 illustre l’apport de cette approche par paquet d’ondes spatial à l’étude des propriétés optiques de composants planaires tels que les filtres optiques interférentiels et les réseaux de diffraction. Il permet d’introduire à cette occasion la notion centrale d’indice effectif, puis celle d’admittance complexe, qui la généralise au cas des ondes stationnaires. Il permet également de montrer la puissance de ce formalisme vis-à-vis de l’analyse des phénomènes de réflexion totale, puis de propagation guidée. Notre présentation de l’Optique électromagnétique n’aurait pas été complète si nous avions passé sous silence des notions aussi importantes que celles de bilan d’énergie en régime spatio-temporel ou encore de causalité, dont la prise en compte conduit aux

3

De l’Optique électromagnétique à l’Interférométrie

fort justement célèbres relations de Kramers-Kronig. C’est donc l’objet du chapitre 6 que de proposer une description détaillée de ces différentes notions, même s’il a aussi pour vocation d’aborder la notion de signal analytique ou encore de cohérence et de montrer dans ce dernier cas comment le caractère quadratique et intégrateur de la détection optique a des conséquences fondamentales sur l’existence ou la visibilité des phénomènes d’interférences entre deux champs électromagnétiques. Ces 6 premiers chapitres s’inscrivaient à l’évidence dans une approche macroscopique des phénomènes. À l’inverse, le chapitre 7 montre comment il est possible de retrouver la relation entre polarisation de la matière et champ appliqué à partir d’une description microscopique de ces mêmes sujets. Les conséquences pratiques d’une telle approche sont en particulier illustrées dans le cas des matériaux diélectriques, pour lesquels la polarisabilité est majoritairement d’origine électronique. Même si l’état de polarisation de l’onde lumineuse a un impact important sur les propriétés optiques des milieux stratifiés, il n’influence que fort peu la démarche qui fonde leur étude : ce n’est évidemment plus le cas lorsque l’on s’intéresse aux milieux anisotropes, qui constituent l’objet du chapitre 8 et où seront introduites les notions clés d’état propre de propagation du champ, d’ellipsoïde des indices et de lames bi réfringentes (la césure anormale étant introduite ici pour rappeler l’étymologie d’un mot que la fréquence de son usage a tendance à obscurcir). Le dernier chapitre de cette première partie consacrée à l’OPTIQUE ÉLECTROMA(chapitre 9) traite des états de polarisation d’une onde lumineuse, des différentes représentations (Jones, Stokes, Poincaré) qui permettent d’en décrire la nature et des moyens que l’on peut mobiliser pour en assurer une manipulation contrôlée. Il montre ensuite comment se transpose, dans le cas de ce champ vectoriel particulier, le concept de cohérence introduit au chapitre 6 et aborde enfin la notion centrale de degré de polarisation. GNÉTIQUE

Le chapitre 10 ouvre la partie de cet ouvrage qui traite de la FORMATION DES IMAGES. Il est consacré à une présentation de l’approximation de Fresnel, dont on montre qu’elle est l’expression du paquet d’ondes spatial restreint aux composantes propagatives du champ dont la fréquence spatiale reste inférieure à une certaine borne. Cette approche permet d’introduire de manière extrêmement naturelle les notions de fonction de transfert et de propagateur au sens de Fresnel, dont une illustration de l’usage est ensuite donnée au travers de l’explication des deux phénomènes a priori assez intrigants que sont le point brillant de Poisson et l’effet Talbot. Jusqu’ici, les phénomènes de propagation que nous avions traités se produisaient dans des milieux homogènes séparés par des interfaces planes. Le chapitre 11 s’inscrit, dans une certaine mesure, en rupture avec cette approche puisqu’il utilise le cas de la lentille mince pour définir la fonction de transmission de la lentille parfaite, puis sa réponse percussionnelle pour différentes formes de pupille. C’est là qu’apparaît pour la première fois le concept de plan d’observation qui généralise celui, très restrictif, de plan image. Cette analyse se prolonge par le concept de filtrage de Fourier et de montage 4f dont on montre l’analogie formelle qu’il présente avec celui de télécentrisme.

4

Prologue

Les deux chapitres qui font suite traitent en fait du même sujet, à savoir la formation des images. Le chapitre 12 l’aborde dans le cas d’un système parfait et les simplifications que cette hypothèse autorise rendent, à notre sens, plus claire la présentation des conséquences d’une notion, la cohérence de l’éclairage, qui reste malgré tout suffisamment complexe pour que l’on se soit ici limité aux deux situations extrêmes correspondant au cas cohérent et au cas incohérent. Nous montrons ensuite au chapitre 13 l’influence des aberrations sur les notions de réponse percussionnelle et de fonction de transfert d’un système optique, en débutant cette présentation par le cas d’une aberration extrinsèque, à savoir le défaut de mise au point. Ceci nous conduit tout naturellement à définir de manière générale l’écart aberrant, à justifier l’emploi du critère de Maréchal et, enfin, à présenter la base particulière de calcul de la variance de cet écart aberrant que constituent, dans le cas d’un instrument à pupille circulaire, les polynômes de Zernike. Le chapitre 14 constitue un prolongement tout naturel du précédent, puisqu’il est consacré à l’optique adaptative et donc, aux corrections des aberrations dynamiques que génère la turbulence atmosphérique. Ce chapitre accorde une attention toute particulière au Shack-Hartmann, non seulement parce que la modélisation de ce système constitue une très bonne illustration de l’utilisation de l’approximation de Fresnel, mais aussi parce que cet exemple montre que la mesure d’une information de phase n’est pas forcément l’apanage d’un procédé interférométrique. Le chapitre 15 fonctionne comme un pivot entre la partie traitant de la FORMATION DES IMAGES et celle consacrée à l’INTERFÉROMÉTRIE. En effet, il détaille les conséquences pratiques de la quantification de l’énergie lumineuse sur le mécanisme de détection et montre comment ce contributeur quantique vient s’ajouter à celui qui résulte de l’agitation thermique des électrons dans une résistance. Les notions de bruit, et donc de rapport signal à bruit qui en résulte, constituent en effet des guides objectifs du dimensionnement d’un système optique qui viennent compléter celui, d’une autre nature, que nous avait fourni la connaissance de sa qualité image. Le premier chapitre consacré à la partie purement interférométrique de cet ouvrage est le chapitre 16. Comme son titre l’indique (Interférométrie et mesure de phase), il traite à la fois de concepts très généraux associés à la détection interférométrique (essentiellement les conséquences du principe de conservation de l’énergie et la notion de gain cohérent ) et de la mise en œuvre pratique de méthodes modernes de mesure de phase. Rappelons ici que le développement de ces méthodes résulte d’une interaction tout à fait positive entre optique fondamentale et techniques radar que le domaine des capteurs à fibre optique a portée à son apogée à la fin des années 1980. Dans le chapitre 17, nous décrivons, parfois en détail (interféromètre stellaire de Michelson, interféromètre à référence ponctuelle ), le fonctionnement et les propriétés d’une dizaine d’interféromètres à 2 ondes, en nous appuyant d’une part sur l’ensemble des notions générales introduites au chapitre précédent, mais aussi sur la modélisation fine des phénomènes de propagation que permet la mise en œuvre de l’approximation de Fresnel.

5

De l’Optique électromagnétique à l’Interférométrie

Le chapitre 18 constitue un prolongement naturel du précédent, dont il généralise l’approche et les concepts au cas du plus emblématique des interféromètres à ondes multiples, à savoir le Fabry-Perot. Cette présentation offre l’occasion de comparer de manière très instructive les approches harmonique et temporelle d’un même phénomène et propose une formulation alternative de la fonction d’Airy qui est d’un usage particulièrement pratique lorsque l’on utilise un tel dispositif en interférométrie de corrélation. Dans le chapitre 19, nous posons les bases théoriques de l’interférométrie en lumière blanche, qui a rendu possible le développement de techniques majeures comme la tomographie optique de cohérence (OCT, optical coherence tomography) ou la remise au goût du jour d’une notion aussi classique que celle des franges de superposition. Une attention particulière est apportée dans ce chapitre à la notion de visibilité de ces phénomènes d’interférence et à l’approche duale qu’il convient d’utiliser, dans ce cas polychromatique, en associant constamment variation d’éclairement et modulation de spectre. Et pour finir (chapitre 20), et illustrer comment un développement industriel bien mené peut venir à bout d’obstacles tout autant conceptuels que pratiques, nous avons choisi comme thème applicatif final un problème réellement extrême, à savoir le gyroscope à fibre optique. En effet, dans ce cas, aucun des critères de faisabilité théorique ne semblait devoir être a priori rempli, que ce soit en termes de sensibilité, de linéarité ou de résistance aux biais et aux sources de bruit, et le succès de cette entreprise est en grande partie due à la mise en œuvre conjointe d’une technique particulièrement innovante de mesure de phase (la rampe de phase numérique ) et de l’interférométrie en lumière blanche. Après une conclusion en forme d’Épilogue, qui met notamment en perspective le concept si troublant d’interférométrie d’intensité (effet Hanbury Brown & Twiss), le corps de cet ouvrage est complété par une Annexe consacrée à une présentation synthétique des principaux outils mathématiques utilisés tout au long des chapitres qui le constituent et par une liste de références bibliographiques restreintes à des seuls titres de livres. Il est également doté d’un index assez détaillé, afin que le lecteur puisse en faire une utilisation extrêmement ciblée sur telle ou telle question en relation avec son objet. Pour revenir au point de départ de toute cette démarche, à savoir la création d’un cours de tronc commun de première année de l’École centrale Marseille associant Électromagnétisme et Optique, notons que les chapitres en lien direct avec ce cours portent les numéros 1 à 5, 7 et 8, puis 10 à 15. Ceux traitant des notions abordées dans le module Signaux optiques de troisième année correspondent aux numéros 9, puis 16 à 20, le chapitre 6 ayant été introduit au cours de la rédaction finale pour assurer la cohérence de l’ensemble ainsi constitué. Michel Lequime et Claude Amra Marseille, 30 avril 2013

6

Concepts de base en optique électromagnétique Chapitre conçu par Claude Amra rédigé par Michel Lequime et Claude Amra

Sommaire 1.1 1.2

1.3

1.4

1.5 1.6

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Sources et champs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Sources de lumière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Champs produits par ces sources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Électrostatique du vide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Notion de potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Résolution par la fonction de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.3 Charges singulières et discontinuités du champ . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.4 Potentiel créé par un dipôle électrostatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . Électrostatique dans la matière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Création de dipôles induits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Approximation dipolaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Charges fictives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.4 Discontinuités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Optique linéaire en milieu isotrope . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Magnétostatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10 11 11 11 12 12 13 15 16 18 18 19 19 21 22 23

9

De l’Optique électromagnétique à l’Interférométrie

1.7

1.6.1 Magnétostatique du vide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Magnétostatique dans la matière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Électromagnétisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.1 Inertie de la matière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.2 Équations de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.3 Introduction aux relations de causalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23 24 25 26 27 28

1.1 Introduction L’optique électromagnétique devient incontournable dès lors que les dimensions des objets sont du même ordre de grandeur que la longueur d’onde de la source qui les éclaire. On comprend ainsi, eu égard au rapide et récent développement des microet des nano-technologies, l’essor de la photonique moderne, en appui sur des nanocomposants et des micro-systèmes. Ces progrès considérables ont permis de revisiter ou d’étendre une multitude de concepts au cours de la dernière décennie, parmi lesquels on citera les cristaux photoniques, les fibres micro-structurées, la lentille plate et les indices négatifs, les optiques diffractives, les micro-cavités luminescentes, les méta-matériaux et les capes d’invisibilité, la super-résolution et plus généralement l’imagerie en milieu diffusant et les nouvelles microscopies, la plasmonique et les nano-antennes… Tous ces concepts s’appuient sur le formalisme de l’optique électromagnétique, tout comme, de façon plus classique, les phénomènes de réflexion, de transmission, d’absorption, de diffraction, de diffusion, de filtrage interférentiel, de génération de fréquences ou de biréfringence. Par ailleurs, le mariage des technologies nouvelles et de la puissance des calculateurs autorise désormais la synthèse de composants 1D, 2D ou 3D capables de confiner l’énergie électromagnétique dans des volumes de l’ordre d’une fraction de la longueur d’onde, ou bien d’exalter localement le champ optique de façon drastique, afin d’augmenter l’interaction lumière matière… Face à cette multitude de concepts et d’applications, il nous a paru important de nous attarder sur les concepts de base de l’optique électromagnétique. Toute théorie physique s’appuie en effet sur des hypothèses qu’il est important de s’approprier, avant même de maîtriser le formalisme mathématique qui en découle ou les prolonge. Cette appropriation est par ailleurs très souvent à la source de l’innovation ou de la remise en cause. Enfin, la maîtrise des fondamentaux facilite grandement la compréhension d’une discipline, à condition de tirer profit des analogies. Ainsi ce premier chapitre met-il l’accent sur les hypothèses mises en jeu dans le cadre du formalisme macroscopique de l’optique électromagnétique (classique). Comme souvent, c’est l’expérience qui induit les hypothèses et valide les approximations ; ce chapitre ne prétend donc pas à une description exacte des phénomènes, mais les auteurs ont tenté d’y faire preuve d’objectivité.

10

1. Concepts de base en optique électromagnétique

1.2 Sources et champs 1.2.1 Sources de lumière L’existence d’une onde lumineuse suppose implicitement qu’il y ait, en un endroit quelconque de l’espace, une source de lumière. Cette source peut être de nature primaire (ou directe ), telle que, par exemple, le soleil, ou de nature secondaire (ou indirecte ), comme la diffusion de cette même lumière solaire par l’atmosphère terrestre. Dans tous ces cas, l’émission de lumière est directement liée, pour chacun des atomes constitutifs de la source primaire, à la transition radiative d’un électron d’un niveau excité vers un niveau de moindre excitation, tel que par exemple le niveau fondamental. Une telle approche, qui met en jeu une description des phénomènes au niveau atomique, sera dite microscopique, par opposition à une approche dans laquelle on ne s’intéressera qu’à des comportements d’ensemble, et que l’on qualifiera alors de macroscopique. L’optique électromagnétique appartient à cette seconde catégorie d’approche. On appellera désormais ρ le triplet d’espace (x, y, z ), r le doublet de coordonnées (x, y) et t le temps. Les sources de lumière seront ici décrites par des densités de charge scalaires q( ρ , t ) et par des densités de courant vectorielles J ( ρ , t ), toutes deux dépendant de l’espace et du temps.

1.2.2 Champs produits par ces sources Si, à l’intérieur d’un domaine  de l’espace, de frontière S , se trouve présente une pluralité de charges et de courants décrite par les densités spatio-temporelles q( ρ, t ) et J ( ρ , t ), alors ce domaine  est la source d’une émission de lumière, décrite par 4 champs vectoriels définis dans R3 , à savoir : – – – –

un champ électrique E ( ρ, t ) ;  un champ magnétique B( ρ, t ) ;  ρ , t ), également appelée déplacement électrique ; une induction électrique D(  ( et enfin une induction magnétique H ρ , t ), parfois désignée par les termes de déplacement magnétique ou d’excitation magnétique.

Ces 4 champs vectoriels correspondent donc à 12 inconnues et sont reliés entre eux par les équations de Maxwell qui s’écrivent : ⎧ ⎪ →E = − ∂ B ⎪− rot ⎪ ⎪ ⎪ ∂t ⎪ ⎨  ∂D − →  = J + (1.1) rotH ⎪ ∂t ⎪ ⎪ ⎪  =q divD ⎪ ⎪ ⎩  divB = 0

11

De l’Optique électromagnétique à l’Interférométrie

Ces équations de Maxwell mettent en jeu 8 relations (2 relations vectorielles et 2 relations scalaires) entre 12 inconnues. Le système est donc a priori sous-déterminé, mais nous verrons plus loin ce qu’il y a lieu de penser du caractère incomplet de cette détermination. On peut d’ores et déjà remarquer que courant J et charge q ne sont pas indépendants, puisque l’on peut écrire :    ∂q ∂ D →H  ) = 0 = div J + ⇒ divJ + div(− rot =0 (1.2) ∂t ∂t Cette dernière équation exprime tout simplement la conservation de la charge. Si l’on intègre cette relation sur un volume , on obtient :

 ∂q  divJ + dv = 0 (1.3) ∂t  soit encore, en utilisant le théorème de Green-Ostrogradsky :  ∂Q J · n dS + =0 ∂t S

(1.4)

où S désigne la surface délimitant le volume  et Q la valeur totale de la charge électrique qui s’y trouve à l’instant t . Ainsi la charge qui s’échappe du domaine  est égale au flux du vecteur courant à travers la surface S .

1.3 Électrostatique du vide Dans ce paragraphe, on se propose de montrer comment on peut revisiter les lois de l’électrostatique à partir des équations de Maxwell.

1.3.1 Notion de potentiel Dans le cas de l’électrostatique, charges et courants ne présentent pas de dépendance temporelle. Il en est de même des champs vectoriels, de sorte que les équations de Maxwell prennent la forme simplifiée suivante : ⎧− →E = 0 rot ⎪ ⎪ ⎪ ⎪ →H ⎨−  = J ( rot ρ) (1.5) ⎪  = q( div D ρ ) ⎪ ⎪ ⎪ ⎩  divB = 0

12

1. Concepts de base en optique électromagnétique

où la conservation de la charge impose en outre que : divJ = 0. On notera par  sont maintenant découplés, ce qui permet de traiter ailleurs que les champs E et H indépendamment le cas électrostatique du cas magnétostatique. Puisque le rotationnel du champ électrique est identiquement nul, cela signifie que ce champ E dérive d’un potentiel scalaire de sorte que l’on pourra toujours écrire : − →E = 0 rot



−−→ ∃V , tel que E = −grad V

(1.6)

La grandeur scalaire V est appelée potentiel électrostatique . L’emploi du signe − est arbitraire et a une origine historique liée à la convention adoptée pour le sens du courant vis-à-vis de la valeur algébrique de la différence de potentiel. On notera aussi que cette définition ne présente aucun caractère d’unicité, puisque la valeur du potentiel y est déterminée à une constante additive près. Par ailleurs, dans le cas correspondant à l’électrostatique du vide, l’induction élec est proportionnelle au champ électrique E , ce coefficient de proportionnatrique D lité étant appelé permittivité électrique du vide et noté 0 , soit :  = 0 E D

(1.7)

En conséquence, la troisième équation de Maxwell permet d’écrire ici : −−→  = q = 0 divE = −0 div(grad V ) = −0 V divD

(1.8)

ce qui conduit à l’équation de Poisson, c’est-à-dire à : V +

q =0 0

(1.9)

Si l’on utilise des méthodes classiques, la recherche de la solution générale de cette équation différentielle est assez longue et difficile. C’est la raison pour laquelle il est souhaitable de faire ici appel aux distributions et à la fonction de Green.

1.3.2 Résolution par la fonction de Green On considère donc l’équation différentielle : V ( ρ) = −

q( ρ) 0

(1.10)

et on appelle G ( ρ ) la fonction de Green solution de l’équation différentielle associée, dans laquelle le second membre a été remplacé par une impulsion de Dirac, soit : G ( ρ ) = δ( ρ)

(1.11)

13

De l’Optique électromagnétique à l’Interférométrie

La solution de cette nouvelle équation différentielle est classique et donnée par (cf. paragraphe A.7.2) : G ( ρ) = −

1 1 =− 4π| ρ| 4πρ

(1.12)

On montre alors qu’une solution particulière de l’équation différentielle initiale (1.10) peut être mise sous la forme d’un produit de convolution entre son second membre et cette fonction de Green, soit : q ( ρ) (1.13) V ( ρ) = − G ρ 0 En effet, en utilisant les règles de dérivation d’un produit de convolution, il vient : q q q q V = − G = −G = −δ =− (1.14) 0 0 0 0 où l’on a implicitement utilisé le fait que l’impulsion de Dirac constitue l’élément neutre du produit de convolution. En conclusion, la forme analytique du potentiel V ( ρ ) est donnée par la relation intégrale suivante :  1 1 q q(ρ ) d ρ ( ρ) = V ( ρ) = 4π| ρ | 0 4π0  | ρ − ρ |

(1.15)

où d ρ désigne l’élément de volume dx  dy  dz  , où ρ parcourt le domaine  où se trouvent les charges et où S désigne la surface fermée limitant ce domaine, comme représenté à la figure 1.1. On notera ici que la fonction V ( ρ ) permet également de définir, par prolongement, un potentiel électrostatique à l’intérieur du domaine chargé . En effet, l’intégrale

Figure 1.1 Électrostatique dans le vide.

14

1. Concepts de base en optique électromagnétique

volumique figurant dans la relation (1.15) est partout définie, même lorsque le dénominateur s’annule (il suffit pour s’en convaincre de passer en coordonnées sphériques après avoir fait un développement limité en ρ de la charge q). On montre de plus qu’à la traversée de la surface S entourant ces charges volumiques, la grandeur V reste continue et dérivable, avec une dérivée continue. Il en résulte que le champ électrique E est lui aussi continu à la traversée de cette surface S, ce que l’on écrira : σ [E ] = 0 (1.16) où la quantité σ [E ] désigne le saut, c’est-à-dire la discontinuité, du champ entre extérieur et intérieur, soit : σ [E ] = Eextérieur  − Eintérieur 

(1.17)

Toutefois, il est important de retenir que ce résultat n’est plus vrai si les charges sont surfaciques ou ponctuelles (au contraire de volumiques), c’est-à-dire singulières au sens des distributions. Nous allons prendre en compte ces cas particuliers au paragraphe suivant.

1.3.3 Charges singulières et discontinuités du champ 1.3.3.1 Charges surfaciques Nous aurons besoin, dans certaines situations particulières (charges induites, charges fictives, matériaux métalliques...), de considérer le cas de charges localisées sur une surface S. Cette répartition particulière de charges sera décrite en introduisant la distribution de Dirac notée δS ( ρ ), dont l’argument s’annule pour tous les points ρS appartenant à la surface S. On écrira donc : ρ ) = qS δS ( ρ ) = qS δ( ρ − ρS ) qS (

(1.18)

et le calcul du potentiel V pourra à nouveau être mené en utilisant la relation (1.15), mais en tenant compte de la présence de ces charges surfaciques, ce qui conduit à : V ( ρ) =

1 4π0

 ρ

1 qS δ(ρ − ρ S )  dρ = 4π0 | ρ − ρ |

 S

qS dS R

(1.19)

où R désigne la quantité | ρ − ρS | dans laquelle ρS décrit la surface S. On peut montrer que, dans ce cas :

n ∧ σ [E ] = 0 n · σ [0 E ] = qS

(1.20)

15

De l’Optique électromagnétique à l’Interférométrie

ce qui signifie que la composante tangentielle du champ électrique reste continue à la traversée de la surface S, mais que sa composante normale subit une discontinuité en relation directe avec la valeur de la charge surfacique qS .

1.3.3.2 Charge ponctuelle Il est également fréquent de faire appel à la notion de charge ponctuelle localisée en un point ρ0 de l’espace. Celle-ci est alors représentée par la distribution : ρ − ρ0 ) q( ρ ) = q0 δ(

(1.21)

et donc, en utilisant les propriétés de l’impulsion de Dirac : V ( ρ) =

q0 4π0

 ρ

1 1 q0 δ(ρ − ρ 0 )  q0 dρ = =   4π | ρ − ρ  | 4π 0 0 0 R | ρ−ρ |

(1.22)

où R désigne ici la quantité | ρ − ρ0 |. Avec ce formalisme, le potentiel électrostatique est donc susceptible de diverger dans le cas d’une charge ponctuelle (alors que ce n’était pas vrai dans le cas d’une charge volumique).

1.3.4 Potentiel créé par un dipôle électrostatique Nous aurons également besoin d’utiliser la notion de dipôle pour décrire les effets de polarisation induite dans la matière. Considérons pour ce faire deux charges ponctuelles de valeurs égales à q, de signes opposés, et séparées par une distance l , comme représenté à la figure 1.2. Cet ensemble constitue un dipôle électrostatique

M R+

θ

+q M' –q

Figure 1.2 Dipôle électrostatique.

16

R–

1. Concepts de base en optique électromagnétique

 = q l , où l est le vecteur de module l caractérisé par un moment dipolaire M orienté de la charge négative vers la charge positive. Le potentiel créé en un point M est celui qui résulte de l’effet conjugué de ces 2 charges. Il a donc pour expression :

+q −q q 1 1 V (M ) = + = − (1.23) 4π0 R+ 4π0 R− 4π0 R+ R− où R+ (respectivement R− ) désigne la distance entre le point M et la charge +q (respectivement −q). Si la distance entre ce dipôle et le point M est grande devant la distance l qui sépare les deux charges, on peut écrire, en première approximation :

q q R q l cos θ R− − R+ V (M ) =  = (1.24) 4π0 R+ R− 4π0 R 2 4π0 R 2 On désigne par u le vecteur unitaire porté par la demi-droite définie par le centre M  · u du dipôle et le point M. Dans ces conditions, on peut remplacer ql cos θ par M dans l’expression du potentiel, ce qui conduit à : V (M ) =

 · u 1 M 4π0 R 2

(1.25)

 La distance R a ici pour expression R = (x − x  )2 + (y − y  )2 + (z − z  )2 , où (x, y, z ) désignent les coordonnées du point M et (x  , y  , z  ) celles du point M . −−→ Considérons la quantité grad R . Pour la calculer de manière correcte, il convient de définir sur quel triplet de coordonnées l’opérateur différentiel va agir. Supposons que cet opérateur agisse sur le triplet (x, y, z ) et considérons dans un premier temps la dérivation par rapport à x : ∂ ∂ R= ∂x ∂x

 x − x (x − x  )2 + (y − y  )2 + (z − z  )2 = R

(1.26)

avec des résultats similaires pour y et z . En conséquence : −−→ −−→ MM = u gradM R = R

(1.27)

où l’indice M apparaissant dans le gradient indique que la dérivation a porté sur le triplet de coordonnées (x, y, z ). Si l’opérateur différentiel avait agi sur le triplet de coordonnées (x  , y  , z  ), l’équation (1.26) serait devenue :  ∂ x − x x − x ∂ R = (x − x  )2 + (y − y  )2 + (z − z  )2 = − = (1.28)   ∂x ∂x R R

17

De l’Optique électromagnétique à l’Interférométrie

et donc :

−−→ −−→ MM gradM  R = = − u R

En conséquence, nous pouvons écrire :

−−→ u 1 1 −−→ gradM  = − 2 gradM  R = 2 R R R

(1.29)

(1.30)

En utilisant le résultat que nous venons d’établir, il est donc possible de mettre l’équation (1.25) sous la forme équivalente suivante :

−−→ 1 1  V (M ) = M · gradM  (1.31) = V (M  , M ) 4π0 R où V (M  , M ) désigne le potentiel créé au point M par le dipôle localisé en M .

1.4 Électrostatique dans la matière Après avoir établi l’expression du potentiel dans le vide, on va s’intéresser maintenant aux perturbations induites sur ce potentiel par la présence de matière. Considérons à nouveau un domaine  de l’espace, limité par une surface S , et occupé par une densité volumique de charges q(ρ ). En un point M de l’espace, cet ensemble de charges crée un potentiel Vvide (M ) = V0 (q, M ) que nous sommes maintenant susceptibles de calculer en utilisant les résultats établis au paragraphe 1.3.

1.4.1 Création de dipôles induits On introduit alors dans cet espace un volume V de matière diélectrique (électriquement neutre), de bordure , comme représenté à la figure 1.3. −−→ Cette matière est soumise au champ électrique E0 = −grad V0 généré par la pluralité de charges q(ρ ) situées dans le domaine . Ce champ électrique induit en conséquence une polarisation locale de la matière dans le volume V , polarisation que l’on pourra assimiler à une séparation des barycentres des charges positives et négatives sous l’action de ce champ (en l’absence du champ, la matière diélectrique est électriquement neutre et les barycentres sont confondus).

18

1. Concepts de base en optique électromagnétique

S

M (ρ) n

q ( ρ ')

Σ

Ω

V n

Figure 1.3 Électrostatique dans la matière.

1.4.2 Approximation dipolaire Il y a ainsi création à l’intérieur du volume V de matière d’une assemblée de dipôles induits par la présence du domaine chargé , que l’on caractérisera à l’aide d’une  = P dv. densité volumique de moments dipolaires notée P , et telle que : dM Dans le cadre de cette approximation dipolaire, nous pourrons donc écrire le potentiel en tout point M comme la somme des potentiels créés par les volumes  et V , soit : Vtotal (M ) = Vvide (M ) + Vmatière (M ) = V0 (q, M ) + V1 (P , M ) avec : 1 V0 ( ρ) = 4π0

 ,ρ

q(ρ ) d ρ | ρ − ρ |

et conformément à la relation (1.31) :

 −−→ 1 1    ρ) = P (ρ ) · gradρ  d ρ V1 ( 4π0 V ,ρ | ρ − ρ |

(1.32)

(1.33)

(1.34)

1.4.3 Charges fictives Il nous reste une dernière étape de calcul avant d’envisager l’analogie matière/vide pour les équations du potentiel. Calculons tout d’abord la divergence du rapport

19

De l’Optique électromagnétique à l’Interférométrie

P /R où R désigne, comme précédemment, la quantité | ρ − ρ |. Nous pouvons écrire :  

−−→ 1 1 P   = divP + P · grad (1.35) div R R R soit encore :

−−→ P · grad

 

1 1 P − divP = div R R R

(1.36)

ρ ) créé par la polarisation élecEn utilisant cette dernière relation, le potentiel V1 (  trique P de la matière peut être mis sous la forme :      1 1 P ρ) = (1.37) V1 ( − divP d ρ div 4π0 V ,ρ R R Considérons le deuxième terme de cette intégrale. Nous pouvons l’écrire : ρ) = − V1,V (

1 4π0

 V ,ρ

divP d ρ | ρ − ρ |

(1.38)

Par analogie avec la formule (1.33), tout se passe donc comme s’il y avait création, au sein du volume V de matière, d’une densité volumique de charge qV (ρ ) définie par : qV = −divP (1.39) Le premier membre de l’équation (1.37) peut être lui aussi transformé, cette fois-ci en appliquant le théorème de Green-Ostrogradsky, qui dit que le flux d’un vecteur à travers une surface fermée est égal à l’intégrale de la divergence de ce vecteur sur le volume délimité par cette surface. En conséquence :      1 P 1 P   div dρ = · n d (1.40) 4π0 V ,ρ R 4π0 R où n désigne ici la normale à la surface , dirigée vers l’extérieur du domaine V . Par analogie avec la formule (1.19), tout se passe comme si la surface portait une densité surfacique de charges définie par : q = n · P

(1.41)

En conséquence, l’introduction de matière dans un potentiel fait apparaître 2 distributions de charges fictives, respectivement volumique et surfacique. L’existence de ces densités additionnelles de charge en présence de matière conduit à reformuler la

20

1. Concepts de base en optique électromagnétique

troisième équation de Maxwell de la manière suivante : div(0 E ) = q + qV = q − divP

(1.42)

 défini par D  = 0 E + P : soit encore, en introduisant le vecteur D  = div(0 E + P ) = q divD

(1.43)

 les équations Cette dernière relation montre que, à condition d’utiliser le vecteur D, de Maxwell prennent la même forme dans la matière ou dans le vide, à savoir que la  est égale aux charges imposées (non induites). divergence de ce vecteur D

1.4.4 Discontinuités Il nous faut également vérifier cette analogie à la frontière du domaine V , c’est-àdire sur la surface . Conformément aux relations de discontinuité introduites au paragraphe 1.3.3.1 dans le cas d’une distribution de charge surfacique, la discontinuité du champ en présence de matière doit maintenant s’écrire en tenant compte des nouvelles charges induites :

n ∧ σ [E ] = 0 (1.44) n · σ [0 E ] = q La première relation relative à la continuité de la composante tangentielle du champ électrique est inchangée. À l’inverse, il nous faut tenir compte, pour la composante normale, de la présence de la charge surfacique q induite dans la matière. On peut remarquer que le saut du vecteur P s’écrit, puisqu’il n’y pas de polarisation induite en dehors du volume V , comme : σ [P ] = 0 − P = −P

(1.45)

 = n · σ [0 E + P ] = q − n · P = 0 n · σ [D]

(1.46)

On en déduit aussitôt que :

On retrouve ainsi, pour la discontinuité de la composante normale, la même expression que celle obtenue dans le vide en l’absence de charge surfacique imposée,  en lieu et place du vecteur E . On retiendra en à condition d’utiliser le vecteur D synthèse que les composantes respectivement tangentielles et normales des champs  sont continues. respectivement E et D Ainsi nous avons bien vérifié que les équations de Maxwell sont identiques dans le vide ou dans la matière, à la fois pour les équations du champ et pour ses

21

De l’Optique électromagnétique à l’Interférométrie

discontinuités. Nous verrons au chapitre 2 comment condenser ces propriétés (équations et discontinuités) sous la forme d’une seule écriture, à l’aide des distributions. Notons pour être complet que nous avons adopté ici une description de la polarisation de la matière qui ne considérait celle-ci que comme résultant de la création de dipôles induits, sans prendre en compte des répartitions de charges plus complexes de type quadrupôles, par exemple. C’est la raison pour laquelle cette approche est habituellement désignée sous l’appellation d’approximation dipolaire.

1.5 Optique linéaire en milieu isotrope Nous avons montré au paragraphe précédent que l’introduction de matière conduit  = 0 E + P tout en à remplacer le vecteur caractéristique 0 E par le vecteur D continuant d’utiliser la même formulation pour les équations de Maxwell.  est fonction de P et Toutefois, à ce stade, le nombre d’inconnues reste le même (D inversement), et concerne toujours 4 grandeurs vectorielles. On peut cependant aller plus loin en exprimant la polarisation de la matière sous la forme d’un développement en série du champ appliqué E . Si nous considérons l’une quelconque des composantes de ce vecteur polarisation, nous pouvons écrire : Pi (E ) = Pi (0) +

3  ∂Pi j =1

∂Ej

Ej +

1  ∂ 2 Pi Ej Ek + ... 2 ∂Ej ∂Ek

(1.47)

j,k

La polarisation électrique en l’absence de champ excitateur est, sauf exception (matériaux ferroélectriques par exemple), nulle, soit : Pi (0) = 0. Les termes qui présentent une dépendance quadratique vis-à-vis des composantes du champ, ainsi que les termes d’ordre supérieur, sont responsables des phénomènes d’optique non linéaire, comme le doublement de fréquence, la rectification optique, l’amplification paramétrique ou l’automodulation de phase. Nous ne les considérerons pas ici, ce qui nous amènera à rester dans le cadre de l’optique dite linéaire, où les processus sont parfois dits élastiques, pour signifier qu’un matériau recevant une longueur d’onde quelconque ne modifiera pas cette longueur d’onde, en dépit des phénomènes de réflexion, transmission, absorption, diffraction, diffusion, focalisation... que nous étudierons plus tard. Si l’on se limite donc aux termes du développement qui présentent une dépendance linéaire vis-à-vis des composantes du champ électrique, la relation (1.47) peut être mise sous la forme simplifiée suivante : Pi (E ) 

 ∂Pi j

22

∂Ej

Ej = 0

 j

χij Ej

avec 0 χij =

∂Pi ∂Ej

(1.48)

1. Concepts de base en optique électromagnétique

où χij désigne les composantes du tenseur susceptibilité. Dans le cas général, ceci nous conduit à une relation matricielle entre polarisation induite et champ, qui s’écrit : P = 0 [χ ] E (1.49) et permet de rendre compte des propriétés de milieux dits anisotropes. Lorsque le milieu considéré est isotrope, c’est-à-dire que sa microstructure ne dépend pas de la direction d’observation, il ne peut y avoir, pour des raisons de symétrie, génération d’une polarisation qui ne soit pas colinéaire à l’excitation. En conséquence : χij = χ δij

(1.50)

où δij désigne le symbole de Kronecker (δij = 1, si i = j et δij = 0, si i = j ). Dans ces conditions, la matrice de susceptibilité se réduit à la matrice identité, de sorte qu’un seul scalaire χ permet de relier les vecteurs P et E comme : P = 0 χ E

(1.51)

 : On obtient ensuite pour le vecteur D  = 0 E + P = 0 E + 0 χ E = 0 (1 + χ )E = 0 r E =  E D

(1.52)

où  désigne la permittivité électrique du milieu et r sa permittivité relative ( = 0 r ). On retiendra que cette dernière expression est établie pour des milieux linéaires et isotropes, sans polarisation électrique permanente. Par ailleurs, le nombre d’incon sont données en fonction nues est ici réduit puisque les 3 composantes du vecteur D  du champ E et de la permittivité  de la matière.

1.6 Magnétostatique La magnétostatique peut être abordée en adoptant une démarche similaire à celle que nous venons de suivre pour l’électrostatique. Dans ce paragraphe, nous nous contenterons d’en décrire les grandes lignes.

1.6.1 Magnétostatique du vide On part à nouveau de la forme simplifiée des équations de Maxwell lorsque charges et courants ne présentent pas de dépendance temporelle, soit :

− →H  = J ( rot ρ) (1.53)  divB = 0

23

De l’Optique électromagnétique à l’Interférométrie

Puisque la divergence du vecteur B est nulle, cela signifie que l’on peut représenter  soit : ce vecteur comme le rotationnel d’un vecteur A, →A B = − rot

(1.54)

Le vecteur A est appelée potentiel vecteur magnétostatique et, comme dans le cas du potentiel scalaire électrostatique, sa définition ne présente pas de caractère d’unicité. On note en effet qu’il est défini à un gradient près : −−→ A = A + grad



− →A = − →A rot rot

(1.55)

où  désigne une fonction arbitraire. Par ailleurs, dans le cas correspondant à la magnétostatique du vide, le champ  , ce coefficient de promagnétique B est proportionnel à l’induction magnétique H portionnalité étant appelé perméabilité magnétique du vide et noté μ0 , soit :  B = μ0 H

(1.56)

En conséquence, la deuxième équation de Maxwell permet d’écrire ici : −−→ →B = 1 − →− →A) − →H  − A]  = J (  = 1 [grad(divA)  = 1 − ρ) rot rot( rot rot μ0 μ0 μ0

(1.57)

Comme indiqué précédemment, le choix du vecteur A n’est pas unique, et il est donc  = 0, toujours possible de considérer celui qui satisfait en outre la condition : divA condition que l’on désigne habituellement sous l’appellation de jauge de Coulomb. Si cette jauge particulière est adoptée, il vient : A + μ0 J = 0

(1.58)

À part le fait qu’elle est maintenant vectorielle, cette équation différentielle est similaire à l’équation de Poisson (15.3) établie dans le cas électrostatique. En conséquence, sa solution générale s’écrit :  ρ) = A(



 1 μ0 J (ρ )  μ0 J ( ρ) = d ρ 4π| ρ| 4π ρ | ρ − ρ |

(1.59)

1.6.2 Magnétostatique dans la matière On voit donc qu’il y a une forte analogie entre électrostatique du vide et magnétostatique du vide. Cette analogie peut être prolongée en présence de matière, le champ généré par la densité volumique de courants provoquant cette fois-ci une

24

1. Concepts de base en optique électromagnétique

aimantation de la matière (que l’on désigne parfois sous l’appellation de polarisation magnétique, par analogie avec le cas électrostatique). On aura donc, pour un milieu linéaire isotrope et pour des matériaux sans aimantation permanente (comme les matériaux paramagnétiques ou diamagnétiques) :  + PH ) B = μ0 (H

avec

 PH = χH H

(1.60)

où χH désigne la susceptibilité magnétique, puis :  = μ0 μr H  = μH  B = μ0 (1 + χH )H

(1.61)

où μ représente la perméabilité magnétique du milieu et μr sa perméabilité relative (μ = μ0 μr ). On notera que les matériaux habituellement utilisés en optique (tels que les matériaux diélectriques) présentent rarement une aimantation induite, contrairement aux métaux et aux alliages. Il est également important de remarquer à ce stade que nous avons traité séparément les cas de l’électrostatique et de la magnétostatique, ce qui nous a conduit à considérer une polarisation électrique (respectivement magnétique) uniquement induite par une charge électrique (respectivement par un courant électrique). On pourrait toutefois envisager l’existence d’un couplage entre ces polarisations induites, notamment dans le cas d’un régime spatio-temporel. Enfin, avant d’aborder l’électromagnétisme au paragraphe suivant, nous pouvons noter que le nombre d’inconnues associées à l’écriture des équations de Maxwell dans la matière linéaire isotrope est simplement de 6, à savoir les composantes des  . En effet, les paramètres  et μ, qui sont caractéristiques de la vecteurs E et H micro-structure de la matière, ne constituent pas des inconnues. On notera que ce sont les hypothèses de linéarité et d’isotropie qui ont permis de simplifier le problème, et de disposer au final de 6 inconnues pour 8 équations, ces dernières étant évidemment liées. Dans le cas général (optique anisotrope et non linéaire), le nombre d’inconnues n’est finalement pas plus élevé si l’on considère que les coefficients des développements limités (cf. relation (1.47)) sont une caractéristique de la  s’obtiennent à partir des potentiels scamatière. Pour conclure, les champs E et H laire (électrostatique) et vecteur (magnétostatique), lesquels se déduisent des sources (q, J ), via les relations (1.15) et (1.59).

1.7 Électromagnétisme Rappelons tout d’abord les relations obtenues en régime statique :  = 0 E + PE D  + PH ) B = μ0 (H

(1.62)

25

De l’Optique électromagnétique à l’Interférométrie

où les polarisations électrique PE et magnétique PH ont pour expressions : PE = 0 χE E  PH = χH H

(1.63)

1.7.1 Inertie de la matière On suppose désormais que charges et courants dépendent du temps, ce qui, justement, différencie l’électromagnétisme de l’électrostatique. On considérera que les propriétés locales définies précédemment restent vraies, à ceci près qu’il nous faut maintenant prendre en compte la réponse temporelle (on dit aussi l’inertie ) du milieu, c’est-à-dire le temps que met la matière à percevoir les variations temporelles des sources. En d’autres termes, les polarisations électrique et magnétique induites dans la matière ne réagissent pas instantanément à l’action du champ excitateur émis par les sources, de sorte qu’il n’est pas possible d’écrire, à chaque instant t : PE ( ρ , t ) = 0 χE E ( ρ, t )

 ( ρ , t ) = χH H PH ( ρ, t )

(1.64)

Cette remarque est classique et vaut pour tous les systèmes physiques soumis à une action extérieure. En réalité, la réponse du système dépend de l’excitation pendant toute la durée où celle-ci s’applique, ce que l’on peut traduire à l’aide des relations intégrales suivantes :  PE ( ρ , t ) = 0 χE (τ )E ( ρ , t − τ ) dτ τ   ( ρ , t ) = χH (τ )H ρ , t − τ ) dτ (1.65) PH ( τ

où les fonctions scalaires χE (τ ) et χH (τ ) sont nulles pour les valeurs négatives du temps τ , de manière à respecter le principe de causalité. Avec de telles relations, la polarisation apparaît comme le résultat d’une combinaison linéaire du champ aux différents instants t − τ , pondérée par le scalaire χ (τ ). On notera que le cas d’une réaction instantanée (cas du vide ou d’une matière parfaite ) correspond au cas où la susceptibilité s’écrit comme une distribution de Dirac temporelle, soit, pour chaque polarisation : χ (τ ) = χ0 δ(τ )

(1.66)

En conservant les hypothèses de linéarité et d’isotropie faites aux paragraphes 1.5 et 1.6.2, on obtient ainsi, pour le régime spatio-temporel :        = 0 (δ + χE ) E =  E PE = 0 χE E ⇒ D (1.67) t

26

t

t

1. Concepts de base en optique électromagnétique

   PH = χH H t



     = μ H  B = μ0 (δ + χH ) H t

t

(1.68)

où l’indice t affectant les produits de convolution indique que ceux-ci ne portent que sur la variable temporelle (et non sur les variables d’espace). Les relations (1.67) et (1.68) sont les relations constitutives de la matière dans le cas de l’électromagnétisme. On notera que les fonctions (t ) et μ(t ) figurant dans ces relations ne sont pas celles du régime statique, ces dernières s’obtenant par intégration temporelle de (t ) et de μ(t ).  sont désormais couplés dans ce régime temporel, de Par ailleurs, les champs E et H sorte qu’on aurait pu considérer une polarisation de nature électrique induite par un champ magnétique (et inversement), ce qui n’a pas été considéré en régime statique. Enfin, on soulignera une dernière hypothèse, sous-jacente aux développements de ce chapitre, où l’on a toujours considéré que les milieux étaient locaux. Ceci signifie qu’en chaque point M de l’espace, la polarisation ne dépend que de l’excitation en ce même point M. On pourrait cependant considérer, pour le calcul de la polarisation et tout en restant dans le cadre d’un formalisme macroscopique, l’influence de l’excitation au voisinage immédiat de ce point M : on obtiendrait alors une convolution spatiale, analogue à la convolution temporelle que nous venons d’introduire. Cette approche, que l’on désigne sous l’appellation générique d’électromagnétisme non local, peut s’avérer importante lorsque l’on s’intéresse au développement de nanomatériaux ou de métamatériaux.

1.7.2 Équations de Maxwell Dans le cadre de ces hypothèses, les équations de Maxwell, initialement données en (1.1), peuvent être finalement réécrites comme suit : ⎧ ∂ − →E ( ⎪  ]( ⎪ ρ, t ) rot ρ , t ) = − [μ H ⎪ ⎪ t ∂t ⎪ ⎪ ⎪ ⎪− ∂ →H ⎨  ( rot ρ , t ) = J ( ρ , t ) + [ E ]( ρ, t ) (1.69) ∂t t ⎪ ⎪  ⎪ div[ E ]( ρ , t ) = q( ρ, t ) ⎪ ⎪ t ⎪ ⎪ ⎪ ⎩ div[μ H  ]( ρ, t ) = 0 t

On signalera enfin que nous avons, jusqu’ici, toujours considéré que les sources étaient imposées, alors qu’en régime temporel, elles peuvent aussi être photo-induites. C’est notamment le cas des métaux, sur lesquels nous reviendrons au chapitre suivant.

27

De l’Optique électromagnétique à l’Interférométrie

1.7.3 Introduction aux relations de causalité La notion de causalité permettra de clôturer ce premier chapitre. À partir d’une remarque d’apparence anodine (la réponse ne dépend que des excitations passées), nous avons considéré au paragraphe précédent que les fonctions susceptibilités étaient à support positif, c’est-à-dire obéissaient à la condition : χE (t ) = χH (t ) = 0 ∀ t < 0 ce qui peut encore s’écrire 1 χ (t ) = [1 + Sgn(t )]χ (t ) 2

(1.70)

où Sgn(t ) est la fonction signe de t, définie par : Sgn(t ) = |t |/t . Cette propriété de causalité est à la base d’une transformation mathématique remarquable, dite de Kramers-Kronig, qui est indispensable à la compréhension des phénomènes de dispersion en électromagnétisme. Nous serons conduits à y revenir au chapitre 6.

28

Régime harmonique Chapitre conçu par Claude Amra rédigé par Michel Lequime et Claude Amra

Sommaire 2.1 2.2

2.3 2.4 2.5

2.6

2.7 2.8

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équations de Maxwell en régime harmonique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Introduction de la transformée de Fourier temporelle . . . . . . . . . . . . . . . . . . . . 2.2.2 Application aux équations de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reconstruction de la dépendance temporelle des champs . . . . . . . . . . . . . . . . . . . . . Équation de propagation en milieu homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vitesse de phase, indice, longueur d’onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Vitesse de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Indice de réfraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Longueur d’onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Milieux absorbants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.2 Cas spécifique des métaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Trièdre direct . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . État de polarisation de la lumière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30 32 32 33 34 35 37 38 38 39 39 40 40 41 42 43

29

De l’Optique électromagnétique à l’Interférométrie

2.9 2.10 2.11

Absorption, flux et énergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Équation de propagation harmonique avec terme source . . . . . . . . . . . . . . . . . . . . . . 47 Équations de Maxwell au sens des distributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.1 Introduction On se place désormais en milieu local, linéaire, isotrope, homogène et sans polarisation permanente. La dépendance des champs électromagnétiques, ainsi que celle des sources et des courants, sera supposée de nature spatio-temporelle. Les équations de Maxwell en régime spatio-temporel que nous avons établies au chapitre précédent, et qu’il n’est pas inutile de rappeler ici, ⎧ ∂ − →E ( ⎪  ]( ⎪ ρ, t ) rot ρ , t ) = − [μ  H ⎪ ⎪ t ∂t ⎪ ⎪ ⎪ ⎪− ∂ →H ⎨  ( rot ρ , t ) = J ( ρ , t ) + [  E ]( ρ, t ) (2.1) ∂t t ⎪ ⎪  ⎪ div[  E ]( ρ , t ) = q( ρ, t ) ⎪ ⎪ t ⎪ ⎪ ⎪ ⎩ div[μ  H  ]( ρ, t ) = 0 t

nous fournissent une description mathématique complète d’un champ électroma ( gnétique [E ( ρ , t ), H ρ , t )] à l’intérieur d’un milieu matériel. Chacun pourra se convaincre que la résolution directe de ce système d’équations n’est pas immédiate, en particulier à cause de la présence des formes intégrales associées aux produits de convolution temporels. Nous allons montrer dans les paragraphes qui suivent comment l’utilisation de la transformation de Fourier va nous permettre d’y parvenir.

Cas particulier de la matière parfaite Il est malgré tout intéressant de noter que ce système peut être résolu de manière directe dans le cas particulier de la matière parfaite, c’est-à-dire d’un milieu dont la réponse à l’excitation est instantanée. On a vu au paragraphe 1.7 que les susceptibilités électrique et magnétique sont alors décrites par des distributions de Dirac temporelles, dont on rappelle qu’elles constituent les éléments neutres du produit de convolution. On s’affranchit ainsi de ces produits de convolution et il nous est alors possible d’appliquer l’opérateur rotationnel à l’ensemble de la première équation :    ∂ − →H − → − →E (  ( rot ρ, t ) rot rot ρ , t ) = −μ ∂t

30

(2.2)

2. Régime harmonique

puis d’utiliser la deuxième équation de Maxwell pour reformuler le second membre :    ∂ ∂ − → − →    ρ , t ) = −μ rot rotE ( J ( ρ , t ) +  E ( ρ, t ) (2.3) ∂t ∂t En milieu homogène, les quantités  et μ sont en effet indépendantes de la variable d’espace. On aboutit ainsi à l’équation d’onde : E ( ρ , t ) − μ

∂2  ∂ 1 −−→ E ( ρ , t ) = μ J ( ρ , t ) + grad q( ρ, t ) ∂t 2 ∂t 

(2.4)

ρ , t ) de l’équation précédente sans second membre (souvent appelée La solution E0 ( solution homogène ) est facile à trouver dans la mesure où toute exponentielle complexe du type exp( ± i β · ρ ± i ωt ) répond au problème, à condition d’avoir : β · β = k 2 = ω2 μ

(2.5)

où k est un réel dans le cas de ce milieu parfait. En conséquence, le champ réel E0 ( ρ , t ) est proportionnel à toute combinaison linéaire (intégrale ou discrète) de fonctions trigonométriques élémentaires du type : E0 (ω) cos [±β (ω) · ρ ± ωt ]

(2.6)

 puis et l’on peut dès lors développer des considérations sur le vecteur d’onde β, définir une vitesse, un indice et une longueur d’onde... Toutefois, pour ces milieux parfaits, les constantes diélectrique et magnétique sont réelles, de sorte que nous nous trouvons dans un cas très particulier qui n’autorise pas tous les vecteurs d’onde complexes dans la relation (2.5). Enfin, avec ces mêmes hypothèses, les constantes  et μ sont indépendantes de la fréquence, quel que soit le domaine spectral considéré, et cette absence de dispersion d’indice ne correspond à l’évidence pas à la réalité. Pour être complet, intéressons-nous maintenant à la solution particulière E1 ( ρ , t ) de l’équation d’onde (2.4). De façon analogue au calcul développé au paragraphe 1.3.2 dans le cas du potentiel électrostatique, la solution de cette équation est directement donnée par la convolution de la fonction de Green associée G ( ρ , t ) avec le second membre de cette équation, soit : E1 ( ρ , t ) avec S ( ρ, t ) = ρ , t ) = [G  S ]( ρ ,t

1 −−→ ∂ grad q( ρ , t ) + μ J ( ρ , t ) (2.7)  ∂t

mais, cette fois, la convolution porte conjointement sur l’espace et le temps.

31

De l’Optique électromagnétique à l’Interférométrie

Par ailleurs, la fonction de Green est ici spécifique de l’équation d’onde spatiotemporelle et doit donc vérifier : G ( ρ , t ) − μ

∂2 G ( ρ , t ) = δ( ρ, t ) ∂t 2

(2.8)

On peut montrer que la solution de cette dernière équation est de la forme : G ( ρ, t ) = −

1 √ ρ |) δ(t − μ | 4π | ρ|

(2.9)

ρ, t ) : ce qui nous donne directement accès à une expression intégrale du champ E1 ( ρ , t ) = [G  S ]( ρ, t ) = − E1 ( ρ ,t



1 4π

ρ

√ ρ − ρ |  S (ρ , t − μ | dρ | ρ − ρ |

(2.10)

où l’on voit que l’information est transmise avec un retard lié à la vitesse de propa√ gation v de l’onde lumineuse (v = 1/ μ).

2.2 Équations de Maxwell en régime harmonique 2.2.1 Introduction de la transformée de Fourier temporelle Nous souhaitons maintenant définir une solution exacte et générale au système d’équations (2.1) en passant dans l’espace des fréquences. On utilise pour cela une transformation de Fourier temporelle des champs électromagnétiques E ( ρ , t ) et  ( ρ , f ) et H ρ , t ), ce qui va nous conduire à introduire les champs fréquentiels E(  ( H ρ , f ), respectivement définis par :

 E ( ρ , f ) = E ( (2.11) ρ , t )e 2iπ ft dt t

et

 ( H ρ, f ) =

t

 ( H ρ , t )e 2iπ ft dt

(2.12)

où f désigne la fréquence temporelle, qui est la variable conjuguée du temps t au sens de la transformée de Fourier. Introduisons de la même manière les quantités ˜ (f ) et μ(f ˜ ) définies par :

˜ (f ) = (t )e 2iπ ft dt (2.13) t

32

2. Régime harmonique



et μ(f ˜ )=

t

μ(t )e 2iπ ft dt

(2.14)

On notera que nous avons adopté ici une convention de signe positif dans l’expression de cette transformée de Fourier temporelle. Nous verrons que ceci a pour conséquence de nous conduire à définir des indices de réfraction complexes ayant une partie imaginaire positive. Dans certains ouvrages, la transformée de Fourier temporelle est définie avec une convention de signe opposée, la partie imaginaire de l’indice de réfraction étant alors négative.

2.2.2 Application aux équations de Maxwell Considérons maintenant, à titre d’exemple, la première équation de Maxwell et prenons-en la transformée de Fourier temporelle. Nous avons donc :



∂ − → 2iπ ft   ]( rotE ( ρ , t )e ρ , t )e 2iπ ft dt dt = − (2.15) [μ  H t ∂t t t Pour calculer le premier membre de l’égalité, il suffit de remarquer que l’opérateur rotationnel n’agit que sur les variables d’espace, alors que la transformée de Fourier est une intégrale sur le temps. Cela signifie que la transformée de Fourier temporelle d’un rotationnel n’est autre que le rotationnel de cette transformée de Fourier temporelle, soit : 



− → − → →E( 2iπ ft 2iπ ft   rotE ( ρ , t )e E ( ρ , t )e dt = rot dt = − rot ρ, f ) (2.16) t

t

En ce qui concerne le deuxième membre, le calcul doit être mené en 3 temps. Tout d’abord, nous pouvons utiliser la propriété caractéristique de la dérivée d’un produit de convolution, à savoir que l’opérateur dérivation peut être indifféremment appliqué à l’une ou l’autre des 2 fonctions dont on effectue le produit de convolution, soit ici : ∂ ]=μ ∂ H  [μ  H (2.17) t t ∂t ∂t Dans un deuxième temps, nous avons à calculer la transformée de Fourier du produit de convolution de 2 fonctions, dont on sait qu’elle est égale au produit simple des transformées de Fourier de chacune de ces deux fonctions, soit :



∂ ∂ 2iπ ft  ](  ( [μ  H dt = μ(f ˜ ) (2.18) ρ , t )e H ρ , t )e 2iπ ft dt t ∂t t t ∂t Et enfin, il nous reste à déterminer la transformée de Fourier temporelle de la dé ( rivée temporelle du champ H ρ , t ). Avec la convention de signe utilisée lors de la

33

De l’Optique électromagnétique à l’Interférométrie

définition de ces transformées de Fourier, nous obtenons :

∂  (  ( ρ, f ) H ρ , t )e 2iπ ft dt = −2i πf H ∂t t

(2.19)

En conclusion, l’application d’une transformation de Fourier à la première équation de Maxwell conduit à la relation finale entre transformées de Fourier temporelles des champs : − →E(  ( rot ρ , f ) = 2i πf μ(f ˜ )H ρ, f ) (2.20) De la même manière, l’application d’une transformation de Fourier à la deuxième équation de Maxwell conduit à la relation suivante entre champs fréquentiels : − →H  ( ρ , f ) = J ( ρ , f ) − 2i πf ˜ (f )E( ρ, f ) rot

(2.21)

où J ( ρ , f ) désigne la transformée de Fourier temporelle de la densité volumique de courants J ( ρ , t ). Dans le cas des deux dernières équations de Maxwell, on obtient de la même manière, en milieu homogène : ρ , f )] = ˜ (f ) divE( ρ , f ) = Q( ρ, f ) div[˜ (f )E(  (  ( ρ , f )] = μ(f ˜ ) divH ρ, f ) = 0 div[μ(f ˜ )H

(2.22) (2.23)

ρ , f ) désigne la transformée de Fourier temporelle de la distribution volumique où Q( de charges q( ρ , t ).

2.2.3 Bilan On a coutume d’appeler ces relations entre grandeurs fréquentielles, qui résultent de l’application d’une transformation de Fourier temporelle aux équations de Maxwell dépendant du temps, les équations de Maxwell en régime harmonique. On verra plus loin que ce régime harmonique correspond à la présence d’une seule longueur d’onde (et donc d’une seule couleur, si cette longueur d’onde appartient au spectre visible), et c’est la raison pour laquelle on parle aussi de régime monochromatique. Ces équations de Maxwell en régime harmonique ont donc pour expression finale, en milieu homogène : ⎧− →E(  ( ρ , f ) = 2i πf μ(f ˜ )H ρ, f ) rot ⎪ ⎪ ⎪ ⎪ → ⎨−   rotH( ρ , f ) = J ( ρ , f ) − 2i πf ˜ (f )E( ρ, f ) ⎪ ρ , f ) = Q( ρ, f ) ⎪ ˜ (f ) divE( ⎪ ⎪ ⎩  ρ, f ) = 0 divH(

34

(2.24)

2. Régime harmonique

soit encore, en faisant apparaître la pulsation temporelle ω en lieu et place de la quantité 2πf : ⎧− →E(  ( ρ , f ) = i ω μ(f ˜ )H ρ, f ) rot ⎪ ⎪ ⎪− ⎪ →H ⎨ rot  ( ρ , f ) = J ( ρ , f ) − i ω ˜ (f )E( ρ, f ) ⎪ ρ , f ) = Q( ρ, f ) ⎪ ˜ (f ) divE( ⎪ ⎪ ⎩  ρ, f ) = 0 divH(

(2.25)

On notera qu’en milieu non homogène, les équations faisant intervenir des divergences doivent être conservées sous leur forme initiale, soit : div[˜ E] = 0 et

] = 0 div[μ ˜H

(2.26)

puisque ˜ et μ ˜ dépendent dans ce cas des variables d’espace. Par ailleurs, ces équations (2.25) présentent une certaine redondance en l’absence de sources, puisqu’alors les deux dernières équations se déduisent des deux premières après application de l’opérateur divergence : →E( ρ , f )] = 0 div[− rot − →  ( ρ , f )] = 0 div[rotH

⇒ ⇒

 ( div[μ(f ˜ )H ρ , f )] = 0 div[˜ (f )E( ρ , f )] = 0

(2.27)

On verra qu’en général les deux premières équations (faisant apparaître l’opérateur rotationnel ) fournissent les composantes tangentielles des champs, alors que les deux dernières (qui utilisent l’opérateur divergence ) fournissent les composantes normales de ces mêmes champs.

2.3 Reconstruction de la dépendance temporelle des champs La démarche présentée au paragraphe 2.2 va nous permettre de calculer les valeurs des  ( ρ , f ) et H ρ , f ) à toute fréquence f , sous réserve que nous connaissions champs E( les propriétés du milieu matériel définies par ˜ (f ) et μ(f ˜ ), ainsi que la nature des ρ , f ) et Q( ρ , f ). sources décrites par J ( Une fois calculées ces expressions fréquentielles des champs, nous pouvons en déduire leurs formulations temporelles en appliquant une transformée de Fourier inverse à notre résultat, à savoir :

ρ , f )e −2iπ ft df (2.28) E ( ρ , t ) = E( f

35

De l’Optique électromagnétique à l’Interférométrie

et :  ( H ρ, t ) =

f

 ( H ρ , f )e −2iπ ft df

(2.29)

Cette opération est appelée la reconstruction de la dépendance temporelle des champs. On peut aussi considérer les fonctions exponentielles complexes exp[−2i πft ] comme une base continue sur laquelle on vient décomposer les champs  (  ( ρ , f ) et H ρ , f ) apparaissant alors E ( ρ , t ) ou H ρ , t ), les champs fréquentiels E( comme les coefficients de cette décomposition spectrale. Notons également que le champ E ( ρ , t ) est une quantité réelle définie dans R3 , ρ , f ) est une quantité car mesurable. À l’inverse, le champ fréquentiel associé E( complexe définie dans C3 . Toutefois, ce champ possède la symétrie hermitienne, puisqu’il est la transformée de Fourier d’un champ réel :



∗ ∗ −2iπ ft   E ( ρ , f ) = E ( ρ , t )e dt = E ( ρ , −f ) (2.30) ρ , t )e −2iπ ft dt = E( t

t

où le symbole ∗ désigne le complexe conjugué. Si on utilise cette propriété dans la relation (2.28), il vient :

+∞  E ( ρ, t ) = E( ρ , f )e −2iπ ft df −∞

+∞   E( ρ , f )e −2iπ ft + E∗ ( ρ , f )e 2iπ ft df = (2.31) 0

soit encore : E ( ρ, t ) = 2

0

+∞

  E( ρ , f )e −2iπ ft df

(2.32)

Si l’on considère l’une quelconque des composantes j = x, y ou z de ces champs, on pourra donc écrire :

+∞   ρ, t ) = 2 Ej ( ρ , f )e −2iπ ft df Ej ( 0

+∞ Ej ( ρ , f ) cos[2πft − φj (f )] df (2.33) =2 0

où Ej ( ρ , f ) désigne le module (au sens des nombres complexes) de la composante j du champ fréquentiel et φj (f ) son argument. Cette dernière relation montre bien que le champ reconstruit est réel et s’exprime comme une combinaison linéaire (intégrale ) de fonctions trigonométriques, chacune de ces fonctions ayant une fréquence et un déphasage spécifiques. Ce résultat est d’ailleurs valable pour tout signal admettant une transformée de Fourier. Nous

36

2. Régime harmonique

allons maintenant examiner comment les modules et les déphasages de ces grandeurs dépendent de la variable d’espace. À titre de remarque, on notera que la relation (2.28) permet également de décrire une onde monochromatique, à condition que le spectre en fréquence soit décrit par une distribution de Dirac. En effet : ρ ) cos (2πf0 t ) E ( ρ , t ) = E0 (

1 ρ , f ) = E0 ( ρ ) δ(f − f0 ) + δ(f + f0 ) ⇒ E( 2

(2.34)

2.4 Équation de propagation en milieu homogène Considérons le cas particulier où charges et courants sont nuls dans un milieu homogène. Les équations de Maxwell en régime harmonique prennent alors la forme simplifiée suivante : ⎧− →  ρ , f ) = 2i πf μ(f  (  ( ˜ )H ρ , f ) = i ω μ(f ˜ )H ρ, f ) ⎪ ⎪ rotE ( ⎪ ⎪ → ⎨−   rotH( ρ , f ) = −2i πf ˜ (f )E ( ρ , f ) = −i ω ˜ (f )E( ρ, f ) ⎪ ρ, f ) = 0 divE( ⎪ ⎪ ⎪ ⎩  ( ρ, f ) = 0 divH

(2.35)

Appliquons l’opérateur rotationnel à la première équation de Maxwell. Il vient : −−→ − →− →E( →H  ( rot[ rot ρ , f )] = grad[divE( ρ , f )] − E( ρ , f ) = i ω μ(f ˜ )− rot ρ , f ) (2.36) En utilisant maintenant la deuxième et la troisième équation, cette relation devient : −E( ρ , f ) = −i 2 ω2 ˜ (f )μ(f ˜ ) E( ρ, f )

(2.37)

et peut être mise sous la forme classique appelée équation d’Helmholtz, à savoir : ρ , f ) + k 2 E( ρ, f ) = 0 E(

avec

k 2 = ω2 ˜ (f )μ(f ˜ )

(2.38)

où k est une fonction de la fréquence f (ou de la pulsation ω) et prend ses valeurs dans C. Il est immédiat de vérifier que toute exponentielle du type exp[i β · ρ ] est solution de cette équation, à condition que le vecteur β vérifie la relation : β · β = k 2 = ω2 ˜ (f )μ(f ˜ )

(2.39)

Il existe une infinité de vecteurs β vérifiant cette condition à une fréquence f donnée, dont la plupart définissent des directions de propagation pour la composante

37

De l’Optique électromagnétique à l’Interférométrie

fréquentielle du champ E( ρ , f ), dont l’expression la plus générale sera donc du type :  E( ρ , f ) = A(f ) e i β ·ρ

avec β · β = ω2 ˜ (f )μ(f ˜ )

(2.40)

Cette dernière expression correspond à une onde progressive ou rétrograde, monochromatique et monodirectionnelle, qui pourra être propagative ou évanescente sous certaines conditions qui seront précisées ultérieurement.

2.5 Vitesse de phase, indice, longueur d’onde Nous supposerons tout d’abord que le milieu considéré est transparent (k réel) et  ), car nous avons déjà à traiter nous nous limiterons ici à un seul vecteur d’onde β(f une somme infinie de fréquences. Le cas de plusieurs vecteurs d’onde conjoints sera abordé au chapitre 4. Enfin, on ne considèrera que des valeurs réelles de ce vecteur d’onde, afin de limiter notre analyse aux seules ondes propagatives (les ondes évanescentes seront introduites dans ce même chapitre 4). Il nous est alors possible de procéder à la reconstruction de la dépendance temporelle du champ en écrivant :



 −2iπ ft   ρ , f )e df = A(f )e i β ρ e −2iπ ft df (2.41) E ( ρ , t ) = E ( f

f

En utilisant la propriété de symétrie hermitienne introduite au paragraphe 2.3, nous pouvons écrire, pour chaque composante j du champ vectoriel E ( ρ , t ), avec j = x, y ou z :

 ρ − 2πft + φj (f )] df ρ, t ) = 2 |Aj (f )| cos[β. (2.42) Ej ( f>0

2.5.1 Vitesse de phase Considérons l’argument ψ de la fonction cosinus qui apparaît dans chaque composante élémentaire de la relation (2.42) et plaçons-nous dans la direction définie par  Cet argument a alors pour expression : le vecteur β. ψ = |β | | ρ | − 2πft + φ(f ) = kρ − ωt + φ(f )

(2.43)

La quantité considérée est donc représentative d’une onde plane qui se propage dans la direction définie par le vecteur β à une vitesse déterminée par la condition d’invariance de cette phase ψ, soit : d ψ = 0 = k d ρ − ω dt

38



v=

dρ ω = dt k

(2.44)

2. Régime harmonique

Compte tenu de sa définition, cette quantité v est appelée vitesse de phase. Si nous injectons maintenant dans la relation (2.44) la définition de la grandeur k qui figurait dans l’équation (2.38), il vient : v=

ω 1 = k ˜ (f )μ(f ˜ )

(2.45)

ce que l’on exprime souvent sous la forme condensée : ˜ (f )μ(f ˜ )v 2 = 1. Dans le cas particulier où le milieu dans lequel se propagent ces ondes correspond au vide, il vient : 0 μ0 c 2 = 1, où c désigne comme à l’accoutumée la vitesse de la lumière dans le vide. On indiquera ici que cette vitesse de phase ne correspond pas nécessairement à une vitesse de propagation de l’énergie transportée par l’onde électromagnétique. Pour cela, il nous faudra introduire la notion de vitesse de groupe, qui prend en compte l’ensemble des fréquences associées à cette onde (cf. chapitre 3).

2.5.2 Indice de réfraction On définit alors l’indice de réfraction n du milieu comme le rapport entre les vitesses de propagation de la lumière dans le vide et dans ce milieu, soit :  ˜ (f )μ(f ˜ )  c n= = √ = ˜r (f )μ ˜ r (f ) (2.46) v 0 μ0 Notons également à ce stade que cette relation ne démontre pas que l’indice de réfraction est supérieur à l’unité, ou que la vitesse de phase est inférieure à c. Ce point sera précisé quand nous introduirons la vitesse de groupe au chapitre 3.

2.5.3 Longueur d’onde Si on fige maintenant le temps dans la relation (2.43), la période spatiale des variations de phase, notée λ et appelée longueur d’onde, est définie par : λ=

2π k

(2.47)

En utilisant les relations (2.45) et (2.46), il est possible de transformer l’équation de définition précédente en : λ=

2πv c 1 2π 1 λ0 = 2π = = ω ωn k0 n n

(2.48)

39

De l’Optique électromagnétique à l’Interférométrie

où λ0 et k0 désignent respectivement la longueur d’onde et le module du vecteur d’onde dans le vide, à la même fréquence f .

2.6 Milieux absorbants 2.6.1 Cas général Les notions introduites au paragraphe précédent ont toutes été définies dans l’hypothèse des milieux transparents, c’est-à-dire ceux pour lesquels ˜ (f ) et μ(f ˜ ) sont réels. Cette hypothèse n’est évidemment acceptable que dans une certaine plage de fréquences, parce que dispersion et absorption sont des phénomènes intrinsèquement liés, et que seule la matière parfaite (dont la réaction à l’excitation est instantanée) peut être non dispersive, du moins en l’absence de courants photo-induits. Cette propriété résulte du principe de causalité et s’illustre directement au travers des relations de Kramers-Kronig évoquées au chapitre précédent et sur lesquelles nous serons amenés à revenir dans la suite de cet ouvrage. Plaçons-nous maintenant dans le cas de milieux absorbants dans un certain domaine fréquentiel. La grandeur k est alors un complexe, mais on peut effectuer un raisonnement similaire à celui que nous venons de détailler, en notant que l’exponentielle complexe introduite au paragraphe 2.4 se décline alors comme : 

  · ρ i(β  · ρ −ωt )

e i(β ·ρ −ωt ) = e −β

e

(2.49)

où nous avons posé : β = β  + i β  , avec β · β = k 2 ∈ C. On voit donc ici que les surfaces équi-phases et équi-amplitudes se dissocient puisqu’elles sont désormais pilotées par les parties réelle et imaginaire du vecteur d’onde. Du point de vue de l’amplitude, l’onde s’amortit du fait de la présence de l’exponentielle réelle en exp (− β  · ρ ). Par ailleurs, les surfaces équi-phases peuvent être utilisées comme précédemment (c’est-à-dire dans le cas des milieux transparents) pour retrouver la notion de vitesse de phase, qui est cette fois-ci donnée par : v=

ω |β  |

(2.50)

On peut aller plus loin dans l’expression de cette dernière grandeur. Commençons par définir un indice complexe n à l’aide de la relation habituelle : k = k0 n √ où k0 = ω 0 μ0 est un réel.

40

(2.51)

2. Régime harmonique

Si l’on suppose que la propagation (et l’atténuation) se fait parallèlement à l’axe z , alors on peut écrire : β = β z



β · β = β 2 = k 2



β=k

(2.52)

et donc : |β  | = |β  | = k  = k0 n 

avec n  = [n]



v=

ω c =  k0 n  n

(2.53)

Ainsi la vitesse de phase garde la même expression qu’en milieu transparent, à condition de considérer la partie réelle de l’indice complexe défini par la relation (2.51). On notera que cet indice complexe peut encore s’écrire comme :   k = k0 n = k0 ˜r μ ˜ r ⇒ n = ˜r μ ˜r (2.54) soit, en introduisant les susceptibilités électrique et magnétique :  ˜r = 1 + χ˜ e et μ ˜ r = 1 + χ˜ h ⇒ n = (1 + χ˜ e )(1 + χ˜ h )

(2.55)

Cette dernière relation ne permet toujours pas de démontrer que la partie réelle de l’indice complexe est supérieure à l’unité ou que la vitesse de phase est majorée par c. Le résultat va en effet dépendre des paramètres de susceptibilité qui sont inhérents à la structure microscopique de la matière. Nous verrons qu’il n’y a pas là de paradoxe dans la mesure où c’est la vitesse de groupe (et non de phase) qui caractérise le transport d’énergie lumineuse. On notera que, dans un souci de simplification, nous avons supposé β parallèle à z . Dans le cas général, le module |β  | de la partie réelle du vecteur d’onde devra être recherché à partir de :  β  · β  − β  · β  = k 2 − k 2 2 β · β = k ⇒ (2.56) β  · β  = k  k 

2.6.2 Cas spécifique des métaux Les métaux constituent un cas particulier des milieux absorbants. Nous allons maintenant voir pourquoi la partie imaginaire de leur indice de réfraction est généralement élevée. Jusqu’ici nous n’avons considéré, dans les équations de Maxwell, que des sources imposées, c’est-à-dire des sources indépendantes du champ électromagnétique. Toutefois, dans de nombreuses situations, et notamment dans le cas des métaux, il apparaît un courant photo-induit qui n’existe pas en l’absence de champ électromagnétique (l’aspect microscopique des charges en déplacement sera illustré au chapitre 7).

41

De l’Optique électromagnétique à l’Interférométrie

On conservera ici une approche macroscopique qui consiste, dans le régime spatiotemporel, à relier le courant induit à l’excitation qui l’a créé, et l’on supposera vérifiée la loi d’Ohm que l’on écrit sous la forme : J = γ  E

(2.57)

t

où la convolution porte sur le temps. On retrouve ainsi une expression analogue à celle trouvée pour la polarisation de la matière au chapitre 1. On notera que la fonction conductivité γ (t ) est à nouveau causale. Après transformation de Fourier temporelle, on obtient en régime harmonique :

J ( ρ , f ) = γ˜ (f ) E( ρ, f )

(2.58)

de sorte que la deuxième équation de Maxwell prend la forme modifiée suivante :  γ˜ (f )  − →  ρ , f ) = −i ω ˜ (f ) + i E ( ρ , t ) = −i ω˜eq (f )E( ρ, t ) (2.59) rotH( ω Ainsi, dans le cas de métaux, les équations de Maxwell ne sont pas modifiées à condition d’utiliser une permittivité complexe ˜eq (f ) définie par la relation : ˜eq (f ) = ˜ (f ) + i

γ˜ (f ) ω

(2.60)

Cette dernière relation explique la permittivité imaginaire élevée des métaux, par comparaison avec celle des diélectriques absorbants.On peut aussi remarquer que, dans le cas des métaux et contrairement à ce que nous avons vu jusqu’ici, l’absence d’inertie de la matière n’implique pas l’absence de pertes ou de dispersion. En effet, une conductivité γ régulière ou singulière (de type Dirac) crée toujours une partie imaginaire dans la permittivité équivalente, et cette partie imaginaire a un comportement dispersif du fait de la présence du terme en 1/ω. Il y a donc lieu, en général, de préciser la nature de la dispersion (diélectrique ou métallique).

2.7 Trièdre direct Nous souhaitons rappeler ici la structure du champ électromagnétique et introduire à cette occasion la notion de trièdre direct. Ceci nous permettra ensuite de définir l’état de polarisation de la lumière. Considérons une onde plane monochromatique se propageant en espace libre avec le vecteur d’onde β à l’intérieur d’un milieu matériel isotrope. L’équation de propagation harmonique nous a permis de montrer que le champ électrique de cette composante élémentaire était de la forme :  E( ρ , f ) = A(f )e i β ·ρ

42

(2.61)

2. Régime harmonique

Introduisons maintenant cette expression dans la première équation de Maxwell harmonique : − →E(  ( rot ρ , f ) = i ω μ(f ˜ )H ρ, f ) ρ , f ), soit : en tenant compte de la forme particulière du vecteur E(

et donc :

−−→   →  − →E( rotA(f ) + grad[e i β ·ρ ] ∧ A(f ) rot ρ , f ) = e i β ·ρ −

(2.62)

 − →E( rot ρ , f ) = 0 + i β ∧ A(f )e i β ·ρ = i β ∧ E( ρ, f )

(2.63)

En conséquence, nous en déduisons que :  ( H ρ, f ) =

1 ρ, f ) β ∧ E( ωμ(f ˜ )

(2.64)

De la même manière, la deuxième équation de Maxwell nous donne, en l’absence de source : − →H  ( rot ρ , f ) = −i ω ˜ (f )E( ρ , f ) ⇒ E( ρ, f ) = −

1  ( ρ, f ) β ∧ H ω˜ (f )

(2.65)

Dans le cas d’un milieu transparent (β ∈ R3 ), ces relations montrent que les vecteurs  forment un trièdre direct. β , E et H En conclusion, dans le cas d’une onde plane qui se propage dans un milieu isotrope et transparent, les champs électriques et magnétiques vibrent dans un plan perpendiculaire au vecteur d’onde et restent mutuellement orthogonaux au cours de ces vibrations.

2.8 État de polarisation de la lumière On se place dans le cas simple où la composante fréquentielle du champ se réduit à une onde plane à la fréquence f se propageant dans la direction définie par le vecteur β (β ∈ R3 ), soit :  E( ρ , f ) = A(f ) e i β ·ρ Nous venons de montrer que, dans un milieu isotrope et transparent, ce champ E est perpendiculaire au vecteur β et peut donc être décomposé dans un repère Ouvw associé au plan perpendiculaire à ce vecteur, avec Ow parallèle à β . Dans ce repère, nous pouvons écrire :  Eu (ρ, f ) = Au (f )e iβρ (2.66) Ev (ρ, f ) = Av (f )e iβρ

43

De l’Optique électromagnétique à l’Interférométrie

Pour remonter à la dépendance temporelle, il suffit d’utiliser la relation (2.32) en prenant en compte le caractère monochromatique de l’onde considérée :   ⎧ ⎨ Eu (ρ, t ) = 2 Au (f )e i(βρ−ωt ) = 2|Au | cos (βρ − ωt + φu )   (2.67) ⎩ E (ρ, t ) = 2 A (f )e i(βρ−ωt ) = 2|A | cos (βρ − ωt + φ ) v v v v où l’on a volontairement omis, dans les termes de droite, d’indiquer les dépendances en fréquence des quantités β , |Au |, |Av |, φu et φv . Observons maintenant l’angle γ que forme ce champ E avec l’axe Ou dans le plan Ouv. On a : Ev |Av | cos (βρ − ωt + φv ) tan γ = = (2.68) Eu |Au | cos (βρ − ωt + φu ) Cette relation montre que l’angle γ n’est pas constant dans le cas général et donc que la direction du champ varie au cours du temps. On montre que la vitesse de rotation de cette direction est proportionnelle à la pulsation ω et s’écrit : |A v | dγ = −ω sin (φv − φu ) dt |A u |

(2.69)

On constate que cette vitesse s’annule lorsque les phases sont identiques sur les deux axes (φu = φv ), condition pour laquelle le rapport Ev /Eu est effectivement constant. Dans ce cas particulier, on dit que la lumière est polarisée linéairement ou qu’elle présente une polarisation rectiligne. Dans le cas général, la polarisation sera en fait de nature elliptique, mais nous reviendrons en détail sur ce point au chapitre 9. On retiendra ici que la vitesse de rotation est de l’ordre de 1014 rad/s pour souligner la complexité de la nature vectorielle de la lumière (le trièdre reste direct au cours du temps).

2.9 Absorption, flux et énergie On s’intéresse ici au bilan d’énergie en régime harmonique. Le cas du régime général (spatio-temporel) sera abordé au chapitre 4. La puissance optique étant fournie par des sources, on fera l’hypothèse de la présence de densités de courant vectorielles J ( ρ , f ) et de charges scalaires Q( ρ , f ) dans les équations de Maxwell. On désignera par  le volume à l’intérieur duquel ces sources se trouvent localisées, par  la surface fermée limitant ce volume et par n la normale locale à cette surface , dirigée vers l’extérieur. Dans tout ce qui suit, de manière à alléger les écritures, nous omettrons de rappeler à chaque fois les variables dont dépendent chacune des grandeurs considérées, qu’elles soient scalaires ou vectorielles.

44

2. Régime harmonique

Les deux premières équations de Maxwell s’écrivent donc, en régime harmonique : − →E = i ω μ  ˜H rot (2.70) − →  = −i ω ˜ E + J rotH  appelé vecteur de Poynting et défini par la relation : Considérons le vecteur  )  = 1 (E∗ ∧ H (2.71)  2 où, comme précédemment indiqué, la notation astérisque désigne la conjugaison au sens des nombres complexes. Calculons à présent la divergence de ce vecteur de Poynting : 1 →E∗ − 1 E∗ · − →H ) = 1H   ·−  = div(E∗ ∧ H div rot rot 2 2 2 i  |2 + i ω˜ |E|2 − 1 J · E∗ ˜ ∗ |H = − ωμ (2.72) 2 2 2 On se place maintenant dans le cas général d’un milieu absorbant et l’on pose : ˜ = ˜  + i ˜ 

μ ˜ =μ ˜  + iμ ˜ 

(2.73)

ce qui permet d’exprimer la partie réelle de la divergence du vecteur de Poynting sous la forme suivante : 1   2 1 1  = − ω˜  |E|2 − ωμ ˜ |H| − [J · E∗ ] [div] 2 2 2

(2.74)

Si nous intégrons maintenant cette relation sur le volume  à l’intérieur duquel les sources se trouvent localisées, il vient :



1   2  dV = − [div] ω˜ |E | dV 2 



1   2 1 − (2.75) ωμ ˜ |H| dV − [J · E∗ ]dV  2  2 En appliquant le théorème de Green-Ostrogradsky au premier membre de cette relation et en réarrangeant légèrement sa structure, nous obtenons enfin :



1 ∗    · n ] dS − [ [J · E ]dV =  2 

 1   2 1   2 + (2.76) ω˜ |E | + ωμ ˜ |H| dV 2  2 Cette dernière équation peut s’écrire sous la forme synthétique suivante : F =+A

(2.77)

45

De l’Optique électromagnétique à l’Interférométrie



où F =−



1 [J · E∗ ]dV 2

(2.78)

désigne la puissance optique fournie par les sources contenues dans le domaine ,

 · n ] dS = [ (2.79) 

la puissance qui s’échappe par rayonnement (le flux ) au travers de la surface fermée , et

 1   2 1   2 A= (2.80) ω˜ |E | + ωμ ˜ |H| dV 2  2 la quantité de lumière absorbée dans le volume  sous forme électrique et magnétique. Les relations (2.76) et (2.77) ne font donc que traduire le principe très général de conservation de l’énergie en régime harmonique. Il est également utile d’introduire à ce niveau les densités définies par : 1 dF = − [J · E∗ ], densité volumique de puissance dV 2 d  · n ], densité surfacique de flux = [ dS  dA 1   |2 , densité volumique d’absorption ˜  |H = ω ˜  |E|2 + μ dV 2

(2.81)

tout en remarquant que ces grandeurs sont des fonctions locales, contrairement aux grandeurs F ,  et A, qui expriment un bilan d’énergie dans un volume  particulier. On retiendra également que ce bilan d’énergie est établi pour une onde monochromatique, sans préjuger de sa répartition spatiale. Dans le cas d’une onde unidirectionnelle et progressive en espace libre non absorbant, le vecteur de Poynting peut être développé plus avant à partir des relations du trièdre direct :   1 ∗ 1 1 2  =  (2.82) E ∧[ (β ∧ E)] = |E | β 2 ωμ ˜ 2ωμ ˜ En conséquence, la densité surfacique de flux à travers une surface perpendiculaire à la direction de propagation s’écrit : d n β 2 |E|2 = |E | = dS 2ωμ ˜ 2η0 μr

(2.83)

√ où η0 = μ0 /0 désigne l’impédance du vide. Nous verrons au chapitre 4 comment relier ces notions à celle d’éclairement, d’intensité ou de luminance.

46

2. Régime harmonique

2.10 Équation de propagation harmonique avec terme source Contrairement à la démarche suivie au chapitre 1 où nous avions considéré la solution particulière de l’équation de Poisson donnée par la fonction de Green associée, dans le cas du régime harmonique nous nous sommes pour l’instant limités à l’étude de la solution homogène de l’équation d’Helmholtz, parce que les sources étaient toutes placées à l’infini dans un milieu transparent. Cette procédure nous a permis de mettre en évidence la forme analytique des champs se propageant en espace libre et loin de ces sources. Cependant, il est utile, notamment pour des études en champ proche, de connaître la solution particulière de l’équation d’onde harmonique en présence d’un terme source S( ρ , f ), soit : ρ , f ) + k 2 E( ρ , f ) = S( ρ, f ) E( −−→ ρ , f ) + grad = −i ωμ ˜ J (



1 Q( ρ, f ) ˜ (f )

(2.84)

dont la solution générale est donnée par :

E( ρ , f ) = [G  S]( ρ, f )

(2.85)

où la convolution porte sur la variable d’espace ρ et où la fonction de Green associée G ( ρ ) doit vérifier : ρ ) = δ( ρ) (2.86) G ( ρ ) + k 2 G ( On montre que cette fonction de Green a pour expression : G ( ρ) = −



1 e i β ·ρ 4π |ρ|

avec β · β = k 2

(2.87)

Cette dernière relation pourra être utile pour traiter du cas de sources volumiques en régime harmonique, ou pour aborder la notion de point source ou d’onde sphérique.

2.11 Équations de Maxwell au sens des distributions Il est important de clôturer ce chapitre en revenant sur la notion de distribution. Dans tout problème d’optique électromagnétique, la forme analytique du champ s’exprime comme une combinaison linéaire des solutions homogènes (i.e. sans terme source) et particulière de l’équation de propagation. La solution particulière étant parfaitement définie (souvent comme le terme source convolué à la fonction de Green associée), ce sont donc les constantes (inconnues) qui apparaissent dans les solutions homogènes qu’il convient de déterminer. Cette détermination s’effectue à partir des

47

De l’Optique électromagnétique à l’Interférométrie

relations de passage, et c’est pourquoi les discontinuités du champ électromagnétique sont souvent qualifiées de sources de ce champ. Un moyen mnémotechnique pour retenir ces relations de passage consiste à considérer que les équations de Maxwell, jusqu’ici écrites au sens des fonctions, restent vraies au sens des distributions. Ces équations aux distributions s’écrivent, en régime harmonique et en présence de sources, sous la forme habituelle : ⎧− →E(  (  ( ρ , f ) = i ωμ(f ˜ )H ρ, f ) + M ρ, f ) rot ⎪ ⎪ ⎪− ⎪ →H ⎨ rot  ( ρ , f ) = −i ω˜ (f )E( ρ , f ) + J ( ρ, f ) ⎪ ρ , f )] = Q( ρ, f ) div[˜ (f )E( ⎪ ⎪ ⎪ ⎩  ρ , f )] = P ( ρ, f ) div[μ(f ˜ )H(

(2.88)

mais où l’on a fait apparaître, afin que le problème soit le plus général possible, des  , ainsi que des charges électriques Q et courants électriques J et magnétiques M magnétiques P . Ces distributions de courants et de charges peuvent être réelles ou fictives (c’est-à-dire résultant d’une opération mathématique). Pour conserver la plus grande généralité à ce problème, il nous faut donc considérer que ces grandeurs possèdent des parties régulières (en relation avec des fonctions), mais aussi singulières (du type impulsion de Dirac ou limites de fonctions), selon que l’on peut ou non leur associer des fonctions usuelles. Ainsi on écrira, dans le cas où les discontinuités ont lieu sur une surface S : ⎧  R +M  S δS M=M ⎪ ⎪ ⎪ ⎨  J = JR + JS δS (2.89) ⎪ Q = QR + QS δS ⎪ ⎪ ⎩ P = PR + PS δS Analysons maintenant ce que deviennent les relations de passage quand on développe ces équations au sens des distributions. On obtient pour la première équation : →E) + n ∧ σ [E] · δ = i ωμ − →E = (−  +M R +M  S δS rot ˜H rot S

(2.90)

où σ [E] désigne la discontinuité du vecteur E à la traversée de la surface S, et où →E)] est appelé dérivée sans précaution de ce champ le terme entre parenthèses [(− rot et correspond à une dérivation au sens des fonctions, alors que le terme portant la discontinuité (le saut ) est une distribution surfacique de Dirac. Cette distribution a pour support la surface S de discontinuité du champ, de normale n . Cela nous donne tout d’abord, en identifiant les parties régulières des distributions, une équation identique à celle utilisée jusqu’alors au sens des fonctions : →E) = i ωμ  +M R (− rot ˜H

48

(2.91)

2. Régime harmonique

On obtient en outre, en identifiant les parties singulières :  S δS n ∧ σ [E] · δS = M



S n ∧ σ [E] = M

(2.92)

ce qui indique que toute discontinuité de la composante tangentielle du champ électrique traduit la présence d’un courant magnétique de surface. La même procédure peut être évidemment appliquée aux trois autres équations de Maxwell. Dans tous les cas, les parties régulières conduisent aux mêmes équations que celles déjà établies au sens des fonctions. Quant aux parties singulières, elles : permettent d’exprimer les discontinuités des vecteurs E et H • pour la composante tangentielle du champ magnétique − →H →H  = (−  ) + n ∧ σ [H  ] · δS = −i ω˜ E + JR + JS δS rot rot  ] = JS ⇒ n ∧ σ [H

(2.93)

• pour la composante normale du champ électrique : div[˜ E] = (div[˜ E]) + n · σ [˜ E] · δS = QR + QS δS ⇒ n · σ [˜ E] = QS

(2.94)

• et pour la composante normale du champ magnétique :  ]) + n · σ [μ  ] · δS = PR + PS δS  ] = (div[μ ˜H ˜H div[μ ˜H  ] = PS ⇒ n · σ [μ ˜H

(2.95)

On retiendra qu’en l’absence de sources singulières (portées par une distribution  sont continues, et il surfacique), les composantes tangentielles des champs E et H   ˜ H. On remarquera que en est de même pour les composantes normales de ˜ E et μ les courants singuliers (surfaciques) sont tangentiels à la surface S de discontinuité. On notera également, d’une autre façon, que les sources volumiques, électriques ou magnétiques, ne créent pas de discontinuité sur les composantes tangentielles des champs. Enfin, dans le cas (fréquent) de milieux optiques non magnétiques et non chargés, le champ magnétique est continu, ainsi que la composante tangentielle du champ électrique. Pour conclure, l’écriture des équations de Maxwell au sens des distributions donne immédiatement accès aux relations de discontinuité. On remarquera également que  sont identiques d’un point de vue mathéles équations régissant les champs E et H matique, à condition que permittivité et perméabilité revêtent des comportements adéquats (˜ = −μ), ˜ et que les sources électriques et magnétiques soient identiques (au signe près pour la charge).

49

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Paquet d’ondes fréquentiel Chapitre conçu par Claude Amra et Michel Lequime rédigé par Michel Lequime et Claude Amra

Sommaire 3.1 3.2

3.3

3.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Largeur de raie et durée d’impulsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Impulsion lumineuse à profil temporel gaussien . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Bilan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vitesse de groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Barycentre d’une impulsion à profil temporel quelconque . . . . . . . . . . . . . . . . 3.3.2 Vitesse de propagation du barycentre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Propagation d’une impulsion gaussienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2 Milieu non dispersif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.3 Milieu à dispersion linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Milieu à dispersion quadratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.5 Transmission d’une information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52 53 53 56 59 60 60 61 64 64 65 65 66 68

51

De l’Optique électromagnétique à l’Interférométrie

3.1 Introduction Depuis son invention en 1960, le laser (Light Amplification by Stimulated Emission of Radiation) a connu un développement si extraordinaire qu’il a aujourd’hui envahi notre quotidien au travers d’objets aussi variés que les lecteurs de code-barres, les imprimantes, les systèmes de télécommunications guidées à haut débit, les lecteurs de CD, DVD et Blu-ray, les niveaux optiques, les mesureurs de distances et de vitesses, etc. Dans l’inconscient collectif, ce laser est assimilé à un fin faisceau directif et monochromatique, ce qui est loin d’être faux, mais demande à être étayé de manière plus scientifique. Retenons pour l’instant qu’en régime continu, c’est-à-dire pour une puissance moyenne constante au cours du temps, la plupart de ces sources peuvent être assimilées à une onde monochromatique, du type de celles précédemment étudiées en régime harmonique. À titre d’exemple, les lasers He-Ne courants délivrent une puissance de quelques milliwatts, sur quelques raies situées dans le spectre visible et présentant une largeur de raie de l’ordre du picomètre. Il existe cependant un grand nombre de sources lasers impulsionnelles, dont le mode de fonctionnement conduit à ce qu’elles délivrent une énergie lumineuse W pendant un temps caractéristique t . La puissance crête de l’impulsion lumineuse ainsi émise sera définie en ordre de grandeur par la relation : P 

W t

(3.1)

Différents modes de fonctionnement peuvent être envisagés pour ces lasers impulsionnels, conduisant à des caractéristiques de durées d’impulsion extrêmement variées : • fonctionnement relaxé, tout d’abord, où le pompage du milieu amplificateur est réalisé de manière continue, les impulsions émises étant associées à des oscillations de relaxation de ce milieu amplificateur. Les durées d’impulsion sont très variables et comprises entre quelques microsecondes et une centaine de millisecondes ; • fonctionnement déclenché ensuite, où l’énergie stockée dans la cavité optique est brutalement convertie sous forme lumineuse, la durée des impulsions ainsi obtenues étant comprise entre quelques nanosecondes et quelques centaines de nanosecondes ; • fonctionnement en modes bloqués enfin, dans lequel on parvient à verrouiller en phase les différents modes susceptibles d’osciller dans la cavité amplificatrice, cette méthode conduisant aux durées d’impulsions les plus courtes, comprises entre 10 femtosecondes et une centaine de picosecondes1 . Si l’on suppose, pour fixer les idées, que l’énergie W émise par impulsion est de l’ordre du millijoule, cela signifie que la puissance crête atteinte par une impulsion de 10 femtosecondes de durée approchera la centaine de gigawatts ! 1

52

1 nanoseconde = 10−9 s ; 1 picoseconde = 10−12 s ; 1 femtoseconde = 10−15 s.

3. Paquet d’ondes fréquentiel

Mais il nous est aussi possible de focaliser ce faisceau avec une optique de caractéristiques appropriées sur des dimensions transverses de l’ordre de la longueur d’onde et de générer ainsi un spot lumineux d’une extrême brillance. En effet, la densité surfacique de puissance (ou éclairement) que l’on est alors capable d’atteindre sera de l’ordre de P /λ2 , soit, dans notre exemple, près de 15 exawatts par centimètre carré2 ! Ces densités d’énergie réellement considérables peuvent être mises à profit pour réaliser, par le seul biais de la lumière, des actions importantes sur la matière (telles que perçage, découpe, soudure), mais ont aussi conduit au lancement de projets scientifiques de grande ampleur, comme : • la fusion thermonucléaire par confinement inertiel (LMJ - Laser MégaJoule en France, NIF - National Ignition Facility aux États-Unis), où 240 faisceaux lasers à la longueur d’onde de 351 nm sont focalisés de manière isotrope sur une cible de 2 mm de diamètre contenant un mélange de deutérium et de tritium. L’absorption par cette cible des 1,8 mégajoule déposés par les lasers en 20 nanosecondes vont porter la température et la pression internes de celle-ci à près de 200 millions de degrés Kelvin et quelques terabars. • la création de particules élémentaires par simple focalisation dans le vide d’un faisceau laser de très forte puissance, que l’on peut voir ici comme l’une des conséquences de l’équivalence masse-énergie établie par Einstein. Ceci constitue l’objectif ultime du projet européen ELI (Extreme Light Infrastructure ), qui vise également à produire des impulsions ultra-courtes de particules de haute énergie telles que photons, électrons, protons, neutrons ou neutrinos, ou à développer des nouveaux procédés de radiothérapie ou d’imagerie médicale. Toutefois, deux questions se posent alors : une onde lumineuse caractérisée par de telles durées d’impulsion (50 fs par exemple) peut-elle encore être considérée comme monochromatique ? et comment la traversée d’un milieu matériel est-elle susceptible d’affecter les propriétés temporelles de ces impulsions ultra-courtes ? C’est à ces deux questions que nous allons maintenant tenter de répondre.

3.2 Largeur de raie et durée d’impulsion 3.2.1 Cas général En un point ρ 0 de l’espace arbitrairement choisi comme origine, on considère une impulsion lumineuse de durée t et de pulsation moyenne ω0 . Dans un souci de simplification, on ne s’intéressera qu’à une composante algébrique du champ associé projeté sur l’un des axes de polarisation. Cette composante peut alors être mise sous la forme suivante : E ( ρ0 , t ) = A0 (t ) cos ω0 t (3.2) 2

1 exawatt = 1018 watts.

53

De l’Optique électromagnétique à l’Interférométrie

où l’on supposera que A0 (t ) est une fonction qui présente une variation lente sur une durée caractéristique tc correspondant à la période d’oscillation de la porteuse (tc = 2π/ω0 ). En d’autres termes, A0 (t ) correspond à l’enveloppe du signal harmonique cos ω0 t , à l’intérieur de laquelle le signal oscille à la pulsation ω0 . Le spectre en fréquence de cette impulsion lumineuse peut être déterminé en calculant la transformée de Fourier de son profil temporel soit :  +∞  +∞ E ( ρ0 , f ) = E ( ρ0 , t )e 2iπ ft dt = A0 (t ) cos ω0 t e 2iπ ft dt (3.3) −∞

−∞

On remplace ici la pulsation ω0 par 2πf0 , puis on exprime le cosinus comme une demi-somme d’exponentielles imaginaires complexes conjuguées l’une de l’autre, soit :   +∞  +∞ 1 2iπ(f −f0 )t 2iπ(f +f0 )t E ( ρ0 , f ) = A0 (t ) e dt + A0 (t ) e dt 2 −∞ −∞ 1 = [A˜ 0 (f − f0 ) + A˜ 0 (f + f0 )] (3.4) 2 où A˜ 0 (f ) désigne la transformée de Fourier de la fonction enveloppe A0 (t ). La présence de ces deux transformées de Fourier identiques, l’une centrée en f0 et l’autre en −f0 est une illustration de la symétrie hermitienne de la composante fréquentielle mise en avant au paragraphe 2.3 à l’occasion de la description du mécanisme de reconstruction temporelle. Dans l’équation qui décrit ce mécanisme [relation (2.32)], l’intégration pourra n’être réalisée que sur les valeurs positives des fréquences :  +∞    E ( ρ0 , t ) = 2  E( ρ0 , f )e −2iπ ft df 0

ρ0 , f ) dans de sorte qu’il suffira de nous intéresser au comportement de la fonction E ( ce seul domaine et, en particulier, à celui du support de la fonction A˜ 0 (f ) autour de la fréquence moyenne f0 , support que nous désignerons désormais sous l’appellation de largeur de raie. Il peut être utile de signaler à ce propos qu’une autre façon de s’affranchir (pour les calculs) de la partie du spectre correspondant aux fréquences négatives consiste à introduire la notion de signal analytique , dont le spectre ne contient que les fréquences positives du signal E ( ρ0 , t ). Nous serons conduits à revenir sur ce point particulier au chapitre 6. Avant de poursuivre, il est nécessaire de définir de manière plus rigoureuse les deux notions que nous venons d’introduire de manière qualitative, à savoir celles de

54

3. Paquet d’ondes fréquentiel

durée d’impulsion t et de largeur de raie f . On pose :  +∞  +∞ t 2 |A0 (t )|2 dt f 2 |A˜ 0 (f )|2 df −∞ −∞ et (f )2 =  +∞ (t )2 =  +∞ 2 |A0 (t )| dt |A˜ 0 (f )|2 df −∞

(3.5)

−∞

Considérons l’intégrale qui figure au numérateur de l’expression définissant la largeur de raie f . Elle s’écrit encore comme :  +∞  +∞ 1 f 2 |A˜ 0 (f )|2 df = |2i πf A˜ 0 (f )|2 df (3.6) 4π 2 −∞ −∞ puis, en utilisant à la fois la définition de la transformée de Fourier de la dérivée d’une fonction et le théorème de Parseval :   +∞   +∞  dA0 2 2   |2i πf A˜ 0 (f )| df = (3.7)  dt  dt −∞ −∞ On en déduit aussitôt, en appliquant ce même théorème de Parseval au dénominateur de l’expression définissant la largeur de raie :  (f )2 =

2    0  dt  dt 

+∞  dA

1 −∞  4π 2 +∞ −∞

(3.8)

|A0 (t )|2 dt

Formons maintenant le produit (t )2 (f )2 , produit que l’on désigne souvent sous l’appellation anglaise de Time-Bandwidth Product :  (t )2 (f )2 =

+∞

 2

2

2    0  dt  dt 

+∞  dA

t |A0 (t )| dt 1 −∞ −∞  +∞  +∞ 4π 2 |A0 (t )|2 dt |A0 (t )|2 dt −∞

(3.9)

−∞

En faisant appel à l’inégalité de Cauchy-Schwarz, nous pouvons écrire : 2  +∞   +∞  +∞  ∗   dA0 2  dA 2 2 0    tA0 (t ) t |A0 (t )| dt (3.10) dt  ≤  dt  dt  dt −∞ −∞ −∞ ce qui nous permet de définir un minorant du numérateur N de la relation (3.9). En utilisant maintenant le fait que la fonction enveloppe A0 (t ) est réelle, nous pouvons

55

De l’Optique électromagnétique à l’Interférométrie

écrire :  N ≥

+∞

−∞

dA ∗ tA0 (t ) 0 dt dt

2

  +∞

2 1 d 2 = t A (t ) dt 2 −∞ dt 0

(3.11)

La dernière intégrale figurant dans la relation (3.11) peut être calculée en utilisant une intégration par parties, soit :

  1 +∞ 1  2 +∞ 1 +∞ 2 d 2 t A (t ) dt A (t ) dt = tA0 (t ) −∞ − 2 −∞ dt 0 2 2 −∞ 0  1 +∞ 2 A (t ) dt (3.12) =− 2 −∞ 0 la valeur nulle du premier terme de l’intégration par parties étant directement liée au caractère fini de la durée de l’impulsion considérée, et donc de sa forte décroissance à l’infini. En reportant ce résultat dans les relations (3.9) et (3.10), nous obtenons enfin : 1 16π 2

(t )2 (f )2 ≥

(3.13)

ce qui peut également s’écrire : t f ≥

1 4π

ou

t ω ≥

1 2

ou encore

λ 1 ≥ λ2 4πc t

(3.14)

Ceci montre que la largeur de raie d’une impulsion lumineuse sera d’autant plus grande que sa durée sera courte. À titre d’illustration, une impulsion de 40 fs centrée autour de la fréquence centrale f0 de 375 THz (soit λ0 = 800 nm) aura une largeur de raie f d’au moins 20 THz (soit λ > 40 nm).

3.2.2 Impulsion lumineuse à profil temporel gaussien On se place maintenant dans le cas particulier où l’enveloppe temporelle de l’impulsion est représentée par une gaussienne. Par conséquent : A0 (t ) = A0 e





 t −t0 2 τ

(3.15)

où τ désigne la demi-largeur temporelle de l’impulsion à 1/e . Grâce à un changement de l’origine des temps, l’expression précédente pourra être mise sous la forme : A0 (t ) = A0 e −

56

 t 2 τ

(3.16)

3. Paquet d’ondes fréquentiel

3.2.2.1 Calcul de la durée d’impulsion En utilisant le formalisme introduit au paragraphe 3.2.1, nous pouvons calculer la durée t de cette impulsion :  +∞  +∞  t 2 2 2 t A0 (t ) dt t 2 e −2 τ dt = −∞+∞ (3.17) (t )2 = −∞+∞  t 2 A02 (t ) dt e −2 τ dt −∞

−∞

Commençons par calculer la dérivée de la fonction F (t ) = exp[−2(t /τ )2 ], soit : 4 d F (t ) = − 2 t F (t ) dt τ

(3.18)

Par conséquent, le numérateur de l’expression (3.17) peut être mis sous la forme :  +∞   2 τ 2 +∞ d 2 −2 τt t e dt = − t [F (t )] dt 4 −∞ dt −∞  τ 2  −2 t 2 +∞ τ 2 +∞ −2 t 2 τ (3.19) + e τ dt te =− −∞ 4 4 −∞  τ 2 +∞ −2 t 2 e τ dt = 4 −∞ En reportant ce résultat dans l’expression (3.17), il vient aussitôt : t =

τ 2

(3.20)

3.2.2.2 Calcul de la largeur spectrale Pour déterminer maintenant la largeur de raie associée à une telle impulsion, il nous ˜ ) de la fonction enveloppe faut tout d’abord calculer la transformée de Fourier A(f A(t ). Nous allons utiliser pour ce faire le procédé mnémotechnique mentionné au paragraphe A.2.5.2 et qui permet de calculer, dans le cas général, la transformée de Fourier d’une gaussienne : π 2 TF 1 − f −πat e −→ √ e a a

2

Une simple identification nous conduit ici à : 1/a = πτ 2 , et donc à la relation recherchée :  +∞ √ t 2 2 2 2 ˜A0 (f ) = A0 e −( τ ) e 2iπ ft dt = A0 τ π e −π τ f (3.21) −∞

57

De l’Optique électromagnétique à l’Interférométrie

Il nous reste à calculer cette largeur de raie f en appliquant la formule générale donnée en (3.5), soit ici :  +∞  +∞ 2 2 2 2 ˜ 2 f |A0 (f )| df f 2 e −2π τ f df −∞ −∞ (f )2 =  =  (3.22) +∞ +∞ 2τ 2 f 2 2 −2π |A˜ 0 (f )| df e df −∞

−∞

puis en adoptant une démarche en tout point similaire à celle utilisée pour le calcul de la durée d’impulsion t . On montre aisément que : f =

1 2πτ

(3.23)

3.2.2.3 Calcul du produit durée d’impulsion - largeur de raie Le Time-Badwidth Product a donc ici pour valeur : t f =

τ 1 1 = 2 2πτ 4π

(3.24)

et correspond donc à la valeur minimale imposée par l’existence d’une relation de type transformation de Fourier entre ces deux quantités. Cette propriété constitue une particularité importante des impulsions à profil gaussien. Nous avons représenté à la figure 3.1 le profil temporel d’une telle impulsion lumineuse pour laquelle le paramètre τ a été pris égal à 40 fs et que nous avons supposée centrée à 800 nm (graphe du haut), ainsi que son spectre en fréquence (graphe du bas), qui présente, bien évidemment, la symétrie hermitienne dont nous avons déjà souligné le caractère générique. On est souvent conduit à considérer une définition alternative du produit duréelargeur de raie, dans laquelle chacun des deux paramètres est pris égal à la largeur totale à mi-hauteur du profil correspondant. Cette largeur totale à mi-hauteur est habituellement désignée par l’acronyme du terme anglais qui lui correspond, à savoir FWHM, pour Full-Width at Half-Maximum. Dans le cas particulier de l’impulsion à profil temporel gaussien, il est facile de calculer la valeur prise par ces deux largeurs FWHM : √ √ 2 ln 2 (t )FWHM = 2τ ln 2 et (f )FWHM = (3.25) πτ puis de former le produit durée d’impulsion – largeur de raie qui leur est associé, soit : 4 ln 2  0,88 (3.26) (t )FWHM(f )FWHM = π

58

3. Paquet d’ondes fréquentiel

1,2 0,8 0,4 0,0 -0,4 -0,8 -1,2 -60

-40

-20

0

20

40

60

t (fs) 1,2 1,0 0,8 0,6 0,4 0,2 0,0 -500

-400

-300

-200

-100

0

100

200

300

400

500

f (THz)

Figure 3.1 Profil temporel et spectre en fréquence d’une impulsion gaussienne [longueur d’onde centrale 800 nm – durée d’impulsion 40 fs].

On utilisera donc souvent, pour ce produit durée-largeur de raie dans le cas d’une impulsion à profil temporel quelconque, une formulation alternative à la relation (3.14), à savoir : (t )FWHM(f )FWHM ≥ 1 (3.27) À titre d’illustration, une impulsion de fréquence centrale f0 = 375 THz (soit λ0 = 800 nm) aura une largeur de raie f au moins égale à 25 THz (soit λ > 50 nm).

3.2.3 Bilan Pour clôturer ce paragraphe, nous insisterons sur le fait que les résultats démontrés précédemment sont intrinsèquement liés aux propriétés de la transformation de Fourier : le produit des supports d’une fonction et de sa transformée de Fourier est minoré par une constante dont l’ordre de grandeur est l’unité. Cette minoration est

59

De l’Optique électromagnétique à l’Interférométrie

aussi à la base de la limite de la résolution spatiale en optique, que l’on retrouvera au chapitre 4 consacré au paquet d’ondes spatial. On retiendra que ce produit durée d’impulsion-largeur de raie vérifie une inégalité dont on doit se contenter. Cela signifie que, si une source à faible durée d’impulsion doit nécessairement présenter un spectre étendu, en revanche une source à spectre large n’est pas nécessairement impulsionnelle, puisque, dans ce deuxième cas, l’inégalité conduit simplement à t > 0. En fait, pour retrouver le caractère impulsionnel de l’onde, il faut pouvoir bénéficier d’un accord spectral de phase complémentaire. Il est également intéressant de noter que l’équivalence temps-fréquence est utile à la conception de nombreuses expériences. La méthode CPA par exemple (Chirped Pulse Amplification) utilise un façonnage du spectre en fréquence de l’impulsion, permettant dans une première étape de l’élargir temporellement pour réduire la puissance crête transportée (P  W /t ), avant de la recomprimer dans une deuxième étape pour retrouver la forme temporelle initiale. Cette procédure permet de s’affranchir dans une large mesure des problèmes d’endommagement des éléments optiques soumis à des flux lumineux intenses. De façon plus générale, on extrait souvent la même information d’une expérience en mesurant la réponse fréquentielle du système ou sa réponse temporelle, à condition d’ajuster en conséquence les fenêtres correspondantes (spectrale ou temporelle).

3.3 Vitesse de groupe 3.3.1 Barycentre d’une impulsion à profil temporel quelconque Le Time-Bandwidth product étant désormais identifié et compris, nous allons maintenant étudier la manière dont se propage l’énergie associée à l’onde lumineuse. On reviendra tout d’abord au cas d’un profil temporel arbitraire, de façon à définir la notion de vitesse de groupe dans le cas général. On supposera que l’onde se déplace selon l’axe Oz en milieu homogène transparent, avec un vecteur d’onde β = β z , β ∈ R. Pour rappel, cela signifie que nous avons une onde polychromatique monodirectionnelle. Nous savons que la puissance d’une impulsion lumineuse varie comme le carré du champ électrique E (z, t ). Pour identifier la position en z du barycentre énergétique de cette impulsion, nous formerons donc le produit entre ce carré E 2 (z, t ) et une fonction à profil symétrique présentant un minimum en z = z0 , puis nous intègrerons le résultat obtenu sur la variable d’espace z . Le résultat obtenu traduit le recouvrement entre les deux quantités dont on vient d’effectuer le produit et sera évidemment fonction de z0 . La valeur particulière de z0 correspondant au minimum de ce produit P (z0 ) permet de déterminer la position du barycentre de l’impulsion considérée.

60

3. Paquet d’ondes fréquentiel

Si on choisit par exemple comme fonction symétrique une forme quadratique du type (z − z0 )2 , alors la position z0 de ce barycentre sera définie par :  +∞  ∂ ∂ 2 2 P (z0 ) = (z − z0 ) E (z, t ) dz = 0 (3.28) ∂z0 ∂z0 −∞ soit encore :

 −2

+∞

−∞

(z − z0 )E 2 (z, t ) dz = 0

et donc :

 z0 (t ) =

+∞

−∞  +∞ −∞

(3.29)

zE 2 (z, t ) dz (3.30) 2

E (z, t ) dz

3.3.2 Vitesse de propagation du barycentre Le calcul de la vitesse de propagation du barycentre nécessite que l’on évalue la quantité ∂z0 /∂t , ce qui ne semble pas très simple en l’absence d’informations plus précises sur le champ E (z, t ). Comme souvent, une bonne solution dans ce cas consiste à passer dans l’espace de Fourier, où le calcul des dérivées est grandement facilité, et à utiliser pour ce faire le théorème de Parseval. Il s’écrit ici :  +∞ −∞  +∞ −∞





zE (z, t )E (z, t ) dz ∗

=

E (z, t )E (z, t ) dz

+∞

−∞  +∞ −∞

(β, t ) zE E ∗(β, t ) d β (3.31) ∗

 E (β, t )E (β, t ) d β

où β désigne la variable conjuguée de z au sens de Fourier. On notera ici que la relation (3.31) met en jeu une transformation de Fourier par rapport à la variable d’espace z , transformation que nous n’avons pas encore définie. On écrira cette transformation de Fourier en adoptant ici la convention de signe négative, contrairement aux transformées de Fourier temporelles que nous avions définies avec la convention positive. On a donc :   E (β, t ) = E (z, t )e −2iπβz dz (3.32) z

61

De l’Optique électromagnétique à l’Interférométrie

3.3.2.1 Recherche de l’expression de la TF selon l’axe de propagation Introduisons l’expression du paquet d’ondes fréquentiel qui décrit la propagation du champ progressif E (z, t ), soit :  E (z, t ) = A(f )e ik(f )z e −2iπ ft df (3.33) f

En reportant cette expression dans la relation (3.32), puis en permutant l’ordre des intégrales, il vient :    A(f )e ik(f )z e −2iπ ft e −2iπβz df dz E (β, t ) = z

 =

f

f

A(f )e

−2iπ ft

 e

ik(f )z −2iπβz

e

dz

df

(3.34)

z

soit encore, en introduisant la distribution de Dirac δ :   E (β, t ) = 2π A(f )e −2iπ ft δ[k(f ) − 2πβ] df

(3.35)

f

À ce stade, il nous faut utiliser un changement de variable ; en effet, la présence d’une distribution de Dirac permettrait de s’affranchir de l’intégrale, à condition que la nouvelle variable soit k (et non pas f ). Mais nous verrons au chapitre 6 que les relations de Kramers-Kronig permettent de prédire que, dans une zone de transparence (ce qui est ici notre hypothèse), l’indice réel n(ω) est une fonction croissante de la fréquence. En conséquence, la fonction k(ω) est monotone, puisque :  

∂ n(ω)ω 1 ∂n ∂n ∂ k(ω) = = n+ω > 0 si >0 (3.36) ∂ω ∂ω c c ∂ω ∂ω de sorte que nous avons le droit de considérer la fonction inverse f = s(k) donnant la fréquence f en fonction de k. Dans ces conditions, la relation (3.35) peut être mise sous la forme :    ∂s −2iπ s(k)t  E (β, t ) = 2π A[s(k)]e δ[k − 2πβ] (k) dk (3.37) ∂k k En utilisant les propriétés de la distribution de Dirac, il vient :   ∂s  E (β, t ) = 2π A[s(2πβ)]e −2iπ s(2πβ)t (2πβ) ∂k

62

(3.38)

3. Paquet d’ondes fréquentiel

On utilisera désormais les notations :  C (β) = 2π A[s(2πβ)]

 ∂s (2πβ) et g (β) = 2πs(2πβ) ∂k

(3.39)

ce qui permet d’écrire la transformée de Fourier du champ sous la forme :  E (β, t ) = C (β)e −ig (β)t

(3.40)

3.3.2.2 Calcul du barycentre À partir de cette dernière relation, on peut faire appel aux différentes propriétés de la transformation de Fourier pour écrire :

  i −ig (β)t ∂C ∂g (β) = i ∂  zE E (β) = e − it C (β) (3.41) 2π ∂β 2π ∂β ∂β Et finalement :

z0 (t ) =



i β  2π β

∂C ∗ C dβ ∂β |C (β)|2 d β

 +

1 β  2π

∂g |C (β)|2 d β ∂β

β

|C (β)|2 d β

t = a + vg t

(3.42)

On voit donc que le barycentre de l’impulsion se déplace en milieu homogène transparent à une vitesse constante vg appelée vitesse de groupe et définie par :   ∂g ∂g (k)|2 dk |C (β)|2 d β |C 1 β ∂β 1 k ∂k   = (3.43) vg = 2π 2π (k)|2 dk |C (β)|2 d β |C β

k

Pour un grand nombre de faisceaux, dits quasi-monochromatiques, la largeur de raie ω est petite devant la pulsation centrale ω0 . Si l’on suppose alors que, sur cette étendue spectrale, les variations de la dérivée ∂g /∂k peuvent être négligées, alors l’expression de la vitesse de groupe devient :   1 ∂g  ∂ω  vg = = (3.44) 2π ∂k k0 ∂k ω0

63

De l’Optique électromagnétique à l’Interférométrie

3.3.2.3 Conséquence Il est intéressant de comparer cette vitesse de groupe à la vitesse de phase v définie en régime harmonique et considérée ici à la pulsation ω0 . Pour cela, développons plus avant l’expression de vg : ∂k 1 ∂  nω  n ω ∂n = = = + vg ∂ω ∂ω c c c ∂ω



vg =

c ∂n n + ω ∂ω

(3.45)

On voit donc qu’en l’absence de dispersion, les vitesses de phase et de groupe sont identiques : c ∂n = 0 ⇒ vg = = v (3.46) ∂ω n En revanche, ce n’est plus le cas pour les milieux dispersifs, une propriété par ailleurs utilisée pour ralentir la lumière dans le cas de très fortes dispersions (concept de lumière lente). On notera cependant, compte tenu de la propriété déjà annoncée pour n(ω), à savoir que la dérivée ∂n/∂ω est positive dans une fenêtre de transparence, que la vitesse de groupe est toujours inférieure à la vitesse de phase : ∂n >0 ∂ω



vg
k ⇒ [α] = 0 ⇒  = 0 (cas des ondes évanescentes, ou hautes fréquences). Ainsi les ondes évanescentes ne transportent pas d’énergie dans un milieu transparent. Toutefois l’expression (4.35) montre qu’en milieu absorbant (k complexe), puisque [α] est non nul à toute fréquence, les ondes évanescentes participent alors au bilan d’énergie.

4.5 Résolution optique La notion de paquet d’onde spatial permet de retrouver immédiatement la limite de résolution optique, plus connue sous l’appellation de critère de Rayleigh. Considérons le paquet d’onde spatial associé à la composante se propageant dans la direction des z positifs. D’après la relation (4.10), on peut écrire :   + (ν)e i[σ x +α(ν)z ] d ν E(x, z ) = A (4.36) σ

79

De l’Optique électromagnétique à l’Interférométrie

Comme nous l’avons déjà vu, dans le plan z = 0 et pour l’une quelconque des composantes de ce champ :  1 Ej (x, 0) = A+ (σ )e iσ x d σ (4.37) 2π σ j Ceci montre que les deux quantités Ej (x, 0) et A+ j (σ ) sont liées par une transformation de Fourier. En conséquence, de la même façon que nous l’avons signalé pour le produit durée-largeur de raie, leurs largeurs à mi-hauteur x et ν ne sont pas indépendantes, puisque reliées par l’inégalité x ν  1. Dans le cas d’une expérience qui consiste à éclairer un échantillon (sous un microscope par exemple), l’éclairement vient du champ lointain (eu égard à la longueur d’onde du rayonnement), de sorte que seules les ondes planes ou basses fréquences incidentes participent à l’éclairement. Dans ces conditions, chaque pulsation spatiale du paquet correspond à un angle θ défini par σ = k sin θ. En conséquence, la pulsation se trouve nécessairement comprise dans l’intervalle [−k, +k], les bornes extrêmes étant obtenues pour le faisceau le plus ouvert possible, c’est-à-dire pour θmax = ±90˚. On en déduit que le support σ est limité à 2k, ce qui impose une extension spatiale minimale au paquet d’ondes considéré, définie par : x 

λ0 2π = 2k 2n

(4.38)

Il est donc a priori impossible d’obtenir un faisceau optique dont les dimensions transverses dans l’air (n = 1) soient inférieures à la moitié de sa longueur d’onde. Ceci définit la limite de résolution de l’optique propagative. On retiendra que ce critère de Rayleigh est établi en l’absence d’ondes évanescentes, dû à l’éclairement en champ lointain. Ceci n’interdit pas de chercher à accroître la résolution en imaginant une illumination en champ proche, susceptible de bénéficier de la contribution des ondes évanescentes, grâce à la proximité de nano-objets conçus à cet effet. On parlera alors de super-résolution. Pour conclure, on insistera encore sur la minoration des produits des supports du champ et de sa transformée de Fourier. Si l’éclairement est une onde plane, sa distribution d’amplitude est un Dirac et donc son étendue spatiale est infinie ; à l’inverse, si l’éclairement est très focalisé, son étendue fréquentielle est grande et réduit ainsi l’extension spatiale.

4.6 Généralisation au cas 3D Il nous faut maintenant généraliser les résultats précédents au cas de la 3D, c’est-àdire pour un champ E(x, y, z ) = E(r , z ) dépendant des 3 variables d’espace ; c’est en effet cette géométrie qui est la plus répandue et correspond à la majorité des configurations expérimentales rencontrées.

80

4. Paquet d’ondes spatial

Cette généralisation est par ailleurs indispensable à l’introduction de notions couramment utilisées comme le flux par unité d’angle solide, la luminance, l’éclairement... Nous procéderons donc ici par analogie avec le cas 2D et de la façon la plus directe possible.

4.6.1 Équation d’Helmholtz, TF spatiale et reconstruction En 3D, l’équation d’Helmholz a pour expression : ∂ 2 E ∂ 2 E ∂ 2 E + 2 + 2 + k 2 E = 0 E + k 2 E = ∂x 2 ∂y ∂z

(4.39)

La transformée de Fourier (TF) spatiale est à nouveau définie à partir de la coordonnée transverse r = (x, y), mais qui est cette fois un vecteur de R2 . Ce choix est dû au fait qu’avec les géométries que nous considérons (sources en z = −∞), la plupart des grandeurs physiques sont tempérées, c’est-à-dire d’extension limitée selon la variable transverse, ce qui garantit l’existence des transformées de Fourier. Notons que la variable conjuguée ν (au sens de Fourier) est aussi un vecteur de R2 ; on écrira cette fréquence spatiale comme ν = (νx , νy ), mais on pourra également utiliser la pulsation définie par σ = 2π ν . Après application de la transformation de Fourier, la relation (4.39) devient :  (ν , z ) + (2i πνy )2 E  (ν , z ) + (2i πνx )2 E

∂2   (ν , z ) = 0 E(ν , z ) + k 2 E ∂z 2

(4.40)

soit encore : ∂2   (ν , z ) = 0 E(ν , z )+α 2 E ∂z 2

avec α 2 (ν) = k 2 −σ 2 = k 2 −(σx2 +σy2 ) (4.41)

où σ désigne le module de la pulsation spatiale. Ainsi, ces équations sont identiques à celles obtenues dans le cas 2D, à condition de remplacer la pulsation algébrique σ par son module |σ |. Comme précédemment, la solution de l’équation (4.41) est immédiate :  (ν , z ) = A  + (ν )e iα(ν)z + A  − (ν )e −iα(ν)z E et la reconstruction du champ conduit enfin à :   + iα(ν)z 2iπ ν ·r 2   − (ν )e −iα(ν)z e 2iπ ν·r d 2 ν  E (r , z ) = A (ν )e e d ν + A ν

ν

(4.42)

(4.43)

81

De l’Optique électromagnétique à l’Interférométrie

On notera ici que ces intégrales sont effectuées sur la variable ν de R2 , avec d 2 ν = d νx d νy . On reconnaît à nouveau la somme de 2 paquets d’ondes, progressif et rétrograde, puisqu’ils s’écrivent encore comme :   + i β + (ν)· ρ 2   − (ν )e i β − (ν)·ρ d 2 ν  E (r , z ) = A (ν )e d ν + A (4.44) ν

ν

où les vecteurs d’onde β + (ν ) et β − (ν ) sont définis par : ⎡ ⎡ ⎤ σx σx ⎢σ ⎥ ⎢ σ + −   β =⎣ y ⎦ et β =⎣ y α(ν)

⎤ ⎥ ⎦

(4.45)

−α(ν)

On retrouve à nouveau le fait que la pulsation spatiale est la composante tangentielle du vecteur d’onde.

4.6.2 Angle normal, angle polaire 4.6.2.1 Ondes planes en milieu transparent Considérons tout d’abord le cas des basses fréquences (σ < k). Chaque pulsation spatiale donne lieu cette fois à la définition de 2 angles ; l’angle normal est défini comme précédemment en 2D : 0 k ⇒ dν dφ On notera également que, si cette fonction est nulle à la fréquence nulle (contrairement au cas 2D), son intégrale autour de cette valeur particulière de la fréquence ne l’est pas, ce qui correspond au cas d’une mesure.

4.6.3.2 Intensité et luminance Il est également d’usage d’introduire la notion d’angle solide. Pour cela, il convient de se limiter aux ondes planes afin de poursuivre le changement de variables de la manière suivante : ν=

k sin θ 2π



dν =

k cos θ d θ 2π

ce qui conduit à :   1 k sin θ  k k cos θ |A(ν )|2 cos θ d θ d φ 2ωμ ˜ 2π 2π  3  1 k  (ν )|2 cos2 θ sin θ d θ d φ |A = 2ωμ ˜ 4π 2

d 2 (z ) =

(4.52)

En remarquant qu’apparaît dans cette dernière relation l’expression différentielle de l’angle solide (d 2  = sin θ d θ d φ), on obtient l’expression en milieu transparent de la densité de flux par unité d’angle solide :  3  1 d 2 (z ) k  (ν )|2 cos2 θ |A (4.53) = 2 d  2ωμ ˜ 4π 2

84

4. Paquet d’ondes spatial

En photométrie, cette dernière grandeur est dénommée intensité et notée I . On utilise également la luminance L, définie par :  3  1 k  (ν )|2 cos θ (4.54) L= |A 2ωμ ˜ 4π 2

4.6.3.3 Éclairement Nous clôturerons ce chapitre avec la notion d’éclairement. Si l’on revient sur l’expression du flux en milieu transparent, et que l’on suppose que la composante normale α du vecteur d’onde est quasi constante sur le support de la distribution d’amplitude (cas d’un faisceau à faible divergence), cette expression devient :  1  (ν )|2 d 2 ν = [α(ν0 )] |A (4.55) 2ωμ ˜ ν En utilisant le théorème de Parseval, on peut aussi écrire :  1 = [α(ν0 )] |E(r , 0)|2 d 2 r 2ωμ ˜ r

(4.56)

On en déduit l’expression de la densité surfacique de flux dans le plan z = 0, communément appelé éclairement : d 2 1 = [α(ν0 )]|E(r , 0)|2 2 d S 2ωμ ˜

(4.57)

où d 2 S désigne l’élément de surface dx dy. On retrouve ici le fait que, pour un faisceau faiblement divergent, l’éclairement est proportionnel au module au carré du champ.

85

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Composants planaires Chapitre conçu par Claude Amra rédigé par Claude Amra et Michel Lequime

Sommaire 5.1 5.2

5.3

5.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Principe du contrôle spatio-temporel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Composantes élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Fonction de transfert du système multicouche . . . . . . . . . . . . . . . . . . . . . . . . . Réponse des milieux stratifiés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Notion d’indice effectif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3 Application à un dioptre plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.4 Notion d’admittance complexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.5 Matrice de passage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.6 Relation de récurrence entre admittances complexes . . . . . . . . . . . . . . . . . . . . . 5.3.7 Répartition du champ stationnaire dans l’empilement . . . . . . . . . . . . . . . . . . . 5.3.8 Grandeurs énergétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.9 Matrices particulières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.10 Réflexion totale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.11 Vers l’optique intégrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réseaux de diffraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88 89 90 91 93 93 95 99 102 104 106 106 107 109 112 116 118

87

De l’Optique électromagnétique à l’Interférométrie

5.1 Introduction Nous avons jusqu’ici étudié les caractéristiques d’une onde lumineuse et mis en évidence les paramètres clés qui régissent son comportement, tels que la longueur d’onde, l’indice de réfraction, l’état de polarisation, l’amplitude, la phase, la durée d’impulsion ou la largeur de raie. En revanche, nous n’avons pas encore cherché à modifier les propriétés de cette onde, c’est-à-dire, en quelque sorte, à façonner ou contrôler la lumière. Ce contrôle s’effectue généralement à partir d’objets dits électromagnétiques, c’est-à-dire de composants dont l’une au moins des dimensions est de l’ordre de grandeur de la longueur d’onde de la lumière incidente. On est alors au cœur de ce qu’on appelle l’Optique électromagnétique, avec une problématique récurrente qui consiste à synthétiser l’objet (antireflet, polariseur, séparateur dichroïque, filtre à bande étroite, absorbeur large-bande, compresseur d’impulsion...) capable de conférer à la lumière les propriétés recherchées. Ces composants peuvent être de nature extrêmement variée et le but n’est pas ici d’en faire une liste exhaustive, mais d’étudier ceux qui sont les plus couramment utilisés, afin de mieux appréhender leur fonctionnement et les possibilités spécifiques qu’ils offrent. Parmi ceux-ci, nous avons choisi de focaliser notre attention sur des composants que l’on qualifie de planaires, car ils présentent à la fois de grandes dimensions transverses (plusieurs millimètres) et une très faible épaisseur (typiquement quelques microns). Parmi ces composants planaires, les premiers auxquels nous nous intéresserons sont les filtres optiques interférentiels (ou empilements de couches minces optiques), qui donnent lieu, pour le filtrage optique en espace libre, à une multitude de composants que l’on retrouve à la fois dans les applications grand public (photographie, lunetterie, éclairage, automobile, bâtiment) et dans les secteurs des hautes technologies (observation de la terre, astronomie, télécommunications en espace libre, communications par fibre, défense, santé, microscopie). Il est en effet rare aujourd’hui qu’une surface optique soit utilisée sans faire appel à un revêtement de surface. Il suffit pour s’en convaincre de noter qu’en l’absence d’antireflet, une surface de verre réfléchit environ 4 % de la lumière incidente visible ; si l’on fonctionne en transmission, les pertes sont ainsi de l’ordre de 8 % pour un seul substrat et avoisinent rapidement les 100 % dès lors qu’un grand nombre de substrats est mis en jeu, ce qui est le cas dans tout système optique un tant soit peu complexe. L’usage de ces couches antireflet est encore plus crucial dans le cas du moyen infrarouge où les surfaces réfléchissent près de 40 % du flux incident ! Pour toutes ces raisons, on comprend donc que, tant qu’il faudra véhiculer des photons, on aura besoin de couches minces optiques, ce qui fait de ce domaine un enjeu stratégique majeur. Du point de vue de la fabrication, et quel que soit le domaine spectral d’utilisation (visible, ultraviolet ou infrarouge), un filtre interférentiel est obtenu grâce au dépôt sous vide, à la surface d’un substrat, d’un empilement de couches diélectriques ou métalliques dont les épaisseurs élémentaires sont typiquement comprises entre quelques nanomètres et quelques centaines de nanomètres. Les réflexions partielles qui interviennent sur les interfaces séparant deux milieux adjacents de propriétés

88

5. Composants planaires

optiques différentes créent en cascade une multitude d’ondes secondaires qui vont ensuite interférer les unes avec les autres. Le choix des épaisseurs et des indices de réfraction des différentes couches constitutives de l’empilement permet d’agir sur le nombre et l’amplitude relative des ondes secondaires impliquées dans ce phénomène d’interférences, mais aussi sur la valeur des déphasages relatifs entre toutes ces ondes. Ceci va permettre d’obtenir, dans un composant planaire dont l’épaisseur globale est de quelques microns (voire quelques dizaines de microns), une variation très rapide de l’état d’interférence global avec la longueur d’onde de l’onde lumineuse qui s’y propage : c’est ce mécanisme qui constitue le filtrage optique interférentiel. Nous verrons également que les composants multicouches permettent de pallier le nombre relativement réduit d’indices de réfraction que l’on trouve spontanément dans la nature. En d’autres termes, et pour utiliser un vocabulaire désormais largement répandu, ces composants permettent d’élaborer des matériaux artificiels, des métamatériaux, qui permettent d’atteindre n’importe quelle valeur arbitraire (réelle ou complexe) de l’indice de réfraction. Il nous faut également citer le cas des cristaux photoniques, qui intervient quand la structuration de la matière est réalisée dans les 3 directions. Ce cas tridimensionnel est plus spécifique de l’optique intégrée, où la propagation modale et les dimensions réduites (dans les 3 dimensions) interdisent l’emploi des composants précédents. On signalera ici, par analogie (ou abus) de vocabulaire, que les systèmes planaires multicouches et les réseaux de diffraction sont quelquefois désignés comme des cristaux photoniques 1D ou 2D. Nous avons choisi de consacrer en majeure partie ce chapitre 5 aux composants multicouches plans, et de le terminer par une introduction à l’optique modale et aux réseaux de diffraction.

5.2 Principe du contrôle spatio-temporel On a souvent tendance à réduire à une simple onde plane l’onde incidente qui interagit avec un composant optique, mais c’est en fait un faisceau lumineux, et non une onde plane, qui va habituellement éclairer ce composant. Il nous faudra donc décomposer ce faisceau lumineux en composantes élémentaires, à savoir des ondes monochromatiques monodirectionnelles, puis tirer avantage du caractère linéaire des équations de Maxwell pour reconstruire, grâce au principe de superposition, la réponse globale du composant à partir de celle qu’il présente vis-à-vis de chacune de ces ondes planes monochromatiques. Cette procédure est applicable à la plupart des calculs électromagnétiques et consiste donc : • à rechercher une base de fonctions sur laquelle on décompose le champ incident en composantes élémentaires ; • à étudier l’interaction de la matière avec chaque composante élémentaire ;

89

De l’Optique électromagnétique à l’Interférométrie

• à reconstruire ensuite le champ total grâce au principe de superposition. Cette procédure n’a évidemment d’intérêt que si la base de fonctions est choisie en accord avec la géométrie du problème (et notamment le lieu des discontinuités qui y sont associées), de façon à simplifier l’étude de l’interaction élémentaire lors de l’écriture des relations de passage. On a recours le plus souvent à une décomposition en harmoniques sphériques (dans le cas de géométries concentriques ou radiales), ou en exponentielles complexes (dans le cas d’une géométrie planaire). Ce dernier cas, qui met en jeu la transformation de Fourier spatiale, est celui qui nous intéresse ici.

5.2.1 Composantes élémentaires Nous avons déjà utilisé les transformées de Fourier temporelle et spatiale du champ, qui permettent rapidement d’obtenir ces composantes élémentaires. En effet, la transformation de Fourier temporelle utilise une base d’exponentielles en e −iωt :  ρ , f ) e −2iπ ft df (5.1) E ( ρ , t ) = E( f

où f désigne la fréquence temporelle, tandis que la transformation de Fourier spatiale utilise une base analogue en e i σ ·r , soit :    (ν , z, f ) e 2iπ ν·r d ν = A  (ν , f ) e iα(ν,f )z e 2iπ ν ·r d ν E( ρ, f ) = E (5.2) ν

ν

où ν désigne la fréquence spatiale et où α(ν , f ) est défini par : α 2 (ν , f ) = k 2 (f ) − |σ |2 , avec σ = 2π ν . La variable d’espace est, quant à elle, toujours notée ρ = (r , z ). Au final, en utilisant conjointement ces 2 bases, on obtient :    (ν , f ) e iα(ν,f )z e 2iπ ν·r e −2iπ ft d ν df  E ( ρ, t ) = A f

ν

(5.3)

Cette dernière expression montre que la composante élémentaire est ici de la forme :  (ν , f ) e iα(ν ,f )z e 2iπ ν ·r e −2iπ ft = A  (ν , f ) e i β (ν ,f )·ρ e −2iπ ft A

(5.4)

et on retrouve bien l’onde monochromatique monodirectionnelle que nous avons déjà traitée au chapitre précédent, et qui s’identifie à une onde plane pour les basses fréquences spatiales (σ < k) dans un milieu transparent (k réel). Dans le cas des composants planaires qui nous intéressent, on bénéficie d’une invariance selon l’axe y, de sorte que l’on pourra travailler dans le plan d’incidence et se limiter au cas 2D, de sorte que la composante élémentaire aura ici pour expression :  (ν, f ) e iσ x e iα(ν,f )z e −iωt A

90

(5.5)

5. Composants planaires

On notera à ce stade que la base de décomposition est convenablement choisie, puisque les discontinuités ont lieu sur des plans d’équation z = Cte , où les dépendances transverses sont toutes les mêmes. On notera également qu’en régime harmonique, la dépendance temporelle apparaît simplement comme un facteur multiplicatif en e −iωt qui pourra être provisoirement omis.

5.2.2 Fonction de transfert du système multicouche Considérons maintenant le cas de la réflexion d’un champ électromagnétique progressif sur un composant planaire, comme représenté schématiquement à la figure 5.1.

Figure 5.1 Réflexion d’un champ progressif sur un composant multicouche plan.

De façon à éviter toute confusion, nous ajouterons désormais un exposant + aux composantes élémentaires du champ incident (elles se propagent dans la direction des z positifs), un exposant − aux composantes élémentaires du champ réfléchi (qui se propagent dans la direction des z négatifs) et un indice 0 aux paramètres α des ondes se propageant dans le milieu incident. Dans un souci de simplification, on supposera également dans ce paragraphe que le champ électrique est perpendiculaire au plan de la figure 5.1 (cas de la polarisation transverse électrique). En omettant leur dépendance temporelle, les composantes algébriques élémentaires du champ incident ont pour expression :

A+ (ν, f ) e i(σ x +α0 z )

(5.6)

91

De l’Optique électromagnétique à l’Interférométrie

tandis que celles du champ réfléchi s’écrivent :

A− (ν, f ) e i(σ x −α0 z ) = r (ν, f )A+ (ν, f ) e i(σ x −α0z )

(5.7)

où r désigne le coefficient de réflexion du multicouche soumis à une onde de pulsation temporelle ω (définissant la longueur d’onde) et de pulsation spatiale σ (définissant l’angle d’incidence). Grâce à l’utilisation du principe de superposition, nous pouvons exprimer le champ réfléchi sous la forme :  r (ν, f )A+ (ν, f ) e −iα0 (ν,f )z e 2iπ(νx −ft ) d ν df (5.8) E − (x, z, t ) = f,ν

ce qui peut également s’écrire, de manière synthétique :   E − (x, z, t ) = TF r (ν, f )A+ (ν, f ) e −iα0 (ν,f )z

(5.9)

où la transformée de Fourier est prise ici simultanément par rapport aux fréquences temporelles et spatiales. En z = 0, on obtient :   (5.10) E − (x, 0, t ) = TF r (ν, f )A+ (ν, f ) Or, nous savons que la transformée de Fourier d’un produit simple de deux fonctions est égale au produit de convolution de leurs transformées de Fourier, ce qui s’écrit ici : E − (x, 0, t ) = [ˇr A + ](x, t ) (5.11) x,t



avec rˇ (x, t ) =



et +

f,ν

A (x, t ) =

f,ν

r (ν, f ) e 2iπ(νx −ft ) d ν df

(5.12)

A+ (ν, f ) e 2iπ(νx −ft ) d ν df

(5.13)

Or, cette dernière intégrale n’est rien d’autre que la reconstruction spatio-temporelle du champ incident à l’abscisse z = 0, ce qui nous conduit donc à la relation finale : E − (x, 0, t ) = rˇ (x, t ) E + (x, 0, t ) x,t

(5.14)

Cette relation montre que le champ réfléchi par un système multicouche est égal en z = 0 au produit de convolution, sur l’espace et le temps, du champ incident par la double transformée de Fourier inverse, vis-à-vis des fréquences temporelle et spatiale, du facteur de réflexion. Cette dernière grandeur rˇ (x, t ) peut ainsi être considérée comme la fonction de transfert du système multicouche. C’est en effet la réponse que l’on obtiendrait dans le cas idéal d’une excitation δ(x, t ) infiniment étroite d’un point de vue spatial et temporel.

92

5. Composants planaires

On notera par ailleurs que la relation (5.14) est à la base de travaux sur la synthèse des composants, puisqu’elle démontre la possibilité d’un contrôle spatio-temporel de la lumière ; il faudra cependant être capable de déterminer les caractéristiques du système multicouche (indices, épaisseurs, séquences ou agencement...) susceptible de réaliser le contrôle recherché.

5.3 Réponse des milieux stratifiés 5.3.1 Introduction Les composants planaires à structure stratifiée se présentent sous la forme d’empilements de couches d’indices variés dont les épaisseurs élémentaires sont de l’ordre de grandeur de la longueur d’onde. Une représentation schématique d’un tel composant est donnée à la figure 5.2 dans le cas où l’empilement considéré contient p couches élémentaires. Ce composant planaire à structure stratifiée est éclairé par une onde plane dont les caractéristiques sont connues : la longueur d’onde λ est définie par la pulsation temporelle ω = 2πc/λ, tandis que l’angle d’incidence θ0 est défini par la pulsation spatiale σ = k0 (ω) sin θ0 . Le couple (ω, σ ) est donc une donnée du problème. La

A0+

A0− = rA0+

Milieu extérieur n0 Dioptre 0

Couche 1 (e1, n1)

Dioptre 1 Dioptre j-1

Couche j (ej, nj)

Dioptre j

Dioptre p-1 Couche p (ep, np)

Dioptre p

Substrat ns = np+1

A+s = tA0+ Figure 5.2 Structure générale d’un empilement multicouche.

93

De l’Optique électromagnétique à l’Interférométrie

dépendance spatiale de l’onde est décrite comme :  + e i(σ x +α0 z ) E0+ (x, z ) = A 0

 avec α0 = k02 − σ 2

(5.15)

 + est également connue, puisque caractéristique du flux incident. où l’amplitude A 0 Remarquons de suite que, dans le substrat d’indice ns , n’existe qu’une onde progressive, dont la dépendance spatiale s’écrit comme :  + e i(σ x +αs z ) Es+ (x, z ) = A s

(5.16)

En revanche, dans la couche d’indice j (1  j  p), se développe une onde stationnaire, constituée par la combinaison d’une onde progressive et d’une onde rétrograde :   + e iαj z + A  − e −iαj z e iσ x Ej (x, z ) = A (5.17) j −1

j −1

 avec αj = kj2 − σ 2 . Contrairement au cas précédent, le module de cette onde stationnaire varie avec l’altitude z à l’intérieur de la couche mince. On vérifie également, comme annoncé en introduction, que le choix de la base donne lieu à la même dépendance transverse pour tous les milieux, du type e iσ x . Ceci correspond en fait à la traduction, pour les basses fréquences spatiales de l’espace de Fourier, de l’invariant de Snell-Descartes : σ = k sin θ = Cte



nj sin θj = n0 sin θ0

(5.18)

On voit donc que la grandeur physique pertinente est bien la fréquence spatiale, les angles étant définis a posteriori à partir de cette fréquence et pour chaque milieu. Ces notations étant établies, nous allons considérer 3 configurations de complexité croissante qui sont schématisées en figure 5.3, à savoir :

n0

n0

θ0

ns z (1)

n0

θ0

ns z

ns z

(2)

(3)

Figure 5.3 Illustration de la démarche mettant en œuvre 3 configurations de complexité croissante.

94

5. Composants planaires

1. la réflexion à incidence nulle (θ0 = 0) d’une onde plane élémentaire sur un dioptre plan séparant deux milieux d’indices différents, le coefficient r étant alors défini par une relation faisant intervenir les valeurs de ces indices de réfraction : r =

n0 − ns n0 + ns

(5.19)

2. la réflexion à incidence non nulle (θ0  = 0) de cette même onde sur ce même dioptre plan, la formule décrivant le coefficient r étant identique à la précédente, à ceci près que les indices de réfraction sont alors remplacés par des indices effectifs n˜ 0 et n˜ s dépendant de l’angle d’incidence et de l’état de polarisation : r =

n˜ 0 − n˜ s n˜ 0 + n˜ s

(5.20)

3. le cas le plus général de la réflexion sur ce même dioptre plan lorsque celui-ci est recouvert par un empilement de couches minces, l’indice effectif du substrat étant alors remplacé par une quantité tenant compte des caractéristiques optiques et géométriques de l’empilement qui a été déposé à sa surface, à savoir son admittance complexe Y0 : n˜ 0 − Y0 (5.21) r= n˜ 0 + Y0 Ces différents résultats seront démontrés dans les paragraphes qui suivent.

5.3.2 Notion d’indice effectif Considérons une onde élémentaire progressive se propageant dans un milieu homogène. La dépendance spatiale de son champ électrique a pour expression :  + e i(σ x +αz ) E+ (x, z ) = A

(5.22)

La règle de constitution du trièdre direct introduite au paragraphe 2.7 nous permet d’écrire : ⎧  σ ⎪  + = 1 β + ∧ E+ ⎪  ⎨H  ωμ ˜ + avec β = σ x + αz =  0 (5.23)  ⎪ 1 + + + ⎪   α ⎩E = − β ∧ H ω ˜

5.3.2.1 Polarisation TE On considère tout d’abord une onde plane polarisée linéairement en TE (transverse électrique ), c’est-à-dire dont le vecteur champ électrique est perpendiculaire au plan

95

De l’Optique électromagnétique à l’Interférométrie

d’incidence x Oz . Cet état de polarisation est aussi désigné par la lettre S, car celleci est l’initiale du mot allemand senkrecht qui signifie perpendiculaire. C’est aussi l’initiale du terme français sagittale qui est parfois utilisé en lieu et place de senkrecht, un procédé mnémotechnique consistant à dire que cette flèche de polarisation est fichée dans le plan d’incidence. Pour cet état particulier de polarisation, nous pouvons écrire :

E+ = E + y + : ce qui conduit à l’expression suivante pour H +  + = 1 β + ∧ E+ = 1 (σ x + αz ) ∧ E + y = σ E z + α z ∧ E+ (5.24) H ωμ ˜ ωμ ˜ ωμ ˜ ωμ ˜

et donc à la relation suivante entre les composantes tangentielles (c’est-à-dire ici contenues dans le plan x Oy) de l’induction magnétique et du champ électrique :  + = α (z ∧ E+ ) = α z ∧ E+ H tg tg ωμ ˜ ωμ ˜

(5.25)

On appellera indice effectif la quantité n˜ défini par1 : n˜ =

α ωμ ˜

(5.26)

ce qui permet d’écrire la relation entre composantes tangentielles sous la forme synthétique suivante :  + = n˜ z ∧ E+ H (5.27) tg tg Il nous reste maintenant à calculer la relation entre l’indice habituel n et l’indice effectif n˜ dans le cas de cette polarisation TE. Nous pouvons écrire : n˜ =

α α nα 1 = = ωμ ˜ kv μ ˜ k cμ ˜

(5.28)

Or μ ˜ =μ ˜ r μ0 et 0 μ0 c 2 = 1. En conséquence, il vient :   nα √ nα 0 1 1 nα 1 μ0 n˜ =

0 μ0 = = (5.29) avec η0 = k μ ˜ r μ0 k μ0 μ ˜r η0 μ ˜r k

0 La quantité η0 est appelée impédance du vide .

Attention ! L’utilisation de la notation n˜ pour désigner l’indice effectif ne signifie pas que cette quantité soit la transformée de Fourier de l’indice de réfraction n. 1

96

5. Composants planaires

Par ailleurs, dans le cas des basses fréquences (composantes propagatives), nous pouvons remplacer α par son expression en θ, soit :   α = k 2 − σ 2 = k 2 − k 2 sin2 θ = k cos θ (5.30) ce qui permet de donner à l’indice effectif n˜ la forme particulière suivante : n˜ =

1 1 nα n cos θ = η0 μ ˜r k η0 μ ˜r

(5.31)

5.3.2.2 Polarisation TM Considérons maintenant une onde plane polarisée linéairement en TM (transverse magnétique ), pour laquelle c’est, comme son nom l’indique, le vecteur induction magnétique qui est cette fois-ci tangentiel, et donc perpendiculaire au plan d’incidence  + = H+ y ). Cet état de polarisation est également désigné par la lettre P, qui est (H l’initiale du terme anglais parallel (ou du terme français parallèle ), ce qui rappelle que le vecteur champ électrique est cette fois parallèle au plan d’incidence. La seconde des 2 relations du trièdre direct (5.23) nous permet d’écrire dans ce cas : 1  + = − 1 (σ x + αz ) ∧ H+ y E+ = − β + ∧ H ω ˜ ω ˜ σ H+ α + =− z − z ∧ H ω ˜ ω ˜

(5.32)

Par conséquent : z ∧ Etg+ = −

α  + ) = − α [(z · H+ y)z −(z ·z )H  + (5.33)  +] = α H z ∧(z ∧ H ω ˜ ω ˜ ω ˜

et donc, au final :

 + = ω ˜ z ∧ E+ = n˜ z ∧ E+ H (5.34) tg tg tg α En utilisant la relation générale entre vitesse de propagation, permittivité et perméabilité : ˜ μv ˜ 2 = 1, nous pouvons transformer le coefficient ω ˜ /α de manière à faire apparaître l’impédance du vide, soit : ω ˜ nk 1 kv 1 1 nk = = = 2 α α μv ˜ α cμ ˜ η0 μ ˜r α

(5.35)

Comme précédemment, nous pouvons, dans le cas des basses fréquences, remplacer α par son expression en θ, et donner ainsi à l’indice effectif n˜ la forme particulière suivante : 1 nk 1 n n˜ = = (5.36) η0 μ ˜r α η0 μ ˜ r cos θ

97

De l’Optique électromagnétique à l’Interférométrie

5.3.2.3 Conclusion Les relations établies dans les deux paragraphes qui précèdent nous permettent de conclure que, dans le cas d’une onde progressive, et quel que soit l’état de polarisation TE ou TM, il existe un scalaire n, ˜ tel que :

avec n˜ =

1 η0 μr



 + = n˜ z ∧ E+ H tg tg

(5.37)

nα/k nk/α

(5.38)

en polarisation TE en polarisation TM

cette relation restant vraie dans le cas d’ondes évanescentes (hautes fréquences spatiales) ou d’ondes dissociées (milieu absorbant). Pour les basses fréquences spatiales en milieu transparent, c’est-à-dire pour les ondes planes, on obtient :  n cos θ en polarisation TE 1 n˜ = (5.39) en polarisation TM η0 μr n/ cos θ Dans le cas d’une onde rétrograde, la démarche est exactement la même, à ceci près que le vecteur β a maintenant pour expression : β − = σ x − αz , ce qui revient à renverser le signe de la quantité α, et donc celui de n, ˜ dans les expressions finales. La relation générique entre composantes tangentielles s’écrit donc dans ce cas :  − = −n˜ z ∧ E− H tg tg

(5.40)

À titre de remarque, notons que la notion d’indice effectif ne s’applique qu’aux ondes progressives ou rétrogrades. Pour les ondes stationnaires, il faudra faire appel à la notion d’admittance.

5.3.2.4 Composantes tangentielles Dans les paragraphes qui précèdent, nous avons limité notre analyse à la prise en compte des composantes tangentielles des champs. En effet, ces composantes sont les seules à intervenir pour le calcul du flux à travers un plan de côte z , et suffiront en conséquence à établir les bilans d’énergie en champ lointain. Ce résultat général est immédiat à démontrer. Nous avons vu au chapitre que la densité surfacique du flux du vecteur de Poynting s’écrivait comme :  d 1   ) · z =  (E∗ ∧ H dS 2

(5.41)

Décomposons le champ en ses composantes tangentielles et normales :  ) · z = [(E∗ + E∗ ) ∧ (H  tg + H  z )] · z (E∗ ∧ H tg z

98

(5.42)

5. Composants planaires

On obtient, grâce aux propriétés des produits vectoriels :  ) · z = (E∗ ∧ H  tg ) · z (E∗ ∧ H tg

(5.43)

Cette dernière expression ne fait plus intervenir que les composantes tangentielles des champs. On peut donc terminer le calcul du flux comme suit :  tg = n˜ z ∧ Etg H



d 1 = [n] ˜ |Etg |2 dS 2

(5.44)

Il est intéressant par ailleurs de savoir qu’en l’absence de sources, les composantes normales des champs se déduisent simplement des composantes tangentielles. Ceci résulte du fait que les 2 dernières équations de Maxwell sont la conséquence des 2 premières. On trouverait par exemple, en développant la troisième équation pour une onde élémentaire progressive :    = σ · A  e i β ·ρ = 0 ⇒ β · A  tg + α A  z = 0 (5.45) divE(ρ, f ) = div A Cette dernière relation donne la composante normale en fonction de la composante tangentielle, ce qui justifie à nouveau le fait de limiter notre analyse aux seules composantes tangentielles.

5.3.3 Application à un dioptre plan De manière à se familiariser avec la notion d’indice effectif et avec son usage, nous allons considérer dans un premier temps un simple dioptre plan dans la configuration représentée à la figure 5.4.

Figure 5.4 Dioptre plan.

99

De l’Optique électromagnétique à l’Interférométrie

On définit les coefficients de réflexion r et de transmission t (en amplitude) de ce dioptre plan à l’aide des deux relations suivantes : − + E0,tg = r E0,tg

+ + E1,tg = t E0,tg

(5.46)

On note ici à nouveau que ces coefficients r et t , qui sont souvent désignés sous l’appellation de coefficients de Fresnel , sont des rapports de composantes tangentielles des champs. La continuité de la composante tangentielle du champ électrique à la traversée du dioptre nous permet d’écrire : + − + E0,tg + E0,tg = E1,tg = E1,tg

(5.47)

soit encore, en faisant apparaître les coefficients r et t définis en (5.46) : + − + + E0,tg + E0,tg = (1 + r ) E0,tg = t E0,tg

(5.48)

d’où la relation classique entre amplitudes des champs incidents, réfléchis et transmis : 1+r =t

(5.49)

Il convient de ne pas oublier que les quantités r et t sont ici des nombres complexes, qui permettent de calculer les amplitudes des ondes réfléchies et transmises. Il ne faut donc pas les confondre avec les coefficients de réflexion R et de transmission T en énergie que nous serons conduits à introduire ultérieurement. La continuité de la composante tangentielle de l’induction magnétique à la traversée du dioptre plan conduit de la même manière à : + + H − = H  1,tg = H +  0,tg = H H 0,tg 0,tg 1,tg

(5.50)

En introduisant à ce stade les indices effectifs des deux milieux et en tenant compte du caractère progressif ou rétrograde des ondes considérées, cette relation peut être mise sous la forme : + − + n˜ 0 (z ∧ E0,tg ) − n˜ 0 (z ∧ E0,tg ) = n˜ 1 (z ∧ E1,tg )

(5.51)

Il ne nous reste plus qu’à exprimer toutes les quantités en fonction de la valeur du champ électrique incident, soit :

Soit encore :

100

+ + + ) − n˜ 0 r (z ∧ E0,tg ) = n˜ 1 t (z ∧ E0,tg ) n˜ 0 (z ∧ E0,tg

(5.52)

n˜ 0 (1 − r ) = n˜ 1 (1 + r )

(5.53)

5. Composants planaires

et donc : r=

n˜ 0 − n˜ 1 n˜ 0 + n˜ 1

et

t =

2n˜ 0 n˜ 0 + n˜ 1

(5.54)

Ces coefficients dépendent bien évidemment des indices des milieux considérés, mais aussi de l’angle d’incidence et de l’état de polarisation de la lumière. On notera l’intérêt de la notion d’indice effectif, à la fois parce qu’elle simplifie les calculs, mais aussi parce qu’elle permet d’exprimer les coefficients r et t de la même manière quelle que soit l’incidence : en d’autres termes, cela signifie qu’en incidence oblique, le matériau d’indice n se comporte comme un matériau d’indice n˜ en incidence normale. En incidence normale, les indices effectifs en TE et en TM sont identiques et donnés par : n n˜TE = n˜TM = (5.55) η0 μr où la quantité μr peut être prise égale à 1 pour tous les matériaux optiques usuels. En conséquence : n0 − n1 n˜ 0 − n˜ 1 = (5.56) r = n˜ 0 + n˜ 1 n0 + n1 de sorte que l’on a, dans le cas d’un dioptre air-verre éclairé par un rayonnement visible (n0 = 1 et n1 = 1,5) : r =

0,5 1 1 − 1,5 n0 − n1 =− =− = n0 + n1 1 + 1,5 2,5 5

(5.57)

En amplitude, le coefficient de réflexion de ce dioptre est donc de −20 %, le signe − mettant en évidence un déphasage de π à la réflexion. En énergie, le coefficient de réflexion R (que l’on définira plus loin comme R = |r |2 ) est donc de 4 %. On peut également utiliser la relation (5.54) pour rechercher des conditions qui conduiraient à annuler le coefficient de réflexion, ce qui se traduirait ici par la condition : n˜ 0 = n˜ 1 . Ceci ne peut être obtenu que dans le cas d’une polarisation TM, et conduit alors à la relation : n1 n0 = (5.58) cos θ0 cos θ1 qui, combinée avec la loi de la réfraction n0 sin θ0 = n1 sin θ1 , va nous permettre de déterminer l’angle d’incidence θ0 pour lequel cette condition est satisfaite :   n02 2 2 2 2 n0 cos θ1 = n1 cos θ0 ⇒ n1 cos θ0 = n0 1 − 2 sin θ0 (5.59) n1 En divisant les deux membres de la dernière égalité par cos2 θ0 , il vient : n12 =

n02 n04 n04 2 2 2 − tan θ = n (1 + tan θ ) − tan2 θ0 0 0 0 2 2 cos2 θ0 n1 n1

(5.60)

101

De l’Optique électromagnétique à l’Interférométrie

1,0 0,9 0,8

R

0,7 0,6 0,5 0,4 0,3 0,2 0, 0,1 0,0 0

10

20

30

40

50

60

70

80

90

angle d incidence θ0

Figure 5.5 Variation du coefficient de réflexion en énergie R sur un dioptre air-verre en fonction de l’angle d’incidence θ0 [en grisé, TE - en noir, TM].

soit encore : n12 − n02 = et donc :

n02 2 (n − n02 ) tan2 θ0 n12 1

tan θ0 =

n1 n0

(5.61)

(5.62)

Cet angle particulier est appelé angle de Brewster et est souvent utilisé pour polariser linéairement un faisceau lumineux de lumière naturelle par simple réflexion sur un dioptre plan air-verre. La figure 5.5 montre, pour les deux états de polarisation TE et TM, l’évolution du coefficient de réflexion en énergie R en fonction de l’angle d’incidence sur le dioptre air-verre (n0 = 1, n1 = 1,5).

5.3.4 Notion d’admittance complexe On se propose de généraliser la notion d’indice effectif, introduite dans le cas des ondes progressives ou rétrogrades, au cas des ondes stationnaires. Il s’agit donc à nouveau de trouver la relation entre les composantes tangentielles des champs électrique et magnétique. Rappelons dans ce but qu’une onde stationnaire est la somme d’une onde progressive et d’une onde rétrograde, et que le module de cette onde varie avec l’altitude z .

102

5. Composants planaires

L’onde stationnaire, présente à l’intérieur de la couche j de l’empilement représenté à la figure 5.2, est donc décrite par la relation : iαj z −iαj z iσ x Ej,tg (x, z ) = (A+ + A− )e j e j e

avec αj2 = kj2 − σ 2

(5.63)

Supposons pour fixer les idées que le champ électrique soit polarisé linéairement en TE, c’est-à-dire que l’on puisse écrire :

E = E y = Etg Alors, en utilisant une démarche analogue à celle adoptée au paragraphe 5.3.2.1, on  et z ∧ E vérifie rapidement que les composantes tangentielles des deux quantités H sont parallèles. Il existe donc un scalaire complexe Y tel que l’on puisse écrire :  tg = Y (z ∧ Etg ) H

(5.64)

Cette quantité Y est appelée admittance complexe de l’interface où sont considérés  tg , et joue, pour un empilement de couches minces, le même rôle que celui que Etg et H joue l’indice effectif dans le cas d’un milieu homogène. Toutefois, et contrairement à l’indice effectif qui est constant dans chaque couche, cette grandeur varie avec l’altitude z . Par ailleurs, les champs tangentiels étant continus dans l’empilement, l’admittance complexe est aussi une fonction continue de l’altitude z dans tout l’empilement. En suivant une démarche similaire (continuité du champ magnétique, puis utilisation des définitions de l’admittance et de l’indice effectif ) à celle présentée au paragraphe 5.3.3 dans le cas d’un dioptre plan, nous pouvons aussitôt en déduire le coefficient de réflexion en amplitude r de l’empilement représenté à la figure 5.2, soit : r=

n˜ 0 − Y0 n˜ 0 + Y0

(5.65)

La quantité Y0 , qui désigne l’admittance complexe du composant à l’interface supérieure de l’empilement, dépend elle aussi de l’angle d’incidence et de l’état de polarisation, mais aussi de toutes les caractéristiques optiques et géométriques du multicouche. La relation (5.65) démontre ainsi que le composant multicouche se comporte, pour le calcul de la réflexion, comme un substrat artificiel d’indice de réfraction Y0 . Ce résultat est à la base des premiers calculs de synthèse analytique, dans la mesure ou l’admittance Y peut prendre des valeurs arbitraires dans le plan complexe. À titre d’exemple, on obtiendra un antireflet (r = 0) en choisissant un empilement donnant une admittance Y0 égale à n˜ 0 . De la même façon, les miroirs parfaits sont obtenus avec une admittance nulle (r = 1) ou infinie (r = −1). On retiendra cependant que l’équivalence entre indice et admittance ne vaut que pour le calcul de la réflexion : on verra en effet que la transmission du multicouche prend une forme différente de celle du dioptre unique (t  = 2n˜ 0 /(n˜ 0 + Y0 )).

103

De l’Optique électromagnétique à l’Interférométrie

Il nous reste maintenant à définir comment calculer en pratique cette admittance complexe.

5.3.5 Matrice de passage Considérons dans un premier temps la couche j , d’épaisseur ej , d’indice de réfraction nj et située entre les interfaces de rang j − 1 et j , comme représenté à la figure 5.6.

Dioptre j-1 ej

nj Dioptre j

z

Figure 5.6 Paramètres et notations associés à la description de la couche j .

Comme indiqué précédemment, on ne s’intéresse qu’aux composantes tangentielles des champs, dont on rappelle qu’elles sont en outre continues. En un point quelconque d’abscisse z dans l’épaisseur de la couche j , nous pouvons écrire : ⎧  + e iαj z + A  − e −iαj z ⎨ Etg,j (z ) = A j j (5.66) + iα z ⎩H  e j +B  − e −iαj z  tg,j (z ) = B j j ce qui conduit immédiatement aux deux groupes de relations suivantes, correspondant respectivement aux abscisses particulières z = 0 et z = ej , et qui décrivent les valeurs des composantes tangentielles des champs sur les deux interfaces j − 1 et j : ⎧ + + A − ⎨ Etg,j −1 = Etg,j (0) = A j j (5.67) ⎩H  tg,j (0) = B + + B −  tg,j −1 = H j j ⎧  + e iαj ej + A  − e −iαj ej ⎨ Etg,j = Etg,j (ej ) = A j j ⎩H  tg,j (ej ) = B  + e iαj ej + B  − e −iαj ej  tg,j = H j j

(5.68)

Nous avons d’autre part, en accord avec les conclusions du paragraphe 5.3.2.3 :  ± = ±n˜ j z ∧ A ± B j j

104

(5.69)

5. Composants planaires

En formant les quantités n˜ j z ∧ Etg,j −1 et n˜ j z ∧ Etg,j , et en utilisant les relations (5.69), nous obtenons aussitôt : ⎧ + − B − ⎨ n˜ j z ∧ Etg,j −1 = B j j (5.70) ⎩ n˜ j z ∧ Etg,j = B  + e iαj ej − B  − e −iαj ej j j Il convient d’adjoindre à ce système les deux équations non encore utilisées, à savoir : ⎧ + + B −  tg,j −1 = B ⎨H j j (5.71) + iα e j j ⎩ H  e  − e −iαj ej  tg,j = B +B j j On en déduit, par combinaison linéaire des premières équations des systèmes (5.70) et (5.71) : ⎧  ⎪  tg,j −1  + = 1 n˜ j z ∧ Etg,j −1 + H ⎨B j 2 (5.72)  ⎪ ⎩B  tg,j −1  − = − 1 n˜ j z ∧ Etg,j −1 − H j 2 Il nous suffit alors de reporter ces expressions dans les secondes équations des systèmes (5.70) et (5.71) pour obtenir les relations linéaires recherchées :   tg,j n˜ j z ∧ Etg,j = cos (αj ej ) [n˜ j z ∧ Etg,j −1 ] + i sin (αj ej )H (5.73)  tg,j −1  tg,j = i sin (αj ej ) [n˜ j z ∧ Etg,j −1 ] + cos (αj ej )H H soit encore, en utilisant une formulation matricielle et en désignant par δj la quantité αj ej : ⎞ ⎛     i tg,j −1  sin δ cos δ z  ∧ E z ∧ Etg,j j j ⎠ =⎝ (5.74) n˜ j  tg,j  tg,j −1 H H i n˜ j sin δj cos δj Il est facile de montrer que la matrice figurant dans la relation précédente est de déterminant unitaire, de sorte que l’on peut inverser la relation précédente et écrire :     z ∧ Etg,j −1 z ∧ Etg,j = M (5.75) j  tg,j −1  tg,j H H avec :



⎞ i cos δj − sin δj ⎠ Mj = ⎝ n˜ j −i n˜ j sin δj cos δj

et

δj = αj ej

(5.76)

La matrice Mj est appelée matrice de passage associée à la couche j , et permet de  tg sur l’interface j − 1, connaissant les valeurs de ces calculer les quantités z ∧ Etg et H mêmes quantités sur l’interface j . Il est important de souligner ici que l’utilisation de

105

De l’Optique électromagnétique à l’Interférométrie

cette matrice de passage permet de remonter à l’intérieur de l’empilement, en partant du substrat et en terminant dans le superstrat. On notera également que le terme de phase δj est sans dimension, et donné aux basses fréquences par : δj = (2π/λ) nj ej cos θj . Enfin, il est certainement utile de signaler que, selon les ouvrages, on trouve définies d’autres matrices de passage permettant de relier les grandeurs aux interfaces. Dans notre cas, cette matrice de passage relie les composantes tangentielles des champs  , mais, chez d’autres auteurs, elles pourront relier les champs stationnaires E et H progressifs et rétrogrades, ou les champs électriques ou magnétiques selon l’état de polarisation.

5.3.6 Relation de récurrence entre admittances complexes Par définition, les admittances complexes des interfaces j − 1 et j sont définies par les relations suivantes (cf. papragraphe 5.3.4) :  tg,j −1 = Yj −1 z ∧ Etg,j −1 H

et

 tg,j = Yj z ∧ Etg,j H

(5.77)

Par conséquent, nous pouvons écrire, en injectant ces définitions dans la relation matricielle (5.75), puis en faisant le rapport des deux équations obtenues : Yj −1 =

Yj cos δj − i n˜ j sin δj cos δj − i (Yj /n˜ j ) sin δj

(5.78)

Cette relation nous permet de calculer l’admittance de l’interface j − 1 connaissant celle de l’interface j . Il nous reste maintenant à initialiser cette relation de récurrence et, pour cela, il nous faut une admittance connue. Celle-ci est donnée par le substrat, qui est le seul milieu où l’onde est progressive (non stationnaire). L’admittance du substrat est donc égale à son indice effectif (Yp = n˜ p+1 ) et permet ainsi d’initialiser la relation de récurrence. Cette dernière permet ensuite de remonter jusqu’à la valeur Y0 de l’admittance à la première interface du multicouche, ce qui permet le calcul du coefficient de réflexion.

5.3.7 Répartition du champ stationnaire dans l’empilement Une fois les admittances connues aux différents dioptres, la relation matricielle (5.75) permet de relier immédiatement les champs aux interfaces. Dans le cas du champ

106

5. Composants planaires

électrique, on obtient : i  tg,j z ∧ Etg,j −1 = cos δj (z ∧ Etg,j ) − sin δj H n˜ j

(5.79)

puis z ∧ Etg,j −1 = cos δj (z ∧ Etg,j ) − i

Yj sin δj (z ∧ Etg,j ) n˜ j

  Yj  Etg,j −1 = cos δj − i sin δj Etg,j n˜ j

et enfin

(5.80)

(5.81)

Si l’on remarque maintenant que toutes ces relations (admittances, champs...) restent valables pour toute valeur z choisie de manière arbitraire à l’intérieur de chaque couche, il devient possible de calculer la répartition du champ dans toute l’épaisseur de la couche j (dans ce cas, on écrira : δj = αj z ), et donc, dans toute l’épaisseur de l’empilement.

5.3.8 Grandeurs énergétiques Comme toujours, le bilan d’énergie se fait relativement à une surface fermée limitant un domaine à l’intérieur duquel se trouve le composant. Compte tenu de la géométrie de notre problème (invariance en y, extension infinie en x pour l’onde élémentaire), cette surface consiste en la réunion de plans d’altitudes z0 et zs , respectivement situés dans le superstrat et le substrat. On notera que la normale devant être orientée vers l’extérieur, elle se confond avec −z pour le plan z = z0 et avec +z pour le plan z = zs . Il ne nous reste plus qu’à calculer le flux traversant cette surface. Dans un souci de simplicité, on supposera que le bilan s’effectue en champ lointain, ce qui évite de tenir compte de la superposition des champs incident et réfléchi au voisinage immédiat du composant. Dans ces conditions, seuls 3 flux (2 progressifs, 1 rétrograde) sont à calculer dans le superstrat et le substrat, flux dont les densités spectrales ont déjà été données dans le chapitre 4 consacré au paquet d’ondes spatial :  + |2 • flux incident + = 1 [α0 ] |A • flux

0 0 2ωμ0 − − 2 1  réfléchi 0 = 2ωμ0 [α0 ] |A0 | 1 + 2 transmis + s = 2ωμs [αs ] |As |

• flux Toutefois, ces expressions sont indépendantes de la polarisation et font donc intervenir l’amplitude totale du champ. Pour demeurer conforme à la méthode utilisée jusqu’ici, et qui fait appel aux seules composantes tangentielles des champs, nous pouvons aussi réécrire les flux comme indiqué au paragraphe 5.3.2.4 : • flux incident + = 1 [n˜ 0 ] |E+ |2 0

2

tg,0

107

De l’Optique électromagnétique à l’Interférométrie − 2 1 • flux réfléchi − ˜ 0 ] |Etg,0 | 0 = 2 [n 1 + |2 • flux transmis + ˜ s ] |Etg,s s = 2 [n

On peut dès lors définir le coefficient de réflexion en énergie comme le rapport du flux réfléchi au flux incident : − 2 | |Etg,0 − 0 = |r |2 R= + = + 0 |Etg,0 |2

(5.82)

et le coefficient de transmission en énergie comme le rapport du flux transmis au flux incident : − |2 [n˜ s ] |Etg,s + [n˜ s ] 2 T = s+ = = (5.83) |t | + 2  [ n˜ 0 ] 0 [n˜ 0 ] |Etg,0 | Ces coefficients R et T sont ceux qui sont couramment mesurés en spectrophotométrie, où l’on s’intéresse essentiellement à des mesures d’éclairement. En l’absence d’absorption, on a évidemment R + T = 1, une relation à ne pas confondre avec la relation d’amplitude (1 + r = t ) du dioptre plan. En milieu complexe, on peut calculer l’absorption globale A du composant en utilisant le principe de conservation de l’énergie (A = 1 − R − T ), mais on peut aussi accéder au détail de l’absorption dans chacune des couches de l’empilement en utilisant la relation donnée au chapitre 2, à savoir pour un milieu non magnétique (μ = 0) : ω A= 2



p

ω

|E(z )|2 dz = 2 z

j =1

 0

ej

j |Ej (z )|2 dz

(5.84)

Pour conclure, il nous faut expliciter le calcul du coefficient d’amplitude t pour le multicouche. En effet, si le facteur de réflexion r est immédiatement déduit de l’admittance Y0 par r = (n˜ 0 − Y0 )/(n˜ 0 + Y0 ), ce n’est pas le cas du coefficient de transmission. Celui-ci peut être déterminé de 2 façons : 1. dans la première, on utilise le formalisme de la matrice de passage, et l’on définit celle, notée M , associée à l’empilement complet, soit : ⎞ ⎛       p  z ∧ Etg,p+1 z ∧ Etg,s z ∧ Etg,0 ⎠ ⎝ Mj = =M (5.85)  tg,0  tg,p+1  tg,s H H H j =1

puis on met en facteur dans chaque terme les quantités du type z ∧ E, soit :        1 1 a b 1 z ∧ Etg,0 = z ∧ Etg,s M = z ∧ Etg,s (5.86) n˜ s Y0 c d n˜ s

108

5. Composants planaires

En divisant les deux termes de l’égalité par la quantité z ∧ E0+ associée au champ incident, il vient :        1 a b 1 a + b n˜ s (1 + r ) =t =t (5.87) Y0 c d n˜ s c + d n˜ s ce qui conduit à l’expression recherchée pour le coefficient t , soit : t =

1+r a + b n˜ s

(5.88)

2. dans la seconde, on reprend la relation (5.79) entre champs tangentiels : z ∧ Etg,j −1 = ( cos δj − i

Yj sin δj ) z ∧ Etg,j n˜ j

(5.89)

On en déduit aussitôt une relation entre les grandeurs z ∧ Etg,0 et z ∧ Etg,s , à savoir : p  Yj z ∧ Etg,0 = ( cos δj − i sin δj ) z ∧ Etg,s (5.90) n˜ j j =1

Il ne nous reste plus qu’à diviser les deux membres de cette égalité par la quantité z ∧ E0+ associée au champ incident pour obtenir la relation recherchée : t =

1+r p  j =1

(5.91) Y

( cos δj − i n˜ jj sin δj )

La seconde méthode est celle qui vient naturellement lorsque l’on utilise le formalisme des admittances, dans la mesure où la détermination des admittances aux interfaces constitue justement la première étape de calcul.

5.3.9 Matrices particulières 5.3.9.1 Couches demi-onde On appelle demi-onde (à la longueur d’onde λ0 ) une couche dont l’épaisseur optique vérifie la condition : λ0 (5.92) nj ej = q 2 où q désigne un entier positif. Cette condition n’a évidemment de sens que dans le cas d’un milieu transparent.

109

De l’Optique électromagnétique à l’Interférométrie

En conséquence, à incidence nulle et pour cette longueur d’onde λ0 , le déphasage δj est un multiple entier de π (δj = qπ), de sorte que la matrice Mj associée à cette couche prend, en l’absence d’absorption, la forme particulière suivante : ⎛ ⎞   i cos δj − sin δj ⎠ q 10 = ( − 1) Mj = ⎝ (5.93) n˜ j 01 −i n˜ j sin δj cos δj Cette matrice de passage est donc égale, soit à la matrice identité, soit à son opposé, et c’est la raison pour laquelle ces couches demi-onde sont également appelées couches absentes, parce qu’à la longueur d’onde λ0 , elles ne modifient pas les propriétés optiques du composant.

5.3.9.2 Couches quart d’onde On appelle couche quart d’onde (comme précédemment à la longueur d’onde λ0 ) une couche dont l’épaisseur optique respecte la condition : nj ej = (2q + 1)

λ0 4

(5.94)

où q désigne un entier positif ou nul. On en déduit aussitôt, à incidence nulle et pour la longueur d’onde λ0 : δj = (2q + 1) π2 , de sorte que la matrice de passage associée à cette couche est antidiagonale et de la forme : ⎞ ⎛ i 0 (5.95) Mj = ( − 1)q+1 ⎝ n˜ j ⎠ i n˜ j 0 Cette forme spécifique de la matrice conduit à une relation élémentaire entre les admittances de part et d’autre d’une couche quart d’onde (Yj Yj −1 = n˜ j2 ), largement utilisée pour le calcul des miroirs multidiélectriques. Supposons en effet que l’on dépose sur un substrat de verre une séquence de couches quart d’onde alternativement de haut et de bas indice, le filtre ainsi réalisé pouvant être décrit par la formule synthétique : Substrat / HBHBHBHB· · · HBH / Air où H et B désignent des couches d’épaisseur optique quart d’onde, de haut et bas indice. À cause de la forme particulière de la matrice associée à ces couches quart d’onde, il est possible de mener jusqu’au bout le calcul du coefficient de réflexion d’un tel empilement de manière analytique. En l’absence d’absorption et en incidence

110

5. Composants planaires

normale, on trouve : n0 ns R 1−4 2 nH



nB nH

p−1 (5.96)

où l’on voit que le paramètre clé est le rapport nH /nB , appelé choc d’indice ; en effet, on atteint plus rapidement (c’est-à-dire avec un plus petit nombre de couches minces) une valeur élevée de réflexion si le choc d’indice est grand. Lorsque le nombre de couches augmente, le coefficient de réflexion de ce miroir tend vers 1, et des valeurs aussi élevées que 99,995 % ont ainsi pu être obtenues. De telles valeurs, qui ne peuvent pas être obtenues avec des miroirs métalliques, sont indispensables à des composants comme les miroirs de gyrolaser (dont la zone aveugle est liée aux pertes), ou pour éviter les phénomènes de dégradation sous flux lumineux intense (élévation de température induite par l’absorption). On retiendra cependant que, lorsque le nombre de couches croît, le coefficient de réflexion finit par être majoré, en raison des phénomènes d’absorption et de diffusion.

5.3.9.3 Traitement antireflet Nous savons maintenant que le coefficient de réflexion en amplitude r d’un empilement est donné par la relation : r=

n˜ 0 − Y0 n˜ 0 + Y0

Concevoir un traitement antireflet consiste donc à définir, en indice et en épaisseur, la séquence de couches minces optiques qui réalise la condition Y0 n˜ 0 sur la plage de longueurs d’onde et le domaine angulaire les plus larges possibles. Comme déjà souligné en introduction, la disponibilité de ces couches antireflets est un point clé de la réalisation d’un système optique complexe, car, si celui-ci comprend N dioptres air-verre, sa transmission en énergie T est approximativement donnée, en l’absence de pertes par absorption, par la relation : T = (1 − R )N

(5.97)

où R désigne le coefficient de réflexion en énergie de chaque dioptre. Si le système optique considéré est conçu pour fonctionner dans le visible ou le proche infrarouge et fait appel dans sa conception à des verres classiques (n ∼ 1,5), ce coefficient R est de l’ordre de 4 %, de sorte que la transmission globale T approche 70 % pour un système simple à 5 lentilles et ne dépasse pas 30 % pour un dispositif plus complexe à 15 lentilles (objectif de microscope, zoom motorisé). La lumière réfléchie par ces différents dioptres participe en outre à la création d’une multitude d’images parasites, dont la position et les dimensions sont à la fois fonctions du design optique du système considéré et des caractéristiques optiques de la scène observée.

111

De l’Optique électromagnétique à l’Interférométrie

Elles ajoutent à l’image directe de cette scène un halo diffus qui nuit de manière très dommageable à la perception des détails qui la caractérisent. Si l’on considère maintenant le même système optique, mais fonctionnant dans le domaine de l’infrarouge proche (1 à 3 μm) ou moyen (3 à 15 μm), où les indices des matériaux utilisés pour sa fabrication peuvent approcher 4 (R ∼ 36 %), alors la transmission d’un système simple à 5 lentilles (caméra thermique utilisée pour la vision de nuit, par exemple) ne dépasse pas dans ce cas le pour cent. On comprend donc aisément l’importance absolument cruciale des traitements antireflets dans ce domaine particulier de longueur d’onde.

5.3.10 Réflexion totale Nous allons maintenant nous intéresser aux phénomènes de réflexion totale, qui méritent une attention particulière dans le cas des systèmes multicouches. En effet, ils donnent lieu à des phénomènes de résonance ou d’exaltation optique, accompagnés par l’apparition de lignes noires et de cônes brillants, et qui annoncent le lien entre l’optique en espace libre et l’optique guidée (ici planaire) ou modale.

5.3.10.1 Approche générale L’expression la plus générale du bilan d’énergie associé à un composant planaire multicouche s’écrit, en optique linéaire, comme : R +T +A +D = 1

(5.98)

où R et T désignent comme à l’accoutumée les coefficients de réflexion et de transmission en énergie de l’empilement considéré, tandis que A représente les pertes par absorption dans les différentes couches qui le constituent et D celles associées à la diffusion de la lumière par ce composant. En optique de précision, où l’on cherche à minimiser la grandeur 1 − R − T , le terme de diffusion est du même ordre de grandeur que le terme d’absorption (inférieur à 10−4 du flux incident), bien qu’il soit souvent omis. Ceci est dû au fait que la diffusion est un processus non spéculaire, c’est-à-dire que la quantité d’énergie qui lui est associée est répartie dans toutes les directions de l’espace. Pour rappel, la diffusion est un processus qui résulte d’une topographie imparfaite de la surface des composants (écart-type de l’ordre du nanomètre par rapport à un plan parfait), mais nous supposerons désormais que les surfaces sont parfaitement polies (rugosités négligeables). Le bilan optique s’écrit alors comme 1 = R + T + A, ou encore R + T = 1 en l’absence d’absorption.

112

5. Composants planaires

La réflexion totale est un phénomène bien connu, souvent présenté dans le cas d’un dioptre comme intervenant au-delà d’un angle limite à partir duquel il n’y a plus de réfraction (plus de faisceau transmis). On dit alors que le dioptre réfléchit totalement la lumière incidente, et que la transmission dans le substrat est nulle. Le bilan d’énergie s’écrit dans ces conditions comme : R = 1 − A, soit encore R = 1 en milieu transparent (et donc r = e iψ ). Dans le cas des multicouches, un grand nombre de surfaces est mis en jeu et la question est souvent posée de savoir sur quel dioptre il y a réflexion totale, ou si l’empilement peut modifier ce bilan d’énergie. Nous allons voir ci-après ce qu’il en est exactement. On dira que la réflexion sur un empilement est totale lorsque le coefficient de réflexion en énergie R est, en l’absence de diffusion et d’absorption, égal à 1. Ceci impose que le coefficient de transmission en énergie T soit donc égal à 0, et qu’il n’y ait en conséquence aucun flux optique qui se propage dans le substrat. Or, nous avons montré au paragraphe 5.3.8 que la partie utile de ce flux avait pour expression élémentaire, en l’absence de pertes magnétiques :     (n˜ s ) + 2 d + αs s  + |2  + |2 = (αs ) |A  (5.99) = |Etg, s | =  |A s dS 2 2ωμ ˜ 2ωμ0 s La quantité de flux se propageant dans le substrat est donc pilotée par la partie réelle de la quantité αs . En d’autres termes, la condition de réflexion totale ne dépend que de l’indice du substrat et est donnée par :   d + s  (5.100) = 0 ⇒ [αs ] = 0 ⇒ σ > ks dS On retrouve ainsi la coupure sur l’axe des pulsations spatiales, introduite au chapitre 4 : l’onde est évanescente dans le substrat. On sait d’autre part que la quantité σ constitue un invariant du problème, défini par les conditions d’éclairement σ = k0 sin θ0 . La relation (5.100) conduit ainsi à l’angle limite donné par sin θ0 = ns /n0 . Cette dernière condition impose par ailleurs, si l’on veut que la réflexion totale puisse avoir lieu à partir d’un certain angle, que : ns /n0 < 1. En conséquence, l’indice du superstrat doit être supérieur à celui du substrat (n0 > ns ). On notera ici que cette condition implique qu’il n’y a jamais réflexion totale en géométrie planaire, tant que le milieu incident est l’air (n0 = 1 = indice minimum). La figure 5.7 représente de manière schématique l’évolution avec la pulsation spatiale σ du coefficient de réflexion en énergie R d’un empilement multicouche transparent, dans une situation où il passe d’un régime de réflexion classique (σ < ks ⇔ R < 1) à un régime de réflexion totale (ks < σ < k0 ⇔ R = 1). Notons que l’expérience ne permet pas ici d’accéder, tout du moins en géométrie planaire, aux pulsations plus grandes que k0 , comme indiqué par la relation (5.100).

113

De l’Optique électromagnétique à l’Interférométrie

1,2 1,0

R 0,8 0,6

Non accessible à l'expérience

0,4 0,2 0,0

ks

k0

pulsation σ

Figure 5.7 Évolution avec la pulsation σ du coefficient de réflexion en énergie R d’un empilement multicouche transparent (le superstrat est supposé de haut indice [k0 > ks ]).

5.3.10.2 Champ évanescent Il est important de souligner à nouveau que l’onde évanescente, présente dans le substrat et qui caractérise ce régime de réflexion totale, ne transporte pas d’énergie. Par ailleurs, son amplitude devient rapidement négligeable dès que l’on s’éloigne dans le substrat. Il n’y a pas ici de contradiction avec le fait que la densité d’énergie électromagnétique, qui est une grandeur locale proportionnelle au carré du champ, ne soit pas nulle. Cette situation est quelquefois comparée à celle d’un liquide circulant dans un tuyau horizontal à section circulaire et dont la génératrice serait percée d’un trou de petite taille. Un mini jet d’eau vertical s’y développerait, l’eau montant et descendant à l’intérieur de cette petite fontaine, sans qu’il n’y ait à aucun moment d’énergie transportée par ce jet d’eau. Notons que, dans le substrat, avant la réflexion totale, le module du champ électrique ne dépend pas de z , alors qu’au-delà de l’angle limite, ce module varie en e −αs z . Ceci permet de définir la profondeur de pénétration zp de l’onde évanescente à l’intérieur du substrat, qui n’est rien d’autre que l’inverse de la quantité α et a donc pour expression : 1 1 (5.101) zp = =  2 αs σ − ks2 À l’angle limite, cette profondeur de pénétration tend vers l’infini, alors que, loin de cet angle limite, le champ évanescent se confine au voisinage de la surface (zp → 0).

114

5. Composants planaires

n0

ns

Champ évanescent

Figure 5.8 Montage permettant l’utilisation en réflexion totale d’un empilement multicouche.

Pour exciter un empilement multicouche en régime de réflexion totale, une solution souvent utilisée consiste à le déposer sur la face arrière plane d’une demi-boule, comme représenté à la figure 5.8, et à l’éclairer à travers le dioptre sphérique. Ceci permet de choisir un angle d’incidence arbitraire, tout en utilisant le verre comme milieu incident. Cette procédure garantit un haut indice pour le superstrat, puisqu’au final c’est l’air qui joue le rôle de substrat.

5.3.10.3 Découplage optique L’étude de la réflexion totale est aussi l’occasion d’introduire la notion de découplage optique, souvent désignée sous l’appellation d’effet tunnel optique. Supposons en effet, dans le cas de la figure 5.8, que soit réalisée la condition de réflexion totale (σ > ks ) tout en restant au voisinage proche de l’angle limite (σ = ks + δσ ). Imaginons maintenant qu’un gaz polluant ou une bactérie contaminante soit introduite dans le substrat d’air, augmentant ainsi ks d’une valeur δks . La nouvelle pulsation de coupure vaut alors : ks = ks + δks , de sorte que le phénomène de réflexion totale disparaît dès que l’on obtient : ks + δσ < ks + δks , c’est-à-dire δks > δσ . On dit alors qu’il y a découplage de l’onde évanescente dans le substrat, ou découplage par effet tunnel optique, mais on retiendra qu’il s ’agit en fait d’un effet interférentiel qui résulte de la modification du milieu substrat. Le même phénomène interviendrait si l’on approchait progressivement une autre demi-boule du côté air ; aux difficultés mécaniques près liées à la planéité des composants, l’énergie est découplée dès que la distance entre les demi-boules est suffisamment faible. Ces problèmes de planéité sont évités si l’on utilise une fibre optique

115

De l’Optique électromagnétique à l’Interférométrie

à la place de la deuxième demi-boule. Dans ce cas, il faut également tenir compte du phénomène de diffraction lié au diamètre réduit de la fibre. Ce dernier principe est à la base de la microscopie à effet tunnel optique, dans la mesure où le découplage dans la fibre va dépendre de sa distance à l’échantillon. En déplaçant ainsi l’extrémité de la fibre effilée de manière à ce que la quantité de lumière découplée dans la fibre reste constante, on va pouvoir réaliser un relevé topographique de la face inférieure de cet empilement, puisque l’obtention de ce découplage constant impose que la distance entre face inférieure et extrémité de la fibre reste elle aussi constante. Cette technique fait partie de celles désignées sous l’appellation générique de Microscopie optique en champ proche ou SNOM (Scanning Near Field Optical Microscopy).

5.3.10.4 Résonance optique On terminera ce paragraphe en introduisant la notion de résonance optique. On peut en effet remarquer que la présence d’une onde évanescente dans le substrat ne présage en rien de la forme du champ dans l’empilement. Celui-ci peut être trigonométrique ou hyperbolique dans la couche j , selon que le rapport σ/kj est inférieur ou supérieur à 1, respectivement. La répartition du champ stationnaire est donc arbitraire et on peut, dans certains cas, assister à des exaltations géantes de ce champ (ainsi que de l’absorption ou de la diffusion) pour certaines pulsations particulières σn . On parle alors de phénomène de résonance et celui-ci est accompagné par la présence d’un cône brillant en champ lointain, sur lequel se répartit l’énergie réfléchie. Ces phénomènes sont d’une grande instabilité (et donc d’une grande sensibilité) et sont aujourd’hui largement utilisés pour accroître la sensibilité des capteurs, ou pour réduire le seuil d’émission laser. Ils sont liés à la présence de pôles complexes dans le facteur de réflexion, que nous allons retrouver au paragraphe suivant dans le cas des modes guidés.

5.3.11 Vers l’optique intégrée L’analogie entre les phénomènes de réflexion totale et ceux de l’optique guidée est grande et mérite d’être mentionnée. Considérons un empilement multicouche déposé à la surface d’un substrat plan, et supposons que l’on soit capable de focaliser un faisceau lumineux sur la tranche de ce composant stratifié, comme représenté à la figure 5.9. Pour que la lumière injectée dans l’épaisseur du multicouche soit effectivement guidée (c’est-à-dire qu’il n’y ait pas de fuites par rayonnement en champ lointain dans les milieux extrêmes d’indice n0 et ns ), il faut que les champs dans le substrat et le superstrat soient de nature évanescente, ce qui impose que soient respectées les

116

5. Composants planaires

n0

Champ évanescent

ns

Champ évanescent

Figure 5.9 Utilisation d’un empilement multicouche en configuration guidée.

deux conditions suivantes : σ > ks

et σ > k0



σ > max(k0 , ks )

(5.102)

Toutefois, cette relation 5.102 est nécessaire mais non suffisante. En effet, l’onde se propageant sans fuite dans la direction transverse (selon x ), on peut considérer à partir d’une certaine distance que les sources sont à l’infini, de sorte que tout le formalisme jusqu’ici établi avec les admittances en l’absence de sources garde son sens. Cependant, il apparaît alors une différence majeure, qui réside dans l’absence d’onde incidente dans le superstrat. En conséquence, l’onde est uniquement rétrograde dans ce milieu, de sorte que son admittance est égale à son indice effectif, soit : Y0 = −n˜ 0 . On en déduit : n˜ 0 − Y0 r = =∞ (5.103) n˜ 0 + Y0 On assiste donc à une discrétisation de la pulsation spatiale (σ = σn ), dont les valeurs remarquables, dites constantes de propagation, sont données par : r (σn ) = ∞. Ainsi les constantes modales sont les pôles du coefficient de réflexion. Il faut ensuite s’interroger sur l’existence de ces pôles, et l’on se contentera pour cela d’exprimer une condition nécessaire. On montre en effet que si ces pôles existent, alors ils doivent vérifier : max (k0 , ks ) < σn < max (kj ) où max (kj ) désigne le plus grand k des matériaux de l’empilement. Cette dernière relation fait ainsi apparaître la fenêtre modale des pulsations. Elle impose que l’une au moins des couches de l’empilement soit de haut indice (i.e. d’indice supérieur à ceux des milieux extrêmes). Cette condition permet alors de définir un angle de propagation θj dans la couche j : sin θj = σ/kj . Nous clôturerons cette partie en précisant l’analogie entre résonances en réflexion totale et propagation guidée. A priori, ces phénomènes semblent très différents, puisque les fenêtres de pulsation sont disjointes. En effet, dans le cas de la réflexion

117

De l’Optique électromagnétique à l’Interférométrie

totale, on a : ks < σn < k0 , tandis qu’en optique guidée, la condition s’écrit : max (k0 , ks ) < σn < max (kj ). Par ailleurs, les pôles du facteur de réflexion ne peuvent pas être réels en réflexion totale (la réflexion est majorée par l’unité), alors qu’ils peuvent être réels en optique guidée (le facteur de réflexion, dont la définition mathématique est inchangée, ne correspond plus à un bilan d’énergie). Pour entrevoir l’analogie annoncée, il faut imaginer, dans le cas de la réflexion totale, insérer une couche (un gap) d’indice ns entre le superstrat et le composant. On comprend alors intuitivement que, lorsque l’épaisseur e de cette couche augmente progressivement, les 2 configurations se rejoignent asymptotiquement : lim R (σ , e ) = Rg (σ ) (5.104) e →∞

Dans cette relation, R vaut pour la réflexion totale, tandis que Rg vaut pour l’optique guidée. On notera que faire croître l’épaisseur e revient à remplacer progressivement le superstrat par un matériau identique au substrat. Pratiquement une épaisseur de quelques microns suffit pour que la partie réelle du pôle en réflexion totale soit identique à la constante de propagation modale (réelle). Ce résultat explique pourquoi le couplage par prisme se fait à partir des résonances à la réflexion totale.

5.4 Réseaux de diffraction Jusqu’ici nous avons toujours considéré des surfaces planes séparant des volumes homogènes et montré que, dans ce cas, la pulsation spatiale σ = k sin θ, qui est caractéristique de l’onde incidente élémentaire était conservée et constituait ainsi un invariant du problème, souvent désigné comme l’invariant de Snell-Descartes. Nous allons maintenant nous intéresser à des surfaces présentant un relief périodique et montrer que l’énergie réfléchie par une telle structure se trouve discrétisée dans un ensemble de directions particulières de l’espace, souvent appelées ordres de diffraction. Lorsque le profil de la surface devient de nature aléatoire, cette discrétisation tend vers un continuum et le phénomène de diffraction est progressivement remplacé par un mécanisme de diffusion. Nous conserverons l’approche 2D utilisée jusqu’à présent et définirons le profil de cette surface périodique par une fonction du type z = h(x ), pour laquelle la seule condition imposée est qu’elle soit périodique, de période d , ce que l’on exprime mathématiquement en écrivant simplement que h(x + d ) = h(x ). Comme toujours dans ce chapitre, nous restreignons l’étude de ce profil à son interaction avec une onde élémentaire dont la projection est donnée par : i(σ0 x +α0 z ) E + (x, z ) = A+ 0e

avec σ0 = k0 sin θ0

(5.105)

Nous n’avons pas d’information a priori sur le champ réfléchi E − (x, z ), mais, compte tenu de la linéarité du problème, nous pouvons affirmer qu’il se déduit du champ

118

5. Composants planaires

incident par application d’un opérateur linéaire que nous noterons L, soit :   E − (x, z ) = L E + (x, z ) (5.106) Si, dans l’expression précédente, nous effectuons le changement de variable x → x + d , le problème que nous avons à traiter reste identique, compte tenu de la périodicité de la topographie de surface. On peut donc écrire :     E − (x + d, z ) = L E + (x + d, z ) = L e iσ0 d E + (x, z ) (5.107) La quantité exp (i σ0 d ) est une constante scalaire, que l’on peut sortir de l’opérateur linéaire. Il vient alors :   E − (x + d, z ) = e iσ0 d L E + (x, z ) = e iσ0 d E − (x, z ) (5.108) ce qui établit le caractère pseudo-périodique du champ réfléchi, défini par la périodicité de son module : (5.109) |E − (x + d, z )| = |E − (x, z )| Si nous introduisons maintenant la fonction annexe F (x, z ) définie par :

F (x, z ) = e −iσ0 x E − (x, z )

(5.110)

on montre rapidement que celle-ci est périodique en x , de période d :

F (x + d, z ) = e −iσ0 (x +d ) E − (x + d, z ) = e −iσ0 (x +d ) e iσ0 d E − (x, z ) = F (x, z )

(5.111)

Ce dernier résultat est majeur puisque l’on peut alors faire appel à une propriété générale, qui est le développement en série de Fourier de toute fonction périodique. Dans notre cas, la périodicité a lieu selon x , qui est la variable intervenant dans les fonctions de base, ces dernières étant des exponentielles de période d . On obtient :  x F (x, z ) = Fq (z )e 2iπ q d (5.112) q

À partir de là, on peut calculer le champ comme :  x E − (x, z ) = e iσ0 x F (x, z ) = e iσ0 x Fq (z )e 2iπ q d =

 q

q

Fq (z )e iσq x

avec σq = σ0 + q

2π d

(5.113)

119

De l’Optique électromagnétique à l’Interférométrie

Il ne nous reste plus qu’à déterminer la fonction Fq . Pour cela, nous utilisons l’équation d’Helmholtz que vérifie le champ : ∂ 2E − ∂ 2E − + + k 2E − = 0 ∂z 2 ∂x 2

(5.114)

En utilisant le développement en série de ce champ établi en (5.113), il vient :  ∂ 2 Fq q

∂z 2

e iσq x −



σq2 Fq (z )e iσq x + k 2

q



Fq (z )e iσq x = 0

(5.115)

q

Les coefficients Fq obéissent donc à l’équation différentielle du second ordre suivante : ∂ 2 Fq + αq2 Fq (z ) = 0 ∂z 2

avec αq2 = k 2 − σq2

(5.116)

dont les solutions générales sont données par des expressions du type : −iαq z Fq (z ) = F− q e

(5.117)

puisque le champ recherché est de nature rétrograde. L’expression générale de ce champ réfléchi (on dira souvent diffracté ) est donc la suivante :    i(σq x −αq z ) i βq · ρ E − (x, z ) = Fq (z )e iσq x = F− = F− (5.118) q e q e q

q

q

où βq désigne le vecteur d’onde de l’ordre diffracté q, dont les coordonnées sont définies par :  2π   σ0 + q  d βq =  0 avec βq · βq = k 2 (5.119)   −α q On retrouve ainsi une relation classique dite loi des réseaux, donnée par : σq = σ0 + q

2π d



sin θq = sin θ0 + q

λ n0 d

(5.120)

Cette loi indique que l’énergie réfléchie se retrouve sous la forme de plusieurs faisceaux diffractés dans les directions θq . On notera ici qu’il existe toujours un ordre diffracté dans la direction de réflexion spéculaire donnée par les lois de Descartes, à savoir θ = θ0 . On parle alors d’ordre zéro, pour faire référence à l’entier q = 0 qui caractérise cet ordre.

120

5. Composants planaires

Pour illustration, plaçons-nous dans le cas de l’incidence normale (θ0 = 0). La loi des réseaux s’écrit comme : λ sin θq = q (5.121) n0 d Pour que le champ diffracté dans l’ordre q soit propagatif (et donc non évanescent), il faut que la quantité αq associée soit un réel, ce qui impose que soit vérifiée la condition : λ σq2 < k02 ⇒ q (5.122) = sin θq < 1 n0 d Cette condition est toujours vérifiée pour l’ordre zéro, mais impose que la période optique n0 d soit plus grande que la longueur d’onde pour qu’existent d’autres ordres diffractés. Cela signifie que des structures de période inférieure à la longueur d’onde ne renvoient pas de lumière en dehors de la direction du faisceau réfléchi. On dit pour traduire ce phénomène que la lumière ne voit pas les périodes plus petites que la longueur d’onde de son rayonnement, ce qui nous ramène à nouveau à la problématique de résolution optique spatiale. En incidence oblique, on peut reprendre le même raisonnement pour aboutir à la moitié d’une longueur d’onde. Il est important de préciser plus avant cette notion de résolution, car la lumière permet bien évidemment de détecter la présence d’un objet de taille inférieure à la longueur d’onde. Ce résultat n’apparaît pas clairement ici parce que l’objet est une surface périodique. Dans le cas d’un défaut isolé, celui-ci peut être décomposé en ses différentes composantes spatiales (périodiques) de Fourier, dont la lumière ne verra en champ lointain que les basses fréquences (σ < 2k0 ). En d’autres termes, l’objet sub-lambda sera détecté, mais sa forme exacte ne pourra pas être reconstruite. C’est pour cela qu’il est plus exact de dire que la lumière ne voit pas les fréquences spatiales supérieures à 2 fois l’inverse de la longueur d’onde, encore que ce résultat découle d’une approche perturbative, et caractéristique d’une détection en champ lointain. On retiendra par ailleurs l’existence d’une infinité d’ordres évanescents, qui ne transportent pas d’énergie mais sont susceptibles d’être découplés. Enfin, nous n’avons pas cherché à déterminer l’amplitude des ordres diffractés, dont le calcul n’est pas immédiat dans le cas général.

121

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Énergie, causalité et cohérence Chapitre conçu par Claude Amra et Michel Lequime rédigé par Claude Amra et Michel Lequime

Sommaire 6.1

6.2 6.3

6.4

Bilan d’énergie en régime spatio-temporel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.3 Composantes harmoniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relations de Kramers-Kronig . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cohérence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Approche générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Cohérence temporelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.3 Temps de cohérence, longueur de cohérence . . . . . . . . . . . . . . . . . . . . . . . . . . . Signal analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Fonctions complexes de la variable temporelle . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Définition du signal analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 Champ monochromatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.4 Champ quasi-monochromatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.5 Utilisation du signal analytique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

124 124 125 127 130 133 133 134 136 137 138 138 140 140 141

123

De l’Optique électromagnétique à l’Interférométrie

Nous avons choisi d’aborder dans ce chapitre 6 trois concepts particulièrement importants, qui s’inscrivent à l’évidence dans le champ de l’Optique électromagnétique, mais dont les implications seront perceptibles aussi bien en formation des images qu’en interférométrie. Ces trois concepts concernent : • la définition d’un bilan de l’énergie associée à un champ électromagnétique en régime spatio-temporel ; • les conséquences du principe de causalité sur la dépendance spectrale de la susceptibilité, électrique ou magnétique, d’un milieu matériel ; • la définition de la cohérence d’un rayonnement électromagnétique et l’étude des grandeurs qui pilotent notamment sa capacité à interférer avec lui-même. Nous donnerons aussi, en conclusion de ce chapitre, quelques éléments d’information sur la notion de signal analytique, souvent utilisée en électromagnétisme, et que nous emploierons d’ailleurs pour présenter le concept de polarisation partielle au chapitre 9 ou celui de fonctions d’auto-corrélation temporelle d’ordres 1 et 2 au chapitre 21.

6.1 Bilan d’énergie en régime spatio-temporel 6.1.1 Introduction Nous avons vu au chapitre 2 comment établir un bilan d’énergie en régime harmonique, puis avons affiné cette approche au chapitre 4 dans le cas du paquet d’ondes spatial. Toutefois, jusqu’ici, les notions introduites n’ont pas concerné le régime spatio-temporel. On se propose donc d’exprimer maintenant l’énergie associée à une lumière à spectre large en fonction de celle transportée par chacune de ses composantes monochromatiques. Précisons de suite que la nature intrinsèquement quadratique de ces grandeurs énergétiques ne nous permettra plus de faire ici appel au principe de superposition, principe que nous avions abondamment utilisé dans le cas où seules comptaient les amplitudes des champs. D’autre part, nous ne reviendrons pas sur les notions fondamentales d’énergie et de travail, mais fonctionnerons par simple analogie de manière à directement aboutir à un bilan utilisable dans le cas particulier qui nous occupe, à savoir celui de l’optique électromagnétique. On se place donc ici dans le cas général du régime spatio-temporel, dans lequel les équations de Maxwell s’écrivent : ⎧ ∂  →E ( ⎪  ( rot ρ , t ) = − B( ρ, t ) + M ρ, t ) ⎨− ∂t (6.1) ∂ ⎪ →H ⎩−  (  ρ, t ) rot ρ , t ) = J ( ρ , t ) + D( ∂t

124

6. Énergie, causalité et cohérence

les différents champs introduits vérifiant en outre les relations constitutives suivantes :   ](  ρ , t ) = [μ  H ρ, t ) B( (6.2)   D( ρ , t ) = [  E ]( ρ, t ) où la convolution porte sur le temps.  ) sont introduits pour Les vecteurs sources (courants électrique J et magnétique M décrire le cas le plus général correspondant à des sources réelles ou fictives. Comme représenté à la figure 6.1, ces sources ont pour support spatial un domaine  et sont à l’origine des champs.

M, J

Σ Ω

 dans un domaine  entouré par une surface fermée fictive  . Figure 6.1 Courants J et M

6.1.2 Définitions Pour identifier une relation susceptible de décrire ce bilan d’énergie, nous allons chercher à utiliser des formulations mathématiques qui impliquent des produits de sources et de champs, de façon à faire apparaître la puissance fournie par ces sources. De plus, intuitivement, on souhaiterait exprimer que la puissance fournie par les sources dans le domaine  donne lieu à un flux rayonné en champ lointain à travers toute surface fermée  entourant ce domaine, moyennant l’introduction d’un terme de pertes à l’intérieur du domaine . On voit donc que la formule recherchée doit faire intervenir conjointement des surfaces et des volumes, ce qui nous amène à considérer le recours à un terme de divergence dont on sait que l’intégrale sur un volume se ramènera à une intégrale de  , on surface. Si l’on considère ainsi le vecteur de Poynting défini par : P = E ∧ H obtient : →E − E · − →H ]=H  ·−  rot rot (6.3) divP = div[E ∧ H soit encore, en utilisant les équations de Maxwell :  ·H  − J · E ) − (H  · divP = (M

∂ ∂  B + E · D) ∂t ∂t

(6.4)

125

De l’Optique électromagnétique à l’Interférométrie

Après intégration sur le volume , on obtient :    ∂ ∂       · B + E · D)  dV (6.5) P · n dS = (M · H − J · E ) dV − (H ∂t ∂t    où n est la normale locale à la surface  dirigée vers l’extérieur du domaine , dS un élément de surface et dV un élément de volume. On dispose ainsi d’une relation instantanée permettant d’assimiler, par analogie : • P · n = d /dS à la densité surfacique de flux  rayonné par les sources à travers la surface fermée  entourant le domaine  ;  ·H  − J · E = dF /dV à la densité volumique de puissance F fournie par les • M sources dans le domaine  ;  · ∂ B + E · • H ∂t domaine .

∂ ∂t

 = dA/dV à la densité volumique de « pertes » A dans le D

On notera ici que nous avons défini un vecteur de Poynting réel, compte tenu du cadre spatio-temporel qui nous intéresse, et dans lequel toutes les grandeurs sont réelles. Nous verrons plus loin comment relier ce vecteur à celui introduit dans le cas du régime harmonique, qui est complexe et précédé d’un facteur 12 . Pour l’instant, notons que la relation (6.5) s’écrit encore comme :    d = dF − dA ⇒ F (, t ) = (, t ) + A(, t ) (6.6) 





Ainsi, à chaque instant, la puissance fournie dans le domaine  est égale au flux sortant à travers la surface limitant , complété des pertes générées à l’intérieur de ce même volume . On notera que cette relation (6.6) est instantanée et non locale. Dans le cas général, il est délicat de préciser plus avant les notions d’énergie sans alourdir le formalisme. Toutefois, en l’absence de dispersion, c’est-à-dire pour une réaction instantanée de la matière, nous avons vu que les convolutions temporelles disparaissaient dans les relations constitutives, de sorte que le terme de pertes se réduit à : dA ∂ ∂ 1 ∂  · H  2 + E 2 )  +  E · E = = μH (H (6.7) dV ∂t ∂t 2 ∂t Si on introduit maintenant la grandeur w, définie par : w= alors la relation (6.7) s’écrit :

126

1  2 2 (H + E ) 2

∂w dA = dV ∂t

(6.8)

(6.9)

6. Énergie, causalité et cohérence

et on obtient finalement, à chaque instant t : ∂W F (, t ) = (, t ) + () avec W () = ∂t

 

w dV

(6.10)

Après intégration temporelle sur une durée τ , on obtient sur le domaine  :  τ  τ F (, t ) dt = (, t ) dt + [W (τ ) − W (0)] (6.11) 0

0

Ainsi, pendant la durée τ , la différence entre la puissance fournie et le flux sortant est égale à la variation W d’énergie électromagnétique dans le volume . Ceci définit donc w = dW /dv comme une densité volumique d’énergie électromagnétique, dont la variation instantanée est égale à la densité volumique de pertes (dA/dV = ∂w/∂t ). On notera cependant qu’en présence de dispersion, l’intégration que nous avons utilisée en (6.7) n’est plus immédiate, puisque l’on aurait :   dA ∂w  · μ ∂ H  + E ·   ∂ E = =H (6.12) dV ∂t ∂t ∂t

6.1.3 Composantes harmoniques Nous allons maintenant introduire dans les relations précédentes l’expression générale du champ sous forme de paquet d’ondes fréquentiel (polychromatique), comme nous l’avons défini au chapitre 3. Pour cela, chaque champ spatio-temporel E ( ρ , t ) ou  ( H ρ , t ) est remplacé par son intégrale de reconstruction de Fourier. Intéressons-nous tout d’abord à la densité surfacique de flux d /dS :    d t −2iπ ft  −2iπ f   ( n= E( ρ , f )e df ∧ H ρ , f )e df = P . . n dS f f   

  ( = e −2iπ(f +f )t E( ρ, f ) ∧ H ρ , f  ) . n df df  (6.13) f

f



À ce stade, le flux est une fonction du temps et nous avons donc à tenir compte des battements entre les ondes harmoniques aux différentes fréquences f et f . Mais, dans le domaine visible, la fréquence f d’oscillation temporelle des champs est extrêmement élevée, de l’ordre de quelques centaines de terahertz f =

c λ0



f  600 × 1012 Hz pour λ0 = 0,5 μm

(6.14)

ce qui correspond à une période temporelle 1/f n’excédant pas 2 × 10−15 s.

127

De l’Optique électromagnétique à l’Interférométrie

Le temps de montée d’un détecteur classique étant de l’ordre de la nanoseconde, celui-ci ne pourra pas suivre l’oscillation optique et délivrera en conséquence un courant de valeur constante au cours du temps. On admettra ici que ce mode de fonctionnement est de type intégrateur parfait, ce qui signifie que le courant électrique I délivré par le détecteur est proportionnel à la moyenne temporelle de la densité surfacique de flux qu’il reçoit, soit :    +T /2 d d I =K (6.15) dt = K dS T −T /2 dS où le symbole  T désigne cette moyenne temporelle réalisée sur le temps d’intégration T du détecteur, supposé très grand devant les périodes optiques du paquet fréquentiel (T 1/f ) et K une constante de proportionnalité. On peut signaler ici qu’un traitement rigoureux de la détection optique devrait en outre faire intervenir l’aspect corpusculaire de la lumière (et des charges électriques que ces photons génèrent). Ce point sera analysé plus en détail au chapitre 15 de cet ouvrage. Exprimons donc la moyenne temporelle de cette densité surfacique de flux :      

d   ( = e −2iπ(f +f )t E( ρ, f ) ∧ H ρ , f  ) · n df df  (6.16) dS T f f T

soit encore, en permutant les intégrales fréquentielles et la moyenne temporelle :        d   ( = E( ρ, f ) ∧ H ρ , f  ) · n e −2iπ(f +f )t df df  (6.17) T dS T f f Compte tenu de l’importance du rapport entre le temps d’intégration T et les périodes optiques f1 ou f1 mises en jeu dans le paquet fréquentiel, on admettra ici qu’il est possible de confondre le résultat de la moyenne temporelle avec celui d’une intégration sur le temps t entre −∞ et +∞, soit :  +∞     e −2iπ(f +f )t dt = δ(f + f  ) (6.18) e −2iπ(f +f )t  T

−∞

où δ désigne l’impulsion de Dirac. En utilisant les propriétés de cette distribution, la relation (6.17) s’écrit :     d  ( = E( ρ , −f ) ∧ H ρ , f ) · n df (6.19) dS T f Si nous prenons maintenant en compte la symétrie hermitienne du champ, cette dernière relation devient :     d  ( = E∗ ( ρ, f ) ∧ H ρ , f ) · n df (6.20) dS T f

128

6. Énergie, causalité et cohérence

soit encore, en restreignant notre sommation aux seules fréquences positives :    ∞   d  ( =2

[E∗ ( ρ, f ) ∧ H ρ , f )] · n df (6.21) dS T 0 On retrouve ainsi, sous le signe intégral, un terme correspondant à l’expression du  ) introduite au chapitre 2.  = 1 (E∗ ∧ H vecteur de Poynting en régime harmonique  2 En conséquence, nous pouvons écrire :    ∞ d   · n ] df =  n · P T = 4

[ (6.22) dS T 0 soit encore, en introduisant la densité surfacique de flux par unité de fréquence temporelle, ou densité surfacique de flux monochromatique :  2  d   · n ] = 4 [ (6.23) dfdS T Ce résultat prolonge à la fréquence temporelle une propriété démontrée au chapitre 4 pour les fréquences spatiales, à savoir que le flux transporté par un paquet d’ondes est égal à la somme des flux transportés par chacune de ses composantes élémentaires. On retiendra également, comme exprimé par la relation (6.23), que le flux de Poynting harmonique correspond à une moyenne temporelle du flux monochromatique. Chacun pourra vérifier que la même approche pourrait être utilisée pour le calcul des densités volumiques de puissance et de pertes définies au paragraphe 6.1.2. On obtiendrait ainsi, pour la densité volumique de puissance monochromatique :  2 

 d F  ∗ (  ( = 2 M ρ, f ) · H ρ , f ) − J ∗ ( ρ , f ) · E( ρ, f ) (6.24) dfdV T et enfin, pour la densité volumique d’absorption monochromatique, sans négliger cette fois l’inertie de la matière :  2 

 d A  ∗ (  ( = 2 −i ωH ρ , f ) · B( ρ , f ) − i ωE∗ ( ρ, f ) · D ρ, f ) (6.25) dfdV T soit encore :  2 

 d A  |2 ( = −2ω i μ(f ˜ )|H ρ , f ) + i ˜ (f )|E|2 ( ρ, f ) dfdV T 

 |2 ( ρ , f ) + ˜  (f )|E|2 ( ρ, f ) = 2ω μ ˜  (f )|H

(6.26)

où μ ˜  (f ) et ˜  (f ) désignent les parties imaginaires de la perméabilité magnétique et de la permittivité électrique du milieu. On notera à cette occasion que ces dernières grandeurs sont donc positives.

129

De l’Optique électromagnétique à l’Interférométrie

Au final, on retiendra que le bilan d’énergie pourra s’obtenir, d’un point de vue mnémo-technique et en omettant la notation  T , par intégration des doubles densités spectrales complexes, volumiques et surfaciques, définies par :  1 ∗ 1 d 2F  ( M ( ρ, f ) · H ρ , f ) − J ∗ ( ρ , f ) · E( ρ, f ) = 4 dfdV 2 1 d 2  · n = 4 dfdS

(6.27)

 iω 1 d 2A  |2 ( μ(f ˜ )|H ρ , f ) + ˜ (f )|E|2 ( ρ, f ) =− 4 dfdV 2

grandeurs dont il faudra ensuite considérer la partie réelle. L’introduction du facteur 14 permet ici une normalisation traditionnelle par rapport au flux transporté par une onde progressive monochromatique monodirectionnelle. Pour une telle onde plane, en effet, la dépendance temporelle du vecteur de Poynting P est en cos2 ωt , et sa valeur moyenne temporelle est donc égale à 12 . Il en résulte que le flux transporté par cette onde est bien égal à [P · n ], ce qui justifie a posteriori l’introduction du coefficient 12 dans la définition du vecteur de Poynting harmonique au chapitre 2. En conclusion, ce paragraphe justifie que l’on puisse analyser une lumière à spectre large en considérant successivement l’ensemble de ses longueurs d’onde et établir un bilan d’énergie séparé pour chacune d’entre elles. On retiendra cependant que c’est l’aspect intégrateur de la détection qui permet d’éliminer ici les phénomènes de battements (ou d’interférences) entre les différentes longueurs d’onde du même faisceau. Ces résultats seraient à revoir dans le domaine micro-onde, où les détecteurs peuvent suivre les variations temporelles du signal électromagnétique, du fait de la valeur plus grande des périodes temporelles qui y sont mises en jeu.

6.2 Relations de Kramers-Kronig Nous avons souligné en fin de chapitre 1 l’importance du principe de causalité, qui affirme que l’effet ne peut précéder la cause. C’est la raison pour laquelle la fonction susceptibilité, qu’elle soit électrique ou magnétique, et qui relie la polarisation de la matière à l’excitation qui l’induit, doit vérifier la propriété : χ (t ) = 0

∀t < 0

(6.28)

Cette condition peut être mise sous la forme équivalente suivante : χ (t ) = Sgn(t ) χ (t )

130

(6.29)

6. Énergie, causalité et cohérence

où Sgn(t ) désigne la fonction Signe, définie au paragraphe A.3.6.1. En effet, si t < 0, Sgn(t ) = −1, ce qui signifie que la fonction χ (t ) est égale à son opposé et est donc identiquement nulle. À l’inverse, si t > 0, Sgn(t ) = +1 et la relation (6.29) est évidemment vérifiée, sans que cela ne contraigne en aucune manière la fonction susceptibilité. Si nous appliquons maintenant une transformation de Fourier aux deux termes de l’égalité (6.29), il vient aussitôt :  +∞   χ˜ ](f ) χ˜ (f ) = χ (t )e 2iπ ft dt = [Sgn (6.30) −∞

La transformée de Fourier de la fonction Signe est donnée ici par l’expression (cf. paragraphe A.3.6.1 de l’Annexe consacrée aux outils mathématiques) :   1 1  (6.31) Sgn(f ) = − VP iπ f où les initiales VP désigne la distribution dite en valeur principale de Cauchy. Par conséquent :

  1 1  χ˜ (f ) χ˜ (f ) = − VP iπ f

soit encore, en développant le produit de convolution :  1 +∞ χ˜ (u) du χ˜ (f ) = − − i π −∞ f − u

(6.32)

(6.33)

Par conséquent, si nous faisons maintenant apparaître les parties réelle χ˜  (f ) et imaginaire χ˜  (f ) de la fonction χ˜ (f ), nous pouvons écrire : ⎧  1 +∞ χ˜  (u) ⎪   ⎪ ⎪ du ⎨ χ˜ (f ) = ˜r (f ) − 1 = − π − −∞ f − u (6.34)  ⎪ 1 +∞ χ˜  (u) ⎪   ⎪ (f ) =  ˜ (f ) = − du χ ˜ ⎩ r π −∞ f − u Ces deux dernières relations constituent les relations de Kramers-Kronig. On dit aussi que les parties réelle et imaginaire de la composante fréquentielle de la susceptibilité sont liées par une transformation de Hilbert. Les relations (6.34) montrent que, si toutes les valeurs de la fonction χ˜  (respectivement χ˜  ) sont connues, alors la fonction χ˜  (respectivement χ˜  ) est entièrement déterminée. Notons que l’on pourrait réduire les intégrations apparaissant dans les relations (6.34) aux seules fréquences positives. En effet, compte tenu de la symétrie

131

De l’Optique électromagnétique à l’Interférométrie

hermitienne de la susceptibilité, les parties réelle et imaginaire de sa transformée de Fourier sont respectivement paire et impaire, soit : χ˜  ( − f ) = χ˜  (f )

et χ˜  ( − f ) = −χ˜  (f )

(6.35)

Ces relations de Kramers-Kronig sont très utiles à l’analyse des phénomènes de dispersion en fréquence. Remarquons tout d’abord que si le milieu est non absorbant [χ˜  (f ) = 0 pour toutes les fréquences], on obtient immédiatement : χ˜  (f ) = 0, de sorte que sa permittivité se réduit à celle du vide ( = 0 ), c’est-à-dire le seul milieu véritablement parfait. Mais on peut aller plus loin en étudiant la dérivée de la partie réelle de la susceptibilité. Il vient en effet :  ∂ χ˜  1 +∞ χ˜  (u) du = − ∂f π −∞ (f − u)2   1 0 χ˜  (u) 1 +∞ χ˜  (u) = − du + du (6.36) − π −∞ (f − u)2 π 0 (f − u)2 Compte tenu de la symétrie impaire de χ˜  (f ), on peut transformer la première intégrale comme suit :  +∞  0 χ˜  (u) χ˜  (u) du = −− du (6.37) − 2 (f + u)2 −∞ (f − u) 0 ce qui nous permet d’écrire :   +∞ 1 ∂ χ˜  1  du χ˜ (u) − =− π ∂f (f − u)2 (f + u)2 0  +∞ u χ˜  (u) du = 4− (f 2 − u 2 )2 0

(6.38)

Compte tenu de l’égalité χ˜  = r et du caractère positif de la partie imaginaire de la permittivité relative électrique r , la relation (6.38) montre que la dérivée ∂ χ˜  /∂f = ∂ ˜r /∂f est positive. C’est cette propriété que nous avons utilisée au chapitre 3 pour justifier un changement de variable utile au calcul de la vitesse de groupe. On notera ici que, dans une zone de transparence d’un milieu nonmagnétique (μ ˜ r = 1), l’indice de réfraction est réel et défini par la relation : n = ˜r , de sorte qu’il croît lui aussi avec la fréquence ou, ce qui revient au même, décroît quand la longueur d’onde augmente. Chacun pourra aisément vérifier que l’on obtient de la même manière, pour la partie imaginaire de la susceptibilité :  +∞ ∂ χ˜  f 2 + u2 χ˜  (u) du π = 2− ∂f (f 2 − u 2 )2 0

132

(6.39)

6. Énergie, causalité et cohérence

6.3 Cohérence Les considérations développées au paragraphe 6.1 nous amènent naturellement à introduire ici la notion de cohérence, qui, elle aussi, fait intervenir le caractère quadratique et intégrateur de la détection optique.

6.3.1 Approche générale Dans une expérience de pensée, considérons une région de l’espace où se propage un champ électromagnétique E ( ρ , t ) et plaçons à l’intérieur de cette région un écran opaque percé de deux trous permettant d’isoler les valeurs prises par ce champ aux points ρ1 et ρ2 , tel que représenté à la figure 6.2. Il s’agit donc là d’une expérience de pensée de type trous d’Young.

ER ( ρ, t)

E ( ρ 1, t) E ( ρ 2, t)

Figure 6.2 Expérience de pensée de type trous d’Young.

Le champ ER ( ρ , t ), résultant de la superposition, au point de coordonnées ρ , de ces deux champs élémentaires, a pour expression générale ; | ρ − ρi | ER ( ρ , t ) = E ( ρ1 , t − t1 ) + E ( ρ2 , t − t2 ) avec ti = c

(6.40)

Si nous plaçons maintenant un détecteur au point de coordonnées ρ , celui-ci va, comme indiqué au paragraphe 6.1.3, délivrer un courant proportionnel à la moyenne temporelle du carré du champ résultant, soit : I = K ER2 ( ρ , t ) T = K E 2 ( ρ1 , t − t1 ) T + K E 2 ( ρ2 , t − t2 ) T + 2K E ( ρ1 , t − t1 ) · E ( ρ2 , t − t2 ) T (6.41)

133

De l’Optique électromagnétique à l’Interférométrie

Supposons maintenant que le champ initial considéré soit stationnaire, ce qui revient à dire que les moyennes temporelles qui apparaissent dans la relation (6.41) ne dépendent pas du choix de l’origine des temps. Dans ces conditions, il vient : I = E 2 ( ρ1 , t ) T + E 2 ( ρ2 , t ) T + 2E ( ρ1 , t ) · E ( ρ2 , t − τ ) T

(6.42)

où τ désigne la différence t2 − t1 et où, pour plus de lisibilité, nous avons omis de rappeler la présence de la constante de proportionnalité K . Cette dernière expression peut être mise sous la forme équivalente suivante : I = I1 + I2 + 2 ( ρ1 , ρ 2 , τ ) avec

ρ1 , t ) T I1 = E 2 ( 2  I2 = E ( ρ2 , t ) T

(6.43)

(6.44)

( ρ1 , ρ 2 , τ ) = E ( ρ1 , t ) · E ( ρ2 , t − τ ) T Dans les relations (6.43) et (6.44), I1 (respectivement I2 ) correspond au courant délivré par le détecteur lorsque le trou situé en ρ2 (respectivement en ρ1 ) est obturé et ( ρ1 , ρ 2 , τ ) désigne la fonction de cohérence mutuelle des deux champs qui viennent se superposer au niveau de ce détecteur. On notera que l’on peut écrire : I1 = ( ρ1 , ρ 1 , 0) et I2 = ( ρ2 , ρ 2 , 0)

(6.45)

On a coutume d’introduire à ce stade le degré de cohérence mutuelle γ ( ρ1, ρ 2 , τ ) qui n’est rien d’autre qu’une expression normalisée de la fonction de cohérence mutuelle et s’écrit donc : ( ρ1 , ρ 2 , τ )  γ ( ρ1 , ρ 2 , τ ) =  ( ρ1 , ρ 1 , 0) ( ρ2 , ρ 2 , 0)

(6.46)

Ceci va nous permettre de reformuler la relation (6.43) de la manière suivante :  ρ1 , ρ 2 , τ ) (6.47) I = I1 + I2 + 2 I1 I2 γ ( et faire ainsi apparaître le lien profond qui existe entre ce degré de cohérence mutuelle et la manière dont les deux champs élémentaires sont susceptibles d’interférer l’un avec l’autre.

6.3.2 Cohérence temporelle Les notions que nous venons d’introduire sont d’une portée extrêmement générale et permettent ainsi d’analyser, avec des approches similaires, des problèmes aussi variés que la cohérence spatiale de l’éclairage d’un système optique (que nous aborderons

134

6. Énergie, causalité et cohérence

de manière restreinte au chapitre 12), le degré de polarisation d’une onde lumineuse (qui sera développé de manière détaillée au chapitre 9) ou même l’interférométrie d’intensité (dont nous dirons quelques mots au chapitre 21). Nous nous limiterons ici à examiner l’aspect temporel de cette question, et supposerons pour ce faire que les deux champs élémentaires qui se superposent sur le détecteur résultent du dédoublement temporel d’une seule et même onde, comme celui qui peut être obtenu en utilisant le montage interférentiel schématisé à la figure 6.3.

E0 (t)

E1 (t)

E2 (t)

E (t) Figure 6.3 Dédoublement temporel d’une onde E ( ρ , t ) obtenu à l’aide d’un interféromètre à 2 ondes.

Si les séparatrices utilisées dans ce montage sont équilibrées et sans pertes (R = T = 1/2) et si les coefficients de réflexion des miroirs qui y sont employés sont de 100 %, alors les deux champs dédoublés présentent, en un point ρ du trajet commun aux deux ondes après leur recombinaison, la relation suivante : 1 E2 (t ) = E1 (t − τ ) = E (t − τ ) 2

avec τ =

L n L = v c

(6.48)

où L désigne la différence de longueur entre les deux bras de l’interféromètre de Mach-Zehnder ainsi constitué (le lecteur se reportera au paragraphe 17.3 pour plus de détails sur le fonctionnement de cet interféromètre). Nous avons ici négligé, par souci de simplicité, les déphasages qui peuvent être introduits par les séparatrices et les miroirs. Dans ces conditions, nous pouvons écrire, en utilisant les mêmes notations que celles introduites au paragraphe 6.3.1 et la même hypothèse de stationnarité : (τ ) = E ( ρ , t ) · E ( ρ , t − τ ) T 1 2 1 I1 = I2 = E ( ρ , t ) T = (0) 4 4

(6.49)

135

De l’Optique électromagnétique à l’Interférométrie

Le courant I résultant de la superposition des deux champs obtenus par dédoublement temporel d’une seule et même onde a donc pour expression :     1 1 1 (τ ) 1 I (τ ) = (0)+ (τ ) = (0) 1 + = (0) 1 + g (1) (τ ) (6.50) 2 2 2 (0) 2 où g (1) (τ ) désigne la fonction de corrélation temporelle normée du premier ordre du champ E ( ρ , t ) et (τ ) sa fonction d’auto-corrélation, définie par :  +∞ E ( ρ , t ) · E ( ρ , t − τ ) dt (6.51) (τ ) = E ( ρ , t ) · E ( ρ , t − τ ) T = −∞

Un résultat établi au paragraphe A.6 de l’annexe consacrée aux outils mathématiques nous dit par ailleurs que la fonction d’auto-corrélation d’une fonction de la variable réelle est égale à la transformée de Fourier de son spectre en puissance, soit ici :  +∞ (τ ) = |E( ρ , f )|2 e −2iπ f τ df (6.52) −∞

Ceci nous donne immédiatement accès à l’expression finale de la fonction de cohérence temporelle normée du premier ordre g (1) (τ ) :  +∞ |E( ρ , f )|2 e −2iπ f τ df (τ ) (6.53) g (1) (τ ) = = −∞ +∞ (0) 2  |E ( ρ , f )| df −∞

Cette relation montre que la fonction de corrélation temporelle peut être déduite de la répartition fréquentielle du champ. On notera ici que nous avons supposé, dans un souci de simplification, l’existence de la fonction d’auto-corrélation du champ ainsi que celle de sa transformée de Fourier.

6.3.3 Temps de cohérence, longueur de cohérence Nous recherchons maintenant un résultat général qui permette de savoir sous quelle condition nous pouvons observer un phénomène d’interférence. Pour rappel, celui-ci sera visible tant que la valeur de la fonction d’auto-corrélation normée n’est pas nulle ou négligeable. On désignera par τ la largeur à mi-hauteur de la fonction d’auto-corrélation (τ ) et par f celle du spectre en puissance |E(f )|2 de l’onde associée. Comme établi au paragraphe 3.2, le produit des supports à mi-hauteur des deux fonctions liées par une transformation de Fourier est supérieur ou égal à 1, de sorte

136

6. Énergie, causalité et cohérence

que la relation (6.52) nous permet d’écrire :

τ f  1



1  τ

f

(6.54)

Pour que la visibilité du phénomène d’interférences soit non nulle, il est par ailleurs nécessaire que nous ayons :

τ (6.55) |τ |  2 Pour que cette dernière inégalité soit vérifiée, il suffit, compte tenu de la relation (6.54), que soit donc respectée la condition suivante : |τ | 

1 2 f

(6.56)

soit encore, en faisant apparaître la largeur spectrale à mi-hauteur λ de la source : |τ | 

λ2 2c λ

(6.57)

Cette dernière quantité est habituellement désignée sous l’appellation de temps de cohérence τc de la source, auquel on associe une longueur de cohérence lc définie par : λ2 λ2 τc = → lc = c τc = (6.58) 2c λ 2 λ À titre d’illustration, si nous considérons un laser He-Ne de caractéristiques standards (λ = 633 nm, λ = 1 pm), sa longueur de cohérence approchera les 20 cm, tandis que celle d’une source halogène filtrée autour de la même longueur d’onde par un monochromateur ( λ = 1 nm) ne dépassera pas 0,2 mm et nécessitera le recours à une égalisation précise de la longueur des bras pour rendre possible la visualisation d’un phénomène d’interférences. À l’inverse, un laser stabilisé en fréquence (par exemple, par verrouillage sur une raie d’absorption) sera susceptible de présenter une largeur de raie de quelques kilohertz, et sa longueur de cohérence pourra donc excéder plusieurs centaines de kilomètres !

6.4 Signal analytique Jusqu’ici, dans cet ouvrage, nous avons toujours utilisé des fonctions réelles pour décrire les grandeurs physiques, mesurables. Ainsi, les dépendances temporelles des champs sont des fonctions réelles de la variable temporelle t . Les grandeurs complexes apparaissent uniquement après transformation de Fourier, la variable temporelle t étant alors remplacée par la variable fréquentielle f .

137

De l’Optique électromagnétique à l’Interférométrie

Toutefois, chez certains auteurs, et notamment lorsque sont abordées des notions telles que la cohérence, on voit apparaître des signaux complexes de la variable temporelle. Ce paragraphe a pour objet de justifier l’introduction de ces signaux que l’on désigne habituellement sous le terme d’analytiques et d’en préciser la définition.

6.4.1 Fonctions complexes de la variable temporelle Les fonctions complexes de la variable temporelle sont d’un usage très répandu pour simplifier la recherche de solutions d’équations différentielles. Supposons en effet que l’on ait à résoudre l’équation :

L(E  ) = S  E

(6.59)

S

et désignent des fonctions réelles de la variable temporelle t , et L un où opérateur différentiel linéaire à coefficients réels constants. Si l’on étend cette équation aux fonctions complexes de la même variable réelle t , en considérant une source complexe S = S  + iS  , la solution prend la forme d’une fonction complexe E = E  + iE  définie par :

L(E  + iE  ) = L(E  ) + i L(E  ) = S  + iS  ⇒ L(E  ) = S  et L(E  ) = S 

(6.60)

Ces résultats montrent que l’on peut rechercher le champ complexe E (t ), solution de l’équation (6.59), en utilisant une source complexe S (t ), et retrouver, après résolution, la solution originelle en considérant uniquement la partie réelle de E (t ), soit : E  (t ) = [E (t )]. L’intérêt de cette procédure est qu’elle permet de bénéficier de tous les outils mathématiques développés pour le plan complexe. On notera à ce stade que la partie imaginaire S  que nous avons introduite est arbitraire. Toutefois, un cas fréquent (et pratique) est celui où la source est de nature trigonométrique (S  = S0 cos ωt ) et étendue à S = S0 e −iωt . On obtiendrait d’ailleurs, en introduisant de telles sources trigonométriques dans les équations de Maxwell, les mêmes équations que celles du régime harmonique (équations de Maxwell dans le plan de Fourier), moyennant une fréquence exclusivement positive et un terme de phase à introduire en amont. Cette procédure est souvent désignée sous l’appellation de méthode des amplitudes complexes. Nous allons maintenant voir comment la notion de signal analytique permet d’aller plus loin, notamment pour les signaux dits quasi-monochromatiques.

6.4.2 Définition du signal analytique À de nombreuses reprises, nous avons été conduits à utiliser la procédure de reconstruction de la dépendance temporelle du champ à partir de ses composantes

138

6. Énergie, causalité et cohérence

fréquentielles et à avoir recours dans ce but à la transformation de Fourier suivante :  +∞ E (f ) e −2iπ ft df (6.61) E (t ) = −∞

en indiquant à chaque fois que l’on pouvait se limiter à une reconstruction sur les seules fréquences positives, soit :  +∞ −2iπ ft E (f ) e df (6.62) E (t ) = 2 0

Ce dernier résultat est directement lié à la symétrie hermitienne de toute fonction réelle E (t ), à savoir : E ( − f ) = E ∗ (f ). La relation (6.62) indique que l’on pourra toujours reconstruire le champ réel E (t ) à partir d’un signal analytique Ea (t ) dont la transformée de Fourier ne contient que des fréquences positives, soit :  +∞ Ea (t ) = 2 E (f ) e −2iπ ft df ⇒ E (t ) = [Ea (t )] (6.63) 0

On notera tout d’abord que ce signal analytique est complexe, contrairement au champ E (t ). Par ailleurs, du fait même de sa construction, le signal analytique admet une transformée de Fourier qui n’est rien d’autre que le produit de celle du champ E par la fonction échelon H (f ), soit : E˜ a (f ) = Ea (f ) = 2H (f ) E (f )

(6.64)

En revenant dans l’espace des temps à l’aide d’une transformée de Fourier inverse, et en utilisant la relation (A.87) établie dans l’annexe consacrée aux outils mathématiques, il vient :    i 1 Ea (t ) = E (t )  δ(t ) − VP (6.65) π t où δ(t ) désigne la distribution de Dirac de la variable temporelle et VP la distribution en valeur principale de Cauchy. Au final, nous obtenons : Ea (t ) = E (t ) + i Eˆ H (t )

(6.66)

où l’on vérifie que le champ E (t ) constitue bien, comme attendu, la partie réelle du signal analytique, et où Eˆ H désigne la transformée de Hilbert de E :   1 1 Eˆ H (t ) = − E (t )  VP (6.67) π t

139

De l’Optique électromagnétique à l’Interférométrie

6.4.3 Champ monochromatique Supposons maintenant que le champ considéré soit de nature monochromatique et donc décrit par une dépendance temporelle du type : E (t ) = E0 cos (ω0 t − φ)

(6.68)

Sa transformée de Fourier est alors donnée par :

E (f ) =

 E0  iφ e δ(f − f0 ) + e −iφ δ(f + f0 ) 2

(6.69)

tandis que celle du signal analytique associé a pour expression :

Ea (f ) = 2H (f ) E (f )   = E0 e iφ H (f0 )δ(f − f0 ) + e −iφ H ( − f0 )δ(f + f0 )

(6.70)

= E0 e iφ δ(f − f0 ) On obtient enfin, par transformée de Fourier inverse : Ea (t ) = E0 e −i(ω0 t −φ)

(6.71)

ce qui n’est rien d’autre que l’amplitude complexe du champ monochromatique.

6.4.4 Champ quasi-monochromatique On considère maintenant que l’amplitude E0 et le terme de phase φ de l’expression (6.68) varient avec le temps, soit : E (t ) = E0 (t ) cos[ω0 t − φ(t )]

(6.72)

Cette nouvelle forme de dépendance temporelle fait évidemment perdre au champ son caractère monochromatique, et sa transformée de Fourier a d’ailleurs pour expression :  1 E (f ) = (6.73) s˜(f − f0 ) + s∗ (f + f0 ) 2 où s˜(f ) désigne la transformée de Fourier de la fonction s(t ) = E0 (t )e iφ(t ). En utilisant les propriétés de la transformée de Fourier, on peut écrire : s∗ (f + f0 ) = s˜∗ ( − f − f0 )

(6.74)

On en déduit aussitôt l’expression de la transformée de Fourier du signal analytique associé :

Ea (f ) = 2H (f ) E (f ) = H (f )˜s (f − f0 ) + H (f )˜s ∗ ( − f − f0 )

140

(6.75)

6. Énergie, causalité et cohérence

Supposons maintenant que la fonction ˜s (f − f0 ) vérifie la relation : H (f )˜s (f − f0 ) = s˜(f − f0 )

∀f ∈ R

(6.76)

Cette condition est celle qui définit le caractère quasi-monochromatique du champ, et traduit le fait que sa fréquence moyenne f0 est grande devant l’étendue fréquentielle

f de son spectre. La relation (6.76) donne immédiatement, après conjugaison complexe et utilisation du changement de variable f → −f : H ( − f )˜s ∗ ( − f − f0 ) = s˜∗ ( − f − f0 ) ∀ f ∈ R

(6.77)

Par conséquent, compte tenu de la définition de l’échelon de Heaviside : H (f )˜s ∗ ( − f − f0 ) = H (f )H ( − f )˜s ∗ ( − f − f0 ) = 0 ∀ f ∈ R

(6.78)

En reportant ce résultat dans la relation (6.75), nous obtenons :

Ea (f ) = H (f )˜s (f −f0 )+H (f )˜s ∗ (−f −f0 ) = H (f )˜s (f −f0 ) = s˜(f −f0 ) (6.79) et donc :

Ea (t ) = E0 (t )e −i[ω0 t −φ(t )]

(6.80)

On retrouve ici un résultat analogue à celui de l’amplitude complexe établi au paragraphe 6.4.3, mais pour une classe de champs beaucoup plus large, à savoir les champs quasi-monochromatiques qui satisfont à la condition (6.76).

6.4.5 Utilisation du signal analytique Il se trouve que nombre de grandeurs G fonctions du champ sont plus pratiques à calculer si l’on part du signal analytique Ea (t ) en lieu et place du signal réel E (t ). Il convient toutefois de s’assurer que la grandeur recherchée G (E ) s’extrait facilement de la grandeur G (Ea ) qui résulte d’une telle démarche. Prenons l’exemple de la puissance transportée par un faisceau quasi-monochromatique. Dans un souci de simplification, on supposera que la dépendance temporelle du champ est ici décrite par : E (t ) = E0 cos[ω0 t − φ(t )]

(6.81)

Nous avons montré que la puissance transportée par une onde lumineuse était proportionnelle à la moyenne temporelle du carré du champ électrique, soit ici, dans le cas quasi-monochromatique, et sous réserve de variations temporelles de la phase

141

De l’Optique électromagnétique à l’Interférométrie

suffisamment lentes : 1 E 2 (t ) T = E02 cos2 [ω0 t − φ(t )] T  E02 2

(6.82)

1 2

près, à la moyenne

|Ea |2 (t ) T = |E0 e −i[ω0 t −φ(t )] |2 T = E02

(6.83)

On vérifie aisément que ce résultat est identique, à un facteur du module au carré du signal analytique :

Cette propriété, en tant que telle, ou étendue à d’autres grandeurs, est souvent utilisée lorsque l’on s’intéresse aux propriétés de cohérence ou de polarisation partielle d’un champ.

142

Approche microscopique Chapitre conçu par Carole Deumié rédigé par Michel Lequime et Carole Deumié

Sommaire 7.1 7.2

7.3 7.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modèle de polarisation microscopique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Polarisabilité électronique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.2 Polarisabilité d’orientation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modèle macroscopique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemple d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

144 144 144 146 147 148 151

143

De l’Optique électromagnétique à l’Interférométrie

7.1 Introduction Bien que cet ouvrage soit dévolu à une approche macroscopique de l’électromagnétisme, nous souhaitions dans ce chapitre 7 sensibiliser le lecteur aux développements issus d’une approche dite microscopique, c’est-à-dire adossée à une vision particulaire (atomique, électronique, moléculaire. . . ) de la matière, plus étroitement liée à sa structure intime. Pour cela, nous allons montrer comment relier la susceptibilité, définie de façon macroscopique au chapitre 1, à la polarisabilité que nous définirons ci-après d’un point de vue microscopique. On se placera en milieu linéaire isotrope et on se limitera au cas d’une polarisation électrique de la matière, dans le cadre de l’approximation dipolaire.  /dv définie au chapitre 1 Considérons donc la densité volumique de dipôles P = d M dans le cas électrostatique. Nous avons vu que cette polarisation P était induite par le champ électromagnétique E , et que ces deux grandeurs étaient reliées par une relation de type filtre linéaire causal, soit : P ( ρ , t ) = 0 [χ  E ]( ρ, t ) t

(7.1)

où la convolution porte sur la variable temporelle et où χ désigne ici la susceptibilité électrique. Cette dernière fonction étant causale, on a donc, pour rappel : χ (t ) = 0

∀t < 0

(7.2)

Nous savons également que l’utilisation d’une transformée de Fourier temporelle permet de remplacer le produit de convolution par un produit simple, soit :

P ( ρ , ω) = 0 χ(ω) ˜ E( ρ , ω)

(7.3)

L’objectif de ce chapitre 7 est de fournir une illustration de cette dernière relation au travers d’un modèle microscopique simplifié.

7.2 Modèle de polarisation microscopique 7.2.1 Polarisabilité électronique On considère ici une matière électriquement neutre (diélectrique). Celle-ci sera assimilée à une assemblée de grains élémentaires de charge totale nulle, constitués par l’association locale de charges positive +q et négative −q. Sous l’effet d’un champ extérieur, noté Eext , le barycentre de ces charges positives et le barycentre de ces charges négatives se séparent spatialement le long de la direction d’application du champ, les forces induites sur chacune d’entre elles étant de signes

144

7. Approche microscopique

opposés. Il y a donc création, au niveau de chaque grain élémentaire, d’un dipôle induit. Chacun de ces dipôles induits crée alors en tout point de l’espace son propre champ électrique qui se superpose au champ extérieur, de sorte que chaque grain élémentaire de matière est alors soumis à un champ local, noté Elocal et constitué par la superposition du champ extérieur appliqué et des champs créés par les différents dipôles induits dans la matière par cette sollicitation extérieure. Nous retrouvons ainsi le cadre de l’approximation dipolaire considérée au chapitre 1. Le calcul devra donc être mené en 2 étapes, la première étant consacrée à la réponse microscopique d’un grain de matière à l’application de ce champ local, et la seconde aux conséquences de cette réponse à l’échelle macroscopique. On désignera ici par r le vecteur joignant le barycentre des charges positives (les noyaux) et celui des charges négatives (les électrons), et compte tenu de leur rapport de masse, on utilisera ici l’approximation des noyaux immobiles. On utilisera un modèle de type oscillateur harmonique où l’on prendra en compte l’existence d’une force de rappel proportionnelle à la distance r séparant les charges q et d’une force de frottement proportionnelle à la vitesse de leur déplacement. En conséquence, on décrira le mouvement des charges négatives par une équation différentielle du type : m

d 2 r d r − q Elocal = −k r − ν 2 dt dt

(7.4)

où m désigne la masse effective de ces charges négatives. On applique alors à cette équation différentielle une transformation de Fourier temporelle, ce qui conduit à : −mω2 r˜(ω) = −k r˜(ω) + i ων˜r(ω) − q Elocal (ω)

(7.5)

et permet d’exprimer la composante fréquentielle du déplacement en fonction de celle du champ électrique local, soit : r˜(ω) =

−q Elocal (ω) k − i ων − mω2

(7.6)

La composante fréquentielle de la polarisation est par ailleurs définie ici par la relation : p˜ (ω) = −q˜r(ω) (7.7) En introduisant la pulsation propre ω0 de l’oscillateur harmonique (k = mω02 ) et le coefficient de frottement réduit γ (ν = mγ ), on obtient au final : p˜ (ω) =

q2 Elocal (ω) = 0 αe (ω)Elocal(ω) m(ω02 − ω2 − i γ ω)

(7.8)

145

De l’Optique électromagnétique à l’Interférométrie

où l’on a fait apparaître la polarisabilité électronique αe (ω), c’est-à-dire la capacité de la matière à se polariser sous l’effet d’un champ électrique à la pulsation ω, et qui a pour expression : q2 (7.9) αe (ω) = m0 (ω02 − ω2 − i γ ω)

7.2.2 Polarisabilité d’orientation Certaines molécules, notamment en milieu liquide, présentent un dipôle permanent, ce qui justifie l’appellation de molécules polaires par laquelle on les désigne. L’eau constitue un bon exemple de milieu polaire. On désignera par p0 le moment dipolaire permanent de la molécule polaire correspondant au milieu considéré. Ce moment dipolaire va chercher à s’aligner sur la direction du champ local, de manière à minimiser son énergie d’orientation U définie par : U = −p0 · Elocal (7.10) Si ce mécanisme était seul présent, le dipôle permanent devrait se retrouver en toutes circonstances aligné sur le champ local. Mais le système est également soumis à une agitation d’origine thermique, de sorte que l’orientation angulaire du dipôle se trouve ici décrite par une loi statistique de type Boltzmann, définie par :     U pM Elocal cos θ − kB T = Ke kB T f (θ) = Ke (7.11) où f (θ) désigne la probabilité que l’orientation du dipôle soit définie par un angle θ, kB la constante de Boltzmann (kB = 1,38 × 10−23 J/K) et T la température du milieu exprimée en degrés kelvin. La constante K peut être déterminée en exprimant le fait que l’intégrale de cette probabilité sur l’ensemble des orientations possibles est égale à 1, c’est-à-dire en écrivant que :   pM Elocal cos θ  2π  π  π kB T sin θ d θ = 1 (7.12) f (θ) sin θ d θ d φ = 2πK e 0

0

0

Nous ferons ici l’hypothèse que l’argument de l’exponentielle est petit devant 1, et que celle-ci peut être remplacée dans l’intégrale par son développement limité au premier ordre, soit :   π pM Elocal cos θ 1 2πK 1+ sin θ d θ = 1 ⇒ K = (7.13) kB T 4π 0

146

7. Approche microscopique

Le problème présentant une symétrie cylindrique autour de l’axe z (c’est-à-dire celui défini par le champ local), il nous faut maintenant calculer la valeur moyenne de la composante en z du dipôle permanent :  2π  π (p0 .z )f (θ) sin θ d θ d φ pz  = 0  π0 = 2π p0 cos θ f (θ) sin θ d θ (7.14) 0

En utilisant la même approximation au premier ordre que celle que nous avons adoptée pour le calcul de la constante K , il vient :    π p0 Elocal cos θ pz  = 2πKp0 cos θ 1 + sin θ d θ kB T 0 p2 4π (7.15) K 0 Elocal = 3 kB T et donc, en utilisant la valeur de la constante K obtenue à la relation (7.13) : pz  =

p02 Elocal 3kB T

(7.16)

La symétrie cylindrique du problème impose d’autre part que nous ayons : px  = py  = 0, ce qui conduit à : p02 p = (7.17) Elocal 3kB T Après application d’une transformée de Fourier temporelle à la relation précédente, nous obtenons enfin l’expression de la composante fréquentielle de la polarisation à la pulsation ω, soit : (7.18) p˜ (ω) = 0 αo (ω)Elocal (ω) où αo (ω) désigne la polarisabilité d’orientation du milieu polaire, définie par : αo (ω) =

p02 30 kB T

(7.19)

7.2.3 Conclusion Dans les paragraphes qui précèdent, nous avons analysé deux modes possibles de réponse de la matière à l’application du champ local, à savoir un mode lié à la réponse électronique d’un milieu diélectrique et un mode lié à l’orientation de molécules polaires. De nombreux autres effets devraient être pris en compte pour décrire de manière exacte le comportement sous champ d’un milieu quelconque. Mais nous obtiendrions dans chaque cas des lois de comportement similaires à celles déjà établies, de sorte

147

De l’Optique électromagnétique à l’Interférométrie

que nous pouvons écrire, en toute généralité, que la relation entre composantes fréquentielles de la polarisation p˜ (ω) et du champ électrique local Elocal (ω) sera toujours du type : (7.20) p˜ (ω) = 0 α(ω)Elocal (ω) avec :

α(ω) = αe (ω) + αo (ω) + ...

(7.21)

la somme utilisée tenant compte des caractéristiques particulières du milieu matériel considéré.

7.3 Modèle macroscopique Nous avons donc à notre disposition deux descriptions complémentaires de la polarisation : une description microscopique, qui fait intervenir la polarisabilité et qui est liée au champ local, et une description macroscopique, qui fait intervenir la susceptibilité et qui est liée au champ extérieur. L’objectif de ce paragraphe 7.3 est donc double : il doit tout d’abord nous permettre d’établir un lien entre la valeur du champ extérieur appliqué et celle du champ local, mais il doit également rendre possible le calcul des propriétés de polarisation de la matière au niveau macroscopique, connaissant sa réponse au niveau microscopique. Considérons dans ce but un ensemble d’atomes répartis aux nœuds d’un réseau à symétrie cubique, comme représenté de manière schématique à la figure 7.1, et décomposons le champ local vu par l’un de ces atomes en 3 contributeurs, à savoir le champ extérieur, le champ associé à une portion du matériau environnant dite z

R S

Figure 7.1 Réseau cubique – zone proche.

148

7. Approche microscopique

proche et celui associé à la portion restante de ce même matériau dite lointaine, soit : Elocal = Eext + Eproche + Elointaine

(7.22)

La symétrie cubique que nous avons adoptée ici permet de simplifier les calculs, mais les résultats que nous obtiendrons grâce à son emploi sont en fait de portée tout à fait générique. Cette décomposition de l’espace environnant l’atome considéré en 2 zones, dites proche et lointaine, sera ici obtenue en utilisant une sphère centrée sur l’atome considéré et de rayon R (cf. figure 7.1). Ce rayon sera choisi de manière à ce que l’on puisse dénombrer les atomes dans la zone proche, c’est-à-dire à l’intérieur de la sphère, et considérer en même temps que l’extérieur de cette sphère constitue effectivement un espace lointain, et donc quasi continu, pour l’atome considéré. Évaluons dans un premier temps la contribution des dipôles situés à l’intérieur de la sphère : compte tenu de la symétrie cubique adoptée, il existe, pour tout dipôle appartenant à la zone proche, un dipôle jumeau situé en position symétrique par rapport au centre de la sphère, de sorte que le champ électrique global résultant de la superposition de ces deux contributions est à chaque fois identiquement nul. En conséquence :

Eproche = 0

(7.23)

Ce résultat ne dépend évidemment pas de la valeur choisie pour le rayon R de la sphère. Analysons maintenant la contribution des dipôles situés à l’extérieur de la sphère. Le problème à résoudre est représenté de manière schématique à la figure 7.2 et correspond à une situation que nous avons déjà analysée au paragraphe 1.4.

Z p n

R

Σ

Figure 7.2 Réseau cubique – zone lointaine.

149

De l’Optique électromagnétique à l’Interférométrie

Nous avions montré dans ce paragraphe que l’existence d’une polarisation induite dans un domaine de l’espace occupé par de la matière allait créer une densité volumique de charges ρ à l’intérieur de ce domaine et une densité surfacique de charges σ sur la frontière qui le délimite, et que ces deux densités étaient définies par : ρ = −divP

et

σ = n · P

(7.24)

Nous ferons ici l’hypothèse que le milieu considéré a des propriétés continues et homogènes, ce qui revient à admettre que la polarisation P est constante à l’extérieur de la sphère . Il n’y a donc pas création de charges volumiques et seules les charges présentes à la surface de cette sphère doivent être prises en compte. Le champ électrique créé par un élément de surface dS est donné par la relation : d Elointain =

1 σ dS n 4π0 R 2

(7.25)

et la composante en z du champ résultant a pour expression : Ez,lointain = soit encore : Ez,lointain =

1 4π0

 0

π

1 4π0

 

n · P ( n · z ) dS R2

P −P cos θ (− cos θ) 2πR 2 sin θd θ = R2 30

(7.26)

(7.27)

Comme le problème présente une symétrie de révolution autour de l’axe z , nous pouvons aussitôt écrire : Ex,lointain = Ey,lointain = 0, et donc, au final : Elointain =

P 30

(7.28)

Nous sommes ainsi en mesure d’exprimer la valeur du champ local, puisque tous les termes figurant dans la relation (7.22) sont maintenant connus : P P = Eext + Elocal = Eext + Eproche + Elointaine = Eext + 0 + 30 30

(7.29)

On désigne habituellement ce résultat sous l’appellation de champ local de Lorentz . Il ne nous reste plus qu’à passer de la réponse microscopique de la matière à sa réponse macroscopique. Sur l’un quelconque des atomes, nous avons :   P   (7.30) p = 0 α Elocal = 0 α Eext + 30

150

7. Approche microscopique

En introduisant N , le nombre d’atomes par unité de volume, il vient :   P P = N p = N 0 α Eext + 30 et donc :

N 0 α  Eext P = 1 − N3α

(7.31)

(7.32)

En considérant les composantes fréquentielles à la pulsation ω, la relation précédente permet d’écrire :

P (ω) = 0 χ˜ (ω)E(ω)

χ˜ (ω) =

avec

N α(ω) 1−

N α(ω) 3

(7.33)

Ceci constitue la relation de Clausius-Mossotti .

7.4 Exemple d’utilisation Supposons que la polarisabilité de la matière soit uniquement d’origine électronique et donc décrite par une relation du type : α(ω) =

q2 m0 (ω02 − ω2 − i γ ω)

(7.34)

Les résultats obtenus au paragraphe précédent nous permettent d’exprimer la susceptibilité électrique du milieu (relation de Clausius-Mossotti) : χ(ω) ˜ =

N α(ω) 1−

N α(ω) 3

= =

Nq 2 m0 (ω02 − ω2 − i γ ω) − Nq 2 1 m0 ω2 − ω2 − i γ ω − 0

Nq 2 3

Nq 2 3m0

(7.35)

On pose : ω12 = ω02 −

Nq 2 3m0

en utilisant comme hypothèse implicite que

Nq 2 < ω02 3m0

Ceci permet de mettre la composante fréquentielle de la susceptibilité électrique sous la forme : Nq 2 1 χ˜ (ω) = (7.36) m0 ω12 − ω2 − i γ ω

151

De l’Optique électromagnétique à l’Interférométrie

c (ω) 0

ω1

ω

ω1

ω

c (ω)

0

Figure 7.3 Dépendances spectrales des parties réelle et imaginaire de la susceptibilité.

et donc en séparant partie réelle χ˜  (ω) et partie imaginaire χ˜  (ω) : χ˜  (ω) =

ω12 − ω2 Nq 2 m0 (ω12 − ω2 )2 + γ 2 ω2

χ˜  (ω) =

Nq 2 γω m0 (ω12 − ω2 )2 + γ 2 ω2

(7.37)

La figure 7.3 présente la dépendance de ces deux quantités vis-à-vis de la pulsation ω, et met en évidence leur forte inter-relation, qui n’est rien d’autre qu’une conséquence (et une illustration) des relations de Kramers-Kronig établies au paragraphe 6.2. La forme de dépendances spectrales présentée à la figure 7.3 est caractéristique des diélectriques, à ceci près que le comportement effectif de ces matériaux met en jeu plusieurs résonances localisées à des pulsations différentes du spectre en fréquence. Rappelons pour être complet les relations qui permettent de passer de la susceptibilité électrique χ˜ (ω) à la permittivité relative ˜r (ω), puis à l’indice de réfraction n(ω). On a donc successivement : ˜ r (ω) = 1 + χ˜ (ω)



˜r (ω) = 1 + χ˜  (ω) et

˜r (ω) = χ˜  (ω) (7.38)

˜ r (ω) = [˜r (ω) + i ˜r (ω)]μr (ω) n 2 (ω) = ˜ r (ω)μ

152

(7.39)

Propagation en milieu anisotrope Chapitre conçu par Michel Lequime et Carole Deumié rédigé par Michel Lequime

Sommaire 8.1 8.2 8.3 8.4 8.5 8.6

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . États propres de propagation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Équation de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ellipsoïde des indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polarisation des états propres de propagation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conséquences pratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

154 155 156 158 160 162

153

De l’Optique électromagnétique à l’Interférométrie

8.1 Introduction Jusqu’à présent, nous avons toujours considéré la propagation d’ondes électromagnétiques dans des milieux de nature isotrope. Or, cette condition est quelque peu restrictive et ne permet pas en particulier de décrire les propriétés de matériaux cristallins très utilisés en optique, comme le quartz (SiO2 ), la calcite (CaCO3 ), le rubis (Al2 O3 ) ou le niobate de lithium (LiNbO3 ). Les applications de ces cristaux concernent, par exemple, la manipulation de l’état de polarisation de la lumière, la production de rayonnement laser ou la génération de fréquences harmoniques par interaction non linéaire. La principale différence avec la formulation habituelle des équations de Maxwell en régime harmonique que nous avons détaillée au chapitre 2 concerne la relation entre induction et champ électriques, qui prend, dans le cas d’un milieu anisotrope, la forme plus générale suivante :      ( D ρ , f ) = ˜ (f ) E( ρ , f ) = 0 ˜r (f ) E( ρ, f ) (8.1)   où  ˜ (f ) désigne le tenseur de permittivité du milieu anisotrope considéré, et ˜r (f ) celui de permittivité relative. La description des propriétés électriques du milieu matériel fait donc ici appel à un tenseur à 9 composantes : ⎤ ⎡ xx xy xz ⎥ ⎢ ⎥ (8.2) [˜r (f )] = ⎢    yx yy yz ⎦ ⎣ zx zy zz en lieu et place d’un unique coefficient de proportionnalité. On peut toutefois montrer que ces composantes ne sont pas toutes indépendantes et que le tenseur de permittivité relative est de nature symétrique, ce qui permet d’écrire : ij = ji ∀ i, j = x, y, z (8.3) et réduit ainsi à 6 le nombre de composantes a priori indépendantes. Dans tout ce qui suit, nous nous placerons en outre dans le cas où deux hypothèses additionnelles se trouvent remplies, à savoir : • les milieux considérés sont non magnétiques, de sorte que la relation entre champ et induction magnétiques prend ici la forme simplifiée suivante :  ( B( ρ , f ) = μ0 H ρ, f )

(8.4)

• la fenêtre fréquentielle d’étude correspond à une zone de transparence du milieu, ce qui signifie que les composantes du tenseur de permittivité relative sont toutes réelles et positives.

154

8. Propagation en milieu anisotrope

Or, le théorème spectral nous dit que toute matrice symétrique à coefficients réels positifs est diagonalisable et que ses valeurs propres sont réelles et positives. En conséquence, il existe un référentiel (OXYZ ) dans lequel le tenseur de permittivité relative s’écrit : ⎤ ⎡ 2 nXX 0 0 ⎥ ⎢ 2 ⎥ [˜r (f )] = ⎢ (8.5) ⎣ 0 nYY 0 ⎦ 2 0 0 nZZ et c’est cette forme réduite que nous considérerons désormais.

8.2 États propres de propagation En l’absence de charges et de courants, les équations de Maxwell en régime harmonique s’écrivent, dans un milieu homogène, anisotrope, transparent et non magnétique : ⎧− →E(  ( ρ , f ) = i ωμ0 H ρ, f ) rot ⎪ ⎪ ⎪   ⎪ → ⎨−   ρ , f ) = −i ωD( ρ , f ) = −i ω0 ˜r (f ) E( ρ , f )} rotH( (8.6) ⎪  ( divD ρ, f ) = 0 ⎪ ⎪ ⎪ ⎩  ( ρ, f ) = 0 divH Nous allons rechercher des solutions de ces équations de Maxwell qui correspondent à des ondes planes monochromatiques de pulsation ω et de vecteur d’onde β . Cela revient à dire que ces ondes planes vont constituer, si elles existent, des états propres de ces équations de Maxwell, et qu’elles seront susceptibles de se propager sans déformation à l’intérieur de ce milieu, malgré son caractère anisotrope. Lorsque l’on s’intéresse à des ondes planes, nous avons déjà montré que les équations de Maxwell précédentes pouvaient être mises sous la forme simplifiée suivante : ⎧  β ∧ E = ωμ0 H ⎪ ⎪ ⎪ ⎪ ⎨ β ∧ H   = −ωD ⎪  =0 β · D ⎪ ⎪ ⎪ ⎩  =0 β · H

(8.7)

, H  ) qui forment ici un trièdre direct, ce qui montre que ce sont les vecteurs (β , D    en lieu et place du triplet (β , E , H) qui était celui identifié dans le cas habituel de l’optique isotrope. Notons que le vecteur champ électrique E reste cependant perpen tout en étant relié au vecteur induction diculaire au vecteur champ magnétique H  = 0 [r ]E.  par la relation D électrique D

155

De l’Optique électromagnétique à l’Interférométrie

 du système constitué par les deux On élimine alors le vecteur champ magnétique H premières relations, en écrivant :  ) = −μ0 ω2 D  β ∧ (β ∧ E) = ωμ0 (β ∧ H

(8.8)

On pose β = k u , où u = (α, β, γ ) désigne le vecteur unitaire correspondant à la direction de propagation de l’onde plane monochromatique solution de ces équations de Maxwell et k le module du vecteur de propagation β (k = nω/c). On utilise alors la formule du double produit vectoriel β ∧ (β ∧ E) = (β · E)β − k 2 E

(8.9)

pour transformer le premier terme de la relation (8.8), soit :  k 2 [( u · E) u − E] = −μ0 ω2 D  et E : et obtenir ainsi une deuxième relation entre D  2  )  − ( = k D E u · E u μ0 ω 2

(8.10)

(8.11)

On notera que cette relation met en évidence le fait que le vecteur E ne saurait être  et E seraient colinéaires, ici perpendiculaire au vecteur u puisque, dans ce cas, D ce qui imposerait que les 3 valeurs propres du tenseur de permittivité relative soient identiques et que le milieu soit donc isotrope. Cette relation vectorielle (8.11) vient donc compléter la relation tensorielle (8.1) qui  et E, et c’est l’utilisation conjointe de ces 2 relations qui va relie déjà les vecteurs D nous conduire à l’équation de Fresnel auquel sera consacré le paragraphe suivant.

8.3 Équation de Fresnel Si l’on appelle n l’indice apparent du milieu dans la direction de propagation définie par le vecteur unitaire u , la relation (8.11) peut se mettre sous la forme :    (nω/c)2   2  ) ) D = E − ( u · E u =  n E − ( u · E u 0 μ0 ω 2

(8.12)

Si l’on se place maintenant dans le référentiel particulier pour lequel le tenseur de permittivité relative [r ] a une forme diagonale, alors on peut écrire : ⎡ ⎤ 2 0 0 nXX ⎥ 2  = 0 [r ]E = 0 ⎢ D (8.13) 0 ⎦ E ⎣ 0 nYY 2 0 0 nZZ

156

8. Propagation en milieu anisotrope

En rapprochant les relations (8.12) et (8.13), on obtient un système de 3 équations linéaires : ⎧ 2 2 2 ⎪ ⎨ nXX EX − n EX + n (α EX + β EY + γ EZ )α = 0 2 (8.14) nYY EY − n 2 EY + n 2 (α EX + β EY + γ EZ )β = 0 ⎪ ⎩ 2 2 2 nZZ EZ − n EZ + n (α EX + β EY + γ EZ )γ = 0 que l’on peut écrire sous la forme matricielle équivalente suivante : ⎡

⎤ ⎡ ⎤ 2 − n 2 ) + α2 n 2 αβn 2 αγ n 2 EX (nXX 2 2 2 2 2 2 ⎣ ⎦ · ⎣EY ⎦ = 0 αβn (nYY − n ) + β n βγ n 2 − n 2 ) + γ 2n 2 αγ n 2 βγ n 2 (nZZ EZ

(8.15)

Pour que cette équation matricielle ait une solution différente de la solution triviale EX = EY = EZ = 0, il faut que le déterminant de la matrice soit égal à zéro, soit :  2  2 2 (n − n 2 ) + α 2 n 2  αβn αγ n  XX  2 2 2 2 2 2  =0 αβn (nYY − n ) + β n βγ n (8.16)   2 2 2 2 2 2  αγ n βγ n (nZZ − n ) + γ n  Une méthode simple pour établir la relation vérifiée par n 2 , et qui est équivalente au calcul de ce déterminant, consiste, à partir du système de 3 équations (8.14), à exprimer les coordonnées EX , EY et EZ en fonction de l’indice n et du produit scalaire u · E, soit : ⎧ ⎪ u · E) n 2 α( ⎪ ⎪ E = X ⎪ 2 ⎪ n 2 − nXX ⎪ ⎪ ⎪ ⎪ ⎨ n 2 β( u · E) (8.17) EY = 2 2 ⎪ n − nYY ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ n 2 γ ( u · E) ⎪ ⎪ ⎩ EZ = 2 2 n − nZZ u · E) : puis à former la quantité (α EX + β EY + γ EZ ) qui n’est rien d’autre que ( n 2 α 2 ( u · E) n 2 β 2 ( u · E) n 2 γ 2 ( u · E) + + (8.18) α EX +β EY +γ EZ = u · E = 2 2 2 2 n − nXX n 2 − nYY n 2 − nZZ u · E), dont En divisant les 2 membres de la relation précédente par la quantité n 2 ( on sait qu’elle est différente de zéro, il vient : 1 α2 β2 γ2 = + + 2 2 2 n2 n 2 − nXX n 2 − nYY n 2 − nZZ

(8.19)

157

De l’Optique électromagnétique à l’Interférométrie

Par ailleurs, on sait que : 1 α2 β2 γ2 = + + (8.20) n2 n2 n2 n2 En soustrayant membre à membre les relations (8.19) et (8.20), nous obtenons : α2 + β 2 + γ 2 = 1



2 2 2 γ 2 nZZ β 2 nYY α 2 nXX + + =0 2 ) 2 ) 2 ) n 2 (n 2 − nXX n 2 (n 2 − nYY n 2 (n 2 − nZZ

(8.21)

et donc, au final : 2 2 2 γ 2 nZZ β 2 nYY α 2 nXX + + =0 2 2 2 n 2 − nXX n 2 − nYY n 2 − nZZ

(8.22)

Cette dernière relation porte le nom d’équation de Fresnel, et permet de déterminer la valeur de l’indice de réfraction n, pour une onde plane se propageant dans la direction (α, β, γ ) à l’intérieur d’un milieu anisotrope dont le tenseur de permittivité relative 2 , n 2 et n 2 . a pour valeurs propres nXX YY ZZ Pour linéariser cette équation, il suffit de multiplier chaque terme du membre de gauche par le produit des 3 dénominateurs qui y apparaissent, ce qui conduit à l’expression : 2 2 2 2 2 2 (n 2 − nYY )(n 2 − nZZ ) + β 2 nYY (n 2 − nZZ )(n 2 − nXX ) α 2 nXX 2 2 2 + γ 2 nZZ (n 2 − nXX )(n 2 − nYY ) = 0 (8.23)

La relation (8.23) est une équation du second degré en n 2 , dont on peut montrer, après des calculs relativement fastidieux, que le discriminant associé est positif : cette équation admet donc deux solutions, qui se trouvent être elles-mêmes positives, et que nous appellerons désormais n12 et n22 . L’équation de Fresnel admet donc 4 solutions en n, qui ne sont autres que ±n1 et ±n2 , les valeurs positives ayant seules ici une signification physique.

8.4 Ellipsoïde des indices  , à savoir : La relation (8.12) nous donne une relation explicite entre E, u et D    = 0 n 2 E − ( D u .E) u Formons le produit scalaire de chacun des membres de cette égalité avec le vecteur  , soit : induction électrique D    = 0 n 2 E · D  − ( )  ·D D u · E)( u·D (8.24)

158

8. Propagation en milieu anisotrope

Le premier terme de cette relation est facile à calculer :  ·D  = D2 + D2 + D2 D X Y Z

(8.25)

 , puisque la relation Il en est de même du premier terme du second membre, en E · D  et E nous permet d’écrire : (8.13) entre D 2 2 DZ2  = EX DX + EY DY + EZ DZ = DX + DY + E · D 2 2 2 0 nXX 0 nYY 0 nZZ

(8.26)

 ), est nul, puisque nous avons u ·D Le dernier terme du second membre, en ( u · E)(   montré au paragraphe 8.2 que les vecteurs ( u , H, D) formaient un trièdre direct. En utilisant ce dernier résultat ainsi que les relations (8.25) et (8.26), il est possible de mettre la relation (8.24) sous la forme équivalente suivante :

DX2 + DY2 + DZ2 DZ2 DX2 DY2 = + + 2 2 2 n2 nXX nYY nZZ

(8.27)

Considérons maintenant le lieu des points M (X, Y, Z ) tels que :

D −−→ OM = n = n d | |D

(8.28)

 . Le lieu de ces points M où d = (a, b, c) désigne le vecteur unitaire porté par D respecte bien évidemment la relation (8.29), de sorte que nous pouvons écrire, en  |/n, Y |D  |/n, Z |D  |/n) : remplaçant (DX , DY , DZ ) par (X |D    |2  |2 X 2 DX2 + DY2 + DZ2 |D |D Y2 Z2 = 2 = 2 + 2 + 2 (8.29) 2 n2 n n nXX nYY nZZ Le lieu des points M est donc défini par l’équation : Y2 Z2 X2 + + =1 2 2 2 nXX nYY nZZ

(8.30)

qui est celle d’un ellipsoïde dont les longueurs des différents axes sont définies par les indices de réfraction apparaissant dans la représentation diagonale du tenseur de permittivité relative du milieu anisotrope. C’est la raison pour laquelle cette surface n porte le nom d’ellipsoïde des indices. Lorsque les trois indices nXX , nYY et nZZ sont identiques, cet ellipsoïde des indices est une sphère et le milieu associé est bien évidemment isotrope.

159

De l’Optique électromagnétique à l’Interférométrie

Lorsque seuls deux de ces trois indices sont identiques (nXX = nYY = no et nZZ = ne  = no ), le milieu est dit uniaxe, et qualifié de positif si ne − no > 0 et de négatif si ne − no < 0. L’indice no est dit ordinaire, tandis que l’indice ne est qualifié d’extraordinaire. Lorsque les trois indices nXX , nYY et nZZ sont différents, le milieu est dit biaxe.

8.5 Polarisation des états propres de propagation Si l’on considère maintenant, dans le cas le plus général correspondant à un système biaxe, le rapport entre deux composantes quelconques du champ électrique E, par exemple EX /EY , la relation (8.17) nous permet d’affirmer que ce rapport est un réel. En effet : 2 2 ) α(n 2 − nYY n 2 α( EX u · E) n 2 − nYY (8.31) = = 2 2 2 ) EY n − nXX β(n 2 − nXX n 2 β( u · E) et il en est évidemment de même pour EY /EZ et EZ /EX . La phase différentielle entre ces différentes composantes étant nulle, les ondes planes qui constituent des états propres de propagation sont donc caractérisées par des polarisations rectilignes (cf. paragraphes 2.8 et 9.2). Dans le repère où nous avons défini l’ellipsoïde des indices n , traçons maintenant le vecteur unitaire u porté par le vecteur propagation β , comme représenté à la  , puisque  et H figure 8.1. Le plan perpendiculaire à u , noté π, contient les vecteurs D nZZ u

H nXX nYY

D

N

Figure 8.1 Ellipsoïde des indices d’un milieu anisotrope avec indication de la position des différents vecteurs caractéristiques.

160

8. Propagation en milieu anisotrope

, H  ) forment un trièdre direct. En outre, l’intersection entre ce plan π et ( u, D l’ellipsoïde des indices est une ellipse que nous appellerons Eπ . Le vecteur N qui correspond à la normale à l’ellipsoïde au point (X, Y, Z ) a pour coordonnées les dérivées partielles de l’équation de la surface n en ce point, soit : ⎡ 2X 2 ⎢ nXX ⎢ ⎢ 2Y ⎢ N = ⎢ 2 ⎢ nYY ⎢ ⎣ 2Z 2 nZZ



⎡ a 2 ⎥ ⎢ nXX ⎥ ⎢ ⎥ ⎢ b ⎥ ⎢ ⎥ = 2n ⎢ 2 ⎥ ⎢ nYY ⎥ ⎢ ⎦ ⎣ c 2 nZZ

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

(8.32)

 (soit où (a, b, c) désigne les coordonnées du vecteur unitaire d porté par le vecteur D    d = D/|D |). En utilisant la relation (8.13), nous pouvons d’autre part écrire les coordonnées du vecteur E sous la forme : ⎤ ⎡ ⎡ a ⎤ DX ⎢  n2 ⎥ 2 ⎥ ⎢ nXX ⎢ 0 XX ⎥ ⎢ ⎥ ⎥ ⎢ | ⎢ ⎢ DY ⎥ |D b ⎥ ⎢ ⎥ ⎥ (8.33) E = ⎢ ⎥ 2 ⎢ 0 n 2 ⎥ =  ⎢ ⎢ nYY ⎥ 0 ⎢ YY ⎥ ⎢ ⎥ ⎥ ⎢ ⎣ c ⎦ ⎣ DZ ⎦ 2 nZZ 0 n 2 ZZ

ce qui montre que ce vecteur E est parallèle à la normale N à l’ellipsoïde des indices . au point courant M associé au vecteur D La projection du vecteur N sur le plan π (que nous noterons N π ) est donc normale  appartient au plan π tout en étant perpenà l’ellipse Eπ . Par ailleurs, le vecteur H  appartient diculaire au vecteur E et donc au vecteur projeté N π . Enfin, le vecteur D −−→  lui aussi à ce plan π, est perpendiculaire au vecteur H et colinéaire au vecteur OM . Nous avons représenté à la figure 8.2 la position relative de ces différents vecteurs dans le plan π, lorsque le point caractéristique M est situé en une position quelconque sur l’ellipse Eπ . Lorsque le point M décrit l’ellipse Eπ , il n’existe que deux positions pour lesquelles la −−→  ) est perpendiculaire normale au vecteur courant OM (qui est colinéaire au vecteur H à la normale N π à cette ellipse (qui est colinéaire à la projection du vecteur E sur le plan π) : ce sont celles pour lesquelles le vecteur courant se confond avec l’un des axes de l’ellipse.

161

De l’Optique électromagnétique à l’Interférométrie

H

D Eπ

Nπ Figure 8.2 Position des différents vecteurs caractéristiques dans le plan d’onde π .

 qui correspondent aux états propres de propagation sont Les directions du vecteur D donc celles des axes de cette ellipse Eπ , et les valeurs des indices n1 et n2 sont égales aux coordonnées des points courants M1 et M2 qui y sont associés.

8.6 Conséquences pratiques Nous avons donc montré que, dans un milieu anisotrope, si l’on considère une direction de propagation u définie par ses cosinus directeurs α, β et γ , il existe deux ondes planes, polarisées rectilignement suivant deux directions perpendiculaires, qui sont susceptibles de se propager à l’intérieur de ce milieu comme si celui-ci était isotrope. Ce milieu est alors caractérisé par un indice de réfraction apparent égal à n1 ou n2 , ces valeurs correspondant aux coordonnées des sommets de l’ellipse résultant de l’intersection entre le plan d’onde perpendiculaire à la direction de propagation u et l’ellipsoïde des indices associé au milieu anisotrope considéré. Si une onde plane monochromatique rencontre une interface plane entre l’air et un milieu anisotrope sous un angle d’incidence i , son angle de réfraction r à l’intérieur du milieu anisotrope va dépendre de l’état de polarisation de l’onde réfractée, puisque la relation de Snell-Descartes impose que nous ayons, pour chaque état propre j , n sin i = nj sin rj avec j = 1, 2 et, dans le cas général, n1  = n2 . Ceci constitue le phénomène de double réfraction, caractéristique des milieux anisotropes. Si l’on taille maintenant une lame à faces planes et parallèles d’épaisseur e dans un matériau anisotrope de manière à ce que la normale n au plan de coupe soit définie par les cosinus directeurs α, β et γ , et que l’on éclaire la lame ainsi formée à l’aide d’une onde plane monochromatique de longueur d’onde λ dont la direction de propagation est parallèle à cette normale n , alors la modélisation de la traversée de cette lame devra être menée : • en décomposant l’état de polarisation de l’onde incidente sur les deux axes propres qui lui sont associés ; • en appliquant à chacune de ces composantes un terme de déphasage du type e iφj = e

2i πenj λ

• et enfin, en recombinant les deux états propres ainsi déphasés.

162

Polarisation de la lumière Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 9.1 9.2

9.3

9.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . États de polarisation de la lumière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Polarisations elliptique, circulaire et rectiligne . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.2 Polarisations droite et gauche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.3 Caractéristiques de l’ellipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.4 Représentations des états de polarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.5 Vecteur de Jones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Manipulation de l’état de polarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Matrice de Jones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.2 Composants polarimétriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polarisation partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4.1 Matrice de cohérence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4.2 Degré de polarisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

164 164 164 166 167 170 171 175 175 176 178 179 183

163

De l’Optique électromagnétique à l’Interférométrie

9.1 Introduction Nous avons défini au paragraphe 2.8 la notion d’état de polarisation de la lumière et montré que celui-ci pouvait être de nature différente suivant la valeur de l’écart entre les phases des deux composantes du champ électrique situées dans un plan perpendiculaire à la direction de propagation. Pour rappel, cet état de polarisation a été défini pour une composante élémentaire du champ électromagnétique, c’est-à-dire pour une onde monochromatique et monodirectionnelle (souvent appelée onde plane). Dans ces conditions, l’onde est par définition totalement polarisée, mais il convient cependant de préciser la nature de cette polarisation, c’est-à-dire la trajectoire de l’extrémité du champ électromagnétique au cours du temps. Nous verrons que cette trajectoire est une ellipse dont il faudra exprimer les paramètres caractéristiques en fonction de ceux du vecteur champ. Nous allons maintenant détailler l’ensemble de ces notions et montrer tout d’abord comment il est possible de caractériser cet état de polarisation, puis de le manipuler.

9.2 États de polarisation de la lumière 9.2.1 Polarisations elliptique, circulaire et rectiligne Comme au paragraphe 2.8, on se place dans le cas simple où la composante fréquentielle du champ se réduit à une onde plane à la fréquence f se propageant dans la direction définie par le vecteur β , soit :  E( ρ , f ) = A(f )e i β ·ρ

Nous choisirons désormais comme repère un trièdre Oxyz dont l’axe z est de même direction que celle définie par le vecteur β . Dans ces conditions, nous pouvons écrire, compte tenu du caractère monochromatique de l’onde lumineuse considérée :   ⎧ ⎨ Ex (z, t ) = 2 Ax (f )e i(kz −ωt ) = 2 |Ax | cos (kz − ωt + φx )   (9.1) ⎩ E (z, t ) = 2 A (f )e i(kz −ωt ) = 2 A  cos (kz − ωt + φ ) y y y y où l’on a volontairement omis, dans les termes de droite, d’indiquer les dépendances en fréquence des quantités k, |Ax |, |Ay |, φx et φy . Cette équation constitue une description paramétrique de la courbe décrite par l’extrémité du vecteur champ électrique E au cours du temps. Sans perdre en généralité, nous pouvons choisir le plan origine (z = 0) comme plan d’observation particulier et définir une origine des temps telle que la composante Ey

164

9. Polarisation de la lumière

présente, dans ce plan particulier, une phase nulle à l’instant t = 0. Le système à 2 équations (9.1) prend alors la forme suivante :  Ex (t ) = Ax cos (ωt + ϕ) (9.2) Ey (t ) = Ay cos ωt où nous avons remplacé 2|Ax | par Ax,y et introduit la quantité ϕ = φy − φx qui porte habituellement le nom de phase différentielle ou de déphasage polarimétrique . On notera que Ax et Ay sont des grandeurs réelles positives. L’équation de la courbe décrite par l’extrémité du vecteur champ électrique dans le plan origine est obtenue en éliminant la quantité dépendant du temps de ce système de 2 équations. Il suffit pour ce faire de développer le cosinus apparaissant dans la première relation et de réarranger les termes de la manière suivante : ⎧ Ex ⎪ ⎪ − cos ωt cos ϕ = − sin ωt sin ϕ ⎨ Ax (9.3) Ey ⎪ ⎪ = cos ωt ⎩ Ay puis d’élever au carré la première de ces deux relations constitutives : ⎧ 2 Ex Ex ⎪ 2 2 2 2 ⎪ ⎪ ⎨ A 2 + cos ωt cos ϕ − 2 A cos ωt cos ϕ = sin ωt sin ϕ x x E ⎪ y ⎪ ⎪ = cos ωt ⎩ Ay En reportant la seconde relation dans la première, il vient :

Ey2 Ey2 Ex2 Ex Ey 2 + 2 cos ϕ − 2 cos ϕ = 1 − 2 sin2 ϕ Ax2 Ay Ax Ay Ay soit encore :

Ey2 Ex Ey Ex2 + −2 cos ϕ = sin2 ϕ 2 2 Ax Ay Ax Ay

(9.4)

(9.5)

(9.6)

qui est l’équation d’une ellipse dont les axes propres ne sont pas forcément confondus avec ceux du référentiel x Oy que nous avons choisi. La forme de cette ellipse sera naturellement affectée par la valeur prise par 2 paramètres clés, qui sont la phase différentielle ϕ et le rapport Ay /Ax . Si la phase différentielle ϕ est nulle (modulo π), l’équation (9.6) représentant le lieu des points décrits par l’extrémité du vecteur champ électrique prend la forme

165

De l’Optique électromagnétique à l’Interférométrie

particulière suivante :



Ey Ex ± Ax Ay

2 =0

(9.7)

qui correspond à une droite : on retrouve ici le cas de la polarisation rectiligne introduite au chapitre 2. Le deuxième cas particulier important est celui qui correspond au cas où la phase différentielle est égale à π/2 (modulo π), et où les deux quantités Ax et Ay sont égales. L’équation (9.6) prend dans ce cas la forme particulière suivante : Ex2 + Ey2 = Ax2

(9.8)

qui n’est rien d’autre que celle d’un cercle de rayon Ax : on parlera donc dans ce cas de polarisation circulaire. Dans tous les autres cas, on parlera de polarisation elliptique.

9.2.2 Polarisations droite et gauche Nous avons montré au paragraphe 9.2.1 que l’extrémité du vecteur champ électrique décrivait de manière générale une ellipse, mais sans avoir défini dans quel sens cette trajectoire était parcourue. Pour ce faire, considérons à nouveau l’angle polaire γ (t ) défini par : tan γ (t ) =

Ey Ay cos ωt = Ex Ax cos (ωt + ϕ)

(9.9)

ainsi que l’expression de sa dérivée d γ /dt : {1 + tan2 γ (t )}

Ay sin ϕ dγ =ω 2 dt Ax cos (ωt + ϕ)

(9.10)

En utilisant la relation (9.9) et en réarrangeant les termes de l’expression (9.10), il vient : Ax Ay dγ sin ϕ (9.11) =ω dt |E |2 Cela signifie que : • lorsque ϕ ∈ [0, π], la vitesse de rotation du vecteur champ électrique est positive et l’ellipse est donc parcourue dans le sens direct (sens inverse des aiguilles d’une montre), et l’on parlera dans ce cas de polarisation elliptique gauche ; • lorsque ϕ ∈ [−π, 0], la vitesse de rotation du vecteur champ électrique est négative et l’ellipse est donc parcourue dans le sens rétrograde (sens des aiguilles d’une montre), et l’on parlera alors de polarisation elliptique droite.

166

9. Polarisation de la lumière

Cette désignation s’applique bien évidemment au cas particulier où la polarisation est de type circulaire (ϕ = ± π2 ), mais perd toute signification lorsque celle-ci est de nature linéaire (ϕ = 0). Dans ce dernier cas, on retrouve bien d γ /dt = 0.

9.2.3 Caractéristiques de l’ellipse Comme nous l’avons indiqué au paragraphe 9.2.1, l’équation de l’ellipse définie par la relation (9.6) ne correspond en général pas à sa représentation canonique, puisqu’il n’y a aucune raison pour que les axes du laboratoire coïncident avec les axes propres de cette ellipse. Nous allons donc dans ce paragraphe rechercher les paramètres qui permettent d’identifier les caractéristiques de l’ellipse de polarisation dans le cas général. À l’aide d’une rotation d’angle α approprié, effectuons un changement de repère pour nous placer dans le référentiel x  Oy  correspondant aux axes propres de l’ellipse. L’équation (9.6) prend alors la forme simplifiée suivante : Ey2 Ex2 + 2 =1 a2 b

(9.12)

La relation entre (Ex  , Ey  ) et (Ex , Ey ) étant définie par cette rotation d’angle α, nous avons :  Ex  = Ex cos α + Ey sin α (9.13) Ey  = −Ex sin α + Ey cos α Nous pouvons également décrire, grâce à la relation (9.12), le mouvement de l’extrémité du vecteur champ électrique sur cette ellipse en utilisant une relation paramétrique qui tienne compte des longueurs effectives a et b de ses axes, soit :  Ex  = a cos (ωt + φ0 ) (9.14) Ey  = ±b sin (ωt + φ0 ) le recours aux signes ± étant destiné à couvrir les deux sens possibles de rotation le long de l’ellipse (le signe + étant associé à une polarisation gauche et le signe − à une polarisation droite), et l’introduction du terme de phase φ0 un terme de phase identique sur chaque composante. En regroupant les relations (9.2), (9.13) et (9.14), nous obtenons deux manières différentes d’exprimer les quantités Ex  et Ey  , soit :  Ex  = a cos (ωt + φ0 ) = Ax cos (ωt + ϕ) cos α + Ay cos ωt sin α (9.15) Ey  = ±b sin (ωt + φ0 ) = −Ax cos (ωt + ϕ) sin α + Ay cos ωt cos α

167

De l’Optique électromagnétique à l’Interférométrie

Ces égalités sont évidemment vérifiées quel que soit l’instant t considéré, ce qui nous conduit à formuler 4 relations indépendantes entre les coefficients de cos ωt et de sin ωt , soit : ⎧ a cos φ0 = Ax cos ϕ cos α + Ay sin α ⎪ ⎪ ⎪ ⎨ a sin φ = A sin ϕ cos α 0 x (9.16) ⎪ = −A ±b sin φ 0 x cos ϕ sin α + Ay cos α ⎪ ⎪ ⎩ ±b cos φ0 = Ax sin ϕ sin α En élevant au carré et en sommant les deux premières relations, il vient : a 2 = Ax2 cos2 α + Ay2 sin2 α + 2Ax Ay sin α cos α cos ϕ

(9.17)

De la même manière, en utilisant les deux dernières relations : b 2 = Ax2 sin2 α + Ay2 cos2 α − 2Ax Ay sin α cos α cos ϕ

(9.18)

ce qui, par sommation des expressions (9.17) et (9.18), conduit à une relation évidente, car résultant directement du principe de conservation de l’énergie, à savoir : a 2 + b 2 = Ax2 + Ay2

(9.19)

En formant maintenant le produit des relations (9.16-1) et (9.16-3), nous obtenons une première expression du produit ±ab sin φ0 cos φ0 : ±ab sin φ0 cos φ0 = Ax Ay cos ϕ ( cos2 α − sin2 α) + sin α cos α(Ay2 − Ax2 cos2 ϕ)

(9.20)

que nous pouvons mettre en regard de celle qui est obtenue en faisant le produit des relations (9.16-2) et (9.16-4) : ±ab sin φ0 cos φ0 = sin α cos αAx2 sin2 ϕ

(9.21)

Ceci nous conduit à la troisième relation recherchée, soit : 2Ax Ay cos ϕ cos 2α = sin 2α(Ax2 − Ay2 )

(9.22)

Celle-ci peut être mise sous la forme équivalente suivante : tan 2α =

2Ax Ay cos ϕ Ax2 − Ay2

(9.23)

soit encore, en introduisant la quantité ( ∈ [0, π/2]), telle que tan = Ay /Ax : tan 2α =

168

2 tan

cos ϕ = tan 2 cos ϕ 1 − tan2

(9.24)

9. Polarisation de la lumière

À ce stade, la position angulaire (α) de l’ellipse est définie en fonction des caractéristiques ( , φ) du champ. Toutefois, il nous reste encore à en calculer les dimensions du petit et du grand axe. La dernière relation utile est obtenue en formant le produit des relations (9.16-1) et (9.16-4), puis celui des relations (9.16-2) et (9.16-3), et en faisant la somme des résultats obtenus : ± ab = Ax sin ϕ sin α(Ax cos ϕ cos α + Ay sin α) + Ax sin ϕ cos α(−Ax cos ϕ sin α + Ay cos α) (9.25) soit encore, après simplification : ±ab = Ax Ay sin ϕ

(9.26)

Vérifions que la correspondance des signes à l’intérieur de cette égalité est conforme à nos hypothèses : les quantités a, b, Ax et Ay sont toutes positives, ce qui signifie qu’une valeur positive de la phase différentielle ϕ est associée au signe + dans la relation initiale (9.14), soit :  Ex  = a cos (ωt + φ0 ) Ey  = b sin (ωt + φ0 ) ce qui correspond bien à une rotation dans le sens direct (et donc gauche). Divisons maintenant membre à membre la relation (9.26) par la relation (9.19). Il vient : Ax Ay ±ab = 2 sin ϕ (9.27) 2 2 a +b Ax + Ay2 Introduisons ici la quantité β, définie par tan β = ±b/a, et reformulons les deux membres de la relation (9.27) en introduisant les paramètres et β. Après quelques transformations trigonométriques simples, on obtient : sin 2β = sin 2 sin ϕ

(9.28)

En conclusion, ce changement de repère nous a conduit à identifier les 3 relations fondamentales suivantes : ⎧ 2 2 2 2 ⎪ ⎨ a + b = Ax + Ay tan 2α = tan 2 cos ϕ ⎪ ⎩ sin 2β = sin 2 sin ϕ où α désigne l’azimut du grand axe de l’ellipse dans le référentiel du laboratoire, une quantité liée au rapport des modules des deux états de polarisation (tan = Ay /Ax ) et β une quantité similaire, mais cette fois liée au rapport des longueurs des deux axes de l’ellipse (tan β = a/b).

169

De l’Optique électromagnétique à l’Interférométrie

La démarche de calcul que nous venons de suivre nous a donc permis de déterminer les paramètres de l’ellipse que décrit, dans le plan d’onde, l’extrémité du vecteur champ électrique en fonction des caractéristiques Ax , Ay et ϕ de ce champ. Nous allons maintenant nous intéresser aux différentes méthodes permettant de représenter cet état de polarisation et de visualiser les valeurs prises par ces différents paramètres.

9.2.4 Représentations des états de polarisation 9.2.4.1 Paramètres de Stokes Dans le cas d’une onde plane monochromatique, on définit les 4 quantités réelles S0 , S1 , S2 et S3 à l’aide des relations suivantes : ⎧ S0 = Ax2 + Ay2 ⎪ ⎪ ⎪ ⎪ ⎨ S = A2 − A2 1 x y (9.29) ⎪ ⎪ S2 = 2Ax Ay cos ϕ ⎪ ⎪ ⎩ S3 = 2Ax Ay sin ϕ Ces quantités sont appelées paramètres de Stokes. Elles permettent de caractériser complètement l’état de polarisation de cette onde lumineuse, puisqu’il est possible de calculer Ax , Ay et φ à partir de S1 , S2 et S3 . On notera que le premier terme S0 caractérise la puissance transportée par l’onde et satisfait la relation générale : S02 = S12 + S22 + S32

(9.30)

Grâce à l’introduction de ces paramètres, la relation (9.23) peut être mise sous la forme condensée suivante : tan 2α =

S2 S1



S2 = S1 tan 2α

(9.31)

En combinant maintenant les relations (9.27), (9.28) et la définition de S3 , il vient aussitôt : 2Ax Ay sin ϕ S3 = = sin 2β ⇒ S3 = S0 sin 2β (9.32) 2 2 Ax + Ay S0 Pour obtenir l’expression de S1 , il nous suffit de reporter les expressions (9.31) et (9.32) dans la relation générale (9.30), soit : S02 = S12 + S12 tan2 α + S02 sin2 2β

170



S1 = S0 cos 2β cos 2α

(9.33)

9. Polarisation de la lumière

ce qui permet de ré-exprimer les 3 dernières expressions du système (9.29) sous la forme suivante : ⎧ ⎪ ⎨ S1 = S0 cos 2β cos 2α S2 = S0 cos 2β sin 2α (9.34) ⎪ ⎩ S = S sin 2β 3 0

9.2.4.2 Sphère de Poincaré La structure du système d’équations (9.34) est comparable à celle permettant de repérer la position d’un point dans un système de coordonnées sphériques, où S0 désignerait la distance à l’origine de ce point, 2α son azimut (ou longitude) et 2β son élévation (ou latitude). Par conséquent, puisque la quantité S0 n’est liée qu’à l’éclairement total associé à l’onde lumineuse, l’état de polarisation de cette onde se trouvera entièrement défini par la seule connaissance des trois grandeurs réduites S1 /S0 , S2 /S0 et S3 /S0 , et donc par la position du point représentatif qui leur est associé sur une sphère de rayon unité. Cette sphère particulière porte le nom de sphère de Poincaré.

9.2.5 Vecteur de Jones Les systèmes optiques mettent souvent en jeu des composants susceptibles de modifier l’état de polarisation de la lumière. Pour pouvoir décrire ces changements d’état d’un composant à l’autre, jusqu’à la sortie du système, il est pratique de faire appel à la notion de vecteur de Jones que nous introduisons dans ce paragraphe et à celle de matrice de Jones que nous présenterons un peu plus loin (paragraphe 9.3.1). On sait que l’état de polarisation d’une onde plane monochromatique est entièrement défini par la connaissance des quantités Ax e iφx et Ay e iφy . Il est donc possible de représenter cet état de polarisation par la donnée d’un vecteur à deux composantes, défini par :   Ax e iφx (9.35) V = Ay e iφy et qui porte le nom de vecteur de Jones. On notera bien évidemment que ce vecteur n’est pas réellement nouveau puisqu’il s’identifie à l’amplitude complexe de l’onde plane, ou encore à une composante élémentaire du champ (monochromatique et monodirectionnelle), après double transformation de Fourier temporelle et spatiale. La désignation qui en est faite dans le contexte associé à la polarisation de la lumière (vecteur de Jones) résulte comme souvent de considérations historiques.

171

De l’Optique électromagnétique à l’Interférométrie

Comme nous l’avons vu au paragraphe précédent, le module de ce vecteur est en relation directe avec l’éclairement lumineux associé à l’onde et n’apporte aucune information sur son état de polarisation. Il est donc habituel de s’intéresser uniquement à une forme normée de ce vecteur, dans laquelle l’origine des phases est en outre prise sur celle de la composante x . En conséquence, il vient : ⎡ ⎤ ⎡ ⎤ Ax Ax iφx e ⎥ ⎢ 2 ⎢ 2 ⎥ ⎢ Ax + Ay2 ⎥ ⎢ Ax + Ay2 ⎥ ⎢ ⎥ ⎢ ⎥ iφ x V = ⎢ = e (9.36) ⎥ ⎢ ⎥ Ay A ⎢ ⎥ ⎢ ⎥ y iφ i(φ −φ ) y y x ⎣ ⎣ ⎦ e ⎦ e Ax2 + Ay2 Ax2 + Ay2 En utilisant la phase différentielle ϕ et la quantité définie au paragraphe 9.2.3, cette relation de définition s’écrit encore :   cos

V = (9.37) e iϕ sin

où nous avons omis de faire apparaître le terme de phase absolue en e iφx , puisqu’il sera sans influence sur l’état de polarisation décrit par ce dernier vecteur.

9.2.5.1 Illustration au travers de cas particuliers 9.2.5.1.1 Polarisation rectiligne Nous avons vu au paragraphe 9.2.1 qu’une onde polarisée rectilignement était caractérisée par une phase différentielle ϕ égale à 0, modulo π. En conséquence, le vecteur de Jones qui la décrit sera du type :   cos

 V = ± sin

Les paramètres de Stokes associés ont pour expression : ⎤ ⎡ 1 ⎢ cos 2 ⎥ ⎥ ⎢ S0 ⎢ ⎥ ⎣ ± sin 2 ⎦ 0

(9.38)

(9.39)

L’angle 2β est ici nul, ce qui signifie que les états de polarisation rectiligne se trouvent tous sur l’équateur de la sphère de Poincaré, à une longitude définie par la quantité ±2 , comme représenté à la figure 9.1.

172

9. Polarisation de la lumière

z

y

2e

x Figure 9.1 Représentation des états de polarisation rectiligne sur la sphère de Poincaré.

Il est important d’avoir présent à l’esprit la forme prise par le vecteur de Stokes dans les cas particuliers où la direction de polarisation est alignée avec l’un des axes du référentiel laboratoire, soit : • polarisation rectiligne le long de Ox :   1 Vx = 0

⎡ ⎤ 1 ⎢ 1⎥ ⎢ ⎥ S0 ⎢ ⎥ ⎣ 0⎦ 0

• polarisation rectiligne le long de Oy : ⎤ 1 ⎢ −1⎥ ⎢ ⎥ S0 ⎢ ⎥ ⎣ 0⎦ 0 ⎡

Vy =

  0 1

9.2.5.1.2 Polarisation circulaire Nous avons vu au paragraphe 9.2.1 qu’une onde polarisée circulairement était caractérisée par une phase différentielle ϕ égale à ±π/2 et un paramètre égal à π/4 (tan = 1). Le vecteur de Jones qui la décrit sera donc du type :   1 1 V = √ 2 ±i

(9.40)

173

De l’Optique électromagnétique à l’Interférométrie

les paramètres de Stokes associés ayant pour expression : ⎡ ⎤ 1 ⎢ 0⎥ ⎢ ⎥ S0 ⎢ ⎥ ⎣ 0⎦ ±1

(9.41)

L’angle 2β est ici égal à ±π/2, ce qui signifie que les états de polarisation circulaire se trouvent confondus avec les pôles de la sphère de Poincaré, comme représenté à la figure 9.2 : • le pôle Nord étant associé à la polarisation circulaire gauche : ⎡ ⎤ 1   ⎥ ⎢ 1 1 ⎢ 0⎥ S0 ⎢ ⎥ VG = √ ⎣ 0⎦ 2 i 1 • et le pôle Sud à la polarisation circulaire droite : ⎡

⎤ 1 ⎢ 0⎥ ⎢ ⎥ S0 ⎢ ⎥ ⎣ 0⎦ −1

  1 1 VD = √ 2 −i

z

z

y

x

y

x

Figure 9.2 Représentation des états de polarisation circulaire sur la sphère de Poincaré.

174

9. Polarisation de la lumière

9.3 Manipulation de l’état de polarisation 9.3.1 Matrice de Jones Nous abordons maintenant, grâce aux outils décrits précédemment, le formalisme des matrices de Jones pour suivre l’évolution de l’état de polarisation d’une onde lumineuse à la traversée d’un système optique. On considérera que l’entrée du système est éclairée par le vecteur de Jones normé introduit précédemment. Par ailleurs, la plupart des composants polarimétriques étant de nature anisotrope, il nous faudra mettre en œuvre les concepts introduits au chapitre 8. Lorsque l’onde lumineuse rencontre une lame de faible épaisseur réalisée dans un matériau anisotrope, les composantes du vecteur de Jones se trouvent modifiées de manière complexe par la traversée de cet objet, du fait de l’existence, dans cette lame anisotrope, de deux états propres de propagation qui diffèrent par leur indice de réfraction et l’orientation de l’état de polarisation qui leur correspond dans le référentiel du laboratoire. Pour décrire cette modification, nous allons procéder en deux étapes : • la première consiste à définir une matrice 2 × 2, la matrice de Jones, qui rend compte des propriétés de déphasage de cette lame dans le référentiel associé à ses axes propres (c’est ce que nous avions décrit de manière préliminaire au paragraphe 8.6) ; • la seconde traite de l’orientation de cette lame dans le référentiel du laboratoire, c’est-à-dire celui où se trouve défini l’état de polarisation de l’onde lumineuse incidente. On notera cependant qu’une seule étape peut suffire lorsque le composant n’est pas anisotrope. C’est notamment le cas des empilements de couches minces dont le pouvoir polarimétrique est très utilisé en incidence d’éclairement oblique. Analysons maintenant la première étape. Comme indiqué plus haut, si une onde lumineuse polarisée rectilignement traverse une lame réalisée dans un matériau anisotrope alors que son état de polarisation est aligné sur l’un des axes propres de cette lame, cette onde va se propager sans déformation, comme si le milieu considéré était isotrope, en accumulant un déphasage proportionnel à l’épaisseur e de cette lame et à l’indice de réfraction (n1 ou n2 ) caractéristique de cet axe propre. La matrice de Jones M associée à cette lame dans le référentiel de ses axes propres aura donc pour expression :  2πn1 e    2πn e 1 0 ei λ 0 i λ1 (9.42) M= = e 2πe n 2πn2 e 0 ei λ 0 ei λ

175

De l’Optique électromagnétique à l’Interférométrie

que l’on peut également mettre sous la forme équivalente suivante :     iφ 2πe n e 1 0 iφ1 1 0 =e avec φ = M= i φ iφ 2 0e 0 e λ

(9.43)

La deuxième étape consiste à utiliser la matrice, notée Mlab , qui rend compte des propriétés de cette lame dans le référentiel du laboratoire, et qui est quant à elle définie par : Mlab = R(−α)MR(α) (9.44) où R(α) désigne la matrice associée à une rotation d’angle α   cos α sin α R(α) = (9.45) − sin α cos α et α l’angle entre l’axe du matériau biréfringent uniaxe et l’axe Ox du référentiel du laboratoire, la lame considérée étant parallèle au plan x Oy.

9.3.2 Composants polarimétriques 9.3.2.1 Polariseur Le premier composant que nous allons considérer ici, à savoir un polariseur, est un peu particulier, car son fonctionnement peut être décrit en supposant que, dans son repère propre, l’une des composantes de polarisation est supprimée, à savoir celle qui est parallèle à Oy. Dans ces conditions, la matrice de Jones qui le caractérise a pour expression :   10 P= (9.46) 00 le terme de phase absolue qui aurait dû figurer en facteur (e i ment omis.

2πn1 e λ

) étant habituelle-

On peut aussi décrire cette propriété en considérant que l’un des deux indices propres, par exemple n2 , présente une forte partie imaginaire (n2 = n2 + in2 avec n2 e  λ). Si la direction passante de ce polariseur fait un angle α avec l’axe Ox , la matrice décrivant le comportement de ce composant dans le référentiel du laboratoire s’écrit :   cos2 α sin α cos α Plab = R(−α)PR(α) = (9.47) sin α cos α sin2 α

9.3.2.2 Association polariseur-lame quart d’onde On désigne par lame quart d’onde une lame biréfringente qui introduit un retard différentiel e n entre ses deux états propres égal à un multiple entier impair de λ/4,

176

9. Polarisation de la lumière

soit : e n = (2q + 1)

λ 4



π φ = (2q + 1) , q ∈ N 2

(9.48)

On précise souvent si la lame considérée est d’ordre zéro (q = 0) ou d’ordre multiple (q > 0), car cette caractéristique a des conséquences importantes sur le comportement chromatique du composant. La matrice associée à une lame quart d’onde dans le référentiel de ses axes propres a donc pour expression (au terme de phase absolue près) :   10 MQW = (9.49) 0i Supposons que nous placions maintenant un polariseur devant une telle lame quart d’onde, la direction passante de ce polariseur étant orientée le long de l’axe Ox , les axes propres de la lame étant basculés de 45˚ par rapport à ceux du laboratoire. La matrice de Jones associée à cet ensemble a alors pour expression :       π π 1 1 −1 1 0 1 1 1 10 √ M = R(− )MQW R( )P = √ 0i 4 4 2 1 1 2 −1 1 0 0   (9.50) 1 1+i 0 = 2 1−i 0 Si cette association Polariseur-Lame quart d’onde est éclairée par une onde lumineuse d’état de polarisation quelconque, le vecteur de Jones de l’onde émergente sera défini par :      1 1 1 + i 0 Ax e iφx 1 iφx = (9.51) e (1 + i )A Vout = MVin = x −i 2 1 − i 0 Ay e iφy 2 ce qui correspond à une onde de polarisation circulaire (ici gauche, l’état droit étant associé à un basculement de −45˚ de la lame quart d’onde par rapport aux axes du laboratoire). Utiliser une telle association polariseur-lame quart d’onde constitue donc une méthode extrêmement simple et efficace pour générer un état de polarisation circulaire, à partir d’une polarisation arbitraire.

9.3.2.3 Association polariseur-lame demi-onde On désigne par lame demi-onde une lame biréfringente qui introduit un retard différentiel e n entre ses deux états propres égal à un multiple impair de λ/2, soit : e n = (2q + 1)

λ 2



φ = (2q + 1)π, q ∈ N

(9.52)

177

De l’Optique électromagnétique à l’Interférométrie

La matrice associée à une lame demi-onde dans le référentiel de ses axes propres a donc pour expression (au terme de phase absolue près) :   1 0 MHW = (9.53) 0 −1 Supposons à nouveau que nous placions un polariseur devant une telle lame demionde, la direction passante de ce polariseur étant, comme précédemment, alignée avec l’axe Ox du laboratoire et les axes de la lame étant ici basculés d’un angle α par rapport à ceux du laboratoire. La matrice de Jones associée à cet ensemble a pour expression :      cos α − sin α 1 0 cos α sin α 1 0 M = R( − α)MHW R(α)P = sin α cos α 0 −1 − sin α cos α 0 0    cos 2α sin 2α 10 = sin 2α − cos 2α 0 0   cos 2α 0 = (9.54) sin 2α 0 Si cette association polariseur-lame demi-onde est éclairée, comme précédemment, par une onde lumineuse d’état de polarisation quelconque, le vecteur de Jones associé à l’onde émergente s’écrira :      cos 2α 0 Ax e iφx iφx cos 2α = A (9.55) e Vout = MVin = x sin 2α sin 2α 0 Ay e iφy ce qui correspond à une onde de polarisation linéaire faisant un angle 2α avec l’axe Ox du laboratoire. En l’absence de lame demi-onde, ce vecteur de Jones aurait eu pour expression :      iφ  1 0 Ax e x iφx 1   Vout = PVin = = Ax e (9.56) 0 0 0 Ay e iφy L’introduction d’une lame demi-onde basculée d’un angle α par rapport aux axes du laboratoire a donc permis de faire pivoter l’état linéaire généré par le polariseur d’un angle double. C’est la raison pour laquelle cette association polariseur-lame demi-onde est souvent désigné sous le terme de rotateur de polarisation.

9.4 Polarisation partielle Jusqu’ici nous avons considéré des ondes planes, c’est-à-dire des champs monochromatiques et monodirectionnels. Cette restriction a permis d’utiliser la propriété de

178

9. Polarisation de la lumière

 ) du champ électromagnétique pour montrer que, dans le trièdre direct (β , E , H plan perpendiculaire au vecteur d’onde, le champ électrique (ou magnétique) était en rotation, avec une extrémité décrivant une ellipse. Ce résultat est caractéristique de l’onde plane, dont on dit qu’elle est parfaitement (ou totalement) polarisée. Nous nous proposons maintenant de voir comment ce résultat peut être étendu dans le cas d’une onde qui n’est plus monochromatique, ce qui nous amènera à introduire les notions de polarisation partielle ou de degré de polarisation. Il est important de souligner d’emblée que polarisation et cohérence sont en général analysées conjointement. Il s’agit en effet d’analyser la capacité de la lumière à interférer avec elle-même, soit par un dédoublement de faisceau (cas de la cohérence temporelle introduite au chapitre 6), soit par superposition des modes de polarisation, comme abordé dans ce paragraphe.

9.4.1 Matrice de cohérence Considérons une onde dont l’état de polarisation du champ   quasi monochromatique électrique E (t ) = Ex (t ), Ey (t ) est supposé quelconque. Supposons que cette onde traverse tout d’abord une lame biréfringente dont les axes propres sont alignés avec les axes du laboratoire (déphasages notés φx et φy ), puis un polariseur dont la direction passante fait un angle θ avec l’axe Ox . En adoptant le formalisme du signal analytique introduit au chapitre 6, nous pouvons écrire le champ électrique E  (t ) transmis par cette association lame biréfringentepolariseur sous la forme suivante :   E  (t ) = Ex (t )e iφx cos θ + Ey (t )e iφy sin θ uθ (9.57) où uθ désigne le vecteur unitaire porté par la direction passante du polariseur. On mesure alors l’éclairement associé à cette onde transmise à l’aide d’un détecteur. Celui-ci délivre un courant I défini par (cf. paragraphe 6.3) :  I = K E ∗ (t )E (t ) T = K cos2 θ Ex∗ (t )Ex (t ) T + sin2 θ Ey∗ (t )Ey (t ) T  (9.58) + sin θ cos θe iϕ Ex∗ (t )Ey (t ) T + sin θ cos θe −iϕ Ey∗ (t )Ex (t ) T où K est une constante de proportionnalité que nous omettrons désormais. Introduisons à ce niveau la matrice de cohérence J définie par :   ∗   Ex (t )Ex (t ) T Ex∗ (t )Ey (t ) T Jxx Jxy = E ∗ (t )E (t ) E ∗ (t )E (t ) J= Jyx Jyy x T y T y y

(9.59)

179

De l’Optique électromagnétique à l’Interférométrie

La trace Tr J de cette matrice est un réel positif et correspond à l’éclairement associé à l’onde entrante. En effet : Tr J = Jxx + Jyy = Ex∗ (t )Ex (t ) T + Ey∗ (t )Ey (t ) T

(9.60)

Par ailleurs, les éléments non diagonaux Ex∗ (t )Ey (t ) T et Ey∗ (t )Ex (t ) T sont des quantités complexes, conjuguées l’une de l’autre, puisque : Jyx = Jxy∗

(9.61)

La matrice de cohérence J est donc hermitienne, mais également définie positive. On montre que, dans ces conditions, son déterminant est nécessairement positif ou nul, soit : det J = Jxx Jyy − Jxy Jyx  0 (9.62) En introduisant le degré de cohérence mutuelle jxy entre les deux composantes Ex (t ) et Ey (t ) du champ incident, défini par : jxy = |jxy | e iβxy = 

Jxy Jxx Jyy

avec 0  |jxy |  1

(9.63)

nous pouvons mettre la relation (9.58) sous la forme équivalente suivante :    (9.64) I = Jxx cos2 θ + Jyy sin2 θ + 2 Jxx Jyy |jxy | sin θ cos θ cos (βxy + ϕ) En utilisant les relations trigonométriques entre angle simple et angle double, il vient aussitôt : I =

 1 (Jxx + Jyy ) + (Jxx − Jyy ) cos 2θ + 2|Jxy | sin 2θ cos (βxy + ϕ) 2

(9.65)

On pose : Jxx − Jyy = R (ϕ) cos β(ϕ) et avec R (ϕ) =

2|Jxy | cos (βxy + ϕ) = R (ϕ) sin β(ϕ)

 (Jxx − Jyy )2 + 4|Jxy |2 cos2 (βxy + ϕ)

(9.66) (9.67)

En utilisant ces quantités, nous pouvons donner à l’expression du courant I la forme contractée suivante : I =

1 {Tr J + R (ϕ) cos[2θ − β(ϕ)]} 2

(9.68)

Réalisons maintenant une expérience de pensée dans laquelle nous faisons varier la phase différentielle ϕ associée à la lame biréfringente sans modifier l’orientation θ

180

9. Polarisation de la lumière

du polariseur. Le courant I varie alors de manière sinusoïdale entre les deux valeurs extrêmes I1(ϕ) et I2(ϕ) définies par : ⎧  1 ⎪ ⎨ I1(ϕ) = Tr J + (Jxx − Jyy ) cos 2θ + 2|Jxy | sin 2θ 2 (9.69) ⎪ ⎩ I2(ϕ) = 1 Tr J + (Jxx − Jyy ) cos 2θ − 2|Jxy | sin 2θ  2 l’utilisation des indices (ϕ) étant destinée à rappeler que le paramètre variable est justement cette phase différentielle. On supposera désormais que sin 2θ est positif. Les deux quantités I1 et I2 peuvent alors être mises sous la forme équivalente suivante : ⎧ 1 ⎪ ⎨ I1(ϕ) = Imax(ϕ) = {Tr J + DCmax } 2 (9.70) 1 ⎪ ⎩ I2(ϕ) = Imin(ϕ) = {Tr J + DCmin } 2 dans laquelle :

 (Tr J)2 − 4 det J   Cmax = max cos (2θ − β  ), cos (2θ − β  )   Cmin = min cos (2θ − β  ), cos (2θ − β  ) Jxx − Jyy 2|Jxy | cos β  = sin β  = D D D=

(9.71)

Dans notre expérience de pensée, faisons maintenant varier l’angle θ du polariseur sans modifier la valeur de la phase différentielle ϕ associée à l’élément biréfringent. Le courant I varie à nouveau de manière sinusoïdale entre les deux nouvelles valeurs extrêmes Imax(θ ) et Imin(θ ) définies par : ⎧ 1 ⎪ ⎨ Imax(θ ) = {Tr J + R (ϕ)} 2 (9.72) 1 ⎪ ⎩ Imin(θ ) = {Tr J − R (ϕ)} 2 Pour achever notre expérience de pensée, il nous reste à déterminer les valeurs extrêmes du courant que nous serions susceptibles d’obtenir en faisant varier simultanément la phase différentielle ϕ introduite par l’élément biréfringent et l’orientation θ du polariseur. Il nous suffit pour cela de rechercher soit le maximum (respectivement le minimum) de Imax(ϕ) (respectivement Imin(ϕ) ) par rapport à θ, soit le maximum (respectivement le minimum) de Imax(θ ) (respectivement Imin(θ ) ) par rapport à ϕ.

181

De l’Optique électromagnétique à l’Interférométrie

Les courants obtenus ne dépendent pas de la procédure adoptée et sont donnés par : ⎧   1 ⎪ ⎨ Imax(ϕ,θ ) = Tr J + (Tr J)2 − 4 det J 2 (9.73)    ⎪ ⎩ Imin(ϕ,θ ) = 1 Tr J − (Tr J)2 − 4 det J 2 On forme alors le rapport Imax(ϕ,θ ) − Imin(ϕ,θ ) v= = Imax(ϕ,θ ) + Imin(ϕ,θ )

 1−

4 det J (Tr J)2

(9.74)

qui n’est rien d’autre que la visibilité maximale que l’on peut atteindre lorsque l’on fait interférer les deux composantes du champ électrique incident E (t ). Lorsque nous avons construit notre expérience de pensée, nous avons choisi de manière totalement arbitraire l’orientation de notre repère x Oy. Il nous reste donc à vérifier si une rotation d’angle α appliquée à ce repère affecte d’une manière quelconque la valeur de la visibilité maximale v que nous venons de déterminer. On désignera par X OY le repère ayant subi la rotation d’angle α. Dans ce nouveau repère, les composantes du champ s’écrivent :  EX = Ex cos α + Ey sin α (9.75) EY = −Ex sin α + Ey cos α Dans ce nouveau repère, la matrice de cohérence a pour expression :   J J Jα = XX XY JYX JYY avec

⎧ JXX ⎪ ⎪ ⎪ ⎪ ⎨J YY ⎪ JXY ⎪ ⎪ ⎪ ⎩ JYX

(9.76)

= Jxx cos2 α + Jyy sin2 α + (Jxy + Jyx ) sin α cos α = Jxx sin2 α + Jyy cos2 α − (Jxy + Jyx ) sin α cos α = Jxy cos2 α − Jyx sin2 α − (Jxx − Jyy ) sin α cos α

(9.77)

= Jyx cos2 α − Jxy sin2 α − (Jxx − Jyy ) sin α cos α

Calculons tout d’abord la trace de cette nouvelle matrice : tr Jα = JXX +JYY = Jxx ( cos2 α+sin2 α)+Jyy ( sin2 α+cos2 α) = Jxx +Jyy (9.78) puis son déterminant : det Jα = JXX JYY − JXY JYX

182

(9.79)

9. Polarisation de la lumière

Commençons ensuite par calculer le premier produit : JXX JYY = [Jxx cos2 α + Jyy sin2 α + (Jxy + Jyx ) sin α cos α] × [Jxx sin2 α + Jyy cos2 α − (Jxy + Jyx ) sin α cos α] = [Jxx2 + Jyy2 − (Jxy + Jyx )2 ] cos2 α sin2 α

(9.80)

− (Jxx − Jyy )(Jxy + Jyx )( cos2 α − sin2 α) sin α cos α + Jxx Jyy ( cos4 α + sin4 α) puis le second : JXY JYX = [Jxy cos2 α − Jyx sin2 α − (Jxx − Jyy ) sin α cos α] × [Jyx cos2 α − Jxy sin2 α − (Jxx − Jyy ) sin α cos α] = [(Jxx − Jyy )2 − (Jxy2 + Jyx2 )] cos2 α sin2 α 2

(9.81)

2

− (Jxx − Jyy )(Jxy + Jyx )( cos α − sin α) sin α cos α + Jxy Jyx ( cos4 α + sin4 α) avant de former leur différence : JXX JYY − JXY JYX = (Jxx Jyy − Jxy Jyx )( cos4 α + 2 cos2 α sin2 α + sin4 α) = (Jxx Jyy − Jxy Jyx )( cos2 α + sin2 α)2

(9.82)

= Jxx Jyy − Jxy Jyx ce qui montre que sont simultanément remplies les deux égalités : tr Jα = tr J

et det Jα = det J

(9.83)

L’expression de la visibilité maximale v est donc indépendante du choix de l’orientation des axes dans le repère du laboratoire et constitue donc une propriété intrinsèque de l’onde incidente. On notera que ce résultat découle en fait d’une propriété plus générale liée aux invariants matriciels.

9.4.2 Degré de polarisation 9.4.2.1 Lumière non polarisée On définira la lumière naturelle (non polarisée) comme une onde quasimonochromatique pour laquelle le degré de cohérence mutuelle jxy est égal à zéro. Cela signifie que les éléments non diagonaux de la matrice de cohérence sont nuls, soit : Jxy = Jyx = 0.

183

De l’Optique électromagnétique à l’Interférométrie

Si l’on veut que cette propriété soit conservée quelle que soit l’orientation α du référentiel laboratoire, il est nécessaire que l’on ait : JXY = JYX . L’utilisation de la relation (9.77) montre que ceci impose alors que : Jxx = Jyy . En conséquence, la matrice de cohérence J a ici pour expression :   10 J = Jxx 01

(9.84)

et est donc proportionnelle à la matrice unité. La trace de cette matrice est égale à 2Jxx , tandis que son déterminant est égal à Jxx2 . La visibilité maximale v est donc égale à zéro, conformément à la relation (9.74). Cette situation est caractéristique d’une lumière non polarisée, que l’on désignera souvent, de façon abusive, sous l’appellation de lumière naturelle.

9.4.2.2 Lumière totalement polarisée On s’intéresse maintenant à une onde plane quasi-monochromatique pour laquelle le module du degré de cohérence mutuelle est égal à 1, soit : |jxy | = 1. Cette condition  est équivalente à : |Jxy | = Jxx Jyy . On en déduit aussitôt : det J = Jxx Jyy − Jxy Jyx = Jxx Jyy − |Jxy |2 = 0

(9.85)

et donc que la visibilité maximale v est égale à 1. Ce type de lumière sera dit totalement polarisé. La matrice de cohérence associée a dans ce cas pour expression :    e iδ Jxx Jyy Jxx  (9.86) δ∈R J = −iδ e Jxx Jyy Jyy

9.4.2.3 Lumière partiellement polarisée Nous allons maintenant montrer que toute onde plane quasi-monochromatique peut être considérée comme la somme d’une contribution dépolarisée et d’une contribution polarisée. Pour cela, il suffit de montrer que la matrice de cohérence peut s’écrire comme la somme de 2 matrices caractéristiques de lumière totalement dépolarisée et totalement polarisée, à savoir :       Jxx Jxy 10 B D =A + (9.87) J = JNP + JP = 01 D∗ C Jyx Jyy où les quantités A, B, C et D doivent respecter les conditions suivantes : A  0, B  0, C  0, BC − DD ∗ = 0

184

(9.88)

9. Polarisation de la lumière

En utilisant la relation de définition (9.87), nous pouvons ré-exprimer la dernière de ces 4 conditions, soit : BC − DD ∗ = (Jxx − A)(Jyy − A) − Jxy Jyx = 0

(9.89)

qui n’est rien d’autre qu’une équation du second degré en A : A 2 − A(Jxx + Jyy ) + (Jxx Jyy − Jxy Jyx ) = 0

(9.90)

que l’on peut également écrire : A 2 − A Tr J + det J = 0

(9.91)

et dont le discriminant a donc pour expression : = (Tr J)2 − 4 det J

(9.92)

soit encore : = (Jxx + Jyy )2 − 4(Jxx Jyy − Jxy Jyx ) = (Jxx − Jyy )2 + 4|Jxy |2  0

(9.93)

Les solutions de l’équation (9.90) sont donc des quantités réelles qui ont pour expression : !  1 A± = (9.94) Tr J ± (Tr J)2 − 4 det J 2 Considérons dans un premier temps la solution notée A−, pour laquelle nous pouvons écrire :    ! 1  1 4 det J  0 (9.95) A− = Tr J − (Tr J)2 − 4 det J = Tr J 1 − 1 − 2 2 (Tr J)2 car Tr J et det J sont des réels positifs qui vérifient en outre l’inégalité : 4 det J 1 (Tr J)2

(9.96)

Nous en déduisons immédiatement les expressions littérales des quantités B et C , soit : ⎧ 1 1 ⎪ ⎨ B = Jxx − A = (Jxx − Jyy ) + (Tr J)2 − 4 det J 2 2 (9.97)  ⎪ ⎩ C = Jyy − A = 1 (Jyy − Jxx ) + 1 (Tr J)2 − 4 det J 2 2 La prise en compte de l’expression (9.93) du discriminant impose par ailleurs que :   (Jxx − Jyy )2 ⇒ (Tr J)2 − 4 det J  |Jxx − Jyy | (9.98)

185

De l’Optique électromagnétique à l’Interférométrie

En conséquence, les quantités B et C sont obligatoirement positives ou nulles. A, B et C vérifient donc les 3 premières conditions édictées en (9.88), la quatrième étant automatiquement remplie, compte tenu de la démarche de calcul que nous avons suivie. À l’inverse, si nous avions choisi la solution notée A+ comme racine de l’équation du second degré (9.91), cette racine aurait été à l’évidence positive, mais les quantités B et C correspondantes auraient été quant à elles négatives, ce qui n’aurait pas permis de respecter la deuxième et la troisième condition édictées en (9.88). La décomposition de la matrice de cohérence J sous la forme définie par la relation (9.87) est donc unique.

9.4.2.4 Degré de polarisation Calculons maintenant la trace de la matrice associée à la composante polarisée  (9.99) Tr JP = B + C = (Tr J)2 − 4 det J et formons le rapport P entre cette trace et celle associée à l’onde lumineuse que nous avons considérée :  4 det J Tr JP (9.100) = 1− P = Tr J (Tr J)2 Ce rapport P est appelé le degré de polarisation de l’onde lumineuse. Compte tenu de sa définition, il est bien évidemment compris entre 0 et 1, ses valeurs extrêmes étant atteintes lorsque l’onde considérée est soit non polarisée (P = 0), soit totalement polarisée (P = 1). On notera que ce degré de polarisation P s’identifie avec la visibilité maximale v que nous avions introduite au paragraphe 9.4.1 à l’occasion de notre expérience de pensée.

186

Approximation de Fresnel Chapitre conçu par Michel Lequime rédigé par Michel Lequime et Claude Amra

Sommaire 10.1 10.2 10.3 10.4

10.5

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Mise en équation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Filtrage fréquentiel associé à la propagation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Approximation de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.1 Définition et domaine de validité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.2 Fonction de transfert et propagateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Premiers exemples d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.1 Onde plane homogène . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.2 Point brillant de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.3 Effet Talbot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

190 190 191 193 193 194 197 197 198 200

189

De l’Optique électromagnétique à l’Interférométrie

10.1 Introduction Le chapitre 5 nous a permis de montrer comment utiliser les équations de Maxwell pour résoudre de manière exacte des problèmes mettant en jeu des composants constitués de dioptres plans ou de milieux stratifiés. Nous avons vu que la méthode de résolution faisait tout d’abord appel au calcul de l’interaction du composant avec une onde élémentaire (monofréquence, monodirectionnelle), et qu’elle procédait ensuite à une boucle sur les fréquences spatiales, puis temporelles. Cette approche exacte est évidemment majeure, mais on notera qu’elle conduit, même dans ces cas relativement simples, à des calculs rapidement délicats. Nous allons maintenant nous intéresser à des problèmes où les champs sont monochromatiques, mais caractérisés par des répartitions spatiales arbitraires (des paquets d’ondes spatiaux, ou multidirectionnels) qui viennent se transformer à la traversée de composants imageurs (essentiellement des lentilles minces) destinés au contrôle de leur propagation. L’utilisation d’une approche exacte devient ici trop lourde pour être conservée jusqu’au bout et, en outre, l’emploi de ce formalisme rigoureux ne permet pas de faire ressortir les objets mathématiques (et les relations entre ces objets) qui donnent accès à une description synthétique des phénomènes physiques, et rendent possible la généralisation des résultats obtenus à des situations plus complexes. C’est ce qui justifie la démarche que nous allons désormais adopter et les hypothèses qui y seront associées.

10.2 Mise en équation du problème On considère une onde électromagnétique monochromatique de pulsation ω, se propageant dans un milieu isotrope et transparent, et dont la répartition spatiale de ρ , f ). On utilisera dans tout ce qui champ électrique est décrite par la fonction E( suit l’approximation dite scalaire, dans laquelle on néglige l’ensemble des effets liés à la polarisation de l’onde lumineuse, et l’on omettra de mentionner à chaque fois la fréquence f , puisque celle-ci est fixée. En conséquence, la répartition spatiale du champ électrique que nous étudierons ici sera décrite par la donnée de ce seul champ scalaire E ( ρ ) = E (r , z ). À cette répartition spatiale de champ est associé un paquet d’ondes dont on considérera la propagation dans la direction des z positifs. Comme montré au chapitre 4, ce paquet d’ondes progressif a pour expression, en tout point de l’espace :  E (r , z ) = A(ν ) e iα(ν)z e 2iπ ν ·r d 2 ν (10.1) ν

où ν désigne la fréquence spatiale définie dans R2 et A(ν ) la distribution fréquentielle d’amplitude dans le faisceau. Le paramètre α(ν) est quant à lui défini par : α 2 (ν) = k 2 − σ 2 , où σ désigne la pulsation spatiale (σ = 2πν). On notera que

190

10. Approximation de Fresnel

l’argument de l’exponentielle e iα(ν)z est complexe pour les ondes planes (σ < k) et réel pour les ondes évanescentes (σ > k). Compte tenu de la forme mathématique de la relation (10.1), on peut aussi considérer le champ comme la transformée de Fourier du produit de la distribution d’amplitude A(ν ) par l’exponentielle e iα(ν)z , soit :   E (r , z ) = TF A(ν ) e iα(ν)z (10.2) Nous pouvons reformuler cette dernière relation en faisant apparaître un produit de convolution sur la variable d’espace r :     E (r , z ) = TF A(ν )  TF e iα(ν)z (10.3) Exprimons maintenant la distribution d’amplitude A(ν ) sous une autre forme. Le plan situé à l’abscisse z = 0 sera désormais défini comme étant l’entrée du système optique. Sur ce plan, le champ s’écrit, conformément à la relation (10.2), comme la transformée de Fourier de la distribution d’amplitude A(ν ) du paquet spatial :   E (r , 0) = TF A(ν ) (10.4) On peut alors réinjecter cette relation (10.4) dans l’expression générale (10.3) du champ en un point quelconque de l’espace, et obtenir ainsi :   E (r , z ) = E (r , 0)  TF e iα(ν)z (10.5) Cette relation montre que le champ à l’abscisse z peut être déduit du champ à l’abscisse 0 à l’aide d’un produit de convolution. En d’autres termes, la propagation du paquet d’ondes spatial dans la direction des z positifs est décrite comme l’action d’un filtre linéaire sur la dépendance spatiale du champ à l’entrée du système optique. On notera que la réponse percussionnelle h(r ) de ce filtre est définie par :    iα(ν)z (10.6) h(r ) = TF e = e iα(ν)z e 2iπ ν ·r d 2 ν ν

10.3 Filtrage fréquentiel associé à la propagation Nous avons montré au chapitre 4 que les ondes évanescentes s’amortissaient rapidement à la propagation, et c’est la raison pour laquelle elles ne jouent quasiment aucun rôle dans les systèmes optiques, où les distances de propagation sont grandes devant la longueur d’onde. Par ailleurs, à l’entrée (z = 0) du système optique, ces ondes sont déjà amorties (et donc absentes), car elles résultent le plus souvent de l’émission d’une source en

191

De l’Optique électromagnétique à l’Interférométrie

espace libre, située en champ lointain et en amont (z < 0) de ce plan d’entrée (ou de référence). En conséquence, lors de la propagation dans un système optique, les paquets d’ondes harmoniques ne transportent que des ondes propagatives. Ce paragraphe a simplement pour but de rappeler ce constat de manière synthétique en adoptant, par rapport au paragraphe précédent, un point de vue plutôt fréquentiel. Ainsi, la distribution fréquentielle associée à la répartition d’amplitude dans le plan d’abscisse z = 0 est donnée par :  E(ν , 0) = E (r , 0)e −2iπ ν·r d 2 r (10.7) La propagation de chacune des composantes fréquentielles de ce champ le long de l’axe z est décrite, dans la direction des z positifs, par la relation générale :

E(ν , z ) = E(ν , 0)e iα(ν)z (10.8) où E(ν , z ) désigne la distribution fréquentielle du champ enregistrée à l’abscisse z . On rappelle ici que :  k2 − σ 2 pour σ = 2πν  k (10.9) α(ν) =  i σ 2 − k2 pour σ = 2πν > k La dépendance spatiale du champ dans le plan d’abscisse z est alors déterminée en appliquant à ce résultat le théorème de reconstruction, soit :  E (r , z ) = E(ν , z )e 2iπ r ·ν d 2 ν (10.10) ν

Nous allons maintenant, comme annoncé, exprimer le fait que la distance de propagation z est grande devant la longueur d’onde λ, et que seules les composantes propagatives vont donc participer de manière efficace au mécanisme de reconstruction du champ dans le plan d’abscisse z . Dans ce but, nous pouvons reformuler la relation (10.10) de la manière suivante :   E (r , z ) = E(ν , z )e ir ·ν d 2 ν + E(ν , z )e ir ·ν d 2 ν (10.11) |σ |k

|σ |>k

puis remplacer la composante fréquentielle du champ E(ν , z ) par l’expression établie en (10.8), en tenant compte dans chaque intégrale de la valeur particulière du paramètre α, soit :  √ 2 2 E (r , z ) = E(ν , 0)e i k −σ z e ir ·ν d 2 ν |σ |k  √ 2 2 E(ν , 0)e − σ −k z e ir ·ν d 2 ν (10.12) + |σ |>k

192

10. Approximation de Fresnel

ce qui, dans le cas de distances de propagation grandes devant la longueur d’onde, se réduit à :  √ 2 2 E (r , z )  E(ν , 0)e i k −σ z e ir ·ν d 2 ν (10.13) |σ |k

Cette dernière relation peut être mise sous la forme équivalente suivante :  σ √ 2 2 E (r , z ) = E(ν , 0) Circ (10.14) e i k −σ z e ir ·ν d 2 ν k σ où Circ(r ) désigne la fonction Cercle définie par : 1 r 1 Circ(r ) = 0 r>1

(10.15)

En revenant dans l’espace de Fourier associé aux fréquences spatiales, la relation (10.14) est équivalente à : σ √ 2 2 E(ν , z ) = E(ν , 0) Circ (10.16) e i k −σ z k Cette relation montre que le phénomène de propagation en espace libre peut être décrit comme un filtrage fréquentiel, dont la fonction de transfert associe une troncature du spectre de l’objet (par le biais de la fonction cercle ) et un déphasage dispersif des composantes propagatives restantes (par le biais de la fonction exponentielle). Nous allons maintenant voir comment nous pouvons, moyennant certaines approximations, expliciter plus avant cette fonction de transfert (10.16) et la réponse percussionnelle (10.6) qui lui est associée, et que nous avons introduite au paragraphe 10.2.

10.4 Approximation de Fresnel 10.4.1 Définition et domaine de validité L’argument de la fonction exponentielle imaginaire apparaissant dans la relation (10.16) peut être développé en série, soit :  σ2 σ2 σ4 z k 2 − σ 2 = kz 1 − 2 = kz − (10.17) z − 3 z + ... k 2k 8k L’approximation de Fresnel consiste à arrêter ce développement à l’ordre 1 en σ 2 /k 2 , soit :  σ2 z (10.18) k 2 − σ 2 z  kz − 2k

193

De l’Optique électromagnétique à l’Interférométrie

Une condition simple pour que cette approximation soit loisible est que le terme d’ordre immédiatement supérieur soit petit devant la période de la fonction exponentielle imaginaire dans laquelle il intervient, ce qui peut être mis sous la forme : 2π σ4 z< 8k 3 N

(10.19)

où N désigne un entier, dont la valeur pourra être ajustée en fonction de la précision recherchée dans l’usage de cette approximation. Supposons pour fixer les idées que l’on choisisse N = 8. La condition de validité de l’approximation de Fresnel s’écrira alors : 2π 1 σ < √ ⇒ ν< √ (10.20) 4 4 3 zλ z λ3 Pour que l’on puisse avoir recours à l’approximation de Fresnel, il est donc nécessaire que le spectre de Fourier de la répartition spatiale du champ dans le plan origine E0 (νx , νy ) soit inscrit à l’intérieur d’un cercle de rayon √4 1 3 , ce qui signifie que ce zλ

spectre ne doit comprendre en fait que de basses fréquences spatiales. Ceci veut également dire que le paquet d’ondes progressives qui décrit la propagation entre les deux plans situés respectivement aux abscisses 0 et z comprend majoritairement des vecteurs d’onde faiblement inclinés par rapport à l’axe. En effet, pour ces ondes propagatives, nous pouvons écrire : 2π 2π 4 λ σ = ⇒ sin θ  θ < sin θ < √ (10.21) 4 λ z z λ3 Des analyses détaillées du domaine de validité de l’approximation de Fresnel ont été menées par de nombreux auteurs, que ce soit de manière analytique ou en ayant recours à des simulations numériques, et elles ont toutes mis en évidence le fait que ce domaine de validité était notablement plus étendu que celui que la condition (10.19) définit. Cependant, pour des raisons de simplicité, nous continuerons à utiliser ce seul critère, en ayant toutefois conscience du caractère quelque peu précautionneux de notre approche.

10.4.2 Fonction de transfert et propagateur 10.4.2.1 Fonction de transfert Dans le cadre défini par l’approximation de Fresnel, la relation (10.16) entre composantes fréquentielles du champ s’écrit : σ2

E(ν , z ) = E0 (ν , 0)e ikz e −i 2k

194

z

(10.22)

10. Approximation de Fresnel

De manière à simplifier les notations et à adopter désormais celles habituellement utilisées dans la communauté de l’optique ondulatoire (et non plus dans celle de l’optique électromagnétique), nous allons remplacer le vecteur ν par le couple de fréquences spatiales (fx , fy ), utiliser l’écriture E˜ , en lieu et place de E, pour désigner la transformée de Fourier de la répartition spatiale d’amplitude E , et enfin placer en indice l’indication relative à la valeur de l’abscisse le long de la direction de propagation. Dans ces conditions, la relation (10.22) prend la forme équivalente suivante : 2 2 E˜z (fx , fy ) = e ikz e −iπ λz (fx +fy ) E˜0 (fx , fy )

(10.23)

soit encore, de manière plus synthétique : 2 2 E˜z (fx , fy ) = Hz (fx , fy ) E˜0 (fx , fy ) avec Hz (fx , fy ) = e ikz e −iπ λz (fx +fy ) (10.24)

La fonction Hz (fx , fy ) est appelée fonction de transfert au sens de Fresnel associée à la distance z , et traduit, dans le cadre de cette approximation, la forme précise du filtrage fréquentiel réalisé par le mécanisme de propagation.

10.4.2.2 Réponse percussionnelle En utilisant les notations et les approximations introduites au paragraphe 10.4.2.1, l’expression de la réponse percussionnelle définie par la relation (10.6) devient :

 (2πf )2 hz (x, y) = TF e ikz e −i 2k z  2 2 e −iπ λz (fx +fy ) e 2iπ(xfx +yfy ) dfx dfy (10.25) = e ikz fx ,fy

On constate, comme attendu, que cette réponse percussionnelle est égale à la transformée de Fourier inverse de la fonction de transfert au sens de Fresnel, et donc ici, à un coefficient constant près, à la transformée de Fourier inverse d’une fonction gaussienne. Or l’on sait [cf. Annexe A, relation (A.29)] que le calcul de la transformée de Fourier d’une gaussienne est régi par la règle générique suivante : π 2 1 2 TF e −π at −−−→ √ e − a f a

(10.26)

Cette relation peut être aisément transposée au cas 2D inverse et à l’emploi de fréquences spatiales en lieu et place d’une fréquence temporelle, soit : π

e − a (fx

2 +f 2 ) y

TF−1

− −−−→ a e −π a(x

2 +y 2 )

(10.27)

195

De l’Optique électromagnétique à l’Interférométrie

Une simple identification permet de déterminer la valeur particulière prise ici par la quantité a, à savoir : 1 a= (10.28) i λz ce qui donne aussitôt accès à l’expression de la transformée de Fourier inverse recherchée : ikz 2 2 π 2 2 TF−1 e (10.29) e − i λz (x +y ) e ikz e −iπ λz (fx +fy ) −−−−→ i λz En faisant apparaître le vecteur d’onde k dans l’argument de la gaussienne et en faisant remonter le nombre imaginaire i au numérateur de ce même argument, cette réponse percussionnelle peut être mise sous la forme équivalente suivante : hz (x, y) =

e ikz i k (x 2 +y 2 ) e 2z i λz

(10.30)

qui est celle que nous utiliserons désormais. Compte tenu du contexte dans laquelle cette réponse percussionnelle a été définie, on a coutume de la désigner sous l’appellation de propagateur de Fresnel . La relation (10.5) s’écrit donc :

Ez (x, y) = [E0  hz ](x, y)

(10.31)

soit encore : e ikz Ez (x, y) = i λz



k

E0 (x0 , y0 )e i 2z [(x −x0 )

2 +(y−y )2 ] 0

dx0 dy0

(10.32)

x0 ,y0

La répartition transverse du champ dans le plan d’abscisse z est donc donnée par le résultat du produit de convolution entre le propagateur de Fresnel et la répartition transverse du champ dans le plan origine.

10.4.2.3 Conclusion En conclusion, dans le cadre défini par l’approximation de Fresnel, le phénomène de propagation en espace libre d’une onde lumineuse sur une distance z est entièrement décrit par le jeu de relations suivantes :

Ez (x, y) = [E0  hz ](x, y)

avec hz (x, y) =

e ikz i k (x 2 +y 2 ) e 2z i λz

E˜z (fx , fy ) = Hz (fx , fy ) E˜0 (fx , fy ) avec Hz (fx , fy ) = e ikz e −iπ λz (fx

196

2 +f 2 ) y

(10.33)

10. Approximation de Fresnel

10.5 Premiers exemples d’utilisation 10.5.1 Onde plane homogène On considère que la répartition d’amplitude complexe du champ électrique dans le plan origine correspond à une onde plane homogène dont le vecteur d’onde est parallèle à l’axe Oz , de sorte que l’on peut écrire :

E0 (x0 , y0 ) = E0

(10.34)

Pour en déduire la répartition d’amplitude dans le plan d’abscisse z : 1. On commence par vérifier si l’approximation de Fresnel peut effectivement être utilisée, et, pour ce faire, on calcule la transformée de Fourier de la fonction E0 (x0 , y0 ), soit :  ˜ e −2iπ(x0 fx +y0 fy ) dx0 dy0 = E0 δ(fx , fy ) E0 (fx , fy ) = E0 (10.35) Le spectre de Fourier de la répartition spatiale du champ dans le plan origine étant réduit à une impulsion de Dirac centrée sur la fréquence nulle, la condition de validité de l’approximation de Fresnel est toujours vérifiée, quelle que soit la distance z de propagation. 2. On applique alors la fonction de transfert Hz (fx , fy ) au résultat obtenu, soit :

E˜z (fx , fy ) = Hz (fx , fy )E˜0 (fx , fy ) = E0 Hz (fx , fy ) δ(fx , fy )

(10.36)

On utilise ici la méthode de calcul énoncée au paragraphe A.3.2.2 et qui dit que le produit d’une fonction par une impulsion de Dirac est égal à la valeur prise par cette fonction au point défini par l’impulsion de Dirac, multipliée par cette impulsion de Dirac, soit :

E˜z (fx , fy ) = E0 Hz (0, 0) δ(fx , fy ) = E0 e ikz δ(fx , fy )

(10.37)

3. Il ne nous reste plus qu’à revenir dans l’espace (x, y) à l’aide d’une transformée de Fourier inverse, soit : Ez (x, y) = E0 e ikz (10.38)

Ce résultat est évidemment conforme à ce qui était attendu, et aurait pu être obtenu par des voies beaucoup plus directes. En fait, il a surtout ici le mérite d’illustrer de manière extrêmement simple la démarche qui devra être adoptée pour rendre compte de configurations plus complexes.

197

De l’Optique électromagnétique à l’Interférométrie

10.5.2 Point brillant de Poisson Considérons la situation décrite à la figure 10.1, et dans laquelle une onde plane homogène d’amplitude E0 et de vecteur d’onde parallèle à l’axe Oz éclaire un disque opaque de rayon R dont le centre est placé à l’origine des axes.

O

z

M

R

Figure 10.1 Configuration correspondant à la mise en évidence du point brillant de Poisson.

On se propose de déterminer l’amplitude complexe du champ Ez (0, 0) qui est enregistrée derrière le disque, sur son axe et à une distance z de celui-ci. La fonction de transmission du disque opaque est définie par la relation : ⎧  ⎪ ⎨0 si r = x02 + y02  R tdisque (x0 , y0 ) =  ⎪ ⎩1 si r = x02 + y02 > R

(10.39)

Il est possible de considérer cette fonction de transmission comme également définie par :  tdisque (x0 , y0 ) = 1 − ttrou (x0 , y0 ) = 1 − Circ( x02 + y02 /R ) (10.40) où ttrou (x0 , y0 ) désigne la fonction de transmission d’un trou de rayon R percé dans un plan opaque infini et Circ(r ) la fonction Cercle définie par la relation (10.15). Le produit de convolution associé au mécanisme de propagation étant une opération de nature linéaire, nous pouvons décrire la situation correspondant au disque opaque comme résultant de la combinaison algébrique d’une première situation où l’espace est vide et d’une seconde situation dans laquelle on a placé un plan opaque percé d’un trou circulaire à l’abscisse z = 0.

198

10. Approximation de Fresnel

Étudions une à une chacune de ces situations : 1. Le problème de l’espace vide a été traité de manière générale au paragraphe 10.5.1. En conséquence, nous pouvons écrire :

Ez(1) (0, 0) = E0 e ikz

(10.41)

2. Le problème du trou est en fait nouveau, et nous choisirons de le traiter dans l’espace direct, c’est-à-dire en ayant recours au produit de convolution par le propagateur de Fresnel. Mais auparavant, il convient de définir le domaine dans lequel cette approximation de Fresnel peut effectivement être utilisée. Utilisons l’approche associée à l’évaluation de l’angle θ quantifiant l’inclinaison des vecteurs d’onde du paquet d’ondes progressives sur l’axe : pour un point situé sur l’axe du trou et situé à une distance z de celui-ci, cette inclinaison maximale est définie par le rapport R /z , de sorte que la condition (10.21) prend ici la forme particulière suivante :  4 λ R 3 R 4 ⇒ z> (10.42) θmax = < z z λ Nous supposerons désormais cette condition remplie. Nous pouvons alors écrire :

Ez(2) (0, 0) = [E0 ttrou  hz ](0, 0)  hz (x0 , y0 ) dx0 dy0 = E0 = E0

trou e ikz

i λz

 0



 dφ

R

(10.43) k

2

e i 2z r rdr

0

ce qui au final, conduit à :

k 2 Ez(2) (0, 0) = E0 e ikz 1 − e i 2z R

(10.44)

En combinant algébriquement les résultats obtenus aux équations (10.41) et (10.44), nous sommes en mesure de déterminer la valeur du champ sur l’axe, à une distance z en arrière du disque opaque, soit : k

Ez (0, 0) = Ez(1) (0, 0) − Ez(2) (0, 0) = E0 e ikz e i 2z R

2

(10.45)

L’éclairement obtenu étant proportionnel au module au carré du champ électrique, nous constatons que cet éclairement est, en tout point de l’axe de symétrie du disque opaque, identique à celui qui aurait été enregistré en l’absence de celui-ci. |Ez (0, 0)|2 = |E0 |2 = |Ez(1) (0, 0)|2

(10.46)

199

De l’Optique électromagnétique à l’Interférométrie

Figure 10.2 Figure de diffraction enregistrée derrière un disque opaque.

Ce phénomène, à vrai dire contre-intuitif, est habituellement désigné sous l’appellation de point brillant de Poisson, du nom du mathématicien français, qui avait prédit son existence comme conséquence de la théorie ondulatoire de Fresnel, et conclu, à la suite de ce résultat, à la non-consistance de cette théorie, jusqu’à ce que les vérifications expérimentales menées par Arago montrent la réalité de cette prédiction et en assoient définitivement le succès. La figure 10.2 présente l’allure de la tâche de diffraction enregistrée derrière un tel disque opaque et permet de mieux visualiser la présence de ce point brillant au milieu de l’ombre portée du disque.

10.5.3 Effet Talbot On considère maintenant un objet périodique situé dans le plan origine z = 0 et dont la transmission en amplitude t (x, y) est décrite par la relation : t (x, y) =

x 1 1 + cos 2π 2 P

(10.47)

Cet objet est éclairé par une une onde plane monochromatique homogène d’amplitude E0 . Pour déterminer la répartition d’amplitude enregistrée dans un plan situé à une distance z du plan origine, nous choisissons ici de passer dans l’espace des fréquences spatiales, ce qui nous impose de calculer la transformée de Fourier de la répartition d’amplitude enregistrée juste après ce plan origine. Or, cette répartition d’amplitude est donnée par :

E0 (x, y) =

x E0  1 + cos 2π 2 P

de sorte que sa transformée de Fourier a pour expression : 

E0 1 1 1 1 E˜0 (fx , fy ) = δ(fx , fy ) + δ(fx − , fy ) + δ(fx + , fy ) 2 2 P 2 P

200

(10.48)

(10.49)

10. Approximation de Fresnel

L’utilisation de la fonction de transfert au sens de Fresnel permet de calculer la transformée de Fourier de la répartition d’amplitude dans le plan d’abscisse z , soit : E˜z (fx , fy ) = Hz (fx , fy )E˜0 (fx , fy )

 1 1 1 1 −i π λz (fx2 +fy2 ) E0 δ(fx , fy ) + δ(fx − , fy ) + δ(fx + , fy ) = e ikz e 2 2 P 2 P 

π λz 1 −i π λz 1 1 1 E0 ikz −i δ(fx , fy ) + e P 2 δ(fx − , fy ) + e P 2 δ(fx + , fy ) e = 2 2 P 2 P

(10.50)

Il ne nous reste plus qu’à repasser dans l’espace de départ en utilisant une transformée de Fourier inverse, ce qui conduit immédiatement à :

Ez (x, y) =

x E0 ikz  −i πλz e 1 + e P 2 cos 2π 2 P

(10.51)

La répartition d’amplitude enregistrée dans le plan d’abscisse z est donc similaire, à un coefficient multiplicatif de phase près affectant le terme en cosinus, à celle enregistrée dans le plan origine. Elle devient identique à celle-ci lorsque la distance z est telle que : e

−i πλz 2 P

=1



πλzm = 2mπ P2



zm = m

2P 2 = mzT λ

(10.52)

la distance zT = 2P 2 /λ apparaissant dans la dernière égalité étant appelée distance de Talbot. On constate donc que la mire sinusoïdale d’amplitude est spontanément imagée avec un grandissement unité pour des distances de propagation égales à un multiple entier de la distance zT . Ce phénomène d’auto-imagerie constitue l’effet Talbot. Il nous faut cependant déterminer sous quelles conditions le recours à l’approximation de Fresnel est possible. Comme en atteste la relation (10.49), le spectre en fréquences spatiales de l’objet est ici constitué de 3 impulsions de Dirac respectivement centrées en −1/P , 0 et +1/P . La formulation fréquentielle de la condition de validité de l’approximation de Fresnel (10.20) conduit ici à l’inégalité suivante : 1 1 < √ 4 P z λ3



z
λ 2m

(10.54)

201

De l’Optique électromagnétique à l’Interférométrie

Il suffit donc que le pas P de la mire soit supérieur à quelques longueurs d’onde. Nous nous sommes ici intéressés au cas d’une mire sinusoïdale d’amplitude, mais ce phénomène d’auto-imagerie existe également lorsque celle-ci est remplacée par une grille binaire, c’est-à-dire une suite de bandes de largeur P /2 présentant une transmission d’amplitude alternativement égale à 0 et 1. Une telle fonction de transmission est donc périodique et peut être décomposée en série de Fourier, dont l’expression est :   ∞ 4  sin 2π(2n + 1) Px 1 1+ (10.55) t (x, y) = 2 π 2n + 1 n=0

La démarche d’analyse est identique à celle que nous avons adoptée pour la mire sinusoïdale et comprend : • un passage dans l’espace des fréquences spatiales :  E 0 δ(fx , fy ) E˜0 (fx , fy ) = 2

 ∞ 1 1 2  1 + {δ(fx − , fy ) + δ(fx + , fy )} (10.56) iπ 2n + 1 P P n=0

• une multiplication par la fonction de transfert au sens de Fresnel : E0 E˜z (fx , fy ) = Hz (fx , fy ) E˜0 (fx , fy ) = e ikz [δ(fx , fy ) 2 (2n+1)2

∞ −i πλz P2 2 e + iπ 2n + 1

{δ(fx −

n=0

1 1 , fy ) + δ(fx + , fy )}] P P

(10.57)

• et enfin, un retour dans l’espace direct qui conduit à l’expression finale recherchée :   ∞ x 2 sin 2π(2n + 1) 4  −iπ λz (2n+1) E0 P P2 1+ (10.58) Ez (x, y) = e 2 π 2n + 1 n=0

Pour que la répartition d’amplitude enregistrée dans le plan d’abscisse z soit identique à celle enregistrée dans le plan origine, il faut que soit respectée la condition suivante : λzm

(2n + 1)2 = 2mπ, ∀n ∈ N P2



zm = m

zT , ∀n ∈ N (10.59) (2n + 1)2

De manière à évaluer les conséquences pratiques du respect de cette condition, considérons le cas particulier où la distance z est égale à la distance de Talbot zT . Dans ce cas, l’ordre n de la grille respecte la condition d’auto-imagerie, puisque la distance de travail est égale à (2n + 1)2 fois la distance de Talbot associée à cette composante fréquentielle. Mais il faut également s’interroger sur la validité de l’approximation

202

10. Approximation de Fresnel

de Fresnel dans cette nouvelle configuration. Celle-ci impose en effet que l’on ait : 1 (2n + 1) < √ 4 P z λ3



P>

√ 2(2n + 1)2 λ

(10.60)

ce qui montre que le nombre d’ordres auto-imagés est d’autant plus important que le pas de la grille est grand devant la longueur d’onde.

203

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Réponse percussionnelle d’un système optique Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 11.1 11.2 11.3 11.4 11.5 11.6

11.7 11.8

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Source lumineuse ponctuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interprétation physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transmission d’une lentille mince . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Choix du plan d’observation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Réponse percussionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6.1 Instrument stigmatique à pupille carrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6.2 Instrument stigmatique à pupille circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . Volume focal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Filtrage de Fourier, télécentrisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8.1 Filtrage de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8.2 Télécentrisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

206 206 207 208 211 213 213 215 217 219 219 221

205

De l’Optique électromagnétique à l’Interférométrie

11.1 Introduction Au chapitre 10, nous avons montré comment l’approximation de Fresnel permettait d’obtenir une formulation simple des phénomènes qui régissent la propagation d’une onde lumineuse en espace libre. Ces résultats sont évidemment importants, mais ils restent de portée limitée, puisqu’ils n’abordent pas ce qui constitue l’une des questions fondamentales de l’optique, à savoir la formation des images. Dans ce chapitre 11, nous allons donc commencer à nous préoccuper de cet objectif général en introduisant une lentille mince sur le trajet des ondes lumineuses, comme représenté à la figure 11.1.

y0

x0

yl

xl

yi

xi

Figure 11.1 Image d’un point lumineux fourni par un système optique de focale F.

La situation que nous allons étudier comprend donc une source lumineuse ponctuelle située à l’origine des axes et une lentille mince de focale F placée à une distance z = d0 de celle-ci.

11.2 Source lumineuse ponctuelle La répartition spatiale de champ associée à une source lumineuse ponctuelle placée à l’origine des axes est représentée à l’aide d’une impulsion de Dirac centrée en (0, 0), soit : E0 (x0 , y0 ) = S0 δ(x0 , y0 ) (11.1) Comme défini au chapitre 10, il nous faut commencer par calculer la transformée de Fourier de cette répartition spatiale E0 (x0 , y0 ), de manière à identifier sous quelles conditions l’approximation de Fresnel sera utilisable. Il vient :  ˜ δ(x0 , y0 )e −2iπ(x0 fx +y0 fy ) dx0 dy0 = S0 E0 (fx , fy ) = S0 (11.2)

206

11. Réponse percussionnelle d’un système optique

relation qui met en évidence le fait que le support de cette fonction est non borné et qu’elle ne respecte donc pas la condition générale de validité établie au paragraphe 10.4. C’est donc à nous de définir la zone de l’espace dans laquelle l’approximation de Fresnel sera loisible et, pour ce faire, on utilise la formulation qui fait apparaître l’angle θ décrivant l’inclinaison du vecteur d’onde par rapport à l’axe z , soit :  2π 4 λ k sin θ  √ ⇒ θ 4 3 z zλ Comme nous cherchons à exprimer la valeur du champ dans un plan situé à l’abscisse z en fonction des coordonnées transverses (x, y), il est utile de faire apparaître ces mêmes coordonnées dans la formulation de cette condition de validité, ce qui revient à écrire :  √ 4 r = x 2 + y 2 = z tan θ  z θ  z 3 λ (11.3) Lorsque l’on se trouve à une distance z de la source lumineuse, l’approximation de Fresnel n’est donc valide qu’au voisinage de l’axe, à l’intérieur d’un disque de rayon √ 4 3 z λ. Dans notre cas, cela revient tout simplement à dire que la lentille mince utilisée a des dimensions transverses qui vérifient la condition :  4 (11.4) rmax < d03 λ Si cette condition est remplie, nous pouvons alors écrire :  hd0 (xl − x0 , yl − y0 )δ(x0 , y0 ) dx0 dy0 El (xl , yl ) = [E0  hd0 ](xl , yl ) = S0 = S0 hd0 (xl , yl ) = S0

e ikd0 i 2dk (xl2 +yl2 ) e 0 i λd0

(11.5)

où (xl , yl ) constitue le jeu de coordonnées (x, y) associé au plan de front spécifique dans lequel se trouve la lentille.

11.3 Interprétation physique Supposons que la source ponctuelle ait été placée en (xa , ya ) dans le plan de départ (x0 , y0 ) et que l’on désire calculer la répartition spatiale du champ dans un plan de front situé à une distance z de cette source. Les équations utilisées au paragraphe

207

De l’Optique électromagnétique à l’Interférométrie

précédent auraient alors pris la forme légèrement amendée suivante :  hz (x − x0 , y − y0 )δ(x0 − xa , y0 − ya ) dx0 dy0 Ez (x, y) = [E0  hz ](x, y) = S0 = S0 hz (x − xa , y − ya ) = S0

e ikz i k [(x −xa )2 +(y−ya )2 )] e 2z i λz

(11.6)

Or, la relation fondamentale décrivant la propagation d’une onde lumineuse au sens de Fresnel entre 2 plans séparés par une distance z s’écrit : e ikz Ez (x, y) = i λz



k

E0 (x0 , y0 )e i 2z [(x −x0 )

2 +(y−y )2 ] 0

dx0 dy0

(11.7)

x0 ,y0

On constate donc que la relation (11.7) exprime simplement le fait que la distribution de champ Ez (x, y) enregistrée dans le plan d’abscisse z correspond à la sommation des champs élémentaires émis, dans le plan origine, par une infinité de sources ponctuelles dont l’amplitude au point de coordonnées (x0 , y0 ) est égale à E0 (x0 , y0 ). Mais quelle est la nature de l’onde qu’émet une source ponctuelle ? Il s’agit d’une onde sphérique, pour des raisons évidentes de symétrie. Ces réflexions nous conduisent à deux constats importants : 1. Le propagateur hz (x, y) que nous avons introduit au paragraphe 10.4.2 correspond, dans l’approximation de Fresnel, à la représentation d’une onde sphérique centrée sur l’origine des coordonnées. 2. La répartition spatiale du champ enregistré dans le plan d’abscisse z correspond à la sommation d’une pluralité d’ondes sphériques dont les amplitudes complexes élémentaires sont proportionnelles à la valeur locale de ce champ dans le plan d’abscisse 0. Cette formulation correspond à ce que l’on désigne habituellement sous l’appellation de principe d’Huyghens-Fresnel, et qui passe ici du statut de principe fondateur à celui de simple conséquence des équations de Maxwell.

11.4 Transmission d’une lentille mince La description de la situation schématisée à la figure 11.1 nous conduit maintenant à prendre en compte la présence d’une lentille mince de focale F et dont le centre optique L est situé sur l’axe z , à une distance d0 de la source. Par ailleurs, pour que l’approximation de Fresnel soit utilisable, il faut que la condition (11.4) soit remplie. Ceci suppose que la lentille utilisée soit de dimensions transverses finies, ce que l’on représente en introduisant une fonction Pupille P (xl , yl ) définie

208

11. Réponse percussionnelle d’un système optique

par :

 P (xl , yl ) =

si M (xl , yl ) ∈ Lentille partout ailleurs

1 0

(11.8)

et en indiquant que : max

   xl2 + yl2 P (xl , yl ) < 4 d03 λ

(11.9)

Il nous reste à décrire l’effet de la lentille sur la distribution du champ se propageant à l’intérieur de sa pupille. Pour ce faire, nous allons tout d’abord scinder par la pensée le plan correspondant à cette lentille mince en 2 plans distincts parallèles, situés de part et d’autre de celle-ci. Le premier plan sera défini comme étant le plan situé juste avant la lentille, tandis que le second sera désigné par le qualificatif juste après. La distribution de champ enregistrée dans le plan situé juste avant la lentille est celui donné par la relation (11.5). Nous allons donc étudier maintenant ce qui se passe entre ce plan et celui situé juste après la lentille, puis nous ferons tendre la distance qui sépare ces 2 plans vers zéro pour nous ramener au cas de la lentille mince. De manière générale, une lentille mince est constituée par une lame de verre d’indice de réfraction n, dont les surfaces avant et arrière sont des portions de sphère, tel que représenté de manière schématique à la figure 11.2. Nous avons choisi de représenter sur cette figure une lentille de type biconvexe, mais, de manière à ce que les résultats que nous allons établir aient une portée générique, nous prendrons la précaution de considérer les rayons de courbure des dioptres

H I

J

K

R2

R1

S1

S2

Figure 11.2 Représentation schématique d’une lentille mince.

209

De l’Optique électromagnétique à l’Interférométrie

sphériques comme des quantités algébriques, comptés positivement dans le sens de propagation des ondes lumineuses. Dans le cas de cette lentille biconvexe, le rayon de courbure du premier dioptre sera donc positif (R1 = S1 C1 > 0), tandis que le second sera négatif (R2 = S2 C2 < 0). L’épaisseur au centre de la lentille, soit S1 S2 , sera notée e (e > 0). On supposera ici, dans le cadre de l’optique scalaire et en négligeant les pertes à la réflexion, que la transmission de la lentille, en un point de la pupille de coordonnées (xl , yl ), est, de manière générale, décrite par la relation : t (xl , yl ) = lim e ik[HK] e →0

(11.10)

où [HK] désigne le chemin optique entre les points H et K, tous deux de coordonnées (xl , yl ) et appartenant respectivement au plan situé juste avant et juste après la lentille. On désignera par I le point d’intersection entre le segment HK et le premier dioptre, et par J celui entre ce même segment et le second dioptre. En tenant compte de la nature des milieux traversés, on peut exprimer le chemin optique [HK] sous la forme suivante : (11.11) [HK] = HI + n IJ + JK Par ailleurs, on peut faire apparaître H et K à l’intérieur de la quantité algébrique IJ en utilisant une simple relation de Chasles, soit : IJ = IH + HK + KJ = IH + e + KJ

(11.12)

En combinant les relations (11.11) et (11.12), il vient : [HK] = ne − (n − 1)HI − (n − 1)JK

(11.13)

Il ne nous reste plus qu’à exprimer les quantités HI et JK en fonction de xl , yl , R1 et R2 . Pour ce faire, on commence par écrire l’équation d’une sphère de rayon R (R > 0), dont le sommet S est situé à l’origine des axes et le centre C sur l’axe z , soit :  x2 + y2 2 2 2 2 x + y + (z − R ) = R ⇒ z± = R ± R 1 − (11.14) R2 la racine z− étant la seule qui nous intéresse ici. La condition de validité de l’approximation de Fresnel nous impose de rester au voisinage de l’axe, ce qui va nous permettre de remplacer la racine carrée par son développement limité à l’ordre 1 en x 2 +y 2 (approximation parabolique de l’équation de la sphère), soit : x2 + y2 z−  (11.15) 2R

210

11. Réponse percussionnelle d’un système optique

En conséquence, en tenant compte des signes particuliers des rayons de courbure des deux dioptres, ceci nous permet d’écrire : HI =

x2 + y2 2R1

JK = −

et

x2 + y2 2R2

(11.16)

Il ne nous reste plus qu’à faire tendre la quantité e vers zéro et à combiner les relations (11.13) et (11.16) pour obtenir l’expression recherchée pour le chemin optique [HK] :  2  x + y2 x2 + y2 [HK] = −(n − 1) − (11.17) 2R1 2R2 expression qui peut également être mise sous le forme suivante :  1 1 1 x2 + y2 − avec = (n − 1) [HK] = − 2F F R1 R2

(11.18)

où F désigne la focale de la lentille mince telle que la définit l’optique géométrique paraxiale. De manière à éviter toute ambiguïté, on préfèrera désormais parler de lentille parfaite de focale F plutôt que de lentille mince de focale F , car l’approche que nous développons ici ne tient absolument pas compte des aberrations géométriques qu’introduit la plupart du temps l’utilisation d’une lentille mince. Ce point sera abordé plus en détail au chapitre 13. En conclusion, la transmission d’une lentille parfaite de focale F , prenant en compte les aspects troncature et déphasage, est définie par : ik 2 (xl + yl2 ) tl (xl , yl ) = P (xl , yl ) e 2F −

(11.19)

tandis que la répartition spatiale du champ dans le plan situé juste après la lentille est donnée par :

El (xl , yl ) = tl (xl , yl )El (xl , yl ) = S0

k e ikd0 i 2dk (xl2 +yl2 ) 2 2 e 0 P (xl , yl ) e −i 2F (xl +yl ) i λd0

(11.20)

11.5 Choix du plan d’observation Considérons maintenant un plan de front situé à une distance di de celui de la lentille L. Entre les deux plans, les ondes lumineuses se propagent en espace libre et

211

De l’Optique électromagnétique à l’Interférométrie

ce phénomène peut donc être décrit à l’aide du propagateur de Fresnel associé à cette distance di , soit :  Ei (xi , yi ) = [El  hdi ](xi , yi ) = hdi (xi − xl , yi − yl )El (xl , yl ) dxl dyl (11.21) où (xi , yi ) constitue le jeu de coordonnées (x, y) associé à ce plan d’observation. En combinant les relations (11.20) et (11.21), et en utilisant l’expression du propagateur de Fresnel correspondant à la distance de propagation di , il vient :

Ei (xi , yi ) = −S0

e ikd0 e ikdi λ2 d0 di

 e

i 2dk (xl2 +yl2 ) 0

×e

k

P (xl , yl ) e −i 2F (xl +yl ) 2

i 2dk [(xi −xl )2 +(yi −yl )2 ] i

2

dxl dyl

(11.22)

En faisant sortir de l’intégrale les quantités qui ne dépendent pas des variables d’intégration xl et yl , et en regroupant les termes de même nature, la relation précédente peut être mise sous la forme équivalente suivante : e ikd0 e ikdi i 2dk (xi2 +yi2 ) Ei (xi , yi ) = −S0 2 e i λ d0 di

 e

i k2 (xl2 +yl2 )

×e



1 1 d0 + di

− F1

−i dk (xi xl +yi yl ) i



P (xl , yl ) dxl dyl

(11.23)

Cette expression n’est évidemment valide que si les conditions permettant d’utiliser l’approximation de Fresnel sont toutes satisfaites. Celle relative à la propagation en espace libre entre la lentille et le plan d’observation s’écrit :   ∀(xl , yl ) , ∀(xl , yl ) , (xi − xl )2 + (yi − yl )2 P (xl , yl ) < 4 di3 λ (11.24) Supposons maintenant que nous choisissions ce plan d’observation de manière à ce que la quantité : 1 1 1 + − d0 di F soit égale à zéro. Cela signifie que la relation entre di et d0 est définie par : 1 1 1 =− + di d0 F

(11.25)

ce qui n’est rien d’autre que la relation de conjugaison au sens de l’optique géométrique paraxiale. Si cette condition est satisfaite, la relation (11.23) prend alors la

212

11. Réponse percussionnelle d’un système optique

forme simplifiée suivante : e ikd0 e ikdi i 2dk (xi2 +yi2 ) Ei (xi , yi ) = −S0 2 e i λ d0 di  − 2i π (x x +y y ) × P (xl , yl ) e λdi i l i l dxl dyl

(11.26)

où k a été remplacé par 2π/λ dans l’exponentielle imaginaire figurant sous l’intégrale. Cette dernière expression est équivalente à :  e ikd0 e ikdi i 2dk (xi2 +yi2 ) xi yi i Ei (xi , yi ) = −S0 2 e , P λ d0 di λdi λdi

(11.27)

où P désigne la transformée de Fourier de la fonction Pupille P .

11.6 Réponse percussionnelle Nous pouvons donc synthétiser les résultats obtenus aux paragraphes précédents de la manière suivante : lorsque l’on place un point lumineux sur l’axe optique d’une lentille parfaite L et à une distance d0 de celle-ci, alors la répartition spatiale du champ Ei (xi , yi ) enregistrée dans un plan d’observation, dont la distance di à la lentille est définie en accord avec la relation de conjugaison de l’optique géométrique, est égale, à un coefficient multiplicatif près, à la transformée de Fourier de la fonction Pupille associée à cette lentille, prise au point de coordonnées (xi /λdi , yi /λdi ). Cette réponse particulière du système optique, correspondant à l’image d’un point lumineux situé sur son axe, est désignée sous l’appellation de réponse percussionnelle. L’éclairement1 correspondant à cette réponse percussionnelle est proportionnel au module au carré de l’expression (11.27), soit :    |S0 | 2

xi yi

2 2 (11.28) Ei (xi , yi ) ∝ |Ei (xi , yi )| = 2

P λd , λd λ d0 di i i et porte le nom de Point Spread Function ou PSF , terme anglais que l’on peut traduire par fonction d’étalement de point.

11.6.1 Instrument stigmatique à pupille carrée Un système optique sera dit stigmatique si, d’une part, il ne présente aucune aberration et si, d’autre part, il est utilisé dans un plan d’observation confondu avec le plan image défini par l’optique géométrique. Attention à ne pas confondre la lettre E utilisée pour désigner un éclairement avec le vecteur E

utilisé pour désigner la dépendance spatio-temporelle du champ électrique. 1

213

De l’Optique électromagnétique à l’Interférométrie

Supposons que la pupille de cet instrument stigmatique soit de forme carrée, c’est-àdire que l’on puisse exprimer la fonction P (xl , yl ) comme le produit de 2 fonctions Porte de largeur 2a, soit : x  y  l l Rect (11.29) P (xl , yl ) = Rect 2a 2a alors la transformée de Fourier de cette fonction Pupille a pour expression :  P (xl , yl )e −2iπ(xfx +yfy ) dx dy P (fx , fy ) =  a  a (11.30) −2iπ xfx e dx e −2iπ yfy dy = −a 2

−a

= 4a Sinc(2πafx ) Sinc(2πafy ) ce qui permet d’exprimer la réponse percussionnelle de cet instrument stigmatique à pupille carrée sous la forme : e ikd0 e ikdi i 2dk (xi2 +yi2 ) e i λ2 d0 di   2πayi 2πaxi Sinc × 4a 2 Sinc λdi λdi

Ei (xi , yi ) = −S0

(11.31)

et d’avoir enfin accès à sa PSF :  2   4a 2 2 2 2πaxi 2 2πayi Sinc Sinc Ei (xi , yi ) = |S0 | λ2 d0 di λdi λdi

(11.32)

La figure 11.3 donne une représentation en niveaux de gris de la distribution d’éclairement associée à cette PSF, ainsi qu’une coupe de cette distribution le long de l’un des axes. La largeur à mi-hauteur de la tâche de diffraction est de l’ordre de λdi /2a. 1,0 0,9 Sinc²(Z)

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 2,5

2

1,5

1

-1,5

0

0,5

1

1,5 Z/π

2

2.5

Figure 11.3 PSF d’un instrument stigmatique à pupille carrée. Représentation en niveaux de gris et coupe le long d’un axe.

214

11. Réponse percussionnelle d’un système optique

11.6.2 Instrument stigmatique à pupille circulaire La situation est similaire à celle étudiée au paragraphe 11.6.1, à ceci près que la fonction Pupille est maintenant de forme circulaire, de diamètre 2a et définie par : ⎞ ⎛ xl2 + yl2 ⎠ (11.33) P (xl , yl ) = Circ ⎝ a Le calcul de la transformée de Fourier de la fonction Pupille est ici plus compliqué, car les intégrales en xl et yl ne sont plus séparables. Cette transformée de Fourier s’écrit en toute généralité :  P (x, y)e −2iπ(xfx +yfy ) dx dy (11.34) P (fx , fy ) = Pour tenir compte de la symétrie de révolution du problème autour de l’axe optique z , on passe en polaire aussi bien dans l’espace de départ que dans celui de Fourier, ce qui revient à introduire les changements de variables suivants : (x, y) −→ (r, θ)

et

(fx , fy ) −→ (f, ψ)

La relation (11.34) prend alors la forme équivalente suivante :  a  2π e −2iπ rf [cos θ cos ψ+sin θ sin ψ] r dr d θ P (f, ψ) = 0 0  a  2π = e −2iπ rf cos (θ −ψ) r dr d θ 0

(11.35)

(11.36)

0

Comme précédemment indiqué, le problème présente une symétrie de révolution autour de l’axe z , de sorte que la valeur de l’angle ψ est indifférente. En conséquence, le résultat que nous recherchons est de la forme : P (f ) =

 0

a





e −2iπ rf

0

cos θ

r dr d θ

(11.37)

Pour calculer cette expression, on utilise tout d’abord une définition intégrale de la fonction de Bessel d’ordre zéro, à savoir :  2π 1 e −ix cos α d α (11.38) J0 (x ) = 2π 0 pour calculer l’intégrale en θ : P (f ) = 2π

 0

a

J0 (2πrf ) r dr

(11.39)

215

De l’Optique électromagnétique à l’Interférométrie

On utilise ensuite une propriété générale des fonctions de Bessel, à savoir : d n+1 Jn+1 (x )] = x n+1 Jn (x ) [x dx

(11.40)

pour calculer l’intégrale en r , en réalisant le changement de variable x = 2πrf : 2J1 (2πaf ) P (f ) = πa 2 2πaf

(11.41)

La réponse percussionnelle d’un instrument stigmatique à pupille circulaire a donc pour expression :   2π ari  ikd ikd 2J e 0 e i i 2dk ri2 2 1 λdi  Ei (ri ) = −S0 2 e i πa  avec ri = xi2 + yi2 (11.42) 2π ari λ d0 di λdi

tandis que celle de sa PSF est donnée par :  Ei (ri ) = |S0 |2

πa 2

2

λ2 d0 di



2J1 ⎣ 



2π ari λdi

2π ari λdi

 ⎤2

 ⎦

(11.43)

On constate que les deux expressions (11.32) et (11.43) sont très similaires, la fonction Sinc(x ) Sinc(y) de la première étant remplacée par 2J1 (r )/r dans la seconde. En r = 0, cette dernière quantité est d’ailleurs égale à 1 (comme c’est le cas pour un sinus cardinal en x = 0 ou y = 0). La figure 11.4 donne une représentation en niveaux de gris de de la distribution d’éclairement associée à cette PSF, ainsi qu’une coupe de cette distribution le long d’un diamètre. La position du premier zéro de la fonction J1 (x ) est définie par 1,0

[2J1(Z)/Z]²

0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0

2,5

2

1,5

1

-1,5

0

0,5

1

1,5 Z/π

2

2.5

Figure 11.4 PSF d’un instrument stigmatique à pupille circulaire - Représentation en niveaux de gris et coupe le long d’un diamètre.

216

11. Réponse percussionnelle d’un système optique

x1 = 1,220 π, tandis que celle de son second zéro correspond à x2 = 2,233 π, ce qui est proche de 2x1 . Le rayon du premier anneau noir de la tâche de diffraction a i donc pour expression : r1 = 1,22 λd 2a , ce qui est tout à fait similaire à l’expression obtenue dans le cas de la pupille carrée, à ceci près qu’apparaît maintenant le facteur multiplicatif 1,22.

11.7 Volume focal On désignera désormais par di,0 la distance di qui vérifie la relation de conjugaison de l’optique géométrique paraxiale, soit : 1 1 1 =− + di,0 d0 F

(11.44)

Si nous nous écartons légèrement de cette position particulière le long de l’axe optique z , nous pouvons écrire : 1 1 1 di,0 − di δ 1 1 + − = = − = − 2 di d0 F di di,0 di di,0 di

(11.45)

où désigne une quantité petite devant 1 et δ l’amplitude de la défocalisation appliquée au plan d’observation. Dans ces conditions, l’expression générale (11.23) peut être mise sous la forme légèrement modifiée suivante : e ikd0 e ikdi i 2dk (xi2 +yi2 ) Ei (xi , yi ) = −S0 2 e i λ d d  0 i k 2 2 − 2i π (x x +y y ) × e i 2 (xl +yl ) P (xl , yl ) e λdi i l i l dxl dyl

(11.46)

qui montre que la situation est globalement identique à celle que nous avons traitée en détail aux paragraphes 11.5 et 11.6, à ceci près que la fonction Pupille P est maintenant remplacée par la fonction Pupille généralisée  P définie par :  P (xl , yl ) = P (xl , yl ) e i

k 2 2 2 (xl +yl )

(11.47)

Nous serons conduits à revenir plus en détail sur cette notion de pupille généralisée au chapitre 13. Nous allons ici l’utiliser pour calculer la variation de l’éclairement enregistré le long de l’axe z , au voisinage du plan image. Pour le point de coordonnées particulières xi = 0, yi = 0, nous pouvons en effet écrire, dans le cas d’un instrument

217

De l’Optique électromagnétique à l’Interférométrie

à pupille circulaire :

Ei (0, 0; δ) = −S0

e ikd0 e ikdi λ2 d0 di

e ikd0 e ikdi = −S0 2 λ d0 di = −S0

e ikd0 e ikdi λ2 d0 di



 P (xl , yl ) dxl dyl



k 2 2 2 (xl +yl )

ei 





0

0

a

ei

k r 2 2 l

P (xl , yl ) dxl dyl

rl drl d θ

= −S0

e ikd0 e ikdi 2π i k a 2 2 − 1 e λ2 d0 di ik

= −S0

 e ikd0 e ikdi π a 2 2 i k4 a 2 πa e Sinc λ2 d0 di 2λ

(11.48)

La variation de l’éclairement sur l’axe en fonction de l’amplitude de la défocalisation δ est donc donnée par :    2 2 πa 2 2 2 πa δ (11.49) Sinc Ei (0, 0; δ) = |S0 | λ2 d0 di 2λdi2 ce qui montre que, le long de l’axe optique, la largeur à mi-hauteur de la tâche focale est de l’ordre de 2λdi2 /a 2 . On a coutume d’introduire ici le nombre d’ouverture N du système optique considéré, défini par : di N = (11.50) 2a et qui permet de donner une nouvelle forme aux largeurs à mi-hauteur de la tâche focale d’un instrument stigmatique à pupille circulaire, soit :

x = y = 1,22λN

z = 8λN 2

(11.51)

Le volume focal a donc la forme d’un ellipsoïde de révolution, allongé dans la direction de l’axe optique, et dont la forme rappelle celle d’un grain de riz.

218

11. Réponse percussionnelle d’un système optique

11.8 Filtrage de Fourier, télécentrisme 11.8.1 Filtrage de Fourier On considère dans un premier temps la configuration représentée à la figure 11.5, dans laquelle la lentille L, de focale F , est supposée parfaite et de dimensions transverses suffisamment importantes pour ne pas introduire de diaphragmation dans la propagation des ondes lumineuses. Le plan objet O est situé à une distance d de cette lentille, tandis que le plan d’observation I est confondu avec son foyer image F .

O

L

F’

F

d

x0 , y 0

xl , y l

xf ,yf

Figure 11.5 Montage dF.

La répartition transverse d’amplitude Ef (xf , yf ) enregistrée dans le plan d’observation a pour expression : e ikF Ef (xf , yf ) = i λF



k

El (xl , yl )e i 2z [(xf −xl )

2 +(y f

−yl )2 ]

dxl dyl

(11.52)

xl ,yl

où El (xl , yl ) désigne la répartition d’amplitude correspondant au plan de front situé immédiatement après la lentille. En développant l’argument de l’exponentielle, en utilisant l’expression (11.19) décrivant la traversée de la lentille, en tenant compte du caractère non diaphragmant de celle-ci (P (xl , yl ) = 1, ∀ xl , yl ) et en faisant sortir de l’intégrale les termes ne dépendant pas de la variable d’intégration, la relation (11.52) peut être mise sous la forme équivalente suivante :

Ef (xf , yf ) = =

e ikF i 2Fk (xf2 +yf2 ) e i λF e ikF i λF

e

k i 2F (xf2 +yf2 )

 xl ,yl

E l

2i π

El (xl , yl )e − λF yf  λF λF

 xf

,

(xf xl +yf yl )

dxl dyl

(11.53)

219

De l’Optique électromagnétique à l’Interférométrie

Pour décrire la propagation entre le plan objet et la lentille, on va utiliser ici le formalisme de la fonction de transfert au sens de Fresnel, qui nous permet d’écrire :  x f yf   x f yf   x f yf  E l E o , = Hd , , (11.54) λF λF λF λF λF λF soit encore :

E l

 xf

,

yf 

λF λF

=e =e

 x f yf  E o , λF λF  x f yf  d 2 2 F (xf +yf ) E o , λF λF x2 f

y2 f

ikd −iπ λd [ λ2 F 2 + λ2 F 2 ]

e

k ikd −i 2F

e

(11.55)

Il ne nous reste plus qu’à reporter cette dernière expression dans la relation (11.53) pour obtenir le résultat recherché, à savoir : e ikF ikd i 2Fk Ef (xf , yf ) = e e i λF

  1− Fd (xf2 +yf2 )

E o

 xf

,

yf 

(11.56)

λF λF

Cette expression montre que, dans le cas où l’objet est situé dans le plan focal objet de la lentille L (d = F ), la répartition transverse d’amplitude enregistrée dans son plan image est égale, à un coefficient multiplicatif et à une homothétie près, à la transformée de Fourier de celle présente dans le plan objet. Supposons maintenant que nous placions en série deux lentilles L1 et L2 , de focales respectivement égales à F1 et F2 , et de manière à ce que le plan focal image de la première coïncide avec le plan focal objet de la seconde, comme représenté à la figure 11.6. Dans le plan focal F, nous avons donc, à une homothétie près, une répartition d’amplitude proportionnelle à la transformée de Fourier de celle présente dans le plan objet O, et dans le plan image I, une répartition d’amplitude proportionnelle à la transformée de Fourier de celle présente dans ce plan focal F, toujours à une homothétie près.

O

L1 F1

Figure 11.6 Montage 4F.

220

F F1

L2 F2

I F2

11. Réponse percussionnelle d’un système optique

Or, la transformée de Fourier de la transformée de Fourier d’une fonction est identique à cette fonction, à un changement de signe de la variable près. Ceci signifie donc que la répartition d’amplitude présente dans ce plan image I est égale, à un facteur de grandissement près, à celle présente dans le plan objet O. Un calcul complet permet d’établir que la relation entre ces deux répartitions d’amplitude est de la forme :  F1 2ikF1 2ikF2 F1 F1 Ei (xi , yi ) = − e e Eo − xi , − yi (11.57) F2 F2 F2 et que le grandissement transverse M est donc égal à −F2 /F1 . Ce montage est dit 4F parce qu’il conduit, dans le cas où les deux lentilles utilisées sont identiques, à utiliser 4 distances de fonctionnement égales à F . Ce montage permet en outre d’avoir accès, dans le plan focal intermédiaire, au spectre de Fourier de la répartition d’amplitude présente dans l’objet et de lui appliquer éventuellement un filtrage des fréquences spatiales, par exemple de type passe-bas, en disposant dans ce plan un diaphragme de diamètre ajustable.

11.8.2 Télécentrisme Le montage ainsi complété est représenté à la figure 11.7 et il est possible de faire une analyse de son fonctionnement au sens de l’optique géométrique.

A

D

O

F2

L2

F2 I

F1

L1

F1 A

Figure 11.7 Montage doublement télécentrique.

On supposera que le diamètre du diaphragme D est suffisamment petit devant les dimensions transverses des deux lentilles L1 et L2 pour qu’il joue ici le rôle de diaphragme d’ouverture. Comme ce diaphragme est situé à la fois dans le plan focal image de L1 et dans le plan focal objet de L2 , la pupille d’entrée et la pupille de sortie sont rejetées à l’infini. Ceci explique pourquoi le rayon principal associé à tout point objet (c’est-à-dire celui qui passe par le centre de la pupille d’entrée) est perpendiculaire au plan objet et qu’il en est de même dans l’espace image. Un tel système optique est dit doublement télécentrique et est d’un usage particulièrement important dès que l’on souhaite disposer de propriétés photométriques homogènes dans le champ d’un instrument.

221

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Formation des images Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 12.1 12.2

12.3 12.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fonction de transfert d’un système optique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.1 Mise en équation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.2 Instrument stigmatique à pupille carrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.3 Instrument stigmatique à pupille circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.2.4 Exemple d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Éclairage cohérent, éclairage incohérent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fonction de transfert en éclairage incohérent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.2 Instrument stigmatique à pupille carrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.3 Instrument stigmatique à pupille circulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4.4 Exemple d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

224 224 224 229 230 230 232 234 234 236 237 239

223

De l’Optique électromagnétique à l’Interférométrie

12.1 Introduction La situation que nous allons étudier dans ce chapitre est similaire à celle analysée au chapitre 11. La seule différence concerne la nature de la distribution spatiale d’amplitude présente dans le plan objet (x0 , y0 ) : le point lumineux unique localisé sur l’axe optique du système est maintenant remplacé par un objet complexe décrit par une fonction E0 (x0 , y0 ), comme représenté à la figure 12.1. y0

x0

yl

xl

yi

xi

Figure 12.1 Formation d’une image.

Comme précédemment, cet objet est placé à une distance d0 de la lentille parfaite de focale F et de fonction Pupille P (xl , yl ), tandis que le plan d’observation se trouve à une distance di en arrière de cette lentille. On supposera dans tout ce chapitre que cette distance di vérifie la relation de conjugaison au sens de l’optique géométrique, c’est-à-dire que l’on peut écrire : 1 1 1 =− + di d0 F

(12.1)

12.2 Fonction de transfert d’un système optique 12.2.1 Mise en équation du problème Nous avons en fait à prendre en compte 3 phénomènes : – la propagation en espace libre entre l’objet et la lentille ; celle-ci est décrite par une convolution entre la répartition d’amplitude décrivant l’objet et le propagateur de Fresnel associé à la distance d0 , soit :

El (xl , yl ) = [E0  hd0 ](xl , yl )  e ikd0 i k [(x −x )2 +(yl −y0 )2 ] = E0 (x0 , y0 ) e 2d0 l 0 dx0 dy0 (12.2) i λd0

224

12. Formation des images

– la traversée de la lentille parfaite de focale F et de fonction Pupille P (xl , yl ), soit :

El (xl , yl ) = P (xl , yl )tl (xl , yl )El (xl , yl ) k

(12.3)

= P (xl , yl )e −i 2F (xl +yl ) El (xl , yl ) 2

2

– et enfin, la propagation en espace libre jusqu’au plan d’observation, décrite à nouveau par une convolution entre la répartition d’amplitude enregistrée juste après la lentille et le propagateur de Fresnel associé à la distance di , soit :

Ei (xi , yi ) = [El  hdi ](xi , yi )  e ikdi i k [(x −x )2 +(yi −yl )2 ] El (xl , yl ) e 2di i l dxl dyl = i λdi

(12.4)

En combinant les relations (12.2.1), (12.3) et (12.4), on obtient l’expression générale suivante :     e ikd0 e ikdi i 2dk (xi2 +yi2 ) i k2 d1 + d1 − F1 (xl2 +yl2 ) 0 i i P (xl , yl ) e Ei (xi , yi ) = − 2 e λ d0 di × E0 (x0 , y0 ) e

π 2i π i 2dk (x02 +y02 ) − λd (xl x0 +yl y0 ) − 2i λd (xl xi +yl yi )

e

0

0

e

i

dxl dyl dx0 dy0 (12.5)

L’exponentielle présentant un terme de phase quadratique en (xl2 + yl2 ) disparaît du fait du choix particulier de plan d’observation. En effet, nous avons, en accord avec la relation (12.1), l’égalité suivante : 1 1 1 + − =0 di d0 F Pour transformer l’expression (12.5) en une relation plus simple d’emploi, nous allons maintenant effectuer deux changements de variable : – le premier consiste à introduire les quantités x0 et y0 , définies par : x0 = Mx0

et y0 = My0

M =−

avec

di d0

(12.6)

où M n’est rien d’autre que le grandissement transverse entre le plan objet et le plan image, tel que défini à nouveau par l’optique géométrique paraxiale. Ce changement de variable permet de transformer les deux dernières exponentielles imaginaires en une expression unique, à savoir : e

π 2i π − λd (xl x0 +yl y0 ) − 2i λd (xl xi +yl yi ) 0

e

i

−→

e

π   − 2i λd [(xl (xi −x0 )+yl (yi −y0 )] i

225

De l’Optique électromagnétique à l’Interférométrie

Cette modification doit naturellement être prise en compte dans l’expression de la répartition d’amplitude dans l’objet :    x y E0 (x0 , y0 ) −→ E0 0 , 0 M M dans celle de la dépendance quadratique de phase associée : e

i 2dk (x02 +y02 )

−→

0

e

i 2dk

0

x02 +y02 M2

ainsi que dans le produit des deux variables d’intégration correspondantes : dx0 dy0

1 dx  dy  M2 0 0

−→

– le deuxième changement de variable consiste à poser : xl = λdi u

et yl = λdi v

(12.7)

Cette modification doit être prise en compte dans l’expression de l’exponentielle imaginaire précédente : e

π   − 2i λd [(xl (xi −x0 )+yl (yi −y0 )] i

−→





e −2iπ [(u(xi −x0 )+v(yi −y0 )]

dans l’expression de la fonction Pupille P (xl , yl )

−→

P (λdi u, λdi v)

ainsi que dans le produit des deux variables d’intégration correspondantes : dxl dyl

−→

λ2 di2 du dv

Sous réserve d’utiliser les changements de variable que nous venons de définir, la relation (12.5) peut alors être mise sous la forme équivalente suivante : e ikd0 e ikdi λ2 di2 i 2dk (xi2 +yi2 ) Ei (xi , yi ) = − 2 e i λ d0 di M 2 ×e

2 2 ik x0 +y0 2d0 M 2





  P (λdi u, λdi v) E0 

e −2iπ [(u(xi −x0 )+v(yi −y0 )] du dv dx0 dy0

x0 x0 , M M



(12.8)

On introduit à ce niveau du calcul deux fonctions annexes, à savoir : – la répartition d’amplitude dans l’image géométrique de l’objet, notée Eg (x0 , y0 ) et définie par :    x y 1   Eg (x0 , y0 ) = E0 0 , 0 (12.9) M M M

226

12. Formation des images

– et la fonction S (x, y) qui est directement reliée à la transformée de Fourier de la fonction Pupille P et que l’on définit par la relation :  (12.10) S (x, y) = P (λdi u, λdi v) e −2iπ(ux +vy) du dv Si l’on revient temporairement au jeu de variables (xl , yl ), en lieu et place de celui (u, v) par lequel il avait été remplacé en (12.7), la relation (12.10) s’écrit :  1 − 2i π (xx +vy ) P (xl , yl ) e λdi l l dxl dyl (12.11) S (x, y) = 2 2 λ di ce qui, à un facteur multiplicatif près, n’est rien d’autre que la réponse percussionnelle du système optique considéré. En introduisant les deux fonctions annexes que nous venons de définir dans la relation initiale (12.8), nous pouvons écrire :

Ei (xi , yi ) = e

ikd0 ikdi

e

e

i 2dk (xi2 +yi2 )



i

S (xi − x0 , yi − y0 ) Eg (x0 , y0 ) 2 2 ik x0 +y0 M2

× e 2d0

dx0 dy0 (12.12)

Le terme de phase quadratique qui apparaît dans l’intégrale précédente rend la signification du résultat obtenu plus complexe à appréhender, mais on peut rendre les choses beaucoup plus claires en utilisant pour le calcul de cette intégrale la méthode de la phase stationnaire. Une façon simple de justifier le résultat auquel on peut parvenir avec cette méthode est de faire tendre, par la pensée, le support de la fonction Pupille vers l’infini (cela ne veut pas dire que notre problème physique le permet, il s’agit juste ici d’un artifice mathématique). Dans ce cas, la fonction S (x, y) définie par la relation (12.10) tend vers l’impulsion de Dirac, ce qui conduirait aux relations : S (xi − x0 , yi

2 2 ik x0 +y0 M2

− y0 ) e 2d0

2 2 ik x0 +y0 M2

−→

δ(xi − x0 , yi

− y0 ) e 2d0

−→

δ(xi − x0 , yi

− y0 ) e 2d0

2 2 ik xi +yi M2

(12.13)

et permettrait de faire sortir le terme de phase quadratique de l’intégrale. Lorsque la fonction Pupille est de support plus restreint, l’impulsion de Dirac est tout simplement remplacée par la réponse percussionnelle de l’instrument, dont le support est de l’ordre de grandeur de λdi /2a. Par conséquent, sur ce support, la variation maximale de la phase quadratique apparaissant dans cette intégrale peut être évaluée en utilisant un développement limité à l’ordre 1 de cette réponse percussionnelle,

227

De l’Optique électromagnétique à l’Interférométrie

soit, en se limitant dans un premier temps à une approche 1D :        k x 2 + y 2 k |x0 | λdi k x02 + y02   k x0 (xi − x0 )   0 i   −    d M 2 2a  2d0 M 2 2d0 M 2   d0 M2 0

(12.14)

Si l’on souhaite que cet écart de phase soit sans conséquence sur le calcul de l’intégrale, il suffit qu’il reste inférieur à 2π/N , où N désigne un entier dont on pourra ajuster la valeur en fonction de la précision recherchée. On en déduit donc une condition sur x0 , puis de manière identique sur y0 , et donc sur la dimension transverse de l’objet, comparée à celle de la pupille, à savoir : √  2 2 2 x0 + y0 ≤ 2a (12.15) N On supposera désormais cette condition satisfaite. Cela nous permet d’écrire, par analogie avec les relations (12.13) : 2 2 ik x0 +y0 M2

S (xi − x0 , yi − y0 ) e 2d0

2 2 ik xi +yi M2

−→ S (xi − x0 , yi − y0 ) e 2d0

(12.16)

Dans ces conditions, la relation (12.12) prend la forme simplifiée suivante : i

k

(x 2 +y 2 ) 1−

1



M Ei (xi , yi ) = e ikd0 e ikdi e 2di i i  × S (xi − x0 , yi − y0 ) Eg (x0 , y0 ) dx0 dy0

(12.17)

ce qui montre que la répartition spatiale du champ dans le plan image est donnée, à un coefficient de phase près, par le produit de convolution entre la réponse percussionnelle du système optique et la répartition spatiale du champ dans l’image géométrique de l’objet. En termes d’éclairement, cette relation conduit immédiatement à :   2          S (xi − x0 , yi − y0 ) Eg (x0 , y0 ) dx0 dy0  Ei (xi , yi ) = 

(12.18)

soit encore, de manière synthétique :  2 Ei = S  Eg 

(12.19)

Donc, vis-à-vis de cet éclairement, seule grandeur que l’on soit capable, en optique, de mesurer, tout se passe comme si nous pouvions écrire :

Ei = S  Eg

(12.20)

et c’est, par abus de langage, cette relation que nous considérerons désormais.

228

12. Formation des images

Comme nous en avons maintenant l’habitude, il est pratique d’appliquer à la relation (12.20) une transformation de Fourier, de manière à remplacer le produit de convolution qui y figure par un produit simple, soit : g (fx , fy ) E i (fx , fy ) = S (fx , fy ) E

(12.21)

Mais il nous faut tenir compte de la définition particulière de la fonction S (x, y) donnée par la relation (12.10), à savoir qu’elle est égale à la transformée de Fourier de la fonction P (λdi u, λdi v). Or, nous avons montré au paragraphe A.3.4 que la transformée de Fourier de la transformée de Fourier d’une fonction est égale à la fonction de départ changée de signe. En conséquence, nous pouvons écrire : S (fx , fy ) = P ( − λdi fx , −λdi fy )

(12.22)

En reportant ce dernier résultat dans la relation (12.21), nous obtenons enfin :

E i (fx , fy ) = Hcoh (fx , fy ) E g (fx , fy ) avec Hcoh (fx , fy ) = P ( − λdi fx , −λdi fy )

(12.23)

où Hcoh (fx , fy ) est appelée fonction de transfert en éclairage cohérent du système optique considéré. L’utilisation de ce qualificatif cohérent sera justifiée au paragraphe 12.3.

12.2.2 Instrument stigmatique à pupille carrée Le système optique que nous considérons ici est stigmatique et à pupille carrée, ce qui signifie que sa fonction P (xl , yl ) a pour expression : x  y  l l Rect (12.24) P (xl , yl ) = Rect 2a 2a En utilisant la relation (12.23), nous en déduisons immédiatement sa fonction de transfert en éclairage cohérent :



λdi fy λdi fx Hcoh (fx , fy ) = Rect − Rect − (12.25) 2a 2a soit encore, en tenant compte de la parité de la fonction Rectangle : fy a fx Hcoh (fx , fy ) = Rect Rect avec f0 = 2f0 2f0 λdi

(12.26)

On appelle f0 la fréquence de coupure du système optique considéré. La figure 12.2 présente la variation de cette fonction de transfert le long de l’axe fx .

229

De l’Optique électromagnétique à l’Interférométrie

Hcoh ( fx,0) 1

fx – f0

0

+ f0

Figure 12.2 Fonction de transfert en éclairage cohérent d’un instrument stigmatique à pupille carrée.

12.2.3 Instrument stigmatique à pupille circulaire La fonction Pupille a ici pour expression : ⎞ ⎛ xl2 + yl2 ⎠ P (xl , yl ) = Circ ⎝ a

(12.27)

où a désigne le rayon de la pupille (a = D/2). La fonction de transfert en éclairage cohérent de ce système optique est donc donnée par : Hcoh (fx , fy ) = P ( − λdi fx , −λdi fy ) ⎞ ⎛    λdi fx2 + fy 2 f ⎠ ⎝ = Circ = Circ a f0

(12.28)

où, comme au paragraphe 12.2.2, f0 correspond à la fréquence de coupure du système et est définie par : a D = (12.29) f0 = λdi 2λdi La variation de cette fonction de transfert le long de l’axe fx est identique à celle représentée à la figure 12.2.

12.2.4 Exemple d’utilisation Considérons un objet dont la répartition d’amplitude E0 (x0 , y0 ) correspond à une modulation sinusoïdale unidimensionnelle de période P définie par la relation :   E0 2πx0 E0 (x0 , y0 ) = 1 + cos (12.30) 2 P

230

12. Formation des images

et déterminons la nature de l’image qu’en donne, par exemple, un instrument stigmatique à pupille carrée. La démarche décrite au paragraphe 12.2.1 nous amène à définir dans un premier temps la répartition d’amplitude associée à l’image géométrique de l’objet, soit :      x0 x0 2πx0 1 E0   Eg (x0 , y0 ) = E0 , = 1 + cos (12.31) M M M 2M MP puis la transformée de Fourier de cette quantité :

1 1 1 1 E0 E g (fx , fy ) = δ(fx , fy ) + δ(fx − , fy ) + δ(fx + , fy ) (12.32) 2M 2 MP 2 MP La transformée de Fourier de la répartition d’amplitude dans l’image est donc définie par la relation suivante :

E i (fx , fy ) = Rect E0 2M E0 = 2M

=



fy fx E˜g (fx , fy ) Rect 2f0 2f0   fy 1 1 fx Rect δ(fx , fy ) + δ(fx ± Rect , fy ) 2f0 2f0 2 MP

  1 1 1 δ(fx ± (12.33) δ(fx , fy ) + Rect , fy ) 2 2MPf0 MP

Le résultat final va donc dépendre de la comparaison entre la fréquence de coupure f0 et celle correspondant à la modulation d’amplitude dans l’image géométrique de l’objet, soit 1/MP . Deux cas doivent être distingués : – cas 1 : f0 < 1/MP La fréquence de modulation 1/MP n’est pas transmise par le système optique, de sorte que la transformée de Fourier de la répartition d’amplitude dans l’image est définie par : E0 E i (fx , fy ) = (12.34) δ(fx , fy ) 2M L’utilisation d’une transformée de Fourier inverse permet de remonter aisément à la répartition d’amplitude dans l’image :

E0 2M puis à l’éclairement enregistré dans le plan d’observation : Ei (xi , yi ) =

Ei (xi , yi ) =

|E0 |2 4M 2

(12.35)

(12.36)

231

De l’Optique électromagnétique à l’Interférométrie

éclairement qui est donc uniforme et inversement proportionnel au carré du grandissement transverse. – cas 2 : f0 > 1/MP La fréquence de modulation 1/MP est maintenant parfaitement transmise par le système optique, de sorte que la transformée de Fourier de la répartition d’amplitude dans l’image est identique à celle qui correspondait à l’objet. Il en est donc de même pour cette répartition d’amplitude et l’éclairement enregistré dans le plan image a donc pour expression :   |E0 |2 2πxi 2 Ei (xi , yi ) = 1 + cos 4M 2 MP

(12.37)

12.3 Éclairage cohérent, éclairage incohérent Les résultats que nous venons d’établir au paragraphe 12.2.1 sont vrais en toute circonstance, pour autant que le plan d’observation soit confondu avec le plan image défini au sens de l’optique géométrique. Mais, dans certains cas, le calcul peut être légèrement modifié pour prendre en compte la nature radiative de l’objet lui-même. Pour comprendre les raisons de cette approche, considérons un objet constitué par deux sources lumineuses ponctuelles respectivement positionnées en (x1 , y1 ) et (x2 , y2 ), et donc décrit par l’expression :

E0 (x0 , y0 ) = E1 δ(x0 − x1 , y0 − y1 ) + E2 δ(x0 − x2 , y0 − y2 )

(12.38)

et supposons, uniquement pour simplifier l’écriture, que le grandissement transverse soit égal à 1. Alors l’utilisation de la relation générale (12.17) nous permet d’écrire, à un facteur de phase constant près :

Ei (xi , yi ) = E1 S (xi − x1 , yi − y1 ) + E2 S (xi − x2 , yi − y2 )

(12.39)

De façon à simplifier l’écriture, nous remplacerons dans ce qui suit l’expression précédente par la formulation contractée :

Ei = E1 S1 + E2 S2

(12.40)

L’éclairement enregistré dans le plan image est dans ce cas défini par : Ei = |Ei |2 = |E1 S1 + E2 S2 |2

(12.41)

Comme défini et expliqué au paragraphe 6.3.2, le résultat de la mesure de cet éclairement sera constitué par la moyenne temporelle du courant instantané délivré par le détecteur utilisé dans ce but, moyenne réalisée sur le temps d’intégration T de ce

232

12. Formation des images

détecteur, soit :

Ei T = |E1 S1 + E2 S2 |2 T

(12.42)

Pour chaque quantité complexe apparaissant dans la relation précédente, utilisons sa représentation en amplitude et phase, soit :

E1 = |E1 | e iφ1

E2 = |E2 | e iφ2

S1 = |S1 | e iψ1

S2 = |E2 | e iψ2

(12.43)

Cela va nous permettre d’écrire la relation (12.41) sous la forme équivalente suivante : Ei T = |E1 |2 |S1 |2 + |E2 |2 |S2 |2 +2|E1 ||S1 ||E2 ||S2 | cos[(ψ1 − ψ2 ) + (φ1 − φ2 )]T

(12.44)

Au moment de distribuer la moyenne temporelle sur l’ensemble des facteurs apparaissant dans cette relation, il est utile de s’interroger sur la dépendance temporelle de chacun d’entre eux : – les termes de type Sk sont fonction des caractéristiques intrinsèques du système optique et de la position des points lumineux dans le plan objet : nous supposerons que ces éléments sont fixes à l’échelle du temps d’intégration du détecteur, ce qui signifie que |S1 |, |S2 |, ψ1 et ψ2 se comportent ici comme des constantes indépendantes du temps ; – nous pouvons faire l’hypothèse (ici non restrictive) que les quantités de type |Ek | sont des constantes à l’échelle du temps d’intégration de notre détecteur, par contre nous n’avons a priori aucune idée de la dépendance temporelle des termes de phase de type φk et donc du comportement exact de la différence φ1 − φ2 . C’est de cette interrogation sur la dépendance temporelle de la relation de phase entre les différents points constitutifs d’un objet que va naître la distinction entre éclairage cohérent et éclairage incohérent. On appellera incohérente la situation dans laquelle il n’y a aucune relation de phase stable dans le temps entre les différents points constitutifs de l’objet. Un exemple simple d’une telle situation est celui qui correspond à l’observation astronomique : les différentes étoiles présentes sur le fond de ciel constituent des émetteurs ponctuels complètement indépendants, et les champs rayonnés par chacun de ces émetteurs n’ont évidemment aucune raison de présenter entre eux la moindre cohérence mutuelle. À l’inverse, on appellera cohérente la situation complètement opposée et dans laquelle cette relation de phase est parfaitement stable dans le temps. Cela suppose implicitement que l’ensemble de la scène est effectivement éclairée avec un front d’onde unique, du type de celui que peut délivrer une source laser, par exemple. Bien évidemment, toutes les situations intermédiaires entre ces deux configurations extrêmes sont susceptibles d’être en pratique rencontrées et elles sont habituellement désignées sous l’appellation générique d’éclairage partiellement cohérent. Cette situation intermédiaire ne sera pas analysée dans le cadre de cet ouvrage.

233

De l’Optique électromagnétique à l’Interférométrie

Revenons au cas dit cohérent : si la quantité φ1 − φ2 ne dépend pas du temps, cela revient à dire que le développement de la quantité |Ei |2 T en constituants élémentaires ne conduit à aucune simplification particulière et que, en fait, la relation (12.41) est celle qu’en pratique il nous faudra considérer. Mais, dans le cas incohérent, la différence φ1 − φ2 constitue en fait une variable aléatoire temporelle, de sorte que la moyenne, sur l’intervalle de temps T , de la fonction cosinus qui apparaît dans la relation (12.44) est identiquement nulle. Cette relation est donc, dans ce cas incohérent, équivalente à :

soit encore :

Ei T = |S1 |2 |E1 |2 T + |S2 |2 |E2 |2 T

(12.45)

Ei T = |S1 |2 E1 T + |S2 |2 E2 T

(12.46)

Les résultats auxquels nous sommes parvenus peuvent donc être synthétisés de la manière suivante : Éclairage cohérent Éclairage incohérent

Ei T = |E1 S1 + E2 S2 |2 T Ei T = |S1 |2 |E1 |2 T + |S2 |2 |E2 |2 T

(12.47)

soit encore, en revenant à une répartition d’amplitude dans l’objet de nature quelconque et en omettant la référence aux moyennes temporelles :  2 Éclairage cohérent Ei = S  Eg  (12.48) Éclairage incohérent Ei = |S |2  |Eg |2

12.4 Fonction de transfert en éclairage incohérent 12.4.1 Définition La situation que nous avons maintenant à analyser est donc décrite par une relation générale du type : (12.49) Ei = |S |2  Eg Cependant, en l’état, cette relation ne saurait être totalement exacte, car son équation aux dimensions n’est pas vérifiée : la fonction S est en effet caractérisée par une dimension en L−2 . Cela impose donc de rajouter à la relation précédente une constante C ayant les dimensions d’une surface, soit : Ei = C |S |2  Eg

(12.50)

En appliquant une transformation de Fourier aux deux membres de cette équation, il vient : Ei (fx , fy ) = Hincoh (fx , fy ) Eg (fx , fy ) (12.51)

234

12. Formation des images

où Hincoh (fx , fy ) représente la fonction de transfert en éclairage incohérent du système optique considéré. Cette fonction est définie par :  2 Hincoh (fx , fy ) = C TF{|S | } = C |S (x, y)|2 e −2iπ(xfx +yfy ) dx dy (12.52) Mais, par ailleurs, nous pouvons écrire : TF{|S |2 } = TF{S.S ∗ } = TF{S }  TF{S ∗ }

(12.53)

Or la transformée de Fourier de la fonction S (x, y) n’est rien d’autre que la fonction de transfert en éclairage cohérent Hcoh (fx , fy ), introduite au paragraphe 12.2.1, et qui est donc définie par :  Hcoh (fx , fy ) = TF{S } = S (x, y) e −2iπ(xfx +yfy ) dx dy (12.54) En prenant le complexe conjugué des deux membres de cette équation, nous pouvons écrire :  ∗ (fx , fy ) = S ∗ (x, y) e 2iπ(xfx +yfy ) dx dy (12.55) Hcoh ce qui revient à dire que : ∗ ( − fx , −fy ) TF{S ∗ } = Hcoh

La relation (12.53) s’écrit donc :  S (ξ , η) S ∗(fx − ξ , fy − η) d ξ d η Hincoh (fx , fy ) = C  ∗ =C Hcoh (ξ , η) Hcoh (ξ − fx , η − fy ) d ξ d η

(12.56)

(12.57)

ce qui montre qu’à un coefficient multiplicatif près, la fonction de transfert en éclairage incohérent du système optique considérée n’est rien d’autre que la fonction d’auto-corrélation de celle définie en éclairage cohérent. De manière à faire disparaître de cette expression la constante C , dont la valeur dépend des caractéristiques géométriques de la configuration optique considérée, on a coutume d’introduire à ce niveau la fonction de transfert de modulation du système optique, qui est égale à sa fonction de transfert normée, soit : Hincoh (fx , fy ) H (0, 0)  incoh ∗ (ξ − fx , η − fy ) d ξ d η Hcoh (ξ , η) Hcoh  = |Hcoh (ξ , η)|2 d ξ d η

FTM(fx , fy ) =

(12.58)

235

De l’Optique électromagnétique à l’Interférométrie

12.4.2 Instrument stigmatique à pupille carrée Au paragraphe 12.2.4, nous avons montré que, pour l’instrument stigmatique à pupille carrée considéré, la fonction de transfert en éclairage cohérent s’écrivait : fy a fx Hcoh (fx , fy ) = Rect Rect avec f0 = 2f0 2f0 λdi Si nous nous intéressons uniquement à la variation de la fonction de transfert en éclairage incohérent le long de l’axe fx , nous pouvons écrire :

 ξ − fx η Hincoh (fx , 0) = C Rect Rect 2f0 2f0 η ξ Rect dξ dη (12.59) × Rect 2f0 2f0 Les deux intégrales sont séparables, ce qui conduit immédiatement à :

 ξ ξ − fx Rect dξ Hincoh (fx , 0) = C Rect 2f0 2f0  η η Rect dη × Rect 2f0 2f0 soit encore :

 f0 ξ ξ − fx Hincoh (fx , 0) = C Rect Rect dξ dη 2f0 2f0 −f0

 ξ − fx ξ Rect dξ = 2Cf0 Rect 2f0 2f0

(12.60)





(12.61)

La fonction Hincoh (fx , 0) est paire, de sorte qu’il suffit de considérer dans notre analyse le cas des fréquences spatiales fx positives. Deux cas doivent cependant être distingués : • fx > 2f0 Les deux fonctions Porte apparaissant dans l’intégrale en ξ ont des supports disjoints, et la fonction Hincoh (fx , 0) est donc identiquement nulle ; • 0 < fx < 2f0 Les deux fonctions Porte apparaissant dans l’intégrale en ξ présentent une zone de recouvrement, comprise entre fx − f0 et f0 , et la relation (12.61) peut donc être mise sous la forme équivalente suivante :  Hincoh (fx , 0) = 2Cf0

236

f0

fx −f0

d ξ = 2Cf0 (2f0 − fx ) =

4Cf02



fx 1− (12.62) 2f0

12. Formation des images

Ce résultat permet de donner une expression générale de la variation de la FTM d’un instrument stigmatique à pupille carrée le long de l’axe fx , à savoir : fx FTM(fx , 0) = Tri (12.63) 2f0   f où Tri 2fx0 désigne la fonction Triangle, définie par : Tri

fx 2f0

⎧ ⎨ 1 − |fx | 2f0 = ⎩ 0

si − 2f0  fx  2f0

(12.64)

partout ailleurs

Cette variation est représentée à la figure 12.3. FTM ( fx,0) 1

fx –2 f0

0

+2 f0

Figure 12.3 Fonction de transfert en éclairage incohérent d’un instrument stigmatique à pupille carrée.

Il est important de noter ici que la fréquence de coupure de cette fonction de transfert est maintenant égale à 2f0 , et non à f0 , comme c’était le cas en éclairage cohérent. Cependant, cette différence n’est pas aussi déterminante qu’il y paraît de prime abord et nous serons conduits à revenir sur ce point au paragraphe 12.4.4.

12.4.3 Instrument stigmatique à pupille circulaire En utilisant l’expression de la fonction de transfert en éclairage cohérent établie au paragraphe 12.2.3 dans le cas d’un instrument stigmatique à pupille circulaire, il nous est possible de donner celle de la fonction de transfert en éclairage incohérent de ce même instrument, soit :    ξ 2 + η2 Hincoh (fx , fy ) = Circ f0  ⎞ ⎛ (ξ − fx )2 + (η − fy )2 ⎠ d ξd η (12.65) × Circ ⎝ f0

237

De l’Optique électromagnétique à l’Interférométrie

En passant en polaire dans les deux espaces, soit :   fx = f cos ψ ξ = ζ cos φ et fy = f sin ψ η = ζ sin φ il vient :

  ζ Circ Hincoh (f, ψ) = f0   f 2 + ζ 2 − 2f ζ cos[ψ − φ] × Circ ζd ζd φ f0

(12.66)



(12.67)

Il est toujours possible, sans perdre en généralité, de choisir une origine de l’angle polaire φ qui corresponde à la valeur particulière prise par l’angle ψ, de sorte que la relation précédente est équivalente à :      f 2 + ζ 2 − 2f ζ cos φ ζ Circ Circ ζ d ζ d φ (12.68) Hincoh (f, ψ) = f0 f0 ce qui montre que cette fonction de transfert est, elle aussi, indépendante de l’angle ψ, ce qui était attendu, compte tenu de la symétrie du problème. Cette fonction de transfert en éclairage incohérent est donc proportionnelle à la surface commune entre 2 cercles de rayon f0 et dont les centres sont distants d’une quantité égale à f . Cette surface est évidemment nulle lorsque cette fréquence f est supérieure à 2f0 . On supposera désormais que f < 2f0 , ce qui va nous permettre d’introduire l’angle θ défini par : f = 2f0 cos θ

(12.69)

cet angle θ variant entre π/2 (f = 0) et 0 (f = 2f0 ). La surface commune à ces deux cercles présente un axe de symétrie passant par leurs deux points d’intersection S1 et S2 (cf. figure 12.4). Chacune des portions de surface commune situées de part et d’autre de cet axe de symétrie est constituée du secteur angulaire d’angle au sommet 2θ, diminuée du triangle de même angle au sommet. La surface Sa du secteur angulaire est donnée par : Sa = θf02

(12.70)

tandis que la surface St du triangle a pour expression : St = f02 sin θ cos θ

238

(12.71)

12. Formation des images

S1

C1

θ

C2

S2

Figure 12.4 Représentation géométrique de la FTM d’un système optique à pupille circulaire.

En conséquence, la surface commune S entre les deux cercles de rayon f0 est égale à : S = 2(Sa − St ) = 2f02 (θ − sin θ cos θ)

(12.72)

La fonction de transfert de modulation (FTM) de ce système optique a donc pour expression : FTM(f ) =

Hincoh (f ) S (θ) 2 = = (θ − sin θ cos θ) Hincoh (0) S (π/2) π

soit encore, en inversant la relation de définition (12.69) : ⎡ ⎤     2 f f 2 f ⎦ − 1− FTM(f ) = ⎣arccos π 2f0 2f0 2f0

(12.73)

(12.74)

Les variations de cette FTM en fonction de la quantité f /2f0 sont représentées sur la figure 12.5. L’allure de cette courbe diffère peu de celle qui correspond à un instrument stigmatique à pupille carrée, dont on rappelle qu’elle est décrite par une fonction Triangle (en trait fin sur la figure 12.5).

12.4.4 Exemple d’utilisation L’exemple que nous allons traiter ici est identique à celui que nous avions considéré au paragraphe 12.2.4, c’est-à-dire : – un objet dont la répartition d’amplitude correspond à un champ de franges sinusoïdales de période P et orientées parallèlement à l’axe y ; – un système optique stigmatique à pupille carrée de côté 2a et de grandissement M .

239

De l’Optique électromagnétique à l’Interférométrie

FTM

Fonction Triangle

1,2 1 0,8 0,6 0,4 0,2 0

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

Figure 12.5 FTM d’un instrument stigmatique à pupille circulaire.

Dans le cas de l’éclairage incohérent, il nous faut tout d’abord évaluer la répartition d’éclairement dans l’image géométrique de l’objet, soit : Eg (x0 , y0 ) = |Eg (x0 , y0 )|2   2πx0 2 |E0 |2 1 + cos = 4M 2 MP      2 2πx0 |E0 | 2 2πx0 = 1 + 2 cos + cos 4M 2 MP MP      2 2πx0 4πx0 1 |E0 | 3 + 2 cos + cos = 4M 2 2 MP 2 MP

(12.75)

puis la transformée de Fourier de cette quantité :

|E0 |2 3 1 1 2 , f ) + δ(f ± ) + ± ) (12.76) δ(f , f δ(f , f Eg (fx , fy ) = x y x y x y 4M 2 2 MP 4 MP La transformée de Fourier de la répartition d’éclairement dans l’image peut être calculée en utilisant la fonction de transfert en éclairage incohérent : Ei (fx , fy ) = Hincoh (fx , fy ) Eg (fx , fy )

(12.77)

Nous avons calculé l’expression de cette fonction de transfert, ainsi que de la FTM associée, au paragraphe 12.4.2. En utilisant ces résultats, il vient : 

  |E0 |2 2 3 2πxi 1 cos Cf + 2 Tri Ei (xi , yi ) = M2 0 2 2MPf0 MP

  1 4πxi 1 cos + Tri (12.78) 2 MPf0 MP

240

12. Formation des images

Cela montre que : – l’efficacité relative de transmission, par l’instrument stigmatique à pupille carrée, des différentes fréquences spatiales caractéristiques de la répartition d’éclairement dans l’image géométrique de l’objet, ne dépend que de la valeur de la fonction de transfert de modulation pour ces fréquence caractéristiques ; – le niveau moyen d’éclairement fait intervenir la constante C . La détermination de la constante C fait appel à des notions de photométrie qui sortent du cadre de cet ouvrage. Cependant, à titre d’information, la méthode utilisée est la suivante : • on considère un objet présentant un éclairement uniforme E0 ; • un calcul analogue à celui que nous venons de mener montre que l’éclairement dans l’image est donné par la relation : Ei =

E0 Cf 2 M2 0

(12.79)

• la luminance L0 de l’objet est définie par la relation : L0 =

E0 π

(12.80)

• la luminance de l’image est conservée à la traversée du système optique, de sorte que l’éclairement image est défini par : Ei = Li

4a 2 4a 2 4a 2 = L = E 0 0 di2 di2 πdi2

(12.81)

• en identifiant les deux expressions de l’éclairement (12.79) et (12.81), on en déduit la valeur de la constante C , soit : C =

4 2 2 λ M π

(12.82)

En utilisant cette expression de la constante C dans la relation (12.78), on obtient enfin :

  2 3 2πxi 1 2 4a Ei (xi , yi ) = |E0 | cos + 2 Tri 2MPf0 MP πdi2 2

  1 4πxi 1 cos + Tri (12.83) 2 MPf0 MP Le résultat final va dépendre, comme dans le cas cohérent, de la comparaison entre la fréquence de coupure f0 et celle correspondant à la modulation d’amplitude dans l’image géométrique de l’objet, soit 1/MP .

241

De l’Optique électromagnétique à l’Interférométrie

Dans le cas de l’éclairage incohérent, trois cas doivent être distingués : – cas 1 : 1/MP > 2f0 La fréquence de modulation 1/MP n’est pas transmise par le système optique, de sorte que l’éclairement dans l’image est uniforme ; – cas 2 : f0 < 1/MP < 2f0 La fréquence de modulation 1/MP est transmise, mais son intensité est réduite par rapport à celle présente dans l’objet, alors que la fréquence en 2/MP n’est pas transmise, car elle est supérieure à la fréquence de coupure 2f0 ; – cas 3 : 1/MP < f0 Les 2 fréquences caractéristiques de la modulation présente dans l’éclairement de l’image géométrique de l’objet sont transmises par le système optique, mais elles le sont avec des atténuations différentes. 1 f = 0 MP 2

1 = f0 MP 1,0

1,0

0,9

0,9

0,8

0,8

Ei

Ei

0,7

0,6

0,5

0,5

0,4

0,4

0,3

0,3

0,2

0,2

0,1

0,1

0,0

0,0 0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

2

0

xi

3f 1 = 0 2 MP

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

2

1,8

2

xi

1 = 2 f0 MP

1,0

Ei

0,7

0,6

1,0

0,9

0,9

0,8

0,8

Ei

0,7 0,6

0,7 0,6

0,5

0,5

0,4

0,4

0,3

0,3

0,2

0,2

0,1

0,1 0,0

0,0 0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

xi

1,8

2

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

xi

Figure 12.6 Variations spatiales de l’éclairement enregistré dans le plan image pour quelques fréquences caractéristiques [f0 = 1/2 ; MP1 = 1, MP2 = 1/2, MP3 = 1/3, MP4 = 1/4] - En trait fin noir Ei (xi , 0), en trait épais grisé Eg (xi , 0).

Ces différentes configurations sont représentées de manière schématique à la figure 12.6. Le point le plus important à souligner ici est que, en aucun cas, l’image n’est identique à l’objet : la traversée du système optique provoque toujours une atténuation de l’intensité des différentes fréquences caractéristiques présentes dans l’éclairement associé à l’image géométrique de l’objet, et cette atténuation est d’autant plus forte que ces fréquences caractéristiques sont élevées.

242

Influence des aberrations Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 13.1 13.2 13.3

13.4

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Défaut de mise au point . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Formation des images en présence d’aberrations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.1 Notion d’écart aberrant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.2 Rapport de Strehl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.3 Critère de Maréchal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3.4 Plan de meilleure mise au point . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polynômes de Zernike . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.2 Définition et propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13.4.3 Application à la représentation de l’écart aberrant . . . . . . . . . . . . . . . . . . . . . . .

244 244 249 249 252 254 254 256 256 257 259

243

De l’Optique électromagnétique à l’Interférométrie

13.1 Introduction Dans l’ensemble de la démarche qui a été suivie au chapitre 12, nous avons implicitement utilisé 2 hypothèses importantes, à savoir : – le système optique considéré était parfait, c’est-à-dire rigoureusement stigmatique pour le couple de plans objet et image utilisés ; – la mise au point réalisée était également parfaite, c’est-à-dire que le choix du plan d’observation était effectué en accord avec la relation de conjugaison de l’optique géométrique. Le stigmatisme rigoureux mentionné plus haut garantit l’unicité de ce choix et son absence de relation avec le nombre d’ouverture effectif du système optique considéré. Dans ce chapitre 13, nous allons maintenant analyser les conséquences de l’abandon progressif de ces 2 hypothèses, à savoir, dans un premier temps, la condition de mise au point parfaite, puis dans un second temps, celle associée au stigmatisme rigoureux, en considérant alors un système optique présentant des aberrations géométriques.

13.2 Défaut de mise au point Si le choix du plan d’observation n’est plus effectué en accord avec la condition de conjugaison de l’optique géométrique telle que définie par la relation (12.1), alors l’expression générale (12.5), décrivant la répartition d’amplitude enregistrée dans le plan image, doit être conservée dans sa globalité, soit : e ikd0 e ikdi i 2dk (xi2 +yi2 ) Ei (xi , yi ) = − 2 e i λ d0 di × E0 (x0 , y0 ) e

  P (xl , yl ) e

i k2



1 di

 + d1 − F1 (xl2 +yl2 )

2i π (x x +y y ) − 2i π (x x +y y ) i 2dk (x02 +y02 ) − λd l i l i l 0 l 0 λd 0

e

e

0

i

0

dxl dyl dx0 dy0

Cela signifie que tout se passe comme si la fonction Pupille P (xl , yl ), utilisée dans le cas d’une mise au point parfaite, devait être remplacée par une fonction Pupille généralisée  P (xl , yl ), définie par :  P (xl , yl ) = P (xl , yl ) e

i k2



1 di

 + d1 − F1 (xl2 +yl2 ) 0

(13.1)

1 1 1 + − = di d0 F

(13.2)

On a coutume de poser :

de sorte que la relation (13.1) définissant la fonction Pupille généralisée prend la forme simplifiée suivante : 2 2  P (xl , yl ) = P (xl , yl ) e i 2 (xl +yl ) k

244

(13.3)

13. Influence des aberrations

Une fois définie cette nouvelle fonction Pupille, toutes les conclusions qui découlaient des calculs développés au chapitre 12 restent applicables, à savoir : • la réponse percussionnelle du système optique est proportionnelle à la transformée de Fourier de la fonction Pupille généralisée :   S (x, y) = P (λdi u, λdi v) e −2iπ(ux +vy)du dv (13.4) • la PSF du système optique est égale au module au carré de cette réponse percussionnelle :   2   2 −2iπ(ux +vy)   P (λdi u, λdi v) e du dv  (13.5) PSF(x, y) = |S (x, y)| =  • la fonction de transfert en éclairage cohérent est égale à cette fonction Pupille généralisée, prise au point de coordonnées ( − λdi fx , −λdi fy ), soit : P ( − λdi fx , −λdi fy ) Hcoh (fx , fy ) =  k

= P ( − λdi fx , −λdi fy ) e i 2 λ

2 d 2 (f 2 +f 2 ) y i x

(13.6)

• la fonction de transfert en éclairage incohérent est proportionnelle à la fonction d’auto-corrélation de cette fonction de transfert en éclairage cohérent, soit :  ∗ Hincoh (fx , fy ) = C Hcoh (ξ , η)Hcoh (ξ − fx , η − fy ) d ξ d η   =C P ( − λdi ξ , −λdi η) × P ∗ [−λdi (ξ − fx ), −λdi (η − fy )] d ξ d η

(13.7)

• la fonction de transfert de modulation est égale à la valeur normée de cette fonction de transfert en éclairage incohérent, soit : Hincoh (fx , fy ) H (0, 0)  incoh  P ( − λdi ξ , −λdi η) P ∗ [−λdi (ξ − fx ), −λdi (η − fy )] d ξ d η  = (13.8)  2  P ( − λdi ξ , −λdi η) d ξ d η

FTM(fx , fy ) =

Au paragraphe 12.4.4, nous avions montré que la variation, le long de l’axe fx , de la FTM d’un instrument stigmatique à pupille carrée de côté 2a, était égale à une fonction Triangle de fréquence de coupure 2f0 :   fx a FTM(fx , 0) = Tri avec f0 = 2f0 λdi

245

De l’Optique électromagnétique à l’Interférométrie

À titre d’illustration de la mise en œuvre de cette fonction Pupille généralisée, nous allons maintenant évaluer l’impact d’un défaut de mise au point sur cette FTM particulière. La fonction de transfert en éclairage incohérent s’écrit donc ici, le long de l’axe fx :  Hincoh (fx , 0) = C



=C

∗ Hcoh (ξ , η)Hcoh (ξ − fx , η) d ξ d η

 P ∗ [−λdi (ξ − fx ), −λdi η] d ξ d η P ( − λdi ξ , −λdi η)

(13.9)

En remplaçant la fonction P (xl , yl ) par le produit de 2 fonctions Porte (pupille de forme carrée), il vient :     k ξ η 2 2 2 2 Rect Rect e i 2 λ di (ξ +η ) 2f0 2f0     k ξ − fx η 2 2 2 2 × Rect Rect e −i 2 λ di [(ξ −fx ) +η ] d ξ d η 2f0 2f0 

Hincoh (fx , 0) = C

(13.10)

La démarche de calcul est similaire à celle utilisée au paragraphe 12.4.2. De la même manière que dans le cas parfait, l’intégrale double est séparable, de sorte que l’on obtient, après simplification : Hincoh (fx , 0) = C

 f0





−f0



Rect

   ξ ξ − fx i k λ2 d 2 (2ξ fx −fx2 ) i dξ Rect e 2 2f0 2f0

(13.11)

La fonction Hincoh (fx , 0) est ici aussi paire, de sorte qu’il suffit de considérer dans notre analyse le cas des fréquences spatiales fx positives. Deux cas doivent être à nouveau distingués : • fx > 2f0 : la fonction Hincoh (fx , 0) est identiquement nulle ; • 0 < fx < 2f0 : la relation (13.11) prend la forme équivalente suivante :  Hincoh (fx , 0) = C

f0

−f0

 dη k

f0

fx −f0

= 2Cf0 e −i 2 λ

2d 2f 2 i x

k

e i 2 λ 

2 d 2 (2ξ f −f 2 ) x x i



2d 2ξ f x i



f0

fx −f0



e ikλ

2 2 − e ikλ di fx (fx −f0 ) = 2Cf0 e ikλ2 di2 fx

 fx 4πa 2 fx fx 2 = 4Cf0 1 − Sinc 1− (13.12) 2f0 λ 2f0 2f0 −i k2 λ2 di2 fx2

246

2d 2f f i x 0

e ikλ

13. Influence des aberrations

L’ensemble de ces résultats peut être utilisé pour donner une expression générale de la FTM d’un instrument stigmatique à pupille carrée en présence d’un défaut de mise au point, à savoir :

    4πa 2 |fx | fx fx Sinc (13.13) Tri FTM(fx , 0) = Tri 2f0 λ 2f0 2f0 De manière générale, on notera que la FTM d’un instrument stigmatique à pupille carrée correspond à la fonction Triangle associée au cas parfait, modulée par une fonction Sinus cardinal dont l’argument est proportionnel au produit du défaut de mise au point  par une fonction quadratique du rapport des fréquences spatiales fx /2f0 . Cela signifie en particulier que le module de la FTM pour une fréquence spatiale donnée est toujours inférieur à celui obtenu dans le cas parfait pour cette même fréquence spatiale. Cela signifie également que la fréquence de coupure n’est pas affectée par l’introduction d’un défaut de mise au point, et que l’efficacité de transmission du continu (fréquence nulle) est toujours la même. Une représentation schématique de cette FTM est donnée à la figure 13.1 pour différentes valeurs de la quantité a 2 (0, λ, 2λ, 10λ). Pour un défaut de mise au point nul, on retrouve bien évidemment la fonction Triangle de fréquence de coupure égale à 2f0 .

ε a2 = 0

ε a2 = λ

ε a2 = 2 λ

ε a2 = 10 λ

Figure 13.1 FTM d’un instrument stigmatique à pupille carrée pour différentes valeurs du défaut de mise au point ( = 0,  = λ/a 2 ,  = 2λ/a 2 ,  = 10λ/a 2 ).

247

De l’Optique électromagnétique à l’Interférométrie

Lorsque l’amplitude du défaut de mise au point est telle que la quantité  est égale à λ/a 2 , alors la FTM s’annule pour la fréquence spatiale égale à f0 : cela signifie que cette fréquence particulière n’est plus transmise par le système optique. Lorsque cette même quantité  atteint 2λ/a 2 , la FTM présente 3 zéros respectivement égaux à f0 /2, f0 et 3f0 /2, et un signe négatif pour les fréquences spatiales comprises entre f0 /2 et 3f0 /2 : cela signifie qu’une modulation de fréquence spatiale située dans cet intervalle particulier de fréquences subit un déphasage spatial égal à une demipériode, c’est-à-dire une inversion de contraste. Enfin, lorsque le défaut de mise au point est tel que le produit a 2 approche 10 λ, alors la FTM ne présente des valeurs non nulles qu’au voisinage immédiat de la fréquence zéro. Le flou est ici tel, que seuls les détails les plus grossiers de l’objet (i.e. ses basses fréquences spatiales) se retrouvent dans l’image. La figure 13.2 illustre de manière schématique ces effets de filtrage, d’annulation et d’inversion de contraste, dans le cas où une mire à structure radiale (en haut à gauche

Figure 13.2 Effets de filtrage, d’annulation et d’inversion de contraste enregistrés lors de l’observation d’une mire radiale [en haut à gauche] par un instrument présentant un défaut de mise au point croissant [ a 2 = 0,  a 2 = λ,  a 2 = 2λ].

248

13. Influence des aberrations

de la figure) est imagée, tout d’abord à l’aide d’un instrument stigmatique (en haut à droite), puis en présence d’un défaut de mise au point d’importance croissante ( = λ/a 2 pour l’image située en bas à gauche et  = 2λ/a 2 pour celle située en bas à droite). On notera en particulier : • l’effet de la fréquence de coupure de l’instrument sur la transmission des motifs situés au voisinage de l’axe de la mire (et qui présentent donc les fréquences spatiales les plus élevées), et ce, même en l’absence d’un défaut de mise au point ; • l’inversion de contraste enregistrée sur l’image de la mire lorsque le défaut de mise au point δ atteint 8λN 2 .

13.3 Formation des images en présence d’aberrations 13.3.1 Notion d’écart aberrant Nous allons utiliser le cas particulier du défaut de mise au point pour introduire et appréhender cette notion d’écart aberrant, avant de la généraliser au cas d’un système optique quelconque. Considérons donc à nouveau la fonction Pupille généralisée associée à un instrument stigmatique en présence d’un défaut de mise au point, telle que nous l’avons définie au paragraphe 13.2 par la relation (13.1), soit : k

i  P (xl , yl ) = P (xl , yl ) e 2



1 di

 + d1 − F1 (xl2 +yl2 ) 0

De la même manière qu’au paragraphe 11.7, désignons par di,0 la distance di qui vérifie la relation de conjugaison au sens de l’optique géométrique et qui est donc définie par : 1 1 1 + − =0 di,0 d0 F Nous pouvons donc transformer le terme quadratique de phase apparaissant dans l’expression de la fonction Pupille généralisée en faisant apparaître cette distance particulière di,0 , soit : e

i k2



1 di

 + d1 − F1 (xl2 +yl2 ) 0

=e

i k2



1 di

− d1

i,0

 (xl2 +yl2 )

=e

i[ −2dk

i,0

k (xl2 +yl2 )− −2d (xl2 +yl2 )] i

(13.14)

Il est donc constitué par la différence entre deux termes : • le premier correspond à la variation de phase enregistrée dans le plan de la pupille lorsque l’onde considérée est une onde sphérique centrée sur l’image géométrique de l’objet et dont le centre de courbure serait donc situé à une distance di,0 de cette pupille, comme représenté en trait fin noir à la figure 13.3. Cette onde sphérique

249

De l’Optique électromagnétique à l’Interférométrie

n’est rien d’autre que celle effectivement délivrée par le système optique dans les conditions d’utilisation qui sont les siennes ; • le second correspond à la variation de phase enregistrée, toujours dans le plan de la pupille, lorsque l’onde prise en compte est une onde sphérique centrée sur le point d’observation, et dont le centre de courbure serait donc situé à une distance di de la pupille, comme représenté en trait grisé à la figure 13.3. ΣR

Σ0

di(0)

di

Ω

Figure 13.3 Visualisation de l’écart aberrant associé à un défaut de mise au point.

Le terme quadratique de phase associé au défaut de mise au point correspond donc à l’écart, mesuré dans le plan de la pupille, entre l’onde sphérique 0 effectivement délivrée par le système et une onde sphérique de référence R centrée sur le point d’observation. Les conclusions auxquelles nous sommes parvenus dans le cas particulier d’un défaut de mise au point peuvent être généralisées à l’ensemble des configurations d’imagerie que nous sommes susceptibles, en pratique, de rencontrer, et notamment à celles qui correspondent à la présence d’aberrations. Un système optique sera donc décrit, dans le cas général, par la simple donnée de sa fonction Pupille généralisée  P (xl , yl ) :  P (xl , yl ) = P (xl , yl ) e ikW (xl ,yl )

(13.15)

où W (xl , yl ) désigne l’écart aberrant, c’est-à-dire celui, enregistré dans le plan de la pupille, entre la surface d’onde effectivement délivrée par le système et une surface d’onde sphérique de référence, centrée sur le point d’observation.

250

13. Influence des aberrations

Cet écart aberrant s’annule lorsque le système est stigmatique et que le point d’observation est confondu avec l’image géométrique de l’objet. Il comprend donc, de manière générale : • une partie intrinsèque, associée à la qualité du système optique dans les conditions d’utilisation qui sont les siennes ; • une partie extrinsèque, associée au choix du plan d’observation. La méthode utilisée pour déterminer cette fonction écart aberrant fait appel à un calcul sur ordinateur et peut être schématiquement décrite de la manière suivante : • on définit tout d’abord l’ensemble des équations décrivant la forme, la position et l’indice de réfraction des éléments optiques (lentilles, miroirs) constituant ce système optique (on supposera que celui-ci est centré, c’est-à-dire qu’il présente une symétrie de révolution autour d’un axe parallèle à la direction de propagation, appelé axe optique) ; • on définit ensuite la position du point objet, dont on supposera dans un premier temps qu’il est situé sur cet axe optique ; • on considère alors un rayon émis par ce point objet et présentant un faible angle d’inclinaison α par rapport à cet axe optique : ce rayon rencontre le premier dioptre en un point A1 , sous un angle i0 calculé à partir des équations de ce rayon et de celle de la surface associée à premier dioptre ; • on applique la relation de Snell-Descartes (n0 sin i0 = n1 sin i1 ) pour déterminer l’effet de la traversée de ce dioptre sur l’angle d’inclinaison du rayon ; • on réitère les étapes précédentes pour l’ensemble des dioptres constitutifs du système optique (propagation, réfraction), jusqu’à ce que le rayon considéré émerge du système optique sous un angle d’inclinaison α  ; • on fait ensuite croître l’angle d’inclinaison α jusqu’à la valeur pour laquelle le rayon n’émerge plus du système optique. Cela signifie qu’il a rencontré au cours de sa propagation un obstacle physique (contour d’un dioptre, diaphragme) qui l’a arrêté : cet obstacle physique est appelé le diaphragme d’ouverture ; • par lancer de rayons depuis la bordure de ce diaphragme d’ouverture, on détermine la position de son image au travers des éléments optiques qui le séparent du plan d’observation : cette image est appelée la pupille de sortie du système optique ; • l’intersection de cette pupille de sortie avec l’axe optique est appelée , tandis que celle avec le rayon courant d’inclinaison α  est appelée H, comme représenté de manière schématique à la figure 13.4 ; • la construction rigoureuse de la trajectoire suivie par chaque rayon lancé à l’intérieur du système optique permet de calculer de manière exacte la valeur du chemin optique [AH ] et d’associer cette valeur aux coordonnées (xl , yl ) du point H dans la pupille de sortie ; • on calcule ensuite la différence [AH ] − [A ] et on compare cette valeur, pour chaque point de coordonnées (xl , yl ) à l’intérieur de la pupille, à celle qui correspondrait à l’écart de chemin optique entre le plan de cette pupille de sortie et

251

De l’Optique électromagnétique à l’Interférométrie

Diaphragme Pupille de sortie

d’ouverture

H α

A’

Ω

A

Dioptre d’entrée

Dioptre de sortie

Figure 13.4 Diaphragme d’ouverture, Pupille de sortie et lancer de rayons associé au calcul de l’écart aberrant.

une sphère centrée en un point A situé sur l’axe à une distance pi du centre de la pupille. La différence entre ces deux quantités correspond précisément à l’écart aberrant W (xl , yl ). Cet écart aberrant est donc évidemment fonction de la position du centre de la sphère de référence, et nous allons voir dans les paragraphes qui suivent sur la base de quels critères il convient d’optimiser le choix de cette sphère de référence.

13.3.2 Rapport de Strehl Le rapport de Strehl est défini comme étant le rapport entre l’éclairement enregistré au centre de la tâche image d’un système optique et celui enregistré dans les mêmes conditions lorsque le système optique considéré est dépourvu d’aberrations. La répartition d’éclairement dans la tâche image associée à un objet ponctuel correspond à la PSF du système optique et s’écrit donc :   2    P (λdi u, λdi v) e −2iπ(ux +vy) du dv  PSF(x, y) = |S (x, y)|2 = 

(13.16)

L’éclairement enregistré au centre de la tâche image est donc défini par :   2    Ei (0, 0) = PSF(0, 0) =  P (λdi u, λdi v) du dv 

252

(13.17)

13. Influence des aberrations

Après changement de variables (xl = λdi u, yl = λdi v) et remplacement de la fonction Pupille généralisée par son expression, il vient :   2  1  ikW (xl ,yl ) Ei (0, 0) = 2 2  dxl dyl  (13.18) P (xl , yl )e λ di expression que l’on peut également mettre sous la forme :   2  1  ikW (xl ,yl ) Ei (0, 0) = 2 2  e dxl dyl  λ d i

P

(13.19)

où l’intégration a été restreinte au support correspondant à la pupille P du système. Le rapport de Strehl R est donc défini par : Ei (0, 0) [Ei (0, 0)]W =0   2  2     ikW (xl ,yl ) ikW (xl ,yl )    e dx dy e dx dy l l l l     P  = =  P     2      dx dy   l l   dxl dyl  

R=

P

(13.20)

P

Il est égal au module au carré de la moyenne de la fonction e ikW sur la pupille P et peut donc s’écrire : 2    R = e ikW P  (13.21) Supposons que la fonction écart aberrant W prenne dans la pupille P des valeurs suffisamment faibles pour que l’on puisse approximer la fonction exponentielle e ikW par son développement limité à l’ordre 2. Il faut donc que le produit kW soit petit devant la période de cette exponentielle imaginaire, soit : 2π λ ⇒ W  (13.22) N N où N est, comme d’habitude, un entier dont la valeur sera choisie en fonction de la précision recherchée pour cette approximation. Si cette condition est remplie, nous pouvons donc écrire : k2 (13.23) e ikW  1 + ikW − W 2 2 soit encore, en passant aux valeurs moyennes sur la pupille P : kW 

k2 (13.24) W 2 P 2 Le rapport de Strehl R est donc, au même ordre d’approximation, défini par : 2  2 R = e ikW P   1 − k 2 [W 2 P − W 2P ] = 1 − k 2 σW (13.25) e ikW P  1 + ikW P −

253

De l’Optique électromagnétique à l’Interférométrie

2 désigne la variance de la fonction écart aberrant sur la pupille P . où σW

On peut légèrement transformer la relation (13.25) et écrire, toujours au même niveau d’approximation : 2 2 R  e −k σW (13.26) Cette formulation alternative est souvent utilisée, car elle permet d’éviter les problèmes de signe lorsque la quantité kσW devient plus grande que 1.

13.3.3 Critère de Maréchal Si l’on souhaite maximiser le rapport de Strehl R, il faut donc minimiser la variance 2 , et c’est ce critère qui sera la plupart du temps utilisé pour identifier la position σW optimale du centre de la sphère de référence, et donc celle du plan d’observation. André Maréchal a proposé en 1947, comme critère d’évaluation de la qualité de l’image fournie par un système optique, que la variance de la fonction écart aberrant sur la pupille n’excède pas λ2 /180. Cela revient en pratique à imposer que le rapport de Strehl reste supérieur à 80 %. En effet : 4π 2 λ2 2 σW  ⇒ R1− = 78 % (13.27) 180 180 Ce critère est beaucoup plus pertinent que celui introduit à l’origine par Rayleigh (valeur maximale de l’écart aberrant dans la pupille inférieure à λ/4).

13.3.4 Plan de meilleure mise au point Nous allons montrer dans ce paragraphe comment la minimisation de cette variance 2 permet de déterminer la position du plan d’observation qui donne accès à une σW qualité image optimale. L’exemple utilisé est relatif à un système optique centré, à pupille circulaire, qui présente de l’aberration sphérique et est utilisé sur l’axe. Lorsque le plan d’observation est placé au point de cet axe défini par la relation de conjugaison de l’optique géométrique, la fonction écart aberrant de ce système est donnée par : W (xl , yl ) = A(xl2 + yl2 )2

(13.28)

Lorsque l’on déplace le plan de mise au point par rapport à cette position de référence, il faut introduire dans l’expression de cet écart aberrant la contribution d’un défaut de mise au point, soit : W (xl , yl ) = A(xl2 + yl2 )2 + B(xl2 + yl2 )    1 1 1 avec B= = − 0 2 2 di di

254

(13.29)

13. Influence des aberrations

Pour identifier la position correspondant au meilleur foyer, il faut donc minimiser la variance de la fonction écart aberrant sur la pupille P du système. On appellera a le rayon de la pupille et on exprimera la fonction écart aberrant en polaire, de manière à tirer profit de la symétrie de révolution du problème. En conséquence : (13.30) W (r, θ) = Ar 4 + Br 2  a  2π dθ (Ar 4 + Br 2 )r dr a2 a4 0 0 W P = (13.31) =A +B  a  2π 3 2 dθ r dr 0

2

W P =





0

 =

0

0

a



dθ 

a

0 2π

0

(Ar 4 + Br 2 )2 r dr  a dθ r dr 0

2 8

(A r + 2ABr 6 + B 2 r 4 )r dr  a r dr 0

a6 a8 a4 = A 2 + AB + B 2 5 2 3

(13.32)

En utilisant ces expressions, nous pouvons maintenant calculer la variance de l’écart aberrant : 2 σW = W 2 P − W 2P   2  8 6 4 4 2 a a a a a − A +B = A 2 + AB + B 2 (13.33) 5 2 3 3 2 Après développement et simplification, il vient : a6 4a 8 a4 2 = A2 + AB + B 2 (13.34) σW 45 6 12 Pour minimiser cette variance, on recherche alors la valeur particulière de B qui 2 /∂B, soit : annule la dérivée partielle ∂σW 2 ∂σW a6 a4 = A + 2B =0 ∂B 6 12



B = −Aa 2

(13.35)

2 a pour expression : Pour ce plan particulier d’observation, la variance σW 2 (σW )min = A 2

A 2a 8 4a 8 a8 − A2 = 45 12 180

(13.36)

255

De l’Optique électromagnétique à l’Interférométrie

Si l’on souhaite que le système optique considéré respecte le critère de Maréchal dans son plan de meilleure mise au point, il est alors nécessaire que la quantité Aa 4 soit inférieure ou égale à λ, ce qui revient à dire que l’aberration sphérique pure correspond à un écart aberrant maximal de λ en bord de pupille. Si ces conditions sont remplies, alors le rapport de Strehl sera effectivement supérieur à 80 % si l’on place le plan d’observation dans le plan de meilleure mise au point. Supposons maintenant que l’on place ce plan d’observation au point défini par l’optique géométrique. Cela signifie que la quantité B est maintenant égale à 0. La relation (13.34) nous permet de calculer immédiatement la valeur de la variance associée à cette position particulière, soit : 2 σW =

4A 2 a 8 4λ2 λ2 = = 16 45 45 180

(13.37)

Le critère de Maréchal n’est plus respecté et le rapport de Strehl ne dépasse pas 3 % lorsque celui-ci est évalué à l’aide de la relation approchée (13.26). En fait, le niveau d’éclairement au centre de la tache image est typiquement 100 fois inférieur à celui qui aurait été obtenu avec un système parfait. Cela montre, si besoin était, que les prédictions de l’optique géométrique paraxiale ne correspondent que fort peu à la réalité des phénomènes physiques mis en jeu dans la formation des images.

13.4 Polynômes de Zernike 13.4.1 Introduction Nous avons montré au paragraphe 13.3.1 que les performances d’un système optique étaient complètement déterminées par la seule connaissance de sa fonction Pupille généralisée, dont on rappelle qu’elle s’écrit :  P (xl , yl ) = P (xl , yl ) e ikW (xl ,yl ) Le module de cette fonction (Pupille P ) est aisé à percevoir autant dans sa structure que dans ses effets, mais la phase de cette même fonction, produit du vecteur d’onde k par la fonction Écart aberrant W , est beaucoup plus complexe à décrire et à évaluer, en particulier lorsqu’elle n’est disponible que sous une forme numérique, ce qui est en pratique souvent le cas. Pour mieux appréhender les effets de cet écart aberrant W , il s’avère donc intéressant de le décomposer en une somme de termes qui soient à la fois indépendants, de structure plus simple et associés à des effets physiques qui se rapprochent de ceux correspondant à des aberrations géométriques classiques, tels qu’aberration sphérique, coma, astigmatisme, courbure de champ ou distorsion.

256

13. Influence des aberrations

C’est ce que permet la décomposition de la fonction écart aberrant sur la base : • des polynômes de Legendre, dans le cas d’une pupille rectangulaire ; • des polynômes de Zernike, dans le cas d’une pupille circulaire. Compte tenu de l’importance pratique des instruments à pupille circulaire, nous nous limiterons ici à une présentation rapide des seuls polynômes de Zernike.

13.4.2 Définition et propriétés 13.4.2.1 Définition Les polynômes de Zernike sont définis sur un disque de rayon unité et s’expriment en coordonnées polaires (ρ, θ). On distingue 2 types de polynômes de Zernike, en fonction de leur parité : les polynômes pairs, définis de manière générale par : Znm (ρ, θ) = Rnm (ρ) cos (mθ)

(13.38)

et les polynômes impairs, définis par une relation analogue, la fonction sinus remplaçant la fonction cosinus : Zn−m (ρ, θ) = Rnm (ρ) sin (mθ)

(13.39)

m et n sont ici des entiers positifs vérifiant m  n. La dépendance radiale Rnm (ρ) est en outre définie par la relation générale :

Rnm (ρ)

=

⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨

(n−m)/2  k =0

⎪ ⎪ ⎪ ⎪ ⎪ ⎩

( − 1)k (n − k)! ρ n−2k − k)!( n−m − k)! 2

si

k!( n+m 2

0

(n − m) pair

(13.40) si

(n − m) impair

13.4.2.2 Propriétés La propriété la plus importante de ces polynômes de Zernike est qu’ils constituent une base de décomposition orthogonale pour toutes les fonctions définies sur le disque de rayon unité. En effet, si n − m et n  − m  sont tous les deux pairs, alors :  0

1  2π 0



Znm (ρ, θ)Znm (ρ, θ) ρ d ρ d θ =

m π δn n  δm m  2n + 2

(13.41)

257

De l’Optique électromagnétique à l’Interférométrie

où δij désigne le symbole de Kronecker (égal à 1 si i = j et à 0 si i  = j ) et m le facteur de Neumann (égal à 2 si m = 0 et à 1 si m  = 0). Toute fonction F (ρ, θ) définie sur le disque unité peut donc être décomposée sur cette base, soit : F (ρ, θ) =

∞  ∞  

Anm Znm (ρ, θ) + Bnm Zn−m (ρ, θ)



(13.42)

m=0 n=m

avec :

⎧   2n + 2 1 2π ⎪ ⎪ F (ρ, θ)Znm (ρ, θ) ρ d ρ d θ ⎪ ⎨ Anm =  π m 0 0   ⎪ 2n + 2 1 2π ⎪ ⎪ ⎩ Bnm = F (ρ, θ)Zn−m (ρ, θ) ρ d ρ d θ m π 0 0

(13.43)

13.4.2.3 Exemples On peut aisément construire la liste des premières fonctions radiales, soit : R00 (ρ) = 1 R11 (ρ)



R10 (ρ)

=0

R44 (ρ) = ρ 4 R43 (ρ) = 0

R22 (ρ) = ρ 2 R21 (ρ) = 0 R20 (ρ) = 2ρ 2 − 1 R33 (ρ) = ρ 3 R32 (ρ) = 0 R31 (ρ) = 3ρ 3 − 2ρ

R42 (ρ) = 4ρ 4 − 3ρ 2 R41 (ρ) = 0 R40 (ρ) = 6ρ 4 − 6ρ 2 + 1 R55 (ρ) = ρ 5 R54 (ρ) = 0 R53 (ρ] = 5ρ 5 − 4ρ 4 etc.

R30 (ρ) = 0

et en déduire celle des polynômes de Zernike eux-mêmes, aussi bien pairs qu’impairs. La figure 13.5 donne une représentation en niveaux de gris des valeurs prises par les premiers d’entre eux. On notera que : ∀n, Rnm (1) = 1

258

si (n − m) est pair

(13.44)

13. Influence des aberrations

Figure 13.5 Représentation en niveaux de gris des premiers polynômes de Zernike [d’après C. Rocchini].

13.4.3 Application à la représentation de l’écart aberrant Lorsque l’on dispose de la fonction Écart aberrant W (wl , yl ) d’un instrument dont la pupille est circulaire et de rayon a, il suffit d’exprimer cette fonction en coordonnées polaires réduites (ρ = r /a, θ) pour rendre possible sa décomposition sur la base des polynômes de Zernike, comme indiqué au paragraphe 13.4.2.2. On peut ainsi écrire : ∞  ∞    Anm Znm (ρ, θ) + Bnm Zn−m (ρ, θ) W (ρ, θ) =

(13.45)

m=0 n=m

259

De l’Optique électromagnétique à l’Interférométrie

Le principal intérêt de cette décomposition est qu’elle donne immédiatement accès 2 de l’écart aberrant, et donc à celle du rapport de Strehl, à la valeur de la variance σW sous réserve que l’on définisse le rang du polynôme où la décomposition en question est effectivement arrêtée. La valeur moyenne de l’écart aberrant sur la pupille est en effet donnée par : 

1  2π

W (ρ, θ) ρ d ρ d θ W P =  1  2π ρ dρ dθ 0 0  1  2π W (ρ, θ)Z00 (ρ, θ) ρ d ρ d θ 0 0 = = A00  1  2π ρ dρ dθ 0

0

0

(13.46)

0

De la même manière, la valeur moyenne du carré de cette fonction W a pour expression :  1  2π W 2 (ρ, θ) ρ d ρ d θ 2 0 0 W P =  1  2π ρ dρ dθ 0

0

∞  ∞   2  2 = Anm + Bnm m=0 n=m

m 2n + 2

(13.47)

expression que l’on peut également écrire sous la forme équivalente suivante : 2

W P =

2 A00

∞ ∞  n 2 2 + B2   An0 Anm nm + + n+1 2(n + 1) n=2

(13.48)

n=1 m=1

En combinant les relations (13.46) et (13.48), on en déduit immédiatement la valeur prise par la variance de la fonction W : ∞ ∞  n 2 2 + B2   An0 Anm nm 2 σW = W 2 P − W 2P = + (13.49) n+1 2(n + 1) n=2

n=1 m=1

puis celle correspondant au rapport de Strehl R :

∞ ∞  n 2 + B2  A2  A nm nm 2 n0 R  1 − k 2 σW = 1 − k2 + n+1 2(n + 1) n=2

(13.50)

n=1 m=1

qui, comme annoncé, est entièrement déterminée par la connaissance des coefficients de la décomposition de la fonction Écart aberrant sur la base des polynômes de Zernike.

260

13. Influence des aberrations

On a l’habitude de désigner les premiers coefficients de cette décomposition en rappelant le nom de l’aberration géométrique auxquels ils se trouvent reliés, à savoir : A00

Piston

A11 B11 A20 A22 B22 A31 B31 A33 B33 A40

Tilt à 0˚ Tilt à 90˚ Défaut de mise au point Astigmatisme à 0˚ Astigmatisme à 45˚ Coma à 0˚ Coma à 90˚ Trefoil à 0˚ Trefoil à 90˚ Aberration sphérique du 3e ordre etc.

Une bonne description des aberrations d’un système optique complexe impose souvent de prendre en compte un nombre important de termes (typiquement entre 40 et 100).

261

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Optique adaptative Chapitre conçu par Carole Deumié et Michel Lequime rédigé par Michel Lequime

Sommaire 14.1 14.2

14.3

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Capteur de type Shack-Hartmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.2 Description théorique d’un Shack-Hartmann . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.3 Description matérielle d’un Shack-Hartmann . . . . . . . . . . . . . . . . . . . . . . . . . . 14.2.4 Avantages et inconvénients . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Optique adaptative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

264 264 264 265 267 269 269

263

De l’Optique électromagnétique à l’Interférométrie

14.1 Introduction Nous avons vu au chapitre 13 l’influence de la fonction Écart aberrant W sur les performances d’un système optique. Supposons que nous soyons capables de mesurer cette fonction Écart aberrant dans le cas d’un instrument d’observation astronomique et de mettre à jour ce résultat à une cadence suffisamment élevée pour rendre possible le suivi des évolutions temporelles que produit la turbulence atmosphérique sur les performances de ce système optique. Alors, si nous avions en outre le moyen de compenser de manière dynamique la valeur instantanée de cet écart aberrant en agissant sur le front d’onde délivré par le système optique utilisé, nous pourrions obtenir des images d’une qualité quasi parfaite en dépit des imperfections de réalisation de notre instrument et des dégradations additionnelles produites par la traversée de l’atmosphère. L’Optique adaptative a pour objectifs de répondre à ces deux enjeux. Le présent chapitre va donc être consacré à la description d’un capteur de front d’onde, le Shack-Hartmann, adapté à la mesure dynamique de cet écart aberrant, et à une présentation rapide de la constitution d’un système d’imagerie ayant recours à l’optique adaptative.

14.2 Capteur de type Shack-Hartmann 14.2.1 Introduction Le capteur dit de Shack-Hartmann utilise comme principe de mesure un échantillonnage du front d’onde à l’aide d’un réseau dense de micro-lentilles et la localisation des réponses percussionnelles élémentaires de ces différentes lentilles. Ce capteur constitue une amélioration d’un système initialement proposé par l’astronome Johannes Hartmann en 1870 et qui consistait à placer devant la pupille d’entrée d’un télescope d’observation astronomique une plaque percée de trous et à enregistrer avec une plaque photographique les positions des images de ces trous dans deux plans situés de part et d’autre du foyer. La comparaison de la position de ces spots lumineux dans les deux clichés permettait de déterminer l’orientation locale de la normale au front d’onde et donc de remonter à la qualité optique du télescope. Une amélioration importante de ce principe a été apportée en 1970 par le physicien américain Roland Shack qui a proposé de remplacer le masque de Hartmann, qui assurait un échantillonnage assez lâche de la pupille de l’instrument, par une matrice de micro-lentilles carrées jointives réalisant un pavage complet de cette même pupille. En outre, l’emploi de ces micro-lentilles rendait le repérage spatial des spots beaucoup plus précis.

264

14. Optique adaptative

Une fois précisés ces éléments de contexte, nous pouvons aborder la description des phénomènes optiques qui sont associés à l’échantillonnage du front d’onde par une micro-lentille de forme carrée.

14.2.2 Description théorique d’un Shack-Hartmann Considérons donc un système optique utilisé dans une configuration 0/∞, c’està-dire qui réalise la transformation d’une onde sphérique divergente émise par une source ponctuelle située à son foyer objet en une onde plane de vecteur d’onde parallèle à son axe optique. Plaçons dans la pupille de sortie de ce système une matrice de micro-lentilles carrées de côté 2a. Si W (x, y) désigne la fonction Écart aberrant de ce système et (xk , yk ) les coordonnées du centre de l’une de ces microlentilles, alors la répartition spatiale du champ enregistrée juste après cette lentille s’écrit :

El (x, y) = A0 e ikW (x,y) P (x − xk , y − yk ) tl (x − xk , y − yk )

(14.1)

où P (x, y) désigne la fonction Pupille associée à cette micro-lentille et tl (x, y) sa fonction de transmission complexe. Si l’ont tient compte de la géométrie particulière de la micro-lentille (carré de côté 2a) et si l’on appelle f sa distance focale, alors l’expression (14.1) prend la forme suivante : El (x, y ) = A0 e ikW (x,y ) Rect



x − xk 2a





Rect

y − yk 2a



e

−i 2fk [(x −xk )2 +(y −yk )2 ]

(14.2)

Si les variations de phase ne sont pas trop rapides à l’intérieur de la pupille de cette micro-lentille, il est possible de remplacer la fonction W par son développement au premier ordre au voisinage du centre (xk , yk ) de celle-ci, soit :   ∂W  ∂W  W (x, y) = W (xk , yk ) + (x − xk ) + (y − yk ) (14.3) ∂x xk ,yk ∂y xk ,yk On se placera désormais dans le référentiel de la micro-lentille considérée et l’on effectuera en conséquence le changement de variables : xl = x − xk ; yl = y − yk . La distribution spatiale d’amplitude complexe donnée par la relation (14.2) peut alors être mise sous la forme suivante : ∂Wk

∂Wk

El (xl , yl ) = A0 e ikWk e ikxl ∂x e l ∂y x  y  −i k l l × Rect Rect e 2f 2a 2a où nous avons utilisé les notations contractées  ∂W  ∂Wk = W (xk , yk ) = Wk ;  ∂x xk ,yk ∂x

iky

;

(xl2 +yl2 )

 ∂Wk ∂W  =  ∂y xk ,yk ∂y

(14.4)

(14.5)

265

De l’Optique électromagnétique à l’Interférométrie

La répartition d’amplitude enregistrée dans le plan focal image de la micro-lentille est donnée par le résultat du produit de convolution entre celle existant juste après la lentille et le propagateur de Fresnel associé à la distance de propagation f , soit :

Ef (xf , yf ) = [El  hf ](xf , yf )  e ikf i k = El (xk , yk ) e 2f i λf

[(xf −xk )2 +(yf −yk )2 ]

dxk dyk

(14.6)

Si l’on tient compte dans cette expression de la forme particulière de la répartition d’amplitude El (xl , yl ) définie par la relation (14.4), il vient : e ikf ikWk i 2fk Ef (xf , yf ) = A0 e e i λf



(xf2 +yf2 )

+a

−a

e 

×

 − 2iλfπ xk xf −f +a

−a

e

∂Wk ∂x



 − 2iλfπ yk yf −f

dxk ∂Wk ∂y



dyk

(14.7)

Les deux intégrales apparaissant dans l’expression précédente peuvent être exprimées en utilisant des fonctions Sinus cardinal, soit : e ikf ikWk i 2fk Ef (xf , yf ) = 4a A0 e e i λf 2



  ∂Wk 2πa Sinc xf − f λf ∂x    ∂Wk 2πa yf − f (14.8) × Sinc λf ∂y

(xf2 +yf2 )

de sorte que l’éclairement Ef (xf , yf ) enregistré dans le plan focal de la micro-lentille a pour expression :  2 Ef (xf , yf ) = Ef (xf , yf ) =



4a 2 λf



2

  ∂Wk 2πa |A0 | Sinc xf − f λf ∂x    ∂Wk 2πa yf − f (14.9) × Sinc2 λf ∂y 2

2

Dans le cas où la fonction Écart aberrant W est identiquement nulle (où simplement constante, la valeur absolue d’un terme de phase n’ayant pas, ici comme ailleurs, de réelle signification), les dérivées partielles ∂Wk /∂x et ∂Wk /∂y sont nulles, et les fonctions Sinus cardinal sont donc centrées sur l’axe optique de la micro-lentille considérée, l’éclairement enregistré correspondant tout simplement à la PSF de cette micro-lentille. Dans le cas où ce même Écart aberrant W présente des variations dans la pupille du système considéré, et donc que les dérivées partielles ∂Wk /∂x et ∂Wk /∂y ne sont a priori plus nulles, le centroïde de la PSF dans le plan focal de la micro-lentille est

266

14. Optique adaptative

décalé en x et en y d’une quantité égale au produit de la focale f par la valeur locale de la dérivée partielle correspondante. La mesure de la position des centroïdes associés à chaque micro-lentille permet donc de déterminer la pente locale du front d’onde en chaque point correspondant au centre optique d’une micro-lentille. Par intégration et propagation à la surface de la pupille du système optique étudié, cette information permet de remonter à la dépendance spatiale de la fonction Écart aberrant, naturellement à une constante additive près, mais cette indétermination n’a ici aucun impact (problème de la phase absolue).

14.2.3 Description matérielle d’un Shack-Hartmann Un capteur de front d’onde de type Shack-Hartmann comprend essentiellement deux composants, à savoir une matrice de micro-lentilles (cf. partie gauche de la figure 14.1) et un détecteur CCD ou CMOS de type matriciel (cf. partie droite de la figure 14.1). La matrice de micro-lentilles, que nous supposerons ici de structure carrée, est caractérisée par 4 grandeurs principales, à savoir son pas l , le nombre d’éléments qui la composent en ligne et en colonne (N × N ), la dimension transverse 2a d’une micro-lentille élémentaire et sa focale f . De la même manière, le détecteur CCD matriciel, également supposé de structure carrée, est caractérisé par son pas p, son nombre d’éléments en ligne et colonne (M × M ), et la dimension transverse s d’un photodétecteur. Nous supposerons que ces deux composants sont de dimensions adaptées, c’est-à-dire qu’est respectée l’égalité suivante : Nl = Mp

(14.10)

Figure 14.1 Composants principaux d’un capteur de front d’onde de type Shack-Hartmann : à gauche, matrice de micro-lentilles, à droite, détecteur CCD matriciel.

267

De l’Optique électromagnétique à l’Interférométrie

Les détecteurs CCD matriciels à hautes performances sont aujourd’hui fabriqués avec un amincissement de leur face arrière (back-thinned CCD), c’est-à-dire celle où ne se trouvent pas les électrodes de lecture et qui est alors utilisée comme surface de détection : le principal intérêt de cette méthode est que la totalité de la surface du détecteur participe ainsi à la détection, avec un impact positif sur l’efficacité quantique de détection (cf. chapitre 15). Cela a également pour conséquence annexe de confondre dimension transverse s du détecteur élémentaire et pas p de la matrice, soit : s =p (14.11) De manière à ce que l’échantillonnage du front d’onde soit le plus dense possible, il est de la même manière souhaitable que le pas de la matrice l soit aussi proche que possible du diamètre 2a d’une lentille élémentaire (l ∼ = 2a). Nous avons vu au paragraphe 14.2.2 que la focale f de la lentille joue le rôle d’un bras de levier vis-à-vis de la pente locale de l’Écart aberrant W . Il faut donc prendre garde, au moment de la définition de cette distance focale, à ce que les PSF de chaque lentille ne se recouvrent pas, ce qui impose en pratique de respecter la condition suivante :   

  ∂Wk   ∂Wk  ,  l f. Max  (14.12) ∂x   ∂y  Cette équation tient compte du déplacement du centroïde de la PSF, mais pas de sa forme intrinsèque et notamment de la présence d’anneaux de diffraction dans les deux directions perpendiculaires aux côtés de la lentille carrée (cf. figure 11.3). Cela a conduit les concepteurs de capteurs de type Shack-Hartmann à adopter une géométrie de lentilles dites carrées-tournées, comme représenté à la figure 14.2, et

Figure 14.2 Recouvrement entre PSF de lentilles carrées jointives et agencement à lentilles carrées-tournées permettant de s’en affranchir [© Imagine Optic].

268

14. Optique adaptative

qui permet d’augmenter la densité de l’échantillonnage du front d’onde sans effets néfastes de recouvrement entre PSF. Le dernier point à prendre en compte dans la conception d’un capteur de type ShackHartmann est également lié à la dimension transverse de cette PSF et vise à obtenir un échantillonnage convenable de son lobe central par la matrice de détecteurs CCD. Si n désigne le nombre de pixels choisi pour échantillonner ce lobe central le long de l’une de ses dimensions caractéristiques, on doit donc avoir : np =

λf 2a

(14.13)

On voit qu’interviennent à nouveau dans cette relation le pas du détecteur CCD, la focale de la micro-lentille et son diamètre. La conception d’un capteur de type ShackHartmann vise donc à réaliser le meilleur compromis possible entre les différentes exigences que nous venons de décrire.

14.2.4 Avantages et inconvénients Le principal avantage d’un capteur de front d’onde de type Shack-Hartmann est bien évidemment constitué par l’absence d’onde de référence, ce qui le rend particulièrement bien adapté à la caractérisation de sources lumineuses et lui confère une très bonne insensibilité aux vibrations. Par ailleurs, comme il n’y a aucun déplacement, les bandes passantes accessibles sont élevées et uniquement limitées par la cadence de lecture de la matrice de détecteurs CCD (plusieurs milliers d’images par seconde sont aujourd’hui tout à fait envisageables). Au niveau des inconvénients, la résolution de la mesure d’Écart aberrant est moindre que ce que l’on peut atteindre en mettant en œuvre une mesure interférométrique de cet écart, mais ce constat résulte plus des compromis effectués durant la conception du capteur que d’une caractéristique intrinsèque de la méthode.

14.3 Optique adaptative Nous avons vu aux paragraphes précédents comment parvenir à déterminer de manière expérimentale la fonction Écart aberrant d’un système optique. Comme décrit en détail au chapitre 13, la connaissance de cette fonction W donne immédiatement accès à la réponse percussionnelle et à la PSF du système étudié, ainsi qu’aux fonctions de transfert associées, aussi bien en éclairage cohérent qu’en éclairage incohérent. Si cette fonction W est mesurable et connue, on peut également envisager d’insérer, sur le trajet des ondes lumineuses qui se propagent dans le système optique, un élément actif qui compense en tout point la valeur de cet écart aberrant en introduisant

269

De l’Optique électromagnétique à l’Interférométrie

Figure 14.3 Miroirs déformables (en haut, à actionneurs piézoélectriques ; en bas, bimorphes) [© CILAS].

un retard additionnel qui lui soit égal en valeur absolue et opposé en signe : c’est ce que permet un miroir déformable. Deux modes possibles de réalisation d’un tel composant actif ont fait l’objet d’importants développements au cours de ces dernières années. Il s’agit : • de miroirs à actionneurs piézoélectriques (cf. partie haute de la figure 14.3), qui utilisent la déformation locale d’une fine lame de verre induite par le déplacement de l’extrémité d’une cale piézoélectrique soumise à une tension ajustable, la caractéristique la plus importante étant dans ce cas le nombre d’actionneurs équipant le miroir ; • de miroirs bimorphes (cf. partie basse de la figure 14.3), qui utilisent également l’effet piézoélectrique, mais au sein d’un bilame constitué d’une lame de verre réfléchissante rapportée sur une plaque de céramique piézoélectrique équipée d’un réseau d’électrodes, le plus souvent de structure radiale : l’application d’une tension provoque la déformation locale de la céramique, ce qui induit l’apparition d’une courbure corrélée en face avant de la lame. Le retard local introduit par ces miroirs déformables présente en outre la particularité d’être achromatique, ce qui s’avère particulièrement important pour les applications de type astronomique, où l’utilisation de larges gammes spectrales de fonctionnement est chose courante.

270

14. Optique adaptative

Figure 14.4 Schéma de principe du fonctionnement d’un système d’Optique Adaptative [© LESIA Observatoire de Paris Meudon].

Si ce miroir déformable est inséré en amont du capteur de front d’onde, la qualité image obtenue à la suite de son action pourra être vérifiée à tout instant, ce qui rendra possible la prise en compte d’évolutions rapides de la fonction Écart aberrant . Un système d’Optique adaptative comprend donc, comme schématisé sur la partie gauche de la figure 14.4 : • une étoile suffisamment brillante pour que le rapport signal à bruit obtenu sur le capteur de front d’onde permette une détermination correcte de la valeur instantanée de la fonction Écart aberrant W ; • un miroir déformable ; • une lame séparatrice, assurant le prélèvement d’une partie suffisante du flux pour qu’il puisse être convenablement analysé par le capteur de front d’onde, sans que cela ne nuise à la capacité du télescope à détecter des objets de faible luminosité ; • un système de contrôle, qui récupère les données issues du capteur de front d’onde, en assure le traitement temps réel et actualise la loi de pilotage du miroir déformable, de manière à assurer la meilleure qualité possible au front d’onde corrigé transmis par la lame séparatrice. Les graphes 3D placés en partie droite de la figure 14.4 montrent l’impact de la mise en œuvre d’un système d’optique adaptative sur la PSF d’un télescope (en haut, le système fonctionne en boucle ouverte et, en bas, en boucle fermée). La figure 14.5 illustre de manière plus quantitative ce même effet en montrant comment la réponse percussionnelle d’un télescope (ici le Keck 1), qui se trouve limitée, en l’absence de contre-réaction du système de contrôle (open loop), par le seeing du site (1,4 seconde d’arc à la longueur d’onde de 1,6 μm) est améliorée

271

De l’Optique électromagnétique à l’Interférométrie

Figure 14.5 Amélioration de la réponse percusssionnelle d’un télescope apportée par la mise en service d’un système d’optique adaptative ([© W.M. Keck Observatory].

Figure 14.6 Illustration de l’apport d’un système d’optique adaptative à l’observation astronomique [© ESO - European Southern Observatory].

de manière drastique par la mise en service de cette boucle (AO loop closed ), la largeur totale à mi-hauteur de la réponse percussionnelle étant ramenée à moins de 46 millisecondes d’arc pour une valeur du rapport de Strehl atteignant 0,23. Enfin, la Figure 14.6 présente un résultat obtenu au VLT (Very Large Telescope) équipé du système NAOS (Nasmyth Adaptative Optics System) sur un champ de vue de 20 × 20 secondes d’arc correspondant au centre de l’amas globulaire Omega Centauri. L’image de gauche a été obtenue dans la bande K (c’est-à-dire au voisinage de 2,2 μm), en utilisant une mise en œuvre standard de l’instrument (c’est-à-dire sans système

272

14. Optique adaptative

d’optique adaptative), la largeur à mi-hauteur de la réponse percussionnelle étant ici de l’ordre de 0,6 seconde d’arc. L’image de droite correspond à une observation du même champ, à la même longueur d’onde, mais une fois activé le système NAOS. Malgré le fait que l’étoile guide est assez éloignée du centre du champ (1 minute d’arc), la largeur à mi-hauteur de la réponse percussionnelle de l’instrument est ramenée à 0,1 seconde d’arc, ce qui apporte un gain important en résolution angulaire et rend possible l’observation d’étoiles de magnitude beaucoup plus faible. L’utilisation de systèmes d’optique adaptative n’est pas réservée qu’à la seule astronomie : ainsi, en ophtalmologie, elle permet des observations à haute résolution de la rétine en présence d’aberrations visuelles et de mouvements oculaires.

273

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Photo-détection et bruit Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 15.1 15.2

15.3

15.4 15.5

15.6

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bruit de photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.1 Nombre moyen de photons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.2 Processus de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.3 Fluctuations quantiques du courant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bruit thermique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 Résistance de charge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.2 Bruit Johnson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.3.3 Bruit résultant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bruit intrinsèque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rapport signal à bruit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.5.1 Bruit total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.5.2 Rapport signal à bruit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exemples d’utilisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.6.1 Mesure de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.6.2 Taux d’erreur d’une communication numérique . . . . . . . . . . . . . . . . . . . . . . . .

278 278 278 279 282 285 285 286 287 287 289 289 289 292 292 295

277

De l’Optique électromagnétique à l’Interférométrie

15.1 Introduction L’objectif de ce chapitre 15 est de montrer comment la nature quantique du photon impose des limitations fondamentales à la précision avec laquelle on peut effectuer la détection d’un flux lumineux. Nous présenterons également les limitations additionnelles qui découlent de la présence de fluctuations de courant d’origine thermique aux bornes d’une résistance (bruit Johnson), puis nous donnerons une illustration de la mise en œuvre pratique de ces différentes notions dans les cas particuliers correspondant d’une part à la mesure du déphasage entre deux ondes lumineuses et d’autre part à l’évaluation du taux d’erreur affectant la transmission optique d’une information numérique.

15.2 Bruit de photons 15.2.1 Nombre moyen de photons L’énergie d’une onde lumineuse est transportée sous forme de grains d’énergie, ou quanta, appelés photons. Lorsque cette onde lumineuse est de nature monochromatique, de longueur d’onde λ, l’énergie E associée à un photon unique est définie par la relation : c E = hν = h (15.1) λ où h désigne la constante de Planck (h = 6,62 × 10−34 J.s), ν la fréquence du rayonnement électromagnétique et c la vitesse de la lumière. Si, à titre d’illustration, on choisit 500 nm comme longueur d’onde caractéristique, la fréquence de l’onde électromagnétique est, à cette longueur d’onde, de 600 THz, tandis que l’énergie transportée par un photon est, toujours à cette même longueur d’onde, de 0,4 aJ (4 × 10−19 J). On voit que cette énergie est réellement infime, ce qui signifie que le nombre de photons transportés par un faisceau de lumière, même de faible puissance, comme par exemple 1 mW, sur une durée caractéristique d’une seconde, est réellement gigantesque, puisqu’il dépasse les 2,5 × 1015 . Ce nombre moyen de photons est noté n¯ et défini comme le rapport entre l’énergie totale transportée par le faisceau lumineux et l’énergie associée à un photon unique. Par conséquent, il vient : PT n¯ = (15.2) hν où P désigne la puissance optique du faisceau lumineux considéré et T le temps caractéristique durant lequel on comptabilise les photons reçus.

278

15. Photo-détection et bruit

15.2.2 Processus de Poisson Considérons un détecteur parfait, c’est-à-dire un système fournissant une impulsion de durée infiniment brève (un clic) à chaque fois qu’il reçoit un photon, et ce, quel que soit l’intervalle de temps qui sépare les arrivées de 2 photons consécutifs. Représentons sur l’axe des temps l’arrivée d’un photon élémentaire par une barre verticale (cf. figure 15.1) et étudions le nombre de photons n arrivant sur ce détecteur pendant des intervalles de temps consécutifs dont les durées élémentaires sont identiques et égales à T .

0

T

2T

3T

4T

5T

6T

t

Figure 15.1 Chronogramme temporel représentant l’arrivée aléatoire de photons individuels sur un détecteur parfait.

Cette quantité n constitue une variable aléatoire, dont la probabilité d’occurrence p(n) est décrite par une loi de Poisson, c’est-à-dire par une relation du type : p(n) = e −n¯

n¯ n n!

(15.3)

où n¯ désigne, comme précédemment, le nombre moyen de photons reçus par le détecteur durant l’intervalle de temps τ . Ce type de loi est bien adapté à la description de situations mettant en jeu l’occurrence d’événements tous indépendants, comme le nombre moyen de personnes qui se trouvent à l’intérieur d’une file d’attente ou, justement, l’émission de photons par un grand nombre d’atomes. Une fois ces définitions posées, il nous est possible de vérifier que la relation (15.3) respecte bien la condition de norme unitaire caractéristique d’une loi de probabilité, puis de calculer les moments d’ordre 1 et d’ordre 2 de la variable n. Il vient : • condition de norme unitaire ∞  n=0

p(n) = e −n¯

∞  n¯ n n=0

• moment d’ordre 1 n =

n!

∞ 

= e −n¯ e n¯ = 1

np(n)

(15.4)

(15.5)

n=0

279

De l’Optique électromagnétique à l’Interférométrie

Pour évaluer l’expression de la somme qui apparaît dans la relation (15.5), le plus simple consiste à isoler le cas particulier correspondant à n = 0, soit : n = [np(n)]n=0 +

∞ 

np(n) = 0 + e

−n¯

n=1

∞  n=1

n¯ n (n − 1)!

(15.6)

puis à effectuer le changement de variable n = 1 + k, soit : n = e

−n¯

∞  n¯ (1+k) k=0

= ne ¯

k!

∞  n¯ k

−n¯

k=0

k!

= n¯

(15.7)

Ce résultat était évidemment attendu, puisque le moment d’ordre 1 d’une variable aléatoire n’est rien d’autre que sa moyenne. • Moment d’ordre 2 2

n  =

∞ 

n 2 p(n)

(15.8)

n=0

La démarche est identique à celle utilisée pour le moment d’ordre 1 (traitement séparé du cas n = 0, simplification, puis changement de variable). Il vient : n 2  = [n 2 p(n)]n=0 + e −n¯

∞  n=1

=e

−n¯

∞ 

(1 + k)

n¯ (1+k)

k=0

= n(1 ¯ + n) ¯ = n¯ + n¯

k!

n

n¯ n (n − 1)!

= ne ¯

−n¯

2

∞  k=0

(1 + k)

n¯ k k! (15.9)

Nous pouvons en déduire immédiatement l’expression de la variance σn2 du nombre n de photons reçus par le photodétecteur, soit : σn2 = n 2  − n2 = n¯

(15.10)

Dans un processus de Poisson, la variance est donc égale à la moyenne. Ce résultat sera d’une grande importance dans l’évaluation du rapport signal à bruit qui caractérise une configuration de détection d’un flux lumineux. Nous avons représenté à la figure 15.2 l’allure de cette loi de Poisson pour quelques valeurs particulières de la moyenne n. ¯ Hormis le cas très particulier correspondant à n¯ = 1, les autres courbes ont une allure qui n’est pas sans rappeler celle d’une gaussienne. Si l’on trace, sur le même graphe (cf. figure 15.3), les lois de Poisson correspondant à ces valeurs de moyenne (soit 10 et 35), et des lois normales caractérisées par les mêmes valeurs de moyenne

280

15. Photo-détection et bruit

Poisson = 1

Poisson = 10

Poisson = 35

0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0

5

10

15

20

25

30

35

40

45

50

Figure 15.2 Lois de Poisson pour différentes valeurs de la moyenne n¯ [carrés, n¯ = 1 - cercles, n¯ = 10 - triangles, n¯ = 35]. Poisson = 10

Poisson = 35

Gaussienne = 10

Gaussienne = 35

0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 0

5

10

15

20

25

30

35

40

45

50

Figure 15.3 Comparaison entre loi de Poisson et loi normale pour deux valeurs de la moyenne n¯ [en noir, n¯ = 10 - en grisé, n¯ = 35].

et de variance, c’est-à-dire les courbes définies par la relation générale suivante : (n − n) ¯ 2 (n − n) ¯ 2 − 1 2σn2 = √ 1 e 2n¯ p(n) = √ e σn 2π 2π n¯ −

(15.11)

on constate que l’accord est excellent.

281

De l’Optique électromagnétique à l’Interférométrie

Cela montre que, dès que le nombre moyen de photons détectés excède une dizaine, alors la loi de Poisson décrivant la variable aléatoire n pourra être assimilée à une loi normale, d’un usage beaucoup plus simple dès qu’il s’agira de représenter les fluctuations de variables continues, comme le courant ou la tension. En outre, le recours à une loi normale est très utile dès que nous aurons à tenir compte de la présence de plusieurs sources de bruit indépendantes, car un théorème de physique statistique nous indique que, dans ce cas, le processus aléatoire résultant de la combinaison de ces différentes sources de bruit est lui aussi décrit par une loi normale dont la variance est égale à la somme des variances des processus élémentaires.

15.2.3 Fluctuations quantiques du courant On considère un flux lumineux de puissance P éclairant un détecteur supposé parfait. Nous venons de voir que ce flux lumineux doit être décrit comme l’arrivée aléatoire sur ce détecteur d’une pluralité de photons d’énergie E . Pour que l’un quelconque de ces photons puisse conduire à la création d’un électron libre dans le volume du détecteur, il est nécessaire que son énergie E excède un certain seuil Es , caractéristique du matériau et que l’on désigne sous l’appellation de seuil photoélectrique. C’est l’existence de ce seuil photoélectrique qui a conduit Einstein en 1905 à utiliser comme une entité réifiée, et non plus abstraite, la notion de photon, que Planck avait introduite, plutôt comme un artifice de calcul, et dans le seul but de parvenir à une description mathématiquement satisfaisante du rayonnement du corps noir. Nous supposerons désormais que l’énergie des photons incidents dépasse cette valeur de seuil, et que leur absorption par le détecteur conduit à la création en son sein d’électrons libres, en nombre théoriquement identique à celui des photons absorbés : théoriquement seulement, car il existe un certain nombre de mécanismes parasites qui vont offrir des usages différents à l’énergie incidente et diminuer ainsi l’efficacité de cette conversion optique/électrique. Pour quantifier cette efficacité, on introduit donc un paramètre noté η et appelé justement efficacité quantique, et qui n’est rien d’autre que le rapport entre le nombre moyen m¯ d’électrons générés par le flux lumineux incident et le nombre moyen n¯ de photons dont ce flux incident est porteur, soit : η=

m ¯ n¯

(15.12)

Si l’on isole maintenant, par la pensée, un intervalle de temps T particulier correspondant au temps d’intégration du détecteur, on peut compter le nombre m d’électrons s’écoulant, durant cet intervalle de temps T , par le fil de liaison représenté à la figure 15.4, et recommencer cette mesure autant de fois qu’on le

282

15. Photo-détection et bruit

P n = PT hν

I

I =

me T

Figure 15.4 Schéma de principe du fonctionnement d’un détecteur parfait.

souhaite. Le résultat obtenu va à nouveau être de nature aléatoire et décrit par une loi de probabilité p(m) similaire à celle que nous avons introduite dans le cas des photons, soit : m¯ m p(m) = e −m¯ avec m ¯ = ηn¯ (15.13) m! Le courant instantané i qui circule dans le fil de liaison est évidemment donné par le rapport entre la charge totale qui y transite, c’est-à-dire me (e désigne la charge de l’électron, soit 1,6 × 10−19 C ), et le temps T durant laquelle cette charge est mesurée, soit : me i= (15.14) T Ce courant instantané va donc présenter des fluctuations, puisque sa valeur est directement proportionnelle au nombre m de photo-électrons créés par l’absorption du flux lumineux P par le détecteur. Deux relations importantes en découlent immédiatement : – l’une relative à la valeur moyenne I du courant délivré par le détecteur e e PT e ηe = ηn¯ = η = P =SP T T hν T hν ηe ηe = λ avec S = hν hc

I = m¯

(15.15)

où S désigne la sensibilité du photodétecteur, exprimée en A/W ; – l’autre relative à la variance σi2 des fluctuations de courant σi2 = i 2  − i 2 =

 e2  2 e e e2 2 e 2  − m σm = m = m¯ = I (15.16) 2 2 T T T T T

La variance du courant instantané i délivré par le détecteur est proportionnelle à la valeur moyenne I de ce courant et inversement proportionnelle au temps d’intégration T du détecteur. Ce résultat, très simple dans sa formulation, est des plus importants dans ses conséquences, car il met en évidence une limitation fondamentale (c’est-à-dire qui ne peut

283

De l’Optique électromagnétique à l’Interférométrie

être amoindrie par une meilleure qualité de réalisation ou contournée par une mise en œuvre technologique différente) avec laquelle la mesure d’un flux lumineux peut être réalisée : on désigne cette limitation fondamentale sous les termes génériques de bruit quantique, de bruit de photons ou de bruit de grenaille (shot noise en anglais). Les résultats importants que nous venons d’établir appellent toutefois quelques commentaires additionnels : 1. La sensibilité S d’un photodétecteur, définie par la relation (15.15), est donc une quantité qui dépend par principe de la longueur d’onde λ du rayonnement lumineux considéré. Mais il ne faut pas perdre de vue que l’efficacité quantique η est également une fonction de cette longueur d’onde, ne serait-ce que comme traduction mathématique directe de l’existence de l’effet photoélectrique. Nous avons représenté de manière schématique sur la figure 15.5 la dépendance spectrale de l’efficacité quantique η(λ) d’un photodétecteur au silicium et celle de la sensibilité S (λ) qui en découle. 1 0,9

Efficacité quantique

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 300

400

500

600

700

800

900

1000

1100

900

1000

1100

Longueur d'onde (nm) 0,6

Sensibilité (A/W)

0,5 0,4 0,3 0,2 0,1 0 300

400

500

600

700

800

Longueur d'onde (nm)

Figure 15.5 Dépendances spectrales de l’efficacité quantique et de la sensibilité d’un photodétecteur au silicium.

284

15. Photo-détection et bruit

Dans cette représentation schématique, l’efficacité quantique η(λ) (partie haute de la figure 15.5) reste constante et égale à 80 % entre 400 et 850 nm. Au-delà de 850 nm, cette efficacité quantique décroît rapidement pour s’annuler vers 1 100 nm (c’est un mécanisme de type seuil photoélectrique qui est responsable de cette évolution), et un comportement similaire est observé en deçà de 400 nm (mais dans ce cas, le mécanisme dominant est une diminution de la profondeur de pénétration des photons à l’intérieur du matériau sensible). En introduisant ce type de dépendance spectrale dans l’expression de la sensibilité S (λ), on obtient la courbe basse de la figure 15.5, où l’on constate, comme attendu, une croissance linéaire de cette caractéristique entre 400 et 850 nm. 2. Nous avions indiqué, en introduction du paragraphe 15.2.2, que le détecteur utilisé était parfait, c’est-à-dire qu’il présentait une réponse temporelle unitaire sur la totalité de l’intervalle de temps T . En conséquence, en accord avec les différentes notions rappelées aux paragraphes A.2.1 et A.2.5.1, la fonction de transfert fréquentielle S (f ) de ce filtre est égale au module au carré de la transformée de Fourier de sa réponse temporelle, qui est ici une fonction Porte de durée T . En conséquence, nous pouvons écrire : S (f ) = T 2 Sinc2 (πfT )

(15.17)

Si l’on définit la bande passante B comme la largeur à mi-hauteur de cette fonction de transfert fréquentielle, alors on peut écrire : B=

1 2T

(15.18)

Il est dans ces conditions possible de modifier l’écriture de la relation (15.16) en remplaçant 1/T par 2B, soit : σi2 = 2eIB

(15.19)

qui constitue la forme la plus courante de la variance des fluctuations de courant liées au bruit de photons.

15.3 Bruit thermique 15.3.1 Résistance de charge Si l’on souhaite mesurer le courant instantané i délivré par le photodétecteur en présence d’un flux lumineux monochromatique de puissance P , il convient de réaliser une transformation en tension de ce courant, ce dont on peut rendre compte en introduisant une résistance de charge R en série avec le photodétecteur et en mesurant la valeur instantanée v de la tension aux bornes de cette résistance, comme schématisé à la figure 15.6.

285

De l’Optique électromagnétique à l’Interférométrie

P

v = Ri i

R

v

Figure 15.6 Utilisation d’une résistance de charge R pour transformer en une tension v le courant i délivré par le photodétecteur.

La valeur moyenne V de la tension est naturellement égale au produit de la résistance de charge R par la valeur moyenne I du courant délivré par le photodétecteur V = R I = R SP

(15.20)

tandis que la variance σv2 des fluctuations de cette tension est définie par : σv2 = v 2  − v2 = R 2 σi2 = 2eR 2 IB = 2eRVB

(15.21)

La partie droite de la figure 15.6 représente de manière schématique la trace enregistrée par un oscilloscope lorsqu’on le raccorde à la sortie de notre photodétecteur : la position verticale de la trace renseigne sur la puissance du flux lumineux incident, tandis que les fluctuations temporelles de la tension mesurée sont une illustration directe du bruit de photons qui accompagne sa détection. Or, si l’on interrompt le flux lumineux P , par exemple en interposant un cache opaque entre la source de lumière et le photodétecteur, on constate que la tension mesurée s’annule en moyenne, mais que les fluctuations demeurent présentes, alors qu’elles devraient disparaître, puisque la variance associée à un bruit de photons est de même valeur que la moyenne du signal. C’est donc que l’origine de ce bruit est différente : elle est en fait de nature thermique.

15.3.2 Bruit Johnson Le bruit Johnson, également appelé bruit thermique ou bruit de résistance, est le bruit généré par l’agitation thermique des électrons dans une résistance à l’équilibre thermique. Il a été expérimentalement mis en évidence pour la première fois par Johnson en 1927 et expliqué de manière théorique par Nyquist en 1928. La définition théorique des caractéristiques de ce bruit relève de la physique statistique et dépasse donc le cadre de cet ouvrage. Nous nous limiterons ici à présenter les

286

15. Photo-détection et bruit

principales conclusions de ces études théoriques : • la tension instantanée v mesurée aux bornes d’une résistance R en équilibre thermique à la température θ est une variable aléatoire de moyenne nulle, décrite par une loi normale dont la variance σv2 est définie par : σv2 = v 2  = 4kθR B

(15.22)

où k désigne la constante de Boltzmann (k = 1,38 × 10−23 J/K) ; • le spectre de ces fluctuations est indépendant de la fréquence : il s’agit donc d’un bruit blanc. Ces fluctuations de tension peuvent être aisément converties en fluctuations de courant dont la variance a pour expression : σi2 = i 2  =

v 2  4kθ = B 2 R R

(15.23)

15.3.3 Bruit résultant Si nous revenons maintenant à la configuration dans laquelle le photodétecteur est éclairé par un flux lumineux monochromatique de puissance P , alors le courant moyen délivré par ce photodétecteur sera, comme précédemment défini par la relation : I = SP (15.24) tandis que les fluctuations de ce courant seront caractérisées par une variance résultante égale à la somme des variances des processus aléatoires élémentaires, soit : σi2 = 2eI B +

4kθ B R

(15.25)

15.4 Bruit intrinsèque Nous avons présenté dans les paragraphes qui précèdent les origines des bruits qui sont susceptibles d’affecter la détection d’un flux lumineux, mais nous nous sommes toujours placés dans le cas relativement restrictif d’un détecteur parfait. Dans la situation plus réaliste qui correspond à celle d’un détecteur imparfait, nous devons tenir compte de l’existence de deux termes perturbateurs additionnels, que sont le courant d’obscurité et la résistance intrinsèque de ce photodétecteur. Le courant d’obscurité trouve son origine dans la présence de charges libres à l’intérieur du volume du matériau sensible, charges libres dont le nombre est lié à la qualité de fabrication du photodétecteur et à la densité de défauts structurels qui en résulte. La valeur moyenne de ce courant d’obscurité augmente par ailleurs avec la température (une règle facile à retenir précise qu’elle double tous les 7 ˚C dans le

287

De l’Optique électromagnétique à l’Interférométrie

cas d’un détecteur silicium). Enfin, la quantification de la charge électrique a, sur ce courant d’obscurité, les mêmes conséquences que celles que nous avons décrites dans le cas du courant photo-induit, à savoir qu’il s’agit d’une variable aléatoire dont la variance est directement proportionnelle à la moyenne et à la bande passante de mesure, soit : σi2 = 2eId B (15.26) Id désignant ici la valeur moyenne du courant d’obscurité (l’indice d fait référence à la première lettre du mot anglais dark). La résistance intrinsèque, ou résistance de shunt, r du photodétecteur est le siège d’une agitation thermique analogue à celle présentée au paragraphe 15.3.2, ce qui se traduit au final par une fluctuation apparente de courant dont la variance est définie par : 4kθ σi2 = B (15.27) r Le bruit intrinsèque d’un photodétecteur résulte de la combinaison de ces deux effets parasites et est donc caractérisé par une variance en courant égale à la somme des variances élémentaires, soit : σi2 = 2eId B +

4kθ B r

(15.28)

Les fabricants de photodétecteurs ont l’habitude de quantifier la performance en bruit de leurs produits à l’aide d’un paramètre synthétique, directement relié à cette variance et appelé Noise Equivalent Power . La signification de ce paramètre, usuellement désigné par son seul acronyme, à savoir NEP, est la suivante : en l’absence de tout flux lumineux et de toute résistance de charge, le courant instantané délivré par le photodétecteur présente donc des fluctuations intrinsèques liées à la valeur de son courant d’obscurité et à celle de sa résistance de shunt. Imaginons maintenant par la pensée que ce même photodétecteur soit éclairé par un flux lumineux fluctuant, de moyenne P et de variance σP2 . En l’absence de tout autre source de bruit, ce photodétecteur délivrerait donc un courant de valeur moyenne I = SP et de variance σi2 = S 2 σP2 . Le NEP d’un photodétecteur n’est rien d’autre que l’écart type des fluctuations de puissance qui conduiraient au même niveau de fluctuations de courant que celles associées à son courant d’obscurité et à sa résistance intrinsèque. En conséquence, ce paramètre est défini par la seule égalité : S 2 NEP2 B = σi2 = 2eId B + soit encore : √ et s’exprime en W/ Hz.

288

4kθ B r

 4kθ 1 2eId + NEP = S r

(15.29)

(15.30)

15. Photo-détection et bruit

15.5 Rapport signal à bruit 15.5.1 Bruit total En regroupant les résultats établis aux paragraphes 15.2, 15.3 et 15.4, nous pouvons décrire le fonctionnement du photodétecteur à l’aide de deux équations fondamentales : • la première définit la valeur moyenne du courant comme la somme du courant photo-induit et du courant d’obscurité, soit : IT = I + Id = SP + Id

(15.31)

• la seconde quantifie la variance totale des fluctuations de courant comme la somme de celles associées au bruit de photons, au bruit thermique de la résistance de charge et au bruit intrinsèque, soit :   4kθ 4kθ 2 σi = 2eIB + B + 2eId B + B (15.32) R r

En introduisant une résistance totale RT résultant de la mise en parallèle des deux résistances caractéristiques R et r , la relation (15.34) peut être mise sous la forme équiva-lente suivante : σi2 = 2eIT B +

4kθ B RT

avec

1 1 1 = + RT R r

(15.33)

Cette forme de présentation ne permet toutefois pas d’isoler de manière claire les différentes contributions de bruit, et on lui préfèrera donc la formulation alternative suivante : 4kθ (15.34) B + S 2 NEP2 B avec I = SP σi2 = 2eIB + R Le premier terme quantifie le bruit de photons, le deuxième le bruit thermique et le troisième le bruit intrinsèque, grâce à la donnée du seul NEP, que l’on trouve habituellement dans les datasheets des fabricants de détecteurs.

15.5.2 Rapport signal à bruit Le rapport signal à bruit ou SNR (Signal to Noise Ratio) est défini comme le rapport entre la valeur moyenne du signal (ici, le courant photo-induit I ) et l’écart type σi

289

De l’Optique électromagnétique à l’Interférométrie

des fluctuations du courant total détecté, soit : SNR =

I =  σi

I

 4kθ 2 2 2eI + + S NEP B R

(15.35)

Lorsque le flux lumineux détecté P est suffisamment important pour que la valeur moyenne du courant I = SP associé respecte l’inégalité 2eI 

4kθ + S 2 NEP2 R

(15.36)

alors la contribution du bruit de photons à la variance du courant est dominante et l’on peut écrire en première approximation :   I SP I = = (15.37) SNR  √ 2eB 2eB 2eIB ce qui montre que ce rapport signal à bruit est proportionnel à la racine carrée du flux lumineux P . À l’inverse, lorsque le flux lumineux détecté est suffisamment faible pour que la valeur moyenne du courant I respecte l’inégalité 2eI 

4kθ + S 2 NEP2 R

(15.38)

alors la contribution du bruit de photons à la variance du courant est négligeable et l’on peut écrire en première approximation : SNR  

I



4kθ + S 2 NEP2 B R

= 

SP

 4kθ 2 2 + S NEP B R

(15.39)

ce qui montre que ce rapport signal à bruit est alors directement proportionnel au flux lumineux P . Si l’on représente maintenant, dans un repère log-log, les variations de ce rapport signal à bruit en fonction de la puissance lumineuse détectée P (figure 15.7), on voit clairement apparaître les deux régimes de fonctionnement précédemment définis, le premier, en noir, étant caractérisé par une pente 1/2 et le second, en grisé, étant associé à une pente 1 [pour cette représentation, nous avons utilisé les données numériques √ suivantes : θ = 20 ˚C = 293 K ; R = 1 M ; S = 0,55 A/W ; NEP = 1 pW/ Hz ].

290

15. Photo-détection et bruit

pente = 1

pente = 1/2

1,E+09 1,E+08

Rapport Signal / Bruit

1,E+07 1,E+06 1,E+05 1,E+04 1,E+03 1,E+02 1,E+01 Régime de bruit quantique Régime de bruit thermique 1,E+00 1,E-12 1,E-11 1,E-10 1,E-09 1,E-08 1,E-07 1,E-06 1,E-05 1,E-04 1,E-03 1,E-02

Puissance (W)

Figure 15.7 Variation du rapport signal à bruit SNR en fonction de la puissance lumineuse détectée P .

On a coutume de désigner la partie noire de la courbe sous l’appellation de régime de bruit quantique et la partie grisée de cette même courbe sous l’appellation de régime de bruit thermique. Autant la première appellation est conforme à la réalité des hypothèses qui la fondent, autant la deuxième est quelque peu abusive, puisque le bruit dominant comprend à la fois les contributions thermique et intrinsèque. Cet abus de langage trouve en fait son origine dans la structure même du bruit intrinsèque, qui associe un bruit purement thermique prenant naissance dans la résistance de shunt du photodétecteur à un bruit quantique associé au courant d’obscurité de ce même photodétecteur, mais dont la valeur est fortement dépendante de la température. La ligne verticale tiretée apparaissant à la figure 15.7 positionne la puissance particulière Pc pour laquelle on passe d’un régime de bruit thermique à un régime de bruit quantique. Cette valeur caractéristique est tout simplement celle pour laquelle les deux contributions s’équilibrent, soit :   4kθ 1 4kθ 2 2 2 2 2eSPc = (15.40) ⇒ Pc = + S NEP + S NEP R 2eS R ce qui, avec les valeurs numériques précédemment définies, conduit à une puissance critique d’environ 2 μW.

291

De l’Optique électromagnétique à l’Interférométrie

15.6 Exemples d’utilisation 15.6.1 Mesure de phase Considérons un interféromètre à deux ondes de type Michelson, qui délivre, sur sa voie de sortie, un éclairement E (φ) dont on supposera qu’il est décrit par la relation suivante (visibilité du phénomène d’interférences prise égale à 1) : E = E0 {1 + cos φ}

(15.41)

où φ désigne ici le déphasage entre les deux ondes. Supposons que la surface A du détecteur soit plus petite que les dimensions transverses du faisceau fourni par l’interféromètre. La valeur moyenne du courant photo-induit délivré par lc détecteur a alors pour expression : I (φ) = SAE0 {1 + cos φ} = I0 {1 + cos φ}

(15.42)

Les questions auxquelles on souhaite apporter une réponse sont les suivantes : quelle est la résolution ultime que l’on peut espérer atteindre dans la mesure du déphasage φ ? Et cette performance est-elle fonction de la valeur de la phase elle-même ? Le courant instantané i délivré par le photodétecteur présente des fluctuations dont l’écart type σi est en toute généralité défini par la relation :  √ 4kθ (15.43) σi = 2eI (ϕ) + B + S 2 NEP2 B R où ϕ désigne la valeur instantanée de la phase. Toute variation de courant δI peut être interprétée comme la conséquence d’une variation de phase δφ, la relation entre ces deux quantités étant obtenue en différentiant membre à membre l’expression (15.42), soit : δI =

∂I δφ = −I0 sin φ δφ ∂φ

(15.44)

En conséquence, l’écart-type des fluctuations de courant σi s’exprime ici à partir de l’écart-type des fluctuations apparentes de phase σφ qui y sont associées par une relation de même nature, soit : ∂I σi = σφ = I0 |sin φ| σφ (15.45) ∂φ

292

15. Photo-détection et bruit

En regroupant les relations (15.43) et (15.45), nous pouvons écrire :  1 4kθ σφ 2eI0 (1 + cos φ) + B + S 2 NEP2 √ = |sin I R φ| B 0

(15.46)

√ ce qui montre que la résolution en phase, exprimée en rads/ Hz, dépend d’un nombre important de paramètres, tels que le courant moyen I0 , le NEP du photodétecteur ou la résistance de charge utilisée, mais également de la valeur de la phase elle-même. Supposons dans un premier temps que le fonctionnement du détecteur corresponde à un régime de limitation par le bruit thermique, c’est-à-dire que la contribution du bruit de photons soit négligeable. La relation de définition (15.46) prend alors la forme simplifiée suivante :  σφ 1 4kθ √  (15.47) B + S 2 NEP2 I0 |sin φ| R B La résolution accessible sur cette mesure de phase est optimale pour des valeurs de la phase qui maximisent la valeur absolue de la fonction sin φ, soit : φ=

π [π] 2

(15.48)

On traduit ces résultats en indiquant que l’interféromètre doit, dans la mesure du possible, être utilisé en quadrature, et que sa mise en œuvre au voisinage de la frange brillante (φ = 0) ou de la frange noire (φ = π) est à prohiber (le bruit apparent de phase diverge pour ces deux points particuliers de fonctionnement). Supposons maintenant que la détection se trouve en régime de limitation par le bruit quantique, c’est-à-dire que les contributions du bruit thermique et du bruit intrinsèque soient négligeables. Alors, la relation de définition (15.46) prend la nouvelle forme simplifiée suivante :

σφ 1 √  2eI0 (1 + cos φ) I0 |sin φ| B   cos2 φ2 e e 1 = = φ φ I0 sin cos I0 sin φ 2 2 2

(15.49)

La résolution accessible sur cette mesure de phase est optimale pour des valeurs de la phase qui maximisent la valeur absolue de la fonction sin φ2 , soit : π φ = [π] 2 2



φ = π [2π]

(15.50)

293

De l’Optique électromagnétique à l’Interférométrie

Bruit de Phase (radians/Hz1/2)

1,E-01 1,E-02 1,E-03

1,E-09 1,E-08 1,E-07 1,E-06 1,E-05 1,E-04 1,E-03

1,E-04 1,E-05 1,E-06 1,E-07 1,E-08 0

0,25

0,5

0,75

1

ϕ/π

Figure 15.8 Variation du bruit de phase en fonction de la valeur de la phase pour différents niveaux de puissance détectée.

Le résultat que nous venons d’établir semble indiquer que l’interféromètre doit, dans ce cas, être utilisé sur la frange noire. Ce résultat n’est toutefois pas compatible avec notre hypothèse initiale, puisque cette frange noire correspond à une valeur nulle du courant photo-induit, ce qui exclut d’office un régime de fonctionnement du type limitation par le bruit quantique, associé à la détection de forts flux. En fait, nous devons en passer par la prise en compte des différents termes de bruit dans la relation (15.46), sans y appliquer d’approximation ou de simplification. Les courbes regroupées√à la figure 15.8 présentent dans un repère semi-log, la variation de la quantité σφ / B en fonction de la phase réduite φ/π , pour différentes valeurs de la puissance moyenne P0 = I0 /S détectée. Lorsque la puissance détectée est faible (par exemple 1 nW, courbe grisée et ombrée située tout en haut), le bruit thermique est dominant et la résolution en phase est optimale quand, comme attendu, l’interféromètre se trouve en quadrature (φ/π √ = 0,5) : l’écart type des fluctuations de phase est alors de l’ordre du millirad/ Hz, tandis que ce paramètre diverge au voisinage de la frange noire (φ/π = 1) et de la frange brillante (φ/π = 0). Lorsque la puissance détectée augmente d’un facteur 10, la courbe décrivant les variations du bruit de phase en fonction de la phase réduite se décale d’une décade, de manière inversement proportionnelle à l’augmentation de puissance. Ce comportement se répète à l’identique jusqu’à ce que la puissance détectée atteigne typiquement 1 μW (courbe ombrée à marqueurs ronds grisés), valeur dont nous avons montré qu’elle était proche de la transition entre régime de bruit thermique et régime de bruit quantique. Lorsque la puissance détectée augmente encore, la contribution du bruit de photons ne peut plus être négligée, de sorte que le gain en résolution n’est plus proportionnel à cette augmentation de puissance. En outre, la valeur de phase pour laquelle la

294

15. Photo-détection et bruit

résolution est optimale se décale progressivement de la quadrature vers la frange noire, ce qui est finalement assez proche de la conclusion préliminaire, quoique erronée, que nous avions tirée de l’analyse du régime de limitation par le bruit quantique.

15.6.2 Taux d’erreur d’une communication numérique Le taux d’erreur ou BER (Bit Error Rate ) d’une communication numérique est défini comme le rapport entre le nombre de bits incorrectement détectés et le nombre total de bits reçus. Si l’on s’intéresse à des messages numériques comportant un grand nombre de bits (typiquement plusieurs millions), il est possible de faire une hypothèse de répartition équilibrée entre bits 0 et bits 1, ce qui permet d’exprimer le taux d’erreur sous la forme suivante : 1 1 BER = p1/0 + p0/1 (15.51) 2 2 où p1/0 désigne la probabilité de détecter un bit 1 alors que c’est un bit 0 qui a été émis et p0/1 la probabilité symétrique de détecter un bit 0 alors que c’est un bit 1 qui a été transmis. On supposera que la loi de probabilité décrivant les fluctuations du courant i délivré par le photodétecteur correspond à une loi normale, aussi bien dans le cas de la transmission d’un bit 0 que dans celui correspondant à la transmission d’un bit 1. On désignera par I0 (respectivement I1 ) la valeur moyenne du courant délivré par le photodétecteur dans le cas correspondant à la réception d’un bit 0 (respectivement 1). Dans ces conditions, nous pouvons écrire : p0 (i ) =

1 √

σ0 2π

e



(i −I0 )2 2σ02

et p1 (i ) =

− 1 √ e σ1 2π

(i −I1 )2 2σ12

(15.52)

Nous avons représenté à la figure 15.9 les variations de ces deux lois de probabilité en fonction de la valeur du courant instantané i . Pour réaliser la détection du message numérique, on commence par effectuer une récupération d’horloge de manière à pouvoir synchroniser le temps d’intégration du détecteur sur la période associée à la transmission de chaque symbole (nous ne décrirons pas ici la méthode qui est utilisée pour le faire), puis on compare la valeur instantanée du courant détecté pendant un intervalle de temps T à un courant de seuil désigné par Ith (l’indice th correspondant au début du mot anglais threshold ). De manière à rendre plus aisée la visualisation des taux d’erreur que nous allons maintenant calculer, nous avons représenté à la figure 15.10 les lois de probabilité associées à la détection de chaque symbole en unités semi-logarithmiques et fait figurer, comme précédemment, la valeur du courant de seuil Ith .

295

De l’Optique électromagnétique à l’Interférométrie

p0(i)

0,0

0,1

0,2

I

0,3

0,4

0,5

0,6

p1(i)

th

0,7

0,8

0,9

1,0

1,1

1,2

1,3

1,4

i (μA)

Figure 15.9 Lois normales associées à la transmission des bits 0 et 1 (en noir p0 (i ), en grisé continu p1 (i ), en en grisé tireté Ith ).

Cette représentation semi-logarithmique permet de bien se rendre compte qu’il existe, par exemple, une probabilité non nulle de détecter un bit 1 (courant i supérieur au seuil Ith ) alors que c’est un bit 0 qui a été émis. L’expression mathématique qui décrit cette probabilité d’erreur est la suivante : p1/0

+∞ = p0 (i ) di = Ith

1 √

σ0 2π

+∞ (i −I0 )2 − 2 e 2σ0 di

(15.53)

Ith

Il est utile à ce niveau d’introduire les deux fonctions Erreur (Erf ) et Erreur complémentaire (Erfc) définies par : 2 Erf(x ) = √ π

x

e −u du 2

et Erfc(x ) = 1 − Erf(x )

(15.54)

0

On notera que Erf(∞) = 1, de sorte que l’on pourra exprimer la fonction Erfc(x ) sous la forme intégrale suivante : 2 Erfc(x ) = √ π



e −u du 2

(15.55)

x

Si nous revenons maintenant à la relation (15.53), et si nous effectuons le changement de variable : √ i − I0 i →u= √ ⇒ di = 2σ0 du (15.56) 2σ0

296

15. Photo-détection et bruit

1,E+10 1,E+00 1,E-10 1,E-20 1,E-30 1,E-40 p0(i)

1,E-50 I

p1(i)

1,E-60

th

1,E-70 1,E-80

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1,0

1,1

1,2

1,3

1,4

i (μA)

Figure 15.10 Lois de probabilité associées à la transmission des bits 0 et 1 (unités logarithmiques en noir p0 (i ), en grisé continu p1 (i ), en grisé tireté Ith ).

cette relation prend la forme : p1/0

1 =√ π

+∞ e

−u 2

Ith −I0 √ 2σ0

  1 Ith − I0 du = Erfc √ 2 2σ0

(15.57)

Si nous adoptons la même démarche pour évaluer la probabilité de détecter un bit 0 alors que c’est un bit 1 qui a été émis, nous obtenons de la même manière : p0/1

1 = √ π

+∞ e I1 −Ith √ 2σ1

−v 2

  1 I1 − Ith dv = Erfc √ 2 2σ1

(15.58)

En reportant les résultats obtenus aux relations (15.57) et (15.58) dans l’expression (15.51) permettant de calculer le BER, il vient :     1 1 Ith − I0 I1 − Ith BER = Erfc √ + Erfc √ (15.59) 4 4 2σ0 2σ1 Le taux d’erreur est donc fonction du choix du courant de seuil Ith . Il suffit de réaliser une dérivation partielle de l’expression du BER par rapport à ce courant de seuil et

297

De l’Optique électromagnétique à l’Interférométrie

d’annuler cette dérivée pour déduire la valeur optimale de Ith , soit : (I −I )2

− th 20 − 1 1 ∂BER 2σ0 =0=− √ e + √ e ∂Ith 2 2πσ0 2 2πσ1 1 1 = − p0 (Ith ) + p1 (Ith ) 2 2



(I1 −Ith )2 2σ12

(15.60)

p0 (Ith ) = p1 (Ith )

Le seuil optimal de détection correspond donc à la valeur du courant où se croisent les deux lois normales respectivement associées à la détection du bit 0 et à celle du bit 1. Si l’on remarque que le comportement de ces lois de probabilité est majoritairement dicté par la partie exponentielle de leur formulation, l’égalité entre ces deux lois peut être approximée par celle des arguments de ces exponentielles, soit : I1 − Ith Ith − I0 √ = √ σ0 2 σ1 2

(15.61)

On en déduit aussitôt l’expression de la valeur optimale du seuil en courant : Ith =

σ 0 I1 + σ 1 I0 σ1 + σ0

(15.62)

Pour cette valeur particulière du courant de seuil, les deux arguments des exponentielles sont identiques, la valeur commune étant définie par la relation : Q =

I1 − I0 σ1 + σ0

(15.63)

la quantité Q étant habituellement appelée rapport signal à bruit de la communication numérique. L’expression du taux d’erreur de bits prend alors la forme finale suivante :   1 Q BER = Erfc √ (15.64) 2 2 Comme ces taux d’erreur sont la plupart du temps très faibles, on peut remplacer la fonction Erreur complémentaire par sa forme asymptotique, à savoir : e −x Erfc(x ) ∼ √ x π 2

pour x > 3

(15.65)

Pour garantir un taux d’erreur inférieur à 10−6 , il suffit que le rapport signal à bruit Q excède 4,75.

298

15. Photo-détection et bruit

Considérons maintenant le cas particulier pour lequel le codage de l’information numérique est du type NRZ (Non Return to Zero) et la puissance émise dans le cas de la transmission d’un bit 0 égale à zéro. Dans ces conditions : • dans le cas de la transmission du bit 0 I0 = 0

4kθ B + S 2 NEP2 B R

(15.66)

4kθ B + S 2 NEP2 B = 2eI1 B + σ02 R

(15.67)

et σ02 =

• dans le cas de la transmission du bit 1 I1 > 0 et

σ12 = 2eI1 B +

Si l’on souhaite maintenant déterminer la puissance lumineuse P1 qu’il convient de détecter (I1 = SP1 ) pour garantir un BER donné, la relation (15.64) nous permet de transformer cette spécification de taux d’erreur en spécification de rapport signal à bruit Q . Il ne nous reste plus qu’à reformuler la relation (15.63) en tenant compte du fait que le courant I0 détecté en cas d’émission d’un bit 0 est nul, soit : σ1 =

I1 − σ0 Q

(15.68)

Il nous suffit d’élever au carré les deux membres de cette égalité et de rapprocher l’expression de σ12 de celle établie à la relation (15.67) : σ12 =

I12 I1 + σ02 − 2σ0 = 2eI1 B + σ02 ⇒ Q2 Q

I12 I1 − 2σ0 = 2eI1 B (15.69) Q2 Q

pour en déduire l’expression recherchée pour le courant I1 (I1 = 0) : I1 = 2Q (σ0 + eQB)

(15.70)

299

7KLVSDJHLQWHQWLRQDOO\OHIWEODQN

Interférométrie et mesure de phase Chapitre conçu par Michel Lequime rédigé par Michel Lequime

Sommaire 16.1 16.2

16.3

16.4 16.5

16.6

Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Concepts de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.2.1 Conservation de l’énergie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.2.2 Gain cohérent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modulateurs de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.3.1 Effet piézoélectrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.3.2 Effet électro-optique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Méthode homodyne active . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Méthodes homodynes passives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5.1 Interférométrie à 4 marches de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5.2 Compteur d’ordre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5.3 Interférométrie à N marches de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5.4 Interférométrie à décalage de phase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.5.5 Interféromètres statiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Méthode hétérodyne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.6.1 Décalage en fréquence par effet Doppler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

302 302 302 306 309 309 310 312 314 314 316 320 322 323 331 331

301

De l’Optique électromagnétique à l’Interférométrie

16.7 16.8

16.6.2 Détection synchrone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Méthode pseudo-hétérodyne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Méthode PGC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

16.1 Introduction Ce chapitre sera essentiellement consacré à une description des principales méthodes développées pour la mesure du déphasage entre deux ondes lumineuses. Les performances ultimes que l’on est aujourd’hui capable d’atteindre approchent la centaine de nanoradians (10−7 rads), ce qui, en termes de différence de marche associée, correspond à quelques femtomètres, soit bien moins que les dimensions caractéristiques d’un atome ! Il ne faut cependant pas être surpris d’un tel résultat, car l’on ne doit pas confondre la qualité de réalisation d’une surface optique (dont la forme peut présenter des écarts à la planéité de quelques dizaines de nanomètres) avec la capacité qui peut être la nôtre de déceler des variations de sa position moyenne avec une résolution plus de mille fois meilleure. La première caractéristique a simplement un effet sur la visibilité effective du phénomène d’interférences qui est mis en œuvre pour mesurer les variations de position de cette surface (le miroir situé dans l’un des bras d’un Michelson par exemple), tandis que la seconde est directement reliée à la résolution ultime de nos mesures de phase. Dans ce chapitre, nous nous intéresserons à 5 méthodes de mesure différentes (avec parfois, plusieurs variantes possibles de mise en œuvre), qui sont, dans l’ordre, la méthode homodyne active, la méthode homodyne passive, la méthode hétérodyne, la méthode pseudo-hétérodyne (ou hétérodyne synthétique) et la méthode dite PGC (acronyme du terme anglais Phase Generated Carrier ). Avant d’aborder la présentation détaillée de toutes ces méthodes, il nous a semblé utile : • de rappeler quelques concepts importants en rapport avec, d’une part, la conservation de l’énergie dans un interféromètre et, d’autre part, la notion de gain cohérent ; • de décrire les moyens à notre disposition pour modifier la phase d’une onde lumineuse.

16.2 Concepts de base 16.2.1 Conservation de l’énergie On considère à titre d’exemple un interféromètre de Michelson tel que celui représenté de manière schématique à la figure 16.1.

302

16. Interférométrie et mesure de phase

M2

r2 r, t

A

r1 M1

S

Onde 1 : A S M1 S D D

Onde 2 : A S M2 S D

Figure 16.1 Interféromètre de Michelson.

Le point A est supposé confondu avec l’origine des axes. Le Michelson est éclairé par une onde plane homogène et monochromatique d’amplitude A0 . On désignera par onde 1 l’onde lumineuse qui est transmise par la séparatrice S et réfléchie par le miroir M1 . De la même manière, on désignera par onde 2 celle qui est réfléchie par la séparatrice S et par le miroir M2 . Considérons tout d’abord la voie de sortie de l’interféromètre qui correspond à celle où nous avons placé le détecteur D (on utilise aussi le terme de port de sortie ou de port symétrique pour la désigner). L’amplitude A1 de l’onde 1 qui arrive sur ce détecteur est définie par la relation suivante :

A1 = A0 e ik[AS] t e ik[SM1 ] r1 e ik[SM1 ] r  e ik[SD]

(16.1)

où t désigne la transmission en amplitude de la séparatrice, attaquée par sa face avant, r1 le coefficient de réflexion en amplitude du miroir M1 et r  celui correspondant à la réflexion sur la face arrière de la séparatrice. De la même manière, l’amplitude A2 de l’onde 2 qui est enregistrée par le même détecteur est définie par la relation suivante : A2 = A0 e ik[AS] r e ik[SM2 ] r2 e ik[SM2 ] t e ik[SD] (16.2) où r désigne le coefficient de réflexion en amplitude sur la face avant de la séparatrice et r2 celui correspondant à la réflexion sur le miroir M2 . Chaque coefficient de réflexion ou de transmission en amplitude est une quantité complexe, qui est donc définie par un module et un argument, soit : √ √ √  (16.3) t = T e iτ ; r = R e iρ ; r  = R  e iρ où R , R  et T désignent les valeurs en énergie de ces mêmes coefficients de réflexion ou de transmission. Si la séparatrice est sans pertes (c’est-à-dire si elle ne contient aucun élément absorbant, et c’est ce que nous supposerons désormais), les deux coefficients de réflexion

303

De l’Optique électromagnétique à l’Interférométrie

en énergie R et R  sont identiques. Par contre, rien n’impose que les déphasages à la réflexion ρ et ρ  le soient. En ce qui concerne les facteurs de transmission, nous serons ultérieurement conduits à considérer le coefficient t  correspondant à la situation symétrique de celle envisagée jusqu’à présent, c’est-à-dire celle pour laquelle la séparatrice est attaquée par sa face arrière. Le principe du retour inverse impose qu’il soit identique à t . En conséquence, nous pouvons écrire : √ t = t  = T e iτ (16.4) où τ désigne le déphasage à la transmission de la séparatrice. On supposera désormais (pour simplifier l’approche, mais sans perdre en généralité) que les 2 miroirs M1 et M2 sont identiques et caractérisés par une réflexion en énergie de 100 %. En conséquence : (16.5) r1 = r2 = e iρ1 L’amplitude totale A reçue par le détecteur D est donc définie par : 

A = A1 + A2 = A0 e ik [AS] e ik [SD] t r1 r  e 2ik [SM1 ] + r r2 t e 2ik [SM2 ]



  = A0 e ik [AS] e ik [SD] e i ρ1 e 2ik [SM2 ] t r  e 2ik ([SM1 ]−[SM2 ]) + r

(16.6)

On désignera désormais par  la différence de marche entre les deux bras de l’interféromètre, soit :  = 2([SM1 ] − [SM2 ]) (16.7) L’éclairement E enregistré par le détecteur est alors défini par :   E = |A|2 = |A0 |2 T R + R + 2R cos (k + ρ  − ρ)

(16.8)

et donc au final par :   E = 2R T |A0 |2 1 + cos (k + ρ  − ρ)

(16.9)

Considérons maintenant une expérience de pensée dans laquelle nous placerions un détecteur dans le bras d’entrée du Michelson, sur le trajet du faisceau retour uniquement, à l’endroit défini par le point A (ce bras est souvent désigné sous l’appellation de port d’entrée ou de port antisymétrique du Michelson). L’amplitude totale reçue par ce détecteur aurait alors pour expression :

A = A0 e ik[AS] t e ik[SM1 ] r1 e ik[SM1 ] t  e ik[AS] + A0 e ik[AS] r e ik[SM2 ] r2 e ik[SM2 ] r e ik[AS]   = A0 e 2ik[AS] e iρ1 e ik[SM2 ] t t  e ik + r 2

304

(16.10)

16. Interférométrie et mesure de phase

et l’éclairement associé serait donc défini par :   E  = |A0 |2 T 2 + R 2 + 2RT cos (k + 2τ − 2ρ)

(16.11)

Dans toute notre démarche, nous avons pris garde à ne considérer que des éléments sans pertes. Deux conséquences à cette hypothèse générale : • la somme des coefficients de réflexion et de transmission en énergie de la séparatrice est égale à 100 %, soit encore : R +T = 1

(16.12)

• l’éclairement entrant est égal à la somme des éclairements sortants, soit : |A 0 |2 = E + E  En regroupant les équations (16.9), (16.11) et (16.13), il vient :   2R T 1 + cos (k + ρ  − ρ)   + T 2 + R 2 + 2RT cos (k + 2τ − 2ρ) = 1

(16.13)

(16.14)

soit encore   2RT +T 2 +R 2 +2RT cos (k + ρ  − ρ) + cos (k + 2τ − 2ρ) = 1 (16.15) puis en utilisant la relation (16.12) :   2RT cos (k + ρ  − ρ) + cos (k + 2τ − 2ρ) = 0

(16.16)

On transforme alors en produit la somme des cosinus, ce qui permet d’écrire :      ρ  − 3ρ + 2τ ρ + ρ − 2τ cos =0 (16.17) 4RT cos k + 2 2 Cette dernière équation doit naturellement être vérifiée quelle que soit la valeur de la différence de marche , ce qui impose que le dernier cosinus soit identiquement nul. En conséquence : π ρ  + ρ − 2τ = [π] (16.18) 2 2 soit encore : (16.19) ρ  + ρ − 2τ = π [2π] Cette dernière relation, souvent appelée relation de clôture de phase, est particulièrement importante, car elle met en évidence les conséquences pratiques d’un principe aussi général que celui de la conservation de l’énergie sur les caractéristiques physiques de la séparatrice utilisée dans un interféromètre.

305

De l’Optique électromagnétique à l’Interférométrie

Notons que la relation (16.19) peut encore s’écrire : ρ + ρ π = τ + [π] 2 2

(16.20)

ce qui peut être synthétisé en disant que la moyenne des déphasages à la réflexion face avant et face arrière est en quadrature avec le déphasage à la transmission. Enfin, on peut se demander s’il existe une configuration pour laquelle les deux déphasages à la réflexion ρ et ρ  seraient, par principe, identiques. La réponse est oui, c’est la configuration dans laquelle la séparatrice est de structure symétrique par rapport à son plan médian. En conséquence, lorsque cette condition de symétrie est remplie, la relation (16.20) prend la forme simplifiée suivante : ρ=τ+

π [π] 2

(16.21)

16.2.2 Gain cohérent L’objectif de ce paragraphe est d’introduire de manière simple la notion de gain cohérent, qui rend compte de l’amplification de la sensibilité d’un mécanisme de détection apportée par un phénomène d’interférences. Considérons pour ce faire un interféromètre à deux ondes, par exemple du type Michelson, comme étudié au paragraphe précédent, et dans lequel la division de l’onde lumineuse monochromatique incidente permet de générer une première onde servant de référence et une seconde utilisée à des fins de mesure ou de détection. Ces deux ondes sont ensuite recombinées de manière à donner naissance au phénomène d’interférences. On peut donc écrire :

A = A1 + A2

(16.22)

où A1 désigne l’amplitude complexe de l’onde de référence et A2 celle de l’onde de mesure. L’éclairement qui résulte de cette superposition est donc défini par la relation générale suivante : E = |A|2 = |A1 + A2 |2 = |A1 |2 + |A2 |2 + 2 |A1 | |A2 | cos (φ1 − φ2 ) (16.23) qu’il est également possible de mettre sous la forme équivalente :  2 |A1 | |A2 | 2 2 cos (φ1 − φ2 ) E = ( |A1 | + |A2 | ) 1 + |A1 |2 + |A2 |2 soit encore :

306

E = E0 [1 + V cos (φ1 − φ2 )]

(16.24)

(16.25)

16. Interférométrie et mesure de phase

où E0 désigne l’éclairement moyen résultant de la superposition de ces deux ondes et V la visibilité du phénomène d’interférences qui lui est associé. Si l’on désigne par κ le rapport entre les modules au carré des amplitudes des ondes de mesure et de référence, soit : κ=

|A 2 |2

(16.26)

|A 1 |2

alors la visibilité V précédemment définie peut être mise sous la forme : √ 2 κ V = 1+κ

(16.27)

Les variations de cette fonction sont représentées à la figure 16.2 en coordonnées log-log.

Visibilité V

1,00

0,10

0,01 0,001

0,01

0,1

1

Rapport R

Figure 16.2 Évolution de la visibilité d’un phénomène d’interférences en fonction du rapport des éclairements des faisceaux qui interfèrent.

On constate que : • la visibilité V est une fonction croissante du rapport κ lorsque celui-ci prend ses valeurs dans l’intervalle [0, 1] (il n’est pas nécessaire de considérer l’intervalle [1, ∞] car il suffit pour cela d’échanger les rôle joués par chacun des deux faisceaux) ; • cette visibilité V est maximale et égale à 1 lorsque les deux faisceaux présentent le même éclairement (κ = 1) ; • cette visibilité prend des valeurs significatives même lorsque ce rapport κ est faible. Ainsi, lorsque κ est simplement égal à 1 %, la visibilité V atteint pratiquement 20 %. C’est ce type de comportement qui constitue la base de la notion de gain cohérent.

307

De l’Optique électromagnétique à l’Interférométrie

Supposons pour fixer les idées que les deux faisceaux qui interfèrent correspondent aux 2 bras d’un Michelson équilibré (séparatrice 50/50) et sans pertes, l’onde de référence A1 étant associée à une réflexion sur un miroir parfait de coefficient de réflexion unitaire, tandis que l’onde de mesure correspond à une réflexion sur un miroir dont on cherche à déterminer la valeur du coefficient de réflexion R . Le fait de faire interférer ces deux faisceaux et de déplacer continûment le miroir de référence parallèlement à lui-même va nous donner accès à un signal utile Su constitué par la composante oscillante du signal interférométrique, dont l’amplitude est définie par application de la relation générale (16.25), soit : √ (16.28) Su = E0 V = 2 |A1 | |A2 | = 2 |A1 |2 R Supposons maintenant que nous ayons tenté de mesurer ce coefficient de réflexion R en utilisant un faisceau unique d’amplitude A0 . Le signal utile S0 aurait été alors défini par la relation : S0 = R |A0 |2 (16.29) Le Michelson considéré étant équilibré et sans pertes, nous pouvons écrire : |A 1 |2 =

1 |A 0 |2 4

|A 2 |2 =

1 R |A 0 |2 4

(16.30)

ce qui conduit, dans ce cas, à une expression du signal utile défini à partir de la relation (16.28), soit : 1√ Su = R |A 0 |2 (16.31) 2 Le gain cohérent Gcoh est donné par le rapport de ces deux signaux utiles, soit : Gcoh =

Su 1 = √ S0 2 R

(16.32)

Dans l’exemple numérique utilisé précédemment (R = 1 %), ce gain cohérent est donc de 5 et cette valeur augmente au fur et à mesure que le coefficient de réflexion R diminue. Pour présenter les choses sous un autre point de vue, lorsque l’on calcule la valeur de l’éclairement après réflexion sur le miroir, celle-ci est définie par le produit |A2 | |A2 |. Lorsque l’on met en œuvre un phénomène d’interférences pour effectuer cette même mesure, le signal utile devient alors proportionnel à |A1 | |A2 |, ce qui revient à dire que l’on a remplacé, pour l’un des termes de ce produit, l’amplitude de l’onde de mesure par celle de l’onde de référence : on décrit souvent cette substitution en disant que l’on a mélangé l’amplitude réfléchie (A2 ) avec celle d’un oscillateur local (A1 ). La détection cohérente présente en outre l’avantage de s’appliquer à un signal oscillant (celui obtenu par exemple grâce au déplacement à vitesse constante du miroir de référence parallèlement à lui-même), et ce caractère oscillant rend possible l’application d’un filtrage en fréquence autour de la porteuse générée par ce déplacement.

308

16. Interférométrie et mesure de phase

16.3 Modulateurs de phase De manière tout à fait générale, la relation entre déphasage φ et différence de marche  s’écrit : ne  (16.33) φ = 2π + ϕ = 2π + ϕ λ λ où ϕ désigne ici la contribution de termes localisés (déphasage à la réflexion sur une interface, déphasage à la traversée d’un foyer...), et ne le chemin optique associé à la différence de marche . Pour obtenir une variation de cette différence de marche, et donc de la phase φ, il nous faut donc utiliser, soit une variation de la longueur d’onde λ, soit un effet physique qui permette de modifier une distance caractéristique de l’un des bras de l’interféromètre (action sur la quantité e ), ou l’indice de réfraction de l’un de ses constituants (action sur la quantité n). La modulation de la longueur d’onde de la source nécessite l’emploi de sources accordables, tels que des lasers semi-conducteurs en cavité externe ou des lasers état solide de type titane/saphir. Cette méthode a donné lieu à des réalisations expérimentales tout à fait intéressantes, mais nous ne la considérerons pas ici. Nous nous limiterons à la présentation de deux effets correspondant à une modulation du chemin optique ne , à savoir l’effet piézoélectrique et l’effet électro-optique.

16.3.1 Effet piézoélectrique La piézoélectricité est la propriété que possèdent certains corps de se polariser électriquement sous l’action d’une contrainte mécanique (apparition de charges électriques à leur surface) et réciproquement de se déformer lorsqu’on leur applique un champ électrique. C’est ce deuxième effet, dit inverse, qui nous intéresse ici. La variation de phase qui en résulte se calcule de la manière suivante. On considère un élément piézoélectrique de longueur caractéristique e , inséré à l’intérieur du trajet optique d’un interféromètre (nous supposerons ici qu’il s’agit d’un Michelson), comme représenté à la figure 16.3. Cet élément actif est placé entre l’un des miroirs et le support mécanique auquel celui-ci est fixé (sur le schéma, la plaque en arrière-plan). On applique alors une tension V , entre les deux extrémités de cette cale piézoélectrique, ce qui provoque une modification de sa dimension caractéristique e définie par la relation : e V =dE =d (16.34) e e où d désigne le coefficient piézoélectrique du matériau exprimé en pm/V (valeur typique 200 pm/V, pour des cales de bonne efficacité).

309

De l’Optique électromagnétique à l’Interférométrie

V

e

Δϕ

Figure 16.3 Modulateur de phase à effet piézoélectrique.

La variation de phase φ associée s’en déduit par application directe de la relation (16.33), soit : 2e 4π d V φ = 2π = (16.35) λ λ où l’on a tenu compte du facteur 2 lié au principe de fonctionnement du Michelson. Cette relation montre qu’il est nécessaire d’appliquer des tensions élevées, de l’ordre du kilovolt, pour engendrer des variations de phase de l’ordre de 2π. Pour réduire l’impact de cette contrainte, on a coutume d’utiliser des empilements de cales piézoélectriques et/ou des amplificateurs mécaniques de déplacement. Ces systèmes présentent des temps de réponse relativement longs (typiquement la milliseconde) et de l’hystérésis, ce qui limite leur domaine d’utilisation et nécessite la plupart du temps l’emploi de capteurs capacitifs de déplacement utilisés en boucle fermée pour linéariser leur réponse. Cependant, comme il s’agit de systèmes essentiellement mécaniques, ils peuvent aussi être utilisés en régime de résonance et donnent alors accès à des modulations de phase sinusoïdales de très bonne stabilité autour de cette fréquence particulière.

16.3.2 Effet électro-optique On appelle effet électro-optique tout phénomène conduisant à la modification de l’indice de réfraction n d’un milieu sous l’effet d’un champ électrique statique E . On distingue habituellement l’effet Pockels, qui présente une dépendance linéaire de cette variation d’indice vis-à-vis du champ E appliqué, de l’effet Kerr, pour lequel cette même dépendance est de nature quadratique. C’est l’effet électro-optique linéaire qui nous intéressera ici. Deux configurations différentes de mise en œuvre de cet effet sont envisageables : la première, dite longitudinale, suppose l’emploi d’électrodes transparentes, tandis que la seconde, dite transverse et représentée à la figure 16.4, permet de s’affranchir de ce type de contrainte. Elle rend en outre possible une miniaturisation extrême du

310

16. Interférométrie et mesure de phase

V

Δϕ

e l

Figure 16.4 Modulateur de phase à effet électro-électrique (configuration transverse).

composant, car son principe de fonctionnement est compatible avec une mise en œuvre de type guidé. La relation entre variation d’indice n et champ E appliqué est donnée par : 1 n = n03 r E 2

(16.36)

où n0 désigne l’indice de réfraction du milieu en l’absence de champ et r le coefficient électro-optique linéaire de ce même milieu. Ce coefficient ne dépasse pas 30 pm/V, même pour des matériaux de très bonne efficacité comme le niobate de lithium. La variation de phase φ associée s’écrit : φ = 2π

e n πe 3 = n rV λ λl 0

(16.37)

où V désigne la tension appliquée sur les électrodes et e /l le rapport longueur sur largeur de ce modulateur, souvent appelé facteur de forme . Le principal avantage de ce modulateur de phase est sa très grande bande passante, qui approche ou dépasse le gigahertz. L’utilisation de cristaux de très faible largeur l permet de réduire la tension nécessaire à l’obtention d’une valeur donnée de déphasage et c’est ainsi que des tensions de pilotage de l’ordre de quelques volts permettent, en configuration guidée, d’atteindre des modulations de phase de plusieurs radians d’amplitude. En aérien, les tensions de pilotage sont toutefois du même ordre de grandeur que celles nécessitées par la mise en œuvre de l’effet piézoélectrique, c’està-dire typiquement le kilovolt. Ce type de modulateur présente toutefois deux inconvénients notables : • il nécessite l’emploi de lumière polarisée, ce qui signifie que la moitié de la puissance lumineuse est perdue dans le cas où la source émet une lumière naturelle ; • les cristaux électro-optiques présentent en général de forts coefficients thermooptiques, et donc une forte dépendance de leur épaisseur optique vis-à-vis des évolutions de la température, ce qui rend la mesure précise d’un déphasage délicate en l’absence d’une compensation thermique, d’une régulation thermique ou d’une mesure simultanée de la température.

311

De l’Optique électromagnétique à l’Interférométrie

16.4 Méthode homodyne active Considérons un interféromètre à deux ondes dans la représentation générique qui en est donnée figure 16.5. L’onde monochromatique entrante est séparée en deux ondes partielles, notées 1 et 2, au niveau de la séparatrice S, ces deux ondes étant ensuite recombinées au travers de la seconde séparatrice S . Nous supposerons que les deux ports, symétrique et antisymétrique, sont également accessibles et l’on désignera par P+ et P− les puissances optiques qui en émergent. Un élément actif, par exemple de type piézoélectrique, est inséré dans le bras 2 de cet interféromètre, de sorte que la phase absolue associée à la traversée de celuici s’écrit 2 + αV , où V désigne la tension de pilotage appliquée à cet élément actif, α l’efficacité de la modulation de phase qu’il génère et 2 la phase absolue caractéristique de ce bras 2 en l’absence de tension appliquée. En désignant par 1 la phase absolue associée à la traversée du bras 1, les puissances P+ et P− détectées au niveau des deux ports de l’interféromètre s’écrivent en toute généralité :

P+ = P¯ {1 + m cos [ 1 − ( 2 + α V )]} (16.38) P− = P¯ {1 − m cos [ 1 − ( 2 + α V )]} où P¯ désigne la puissance moyenne délivrée par chaque port de cet interféromètre (on les supposera équilibrés) et m l’indice de modulation du signal interférométrique. En utilisant une amplification différentielle des courants associés à la détection de chacune de ces puissances caractéristiques, on obtient au final un signal I défini par : I = I+ − I− = SP+ − SP− = 2mS P¯ cos [( 1 − 2 ) − α V ]

(16.39)

où S désigne la sensibilité des détecteurs utilisés.

Φ1

S S

P+

S’ S’

Φ1 _ Φ2 = ϕ

Φ2

α .V

P-

Figure 16.5 Représentation générique d’un interféromètre à 2 ondes en configuration homodyne active.

312

16. Interférométrie et mesure de phase

On appellera désormais φ la différence de phase caractéristique de cet interféromètre à 2 ondes, différence de phase qui est justement la quantité que l’on souhaite mesurer. La relation (16.39) se met alors sous la forme finale suivante : I = 2mS P¯ cos [φ − α V ]

(16.40)

La méthode homodyne active consiste à agir continûment sur la tension de pilotage V pour que le signal I soit identiquement nul. Plusieurs remarques et conséquences découlent directement de cette définition : 1. Si le signal I est identiquement nul, alors l’argument de la fonction cosinus est constamment égal à π/2, de sorte que l’on peut écrire : φ = αV +

π 2

(16.41)

On dit souvent que l’interféromètre est verrouillé en quadrature. La relation précédente montre en outre que l’on a remplacé la mesure de la phase φ de l’interféromètre par celle de la tension de pilotage V de l’élément actif. Considérons, pour illustrer cette situation, un interféromètre de Michelson dont le miroir de l’un des bras se déplace de manière aléatoire sous l’effet d’un paramètre physique (vibrations, par exemple). Alors le verrouillage en quadrature de cet interféromètre est obtenu au travers de l’application d’une tension de contreréaction V sur l’élément actif (cale piézoélectrique) solidaire du miroir situé dans l’autre bras, celui-ci étant alors animé d’un mouvement qui est l’exacte recopie de celui du premier miroir. Cet effet de recopie est caractéristique de la méthode homodyne active. 2. La résolution en phase que l’on est susceptible d’atteindre est directement liée à l’écart-type des fluctuations affectant les courants I+ et I− délivrés par les deux détecteurs. La procédure de calcul permettant d’évaluer cette résolution est la suivante : – on commence par relier l’écart-type des fluctuations de phase à l’écart-type des fluctuations de courant en différentiant la relation (16.40), soit : σI = 2mS P¯ sin [φ − α V ] σφ = 2mS P¯ σφ

(16.42)

où la deuxième égalité tient compte du verrouillage en quadrature de l’interféromètre ; – les courants I+ et I− présentent des fluctuations totalement décorrélées, de sorte que l’on peut écrire : 4kθ 2 2 2 2 2 2 (16.43) σI = σI + + σI − = 2σI = 2 2eIB + B + S NEP B R où I = S P¯ désigne la valeur commune du courant (le résultat de l’amplification différentielle est en effet identiquement nul) et B la bande passante de détection ;

313

De l’Optique électromagnétique à l’Interférométrie

– on reporte enfin cette expression dans celle définissant les fluctuations de phase, soit :

2 2 2eS P¯ + 4kθ σ σI R + S NEP φ ⇒ √ = σφ = √ (16.44) 2mS P¯ 2mS P¯ B La résolution en phase sera d’autant meilleure que la puissance moyenne détectée P¯ sera élevée, avec un passage progressif d’un régime de bruit thermique à un régime de bruit quantique, lorsque la valeur moyenne de cette puissance augmente. Il ne faut toutefois pas perdre de vue que cette résolution en phase sera également limitée par les fluctuations intrinsèques de la tension appliquée au modulateur de phase (dans le cas d’un pilotage purement analogique de ce système de mesure) ou par la tension équivalente au bit de poids le plus faible ou VLSB (Least Significant Bit ) du convertisseur analogique numérique (CAN ou DAC, Digital-to-Analog Converter ), dans le cas où le pilotage de cette même boucle de contre-réaction est réalisé de manière numérique. 3. La gamme de fonctionnement de cette méthode est directement dépendante de celle de l’élément actif utilisé, ce qui constitue un inconvénient majeur dans de nombreux cas d’application pour lesquels les amplitudes des variations de phase sont susceptibles d’être très largement supérieures à 2π. C’est notamment pour cette raison que l’on a souvent recours à la méthode dite homodyne passive en lieu et place de son homologue active.

16.5 Méthodes homodynes passives On désignera sous l’appellation générique d’homodynes passives toutes les méthodes qui conduisent à la détection, simultanée ou séquentielle, de plusieurs signaux interférométriques associés à la même phase φ et dont la combinaison donne accès, dans un premier temps aux quantités sin φ et cos φ, puis à la valeur de la phase elle-même.

16.5.1 Interférométrie à 4 marches de phase La première méthode que nous évoquerons ici est habituellement désignée sous l’appellation anglaise de Phase Stepping Interferometry. Elle met en œuvre un élément actif analogue à celui utilisé par la méthode homodyne active, mais suppose l’application séquentielle de 4 tensions de valeurs prédéterminées, correspondant à des déphasages successivement égaux à 0, π/2, π et 3π/2. Chacune de ces tensions est maintenue pendant une durée élémentaire τ , la période T du cycle complet de 4 états étant donc égale à 4τ .

314

16. Interférométrie et mesure de phase

En adoptant les mêmes notations que celles utilisées au paragraphe 16.4, l’application de ces quatre états conduit à la détection, sur le port noté +, des puissances caractéristiques suivantes : État 1 : αV = 0 π État 2 : αV = 2 État 3 : αV = π 3π État 4 : αV = 2

P1 = P¯ [1 + m cos φ] π P2 = P¯ [1 + m cos (φ − )] 2 P3 = P¯ [1 + m cos (φ − π)] 3π P4 = P¯ [1 + m cos (φ − )] 2

(16.45)

et donne naissance au chronogramme de courant défini ci-après : I1 = S P¯ [1 + m cos φ] I2 = S P¯ [1 + m sin φ]

0t