220 25 4MB
French Pages 230 [229] Year 2010
Collection « Une Introduction à » dirigée par Michèle Leduc et Michel Le Bellac
Le monde quantique Michel Le Bellac Préface d’Alain Aspect
17, avenue du Hoggar Parc d’activités de Courtabœuf, BP 112 91944 Les Ulis Cedex A, France
Imprimé en France.
© 2010, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35. ISBN EDP Sciences 978-2-7598-0443-6
Ancien élève de l’École normale supérieure, Michel Le Bellac, a d’abord passé cinq ans au CNRS à Orsay. Il a rejoint en 1967 comme professeur l’Université de Nice-Sophia Antipolis où il a effectué la suite de sa carrière, en dehors de trois années passées au CERN à Genève. Il est professeur émérite de l’Université de Nice-Sophia Antipolis depuis 2002. Ses recherches ont porté sur la physique théorique des particules élémentaires puis sur la théorie des champs à température finie et le plasma quark-gluon, sujet sur lequel il a écrit Thermal Field Theory (Cambridge University Press, 1996). Il a écrit récemment plusieurs manuels de physique de niveau M1/M2 : Thermodynamique statistique, en collaboration avec G. Batrouni et F. Mortessagne (Dunod, 2000), Physique quantique (EDP Sciences/CNRS Éditions, 2003, seconde édition en 2007), Information quantique (Belin, 2005). Tous ces livres ont été traduits en anglais et publiés par Cambridge University Press.
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Table des matières
Préface
7
Avant-propos
11
1 Un principe qui dérange 1.1 Les ondes de la physique classique . . . . . . . . . 1.2 L’interféromètre de Mach-Zehnder . . . . . . . . . 1.3 Photons . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Photons dans l’interféromètre de Mach-Zehnder 1.5 L’interféromètre de Mach-Zehnder revisité . . . . 1.6 Particules quantiques . . . . . . . . . . . . . . . . . 1.7 Choix retardé et mesure « sans interaction » . . . 1.8 Bibliographie . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
17 18 21 23 29 31 33 38 41
. . . . .
43 43 46 49 52 56
. . . . .
57 58 59 61 64 69
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
2 Des transmissions sécurisées 2.1 La cryptographie classique : clé secrète et clé publique 2.2 Polarisation de la lumière . . . . . . . . . . . . . . . . . . 2.3 Polarisation d’un photon . . . . . . . . . . . . . . . . . . . 2.4 Le protocole BB84 pour la cryptographie quantique . . 2.5 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Einstein, Bohr et la physique quantique 3.1 Des communications supraluminales ? 3.2 Une inégalité remarquable . . . . . . . 3.3 Et la physique quantique ? . . . . . . . . 3.4 L’expérience d’Aspect . . . . . . . . . . . 3.5 Bibliographie . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
4 Atomes, lumière, lasers 4.1 Particules et ondes classiques sur une droite . . 4.2 Particule quantique dans un puits de potentiel 4.3 Inégalités de Heisenberg et niveaux d’énergie . 4.4 Atomes . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Lasers . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Bibliographie . . . . . . . . . . . . . . . . . . . . . 5 Des atomes très froids 5.1 Qu’est-ce que la température ? 5.2 Refroidir les atomes . . . . . . . 5.3 Condensats de Bose-Einstein . 5.4 Bibliographie . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
71 72 75 77 81 83 89
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
91 91 95 105 111
6 Le règne des semi-conducteurs 6.1 Conducteurs et isolants . . . . . . . . . . . . . . 6.2 Semi-conducteurs . . . . . . . . . . . . . . . . . . 6.3 Interaction avec un champ électromagnétique 6.4 Hétérostructures et diodes laser . . . . . . . . . 6.5 Bibliographie . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
113 113 119 123 124 129
. . . .
131 . 131 . 139 . 144 . 149
. . . . .
151 . 152 . 157 . 162 . 163 . 165
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
7 Physique quantique et relativités 7.1 Théorie relativiste des champs quantiques . . . . . 7.2 Le modèle standard de la physique des particules 7.3 La gravitation quantique . . . . . . . . . . . . . . . . 7.4 Bibliographie . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
8 Vers l’ordinateur quantique ? 8.1 Bits et portes logiques quantiques . . . . . . . . . . . . 8.2 Algorithmes quantiques . . . . . . . . . . . . . . . . . . 8.3 Algorithmes quantiques et complexité algorithmique 8.4 Réalisations physiques . . . . . . . . . . . . . . . . . . . 8.5 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
. . . .
. . . . .
9 L’environnement surveille 167 9.1 La décohérence : un exemple élémentaire . . . . . . . . . . . . . . . . . . 167 9.2 Décohérence environnementale . . . . . . . . . . . . . . . . . . . . . . . . 172 9.3 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
4
Table des matières
10 Interprétations 10.1 L’interprétation de Copenhague . . . . . 10.2 La théorie de von Neumann . . . . . . . . 10.3 L’appareil de mesure est macroscopique 10.4 Interprétations non standard . . . . . . . 10.5 Conclusion . . . . . . . . . . . . . . . . . . 10.6 Bibliographie . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
179 180 186 190 194 196 198
11 Annexes
199
Index
223
LE MONDE QUANTIQUE
5
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Préface L’écriture d’un livre de vulgarisation – il vaudrait mieux parler de « popularisation » comme les anglophones – est toujours une entreprise difficile. Quand il s’agit de physique quantique, monde dans lequel nos repères et notre expérience courante ne nous permettent pas de construire des images, il s’agit d’un défi majeur. C’est ce défi que Michel Le Bellac a décidé de relever. Il faut l’en féliciter car la physique quantique a connu des bouleversements majeurs au cours des dernières décennies, et il est indispensable de mettre à la disposition du public des ouvrages lui permettant de comprendre de quoi il s’agit lorsqu’il entend parler d’intrication, de décohérence, de condensats de Bose-Einstein, de cryptographie quantique, d’ordinateur quantique. La physique quantique est née au début du XXe siècle, avec les travaux fondateurs de Planck, Einstein, Bohr, de Broglie, bientôt suivis par la mise en forme cohérente par Heisenberg, Schrödinger et Dirac du formalisme mathématique encore utilisé aujourd’hui. Il permet de décrire l’ensemble des phénomènes microscopiques qui échappent à l’électrodynamique classique, synthèse des deux grandes théories physiques achevées au XIXe siècle, la mécanique d’une part et l’électromagnétisme de l’autre. Les plus grands physiciens tels Lorentz avaient en effet échoué dans leurs tentatives de comprendre la stabilité de la matière, dont on savait qu’elle était composée de charges positives et négatives qui, en s’attirant, auraient dû aboutir à l’effondrement de la matière sur elle-même. Le modèle d’atome de Rutherford, sorte de système solaire où les électrons tournent autour du noyau comme les planètes autour du Soleil, n’échappait pas à l’objection car une charge électrique que l’on force à changer de direction émet du rayonnement (c’est le principe des sources de rayonnement synchrotron). Elle perd donc de l’énergie et va finir par tomber sur le noyau, comme un satellite freiné par les frottements sur les couches supérieures de l’atmosphère finit par tomber sur la terre. S’appuyant sur les idées de granularité du rayonnement dues à Planck et Einstein, Niels Bohr émit l’hypothèse radicale que les orbites des électrons elles aussi ne pouvaient prendre que certaines valeurs particulières, déterminées à partir de la constante de Planck dont la valeur était déduite de mesures sur le rayonnement. C’est de Broglie et Schrödinger qui donnèrent une interprétation de la quantification de ces trajectoires en termes d’ondes
de matière qui, comme les vibrations des cordes d’une guitare, ne peuvent prendre que des fréquences particulières. La mécanique ondulatoire était née. Au même moment, Heisenberg développait un formalisme totalement différent, la mécanique des matrices, qui aboutissait aux mêmes valeurs, en accord avec les mesures spectroscopiques, pour les longueurs d’onde des radiations émises par l’atome d’hydrogène. Dans une synthèse éblouissante, Schrödinger montrait l’équivalence entre les deux approches, et Dirac décrivait l’ensemble dans un formalisme d’une élégance sublime, que nous utilisons toujours. La mécanique quantique sous sa forme moderne était à la disposition des physiciens. Ses succès étaient innombrables puisqu’elle permettait enfin de comprendre la structure de la matière et sa stabilité, ainsi que ses propriétés mécaniques, électriques, thermiques et optiques. Elle permettait également de décrire des phénomènes stupéfiants comme la superfluidité de l’hélium, c’est-à-dire l’absence totale de résistance à l’écoulement de ce liquide, ou la supraconductivité électrique, le fait que certains matériaux, portés à une température suffisamment basse, peuvent conduire le courant électrique sans aucune perte. Enfin, au lendemain de la seconde guerre mondiale, la mécanique quantique allait permettre deux inventions qui devaient bouleverser nos sociétés, le transistor et le laser. Sans ordinateurs, dont la puissance résulte de l’intégration d’un nombre immense de transistors, et sans communications par fibres optiques rendues possibles par les lasers, nous ne serions pas entrés dans la société de l’information et de la communication. Il n’est donc pas exagéré de parler de révolution quantique, pour désigner cet impressionnant ensemble de progrès d’abord dans notre compréhension de la structure et des propriétés de la matière, puis dans des technologies nouvelles allant des autoroutes de l’information aux ordinateurs portables, en passant par l’imagerie médicale par résonance magnétique. Cette révolution scientifique et technique de la première partie du XXe siècle s’est accompagnée d’une autre révolution tout aussi radicale, dans la façon dont nous nous représentons le monde. Avec la mécanique quantique il a fallu admettre que les particules se comportent parfois comme des ondes, et réciproquement que la lumière, dont la plupart des propriétés sont celles d’une onde électromagnétique, se comporte parfois comme un flux de particules, les photons. Cette dualité ondeparticule est au cœur de la plupart des phénomènes quantiques connus en 1960, au point que Richard Feynman n’hésitait pas à écrire à son sujet, dans son fameux cours de physique : « un phénomène qu’il est impossible, absolument impossible, d’expliquer de façon classique, et qui porte en lui le cœur de la mécanique quantique. En réalité, il contient le seul mystère ». En fait les années 1960 allaient voir l’émergence d’une nouvelle révolution quantique, basée d’abord sur la prise de conscience de l’importance d’un autre concept quantique, l’intrication, introduit en 1935 par Einstein et ses collègues Podolsky et Rosen d’une part, et Schrödinger d’autre part. Il s’agit de la propriété que peuvent
8
Préface
avoir plusieurs particules quantiques de former un tout que l’on ne peut pas décrire correctement en se contentant de donner l’ensemble de toutes les propriétés de chaque particule. Le tout est plus que l’ensemble des parties, et cela même si les parties sont parfaitement séparées dans l’espace-temps, de sorte que la relativité interdit toute communication entre ces parties, par quelque interaction que ce soit. Cela se traduit par l’existence de corrélations beaucoup plus fortes que celles que la physique classique autorise, comme le montre la violation des inégalités de Bell, amplement vérifiée par l’expérience. Il fallut attendre la découverte de ces inégalités, en 1964, pour que l’on comprenne l’importance de l’intrication, et c’est à de telles inégalités que se réfère le même Feynman lorsqu’il finit par écrire, en 1982 : « Je me suis toujours illusionné en ramenant la difficulté de la mécanique quantique à un élément de plus en plus petit, et en étant de plus en plus ennuyé par cet élément. Il peut sembler ridicule de pouvoir le ramener à la question numérique de savoir si une chose est plus grande qu’une autre. Mais voilà, elle est plus grande que ce que n’importe quel raisonnement logique peut prédire. . . ». Au-delà de la révolution conceptuelle entraînée par la prise de conscience du caractère radicalement nouveau de l’intrication, une révolution scientifique allait immédiatement suivre, dont les prémices se trouvaient explicitement dans l’article de Feynman que nous venons de citer : il s’agit de la possibilité de concevoir des ordinateurs quantiques, dont la puissance de calcul serait exponentiellement plus grande – au sens exact du terme, que n’importe quel ordinateur classique. À la même époque, à partir des années 1960, les physiciens devenaient capables d’isoler, de contrôler et d’observer des objets quantiques uniques, qu’il s’agisse d’un électron, d’un photon, d’un ion, d’un atome ou d’une molécule. L’ensemble de ces avancées conceptuelles et expérimentales ont permis le développement rapide d’un nouveau champ de recherche, l’information quantique, qui se propose d’utiliser les ressources les plus extraordinaires de la physique quantique, et en particulier l’intrication, pour traiter et transmettre l’information. Il est trop tôt pour savoir si les progrès remarquables déjà obtenus aboutiront à la révolution technologique énorme que constituerait la réalisation d’un ordinateur quantique, mais les conséquences d’un tel succès justifieraient amplement l’expression « seconde révolution quantique ». Le livre de Michel Le Bellac a l’immense mérite de tirer les conséquences des avancées récentes, et de présenter de façon synthétique les concepts à la base des deux révolutions quantiques, ainsi qu’un certain nombre de phénomènes remarquables qui ne peuvent être décrits que dans ce cadre conceptuel. On y trouvera aussi bien la description d’expériences d’interférences photon par photon – illustrant la « mystérieuse » dualité onde-particule, que l’application de la physique quantique aux lasers à semi-conducteurs présents dans tous les lecteurs de DVD. Un chapitre entier est consacré à l’intrication, au débat entre Einstein et Bohr, et aux expériences de test des inégalités de Bell, un autre à la cryptographie quantique, un autre encore
LE MONDE QUANTIQUE
9
au refroidissement d’atomes par laser et aux fameux condensats de Bose Einstein atomiques. L’état actuel des recherches sur l’ordinateur quantique est présenté avec lucidité, sans cacher les difficultés qui devront être surmontées pour aboutir à un instrument utile. Enfin le lecteur trouvera dans ce livre non pas la réponse, que nous ne connaissons toujours pas, mais la formulation claire de questions difficiles loin d’être résolues, sur la frontière quantique / classique, et sur l’interprétation de la mécanique quantique. J’ai eu la chance de travailler sur un certain nombre de ces questions, et je peux témoigner que Michel Le Bellac a, sur chacune d’entre elles, su dégager les points essentiels et choisir quelques exemples importants, sans noyer le lecteur sous une accumulation de phénomènes. Ce livre exigeant demande une attention soutenue, mais le jeu en vaut la chandelle car les sujets présentés sont parmi les plus passionnants de la recherche actuelle, et le lecteur sera récompensé de ses efforts en découvrant l’intérêt de ces sujets, et l’état de la question. Il sera donc à même de mieux suivre les découvertes qui ne manqueront pas d’être annoncées dans les prochaines années. Michel Le Bellac, dont la spécialité initiale est la physique des particules, a fait depuis plusieurs années l’effort de comprendre en détail les nombreuses recherches dans des domaines qui vont bien au-delà du sien. Il en a tiré des ouvrages d’un niveau avancé. Aujourd’hui il met cette vaste culture au service du public intéressé par la science et ses découvertes récentes. Il faut l’en remercier, et souhaiter à ce nouvel ouvrage le succès qui témoignera de l’intérêt suscité par « le monde quantique ». Alain ASPECT
10
Préface
Avant-propos Dans le dernier film de Woody Allen, « Whatever works », le personnage principal, qui est manifestement le double du metteur en scène, se présente comme « un génie (semble-t-il méconnnu !) de la mécanique quantique et de la théorie des cordes ». Ces deux théories n’ont pas été choisies par hasard : elles sont supposées être particulièrement ésotériques et maîtrisées uniquement par une poignée d’experts dans le monde. Je ne me prononcerai pas sur la théorie des cordes, mais je voudrais montrer dans ce livre qu’en ce qui concerne la physique quantique, les principes de base ne sont pas si compliqués et peuvent être compris en profondeur à condition de les examiner avec un minimum de concentration. Bien entendu, la maîtrise technique de la théorie quantique, celle qui est nécessaire aux physiciens professionnels, nécessite un lourd investissement, mais cet investissement n’est en rien indispensable pour comprendre réellement de quoi il retourne. Il m’a semblé qu’un lecteur possédant un minimum d’intérêt pour les problématiques scientifiques pourrait se poser les questions suivantes. Est-il correct d’affirmer « qu’un atome peut se trouver en plusieurs endroits à la fois » ? Quels étaient les enjeux du débat entre Einstein et Bohr en 1935 ? Qu’est-ce qu’un « atome froid » et quelles en sont les applications ? Quels sont les principes du laser et les spécificités de la lumière laser ? Comment fonctionnent les diodes laser qui permettent de lire et de graver les CD et les DVD ? Qu’est-ce qu’une particule élémentaire dans une théorie quantique et relativiste ? Qu’appelle-t-on « interprétation de Copenhague » de la mécanique quantique ? Telles sont quelques-unes des questions auxquelles j’aimerais répondre dans cet ouvrage, tout en restant à un niveau aussi élémentaire que possible. J’essaierai aussi de donner quelques éléments de jugement sur des questions toujours ouvertes, par exemple : pourquoi est-il aussi difficile de bâtir une théorie quantique de la gravitation ? Existe-t-il une frontière entre le monde quantique et le monde classique ? La fonction d’onde représente-t-elle une réalité externe ? Dans une entreprise de « vulgarisation de la physique quantique », il faut inévitablement se fixer le niveau visé. Il me semble que deux niveaux sont possibles. Le premier, que l’on pourrait qualifier de « grand public », se borne à une description qualitative des phénomènes quantiques, mais n’essaie pas véritablement d’expliquer
les règles qui les régissent. Le second niveau, qui est celui visé par le présent ouvrage, est plus ambitieux, mais aussi plus exigeant, dans la mesure où il s’efforce de répondre à la question « comment ça marche ? » tout en faisant appel au minimum de formalisme. Ce livre s’adresse donc à un lecteur qui n’a pas complètement oublié les mathématiques de terminale, capable de comprendre une équation algébrique simple (à peine plus compliquée que E = mc 2 !) et de visualiser le graphe de la fonction cosinus ; en revanche, ce lecteur ne rencontrera dans le texte principal aucune notion mathématique avancée. Toutefois, à partir du chapitre 8, j’ai introduit la notation de Dirac afin d’écrire quelques équations très simples que j’aurais dû sinon remplacer par des périphrases plus ou moins obscures. Le lecteur qui m’aura suivi jusque-là aura certainement une compréhension intuitive de cette notation. S’il possède des connaissances mathématiques du niveau de la première année d’une licence scientifique (L1 ), il trouvera dans les encadrés et dans les annexes des compléments lui permettant de se faire une idée plus approfondie de la théorie quantique. Ce livre n’a pas pour seul objectif d’introduire les idées de base de la théorie quantique. En effet, nous sommes entrés depuis quelques dizaines d’années dans un monde de plus en plus dépendant des applications de la physique quantique. Le développement prodigieux des sciences et techniques de l’information et de la communication (STIC) n’aurait pas été possible sans une parfaite maîtrise de cette physique, qui est à la base du développement du transistor et du laser. Sans ces technologies, nous n’aurions ni lecteurs de CD et de DVD, ni télécommunications à haut débit, ni ordinateurs ou téléphones portables, ni dispositifs de vision nocturne dans l’infrarouge. Sans les horloges atomiques, nous n’aurions pas de GPS précis au mètre près. La deuxième question à laquelle je me propose de répondre est donc « à quoi ça sert ? » Naturellement j’ai dû faire un choix parmi les multiples applications. Ce choix s’est porté sur le principe de quelques-uns des objets emblématiques créés par l’ingénierie quantique : lasers, horloges atomiques, semi-conducteurs, diodes électroluminescentes (ou LED) et diodes laser. Quelques indications sur le plan de l’ouvrage pourront être utiles pour s’orienter dans sa lecture. Le chapitre 1 conduit directement au cœur du monde quantique : il énonce les premières règles de base de la théorie quantique, précise le rôle des probabilités, introduit la notion d’amplitude de probabilité ainsi que le principe de superposition. Ce principe est très surprenant, car nous n’en avons aucune intuition tangible dans notre monde habituel, il contredit notre vision du monde, bref il dérange, d’où le titre du premier chapitre. Le chapitre 2 montre comment les règles de base de la théorie quantique peuvent être utilisées pour la transmission sécurisée de clés de cryptage, grâce à une méthode permettant de détecter toute tentative d’espionner une communication entre deux parties. Le chapitre 3 introduit le débat entre Einstein et Bohr qui remonte à 1935, et dont l’issue était longtemps restée en suspens. Un pas décisif fut franchi en 1964 par Bell, donnant la possibilité de
12
Avant-propos
trancher le débat par une expérience cruciale qui a permis de réfuter les hypothèses sous-jacentes au raisonnement d’Einstein. Alors que l’espace n’avait pratiquement joué aucun rôle dans les premiers chapitres, le chapitre 4 aborde les propriétés spatiales des particules quantiques ; on revient ainsi à la version première de la théorie quantique, la mécanique ondulatoire. À l’aide de l’exemple du puits quantique (qui refera surface au chapitre 6 pour les diodes laser), j’introduis les notions de fonction d’onde, de niveau d’énergie et d’inégalités de Heisenberg, plus connues sous l’appellation discutable de « principe d’incertitude de Heisenberg ». Comme application, je décrirai en fin de ce chapitre le principe du laser. Les chapitres 5 et 6 traitent des effets collectifs des particules quantiques. Après avoir expliqué le refroidissement des atomes, je montre dans le chapitre 5 comment ce refroidissement peut être utilisé d’abord pour améliorer le fonctionnement des horloges atomiques, et ensuite pour mettre en évidence le comportement étonnant d’une des deux catégories de particules quantiques, les bosons. Les bosons sont susceptibles de former des systèmes aux propriétés remarquables, les condensats de Bose-Einstein. Le chapitre suivant traite de l’autre catégorie de particules quantiques, les fermions. Les électrons sont des fermions et cette propriété est fondamentale pour expliquer la conduction du courant électrique par les métaux et les semi-conducteurs. L’objectif final de ce chapitre est d’expliquer les mécanismes mis en œuvre dans les diodes électroluminescentes, ou LED, et les diodes laser. En 1905, dans deux articles fondateurs, Einstein introduisit l’aspect quantique du champ électromagnétique et la relativité restreinte. Le mariage de la physique quantique et de la relativité restreinte a donné naissance à une théorie quantique relativiste qui est à la base des théories modernes des particules élémentaires. Comme je l’explique dans le chapitre 7, le mariage entre physique quantique et relativité restreinte est conflictuel, mais le conflit a une solution raisonnable. Il n’en est pas de même pour le mariage entre mécanique quantique et relativité générale, théorie relativiste de la gravitation développée par Einstein en 1915. Je montrerai sur un exemple simple pourquoi la gravitation quantique doit nécessairement rencontrer de sérieuses difficultés, dont on ne connaît pas aujourd’hui la solution. Les chapitres 8 et 9 sont consacrés à des sujets très actuels, mais ils font appel à un peu plus de formalisme, que l’on trouve développé dans les annexes. Les physiciens mettent beaucoup d’espoir dans les ordinateurs quantiques, capables de résoudre en un temps record quelques problèmes inaccessibles aux ordinateurs classiques. Les principes de l’algorithmique quantique sont exposés au chapitre 8. Malheureusement, il faut bien avouer que la réalisation pratique d’un ordinateur quantique est encore un objectif à très, très long terme. Le chapitre 9 explique comment l’interaction d’un système quantique avec son environnement induit un
LE MONDE QUANTIQUE
13
comportement classique. Cet effet, dit de décohérence, permettra de discuter la frontière entre mondes quantique et classique. Enfin le chapitre 10 est consacré à des thèmes plus « philosophiques ». Suivant l’ordre historique, je commencerai par exposer l’interprétation dite de Copenhague de la théorie quantique et je poursuivrai par la théorie de la mesure quantique due à von Neumann. À mon sens, aucune de ces approches n’est pleinemement satisfaisante et je développerai d’autres approches comme celle fondée sur la décohérence. Chapitre 1
Chapitre 4
Chapitre 2
Chapitre 5
Chapitre 3
Chapitre 6
Chapitre 9
Chapitre 7
Chapitre 10
Chapitre 8
Figure 1. Enchaînement logique des différents chapitres. La colonne de gauche correspond à une lecture plutôt orientée « applications » et celle de droite à une lecture plutôt orientée « problèmes de principe ».
Un mot sur quelques notations et conventions. Lorsqu’un terme (ou une expression) est défini(e) pour la première fois, il(elle) apparaît en italique. Pour attirer l’attention sur un point important d’un raisonnement ou un résultat essentiel, j’utilise les caractères penchés. La notion d’ordre de grandeur est fondamentale en physique et souvent on ne se préoccupe pas de savoir si deux quantités sont exactement égales ou très proches. On peut dans de nombreux cas se contenter d’une égalité approximative. Ainsi, signifie égalité approximative, disons à 10 % près, et ∼ égalité à un facteur 2 ou 3 près : A ∼ B veut dire que A et B sont du même ordre de grandeur. A B, ou B A signifient que A est plus petit que B par un facteur 10 au moins, et peut-être beaucoup plus. Enfin, π 3,14 est bien évidemment le rapport de la circonférence du cercle à son diamètre ! Deux enchaînements de chapitres sont possibles (figure 1.1), selon les sujets qui intéressent la lectrice. La lectrice principalement intéressée par l’ingénierie quantique et les applications pourra suivre l’ordre de la colonne de gauche, quitte à
14
Avant-propos
revenir ultérieurement aux autres chapitres, et celle principalement intéressée par les questions de principe pourra opter pour la colonne de droite. Chaque chapitre se conclut par une courte bibliographie. Je me suis efforcé de donner une majorité de références en français, mais j’en ai indiqué quelques-unes en anglais lorsqu’elles me semblaient particulièrement pertinentes. Remerciements Je voudrais avant tout remercier Alain Aspect qui a accepté de préfacer ce livre. Je suis particulièrement reconnaissant envers Sébastien Tanzilli et Mathieu Le Bellac qui ont lu en détail l’ensemble du manuscrit et y ont apporté de multiples améliorations. Je remercie également Thierry Grandou, Franck Laloë, Michèle Leduc, Emmanuel Menini et Borge Vinter pour leurs nombreuses remarques. Mathieu Le Bellac a réalisé la figure 1.2 et Michel Laget m’a fourni la figure 1.4.
LE MONDE QUANTIQUE
15
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
1 Un principe qui dérange Au début du XIXe siècle, la physique était dominée par deux théories, la mécanique et l’électromagnétisme ; pour être vraiment complet, il faudrait ajouter la thermodynamique, qui était au départ une branche indépendante, mais dont les liens avec la mécanique commençaient à être compris grâce aux travaux de Maxwell et de Boltzmann en particulier. La mécanique, née avec Galilée et Newton, se proposait d’expliquer le mouvement d’objets matériels sous l’action de forces. Le paradigme d’un objet matériel est la particule ou le corpuscule, que l’on peut se représenter intuitivement comme une boule de billard de très petites dimensions que j’appellerai par la suite une micro-boule de billard. Le second volet de la physique du XIXe siècle est l’électromagnétisme, théorie des champs électrique et magnétique et aussi des ondes lumineuses, suite à la synthèse réalisée par Maxwell entre électromagnétisme et optique. On avait d’un côté une théorie mécanique, où de la matière se manifestant sous un aspect discret (corpusculaire) était transportée le long de trajectoires bien localisées, et de l’autre une théorie ondulatoire, décrivant des phénomènes continus ne correspondant pas à un transport de matière. Les deux théories régissaient des domaines distincts, le seul lien manifeste étant la loi donnant la force sur une particule chargée dans un champ électromagnétique, ou force de Lorentz. En 1905, Einstein met fin à cette vision dichotomique particule/onde et donne le coup d’envoi à deux révolutions de la physique : la relativité restreinte et la physique quantique. En premier lieu, il montre que les équations de la mécanique de Newton doivent être modifiées lorsque la vitesse des particules n’est plus négligeable par rapport à la vitesse de la lumière : c’est la révolution de la relativité restreinte, qui introduit dans la mécanique une quantité caractéristique de l’optique, la vitesse de la lumière. Cependant, c’est un aspect de la révolution einsteinienne qui ne nous intéressera pas directement, sauf dans le chapitre 7. En second lieu, Einstein introduit le
caractère particulaire ou corpusculaire de la lumière : dans un langage moderne, il introduit l’aspect quantique du champ électromagnétique, matérialisé par le concept de photon. Après un bref rappel sur les ondes de la physique classique, ce chapitre nous conduira au cœur du monde quantique, à partir d’un exemple développé en détail, l’interféromètre de Mach-Zehnder. Il s’agit d’un instrument couramment utilisé dans les laboratoires de physique mais, bien entendu, la description qui en est donnée ci-après reste très schématique, au niveau de ce que mes collègues expérimentateurs appelleraient « un interféromètre de théoricien » ! 1 1.1
Les ondes de la physique classique Ondes de surface dans une mare
Tout le monde a lancé au moins une fois dans sa vie un caillou dans une mare parfaitement calme et a vu se développer à partir du point de chute du caillou un système d’ondes circulaires se propageant à la surface de la mare. Pour caractériser le phénomène ondulatoire, on peut placer un bouchon à une certaine distance du point de chute. Le bouchon reste immobile tant qu’il n’est pas atteint par le système d’ondes, il se met ensuite à osciller et finit par s’immobiliser lorsque la mare redevient calme. Afin d’obtenir un phénomène régulier, on peut remplacer le caillou par une tige verticale animée d’un mouvement périodique contrôlé qui perturbe la surface de l’eau. Dans ces conditions, et si l’amplitude des vagues est suffisamment faible, la trajectoire du bouchon est un cercle de rayon constant dont le centre est immobile : la position moyenne du bouchon est fixe (le bouchon n’avance pas avec la vague). Les mouvements ondulatoires sont caractérisés par une amplitude ondulatoire, ou amplitude de vibration ; dans le cas du bouchon, en chaque point de la mare, on peut choisir la hauteur maximale atteinte par rapport à sa position d’équilibre en eau calme. Cette amplitude ondulatoire sera notée a et ses propriétés seront précisées ultérieurement. Compte tenu du caractère périodique de l’excitation, le mouvement vertical du bouchon est aussi périodique : il passe par son altitude maximale à des intervalles réguliers séparés par un intervalle de temps T appelé la période des oscillations. Compliquons un peu l’expérience en disposant un mur vertical entre le point où la surface est perturbée et le point d’observation de l’onde, là où se trouve le bouchon. On a découpé dans ce mur deux fentes verticales, ce qui permet à l’onde de se propager vers le bouchon. Si une des fentes est fermée, on obtient alors un système d’ondes appelé figure de diffraction de la fente restée ouverte (figures 1.1a pour l’expérience et 1.2 pour une simulation numérique). Ouvrons maintenant les deux fentes : le résultat remarquable est que le système d’ondes ne se déduit pas de
18
Chapitre 1. Un principe qui dérange
(a)
(b)
Figure 1.1. Diffraction et interférence d’ondes à la surface de l’eau. (a) Une seule fente est ouverte : on obtient une figure de diffraction. (b) Les deux fentes sont ouvertes : on obtient une figure d’interférence. On distingue les maxima d’interférence (les « doigts ») où l’oscillation est la plus forte et, entre les « doigts », des régions où un bouchon resterait immobile. Reproduit de T. Hey and P. Walters, The New Quantum Universe, Cambridge University Press, Cambridge (2003).
façon évidente des figures de diffraction des deux fentes. Par exemple, si le bouchon oscille quand la fente 1 est ouverte et la fente 2 fermée, et qu’il oscille également avec 2 ouverte et 1 fermée, il peut arriver qu’il reste immobile lorsque les deux fentes sont ouvertes ! Ce phénomène, cas particulier d’une interférence (figures 1.1b et 1.2), vient de ce que l’amplitude totale de vibration du bouchon s’obtient en additionnant les amplitudes de diffraction de la fente 1 et de la fente 2 suivant des règles que nous allons préciser. Pour comprendre ces règles d’addition, examinons un point de la surface. Appelons a1 l’amplitude ondulatoire en ce point lorsque la fente 1 est ouverte et la fente 2 fermée, et a2 l’amplitude correspondant à la situation inverse. Supposons qu’au point considéré les ondes issues des deux fentes passent par leur altitude maximale au même instant : on dit alors que les deux ondes sont en phase. Dans ces conditions, l’amplitude ondulatoire totale est la somme a = a1 + a2 des deux amplitudes, et on observe une interférence constructive. Si, en un autre point de la surface, une des deux ondes passe par un maximum alors que l’autre onde passe par un minimum, on dira que les deux ondes sont en opposition de phase. L’amplitude totale est alors a = a1 − a2 ou, plus précisément, avec notre définition de l’amplitude fondée sur l’altitude maximale, la valeur absolue |a1 − a2 | lorsque a1 < a2 , et on observe une interférence destructive. On distingue nettement sur la figure 1.1b ou la figure 1.2 les zones d’interférence constructive et destructive. La discussion qui précède met en lumière une propriété essentielle : en présence d’une seule amplitude
LE MONDE QUANTIQUE
19
1 0,5 0 −0,5 −1
Diffraction
Interférences
Figure 1.2. Simulation numérique de la diffraction (figure de gauche) et des interférences (figure de droite) à un instant fixé. L’altitude du bouchon par rapport à sa position en eau calme est donnée par un code couleur : elle est comprise entre −1 (rouge) et +1 (bleu) : l’amplitude des oscillations vaut 1. On distingue nettement sur la figure de droite les deux lignes d’interférence destructive. Figure réalisée par Mathieu Le Bellac.
ondulatoire (une seule fente ouverte), la seule information pertinente – en dehors de la période des oscillations – est la hauteur maximale atteinte par le bouchon en un point donné. En revanche, lorsque l’on veut combiner deux amplitudes ondulatoires (deux fentes ouvertes), on doit disposer d’une information supplémentaire qui est en fait une mesure du décalage temporel entre les deux ondes. Ce décalage est caractérisé par un angle δ qui est la différence de phase, ou le déphasage, entre ces deux amplitudes. L’interférence constructive correspond à δ = 0 et l’interférence destructive à δ = π, et les cas intermédiaires seront traités ultérieurement (section 1.5 et annexe A1.4). L’intensité I du phénomène ondulatoire est donnée par le carré de l’amplitude : I = a2 . L’énergie transportée par un système de vagues est proportionnelle à leur intensité, et donc au carré de leur amplitude. Si deux ondes d’égale intensité interfèrent destructivement, on observera une intensité nulle et, si au contraire elles interfèrent constructivement, on observera une intensité qui vaut 4 fois l’intensité de chacune des ondes. Ces règles d’addition curieuses viennent de ce que ce sont les amplitudes des ondes qui s’additionnent, et non les intensités. 1.2
Ondes lumineuses
Le phénomène ondulatoire est évidemment bien plus général que les ondes de surface, et il existe une grande variété d’ondes. Les plus importantes sont les ondes sonores, qui correspondent à des vibrations dans les gaz, les liquides ou les solides, et surtout les ondes lumineuses, qui correspondent aux vibrations du champ électromagnétique. Dans ce dernier cas, l’amplitude ondulatoire n’est autre que celle du champ électromagnétique. Comme dans le cas des ondes de surface, ces ondes sont caractérisées par une période, une amplitude de vibration et une intensité lumineuse I
20
Chapitre 1. Un principe qui dérange
qui est proportionnelle au carré du champ électrique (ou magnétique) de l’onde lumineuse. Comme les ondes lumineuses vont jouer un rôle majeur par la suite, il est utile de rappeler brièvement quelques-unes de leurs propriétés. Les ondes lumineuses se propagent dans le vide à la vitesse de la lumière, c = 300 000 000 m/s = 3 × 108 m/s (voir l’annexe A1.1 pour la notation exponentielle). Elles sont un cas particulier des ondes électromagnétiques dont le spectre, qui s’étend des rayons γ aux ondes radio, est donné sur la figure 11.1 et en annexe A1.2. Comme dans le cas des ondes de surface, une caractéristique importante d’une onde électromagnétique est sa période T . Il est plus habituel de caractériser une onde électromagnétique par sa fréquence ν, qui est l’inverse de la période : ν = 1/T et est mesurée en hertz (symbole Hz). Une onde se répète périodiquement dans l’espace et la périodicité spatiale est la longueur d’onde λ = cT = c/ν : c’est la distance qui sépare deux crêtes successives d’une onde qui se propage. Les ondes lumineuses ont une longueur d’onde comprise entre λ = 0,4 μm (violet) et λ = 0,7 μm (rouge) ; 1 μm = 1 micromètre = 10−6 m, parfois appelé micron.
2
L’interféromètre de Mach-Zehnder
Les ondes lumineuses, tout comme les ondes à la surface de l’eau, donnent lieu à des phénomènes de diffraction et d’interférence. Une expérience d’interférence classique est celle des fentes d’Young, analogue optique de l’expérience de la figure 1.1b. Cette expérience est souvent utilisée pour introduire la physique quantique, mais je choisirai plutôt l’interféromètre de Mach-Zehnder qui en illustre les principes encore plus directement. La figure 1.3 illustre l’interféromètre. Un rayon lumineux, par exemple un faisceau laser, arrive depuis la gauche suivant la direction X sur une première lame séparatrice L1 , inclinée à 45◦ par rapport à l’horizontale. Une vitre est un exemple de lame séparatrice, aussi appelée lame semi-transparente : en se regardant dans une vitre sous une incidence convenable, on peut voir à la fois son image (lumière réfléchie) et l’extérieur (lumière transmise). Une lame séparatrice, supposée non absorbante, transmet une fraction p de la lumière incidente et en réfléchit une fraction 1 − p. La lame est équilibrée si p = 50 %. La lame L1 est supposée équilibrée, elle réfléchit 50 % de l’intensité initiale (trajet bleu), qui part donc suivant la direction Y et en transmet 50 % (trajet rouge), qui continue suivant X . Les faisceaux du trajet bleu et du trajet rouge sont ensuite recombinés par une seconde lame séparatrice équilibrée L2 grâce à l’utilisation de deux miroirs. Les miroirs et les lames sont supposés parfaitement non absorbants, de sorte que l’intensité à la sortie de l’interféromètre est égale à l’intensité à l’entrée : si I est l’intensité lumineuse incidente, elle se répartit à la sortie de l’interféromètre après la seconde lame
LE MONDE QUANTIQUE
21
DY aY M1
IY
L2
aX
DX
IX Y
a/ 2
X
laser
a/ 2
a L1
M2
Figure 1.3. L’interféromètre de Mach-Zehnder. Un faisceau laser arrive horizontalement en bas à gauche de la figure avec une intensité I = a 2 . Il est divisé en deux sous-faisceaux d’égale intensité (les amplitudes sont donc divisées par 2) par la lame L 1 , et chaque sous-faisceau subit une réflexion par les miroirs M1 et M2 (en vert). Les deux sous-faisceaux sont recombinés par L 2 et détectés en DX et DY , avec des intensités respectives I X et I Y , I = I X + I Y .
en I X suivant la direction X et I Y suivant la direction Y , et la somme de ces deux intensités doit être égale à l’intensité incidente. Appelons a l’amplitude ondulatoire à l’entrée de l’interféromètre. Ainsi que nous l’avons mentionné, l’intensité est proportionnelle au carré de l’amplitude, à un facteur de proportionnalité près que nous pouvons ignorer : I = a2 . Les intensités sont divisées par deux au passage par une lame et les amplitudes par 2. Afin de simplifier la discussion, nous admettrons que les trajets rouge et bleu sont de longueur égale. La lumière arrivant sur le détecteur DX via le trajet bleu subit une réflexion sur la première lame et une transmission par la seconde, et vice versa pour la lumière prenant le trajet rouge. Les parcours suivis par la lumière sur chacun des trajets sont donc exactement identiques (même distance parcourue, même nombre de réflexions et de transmissions), ce qui veut dire que les amplitudes ondulatoires correspondantes s’additionnent sur le bras orienté suivant X après la seconde lame : l’interférence est constructive. Toute la lumière incidente est reçue par le détecteur DX et, par conservation de l’énergie lumineuse,
22
Chapitre 1. Un principe qui dérange
l’intensité lumineuse reçue par le détecteur DY est nulle, ce qui correspond à une interférence destructive : l’amplitude aY = 0. Encadré 1.1. Interférence constructive et destructive.
Après avoir subi une réflexion et une transmission, chaque amplitude est divisée par ( 2)2 = 2, l’amplitude en DX vaut aX = a/2 + a/2 = a, et l’intensité lumineuse reçue par le détecteur DX est I X = a2 = I . L’interférence destructive en DY vient de ce que les deux trajets ne sont plus identiques : la lumière passant par le trajet bleu subit deux réflexions, et celle passant par le trajet rouge deux transmissions. On montre en optique que deux réflexions multiplient l’amplitude par −1 : aY = a/2 − a/2 = 0.
3 3.1
Photons Introduction au concept de photon
Jusqu’au début du siècle dernier, les physiciens considéraient que la théorie ondulatoire de la lumière, fondée sur les vibrations du champ électromagnétique, rendait parfaitement compte de tous les phénomènes optiques. La théorie corpusculaire de Newton, où l’on supposait un rayon lumineux composé d’un grand nombre de corpuscules se propageant en ligne droite dans le vide, était complètement discréditée car elle était incapable d’expliquer les phénomènes de diffraction et d’interférence. C’est cette théorie ondulatoire qui nous a servis dans l’étude de l’interféromètre de Mach-Zehnder. En 1905, Einstein vint chambouler ce bel édifice. Partant d’un argument théorique de mécanique statistique, Einstein conclut que la lumière devait aussi présenter un aspect corpusculaire (ou particulaire). De plus, Einstein complétait son argument théorique en donnant l’explication d’un phénomène de seuil mystérieux observé dans l’effet photoélectrique : l’émission d’électrons par un métal illuminé ne se produit que si la longueur d’onde est suffisamment courte, un phénomène en totale contradiction avec la théorie ondulatoire classique qui ne prévoit aucun effet de ce genre. En 1915, Millikan, jusque-là farouche opposant à la théorie d’Einstein, effectua une série de mesures très précises de l’effet photoélectrique et dut se rendre à l’évidence : Einstein avait raison ! On connaît aujourd’hui les limites de l’argument : on peut parfaitement expliquer l’effet photoélectrique sans renoncer à la théorie ondulatoire classique, pourvu que la matière soit traitée par la physique quantique. Cependant, l’intuition d’Einstein était correcte : dans certaines expériences, la lumière peut se présenter sous forme de « grains de lumière », que l’on appelle des photons, une terminologie qui n’a été introduite par Lewis qu’en 1926. En fait, il a fallu attendre 1977, plus de 70 ans après l’hypothèse d’Einstein, pour que des expériences d’optique prouvent indubitablement l’existence de photons, les résultats de
LE MONDE QUANTIQUE
23
ces expériences contredisant les prédictions de la théorie ondulatoire. Il faut néanmoins souligner que, dès les années 1950, les physiciens nucléaires et des particules avaient montré l’existence de photons de haute énergie, les photons γ (voir la figure 11.1 et l’annexe A1.2). La raison pour laquelle les photons ne font pas partie de notre quotidien est que le nombre de photons auquel nous sommes confrontés dans la vie de tous les jours est énorme, et nous n’en voyons que les effets collectifs, pas individuels : l’aspect corpusculaire s’estompe dans un flux de photons continu. Pour fixer les idées, prenons l’exemple d’une diode laser qui émet dans le rouge une puissance P = 1 mW = 10−3 joule par seconde (J/s). D’après Einstein, l’énergie E de chaque photon dans le faisceau lumineux émis par la diode est reliée à la fréquence lumineuse ν par la relation, appelée relation de Planck-Einstein E = hν
(1.1)
h = 6,63 × 10−34 J × s (joule fois secondes).
(1.2)
où h est la constante de Planck,
La fréquence correspondant à une lumière rouge est ν 3,8 × 1014 Hz, et l’énergie d’un photon individuel dans le faisceau est donc 2,5×10−19 J. Le nombre de photons traversant par seconde une surface perpendiculaire au faisceau, ou flux de photons, est P/hν 4 × 1015 , un nombre énorme même pour une puissance aussi faible. Afin d’illustrer le caractère corpusculaire de la lumière, nous avons choisi un exemple emprunté à l’astrophysique. La figure 1.4 représente la photographie d’un ensemble d’étoiles prise avec une caméra CCD qui enregistre l’arrivée de photons individuels : les caméras CCD ont remplacé les plaques photographiques en astrophysique dès le début des années 1980. Sur la photographie de gauche, les photons semblent arriver de façon complètement aléatoire. Lorsque le nombre de photons enregistrés augmente, on constate qu’ils arrivent en fait de façon préférentielle en des points correspondant à des images d’étoiles. 3.2
Photons et probabilités
Une propriété de l’aspect corpusculaire de la lumière doit sauter aux yeux, c’est le caractère probabiliste de la détection des photons. Comme nous venons de le remarquer, dans la photographie de gauche de la figure 1.4, à première vue les photons semblent arriver complètement au hasard, mais en fait ils ont une forte probabilité d’arriver en un point où se forme l’image d’une étoile et une faible probabilité d’arriver en dehors d’un tel point. Cet aspect probabiliste est un point crucial et il vaut la peine d’en donner une autre illustration, en utilisant une lame séparatrice
24
Chapitre 1. Un principe qui dérange
Figure 1.4. Une même photographie d’étoiles avec des expositions différentes. Dans tous les cas, le nombre de pixels est 10 000. La photo de gauche correspond à la détection de 440 photons, celle du centre à 4 400 et celle de droite à 44 000. Courtoisie de Michel Laget.
équilibrée (figure 1.5a). Imaginons que nous disposions un atténuateur sur le faisceau de la diode laser précédente, de sorte que la puissance du faisceau soit réduite d’un facteur un milliard et diminue jusqu’ à 10−12 W. Un calcul simple, utilisant la vitesse de la lumière c = 3 × 108 m/s, montre que les photons successifs sont séparés en moyenne de 100 m, et il semble raisonnable d’admettre que des photons isolés arrivent sur la lame. Dans une analogie hydrodynamique, nous sommes passés d’un robinet qui coule continûment à un robinet mal fermé qui coule goutte à goutte. Pour des raisons exposées dans l’annexe A2.3, cette façon simple de produire des photons isolés est sujette à critique ; heureusement, on dispose aujourd’hui de sources assez performantes de photons véritablement uniques émis à la demande, où chaque photon est identifié par l’instant où il est émis. Revenons à la lame séparatrice équilibrée de la figure 1.5a sur laquelle nous envoyons des photons uniques. Afin de simplifier l’argument, supposons que les détecteurs sont à 100 % efficaces : si un photon arrive sur le détecteur, celui-ci est déclenché, et il n’est jamais déclenché en l’absence de photon (pas de coups sombres, ou « dark counts »), un détecteur de rêve pour les expérimentateurs ! On constate qu’un photon donné ne déclenche qu’un seul des deux détecteurs, DX ou DY , qu’il a une probabilité de 50 % d’être transmis et une probabilité de 50 % d’être réfléchi. Il n’arrive jamais que les deux détecteurs soient déclenchés simultanément, ce qui montre que le photon ne se divise pas. Nous retrouvons l’optique classique en envoyant un grand nombre de photons successifs : par exemple, si nous envoyons 10 000 photons, nous devons en avoir environ 5 000 transmis et 5 000 réfléchis.
LE MONDE QUANTIQUE
25
amplitude de probabilité DY
aX
Y
aY L photon 1
X S
photon 2
L DX
(a)
photon 3
DX
(b)
DY
Figure 1.5. (a) Une source de photons uniques S envoie des photons sur une lame séparatrice équilibrée L . Les photons transmis sont détectés par DX et les photons réféchis par DY . (b) Représentation très schématique des amplitudes de probabilité aX et aY : pour la clarté de la figure, la lame L et les détecteurs ont été alignés sur un axe horizontal, l’axe vertical donnant l’amplitude. L’amplitude de probabilité totale est la superposition de aX et aY , et elle n’est différente de zéro qu’au voisinage des détecteurs. Dans l’exemple de la figure, le premier et le second photon déclenchent DX et le troisième déclenche DY .
Encadré 1.2. Fluctuations statistiques et sondages.
Plus précisément, avec une probabilité de 70 %, le nombre de photons transmis sera compris entre 4 900 et 5 100 : en effet, les fluctuations statistiques sont de l’ordre de 10 000 = 100, soit 1 % en valeur relative. C’est ce qui se passe pour un sondage : un sondage sur un échantillon 10 000 personnes a une marge d’erreur de 1 %, un sondage standard sur un échantillon 1 000 personnes une marge d’erreur de 3 % ( 1 000 30). Un gain de 2 % dans un sondage n’a donc strictement aucune signification. Cette marge d’erreur est appelée erreur statistique, mais il peut s’y ajouter une erreur systématique, provenant par exemple d’un échantillon biaisé. Le même phénomène se produit dans une expérience de physique quantique. Comme le nombre d’événements enregistrés est fini, le caractère probabiliste de la théorie entraîne que tout résultat est limité par une erreur statistique d’autant plus faible que le nombre d’événements enregistrés est plus grand. Il s’ajoute une erreur systématique, due par exemple aux imperfections de l’appareillage.
Les probabilités de transmission et de réflexion d’un photon dans le schéma de la figure 1.5a sont connues, mais le sort individuel d’un photon ne peut pas être prédit : la seule information disponible est sa probabilité de détection par DX ou DY . En physique quantique, les probabilités sont associées à des systèmes quantiques individuels alors qu’en physique classique les probabilités sont associées à des ensembles (une notion qui sera définie ci-après), et le recours aux probabilités
26
Chapitre 1. Un principe qui dérange
est une façon de prendre en compte la complexité de phénomènes que nous ne pouvons pas (ou ne voulons pas) connaître dans le détail. Par exemple, quand on tire à pile ou face, la connaissance parfaite des conditions initiales du lancer de la pièce, la prise en compte de la résistance de l’air, de la configuration du sol d’arrivée, etc. permettraient en théorie de prévoir le résultat. En pratique, une information aussi détaillée n’est pas accessible, et on raisonne sur des ensembles de pièces, c’est-à-dire sur le lancer d’un grand nombre de pièces identiques, ou sur celui d’une seule pièce que l’on lance un grand nombre de fois. Si les pièces ne sont pas biaisées, la théorie des probabilités décrit correctement les résultats en admettant une probabilité de 50 % pour chacune des faces de la pièce. En théorie classique des probabilités, chaque individu de l’ensemble est dans un état où tous ses paramètres sont déterminés, même s’ils nous sont inconnus, mais ce n’est pas le cas en physique quantique où il n’existe pas de tels paramètres : l’aspect probabiliste ne peut pas être attribué à notre ignorance. Si dans l’expérience de la figure 1.5a deux photons successifs sont préparés de façon strictement identique, il se peut que le premier photon déclenche DX et le second DY , mais nous n’avons aucun moyen de le savoir à l’avance. Cela est en contradiction complète avec la physique classique, pour laquelle la connaissance des conditions initiales permet de prévoir complètement l’évolution future d’un système, même si l’on sait que cet énoncé possède une valeur pratique limitée : en effet, pour des problèmes présentant un caractère chaotique, deux conditions initiales très proches peuvent donner lieu à des trajectoires complètement différentes au bout d’un certain temps. Cependant, il se pourrait que nous ayons seulement l’impression de préparations strictement identiques, mais peut-être certaines données nous ont-elles échappé : si nous avions accès à des variables supplémentaires, inconnues pour le moment, et appelées pour cette raison variables cachées, alors nous pourrions prédire avec certitude le sort individuel de chaque photon. Nous aurons l’occasion de revenir sur cette question au chapitre 3 et au chapitre 10. Quelques physiciens (dont de Broglie, Bohm etc.) ont proposé cette explication au caractère probabiliste de la physique quantique en lui redonnant une interprétation d’ignorance. Toutefois, nous verrons ultérieurement les raisons pour lesquelles ces variables cachées sont peu plausibles aux yeux de la majorité des physiciens. 3.3
Amplitudes de probabilité et principe de superposition
Reprenons le dispositif de la figure 1.5a, mais en remplaçant la source de photons uniques par un laser qui envoie sur la lame séparatrice un faisceau d’intensité I, laquelle se répartit également entre les deux trajets : les intensités mesurées par les détecteurs DX et DY sont I X = I Y = I/2. À ces intensités correspondent des amplitudes ondulatoires aX et aY , dont les carrés donnent les intensités correspondantes.
LE MONDE QUANTIQUE
27
Dans le cas de photons uniques, les probabilités de détection par DX et DY sont ProbX = 1/2 et ProbY = 1/2, et ces probabilités pour les photons uniques jouent le rôle des intensités pour les ondes lumineuses. On peut alors se poser la question : existe-t-il pour les photons un analogue des amplitudes ondulatoires ? La réponse est positive : on peut associer à l’émission d’un photon par la source un nombre a et à sa détection deux nombres aX et aY dont le carré représente la probabilité de déclencher DX ou DY , ProbX = a2X et ProbY = a2Y . Ces nombres sont appelés amplitudes de probabilité. La situation est schématisée sur la figure 1.5b : les amplitudes aX et aY ne sont différentes de zéro qu’au voisinage des détecteurs. L’amplitude aY a été choisie négative, pour souligner le fait que les amplitudes de probabilité ne sont pas en général des nombres positifs ; en toute rigueur, ce sont mathématiquement des nombres complexes (encadré 1.3 et annexe A1.3). La situation schématisée sur la figure 1.5b illustre le concept fondamental de superposition linéaire (ou superposition cohérente) de deux états quantiques : le photon est dans une superposition de deux états quantiques localisés au voisinage des détecteurs, mais un seul des deux détecteurs est déclenché. Ce type de superposition n’est pas propre aux photons : on pourrait facilement réaliser la même expérience avec des neutrons, la lame séparatrice étant alors un cristal, ou bien avec des atomes, où un laser joue le rôle de lame séparatrice. Encadré 1.3. Nombres complexes.
En toute rigueur mathématique, l’amplitude de probabilité a est un nombre complexe. La représentation mathématique des amplitudes de probabilité fait intervenir des nombres complexes, dont les propriétés essentielles sont résumées dans l’annexe A1.3. Un nombre tel que a se décompose en une partie réelle b et une partie imaginaire ic, où b et c sont des nombres réels et i2 = −1 : a = b + ic. Les calculs algébriques suivent les règles de l’algèbre usuelle des nombres réels, en tenant compte de i2 = −1. La valeur absolue |a| du nombre complexe a est par définition un nombre positif tel que |a|2 = b2 +c 2 . Les nombres complexes ne sont qu’une commodité mathématique en optique ondulatoire classique. Ils deviennent indispensables en physique quantique.
On donne souvent de cette situation de superposition linéaire l’image intuitive suivante : le photon (ou tout autre objet quantique comme un neutron ou un atome) se trouve en plusieurs endroits à la fois. Cependant, aussi utile que puisse être cette image, elle ne doit pas être prise à la lettre. L’énoncé correct est le suivant : si l’on mesure la position d’un objet quantique, alors on le trouvera en un point d’espace avec une certaine probabilité, mais cela ne veut pas dire qu’il se trouvait en ce point avant la mesure. Contrairement à ce qui se passe en physique classique, la mesure ne révèle pas une réalité préexistante. Lorsqu’un gendarme mesure sur une autoroute la vitesse de votre voiture avec un radar, cette vitesse existait avant la mesure, ce qui donne au représentant de l’ordre la légitimité pour verbaliser si cette vitesse dépasse
28
Chapitre 1. Un principe qui dérange
130 km/h par beau temps. Ce n’est pas le cas en physique quantique : un atome peut parfaitement se trouver dans un état où sa vitesse n’a pas de valeur déterminée, par exemple dans un état de superposition linéaire de deux vitesses. La mesure de cette vitesse donnera une des deux valeurs, mais cela ne veut pas dire que l’atome possédait cette vitesse avant la mesure. Le fait qu’un objet quantique puisse se trouver dans un état de superposition linéaire (ou simplement superposition) de deux ou plusieurs états quantiques est une caractéristique fondamentale, et sans doute la plus fondamentale, de la physique quantique.
Nous n’avons aucune expérience tangible de ce principe de superposition dans notre monde habituel, qui est macroscopique et régi par les lois de la physique classique. C’est pourquoi ce principe est très surprenant, il contredit notre vision intuitive du monde, bref il dérange. Cela explique les débats qui durent depuis 70 ans sur l’« interprétation » de ce principe, débats que nous essaierons de résumer au chapitre 10. Pour l’instant, il faut simplement nous habituer à vivre avec lui pour comprendre ce qui va suivre. 4
Photons dans l’interféromètre de Mach-Zehnder
Le fonctionnement de l’interféromètre n’a rien d’extraordinaire dans le cadre de la théorie ondulatoire classique, mais la situation va devenir beaucoup plus intéressante si nous prenons en compte l’aspect corpusculaire de la lumière. Que se passet-il si, au lieu d’envoyer un faisceau lumineux dans l’interféromètre, nous envoyons des photons isolés produits par une source de photons uniques, détectés en coïncidence avec leur instant de production par des clics des détecteurs DX et DY de la figure 1.3 (bien évidemment, il faut tenir compte d’un délai en raison du temps mis par le photon pour aller de la source aux détecteurs) ? Pour éviter toute ambiguïté, nous admettrons aussi qu’il n’y a jamais plus d’un photon à la fois dans l’interféromètre. Commençons par un raisonnement naïf mais erroné, car les raisonnements erronés sont souvent instructifs ! Un photon incident a une probabilité de 50 % de choisir le trajet rouge en L1 et ensuite une probabilité de 50 % de choisir en L2 le bras orienté X ou le bras orienté Y , soit au final une probabilité de 25 % d’arriver en DX et de 25 % d’arriver en DY . Comme ce photon aurait aussi bien pu choisir le trajet bleu en L1 , les deux détecteurs sont déclenchés avec une probabilité de 50 %. En résumé, si ProbX et ProbY sont les probabilités respectives de déclencher DX et DY , on s’attend au résultat suivant ProbX =
LE MONDE QUANTIQUE
1 2
ProbY =
1 2
·
29
Mais ce résultat « évident » a toutes les chances d’être faux, comme le montre le raisonnement heuristique suivant. Partons de la description de l’interféromètre en optique classique (section 1.2) et diminuons progressivement l’intensité lumineuse, jusqu’à ce que l’intervalle moyen entre deux photons incidents soit suffisamment important pour qu’il n’y ait pas plus d’un photon à la fois dans l’interféromètre : les détecteurs enregistrent alors des coups isolés. Le résultat de l’optique classique, I X = I, I Y = 0, nous conduit à penser qu’en fait ProbX = 1 et ProbY = 0. Les raisonnements théoriques sont utiles, mais c’est à l’expérience d’avoir le dernier mot, et celle-ci faite avec des photons uniques (figure 1.8) tranche en faveur du second résultat, typique d’un phénomène d’interférence ProbX = 1
ProbY = 0.
Si le résultat correct est celui suggéré par l’optique ondulatoire, cela veut dire qu’il faut raisonner sur les amplitudes, et non sur les probabilités ! De fait, il suffit de raisonner sur les amplitudes de probabilité par analogie avec les amplitudes ondulatoires pour obtenir le résultat correct. Une première leçon à tirer de cette discussion est que le photon exhibe à la fois des propriétés corpusculaires lorsqu’il déclenche le détecteur en un point déterminé (il n’arrive jamais de fraction de photon) et des propriétés ondulatoires, car le fait que 100 % des photons arrivent en DX est typique d’un phénomène d’interférence constructive. Le photon n’est ni une particule classique (une micro-boule de billard), ni une onde. C’est un objet entièrement nouveau dont nous n’avons aucune expérience tangible, car notre intuition est fondée sur l’observation d’un monde classique. Aucune description classique ne peut rendre compte de la richesse des propriétés d’un photon : c’est un objet quantique, que certains auteurs désignent par le néologisme « quanton ». La deuxième leçon est que les intensités lumineuses ont été remplacées par des probabilités de détection : au lieu de I X et I Y , les quantités pertinentes sont les probabilités ProbX et ProbY . De même, comme nous l’avons vu au § 1.3.3, l’amplitude ondulatoire a devient une amplitude de probabilité, et son carré a2 n’est pas une intensité, mais une probabilité de déclencher un détecteur. La troisième leçon est que la notion de trajet du photon perd sa signification. En effet, supposons que nous puissions déterminer si un photon particulier de notre ensemble de photons uniques a choisi le trajet bleu ou le trajet rouge, autrement dit, supposons que nous ayons trouvé un marqueur de trajet. Nous verrons au chapitre 8 comment réaliser un tel marqueur ; voir également la figure 1.11. Grâce à ce marqueur, nous pourrions diviser les photons en deux groupes, le groupe des photons ayant suivi le trajet bleu et celui ayant suivi le trajet rouge. Prenons par exemple le groupe des photons ayant choisi le trajet rouge : comme nous l’avons expliqué ci-dessus, quand un photon de ce type arrive sur la lame L2 , il a une probabilité
30
Chapitre 1. Un principe qui dérange
1/2 de continuer suivant la direction X et une probabilité 1/2 de continuer suivant la direction Y , de sorte que ProbX =ProbY = 1/2, et il n’y a plus d’interférence. Une configuration d’interférence implique l’impossibilité de répondre à la question : « quel trajet a suivi un photon particulier ? » Ce point est si important qu’il vaut la peine de donner une autre version de l’argument. En présence d’interférence, nous pourrions être tentés de dire qu’une des deux éventualités suivantes a été réalisée pour un photon particulier de notre ensemble. 1. Éventualité 1. Le photon a suivi le trajet bleu. 2. Éventualité 2. Le photon a suivi le trajet rouge. Mais la réalisation d’une de ces éventualités impliquerait l’absence d’interférence, car on pourrait alors diviser les photons en deux groupes même en l’absence de marqueur. Pour chacun des groupes, aucune interférence n’est possible ; par conséquent, aucune des deux éventualités n’a été réalisée. Autrement dit, la question : « quel est le chemin suivi par un photon déterminé ? » ne peut pas avoir de sens, on n’est simplement pas autorisé à la poser. On pourrait être tenté de sortir de ce dilemme en affirmant : « le photon a suivi les deux chemins à la fois », mais ce n’est qu’une façon d’éluder le problème car un photon ne se divise pas. En fait, le seul énoncé correct est : « le photon se trouve dans un état de superposition linéaire (ou cohérente) des deux trajets ». Encadré 1.4. La théorie de de Broglie/Bohm.
Le raisonnement ci-dessus, popularisé par le cours de physique de Feynman et repris dans de nombreux manuels de mécanique quantique, contient cependant une faille. Ainsi que nous le verrons dans la section 10.4, dans la théorie de de Broglie/Bohm pour un interféromètre à neutrons, le neutron suit un des deux trajets. Supposons que le trajet bleu soit bloqué quand le neutron suit le trajet rouge et vice versa. Il se pourrait, et c’est le cas dans la théorie de de Broglie/Bohm, que le fait qu’un trajet soit bloqué ou non influence la propagation sur l’autre trajet. Cependant, les théories de ce type présentent un défaut rédhibitoire pour la majorité des physiciens : elles sont non locales (voir le chapitre 3 et le chapitre 10).
5
L’interféromètre de Mach-Zehnder revisité
Nous allons ajouter une (petite) complication à l’interféromètre de Mach-Zehnder, en allongeant le trajet bleu grâce à quatre miroirs supplémentaires. Sur le trajet bleu, la lumière parcourt une distance supplémentaire (figure 1.6). Si cette distance est un multiple entier de la longueur d’onde, = nλ avec n entier, rien ne va changer puisque que l’on a la même onde, que les miroirs supplémentaires soient présents ou non : si les ondes issues du trajet rouge et du trajet bleu étaient en phase au niveau
LE MONDE QUANTIQUE
31
DY IY
aY /2
M1
L2
aX
DX
IX Y
a/ 2
X
laser
a/ 2
a
M2
L1
Figure 1.6. L’interféromètre de Mach-Zehnder modifié. La lumière parcourt un trajet supplémentaire sur le trajet bleu et le déphasage δ = 2π/λ.
de la lame de sortie, elles le restent. Si est de la forme = (n + 1/2)λ, l’onde issue du trajet bleu va se trouver en opposition de phase avec celle issue du trajet rouge, et l’intensité dans DX sera nulle. Dans le cas général, l’intensité est donnée en fonction de l’angle δ = 2π/λ par (annexes A1.4 et A1.5) IX =
I 2
(1 + cos δ)
IY = I − IX =
I 2
(1 − cos δ).
(1.3)
δ est le déphasage introduit au § 1.1.1 qui mesure le retard pris par la lumière entre M1 et L2 en raison des miroirs supplémentaires. La fonction cos δ est représentée sur la figure 1.7. On obtient I X = I, I Y = 0 si δ est un multiple pair de π, δ = 2πn, n entier, et le cas inverse I X = 0, I Y = I si δ est un multiple impair de π, δ = (2n + 1)π. En général, l’intensité incidente est répartie de façon inégale dans les deux directions, et cette répartition varie en fonction de l’angle δ suivant la loi (1.3). Cette dépendance par rapport à δ est la manifestation du phénomène d’interférence dans ce dispositif. Le cas des photons uniques se déduit aisément de celui des ondes lumineuses : les règles de combinaison des amplitudes de probabilité sont identiques à celles des amplitudes ondulatoires. Comme en physique des ondes, ces amplitudes peuvent
32
Chapitre 1. Un principe qui dérange
sin δ
cos δ
+1
2π
2π
δ −1
Figure 1.7. La fonction cos δ (trait plein vert). Cette fonction se répète avec une période 2π : l’intervalle entre deux maxima successifs est 2π. La fonction cosinus est comprise entre −1 et +1 : −1 ≤ cos δ ≤ +1. Elle vaut +1 pour δ = 0, 2π, 4π, . . . et −1 pour δ = π, 3π, 5π, . . . La fonction sin δ est tracée en tirets rouges.
interférer constructivement ou destructivement, ou de façon intermédiaire. Le résultat de l’expérience effectué par Alain Aspect, Philippe Grangier et Gérard Roger en 1986 avec des photons uniques est représenté sur la figure 1.8 : chaque compteur enregistre des clics isolés, chaque photon déclenchant soit DX , soit DY . Lorsque le nombre de photons augmente, on voit la figure d’interférence se former photon après photon et reproduire l’équation (1.3). Pour retrouver les résultats de l’optique classique lorsque le nombre de photons devient grand, il faut que les photons empruntant le trajet horizontal après L2 soient détectés par le détecteur DX avec une probabilité ProbX = (1 + cos δ)/2, et ceux empruntant le trajet vertical par DY avec une probabilité ProbY = (1 − cos δ)/2, la somme des probabilités pour un photon donné d’être détecté par DX ou par DY étant bien égale à l’unité : ProbX + ProbY = 1. En effet, comme les photons ne sont pas absorbés sur leur parcours, un photon entré dans l’interféromètre doit déclencher soit DX , soit DY .
6 6.1
Particules quantiques Ondes de de Broglie
Incontestablement, un photon se comporte de manière bizarre. Mais il n’est pas le seul dans ce cas ! Toutes les particules de la physique microscopique : électrons, protons, neutrons, atomes, molécules. . . partagent ce comportement surprenant. Et pourquoi se limiter aux particules microscopiques ? Les protéines et les virus, les boules de billard et même les éléphants ne seraient-ils pas aussi des objets quantiques ? Nous ne savons pas répondre avec certitude à la question : existe-t-il une
LE MONDE QUANTIQUE
33
Figure 1.8. Construction progressive de la figure d’interférences photon par photon pour les détecteurs DX (Z1 ) et DY (Z2 ). Le déphasage δ est porté en abscisse. On remarque que les deux détecteurs donnent des signaux complémentaires en (1 + cos δ)/2 et (1 − cos δ)/2. Le temps passé pour l’enregistrement des photons et pour une valeur donnée de δ varie entre 0,01 s (figure du haut) et 10 s (figure du bas). A. Aspect, P. Grangier et G. Roger, « Dualité onde-corpuscule pour un photon unique », J. Optics (Paris) 20, 119 (1989). Courtoisie d’Alain Aspect et Philippe Grangier.
limite de taille au comportement quantique ? Nous avons cependant quelques indications sur une réponse possible, qui seront examinées au chapitre 9. Entrons dans quelques détails de la description quantique. Dire qu’une particule quantique possède des traits communs avec le photon implique qu’elle est possède à la fois des propriétés de particule et des propriétés d’onde. Pour un atome, par exemple, l’aspect particule est évident. Il est facile de l’imaginer et, en première approximation, l’image n’est pas trop inexacte, comme une micro-boule de billard dont le diamètre est de l’ordre d’un dixième de nanomètre (1 nm = 10−9 m, un milliardième de mètre). Mais qu’en est-il de l’aspect ondulatoire ? C’est en 1923 que Louis de Broglie énonça l’hypothèse selon laquelle la longueur d’onde λ d’une
34
Chapitre 1. Un principe qui dérange
particule quantique était reliée à sa masse m et à sa vitesse v par sa célèbre relation λ=
h mv
(1.4)
où λ est la longueur d’onde de de Broglie. En fait, cette équation n’est valable que pour des vitesses faibles par rapport à la vitesse de la lumière, v c. Pour de telles vitesses, l’impulsion (ou la quantité de mouvement) p est donnée par p = mv , et on peut récrire (1.4) sous la forme λ = h/p. Sous cette seconde forme, la relation de de Broglie est générale si l’on utilise pour l’impulsion la formule de la relativité restreinte. Dans le cas d’un photon, l’impulsion p est reliée à son énergie E par p = E/c ; combinant la relation de Planck-Einstein (1.1) et celle de de Broglie (1.4), on retrouve bien λ = h/p. L’hypothèse de de Broglie implique que l’on doit observer pour toute particule quantique des phénomènes caractéristiques des ondes, à savoir diffraction et interférence. De fait, interférence et diffraction ont été observées pour une grande variété de particules : électrons, neutrons, atomes, molécules. Je me limiterai à trois exemples. 1. On réalise couramment au laboratoire des interféromètres de Mach-Zehnder fonctionnant avec des neutrons ou des atomes et on les utilise quotidiennement pour des expériences de précision. 2. Une expérience de fentes d’Young spectaculaire a été réalisée avec des atomes froids (chapitre 5). Les atomes froids tombent sous l’effet de la pesanteur sur les deux fentes et ils se répartissent sur l’écran en formant une figure d’interférence (figure 1.9). 3. Les gyrolasers, utilisés dans les centrales inertielles de navigation des avions et qui ont remplacé les gyroscopes, fonctionnent suivant un principe analogue à celui de l’interféromètre de Mach-Zehnder. Une rotation de vitesse angulaire ω autour d’un axe perpendiculaire au plan de l’interféromètre produit un déphasage δ = 2πωνS/c 2 , où S est l’aire comprise entre les bras de l’interféromètre et ν la fréquence lumineuse. La figure d’interférence dépend de δ, ce qui permet de remonter à la vitesse de rotation ω de l’appareil. Au lieu de photons, on peut utiliser dans l’interféromètre des neutrons ou des atomes froids. La sensibilité est considérablement améliorée, mais il est difficile d’utiliser des neutrons ou des atomes froids dans un avion !
LE MONDE QUANTIQUE
35
atomes froids
3,5 cm
fentes 85 cm
écran de détection
1 cm
Figure 1.9. Interférence avec des atomes froids. Les atomes froids tombent sous l’effet de la pesanteur sur les deux fentes et se répartissent sur l’écran en formant une figure d’interférence. On observe que la figure d’interférence est formée d’impacts isolés des atomes sur l’écran. Expérience réalisée par F. Shimizu, K. Shimizu et H. Takuma, « Double-slit interference with ultracold metastable neon atoms », Physical Review, A46, R17 (1992).
Encadré 1.5. Effet Sagnac.
L’effet utilisé dans le gyrolaser est l’effet Sagnac : quand l’interféromètre est en rotation autour d’un axe perpendiculaire à son plan, le faisceau qui suit le sens de rotation arrive sur L2 après celui qui prend le chemin inverse. Pour une vitesse de rotation suffisamment faible, la différence de temps d’arrivée est Δt = 2ωS/c 2 , d’où le déphasage δ. Si l’on utilise dans l’interféromètre des neutrons ou des atomes froids de masse m, alors δ = 4πmωS/h. Il est amusant d’observer que la formule simplifiée de l’effet Sagnac donnée ci-dessus pour des photons se démontre en utilisant la théorie de l’éther, discréditée par Einstein. Sagnac avait d’ailleurs vu dans cet effet une confirmation de la théorie de l’éther !
6.2
Règles de la physique quantique
Les objets quantiques se comportent donc de façon surprenante, avec cette double caractéristique ondulatoire et particulaire, mais on peut néanmoins enregistrer une simplification. Comme le dit Feynman, « Les objets quantiques sont complètement cinglés, mais au moins le sont-ils tous de la même façon », et ils sont tous assujettis aux mêmes règles. À ce point, il est utile de faire un premier recensement des règles de la physique quantique, parfois appelées « postulats de la physique quantique », ou « axiomes de la physique quantique », mais je préfère le terme plus neutre de « règles ». Bien entendu, il n’est pas possible de donner une « démonstration » de ces règles et, dans l’état de nos connaissances, ces règles ne découlent pas de concepts qui seraient encore plus fondamentaux. À l’heure actuelle, il est seulement possible de poser ces règles a priori, tant qu’elles ne sont pas contredites par l’expérience. Elles sont fondées sur la notion de processus, défini par la donnée d’un état initial et
36
Chapitre 1. Un principe qui dérange
d’un état final, par exemple : état initial → le photon entre dans l’interféromètre en L1 , état final → il est détecté en DX . Ces règles sont les suivantes. Règle n◦ 1. À tout processus défini par un état initial et un état final correspond une amplitude de probabilité. Exemple : le nombre aX dans la figure 1.3 est l’amplitude de probabilité pour qu’un photon entrant dans l’interféromètre (état initial) soit détecté par DX (état final). Règle n◦ 2. La probabilité d’observer le processus est le carré de l’amplitude de probabilité, en toute rigueur le carré |a|2 de la valeur absolue du nombre complexe : ceci est la règle de Born. Exemple : la probabilité pour un photon de déclencher DX est a2X . Il arrive souvent que l’on ne se préoccupe pas de normaliser à l’unité la somme de toutes les probabilités et dans ce cas la probabilité du processus est seulement proportionnelle, et non exactement égale, au carré de la valeur absolue de l’amplitude de probabilité. Règle n◦ 3 (principe de superposition). S’il existe deux processus partant du même état initial et aboutissant au même état final auxquels correspondent respectivement des amplitudes a1 et a2 , alors l’amplitude totale s’obtient en additionnant les deux amplitudes. Le résultat (annexes A1.4 et A1.5) dépend non seulement des carrés a12 et a22 , mais aussi du déphasage δ entre les deux amplitudes, et la probabilité totale a2 est donnée par a2 = a12 + a22 + 2|a1 a2 | cos δ.
(1.5)
Si l’on utilise des nombres complexes, cette relation est équivalente à |a|2 = |a1 +a2 |2 . C’est cette propriété qui est bien évidemment à l’origine des interférences. Exemple : dans l’interféromètre de Mach-Zehnder, pour obtenir aX , on doit additionner les amplitudes provenant du trajet bleu et du trajet rouge. La règle ne s’applique que s’il y a impossibilité de décider entre les trajets : les deux trajets doivent être indiscernables. Au contraire, si les deux trajets correspondent à des états finaux que l’on peut distinguer, alors on doit ajouter les probabilités : Prob = Prob1 + Prob2 = a12 + a22 , et l’interférence disparaît. Il suffit que la distinction entre les deux trajets soit possible en principe, mais il n’est pas du tout indispensable qu’elle soit effectivement observée. Il pourrait même arriver que la technologie d’aujourd’hui soit incapable d’effectuer l’observation, même si celle-ci est théoriquement envisageable : cela ne change rien aux règles. Il suffit qu’il reste quelque part une trace du trajet suivi, même non exploitable, pour que l’interférence soit détruite. En résumé, c’est la configuration expérimentale, et non une observation effectuée ou non effectuée, qui dicte l’application correcte du principe de superposition. Nous l’illustrerons par l’expérience à choix retardé dans la section suivante.
LE MONDE QUANTIQUE
37
Figure 1.10. Photographie d’une partie de l’appareillage dans l’expérience à choix retardé : production de photons uniques. Expérience réalisée par V. Jacques, E. Wu, F. Grosshans, F. Treussart, Ph. Grangier, A. Aspect and J.-F. Roch, « Experimental realization of Wheeler’s delayed choice experiment », Science 315, 966 (2007). Courtoisie de Jean-François Roch.
7
Choix retardé et mesure « sans interaction »
Je conclurai ce chapitre 1 par deux compléments sur l’interféromètre de MachZehnder, en commençant par décrire une expérience dite à choix retardé. Supposons la seconde lame L2 mobile : elle peut être en place suivant le schéma de la figure 1.3, ou au contraire elle peut être absente. Si elle est en place, on observe une interférence, ProbX = 1, ProbY = 0 et si elle ne l’est pas, on revient à ProbX = ProbY = 1/2. Supposons en outre que le déplacement de cette lame puisse être effectué très rapidement, de sorte qu’elle soit mise en place ou non quand le photon est déjà entré dans l’interféromètre, par exemple qu’il se trouve au niveau des miroirs. Cette expérience est appelée « à choix retardé » car la mise en place de la seconde lame n’est décidée qu’après que le photon a franchi la première. On pourrait naïvement penser que l’interférence est absente, que la seconde lame soit en place ou non, puisqu’une fois franchie la première lame, le photon doit avoir choisi le trajet bleu ou le trajet
1
Cette section peut être omise dans une première lecture.
38
Chapitre 1. Un principe qui dérange
λ/2
MEO PW L1
48 m
L2
Figure 1.11. Schéma de l’expérience à choix retardé. Un photon unique entre dans l’interféromètre et rencontre une première lame biréfringente L 1 (chapitre 2) qui joue le rôle de lame séparatrice. Il « emprunte » un des deux trajets selon son état de polarisation (chapitre 2) verticale (trajet supérieur) ou horizontale (trajet inférieur). Une lame demi-onde λ échange les polarisations, de sorte que les deux trajets peuvent être recombinés par une seconde lame L 2 . Le prisme de Wollaston PW (chapitre 2) permet de distinguer les états de polarisation et d’étiqueter le trajet suivi : il n’y a pas d’interférence, la polarisation joue comme un marqueur du trajet. Un modulateur électro-optique MEO peut faire tourner la polarisation de 45◦ et effacer l’information sur la polarisation. Si ce modulateur électro-optique est activé, on retrouve l’interférence.
rouge. Mais après la mise en place de la seconde lame, les deux trajets restent indiscernables et la règle n◦ 3 implique l’existence d’interférence. L’expérience a été réalisée en 2007 par un groupe Institut d’optique/ENS Cachan (figure 1.10), avec un interféromètre de Mach-Zehnder dont le principe est cependant légèrement différent de celui de la figure 1.3. Dans cet interféromètre, le photon parcourt un trajet de 48 m, ce qui lui prend 0,16 μs. Aucun dispositif mécanique ne serait capable de déplacer une lame dans un laps de temps aussi court, et les expérimentateurs ont eu recours à un dispositif électro-optique dont l’action est équivalente au déplacement de la lame. Le schéma du montage est donné sur la figure 1.11. Les résultats confirment en tout point la théorie quantique : l’interférence est observée si et seulement si la seconde lame est en place, et manifestement la notion de trajectoire du photon perd toute signification en présence d’interférence. Cette expérience semble valider le point de vue de Bohr selon lequel les objets quantiques n’ont pas d’existence indépendante de l’appareillage macroscopique utilisé pour les manipuler (chapitre 10). Lorsque la lame L2 est en place, le photon qui se propage dans l’interféromètre n’est simplement pas le même objet que lorsqu’elle ne l’est pas. Ce point de vue a pour fondement la distinction entre un monde classique macroscopique décrit par la physique classique et un monde quantique : en d’autres termes, il repose sur l’existence d’une frontière entre un monde classique, le seul accessible à notre expérience, et un monde quantique que nous ne pouvons connaître que par l’intermédiaire de dispositifs macroscopiques. Cependant, comme
LE MONDE QUANTIQUE
39
DY
M1
L2
DX
bombe
S
a L1
M2
Figure 1.12. Dispositif pour une mesure sans interaction. S = source de photons uniques.
nous le verrons au chapitre 9, on peut avoir de sérieux doutes sur l’existence d’une telle frontière classique/quantique. Le deuxième complément permet d’introduire le concept de mesure sans interaction. Supposons qu’un obstacle soit placé sur la partie orientée Y du trajet rouge (figure 1.12), qui empêche le photon d’atteindre L2 . On a réglé l’interféromètre comme dans la section 2.2 de sorte que ProbX = 1, ProbY = 0 en l’absence d’obstacle : tous les photons arrivent en DX . Afin de rendre le sujet plus dramatique, on suppose que l’obstacle est une bombe, et il suffit qu’elle soit touchée par un seul photon pour exploser : il est donc impossible de voir directement la bombe sans conséquences catastrophiques. On ne sait pas a priori si la bombe est présente ou non, et il y a trois éventualités possibles : si la bombe est présente, le photon emprunte le trajet bleu ou le trajet rouge et, si elle est absente, il y a interférence. 1. La bombe explose : le photon a choisi le trajet rouge. Bien entendu, aucun des compteurs n’est déclenché, car tout l’appareillage a été détruit ! 2. Le compteur DX est déclenché : dans ce cas, soit la bombe était présente et le photon a choisi le trajet bleu, soit elle était absente et nous étions dans une situation d’interférence. 3. Le compteur DY est déclenché.
40
Chapitre 1. Un principe qui dérange
C’est ce dernier cas qui est intéressant, car on peut conclure que la bombe était présente, mais que le photon a choisi le trajet bleu. Ainsi nous avons pu détecter la présence de la bombe sans aucunement interagir avec elle : c’est un exemple de mesure sans interaction. Nous avons pu sonder une région de l’espace sans y accéder directement. Cependant, l’expression « mesure sans interaction » est un peu abusive. D’une part, elle repose implicitement sur une image classique et, d’autre part, l’effet repose aussi sur l’existence d’un hamitonien d’interaction entre le photon et la bombe, même quand celle-ci n’est pas touchée. 8
Bibliographie
Grand public. Je recommande vivement le livre de V. Scarani, Initiation à la physique quantique, Vuibert, Paris (2003) et celui d’E. Klein, Petit voyage dans le monde des quanta, Champs Flammarion, Paris (2004). Plus de quarante ans après sa rédaction, la lecture de l’ouvrage de R. Feynman Leçons sur la physique, chapitre 6, Odile Jacob, Paris (2000) est toujours aussi instructive. On pourra aussi consulter le dossier de La Recherche n◦ 29, « Le monde quantique », (2007). Un autre livre excellent est celui de T. Hey et P. Walters, The New Quantum Universe, Cambridge University Press, Cambridge (2003). Niveau avancé. Le manuel standard de physique quantique est celui de C. CohenTannoudji, B. Diu et F. Laloë, Mécanique quantique, Hermann, Paris (1973). Deux livres plus récents sont celui de J.-L. Basdevant et J. Dalibard, Mécanique quantique, Éditions de l’École Polytechnique, Palaiseau (2001) et celui de M. Le Bellac, Physique quantique, EDP Sciences/CNRS Éditions, 2e édition (2007).
LE MONDE QUANTIQUE
41
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
2 Des transmissions sécurisées La première application de la physique quantique examinée dans ce livre est la cryptographie quantique. Cette application est récente, elle date seulement du milieu des années 1980, mais je l’ai choisie car elle a l’avantage d’illustrer les règles fondamentales avec un minimum d’intermédiaires. Je commencerai par rappeler les bases de la cryptographie classique en décrivant brièvement les deux systèmes de cryptage utilisés aujourd’hui : le système à clé secrète et le système à clé publique. Plusieurs dispositifs expérimentaux ont été proposés pour la cryptographie quantique, qui n’est pas une nouvelle façon de crypter un message, mais permet de s’assurer que la transmission d’une clé secrète n’a pas été espionnée. Le dispositif le plus simple repose sur la propriété de polarisation. Après avoir introduit le concept de lumière polarisée, je passerai au cas de la polarisation des photons. C’est en utilisant les propriétés de la polarisation que je décrirai une des mises en œuvre possibles du protocole appelé BB84, qui n’est qu’un protocole parmi les nombreux autres proposés pour la cryptographie quantique.
1
La cryptographie classique : clé secrète et clé publique
La cryptographie, ou l’art de transmettre à un correspondant un message qui ne puisse pas être compris par une partie adverse, est pratiquement aussi ancienne que l’écriture. Un tel message est dit chiffré (cf. le service du chiffre dans les armées) ou crypté. On utilise parfois message codé (cf. The da Vinci code), mais un message codé n’est pas nécessairement crypté. Par exemple, un message écrit à l’aide d’un codage binaire n’est pas en général crypté. Le premier chiffrage (ou cryptage) moderne fut sans doute celui utilisé par Jules César dans les années 50 avant notre
ère, le chiffrage par substitution : à chaque lettre de l’alphabet est substituée une autre lettre, par exemple la lettre suivante dans l’alphabet. Le message « LE LEGIONNAIRE VOREMUS . . . » (voir la série de la BBC Rome) devient ainsi « MF MFHJPOOBJSF WPSFNVT. . . » Il est bien connu que ce type de cryptage est très facile à casser, même si l’on utilise une loi de substitution plus sophistiquée qu’un simple décalage de l’alphabet : il suffit de se fonder sur la fréquence d’apparition des lettres et des groupements de lettres, en particulier des doubles-lettres, dans une langue déterminée. Ce cryptage fut considérablement amélioré vers 1 550 par Blaise de Vigenère, qui eut l’idée d’utiliser une clé permettant de coder chaque lettre par une lettre différente selon sa position dans le message : par exemple, une même lettre, A, pouvait être codée par E, X ou H. Ce cryptage a résisté pendant trois siècles aux efforts des casseurs de code, jusqu’à ce que Charles Babbage en vienne à bout vers 1850. L’amélioration suivante fut le codage automatique. En 1918, Arthur Schoebius construisit une machine électromécanique – il n’y avait pas d’électronique à l’époque – qu’il baptisa ENIGMA. Avec cette machine, le texte du message est tapé directement sur un clavier et des ampoules s’allument pour donner le codage de chaque lettre qui s’effectue au moyen de rotors dont la disposition est fixée par une clé de cryptage. Le destinataire effectue le décodage de la même manière : le texte crypté est tapé sur le clavier et les ampoules donnent pour chaque lettre la correspondance en clair. Cette machine fut perfectionnée par l’armée nazie et largement utilisée par cette dernière durant la seconde guerre mondiale, en particulier pour les communications avec ses sous-marins. Afin de protéger les convois alliés des sous-marins allemands, une véritable course de vitesse fut menée avec succès par les casseurs de code de Bletchley Park, dirigés par le mathématicien de génie Alan Turing. Aujourd’hui, un ordinateur standard permettrait de casser un message crypté par ENIGMA en quelques secondes, le temps nécessaire pour essayer toutes les combinaisons. Jusqu’aux années 1970, les messages chiffrés étaient réservés pour l’essentiel aux militaires et aux diplomates. Avec l’explosion de l’électronique et des communications par fibres optiques, le cryptage est devenu omniprésent dans la vie quotidienne : communications avec les banques, transactions commerciales, achats sur Internet, déclarations de revenus. . . nécessitent l’utilisation de messages cryptés. Dans l’acronyme https://, le « s » indique que l’on se trouve sur un site sécurisé et, en principe, le numéro de votre carte bancaire ou votre feuille d’impôts sont protégés par un cryptage et ne circulent pas en clair sur le réseau. Il existe à l’heure actuelle deux grands types de cryptage. Le premier est dit à clé secrète, ou cryptage symétrique, et le second à clé publique, ou cryptage asymétrique. L’exemple type de cryptage à clé secrète est celui inventé par Vernam en 1926. L’expéditeur et le destinataire doivent partager une clé, qui est connue d’eux seuls, d’où la dénomination « cryptage à clé secrète ». Cette clé est une suite aléatoire de 0
44
Chapitre 2. Des transmissions sécurisées
et de 1. Le message est d’abord traduit en langage binaire, comme une suite de 0 et de 1. Le cryptage s’effectue en additionnant le message et la clé en utilisant l’addition modulo 2 sans retenue, le « ou exclusif » des informaticiens, notée par le symbole ⊕ et dont les règles sont élémentaires 0⊕0=0
0⊕1 = 1⊕0= 1
1 ⊕ 1 = 0.
J’illustrerai ce cryptage par un exemple simple message
:
100110100
cl´ e
:
110111101
message crypt´ e
:
010001001
Le décryptage s’effectue tout simplement en additionnant le message crypté et la clé message crypt´ e
:
010001001
cl´ e
:
110111101
message en clair
:
100110100
Claude Shannon a prouvé que ce cryptage était absolument sûr, à condition que : 1. la clé soit parfaitement aléatoire ; 2. elle ne soit utilisée qu’une seule fois ; 3. elle soit aussi longue que le message. Les variantes modernes comme l’AES (Advanced Encryption System) sont très sûres, à condition que la clé puisse être partagée de façon sécurisée par les deux correspondants. Le point faible du cryptage à clé secrète réside dans le point 2 ci-dessus : il faut fréquemment partager la clé entre partenaires et ce partage est un processus à risque. Par exemple, les deux partenaires doivent se retrouver en un même lieu pour partager la clé, ou faire confiance à un intermédiaire pour la transmettre, ou stocker des clés dans un coffre-fort : dans tous les cas, le processus est soit complexe, soit risqué. C’est pour cette raison que l’on préfère souvent les systèmes fondés sur un principe différent, les systèmes à clé publique, où la clé est diffusée publiquement, par exemple sur Internet ou par téléphone. Le système à clé publique courant, appelé chiffrage RSA, acronyme formé des initiales de ses trois inventeurs Ronald Rivest, Adi Shamir et Leonard Adleman (1977), est fondé sur la difficulté de décomposer un nombre entier très grand, N , en facteurs premiers (c’est-à-dire de l’écrire comme un produit de nombres premiers), ce que l’on appelle aussi factoriser N , alors que l’opération inverse est immédiate : même sans calculette, on obtiendra en quelques
LE MONDE QUANTIQUE
45
secondes 137 × 53 = 7 261, mais étant donné 7 261, cela prendra un certain temps pour le décomposer en 137 × 53. Avec les meilleurs algorithmes actuels, le temps de calcul nécessaire pour décomposer un nombre N en facteurs premiers croît comme exp[1,9(ln N )1/3 (ln ln N )2/3 ], où ln N est le logarithme népérien de N (en gros le nombre de chiffres nécessaire pour écrire N ), et il faut aujourd’hui quelques mois à une grappe de PC pour factoriser un nombre d’environ 200 chiffres. Plus concrètement, la formule précédente nous dit que, s’il faut un mois à un ordinateur pour factoriser un nombre de 200 chiffres, il faudra 100 000 ans au même ordinateur pour factoriser un nombre de 400 chiffres ! Dans le système de chiffrage à clé publique, le destinataire, appelé conventionnellement Bob, diffuse publiquement à l’expéditeur, appelé conventionnellement Alice, un nombre très grand N = pq, produit de deux nombres premiers p et q, ainsi qu’un autre nombre c. C’est donc le destinataire qui transmet la clé ! Les deux nombres N et c suffisent à Alice pour chiffrer le message, mais il faut disposer des nombres p et q pour le déchiffrer (annexe A2.1). Cependant, il n’existe aucune preuve mathématique du fait que l’on ne pourra pas un jour factoriser aisément un nombre très grand : on ne peut pas exclure que l’on dispose un jour d’algorithmes plus performants que les algorithmes actuels pour décomposer un nombre en facteurs premiers. De plus, si les ordinateurs quantiques voient le jour, on sait déjà que la factorisation en nombres premiers deviendra un problème « facile » : pour passer de 200 à 400 chiffres, il suffira de multiplier par 8 le temps de calcul. Encadré 2.1. Complexité algorithmique.
La théorie de la complexité algorithmique permet, en première approximation, de classer les problèmes en deux grandes catégories. On a d’une part ceux dont la solution sur un ordinateur est « facile », tels que le nombre d’opérations ne croît pas trop vite avec la taille du problème, et d’autre part ceux dont la solution est « difficile », tels que le nombre d’opérations croît très vite avec la taille, de sorte que la solution n’est pas accessible en pratique, même s’il existe en principe un algorithme pour résoudre le problème. Ce point sera détaillé au § 8.3.
2
Polarisation de la lumière
La cryptographie classique repose donc soit sur l’utilisation d’une clé secrète dont la transmission sécurisée est problématique, soit sur des propriétés mathématiques qui ne sont pas prouvées. Le cryptage RSA s’écroulerait du jour au lendemain si l’on prouvait que la factorisation en nombres premiers est un problème « facile », d’où l’idée de recourir à la cryptographie quantique qui est en théorie absolument sûre. « Cryptographie quantique » est une expression médiatique, mais elle est quelque peu inexacte. En effet, il n’est pas question de crypter un message à l’aide de la physique quantique, mais d’établir une clé en ayant la garantie que cette clé est restée
46
Chapitre 2. Des transmissions sécurisées
θ
(a)
(b) Figure 2.1. Passage d’un faisceau lumineux à travers un polaroïd. (a) La polarisation initiale de la lumière fait un angle inconnu θ avec la verticale. Une fraction de l’intensité lumineuse est arrêtée par le polaroïd d’axe vertical, la fraction qui sort du polaroïd est polarisée verticalement (bleu), et elle est arrêtée par le second polaroïd d’axe horizontal. (b) Le premier polaroïd transmet 100 % de la lumière incidente polarisée verticalement. Le second polaroïd est orienté à 45◦ de la verticale, la lumière qui en sort (bleu) est polarisée dans cette direction ; 25 % de la lumière incidente (violet) franchit le dernier polaroïd et elle est polarisée horizontalement.
secrète : l’expression correcte est transmission (ou distribution) quantique d’une clé (Quantum Key Distribution, en abrégé QKD). La cryptographie quantique est donc supposée résoudre le problème du partage sécurisé de la clé dans les protocoles à clé secrète comme l’AES, et la sécurité du partage repose sur la seule hypothèse de la validité des lois de la physique quantique. Afin d’expliquer les principes de base, je décrirai le protocole proposé en 1984 par les chercheurs Charles Bennett (IBM) et Gilles Brassard (Montréal), connu sous l’acronyme BB84. Afin de rester aussi simple que possible, je me limiterai à une mise en œuvre particulière de ce protocole, celle qui utilise la propriété de polarisation de la lumière. C’est un phénomène familier, qui a pour origine le fait que la vibration lumineuse s’effectue dans un plan perpendiculaire à sa direction de propagation. Supposons qu’un rayon lumineux se propage dans une direction horizontale. Un polaroïd dont l’axe est vertical transmet uniquement la lumière vibrant le long de cet axe, et l’on obtient à la sortie du polaroïd une lumière polarisée verticalement (figure 2.1a). Si l’on place après le premier polaroïd un second dont l’axe peut prendre différentes orientations, bien sûr toujours perpendiculaires à la direction de propagation, on obtiendra par exemple les résultats suivants.
LE MONDE QUANTIQUE
47
| 〉
| ↔〉 Figure 2.2. Un prisme de Wollaston, ou prisme polarisant, divise un faisceau incident en deux sous-faisceaux dont les polarisations sont orthogonales. La polarisation du faisceau dévié vers le haut se trouve dans le plan de la figure, celle du faisceau dévié vers le bas dans le plan perpendiculaire à la figure.
1. Si l’axe du second polaroïd est vertical, il transmet 100 % de la lumière filtrée par le premier. 2. Si l’axe est horizontal, alors ce second polaroïd ne transmet rien : deux polaroïds croisés arrêtent tout rayon lumineux (figure 2.1a). Les lunettes polaroïd fonctionnent suivant ce principe : normalement orientées sur le nez de leur propriétaire, elles transmettent uniquement la lumière polarisée verticalement et absorbent la lumière polarisée horizontalement. Cela permet d’éliminer les réflexions gênantes par exemple sur la neige, car la lumière réféchie est principalement polarisée horizontalement. 3. Si l’axe du second polaroïd fait un angle de 45◦ avec la verticale, il transmet 50 % de la lumière filtrée. Cela implique que si l’on insère entre deux polaroïds croisés un polaroïd dont l’axe fait un angle de 45◦ avec la verticale, 25 % (le carré de 50 %) de la lumière filtrée initialement sont transmis (figure 2.1b), et cette lumière est polarisée horizontalement. Au lieu du polaroïd, qui laisse passer la vibration suivant son axe et stoppe la vibration perpendiculaire, il est souvent avantageux d’utiliser un prisme de Wollaston (figure 2.2), ou prisme polarisant, qui dirige la lumière dans deux directions différentes selon sa polarisation sans l’absorber : un prisme dont l’axe est vertical divise un faisceau incident en deux sous-faisceaux, l’un polarisé verticalement ( ), l’autre horizontalement (↔). Si l’on polarise une lumière quelconque à l’aide d’un polaroïd dont l’axe est vertical, et que l’on place ensuite un prisme de Wollaston, dont l’axe fait un angle de 45◦ avec la verticale, 50 % de la lumière partira dans une direction et 50 % dans l’autre. Dans le cas d’une lumière polarisée linéairement, si l’on ne connaît pas la direction de la polarisation d’une lumière incidente, il est toujours
48
Chapitre 2. Des transmissions sécurisées
possible de la déterminer en mesurant le rapport de l’intensité transmise par un polaroïd à l’intensité initiale. 3 3.1
Polarisation d’un photon Le théorème de non-clonage quantique
La description classique de la polarisation ne pose guère de problèmes de principe, mais il n’en va pas de même pour la polarisation d’un photon. Comme on l’a vu, on sait depuis Einstein que la lumière possède des propriétés corpusculaires, elle est formée de « grains de lumière », les photons. On sait aujourd’hui fabriquer des sources de photons uniques assez performantes, où les photons sont identifiés individuellement par l’instant où ils sont produits. De même que la lumière, les photons peuvent être polarisés, verticalement, horizontalement, à 45◦ ou suivant toute autre direction perpendiculaire à leur direction de propagation. En plus des polarisations verticale (V ) et horizontale (H), nous ferons un usage intensif des polarisations à 45◦ , notée D (pour diagonale) et à −45◦ , notée A (pour antidiagonale). Examinons des photons de polarisation D par exemple, obtenus lorsque des photons uniques ont franchi un polaroïd orienté à 45◦ par rapport à la verticale (le polaroïd intermédiaire de la figure 2.1b). Si nous analysons la polarisation de ces photons en les faisant passer à travers un polaroïd d’axe vertical, ils sont transmis avec une probabilité de 50 %, et le même résultat vaut pour un polaroïd d’axe horizontal, en accord avec le schéma de la figure 2.1b pour la lumière polarisée classique. Mais cela ne veut pas dire qu’arrivent sur les polaroïds d’analyse des photons parfois polarisés H et parfois polarisés V . Tout comme le photon de la figure 1.4 est dans un état de superposition linéaire d’états localisés au voisinage de deux positions linéaire des états V etH, différentes, l’état de polarisation D est une superposition que j’écrirai symboliquement D = (V + H)/ 2. Dans cette représentation, 1/ 2 est une amplitude de probabilité, dont le carré 1/2 donne la probabilité de 50 % pour qu’un photon dans l’état de polarisation D franchisse un polaroïd d’axe vertical ou horizontal,en accord avec la discussion précédente. L’état A est représenté par A = (V − H)/ 2, ce qui montre que les signes des amplitudes ont une importance, pas seulement leurs carrés. On peut alors se poser la question suivante. Est-il possible de déterminer la polarisation d’un photon incident sur lequel on possède uniquement l’information suivante : ce photon est polarisé soit verticalement, soit horizontalement, soit à ±45◦ ? Faisons passer ce photon à travers un polaroïd d’axe vertical. Si le photon est transmis, cela veut dire qu’il n’était certainement pas polarisé horizontalement, mais n’exclut pas qu’il ait été polarisé à ±45◦ , puisque dans ce cas le photon aurait eu une chance sur deux d’être transmis par le polaroïd d’axe vertical (figure 2.1b).
LE MONDE QUANTIQUE
49
Mais pour vérifier cette hypothèse, il faudrait disposer d’un deuxième photon identique et refaire l’analyse cette fois avec un polaroïd orienté à 45◦ (D), ce qui n’est pas possible car nous n’avions qu’un seul photon. Cet argument montre que, pour déterminer l’état de polarisation porté par le photon, il faudrait être capable de le dupliquer afin de pouvoir procéder à une analyse suivant les deux orientations : vertical/horizontal et ±45◦ . En physique classique, il n’existe aucune limite à la possibilité de copier l’information : nous utilisons quotidiennement cette possibilité en photocopiant un document ou en téléchargeant un fichier sur Internet et en le recopiant sur le disque dur de notre ordinateur. Tel n’est pas le cas en physique quantique, où cette possibilité est contrainte par un théorème fondamental, déduit directement du principe de superposition, le théorème de non-clonage quantique. Afin de démontrer ce théorème dans un cas simple (mais le théorème est général), je me restreindrai à quatre orientations possibles pour la polarisation, correspondant à deux configurations : vertical/horizontal : {V H} et +45◦ /−45◦ : {DA}. Je vais montrer qu’il est possible de recopier (cloner) l’état de polarisation porté par les photons s’ils sont tous soit dans la configuration {V H}, soit dans la configuration {DA}, mais un dispositif capable de cloner l’état de polarisation porté par les photons dans la configuration {V H} ne pourra pas le faire dans la configuration {DA}, et vice versa. Supposons en effet qu’il existe une machine à cloner quantique, capable de dupliquer les états de polarisation V et H portés par un photon. Nous avons donc une Q-photocopieuse qui présente une page blanche, un état de polarisation X , sur lequel va s’imprimer l’état à dupliquer. Cette Q-photocopieuse a l’action suivante sur les états V et H V X =⇒ V V
H X =⇒ H H.
On en déduit son action sur l’état D 1 1 DX = (V + H)X =⇒ (V V + H H). 2 2 Mais on n’obtient pas l’état souhaité, car dupliquer D donnerait 1 1 1 DX =⇒ DD = (V + H) (V + H) = (V V + V H + H V + V V ). 2 2 2 Cela clôt la démonstration : la Q-photocopieuse ne peut pas photocopier correctement l’état D. En résumé, si l’on connaît la configuration de polarisation des photons incidents, c’est-à-dire si l’on sait à l’avance que les photons sont polarisés {V H} ou {DA}, un prisme de Wollaston convenablement orienté donne la direction de la polarisation : dans le cas {V H}, on orientera le prisme comme dans la figure 2.2, dans le cas {DA}
50
Chapitre 2. Des transmissions sécurisées
il faudra le faire tourner de 45◦ autour de la direction de propagation des photons incidents. Si l’on sait que tous les photons relèvent d’une seule et même configuration, mais que celle-ci est inconnue, alors on peut obtenir une détermination fiable de leur polarisation en clonant un nombre suffisant de photons et en analysant leur polarisation. Si l’on ne dispose d’aucune information préalable, il est impossible de déterminer la polarisation en raison du théorème de non-clonage. On notera une généralisation intéressante : il est impossible de déterminer un état quantique inconnu. Cependant, le concept « d’état quantique inconnu » frise l’oxymore, comme nous le verrons au chapitre 10. Encadré 2.2. Bases orthonormées.
Le terme mathématique exact pour « configuration » est base orthonormée. Comme on l’explique dans l’annexe A2.2, on fait correspondre aux états V et H deux vecteurs notés |V 〉 et |H〉 formant une base orthonormée d’un espace complexe à deux dimensions, avec 〈V |V 〉 = 〈H|H〉 = 1
〈V |H〉 = 0,
où 〈X |Y 〉 désigne le produit scalaire de deux vecteurs |X 〉 et |Y 〉. À la configuration {V H} correspond mathématiquement la base orthonormée {|V 〉, |H〉}. Aux polarisations à ±45◦ correspondent des vecteurs |D〉 et |A〉 1 |D〉 = (|V 〉 + |H〉) 2
1 |A〉 = (|V 〉 − |H〉). 2
Ces deux vecteurs, superpositions linéaires des états |V 〉 et |H〉, forment eux aussi une base orthonormée.
3.2
Codage binaire d’un message par la polarisation
La transmission d’un message, chiffré ou non, peut se faire en utilisant deux états de polarisation orthogonaux d’un photon, par exemple V ( ) et H (↔). On peut décider d’attribuer par convention la valeur 0 à la polarisation V et la valeur 1 à la polarisation H : chaque photon transporte donc un bit d’information. Une fois le message, chiffré ou non, écrit en langage binaire comme une suite de 0 et de 1, un message apparaît par exemple sous la forme 1 001 110. Il est codé par Alice grâce à la séquence d’états de polarisation H V V H H H V , qu’elle expédie à Bob par exemple par une fibre optique. À l’aide d’un prisme de Wollaston, Bob sépare les photons de polarisation verticale et horizontale comme dans la figure 2.2, et deux détecteurs placés derrière le prisme lui permettent de décider si le photon était polarisé horizontalement ou verticalement : il peut donc reconstituer le message. S’il s’agissait d’un message ordinaire, il y aurait bien sûr des façons bien plus simples et efficaces de le transmettre ! Remarquons simplement que si un espion, appelé par convention Ève,
LE MONDE QUANTIQUE
51
s’installe sur la fibre, détecte les photons, mesure leur polarisation grâce à un prisme de Wollaston et renvoie à Bob des photons de polarisations identiques à ceux expédiés par Alice, Bob n’a aucun moyen de savoir que la ligne a été espionnée. Si Ève ne connaît pas la configuration de polarisation des photons, mais si elle sait que celle-ci est unique, elle peut mesurer leur polarisation par clonage. Il en serait de même pour tout dispositif fonctionnant de façon classique : si l’espion prend suffisamment de précautions, il est indétectable.
4 4.1
Le protocole BB84 pour la cryptographie quantique Le protocole quantique
52
↔
↔
↔
↔
C’est à ce point que la physique quantique vient au secours d’Alice et de Bob, en leur permettant de s’assurer que leur suite de bits n’a pas été interceptée : ce qui suit décrit d’abord la partie quantique du protocole. La suite de bits n’a pas besoin d’être longue (le système de transmission par la polarisation est très peu performant), puisqu’il s’agit d’établir une clé permettant de chiffrer un message ultérieur, clé qui pourra être remplacée à la demande. Pour tirer parti du théorème de non-clonage quantique, Alice va choisir de façon aléatoire deux configurations pour envoyer ses photons un par un : {V H} et {DA}, ce qui permet d’éviter leur clonage. Elle envoie donc à Bob quatre types de photon : polarisés verticalement V ( ) et horizontalement H (↔) comme précédemment, et polarisés suivant des axes inclinés à ±45◦ : A ( ) et D ( ), correspondant respectivement aux valeurs 0 et 1 des bits. De même, Bob analyse les photons envoyés par Alice à l’aide d’analyseurs disposés dans deux configurations identiques à celles d’Alice : verticale/horizontale {V H}, et ±45◦ {DA}. À nouveau le choix des configurations est fait de façon aléatoire, sans information sur la polarisation des photons envoyés par Alice. Une possibilité serait d’utiliser un prisme de Wollaston orienté aléatoirement soit verticalement, soit à 45◦ de la verticale, et de détecter les photons sortant de ce prisme comme dans la figure 2.2. Cependant, au lieu de faire tourner l’ensemble prisme + détecteurs, on utilise plutôt une cellule de Pockels, qui permet de transformer une polarisation donnée en une polarisation orientée de façon arbitraire tout en maintenant fixe l’ensemble prisme + détecteurs (figure 2.3). La figure 2.4 donne un exemple d’échanges entre Alice et , 1 s’il est polarisé ↔ ou . Bob : Bob enregistre 0 si le photon est polarisé ou Après enregistrement d’un nombre suffisant de photons, Bob annonce publiquement la suite des configurations qu’il a utilisées, mais non ses résultats. Alice compare sa séquence de configurations à celle de Bob et lui donne toujours publiquement la liste des configurations compatibles avec les siennes (colonnes vertes). Les bits qui correspondent à des configurations incompatibles (colonnes rouges) sont rejetés, et,
Chapitre 2. Des transmissions sécurisées
PW
PW
laser atténuateur Alice
P
détecteur
P Bob
Figure 2.3. Schéma du protocole BB84 mis en œuvre avec des photons polarisés. PW = prisme de Wollaston. P = cellule de Pockels. Les photons sont soit polarisés dans la configuration {V H} (flèches rouges), soit dans la configuration {DA} (flèches vertes).
Polarisations Alice
0
1
1
0
1
Résultats de Bob
0
0
1
0
1
Bits retenus
0
0
1
Suite de bits Configurations de Bob
Figure 2.4. Échange de photons polarisés entre Alice et Bob : les colonnes vertes sont conservées pour établir la clé, les colonnes rouges sont rejetées.
pour les bits restants, Alice et Bob sont certains que leurs valeurs sont les mêmes : ce sont les bits qui serviront à composer la clé, et ils sont connus seulement de Bob et d’Alice car l’extérieur ne connaît que la liste des configurations, pas les résultats ! On notera que la procédure élimine environ la moitié des bits envoyés par Alice. On pourrait conserver tous les bits si Bob était capable de stocker les polarisations reçues et de comparer après coup ses orientations avec celles d’Alice. Malheureusement le stockage des états de polarisation restera encore pour longtemps un fantasme de théoricien. . . 4.2
Partie classique du protocole
L’échange de photons polarisés constitue la partie quantique du protocole. Il reste à s’assurer que la clé n’a pas été interceptée et qu’elle peut être utilisée sans risque.
LE MONDE QUANTIQUE
53
Alice et Bob choisissent au hasard un sous-ensemble commun de leur clé et le comparent publiquement par une voie classique (téléphone ou Internet). La conséquence de l’interception de photons par Ève serait une réduction de la corrélation entre les valeurs de leurs bits. Supposons par exemple qu’Alice envoie un photon polarisé verticalement. Dans la stratégie la plus simple, mais pas la plus efficace, appelée stratégie interception-renvoi, Ève l’intercepte avec un prisme de Wollaston orienté par exemple à 45◦ . Supposons qu’elle trouve un photon polarisé à +45◦ . Elle ne sait pas que ce photon était initialement polarisé verticalement ; elle renvoie donc à Bob un photon polarisé dans la direction +45◦ et, dans 50 % des cas, Bob ne va pas trouver le bon résultat. Comme Ève a une chance sur deux d’orienter son prisme dans la bonne direction, Alice et Bob vont enregistrer une différence dans 25 % des cas et en conclure que leur clé a été interceptée pendant la transmission : la sécurité du protocole dépend du fait qu’Ève ne peut pas déterminer l’état de polarisation d’un photon si elle ne sait pas à l’avance dans quelle configuration il a été envoyé. Un fois l’échange de photons terminé, Alice et Bob disposent chacun d’une série de bits qui sont théoriquement identiques : la série 001 dans l’exemple de la figure 2.4. Cette série de bits forme une clé, une suite aléatoire de 0 et de 1 qui peut servir pour le cryptage classique ultérieur d’un message. Elle doit bien sûr être connue uniquement d’Alice et de Bob. En pratique, il existe des sources d’erreurs provenant des imperfections des détecteurs et de la fibre optique ou des tentatives d’espionnage. Comme nous l’avons expliqué ci-dessus, Alice et Bob sacrifient un sousensemble commun de leur série de bits et le comparent publiquement. Ceci leur permet de mesurer le taux d’erreur par bit quantique (QBER, Quantum Bit Error Rate), qui est simplement la probabilité que Bob mesure une valeur erronée de la polarisation, alors qu’il connaît celle envoyée par Alice. Grâce à la connaissance de ce taux d’erreur, ils peuvent utiliser un code correcteur d’erreurs classique (par opposition à quantique) qui leur permet de reconstituer deux séries de bits strictement identiques et aléatoires, qui forment la clé secrète. Cependant, l’ensemble du processus a éventuellement permis à Ève d’acquérir une certaine information sur la série de bits. Alice et Bob doivent donc utiliser un processus également classique appelé amplification de la confidentialité (privacy amplification) qui leur permet, en raccourcissant leur série de bits, d’avoir la certitude qu’Ève ne possède aucune information sur la série ainsi tronquée, et c’est cette dernière qui sera utilisée en tant que clé. Dans le cas du protocole BB84, on peut montrer que le QBER doit être inférieur à 11 % si Alice et Bob veulent disposer d’une clé fiable. Enfin, il faudrait utiliser des photons uniques, et non des paquets d’états cohérents produits par une lumière laser atténuée qui sont moins sûrs, mais que l’on doit choisir pour des raisons pratiques (encadré 2.3). Lorsque l’on utilise des fibres optiques, il est difficile de contrôler la polarisation sur de longues distances, et un support physique différent, la phase des photons, doit être utilisé pour mettre en œuvre le protocole BB84. Dans ce cas on peut établir
54
Chapitre 2. Des transmissions sécurisées
une clé sur environ 100 kilomètres avec un taux de l’ordre de quelques dizaines de kbits/seconde, et il existe aujourd’hui trois versions commercialisées du dispositif. Encadré 2.3. Impulsions atténuées et photons uniques.
Une impulsion laser atténuée utilisée en cryptographie quantique contient typiquement 0,1 photon en moyenne. On peut alors montrer qu’une impulsion non vide a une probabilité de 5 % de contenir deux photons (annexe A2.2), un fait qui peut être exploité par Ève, mais contre lequel on peut se prémunir en utilisant un « leurre ». Dans le cas de transmission de photons uniques, le théorème de non-clonage quantique garantit qu’il est impossible à Ève de tromper Bob, même s’il lui est possible de faire moins de 25 % d’erreurs sur les photons renvoyés à Bob en utilisant une technique d’interception plus sophistiquée que l’interception-renvoi. Par exemple, une technique de clonage partiel permet de ramener à 16 % la probabilité de renvoyer à Bob un photon dont l’état de polarisation est incorrect.
4.3
Limitations de la cryptographie quantique
La principale limitation de la cryptographie quantique vient de l’atténuation du signal dans une fibre optique. Dans le cas d’une impulsion lumineuse se propageant dans une fibre, l’intensité du signal diminue avec la distance, typiquement d’un facteur 100 sur 100 km, si bien que l’on doit utiliser des répéteurs pour retrouver la forme et l’intensité initiales du signal. Cela n’est pas possible pour des photons uniques, qui ne peuvent pas être clonés et donc amplifiés. La distance maximale qui sépare les utilisateurs sur une ligne de cryptage quantique est aujourd’hui limitée à une centaine de km. La raison essentielle vient de l’emploi de fibres optiques et de détecteurs imparfaits. En particulier, et c’est le facteur prépondérant, les détecteurs ont des probabilités non négligeables de se déclencher alors qu’aucun photon n’est incident : c’est ce que l’on appelle les coups sombres qui limitent de façon draconienne le rapport signal/bruit de la ligne de communication. D’un point de vue technologique, la solution consiste soit à améliorer la transmission des fibres optiques, soit à diminuer la probabilité de coups sombres des détecteurs. On ne gagnera probablement plus grand chose sur les pertes des fibres optiques. En revanche, les détecteurs continuent à progresser mais cela relève de la physique des semi-conducteurs (chapitre 6) et les problèmes sont complexes. La physique quantique contourne ces difficultés de façon inattendue, via l’utilisation du protocole de téléportation quantique, longtemps considéré comme une curiosité de physique fondamentale. La téléportation quantique consiste à transférer à distance par exemple un état de polarisation inconnu porté par un photon sans transmettre le photon lui-même. Le succès d’une telle opération s’accompagne d’un signal électrique qui permet de déclencher les détecteurs de Bob placés en bout de ligne de communication, conditionnellement au succès du protocole. Il est alors possible de réduire le bruit apparent dans les détecteurs de Bob et donc d’augmenter le rapport signal/bruit de la ligne, au prix
LE MONDE QUANTIQUE
55
d’un débit réduit : c’est le principe du relais quantique. Pour obtenir des répéteurs, il faudrait en plus utiliser des mémoires quantiques dont les réalisations pratiques semblent encore très lointaines. 5
Bibliographie
Grand public. Le livre de S. Singh, Histoire des codes secrets, J.-C. Lattès (1999) donne une introduction très lisible à la cryptographie, y compris la cryptographie quantique. On pourra aussi consulter l’article de A. Aspect et Ph. Grangier, « Des intuitions d’Einstein aux bits quantiques », Pour la Science, décembre 2004, p. 120 ; C. Bennett, G. Brassard et A. Ekert, « Quantum cryptography », Scientific American, 267, October 1992, p. 26. Sur la téléportation quantique : N. Cerf et N. Gisin, On a téléporté des atomes, dossiers La Recherche, n◦ 29, p. 36 (2007). Niveau avancé. M. Le Bellac, Introduction à l’information quantique, chapitre 2, Belin, Paris (2005) ; A. Aspect et Ph. Grangier, « De l’article EPR à l’information quantique : les stupéfiantes propriétés de l’intrication » dans Einstein aujourd’hui, p. 39, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS Éditions, Paris (2005) ; S. Loepp et W. Wootters Protecting information, Cambridge University Press, Cambridge (2006). L’article de revue de référence est celui de N. Gisin, G. Ribordy, W. Tittel et H. Zbinden, « Quantum cryptography », Review of Modern Physics, 74, 145 (2002).
56
Chapitre 2. Des transmissions sécurisées
3 Einstein, Bohr et la physique quantique La forme quasi définitive de la théorie quantique – dans le cas particulier de la mécanique ondulatoire – fut établie dans les années 1925-1927, principalement par Heisenberg, Schrödinger et Born, mais ce fut Bohr qui en fit la synthèse en donnant une interprétation épistémologique à tous les développements techniques accumulés durant ces deux années ; cette interprétation sera examinée en détail au chapitre 10. Bien qu’il reconnût l’efficacité de la mécanique quantique et ses succès par exemple en physique atomique et moléculaire, Einstein estimait que l’interprétation de Bohr ne constituait pas une réponse définitive. Pendant plusieurs années, il s’efforça de trouver des insuffisances dans la formulation de la théorie quantique telle qu’elle avait été plus ou moins acceptée par la grande majorité des physiciens, mais ses objections furent balayées par Bohr. Cependant, dans un article publié en 1935 avec Podolsky et Rosen, article universellement connu sous l’acronyme EPR formé par les initiales des trois auteurs, Einstein pensa avoir détecté une faille. La réponse obscure et pour partie hors sujet de Bohr montra qu’il avait visé juste. Cependant, jusqu’en 1964, le débat resta uniquement sur le terrain philosophique, et il fut d’ailleurs oublié de la plupart des physiciens comme n’ayant aucune implication pratique. C’est en 1964 que le physicien irlandais John Bell se rendit compte que les hypothèses contenues dans l’article EPR pouvaient être testées expérimentalement. Ces hypothèses conduisaient en effet à des inégalités, les inégalités de Bell, contredites par les prédictions de la théorie quantique. Dès la fin des années 1970, plusieurs groupes expérimentaux s’attaquèrent au problème, et on sait aujourd’hui que les inégalités de Bell ne sont pas compatibles avec l’expérience : selon toute probabilité, les hypothèses implicites dans l’article EPR sont infirmées par les résultats expérimentaux.
Dans ce chapitre, j’expliquerai à l’aide d’un exemple intuitif l’origine des inégalités de Bell, je les comparerai avec les prédictions de la théorie quantique et je discuterai brièvement une expérience récente. Le débat entre Einstein et Bohr va bien au-delà d’une simple controverse, somme toute ancienne et aujourd’hui réglée par la confirmation de la théorie quantique. En fait, les concepts introduits dans ce débat, comme le concept d’intrication, sont à la base d’une série de développements extrêmement importants de la physique quantique moderne, en particulier de tous ceux liés à l’information quantique (chapitre 8), et cela justifie qu’un chapitre entier y soit consacré.
1
Des communications supraluminales ?
Nous communiquons quotidiennement à des vitesses proches mais légèrement inférieures à celle de la lumière dans le vide, en échangeant des signaux lumineux, ou plus généralement des signaux électromagnétiques. Il est bien connu que la théorie de la relativité restreinte interdit tout échange d’information à une vitesse supérieure à c : autrement dit, la relativité restreinte interdit toute communication supraluminale. En relativité restreinte, un événement est défini par le point d’espace et l’instant où il se produit : par exemple un accident de voiture est défini par le lieu et l’heure où il se produit. Deux événements peuvent être reliés de façon causale s’il est possible qu’une information se propage de l’un à l’autre à une vitesse inférieure à la vitesse de la lumière. Dans le cas contraire, il ne peut y avoir de relation de cause à effet entre les deux événements, c’est-à-dire qu’aucun des deux événements ne peut influencer l’autre. Une théorie physique qui obéit à ce principe, ou principe de localité, est appelée théorie locale. Il faut cependant bien comprendre que la relativité restreinte n’interdit pas des déplacements s’effectuant à des vitesses supérieures à c. Un exemple simple est donné par le déplacement de la tache de quelques km de diamètre d’un pinceau laser illuminant la Lune. Si le laser tourne avec une vitesse angulaire supérieure à environ 10 tours par seconde, alors la tache balaie la Lune avec une vitesse supérieure à c. Mais il est impossible d’utiliser ce déplacement pour échanger de l’information, en dehors d’une information préétablie, par exemple celle du dispositif suivant : le faisceau peut avoir deux couleurs, vert ou rouge, et il balaie la surface de la Lune depuis Alice vers Bob, distants par exemple de 100 km. Si le faisceau est rouge, Alice lève le bras droit, et s’il est vert, Alice lève le bras gauche. Lorsque la tache lumineuse arrive à Bob, il sait quel bras Alice a levé, et cette information lui est parvenue à une vitesse supérieure à c. Mais, à l’évidence, la méthode ne permet pas à Alice de transmettre à Bob des informations qui n’auraient pas été codifiées à l’avance : pour échanger un message, il faut communiquer avec l’opérateur du laser sur la Terre.
58
Chapitre 3. Einstein, Bohr et la physique quantique
Un autre exemple, cette fois tiré de l’astrophysique, est le mouvement apparent d’un jet relativiste vu par un observateur terrestre. Pour un tel observateur, l’image du jet émis par la galaxie M87 se déplace à une vitesse égale à 6 fois la vitesse de la lumière. Enfin, la relativité restreinte n’est pas incompatible avec l’existence de particules se déplaçant à une vitesse supérieure à c, appelées tachyons. S’ils existent, les tachyons ont toujours une vitesse supérieure à c, et ils ne peuvent pas être ralentis à des vitesses inférieures à c. On montre que ces particules, si elles existaient, ne pourraient en aucun cas (sauf dans les livres de science-fiction) permettre l’échange d’information. Quelle qu’en soit l’origine, l’existence de communications supraluminales conduirait au paradoxe du grand-père : vous pourriez remonter le temps et assassiner votre grand-père avant qu’il n’ait eu des enfants, ce qui mettrait évidemment en danger votre propre existence. Nous allons retrouver une situation d’information préétablie dans le cas suivant, qui servira d’introduction à une inégalité importante écrite dans la section suivante. Une boîte contient deux T-shirts, l’un rouge et l’autre vert, chacun enveloppé dans un sac opaque. Réunis à un certain instant en un point S (S pour source), Alice et Bob prennent chacun dans la boîte un des deux T-shirts et, sans ouvrir leur sac, partent dans deux directions opposées et parcourent chacun 1,5 milliard de kilomètres. Ayant terminé leur périple, ils enfilent chacun leur T-shirt. Si Alice constate qu’elle est habillée en rouge, elle sait que Bob est habillé en vert, et vice versa. Bien qu’un échange de signaux entre Alice et Bob prenne plus de 3 heures, Alice connaît instantanément la couleur du T-shirt de Bob. Bien évidemment il n’y a aucun mystère : une corrélation entre les couleurs des T-shirts a été introduite à la source et la communication supraluminale apparente est en fait un échange d’information préétablie. Le lecteur peut estimer à juste titre que cet exemple est complètement trivial, voire ridicule, mais il doit faire preuve d’un peu de patience : une petite complication va conduire à un résultat absolument non trivial dans la section suivante.
2
Une inégalité remarquable
Nous allons étoffer la garde-robe d’Alice et de Bob en leur attribuant non seulement des T-shirts, mais également des pantalons (figure 3.1). Ces T-shirts et ces pantalons sont comme ci-dessus soit verts, soit rouges, TA et PA désignent les couleurs du T-shirt et du pantalon d’Alice, TB et PB celles du T-shirt et du pantalon de Bob. Afin d’établir le catalogue de leurs tenues vestimentaires, ils attribuent la valeur +1 ou −1 à chacune des couleurs : par exemple TA = +1 veut dire que le T-shirt d’Alice est rouge, PB = −1 que le pantalon de Bob est vert. Ce choix est une pure convention et tout autre choix, par exemple 36 et 2 645, conduirait aux mêmes conclusions au prix d’une notation nettement moins commode. Le point important
LE MONDE QUANTIQUE
59
Figure 3.1. Alice et Bob habillés d’un T-shirt et d’un pantalon. La figure représente un cas où TA = TB ,
TA = PB , PA = TB et PA = PB .
est que les variables TA, PA, TB , PB sont des variables dichotomiques, qui ne peuvent prendre que deux valeurs : rouge ou vert, ou bien +1 et −1. Alice et Bob ont 4 tenues possibles, et il y a donc globalement 4 × 4 = 16 possibilités. Les habits sont attribués selon une loi de probabilité où chacune des 16 possibilités apparaît avec une probabilité Prob(TA, PA, TB , PB ). La loi de probabilité permet de calculer par exemple Prob(TA = TB ), la probabilité que le T-shirt d’Alice ait la même couleur que celui de Bob, ou Prob(PA = PB ), la probabilité que les pantalons d’Alice et de Bob soient de couleur différente. Avec ces notations, l’exemple de la section 3.1 correspond à Prob(TA = TB ) = 0, Prob(TA = TB ) = 1. Dans ce nouvel exemple un peu plus complexe, on montre en toute généralité (annexe A3.1) que les probabilités obéissent à une inégalité. Prob(TA = TB ) + Prob(TA = PB ) + Prob(PA = TB ) + Prob(PA = PB ) ≤ 3
(3.1)
L’inégalité (3.1) est un exemple d’inégalité de Bell, qui fait partie d’une classe d’inégalités démontrées par Boole en 1862. Cette inégalité est remarquable, car a priori les probabilités sont comprises entre zéro et un, et le seul résultat évident est que la somme des probabilités doit être inférieure à 4 ; pourtant la démonstration de (3.1) ne fait intervenir que des considérations absolument élémentaires. Nous avons donc le résulat suivant : quelles que soient les corrélations introduites à la source, c’està-dire lorsque leurs habits sont attribués à Alice et Bob avec une certaine loi de probabilité, l’inégalité de Bell (3.1) doit être vérifiée.
60
Chapitre 3. Einstein, Bohr et la physique quantique
Encadré 3.1. Probabilités.
Les probabilités Prob(TA, PA, TB , PB ) obéissent à
Prob(TA, PA, TB , PB ) ≥ 0
Prob(TA, TB , PA, PB ) = 1.
TA ,TB ,PA ,PB
La probabilité Prob(TA = TB ) par exemple est obtenue en sommant sur PA et PB Prob(TA = TB ) = Prob(TA = TB , PA, PB ). PA ,PB
3
Et la physique quantique ?
Nous allons donner une version quantique des T-shirts et des pantalons en utilisant ce que l’on appelle des paires de photons intriqués en polarisation, un cas particulier du phénomène général d’intrication quantique. Une source S fabrique des paires de photons intriqués en polarisation à des instants bien identifiés (figure 3.2). Dans cet état intriqué, chaque photon de la paire part suivant l’axe des z dans des directions opposées et les polarisations des photons de chacune des paires sont corrélées : si Alice mesure la polarisation du photon dans la configuration {V H} (voir § 2.3.1) et qu’elle trouve une polarisation verticale (resp. horizontale), alors Bob utilisant la même configuration mesurera une polarisation verticale (resp. horizontale) pour le photon . On observe donc une corrélation parfaite H H ou V V des polarisations, chaque cas de figure se produisant avec une probabilité de 50 %. Si Alice et Bob utilisent la configuration {DA}, ils observent aussi une corrélation DD ou AA avec la même probabilité. Le résultat reste valable quelle que soit la configuration choisie, pourvu qu’Alice et Bob utilisent la même configuration, c’est-à-dire la même orientation de leurs prismes de Wollaston. Ce type de corrélation est reproduit sans difficulté par un modèle probabiliste classique généralisant celui de la section 3.1. Mais l’état intriqué utilisé dans l’expérience n’est pas un simple mélange à parts égales des états H H et V V , c’est une superposition linéaire (voir § 1.3.3 et § 2.3.1) (H H + V V )/ 2 à poids égaux des états H H et V V (ou DD et AA), et, comme nous allons le voir, les corrélations de cet état intriqué sont plus riches que des corrélations classiques. La définition et la description mathématique des états intriqués en polarisation sont examinées à l’annexe A3.2. La nouveauté apportée par Bell fut de permettre à Alice et Bob d’utiliser des configurations différentes. La polarisation d’un des photons de la paire ( ) est analysée par Alice, et celle de l’autre photon () par Bob, grâce à des prismes de Wollaston (ou des polaroïds) orientés le long de directions situées dans un plan perpendiculaire à l’axe des z, a ou a pour Alice et b ou b pour Bob. Le choix de l’orientation des
LE MONDE QUANTIQUE
61
a V z H
Bob
b
Alice
V
S S = source de paires de photons
H
Figure 3.2. Expérience avec des photons intriqués en polarisation. Une paire de photons intriqués en a de polarisation est produite en S . La polarisation de chacun des photons est analysée par Alice (orientation
son polaroïd ou de son prisme de Wollaston) et par Bob (orientation b).
prismes de Wollaston est effectué alors que les photons sont en vol entre la source et le point d’observation. Alice et Bob sont supposés suffisamment éloignés pour que l’orientation choisie par Bob ne puisse pas influencer les résultats d’Alice et vice versa, car une telle influence supposerait une communication supraluminale. Dans l’expérience la plus récente décrite dans la section 3.4, Alice et Bob sont distants de 400 m, une distance que la lumière met 1,3 μs à parcourir, tandis que la durée d’une mesure, choix de l’orientation du prisme et détermination de la polarisation, prend moins de 0,1 μs. La mesure de la polarisation suivant un axe donne deux résultats possibles : par convention +1 si la polarisation est parallèle à cet axe, −1 si elle lui est perpendiculaire. Si l’axe utilisé par Alice est a (resp. a ), on désignera son résultat par A = ±1 (resp. A = ±1), et pour Bob qui utilise b (resp. b ) par B = ±1 (resp. B = ±1). On peut maintenant établir la correspondance suivante avec la section précédente. T − shirt Alice =⇒ orientation a esultat A = ±1 de la mesure de polarisation couleur TA = ±1 du T − shirt =⇒ r´
62
Chapitre 3. Einstein, Bohr et la physique quantique
V
b π/8
a
H
b
a Figure 3.3. Configuration des orientation
a, a , b, b pour une violation maximale des inégalités de Bell.
et plus généralement TA =⇒ A
PA =⇒ A
TB =⇒ B
PB =⇒ B .
(3.2)
Nous pouvons donc transposer immédiatement l’inégalité de Bell (3.1) qui devient dans ce contexte Prob(A = B) + Prob(A = B ) + Prob(A = B) + Prob(A = B ) ≤ 3.
(3.3)
Pour l’état intriqué défini ci-dessus, superposition linéaire à poids égaux des états H H et V V , les probabilités sont calculées par la théorie quantique en fonction des angles entre les différents vecteurs a , a , b, b , par exemple l’angle θ entre a et b ; on obtient dans ce cas 1 Prob(A = B) = (1 + cos 2θ ). (3.4) 2 a , b) Si l’on choisit les orientations de la figure 3.3, où l’angle entre ( a, b), ( a, b ), (
◦ est de π/8 (22,5) et l’angle entre ( a , b ) de 3π/8, compte tenu de cos π/4 = 2/2 et cos 3π/4 = − 2/2, on trouve Prob(A = B) + Prob(A = B ) + Prob(A = B) + Prob(A = B ) = 2 + 2 3,414 > 3. (3.5) L’inégalité de Bell (3.1) est donc violée par la physique quantique ! Que s’est-il donc passé ? La démonstration de l’inégalité de Bell (3.1) semblait pourtant complètement générale et la correspondance entre les garde-robes d’Alice et de Bob et les mesures de polarisation parfaitement légitime. La différence entre les deux situations est subtile, mais essentielle : pour évaluer par exemple la probabilité Prob(TA = PB ) en effectuant un grand nombre d’essais, Alice et Bob peuvent se
LE MONDE QUANTIQUE
63
contenter d’observer la couleur de leur T-shirt et pantalon respectifs et ignorer celles de leur pantalon (Alice) et de leur T-shirt (Bob), mais l’information sur ces couleurs existe, même si elle n’est pas utilisée. Dans l’expérience avec les photons intriqués, lorsqu’Alice choisit de mesurer la polarisation suivant a (elle observe la couleur de son T-shirt), elle s’interdit de mesurer la polarisation suivant a pour la même paire de photons : les mesures suivant a et a sont incompatibles, on peut effectuer soit l’une, soit l’autre, mais pas les deux à la fois. Si nous voulions pousser jusqu’au bout l’analogie T-shirt/pantalon et choix des axes pour les mesures de polarisation, il nous faudrait admettre que la valeur de la polarisation suivant a existe, même si Alice ne peut pas l’observer avec le choix d’axe a, et dans ces conditions l’inégalité de Bell serait valable. Ce n’est pas le cas en physique quantique : le choix de l’orientation
a exclut celui de l’orientation a et les résultats de la mesure de la polarisation ne préexistent pas à cette mesure. Cela n’a aucun sens de prétendre qu’une mesure non effectuée aurait un résultat. Une autre façon de voir les choses est la suivante : l’inégalité de Bell est valable si les seules corrélations possibles sont celles introduites à la source par une distribution de probabilité Prob(TA, PA, TB , PB ). La violation de l’inégalité de Bell par la physique quantique montre que la distribution de probabilité correspondante Prob(A, A , B, B ) n’existe pas. Supposer l’existence des variables A, A , B, B donne un exemple de théorie de variables cachées : si l’on mesure par exemple A et B, A et B existent dans une telle théorie même s’il est impossible de les mesurer simultanément à A et B.
4
L’expérience d’Aspect
L’expérience décrite et commentée dans la section précédente trouve son origine dans un débat qui opposa Einstein et Bohr. Einstein n’était pas satisfait de l’interprétation donnée par Bohr et Heisenberg de la théorie quantique, et il tenta à plusieurs reprises d’y trouver des failles. En 1935, il publia avec Podolsky et Rosen un article célèbre, aujourd’hui désigné par les initiales de ses auteurs, EPR, article où il donnait une vision critique de la théorie quantique. Einstein Podolsky et Rosen partaient d’un exemple dont le principe est analogue à celui de la figure 3.2, quoique techniquement différent. Examinons d’abord le cas où Alice est la seule à faire une mesure de polarisation suivant a. Le résultat de la mesure est aléatoire : la polarisation du photon est orientée suivant a avec une probabilité de 50 %, et suivant la direction orthogonale à a avec la même probabilité, et ceci quelle que soit l’orientation a choisie : le photon est non polarisé. Comme c’est usuellement le cas, la physique quantique ne prédit que des probabilités. Cependant, et c’est ce qui avait mis Einstein Podolsky et Rosen sur la piste de leur argument, on peut arriver à des certitudes en considérant des mesures conjointes d’Alice et de Bob. Comme nous l’avons vu, la paire
64
Chapitre 3. Einstein, Bohr et la physique quantique
de photons est telle que si la polarisation du photon est orientée suivant a, alors celle du photon est aussi dirigée suivant a, ce qui se retrouve sur l’équation (3.4) : en effet, lorsque a ≡ b, alors Prob(A = B) = 1 car l’angle θ entre les deux vecteurs est nul et cos(2θ = 0) = 1. Par conséquent, si Alice fait passer le photon à travers un polaroïd d’axe a et que le photon est transmis (resp. arrêté), et si Bob oriente également son polaroïd suivant b ≡ a, le photon sera également transmis (resp. arrêté), et ceci avec une probabilité de 100 %. Au contraire, le résultat de la mesure d’Alice est aléatoire : son photon est transmis ou arrêté avec une probabilité de 50 %, mais une fois le résultat acquis, celui de Bob est connu avec certitude pour la même configuration. Encadré 3.2. Proposition pour des communications supraluminales.
On pourrait penser à exploiter cette certitude pour établir une communication supraluminale entre Alice et Bob de la façon suivante. Alice utilise pour la mesure de la polarisation de son photon soit la base (ou configuration) {V H}, soit la base {DA} (§ 2.3.1). Immédiatement après la mesure d’Alice, Bob mesure la polarisation de son photon : s’il trouve V ou H, c’est qu’Alice a utilisé la première base, s’il trouve D ou A, la seconde. Bob est donc instantanément au courant de la base utilisée par Alice, ce qui peut servir pour échanger des informations. L’idée est astucieuse, mais elle ne marche pas ! En effet, Bob ne peut pas déterminer l’état de polarisation de son photon, qui lui est inconnu, même si cet état est connu d’Alice. C’est le théorème de non-clonage quantique (§ 2.3.1) qui s’y oppose. On arrive à la même conclusion en montrant que les résultats de Bob sont indépendants des manipulations infligées par Alice à ses photons.
La conclusion principale qui découle de cette observation est, selon EPR, le caractère incomplet de la théorie quantique. Cependant, on ne peut pas totalement se fier au texte de l’article, qui, pour des raisons linguistiques, fut écrit par Podolsky ; on sait qu’Einstein n’était pas entièrement satisfait de certaines de ses formulations. Des écrits ultérieurs d’Einstein permettent de reconstituer approximativement sa critique du caractère incomplet de la théorie quantique, laquelle repose sur deux piliers : la séparabilité, c’est-à-dire le fait que chacun des photons de la paire possède une identité propre, et la localité, l’absence d’influences à distance instantanées. Une fois qu’Alice a effectué sa mesure, par exemple dans la base {V H}, la polarisation du photon de Bob possède une valeur déterminée dans cette base. Mais la conjonction localité/séparabilité entraîne que, juste avant la mesure, le photon de Bob devait posséder cette polarisation. En effet, le fait que le photon de Bob possède une propriété physique, une polarisation linéaire, ne doit pas dépendre de ce qu’une mesure ait été effectuée ou non par Alice. Aucune information sur cette polarisation n’est fournie par le formalisme quantique où, avant la mesure, le photon ne possède aucune polarisation. Si l’on admet la validité du postulat localité/séparabilité, la description quantique est incomplète car cette information n’est pas contenue dans
LE MONDE QUANTIQUE
65
le formalisme. La conclusion d’Einstein est donc non pas que ce formalisme est incorrect – au contraire ses prédictions sont statistiquement correctes – mais qu’il donne une description incomplète de la réalité physique. Le formalisme envisagé par Einstein Podolsky et Rosen, mais qu’ils n’ont jamais explicité mathématiquement, serait celui d’une théorie appelée réaliste locale : réaliste parce que les résultats de la mesure préexistent à celle-ci, et locale parce qu’elle obéit à l’interdiction des communications supraluminales. À l’inverse, la théorie quantique respecte certes la localité : même si le formalisme est non local, elle ne peut pas être utilisée pour des communications supraluminales (encadré 3.2), mais elle invalide la séparabilité. Bohr réagit vigoureusement à l’article EPR, mais sa réponse, alambiquée et obscure, ne semble pas avoir pris toute la mesure de l’argumentation développée dans cet article. Nous y reviendrons au chapitre 10. En fait, c’est Schrödinger qui eut à l’époque la compréhension la plus profonde du problème introduit par EPR. Il se rendit compte que l’intrication était une caractéristique fondamentale de la physique quantique, et peut-être même la plus fondamentale. Lorsque les deux photons sont éloignés et ne peuvent plus communiquer, ils continuent néanmoins à former une entité unique. Les propriétés de la paire de photons ne se réduisent pas à une conjonction des propriétés des deux photons pris individuellement, et la séparabilité n’est pas valable. Le phénomène d’intrication était déjà familier en physique atomique : par exemple les propriétés de l’atome d’hélium ne peuvent s’expliquer que si l’on prend en compte l’intrication des deux électrons de cet atome. La nouveauté apportée par EPR est que cette intrication doit persister même pour des particules quantiques trop éloignées pour pouvoir communiquer, ce qui permet d’utiliser des arguments combinant la localité et la séparabilité. Nous verrons au chapitre 10 que la théorie de de Broglie-Bohm rend compte des résultats de la mécanique quantique – la violation des inégalités de Bell ne prouve pas que la théorie quantique est vraie ! Ceci est possible car cette théorie obéit à la séparabilité, mais non à la localité. Encadré 3.3. Principe de superposition ou intrication ?
Quelle est la propriété de la physique quantique la plus fondamentale ? Je choisirai le principe de superposition, car la possibilité de construire des états quantiques intriqués est une conséquence du principe de superposition. Cependant, il est exact que la puissance du principe de superposition s’exprime de façon particulièrement spectaculaire dans l’intrication. Notons que deux particules peuvent ête intriquées sans avoir jamais été en contact, grâce à la procédure d’échange d’intrication (entanglement swapping).
Après la passe d’armes initiale EPR/Bohr et les commentaires de Schrödinger qui remontent à 1935, plus rien ne se passa pendant 30 ans, en dehors de la version simplifiée donnée par Bohm en 1951 de l’argument EPR, et la controverse tomba
66
Chapitre 3. Einstein, Bohr et la physique quantique
dans l’oubli. La communauté des physiciens considéra dans sa grande majorité que le débat était de nature purement philosophique, voire académique, et sans aucune incidence expérimentale. C’est seulement en 1964 que le physicien irlandais John Bell (alors au CERN à Genève et qui y a effectué l’essentiel de sa carrière) imagina le principe d’une expérience permettant de choisir entre le réalisme local et la physique quantique, en démontrant une inégalité analogue à (3.1). Dans une théorie réaliste locale, comme il ne peut pas exister de transmission instantanée de l’information entre Alice et Bob supposés suffisamment éloignés, on doit conclure que chaque photon transporte avec lui toute l’information nécessaire pour déterminer le résultat des mesures. Dans une telle théorie, développée dans la section 3.2, des corrélations ont été introduites à la source entre les polarisations des deux photons ; ensuite chacun des photons a voyagé depuis la source jusqu’aux expérimentateurs en transportant l’intégralité de l’information nécessaire pour toutes les mesures envisageables et n’a plus communiqué avec l’autre photon. Les deux hypothèses à la base de la preuve initiale de Bell sont techniquement légèrement différentes mais en fait équivalentes à celles de la section 3.2. 1. L’hypothèse de localité, conséquence de l’absence de communication supraluminale : si deux objets quantiques et sont intriqués, par exemple parce qu’ils sont émis par une source commune, et si des mesures effectuées sur et ne peuvent pas être reliées de façon causale, alors le résultat d’une mesure sur ne peut pas dépendre de la configuration du dispositif expérimental utilisé pour observer . 2. Les résultats de toutes les mesures possibles sont contenus dans la description de l’état des deux photons, même si le détail de cette description ne nous est pas accessible. Cet état doit permettre de déterminer à l’avance le résultat +1 ou −1 d’une mesure de la polarisation, quelle que soit l’orientation choisie au dernier moment pour les polariseurs ; (ii) est en fait une hypothèse de variables cachées, nécessaires à la description complète de l’état des deux photons. La controverse Einstein/Bohr peut alors se résoudre sur une base expérimentale : vat-on trouver que les résultats expérimentaux obéissent à l’inégalité de Bell (3.1) ou va-t-on au contraire valider le résultat (3.5) de la physique quantique ? De belles expériences furent été effectuées au début des années 1970, mais qui ne satisfaisaient pas complètement au critère de localité. Il fallut attendre les expériences menées en 1982 à Orsay par Alain Aspect et ses collaborateurs pour que soit effectuée une expérience se rapprochant au plus près du schéma de la figure 3.2 servant de support aux raisonnements d’Einstein et de Bell. Grâce à une source de paires de photons intriqués d’une efficacité sans précédent, il fut notamment possible de modifier l’orientation des polariseurs pendant la propagation des photons entre ceux-ci et la source, ce qui apporta une première indication sérieuse de la violation des inégalités de Bell
LE MONDE QUANTIQUE
67
Alice +1 −1
Bob
PW
MEO
Photon
MEO PW
+1 −1
GA Rb
Photon
ordinateur
source de photons intriqués en polarisation
GA ordinateur
Rb
communication classique
Figure 3.4. L’expérience du groupe d’Innsbruck dirigé par Anton Zeilinger. Les stations de mesure d’Alice et de Bob sont éloignées de 400 m, et le choix de l’orientation des polariseurs est fait par un générateur aléatoire (GA) attaché à chaque station pendant que les photons se propagent de la source aux stations. PW = prisme de Wollaston, Rb = horloge atomique à rubidium (chapitre 5), MEO = modulateur électro-optique. Les détecteurs sont représentés en jaune cerclé de rouge. Expérience réalisée par G. Weihs et al. « Violation of Bell’s inequalities under strict locality conditions », Physical Review Letters, 81, 5039 (1998).
et une confirmation des prédictions de la théorie quantique. L’expérience récente la plus précise est celle d’Anton Zeilinger (alors à Innsbruck) et ses collaborateurs (figure 3.4). Dans cette expérience, un photon ultraviolet est converti dans un cristal non linéaire en deux photons dans un état de polarisation intriqué. On peut modifier de façon aléatoire l’orientation des analyseurs pendant que les photons sont en vol entre leur point de production et les détecteurs. En effet, les deux détecteurs sont distants de 400 m, distance franchie par la lumière en 1,3 μs, alors que la durée combinée des mesures individuelles et de la rotation des polariseurs ne dépasse pas 100 ns. Dans l’expérience d’Aspect et collaborateurs, la distance était de 12 m, distance parcourue par la lumière en 40 ns, et l’orientation des polariseurs changeait toutes les 10 ns. Il est impossible que les détections d’Alice et de Bob soient reliées de façon causale et on élimine toute information sur l’orientation des analyseurs qui pourrait avoir été stockée à l’avance. La seule objection possible est que seulement 5 % des paires de photons sont détectées, et il faut admettre que ces 5 % constituent un échantillon représentatif. A priori on ne peut voir aucune raison qui s’y oppose, et l’on peut très raisonnablement affirmer que l’expérience a tranché en faveur de la physique quantique et éliminé le réalisme local implicite dans l’argumentation d’Einstein. On pourrait être tenté de conclure que la physique quantique est non locale, mais cette « non-localité » ne contredit jamais la relativité restreinte, en ne permettant pas par exemple de transmission d’information à une vitesse supraluminale : Alice et Bob observent chacun une suite aléatoire de +1 et de −1, qui ne contient aucune information, et c’est seulement en comparant leurs résultats transmis par une voie classique, à une vitesse inférieure à c, qu’ils peuvent se rendre compte de leur corrélation.
68
Chapitre 3. Einstein, Bohr et la physique quantique
5
Bibliographie
Grand public. V. Scarani, Initiation à la physique quantique, Vuibert, Paris (2003), chapitres 6 à 8 ; A. Aspect et Ph. Grangier, « Des intuitions d’Einstein aux bits quantiques », Pour la Science, décembre 2004, p. 120. On pourra également consulter T. Coudreau et P. Milman, « Domestiquer l’intrication quantique », Pour la Science, mai 2007, p. 78. J.-P. Delahaye, « Libre arbitre et mécanique quantique », Pour la Science, décembre 2009, p. 96. Le site web de « Stanford Encyclopedia of Philosophy », rubrique Quantum Mechanics, donne accès à plusieurs excellents articles, parmi lesquels : A. Fine, « The Einstein Podolsky Rosen argument in quantum mechanics » ; A. Shimony, « Bell’s theorem ». Niveau avancé. A. Aspect et Ph. Grangier, De l’article EPR à l’information quantique : les stupéfiantes propriétés de l’intrication quantique dans Einstein aujourd’hui, p. 87, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS Éditions, Paris (2005). L’article original EPR est de A. Einstein, B. Podolsky and N. Rosen, « Can quantummechanical description of physical reality be considered complete ? » Physical Review, 47, 777 (1935) et la réponse de N. Bohr a exactement le même titre « Can quantummechanical description of physical reality be considered complete ? » Physical Review, 48, 696 (1935).
LE MONDE QUANTIQUE
69
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
4 Atomes, lumière, lasers
Jusqu’à présent, les propriétés spatiales des particules quantiques n’ont joué qu’un rôle tout à fait secondaire dans l’exposé : nous avons seulement eu besoin de la relation de de Broglie (1.4) qui donne la longueur d’onde. Notre discussion des propriétés quantiques des photons s’est appuyée principalement sur leur polarisation, qui est un degré de liberté interne du photon. Les amplitudes de probabilité que nous avons utilisées ne faisaient pas intervenir les positions ou les vitesses des particules, qui sont des degrés de liberté spatiaux, ou externes. Dans ce chapitre, nous allons introduire la dépendance spatiale en définissant des amplitudes de probabilité qui sont des fonctions (complexes !) de la position r, a( r). Afin de simplifier l’exposé, nous nous limiterons à la propagation le long d’une seule direction d’espace, par exemple la propagation sur une droite qui sera choisie comme axe O x. L’amplitude de probabilité décrivant la propagation d’une particule quantique sur cette droite sera une fonction complexe a(x) de la variable x, la position de la particule. Nous allons traiter l’exemple du puits de potentiel, où une particule effectue des allers-retours entre deux points de l’axe O x ; un cas particulier est le puits infini où, dans le cas classique, la particule est enfermée entre deux murs infranchissables. Cet exemple n’est pas du tout académique, nous le retrouverons au chapitre 6 dans la conception des diodes laser ! Il nous permettra en outre d’introduire la notion de niveau d’énergie, d’écrire les inégalités de Heisenberg, de comprendre l’interaction d’une onde électromagnétique avec un atome, et finalement d’expliquer schématiquement le principe du laser.
1 1.1
Particules et ondes classiques sur une droite Puits de potentiel à une dimension
Avant de discuter le cas quantique, rappelons quelques propriétés du mouvement classique en nous servant de l’exemple d’un manège de foire, les montagnes russes : la figure 4.1 montre un parcours comprenant une cuvette située entre deux parties horizontales à la même hauteur. Le chariot lancé sur la partie horizontale arrive dans la descente avec une certaine vitesse initiale, accélère pendant la descente et freine pendant la montée. En l’absence de frottement, il continue horizontalement avec une vitesse égale à sa vitesse initiale. Cet exemple illustre les propriétés de ce que les physiciens appellent un puits d’énergie potentielle ou, plus brièvement, un puits de potentiel. Un autre cas intéressant pour la suite est celui-ci : au lieu d’arriver avec une vitesse initiale dans le puits, le wagon est lâché sans vitesse intiale d’un point A à l’intérieur du puits. Toujours en l’absence de frottement, il va remonter jusqu’au point B situé à la même hauteur que A et osciller ensuite indéfiniment entre A et B. Lorsque l’amplitude des oscillations est faible, ce puits donne un exemple d’oscillateur harmonique, la fréquence des oscillations f étant fixée par la courbure au fond du puits.
A
B
Figure 4.1. Montagnes russes. Le chariot arrive de la gauche sur une partie horizontale, il traverse la cuvette et repart vers la droite sur la deuxième partie horizontale du trajet, située à la même hauteur que la première. Il peut aussi être lâché du point A sans vitesse initiale et, en l’absence de frottement, il oscille indéfiniment entre A et B .
Nous allons remplacer le chariot des montagnes russes par une bille de très petites dimensions, l’archétype de la particule classique que nous avons baptisée micro-boule de billard, ce qui facilitera la transition au cas de la particule quantique. Un exemple très simple de puits de potentiel est celui où la bille est enfermée entre deux murs verticaux infranchissables distants de L (figure 4.2), cas que nous allons appeler particule dans une boîte à une dimension (ou unidimensionnelle). Si la bille part vers la droite avec une certaine vitesse, elle est réfléchie par le mur de droite et repart vers la gauche avec la même vitesse. Elle rebondit ensuite sur le mur de
72
Chapitre 4. Atomes, lumière, lasers
L
x O
L
Figure 4.2. La boîte unidimensionnelle. La bille effectue des allers-retours entre les deux murs verticaux.
gauche et effectue indéfiniment des allers-retours entre les deux murs avec une vitesse constante en valeur absolue. 1.2
Ondes classiques
Ce qui précède décrit l’aspect corpusculaire du mouvement dans le puits, mais pour passer au cas quantique, nous avons aussi besoin de l’aspect ondulatoire. Que se passe-t-il pour une onde confinée dans une région [0, L] et dont l’amplitude de vibration a(x) est uniquement fonction de x ? Un bon exemple physique est donné par une corde dont les deux extrémités ont pour abscisses x = 0 et x = L et que l’on fait vibrer en x = 0, l’extrémité en x = L étant fixée (figure 4.3 : on notera que l’axe des x est vertical dans cette figure). Cette corde possède un grand nombre de modes de vibration, en théorie une infinité. Dans le mode de vibration le plus simple (figure 4.3a), aucun point de la corde, sauf bien sûr les deux extrémités, ne reste immobile : on dit que la vibration ne possède pas de nœuds. Il sera commode d’indicer le mode de vibration par un entier égal au nombre de nœuds plus 1, soit n = 1 dans le cas de zéro nœud ; il semblerait plus logique de choisir n = 0, mais la convention choisie est plus commode pour la suite. Le cas suivant est celui où la vibration s’annule au milieu de la corde, au point x = L/2 (figure 4.3b) : la vibration possède un nœud (n = 2), et les modes suivants en possèdent deux (n = 3, figure 4.3c), trois (n = 4, figure 4.3d). . . Le cas de zéro nœud (n = 1) correspond au mode de vibration fondamental de la corde, et les cas n = 2, n = 3 . . . au premier, second. . . harmoniques. La vibration est appelée onde stationnaire, et elle est caractérisée par une amplitude de vibration a(x), qui obéit à a(x = 0) = a(x = L) = 0.
LE MONDE QUANTIQUE
73
(a)
(b)
(c)
(d)
Figure 4.3. Ondes stationnaires d’une corde vibrante. L’axe des x est vertical et les extémités de la corde sont fixées aux points x = 0 et x = L . Les modes de vibration a, b, c et d possèdent respectivement zéro (n = 1), un ( n = 2), deux ( n = 3) et trois nœuds (n = 4). Reproduit de T. Hey and P. Walters, The New Quantum Universe, Cambridge University Press, Cambridge (2003).
Au lieu des ondes stationnaires de la figure 4.3, on peut aussi observer des ondes progressives, analogues aux ondes progressives à la surface de l’eau du § 1.1.1, si l’on ne maintient pas fixes les extrémités de la corde. Les ondes stationnaires de la figure 4.3 sont en fait une superposition d’ondes progressives se propageant vers la droite et vers la gauche (sur la figure : vers le haut et vers le bas), caractérisées par une longueur d’onde λ, ou un vecteur d’onde k = 2π/λ. Dans le cas de la figure 4.3a, la longueur d’onde est λ = 2L, et donc k = π/L, et dans le cas général présentant (n − 1) nœuds, λ = 2L/n ou k = nπ/L. On montre en physique élémentaire des
74
Chapitre 4. Atomes, lumière, lasers
vibrations que l’amplitude de vibration a(x), lorsqu’elle n’est pas trop importante, possède une forme sinusoïdale. Pour un mode présentant (n − 1) nœuds, l’amplitude de vibration a(x) est de la forme a(x) = Asin k x = Asin
πnx L
n = 1, 2, 3, . . .
(4.1)
où A est une constante et k = πn/L. La fonction sin δ est tracée sur la figure 1.7 ; elle s’annule à l’origine et à δ = π, δ = 2π, . . ., et on vérifie que a(x) définie en (4.1) s’annule bien à l’origine et à x = L. La fréquence de vibration ν est approximativement une fonction linéaire du vecteur d’onde k, ν cs k/2π, où cs est la vitesse de propagation du son le long de la corde. Si la fréquence du mode fondamental est ν, celle du premier harmonique sera approximativement 2ν, celle du troisième 3ν. . . Encadré 4.1. Vecteur d’onde.
Il peut sembler superflu d’introduire le vecteur d’onde en plus de la longueur d’onde. En fait, à une dimension, le vecteur d’onde est un nombre algébrique, qui peut être positif ou négatif, alors qu’une longueur d’onde est toujours positive. À trois dimensions, c’est un vecteur, k, relié à l’impulsion par p = h k/2π = ħ h k. La longueur d’onde est donnée par la
valeur absolue |k| du vecteur d’onde, λ = 2π/|k|.
2
Particule quantique dans un puits de potentiel
Substituons à la petite bille de la section précédente une particule quantique et essayons de deviner son comportement compte tenu de ce que nous avons appris sur les aspects corpusculaire et ondulatoire d’un mouvement confiné dans l’intervalle [0, L]. Comme dans toute description quantique, nous allons associer au mouvement une amplitude de probabilité, un nombre complexe qui doit dépendre de la position x, a(x). Il nous faut maintenant en donner une interprétation physique. D’après la règle 2 du § 1.6.2, |a(x)|2 est proportionnel à une probabilité et il est naturel de l’interpréter comme étant proportionnel à la probabilité d’observer la particule au point x. Plus exactement, |a(x)|2 est une densité de probabilité : |a(x)|2δ x est la probabilité d’observer la particule dans l’intervalle [x, x +δ x], où δ x est choisi suffisamment petit pour que |a(x)|2 varie très peu sur cette distance, dans le cas présent δ x L. |a(x)|2 est appelé probabilité de présence de la particule au point x. À ce point, nous allons procéder à un changement de notation en introduisant au lieu de a(x) la notation consacrée ψ(x), a(x) → ψ(x). La fonction ψ(x) est la fonction d’onde de la particule quantique et c’est l’amplitude de probabilité pour la trouver au point x. Passons maintenant à la détermination de cette fonction d’onde. Le raisonnement qui va suivre n’est pas entièrement rigoureux – c’est ce que les physiciens appellent
LE MONDE QUANTIQUE
75
un raisonnement heuristique –, mais il permet de saisir l’essentiel ; le raisonnement rigoureux est renvoyé à l’annexe A4.2. En l’absence du puits de potentiel, la particule se propagerait sur l’axe O x avec une probabilité de présence indépendante de x, puisque tous les points de l’axe sont alors physiquement équivalents. De plus, étant quantique, la particule est aussi une onde, avec une longueur d’onde de de Broglie λ. En résumé, en l’absence du puits de potentiel, ψ(x) devrait présenter les deux propriétés suivantes. 1. |ψ(x)|2 est égal à une constante que l’on peut prendre égale à 1 sans perte de généralité. 2. ψ(x) doit être une fonction périodique de période λ. D’un point de vue ondulatoire classique, ce cas correspond à celui des ondes progressives sur la corde : ces ondes peuvent se propager vers la droite ou vers la gauche. Pour une particule quantique de masse m et de vitesse v , la longueur d’onde λ est liée à l’impulsion p = mv par la relation de de Broglie λ = h/p, soit pour le vecteur d’onde k = 2πp/h. Afin de minimiser le nombre de facteurs 2π, on introduit habituellement la constante de Planck modifiée ħ h (prononcer hachebarre), ħ h = h/2π. Avec cette notation, la relation entre vecteur d’onde et impulsion se simplifie en p = ħ hk, et elle se généralise à trois dimensions sous forme vectorielle : p = ħ h k (encadré 4.1). Encadré 4.2. Ondes progressives et stationnaires.
On montre qu’il existe seulement deux fonctions qui obéissent aux conditions 1. et 2. cidessus, les exponentielles complexes exp(ik x) et exp(−ik x). En effet (annexe A1.3), on vérifie a posteriori d’une part que | exp(±ik x)|2 = 1 et d’autre part que exp(±ik x) est périodique et de période λ : comme le vecteur d’onde est donné par k = 2π/λ, compte tenu de l’identité exp(±2iπ) = 1 e±ik(x+λ) = e±ikx e±2iπ = e±ikx . De plus on montre que, si k > 0, exp(ik x) représente une onde se propageant vers la droite et exp(−ik x) une onde se propageant vers la gauche. La fonction sin k x (onde stationnaire) est une superposition d’ondes se propageant vers la droite et vers la gauche : sin k x = (e ikx − e−ikx) /2i.
Revenons maintenant à la boîte unidimensionnelle de la figure 4.2 : comme la particule est confinée dans l’intervalle [0, L], sa probabilité de présence est nulle en dehors de cet intervalle et on doit avoir |ψ(x)|2 = 0 pour x ≤ 0 et x ≥ L. Par continuité, ψ(x) doit s’annuler à x = 0 et x = L, et d’autre part, comme la particule se propage tantôt vers la droite et tantôt vers la gauche, ψ(x) doit être dans la région 0 ≤ x ≤ L une superposition d’ondes de de Broglie se propageant vers la droite et
76
Chapitre 4. Atomes, lumière, lasers
vers la gauche. Par analogie avec (4.1), nous pouvons écrire ψ(x) sous la forme ψ(x) = Asin k x = Asin
πnx L
n = 1, 2, 3, . . .
(4.2)
La constante A = 2/L est déterminée en exigeant que la probabilité de trouver la particule quelque part entre x = 0 et x = L soit égale à 1. De la relation de de Broglie p=ħ hk et de k = πn/L, nous déduisons que p = ±ħ hπn/L, où le ± correspond au fait que la particule peut se diriger vers la droite avec une valeur positive +|p| de l’impulsion ou vers la gauche avec une valeur négative −|p|. Le produit |p|L vaut ħ hπn et une remarque importante pour la section suivante est que la valeur minimale de ce produit est atteinte pour n = 1 : |p|L = ħ hπ.
3
Inégalités de Heisenberg et niveaux d’énergie
La discussion qui précède va nous permettre de déduire deux propriétés fondamentales de la physique quantique : les inégalités de Heisenberg (plus connues sous la dénomination à éviter de « principe d’incertitude de Heisenberg »), et la quantification des niveaux d’énergie. Commençons par les inégalités de Heisenberg. Une mesure de position ne donne pas une valeur précise, puisque la meilleure information disponible est fournie par la probabilité de présence |ψ(x)|2. Une mesure individuelle donne une valeur aléatoire et, pour obtenir une information précise sur la position, il faut effectuer un grand nombre de mesures dans des conditions identiques. Les résultats de ces mesures vont se répartir selon une loi de probabilité donnée par |ψ(x)|2 (figure 4.4), et plus le nombre de mesures sera grand, meilleure sera notre connaissance de |ψ(x)|2. La valeur la plus probable de la position est donnée par le maximum de |ψ(x)|2 à x = x 0 , et la largeur de la courbe donne la dispersion (ou écart-type) Δx sur ces mesures. Dans le cas (4.2), Δx ∼ L, puisque la particule est sûrement localisée dans l’intervalle [0, L]. Au lieu de mesurer la position, on peut mesurer la vitesse v ou l’impulsion p = mv de la particule. Dans le cas du puits infini, l’impulsion est +|p| ou −|p| selon que la particule se propage vers la droite ou vers la gauche, et la dispersion Δp ∼ |p| = ħ hπn/L. Le produit Δx Δp est égal à (L) × (ħ hπn/L) = ħ hπn, et la valeur minimale de ce produit est atteinte pour n = 1 : dans ce cas Δx Δp ∼ ħ hπ. Le raisonnement que nous venons de suivre peut être rendu parfaitement rigoureux : si l’on mesure dans une série d’expériences la position d’une particule dans un état quantique bien défini, et si l’on mesure son impulsion dans une autre série d’expériences indépendantes, alors le produit des dispersions Δx sur la mesure de position et celle Δp sur la mesure de son impulsion
LE MONDE QUANTIQUE
77
2 ˜ |ψ(p)|
|ψ(x)|2
Δp
Δx
x0
x
p0
p
Figure 4.4. Illustration schématique des inégalités de Heisenberg. La probabilité de présence |ψ(x)|2 présente un maximum à x = x 0 , qui donne la valeur la plus probable de la position de la particule. La 2 ˜ ˜ (ψ(p) est la transformée de probabilité de mesurer une impulsion p est donnée par une fonction |ψ(p)| 2 ˜ Fourier de ψ(x)). La valeur la plus probable de l’impulsion est donnée par le maximum à p = p0 de |ψ(p)| .
vérifient l’inégalité de Heisenberg (figure 4.4) Δx Δp ≥
ħ h 2
(4.3)
Il faut insister sur le fait que les dispersions Δx et Δp ne sont en rien liées aux imprécisions expérimentales et qu’en fait elles sont intrinsèques à l’état quantique de la particule, comme on l’a vu dans le cas de la boîte : en général, les courbes de la figure 4.4 se calculent à partir de cet état quantique. Il faut aussi insister sur le fait qu’il s’agit de mesures faites sur une particule toujours préparée dans le même état quantique et que l’on ne peut pas mesurer la position et l’impulsion dans une même expérience. L’inégalité de Heisenberg implique la propriété suivante : si l’on prépare une particule quantique dans un état où Δx est petit, c’est-à-dire dans un état où sa position est déterminée avec une bonne précision, alors une mesure de l’impulsion donnera une dispersion Δp ∼ ħ h/(2Δx) d’autant plus grande que Δx est plus petit. Par exemple, si une particule quantique est enfermée dans un puits de petite dimension, son impulsion sera nécessairement importante. En ce sens, il n’est pas possible d’attribuer simultanément une position précise et une impulsion précise à une particule quantique. On a parfois tiré du « principe d’incertitude de Heisenberg » la conclusion abusive suivante : la physique quantique impose des limitations fondamentales à nos connaissances. En fait, notre présentation montre que les inégalités de Heisenberg fixent les limites d’utilisation des concepts classiques de position et de vitesse (ou d’impulsion).
78
Chapitre 4. Atomes, lumière, lasers
Amplitudes ψ des ondes d’électrons
Niveaux d’énergie dans une boîte
Probabilités lψl2
n=4
Énergie n=3
n=2 n=1 Énergie = 0
Figure 4.5. Les quatre premiers niveaux d’énergie ( n = 1, 2, 3, 4) et les fonctions d’onde correspondantes de la boîte unidimensionnelle.
Venons-en maintenant à la quantification de l’énergie. Dans la boîte unidimensionnelle, l’énergie E de la particule quantique est purement cinétique, car on peut choisir son énergie potentielle indépendante de x et égale à zéro E=
1 2
mv 2 =
p2 2m
,
hπn/L, nous compte tenu de p = mv . Comme les valeurs possibles de p sont p = ±ħ en déduisons que E prend des valeurs discrètes En , indicées par un nombre entier positif n. En =
ħ h2 π2 2mL 2
n2
n = 1, 2, 3, . . .
(4.4)
Chaque valeur de En caractérise un niveau d’énergie. En physique classique, l’énergie d’une particule peut prendre n’importe quelle valeur positive dans la boîte et en particulier la valeur E = 0 correspondant à une particule immobile serait possible. C’est impossible en physique quantique, car une particule immobile aurait une impulsion parfaitement fixée p = 0 et donc Δp = 0, ce qui est incompatible avec l’inégalité de Heisenberg (4.3) et Δx = L. Un autre exemple est celui du puits de profondeur finie de la figure 4.1. Les points A et B peuvent être choisis arbitrairement et l’énergie du chariot est égale à son énergie cinétique quand il passe au fond de la cuvette. Cette énergie n’est pas quantifiée. Ce n’est pas le cas en physique quantique où seules des valeurs discrètes sont possibles. Cette propriété est appelée quantification des niveaux d’énergie.
LE MONDE QUANTIQUE
79
La quantification des niveaux d’énergie est à la base d’une propriété fondamentale des atomes : un atome peut passer d’un niveau d’énergie supérieur E2 à un niveau d’énergie inférieur E1 en émettant un photon, dont l’énergie hν est égale, par conservation de l’énergie, à la différence E2 − E1 : hν = E2 − E1 . Inversement, si l’atome est dans l’état E1 et qu’il est illuminé par une onde électromagnétique de fréquence ν, il absorbera fortement cette onde si hν est proche de la différence d’énergie E2 − E1 . Si hν est exactement égal à E2 − E1 , on dit que l’on se trouve à la résonance, et c’est dans ces conditions que le taux d’absorption de photons est le plus important. La boîte unidimensionnelle constitue une sorte d’atome élémentaire et on peut vérifier expérimentalement les propriétés que nous venons de montrer, car des puits quantiques se rapprochant de notre exemple théorique peuvent être réalisés dans des semi-conducteurs (chapitre 6). Ces puits quantiques émettent et absorbent de la lumière, et les fréquences émises ou absorbées sont déterminées par les niveaux d’énergie : compte tenu de (4.4) les fréquences possibles νmn sont données par hνmn = Em − En =
ħ h2 π2 2mL 2
m2 − n2 .
(4.5)
Cette équation représente la conservation de l’énergie pour l’émission d’un photon (figure 4.6). En effet, si Em > En (m > n), le puits émet un photon d’énergie hνmn = Em − En , et l’énergie initiale Em est égale à l’énergie finale En + hνmn . Si au contraire la boîte absorbe un photon, En > Em (n > m), l’énergie initiale En + hνmn est égale à l’énergie finale Em .
n=4
n=3
n=2 n=1
(a)
(b)
Figure 4.6. Émission et absorption de photons par le puits infini entre les niveaux n = 3 et n = 2. (a) Émission : l’état initial de l’atome n = 3 est représenté par le cercle vert, son état final n = 2 par le cercle rouge. (b) Absorption : deux photons arrivent sur l’atome dans son état initial n = 2 (cercle rouge). Un photon est absorbé et l’atome passe dans l’état final n = 3 (cercle vert).
80
Chapitre 4. Atomes, lumière, lasers
4
Atomes
Une image de l’atome souvent utilisée est celle d’un système solaire en miniature (figure 4.7) : des électrons de charge négative tournent en orbite autour d’un noyau atomique chargé positivement, beaucoup plus petit que l’atome. Rappelons en effet que les dimensions de l’atome sont de l’ordre de 0,1 nm (10−10 m) et celles du noyau de quelques femtomètres (10−15 m) : les deux rayons diffèrent d’un facteur 100 000 environ. Nous allons choisir pour notre discussion l’atome le plus simple, l’atome d’hydrogène, où le noyau est un proton et où un seul électron tourne en orbite autour de ce proton ; c’est donc un système solaire en miniature avec une seule planète. L’attraction gravitationnelle qui maintient la planète en orbite est remplacée ici par l’attraction électrostatique entre le proton et l’électron, et dans les deux cas la force décroît en fonction du rayon r de l’orbite selon une loi en 1/r 2 . L’image du système planétaire est intuitive et pas entièrement fausse, mais elle souffre d’un défaut majeur : dans cette image, l’atome d’hydrogène est instable. En effet, un électron en orbite se comporte comme une petite antenne qui rayonne de l’énergie électromagnétique dans l’espace. Par conservation de l’énergie, l’énergie de l’atome doit diminuer au fur et à mesure qu’il rayonne. On montre en mécanique classique que la diminution de l’énergie s’accompagne d’une diminution du rayon de l’orbite, et l’électron finit par « tomber » sur le noyau. Or on sait que le rayon de l’orbite, qui peut être défini de façon approchée, reste inchangé quand l’atome d’hydrogène est dans un état stable et que dans cet état il ne rayonne pas. Ce rayon vaut environ 0,05 nm, le « rayon » de l’atome d’hydrogène : la stabilité de l’atome d’hydrogène contredit le modèle planétaire.
1 fm
0,1 nm Figure 4.7. Le modèle planétaire de l’atome. La figure n’est pas à l’échelle : les dimensions du noyau (quelques fm) sont environ 1/100 000 de celles de l’atome (0,1 nm).
LE MONDE QUANTIQUE
81
Encadré 4.3. Énergies sur une orbite circulaire.
L’énergie d’une orbite circulaire de rayon r est négative et proportionnelle à 1/r, E = −C/r, où C est une constante positive. L’énergie potentielle sur l’orbite est −2C/r, le double de l’énergie totale, et l’énergie cinétique est donc Ec = C/r. La constante C est égale à e2 , e2 = q2 /(4π 0 ), où q est la charge de l’électron en Coulomb et 0 la permittivité du vide. Une formule plus utile donne la constante de structure fine α, nombre sans dimension qui vaut α = q2 /(4π 0ħ hc) = e2 /(ħ hc) 1/137.
Essayons de comprendre pourquoi cette chute catastrophique de l’électron sur le noyau prédite par la physique classique ne se produit pas. La clé de l’explication se trouve dans l’inégalité de Heisenberg (4.3). Dans notre raisonnement, nous allons partir des variables classiques, le rayon de l’orbite r et l’impulsion p sur cette orbite, ainsi que des expressions classiques de l’énergie. Cependant, nous allons utiliser l’inégalité de Heisenberg pour limiter la validité des concepts classiques qui conduisent à l’instabilité de l’atome : ce type de raisonnement est appelé semi-classique. L’inégalité de Heisenberg implique que le produit r p doit être de l’ordre de ħ h, r p ∼ ħ h. Si r devient très petit parce que l’électron se met à « tomber » sur le noyau, son impulsion devient grande, et il en résulte que son énergie cinétique p2 /(2m), où m est la masse de l’électron, devient également grande. Un principe général de la physique énonce qu’un état stable correspond au minimum de l’énergie : ainsi le chariot des montagnes russes de la section 4.1 est dans un état stable s’il se trouve immobile au creux de la cuvette avec une énergie potentielle minimale et une énergie cinétique nulle. Dans le cas de l’atome d’hydrogène, l’énergie potentielle de l’électron est l’énergie potentielle d’attraction électrostatique du proton sur l’électron. Cette énergie potentielle est négative et décroît vers moins l’infini quand r tend vers zéro. Quand l’électron se rapproche du noyau, son énergie potentielle devient de plus en plus petite (plus grande en valeur absolue !), mais son énergie cinétique h2 /(2mr 2 ) devient de plus en plus grande et elle croît plus vite que Ec = p2 /(2m) = ħ la valeur absolue de l’énergie potentielle quand r → 0. L’état stable est obtenu en cherchant le compromis correspondant au minimum d’énergie et un calcul quantitatif simple (annexe A4.2) donne pour le rayon r de l’orbite et l’énergie E de l’état fondamental en fonction de la charge e de l’électron (encadré 4.3) r=
ħ h2 me2
0,053 nm
E=−
me4 2ħ h2
−13,6 eV.
(4.6)
De façon générale, c’est l’inégalité de Heisenberg qui est à la base de la stabilité des atomes. Comme dans le cas du puits quantique, nous avons non seulement un niveau fondamental mais aussi des niveaux excités. L’énergie de l’état fondamental est donnée par (4.6) et il existe une infinité d’états excités indicés par un entier
82
Chapitre 4. Atomes, lumière, lasers
positif n = 1, 2, 3, . . . En = −
me4
· (4.7) 2ħ h2 n2 Comme dans le cas du puits quantique, les fréquences νnm des photons émis ou absorbés par l’atome d’hydrogène sont données par hνnm = En − Em hνnm = −
me2 2ħ h2
1 n2
−
1 m2
.
(4.8)
L’ensemble des niveaux d’énergie de l’atome d’hydrogène forme le spectre de niveaux de cet atome. Ce spectre de niveaux détermine l’ensemble des fréquences des photons émis et absorbés, et donc les spectres d’émission et d’absorption de l’atome. Le cas d’un atome à plusieurs électrons est plus complexe, car il n’existe pas de formule exacte du type (4.7) pour les niveaux d’énergie. Cependant, on retrouve la propriété de quantification des niveaux d’énergie et de spectre de niveaux. Les spectres d’émission et d’absorption sont caractéristiques d’un atome donné et constituent une sorte « d’empreinte digitale » de l’atome. Ainsi on a pu mettre en évidence l’existence de l’atome d’hélium dans le Soleil grâce à son spectre d’absorption de la lumière solaire bien avant qu’on ne le découvre sur la Terre, car le spectre d’absorption observé ne correspondait à l’époque à aucun spectre connu au laboratoire. 5
Lasers
L’interaction lumière-matière va nous permettre de comprendre le fonctionnement du laser, mais il nous faut d’abord donner quelques précisions sur l’interaction entre une onde électromagnétique, par exemple une onde lumineuse, et un atome. Ainsi que nous l’avons vu, un atome porté dans un niveau excité E2 peut émettre spontanément un photon en revenant dans un état d’énergie inférieure E1 comme dans le cas de la figure 4.6a (avec un réétiquetage E2 → E1 et E3 → E2 ). L’atome dans son état fondamental peut aussi absorber un photon de l’onde lumineuse incidente et passer dans un niveau excité (figure 4.6b). Le processus d’absorption n’est efficace que si la fréquence ν de l’onde incidente est voisine de la différence d’énergie entre le niveau fondamental et un des niveaux excités divisée par h. Pour une absorption efficace, on doit avoir hν E2 − E1 : c’est, nous l’avons vu, la condition de résonance. En résumé, nous avons pris en compte pour l’instant deux possibilités : l’émission spontanée d’un photon E2 → E1 et l’absorption d’un photon E1 → E2 . Comme son nom l’indique, l’émission spontanée se produit quel que soit l’environnement électromagnétique de l’atome, mais l’absorption ne peut exister qu’en présence d’une onde lumineuse et le taux d’absorption est proportionnel à l’intensité de l’onde incidente. En 1916, dans un article très en avance sur son temps, Einstein montra qu’il existait
LE MONDE QUANTIQUE
83
n=4
n=3
n=2 n=1 Figure 4.8. Émission stimulée entre les niveaux n = 3 et n = 2. Deux photons incidents en donnent trois dans l’état final, l’atome passant du niveau n = 3 (cercle vert) au niveau n = 2 (cercle rouge).
un troisième processus, l’émission stimulée. Supposons que l’atome dans un état excité E2 soit illuminé par une onde de fréquence ν telle hν E2 − E1 . L’atome émet alors un photon avec une probabilité par unité de temps proportionnelle à l’intensité de l’onde : ce processus est appelé émission stimulée (par l’onde incidente). Il faut bien comprendre la différence entre émission spontanée et émission stimulée : dans le premier cas, l’émission est complètement indépendante de l’environnement électromagnétique de l’atome et le photon est émis dans une direction aléatoire ; dans le second cas, elle n’existe qu’en présence d’une onde lumineuse incidente (comparer les figures 4.6a et 4.8) et le photon émis a les mêmes caractéristiques que les photons incidents. Un laser utilise l’émission stimulée pour amplifier une onde lumineuse : LASER est un acronyme pour « Light Amplification by Stimulated Emission of Radiation », amplification de la lumière par émission stimulée de rayonnement. Considérons l’action d’une onde lumineuse sur un ensemble de N atomes dans un des deux états E1 ou E2 ; N1 atomes sont dans l’état E1 et N2 dans l’état E2 , avec bien sûr N1 + N2 = N . Si N1 > N2 , l’ensemble des atomes absorbe plus d’énergie qu’il n’en fournit, puisqu’un atome dans E1 absorbe de l’énergie et qu’un atome dans E2 en fournit. Pour que l’énergie de l’onde lumineuse soit amplifiée, il faut que N2 > N1 . Or, en raison de la loi de Boltzmann (encadré 5.1), la situation normale est celle où N2 < N1 , et il faut donc obtenir une inversion de population grâce à des méthodes dites de pompage optique. On montre qu’il n’est pas possible d’obtenir cette inversion de population en se limitant à deux niveaux. Il faut utiliser au moins trois niveaux, et en fait la méthode la plus efficace décrite ultérieurement consiste à utiliser quatre niveaux.
84
Chapitre 4. Atomes, lumière, lasers
Un laser comprend en général : • un milieu actif qui joue le rôle d’amplificateur optique ; • une source d’énergie qui permet d’exciter le milieu actif et de réaliser l’inversion de population. Elle peut être électrique (voir le chapitre 6 sur les lasers à semi-conducteurs) ou optique (lampe ou autre laser) ; • une cavité résonante linéaire ou en anneau (figure 4.9) qui sélectionne les modes amplifiés. Un des miroirs de la cavité est partiellement réfléchissant afin qu’une partie du rayonnement lumineux puisse être extraite de la cavité. Le laser est en fait un convertisseur d’énergie de pompage en énergie lumineuse, ou plus généralement électromagnétique. milieu actif
M1
M3
M2 Figure 4.9. Schéma d’un laser en anneau. Les miroirs M1 et M2 sont parfaitement réfléchissants, M3 transmet une fraction de la lumière incidente qui forme le faisceau laser.
Dans le cas de la cavité en anneau de la figure 4.9, le champ électrique doit être identique à lui-même lorsque la lumière a fait un tour complet, et les longueurs d’onde permises sont fixées par la stationnarité de la phase : la longueur optique L de la cavité doit être un multiple entier de la longueur d’onde λ L = nλ
n = 1, 2, . . .
(4.9)
ou, en termes de fréquences, νn =
c L
n
n = 1, 2, . . .
(4.10)
Ces conditions, qui définissent les modes de la cavité, rappellent bien évidemment celles qui donnent les modes de la corde vibrante de la section 4.2, à la différence que cette fois on exige la périodicité sur une longueur L, au lieu d’une annulation aux extrémités. Il est généralement possible de sélectionner une longueur d’onde
LE MONDE QUANTIQUE
85
Γ3
E3
E2
w
Γ2
E1
Γ1
E0
Figure 4.10. Schéma d’un mécanisme d’inversion de population à 4 niveaux. Le pompage optique fait passer de E0 à E3 avec un taux w . Les flèches épaisses dénotent les transitions rapides entre niveaux.
unique, ce qui donne un laser monomode. Grâce à l’utilisation de miroirs concaves, le faisceau laser possède une extension transverse finie et son ouverture angulaire à grande distance est de l’ordre de λ/w, où w est la dimension transverse minimale, ou col (en anglais “waist”), du faisceau. Cette propriété est illustrée sur la figure 6.8 dans le cas des diodes laser. Il existe plusieurs mécanismes permettant de réaliser l’inversion de population des niveaux E2 et E1 . Nous nous contenterons de décrire le mécanisme le plus simple, qui repose sur l’utilisation d’un système à quatre niveaux d’énergie : E0 (fondamental), E3 (excité), E1 et E2 (niveaux intermédiaires) (figure 4.10). Les atomes sont portés par pompage optique dans le niveau E3 avec un taux w. Une relaxation rapide amène ensuite l’atome dans le niveau E2 , choisi tel que la relaxation de E2 vers E1 soit lente : le temps de relaxation est le temps moyen mis par l’atome pour passer du niveau E2 au niveau E1 . Enfin une relaxation rapide conduit de E1 à E0 . Si on appelle Γi les taux de relaxation, on doit donc s’arranger pour avoir Γ1 , Γ3 Γ2 .
(4.11)
Il est facile d’écrire les équations donnant l’évolution au cours du temps des populations N0 , N1 , N2 , N3 des quatre niveaux considérés. Par exemple le niveau E1 est peuplé par émission à partir du niveau E2 avec un taux Γ2 N2 et il se dépeuple vers le niveau E0 avec un taux Γ1 N1 . En régime permanent, le taux de peuplement d’un niveau doit être égal à son taux de dépeuplement et par conséquent Γ2 N2 − Γ1 N1 = 0, ou, de façon équivalente N2 N1 86
=
Γ1 Γ2
.
(4.12)
Chapitre 4. Atomes, lumière, lasers
En toute rigueur, on a supposé un régime non saturé, où l’on peut négliger l’émission stimulée ou l’absorption entre les niveaux E2 et E3 . Les équations d’évolution complètes sont données par exemple dans l’article de Jean-Paul Pocholle cité dans la bibliographie. La condition Γ1 Γ2 entraîne bien l’inversion de population. En fait, l’émission stimulée est en compétition avec l’émission spontanée et cette dernière est préjudiciable au fonctionnement du laser. On montre que la probabilité d’émission spontanée est proportionnelle à ν 3 , où ν est la fréquence d’émission du laser et cette émission est par conséquent d’autant plus gênante que la longueur d’onde du laser est plus courte. L’émission spontanée est environ huit fois plus importante dans le bleu que dans le rouge, et c’est pourquoi il est plus facile de construire un laser émettant dans le rouge que dans le vert ou le bleu. Malgré un rendement énergétique défavorable, un pointeur laser vert est construit en partant d’un laser émettant dans l’infra-rouge, et le faisceau vert est obtenu grâce à une conversion optique depuis l’infrarouge en vert par doublement de fréquence dans un milieu non linéaire. La condition de stationnarité de l’onde laser dans la cavité est à l’origine des propriétés de cohérence temporelle (ou longitudinale) et de cohérence spatiale (ou transverse) de la lumière laser, qui sont à la base des propriétés remarquables de cette lumière que l’on appelle lumière cohérente, tandis que celle des sources classiques est incohérente. En pratique des temps de cohérence de l’ordre de la dizaine de μs (et donc des longueurs de cohérence de plusieurs kilomètres) sont faciles à atteindre. La cohérence spatiale permet à la largeur du faisceau d’approcher les limites de la diffraction et de le focaliser sur une tache dont les dimensions sont de l’ordre de la longueur d’onde. C’est aussi cette propriété qui permet d’obtenir des faisceaux lumineux dont la divergence approche la seconde d’arc en les dilatant jusqu’à un diamètre de 15 cm, et on peut par exemple former sur la Lune une tache de quelques km de diamètre. Grâce à la réflexion de ce faisceau par un miroir, il est possible de mesurer la distance Terre-Lune avec une précision de 1 mm. Encadré 4.4. Cohérences longitudinale et transverse.
Si l’onde lumineuse était une sinusoïde monochromatique parfaite de fréquence ν, on aurait en un point d’espace fixé un comportement en cos(2πν t − φ). En fait, φ est une fonction (aléatoire) du temps, φ(t). Si φ(t) a une certaine valeur à t = 0, la mémoire de cette valeur sera perdue au bout d’un temps τ, le temps de corrélation de la phase ou temps de cohérence, et cτ est la longueur de cohérence longitudinale. Un argument analogue est utilisé pour définir la cohérence entre deux points dans le plan perpendiculaire au faisceau, ce qui donne la cohérence transverse.
Si l’on compare un laser à une source de lumière conventionnelle, par exemple un laser YAG doublé en fréquence émettant dans le vert une puissance de 15 W, et une ampoule à incandescence de 150 W (exemple emprunté à Gilbert Grynberg,
LE MONDE QUANTIQUE
87
Alain Aspect et Claude Fabre), le laser coûte environ 40 000 euros et la lampe à incandescence 1 euro : il semble que le laser représente une technologie sophistiquée et onéreuse pour une puissance relativement faible ! Mais l’avantage du laser devient décisif quand on essaie de concentrer la puissance sur une petite surface ou un intervalle de temps très court. Compte tenu des lois de l’optique, il est impossible d’obtenir un flux lumineux (une puissance par unité de surface) de plus de 500 W/cm2 avec l’ampoule. Au contraire, en raison de la cohérence spatiale de la lumière laser, la puissance du laser YAG peut être focalisée sur une surface dont la taille est limitée uniquement par la diffraction, c’est-à-dire par la longueur d’onde émise, λ ∼ 0,5 μm. Le flux lumineux peut alors atteindre 109 W/cm2 , soit un gain de plus d’un million par rapport à l’ampoule. La cohérence temporelle permet de concentrer la puissance sur des intervalles de temps très courts et avec un taux de répétition élevé grâce à la technique dite de synchronisation de modes. Par exemple, un laser titane-saphir à modes synchronisés permet d’atteindre une puissance de 1014 W sur des intervalles de temps de l’ordre de la femtoseconde (10−15 s, lasers femtosecondes). Une façon de comprendre la différence entre la lumière laser et la lumière d’une source classique est de comparer le nombre de photons dans un mode. Dans le cas de la lumière du Soleil (source lumineuse correspondant à une température de 5 500 ◦ C), le nombre de photons par mode dans le visible est de l’ordre de 1/100. Au contraire, le nombre de photons par mode dans un laser peut atteindre des valeurs de 109 . C’est ce très grand nombre de photons par mode qui permet de concentrer l’énergie sur des petites surfaces ou des intervalles de temps très courts. Il existe une grande variété de lasers : lasers à néodyme (YAG), lasers saphirtitane, lasers de puissance à CO2 . . . Les lasers les plus répandus dans la vie courante sont les lasers à semi-conducteurs ou diodes lasers, qui sont utilisés par exemple pour la lecture des CD, des DVD et des codes-barres, dont le principe sera expliqué au chapitre 6. Dans ce cas, le processus de base est la recombinaison d’une paire électron-trou, et les dimensions de la cavité résonante sont de l’ordre de quelques centaines de μm. Le laser a été inventé il y a tout juste 50 ans, mais on ne pourrait plus imaginer aujourd’hui un monde sans lasers ! Le laser est bien sûr omniprésent dans les laboratoires de recherche, mais aussi dans le monde industriel – découpe industrielle, gravure, soudure – et le monde médical – micro-chirurgie. Les lasers sont utilisés pour le positionnement : télémétrie, gyrolasers (§ 1.6.1), etc. Les diodes laser sont fondamentales pour la lecture des CD, des DVD, des codes barres et pour les télécommunications par fibre optique. Les lasers femtosecondes ont une puissance de crête pouvant atteindre 100 TW : le laser mégajoule à Bordeaux pourrait déclencher la fusion thermonucléaire inertielle contrôlée et représente une alternative à ITER. Bref, le laser est devenu un outil universel.
88
Chapitre 4. Atomes, lumière, lasers
6
Bibliographie
Grand public. On trouvera dans la même collection un livre entièrement consacré aux lasers : F. Breitenaker et N. Treps eds, Le laser, EDPSciences, à paraître (2010). Voir également dans Panorama de la physique, Belin (2008) le chapitre « L’optique : ses sources et ses applications » ; T. Hey et P. Walters, The New Quantum Universe, Cambridge University Press, Cambridge (2003), chapitres 3, 4 et 7. Sur les inégalités de Heisenberg : J.-M. Lévy-Leblond, « Que veulent dire les inégalités de Heisenberg ? », dossiers La Recherche n◦ 29, p. 46 (2007). Niveau avancé. J.-P. Pocholle, « De l’émission stimulée d’Einstein aux lasers d’aujourd’hui », dans Einstein aujourd’hui, p. 129, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS Éditions, Paris (2005) ; G. Grynberg, A. Aspect et C. Fabre, Introduction aux lasers et à l’optique quantique, Ellipses, Paris (1997), dont une version anglaise remaniée et actualisée sera bientôt disponible (Cambridge University Press).
LE MONDE QUANTIQUE
89
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
5 Des atomes très froids Ce chapitre et le suivant sont consacrés aux effets collectifs des particules quantiques, c’est-à-dire aux effets observés lorsque l’on met ensemble un grand nombre de particules identiques, par exemple des électrons, des atomes d’hélium 4 ou de rubidium. Nous allons voir qu’il existe deux grandes classes de particules quantiques, les fermions et les bosons, dont le comportement collectif est radicalement opposé. Les bosons ont tendance à s’agglutiner et au contraire les fermions à soigneusement s’éviter : on dit que les bosons et les fermions obéissent à deux statistiques quantiques différentes, respectivement les statistiques de Bose-Einstein et de Fermi-Dirac. La température est un effet collectif et, dans la section 5.1, nous expliquerons le concept de température absolue et sa relation avec l’énergie cinétique moyenne des particules. Nous décrirons dans la section 5.2 la façon dont on peut refroidir les atomes grâce à l’effet Doppler, avec comme application l’amélioration de la précision des horloges atomiques par un facteur ∼ 100. Les effets de statistique quantique se manifestent à basse température et le refroidissement des atomes sera mis à profit pour obtenir à température suffisamment basse des condensats de Bose-Einstein dans le cas où les atomes sont des bosons (section 5.3). 1 1.1
Qu’est-ce que la température ? Zéro absolu et température absolue
La notion de température est familière dans la vie courante, où l’on utilise par exemple un thermomètre formé d’un tube gradué relié à un réservoir contenant un liquide coloré. La température zéro correspond au cas où le thermomètre est plongé dans un mélange de glace et d’eau, la température 100 à celui où le thermomètre est plongé dans de l’eau bouillante. L’intervalle de zéro à 100 est divisé
en intervalles d’un degré, et la graduation est éventuellement prolongée en dessous de zéro et au-dessus de 100 ; la température ainsi mesurée est donnée en degrés Celsius (◦ C). Cette graduation contient bien évidemment une large part d’arbitraire. Une autre graduation utilisée dans le monde anglo-saxon, et tout aussi arbitraire, choisit comme zéro la température d’un mélange de glace et de sel dans des proportions définies et comme base 100 la température du corps humain, ce qui donne la température en degrés Fahrenheit (◦ F). Quelle que soit la graduation utilisée, un thermomètre fournit une relation d’ordre : un thermomètre permet de s’assurer que la température t 1 d’un objet 1 est plus élevée, ou moins élevée, que celle t 2 d’un objet 2, t 1 > t 2 ou t 1 < t 2 . Si t 1 = t 2 , on dit que les deux objets sont en équilibre thermique. Toutefois, cette notion d’ordre ne permet pas de comparaison absolue de deux températures : on ne peut pas dire qu’un objet est deux fois plus chaud qu’un autre ! Pour comparer quantitativement deux températures, il faut introduire la température absolue, mesurée en kelvins (K). Partons de l’expérience suivante : un gaz dilué, de l’azote, est contenu dans un cylindre bon conducteur de la chaleur fermé par un piston mobile (figure 5.1). L’ensemble est placé dans une enceinte maintenue à pression constante mais dont la température variable est mesurée, pour fixer les idées, en degrés Celsius. Commençons par une température élevée, par exemple 200 ◦ C, puis diminuons la température de 10 degrés en 10 degrés. À chaque étape, nous attendons suffisamment longtemps pour que le gaz soit en équilibre thermique, c’est-à-dire à la même température que l’enceinte. La position du piston est repérée par une règle graduée qui permet à chaque étape de mesurer le volume du gaz. Reportons sur un graphique le volume en fonction de la température : nous constatons que les points se placent sur une droite, et que cette droite coupe l’axe des températures à t = −273 ◦ C. On ne peut évidemment pas atteindre ce point dans l’expérience, car l’azote se liquéfie bien avant, à t = −196 ◦ C. Recommençons l’expérience avec un autre gaz dilué, oxygène, gaz carbonique, hélium, xénon etc. : tant que le gaz est dilué et loin de son point de liquéfaction, nous retrouvons la même droite et le même point d’intersection à t = −273 ◦ C. Cette valeur présente donc un caractère universel. Une idéalisation de physicien consiste à prendre comme gaz des molécules ponctuelles et sans interactions, ce que l’on appelle un gaz parfait. Dans ce cas (idéal !), on trouve une droite se prolongeant jusqu’à la température t = −273 ◦ C. Ce point représente la température la plus basse possible, car pour des températures encore inférieures, le volume deviendrait négatif. Cette température universelle est appelée le zéro absolu, et il est logique d’adopter une nouvelle graduation du thermomètre, où le zéro correspond à cette température la plus basse possible. On pourra ensuite graduer le thermomètre en décidant que la température de la glace fondante est T = 273 K, la température étant désormais mesurée en kelvin (K). Avec cette
92
Chapitre 5. Des atomes très froids
volume
gaz parfait
gaz réel −273 ◦ C
température t 0 ◦C
100 ◦ C
Figure 5.1. Expérience définissant le zéro absolu de température. À pression constante, le volume du gaz dépend de la température t et diminue avec celle-ci. La courbe du gaz réel, en trait plein, s’arrête avant −273 ◦ C, car le gaz se liquéfie et son volume diminue brutalement.
nouvelle graduation, la température d’ébullition de l’eau est T = 373 K. La température T est la température absolue. Plusieurs groupes expérimentaux se sont efforcés d’obtenir des températures de plus en plus basses. Une température couramment atteinte, par exemple pour refroidir des aimants dans l’imagerie par résonance magnétique (IRM), est celle de l’hélium liquide (4 K). Dans le grand collisionneur de hadrons au CERN à Genève – ou LHC, Large Hadron Collider (chapitre 7) –, 120 tonnes d’hélium sont refroidies à 1,9 K. Pour diminuer encore la température, on utilise un mélange des deux isotopes de l’hélium, l’hélium 3 et l’hélium 4, qui permet de descendre à environ 0,001 K (1 millikelvin ou mK). 1.2
Température absolue et énergie cinétique
Une interprétation microscopique donne une image intuitive de la température absolue. Dans l’exemple du gaz dilué enfermé dans un piston, les molécules du gaz sont animées de vitesses aléatoires de l’ordre de quelques centaines de mètres par seconde à la température ambiante. Si le récipient est immobile, l’impulsion globale doit être nulle et il y a autant de molécules se déplaçant dans un sens que dans l’autre : la vitesse moyenne 〈v 〉 est nulle. En revanche, la valeur moyenne 〈v 2 〉 du
LE MONDE QUANTIQUE
93
carré de la vitesse n’est pas nulle et la mécanique statistique permet de la relier à la température absolue T par 1 1 (5.1) m〈v 2 〉 = kB T, 2 2 où m est la masse de la molécule et kB la constante de Boltzmann, qui vaut 1,38 × 10−23 J/K ; kB T est une mesure de l’énergie cinétique moyenne m〈v 2 〉/2 des molécules, souvent appelée énergie d’agitation thermique. Il est important de mentionner que (5.1) reste valable pour un gaz qui n’est pas dilué, et même pour un liquide, pourvu que les effets quantiques soient négligeables. L’équation (5.1) montre que plus une molécule est légère, plus sa vitesse d’agitation thermique est grande, à température égale. À la température ambiante, elle vaut environ 1 000 m/s pour l’hydrogène et 300 m/s pour l’oxygène. Nous aurons besoin par la suite d’une description un peu plus fine de l’agitation thermique. Les molécules étant animées de vitesses aléatoires, cette description fait intervenir une fonction de distribution des vitesses qui en donne la répartition. Pour simplifier la discussion, je me limiterai au cas d’une dimension, en supposant que les molécules se déplacent suivant une droite avec une vitesse v . La probabilité de trouver la vitesse dans l’intervalle [v , v + δv ], avec δv suffisamment petit, est égale à Prob(v )δv . La fonction Prob(v ) est représentée sur la figure 5.2 pour trois températures T1 < T2 < T3 . Le pic de la courbe est centré en v = 0 : ainsi que nous l’avons vu, la vitesse moyenne est nulle. La largeur à mi-hauteur de la courbe, Δ v , décrit les fluctuations de la vitesse autour de la valeur moyenne nulle : Δv = 〈v 2 〉, où 〈v 2 〉 est donné par la relation (5.1). On constate que Δv diminue avec la température, conformément à la relation (5.1). Le refroidissement du gaz est caractérisé par la largeur du pic autour de v = 0. Il faut faire très attention au domaine de validité de (5.1) : cette relation n’est valable que si les effets quantiques sont négligeables, et donc, nous le verrons, à des températures qui ne sont pas trop basses, mais elle reste valable pour un liquide classique et pas seulement pour un gaz dilué. Encadré 5.1. Distribution de Maxwell et loi de Boltzmann.
Lorsque la valeur moyenne 〈v 〉 = 0, on a Δv =
(v − 〈v 〉)2 .
La fonction de distribution des vitesses pour 〈v 〉 = 0 est donnée par une loi de Gauss, appelée dans ce cas distribution des vitesses de Maxwell
mv 2 Prob(v ) = cste × exp − . 2kB T
94
Chapitre 5. Des atomes très froids
T1
densité de probabilité Prob(v)
T2
T3
Figure 5.2. Fonction de distribution des vitesses Prob(v ) pour trois températures T1 < T2 < T3 . On constate que le pic autour de v = 0 se rétrécit quand la température diminue.
Dans un espace à 3 dimensions, la vitesse est un vecteur v et la relation entre énergie cinétique et température est 1 3 m〈 v 2 〉 = kB T. 2 2 〈 v 2 〉 est la vitesse quadratique moyenne, la valeur moyenne de v 2 . Je me contenterai de (5.1), afin de ne pas m’encombrer de facteurs numériques sans importance qualitative. La généralisation à trois dimensions de la distribution de Maxwell est aisée : si la vitesse v a trois composantes (v x , v y , vz ), la fonction de distribution des vitesses est un produit de trois fonctions identiques, Prob( v ) = Prob(v x )Prob(v y )Prob(vz ). Cela permet de comprendre le facteur 3/2 : chaque dimension d’espace apporte un facteur 1/2. La distribution de Maxwell est un cas particulier de la loi de Boltzmann : la probabilité d’observer un système physique dans un état d’énergie E à la température T est proportionnelle à exp(−E/kB T ).
2 2.1
Refroidir les atomes Absorption de photons et effet Doppler
Dans le chapitre précédent, nous avons vu comment un atome pouvait passer d’un niveau d’énergie à un autre sous l’action d’une onde lumineuse de fréquence ν. Par exemple, il peut passer du niveau fondamental E1 à un niveau excité E2 en absorbant un photon d’énergie hν = E2 − E1 . Cette absorption s’accompagne d’un effet de recul, qui est connu depuis longtemps et a été observé avec de la lumière classique. Il est responsable de la pression de rayonnement qui oriente la queue des comètes dans une direction opposée au Soleil. Cependant, son étude exhaustive n’a pu être développée dans les laboratoires que depuis l’invention du laser, car l’effet est très faible avec de la lumière ordinaire. L’effet de recul est familier : par exemple, un dessin humoristique représente un gardien de but captant un ballon et se retrouvant propulsé dans ses filets par un tir surpuissant (figure 5.3). Cet effet de recul est dû à la conservation de l’impulsion (ou quantité de mouvement) :
LE MONDE QUANTIQUE
95
Figure 5.3. Par conservation de l’impulsion, le malheureux gardien de but est propulsé dans ses filets.
l’impulsion initiale du ballon est transmise au gardien de but qui recule. Inversement, quand on tire au fusil, l’épaule prend un choc : en effet, initialement l’impulsion totale est nulle, et elle le reste parce que l’impulsion de la balle est égale et opposée à celle imprimée au tireur par le fusil. En fin de compte, l’impulsion imprimée au tireur est absorbée par le sol. C’est aussi la conservation de l’impulsion qui explique le recul d’un atome quand il absorbe un photon (figure 5.4). Supposons pour simplifier l’atome (le gardien de but) immobile et dans son état fondamental E1 . Il absorbe un photon d’impulsion p = ħ h k et passe dans l’état excité ; rappelons que k est le vecteur d’onde, k = 2πν/c et ħ h = h/2π. Tel le gardien de but bloquant le ballon, l’atome recule en absorbant le photon et il acquiert une impulsion p , et donc une h k/m, où m est sa masse. Bien que cette vitesse vitesse, dite de recul v = p /m = ħ de recul soit faible, de l’ordre de quelques cm/s, on conçoit que si l’on illumine avec un laser de fréquence adéquate les atomes sortant d’un four avec des vitesses de
E2 ħ h k/m E1 (a)
(b)
Figure 5.4. Recul d’un atome dans l’absorption d’un photon. (a) Initialement, l’atome est immobile et dans
h k et, par conservation de l’impulsion, recule son niveau fondamental. (b) Il absorbe un photon d’impulsion ħ
hk/m, où m est sa masse. avec une vitesse ħ
96
Chapitre 5. Des atomes très froids
plusieurs centaines de mètres par seconde en répétant un grand nombre de fois le cycle absorption/émission, ces atomes seront rapidement ralentis par absorption de photons. Nous verrons que la force qui s’exerce sur les atomes peut être considérable, jusqu’à 100 000 fois la force de pesanteur. 2.2
Refroidissement Doppler
La première phase du refroidissement laser consiste à ralentir les atomes sortant d’un four avec des vitesses de plusieurs centaines de m/s. Nous passerons sur cette première phase un peu complexe et nous examinerons directement la seconde, où l’on va piéger les atomes en vitesse entre plusieurs faisceaux laser. Afin de simplifier la discussion, nous supposerons que le mouvement des atomes se fait à une seule dimension, c’est-à-dire suivant une droite, et dans ce cas il suffira de deux faisceaux laser se propageant dans des directions opposées. Dans le cas de trois dimensions, il faut six faisceaux laser, deux par dimension d’espace. Le phénomène physique utilisé dans ce refroidissement est l’effet Doppler. Tout le monde a pu remarquer que le son de la sirène d’une ambulance qui s’approche est plus aigu que lorsqu’elle s’éloigne : c’est l’effet Doppler pour des ondes sonores. Le même effet se produit avec des ondes électromagnétiques : la mesure de la vitesse d’une voiture par un radar (souvent remplacé aujourd’hui par un laser) utilise le fait que la voiture réfléchit le faisceau incident, et elle se comporte comme une source d’émission d’ondes radar qui s’approche du récepteur (le gendarme !). La fréquence mesurée par le gendarme est d’autant plus grande que la vitesse de la voiture est plus élevée. Si l’onde radar est réfléchie par une voiture qui s’éloigne, la fréquence réfléchie est plus faible. La dépendance de la fréquence émise par la voiture en fonction de sa vitesse permet de mesurer celle-ci. En effet, si la source d’ondes électromagnétiques émettant sur la fréquence ν se rapproche de l’observateur avec une vitesse v , on montre que la fréquence mesurée par l’observateur est donnée pour v c par kv . (5.2) ν = ν(1 + v /c) = ν + 2π Encadré 5.2. Radars et effet Doppler.
La voiture arrivant avec une vitesse v vers le radar « voit » une fréquence ν = ν + Δν, avec Δν/ν = v /c. Dans le référentiel où elle est immobile, elle se comporte comme un émetteur d’ondes de fréquence ν , et la fréquence mesurée par le récepteur est ν + Δν = ν + 2Δν. Pour des ondes électromagnétiques se propageant dans le vide, la variation de fréquence ne doit dépendre que de la vitesse relative de la source et de l’observateur. La formule de l’effet Doppler valable quelle que soit la vitesse est, toujours à une dimension 1 + v /c . ν =ν 1 − v /c Compte tenu de 1 + 1 + /2 si 1, on retrouve bien (5.2) si v c.
LE MONDE QUANTIQUE
97
Figure 5.5. Principe du refroidissement Doppler à une dimension. Les atomes du nuage absorbent des photons provenant des deux lasers.
Revenons maintenant au refroidissement laser, en rappelant que nous nous limitons à un mouvement suivant une droite. Les sources lumineuses sont deux lasers émettant dans des directions opposées avec une fréquence ν, et les atomes sont modélisés par deux niveaux d’énergie E1 et E2 , avec E2 − E1 = hν0 (figure 5.5). La fréquence du laser est choisie légèrement inférieure à ν0 , ν = ν0 − Δ/(2π), où Δ ν0 est appelé le désaccord. Si les atomes étaient immobiles, ils absorberaient relativement peu de photons, car ils seraient hors résonance ; rappelons que l’absorption est maximale si ν = ν0 , c’est-à-dire si la fréquence du laser ν est égale à la fréquence de résonance ν0 . Mais si les atomes ont une vitesse positive, v > 0, ils se rapprochent du laser de droite et « voient » une fréquence ν = ν + kv /2π. Ils sont plus proches de la résonance et absorbent plus fortement les photons émis par le laser de droite. Ils vont donc se trouver ralentis par effet de recul par rapport aux autres atomes de vitesse plus faible. Inversement, les atomes partant vers la gauche avec une vitesse négative v < 0 vont absorber plus fortement les photons provenant du laser de gauche, et ils sont eux aussi ralentis. Quel que soit le sens de leur vitesse, positive ou négative, les atomes sont ralentis. À trois dimensions d’espace, il faut six lasers, deux par dimension. On pourrait en conclure que ce mécanisme, après une mise au point convenable, devrait permettre de réduire la vitesse des atomes à zéro. Mais un deuxième processus est en compétition avec l’absorption et le recul correspondant, c’est l’émission spontanée. En effet, lorsqu’un atome initialement dans l’état fondamental E1 absorbe un photon et est porté dans l’état excité E2 , il revient dans son état fondamental en émettant un photon. Mais, alors que les photons absorbés ont toujours une impulsion dont la direction est fixée par les lasers, les photons de l’émission spontanée sont émis dans des directions aléatoires. L’émission s’accompagne d’un recul (le recul du tireur qui reçoit un choc), qui se fait aussi dans une direction aléatoire, et sous l’effet de ces reculs successifs, l’atome effectue une marche aléatoire dans l’espace des impulsions (ou des vitesses). En résumé, deux effets sont en compétition : 1. L’absorption de photons suivant des directions fixées par les lasers ; 2. L’émission spontanée suivant une direction aléatoire.
98
Chapitre 5. Des atomes très froids
Figure 5.6. Cycle de fluorescence. Dans la phase (1), l’atome au repos absorbe un photon du laser de direction fixée et il est porté dans son état excité E2 . Dans la phase (2), il se trouve dans son état excité avec h k/m. Dans la phase (3), il revient à son état fondamental E1 en émettant un photon de vecteur la vitesse ħ
d’onde k orienté dans une direction aléatoire, avec k + k = k par conservation de l’impulsion.
L’ensemble du processus absorption/émission est appelé cycle de fluorescence (figure 5.6). Le premier effet correspond à une force dirigée en sens inverse de la vitesse, ou de l’impulsion, c’est-à-dire à une force de viscosité F visc = −γ p, où γ est le coefficient de friction. Le second correspond à une marche aléatoire dans l’espace des impulsions. Un régime stationnaire est atteint quand les deux effets s’équilibrent. Les atomes ne sont pas ralentis jusqu’à une vitesse nulle, mais il leur reste toujours une vitesse résiduelle. Cette vitesse résiduelle dépend d’une caractéristique du niveau excité dont nous n’avons pas encore parlé, sa vie moyenne. La vie moyenne est définie de la même façon que celle d’un noyau atomique radioactif : si au temps t = 0 nous disposons d’un échantillon de N0 noyaux radioactifs, au bout d’un temps t = τ = 1/Γ qui est précisément la vie moyenne du noyau radioactif, il ne nous en restera plus qu’environ la moitié N0 /2 (plus exactement N0 /e, e 2,72, encadré 5.3) ; l’inverse Γ de la vie moyenne est le taux de désintégration. Le même concept est valable pour un atome porté dans un état excité E2 : il n’y reste pas indéfiniment et, s’il y a été porté au temps t = 0, la probabilité de le trouver dans E2 au temps t = τ = 1/Γ n’est plus que de 50 % environ ; τ = 1/Γ est la vie moyenne de l’état excité. En fait, dans l’évolution de la figure 5.6, les atomes sont soumis à un cycle absorption/émission, et le taux de photons absorbés est contrôlé par Γ, puisqu’un atome porté dans E2 met en moyenne un temps 1/Γ avant de revenir dans E1 , où il est à nouveau susceptible d’absorber un photon. Pour estimer la température obtenue dans le processus, appelée température de refroidissement Doppler, ou simplement température Doppler TD , il faut chercher une énergie caractéristique du cycle des atomes, et celle-ci est hΓ, d’où donnée par ħ hΓ. On identifie les énergies kB TD et ħ kB TD ∼ ħ hΓ.
LE MONDE QUANTIQUE
(5.3)
99
Encadré 5.3. Vie moyenne et demi-vie.
La loi de décroissance du nombre de noyaux donne ce nombre N (t) au temps t en fonction du nombre N0 au temps t = 0 N (t) = N0 e−Γt . (5.4) Pour un noyau unique, exp(−Γt) représente la probabilité que ce noyau ne se soit pas désintégré au temps t. La vie moyenne τ = 1/Γ est le temps au bout duquel il ne reste plus que N0 /e noyaux, et la demi-vie τ1/2 = τ ln 2 le temps au bout duquel il n’en reste plus que N0 /2.
L’équation (5.3) se démontre en écrivant que les effets de l’émission spontanée et de l’absorption s’équilibrent en régime stationnaire, et une analyse rigoureuse hΓ/2. Pour la transition appelée raie D2 de l’atome de sodium pour donne kB TD = ħ laquelle 1/Γ = 1,6 × 10−8 s, cette température est de 240 μK. Nous pouvons profiter de la discussion précédente pour estimer le ralentissement maximum qu’un laser peut imprimer à un atome. Comme un atome peut effectuer au maximum Γ cycles par seconde, et que la vitesse de recul due à l’absorption d’un photon est ħ hk/m, l’accélération maximale amax est de l’ordre de amax
ħ hk m
Γ.
Pour la raie D2 de l’atome de sodium, on trouve amax 105 g, 100 000 fois l’accélération de la pesanteur g 10 m/s2 ! Il existe des méthodes de refroidissement plus sophistiquées que le refroidissement Doppler, qui sont fondées sur la décomposition en sous-niveaux des niveaux E1 et E2 , ou d’un seul de ces sous-niveaux. Ces méthodes permettent de descendre jusqu’au microkelvin (μK). A priori, il semble difficile de descendre en dessous d’une température TR , la température de recul, dont l’origine est la suivante : lorsqu’un atome initialement immobile absorbe un photon h k/m, qui correspond à une énerd’impulsion ħ h k, il acquiert une vitesse de recul v = ħ 2 2 2 gie cinétique de recul ER = mv /2 = ħ h k /2m. La température de recul s’obtient en écrivant kB TR = ER et vaut 1,2 μK pour la raie D2 du sodium. Il semble que cette température de recul soit une limite infranchissable, car chaque phénomène élémentaire correspond à une variation d’énergie cinétique ER . Malgré tout, en utilisant des propriétés subtiles de la physique quantique, les physiciens sont parvenus à franchir la barrière de la température de recul et à descendre jusqu’à quelques nanokelvins. Nous avons jusqu’à présent examiné comment piéger les atomes en vitesse, c’està-dire réduire leur vitesse à l’intérieur d’un petit intervalle. Il est souhaitable de pouvoir les piéger aussi en position, c’est-à-dire de les concentrer dans un petit volume. Cela est possible grâce au piège magnéto-optique, qui agit comme une force de rappel, mais cette fois également dans l’espace des positions. Le piège magnétooptique utilise la décomposition des niveaux d’énergie, en général le niveau E2 ,
100
Chapitre 5. Des atomes très froids
Figure 5.7. Vue d’artiste d’un piège magnéto-optique. On distingue les six faisceaux laser utilisés pour le piégeage, les bobines (flèches) produisant le champ magnétique et au centre le nuage d’atome piégés. © National Institute of Standards (NIST), Science Photo Library.
par un champ magnétique, un phénomène appelé effet Zeeman. C’est la variation spatiale de ce champ qui permet de créer une force de rappel et de contenir un nuage d’atomes dans un volume limité (figure 5.7). 2.3
Horloges atomiques et atomes froids
Les atomes froids ont permis de considérablement améliorer les performances des horloges atomiques. Une horloge repose toujours sur un phénomène périodique, que ce soit le mouvement du balancier de l’horloge de nos grand-mères ou la vibration d’un cristal de quartz des montres actuelles. Le phénomène périodique utilisé dans les horloges atomiques est la vibration de l’onde électromagétique émise dans la transition entre deux niveaux bien déterminés d’un atome ou d’un ion, caractérisée par sa fréquence ν0 : si E1 et E2 (E2 > E1 ) sont les énergies de ces deux niveaux, alors la fréquence ν0 est donnée par hν0 = E2 − E1 . Pour fabriquer une horloge, il faut être capable de comparer la fréquence du signal de l’horloge à celle de la transition atomique. Il est nécessaire d’« interroger » les atomes, c’est-à-dire de comparer le signal de la transition au signal de l’horloge. Cela est illustré sur la figure 5.8, où sont comparés le signal de l’horloge et celui de la transition. Si l’on observe les deux signaux suffisamment longtemps, on met en évidence la différence de fréquence, alors qu’une comparaison sur un temps plus court ne permet pas de déceler de différence : la précision de l’horloge sera
LE MONDE QUANTIQUE
101
interrogation longue
atome horloge
atome
interrogation
horloge
courte
Figure 5.8. Comparaison entre le signal de l’atome (en rouge) et celui de l’horloge (en bleu). Les deux vibrations coïncident au temps t = 0. Si l’on observe les deux signaux suffisamment longtemps, on met en évidence une différence (figure supérieure), alors que les signaux sont pratiquement confondus sur un intervalle de temps court (figure inférieure). Courtoisie d’Erwan Jahier.
d’autant meilleure que la durée T (à ne pas confondre avec la température !) de comparaison sera plus longue. Cette comparaison entre le signal de l’horloge et le signal de référence permet de corriger les erreurs, et ainsi d’asservir le signal de l’horloge au signal de référence. Les horloges atomiques sont à l’heure actuelle les instruments les plus précis pour la mesure du temps. Il en existe plusieurs versions : une des plus courantes – c’est celle utilisée par le GPS – est l’horloge à rubidium, qui exploite une transition particulière de l’atome de rubidium et repose sur un mécanisme d’interrogation des atomes différent de celui des franges de Ramsey décrit ultérieurement. Il faut bien sûr éliminer du mieux possible tous les effets parasites qui pourraient influencer la vibration émise. Ainsi que nous l’avons vu, cette fréquence peut par exemple être modifiée par l’effet Doppler, si les atomes sont en mouvement, et la modification est d’autant plus importante que la vitesse est plus grande, d’où la nécessité de ralentir les atomes pour des mesures précises. La seconde est aujourd’hui définie par la fréquence ν0 d’une transition entre deux niveaux spécifiques de l’isotope 133 de l’atome de césium, qui sert donc d’étalon universel de temps. La fréquence ν0 de la vibration électromagnétique émise dans cette transition est par définition de 9 192 631 770 Hz, environ 1010 Hz. Nous allons expliquer une méthode possible pour comparer la fréquence ν d’une l’horloge à césium à celle ν0 de la transition atomique, la méthode des franges de Ramsey, dont le schéma est indiqué sur la figure 5.9. Un oscillateur électromagnétique S de fréquence ν, la fréquence de l’horloge que l’on veut comparer avec la fréquence atomique, alimente deux cavités C1 et C2 . L’atome entre dans la cavité C1 , parcourt la distance entre C1 et C2 en un temps T , et passe ensuite par C2 . Il est détecté à la sortie de C2 par le détecteur D qui enregistre uniquement les atomes dans l’état E2 . La méthode des franges de Ramsey présente une grande analogie de principe avec l’interféromètre de Mach-Zehnder du chapitre 1. Les cavités jouent le rôle des lames séparatrices L1
102
Chapitre 5. Des atomes très froids
T
jet d’atomes
C1
L = vT C2
détecteur D
source fréquence ν Figure 5.9. Schéma de principe d’une horloge atomique à césium utilisant la méthode des franges de Ramsey. Les cavités C1 et C2 sont alimentées par un oscillateur électromagnétique de fréquence ν . Les atomes arrivent en C1 dans le niveau E1 , ils se propagent de C1 à C2 en un temps T en parcourant une distance L = v T , où v est leur vitesse, et sont détectés en D s’ils sont dans le niveau E2 .
et L2 de l’interféromètre, les niveaux E1 et E2 celui des propagations suivant les directions X et Y . Appelons a1 (resp. a2 ) l’amplitude de probabilité de trouver l’atome dans le niveau d’énergie E1 (resp. E2 ). Quand il entre dans la cavité C1 , l’atome est dans l’état E1 , l’analogue de la propagation suivant X dans l’interféromètre de Mach-Zehnder. Les cavités agissent comme les lames séparatrices : à leur passage, les amplitudes de probabilité se transforment suivant 1 a1 → (a1 − a2 ) 2
1 a2 → (a1 + a2 ). 2
L’origine du signe (−) dans la première équation est expliquée dans l’encadré 9.1. À l’entrée dans C1 , a1 = 1, a2 = 0. Après passage dans C1 , a1 = 1/ 2 et a2 = 1/ 2 et après passage dans C2 , compte tenu des règles ci-dessus, a1 = 0 et a2 = 1. La probabilité de trouver l’atome dans le niveau E2 est Prob(E2 ) = a22 = 1, celle de le trouver dans le niveau E1 est nulle. Cela est l’analogue d’un interféromètre de Mach-Zehnder réglé de sorte que tous les photons soient détectés par DY . Cependant, les trajectoires des photons dans l’interféromètre de Mach-Zehnder sont des trajectoires dans l’espace, tandis dans le dispositif de la figure 5.9, les atomes suivent le même chemin spatial, mais leurs « trajectoires » sont différentes dans l’espace abstrait des états quantiques. Partant de son état E1 , l’atome passe dans l’état E2 , et en quelque sorte chaque cavité effectue la « moitié » du passage de E1 à E2 . Toutefois, cette description n’est correcte que si l’on a exactement ν = ν0 . Supposons donc que la fréquence ν de l’horloge diffère légèrement de celle de la transition : le désaccord Δ = 2π(ν − ν0 ) = 0. Ce cas est l’exact analogue de l’interféromètre de Mach-Zehnder lorsque les deux bras ne sont plus de longueur égale (figure 1.6). On montre alors qu’un déphasage δ = T Δ s’introduit entre les deux amplitudes a1 et a2 , et la probabilité d’observer à la sortie de C2 l’état E2 est donnée par l’analogue de (1.3) 1 1 Prob(E2 ) = [1 + cos δ] = [1 + cos(T Δ)]. 2 2 LE MONDE QUANTIQUE
103
Cela permet de comparer la fréquence de l’horloge et celle de la transition, et en fin de compte d’asservir la fréquence de l’horloge à celle de la transition. Si le détecteur, sensible uniquement à l’état excité, n’enregistre plus d’atomes, c’est que T Δ = π : on voit que la méthode détecte un désaccord Δ ∼ 1/T . T est donc le temps d’interrogation effectif de l’atome, et plus ce temps d’interrogation est long, plus précise sera l’horloge. Pour des horloges atomiques standard utilisant des atomes sortant d’un four, la précision relative est de l’ordre de 10−13 , soit une dérive d’une seconde sur 300 000 ans. La distance L entre les cavités (figure 5.9) étant fixée et de l’ordre du mètre, pour augmenter le temps de vol T il faut diminuer la vitesse, autrement dit il faut ralentir les atomes et donc avoir recours aux atomes froids ! Une fontaine atomique réalise une horloge utilisant des atomes froids (figure 5.10). On forme d’abord un nuage d’atomes froids dans un piège magnétooptique et on le fait passer deux fois dans une cavité unique. Le nuage est lancé vers le haut et passe une première fois dans la cavité ; après avoir atteint une hauteur d’un mètre environ, il retombe sous l’effet de la pesanteur et passe une seconde fois dans la cavité. Le temps d’aller-retour T , ou temps d’interrogation effectif, est d’une seconde environ, au lieu de quelques millisecondes dans une horloge atomique ordinaire. Cela permet de gagner un facteur 100 environ, et la précision relative atteint 10−15 , soit une dérive d’une seconde sur trente millions d’années !
Figure 5.10. Une fontaine atomique. Les atomes confinés dans le piège magnéto-optique (flèches horizontales) sont envoyés vers le haut par une impulsion laser (flèche verticale) avec une vitesse de l’ordre de 5 m/s. Ils passent deux fois, à la montée et à la descente, dans la cavité (anneau gris) et sont détectés par un laser (faisceau rouge). Courtoisie de Christophe Salomon.
104
Chapitre 5. Des atomes très froids
3 3.1
Condensats de Bose-Einstein Statistiques quantiques et basses températures
Nous avons vu qu’il était expérimentalement impossible de prolonger la droite de la figure 5.1 jusqu’à la température nulle car le gaz se liquéfiait avant d’atteindre le zéro absolu, ce qui invalidait l’approximation du gaz dilué. La liquéfaction est le résultat d’interactions entre molécules, et on pourrait penser que si l’on disposait d’un gaz parfait de molécules ponctuelles et sans interactions, alors la droite de la figure 5.1 pourrait être prolongée jusqu’à T = 0 K. En fait il n’en est rien et, en raison d’effets quantiques, il est impossible de prolonger cette droite jusqu’à la température nulle même dans ce cas idéalisé. Les effets quantiques dépendent d’une propriété appelée statistique quantique. Si les atomes ou les molécules du gaz parfait étaient des microboules de billard, on pourrait toujours les distinguer par un trait de peinture ou un numéro. Le fait de peindre un numéro modifie de façon négligeable les propriétés de collision des micro-boules : quand on joue au billard, peu importe que la collision implique deux boules rouges, deux boules jaunes, ou une boule rouge et une boule jaune. La différence avec les atomes vient de ce que l’on ne sait pas numéroter ceux-ci. Il ne s’agit pas ici d’une impossibilité pratique, en raison d’une technique encore déficiente, mais d’une impossibilité de principe : deux protons, deux atomes d’hélium 4, deux atomes de rubidium 87 sont indiscernables. En revanche, deux isotopes différents d’un même atome sont discernables : la différence des noyaux est le « trait de peinture » qui permet de les distinguer, même si leurs propriétés chimiques sont par ailleurs strictement identiques. Rappelons que deux isotopes sont des atomes ayant le même nombre de protons et d’électrons, mais un nombre de neutrons différents. La notation rubidium 87 par exemple indique que la somme du nombre de protons (37) et du nombre de neutrons (50) est de 87. Ainsi un atome d’hélium 4 (2 protons et deux neutrons) est différent d’un atome d’hélium 3 (2 protons et 1 neutron), un atome de rubidium 87 est différent d’un atome de rubidium 85. L’indiscernabilité des particules quantiques suggère que rien ne doit changer dans leur description quand on permute deux particules identiques. Commençons par deux particules qui peuvent se trouver dans des états quantiques i ou j, et soit ψ(i, j) l’amplitude de probabilité pour que la première particule soit dans l’état i et la seconde dans l’état j. On devrait retrouver la même amplitude de probabilité quand on permute i et j, ce qui est équivalent à permuter les deux particules. En fait, ce raisonnement n’est pas correct, car deux amplitudes de probabilité différant par un facteur de phase (encadré 5.4), par exemple un facteur −1, décrivent des situations physiques identiques : en effet les probabilités restent inchangées. L’amplitude de probabilité après permutation peut donc différer a priori de l’amplitude
LE MONDE QUANTIQUE
105
de probabilité initiale par un facteur de phase. Il est absolument remarquable que ce facteur de phase ne puisse prendre que les valeurs +1 et −1, ψ(i, j) = +ψ( j, i) ou ψ(i, j) = −ψ( j, i). Lorsque le facteur de phase prend la valeur +1, on dit que les particules sont des bosons, et lorsqu’il prend la valeur −1, que ce sont des fermions. Le même résultat est valable quand on permute deux particules dans un ensemble de plusieurs particules identiques. Les électrons, les protons, les neutrons, et les neutrinos sont des fermions, les photons sont des bosons. Une particule quantique formée d’un nombre pair N de fermions est un boson. En effet, si l’on veut permuter deux particules de ce type, il faut permuter un nombre pair N de fermions. Comme chaque permutation de deux fermions se traduit par un facteur (−1) et que (−1)N = +1 pour N pair, la particule est un boson. Un raisonnement analogue montre qu’une particule composée d’un nombre impair de fermions est un fermion. Ainsi l’atome d’hélium 4, composé de deux protons, deux neutrons et deux électrons, soit six fermions, est un boson, tandis que l’atome d’hélium 3, composé de deux protons, un neutron et deux électrons, soit cinq fermions, est un fermion. Bien que les atomes d’hélium 4 et d’hélium 3 aient les mêmes propriétés chimiques et que leur comportement à la température ordinaire soit identique (les légères différences sont imputables à la différence de masse entre les deux isotopes, différence qui n’est pas négligeable, mais qui ne saurait en aucun cas rendre compte des différences drastiques de comportement à très basse température), leur comportement à basse température est fondamentalement différent : l’hélium 4 devient superfluide à 2 K, l’hélium 3 à 2 mK ! En résumé, les particules quantiques obéissent à deux types de statistique : les bosons à la statistique dite de Bose-Einstein, les fermions à celle dite de Fermi-Dirac. L’existence de particules indiscernables et de deux types de statistique quantique a une origine profonde dans la théorie quantique des champs relativistes que nous expliquerons au chapitre 7. Encadré 5.4. Facteurs de phase.
Un facteur de phase est un nombre complexe de valeur absolue un, et donc de la forme exp(iθ ). Si ψ(i, j) est l’amplitude de probabilité pour deux particules identiques i et j, on a a priori ψ(i, j) = e iθ ψ( j, i). En fait, e iθ = ±1, ψ(i, j) = +ψ( j, i) pour les bosons et ψ(i, j) = −ψ( j, i) pour les fermions. Cette propriété est spécifique de la dimension 3 de l’espace. En dimension 2, il est possible d’avoir des particules qui ne sont ni des bosons ni des fermions, mais des cas intermédiaires appelés anyons.
L’exemple de l’hélium montre que l’effet des statistiques quantiques ne se manifeste qu’à très basse température : de façon générale, à température suffisamment basse, l’énergie cinétique moyenne n’est plus proportionnelle à la température absolue
106
Chapitre 5. Des atomes très froids
λdB
(a)
(b)
(c)
(d)
Figure 5.11. Variation de la longueur d’onde de de Broglie λdB en fonction de la température dans le cas des bosons confinés dans un piège. La température décroît de (a) à (d). Dans la figure (a), la température est très élevée et les bosons peuvent être assimilés à des micro-boules de billard. Ensuite (b) la longueur d’onde de de Broglie devient de l’ordre de la distance entre bosons, puis de l’ordre des dimensions du piège (c). Dans la figure (d), tous les bosons sont condensés dans l’état fondamental du piège. Le trait épais représente la fonction d’onde de cet état.
comme dans la relation (5.1). Pourquoi est-ce le cas ? Pour l’expliquer, nous allons comparer la longueur d’onde de de Broglie à la distance moyenne entre particules. Ainsi que nous l’avons vu en (5.1), l’énergie cinétique thermique d’une particule est ∼ kB T , sa vitesse ∼ kB T /m et son impulsion ∼ mkB T . La longueur d’onde de de Broglie correspondante, appelée longueur d’onde thermique, est d’après (1.4) λ T ∼ h/ mkB T . Si n est la densité de particules, la distance moyenne entre deux particules est d ∼ n−1/3 . L’« extension quantique » de la particule est la longueur minimale d’un train d’ondes formé avec des ondes de de Broglie, et elle est donc de l’ordre de λ T . Lorsque λ T d, les particules sont bien individualisées et les effets quantiques sont négligeables. Au contraire, lorsque λ T devient de l’ordre de d, les trains d’onde commencent à se recouvrir et les effets des statistiques quantiques deviennent importants (figure 5.11). On s’attend donc à des effets quantiques importants lorsque la température T devient plus faible qu’une température Tc donnée
LE MONDE QUANTIQUE
107
par d ∼ λ T , soit kB Tc ∼
h2 n2/3
· (5.5) m En résumé, pour T Tc , les effets quantiques sont négligeables, pour T Tc , ils sont dominants. À ce point, il convient de distinguer entre les fermions et les bosons. Ce chapitre est consacré aux bosons et l’étude des fermions est renvoyée au chapitre suivant. 3.2
Condensats de Bose-Einstein atomiques gazeux
Supposons qu’un gaz de bosons ait été enfermé dans un piège qui joue le rôle d’un puits de potentiel. Un boson isolé dans ce piège possède des niveaux d’énergie 0 , 1 , 2 , . . . À température nulle, le système de bosons recherche le minimum d’énergie, ce qui correspond à mettre tous les bosons dans l’état d’énergie minimale 0 . Rien ne s’y oppose pour les bosons, mais nous verrons que c’est impossible pour des fermions. Les bosons ont un comportement moutonnier, ils ont tendance à se mettre dans le même état quantique, alors que les fermions sont farouchement individualistes, il est impossible d’en mettre deux (ou plus !) dans le même état. Lorsque la température n’est pas nulle, la théorie du gaz de bosons devient complexe, même dans le cas idéalisé de bosons ponctuels sans interactions. Il me sera seulement possible de décrire les résultats, sans pouvoir en donner une justification intuitive. Pour fixer les idées, prenons le cas de bosons confinés dans un piège magnétique engendrant l’analogue d’un potentiel de forme parabolique, ou piège harmonique (§ 4.1.1), ce qui correspond à une force de rappel proportionnelle au vecteur
r joignant la position de l’atome à l’origine : F = −mΩ2 r , où Ω est la pulsation du piège égale à 2π f , f étant la fréquence des oscillations dans le piège. C’est une force de type ressort, où la force est proportionnelle à l’élongation. Les pièges utilisés dans les dispositifs expérimentaux sont approximativement harmoniques. Cependant, la force de rappel n’est pas en général la même dans toutes les directions, mais nous ne tiendrons pas compte de cette complication. Dans un piège harmonique, les niveaux hΩ, 2 = 2ħ hΩ, . . . , n = nħ hΩ, . . . Supposons d’énergie sont équidistants : 0 = 0, 1 = ħ que le piège contienne N bosons, N ∼ 106 dans une expérience typique. Lorsque la température est très grande, la probabilité d’occupation d’un niveau par un boson est donnée par la loi de Boltzmann (encadré 5.1) : elle est proportionnelle à exp(− n/kB T ). Lorsque T descend en dessous d’une certaine température Tc , une fraction finie des bosons se retrouve dans le niveau 0 : c’est la condensation de BoseEinstein. La température Tc peut se calculer exactement pour un gaz sans interactions dans un piège harmonique. On trouve kB Tc =
108
N 1/3 1, 06
ħ hΩ.
(5.6)
Chapitre 5. Des atomes très froids
N0 /N 1
O Tc
T
Figure 5.12. La fraction N0 /N de bosons dans l’état fondamental en fonction de la température. À T = 0, N0 = N et N0 = 0 pour T > Tc .
Pour T < Tc , le nombre N0 de bosons dans l’état 0 est représenté figure 5.12. Lorsqu’une fraction finie N0 /N de bosons se trouve dans l’état 0 , on dit que l’on a formé un condensat de Bose-Einstein. Encadré 5.5. Quelques formules pour les condensats.
Le facteur numérique 1,06 dans (5.6) est en fait (ζ(3))1/3 , où ζ(n) est la fonction de Riemann familière en théorie des nombres ζ(n) =
∞ 1 p=0
pn
ζ(3) 1,202.
On montre que pour T < Tc , le nombre N0 de bosons dans l’état 0 est donné, pour un gaz sans interactions, par 3/2 N0 T =1− . N Tc
Pour obtenir expérimentalement un condensat, on commence par refroidir les atomes dans un piège magnéto-optique, mais ce piège ne permet pas d’atteindre la température de condensation. Il faut transférer les atomes dans un piège magnétique et les refroidir suivant une technique dite de « refroidissement évaporatif », analogue à celle qui permet de refroidir son café en soufflant sur la surface. Les molécules les plus énergiques ont tendance à s’échapper plus facilement de la surface, et le fait de souffler permet de les éliminer plus rapidement que si l’on attendait tranquillement que le café se refroidisse. L’équilibre thermique se rétablit ensuite, mais à une température plus basse, car les molécules les plus énergiques ont été éliminées. En jouant sur le champ magnétique du piège, on arrive à éliminer les bosons les plus rapides, et les bosons restants rétablissent l’équilibre thermique à une
LE MONDE QUANTIQUE
109
N (v )
N (v )
v
(a)
N (v )
v
(b)
v
(c)
Figure 5.13. Les courbes en rouge donnent le nombre d’atomes N (v ) de vitesse v . En (a), les atomes sont initialement à l’équilibre thermique, mais la hauteur du piège (en vert) est brutalement diminuée. En (b), les atomes les plus énergiques, ceux qui ont les plus grandes vitesses en valeur absolue, s’échappent du piège ; la distribution N (v ) voit ses ailes coupées. Cette distribution ne correspond pas à un équilibre et la température n’est pas définie. En (c), le nombre d’atomes a diminué mais les atomes sont revenus à l’équilibre avec une distribution de vitesse plus étroite et donc une température inférieure à la température initiale (a).
température plus basse que la température initiale (figure 5.13). En répétant l’opération, on obtient une température suffisamment basse pour former un condensat (figure 5.14). On part typiquement de 109 atomes dans un piège magnéto-optique à une température voisine de 1 mK, pour arriver à condenser 106 atomes à une température de l’ordre de 1 μK. Les prouesses réalisées par les physiciens dans le domaine des atomes froids sont spectaculaires, mais quel est leur intérêt ultime ? En fait, comme on l’a vu sur l’exemple des horloges atomiques, les très basses températures autorisent un contrôle extrêmement fin des systèmes physiques, d’autant plus que le phénomène des résonances de Feschbach permet de faire varier les interactions entre particules. C’est pourquoi le domaine des condensats a littéralement explosé au cours de ces dernières années, avec des idées nouvelles comme l’étude de la transition superfluide, le piégeage dans des réseaux optiques et l’extension aux fermions. Le contrôle exercé sur ces systèmes permet de tester des modèles, ce qui est particulièrement important dans le cas des fermions – mais les bosons piégés dans des réseaux optiques présentent aussi un grand intérêt. Des modèles de fermions comme celui de Hubbard et d’autres modèles de base pour la supraconductivité à haute température ne sont pas simulables sur des ordinateurs classiques. La perspective à moyen terme serait de
110
Chapitre 5. Des atomes très froids
Figure 5.14. Condensation de Bose-Einstein. Le schéma donne la distribution de vitesse des bosons, environ 1 million d’atomes de sodium. En (a), la température est de plusieurs μK, bien au-dessus de la température de condensation Tc 1 μK, et la distribution de vitesse est proche d’une distribution de Maxwell (encadré 5.1). En (b), la température est très légèrement supérieure à la température de condensation Tc . En (c), le nuage atomique est pratiquement entièrement condensé : la distribution de vitesses est celle de l’état fondamental de l’oscillateur harmonique. Courtoisie de W. Ketterle.
fabriquer des simulateurs analogiques quantiques. Tout ceci a entraîné une rapprochement aussi spectaculaire qu’inattendu entre la physique atomique et la physique du solide ! 4
Bibliographie
Grand public. Dans la même collection que le présent ouvrage : E. Jahier, La physique des atomes ultra-froids, EDP Sciences (2010), à paraître. Il existe de nombreux articles, parmi lesquels : Y. Castin, « La saga des atomes froids », Pour la Science, décembre 2004, p. 114 ; J. Thomas et M. Gehm, « Des atomes froids à la superfluidité », Pour la Science, juillet 2004, p. 68 ; F. Chevy, « La preuve par les atomes froids », dossiers La Recherche, n◦ 29, p. 72 (2007). Niveau avancé. Un article général : C. Cohen-Tannoudji, J. Dalibard et F. Laloë, « La condensation de Bose-Einstein dans les gaz », dans Einstein aujourd’hui, p. 87, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS Éditions, Paris (2005). Pour les réseaux optiques : M. Greiner et S. Fölling, « Optical lattices », Nature, 435, 736 (2008) ; I. Bloch « Quantum coherence and entanglement with ultracold atoms in optical lattices », Nature, 453, 1018 (2008). Pour les fermions : C. Sà de Melo, « When fermions become bosons : pairing in ultracold gases », Physics Today, October 2008, p. 45.
LE MONDE QUANTIQUE
111
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
6 Le règne des semi-conducteurs Les fermions présentent des propriétés tout aussi intéressantes que celles des bosons. En pratique, les électrons sont le cas particulier le plus important de fermions, car ce sont eux qui sont responsables de la conduction électrique dans les métaux et les semi-conducteurs. Il est impossible de comprendre le phénomène de la conduction électrique sans faire appel à la physique quantique. Deux propriétés sont fondamentales : la propagation ondulatoire des électrons dans un réseau cristallin et le principe d’exclusion de Pauli, conséquence du caratère fermionique des électrons. Dans la section 6.1, je donnerai quelques éléments de la théorie de la propagation des électrons dans un cristal, avec comme conséquence le phénomène des bandes d’énergie et je décrirai le remplissage de ces bandes conformément au principe de Pauli. Cela sera utilisé dans la section 6.2 pour l’étude des propriétés des semi-conducteurs, qui sont le matériau de base de toute l’électronique, de la technologie des ordinateurs et des téléphones portables, des lecteurs de CD et de codes-barres et des télécommunications à haut débit. Enfin, dans les sections 6.3 et 6.4, j’expliquerai le principe des diodes électroluminescentes (LED) et des diodes laser.
1
Conducteurs et isolants
Au chapitre précédent, nous avons décrit la tendance qu’ont les bosons à s’agglutiner dans le même état quantique. C’est la situation exactement inverse qui prévaut pour les fermions : il est impossible de mettre deux fermions identiques dans le même état quantique. Cette propriété est appelée principe d’exclusion de Pauli. Ce principe découle en fait de l’antisymétrisation des amplitudes de probabilité pour les fermions (§ 5.3.1) : considérons deux états quantiques possibles i et j pour deux fermions
V (x) x 5 4 3 2 1 0 Figure 6.1. Remplissage des niveaux d’un puits de potentiel V (x) par des fermions à température nulle. Les niveaux sont ordonnés de bas en haut à partir du niveau fondamental 0 . Dans l’exemple choisi, 4 fermions sont placés dans le puits et ils occupent les niveaux 0 . . . 3 , alors que les niveaux 4 et 5 ne sont pas occupés. Le niveau de Fermi est 3 et l’énergie globale vaut E0 = 0 + 1 + 2 + 3 .
identiques, et soit ψ(i, j) l’amplitude de probabilité pour trouver le premier fermion dans l’état i et le second dans l’état j. Les deux fermions étant identiques, on doit avoir ψ(i, j) = −ψ( j, i), alors que pour deux bosons on aurait ψ(i, j) = +ψ( j, i). Si maintenant i et j sont des états quantiques identiques, i ≡ j, ceci implique pour des fermions ψ(i, i) = 0, d’où le principe de Pauli. Ce principe est à la base de toute la construction des atomes et des molécules, car il dicte la façon de placer les électrons dans les différents niveaux d’énergie. Nous allons l’expliquer sur un exemple simple, le remplissage des niveaux d’énergie n d’un puits de potentiel. Le schéma des niveaux est donné dans la figure 6.1 et les n sont les niveaux d’énergie individuels pour une particule dans le puits. Les fermions sont confinés dans le puits de potentiel, et nous cherchons le niveau fondamental global de l’ensemble des N fermions, supposés sans interactions entre eux, qui sera l’état du système à température nulle. Nous avons vu que pour les bosons cet état fondamental est obtenu en mettant les N bosons dans l’état fondamental de plus basse énergie 0 , ce qui fait que l’énergie globale est N 0 . Il n’est bien sûr pas possible de procéder de la sorte pour des fermions : une fois le niveau 0 occupé par un fermion, on ne peut pas y mettre un second. Pour construire l’état d’énergie globale la plus basse, il faut mettre le premier fermion dans 0 , le second dans 1 , le troisième dans 2 . . ., jusqu’à ce que tous les fermions aient trouvé leur place dans un niveau : autrement dit, on remplit les niveaux d’énergie du puits par ordre d’énergie croissante comme le montre la figure 6.1. Le niveau d’énergie le plus élevé attribué à un fermion est d’une importance capitale en physique du solide et il est appelé niveau de Fermi. C’est 3 dans la figure 6.1. Lorsque les fermions interagissent entre eux, le problème devient beaucoup plus compliqué et en général il n’est pas exactement soluble. Cependant
114
Chapitre 6. Le règne des semi-conducteurs
a
Cl− Na+ Figure 6.2. Structure cristalline du chlorure de sodium. Le motif se répète dans les trois directions d’espace avec une périodicité de a = 0,56 nm, le pas du réseau.
la notion de niveau de Fermi reste valable : c’est l’énergie qu’il faut apporter au système pour passer de N − 1 à N fermions. Comme en pratique N est très grand, N ∼ 1023 , c’est aussi l’énergie nécessaire pour passer de N à N + 1 fermions, c’està-dire pour ajouter un fermion au système à température nulle. La définition que nous avons donnée du niveau de Fermi est précisément celle du potentiel chimique à température nulle, mais niveau de Fermi et potentiel chimique sont différents lorsque T = 0. Malgré tout, les physiciens des semi-conducteurs parlent indifféremment – mais abusivement – de potentiel chimique ou de niveau de Fermi. Nous venons de décrire le cas où N fermions se déplacent librement à l’intérieur d’un puits de potentiel, mais le cas intéressant en pratique est celui d’électrons se déplaçant dans un cristal. Un cristal est fondé sur une structure périodique, le réseau cristallin, dont le motif, appelé maille du cristal, se répète périodiquement dans l’espace. La figure 6.2 illustre un exemple simple, celui du chlorure de sodium (du sel de cuisine !). Les ions Na+ et Cl− sont placés aux nœuds d’un réseau cubique et le motif se répète dans les trois dimensions d’espace avec une périodicité a = 0,56 nm, le pas du réseau. Dans un cristal, les électrons proches du noyau atomique, ou électrons des couches internes, restent confinés au voisinage de leurs noyaux respectifs et ne se déplacent pas dans le cristal. En revanche, les électrons externes qui sont peu liés se déplacent plus ou moins librement dans le cristal. Ce sont ces électrons qui vont contribuer au courant électrique en se mettant en mouvement lorsqu’on leur applique un champ électrique. La conduction électrique dans un métal semble donc relever d’un mécanisme très simple, la mise en mouvement d’électrons libres dans un cristal. Plus précisément, la conduction électrique est due à un transport de charges et, dans une approche de physique classique, les électrons libres sont mis en mouvement sous l’effet d’un champ électrique. Ils acquièrent une certaine vitesse v
LE MONDE QUANTIQUE
115
et, si leur densité de charge est ρ, la densité de courant est j = ρ v . Ce courant est dirigé en sens inverse de v car la charge des électrons est négative. De façon plus quantitative, sous l’action d’un champ électrique E, les électrons acquièrent une accélération −qE/m, où q et m sont la valeur absolue de la charge et la masse de l’électron, mais en raison des collisions, leur vitesse ne croît pas indéfiniment et tend très vite vers une vitesse limite. La vitesse effective v du déplacement des charges est en fait cette vitesse limite. De plus, la masse m qui intervient dans l’accélération n’est pas la masse de l’électron se propageant dans le vide, mais la masse effective m∗ de l’électron se propageant dans le cristal (encadré 6.1). Encadré 6.1. Quasi-particules et masse effective.
En fait les électrons dans un métal interagissent fortement entre eux. Il est tout à fait remarquable que l’on puisse décrire ce gaz d’électrons en interaction forte par un gaz de quasiparticules (ou pseudo-particules) dont les interactions sont faibles, en substituant simplement à la masse dans le vide m de l’électron la masse effective m∗ de la quasi-particule. Ce schéma de quasi-particules n’est pas universel. Dans les systèmes de basse dimensionnalité, il n’est pas possible en général d’ignorer les interactions, et on a alors affaire à un ensemble de fermions fortement corrélés, dont les propriétés ne sont pas du tout celles d’un gaz de quasi-particules. Ces sytèmes fortement corrélés sont encore mal compris et ils interviennent par exemple dans la supraconductivité à haute température.
Ce mécanisme de conduction est effectivement très simple, mais il est absolument incapable d’expliquer pourquoi il existe des conducteurs et des isolants ! Pour comprendre un phénomène aussi simple et familier que la conduction de l’électricité, on ne peut pas se passer de la physique quantique. Lorsqu’un électron se déplace dans un cristal, on ne peut absolument pas assimiler son mouvement à celui d’une microboule de billard, l’aspect ondulatoire est essentiel. En effet, la propagation de l’onde électronique dans le potentiel périodique créé par les ions du cristal se traduit par des interférences multiples, et ces interférences entraînent que les niveaux d’énergie permis se regroupent dans des intervalles bien définis, appelés bandes d’énergies permises, alors que d’autres intervalles, les bandes d’énergies interdites, sont exclus (figure 6.3a). Les bandes interdites sont dues à des interférences destructives et sont donc la conséquence d’un phénomène typiquement ondulatoire. Dans un cristal parfait à température nulle, les électrons se propagent sans aucune dissipation. La résistivité est due aux imperfections du réseau : impuretés, défauts ou vibrations dues à l’agitation thermique. Plaçons-nous pour simplifier à une dimension, en appelant k le vecteur d’onde de l’électron. En raison de la périodicité du réseau, le vecteur d’onde k + 2π/a, où a est le pas du réseau, est équivalent à k (encadré 6.2), de sorte que l’on peut restreindre k à l’intervalle 0 ≤ k ≤ 2π/a, ou, de façon plus symétrique, à −π/a ≤ k ≤ +π/a comme dans les figures 6.3 et 6.4. Le premier ingrédient essentiel d’origine quantique permettant d’expliquer la conduction de l’électricité est
116
Chapitre 6. Le règne des semi-conducteurs
E(k)
E(k)
E(k)
Eg k −π/a
π/a (a)
k −π/a
π/a (b)
k −π/a
π/a (c)
Figure 6.3. Bandes d’énergie et conductivité électrique. (a) Bandes d’énergie permises et interdites : la bande de valence (en vert) et la bande de conduction (en rouge) sont des bandes permises. Chaque niveau d’énergie E(k) correspond à deux valeurs de k , l’une positive et l’autre négative. Entre les deux bandes permises, il n’existe aucun niveau d’énergie (zone en grisé) : cette zone est une bande interdite. La largeur de cette bande interdite ou, de façon équivalente, la distance entre le maximum de la bande de valence et le minimum de la bande de conduction est le gap d’énergie E g . (b) Isolant ou semi-conducteur : la bande de valence est entièrement remplie (cercles pleins) et la bande de conduction est vide. Les niveaux d’énergie dans les bandes permises forment un quasi-continuum et la différence d’énergie entre niveaux successifs d’une même bande a été considérablement exagérée pour la clarté de la figure. (c) Conducteur : la bande de conduction est partiellement remplie, les cercles pleins correspondant aux niveaux occupés et les cercles vides aux niveaux inoccupés. Sous l’action d’un champ électrique, la distribution dans la bande de conduction devient asymétrique : il y a par exemple davantage d’électrons avec k > 0 que d’électrons avec k < 0, ce qui produit un flux d’électrons dirigé de gauche à droite et donc un courant électrique dirigé en sens inverse, en raison de la charge négative des électrons.
la structuration des niveaux d’énergie en bandes permises et bandes interdites (figure 6.3a). Le second ingrédient est le caractère fermionique des électrons. Comme dans l’exemple du puits de potentiel, nous devons remplir les bandes d’énergie avec les électrons libres du cristal. Deux bandes vont jouer un rôle crucial, la bande de valence et la bande de conduction. La bande de valence correspond aux niveaux les plus bas et elle est entièrement remplie (figure 6.3b). Dans les figures 6.3 et 6.4, la différence d’énergie entre niveaux successifs d’une même bande a été considérablement exagérée pour la clarté des figures : la différence entre deux niveaux successifs d’une même bande est typiquement de 10−20 eV et ces niveaux forment un quasi-continuum, alors que la largeur E g de la bande interdite est de l’ordre de l’eV. La bande de valence ne peut pas contribuer à la conduction du courant électrique, car elle est symétrique quand on change +k en −k : à tout électron d’énergie E(k) dans la bande de valence correspond un autre électron de même énergie E(−k). Si hk/m orientés vers un électron possède un vecteur d’onde k et une vitesse v (k) = ħ la droite, il lui correspondra un autre électron de vecteur d’onde −k et de vitesse v (k) = −ħ hk/m, de sorte que le flux global de charge dû aux deux électrons est nul.
LE MONDE QUANTIQUE
117
E(k)
E(k)
k
k
(a)
(b)
Figure 6.4. Dopage d’un semi-conducteur. (a) Dopage de type n : la bande de valence est pleine mais un petit nombre d’électrons (cercles pleins) occupe la bande de conduction. (b) Dopage de type p : quelques électrons sont manquants (cercles ouverts) dans la bande de valence : on observe alors une conduction par trous.
Il n’y a évidemment aucun courant en l’absence de champ électrique appliqué, mais l’application d’un tel champ ne change rien : les électrons restent bloqués dans leurs niveaux initiaux en raison du principe de Pauli. Un isolant est un cristal dont la bande de valence est pleine et où la bande de conduction est vide d’électrons (figure 6.3b). Au contraire, dans un conducteur, la bande de conduction est partiellement remplie (figure 6.3c). Lorsqu’un champ électrique est appliqué à un cristal conducteur, les électrons de k > 0 (par exemple) peuvent occuper des niveaux d’énergie plus élevés, en se plaçant dans des niveaux qui étaient auparavant inoccupés (figure 6.3c), ce qui était interdit pour une bande pleine en raison du principe de Pauli. En résumé, l’explication de la conduction électrique repose sur deux phénomènes typiquement quantiques : 1. L’existence de bandes d’énergie permises et interdites, qui ont pour origine la propagation ondulatoire des électrons dans un potentiel périodique. 2. Le remplissage de ces bandes conformément au principe de Pauli. Encadré 6.2. Impulsion et vecteur d’onde dans un cristal.
On montre grâce au théorème de Bloch, qui est la version spatiale du théorème de Floquet, que la fonction d’onde est de la forme exp[ik x] u(x), où u(x) est périodique et de période a. Si l’on remplace k par k = k + 2π/a exp[ik x] u(x) = exp[ik x] [exp[(2iπx/a)] u(x) = exp[ik x] u (x)
118
Chapitre 6. Le règne des semi-conducteurs
où u (x) est aussi périodique de période a. Le vecteur d’onde k ne varie donc pas entre −∞ et +∞ comme pour une particule libre, et on appelle k un « quasi-vecteur d’onde ». De même l’impulsion associée par p = ħ hk est une « quasi-impulsion », et non une impulsion de particule libre.
Nous avons vu au chapitre précédent qu’il fallait descendre à très basse température pour que les effets quantiques se manifestent dans le cas des bosons : 2 K pour la superfluidité de l’hélium 4, 1 μK pour les condensats de Bose-Einstein. Ce sont effectivement là des températures très basses par rapport à la température ambiante de 300 K. Dans le cas du gaz d’électrons, on peut associer à l’énergie de Fermi F une température de Fermi TF = F /kB . L’énergie de Fermi d’un conducteur métallique est de l’ordre de l’électron-volt, ce qui donne TF ∼ 104 K. La température TF est une température très grande par rapport à la température ambiante : cela explique que le gaz d’électrons dans un conducteur soit un gaz quantique et que les effets quantiques soient dominants même à 300 K. Il en résulte que l’énergie cinétique moyenne des électrons n’est pas proportionnelle à la température : pour les électrons dans un métal, l’équation (5.1) n’est pas vérifiée.
2
Semi-conducteurs
Revenons sur le cas de de la figure 6.3b : lorsque la température n’est pas nulle, T = 0, l’agitation thermique fait passer quelques électrons de la bande de valence dans la bande de conduction. La densité d’électrons dans la bande de conduction est donnée par la loi de Boltzmann : elle est proportionnelle à exp[−E g /(2kB T )], où E g est l’énergie nécessaire pour passer du haut de la bande de valence au bas de la bande de conduction. Selon une terminologie consacrée, cette énergie est appelée « gap d’énergie », ou simplement « gap », d’où la notation E g . Comme E g est de l’ordre de l’électron-volt et que kB T ∼ 0,0025 eV à la température ambiante, cette densité d’électrons est très faible. Lorsque le gap est petit, E g < ∼ 1 eV, elle n’est cependant pas entièrement négligeable, et le cristal conduit un peu l’électricité, ce qui justifie l’appellation « semi-conducteur ». Cette conductivité d’origine thermique diminue quand le gap augmente et, pour le carbone sous la forme diamant où E g 5 eV, elle est pratiquement nulle : le diamant est un excellent isolant. Cela dit, on voit qu’il n’existe pas de différence de principe entre un isolant et un semi-conducteur. Si l’agitation thermique était la seule source de la conductivité électrique dans les semi-conducteurs, ces derniers seraient plus ou moins tombés dans l’oubli. L’intérêt des semi-conducteurs vient de ce que l’on sait les doper pour augmenter leur conductivité. On peut par exemple partir d’un cristal de silicium et remplacer certains atomes de silicium du réseau cristallin par des atomes de phosphore. Le phosphore
LE MONDE QUANTIQUE
119
possède un électron de valence de plus que le silicium et cet électron supplémentaire va se comporter comme un électron libre dans le réseau : l’atome de phosphore est un donneur (d’électrons). Compte tenu du principe de Pauli, il va occuper un état de la bande de conduction, puisque tous les états de la bande de valence sont déjà occupés. On a ainsi fabriqué un semi-conducteur de type n (négatif), car le courant est dû au déplacement de charges négatives, celles de électrons. Ce cas est représenté sur la figure 6.4a. Le cas de la figure 6.4b est aussi remarquable et va jouer un rôle majeur dans les semi-conducteurs. Dans cette figure, on observe que la bande de conduction est vide, mais que quelques électrons manquent dans la bande de valence. On montre qu’une absence d’électron de vecteur d’onde k se comporte comme un particule effective de vecteur d’onde −k et de charge opposée à celle de l’électron. Cette particule effective, qui bien sûr n’existe pas à l’état libre mais seulement à l’intérieur d’un cristal, est appelée un trou. Il est donc parfaitement possible que l’on observe une conductivité électrique due au déplacement de charges positives, ou « conductivité par trous ». Cette conductivité par trous est incompréhensible en physique classique, car il faudrait admettre que les ions (chargés positivement) participent à la conductivité électrique, ce qui est impossible : en effet, les ions sont solidement ancrés aux nœuds du réseau cristallin. Un semi-conducteur de type p (positif) est obtenu en remplaçant des atomes de silicium par des atomes (par exemple de bore) qui capturent des électrons, ce qui crée des trous dans la bande de valence : l’atome de bore est un accepteur (d’électrons). La conduction est alors due au déplacement de charges positives, celles des trous. C’est grâce au dopage que les semi-conducteurs deviennent des matériaux intéressants ! Encadré 6.3. Électrons et trous.
Au minimum de la bande de conduction, l’énergie d’un électron a une forme parabolique en fonction du vecteur d’onde k : E = ħ h2 k2 /(2m∗e ), et cette expression définit la masse effective ∗ me de l’électron (encadré 6.1) ; la concavité de E(k) est dirigée vers le haut. En revanche, au maximum de la bande de valence, la concavité de E(k) est dirigée vers le bas, ce qui donnerait une masse effective négative. Le passage aux trous (h = « hole ») donne une masse h2 (−k)2 /(2m∗h ). effective positive m∗h aux trous, avec Eh(k) = ħ
La diode (ou jonction) p − n est à la base des applications les plus importantes des semi-conducteurs dopés. Supposons que nous accolions deux cristaux de silicium, dont l’un est dopé n et l’autre p, et que nous appliquions une différence de potentiel V (une tension électrique V ) à l’ensemble. Le courant en fonction de V est tout à fait asymétrique : on voit sur la figure 6.5a que le courant circule facilement dans un sens lorsque V > 0 – on dit que la diode est polarisée en direct –, et qu’il augmente même exponentiellement en fonction de V , mais que dans l’autre sens il reste pour
120
Chapitre 6. Le règne des semi-conducteurs
zone n
zone p
E
I
U0 V
n
p V IS (a)
(b)
Figure 6.5. (a) Courant dans une diode p − n, ou caractéristique de la diode. Pour V > 0 (diode polarisée en direct), le courant croît exponentiellement avec V . Pour V < 0 (diode polarisée en inverse), le courant tend vers le courant de saturation IS . (b) Diagramme de bandes. La bande de conduction est en rouge, la bande de valence en vert ; les électrons sont représentés par les cercles pleins et les trous par les cercles ouverts. En l’absence de tension appliquée (V = 0), les électrons au voisinage de la jonction sont repoussés vers la gauche et les trous vers la droite par une barrière de potentiel de hauteur U0 = −qV0 voisine du gap d’énergie ; le champ électrique correspondant est
E . La hauteur de la barrière est diminuée de qV (tirets) quand on applique une tension V .
V < 0 (diode polarisée en inverse) limité à un courant appelé courant de saturation IS . Pour expliquer cet effet, il faut remarquer qu’en l’absence de tension externe (V = 0), la jonction doit jouer le rôle d’une barrière d’énergie potentielle (ou simplement de potentiel) de hauteur U0 = −qV0 où q est la valeur absolue de la charge de l’électron, voisine du gap d’énergie, et qui repousse les électrons essayant de passer de la zone n vers la zone p et les trous venant de la zone p vers la zone n. En effet, la densité d’électrons est grande dans la zone n et très faible dans la zone p et en l’absence de barrière de potentiel, les densités tendraient à s’équilibrer par diffusion. C’est la barrière de potentiel qui s’oppose au passage n → p en repoussant les électrons vers la zone n ; la résolution des équations de l’électrostatique permet de calculer la forme explicite de cette barrière. Limitons-nous au cas des électrons, car le même raisonnement vaut pour les trous. Dans la figure 6.5b, lorsqu’un électron vient de la zone n où les électrons sont nombreux (leur densité est égale à celle ND
LE MONDE QUANTIQUE
121
des donneurs), cet électron est repoussé par la barrière de potentiel et ne passe que très rarement du côté p : il devrait pour ce faire « remonter » la barrière de potentiel (figure 6.5b). Inversement, les électrons sont peu nombreux du côté p, mais si un électron passe dans la bande de conduction par exemple par agitation thermique au voisinage de la jonction, il sera immédiatement balayé vers la zone n car il « descend » la barrière de potentiel. Un raisonnement identique s’applique aux trous, très nombreux dans la zone p et rares dans la zone n : l’énergie potentielle d’équilibre est aussi répulsive pour les trous. Lorsque V = 0, il n’y a pas de courant, ce qui veut dire que les courants p → n et n → p s’équilibrent. Lorsqu’une tension positive V > 0 est appliquée du côté p, la hauteur de la barrière de potentiel est diminuée de qV : U0 → −q(V0 + V ) (V0 < 0 !), et le courant d’électrons n → p augmente suivant une loi exponentielle (encadré 6.4). Lorsque V < 0, le courant n → p tend à être supprimé, mais celui p → n n’est pas affecté et donne le courant de saturation. Une diode p − n peut par exemple être utilisée pour « redresser » un courant alternatif et le transformer en courant continu. La diode p − n décrite ci-dessus est un exemple d’homojonction, car le matériau de base, le silicium par exemple, est identique des deux côtés de la jonction, même si les dopages sont différents. Des effets nouveaux et spectaculaires vont se manifester lorsque l’on accolera des semi-conducteurs différents pour former une hétérojonction. Encadré 6.4. Courant d’électrons dans une diode.
Lorsque V = 0, le courant n → p est proportionnel à la densité de donneurs ND multipliée par la probabilité exp(−U0 /kB T ) de franchir la barrière. Le courant p → n est lui proportionnel à la (faible) densité Ne d’électrons du côté p. Comme les courants p → n et n → p doivent s’équilibrer en l’absence de tension appliquée, on doit avoir ND exp(qV0 /kB T ) = Ne . Lorsque V = 0, on doit remplacer V0 (V0 < 0) par V0 + V , ce qui affecte le courant n → p mais pas celui p → n. Le courant total est donc proportionnel à Ne [exp(qV /kB T ) − 1] qui s’annule, comme il se doit, pour V = 0.
Suite aux travaux initiaux de Bardeen et Brattain, Shockley construisit en 1951 le premier transistor en accolant trois zones dopées différemment, p, n et p, soit deux jonctions p − n tête-bêche, d’où la dénomination transistor p − n − p, où les trois éléments sont respectivement l’émetteur, la base et le collecteur. Le transistor permet des variations importantes du courant entre le collecteur et l’émetteur engendrées par de petites variations de courant dans la base : le transistor fonctionne comme un amplificateur. Le fonctionnement de ce transistor, tout comme celui de la
122
Chapitre 6. Le règne des semi-conducteurs
diode p − n, peut se comprendre en analysant les courants d’électrons et de trous dans les deux jonctions. Le transistor décrit ci-dessus est le transistor bipolaire ; dans la plupart des applications, ce transistor a été remplacé aujourd’hui par le transistor à effet de champ (FET : Field Effect Transistor), et surtout sa variante MOS (Metal/Oxyde/Semiconductor) où les trois électrodes sont la source, la grille et le drain. Une petite variation de la tension appliquée à la grille engendre des variations de courant importantes entre la source et le drain. Ce transistor MOS permet de réaliser des amplificateurs et des interrupteurs : c’est cette dernière propriété qui en fait un outil idéal pour la logique binaire. Le saut technologique décisif fut la naissance des circuits intégrés : au lieu de joindre les différents éléments d’un circuit par des fils conducteurs, les transistors furent directement gravés par lithographie avec les éléments passifs (résistances, condensateurs. . .) sur des plaques de semi-conducteurs, en général une plaque de silicium, pour donner des microprocesseurs. L’expression « micro-électronique » vient de ce que la taille des transistors a diminué jusqu’au micromètre, et même au-delà, puisqu’on arrive aujourd’hui à des dimensions de l’ordre de 50 nanomètres avec jusqu’à 3 milliards de transistors gravés sur un microprocesseur. C’est cette miniaturisation des transistors qui est à l’origine de la célèbre « loi de Moore », qui énonce que la puissance de calcul de nos ordinateurs portables est multipliée par deux tous les dix-huit mois. 3
Interaction avec un champ électromagnétique
Les semi-conducteurs, et tout particulièrement le silicium, sont utilisés de façon intensive en électronique, comme en témoigne l’expression « Silicon Valley », la vallée du silicium en Californie. Cette électronique est maintenant très technologique et éloignée de la physique fondamentale, sauf pour quelques applications de pointe : transistors à un seul électron, électronique de spin, nanotubes de carbone. . . et je vais plutôt passer aux applications des semi-conducteurs à l’électro-optique. Les semiconducteurs interagissent avec le rayonnement électromagnétique : ils peuvent absorber des photons en produisant un courant électrique, ou inversement émettre des photons sous l’action d’un courant. Le premier effet est utilisé dans les détecteurs de photons et les cellules photovoltaïques, le second dans les diodes électroluminescentes ou LED (Light Emitting Diodes) et les diodes laser. Lorsqu’un photon d’énergie hν suffisante arrive sur un semi-conducteur massif, il peut faire passer un électron depuis la bande de valence dans la bande de conduction, en laissant un trou dans la bande de valence ; il crée une paire électron-trou. Pour que cet effet puisse se produire, il faut d’abord que l’énergie du photon soit plus grande que le gap d’énergie, hν > E g , et d’autre part que le sommet de la bande de valence soit juste en dessous du minimum de la bande de conduction comme dans la figure 6.4, ce qui est le cas des semi-conducteurs dits à gap direct. Sinon on a affaire
LE MONDE QUANTIQUE
123
à un semi-conducteur à gap indirect, ce qui est le cas du silicium où le maximum de la bande valence est décalé par rapport au minimum de la bande de conduction. L’interaction avec le rayonnement électromagnétique est beaucoup plus facile pour un semi-conducteur à gap direct : la difficulté dans le cas des semi-conducteurs à gap indirect vient de ce qu’il faut assurer la conservation de l’impulsion, ce qui explique que le silicium n’est pas, ou peu, utilisé en électro-optique. Cependant, même pour les semi-conducteurs à gap direct, l’interaction entre un photon et une paire électron-trou est faible pour le matériau massif, et le processus est relativement peu efficace dans un cas (détection de photons) comme dans l’autre (production de photons). Nous verrons bientôt comment augmenter l’efficacité de l’interaction entre semi-conducteurs et photons. La façon la plus simple de réaliser une diode électroluminescente est de placer en sandwich une zone active, celle où se formeront les paires électrons-trous, entre deux couches de semi-conducteurs dopés p et n. Comme dans la figure 6.5, l’application d’une tension électrique positive (la diode est polarisée en direct) sur l’ensemble balaie les trous et les électrons vers la jonction, ou zone active, où il se recombinent pour donner des photons ; en d’autres termes, les électrons perdent une énergie E g en passant de la bande de conduction à la bande de valence. La longueur d’onde de ces photons est déterminée par le gap E g : la fréquence du photon émis est ν = E g /h et sa longueur d’onde λ = hc/E g . Une LED produit une lumière de longueur d’onde fixée, et donc de couleur fixée, par exemple rouge si le gap vaut 1,5 eV. Au contraire, une ampoule à incandescence classique produit une lumière blanche, parce que son spectre d’émission contient toutes les longueurs d’onde du visible. Pour obtenir une couleur déterminée, il faut filtrer cette lumière, et perdre ainsi une partie de la lumière initiale qui est absorbée par le filtre. Avec une LED, le problème est exactement inverse : il faut combiner des LED émettant plusieurs longueurs d’onde différentes pour « reconstituer » de la lumière blanche. Toutefois, cette lumière est beaucoup plus « froide » que celle des sources thermiques. Les LED ont un rendement énergétique, c’est-à-dire un taux de conversion de l’énergie électrique en énergie lumineuse de l’ordre de 20 %, bien meilleur que celui des ampoules à incandescence, qui est de 3 à 5 %. La comparaison est encore plus à l’avantage des LED quand il faut obtenir des couleurs déterminées : par exemple, le filtre rouge utilisé pour les feux stop des voitures absorbe 80 % de la lumière émise par une ampoule classique. Il vaut bien mieux remplacer une ampoule de feu stop par une LED émettant directement dans le rouge. 4
Hétérostructures et diodes laser
Les LED de première génération dont nous venons de décrire le fonctionnement, étaient des homojonctions, le semi-conducteur étant identique de chaque côté de
124
Chapitre 6. Le règne des semi-conducteurs
Al x Ga1−x As
GaAs
Al x Ga1−x As
Figure 6.6. Une hétérostructure Al x Ga1−x As/GaAs formant un puits quantique. Al = aluminium, Ga = gallium, As = arsenic. Al x Ga1−x : bleu ; GaAs : rose. On a également représenté le carré de la fonction d’onde d’un électron dans le puits. Courtoisie de Borge Vinter.
la jonction. On démultiplie la souplesse d’utilisation et le rendement de l’émission lumineuse en ayant recours à des hétérojonctions, c’est-à-dire à des jonctions où l’on accole plusieurs semi-conducteurs différents. En effet, la densité de paires électronstrous est bien supérieure dans une hétérostructure pour un même flux de porteurs de charge. Ces hétérojonctions n’existent pas dans la nature, ce sont des créations entièrement artificielles obtenues par dépôt de couches monoatomiques successives sur un substrat. Cette croissance couche par couche s’obtient par un procédé dit d’épitaxie, dont il existe plusieurs variantes. Pour que l’épitaxie puisse fonctionner, il faut que les mailles des semi-conducteurs que l’on veut accoler soient suffisamment voisines. La figure 6.6 représente l’archétype d’hétérostructure, où quelques dizaines de couches atomiques d’arsénure de gallium (GaAs) sont prises en sandwich entre deux tranches de semi-conducteur Al x Ga1−x As : cette formule indique qu’une fraction x des atomes de gallium dans le GaAs est remplacée par la même fraction d’atomes d’aluminium. Comme le gap de GaAs est plus petit que celui de l’autre semiconducteur, cette hétérostructure forme un puits quantique, du type de ceux étudiés dans la section 4.2, dont la largeur est de l’ordre de la dizaine de nm. Les électrons sont piégés dans la direction de croissance des couches, mais sont libres de se déplacer dans la direction perpendiculaire. On est donc en présence d’un gaz d’électrons bidimensionnel. Dans la direction de croissance, tout se passe qualitativement comme dans le puits quantique de la section 4.2 ; bien sûr le puits n’est pas infini, mais il existe un petit nombre de niveaux d’énergie discrets. L’existence de ces niveaux conduit à distinguer entre deux types de transition (figure 6.7).
LE MONDE QUANTIQUE
125
Transition intra-bande
Transition inter-bandes
Bande de conduction
Bande de conduction eV
eV
électron
0.1 à 0,3eV 0.7 à 3eV
trou
Bande de valence
(a)
(b)
Figure 6.7. Transitions inter-bandes et intra-bandes. (a) Transition inter-bande : le rayonnement est émis par la recombinaison d’une paire électron-trou. (b) Transition intra-bande : un électron passe d’un niveau d’énergie supérieur à un niveau inférieur en émettant un photon. Courtoisie de Jean-Paul Pocholle.
1. Les transitions inter-bandes, qui se font entre un niveau d’énergie dans une bande et un niveau d’une autre bande par recombinaison électron-trou. L’énergie du photon produit dans une telle transition vaut environ celle du gap (0,7 à 3 eV), mais avec une correction due aux niveaux d’énergie des puits. Cela permet de modifier la longueur d’onde et de l’ajuster à la demande. 2. Les transitions intra-bandes, qui se font entre deux niveaux d’énergie du puits dans la même bande et font intervenir un seul type de porteur de charge, les électrons. Ce sont donc des transitions tout à fait analogues à celles du puits de la section 4.2. Les différences d’énergie typiques entre niveaux sont de quelques dixièmes d’eV, ce qui correspond à une émission dans l’infra-rouge utilisée dans les diodes laser à cascade quantique. On observe que les longueurs d’onde peuvent être ajustées pratiquement à la demande, selon une ingénierie fondée sur la physique quantique : on peut à juste titre parler d’ingénierie quantique. Les hétérojonctions sont utilisées dans la fabrication des LED modernes, dont le schéma est donné dans la figure 6.8a. L’émission d’une LED, qui correspond à l’émission spontanée, n’est pas directionnelle en raison de l’indice optique important des semi-conducteurs. Le principal problème est d’extraire les photons du semi-conducteur : en effet, ce dernier possède un indice de réfraction élevé et en raison de la loi de Snell-Descartes, les photons sont piégés par des réflexions internes totales, et même pour des incidences proches de la normale, la réflectivité reste forte. Heureusement, on bénéficie d’un phénomène de « recyclage des photons » : un photon réfłéchi peut lui-même créer une paire électron-trou. Pour fabriquer une diode laser (figure 6.8b), et pas simplement une LED, il faut deux ingrédients supplémentaires identifiés dans la section 4.5.
126
Chapitre 6. Le règne des semi-conducteurs
a
Métal
p
Oxyde
n Substrat transparent et conducteur
Métal
b
l d
p n
λ/d
λ/l
Figure 6.8. Schémas d’une diode électroluminescente et d’une diode laser. (a) Diode électroluminescente : le substrat étant transparent, la lumière émise vers l’arrière est réfléchie par la face arrière métallique, ce qui augmente le rendement de la diode. (b) Diode laser : deux couches de confinement de type p et n encadrent la zone active où sont produits les photons. La lumière est émise dans le plan de la jonction. Dans la direction horizontale, la divergence du faisceau est due à la diffraction contrôlée par la largeur du composant, typiquement = 5 μm, d’où une ouverture angulaire de 10◦ environ, et dans la direction verticale par la diffraction contrôlée par la largeur du mode, typiquement d = 1 μm, d’où une ouverture de 60◦ environ. Crédit : Panorama de la Physique.
1. Un mécanisme d’inversion de population entre les électrons de la bande de conduction et les trous de la bande de valence obtenu en augmentant la tension appliquée, et donc le courant dans la jonction. En dessous d’un certain courant de seuil, la diode fonctionne en LED et comme une diode laser audessus de ce seuil. 2. Une cavité résonante susceptible de sélectionner un petit nombre de modes amplifiés. Cependant, avec une jonction p − n simple, le courant nécessaire est élevé et conduit à une émission de chaleur trop importante. Les hétérojonctions résolvent le problème en diminuant l’épaisseur de la zone active, ce qui augmente la densité de paires électron-trou. De plus, la couche centrale de fort indice optique constitue un guide plan très efficace pour la lumière et la piège dans la zone amplificatrice. L’effet laser peut être engendré en utilisant la réflectivité naturelle des facettes obtenues dans le clivage du cristal : comme le cristal est clivé deux fois le long d’un même
LE MONDE QUANTIQUE
127
Figure 6.9. Lecture de CD, de DVD et de DVD blu-ray avec une diode laser. Les longueurs d’onde utilisées sont données en nm et ON (Ouverture Numérique) caractérise l’optique de focalisation. La dimension des gravures et la distance entre les pistes diminue d’un facteur 3 entre un CD et un blu-ray, ce qui multiplie la densité d’information stockée par un facteur 9. Courtoisie de Jean-Paul Pocholle.
plan cristallographique, les miroirs sont exactement parallèles et, malgré une faible réflectivité, de l’ordre de 30 %, cela suffit pour fabriquer une cavité résonante car la faible réflectivité est compensée par la très forte densité d’émetteurs de photons. Comme la cavité est beaucoup plus courte que celle d’un laser conventionnel (chapitre 4), les différentes longueurs d’onde correspondant aux modes de la cavité sont plus éloignées les unes des autres et il est plus facile de sélectionner un mode unique. On peut aujourd’hui faire fonctionner des diodes laser avec des courants de seuil de quelques mA ; les dimensions typiques de ces diodes sont de 500 μm × 5 μm. Elles sont utilisées dans de multiples applications : lecture de codes-barres, de CD et de DVD, et bien sûr de façon intensive dans les télécomunications optiques où l’on utilise principalement la longueur d’onde infra-rouge de 1,55 μm qui correspond au minimum d’absorption des fibres optiques. La figure 6.9 illustre les progrès dans la miniaturisation : la lecture de CD se fait à l’aide de lasers fonctionnant dans le proche infrarouge (λ = 780 nm), et la distance entre deux pistes sur le CD est de 1,6 μm, tandis que la lecture des blu-ray se fait avec une longueur d’onde située dans le proche ultraviolet, λ = 405 nm, avec une distance entre les pistes de 0,5 μm. La densité d’information gravée sur le disque est inversement proportionnelle au carré de la longueur d’onde : on gagne un facteur (780/405)2 3,7 en passant du CD au blu-ray et un autre facteur de l’ordre de 3 grâce au gain sur l’ouverture numérique ON, rapport du diamètre de la lentille à sa distance focale. Le diamètre de la tache sur le disque est 1,2λ/ON.
128
Chapitre 6. Le règne des semi-conducteurs
5
Bibliographie
Grand public. G. Pietryk(dir), Panorama de la physique, Belin (2008), chapitres « Électrons et photons dans les solides » et « Nano et microtechnologies ». On pourra aussi consulter R. Feynman, Leçons sur l’informatique, Odile Jacob (2006), leçon 7, P. Keyes L’irremplaçable transistor, Pour la Science janvier 2010, page 66. ou l’encyclopédie Wikipedia, articles Semi-conducteurs et Transistor. Niveau avancé. J.-P. Pocholle, « De l’émission stimulée d’Einstein aux lasers d’aujourd’hui », dans Einstein aujourd’hui, p. 129, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS Éditions , Paris ; E. Rosencher et B. Vinter Optoélectronique, Dunod (2002).
LE MONDE QUANTIQUE
129
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
7 Physique quantique et relativités Jusqu’à présent nous n’avons pris en considération que des systèmes dits « non relativistes », ceux où la vitesse des particules (atomes, électrons. . .) autres que les photons est petite par rapport à la vitesse de la lumière c. Ce chapitre va marier la physique quantique, d’abord dans les sections 7.1 et 7.2 avec la relativité restreinte (Einstein, 1905), puis dans la section 7.3 avec la relativité générale (Einstein, 1915). Dans le premier cas, on obtient la théorie relativiste des champs quantiques, indispensable pour la physique des particules élémentaires. Ce sera l’occasion de donner un aperçu de l’état de l’art du modèle standard de cette physique. Le second cas est celui de la gravitation quantique et nous essaierons, à partir de l’exemple d’une mesure de longueur, de donner une idée des difficultés, pour le moment insurmontables, que rencontre cette théorie. 1 1.1
Théorie relativiste des champs quantiques L’énergie du vide
Dans les chapitres précédents, nous avons examiné la description quantique des atomes (chapitres 4 et 5) et des électrons (chapitre 6), mais nous sommes restés très discrets sur celle des photons. Pour passer de la description classique à la description quantique, nous devons suivre le chemin inverse de celui utilisé pour les atomes et les électrons. En physique classique, les particules sont des micro-boules de billard, et c’est seulement au début des années 1920 que l’on a commencé à comprendre qu’elles avaient aussi des propriétés ondulatoires. En ce qui concerne les photons, c’est le contraire : la description classique, qui remonte au début du XIXe siècle pour les ondes lumineuses, est ondulatoire, et c’est seulement en 1905 qu’Einstein
introduisit l’aspect particule. En physique classique, le champ électromagnétique est une fonction numérique dépendant de l’espace et du temps, plus précisément six fonctions numériques pour les trois composantes du champ électrique et du champ magnétique. Pour obtenir l’aspect particule, il faut « quantifier » le champ électromagnétique. Afin de comprendre le processus de quantification, il est commode de prendre comme exemple un champ électromagnétique confiné dans une cavité aux parois réfléchissantes et, pour simplifier, de se limiter à une cavité unidimensionnelle. Comme dans le cas de la corde vibrante de la section 4.1, seuls certains modes du champ sont autorisés, ceux dont la longueur d’onde λ vérifie L = qλ/2, où L est la longueur de la cavité et q un nombre entier positif ; comme dans la section 4.1, la longueur de la cavité doit être un multiple entier de la demi-longueur d’onde. Cette condition sur la longueur d’onde se traduit par une condition sur la fréquence, ν = qc/2L. On peut montrer qu’un mode spectral de la cavité se comporte comme un oscillateur harmonique et de l’étude de cet oscillateur en physique quantique, on déduit que les niveaux d’énergie sont de la forme En = (n + 1/2)hν, n = 0, 1, 2 . . . Ce résultat a déjà été mentionné dans la section 5.3, et l’état fondamental n = 0 est étudié à l’annexe A4.2 à partir de l’inégalité de Heisenberg. On comprend alors l’origine du concept de photon. L’énergie d’une onde électromagnétique dans le mode ν ne peut prendre que des valeurs discrètes, indicées par un entier n, ce qui s’interprète ainsi : chaque photon ayant une énergie hν, le nombre de photons dans le mode de fréquence ν et d’énergie En = (n + 1/2)hν est égal à n. L’état à zéro photon, n = 0, correspond à une énergie E = hν/2, l’état à un photon, n = 1, à une énergie E = 3hν/2, l’état à deux photons, n = 2, à une énergie E = 5hν/2 et ainsi de suite. L’énoncé de ces résultats aura sans doute plongé le lecteur dans une certaine perplexité : si le mode de fréquence ν contient zéro photon, comment se fait-il que son énergie soit hν/2, et non zéro ? Plus grave encore, le nombre de modes obéissant à L = qλ/2 dans la cavité est infini et la somme des hν/2 pour tous ces modes donne une énergie infinie. L’état à zéro photon, aussi appelé état du vide, possède une énergie infinie ! La perplexité (éventuelle) du lecteur est parfaitement justifiée, et on ne connaît pas aujourd’hui de réponse définitive à ce problème. La procédure généralement adoptée, dite de « renormalisation », consiste à redéfinir le zéro d’énergie et à retrancher hν/2 à l’énergie de chacun des modes du champ. Cette procédure qui revient à manipuler des quantités infinies peut sembler cavalière, mais il est possible de la rendre mathématiquement rigoureuse, du moins dans le cadre de la relativité restreinte. Le problème reste ouvert en relativité générale, où on ne peut pas jouer arbitrairement avec les énergies, et où une telle procédure de renormalisation est a priori éminemment discutable. L’énergie du vide produit des effets analogues à la constante cosmologique proposée par Einstein vers 1930 pour stabiliser l’Univers. En 1930, on pensait que l’Univers était statique, mais comme la gravitation entraînait la contraction de cet Univers, celui-ci ne pouvait pas demeurer
132
Chapitre 7. Physique quantique et relativités
statique. Pour éviter cette contraction indésirable, Einstein proposa une constante cosmologique, jouant comme une sorte d’antigravitation qui s’y opposait. Cependant, rien n’était vraiment résolu, car la solution statique était instable. La constante cosmologique fut enterrée quelques années plus tard, quand Hubble démontra que l’Univers n’était pas statique, mais en expansion, et Einstein qualifia sa proposition de « plus grosse bourde de sa vie ». La constante cosmologique a cependant fait un retour fracassant dans les années 1990, quand les astrophysiciens se sont convaincus de l’accélération de l’expansion de l’Univers, un effet surprenant et imprévu dans la mesure où la gravitation ne peut que ralentir l’expansion. Pour le comprendre, on peut utiliser l’analogie suivante : une fusée est lancée verticalement depuis la Terre avec une vitesse inférieure à la vitesse de libération de 11 km/s. Elle va s’élever (l’analogue d’une phase d’expansion de l’Univers), passer par une altitude maximale et ensuite retomber (l’analogue d’une phase de contraction) ; c’est un « big-bang » suivi d’un « big-crunch ». Si la fusée est lancée avec une vitesse plus grande que la vitesse de libération, elle partira à l’infini (l’analogue d’une phase d’expansion de durée infinie), mais son mouvement sera toujours freiné par la force de gravitation. Cependant la constante cosmologique pose un problème majeur : son estimation à partir de la théorie des champs quantiques est fausse par un facteur 10120 ( !) si on la compare à la valeur expérimentale, ce qui est le résultat le plus faux, et de loin, jamais obtenu par les physiciens. Aujourd’hui, le mystère de la constante cosmologique reste entier. Nous reviendrons à la relativité générale dans la dernière section et nous nous limitons pour l’instant à la relativité restreinte. On peut alors se convaincre de la réalité de l’énergie du vide grâce à l’effet Casimir, du nom du physicien néerlandais qui en a fait la théorie en 1945. Prenons deux plaques métalliques électriquement neutres placées à une distance L (figure 7.1). L’existence de ces plaques modifie la configuration des modes du champ électromagnétique par rapport au cas où elles sont absentes et cette modification entraîne une variation ΔE de l’énergie du vide, ce qui se traduit par une force attractive F par unité de surface entres les deux plaques ΔE = −
π2 hc 720 L 3
F=
π2 hc 240 L 4
·
(7.1)
L’énergie du vide en l’absence de plaques est infinie, il en est de même de celle en présence des plaques, mais la différence est finie et mesurable ! Plusieurs expériences précises ont été réalisées depuis une dizaine d’années, qui confirment la réalité de cet effet Casimir et la validité de (7.1).
LE MONDE QUANTIQUE
133
F
− F
L
Figure 7.1. L’effet Casimir. Les deux plaques métalliques, placées dans le vide à une température aussi basse que possible, s’attirent en raison des fluctuations du vide de photons.
Encadré 7.1. Force et énergie.
La force est égale à moins la dérivée de l’énergie par rapport à L F =−
dΔE dL
·
Le calcul de cette force passe par celui de l’énergie, qui doit être fait dans l’espace à trois dimensions, en étudiant les modifications des conditions aux limites introduites par les plaques pour le champ électromagnétique.
1.2
Particules virtuelles et diagrammes de Feynman
La théorie relativiste des champs quantiques ne se limite pas au champ électromagnétique, elle concerne en fait toutes les particules. Avant de développer ce sujet, il est utile de rappeler brièvement quelques notions de relativité restreinte. Tout le monde connaît la célèbre relation d’équivalence masse-énergie E = mc 2 . Cette relation permet de mesurer les masses en unités d’énergie/c 2 , par exemple en eV/c 2 , ou MeV/c 2 : ainsi la masse de l’électron est de 0,51 MeV/c 2 , celle du proton de 938 MeV/c 2 . La relation E = mc 2 implique aussi que des particules massives peuvent être créées pourvu que l’on dispose d’une réserve d’énergie suffisante. Par exemple, des photons γ de haute énergie passant au voisinage d’un noyau atomique peuvent créer des paires électron (e− )-positron (e+ ) suivant la réaction γ → e− + e+ . Le positron est l’antiparticule de l’électron : il possède la même masse mais une charge opposée. La théorie relativiste des champs quantiques prévoit qu’une antiparticule de même masse et de charge opposée est associée à toute particule : par exemple l’antiproton est l’antiparticule du proton, l’antineutron celle du neutron. L’antineutron est de charge nulle, comme le neutron, mais il s’en différencie par son
134
Chapitre 7. Physique quantique et relativités
moment magnétique, qui est de signe opposé. Certaines particules comme le photon sont leur propre antiparticule. Lorsqu’une particule possède une impulsion p, la forme relativiste de son énergie est donnée par (7.2) E = m2 c 4 + p2 c 2 . On retrouve E = mc 2 pour une particule d’impulsion nulle (p = 0), et E = cp pour une particule de masse nulle comme le photon (m = 0). Toute réaction entre particules doit conserver non seulement l’énergie totale, mais aussi l’impulsion totale. C’est pourquoi, même pour des photons de très haute énergie (dans notre référentiel !) la réaction γ → e− +e+ ne se produit pas dans le vide : on ne peut pas conserver à la fois l’énergie et l’impulsion. La relation (7.2) et la possibilité de créer des paires e+ −e− ont des conséquences importantes sur le comportement quantique d’un électron. Supposons en effet que nous essayions de confiner un électron dans un petit volume de dimensions linéaires L. L’inégalité de Heisenberg implique que son impulsion est de l’ordre de ħ h/L et, d’après (7.2), son énergie est de l’ordre de
h2 c 2 /L 2 + m2e c 4 , E∼ ħ où me est la masse de l’électron. Si l’on suppose L suffisamment petit, on peut négliger la masse de l’électron et écrire comme pour une particule de masse nulle h/me c, nous avons suffisamment d’énergie E∼ħ hc/L. Mais si ħ hc/L me c 2 ou L ħ + − pour créer des paires e − e , puisqu’il suffit de 2me c 2 pour créer une telle paire. Cela veut dire que l’électron ne peut plus être considéré comme particule isolée si l’on essaie de le confiner dans un domaine de dimensions L < h/me c : l’électron ∼ħ est entouré d’un « nuage » de paires électron-positron. La longueur L = ħ h/me c 3, 86 × 10−13 m est appelée longueur d’onde Compton de l’électron. À des distances inférieures à la longueur d’onde Compton, la théorie quantique non relativiste de l’électron devient fausse, car elle est incapable de décrire la création ou l’annihilation de particules. Une bonne façon de comprendre intuitivement certains résultats de la théorie relativiste des champs quantiques est de faire appel à l’inégalité de Heisenberg temporelle, ΔE Δt > h, où ΔE représente une fluctuation d’énergie et Δt un inter∼ ħ valle de temps. Malgré une ressemblance superficielle avec l’inégalité de Heisenberg Δx Δp > h, l’inégalité de Heisenberg temporelle possède une interprétation phy∼ ħ sique différente. En effet, Δx et Δp sont des fluctuations, ΔE est aussi une fluctuation, mais pas Δt, qui est un intervalle de temps : pour un système physique, x et p sont des variables dynamiques, E l’est également, mais pas le temps, qui est un paramètre extérieur au système physique considéré. Une conséquence de l’inégalité de Heisenberg temporelle est la suivante : pendant un intervalle de temps Δt,
LE MONDE QUANTIQUE
135
n p
π+
n p
Figure 7.2. Diagramme de Feynman. Le proton initial (en rouge) donne un neutron (en bleu) et un méson π+ (tirets verts). Le méson π+ est absorbé par le neutron (bleu) et donne un proton (rouge).
il est possible que l’énergie fluctue de ΔE, avec ΔE ∼ ħ h/Δt. Autrement dit, il est possible que l’énergie subisse des fluctuations importantes, pourvu que cela se passe pendant un temps assez court, et ce temps est trop court pour que la fluctuation soit observable. Les physiciens appellent de tels processus des processus virtuels, qui sont inobservables directement, mais dont les conséquences indirectes le sont. Les célèbres diagrammes de Feynman constituent une application importante des processus virtuels. Considérons l’interaction proton (p)-neutron (n) par échange de mésons π, qui peuvent être chargés (π± ) ou neutres (π0 ) (figure 7.2). La réaction p → n + π+ est interdite par conservation de l’énergie-impulsion. Cependant, on peut profiter d’une fluctuation d’énergie ΔE ∼ ħ h/Δt pendant un intervalle de temps très court pour créer un méson π+ qui est absorbé dans ce même intervalle de temps par le neutron suivant π+ + n → p, et globalement la conservation de l’énergie-impulsion est respectée. Pour créer le méson π+ , il faut une fluctuation d’énergie ΔE ∼ mπ c 2 , et donc Δt ∼ ħ h/mπ c 2 . Comme la propagation se fait au maximum à la vitesse de la h/mπ c, la longueur lumière, la distance maximale parcourue par le méson π+ vaut ħ d’onde Compton du méson π+ , et l’interaction proton-neutron doit s’annuler au-delà de cette distance. L’étude des forces nucléaires ayant montré que cette interaction était limitée à 1 fm (10−15 m), le physicien japonais Yukawa en déduisit en 1935 la masse du méson π, environ 200 MeV/c 2 . Ce méson fut effectivement découvert en 1947 avec une masse de 140 MeV/c 2 , en accord satisfaisant avec la prédiction théorique, compte tenu du caractère approché de l’estimation. On mesure sur cet exemple la réalité des conséquences des processus virtuels !
136
Chapitre 7. Physique quantique et relativités
1.3
Qu’est-ce qu’une particule élémentaire ?
On apprend au lycée que la matière est composée de molécules, les molécules d’atomes, les atomes d’électrons et de noyaux, les noyaux de protons et de neutrons. Cette décomposition de la matière en entités de plus en plus élémentaires a-t-elle une fin, ou continue-t-elle à se répéter à des échelles de plus en plus petites ? La première question à se poser est la suivante : comment se convainc-t-on qu’une particule est composée d’entités plus élémentaires ? Une technique éprouvée – bien que déconseillée – pour décomposer en entités plus élémentaires la montre de votre grand-père que vous venez de trouver dans un tiroir abandonné consiste à lui donner un grand coup de marteau : vous verrez apparaître les rouages et les ressorts composant la montre. Les physiciens ne procèdent pas autrement : ils cassent les particules (la montre) en les bombardant avec d’autres particules énergiques (le marteau) sortant d’un accélérateur de particules. Essayons de casser le noyau atomique le plus simple, le deutéron (D), formé d’un proton et d’un neutron. L’atome correspondant, le deutérium, est un isotope de l’hydrogène ; c’est l’isotope qui entre dans la composition de l’eau lourde D2 O. Bombardons le deutéron avec des électrons (e). Si les électrons ont une faible énergie, inférieure à 2 MeV, les collisions sont élastiques, comme les collisions de deux boules de billard : e + D → e + D, et le deutéron reste intact. Le coup de marteau n’est pas suffisamment énergique. Pour des énergies supérieures à environ 2 MeV, il arrive que le deutéron se brise en un proton (p) et en un neutron (n) : e + D → e + p + n. Nous avons gagné : le deutéron est composé d’un proton et d’un neutron ! Persévérons dans cette démarche en essayant maintenant de casser le proton. Pour des énergies inférieures à 150 MeV, rien ne se passe, les collisions sont élastiques : e + p → e + p, mais si l’on monte en énergie, on observe la création de nouvelles particules, des mésons π chargés (π+ ) ou neutres (π0 ) e + p → e + p + π0 , e + p → e + n + π+ . Si l’on monte encore en énergie, on va créer de plus en plus de mésons, et même de nouvelles particules, comme des mésons K et des hypérons. Dans les réactions ci-dessus, les mésons π n’existaient pas dans le proton, ils ont été créés au moment de la collision : le proton n’est pas composé d’un proton et d’un méson π0 , ou d’un neutron et d’un méson π+ . Un autre exemple instructif est celui de la radioactivité β du neutron. En règle générale, une particule A peut se désintégrer en particules B, C . . . si sa masse est plus grande que la somme des masses des particules finales. Par exemple, A → B + C est possible si les masses vérifient mA ≥ mB + mC . La désintégration est alors compatible avec les règles de la conservation de l’énergie et de l’impulsion relativistes. La masse mn du neutron est plus grande que la somme des
LE MONDE QUANTIQUE
137
masses du proton, m p , de l’électron, me et de l’antineutrino, mν : mn > m p + me + mν mn = 939,5 Mev/c 2
m p = 938,3 Mev/c 2
me = 0,5 Mev/c 2
mν 0
et la désintégration n→ p+e+ν est possible : c’est le cas le plus simple de radioactivité β, et la vie moyenne du neutron est de 15 minutes. Cependant, on ne peut pas en conclure que l’électron préexistait dans le neutron. En effet, un électron confiné dans un neutron, dont les dimensions sont de l’ordre de 0,5 fm, aurait d’après l’inégalité de Heisenberg une énergie énorme d’environ 400 MeV : le neutron n’est pas composé d’un proton, d’un électron et d’un antineutrino. Pourquoi le neutron ne se désintègre-t-il pas dans le deutéron ? C’est une question de masses : en effet, m D < 2m p + me + mν , ce qui rend la désintégration D → 2p + e + ν impossible. Cet argument se généralise au cas des noyaux atomiques : le neutron est stable à l’intérieur des noyaux non radioactifs. Le paysage qui émerge de la théorie quantique relativiste est celui où les particules peuvent être créées et détruites à volonté, pourvu que l’on dispose d’une réserve d’énergie suffisante. Une des conséquences les plus importantes de la théorie quantique relativiste est l’indiscernabilité des particules identiques. Des particules comme le photon ou l’électron sont des excitations d’un champ quantifié, le champ électromagnétique dans le premier cas, le champ électron-positron dans le second. Il en résulte que toutes les particules d’un même type ont une origine unique, les excitations du champ quantique correspondant, et elles sont donc strictement identiques (voir cependant l’encadré 7.2). De plus, la théorie quantique relativiste montre que la statistique d’une particule est liée à son comportement dans une rotation de 360o , c’est-à-dire la rotation identité : l’état quantique d’un boson est multiplié par +1, celui d’un fermion par −1. C’est le théorème spin-statistique, facile à énoncer, mais dont la démonstration est tout sauf élémentaire. Le vide est un milieu où règne une activité intense de création et de destruction de particules virtuelles. Pendant des intervalles de temps suffisamment courts, des fluctuations d’énergie créent des paires de particules virtuelles, par exemple des paires e+ − e− . Même si ces particules sont inobservables directement, elles ont des effets indirects mesurables. Par exemple, la création dans le vide de paires virtuelles e+ − e− déplace un niveau excité de l’atome d’hydrogène de −1, 12 × 10−4 eV, un déplacement qui a été observé expérimentalement avec une très grande précision. La première théorie des champs quantiques a été élaborée juste après la guerre, c’est la théorie relativiste de l’interaction entre photons et électrons, ou électrodynamique quantique (QED, pour Quantum ElectroDynamics). Cette théorie est vérifiée expérimentalement avec une précision extraordinaire. Outre le déplacement des niveaux d’énergie de l’atome d’hydrogène mentionné ci-dessus, cette théorie permet de calculer une quantité appelée moment magnétique anormal de l’électron, notée a, avec
138
Chapitre 7. Physique quantique et relativités
a = 1 en théorie quantique non relativiste. Les valeurs théoriques et expérimentales sont comparées ci-dessous. • aexp = 1,001 159 652 180 8 ± 8 • ath = 1,001 159 652 175 ± 9
Expérience Théorie
Les chiffres rouges sont ceux qui donnent l’incertitude sur le résultat. L’incertitude théorique est due principalement à notre connaissance imparfaite de la valeur de la charge de l’électron qe . En fait, cette détermination très précise du moment magnétique anormal peut être utilisée pour obtenir la valeur aujourd’hui la plus précise de la charge de l’électron ; plus précisément, la combinaison des constantes qui intervient dans le calcul théorique est la constante de structure fine, α = q2e /(4π 0hc) 1/137 (encadré 4.3).
2
Le modèle standard de la physique des particules
Depuis une trentaine d’années, les physiciens disposent d’une théorie des particules élémentaires appelée modèle standard. Ce modèle est le résultat de contributions de plusieurs physiciens, étalées de 1960 à 1973. Depuis 1973, le modèle a été confirmé expérimentalement avec une précision de l’ordre de 0,1 %, principalement auprès du collisionneur électron-positron du CERN à Genève, le LEP (Large Electron Positron), qui a fonctionné de 1990 à 2000 (figure 7.3). Le modèle standard répond à la question : « qu’est-ce qu’une particule élémentaire ? » de la façon suivante. Une particule élémentaire est une particule qui peut être considérée comme ponctuelle dans ses interactions avec d’autres particules. Autrement dit, la théorie repose sur le fait que les interactions ont lieu en un seul point d’espace-temps, et on ne peut attribuer aucune structure à une particule élémentaire. Avec cette définition, les électrons et les photons sont élémentaires. Mais les protons et les neutrons ne le sont pas car ils sont formés d’entités qui, elles, sont ponctuelles, les quarks. Pour former protons et neutrons, il faut deux types de quark, le quark up (u) de charge 2/3 en unités de la charge du proton, et le quark down (d) de charge −1/3. Un proton est formé de deux quarks up et d’un quark down (2/3+2/3−1/3 = 1) et le neutron d’un quark up et de deux quarks down (2/3−1/3−1/3 = 0). Naturellement il existe aussi deux antiquarks correspondants, l’antiquark u, de charge −2/3 et l’antiquark down, d, de charge 1/3. Un méson π+ correspond à la combinaison ud et un méson π0 à un mélange de uu et d d. Cependant, les quarks n’existent pas à l’état libre, ce qui fait que l’on ne peut pas casser un proton en trois quarks. La théorie de l’interaction entre quarks, ou chromodynamique quantique (QCD, Quantum ChromoDynamics), prévoit que les quarks sont toujours « confinés » et ne peuvent jamais apparaître à l’état libre. La conviction des physiciens de « l’existence » des quarks vient de ce que
LE MONDE QUANTIQUE
139
Figure 7.3. Vue aérienne du site du CERN. Le cercle rouge marque le tracé du tunnel de 27 km de circonférence où ont été construits, à quelques dizaines de mètres sous terre, le LEP, puis le LHC. Reproduit avec l’autorisation du CERN.
la théorie explique parfaitement un grand nombre de propriétés, n’a jamais été mise en défaut jusqu’à aujourd’hui, et qu’il n’existe aucune théorie concurrente plausible.
Encadré 7.2. Relation champs-particules.
La chromodynamique quantique montre que la relation entre les champs quantiques (dans ce cas les champs quarks-antiquarks) et les particules observées (les protons et les neutrons), que l’on appelle des états asymptotiques, est en fait très complexe : la correspondance champparticule ne doit pas être vue de façon trop simpliste.
140
Chapitre 7. Physique quantique et relativités
Pour continuer dans la description du modèle standard, il faut rappeler qu’il existe quatre types d’interactions, ou de forces, fondamentales. 1. L’interaction électromagnétique, responsable des propriétés de la physique atomique, moléculaire et du solide. 2. L’interaction forte, qui assure la cohésion des noyaux atomiques, et est donc essentielle en physique nucléaire. 3. L’interaction faible, responsable de la radioactivité β, dont nous avons vu un exemple dans la désintégration du neutron. 4. L’interaction gravitationnelle, dont une conséquence, la pesanteur à la surface de la Terre, est familière dans la vie de tous les jours. Les interactions gravitationnelles n’interviennent pas dans le modèle standard, en raison de leur faiblesse intrinsèque : comme la forme de la loi de force est la même, en 1/r 2 , on peut faire le rapport de la force de gravitation Fgrav et de la force électrostatique Fel entre un proton et un électron dans l’atome d’hydrogène. On trouve Fgrav /Fel ∼ 10−39 ! Les interactions gravitationnelles sont donc complètement négligeables en physique des particules élémentaires, mais j’y reviendrai dans la section 7.3. D’autre part le modèle standard unifie les interactions électromagnétiques et faibles en interactions électro-faibles. Cette classification des interactions permet de ranger les particules du modèle standard en trois catégories. Les leptons, électrons et neutrinos, ne sont sensibles qu’aux interactions électro-faibles, tandis que les quarks sont sensibles aux interactions électro-faibles et aux interactions fortes. Les leptons et les quarks sont des fermions. Au contraire, les particules qui servent de médiateurs aux interactions, les photons, les bosons W ± et Z 0 pour les interactions électro-faibles, ainsi que les gluons pour les interactions fortes, sont des bosons. Les gluons, tout comme les quarks, sont confinés et n’existent pas à l’état libre. Le contenu de la première famille du modèle standard est résumé ci-dessous. 1. Leptons : électron (e− ) et neutrino électronique (νe ). 2. Quarks : quark up (u) et down (d), 6 quarks en tout, car les quarks possèdent une caractéristique quantique, la couleur, qui est l’analogue de la charge pour les interactions fortes et chaque quark peut prendre une couleur parmi trois couleurs différentes. Cela explique le nom de la théorie quantique des quarks et des gluons : la chromodynamique quantique, ou QCD. La terminologie est bien sûr totalement conventionnelle, et la « couleur » des quarks n’a rien à voir avec une couleur ordinaire ! 3. Le photon (γ) et les bosons W ± et Z 0 médiateurs des interactions électrofaibles, et les 8 gluons, médiateurs des interactions entre quarks. Il faut bien sûr ajouter les antiparticules : le positron (e+ ), l’antineutrino électronique (ν e ), les anti-quarks up (u) et down (d). Cette première famille est celle qui est
LE MONDE QUANTIQUE
141
Figure 7.4. Les particules du modèle standard. Courtoisie de Jean Iliopoulos.
nécessaire à la vie quotidienne. Nous sommes formés d’électrons et de quarks up et down liés dans des noyaux atomiques grâce aux gluons, nous voyons le monde et nous recevons l’énergie du Soleil grâce aux photons, tandis que les neutrinos et les bosons W ± et Z 0 sont à la base des interactions faibles qui sont essentielles pour les réactions nucléaires à l’origine de l’énergie solaire. Il est très surprenant que la liste des particules élémentaires ne se soit pas arrêtée là. Pour des raisons que personne ne comprend, la nature a trouvé bon d’ajouter deux autres familles de particules, qui sont des répliques de la première famille en ce qui concerne les fermions, leptons et quarks, tandis que les bosons sont communs aux trois familles. La seconde famille est composée comme suit. 1. Leptons : muon (μ− ) et neutrino muonique (νμ ). 2. Quarks : quark étrange (s pour « strange », charge −1/3) et charmé (c, charge 2/3). et leurs antiparticules : μ+ , ν μ , s et c. La troisième famille est composée des quarks et leptons suivants. 1. Leptons : tau (τ− ) et neutrino tauonique (ντ ). 2. Quarks : quark bottom (b, charge −1/3) et top (t, charge 2/3) et leurs antiparticules : τ+ , ν τ , b et t. Cette zoologie est résumée dans la figure 7.4. Reste la dernière particule, la plus mystérieuse, le boson de Higgs. Les symétries du modèle standard prévoient qu’initialement toutes les particules sont de masse
142
Chapitre 7. Physique quantique et relativités
nulle, ce qui est bien sûr en contradiction avec l’expérience. Cependant, on comprend immédiatement qu’expliquer les masses pose problème, car ces masses s’étalent sur un très grand intervalle, de 0,5 MeV/c 2 pour la particule la plus légère, l’électron, à 175 GeV/c 2 pour la particule la plus lourde, le quark top. Et cet intervalle s’élargit encore si l’on prend en compte les neutrinos, dont les masses sont de l’ordre de 0,01 eV/c 2 . Pourtant le modèle standard propose un mécanisme unique pour ces masses, sauf dans le cas des neutrinos où il pourrait exister des mécanismes plus complexes. Le mécanisme inventé pour donner une masse aux particules est la partie la plus discutable du modèle standard. On doit ajouter quatre champs quantiques, appelés champs de Higgs qui modifient le vide : c’est en se propageant dans ce vide modifié, ou « vide de Higgs », que les particules, sauf le photon, acquièrent une masse. Trois champs de Higgs sur les quatre étant absorbés par les bosons de jauge devenus massifs W ± et Z 0 , il en reste un seul qui apparaît sous forme de particule, un boson neutre : c’est le boson de Higgs. Ce boson de Higgs a été activement recherché au LEP, mais sans succès. Les recherches continuent actuellement au Tevatron, anneau de collision de 2 TeV (2 000 GeV) en fonction près de Chicago, et la découverte du boson de Higgs est bien sûr l’objectif majeur du CERN. Les processus virtuels donnent quelques indications sur la masse du boson de Higss, qui est actuellement un paramètre arbitraire de la théorie. En effet, même si le boson de Higgs n’a pas été mis en évidence comme particule réelle, son effet se fait sentir indirectement dans un certain nombre de processus. La stratégie a déjà été mise en œuvre avec succès dans le cas du quark top. Le quark top, dont la masse de 175 GeV/c 2 vaut près de 200 fois la masse du proton, est difficile à produire précisément en raison de cette masse élevée : il faut un accélérateur très puissant. Cependant, l’existence du quark top influence certains processus, dans lesquels celuici intervient comme particule virtuelle. Ainsi le LEP a pu prédire dès 1990 une masse comprise entre 160 et 200 GeV/c 2 , avant que cette masse ne soit définitivement mesurée lorsque le Tevatron a produit le quark top comme particule réelle en 1995. Compte tenu des résultats du LEP, on sait que la masse du boson de Higgs (s’il existe) doit être comprise entre environ 115 et 160 GeV/c 2 . Il devrait être découvert au LHC (Large Hadron Collider), collisionneur de 14 TeV qui a pris la succession du LEP au CERN fin 2009 (figure 7.5) avec dans un premier temps une énergie réduite à 7 TeV, à moins que le Tevatron ne lui brûle la politesse. Cela dit, la découverte éventuelle du boson de Higgs ne mettrait pas un point final à la théorie des particules élémentaires. En effet, la plupart des physiciens des particules estiment que le modèle standard, en dépit de ses succès dans la comparaison avec l’expérience, ne peut pas être considéré comme satisfaisant. Il dépend d’une vingtaine de paramèteres arbitraires, dont on aimerait comprendre l’origine. Le modèle standard pourrait être inclus dans une théorie plus globale, par exemple la supersymétrie, qui est une voie possible pour prolonger le modèle standard, ou plus fondamentalement la théorie
LE MONDE QUANTIQUE
143
Figure 7.5. Le LHC avec ses détecteurs.
des supercordes. Cependant les supercordes, quoique toujours très populaires, rencontrent de sérieuses difficultés dont on ne voit pas aujourd’hui la solution. 3 3.1
La gravitation quantique Le principe d’équivalence
En 1915, la relativité générale fut l’aboutissement de dix années d’efforts intenses fournis par Einstein, travaillant pratiquement seul. C’est une théorie classique, en fait une théorie d’un champ classique, le champ de gravitation. La relativité générale est une théorie complexe qui sort du cadre de cet ouvrage. Il nous suffira d’énoncer un principe qui est à la base de cette théorie, le principe d’équivalence. Ce principe affirme que, dans une région d’espace-temps suffisamment limitée, il est impossible de distinguer entre une force d’inertie due à une accélération ou à un freinage et une force de gravitation. Un exemple de force d’inertie est la force qui vous projette en avant quand la voiture où vous êtes assis freine brusquement. Un autre exemple est la force centrifuge. Illustrons le principe d’équivalence avec l’exemple suivant. Un astronaute se trouve dans une fusée située dans l’espace intergalactique, loin de
144
Chapitre 7. Physique quantique et relativités
D
D
g H
H F = − mg
(a)
F = − mg
(b)
S
S
(c)
(d)
Figure 7.6. (a) Une fusée est accélérée vers le haut avec une accélération g : l’astronaute est soumis à une force F = −mg dirigée vers le bas. (b) La fusée est posée sur la Terre : l’astronaute est aussi soumis à une force F = −mg dirigée vers le bas. (c) Émission et réception de photons dans la fusée accélérée. La fréquence ν reçue par D est inférieure à la fréquence d’émission ν . (d) Émission et réception de photons dans une fusée posée sur la Terre. À nouveau, la fréquence ν reçue par D est inférieure à la fréquence d’émission ν .
toute influence extérieure. Au temps t = 0, les moteurs de la fusée sont allumés et la fusée est accélérée, avec une accélération égale à l’accélération de la pesanteur g (g = 9,81 m/s2 , figure 7.6a). L’astronaute est propulsé vers le bas de la fusée car, par rapport à la fusée (les physiciens disent : par rapport à un référentiel lié à la fusée), il est soumis à une force d’inertie F = −mg, où m est sa masse et le signe moins indique une orientation vers l’arrière de la fusée. Plaçons maintenant ce même astronaute dans une fusée immobile posée verticalement à la surface de la Terre (figure 7.6b), et supposons que le plancher se dérobe sous ses pieds. L’astronaute va tomber vers l’arrière de la fusée, car il est soumis à la force de pesanteur (ou de gravitation) F = −mg. L’astronaute éprouve exactement la même sensation dans les deux cas : c’est le principe d’équivalence. Toujours à l’intérieur de cette même fusée, imaginons une source S de photons uniques située à l’altitude z = 0 et émettant vers le haut des photons de fréquence ν (figure 7.6, c et d). Ces photons sont détectés par un détecteur D situés à l’altitude z = H, capable de mesurer leur fréquence. Un photon met un temps t = H/c pour atteindre le détecteur. Dans le cas de la fusée accélérée, la vitesse de la fusée, que l’on peut prendre initialement nulle, est au temps t de v = g t = gH/c. Le photon voit alors un détecteur qui s’éloigne avec cette vitesse v , et la fréquence ν mesurée par le détecteur sera donc en raison de l’effet Doppler (section 5.2) gH v = ν 1− 2 . (7.3) ν = ν 1− c c LE MONDE QUANTIQUE
145
T0 = H/c
T0 + T
T0 + 2T
T0 + 3T
H
0
T
2T
3T
Figure 7.7. L’horloge à l’altitude z = 0 (rouge) émet des signaux aux temps 0, T , 2T . . . L’horloge à l’altitude z = H (bleu) les reçoit aux temps T0 = H/c , T0 + T , T0 + 2T . . ., avec T = T (1 + g H/c 2 ). Pour un observateur à l’altitude z = H , l’horloge à z = 0 retarde.
Nous avons supposé t suffisamment petit pour pouvoir négliger les effets de la relativité restreinte, comme la contraction des longueurs. La condition nécessaire est que la vitesse acquise par la fusée pendant le temps t soit très petite par rapport à la vitesse de la lumière : g t = gH/c c, soit gH/c 2 1. Les corrections de relativité restreinte dans (7.3) sont alors négligeables. Le principe d’équivalence nous dit que le même effet doit être observé dans la fusée immobile sur la Terre : la fréquence du photon détecté est plus faible que celle du photon émis. Cela veut dire (figure 7.7) que les horloges situées à basse altitude retardent par rapport à celles situées à une altitude plus élevée. Cet effet a été vérifié expérimentalement pour la première fois en 1960 par Pound et Rebka sur une hauteur de 20 m. Il est aujourd’hui essentiel de le prendre en compte pour le bon fonctionnement du GPS : la synchronisation des signaux émis depuis la Terre avec ceux émis par les satellites exige que soit pris en compte le retard des horloges terrestres dû à la gravitation par rapport aux horloges situées dans les satellites. En plus des effets gravitationnels, il faut aussi tenir compte des effets de relativité restreinte (dilatation du temps) dus à la vitesse des satellites par rapport à la Terre qui sont un peu plus faibles, mais du même ordre de grandeur, environ 10−10 en valeur relative. Si l’on ne tenait pas compte de l’ensemble de ces corrections, la dérive de la synchronisation serait de 40 μs par jour, ce qui peut sembler faible, mais en 40 μs la lumière parcourt 12 km ! Une autre conséquence du principe d’équivalence est qu’un rayon lumineux qui se propage horizontalement en l’absence de gravitation est dévié vers le bas dans le champ de pesanteur terrestre : la lumière « tombe » ! Pour le voir, il suffit d’examiner la propagation de ce rayon dans la fusée accélérée.
146
Chapitre 7. Physique quantique et relativités
L A
B
Figure 7.8. Mesure de la longueur L de la règle AB . Un photon représenté par un train d’ondes (vert) est envoyé depuis A. Il est réfléchi par un miroir en B et on mesure le temps d’aller-retour T . La longueur est L = c T /2.
3.2
L’échelle de Planck
Une autre façon de montrer le ralentissement gravitationnel des horloges est d’utiliser un raisonnement fondé sur des considérations énergétiques. Le photon possède au départ de S une énergie hν. Si l’on s’inspire de E = mc 2 , on peut lui attribuer une « masse » mphot = hν/c 2 . En arrivant à l’altitude H, le photon a perdu une énergie gravitationnelle mphot gH = hν gH/c 2 , et son énergie à l’altitude H du détecteur est hν(1 − gH/c 2 ) = hν , ce qui donne pour ν un résultat en accord avec celui déduit de l’effet Doppler (7.3). La quantité P = gH est le potentiel gravitationnel, et on peut résumer les résultats de la façon suivante : si le potentiel gravitationnel de deux horloges diffère de P, alors celle qui est localisée dans le potentiel gravitationnel inférieur retarde par un facteur (1 + P/c 2 ). Nous allons utiliser ce résultat pour fixer une limite ultime à la précision des mesures de longueur. Supposons que nous voulions déterminer la longueur L d’une règle en mesurant le temps d’aller-retour d’un photon : le photon est envoyé au temps t = 0 de l’extrémité A de la règle, il est réfléchi à l’autre extrémité B par un miroir et détecté au temps t = T en A après un aller-retour. On a bien entendu L = cT /2. Outre les erreurs expérimentales que nous négligerons, il existe deux sources fondamentales d’incertitude sur le résultat de la mesure (figure 7.8). 1. Si λ est la longueur d’onde du photon, le train d’ondes correspondant possède une longueur qui ne peut pas être plus petite que λ (figure 7.8), et la précision sur la mesure est au mieux λ. 2. Le potentiel gravitationel P créé par le photon le long de la règle est ∼ mphot G/L, où G est la constante de gravitation P∼
hν G c2
L
=
Għ h Lcλ
.
Ce potentiel est une deuxième source d’incertitude, car il affecte la marche des horloges qui servent à mesurer T .
LE MONDE QUANTIQUE
147
En résumé, l’incertitude fondamentale ΔL sur la mesure de L, qui ne peut être diminuée quelle que soit la précision des appareils utilisés, est ΔL ∼ λ +
PL c2
=λ+
Għ h λc 3
=λ+
LP2 λ
,
(7.4)
h/c 3 est la longueur de Planck. Pour trouver le minimum de l’incertitude, où LP = Għ il faut examiner la courbe λ + LP2 /λ en fonction de λ. On voit que cette courbe tend vers l’infini pour λ → 0 et aussi pour λ → ∞. Il existe un minimum à λ LP , et l’incertitude minimale est donc ΔL ∼ LP . On ne peut pas mesurer une longueur avec une précision meilleure que LP = 1,6 × 10−35 m. Autrement dit, les distances plus petites que LP n’ont pas de sens si l’on combine physique quantique et relativité générale. Les partisans de la gravité quantique à boucles en déduisent que l’espace possède une structure granulaire pour des distances plus petites que la longueur de Planck. Encadré 7.3. Constante de gravitation et potentiel gravitationnel.
La constante de gravitation G est définie par la force attractive F entre deux masses ponctuelles m et m distantes de r : F = Gmm /r 2 . L’énergie potentielle gravitationnelle de la masse m est U = −Gmm /r = Pm, où P est le potentiel gravitationnel créé par la masse m , P = −Gm /r. Comme L est la longueur de la règle, le potentiel gravitationnel créé par le photon est P ∼ Gmphot /L.
ħ hc/G est la masse d’une particule dont la longueur d’onde de Compton est LP , et l’énergie de Planck correspondante EP = MP c 2 = ħ hc 5 /G. Elle 19 15 vaut environ 1, 2 × 10 GeV, une énergie plus grande d’un facteur 10 que l’énergie du LHC ! À des distances de l’ordre de LP , ou à des énergies de l’ordre de EP , on ne peut plus négliger les effets quantiques en relativité générale. Cependant, l’application des techniques de la théorie des champs quantiques donne des résultats infinis que l’on ne sait pas interpréter. Deux voies principales sont aujourd’hui explorées : la théorie des supercordes et la gravité quantique à boucles. Dans les deux cas, on doit apporter des modifications majeures à nos conceptions antérieures et ces modifications ne sont toujours pas maîtrisées. Pour les supercordes, il existe une dimension minimale des particules qui sont des « cordes » de dimension ∼ LP et pour la gravité quantique à boucles c’est l’espace-temps qui acquiert une structure granulaire. Mais, malgré des progrès dans les deux approches, nous sommes encore loin d’une théorie quantique de la gravitation, à supposer qu’une telle théorie existe ! La masse de Planck MP =
148
Chapitre 7. Physique quantique et relativités
4
Bibliographie
Grand public. Effet Casimir : A. Lambrecht, « La force qui vient du vide », dossiers La Recherche, n◦ 29, p. 66 (2007). Physique des particules : M. Jacob, « Le modèle standard de la physique des particules », Pour la Science, octobre 2002, p. 58 ; J. Iliopoulos, « Au-delà du modèle standard », Pour la Science, novembre 2007, p. 90 ; P. Janot, « Des géants pour traquer l’infiniment petit », Pour la Science, novembre 2007, p. 98. Un panorama complet est donné par le bestseller de B. Greene, L’univers élégant, Robert Laffont (1999). Un livre plus récent est celui de G. Musser, The complete idiot’s guide to string theory, Penguin (2008). Le livre de L. Smolin, Rien ne va plus en physique ! L’échec de la théorie des cordes, Dunod (2007), est une critique virulente de la théorie des supercordes. Voir également les articles : R. Bousso et J. Polchinski, « Le paysage de la théorie des cordes », Pour la Science décembre 2004, p. 132 ; J.-Ph. Uzan, « Que cache la constante cosmologique ? » Pour la Science, décembre 2004, p. 96 ; L. Smolin, « Des atomes d’espace et de temps », Pour la Science, février 2004, p. 46. Niveau avancé. D. Perkins, An Introduction to High Energy Physics, 4e édition, Cambridge University Press, Cambridge (2000).
LE MONDE QUANTIQUE
149
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
8 Vers l’ordinateur quantique ? Dans notre vie quotidienne, pratiquement toute l’information traitée, échangée ou stockée est codée sous forme d’entités discrètes appelées bits, qui prennent par convention les valeurs zéro et un. Avec la technologie actuelle des ordinateurs et des fibres optiques, les bits sont transportés par des courants électriques et des ondes électromagnétiques correspondant à des flux macroscopiques d’électrons et de photons, et ils sont stockés dans des mémoires de types variés, par exemple magnétiques. Bien que la physique de base qui sous-tend le fonctionnement d’un transistor (chapitre 6) ou d’un laser (chapitre 4) soit la physique quantique, chaque bit échangé ou stocké correspond à un grand nombre de systèmes quantiques élémentaires et son comportement peut être décrit classiquement, par exemple en raison du fort couplage avec l’environnement (chapitre 9). Depuis une trentaine d’années, les physiciens ont appris à manipuler avec une précision croissante des systèmes quantiques individuels : photons, électrons, neutrons, atomes. . ., ce qui ouvre la voie à l’utilisation de systèmes quantiques à deux états tels que deux états de polarisation d’un photon (chapitre 2) ou deux niveaux d’énergie d’un atome (chapitre 4) pour échanger, stocker ou traiter l’information. Au chapitre 2, § 2.3.2, nous avons utilisé deux états de polarisation, vertical (V ) et horizontal (H) pour représenter les valeurs 0 et 1 d’un bit. Il sera commode par la suite de se servir de la notation de Dirac (voir l’annexe A2.2 pour un exposé détaillé), où un état de polarisation verticale est noté |0〉, un état de polarisation horizontale |1〉 et un état de polarisation arbitraire |ψ〉. Les états de polarisation d’un photon sont une réalisation possible d’un bit quantique, ou en abrégé qubit. Grâce aux propriétés de la physique quantique, les ordinateurs quantiques, s’il voyaient le jour, surpasseraient les ordinateurs classiques pour la résolution de certains problèmes certes spécifiques, mais très importants.
Les sections 8.1 à 8.2.2 décrivent les algorithmes quantiques en entrant dans quelques détails techniques. Leur lecture n’est pas indispensable pour suivre les considérations plus générales des sections 8.2.3 à 8.4. 1 1.1
Bits et portes logiques quantiques Bits classiques et qubits
Avant de passer aux qubits, rappelons brièvement comment les bits sont utilisés pour écrire des nombres entiers. Comme exemple simple, prenons les nombres compris entre 0 et 7, que nous allons noter par une lettre x en gras. Trois bits suffisent pour écrire les nombres de 0 à 7, si l’on utilise la notation binaire 0 = {000} 1 = {001} 2 = {010} 3 = {011} 4 = {100} 5 = {101} 6 = {110} 7 = {111}. On observera la différence de notation pour un nombre entier x, et la valeur x d’un bit, x = 0 ou x = 1. La valeur numérique de x = {x 2 x 1 x 0 } est x = 4x 2 + 2x 1 + x 0 = 22 x 2 + 2x 1 + x 0 . Par exemple, le nombre 6 est donné par 6 = 4 + 2 + 0 soit x 2 = 1, x 1 = 1, x 0 = 0. De façon générale, un nombre x compris entre 0 et 2n−1 s’écrit en notation binaire x = 2n−1 x n−1 + 2n−2 x n−2 + . . . + 2x 1 + x 0 = {x n−1 x n−2 . . . x 1 x 0 },
(8.1)
avec x i = 0 ou x i = 1. Le passage aux qubits est facile. Supposons que nous disposions de trois photons pour écrire comme ci-dessus un nombre compris entre 0 et 7. Pour écrire 6 par exemple, nous prenons le premier photon dans l’état de polarisation verticale |0〉, le second dans l’état de polarisation horizontale |1〉 et le troisième également dans l’état de polarisation horizontale |1〉. Nous allons écrire cet état comme |1〉|1〉|0〉 (on notera que le premier qubit est situé à droite), et les 8 nombres de 0 à 7 seront représentés par les états suivants de polarisation de trois photons 0 : |0〉|0〉|0〉 1 : |0〉|0〉|1〉 2 : |0〉|1〉|0〉 3 : |0〉|1〉|1〉 4 : |1〉|0〉|0〉 5 : |1〉|0〉|1〉 6 : |1〉|1〉|0〉 7 : |1〉|1〉|1〉 . La correspondance avec l’écriture des bits classiques est manifeste. Un état tel que |1〉|1〉|0〉 est appelé produit tensoriel des trois états |1〉, |1〉 et |0〉 (annexe A3.2).
152
Chapitre 8. Vers l’ordinateur quantique ?
Passons au cas général, en supposant que nous voulions stocker dans un registre quantique le nombre entier x (8.1). Pour ce faire, il nous faudra n qubits et le nombre x sera représenté par l’état quantique |x〉 |x〉 = |x n−1〉|x n−2 〉 . . . |x 1 〉|x 0 〉.
(8.2)
Pour l’instant, nous n’avons pas vu de grande différence entre l’écriture des nombres avec des bits classiques et celle avec des qubits. Les propriétés de polarisation d’un photon permettront de mettre cette différence en évidence. Revenons au chapitre 2, figure 2.1a, où la polarisation du photon incident sur le premier polaroïd fait un angle θ avec la verticale. Cette polarisation est une superposition d’un état de polarisation verticale |0〉 et horizontale |1〉 avec des poids cos θ et sin θ qui s’écrit |ψ〉 = cos θ |0〉 + sin θ |1〉.
(8.3)
L’interprétation physique des poids cos θ et sin θ est la suivante : si nous faisons passer un photon de polarisation |ψ〉 à travers un polaroïd d’axe vertical (resp. horizontal), il sera transmis avec une probabilité cos2 θ (resp. sin2 θ ) : c’est la loi de Malus (annexe A2.2) pour les photons. Un cas particulier de (8.3) largement utilisé dans le chapitre 2 est celui des états polarisés à ±45◦ , |D〉 et |A〉 1 |D〉 = (|0〉 + |1〉) 2
1 |A〉 = (|0〉 − |1〉). 2
(8.4)
Alors que le bit classique ne pouvait prendre que les valeurs 0 et 1, le bit quantique peut prendre une infinité de valeurs |ψ〉, puisque θ varie continûment entre 0 et π. En fait, la description complète d’un qubit nécessite même deux angles, θ et φ, car l’équation (8.3) décrit uniquement une polarisation linéaire : un qubit est représenté géométriquement par un point sur une sphère de rayon unité, la sphère de PoincaréBloch (figure 8.1). Un point sur cette sphère est repéré par deux angles, la latitude θ , 0 ≤ θ < π, et la longitude φ, φ ≤ 0 < 2π. Comme les angles θ et φ varient de façon continue, on pourrait en déduire qu’un qubit contient bien plus d’information qu’un bit classique (en fait une quantité infinie d’information !) Cependant, quand nous mesurons un qubit, nous devons utiliser une certaine orientation des polaroïds, par exemple V (axe du polaroïd vertical) ou D (axe du polaroïd incliné à 45◦ ). Le résultat de la mesure est par convention 0 si le photon est transmis, 1 s’il est arrêté, quelle que soit l’orientation choisie. La mesure d’un qubit ne donne que deux résultats possibles, 0 ou 1, de sorte que notre espoir d’extraire plus d’information d’un qubit que d’un bit classique est totalement infondé. Cette remarque pessimiste est corroborée par le théorème d’Holevo : N qubits ne transportent pas plus d’information que N bits classiques. Les raisons pour lesquelles le calcul quantique peut être plus performant que le calcul classique ne sont absolument pas évidentes, et c’est en utilisant des
LE MONDE QUANTIQUE
153
z |0〉 θ M |L〉
|A〉
O |D〉
y |R〉
φ
x |1〉 Figure 8.1. La sphère de Poincaré-Bloch est une sphère de rayon unité. Un point sur la sphère est repéré par sa latitude θ et sa longitude φ . L’état de polarisation |ψ〉 (encadré 8.1) est en correspondance bijective avec un point de la surface de la sphère. Les points correspondant aux polarisations verticale |0〉 et horizontale |1〉, aux polarisations à ±45◦ |D〉 et |A〉, ainsi qu’aux polarisations circulaires droite |R〉 et |L〉 (11.16) ont été placés sur la surface de la sphère.
propriétés spécifiques de la physique quantique, superposition et intrication, que les ordinateurs quantiques peuvent surpasser les ordinateurs classiques dans certains problèmes de grande importance, mais qui restent aujourd’hui en nombre limité. Encadré 8.1. État quantique d’un qubit.
Le vecteur d’état le plus général |ψ〉 d’un qubit s’écrit |ψ〉 = cos
θ 2
|0〉 + e iφ sin
θ 2
|1〉
ce qui établit la correspondance bijective entre |ψ〉 et un point sur la sphère de Poincaré repéré par les angles θ et φ. On observera que la définition de l’état |ψ〉 fait intervenir l’angle θ /2. Le cas φ = 0 (ou φ = π) correspond à une polarisation linéaire, le cas φ = 0 à une polarisation elliptique. Le cas particulier θ = π/2, φ = ±π/2 donne une polarisation circulaire.
1.2
Portes logiques quantiques
Le schéma d’un calcul effectué sur un ordinateur quantique est reproduit sur la figure 8.2, où n qubits sont préparés dans l’état |0〉 au temps t = t 0 : c’est l’étape de
154
Chapitre 8. Vers l’ordinateur quantique ?
|0〉
|0〉 t0
t
Figure 8.2. Schéma de principe d’un calcul quantique : n qubits sont préparés dans l’état |0〉. Ils subissent une évolution quantique dans l’espace des n qubits de l’instant t = t 0 à l’instant t . Les flèches ondulées représentent l’interaction des qubits avec des champs électromagnétiques classiques. Une mesure des qubits (ou d’un sous-ensemble des qubits, les trois premiers dans le cas de la figure) est effectuée au temps t . Les diagrammes se lisent de gauche à droite.
préparation du système quantique. Les qubits subissent ensuite une évolution quantique qui effectue les opérations souhaitées, par exemple le calcul d’une fonction. La difficulté majeure consiste à isoler suffisamment l’ordinateur de son environnement externe, sous peine de voir l’évolution se dérouler dans un espace des états quantiques plus grand que celui sous-tendu par les n qubits. Dans ce cas, la fiabilité du calcul quantique serait détériorée par le phénomène dit de décohérence, sur lequel nous reviendrons en détail au chapitre suivant. Les seules interactions possibles sont celles avec des champs classiques, en général électromagnétiques, qui sont compatibles avec une évolution quantique limitée aux n qubits. Une fois l’évolution quantique terminée, une mesure est faite au temps t sur les qubits (ou une partie d’entre eux), qui donne le résultat du calcul. Notons qu’il est impossible d’effectuer quelque observation que ce soit sur les qubits pendant l’évolution quantique, c’est-à-dire entre les temps t 0 et t à l’intérieur de la boîte de la figure 8.2, alors qu’en principe rien n’empêche d’observer les bits classiques dans une étape intermédiaire d’un calcul effectué par un ordinateur classique. Les opérations du calcul quantique sont réalisées grâce à des portes logiques quantiques, qui effectuent des opérations sur les qubits (figure 8.3). Les portes les plus simples sont celles à un qubit, qui transforment l’état d’un qubit en un autre état du même qubit. Tout comme les nombres, les portes logiques seront écrites en gras. Donnons deux exemples importants de portes à un seul qubit. La porte X échange les états |0〉 et |1〉 X|0〉 = |1〉
LE MONDE QUANTIQUE
X|1〉 = |0〉,
(8.5)
155
|0〉 |1〉
X
(a)
|1〉
|0〉
|0〉
|1〉
H
|x〉
|x〉
| y〉
|x ⊕ y〉
|D〉 |A〉
(b)
(c)
Figure 8.3. Portes logiques quantiques. (a) Porte X qui échange |0〉 et |1〉. (b) Porte de Hadamard H qui transforme |0〉 en |D〉 et |1〉 en |A〉. (c) Porte cNOT : le qubit de contrôle est |x〉 (ligne verte) et le qubit cible | y〉 (ligne bleue).
tandis que la porte de Hadamard H transforme les états |0〉 et |1〉 dans les états polarisés à ±45◦ , |D〉 et |A〉 1 H|0〉 = (|0〉 + |1〉) = |D〉 2 1 H|1〉 = (|0〉 − |1〉) = |A〉. 2
(8.6)
On vérifie immédiatement que ces deux opérations sont de carré unité : X2 = H2 = 1, et sont donc leur propre inverse. Une autre porte logique d’importance majeure est la porte cNOT (controlled-NOT) qui est une porte à deux qubits, où le premier qubit |x〉 est appelé qubit de contrôle et le second qubit | y〉 qubit cible. Appliquée à un état à deux qubits, la porte cNOT ne modifie rien si le qubit de contrôle est dans l’état |0〉 cNOT |0〉|0〉 = |0〉|0〉 cNOT |0〉|1〉 = |0〉|1〉, mais elle échange |0〉 et |1〉 pour le qubit cible si le qubit de contrôle est dans l’état |1〉 cNOT |1〉|0〉 = |1〉|1〉
cNOT |1〉|1〉 = |1〉|0〉.
En utilisant l’addition modulo 2 (symbole ⊕) déjà rencontrée au chapitre 2 0⊕1 = 1⊕0 = 1
0⊕0=1⊕1=0
on peut résumer l’action de la porte cNOT par cNOT |x〉| y〉 = |x〉|(x ⊕ y)〉
(8.7)
où x est la valeur du qubit de contrôle (x = 0 ou x = 1), et y celle du qubit cible ( y = 0 ou y = 1) ; la porte cNOT est l’équivalent du ou exclusif de la logique
156
Chapitre 8. Vers l’ordinateur quantique ?
classique. L’importance de ces portes vient de la propriété mathématique suivante : toute évolution quantique d’un ensemble de qubits peut être décomposée en un produit de portes à un qubit choisies dans un ensemble limité et de la porte cNOT ou, plus exactement, toute évolution quantique peut être approchée d’aussi près que l’on veut par une telle combinaison de portes. En raison de la propriété y ⊕ x ⊕ x = y, la porte logique cNOT est réversible, et il en est de même de toutes les opérations logiques quantiques : étant donné l’état résultant d’une évolution quantique, on peut remonter à l’état de départ. Autrement dit, il existe une correspondance bijective entre état initial et état final. Ce n’est pas le cas des circuits logiques classiques qui contiennent des portes logiques irréversibles, telles que deux états initiaux différents conduisent au même état final. On sait toutefois convertir tout circuit logique classique en un circuit réversible, au prix d’une augmentation limitée du temps de calcul. Tout algorithme classique peut donc être converti en un algorithme quantique. 2 2.1
Algorithmes quantiques Calcul d’une fonction
Schématiquement, un algorithme quantique fonctionne de la façon suivante : un registre de données de n qubits stocke un entier x, 0 ≤ x ≤ 2n − 1 et un registre de résultats de m qubits stocke un entier y, 0 ≤ y ≤ 2m − 1. Afin de donner un exemple élémentaire, nous allons examiner le cas où le registre de données et le registre de résultats sont à deux qubits : ils peuvent donc stocker chacun quatre entiers x et y de 0 à 3. Supposons qu’une fonction f (x) est donnée pour les 4 valeurs de x par f (0) = 2
f (1) = 3
f (2) = 1
f (3) = 0.
(8.8)
Nous allons montrer comment construire un circuit logique quantique qui calcule cette fonction. Ce circuit quantique est dessiné sur la figure 8.4, avec un registre d’entrée et un registre de résulats stockant chacun deux qubits. Ce circuit a l’action suivante sur un état initial |x 1 〉|x 0 〉| y1 〉| y0 〉, où x 1 et x 0 sont stockés dans le registre de données, y1 et y0 dans le registre de résultats. |x 1 〉|x 0 〉| y1 〉| y0 〉 → |x 1 〉|x 0 〉|( y1 ⊕ x 1 ⊕ 1)〉|( y0 ⊕ x 1 ⊕ x 0 )〉.
(8.9)
Si la fonction f (x) est donnée par (8.8) alors l’action du circuit peut être résumée par (8.10) |x〉|y〉 → U f |x〉|y〉 = |x〉|[y ⊕ f (x)]〉, où ⊕ est l’addition modulo 2 sans retenue. En particulier si y = 0 |x〉|0〉 → U f |x〉|0〉 = |x〉| f (x)〉,
LE MONDE QUANTIQUE
157
x1
x1
x0
x0
y1 y0
X
y1 ⊕ x 1 ⊕ 1 y0 ⊕ x 1 ⊕ x 0
Figure 8.4. Un circuit quantique élémentaire avec trois portes cNOT ( x 1 et x 0 = bits de contrôle, lignes vertes, y1 et y0 = bits cibles, lignes bleues) et une porte à un qubit X qui calcule la fonction f (x) (8.8).
ce qui donne f (x). On peut le vérifier par exemple pour x = 1 (x 1 = 1, x 0 = 0) : de x 1 ⊕ 1 = 1 et x 1 ⊕ x 0 = 1 on déduit f (1) = 3. La transformation U f représente l’évolution quantique de la figure 8.4. Pour une fonction générique f (x), l’évolution quantique U f sera construite en généralisant le circuit de la figure 8.4. 2.2
L’algorithme de Deutsch
Dans la scène finale du film de Howard Hawks « Seuls les anges ont des ailes », après de nombreuses péripéties qui n’ont aucun rapport avec le calcul quantique, Bonnie (Jean Arthur) demande à Geoff (Cary Grant) si elle doit reprendre le bateau ou bien rester avec lui dans le petit aéroport en Colombie qui sert de base pour acheminer le courrier au-delà de la Cordillère des Andes (nous sommes en 1938). Juste au moment où il part en mission, Geoff lui répond en tirant à pile ou face : « Face tu restes et pile tu pars ! » Après le départ de Geoff, furieuse d’avoir vu son sort joué à pile ou face, Bonnie fait sa valise, mais jette néanmoins un coup d’œil à la pièce. . . et constate que les deux côtés sont des « face ». Pour vérifier si la pièce était ou non truquée, Bonnie a dû examiner successivement les deux faces, soit deux opérations. L’algorithme quantique de Deutsch exécute le test en une seule opération ! En termes mathématiques, le problème de Bonnie est le suivant : elle dispose d’une fonction f (x), x = 0 ou x = 1, et f (x) prend également deux valeurs 0 et 1 ; il n’est pas nécessaire d’utiliser des lettres en gras car les valeurs possibles de x et de f (x) sont seulement 0 et 1. Il s’agit d’obtenir l’information suivante : les deux valeurs de f (x) sont-elles identiques, f (0) = f (1) (la pièce est truquée avec deux « pile » ou deux « face »), ou bien f (0) = f (1) (la pièce est honnête) ? Avec un ordinateur classique, deux opérations sont nécessaires, parce qu’il faut calculer f (0) et f (1) : autrement dit, nous avons besoin d’une table de valeurs de f (x). La stratégie de l’ordinateur quantique pour obtenir le résultat – f (0) = f (1) (fonction constante)
158
Chapitre 8. Vers l’ordinateur quantique ?
|0〉 |1〉
H Uf
mesure D ou A
H
Figure 8.5. Algorithme de Deutsch. Le qubit du registre de données est initialement dans l’état |0〉, celui du registre de résultat dans |1〉. Une porte de Hadamard les transforme en |D〉 et |A〉 respectivement. Après l’évolution quantique U f , une mesure du registre de données est effectuée dans la configuration {DA}.
ou f (0) = f (1) (fonction équilibrée) – sera de contourner le calcul explicite des valeurs de f pour obtenir le résulat en une seule opération. On réalise l’algorithme de Deutsch à l’aide du circuit de la figure 8.5, avec un registre de données et un registre de résultats à un qubit. Bien sûr cet exemple est trop élémentaire pour être d’un quelconque intérêt pratique, mais c’est l’exemple le plus simple illustrant le concept de parallélisme quantique. Le registre de données étant au départ dans l’état |0〉 et le registre de résultats dans l’état |1〉, l’application aux deux qubits de la porte de Hadamard (8.6) donne 1 1 1 |x〉 |0〉 − |1〉 . |0〉 + |1〉 |0〉 − |1〉 = H|0〉 H|1〉 = 2 2 x=0
(8.11)
L’évolution quantique U f (8.10) sur cet état ne change rien si f (x) = 0, mais si f (x) = 1, elle change le signe de l’état car, suivant (8.10) U f |x〉 |0〉 − |1〉 = |x〉 |0 ⊕ 1〉 − |1 ⊕ 1〉 = −|x〉 |0〉 − |1〉 , soit, en résumé
|0〉 − |1〉 → (−1) f (x) |0〉 − |1〉 .
L’état du qubit du registre de données est donc 1 = (−1) f (0) |D〉 si f (0) = f (1) (−1) f (0) |0〉 + (−1) f (1) |1〉 2 = (−1) f (0) |A〉 si f (0) = f (1). Si les qubits sont portés par la polarisation d’un photon, il suffit de mesurer le qubit de données avec un polaroïd orienté à 45◦ : si le photon est transmis, la fonction est constante : f (0 = f (1)), et s’il est arrêté, la fonction est équilibrée : f (0) = f (1). Ce résultat est acquis en une seule mesure. C’est un premier exemple de parallélisme quantique, qui dans ce cas a permis de faire une comparaison sans calculer explicitement les deux valeurs de f (x).
LE MONDE QUANTIQUE
159
2.3
Le parallélisme quantique
Les états de la forme (8.3) forment une base d’un espace à 2 n -dimensions appelée base de calcul et on pourrait être tenté de conclure à partir du principe de superposition qu’un registre de n qubits peut stocker 2n états en même temps. Cependant, comme dans le cas d’un seul qubit, une mesure des n qubits donnera un seul résultat et le défi du calcul quantique est d’utiliser la superposition et l’intrication pour exploiter cette information qui croît en principe exponentiellement. Un état du registre de données où tous les qubits sont dans l’état |0〉 sera noté symboliquement (|0〉)n, et de même (|0〉)m pour le registre de résultats. L’application de la porte de Hadamard sur les qubits du registre de données fabrique une superposition de valeurs de x allant de 0 à 2n−1 n −1 1 2 n H|0〉 = n/2 |x〉. 2 x=0 et, étant donné une fonction f (x), l’évolution quantique donne une généralisation de (8.10) n −1 1 2 n m U f (H|0〉) (|0〉) = n/2 |x〉| f (x)〉. 2 x=0 En principe, cet état contient les 2 n valeurs de f (x), pas nécessairement toutes différentes. Par exemple, si n = 100, il contient les ∼1030 valeurs de la fonction ! C’est cette croissance exponentielle du nombre d’états qui permet au parallélisme quantique de traiter de problèmes qui exigeraient un temps de calcul prohibitif sur un ordinateur classique. Une mesure des registres ne donne bien sûr qu’une seule des valeurs de f (x), mais il est néanmoins possible d’extraire une information utile sur des relations entre ces valeurs, le prix à payer étant la perte de toute information sur les valeurs individuelles. Nous en avons vu un exemple avec l’algorithme de Deutsch. L’art du calcul quantique consiste à construire un schéma d’interférence, où le résultat se détache avec une bonne probabilité sur un bruit de fond limité. En fait, l’algorithme de Deutsch est particulier et quelque peu trompeur, car il donne le résultat avec certitude. Les algorithmes quantiques plus complexes ne peuvent donner le résultat qu’avec une certaine probabilité : ce sont des algorithmes probabilistes. Il est ensuite nécessaire de vérifier le résultat avec un ordinateur classique, mais cela va très vite. C’est la recherche d’une solution qui est gourmande en temps de calcul. À l’heure actuelle, on a identifié deux grandes classes d’algorithmes quantiques. La première classe, représentée principalement par l’algorithme de recherche de Grover, permet une accélération quadratique du calcul. L’objectif de l’algorithme de Grover est de rechercher une donnée dans une base non structurée, par exemple trouver un nom dans un annuaire téléphonique quand on ne dispose que du numéro
160
Chapitre 8. Vers l’ordinateur quantique ?
de téléphone. Si l’annuaire contient N entrées, il faudra en moyenne N /2 essais avant de repérer l’entrée souhaitée. L’algorithme de Grover donne le résulat en N opérations environ : si la base contient 10 000 entrées, on passe de 5 000 essais à une centaine. Cette classe d’algorithme exploite la superposition quantique mais pas l’intrication, alors que la seconde classe, à laquelle appartient l’algorithme de Shor, fait une utilisation essentielle de l’intrication. Cet algorithme effectue la décomposition en facteurs premiers d’un entier N . La difficulté de réaliser cette opération sur un ordinateur classique est à la base de la sécurité du cryptage RSA (chapitre 2 et annexe A2.1). La mise en œuvre de l’algorithme de Shor sur un ordinateur quantique signerait instantanément l’acte de décès de tous les processus de sécurisation actuels de transmission de données. Aujourd’hui, le meilleur algorithme tournant sur un ordinateur classique exige un minimum de ∼ exp[1,9 ln1/3 N ln ln2/3 N ] opérations pour décomposer un entier N en facteurs premiers ; ln N est le logarithme népérien de N , en gros le nombre de chiffres nécessaire pour écrire N . Comme ce nombre d’opérations croît plus vite que tout polynôme en ln N , le nombre de bits (n ∼ ln N ) qui caractérise la taille du problème, on a émis la conjecture que cette décomposition en facteurs premiers est un problème de complexité exponentielle, aussi appelé problème « difficile » (voir la section suivante). Au contraire, le problème devient de complexité polynômiale (« facile ») avec l’algorithme de Shor, où le nombre d’opérations croît seulement comme ∼ (ln N )3 . Il est aussi possible que les ordinateurs quantiques se révèlent efficaces dans la simulation de systèmes quantiques importants en physique de la matière condensée, mais il est quelque peu frustrant de constater qu’en dix ans aucun algorithme quantique véritablement nouveau n’est venu s’ajouter à ceux de Grover et de Shor. Comme dans les ordinateurs classiques, des erreurs peuvent survenir dans le traitement ou le stockage de l’information et il est nécessaire de mettre au point des codes correcteurs d’erreurs. Les codes qui corrigent les erreurs sur les ordinateurs classiques sont fondés sur la redondance : par exemple on fait trois copies de chaque bit et on récupère la valeur correcte par un vote majoritaire. Si la probabilité d’une erreur est de 1 %, la probabilité de la même erreur n’est plus que de ∼10−4 après application du code de correction. Les codes classiques ne peuvent pas être transposés aux algorithmes quantiques, en premier lieu parce que le théorème de non-clonage interdit de recopier un qubit dont l’état est inconnu. Ensuite, la seule erreur possible sur un bit classique est la substitution de 0 par 1 ou vice versa, alors que les paramètres d’un qubit peuvent varier de façon continue sur la sphère de Poincaré-Bloch : le bruit incontrôlé qui est à la source des erreurs peut entraîner des variations continues des angles θ et φ. Il est tout à fait remarquable que l’on puisse néanmoins contrôler toutes les sources d’erreur possibles en se limitant à un petit nombre de corrections de base et des codes correcteurs d’erreurs ont été mis au point, par exemple celui de Steane qui utilise une redondance à sept qubits.
LE MONDE QUANTIQUE
161
3
Algorithmes quantiques et complexité algorithmique
L’algorithmique quantique remet en question certaines thèses de l’algorithmique classique lorsque l’on se pose la question suivante, dite de la complexité algorithmique : quelles sont les ressources nécessaires pour effectuer un calcul ? Une idée générale est que certains problèmes peuvent être résolus en un nombre d’étapes de calcul polynômial dans le nombre de bits n qui mesure la taille du problème : par exemple, si l’on veut multiplier deux nombres de n chiffres en notation binaire, il suffit d’un nombre d’étapes de calcul polynômial en n, dans ce cas ∼ n2 . Un exemple beaucoup moins trivial est celui de la primalité : quel est le nombre d’étapes de calcul nécessaire pour montrer qu’un nombre est premier ? On a montré en 2002 que ce problème est polynômial. En revanche, l’expérience suggère que d’autres problèmes nécessitent un nombre d’étapes de calcul croissant plus vite que toute puissance de n pour n 1 : par exemple, exp n, exp(n1/3 ) ou nln n . Par abus de langage, on qualifie souvent de tels problèmes « d’exponentiels ». Turing a défini une classe de machines, connues aujourd’hui sous le nom de machines de Turing, qui ont permis d’aborder la notion de complexité d’un algorithme de calcul. Il a montré qu’il existe des machines, dites universelles (et il en a proposé une) ayant la capacité de simuler toute autre machine de Turing. On a découvert par la suite que tous les modèles de calcul proposés pour exécuter des programmes étaient simulables par une machine de Turing en utilisant un temps de calcul polynômial par rapport à celui de la machine simulée. Ce résultat a suggéré la généralisation suivante : tous les modèles de machines sont équivalents pour le temps de calcul (ou le nombre d’étapes de calcul), à un polynôme près. Si cette idée est correcte, le caractère exponentiel ou polynômial se conserve en passant d’un modèle de calcul à un autre, d’où l’idée de définir de façon précise la complexité algorithmique d’un problème donné à partir du nombre d’étapes de calcul qu’une machine de Turing doit effectuer pour résoudre ce problème. Si est polynômial en n, alors le problème est dit « facile », et si croît plus vite que tout polynôme en n, alors le problème est « difficile ». L’addition de deux nombres de n chiffres est un problème « facile », la décomposition d’un nombre en facteurs premiers est supposée être « difficile », bien qu’il n’y ait pas de preuve formelle de ce résultat. Deux classes de complexité importantes sont la classe P, la classe des problèmes dont la solution est « facile », et la classe NP, celle des problèmes dont la solution (si l’on en a trouvé une) peut être vérifiée en un temps polynômial. Par exemple, il est « difficile » de décomposer un nombre en facteurs premiers, mais il est « facile » de vérifier la solution si l’on connaît les facteurs premiers. Naturellement P⊂NP et il existe une conjecture célèbre, P=NP, qui n’a jamais pu être prouvée à ce jour. On a identifié de multiples classes de complexité que l’on définit en se référant le plus souvent au modèle de calcul des machines de Turing, mais qui ne dépendent pas de ce modèle
162
Chapitre 8. Vers l’ordinateur quantique ?
pourvu qu’on utilise un modèle simulable en temps polynômial par une machine de Turing. Une classe importante est celle des problèmes NP complets, comme le problème du voyageur de commerce : étant donné un certain nombre de villes, il s’agit pour le voyageur de trouver l’itinéraire qui passe une fois et une seule par chaque ville et minimise la distance parcourue. La découverte d’un algorithme polynômial pour un problème NP complet impliquerait l’existence d’un tel algorithme pour tous les problèmes NP. Nous avons uniquement évoqué jusqu’à présent les problèmes calculables : la thèse de Church-Turing, universellement admise bien que par nature elle ne soit pas démontrable, énonce que la classe des fonctions calculables par une machine de Turing correspond exactement à la classe des fonctions que l’on peut considérer de façon naturelle comme calculables par un algorithme. Il existe des problèmes non calculables dûment identifiés, pour lesquels on sait qu’il n’existe aucun algorithme, par exemple le problème de l’arrêt d’une machine de Turing : la fonction qui à tout programme de machine de Turing (c’est une suite finie de symboles) associe 0 ou 1 selon que la machine s’arrête ou ne s’arrête pas, n’est pas une fonction calculable. Les ordinateurs quantiques ne semblent pas remettre en cause la thèse de ChurchTuring : les fonctions que peuvent calculer les ordinateurs quantiques sont a priori les mêmes que celles calculables par les machines de Turing. Nous avons déjà mentionné que la simulation de tout modèle d’algorithme classique peut être faite avec une augmentation du temps de calcul au plus polynômiale sur une machine de Turing, et ce résultat a été admis comme une sorte d’« axiome » à la base de la théorie de la complexité algorithmique. C’est la version forte de la thèse de Church-Turing, dont l’énoncé est le suivant : tout modèle de calcul peut être simulé sur une machine de Turing probabiliste avec au plus un accroissement polynômial du nombre d’étapes de calcul. L’importance des ordinateurs quantiques vient de ce qu’ils remettent en question cette version forte : en effet, si la factorisation est un problème « difficile », ce que suggère l’expérience mais reste à prouver, alors l’algorithme de Shor contredit cette version forte. Avec un ordinateur quantique, il est possible de décomposer en facteurs premiers avec un nombre d’étapes de calcul polynômial en n, alors qu’un ordinateur classique devrait en utiliser un nombre exponentiel. Malheureusement, le problème de la factorisation n’est pas NP complet et sa solution par un algorithme polynômial n’entraîne pas celle de tous les problèmes NP.
4
Réalisations physiques
On en est encore aux premiers balbutiements de réalisations physiques d’ordinateurs quantiques et il est tout à fait prématuré d’essayer de prévoir aujourd’hui quel dispositif sera effectivement utilisé pour un ordinateur quantique pouvant traiter plusieurs
LE MONDE QUANTIQUE
163
Chaine d’ions 40Ca+ dans un piège linéaire : registre quantique !
70 μm
Figure 8.6. Description schématique d’un ordinateur quantique utilisant des ions piégés. On distingue une rangée d’ions piégés manipulés par laser. Courtoisie d’Alain Aspect et Philippe Grangier d’après un original de R. Blatt.
milliers de qubits (s’il en existe un jour). Le stockage et le traitement de l’information quantique exigent des systèmes physiques obéissant aux conditions suivantes : 1. Des systèmes qui soient extrapolables (en anglais « scalable ») à un nombre suffisant de qubits, avec des qubits bien définis. 2. Des qubits qui puissent être initialisés dans l’état |0〉. 3. Des qubits qui soient portés par des états physiques à vie suffisamment longue, de façon à assurer la cohérence des états quantiques tout au long du calcul. 4. Un ensemble de portes quantiques universelles : portes agissant sur des qubits individuels et porte cNOT, qui soient obtenues par des manipulations contrôlées. 5. Une procédure efficace de mesure de l’état des qubits à la fin du calcul. L’ennemi numéro un de l’ordinateur quantique est l’interaction avec l’environnement, qui conduit au phénomène de décohérence (chapitre 9), dont une conséquence est la perte de la phase dans les superpositions linéaires de qubits. Les calculs doivent être effectués en un temps inférieur au temps de décohérence τdec . Si une opération élémentaire (porte logique) sur un qubit prend un temps τop , la figure de mérite d’un ordinateur quantique est le rapport nop =
τdec τop
·
C’est le nombre maximum d’opérations que l’ordinateur quantique peut effectuer. Il existe aujourd’hui deux voies principales de recherche pour la réalisation effective d’ordinateurs quantiques. La première voie utilise des systèmes où les qubits
164
Chapitre 8. Vers l’ordinateur quantique ?
sont portés par des particules quantiques individuelles : photons, atomes, ions. . . Ces systèmes sont dits « propres » car le contrôle en est relativement efficace, mais ils ne sont pas aisément extrapolables. La seconde voie utilise des qubits portés par des systèmes collectifs, comme des boîtes quantiques ou des circuits supraconducteurs. Ces systèmes ont l’avantage de pouvoir exploiter toute la technologie des micropuces développée pour les semi-conducteurs et sont en principe plus facilement extrapolables. Mais ils sont « sales », dans la mesure où le contrôle de systèmes collectifs est moins efficace que celui des particules isolées. L’état de l’art est aujourd’hui le suivant : il a été possible de manipuler quatre à cinq qubits dans des situations parfaitement contrôlées (sept dans le cas de la RMN, qui cependant n’est pas extrapolable) et, en l’absence d’une percée technologique imprévue, mais toujours possible, il devrait se passer plusieurs dizaines d’années avant que l’on puisse fabriquer un ordinateur quantique véritablement performant. 5
Bibliographie
Grand public. J. Kempe, S. Laplante et F. Magniez, « Comment calculer quantique ? », dossiers La Recherche n◦ 29, p. 50 ; S. Aaronson, « Les limites du calcul quantique », Pour la Science, mai 2008, p. 68 ; N. Hermann et P. Lescanne, « Est-ce que P=NP ? », dossiers La Recherche, n◦ 20, p. 64. Les machines de Turing sont expliqués par R. Feynman dans Leçons sur l’informatique, Odile Jacob (2006). Niveau avancé. M. Le Bellac, Introduction à l’information quantique, Belin (2005) ; une version anglaise révisée et complétée, A short introduction to quantum information and quantum computation est disponible chez Cambridge University Press (2006) ; N. Mermin, Introduction au calcul quantique, collection « Savoirs Actuels », à paraître, EDP Sciences/CNRS Éditions, traduction d’O. Alibart et S. Tanzilli ; S. Mertens, Computational complexity for physicists, Computing in Science and Engineering, May/June 2002, p. 31.
LE MONDE QUANTIQUE
165
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
9 L’environnement surveille Il est généralement admis que les lois fondamentales de la physique sont les lois quantiques et que les lois classiques n’en sont qu’une approximation valable sous certaines conditions. Cependant, le passage quantique → classique et les conditions de validité des approximations sous-jacentes font encore débat aujourd’hui. On peut par exemple se poser la question suivante : dans le monde quantique, les particules sont susceptibles de présenter des phénomènes d’interférence. Pourquoi n’observet-on jamais d’interférence dans le monde classique (sauf bien sûr avec des ondes) ? De façon équivalente, pourquoi ne semble-t-il pas exister de superposition d’états macroscopiquement discernables ? Une réponse possible à ces questions réside dans le phénomène de décohérence. Le concept de décohérence en physique quantique remonte à Schrödinger et a été redécouvert au début des années 1970. Après être passé relativement inaperçu, ce concept a progressivement révélé sa pertinence dans des domaines comme l’information quantique où la décohérence joue un rôle capital (voir la section 8.4). Après avoir expliqué sur un exemple simple ce qu’est la décohérence, je décrirai quelques expériences où elle se manifeste à des échelles mésoscopiques, c’est-à-dire intermédiaires entre macroscopiques et microscopiques, de l’ordre du μm.
1
La décohérence : un exemple élémentaire
Pour introduire la notion de décohérence, nous utiliserons comme exemple l’interféromètre de Mach-Zehnder (section 1.2) avec des photons polarisés. En effet, nous avons tenu compte dans l’étude du chapitre 1 des propriétés spatiales du photon, sa propagation dans l’interféromètre, mais nous avons négligé son degré de liberté
DY aY
aX
DX
Y O
Λ X
Figure 9.1. Interféromètre de Mach-Zehnder avec photons polarisés. Les photons entrent dans l’interféromètre en bas à gauche et leur polarisation V est perpendiculaire au plan horizontal de la figure. Elle est modifiée par la lame biréfringente Λ (en mauve) sur le trajet rouge ; la figure correspond au cas où elle est transformée en polarisation horizontale H .
interne, sa polarisation P : V pour une polarisation perpendiculaire au plan de l’interféromètre, H pour une polarisation dans ce plan (figure 9.1). On suppose que le photon entre dans l’interféromètre dans un état de polarisation verticale V . Tant que nous utilisons l’interféromètre dans la configuration de la figure 1.3, rien n’est modifié : la polarisation ne joue aucun rôle. Mais une modification d’apparence mineure va tout bouleverser. Insérons sur le trajet rouge une lame biréfringente Λ qui transforme la polarisation verticale en polarisation horizontale. Pour la discussion qui va suivre, nous aurons besoin de la relation générale donnant l’action d’une lame séparatrice. Supposons que des amplitudes bX et bY arrivent sur une telle lame et que les amplitudes sortantes soient aX et aY (figure 9.2). La relation entre amplitudes a déjà été écrite dans un autre contexte au § 5.2.3 1 aX = (bX + bY ) 2
1 aY = (bX − bY ). 2
(9.1)
Encadré 9.1. Action d’une lame séparatrice.
Le signe (−) de l’équation donnant aY dans l’équation (9.1) peut se comprendre à partir de la conservation de l’intensité lumineuse en physique ondulatoire, ou de la conservation de la probabilité en physique quantique. L’intensité incidente sur la lame est Iinc = bX2 + bY2 et l’intensité sortante Isort = aX2 + aY2 =
168
1 2
1 (bX + bY )2 + (bX − bY )2 = bX2 + bY2 = Iinc . 2
Chapitre 9. L’environnement surveille
aY bX
aX
bY Figure 9.2. Action d’une lame séparatrice sur deux amplitudes incidentes bX et bY . Les amplitudes sortantes sont aX et aY .
Le signe (−) est manifestement indispensable si l’on veut avoir Isort = Iinc , relation qui doit être vérifiée pour une lame non absorbante. En toute rigueur, il faudrait utiliser des nombres complexes et écrire |aX + aY |2 et non (aX + aY )2 .
Dans la situation décrite dans la section 1.2, les amplitudes incidentes sur la lame L2 étaient bX = bY = a/ 2 (figure 1.3), d’où aX = a, aY = 0 : tous les photons sortent horizontalement de L2 . Il nous faut maintenant tenir compte de la polarisation et introduire 4 amplitudes à la sortie de la lame L2 . Pour les calculer, nous utilisons les données à l’entrée de cette lame, qui dépendent maintenant des polarisations V et H a bX (V ) = 2
bX (H) = 0
bY (V ) = 0
a bY (H) = 2
et l’équation (9.1). Cela nous donne les amplitudes à la sortie de L2 . 1. Photon sortant dans la direction X polarisé verticalement : amplitude de probabilité aX (V ) = 1/2. 2. Photon sortant dans la direction X polarisé horizontalement : amplitude de probabilité aX (H) = 1/2. 3. Photon sortant dans la direction Y polarisé verticalement : amplitude de probabilité aY (V ) = 1/2. 4. Photon sortant dans la direction Y polarisé horizontalement : amplitude de probabilité aY (H) = −1/2. Pour calculer les probabilités, revenons à la règle n◦ 3 du § 1.6.2 en tenant compte de ce que les états de polarisation V et H sont discernables. Nous pourrions en effet analyser la polarisation des photons après la lame L2 à l’aide d’un prisme de Wollaston (section 2.2) et identifier leurs polarisations. Nous avons quatre probabilités différentes notées suivant le même schéma que les amplitudes, à savoir :
LE MONDE QUANTIQUE
169
ProbX (V ), . . . , Prob Y (H). Compte tenu des résultats pour les amplitudes, ces quatre probabilités sont égales à 1/4 (=(1/2)2 = (−1/2)2) ProbX (V ) = ProbX (H) = ProbY (V ) = ProbY (H) =
1
. 4 La probabilité Prob(X ) pour qu’un photon sorte suivant la direction OX s’obtient en additionnant les polarisations verticale et horizontale ProbX = ProbX (V ) + ProbX (H) =
1
. 2 L’interférence a disparu ! En fait, la polarisation agit comme un marqueur du trajet suivi par le photon : l’observation d’une polarisation V (H) indique que le photon a suivi le trajet bleu (rouge), et nous pouvons diviser l’ensemble des photons en deux groupes, ceux qui ont suivi le trajet bleu et ceux qui ont suivi le trajet rouge. Ainsi que nous l’avons expliqué dans la section 1.4, on n’observe d’interférence pour aucun de ces deux groupes et la même propriété est donc vraie globalement. Il faut maintenant ajouter trois remarques fondamentales. 1. Il n’y a eu aucune perturbation de la propagation spatiale des photons. Il n’est donc pas possible d’expliquer la disparition de l’interférence par une « perturbation incontrôlable ». C’est l’étiquetage des trajets par la polarisation qui est à la base de la disparition de l’interférence. 2. Il n’est pas nécessaire d’observer la polarisation pour que l’interférence disparaisse. Il suffit que le dispositif puisse en principe donner accès à cette information. Le comportement du photon n’est pas lié à une observation effectuée ou non effectuée, mais à la configuration du dispositif expérimental, une propriété que nous avons déjà observée pour l’expérience à choix retardé (section 1.7). 3. En manipulant le photon après L2 , nous pourrions récupérer l’interférence et effacer l’information contenue dans la polarisation. C’est avec un dispositif un peu différent, mais dont le principe est analogue, que fonctionne l’expérience à choix retardé (figure 1.10). C’est uniquement lorsque l’un des compteurs a été déclenché que nous pouvons affirmer avec certitude que le photon a suivi un des deux trajets ; nous le reverrons au chapitre suivant. Comme le dit John A. Wheeler : « Aucun phénomène élémentaire ne peut être considéré comme tel tant qu’il n’a pas été enregistré. » Pour conclure cette section, généralisons légèrement le dispositif de la figure 9.1 en permettant à la lame biréfringente Λ de faire tourner la polarisation d’un angle quelconque θ au lieu de π/2. Il est immédiat d’obtenir les 4 amplitudes a a aX (V ) = (1 + cos θ ) aX (H) = sin θ 2 2 a a (1 − cos θ ) aX (H) = − sin θ , aY (V ) = 2 2 170
Chapitre 9. L’environnement surveille
ce qui donne les probabilités ProbX
=
ProbY
=
1 4 1 4
(1 + cos θ )2 + (1 − cos θ )2 +
1 4 1 4
sin2 θ = sin2 θ =
1 2 1 2
(1 + cos θ ) (1 − cos θ ).
avec bien entendu Prob(X )+Prob(Y ) = 1. La visibilité de l’interférence est définie par ProbX − ProbY = = cos θ . (9.2) ProbX + ProbY En combinant les propagations suivant les deux axes OX et OY , la lame L2 permet de tester la cohérence entre ces deux états. La cohérence est maximale si = 1, c’està-dire pour θ = 0 et elle est nulle pour = 0, c’est-à-dire pour θ = π/2. En d’autres termes, la lame L2 permet de tester la superposition linéaire des deux trajets, le rouge et le bleu. Cette superposition est cohérente pour θ = 0 (P = V ), incohérente pour θ = π/2 (P = H). L’interféromètre de Mach-Zehnder avec photons polarisés illustre un cas où il existe une corrélation quantique entre un degré de liberté de propagation (la propagation suivant les directions X ou Y ) et un degré de liberté de polarisation. C’est un nouvel exemple d’intrication et cette intrication d’un degré de liberté de propagation avec un degré de liberté de polarisation a permis d’influencer la cohérence du premier. Si l’on observe seulement le degré de liberté de propagation, on constate une perte de cohérence lorsque l’angle θ passe de 0 à π/2. La perte de cohérence est totale lorsque les états de polarisation intriqués avec chacun des deux états de propagation sont discernables, par exemple les états V et H. Cette perte de la cohérence due à l’intrication est précisément le phénomène de décohérence. Les expériences d’interférence, par exemple celle effectuée avec l’interféromètre de Mach-Zehnder, sont souvent expliquées par le principe de complémentarité de Bohr (section 10.3). Si les deux trajets sont discernables, il n’y a pas d’interférence et nous observons l’aspect particulaire. S’ils sont indiscernables, nous avons interférence et nous observons l’aspect ondulatoire. Les deux aspects sont mutuellement exclusifs. Cependant, l’expérience d’interférence révèle en fait les deux aspects, car les particules sont localisées quand elles sont détectées. De plus, on a vu qu’en jouant sur l’angle θ , on passe continûment de l’aspect ondulatoire à l’aspect corpusculaire. Ce qui est fondamental est en fait l’intrication avec un degré de liberté autre que celui qui nous intéresse directement et qui permet d’accéder (ou non, ou seulement en partie) à l’information sur le trajet suivi.
LE MONDE QUANTIQUE
171
2
Décohérence environnementale
Il sera commode pour ce qui suit de reformuler la théorie quantique en termes de vecteurs d’état, et non d’amplitudes de probabilité. On représente souvent l’état • d’un système quantique en utilisant la notation de Dirac |•〉 : c’est le vecteur d’état du système quantique (voir le chapitre précédent pour les états d’un qubit et les annexes A2.1 et A4.1 pour un exposé plus détaillé). Donnons un exemple : l’état (quantique) de polarisation d’un photon polarisé verticalement s’écrira |V 〉, celui d’un photon polarisé horizontalement |H〉. La propriété fondamentale des vecteurs d’état est qu’ils peuvent s’additionner comme les amplitudes de probabilité : ils obéissent au principe de superposition et c’est pourquoi les deux descriptions sont équivalentes. Un état de polarisation linéaire faisant un angle θ avec la verticale s’écrit sous la forme d’un vecteur d’état |P〉, avec |P〉 = cos θ |V 〉 + sin θ |H〉.
(9.3)
Cette équation implique que l’amplitude de probabilité pour trouver le photon dans l’état |V 〉 (resp. |H〉) est cos θ (resp. sin θ ), et l’équation (9.3) est la réalisation mathématique d’une superposition linéaire (ou cohérente) telle que nous l’avons introduite au § 1.3.3 : l’état |P〉 est une superposition linéaire des états |V 〉 et |H〉. Il est important d’observer que le facteur cos θ dans l’équation (9.3) est précisément celui qui a fixé la cohérence (9.2) dans la section précédente. Ce facteur est le recouvrement des états |P〉 et |V 〉 et c’est mathématiquement leur produit scalaire. Dans le formalisme de Dirac, les états de propagation suivant les directions X et Y s’écrivent |X 〉 et|Y 〉 et le vecteur d’état spatial avant la lame L2 est 1 |ψ〉 = (|X 〉 + |Y 〉). 2
(9.4)
Le mécanisme décrit dans la section précédente contient l’essence du phénomène de décohérence comme conséquence de l’intrication, indépendamment du mécanisme utilisé pour engendrer celle-ci. Le mécanisme habituel pour engendrer l’intrication est l’interaction d’un système quantique , celui qui nous intéresse, avec un environnement . On suppose que se trouve initialement dans une superposition cohérente à poids égaux |ψ〉 de deux états discernables (orthogonaux) |S1 〉 et |S2 〉 1 |ψ〉 = |S1 〉 + |S2 〉 , 2
(9.5)
où |S1 〉 et |S2 〉 jouent le rôle des états de propagation |X 〉 et |Y 〉 de l’équation (9.4). Ce choix est fait pour permettre une comparaison directe avec le cas de l’interféromètre. En général, on aurait |ψ〉 = α |S1 〉 + β |S2 〉 avec |α|2 + |β|2 = 1. En raison
172
Chapitre 9. L’environnement surveille
de l’interaction avec l’environnement, l’évolution temporelle crée en général un état intriqué avec des états de l’environnement, par exemple |E1 〉 pour |S1 〉 et |E〉 pour |S2 〉, avec |E〉 = cos θ |E1 〉 + sin θ |E2 〉, où les états |E1 〉 et |E2 〉 sont discernables (orthogonaux). L’interaction système + environnement engendre un état intriqué 1 |ΨAE 〉 = |S1 〉|E1 〉 + |S2 〉|E〉 2
(9.6)
où l’on note les correspondances avec ce qui précède |X 〉 =⇒ |S1 〉
|Y 〉 =⇒ |S2 〉
|V 〉 =⇒ |E1 〉
|P〉 =⇒ |E〉.
Dans ces conditions, et pour les mêmes raisons que dans la section précédente, la cohérence initiale contenue dans l’équation (9.5) est réduite par le facteur cos θ , qui n’est autre que le produit scalaire 〈E1 |E〉. En pratique, le système interagit avec un environnement complexe présentant un grand nombre de degrés de liberté. Il en résulte que le facteur 〈E1 |E〉 décroît selon un temps caractéristique τdec , le temps de décohérence : en effet, la dynamique introduit un facteur de phase différent pour chaque degré de liberté, le produit scalaire 〈E1 |E〉 s’écrit comme la somme d’un grand nombre de fonctions sinusoïdales oscillant à des fréquences différentes et il tend rapidement vers zéro aux grands temps. Cet argument qualitatif est confirmé quantitativement par des modèles semi-réalistes d’interaction - . Le temps de décohérence peut varier d’une fraction de seconde (expériences de Serge Haroche et collaborateurs) à 10−17 s pour une molécule lourde préparée dans une superposition linéaire de deux états localisés à une distance de 1 nm dans l’air à la pression ambiante. Lorsque les états |E1 〉 et |E〉 sont devenus orthogonaux (θ = π/2), alors aucune mesure effectuée uniquement sur le système ne pourra mettre en évidence une cohérence entre les états |S1 〉 et |S2 〉. De même que la polarisation agit comme un marqueur du trajet du photon, l’état de l’environnement agit comme un marqueur de celui de . Il faut bien comprendre que l’origine de la décohérence ne réside pas dans le caractère complexe, chaotique et incontrôlable de l’environnement (cependant, ces caractéristiques sont importantes pour le temps de décohérence), mais bien dans l’intrication - , et il importe de ne pas confondre la décohérence, qui est un phénomène quantique et les interactions bruitées. En plus du temps de décohérence, la décohérence environnementale présente une seconde spécificité par rapport à l’exemple simple de la section précédente. Si interagit avec des particules de qui s’éloignent ensuite de la zone d’interaction, les corrélations systèmeenvironnement sont délocalisées. Cela confère à la décohérence environnementale
LE MONDE QUANTIQUE
173
(a)
(b)
(c)
Figure 9.3. Molécules utilisées dans les expériences du groupe de Zeilinger et collaborateurs : (a) C70 , (b) C44 H30 N4 , (c) C60 F48 . D’après Arndt et al. (2005), courtoisie d’Anton Zeilinger.
un caractère en pratique irréversible, car il est impossible de ramener l’ensemble - dans la zone d’interaction. Il importe d’éviter deux confusions. Tout d’abord, décohérence et irréversibilité sont parfois liées, mais elles ne sont pas identiques. Prenons par exemple une molécule lourde se propageant dans un gaz dilué de molécules légères, initialement dans un état de superposition de deux positions différentes. Par suite des collisions avec les molécules du gaz, elle perd de l’énergie cinétique et le temps caractéristique de la décroissance de cette énergie est τirr . Cependant, τirr τdec , car il faut un grand nombre de collisions pour ralentir la molécule lourde, alors qu’une seule collision suffit pour la décohérence. En second lieu, il ne faut pas penser que c’est l’environnement qui perturbe le système ; au contraire, c’est le système qui perturbe l’environnement. Comme on le voit dans l’équation (9.6), le système n’a pas changé, c’est l’environnement qui a été modifié. La destruction des interférences en raison des interactions avec l’environnement a été vérifiée dans de nombreuses expériences. L’une des plus faciles à interpréter a été conduite par le groupe d’Anton Zeilinger à Vienne, qui a fait interférer des molécules lourdes de type fullérène (figure 9.3), de poids moléculaire ∼ 1 000, dans des expériences de fentes d’Young (figure 1.9). Bien sûr, il devient de plus en plus difficile d’observer des interférences lorsque la masse des particules augmente, car l’interfrange varie comme λdB /d, où λdB est la longueur d’onde de de Broglie (1.4) des molécules et d la distance entre les fentes. Comme λdB = h/mv , où m et v sont la masse et la vitesse des molécules, l’interfrange décroît comme l’inverse de la masse. On peut remédier en partie à cet inconvénient en utilisant un interféromètre de Talbot Lau où l’interfrange effectif décroît seulement en 1/ m. Cependant, il existe une autre raison qui rend difficile l’observation des interférences, c’est précisément l’interaction des molécules avec leur environnement. Ces molécules lourdes possèdent des centaines de degrés de liberté de rotation et de vibration, qui ne demandent
174
Chapitre 9. L’environnement surveille
Visibilité (normalisée)
Visibilité (normalisée)
é
Pression en
Intensité du laser (W)
Figure 9.4. Brouillage des interférences en raison des collisions et de l’émission de photons. L’axe vertical donne la visibilité (9.2) des franges d’interférence. Figure du haut : influence de la pression. Figure du bas : influence de la température, reliée à l’intensité du laser qui irradie initialement la molécule. D’après Arndt et al. [2005], courtoisie d’Anton Zeilinger.
qu’à interagir avec le milieu extérieur. Les interactions sont principalement l’émission de photons et les collisions avec les particules du gaz résiduel. On obtient soit des états intriqués molécule-photon, soit des états intriqués molécule-particules : le passage de la molécule laisse une empreinte dans l’environnement, et cette empreinte contient une information sur le trajet suivi dans l’interféromètre et donc sur la fente choisie. Les expériences (figure 9.4) confirment la disparition progressive des interférences lorsque la température de la molécule augmente, ou lorsque la pression du gaz résiduel augmente. Dans le premier cas, l’émission de photons de longueur d’onde de plus en plus courte en raison de l’excitation de niveaux élevés permet une meilleure résolution spatiale du chemin suivi : si la longueur d’onde du photon émis est de l’ordre de d, on peut (en principe !) distinguer entre les fentes. Dans le second cas, c’est le mouvement brownien de la molécule induit par les collisions qui détruit les interférences. Dans les deux cas, on peut calculer théoriquement la dégradation de la visibilité des franges, et les résultats du calcul sont en bon accord avec les données expérimentales : c’est bien le mécanisme de décohérence que l’on voit à l’œuvre dans cette expérience. On montre aussi que les deux processus conduisent à la possibilité de localiser partiellement la molécule et, lorsque la localisation est totale, il ne peut bien sûr plus exister d’interférence : le trajet de la molécule est parfaitement connu. Une propriété remarquable de la décohérence est que le temps de décohérence diminue très rapidement lorsque la taille de l’objet observé augmente, car le nombre de degrés de liberté susceptibles d’interagir avec l’environnement croît rapidement avec cette taille. Ainsi, pour un objet macroscopique ou même mésoscopique, ce temps est si court que la décohérence est inobservable en pratique, sauf dans des expériences très soigneusement contrôlées comme celles menées par le groupe de
LE MONDE QUANTIQUE
175
Serge Haroche à l’ENS, capables de surprendre la décohérence en flagrant délit. Cette propriété est confirmée par des modèles semi-réalistes où le temps de décohérence diminue typiquement comme l’inverse du carré de la taille des objets : les superpositions linéaires d’états macroscopiquement discernables sont détruites quasiinstantanément. Ce que l’on doit retenir des expériences sur la décohérence, c’est qu’un objet n’est pas « intrinsèquement quantique » ou « intrinsèquement classique ». Selon son environnement, un même objet, par exemple une molécule lourde, exhibe un comportement quantique (interférence), ou un comportement classique (absence d’interférence). Les objets macroscopiques, et même mésoscopiques, présentent un comportement classique car ils possèdent un nombre énorme de degrés de liberté interagissant avec leur environnement et leur temps de décohérence est tellement court qu’il est complètement inaccessible. Cependant, la théorie ne prévoit aucune limite supérieure de taille ou de complexité pour un objet physique, limite au-delà de laquelle les effets quantiques (superposition ou cohérence) ne seraient plus présents, et il est tout à fait concevable que l’on observe un jour des interférences avec des protéines ou des virus, pourvu que les expérimentateurs soient capables de contrôler strictement l’environnement. On a fabriqué récemment des circuits supraconducteurs dont les dimensions (mésoscopiques) sont de l’ordre du μm, où un courant électrique peut se trouver dans un état quantique de superposition linéaire d’un courant circulant dans un sens et d’un courant circulant dans le sens opposé : un tel état est un exemple de superposition linéaire de deux états macroscopiquement discernables (figure 9.5). Ces qubits
Figure 9.5. Un qubit supraconducteur. Courtoisie de Hans Mooij.
176
Chapitre 9. L’environnement surveille
supraconducteurs sont de véritables atomes de taille mésoscopique si bien qu’ils possèdent un spectre de niveaux d’énergie tout comme un atome ordinaire. D’autres dispositifs mésoscopiques présentant un comportement quantique sont envisagés et seront certainement réalisés expérimentalement d’ici quelques années : dispositifs nanomécaniques exhibant un spectre de niveaux d’énergie, ou intrication d’un photon et d’un miroir comprenant ∼ 1015 atomes. En conclusion, l’état actuel de la théorie quantique ne permet pas de prédire de façon naturelle une frontière entre un monde quantique et un monde classique. 3
Bibliographie
Grand public. S. Haroche, J.-M. Raimond et M. Brune, « Le chat de Schrödinger se prête à l’expérience », dossiers La Recherche, n◦ 18, p. 76 (2005) ; M. Brune, « La frontière classique-quantique », Pour la Science, décembre 2008, p. 106 ; H. Ollivier et Ph. Pajot, La décohérence livrera-t-elle tous ses secrets ?, dossiers La Recherche, n◦ 29, p. 22. Niveau avancé. S. Haroche et J.-M. Raimond, Exploring the quantum, Oxford University Press, Oxford (2006) ; M. Schlosshauer, Decoherence and the quantum-toclassical transition, Springer-Verlag, Berlin (2007). Les expériences du groupe de A. Zeilinger sont résumées dans M. Arndt, K. Hornberger and A. Zeilinger, « Probing the limits of the quantum world », Physics World, 18, March 2005, p. 35, et celles du groupe de S. Haroche dans M. Brune, E. Hagley, J. Dreyer, X. Maître, A. Maali, C. Wunderlich, J.-M. Raimond and S. Haroche, « Observing the progressive decoherence of the « meter » in a quantum measurement », Phys. Rev. Lett., 77, 4887 (1996).
LE MONDE QUANTIQUE
177
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
10 Interprétations Si l’efficacité pratique de la physique quantique n’est mise en doute par personne, il subsiste de sérieuses interrogations sur sa signification. Comme le dit fort justement Valerio Scarani : « Nous ne sommes pas à l’aise avec le principe d’indiscernabilité (i.e. de superposition) et certaines de ses conséquences. » En effet, ce principe, omniprésent dans le monde quantique, est en contradiction flagrante avec notre expérience courante. Depuis les tous débuts de la mécanique quantique, un certain nombre de physiciens – mais pas la majorité d’entre eux ! – se sont posé la question de son « interprétation » afin d’essayer de répondre à la question : pourquoi le principe de superposition est-il absent de notre vie quotidienne ? On peut tout simplement nier qu’il y ait un problème : selon les partisans de l’interprétation minimaliste, la mécanique quantique se suffit à elle-même, elle n’a besoin d’aucune interprétation. L’attitude majoritaire, celle de l’interprétation de Copenhague sera exposée dans la section 10.1. Au cœur du problème se trouve le statut du vecteur d’état introduit au chapitre précédent pour décrire un système quantique, qui n’est qu’une représentation symbolique pour l’interprétation de Copenhague. À l’inverse, on peut, implicitement ou explicitement, attacher une « réalité externe » à ce vecteur d’état, c’est-à-dire une correspondance avec la réalité physique du système. Dans ce cas, c’est le problème de la mesure qui occupe le devant de la scène. En 1932, von Neumann fut le premier à proposer une approche globale, en essayant de bâtir une théorie purement quantique de la mesure, examinée dans la section 10.2. Cette théorie sous-tend toujours les approches modernes, dont celle fondée sur la décohérence ou le caractère macroscopique de l’appareil de mesure (section 10.3). Enfin il existe des interprétations non standard, comme l’interprétation multi-mondes d’Everett ou les théories de variables cachées à la de Broglie-Bohm (section 10.4).
Encadré 10.1. Réalité externe.
D’un point de vue philosophique, le concept de « réalité » doit bien sûr être manié avec une extrême précaution. N’ayant aucune compétence philosophique, je ne m’aventurerai pas sur ce terrain. La « réalité » dont je parle est celle du réalisme naïf des physiciens : un monde extérieur qui existe indépendamment de la description que nous en donnons et des observations que nous effectuons sur lui.
1
L’interprétation de Copenhague
En physique classique, l’état d’un système est essentiellement une liste de ses propriétés : position et vitesse pour une particule, amplitudes du champ électrique et du champ magnétique pour un champ électromagnétique, etc. qui sont des collections de nombres. La dynamique spécifie la façon dont ces propriétés évoluent au cours du temps suivant une loi d’évolution déterministe : la donnée des conditions initiales et des interactions fixent sans ambiguïté l’évolution ultérieure. Bien entendu, il s’agit là d’un énoncé de principe : la difficulté de trouver une solution aux équations du mouvement ou le caractère éventuellement chaotique de ces équations limitent la valeur pratique de cet énoncé. On peut visualiser cette évolution dans l’espace-temps et il n’y a pas de distinction entre la liste des propriétés et la réalité externe attachée au système. Au contraire, la théorie quantique permet seulement, étant donné des conditions initiales, de prédire la probabilité d’observer tel ou tel résultat. De plus, la réfutation expérimentale de la conjonction séparabilité/localité pour un système quantique (section 3.4) montre que l’on ne peut pas visualiser l’évolution d’un tel système dans l’espace-temps. Ces deux caractéristiques de la théorie quantique conduisent à se poser la question du statut du vecteur d’état, notion introduite dans la section 9.2. Est-ce un simple catalogue enregistrant les manipulations infligées au système par un expérimentateur, souvent appelé observateur dans ce contexte, ou bien ce vecteur d’état décrit-il une réalité externe attachée au système ? Ce choix est au cœur des problèmes d’interprétation de la mécanique quantique. Est-il indispensable, utile ou totalement superflu de s’intéresser aux problèmes d’interprétation ? La position minimaliste choisit sans ambiguïté la troisième option : elle affirme que la physique quantique se suffit à elle-même. D’après Christopher Fuchs et Asher Peres : « Quantum mechanics needs no interpretation » la mécanique quantique n’a pas besoin d’interprétation. Selon cette position, la seule chose que l’on puisse exiger de la théorie est que celle-ci calcule correctement les probabilités dans le cadre du schéma général d’une expérience menée avec des objets quantiques, schéma que nous résumons brièvement : en premier lieu, une procédure de préparation permet d’obtenir un ensemble d’objets quantiques tous dans le même état. Il s’ensuit une évolution quantique et, après un certain temps, on effectue une mesure sur l’état final. Il s’agit donc de répéter les mêmes mesures sur une série d’objets
180
Chapitre 10. Interprétations
quantiques, tous préparés dans des conditions identiques. Par exemple, si l’on veut étudier la polarisation de photons, un polariseur comme celui de la figure 2.1 sélectionne un ensemble de photons tous dans un état de polarisation verticale. Après avoir manipulé ces photons, on analyse leur polarisation finale à l’aide d’un prisme de Wollaston suivi de deux détecteurs (figure 2.2). Dans des cas plus complexes, on peut utiliser des « prismes de Wollaston à plusieurs voies » (figure 11.8). La théorie permet en principe de calculer la probabilité Prob(Di ) que le détecteur Di de la figure 11.8 (annexe A4.1) soit déclenché, et si l’on a préparé une série de N états identiques, le nombre de clics du détecteur Di sera en moyenne N × Prob(Di ). Il est important d’observer, par exemple dans le cas de la figure 3.2, que la mesure est terminée pour un photon particulier de l’ensemble uniquement lorsque le détecteur a enregistré ce photon, et non pas dès que le photon a emprunté un des deux trajets après passage dans le prisme : un phénomène quantique ne peut être considéré comme tel que lorsqu’il a été enregistré. Selon la phrase déjà citée de John A. Wheeler : « No elementary phenomenon is a phenomenon until it is a registered phenomenon. » La pertinence de cet énoncé est particulièrement manifeste dans l’expérience à choix retardé (section 1.7). Dans l’interprétation minimaliste, les concepts de la théorie quantique (amplitudes de probabilité, vecteurs d’état. . .) ne sont que des outils de calcul et ne représentent aucune réalité externe ; le vecteur d’état ne représente rien d’autre que la procédure de préparation. La théorie ne s’applique qu’à des ensembles et pas à des systèmes quantiques individuels. Ce point de vue, parfois attribué à Einstein qui considérait de toute façon la théorie quantique comme incomplète, était assez naturel lorsque l’on ne savait manipuler expérimentalement que des ensembles d’objets quantiques : le caractère probabiliste pouvait raisonnablement être attribué à la nécessité d’expérimenter sur des ensembles, par exemple un ensemble de plusieurs milliards d’atomes d’une vapeur de sodium enfermée dans un tube de verre. Il devient difficile à soutenir aujourd’hui : comment ne pas prendre explicitement en considération l’état individuel d’un ion piégé unique que l’on peut observer pendant des heures effectuant des transitions entre différents niveaux d’énergie ? Cependant cet argument, s’il montre que la position minimaliste n’est pas très naturelle dans cette situation, ne permet pas de la rejeter définitivement. En effet, on peut interpréter une série d’observations sur un ion unique comme une suite de mesures effectuées sur des états quantiques identiques. L’interprétation de Copenhague, élaborée entre 1925 et 1927 principalement par Bohr et Heisenberg, applique la théorie quantique à des systèmes individuels, et non à des ensembles. Initialement, elle repose sur deux piliers : les inégalités de Heisenberg (§ 5.3) et la complémentarité. Dans sa version la plus élémentaire, la complémentarité affirme qu’une expérience peut soit mettre en évidence le caractère particulaire (ou corpusculaire) d’un objet quantique, soit son caractère ondulatoire,
LE MONDE QUANTIQUE
181
mais pas les deux à la fois : les aspects ondulatoire et particulaire sont dits complémentaires. Cependant, (i) l’interféromètre de la section 1.4 exhibe un cas de figure qui dépend des deux caractéristiques (clics des détecteurs localisés et interférence) et (ii) le montage décrit dans la section 9.1 montre que l’on peut passer continûment de l’aspect particule (absence d’interférence) à l’aspect onde (interférence), ce qui se comprend grâce à l’intrication entre les degrés de liberté spatiaux et de polarisation du photon. Bien que la complémentarité soit toujours incluse dans nombre d’exposés récents, il semble que sous cette forme le concept n’ait plus guère d’intérêt aujourd’hui. Enfin, selon Bohr et Heisenberg, le caractère probabiliste vient de ce qu’au moment de la mesure, l’objet quantique interagit avec un appareil macroscopique qui le perturbe de façon aléatoire et incontrôlable : c’est la célèbre « perturbation incontrôlable au moment de la mesure » que l’on trouve encore citée dans nombre de manuels. Les résultats des mesures doivent être exprimés en termes classiques, les seuls qui puissent être transmis de façon intelligible. Bohr et Heisenberg diffèrent sur le rôle de l’observateur auquel Heisenberg, contrairement à Bohr, attribue un rôle central. Encadré 10.2. Interprétation de Copenhague.
Il n’existe pas de version canonique de cette interpétation. La position de Bohr a évolué au cours du temps, et elle différait notablement sur certains points de celle de Heisenberg. En exagérant un peu, on peut dire que chaque physicien intéressé par le sujet définit sa propre version de l’interprétation de Copenhague. Entrer dans le détail nécessiterait donc plusieurs centaines de pages.
En 1935, l’article EPR (chapitre 3) conduisit Bohr à réviser sa position en profondeur. En effet, Einstein, Podolsky et Rosen soulignaient que l’on pouvait parfaitement mesurer une propriété physique d’un objet quantique sans aucunement interagir avec celui-ci : dans le processus de mesure, la perturbation ne jouait donc pas un rôle fondamental. Cette absence de perturbation est également mise en évidence dans l’expérience décrite au chapitre précédent, où le trajet du photon est déterminé grâce à sa polarisation, sans aucunement perturber la trajectoire dans l’espace ; d’autres exemples de mesure sans perturbation, ou mesures non destructrices (section 10.2) ont été proposés récemment et même réalisés expérimentalement pour certains d’entre eux. Ce point n’est pas contesté par Bohr dont la réponse prend pour cible la notion « d’élément de réalité » introduite par Einstein et ses collaborateurs, ainsi que leur affirmation du caractère incomplet de la mécanique quantique exposée dans la section 3.4. De plus, Bohr profite de cette réponse pour préciser son interprétation de la théorie quantique. L’article de Bohr est difficile à lire et j’ai essayé de réorganiser sa présentation en espérant ne pas en avoir (trop) déformé l’argumentation. En premier lieu, Bohr
182
Chapitre 10. Interprétations
réaffirme que l’appareillage servant à expérimenter sur des phénomènes quantiques doit être décrit en termes classiques, car seul un vocabulaire utilisant des termes définis en physique classique peut nous permettre de communiquer à d’éventuels interlocuteurs ce que nous avons fait. Par exemple, nous pouvons leur communiquer les positions des détecteurs qui ont enregistré des photons avec leur temps d’arrivée. Cela n’entraîne pas nécessairement que l’appareillage lui-même fonctionne suivant les principes de la physique classique : nous reviendrons ultérieurement sur ce point délicat. Nous avons déjà rencontré le deuxième point de Bohr à propos de l’interprétation minimaliste : un phénomène quantique ne peut être considéré comme tel que lorsque l’expérience est terminée, que ses résultats ont été enregistrés grâce à des processus irréversibles, sans possibilité de retour en arrière, et peuvent être communiqués, nous l’avons vu, en termes classiques. Encadré 10.3. Éléments de réalité.
Selon Einstein, Podolsky et Rosen, si nous pouvons prévoir la valeur d’une quantité physique attachée à un système sans aucunement interagir avec lui, alors il existe un élément de réalité attaché à cette quantité physique qui doit avoir sa place dans la description théorique. Le point de vue EPR repose implicitement sur la séparabilité, c’est-à-dire, dans une expérience de type EPR, la possibilité d’attribuer des propriétés aux deux sous-systèmes (les deux photons du chapitre 3), lorsque ceux-ci ont cessé d’interagir et ne peuvent plus communiquer.
Il en résulte, et c’est le troisième point, que les propriétés d’un système quantique sont indissociables de la configuration expérimentale utilisée pour l’observer. Ce troisième point est au cœur de la réponse de Bohr : la notion « d’élément de réalité » telle qu’introduite par EPR ne fait pas partie du cadre conceptuel de la théorie quantique, car les conditions expérimentales constituent un élément inhérent de la description de tout phénomène auquel on peut attacher le terme « réalité physique ». La notion de « réalité physique » d’un système quantique ne peut être dissociée de l’appareillage macroscopique utilisé pour l’observer, et on ne peut pas faire comme si cette réalité avait une existence indépendante de celui-ci. Pour Bohr, il n’existe pas de propriétés intrinsèques d’un système quantique, et notre représentation de son état quantique par un vecteur d’état ne peut donc être qu’une représentation symbolique, qui ne correspond à aucune réalité externe. Afin d’illustrer l’argument, reprenons la figure 3.2, où Alice et Bob mesurent la polarisation de leur photon respectif issu d’une paire produite à la source S. Pour mesurer la polarisation, Alice et Bob peuvent par exemple utiliser tous deux la configuration (ou base, voir § 2.3.1) {V H}, ou bien la configuration incompatible {DA}. Les deux expériences s’excluent mutuellement et, selon Bohr, les photons se propageant vers Alice et Bob depuis la source S ne correspondent simplement pas à la même réalité physique dans les deux cas : il n’existe pas de réalité intrinsèque pour les deux photons.
LE MONDE QUANTIQUE
183
Enfin, et c’est le quatrième point, le concept de complémentarité repose sur la notion de configurations expérimentales mutuellement exclusives. Les deux configurations expérimentales ci-dessus donnent un exemple de configurations complémentaires : les photons polarisés {V H} ou {DA} apparaissent dans des configurations expérimentales mutuellement exclusives. Dans toute situation concrète, des configurations expérimentales mutuellement exclusives, ou complémentaires, permettent une description complète et non ambiguë de l’ensemble des phénomènes quantiques en des termes classiques. Ainsi définie, la complémentarité est le fondement du caractère exhaustif de la description quantique et la critique par EPR de son caractère incomplet n’est pas fondée. J’ajouterai qu’il n’y a aucun problème avec la localité car c’est seulement après avoir effectué leurs mesures qu’Alice et Bob peuvent se rencontrer et constater que leurs résultats sont corrélés : c’est uniquement le formalisme de la théorie quantique qui est non local. Le point de vue de Bohr impose de tracer une ligne de démarcation entre le système quantique à étudier et le dispositif expérimental. Cette nécessité de distinguer de façon nette entre l’appareil de mesure et le système étudié constitue selon Bohr la différence principale entre physique quantique et physique classique. En effet, dans cette dernière, cette distinction n’existe pas : la description d’un système classique est « intrinsèque », elle ne dépend pas de l’environnement expérimental. Il n’est pas a priori nécessaire que le système quantique soit microscopique et l’appareil macroscopique, il ne s’agit donc pas obligatoirement d’une frontière classique/quantique et il se pourrait que l’appareil de mesure ait une partie microscopique. Il existe selon Bohr une « zone tampon » où les descriptions classique et quantique se recouvrent. Cependant, la nécessité logique de faire une distinction de principe entre objet quantique étudié et appareil de mesure ne peut pas être formalisée : nous l’avons vu au chapitre précédent, la question de la limite classique du monde quantique est loin d’être comprise et formalisée de façon satisfaisante. Les recherches théoriques et expérimentales de ces trente dernières années montrent au contraire que la notion de zone tampon invoquée par Bohr est une notion qui reste floue et la frontière classique/quantique est un concept mal défini ne découlant pas, au moins aujourd’hui, de la théorie. Si la mesure commence par une interaction quantique, où doit-on mettre la frontière qui distingue l’objet à étudier de l’appareil de mesure ? Et en fin de compte on ne peut pas échapper au constat que l’appareil de mesure est fondamentalement régi par des lois quantiques et que sa description classique ne peut être qu’une approximation. On voit mal en pratique comment on pourrait éviter d’imposer par décret une ligne de démarcation entre un monde classique et un monde quantique, et la nécessité de faire appel à cette frontière reste un aspect peu convaincant de la vision de Bohr. Quoi qu’il en soit, les deux points clés de l’interprétation de Copenhague se résument ainsi.
184
Chapitre 10. Interprétations
1. C’est le dispositif expérimental utilisé pour l’observation qui permet de définir un système quantique. Ce dispositif doit être décrit en termes classiques. 2. Les concepts introduits par la théorie quantique : amplitudes de probabilité, vecteurs d’état. . ., ne sont que des outils de calcul, qui ne permettent pas une représentation de l’évolution quantique dans l’espace-temps entre la préparation et la mesure. La description quantique ne correspond à aucune visualisation spatio-temporelle de l’évolution. Une variante aujourd’hui très populaire du point de vue de Bohr repose sur la notion d’information : le vecteur d’état ne décrit pas la réalité d’un objet quantique, mais seulement l’information que nous avons sur cet état. L’argumentation invoquée par les partisans de cette version repose, une fois de plus, sur l’analyse de la section 3.4. Partons du vecteur d’état |Φ〉 intriqué en polarisation de la paire de photons dans la figure 3.2 (équation (11.24) que nous récrivons ici) 1 |Φ〉 = |VA〉|VB 〉 + |HA〉|H B 〉 2
(10.1)
où |V 〉 et |H〉 sont des états de polarisation verticale et horizontale, A et B désignent Alice et Bob. Supposons qu’Alice effectue une mesure de la polarisation de son photon ( ) dans la configuration {V H}, avec le résultat |VA〉. Le vecteur d’état après cette mesure n’est plus |Φ〉 (10.1), mais |ΦV 〉 = |VA〉|VB 〉, ce qui veut dire que le photon arrivant à Bob est polarisé verticalement. Même si Bob est très éloigné d’Alice, le passage de |Φ〉 à |ΦV 〉 se fait instantanément. Or, en l’absence de communication supraluminale, il est impossible que la mesure d’Alice ait pu influencer le photon arrivant à Bob : ce photon, en tant qu’objet physique, ne peut absolument pas avoir été affecté par la mesure. En revanche, l’information que nous avons sur cet état a été modifiée. Avant la mesure d’Alice, le photon qui arrive à Bob est non polarisé : il a une probabilité de 50 % d’être polarisé verticalement ou horizontalement et, quelle que soit la base choisie ({V H} {DA}, circulaire droite et gauche, etc.), tous les états de polarisation sont également probables. Mathématiquement, cet état quantique est décrit, non par un vecteur d’état, mais par un opérateur statistique (ou densité). Avant la mesure d’Alice, le photon de Bob ne possède aucune polarisation. Après cette mesure, il est polarisé verticalement mais Bob n’a aucun moyen de le savoir. Comme le photon arrivant à Bob n’a pas pu être influencé par la mesure d’Alice, on pourrait penser que sa « réalité physique » est restée inchangée et pourtant, pour Alice, il est polarisé verticalement tandis que pour Bob il est non polarisé : les états sont différents parce qu’Alice et Bob possèdent une information différente. Le vecteur d’état n’est pas attaché à la réalité physique du photon mais à l’information que nous avons sur lui. Avec ce point de vue, la notion « d’état quantique inconnu » est un oxymore : un état quantique doit, par définition, être connu de quelqu’un !
LE MONDE QUANTIQUE
185
La théorie de von Neumann
2
Outre le caractère élusif de la frontière appareil/objet d’étude, on peut adresser une autre critique à l’interprétation de Bohr, qui est sans doute la plus sérieuse : elle ne correspond pas à la pratique des physiciens, théoriciens comme expérimentateurs, qui manipulent quotidiennement la physique quantique. En effet ces physiciens, dans leur pratique courante, ne mettent pas en doute, ouvertement ou le plus souvent implicitement, la correspondance entre vecteur d’état et réalité du système quantique étudié. L’interprétation de Bohr, qui fait toujours référence à un dispositif expérimental pour définir un système quantique, constitue un cadre encombrant pour les physiciens qui donnent spontanément une existence propre à un système quantique indépendamment de son observation. Intuitivement au moins, un physicien du LHC (chapitre 7) admettra difficilement que l’état d’un proton circulant dans l’anneau de collision n’a aucune existence propre entre l’injection dans l’accélérateur et l’enregistrement par les détecteurs du produit des collisions. Mais si l’on adopte un point de vue « réaliste » sur le vecteur d’état, c’est alors le problème de la mesure quantique qui devient la source de sérieuses difficultés. Bohr ne se préoccupait pas du détail du processus de mesure : il lui suffisait de savoir qu’une mesure devait présenter deux caractéristiques. 1. Une amplification permettant de traduire un phénomène microscopique en un résultat macroscopique, traditionnellement la position d’une aiguille sur un cadran (pointeur). 2. Un caractère irréversible permettant au résultat de la mesure d’être acquis une fois pour toutes et excluant tout retour en arrière. Rappelons l’exemple du prisme de Wollaston discuté dans la section précédente : tant que le photon n’a pas été enregistré par le détecteur, la mesure n’est pas effectuée. En 1932, von Neumann publie un article fondateur où il établit les bases d’une théorie entièrement quantique de la mesure. Il observe qu’il existe deux types d’évolution en physique quantique. (i) Une évolution de type déterministe, régie par l’équation de Schrödinger (11.34). Une fois la phase de préparation terminée, un état quantique évolue de façon entièrement déterminée par les conditions initiales et les interactions, tout comme le mouvement d’une particule classique est entièrement déterminé par les conditions initiales, position et vitesse, et les interactions (ou forces). Cette évolution est aussi réversible : on peut « remonter le temps ». Étant donné l’état au temps t, on peut en déduire l’état à un temps antérieur t 0 < t. (ii) Une évolution irréversible et non déterministe (probabiliste) au moment de la mesure. Dans la section précédente, nous avons vu un vecteur d’état se
186
Chapitre 10. Interprétations
fonction d’onde aX
aY L DY
DX fonction d’onde
aY
aX L DX
DY
Figure 10.1. Vue d’artiste de la réduction du paquet d’ondes. On a repris le schéma de la figure 1.4, où des photons uniques arrivent sur une lame séparatrice équilibrée. Avant détection, l’amplitude de probabilité (ou la fonction d’onde) est donnée par la figure du haut. Lorsque le détecteur DX a effectué une mesure non destructrice et enregistré le passage d’un photon, la fonction d’onde est transformée : figure du bas. Il ne faut surtout pas penser que ce schéma décrit quelque chose qui se passe réellement dans un laboratoire !
transformer brutalement au moment de la mesure, |Φ〉 → |ΦV 〉 = |VA〉|VB 〉. Cette évolution est probabiliste car, avec une probabilité de 50 %, nous aurions aussi bien pu observer l’évolution |Φ〉 → |ΦH 〉 = |HA〉|H B 〉. Elle est irréversible car nous ne pouvons plus remonter à l’état initial |Φ〉 à partir de |ΦV 〉 ou de |ΦH 〉. Ce second type d’évolution est appelé pour des raisons historiques « réduction du paquet d’ondes » (figure 10.1). Toutefois cette réduction repose sur une hypothèse technique implicite : la mesure doit être non destructrice, c’est-à-dire que la particule quantique mesurée ne doit pas être détruite par la mesure, auquel cas la connaissance de son vecteur d’état ultérieur devient sans objet ! Or, la plupart des mesures courantes sont destructrices. Par exemple, si nous revenons au schéma de la figure 1.4, un photon unique déclenche l’un des deux détecteurs avec une probabilité de 50 %, mais il sera absorbé par le détecteur et n’est plus disponible pour des expériences ultérieures. C’est pourquoi nous avons supposé dans la figure 10.1 une mesure non destructrice. Il est possible aujourd’hui d’effectuer des mesures non destructrices dans des expériences sophistiquées, et donc de se placer dans des conditions où la réduction du paquet d’ondes est un concept pertinent. Toutefois, on montre
LE MONDE QUANTIQUE
187
que cette réduction est alors équivalente à la règle de Born (règle 2 du § 1.6.2 et annexe A4.1) : si l’on effectue des mesures successives, les corrélations entre ces mesures peuvent être calculées soit à partir de la règle de Born, soit à partir du schéma de von Neumann avec des résultats identiques. Le schéma de la réduction du paquet d’ondes n’est en fait qu’une reformulation commode des règles de base. Enfin, pour les tenants de l’interprétation « vecteur d’état = information », il est clair que la réduction du paquet d’ondes ne peut être en aucun cas un processus physique se passant dans un laboratoire, mais seulement la description de la modification d’une information que nous avons sur l’état. La version de la « mécanique » quantique reposant sur les postulats d’évolution (i) et (ii) est celle que l’on trouve dans la plupart des manuels, et elle est souvent appelée interprétation standard ou orthodoxe. Encadré 10.4. Réduction du paquet d’ondes et interpétation de Bohr.
Contrairement à une opinion largement répandue, la réduction du paquet d’ondes ne fait pas partie de l’interprétation de Copenhague, du moins dans la version de Bohr. Cette réduction du paquet d’ondes n’a évidemment aucun sens dans l’interprétation minimaliste, qui raisonne uniquement sur des ensembles. Les (excellents) livres de Leslie Ballentine et de Asher Peres (qui est bohrien) sont deux exceptions notables qui échappent à l’orthodoxie des manuels.
Le fait d’avoir recours à deux types d’évolution n’est pas très satisfaisant : en effet, on peut observer que si la théorie quantique est universellement valable, l’appareil de mesure et l’objet étudié sont tous deux régis par une évolution de type (i). Pourtant la mise en contact de l’appareil et de l’objet se traduit par une évolution probabiliste de type (ii), ce que l’on peut considérer comme une contradiction interne de ce schéma. C’est pourquoi von Neumann proposa de renvoyer le plus loin possible l’évolution déterministe de type (i). Il suppose que le système à mesurer interagit de façon quantique avec l’appareil de mesure . Initialement le système est dans l’état |Si 〉 et l’appareil dans un état neutre |A0 〉 : l’état initial global est donc le produit |Φi 〉 = |Si 〉|A0 〉. Une interaction quantique transforme |Φi 〉 en |Ψi 〉 = |Si 〉|Ai 〉, où les états |Ai 〉 et |A j 〉 peuvent être distingués sans ambiguïté lorsque i = j. Mathématiquement, ces états sont orthogonaux pour i = j : 〈Ai |A j 〉 = δi j . L’appareil constitue donc un pointeur pour la mesure de . L’état |Ai 〉 dans lequel se trouve l’appareil peut être identifié à la position d’une aiguille sur un cadran : l’aiguille du cadran pointe dans la « direction » |Ai 〉 et la lecture du cadran permet de remonter à l’état |Si 〉 de . Tout semble donc se passer pour le mieux, mais il y a un problème : supposons que le système soit dans une superposition |S〉 d’états |Si 〉 avec des poids ci |S〉 =
i
188
ci |Si 〉
|ci |2 = 1.
(10.2)
i
Chapitre 10. Interprétations
Alors, par linéarité de la théorie quantique, l’état final global + est ci |Si 〉|Ai 〉 |Ψ〉 =
(10.3)
i
c’est-à-dire un état intriqué. La lecture de l’appareil donne bien le résultat |Si 〉 avec la probabilité |ci |2 , ce qui est conforme à la règle de Born. Mais dans l’état (10.3), aucune mesure n’a été effectuée : nous avons toujours une superposition quantique, qui contient seulement une potentialité de résultats, et pas les résultats eux-mêmes. De plus, si l’appareil de mesure est macroscopique, l’équation (10.3) décrit une superposition d’états macroscopiquement discernables, que l’on appelle un chat de Schrödinger. Cette dénomination vient d’une situation imaginée par Schrödinger en 1935 afin d’en souligner l’absurdité, et est parfois appelée paradoxe du chat de Schrödinger. Un chat est enfermé dans une boîte contenant aussi un noyau atomique radioactif, qui se désintègre en moyenne au bout d’une heure. Si le noyau se désintègre, un dispositif diabolique tue le malheureux chat : une particule émise dans la désintégration déclenche un compteur, lui-même connecté à un marteau qui brise une fiole contenant un gaz instantanément mortel. L’état du chat est intriqué avec celui de l’atome comme dans (10.3) et, au bout d’une heure, l’état quantique est une superposition à poids égaux de l’atome non désintégré |AT OM E〉 et du chat vivant |C HAT 〉, et de l’atome désintégré |atome〉 et du chat mort |chat〉 1 |Ψ〉 = (|AT OM E〉|C HAT 〉 + |atome〉|chat〉). 2 La théorie de von Neumann a pour conséquence inévitable que l’on doit traiter les appareils macroscopiques comme des objets quantiques, avec des états de superposition qui semblent a priori absurdes et qui n’ont jamais été observés. En résumé, la théorie de von Neumann doit faire face à deux problèmes : (i) l’équation (10.3) ne décrit pas une mesure effectivement réalisée, mais seulement une pré-mesure et (ii) la théorie introduit inévitablement des superpositions d’états macroscopiquement discernables. Encadré 10.5. Interprétation minimaliste et chat de Schrödinger.
Pour un tenant de l’interprétation minimaliste, il n’y a strictement aucun problème (sauf peutêtre avec la Société protectrice des animaux !) L’expérience est faite sur un grand nombre (ensemble) de chats et, au bout d’une heure, la moitié des chats sont vivants et la moitié sont morts. La théorie quantique calcule correctement la probabilité de chaque éventualité, et c’est tout ce que l’on peut lui demander. Cela n’a aucun sens de se poser la question du sort du chat numéro 36. Le paradoxe apparaît uniquement quand on applique la théorie quantique à des systèmes individuels avec une interprétation réaliste du vecteur d’état.
LE MONDE QUANTIQUE
189
C’est à ce point que von Neumann fait intervenir l’observateur. C’est la lecture de l’appareil par l’observateur qui inscrit de façon indélébile le résultat de la mesure dans son cerveau, et c’est alors que se passe le processus d’enregistrement irréversible de la mesure. Cet aspect de la théorie de von Neumann n’est plus pris au sérieux aujourd’hui, ne serait-ce que parce que l’enregistrement des clics des détecteurs se fait de façon automatique avec pilotage par un ordinateur et les cerveaux humains n’interviennent que bien après que les résultats ont été enregistrés de façon irréversible. L’observation n’intervient que dans la lecture de l’écran ou des listings, bien après que l’événement a été enregistré de façon irréversible par un détecteur. De même, le décès (éventuel) du chat de Schrödinger ne se produit pas au moment où l’observateur ouvre la boîte, mais au moment où le détecteur enregistre de façon irréversible la particule émise dans la désintégration de l’atome et déclenche le dispositif diabolique. Cependant, la première partie de la théorie de von Neumann, celle qui conduit à l’équation (10.3), reste aujourd’hui la base des approches modernes.
3
L’appareil de mesure est macroscopique
La réduction du paquet d’ondes est une caractéristique peu satisfaisante de la théorie de von Neumann dont on aimerait se débarrasser en ne conservant que l’évolution déterministe (équation de Schrödinger). La théorie de von Neumann ne donne aucune précision sur l’appareil de mesure, en dehors du fait qu’il est régi par les lois quantiques. Cependant, même si le processus de mesure commence par une interaction microscopique entre le système à mesurer et l’appareil , le caractère macroscopique de l’appareil pourrait jouer un rôle majeur. Landau et Lifschitz (Landau était intellectuellement très proche de Bohr), qui adoptent initialement le point de vue de von Neumann, « résolvent » le problème en imposant par décret l’unicité de l’état de l’appareil : « Le caractère classique de l’appareil de mesure s’exprime dans le fait que, à chaque instant, on peut affirmer avec certitude qu’il se trouve dans un état connu », ce qui revient au fond au point de vue de Bohr, car le caractère classique de l’appareil joue un rôle fondamental. Par conséquent le résultat de la mesure, en correspondance bi-univoque avec l’état de l’appareil, est défini et unique (unicité du résultat) : dans l’équation (10.3), l’appareil est dans un état unique |Ai 〉, et pas dans une superposition de ces états. Il existe deux grandes classes de modèles qui essaient d’exploiter le caractère macroscopique de l’appareil tout en restant dans le cadre quantique, sans imposer un décret à la Landau-Lifschitz.
190
Chapitre 10. Interprétations
1. Les modèles fondés sur la décohérence (chapitre 9). 2. Les modèles qui exploitent directement le grand nombre de degrés de liberté de l’appareil. Les modèles fondés sur la décohérence sont aujourd’hui les plus populaires et je commencerai par eux. L’appareil de mesure macroscopique possède un nombre énorme de degrés de liberté – énormément plus grand que celui des fullérènes du chapitre 9 –, et ces degrés de liberté ne demandent qu’à interagir avec ceux de l’environnement : molécules de l’air, vibrations des composants, etc. Soulignons le fait que la décohérence se place dans le cadre strict de l’évolution déterministe et réversible, c’est-à-dire le cas (i) du schéma de von Neumann. La description qui va suivre est schématique et il existe des modèles bien plus sophistiqués, qui cependant reposent tous sur la même stratégie. L’approche de von Neumann est généralisée en plaçant l’appareil dans un environnement traité quantiquement et dont les états sont notés |Ei 〉. L’état global du système composé + + est initialement ci |Si 〉 |A0 〉|E0 〉 |Φ〉 = i
où |A0 〉 est comme précédemment l’état « neutre » de l’appareil et |E0 〉 l’état initial de l’environnement. Afin de simplifier (mais ce n’est pas essentiel), on suppose que l’interaction se produit en premier ci |Si 〉|Ai 〉 |E0 〉. |Φ〉 → |Φ 〉 = i
Le modèle est construit de telle sorte que l’interaction ait un effet analogue à celle de dans la section précédente |Ai 〉|E0 〉 → |Ai 〉|Ei 〉. Une fois l’interaction terminée, l’état global |Ψ〉 est ci |Si 〉|Ai 〉|Ei 〉. |Ψ〉 =
(10.4)
i
Nous sommes à nouveau dans la situation du chapitre 9 : si les états |Ei 〉 sont discernables, c’est-à-dire orthogonaux, 〈Ei |E j 〉 = δi j , alors on observera l’appareil dans l’état |Ai 〉 avec une probabilité |ci |2 . Comme dans le cas de l’interféromètre avec photons polarisés verticalement dans un bras ethorizontalement dans l’autre, la cohérence contenue dans la superposition (10.3) i ci |Si 〉|Ai 〉 a disparu, et il en est de même des interférences désastreuses entre états macroscopiquement discernables
LE MONDE QUANTIQUE
191
de l’appareil, ou chats de Schrödinger. Les cohérences contenues dans la superposition linéaire (10.4) sont distribuées sur un grand nombre de degrés de liberté de l’environnement, ce qui rend de fait le processus irréversible, même si l’évolution du vecteur d’état global |Ψ〉 est toujours réversible. Les corrélations quantiques du système ont été tranférées à l’environnement et une observation limitée à révèlera que les interférences sont absentes. De plus, seuls les états qui sont stables par interaction avec l’environnement, c’est-à-dire qui ne s’intriquent pas avec celui-ci, peuvent apparaître dans la superposition (10.4). Ces états forment une base privilégiée (par la décohérence) car ils résistent à la décohérence, et on les appelle aussi états classiques. Dans de nombreux exemples, les états localisés en position sont des états classiques et, en optique quantique, les états appelés cohérents sont aussi de ce type ; ils sont d’ailleurs souvent appelés états classiques du champ électromagnétique. Peut-on en conclure qu’il n’y a plus de chat de Schrödinger, que l’appareil se trouve dans un état déterminé et que le problème de la mesure quantique est résolu ? Malheureusement, ce n’est pas le cas ; cependant le lecteur doit être prévenu que cet énoncé fait débat, et des énoncés différents sont faciles à trouver dans la littérature. C’est la notion « d’observation de » qui est cruciale. Revenons en effet à l’exemple de l’interféromètre avec photons polarisés : tant que le photon n’a pas été enregistré par un détecteur (= observé), on ne peut pas dire qu’il a choisi un des deux trajets. En effet, l’intrication de la propagation avec la polarisation ne suffit pas à déterminer le trajet. Cette détermination n’est effectuée qu’une fois le photon enregistré. Quand on passe d’un objet quantique microscopique (le photon) à un objet quantique macroscopique (l’appareil), les règles de la théorie quantique n’ont pas changé : ce point a été souligné avec force par Anthony Leggett, et l’intrication avec l’environnement ne peut à elle seule forcer l’appareil de mesure à adopter un état défini et unique. Le fait que l’environnement soit d’une très grande complexité ne change rien à l’affaire : tant que l’évolution + + est déterministe, on ne peut pas avoir de résultat défini pour la mesure. L’argument ci-dessus est important, et controversé ! Il est donc utile d’en donner une version équivalente, mais qui en diffère dans le détail. Elle repose sur la distinction entre deux types d’ensembles probabilistes. Dans l’interféromètre de MachZehnder de la section 9.1 avec des détecteurs insensibles à la polarisation, nous savons après détection qu’un photon particulier de l’ensemble des photons envoyés successivement dans l’interféromètre a emprunté de façon certaine un des deux trajets, même si nous ne pouvons pas savoir lequel. Nous sommes en présence d’un mélange statistique classique, où chaque individu de l’ensemble est dans un état bien défini, même si cet état nous reste inconnu : notre unique information est la probabilité qu’un individu particulier soit dans tel ou tel état. Au contraire, tant que le photon n’a pas été détecté, nous pouvons seulement affirmer qu’une détection sensible à la polarisation nous renseignerait sur le trajet suivi, chacun des trajets
192
Chapitre 10. Interprétations
ayant une probabilité de 50 %, mais ce trajet n’a pas d’existence avant la détection. Deux éventualités sont possibles avant détection, le trajet rouge ou le trajet bleu (figure 9.1), mais aucune éventualité n’a été réalisée. Ce second ensemble probabiliste est de type quantique. Ces deux types d’ensembles probabilistes ont été appelés par Bernard d’Espagnat « mélanges statistiques propres » (classiques) et « mélanges statistiques impropres » (quantiques). L’ensemble probabiliste des résultats de la mesure effectuée par et contenue dans l’équation (10.4) quand le dispositif est insensible aux degrés de liberté de l’environnement (les physiciens disent : « quand on prend la trace partielle sur les degrés de liberté de l’environnement ») est du type probabiliste quantique. Par conséquent aucune éventualité, dans ce cas l’aiguille de l’appareil pointant dans une direction bien déterminée, n’a été réalisée. La seconde classe de modèles exploite directement le grand nombre de degrés de liberté de l’appareil. Je décrirai brièvement le modèle de Cini qui, même s’il souffre de défauts rédhibitoires mentionnés ultérieurement, permet d’expliquer simplement l’idée générale. Dans ce modèle, possède deux états discernables |S1 〉 et |S2 〉 et l’appareil est un réservoir contenant un nombre macroscopique N de bosons identiques dans leur état fondamental (section 5.3). Seul l’état |S1 〉 interagit avec , tandis que |S2 〉 reste inchangé. Un boson du réservoir possède un degré de liberté interne (l’analogue d’une polarisation) et peut se trouver dans un état |0〉 ou |1〉. L’état de l’appareil est défini par le nombre (macroscopique) n de bosons dans l’état |0〉. Ce nombre n représente la position de l’aiguille. Initialement, au temps t = 0 lorsque la mesure commence, tous les bosons sont dans l’état |0〉. L’interaction est choisie de telle sorte qu’au temps t le nombre de bosons dans l’état |0〉 soit proche d’une valeur moyenne n(t) avec une dispersion négligeable. La valeur moyenne n(t) est de la forme N × Prob(t), où Prob(t) se calcule explicitement. Si est au départ dans l’état c1 |S1 〉 + c2 |S2 〉, le vecteur d’état + est alors au temps t |ΨSA(t)〉 = c1 |S1 〉 |n(t)〉 + c2 |S2 〉 |N 〉.
(10.5)
Comme les états |N 〉 et |n(t)〉 sont macroscopiquement discernables, c’est à ce point que le caractère macroscopique de l’appareil joue son rôle, car on a mis en correspondance l’état d’un microsystème, , avec celui d’un macrosystème, , et donc effectué une mesure de . Mais on peut faire la même objection que précédemment : aucune éventualité, |S1 〉 |n(t)〉 ou |S2 〉 |N 〉 n’a été réalisée. Le modèle exhibe en outre deux défauts « techniques » dus à sa trop grande simplicité. 1. La probabilité Prob(t) est une fonction oscillante de t. 2. Le temps nécessaire pour l’excitation du détecteur est proportionnel à N , et donc infiniment long pour un appareil macroscopique. Ce type de modèle peut être perfectionné en prenant comme appareil de mesure un système macroscopique dans un état métastable |A0 〉 qu’une perturbation infinitésimale suffit à faire basculer d’un côté plutôt que de l’autre vers un état stable.
LE MONDE QUANTIQUE
193
Un exemple d’état métastable est donné par une bille posée sur un cylindre horizontal : une poussée infinitésimale suffit à la faire tomber d’un côté plutôt que de l’autre. Les deux états stables de l’appareil étant |A1 〉 et |A2 〉, le couplage avec le système microscopique est tel que l’appareil bascule dans l’état |A1 〉 (|A2 〉) si le système est dans l’état |S1 〉 (|S2 〉).
Interprétations non standard
4
La réduction du paquet d’ondes est, nous l’avons vu, l’élément le plus artificiel du formalisme orthodoxe de la théorie quantique. Plusieurs propositions (ou interprétations) ont été avancées pour éviter de l’introduire. Disons d’emblée que toutes ces propositions se heurtent à des difficultés telles qu’elles n’ont pas d’avantage comparatif sur l’interprétation standard. Nous nous limiterons à deux d’entre elles. 1. La théorie de variables cachées proposée initialement par de Broglie et perfectionnée par Bohm. 2. L’interprétation d’Everett et sa variante multi-mondes. La théorie de de Broglie-Bohm (annexe A10.1) introduit deux entités couplées, la particule et la fonction d’onde, qui définissent complètement l’état du système microscopique. Une particule possède toujours une position et une vitesse (ou une impulsion) définies ; néanmoins, la position et l’impulsion mesurées obéissent toujours aux inégalités de Heisenberg (4.3). La position de la particule joue un rôle clé : son évolution est régie par une équation déterministe du type seconde loi de Newton. Cependant, l’énergie potentielle dont on déduit la force ne se réduit pas à celle de la mécanique classique. Il s’y ajoute un potentiel quantique, proportionnel au carré de la constante de Planck, qui s’annule donc à la limite classique h = 0. Ce potentiel quantique est déterminé par la fonction d’onde ψ( r, t) qui dépend de la position r et du temps t et obéit à l’équation de Schrödinger habituelle (11.34). Elle agit sur la particule et détermine sa trajectoire, mais la particule ne réagit pas sur l’onde. Le carré de la fonction d’onde donne la distribution de probabilité de la position d’un ensemble de particules ; la distribution de probabilité des impulsions p se calcule comme en mécanique quantique ordinaire, de sorte que les positions et les impulsions mesurées sur un ensemble de particules obéissent aux inégalités de Heisenberg (4.3). Cependant, cette probabilité est une probabilité d’ignorance de type classique, due à notre connaissance imparfaite de la position de la particule, et non une probabilité intrinsèque de type quantique. La position de la particule est la variable cachée qui peut être mesurée dans une expérience, mais qu’il n’est pas possible de contrôler ou de manipuler, alors qu’il est possible d’agir sur la fonction d’onde en modifiant le potentiel externe. La théorie est réaliste : position et fonction d’onde ont une existence indépendante de toute observation.
194
Chapitre 10. Interprétations
Le potentiel quantique possède une caractéristique essentielle : il est non local, dans le sens où une modification de la fonction d’onde en un point d’espace se répercute instantanément en un autre point. Il est instructif d’examiner une expérience d’interférence du type fentes d’Young (figure 1.9) dans cette théorie. Chaque particule de l’ensemble suit une trajectoire déterminée et passe par l’une des deux fentes. Cela semble contredire la discussion de la section 1.4, selon laquelle l’interférence est détruite lorsque les trajectoires sont déterminées : on peut alors diviser les particules en deux classes, la classe de celles qui sont passées par la fente F1 et pour lesquelles on aurait aussi bien pu fermer la fente F2 , et vice versa. Mais ce raisonnement n’est pas valable dans la théorie de Broglie-Bohm, car le potentiel quantique qui guide la particule n’est pas le même selon qu’une seule fente ou les deux fentes sont ouvertes : la particule passant par la fente F1 est sensible au fait que la fente F2 soit ouverte ou fermée, car l’onde ψ( r, t) n’est pas la même dans les deux cas. Les résultats de l’expérience EPR avec des particules non relativistes sont parfaitement expliqués par cette théorie, au prix toutefois d’un calcul plus que laborieux. Ce calcul est fait pour des particules de spin 1/2 : le spin, ou moment angulaire (cinétique) propre, est une propriété analogue à la polarisation, et des particules de spin 1/2 ont deux états de spin, par exemple spin en haut et spin en bas, analogues des états de polarisation horizontale et verticale pour les photons. La mesure des spins se fait à l’aide d’aimants qui dévient les particules selon leur état de spin, et jouent le même rôle que des prismes de Wollaston. C’est la non-localité qui permet à la théorie d’être en accord avec les prévisions de la mécanique quantique : lorsque le spin d’Alice est dévié par un aimant, cette déviation exerce instantanément une influence sur le spin de Bob et lui fait choisir une trajectoire avec la même probabilité que celle prévue par la mécanique quantique. Comme nous l’avons vu, la théorie de de Broglie-Bohm est une théorie réaliste : une particule est dotée de propriétés en l’absence d’observation. La réduction du paquet d’ondes découle de la théorie n’a pas à être imposée de façon ad hoc : la mesure ne fait que révéler la position préexistante de la particule. La théorie obéit à la séparabilité : chacune des particules de spin 1/2 dans une expérience de type EPR garde une identité propre, mais elle est non locale. Elle reproduit tous les résultats de la théorie quantique non relativiste, toutefois au prix d’un formalisme très lourd. Elle ne fait aucune prédiction nouvelle et, surtout, ne semble pas posséder de généralisation compatible avec la relativité restreinte. Malgré tout, elle conserve les faveurs d’une minorité active de physiciens. L’interprétation d’Everett (proposée d’abord par Everett et précisée ensuite par Wheeler, d’où la terminologie fréquente : interprétation d’Everett-Wheeler) propose une procédure entièrement différente pour éviter la réduction du paquet d’ondes. Supposons que le vecteur d’état du système à mesurer soit dans l’état de superposition (10.2) |S〉 = i ci |Si 〉. Un observateur – qui n’est pas nécessairement une personne mais peut être un dispositif d’enregistrement automatique – effectue une
LE MONDE QUANTIQUE
195
mesure qui réduit le paquet d’ondes : |S〉 → |Si 〉. Comment apparaît ce processus à un autre observateur qui n’est lié ni à ni à ? Cet observateur attribue à avant la mesure un vecteur d’état |Oinit 〉, et il décrit la mesure à l’aide de l’équation ci |Si 〉|Oinit 〉 → ci |Si 〉|Oi 〉. (10.6) i
i
On remarquera l’analogie formelle avec (10.3) : le second membre de (10.6) définit un état intriqué et |Oi 〉 est l’état de l’observateur qui a obtenu le résultat |Si 〉. Everett interprète (10.6) comme le fait que est dans l’état |Oi 〉 relativement à |Si 〉 : c’est pourquoi cette interprétation est parfois appelée interprétation de l’état relatif. La réduction du paquet d’ondes est valable au niveau subjectif de chaque observateur figurant dans la superposition (10.6) : chaque terme de la superposition décrit un observateur qui a perçu un résultat défini, mais qui est différent pour chaque observateur. La réduction du paquet d’ondes apparaît comme un processus valable subjectivement pour , mais pour l’observateur il n’y a pas de réduction du paquet d’ondes. Cependant, les perceptions par l’observateur représentées par les différents termes de (10.6) étant contradictoires, comment peuvent-elles être simultanément réalisées ? Comme Everett n’a jamais clairement répondu à cette question, plusieurs versions de son interprétation ont été proposées. La plus populaire est celle des mondes multiples de Graham et de Witt. Selon ces auteurs, au moment de la mesure, l’Univers se scinde en de multiples mondes parallèles et, dans chacun de ces Univers, un des termes de la décomposition (10.6) est effectivement réalisé. Chacun des observateurs de ces différents Univers vit dans un monde particulier et il n’a pas accès aux Univers parallèles. Outre des difficultés techniques (par exemple la compatibilité avec la relativité restreinte et la définition de la base privilégiée qui est implicite dans la décomposition (10.6)), cette interprétation se heurte au sens commun : n’est-il pas paradoxal de faire appel à 10100 copies (au moins !) de notre Univers pour résoudre le problème de la réduction du paquet d’ondes, et cette solution n’est-elle pas plus extravagante que la contradiction logique qui existe aujourd’hui dans cette réduction ? Cependant, le caractère audacieux de cette interpétation ne constitue pas une réfutation et, selon un sondage récent, elle est majoritaire chez les cosmologistes, qui sont tout à fait séduits par l’existence d’Univers parallèles.
5
Conclusion
Nous voici au terme de cette visite guidée du monde quantique. J’espère avoir convaincu le lecteur qui m’a suivi jusqu’ici de l’universalité de la théorie quantique et de sa redoutable efficacité pratique. La modification du paysage de la physique
196
Chapitre 10. Interprétations
quantique en 30 ans est spectaculaire : en 1980, le statut expérimental des inégalités de Bell était incertain, il n’existait pas d’atomes froids, de condensats de BoseEinstein, de cryptographie quantique, de diodes laser commercialisées, de dispositifs de vision nocturne dans l’infra-rouge, de matériaux pour l’électronique ou l’optoélectronique entièrement artificiels, etc. Dans les années à venir, on peut s’attendre à des avancées expérimentales spectaculaires qui permettront en particulier d’explorer la frontière entre mondes quantique et classique, et (peut-être) de mieux cerner la signification de la théorie quantique. Il n’existe toujours pas de consensus sur la signification des concepts introduits dans cette théorie mais la fin du siècle dernier a été marquée par une large contestation de l’interprétation jusque-là dominante, celle de Copenhague. Ainsi deux théoriciens de la décohérence, Eric Joos et Maximillian Schlossauer, écrivent : Joos : « Les propriétés classiques ne sont pas des attributs donnés a priori aux objets, mais elles émergent en raison des interactions irréversibles avec l’environnement. De ce point de vue, des concepts traditionnels mais mal définis, comme la dualité onde-particule, les relations d’incertitude de Heisenberg ou le principe de complémentarité apparaissent dépassés. » Schlossauer : « Pour dissiper le brouillard (sous-entendu venant de Copenhague), nous devons considérer que la fonction d’onde est autre chose qu’un simple outil pour calculer des probabilités. » Cependant, des physiciens, et non des moindres, ont récemment réaffirmé leur attachement à l’interpétation de Bohr, par exemple John Wheeler (décédé en 2008), David Mermin ou Anthony Leggett (prix Nobel 2002) : Wheeler : « L’interprétation de Copenhague reste la meilleure interprétation de la mécanique quantique dont nous disposons aujourd’hui. » Mermin : « La reconnaissance que les états quantiques sont des outils de calcul et non des propriétés réelles des systèmes nous permet de formuler les raisons de notre inconfort (vis-à-vis de l’apparente non-localité de la théorie quantique) en termes plus nuancés, moins sensationnels. » Leggett : « L’ensemble du formalisme de la mécanique quantique n’est rien de plus qu’une recette pour calculer des probabilités. » Ces quelques citations montrent que le débat est toujours d’actualité ! La théorie quantique est loin d’être achevée, comme semble l’être la mécanique classique, et ceci est vrai aussi bien de ses développements scientifiques que de son interprétation. Elle promet de rester vivante et productive pour encore longtemps !
LE MONDE QUANTIQUE
197
6
Bibliographie
Grand public. La littérature sur le « problème de la mesure en mécanique quantique » est immense, et je me limiterai à quelques références. Une discussion courte, mais pertinente, est donnée au chapitre 9 du livre de V. Scarani, Initiation à la physique quantique, Vuibert, Paris (2003). Je recommande aussi l’article de M. Tegmark et J. Wheeler, « 100 ans de mystères quantiques », Pour la Science, avril 2001, p. 82. Le site web de « Stanford Encyclopedia of Philosophy », rubrique Quantum Mechanics, donne accès à plusieurs excellents articles, parmi lesquels : J. Barrett, « Everett’s relative state formulation of quantum mechanic » ; A. Fine, « The Einstein Podolsky Rosen argument in quantum mechanics » ; H. Krips, « Measurement in quantum mechanics » ; J. Faye, « The Copenhagen interpretation ». Enfin on trouvera un résumé percutant dans A. Leggett, « The quantum measurement problem », Science, 307, 871 (2005). Niveau avancé. On trouvera deux exposés très complets dans le livre de B. d’Espagnat, Le réel voilé, Fayard, Paris (1993) et celui de M. Bitbol, Mécanique quantique, Flammarion (1999) ; un autre livre excellent est celui de J. Baggott, Beyond measure, Oxford University Press (2004). La théorie de de Broglie/Bohm est exposée par P. Holland, The Quantum Theory of Motion, Cambridge University Press (1993). Le point de vue information est défendu par C. Fuchs Quantum Mechanics as Quantum Information, disponible sur le web, arXiv:quant-ph/0205039. Les deux manuels mentionnés dans le texte, réfractaires à la réduction du paquet d’ondes sont : A. Peres, Quantum Theory, Concepts and Methods, Kluwer, Boston (1993) et L. Ballentine, Quantum Mechanics, World Scientific (1998). Le livre de L. Landau et E. Lifschitz s’intitule Mécanique quantique, Éditions MIR, Moscou (1966).
198
Chapitre 10. Interprétations
11 Annexes Annexe A1.1 Notation exponentielle Les physiciens, tout comme d’autres scientifiques (ou même les économistes) ont besoin de manipuler des nombres très grands ou très petits et, plutôt que d’aligner des séries de zéros, ils utilisent la notation exponentielle. Un exemple familier de grand nombre est la capacité de mémoire informatique : capacité d’un CD, d’un DVD, d’une clé USB ou d’un disque dur. L’unité de base en informatique est le bit, qui peut prendre deux valeurs, conventionnellement 0 ou 1 (chapitre 9). Avec deux bits, on peut représenter 2 × 2 = 4 nombres différents et avec 8 bits 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 28 = 256 nombres. Dans l’équation précédente, 28 (2 à la puissance 8) est une notation exponentielle ; 8 bits forment un octet à la base du codage ASCII. Compte tenu des progrès de l’informatique, un octet est une toute petite unité, et il faut le multiplier par des puissances de 10 pour donner la capacité de mémoire des dispositifs usuels : • 1 kilooctet (ko)= mille octets= 103 octets ; • 1 mégaoctet (Mo) = 1 million d’octets= 106 octets ; • 1 gigaoctet (Go) = 1 milliard d’octets = 109 octets ; • 1 téraoctet (To) = 1 000 milliards d’octets = 1012 octets. Pour un document de quelques pages, il faut quelques ko, un CD stocke environ 700 Mo, un DVD environ 5 Go, et la capacité des disques durs actuels se mesure en To. Les préfixes kilo, méga, etc. sont aussi utilisés pour d’autre unités, par exemple de longueur : kilomètre, mégamètre, ou de puissance : mégawatt, térawatt. La notation exponentielle est aussi commode pour écrire des nombres très petits : ainsi un centième de milliardième, soit 0,000 000 000 01 s’écrit 10−11 ; l’exposant 11
est égal au nombre de zéros situés après la virgule, plus un. De même 0,125 milliardième devient 0,000 000 000 125 = 0,125 × 10−9 = 1,25 × 10−10 . Il est également commode de définir des unités pour le millième (10−3 ), le millionième (10−6 ), le millardième (10−9 ), etc., qui donnent respectivement le milli, le micro, le nano de l’unité considérée. Par exemple, les sous-multiples de l’unité de longueur, le mètre (m) sont : • le millimètre (mm) = 10−3 m ; • le micromètre (μm) = 10−6 m, autrefois appelé micron ; • le nanomètre (nm) = 10−9 m ; • le picomètre (pm) = 10−12 m ; • le femtomètre (fm) = 10−15 m, autrefois appelé fermi. On définirait de même la nanoseconde comme étant 10−9 s, etc. Il est instructif d’utiliser cette notation pour donner dans le tableau ci-dessous des ordres de grandeur de longueurs typiques, en partant de l’Univers pour descendre jusqu’aux particules élémentaires. On retiendra que la taille d’un atome est voisine de 0,1 nanomètre = 10−10 m, une unité appelée autrefois Angström, et que celle d’un noyau atomique est de quelques femtomètres (10−15 m). Univers
Rayon de la
Distance
Rayon de
Homme
Insecte
connu
Galaxie
Terre-Soleil
la Terre
1,3 × 1026
5 × 1020
1,5 × 1011
6,4 × 106
1,7
0,01 à 0,001
bactérie
virus
fullerène
atome
noyau
proton
E. coli
HIV
C 60
de plomb
2 × 10−6
1,1 × 10−7
0,7 × 10−9
10−10
7 × 10−15
0,8 × 10−15
Tab. 11.1. Ordres de grandeur en mètres de quelques distances typiques.
Annexe A1.2 Ondes électromagnétiques et photons Les ondes électromagnétiques vont des ondes radio jusqu’aux ondes de la radioactivité gamma (γ). Comme l’aspect particulaire est particulièrement évident dans ce domaine, on parle en général de photons gamma, et pas d’ondes gamma. En revanche, « photon radio » est plutôt rare ! La longueur d’onde décroît quand on passe des ondes radio aux ondes de la radioactivité gamma, comme on le voit dans la figure 11.1.
200
Chapitre 11. Annexes
0.01 nm
1 nm
100 nm
780 nm
Rayons gamma
Rayons X
Rayons ultraviolets
Infrarouges
1 mm
1 cm
Micro-ondes et radars
1m
1 km
Ondes radio
Lumière visible par l’homme 400 nm
violet
700 nm
indigo
bleu
vert
jaune
orange
rouge
Figure 11.1. Spectre du rayonnement électromagnétique. Les longueurs d’onde les plus courtes sont celles des rayons γ, puis viennent les rayons X et les rayons UV. On passe ensuite dans le domaine visible qui va du violet au rouge. Augmentant encore la longueur d’onde, on entre d’abord dans l’infrarouge, puis dans le domaine des micro-ondes, et enfin dans celui des ondes radio. La longueur d’onde est donnée en nanomètres (nm), 1 nm = 10−9 m. Adapté de « Libération ».
Les ondes lumineuses se propagent dans le vide à la vitesse de la lumière, c = 300 000 000 m/s = 3×108 m/s : il faudrait environ 0,13 s (un peu plus d’un dixième de seconde) à une onde lumineuse pour faire le tour de la Terre. Dans un milieu transparent comme l’eau ou le verre, la vitesse de propagation est réduite à c/n, où n est l’indice optique, ou de réfraction : n 1,3 pour l’eau, n 1,5 pour le verre. Si une onde lumineuse faisait le tour de la Terre dans une fibre optique, il lui faudrait n × 0,13 s, où n est l’indice de la fibre. Les ondes lumineuses sont un cas particulier des ondes électromagnétiques dont le spectre, qui s’étend des rayons γ aux ondes radio, est donné sur les figures 11.1 et 11.2. Une caractéristique importante d’une onde électromagnétique est sa période T . Il est plus habituel de caractériser une onde électromagnétique par sa fréquence ν, qui est l’inverse de la période : ν = 1/T . Cette fréquence est mesurée en hertz (symbole Hz). Par exemple on trouve France Culture à Nice sur une fréquence de 101,9 MHz, ou 101,9 × 106 Hz, ou encore 1,019 × 108 Hz. Une onde se répète périodiquement dans l’espace et la périodicité spatiale est la longueur d’onde λ = cT = c/ν : c’est la distance qui sépare deux crêtes successives d’une onde qui se propage. Les ondes lumineuses ont une longueur d’onde comprise entre λ = 0,4 μm (violet) et λ = 0,7 μm (rouge). Comme dans la figure 11.1, on mesure souvent les longueurs d’onde en nanomètres (nm). Pour
LE MONDE QUANTIQUE
201
108
104
γ
X
10−14
E (eV) 1
UV
10−10
10−4
IR
10−6
micro
10−2
10−8
radio
102
λ (m) Figure 11.2. Longueur d’onde de rayonnements électromagnétiques et énergie des photons correspondants. La boîte hachurée représente le domaine visible. Les frontières entre les différents types de rayonnement (par exemple la frontière entre les rayons γ et les rayons X) ne sont pas définies de façon stricte. Un photon d’énergie E = 1 eV dans le proche infrarouge a une longueur d’onde λ = 1,24 × 10−6 m, une fréquence ν = 2,42 × 1014 Hz et une pulsation ω = 1,52 × 1015 rad.s−1 .
λ < 0,4 μm, on entre dans le domaine de l’ultra-violet (UV) et, pour λ > 0,7 μm, on entre dans l’infra-rouge (IR), voir les figures 11.1 et 11.2. L’énergie E d’un photon correspondant à une onde électromagnétique de longueur d’onde λ est donnée par hc (11.1) E= λ où h est la constante de Planck et c la vitesse de la lumière dans le vide. Plus la longueur d’onde est courte, et plus l’énergie est grande : un photon γ est plus énergique qu’un photon X , qui est lui-même plus énergique qu’un photon ultra-violet, etc. L’énergie s’exprime aussi en fonction de la fréquence ν de l’onde, qui est donnée en fonction de la longueur d’onde par ν = c/λ. L’énergie d’un photon s’écrit donc de façon équivalente sous la forme de Planck-Einstein E = hν = ħ hω
(11.2)
avec ħ h = h/2π et ω = 2πν est la pulsation ou fréquence angulaire (figure 11.2).
Annexe A1.3 Fonctions trigonométriques et nombres complexes Pour définir les fonctions trigonométriques, dessinons un cercle de rayon unité (figure 11.3), et traçons le rayon OM joignant le centre O du cercle à un point M sur
202
Chapitre 11. Annexes
sin θ
|z|
θ
θ O
cos θ
O
M
b
M
(a)
a
(b)
Figure 11.3. (a) Un cercle de rayon unité définit les fonctions sinus et cosinus. (b) Représentation géométrique d’un nombre complexe. Le rayon du cercle est |z|, la partie réelle de z est a = |z| cos θ et sa partie imaginaire b = |z| sin θ .
le cercle. L’angle entre OM et l’axe horizontal OH est θ . Soit OA et OB les projections algébriques sur les axes OH et OV respectivement. Par définition OA = cos θ
OB = sin θ .
Dans le cas de la figure 11.3, cos θ et sin θ sont tous deux positifs, mais ils peuvent être en général de signe quelconque. Le théorème de Pythagore implique que cos2 θ + sin2 θ = 1.
(11.3)
Un nombre complexe z est de la forme z = a + ib où a et b sont deux nombres réels, positifs ou négatifs, et i2 = −1 : a est la partie réelle de z et b sa partie imaginaire. Les règles de calcul sont celles de l’algèbre usuelle : si par exemple z1 = a1 + ib1 et z2 = a2 + ib2 , le produit z1 z2 est donné par z1 z2 = (a1 a2 − b1 b2 ) + i(a1 b2 + a2 b1 ). La valeur absolue de z, aussi appelée module de z est |z| = a2 + b2 .
(11.4)
Il existe une autre écriture utile de |z| : le complexe conjugué de z, noté z ∗ , est défini par z ∗ = a − ib, et (les mathématiciens utilisent la notation z, au lieu de z ∗ ) |z|2 = a2 + b2 = (a + ib)(a − ib) = zz ∗ .
LE MONDE QUANTIQUE
(11.5)
203
On peut donner une représentation géométrique commode d’un nombre complexe : l’axe horizontal correspond à la partie réelle, l’axe vertical à la partie imagi a pour composantes a et b. La longueur de OM
n’est autre naire, et le vecteur OM
que le module |z| de z. Si θ est l’angle entre le vecteur O M et l’axe horizontal, nous avons par définition des fonctions trigonométriques a = |z| cos θ
b = |z| sin θ .
(11.6)
Il existe de plus une relation remarquable entre les fonctions trigonométriques et la fonction exponentielle (formule de Moivre) e iθ = cos θ + i sin θ , ou inversement cos θ =
1
e iθ + e−iθ
2 On peut donc récrire z sous la forme
sin θ =
(11.7) 1 2i
e iθ − e−iθ .
z = |z|(cos θ + i sin θ ) = |z| e iθ .
(11.8)
L’angle θ est appelé la phase du nombre complexe et l’équation (11.8) est la représentation en module et phase du nombre complexe z. On note que la représentation en module et phase du nombre complexe conjugué est z ∗ = |z| exp(−iθ ). Prenons un exemple qui nous sera utile pour le calcul de l’intensité dans l’interféromètre de Mach-Zehnder (section 1.6), en évaluant le module de [exp(iθ ) + 1]. Utilisant l’équation (11.5), il vient e iθ + 1 e−iθ + 1 |e iθ + 1|2 = = 1 + e iθ + e−iθ + 1 = 2(1 + cos θ ). La formule (11.7) permet d’obtenir aisément des relations trigonométriques, par exemple e 2iθ
= cos 2θ + i sin 2θ = (cos θ + i sin θ )2 = (cos2 θ − sin2 θ ) + 2i sin θ cos θ ,
d’où par identification des parties réelles et imaginaires cos 2θ = cos2 θ − sin2 θ = 2 cos2 θ − 1
sin 2θ = 2 sin θ cos θ .
Finalement notons le lien avec la construction de Fresnel (figure 11.5) : si on fait
M1 le nombre complexe z1 , à O
M2 le nombre complexe z2 , le correspondre à O
vecteur somme O M correspond à z = z1 + z2 , et la valeur absolue au carré de la somme z = z1 + z2 est |z|2 = |z1 |2 + |z2 |2 + 2|z1 z2 | cos δ, ce qui est l’équivalent de l’équation (1.5).
204
Chapitre 11. Annexes
Annexe A1.4 Addition de deux amplitudes ondulatoires Revenons sur le mouvement du bouchon à la surface de la mare (§ 1.1.1) : il décrit un cercle de rayon R dont le centre est immobile (figure 11.4). Le mouvement est périodique : le bouchon fait un tour complet en un temps T , la période du mouvement. Comme la circonférence du cercle décrit par le bouchon est 2πR, sa vitesse est 2πR/T = 2πνR, où ν est la fréquence. Si le système de vagues se déplace à la vitesse cV , la distance entre deux crêtes successives est cV T , qui n’est autre que la longueur d’onde λ.
Figure 11.4. Trois bouchons (en rouge) sur une vague se propageant de gauche à droite. Chaque bouchon décrit un cercle de rayon R dans le sens des aiguilles d’une montre. Un bouchon se déplace vers la droite quand il se trouve sur une crête, vers la gauche s’il est dans un creux.
Nous allons maintenant donner une définition précise de l’expression « addition de deux amplitudes ». Reprenons la description du mouvement du bouchon dans la figure 1.1 : lorsqu’une seule des deux fentes est ouverte, on peut représenter ce mou joignant le centre du cercle au vement comme sur la figure 11.5a par un vecteur OM bouchon. Ce vecteur tourne dans le sens des aiguilles d’une montre et l’angle qu’il fait avec la verticale au temps t est 2πν t : sa vitesse angulaire est ω = 2πν. Lorsque les deux fentes sont ouvertes, nous devons ajouter les amplitudes de vibration pro 2 . Supposons que
1 et OM venant des deux fentes, représentées par les vecteurs OM ces deux vecteurs soient parallèles et de même sens (figure 11.5b), ce qui veut dire que les deux amplitudes sont en phase : dans ces conditions, l’amplitude totale de
est le double de chacune des deux amplitudes, et l’on retrouve le cas vibration OM de l’interférence constructive. Le cas de l’interférence destructive, également illustré
2 sont parallèles et de sens
1 et OM sur la figure 11.5b, est celui où les vecteurs OM opposé, ce qui veut dire que les deux amplitudes sont en opposition de phase. Le cas général est représenté sur la figure 11.5c. On montre alors que la longueur au carré
= OM
1 + OM
2 est donnée par du vecteur OM
2 = R2 (1 + cos δ), OM
1 et où la différence de phase δ (introduite à la fin du § 1.1.1) est l’angle entre OM
OM 2 . Cet angle est constant, indépendant du temps, car les deux vecteurs tournent à la même vitesse angulaire. L’interférence constructive correspond à δ = 0 (cos δ = 1)
LE MONDE QUANTIQUE
205
M
a(t)
θ
O
M
M2
M2
M1 M1
O
δ
M
O
M
M2 M1 (a)
(b)
(c)
Figure 11.5. (a) Détail du mouvement du bouchon : le mouvement vertical est donné par la projection a(t) du rayon OM sur l’axe vertical. Comme OM a tourné de 2πν t par rapport à la verticale, a(t) = R cos 2πν t . (b) Interférences constructives (en vert) et destructives (en rouge). Le résultat de l’addition des deux
; dans le second cas, pour la clarté de la figure, les longueurs OM1 et OM2 amplitudes de vibration est OM
1 et ont été choisies légèrement différentes. (c) Cas général : l’amplitude totale est l’addition des vecteurs OM
2 . On montre que OM
2 = R2 (1 + cos δ), où δ, la différence de phase entre les deux amplitudes, est OM
l’angle entre OM 1 et OM 2 . Cet angle est constant, car les deux vecteurs tournent à la même vitesse angulaire.
et l’interférence destructive à δ = π (cos δ = −1). La construction de l’addition des amplitudes ondulatoires de la figure 11.5 est appelée construction de Fresnel.
Annexe A1.5 Théorie de l’interféromètre de Mach-Zehnder Dans cette annexe, je donne quelques détails mathématiques sur la théorie de l’interféromètre de Mach-Zehnder en utilisant les nombres complexes. La lame L2 combine les amplitudes ondulatoires provenant du trajet bleu et du trajet rouge de la figure 1.6. Dans le cas de l’amplitude aX correspondant au trajet horizontal après L2 , les amplitudes provenant du trajet bleu et celle provenant du trajet rouge ont subi l’une et l’autre une réflexion et une transmission : réflexion par L1 et transmission par L2 pour le trajet bleu, et vice versa pour le trajet rouge. Si l’on suppose pour simplifier que les bras de l’interféromètre sont de longueur strictement identique, la seule différence vient du déphasage δ = 2π/λ induit par la différence de parcours sur le trajet bleu. Sans ce déphasage, chacune des amplitudes serait égale à a/2, en tenant compte de la division de l’amplitude par 2 au passage de chaque lame. Avec ce déphasage, l’amplitude provenant du trajet bleu vaut a exp(iδ)/2, et on obtient pour aX a iδ e +1 . aX = (11.9) 2 206
Chapitre 11. Annexes
On en déduit l’intensité I X |a|2 iδ I e + 12 = (1 + cos δ), I X = |aX | = 4 2 2
(11.10)
où l’on a utilisé (annexe A1.3) e iδ + 12 = e iδ + 1 e−iδ + 1 = 2(1 + cos δ). Quelle est l’origine du signe moins dans I Y = I(1 − cos δ)/2 ? En fait, dans le calcul de l’amplitude aY , on constate que l’amplitude provenant du trajet bleu a subi deux réflexions, et celle provenant du trajet rouge a subi deux transmissions. On montre en optique que chaque réflexion multiplie l’amplitude par un facteur i, et il y a donc une différence d’un facteur i2 = −1 entre les contributions des deux trajets, de sorte que a iδ −e + 1 , aY = 2 d’où la valeur de I Y .
Annexe A2.1 Le cryptage RSA Bob choisit deux nombres premiers p et q, N = pq, et un nombre c n’ayant pas de diviseur commun avec le produit (p − 1)(q − 1). Il calcule d qui est l’inverse de c pour la multiplication modulo (p − 1)(q − 1) cd ≡ 1 mod (p − 1)(q − 1). Il envoie à Alice par une voie non sécurisée les nombres N et c (mais pas p et q séparément !). Alice veut envoyer à Bob un message codé, qui doit être représenté par un nombre a < N (si le message est trop long, Alice le segmente en plusieurs sous-messages). Elle calcule ensuite b ≡ a c mod N , et envoie b à Bob, toujours par voie non sécurisée. En effet, un espion qui connaît seulement b ne peut pas en déduire le message original a. Quand Bob reçoit le message, il calcule b d mod N = a. Le fait que le résultat soit précisément a, c’est-à-dire le message original d’Alice, est un résultat de théorie des nombres. En résumé, sont envoyés par voie publique, non sécurisée, les nombres N , c et b.
LE MONDE QUANTIQUE
207
Exemple : p = 3 q = 7 N = 21 (p − 1)(q − 1) = 12. c = 5 n’a aucun facteur commun avec 12, et son inverse par rapport à la multiplication modulo 12 est d = 5 car 5 × 5 = 24 + 1. Alice choisit pour message a = 4. Elle calcule 45 = 1 024 = 21 × 48 + 16 45 = 16 mod 21. Alice envoie donc à Bob le message 16. Bob calcule b5 = 165 = 49,932 × 21 + 4
165 = 4 mod 21,
et Bob récupère donc le message original a = 4. Le calcul ci-dessus de 165 mod 21 par exemple n’a pas été mené de façon astucieuse. Il faut calculer 162 mod 21 = 4, puis 163 mod 21 comme 4 × 16 mod 21 = 1, d’où l’on tire sans calculs supplémentaires 165 mod 21 = 4. Cette méthode permet de manipuler uniquement des nombres qui ne sont pas très grands par rapport à N .
Annexe A2.2 Description mathématique de la polarisation Le schéma de la figure 3.1 suggère une interprétation géométrique simple de la polarisation. Commençons par le cas ondulatoire. Comme la polarisation définit une direction dans un plan perpendiculaire à la direction du faisceau lumineux, on peut interpréter la polarisation comme un vecteur e de longueur unité ( e 2 = 1) dans ce plan. Si eV et eH désignent deux vecteurs de longueur unité dans ce plan, respectivement vertical et horizontal, toute polarisation peut s’écrire en fonction de l’angle θ entre les vecteurs e et eV sous la forme (figure 11.6)
e = eV cos θ + eH sin θ .
(11.11)
Les quantités cos θ et sin θ sont des amplitudes ondulatoires : si I0 est l’intensité à l’entrée du polaroïd, l’intensité à la sortie d’un polaroïd d’axe vertical est I0 cos2 θ et I0 sin2 θ à la sortie d’un polaroïd d’axe horizontal. La proportionnalité à cos2 θ est appelée loi de Malus : elle fut écrite pour la première fois par le chevalier Malus en 1809. Malus observait la lumière du soleil couchant réfléchie par la vitre d’une fenêtre du Palais du Luxembourg à travers un cristal de spath d’Islande. En faisant tourner ce cristal, il constata que l’une des deux images du soleil disparaissait. Le spath d’Islande est un cristal biréfringent, qui décompose un rayon lumineux en deux rayons polarisés dans des directions perpendiculaires, tandis que le rayon réfléchi par la vitre est (partiellement) polarisé. Pour une orientation convenable du cristal, on observera donc une extinction (ou une forte atténuation) d’un des deux rayons. Un cas particulier intéressant est θ = 45◦ , où cos θ = sin θ = 1/ 2 et I V = I H = 1/2.
208
Chapitre 11. Annexes
eV
e θ
eH Figure 11.6. Le vecteur polarisation de la lumière.
Passons maintenant au cas de la polarisation des photons. Supposons que nous disposions d’une source de photons uniques polarisés mais de polarisation inconnue, que nous envoyons sur un polaroïd. Si ce polaroïd est d’axe vertical, un certain nombre de photons sont arrêtés, et ceux qui franchissent le polaroïd auront une polarisation dirigée suivant eV . Si l’axe du polaroïd fait un angle θ avec l’horizontale, les photons qui franchissent le polaroïd auront une polarisation dirigée suivant
e (11.11). En physique quantique, on dit que le polaroïd a préparé les photons dans l’état de polarisation e : c’est la phase de préparation du système quantique. Si ces photons sont envoyés sur un polaroïd d’axe vertical (horizontal), ils seront transmis avec une probabilité cos2 θ (sin2 θ ) : nous devons retrouver le résultat de l’optique classique, à savoir la loi de Malus, si le nombre de photons devient grand. La quantité cos θ (resp. sin θ ) est l’amplitude de probabilité pour trouver les photons de polarisation e dans l’état de polarisation verticale (resp. horizontale). Suivant les règles énoncées au chapitre 1, les probabilités sont données par le carré des amplitudes. La remarque suivante va jouer un rôle important : les amplitudes de probabilité cos θ et sin θ sont les produits scalaires de e par eV et eH cos θ = eV · e
sin θ = eH · e.
(11.12)
Rappelons que le produit scalaire a · b de deux vecteurs a et b est par définition
a · b = ab cos φ, où a et b sont les longueurs des deux vecteurs et φ l’angle entre ces deux vecteurs. Dirac a introduit une notation compacte pour les états quantiques de polarisation eV , eH et e, qui dans ce cas s’écrivent |V 〉, |H〉 et |θ 〉. Avec cette notation
LE MONDE QUANTIQUE
209
l’équation (11.11) devient |θ 〉 = cos θ |V 〉 + sin θ |H〉,
(11.13)
tandis que le produit scalaire eV · e est noté 〈V |θ 〉. Comme |V 〉, |H〉 et |θ 〉 sont des vecteurs, on les appelle les vecteurs d’état de polarisation des photons polarisés suivant la direction V , H ou θ . Les vecteurs d’état de polarisation à ±45◦ du protocole BB84 mis en œuvre avec des photons polarisés sont donc 1 |D〉 = (|V 〉 + |H〉) 2 1 |A〉 = (|V 〉 − |H〉) . 2
(11.14)
Une petite complication pour conclure : nous avons vu au chapitre 2 que les amplitudes de probabilité sont des nombres complexes. Le vecteur de polarisation le plus général |ϕ〉 = cos θ |V 〉 + e iδ sin θ |H〉 (11.15) fait intervenir en plus de cos θ et sin θ le nombre complexe exp(iδ). Dans le cas général, la polarisation d’un photon est elliptique, ce qui veut dire que l’extrémité du vecteur polarisation décrit une ellipse dans le plan perpendiculaire à la direction de propagation. Notons qu’un cas particulier de polarisation elliptique est la polarisation circulaire, droite (R) ou gauche (L) 1 |R〉 = (|V 〉 + i|H〉) 2 1 |L〉 = (|V 〉 − i|H〉) . 2
(11.16)
L’extrémité du vecteur polarisation décrit un cercle dans le plan perpendiculaire à la direction de propagation. Si l’on regarde le photon arriver, on voit le champ électrique tourner dans le sens des aiguilles d’une montre pour la polarisation gauche, et en sens inverse pour la polarisation droite.
Annexe A2.3 Lumière atténuée et photons uniques Reprenons l’exemple de la figure 1.4 où une onde lumineuse arrive sur une lame séparatrice équilibrée. Diminuons l’intensité lumineuse de sorte que l’intervalle de temps entre deux photons successifs soit plus grand que le temps mort qui sépare deux détections. On enregistre alors des clics isolés des détecteurs. Soit 〈n〉 le nombre moyen de photons arrivant pendant un intervalle de temps déterminé, par exemple
210
Chapitre 11. Annexes
une micro-seconde, sur la lame séparatrice, disons 〈n〉 = 0,1. On montre que dans le cas d’une onde lumineuse provenant d’une source classique ou d’un laser, la probabilité Prob(n) que n photons arrivent par micro-seconde est donnée par une loi de Poisson e−〈n〉 〈n〉n · (11.17) Prob(n) = n! La probabilité d’observer deux photons dans une micro-seconde est 〈n〉2 /2 (e−〈n〉 1 pour 〈n〉 = 0,1), et elle est donc voisine de 5 %. En cryptographie quantique, on utilise souvent des impulsions laser atténuées telles que le nombre moyen de photons dans une impulsion soit de l’ordre de 0,1, afin d’imiter autant que faire se peut le cas idéal des photons uniques. On sait fabriquer des états non classiques, pour lesquels la loi (11.17) n’est pas vérifiée. C’est le cas bien sûr des sources de photons uniques, où Prob(n = 1) = 1, Prob(n = 1) = 0, ou plus généralement des états à nombre de photons fixé, appelés états de Fock. Un autre exemple est celui des états dits comprimés, où l’équation (11.17) n’est pas valable.
Annexe A3.1 Démonstration de l’inégalité de Bell Partons de l’exemple décrit dans la section 4.2 et examinons par exemple le produit TA PB : ce produit vaut +1 si TA = PB (le T-shirt d’Alice a la même couleur que le pantalon de Bob), et il vaut −1 si TA = PB (le T-shirt d’Alice a une couleur différente de celle du pantalon de Bob). Alice et Bob effectuent un grand nombre d’essais, N , en notant pour chaque essai le résultat du produit TA PB , [TA PB ]n pour l’essai numéro n. Une caractérisation intéressante de l’ensemble des essais est la valeur moyenne de TA PB , notée 〈TA PB 〉, qui est la somme des différentes valeurs de [TA PB ]n divisée par le nombre d’essais 〈TA PB 〉 =
1 N
[TA PB ]1 + · · · + [TA PB ]n + · · · [TA PB ]N .
(11.18)
On suppose que le choix des habits est régi par une loi de probabilité Prob(TA, TB , PA, PB ) ; la valeur moyenne 〈TA PB 〉 se calcule alors par 〈TA PB 〉 = TA PB Prob(TA, TB , PA, PB ). TA ,TB ,PA,PB
Cette valeur moyenne s’exprime en fonction des probabilités pour que TA = TB et TA = PB 〈TA PB 〉 = Prob(TA = PB ) − Prob(TA = PB ) 〈TA PB 〉 = 2Prob(TA = PB ) − 1 = 1 − 2Prob(TA = PB ), LE MONDE QUANTIQUE
(11.19)
211
où la deuxième ligne se déduit de la première en remarquant que la somme des probabilités vaut un Prob(TA = PB ) + Prob(TA = PB ) = 1. Considérons la combinaison suivante 〈X 〉 des valeurs moyennes 〈X 〉 = 〈TA TB 〉 + 〈TA PB 〉 + 〈PA TB 〉 − 〈PA PB 〉 = 〈TA(TB + PB ) + PA(TB − PB )〉. Si TB = −PB , le premier terme de la valeur moyenne s’annule dans la seconde équation, et le deuxième terme vaut 2PA TB . Comme PA = ±1, TB = ±1, on obtient X = ±2. Si au contraire TB = PB , c’est le deuxième terme qui s’annule, mais on trouve à nouveau X = ±2. Dans tous les cas de figure, X = ±2. Dans le calcul de la valeur moyenne, il pourra arriver que X soit positif ou négatif, mais dans tous les cas la valeur absolue de la valeur moyenne sera inférieure ou égale à 2 : |〈X 〉| ≤ 2 |〈TA TB 〉 + 〈TA PB 〉 + 〈PA TB 〉 − 〈PA PB 〉| ≤ 2.
(11.20)
Cette inégalité prend une forme plus intuitive si on l’exprime en termes de probabilités grâce à (11.19) Prob(TA = TB ) + Prob(TA = PB ) + Prob(PA = TB ) + Prob(PA = PB ) ≤ 3,
(11.21)
où par exemple Prob(TA = PB ) est la probabilité que le T-shirt d’Alice et le pantalon de Bob aient la même couleur, Prob(PA = PB ) la probabilité pour que les pantalons d’Alice et Bob soient de couleur différente. L’inégalité (11.20), ou sa forme équivalente (11.21), sont des exemples d’inégalités de Bell. Nous avons donc démontré le résulat suivant : quelles que soient les corrélations introduites à la source, c’est-àdire lorsque Alice et Bob choisissent leurs habits avec une certaine loi de probabilité Prob(TA, PA, TB , PB ), l’inégalité de Bell (11.21) doit être vérifiée.
Annexe A3.2 États intriqués Cette annexe donne la description mathématique des états intriqués. Nous nous limiterons à des états intriqués en polarisation portés par deux photons, mais le formalisme se généralise aisément à d’autre cas. Nous avons donné dans l’annexe A3.2 la description mathématique pour l’état |θ 〉 de polarisation d’un photon, dans le cas où sa polarisation est alignée le long d’une direction faisant un angle θ avec l’axe vertical d’un plan perpendiculaire à la direction de propagation (voir (11.13)) |θ 〉 = cos θ |V 〉 + sin θ |H〉.
212
(11.22)
Chapitre 11. Annexes
Comme nous voulons traiter le cas de deux photons, nous allons les distinguer par deux indices A et B : par exemple |VA〉 représente un état de polarisation verticale du photon , |H B 〉 un état de polarisation horizontale du photon . Pour décrire les deux photons, nous devons envisager quatre possibilités |VA〉|VB 〉
|VA〉|H B 〉
|HA〉|VB 〉
|HA〉|H B 〉.
Par exemple, |VA〉|H B 〉 représente un état à deux photons où le photon possède une polarisation verticale et le photon une polarisation horizontale. Nous pouvons obtenir une situation plus générale |θAθB 〉 en utilisant (11.22) pour les deux photons |θA〉 = cos θ |VA〉 + sin θ |HA〉 |θB 〉 = cos θ |VB 〉 + sin θ |H B 〉.
(11.23)
Nous pourrions même utiliser deux angles différents pour les deux lignes de (11.23), mais nous n’en aurons pas besoin. Un état tel que |VA〉|H B 〉 ou |θA〉|θB 〉 est appelé produit tensoriel. De la même manière que dans (11.22), nous avons construit une combinaison linéaire de deux états |V 〉 et |H〉, rien ne nous empêche de construire par exemple la combinaison linéaire |Φ〉 1 |Φ〉 = (|VA〉|VB 〉 + |HA〉|H B 〉). 2
(11.24)
Cet état, combinaison linéaire de deux produits tensoriels, est appelé état intriqué. Dans cet état, les polarisations sont corrélées à 100 % pour des mesures faites dans la base {V H} : si la mesure de la polarisation du photon donne le résultat V (resp. H), alors celle du photon sera aussi V (resp. H). Cependant, le résultat de la mesure de la polarisation par Alice est aléatoire : elle a 50 % de chances de trouver une polarisation horizontale et 50 % de chances de trouver une polarisation verticale. En effet, (11.24) montre que l’amplitude de probabilité pour trouver |VA〉 vaut 1/ 2, et c’est également l’amplitude de probabilité pour trouver |HA〉. C’est cet état qui est utilisé dans la discussion du chapitre 3. Il possède une propriété remarquable : sa forme ne change pas quand on modifie l’orientation des axes dans le plan perpendiculaire à la direction de propagation, autrement dit, il est invariant par rotation autour de la direction de propagation. Pour le montrer, introduisons l’état de polarisation orthogonale à la direction θ |θ⊥ 〉 = − sin θ |V 〉 + cos θ |H〉.
(11.25)
Un calcul élémentaire montre que |Φ〉 s’écrit aussi 1 |Φ〉 = (|θA〉|θB 〉 + |θA⊥ 〉|θB⊥ 〉). 2 LE MONDE QUANTIQUE
(11.26)
213
Il suffit de reporter (11.23) et (11.25) dans (11.26) et d’utiliser cos2 θ + sin2 θ = 1 pour retrouver l’expression initiale (11.24) de |Φ〉. Les polarisations sont corrélées à 100 %, quelle que soit l’orientation choisie. Démontrons maintenant l’équation (3.4). En raison de l’invariance par rotation, nous pouvons choisir a suivant la direction verticale et b faisant un angle θ avec cette direction. Supposons que nous mesurions pour le photon une polarisation verticale. D’après (11.24), la polarisation du photon est alors verticale et l’état de est |VB 〉. Mais nous pouvons inverser (11.19) et écrire |VB 〉 = cos θ |θB 〉 − sin θ |θB⊥ 〉. L’amplitude de probabilité pour trouver |VB 〉 dans l’état de polarisation |θB 〉, c’est-àdire une polarisation orientée suivant b, est donc cos θ , et la probabilité correspondante cos2 θ (loi de Malus). La probabilité jointe que le photon ait une polarisation parallèle à a et le photon une polarisation parallèle à b est donc donnée par 1 1 cos2 θ = (1 + cos 2θ ). 2 4 En raison de l’invariance par rotation, la probabilité que les deux polarisations soient perpendiculaires à a et b est donnée par le même résultat, ce qui démontre (4.4).
Annexe A4.1 Le formalisme de la théorie quantique Nous allons décomposer l’exposé du formalisme en trois étapes. 1. La description mathématique d’un état quantique. 2. Les probabilités et la règle de Born. 3. L’évolution temporelle d’un état quantique et l’équation de Schrödinger. Commençons par la description d’un état quantique. Nous avons donné dans l’annexe 3.2 la description de l’état quantique de polarisation d’un photon : cet état quantique est représenté mathématiquement par un vecteur |ϕ〉 d’un espace à deux dimensions, et on peut choisir dans cet espace deux vecteurs de base |V 〉 et |H〉 décrivant respectivement des états de polarisation horizontale et verticale. Ces deux états sont orthogonaux : le produit scalaire 〈H|V 〉 = 0, et ils sont de longueur, ou plus correctement, de norme unité (la norme ϕ d’un vecteur |ϕ〉 généralise la notion de longueur : c’est la racine carrée du produit scalaire 〈ϕ|ϕ〉, ϕ = 〈ϕ|ϕ〉), 〈V |V 〉 = 〈H|H〉 = 1. L’état quantique de polarisation le plus général est décrit par un vecteur |ϕ〉, le vecteur d’état (de polarisation), combinaison linéaire à coefficients complexes cV et cH de |V 〉 et |H〉 du type (11.15) |ϕ〉 = cV |V 〉 + cH |H〉 2
|cH |2 + |cV |2 = 1.
(11.27)
2
La condition |cH | + |cV | = 1 assure que le vecteur |ϕ〉 est de norme un : 〈ϕ|ϕ〉 = 1.
214
Chapitre 11. Annexes
L’état d’un système quantique général est décrit mathématiquement par un vecteur |ϕ〉 qui est un élément d’un espace vectoriel ! que nous choisirons pour simplifier de dimension finie D (les espaces vectoriels de dimension infinie sont indispensables dans certains cas physiques, mais ils conduisent à de sérieuses complications mathématiques) ; le cas de la polarisation correspond à D = 2 ; ! est appelé espace des états. Un espace vectoriel de dimension D est sous-tendu par D vecteurs de base |1〉, . . . , |n〉, . . . , |D〉 |ϕ〉 = c1 |1〉 + . . . + cn |n〉 + . . . + cD |D〉,
(11.28)
avec la condition de normalisation 〈ϕ|ϕ〉 = |c1 |2 + . . . + |cn |2 + . . . = |cD |2 = 1. Si un autre vecteur |χ〉 se décompose suivant |χ〉 = b1 |1〉 + . . . + bn |n〉 + . . . + b D |D〉,
(11.29)
alors le produit scalaire 〈χ|ϕ〉 vaut 〈χ|ϕ〉 = b1∗ c1 + . . . + b∗n cn + . . . + b∗D cD .
(11.30)
La deuxième partie de cette annexe consiste à donner une forme mathématique aux amplitudes de probabilité introduites au § 1.6.2, règle numéro 3. Les vecteurs d’état |ϕ〉 et |χ〉 ayant été définis par (11.28) et (11.29), l’amplitude de probabilité pour trouver |ϕ〉 dans |χ〉 est le produit scalaire 〈χ|ϕ〉, et la probabilité correspondante |〈χ|ϕ〉|2 (11.30). Ces deux définitions, amplitude de probabilité et probabilité, sont pour l’instant assez abstraites, mais elles vont se concrétiser grâce à la règle de Born que nous allons illustrer sur l’exemple de la polarisation. Supposons que l’état de polarisation soit donné par (11.15) |ϕ〉 = cos θ |V 〉 + e iδ sin θ |H〉, et faisons passer le photon par un prisme de Wollaston qui sépare les photons de polarisation verticale et horizontale (figure 11.7). La probabilité ProbV de trouver le photon polarisé verticalement est donnée par le carré du produit scalaire 〈V |ϕ〉 ProbV = |〈V |ϕ〉|2 = cos2 θ et celle de le trouver polarisé horizontalement est ProbH = |〈H|ϕ〉|2 = sin2 θ .
LE MONDE QUANTIQUE
215
| 〉
| ↔〉 Figure 11.7. Prisme de Wollaston, ou prisme polarisant.
|1〉 |2〉 |3〉 |4〉 |5〉 Figure 11.8. Prisme de Wollaston généralisé, avec D = 5 voies de sortie.
Dans le cas général, si l’état quantique est décrit par un vecteur d’un espace à D dimensions, une mesure fera intervenir un « prisme de Wollaston généralisé » comprenant D voies de sortie |1〉, . . . , |n〉, . . . , |D〉 (figure 11.8). La probabilité pour que le système choisisse la voie |n〉 est |〈n|ϕ〉|2 = |cn |2 .
(11.31)
Lorsque l’on remplace |ϕ〉 par e iδ |ϕ〉, les probabilités |〈χ|ϕ〉|2 sont inchangées. Comme ces probabilités sont tout ce que peut déterminer l’expérience, les vecteurs |ϕ〉 et e iδ |ϕ〉 représentent le même état physique. Ainsi (11.15) décrit l’état de polarisation le plus général, car on peut toujours choisir le coefficient cV de |V 〉 dans (11.25) comme un nombre réel : cV = cos θ .
216
Chapitre 11. Annexes
Une notion importante est celle de bases incompatibles (ou complémentaires), notion qui peut être expliquée simplement dans le cas de la polarisation. Au lieu des états de base |V 〉 et |H〉, nous pouvons utiliser la base (11.14) des états |D〉 et |A〉. Une mesure dans cette nouvelle base s’effectuera en faisant tourner le prisme de Wollaston de la figure 12.4 de 45◦ autour de la direction de propagation des photons incidents : la mesure s’effectue alors dans la base {|D〉, |A〉} au lieu de la base {|V 〉, |H〉}. Supposons qu’un photon incident soit polarisé verticalement. Si la mesure est faite dans la base {|V 〉, |H〉}, la polarisation sera mesurée verticale avec une probabilité de 100 %, la valeur de la polarisation est certaine. En revanche, si la mesure est faite dans la base {|D〉, |A〉}, nous allons mesurer une polarisation à +45◦ avec une probabilité de 50 % et une polarisation à −45◦ avec aussi une probabilité de 50 % : la polarisation est complètement aléatoire dans cette base. Si la valeur de la polarisation est bien définie dans la base {|V 〉, |H〉}, elle ne l’est pas dans la base {|D〉, |A〉} : les deux bases sont dites incompatibles. On observe la même situation dans le cas de mesures de la position x et de la position p : ces deux variables sont incompatibles. Si la valeur de x est certaine, celle de p est indéterminée, et vice versa. Dans la troisième étape, nous allons examiner l’évolution temporelle. Nous avons donné jusqu’à présent la description mathématique d’un état quantique à un instant donné, par exemple t = t 0 , et décrit les opérations de mesure sur cet état. Une description complète requiert que nous soyons capables de répondre à la question : comment cet état va-t-il évoluer au cours du temps, à partir des conditions initiales à t = t 0 ? Cette évolution est unitaire, elle se fait au moyen d’un opérateur unitaire U(t, t 0 ) : un opérateur unitaire U est tel que 〈Uϕ|Uχ〉 = 〈ϕ|χ〉, quels que soient les vecteurs |ϕ〉 et |χ〉. Le vecteur d’état |ϕ(t)〉 au temps t est donné en fonction du vecteur d’état |ϕ(t 0 )〉 au temps t 0 par |ϕ(t)〉 = U(t, t 0 )|ϕ(t 0 )〉.
(11.32)
Lorsque le système quantique est isolé, le choix de l’origine des temps est arbitraire et on doit avoir quel que soit l’intervalle de temps τ U(t + τ, t 0 + τ) = U(t, t 0 ). Cela implique que U(t, t 0 ) ne peut dépendre que de la différence (t − t 0 ). Un théorème dû à Stone montre que U(t − t 0 ) est alors de la forme exponentielle U(t − t 0 ) = e−iH(t−t 0 )/ħh .
(11.33)
L’argument de l’exponentielle devant être sans dimension, H a les dimensions d’une énergie, et en fait H est l’opérateur énergie, ou hamiltonien du système quantique. Combinant (11.32) et (11.33), on déduit que |ϕ(t)〉 = e−iH(t−t 0 )/ħh |ϕ(t 0 )〉,
LE MONDE QUANTIQUE
217
et si l’on différencie cette équation par rapport au temps t d dt
|ϕ(t)〉 = −
iH ħ h
e−iH(t−t 0 )/ħh |ϕ(t 0 )〉 = −
iH ħ h
|ϕ(t)〉,
ou encore iħ h
d dt
|ϕ(t)〉 = H|ϕ(t)〉
(11.34)
C’est l’équation d’évolution, plus connue sous le nom d’équation de Schrödinger. Elle reste valable même si H dépend du temps, H → H(t). Le point remarquable de (11.31) ou (11.34) est que ces équations sont déterministes : étant donné des conditions initiales sous la forme d’un vecteur d’état |ϕ(t 0 )〉, elles déterminent de façon unique le vecteur d’état au temps t, tout comme la donnée des positions et vitesses initiales en mécanique classique déterminent toute l’histoire ultérieure. L’aspect probabiliste s’introduit uniquement au moment de la mesure, via la règle de Born, mais entre deux mesures l’évolution est déterministe. Lorsque le hamiltonien est indépendant du temps, on montre qu’il existe D vecteurs |ϕ1 〉, . . . , |ϕn 〉, . . . , |ϕ D 〉 (pas nécessairement uniques) formant une base orthonormée de ! avec (11.35) H|ϕn 〉 = En |ϕn 〉. Les états |ϕn〉 sont appelés états stationnaires, car leur évolution temporelle est très simple : si |ϕ(t 0 )〉 = |ϕn〉, alors |ϕ(t)〉 = e−iH(t−t 0 )/ħh |ϕ(t 0 )〉 = e−iEn (t−t 0 )/ħh |ϕn 〉 = e−iEn (t−t 0 )/ħh |ϕ(t 0 )〉,
(11.36)
car l’action de H sur |ϕn 〉 se résume à H → En . L’évolution temporelle correspond donc à une simple multiplication par un facteur de phase et, comme on l’a vu, cette multiplication ne modifie pas l’état physique : un état vérifiant (11.35) reste physiquement inchangé au cours du temps, d’où la terminologie d’état stationnaire.
Annexe A4.2 Particule quantique dans une boîte à une dimension Reprenons l’exemple du § 4.2 de la particule dans une boîte à une dimension, et soit |x〉 un état de position bien définie : la particule possède une position parfaitement déterminée au point x. À strictement parler, l’inégalité de Heisenberg interdit une telle configuration, car cela voudrait dire que l’impulsion de la particule devient infinie. Les états tels que |x〉 peuvent être définis, mais en prenant certaines précautions.
218
Chapitre 11. Annexes
La difficulté est liée au fait qu’en toute rigueur nous aurions besoin d’un espace de dimension infinie, ce qui impliquerait de se frotter aux complications inhérentes à ces espaces. Si l’état de la particule quantique est |ψ〉, d’après l’annexe A4.1, l’amplitude de probabilité pour trouver la particule au point x est 〈x|ψ〉 ≡ ψ(x), qui est la fonction d’onde de la particule. Soit |ψn 〉 un état de la forme (11.33) H|ψn 〉 = En |ψn 〉 et multiplions cette équation à gauche par 〈x| 〈x|H|ψn〉 = En 〈x|ψn〉 = En ψn (x). On montre que 〈x|H|ψ〉 = −
ħ h2 d2 ψ(x)
. 2m dx 2 La démonstration est un peu technique et se trouve dans tous les manuels de physique quantique. Cela donne l’équation de Schrödinger indépendante du temps pour ψn (x) ħ h2 d2 ψn (x) − = En ψn (x), (11.37) 2m dx 2 ou encore d2 ψn (x) + k2n ψn (x) = 0, (11.38) dx 2 h2 . Les solutions de (11.37) sont des combinaisons linéaires de avec k2n = 2mEn /ħ sin kn x et de cos kn x, mais comme ψn (x) doit s’annuler à x = 0, seule la solution sin kn x convient. De plus ψn (x) doit s’annuler à x = L, ce qui implique kn L = nπ, n = 1, 2 . . . On retrouve les résultats du § 4.2, kn = nπ/L et la quantification des h2 n2 π2 /(2mL 2 ). niveaux d’énergie En = ħ La quantité |ψn (x)|2δ x est la probabilité de trouver la particule dans l’intervalle [x, x + δ x], pour δ x suffisamment petit, dans le cas présent δ x L. Comme la particule doit se trouver dans l’intervalle [0, L] avec une probabilité unité, on en déduit L L πnx L 2 2 dx = a2n , |ψn (x)| dx = an sin2 1= (11.39) L 2 0 0 ce qui donne an = 2/L. Pour conclure cette annexe, utilisons l’inégalité de Heisenberg (4.3) pour estimer l’énergie du niveau fondamental de l’oscillateur harmonique à une dimension et celui de l’atome d’hydrogène. Le hamiltonien de l’oscillateur harmonique, par exemple celui du piège du § 5.3.2, est de la forme énergie cinétique + énergie potentielle H=
LE MONDE QUANTIQUE
p2 2m
+
1 2
mΩ2 x 2
219
où Ω = 2π f est la pulsation du piège. Utilisant l’inégalité de Heisenberg sous la forme p = ħ h/2x, on obtient H sous la forme H=
ħ h2 8m2 x 2
+
1
mΩ2 x 2 .
2
h/(2mΩ), et en On cherche le minimum de H : dH/dx = 0, ce qui donne x 2 = ħ reportant dans H 1 1 1 hΩ + ħ hΩ = ħ hΩ. (11.40) H= ħ 4 4 2 Cela coïncide avec le résultat exact. En fait, la fonction d’onde de l’état fondamental de l’oscillateur harmonique sature l’inégalité de Heisenberg : pour cette fonction d’onde, l’inégalité devient une inégalité. C’est ce qui explique que l’on obtienne le résultat exact à partir de p = ħ h/2x. Passons maintenant à l’atome d’hydrogène. Si l’électron décrit une orbite circulaire de rayon r avec une impulsion p = mv , son énergie classique est E=
p2 2m
−
e2 r
·
(11.41)
En physique classique, le rayon de l’orbite de l’électron tend vers zéro (« l’électron tombe sur le noyau »), ce phénomène étant accompagné de l’émission de rayonnement électromagnétique : en effet, en physique classique, l’énergie de l’orbite circulaire E = −e2 /(2r) n’est pas bornée inférieurement et rien ne s’oppose à ce que le rayon de l’orbite devienne arbitrairement petit. La décroissance de l’énergie de l’orbite est compensée par l’émission dans l’espace d’énergie sous forme de rayonnement électromagnétique, ce qui assure la conservation de l’énergie. Mais sur une orbite de rayon r, la dispersion Δx de la position suivant l’axe des x est de l’ordre de r, ce qui fait que la dispersion sur l’impulsion est au moins de ∼ ħ h/Δx = ħ h/r. Nous pouvons en déduire r p ∼ ħ h et l’expression de l’énergie (11.41) devient E∼
ħ h2 2mr 2
−
e2
·
r
Cherchons le minimum de E dE dr
∼−
ħ h2 mr 3
+
e2 r2
= 0,
ce qui donne un minimum pour r = a0 =
220
ħ h2 me2
,
(11.42)
Chapitre 11. Annexes
le rayon de Bohr de l’atome d’hydrogène. Naturellement, le fait que l’on obtienne exactement a0 dans ce calcul d’ordre de grandeur est un hasard heureux, qui nous permet de retrouver l’énergie de l’état fondamental E0 = −
e2 2a0
=−
me4 2ħ h2
·
(11.43)
S’il est bien entendu que ce calcul ne peut donner qu’un ordre de grandeur, la physique sous-jacente explique la raison profonde de la stabilité de l’atome : en raison des inégalités de Heisenberg, l’électron ne peut pas se trouver sur une orbite de rayon trop petit, sous peine d’acquérir une impulsion importante, qui fait croître son énergie cinétique. L’énergie de l’état fondamental est obtenue en recherchant le meilleur compromis possible entre énergie cinétique et énergie potentielle, de façon à obtenir le minimum de l’énergie totale.
Annexe 10.1 La théorie de de Broglie/Bohm Si la fonction d’onde ψ( r, t) est écrite sous forme module et phase (ħ h = h/2π) ψ( r, t) = R( r, t) exp(iS( r, t)/ħ h), la loi d’évolution pour la phase S est donnée par ∂S ∂t
+
1 2m
2 + V + U = 0, (∇S)
est le gradient, V l’énergie potentielle ordinaire et U le potentiel quantique, où ∇ h = 0, on retrouve les équations de la mécanique classique U = −(ħ h2 /2m)(∇2R). Si ħ sous la forme dite de Hamilton-Jacobi. L’impulsion p est le gradient de la phase :
La loi de Newton modifiée est
p = ∇S. d p dt
=
d(∇S) dt
= −∇(V + U),
où d/dt est la dérivée prise le long de la trajectoire. La fonction d’onde obéit à l’équation de Schrödinger (11.34) et n’est pas influencée par la position de la particule.
LE MONDE QUANTIQUE
221
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Index A absorption 80, 83 accepteur 120 Advanced Encryption Standard (AES) 45 algorithme de Deutsch 159 de Grover 160 de Shor 161 probabiliste 160 amplitude de probabilité 28, 37, 49, 105, 209, 215 de vibration 18 ondulatoire 18 antiparticule 134 atome 34, 81 froid 35, 91 d’hydrogène 81, 220 B bande d’énergie 116 d’énergie interdite 116 de conduction 117 de valence 117 base incompatible, ou complémentaire 217 orthonormée 51 privilégiée 192 bit d’information 51, 199 quantique 151
boîte unidimensionnelle 72 boson 106 de Higgs 143 de jauge 141 C causalité 58 chat de Schrödinger 189 chiffrage RSA 45, 161, 207 classe de complexité 162 clé publique, ou asymétrique 45 secrète, ou symétrique 44 cohérence 171 spatiale 87 temporelle 87 complémentarité 183 complexe conjugué 203 complexité algorithmique 46, 162 condensat de Bose-Einstein 108 conducteur 118 configuration 50, 183 constante cosmologique 132 de Boltzmann 94 de gravitation 148 de Planck 24 de Planck modifiée ħ h 76 de structure fine 82, 139 construction de Fresnel 206 corpuscule 17 coup sombre 25 cryptage 44
cryptographie quantique 46 cycle de fluorescence 99 D décohérence 164, 167, 171 degré de liberté externe 71 interne 71 déphasage 20, 32, 37 désaccord 98, 103 diagramme de Feynman 136 différence de phase 20 diffraction 18 diode électroluminescente (LED) 123 laser 24, 123 p − n 120 distribution de Maxwell 94 quantique d’une clé (QKD) 47 donneur 120 dopage (d’un semi-conducteur) 120 E effet Casimir 133 collectif 91 Doppler 97, 145 Sagnac 35 électron 113, 134, 138 élément de réalité 183 émission spontanée 83, 98 stimulée 84 énergie cinétique 79, 94, 95 ensemble 26 épitaxie 125 équation d’évolution 218 de Schrödinger 218 erreur statistique 26 systématique 26
224
état de superposition linéaire, ou cohérente 29 du vide 132 intriqué 61, 213 quantique 28, 214 stationnaire 218 événement 58 expérience à choix retardé 38 F facteur de phase 106 fentes d’Young 21, 35 fermion 106 flux de photons 24 fonction d’onde 75 franges de Ramsey 102 fréquence 21, 201 angulaire 202 de résonance 98 G gap (d’énergie) 119 gaz parfait 92 gluon 141 gravité quantique à boucles 148 gyrolaser 35 H hamiltonien 217 hétérojonction 122, 124 homojonction 122 horloge atomique 101 I impulsion (ou quantité de mouvement) 35, 96 indice optique (ou de réfraction) 201 indiscernabilité 105 inégalité de Bell 60, 211 de Heisenberg 78 de Heisenberg temporelle 135
Index
ingénierie quantique 126 intensité (lumineuse) 20 interaction 141 électromagnétique 141 faible 141 forte 141 gravitationnelle 141 interférence 19 avec des atomes froids 36 avec des molécules 174 constructive 19, 205 destructive 19, 205 interféromètre de Mach-Zehnder 21, 206 interprétation de Copenhague 181 d’Everett-Wheeler 196 d’ignorance 27 minimaliste 180 standard, ou orthodoxe 188 intrication 61, 66, 171 inversion de population 84, 126 irréversible 157, 186 isolant 118 L lame semi-transparente 21 lame séparatrice 21, 168 équilibrée 21 laser monomode 86 lepton 141 lithographie 123 localité 58, 65 loi de Boltzmann 95, 119 de Malus 153, 208 longueur de cohérence 87 longueur d’onde 21, 74, 201 Compton 135 de de Broglie 35 de Planck 148 thermique 107 M machine de Turing 162 maille d’un réseau 115
LE MONDE QUANTIQUE
masse de Planck 148 effective 116 mesure non destructrice, ou idéale 187 sans interaction 40 méson π 137 mésoscopique 167, 176 mode de vibration 73 d’une cavité 85, 132 modèle standard 131, 139, 141–143 N nœud 73 neutrino 138, 141 neutron 137 niveau d’énergie 79 de Fermi 114 nombre complexe 28, 203 norme (d’un vecteur) 214 notation de Dirac 151, 209 noyau atomique 81 O objet quantique 30 ondes électromagnétiques 21, 201 en opposition de phase 19, 205 en phase 19 lumineuses 20 progressives 74 stationnaires 73 opérateur unitaire 217 orbite circulaire 82 oscillateur harmonique 72, 132, 219 P paire électron-trou 123 parallélisme quantique 159 particule 17 quantique 34
225
partie réelle (d’un nombre complexe) 28, 203 partie imaginaire (d’un nombre complexe) 28, 203 pas du réseau 115 période 18 photon 23 piège magnéto-optique 100 polarisation de la lumière 47 d’un photon 49 polaroïd 47, 61 porte logique quantique 154 control-NOT 156 de Hadamard 156 positron 134 potentiel chimique 115 gravitationnel 147 préparation 27, 78, 155, 180, 209 prisme de Wollaston (ou polarisant) 48, 61 principe de complémentarité 171 de localité 58 de Pauli 113 d’équivalence 144 de superposition 29, 33, 172 d’incertitude de Heisenberg 78 probabilité de présence 75, 77 processus 36 processus virtuel 136 produit tensoriel 152, 213 proton 134, 138 puits de potentiel 72 quantique 80, 125 Q quantification des niveaux d’énergie 77 dans un puits infini 79 de l’atome d’hydrogène 83 quantité de mouvement (voir impulsion) quantum bit error rate (QBER) 254
226
quark 139 quasi-particule 116 qubit 151 R radioactivité β 138 réalisme local 66 réalité externe 179 réduction du paquet d’ondes 187 refroidissement Doppler 97 règles de Born 37, 215 de la physique quantique 36 relation de Planck-Einstein 24 relativité générale 132, 144 restreinte 132 résonance 80, 83 réversible 157, 186 S semi-conducteur 119 séparabilité 65 source 59 spectre de niveaux 83 sphère de Poincaré-Bloch 153 statistique quantique 105 de Bose-Einstein 106 de Fermi-Dirac 106 superposition linéaire (ou cohérente) 28, 29, 31, 49, 61, 172 supersymétrie 143 supraluminal 53 T taux de désintégration 99 téléportation quantique 55 temps de cohérence 164 temps de décohérence 164, 173 température 91 absolue 93 de recul 100 Doppler 99
Index
théorème de non-clonage quantique 50 spin-statistique 138 théorie de de Broglie/Bohm 194, 221 des champs quantiques 131 des cordes 143 locale 58 transistor 122 trou 120
LE MONDE QUANTIQUE
V valeur moyenne 211 variable cachée 27, 64 vecteur d’onde 74, 75 d’état 180, 210, 214 vie moyenne 99 vitesse de recul 96 visibilité (de l’interférence) 171
227